Панды DataFrames
Что такое датафрейм?
Pandas DataFrame — это двумерная структура данных, такая как двумерный массив или таблица со строками и столбцами.
Пример
Создайте простой Pandas DataFrame:
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration":
[50, 40, 45]
}
#load data into a DataFrame object:
df = pd.DataFrame(data)
print(df)
Результат
calories duration 0 420 50 1 380 40 2 390 45
Найдите строку
Как видно из приведенного выше результата, DataFrame похож на таблицу со строками и столбцами.
Панды используют loc
атрибут для возврата одной или нескольких указанных строк .
Пример
Вернуть строку 0:
#refer to the row index:
print(df.loc[0])
Результат
calories 420 duration 50 Name: 0, dtype: int64
Примечание. В этом примере возвращается серия Pandas .
Пример
Вернуть строки 0 и 1:
#use a list of indexes:
print(df.loc[[0, 1]])
Результат
calories duration 0 420 50 1 380 40
Примечание. При использовании []
результатом является Pandas DataFrame .
Получите сертификат!
ЗАРЕГИСТРИРОВАТЬСЯ НА 10 $
Именованные индексы
С index
аргументом вы можете назвать свои собственные индексы.
Пример
Добавьте список имен, чтобы дать каждой строке имя:
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration":
[50, 40, 45]
}
df = pd.DataFrame(data, index = ["day1", "day2",
"day3"])
print(df)
Результат
calories duration day1 420 50 day2 380 40 day3 390 45
Найдите именованные индексы
Используйте именованный индекс в loc
атрибуте, чтобы вернуть указанные строки.
Пример
Вернуть "день2":
#refer to the named index:
print(df.loc["day2"])
Результат
calories 380 duration 40 Name: 0, dtype: int64
Загрузить файлы в DataFrame
Если ваши наборы данных хранятся в файле, Pandas может загрузить их в DataFrame.
Пример
Загрузите файл с разделителями-запятыми (файл CSV) в DataFrame:
import pandas as pd
df = pd.read_csv('data.csv')
print(df)
Вы узнаете больше об импорте файлов в следующих главах.