Панды DataFrames


Что такое датафрейм?

Pandas DataFrame — это двумерная структура данных, такая как двумерный массив или таблица со строками и столбцами.

Пример

Создайте простой Pandas DataFrame:

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

#load data into a DataFrame object:
df = pd.DataFrame(data)

print(df) 

Результат

     calories  duration
  0       420        50
  1       380        40
  2       390        45


Найдите строку

Как видно из приведенного выше результата, DataFrame похож на таблицу со строками и столбцами.

Панды используют locатрибут для возврата одной или нескольких указанных строк .

Пример

Вернуть строку 0:

#refer to the row index:
print(df.loc[0])

Результат

  calories    420
  duration     50
  Name: 0, dtype: int64

Примечание. В этом примере возвращается серия Pandas .

Пример

Вернуть строки 0 и 1:

#use a list of indexes:
print(df.loc[[0, 1]])

Результат

     calories  duration
  0       420        50
  1       380        40

Примечание. При использовании []результатом является Pandas DataFrame .


w3schools CERTIFIED . 2021

Получите сертификат!

Завершите модули Pandas, выполните упражнения, сдайте экзамен, и вы получите сертификат w3schools!

ЗАРЕГИСТРИРОВАТЬСЯ НА 10 $

Именованные индексы

С indexаргументом вы можете назвать свои собственные индексы.

Пример

Добавьте список имен, чтобы дать каждой строке имя:

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

df = pd.DataFrame(data, index = ["day1", "day2", "day3"])

print(df) 

Результат

        calories  duration
  day1       420        50
  day2       380        40
  day3       390        45

Найдите именованные индексы

Используйте именованный индекс в locатрибуте, чтобы вернуть указанные строки.

Пример

Вернуть "день2":

#refer to the named index:
print(df.loc["day2"])

Результат

  calories    380
  duration     40
  Name: 0, dtype: int64


Загрузить файлы в DataFrame

Если ваши наборы данных хранятся в файле, Pandas может загрузить их в DataFrame.

Пример

Загрузите файл с разделителями-запятыми (файл CSV) в DataFrame:

import pandas as pd

df = pd.read_csv('data.csv')

print(df) 

Вы узнаете больше об импорте файлов в следующих главах.


Проверьте себя с помощью упражнений

Упражнение:

Вставьте правильный метод Pandas для создания DataFrame.

pd.(data)