Наука о данных — Python DataFrame


Создайте DataFrame с Pandas

Фрейм данных — это структурированное представление данных.

Давайте определим фрейм данных с 3 столбцами и 5 строками с вымышленными числами:

Пример

import pandas as pd

d = {'col1': [1, 2, 3, 4, 7], 'col2': [4, 5, 6, 9, 5], 'col3': [7, 8, 12, 1, 11]}

df = pd.DataFrame(data=d)

print(df)

Объяснение примера

  • Импортируйте библиотеку Pandas как pd
  • Определите данные со столбцом и строками в переменной с именем d
  • Создайте фрейм данных с помощью функции pd.DataFrame()
  • Фрейм данных содержит 3 столбца и 5 строк.
  • Распечатайте вывод фрейма данных с помощью функции print()

Пишем пд. перед DataFrame() , чтобы сообщить Python, что мы хотим активировать функцию DataFrame() из библиотеки Pandas.

Помните о заглавных буквах D и F в DataFrame!


Интерпретация вывода

Это результат:

Вывод фрейма данных

Мы видим, что «col1», «col2» и «col3» — это имена столбцов.

Пусть вас не смущают вертикальные числа от 0 до 4. Они сообщают нам информацию о положении строк.

В Python нумерация строк начинается с нуля.

Теперь мы можем использовать Python для подсчета столбцов и строк.

Мы можем использовать df.shape[1], чтобы найти количество столбцов:

Пример

Подсчитайте количество столбцов:

count_column = df.shape[1]
print(count_column)

Мы можем использовать df.shape[0], чтобы найти количество строк:

Пример

Подсчитайте количество строк:

count_row = df.shape[0]
print(count_row)

Почему мы сами не можем просто посчитать строки и столбцы?

Если мы работаем с большими наборами данных с большим количеством столбцов и строк, будет сложно посчитать их самостоятельно. Вы рискуете неправильно посчитать. Если мы правильно используем встроенные функции в Python, мы гарантируем правильность подсчета.