Наука о данных — Python DataFrame
Создайте DataFrame с Pandas
Фрейм данных — это структурированное представление данных.
Давайте определим фрейм данных с 3 столбцами и 5 строками с вымышленными числами:
Пример
import pandas as pd
d = {'col1': [1, 2, 3, 4, 7], 'col2': [4, 5, 6, 9,
5], 'col3': [7, 8, 12, 1, 11]}
df = pd.DataFrame(data=d)
print(df)
Объяснение примера
- Импортируйте библиотеку Pandas как pd
- Определите данные со столбцом и строками в переменной с именем d
- Создайте фрейм данных с помощью функции pd.DataFrame()
- Фрейм данных содержит 3 столбца и 5 строк.
- Распечатайте вывод фрейма данных с помощью функции print()
Пишем пд. перед DataFrame() , чтобы сообщить Python, что мы хотим активировать функцию DataFrame() из библиотеки Pandas.
Помните о заглавных буквах D и F в DataFrame!
Интерпретация вывода
Это результат:
Мы видим, что «col1», «col2» и «col3» — это имена столбцов.
Пусть вас не смущают вертикальные числа от 0 до 4. Они сообщают нам информацию о положении строк.
В Python нумерация строк начинается с нуля.
Теперь мы можем использовать Python для подсчета столбцов и строк.
Мы можем использовать df.shape[1], чтобы найти количество столбцов:
Пример
Подсчитайте количество столбцов:
count_column = df.shape[1]
print(count_column)
Мы можем использовать df.shape[0], чтобы найти количество строк:
Пример
Подсчитайте количество строк:
count_row = df.shape[0]
print(count_row)
Почему мы сами не можем просто посчитать строки и столбцы?
Если мы работаем с большими наборами данных с большим количеством столбцов и строк, будет сложно посчитать их самостоятельно. Вы рискуете неправильно посчитать. Если мы правильно используем встроенные функции в Python, мы гарантируем правильность подсчета.