Панды — Заговор
Заговор
Pandas использует этот plot()
метод для создания диаграмм.
Мы можем использовать Pyplot, подмодуль библиотеки Matplotlib, для визуализации диаграммы на экране.
Подробнее о Matplotlib читайте в нашем Учебнике по Matplotlib .
Пример
Импортируйте pyplot из Matplotlib и визуализируйте наш DataFrame:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot()
plt.show()
В примерах на этой странице используется файл CSV с именем «data.csv».
Скачать data.csv или открыть data.csv
Точечная диаграмма
Укажите, что вам нужен точечный график с
kind
аргументом:
kind = 'scatter'
Точечная диаграмма нуждается в осях x и y.
В приведенном ниже примере мы будем использовать «Продолжительность» для оси X и «Калории» для оси Y.
Включите аргументы x и y следующим образом:
x = 'Duration', y = 'Calories'
Пример
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')
plt.show()
Результат
Помните:
в предыдущем примере мы узнали, что корреляция между «Продолжительность» и «Калории» 0.922721
равна , и пришли к выводу, что чем больше продолжительность, тем больше сжигается калорий.
Глядя на диаграмму рассеяния, я соглашусь.
Давайте создадим еще одну диаграмму рассеяния, где между столбцами, такими как «Длительность» и «Макспульс», существует плохая связь с корреляцией 0.009403
:
Пример
Диаграмма рассеяния, где нет связи между столбцами:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')
plt.show()
Результат
Получите сертификат!
ЗАРЕГИСТРИРОВАТЬСЯ НА 10 $
Гистограмма
Используйте
kind
аргумент, чтобы указать, что вы хотите гистограмму:
kind = 'hist'
Гистограмме нужен только один столбец.
Гистограмма показывает нам частоту каждого интервала, например, сколько тренировок длилось от 50 до 60 минут?
В приведенном ниже примере мы будем использовать столбец «Длительность» для создания гистограммы:
Пример
df["Duration"].plot(kind = 'hist')
Результат
Примечание . Гистограмма показывает, что было проведено более 100 тренировок продолжительностью от 50 до 60 минут.