Панды — Заговор



Заговор

Pandas использует этот plot()метод для создания диаграмм.

Мы можем использовать Pyplot, подмодуль библиотеки Matplotlib, для визуализации диаграммы на экране.

Подробнее о Matplotlib читайте в нашем Учебнике по Matplotlib .

Пример

Импортируйте pyplot из Matplotlib и визуализируйте наш DataFrame:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot()

plt.show()

В примерах на этой странице используется файл CSV с именем «data.csv».

Скачать data.csv или открыть data.csv


Точечная диаграмма

Укажите, что вам нужен точечный график с kindаргументом:

kind = 'scatter'

Точечная диаграмма нуждается в осях x и y.

В приведенном ниже примере мы будем использовать «Продолжительность» для оси X и «Калории» для оси Y.

Включите аргументы x и y следующим образом:

x = 'Duration', y = 'Calories'

Пример

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')

plt.show()

Результат

Помните: в предыдущем примере мы узнали, что корреляция между «Продолжительность» и «Калории» 0.922721равна , и пришли к выводу, что чем больше продолжительность, тем больше сжигается калорий.

Глядя на диаграмму рассеяния, я соглашусь.

Давайте создадим еще одну диаграмму рассеяния, где между столбцами, такими как «Длительность» и «Макспульс», существует плохая связь с корреляцией 0.009403:

Пример

Диаграмма рассеяния, где нет связи между столбцами:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')

plt.show()

Результат


w3schools CERTIFIED . 2021

Получите сертификат!

Завершите модули Pandas, выполните упражнения, сдайте экзамен, и вы получите сертификат w3schools!

ЗАРЕГИСТРИРОВАТЬСЯ НА 10 $

Гистограмма

Используйте kindаргумент, чтобы указать, что вы хотите гистограмму:

kind = 'hist'

Гистограмме нужен только один столбец.

Гистограмма показывает нам частоту каждого интервала, например, сколько тренировок длилось от 50 до 60 минут?

В приведенном ниже примере мы будем использовать столбец «Длительность» для создания гистограммы:

Пример

df["Duration"].plot(kind = 'hist')

Результат

Примечание . Гистограмма показывает, что было проведено более 100 тренировок продолжительностью от 50 до 60 минут.


Проверьте себя с помощью упражнений

Упражнение:

Вставьте правильный синтаксис для визуализации данных в DataFrame в виде диаграммы (графика).

df.()