Наука о данных — построение линейных функций
Набор данных спортивных часов
Взгляните на наш набор данных о здоровье:
Продолжительность | Средний_пульс | Max_Pulse | Calorie_Burnage | Часы_Работы | Часы_Сна |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Постройте существующие данные в Python
Теперь мы можем сначала построить график значений Average_Pulse и Calorie_Burnage, используя библиотеку matplotlib.
Функция plot()
используется для создания двумерного шестиугольного графика бинирования точек x, y:
Пример
import matplotlib.pyplot as plt
health_data.plot(x ='Average_Pulse',
y='Calorie_Burnage', kind='line'),
plt.ylim(ymin=0)
plt.xlim(xmin=0)
plt.show()
Объяснение примера
- Импортируйте модуль pyplot библиотеки matplotlib.
- График данных из Average_Pulse против Calorie_Burnage
kind='line'
говорит нам, какой тип сюжета мы хотим. Здесь мы хотим иметь прямую линию- plt.ylim() и plt.xlim() сообщают нам, с какого значения мы хотим, чтобы ось начиналась. Здесь мы хотим, чтобы ось начиналась с нуля
- plt.show() показывает нам вывод
Приведенный выше код даст следующий результат:
Вывод графика
Как мы видим, существует связь между Average_Pulse и Calorie_Burnage. Calorie_Burnage увеличивается пропорционально среднему пульсу. Это означает, что мы можем использовать Average_Pulse для прогнозирования Calorie_Burnage.
Почему линия не полностью опущена по оси Y?
Причина в том, что у нас нет наблюдений, где Average_Pulse или Calorie_Burnage равны нулю. 80 — это первое наблюдение среднего_пульса, а 240 — первое наблюдение калорий_сжигания.
Посмотрите на линию. Что произойдет с сжиганием калорий, если средний пульс увеличится с 80 до 90?
Мы можем использовать диагональную линию, чтобы найти математическую функцию для прогнозирования сжигания калорий.
Как выясняется из:
- Если средний пульс равен 80, сжигание калорий составляет 240.
- Если средний пульс равен 90, сжигание калорий составляет 260.
- Если средний пульс равен 100, сжигание калорий составляет 280.
Есть шаблон. Если средний пульс увеличивается на 10, сжигание калорий увеличивается на 20.