Наука о данных — таблица регрессии


Таблица регрессии

Результаты линейной регрессии можно обобщить в таблице регрессии.

В содержание таблицы входят:

  • Информация о модели
  • Коэффициенты функции линейной регрессии
  • Статистика регрессии
  • Статистика коэффициентов функции линейной регрессии
  • Другая информация, которую мы не будем рассматривать в этом модуле

Таблица регрессии со значением Average_Pulse в качестве независимой переменной

Таблица линейной регрессии

Теперь вы можете начать свое путешествие по анализу расширенного вывода!


Создайте таблицу линейной регрессии в Python

Вот как создать таблицу линейной регрессии в Python:

Пример

import pandas as pd
import statsmodels.formula.api as smf

full_health_data = pd.read_csv("data.csv", header=0, sep=",")

model = smf.ols('Calorie_Burnage ~ Average_Pulse', data = full_health_data)
results = model.fit()
print(results.summary())

Объяснение примера:

  • Импортируйте библиотеку statsmodels.formula.api как smf. Statsmodels — это статистическая библиотека на Python.
  • Используйте набор full_health_data.
  • Создайте модель на основе метода наименьших квадратов с помощью smf.ols(). Обратите внимание, что объясняющая переменная должна быть записана первой в скобках. Используйте набор данных full_health_data.
  • Вызывая .fit(), вы получаете переменные результаты. Это содержит много информации о регрессионной модели.
  • Вызови summary(), чтобы получить таблицу с результатами линейной регрессии.