Наука о данных — Введение в статистику


Введение в статистику

Статистика – это наука об анализе данных.

Когда мы создали модель для предсказания, мы должны оценить надежность предсказания.

В конце концов, чего стоит предсказание, если на него нельзя положиться?


Описательная статистика

Сначала мы рассмотрим некоторые основные описательные статистики.

Описательная статистика обобщает важные характеристики набора данных, такие как:

  • Считать
  • Сумма
  • Среднеквадратичное отклонение
  • Процентиль
  • Средний
  • И т.д..

Это хорошая отправная точка для ознакомления с данными.

Мы можем использовать describe()функцию в Python для суммирования данных:

Пример

print (full_health_data.describe())

Вывод:

Стат Описание

Ты видишь здесь что-нибудь интересное?