Наука о данных — Введение в статистику
Введение в статистику
Статистика – это наука об анализе данных.
Когда мы создали модель для предсказания, мы должны оценить надежность предсказания.
В конце концов, чего стоит предсказание, если на него нельзя положиться?
Описательная статистика
Сначала мы рассмотрим некоторые основные описательные статистики.
Описательная статистика обобщает важные характеристики набора данных, такие как:
- Считать
- Сумма
- Среднеквадратичное отклонение
- Процентиль
- Средний
- И т.д..
Это хорошая отправная точка для ознакомления с данными.
Мы можем использовать describe()
функцию в Python для суммирования данных:
Пример
print (full_health_data.describe())
Вывод:
Ты видишь здесь что-нибудь интересное?