Наука о данных — статистическое стандартное отклонение
Среднеквадратичное отклонение
Стандартное отклонение — это число, которое описывает, насколько разбросаны наблюдения.
Математическая функция будет иметь трудности в предсказании точных значений, если наблюдения «разбросаны». Стандартное отклонение является мерой неопределенности.
Низкое стандартное отклонение означает, что большинство чисел близки к среднему (среднему) значению.
Высокое стандартное отклонение означает, что значения разбросаны по более широкому диапазону.
Стандартное отклонение часто обозначается символом сигма: σ
Мы можем использовать std()
функцию из Numpy, чтобы найти стандартное отклонение переменной:
Пример
import numpy as np
std = np.std(full_health_data)
print(std)
Выход:
Что означают эти цифры?
Коэффициент вариации
Коэффициент вариации используется, чтобы получить представление о том, насколько велико стандартное отклонение.
Математически коэффициент вариации определяется как:
Coefficient of Variation = Standard Deviation / Mean
Мы можем сделать это в Python, если перейдем к следующему коду:
Пример
import numpy as np
cv = np.std(full_health_data) / np.mean(full_health_data)
print(cv)
Выход:
Мы видим, что переменные Duration, Calorie_Burnage и Hours_Work имеют высокое стандартное отклонение по сравнению с Max_Pulse, Average_Pulse и Hours_Sleep.