Наука о данных — статистическое стандартное отклонение


Среднеквадратичное отклонение

Стандартное отклонение — это число, которое описывает, насколько разбросаны наблюдения.

Среднеквадратичное отклонение

Математическая функция будет иметь трудности в предсказании точных значений, если наблюдения «разбросаны». Стандартное отклонение является мерой неопределенности.

Низкое стандартное отклонение означает, что большинство чисел близки к среднему (среднему) значению.

Высокое стандартное отклонение означает, что значения разбросаны по более широкому диапазону.

Стандартное отклонение часто обозначается символом сигма: σ

Мы можем использовать std()функцию из Numpy, чтобы найти стандартное отклонение переменной:

Пример

import numpy as np

std = np.std(full_health_data)
print(std)

Выход:

Среднеквадратичное отклонение

Что означают эти цифры?


Коэффициент вариации

Коэффициент вариации используется, чтобы получить представление о том, насколько велико стандартное отклонение.

Математически коэффициент вариации определяется как:

Coefficient of Variation = Standard Deviation / Mean

 Мы можем сделать это в Python, если перейдем к следующему коду:

Пример

import numpy as np

cv = np.std(full_health_data) / np.mean(full_health_data)
print(cv)

Выход:

Коэффициент вариации

Мы видим, что переменные Duration, Calorie_Burnage и Hours_Work имеют высокое стандартное отклонение по сравнению с Max_Pulse, Average_Pulse и Hours_Sleep.