Наука о данных — процентили статистики
25%, 50% и 75% - процентили
Процентили используются в статистике, чтобы дать вам число, описывающее значение, ниже которого заданный процент значений.
Попробуем объяснить это на некоторых примерах, используя Average_Pulse.
- 25% процентиль Average_Pulse означает, что 25% всех тренировок имеют средний пульс 100 ударов в минуту или ниже. Если перевернуть утверждение, это означает, что 75% всех тренировок имеют средний пульс 100 ударов в минуту или выше.
- 75% процентиль Average_Pulse означает, что 75% всех тренировок имеют средний пульс 111 или ниже. Если перевернуть утверждение, это означает, что 25% всех тренировок имеют средний пульс 111 ударов в минуту или выше.
Задача: найти 10-процентный процентиль для Max_Pulse.
В следующем примере показано, как это сделать в Python:
Пример
import numpy as np
Max_Pulse= full_health_data["Max_Pulse"]
percentile10 = np.percentile(Max_Pulse, 10)
print(percentile10)
- Max_Pulse = full_health_data["Max_Pulse"] — изолировать переменную Max_Pulse от полного набора данных о здоровье.
- np.percentile() используется для определения того, что нам нужен процентиль 10% от Max_Pulse.
10%-й процентиль Max_Pulse равен 120. Это означает, что 10% всех тренировок имеют Max_Pulse 120 или ниже.