Наука о данных — процентили статистики


25%, 50% и 75% - процентили

Процентили используются в статистике, чтобы дать вам число, описывающее значение, ниже которого заданный процент значений.

процентили

Попробуем объяснить это на некоторых примерах, используя Average_Pulse.

  • 25% процентиль Average_Pulse означает, что 25% всех тренировок имеют средний пульс 100 ударов в минуту или ниже. Если перевернуть утверждение, это означает, что 75% всех тренировок имеют средний пульс 100 ударов в минуту или выше.
  • 75% процентиль Average_Pulse означает, что 75% всех тренировок имеют средний пульс 111 или ниже. Если перевернуть утверждение, это означает, что 25% всех тренировок имеют средний пульс 111 ударов в минуту или выше.

Задача: найти 10-процентный процентиль для Max_Pulse.

В следующем примере показано, как это сделать в Python:

Пример

import numpy as np

Max_Pulse= full_health_data["Max_Pulse"]
percentile10 = np.percentile(Max_Pulse, 10)
print(percentile10)
  • Max_Pulse = full_health_data["Max_Pulse"] — изолировать переменную Max_Pulse от полного набора данных о здоровье.
  • np.percentile() используется для определения того, что нам нужен процентиль 10% от Max_Pulse.

10%-й процентиль Max_Pulse равен 120. Это означает, что 10% всех тренировок имеют Max_Pulse 120 или ниже.