R Процентили


процентили

Процентили используются в статистике, чтобы дать вам число, описывающее значение, ниже которого заданный процент значений.

Если мы посмотрим на значения wt переменной (вес) из mtcarsнабора данных:

Наблюдение за массой (массой)

1,513 1,615 1,835 1,935 2.140 2.200 2.320 2,465
2.620 2.770 2.780 2,875 3.150 3.170 3.190 3.215
3.435 3.440 3.440 3.440 3.460 3.520 3.570 3.570
3.730 3.780 3.840 3.845 4.070 5.250 5.345 5.424

Что такое 75. процентиль веса автомобилей? Ответ 3,61 или 3 610 фунтов, что означает, что 75% автомобилей весят 3 610 фунтов или меньше:

Пример

Data_Cars <- mtcars

# c() specifies which percentile you want
quantile(Data_Cars$wt, c(0.75))

Результат:

75% 
3.61

Если вы запустите quantile()функцию без указания c()параметра, вы получите процентили 0, 25, 50, 75 и 100:

Пример

Data_Cars <- mtcars

quantile(Data_Cars$wt)

Результат:

     0%     25%     50%     75%    100% 
1.51300 2.58125 3.32500 3.61000 5.42400 

Квартили

Квартили — это данные, разделенные на четыре части при сортировке в порядке возрастания:

  1. Значение первого квартиля отсекает первые 25% данных.
  2. Значение второго квартиля отсекает первые 50% данных.
  3. Значение третьего квартиля отсекает первые 75% данных.
  4. Значение четвертого квартиля отсекает 100% данных.

Используйте quantile()функцию, чтобы получить квартили.