R Процентили
процентили
Процентили используются в статистике, чтобы дать вам число, описывающее значение, ниже которого заданный процент значений.
Если мы посмотрим на значения wt
переменной (вес) из mtcars
набора данных:
Наблюдение за массой (массой)
1,513 | 1,615 | 1,835 | 1,935 | 2.140 | 2.200 | 2.320 | 2,465 |
2.620 | 2.770 | 2.780 | 2,875 | 3.150 | 3.170 | 3.190 | 3.215 |
3.435 | 3.440 | 3.440 | 3.440 | 3.460 | 3.520 | 3.570 | 3.570 |
3.730 | 3.780 | 3.840 | 3.845 | 4.070 | 5.250 | 5.345 | 5.424 |
Что такое 75. процентиль веса автомобилей? Ответ 3,61 или 3 610 фунтов, что означает, что 75% автомобилей весят 3 610 фунтов или меньше:
Пример
Data_Cars <- mtcars
# c() specifies which percentile you want
quantile(Data_Cars$wt, c(0.75))
Результат:
75% 3.61
Если вы запустите quantile()
функцию без указания c()
параметра, вы получите процентили 0, 25, 50, 75 и 100:
Пример
Data_Cars <- mtcars
quantile(Data_Cars$wt)
Результат:
0% 25% 50% 75% 100% 1.51300 2.58125 3.32500 3.61000 5.42400
Квартили
Квартили — это данные, разделенные на четыре части при сортировке в порядке возрастания:
- Значение первого квартиля отсекает первые 25% данных.
- Значение второго квартиля отсекает первые 50% данных.
- Значение третьего квартиля отсекает первые 75% данных.
- Значение четвертого квартиля отсекает 100% данных.
Используйте quantile()
функцию, чтобы получить квартили.