Машинное обучение — режим среднего медианы
Среднее значение, медиана и мода
Что мы можем узнать, глядя на группу чисел?
В машинном обучении (и в математике) нас часто интересуют три значения:
- Среднее - среднее значение
- Медиана - среднее значение точки
- Режим — наиболее распространенное значение.
Пример: Мы зарегистрировали скорость 13 автомобилей:
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
Каково среднее, среднее или наиболее распространенное значение скорости?
Значит
Среднее значение – это среднее значение.
Чтобы вычислить среднее значение, найдите сумму всех значений и разделите сумму на количество значений:
(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 =
89.77
В модуле NumPy есть метод для этого. Узнайте о модуле NumPy в нашем учебном пособии по NumPy .
Пример
Используйте метод NumPy mean()
, чтобы найти среднюю скорость:
import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.mean(speed)
print(x)
медиана
Среднее значение — это значение посередине после того, как вы отсортировали все значения:
77, 78, 85, 86, 86, 86,
87
, 87, 88, 94, 99, 103, 111
Важно, чтобы числа были отсортированы, прежде чем вы сможете найти медиану.
Модуль NumPy имеет для этого метод:
Пример
Используйте метод NumPy median()
, чтобы найти среднее значение:
import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)
Если в середине два числа, разделите сумму этих чисел на два.
77, 78, 85, 86, 86,
86, 87
,
87, 94, 98, 99, 103
(86 + 87) / 2 = 86.5
Пример
Используя модуль NumPy:
import numpy
speed = [99,86,87,88,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)
Режим
Значение режима — это значение, которое появляется наибольшее количество раз:
99,
86
, 87, 88, 111,
86
, 103, 87, 94, 78, 77, 85,
86
= 86
В модуле SciPy есть метод для этого. Узнайте о модуле SciPy в нашем учебном пособии по SciPy .
Пример
Используйте mode()
метод SciPy, чтобы найти наиболее часто встречающееся число:
from scipy import stats
speed =
[99,86,87,88,111,86,103,87,94,78,77,85,86]
x = stats.mode(speed)
print(x)
Краткое содержание главы
Среднее значение, медиана и мода — это методы, которые часто используются в машинном обучении, поэтому важно понимать лежащую в их основе концепцию.