Наука о данных — линейные функции
Математические функции важно знать специалисту по данным, потому что мы хотим делать прогнозы и интерпретировать их.
Линейные функции
В математике функция используется для связи одной переменной с другой переменной.
Предположим, мы рассматриваем взаимосвязь между сжиганием калорий и средним пульсом. Разумно предположить, что в целом сжигание калорий будет меняться по мере изменения среднего пульса — мы говорим, что сжигание калорий зависит от среднего пульса.
Кроме того, разумно предположить, что по мере увеличения среднего пульса увеличивается и сжигание калорий. Две рассматриваемые переменные — сжигание калорий и средний пульс.
Поскольку сжигание калорий зависит от среднего пульса, мы говорим, что сжигание калорий — это зависимая переменная, а средний пульс — независимая переменная.
Связь между зависимой и независимой переменной часто можно выразить математически с помощью формулы (функции).
Линейная функция имеет одну независимую переменную (x) и одну зависимую переменную (y) и имеет следующий вид:
y = f(x) = ax + b
Эта функция используется для вычисления значения зависимой переменной, когда мы выбираем значение для независимой переменной.
Объяснение:
- f(x) = результат (зависимая переменная)
- x = вход (независимая переменная)
- а = наклон = коэффициент независимой переменной. Он дает скорость изменения зависимой переменной
- b = точка пересечения = значение зависимой переменной, когда x = 0. Это также точка, в которой диагональная линия пересекает вертикальную ось.
Линейная функция с одной независимой переменной
Функция с одной объясняющей переменной означает, что мы используем одну переменную для предсказания.
Допустим, мы хотим предсказать сжигание калорий, используя средний пульс. У нас есть следующая формула:
f(x) = 2x + 80
Здесь цифры и переменные означают:
- f(x) = результат. Это число, где мы получаем предсказанное значение Calorie_Burnage.
- x = вход, который представляет собой Average_Pulse
- 2 = Slope = Указывает, насколько увеличивается Calorie_Burnage, если Average_Pulse увеличивается на единицу. Он говорит нам, насколько «крута» диагональная линия.
- 80 = Intercept = Фиксированное значение. Это значение зависимой переменной, когда x = 0
Построение линейной функции
Термин «линейность» означает «прямая линия». Итак, если вы изобразите линейную функцию графически, линия всегда будет прямой линией. Линия может наклоняться вверх, вниз, а в некоторых случаях может быть горизонтальной или вертикальной.
Вот графическое представление вышеприведенной математической функции:
Пояснения к графику:
- Горизонтальную ось обычно называют осью x. Здесь он представляет собой Average_Pulse.
- Вертикальную ось обычно называют осью Y. Здесь он представляет собой Calorie_Burnage.
- Calorie_Burnage является функцией Average_Pulse, поскольку предполагается, что Calorie_Burnage зависит от Average_Pulse.
- Другими словами, мы используем Average_Pulse для прогнозирования Calorie_Burnage.
- Синяя (диагональная) линия представляет структуру математической функции, предсказывающей сжигание калорий.