Наука о данных — линейные функции


Математические функции важно знать специалисту по данным, потому что мы хотим делать прогнозы и интерпретировать их.


Линейные функции

В математике функция используется для связи одной переменной с другой переменной.

Предположим, мы рассматриваем взаимосвязь между сжиганием калорий и средним пульсом. Разумно предположить, что в целом сжигание калорий будет меняться по мере изменения среднего пульса — мы говорим, что сжигание калорий зависит от среднего пульса.

Кроме того, разумно предположить, что по мере увеличения среднего пульса увеличивается и сжигание калорий. Две рассматриваемые переменные — сжигание калорий и средний пульс.

Поскольку сжигание калорий зависит от среднего пульса, мы говорим, что сжигание калорий — это зависимая переменная, а средний пульс — независимая переменная.

Связь между зависимой и независимой переменной часто можно выразить математически с помощью формулы (функции).

Линейная функция имеет одну независимую переменную (x) и одну зависимую переменную (y) и имеет следующий вид:

y = f(x) = ax + b

Эта функция используется для вычисления значения зависимой переменной, когда мы выбираем значение для независимой переменной.

Объяснение:

  • f(x) = результат (зависимая переменная)
  • x = вход (независимая переменная)
  • а = наклон = коэффициент независимой переменной. Он дает скорость изменения зависимой переменной
  • b = точка пересечения = значение зависимой переменной, когда x = 0. Это также точка, в которой диагональная линия пересекает вертикальную ось.


Линейная функция с одной независимой переменной

Функция с одной объясняющей переменной означает, что мы используем одну переменную для предсказания.

Допустим, мы хотим предсказать сжигание калорий, используя средний пульс. У нас есть следующая формула:  

f(x) = 2x + 80

Здесь цифры и переменные означают:

  • f(x) = результат. Это число, где мы получаем предсказанное значение Calorie_Burnage.
  • x = вход, который представляет собой Average_Pulse
  • 2 = Slope = Указывает, насколько увеличивается Calorie_Burnage, если Average_Pulse увеличивается на единицу. Он говорит нам, насколько «крута» диагональная линия.
  • 80 = Intercept = Фиксированное значение. Это значение зависимой переменной, когда x = 0

Построение линейной функции

Термин «линейность» означает «прямая линия». Итак, если вы изобразите линейную функцию графически, линия всегда будет прямой линией. Линия может наклоняться вверх, вниз, а в некоторых случаях может быть горизонтальной или вертикальной.

Вот графическое представление вышеприведенной математической функции:

Линейная функция

Пояснения к графику:

  • Горизонтальную ось обычно называют осью x. Здесь он представляет собой Average_Pulse.
  • Вертикальную ось обычно называют осью Y. Здесь он представляет собой Calorie_Burnage.
  • Calorie_Burnage является функцией Average_Pulse, поскольку предполагается, что Calorie_Burnage зависит от Average_Pulse.
  • Другими словами, мы используем Average_Pulse для прогнозирования Calorie_Burnage.
  • Синяя (диагональная) линия представляет структуру математической функции, предсказывающей сжигание калорий.