Функции науки о данных


В этой главе показаны три часто используемые функции при работе с наукой о данных: max(), min() и mean().


Набор данных спортивных часов

Продолжительность Средний_пульс Max_Pulse Calorie_Burnage Часы_Работы Часы_Сна
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

Приведенный выше набор данных состоит из 6 переменных, каждая из которых имеет 10 наблюдений:

  • Продолжительность — сколько времени длилась тренировочная сессия в минутах?
  • Average_Pulse — Каким был средний пульс на тренировке? Это измеряется ударами в минуту
  • Max_Pulse — какой был максимальный пульс на тренировке?
  • Calorie_Burnage — Сколько калорий было сожжено на тренировке?
  • Hours_Work — Сколько часов мы работали на нашей работе до тренировки?
  • Hours_Sleep — сколько мы спали в ночь перед тренировкой?

Мы используем подчеркивание (_) для разделения строк, потому что Python не может читать пробел как разделитель.



Функция макс()

Функция Python max()используется для поиска максимального значения в массиве.

Пример

Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_max)

Функция мин()

Функция Python min()используется для поиска наименьшего значения в массиве.

Пример

Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_min)

Функция среднего()

Функция NumPy mean()используется для нахождения среднего значения массива.

Пример

import numpy as np

Calorie_burnage = [240, 250, 260, 270, 280, 290, 300, 310, 320, 330]

Average_calorie_burnage = np.mean(Calorie_burnage)

print(Average_calorie_burnage)

Пишем нп. перед значением , чтобы сообщить Python, что мы хотим активировать функцию среднего значения из библиотеки Numpy .