Учебник по Python

ДОМАШНЯЯ СТРАНИЦА ПИТОН Введение в Python Python для начала Синтаксис Python Комментарии Python Переменные Python Типы данных Python Числа Python Кастинг Python Строки Python Логические значения Python Операторы Python Списки Python Кортежи Python Наборы Python Словари Python Python, если...иначе Циклы Python в то время как Python для циклов Функции Python Python лямбда Массивы Python Классы/объекты Python Наследование Питона Итераторы Python Объем Python Модули Python Даты Python Математика Python Python JSON регулярное выражение Python Картинка в картинке Python Python Попробуйте... Кроме Пользовательский ввод Python Форматирование строк Python

Работа с файлами

Обработка файлов Python Файлы чтения Python Python Запись/создание файлов Удалить файлы Python

Модули Python

Учебник по NumPy Прохождение панды Учебник по Сципи

Python Matplotlib

Введение в Matplotlib Matplotlib Начать Пилот Matplotlib Графики Matplotlib Маркеры Matplotlib Линия Matplotlib Метки Matplotlib Сетка Matplotlib Подсюжеты Matplotlib Матплотлиб Скаттер Бары Matplotlib Гистограммы Matplotlib Круговые диаграммы Matplotlib

Машинное обучение

Начиная Средняя медиана режима Среднеквадратичное отклонение Процентиль Распределение данных Нормальное распределение данных Точечная диаграмма Линейная регрессия Полиномиальная регрессия Множественная регрессия Масштаб Поезд/тест Древо решений

Python MySQL

Начать работу с MySQL MySQL Создать базу данных MySQL Создать таблицу Вставка MySQL Выбор MySQL MySQL Где Порядок MySQL MySQL Удалить Таблица удаления MySQL Обновление MySQL Лимит MySQL MySQL присоединиться

Python MongoDB

Начать работу с MongoDB MongoDB Создать базу данных MongoDB Создать коллекцию Вставка MongoDB MongoDB Найти Запрос MongoDB Сортировка MongoDB MongoDB Удалить Коллекция MongoDB Drop Обновление MongoDB Лимит MongoDB

Справочник по Python

Обзор Python Встроенные функции Python Строковые методы Python Методы списка Python Словарные методы Python Методы кортежей Python Методы набора Python Файловые методы Python Ключевые слова Python Исключения Python Глоссарий Python

Справочник по модулям

Случайный модуль Модуль запросов Модуль статистики Математический модуль cМатематический модуль

Python Как

Удалить дубликаты списка Перевернуть строку Добавить два числа

Примеры Python

Примеры Python Компилятор Python Упражнения на Python Питон Викторина Сертификат Python

Машинное обучение

Машинное обучение заставляет компьютер учиться, изучая данные и статистику.

Машинное обучение — это шаг в сторону искусственного интеллекта (ИИ).

Машинное обучение — это программа, которая анализирует данные и учится предсказывать результат.

Когда начать?

В этом уроке мы вернемся к математике и изучим статистику, а также способы расчета важных чисел на основе наборов данных.

Мы также узнаем, как использовать различные модули Python, чтобы получить нужные нам ответы.

И мы научимся создавать функции, способные предсказывать результат на основе того, что мы узнали.


Набор данных

В сознании компьютера набор данных — это любой набор данных. Это может быть что угодно, от массива до полной базы данных.

Пример массива:

[99,86,87,88,111,86,103,87,94,78,77,85,86]

Пример базы данных:

КарнамеЦветВозрастСкоростьАвтопасс
БМВкрасный599Д
Вольвочернить786Д
Фольксвагенсерый887Н
Фольксвагенбелый788Д
Фордбелый2111Д
Фольксвагенбелый1786Д
Теслакрасный2103Д
БМВчернить987Д
Вольвосерый494Н
Фордбелый1178Н
Тойотасерый1277Н
Фольксвагенбелый985Н
Тойотасиний686Д

Глядя на массив, мы можем предположить, что среднее значение, вероятно, составляет около 80 или 90, и мы также можем определить самое высокое и самое низкое значение, но что еще мы можем сделать?

И, взглянув на базу данных, мы можем увидеть, что самый популярный цвет — белый, а самому старому автомобилю — 17 лет, но что, если бы мы могли предсказать, есть ли у автомобиля AutoPass, просто взглянув на другие значения?

Вот для чего нужно машинное обучение! Анализ данных и прогнозирование результата!

В машинном обучении принято работать с очень большими наборами данных. В этом уроке мы постараемся максимально упростить понимание различных концепций машинного обучения и будем работать с небольшими простыми для понимания наборами данных.


Типы данных

Для анализа данных важно знать, с какими типами данных мы имеем дело.

Мы можем разделить типы данных на три основные категории:

  • Числовой
  • Категориальный
  • Порядковый номер

Числовые данные — это числа, и их можно разделить на две числовые категории:

  • Дискретные данные
    — числа, которые ограничены целыми числами. Пример: Количество проезжающих мимо автомобилей.
  • Непрерывные данные
    — числа, которые имеют бесконечное значение. Пример: цена товара или размер товара.

Категориальные данные — это значения, которые нельзя сравнивать друг с другом. Пример: значение цвета или любые значения да/нет.

Порядковые данные похожи на категориальные данные, но их можно сравнивать друг с другом. Пример: школьные оценки, где A лучше, чем B, и так далее.

Зная тип данных вашего источника данных, вы сможете узнать, какую технику использовать при их анализе.

Вы узнаете больше о статистике и анализе данных в следующих главах.