Учебник по Python

ДОМАШНЯЯ СТРАНИЦА ПИТОН Введение в Python Python для начала Синтаксис Python Комментарии Python Переменные Python Типы данных Python Числа Python Кастинг Python Строки Python Логические значения Python Операторы Python Списки Python Кортежи Python Наборы Python Словари Python Python, если...иначе Циклы Python в то время как Python для циклов Функции Python Python лямбда Массивы Python Классы/объекты Python Наследование Питона Итераторы Python Объем Python Модули Python Даты Python Математика Python Python JSON регулярное выражение Python Картинка в картинке Python Python Попробуйте... Кроме Пользовательский ввод Python Форматирование строк Python

Работа с файлами

Обработка файлов Python Файлы чтения Python Python Запись/создание файлов Удалить файлы Python

Модули Python

Учебник по NumPy Прохождение панды Учебник по Сципи

Python Matplotlib

Введение в Matplotlib Matplotlib Начать Пилот Matplotlib Графики Matplotlib Маркеры Matplotlib Линия Matplotlib Метки Matplotlib Сетка Matplotlib Подсюжеты Matplotlib Матплотлиб Скаттер Бары Matplotlib Гистограммы Matplotlib Круговые диаграммы Matplotlib

Машинное обучение

Начиная Средняя медиана режима Среднеквадратичное отклонение Процентиль Распределение данных Нормальное распределение данных Точечная диаграмма Линейная регрессия Полиномиальная регрессия Множественная регрессия Масштаб Поезд/тест Древо решений

Python MySQL

Начать работу с MySQL MySQL Создать базу данных MySQL Создать таблицу Вставка MySQL Выбор MySQL MySQL Где Порядок MySQL MySQL Удалить Таблица удаления MySQL Обновление MySQL Лимит MySQL MySQL присоединиться

Python MongoDB

Начать работу с MongoDB MongoDB Создать базу данных MongoDB Создать коллекцию Вставка MongoDB MongoDB Найти Запрос MongoDB Сортировка MongoDB MongoDB Удалить Коллекция MongoDB Drop Обновление MongoDB Лимит MongoDB

Справочник по Python

Обзор Python Встроенные функции Python Строковые методы Python Методы списка Python Словарные методы Python Методы кортежей Python Методы набора Python Файловые методы Python Ключевые слова Python Исключения Python Глоссарий Python

Справочник по модулям

Случайный модуль Модуль запросов Модуль статистики Математический модуль cМатематический модуль

Python Как

Удалить дубликаты списка Перевернуть строку Добавить два числа

Примеры Python

Примеры Python Компилятор Python Упражнения на Python Питон Викторина Сертификат Python

Машинное обучение — точечная диаграмма


Точечная диаграмма

Точечная диаграмма — это диаграмма, на которой каждое значение в наборе данных представлено точкой.

В модуле Matplotlib есть метод рисования точечных диаграмм, ему нужны два массива одинаковой длины, один для значений оси x и один для значений оси y:

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]

y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

Массив xпредставляет возраст каждой машины.

Массив yпредставляет скорость каждого автомобиля.

Пример

Используйте scatter()метод, чтобы нарисовать диаграмму точечной диаграммы:

import matplotlib.pyplot as plt

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

plt.scatter(x, y)
plt.show()

Результат:

Объяснение графика рассеяния

Ось X представляет возраст, а ось Y — скорость.

Из диаграммы видно, что двум самым быстрым машинам было по 2 года, а самой медленной машине было по 12 лет.

Примечание: кажется, что чем новее машина, тем быстрее она едет, но это может быть совпадением, ведь мы зарегистрировали всего 13 машин.



Случайные распределения данных

В машинном обучении наборы данных могут содержать тысячи или даже миллионы значений.

У вас может не быть реальных данных, когда вы тестируете алгоритм, возможно, вам придется использовать случайно сгенерированные значения.

Как мы узнали из предыдущей главы, в этом нам может помочь модуль NumPy!

Давайте создадим два массива, которые оба заполнены 1000 случайными числами из нормального распределения данных.

Первый массив будет иметь среднее значение 5,0 со стандартным отклонением 1,0.

Второй массив будет иметь среднее значение 10,0 со стандартным отклонением 2,0:

Пример

Точечная диаграмма с 1000 точек:

import numpy
import matplotlib.pyplot as plt

x = numpy.random.normal(5.0, 1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)

plt.scatter(x, y)
plt.show()

Результат:

Объяснение графика рассеяния

Мы видим, что точки сосредоточены вокруг значения 5 по оси x и 10 по оси y.

Мы также можем видеть, что разброс по оси y шире, чем по оси x.