Искусственный интеллект

Домой Что такое ИИ? Человеческий интеллект История языков История чисел История вычислений Роботы Замена работы Примеры ИИ Теория разума Программирование JavaScript ИИ в браузере

Математика

Математика Линейные функции Линейная алгебра Векторы Матрицы Тензоры

Статистика

Вероятность Статистика Распределение

Графика

ИИ-плоттер Линейные графики ИИ Диаграммы рассеяния ИИ

Наука ИИ

наук Сбор данных Кластеризация Регрессии Машинное обучение Нейронные сети

Машинное обучение

Персептроны Признание Обучение Тестирование Обучение Терминология Мозг.js

ТензорФлоу

Учебник по TFJS Операции TFJS Модели TFJS Средство просмотра TFJS

Пример 1

Ex1 Введение Ex1 Данные Модель Ex1 Ex1 Обучение

Пример 2

Ex2 Введение Ex2 Данные Модель Ex2 Ex2 Обучение

JS-графика

вступление Графическое полотно График Plotly.js График Chart.js График Google График D3.js

Кластеры данных

  • Кластеры — это наборы похожих данных
  • Кластеризация — это тип обучения без учителя.
  • Коэффициент корреляции описывает силу связи.

Кластеры

Кластеры — это наборы данных, основанные на сходстве.

Точки данных, сгруппированные вместе на графике, часто можно разделить на кластеры.

На графике ниже мы можем выделить 3 разных кластера:


Идентификация кластеров

Кластеры могут содержать много ценной информации, но кластеры бывают самых разных форм, так как же мы можем их распознать?

Два основных метода:

  • Использование визуализации
  • Использование алгоритма кластеризации

Кластеризация

Кластеризация — это тип обучения без учителя .

Кластеризация пытается:

  • Соберите похожие данные в группы
  • Собирайте разнородные данные в других группах

Методы кластеризации

  • Метод плотности
  • Иерархический метод
  • Метод разделения
  • Сеточный метод

Метод плотности считает, что точки в плотных регионах имеют больше сходств и различий, чем точки в менее плотных регионах. Плотностный метод имеет хорошую точность. Он также имеет возможность объединять кластеры.
Двумя распространенными алгоритмами являются DBSCAN и OPTICS.

Иерархический метод формирует кластеры в виде древовидной структуры. Новые кластеры формируются с использованием ранее сформированных кластеров.
Двумя распространенными алгоритмами являются CURE и BIRCH.

Метод на основе сетки формулирует данные в конечное число ячеек, которые образуют структуру, подобную сетке.
Два распространенных алгоритма: CLIQUE и STING.

Метод секционирования разделяет объекты на k кластеров, и каждый раздел образует один кластер.
Одним из распространенных алгоритмов является CLARANS.


Коэффициент корреляции

Коэффициент корреляции (r) описывает силу и направление линейной зависимости и переменных x/y на диаграмме рассеяния.

Значение r всегда находится в диапазоне от -1 до +1:

-1,00Идеальный спускОтрицательная линейная зависимость.
-0,70Сильный спускОтрицательная линейная зависимость.
-0,50Умеренный спускОтрицательная линейная зависимость.
-0,30Слабый спускОтрицательная линейная зависимость.
0Нет линейной зависимости.
+0,30Слабый подъемПоложительная линейная зависимость.
+0,50Умеренный подъемПоложительная линейная зависимость.
+0,70Сильный подъемПоложительная линейная зависимость.
+1,00Идеальный подъемПоложительная линейная зависимость.

Идеальный подъем +1,00 :

Идеальный спуск -1.00 :

'

Сильный подъем +0,61 :

Нет отношений :