Что такое машинное обучение с учителем?
При обучении с учителем вы обучаете машину, используя данные, которые хорошо «помечены ». Это означает, что некоторые данные уже помечены правильным ответом. Это можно сравнить с обучением, которое происходит в присутствии руководителя или учителя.
Алгоритм обучения с учителем учится на помеченных данных обучения, помогает прогнозировать результаты для непредвиденных данных. Успешное построение, масштабирование и развертывание точной модели машинного обучения с учителем требует времени и технических знаний от команды высококвалифицированных специалистов по данным. Более того, специалист по анализу данных должен перестроить модели, чтобы убедиться, что предоставленная информация остается верной до тех пор, пока данные не изменятся.
В этом руководстве вы узнаете
- Что такое машинное обучение с учителем?
- Что такое обучение без учителя?
- Почему обучение с учителем?
- Почему обучение без учителя?
- Как работает контролируемое обучение?
- Как работает обучение без учителя?
- Типы контролируемых методов машинного обучения
- Типы методов машинного обучения без учителя
- Контролируемое и неконтролируемое обучение
Что такое обучение без учителя?
Неконтролируемое обучение - это метод машинного обучения, при котором вам не нужно контролировать модель. Вместо этого вам нужно позволить модели работать самостоятельно, чтобы обнаруживать информацию. В основном он имеет дело с немаркированными данными.
Алгоритмы обучения без учителя позволяют выполнять более сложные задачи обработки по сравнению с обучением с учителем. Тем не менее, обучение без учителя может быть более непредсказуемым по сравнению с другими методами естественного обучения, глубокого обучения и обучения с подкреплением.
Почему обучение с учителем?
- Контролируемое обучение позволяет собирать данные или создавать выходные данные из предыдущего опыта.
- Помогает оптимизировать критерии эффективности, используя опыт
- Машинное обучение с учителем помогает решать различные типы реальных вычислительных задач.
Почему обучение без учителя?
Вот основные причины использования обучения без учителя:
- Машинное обучение без учителя находит в данных все неизвестные закономерности.
- Неконтролируемые методы помогают найти функции, которые могут быть полезны для категоризации.
- Это происходит в режиме реального времени, поэтому все входные данные будут проанализированы и помечены в присутствии учащихся.
- Легче получить данные без меток с компьютера, чем данные с метками, которые требуют ручного вмешательства.
Как работает контролируемое обучение?
Например, вы хотите обучить машину, которая поможет вам предсказать, сколько времени вам потребуется, чтобы ехать домой с рабочего места. Здесь вы начинаете с создания набора помеченных данных. Эти данные включают
- Погодные условия
- Время дня
- каникулы
Все эти детали - ваши входные данные. Выходные данные - это количество времени, которое потребовалось, чтобы вернуться домой в этот конкретный день.
Вы инстинктивно знаете, что если на улице идет дождь, вам понадобится больше времени, чтобы ехать домой. Но машине нужны данные и статистика.
Давайте теперь посмотрим, как вы можете разработать модель обучения с учителем из этого примера, которая поможет пользователю определить время в пути. Первое, что вам нужно создать, - это набор обучающих данных. Этот обучающий набор будет содержать общее время в пути и соответствующие факторы, такие как погода, время и т. Д. На основе этого обучающего набора ваша машина может увидеть прямую зависимость между количеством дождя и временем, которое вам понадобится, чтобы добраться до дома.
Таким образом, выясняется, что чем больше идет дождь, тем дольше вы будете ехать, чтобы вернуться домой. Он также может увидеть связь между временем, когда вы уходите с работы, и временем, когда вы будете в дороге.
Чем ближе вы к 18:00, тем дольше вы доберетесь до дома. Ваша машина может обнаружить некоторые отношения с вашими помеченными данными.
Это начало вашей модели данных. Это начинает влиять на то, как дождь влияет на то, как люди водят машину. Также становится очевидным, что все больше людей путешествуют в определенное время суток.
Как работает обучение без учителя?
Возьмем, к примеру, ребенка и ее семейную собаку.
Она знает и опознает эту собаку. Через несколько недель друг семьи приносит с собой собаку и пытается поиграть с малышом.
Бэби раньше не видел эту собаку. Но он узнает, что многие черты (2 уха, глаза, ходьба на 4 ногах) похожи на ее домашнюю собаку. Она идентифицирует новое животное как собаку. Это обучение без учителя, при котором вас не учат, но вы учитесь на основе данных (в данном случае данных о собаке). Если бы это обучение проходило под наблюдением, друг семьи сказал бы ребенку, что это собака.
Типы контролируемых методов машинного обучения
Регрессия:
Метод регрессии предсказывает одно выходное значение с использованием обучающих данных.
Пример: вы можете использовать регрессию для прогнозирования стоимости дома на основе данных обучения. Входными переменными будут местонахождение, размер дома и т. Д.
Классификация:
Классификация означает группировку вывода внутри класса. Если алгоритм пытается разделить входные данные на два разных класса, это называется двоичной классификацией. Выбор между более чем двумя классами называется многоклассовой классификацией.
Пример : определение того, будет ли кто-то неплательщиком ссуды.
Сильные стороны : выходные данные всегда имеют вероятностную интерпретацию, и алгоритм можно упорядочить, чтобы избежать переобучения.
Слабые стороны : логистическая регрессия может работать неэффективно при наличии множественных или нелинейных границ принятия решений. Этот метод не является гибким, поэтому он не фиксирует более сложные отношения.
Типы методов машинного обучения без учителя
Проблемы неконтролируемого обучения далее группируются в проблемы кластеризации и ассоциации.
Кластеризация
Кластеризация - важная концепция, когда речь идет об обучении без учителя. В основном он занимается поиском структуры или шаблона в коллекции некатегоризованных данных. Алгоритмы кластеризации обработают ваши данные и найдут естественные кластеры (группы), если они существуют в данных. Вы также можете изменить количество кластеров, которые должны идентифицировать ваши алгоритмы. Это позволяет вам регулировать степень детализации этих групп.
Ассоциация
Правила ассоциации позволяют устанавливать ассоциации между объектами данных внутри больших баз данных. Этот метод без учителя предназначен для обнаружения интересных взаимосвязей между переменными в больших базах данных. Например, люди, которые покупают новый дом, скорее всего, купят новую мебель.
Другие примеры:
- Подгруппа больных раком, сгруппированная по результатам измерений экспрессии генов.
- Группы покупателей на основе их истории просмотров и покупок
- Группа фильмов по рейтингу зрителей фильмов
Контролируемое и неконтролируемое обучение
Параметры | Техника машинного обучения с учителем | Техника неконтролируемого машинного обучения |
Процесс | В модели обучения с учителем будут указаны входные и выходные переменные. | В модели обучения без учителя будут предоставлены только входные данные. |
Входные данные | Алгоритмы обучаются с использованием помеченных данных. | Алгоритмы используются против данных, которые не помечены |
Используемые алгоритмы | Машина опорных векторов, нейронная сеть, линейная регрессия и логистическая регрессия, случайный лес и деревья классификации. | Неконтролируемые алгоритмы можно разделить на разные категории: например, кластерные алгоритмы, K-средства, иерархическая кластеризация и т. Д. |
Вычислительная сложность | Обучение с учителем - более простой метод. | Обучение без учителя - сложная с точки зрения вычислений |
Использование данных | Модель контролируемого обучения использует данные обучения для изучения связи между входными и выходными данными. | При обучении без учителя выходные данные не используются. |
Точность результатов | Очень точный и надежный метод. | Менее точный и надежный метод. |
Обучение в реальном времени | Метод обучения проходит офлайн. | Обучение происходит в реальном времени. |
Количество классов | Количество классов известно. | Количество классов не известно. |
Главный недостаток | Классификация больших данных может стать настоящей проблемой при обучении с учителем. | Вы не можете получить точную информацию о сортировке данных, а выходные данные, используемые при обучении без учителя, помечены и неизвестны. |
Резюме
- При обучении с учителем вы обучаете машину, используя данные, которые хорошо «помечены».
- Неконтролируемое обучение - это метод машинного обучения, при котором вам не нужно контролировать модель.
- Контролируемое обучение позволяет собирать данные или создавать выходные данные из предыдущего опыта.
- Машинное обучение без учителя помогает находить в данных все неизвестные закономерности.
- Например, вы сможете определить время, затраченное на обратный путь, исходя из погодных условий, времени дня и праздника.
- Например, Бэби может идентифицировать других собак на основе прошлого обучения под присмотром.
- Регрессия и классификация - это два типа контролируемых методов машинного обучения.
- Кластеризация и ассоциация - это два типа обучения без учителя.
- В модели обучения с учителем будут заданы входные и выходные переменные, в то время как в модели обучения без учителя будут заданы только входные данные.