Контролируемое обучение и неконтролируемое обучение являются двумя основными понятиями машинного обучения. Контролируемое обучение - это задача машинного обучения, состоящая в изучении функции, которая отображает входные данные в выходные данные на основе примеров пар ввода-вывода. Неподготовленное обучение - это задача машинного обучения, заключающаяся в том, чтобы вывести функцию для описания скрытой структуры из немаркированных данных. ключевое отличие между контролируемым и неконтролируемым машинным обучением является то, что контролируемое обучение использует маркированные данные, в то время как неконтролируемое обучение использует немаркированные данные.
Машинное обучение - это область компьютерных наук, которая позволяет компьютерной системе учиться на данных без явного программирования. Это позволяет анализировать данные и прогнозировать закономерности в них. Есть много приложений машинного обучения. Некоторые из них - распознавание лиц, распознавание жестов и распознавание речи. Существуют различные алгоритмы, связанные с машинным обучением. Некоторые из них - это регрессия, классификация и кластеризация. Наиболее распространенными языками программирования для разработки приложений на основе машинного обучения являются R и Python. Другие языки, такие как Java, C ++ и Matlab также могут быть использованы.
1. Обзор и основные отличия
2. Что такое контролируемое обучение
3. Что такое обучение без учителя
4. Сходство между контролируемым и неконтролируемым машинным обучением
5. Сравнение по принципу «параллельное обучение» и машинное обучение без контроля в табличной форме
6. Резюме
В системах, основанных на машинном обучении, модель работает в соответствии с алгоритмом. В контролируемом обучении модель контролируется. Во-первых, необходимо обучить модель. Получив знания, он может предсказать ответы на будущие случаи. Модель обучается с использованием маркированного набора данных. Когда данные из выборки передаются в систему, она может предсказать результат. Ниже приводится небольшая выдержка из популярного набора данных IRIS..
В соответствии с приведенной выше таблицей, длина Sepal, ширина Sepal, длина Patel, ширина Patel и вид называются атрибутами. Столбцы известны как функции. В одной строке есть данные для всех атрибутов. Поэтому один ряд называется наблюдением. Данные могут быть числовыми или категориальными. В модели приведены наблюдения с соответствующим названием вида в качестве входных данных. Когда дается новое наблюдение, модель должна предсказывать тип вида, к которому она относится.
В контролируемом обучении существуют алгоритмы классификации и регрессии. Классификация - это процесс классификации помеченных данных. Модель создала границы, которые разделяли категории данных. Когда новые данные предоставляются модели, она может быть классифицирована в зависимости от того, где существует точка. K-Ближайшие соседи (KNN) - это модель классификации. В зависимости от значения k определяется категория. Например, когда k равно 5, если конкретная точка данных находится вблизи восьми точек данных в категории A и шести точек данных в категории B, тогда точка данных будет классифицироваться как A.
Регрессия - это процесс прогнозирования тенденции предыдущих данных для прогнозирования результата новых данных. В регрессии выходные данные могут состоять из одной или нескольких непрерывных переменных. Прогнозирование выполняется с использованием линии, которая охватывает большинство точек данных. Простейшая модель регрессии - это линейная регрессия. Это быстро и не требует настройки параметров, таких как в KNN. Если данные показывают параболическую тенденцию, то модель линейной регрессии не подходит.
Вот некоторые примеры контролируемых алгоритмов обучения. Как правило, результаты, полученные с помощью контролируемых методов обучения, являются более точными и надежными, поскольку входные данные хорошо известны и маркированы. Поэтому машина должна анализировать только скрытые закономерности.
При неконтролируемом обучении модель не контролируется. Модель работает самостоятельно, чтобы предсказать результаты. Он использует алгоритмы машинного обучения, чтобы прийти к выводам о немаркированных данных. Как правило, неконтролируемые алгоритмы обучения сложнее, чем контролируемые алгоритмы обучения, потому что информации мало. Кластеризация - это тип обучения без учителя. Может использоваться для группировки неизвестных данных с использованием алгоритмов. К-среднее и плотность на основе кластеризации являются двумя алгоритмами кластеризации.
алгоритм среднего значения, размещает k центроидов случайным образом для каждого кластера. Затем каждая точка данных назначается ближайшему центроиду. Евклидово расстояние используется для расчета расстояния от точки данных до центроида. Точки данных классифицируются по группам. Позиции для k центроидов вычисляются снова. Новая позиция центроида определяется по среднему значению всех точек в группе. Снова каждая точка данных назначается ближайшему центроиду. Этот процесс повторяется до тех пор, пока центроиды больше не изменятся. k-mean - это быстрый алгоритм кластеризации, но нет определенной инициализации точек кластеризации. Кроме того, существует большое разнообразие моделей кластеризации, основанных на инициализации точек кластеризации..
Другой алгоритм кластеризации Плотность на основе кластеризации. Он также известен как приложения пространственной кластеризации на основе плотности с шумом. Он работает, определяя кластер как максимальный набор точек плотности, связанных. Это два параметра, используемые для кластеризации на основе плотности. Это Ɛ (эпсилон) и минимальные баллы. Ɛ - максимальный радиус окрестности. Минимальные точки - это минимальное количество точек в Ɛ окрестности для определения кластера. Вот некоторые примеры кластеризации, которая попадает в обучение без учителя.
Как правило, результаты, полученные из неконтролируемых алгоритмов обучения, не очень точны и надежны, потому что машина должна определять и маркировать входные данные, прежде чем определять скрытые шаблоны и функции..
Машинное обучение под присмотром против машинного обучения | |
Контролируемое обучение - это задача машинного обучения, состоящая в изучении функции, которая отображает входные данные в выходные данные на основе примеров пар ввода-вывода.. | Неподготовленное обучение - это задача машинного обучения, заключающаяся в выводе функции для описания скрытой структуры из немаркированных данных.. |
Основная функциональность | |
В контролируемом обучении модель прогнозирует результат на основе помеченных входных данных. | При обучении без учителя модель прогнозирует результат без маркированных данных, самостоятельно определяя закономерности.. |
Точность результатов | |
Результаты, полученные из контролируемых методов обучения, являются более точными и надежными. | Результаты, полученные от неконтролируемых методов обучения, не очень точны и надежны. |
Основные алгоритмы | |
Существуют алгоритмы регрессии и классификации в контролируемом обучении.. | Существуют алгоритмы кластеризации в обучении без учителя. |
Контролируемое обучение и неконтролируемое обучение - это два типа машинного обучения. Контролируемое обучение - это задача машинного обучения, состоящая в изучении функции, которая отображает входные данные в выходные данные на основе примеров пар ввода-вывода. Неподготовленное обучение - это задача машинного обучения, заключающаяся в выводе функции для описания скрытой структуры из немаркированных данных. Разница между контролируемым и неконтролируемым машинным обучением заключается в том, что контролируемое обучение использует помеченные данные, а неконтролируемое обучение использует немеченые данные..
1.TheBigDataUniversity. Машинное обучение - Supervised VS Unsuperised Learning, Cognitive Class, 13 марта 2017 г. Доступно здесь
2. «Обучение без учителя». Википедия, Фонд Викимедиа, 20 марта 2018 г. Доступно здесь
3. «Контролируемое обучение». Википедия, Фонд Викимедиа, 15 марта 2018 г. Доступно здесь
1.'2729781 'от GDJ (Public Domain) через pixabay