Разница между глубоким обучением и усиленным обучением

Как глубокое, так и подкрепляющее обучение тесно связаны с вычислительной мощью искусственного интеллекта (ИИ). Это автономные функции машинного обучения, которые позволяют компьютерам создавать свои собственные принципы в поиске решений. Эти два вида обучения могут также сосуществовать в нескольких программах. Как правило, глубокое обучение использует текущие данные, в то время как обучение с подкреплением использует метод проб и ошибок при вычислении прогнозов. Следующие обсуждения далее углубляются в такие различия.

Что такое глубокое обучение?

Глубокое обучение также называется глубоким структурированным обучением или иерархическим обучением. Впервые это было представлено в 1986 году Риной Дехтер, профессором информатики. Он использует текущую информацию в обучающих алгоритмах для поиска подходящих моделей, которые необходимы для прогнозирования данных. Такая система использует различные уровни искусственных нейронных сетей, аналогичных нейронной структуре человеческого мозга. С помощью сложных связей алгоритм может обрабатывать миллионы информации и разбивать зоны на более конкретные прогнозы..

Этот вид обучения может применяться, когда разработчики хотят, чтобы программное обеспечение распознавало фиолетовый цвет на различных изображениях. Затем в программу будет добавлено несколько изображений (следовательно, «глубокое» обучение) с фиолетовыми цветами и без них. Благодаря кластеризации программа сможет определять шаблоны и узнавать, когда отмечать цвет как фиолетовый. Глубокое обучение используется в различных программах распознавания, таких как анализ изображений и задачи прогнозирования, такие как прогнозирование временных рядов..

Что такое обучение усилению?

Усиленное обучение, как правило, определяет прогнозы методом проб и ошибок. Что касается его истории с точки зрения ИИ, он был разработан в конце 1980-х годов; оно основывалось на результатах экспериментов на животных, концепциях оптимального управления и разностных методах. Наряду с контролируемым и неконтролируемым обучением подкрепление является одной из фундаментальных парадигм машинного обучения. Как следует из названия, алгоритм обучается с помощью наград.

Например, ИИ разработан, чтобы играть с людьми в определенной мобильной игре. Каждый раз, когда ИИ проигрывает, алгоритм пересматривается, чтобы максимизировать его счет. Таким образом, этот вид техники учится на своих ошибках. После многочисленных циклов ИИ эволюционировал и стал лучше побеждать игроков-людей. Усиленное обучение применяется в различных передовых технологиях, таких как улучшение робототехники, анализ текста и здравоохранение..

Разница между глубоким обучением и усиленным обучением

Техника обучения

Глубокое обучение способно выполнить целевое поведение, анализируя существующие данные и применяя полученные данные к новому набору информации. С другой стороны, обучение с подкреплением способно изменить свою реакцию путем адаптации непрерывной обратной связи.

Наличие данных

Глубокое обучение работает с уже существующими данными, так как это необходимо для обучения алгоритму. Что касается обучения с подкреплением, оно носит исследовательский характер и может быть разработано без текущего набора данных, так как он учится методом проб и ошибок..

заявка

Глубокое обучение используется в распознавании изображений и речи, глубокой предварительной подготовке сети и задачах по уменьшению размеров. Для сравнения, обучение с подкреплением используется во взаимодействии с внешними стимулами с оптимальным управлением, например, в робототехнике, планировании лифта, телекоммуникациях, компьютерных играх и ИИ здравоохранения..

Также известен как

Глубокое обучение также известно как иерархическое обучение или глубокое структурированное обучение, в то время как обучение с подкреплением не имеет других широко известных терминов..

Машинное обучение

Глубокое обучение является одним из многочисленных методов машинного обучения. С другой стороны, обучение с подкреплением является областью машинного обучения; это одна из трех основных парадигм.

Человеческий мозг

По сравнению с глубоким обучением обучение с подкреплением ближе к возможностям человеческого мозга, так как этот вид интеллекта может быть улучшен посредством обратной связи. Глубокое обучение в основном для признания, и оно меньше связано с взаимодействием.

история

Глубокое обучение было впервые введено в 1986 году Риной Дехтер, в то время как изучение подкрепления было разработано в конце 1980-х годов на основе концепций экспериментов на животных, оптимального управления и разностных методов..

Глубокое обучение против обучения подкреплению

Резюме

  • Глубокое и подкрепляющее обучение - это автономные функции машинного обучения, которые позволяют компьютерам создавать свои собственные принципы в разработке решений..
  • Глубокое обучение использует текущую информацию в обучающих алгоритмах для поиска подходящих моделей, которые необходимы для прогнозирования данных..
  • Усиленное обучение обычно вычисляет прогнозы методом проб и ошибок..
  • Глубокое обучение применяет усвоенные паттерны к новому набору данных, в то время как усвоение выгоды от обратной связи.
  • Глубокое обучение требует уже существующего набора данных для обучения, в то время как обучение с подкреплением не требует текущего набора данных для изучения.
  • Применение глубокого обучения чаще применяется для задач распознавания и уменьшения области, в то время как обучение с подкреплением обычно связано с взаимодействием среды с оптимальным управлением.
  • Глубокое обучение также известно как иерархическое обучение или глубокое структурированное обучение, в то время как обучение с подкреплением не имеет другого термина.
  • Глубокое обучение является одним из многих методов машинного обучения, в то время как обучение с подкреплением является одной из трех основных парадигм машинного обучения..
  • Глубокое обучение было введено в 1986 году, в то время как дополнительное обучение было разработано в конце 1980-х годов..