Разница между ИИ, машинным обучением, обработкой естественного языка и глубоким обучением

ИИ (Искусственный интеллект) — подраздел компьютерных наук, который был создан в 1960-х годах. ИИ занимается решением трудных для компьютеров, но простых для людей, задач. В частности, сильная ИИ-система та, которая может делать все, что человек (возможно, исключая физические вещи). Это довольно общее понятие и включает в себя все виды задач, такие как, планирование, перемещение, распознавание объектов и звуков, речь, перевод, выполнение социальных или деловых сделок, творческая работка, и т.д.

Обработка естественного языка (NLP на англ., прим. автора) — часть ИИ, которая направленна на работу с человеческим языком (обычно написанным).

Машинное обучение — методы ИИ направленные на принятие "правильного" действия, когда они программно не прописаны разработчиком. Как правило, требуется некоторый внешний процесс, чтобы определить, было ли действие правильным или нет.

С математической точки зрения — это функция: вы задаете входные данные и хотите получить правильный результат. Вся проблема заключается в том, чтобы автоматически построить модель этой математической функции. Проводя параллель с ИИ: если разработчик может написать умную программу, которая имеет человекоподобное поведение, это может быть ИИ; но, если ее параметры не извлекаются автоматически из данных, это не может считаться машинным обучением.

Глубокое обучение является одним из популярных видов машинного обучения. Оно включает в себя определенный вид математической модели, которую можно рассматривать как композицию простых блоков (функциональный состав) определенного типа. Где некоторые из этих блоков могут быть скорректированы для улучшения предсказания конечного результата.

Слово "глубокий" означает, что композиция состоит из блоков, которые складываются друг на друга. Сложность заключается в рассортировке блоков, находящихся далеко от конечного результата, так как небольшое изменение в блоке может иметь косвенное влияние на результат. Это достигается путем обратного распространение ошибки с градиентным спуском (распространение сигналов ошибки от выходов сети к её входам, прим. автора), который позволяет изменять параметры таким образом, чтобы они непосредственно улучшали модель.

Перевод статьи Дмитрия Гензел (инженер и исследователь в области машинного обучения и технологий обработки естественного языка в Facebook).