Эндрю Нг о будущем агентных систем и ИИ: главные тезисы из беседы.
На одной из последних конференций Эндрю Нг поделился своими мыслями о текущем состоянии и перспективах развития агентных систем, голосовых технологий и новых инструментов в области искусственного интеллекта.
Для тех, кто не в курсе, его имя уже давно стало нарицательным. Его курсы на Coursera — это пропуск в мир глубокого обучения для миллионов людей. Но мало кто знает, что он также сыграл ключевую роль в популяризации LangChain , активно поддерживая развитие этой технологии с самого начала.
Ниже я выделил основные тезисы из его беседы.
Агентность: не спорить, а внедрять
Вместо того чтобы обсуждать, является ли система настоящим «агентом», Нг предлагает сосредоточиться на степени автономии. Он выступает за использование термина «агентные системы» для всех решений, где есть хоть какая-то степень самостоятельности — от простых автоматизаций до сложных цепочек.
По его словам, большинство бизнес-процессов сегодня остаются линейными или почти линейными. Главный вызов — это перевод этих процессов в формат агентных систем: разбиение на микро-задачи, определение точек ветвления и внедрение контрольных механизмов (e-vows).
Инструменты и навыки создания агентных систем
Эндрю сравнил современные ИИ-инструменты с Lego-кирпичиками: чем больше разных инструментов у вас есть, тем быстрее можно собрать рабочее решение. Среди ключевых:
- LangGraph — для построения сложных потоков
- RAG — для работы с данными вне контекста модели
- E-vows — для оценки производительности и отслеживания ошибок
- MCP — для стандартизации взаимодействия между моделями и инструментами
Он отметил, что многие команды слишком долго полагаются на ручную проверку вывода моделей, медленно внедряя автоматизированные e-vows. На самом деле, даже простой e-vow, созданный за 20 минут, может значительно упростить процесс и сэкономить время.
Голосовые технологии: недооценённый потенциал
Голосовые интерфейсы делают взаимодействие с ИИ более естественным. По мнению Нга, эта область пока получает меньше внимания, чем заслуживает. Важным техническим требованием остаётся низкая задержка отклика — желательно менее одной секунды.
Среди интересных находок — использование предварительного ответа (pre-response), чтобы скрыть задержку, и добавление фонового шума, которое делает ожидание ответа менее заметным для пользователя.
MCP: шаг к унификации ИИ-экосистемы
Протокол MCP позволяет стандартизировать взаимодействие между ИИ-моделями, инструментами и источниками данных. Нг считает его важным шагом к упрощению интеграции и масштабируемости агентных систем.
Хотя MCP находится на ранней стадии развития, он уже помогает снизить количество повторяющихся интеграций. В будущем ожидается развитие иерархической системы обнаружения сервисов.
Программирование: навык, который должен быть у всех
Понимание основ программирования становится необходимым навыком даже для не-разработчиков. В его компании AI Fund даже сотрудники, далёкие от IT, умеют писать код — это повышает общую продуктивность и улучшает коммуникацию с техническими командами.
Он также высказался против мнения, что ИИ-ассистенты сделают программирование ненужным. Напротив, благодаря им программировать станет проще, а значит, этим займутся ещё больше людей.
Советы для стартапов
Эндрю поделился двумя ключевыми факторами успеха для стартапов:
- Скорость — опытные команды работают гораздо быстрее, чем это может показаться.
- Техническая экспертиза — знание технологий сегодня гораздо ценнее, чем маркетинговое или продажное мастерство.
AI Fund инвестирует только в те проекты, которые создаёт совместно с технически сильными командами. По его словам, бизнес-знания важны, но их легче получить, тогда как глубокое понимание технологий — редкий и ценный навык.