February 20

Битва фреймворков ИИ-агентов 

Перевод

Автор этого отчета может лично иметь значительную позицию в ETH. Автор не приобретал...


Суть агентности

Во многом фреймворки агентов можно сравнить с цифровым «телом»: кибернетическими щупальцами, которые позволяют «разуму» (то есть модели) взаимодействовать с миром. Это суть агентности.

Обнадеживает тот факт, что такая комбинация носит модульный характер — это позволяет создавать различные сочетания «разумов» и «тел» для решения конкретных задач. Возможно, самым мощным фактором роста фреймворков агентов являются стремительно расширяющиеся возможности самих моделей, которые все лучше используют свои «конечности» для выполнения все более сложных автономных задач.

Несмотря на ранние слухи о том, что предобучение достигло плато, «разум» продолжает неуклонно развиваться, масштабируясь по множеству направлений:

  • Улучшенные GPU (H100 → B200 и т. д.)
  • Вертикальное масштабирование GPU (расширение суперкомпьютеров для предобучения)
  • Горизонтальное масштабирование GPU (многодатацентровое / распределенное обучение)
  • Обучение с подкреплением, синтетические данные и вычисления на этапе тестирования вывода (пост-тренировка)

Последний пункт теперь стал центральной темой обсуждений от Капитолийского холма до Чжуннаньхая после выхода R1 от DeepSeek — первой конкурентоспособной китайской (и открытой) модели для логических рассуждений.

Не только масштабирование продолжается, но и, судя по всему, готово к ускорению. DeepSeek доказал, что дистилляция работает: использование более крупных моделей для обучения меньших, более экономичных версий позволяет достичь сопоставимого качества при гораздо меньших затратах.

Источник: Технический документ DeepSeek R1

…параллельно подтверждая, что обучение с подкреплением без обратной связи от человека способно значительно повышать производительность моделей.

Стоимость интеллекта продолжает стремительно снижаться. Пока Twitter пылает ссылками на парадокс Джевонса и спекуляциями о последствиях для Nvidia и других игроков на уровне инфраструктуры и моделей, результат для приложений однозначно позитивен.

Агенты идут.

Они будут обладать энциклопедическими знаниями, дополненными логическим рассуждением, и при этом стоить невероятно дешево. Всего за два с небольшим года синтетический интеллект уверенно движется к уровню, превосходящему человеческий.

Интересно, что эти очевидные позитивные факторы вступают в противоречие с жесткой распродажей веб3-фреймворков агентов: многие токены потеряли 80–90% за последние 60 дней. Причиной стал спад эйфории вокруг DeAI в четвертом квартале 2024 года и макроэкономическая / тарифная неопределенность в первом квартале 2025-го, вызванная тем, что Трамп начал активно вмешиваться в ситуацию.

Динамика цен веб3-фреймворков агентов с 31 декабря 2024 года.

Source: Delphi Digital Sector Dashboard (as of Feb 18th)

Хотя у каждого фреймворка есть свои недостатки (подробности далее), быстрый прогресс в области логических рассуждений — однозначно бычий сигнал. Я был бы сильно удивлен, если бы в 2025 году мы не увидели вторую волну энтузиазма, когда эти ускоряющиеся возможности будут интегрированы в приложения, бизнес-процессы и мировую экономику.

Мы получили огонь с небес — бесконечно воспроизводимые цифровые разумы, заключенные в дата-центрах.

Теперь мы собираемся их высвободить.


Совмещение: высвобождение разума

Агенты — это сущности, которые способны воспринимать окружающую среду и действовать в ней.

Для этого необходимы:

  • Двусторонние потоки связи
  • Краткосрочная и долгосрочная память
  • Контекст, интеграции и инструменты, позволяющие эффективно взаимодействовать со средой

ИИ — это "мозг", который обрабатывает задачи, планирует действия и оценивает их выполнение.

Однако, как и у людей, инструменты могут радикально повысить эффективность агентов, предоставляя им возможность "читать и записывать" данные во все большее число сред.

Примечание: SWE-agent — это кодирующий агент, средой которого является компьютер. Его действия включают навигацию, поиск, просмотр файлов и их редактирование.

Позволяя базовым моделям вызывать инструменты, мы наделяем их агентным поведением.

В своем выдающемся обзоре Chip Huyen выделяет три ключевые категории инструментов, которые позволяют агенту взаимодействовать со средой:

  1. Расширение знаний: веб-браузинг, поиск текстов и изображений, доступ к API с релевантными данными и т. д.
  2. Расширение возможностей: калькуляторы, календари, интерпретаторы кода и т. д.
  3. Запись данных и выполнение действий: исполнение SQL-запросов, API для отправки писем, банковские API для переводов и т. д.

Хотя эти примеры иллюстрируют отдельные функции, сложные задачи требуют последовательного планирования с множеством вызовов функций.

Поскольку планирование — это по сути задача поиска (прогнозирование возможных путей, выбор оптимального и "откат" при необходимости), недавний переход к моделям логического рассуждения (усиленным методами Chain of Thought и увеличенными вычислениями на этапе вывода) значительно повысит их способности к планированию — что является одним из главных узких мест для по-настоящему автономных агентов.

https://x.com/sama/status/1886220281565381078?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1886220281565381078%7Ctwgr%5E8c84ac7017c97f827144e5a30e5adfa495773f14%7Ctwcon%5Es1_&ref_url=https%3A%2F%2Fmembers.delphidigital.io%2Freports%2Fthe-battle-of-the-ai-agent-frameworks

Выбор инструментов также имеет ключевое значение. Большее количество инструментов расширяет возможности, но требует более глубокого понимания и учета контекста. Разные задачи требуют разных инструментов, и различные модели лучше работают с определенными инструментами. Точная настройка сочетания модели, инструментов и их последовательности для решения конкретной задачи — нетривиальная задача.

Фреймворки агентов упрощают этот процесс для разработчиков, предоставляя шаблоны, библиотеки, коннекторы и другие инструменты, которые можно модульно комбинировать для создания агентов или AI-приложений.

Однако среды, в которых работают агенты, сильно различаются. Выбор правильного сочетания модели, инструментов и их последовательности критически важен для создания агентов, способных эффективно выполнять задачи. Если фреймворк не соответствует конкретному случаю использования, он скорее станет препятствием, чем преимуществом.

Web2 vs. Web3: конкуренция или симбиоз?

Одна из явных линий разделения среди фреймворков агентов проходит между Web2-лидерами — такими как Langchain, Autogen и CrewAI…

…и Web3-ориентированными фреймворками, такими как ElizaOS, Virtuals / Game, ARC и другие.

На данный момент это разделение проявилось в том, что Web2-фреймворки в первую очередь ориентированы на утилитарные и продуктивные случаи использования (корпоративные рабочие процессы, персональные ассистенты, услуги для белых воротничков), в то время как Web3-агенты сосредоточены на развлекательных и финансовых применениях, где криптовалюта изначально нашла более удачное соответствие рынку (ключевые лидеры мнений, виртуальные компаньоны, трейдинг).

Пул прибыли, ориентированный на продуктивность, явно больше. Сегодня его общий адресуемый рынок (TAM) — это раздутые корпоративные контракты на ПО, но завтра под угрозой окажутся бэк-офис, начальные позиции во фронт-офисе и даже управленческие роли.

Этот процесс уже стремительно развивается во многих ведущих компаниях:

Синтетический интеллект, скорее всего интегрированный в Web2-фреймворки, захлестнет традиционные предприятия, захватывая большую часть этого прибыльного рынка. Однако сам эффект этого потрясения создаст попутный ветер и для их Web3-аналога.

Обе стороны могут выиграть.

Смерть корпорации: Распад по Коузу

ИИ радикально ускорит "гиг-экономику", вытесняя все большие слои работников в "экономику создателей", где экономическая активность смещается от утилитарного труда к развлечениям, увлечениям и азартной экономике внимания.

В 1900 году 38% американцев работали в сельском хозяйстве, обеспечивая продовольствием 76 миллионов человек. К 2017 году эта доля упала до 1%, при этом они кормили более 300 миллионов, 40% из которых страдают ожирением, а Novo Nordisk стала самой дорогой компанией в Европе.

В 1960-х производственный сектор составлял ~26% рабочей силы США. К январю 2025 года эта цифра рухнула до 7,6% от всей несельскохозяйственной занятости.

Революция ИИ запустит тот же процесс в сфере услуг, которая сегодня составляет ~70% ВВП США и ~80% всей занятости.

Что дальше?

Производительность предприятий взлетит, так как ИИ заменит работников, а краткосрочные прибыли подскочат из-за роста маржи. Но затем последует "великая дефляция", так как традиционные компании потеряют конкурентные преимущества перед гиперэффективными вычислительными платформами с минимальными издержками.

Web2 и Web3 фреймворки выиграют от этого:

Web2 — напрямую через подписки и API, так как компании будут переходить от человеческих сотрудников к "силиконовым" работникам.
Web3 — косвенно, поскольку экономическая активность сместится в его естественные ниши: развлечения, социальные платформы, трейдинг, гемблинг, контент для взрослых и т. д.

Сельское хозяйство → промышленность → сфера услуг → гиперперсонализированная экономика азартных развлечений и Netflix & Chill.

Пирамида Маслоу встречает Последнего Человека. Со временем Web3-разработчики и автономные агенты займут более важную роль в утилитарных задачах. Когда индустриальные корпорации распадутся, теория фирмы Рональда Коуза потеряет смысл. Транзакционные издержки упадут почти до нуля. Каждая задача перейдет от подписки / зарплаты к серии гиперспециализированных on-demand вычислительных циклов.

Эти циклы будут разделены между несколькими мегакорпорациями (Dwarkesh) и открытой сетью агентных подрядчиков (Me), которые будут конкурировать за дешевейшие вычисления и любые преимущества в проприетарных данных (Ben Thompson).

Этот процесс займет время. На данный момент Web3-агенты в основном работают как примитивные боты для ответов или гемблинга в духе мемкойнов и не могут конкурировать с корпоративными решениями. Как и в случае с децентрализованным хранением и вычислениями, их массовое внедрение тормозится юридическими и регуляторными рисками. Поэтому Web2-платформы, такие как LangChain или Autogen, останутся основным выбором для большинства разработчиков в обозримом будущем.

Подпишись на канал: https://t.me/cryptomokakke