September 19

Офисные ИИ-Агенты: когда они нас заменят?


ИИ-агенты: не просто функция, а новый коллега

Искусственный интеллект — это уже не просто функция, а полноценный член команды. Он берет на себя много задач: от составления писем и дизайна презентаций до исследования рынков и построения финансовых моделей. Мы наблюдаем за рождением нового класса «агентных» инструментов, напоминающий офисный пакет, созданный на базе ИИ.

Но есть и проблема: на данный момент рынок фрагментирован, и каждую неделю появляются новые инструменты. Буквально на этой неделе Anthropic добавила в Claude функцию «создания и редактирования файлов»! Пользователи в замешательстве: какой инструмент выбрать и в каких сценариях можно начать внедрять агентные инструменты в свою повседневную работу?

Чтобы выяснить, как эти инструменты работают на практике, мы изучили рынок и сравнили производительность ИИ-инструментов при выполнении различных повседневных офисных задач: создании электронных таблиц, ведении заметок на встречах и написании электронных писем. Наши тесты показали впечатляющую производительность ряда универсальных инструментов, выявили несколько выдающихся узкоспециализированных приложений и дали несколько подсказок о том, как развивается этот рынок.

Два пути к агентной продуктивности: универсалы против специалистов

Рынок разделяется на два подхода к агентной продуктивности. С одной стороны — горизонтальные инструменты «всё в одном», созданные для решения любых задач в разных приложениях. С другой — вертикальные специалисты, предназначенные для глубокой проработки одного конкретного рабочего процесса, будь то электронная почта, презентации или таблицы. Оба направления быстро развиваются, и у каждого есть свои компромиссы.

Горизонтальные или универсальные

Они могут переключаться между различными контекстами, приложениями и задачами, но часто в ущерб качеству и точности. В этом лагере выделяются три формата:

  • Общие ассистенты: горизонтальные веб-инструменты, которые обычно мультимодальны, работают на основе промптов и иногда обладают памятью для выполнения нескольких типов задач.
    Примеры: Operator, Manus, Genspark.
  • Агентные браузеры: автономный просмотр веб-страниц и выполнение задач в интернете. Некоторые из них, например Comet, добавляют более сложные функции, такие как шорткаты, которые воспроизводят рабочие процессы по ключевым словам.
    Примеры: Dia, Perplexity Comet, Browserbase.
  • Браузерные расширения: помощники, которые встраиваются поверх существующих рабочих процессов и интерфейсов.
    Примеры: MaxAI, Merlin, Monica.

Вертикальные инструменты или специализированные

Вместо того чтобы пытаться делать всё подряд, они фокусируются на структурированных рабочих процессах, где важны доверие, качество и контроль со стороны пользователя. Сегодняшний рынок вертикальных инструментов сосредоточен вокруг ключевых профессиональных задач.

  • Помощники для почты: ассистенты, которые составляют структурированные ответы, помогают разбирать входящие и решают задачи по планированию.
    Примеры: Fyxer, Serif, Jace.
  • Инструменты для презентаций: ИИ-инструменты, создающие слайды с акцентом на визуальный дизайн, скорость и возможность редактирования.
    Примеры: Gamma, Chronicle, Beautiful.ai.
  • Инструменты для заметок и документов: инструменты для структурированного письма, ведения заметок, сбора знаний и совместного редактирования.
    Примеры: Mem, Notion, Granola.
  • Инструменты для таблиц: приложения, которые извлекают, форматируют и анализируют данные. Они могут расширяться в сторону исследований или автоматизации рабочих процессов.
    Примеры: Paradigm, Shortcut, Meridian, Julius.

Бенчмарк: как все работает на самом деле?

Чтобы увидеть, как эти инструменты справляются с реальными задачами, мы протестировали их, чтобы измерить, где они преуспевают, а где не очень.

Промпты были разработаны так, чтобы охватить шесть ключевых аспектов: обобщение, коммуникация, понимание файлов, исследование, планирование и исполнение.

Кейс 1: PowerPoint

Промпт: Создай визуально насыщенную презентацию из 7 слайдов о трендах интернет-поведения поколения Z в 2025 году.

Gamma — это вертикальный ИИ-инструмент для презентаций со встроенными шаблонами и функциями дизайна, который позволяет создать презентацию менее чем за две минуты. Как полноценный редактор, он предлагает много элементов управления для редактирования после генерации — пользователи могут настраивать макеты, менять визуалы и шрифты, добавлять диаграммы и давать ИИ инструкции для внесения изменений по тексту или дизайну.

Genspark и Manus, будучи универсальными ассистентами, склонны создавать более содержательные презентации, часто напоминающие исследовательские отчеты. На их создание уходит больше времени, но они, как правило, отличаются более глубоким анализом и лучшим соответствием промпту. ChatGPT Agent создал довольно простые презентации, похожие на текстовые отчеты, с простым дизайном.

На этой неделе Anthropic запустила создание и редактирование файлов в Claude. В задаче по созданию презентаций это самый быстрый агент общего назначения, который мы тестировали, хотя дизайн все еще требует доработки.

Итог: если вам нужна презентация для внешнего использования, где важны качество визуала и контроль после генерации, Gamma — лучший выбор. Если вы ищете содержательную презентацию для вдохновения на исследование или анализ, лучше подойдет Genspark.

Кейс 2: Электронная таблица

Промпт: Извлеки все данные из этого PDF и рассчитай операционную маржу.

Электронные таблицы — это сложный сценарий использования. Их сложность особенно проявляется при создании таких вещей, как комплексные финансовые модели, где важны и форматирование, и абсолютная точность. Тем не менее, ИИ-инструменты для таблиц начинают показывать свою состоятельность в базовых и средних задачах, таких как извлечение данных из PDF и выполнение простых финансовых расчетов.

В этом тесте мы загрузили страницу из заявки компании на первичное публичное размещение акций (IPO), и попросили инструменты рассчитать операционную маржу. Среди горизонтальных агентов лучше всех справился Manus: он извлек данные в структурированную таблицу и быстро вернул точные результаты. Claude был самым быстрым в задачах с таблицами и тоже выдал правильный ответ, но его результат немного ограничен — он предоставил минимальный анализ и не смог перенести весь набор данных в таблицу.

Shortcut, как вертикальный агент, ориентированный на Excel, предложил более комплексный анализ в нативной среде Excel, хотя на это ушло больше времени, и он извлек только данные, относящиеся к расчету, а не весь датасет.

Кейс 3: Электронная почта

Промпт: Напиши письмо, чтобы запланировать ужин на следующий четверг.

Fyxer, Serif и Jace — это вертикальные ассистенты для электронной почты. Каждый из них может создавать грамотные черновики и сохранять контекст в переписках. Serif выделяется своей кастомизацией: он поддерживает «плейбуки» (сценарии), метки для писем и настройки предпочтений, что позволяет пользователям использовать последовательные рабочие процессы в схожих ситуациях.

Подходы агентов к планированию различаются, но все смогли выполнить простую задачу по организации встречи:

  • Serif обеспечивает асинхронную координацию. Вы можете добавить агента в копию письма, чтобы он вел переписку по согласованию времени и отправлял приглашения в календарь.
  • Fyxer генерирует ссылку в стиле Calendly, по которой другие могут забронировать время.
  • Jace использует более деликатный подход: он создает события, но ждет одобрения пользователя перед отправкой.

В отличие от них, Comet привносит в почту возможности общего ассистента. Он может составлять ответы, выполнять промпты для планирования встреч, отправлять приглашения и искать в почтовом ящике. Но ему не хватает встроенных функций кастомизации, таких как плейбуки, метки или предпочтения, поэтому черновики кажутся менее персонализированными по сравнению со специализированными почтовыми ассистентами.

Кейс 4: Исследование

Промпт: Сделай сводку и сравни последний квартальный рост выручки облачных сервисов Microsoft, Amazon и Google в таблице с источниками, а затем проанализируй причины этих результатов в коротком отчете.

Благодаря ИИ-инструментам пользователи теперь могут за считанные секунды генерировать хороший, основанный на исследованиях анализ — работа, которая раньше занимала часы и требовала большого опыта.

Все протестированные нами сервисы смогли извлечь нужные данные о росте выручки облачных сервисов и организовать их в таблицы. Различия заключались в нюансах и скорости, что отражает базовые оптимизации и ограничения каждого продукта.

  • Comet и Dia - эти два ИИ-браузера, оказались самыми быстрыми. Они выдали результаты менее чем за 20 секунд, но их выводы были менее аналитическими и структурированными по сравнению с Manus, который предоставил более полные таблицы и обьяснение данных, стоящих за цифрами.
  • Качество источников также варьировалось. Comet и ChatGPT Agent выделились тем, что ссылались на авторитетные источники, такие как отчеты о доходах и Yahoo Finance, часто включая встроенные цитаты, что облегчало проверку точности.

Итог: компромисс очевиден. Если вы цените глубокий анализ и для вас не так критично время выполнения, Manus — лучший выбор. Если вам важна скорость и нужен быстрый, приемлемый ответ, лучше подойдет Comet.

Кейс 5: Ведение заметок на встречах

Блокнот включен во время встречи.

Ведение заметок на встречах — одно из самых естественных применений ИИ, позволяющее пользователям сосредоточиться на разговоре, а не на печати. Инструменты в этой категории обычно работают в формате блокнота, автоматически транскрибируя и структурируя обсуждение. Все протестированные продукты поддерживают поиск по ключевым словам, но их сильные стороны различаются в качестве заметок, кастомизации и возможностях совместной работы.

  • Mem создает самые подробные записи, детально фиксируя обсуждения и задачи. Режим записи ChatGPT предлагает более общие сводки, которые легче просматривать, но они менее полные. Granola отличается настраиваемыми шаблонами, которые адаптируются к разным типам встреч, давая пользователям больше контроля над структурой и результатом.
  • Granola, Mem и Notion позволяют готовить заметки заранее, добавлять указания во время встречи и следить за транскрипцией в реальном времени. Notion выделяется в плане совместной работы: задачи можно назначать прямо в заметках, синхронизировать с Notion Calendar и согласовывать с общими рабочими процессами команды.

Итог: если вам нужна исчерпывающая фиксация, лучше всего подойдет Mem; для структуры и кастомизации превосходен Granola; а для командной координации — Notion.

Наблюдения по итогам тестирования

В ходе тестов по этим сценариям проявилось несколько закономерностей:

  • Закономерности дифференциации уже очевидны. Вертикальные продукты выделяются дизайном и отточенностью рабочих процессов, фокусируясь на «рабочей поверхности» или холсте и глубоко встраиваясь в профессиональные задачи. Это делает их особенно сильными для внешних сценариев, где важны качество и подача. Горизонтальные продукты, напротив, делают ставку на широту охвата: они конкурируют за то, чтобы стать «единой точкой входа», добавляя смежные задачи. Manus, например, уже охватывает исследования, презентации и таблицы, позиционируя себя как единое место, где начинается работа.
  • Конкуренция среди горизонтальных продуктов накаляется — в том числе со стороны разработчиков моделей. Общие ассистенты и агентные браузеры ведут гонку за то, чтобы стать основным интерфейсом для работы. Учитывая важность как скорости, так и точности, компании, которые ближе к разработке моделей, могут иметь больше шансов на успех. Крупные исследовательские лаборатории все еще вступают в гонку: Anthropic недавно запустила браузерного помощника для Claude, и мы ожидаем новых попыток от OpenAI и других игроков.
  • Конвергенция неизбежна. Четкие границы между вертикальными и горизонтальными агентами начинают стираться, поскольку вертикальные продукты стремятся «перепрыгнуть» в новые категории, а горизонтальные платформы усиливают популярные сценарии использования. Если вы создаете вертикальный продукт, вам нужно следить за новейшими примитивами моделей и строить на их основе. Если вы создаете горизонтальный продукт, вам нужны рабочие процессы и циклы итераций, достаточно глубокие, чтобы вертикальные игроки не смогли отнять у вас ваши сценарии использования.

Источник