Офисные ИИ-Агенты: когда они нас заменят?
ИИ-агенты: не просто функция, а новый коллега
Искусственный интеллект — это уже не просто функция, а полноценный член команды. Он берет на себя много задач: от составления писем и дизайна презентаций до исследования рынков и построения финансовых моделей. Мы наблюдаем за рождением нового класса «агентных» инструментов, напоминающий офисный пакет, созданный на базе ИИ.
Но есть и проблема: на данный момент рынок фрагментирован, и каждую неделю появляются новые инструменты. Буквально на этой неделе Anthropic добавила в Claude функцию «создания и редактирования файлов»! Пользователи в замешательстве: какой инструмент выбрать и в каких сценариях можно начать внедрять агентные инструменты в свою повседневную работу?
Чтобы выяснить, как эти инструменты работают на практике, мы изучили рынок и сравнили производительность ИИ-инструментов при выполнении различных повседневных офисных задач: создании электронных таблиц, ведении заметок на встречах и написании электронных писем. Наши тесты показали впечатляющую производительность ряда универсальных инструментов, выявили несколько выдающихся узкоспециализированных приложений и дали несколько подсказок о том, как развивается этот рынок.
Два пути к агентной продуктивности: универсалы против специалистов
Рынок разделяется на два подхода к агентной продуктивности. С одной стороны — горизонтальные инструменты «всё в одном», созданные для решения любых задач в разных приложениях. С другой — вертикальные специалисты, предназначенные для глубокой проработки одного конкретного рабочего процесса, будь то электронная почта, презентации или таблицы. Оба направления быстро развиваются, и у каждого есть свои компромиссы.
Горизонтальные или универсальные
Они могут переключаться между различными контекстами, приложениями и задачами, но часто в ущерб качеству и точности. В этом лагере выделяются три формата:
- Общие ассистенты: горизонтальные веб-инструменты, которые обычно мультимодальны, работают на основе промптов и иногда обладают памятью для выполнения нескольких типов задач.
Примеры: Operator, Manus, Genspark. - Агентные браузеры: автономный просмотр веб-страниц и выполнение задач в интернете. Некоторые из них, например Comet, добавляют более сложные функции, такие как шорткаты, которые воспроизводят рабочие процессы по ключевым словам.
Примеры: Dia, Perplexity Comet, Browserbase. - Браузерные расширения: помощники, которые встраиваются поверх существующих рабочих процессов и интерфейсов.
Примеры: MaxAI, Merlin, Monica.
Вертикальные инструменты или специализированные
Вместо того чтобы пытаться делать всё подряд, они фокусируются на структурированных рабочих процессах, где важны доверие, качество и контроль со стороны пользователя. Сегодняшний рынок вертикальных инструментов сосредоточен вокруг ключевых профессиональных задач.
- Помощники для почты: ассистенты, которые составляют структурированные ответы, помогают разбирать входящие и решают задачи по планированию.
Примеры: Fyxer, Serif, Jace. - Инструменты для презентаций: ИИ-инструменты, создающие слайды с акцентом на визуальный дизайн, скорость и возможность редактирования.
Примеры: Gamma, Chronicle, Beautiful.ai. - Инструменты для заметок и документов: инструменты для структурированного письма, ведения заметок, сбора знаний и совместного редактирования.
Примеры: Mem, Notion, Granola. - Инструменты для таблиц: приложения, которые извлекают, форматируют и анализируют данные. Они могут расширяться в сторону исследований или автоматизации рабочих процессов.
Примеры: Paradigm, Shortcut, Meridian, Julius.
Бенчмарк: как все работает на самом деле?
Чтобы увидеть, как эти инструменты справляются с реальными задачами, мы протестировали их, чтобы измерить, где они преуспевают, а где не очень.
Промпты были разработаны так, чтобы охватить шесть ключевых аспектов: обобщение, коммуникация, понимание файлов, исследование, планирование и исполнение.
Кейс 1: PowerPoint
Промпт: Создай визуально насыщенную презентацию из 7 слайдов о трендах интернет-поведения поколения Z в 2025 году.
Gamma — это вертикальный ИИ-инструмент для презентаций со встроенными шаблонами и функциями дизайна, который позволяет создать презентацию менее чем за две минуты. Как полноценный редактор, он предлагает много элементов управления для редактирования после генерации — пользователи могут настраивать макеты, менять визуалы и шрифты, добавлять диаграммы и давать ИИ инструкции для внесения изменений по тексту или дизайну.
Genspark и Manus, будучи универсальными ассистентами, склонны создавать более содержательные презентации, часто напоминающие исследовательские отчеты. На их создание уходит больше времени, но они, как правило, отличаются более глубоким анализом и лучшим соответствием промпту. ChatGPT Agent создал довольно простые презентации, похожие на текстовые отчеты, с простым дизайном.
На этой неделе Anthropic запустила создание и редактирование файлов в Claude. В задаче по созданию презентаций это самый быстрый агент общего назначения, который мы тестировали, хотя дизайн все еще требует доработки.
Итог: если вам нужна презентация для внешнего использования, где важны качество визуала и контроль после генерации, Gamma — лучший выбор. Если вы ищете содержательную презентацию для вдохновения на исследование или анализ, лучше подойдет Genspark.
Кейс 2: Электронная таблица
Промпт: Извлеки все данные из этого PDF и рассчитай операционную маржу.
Электронные таблицы — это сложный сценарий использования. Их сложность особенно проявляется при создании таких вещей, как комплексные финансовые модели, где важны и форматирование, и абсолютная точность. Тем не менее, ИИ-инструменты для таблиц начинают показывать свою состоятельность в базовых и средних задачах, таких как извлечение данных из PDF и выполнение простых финансовых расчетов.
В этом тесте мы загрузили страницу из заявки компании на первичное публичное размещение акций (IPO), и попросили инструменты рассчитать операционную маржу. Среди горизонтальных агентов лучше всех справился Manus: он извлек данные в структурированную таблицу и быстро вернул точные результаты. Claude был самым быстрым в задачах с таблицами и тоже выдал правильный ответ, но его результат немного ограничен — он предоставил минимальный анализ и не смог перенести весь набор данных в таблицу.
Shortcut, как вертикальный агент, ориентированный на Excel, предложил более комплексный анализ в нативной среде Excel, хотя на это ушло больше времени, и он извлек только данные, относящиеся к расчету, а не весь датасет.
Кейс 3: Электронная почта
Промпт: Напиши письмо, чтобы запланировать ужин на следующий четверг.
Fyxer, Serif и Jace — это вертикальные ассистенты для электронной почты. Каждый из них может создавать грамотные черновики и сохранять контекст в переписках. Serif выделяется своей кастомизацией: он поддерживает «плейбуки» (сценарии), метки для писем и настройки предпочтений, что позволяет пользователям использовать последовательные рабочие процессы в схожих ситуациях.
Подходы агентов к планированию различаются, но все смогли выполнить простую задачу по организации встречи:
- Serif обеспечивает асинхронную координацию. Вы можете добавить агента в копию письма, чтобы он вел переписку по согласованию времени и отправлял приглашения в календарь.
- Fyxer генерирует ссылку в стиле Calendly, по которой другие могут забронировать время.
- Jace использует более деликатный подход: он создает события, но ждет одобрения пользователя перед отправкой.
В отличие от них, Comet привносит в почту возможности общего ассистента. Он может составлять ответы, выполнять промпты для планирования встреч, отправлять приглашения и искать в почтовом ящике. Но ему не хватает встроенных функций кастомизации, таких как плейбуки, метки или предпочтения, поэтому черновики кажутся менее персонализированными по сравнению со специализированными почтовыми ассистентами.
Кейс 4: Исследование
Промпт: Сделай сводку и сравни последний квартальный рост выручки облачных сервисов Microsoft, Amazon и Google в таблице с источниками, а затем проанализируй причины этих результатов в коротком отчете.
Благодаря ИИ-инструментам пользователи теперь могут за считанные секунды генерировать хороший, основанный на исследованиях анализ — работа, которая раньше занимала часы и требовала большого опыта.
Все протестированные нами сервисы смогли извлечь нужные данные о росте выручки облачных сервисов и организовать их в таблицы. Различия заключались в нюансах и скорости, что отражает базовые оптимизации и ограничения каждого продукта.
- Comet и Dia - эти два ИИ-браузера, оказались самыми быстрыми. Они выдали результаты менее чем за 20 секунд, но их выводы были менее аналитическими и структурированными по сравнению с Manus, который предоставил более полные таблицы и обьяснение данных, стоящих за цифрами.
- Качество источников также варьировалось. Comet и ChatGPT Agent выделились тем, что ссылались на авторитетные источники, такие как отчеты о доходах и Yahoo Finance, часто включая встроенные цитаты, что облегчало проверку точности.
Итог: компромисс очевиден. Если вы цените глубокий анализ и для вас не так критично время выполнения, Manus — лучший выбор. Если вам важна скорость и нужен быстрый, приемлемый ответ, лучше подойдет Comet.
Кейс 5: Ведение заметок на встречах
Блокнот включен во время встречи.
Ведение заметок на встречах — одно из самых естественных применений ИИ, позволяющее пользователям сосредоточиться на разговоре, а не на печати. Инструменты в этой категории обычно работают в формате блокнота, автоматически транскрибируя и структурируя обсуждение. Все протестированные продукты поддерживают поиск по ключевым словам, но их сильные стороны различаются в качестве заметок, кастомизации и возможностях совместной работы.
- Mem создает самые подробные записи, детально фиксируя обсуждения и задачи. Режим записи ChatGPT предлагает более общие сводки, которые легче просматривать, но они менее полные. Granola отличается настраиваемыми шаблонами, которые адаптируются к разным типам встреч, давая пользователям больше контроля над структурой и результатом.
- Granola, Mem и Notion позволяют готовить заметки заранее, добавлять указания во время встречи и следить за транскрипцией в реальном времени. Notion выделяется в плане совместной работы: задачи можно назначать прямо в заметках, синхронизировать с Notion Calendar и согласовывать с общими рабочими процессами команды.
Итог: если вам нужна исчерпывающая фиксация, лучше всего подойдет Mem; для структуры и кастомизации превосходен Granola; а для командной координации — Notion.
Наблюдения по итогам тестирования
В ходе тестов по этим сценариям проявилось несколько закономерностей:
- Закономерности дифференциации уже очевидны. Вертикальные продукты выделяются дизайном и отточенностью рабочих процессов, фокусируясь на «рабочей поверхности» или холсте и глубоко встраиваясь в профессиональные задачи. Это делает их особенно сильными для внешних сценариев, где важны качество и подача. Горизонтальные продукты, напротив, делают ставку на широту охвата: они конкурируют за то, чтобы стать «единой точкой входа», добавляя смежные задачи. Manus, например, уже охватывает исследования, презентации и таблицы, позиционируя себя как единое место, где начинается работа.
- Конкуренция среди горизонтальных продуктов накаляется — в том числе со стороны разработчиков моделей. Общие ассистенты и агентные браузеры ведут гонку за то, чтобы стать основным интерфейсом для работы. Учитывая важность как скорости, так и точности, компании, которые ближе к разработке моделей, могут иметь больше шансов на успех. Крупные исследовательские лаборатории все еще вступают в гонку: Anthropic недавно запустила браузерного помощника для Claude, и мы ожидаем новых попыток от OpenAI и других игроков.
- Конвергенция неизбежна. Четкие границы между вертикальными и горизонтальными агентами начинают стираться, поскольку вертикальные продукты стремятся «перепрыгнуть» в новые категории, а горизонтальные платформы усиливают популярные сценарии использования. Если вы создаете вертикальный продукт, вам нужно следить за новейшими примитивами моделей и строить на их основе. Если вы создаете горизонтальный продукт, вам нужны рабочие процессы и циклы итераций, достаточно глубокие, чтобы вертикальные игроки не смогли отнять у вас ваши сценарии использования.