March 11

Новые инструменты для создания ИИ-Агентов от OpenAI

Оригинал тут

Сегодня мы выпускаем первый набор инструментов, которые помогут разработчикам и предприятиям создавать полезных и надежных агентов. Под агентами мы понимаем системы, которые самостоятельно выполняют задачи от имени пользователей. За прошедший год мы представили новые возможности моделей, такие как продвинутое рассуждение, мультимодальные взаимодействия и улучшенные методы обеспечения безопасности, которые заложили основу для выполнения сложных многошаговых задач. Однако клиенты сообщали, что превращение этих возможностей в готовых к производству агентов зачастую требует сложной настройки промтов и собственной логики оркестрации без достаточной видимости и встроенной поддержки.

Для решения этих задач мы запускаем новый набор API и инструментов, упрощающих разработку агентных приложений:

  • Responses API — новый API, объединяющий простоту Chat Completions API с возможностями использования инструментов Assistants API.
  • Встроенные инструменты: поиск в интернете, поиск по файлам и выполнение действий на компьютере.
  • Новый Agents SDK для оркестрации рабочих процессов с одним или несколькими агентами.
  • Интегрированные инструменты наблюдаемости для отслеживания и анализа выполнения рабочих процессов агентов.

Эти нововведения существенно упрощают логику работы агентов, их взаимодействие и оркестрацию. В ближайшие месяцы мы планируем выпустить дополнительные инструменты и возможности.

Responses API

Responses API позволяет использовать встроенные инструменты OpenAI для создания агентов. Он поддерживает такие инструменты, как поиск в интернете, поиск по файлам и работу с компьютером. Responses API упрощает интеграцию моделей OpenAI в приложения без необходимости сложной интеграции нескольких API или внешних поставщиков. Он также облегчает хранение данных на платформе OpenAI для оценки производительности агентов. Важно отметить, что OpenAI не тренирует модели на бизнес-данных по умолчанию.

Responses API доступен всем разработчикам уже сегодня без дополнительной платы (токены и инструменты оплачиваются по стандартным тарифам).

Что это значит для существующих API

  • Chat Completions API: Этот API остается самым популярным и будет активно поддерживаться новыми моделями. Однако Responses API является его расширением с аналогичной производительностью, поэтому для новых интеграций рекомендуется использовать Responses API.
  • Assistants API: На основе отзывов разработчиков мы внесли ключевые улучшения в Responses API. После достижения полной функциональной совместимости между Assistants API и Responses API мы планируем официально объявить о прекращении поддержки Assistants API в середине 2026 года с предоставлением подробного руководства по миграции.

Встроенные инструменты Responses API

Поиск в интернете (Web search)

Инструмент поиска позволяет получать быстрые ответы с актуальной информацией из интернета с четкими ссылками на источники. Доступен при использовании моделей gpt-4o и gpt-4o-mini. Стоимость начинается от $30 за 1000 запросов (GPT‑4o) и $25 за тысячу запросов (GPT‑4o-mini).

Поиск по файлам

Позволяет быстро находить нужную информацию среди большого количества документов с помощью оптимизации запросов, фильтрации по метаданным и пользовательского ранжирования результатов. Стоимость использования — $2,50 за тысячу запросов; хранение файлов — $0,10/ГБ/день (первый гигабайт бесплатно).

Computer use

Инструмент позволяет автоматизировать задачи на компьютере через мышь и клавиатуру с помощью модели Computer-Using Agent (CUA). Доступен в режиме предварительного просмотра для отдельных разработчиков уровней использования 3–5. Стоимость: $3 за миллион входных токенов и $12 за миллион выходных токенов.

Agents SDK

Новый открытый SDK упрощает оркестрацию многоагентных сценариев работы:

  • Простая конфигурация агентов с четкими инструкциями.
  • Интеллектуальная передача управления между агентами.
  • Настраиваемые проверки безопасности (guardrails).
  • Инструменты трассировки выполнения задач для отладки и оптимизации производительности.

Agents SDK совместим с Responses API, Chat Completions API и моделями других провайдеров (при наличии совместимого интерфейса). Уже доступна интеграция в Python-приложения; поддержка Node.js появится позже.

Что дальше: платформа для создания агентов

OpenAI считает, что агенты вскоре станут важной частью рабочей среды во многих отраслях, значительно повышая продуктивность. Компания продолжит развивать интеграцию своих моделей через APIs и создавать новые инструменты для развертывания, оценки и оптимизации агентов в продакшене. Цель — предоставить разработчикам удобную платформу для создания агентов под любые задачи во всех отраслях экономики.