Понедельничный дайджест №5

Что интересного произошло в мире нейронок за прошедшую неделю? (28.04.2025)

→ Перейти к буквам
→ Перейти к картинкам
→ Перейти к видео
→ Перейти к разному
← Перейти к прошлым дайджестам

🟢 Буквы

o4-mini доступна бесплатным пользователям ChatGPT Доступ к новейшей модели o4-mini теперь доступен для бесплатных пользователей ChatGPT. Модель o4-mini обладает улучшенным размышлением, прокаченной памятью и кодингом на уровне Google Gemini 2.5 Pro. Она также анализирует изображения и понимает их содержание.
📝 Ещё увеличили лимиты: можно отправлять примерно 25 сообщений с пятичасовым перерывом. Gользователи reddit заметили, что модель o4-mini демонстрирует заметно лучшие результаты, когда думает, что работает с платным пользователем.
📎 Пробуем тут
Осторожно: новые модели ChatGPT вшивают в тексты невидимые метки OpenAI использует скрытые пробелы в длинных ответах новых моделей. Символы появляются только в длинных ответах, но могут быть видны в кодовых редакторах или Google Docs. Старые версии GPT-4o таких символов не оставляют.
📝 OpenAI заявляют, что это не аналог водяных меток, а ошибка в обучении
📎Убрать следы можно тут

🟡 Картинки

Презентация одной кнпокой в Genspark Стартап Genspark представил ИИ-агентов, которые могут создавать презентации с глубоким исследованием темы и дизайном слайдов. AI Slides позволяет генерировать презентации из любой темы, добавлять визуал и вносить правки. Превращает файлы (PDF, Excel, Word) в слайды. Доступно только в подписке (Обещают, что это временно).
📝 Вводим тему для исследования — Добавляем визуальные элементы и внести правки в презентацию через текстовые команды.
📎 Пробуем тут

🟣 Видео

Новый видеогенератор MAGI-1 MAGI-1 - это новый авторегрессионный видеогенератор, который обещает высокое качество видео без швов и стыков. Генератор позволяет генерировать видео с контролем времени на уровне каждого кадра, физикой движения и созданием видео из одной фотографии.
📝 Качество не такое крутое, как у других генераторов, зато лучше держит персонажей (особенности авторегрессии). Есть две модели – маленькая для домашних ПК (с 4090) и большая (для серверов и богатых людей). На сайте дают 500 кредитов (15 секунд генерации).
📎 Пробуем тут, качаем отсюда
Vidu Q1: Новый китайский видеогенератор Китайцы выпустили новую версию видеогенератора Vidu Q1 с улучшенной детализацией и звуковыми эффектами.
📝 Видеогенератор может генерировать по первому и последнему кадру, а также сам создавать звуки и звуковые эффекты. На новые аккаунты дают 100 кредитов (+20 каждый день), а по промокоду «VIDUQ1» ещё +100 кредитов.
📎 Пробуем тут

🟠 Разное

Microsoft Copilot теперь умеет кликать мышкой В Copilot Studio добавлена функция Computer Use для взаимодействия с десктопными приложениями.
📝 Copilot может нажимать кнопки, заполнять формы, работать с сайтами и приложениями без API, имитируя действия пользователя.
📎 Записаться на тест можно тут
Вышел первый универсальный ИИ-агент с открытым исходным кодом — Suna Kortix выпустила Suna. Это полная замена Genspark и Manus, созданная для локального запуска на ПК. ИИ-система обучается, планирует, рассуждает, имеет доступ к Терминалу, извлекает данные из тысяч источников и превращает их в Excel-таблицы, пишет отчёты, рисует графики и диаграммы.
📝 Бесплатно в облаке можно попробовать 10 минут в месяц (указано время вычисления), а для развёртки у себя нужны API-ключи Anthropic, Tavily и Firecrawl.
📎 Пробуем тут, подробнее на гитхабе
ИИ-агенты теперь общаются! Появился новый термин - A2A (Agent2Agent Protocol). Это проткол который позволяет разным ИИ‑агентам разговаривать друг с другом напрямую.
📝 A2A направлен на распределение задач между автономными агентами, каждый из которых может использовать MCP или другие способы доступа к инструментам. Цель - сделать агентов дружелюбными друг к другу.
📎 Подробнее тут
Hunyuan 2.5: новый китайский 3D-генератор Новая версия китайского 3D-генератора Hunyuan 2.5 демонстрирует адаптивную детализацию, симметричность и реалистичные формы в 3D-моделях.
📝 Текстуры стали похуже, но сами модели – лучше, многие уже можно сразу после генерации печатать на 3д-принтере. В опенсорсе пока нет, но можно попробовать на сайте – 20 генераций в день
📎 Пробуем тут (Сайт только на китайском)
Как создавать ИИ-агентов: методичка от OpenAI OpenAI выпустили методичку на 34 страницы по сборке ИИ-агентов.
📝 Методичка рассказывает о создании агентов с нуля, описывает их компоненты и принципы работы. Она полезна для тех, кто хочет разобраться в создании агентов без использования платформ n8n, make и прочих.
📎 Оригинал: тут, перевод тут
🔶10 главных пунктов: 🔸Агенты отличаются от рабочих процессов: это полностью автономные системы, выполняющие задачи вместо вас. Многие приложения используют LLM для рабочих процессов, но это не агент.
🔸Используйте их для сложных задач: комплексное принятие решений, динамические правила, неструктурированные данные.
🔸Базовая структура: каждый агент состоит из трёх основных компонентов: Модель (мозг), Инструменты, Инструкции по поведению.
🔸Выбирайте правильный "мозг": настройте оценочные тесты для получения базовых показателей, используйте продвинутую модель, чтобы увидеть возможности, постепенно упрощайте модель для экономии и скорости.
🔸Инструменты критически важны: выбирайте хорошо определённые и проверенные инструменты. Агенту нужны инструменты для получения данных и контекста, а также для выполнения действий.
🔸Инструкции КРАЙНЕ важны: предельно ясно объясняйте агенту его цели, шаги и правила. Расплывчатые инструкции = непредсказуемый агент. Будьте конкретны.
🔸 Начинайте просто, потом масштабируйте: часто достаточно одного агента с несколькими инструментами. Не бросайтесь сразу к сложным мультиагентным системам.
🔸 При использовании мультиагентов: можно создать агента-"менеджера", направляющего задачи специализированным агентам, или настроить агентов на передачу задач друг другу.
🔸Защитные механизмы ОБЯЗАТЕЛЬНЫ: проверяйте ввод пользователя на странности, следите, чтобы агент не делал рискованных вещей, фильтруйте личную информацию, блокируйте вредоносный контент. Не давайте ему действовать бесконтрольно.
🔸Разрабатывайте с учётом людей: начинайте с малого, тестируйте, улучшайте. Всегда имейте план на случай, если агент застрянет или собирается сделать что-то высокорискованное.