Понедельничный дайджест №10

Что интересного произошло в мире нейронок за прошедшую неделю? (18.08.2025)

→ Перейти к буквам
→ Перейти к картинкам
→ Перейти к звуку
→ Перейти к видео
→ Перейти к разному
← Перейти к прошлым дайджестам

🟢 Буквы

GPT-5 мухлюет! Оказывается сейчас GPT-5 в API имеет более глубокий режим мышления (до 200 шагов), чем в чате на сайте с подпиской PLUS (64 шага).
📝 C каждой неделей всё грустнее получать информацию о GPT-5 — не особо удачный запуск… Ждём скоро ответа от Google!

Системный промпт GPT-5 стал доступен Системный промпт GPT-5 был раскрыт, показывая его инструменты и правила работы. GPT-5 имеет модули для памяти, автоматизации, работы с документами, поиска по файлам, генерации изображений и выполнения кода.
📝 Изучаем модули GPT-5 — Анализируем правила работы — Используем информацию для улучшения взаимодействия с ИИ
📎Подробнее в твиттере

Claude 4 Sonnet получил контекст в 1 миллион токенов Anthropic расширила контекстное окно Claude 4 Sonnet до 1 миллиона токенов.
📝 Все компании потихоньку доходят до 1-го миллиона токенов, это позволяет анализировать большие документы и код. Как всегда — доступно через API.
📎Подробнее читаем тут

Gemini добавил память между диалогами Нейросеть от Google прокачивает свою продуктово-сервисную часть.
📝 Gemini добавил память между диалогами и временные чаты для конфиденциальности, а так же возможность запланировать задачи.
📎Подробнее тут

Open Lovable — бесплатная замена Lovable Вышел бесплатный аналог Lovable с открытым исходным кодом. Open Lovable превращает URL в клон сайта на React. Поддерживает интеграцию с GPT-5 и другими моделями.
📝 Клонируем сайты — Меняем — Создаём свои лендинги
📎Скачать можно отсюда

🟡 Картинки

SkyWorks выпустила Matrix-3D для генерации 3D миров Новая модель SkyWorks генерирует 3D сцены и видеопанорамы из текста или изображений.
📝Опенсорсная Matrix-3D от SkyWorks конкурирует с Hunyuan World 1 от Tencent и Genie 3 от Google. Модель генерирует 3D сцены с возможностью перемещения.
📎Качаем отсюда

Matrix-Game 2.0 — генерация интерактивных 3D миров Китайцы выпустили ещё одну модель по создании своих миров. Эта модель генерирует интерактивные 3D миры из текста в реальном времени.
📝Matrix-Game 2.0 от Tencent генерирует интерактивные 3D миры с 25 FPS. Требует видеокарту A100 и 24 ГБ видеопамяти (Короче — нужно быть шейхом, чтобы запустить у себя на компьютере)
📎Скачать можно отсюда

SEELE: text to endless 3D game Продолжаем тренд по созданию 3D-миров — новая модель SEELE.
📝Модель генерирует бесконечные 3D игры из текста с возможностью ремикса.
📎Ссылочка

DinoV3 от Meta для анализа изображений Новая модель от Meta улучшает анализ изображений, сегментацию и разметку.
📝 Анализировать изображения — Использовать информации с изображения
📎Скачать можно отсюда

Генерируем изображение с помощью Imagen 4 Imagen 4 от Google теперь доступна в API с тремя режимами генерации.
📝 Imagen 4 доступна в API с режимами Fast, Standard и Ultra.
📎 Попробовать без API можно тут

Nano Banana — новая модель от Google Google тизерит Nano Banana — компактная модель для генерации и редактирования изображений.
📝 Новая модель сможет редактировать изображение по тексту и, вероятно, для мобильных устройств

🔵 Звук

Video2Music от ElevenLabs Новая модель от авангардистов звука, которая анализирует видео и генерирует подходящую музыку. Функция пока в альфа-тестировании.
📝 Генерируем музыку для видео — Используем в своих видео-проектах на Лигу
📎Пробуем тут

🟣 Видео

Генерация видео в Perplexity Perplexity официально добавила генерацию видео в веб-версию и приложение, но с ограниченными лимитами.
📝 Perplexity теперь поддерживает генерацию видео, но лимиты очень малы: 5 видео в месяц для Pro и 15 для Max аккаунтов. (Да, можно было генерировать видео и до этой недели, но только в веб-версии, теперь официально везде)
📎Пробуем тут, а купить дёшево подписку можно тут

Pika Labs уходит в генерацию аватаров Pika Labs теперь фокусируется на генерации аватаров с липсинком и без ограничений по длительности трека.
📝 Можно создать аватар из своих фотографий и видео — Сгенерировать видео с липсинком — Использовать для своих соцсетей или лиге достижений
📎Можно попробовать тут

Wonder Studio теперь бесплатный Теперь сервис называется Autodesk Flow Studio и он снова предлагает бесплатный тариф — 300 кредитов в месяц
📝 Используем для захвата движений с помощью нейросети — Обрабатываем видео и анимацию
📎Пробуем тут

StableAvatar: генерация аватаров с липсинком Microsoft Research Asia выпустили опенсорс-модель StableAvatar, которая генерирует аватары с липсинком на основе аудио.
📝 Для запуска потребуется 18 ГБ видеопамяти
📎Качаем отсюда

Анимируем изображение с помощь Draw2Video Новая модель от Draw2Video позволяет создавать анимацию, рисуя на статичном изображении. Генерация занимает около 5 минут.
📝 Загружаем изображение — Создаём анимацию — Используем в своих видео или презентациях
📎Попробовать можно тут

🟠 Разное

Реальные бои роботов в Сан-Франциско Киношники предсказали будущее: теперь в Сан-Франциско проходят реальные бои роботов с блекджеком и хуками.
📝 На сайте можно увидеть бои роботов, напоминающие больше бои неуклюжих кукол, но организаторы активно продвигают это через твиттер.
📎 Смотрим тут

OpenAI выиграла золотую медаль на олимпиаде по информатике Система OpenAI заняла 6-е место среди 330 участников, включая людей, на олимпиаде по информатике.
📝 Изучить подход OpenAI к решению олимпиадных задач — Анализировать ограничения и возможности ИИ в академических соревнованиях
📎 Подробнее в твиттере

Никогда у Apple такого не было и вот опять Илон Маск обвиняет Apple в манипуляции рейтингами в App Store в пользу OpenAI.
📝 Маск утверждает, что Apple манипулирует рейтингами, чтобы приложения OpenAI занимали первое место. Доказательств, естественно нет.
📎Источник тут

Meta выпустила модель для предсказания реакции мозга Анализ мозга по одному лишь видео!
📝 Модель TRIBE предсказывает реакцию мозга на видеозаписи без сканирования, анализируя только видео, аудио и текст. Можно использовать для анализа контента, чтобы оптимизировать видео для максимального внимания, а также изучить реакции зрителей
📎Берём пол литра и разбираемся как запустить отсюда

DeepMind расшифровала «тёмную материю» ДНК AlphaGenome от DeepMind предсказывает работу генов и влияние мутаций на организм.
📝 AlphaGenome может анализировать миллионы букв для расшифровки ДНК и предсказывать молекулярные свойства. Это открывает новые возможности для медицины.
📎Подробнее тут

Perplexity предложила купить Google Chrome за $34,5 млрд Компания хочет купить Chrome, обещая сохранить код Chromium и оставить Google поисковиком по умолчанию.
📝 Предложение интересное, т. к. Perplexity предложили, несмотря на свою оценку в $18 млрд., почти в два раза больше. Но при этом обещают ещё и инвестировать в проект.
📎Подробнее тут

Strawberry Browser — ИИ-браузер с автоматизацией Все браузеры уже включили в себя нейросети, поэтому неудивительно, что появляются новые игроки, делающие на это ставку — встречаем Клубничку!
📝 Strawberry Browser предлагает автоматизацию задач, генерацию отчетов и работу с соцсетями и почтой.
📎Пробуем на свой страх и риск тут

Библиотека приложений от GPT-5 Один из умельцев выпустил сборник приложений, сгенерированных GPT-5 с помощью одного промпта.
📝 Можно использовать как исходники или добавить серверную часть и использовать полноценно.
📎Смотрим тут

Авито запускает AI-лабораторию Авито инвестирует 1 млрд рублей в AI-лабораторию.
📝 Ребята настроены серьезно: AI-лабораторию возглавляет Kaggle Grandmaster и она будет заниматься генеративными моделями и компьютерным зрением.
📎Подробнее тут

Оно развивается Вышло исследование, которое описывает эволюцию ИИ-агентов и их потенциал.
📝 Исследование рассматривает самосовершенствующиеся ИИ-агенты, их этику, безопасность и развитие.
📎Исследование тут