Понедельничный дайджест №10
Что интересного произошло в мире нейронок за прошедшую неделю? (18.08.2025)
→ Перейти к буквам
→ Перейти к картинкам
→ Перейти к звуку
→ Перейти к видео
→ Перейти к разному
← Перейти к прошлым дайджестам
🟢 Буквы
GPT-5 мухлюет!
Оказывается сейчас GPT-5 в API имеет более глубокий режим мышления (до 200 шагов), чем в чате на сайте с подпиской PLUS (64 шага).
📝 C каждой неделей всё грустнее получать информацию о GPT-5 — не особо удачный запуск… Ждём скоро ответа от Google!
Системный промпт GPT-5 стал доступен
Системный промпт GPT-5 был раскрыт, показывая его инструменты и правила работы. GPT-5 имеет модули для памяти, автоматизации, работы с документами, поиска по файлам, генерации изображений и выполнения кода.
📝 Изучаем модули GPT-5 — Анализируем правила работы — Используем информацию для улучшения взаимодействия с ИИ
📎Подробнее в твиттере
Claude 4 Sonnet получил контекст в 1 миллион токенов
Anthropic расширила контекстное окно Claude 4 Sonnet до 1 миллиона токенов.
📝 Все компании потихоньку доходят до 1-го миллиона токенов, это позволяет анализировать большие документы и код. Как всегда — доступно через API.
📎Подробнее читаем тут
Gemini добавил память между диалогами
Нейросеть от Google прокачивает свою продуктово-сервисную часть.
📝 Gemini добавил память между диалогами и временные чаты для конфиденциальности, а так же возможность запланировать задачи.
📎Подробнее тут
Open Lovable — бесплатная замена Lovable
Вышел бесплатный аналог Lovable с открытым исходным кодом. Open Lovable превращает URL в клон сайта на React. Поддерживает интеграцию с GPT-5 и другими моделями.
📝 Клонируем сайты — Меняем — Создаём свои лендинги
📎Скачать можно отсюда
🟡 Картинки
SkyWorks выпустила Matrix-3D для генерации 3D миров
Новая модель SkyWorks генерирует 3D сцены и видеопанорамы из текста или изображений.
📝Опенсорсная Matrix-3D от SkyWorks конкурирует с Hunyuan World 1 от Tencent и Genie 3 от Google. Модель генерирует 3D сцены с возможностью перемещения.
📎Качаем отсюда
Matrix-Game 2.0 — генерация интерактивных 3D миров
Китайцы выпустили ещё одну модель по создании своих миров. Эта модель генерирует интерактивные 3D миры из текста в реальном времени.
📝Matrix-Game 2.0 от Tencent генерирует интерактивные 3D миры с 25 FPS. Требует видеокарту A100 и 24 ГБ видеопамяти (Короче — нужно быть шейхом, чтобы запустить у себя на компьютере)
📎Скачать можно отсюда
SEELE: text to endless 3D game
Продолжаем тренд по созданию 3D-миров — новая модель SEELE.
📝Модель генерирует бесконечные 3D игры из текста с возможностью ремикса.
📎Ссылочка
DinoV3 от Meta для анализа изображений
Новая модель от Meta улучшает анализ изображений, сегментацию и разметку.
📝 Анализировать изображения — Использовать информации с изображения
📎Скачать можно отсюда
Генерируем изображение с помощью Imagen 4
Imagen 4 от Google теперь доступна в API с тремя режимами генерации.
📝 Imagen 4 доступна в API с режимами Fast, Standard и Ultra.
📎 Попробовать без API можно тут
Nano Banana — новая модель от Google
Google тизерит Nano Banana — компактная модель для генерации и редактирования изображений.
📝 Новая модель сможет редактировать изображение по тексту и, вероятно, для мобильных устройств
🔵 Звук
Video2Music от ElevenLabs
Новая модель от авангардистов звука, которая анализирует видео и генерирует подходящую музыку. Функция пока в альфа-тестировании.
📝 Генерируем музыку для видео — Используем в своих видео-проектах на Лигу
📎Пробуем тут
🟣 Видео
Генерация видео в Perplexity
Perplexity официально добавила генерацию видео в веб-версию и приложение, но с ограниченными лимитами.
📝 Perplexity теперь поддерживает генерацию видео, но лимиты очень малы: 5 видео в месяц для Pro и 15 для Max аккаунтов. (Да, можно было генерировать видео и до этой недели, но только в веб-версии, теперь официально везде)
📎Пробуем тут, а купить дёшево подписку можно тут
Pika Labs уходит в генерацию аватаров
Pika Labs теперь фокусируется на генерации аватаров с липсинком и без ограничений по длительности трека.
📝 Можно создать аватар из своих фотографий и видео — Сгенерировать видео с липсинком — Использовать для своих соцсетей или лиге достижений
📎Можно попробовать тут
Wonder Studio теперь бесплатный
Теперь сервис называется Autodesk Flow Studio и он снова предлагает бесплатный тариф — 300 кредитов в месяц
📝 Используем для захвата движений с помощью нейросети — Обрабатываем видео и анимацию
📎Пробуем тут
StableAvatar: генерация аватаров с липсинком
Microsoft Research Asia выпустили опенсорс-модель StableAvatar, которая генерирует аватары с липсинком на основе аудио.
📝 Для запуска потребуется 18 ГБ видеопамяти
📎Качаем отсюда
Анимируем изображение с помощь Draw2Video
Новая модель от Draw2Video позволяет создавать анимацию, рисуя на статичном изображении. Генерация занимает около 5 минут.
📝 Загружаем изображение — Создаём анимацию — Используем в своих видео или презентациях
📎Попробовать можно тут
🟠 Разное
Реальные бои роботов в Сан-Франциско
Киношники предсказали будущее: теперь в Сан-Франциско проходят реальные бои роботов с блекджеком и хуками.
📝 На сайте можно увидеть бои роботов, напоминающие больше бои неуклюжих кукол, но организаторы активно продвигают это через твиттер.
📎 Смотрим тут
OpenAI выиграла золотую медаль на олимпиаде по информатике
Система OpenAI заняла 6-е место среди 330 участников, включая людей, на олимпиаде по информатике.
📝 Изучить подход OpenAI к решению олимпиадных задач — Анализировать ограничения и возможности ИИ в академических соревнованиях
📎 Подробнее в твиттере
Никогда у Apple такого не было и вот опять
Илон Маск обвиняет Apple в манипуляции рейтингами в App Store в пользу OpenAI.
📝 Маск утверждает, что Apple манипулирует рейтингами, чтобы приложения OpenAI занимали первое место. Доказательств, естественно нет.
📎Источник тут
Meta выпустила модель для предсказания реакции мозга
Анализ мозга по одному лишь видео!
📝 Модель TRIBE предсказывает реакцию мозга на видеозаписи без сканирования, анализируя только видео, аудио и текст. Можно использовать для анализа контента, чтобы оптимизировать видео для максимального внимания, а также изучить реакции зрителей
📎Берём пол литра и разбираемся как запустить отсюда
DeepMind расшифровала «тёмную материю» ДНК
AlphaGenome от DeepMind предсказывает работу генов и влияние мутаций на организм.
📝 AlphaGenome может анализировать миллионы букв для расшифровки ДНК и предсказывать молекулярные свойства. Это открывает новые возможности для медицины.
📎Подробнее тут
Perplexity предложила купить Google Chrome за $34,5 млрд
Компания хочет купить Chrome, обещая сохранить код Chromium и оставить Google поисковиком по умолчанию.
📝 Предложение интересное, т. к. Perplexity предложили, несмотря на свою оценку в $18 млрд., почти в два раза больше. Но при этом обещают ещё и инвестировать в проект.
📎Подробнее тут
Strawberry Browser — ИИ-браузер с автоматизацией
Все браузеры уже включили в себя нейросети, поэтому неудивительно, что появляются новые игроки, делающие на это ставку — встречаем Клубничку!
📝 Strawberry Browser предлагает автоматизацию задач, генерацию отчетов и работу с соцсетями и почтой.
📎Пробуем на свой страх и риск тут
Библиотека приложений от GPT-5
Один из умельцев выпустил сборник приложений, сгенерированных GPT-5 с помощью одного промпта.
📝 Можно использовать как исходники или добавить серверную часть и использовать полноценно.
📎Смотрим тут
Авито запускает AI-лабораторию
Авито инвестирует 1 млрд рублей в AI-лабораторию.
📝 Ребята настроены серьезно: AI-лабораторию возглавляет Kaggle Grandmaster и она будет заниматься генеративными моделями и компьютерным зрением.
📎Подробнее тут
Оно развивается
Вышло исследование, которое описывает эволюцию ИИ-агентов и их потенциал.
📝 Исследование рассматривает самосовершенствующиеся ИИ-агенты, их этику, безопасность и развитие.
📎Исследование тут