Нейродайджест
May 6, 2025
Понедельничный дайджест №6
Что интересного произошло в мире нейронок за прошедшую неделю? (05.05.2025)
→ Перейти к буквам
→ Перейти к картинкам
→ Перейти к звуку
→ Перейти к видео
→ Перейти к разному
← Перейти к прошлым дайджестам
🟢 Буквы
- Команда ИИ-учёных в кармане!
Платформа AI Scientist от FutureHouse выполняет научные исследования эффективнее, чем люди.
Четыре умных ИИ-агента (Crow, Falcon, Owl и Phoenix) выполняют научные задачи быстрее и точнее людей. Они доступны бесплатно онлайн для всех.
📝 Сервис отвечает на научные вопросы, генерирует гипотезы, оценивает идеи, анализрует научную литературу, знает «делали ли кто-то это раньше» и планирует хим. эксперименты
📎 Пробуем тут - В Grok добавили поддержку генерации PDF-документов
Grok Studio теперь позволяет создавать различные типы документов в формате PDF.
📝 Необходимо добавить в запрос «создай в PDF»
📎 Создаём файлики тут - Вышла обновленная версия Qwen
Вышла новая версия опен-сорс модели Qwen 3 разного размера, включая миниатюрные и крупные версии.
📝 Модели Qwen 3 являются гибридными и могут вести себя и как рассуждающая модель, и как обычная (В запрос добавить /no_think)
📎 Пробуем тут, качаем отсюда
🟡 Картинки
- Генерируем картинки в Perplexity!
В Perplexity теперь можно делать картинки!
📝 В Perplexity добавил генерацию картинок на базе GPT Image Generation от OpenAI. Генерировать можно как на сайте, так и в ТГ-боте, и в WhatsApp-боте
📎 ТГ-бот, сайт, WhatsApp - Krea изобрела Фотошоп
KREA GPT Paint теперь позволяет рисовать поверх изображений и добавлять стрелки, фигуры и заметки.
📝 С помощью KREA GPT Paint можно создавать промпты для генерации изображений с использованием стрелок и фигур. Просто обвёл, написал «сделай красным» — и готово. Никаких сложных промптов.
📎Пробуем тут
🔵 Звук
- NotebookLM научился генерировать подкасты на русском языке
Гугловский сервис по анализу документов обновился и получил возможность создавать аудио-подкасты с разговорами между ИИ-агентами. Сервис анализирует тексты из PDF, статей или видео и генерирует по ним конспекты, презентации и аудио-подкасты.
📝 Закинуть ссылку/файл на текст/видео/PDF (можно несколько) — Нажать «Создать аудиопересказ».
📎 Пробуем тут (Нужно поменять DNS) - «Живая» озвучка переведённых видео от Яндекса
Система синтеза речи при переводе видео от Яндекса теперь сохраняет интонации и тембр говорящего, делая перевод более естественным.
📝 Инженеры Яндекса значительно улучшили свою модель и в воспроизведении, и в переводе.
📎 Пробуем в Яндекс.Браузере. Подробнее читаем тут - Riffusion выпустил новую модель для генерации треков FUZZ-1.0
Riffusion представил две версии новой модели для генерации музыкальных треков — бесплатную и платную.
📝 Модель FUZZ-1.0 Mini является бесплатной, а FUZZ-1.0 Pro — платной и более мощной. Можно редактировать части трека, настроение и другие параметры.
📎 Пробуем тут - Сбер представил первую русскую модель с нативным восприятием аудио
Сбер прикрутил к своему GigaChat модель, которая может воспринимать аудио и текст одновременно.
📝 Модель распознаёт эмоции и звуки, музыку и речь (В том числе и на других языках). Длина контекста составляет 170 минут. Обещают скоро показать модель отдельно.
📎 Пробуем в Гигачат - Suno выпустила обновлённую модель V4.5 Suno представила обновлённую модель для создания музыкальных композиций.
📝 Модель V4.5 имеет новые жанры, насыщенное звучание и отчётливо слышимые партии инструментов, а самое главное — треки теперь до 8 минут!
📎 Пробуем тут
🟣 Видео
- Генерируем прямо эфир в прямом эфире
Опен-сорсная модель CausVid позволяет генерировать видео мгновенно, в стриминговом режиме.
Воспроизведение происходит сразу после нажатия кнопки «Generate».
📝 Скорость 9.4 кадра в секунду, поддержка текст-видео и других форматов. Пока не юзабельно — нужно серверное железо.
📎 Качаем отсюда
🟠 Разное
- Google выкатил новый режим поиска с помощью ИИ
Google представил новый режим поиска «AI Mode», но пока только в США
📝 Режим включает новую вкладку для поиска товаров, карточек и других функций.
📎 Пробуем в гугле с США-VPN’ом - Chatgpt перестал быть подлизой
На этой неделе выпустили и почти сразу откатили обновление для модели 4o.
📝 Модель максимально подлизывалась к пользователю, считала все его исправления и мысли верными.
📎Сейчас это убрали, а как это произошло читаем тут - Google запустила инициативу 100 Zeros по созданию фильмов и телешоу
Гугл инициировала создание фильмов и телешоу с использованием ИИ.
📝 Инициатива включает поиск проектов для финансирования, продвижение технологий ИИ в киноиндустрии и борьбу со страшилками о технологиях.
📎Подробнее тут - Как понять какую модель ChatGPT использовать?
OpenAI обновили документацию, описывающую оптимальные модели для различных задач.
📝 Документация описывает GPT-4o, GPT-4.5, o4-mini и другие модели с указанием их особенностей и оптимальных применений.
📎 Читаем тут