Нейродайджест
May 6, 2025

Понедельничный дайджест №6

Что интересного произошло в мире нейронок за прошедшую неделю? (05.05.2025)

→ Перейти к буквам
→ Перейти к картинкам
→ Перейти к звуку
→ Перейти к видео
→ Перейти к разному
← Перейти к прошлым дайджестам

🟢 Буквы

  1. Команда ИИ-учёных в кармане! Платформа AI Scientist от FutureHouse выполняет научные исследования эффективнее, чем люди.
    Четыре умных ИИ-агента (Crow, Falcon, Owl и Phoenix) выполняют научные задачи быстрее и точнее людей. Они доступны бесплатно онлайн для всех.
    📝 Сервис отвечает на научные вопросы, генерирует гипотезы, оценивает идеи, анализрует научную литературу, знает «делали ли кто-то это раньше» и планирует хим. эксперименты
    📎 Пробуем тут
  2. В Grok добавили поддержку генерации PDF-документов Grok Studio теперь позволяет создавать различные типы документов в формате PDF.
    📝 Необходимо добавить в запрос «создай в PDF»
    📎 Создаём файлики тут
  3. Вышла обновленная версия Qwen Вышла новая версия опен-сорс модели Qwen 3 разного размера, включая миниатюрные и крупные версии.
    📝 Модели Qwen 3 являются гибридными и могут вести себя и как рассуждающая модель, и как обычная (В запрос добавить /no_think)
    📎 Пробуем тут, качаем отсюда

🟡 Картинки

  1. Генерируем картинки в Perplexity! В Perplexity теперь можно делать картинки!
    📝 В Perplexity добавил генерацию картинок на базе GPT Image Generation от OpenAI. Генерировать можно как на сайте, так и в ТГ-боте, и в WhatsApp-боте
    📎 ТГ-бот, сайт, WhatsApp
  2. Krea изобрела Фотошоп KREA GPT Paint теперь позволяет рисовать поверх изображений и добавлять стрелки, фигуры и заметки.
    📝 С помощью KREA GPT Paint можно создавать промпты для генерации изображений с использованием стрелок и фигур. Просто обвёл, написал «сделай красным» — и готово. Никаких сложных промптов.
    📎Пробуем тут

🔵 Звук

  1. NotebookLM научился генерировать подкасты на русском языке Гугловский сервис по анализу документов обновился и получил возможность создавать аудио-подкасты с разговорами между ИИ-агентами. Сервис анализирует тексты из PDF, статей или видео и генерирует по ним конспекты, презентации и аудио-подкасты.
    📝 Закинуть ссылку/файл на текст/видео/PDF (можно несколько) — Нажать «Создать аудиопересказ».
    📎 Пробуем тут (Нужно поменять DNS)
  2. «Живая» озвучка переведённых видео от Яндекса Система синтеза речи при переводе видео от Яндекса теперь сохраняет интонации и тембр говорящего, делая перевод более естественным.
    📝 Инженеры Яндекса значительно улучшили свою модель и в воспроизведении, и в переводе.
    📎 Пробуем в Яндекс.Браузере. Подробнее читаем тут
  3. Riffusion выпустил новую модель для генерации треков FUZZ-1.0 Riffusion представил две версии новой модели для генерации музыкальных треков — бесплатную и платную.
    📝 Модель FUZZ-1.0 Mini является бесплатной, а FUZZ-1.0 Pro — платной и более мощной. Можно редактировать части трека, настроение и другие параметры.
    📎 Пробуем тут
  4. Сбер представил первую русскую модель с нативным восприятием аудио Сбер прикрутил к своему GigaChat модель, которая может воспринимать аудио и текст одновременно.
    📝 Модель распознаёт эмоции и звуки, музыку и речь (В том числе и на других языках). Длина контекста составляет 170 минут. Обещают скоро показать модель отдельно.
    📎 Пробуем в Гигачат
  5. Suno выпустила обновлённую модель V4.5 Suno представила обновлённую модель для создания музыкальных композиций.
    📝 Модель V4.5 имеет новые жанры, насыщенное звучание и отчётливо слышимые партии инструментов, а самое главное — треки теперь до 8 минут!
    📎 Пробуем тут

🟣 Видео

  1. Генерируем прямо эфир в прямом эфире Опен-сорсная модель CausVid позволяет генерировать видео мгновенно, в стриминговом режиме.
    Воспроизведение происходит сразу после нажатия кнопки «Generate».
    📝 Скорость 9.4 кадра в секунду, поддержка текст-видео и других форматов. Пока не юзабельно — нужно серверное железо.
    📎 Качаем отсюда

🟠 Разное

  1. Google выкатил новый режим поиска с помощью ИИ Google представил новый режим поиска «AI Mode», но пока только в США
    📝 Режим включает новую вкладку для поиска товаров, карточек и других функций.
    📎 Пробуем в гугле с США-VPN’ом
  2. Chatgpt перестал быть подлизой На этой неделе выпустили и почти сразу откатили обновление для модели 4o.
    📝 Модель максимально подлизывалась к пользователю, считала все его исправления и мысли верными.
    📎Сейчас это убрали, а как это произошло читаем тут
  3. Google запустила инициативу 100 Zeros по созданию фильмов и телешоу Гугл инициировала создание фильмов и телешоу с использованием ИИ.
    📝 Инициатива включает поиск проектов для финансирования, продвижение технологий ИИ в киноиндустрии и борьбу со страшилками о технологиях.
    📎Подробнее тут
  4. Как понять какую модель ChatGPT использовать? OpenAI обновили документацию, описывающую оптимальные модели для различных задач.
    📝 Документация описывает GPT-4o, GPT-4.5, o4-mini и другие модели с указанием их особенностей и оптимальных применений.
    📎 Читаем тут