September 4

MiniMax Video-01: Гиперреалистичный видеогенератор из Китая

Источник, Журнал Гервин: https://gerwin.io/journal/video-01-ot-minimax

Китайский стартап MiniMax совсем недавно представил свою новую разработку — видеогенератор на основе искусственного интеллекта Video-01. Этот инструмент вызывает интерес благодаря своей способности создавать гиперреалистичные видеоклипы всего лишь по текстовым подсказкам. В качестве основных спонсоров выступили такие гиганты, как Alibaba и Tencent, что лишь подтверждает серьёзные намерения и потенциал проекта. В данной статье мы подробно рассмотрим работу Video-01, испытанные возможности и результаты генерации видеоконтента.

Основы работы с MiniMax Video-01

Нейросеть Video-01 представляет собой первую версию инструмента компании, который направлен на создание коротких видеоклипов продолжительностью до 6 секунд на основе текстовых запросов. Удобство использования услуги находится на высоком уровне: регистрация не требуется, достаточен лишь доступ к интерфейсу через вкладку "video" в искусственном интеллекте Hailuo.

Тестирование возможностей Video-01: Первый опыт

Первоначальные эксперименты включали создание видеоклипов по различным текстовым запросам. Для начала, был использован запрос на русском языке. Результат оказался неудачным, так как нейросеть не смогла обработать текст на русском. Придётся писать запросы на английском языке.

Пример простого запроса:

An astronaut looks at the Earth from space. The planet explodes and he slowly moves away from this explosion in complete pitch darkness, illuminated only by the rays of the explosion.

Нейросеть справилась с задачей в течение 5 минут, однако результат оказался не идеальным по качеству. Тем не менее, изображение соответствовало заданному описанию. Уточним запрос для большего эффекта:

A close-up of an astronaut is shown to us. In the reflection of his helmet, you can see how the Earth he is looking at explodes and his expression becomes first horrified, then desperate.

Здесь наблюдается улучшение: взрыв стал более масштабным, а эмоции астронавта — выразительными. Но некоторые детали были упущены.

Работа с более сложными запросами

Мы продолжили тестирование, задав более детализированные запросы, чтобы проверить генерацию эмоций и сложные движения.

Эмоциональный запрос:

From the middle frame, a tall, beautiful girl with long brown hair turns to the viewer. She turns around and waves at us. Then she starts running towards us and the shot ends with a close-up on her face, where she smiles broadly and we see her freckles all over her face.

Результат: нейросеть учла практически все условия запроса, но движения всё ещё выглядели слегка неестественными.

Запрос с несколькими субъектами:

A large family gathered together for lunch, there is a TV in the kitchen, and at the moment when the family is having lunch and talking, footage of the explosion of the city is shown on this TV. In the end, everything turns white.

Нейросеть справилась с генерацией видео, однако заметны некоторые ошибки: искажения лиц и неестественные движения рук.

Проверка генерации текста

Запрос с текстом и знаменитостью:

An old-fashioned movie set in sepia tones with an ornate frame and classic font. The text: 'Go away and save yourself soon' appears in the center, accompanied by a subtle film grain effect and the flicker of old film. After that, we see a shot of Doctor Who, played by Matt Smith.

Результат показал, что нейросеть частично сумела воспроизвести текст, но столкнулась с трудностями при воссоздании лица Мэтта Смита и добавила случайные строки в текст.

Итоги и перспективы

Несмотря на выявленные недостатки, MiniMax Video-01 демонстрирует значительный потенциал. На текущем этапе пользователи сталкиваются с некоторыми ограничениями, такими как:

  • Невозможность обработки запросов на русском языке.
  • Ошибки при генерации большого числа людей в кадре.
  • Неестественность движений.
  • Сложности с воссозданием лиц знаменитостей и генерированием текста.

Тем не менее, MiniMax Video-01 уже сейчас показывает отличные результаты в создании человеческих движений и эмоциональных выражений. Учитывая, что разработчики обещают значительные улучшения в ближайшие недели, можно ожидать, что эта технология станет ещё более мощным инструментом для создания видеоконтента.

MiniMax Video-01 — инновационный и перспективный видеогенератор, за которым стоит следить. Он уже сейчас представляет интерес для творческих проектов и имеет все шансы на дальнейшее развитие и совершенствование.