February 23, 2024

Нейросеть Sora - превращение текста в видео

Для тех, кто интересуется нейросетями. 15 февраля 2024 года всеми известная компания Open AI представила новую нейросеть SORA.

Что пишет об этом создатель, информация с сайта:

Мы исследуем масштабное обучение генеративных моделей на видеоданных. Конкретно, мы обучаем текстоусловные диффузионные модели совместно на видео и изображениях переменной длительности, разрешения и соотношения сторон. Мы используем архитектуру трансформера, которая работает с пространственно-временными патчами видео и изображений в латентных кодах. Наша крупнейшая модель, Sora, способна генерировать минуту видео высокой точности. Наши результаты свидетельствуют о том, что масштабирование моделей генерации видео является многообещающим путем к созданию универсальных симуляторов физического мира.

Полная версия статьи: https://dzen.ru/a/ZdOGMsjpdxLS3NAF