Sora Images. Как использовать нейросеть для генерации картинок

Sora Images — инновационная нейросеть, разработанная компанией OpenAI, которая используется для создания и стилизации картинок. Главным преимуществом данной технологии является способность точно следовать референсам (картинкам и фотографиям), загружаемым пользователем. Кроме того, Sora Images знает практически все языки, что позволяет легко добавлять текстовые элементы к изображениям и эффективно обрабатывать пользовательские запросы. Ключевой особенностью данной нейросети является её способность чётко распознавать простые инструкции: достаточно попросить повысить качество изображения, изменить его визуальный стиль или даже выполнить раскрашивание чёрно-белых фотографий.

Нейросеть Sora Images для генераци картинок по промту или фереренсам

Начнём с самого начала. Нейросеть Sora изначально разрабатывалась для генерации видеоконтента по текстовым запросам и предоставленным референсам, что подробно раскрывалось нами в отдельной статье. Позже специалисты из OpenAI расширили её возможности, добавив также функционал создания картинок. Если говорить откровенно, в генерации видео нейросеть Sora проявила себя не самым лучшим образом: она испытывала сложности при обработке референсных изображений, хотя прекрасно справлялась с задачами генерации видео по текстовым описаниям. Совершенно иная картина наблюдается при создании картинок — здесь Sora произвела хорошее впечатление и полностью соответствует ожиданиям.

Ключевые возможности нейросети Sora

Sora Images обладает высоким уровнем понимания текстовых запросов практически на любых языках и достаточно точно придерживается указанных описаний. Например, вы можете дать запрос такого типа: «Волк говорит зайцу: "Давай поиграем в выживание". Выполни в стиле комикса». В результате вы получите готовое комикс-изображение с надписью на русском языке, как правило, без ошибок и неточностей. Таким образом, для создания собственного комикса больше не требуется нанимать художника — достаточно ваших идей и текстового описания.
Помимо этого, нейросеть успешно распознаёт отдельные детали и элементы изображений, которые вы загружаете. Вы можете предоставить от одного до десяти изображений в качестве референсов и комбинировать из них нужные элементы. Например, если вам необходимо изменить одежду персонажа, вы можете загрузить его фотографию и выбрать изображения с нужной одеждой и аксессуарами. Пример такого запроса может выглядеть следующим образом: «Одень человека в эту футболку, пиджак и шляпу. Помести его на солнечный пляж». Sora не только переоденет вашего героя, но и аккуратно интегрирует его в новую локацию, тщательно соблюдая требования к окружению.
Высокое качество работы нейросети распространяется и на обработку фотографий людей. Sora воспроизводит черты лица и телосложение, редко допуская какие-либо искажения. Более того, вы можете экспериментировать с внешностью: загрузите собственную фотографию и получите изображение себя в качестве аниме-персонажа или дерзкого бандита.
Наконец, Sora легко воспринимает промты, написанные простым человеческим языком. Вам больше не придётся использовать сложные синтаксические конструкции и команды, как это требуется в Midjourney или Stable Diffusion. Просто объясните нейросети, что именно вы хотите получить — так же легко и естественно, как если бы вы говорили с реальным человеком.

Недостатки нейросети Sora при генерации картинок

С точки зрения художественной выразительности Sora значительно проигрывает своему прямому конкуренту Midjourney, однако по фотореалистичности изображений ситуация выглядит заметно лучше.
Картинки, создаваемые нейросетью, имеют характерные особенности, которые делают их заметно отличающимися от аналогичных результатов других платформ. Особенно ярко это проявляется в цветовом решении: изображения нередко выходят приглушёнными и тусклыми. Если яркость изображения для вас является важным критерием, необходимо добавлять уточняющие формулировки, например «яркие цвета», «цветное изображение» или «насыщенные цвета».
Встроенной функции увеличения разрешения изображений (апскейла) в Sora не предусмотрено. Тем не менее, эта проблема быстро решается применением сторонних приложений и специализированных нейросетей.
Отдельного внимания заслуживает вопрос стоимости. Подписка на Sora не относится к числу бюджетных предложений. При интенсивном использовании необходим тариф стоимостью 200 долларов, так как именно он позволяет создавать картинки в нескольких параллельных потоках. Однако решить этот вопрос можно гораздо дешевле, используя Sora Images через специальный Telegram-бот @yes_ai_bot (оплачиваются только сами генерации, подписка не требуется).

Лайфхаки по применению нейросети Sora Images

Вы знали, что с помощью нейросети Sora можно виртуально изменить образ человека? Фактически, перед нами настоящий онлайн-шоурум, позволяющий буквально за несколько минут примерить различные элементы одежды. Всё, что от вас требуется – фотография человека и отдельные изображения вещей, которые вы хотите примерить. Далее необходимо составить промт с указанием, что выбранная одежда должна быть размещена на человеке с исходного изображения. Конечно, на данный момент нейросеть не всегда точно воспроизводит мелкие детали: логотипы или небольшие узоры могут потеряться. Однако даже при таких ограничениях результат выглядит весьма убедительно и многообещающе.

Исходный референс и два элемента одежды

Замена одежды через нейросеть Sora Images

Стилизовать изображения намного проще, чем может показаться на первый взгляд. Достаточно выбрать любую фотографию людей, животных или различных предметов и отправить её в Сору с кратким описанием, например: «Изобрази людей в стиле картин Рембрандта» или «Собака, выполненная в манере детского рисунка». Такой простой подход поможет вам по-новому взглянуть даже на самые известные произведения искусства, такие как знаменитая «Мона Лиза».

Мона Лиза в стиле детского карандашного рисунка - создано в нейросети Sora Images

Сора способна распознавать команды, благодаря чему текст, размещенный в примечании к изображению, воспринимается нейросетью как конкретное руководство к действию. Например, нейросеть может восстановить исходную четкость старой фотографии или придать яркие цвета черно-белому изображению. В качестве иллюстрации можно привести команду: «восстанови это изображение и сделай его цветным», при этом в одном запросе допускается постановка сразу нескольких задач.

Реставрация старых фотографий через Sora Images

Результат реставрации фото с добавлением цвета

Как начать создавать картинки с помощью Sora Images без регистрации

Перейдите по ссылке и запустите Telegram-бота @yes_ai_bot 👈
В разделе настроек выберите наиболее подходящий формат изображения из предложенных вариантов (1:1, 2:3 или 3:2).

Выбор настроек соотношения сторор в телеграм боте Yes Ai

Для создания изображений по собственному описанию отправьте боту подробный текстовый запрос.
Если у вас есть изображения, которые можно использовать в качестве основы, загрузите их (от 1 до 10 штук) одним сообщением и добавьте текстовую заметку, которая станет промтом для генерации. Затем отправьте боту дополнительное описание и нажмите кнопку «🎡 Смешать изображения».

Загрузка картинок в качестве референсов для смешивания в Sora Images

Подождите несколько минут, и бот предоставит 4 варианта изображений (всегда создается по 4 картинки).
Готовые изображения можно скачать в исходном качестве, а также дополнительно улучшить с помощью функции перерисовки (INPAINT). Помимо этого, изображения, созданные в Yes AI, можно сделать анимированными, задействовав другие нейросети, например Kling AI, Luma или Pika.
Если вам понравился результат и вы хотите им поделиться, можно опубликовать работу на нашем форуме при помощи специальной кнопки. За такую активность Yes AI начислит вам ⭐ баллы, которые могут быть полезны для генерации контента в других нейросетях.

Пользователи Yes Ai Bot могут использовать следующие возможности нейросети Sora Images:

Выбор пропорций для генерируемых картинок (доступны форматы 1:1, 2:3 и 3:2).
Применение встроенных стилистических шаблонов из галереи — одновременно можно комбинировать до трех различных стилей, таких как акварель, реализм или аниме.
Конвертация полученного изображения в формат SVG.
Оживление созданного изображения в любой нейросети: Sora Video, Kling Ai, Pika или Luma.