sora
May 4

Sora Images. Как использовать нейросеть для генерации картинок

Sora Images — инновационная нейросеть, разработанная компанией OpenAI, которая используется для создания и стилизации картинок. Главным преимуществом данной технологии является способность точно следовать референсам (картинкам и фотографиям), загружаемым пользователем. Кроме того, Sora Images знает практически все языки, что позволяет легко добавлять текстовые элементы к изображениям и эффективно обрабатывать пользовательские запросы. Ключевой особенностью данной нейросети является её способность чётко распознавать простые инструкции: достаточно попросить повысить качество изображения, изменить его визуальный стиль или даже выполнить раскрашивание чёрно-белых фотографий.

Нейросеть Sora Images для генераци картинок по промту или фереренсам

Начнём с самого начала. Нейросеть Sora изначально разрабатывалась для генерации видеоконтента по текстовым запросам и предоставленным референсам, что подробно раскрывалось нами в отдельной статье. Позже специалисты из OpenAI расширили её возможности, добавив также функционал создания картинок. Если говорить откровенно, в генерации видео нейросеть Sora проявила себя не самым лучшим образом: она испытывала сложности при обработке референсных изображений, хотя прекрасно справлялась с задачами генерации видео по текстовым описаниям. Совершенно иная картина наблюдается при создании картинок — здесь Sora произвела хорошее впечатление и полностью соответствует ожиданиям.


Ключевые возможности нейросети Sora

  • Sora Images обладает высоким уровнем понимания текстовых запросов практически на любых языках и достаточно точно придерживается указанных описаний. Например, вы можете дать запрос такого типа: «Волк говорит зайцу: "Давай поиграем в выживание". Выполни в стиле комикса». В результате вы получите готовое комикс-изображение с надписью на русском языке, как правило, без ошибок и неточностей. Таким образом, для создания собственного комикса больше не требуется нанимать художника — достаточно ваших идей и текстового описания.
  • Помимо этого, нейросеть успешно распознаёт отдельные детали и элементы изображений, которые вы загружаете. Вы можете предоставить от одного до десяти изображений в качестве референсов и комбинировать из них нужные элементы. Например, если вам необходимо изменить одежду персонажа, вы можете загрузить его фотографию и выбрать изображения с нужной одеждой и аксессуарами. Пример такого запроса может выглядеть следующим образом: «Одень человека в эту футболку, пиджак и шляпу. Помести его на солнечный пляж». Sora не только переоденет вашего героя, но и аккуратно интегрирует его в новую локацию, тщательно соблюдая требования к окружению.
  • Высокое качество работы нейросети распространяется и на обработку фотографий людей. Sora воспроизводит черты лица и телосложение, редко допуская какие-либо искажения. Более того, вы можете экспериментировать с внешностью: загрузите собственную фотографию и получите изображение себя в качестве аниме-персонажа или дерзкого бандита.
  • Наконец, Sora легко воспринимает промты, написанные простым человеческим языком. Вам больше не придётся использовать сложные синтаксические конструкции и команды, как это требуется в Midjourney или Stable Diffusion. Просто объясните нейросети, что именно вы хотите получить — так же легко и естественно, как если бы вы говорили с реальным человеком.

Недостатки нейросети Sora при генерации картинок

  • С точки зрения художественной выразительности Sora значительно проигрывает своему прямому конкуренту Midjourney, однако по фотореалистичности изображений ситуация выглядит заметно лучше.
  • Картинки, создаваемые нейросетью, имеют характерные особенности, которые делают их заметно отличающимися от аналогичных результатов других платформ. Особенно ярко это проявляется в цветовом решении: изображения нередко выходят приглушёнными и тусклыми. Если яркость изображения для вас является важным критерием, необходимо добавлять уточняющие формулировки, например «яркие цвета», «цветное изображение» или «насыщенные цвета».
  • Встроенной функции увеличения разрешения изображений (апскейла) в Sora не предусмотрено. Тем не менее, эта проблема быстро решается применением сторонних приложений и специализированных нейросетей.
  • Отдельного внимания заслуживает вопрос стоимости. Подписка на Sora не относится к числу бюджетных предложений. При интенсивном использовании необходим тариф стоимостью 200 долларов, так как именно он позволяет создавать картинки в нескольких параллельных потоках. Однако решить этот вопрос можно гораздо дешевле, используя Sora Images через специальный Telegram-бот @yes_ai_bot (оплачиваются только сами генерации, подписка не требуется).

Лайфхаки по применению нейросети Sora Images

Вы знали, что с помощью нейросети Sora можно виртуально изменить образ человека? Фактически, перед нами настоящий онлайн-шоурум, позволяющий буквально за несколько минут примерить различные элементы одежды. Всё, что от вас требуется – фотография человека и отдельные изображения вещей, которые вы хотите примерить. Далее необходимо составить промт с указанием, что выбранная одежда должна быть размещена на человеке с исходного изображения. Конечно, на данный момент нейросеть не всегда точно воспроизводит мелкие детали: логотипы или небольшие узоры могут потеряться. Однако даже при таких ограничениях результат выглядит весьма убедительно и многообещающе.

Исходный референс и два элемента одежды
Замена одежды через нейросеть Sora Images

Стилизовать изображения намного проще, чем может показаться на первый взгляд. Достаточно выбрать любую фотографию людей, животных или различных предметов и отправить её в Сору с кратким описанием, например: «Изобрази людей в стиле картин Рембрандта» или «Собака, выполненная в манере детского рисунка». Такой простой подход поможет вам по-новому взглянуть даже на самые известные произведения искусства, такие как знаменитая «Мона Лиза».

Мона Лиза в стиле детского карандашного рисунка - создано в нейросети Sora Images

Сора способна распознавать команды, благодаря чему текст, размещенный в примечании к изображению, воспринимается нейросетью как конкретное руководство к действию. Например, нейросеть может восстановить исходную четкость старой фотографии или придать яркие цвета черно-белому изображению. В качестве иллюстрации можно привести команду: «восстанови это изображение и сделай его цветным», при этом в одном запросе допускается постановка сразу нескольких задач.

Реставрация старых фотографий через Sora Images
Результат реставрации фото с добавлением цвета

Как начать создавать картинки с помощью Sora Images без регистрации

  • Перейдите по ссылке и запустите Telegram-бота @yes_ai_bot 👈
  • В разделе настроек выберите наиболее подходящий формат изображения из предложенных вариантов (1:1, 2:3 или 3:2).
Выбор настроек соотношения сторор в телеграм боте Yes Ai
  • Для создания изображений по собственному описанию отправьте боту подробный текстовый запрос.
  • Если у вас есть изображения, которые можно использовать в качестве основы, загрузите их (от 1 до 10 штук) одним сообщением и добавьте текстовую заметку, которая станет промтом для генерации. Затем отправьте боту дополнительное описание и нажмите кнопку «🎡 Смешать изображения».
Загрузка картинок в качестве референсов для смешивания в Sora Images
  • Подождите несколько минут, и бот предоставит 4 варианта изображений (всегда создается по 4 картинки).
  • Готовые изображения можно скачать в исходном качестве, а также дополнительно улучшить с помощью функции перерисовки (INPAINT). Помимо этого, изображения, созданные в Yes AI, можно сделать анимированными, задействовав другие нейросети, например Kling AI, Luma или Pika.
  • Если вам понравился результат и вы хотите им поделиться, можно опубликовать работу на нашем форуме при помощи специальной кнопки. За такую активность Yes AI начислит вам ⭐ баллы, которые могут быть полезны для генерации контента в других нейросетях.

Пользователи Yes Ai Bot могут использовать следующие возможности нейросети Sora Images:

  • Выбор пропорций для генерируемых картинок (доступны форматы 1:1, 2:3 и 3:2).
  • Применение встроенных стилистических шаблонов из галереи — одновременно можно комбинировать до трех различных стилей, таких как акварель, реализм или аниме.
  • Конвертация полученного изображения в формат SVG.
  • Оживление созданного изображения в любой нейросети: Sora Video, Kling Ai, Pika или Luma.