Sora Images. Как использовать нейросеть для генерации картинок
Sora Images — инновационная нейросеть, разработанная компанией OpenAI, которая используется для создания и стилизации картинок. Главным преимуществом данной технологии является способность точно следовать референсам (картинкам и фотографиям), загружаемым пользователем. Кроме того, Sora Images знает практически все языки, что позволяет легко добавлять текстовые элементы к изображениям и эффективно обрабатывать пользовательские запросы. Ключевой особенностью данной нейросети является её способность чётко распознавать простые инструкции: достаточно попросить повысить качество изображения, изменить его визуальный стиль или даже выполнить раскрашивание чёрно-белых фотографий.
Начнём с самого начала. Нейросеть Sora изначально разрабатывалась для генерации видеоконтента по текстовым запросам и предоставленным референсам, что подробно раскрывалось нами в отдельной статье. Позже специалисты из OpenAI расширили её возможности, добавив также функционал создания картинок. Если говорить откровенно, в генерации видео нейросеть Sora проявила себя не самым лучшим образом: она испытывала сложности при обработке референсных изображений, хотя прекрасно справлялась с задачами генерации видео по текстовым описаниям. Совершенно иная картина наблюдается при создании картинок — здесь Sora произвела хорошее впечатление и полностью соответствует ожиданиям.
Ключевые возможности нейросети Sora
- Sora Images обладает высоким уровнем понимания текстовых запросов практически на любых языках и достаточно точно придерживается указанных описаний. Например, вы можете дать запрос такого типа: «
Волк говорит зайцу: "Давай поиграем в выживание". Выполни в стиле комикса
». В результате вы получите готовое комикс-изображение с надписью на русском языке, как правило, без ошибок и неточностей. Таким образом, для создания собственного комикса больше не требуется нанимать художника — достаточно ваших идей и текстового описания. - Помимо этого, нейросеть успешно распознаёт отдельные детали и элементы изображений, которые вы загружаете. Вы можете предоставить от одного до десяти изображений в качестве референсов и комбинировать из них нужные элементы. Например, если вам необходимо изменить одежду персонажа, вы можете загрузить его фотографию и выбрать изображения с нужной одеждой и аксессуарами. Пример такого запроса может выглядеть следующим образом: «
Одень человека в эту футболку, пиджак и шляпу. Помести его на солнечный пляж
». Sora не только переоденет вашего героя, но и аккуратно интегрирует его в новую локацию, тщательно соблюдая требования к окружению. - Высокое качество работы нейросети распространяется и на обработку фотографий людей. Sora воспроизводит черты лица и телосложение, редко допуская какие-либо искажения. Более того, вы можете экспериментировать с внешностью: загрузите собственную фотографию и получите изображение себя в качестве аниме-персонажа или дерзкого бандита.
- Наконец, Sora легко воспринимает промты, написанные простым человеческим языком. Вам больше не придётся использовать сложные синтаксические конструкции и команды, как это требуется в Midjourney или Stable Diffusion. Просто объясните нейросети, что именно вы хотите получить — так же легко и естественно, как если бы вы говорили с реальным человеком.
Недостатки нейросети Sora при генерации картинок
- С точки зрения художественной выразительности Sora значительно проигрывает своему прямому конкуренту Midjourney, однако по фотореалистичности изображений ситуация выглядит заметно лучше.
- Картинки, создаваемые нейросетью, имеют характерные особенности, которые делают их заметно отличающимися от аналогичных результатов других платформ. Особенно ярко это проявляется в цветовом решении: изображения нередко выходят приглушёнными и тусклыми. Если яркость изображения для вас является важным критерием, необходимо добавлять уточняющие формулировки, например «
яркие цвета
», «цветное изображение
» или «насыщенные цвета
». - Встроенной функции увеличения разрешения изображений (апскейла) в Sora не предусмотрено. Тем не менее, эта проблема быстро решается применением сторонних приложений и специализированных нейросетей.
- Отдельного внимания заслуживает вопрос стоимости. Подписка на Sora не относится к числу бюджетных предложений. При интенсивном использовании необходим тариф стоимостью 200 долларов, так как именно он позволяет создавать картинки в нескольких параллельных потоках. Однако решить этот вопрос можно гораздо дешевле, используя Sora Images через специальный Telegram-бот @yes_ai_bot (оплачиваются только сами генерации, подписка не требуется).
Лайфхаки по применению нейросети Sora Images
Вы знали, что с помощью нейросети Sora можно виртуально изменить образ человека? Фактически, перед нами настоящий онлайн-шоурум, позволяющий буквально за несколько минут примерить различные элементы одежды. Всё, что от вас требуется – фотография человека и отдельные изображения вещей, которые вы хотите примерить. Далее необходимо составить промт с указанием, что выбранная одежда должна быть размещена на человеке с исходного изображения. Конечно, на данный момент нейросеть не всегда точно воспроизводит мелкие детали: логотипы или небольшие узоры могут потеряться. Однако даже при таких ограничениях результат выглядит весьма убедительно и многообещающе.
Стилизовать изображения намного проще, чем может показаться на первый взгляд. Достаточно выбрать любую фотографию людей, животных или различных предметов и отправить её в Сору с кратким описанием, например: «Изобрази людей в стиле картин Рембрандта
» или «Собака, выполненная в манере детского рисунка
». Такой простой подход поможет вам по-новому взглянуть даже на самые известные произведения искусства, такие как знаменитая «Мона Лиза
».
Сора способна распознавать команды, благодаря чему текст, размещенный в примечании к изображению, воспринимается нейросетью как конкретное руководство к действию. Например, нейросеть может восстановить исходную четкость старой фотографии или придать яркие цвета черно-белому изображению. В качестве иллюстрации можно привести команду: «восстанови это изображение и сделай его цветным
», при этом в одном запросе допускается постановка сразу нескольких задач.
Как начать создавать картинки с помощью Sora Images без регистрации
- Перейдите по ссылке и запустите Telegram-бота @yes_ai_bot 👈
- В разделе настроек выберите наиболее подходящий формат изображения из предложенных вариантов (1:1, 2:3 или 3:2).
- Для создания изображений по собственному описанию отправьте боту подробный текстовый запрос.
- Если у вас есть изображения, которые можно использовать в качестве основы, загрузите их (от 1 до 10 штук) одним сообщением и добавьте текстовую заметку, которая станет промтом для генерации. Затем отправьте боту дополнительное описание и нажмите кнопку «🎡
Смешать изображения
».
- Подождите несколько минут, и бот предоставит 4 варианта изображений (всегда создается по 4 картинки).
- Готовые изображения можно скачать в исходном качестве, а также дополнительно улучшить с помощью функции перерисовки (INPAINT). Помимо этого, изображения, созданные в Yes AI, можно сделать анимированными, задействовав другие нейросети, например Kling AI, Luma или Pika.
- Если вам понравился результат и вы хотите им поделиться, можно опубликовать работу на нашем форуме при помощи специальной кнопки. За такую активность Yes AI начислит вам ⭐ баллы, которые могут быть полезны для генерации контента в других нейросетях.
Пользователи Yes Ai Bot могут использовать следующие возможности нейросети Sora Images:
- Выбор пропорций для генерируемых картинок (доступны форматы 1:1, 2:3 и 3:2).
- Применение встроенных стилистических шаблонов из галереи — одновременно можно комбинировать до трех различных стилей, таких как акварель, реализм или аниме.
- Конвертация полученного изображения в формат SVG.
- Оживление созданного изображения в любой нейросети: Sora Video, Kling Ai, Pika или Luma.