Как использовать DALL·E 3 для создания изображений
DALL·E 3 — новое поколение генератора изображений с искусственным интеллектом от OpenAI
DALL·E 3 — это современная версия генератора изображений на базе ИИ, представляющая значительный шаг вперед по сравнению с DALL·E 2. Эта версия не только улучшила качество создаваемых изображений, но и сделала процесс взаимодействия более удобным для пользователей. Теперь DALL·E 3 может успешно конкурировать с другими ведущими генераторами изображений.
Как использовать DALL·E 3 через ChatGPT
Одним из главных преимуществ DALL·E 3 является его тесная интеграция с ChatGPT. Это позволяет пользователям генерировать изображения, просто описывая их текстом в диалоге. Вместо сложных команд для генерации, вы можете вести обычный разговор с ChatGPT, добавляя детали к вашему запросу и корректируя его на ходу.
Лимиты
На данный момент лимиты DALL·E 3 схожи с ограничениями GPT-4: вы можете отправлять до 50 запросов каждые три часа. Теоретически это позволяет создавать более тысячи изображений в день. Это значительно больше, чем предлагают другие генераторы изображений, такие как Dream Studio (на базе Stable Diffusion) или Midjourney. Однако стоит учитывать, что ценовая политика у этих сервисов различается. И всё же, если вы регулярно начнёте генерировать изображения в таком объёме, не удивлюсь, если OpenAI обратит на это внимание.
Как начать работу с DALL·E 3
Чтобы получить доступ к DALL·E 3, перейдите в ChatGPT и убедитесь, что используете ChatGPT 4о или ChatGPT 4o mini. (Также доступен DALL·E GPT.)
После этого работать с DALL·E 3 так же просто, как с обычным ChatGPT. Вы можете вводить стандартные текстовые запросы или взаимодействовать с моделью, используя естественный язык. Если вы используете DALL·E через ChatGPT 4 или 4o, каждый запрос создаёт только одно изображение. Однако через DALL·E 3 GPT вы получите два разных изображения на выбор.
- «Кубистская картина большой коровы на маленьком поле»
- «Картина маслом: обезьяна в космическом скафандре на Луне»
- «Мужчина, верхом на медведе, проезжает через кленовый лес в стиле импрессионизма»
- «Стоковая фотография программиста, работающего удалённо»
Если вы используете отдельный GPT для DALL·E, интерфейс также предложит вам подсказки и выбор соотношения сторон изображения.
Особенность DALL·E 3 в том, что он автоматически улучшает и уточняет ваши запросы. Кроме того, при создании двух изображений он использует слегка разные интерпретации для каждого из них.
Например, когда я ввёл запрос «котёнок в костюме фотореализм», один из реально использованных запросов выглядел так:
«A photorealistic image of an adorable kitten wearing a cute costume, such as a small tailored suit or a colorful outfit. The kitten should have bright, expressive eyes and soft fur, posed playfully or sitting attentively. The background is softly blurred to emphasize the kitten as the focal point, creating a warm and inviting atmosphere.»
Чтобы посмотреть, какой текстовый запрос использовал DALL·E 3 для создания изображения, просто нажмите на изображение, а затем на кнопку с символом "i". В поле «Prompt» отобразится описание того, что модель пыталась сгенерировать.
Чтобы скачать изображение, нажмите на значок загрузки в правом верхнем углу.
Как редактировать изображение с помощью DALL·E 3 в ChatGPT
Одной из лучших функций DALL·E 3 является возможность продолжить работу с изображением через естественные текстовые запросы в ChatGPT. Если вас что-то не устраивает или вы хотите акцентировать внимание на определённых деталях в новом варианте, достаточно просто описать это.
Примеры того, что можно сделать:
- Запросить больше вариаций конкретного изображения.
- Изменить точку обзора изображения.
- Поменять расположение объекта на изображении.
- Изменить соотношение сторон изображения.
- Изменить количество объектов на изображении.
- Добавить, удалить или изменить детали объекта, например, цвет или размер.
- Добавить или убрать элементы фона.
- Представить сгенерированное изображение, будто оно висит на стене галереи.
DALL·E 3 позволяет интуитивно работать с изображениями, создавая новые версии на основе ваших уточнений и идей.
Особенности редактирования изображений в DALL·E 3
Важно помнить, что при внесении изменений через текстовые запросы DALL·E 3 создаёт новый запрос на основе ваших указаний и генерирует новые изображения, вместо прямого редактирования существующего.
Иногда изменения будут минимальными и точно соответствовать вашим ожиданиям — в такие моменты результат действительно кажется магией. Но бывают случаи, когда DALL·E 3 может изменить или убрать те элементы, которые вам нравились в исходном изображении.
Если вам нужен более точный контроль, выполните следующие шаги:
- Нажмите на изображение, которое хотите изменить.
- Выберите инструмент "Select/Выбрать" в верхнем меню.
3. Закрасьте ту область изображения, которую вы хотите отредактировать. Чтобы сделать процесс удобнее, вы можете изменить размер кисти в верхней части экрана.
4. В боковой панели введите запрос, описывающий, что именно вы хотите изменить.
DALL·E 3 постарается внести изменения в отмеченную область изображения.
Хотя инструменты редактирования в DALL·E 3 пока не так функциональны, как в DALL·E 2, они остаются интуитивно понятными и достаточно эффективными. Однако модель может кардинально изменить изображение, даже если вы хотели лишь небольшие корректировки. Чтобы добиться нужного результата, придётся поработать с текстовым запросом, уточняя его до тех пор, пока изображение не будет максимально близко к вашему замыслу.
Как добиться наилучших результатов с DALL·E 3
Несмотря на то, что DALL·E 3 всё ещё активно развивается, уже сейчас с его помощью можно создавать впечатляющие изображения. Особенно хорошо модель справляется с созданием рисунков, картин и других видов художественного искусства, нежели с фотореалистичными изображениями. Для фотореализма больше подойдёт Midjourney / Stable Diffusion.
💡 Вот несколько советов, которые помогут вам получить лучший результат.
Давайте подробные запросы
Хотя DALL·E 3 значительно упростил работу с короткими запросами, интерпретируя многие детали самостоятельно, для создания конкретного изображения лучше максимально подробно описывать желаемый результат.
Например, вот как выглядел запрос для изображения на скриншоте:
«Очень детализированная картина маслом: бельгийская овчарка Малинуа, одетая как пират, командует своим кораблём во время напряжённой пиратской битвы с другим судном. Она носит треуголку и держит пистолет, отдавая приказы своей команде. Море бурное, дождь льёт как из ведра, всё вокруг хаотично. Тёмные и мрачные цвета. Мы задаёмся вопросом, сможет ли она выжить.
»
Структура промптов для DALL·E 3
Как уже было сказано, DALL·E 3 и ChatGPT берут на себя большую часть работы, когда дело касается создания изображений, но для лучшего результата важно добавлять в промпт как можно больше структуры и деталей.
Вам не обязательно строго следовать этим правилам, но вот основные принципы, которые помогут создавать эффективные промпты для DALL·E 3:
- Начните с главной идеи: Сформулируйте чёткую центральную тему. Это может быть что угодно: от умиротворяющего пейзажа до абстрактной концепции или сюжета.
- Добавьте детали: Развивайте свою идею, добавляя слои. Опишите объект, место, настроение и стиль. Будь то оживлённый город, тихий лес или волшебный мир, ваши слова задают атмосферу будущей картинки.
- Варьируйте стиль изложения: Используйте чередование коротких, лаконичных фраз и длинных, описательных предложений. Это позволит вам варьировать сложность — от минималистичных идей до богатых деталями сцен.
- Уточните художественные элементы: Задайте параметры, такие как освещение, ракурс или художественный стиль. Например, тёплое свечение заката или вид города с высоты птичьего полёта добавят глубины изображению.
- Корректируйте и улучшайте: Оцените сгенерированные изображения, отметьте, что можно улучшить, и скорректируйте текст запроса.
Это общая структура, которая поможет создавать промпты.
Чем больше деталей вы добавите — об атмосфере, цветах, положении объектов и их характеристиках — тем ближе изображение будет к вашим ожиданиям.
DALL·E 3 лучше понимает числа и расположение
Хотя DALL·E 3 всё ещё может запутаться, если перегрузить его запрос избыточным количеством деталей, это происходит гораздо реже, чем в предыдущей версии. Кроме того, модель заметно лучше справляется с пониманием чисел и расположением объектов в кадре.
- Вы можете попросить разместить объект на переднем плане или в левой части изображения, и с большой вероятностью модель выполнит это.
- Если вы укажете точное количество элементов (например, «три звезды на фоне ночного неба»), DALL·E 3 чаще всего корректно их сгенерирует.
Создание текста на изображениях с помощью DALL·E 3
Хотя OpenAI в своих документах прямо указывает, что модель не предназначена для генерации текста, иногда это всё же работает:
"DALL·E на данный момент не предназначен для создания текста, а разработан для генерации реалистичных и художественных изображений на основе ключевых слов или фраз. В настоящее время модель не обладает точным пониманием текстов, меток или других общепринятых надписей и зачастую создаёт искажённые или неразборчивые результаты."
Тем не менее, с помощью DALL·E 3 можно создавать текст на изображениях, если ограничиться одним-двумя словами. Если результат не удаётся с первого раза, попробуйте ещё несколько вариантов запроса, прежде чем перейти к чему-то другому. Работает с английским языком.
💡 Вот несколько примеров текста на изображениях, созданного с помощью DALL·E 3:
Привет, небо
Создай изображение голубого неба с белыми облаками, на котором слово «Hello» написано в виде надписи самолётом на небе.
Звёзды желаний
Изобрази ясное ночное небо, наполненное звёздами, где слово «Wish» тонко формируется из расположения звёзд.
Привет, мир
Создайте изображение компьютерного чипа, на котором фраза «Hello World» встроена в дизайн схемы, символизируя пересечение технологий и программирования.
Квантовый скачок
Отобрази «Quantum Leap» на цифровом экране, окружённом визуализациями квантовых вычислений.
Экспериментируйте и получайте удовольствие
Единственный способ по-настоящему понять, на что способен DALL·E 3, — это пробовать его в действии. Некоторые сложные запросы модель обрабатывает с неожиданно точными результатами, но иногда даже простые задачи могут быть выполнены с ошибками.
Вот вам задача со звёздочкой: попробуйте сгенерировать просто чёрный квадрат. Обычный, сплошной чёрный лист. По идее закрасить холст сплошным чёрным цветом должно быть легче, чем рисовать картинку маслом, ведь так?
И в этот момент, вы поймёте, что нейросети – это непредсказуемый инструмент.
Воспользоваться DALL·E 3 без vpn прямо в телеграм можно здесь: @FoxGPT_aibot
Играйте с разными идеями, уточняйте запросы, и вы обязательно найдёте подход, который будет работать именно для ваших нужд.