June 4

Руководство по использованию DALLE-3

Оглавление:

1. Что такое DALLE-3?

2. Как работает DALLE-3?

3. Как начать общение с ботом?

4. Промпты и правила их написания;

5. Примеры промптов;

6. Чего ждать и избегать при общении с DALLE-3?

7. Отличие DALLE-3 от MidJourney и Stable Diffusion;

8. Как пополнить баланс

Время чтения - 5 минут.

1. Что такое DALLE-3?

DALLE-3 - это модель генерации изображений по текстовому описанию, разработанная компанией OpenAI и является самой доступной из существующих графических нейросетей.

Графическая нейросеть обучена на более чем 500 миллионах изображений, что позволяет ей создавать рисунки в разных стилях.

2. Как работает DALLE-3?

В основе DALLE-3 лежит модель глубокого обучения — генеративная контрактивная сеть. Она состоит из двух основных компонентов: генератора и дискриминатора. Генератор создает изображения, а дискриминатор оценивает их качество.

Процесс обучения происходит во время создания изображения — генератор стремится создать такие сцены, которые дискриминатор не сможет отличить от настоящих изображений.

Промпт: «Портрет молодой девушки, стиль реализм, размытый футуристичный фон, студийное качество»

3. Как начать общение с ботом?

1. Найдите бота в Telegram. Откройте приложение и воспользуйтесь поиском, чтобы найти бота по этой ссылке - https://t.me/dalle_3_toe_bot
2. Перейдите в бота и начните диалог, нажав кнопку "Старт".

4. Промпты и правила их написания;

В прошлой статье про GPT-4 omni, тема промптов поднималась максимально подробно и понятно, но на всякий случай поясняем, что промпт - это всего лишь ваш запрос к нейросети, который служит целью получить желаемое изображение или текст. В нашем случае это изображение.

Чем чётче и правильнее будет прописан промпт, тем более точным будет результат.

Прежде, чем просить нейросеть сгенерировать фотографию, изучите несколько правил написания промптов:

  1. Выберите основу. Для начала нужно определить цель и понять, что именно вы хотите сгенерировать: человека, пейзаж, абстракцию, анимацию или же аниме-персонажа.
  2. Укажите стиль. Важно прописать, в каком стиле должно быть изображение — анимация, скетч, 3D, стиль любимого художника или что-то другое. Также можно прописать цвета изображения.
  3. Пропишите основные и второстепенные объекты. Здесь вы можете указать все объекты, которые хотите увидеть.

На этом создание промпта можно прекратить, так как нейросеть обладает навыком доработки запроса — она сама переписывает его так, чтобы алгоритму было понятно, что вы хотите получить.

Важно, что DALLE-3 не может сгенерировать изображения, которые содержат насилие или находятся «на грани» — повреждения человеческого тела, насилие, разрушения, эротические изображения.

5. Примеры промптов;

Разберем примеры двух промптов для генерации изображения: подробный с описанием деталей и краткий.

Первый промпт, который мы решили использовать, звучал так:

«Создай изображение природы и восходящего солнца над горами. В центре кадра должна быть высокая гора, покрытая снегом. Солнце должно находиться чуть выше горизонта, озаряя небо яркими лучами, создавая оранжево-розовое отражение на облачном фоне. Внизу кадра должен быть лес, окружающий горы. В сцене должен чувствоваться покой и умиротворение».

В итоге получилось такое изображение, как мы и запросили. В доработке оно не нуждается.

Изображение по заданному промпту

С другой стороны, краткий промпт для генерации изображения не структурирован.

Он не указывает на конкретные элементы или сюжет и оставляет все на усмотрение генератора.

В результате изображение, созданное из такого промпта, может быть беспорядочным, что не будет соответствовать ожиданиям пользователя.

Промпт: "Нарисуй гору на восходе солнца, розовый свет, добавь снег".

6. Чего стоит ждать и избегать в работе с DALLE-3?

Ваши ожидания должны быть следующими:

  1. Я получу нужное мне фото, если напишу конкретный и четко сформулированный запрос.
  2. Нейросеть нарисует в том стиле, который я хочу, если я не забуду его указать.

Ну и так далее...

Чего стоит избегать:

  1. Нейросеть Dall-E 3 все еще может создавать изображения с некоторыми артефактами и искажениями. Например, у человека могут быть три глаза или рука с шестью пальцами.
  2. Нельзя генерировать знаменитостей и картинки в стиле художников, живших в последние сто лет. Решение было принято после судебных процессов, инициированных художниками.
  3. Размер изображений. Итоговая генерация выдается в формате 1024 × 1024 пикселя, увеличить ее нельзя.
  4. Нет функций INPAINT и DeepFace. Нейросеть не позволяет изменить детали на генерациях и менять лица.

7. Отличие DALLE-3 от MidJourney и Stable Diffusion

8. Как пополнить баланс

  1. Перейди в бота и нажми кнопку "start".
  2. Тыкни на кнопку "Личный кабинет".
  3. Зайди в раздел "Баланс" и нажми "Пополнить"
  4. Тебя перекинет в платёжного бота и там выбери сумму пополнения.
  5. После этого, откроется кнопка "Платёжная страница". Жми на неё и у тебя откроется страница с оплатой.

ПОСЛЕДНЯЯ ВЕРСИЯ DALLE-3 -> https://t.me/dalle_3_toe_bot