Руководство по использованию DALLE-3
Оглавление:
3. Как начать общение с ботом?
4. Промпты и правила их написания;
6. Чего ждать и избегать при общении с DALLE-3?
7. Отличие DALLE-3 от MidJourney и Stable Diffusion;
1. Что такое DALLE-3?
DALLE-3 - это модель генерации изображений по текстовому описанию, разработанная компанией OpenAI и является самой доступной из существующих графических нейросетей.
Графическая нейросеть обучена на более чем 500 миллионах изображений, что позволяет ей создавать рисунки в разных стилях.
2. Как работает DALLE-3?
В основе DALLE-3 лежит модель глубокого обучения — генеративная контрактивная сеть. Она состоит из двух основных компонентов: генератора и дискриминатора. Генератор создает изображения, а дискриминатор оценивает их качество.
Процесс обучения происходит во время создания изображения — генератор стремится создать такие сцены, которые дискриминатор не сможет отличить от настоящих изображений.
3. Как начать общение с ботом?
1. Найдите бота в Telegram. Откройте приложение и воспользуйтесь поиском, чтобы найти бота по этой ссылке - https://t.me/dalle_3_toe_bot
2. Перейдите в бота и начните диалог, нажав кнопку "Старт".
4. Промпты и правила их написания;
В прошлой статье про GPT-4 omni, тема промптов поднималась максимально подробно и понятно, но на всякий случай поясняем, что промпт - это всего лишь ваш запрос к нейросети, который служит целью получить желаемое изображение или текст. В нашем случае это изображение.
Чем чётче и правильнее будет прописан промпт, тем более точным будет результат.
Прежде, чем просить нейросеть сгенерировать фотографию, изучите несколько правил написания промптов:
- Выберите основу. Для начала нужно определить цель и понять, что именно вы хотите сгенерировать: человека, пейзаж, абстракцию, анимацию или же аниме-персонажа.
- Укажите стиль. Важно прописать, в каком стиле должно быть изображение — анимация, скетч, 3D, стиль любимого художника или что-то другое. Также можно прописать цвета изображения.
- Пропишите основные и второстепенные объекты. Здесь вы можете указать все объекты, которые хотите увидеть.
На этом создание промпта можно прекратить, так как нейросеть обладает навыком доработки запроса — она сама переписывает его так, чтобы алгоритму было понятно, что вы хотите получить.
Важно, что DALLE-3 не может сгенерировать изображения, которые содержат насилие или находятся «на грани» — повреждения человеческого тела, насилие, разрушения, эротические изображения.
5. Примеры промптов;
Разберем примеры двух промптов для генерации изображения: подробный с описанием деталей и краткий.
Первый промпт, который мы решили использовать, звучал так:
«Создай изображение природы и восходящего солнца над горами. В центре кадра должна быть высокая гора, покрытая снегом. Солнце должно находиться чуть выше горизонта, озаряя небо яркими лучами, создавая оранжево-розовое отражение на облачном фоне. Внизу кадра должен быть лес, окружающий горы. В сцене должен чувствоваться покой и умиротворение».
В итоге получилось такое изображение, как мы и запросили. В доработке оно не нуждается.
С другой стороны, краткий промпт для генерации изображения не структурирован.
Он не указывает на конкретные элементы или сюжет и оставляет все на усмотрение генератора.
В результате изображение, созданное из такого промпта, может быть беспорядочным, что не будет соответствовать ожиданиям пользователя.
6. Чего стоит ждать и избегать в работе с DALLE-3?
Ваши ожидания должны быть следующими:
- Я получу нужное мне фото, если напишу конкретный и четко сформулированный запрос.
- Нейросеть нарисует в том стиле, который я хочу, если я не забуду его указать.
- Нейросеть Dall-E 3 все еще может создавать изображения с некоторыми артефактами и искажениями. Например, у человека могут быть три глаза или рука с шестью пальцами.
- Нельзя генерировать знаменитостей и картинки в стиле художников, живших в последние сто лет. Решение было принято после судебных процессов, инициированных художниками.
- Размер изображений. Итоговая генерация выдается в формате 1024 × 1024 пикселя, увеличить ее нельзя.
- Нет функций INPAINT и DeepFace. Нейросеть не позволяет изменить детали на генерациях и менять лица.
7. Отличие DALLE-3 от MidJourney и Stable Diffusion
8. Как пополнить баланс
- Перейди в бота и нажми кнопку "start".
- Тыкни на кнопку "Личный кабинет".
- Зайди в раздел "Баланс" и нажми "Пополнить"
- Тебя перекинет в платёжного бота и там выбери сумму пополнения.
- После этого, откроется кнопка "Платёжная страница". Жми на неё и у тебя откроется страница с оплатой.
ПОСЛЕДНЯЯ ВЕРСИЯ DALLE-3 -> https://t.me/dalle_3_toe_bot