Как генерировать картинки в Midjourney. Гайд для новичков

В боте CatGPT можно создавать изображения в самой актуальной модели Midjourney V6.

Что такое промт

Промт — текстовое описание изображения, которое вы хотите сгенерировать. В нем можно указать, что вы хотите нарисовать, в каком стиле и какие детали изображения важны.

Вот основные советы, которые помогут вам составить эффективный запрос. Рассматриваем на примере CatGPT!

Базовые принципы хорошего промта

Используйте правильную команду

В CatGPT Bot запросы к Midjourney начинаются с команды /imagine.

Вы можете писать промпт на любом языке — русском, английском, французском, арабском или казахском. Если сомневаетесь — переведите промт на английский и вставьте результат.

Не просите ничего в промте

Midjourney рассматривает каждое слово в промте как потенциальное описание изображения, потому не нужно писать в запросе «Нарисуй мне...», «Создай изображение...», «Сгенерируй фото...», «Привет, Midjourney, сделай мне, пожалуйста фото с...» и т. д. Переходите сразу к сути.

Пишите коротко и ясно

Нейросеть лучше всего работает с простыми короткими фразами, описывающими то, что вы хотите увидеть. В описании будущего изображения избегайте длинных списков просьб и инструкций.

Будьте позитивными

Конечно, речь не о настроении, а о формулировках. Лучше описывать то, чего вы хотите, а не то, чего вы не хотите. Если вы попросите нарисовать вечеринку без торта, в сгенерированном изображении, скорее всего, будет торт.

Чтобы убедиться, что объекта нет в окончательном изображении, попробуйте использовать расширенный запрос с использованием параметра --no (подробнее об этом и других параметрах — в следующем разделе).

Уделите внимание контексту и деталям

Постарайтесь подробно объяснить любой контекст и детали, которые важны для результата. Вот примерный список того, что можно описать.

Субъект: человек, животное, персонаж, локация, предмет;

Материал: фотография, живопись, иллюстрация, скульптура;

Окружающая среда: в помещении, на улице, на Луне, под водой, в городе;

Освещение: мягкое, рассеянное, пасмурное, неоновое, студийное;

Цвет: насыщенный, яркий, однотонный, красочный, черно-белый;

Композиция: портрет, крупный план, вид с высоты птичьего полета.

Параметры генерации

Параметры позволяют влиять на процесс генерации и задавать различные свойства изображений. Они добавляются в конце промпта через два дефиса --

Наиболее полезные из них:

--ar 1:2 — сгенерирует изображение с соотношением сторон 1 к 2. Вместо 1:2 укажите необходимое вам значение. По умолчанию 1:1;

--stylize <число 0-1000> — художественная обработка изображения. Низкие значения стилизации позволяют получить изображения, которые более точно соответствуют запросу, но менее художественны. Высокие значения стилизации создают очень художественные изображения, но менее связанные с подсказкой. Значение по умолчанию 100;

--niji и --niji 6 — создает изображение в аниме стиле;

--chaos <число от 0 до 100> — влияет на то, насколько разнообразны исходные сетки изображений. Высокие значения дадут более необычные и неожиданные результаты и композиции. Более низкие значения дают более надежные и повторяемые результаты;

--no — сообщает Midjourney, что не следует включать в изображение. После параметра нужно указать список слов того, что вы не желаете видеть в сгенерируемом изображении;

--weird <число от 0 до 3000> — применяется для придания изображениям необыкновенных характеристик, что вызывает создание уникальных и непредсказуемых эффектов. Является экспериментальной функцией;

--style raw — обеспечивает создание более естественных и реалистичных изображений, сокращая эффект эстетической обработки Midjourney;

--sref random — придает изображению случайный стиль.

Примеры применения параметров

/imagine woman in skirt, sea, sunrise --ar 2:1

/imagine woman in skirt, sea, sunrise --ar 2:1 --stylize 700

/imagine woman in skirt, sea, sunrise --ar 2:1 --niji 6

/imagine woman in skirt, sea, sunrise --ar 2:1 --niji 6 --chaos 10

Что за кнопки появляются под изображениями и зачем они вам

После генерации

После генерации по промту бот выдает результат из четырех изображений, размещенных на единой картинке (как в примерах выше). Под этим результатом появляется ряд кнопок:

U1, U2, U3, U4 — для увеличения выбранного изображения. Эти кнопки не тратят купленные запросы к Midjourney.

V1, V2, V3, V4 — для генерации четырех новых вариантов выбранного изображения.

🔄 — для новой генерации изображений.

После увеличения изображения

После нажатия на кнопки U1, U2, U3, U4 нейросеть выдаёт новый результат — одно выбранное изображение. Под ним появляются новые кнопки:

🔼 Upscale (Subtle) — увеличивает разрешение изображения до 2048х2048.

🔼 Upscale (Creative) — увеличивает разрешение изображения до 2048х2048 и добавляет к нему новые детали.

🔍 Zoom Out 2x и 🔍 Zoom Out 1.5x — уменьшают масштаб изображения, позволяя увидеть больше деталей картинки.

⬅️ ➡️ ⬆️ ⬇️ — создают новое изображение, дорисовывая его в соответствующем направлении.

Тоже сделано в CatGPT)

Попробуйте написать свой первый классный промт для Midjourney в CatGPT Bot