Как генерировать картинки в Midjourney. Гайд для новичков
В боте CatGPT можно создавать изображения в самой актуальной модели Midjourney V6.
Что такое промт
Промт — текстовое описание изображения, которое вы хотите сгенерировать. В нем можно указать, что вы хотите нарисовать, в каком стиле и какие детали изображения важны.
Вот основные советы, которые помогут вам составить эффективный запрос. Рассматриваем на примере CatGPT!
Базовые принципы хорошего промта
Используйте правильную команду
В CatGPT Bot запросы к Midjourney начинаются с команды /imagine.
Вы можете писать промпт на любом языке — русском, английском, французском, арабском или казахском. Если сомневаетесь — переведите промт на английский и вставьте результат.
Не просите ничего в промте
Midjourney рассматривает каждое слово в промте как потенциальное описание изображения, потому не нужно писать в запросе «Нарисуй мне...», «Создай изображение...», «Сгенерируй фото...», «Привет, Midjourney, сделай мне, пожалуйста фото с...» и т. д. Переходите сразу к сути.
Пишите коротко и ясно
Нейросеть лучше всего работает с простыми короткими фразами, описывающими то, что вы хотите увидеть. В описании будущего изображения избегайте длинных списков просьб и инструкций.
Будьте позитивными
Конечно, речь не о настроении, а о формулировках. Лучше описывать то, чего вы хотите, а не то, чего вы не хотите. Если вы попросите нарисовать вечеринку без торта, в сгенерированном изображении, скорее всего, будет торт.
Чтобы убедиться, что объекта нет в окончательном изображении, попробуйте использовать расширенный запрос с использованием параметра --no (подробнее об этом и других параметрах — в следующем разделе).
Уделите внимание контексту и деталям
Постарайтесь подробно объяснить любой контекст и детали, которые важны для результата. Вот примерный список того, что можно описать.
Субъект: человек, животное, персонаж, локация, предмет;
Материал: фотография, живопись, иллюстрация, скульптура;
Окружающая среда: в помещении, на улице, на Луне, под водой, в городе;
Освещение: мягкое, рассеянное, пасмурное, неоновое, студийное;
Цвет: насыщенный, яркий, однотонный, красочный, черно-белый;
Композиция: портрет, крупный план, вид с высоты птичьего полета.
Параметры генерации
Параметры позволяют влиять на процесс генерации и задавать различные свойства изображений. Они добавляются в конце промпта через два дефиса --
--ar 1:2 — сгенерирует изображение с соотношением сторон 1 к 2. Вместо 1:2 укажите необходимое вам значение. По умолчанию 1:1;
--stylize <число 0-1000> — художественная обработка изображения. Низкие значения стилизации позволяют получить изображения, которые более точно соответствуют запросу, но менее художественны. Высокие значения стилизации создают очень художественные изображения, но менее связанные с подсказкой. Значение по умолчанию 100;
--niji и --niji 6 — создает изображение в аниме стиле;
--chaos <число от 0 до 100> — влияет на то, насколько разнообразны исходные сетки изображений. Высокие значения дадут более необычные и неожиданные результаты и композиции. Более низкие значения дают более надежные и повторяемые результаты;
--no — сообщает Midjourney, что не следует включать в изображение. После параметра нужно указать список слов того, что вы не желаете видеть в сгенерируемом изображении;
--weird <число от 0 до 3000> — применяется для придания изображениям необыкновенных характеристик, что вызывает создание уникальных и непредсказуемых эффектов. Является экспериментальной функцией;
--style raw — обеспечивает создание более естественных и реалистичных изображений, сокращая эффект эстетической обработки Midjourney;
--sref random — придает изображению случайный стиль.
Примеры применения параметров
Что за кнопки появляются под изображениями и зачем они вам
После генерации
После генерации по промту бот выдает результат из четырех изображений, размещенных на единой картинке (как в примерах выше). Под этим результатом появляется ряд кнопок:
U1, U2, U3, U4 — для увеличения выбранного изображения. Эти кнопки не тратят купленные запросы к Midjourney.
V1, V2, V3, V4 — для генерации четырех новых вариантов выбранного изображения.
🔄 — для новой генерации изображений.
После увеличения изображения
После нажатия на кнопки U1, U2, U3, U4 нейросеть выдаёт новый результат — одно выбранное изображение. Под ним появляются новые кнопки:
🔼 Upscale (Subtle) — увеличивает разрешение изображения до 2048х2048.
🔼 Upscale (Creative) — увеличивает разрешение изображения до 2048х2048 и добавляет к нему новые детали.
🔍 Zoom Out 2x и 🔍 Zoom Out 1.5x — уменьшают масштаб изображения, позволяя увидеть больше деталей картинки.
⬅️ ➡️ ⬆️ ⬇️ — создают новое изображение, дорисовывая его в соответствующем направлении.
Попробуйте написать свой первый классный промт для Midjourney в CatGPT Bot