Краткое руководство по созданию фотореалистичных картинок для нейросети Stable Diffusion и Midjourney
В этом руководстве я поделюсь процессом, которому следую я лично, когда придумываю запрос для создания изображений.
Все примеры я буду специально создавать в приложении PlaygroundAI, так как среди бесплатных и доступных оно самое функциональное. И его достаточно легко и быстро можно освоить.
- Процесс создания запроса
- Шаг 1. Субъект
- Шаг 2. Пол
- Шаг 3. Внешний вид / одежда
- Шаг 4. Композиция
- Шаг 5. Местность / задний план
- Шаг 6. Тип изображения
- Шаг 7. Негативный запрос
- Первичный результат:
- Шаг 8. Добавляем детали
- Вот и все! Ваше изображение готово!
Пример изображения, созданного нейросетью:
Процесс создания запроса
Шаг 1. Субъект
Первое, что я делаю - это определяюсь с субъектом. Другими словами - с главным действующим лицом моего запроса.
Так как я предпочитаю создавать портретные изображений, то моим субъектом является какой-то персонаж, являющийся человеком или очень на него похожий. Как-минимум, имеющий человеческое лицо.
- Воин (warrior)
- Эльф (elf)
- Маг (mage или wizard)
- Солдат (soldier)
- Король (king)
- Киборг (cyborg)
- Викинг (viking)
Шаг 2. Пол
Часто перед субъектом я уточняю его пол. Ведь нейросети может быть непонятно какого пола должен быть пират или воин, которого нужно нарисовать.
Перед субъектом я добавляю male (мужской род) или female (женский род).
Шаг 3. Внешний вид / одежда
Определившись с субъектом, я добавляю описание его внешнего вида.
Например, если я изображаю война, то опишу, что он в доспехах. Если маг, то в робе в шляпе мага.
- A male mage wearing a robe and a witch hat (маг, одетый в робу и шляпу ведьмы)
- A male warrior wearing a steel armor (воин одетый в стальную броню)
- A male pirate wearing a pirate vest (пират, одетый в пиратский жилет)
Иногда я могу проигнорировать описание одежды и дать нейросети самой пофантазировать или дать очень общее описание. Например:
A male pirate wearing a pirate clothing (пират одетый в пиратскую одежду)
Но как правило, описание одежды улучшает запрос и позволяет избежать ракурсов без тела (когда в кадре одна голова).
Шаг 4. Композиция
Перед каждый запросом я всегда пишу “a portrait of”. Переводится как портрет. “Of” в английском языке является связкой подразумевающей, что портрет кого-то, о ком речь идет дальше.
Например A portrait of a male warrior wearing a steel armor (портрет война, одетого в стальной доспех).
Такое небольшой дополнение приводит к тому, что нейросеть чаще выдает нам портретную композицию. Без этой приписки наш персонаж может часто стоять к нам спиной или боком. Или находиться слишком далеко.
Шаг 5. Местность / задний план
После описания внешности я добавляю описание местности, где находится наш субъект.
Есть 2 способа описания этой местности, которые я использую. Первый выглядит так:
- In the space ship (на космическом корабле)
Второй способ выглядит следующим образом:
- Forest in the background (лес на фоне)
- Mountains in the background (горы на фоне)
- Spaceship in the background (космический корабль на фоне)
Трудно сказать какой из этих способов лучше. Это обычно предмет экспериментов.
Обычно перед описанием местности я ставлю запятую. Как и перед описанием одежды. Это не обязательно, но помогает лучше потом воспринимать визуально запрос.
A portrait of a male warrior, wearing armor, in the forest (портрет война, одет в доспех, в лесу)
A portrait of a pirate wearing a black vest, on the ship (портрет пирата, одетого в черный жилет, на корабле)
Шаг 6. Тип изображения
Наконец, последней основной частью запроса является тип изображения.
Обычно в конце запроса я указываю тип изображения. Но иногда добавляю его вначале, если вижу, что нейросеть его недостаточно хорошо воспринимает.
- A portrait of a male pirate wearing a black vest, on the ship, digital painting (портрет пирата, одетого в черный жилет, на корабле, цифровая картина).
- A portrait of a male warrior, wearing armor, in the forest, a photography (портрет война, одет в доспех, в лесу, фотография)
Шаг 7. Негативный запрос
Уже на этом этапе я обычно начинаю рисовать то, что у меня получилось.
Но перед этим обязательно добавляю негативный запрос.
Главное слово в моем негативном запросе - это disfigured (уродливый).
По какой-то неведомой причине - это очень сильное слово, которое в положительную сторону влияет на результат.
- text (чтобы он не пытался писать текст)
- Signature (подпись - чтобы не пытался ее ставить)
- Double heads (двойные головы - сокращает вероятность их появления)
- Black and white, b&w (снижает шансы на появление черно-белых изображений)
- Cartoon (если я не хочу, чтобы нейросеть искажало изображение в стиле мультиков)
- Oversaturated (сокращает шанс появления картинок перенасыщенных цветом)
У некоторых в негативном запросе используется гораздо больше слов, но я не замечал положительных эффектов от этого.
Вот мой типичный негативный запрос:
disfigured, double heads, text, signature, black and white, oversaturated
Если вы создаете изображения в публичном приложении вроде Playground и при этом рисуете женщину, то рекомендую добавить в негативный запрос слово nude (обнаженный), что значительно снизит число моментов, когда нейросеть будет ругаться и не выдавать результат, сообщая о том, что сработала защита от недопустимого контента.
И тогда ваш стандартный негативный запрос может выглядеть так:
disfigured, double heads, text, signature, black and white, oversaturated, nude
Первичный результат:
А вот что у меня получилось нарисовать в сервисе PlaygroundAI с первого раза по запросу:
- A portrait of a male warrior, wearing armor, in the forest, a photography
Если объект слишком часто находится далеко, то после его описания, я добавляю detailed face или highly detailed face (детализированное лицо или высоко детализированное лицо).
Это также часто спасает от проблемы, что воин рисуется в шлеме (конечно если мы этого не хотим). Шлем также можно прописать в негативном запросе.
Шаг 8. Добавляем детали
А позже начинаю добавлять детали, которые позволяют сделать изображение еще более интересным.
Например, мне нравится добавлять солнечные лучи (sun rays).
A portrait of a male warrior, wearing armor, highly detailed face, in the forest, sun rays, a photography
Солнечные лучи будут появляться не всегда. Часто их не будет видно в явном виде, однако свет и тени будут более интересными.
Можно попробовать добавить известных фотографов, что иногда помогает сделать изображения более интересными.
Например, я люблю добавлять фотографа Олега Оприско.
A portrait of a male warrior, wearing armor, highly detailed face, sun rays, in the forest, sun rays, a photography by Oleg Oprisco
Имейте ввиду, что упоминание фотографа влияет не только на общий стиль съемки, но и на то, как выглядят люди, на их лица и на объекты вокруг.
Например, при использования стиля Олега Оприско, воин по-умолчанию часто становится без более молодым и без бороды.
А вот при использования фотографа Стива МакКари (Steve McCurry), воин часто имеет восточную внешность.
Однако, это совсем не значит, что вы не сможете создать война с европейской внешности
при использовании стиля этого фотографа. Достаточно уточнить тип внешности в запросе:
A portrait of a male warrior, 30 years old, european, blonde long hairs, wearing armor, highly detailed face, sun rays, in the forest, sun rays, a photography by Steve McCurry
Если вы хотите рисованное изображение, то имеет смысл сразу уточнять художников.
Например, самый часто используемый художник - это Greg Rutkowski. С него можно и начать.
A portrait of a male warrior, 30 years old, european, blonde long hairs, wearing armor, highly detailed face, sun rays, in the forest, sun rays, a digital painting by Greg Rutkowski