March 1, 2024

Базовые и легкие генерации в Midjourney

В этой статье мы расскажем про логику прописывания промтов, а также расскажем про базовые и легкие генерации, на которых вы научитесь самостоятельно управлять MJ.

А именно генерировать:

- простые элементы (например, сердечко, цветочек, фотокамера, яблоко и т.д.)

- открытки к праздникам (8 марта, 14 февраля, пасха и т.д.)

- фоны-подложки под ваши товары (например, вы рекламируете косметику и можете сделать красивый фон в Mj, а в фотошопе прикрепить ваш товар на данный фон)

Почему важно идти по уровням и следовать инструкциям?

бОльшая вероятность успешной генерации с первого раза.

Рассмотрим, как правильно делать базовые запросы в Mj на конкретных примерах генераций и для чего они вам могут пригодиться.

Логика генерации простых элементов на базовом уровне

Под базовыми (простыми) запросами мы понимаем такие запросы, которые можно описать одним или двумя словами, а также с уточнением, в каком именно стиле вы хотите видеть конечный результат.

Базовые генерации можно сравнить с поиском в Гугл. Вы просто вводите запрос и получаете результат запроса без какого-либо контроля.

Такие объекты могут понадобиться для какой-либо визуализации ваших постов.

Например, “Рыжий кот”, “Выделанная кожа”.

Базовый запрос делится на 3 уровня сложности прописывания промта:

—  1 уровень — запрос.

Например, «кот», «рыжий кот».

—  2 уровень — запрос + запрос.

Например, «рыжий кот, черный фон».

—  3 уровень — запрос + запрос + стиль.

Например, «рыжий кот, черный фон, в стиле Ван Гога».

Общую логику составления запроса на базовом уровне можно описать так — мы делаем запрос какого конкретного предмета/ситуации, а дальше «навешиваем» на этот запрос какие-то уточнения.

Но(!) все только кажется совсем очевидным, на самом деле даже в базовом уровне нужно подключать некий контроль. Влиять на результат могут тонкости перевода и иные факторы.

Генерация простых объектов: сложности.

От перемены мест слагаемых в Midjourney сумма МЕНЯЕТСЯ.

Аксиома: ОБЪЕКТ + уточнение

MJ приоритизирует объекты и уточнения в запросе по порядку.

То есть первым делом генерируется то, что стоит в начале запроса.

Это может стать не только сложностью, но и спасением, если запомнить эту аксиому и применять намеряно для контроля генерации.

Если мы размещаем «черный фон» в запросе сначала, MJ выдает более темную картинку с преобладанием черного + процент площади занимаемой котом меньше.

Если мы пишем «стиль Ван Гога» вначале запроса, изображение само по себе сильнее начинает напоминать узнаваемый почерк художника, а кот становится второстепенным персонажем + необязательно полностью рыжим.

Не достаточно наглядно? Так это запросы очень простые, давайте усложним)

При нагромождении различных запросов и уточнений Mj становится тяжелее и она начинает воспринимать фразу отдельными кусками.

Если мы указываем вначале запроса модель фотоаппарата, Mj рисует фотоаппарат.

Если мы в начале фразы указываем объект «кот», а уже затем модель фототехники, Mj делает «снимок» объекта (кота) на этот фотоаппарат.

Тонкости перевода

Аксиома: обращайте внимание на разные варианты перевода одного слова и делайте дубли запросов - один из них понравится вам больше других

Рассмотрим ситуацию, когда одно и то же слово на русском переводится по-разному на английский и что делать в таком случае с генерациями.

Один из удобных и бесплатных переводчиков на «разный» английский (американский язык, фразеологизмы и прочее) https://www.deepl.com

Заходим в переводчик и вбиваем “рыжий кот”. Нам предлагается несколько вариантов перевода:

- red cat;

- ginger cat;

- orange cat.

Переходим к генерации, для этого:

1) заходим в discord, открываем Mj
2) вводим: «/imagine prompt»

3)  прописываем все 3 варианта написания и получаем результат:

—  red cat

—  ginger cat

—  orange cat

Как будет выглядеть запрос в 4 версии Midjourney:

Как будет выглядеть запрос в 5 версии Midgourney:

Промежуточные итоги по данному примеру:

·         “Рыжий” можно перевести на английский в 3-х разных вариациях: red, ginger или orange. В зависимости от того, какое именно слово на английском вы вводите — такой результат и получаете.

·         Заранее нельзя спрогнозировать, какой из вариантов окажется лучше, это можно узнать только опытным путем, т.е. сделав запросы со всеми вариантами и выбрать наилучший.

Для того, чтобы смотреть разные вариации перевода мы рекомендуем переводчик https://www.deepl.com

В нашем случае лучше всего сработал запрос «ginger», и он чаще всего используется в литературном английском при описании цвета волос.

Несмотря на то, что 5 версия выдает максимально реалистичные картинки, даже в ней вышло так, что по запросу «ginger cat» и «orange cat» Mj сгенерировать несколько нереалистичных вариантов картинок.

Это еще раз подтверждает тот факт, что для данного запроса подходит вариант "ginger cat".

Устоявшиеся названия

Похожий «баг» на различия перевода, но немного о другом)

Mj понимает устоявшиеся выражения/ названия. Если требуемое вам изображение в запросе содержит подобные фразы, просто перефразируйте их части.

Сгенерируем 3 разных варианта картинок:

- океан по мнению нейросети;

- конкретно Тихий океан;

- Тихий Океан в стиле Винсента ван Гога.

Прописываем запросы и получаем результат:

—prompt Ocean

—  Pacific ocean

—  Pacific Ocean, Vincent van Gogh style

Обратите внимание, океан всегда генерируется именно буйный — по реальному свойству Тихого океана. Не помогают даже уточнения.

Тихий океан по мнению 4 версии mj:

Тихий океан по мнению 5 версии mj:

Как видим, обе версии mj генерируют одинаково буйный океан, на 2 генерации он вроде похож на спокойный, но маленькие волнения все равно присутствуют + он показал нам Тихий океан из космоса. Это не то, что нам нужно.

Если вам нужен реально тихий, то есть спокойный океан, то так и пишите «спокойный» или «штиль в океане»)

«calm ocean» в 4 версии mj Теперь обе версии нас понимают.

Так же показательно видна эта особенность на запросе «большое яблоко»

Большое яблоко — Mj понимает, что у Нью-Йорка есть такое прозвище. Большое яблоко в 4 версии mj:

Нейросеть обязательно лепит элементы города к изображению Большое яблоко в 5 версии mj:

В 5 версии нейросеть также лепит элементы города к изображению.

В 5 версии нейросеть восприняла запрос «a big apple on a tree» более точно, однако яблоко выглядит нереалистично и как отдельная от дерева часть.

Уточним запрос:

Сравнение запросов «Большое яблоко на дереве» и «Крупное яблоко на дереве» в 4 версии Mj

Уточнение запроса:

бренды и конкретизация объекта

Аксиома: что бы не получить усредненный в вакууме объект, всегда конкретизируйте его цвет/форму/марку/бренд/модель/породу и т.д.

Не абы какой «имбирный кот», а непременно персидский или сфинки (да, они тоже бывают рыжими))

Для кота «бренд» — это его порода. Генерация рыжих котов в 4 версии Mj

Видно, что в 5 версии Mj не очень удачно сгенерировала сфинкса.

Рассмотрим пример генерации, где важно уточнение на запросе «мобильный телефон»

Наша задача сделать:

- телефон по мнению нейросети;

-  айфон по мнению нейросети;

-  и конкретно айфон 11 модели.

Прописываем запросы и получаем результат:

—  Cell phone

—  iphone

—  iphone 11

Генерации мобильных телефонов в 4 версии Mj:

Генерации мобильных телефонов в 5 версии Mj:

Как мы видим обе версии хорошо понимают запрос, если уточнить, какой конкретный телефон нам нужен.

Промежуточные итоги по данному примеру:

Если вы заранее знаете, какой простой объект вам нужен — лучше сразу уточните то, что может помочь нейросети лучше понять вас.

Неизвестно каких «референсов» у нейронки было больше. Пример с котом показывает, что сферический в вакууме «кот» для нейросети это что-то среднее между мейн-куном и диванным гладкошерстным. А сферический в вакууме телефон — батина трубка из нулевых)

Это очень важный итог, потому что в дальнейшем от того, насколько точно вы подберете описание, будет сильно зависеть конечный итог.

Неудачные попытки уточнений —проблема на этапе обучения ИИ.

Не все уточнения работают, у Mj проблема с 2d изображениями

Есть уточнения, которые работают не так, как вы себе заранее представляете. В мире MJ 4 версии не существует 2d котов)

—  cat

—  cat, 2 d

—  cat, 3 d

А вот как выглядят коты в 5 версии:

5 версия воспринимает стили слишком буквально, 2d кот действительно нарисован, но нарисован либо графически, либо слишком реалистично. 3d кот и вовсе изображен в процессе создания в 3D редакторе.

Пример генерации, когда простого уточнения недостаточно для получения нужного результата на запросе «сердечко».

Наша задача получить 3 разных вариации сердечек в разных формах, а именно:

- то, что предложит сама нейросеть;

- 3д объект;

- 2д объект.

Прописываем запросы и получаем результат:

—  Red Heart

—  Heart, 3d

—  Heart, 2d

Генерация сердечек в 4 версии Mj:

У нас получилось 3 практически одинаковых варианта картинок. Генерация сердечек в 5 версии Mj:

То же самое, получаем почти все одинаковые варианты сердечек. В 2d версии mj вроде как попробовал сделать рисованные сердечки, но они получились пиксельные и все равно там есть отсылка к 3d стилю в виде рисованных теней.

Промежуточные итоги:

Для генерации определенного стиля или вида объекта не достаточно ввести в конце 3д или 2д. Этих исходных данных мало для того, чтобы получить нужный нам результат.

На этом этапе мы не будем добиваться идеального варианта, так как для его достижения нам нужно задействовать следующие уровни сложности промта (4 и 5 уровень). Про это мы расскажем дальше.

Пруф, что сделать похожие на предполагаую 2d стилискику арты в обеих версиях все же можно, но многим сложнее простого уточнения «2d»

Версия 4

Промежуточные итоги:

Нейросеть отлично понимает многие уточнения. В случае с Тихим океаном мы видим, что несмотря на то, что “Pacific” переводится, как “мирный” или “спокойный”, нейросеть все равно выдала нам верный результат. А все, потому что Тихий океан совсем не тихий)

Выводы по базовой генерации

1.      В базовой генерации в большинстве случаев интереснее всего получить результаты, которые предлагает нейросеть.

2.      В зависимости от точности перевода запроса будут получаться разные результаты генерации.

3.      В зависимости от очередности слов в запросе будут разные результаты генерации

4.      Чтобы получить более конкретный и подходящий результат, нужно дописывать уточнения

5.      Нейросеть не всегда понимает, что от нее хотят с первого раза. Иногда нужны более сильные уточнения

6.      Нейросеть хорошо имитирует стили художников (забежим наперед, еще и стили фильмов/режиссеров/компьютерных игр и т.д.)

7.      Нейросеть хорошо понимает названия объектов, которые знают все.

Эти 7 выводов нужны нам для базового понимания нейросети. От этой базы мы будем отталкиваться в дальнейших генерациях.

Все генерации раздела в 4 версии в большом размере:

Все генерации раздела в 5 версии в большом размере:

Любительский уровень

Усложним запросы и научимся генерировать открытки к праздникам и фоны для ваших товаров

Логика генерации на любительском уровне сложности

Вернемся к таблице:

На базовом уровне мы научились генерировать картинки по следующей схеме: «ЗАПРОС

+ УТОЧНЕНИЕ + СТИЛЬ»

На любительском уровне сложности добавляется два уровня контроля изображения:

·         контроль визуала;

·         контроль освещения.

На базовом уровне мы получали результат, который предлагала нам нейросеть. На любительском уровне мы будем добиваться конкретного результата с помощью усиления “контроля” над генерациями.

“Контроль” в кавычках, потому что несмотря на точность запроса, нейросеть всё равно будет предлагать нам разные варианты. Поэтому мы используем нейросеть для создания креативов, а не берем реальную фотографию и делаем с ней стандартный дизайн.

Запрос на любительском уровне мы разделили на 5 уровней сложности прописывания промта:

—  1 уровень — запрос

Например, «кот»

—  2 уровень — запрос + запрос

Например, «рыжий кот, черный фон»

—  3 уровень — запрос + запрос + стиль

Например, «рыжий кот, черный фон, в реалистичном стиле»

—  4 уровень — запрос + запрос + стиль + контроль визуала

Например, «рыжий кот, черный фон, в реалистичном стиле, крупным планом»

—  5 уровень - запрос + запрос + стиль + контроль визуала + контроль освещения

Например, «рыжий кот, черный фон, в реалистичном стиле, крупным планом, солнечное освещение»

Даже если прочитать запрос и не видеть результат генерации, всё равно довольно точно можно представить эту картину в голове. Нейросеть также лучше поймет нас и сделает более точную генерацию.

В этом и есть главный смысл «любительского» уровня сложности — сделать более-менее контролируемую генерацию.

Какие типы генерации мы относим к этому уровню:

На этом уроке, помимо базовых разберем и легкие генерации, к ним мы отнесли такие генерации, которые проще всего сделать примерно с 5 запросов и при этом, нейросеть отлично понимает, что мы хотим от нее, это:

- открытки к праздникам;

- фоны и подложки под товары.

Любительский уровень. Детальное управление генерацией

Идея - атомарные части идеи - конкретизация промта.

Задача № 1: точно понять что вы хотите увидеть

Задача № 2: разложить образ на отдельные части и понять какие должны быть главными, а какие второстепенными

Задача № 3: грамотно расположить эти части в промте соблюдая порядок приоритета и детализации

Генерация открыток 8 марта —управление светом и качеством картинки

Цель: получить картинку, на которой будет цифра 8 и цветочки, как это обычно бывает на поздравлениях с 8 марта.

Шаг 1 — Введем 1 уровень промта — запрос «8 марта»

March 8

Запрос «march 8» в 4 версии mj

Видим, что нейросеть не совсем точно понимает, что значит 8 марта. В 4 версии она выдает машину, постапокалиптическую картинку и 2 девушки. В 5 версии нейросеть пытается сгенерировать календарь.

Значит нам надо уточнить, что именно мы имеем ввиду.

Шаг 2 — Введем 2 уровень промта с уточнением — запрос «8 марта, международный женский день»

— March 8, international women's day

Запрос «March 8, international women's day» в 4 версии Mj

Нейросеть зацепилась за слово «women» и теперь мы видим женщину на картинке. Вероятно, нейросеть пытается показать основоположника этого праздника.

Шаг 3 — Вводим 3 уровень и прописываем стиль — запрос «8 марта, международный женский день, в реалистичном стиле»

— March 8, international women's day, realistic style

Запрос «March 8, international women's day, realistic style» в 4 версии Mj

Мы видим, что нейросеть в 4 версии окончательно перестала нас понимать, так как мы вбили 3 совершенно разные фразы (по мнению нейросети), и она просто генерирует нам изображения на своё усмотрение, зацепившись за фразу «international women's day».

В 5 версии нейросеть вроде бы немного поняла, что мы имели ввиду, но картинки все разноплановые и вместо цифры 8 там появились числа 30, 90 и 91.

С точки зрения нейросети всё верно:

- цифра 8 есть. Даже в виде небольшого «артефакта» на изображении;

- женщина есть;

- даже цветы есть;

- отсылка к основоположнице праздника есть.

Артефакт на изображении — это любая черта, не присутствующая в отображаемом объекте, но присутствующая на изображении. Другими словами — это искажения.

Но, когда мы вбивали запрос, мы представляли совершенно другой результат. А значит, чтобы сгенерировать нужное нам изображение, нужно идти по другой логике.

Напоминаем, что мы хотели добиться, чтобы на изображении была цифра 8, а также цветочки. Повторим все шаги заново.

Шаг 1 — Вводим 1 уровень промта — запрос «цифра 8»

— number 8

Запрос «number 8» в 4 версии Mj

Так как нам нужна цифра 8, то так и вводим в запрос. В 4 версии получаем на выходе цифру 8 без каких либо сильных искажений. В 5 же версии нейросеть начала коверкать цифру 8 и даже после нескольких генераций она выдает странный результат — из 4 вариантов цифра 8 только на 1 картинке.

Шаг 2 — Вводим 2 уровень промта — запрос «Белая цифра 8, на фоне цветы»

— white number 8, on the background of flowers

Запрос «white number 8, on the background of flowers» в 4 версии Mj

Мы уточнили, что хотим видеть именно белую цифру 8, а также цветы на заднем фоне. Уже на этом этапе мы получаем более-менее нужную для нас картинку.

Картинка в 4 версии выглядит более интересной, чем в 5. Плюс ко всему 5 версия упорно пытается вместо цифры 8 сгенерировать цифру 3.

Делаем вывод — чтобы получить конкретное изображение, нужно «раскладывать» идею на составные части.

В нашем случае 8 марта — это цифра “8” и надпись “марта”

Шаг 3 — Вводим 3 уровень промта — запрос «белая цифра 8, на фоне цветы, в реалистичном стиле»

— white number 8, on the background of flowers, realistic style

Запрос «white number 8, on the background of flowers, realistic style» в 4 версии Mj

Картинка стала более «живая», добавилось больше теней и глубины. Нейросеть воспринимает «реалистичный стиль» с той точки зрения, что добавляет больше текстур и глубины изображения.

В целом, уже на этом этапе мы получили картинку, которая нас полностью устраивает как в 4 версии, так и на 5 версии. Но нам интересно посмотреть, как нейросеть будет выдавать картинку в разных стилях.

Для этого поменяем «реалистичный стиль» на «3д графику»

— white number 8, on the background of flowers, 3d, unreal engine

Запрос «white number 8, on the background of flowers, 3d, real engine» в 4 версии Mj 5 версия все еще активно пытается сделать цифру 3 вместо цифры 8.

Или на «векторную графику»

— white number 8, on the background of flowers, vector graphics

Запрос «white number 8, on the background of flowers, vector graphics» в 4 версии Mj

Допустим, нам нравится, как нейросеть рисует изображение в стиле векторной графики. Оставляем этот вариант и усложняем запрос дальше.

Шаг 4 — Вводим 4 уровень промта — запрос «белая цифра 8, цветы на фоне, векторная графика, детали, больше света»

— white number 8, on the background of flowers, vector graphics, detailed, uplight

Запрос «white number 8, on the background of flowers, vector graphics, detailed, uplight» в 4 версии Mj

В этом варианте мы добавили уточнение — «detailed», благодаря которому изображение стало более детализированное. Это видно, когда начинаешь всматриваться.

А также добавили контроль света с помощью добавления запроса «uplight». Благодаря этому запросу освещение на изображении стало более контрастное и вы можете увидеть луч света.

Шаг 5 — Вводим 5 уровень промта — для того, чтобы сделать изображение не квадратным, а в привычном нам формате 16:9, добавляем в конце запроса --ar 16:9.

— white number 8, on the background of flowers, vector graphics, detailed, uplight --ar 16:9

Запрос «white number 8, on the background of flowers, vector graphics, detailed, uplight --ar 16:9» в 4 версии Mj

В итоге мы получили нужное нам изображение в 4 версии.

В 5 версии нейросеть выдала нам 2 картинки с цифрой 8 из 4х и при этом они оказались обрезанные. Поэтому будем использовать изображения из версии 4.

Промежуточный итог примера генерации открытки:

·         если хотите видеть конкретные элементы на изображении, то описываете их так, как будто бы описываете в отрыве от общего изображения. Как в нашем случае с “8 марта” и “цифра 8”

·         При одинаковом запросе, но разных стилях получатся похожие изображения, но форма, детализация, расположение может меняться. Используйте это в своих целях, чтобы достичь нужного результата

·         Контроль освещения может дать нам более интересную картинку практически в любом случае. Иначе вы оставляете это на усмотрение нейросети.

·         Если хотите поменять формат генерации, то в конце добавьте запрос «-- ar» и введите соотношение сторон.

·         Для генерации открытки к 8 марта нам больше подойдет 4 версия Mj, так как она понимает нас более точно и делает более художественную генерацию.

1 мая праздник Весны и Труда — использование образца референса для генерации.

Пока что мы не совсем понимаем, какое именно изображение хотим видеть. Но на нем точно должна быть символика СССР, цветы и, если получится, девушки.

Шаг 1 и 2 — Вводим 1 и 2 уровни промта — пробуем дословно вбить название праздника

«Праздник Весны и Труда»

— Holiday spring and labor

Запрос «Holiday spring and labor» в 4 версии Mj

И мы получаем весенние цвета, а также процесс работы. Как мы вбили дословно запрос, так и нейросеть нам дословно выдала ответ

Шаг 3 — Вводим 3 уровень промта — запрос «Праздник Весны и Труда в стиле СССР»

— Holiday spring and labor, in the style of the USSR

Запрос «Holiday spring and labor» в 4 версии Mj

Стало лучше, мы уже видим стилистику, в которой делали открытки и рисунки в СССР.

Шаг 4 — Вводим 4 уровень промта — добавляем еще одно уточнение по визуалу — запрос «Праздник Весны и Труда в стиле СССР, открытка»

—  Holiday spring and labor, in the style of the USSR, greeting card

Запрос «Holiday spring and labor, in the style of the USSR, greeting card» в 4 версии Mj Получаем форму открытки, но всё равно содержание всё еще не такое, как нам нужно Промежуточный итог по генерации примера открытки к 1 мая:

·         мы чаще всего видим девушку;

·         мы видим цветы ;

·         картинка в форме открытки ;

·         стилистика отдаленно похожа на иллюстрации, которые делали в СССР .

Давайте перенесем этот итог в схему, где “разложим” картинку на составляющие. Это нужно для того, чтобы лучше понять, по какому принципу генерируются изображения.

Делим исходный запрос на части. По итогу генерации мы расписали, что именно получилось на изображении. Далее предположили, какой компонент рисунка относится к какому запросу.

Данный метод очень полезен на этапе составления промта. Благодаря этому вы заранее сможете предугадывать, какие фразы стоит сразу расписать на элементы, чтобы добиться нужной нам картинки.

Также в Mj есть команда, которая может разложить картинку на 4 разных запроса, тем самым вы можете также произвести декомпозицию картинки.

Для этого нужно ввести команду «/describe» и прикрепить нужную картинку, которую необходимо декомпозировать.

Вы можете сгенерировать по одному из появившихся запросов новую картинку, а можете перегенерировать и получить другой результат.

Отсюда вы также можете брать какие-то подсказки из запросов и создавать новые кастомные генерации.

Вернемся к нашей изначальной задаче и напишем запрос «девочка в красном галстуке с весенними цветами в стиле СССР»

— a girl in a red tie holds spring flowers, in the style of the USSR

Запрос «a girl in a red tie holds spring flowers, in the style of the USSR» в 4 версии Mj

Результат в 4 версии уже намного лучше, но всё равно красный галстук превратился в основной цвет изображения — красный. А нам нужен только красный галстук.

5 версия генерирует нам слишком реалистичную девушку, нам нужен более рисованный стиль для открытки.

В целом обе версии картинок не совсем нам подходят. И тут у нас есть два пути, как исправить это

1.      Детальнее прописывать запрос и тратить много генераций для получения нужного нам изображения

2.      Добавить референс изображения к запросу

Референс — вспомогательное изображение: рисунок или фотография, которые художник или дизайнер изучает перед работой, чтобы точнее передать детали, получить дополнительную информацию, идеи.

Добавим изображение, которое нам нравится и похоже на конечную идею

Референс изображения мы вставляем в виде ссылки на это изображения.

Пропишем запрос «*ссылка на исходную фотографию* девочка в красном галстуке с весенними цветами, в стиле СССР»

Запрос a girl in a red tie holds spring flowers, in the style of the USSR» в 4 версии Mj

В 4 версии мы получили картинки, которые больше всего соответствует нашему запросу и цели для этой генерации.

В 5 версии у нас вышло 3 из 4 слишком реалистичных генераций, только первая картинка соответствует нашим ожиданиям.

ВАЖНО! Ссылку на референс мы вставляем в начало запроса.

Также если вы используете для референса фотографию, то ее формат автоматически будет подтягиваться, как нужный в генерацию.

В нашем случае мы взяли вертикальную фотографию масштаба 1:2 и при генерации наше изображение создается в формате 1:1. Как мы видим, два масштаба совместились и получилось квадратное изображение с полосками по бокам.

Сделаем еще одну генерацию открытки с символикой СССР и букетом весенних цветов В запросе так и напишем «букет весенних цветов, на фоне флаг СССР»

— a bouquet of spring flowers, on the background of the flag of the USSR

Запрос «a bouquet of spring flowers, on the background of the flag of the USSR» в 4 версии Mj

Видим, что это не совсем то, что нам нужно. Давайте также попробуем добавить референс в виде фото:

Прописываем запрос «*ссылка на исходную фотографию* букет весенних цветов, на фоне флаг СССР»

Запрос: a bouquet of spring flowers, on the background of the flag of the USSR» в 4 версии Mj

Можно заметить, что 4 версия сгенерировала максимально подходящий вариант в формате советской открытки, в отличие от 5 версии.

Теперь попробуем с той же исходной фотографией прописать запрос, который может ассоциироваться с праздником, но напрямую к нему не относится: «*ссылка на исходную фотографию* шашлыки на даче»

— https://s.mj.run/s1y2zHRHMsI barbecue at the cottage

Запрос «https://s.mj.run/s1y2zHRHMsI barbecue at the cottage» в 4 версии Mj

Нейросеть попыталась совместить 2 бессвязных вещей в одну картинку. То есть это мы поняли бы ассоциацию, что на первомай многие едут на дачу жарить шашлыки. А нейросеть этого не понимает, тем более, когда мы на даем ей референс открытки с флагом и цветами.

Запомним важное правило — Референс должен усиливать ваше текстовое описание

Если вставить просто рефернс и дописать 2 часть промта текстом, то нейросеть будет смешивать эти два описания, а не усиливать. Правильным вариантом будет считаться ситуация, когда текст полностью “повторяет” изображение. То есть вы буквально описываете картинку. В итоге вы получите новое уникальное изображение, которое будет похоже на исходник.

Подведем промежуточный итог примера генерации:

·         нейросеть работает в формате “ассоциативного ряда». То есть ваш запрос будет разложен на ряд ассоциаций, которые относятся к 1 слову. И какая-то из этих ассоциаций будет генерироваться

·         Добавление референса в запрос помогает нейросети лучше понять вас и сделать картинку, которая будет походить на исходник.

·         Чтобы добиться хорошей генерации с референсом, нужно описать в тексте запроса изображение. Тогда эффект усилится.

Пасха — учимся гуглить, детализировать запрос + давать референсы.

11:42

Прежде чем начать, важно обозначить один момент. Пасху в разных странах празднуют по разному. А значит, что и символы праздника могут отличаться.

Введем запрос “Пасха”

— Easter

Запрос «easter» в 4 версии Mj

Очень странная генерация вышла в 4 версии, мы видим зайца с одним ухом и козу скрещенную с зайцем. Плюс ко всему картинки мрачные. 5 же версия поняла нас хорошо и с первого раза сгенерировала подходящую картинку.

Так как результат генерации был нестабилен, уточним детали фона и полное название праздника для 4 версии и посмотрим, как с этим запросом справится 5 версия.

Введем запрос «Счастливая пасха, белый фон»

— Happy Easter, white background

Запрос «Happy Easter, white background» в 4 версии Mj

Уже лучше, как минимум все объекты на фотографиях можно вырезать в редакторах и использовать в каких то изображениях.

Добавим стиль изображения — запрос «Пасха, белый фон, рисунок акварелью»

— Easter, white background, watercolor drawing

Запрос «Easter, white background, watercolor drawing» в 4 версии Mj

А вот к этим картинкам уже можно просто приписать текст и будет полноценная открытка на праздник.

В этом примере мы также использовали название праздника, поэтому нейросеть сама предлагает нам разные варианты на итоговых изображениях. Это может быть крайне интересно, поэтому в целом не требует особых уточнений. Но если вы хотите видеть конкретно цыпленка и пасхальные яйца, то так и пропишите запрос «Цыпленок и пасхальные яйца»

— chick and easter eggs

Запрос «chick and easter eggs» в 4 версии Mj

С первого запроса вышли генерации без особых искажений.

Добавим стилистику изображения — запрос «цыпленок и пасхальные яйца, рисунок акварелью»

— chick and easter eggs, watercolor drawing

Запрос «chick and easter eggs, watercolor drawing» в 4 версии Mj Этот вариант нас также полностью устраивает.

Также мы хотим рассказать про интересные попытки сгенерировать Пасху в русском стиле

— с куличами и Пасхи из творога.

Во-первых, в Европейских странах не делают Пасху из творога. Нейросеть не понимает, что это, т.к. невозможно обучить её на всем многообразии традиций народов.

Во-вторых, кулич называется “куличом”, только в России. И нейросеть также не понимает, что это такое.

Давайте пройдемся по всем этим генерациям и для начала сгенерируем кулич

— Easter cake

Запрос «Easter cake» в 4 версии Mj

Что в 4, что в 5 версии нейросеть воспринимает слово “cake” и “Easter” отдельно и просто смешивает их.

Добавим уточнение к запросу — «кулич с белой глазурью и посыпкой»

— Easter cake with white frosting and sprinkles

Запрос «Easter cake with white frosting and sprinkles» в 4 версии Mj

Все еще совсем не то, потому что в английском языке нет слова “кулич”. Нужно найти конкретное название выпечки, которая будет похожа на наш кулич с белой глазурью и посыпкой. И мы нашли это название — “Панеттоне”.

Пропишем запрос «Панеттоне с белой глазурью и посыпкой»

— Panettone white icing and sprinkles

Запрос «Panettone white icing and sprinkles» в 4 версии Mj

Этот вариант нейросеть в обеих версиях понимает и он больше всего похож на кулич в России.

Но все же видно, что это не православный кулич.

Детализируем запрос — добавляем стандартных атрибутов праздника и помещаем в их окружение аналог кулича

«Панеттоне с белой глазурью и посыпкой стоит на красивой тарелке, на столе, пасхальные яйца нарисованы на столе рядом с ним, ваза с вербой на заднем плане»

— Panettone with white icing and sprinkles stands on a beautiful plate, on the table, Easter eggs painted on the table next to it, with a vase of willow in the background

Запрос в 4 версии MJ

Уже больше похоже на стандарт.

Попробуем еще усложнить композицию и покажем «утро». Ведь именно утром едят куличи. Введем на задний фон окно

— Panettone with white icing and sprinkles stands on a beautiful plate, on the windowsill, multicolored eggs lie next to each other, willow flowers lie next to each other, and it's dawn outside the window

Запрос в 4 версии MJ

С картинки, сгенерированной в 4 версии первый вариант подходит нам больше всего. Там присутствует и кулич, и яйца, и цветочки. Сделаем его апскейл, он нам пригодится в дальнейшем.

В 5 версии сделаем апскейл 2 картинки. Апскейл картинки в 4 верси Mj

Теперь мы хотим сделать более православное изображение, для этого поместим церковь на задний план, как будто бы она за окном.

«Панеттоне с белой глазурью и посыпкой на красивой тарелке, на подоконнике, рядом разноцветные яйца, а за окном православный храм»

— Panettone with white icing and sprinkles is on a beautiful plate, on the windowsill, with colorful eggs next to it, and an Orthodox church outside the window

Запрос в 4 версии Mj

5 версия несмотря на несколько попыток генераций ни в какую не хочет генерировать храм за окном.

А в 4 версии на 2 картинке мы четко видим крест на церкви, давайте сделаем ее апскейл.

Апскейл картинки из 4 версии Mj

Когда делаем апскейл, Mj усердно убирает крест на церкви и теперь не понятно, что это церковь.

Пойдем по другому пути. Найдем в интернете фотографию Питерского храма и используем ее как референс для фото.

Теперь скопируем ссылки на изображения и вставим в запрос Референс из интернета

Результат:

Запрос «https://s.mj.run/FA2fwOwPk9k https://s.mj.run/oBRDnG6fnVk» в 4 версии Mj

Нам понравился вариант 4, давайте сделаем его апскейл

Помимо того, что на церкви виден красивый крест, на заднем плане мы можем увидеть башню Лахта-центра, хотя мы и не прописывали, что это Спб. Мы закинули в референс Питерский храм и Mj на основе своих знаний сама сгенерировала нам Санкт-Петербург.

В 5 версии ситуация обстоит иначе. Когда мы вставляем в запрос просто ссылки на изображения, то Mj пытается сделать кулич в форме храма. Даже если поменять ссылки местами, то все равно ситуация остается такая же.

Попробуем добавить уточняющий запрос к ссылкам

https://s.mj.run/fiCSOMi2J-k https://s.mj.run/hlkLnNph1wY Panettone with white icing and sprinkles is on a beautiful plate, on the windowsill, with colorful eggs next to it, and an Orthodox church outside the window

С уточнением мы добились того результата, который нас устраивает. Сделаем апскейл 4 варианта картинки

Теперь попробуем сделать наоборот — сгенерируем православную церковь в Mj , а в качестве референса прикрепим кулич.

Результат генерации церкви:

— Orthodox Church

Референс кулича и результат генерации на его основе

-- https://s.mj.run/Ah1tyfgugLc easter cake on a beautiful plate, on the windowsill, with colorful eggs next to it

Референс из интернета

Скрестим наши результаты и напишем уточнение в запросе

—  https://s.mj.run/K6YOIRIw_9w https://s.mj.run/j7UHykixCBE easter cake is on a beautiful plate, on the windowsill, with colorful eggs next to it, and an Orthodox church outside the window

Результат генерации в 4 версии Mj

Таким образом мы можем добиться нужных нам генераций с помощью референсов.

Промежуточный итог примера генерации:

·         Нейросеть может не знать национальных тардиций и особенностей в приготовлений блюд -- ищите аналоги

·         Если вас не устаивает как Mj видит тот или иной объект, помогите ему — дайте референс на фото из интернета

·         Обязательно прописывайте уточняющий запрос после референса, иначе нейросеть сгенерирует не то, что вам нужно

·         Необязательно на 100% попадать в цвет/структуру/форму объекта, достаточно добавить к нему привычных узнаваемых деталей. Фон и в целом картинка будет считываться мозгом нужным образом.

Картинки к праздникам, открытки, тематические изображения — это одно из самых простых, что можно генерировать в нейросети.

Генерация фонов/подложек

В прошлом блоке урока мы генерировали открытки к праздникам, а теперь будет генерировать фоны и подложки для товаров.

Большинство товаров сфотографированы на базовых фонах: белый фон, встроенные в интерьер и реже в процессе использования. Это простой вариант, который не требует большого количество времени и трудозатрат, в отличие от тематической съемок товара в определенном интерьере/пейзаже.

Благодаря нейросетям мы можем встроить любой товар на любой фон. Для этого нужны любые фотографии с товаром, которые вы можете вырезать и перенести на фон, который вы сгенерируете.

Логика для генерации подложки под товар простая:

- берем фотографию товара

- генерируем фон

- вставляем товар на фон с помощью фотошопа

Фон для женского парфюма — обрамление товара элементами

У нас есть фотография самого стандартного женского флакона для духов. И мы хотим получить картинку с цветочным фоном, которые обвивают флакон.

Вводим запрос дословно «цветы в виде виньетки, Белый фон»

—  flower vignette, white background

Запрос «flower vignette, white background» в 4 версии Mj

Слово “Виньетка” нейросеть не совсем точно понимает. Давайте перефразируем под более простую фразу «цветы по краям, Белый фон»

—  flowers around the edges, white background

запрос «flowers around the edges, white background» в 4 версии Mj

“Цветы по краям” нейросеть поняла намного лучше, чем “виньетка из цветов”. Такой прием мы часто будем использовать при генерациях, чтобы нейросеть выдала более точный результат.

Теперь мы можем вырезать наш флакон духов и поместить в этот фон:

Это самый простой пример, на котором наглядно видно, как быстро можно сделать элементы для дополнения рекламы товара.

Есть еще один способ сделать подходящие цветы. Прямо в запросе написать, что нам нужен парфюм и цветы по краям — «Парфюм, цветы по краям, Белый фон»

— Perfume, flowers around the edges, white background

Запрос «Perfume, flowers around the edges, white background» в 4 версии Mj Теперь мы просто поверх флакона с примера генерации поместим наш:

Благодаря тому, что мы прямо в запросе задаем некую форму нужного вам объекта, нейросеть может выдать нам более подходящий результат.

Мужские духи — генерация фотореалистичного фона.

Здесь мы не просто вставили элементы на фотографию товара, но и полностью создали весь фон

У нас есть мужской парфюм, сделаем так, чтобы он стоял в ручье на фоне большого каньона, еще и с определенным освещением. Для начала смотрим, какая будет генерация пейзажа

Введем запрос «ручеёк, на фоне каньона, сумеречного голубого неба, синего и оранжевого освещения»

—  stream, against the background of the canyon, twilight blue sky, blue and orange lighting

Это примерно то, что нужно. Но вставить сюда изображение с парфюмом вы вряд ли сможем. Добавим подсказку в запросе «духи крупным планом стоят в ручье, на фоне каньона, сумеречного голубого неба, синего и оранжевого освещения»

—  perfume close-up stands in a stream, against the background of a canyon, twilight blue sky, blue and orange lighting

Один из вариантов нам полностью подходит. Берем его и вставляем наш флакон.

И еще один вариант после нескольких генераций фона

И еще один вариант после нескольких генераций фон

Нейросеть отлично рисует любой пейзаж, который вы можете использовать в качество фона.

В итоге у нас получилось 2 полноценных картинки с вашим товаром.

Закроем возражение: “Видно, что вырезано”, “нереалистично”, “реальное фото не сочетается с нарисованным”.

А в этом и есть самый главный смысл. Делать супер реалистичные изображения в нейросети кончено можно, но в этом просто нет смысла. Такой “нейронный” стиль сейчас вызывает большой интерес у людей. Он привлекает своей необычностью, потому что все привыкли к стандартным вещам, а такие изображения выбиваются из общей массы.

А если изображение выбивается из общей массы - значит есть шанс зацепить внимание большего количество людей. Это нам и нужно.

Примеры прикладного использования фонов из Mj:

Вывод , который можно сделать из этого раздела — вы можете сгенерировать абсолютно любой фон, подходящий под ваши товары. Главное сделать его похожим на стилистику вашего товара.

Про то, как грамотно генерировать ваши товары/услуги, мы расскажем в следующем уроке.

В отдельном уроке также будет информация о том, как вырезать и прикрепить ваш товар на сгенерированный в Mj фон.

Фон для поста «озеро в России» — генерация с «использованием» профессиональной фототехники.

Сгенерируем изображение для поста, которое подойдет для группы про путешествия, природу, рыболовного магазина. Пускай это будет озеро с рыбаком на рассвете, летом.

Шаг 1 — Введем 1 уровень запроса “озеро”

lake

Запрос «lake» в 4 версии mj

Видим, что пейзаж не очень похож на российский. Добавим уточнение

Шаг 2 — Введем 2 уровень запроса “Озеро в России”

— lake in Russia

Запрос «lake in Russia» в 4 версии Mj

Разница довольно сильная, этот вариант намного больше подходит. Но в 4 версии время года постоянно изменяется. Уточним время года и время суток.

Уточним 2 уровень запроса “Озеро в России на рассвете, летом”

— Lake in Russia at dawn, summer

Запрос «Lake in Russia at dawn, summer» в 4 версии Mj

Отлично, но “качество” не совсем то, что нам нужно. Добавим уточнение по стилю фотографии

Шаг 3 — Введем 3 уровень запроса «Озеро в России на рассвете, летом, профессиональное фото + настройки камеры»

— Lake in Russia at dawn, summer, Professional photographer, Canon R5, 1/ 3200s, ISO 200, Canon RF 35mm f/22

Запрос в 4 версии Mj

Что произошло — картинка стала фактически фотографией. А все благодаря тому, что прописали модель камеры и её настройки. Фотографы уже поняли в чем дело, но давайте разберемся.

Canon R5, 1/3200s, ISO 200, Canon RF 35mm f/22 — это модель фотоаппарата и настройки камеры. Если не вдаваться глубоко в детали, то этот запрос в совокупности с “Professional photographer” дает нам генерации, которая сделана как будто бы с этой камеры и с этими настройками. Кстати, если менять модели камеры и настройки можно получить разные интересные эффекты.

Например, если вставить название фотопленки, то получится такой эффект

—  Lake in Russia at dawn, summer, Portra 800 35mm, soft focus lens

Запрос «Lake in Russia at dawn, summer, Portra 800 35mm, soft focus lens» в 4 версии Mj Фотография стала в стилистике пленочного фотоаппарата.

Вернемся к первоначальной задаче — сделать изображение, где будет озеро с рыбаком на рассвете, летом

—  man fishing on a lake at dawn in Russia, summer, Professional photographer, Canon R5, 1/ 3200s, ISO 200, Canon RF 35mm f/22 --ar 16:9

Запрос в 4 версии Mj

Мы добавили мужчину, который рыбачит в начало запроса, а также поменяли формат изображения. Результат более чем интересный и его можно использовать для публикации.

Итоги:

мы разобрали:

- в какой последовательности нужно прописывать запрос (промт)

- какие уровни запросов есть и почему нужно идти именно в такой последовательности

- как базово генерировать простые объекты

- как частично контролировать генерацию изображений, а именно освещение и визуал

- как генерировать открытки, фоны и подложки

Также давайте соберем все промежуточные итоги в одном месте

Логические итоги:

1.  “Нейронный” стиль сейчас вызывает большой интерес у людей. Он привлекает своей необычностью, потому что все привыкли к стандартным вещам, а нейронные изображения выбиваются из общей массы

2.  Нейросеть работает в формате “ассоциативного” ряда. То есть ваш запрос будет разложен на ряд ассоциаций, которые относятся к 1 слову. И какая то из этих ассоциаций будет генерироваться

3.  В прописывании запроса есть конкретная последовательность описания. Первые слова в запросе (промте) будут расцениваться в большинстве случаев, как главные. Как в примере с котом и фотоаппаратом.

4.  Если хотите видеть конкретные элементы на изображении, то описываете их так, как будто бы описываете в отрыве от общего изображения. Как в нашем случае с “8 марта” и “цифра 8”

5.  Нейросеть может не знать национальных традиций и особенностей разных народов, например названия праздников, блюд, мероприятий, а значит не всегда сможет сгенерировать нужное вам изображение.

Технические итоги:

1.  Если хотите поменять формат генерации, то в конце добавьте запрос “--ar” и введите соотношение сторон.

2.  Добавление референса в запрос помогает нейросети лучше понять вас и сделать картинку, которая будет походить на исходник.

3.  Чтобы добиться хорошей генерации с референсом, нужно описать в тексте запроса изображение. Тогда эффект усилится.

4.  Обязательно добавляйте к референсу уточнение того, что вы хотите видеть на картинке.

5.  Чтобы добиться эффекта “фотографии” нужно указывать модель фотоаппарата и его настройки

Если добавить в запрос контроль освещения, то она станет более объемной и красочной. Если не указывать, какое вам нужно освещение, то нейросеть сделает это по своему усмотрению.

6.  При одинаковом запросе, но разных стилях (фотореализм, рисунок акварелью)

- получатся похожие изображения, но форма, детализация, расположение могут измениться

В итоге исследования мы погрузились в увлекательный мир генерации изображений с помощью нейросетей. Освоили ключевые аспекты, создающие уникальные и креативные композиции.

Важным выводом стало понимание последовательности запросов и уровней, чтобы получить желаемый результат. "Нейронный" стиль приносит необычность и оригинальность в каждую работу.

Добавление референсов и точных описаний улучшает качество и соответствие ожиданиям. Но нейросеть не всегда знает о национальных традициях, так что уточнения могут быть нужны.

Технические моменты также важны: формат генерации и контроль освещения создают более выразительные изображения.

Генерация изображений с помощью нейросетей - захватывающее путешествие в мир креатива и технологий. Будущее графического дизайна обещает быть ярким и разнообразным, с нетерпением ждем новых открытий и достижений в этой области.