March 16, 2023

Полет шмеля. Первые шаги в нейрографике

на Midjourney и других нейросетях

Задание «Электрический шмель-пылесос» из вчерашней угадайки  кому-то могло показаться нелепой причудой, на самом деле это  идея для простенькой и забавной праздничной открытки на осень — обычно рисуют мёд и яблоки, иногда пчелок для оживляжа.

МиДжи крут в плане отрисовки, но в вопросе понимания промтов — не лучше множества бесплатных нейро-рисовалок.
MJ — суперская игрушка, которой можно наслаждаться, как когда-то в детстве «волшебными» узорами в калейдоскопе.
(Однако, те, кто использует инструмент по работе, настроены мернее восторженно, пишут, что приходится делать тысячи генераций, чтобы побрать изображение для проекта)

Шмелики один пушистей другого, тычинки загляденье, но я же задумала смешную картинку — эдакий летающий пылесборник:

Пыталась втолковать задание нейросети как «механический шмель»

Электро-механический, на цветах

Прикольно, но это скорее для какого-нибудь ужастика

Уже ближе, но настрой все еще не тот.
Хочу, чтобы герой был няшный и дурашливый, а не робокоп с крылышками

В помощь описанию можно добавить свой рисунок (или фото), и регулировать в настройках, насколько точно нейросеть будет его придерживаться:

в результате или просвечивает исходная корявость или не сохраняется заданная расстановка объектов (а корявость все равно заметна):

И... 🤖 Злюки они все у МиДжи.
Что живность, что люди, по умолчанию — «морды протокольные»; чтоб персонаж полу-улыбнулся нужно целую простыню исписать с установочными кодами.

Открытку в начале поста делала на Lexica.
Работает на СтейблДифьюжен, по качеству самая близкая к Миджорни (из доступниых). Платная, те же 25  попыток  free, для поиграться.
Но без замороченной двойной регистрации с верификацией на мобилу. Обычный вход по е-мейлу. Ни дискорота, ни чехарды в общих чатах — открыл сайт и рисуй:

К этому времени я уже немного разобралась, что к чему, не пытаюсь «посвятить ИИ в свой замысел», предлагая «пофантазировать на тему мини-пылесоса, летающего как шмель». Началу было поддалась  влиянию кликбейтных заголовков «Нейросеть нарисовала пословицы», «Как нейросеть видит города», «Джипити бот написал сказку!».  На деле все более прозаично.

Представила, что я хочу видеть на открытке, записала в промт «Игрушечный шмель. Ромашки в бекграунде»
Получилось, только «вид сзади», а, нужно, чтоб лицом смотрел — уточнила «Блестящий пластиковый игрушечный шмель, фронтальная камера, цветочное поле»:

«Лексика» все поняла правильно, осталось добавить специальное указание — «игрушечный шмель с крыльями, летит на цветком»
И еще я передумала, отказалась от «пластика» (заметила, что мягкая игрушка смотрится приятней);  и добавила «Дисней-стиль»

Добиваться от ИИ полного соответствия сюжету целиком — муторная затея, если и удастся изощриться с промтом через стопятьсот проб — по времени выйдет дольше, чем допились в Фотошопе.
Мне приглянулись две картинки, которые можно склеить без радикальных  изменений:

На том же сайте сгенерировала мёд, чтобы сохранить общую стилистику (прозрачные пнг-шки подобрать можно, но по времени на то же выйдет)

Кст — в промте было только «мед в стеклянной банке», никаких цветочков — последующие запросы всегда отражают что-то из предыдущих. Да еще ромашки реально стали ромашками, а не маргаритками, как в первых опытах. Будто до нейросети наконец «дошло» =)

Вырезала, свела в одно изображение — идея и монтаж мои,
а нейросеть в качестве подсобника =)

Лирика:
В романе «Гойя» описана небольшая сценка в мастерской художника — подмастерья «раскрашивают конский зад» и прочая шпаклевка подмалевка на них, чтобы освободить мастера от рутины; это было в порядке вещей; авторство, разумеется, оставалось за генератором идей, который руководил процессом и выполнял окончательную доводку 👨🏽🎨

— Это к актуальным спорам на арт-площадках о философии нейро-графики — что это вообще такое, имеет ли отношение к искусству или к инжинирингу?;  рубятся и ни к чему не приходят.
Как по мне: если кино считать творчеством, то почему бы и не отрисовку на нейросетях. Режиссер использует живых людей в качестве «красок», диктует им, в каком именно диапазоне проявлять свой характерный дар. Сами, без режиссерского замысла, ничего бы они не наснимали, кроме хаоса.
Нейросеть так же — без оператора ничего получится.

Еще о первых шагах. На разных рисовалках:

«Крайон», платный, с несколькими бонусными рендерингами на пробу.
Не то он тупой и кривой, не то я с никаким еще тогда опытом подступилась: сказано пылесос —  нарисовал пылесос, в шмелиной расцветке,ок. Но корявый же до ужаса:

«Дрим» накидал фото шмеликов, пылесос поприличнее. Выкатил краешком одну симпатичную картинку, остальные упрятал под замок.
Понятно, что там, где гоняют такие вычислительные мощности — хотят заработать. Но, если Миджорни грамотно дает клиенту подсесть на забаву, то остальные пытаются продавать кота в мешке, дескать — вы нам на слово поверьте, что на про-аккаунте результат будет зашибись, это только в пробниках отстой!

Даже уже не помню, что за Фузион, по результатм — фубл..ин

Фузия честно пыталось, «ну не шмогла»

«Лексика» вери гуд!, снова подтвердила, что лучше всех доводит до ума каляку-маляку, в точности следуя исходнику

Гугловский Дрим — ну такое себе: