February 27, 2023

Заменит ли нейросеть художников прямо завтра?

«На дворе трава, на траве братва, вся братва в дрова»
Canva, встроенная в ЖЖ-редактор теперь тоже умеет в модные нейросети; вот так она представляет братву на дровах:

Идея в том чтобы задав текстовое описание, использовать полученный результат — одну из предложенных картинок и последовательными итерациями, уточнениями, добавлениями добиться реализации задуманного

Загруженный эскиз, сделанный левой ногой мышкой сеть не прожевала, реагирует только на описание,

есть бревнышки и трава, пытаюсь заставить ее изобразить «братву» в нужной кондиции и во дворе

В наличии либо «тост», либо «дрова», да и «братва» на себя не похожа

Что еще хужее — и персонажи  на людей похожи весьма условно

количество рук, ног и их расположение непредсказуемы

это предел, чего удалось добиться от Канвы

разве что деревья более-менее

дальнейшие уточнения приводят к закольцовыванию, возвращая к уже отвергнутым решениям

Натурально —  «в дрова» =)

Прямолинейный перевод с «русского на русский» про «бухих бандитов на дворе» не  проходит, приходится изощряться; «дрова», не расписанные в целую фразу, система игнорирует, «двор в городе, городской квартал» игнорирует в любых вариациях, упорно отрисовывая то ли футбольное поле, то ли стриженную лужайку.

Попробую онлайновый Дрим:

Превьюшка игнорируется точно так же, но в «дрова» система врубается лучше Канваса. С количеством ног тоже путаница, похоже это общая засада.

Stable Diffusion — самый популярный, чаще всего его приводят как пример возможностей ИИ в области цифровой изобразительной техники:

Пробую в разных жанрах

Отдает не все, намекает на продвинутый кейс. Но сквозь блюр тоже ничего примечательного не проглядывает.

Если не присматриваться к конечностям, где-то даже интересно

чьи-то руки, чьи-то ноги, но бревнышки местами удались

— казалось бы, уж по бутылкам-то какая проблема сгенерить что-то вменяемое? но тоже как повезет.

А как же множество крутейших примеров в сети, с поразительными деталями реалистичных отрисовок?
Пишут что:
—  декстопные программы уровня PRO показывают лучший результат
— описания порой достигают сотни слов
— картинки дорабатываются, на основе доработок генерируются заново, деталь за деталью и так стопятьсот раз
— нужен навык по общению с ИИ, чтобы выхлоп стал более предсказуемым
— а еще должно повезти
— есть круг тем, на которые рисовалки заточены — мультяшно-киношные супергерои(ни), космос, технический артхаус. Ландшафты. Копирование стиля художников-классиков.

И — нейросеть не рисует. Она автоматизирует процесс выполнения заказов по диги-арту популярным методом: «укради так, чтоб не попадаться» — не передирай внаглую, а заимствуй перерабатывая, компилируя, перемешивая и перекрашивая.

Еще один из популярных ресурсов

Площадка — многофункциональная, для пользования рисовалкой нужно подключаться к чатам, по выражению завсегдатаев — «пробиться», на момент захода свободных не было.
Образцы выглядят круто, но — не оставляет ощущение, что я все это уже видела не по одному разу. В фильмах, игровых скринах и сборниках фотообоев..

Есть еще несколько сервисов, то с ограниченным доступом, то работа в программных кодах, не стала заморачиваться.

Ресурс попроще, этот хотя бы предложенный эскиз не проигнорировал.
Хотя просто выровнять исходную картинку фотошоп может лучше.

О математической сущности нейросетей — тут

По общему впечатлению — доступные онлайновые нейрорисовалки не особо продвинулись по сравнению со стародавней игрушкой «нарисуй котика»

такое же все кривое. Хотя женский юношеский портрет уже тогда у нейросети  получался неплохо — видимо самый распространенный сюжет в цифровой графике, самая обширная база данных для компиляции. Даже с котиками до сих пор не так все здорово. А уж запас «дров», «дворов нараЁне» и «группы товарищей» в базе референсов и вовсе ограничен, да и сами базы собирались в других реалиях.

Однако,  удачные примеры  показывают, что система работает, пополнить ее библиотеки, допилить огрехи с руками-ногами — дело времени.

Когда-то смеялись всем жж над первыми шагами Гугл-транслейта, помните «котенка афро-американца» ? =)
Шаг за шагом алгоритм набрался опыта и в расхожих случаях очень даже неплохо справляется (хотя контролировать, что он перевел, не помешает).  Однако, до замены профессиональных переводчиков роботами еще далеко.

Заменит ли нейросеть художников?
Возможно какие-то функции  вскоре будут  автоматизированы —  баннеры, иллюстрации к новостным текстам и прочий прикладной веб-арт.  Это и сейчас делается практически «на автомате», только что реальными девочками-дизайнерами операторами. Рутину и заменит ИИ.

Появление фотографии не отменило живописи (возможно стало меньше портретистов-ремесленников, зато понадобилось множество оформителей для наглядной агитации, было куда переквалифицироваться).
Трикотажная промышленность развивается более сотни лет,  производительность  не сопоставима с домашним рукоделием, но люди по прежнему вяжут, плетут кружевные салфетки для собственного удовольствия.

Не факт, что технологический прорыв в области взаимопонимания между автоматикой и пользователем последует сразу же за прорывом в технике синтеза картинки на основе сотни скормленных нейросети образцов.
Тут люди-то не всегда друг друга понимают...
Пока что составлять и пересоставлять «промт»-описание, подбирать референсы для исходной генерации, доводить результаты вручную, снова и снова перезапуская рендеринг — отдельное искусство, которое возможно сделается новой профессией.
С другой стороны — не факт, что глянцевый «нейронный» арт не приестся, как надоели роскошные экранные заставки — кто ими сейчас увлекается?
На нынешний момент скачать десяток фри-pngшек и собрать из них иллюстрацию для поста, именно такую, как хочется —  займет пару минут, если руку набить.
Научится ли нейросеть понимать чего хочется заказчику?
Будем посмотреть :)

Реплика с Хабра: