April 7, 2023

Красивое, показываем

Первенство среди нейросетей по кото-рыбкингу!

Представляем участников:
Миджорни, СтейблДифьюжен в нескольких оболочках, Дали от Бинга и Дали-ру, канадский Вомбо, китайский ERNIE-ViLG 2.0, Девиант и ПикФиндер на нераспознанном движке. Все получают две попытки с одинаковым заданием — 1.простой промт в двух словах и, 2. расширенное описание, с подводкой, упоминанием фотореалистичности-детализации-студийного света.

Рыба на столе, праздничная подача, иллюстрация

🌚 Первым выступает любимец нейрокреативной публики, Midjourny:

Статья с такой вступительной иллюстрацией, не осталась бы без внимания

🌚 За Стабильную Диффузию выступает Леонардо:

СД во всех ипостасях интерпретирует праздничное — как новогоднее.

Что-то можно было бы выбрать, для иллюстрации к проходной заметке:

Опыт показал, что развесистый «промт» практически во всех случаях уступает односложному, минималистичному описанию, нейросети предпочитают «фантазировать в свободном режиме»

не без огрехов, но если вручную доработать детали, то можно использовать

🌚 Следующим номером выступает StableDiffuzion в оболочке Playground:

Лучше всего ему удаются картинки в режиме «скетчбук» (если удаются)
«реалистик» менее привлекателен

🌚 Самый сильный из оппонентов Леонардо — дискорт-бот BlueWillow, который называли даже альтернативой Миджорни (пока у тех не вышла 5-я версия)

показывает результат на уровне стоковой иллюстрации. С легкими недочетами, но и без особых открытий:

Рыба слегка сыровата?

Бывают нужны и такие, не запоминающиеся, приятные глазу заставочки

Относительно движка BW существуют сомнения, пользуется ли он стандартной Диффузией или подпитывается от чего-то еще (высказывались  подозрения, что от самой MJ, когда там был открытый триал)

В команде СтайблДифьюжен — более десятка различных сервисов, более и менее качественно настроенных; для полноты охвата пригласим аутсайдера
в этой подгруппе —  Nightcafe.studio :

Рыба, стол, праздник... Понимание запроса присутствует.

Возможно поиск на стоках займет больше времени, чем генерация. Но найт-кафе — очень жадный сервис с минимумом попыток, не убеждающих, почему стоит выбрать его, а не заснять рыбу или котика самостоятельно  любое из альтернативных предложений

🌚 На арене — невероятный РicFinder!
Генерирует миллион вариантов к любому запросу :
прокручиваешь страницу — появляются все новые и новые (в то время как даже топовые платники выкатывают считанное количество превьюшек )

из сотни предложенных картинок пару десятков вполне приличных иллюстраций можно подобрать (размер стандартный — 512рх)

🌚 Китайская нейросеть ERNIE-ViLG 2.0  показывает достаточно стильный и оригинальный результат в режиме цифровой графики (верхняя иллюстрация оттуда же):

фотореализм ей удается не всегда:

🌚 Тяжеловес DALL-E  выходит на помост:

— Увы, сегодня не его день, ужасы мы не заказывали

В качестве оболочки - майкрософтовский Bing

С подсказкой, что «рыба приготовленная», «копченая-золотистая», картинка выходит пригляднее:

Что-то даже могло бы сгодится в качестве заставки:

Это достижение «превзошел» Дал-и
«с сохранением условий и авторства правообладателя»:

В верхней строке — промт.
Оно сочло, что «золотая рыбка» это название гостиницы?

«Красная», не поспоришь.. (когда требуется писать на гегемоне, я проверяю в контексте; оказывается  не помешал бы  и перевод с русского на русский):

Удивительный сайт, который не умеет обновлять страницу с результатом автоматически; захаживай, тычь в кнопку, когда-нибудь сработает:

🌚 Но, у  Кандински имеется другая площадка, показывающая Dall-E.ru c "более лучшей" стороны.
Возможности на уровне Леонардо — генерация по частям, выбор стилей. При том без ограничений:

Искажения зависят от выбранных настроек, отрисовка  бывает лучше/хуже, смотря как повезет с фильтром. Но это у всех так:

Определенное своеобразие  есть:

🌚 Wombo:

Ничем не удивляет, но годно. «Слегка пережарено» - может считаться стилем.

🌚 Скандально-известный Deviant-art
(судился с юзерами из одноименной галереи, на чьих работах паразитировал обучался без их ведома. После возражений убрал галочку «по умолчанию»).
Единственная из сеток, которой потребовался развесистый промт, чтобы вышло что-то внятное —

— рыба после улучшайзинга.
Триальный пакет треша из пяти попыток, никак не стимулирует к продолжению:

Это генерации с нуля.
В галерее у них есть отменные работы, но там вперемешку — цифровые арты художников, рендеры от нейросети, и нейросетевые накрутки поверх готовых картинок.

Контрольная проверка на котиках

🌚 Леонардо тоже не всегда на высоте, но поднатужившись выдал пару симпатяшек:

🌚 БлюВиллоу — умеет в улыбчивых котеек:

если не няши, то по-своему интересные кото-персонажи

Как и заказано — кот в интерьере, не одна лишь мордочка

В рендере месячной давности прослеживаются узнаваемые черты —

будто текстуру кошачьей шубки натягивают на один образец. Хотя бы образец у  них приятный, кото-злюки не получаются.

🌚 Сектчбук от Плейграунд нежный и трогательный:

фото-фильтр до реализма недотягивает:

🌚 У Дал-и  от Бинг тоже милые пушистики

🌚 Китайские котики на вид не дурны, хотя изображения несколько зашумленные и слишком обрезанные:

🌚 Вомбо подчеркнуто декоративен, но и такой стиль имеет право быть

🌚 Бесчисленно полосатиков от:

даже закралось подозрение, что это поисковик, а не рендер.
Проверила гугло-объективом — нет, действительно уникальные картинки.

🌚 Дал-и в изводе «Малевич» отвернулся, сгорая со стыда:

🌚 Но на Брайн-Фузии (с тем же движком) котики очаровательны:

(результат сильно зависит от фильтра)

Проголосуем?
У кого из нейросетей рыбы и котики всех пригожей и милее:

View Poll: #2124157