Почему ИИ-генераторы изображений не заменят UI/UX-дизайнеров и иллюстраторов

Нейронные сети переживают расцвет во многих направлениях: искусстве, дизайне и разработке. Из этой статьи вы узнаете, почему не стоит бояться ИИ-генераторов и какие из них использовать в своих интересах.

Нейронные сети активно развиваются во многих творческих сферах. Они рисуют потрясающие картины, создают интерфейсы для мобильных и веб-приложений, пишут статьи на разные темы. Всё, что вам нужно, — лишь отправить им короткую текстовую подсказку. Бизнес только выиграет от сложившейся ситуации, поскольку они смогут сократить расходы и делать дизайн в кратчайшие сроки. Но стоит ли всецело полагаться на ИИ (искусственный интеллект — здесь и далее «ИИ»)?

Иллюстраторы и UI/UX-дизайнеры спорят о том, смогут ли генераторы изображений отнять у них работу. И не зря: за последние несколько лет применение ИИ выросло на 270%. В 2020 году мировой рынок нейронных сетей оценивался в $14,35 млрд, а к 2030 году он достигнет отметки $152,61 млрд.

Тем не менее, не стоит паниковать, потому что время ещё есть. У генераторов изображений, которые работают по текстовым подсказкам, есть несколько недостатков, которые мешают им занять лидирующие позиции. Давайте их рассмотрим.

Когда ИИ может вас подвести?

Нейронные сети обладают множеством преимуществ. Как мы уже говорили ранее: они снижают стоимость проекта, быстро работают, оптимизируют процессы. В то же время есть и минусы, которые сводят на нет большинство этих плюсов и делают использование нейросетей нецелесообразным.

Низкое качество рендеринга

Никто не идеален, и ИИ не исключение. При создании изображений он часто допускает ошибки. Его главная слабость — человеческие руки. Если вы добавляете на картинку людей, будьте готовы к тому, что их пальцы будут переплетены. Кроме того, он допускает другие, более мелкие ошибки — рисует неровные линии, добавляет размытые пятна и дублирует объекты.

Иногда ИИ-генератор изображений может сойти с ума и на основе обычных текстовых подсказок создавать очень странные вещи. Причина в том, что он не обладает знаниями о реальных объектах и не понимает, как они работают.

В результате вам всё равно придётся нанимать специалистов, чтобы отшлифовать дизайн, или брать сгенерированные изображения исключительно для внутреннего использования.

Отсутствие разнообразия

Каждая нейронная сеть обучается на миллионах предварительно отобранных картинок. Она содержит от 10 до 30 вложенных слоев с различными уровнями абстракции. Сначала изображение поступает на входной уровень и передает информацию на следующий уровень, пока на выходе не будет получен ожидаемый результат.

Поэтому стиль изображений, сгенерированных с помощью ИИ, выглядит так, как если бы их нарисовал один и тот же художник. В зависимости от картинок, на которых обучалась нейросеть, вновь созданные арты будут лишь незначительно отличаться по цветам, линиям и композиции. Если вы стремитесь создавать уникальный продукт, генераторы изображений — не ваш вариант.

Нарушение авторских прав

Где люди берут фотографии, чтобы обучать нейросети? Правильно — в Интернете. Они просто отбирают иллюстрации на нужную тему, и, как правило, не спрашивают разрешения у автора на их использование. В результате нейросеть и продукты, которые она генерирует, нарушают авторские права.

Недавно цифровые художники начали массовый флешмоб против ИИ. Они заполонили Artstation и Instagram фотографиями с надписью «Нет изображениям, сгенерированным ИИ». Художники не размещали новые работы, чтобы ИИ их не украл.

Вот почему использование таких изображений в маркетинговых целях, в дизайне упаковки или айдентике — не лучшая идея, ведь вы будете поддерживать кражу искусства, пусть даже невольно.

Никакого творчества

Нейронные сети обучаются на отобранных изображениях и работают в соответствии с заданными алгоритмами. Они не обладают воображением, они не способны вдохновляться. ИИ не привносит в этот мир ничего нового, его творения — результаты сочетания цифровых артов.

Для создания содержательного брендинга и привлекательного UI/UX-дизайна нужны уникальные иллюстрации и дизайн-решения. ИИ просто не сможет сделать их для вас. Чтобы получить потрясающие результаты, вам придется работать с людьми, которые обладают специальными навыками.

Как использовать ИИ-генераторы изображений в своих интересах?

Несмотря на минусы, в некоторых случаях с помощью нейронных сетей вы сможете улучшить внутренние рабочие процессы.

Используйте сгенерированные иллюстрации в качестве базы для будущего проекта. Реализуйте свою идею в виде чернового варианта, который сгенерирует для вас ИИ. Результат может не совпасть с вашими ожиданиями, но он даст вам толчок и сэкономит драгоценное время.
Ищите вдохновение. ИИ способен предложить различные концепты с использованием более сотни разных стилей. Так вы можете собрать референсы, концепты и сформировать общее настроение проекта.
Генерируйте идеи быстро. Если вам необходимо поделиться идеями с коллегами, но вы не художник и у вас мало времени, нейронные сети помогут создать черновой концепт в считанные минуты. Имейте в виду, что его придётся доработать.
Отточить навыки. Звучит странно, но это правда. Вы можете соревноваться с ИИ в рисовании артов или проектов в тех направлениях, где вам не хватает знаний.

Это лишь некоторые способы, с помощью которых можно использовать ИИ для оптимизации рабочих процессов. В зависимости от бизнеса, который вы ведёте, или вашего рода деятельности, их гораздо больше. Ещё один вариант — базовое 3D-моделирование.

Популярные нейронные сети для создания иллюстраций и UI/UX-дизайна

На какие продвинутые ИИ-инструменты стоит обратить внимание? Мы собрали популярные алгоритмы для генерации дизайна приложений, анимации и цифрового искусства.

Midjourney

Midjourney — запатентованный генератор изображений, который создаёт картинки на основе текстовых подсказок. С июля 2022 года он находится в стадии открытого бета-тестирования. К чести Midjourney художники могут удалить свою работу из набора данных для машинного обучения, отправив соответствующий запрос.

С помощью Midjourney можно создавать арты, отдавая специальные команды боту в Discord. Чтобы начать процесс, вам нужно напечатать команду /imagine и отправить текстовое описание картинки. В ответ вы получите изображение, «придуманное» нейросетью.

С помощью Midjourney вы сможете создать несколько концептов или прототипов и показать их клиентам, чтобы презентовать им будущую идею. Это также отличное подспорье в разработке маркетинговой стратегии, поскольку вы сможете быстро делать эскизы во время мозгового штурма, а затем выбрать наиболее жизнеспособные.

Если вы хотите делать веб-дизайн, попробуйте Midjourney совместно с ChatGPT — чат-ботом, который генерирует реалистичный текст, похожий на тот, который мог бы написать человек. Midjourney поможет вам создать иллюстрации для продукта, а ChatGPT напишет весь текст — от заголовков до названий кнопок. Если вы не разбираетесь в программировании, используйте no-code конструкторы для создания дизайна сайта.

Дизайн приложения для доставки еды, выполненный Крисом Людерсом в Midjourney

DALL-E

DALL-E — инструмент машинного обучения, созданный OpenAI. Он, как и другие генераторы изображений, создает цифровые арты на базе текстовых подсказок. В апреле 2022 года разработчик анонсировал выпуск DALL-E 2. Это бесплатная расширенная версия, которая способна сочетать различные концепции и стили, генерируя картинки в более высоком разрешении.

С ноября 2022 года разработчики могут интегрировать инструмент в собственные приложения с помощью API. Вы можете найти ИИ-генератор изображений DALL-E в Microsoft Bing и Microsoft Edge под названием приложение Designer и инструмент Image Creator.

Помимо высокого разрешения эта нейросеть предлагает широкий выбор стилей: начиная с фотореалистичного и заканчивая эмодзи. Более того, этот ИИ способен переставлять объекты и создавать сложные композиции в иллюстрации без подробных описаний. Если результат вас не устроит, вы сможете сгенерировать несколько вариантов изображения, отредактировать или расширить их область. Таким образом, эта нейронная сеть — оптимальный вариант, если вам нужно несколько вариантов изображений с различными модификациями.

Результат работы DALL-E 2 в ответ на текстовую подсказку «a soup as a portal to another dimension» (суп как портал в другое измерение)

Disco Diffusion

Disco Diffusion или DD — это диффузионная модель, написанная на языке программирования Python. Она работает в Google Colab и создает арты на базе текстовых подсказок. В отличие от ИИ, о которых мы писали выше, DD хороша в создании абстрактных произведений искусства с яркими цветами и композициями.

По сравнению с конкурентами или Stable Diffusion, DD предоставляет больше параметров, которые можно настроить на свой вкус. В результате вы получите результаты в разных стилях и с различными эффектами. Более того, DD лучше понимает сложные текстовые подсказки. Поэтому этот генератор можно использовать для создания ярких, художественных концепций, таких, словно их нарисовали кистью.

Изображение Чэн Хэ

Artbreeder

Artbreeder – совместная веб-платформа, которая работает на базе машинного обучения. С её помощью пользователи могут создавать и корректировать портреты, пейзажи и другие арты.

Название платформы (art — искусство, breeder — специалист по разведению животных) тесно связано с алгоритмом её работы. В процессе создания арта вы настраиваете различные ползунки, которые называются генами. В разделе «Портреты» они отвечают за пол, волосы на лице, серьги, очки и т.д. Кроме того, изображение можно скрестить с любым другим артом на сайте. С помощью другого ползунка вы можете контролировать, насколько сильно «родители» будут влиять на своего «ребенка».

Artbreeder — отличный ИИ-генератор изображений, если вам нужно создать персонажей разного пола, рода занятий и расы. Эта нейронная сеть поможет сэкономить время и усилия.

Nvidia GauGAN

Если вам нужен инструмент для генерации фотореалистичного изображения пейзажей, тогда Nvidia GauGAN — для вас. Он назван в честь знаменитого художника-постимпрессиониста Поля Гогена.

Улучшенная версия, GauGAN2, предлагает два способа создания изображений. Первый — обычный, когда вы используете текст или фразу для генерации реалистичного изображения. Меняя подсказку, вы сможете корректировать сцену в режиме реального времени.

Пейзаж, созданный с помощью GauGAN2

Кроме того, можно нарисовать картину специальной кистью, показывая, где расположить облака, море, почву или лес. С помощью фильтров можно полностью изменить освещение или стиль живописи.

GauGAN — спасение, когда для продукта или брендинга нужны фотореалистичные изображения, но у вас нет времени на фотосъёмку или поиск картинок в гугле.

EbSynth

Ищете инструмент для преобразования видео и анимации? Обратите внимание на EbSynth. Он создаёт потрясающие визуальные образы путём сочетания отснятого материала и изображений.

Это проще, чем кажется. Возьмите видео, его фрагменты, анимацию или 3D-рендер. Затем выберите один ключевой кадр и примените к нему нужный стиль живописи. Отдайте их EbSynth, и он скорректирует все остальные ключевые кадры. Нейронная сеть поддерживает альфа-канал, поэтому вы можете работать с прозрачным фоном, отделяя объекты от фона.

В результате вы сможете превратить видео или нарисованную от руки анимацию в рисованный фильм. Такой стиль определенно произведёт сильное впечатление на аудиторию. Просто взгляните на пример ниже:

Dream by WOMBO

Dream by WOMBO — ещё один ИИ-генератор изображений на базе текстовых подсказок. Однако он немного отличается от других нейросетей. Dream предлагает готовые стили: реалистичный, экспрессионизм, HDR, праздничный и другие, а в качестве эталона вы можете выбрать собственное изображение или NFT.

В платном тарифе инструмент предлагает расширенные возможности: вариации, Discord-бота для генерации, видеоформат и другие. У Dream простой интерфейс, и он позволяет создавать впечатляющие арты, стилизованные под нарисованные картины, в разных стилях менее чем за минуту.

Скалы на закате в разных стилях

Нейронным сетям предстоит пройти ещё долгий путь

ИИ-генераторы изображений — большой шаг вперёд. При правильном использовании они действительно могут ускорить процесс проектирования, позволяя вам переключиться на другие задачи. Однако они не смогут конкурировать с человеком ещё лет десять. Только люди могут создавать передовые дизайнерские решения и осмысленное искусство. Поэтому считайте ИИ ещё одним полезным инструментом для личного использования или оптимизации внутренних рабочих процессов, а не врагом.

Более того, когда появятся более умные нейросети, вероятно, возникнут новые профессии. Они будут служить связующим звеном между ИИ и работодателем. В существующих должностях появятся новые обязанности, например, взаимодействие с генераторами изображений. В конце концов, мы уже не вернёмся к исходной точке.

В нашем Телеграм-канале UX Teddy публикуем так же переводы практических статей из блога UX Movement — подписывайтесь!