Искусственный интеллект
August 28, 2023

Простые советы по созданию собственных иллюстраций с помощью ИИ

Время прочтения — 8 минут.

прим. ред. Мы уже переводили первую статью Тома Кульмана о генерации картинок. Посмотреть можно вот здесь. Эта статья является продолжением той, но вы спокойно можете читать ее отдельно.

О чем поговорим сегодня?

Короткой строкой: советы для создания ИИ картинок

Будьте последовательны, начинайте с простых запросов, учитывайте предвзятость ИИ, и все будет отлично!

Об авторе:

Том Кульман — главный архитектор обучения в Articulate (в том самом, да).

Оригинал статьи: https://blogs.articulate.com/rapid-elearning/simple-tips-on-creating-your-own-illustrations-with-ai/


Далее текст автора

Я, как и многие из вас, возился с различными приложениями генеративного ИИ. Я пытаюсь понять, как я могу использовать их в своей работе, а также научиться хорошо работать с различными инструментами искусственного интеллекта. Поскольку я создаю онлайн-курсы, я работаю над созданием собственных иллюстраций, которые хорошо работают.

Все начинается с подсказки (Prompt)

Секрет получения правильных изображений заключается в подсказках. Сложность работы с искусственным интеллектом исходит из двух вещей:

  1. никогда не знаешь, какое изображение в итоге получишь;
  2. если получишь хорошее изображение, можешь не получить такой же результат снова.

Свою работу по генерации изображений я начинаю с простых подсказок без лишних деталей. А затем работаю дальше.

Я также смотрю на другие ИИ-изображения, которыми делятся люди в сообществе, и когда нахожу то, что мне нравится, пробую их подсказки, чтобы посмотреть, что же получится у меня.

Чаще всего в подсказках я указываю персонажа, действие и стиль. В зависимости от того, что мне нужно, я могу добавить локацию или же еще какие-то другие элементы, чтобы создать дополнительный визуальный контекст.

Персонаж

В языковых моделях ИИ заложена большая предвзятость. Например, если я наберу слово «бизнесмен», то в 99% случаев это будет белый бизнесмен в костюме. Почему белый? Почему костюм? Это нужно учитывать при создании персонажей.

Независимо от предубеждений ИИ, я начинаю с чего-то общего, например, с «бизнесмена». Обычно ИИ выдает мне белого парня в костюме. Но для начала это нормально. Как только я найду подходящий образ, я изменю описательную часть. Вот несколько советов, как получить лучших начальных персонажей:

  1. Добавьте к простому «бизнесмену» возраст и посмотрите, что получится. Я считаю, что «40-летний» — отличное дополнение.
  2. Неважно, что у вас получится, главное — посмотреть, сможете ли вы придумать что-то последовательное.
  3. Сейчас есть много хороших видеороликов и статьей о том, как писать подсказки. Чем больше вы практикуетесь, тем лучше у вас получается.
  4. В какой-то момент я перестаю экспериментировать над одной картинкой и иду дальше. Моя цель — найти простой способ получить достаточно хорошее изображение. Играть в ИИ часами (или днями, что обязательно может произойти) — это весело, но не то, что я могу себе позволить делать длительное время.

Как видно на приведенных ниже изображениях, для начала получаются довольно приличные начальные картинки. Я могу продолжить работать с ними.

Изображение взял там же. Перевод: подсказка: бизнесмен, жестикуляция, плоская векторная иллюстрация.

Действие

Описывая действия, вы получаете позу, которую хотите использовать. Я придерживаюсь простого подхода.

  1. Мне нравится использовать слово «жестикуляция» (gesturing) в подсказке. Это дает мне возможность разнообразить положение рук.
  2. Добавьте эмоцию или состояние, например, «растерянность» или «гнев».
  3. Я также меняю позу и могу использовать «скрещенные руки» (arms crossed) или «руки на бедрах» (hands on hips).
  4. Экспериментируйте и смотрите, что получается.

Вы заметите, как меняются изображения от добавления нескольких простых слов.

Изображение взял там же. Перевод: подсказка: бизнесмен, жестикуляция, в замешательстве, плоская векторная иллюстрация.
Изображение взял там же. Перевод: подсказка: бизнесмен, жестикуляция, злой, плоская векторная иллюстрация.
Изображение взял там же. Перевод: подсказка: бизнесмен,скрещенные руки, в замешательстве, плоская векторная иллюстрация.
Изображение взял там же. Перевод: подсказка: бизнесмен, руки на бедрах, в замешательстве, плоская векторная иллюстрация.

Рассматривая приведенные выше изображения, вы заметите, что стили довольно сильно меняются. Вы также можете заметить, что получаете в итоге не ту позу, которую ожидали. Например, вы пишите «руки на бедрах», а получается «скрещенные руки». С этим придется смириться.

По мере того как вы будете практиковаться и узнавать, как писать подсказки, вы сможете разрабатывать более последовательные стили.

Стиль

Как уже говорилось выше, выработать единый стиль может быть крайне непросто. Во многом это зависит от того, как вы пишете подсказки и как вы их корректируете в процессе практики.

Для иллюстрированных персонажей мне нужен похожий стиль и белый фон, чтобы его было крайне легко убрать. По умолчанию я использую стиль подсказок «плоская векторная иллюстрация» (flat vector illustration), поскольку он хорошо подходит для оформления многих электронных учебных курсов. Кроме того, в большинстве случаев он работает стабильно. И даже если иллюстрированные символы неодинаковы, они часто достаточно близки, чтобы использовать их вместе.

Я играю с уникальными описаниями стилей. Например, я пишу «в стиле [добавляю дескриптор]».

Изображение взял там же. Перевод: подсказка: бизнесмен, жестикуляция, говорит, плоская векторная иллюстрация, в стиле Крюдсона*.

прим. редакции: по всей видимости, речь идет о Грегори Крюдсоне, американском фотографе.

Изображение взял там же. Перевод: подсказка: бизнесмен, жестикуляция, говорит, плоская векторная иллюстрация, в стиле Тима Бертона.

Рассмотрев приведенные выше изображения, можно заметить, что добавление описания стиля к «плоской векторной иллюстрации» позволяет получить более конкретный стиль, приближенный к единообразию.

Бонусный совет: избавляемся от фона

Изображение в формате ИИ — это только отправная точка. Часто приходится вносить некоторые правки в руки, лица и т. д. Одна из главных задач — получить прозрачный фон, чтобы я мог разместить изображение там, где мне нужно. Чтобы получить как можно более чистый фон, я добавляю подсказку: «белый фон» (white background). Это работает в 90% случаев. На рисунке ниже — та же подсказка «руки на бедрах», что и выше, с добавлением «белого фона» в подсказке. На рисунке ниже — та же подсказка «руки на бедрах», что и выше, с добавлением «белого фона» в подсказке.

Изображение взял там же. Перевод: подсказка: бизнесмен, руки на бедрах, в замешательстве, плоская векторная иллюстрация, белый фон.

Преодоление предвзятости ИИ

Как я уже отмечал выше, у ИИ существует встроенная предвзятость, которая может отражаться на поле и расе, а также на стиле одежды. Вы можете смягчить некоторые из них, изменив дескриптор. Как только я найду стиль изображения, который мне нравится, я начну добавлять дополнительные описания, чтобы получить более разнообразных персонажей. Через некоторое время у меня уже есть разнообразный набор персонажей, из которых можно создавать новые.

Изображение взял там же.

Следует также учитывать собственную предвзятость. Например, я могу искать определенный образ, а затем предположить, что он подходит просто потому, что «я так вижу» этого персонажа и то, что он должен представлять.

Таковы основные советы по созданию собственных персонажей с помощью искусственного интеллекта. В следующем посте я расскажу о своем секретном соусе и о том, что я делаю для ускорения работы и как я редактирую персонажей.