Профили героев
February 14

Как выглядит мой идеальный герой?

"Черпай вдохновение в себе" - примерно с таким подходом я дожила до своих N лет, не закончила толком ни одной книги и не стала писателем. И отчего-то хуже всего вдохновение черпается, когда дело доходит до внешности персонажей, о которых я вроде как должна писать, как о живых людях. Но достоверно представить на бумаге героя, имея представление о его внешности на уровне цвет глаз, цвет волос и рост, - непосильная задача.

Моя беда в том, что, вероятно, я неправильный автор. Мне тяжело в мелочах представлять внешность своих героев. Обычно я твердо уверена в каких-то отдельных чертах. Например, я всегда точно знаю цвет волос и глаз моих персонажей. Обычно могу представить их комплекцию. Но вообразить каждую черточку... нет.

Раньше я часами шерстила интернет в поисках фотографий незнакомых людей, 3D портретов и аниме. Эти изображения служили референсами, помогали подстегнуть воображение и сделать моих героев более живыми и осязаемыми - хотя бы для себя самой.

Но сейчас я несказанно рада, что в нашу повседневную жизнь ворвались нейросети. Мне не надо добиваться от них идеального сходства с воображаемым образом, а совсем наоборот - как раз от нейросети я ожидаю четкий портрет по моим смутным описаниям, к которому впоследствии смогу обращаться.

Практически все умные книги по писательскому мастерству призывают к читерству. Разглядывай людей, подслушивай людей - примерно так вкратце звучат эти советы, лишенные налета вежливости и уважения к личным границам.

Тем не менее, я решила не пренебрегать рекомендацией и понаблюдать за людьми вокруг. Оказывается,если оторвать взгляд от экрана телефона и нескончаемой ленты безрадостных новостей, то можно обнаружить себя посреди удивительной картотеки будущих героев.

Я устроила себе небольшой челлендж: в течение 5 дней находить в толпе одно лицо, которое зацепило меня больше остальных, и создавать его словесный портрет.

Пожалуй повторюсь: не встретить в метро k-pop идола или Анджелину Джоли, а найти лицо, на которое захотелось посмотреть второй раз. Причём, необязательно привлекательное - вряд ли все герои вашей книги будут выглядеть так, словно с книжных страниц шагнут сразу на подиум.

В итоге у меня начала собираться "галерея персонажей", которой я смогу воспользоваться в будущем - во всяком случае, для создания второстепенных героев точно.

И коли уж я люблю все классифицировать и писать инструкции, то дальше текст от душнилы, которая:
- Воспринимает нейросети как чудо
- Пользуется ими для кустарного решения собственных маленьких задач и радуется любым условно удачным решениям
- Не понимает как это все работает, не зарабатывает этим и не стремится

У меня сразу сложилась система каталога для портретов. И так как пока что это просто лица "отложенные на будущее", то у них нет имён, профессий и эпохи. Они не опубликованы и их истории ещё не описаны. Поэтому каждый такой персонаж я классифицирую по полу, возрасту (в годах), возрастной группе (ребёнок, подросток, young adult, взрослый, пожилой) и цвету волос. А имена у них одинаковые: Jane Doe, John Doe, Baby Doe...

Когда для кого-то из "палетки" найдётся место в романе, я возьму его из каталога и дам уникальное имя, биографию и цель, но пока это безымянные лица, грубо прописанные сухими словами.

Мне нравится "прогонять" получившийся набор черт через разные нейросети, чтобы посмотреть насколько непохожими получаются одни и те же люди через призму разных тренировочных датасетов.

Моя неразделенная любовь, конечно, Midjourney. Разделила нас необходимость её оплачивать. Своих героев ненаписанного романа я отрисовала именно в ней, и коли уж пока нет острой необходимости в суперкачественных портретах, то я скупердяйничаю с прицелом на будущее.

Что есть из бесплатного?

  • Бот Kandinsky в телеграмме, как правило, неважно справляется с моими запросами, но у него есть неоспоримое преимущество в плане доступности - все происходит в чате, отправить описание можно сразу и при первом результате уточнить очевидные огрехи в описании. К тому же бот взаимодействует с пользователем на русском, поэтому дополнительных "подпрыгиваний" удастся избежать.
  • Мой русскоговорящий бесплатный фаворит Fusion Brain, требующий простой регистрации. По сути тот же Кандинский, но более тонкой настройки. Основное преимущество взято у нейросети Stable Diffusion, а именно: негативный промпт - то есть возможность указать нейросети чего именно не должно быть на картинке без использования отвергаемых нейросетями отрицательных частиц.
  • Stable Diffusion будет требовать от вас постановки задачи на английском, но с такими помощниками как ChatGPT или GigaChat это перестаёт быть камнем преткновения. Являясь пионером, StableDiffusion выдаёт очень интересные результаты, но не терпит запросов с наскока и непродуманных промптов. Тут интересно посмотреть сразу 2 формата - бесплатно и без регистрации WebUi, с регистрацией и 10 бесплатных картинок в день. Результаты по одному и тому же запросу отличаются, и не всегда можно угадать в каком окне сгенерированная картинка окажется лучше.

Проблемы с нейросетями, на которые я милостиво закрываю глаза:

  • У меня не всегда получается побороть любовь нейросетей к бородатым мужчинам
  • Нейросети приукрашивают реальность, они делают портреты более приятными глазу, потому что их так научили
  • Не всегда можно угадать, какую часть промпта нейросеть сочтет оскорбительной. Например, Кандинский отказался генерировать мужской портрет с "близко посаженными глазами"

Ну и закончу развлекательным контентом для привлечения внимания - те самые Джейн и Джоны.

Палетка персонажей

Jane Doe Blonde 35

Возраст: 35. Пол: женский. Фенотип: нордический тип внешности. Форма лица: широкое. Цвет волос, длина, прическа: блондинка, длинные, прямые, убраны назад. Цвет глаз и форма, расположение: голубые, небольшие, расположены близко к переносице. Форма, размер носа: длинный, крупный. Форма, размер губ: крупные, бледные. Форма, размер, цвет бровей: светлые, тонкие, вразлет. Подбородок: тяжелый. Кожа - цвет, состояние: бледная, тусклая. Рост: 180. Осанка: ровная. Особенности внешности (морщины, шрамы, родинки и т.д): нос доминирует на лице. Эмоциональное состояние: сосредоточенная.

Ближе всех по ощущению, которое оставила у меня встреченная незнакомка, оказался FusionBrain, хотя не удержался от того, чтобы ей польстить.

Jane Doe Red 30

Возраст: 30 лет. Пол: женский. Форма лица: узкое, овальное. Цвет волос, длина, прическа: ярко-рыжие, крашеные волосы, волнистые, длина до плеч. Цвет глаз и форма, расположение: миндалевидные, карие, темная подводка. Форма, размер носа: нос маленький, аккуратный. Форма, размер губ: пухлые, нежно-розовые. Форма, размер, цвет бровей: темные узкие длинные брови. Подбородок: заостренный, маленький. Кожа - цвет, состояние: ровный, бледный тон, пудра. Эмоциональное состояние: надменная. Рост: 170 см. Осанка: прямая. Одежда и стиль: японский.

Stable Diffusion не угадал с цветом волос, но в остальном оказался намного ближе к описанному оригиналу

John Doe Black 22

Возраст: 22 года. Пол: мужской. Фенотип: европейская наружность. Форма лица: длинное, овальное, как будто вытянутое вперед с выступающими скулами. Цвет волос, длина, прическа: черные, короткие, разделены на боковой пробор, зачесаны назад. Цвет глаз и форма, расположение: большие, карие глаза. Форма, размер носа: крупный, треугольный. Форма, размер губ: тонкие, вытянутые.

Откровенно говоря, ни один портрет не получился даже близко похожим на оригинал. Есть мегастрашный вариант от Dalle (из ChatGPT), однако, несмотря на его карикатурность, очень четко оказались переданы и общее впечатление от человека, и черты лица в целом - я считаю его бесспорным лидером.
Версия Dalle

John Doe Grey 42

Возраст: 42 года Пол: мужской. Фенотип: славянский тип лица. Форма лица: широкое, черты крупные, резкие. Цвет волос, длина, прическа: седой, залысины, волосы ниже плеч, собраны в пучок на затылке. Цвет глаз и форма, расположение: круглые, блеклые. Форма, размер носа: крупный, картошкой. Форма, размер губ: крупные, поджатые. Форма, размер, цвет бровей: редкие. Подбородок: крупный, тяжелый, гладко выбрит. Кожа - цвет, состояние: крупные поры. Особенности внешности (морщины, шрамы, родинки и т.д): глубокие морщины на лбу, резкие складки у рта. Эмоциональное состояние: раздраженный. Рост: 175. Осанка: сутулый, пивной живот

С Kandinsky мне так и не удалось договориться относительно собранных в пучок волос, хотя эта важная часть образа. Веб версия (посередине) оказалась очень близка к оригиналу, а версия с регистрацией оставляет впечатление более мягкого человека.

John Doe Copper-Red 30

Возраст: 30 лет. Пол: мужской. Фенотип: славянская внешность. Форма лица: овальное. Цвет волос, длина, прическа: медно-рыжие, короткие, волнистые. Цвет глаз и форма, расположение: голубые, расположенные близко друг к другу. Форма, размер носа: маленький, острый. Форма, размер губ: тонкие. Форма, размер, цвет бровей: темные, тонкие. Подбородок: узкий, маленький, безвольный, гладко выбрит. Кожа - цвет, состояние: бледная, чистая. Эмоциональное состояние: надменный. Рост: 175. Осанка: ровная.

Как я ни уговаривала, Kandinsky отказался сбривать бороду и усы и демонстрировать безвольный подбородок, да и в целом не угадал от оригинала примерно ничего (кроме цвета волос и глаз). А вот Stable Diffusion постарался на славу, но только в одном варианте мне удалось убедить нейросеть отказаться от рисования растительности на лице (которой у "исходника" не было).

Вот настолько непохожими получаются портреты у разных нейросетей, сделанные по описаниям с одними и теми же грамматическими ошибками. В результате, это не пять персонажей, а больше двадцати (считая тех, что остались за кадром).

Было бы интересно посмотреть портреты, созданные более опытными пользователями по этим описаниям. Но блог из меня, снова меня и опять меня, увы, ведется в формате "сам шучу - сам смеюсь".