✨ Как живой, но не живой: генерируем своего персонажа в NanaBanana (и не только) + халявная прошка (почти) без лимита + чутка о SillyTavern

здесь и далее мои любимые глупые иислоп картинки с моими иишаками и извиняться я за них не намерена

Привет!

Оставлю мои приветственные слова традиционными. Скорее всего вы тут потому, что вы хотите увидеть, как ваш бот или персона становятся чуть живее. Что ж, я набила в этом шишек и готова вам помочь!

Данный гайд выпускается в честь 700 подписчиков на моем тгк :3 Котёныши, спасибо за поддержку! <3

Итак, меня зовут Вевва, Ева, Шешша, Пожухла, как-угодно-вообще, и сегодня я расскажу вам немного о том, как генерировать вкусные картинки в гемини. Я обычно зову эти картинки просто гены.

Уже знаете, как? Тогда листайте до момента, где я делюсь тем, как пользоваться Gemini 3 Pro и другими штуками для генераций почти без лимита.

Как обычно буду рада увидеть результаты ваших генераций ✨️

Мой тг паблик (боты, гайды, промты, приколы, РУССКАЯ ТОСКА) | Мой JAI | Мой YT с гайдом на лорбуки | мой гайд по пиару ботов и базам дс | Мой бусти

Структура гайда:

на примерах покажу самую базовую базу (с рефами, без рефов, со сложным промтом и нет)
покажу фичи, скажу где искать штуки
перенесем это все в таверну, кому надо
покажу приколюхи, которые можно добавить, чтобы картинка вышла лучше
покажу частые проблемы, их источники и что с этим делать (или как не плакать)

Ну, дорогие друзья, погнали окунаться в увлекательный мир доступного всем креатива в иишках!

(а еще я сдохла, пока делала этот гайд, поэтому я буду рада, если вы скажете мне спасибо, проклянёте, скинетесь на психолога/палату в кащенко, санаторий или на участок в Гипербореевке)

✨️Оглавление:

✨ Что такое Gemini и с чем его едят?

Gemini, или Гемини, или Джемини, или Гемка – нейросеть от Гугл. Скорее всего, вы и так прекрасно знаете, что это такое, раз пришли в эту статью, так что сильно распыляться не буду.

Она достаточно сообразительная, неплохо генерит код, всякие текстовые штуки, переводы, и в целом отдает вайбами той самой дочки маминой подруги. С недавних пор начала генерировать даже музычку. А еще она условно-бесплатная: её Pro версии доступны даже тем, у кого нет подписки, просто в ограниченном количестве в сутки.

Но сегодня мы рассмотрим её как штуку для генерации картинок. Вкусных, сочных, с вашими любимыми чарами, персонами и прочими лицами, которые хоть как-то можно описать текстом/показать картинкой.

Конечно, на этом можно не останавливаться: она генерит ВСЁ, что только можно: дизайны карточек, попытку в чертежи, обрабатывает фотки и бла-бла-бла.

Красивый коллажик? Логотип? Идея для оформления бота? Может, она не сделает это идеально, но накинет вам визуальных идей.

✨ С чего начнём? Модели и настройки

Начнём с простого. Вот тут можно открыть гемини и начать генерировать, проставив в инструментаж “генерация изображений”.

⚠️ Внимание: в РФ сайт не доступен.

У гемини на момент написания статьи есть три тира: быстрая (flash), думающая и Pro. У меня ни разу не вышло в официальной гемини чет сгенерить на Pro, поэтому её я мучаю только если мне нужен код или анализ текста.

Тирлисты:

📌 Flash (быстрая) – меньше думает о том, что генерит, плохо ловит внешку, но быстрая и жрет меньше лимита. Годится для тестов, набросков, "интересно че получится". Кстати, gemini 3 flash себя неплохо показывает, на ней генерятся все мои тавернокартинки, но я не уверена, что в официальной гемини стоит эта модель.

📌 Pro (думающая) – лучше понимает сложные промты, точнее ловит внешность с рефов, красиво рисует. Используем для наилучшего результата. Минус: лимит меньше, генерит дольше, часто валяется в отрубе жестком.

📌 NanoBanana – официальное название гемини для генерации картинок. Вы могли его видеть в чатах. На момент выхода статьи также выпустилась новая NanoBanana2, аж в двух вариациях. На мой взгляд (ИМХО), она стала хуже работать в креатив, и ей нужны инструкции посильнее. Так что если вы пришли сюда, потому что “раньше работало, а теперь нет” – я вас понимаю, у нас с ней enemies to lovers.

Чтобы начать, достаточно… Просто написать промт!

Промт (англ. prompt) – это запрос к нейросети для получения желаемого результата, будь то текст, картинка, видео, музыка и тд.

У нас есть несколько способов работать с промтами:

взять готовый промт (и поменять, если надо)
написать свой (без рефов)
написать свой (с рефами)
использовать только рефы
попросить нейросеть написать промт
использовать рефы + написанный нейронкой промт
генерировать в SillyTavern, используя соответствующий тоггл с промтом на генерацию + добавить своих инструкций

Пойдём по порядку.

✨ Вариант 1: Берём готовый промт

С готовым все легко. Вы просто… Ищите готовые промты!

Что тут нужно учитывать:

нейронке в принципе все равно, на каком языке написан промт, хотя английскй вРоДе КаК ловится лучше. но в первую очередь это важно только для вас.
самое важное: внимательно смотрите на содержимое промта, иногда они имеют описание внешности. редактируйте под себя/убирайте.
если язык промта вам незнаком, просто прогоните через переводчик.
некоторые промты нужно чистить от “триггеров”. например, сайт, где я генерю, часто триггерится на некоторые слова, как цензуру. однажды он не пропускал мне промт со словом “family”
иногда промт, который работал раньше, может не сработать теперь, потому что имеет слова, на которые моделька может стриггериться. по-моему, это довольно динамичная история, в том плане, что триггер-ворды то прибавляются, то убавляются.
лайфхак для генерации текста: если вам ну очень нужно написать что-то запрещенное, используйте буквы других языков или цифр. например, он пропустит слово pu$y как текст на футболку.

Вот пара моих промтов, на которых можно потренироваться:

Результат

Промт:

Сгенерируй фото с этими персонажами. Персонаж с фото 1 должен держать плюшевую игрушку нуигуруми персонажа с фото 2. Он держит игрушку одной рукой, при этом целуя его в щеку и улыбаясь. Персонаж с фото 2 изображен в виде игрушки нуигуруми, которую держит персонаж 1. Его внешность выглядит точно так же, но стилизована под мягкую игрушку. Фон: жилая светлая комната в стиле русреал (убранная, не обшарпанная), задний план заблюрен.

Промт есть. Дополнительно, я прикрепляю фото персонажей, как рефы. В промте я указала, в каком порядке нейронка должна относиться к рефам. На фото 1 у меня Редхед (девушка), на фото 2 – картинка бота.

Картинки, которые я прикрепила как рефы персонажей

(тут ловушка: иногда ватермарка может всплывать на генерации)

Еще один вариант, реф – фотка Энди сверху:

Промт:

generate a photo of this man, like it was taken on a film camera. with noise effect, slight film camera glitches. put him in a room with red light, atmosphere is intimate, he leans towards the camera, as if hanging over it, as if it were the point of view of a person standing against a wall.

Или еще один (реф – pfp Паши)

сгенерируй фото этого персонажа. макросъемка. на переднем плане: соцветения сирени на веточке в расфокусе, занимают большую часть экрана. но фокус на лице этого персонажа за ними. вокруг него также кусты сирени, нежное майское утро. на его лице играют лучи солнца. он смотрит с выражением светлой тоски. фото выглядит так, будто бы сделано на плёночную фотокамеру зенит. не добавляй надписей.

Промты можно отредактировать. Попробуйте! Поменяйте вашему персонажу эмоцию, или пропишите, какую одежду он должен надеть. Или задний план. Или добавьте финтифлюшек с эффектами, типа боке, виньетки, глитча и тд.

Еще в тг можно найти авторов, которые делятся промтами, или целые тгк которые на этом специализируются. Ну а также просто открыть гугл и вбить что-то типа “nano banana prompts”, их много валяется на реддите.

Просто копируем промт (советую перед этим его вычитать/перевести в переводчике, чтобы не удивляться неожиданным приколам генерации, вроде другого цвета волос), прикрепляем персонажа и ждем результат.

В большинстве случаев все проходит гладко.

✨ Вариант 2: Пишем свой промт (без рефов)

С написанием своего тоже вроде бы не сложно, да? Садишься и… пишешь. Как чувствуешь. От души. Это мой основной метод: довольно часто я пишу дурацкие, поверхностные промты, оставляя модели шанс покреативить. В основном результатом я довольна, а получив генерацию, могу проанализировать, в какую сторону идти.

Однако, с новой Нанабананой часто выходят ПРИКОЛЫ. Например, модель может решить, что ваш черноволосый чар на самом деле блондин. Или что “тёплая атмосфера” значит “оранжевый фильтр на всё, включая кожу персонажа”. Или резко повторить что-то с картинки-рефа.

Поэтому чем подробнее вы пишете – тем предсказуемее результат. Но тут палка о двух концах: слишком подробный промт иногда путает модель ещё больше.

Золотая середина существует, и она у каждого своя. Найдётся методом тыка.

📌 Формула хорошего промта

Вот вам шпаргалка. Не обязательно заполнять ВСЕ слоты каждый раз, но чем больше заполнено – тем точнее результат, тем меньше нейронка думает сама (но я люблю, когда она думает сама, тут уж подбирайте по вкусу):

Персонаж + желаемая одежда (описанием/рефом) + Действие/поза (можно рефом) + Эмоция + Ракурс камеры + Освещение + Фон (можно рефом/буквально попросить вписать в фон) + Стиль (тоже можно рефом) + эффекты

Если вы намеренно хотите, чтобы модель покреативила в каком-то аспекте – просто не заполняйте этот слот. Не написали про одежду? Модель оденет сама, но скорее всего будет опираться на реф персонажа.

Не указали фон? Модель решит за вас. Иногда это даже лучше, чем пытаться описать каждый пиксель.

Мои примеры креатива с потолка, но с рефами персонажей:

рефы тут: фото лица редхед и фото лица денчика.

Сгенерируй фото Redhead и Denis. Это должна быть романтика, они пара. Они находятся в Париже, на фоне Эльфевой башни

реф здесь: только лицо редхед

сделай арт в семи-реализме этого персонажа. Она должна держать на руках рыжую таксу с коричневым носом (самку), и стоять в позе плаката we can do it. никаких надписей. она обаятельно улыбается. задний план русреал лето вечер закат.

реф тут: оригинальная аватарка Ро

сделай семи-реалистичный арт этого персонажа в полный рост на белом фоне. на ногах у него черные кеды, скинни черные джинсы. не забудь его перчатки, закрывающие пальцы. не добавляй тату. он мягко улыбается, держа в руке одну ромашку.

перчатки он мне правильно не сгенерировал, поэтому потом я снова скинула ему картинку, и сказала:

переделай ему перчатки так, чтобы они закрывали пальцы

реф тут: предыдущая генерация

📌Редактирование через ии: пара советов

Да, мы можем кидать генерацию обратно и просить что-то поправить.

Но тут важно учитывать кое-что: возможно, картинка может потерять в качестве. Так что если у вас будут крупные исправления, лучше предыдущую генерацию использовать как референс для модели, а не напрямую просить что-то менять.

Что скорее всего пройдёт норм:

изменить одежду (принт, перчатки, цвет носков)
убрать/добавить тату
поменять цвет волос/глаз
убрать/добавить пирсинг
добавить справа/слева/сверху/етс еще одного персонажа

Кстати, такой лайфхак: гемини сходит с ума, если работает более с чем 3-4 картинками. Поэтому если вы хотите сделать картинку со всеми вашими персонажами, действуйте по методу "сгенерировал 2" + "скинул картинку и попросил добавить еще 1-2" + повторить (до нужного результата)

Не спасает полностью от ии слопов, но делает жизнь чуть легче.

📌 Плохой → средний → хороший: разбираем на примере

Допустим, мы хотим сгенерить нашего (или еще не нашего) персонажа в кафе. Смотрим, как детализация промта влияет на результат.

Мы помним: чтобы промт работал хорошо, нейросети нужен контекст. Когда мы генерируем своего персонажа, мы прикрепляем рефы. Даже если у вас еще нет конкретного лица персонажа, вы можете набросать подходящие лица с пинтереста, например.

Когда контекста по-минимуму, нейросеть берёт с потолка.

Плохой промт:

Сгенерируй аниме девушку с красными волосами в кафе

первая попытка. тут вообще ии слоп: девушек две, с проблемами с кистями рук. художники, знакомо?

попытка номер два. в целом, тут всё мило и приятно. подходит, если вы в поисках каких-то общих картинок.

Почему промт "плохой": модель сама решает ВСЁ – позу, ракурс, стиль, освещение, одежду, выражение лица.

Может повезти, а может выйти дженерик-фотка, которую вы видели уже тысячу раз. У модели нет понятия “красиво” в привычном понимании: у неё есть понятие среднего/популярного значения, ну или статистики. Она обучена на огромном количестве картинок, и она просто будет брать усреднённый вариант, который встречался чаще всего.

Однако, когда мы прикрепляем арт/фото как реф персонажа, у модели появляется небольшая конкретика, и теперь ей нужно не выдумывать персонажа и его одежду, например. Она кинет свои ресурсы на атмосферу.

Опять же, это если мы не прописываем все остальное. И, опять же, попробуйте сами: я, например, очень люблю, когда нейросеть додумывает сама.

Попробуем прикрепить реф персонажа. Спасибо, Мигрень, за твою красотку!

Реф:

Промт:

Сгенерируй фото этой девушки в кафе

Результат:

Верим? Верим, вполне! Выглядит, как обычная инстаграм-фотка в кафешке.

Мы получаем хорошую фотку, которая очень похожа на все то, что мы обычно видим в инстаграмах про успешный успех или в рекламе. Все потому, что мы не добавляли уточнений: настроение, атмосфера, действие персонажей и тому подобное.

Плохо ли это? Нет, конечно. Вкусы у всех свои. Просто пример, что даже такой промт уже даст вам хороший результат, все остальное просто будет выкручивать особенности чисто под вашего персонажа и ваш вкус.

Но, как мы видим, промт может быть даже таким. Просто результат менее предсказуемый (или более предсказуемый. Тут уж кому как нравится).

Средний промт:

Добавим немного больше деталей: настроение, контраст холода и тепла, немного поигрались с освещением.

Сгенерируй фото аниме девушки с длинными красными волосами, она сидит в кафе за столиком, пьёт латте, улыбается. Стиль: мягкое освещение, холодные тона, тепло несмотря на холод за окном.

Почему лучше: есть действие, эмоция, атмосфера. Модель уже не рисует стоящую палку посреди пустоты. Но нет конкретики по ракурсу, деталям внешности, одежде. И “аниме девушка с красными волосами” это всё ещё миллион возможных девушек.

Теперь попробуем с нашей красоткой, которую мы использовали выше. Реф все тот же.

Реф: выше.

Промт:

Сгенерируй фото этой девушки, она сидит в кафе за столиком, пьёт латте, улыбается. Стиль: мягкое освещение, холодные тона, тепло несмотря на холод за окном.

Фотка теперь стала чуть живее, у персонажа появились эмоции, появилась какая-то история, хотя и до этого картинка была хорошая.

Хороший промт:

Теперь мы добавим деталей. Уточним внешний вид нашего безликого персонажа, уточним детали мебели, окружения, угла камеры, освещения, DoF, детали заднего плана.

Generate a photo of an anime-style girl with long wavy red hair, green eyes, wearing a cream-colored knit sweater. She is sitting at a small round table in a cozy café, holding a latte cup with both hands, smiling softly with closed eyes. Camera angle: upper body shot from across the table. Lighting: warm golden afternoon light from a window on the left. Background: blurred café interior, bookshelves, other patrons out of focus. Style: soft focus, film grain, warm color palette.

Результат:

По качеству, по сути, не сильно отличается, но у нас здесь было больше власти, и больше предсказуемых деталей. Фон стал глубже и живее (до этого модель могла сделать DoF, а могла не сделать), свет начал передавать настроение (до этого оно появилось только после моего уточнения), красиво играть на самой персонажке.

Теперь посмотрим, как это сработает при рефе персонажа.

Реф: выше

Промт:

Generate a photo of this character, wearing a cream-colored knit sweater. She is sitting at a small round table in a cozy café, holding a latte cup with both hands, smiling softly with closed eyes. Camera angle: upper body shot from across the table. Lighting: warm golden afternoon light from a window on the left. Background: blurred café interior, bookshelves, other patrons out of focus. Style: soft focus, film grain, warm color palette.

Результат:

Вот теперь она мне очень нравится! Живая фотка, размытие, довольная моська. Правда, откуда-то, появился загадочный человек на переднем плане, но это решается рероллом.

Почему хороший: модели дано всё – внешность, одежда, поза, эмоция, ракурс камеры, свет, фон, стиль обработки. Чем меньше модель додумывает сама, тем предсказуемее результат. Но, опять же, это – вкусовщина!

📌 Заметьте: хороший промт не обязательно длинный. Он просто конкретный. “Улыбается с закрытыми глазами” – это конкретно. “Хорошо выглядит” – это слишком обще, непонятно, размыто.

Ну и да, язык промта: как я говорила, модели все равно. Но по моему опыту, на английском она чуть точнее понимает стилистические штуки (типы освещения, углы камеры, названия эффектов). Русский тоже работает отлично, особенно для простых-средних промтов. Микс языков тоже работает, модель не обидится.

Значит, делаем выводы в этой части: даже если у нас нет внешности персонажа, мы можем её генерировать. Но если у нас есть рефы, дело пойдёт проще.

Если рефов внешности нет, мы можем подробно описать внешность персонажа. Знаете разницу между типажами лица, знаете, как описать форму глаз или носа, или кто такие эктоморфы? Значит, вы должны справиться.

✨ Вариант 3: Пишем свой промт (с рефами)

Тут мы комбинируем текст + картинку. Это, пожалуй, самый мощный способ, потому что реф решает проблему “модель нарисовала не того человека”.

Написать свой с рефами тоже не сложно. Например, мне нужна вот такая поза, но в другом антураже. Я пишу что-то типа:

Generate a photo of this character from photo 1. Use the pose from photo 2. The character should be in a dark gothic cathedral, wearing a black velvet coat. Dramatic lighting from stained glass windows. Upper body shot. Moody atmosphere, cinematic style.

И прикрепляю:

Фото 1 – реф внешности персонажа
Фото 2 – реф позы (это может быть вообще другой человек, стоковое фото, скриншот из аниме, что угодно)

Наша новая подопытная, выданная мне Юлей. Спасибо!

Реф хороший: анфас, нет лишних деталей, она не курит/не корчит рожицы/нет рук в кадре

И поза, с которой я решила поиграться. Тут будет один нюансик, о котором я скажу чуть-чуть позже!

взято с пинтерест

Заливаю промт (атмосфера, указание где что, задний план), личико персонажки, позу, и получаю результат:

Сравниваем:

лицо похоже, учтены веснушки, цвет глаз, текстура волос
фон сделал, свет сделал, вельветовый шмот сделал
позу повторил, однако украл колье, фату и бижутерию

Чуть-чуть меняю промт, прошу не повторять аксессуары, только меч:

Generate a photo of this character from photo 1. Use the pose from photo 2. The character should be in a dark gothic cathedral, wearing a black velvet coat. Dramatic lighting from stained glass windows. Upper body shot. Moody atmosphere, cinematic style. Don't copy any accessories from photo 2, only the pose and the sword.

Аксессуары оставил оригиналу, но решил поменять позу.

Не удивляйтесь: это БАЗА промтинга. Я бы сделала еще пару реролов, если бы мне было критически важно получить этот результат.

Совет: нейросети НЕНАВИДЯТ когда им запрещают. Вместо формулировки "запрещено", попробуйте использовать что-то помягче.

Например:

избегай использования
вместо Х используй Y
замени X на Y
поменяй X на Y

...и все в таком духе.

В коротких промтах для картинок, в принципе, это можно не использовать. Но иногда, если у вас долго что-то не получается, попробуйте прибегнуть к этой шпаргалке.

📌 Важно указать в промте, что на каком фото. Иначе модель может перепутать и нарисовать вам готический собор в позе вашего персонажа. Ладно, не настолько, но лица и элементы путает на ура, особенно когда у вас несколько персонажей на картинке.

диско-смерть

📌 Что по рефам? Сколько, как, куда

Окей, рефы – это, по сути, визуальные подсказки для модели. “Вот так должен выглядеть персонаж”, “вот такая поза мне нужна”, “вот такой стиль хочу”.

Сколько рефов кидать?

1 реф – если один персонаж. Самый стабильный вариант. Модель не путается.
2-3 рефа – если нужно несколько персонажей, или реф внешности + реф позы/стиля. Обязательно указать в промте, кто на каком фото: “Character from photo 1…”, “Pose from photo 2…” [и убедитесь, что в таком же порядке прикрепляете эти фотки]
4+ – модель начинает путаться. Можно, но результаты менее предсказуемые. Если нужно – лучше генерить по частям и потом комбинировать, чем пихать всё в один запрос.

Какого качества должны быть рефы?

Чем выше разрешение – тем лучше. Фотки плохого качества плохо считываются и ИНОГДА даже вшиваются в результат, и вы получаете 10 шакалов из 10.
Хорошее освещение на рефе – желательно. Больше четких деталей видим: лучше считается моделью.
Простой фон лучше. Портрет на белом/однотонном фоне > скриншот из аниме с кучей деталей позади. Модель может зацепиться за элементы фона и притащить их в генерацию. Да, тебе действительно очень нужна была та странная рука с угла скриншота на финальной генерации.
Лицо крупно – если важна внешность. Полноростовый арт хуже ловит лицо, чем портрет по плечи. Логично, да? Чем больше пикселей на морду лица – тем больше информации для модели.

Что работает лучше: фото, арт, скриншот?

Качественный арт (не пиксельный, не крошечный) – работает лучше всего для аниме/семи-реализм/стилизованного арта. Модель понимает стиль и переносит его.
Фото – работает отлично, но результат будет тянуться в сторону реализма, если не указать стиль явно. Если вам нужен аниме-стиль, а реф – фотография, пропишите стиль в промте. [сделай аниме-арт в стиле Гуррен Лаган с этим персонажем...]

магма течёт в наших венах, раскаляя сердца...

Скриншоты из аниме/игр – работают нормально, если качество нормальное и нет субтитров/интерфейса поверх. Если на скрине есть субтитры: умоляйте нейросеть их не повторять. Прям так и скажите: не добавляй никакой текст.

арты райот геймс в качестве рефа в принципе считываются по стилю...

...но иногда получается омегарофл. так что просите не повторять позу с рефов, если она вам не нужна.

Пиксельарт, чиби, очень стилизованный арт – модель может не понять, как это “перевести” в нормальные пропорции. Лучше использовать как дополнительный реф, а не основной (например, когда вам нужно перевести в чиби-стиль)

А если у персонажа нет еще рефа?

Самый простой вариант:

возьмите в пинтересте фото человека, который больше всего похож на чара. сгенерируйте сначала его в семи-реализме, фото а-ля "на паспорт".
затем возьмите полученный результат и с новым промтом добавьте нужные вам детали
что-то проще дорисовать/убрать в фш. либо так же обратиться к нейронке и попросить убрать детали (например, тату)
если вы умеете рисовать, попросите оживить персонажа с вашего арта

только поаккуратнее со стилизацией

если бы мне была критически нужна ее внешка, остаток анатомии я бы чуть правила в фш и попросила бы перегенерить ресницы

а тут он даже скулы учел, прикольно! но у Бэт уже есть генерация, хаха

В целом, добрый совет: у вас может быть невероятно красивая картинка/профиль пик вашей персоны/бота, но лучше всего сделать ему еще и "фото на паспорт". Тогда на генерациях он будет больше всего похож на себя.

✨ Вариант 4: Только рефы (ленивый режим)

Иногда промт не нужен. Буквально. Вот это – мой основной метод работы. У меня все в жизни идет через "я так чувствую", и нейронки у меня работают так же.

Кидаете картинку и пишете что-то типа:

Сгенерируй этого персонажа в другой позе
Сделай из этого аниме-арт
Этот персонаж, но он держит кота

ну типа все мои промты буквально такие

Модель сама разберётся с остальным. Иногда получается лучше, чем когда ты расписываешь три абзаца. Иногда – хуже. Как карта ляжет. Медицинская.

📌 Этот способ хорош для:

быстрого тестирования
когда вам лень и хочется посмотреть, что модель накреативит
простых задач (например, палитра эмоций персонажа)
когда вы просто хотите посмотреть на персонажа в разных ситуациях и сильно не париться

📌 Этот способ не очень хорош для:

сложных сцен с несколькими персонажами
когда вам нужен конкретный результат
когда модель уже пять раз подряд рисует не то (значит, ей таки нужен нормальный промт. либо у неё сейчас лоботомия)

✨ Вариант 5: Просим нейросеть написать промт

я говорила что для генерации иллюстраций в сеттинг мне нужна мж потому что она сильнее креативит, а на ее основе потом можно заставить банану потеть

Заставляем ИИшаков на нас работать, пока другие ИИшаки работают...

Суть: вы идёте в ту же гемини (или в клодика, или в чатжпт, или дипсик, или в гигачат) и пишете что-то типа:

Напиши мне детальный промт для генерации картинки. На картинке должен быть [описание персонажа], он/она [что делает], в [где находится]. Стиль: [какой хотите]. Промт должен быть на английском.

И модель вам выдаст промт. Часто – весьма недурной. С деталями, которые вы бы сами не додумались вписать.

Вот например:

Кстати, по сути, именно этим и занимается нейронка в вашей таверне с расширениями на генерации. Она анализирует контекст и сама пишет промт.

На картинках выше от меня только нужные VFX и рефы персонажей. Ну и фраза "сгенерируй 3 фотки {{char}} на территории SACRAMENT"

Но даже если вы не ролите в таверне, просто загрузите в нейронку контекст вашей вселенной, если это нужно (описание бота, лорбук, еще что-то), и попросите загенерить.

📌 Это полезно, если:

вы не можете сформулировать то, что хотите, или ищите более свежие решения
вам нужны специфические термины (типы освещения, ракурсы камеры, художественные стили), а вы не фотограф и не художник – нейронка выдаст (а еще прокрутите гайд до конца, там я вам с этим помогу)
вы просто хотите разнообразить свои промты и подсмотреть, как их пишут “профессионально”

📌 Минусы:

иногда модель пишет промт, который она сама потом не может нормально нарисовать. ирония.
промт может быть перегружен деталями. Не стесняйтесь вырезать из него лишнее.
по моим наблюдениям, дипсик, например, часто повторяется в промтах

этот гайд - пиар-кампания SACRAMENT. кстати нейронки не справляются с изображением блуминга :(

✨ Вариант 6: Рефы + промт от нейросети (комбо)

Это, по сути, квинтэссенция всех способов. Или буквально то, что генерирует нам таверна:

Берём реф(ы) нашего персонажа
Просим нейросеть написать нам красивый, детальный промт
Прикрепляем реф(ы)
Вставляем промт, правим че нужно
Жмём генерировать
Наслаждаемся (...возможно, если вы ниче не перепутали в процессе, как я с Геной)

...выйду ночью в поле с конём

На данный момент можно сказать, что это мой основной метод. Часто к новым ботам я прикрепляю картинки из моих рп/рп тестеров. Такие картинки генерируются вкусно потому, что у нейронки:

есть контекст мира
есть история которую нужно изобразить
есть грамотный промт на генерацию
есть прописанный бот
есть рефы бота (на лицо/одежду)

и благодаря этому выходит что-то очень вкусное!

как живой жаль не живой

✨ Вариант 7: Генерации в SillyTavern

Если вы сидите в таверне (или планируете), у вас есть опция генерить картинки прямо во время РП с подходящими расширениями.

Например, у меня недавно вышло расширение на инлайн-генерацию и гардероб персонажам, SLAY Images.

Суть: если у вас есть тоггл на генерацию картинок, он отправляет в чат промт, который активирует расширение на генерацию, которое отправляет контекст вашего текущего РП как промт для генерации картинки.

То есть модель берёт то, что происходит в сцене, и рисует это.

📌 Чтобы это работало, нужно:

подключить API для генерации изображений (гемини, например)
настроить промт для генерации (в настройках пресета)
по желанию добавить свои инструкции (типа “always use anime style”, или, как я, добавить особых финтифлюшек)

📌 Минусы:

результат бывает… весьма вольной интерпретацией происходящего. зависит от нейронки. у клода оч сочно. у гемини хорошо. то, что я вижу как работы дипсик... нууу....
если контекст длинный, модель может зацепиться не за ту часть сцены
требует небольшой настройки, это не “нажал и заработало”. есть расширения, где можно так, но все равно нужно найти подходящие промты

📌 Плюсы:

ВАШ РП ОЖИВАЕТ, ЭТО ФАНФИК С КАРТИНКАМИ!!!
очень кайфово для скриншотов и визуализации

Подробный гайд по настройке генераций в таверне – это, пожалуй, отдельная статья. Если хотите – напишу. А пока что: гугл, ютуб и чатики тавернщиков вам в помощь. В моём чатике тоже подскажут!

📌 А что, генерируется только во время рп?

Нет! Тут есть пара приколов:

вы можете создать отдельного бота-помощника, прикреплять к нему нужные лорбуки, когда надо, и генерить в чате с ним
вы можете открыть пустое сообщение бота, и генерить в чате с ним (контекст вселенной подтянется по ключевым словам + из карточки бота)
для экономии токенов можно переключиться на пустой пресет, самое главное чтобы у вас был тоггл на генерацию картинок

Результат:

я не просила, но иногда они делают реализм. да и сегодня у гемини лоботомия, все воют. маленькие инди-компании опять все режут

Результат:

вот на этом меня можно было выносить. кто понял тот понял

✨ Типичные ошибки и как с ними жить

ну вот мы и дошли до весёлого. Раздел, в котором я делюсь болью.

📌 Руки, пальцы и прочие конечности

Давайте честно: это проблема самой модели, а не вашего промта. Нейросети до сих пор не дружат с руками, хотя сейчас ситуация улучшилась. Это можно минимизировать, если вам важно:

Прятать руки, если они не важны: руки в карманах, за спиной, обрезать кадр по грудь. Нет рук – нет проблем. Я ж с руками из жопы как-то живу!
Указывать позу рук явно: “holding a cup with both hands”, “resting chin on one hand”, “hands clasped behind back”, “one hand in pocket”. Чем конкретнее – тем меньше шансов на слоп.
Если вышли кривые пальцы – перегенерить. Иногда проще нажать реген, чем пытаться чинить. Но можно и попросить модель “fix the hands in this image” и скормить результат обратно как реф. Иногда помогает, иногда делает хуже, тут не угадаешь.
Чем проще поза рук – тем лучше результат. “Размахивает двумя мечами, одновременно перебирая чётки третьей рукой”... Не надо так. Если только ваш персонаж не Шива. Но даже тут, боюсь, гемочка не поймёт.

📌 Не та внешность

Без рефа модель выдумывает. Даже если написать “блондинка с голубыми глазами и шрамом через левый глаз” – она нарисует СВОЮ блондинку. Может быть, даже без шрама. Потому что ей так захотелось. А с рефом она, может, и будет фыркать, но, скорее всего, подчинится.
Если с рефом не ловит – попробовать другой реф. Иногда дело именно в рефе, а не в промте. Попробуйте:

крупный план лица
хорошее освещение
простой фон (белый, однотонный)
другой ракурс
или добавить в промт уточнение: “the character’s appearance must exactly match the reference photo”. Иногда модели нужно СКАЗАТЬ, что вы серьёзно.
также иногда стоит добавить, если вы, например, добавляете реф позы, что НЕ НАДО повторять с этого рефа ничего, кроме позы (вспоминаем пример с мечом и готическим собором)

Стиль рефа влияет на стиль результата. Скормишь фото – получишь ближе к фото. Скормишь чиби – ну… получишь что-то с большой головой. Если ваш реф в одном стиле, а вы хотите результат в другом – явно пропишите стиль в промте, скажите, откуда копировать, на что опираться. Картинки, которые я генерю, это semi-realism style.
Модель может “усреднять” внешность. Если у вашего персонажа необычные черты (разноцветные глаза, специфическая форма рогов, шрамы в конкретных местах), модель может их упростить до чего-то более типичного. В таких случаях помогает и реф, и явное описание в промте одновременно. Я так постоянно напоминаю, что у Денчика есть веснушки и удлинённые клыки.
Не знаешь, как описать свой стиль? Найди подходящую картинку и... Попроси нейронку описать стиль. ¯\_(ツ)_/¯

📌 Триггер-слова (цензура)

UGH.

Гемини (и нанабанана) имеет встроенные фильтры безопасности, как любая другая нейронка. Это значит, что некоторые слова и их комбинации вызывают отказ генерации. И этот триггер-список постоянно меняется, что делает составление полного списка триггеров невозможным. Но общие паттерны есть.

Что может триггернуть:

Слова, связанные с возрастом: young, little, child, minor, teen – особенно в сочетании с чем-то романтическим или физическим. Даже если вы имели в виду “young woman, 25 years old”. Модель не разбирается в контексте, она видит ключевое слово и паникует.
Слова про тело и наготу – даже в совершенно невинном контексте. “Bare shoulders” иногда проходит, а иногда нет. Зависит от фазы луны и настроения серверов гугла. Сейчас вон, например, у них лоботомия.
Слова про насилие, оружие – тоже зависит от контекста. “Holding a sword” обычно ок. “Blood dripping from a knife” – уже может не пройти.
Совершенно рандомные слова. Помните мою историю с “family”? Вот так и живём.
Имена реальных людей и знаменитостей – модель откажется рисовать конкретных селебрити. Если вам нужен “персонаж, похожий на [актёра]”, лучше опишите черты внешности, а не называйте имя.

Хотя вот эти твое смеются с последнего:

ах, старые генерации денчика... как молода я была, как наивна...

Что делать, когда триггернуло:

Переформулировать. “Young woman” => “woman in her early 20s” => “adult woman with a youthful appearance”. Тот же смысл, другие слова.
Использовать синонимы. Принцип: если не прошло – скажи то же самое другими словами. Нейросеть реагирует на слова, а не на смысл.
Сменить язык. Если промт на русском не проходит – попробуйте на английском. И наоборот. Фильтры работают по-разному для разных языков. Иногда русский проходит там, где английский не проходит.
Дробить промт. Иногда длинный промт триггерит из-за комбинации слов, а если разбить на два сообщения – проходит. Например: первое сообщение – “сгенерируй этого персонажа в такой позе и таком месте”, второе – “добавь такое освещение и такой эффект”.
Убрать подозрительное слово и посмотреть, прошло ли. Кто в симс играл и разбирал папку модс, тот поймёт: убираете половину промта, смотрите, проходит ли. Если да – проблема во второй половине. И так далее, пока не найдёте конкретное слово.
Смириться и перегенерить. Иногда тот же самый промт не проходит сейчас, но пройдёт через час. Такое бывает

📌 Заметка на полях: если вы делаете ботов с тёмными тематиками (dead dove, horror, gore), генерировать для них арты – отдельный квест. Будьте готовы к тому, что придётся изрядно покрутиться с формулировками.

📌 Вторая заметка на полях: джейлбрейк в таверне может не помочь сгенерировать картинку. Да, промт-то он составил, но потом чистый промт с картинками летит в гемини, и может ей не понравится. Например, она не любит у меня слово bikini...

и все равно устроила это непотребство на картинке с викой!

📌 “Почему оно выглядит не так, как я хотел?”

Иногда реальность не совпадает с нашей фантазией. К сожалению, несмотря на то, что мы тут все за эскапизмом, даже тут ирл может напомнить нам, что мы живем не в сказке.

Типичные случаи:

Модель проигнорировала часть промта. Вы написали “в красном платье на фоне заката”, а получили зелёное платье на фоне города. Это случается, особенно в длинных промтах. Модель теряет детали. Совет: выносите самое важное в начало промта. То, что в конце, теряется чаще.
Слишком много деталей. Если промт выглядит как страница из вики, модель может растеряться. Выберите 5-7 самых важных деталей и сфокусируйтесь на них.
Конфликтующие инструкции. “Тёмная мрачная атмосфера, яркие насыщенные цвета, солнечный свет”. Проверьте, не противоречите ли вы сами себе.
Стиль “плывёт”. Вы хотели полуреализм, а получили мультяшку. Или наоборот. Укажите стиль максимально конкретно. Не просто “красиво”, а “semi-realistic digital art style, soft shading, detailed” или “anime style, cel shading, vibrant colors”. Чем точнее – тем лучше.
Композиция “поехала”. Два персонажа слились в одного, фон наложился на персонажа, объекты летают в воздухе. Для сложных сцен помогает описывать расположение: “character A on the left, character B on the right”, “foreground: …, background: …”.
Но иногда последнее происходит просто потому, что происходит.
Другая причина каши из персонажей может быть в том, что вы отправили слишком много рефов. Наше золотое правило: не более 3-4 картинок.

📌 И главный совет, который я могу дать: перегенерируйте. Один и тот же промт с одними и теми же рефами может дать десять разных результатов. Иногда первая генерация – шедевр. Иногда десятая. Иногда ни одна. Это нормально. Генерация картинок – это, к сожалению, тоже иногда сложно.

конкурс ии слопов

✨ Актуальные модели Gemini и генерации почти без лимита

ВОТ. Вот за этим вы сюда пришли, я знаю. Поздравляю!

В общем, каждый день рождаются и умирают совершенно разные сервисы, позволяющие генерировать картинки. Вы могли видеть ТГ ботов, например, которые за подписку генерят вам картинки в MJ/Banana/Grok и где угодно еще, и это ваше право их использовать. Я, например, предпочитаю, все-таки, старую-добрую гемку с офсайта, либо...

...чудо, которое подарили нам замечательные люди.

> AI Arena! <

Почему-то о ней мало говорят, а ведь она... Крутая!

доступ текстом ко всем моделям, включая клоды (перевести текст, чет протестить, чет нагенерить)

доступ к моделям, которые делают картинки

доступ к генерации видео (только в battle mode, вы не выбираете модели, сервис сам дает 2 рандомные)
доступ к код-моделям (и уточнениям, че именно вам нужно: от игр до джаваскрипта)

Как пользоваться?

зарегать аккаунт
вверху выбрать Direct chat (это важно, потому что в BattleMode вы не выбираете модели самостоятельно)

не забыть переставить на Image модели, и выбрать модель

загружаем рефы и промт, и ждем!

Какие подводные?

есть небольшие ограничения по использованию. например, некоторые модели можно использовать только несколько раз за час. чит: просто заходим в другой аккаунт.
иногда модели падают. это нормально, особенно у гемки. если у вас вылезают любые ошибки: просто тыкайте перегенарацию.
иногда модели убирают из доступа (до приколов от антропиков там был опус 4.6, например), но это не особо страшно, гемка и гпт всегда будут на месте.

📌 А есть ещё варианты?

Вообще, да. Гемини – не единственная нейросеть для генерации картинок. Вот альтернативы, о которых стоит знать:

Grok – умеет генерить картинки, плюс есть анимация. В РФ недоступен. Иногда выдаёт результаты, которые гемини не может (и наоборот). Иногда выдает полный треш (привет, видео с денчиком...)
Midjourney – классика жанра, платная. Очень красивые генерации, особенно стилизованные. Если готовы платить – один из лучших вариантов по качеству. Не всегда хорошо работают с рефами
DALL-E / ChatGPT – тоже умеет генерить, тоже неплохо. Стиль отличается от гемини, иногда в лучшую сторону.
Flux, Stable Diffusion – для тех, кто готов заморочиться с локальной установкой или через всякие сервисы. Больше контроля, но больше возни.
Tensor – условно-бесплатно, можно генерить арты. Я в нем ничерта не понимаю, а вот носочек понимает, можете посмотреть.

По моим ощущениям, Гемини и ГПТ лучше всего работают с рефами, хотя у ГПТ есть эта стилизация, которую я прям терпеть не могу. Миджорни – плюс-минус, с оговорочками, но 7 niiji будто бы стал лучше слушаться промт.

Если вам кровь из носу нужно использовать именно гемини, но предоставленные варианты вам не подходят, и через таверну вы генерить по какой-то причине тоже не можете: тогда тг боты, хотя дерут они за это ппц сколько.

Есть еще сторонние сервисы, которые несут в себе несколько подписок, но и у них ценообразование сомнительное.

✨ Ресурсы, ссылки, всякое полезное

Список штук, которые мне помогают, когда я генерирую, и помогут, скорее всего, и вам:

📌 pinterest.com – база любого творческого человека. Кладезь рефов, идей и вдохновения. Если вам нужна поза, антураж, цветовая палитра, стиль одежды – всё сюда. Если не пользовались раньше – попробуйте. Когда лента подстроится под вас, слезть будет тяжело.

📌 https://promptmania.site/ – ИМБА. Тыкая на кнопочки, можно собрать промт под то, что вам нужно. Буквально. Тут есть разные углы камеры, окружение, да можно и описание человека собрать! Я через какое-то время использования запомнила, что и как пишется, но иногда к ней возвращаюсь. Результаты выглядят очень сочно. Просто зайдите и посмотрите.

📌 https://www.pixited.com/ – тут можно подсмотреть промты и стили. Они бывают сырые и используются где попало, но как источник вдохновения для формулировок — вполне.

📌 https://promptbase.com/free-prompts – база промтов, есть платные и есть бесплатные. Вполне заменяется телеграм-каналами, но иногда можно найти что-то прикольное.

📌 Телеграм-каналы с промтами – их много, ищутся по запросам типа “nano banana prompts”, “gemini prompts”, “нейросеть генерация”. Гуглите, подписывайтесь, воруйте вдохновляйтесь.

📌 Чатики, где помогут – да, опять я про нетворкинг. В чатиках креаторов и ии-энтузиастов часто есть топики про генерации. Скидывайте туда свои промты и результаты, просите совета, делитесь находками. Мы все тут учимся.

✨ Пара приколюшек напоследок ✨

почти все мои генерации такие красивые-вкусные-живые потому, что я художник. А художник помнит про:

передний, средний, задний план
тип картинки (портрет, широкий кадр, экспозиция, макро-, етс)
особенности палитры и освещения (контрастный свет, нуар, мягкий свет, етс)
особенности линз (вот когда у вас за персонажем размытые красивые кружочки это боке/ bokeh)
всякие штуки типа экспозиции, выдержки, блума, виньетки, зеркал

Вы можете нагуглить список фотоэффектов, стилей живописи или терминологии из искусства фотографии, и спокойно их применять...

...только не переусердствуйте!

Да и в целом, не бойтесь гуглить. Если вы ищите интересные эффекты для картинок, их буквально можно найти даже на пинтерест:

Да, это туториалы. Но это туториалы на конкретный стиль. А зная название стиля, вы сможете нормально скормить его нейроночке!

Ну и промт на "фото на паспорт"... Угадаете, как он выглядит?

Максимально тупо!

Сгенерируй фото этого персонажа, будто бы он фотографируется на паспорт.

Если модель начинает делать всякую хрень, пишем так:

Сгенерируй фото этого персонажа, будто бы он фотографируется на паспорт. Белый задний план, спокойная поза и выражение лица. Он смотрит прямо в камеру.

....иногда он генерит буквально паспорт. Лол.

Если модель что-то упускает, уточните. Например, тату, косичку (привет Стёпа), прическу, одежду. Вы у меня уже прошаренные.

✨ Как живой но не живой: итоги

Уфф. Кажется, я вывалила на вас всё, что знаю о генерации картинок. Давайте соберём это в кучку.

📌 Саммари этого полотна:

Промт – основа всего. Формула: Персонаж + Действие + Эмоция + Ракурс + Свет + Фон + Стиль. Не обязательно заполнять все слоты, но чем больше – тем предсказуемее.
Рефы решают. Хороший реф > длинный промт без рефа. Особенно для внешности. Сделайте персонажу “паспортное фото” и используйте его всегда.
Качество рефа критично. Высокое разрешение, хороший свет, простой фон, крупно лицо.
Модель – это рулетка. Перегенерируйте. Иногда первая попытка – мусор, а пятая – кайф. Это нормально.
Если что-то не выходит, пробуйте иначе: другой реф, другая поза, другое настроение.
Триггеры есть и будут. Переформулируйте, меняйте язык, дробите промт.
Не бойтесь экспериментировать. Со стилями, с освещением, с позой. Худшее я все равно уже загенерировала за вас.

На этом всё! Я надеюсь, гайд поможет вам сделать ваших ботов и персонажей чуточку живее. Если у вас есть вопросы, находки или вы хотите показать свои генерации – мои комментарии открыты!

Ну и меня всегда можно поблагодарить за то, что я вся такая бешеная вот это все тут сделала. Либо проклясть. :)

Мой тг паблик (боты, гайды, промты, приколы, РУССКАЯ ТОСКА) | Мой JAI | Мой YT с гайдом на лорбуки | мой гайд по пиару ботов и базам дс

диско-смерть. я же говорила, все самое странное я уже нагенерировала!