April 7, 2025

Стикеры с помощью Chat GPT

Сделал для себя пак стикеров в Телеграм с помощью chat GPT, и это был занимательный опыт.

Готовый пак, промт и фото-референс в конце статьи.

Изначально я хотел пойти самым ленивым путем и сгенерить все стикеры на одном холсте. Получилось неплохо, но вместиться в один холст они все же не смогли. А еще «Салам» вышел слишком суровым.

Я внес правки, попросил расширить холст и поработать над эмоциями, такой вышла вторая генерация: в ней персонаж уже имел другие позы и мимику, поехали некоторые текстовые блоки, а последний стикер вовсе занялся обналом (осуждаем).

Оффтоп: если вы хотите заказать рекламный макет (статичный или с анимацией), карточку товара, обложку для песни и прочий визуал, то велком.

Я подумал, что все не так уж и плохо, и текст можно будет добавить в ФШ отдельно, попросил прислать эти же стикеры на прозрачном фоне. Оказалось, что для этого, нейросети нужно заново их сгенерить, но уже без фона. Но при такой генерации сбивается стилистика рисовки:

Я еще немного помучил Chat GPT бесполезными правками, а потом понял, что самое понятное ему техническое задание может написать только он сам. И попросил его сделать это.

Вот промт от самого Chat GPT:

Задание: Cоздать Telegram-стикерпак из 9 стикеров на одной картинке
📌 Основное:
Изображение персонажа (артиста Baltin) в стиле мягкой стилизации, без искажения черт лица, в жилетке с характерным вязаным узором.
Общий визуальный стиль — уютный, тёплый, «ручной», немного мультяшный, но узнаваемый.
Формат стикеров — как в Telegram: с белой обводкой, чёткие, выразительные силуэты.
Цвет фона всей композиции — чёрный, чтобы обводка смотрелась контрастно.
🧶 Тексты на стикерах (в вязаном стиле):
Большое спасибо
Салам!
Что-то не вяжется
Устал
Просто пушка!
Добро
Сделаем!
На согласование
Обнял
Шрифт — вязаный, имитация текстиля или ручной аппликации, но читаемый.
Все тексты — на русском, в одной стилистике, размещены рядом с персонажем (надпись может быть частью образа — нашивка, табличка, облако и т. д.).
🧍 Персонаж:
Парень с короткими каштановыми волосами, в очках, в вязаной жилетке (рефы — твои фотографии).
Каждый стикер с разной мимикой / позой, соответствующей фразе.
Лёгкая мультяшность разрешена, но важно, чтобы сохранялось сходство с артистом.
🖼 Формат итоговой картинки:
Размер: достаточно большой, чтобы удобно было вырезать стикеры (например, 3000+ px по ширине).
Раскладка: 3×3 или 3×4 (если оставить отступы сверху/снизу).
Между стикерами — равномерные отступы (не менее 150–200 px), чтобы удобно вырезать в Photoshop.
Файл: PNG, 300 DPI, прозрачный фон для стикеров, чёрный фон на общем изображении.
Каждому стикеру — белая обводка толщиной ~5% от его размера.

Решено было делать по 3 стикера за одну генерацию, чтобы не вносить правки сразу в 9 стикеров одновременно. Но что-то пошло не так:

Таким образом нейросеть уговорила меня не лениться, а работать над каждым стикером отдельно. И вот он, первый красавчик:

Я обозначил, что этот стикер мы возьмем за эталонный референс и остальные будем делать по его образу и подобию. Chat GPT согласился на словах, а на деле снова начал самовольничать.

Немного другой стиль рисовки и другая текстура текста
Обрезана голова
Текст отдельно от стикера

На этом этапе я попросил уточнить, помнит ли он мои требования к стикеру, оказалось, что помнит:

Образ
Персонаж — ты, в жёлто-зелёной вязаной жилетке, в очках, стилизован под мультяшного героя.
Эмоции и позы — строго соответствуют смыслу фразы.
Стиль
Мультяшный, но аккуратный и узнаваемый.
Белая обводка вокруг каждого элемента стикера (персонаж + текст).
Чёрный фон.
Текст в вязаном стиле, большой, впаян в композицию — персонаж может заходить на него.
Формат
Один стикер за раз.
Пространства достаточно, ничего не обрезано.
Размер адаптивный, но с хорошим отступом для отделения в Photoshop.

Стикер «Зур рэхмэт» получился с первого раза. И я был в шоке с того, что промт я писал с русской «Э», уточнив, что «рэхмэт» — это «спасибо» на татарском, и нейросеть выдала мне слово, написанное на татарском.

Оффтоп: если вы хотите заказать рекламный макет (статичный или с анимацией), карточку товара, обложку для песни и прочий визуал, то велком.

Далее 4-5 стикеров мы сделали без единой правки, а потом он видимо подустал. Начал добавлять в текст лишние символы и снова обрезать стикеры:

Обнто ружал? Почему бы и нет!
У шамана 3 руки и крыло из-за плеча!
Плиз же английское слово, значит и «П» должна быть английской
Вот с этого я орал. Так переживал за дедлайн, что кальян уронил. А его тут даже быть не должно.

В чем проблема

Я подумал, раз он смог объяснить сам себе, что от него требуется, то скорее всего знает, и в чем его проблема. Таков был ответ:

Почему появляются ошибки
История запросов становится слишком насыщенной
Модель пытается учитывать всю предшествующую информацию, и иногда начинает «перемешивать» контекст:
Берёт элементы из предыдущих стикеров (например, кальян для "Насти").
Тянет визуальный стиль или ошибочные буквы из старых версий.
Тексты на кириллице — зона риска
Даже при чётком описании, генераторы могут:
Перепутать кириллицу и латиницу (И vs I, Р vs P, и т.д.).
«Придумывать» буквы или интерпретировать их как текстуру, особенно в вязаном стиле.
Игнорировать расстановку по строкам.
Сложность с удержанием конкретного визуального стиля
Даже если мы нашли идеальный стиль (как в первом «Салам!»), генератор не может "запомнить" и воспроизводить его точно. Каждый запрос считается новым, а «референс» нельзя передать напрямую — только описанием. Но описания могут быть поняты по-разному.
Вязаный стиль + кириллица = особенно хрупкая комбинация
Это очень нестандартное сочетание. Генератор старается интерпретировать вязаную текстуру, а заодно правильно воспроизвести кириллический текст — и в этом месте случаются сбои.
Как это можно обойти:
Делать стикеры по одному, без параллельных генераций.
Чётко фиксировать стиль через референс (как ты сделал со «Салам!»).
При необходимости — вручную вносить правки в графике.
Если хочешь, мы можем зафиксировать визуальный стиль и я соберу шаблоны, которые ты сможешь передавать дальше (дизайнеру или даже в генерации как референсы).
Хочешь — можем перезапустить всё заново, с одним стильно-чистым шаблоном, и на его основе продолжать.

Я конечно же согласился, мы заново делали шаблон эталонного стикера и доработали остатки.

Вот такой пак в итоге получился:

Да, не идеально, где-то различается узор на жилетке, где-то текст разной текстуры и расположен неудачно, но если бы мне еще год назад сказали, что я просто могу загрузить свою фотку в нейросеть и, пообщавшись с ней несколько часов, получить пак готовых стикеров, я бы не поверил.

Кстати да, совсем забыл про фото, которое было референсом.

Вот оно:

А вот универсальный промт, который вы сами можете затестить, вставив свои пожелания:

🎯 Задание: создать один Telegram-стикер в фирменном уютном стиле

📌 Что должно быть на стикере:

  • Персонаж
    Опиши своего персонажа — кто он, как выглядит:
    Например: молодой парень с короткими волосами, в очках, в вязаной жилетке.
    Можно указать: пол, прическу, бороду, одежду и т.д.
  • Эмоция или поза
    Как он себя ведёт, что делает:
    Например: машет рукой, в панике держится за голову, обнимает себя, держит чашку чая и т.д.
  • Текст
    Что написано на стикере —
    Например: «САЛАМ!», «УСТАЛ», «ЗУР РӘХМӘТ», «НАСТЯ, ГДЕ МАКЕТ?»
    Текст всегда на русском (или татарском), в вязаном стиле — как будто буквы сделаны из ниток.
    Пиши в точности, как хочешь видеть — с переносами, с заглавными, без ошибок.

🎨 Как должен выглядеть стикер:

  • Персонаж и текст должны быть в одной композиции, визуально связаны.
  • Фон — чёрный.
  • Вокруг — белая обводка по контуру стикера.
  • Ничего не обрезано — сверху и снизу есть воздух.
  • Текст — вязаная текстура, крупный, читаемый, с белой обводкой.
  • Стиль — мультяшный, тёплый, как наклейка, но без сильных искажений внешности.

А если вы хотите заказать рекламный макет (статичный или с анимацией), карточку товара, обложку для песни и прочий визуал, то велком.