Как распознать содержимое любого изображения и получить промпт для генераций похожих картинок? img2txt

Достаточно часто, особенно у новичков, возникают сложности с написанием промптов для генерации изображений в нейросетях Stable Diffusion и Midjourney. С помощью этой короткой статьи вы решите данную проблему. Процесс преобразования изображения в текст называется "img2txt".

Итак, суть предлагаемого нами варианта заключается в том, чтобы понять, как сами нейросети "видят" содержимое того или иного изображения, а потом просто делать так же, как это делают они.

Мы подготовили специальную функцию в @yes_ai_bot, которая отправит любое ваше изображение на распознание в нейросеть, а та сообщит, что изображено на картинке.

В результате такой простой манипуляции вы получите готовый промпт (текстовое описание), который в будущем можно использовать для генерации собственных изображений.

Обратите внимание, что распознание содержимого не даст вам описание, которое позволит на 100% повторить изображение.

Что нейросеть способна определить на изображениях:

положение камеры относительно объектов на изображении
освещение, погоду и пр.
цветовую гамму, яркость, контрастность и пр.
микро- и макроэлементы
людей и их эмоции
имя художника и название стиля, которое позволит изобразить что-то подобное

Как получить готовый промпт по изображению или фотографии:

Зайдите в @yes_ai_bot в мессенджере Телеграм
Отправьте боту картинку, которую хотите распознать
В появившемся меню выберите пункт "🧠 Распознать промпт"
Дождитесь результата

Для отправки фотографий в приложении Telegram нужно нажать на символ со скрепкой 📎 слева от строки ввода сообщения.

Процесс распознания содержимого картинки может занять до нескольких минут.

На нашем изображении нейросеть распознала следующий промпт:
a man in a suit and tie looking at the camera with a serious look on his face and chest, Anthony Angarola, realistic shaded perfect face, a character portrait, figurativism

...переведем на русский язык: мужчина в костюме и галстуке смотрит в камеру с серьезным выражением лица и груди, Энтони Ангарола, реалистичное затененное идеальное лицо, портрет персонажа, фигуративизм.

Как видно из промпта, нейросеть справилась хорошо, но может появиться вопрос "Кто такой Энтони Ангарола?", ведь на фотографии явно изображен актер Кевин Спейси. Все очень просто, Энтони Ангарола — это американский художник, рисунки которого искусственный интеллект счел похожими по стилистике с загруженным нами изображением.

Кстати, под текстом распознанного нейросетью промпта находится кнопка "👁️ Сгенерировать", при нажатии на которую вы сразу получите изображения, созданные искусственным интеллектом по полученному ранее текстовому описанию.

Не забывайте, что результат генерации зависит не только от промта, но и от того, какие настройки и стили у вас установлены. На эту тему у нас подготовлено видео с подробным описанием, настоятельно рекомендуем к просмотру:

🚀 Не упустите шанс получить бесплатные знания о нейросетях, включая ChatGPT, Stable Diffusion и Dalle-3.
Подробности по этой ссылке: ОПИСАНИЕ

Загляните на наш сайт - там вы найдете больше информации о нейронных сетях.

URL нашего сайта: https://yesai.su

Полный список статей о боте @yes_ai_bot находится по этой ссылке

По всем вопросам обращайтесь в наше сообщество в Телеграм: https://t.me/yes_ai_chat

Подробнее о сервисе Yes Ai рассказываем в этом коротком видео

Чем могут помочь нейросети в бизнесе?

Узнавайте инсайдерскую информацию на открытом форуме о нейросетях