July 13

Генерация контента

Нейросети для работы с изображением

Нейросети, основанные на глубоком обучении, стали распространять в области обработки изображений. Эти искусственные нейронные сети автоматически извлекают признаки из входных изображений, что позволяет решать различные задачи, связанные с обработкой и анализом обработки информации. В этом уроке мы рассмотрим основные технологии, используемые в нейросетях для работы с изображениями, а также рассмотрим их применение в различных объектах.

1. Сверточные нейронные сети (CNN)

Сверточные нейронные сети (Convolutional Neural Networks, CNN) широко используются для обработки изображений. Они успешно применяются в жалобах, обнаружении объектов, сегментации и многих других.

Особенностью CNN является использование сверточных слоев, которые снимают фильтры для выделения различных признаков изображения. Последующие объединения слоев (объединение) уменьшают размерность данных, что позволяет сети скорректировать с более выявленными изображениями.

2. Автокодировщики (Автокодировщики)

Автокодировщики - это нейронные сети, используемые для безупречного восстановления входных данных. Они входят в состав энкодера, который сжимает входное изображение в латентное представление, и декодера, который восстанавливает изображение из этого представления.

Автокодировщики широко используются в задачах сжатия изображений, а также в генерирующих моделях, таких как генерирующие состязательные сети (GAN). В этом случае они позволяют генерировать новые изображения на основе обучающего набора.

3. Рекуррентные нейронные сети (RNN)

Рекуррентные нейронные сети (рекуррентные нейронные сети, RNN) применяются в задаче, предоставляются с обработкой последовательностей, таких как текст и видео. Хотя они широко применяются для анализа текста, они также подходят для обработки видео как последовательности изображений.

RNN увеличивает запоминаемость информации о предыдущих состояниях, что делает их воспроизведение для воспроизведения последующих состояний.

Применение нейросетей в обработке изображений

  1. Классификация изображений: Нейросети, в частности свертки, применяемые для преследования изображений. Они могут распознавать объекты на фотографиях, определять наличие и класс автомобиля на дороге, а также решать задачи диагностики.
  2. Детекция объектов: С помощью сверточных нейронных сетей можно выделить объекты на изображениях. Это находит применение в автономных автомобилях, источники безопасности, источники слежения за объектами и др.
  3. Сегментация изображений: Нейросети позволяют разделить изображение на семантические части и определить, к какому классу относится каждая область. Это важно для обработки результатов анализа спутниковых изображений и других объектов.
  4. Перенос стилей: Нейросети изменяют стиль изображения, перенося художественные особенности одного изображения на другое. Используется в креативной графике и фотообработке.
  5. Улучшение качества изображений: с помощью подключения нейронных сетей можно улучшить разрешение и качество изображений, что находит применение в расширении изображений, видеонаблюдении и других раскрытиях.

Что можно создавать с помощью этих нейросетей: иллюстрации к детским книгам, рисунки для информационных бюллетеней, концепт-арты, персонажей для игр, мудюорды для консультаций по дизайну, раскадровки фильмов и многое другое.

Теперь приступим к изучению нейросетей.

DALL·E (Временно недоступна)

https://openai.com/dall-e-2

Плюс: Это одна из самых простых нейросетей.

Минус: Платное использование.

Сегодня мы попробуем поработать с бесплатной версией, поэтому проходим регистрацию и нажимаем: "Try DALL·E".

Формируем запрос. Например: "Иллюстрация к сказке про девочку, стоящую в лесу, которая умеет говорить с животными"

❗️Не забываем, чем точнее и сложнее запрос, тем лучше на выдаче мы получим изображение.

Работаем с вашим изображением в DALL·E.

Загружаем в нейросеть наше изображение, например фото руки, пропускаем обрезку.

Видим синюю рамку на нашем изображении. Это та область, с которой будет работать нейросеть, на некоторых изображениях она может быть меньше и ее можно передвигать.

Загружаем наше фото, стираем ластиком область на руке, где будет располагаться браслет.

Формируем наш запрос, через переводчик, на английском языке: "diamond bracelet". Получаем готовые изображения в четырех вариантах.

Также на изображениях можно изменять предметы одежды, менять их цвет, добавлять различные предметы, например деревья, в разных стилистиках (мультики, аниме и тд).

LEXICA (Временно недоступна)

https://lexica.art/

Нажимаем на вкладку "Generate" , формируем свой запрос, (мы снова просим сделать нам иллюстрацию к сказке, про девочку говорящую с животными).

В пишем Negative prompt - что вы видеть не хотите и генерируем изображение.

Получается очень красиво.

SeaArt

https://www.seaart.ai/

SeaArt - это эффективный и удобный инструмент для рисования с использованием ИИ.

Данная нейросеть позволяет легко создавать высококачественные изображения, не требуя профессиональных навыков, что делает её пригодной для самых разнообразных сфер. Также она может быстро создавать реалистичные и высококачественные изображения в соответствии с индивидуальными требованиями.

Независимо от того, новичок вы или профессионал, вы можете найти свой эксклюзивный стиль рисования и уникальное художественное выражение в SeaArt.

Вы можете создавать 100 изображений бесплатно каждый день. При превышении лимита, токены будут вычтены в соответствии с потребляемой мощностью графического процессора. Жетоны можно получить, выполняя задания и участвуя в официальных мероприятиях фан-сообщества.

Перейдем на сайт и ознакомимся с интерфейсом.

ВАЖНО! Вход в нейросеть нужно осуществлять с включенным VPN!

После регистрации вводим наш ник и выбираем стили, которые нас интересуют.

После попадаем на главную страницу и нажимаем "Рисование ИИ".

Краткий гайд по рисованию

Сразу обозначу основные важные термины:

  • Промпт - ваше текстовое описание, что вы хотите нарисовать
  • Модель/чекпоинт - то, на каких изображениях была натренирована нейросеть, от этого будет очень сильно зависеть то, что получится в итоге, например некоторые модели прекрасно рисуют фотореализм, некоторые аниме, некоторые пейзажи.
  • LoRA - более узкая необязательная надстройка которую можно использовать вместе с моделью, можно использовать сразу несколько. Например можно использовать фотореалистичную модель, добавить в нее LoRA Бритни Спирс и Брэда Питта, чтобы увидеть как примерно могли бы выглядеть их дети.
  • Токен - внутрення валюта которая тратиться на генерацию изображений и которую можно копить, пока все бесплатно и можно копить на будущее!

А теперь инструкция по рисованию:

Нажимаем Рисование ИИ

Попробуем сгенерировать рандомное изображение.

Выбираем SeaArt 2.0 для ручного выбора модели и LoRA или другие режимы для автоматического выбора

  • Ниже выбираем Модель и LoRA - это самые важные опции, с которыми вам будет интересно поэкспериментировать с одинаковым промптом
  • Дальше идет несколько не столь важных настроек, которые влияют, в основном, на скорость генерации и/или потребление токенов, если вам это неважно, то лучше оставьте все кроме, Размера изображения, как на скриншоте, а размер можете изменить под ваши нужды
  • В расширенные настройки, поначалу, можно не лезть. Единственная полезная функция для новичка - это список негативных промптов, то есть то, что мы не хотим увидеть, но даже это все обычно неплохо заполняется автоматически
  • Собственно, для начала это все, но на левой панели есть еще очень важные инструменты!
  • Создать - можете создать свой публичный канал и делиться шедеврами
  • Img2Img - там вы можете загрузить свое изображение и уже на его основе частично или полностью нарисовать свое, там можно автоматически или вручную выделять области для перерисовки, а также попробовать автоматически определить текстовое описание изображения
  • ControlNet - более продвинутая версия Img2Img для более узких нужд, например, извлечь только позу персонажа или линии архитектурного объекта, для всех опций есть описания, лучше нажмите на них и изучите все
  • Расширение - дорисовать рисунок за его границами
  • Upscale - увеличить разрешение изображения.
  • Студия промптов - здесь вы можете быстро из короткого промпта создать более точный и развернутый промпт

Теперь познакомимся с еще несколькими нейросетями и сервисами, которые работают с изображениями.

Runway

Следущий сервис, онлайн редактор, который вмещает в себя десятки разных инструментов и нейросетей.

В ней можно полноценно создать изображения и видео. Углубляться сегодня в него не будем, мы уделим этому сервису отдельный урок.

Плюс: простой интерфейс;

Минус: редактор платный, бесплатное использование возможно, но с ограничениями.

Letsenhance.io

Платная нейросеть, с помощью которой можно улучшать качество фотографий и изображений.

Topaz labs

Аналогичная нейросеть, платная, улучшает качество фотографий. Также работает с видео.

Retouch Me

Плагин для автоматической ретуши фотографий. Она делает профессиональную, точечную ретушь, как профессиональный ретушер-фотограф.

Плюс: отличный вариант для заработка на ретушировании фотографий, даже если вы не фотограф.

Минус: платное использование.

Imagineme

Нейросеть по фотографии и придуманному вами тексту создаёт любой образ, который только можно вообразить буквально за пару минут.

Benzin

https://benzin.io/ru/

Российский бесплатный сервис по удалению фона, где работает нейросеть.

Очень прост в использовании, для начала работы не нужна регистрация. Интегрируется с 1С, здесь удобно создавать карточки товаров с белым фоном и загружать в интернет-магазин.

Интегрируется с API документацией (нужна регистрация и АРІ-

ключ). Пока работает только с компьютера, но мобильное приложение уже в разработке.