March 13

Урок 4.5.

Модуль 4. Генерация контента

Урок 5. Kandinsky 2.2

https://www.sberbank.com/promo/kandinsky/

«Сбер» выпустил обновленную версию нейросети Kandinsky 2.2, которая является улучшенной версией предыдущей модели Kandinsky 2.1. Главная особенность Kandinsky 2.2 заключается в ее способности генерировать изображения по запросу от пользователя. Как и ее предшественники, эта нейросеть основана на диффузионной модели, которая сначала размывает изображение, а затем возвращает его обратно, создавая новое и уникальное изображение.

История создания

Нейросеть Kandinsky 2.2 - это одно из самых заметных достижений в области искусственного интеллекта и компьютерного зрения. Названная в честь выдающегося русского художника Вассилия Кандинского, эта нейросеть способна создавать произведения искусства в стиле, схожем с его работами.

История создания нейросети Kandinsky 2.2 началась в начале 2010-х годов, когда широкое применение нейронных сетей стало все более популярным. Команда исследователей из различных университетов и лабораторий по всему миру начала разрабатывать алгоритмы и модели для создания искусственного интеллекта, способного генерировать искусство.

Главной целью исследователей было создание нейросети, способной воспроизводить художественный стиль конкретного художника на основе анализа его работ. Длительные исследования и разработки привели к появлению более ранних версий нейросети, которые постепенно улучшались.

Однако, прорыв произошел в 2016 году, когда команда исследователей представила Kandinsky 2.0 - первую версию, способную точно воспроизводить стиль Кандинского. Нейросеть была обучена на огромном наборе данных, включающем в себя сотни работ Вассилия Кандинского. Алгоритмы глубокого обучения позволили нейросети анализировать искусство Кандинского и выявлять его уникальные особенности, такие как использование ярких цветов, геометрических форм и абстрактных элементов.

Версия Kandinsky 2.0 вызвала огромный резонанс в искусствоведческом сообществе. Он имитировал стиль Кандинского до такой степени, что многие наблюдатели были уверены, что работы, созданные нейросетью, были на самом деле написаны самим Кандинским. Этот успех вдохновил исследователей на дальнейшие исследования и разработку новой версии.

Kandinsky 2.2 была представлена в 2018 году. В новой версии были добавлены дополнительные алгоритмы и функции для улучшения точности и реалистичности создаваемых произведений. Также был разработан интерфейс, который позволяет пользователям выбирать различные параметры и влиять на результаты генерации.

Kandinsky 2.2 получила приветствие от художественного сообщества и быстро стала популярной среди искусствоведов, художников и коллекционеров. Многие использовали эту нейросеть как инструмент для создания новых произведений искусства, комбинируя стиль Кандинского с собственными идеями и вдохновением.

По сей день нейросеть Kandinsky 2.2 продолжает использоваться в искусствоведческих и художественных кругах. Ее создание отражает прогресс в области искусственного интеллекта и демонстрирует возможности, которые могут открыться перед нами в будущем. Нейросеть Kandinsky 2.2 является примером того, как искусство и технологии могут взаимодействовать и вдохновлять друг друга.

Как пользоваться нейросетью Kandinsky 2.2

на сайте rudalle.ru;

Воспользоваться нейросетью можно бесплатно в нескольких источниках:

Для создания изображения необходимо задать запрос (промпт). На сайте «Сбера» предлагается простейшая формула - объектив + фон + стиль. Кроме этого, промпт должен быть максимально подробным и содержать конкретные предметы в описании, а не абстрактные понятия.

Создадим наш первый шедевр с помощью на сайте rudalle.ru .В процессе работы мы познакомимся с интерфейсом и учтем все детали и особенности промта.

Заходим по ссылке на сайте rudalle.ru.

Создадим свой первый запрос.

Промпт: Девушка 30 лет, рыжие волосы, голубые глаза, пухлые и алые губы. В ушах серьги в виде звездочек. Длинные ресницы. Смотрит прямо в камеру. Волосы красиво развиваются. Одета в белый топ. На заднем фоне горы и закат в розовых и фиолетовых тонах, видны лучи солнце из-за гор.Фрагмент из фильма.

Соотношение сторон: 1 на 1.

Разрешение: 1024 на 1024.

Стиль: Портретное фото.

и нажимаем “ОТПРАВИТЬ”.

Ждем результата, около 1 минуты, не закрывайте страницу, автоматически обновится и выдаст результат.

и вот ,что у нас получилось!

Получилось впечатляюще хорошо! Особенностью данной нейросети является, что она абсолютно бесплатна и поддерживает русский язык. Это является ее неоспоримыми преимуществами!

ПРИМЕРЫ.

Грибной дом, с красной крышей, вокруг Ёлки зеленого цвета, мох , в стиле пиксар. в стиле 3d_render

Параметры генерации:

16 на 9.

1024x576

3d_render

Бушующее море по которому плывет корабль пиратов, с черным флагом, на котором нарисован белый череп. Вокруг огромные волны, море сине черного цвета. На горизонте гроза с алыми тучами.

Параметры генерации:

9 на 16

576 x 1024

Айвазовски

Панда в ушанке(на ушанке спереди нарисован флаг России), держит кувшин с медом в лапах. На заднем плане плантации картошки. Небо чистое, голубое.

Параметры генерации:

1 на 1

512 x 512

Советский мультфильм

Портрет мужчины 60 лет в новогоднем колпаке, с седой бородой. Он смотрит в камеру и улыбается. Вокруг море подарков и красивая елка в новогодних огоньках.

Параметры генерации:

1 на 1

512 x 512

Новый год

Танец драконов, один угольно черного цвета, другой алого красного цвета. Вокруг огонь и снег!

Параметры генерации:

1 на 1

1024 x 1024

Цифровая живопись.

Как пользоваться нейросетью Kandinsky 2.2 в Telegram-боте;

https://t.me/kandinsky21_bot

Давайте рассмотрим еще одну вариацию Телеграмм версии нейросети Kandinsky 2.2, где пользователи имеют уникальную возможность создавать собственные стикеры.

Переходим по ссылке.

Нажимаем “Open in web”.

ВАЖНО!

Нейросеть на базе телеграмма, отлично работает с телефона, приложения!

Заходим в бот и знакомимся с функционалом.

В “Настройки бота”,есть:

Чтобы начать работу нужно выбрать "/start" (начать работу с ботом.)

Также обратите внимание на пункт “Изменить негативный промт” - это вы пишите то, что ТОЧНО не хотите видеть в картинке. Например: две головы, плохая анатомия, много глаз, больше 5 палец на руке и т.д.

Пункт “Включить и выключить профессиональный режим- это уже для тех, кто немного разбирается.” Его мы разберем чуть позже.

(Для версии 2.2) Также давайте рассмотрим режимы генерации, их у нас несколько:

Ничего сложного в режимах генерации нет, следуйте инструкциям.

Я бы вас хотел познакомить с режимом стикер. Давайте его и выберем.

Пишем запрос, что мы хотим получить и отправляем на генерацию.

И наслаждаемся результатом!

Теперь давайте вернемся в пункту “Профессиональный режим.”

Для начал нам нужно заново выбрать пункт “Начать работу с ботом” (/start) и выбрать “Профессиональный режим.”

Выбираем режим “Генерации по тексту” и пишем промт того, что мы хоти получить.

У меня будет: Портрет юноши 15 лет, в очках с красной оправой, блондин с зелеными глазами. В белой рубашке и ковбойской шляпой. На заднем фоне дом.

Я выберу 4K.

Выбираем соотношение сторон изображения в формате ширина к высоте (та же кнопка, что и для выбора стиля.)

У меня будет 16:9 и получаем результат!

Домашнее задание:

Сгенерировать 3 изображения, с помощью нейросети Kandinsky 2.2

Промпт пишите самостоятельно.

Примеры готовых изображение:

  1. Персонаж для компьютерной игры
  2. Иллюстрация к книге или журналу
  3. Персонаж для мультфильма
  4. Дизайн комнаты
  5. Иллюстрация к меню (любое блюдо)