Как пользоваться самой популярной нейросетью генерации изображений - Midjourney

Вы уже, наверное, не раз слышали про Midjourney — нейронную сеть, которая создаёт крутые изображения по текстовому описанию. Благодаря Midjorney дизайнеры, маркетологи и другие творческие специалисты могут мгновенно создавать иллюстрации для публикаций в социальных сетях, визуальное наполнение для веб-сайтов и рекламные материалы.

Привлекательность Midjourney также обусловлена тем, что для её использования не требуется специальных технических знаний. Любой желающий может попробовать эту технологию, в отличие от аналогичных решений, таких как OpenAI DALL-E и Google Imagen, доступ к которым ограничен.

Для работы с Midjourney вам понадобится лишь аккаунт в Discord, воображение и настойчивость (и, возможно, немного денег в некоторых случаях). Всю сложную часть берут на себя встроенные алгоритмы.

Как зарегистрироваться в Midjourney:

- Перейдите на сайт нейросети и нажмите на кнопку - Join the Beta

- Произойдёт переход на Discord-сервер Midjourney

- Войдите или создайте аккаунт Discord

- Присоединитесь к сообществу

- Перейдите в один из каналов Newbies

- В чате канала введите команду «/imagine prompt:»

- После двоеточия введите запрос на английском языке

- Midjourney сгенерирует несколько вариантов изображения

Midjourney обладает уникальным стилем изображений, придающим им вид нарисованных картин в сюрреалистическом жанре. Для создания наиболее подходящего изображения необходимо составить четкий запрос описания будущей картины: чем более точно и детально сформулирован запрос, тем ближе результат будет к ожидаемому.

После того как изображение сгенерировано, пользователю предоставляются 4 варианта для его улучшения и 4 альтернативные версии. Также существует возможность повторной генерации на основе уже введенного запроса. Созданное изображение можно сохранить.

Основные команды в Midjourney для работы с изображением после генерации:

После того как вы сгенерировали изображение и выбрали наиболее понравившееся вам, нажав одну из кнопок U1 - U4, становится доступным расширенный набор опций.

- 🪄 Vary (Strong), Vary (Subtle) - Создает более сильную или тонкую вариацию выбранного изображения, генерируя новую сетку из четырех вариантов.

- 🖌 Vary (Region) - Новая команда, появилась в 5 версии приложения. Позволяет изменить выбранную часть изображения, подробно будет рассмотрена позже.

- 🔍 Zoom Out 2x, Zoom Out 1.5x, Custom Zoom - Уменьшение масштаба изображения позволяет расширить холст до первоначальных границ, не изменяя содержимого исходного изображения. Вновь расширенный холст будет заполнен с использованием подсказок и исходного изображения.- ⬅️ ➡️ ⬆️ ⬇️ - Кнопки Pan позволяют расширить холст изображения в выбранном направлении, не изменяя содержимого исходного изображения. Вновь развернутый холст будет заполнен с использованием подсказок и исходного изображения.

- ↕️ Make Square - кадрирует (обрезает) изображение, делая его квадратным.

- ❤️ Избранное - Пометить лучшие изображения, чтобы легко находить их на сайте Midjourney.

- 🌐 Web - Открыть изображение в своей галерее на Midjourney.

- 📀 Сохранить изображение - Щелкните на изображении, чтобы открыть его в полном размере, а затем щелкните правой кнопкой мыши и выберите Сохранить изображение. На мобильных устройствах долго нажимайте на изображение, а затем нажмите на значок загрузки в правом верхнем углу.

Рассмотрим на примере работу некоторых команд по улучшению изображения. В качестве исходного изображения возьмем такую картинку:

Применим команду Zoom Out 2x - нейросеть увеличила угол обзора, добавив детали со всех сторон картинки. Для такого типа изображений, результат работы данной команды оставляет желать лучшего, однако если у вас изображение, где есть некий центральный объект, и вам необходимо несколько его отдалить, то команда Zoom справляется гораздо лучше.

Выполним команду Vary (Subtle) - нейросеть сгенерировала 4 новых вариации изображения, весьма похожих на оригинальную картинку, цветы примерно такого же цвета, речка идет под похожим углом. Т.е. как мы можем убедиться, вариация действительно довольно тонкая.

Напротив команда Vary (Strong) дает более сильные изменения в изображении, все объекты на картинке - деревья, облака, горы, и речка с цветами существенно отличаются на каждом из 4 вариантов.

Рассмотрим пример работы с командой Vary (Region) в нейросети MidJourney. Для того чтобы команда Vary (Region) давала лучший эффект, рекомендуется использовать ее совместно с включенной настройкой Remix Mode.

1. Для того чтобы включить Remix Mode нужно набрать команду /Settings и выбрать во всплывающем окне 🎛 Remix.

2. Сгенерировать изображение с помощью команды /imagine.

3. Выбрать одно из четырех изображений, используя кнопки U1 - U4.

4. Нажать кнопку 🖌 Vary (Region), чтобы открыть интерфейс редактирования.

5. Выбрать инструменты выделения "свободная рука" или "прямоугольник" в левой нижней части редактора.

6. Выделить области изображения, которые необходимо изменить. Размер выделения влияет на результат. Большие выделения дают боту Midjourney больше возможностей для создания новых творческих деталей. При меньших размерах выделения получаются более мелкие и тонкие изменения.

7. Изменить ваш промт. Опишите то, что вы хотите создать в выбранных областях, с помощью обновленной подсказки. В новой подсказке следует сосредоточиться на деталях, которые необходимо ввести или изменить.

8. Нажать кнопку Submit, чтобы отправить запрос боту Midjourney. Кнопку редактора под увеличенным изображением можно использовать несколько раз, чтобы поэкспериментировать с различными вариантами выбора и подсказками.

Пример работы команды Vary (Region)

Начальный промт - woman on the street with a dog on a leash --ar 4:3.

Выделяем область изображения в котором находится собака.

Корректируем промт - woman on the street with a bear on a leash --ar 4:3

Получаем результат, нейросеть заменила собаку на медведя. При этом все остальные части изображения остались без изменений.

Основные параметры в командах Midjourney

Рассмотрим основные параметры, которые можно добавлять в командах Midjourney. Параметры должны задаваться в самом конце после текста подсказки. Каждый параметр начинается с -- (два дефиса). Далее следует название параметра (полное или сокращенное) и значение. Например --aspect ratio 4:3 или --ar 4:3.

1. aspect ratio - соотношение сторон. Параметр --aspect или --ar изменяет соотношение сторон формируемого изображения. Соотношение сторон - это отношение ширины изображения к его высоте. Обычно оно выражается двумя числами, разделенными двоеточием, например, 7:4 или 4:3. По умолчанию данный параметр имеет значение 1:1 т.е. квадрат.

2. version - версия модели Midjourney. Midjourney регулярно выпускает новые версии моделей для повышения эффективности, согласованности и качества. По умолчанию используется последняя версия модели, но можно использовать и другие модели, добавив параметр --version или --v или воспользовавшись командой /settings и выбрав версию модели. Каждая модель позволяет получать различные типы изображений. Параметр --version может принимать значения 1, 2, 3, 4, 5, 5.1 и 5.2 --v 5.2 - текущая модель по умолчанию, самая новая и самая совершенная, выпущена в июне 2023 года. Эта модель позволяет получить более детальные и четкие результаты с лучшими цветами, контрастом и композицией. Кроме того, она несколько лучше понимает подсказки, чем предыдущие модели, и лучше реагирует на весь диапазон параметра --stylize.

3. niji 5 - Модель Niji - это совместная работа Midjourney и Spellbrush, настроенная на создание аниме и иллюстративных стилей с гораздо большим знанием аниме, аниме-стилей и аниме-эстетики. Она отлично подходит для динамичных и экшн-снимков, а также композиций, ориентированных на персонажей. Чтобы использовать эту модель, добавьте в конец запроса параметр --niji 5 или воспользуйтесь командой /settings и выберите Niji version 5. Данная модель чувствительна к параметру --stylize. Экспериментируйте с различными диапазонами стилизации для тонкой настройки изображений. Модель Niji версии 5 также может быть тонко настроена с помощью параметров --style для получения уникальных образов. Попробуйте использовать параметры --style cute, --style scenic, --style original или --style expressive.

4. style - стиль. Параметр --style позволяет точно настроить эстетику некоторых версий модели Midjourney. Добавление параметра может помочь вам создать более фотореалистичные изображения, кинематографические сцены или более симпатичных персонажей. Версия модели 5.2 и предыдущая версия 5.1 по умолчанию принимают параметр --style raw. Параметры --style raw уменьшают влияние стандартной эстетики Midjourney и хорошо подходят для опытных пользователей, которые хотят получить больший контроль над своими изображениями или более фотографические изображения. Модель версии Niji 5 принимает --style cute --style scenic --style original или --style expressive.

5. stylize - стилизация. Midjourney была обучена создавать изображения, в которых предпочтение отдается художественным цветам, композиции и формам. Параметр --stylize или --s влияет на то, насколько сильно будет применяться это обучение. При низких значениях стилизации получаются изображения, которые точно соответствуют подсказке, но менее художественные. При высоких значениях стилизации получаются очень художественные, но менее связанные с подсказкой изображения. По умолчанию значение параметра --stylize равно 100, Для моделей версий 4, 5 и niji 5 данный параметр может принимать целочисленные значения в диапазоне 0-1000.

6. chaos - Параметр --chaos или --c влияет на то, насколько разнообразны исходные сетки изображений. При высоких значениях параметра --chaos получаются более необычные и неожиданные результаты и композиции. При меньших значениях --chaos получаются более надежные, повторяющиеся результаты. --chaos принимает значения 0-100. По умолчанию значение --chaos равно 0. Если использовать низкое значение --chaos или не указывать его, то при каждом запуске задания будут получаться одинаковые исходные сетки изображений. При использовании очень высоких значений --chaos исходные сетки изображений будут отличаться разнообразием и неожиданными композициями или художественными средствами при каждом выполнении задания.

7. no - Параметр No указывает боту Midjourney, что не следует включать в изображение. --no может содержать несколько слов, разделенных запятыми: --no item1, item2, item3, item4.
--no или "не" - Бот Midjourney рассматривает любое слово в подсказке как то, что вы хотели бы видеть в конечном изображении. Подсказка "натюрморт гуашью без фруктов" с большей вероятностью приведет к появлению изображений, содержащих фрукты, поскольку связь между словами "без" или "не" и "фруктами" интерпретируется ботом Midjourney не так, как это понимает человек. Чтобы улучшить результаты, сфокусируйте запрос на том, что вы хотите видеть на изображении, и используйте параметр "--no", чтобы указать понятия, которые вы не хотите включать.

8. tile - Параметр --tile генерирует изображения, которые могут быть использованы в качестве повторяющихся плиток для создания бесшовных узоров для тканей, обоев и текстур. --tile работает с версиями модели 1, 2, 3, test, testp, 5, 5.1 и 5.2. Параметра генерирует только одну плитку. Чтобы увидеть повторение плиток, используйте инструмент для создания узоров, например, Seamless Pattern Checker.

9. weird - Странности, исследуйте нетрадиционную эстетику с помощью экспериментального параметра --weird или --w. Этот параметр привносит в создаваемые изображения причудливые и необычные качества, что приводит к уникальным и неожиданным результатам.
--weird принимает значения: 0-3000. По умолчанию значение --weird равно 0. Функция --weird является экспериментальной. Со временем значение --weird может измениться. --weird совместима с версиями модели Midjourney 5, 5.1 и 5.2 --weird не полностью совместим с --seed. Влияние Weird на работу. Оптимальное значение --weird зависит от запроса и требует экспериментов. Попробуйте начать с меньших значений, например 250 или 500, а затем увеличивать/уменьшать их. Если вы хотите, чтобы изображение было условно привлекательным и странным, попробуйте смешать более высокие значения --stylize и --weird. Попробуйте начать с одинаковых значений для обоих вариантов. Пример: /imagine prompt cyanotype cat --stylize 250 --weird 250.

10. video - С помощью параметра --video можно создать короткий видеоролик о том, как формируется исходная сетка изображений. Нажмите на значок эмодзи-конверта ✉️, чтобы бот Midjourney отправил ссылку на видео в ваши прямые сообщения. --video работает только с сетками изображений, но не с масштабированием. --video работает с версиями модели 5, 5.1, 5.2 и niji 5, а также с устаревшими версиями моделей 1, 2, 3, test и testp.

11. repeat - Параметр --repeat или --r запускает задание несколько раз. Комбинируйте --repeat с другими параметрами, например --chaos, чтобы увеличить темп визуального исследования. --repeat принимает значения 2-4 для базовых подписчиков, 2-10 для подписчиков Standard, 2-40 для подписчиков Pro и Mega. Параметр --repeat может быть использован только в режиме Fast и Turbo GPU.
Использование кнопки redo (повтор) 🔄 по результатам выполнения задания --repeat приведет к повторному выполнению запроса только один раз.

Neural Networks