Функционал Midjourney

Midjourney отображается в Discord отдельным общим сервером, где разные пользователи генерируют изображения в общих чатах. Ещё бота можно добавить на свой личный сервер и взаимодействовать без посторонних людей.

На изображении отмечены общий сервер Midjourney с различными каналами для генерации изображений, и личный, в который можно добавить чат-бот.

Как работают команды Midjourney в Discord

Взаимодействие с ботом Midjourney в Discord происходит с помощью команд. Команды используются для создания изображений, изменения настроек по умолчанию, отслеживания информации о пользователе и выполнения других полезных задач.

Основные команды

/imagine — генерирует уникальное изображение из короткого текстового описания.

/settings — открывает поле с упрощенными настройками генерации, качества, приватности и т. д.

Окно с настройками Midjourney в чате Discord / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

Во-первых, в настройках можно выбрать версию нейросети, используемую для генерации. По умолчанию выбрана последняя актуальная версия (на сегодняшний день это 5.2), и в большинстве случаев стоит использовать именно её. Если же захочется создать несколько картинок в более ранней версии, можно выбрать другую версию для текущего запроса, добавив в конце описания ключ --v и номер версии (например, чтобы сгенерировать изображение в Midjourney 4, нужно добавить --v 4).

RAW Mode — в свежих моделях Midjourney, версии 5.1 и 5.2, создатели научили нейросеть рисовать красивые картинки даже по минималистичному запросу из 2-3 слов и при их создании придерживаться так называемой «эстетики Midjourney». На что именно она влияет в каждом конкретном случае, сказать сложно. А для отключения этой функции как раз и предназначена кнопка «RAW mode» (режим без обработки).

Вот так выглядят картинки по запросу «Landscape with waterfall» c выключенной настройкой RAW mode (слева) и включенной (справа). В первом случае картинки похожи на цифровую живопись (или качественную работу нейросети), а во втором — на акварельный пейзаж:

Картинки получились разные, но сложно сказать, какой результат лучше / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

В другом случае включение этой настройки практически не повлияло на результат. Картинки по запросу «Portrait of the old man» (портрет пожилого мужчины) получились очень похожими:

С включенным RAW mode (слева) мужчины вышли более старыми и бородатыми, а выключенный RAW mode (справа) лучше подсветил глаза / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

В большинстве случаев рекомендуют не включать эту настройку, если вы только начинаете знакомиться с Midjourney (и включать, если вы опытный пользователь нейросети и любите создавать длинные детализированные запросы).

Niji version — включает версию нейросети Midjourney Niji для создания картинок в аниме-стиле. Стоит включать в разделе настроек только в том случае, если нужно создавать аниме и ничего кроме аниме. Если же нужно включить эту модель только для одной генерации, проще использовать в запросе ключ --niji 5.

Stylize — степень стилизации, доступны 4 значения от низкой (Low) до очень высокой (Very High). Настройка чем-то похожа на RAW Mode и отвечает за «творческие способности» нейросети. При высоких значениях стилизации Midjourney старается создавать красивые, композиционно верные картинки с хорошим цветом и светом (но при этом может не очень точно следовать запросу). В большинстве случаев подойдёт настройка Stylize Med (средний уровень) или Stylize High (умеренно-высокий).

Кошка ловит мышь с самым низким (слева) и самым высоким (справа) уровнем стилизации. Левый результат похож на не самую удачную генерацию в Stable Diffusion, а из правого куда-то убежала мышь / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

Public Mode — переключает между публичным (Public) и скрытым (Stealth) режимами. В скрытом режиме созданные изображения не видны в галерее на сайте Midjourney. Но из чата Discord эта настройка изображения не скрывает — так что, если работать в общем чате, картинки будут видны всем пользователям независимо от выбранного режима.

Fast mode — настройка для экономных, переключает между быстрым (Fast) и расслабленным (Relax) режимом генерации. При покупке подписки Midjourney пользователь получает некоторое количество GPU-минут, которые тратятся на генерацию изображений. Например, в самую дешёвую подписку за 10 долларов входит 200 минут, и это примерно 200 генераций. Если же переключиться в расслабленный режим, минуты не будут тратиться, но и генерация станет дольше, так как приоритет запроса сильно снизится. В среднем, генерация в режиме Fast занимает 1-3 минуты, а в Relax придётся подождать минут 10.

Remix mode — позволяет изменить запрос при создании вариантов сгенерированной картинки, и получить на её основе похожее изображение с другими объектами.

При включенном Remix mode пирамида из тыкв легко превращается в пирамиду из сов / Фото: docs.midjourney.com

High Variation mode и Low Variation mode. Midjourney генерирует сразу 4 картинки, и этот параметр влияет на то, насколько похожими друг на друга они будут. Лучше оставить высокую вариативность (High Variation).

/info — вызывает окно с информацией по подписке.

/subscribe — вызывает окно с возможностью перехода к тарифным планам.

/blend — помогает скрещивать изображения, когда мы хотим из нескольких получить нечто общее. Без этой команды тоже можно создать смешанное изображение, но подгружая несколько ссылок и описывая результат.

/prefer option set ****— позволяет сохранить часто используемые настройки: вводим команду, далее указываем название для настройки, а после сам параметр через элемент «--».

Пример:

/prefer option set mine --hd --ar 16:9 промт создает опцию под названием « mine», при вводе которой в строку запроса как --mine Midjourney будет считывать ее как --hd --ar 16:9

Все созданные настройки можно посмотреть через команду /prefer option list.

/help — показывает полезную информацию и советы о боте Midjourney.

Подробнее про генерацию изображений с /imagine prompt

1. Введите /imagine prompt: или выберите /imagine команду во всплывающем окне команд с косой чертой.

2. Введите описание изображения, которое вы хотите создать, в prompt поле.

3. Отправьте свое сообщение.

Midjourney Bot лучше всего работает с простыми короткими предложениями. Длинные запросы могут ломать логику на сгенерированном изображении или приводить к некачественным результатам.

После завершения генерации появляются изображения и несколько дополнительных командных кнопок:

U1 ****U2 ****U3 ****U4

Кнопки U

масштабируют изображение, создавая увеличенную версию выбранного изображения (увеличенное изображение будет немного отличаться от оригинала).

V1 V2 V3 V4

Кнопки V

создают небольшие вариации выбранного изображения сетки. При создании варианта создается новая сетка изображения, аналогичная общему стилю и композиции выбранного изображения.

!https://habrastorage.org/r/w1560/getpro/habr/upload_files/7e4/7eb/519/7e47eb5191013e2921926b6c6e69be8a.jpg

Кнопка «Обновить» генерирует новые изображения под текущий запрос.

После использования масштабирования изображения (Кнопки U) появится новый набор параметров:

Отдаление (Zoom Out)

Инструмент похож генеративную заливку в Adobe Photoshop и позволяет «отдалить» созданную картинку, дорисовав ей края. Для этого нужно выбрать степень отдаления (в полтора или в два раза) и нажать соответствующую кнопку:

Жмём Zoom Out 2x, чтобы у нарисованного нейросетью мужчины появились ноги / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

Повторять «отзумливание» можно сколько угодно раз. Но так как запрос при этом не меняется, есть шанс, что изображения начнут повторяться — на примере ниже нейросеть нарисовала нового мужчину, как только исходный отодвинулся очень далеко:

Зумирование с элементами рекурсии от Midjourney 5.2 / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

Чтобы этого избежать, можно использовать кнопку Custom Zoom. Она позволяет не только задать степень отдаления (в пределах от 1х до 2х), но и отредактировать при этом запрос. Например, исходная картинка была сгенерирована с запросом «vibrant California poppies (яркие калифорнийские маки). После нажатия кнопки Custom Zoom открылось окно, в котором запрос поменяли на «A framed poster on the wall» (плакат в рамке на стене), и вот что вышло:

Жмём кнопку, меняем запрос и перемещаемся в комнату / Фото: nerdschalk.com

С помощью этой функции отдаляться и приближаться можно очень сильно.

Make Square

Этот инструмент тоже дорисовывает края изображению, но делает это чуть иначе. Она ничего не отдаляет, а делает из прямоугольного изображения квадратное (если изображение и так квадратное, этой кнопки не будет). Жмём кнопку, и вертикальная картинка становится квадратной:

Кажется, эту собаку лучше одну дома не оставлять / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт

Vary (Strong) и Vary (Subtle)

Новые инструменты создания вариантов сгенерированного изображения. Если в прошлых версиях Midjourney просто предлагала сделать несколько вариантов понравившейся картинки, то сейчас можно выбирать, насколько сильно они будут отличаться от исходной.

Кнопки создания вариантов изображения в Midjourney v4 (слева) и Midjourney v5 (справа) /

Доступны два варианта: Vary (Strong) вносит более сильные изменения в создаваемые вариации (например, у человека может поменяться лицо, одежда и причёска), а с Vary (Subtle) изменения будут едва заметны.

Варианты портрета бабушки, созданные с помощью Vary (Strong) и Vary (Subtle) /