Функционал Midjourney
Midjourney отображается в Discord отдельным общим сервером, где разные пользователи генерируют изображения в общих чатах. Ещё бота можно добавить на свой личный сервер и взаимодействовать без посторонних людей.
На изображении отмечены общий сервер Midjourney с различными каналами для генерации изображений, и личный, в который можно добавить чат-бот.
Как работают команды Midjourney в Discord
Взаимодействие с ботом Midjourney в Discord происходит с помощью команд. Команды используются для создания изображений, изменения настроек по умолчанию, отслеживания информации о пользователе и выполнения других полезных задач.
Основные команды
/imagine
— генерирует уникальное изображение из короткого текстового описания.
/settings
— открывает поле с упрощенными настройками генерации, качества, приватности и т. д.
Окно с настройками Midjourney в чате Discord / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт
Во-первых, в настройках можно выбрать версию нейросети, используемую для генерации. По умолчанию выбрана последняя актуальная версия (на сегодняшний день это 5.2), и в большинстве случаев стоит использовать именно её. Если же захочется создать несколько картинок в более ранней версии, можно выбрать другую версию для текущего запроса, добавив в конце описания ключ --v и номер версии (например, чтобы сгенерировать изображение в Midjourney 4, нужно добавить --v 4).
RAW Mode — в свежих моделях Midjourney, версии 5.1 и 5.2, создатели научили нейросеть рисовать красивые картинки даже по минималистичному запросу из 2-3 слов и при их создании придерживаться так называемой «эстетики Midjourney». На что именно она влияет в каждом конкретном случае, сказать сложно. А для отключения этой функции как раз и предназначена кнопка «RAW mode» (режим без обработки).
Вот так выглядят картинки по запросу «Landscape with waterfall» c выключенной настройкой RAW mode (слева) и включенной (справа). В первом случае картинки похожи на цифровую живопись (или качественную работу нейросети), а во втором — на акварельный пейзаж:
Картинки получились разные, но сложно сказать, какой результат лучше / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт
В другом случае включение этой настройки практически не повлияло на результат. Картинки по запросу «Portrait of the old man» (портрет пожилого мужчины) получились очень похожими:
С включенным RAW mode (слева) мужчины вышли более старыми и бородатыми, а выключенный RAW mode (справа) лучше подсветил глаза / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт
В большинстве случаев рекомендуют не включать эту настройку, если вы только начинаете знакомиться с Midjourney (и включать, если вы опытный пользователь нейросети и любите создавать длинные детализированные запросы).
Niji version — включает версию нейросети Midjourney Niji для создания картинок в аниме-стиле. Стоит включать в разделе настроек только в том случае, если нужно создавать аниме и ничего кроме аниме. Если же нужно включить эту модель только для одной генерации, проще использовать в запросе ключ --niji 5.
Stylize — степень стилизации, доступны 4 значения от низкой (Low) до очень высокой (Very High). Настройка чем-то похожа на RAW Mode и отвечает за «творческие способности» нейросети. При высоких значениях стилизации Midjourney старается создавать красивые, композиционно верные картинки с хорошим цветом и светом (но при этом может не очень точно следовать запросу). В большинстве случаев подойдёт настройка Stylize Med (средний уровень) или Stylize High (умеренно-высокий).
Кошка ловит мышь с самым низким (слева) и самым высоким (справа) уровнем стилизации. Левый результат похож на не самую удачную генерацию в Stable Diffusion, а из правого куда-то убежала мышь / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт
Public Mode — переключает между публичным (Public) и скрытым (Stealth) режимами. В скрытом режиме созданные изображения не видны в галерее на сайте Midjourney. Но из чата Discord эта настройка изображения не скрывает — так что, если работать в общем чате, картинки будут видны всем пользователям независимо от выбранного режима.
Fast mode — настройка для экономных, переключает между быстрым (Fast) и расслабленным (Relax) режимом генерации. При покупке подписки Midjourney пользователь получает некоторое количество GPU-минут, которые тратятся на генерацию изображений. Например, в самую дешёвую подписку за 10 долларов входит 200 минут, и это примерно 200 генераций. Если же переключиться в расслабленный режим, минуты не будут тратиться, но и генерация станет дольше, так как приоритет запроса сильно снизится. В среднем, генерация в режиме Fast занимает 1-3 минуты, а в Relax придётся подождать минут 10.
Remix mode — позволяет изменить запрос при создании вариантов сгенерированной картинки, и получить на её основе похожее изображение с другими объектами.
При включенном Remix mode пирамида из тыкв легко превращается в пирамиду из сов / Фото: docs.midjourney.com
High Variation mode и Low Variation mode. Midjourney генерирует сразу 4 картинки, и этот параметр влияет на то, насколько похожими друг на друга они будут. Лучше оставить высокую вариативность (High Variation).
/info
— вызывает окно с информацией по подписке.
/subscribe
— вызывает окно с возможностью перехода к тарифным планам.
/blend — помогает скрещивать изображения, когда мы хотим из нескольких получить нечто общее. Без этой команды тоже можно создать смешанное изображение, но подгружая несколько ссылок и описывая результат.
/prefer option set
****— позволяет сохранить часто используемые настройки: вводим команду, далее указываем название для настройки, а после сам параметр через элемент «--».
/prefer option set
mine
--hd --ar 16:9
промт создает опцию под названием « mine
», при вводе которой в строку запроса как --mine
Midjourney будет считывать ее как --hd --ar 16:9
Все созданные настройки можно посмотреть через команду /prefer option list.
/help
— показывает полезную информацию и советы о боте Midjourney.
Подробнее про генерацию изображений с /imagine prompt
1. Введите /imagine prompt:
или выберите /imagine
команду во всплывающем окне команд с косой чертой.
2. Введите описание изображения, которое вы хотите создать, в prompt
поле.
Midjourney Bot лучше всего работает с простыми короткими предложениями. Длинные запросы могут ломать логику на сгенерированном изображении или приводить к некачественным результатам.
После завершения генерации появляются изображения и несколько дополнительных командных кнопок:
Кнопки U
масштабируют изображение, создавая увеличенную версию выбранного изображения (увеличенное изображение будет немного отличаться от оригинала).
Кнопки V
создают небольшие вариации выбранного изображения сетки. При создании варианта создается новая сетка изображения, аналогичная общему стилю и композиции выбранного изображения.
!https://habrastorage.org/r/w1560/getpro/habr/upload_files/7e4/7eb/519/7e47eb5191013e2921926b6c6e69be8a.jpg
Кнопка «Обновить» генерирует новые изображения под текущий запрос.
После использования масштабирования изображения (Кнопки U) появится новый набор параметров:
Отдаление (Zoom Out)
Инструмент похож генеративную заливку в Adobe Photoshop и позволяет «отдалить» созданную картинку, дорисовав ей края. Для этого нужно выбрать степень отдаления (в полтора или в два раза) и нажать соответствующую кнопку:
Жмём Zoom Out 2x, чтобы у нарисованного нейросетью мужчины появились ноги / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт
Повторять «отзумливание» можно сколько угодно раз. Но так как запрос при этом не меняется, есть шанс, что изображения начнут повторяться — на примере ниже нейросеть нарисовала нового мужчину, как только исходный отодвинулся очень далеко:
Зумирование с элементами рекурсии от Midjourney 5.2 / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт
Чтобы этого избежать, можно использовать кнопку Custom Zoom. Она позволяет не только задать степень отдаления (в пределах от 1х до 2х), но и отредактировать при этом запрос. Например, исходная картинка была сгенерирована с запросом «vibrant California poppies (яркие калифорнийские маки). После нажатия кнопки Custom Zoom открылось окно, в котором запрос поменяли на «A framed poster on the wall» (плакат в рамке на стене), и вот что вышло:
Жмём кнопку, меняем запрос и перемещаемся в комнату / Фото: nerdschalk.com
С помощью этой функции отдаляться и приближаться можно очень сильно.
Make Square
Этот инструмент тоже дорисовывает края изображению, но делает это чуть иначе. Она ничего не отдаляет, а делает из прямоугольного изображения квадратное (если изображение и так квадратное, этой кнопки не будет). Жмём кнопку, и вертикальная картинка становится квадратной:
Кажется, эту собаку лучше одну дома не оставлять / Иллюстрация: Алиса Смирнова, Фотосклад.Эксперт
Vary (Strong) и Vary (Subtle)
Новые инструменты создания вариантов сгенерированного изображения. Если в прошлых версиях Midjourney просто предлагала сделать несколько вариантов понравившейся картинки, то сейчас можно выбирать, насколько сильно они будут отличаться от исходной.
Кнопки создания вариантов изображения в Midjourney v4 (слева) и Midjourney v5 (справа) /
Доступны два варианта: Vary (Strong) вносит более сильные изменения в создаваемые вариации (например, у человека может поменяться лицо, одежда и причёска), а с Vary (Subtle) изменения будут едва заметны.
Варианты портрета бабушки, созданные с помощью Vary (Strong) и Vary (Subtle) /