Как пользоваться Midjourney

О проекте

Midjourney (в народе «пол пути») — это ИИ, которое преобразует текст в изображения. На данный момент запущен бета-тест с помощью бота Discord. Благодаря ему можно создать что вашему и его воображению угодно.

Всего для нового пользователя Discord бесплатно доступно 25 GPU-минут или как я называю круток, которые тратятся на примерно 25 действий (в том числе альтернативные варианты, улучшение разрешения и собственно создание новой серии картинок)

Начало работы

Ссылка на дискорд

При попадании на сервер вам присваивается рандомная группа с определенными открытыми каналами для новичков -newbies. Не волнуйтесь, если они не отображаются. Подождите немного. Тыкаем на любой канал newbies

Базовые команды

Команды вводятся в сообщениях. Начинайте писать / и увидите список команд. Ниже все важные команды, которые нужно узнать прежде, чем о команде генерации.

Команда /info показывает информацию. Для неподписанных количество оставшихся круток

Команда /settings показывает параметры, которые можно отрегулировать. Некоторые параметры недоступны тем у кого бесплатная версия.

Относительно важные из них:

Первая строчка - варианты движка (особо не важно)

Вторая строчка - Качество изображения. Влияет на длительность генерации, стоимость в GPU-минутах и результат генерации. Технически добавляется в конце запроса.

Третья - Качество изображения. Влияет на длительность генерации. Технически добавляется в конце запроса.

В любом случае все эти опции можно добавлять в конце запроса на рисунок

Imagine

Теперь самая используемая команда /imagine. Prompt является необходимой частью команды. Если вы стерли его, то введите команду заново. В prompt вписываем что угодно (кроме запрещенных слов).

Через какое-то время вы получите результат. Процесс генерации будет отображаться в том же канале, в иных случаях бот оповестит, что не может показать процесс. Получаем серию картинок из 4. Под картинками находятся кнопки. Напомню все кнопки кроме web будут стоить как минимум 1 крутку.

Меню после генерации

U — апскейлинг или увеличение разрешения. 1 — верхнее лево, 2 — верхнее право, 3 — нижнее лево, 4 — нижнее право.
Кнопка на уровне с апскейлингом генерация новых изображений по тому же запросу.
V — вариации или сделать ещё 4 похожие. 1 — верхнее лево, 2 — верхнее право, 3 — нижнее лево, 4 — нижнее право.

Меню после upscaling

Make Variations создает новые 4 изображения похожие на апскейлнутое
Upscale to Max и Light Upscale Redo — вариации апскейла. Исходя из названия один сильный, другой послабее.
Web открывает ссылку на изображение на сайте-галерее
Эмодзи позволяют оценить работу, свою или чужую. Ведь никто не оценит лучше чем ты сам.

Как правильно писать запросы, чтобы ИИ вас понимал

Казалось бы всё, можно начинать, но у всего есть нюансы. Самое главное, что вы должны понимать, так это то, что Midjourney — это ИИ и ему непонятны некоторые фразы или слова, он может неправильно понять. Он не сгенерирует «Агент взял свой любимый коктейль и поднял свои брови думая отравлен ли он» как вы бы хотели, он поймёт запрос по-своему. Чтобы запрос получится больше похож на ваши ожидания нужно написать «мужчина, смокинг, в руке бокал с коктейлем, задумчивое лицо».

Лучше всего бот работает с командами на английском, но вы можете ввести команду и на другом языке. Результаты конечно же будут расплывчатые, но зато непредсказуемые.

Пример русского запроса

Для разграничения запроса используются " :: " (с пробелами), то есть допустим «goblin in the city :: cyberpunk style -- ar 16:9 -- no cars». Сначала текстовой запрос, потом технические параметры, например соотношение сторон (ar) и то, что должно отсутствовать. Стиль можно в обоих вариантах, я предпочитаю после разделения. Можно и через ",", как делают все новички, но мы профи, поэтому через " :: "

Параметры после "::"

Сюда включаются в основном технические параметры.

Вес (::x, где x число). Также используются для регулирования соотношения каких-либо элементов на изображении, но использовать их нужно без пробелов, то есть "car::80, road::20". Минимальное число - -10000, максимальное - 10000. Ниже примеры.

Стилизация (--s x, где x число). Один из параметров, который в настройках можно поставить по умолчанию на каком-то значении. Не путать со стилями художника, фильма и сериала, это другое. Чем больше число, тем абстрактнее и похоже на красивый пейзаж. Советую ставить в настройках (/settings) либо по умолчанию (2000) или чуть выше (5000) значение. Минимальное число - 625, максимальное - 60000

Качество (--q x, где x число). Второй из параметров, который в настройках можно поставить по умолчанию на каком-то значении. Чем больше, тем больше деталей и красивее в целом, но также больше тратится GPU-минут и времени на создание. По умолчанию - 1, минимальное число - 0.25, максимальное - 2 (некогда было 5).

Высокое разрешение (--hd ). Потенциально лучше для больших изображений, т.к. использует другую композицию, но меньше деталей. К тому же разрешение сгенерированных изображений будет больше. Неплохой вариант не тратя действие на апскейлинг получить картинку побольше. По тестам, просто делает уже апскейлнутую серию из 4 картинок.

Соотношение сторон можно задать двумя путями: первый через (--ar x:y, где x ширина, y высота). К сожалению при сильной разнице высоты и ширины соотношение "сглаживается", лучше использовать второй вариант.

Также соотношение сторон можно задать (--w x, где x ширина) и/или (--h y, где y это высота). Лучше сработает, если число кратно 64 (или 128 в случае с --hd). Ниже пример с соотношением 1:10, которое я не смог сделать с помощью --ar.

Без (--no x, где x слово). Если ИИ внезапно добавляет на изображение какой-то элемент, то его можно убрать с помощью этого параметра. Я уже добавлял изображение с таким параметром, оно находится после объяснения про " :: "

Сид (--seed x, где x цифра). Каждому изображению присваивается своё семя, поэтому изображение можно повторить, хотя и только в начальных этапах генерации. Чтобы узнать его нужно будет поставить эмодзи письма или :envelope: на сгенерированное изображение, затем вам в личные смс придёт

Затем пишите какой-то другой запрос, указываете ваш сид и они должны сгенерироваться каким-то образом

Добавил слово Angels к своему сиду, который был выше

Референс-изображение (через ссылку на изображение). Изображения берутся как стили, а не как содержание, поэтому так вы не сможете обойти запретные слова. Можно добавить несколько иллюстраций, но отрегулировать вес каждого нельзя.

Взял это как образец

Скрестил с Маском

Регуляция веса (--iw x, где х это число) позволяет усилить влияние на конечное изображение референса. По-умолчанию 0.25, максимально - 5. Чем больше число, тем больше исходный рисунок будет похож стиль реферанса

С тем же референсом но с параметров 5

Видео (--video). Вам будет отправлен процесс генерации в виде видео через сообщение лс, но нужно будет поставить эмодзи письма или :envelope: на сгенерированное изображение.

Запрос с --video, ставите затем конверт и в лс приходит ссылка на видео с процессом генерации

Эта функция я думаю очень пригодится, если будете заливать арты в для влов в дискорд

Прочие параметры

В эту категорию я отмел рендеры, камеры, сами стили и прочее. Чтобы узнать о них вы можете посмотреть на вот этот гитхаб, где собрано множество изображений, которые помогут выбрать какой-то стиль. В остальном я помочь не смогу.

https://github.com/willwulfken/MidJourney-Styles-and-Keywords-Reference?ref=dtf.ru

Помощник для составления запросов

Также может помочь выбрать стиль, камеры, рендеры помощник. Есть несколько разных веб-сервисов, которые помогают с составлением запросов. Вот некоторые.

https://midjourney-prompt-helper.netlify.app/

https://prompt.noonshot.com/midjourney

https://phraser.tech/

Делимся гайдом, подписываемся на канал

И делимся вашими артами :)