Как пользоваться Midjourney
О проекте
Midjourney (в народе «пол пути») — это ИИ, которое преобразует текст в изображения. На данный момент запущен бета-тест с помощью бота Discord. Благодаря ему можно создать что вашему и его воображению угодно.
Всего для нового пользователя Discord бесплатно доступно 25 GPU-минут или как я называю круток, которые тратятся на примерно 25 действий (в том числе альтернативные варианты, улучшение разрешения и собственно создание новой серии картинок)
Начало работы
При попадании на сервер вам присваивается рандомная группа с определенными открытыми каналами для новичков -newbies. Не волнуйтесь, если они не отображаются. Подождите немного. Тыкаем на любой канал newbies
Базовые команды
Команды вводятся в сообщениях. Начинайте писать / и увидите список команд. Ниже все важные команды, которые нужно узнать прежде, чем о команде генерации.
Команда /info показывает информацию. Для неподписанных количество оставшихся круток
Команда /settings показывает параметры, которые можно отрегулировать. Некоторые параметры недоступны тем у кого бесплатная версия.
Первая строчка - варианты движка (особо не важно)
Вторая строчка - Качество изображения. Влияет на длительность генерации, стоимость в GPU-минутах и результат генерации. Технически добавляется в конце запроса.
Третья - Качество изображения. Влияет на длительность генерации. Технически добавляется в конце запроса.
В любом случае все эти опции можно добавлять в конце запроса на рисунок
Imagine
Теперь самая используемая команда /imagine. Prompt является необходимой частью команды. Если вы стерли его, то введите команду заново. В prompt вписываем что угодно (кроме запрещенных слов).
Через какое-то время вы получите результат. Процесс генерации будет отображаться в том же канале, в иных случаях бот оповестит, что не может показать процесс. Получаем серию картинок из 4. Под картинками находятся кнопки. Напомню все кнопки кроме web будут стоить как минимум 1 крутку.
- U — апскейлинг или увеличение разрешения. 1 — верхнее лево, 2 — верхнее право, 3 — нижнее лево, 4 — нижнее право.
- Кнопка на уровне с апскейлингом генерация новых изображений по тому же запросу.
- V — вариации или сделать ещё 4 похожие. 1 — верхнее лево, 2 — верхнее право, 3 — нижнее лево, 4 — нижнее право.
- Make Variations создает новые 4 изображения похожие на апскейлнутое
- Upscale to Max и Light Upscale Redo — вариации апскейла. Исходя из названия один сильный, другой послабее.
- Web открывает ссылку на изображение на сайте-галерее
- Эмодзи позволяют оценить работу, свою или чужую. Ведь никто не оценит лучше чем ты сам.
Как правильно писать запросы, чтобы ИИ вас понимал
Казалось бы всё, можно начинать, но у всего есть нюансы. Самое главное, что вы должны понимать, так это то, что Midjourney — это ИИ и ему непонятны некоторые фразы или слова, он может неправильно понять. Он не сгенерирует «Агент взял свой любимый коктейль и поднял свои брови думая отравлен ли он» как вы бы хотели, он поймёт запрос по-своему. Чтобы запрос получится больше похож на ваши ожидания нужно написать «мужчина, смокинг, в руке бокал с коктейлем, задумчивое лицо».
Лучше всего бот работает с командами на английском, но вы можете ввести команду и на другом языке. Результаты конечно же будут расплывчатые, но зато непредсказуемые.
Для разграничения запроса используются " :: " (с пробелами), то есть допустим «goblin in the city :: cyberpunk style -- ar 16:9 -- no cars». Сначала текстовой запрос, потом технические параметры, например соотношение сторон (ar) и то, что должно отсутствовать. Стиль можно в обоих вариантах, я предпочитаю после разделения. Можно и через ",", как делают все новички, но мы профи, поэтому через " :: "
Параметры после "::"
Сюда включаются в основном технические параметры.
Вес (::x, где x число). Также используются для регулирования соотношения каких-либо элементов на изображении, но использовать их нужно без пробелов, то есть "car::80, road::20". Минимальное число - -10000, максимальное - 10000. Ниже примеры.
Стилизация (--s x, где x число). Один из параметров, который в настройках можно поставить по умолчанию на каком-то значении. Не путать со стилями художника, фильма и сериала, это другое. Чем больше число, тем абстрактнее и похоже на красивый пейзаж. Советую ставить в настройках (/settings) либо по умолчанию (2000) или чуть выше (5000) значение. Минимальное число - 625, максимальное - 60000
Качество (--q x, где x число). Второй из параметров, который в настройках можно поставить по умолчанию на каком-то значении. Чем больше, тем больше деталей и красивее в целом, но также больше тратится GPU-минут и времени на создание. По умолчанию - 1, минимальное число - 0.25, максимальное - 2 (некогда было 5).
Высокое разрешение (--hd ). Потенциально лучше для больших изображений, т.к. использует другую композицию, но меньше деталей. К тому же разрешение сгенерированных изображений будет больше. Неплохой вариант не тратя действие на апскейлинг получить картинку побольше. По тестам, просто делает уже апскейлнутую серию из 4 картинок.
Соотношение сторон можно задать двумя путями: первый через (--ar x:y, где x ширина, y высота). К сожалению при сильной разнице высоты и ширины соотношение "сглаживается", лучше использовать второй вариант.
Также соотношение сторон можно задать (--w x, где x ширина) и/или (--h y, где y это высота). Лучше сработает, если число кратно 64 (или 128 в случае с --hd). Ниже пример с соотношением 1:10, которое я не смог сделать с помощью --ar.
Без (--no x, где x слово). Если ИИ внезапно добавляет на изображение какой-то элемент, то его можно убрать с помощью этого параметра. Я уже добавлял изображение с таким параметром, оно находится после объяснения про " :: "
Сид (--seed x, где x цифра). Каждому изображению присваивается своё семя, поэтому изображение можно повторить, хотя и только в начальных этапах генерации. Чтобы узнать его нужно будет поставить эмодзи письма или :envelope: на сгенерированное изображение, затем вам в личные смс придёт
Затем пишите какой-то другой запрос, указываете ваш сид и они должны сгенерироваться каким-то образом
Референс-изображение (через ссылку на изображение). Изображения берутся как стили, а не как содержание, поэтому так вы не сможете обойти запретные слова. Можно добавить несколько иллюстраций, но отрегулировать вес каждого нельзя.
Регуляция веса (--iw x, где х это число) позволяет усилить влияние на конечное изображение референса. По-умолчанию 0.25, максимально - 5. Чем больше число, тем больше исходный рисунок будет похож стиль реферанса
Видео (--video). Вам будет отправлен процесс генерации в виде видео через сообщение лс, но нужно будет поставить эмодзи письма или :envelope: на сгенерированное изображение.
Эта функция я думаю очень пригодится, если будете заливать арты в для влов в дискорд
Прочие параметры
В эту категорию я отмел рендеры, камеры, сами стили и прочее. Чтобы узнать о них вы можете посмотреть на вот этот гитхаб, где собрано множество изображений, которые помогут выбрать какой-то стиль. В остальном я помочь не смогу.
https://github.com/willwulfken/MidJourney-Styles-and-Keywords-Reference?ref=dtf.ru
Помощник для составления запросов
Также может помочь выбрать стиль, камеры, рендеры помощник. Есть несколько разных веб-сервисов, которые помогают с составлением запросов. Вот некоторые.
https://midjourney-prompt-helper.netlify.app/
https://prompt.noonshot.com/midjourney
Делимся гайдом, подписываемся на канал