March 10, 2023

Инструкция по работе с Midjourney

Как пользоваться Midjourney

Для тех, кто ещё не в курсе Midjourney - это нейросеть, которая создаёт уникальные картинки на основе текстового запроса от человека. Помимо midjourney есть DALL-E, Stable Diffusion и другие.

Подробно все секреты эффективного использования рассказал в этом видео:

Основным плюсом является то что Midjourney самая простая и поэтому я рекомендую начать пратику именно с неё.

Минус этой нейросети, у вас ограниченное число бесплатных запросов. Дальше вам предложат оформить подписку.

Тарифные планы:

Когда начинашь работу с Midjourney кажется, что всё просто. Но нет, на самом деле это не просто. Есть куча подводных камней, о которых я расскажу далее. Вы должны понимать, что это программа и она не умеет читать мысли. Ей нужно чёткое техническое задания с максимально подробным описанием деталей.

В противном случае вы будете получать вот такой результат:

Запрос был “Нарисуй кота на диване”. Результат отличается очень сильно всего из-за 1 параметра в настройке.

Установка Midjourney

Первым делом, чтобы использовать нейронку вам необходимо установить Discord на комп или на телефон. Можно использовать и веб версию с компьютера, но мне удобнее в приложении. Ссылка на скачивание Discord:

https://discord.com/

Для тех, кто хочет использовать веб версию, то просто переходите по ссылке на официальный сайт Midjourney прямо в браузере и от туда на веб версию Discord.

https://midjourney.com/

Жмём Join beta+ и попадаем в дискорд

Вводим логин и пароль от своего аккаунта в Discord

У вас появится вот такое окно, слева вы увидите различные чаты.

Вам нужно будет перейти в чат newbies-**

Все чаты имеют различные номера, не пугайтесь, что у вас номер newbies может отличаться от моего, это сделано специально, чтобы распределить нагрузку, ибо число пользователей просто зашкаливает, сообщения улетают за секунду и сложно найти свой запрос

Чтобы не искать свою картинку в общей куче запросов от других людей, можно остаться с нейронкой 1 на 1.

Создаём отдельный чат с нейронкой

Первый вариант, зайти в комнату, которой давно не пользовались

Нажимаем справа вверху на Решётку

Ищем комнату в которой активности была минимум 2 дня назад

Вот подходящая комната

Другой вариант загрузить бота к себе на сервер и вы будете общаться только вдвоём, но ваши запросы будут видеть другие пользователи в каком-то из чатов.

С чего начать?

Разберёмся как делать запросы.

Все запросы начинаются с символа / слэш - наклонная палочка. После этого вы увидите список доступных команд.

команда /settings открывает настройки Midjourney

Первое время вам хватит и стандартных настроек, можете не заморачиваться. По умолчанию уже стоит последняя версия Midjourney, высокое качество, быстрый режим.

💡 Дальше инфа по настройкам, что за что отвечает. Если просто хочешь попробовать, то не вникай и сразу спускайся вниз до
“Второй способ - Лёгкий старт”

=R========================================================

Разница версий Midjourney

MJ version 1-4 (параметр --version N или --v N)— выбор версии Midjourney. Версия 4 сейчас стоит по умолчанию и я настоятельно рекомендую пользоваться именно ей.

  • MJ version 1 (-- v 1) — самый первый алгоритм работы нейросети, повезет если сгенерирует что-то внятное
  • MJ version 2 (-- v 2) — второй алгоритм, выдает абстракции, но уже больше распознавания
  • MJ version 3 (-- v 3) — третий алгоритм выглядит более художественно, но видна одна стилистика, как картина маслом. Для хороших и разнообразных работ нужны длинные и подробные промты. В этой версии работают все параметры, которые могут ещё не работать в версии 4
  • MJ version 4 (-- v 4) — последний и самый мощный алгоритм, высокая реалистичность, отчетливость деталей, достаточно описать краткий промт для эффектной генерации.

Niji Mode (-- niji ) —режим превращения своих генераций в аниме. При активации этого режима используется сторонняя нейросеть niji · journey , которая изначально обучена на анимации аниме и иллюстраций, но в таких же алгоритмах MJ.

Если добавить команду Photorealicsitc в режиме Niji то получится картинка из компьютерной игры

Оставляем версию Midjourney 4 и эксперементируем со стилями

Quality - качество

  • Half quality (--q 0.5) — ****пониженное качество, быстрая пробная генерация для пробы вашего промта
  • Base quality (--q 1) — качество по умолчанию, занимает стандартное время генерации
  • High quality (--q 2) —повышенное качество, этот режим даёт наилучшие результаты детальности, занимает двойное время одной генерации

Style - Стилизация

Style - отвечает за художественность и сочетание всех элементов картины в единое целое. Он как бы синхронизирует между собой все детали.

  • Style low (--s 50) — низкая стилизация, если вы хотите более приближенный результат к промту, без украшательств
  • Style med (--s 100 ?) — стилизация по умолчанию, без --s в запросе
  • Style high (--s 250) — «высокая» стилизация
  • Style very high (--s 750) — «очень высокая» стилизация

Upscale

Upscale — повышение разрешения исходного изображения. Так как первичный запрос предлагает сразу 4 варианта изображения, их разрешение по умолчанию 512х512 пикселей. Вариант параметра upscale говорит как именно будет увеличено исходное изображение и до какого до размера.

  • Regular upscale — стандартное повышение разрешения до 1024х1024, тип по умолчанию, который дает лучшее качество, однако, в процессе апскейла в готовую картинку могут быть случайным образом добавлены мелкие детали которых не было изначально, или могут измениться некоторые части изображения. То есть даже если апскейлить одну и ту же мини-картинку два раза подряд, вы получите разный итоговый результат.
  • Light upscale (--uplight) — повышение разрешения до 1536х1536, при котором вы сохраняете исходное мини-изображение, части изображения не будут переработаны, но некая красота потеряется, мелкие детали не проработаются и могут быть шумными
  • Beta upscale (--upbeta) — повышение разрешения до 2048х2048, которое в целом похоже на light, но более «отфильтрованное»

Remix mode

Remix mode - нужен для скрещивания двух изображений, которые мы даём нейронке для примера. Для этого нужно в запросе указать 2 ссылки на картинки.

Берём грушу и лампочку.

Загружаем их в дискорд прямо в чат. Копируем ссылки на изображения и вставляем в чат через пробел две эти ссылки.

Прикольно да?

Доработка изображений

Так же Remix Mode позволяет дорабатывать и улучшать один из тех вариантов, что сделала нейронка.

Вы работаете с запросами как обычно, не обязательно с ссылками на изображения. Но всякий раз, когда вы пытаетесь создать новые вариации кнопками V1-V4 выскакивает окно, где можно изменить исходный промт, добавить или убрать слова. Новые варианты будут созданы на основании выбранного изображения с учетом нового запроса. Таким образом можно корректировать удачную генерацию, если хочется сохранить большую часть исходной.

Дополнительно

  • Public mode — режим, при котором все сгенерированные изображения остаются в открытом доступе в галерее на сайте Midjourney и каждый пользователь может найти вашу работу и посмотреть какой был промт. Это режим по умолчанию и его нельзя изменить если у вас не приобретена подписка за 60$ в месяц.
  • Privat mode — соответственно скрытный режим, когда ваши сгенерированные изображения недоступны для других пользователей. Приобретается только с подпиской за 60$ в месяц.

Fast и relax режимы

  • Fast mode — режим быстрой генерации изображений. Каждый запрос тратит ресурс, который измеряется во времени — в часах или минутах. Этот режим расходует ваши «ограниченные» часы генерации. В среднем, один запрос тратит одну минуту этого ресурса. Приобретая подписку, вам дают определенное число быстрых часов в месяц, в этом режиме ваши запросы обрабатываются с приоритетом.
  • Relax mode — режим обычной генерации изображений. В этом режиме ваши запросы начнут обрабатываться немного позже (1-10 минут), однако длительность генерации останется прежней. Этот режим доступен только в безлимитных подписках на 30$ и 60$ в месяц, и предполагается, что когда ваши fast часы закончатся, вы переходите в режим relax без ограничения по часам в оплаченном месяце.

💡 На этом заканчиваются режимы и параметры в /settings, однако один из самых важных параметров без которого комплексная работа невозможна - это параметр соотношения сторон генерируемого изображения.

Формат изображения --ar

Параметр --ar N:N (или --aspect N:N) отвечает за соотношение сторон генерируемого изображения. По умолчанию вы получаете квадрат с параметрами --ar 1:1, но это не показывается в промте. На данный момент в 4 версии MJ работает только 3 варианта соотношения сторон - квадрат, горизонтальное и вертикальное изображение.

  • Горизонтальное изображение -ar 3:2 (на выходе получаем 1536х1024)
  • Вертикальное изображение -ar 2:3 (на выходе получаем 1024х1536)

Стоит отметить, что раз размер изображения в полтора раза больше чем квадратное, то и генерируется оно немного дольше. Это требует больше ресурса ваших fast часов.MJ может по-разному располагать объекты запроса согласно выбранному формату. И это следует иметь ввиду.

В 3 версии MJ доступны более разнообразные форматы от --ar 2:5 до 5:2. Надеюсь, рано или поздно это будет доступно и в 4 версии.

Как начать вводить запрос?

Команда /imagine запускает генерацию изображения нейросетью по вашему текстовому запросу, но предварительно вы должны ввести promt: это и есть техническое задание для нейросети

Как правильно вводить запрос?

Есть 2 вариант!

Первый вариант

Первый сложный, с ним надо разбираться.

Используйте вспомогательные сервисы

Выбираем например лица

Далее выбираем стиль, который нам нужен. Параметров херова гора, пробуйте, тестируйте, подбирайте. Удобно, что всё наглядно.

Ссылки на сайты с подбором промтов: https://promptomania.com/midjourney-prompt-builder/ - удобно и наглядно

https://midjourney-prompt-helper.netlify.app/ - много параметров, но нихера непонятно

https://github.com/willwulfken/MidJourney-Styles-and-Keywords-Reference - много параметров, удобно и понятно

Но второй способ ещё круче и проще.

Второй способ - Лёгкий старт

Заходим в любой чат newbies в левой вкладке и смотрим что создали другие. Находим крутые картинки, смотрим по какому запросу их создали и копируем этот запрос.

В начале запроса пишется текст аля “Инфопродюсер, меняющий мир к лучшему” а затем пишутся настройки “--ar 2:1 --v 4”

An infoproducer changing the World for better --ar 2:1 --v 4

boxer dog in a hood and with boxing gloves, front view from the waist up

A geek man changing the World for better. Ultra realistic. --ar 2:1 --v 4

Это проще? Да. Это по научному? Нет. Главное это результат. Не мучайте себя на старте, просто скопируйте хороший промт, который вам по душе и вставьте после команды:

/imagine “описание, настройки”.

Далее включайте Remix Mode и просто добавляйте к вашему запросу то, что хотите изменить, пока не получите идеальный результат.

Изи.

И ещё кое-что

Чем больше слов, тем хуже результат. Нейронка теряется и уходит в расфокус. Выбери от 1 до 4 параметров, которые дополняют друг друга, а не мешают.

Структура правильного запроса:

  1. Ссылка на картинку, если она есть
  2. Текстовое описание, что надо нарисовать
  3. Параметры для отрисовки

Что нейронка понимает лучше всего:

Subject - кто должен быть на фото

Format - в каком формате должна быть картинки (фото, скетч, иллюстрация, геометрия)

Lighting - освещение, например, неон или дневной свет

Color - как работать с цветом, насыщенный, пастельный, выгорание Mood - общее настроение картинки, энергичность, релакс и т.д.

Можно попросить нейронку исключить из картинки какой-то элемент как при первом запросе, так и при последующем в Remix Mode. Достаточно написать “No ***” и чего мы не хотим видеть после No. Обязательно на английском.

Размер картинки и её пропорции.

Самые понятные для нейронки это:

Portrait - Вертикальный (—ar 2:3) или (—ar 9:16)

Landscape - Горизонтальный (—ar 3:2) или (—ar 16:9)

Как заработать на Midjourney?

Первый способ, который не требует специальных навыков это создание статей для своего блога\сайта\ТГ канала и т.п.

-Пишем статью в ChatGPT

-Создаём картинки в Midjourney

-Загружаем в блог

Второй способ это создание пака картинок под заказ для блогеров

Генерируете пару десятков изображений по тематике заказчика, вырезаете в фотошопе и закидываете в один файл. Сверху накидываете эффекты

Подробно про способы заработка я расскажу в следующей статье

Подпишись на мой канал в ТГ чтобы не пропустить:

https://t.me/live_trading_channel

Если возникли вопросы пиши в нашем ТГ чате по нейронкам и крипте:

https://t.me/+vrHIO_LbobFhN2M6