Инструкция по работе с Midjourney
Для тех, кто ещё не в курсе Midjourney - это нейросеть, которая создаёт уникальные картинки на основе текстового запроса от человека. Помимо midjourney есть DALL-E, Stable Diffusion и другие.
Подробно все секреты эффективного использования рассказал в этом видео:
Основным плюсом является то что Midjourney самая простая и поэтому я рекомендую начать пратику именно с неё.
Минус этой нейросети, у вас ограниченное число бесплатных запросов. Дальше вам предложат оформить подписку.
Когда начинашь работу с Midjourney кажется, что всё просто. Но нет, на самом деле это не просто. Есть куча подводных камней, о которых я расскажу далее. Вы должны понимать, что это программа и она не умеет читать мысли. Ей нужно чёткое техническое задания с максимально подробным описанием деталей.
В противном случае вы будете получать вот такой результат:
Запрос был “Нарисуй кота на диване”. Результат отличается очень сильно всего из-за 1 параметра в настройке.
Установка Midjourney
Первым делом, чтобы использовать нейронку вам необходимо установить Discord на комп или на телефон. Можно использовать и веб версию с компьютера, но мне удобнее в приложении. Ссылка на скачивание Discord:
Для тех, кто хочет использовать веб версию, то просто переходите по ссылке на официальный сайт Midjourney прямо в браузере и от туда на веб версию Discord.
Жмём Join beta+ и попадаем в дискорд
Вводим логин и пароль от своего аккаунта в Discord
У вас появится вот такое окно, слева вы увидите различные чаты.
Вам нужно будет перейти в чат newbies-**
Все чаты имеют различные номера, не пугайтесь, что у вас номер newbies может отличаться от моего, это сделано специально, чтобы распределить нагрузку, ибо число пользователей просто зашкаливает, сообщения улетают за секунду и сложно найти свой запрос
Чтобы не искать свою картинку в общей куче запросов от других людей, можно остаться с нейронкой 1 на 1.
Создаём отдельный чат с нейронкой
Первый вариант, зайти в комнату, которой давно не пользовались
Нажимаем справа вверху на Решётку
Ищем комнату в которой активности была минимум 2 дня назад
Другой вариант загрузить бота к себе на сервер и вы будете общаться только вдвоём, но ваши запросы будут видеть другие пользователи в каком-то из чатов.
С чего начать?
Разберёмся как делать запросы.
Все запросы начинаются с символа / слэш - наклонная палочка. После этого вы увидите список доступных команд.
команда /settings открывает настройки Midjourney
Первое время вам хватит и стандартных настроек, можете не заморачиваться. По умолчанию уже стоит последняя версия Midjourney, высокое качество, быстрый режим.
💡 Дальше инфа по настройкам, что за что отвечает. Если просто хочешь попробовать, то не вникай и сразу спускайся вниз до
“Второй способ - Лёгкий старт”
=R========================================================
Разница версий Midjourney
MJ version 1-4 (параметр --version N или --v N)— выбор версии Midjourney. Версия 4 сейчас стоит по умолчанию и я настоятельно рекомендую пользоваться именно ей.
- MJ version 1 (-- v 1) — самый первый алгоритм работы нейросети, повезет если сгенерирует что-то внятное
- MJ version 2 (-- v 2) — второй алгоритм, выдает абстракции, но уже больше распознавания
- MJ version 3 (-- v 3) — третий алгоритм выглядит более художественно, но видна одна стилистика, как картина маслом. Для хороших и разнообразных работ нужны длинные и подробные промты. В этой версии работают все параметры, которые могут ещё не работать в версии 4
- MJ version 4 (-- v 4) — последний и самый мощный алгоритм, высокая реалистичность, отчетливость деталей, достаточно описать краткий промт для эффектной генерации.
Niji Mode (-- niji ) —режим превращения своих генераций в аниме. При активации этого режима используется сторонняя нейросеть niji · journey , которая изначально обучена на анимации аниме и иллюстраций, но в таких же алгоритмах MJ.
Если добавить команду Photorealicsitc в режиме Niji то получится картинка из компьютерной игры
Оставляем версию Midjourney 4 и эксперементируем со стилями
Quality - качество
- Half quality (--q 0.5) — ****пониженное качество, быстрая пробная генерация для пробы вашего промта
- Base quality (--q 1) — качество по умолчанию, занимает стандартное время генерации
- High quality (--q 2) —повышенное качество, этот режим даёт наилучшие результаты детальности, занимает двойное время одной генерации
Style - Стилизация
Style - отвечает за художественность и сочетание всех элементов картины в единое целое. Он как бы синхронизирует между собой все детали.
- Style low (--s 50) — низкая стилизация, если вы хотите более приближенный результат к промту, без украшательств
- Style med (--s 100 ?) — стилизация по умолчанию, без --s в запросе
- Style high (--s 250) — «высокая» стилизация
- Style very high (--s 750) — «очень высокая» стилизация
Upscale
Upscale — повышение разрешения исходного изображения. Так как первичный запрос предлагает сразу 4 варианта изображения, их разрешение по умолчанию 512х512 пикселей. Вариант параметра upscale говорит как именно будет увеличено исходное изображение и до какого до размера.
- Regular upscale — стандартное повышение разрешения до 1024х1024, тип по умолчанию, который дает лучшее качество, однако, в процессе апскейла в готовую картинку могут быть случайным образом добавлены мелкие детали которых не было изначально, или могут измениться некоторые части изображения. То есть даже если апскейлить одну и ту же мини-картинку два раза подряд, вы получите разный итоговый результат.
- Light upscale (--uplight) — повышение разрешения до 1536х1536, при котором вы сохраняете исходное мини-изображение, части изображения не будут переработаны, но некая красота потеряется, мелкие детали не проработаются и могут быть шумными
- Beta upscale (--upbeta) — повышение разрешения до 2048х2048, которое в целом похоже на light, но более «отфильтрованное»
Remix mode
Remix mode - нужен для скрещивания двух изображений, которые мы даём нейронке для примера. Для этого нужно в запросе указать 2 ссылки на картинки.
Загружаем их в дискорд прямо в чат. Копируем ссылки на изображения и вставляем в чат через пробел две эти ссылки.
Доработка изображений
Так же Remix Mode позволяет дорабатывать и улучшать один из тех вариантов, что сделала нейронка.
Вы работаете с запросами как обычно, не обязательно с ссылками на изображения. Но всякий раз, когда вы пытаетесь создать новые вариации кнопками V1-V4 выскакивает окно, где можно изменить исходный промт, добавить или убрать слова. Новые варианты будут созданы на основании выбранного изображения с учетом нового запроса. Таким образом можно корректировать удачную генерацию, если хочется сохранить большую часть исходной.
Дополнительно
- Public mode — режим, при котором все сгенерированные изображения остаются в открытом доступе в галерее на сайте Midjourney и каждый пользователь может найти вашу работу и посмотреть какой был промт. Это режим по умолчанию и его нельзя изменить если у вас не приобретена подписка за 60$ в месяц.
- Privat mode — соответственно скрытный режим, когда ваши сгенерированные изображения недоступны для других пользователей. Приобретается только с подпиской за 60$ в месяц.
- Fast mode — режим быстрой генерации изображений. Каждый запрос тратит ресурс, который измеряется во времени — в часах или минутах. Этот режим расходует ваши «ограниченные» часы генерации. В среднем, один запрос тратит одну минуту этого ресурса. Приобретая подписку, вам дают определенное число быстрых часов в месяц, в этом режиме ваши запросы обрабатываются с приоритетом.
- Relax mode — режим обычной генерации изображений. В этом режиме ваши запросы начнут обрабатываться немного позже (1-10 минут), однако длительность генерации останется прежней. Этот режим доступен только в безлимитных подписках на 30$ и 60$ в месяц, и предполагается, что когда ваши fast часы закончатся, вы переходите в режим relax без ограничения по часам в оплаченном месяце.
💡 На этом заканчиваются режимы и параметры в /settings, однако один из самых важных параметров без которого комплексная работа невозможна - это параметр соотношения сторон генерируемого изображения.
Формат изображения --ar
Параметр --ar N:N (или --aspect N:N) отвечает за соотношение сторон генерируемого изображения. По умолчанию вы получаете квадрат с параметрами --ar 1:1, но это не показывается в промте. На данный момент в 4 версии MJ работает только 3 варианта соотношения сторон - квадрат, горизонтальное и вертикальное изображение.
- Горизонтальное изображение -ar 3:2 (на выходе получаем 1536х1024)
- Вертикальное изображение -ar 2:3 (на выходе получаем 1024х1536)
Стоит отметить, что раз размер изображения в полтора раза больше чем квадратное, то и генерируется оно немного дольше. Это требует больше ресурса ваших fast часов.MJ может по-разному располагать объекты запроса согласно выбранному формату. И это следует иметь ввиду.
В 3 версии MJ доступны более разнообразные форматы от --ar 2:5 до 5:2. Надеюсь, рано или поздно это будет доступно и в 4 версии.
Как начать вводить запрос?
Команда /imagine запускает генерацию изображения нейросетью по вашему текстовому запросу, но предварительно вы должны ввести promt: это и есть техническое задание для нейросети
Первый вариант
Первый сложный, с ним надо разбираться.
Используйте вспомогательные сервисы
Далее выбираем стиль, который нам нужен. Параметров херова гора, пробуйте, тестируйте, подбирайте. Удобно, что всё наглядно.
Ссылки на сайты с подбором промтов: https://promptomania.com/midjourney-prompt-builder/ - удобно и наглядно
https://midjourney-prompt-helper.netlify.app/ - много параметров, но нихера непонятно
https://github.com/willwulfken/MidJourney-Styles-and-Keywords-Reference - много параметров, удобно и понятно
Но второй способ ещё круче и проще.
Второй способ - Лёгкий старт
Заходим в любой чат newbies в левой вкладке и смотрим что создали другие. Находим крутые картинки, смотрим по какому запросу их создали и копируем этот запрос.
В начале запроса пишется текст аля “Инфопродюсер, меняющий мир к лучшему” а затем пишутся настройки “--ar 2:1 --v 4”
An infoproducer changing the World for better --ar 2:1 --v 4
boxer dog in a hood and with boxing gloves, front view from the waist up
A geek man changing the World for better. Ultra realistic. --ar 2:1 --v 4
Это проще? Да. Это по научному? Нет. Главное это результат. Не мучайте себя на старте, просто скопируйте хороший промт, который вам по душе и вставьте после команды:
/imagine “описание, настройки”.
Далее включайте Remix Mode и просто добавляйте к вашему запросу то, что хотите изменить, пока не получите идеальный результат.
И ещё кое-что
Чем больше слов, тем хуже результат. Нейронка теряется и уходит в расфокус. Выбери от 1 до 4 параметров, которые дополняют друг друга, а не мешают.
Структура правильного запроса:
Что нейронка понимает лучше всего:
Subject - кто должен быть на фото
Format - в каком формате должна быть картинки (фото, скетч, иллюстрация, геометрия)
Lighting - освещение, например, неон или дневной свет
Color - как работать с цветом, насыщенный, пастельный, выгорание Mood - общее настроение картинки, энергичность, релакс и т.д.
Можно попросить нейронку исключить из картинки какой-то элемент как при первом запросе, так и при последующем в Remix Mode. Достаточно написать “No ***” и чего мы не хотим видеть после No. Обязательно на английском.
Размер картинки и её пропорции.
Самые понятные для нейронки это:
Portrait - Вертикальный (—ar 2:3) или (—ar 9:16)
Landscape - Горизонтальный (—ar 3:2) или (—ar 16:9)
Первый способ, который не требует специальных навыков это создание статей для своего блога\сайта\ТГ канала и т.п.
-Создаём картинки в Midjourney
Второй способ это создание пака картинок под заказ для блогеров
Генерируете пару десятков изображений по тематике заказчика, вырезаете в фотошопе и закидываете в один файл. Сверху накидываете эффекты
Подробно про способы заработка я расскажу в следующей статье
Подпишись на мой канал в ТГ чтобы не пропустить:
https://t.me/live_trading_channel
Если возникли вопросы пиши в нашем ТГ чате по нейронкам и крипте: