December 21, 2023

Изменения в структуре промптов в Midjourney V6

⁠⁠Итак, сегодня новая шестая версия Midjourney стала доступна в discord для всех пользователей. Пока только в альфа версии. Среди анонсированных новостей было указано, что сильно изменился подход к составлению промптов в 6 версии.
Что же именно изменилось? Вот такая информация появилась по этому поводу в discord

Подробнее про эти пункты:

  1. Длина промпта теперь может быть более 350 слов

В V5 только первые 15-20 слов оказывали сильное влияние на полотно, после чего память заканчивалась и влияние слов падало.

В V6 нам предоставили значительно больше памяти, так что можно с уверенностью сказать, что у нас есть от 350 до 500 слов, а может, и больше. То, как доступная память используется подсказкой, похоже, связано со смысловым содержанием слов.

Например, фраза из 15 слов - "the the the the the the the the an an an an an an this this this this this this" - не имеет особого смыслового содержания и, похоже, использует очень мало доступной памяти. Но те же 15 слов, использованные для яркого описания трех ковбоев, означают, что четвертого ковбоя будет трудно представить с учетом оставшейся у нас памяти.

Итак, у V6 есть не столько длина подсказки, сколько "семантический смысл", который будет играть по-разному для каждой подсказки

2. Можно указывать цвета и другие детали

В V5 разработчики склонялись к архетипам. Это позволило Midjourney самой выбирать, как ей рендерить изображение, потому что ее собственные решения были бы более последовательными, а наши попытки контроля игнорировались бы.

В V6 разработчики по-прежнему дают Midjourney архетип, но теперь они в большей степени контролируют рендеринг Midjourny с помощью деталей, выраженных на естественном языке.

3. Вы можете размещать предметы в промпте так, как вам хочется, используя язык для управления композицией.

В V5 предложные фразы часто не понимались. В V6 они понимаются почти всегда. Теперь, когда у нас есть надежные препозиционные фразы, легко расположить предметы по отношению друг к другу и к камере.

Как же управлять композицией? Исследовать! Вот отправная точка: надежнее описать общий образ в короткой фразе, а затем дополнить его деталями, начиная с фокусной точки холста. После того как фокусная точка установлена, заполните ее деталями.

На кухонном столе стоят три корзины, полные фруктов. В корзине посередине лежат зеленые яблоки. Корзина слева наполнена клубникой. В корзине справа - черника. На заднем плане - глухая стена тилового цвета с круглым окном.

4. Можно добавлять текст, который может быть сгенерирован на изображении

Чтобы добавить текст к изображению, поместите слова, которые вы хотите напечатать, в "кавычки" и убедитесь, что ваша подсказка содержит семантически правдоподобное место для печати текста.

Используйте такие фразы, как: говорит, напечатано на, озаглавлено, начертано, помечено, отмечено, клеймо, тиснено, гравировано, штамповано, украшено, написано, начертано и т. д.

Вы также можете печатать текст на предметах, таких как: стикер, обложка книги, плакат, знак, футболка, кружка, рекламный щит, газета, журнал, поздравительная открытка, конверт, номерной знак, календарь, билет, упаковка товара, визитная карточка и т. д.

Чтобы текст или буквы выглядели одиночными, иногда помогает добавить к подсказке шрифтовой дизайн фразы. Вы можете использовать фразы, выделенные на белом фоне, если хотите, чтобы холст оставался пустым.

"Hello World!", написанная маркером на липкой записке

5. Можно задать несколько тем в одном промпте.

В V5 один объект можно было отрисовать красиво, но два объекта смешивались... а три объекта были недоступны для большинства из нас.

В V6 и один, и два объекта могут быть отрисованы великолепно, а три объекта начинают смешиваться, но их можно контролировать.

6.Теперь можно составлять промпт в Midjourney как и в ChatGPT.

Нельзя задать в Midjourney промт вида "<Какой то URL>, сделай также, но масляными красками" или использовать remix и сказать Midjourney "добавь больше цветов в ее волосы". Однако прямой промпт заданный в /imagine можно написать как инструкцию в ChatGPT , и он, скорее всего, будет работать отлично.

7. Midjourney V6 способен понимать нюансы пунктуации и грамматики.

8. Вы можете использовать v6 для создания комиксов.

При соблюдении соотношения сторон можно организовать простые сцены в виде панелей.

9. Отрицания на естественном языке теперь работают.

Помните, что даже один правильный элемент в сетке - это замечательно для такой подсказки.

Мальчик на парковке держит ключи от машины, но машин поблизости нет. --v 6

10. Можно добавить рамку или кайму вокруг изображения, просто описав его.

Клипарт лампы на чистом фоне. Изображение обведено тонкой золотой рамкой.

Как видим довольно много изменений. Открывается огромное поле для тестов и сравнений. И нужно учитывать, что это еще всего лишь альфа (бета) версия и в релизной версии, может быть еще больше изменений.