Нейросети
October 20, 2023

Fooocus - как Midjourney, но лучше

В чем главное преимущество MJ над SD для рядового пользователя? Низкий порог входа (не считая стоимости подписки конечно). В сравнении с использованием MJ - разбираться в AUTOMATIC1111 (самая популярная оболочка для использования Stable Diffusion) сомнительное удовольствие. И как усидеть на двух стульях - чтобы и бесплатно и удобно? Для этого у нас теперь есть Fooocus и далее будет мой гайд по его использованию.

А зачем?

Давайте кратко по фишкам фокуса (для простоты дальше буду его называть так):

  1. В него вшит автономный движок GPT-2, который улучшает понимание промпта и прокачивает его самостоятельно (неважно, одно это слово или тысяча).
  2. Все работает "из коробки". Скачали, запустили, дождались загрузки модели - готово.
  3. В новой версии к стандартному фокусу добавлены более конкретные версии: аниме и реалистик.
  4. Базовый интерфейс - поле для промпта плюс кнопка "Генерировать". В расширенном можно покрутить всякое полезное, но даже в таком формате - проще и понятнее AUTOMATIC1111.
  5. Оптимизация. Генерации быстрее, а минимальные требования позволяют работать даже с 4Гб ГПУ и 8Гб ОЗУ.
  6. Десятки стилей, не требующих выдумывать и писать что-то из головы. Киберпанк, пикселизация, живопись эпохи возрождения - на любой вкус и цвет.

А как?

И снова будет список (извините, очень их люблю), но теперь по использованию:

- Ссылка на скачивание

- Распаковывайте куда угодно, лишь бы в пути не было кириллицы.

- Запускайте run.bat

- Генерируйте

И все?

Ну чисто технически да. На базовом уровне этого достаточно. Но я ведь писал выше про стили, так что нажмем под окном промпта чекбокс "Advanced" и посмотрим, что там...

Вкладка "Settings"

Машинки получились классные, но хочется качества, да и зачем мне две картинки?

Как видите на скрине, тут нам доступно переключение на режим "Качество". Выбор разрешения и количества генерируемых картинок если хочется побольше того и другого. Негативный промпт стоит редактировать, только если ИИ продолжает упорно рисовать то, что вам не требуется. Кстати эта машина мне понравилась, так что снимаем чекбокс "Random" и сохраняем seed (очень не хочу использовать слово "семя", извините 🌚)

Вкладка "Style"

Тут даже рассказывать нечего, просто посмотрим, что фокус сделает с нашей машиной в ночном городе.

Ниже можно увидеть самое главное - простой промпт дает больше свободы ИИ. Он рисует авто и пытается сохранить ракурс, но иногда ему сносит крышу. Так что если хотите сделать, например, персонажа в разных стилях - не скупитесь на жирный и подробный промпт.

Киберпанк
Граффити
Психоделик
Лавкрафт
Нуар

Вкладка "Advanced"

Спросите, а как же вкладка "Models"? Я не забыл про нее, просто нам она не нужна. Не надо ломать то, что работает и менять дефолтные модели.

Так вот, на четвертой вкладке два ползунка. Для примера сгенерил красный спорткар на горной дороге.

  • Помогает с решением проблемы, из-за которой модель SDXL иногда генерирует чрезмерно гладкие изображения или изображения с пластиковым внешним видом.
Sampling Sharpness - 2
Sampling Sharpness - 10
Sampling Sharpness - 15
  • Этим ползунком ослабляем поводок нейронки. Чем выше параметр - тем больше фантазии у ИИ и тем меньше он опирается на промпт.
На значении 20 начал накидывать еще деталей, придумал озеро, но во многих местах искривил пространство
На значении 30 получился какой-то RTX+++++ в самом негативном смысле

А теперь то все?!

Да, теперь все, пользуйтесь и радуйтесь.

Бонус:

  1. Все ваши картинки будут тут: Fooocus\Fooocus\outputs\
  2. Ссылка на Гит, там более полное описание: https://github.com/lllyasviel/Fooocus
  3. Скачайте себе расширение DeepL переводчик для браузера, чтобы не мучаться. Пишите промпт на русском и переводите прямо в окне через ctrl+Q

Надеюсь, что было полезно. Сегодня кошкодевочек и прочую порнографию не генерили, но это фокус тоже может 🌚