Установка StableDiffusion на ПК

ДАННАЯ ИНФОРМАЦИЯ СИЛЬНО УСТАРЕЛА НЕ АКТУАЛЬНА! ОНА БЫЛА НАПИСАНА В 2022 ГОДУ!

🤓 Вариант: у кого не получается установить, и он не в силах разобраться

Для StableDiffusion необходима видеокарта NVIDIA от 6Гб и выше, впрочем, существует возможность запустить шарманку и на более простых видеокартах, и даже на AMD, и самом процессоре, но все это костыли, которые потребуют значительного времени для генерации и более низкого качества, потому их целесообразность очень сомнительна, когда есть бесплатный Google Colab.

Вообще самый оптимальный вариант, это установка WebUI от АВТОМАТИК1111

У него там же есть подробный гайд для тупых на все случаи жизни. Даже для AMD: как запустить SD WebUI на видеокартах AMD.

И еще видеогайд по установке с граф.интерфейсом за 3 минуты:

Если не смог осилить гайды выше, попробуй вариант для умственно отсталых. Он точно поможет.

Краткая инструкция для пацанов со средним ICQ:

Устанавливаем Python 3.10.6 со страницы загрузки
Устанавливаем git отсюда
Открываем терминал Windows или PowerShell, выполняем дальнейшие команды в нем
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
Скачиваем модель и кладём файлы модели в папку models
(Опционально)
▪️ GFPGAN для улучшения лиц. Качаем .pth файл и кладём его в папку stable-diffusion-webui
▪️ ESRGAN для увеличения картинок. Выбираем нужные (Подойдут только с архитектурой ESRGAN!), скачиваем .pth файлы и кладём в папку ESRGAN
Запускаем файл webui-user.bat и ждем завершения установки
Интерфейс будет доступен по адресу типа http://localhost:7860/ - открываем в браузере и пользуемся!

Подробный гайд для тел с ICQ ниже среднего:

1. Установка интерпретатора и GIT

В первую очередь надо установить Python 3.10.6 и git.
Python: с офф.сайта и Git: офф.сайт

После скачивания установочников необходимо все это проинсталлировать в винду, как обычно, с настройками по дефолту. Единственное: поставь галочку на против Add Python 3.10.6 to PATH:

2. Загрузка WebUI и модели

Теперь скачиваем репозиторий Автоматика при помощи git, что в дальнейшем облегчит обновления.

Выбери место на каком-то диске, устанавливать нужно в корень, без русских символов и пробелов в названиях папок! Все это проделываем в командной строке или PowerShell:
Несколько раз вводим cd .. и нажимаем Enter, пока не увидим что мы в корне диска:

Или же в проводнике открываем корень диска и в адресной строке вводим «cmd» - откроется окно терминала сразу с нужного места.

Когда мы уже в терминале в корне диска, копируем и вставляем в него команду, нажимаем Enter:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

Она создаст папку «stable-diffusion-webui» на жестком диске и скачает все с репозитория.

Скачиваем модель и перемещаем ее в папку models, в нашей папке stable-diffusion-webui. Вообще, туда можно положить много разных моделей, для разных нужд. Между моделями можно будет переключаться в графическом интерфейсе на вкладке настроек. Но это все потом.

3. устанавливаем GFPGAN и SRGAN

Это все не относится непосредственно к нашей нейросети, и все это можно и не ставить. Но рекомендуется, для улучшения результатов. У нейросети часто всратые лица получаются, особенно глаза. Поэтому - пусть будет.

Скачиваем .pth файл по ссылке и кидаем его в нашу папку stable-diffusion-webui

ESRGAN это дополнительная нейронка для апскейла. Для нее много моделей, выбирать нужно под свой тип картинок, смотря что ты там генерируешь (пейзажики, лица, фотки, аниме, говно, текстурки). Искать нужно строго модель с архитектурой «ESRGAN» и скачать .pth файлы. Скачанные файлы кладем в папку ESRGAN в нашей рабочей папке stable-diffusion-webui.

4. Настраиваем под свою видюху

Зайди в папку stable-diffusion-webui и откройте в блокноте файлик webui-user.bat, найди там строку set COMMANDLINE_ARGS=

И после знака = нужно добавить аргументы, если твоя видеокарта:

4GB VRAM для генерации изображения 512x512 - 640x640 --medvram
4GB VRAM и метод выше не помогает, вываливается ошибка out of memory, тогда используем --medvram --opt-split-attention
4GB VRAM и ничего из двух аргументов выше не помогает тогда используй это --lowvram --always-batch-cond-uncond --opt-split-attention
4GB VRAM и хочется генерировать картинки больше чем возможно c аргументом --medvram, используй --lowvram --opt-split-attention
Более 4 GB VRAM и хочется генерировать картинки больше, чем позволяет видеопамять, например 1024x вместо 512x, тогда добавляем эти аргументы --medvram --opt-split-attention
В других случаях, когда у нас нормальная видеокарта - ничего не трогаем!

5. Доустановка в авто-режиме

Если делали изменения в webui-user.bat - сохраняем. Теперь запускаем файл webui-user.bat двойным кликом. Первый раз произойдет установка всего недостающего и первичная настройка. Это требует времени, и зависит от скорости диска и интернета, и ЦП. Поэтому не стоит беспокоиться что консолька зависла. Жди.
Когда все закончится, в конце должно отобразиться:

Running on local URL: http://127.0.0.1:7860

Вот и все, просто нужно скопировать или набрать вручную этот адрес в любимом браузере Амиго и нажать Enter. Работаем как с сайтом, только у себя на диске.

Возможные ошибки: черный или зеленый квадрат вместо картинки

Значит твоя видеокарта старая, и не поддерживает числа с плавающей точкой с половиной точности - отсюда и трабл. Но это можно исправить. Возвращаемся к редактированию блокнотом файлика webui-user.bat и добавляем аргумент:

--precision full --no-half

Т.к. расход видеопамяти возрасет, возможно потребуется добавить еще и этот аргумет: --medvram если его еще небыло.

Официальный гайд по оптимизации

Автор сборки про работу видях с малым объемом памяти

🤓 Пара простых вариантов, для тек кто вообще ничего не осилил:

InvokeAI: Stable Diffusion Toolkit — Это ответвление CompVis/stable-diffusion, с открытым исходным кодом. Работает на компьютерах с Windows, Mac и Linux с видеокартами от 4 ГБ. Работает через простой и понятный графический интерфейс, и гораздо проще в установке чем по гайдам выще.

Stable Diffusion GRisk GUI 0.56 — программный комплект для ПК с видеокартой nvidia от 4Гб c очень простой установкой буквально в один клик. Это альтернатива для тех кто не может разобраться во всех гайдах. Софтина не бесплатна, купить можно на патреоне. Анон поделился сливом, спасибо ему!

Другие варианты и гайды западных коллег с форчана:

Другие не очень актуальные сетки:

https://github.com/sd-webui/stable-diffusion-webui
Фикс на видеопамять, позволяет запускать (немного в ущерб качеству) на 4 гб видеопамяти, а на 8 гб позволяет разрешения вплоть до 1472х832:
https://github.com/Doggettx/stable-diffusion

Сравнение времени генерации в it/sec на разных видеокартах

Таблица в гугл-документы на тестирование различных видеокарт в StableDiffusion

сравнение времени генерации изображения в SD на разных видеокартах