Установка StableDiffusion на ПК
ДАННАЯ ИНФОРМАЦИЯ СИЛЬНО УСТАРЕЛА НЕ АКТУАЛЬНА! ОНА БЫЛА НАПИСАНА В 2022 ГОДУ!
🤓 Вариант: у кого не получается установить, и он не в силах разобраться
Для StableDiffusion необходима видеокарта NVIDIA от 6Гб и выше, впрочем, существует возможность запустить шарманку и на более простых видеокартах, и даже на AMD, и самом процессоре, но все это костыли, которые потребуют значительного времени для генерации и более низкого качества, потому их целесообразность очень сомнительна, когда есть бесплатный Google Colab.
Вообще самый оптимальный вариант, это установка WebUI от АВТОМАТИК1111
У него там же есть подробный гайд для тупых на все случаи жизни. Даже для AMD: как запустить SD WebUI на видеокартах AMD.
И еще видеогайд по установке с граф.интерфейсом за 3 минуты:
Если не смог осилить гайды выше, попробуй вариант для умственно отсталых. Он точно поможет.
Краткая инструкция для пацанов со средним ICQ:
- Устанавливаем Python 3.10.6 со страницы загрузки
- Устанавливаем git отсюда
- Открываем терминал Windows или PowerShell, выполняем дальнейшие команды в нем
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
- Скачиваем модель и кладём файлы модели в папку models
- (Опционально)
▪️ GFPGAN для улучшения лиц. Качаем .pth файл и кладём его в папку stable-diffusion-webui
▪️ ESRGAN для увеличения картинок. Выбираем нужные (Подойдут только с архитектурой ESRGAN!), скачиваем .pth файлы и кладём в папку ESRGAN - Запускаем файл
webui-user.bat
и ждем завершения установки - Интерфейс будет доступен по адресу типа http://localhost:7860/ - открываем в браузере и пользуемся!
Подробный гайд для тел с ICQ ниже среднего:
1. Установка интерпретатора и GIT
В первую очередь надо установить Python 3.10.6 и git.
Python: с офф.сайта и Git: офф.сайт
После скачивания установочников необходимо все это проинсталлировать в винду, как обычно, с настройками по дефолту. Единственное: поставь галочку на против Add Python 3.10.6 to PATH
:
Теперь скачиваем репозиторий Автоматика при помощи git, что в дальнейшем облегчит обновления.
Выбери место на каком-то диске, устанавливать нужно в корень, без русских символов и пробелов в названиях папок! Все это проделываем в командной строке или PowerShell:
Несколько раз вводим cd ..
и нажимаем Enter, пока не увидим что мы в корне диска:
Или же в проводнике открываем корень диска и в адресной строке вводим «cmd» - откроется окно терминала сразу с нужного места.
Когда мы уже в терминале в корне диска, копируем и вставляем в него команду, нажимаем Enter:git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
Она создаст папку «stable-diffusion-webui» на жестком диске и скачает все с репозитория.
Скачиваем модель и перемещаем ее в папку models, в нашей папке stable-diffusion-webui. Вообще, туда можно положить много разных моделей, для разных нужд. Между моделями можно будет переключаться в графическом интерфейсе на вкладке настроек. Но это все потом.
3. устанавливаем GFPGAN и SRGAN
Это все не относится непосредственно к нашей нейросети, и все это можно и не ставить. Но рекомендуется, для улучшения результатов. У нейросети часто всратые лица получаются, особенно глаза. Поэтому - пусть будет.
Скачиваем .pth файл по ссылке и кидаем его в нашу папку stable-diffusion-webui
ESRGAN это дополнительная нейронка для апскейла. Для нее много моделей, выбирать нужно под свой тип картинок, смотря что ты там генерируешь (пейзажики, лица, фотки, аниме, говно, текстурки). Искать нужно строго модель с архитектурой «ESRGAN» и скачать .pth файлы. Скачанные файлы кладем в папку ESRGAN в нашей рабочей папке stable-diffusion-webui.
4. Настраиваем под свою видюху
Зайди в папку stable-diffusion-webui и откройте в блокноте файлик webui-user.bat, найди там строку set COMMANDLINE_ARGS=
И после знака = нужно добавить аргументы, если твоя видеокарта:
- 4GB VRAM для генерации изображения 512x512 - 640x640
--medvram
- 4GB VRAM и метод выше не помогает, вываливается ошибка out of memory, тогда используем
--medvram --opt-split-attention
- 4GB VRAM и ничего из двух аргументов выше не помогает тогда используй это
--lowvram --always-batch-cond-uncond --opt-split-attention
- 4GB VRAM и хочется генерировать картинки больше чем возможно c аргументом
--medvram
, используй--lowvram --opt-split-attention
- Более 4 GB VRAM и хочется генерировать картинки больше, чем позволяет видеопамять, например 1024x вместо 512x, тогда добавляем эти аргументы
--medvram --opt-split-attention
- В других случаях, когда у нас нормальная видеокарта - ничего не трогаем!
Если делали изменения в webui-user.bat - сохраняем. Теперь запускаем файл webui-user.bat
двойным кликом. Первый раз произойдет установка всего недостающего и первичная настройка. Это требует времени, и зависит от скорости диска и интернета, и ЦП. Поэтому не стоит беспокоиться что консолька зависла. Жди.
Когда все закончится, в конце должно отобразиться:
Running on local URL: http://127.0.0.1:7860
Вот и все, просто нужно скопировать или набрать вручную этот адрес в любимом браузере Амиго и нажать Enter. Работаем как с сайтом, только у себя на диске.
Возможные ошибки: черный или зеленый квадрат вместо картинки
Значит твоя видеокарта старая, и не поддерживает числа с плавающей точкой с половиной точности - отсюда и трабл. Но это можно исправить. Возвращаемся к редактированию блокнотом файлика webui-user.bat и добавляем аргумент:
Т.к. расход видеопамяти возрасет, возможно потребуется добавить еще и этот аргумет: --medvram
если его еще небыло.
Официальный гайд по оптимизации
Автор сборки про работу видях с малым объемом памяти
🤓 Пара простых вариантов, для тек кто вообще ничего не осилил:
InvokeAI: Stable Diffusion Toolkit — Это ответвление CompVis/stable-diffusion, с открытым исходным кодом. Работает на компьютерах с Windows, Mac и Linux с видеокартами от 4 ГБ. Работает через простой и понятный графический интерфейс, и гораздо проще в установке чем по гайдам выще.
Stable Diffusion GRisk GUI 0.56 — программный комплект для ПК с видеокартой nvidia от 4Гб c очень простой установкой буквально в один клик. Это альтернатива для тех кто не может разобраться во всех гайдах. Софтина не бесплатна, купить можно на патреоне. Анон поделился сливом, спасибо ему!
Другие варианты и гайды западных коллег с форчана:
- 4 гб видеопамяти
- 2 гб видеопамяти (и не только)
- для АМДаунов + еще один способ
- Генерация на процессоре без видюхи
- Mac с M1 от Пролапса Кука
Другие не очень актуальные сетки:
https://github.com/sd-webui/stable-diffusion-webui
Фикс на видеопамять, позволяет запускать (немного в ущерб качеству) на 4 гб видеопамяти, а на 8 гб позволяет разрешения вплоть до 1472х832:
https://github.com/Doggettx/stable-diffusion
Сравнение времени генерации в it/sec на разных видеокартах
Таблица в гугл-документы на тестирование различных видеокарт в StableDiffusion