August 20, 2023

Делаем реалистичный женский голос в реальном времени

Для начала нам потребуется средняя-мощная видеокарта, на слабой видеокарте будет большая задержка.

Что потребуется?

Сама программа, ссылка для скачивания и туториал ниже:

Туториал по скачиванию:

На открывшемся сайте листаем вниз и нажимаем на Hugging face как на скрине:

​Далее видим кучу файлов:

Если у вас мак, то скачиваете мак версию.
Если у вас видеокарта AMD, то скачиваем onnxDirectML версию (самую новую)
Если у вас видеокарта Nvidia, то скачиваем onnxgpu версию (самую новую)

Установка

Распаковываем архив и ищем в папке файл "start_http.bat" и запускаем.

У вас начнут скачиваться файлы и в итоге запустится панель:

​Для вывода звука из программы нам понадобится виртуальный аудио кабель (VAC) Virtual Audio Cabel.

Архив распаковывать необязательно, для установки запускаем этот файл:

В установщике везде ждём далее и со всем соглашаемся.

ВАЖНО: при установке кабель поставит себя как дефолт усстройство вывода звука, не забудьте поменять на свои наушники обратно, а так же не забываем поставить line 1 в усстройство ввода в дискорде .

Интерфейс

Я сделал для вас перевод интерфейса на русский (только то, что нам нужно):

В Качестве ставим от 192 до 512 (выше нет смысла), в битрейте ставим 4096.

В тональности ставим +12 если вы тестируете женскую голосовую модель и -12 если мужскую.

Далее нажимаем Start и профит. Голосовая модель работает!