Делаем реалистичный женский голос в реальном времени
Для начала нам потребуется средняя-мощная видеокарта, на слабой видеокарте будет большая задержка.
Сама программа, ссылка для скачивания и туториал ниже:
На открывшемся сайте листаем вниз и нажимаем на Hugging face как на скрине:
Если у вас мак, то скачиваете мак версию.
Если у вас видеокарта AMD, то скачиваем onnxDirectML версию (самую новую)
Если у вас видеокарта Nvidia, то скачиваем onnxgpu версию (самую новую)
Распаковываем архив и ищем в папке файл "start_http.bat" и запускаем.
У вас начнут скачиваться файлы и в итоге запустится панель:
Для вывода звука из программы нам понадобится виртуальный аудио кабель (VAC) Virtual Audio Cabel.
Архив распаковывать необязательно, для установки запускаем этот файл:
В установщике везде ждём далее и со всем соглашаемся.
ВАЖНО: при установке кабель поставит себя как дефолт усстройство вывода звука, не забудьте поменять на свои наушники обратно, а так же не забываем поставить line 1 в усстройство ввода в дискорде .
Я сделал для вас перевод интерфейса на русский (только то, что нам нужно):
В Качестве ставим от 192 до 512 (выше нет смысла), в битрейте ставим 4096.
В тональности ставим +12 если вы тестируете женскую голосовую модель и -12 если мужскую.