Озвучиваем текст любым голосом с помощью RVC-TTS

В этой статье мы разберем, как не платить сайтам с озвучкой и сделать это все самому. Вам может показаться, что в каких-то моментах это сложно, но мы экономим наши средства в обмен на время

В этой статье мы разберем два способа: онлайн и с установкой софта. А так же как обучить нейросеть генерировать аудио из вашего голоса или чужого!

Делаем озвучку онлайн

Два источника которые нам понадобятся:

https://huggingface.co/spaces/juuxn/SimpleRVC тут мы будем делать озвучку
https://docs.google.com/spreadsheets/d/1owfUtQuLW9ReiIwg6U9UkkDmPOTkuNHf0OKQtWu1iaI/edit#gid=1227575351 - отсюда брать модели голосов

Из аудио в аудио

Допустим мы хотим изменить голос озвучики или сделать AI COVER.

Выбираем нужную модель голоса

Первый стобец название модели голоса, вторые два столбца нам не интересны. Нужен только четвертый, копируем ссылку из него.

Переходим на наш сервис, в котором будем делать основную работу

https://huggingface.co/spaces/juuxn/SimpleRVC

Вставляем нашу голосовую модель которую скопировали(1), выбираем аудио которое будем изменять (2). Алгоритм(3) не могу выделить лучший. Попробуйте разные и какой больше понравится - используйте. Осталось только нажать на кнопку конверта(4), подождать 2-3 минуты и готово

Из текста в аудио

Для начала так же выбираем нужную модель голоса из списка и копируем ее.

Пишем текст который нужно озвучить
Вставляем модель голоса которую скопировали
Выбираем метод генерации (РУ язык есть только у того что на скрине)
Выбираем модель (язык и тип голоса)
Нажимаем на конвертацию

Результат скачиваем и используем! Все достаточно просто и самое главное бесплатно )

Делаем озвучку через программу

Начинаем процесс установки. Для запуска программы RVC-TTS следует принять во внимание несколько вещей:

Ваша операционная система — Windows;
У вас установлен Python версии 3.10;
Имеется установленный Git;
Наличие актуальной видео-карты у вашего ПК.

Подробно на этих пунктах мы не будем останавливаться, так как всю информацию можно свободно найти в Google. Далее переходим непосредственно к установке чудо машины для озвучки:

Открываем командную строку, открываем любую папку и начинаем выполнять по очереди следующие команды:

git clone https://github.com/litagin02/rvc-tts-webui.git
cd rvc-tts-webui
curl -L -O https://huggingface.co/lj1995/VoiceConversionWebUI/resolve/main/hubert_base.pt
curl -L -O https://huggingface.co/lj1995/VoiceConversionWebUI/resolve/main/rmvpe.pt
python -m venv venv
venv\Scripts\activate
pip install torch torchvision torchaudio –index-url https://download.pytorch.org/whl/cu118
pip install -r requirements.txt

Наш генератор озвучки установлен, однако запустить его не выйдет до тех пор пока мы не положим в него голосовую модель (RVC model), которая будет озвучивать весь текст. Найти такие рвс модели можно на просторах интернета. Это могут быть голоса каких либо персонажей, либо голоса реальных людей и даже звезд.
Модели голосов: https://docs.google.com/spreadsheets/d/1owfUtQuLW9ReiIwg6U9UkkDmPOTkuNHf0OKQtWu1iaI/edit#gid=1227575351
После того как вы выберете подходящую модель поместите её в папку “weights”;
После производим запуск в командной строке следующими командами:

venv\Scripts\activate
python app.py

Готово! Откроется веб интерфейс, в котором вам необходимо выбрать язык и текст в соответствующих полях и далее нажать на кнопку “Convert”.

Интерфэйс программы

( Этим мануалом поделился знакомый, у меня у самого mac, поэтому если возникнут вопросы можете спросить у знатоков в чате )

[AI] Обучение и использование собственной голосовой модели:

https://zelenka.guru/threads/5694450/

( установка очень похожа с той, что я описывал, но сделана подробней. Советую просмотреть )

Наши каналы

🎰CASH AI - наш канал про нейросети. В нем мы публикуем контент именно про заработок на нейросетях и не только!

👨‍💻 NEIRO CASH - все новые нейронки и новости по ним можете найти тут