Клонируем любой голос и используем для свои целей
У самого была проблема найти хороший голос, для использования в своих целях по большей части в нейронках слышно, что голос робота ну и как бы да, можно поиграться и сделать голос, чтобы он был как живой, но легче просто клонировать любой Русский голос по типу ( Литвина, Масленников и т.д ) и он будет говорить на любых языках под разное гео и разные задачи...
Для этого над понадобиться сайт https://huggingface.co/spaces/tonyassi/voice-clone
Но изначально нужно найти референс. Идём на ютуб )
Выбираем понравившийся голос блогера, возьму на примере канал КЛИФФХЭНГЕР, где голос диктора максимально чёткий и кайфовый )
Дальше нужно скачать один из роликов, советую качать шортсы
Для этого переходим на сайт:
https://ru.get-save.net/248284-u5RRNJ4Kehc/
https://cobalt.tools/
В нужное окно вставляем ссылку и скачиваем ролик
Дальше нам нужно вытащить субтитры. Переходим на сайты и заходим на тот, который открывается )
Я делаю это на этом сайте - https://speech2text.ru/ или можно здесь - https://huggingface.co/spaces/hf-audio/whisper-large-v3-turbo
Так же помимо субтитров нам нужен только MP3 файл нашего скаченного ролика
Я делаю это на этом сайте - https://audio-extractor.net/ru/
Вставляем наше скаченное видео и получаем MP3 файл
Дальше скачиваем субтитры когда они загрузились без таймкодов
Теперь переходим на сайт - https://huggingface.co/spaces/tonyassi/voice-clone Вставляем наше скаченное аудио, а текст переводим на нужный нам язык в моём случае сделаю английский, переводить можно тут: https://www.deepl.com/ru/translator
И после нажимаем Submit. Свой результат отправил под этим постом в ТГ
Наш результат готов ! Теперь нужно добавить нашу озвучку в нейросеть, чтобы пользоваться ей всегда
Для этого качаем бесплатную нейросеть в данном посте:
https://t.me/c/1868030061/2190
Либо перейдите через закреп в канале и выберите Озвучка 2
После того как скачали всё по инструкции открываем нашу нейросеть и после нас перебрасывает в браузер
Теперь нам нужно создать TXT файл и закинуть туда наш текст на нужном нам языке, в моём случае ENG
ВАЖНО ! Чтобы txt и mp3/wav файл были одинакового названия, дальше переходим в папку озвучка
Копируем наши файлы и вставляем в папку examples
Теперь перезапускаем нашу нейронку закрывая её в браузере и закрывая панель
Теперь можем увидеть, что при выборе голоса у нас всё появилось
Выбираем его и тестируем на другом ENG тексте
Все результаты, которые получились у меня скину ниже данного поста в тг: https://t.me/+Y90bSwhEzztmNDRi
Так же можете поиграться с ползунками, настроить скорость, тэмбор по себя и т.д
Рекомендация, старайтесь находить референс где в ролике нету какой либо музыкы, чтобы голос был чётким без лишних шумов, тогда сгенерируется всё намного лучше. Всех благ !
https://teletype.in/@sobolevtgg/sob_obuch