Клонируем любой голос и используем для свои целей

У самого была проблема найти хороший голос, для использования в своих целях по большей части в нейронках слышно, что голос робота ну и как бы да, можно поиграться и сделать голос, чтобы он был как живой, но легче просто клонировать любой Русский голос по типу ( Литвина, Масленников и т.д ) и он будет говорить на любых языках под разное гео и разные задачи...

Для этого над понадобиться сайт https://huggingface.co/spaces/tonyassi/voice-clone

Но изначально нужно найти референс. Идём на ютуб )

Выбираем понравившийся голос блогера, возьму на примере канал КЛИФФХЭНГЕР, где голос диктора максимально чёткий и кайфовый )

Дальше нужно скачать один из роликов, советую качать шортсы
Для этого переходим на сайт: https://ru.get-save.net/248284-u5RRNJ4Kehc/ https://cobalt.tools/

В нужное окно вставляем ссылку и скачиваем ролик

Дальше нам нужно вытащить субтитры. Переходим на сайты и заходим на тот, который открывается )

Я делаю это на этом сайте - https://speech2text.ru/ или можно здесь - https://huggingface.co/spaces/hf-audio/whisper-large-v3-turbo

Так же помимо субтитров нам нужен только MP3 файл нашего скаченного ролика

Я делаю это на этом сайте - https://audio-extractor.net/ru/ Вставляем наше скаченное видео и получаем MP3 файл

Дальше скачиваем субтитры когда они загрузились без таймкодов

Теперь переходим на сайт - https://huggingface.co/spaces/tonyassi/voice-clone Вставляем наше скаченное аудио, а текст переводим на нужный нам язык в моём случае сделаю английский, переводить можно тут: https://www.deepl.com/ru/translator

И после нажимаем Submit. Свой результат отправил под этим постом в ТГ

Наш результат готов ! Теперь нужно добавить нашу озвучку в нейросеть, чтобы пользоваться ей всегда

Для этого качаем бесплатную нейросеть в данном посте:
https://t.me/c/1868030061/2190
Либо перейдите через закреп в канале и выберите Озвучка 2

После того как скачали всё по инструкции открываем нашу нейросеть и после нас перебрасывает в браузер

Теперь нам нужно создать TXT файл и закинуть туда наш текст на нужном нам языке, в моём случае ENG

ВАЖНО ! Чтобы txt и mp3/wav файл были одинакового названия, дальше переходим в папку озвучка

Fish_speech -> examples

Копируем наши файлы и вставляем в папку examples

Теперь перезапускаем нашу нейронку закрывая её в браузере и закрывая панель

Теперь можем увидеть, что при выборе голоса у нас всё появилось

Выбираем его и тестируем на другом ENG тексте

Все результаты, которые получились у меня скину ниже данного поста в тг: https://t.me/+Y90bSwhEzztmNDRi

Так же можете поиграться с ползунками, настроить скорость, тэмбор по себя и т.д

Рекомендация, старайтесь находить референс где в ролике нету какой либо музыкы, чтобы голос был чётким без лишних шумов, тогда сгенерируется всё намного лучше. Всех благ !

https://teletype.in/@sobolevtgg/sob_obuch