Нейросети работающие с аудиозаписями и музыкой 2
Улучшение качества звука аудиозаписи.
На этом уроке мы погрузимся в удивительный мир алгоритмов, которые способны улучшать качество звука аудиозаписи.
Все нейросети работают по одинаковому принципу, поэтому во всех углубляться не будем.
Auphonic
Auphonic - это онлайн-сервис, который специализируется на инструментах для послепроизводства. Он предоставляет возможность обрабатывать аудио- и видеоматериалы, используемые в подкастах и видеороликах. В его наборе доступных алгоритмов есть не только функция удаления нежелательных шумов, но также и нормализация громкости и автоматическое выравнивание баланса между различными источниками звука. Например, вы можете легко настроить уровень речи, чтобы он был комфортным для восприятия в сравнении с фоновой музыкой.
Auphonic обрабатывает как отдельные файлы, так и многодорожечные проекты. Для каждой дорожки можно задать пространственные характеристики, чтобы определить, должен ли звук находиться на переднем плане или оставаться на заднем фоне, особенно если это голос.
Этот инструмент также позволяет добавлять метаданные к выходному файлу. При детальной настройке записи можно указать информацию о авторах, участниках записи, названии альбома, издателе, типе лицензии, годе выпуска, жанре, тегах и комментариях.
В настройках обработки можно включить внешний сервис распознавания речи, который позволит автоматически преобразовывать голосовые записи в текстовый формат. Вы сможете сохранить однотипные параметры в виде шаблона для будущих проектов.
Auphonic предоставляет бесплатную версию, но она ограничена общей продолжительностью обрабатываемых аудиодорожек до 2 часов в месяц. Если вам требуется профессиональная работа, вам потребуется подписка, стоимостью от 11 долларов в месяц.
Регистрируемся. "Try Auphonic"
Заполняем все поля, чтобы понять делайте автоматический перевод страницы.
Затем нажимаем "Начать производство".
Audo Studio
Audo Studio похож на предыдущий сервис, но в данном случае фокус именно на фильтрации записи голоса от посторонних шумов. Помимо удаления раздражающего фона инструмент может нейтрализовать эхо и реверберацию звука в помещении, а также выровняет уровень громкости. Для регулировки интенсивности обработки предусмотрен один слайдер.
Готовый результат можно прослушать и быстро сравнить с исходной версией. Обработанный файл легко конвертировать во все популярные форматы аудио: WAVE, AIF, OGG Vorbis, AAC, MP3, M4A.
Бесплатно в Audo Studio разрешается обрабатывать до 20 минут записей в месяц. За 12 долларов лимит расширяется до 10 часов в месяц.
Adobe Podcast
https://podcast.adobe.com/enhance
В Adobe Enhance Speech нет никаких настроек. Нейросеть нейтрализует эхо и удаляет большинство посторонних шумов автоматически. Можно загрузить файл продолжительностью до часа и размером до 1 ГБ, а потом сравнить исходную запись с отфильтрованной.
Если голос записан слишком тихо по сравнению с окружающими звуками, то часть слов может пропасть после обработки. Enhance Speech не только уменьшает количество шумов, но и перестраивает саму речь, чтобы повысить её чёткость.
Алгоритм неплохо справляется с английским языком, а вот в других случаях происходит забавная ситуация. Например, русский может звучать так, будто человек говорит с американским акцентом. Эти странности проявляются не на всех словах, но стоит помнить о такой особенности сервиса.
На данный момент Enhance Speech в составе набора Adobe Podcast доступен бесплатно.
Runway
https://app.runwayml.com/video-tools/teams/viktorbevz637/ai-tools/clean-audio
Чистит звук, простой интерфейс, хорошо выполняет свои задачи.