Нейросети и аудио. Часть 1: VEED IO и Stable Audio
Сегодня давайте о высоком - музыке. Сравнил два сервиса по генерации треков: VEED IO и Stable Audio. Первым пользовался ранее для генерации шаблонных фоновых мелодий к драфтовым видео-роликам, а второй пока еще нигде не использовал.
Stable Audio:
Длительность до 3-х минут
Хорошо понимает промт
Есть библиотека промтов
Есть несколько extras настроек и можно подавать свой трек на «вход»
Платно. Для бесплатной пробы есть 20 токенов в месяц. Одна генерация на «v2» кушает 2 токена
VEED IO:
Трек генерируется как бы тайлом, и при зацикливании начало совпадает с концом (но не в 100%)
Помимо генерации аудио инструмент работает с другими модальностями (я с помощью него генерировал субтитры для видоса)
Бесплатно
Иногда неточно понимает промт а иногда вовсе не понимает
Трек не длиннее 30 секунд
Очень сложно (почти невозможно) выгрузить mp3. Из-за кривого интерфейса сайта придется качать в формате mp4
Часто крашится и ничего не выдаёт
Мой канал про то как я прикалываюсь и работаю в нейронках: t.me/alexandsheeps