May 23, 2024

Нейросети и аудио. Часть 1: VEED IO и Stable Audio

Сегодня давайте о высоком - музыке. Сравнил два сервиса по генерации треков: VEED IO и Stable Audio. Первым пользовался ранее для генерации шаблонных фоновых мелодий к драфтовым видео-роликам, а второй пока еще нигде не использовал.

Stable Audio:

  • Длительность до 3-х минут
  • Хорошо понимает промт
  • Есть библиотека промтов
  • Есть несколько extras настроек и можно подавать свой трек на «вход»
  • Платно. Для бесплатной пробы есть 20 токенов в месяц. Одна генерация на «v2» кушает 2 токена


VEED IO:

  • Трек генерируется как бы тайлом, и при зацикливании начало совпадает с концом (но не в 100%)
  • Помимо генерации аудио инструмент работает с другими модальностями (я с помощью него генерировал субтитры для видоса)
  • Бесплатно
  • Иногда неточно понимает промт а иногда вовсе не понимает
  • Трек не длиннее 30 секунд
  • Очень сложно (почти невозможно) выгрузить mp3. Из-за кривого интерфейса сайта придется качать в формате mp4
  • Часто крашится и ничего не выдаёт


Мой канал про то как я прикалываюсь и работаю в нейронках: t.me/alexandsheeps