February 25

О цунами музыкального ИИ

"Снегурочка", нейротрек, взорвавший чарты, сделан Сашей Комович, фотографом из Улан-Удэ.

Помнится, когда нейросети только зарождались, тема эта казалась диковинкой, уделом программистов-задротов. Сидишь, бывало, с коллегами за обедом, рассказываешь: «Представляете, есть нейросеть, которая проанализировала все песни The Beatles и выдала собственную композицию в их стиле!». В ответ — удивление пополам с недоверием: «Надо же, придумают же люди!». Прошло всего пару лет — и уже треть песен в мире создается ИИ. И это не просто проходной контент: творения нейросетей занимают верхушки чартов. Думаю, многие уже слышали композиции вроде «Снегурочки» или «На мурмулях».

Как это отразится на живых музыкантах? Вопрос непростой. Их, если честно, жаль. И раньше было непросто конкурировать. Музыка — пипец какой тяжелый труд, где успех всегда был уделом единиц. Даже до появления ИИ ситуация складывалась не в пользу рядового артиста. В Средневековье странствующий менетсрель мог прокормиться, переходя из деревни в деревню, получая признание и уважение. Потом появились технологии записи и копирования, и менестрель начал конкурировать с чародеями, которые могли телепортироваться в тысячу мест одновременно, забирая заработок. А теперь появился искусственный интеллект — это уже джинн, готовый исполнить любое музыкальное желание.

Поэтому совет, особенно родителям, которые видят будущее своих детей в музыке: если вы просто любите музыку, не спешите делать её профессией вашего чада. По крайней мере, сейчас. Рискованней некуда.

Конечно, многие возразят: «Как машина может конкурировать с живым артистом? В ней же нет души, она поёт неестественно!». Для начала, это уже не так. Современные нейросети виртуозно имитируют дыхание, эмоциональный накал и прочие нюансы живого вокала. То, что мы называем «душевностью» исполнения, часто базируется на безупречной технике. Высокая полетная нота, которая берет за душу — это результат десятилетий муштры. ИИ делает это автоматически, без усилий. И в этом его колоссальное преимущество: он может эффективно конкурировать в эмоциональном плане просто потому, что многие певцы физически не способны выполнить те или иные вокальные приемы на том же уровне. Живой исполнитель может «дать петуха», сорвать голос. А ИИ — нет. Сейчас появляются треки, которые даже специалисты не могут отличить от реальных.

Важно понимать: когда мы говорим о действительно великих, проникновенных человеческих песнях, мы говорим о крошечной фракции лучших из лучших. Тех, кто прошел через годы, а то и десятилетия истязаний и тренировок. ИИ же достигает этого результата мгновенно.

При этом глупо отрицать, что у нейросетей есть множество объективных плюсов. Один из главных доводов хейтеров — «они не люди» — на деле оборачивается их сильнейшей стороной. Они могут решать проблемы, которые людям не под силу.

Первое. Баланс формы и содержания.

В музыкальном мире присутствует некоторый негласный дисбаланс. Есть две условные категории: «звукари» и «текстовики». Первые выдают качественный звук, крутые аранжировки, но часто с текстами хрень — либо банальщина, либо откровенные заимствования. Вторые пишут глубокие стихи, но их музыкальное воплощение хромает: вокал невзрачный, мелодии однообразные. А хочется и смысла, и качества. ИИ эту проблему способен решить, подтянуть то, что лагает.

Отличный тренд — озвученные стихи великих поэтов. Пушкин, Есенин, Маяковский, Блок, Бродский в обрамлении качественной музыки — это работает. Можно слушать с удовольствием и не испытывать претензий к качеству текста.

Не буду приводить в пример "Сыпь, гармоника!" Есенина, что звучит из каждого рилса, а вставлю лучше "Ночь, улица, фонарь, аптека" Блока.

Второе. Смешение жанров и эклектика.

Это отдельный кайф для автора. Фьюжены, неожиданные комбинации: фолк с роком, поэзия Серебряного века с электроникой, классика с контемпорари. Думается, сама концепция песни изменится. Она перестанет быть статичной записью, превратившись в дерево с множеством ветвей. Любую композицию можно будет переделать в любой жанр по клику. Эминем в стиле Irish Folk? Пожалуйста. RnB в формате церковного госпела? Here you are. Билли Айлиш перепевает Аллу Пугачеву? На здоровье.

В плейлисте автора, например, есть прекрасная композиция «Respiration» — «Дыхание» Наутилуса, перепетая приятным французским женским вокалом. Или группа YKZX (кажется, автор из Краснодара), делающая J-pop dubstep с вокалисткой, что выдает японские тексты с западной техникой исполнения. Эклектика, зачет.

YKZX - думаю, реальные японские артистки так не поют, но звучит прикольно

Третье. Деконструкция и юмор.

Постмодернизм, как философское направление в социуме и политике, очень не люблю. Но в искусстве он дает занятные плоды. Сейчас, например, появилась масса пародий, хулиганских, матерных песен, ломающих шаблоны. Любимый пример — «Крапива джаз»: приятный, ламповый джаз с озорно непристойными текстами. Или зумерский шансон, "Баня" в стиле брутализм, офисный фолк-рок "Мы производим гвозди по ГОСТу". Раньше у юмористических текстовиков часто проседала музыкальная часть. Теперь с помощью ИИ музыка подтягивается до уровня, когда реально качает. Отдельное направление — музыкальная озвучка комментариев, порой выходят настоящие шедевры.

Весь декабрь мурлыкал "Крапива Jazz", новогоднее настроение обеспечили.

Четвертое. Воскрешение кумиров.

ИИ создает целые альтернативные вселенные, дописывая творчество ушедших музыкантов. Кого только не «оживили»: Цоя, Высоцкого, Элвиса Пресли, Курта Кобейна, Фредди Меркури, всех не перечислишь. Нейро-Цой, например, звучит очень достоверно — и по стилистике, и по музыке, как продолжение группы «Кино». Благодаря ИИ, Цой - жив.

Пятое. Синергия.

ИИ объединяется с другими направлениями. Музыкальные композиции обрастают продуманными визуальными образами, целыми вселенными с собственным лором и богатой историей. Нейро-музыканты создаются с нуля и вполне способны конкурировать с реальными, а в чем-то и превосходить их.

Развитие идет колоссальными темпами. Очень интересно наблюдать за тем, как ИИ цунами трансформирует музыкальную индустрию прямо сейчас. Посмотрим, что будет дальше.

P.S. Текст этой заметки был надиктован автором, затем расшифрован, структурирован и отполирован нейросетями, что сэкономило уйму времени.