Диалог
April 18, 2024

Что такое AI-режиссура?

Интервью подготовлено проектом «Режиссёрский разбор» Беседовал Никита Карих


Тема искусственного интеллекта и его применения в сфере кино-/видеопроизводства актуальна довольно давно и пройти её стороной мы просто не могли. В рамках беседы с режиссёром, сценаристом и автором Tg-канала «AI Filmmaker» Дмитрием Алексеевым мы выяснили чем искусственный интеллект может оказаться нам полезен, как он влияет на кино и что такое AI-режиссура.

Дима, привет. Давай начнём наш разговор с короткого знакомства: как ты начал заниматься искусственным интеллектом и ушёл из, скажем так, классической режиссуры в режиссуру AI?

Стоит сказать, что AI-режиссура от классической в целом ничем не отличается. Ну, опять же, на мой взгляд. Просто я скорее режиссёр, который понимает каким образом реализовывать какие-то сцены или отдельные кадры при помощи ИИ и каким образом эти инструменты могут помочь мне рассказывать истории.

Так получилось, что с ноября 2022 года, когда вышла версия V4 Midjourney, в которой появились первые фоторильные примеры генерации, я думал над тем, в каком формате можно его протестировать и придумал сизл трейлера, который и начал делать на ходу. Нашёл инструменты, которые просто по видео с твоей фронтальной камеры переносят мимику на любое изображение и сразу смекнул: “Ага, это можно перенести на сгенерированных персонажей. Значит у нас уже появляется виртуальный актер”. В рамках работы над этим проектом каждый день я тратил где-то в районе 6 часов в день в течение 30 дней.

По окончании работ я показал коллегам первую сборку этого трейлера. Конечно, реакция у них была забавная: “А что это такое? Это графика?”. В тот момент мне казалось, что, все сейчас будут делать такие трейлеры. Но, как показала практика, до сих пор подобного рода проекты - с такой сложной техникой - ещё никто не делал.

Собственно, так и получилось, что я сделал один трейлер, потом и ещё какие-то начали прилетать заказы.

Какая у тебя подготовка на этапе пре-продакшена, когда ты занимаешься производством ролика с помощью искусственного интеллекта?

Моя подготовка мало чем отличается от подготовки любого другого режиссёра, так как я не режиссёр анимации, просто так получилось. То есть, я придумываю идею, понимаю, какие у меня есть ограничения по анимации, движениям камеры. Я стараюсь мыслить в рамках технических ограничений - это важно понимать. Понимаю примерно для себя жанр и начинаю уже писать промты. Эта работа похожа на работу с референсом по факту.

В целом, это мало чем отличается от обычной режиссуры. Но преимущество заключается в том, что ты можешь по сгенерированным референсам собрать бордоматик, а уже потом приступать к полноценной анимации. Когда я работал над роликом по мотивам Миядзаки, то собирал полностью 4,5-минутный бардоматик из сгенерированных кадров. Мне кажется, что всё-таки режиссёр анимации по-другому работают. А мы лишь двигаемся на интуиции какой-то.

Если говорить о будущем, предполагаешь ли ты, что создание роликов с помощью искусственного интеллекта станет отдельным направлением, отличным от кино? То есть, будет кино, анимация и… что-то, чему нам ещё предстоит придумать своё название.

Сложно сказать. У нас имеется многомиллиардная индустрия во всём мире, которую никуда не денешь. Когда меня куда-то приглашают, я говорю о том, что нейросети пришли в своё время в нашу жизнь и индустрию. Мы слишком много и быстро потребляем контент и его ценность снизилась. Сроки ожиданий тоже сузились. То есть если раньше было так: ты посмотрел какой-то сериал или фильм и потом можешь несколько дней ходить и о нём думать. Сейчас нас удивить стало сложнее. Плюс производство тех же блокбастеров дорожает. Мы хотим больше, мы хотим интереснее и человеческими ресурсами невозможно этого достичь. Поэтому я думаю, что ИИ - это хороший инструмент, необходимый для того, чтобы улучшить производимый контент.

Но есть также и такой нюанс: мы не знаем как на самом деле распорядятся продюсеры, компаний-мейджоров этой бесконечной силой. Потому что есть, конечно, очень большой шанс, что, например, когда можно будет выгнать всех актеров, чтобы им не платить, они перестанут это делать. Сейчас мы живем в эпоху кинозвёзд и им платят не всегда за их талант. Это тоже инструмент зарабатывания денег в кино и из-за этого бывают нередко мискасты, как мы знаем. Но если можно не платить какой-нибудь Скарлетт Йоханссон 50 миллионов из 150-миллионного бюджета, то, конечно, продюсеры не будут этого делать. Однако когда это случится люди будут обвинять искусственной интеллект.

То есть, ты всё-таки допускаешь, что искусственный интеллект сможет заменить человека?

Нет, я допускаю вариант, в котором жадные люди заменят людей на искусственный интеллект, потому что он работает когда ему скажешь, денег лишних не попросит и ещё не будет выделываться и просить чашку кофе. То есть, с точки зрения продюсирования здесь одни плюсы.

Но есть интересный момент: были новости, что Сэм Альтман – один из основателей OpenAI – ходил на встречи с главами Голливудских студий, чтобы найти какой-то консенсус по плавной интеграции в индустрию их наработок.

Недавно я общался со своим другом и камнем преткновения в нашей беседе стали разные взгляды на развитие искусственного интеллекта внутри индустрии. Он считает, что ИИ подобен созданию атомной бомбы –  его создатели сами не понимают до конца что они создали. Я же говорю ему, что скорее всего искусственный интеллект и создание фильмов с его помощью будет временным трендом, каким было 3D 15 лет назад. Рассуди. 

Я прекрасно понимаю людей, которые настороженно к этому всему относятся. Но вспомним, что в своё время к фотографии живописцы относились также. Также относились и к цифровым камерам те, кто снимал на плёнку.

Нам нужно понимать, что при увеличении масштабов, мы будем вязнуть в производственном болоте, которое будет требовать всё больше и больше человеческих жертв. Ведь очень много историй существует, когда художники, аниматоры, или, например, создатели игр просто выгорали. Сначала сделали какой-то потрясающий продукт, а потом годами не могли работать. То же относится и к кинематографистам. Когда машины заберут на себя большую часть производственной рутины, нам останется лишь то, ради чего мы вообще в эту профессию пришли - акт творчества.

Но есть ещё, конечно, ребята, которые рассуждают: а творчество ли это? Для меня - однозначно да. Кто-то, например, собирает кучку мусора и выставляет в музее, считая это творчеством. Оно имеет разные виды и формы, почему нет?

Вот про творчество, кстати, как раз и хотел с тобой далее поговорить. Я недавно заметил – и ты сам, в начале нашей беседы, подтвердил это моё наблюдение, – что на данный момент ролики, которые создаются при помощи ИИ, представляют из себя набор статичных картинок, которые ты потом анимируешь. И в целом получается, что как-будто не ты делаешь эту работу, а искусственный интеллект делает её за тебя… Сможешь ли ты меня в этом переубедить?

Смотри, когда ты делаешь какой-то проект, за тебя художку делает художник-постановщик. Разве ты перестаёшь от этого быть творцом? Твоё творчество - это твоё видение, твой art-direction. Когда ты выбираешь какой-то вектор, изображение, его характер, собираешь всё это в единую картину, почему это не может быть творчеством? Людям как-будто тяжело просто поверить, что у нас наконец появилась кнопка “сделать офигенно”. Мы в целом идём по кругу вечных принятий неизбежного: нет, только изобразительное искусство - true; нет, только плёночная фотография; нет, только компьютерная графика; нет, только нейросети… А что дальше будет? Нет, симуляция в мозгу, это не true, а вот нейросети были true.

Я считаю это вполне себе творчеством, при том, что я себе вообще никогда не называл AI-художником. Когда у меня “Миядзаки” завирусился, нас с Сергеем в прессе называли и AI-пацаны, и AI-энтузиасты и так далее. Но сам я в первую очередь себя позиционирую как режиссёр, AI-filmmaker. Почему? Потому что создаю визуальные истории.

Если продолжать нашу беседу в контексте, ну в таком философском ключе, как ты считаешь ролики, создаваемые тобой создаются такой при помощи искусственного интеллекта или искусственным интеллектом при твоей непосредственной помощи?

В моём случае ролики создаются именно мной при помощи искусственного интеллекта, потому что я определяю какие в нём будут сцены и в каком порядке, какие персонажи, с каким ритмом, с каким звуком. То есть, в целом искусственный интеллект за меня решает визуальную часть. Но даже анимацию я делаю сам: добавляю, например, импакты от выстрелов, тряску камеры и так далее. Это большая работа, которая не отличается от компьютерной графики.

Вопрос от слушателя:

Выход в аниме-стилистику происходил потому что немного проще с этой эстетикой работать, потому что очень много материала и хорошо обученных на нём нейросетей или какие-то еще можешь назвать причины?


Ты всё верно сказал. Действительно, аниме – один из самых популярных анимационных стилей. До сих пор каждый месяц выходит по несколько аниме-сериалов и соответственно это самый огромный анимационный датасет. Это первый момент. Второй момент заключается в том, что аниме само по себе так структурировано. Это вообще анимационный Японский стиль, появившийся в послевоенные годы и стал он популярен за счёт дешевизны производства. Для аниме характерны какие-нибудь плавные проезды и другие решения, которые оптимизируют производство.

За время работы над клипом, нами было отсмотрено очень много ретро-аниме. Просто чтобы понять по каким принципам они выстраивают кадр, анимируют и так далее. И оказалось, что там очень много простых, но изящных решений, которые также сформировали визуальный стиль аниме. То есть, пусть это будет ретро-аниме эстетика, но при этом я буду работать по всем законам кино.

Дим, спасибо тебе за то, что присоединился сегодня к нам. Скажи, есть ли тебе что сказать напоследок нашей аудитории?

Я могу сказать, что мы вступаем в то время, когда одним из самых важных навыков в будущем – это мое видение – будет умение рассказывать истории именно с авторской, режиссерской точки зрения. То есть мы движемся в эпоху… Нет, мы уже в эпохе персонального контента. Но сейчас это прерогатива блогеров и нейросети в ближайшем будущем помогут создавать более глубокий и интересный контент.