ПОШАГОВЫЙ ГАЙД ПО СОЗДАНИЮ ВИДЕО-ШЕДЕВРОВ С VEO3
Вы наверняка видели вирусные ролики, которые взорвали интернет: бабушка в мире Майнкрафта или выгуливающая бегемота, интервью с улетающими в небо людьми и многие другие.
Всё это — работа нейросети Veo3 от Google, способной создавать невероятно реалистичные и детализированные видео по текстовому описанию. Но еще важнее то, что она может реалистично генерировать голос, даже на русском языке.
Естественное желание каждого творческого человека — прикоснуться к этой магии и попробовать самому.
Единственное, что смущает сразу, это цена. 8-секундная генерация напрямую в veo3 стоит 1200 рублей. Дороговато для экспериментов, да и для работы тоже недешево.
Но есть обходной путь, который позволяет генерировать те же самые видео, но по цене в сто раз ниже.
В этом гайде я проведу вас за руку по всему процессу создания видео в Veo3. Мы не просто сэкономим бюджет, но и научимся писать "умные" промпты, которые дают предсказуемо качественный результат.
Я поделюсь не только техническими шагами, но и всеми лайфхаками, которые я нащупала в процессе десятков экспериментов. Готовы? Тогда погнали!
Глава 1. Подготовительный этап
Прежде чем мы начнём творить, нужно подготовить наш "рабочий цех". Этот этап самый важный и требует немного внимательности. Пройдём его по шагам.
1.1 Как получить доступ к Gemini 2.5 Pro из России
- Регистрируемся. Переходим на официальную страницу Gemini, регистрируем аккаунт и выбираем тарифный план Gemini Advanced. Стоимость — $15 в месяц, но первый месяц можно попробовать бесплатно, потребуется только привязка карты (привязать иностранную карту из России будет стоить около 500 рублей).
Важно: доступа из России нет, поэтому вам понадобится сменить IP адрес на другую локацию.
- Оплачиваем подписку. Если из России, то проще всего это сделать через специализированные Telegram-боты или сервисы. Они за небольшую комиссию оплачивают вам сервис по ссылке или дают данные карты, чтобы вы оплатили самостоятельно. Я пользуюсь вот этим ботом с гуманными ценами.
1.2 Бонусом вы получаете доступ к целому набору мощных инструментов Google
Ваш AI-ассистент прямо в Google Документах, Таблицах и Презентациях. Он может писать тексты, анализировать данные, создавать слайды.
В чате с Gemini можно создавать качественные картинки, не уступающие GPT и многим другим моделям.
Объем, который Gemini запоминает, глубина рассуждений, понимание нюансов и качество текста на русском вас точно порадуют.
1.3 Ограничения, о которых нужно знать, генерируя видео в Gemini
- Длительность: Максимум 8 секунд на одно видео (как и везде, но помним об этом)
- Соотношение сторон: Только 16:9 (стандартное горизонтальное видео). Вертикальные ролики придётся кадрировать вручную.
- Ежедневный лимит: 3 генерации видео в сутки. Этого мало для бездумных тестов, но вполне достаточно для вдумчивой работы.
1.4 Дополнительный набор инструментов
1. Если вы планируете делать длинные видео
Видеоредактор. В нём мы будем склеивать наши 8-секундные отрывки, добавлять музыку и эффекты. Самый удобный и простой — CapCut
Есть версия и для компьютера, и для телефона.
2. Если вам нужны вертикальные видео
Если вам понадобятся вертикальные видео для Reels или Shorts, можно использовать любой бесплатный онлайн-инструмент. Например, этот
Итак, наш плацдарм готов. Дальше мы погрузимся в самую интересную часть — творческий процесс и написание промптов, которые действительно работают.
Глава 2: От провала до вирусного ролика
Теория — это хорошо, но вся магия (и все сложности) проявляются на практике. В этой главе я не буду давать вам сухие инструкции. Вместо этого я покажу всё закулисье создания ролика про Михалыча и Петю. Это реальная история со всеми ошибками, находками и итоговым результатом.
Этап 1: "Простые промты — скучный результат"
Я начинала с коротких и простых запросов в духе: "Деревенский мужчина и робот чинят самогонный аппарат, мужчина говорит то и то, кинематографично".
Результат? В целом было мило, но чего-то не хватало.
А иногда результат получался непредсказуемым.
Вывод №1: Стало ясно: чтобы получить живое, интересное видео, промпт должен быть не просто описанием, а емким техническим заданием для режиссёра, оператора и художника по свету.
Этап 2: "Использование генератора промптов"
Писать такие сложные ТЗ с нуля — непросто. Я пошла двумя путями: стала изучать чужие успешные работы и использовать вспомогательные инструменты.
Одним из таких инструментов стал бесплатный генератор промтов для veo3. Он помогает накидать структуру и обогатить запрос деталями. Именно там я нашла основу для знаменитого промпта про "бабушку и бегемота" и переделала его под свой первый ролик для "Юлино" — тот самый, где робот Вася роняет ведро.
Это сработало — видео получилось гораздо более детализированным и живым, а результат был близок к первоначальному сценарию и задумке.
Вывод №2: Не нужно изобретать велосипед. Анализируйте чужие работы и используйте генераторы промптов, чтобы понять логику и структуру сложных запросов.
Этап 3: "Мозговой штурм с ИИ — создаём сценарий вместе"
Для следующего, более сложного эпизода с Михалычем, я решила использовать Gemini как полноценного соавтора и технического консультанта. Это было удобно, в одном чате я генерировала видео, а в соседнем — советовалась по промтам и процессу.
Творческий процесс выглядел так:
- Раскадровка: Разбили сложную идею на две простые сцены: "завязку" у клуба и "кульминацию" внутри. Отказались от идеи впихнуть весь сюжет в одно видео (вступительное видео было сгенерировано отдельно).
- "Отлов багов": Продумывали логику действий. Например, именно в процессе обсуждения я поняла, что заставить робота поставить стакан, а потом взять тряпку — почти нереальная задача для ИИ. Так родилось решение с огурцом, а потом и финальная сцена, где робот просто с любопытством смотрит в свой стакан.
- "Конфликт перевода": Самым показательным был момент, когда Михалыч вместо слова "гайд" упорно говорил "проводник". ИИ пытался стилизовать речь под "советскую эпоху" и по-своему трактовал команду "говорить на чисто русском языке", избегая англицизмов.
- Рождение "режиссёрского промпта": В итоге я пришла к той самой "золотой формуле", когда вся хореография сцены (действия, речь, движения камеры) выносится в самый верх промпта. Это и стало ключом к успеху.
Вывод №3: Используйте ИИ (Gemini, ChatGPT) как партнёров для мозгового штурма. Обсуждайте с ними сценарий и просите помочь найти слабые места в логике действий ещё до генерации. Это экономит время и попытки.
Этап 4: "Магия монтажа — собираем всё воедино"
Генерация — это лишь половина дела. Из пяти сделанных генераций две оказались почти идеальными. По тому же принципу я сгенерировала первый эпизод в видео и дальше началась работа в видеоредакторе CapCut.
- Склеила сцены, вырезала неудачный момент, где Михалыч уходит.
- Добавила "глитч-эффект" на переходе между сценами (кстати, эту идею тоже подсказал Gemini).
- Наложила звуки: добавила шум помех на переходе и тот самый вопросительный писк R2-D2 в конце, который нейросеть упорно не хотела генерировать.
Михалыч получился настолько горячим, что видео отнесли в категорию 18+ (шучу, смотрите все сами)
Главный вывод: Финальное видео — это результат синергии: Идея + Промпт-инжиниринг + Генерация + Творческий монтаж.
Нейросеть — это мощный инструмент, но режиссёром и финальным автором остаетесь вы.
Глава 3: Золотые правила и лайфхаки
История этого эксперимента — это хорошо, но вам нужны конкретные, работающие правила, которые можно брать и использовать. В этой главе я собрала 5 ключевых принципов. Эти "лайфхаки" сэкономят вам время, нервы и драгоценные генерации.
Правило №1: "Режиссёрский промпт"
- Проблема: В длинном промпте, где детали локации, стиля и света идут первыми, нейросеть может "устать" и уделить меньше внимания самому главному — действию.
- Решение: Всю "хореографию" сцены — кто что делает, кто что говорит, как движется камера — выносите в самый верх промпта, в первый же блок.
Модель отдает наивысший приоритет первым строкам. Описав действие в самом начале, вы даете ей четкое "режиссерское" указание. Все остальные блоки (Локация, Стиль и т.д.) она использует как уточняющие декорации и фон для уже заданной сцены.
Правило №2: "Один промт — одно ключевое действие"
Нейросеть — прекрасный художник, но плохой хореограф.
- Проблема: Попытка заставить персонажа выполнить последовательность действий в одном кадре (например, поставить стакан, а затем взять тряпку) почти всегда проваливается.
- Решение: Формулируйте задачу как одно простое, непрерывное движение или статичную позу.
Нейросеть пока не понимает логику последовательных действий. Она пытается сделать всё одновременно, что приводит к "сломанной" анимации и артефактам (третьи руки, слипшиеся предметы).
Да, модели иногда забывают, что они полиглоты, и сбиваются на английский.
- Проблема: Персонаж в кадре начинает говорить по-английски, особенно в сложных, перегруженных деталями сценах.
Вот пример сцены, в которой было слишком много действий и герои упорно переходили на английский.
- Решение: Делайте акцент на нужном языке.
- В описании действия укажите:
...говорит на чистом русском языке... - Сразу после этого добавьте в скобках
(Russian language). - Для надежности, в блоке
ЗВУКможно продублировать:Голос персонажа: чистый русский язык (Russian language). - Если не помогает, нужно упросить сцену: количество действий или персонажей.
Правило №4: "Стилизация > Бренды"
Не стоит указывать бренды или названия — путь к ошибкам и блокировкам.
- Проблема: При упоминании "РенТВ" генерация блокировалась из-за авторских прав. При упоминании игры "Atomic Heart" модель могла сбиться на генерацию игровых скриншотов.
- Решение: Не называйте бренд, а описывайте его стиль.
Правило №5: "Принимайте 'счастливые случайности'"
Иногда лучший режиссёр — это сама нейросеть.
- Проблема: Генерация не всегда на 100% соответствует вашему сценарию.
- Решение: Не спешите браковать видео, если оно немного отличается от задумки. Всмотритесь — возможно, результат получился даже лучше.
В финальном ролике робот не просто смотрит в камеру, а с грустным звуком опускает голову. Этого не было в сценарии, но эта "ошибка" генерации добавила персонажу неожиданной глубины и сделала сцену еще смешнее. Гибкость и умение адаптировать сценарий под удачный результат — ключевой навык при работе с ИИ.
Глава 4: Пошаговый "рецепт" — от идеи до готового ролика
Теперь, когда вы знаете все правила и хитрости, давайте соберем весь процесс в один простой и понятный чек-лист. Это ваш пошаговый план действий для создания любого видео.
- Придумайте идею. Сразу разбейте её на короткие 8-секундные сцены. Помните: для каждой сцены — одно ключевое действие. Не пытайтесь уместить слишком много событий в один кадр.
- Для каждой сцены составьте подробный "режиссёрский" промпт по "золотой формуле": в самом верху опишите всю хореографию, а ниже — детали персонажей, локации, стиля, света и звука.
- Не стесняйтесь обсуждать идеи и искать слабые места в сценарии вместе с чат-ботом (Gemini, ChatGPT).
- Отправляйте готовый промпт в Gemini. Помните про дневной лимит (3 видео).
- Не расстраивайтесь, если первая попытка неидеальна. Попробуйте еще раз, слегка изменив детали в промпте, или просто запустите тот же самый — результат может отличаться.
- Внимательно просмотрите полученные видео. Выберите лучшие "дубли".
- Ищите "счастливые случайности" — неожиданные движения или детали, которые могут обогатить вашу историю, даже если их не было в первоначальном сценарии.
- Загрузите лучшие кадры в ваш видеоредактор (например, CapCut).
- Склейте сцены в нужной последовательности.
- Добавьте магии: вставьте переходы, наложите недостающие звуки.
- При необходимости сделайте базовую цветокоррекцию, чтобы все кадры выглядели в едином стиле.
- Если вам нужен вертикальный формат для Reels или Shorts, кадрируйте готовый ролик 16:9 в онлайн-сервисе (например, Adobe Express).
- Готово! Ваш видео-шедевр можно публиковать.
Промты, которые были использованы в финальных роликах
Промт для видео про бабушку Агафью и Васю:
ОПИСАНИЕ СЦЕНЫ: Репортажная съемка. Бабушка советской эпохи говорит в микрофон с логотипом «РенТВ», который держит журналист за кадром со стороны объектива. Бабушка смотрит на собеседника.
Внезапно позади нее появляется человекоподобный робот. В его руках жестяное ведро с водой.
Бабушка тепло улыбается в объектив. Голос бабушки теплый и хрипловатый, она говорит на чисто русском языке: "Это Вася, мой помощник, он всегда составляет мне компанию!" Когда она представляет своего любимого робота, робот неуклюже топчется на месте, пытается поставить ведро на стол, но оно падает с тяжелым, звучным стуком. Камера резко поворачивается, чтобы показать, как робот пытается поднять ведро. Бабушка смеется со смесью раздражения и нежности, ее голос хриплый, но нежный, она продолжает: "Он только учится, но очень старается". Робот почти поднимает ведро, но оно опять падает. Видеозапись резко прерывается, когда робот падает на пол, наклон камеры, после чего изображение становится черным.
ВИЗУАЛЬНЫЙ СТИЛЬ: Кинематографический реализм с легкой винтажной патиной.
ГЛАВНЫЙ ОБЪЕКТ СЪЕМКИ: бабушка советской эпохи с фотоаппаратом в руках, робот - второстепенная, но заметная фигура.
ФОНОВАЯ ОБСТАНОВКА: Интерьер деревенского дома — деревянные бревенчатые стены, деревянная мебель, выцветший зеленый диван, белые салфетки на столике, мягкое желтое освещение. На подоконнике окна стоят цветы в горшочках, на окне висят белые кружевные занавески, за окном темно.
ЗВУКИ: На фоне: отдаленный лай собак, иногда тихие, почти незаметные звуки сверчка, крик петуха вдалеке. Музыка и текст не накладываются. Видео заканчивается звуком щелчка камеры и окончательной, резкой паузой.
Камера: Съёмка «от руки», как будто оператор ведёт репортаж. Лёгкая дрожь, естественные микродвижения.
Цвет и свет: Мягкие землистые цвета. Лёгкая плёночная зернистость создаёт винтажный эффект.
Промт для видео про Михалыча и Петю:
Открывающий кадр — локация, Михалыч и робот стоят за столом с гранеными стаканами в руках. Камера направлена на них. Михалыч и робот смущенно замирают. Пауза. Михалыч пожимает плечами и доброжелательно мягко говорит на чисто русском языке: “Это... Это в научных целях!" Робот в это время с любопытством заглядывает в свой стакан.
Камера плавно поворачивается на робота Петю. Он медленно поднимает голову и смотрит своей линзой прямо в камеру и издает короткий электронный звук, похожий на любопытный вопрос.
ЛОКАЦИЯ: Интерьер старого деревенского клуба, переоборудованный в мастерскую-лабораторию. Стены — бревенчатые. На них висят чертежи советских времен. В центре комнаты стоит сложный самогонный аппарат из медных трубок и стеклянных колб. Рядом на грубом деревянном столе стоит большая стеклянная бутыль с жидкостью и тарелка с маринованными огурцами.
ПЕРСОНАЖИ: Михалыч: Мужчина 50-55 лет, с усами, в ватнике и шапке-ушанке.
Робот: Высокий, неуклюжий человекоподобный робот из алюминия. Вместо лица — одна большая синяя фото-линза. Дизайн в стиле советской фантастики 70-х.
КАМЕРА: Съёмка "от руки", в репортажном стиле. Лёгкая естественная дрожь.
В середине сцены камера делает плавный панорамный поворот (pan) от Михалыча к роботу.
СТИЛЬ И АТМОСФЕРА: Стиль советских фильмов 70-80х годов, кинематографический реализм. Дух вселенной "русской кибердеревни".
Настроение: ироничное, абсурдное, комедийное.
СВЕТ И ЦВЕТ: Мягкие землистые цвета. Лёгкая плёночная зернистость для винтажного эффекта. Полумрак. Основной свет — от одной тусклой лампочки под потолком (тёплый жёлтый), создающий резкие тени. Холодное синее свечение от плакатов на стенах. Холодные отблески на корпусе робота и стаканах.
ЗВУК: В начале — скрип двери. На фоне — тихий гул работающего аппарата. Голос Михалыча: чистый русский язык (Russian language), доброжелательный, немного стеснительный. В конце робот Петя издает короткий электронный звук, похожий на любопытный вопрос R2-D2.
Давайте будем честны: на сегодняшний день Veo3 в Gemini — это скорее мощный инструмент для творчества, экспериментов и создания вирусного контента для соцсетей, чем для потокового коммерческого производства.
Но потенциал огромен. Я, например, уже думаю о создании атмосферного буктрейлера для своей книги или необычных видео-обложек для статей. Этот инструмент идеально подходит для любых задач, где нужна яркая, нестандартная и запоминающаяся картинка.
Но что делать, если вам нужно видео для карточки на маркетплейсе с вашим конкретным товаром? Или серия роликов с одним и тем же персонажем для рекламы?
Здесь на сцену выходят более специализированные платформы. Самая интересная из них сейчас — Higgsfield. Она создана именно для коммерческих задач:
- Загружать фото своего продукта и "оживлять" его в видео.
- Создавать постоянных цифровых аватаров и снимать с ними целые сериалы.
- Использовать десятки готовых шаблонов вертикальных и горизонтальных видео.
Это уже совсем другой уровень, и он заслуживает отдельного, большого гайда, к которому мы, возможно, еще вернемся.
Итог
Главный вывод, который я сделала: нейросети пока не кнопка "сделать красиво". Это мощный, иногда странный, но невероятно талантливый соавтор. Ключ к успеху — в эксперименте и синергии.
Не бойтесь пробовать, ошибаться и отклоняться от сценария. Возможно, самые интересные открытия ждут вас на стыке вашей идеи и "странностей" искусственного интеллекта.
Надеюсь, этот гайд поможет реализовать ваши творческие задумки. Успехов вам!
Больше интересного в моем канале Телеграм