September 8, 2025

Гайд: как создать ролик, используя две нейросети

Ниже — полностью воспроизводимый гайд по моему пайплайну: ChatGPT → Nano Banana → Kling → CapCut. Делаем сценарий и промты в ChatGPT, рисуем ключевые кадры в Nano Banana, анимируем в Kling, склеиваем и допиливаем в CapCut.

Рассказываю на примере того самого трейлера iPhone.


Что понадобится

  • ChatGPT — для сценария, шотлиста и промт-паков.
  • Higgsfield.ai — для доступа к нейросетям.
  • Nano Banana — генерация статичных кадров/ключевых артов.
  • Kling — анимация (image-to-video).
  • CapCut — монтаж, звук, титры, цвет.
  • Бюджет/время: ~4 часа; ~$40 на кредиты (ориентир на один ролик 25–45 сек).

Общая логика пайплайна

  1. Замысел → шотлист (в ChatGPT).
  2. Ключевые арты (в Nano Banana).
  3. Короткие анимки на каждый шот (в Kling, 3–6 сек).
  4. Монтаж + звук + титры + сведение (в CapCut).
  5. Экспорт под площадки (Reels/TikTok/Shorts/Х).

Шаг 1. Сценарий, шот-лист и промт-пак в ChatGPT

Цель

За 10–15 минут получить:

  • синопсис (1–2 фразы),
  • список сцен (8–12 шотов, 3–6 сек каждый),
  • промты для Nano Banana (картинка) и для Kling (анимка),
  • тексты на экране в стиле Apple.

Промт на сценарий (скопируй/ставь)

Роль: креативный продюсер Apple-уровня. Задача: сделать трейлер нового iPhone (30–40 сек), стиль: минимализм, тактильность, премиум.

Выведи JSON со структурой: { "overall": { "duration_sec": 35, "ratio": "9:16", "mood": "premium, tactile, cinematic, clean", "palette": ["deep black", "soft white", "graphite", "neon accent"], "music": "slow build → beat drop на середине", "slogan_bank": [ "Most Powerful Chip", "Ceramic Shield. Tougher than ever.", "Night Mode. Brighter than night.", "Pro camera. Pro results.", "Seamless with AirPods.", "Tap to Pay. Done." ] }, "shots": [ { "id": "S01", "goal": "показать форму, первый тактильный эффект", "screen_text": "Designed to be felt", "nano_banana_prompt": "<детальный промт для статичного кадра>", "kling_prompt": "<детальный промт для 4–5с анимации>", "camera": "slow push-in, 35mm, shallow DOF", "lighting": "soft top light, specular highlights", "notes": "фон нейтральный, фокус на гранях, без рук" }, ... ] } Ограничения: без рук и людей; без логотипов брендов, кроме нейтральных намёков; каждый кадр — с уникальным углом/материалом (сталь, стекло, оптика, экран, отверстия динамика, камеры). Сделай 10–12 шотов: форму, материалы, экран, ночная сцена, макро камеры, AirPods pairing, Apple Pay момент, прочность стекла, финальный hero. Для каждого шота дай 1–2 варианта screen_text из "slogan_bank".

Советы по структуре

  • Длительность: 35 сек ≈ 10 шотов × 3–4 сек.
  • Ритм: первые 3 шота — «тихие», 4–7 — динамика/кульминация, 8–10 — «разрешение» и финальный hero.
  • Вставь «важные» сцены: Night Mode, Ceramic Shield, AirPods pairing, Tap to Pay.

Шаг 2. Генерация ключевых кадров в Nano Banana

Цель

На каждый шот — 1–2 финальных изображения в едином стиле (лучше сразу 2K+ по длинной стороне).

Базовый шаблон промта (подставляй переменные)

Ultra-detailed studio product render of the new iPhone {color_variant},
hero angle {angle_desc} with emphasis on {feature_focus} (steel edges / camera island / ceramic shield micro-bevel),
minimalist seamless background {bg_material}, soft top light with clean specular highlights,
professional product photography look, 35mm lens, shallow depth of field, pristine reflections,
no hands, no logos, no watermarks, no text, hyperrealistic, Apple-level premium aesthetic

Переменные идей:

  • {color_variant}: black titanium / natural titanium / silver / blue.
  • {angle_desc}: low-angle 3/4 front | top-down 15° | side macro | camera island close-up.
  • {feature_focus}: ceramic shield edge | camera lens coating | speaker grill micro-holes | OLED panel.
  • {bg_material}: matte charcoal | soft gradient gray | ultra-clean white.

Негатив-подсказки:

hands, fingers, people, watermark, logo, text, extra reflections, distortion, bend

Практика

  • Делай серии по 4–8 вариаций на шот; фиксируй удачный seed и свет.
  • Следи за консистентностью: одинаковые пропорции, одинаковая цветовая температура.
  • Если ломается перспектива — жёстче задавай угол (например: «top-down 15° tilt»).
  • Ночь/low-light: тёмный фон + мягкие контровые; оставляй зону блика для «мокрого» эффекта.

Шаг 3. Анимация кадров в Kling (image-to-video)

Цель

На каждый ключевой арт — 3–6 секунд кинодвижения: пуш-ин, параллакс, лёгкий орбит, «дыхание» света.

Шаблон промта для Kling

Cinematic product shot of a premium smartphone.
Camera movement: slow push-in with subtle parallax, micro-orbit 5–8°, maintain framing of {feature_focus}.
Lens: 35mm, shallow depth of field, creamy bokeh.
Lighting: soft key from top, gentle rim light, controlled speculars.
Motion: no hands, no people, keep background minimal and clean.
Timing: {duration}s.
Mood: tactile, premium, calm → confident.

Рекомендации:

  • Duration: 3–6 сек на шот; кульминацию (Night Mode / Ceramic Shield) сделай длиннее.
  • Стабильность: проси «maintain subject geometry, avoid warping».
  • Экран-шоты: добавь «subtle inter-pixel shimmer» вместо фейковой анимации интерфейса.
  • Финал: hero-сцена — медленный орбит + лёгкий бликовый «вздох» света.

Чек-лист качества (перед экспортом)

  • Единый свет и температура по всем шотам.
  • Ноль «желейности» и глюков геометрии на орбитах.
  • Тексты не перекрывают ключевые бликовые области телефона.
  • Музыка «строится», кульминация совпадает с сильным шотом.
  • Нет лишних переходов — только match-cuts/ритм.
  • Длительность 25–45 сек. Смотрится на одном дыхании.

Типичные баги и быстрые фиксы

  • Сломало перспективу / повело корпус: задавай угол точнее, добавляй «orthographic tendency, avoid barrel distortion».
  • Мыльные материалы: повысить «specular clarity», «micro-surface detail», «photographic crispness».
  • Шторм с бликами: «controlled speculars, no blown highlights».
  • Разъезжается стиль между шотами: фиксируй палитру и свет в брифе, повторяй в промтах «Apple-level premium minimal studio».
  • Kling «качает» фон: проси «lock background plane, parallax only on subject».

Готовые примеры

1) Nano Banana

Ultra-detailed macro of the iPhone camera island, 3/4 angle, lens coating reflections,
soft top key, subtle rim light, clean studio gradient background, 35mm, shallow DOF,
hyperrealistic product photography, Apple-level premium, no hands, no text, no watermark

2) Kling

Premium smartphone product shot. Duration 4s.
Camera: slow push-in + 6° micro-orbit around the camera island.
Lens: 35mm, shallow DOF. Lighting: soft top, controlled specular.
Keep geometry stable, background locked, add subtle reflective "breath" on glass at 70% timeline.

План по времени (реально укладывается в ~4 часа)

  • Бриф + шот-лист в ChatGPT — 15–25 мин
  • Генерация ключевых артов в Nano Banana — 60–90 мин
  • Анимация в Kling (10 шотов × 3–6 сек) — 60–80 мин
  • Монтаж/звук/титры в CapCut — 40–60 мин

Экономика

  • Генерация артов + коротких анимок = ~$40 кредитов при аккуратной итерации (ориентир).
  • По сравнению с классическим продакшеном — в разы быстрее и дешевле при сопоставимом впечатлении.

Если понравилась инструкция — подпишись на мой Telegram-канал, чтобы быть на два шага впереди в мире технологий и понимать, как это использовать в контенте и бизнесе.