Гайд: как создать ролик, используя две нейросети
Ниже — полностью воспроизводимый гайд по моему пайплайну: ChatGPT → Nano Banana → Kling → CapCut. Делаем сценарий и промты в ChatGPT, рисуем ключевые кадры в Nano Banana, анимируем в Kling, склеиваем и допиливаем в CapCut.
Рассказываю на примере того самого трейлера iPhone.
Что понадобится
- ChatGPT — для сценария, шотлиста и промт-паков.
- Higgsfield.ai — для доступа к нейросетям.
- Nano Banana — генерация статичных кадров/ключевых артов.
- Kling — анимация (image-to-video).
- CapCut — монтаж, звук, титры, цвет.
- Бюджет/время: ~4 часа; ~$40 на кредиты (ориентир на один ролик 25–45 сек).
Общая логика пайплайна
- Замысел → шотлист (в ChatGPT).
- Ключевые арты (в Nano Banana).
- Короткие анимки на каждый шот (в Kling, 3–6 сек).
- Монтаж + звук + титры + сведение (в CapCut).
- Экспорт под площадки (Reels/TikTok/Shorts/Х).
Шаг 1. Сценарий, шот-лист и промт-пак в ChatGPT
Цель
- синопсис (1–2 фразы),
- список сцен (8–12 шотов, 3–6 сек каждый),
- промты для Nano Banana (картинка) и для Kling (анимка),
- тексты на экране в стиле Apple.
Промт на сценарий (скопируй/ставь)
Роль: креативный продюсер Apple-уровня.
Задача: сделать трейлер нового iPhone (30–40 сек), стиль: минимализм, тактильность, премиум.
Выведи JSON со структурой:
{
"overall": {
"duration_sec": 35,
"ratio": "9:16",
"mood": "premium, tactile, cinematic, clean",
"palette": ["deep black", "soft white", "graphite", "neon accent"],
"music": "slow build → beat drop на середине",
"slogan_bank": [
"Most Powerful Chip",
"Ceramic Shield. Tougher than ever.",
"Night Mode. Brighter than night.",
"Pro camera. Pro results.",
"Seamless with AirPods.",
"Tap to Pay. Done."
]
},
"shots": [
{
"id": "S01",
"goal": "показать форму, первый тактильный эффект",
"screen_text": "Designed to be felt",
"nano_banana_prompt": "<детальный промт для статичного кадра>",
"kling_prompt": "<детальный промт для 4–5с анимации>",
"camera": "slow push-in, 35mm, shallow DOF",
"lighting": "soft top light, specular highlights",
"notes": "фон нейтральный, фокус на гранях, без рук"
},
...
]
}
Ограничения: без рук и людей; без логотипов брендов, кроме нейтральных намёков; каждый кадр — с уникальным углом/материалом (сталь, стекло, оптика, экран, отверстия динамика, камеры).
Сделай 10–12 шотов: форму, материалы, экран, ночная сцена, макро камеры, AirPods pairing, Apple Pay момент, прочность стекла, финальный hero.
Для каждого шота дай 1–2 варианта screen_text из "slogan_bank".
Советы по структуре
- Длительность: 35 сек ≈ 10 шотов × 3–4 сек.
- Ритм: первые 3 шота — «тихие», 4–7 — динамика/кульминация, 8–10 — «разрешение» и финальный hero.
- Вставь «важные» сцены: Night Mode, Ceramic Shield, AirPods pairing, Tap to Pay.
Шаг 2. Генерация ключевых кадров в Nano Banana
Цель
На каждый шот — 1–2 финальных изображения в едином стиле (лучше сразу 2K+ по длинной стороне).
Базовый шаблон промта (подставляй переменные)
Ultra-detailed studio product render of the new iPhone {color_variant},
hero angle {angle_desc} with emphasis on {feature_focus} (steel edges / camera island / ceramic shield micro-bevel),
minimalist seamless background {bg_material}, soft top light with clean specular highlights,
professional product photography look, 35mm lens, shallow depth of field, pristine reflections,
no hands, no logos, no watermarks, no text, hyperrealistic, Apple-level premium aesthetic
- {color_variant}: black titanium / natural titanium / silver / blue.
- {angle_desc}: low-angle 3/4 front | top-down 15° | side macro | camera island close-up.
- {feature_focus}: ceramic shield edge | camera lens coating | speaker grill micro-holes | OLED panel.
- {bg_material}: matte charcoal | soft gradient gray | ultra-clean white.
hands, fingers, people, watermark, logo, text, extra reflections, distortion, bend
Практика
- Делай серии по 4–8 вариаций на шот; фиксируй удачный seed и свет.
- Следи за консистентностью: одинаковые пропорции, одинаковая цветовая температура.
- Если ломается перспектива — жёстче задавай угол (например: «top-down 15° tilt»).
- Ночь/low-light: тёмный фон + мягкие контровые; оставляй зону блика для «мокрого» эффекта.
Шаг 3. Анимация кадров в Kling (image-to-video)
Цель
На каждый ключевой арт — 3–6 секунд кинодвижения: пуш-ин, параллакс, лёгкий орбит, «дыхание» света.
Шаблон промта для Kling
Cinematic product shot of a premium smartphone.
Camera movement: slow push-in with subtle parallax, micro-orbit 5–8°, maintain framing of {feature_focus}.
Lens: 35mm, shallow depth of field, creamy bokeh.
Lighting: soft key from top, gentle rim light, controlled speculars.
Motion: no hands, no people, keep background minimal and clean.
Timing: {duration}s.
Mood: tactile, premium, calm → confident.
- Duration: 3–6 сек на шот; кульминацию (Night Mode / Ceramic Shield) сделай длиннее.
- Стабильность: проси «maintain subject geometry, avoid warping».
- Экран-шоты: добавь «subtle inter-pixel shimmer» вместо фейковой анимации интерфейса.
- Финал: hero-сцена — медленный орбит + лёгкий бликовый «вздох» света.
Чек-лист качества (перед экспортом)
- Единый свет и температура по всем шотам.
- Ноль «желейности» и глюков геометрии на орбитах.
- Тексты не перекрывают ключевые бликовые области телефона.
- Музыка «строится», кульминация совпадает с сильным шотом.
- Нет лишних переходов — только match-cuts/ритм.
- Длительность 25–45 сек. Смотрится на одном дыхании.
Типичные баги и быстрые фиксы
- Сломало перспективу / повело корпус: задавай угол точнее, добавляй «orthographic tendency, avoid barrel distortion».
- Мыльные материалы: повысить «specular clarity», «micro-surface detail», «photographic crispness».
- Шторм с бликами: «controlled speculars, no blown highlights».
- Разъезжается стиль между шотами: фиксируй палитру и свет в брифе, повторяй в промтах «Apple-level premium minimal studio».
- Kling «качает» фон: проси «lock background plane, parallax only on subject».
Готовые примеры
1) Nano Banana
Ultra-detailed macro of the iPhone camera island, 3/4 angle, lens coating reflections,
soft top key, subtle rim light, clean studio gradient background, 35mm, shallow DOF,
hyperrealistic product photography, Apple-level premium, no hands, no text, no watermark
2) Kling
Premium smartphone product shot. Duration 4s.
Camera: slow push-in + 6° micro-orbit around the camera island.
Lens: 35mm, shallow DOF. Lighting: soft top, controlled specular.
Keep geometry stable, background locked, add subtle reflective "breath" on glass at 70% timeline.
План по времени (реально укладывается в ~4 часа)
- Бриф + шот-лист в ChatGPT — 15–25 мин
- Генерация ключевых артов в Nano Banana — 60–90 мин
- Анимация в Kling (10 шотов × 3–6 сек) — 60–80 мин
- Монтаж/звук/титры в CapCut — 40–60 мин
Экономика
- Генерация артов + коротких анимок = ~$40 кредитов при аккуратной итерации (ориентир).
- По сравнению с классическим продакшеном — в разы быстрее и дешевле при сопоставимом впечатлении.
Если понравилась инструкция — подпишись на мой Telegram-канал, чтобы быть на два шага впереди в мире технологий и понимать, как это использовать в контенте и бизнесе.