October 28, 2024

Kling: как создать видео в боте

Kling — это нейросеть, которая превращает ваши идеи в живые видеоистории. С выходом новых версий 3.0 и o1, Kling стал еще мощнее: он понимает физику объектов, сохраняет черты лица и выдает кинематографичное качество 4K.

В этой статье мы разберем, как пользоваться Kling в @GPT4Telegrambot, какую версию выбрать под вашу задачу и как писать промпты, которые дают «вау-эффект».

Как это работает?

Kling создает короткие видео (5-10 секунд) тремя способами:

  • по тексту: вы описываете сцену — нейросеть рисует её с нуля.
  • по одному фото: ваше изображение становится первым кадром, который «оживает».
  • по двум кадрам (Морфинг): вы задаете начало и конец, а Kling достраивает плавный переход между ними. Про морфинг вы можете почитать отдельную статью.

Работать с Kling удобно через @GPT4Telegrambot. Чтобы начать, нажмите кнопку "Создать видео", выберите Kling и задайте основные параметры.

1. Промпт

A sneaky raccoon wandering through a quiet park at night discovers a glowing vending machine full of snacks, cinematic lighting, funny curiosity.

Описание видео, которое вы хотите получить, на любом языке.

2. Изображения

Можно отправить боту одно или два изображения, которые станут основой вашего видео. Если отправить одно, оно станет первым кадром, с которого начнется ваш ролик. Если два, то первым и последним кадрами.

3. Продолжительность

5 или 10 секунд. Видео 10 секунд расходует 2 генерации в боте. В версии Kling 3.0 доступно видео продолжительностью 15 секунд — расходует 3 генерации.

4. Версия Kling

В боте доступно несколько версий Kling, каждая из которых лучше подходит для определенных задач. Вот краткий гид:

  • Kling 3.0: ваш выбор для максимального фотореализма и детализации. Идеален для создания кинематографичных сцен, рекламных роликов и контента для блогов, где нужно качество 4K.
  • Kling o1: лучший инструмент для работы со сложными взаимодействиями, физикой объектов и модой. Эта версия отлично справляется с задачами, где нужно сохранить консистентность персонажа или показать реалистичное движение (например, виртуальная примерка одежды).
  • Kling 2.6: сбалансированный вариант для видео средней сложности. Обеспечивает лучшую стабильность движений и подходит для большинства повседневных задач.
  • Kling 2.5 Turbo: самая быстрая модель для генерации. Используйте ее для быстрых тестов, создания мемов, простых анимаций и когда скорость важнее идеального качества.

5. Соотношение сторон

  • 1:1 – квадрат
  • 16:9 – горизонтальное
  • 9:16 – экран смартфона

Соотношение сторон работает, если вы НЕ загружали изображение. В противном случае, соотношение будет таким же, как первый кадр, который вы загрузили.

После ввода параметров, нажмите кнопку "Начать генерацию".

⏳ Генерация занимает от 5 до 20 минут в зависимости от продолжительности видео и выбранной версии Kling.

Cinematic high-adrenaline big wave surfing sequence in Unreal Engine 5 photorealistic style, third-person chase cam following young athletic woman in black wetsuit bottom-turning at maximum speed on a heaving 20-foot Teahupo'o slab, the wave face a translucent blue-green wall of impossible thickness, lip throwing a full 10-foot curtain overhead, barrel forming behind her as she drives through the compression zone, spray vaporizing off the back of the board, camera dropping to water level showing the full horror of the close-out section behind, tow rope still visible mid-wave from the ski assist, hyper-detailed water physics with subsurface light scattering through the barrel ceiling, coral reef visible through shallow water in wide shots, 4K 60fps 16:9 seamless 15-20 second loop; synchronized music — low ocean frequency rumble building from first frame, drums entering on bottom turn lock-in, massive bass drop as barrel forms overhead, sustained held note through barrel section representing suspended time, explosion of full mix on exit or wipeout impact.

Как составить грамотное описание?

Используйте проверенную формулу, дополненную новыми параметрами для 3.0:

Промпт = Объект + Действие + Сцена + Камера + Освещение + Детализация

Наиболее важны первые 3 параметра.

  1. Объект: главный герой видео. Это могут быть люди, животные, предметы. Можно кратко описать внешний вид объекта: цвет волос, одежда, аксессуары и др.
  2. Действие: описание движения объекта должно быть простым и подходящим для 5-10 секундного видео.
  3. Сцена: описание окружения, в котором находится объект.
  4. Камера: приближается / отдаляется / крупный план / съемка с дрона и др.
  5. Освещение: свет и тень позволяют создать более реалистичное видео. Например, естественное освещение, закат / рассвет, свет фонарей.

Простой пример (только объект + движение):

Промпт: Большой енот читает книгу в кафе

Стандартный промпт (объект + движение + сцена):

Большой енот читает книгу в кафе. Он сидит около большого окна. Книга лежит на столе, рядом с книгой стоит чашка кофе.

Сложный промпт (объект + движение + сцена + камера + освещение):

Большой енот читает книгу в кафе. Он сидит около большого окна за окном ходят люди, камера сдвигается вправо, открывая вид на площадь из окна. Книга лежит на столе, рядом с книгой стоит чашка кофе. Теплый свет. Кинематографично

Общее правило: выбирайте более простые слова и выражения, избегайте сложных грамматических конструкций.

Если в вашем промпте есть изображение, то в описании уделите больше внимания движению, так как объект и сцена будут взяты с картинки.

Для 3.0: не бойтесь длинных описаний. Чем больше деталей про текстуры и свет, тем круче результат.

Для o1: фокусируйтесь на глаголах. Описывайте, как происходит движение.

Примеры промптов

A black raven horse rides along a black sand beach, with the ocean on the side, first-person view, showing beautiful hands in black velvet gloves, hyper-realistic contemporary photography, super-detailed shooting.
Macro cinematic video of a smooth ivory colored snake slowly moving and coiling around a brilliant diamond ring. The snake’s scales subtly shimmer while the diamond reflects rainbow light. Minimal clean background, dramatic studio lighting, shallow depth of field, extremely detailed texture, luxury jewelry commercial aesthetic, slow motion, 4K.
Create a cinematic multi-shot arctic survival sequence. Cold blue desaturated color grading. Ultra-realistic Antarctica glacier canyon. Strong wind. Natural snow physics. No fantasy. Grounded realism. ARRI Alexa cinematic quality.

Character: Lil Prompt wearing pink hoodie with hood up AND pink beanie, pink pants, winter boots. Exhausted, crawling slowly through deep snow. He does NOT notice the wolf.

Animal: Large arctic wolf. White-grey thick fur. Realistic proportions. Natural predator behavior. No stylization.

SHOT 1 (handheld tension, 6–8 seconds). Handheld camera feeling. Camera slightly shaky, as if filmed by a person hiding nearby. The wolf slowly walks in a wide circle around Lil Prompt. Wolf stays elevated on an icy ledge. We see wolf moving in frame foreground. Lil Prompt below in background, crawling weakly. He struggles forward on hands and knees. Heavy breathing. Snow blowing between them. Camera follows wolf movement slightly, subtle push-ins and small framing adjustments. Wind dominant. Snow hitting lens occasionally. Predatory tension building.

SHOT 2 (close-up threat, 4–5 seconds). Cut to close-up of the wolf's face. Low angle slightly upward. Wind moving fur. Snow particles crossing frame. Wolf bares teeth slightly. Not exaggerated. Natural animal warning behavior. Ears forward. Breathing visible in cold air. Background blurred glacier canyon. Intense eye focus. Cinematic shallow depth of field. Handheld micro-movement continues.
Промпт: pumpkin on Halloween, eyes glowing with fire
шмель сидит на цветке, цветочный луг

Теперь ваша очередь написать свой промпт и удивиться тому, на что способна нейросеть Kling ❤️🔥🍀

@GPT4Telegrambot