视频模型 API
Kling v3 动作控制
可灵 3.0 动作控制——以参考图片中的人物为主体,复刻参考视频的动作生成新视频
POST
授权
在请求 Header 中传入 Authorization: Bearer <YOUR_API_KEY>。前往 API Keys 管理页 创建和管理 API Key。
请求体
application/json
固定值 kling/kling-v3-motion-control
文本提示词,可包含正向与负向描述,长度不超过 2500 字符。
示例:
"A dancer performs graceful movements in a sunlit studio"
输出分辨率,默认 720P。
可用选项:
720P, 1080P 参考图像,仅支持 1 张。生成视频中的人物、背景等元素均以该图为准。
内容要求:
- 人物比例尽量与参考视频动作比例一致,避免用全身动作驱动半身人物;
- 人物需清晰露出完整的上半身或全身肢体及头部,避免遮挡;
- 避免极端朝向(如倒立、平卧),人物占画面比例不宜过低;
- 支持真实 / 风格化角色(含人物 / 类人动物 / 部分纯动物 / 部分类人肢体比例角色)。
图片要求:
- 格式:
jpg/jpeg/png; - 大小 ≤ 10 MB;
- 宽高尺寸:300px ~ 65536px;
- 宽高比介于
1:2.5 ~ 2.5:1之间。
Maximum array length:
1参考视频,仅支持 1 段。生成视频中的人物动作与该视频保持一致。
内容要求:
- 人物需清晰露出完整的上半身或全身肢体及头部,避免遮挡;
- 建议上传单人动作视频;多人画面会选取占比最大的人物进行生成;
- 推荐真人动作,部分风格化 / 类人肢体比例角色可通过;
- 一镜到底、角色始终在画面内,避免切镜、运镜(否则会被截取);
- 动作避免过快,相对平稳的动作生成效果更佳。
视频要求:
- 格式:
MP4/MOV; - 大小 ≤ 100 MB;
- 宽高尺寸(长宽边长均需满足):340px ~ 3850px;
- 时长下限 3s,上限取决于
extra_params.character_orientation:video:≤ 30s;image:≤ 10s。
- 仅支持公网 URL,不支持 base64。
如果动作难度高、速度快,模型可能只提取其中的有效动作时长(最短需 3s 连续可用动作即可),生成结果时长可能短于上传时长。
Maximum array length:
1是否生成声音,默认 false。
扩展参数。

