模型优势

动作与表情:提示词中描述的具体动作、面部表情能够被准确执行,减少"自由发挥"导致的偏离

运镜与构图:推拉摇移、特写全景等镜头语言的指令可被正确理解和执行

文字生成:画面中需要出现的文字内容、字体风格、出现位置和时机,大部分情况下可准确呈现

运动质量:动作轨迹符合真实规律,人物行走、奔跑、打斗等动作流畅自然

物理规律:人与物体的接触、碰撞有合理的反馈,比如拿取物品、推拉动作的重量感和阻力感

结构保持:在动态中、在跨分镜场景下,物体结构都能保持一致

质感真实:材质表面的光影、反射、透明度等渲染接近真实世界

多模态参考 特征精细保持

参考生成
视频
图像
Ref 1 Ref 2 Ref 3
输出
参考生成
视频
视频
输出
参考生成
图像
Ref 1 Ref 2 Ref 3 Ref 4 Ref 5 Ref 6 Ref 7
音频
输出

Prompt: 参考 @视频1 的人物动作和镜头语言,生成 @图像1@图像2的打斗场面,打斗背景是@图像3,打斗的过程模仿像素游戏,背景音乐是@音频1中的音乐,随着打斗动作还有打斗音效。

Prompt:固定镜头,中央鱼眼镜头透过圆形孔洞向下窥视,参考 @视频1 的鱼眼镜头,一只穿着红色新年衣服的可爱小猫看向镜头,嘴角带笑。背景是深黄色墙面、黑白波点地砖的复古走廊,暖黄壁灯点缀其间,镜头畸变带来的空间收拢感鱼眼镜头,场景模仿门上猫眼,动作参考 @视频2 ,小猫看着镜头,说“新年好!开门,seedance来啦!”

Prompt:8秒智性博弈式战斗动漫片段,贴合复仇主题。0-3秒: @图像1中女主转身坐下,转镜头,女主下了一步棋子,并说“你输了”,参考 @图像2的分镜画面,女主声音参考@音频1中的御姐音色,背景参考@图像3。3-4秒:快速摇镜头,转向对面特写@图像4中的男人面部,男人说:“怎么会!”,参考@图像5的分镜画面,男人咬牙切齿,对结果很不满。4-6秒:切镜头,俯拍,女人下了一步棋,对面的人们惊叹,参考@图像6的分镜画面。6-8秒:镜头迅速向下摇,画面黑屏转场,后画面渐亮,昏暗室内,女人看着窗外月色静静地说“我们走着瞧”,参考@图像7的分镜画面。