
据悉,万相2.6在技术层面通过多模态联合建模,可对输入视频的时序信息、主体特征及声学要素进行学习,旨在实现生成视频在画面与声音上的整体一致性。其分镜控制功能可依据语义理解,将原始素材构建为包含多镜头切换的专业叙事段落。
此次升级重点提升了画质、音效与指令遵循能力,单次生成视频时长最高支持15秒。新增的角色扮演功能允许用户上传个人视频并结合提示词,模型可自动完成分镜设计、角色演绎与配音,生成具备电影感运镜的短片。该能力主要面向广告设计、短剧制作等专业场景。

目前,万相模型家族已具备文生图、图像编辑、文生视频等十余种视觉创作能力。即日起,用户可通过官网体验万相2.6,企业用户也可通过阿里云百炼平台调用模型API。


