51工具盒子

依楼听风雨
笑看云卷云舒,淡观潮起潮落

MOFA-Video

图片直接生视频:腾讯开源的可控性AI图生视频模型

图片直接生视频:腾讯开源的可控性AI图生视频模型

厉飞雨 阅读(68) 评论(0) 赞(3)

MOFA-Video是一种由腾讯A1实验室和东京大学的研究人员共同开源的图像生成视频模型。该技术通过生成运动场适应器将静态图像动画化,从而生成视频。基于预训练的Stable VideoDiffusion模型,MOFA-Video能够通过稀疏控制信号(如手动轨迹、面部标记序列或音频等)实现对视频生成过程中动作的精细控制。这些控制信号不仅可以单独使用,还可以组合使用,以零样本(ze