这两天不是有一个2024世界人工智能大会嘛
我在上面看到了不少叫人眼前一亮的黑科技。
我对里面印象最深的就数商汤科技那个Vimi了。
你问这是个啥?
那我就给你简单讲一下:这Vimi是个可控人物视频生成大模型。
白话讲就是你只需要上传一张照片,它就能给你整出一段1分钟左右的人物视频,还能自己加各种动画、声音、文字特效。
主要是最近的AI修复老照片这个小项目比较火
所以对这方面的工具就比较关注。
emmmm,其实也不是没见过类似的产品,但问题一堆。
就比如有的呢,人物动作和表情都巨僵硬,调半天也弄不好;有的视频效果时好时坏,人长相和背景都能瞬间变
更别提有的连几秒的视频都整不明白,根本满足不了我们这些视频创作者的要求啊。
这不,商汤的这帮研究人员就专门研发了Vimi这个大模型来解决这些痛点。
这款Vimi,不光能精准控制人物表情,在半身范围内也能做出超自然的肢体动作,连头发衣服背景什么的都能匹配,光影效果也特别真实,看着贼拉和谐。
别看上面说只能生成1分钟视频,关键这一分钟的画面效果能一直稳定,不会突然崩了,这点就能甩其他产品好几条街。
而且这个大模型主要就是面向咱们普通C端用户的,尤其是女性用户,你们懂的,爱自拍爱玩的妹子们有福了!
以后只要传几张不同角度的自拍照,这个Vimi就能给你变出一个数字分身,还能拍出好几种风格的写真视频。
里面的人物啊,表情动作那叫一个到位,手啊身啊脸的,配合得那叫一个细致,到时候你想咋选角度咋剪辑就随你了。
对了,平时人们还喜欢自己在聊天软件上斗斗图啥的?
Vimi在这方面也有大用处!
你就给它提供一张自拍照,它能给你整出一堆有趣的表情包,聊天、唱歌、跳舞各种场景都行,玩法可以说是相当多样了。
下面这就是Vimi出的动态表情包:Vimi生成的表情包动图
Vimi生成的兵马俑表情包
好啦,今天就先给大家分享到这儿吧。