网传的三星“虚拟人项目”只是个大饼,公司前台的饭碗保住了

  • 9

就这?

前两天我们写了一篇关于CES的小文章,在最后提到了有传言说三星可能要发布一项叫做“霓虹”(Neon)的全新的虚拟人项目,通过真人采样来生成几可乱真的可以交互的虚拟人形象。

这个传言最早起源于一个社交媒体上的帖子,楼主在三星的网页上面发现了几个即将在CES上公布的预告片。在预告片里面,几个人在一边说话一边指手画脚。

预告片片段预告片片段

单看这个片子可能只是有点奇怪,但是配合其他一些发掘出来的说明词,就有点引人遐思了。“霓虹”的核心技术叫做Core R3,三星给出的定义是“真实、实时和响应(Reality,Realtime,Resbonsive)”。有些网友就开始猜测,这些“人”会不会只是我们过去在科幻电影和科幻游戏中见到的那种,用技术手段生成的虚拟形象?

最让吃瓜群众兴奋的是,三星泄露出来的预告片中的角色质量实在是太高了,完全没有现在AI图形处理常见的各种瑕疵和漏洞。假如一切都是用AI即时生成的,那三星一定还藏了一些了不起的黑科技。这给三星吸引了不少关注,有个博主针对这个传言做了一期视频,吸引了40多万播放量,比绝大多数CES产品发布会的播放量都要高。

昨天“霓虹”项目正式发布了,一切问题也揭开了谜底,总体来说,让人有点扫兴。

“霓虹”预告片中角色的质量高,完全是因为这个片完全就是真人实拍的视频,没有使用任何黑科技,所以看起来当然要比其他AI生成的形象要真实的多。

这个引人遐思的预告片其实就是真人视频录像这个引人遐思的预告片其实就是真人视频录像

三星“霓虹”项目的目标是生成一个会识别用户的表情和动作,并且做出相应回应的虚拟形象。现在的智能家居、语音识别产品,一般都是非常冰冷的机器形象,替换成可以互动的虚拟人,可能会让用户觉得更温暖舒适一些。

这几年没少在酒店里见到这玩意这几年没少在酒店里见到这玩意

不过在发布会上,“霓虹“目前还没有拿出任何让人眼前一亮的新成果。现场的演示角色表情比较僵硬,语音系统也说不上有多先进。整个项目目前看起来更像是一个面向未来画下的大饼。

当然,这不意味着“霓虹“这样的设想无法被实现。如果你在过去几年里面关注过图形深度学习相关的科技趋势,就会知道这样的虚拟人项目不算太过天方夜谭。大名鼎鼎的“Deepfake”,就是通过深度学习技术,用一个人的脸演绎另一个人的表情。

把游戏角色的面孔投射到Coser拍摄的视频上,可能是宅男们的终极春梦把游戏角色的面孔投射到Coser拍摄的视频上,可能是宅男们的终极春梦

另外在2016年,也有一项通过建模,实现实时表情投射的技术,这个原理和Deepfake有一些区别,重点在实现即时交互上。

左上人物的表情可以即时投映到左下人物的脸上左上人物的表情可以即时投映到左下人物的脸上

2018年,加州大学伯克利分校的一篇论文,提出了深度学习影像处理的一种更有趣的应用:通过机器学习采集素材,将一个人的动作投射到另一个人的身上,让理工宅男宅女化身舞蹈大神。

整合好上面的几项技术,加在现在已经很成熟的语音生成技术,实现科幻电影和科幻游戏里面常见的那种可以交互和对话的虚拟人,其实真的没有我们想象得那么遥远。

不过目前,至少三星的“霓虹“,还没有走到那一步。商场导购和公司前台的小哥哥小姐姐们可以暂时放心了,AI界现在派出和他们竞争岗位的选手只有下面这货。


展开全文

3 条评论

发布
取消
返回顶部
App内打开