关于“混合虚实”


混合虚实,想了一段时间,决定把音视频制作,3D影像建构和老照片、老视频基于AI混合在一起的技术统称为混合虚实。混合虚实技术的发展在5G大规模部署后将会成为视频中的主流。这将进一步降低门槛,未来我们都不需要拍摄即可获得自己的任意指定场景的影像。这一天很快会到来。 摘自微博 新媒沈阳

意外地看到“圈外”的人的预测,我很佩服这位清华教授的视野。我对他描述的未来有些担忧不吐不快。

我进入实验室以来,研究的内容可以视作这位老师说的内容的最最基础(low)的那一部分。虽然我自己做的东西low,离他说的还很远,但我毫不怀疑“未来我们都不需要拍摄即可获得自己的任意指定场景的影像”。

我这种无名氏都能根据一篇论文的描述,实现“不需要拍摄即可获得自己的任意姿势的图片”。我把自己的代码开源了,我的后来人甚至不需要自己写代码,跑我的代码用我提供的参数就能生成一张原本不存在的图片。(当然我搞的还是垃圾,方法一堆限制,生成的图片一堆问题。)

但关键的是,以这个领域的人的开源或者是炫技精神,一项技术只要被介绍,很短时间内就有“傻瓜版”可用了。一年前谁能想到现在一个会敲两下命令的人就能造一个换脸视频呢?

不瞒大家,我朋友圈出现第一个ZAO制作的视频时,我一点都没怀疑真假,我还念叨我以前没发现这个明星这么像我学姐呢。我知道DeepFake,知道ZAO,甚至差不多懂它们的原理,但我的父母呢,他们看着那些假视频会往这个视频是假的方向思考吗?现在应该仍有相当大比例的圈外人信奉“有图有真相”,他们将如何接受并融入一个随随便便就能“不需要拍摄即可获得自己的任意指定场景的影像”的世界?

我觉得现在我们有义务告诉我们的周围人,有图、有视频、有声音并不意味着就有真相。