文/陈根
在一众三维技术里,虚拟现实备受市场关注——虚拟现实技术(VR)作为一种能够使人以沉浸的方式进入和体验人为创造的虚拟世界的计算机仿真技术,是三维场景可视化的重要代表。
然而,尽管经过多年宣传,VR头戴式耳机至今也仍未成为电视或计算机屏幕上观看视频的必备设备。一个重要的原因是VR依然会让用户感到不适。虽然用户实际上是注视着2D显示器,但VR会产生3D观看的错觉,从而使人视觉疲劳和感到头晕恶心。
在这样的背景下,全息图对应而出。全息图是以激光为光源,用全景照相机将被摄体记录在高分辨率的全息胶片上构成的图。与传统的照片相比,传统的照片呈现的是真实的物理图像,而全息图则包含了被记录物体的尺寸、形状、亮度和对比度等信息。这些信息储存在一个很微小但却很复杂的干涉模式中。
长期以来,研究者们一直在试图制造出计算机生成的全息图,但传统上,该过程需要一台超级计算机来进行物理模拟,这不仅非常耗时,而且产生的效果真实感不高。
近日,来自麻省理工学院的研究者已经开发出一种几乎可以立即生成全息图的研究方法。研究人员表示,基于深度学习的方法非常高效,使得新方法瞬间就能够在笔记本电脑上运行。
具体来说,新方法能够实时从单个RGB深度图像合成光致彩色3D全息图。其中,研究人员的卷积神经网络(CNN)具有极高的内存效率(低于620千字节),在单个消费级图形处理单元上以60赫兹运行,分辨率为1920×1080像素。
利用低功耗的设备上人工智能加速芯片,研究人员的CNN还可以在移动(iPhone 11 Pro,1.1赫兹)和edge(Google edge TPU,2.0赫兹)设备上进行交互式运行,在未来的虚拟和增强中具有出色的实时性能现实移动头戴。
研究人员通过引入具有4000对RGB深度图像和相应3D全息图的大规模CGH数据集(MIT-CGH-4K)来启用该方法。研究人员表示,此次张量全息术的新方法或将推动 VR 和 3D 打印等领域引入全息技术。该研究的论文现已发表在《Nature》上,索尼对部分研究提供了支持。