• 11月26日 星期二

微软HoloLens光学架构师详述AR/VR/MR数字光学元件和技术

映维网 2019年10月31日)伯纳德·克雷斯(Bernard Kress)是微软HoloLens光学架构师(Partner职级)。他在10年代的初期主要是担任谷歌眼镜的首席光学架构师,但于2015年来到了微软,并一直从事HoloLens混合现实智能头显的研发工作。

作为对EDO19 Digital Optical Technologies大会的介绍,克雷斯撰文概述了当前当前AR/VR/MR的数字光学元件和技术。下面是映维网的具体整理:

已于2019年6月24日-27日结束的EDO19 Digital Optical Technologies的话题涵盖了用于AR/VR/MR系统的新型光学元件,如自由空间光学元件,波导光学元件(波导组合器),衍射,全息和超表面光学元件,可调,可切换和可重新配置的光学元件。下一届大会将于2021年6月21日-24日召开。

微软HoloLens光学架构师详述AR/VR/MR数字光学元件和技术


1. 介绍

国防一直是增强现实和虚拟现实的首批应用领域,这最早可以追溯至上世纪50年代。接下来,第一个消费者VR/AR浪潮于90年代开始兴起,但因为过于超前,尚未成熟,沉浸式领域的热度开始淡化萎缩。然而,正是由于缺乏可用的消费者显示技术和相关传感器,当时诞生了一系列的新型光学显示概念,而它们在今天依然是相当前沿的技术,如Reflection Technology的“Private Eye”智能眼镜(1989)和任天堂的Virtual Boy(1995)。两者都是基于扫描显示器,而非平面显示器。尽管这种显示技术在当时十分超前,但消费者级IMU传感器,低功率3D渲染显卡,以及无线数据传输技术的缺乏导致第一起VR浪潮于90年代的消退。另一个原因是数字内容的缺乏,或者缺乏对企业和消费者VR/AR内容的清晰认识。

这与General Magic早期的iPod开发十分类似。在90年代后期,这家公司提出了所述的硬件概念,但当时缺乏无线传输技术和音乐库。十年后的苹果终于整合了这三个要素(硬件,WIFI,在线音乐库),而这种iPod概念颠覆了一个时代。它不仅成为了一种理想的音乐播放产品,同时引起了消费市场的强烈共鸣。

类似地,无论消费者AR/VR头显的质量如何,如果缺乏相应的“iTune Store App”,消费者市场将不会实现腾飞。

在第一波浪潮衰退之后的十年间,依然在持续拓展AR/VR技术的领域是国防工业,如飞行模拟与训练(用于旋转翼飞行器的头盔式显示器和用于固定翼飞行器的平视显示器)。在00年代,有效的消费者努力是汽车平视显示器和个人双目头显视频播放器领域。

今天的工程师们从小就能接触到不断普及的平板显示器技术,而比起20年前不得不从零发明新颖沉浸式显示技术的同行相比,他们已经习惯于这样的创新额。自2012年以来,我们看到了基于现成智能手机显示面板(LTPS-LCD,IPS-LCD,AMOLED)或Pico显示面板(HTPS-LCD,mu-OLED,DLP,LCoS),以及IMU,摄像头,深度传感器(结构光和飞行时间)的初始沉浸式AR/VR实现。目前,头显显示架构正在缓慢发展为更具体的技术,而且与平板显示器更适合沉浸体验的要求。就如同在20年前兴起的发明浪潮(无机mu-LED面板,一维扫描阵列,二维激光/VCSEL MEMS扫描器……),现在行业可谓是欣欣向荣。

就显示,联网和传感器方面,智能手机技术生态系统塑造了第二波VR/AR浪潮,而且一直是早期产品最为显而易见的目标用例。这种传统额度显示技术将作为下一波的初始催化剂。

然而,AR/VR沉浸式显示体验是延续半个多世纪以来的传统面板显示体验的范式转变:从CRT电视到LCD电脑显示器和笔记本电脑屏幕,再到OLED平板电脑和智能手机,LCoS,DLP和MEMS扫描仪数字投影仪,再到iLED智能手表(请参见图1)。

微软HoloLens光学架构师详述AR/VR/MR数字光学元件和技术


图1:沉浸式近眼显示器:个人信息显示器的范式转变

当用平板显示技术和架构(智能电话或微型显示面板)来实现沉浸式近眼显示设备时,光学扩展量,固定焦点和低亮度成为了严重的限制。为了支持近眼显示器匹配人类视觉系统的特性,我们需要替代性的显示技术。

虚拟现实/增强现实/智能眼镜热潮在本世纪10年代初的第二次兴起带来了新的命名趋势:混合现实,融合现实,扩展现实,或统称为XR。智能眼戴设备(包括数字信息显示器和眼镜)趋向于替代最初的智能眼镜命名惯例。

2. 智能眼镜/AR/MR/VR市场

与第一次的AR/VR热潮不同,今天的投资者,市场分析师,AR/VR/MR开发商及企业用户都期望这种独特的技术能够在未来5年内带来真正的投资回报, 如2017/2018 Gartner技术成熟度曲线所示(参见图2)。

微软HoloLens光学架构师详述AR/VR/MR数字光学元件和技术


图2:Gartner技术成熟度曲线

2017年的Gartner图表表明,AR和VR有望在2年到10年内达到稳定的发展,而VR要领先AR数年。这是大多数AR/VR分析师所认可的概念。有趣的是,修订后的2018年图表不再显示VR,而是MR。VR在2018年进入了一个更为成熟的阶段,甚至成为一种商品,所以Gartner将其从新兴技术类别中移除。

但我们必须谨慎看待。目前已得到证实的可持续市场是企业MR,其中投资回报率(ROI)主要是成本成本规避:

  1. 新员工的上手速度更快,错误更少,收益更高。
  2. 协同设计,远程专家指导,更好的服务,增强的监控。
  3. 更高的制造质量保证。
  4. 提升了产品展示和演示,并提供了更好的最终用户体验。

混合现实已经在出制造业(汽车,航空电子设备,重工业产品),电力,能源,采矿和公用事业,技术,媒体和电信,医疗保健和外科手术,金融服务以及零售/接待/休闲领域等领域出现了明显的投资回报率。

现有智能眼镜/AR/MR消费市场的证据则相对不是十分明显。智能眼镜(Google Glass,Snap Spectacles,英特尔Vaunt或North“Focals”)已经经过试水;VR头显的发展最近有所放缓(Oculus/Facebook VR,谷歌Daydream,索尼PSVR),而其他厂商的VR项目已经终止,比如说英特尔的Alloy和宏碁/StarVR的大视场头显。但从长远来看,MR的视频用例潜力依然很大。在2018年,尽管曾带来了强大的初始产品和获得了雄厚的风投支持,但诸如MetaVision Corp(Meta2),CastAR Corp和ODG Corp(ODG R8和R9)等中等规模的企业经历了倒闭情况。其他公司则进行了重大重组,如Avegant。MetaVision和CastAR在2019年中期迎来了新生,这表明所述领域依然存在巨大的不确定性,同时充满惊喜。其他公司(Vuzix)则在整个2019年实现了持续增长和风投支持(Digilens Corp)。

在智能眼镜方面,专注于音频的智能眼镜获得了强劲的投资回报。提供音频沉浸感和世界锁定音频(仅基于IMU)的音频智能眼镜并不是全新的概念,但最近迎来了诸如环绕声和降噪等方面的进步。它们可以为消费者和企业提供基本的输入和命令,同时是增强世界体验的重要组成要素。华为等大公司最近已经推出了音频AR智能眼镜。另外,诸如Snap Spectacles(第1代和第2代)之类的摄像头眼镜和Google Glass Explorer版本一样难以获得消费者的认可。

除空间世界锁定音频外,如果存在IMU(如Bose AR Frames),则设备同时可以检测一系列不同的头部和身体姿态,包括俯卧撑,下蹲,点头,摇动,双击,看向上,向下看和转头等等。

微软HoloLens光学架构师详述AR/VR/MR数字光学元件和技术


表1:智能眼镜/AR/VR/MR头显在消费者/企业/国防领域的采用率。

在英特尔Vaunt项目的带动下,具有更小显示屏(约10度单眼视场)和视力校正功能的小尺寸智能眼镜在2018年重新抬头(2014年的谷歌眼镜遭遇了失败)。然而,英特尔的项目于当年下半年中止,转而投资了由North开发的“Focals”。但这款产品在2019年初出现了近50%的价格暴跌,而North同样进行了大量的裁员。目前消费者智能眼镜的短期前景不是十分明朗。仅针对企业领域的智能眼镜概念则出现一段安静但平稳的增长期,如RealWear头显(加拿大温哥华)和更时尚的Google Glass Enterprise V2眼镜。

另一方面,当前的风投正在疯狂地助推初创独角兽的发展,比如说Magic Leap(总投资额超过30亿美元,估值达到70亿美元)。这透露出后期阶段投资者(阿里巴巴,新加坡淡马锡和沙特基金)的“Fear Of Missing Out(害怕错过)”心理,并渴望跟随主要科技风投(谷歌,亚马逊,高通)的前期投资决定。同时值得注意的是,Magic Leap的最后两笔风投(2018年末和2019年中)是由主要通信公司提供(AT&T/金额未知,Docomo/2.8亿美元)。他们寄望于未来的AR市场将能推动带宽通信(5G,WiGig等)的发展,而这同时将为MR云服务带来持续的投资回报(AR/MR硬件回报极低)。

不论投资炒作几许,一家大型消费电子公司都很可能同时创建最终的消费者头显架构(解决视觉/可穿戴舒适性/沉浸式体验),以及随后的消费者市场。对于企业市场来说,内容是根据每家企业的特定需求而定制开发,而消费市场则需要完全依靠整个MR生态系统的发展,这包括从通用硬件到通用内容与应用程序。

尽管2018年Q3季度智能手机和平板电脑的销量首次出现了全球性下滑,而这预告了苹果于同年Q4季度30%的股票跌幅,但尚不清楚这种MR消费者硬件是否有潜力(甚至是意愿)取代 现有的智能手机/平板电脑,或作为智能手机的附件,从而提供传统显示屏概念所无法企及的沉浸式体验。

除了这里讨论的消费者和企业市场之外,MR头显在国防市场存在巨大的潜力。微软已经在2018年Q4季度拿下4.8亿美元的美国国防合同,为美国陆军开发特殊版本的HoloLens:IVAS(Integrated Visual Augmentation System;集成视觉增强系统)。这是AR/VR/MR有史以来最大的合同,并将推动全球MR生态系统的发展。

3. MR正作为下一个计算平台而逐渐兴起

智能眼镜(同时又称为数字眼戴设备)主要是眼镜的扩展,为视力障碍提供数字情景显示(请参见图3中的谷歌眼镜)。这个概念与AR或MR大不相同。 典型的智能眼镜在视场方面非常小(对角线小于15度),而且通常会偏离视线。传感器的缺乏(IMU除外)只可实现大约三自由度的头部追踪,而双目视觉的不足则只能显示简单的2D文字与图像。单眼显示器不需要双眼视觉系统那样的镜框刚度(从而减少可能引起眼睛疲劳的水平和垂直视差)。大多数智能眼镜开发商同时将视力校正作为标准功能(North的Focal或Google Glass V2)。

微软HoloLens光学架构师详述AR/VR/MR数字光学元件和技术


图3:智能眼镜,AR/VR和VR头显的兴起。

强大的连接(3G,4G,WiFi,蓝牙)和摄像头的结合令它有理由成为智能手机的强大配件,如用于情景显示功能或用作虚拟助手,GPS和社交网络配件(得益于摄像头)。智能眼镜并非旨在取代智能手机,而是补充智能手机,就如同智能手表一样。

VR头显是游戏主机的扩展,这可见于索尼,Ocuus,HTC和微软WMR等主要游戏供应商,以及诸如Steam等游戏内容合作伙伴。这种头显通常搭载游戏控制器(请参见图3)。早期的外向内传感器(如2016年的Oculus CV1和HTC Vive)已经发展至今天的内向外追踪,从而提供了更紧凑的硬件(如WMR和三星玄龙)。尽管这种高端VR系统依然需要搭载先进GPU的昂贵PC或笔记本电脑,但VR一体机已于2018年登陆消费者市场,如Oculus Go(3DOF-IMU)和HTC Vive Focus,而它们能够成为蓬勃发展的VR消费者市场的基础。最近,搭载内向外传感器的VR一体机进一步扩展了这一产品类别,比方说Oculus Quest(六自由度)。

然而,搭载内向外传感器的高端VR头显已经面世,比如说Oculus和HTC于2019年推出的Rift S和Vive Pro。诸如三星玄龙+等其他WMR头显则将2017年版本的分辨率翻了一番。

AR/MR系统将成为下一个计算平台,取代原来的桌面和笔记本硬件,以及正在衰退的平板电脑硬件。大多数这样的硬件都是无线束缚形式(参见图3的HoloLen V1),需要高端光学,组合器元件和传感器(深度扫描摄像头,头部追踪摄像头,精确的眼动追踪器和姿势传感器)。它们是当前要求最为苛刻的硬件,尤其是对光学硬件而言。最终,如果技术允许,这三个类别将融合成单一的硬件概念。不过,它们需要连接(5G,WiGig),视觉舒适度(显示技术),以及穿戴舒适度(续航能力,热管理,重量/尺寸)等方面的提升。

智能手机和平板电脑在2018年Q3季度全球销量下降是一个重大信号,这会促使大型消费电子公司和风投把目光投向“下一个划时代的产品”。无论这最终是什么,MR都是一个优秀的候选者。

4. 终极MR体验的关键

对于消费者或企业而言,终极的MR体验都是沿着两个主轴定义:舒适度和沉浸感。舒适感有两个方面:穿戴性和视觉。从显示到音频,再到手势和触觉等等,沉浸感有多种表现形式。

在舒适度和沉浸感的融合中,令人信服的MR体验需要做到三点:

  1. 低于10ms的运动到光子延迟(通过优化的传感器融合和低延迟显示)。
  2. 通过连续的深度映射和语义识别实现内容锁定。
  3. 快速眼动追踪和通用眼动追踪是必备的功能,它将能实现本文列出的众多功能。

大多数都可以通过集成于专用芯片的全局传感器融合工艺实现,例如HoloLens的HPU(Holographic Processing Unit;全息处理单元)。

4.1 穿戴舒适度和视觉舒适度

对任何一款MR头显架构而言,穿戴舒适度和视觉舒适度都是实现主流普及的重要基础。

穿戴舒适度包括:

  1. 无线束缚的头显,可实现最佳移动性(5G或WiGig带来的未来无线连接将能显著减少板载计算和渲染负载)。
  2. 体积小,重量轻。
  3. 整个头显的热管理(被动或主动)。
  4. 压力点的皮肤接触管理。
  5. 用于控制汗水和热量的透气面料。
  6. 头显重心更接近头部中心。

视觉舒适度包括:

  1. 大视窗,可实现广泛的IPD覆盖。对于消费者而言,光学器件可能会提供不同的SKU。但对于企业而言,由于头显支持实现员工共享,所以产品需要适配广泛的IPD范围。
  2. 角分辨率接近20/20视敏度(注视点区域至少为每度45像素),而外围视场区域则可适当降低每度像素数。
  3. 零纱窗效应(高像素填充系数和高PPD),没有Mira伪影。
  4. 通过高亮度和高对比度实现HDR(MEMS扫描仪和OLED/iLED等发光显示器 vs LCOS和LCD等非发光显示器)。
  5. 伪影最小化(<1%)。
  6. 不受限的200度以上透视外围视场(支持户外用例,这对国防和土木工程特别有用)。
  7. 主动调光(均匀快门或柔和边缘调光)。

基于精确/通用眼动追踪的视觉舒适度功能包括:

  1. 通过利用差分眼动追踪数据进行的聚散追踪,可以缓解位于注视点圆锥体中的近距离对象的视觉辐辏调节冲突(因为视觉调节是视觉辐辏的触发器)。
  2. 适用于大视场光学器件的有源瞳孔游离校正。
  3. 用于增加全息图不透明度(更真实)的有源像素遮挡(硬边缘遮挡)。

额外的视觉舒适度和视觉增强功能包括:

  1. 具有球面和像散屈光度的有源视力障碍矫正。
  2. 如果视觉辐辏调节冲突缓解架构不产生光学模糊,则渲染模糊将添加到3D提示并改善3D视觉体验(例如色度模糊)。
  3. 显示器关闭时的超级视觉功能,如放大镜或双目望远镜视觉功能。

4.2 显示沉浸感

沉浸感是实现终极MR体验的另一个关键因素,而且它不仅仅只是基于视场:视场是2D角度概念,沉浸感视场是3D概念,包括与用户眼睛的Z距离和支持臂展显示交互)。

用户沉浸式体验包含众多方面:

  1. 广角视场,包括每度像素数较少,色深较低的外围显示区域。
  2. 固定注视点渲染和动态注视点渲染。
  3. 通过深度图扫描仪实现的世界锁定全息图和全息图遮挡。
  4. 世界锁定的空间音频。
  5. 通过专用传感器进行精确的手势感应。
  6. 触觉

图4总结了在沉浸式体验和穿戴舒适度/视觉舒适度融合的前提下,能够令分析师对VR/AR/MR/智能眼镜市场感到乐观的主要要求。

微软HoloLens光学架构师详述AR/VR/MR数字光学元件和技术


图4:终极MR体验的舒适度和沉浸感要求

图4中的深灰色项是下一代MR头显的关键光学技术:快速,精确和通用的眼动/瞳孔/注视点追踪器。

4.3 临场感

我们认为沉浸感是一种多感官幻觉(显示器,音频,触碰等)。MR的临场感是一种意识状态,亦即头显佩戴者真正相信自己置身于不同的环境之中。沉浸感能够产生临场感。

但为了实现栩栩如生的临场感,我们需要解决头显面临的各种关键挑战,不仅仅只是显示器(刷新率,视场,角度分辨率,视觉辐辏调节冲突,边缘遮挡和HDR等等等),同时包括各种传感器(六自由度头部追踪器,深度映射传感器,空间映射传感器,眼动/瞳孔/注视点追踪器,手势传感器等等等)。MR的目标是创造高度临场感,令用户确信自己正置身于另一个(虚拟)环境之中。

5. 人类因素

为了设计一种能够实现上节所述的终极MR舒适度和沉浸感体验的显示架构,我们需要将光学设计视为以人为中心的任务。本节主要分析了人类视觉系统的特定细节,以及如何利用它来减少光学硬件和软件架构的复杂性,同时又不以任何方式降低用户的沉浸感和舒适度。

5.1 人类视觉系统

由于高视锥密度,仅覆盖2-3度,并且偏离视线约5度,中心凹的分辨力最大。中心凹是早期视觉体验的结果,并且从小就成长为一个独特的区域。

视距和光轴

人类视力情况是基于视网膜的视锥和视杆密度,如图5所示。光轴略微偏离视距5度左右(靠近视轴),并且与视网膜中心凹的位置重合。盲点(视神经所在位置)偏离中心凹中心约18度。

微软HoloLens光学架构师详述AR/VR/MR数字光学元件和技术


图5:左边是视锥和视杆细胞密度,右边是光轴和视距

需要注意的是,中心凹在早年会根据特定的人类视觉行为而缓慢生长,与我们出生时视觉系统特征不同。所以,由于与人类数千年来的进化完全不同的新颖视觉行为,中心凹的位置可能会漂移到视网膜的新位置,例如幼儿近距离握持小型数字显示器。另一个重大的变化是由相同原因引起的儿童早期近视。

横向色差(Lateral Chromatic Aberrations或LCA)

色差因为菲涅尔圆环,光栅或传统反射性透镜的颜色分离所致,横向色差中的“横向”包含“横向”和“纵向”,其中不同的颜色聚焦在不同的深度,具体取决于透镜的Abbe V值。反射光学器件不产生LCA,所以在AR显示领域得到了广泛的应用。

LCA一般是通过软件进行校正,方法是在场序模式下预先补偿每个彩色帧,或者在RGB显示面板中预先补偿整个彩色图像(等效于三个失真图补偿,每种颜色一个)。但是,这可能会导致显示伪影,如颜色混叠,并且需要高角度分辨率才能达到合理效果。光学色散补偿是一种更优的方法,但需要更复杂的光学器件(混合折射衍射)或对称耦合结构(可见于使用光栅或全息耦合器的波导组合器),或者用反射光学器件代替折射光学器件。

一种重要的侦测器是人眼,所以分析人眼的自然LCA扩散同样非常有趣,而结果是出奇的强。图6是测量的人眼LCA(左边为过去50年的测量总和),其在可见光谱产生了2个屈光度;图6同时说明了彩色图像在视网膜,轴上和轴外的显示方式(中间)。右边是视觉皮层处理后的用户“所见”。

微软HoloLens光学架构师详述AR/VR/MR数字光学元件和技术


图6:人眼的自然LCA

人眼的自然LCA同时是数字渲染3D深度线索(称为“Chromablur/色彩模糊度”)的基础。取决于它们出现在白色对象的哪一侧,蓝色和红色模糊(光学或渲染模糊)可以分辨远焦与近焦,从而为动眼肌提供视觉调节变化的信息,从而重新聚焦图像(即图像的绿色部分聚焦在视网膜上)。

不同人之间的LCA略有不同:所以,用外部光学器件来增加或减少光谱扩散来稍微改变自然LCA不会显著影响视力。但如果视场一部分具有特定的LCA(AR中的透视),而另一部分具有不同的LCA(AR中的数字图像),则这可能会导致视觉不适。

中心凹及外围区域的视敏度

测量的人眼多色MTF(Modulation Transfer Function;调制传递函数)请参见图7。所述MTF主要表示轴上视场的明视觉,其接近以中心凹为中心的视距区域(偏移约3到5度)。

微软HoloLens光学架构师详述AR/VR/MR数字光学元件和技术


图7:不同瞳孔直径的人眼多色调制传递函数

我们将眼睛分辨细小特征的能力称为“视敏度”。青壮年可以分辨出黑白线条交替的图案,小至一弧分(每度30个周期或60 PPD)。这同时是20/20视觉的定义。少数人能够区分较小的图案(具有较高的MTF),但我们大多数人会将其视为灰色阴影(MTF较低,低于0.1)。

对于所有瞳孔大小,MTF为20/20的明视觉高于30%,只有超过5mm的暗视觉才会令MTF降到较低水平。

请注意,MTF50(低频时为MTF的50%)或MTF50P(峰值时为MTF的50%)是出色的指标,但主要用于相机。人眼,尤其是不断移动的人眼,其依然可以在30%MTF的水平下很好地分辨出特征。与相机不同的是,眼睛的MTF会在低频下降(主要是这样的低频缺乏运动)。

由于人眼的高像差影响,瞳孔尺寸越大,则产生的MTF越低,这与受衍射限制的高端相机不同(MTF会随着光圈增加)。有趣的是,当瞳孔增加明视觉时,较高的空间频率实际上是可以区分,从而能够在较暗的视场中实现超过20/20的视力。

这表示,人类视觉系统不能像相机那样简单局限于纯光学特性,而是将其作为计算成像系统(其中CPU当成视觉皮层)。上一节中讨论的LCA就是证明。

人类视场的细节

图9说明了人类双目视觉系统的不同角度区域的水平延伸。尽管整体视场水平跨度超过220度,但在大多数情况下,双目范围仅跨120度(取决于鼻子的几何形状)。然而,立体视觉(提供3D深度线索的左右单目视觉融合)受到限制(+/-40度)。

微软HoloLens光学架构师详述AR/VR/MR数字光学元件和技术


图8:人类视场(水平和垂直)


微软HoloLens光学架构师详述AR/VR/MR数字光学元件和技术


图9:具有固定注视点区域的人类双目视场,包括不受约束的眼球运动,可以支持持续注视和视觉调节

垂直视场的大小与水平视场相似,并且向下偏离标准视距大约15度。

人眼视场是一个动态概念,最好的描述是受约束和不受约束的眼睛运动范围时(不受约束:不会产生眼睛疲劳并允许稳定注视和随后的视觉调节反射)。尽管机械式眼球运动范围可能很大(+/- 40度),但可以在不引起头部旋转反射的情况下进行不受约束的眼部运动要小得多,并且只覆盖大约+/- 20度视场。这反过来定义了静态注视点区域,视场为40到45度。图9是双目视场,即左右视场的重叠。

微软HoloLens光学架构师详述AR/VR/MR数字光学元件和技术


图10:对于当前最先进技术的智能眼镜,AR,MR和VR头显,其视场一般覆盖于双目视觉和固定注视点显示区域。

双目视场是一个相当大的区域,水平对称,垂直非对称,在上+55度和下-30度的范围内,跨度为+/- 60度,而中下区域同样达到-60度,但位于35度全角的较小水平跨度。白色圆圈是固定注视点区域,这同时定义了当今大多数高端AR/MR设备的对角视场状态(提供了100%的立体视场重叠)。 另外,对于给定的注视角度,颜色识别跨越+/- 60度视场,形状识别跨越+/- 30度视场,文本识别跨越+/- 10度视场。

5.2 显示硬件适配人眼视觉系统

图11是各种头显的视场。标准VR头显(Oculus CV1,HTC Vive,PSVR,WMR)的视场都围绕着110度对角线,其他(小派和StarVR)则能扩展至200度视场。大手机面板显示器和自由空间组合器(Meta2,DreamGlass,Mira AR和Leap Motion)可以实现高达90度的大视场,而高端AR/MR系统则采用微型显示屏,如微软HoloLens V1和Magic Leap One。智能眼镜的视场通常是10到15度(蔡司“Tooz”智能眼镜,谷歌眼镜,North Focals),25度和最高50度(Vuzix Blade,Digilens,Optinvent ORA,Lumus DK50,ODG R9)。

微软HoloLens光学架构师详述AR/VR/MR数字光学元件和技术


图11:VR,智能眼镜和AR头显的显示视场和透视视场。

对于VR系统,由于没有透视,所以显示的视场可以相当大,从110到150到最大的200+视场(小派或StarVR)。对于智能眼镜,受侧向显示臂的阻碍,其偏心显示视场为15度。对于Magic Leap One,由于眼镜圆形机械外壳而造成的隧穿效应将透视视场大大降低,减少到大约70度的圆锥形,而显示器的视场为50度。对于Hololens V2,横向透视(或透视)视场等于220度的自然人类视场,而对角线视场则为52度,覆盖大部分中心凹区域,上方视场被用于固定传感器条,激光/MEMS显示引擎和系统板的机械外壳所覆盖,下上视场没有限制。 HoloLens V2的另一个特殊之处是,你能够向上翻转显示面罩并显示完全无遮挡的视图。为优化头显光学架构以实现大视场,我们必须考虑图9所描述的各视场区域,从而避免国过度设计系统。通过在光学设计过程中实现“以人为中心的优化”,我们可以在分辨率,MTF,像素密度,色深和对比度方面实现与人类视觉系统非常匹配的系统。

5.3 感知分辨率和视场

AR/VR系统的要旨是人眼视觉系统的感知视场和感知分辨率:其中分辨率是感知规格(主观)而非科学测量的规格(客观)。

例如,在不增加GPU渲染负担的情况下提升感知分辨率的一种方法是,简单地复制物理面板的像素。最新版本的三星WMR(2018版)就采用了这种方法,其中显示管道以616ppi的速度渲染和驱动显示器,而最终的物理显示达到1233ppi。事实证明,这样做可以减少纱窗效应并提高用户的感知分辨率。

感知的视场跨度同样可能是主观感受,尤其是对于AR系统而言。显示器的质量(高MTF,高分辨率,没有纱窗效应和Mura效果,减少的锯齿和运动模糊)有助于令人认为感知视场大于类似的显示架构。用户对视场的感知是自然透视视场与虚拟图像质量的结合。

6. 总结

这篇本文是对EDO19会议“数字光学技术”的介绍(这个大会专门针对AR/VR和MR系统的数字光学,包括显示,成像和传感器)。我们介绍了AR/VR/MR光学领域,并回顾了AR/VR/MR光学设计的最重要标准:将光学性能与人类视觉系统相匹配。我们可以通过本次大会讲解的所有数字光学元件来做到这一点:自由空间光学元件,波导光学元件(波导组合器),衍射,全息和超表面光学元件,可调,可切换和可重新配置的光学元件,以及用于显示和成像的新颖计算技术。

原文链接:https://yivian.com/news/68116.html

上一篇新闻

星球日报 | 数据显示近一周有5亿美元注入DeFi协议;区块链服务网络BSN将与Chainlink集成

下一篇新闻

为李安新片 京城4影院升级高帧率

评论

订阅每日新闻

订阅每日新闻以免错过最新最热门的新加坡新闻。