又谈XR

熟系本号的读者都知道,本号长期以来一直关注的两个技术方向,一个是人工智能,另一个是VR/AR/MR(因为没有本质区别,以下简称XR)。与人工智能的起起落落同样, XR 这个方向也是很早就被人看好,但是一直在波浪式进步。 最近一波XR的高峰是Facebook搞的元宇宙概念。 Facebook还因此改名成了Meta,然而元宇宙的美好愿景迟迟得不到落地,几乎又成了一场技术闹剧。这场闹剧以苹果推出vision Pro收尾, 又一个刚出来的时候惊艳到了公众,最终却没有激起什么浪花的准”失败“产品。

虽然产品没有成功,但是方向是没有错的。AI和XR其实代表两种最重要的未来范式,一个是未来的计算,一个是未来的交互。 回顾历史,计算和交互总是互相影响,互相促进又互相制约。有的时候计算能力跑在前面,强大的计算能力催生更丰富的交互方式,比如从命令行到图形界面。有的时候交互理念跑在前面,比如与XR紧密相关的自然交互界面NUI,催生对强大计算能力的需求。

XR 迄今为止不太成功的主要原因还是被计算能力给制约了。 苹果的Vision Pro就是个典型的例子,其实从功能设计上,已经不错了,但是因为体积重量的原因,完全没办法长期佩戴,也就没办法在日常生活, 办公场景下应用。再加上苹果的定价,一个昂贵又用途有限的产品,最终只会沦为小众Geek的玩物。

Vsison Pro的失败严重影响了大家对此类MR产品的期望,以苹果的财力和技术能力都搞不成,其他厂家还能有什么指望? 于是XR关注点又回到了轻量级的AR眼镜,这类产品虽然显示效果不佳,产品功能也被严重限制,但是因为体积重量可以接受,能日常佩戴,单从使用价值的角度看,可能比类似Vision Pro的全功能产品还要高一些,再加上价格相对容易接受,也许能先在一定范围内落地。

笔者也使用过一阵AR当红炸子鸡Rokid去年推出的AR眼镜,Rokid glasses。 这个产品的外观和重量已经接近普通眼镜了,当然因此显示效果就相当有限。眼镜的技术方案是衍射光波导,通过装在镜框中央的的micro-led引擎,一分二投射到镜片上,只支持单色,虽然支持双目,但是分辨率只有640*480. 视场角也只有30度(对角线,实际更小)。这种显示质量只能显示少量文本或者提示信息。眼镜通过蓝牙连接手机,AI相关的功能可以依靠手机的计算能力来实现。配合眼镜上的摄像头,Rockid支持一些智能辅助场景:比如看见花花草草问这是什么品种;在博物馆可以介绍展品;会议时可以看到语音转写或者给发言者提词;外出时可以显示导航信息;读书学习的时候可以高亮重点,解析问题;外语环境下可以实时翻译 等等。按照我自己的使用体验,用的上时还是有价值的,用久了再摘掉,会有点不习惯。但其实也没有太有用,摘掉了也想不起来再戴上。

低分辨率单色的显示,终究是限制多多。比此类单色低分辨率产品显示效果好一档的,是使用更大的micro-OLED投射彩色图像,比如Rokid自家的 Rokid Air,1920*1080分辨率,官方宣传41度视场角(对角线,实际只有不到35度),使用类似墨镜的造型,用镜片上面的一块屏幕,把图像反射到眼睛里,这样显示效果提升了,但是眼镜也厚重了一些。Air的宣传重量是83克,比49克的Rokid glasses 重了几乎一倍。 这类眼镜主要的使用场景是随身屏幕,连接手机后当做外接显示器,可以用来打游戏。 因为视场角的限制,效果远达不到VR沉浸式体验,差不多就是一块大一点的pad。

以上两种AR眼镜都没有所谓空间计算能力,就是能够感知环境,跟踪头部自由运动,包括平移旋转的能力。只有具备了空间计算能力,才能根据视角位置的变化,动态调整显示内容,实现显示扩展直至体验虚拟世界的效果。当前支持空间计算的XR产品,从字节的pico,meta的 quest系列,到苹果的vision pro ,都至少要用4颗以上的摄像头来辅助定位,后台也需要相应的处理能力。

那能不能即轻量级,又能实现很好的显示效果? 很多人可能以为是显示部分没办法做的轻薄,才让全功能的VR产品做的又厚又重。其实现有的技术已经能把显示部分做的相当轻薄了,vision pro 之所以这么厚重,主要还是计算部分的体积重量,也就是处理器和相关的散热装置占地方。

如同AI应用的卡脖子产品是GPU 芯片一样, XR 真正卡脖子的是背后的计算芯片。GPU赛道上Nvidia一家独大, XR赛道上高通一家独大。 除了苹果有能力自研以外,各种XR眼镜基本都是用的高通方案。要深入分析高通怎么统治这个市场,可以单开一篇。简单说, 因为XR芯片市场本身的体量有限,而且满足产品需求并不单单是一块芯片,还需要一个软硬件一体的完整生态,所以高通在这个领域,挖出了护城河。

拆解XR产品的功能,泛泛来说,对处理器的需求和手机非常类似,所以手机芯片厂家搞XR 芯片就有先天优势。而另一方面真XR的处理器因为需要支持空间计算,必须支持四路以上摄像头的输入和处理。这是为什么真XR处理器和同时代的手机处理器规格几乎相同,却没办法把手机处理器直接拿来用的主要原因。

高通抢先统治了这个市场,后来者也不是完全没有机会,苹果就可以另起一行。苹果给Vision Pro搞了两颗芯片的方案, 一颗来源于苹果笔记本/手机的处理器,另外一颗单独负责空间计算。 在轻量级AR领域, Rokid glasses 之所以在严控重量下还能保持相当的续航能力, 也是因为在高通的处理器之外,引入了一颗恩智浦的MCU当协处理器。 这颗处理器能力不强,但是功耗很低,可以在不唤醒主处理器的情况下,处理一些例如语音唤醒词识别之类的待机任务。

总而言之,XR 产品为了取得性能, 功能, 体积,重量,功耗等多种因素的平衡,背后需要精心设计选择计算架构和芯片方案。 国内的产业链,到目前为止,在其他方面都已经占据了统治地位,唯独芯片上还是短板。

转眼已经是2026年了, 大约十年前,就有人说XR是手机之后的下一代计算平台,十年过后,XR仍然是“下一代”平台。要把下一代带到现实,行业里现在挣钱的老登们态度不够积极,还需要技术工业党的努力。 国内产业链在这10年里可以说能力突飞猛进,能否真正解决卡脖子芯片问题, 建立好生态,吃下下一代计算设备这一块大蛋糕,可能已经不是一个问号。

汽车和手机是当前消费产品里最大的两个品类。 随着新能源汽车的突破,在汽车领域里,国内产业链已经慢慢显露出王者之象。 计算设备领域能否复现这种成功,目标是清晰的,道路是曲折的,还需大家一起努力。

发表回复