又谈XR

熟系本号的读者都知道,本号长期以来一直关注的两个技术方向,一个是人工智能,另一个是VR/AR/MR(因为没有本质区别,以下简称XR)。与人工智能的起起落落同样, XR 这个方向也是很早就被人看好,但是一直在波浪式进步。 最近一波XR的高峰是Facebook搞的元宇宙概念。 Facebook还因此改名成了Meta,然而元宇宙的美好愿景迟迟得不到落地,几乎又成了一场技术闹剧。这场闹剧以苹果推出vision Pro收尾, 又一个刚出来的时候惊艳到了公众,最终却没有激起什么浪花的准”失败“产品。

虽然产品没有成功,但是方向是没有错的。AI和XR其实代表两种最重要的未来范式,一个是未来的计算,一个是未来的交互。 回顾历史,计算和交互总是互相影响,互相促进又互相制约。有的时候计算能力跑在前面,强大的计算能力催生更丰富的交互方式,比如从命令行到图形界面。有的时候交互理念跑在前面,比如与XR紧密相关的自然交互界面NUI,催生对强大计算能力的需求。

XR 迄今为止不太成功的主要原因还是被计算能力给制约了。 苹果的Vision Pro就是个典型的例子,其实从功能设计上,已经不错了,但是因为体积重量的原因,完全没办法长期佩戴,也就没办法在日常生活, 办公场景下应用。再加上苹果的定价,一个昂贵又用途有限的产品,最终只会沦为小众Geek的玩物。

Vsison Pro的失败严重影响了大家对此类MR产品的期望,以苹果的财力和技术能力都搞不成,其他厂家还能有什么指望? 于是XR关注点又回到了轻量级的AR眼镜,这类产品虽然显示效果不佳,产品功能也被严重限制,但是因为体积重量可以接受,能日常佩戴,单从使用价值的角度看,可能比类似Vision Pro的全功能产品还要高一些,再加上价格相对容易接受,也许能先在一定范围内落地。

笔者也使用过一阵AR当红炸子鸡Rokid去年推出的AR眼镜,Rokid glasses。 这个产品的外观和重量已经接近普通眼镜了,当然因此显示效果就相当有限。眼镜的技术方案是衍射光波导,通过装在镜框中央的的micro-led引擎,一分二投射到镜片上,只支持单色,虽然支持双目,但是分辨率只有640*480. 视场角也只有30度(对角线,实际更小)。这种显示质量只能显示少量文本或者提示信息。眼镜通过蓝牙连接手机,AI相关的功能可以依靠手机的计算能力来实现。配合眼镜上的摄像头,Rockid支持一些智能辅助场景:比如看见花花草草问这是什么品种;在博物馆可以介绍展品;会议时可以看到语音转写或者给发言者提词;外出时可以显示导航信息;读书学习的时候可以高亮重点,解析问题;外语环境下可以实时翻译 等等。按照我自己的使用体验,用的上时还是有价值的,用久了再摘掉,会有点不习惯。但其实也没有太有用,摘掉了也想不起来再戴上。

低分辨率单色的显示,终究是限制多多。比此类单色低分辨率产品显示效果好一档的,是使用更大的micro-OLED投射彩色图像,比如Rokid自家的 Rokid Air,1920*1080分辨率,官方宣传41度视场角(对角线,实际只有不到35度),使用类似墨镜的造型,用镜片上面的一块屏幕,把图像反射到眼睛里,这样显示效果提升了,但是眼镜也厚重了一些。Air的宣传重量是83克,比49克的Rokid glasses 重了几乎一倍。 这类眼镜主要的使用场景是随身屏幕,连接手机后当做外接显示器,可以用来打游戏。 因为视场角的限制,效果远达不到VR沉浸式体验,差不多就是一块大一点的pad。

以上两种AR眼镜都没有所谓空间计算能力,就是能够感知环境,跟踪头部自由运动,包括平移旋转的能力。只有具备了空间计算能力,才能根据视角位置的变化,动态调整显示内容,实现显示扩展直至体验虚拟世界的效果。当前支持空间计算的XR产品,从字节的pico,meta的 quest系列,到苹果的vision pro ,都至少要用4颗以上的摄像头来辅助定位,后台也需要相应的处理能力。

那能不能即轻量级,又能实现很好的显示效果? 很多人可能以为是显示部分没办法做的轻薄,才让全功能的VR产品做的又厚又重。其实现有的技术已经能把显示部分做的相当轻薄了,vision pro 之所以这么厚重,主要还是计算部分的体积重量,也就是处理器和相关的散热装置占地方。

如同AI应用的卡脖子产品是GPU 芯片一样, XR 真正卡脖子的是背后的计算芯片。GPU赛道上Nvidia一家独大, XR赛道上高通一家独大。 除了苹果有能力自研以外,各种XR眼镜基本都是用的高通方案。要深入分析高通怎么统治这个市场,可以单开一篇。简单说, 因为XR芯片市场本身的体量有限,而且满足产品需求并不单单是一块芯片,还需要一个软硬件一体的完整生态,所以高通在这个领域,挖出了护城河。

拆解XR产品的功能,泛泛来说,对处理器的需求和手机非常类似,所以手机芯片厂家搞XR 芯片就有先天优势。而另一方面真XR的处理器因为需要支持空间计算,必须支持四路以上摄像头的输入和处理。这是为什么真XR处理器和同时代的手机处理器规格几乎相同,却没办法把手机处理器直接拿来用的主要原因。

高通抢先统治了这个市场,后来者也不是完全没有机会,苹果就可以另起一行。苹果给Vision Pro搞了两颗芯片的方案, 一颗来源于苹果笔记本/手机的处理器,另外一颗单独负责空间计算。 在轻量级AR领域, Rokid glasses 之所以在严控重量下还能保持相当的续航能力, 也是因为在高通的处理器之外,引入了一颗恩智浦的MCU当协处理器。 这颗处理器能力不强,但是功耗很低,可以在不唤醒主处理器的情况下,处理一些例如语音唤醒词识别之类的待机任务。

总而言之,XR 产品为了取得性能, 功能, 体积,重量,功耗等多种因素的平衡,背后需要精心设计选择计算架构和芯片方案。 国内的产业链,到目前为止,在其他方面都已经占据了统治地位,唯独芯片上还是短板。

转眼已经是2026年了, 大约十年前,就有人说XR是手机之后的下一代计算平台,十年过后,XR仍然是“下一代”平台。要把下一代带到现实,行业里现在挣钱的老登们态度不够积极,还需要技术工业党的努力。 国内产业链在这10年里可以说能力突飞猛进,能否真正解决卡脖子芯片问题, 建立好生态,吃下下一代计算设备这一块大蛋糕,可能已经不是一个问号。

汽车和手机是当前消费产品里最大的两个品类。 随着新能源汽车的突破,在汽车领域里,国内产业链已经慢慢显露出王者之象。 计算设备领域能否复现这种成功,目标是清晰的,道路是曲折的,还需大家一起努力。

有闲阶级论 读后感

公众号上一篇到现在,眨眼4年过去了。4年时间,说长不长,说短不短,是人生的一小段,对AI来说,可是翻天覆地的变化。以2022年底GPT-3发布作为标志,AI的能力开始飞跃。到现在,AI对文字的处理能力已经超过了绝大多数人。 那读书写文章还有什么意义?其实,对AI来说,本来就没有意义,对人来说,那还是相当的适合。。。有闲阶级。

凡勃仑的有闲阶级论写在一百年前。他新开了一个观察社会的角度,本质上也在讲意义。自人类文明进步,出现了私有制,社会开始分工和分化,就出现了一类每天的主要时间不是在生产劳动,而是在休闲消费的所谓有闲人。文明早期这是一小撮统治者和贵族,随着资本主义发展,生产力飞跃性的进步,有闲阶级数量大大增多,他们占据社会统治地位,引领社会生活方式,还主导着社会的价值观,凡勃仑深刻的剖析了这个阶层,包括其形成过程,内在动机,表现方式和对社会的影响,

凡勃仑1857年出生在美国威斯康星州一个挪威移民的农家,是家里第六个娃,小时候家里只讲挪威语,直到上学才开始慢慢学用英语。在当时的社会大环境下,移民本来就被排挤,加上语言障碍,可以说从小就是个边缘人。所以他早年的表现也并不突出。好在凡勃仑的父亲虽然务农,但是非常重视教育,给家里的孩子都提供了读书条件,而且读的是要花钱的学校。这在当时的移民家庭非常少见。凡勃仑和他哥哥都读到了大学,家里为了方便孩子们上学,还在学校附近盖了房子。凡勃仑从大学开始展露才华,三年就毕业了,毕业之后又进了约翰霍普金斯读研究生,最后到耶鲁拿了哲学博士,是耶鲁最早一批哲学博士。然而,本该走上人生巅峰的他,毕业后却找不到工作,失业了整整七年。主要原因是当时的学校都是教会背景,而凡勃仑却不怎么信教,他的博士论文还挑战了当时的宗教伦理。再加上他平时不修篇幅,穿着邋遢,望之不似学者。 这种异类,哪个大学都不收。于是凡勃仑只好回家,靠父母和岳父接济生活。

回家以后,凡勃仑的主要时间就是躲在阁楼里狂读书, 过“没钱有闲”的生活,眼看着7年过去了,也不能一直就这么耗着。他觉得要换赛道,不搞(批判)宗教哲学了。转行去学当时算是新兴的经济学。于是他决定去康奈尔大学读经济学研究生。这是他人生的转折点,在康奈尔他遇到了自己的伯乐,当时的古典经济学大佬J.L.劳夫林。据说去面试时候,凡勃仑戴着浣熊皮帽子,穿着灯芯绒裤,一幅老农摸样,也不提前准备简历,见到大佬也不毕恭毕敬,一副牛哄哄的样子。然而就算这样,也没掩盖住他的个人才华,被大佬一眼相中,收为弟子,从此咸鱼翻身。

在当时,经济学作为新兴学科,受教会的影响比较小,凡勃仑毕业后,跟着老师大佬去了当时刚刚建立的芝加哥大学,总算是有了工作。芝加哥大学是后来的经济学圣地,在当时只是初建,也许对怪才得容忍度比较高,当然也没有那么高。凡勃仑依然是做了七年教学助理,直到写出了这本《有闲阶级论》,一炮而红,才拿到了助理教授的正式教职。六年以后,凡勃仑因为风评不佳,转去了当时新开的斯坦福大学,拿到了副教授。再后来,辗转几所大学后,凡勃仑晚年去了新社会研究学院,在1929年72岁病逝于自己的隐居地,当年斯的山间小屋,现在的硅谷核心地段。

凡勃仑自从转行经济学,运气变得极好,先是有大佬提携,后来去的也都是现在知名的大学,加上写书一举成名,本该大有发展。然而他却一直特立独行,拒绝与自己批判的主流社会同流合污,拒绝金钱消费。他日常不修篇幅,只穿旧衣服,扣子掉了就拿别针别上,头发乱蓬蓬,像个流浪汉,自己的住处没有一件真正的家具,都是拿纸箱当柜子,货箱拼起来当床,屋里除了书,没有任和值钱的东西。他不买车,不买房,不社交,不旅行,一辈子没什么朋友。总之,凡勃仑的一生:虽然天赋极高、运气也算不错,但他始终践行自己的理念,死前凡勃仑立遗嘱:不发讣告,不搞仪式,抛洒骨灰,不搞任何形式的墓地和纪念物。

回到《有闲阶级论》这本书,一本批判社会的书,为什么算经济学呢? 其实这本书的副标题叫关于制度的经济研究。回看经济学的脉络:古典经济学从亚当·斯密开始讲“看不见的手”、勤劳致富,说人是理性的;到了19世纪末新古典主义,在理性人的基础上,希望把一切都数学化,搞边际效用,供需平衡,用各种公式图表来理解市场。凡勃仑洞察到了人性复杂,从根本上不认可理性人假设。他认为人是社会驱动的,社会本身就不是理性计算的结果。于是他把有闲阶级当做社会制度切入口,研究其起源,运作方式,以及如何影响社会的生产,消费和分配。凡勃仑因此被认为是制度经济学,这个研究社会运作方式对经济影响的方向的开创者。

原书的主要内容,包含“有闲阶级”的方方面面。从起源讲起:人类社会最初人人劳动,没有阶级,后来出现私有制和社会等级,上等人负责战争、政治、宗教这些非生产性“有闲”活动,享有声望和荣耀,而下等人主干脏活累活,还被人歧视。正是“ 陶尽门前土,屋上无片瓦。十指不沾泥,鳞鳞居大厦” 。于是凡勃仑指出:上层阶级的尊贵,不在于贡献,而在于不用干活;劳动被视为低贱,有闲才是荣誉。

有闲不是享受,是公开证明自己无需劳作也能生存,是一种身份展示。有闲阶级通过“炫耀性闲暇”和“炫耀性消费”来证明自己“高人一等”。比如,花大钱买没用的奢侈品、举办无聊的社交宴会、打高尔夫、收藏艺术品——这些消费都不是古典经济学意义下的理性消费,是为了证明自己的身份地位。通过“金钱竞赛”,让别人羡慕,满足自己的虚荣。基本逻辑是:贵 = 美,廉价 = 粗俗。

消费社会充满各种金钱符号,服装是炫耀性消费的典型,贵妇的裙子越不实用越贵,因为这样就越能证明不用干活;礼仪和品味也同样,所谓“高雅”是因为你要花大量时间学这些无用知识,所以能代表身份;很多类似社会行为的本质都是故意浪费,因为浪费本身就是阶级区分的手段。

凡勃仑认为,在对有闲阶级来说,追求财富不是为了生存,而是为了攀比胜出。人的欲望永远得不到满足,因为标准总是由更上层的人定义,一山更比一山高。有闲阶级也从此被自己的欲望牢笼困住。

凡勃仑还说,有闲阶级依附于现有社会制度,依赖于现行社会秩序的稳定,因此他们天生保守、反对任何社会变革,是旧势力的代表,也是阻碍社会进步的最大障碍。

书中依次评价了:体育竞赛是古老掠夺气质的延续;妻子、仆人、家人是有闲阶级通过代理展示有闲;高等教育、古典学问本质也是炫耀性有闲的产物。它们最初价值不在实用,而在于无用,因为脱离生产,才能证明身份高贵。

“有闲阶级论”一出版就在当时引发轰动,被认为是戳破了美国上流社会的遮羞布。知识分子人手一本,报刊争相讨论。后来虽然热度退潮,但每一轮经济大周期,当消费主义盛行时,都会被反复提起,作为对抗金钱崇拜,炫富文化的思想武器。

今天再看,凡勃仑的大部分观点,或者说他的观察角度,也依然犀利。当代社会的很多竞争,本质上仍然是地位与炫耀性符号之争,而不是技术和效率的竞争。譬如多养几只openclaw小龙虾,虽然并没有什么用处,也可以是炫耀的本钱。

凡勃仑生前写的最后一本著作叫“工程师和价格体系”。他认为资产阶级为了维系价格体系,通过垄断获取超额利润,根本动机就会限制生产,破坏生产效率的提升,搭建阻碍技术进步的牢笼。而要打破这种牢笼枷锁,只有靠工程师,技术人员和科学家们组成的生产体系。他提出了所谓“技术人员苏维埃”的概念,期望技术人员联合起来,建立技术委员会接管经济,组织生产,才能释放生产力,推动文明进步,提升人类的福祉。在此意义上,凡勃仑可以说是最早的技术工业党。

一百年过去了,技术工业党的理想还远没有实现。当今世界,正是代表技术人员的东大和代表金融金钱的鹰西对决。未来是谁的,还需拭目以待。