三生三世十年蛙声-乱弹自动驾驶

上周有一桩大案发生。我说的大案自然不是特警半夜出击,开着直升机奔波千里,擒拿巨贼于热被窝中,对这种类型感兴趣,请看今日说法。我说的是收购大案,intel花了150多亿美元收购mobileye。 mobileye大约是500人规模的一个中型公司, 150多亿美元相当于1千多亿人民币, 人均2个小目标。很多人质疑真的值那么多吗? 是不是买贵了。 intel为什么舍得下这么大本? 要知道intel是虽然最赚钱的it公司之一, 一年净利润大约110亿(市值最高的it公司,google大约200亿, facebook不到80亿,但是增长很快),买mobileye也谈不上轻松, 这个价格相当于intel一年半挣的钱。

这场收购案一出来,就嘘声四起。有人说mobileye不值那么多, 技术没什么了不起, 大中华做adas,自动驾驶的公司, 不以千记,也有上百, 分分钟追上mobileye云云(潜台词, 买我吧,买我吧,性价比无敌)。 到底mobileye值不值那么多? 本文回答不了这个问题, 只是作者一点浅薄的愚见。 胡乱说说对自动驾驶的现状和未来的理解。

首先要澄清基本概念, 大家说的是自动驾驶, 谈的未来也是自动驾驶, 花这么大价钱买的也是自动驾驶, 实际上市面上还没有自动驾驶。 只有辅助驾驶(ADAS)。 区分自动驾驶和辅助驾驶, 实际上有非常清楚的分类, 所谓自动驾驶的6个基本层级, 文抄公搬运如下:

L0 :驾驶员完全掌控车辆,无自动化。可能仅安装了一些预警技术,如前碰撞提醒(FCW)、侧偏提醒(LKW)等等

L1 :对方向盘和减速的单一任务提供一些辅助支持;主要包括自适应巡航控制(ACC)、自动紧急制动(AEB)、道路偏移回正(LKA)等。

L2 :自动系统能够完成某些场景下方向和减速的组合驾驶任务,可以部分自动化。L2的典型场景包括,低速堵车跟车、高速路上的快速行车和驾驶员在车内的自动泊车等。

L3 :又称有条件的自动驾驶,自动系统能通过监控环境接管所有驾驶任务,但驾驶员必须准备好重新取得驾驶控制权。驾驶者仍无法进行睡觉或者深度的休息。

L4 :自动系统在某些限定道路和环境下,能够完成驾驶任务;人可以不管了, 但是需要环境配合, 比如景区, 停车场之类的环境下完全可以无人操作。L4可以做一些道路和信号的配合。

L5 :自动系统在所有条件下都能完成的所有驾驶任务。

这样就可以分割清楚了, 自动驾驶是从L3开始的, 之前的都是辅助驾驶。 而对辅助驾驶, 从L1开始, 就需要介入车辆的控制, 如果只是嘀嘀嘀叫一叫, 给个提醒, 不管怎么嚷嚷, 都是L0, 无自动化。

而现在大家见到的最多的ADAS辅助驾驶系统, 所谓后装市场上那种只要是个行车记录仪宣称都带的, 都属于L0。 既然是L0, 自然要求就低, 也可以不负责任, 厂家就随意,做行车记录仪芯片方案的厂商请几个人稍带着就做了。 效果可想而知。通常情况下, 买了行车记录仪回家的人, 碰上这种所谓的辅助驾驶的行车记录仪, 第一件事情就是把它关掉。嘀嘀嘀的实在太烦人。 所谓劣币驱逐良币, 在行车记录仪上玩辅助驾驶, 为谁辛苦为谁甜?投资人都懂! 也不能说提醒没有价值, 只是在通用市场上价值实在有限。 某些专业市场,比如大货司机喜欢疲劳驾驶的, 能嘀嘀一下还是管用的,有专门做这个的公司, 比如径为视觉(替孙师弟安利一下,  看到要请我吃饭)。

如果要说对人真正有价值, 那就需要介入驾驶动作, 从L1开始,必须和车的控制联动, 这个不管操作多简单和基本,通常只能做前装了。L1和L2 的分别是前者是单一任务, 也就更简单。 Mobileye在这个市场上占统治地位,  Mobileye带自动紧急制动(AEB)和车道偏离预警(LDW)功能的前装系统供货价为200美元左右,占领了大约90%(未核实,请指正)的全球此类市场。 做到这两个功能主要就是检测前车和车道线。听上去不难,但是如果要做到接管控制的地步, mobileye给的标杆是:在各种条件下(全天候需求, 如果天气条件实在不合适,自己也得能判断出来, 会把自己关掉)起码要四个9的准确率,99.99%。

L2 就不仅仅是单一任务了, 可以是刹车和转向的组合, 比如volvo全系几乎都配备的跟车系统, 在车速很低时, 比如高速上堵车, 就可以打开, 车辆会自动跟着前车开, 碰到弯道也能沿着车道控制方向。 Tesla的高速自动驾驶, 比这个要强一些, 大概介于L2和L3之间,速度高了也能自动跟车。 这个市场, 目前也属于mobileye统治。 volvo用的,和tesla早先用到的都是mobileye。

从L3往上就属于自动驾驶了。 在这个层级, Tesla是最冒进的, 其实这个层级作为自动驾驶的过渡是很麻烦的。 不能完全指望自动驾驶, 但是又可以部分有效, 人可以适度走神,这个度不好把握。一旦自动驾驶认错了, 人通常是反映不过来的。 Tesla的几起中外车祸,都跟这个有关。 不知道Tesla的内部认定标准, 我个人理解是冒进了。 做新事物必须要小心又小心。 玩过头了, 就会象Magicleap一样变成骗子公司, 而且这个打击甚至会扩大到全行业。

反过来说, mobileye一直在稳扎稳打, mobileye的cto, Amnon Shashua, 在2016年cvpr上有一个公开演讲。讲自己的技术路线, 网上很容易搜到, 百度百家里有全文翻译, 非常建议大家仔细阅读。 可以看到, 要做自动驾驶, 需要, 传感器, 路(地图), 数据(算法)多方面的配合。 mobileye为此一直在做准备, 包括如何做地图表示, 如何收集数据等等。 Tesla一开始用的就是mobileye, 后来两者分手, 应当是节奏不匹配。 一个稳扎稳打的公司和一个拼速度的公司尿不到一壶里。 但是谁能笑到最后, 不太好说。

自动驾驶里L5 那种跟人一样开车的,我个人理解一旦做到就肯定会比人开的更好。 但这个实在是离的很远很远。 所以能够先期做起来的, 应当是L4, 在一些特定环境, 比如物流港, 景区, 或者某些城市区域在道路上做了配合施工的。 这个一定是自动驾驶先期的用武之地。 因为车辆和路都是定制化, 甚至不一定是公共道路, 所以条条框框也小。 也不一定非要找整车厂, 主动权更多。 但是说的容易做起来难, 要做这个也不容易, 更多的是对要对特定行业需求有深入理解。 最后还要算成本收益的经济账。

L5一旦实现, 会对社会全行业有深刻的影响, 因为有了L5实际上汽车就变成了汽车人。前一阵网上有个笑话, 说自己的车,注册了滴滴账号(自动驾驶都联网),半夜出去偷偷拉活。 如果有了L5,这个就不是笑话了。 因此这个涉及到机器和人的关系, 社会伦理, 产权法律等等, 是一个可以单开的大话题。 但是为时尚早, 说这个都是空对空。

最后再谈两句技术相关。 首先是传感器, 要自动驾驶, 需要多传感器融合, 人开车, 需要两只眼和耳朵配合(自动驾驶很少提到用耳朵的, 不是做的人忽略了, 是目前的AI太傻,用不到)。其实有眼睛就够了, 人的眼睛如果类比光学传感器和镜头,那简直好到离谱, 在这么小的体积和功耗下, 做到了大范围变焦, 高分辨率, 宽动态, 自动动态范围调节等等做自动驾驶的摄像头必须要考虑的技术特性。

但是车比人大个, 车的眼睛不一定非要象人一样这么小巧, 可以多, 可以有不同的工作原理。 其中光学传感器还是必须的。 Mobileye的cto说的很明白, 要准确理解场景, 不能光有形状, 还有有纹理, 而获得纹理, 只有靠光学。 人眼通过立体视觉就可以获取形状。 但是自从马大卫(David Marr)快40年前就提出的视觉计算框架开始, 无数学者都为之付出过, 目前还是做不到光依赖两只眼的视差就能可靠提取形状。 因此需要雷达配合, 常用的雷达有两种, 毫米波雷达, 以及现在贵贵的也很大只的激光雷达(将来会便宜且小只)。其实传感器的需求不见得限于此, 声音, 热成像, 只要有用的,将来都可以用。 当然最终光学仍然是基础。

那么有这么多传感器, mobileye为什么长期还是一只眼(单镜头), 并不是人家笨, 是因为要处理传感器的那么多实时数据流, 需要高性能计算, 而计算都是要成本的。 对mobileye的任务(L1,L2),两只眼增加了很多成本, 并不增加很多性能得分。

拜摩尔定律所赐, 这个成本总是越来越低。 mobileye自己有硬件平台, 下一代eyeQ5标称传感器能接入40Gbps数据, 懂的人可以知道这个量级的数据意味这什么。

有了传感器的数据, 更重要的是算法, 说到算法, 当然不能不说深度学习。 很多人说深度学习万能, 可以黑盒子端到端, 这边传感器数据进去, 那边驾驶控制操作就可以出来。这在理论上是可行的, 但也只是在理论上。 对现在的深度学习网络来说, 臣妾做不到啊!深度学习网络是干什么的?mobileye的cto说, 啊!就是用来提取特征的。 至于后面怎么构建场景, 进行控制, 还得单玩, 不管你信不信, 反正我是信了。

技术讨论, 我不是干这行的, 只能浅尝即止。 八成属于胡说。

回到文章一开始mobileye值不值, 我说了一大堆的意思是比较值。 当然我大中华厂商不可气短, 奋起直追, 也就一年左右技术差距(某媒体语),是不是咱们也分分钟就搞个大新闻呢?我们师母已呆!

 

 

 

 

 

To Be or Not To Be? 再谈人工智能芯片

转眼又是三月了。在一年里,三月总是和春天联系在一起。 春天里万物复苏, 发芽成长。正是思考新生事物的时机。 去年年底时, 曾经写过一篇有关人工智能芯片的文章, 那篇的文章的结论是除了语音已经看到些许应用的机会, 面向应用的其他行业可能都还得以GPU/DSP为主, 或者是借助FPGA。主要原因是算法性能不足, 而且在不断变化发展。三个月过后, 这里重新再回顾一下前文的结论, 看有没有需要修正的地方。

开宗名义, 有没有要修正的地方? 没有! 虽然语音已经看到了一些端倪, 但是要踩着dsp走过去, 还是要准确定位市场。 其他行业应用就更不用说了, 老老实实用GPU/DSP吧。 虽然业内在蠢蠢欲动, 可能今年会看到一堆所谓面向深度学习的芯片发布, 那估计也只是发布…而已。

这里有个大背景, 从去年开始,就有各种媒体都在放风, 中国进口的物资里, 芯片已经成了超过能源的最大一头。 对于中国这样的大国, 命根子捏在别人手里怎麼可以。 所以一定要自己造, 不造不舒服斯基。国家自然要在芯片领域大力投入。 中国的国家投入历来有个特点, 就是中央指挥棒一指, 就是方向就是政治正确。 各个地方诸侯都要玩了命的搞小猪赛跑。 中央花钱的人通常是很懂得, 钱也能花在点子上, (为了不被乱棍打死,必须这么写)。然而小猪们就不见得, 通常是人傻钱多速来, 于是这个行业开始泥沙俱下,无数牛鬼蛇神一言不合就要做芯片。 连做LED封装的也都成了先进IC产业。 傻钱不要怎么可以?

还真就是不可以。 虽然未来的事情谁也说不清。 但是动机很重要, 抱着做事的动机出发, 才有做成事的可能。 抱着有傻钱先弄到手的动机出发, 做事的思路就会错位,事情当然也不大可能做成。 最后基本都是一地鸡毛, 或者跑路, 或者吃官司的下场。 这里不是放话吓唬人,一言决生死, 没有那个本事, 只是通过观察历史,感受到这个技术和商业发展的复杂系统在不断重复自己…

那么如果非要做芯片, 又该是怎样一个思路呢? 我们可以看看国产做芯片的成功例子, 比如某思。 某思现在已经是当仁不让的国产芯片龙头企业。 某思虽然是背靠大树好成凉, 但在一些行业市场上也十分的给力。 比如安防行业, 某思借助国内安防市场发展的东风, 借着几个安防企业发展成了世界上最大的安防公司的机会, 也熬出了头,几个拳头产品都做到了有量能赚钱。 给个枣吃再打一棍子, 某思的问题是自己仍然不能引领方向, 做产品靠对标, 早期对标某霸,去年某霸流年不太利。 某达是当红炸子鸡, 又开始对标某达。 哎, 为什么靠对标, 是因为不掌握从预研技术到理解用户和市场两者结合定义产品的正确姿势啊。只有掌握了这一套, 才可以不靠对标,自己领路。 这句话说起来容易, 做起来难。

要想引领潮流。首先新技术要有积淀, 至少要有超前研究一代, 研发一代, 应用一代的结构。 可能有些人不同意, 那里需要搞那么花哨, 超前研究那种事情是要开研究院, 我就不搞, 你看苹果不就没有研究院吗?这个话题涉及到企业如何搞研究, 三言两语说不清楚。 总之搞研究基本属于试错, 而且很多时候试的是技术和应用领域的结合。 因此要超前一代。 研发一代, 应用一代, 车轱辘话不展开。

而对应用领域的结合, 需要对市场整体的结构, 产业链各个企业的态势和互动关系, 最终用户的动机和需求有全面的把握和理解。 如果搞新产品是开车, 需要同时做好两件事:技术是发动机驱动轮子, 理解用户和市场是方向盘。 如果没有发动机驱动轮子, 知道了方向也跑不起来。 如果没有知道怎么打方向盘的, 轮子转的再快也是随机游走, 只在一个车范围里绕圈子,同样跑不远。 要做好这些事情, 必须找对人,多投入,更重要的领导人可以转变思维, 在脑子里建立新事物发展的演化模型, 才可以把握时机。 都非一时之功。

以上说法全是务虚, 属于闲聊吹水, 我们找个实际的例子评估一下。 比如某米最近刚刚推出一款某果的芯片和用这个芯片早出的某c手机。 有关这个芯片的具体细节, 建议去看看知乎问答, 某米水军的考证(https://www.zhihu.com/question/56045568/answer/149060579) 。 虽然是一篇水军文,但里面有大量的比较, 可以看出某米做这款产品的思路。 还是靠…对标。

稍等,也不全是对标, 做soc可以理解为搭积木, 选定工艺制程, 定义性能指标(这一步最关键,用综合考虑技术和市场)然后找到对应IP, 再干一点连接的粗活。剩下就是各种调优。 然后就可以流片。 说起来好像容易, 有什么难的。 难在做系统的经验上。 各种know how 其实不容易。 行内有个笑话, 说某司对另外某公说我可以无偿把IC的核心知识产权给你, 大约1000万行代码, 某公忙说不了,不了, 我赶脚要弄清你这1000万行代码也得花100亿。 要不要100亿姑且不论, 总之系统规模一上去就麻烦。

依照水军的说法, 对某米的这款芯片的思路可以做如下总结:定义性能指标上是保守的(面向中端,最成熟的28nm制程在手机芯片上是落后了), 产品的规格是恰到好处的(可以流畅的打王者荣耀),有些小地方是突出的(比如什么高级货背光控制), 有些大地方是不知道能不能经得起考验的(比如isp)。

某米是有心杀贼, 然而各方面积淀欠缺。 有人说某米做芯片的某果团队是借船出海, 某芯的团队一开始合作后来被连锅端了,搞的某芯一肚子怨气。 这也是缺乏积淀导致的结果。

但从某果这个略显奇怪的名字也可以做一番推测。 某果为啥叫某果, 有人说某米起名字都是植物系, 比如软件界面叫某柚, 硬件芯片叫某果正常。 我觉得不正常, 植物系的太多了, 为毛要选个满是疙瘩又脏又硬的某果呢。 在人的大脑里有个某果体, 某果八成就是这么来的。 用大脑里的植物系称呼来命名植物系芯片当然是最恰当的。而起名字这么用心, 说明这是长跑不是短跑, 来日方长。

小米说完,再回到人工智能芯片。 同样的问题, 要做好这个, 要同时掌握技术和市场用户。 问自己两个问题, 有专有技术吗?理解市场和用户吗? 如果还有犹豫和怀疑那还是再等等。留得青山在,不怕没柴烧。别干人面桃花的事情。

AI相关的算法日新月异, 比如周志华老师最新的deep forest, 如果在大数据集上验证性能也极好, 那围绕BP训练过程做优化硬件的还不哭死。

文章写到这里已经又臭又长了, 好像啥也没说。 其实人生也类似, 大多经历, 都是又臭又长且没有结果的啊。

 

国家的消亡

最近几天北京的天气极好。空气通透, 阳光明媚,一白天从早到晚都是蓝天白云。 适合郊游,踏青,晒太阳。 然而这种令人意外的天气总是短暂。据说从周一起又要进入空气污染的循环。 北京的污染是人为,要看见蓝天可又得全凭老天, 看风向。 风向本身属于天气,这是一个复杂系统,无法预期,但是永远在循环。 正如本文想说的国家一样。

如果同意国家, 或者社会本身是一个复杂系统。 那就必须要同意未来不可预期。 路是要靠人走出来的, 所有所谓历史终结的观点都是跳大神。 那么除了摸着石头过河, 还有什么可说的吗? 有的,其实就是前文曾经谈过的周期律, 或者复杂系统运动发展总体呈现的某种螺旋上升的规律。

去年几个读书公号都曾经推过一本书, 国家为什么会失败,  这是MIT和哈佛的经济学教授写的,作者之一曾经有在非洲等穷困国家长期援助工作的经历, 因此书比一般的学术著作要接地气。

书的前半部分讨论制度的功效和社会经济的影响, 逻辑还算清楚。 书中把制度分为攫取型和包容型。主要取决于统治阶级对社会的互动。 攫取型社会的统治精英们只从社会中吸血而不回馈。为了维系自身的地位,就墨守成规,抵制一切改革和创新,整个社会是封闭守旧的。最终社会在从兴起到崩溃的状态中循环。 而所谓包容型的社会的统治阶级愿意通过分权来平衡社会矛盾, 整个社会对创新是一个鼓励开放的态度。这是全书的精华。 书中给出了真实反应非洲现状的大量事例。 非洲的统治阶级,独裁者们用从西方引入的现代技术和武器牢牢掌控国家,实行愚民政策,压制百姓,造成国家大部分人的贫穷。作为非洲专家,这是作者最擅长的,也是这本书无论如何都值得一读的原因。

然而后半部分各种举例又回到了MZ无敌, 独裁不好的二元思维。作者试图用这一套来解释中国(中文版有删减),把中国近30年的进步理解为攫取型政府迈向了包容。这只能当作是说相声了。为什么是说相声。是因为逻辑到这里就开始不严谨, 比如把前苏联定义为攫取型就无论如何也不能解释苏联曾经取得的成就。

其实造成这些问题的根本原因还是作者的思维模式, 试图用线性稳态的思维方式来解释一个复杂系统演化过程, 因此只能拆东墙补西墙,做一个裱糊匠, 似是而非的表象理论之下是各种矛盾和含糊。

应当怎么理解复杂系统的演化呢? 回顾历史, 人类社会发展的源动力仍然是生存竞争。按照人类简史的观点, 国家是人类得以组织起来的一种共同想象物。 其实在古代社会尤其是中国, 没有那么明确的民族和现代国家的观念。 然而人们仍然会被分割成各种国,也就是不同的统治集团。大家打来打去。那时候的打来打去是残酷的, 一旦军事失败, 就有可能被族灭。

在南北朝时期,曾经有叱咤风云的慕容家族,也就是金庸天龙八部里慕容复的祖先。慕容家出过慕容恪,慕容垂等著名的极其能打的人。在前秦失败以后,建立了前燕,后燕,南燕等一系列国家。 慕容家应当是白种人,史书上说他们肤白貌美,高鼻深目,都是白种人的典型特证。这个家族也以出美男而著称。刘裕在给东晋当军头没有自立为帝时,曾经打过一张对南燕也就是慕容家最后一国的灭国之战。慕容家战败投降当了俘虏。有人说慕容家的人天生最坏爱造反, 刘裕就把投降的几千皇族贵胄都扔进了黄河。史上著名的美男子家族到此绝种。当然天龙八部里的慕容复也长的好看,迷倒了表妹王语嫣。可能是乡间还有遗存。

社会的演化好坏归根结底要看军事斗争的结果。 精英们互相之间的竞争最后还是打打看。孙子兵法开篇就说,兵者,国之大事,死生之地,存亡之道,不可不察也。

人类简史说尼安德特人象慕容家一样高大俊美,可能脑容量更大,但是都是以靠血缘来维系的狩猎部落存在,没有发明各种图腾之类的共同想象物,部落之间不能联合协同,自由主义小确幸只是看上去很美。一旦遇上生存竞争,就被能够联合作战的智人灭的干干净净。

智人能够联合作战,是原始社会全民皆兵的时代。部落之间合纵连横打来打去,是为迁移,抢占最好的底盘。军事失败就被灭族。这种部落军队直到西方罗马时期,罗马和高卢之战还能看到, 高卢一打仗就是整个部落的迁移。男人在前面打仗,家属在后面跟着, 战士们都英勇奋战,因为输了就是死。然而仍然打不过诡计多端的凯撒带领的罗马军团。罗马军团在当时是公民兵,打仗对他们来说是获得土地和财富的手段,打起仗来也很英勇,加上组织和技术上的优势。7年战争据记载打败了300万高卢人,杀掉了100万,俘虏了100万,剩下100万逃走。 这样惊人的数字如果没弄错,只能用高卢人全民上阵来解释。

而罗马作为一个奴隶制国家,当时奴隶是不上阵的。 公民作为统治集团,在享受奴隶服务的同时,也要承担对内对外作战的义务。中国的商周时期也于此类似, 打仗的是贵族或者说国人, 打仗是靠精英的军队。

而到战国时期就不同了, 战国开始战斗激化,光靠贵族打架不够看。 于是开始武装乡下的野人上阵。 直到商鞅变法之后的秦国是这一阶段的巅峰,全国种地的农民都被组织起来,打仗的时候可以全面动员。 所以秦国最后的灭六国之战都是几十万对几十万人的大战, 长平一下就干掉了40万, 占赵国全部人口的十分之一还多。

从原始社会的全民皆兵,到商周的贵族兵, 到战国的全民皆兵是一个轮回。 能够玩全民皆兵, 其实是因为财富共享。秦制兵农合一, 秦兵能打, 除了纪律,还有动力。立军功不光能够当官,更重要的是能分地。 而土地是农业革命之后,工业革命之前唯一真正的财富。

汉朝随秦制, 一开始也是全民皆兵, 慢慢的就玩不起来了, 因为地分完了。 多吃多占的形成势力, 开始马太效应, 国家的控制力变弱, 大贵族的控制力变强, 到东汉三国, 大小地主都开始自己养自己的兵。 三国演义里曹操招兵买马,夏侯惇,曹洪,曹仁各个大将都是带队来投。当然到这个时候汉朝也就完蛋了。只有蜀汉仍然是全民皆兵, 因为蜀汉集团是外来户,有没收来的大量的地可以分。这也是为什么当时蜀国统共没几十万人,诸葛亮能带着一支近10万人的军队和曹魏正面作战。当然因为诸葛亮打了很长时间也打不赢,抢不到财富和土地,蜀汉在他死后就国力贫弱了。

全民皆兵,到贵族私兵再到分割出一拨人专门打仗的府兵,军户,历史走过一个个轮回。背后是土地面积,土地分配,  人口, 生产能力等等各种物质因素的制约。这些都最终都被总结为战场上的输赢,以及统治精英的存亡。

西方的历史其实也是类似的, 不同的一点是西方的商品经济比较发达,可以花钱招兵。比如瑞士现在风景独好,在当家是不长庄稼的苦寒之地。瑞士农民长期就靠当雇佣兵来谋生。瑞士雇佣兵在西方历史上也曾经大大有名, 并且被很多有钱的大贵族雇来做王室卫队这样的核心军事力量。穷贵族还雇不起。

军事制度的演变跟随着物质和技术的变化。最终西方因为工业革命又先走一步,从雇佣军回到全名皆兵的义务兵役制。靠工业革命带来的强大物资支持,能够在战时做全民动员。最终在一战,二战时如同绞肉机一般,能造成几百万,几千万人伤亡。 细究起来, 一战主要上场的还基本是欧洲精英。二战光精英也不够看了, 只好动员平民,甚至动员殖民地的力量。这在战后造成了全民民主,和殖民地解放运动等一系列平权社会现象。

历史是一个个螺旋上升的轮回,所以可以说国家在血与火中诞生,也必将在血与火中消亡。这是人类历史的宿命。也是复杂系统演化的基本模式和规律。 统治阶级开明与否,只能加速或者延缓这个过程,不能改变方向和大局。

(全文完)

 

 

 

 

记忆,又见记忆。总是回忆。

春节一边休息一边忙着吃, 不大关注研究的进展, 这两天有时间才看了看最新的论文成果。 这么说有点给自己脸上贴金。不在一线战斗, 其实没有太紧跟研究工作和论文。 所谓关注也只是刷刷人工智能相关的一些媒体公号朋友圈,看看人家帮忙给筛出了什么热点。今天就简单说说几个朋友圈热点,主题是有关记忆。

首先是一场热闹, 有关深度神经网络是不是在做记忆。两篇文章的一场对话。 其中一篇曾经在年前讨论过, 理解深度学习需要重新思考泛化能力。 作者从网络能记住随机的label出发,延展到讨论为什么无需正则化,这样的网络就可以有很好的泛化能力。作者最后的解释是认为泛化能力已经紧密结合在所谓记忆的细节里。这是传统理论没有涉及到的盲区。 该文作者只是提出了思考,没有给出恰当的解释。 就提出问题来说, 这是一篇好文章。 问题没有解决,也给大家留下了讨论的余地。

紧接着讨论就来了,Bengio团队有一篇题目为:深度网络不需要通过记忆来学习,的文章发表在ICLR上。这篇文章大概是说,虽然网络有大量参数足够用来记忆,但是并不是简单粗暴记忆法,前面那篇文章这么想,是因为实验做的不够细致, 学习随机label特别是噪声时网络需要更大的容量,而且随机样本更难学。改变学习中的某些类似在做正则化的方法,比如dropout, 对随机样本学习的影响比真实数据的要大。

文章中还特别说明了什么是记忆, 以及大家对这个概念理解的含混之处。前面一篇文章提到的记忆,意指类似用一张表格记住所有训练样本一样的简单记录法。这样可以精确对样本分类,然而对非样本集合, 分类结果就是随机的,所谓随机泛化误差。深度网络显然不是这样。

因为实验做的不够细致被打脸是常有的事情, 但是前一篇文章提出的问题还在。 为什么这么大量参数的网络, 无需正则化,就有很好的泛化能力。 Bengio文章里也提到了可能是某种early stop, 因为没有那么充分的学习去适应样本的缘故。这又是一个可以被打成筛子的想法。

涉及到记忆, 大家仍然各种稀里糊涂。这大半年对AI进展的思考,让我觉得对记忆的理解是解开人工智能奥妙的关键核心。有关记忆的含混的提法太多, 是因为记忆本身就特别复杂。

我们熟悉的存储, 那种记录在存储单元里精确的表格,看似简单的东西, 对大脑的记忆来说, 实际上是一种高级货。 按照研究大脑记忆的认知神经科学的提法, 记忆至少可以被分成语义记忆和情境记忆。 前面提到的那种精确的记忆来源于大脑形成了符号系统之后的语义记忆,是一种陈述性记忆,只有依靠语言和符号系统的帮助, 大脑才能长期记住一些事件。而情境记忆以对感官刺激的回应为主, 我们在儿时的早期记忆, 大致都是来源于感观的一些鲜活的画面和情境。 我们能够回忆起这些画面, 特别是其中的某些细节,但是就整体来说,并不是当时场景照相般的重复。

前面AI大牛吵来吵去, 似乎是弄混了语义记忆和情景记忆。 深度网络在玩的东西,都还只是在情境记忆的范畴。  如果沿着人的记忆形成机制来理解这个问题, 其实大家没有分歧。 因为人的记忆的有趣之处, 是在于所谓回忆,本身是一种计算过程。

在心理学系列里面,我们提到过利用科学方法研究记忆最早的是德国人赫尔曼.艾宾浩斯。艾宾浩斯通过研究自己学习新语言的过程, 提出了著名的遗忘曲线。直到今天还是我们教育依赖的所谓科学方法之一。 随后英国心理学家弗雷德里克.巴特莱特在1930年代做了很多有关记忆的研究工作. 巴特莱特有一本就叫做回忆(remembering)的大作。 他当时就发现, 人们的回忆不准确, 对同一个事件, 不同人在做回忆时, 会受到各自的世界观的影响,其中包括人们认为这个世界是如何运转的, 各种事物之间的关系如何, 都会干扰到他如何复述自己看到的故事。最终扭曲事实只是为了和自己的信念一致。

在随后的心理学研究里,记忆事实上是一种计算的观点被反复验证过。 所谓回忆, 实际上是根据当时的现场和个人的主观意识结合来重新生成一种对过去经历的描述。 会被修正,篡改和扭曲。除了前面两种记忆的划分,参与记忆形成计算的,还可以被分成能够进入意识的, 和在没有进入意识,可称之为只在潜意识中的记忆。 这一部分又包括程序性的技能和对极端情绪情感的记忆。 不同的记忆在现在脑成像辅助研究下已经被证明会激活不同的大脑区域,因此是来源于不同的计算。

似乎讨论认知神经科学和脑科学并没有帮助我们理解问题, 反而引发更多的混乱。 这里有太多的含混之处。 但是深度神经网络的另外一个热点,所谓生成对抗网络,又可以帮助我们加深理解。 就算你不同意生成对抗网络里做识别的那个在记忆, 做生成的那个网络要产生和真实样本一样的图像,总该是真正记住了某些东西了吧?

更加有趣的,生成对抗网络中一些现象, 和人的记忆过程有对应关系。 展开写可能又收不住了, 我们有机会再聊。 这里说说最近生成对抗网络中的所谓突破性进展, 在引入了来源于概率分布测度的Wasserstein距离后,对抗式学习的训练迈出了一大步。 顾险峰老师在他的公众号里用统计理论和微分几何来解释这个问题,有题为:看穿机器学习的黑箱系列文章,强烈推荐阅读。

讲了这么一大套枯燥的东西之后, 最后我们说点好玩的, 最近有两篇来源于用深度网络做生成的文章, 一篇用来补洞,High-Resolution Image In-painting using Multi-Scale Neural Patch Synthesis. 还有一篇讲像素到像素转换的Image-to-Image Translation with Conditional Adversarial Networks。 有人用这篇文章的思路做了个网站http://affinelayer.com/pixsrv/index.html。 利用简单的轮廓边缘来生成实际图像,比如猫,建筑,鞋子,包之类的。 这个因为有趣,出发了流行,被各种玩坏。从能够形成像模像样的大量细节来看, 网络确实记住了一些东西, 而从生成的各种怪物来看, 语义仍然是个很大的问题。 任重且道远。

 

 

春节闲谈-说说年饭

昨天大年三十, 按照中国人的传统, 家家要团聚, 吃一顿年饭。顺便看看春节联欢晚会。

春晚基本上是一年比一年难看, 以至于微信,微博都提供了专门对春晚吐槽的渠道。很多人说春晚难看是因为晚会已经过时了, 大家不需要这种东西了。 我个人觉得不是。 在中央台的春晚之外, 地方台也都搞春晚。一些地方台的春晚就比央视的好看,具体表现为相对比较实在, 接地气。 央视不光自己搞不好, 在大年三十晚上同一时间你看不到其他地方台自己的晚会, 全都在转播央视的春晚。 地方台自办的春晚,不是在年前, 就是在初一, 总之要避开除夕这一天。

这个地方台年三十转播春晚的现象已经很多年了, 到底是一个官方规定, 还是自觉自愿,网上的说法众说纷纭。有人说虽然没有官方文件, 但实际上就跟新闻联播一样, 地方台必须转的。 还有人说是因为市场竞争, 地方台硬要在大年三十跟央视竞争,划不来。 从广告收入和请演员开支等各个角度来说,避开央视春晚这个市场上的大老虎相对更划算。 这些说法看似都有些道理。 也许综合采纳就是真相。总之结果就是除夕夜的春晚被央视垄断了。

垄断一经建立就会自持。 所以央视就没有太多动力改进自己出品的质量。 另一方面, 也许是因为要代表所谓官方形象,必须注重形式, 就有了各种约束条件。 最后结果就是央视的节目越来越空洞, 越来越没有内容,越来越不接地气, 最后自然也就越来越难看。这往深里说,已经形成了路径依赖, 不是换个什么青年导演就能改的。 只有用不破不立,大破大立的态度来对待才行。央视好自为之吧。

春晚形式大于内容做的越来越不好吃。 年夜饭通常也是如此, 回顾历史, 现代中国人的年夜饭也是经过了从内容到形式的一个过程。作为北方人, 最熟悉的还是北方过年的习惯。 年夜饭又是怎么演变的呢?

中国人物质上的富足其实没有几年。 我出生的年代就还非常贫困。连吃饱肚子的基本要求都没有实现。 特别是在农村,要赶上过年杀猪才有肉吃, 包饺子的白面也是平时吃不到的。 于是只要是肉馅的饺子, 就已经是让人趋之若鹜的美味了, 还要限量不给多吃。

80年代开始, 中国人的平均粮食产量大幅提高。有人说文革末期因为中美破冰,与西方渡蜜月,引进了对苏东禁运的化肥工业,从此生产出来了大量的氮肥。 也有人说是因为改革开放,包产到户,提高了劳动的积极性和效率。 这些说法看似都有些道理。也许综合采纳就是真相。

要特别强调一下, 我并不是为了凑字数所以一句话说两遍。 兼听则明的道理怎么说都不为过。重要的事情都要说三遍哩。

总之粮食产量提高, 不光喂饱了人, 还支持人开始搞副业,主要是养鸡,养猪。 很多人问为啥过去人吃不上肉? 很简单的原因是养不起猪。 这跟是不是人民公社关系不大,人民公社也可以养猪。 不养猪的原因是猪要吃的东西其实跟人差不多, 要用粮食来喂猪。人都不够吃,那里有给猪吃的?  只有粮食产量上去了, 人先吃饱肚子, 有了余粮,用来喂猪, 才能有肉吃。 印度人据说现在都没解决这个问题, 他们抱怨世界粮食增加的产量都被中国的猪吃了。 您别笑,这可能是真相, 猪比人能吃, 中国生猪存栏量大约5亿头, 一年出栏量7亿头, 中国的猪加起来真的有可能比印度的人吃的粮食要多。

有了猪, 吃上了白面饺子。 就可以开始养鱼了,生态循环农业最早就是用猪粪来喂鱼。 您别着急恶心,这是在上个世纪8,90年代的事情了。能有鱼吃可不是一件小事 ,别说活鱼,就算是死鱼,也必须要有冷链运输,才能在坏掉之前让人吃到。 这些大约都是在80年代做到的。 于是中国人的年夜饭餐桌上有了鱼。 年年有余,来之不易。

有了肉,有了鱼, 可以开始炒菜了。 但是绿色蔬菜对北方来说, 也是困难的事情。 我小时候家里过年吃饺子主要是吃白菜饺子。 不是说白菜饺子不好吃, 但是想吃别的没有。  蔬菜大棚的普及要更晚一些, 基本上要到90年代, 北方人民才慢慢告别冬天里搬运码放大白菜,整天琢磨大白菜一百种吃法的生活。

有了蔬菜大棚, 就可以有花样繁多的菜。 大白菜饺子变成了韭菜,茴香,胡萝卜饺子。 猪肉,鸡肉,牛肉, 羊肉。 年夜饭餐桌上的食材越来越多。 最新加入的是海鲜大军, 各种虾元帅,蟹将军也闪亮登场了。 海鲜的来源之一是沿海各种海水人工养殖场。想吃海鲜换来的代价之一就是养殖污染了海水,各地海水透明度下降,海水浴场都吹着腥臭的海风。  另外一个海鲜的来源是中国已经是世界上最大的远洋捕捞船队。  嗯,代价之二是,这么大的船队,按美国人的报道,还不按规矩捕鱼, 破坏了海洋的生态。

14亿中国人要吃饱饭,吃好饭,  是一股强大的推动历史进步的力量。 这个过程仍然在继续中。 而在发展到后现代的大城市里, 北上广城里人的年夜饭餐桌上, 人们已经在抱怨演变不到二十年的,形式化年夜饭不好吃。 小清新,白富美们要吃新鲜的,不一样的!

之前作者评论过中国的八大菜系, 粤菜和淮扬菜最高级。 原因很简单, 这两个地方都是富商的聚集地。淮盐菜发达靠的是国内经济循环,大运河漕运, 盐商, 南北物流交通。 广东的发达是靠海外贸易, 广州十三行最盛时包办了清朝三分之二以上的进出口。 虽然后来因为战乱,这两个地方的商人集团都衰败了。 但是富裕生活方式的外溢,他们的品味以及审美拔高了淮扬菜和粤菜的档次。 高级的菜都强调食材,要发挥食材的本味。前提当然是食材要好。 好的食材就贵, 越好的越贵。 所以高级的菜其实不会便宜。 你要去餐馆里吃,菜价比原料的价格还要翻好多倍,吃的菜价里还包括环境和服务,又多了很多附加的东西。

回到一百年前, 广东有个美食家江太史。 他发明的太史蛇羹是粤菜的代表之一。 能出席江家的家宴吃一顿饭, 是进入广州上流社会的标志之一。江太史风光了一辈子,90岁的时候被抓住,最后绝食饿死。 曾经在广州占了三条街的江家大屋被拆散,江家人也流落各方。其中有个江太史的小孙女叫江献珠, 先在美国后住香港, 凭借儿时的记忆和后来的悟性成为风靡港台东南亚的美食家。 有很多书和电视节目讲怎么做菜。

江献珠有一本回忆录写自家历史的, 是香港小学生的课外指定读物, 大陆引进版叫钟鸣鼎食之家。 这个大陆取名俗之又俗,取名的人还自命得意。。。放过没文化的人不提, 书里有一篇叫春节家馔,讲江家过年怎么吃。

文中讲述, 过年第一顿饭,江家吃素, 为啥要吃素,可能因为礼佛, 江太自己也奇怪。但是素菜也可以各种花样,腐衣,草菇,生菜,黄芽白,芋饼,冬菇等等,每年不同。之后晚餐是吃生滚大蚬。在江太看来,大蚬是很贱的东西, 所费无几, 因为是疍民沿街叫卖的。  疍民的苦难历史感兴趣的人可以去查。 他们卖的食材,贵不到那里去。只是江家选材考究一点罢了。 所以在江太认为不用费几个钱。 今天你要复现江家这个生滚大蚬,便宜不了。 又是鲜美至极,又能凸显食材的原味,可以供下一顿不知吃什么好的人的参考。

据德国总理默克尔说, 中国人开始喝牛奶, 印度人开始吃第二顿饭,对世界都是莫大的灾难(原话不是这样, 我引申了)。 上等人能享受的精致, 只能让普罗大众来追求, 还要他们求之不得。 这样就奠定了现代生活方式和时尚追求的基础。

而中国人传统里自带不信邪,王侯将相宁有种乎。 再怎么提倡贵族范也压制不住我们的文化传统。当中国开始引领世界时, 这样的传统是否能稳定,也是未知数。。。 还是放弃这烧脑的思考,琢磨怎么吃好下一顿饭把。

谢谢观赏,祝大家春节假期吃的开心。

 

人从那里来-人是什么系列外篇之二

在本系列文章中, 我们主要回答人是什么这个问题。 很多人都知道小区保安经常会问三个哲学终极问题,  你/我是谁?  你/我从那里来? 你/我要到哪里去? 保安不是哲学家是因为他问的是你, 哲学里面是问我。 在前面系列文章里解释了我是谁之后,这里简单说说我从哪里来的问题。供大家参考。

老子说, 道生一, 一生二, 二生三,三生万物。 现代科学认为, 我们目前生存的宇宙来源与一场大爆炸。 什么是大爆炸, 就是从一个奇点在极短的时间内迅速膨胀, 生成了宇宙。 较起真来, 这一句话里有三个关键概念, 奇点,时间,膨胀(空间)。

首先说奇点, 奇点就是无穷大, 无穷就是道。道可道, 非常道, 我们当前的数学碰上了无穷也基本说不出什么来。 从计算的观点看, 无穷还是有不同, 这是题外话。这里先不展开了。不谈道, 我们知道道生一, 无穷生有穷就好了。

然后就出现了时间。  时间又是什么? 有一本著名的科普读物, 时间简史。 这里不重复说明了。从计算的观点, 可以认为时间是复杂系统在墒增原理作用下, 单向演化的一种方式。

最后是空间, 时间也好, 空间也好, 一有定义, 就是有限度的。 按照相对论哲学, 空间是一个相对的概念, 有参照物, 才可以有空间。 另外讨论空间,一个关键属性是维度。 这个脱开数学又没法简单解释。也只好点到为止。

但是有个概念必须说明, 我们已知的空间里充满了物质, 这些物质中包含有一部分能看到的物质,  还有一部分看不到的叫做暗物质。 玄学爱好者们最喜欢这些暗物质暗能量的提法, 因为在他们看来, 有了暗能量就有了鬼神的空间, 此外宣称自己能够连通暗能量就可以作法, 可以无所不能。 玄学爱好者们最喜欢的现代物理的另外一个概念就是量子, 他们稀里糊涂的觉得量子学说里面的各种不确定性, 超距作用,量子纠缠有可以让他们无所不能。 不管你信不信, 反正我是不信。 为什么?

因为对量子概念最大的误会,就来源与对量子是什么的理解上。 量子这个名字应当是来源于能量单位的提法, 这个名词让人觉得量子是个确定性的东西。实际上在微观世界一切都是不确定的, 都只是一个分布。 学过bayesian理论的人容易理解, 量子给了一个先验, 只有我们开始观测, 基于我们自己和量子的分布不再独立, 量子就有了后验分布,也就是物理学描述的各种属性。 这个世界的确定性来源于不确定性。 好像我也没太解释清楚。 也只能说这么多了。

我们从量子出发, 这个世界是由大量的量子构成的, 也就是建立在大量的简单模型就可以描述的分布构成的联合分布的基础上的。 从各种量子的独立分布到互相之间发生作用的联合分布, 世界从不确定到我们观察到的确定后验分布,是做了积分, 所以忽略了很多细节。依照时间, 实际上有各种分布到分布的inference计算发生。 从计算的观点看, 组成了一个复杂系统。

复杂系统摒弃了还原论。 也就是说就算搞明白了局部, 也把握不了整体。 从局部,特别是微观来看, 我们可以有精确的模型, 量子力学是很准的,why? 不是测不准吗?   不解释。 然而大量量子发生交互作用产生的各种自然现象, 我们就没办法用一个模型来描述了。 有模型的真实含义就是其实可以变简单。 复杂系统不能简单化。 只能用另外一个复杂计算来逼近。 绕来绕去, 好像没有说清楚, 总之我们要体会, 搞清楚局部,也搞不清楚整体, 永远无法精确的用模型描述整体,是我们世界普遍存在的规律。 世界是复杂的, 这是理解世界的第一规律。

第一规律跟时间相关, 下面一个关键概念是墒, 墒是描述乱序的量, 越乱墒越大。 热力学第二定律说, 一个孤立系统, 也许我们当前宇宙就是, 墒会自然增大, 过程不可逆。 因此热力学第二定律告诉我们时间的终点是一个处处混乱也就是处处一致, 的热寂宇宙。反过来说, 加个负号,负墒就是描述信息的量, 负墒越大, 信息越多。我们看到的世界,特别是生命的世界, 是多姿多彩的。 很有规律,也很有信息量, 这又是怎么来的呢?

大爆炸之后的宇宙, 无穷生有穷, 有极大的负墒,在宇宙热寂之前。处处存在着负墒聚集的,也就是远离平衡态的能量聚集的点, 恒星,太阳。 太阳逃不脱热力学第二定律, 早晚会死。 但在死之前,散发着光和热,牺牲自己,温暖大家。 给地球上相比太阳来说很微小的生命构成的生态系统, 提供了源源不断的负墒。

不管是一个生命个体,比如说你,  还是个体构成的一个种群, 比如说人类, 还是由地球上全部生命构成的生态系统, 都是墒减的。 这可以类比为一个新陈代谢的过程, 也就是通过汲取大量的负墒,利用一部分, 释放一部分, 就可以生长(人是从一个单细胞长出来的),可以从简单到复杂,越来信息量越大,约来约多姿多彩。这又是怎么一回事呢? 不是神, 是进化论!

进化论的核心思想是物竟天择。个体通过遗传变异产生多样性, 依据环境适应来选择。 进化论其实解释不了自己, 也就是多样性。 我们又需要用一点点复杂系统理论。现在科学的不同分支, 复杂系统研究的远平衡态自组织, 非平衡态热物理, 研究生态系统新陈代谢的代谢生态学都说的是一类事情。他们发现主导系统的演化的有一些共通的规律。

归根结底是所谓的最大流原理, 把一个系统当作能量,或者信息(负墒)在其中流动的网络。 比如生态系统, 每个个体是一个节点。整体构成生态网络。 系统的演化方向, 是让网络整体的流量最大。 系统在网络中传输能量/信息的整体效率最高。虽然整体上都是最大流原理,但是因为具体系统最大化的目标,或者说墒,或者说能量函数,有各种不同的形式。具体到特定系统又有不同。

比如进化论的生存竞争就是一种, 就个体来说, 需要增加自己的能量传输效率。 因为每个时间点网络里总的传输能量是有限的, 当某个节点增加了传输能量效率, 必然会导致有另外一个节点减少了传输的能量,甚至没有能量(灭绝)。怎么增加能量传输效率呢? 就是要快!天下武功,唯快不破!谁快谁活,慢着死。 但就整体来说, 生态系统的复杂程度, 要依托于环境, 也就是环境提供的可以被利用的负墒的多少。能利用的负墒越多, 生态系统就可以越复杂。

以上要快要快要更快原理,正式的说法叫做最快就生存(suvival of fastest)。2007年科普作家John Whitfield写过一篇很有名的文章”Suvival of likeliest” 说的就是这个。

生物和环境其实也是互动的。 就网络整体来看, 就算没有看到其中的节点生物个体的竞争。 进行新陈代谢的网络的传输能量也会越来越高。 前面讨论的生存竞争是粗的管子才能留下。 还有一种是速度越来越快。通过竞争,所有管子里流动速度都更快了。 大家一起都成长了。 系统会自动加速。

除了管子变粗, 速度加快, 更重要的是,系统中会自动生出新管子,整体网络的结构会越来越复杂。如此一来, 人会成长, 生态系统也多样化, 世界也多姿多彩了。

可能到这里有人会问, 为啥会有最大化原理, 系统不是会热寂吗? 其实放在整体想一想, 所谓自组织的生态系统, 是寄生在一个负墒流上的, 负墒流之所以出现, 是能量在传递, 是负墒减小, 墒增加热力学第二定律的标准过程。 而最大流, 可以加速这种负墒的传递, 那么从整体系统的角度上讲, 可以让热寂的速度更快一点。 正是要加快死亡的整体过程, 才有所谓生命的诞生。 反者, 道之动。 世界就是这么辩证的啊!

因为各种最大化效率的行为存在, 个体竞争, 生存选择,遗传变异,从简单到复杂, 我们有了理解复杂系统的第二原理, 最大流原理。 也就是各种系统, 本质都是效率。

你也许不同意, 建立在如此简单的规律基础上的复杂系统演化, 就能出现人这样的高级货。 不是不要还原论吗? 如果你认同计算宇宙的观点, 认为整个世界就是一场计算, 那么确实可以从简单的规律生成各种各样的复杂。 Wolfram 已经用他了计算游戏模拟了这个过程。 稍等, 我们进行的可不是确定性计算, 是从分布到分布的统计推断, 终归还是没有那么简单,谢谢阅读!

 

 

 

 

 

 

再谈记忆之墒和能量-人是什么系列外篇

本来这一篇打算继续心理学系列讲意识。整理思路时发现, 要说意识, 就要理解记忆是什么。 而只从从心理学出发谈记忆, 很容易跑火车。这里先从计算的角度谈谈记忆,铺垫一下。

 

在进入正文之前说点儿题外话。为了写这个系列的文章, 我查看了心理学, 认知神经学, 脑神经科学等一些相关学科的经典文献,强烈的感受到现代科学在各种分支上已经走的太远,每个学科各自为战。即使一些学科内的顶尖人物,纵使这些人通常已经是跨多个学科的大才,他们作品中仍然流露出来片面的认识和不足。 因为大脑实在太复杂,可以被称作科学的皇冠,要研究大脑,就像人类的意识形成自我一样(这个我们后文详细谈),需要各个学科的有效配合,取得一致。只有这样才能真正解决问题。而各个学科的各自独立进展其实已经有不少了,就差整合。

 

人工智能起源于1956年夏天的达特茅斯学院。 那一年的暑期,学界和业界的几个大佬, 达特茅斯学院的约翰.麦卡锡,哈佛的马文.明斯基,贝尔实验室的香农和IBM的罗切斯特在达特茅斯学院一起讨论了两个月。思想碰撞之下创建了人工智能这个学科。

 

时至今日, 我们需要又一场思想碰撞。 热切的盼望有识之士能够把各个学科的大佬召集到一起,再搞一次暑期研讨班,来梳理人工智能和脑科学前沿的方向,必将能促进学科的突破和进展。是时候了。

 

在去年夏天写的几篇讨论人工的智能的文章里, 曾经提到过想搞出类人智能的关键基础在于弄明白记忆的机制。我最早的想法来源于杰夫.霍金斯。 杰夫自己说, 他在1978年, 因为看到了神经科学家芒卡斯尔的一片论文而得到了启示,立志要搞明白智能是什么。

 

芒卡斯尔那篇文章主要讨论大脑的新皮层,也就是支撑人类智能的关键部分。 文章的结论很简单,就一句话,大脑新皮层虽然功能有分区整体结构上却非常类似。不同功能的长的都一样, 这很奇怪, 因为耳朵和眼睛天差地别,而分别处理视觉和听觉的神经中枢竟然完全一样。这在当时是个突破性的想法。而在随后的各种实验中,这个想法得到了反复验证。实际上同样一块区域, 既可以处理视觉, 也可以被训练成处理听觉。 而大脑的新皮层,统共只有六层, 每层的神经元都是使用电化学反应来传递电信号, 因为用到的化学媒介其实很慢。 因此如果把大脑的计算当作一个计算机,顶多是几百HZ主频的量级。 但是大脑又极其的有效,识别一个人只需要零点几秒。 这靠传统的计算模型完全不可能。

 

于是杰夫认为那些在当时搞ai的人完全走错了路。 要掀大家的桌子, 别人当然不答应。 如果杰夫不是因为创办palm挣到了很多很多钱, 必将会被当作一个民科来耻笑。 幸亏有钱就可以任性,杰夫自掏腰包成立了研究所, 按他的想法来研究。 他说大脑新皮层并不是在计算,而是在做记忆。 所谓识别, 就是在回忆。 而这个处理过程, 不应当是简单自底向上, 需要自底向上和自顶向下配合。他把自己的学说写成了一本书 On intelligence 。 按照书名里名词越少书越牛B的定律。 杰夫的这本书也值得一读。

 

杰夫有一些真正的洞见, 与我们对深度神经网络的最新解释是一致的。 比如传统上我们认为深度学习网络就是在提取特征,抽取模式的分层表示,这样的理解也许是是很片面的。 与杰夫的看法类似, 最新的深度学习研究猜测,深度学习比传统方法有效, 正是因为用大量的参数进行了记忆。 而相比大脑只要6层就搞定一切, 我们要150多层甚至1000层才在某一个特定领域与人可比。 说明我们的方法离人的效率还有很远的距离。 这可能有两个原因。 第一, 我们的网络训练的时候利用了自底向上和自顶相下的结合。 但识别应用时只是一个单向的过程。杰夫认为大脑皮层在工作的时候一直是两种机制结合。 第二, 最近一些讨论, 认为我们的网络学习特别的不充分, 这表现在网络可以大幅压缩, 或者做各种量化都不损失性能,其中必然存在大量的冗余。

 

众所周知, 大脑的效率极高, 大约十几瓦的功耗就做了那么多事情。 令搞深度学习网络硬件实现的人汗颜。 做硬件的兄弟们其实已经发现,提高性能/功耗比的核心要义就是降频。 如果以芯片面积或者说制造成本为代价, 通过展开网络来降低对单层网络计算主频的要求,功耗就可以要多低有多低。 美国人韩国人在业界学界都干了类似的事情。 可以忽悠各路神仙。

 

话有说回来,这个方向是对的。从硬件角度看,我们早晚是要和冯诺依曼结构说再见了。 为了实现记忆的有效计算, 我们需要计算和内嵌存储的小单元,通过网络连接在一起,每个单元不需要复杂的指令, 只支持一些很基本的计算就可以, 但是单元之间的连接要快速和高效。神级网络硬件实现的核心要义是优化所谓data flow。 大脑的计算是大家追寻的终极的目标。 我们只是迈出了一小步。

 

杰夫虽然提出了概念, 其实并没有说明白, 记忆到底是什么。 我们目前也只有很初级的猜测。这里就大胆的探讨一下。 现在的深度神经网络大概分为几类, 最成功的CNN所做的都是感知, 用来从现实世界中抽取各种实体概念。 CNN的世界是静态的,处理不好动态。 要理解动态信号,流行的是RNN和一系列特殊形式的RNN。 各种变体比如LTSM, 在自然语言处理中也有大量应用。 这对理解记忆有有什么启示呢? 我们说记忆的过程, 其实是一个动态演化, 对于神经网络的学习来说, 可以从两个理论的角度来考察:

 

第一条路是统计。 我对统计的全部理解都来源于十六年前夏天听朱松莼老师开讲。 朱老师一上来就讲你们之前学的都是错的。释放气场之后,朱老师说这个世界是一朵云。 不管是旧金山的雨云, 还是硅谷傍晚天边的火烧云(前两天所见),都是概率云。 我们要理解这个世界是怎么回事, 就是要掌握这个云的分布。 学习就是对世界的联合概率分布估计。

 

好吧, 朱老师实际没说世界是一朵云。 他是说我们要研究问题是一朵云。 自觉讲世界会更酷一点, 毕竟大脑的任务就是理解世界嘛。 当我们对整个世界一无所知时,也就是没有任何信息时, 按照热力学第二定律, 这个世界最可能是一个处处均匀的死掉的热寂宇宙。这就是所谓最大熵原理,此时熵最大。

 

随后我们开始观察这个世界, 世界的维度太高太复杂, 想一下子把握整体无从开始。 我们只能有用低维度的简单武器,在云上打一个洞。 就像研究地球的内部结构一样,找一个矿井, 打一个深洞, 抽取一段岩层, 看看岩层长什么样。 如果岩层仍是一整块, 说明这个洞打的不好,没有有效信息。 如果发现分了几层, 我们对世界多了点了解。目前人类在地球上打的最深的洞也就是万米级别。 假设地球是一个苹果,这个洞全在苹果皮上。  如果世界是平的, 按照不知道的就得均匀分布的最大熵理论,如果观察到几层,世界就是几层板叠在一起。 如果地球是个球, 就是几层大球套小球。 同样打一个洞,看到的分层越多, 说明获取的信息越多,熵的减小也越多。 我们希望每次打的洞, 都获取了最多的有效信息。 而对于看不到的东西就当做是均匀分布最大熵, 这就是朱老师教给我们的最大最小熵原理。

 

我们曾经是山顶洞人,那是几万年前。 北京北边延庆县有个旅游景点叫古崖居。据说是辽金时期的一个村落遗址, 就是在一个山上打了很多洞, 人都住在里面,那是一千年前。 还有黄土高原上一直到现在都有很多人住在窑洞里。 我外婆家就有窑洞,小时候去玩,住在里面冬暖夏凉,还可以亲近各种生物, 比如跳蚤。 可见从古至今, 住在洞里观察世界都大有人在。这是继承优良传统。

 

等等, 这跟记忆有什么关系? 朱老师告诉我们打洞可以研究世界,而且每打一个洞都能知道这个洞打的好不好。 但是终究没有告诉我们该怎么打洞。胡乱打洞效率太低。 于是其实还是没解决问题。

 

而深度学习正是可以解决问题的武器。按照我们的打洞理论来理解深度神经网络, 每一个神经元都是一个洞。 洞是一层一层打的, 一开始先均匀的打一遍。 那个洞打的好, 下一次就在它附近多打。 打的不好的洞就不要了。  网络训练好之后, 有一些洞很好, 里面的模式很丰富, 特别是边界陡峭, 也就是说有很大很大的负熵在这个洞里。 我们在这个洞里看世界, 看的格外清楚, 这个洞就是构成记忆的一部分。 可称为记忆之洞。 记忆就是一些提供了最大负熵或者说最有效信息的山洞的总和。 其实仔细想想没有这么简单, 这里只是浅谈。

 

第二条解释记忆的路径, 来源于理论物理。主要是换了另外一套术语。在理论物理看来, 世界由能量决定。 提出理论就是要先定义能量函数。 有了能量函数, 就可以描述世界。 而记忆在这个体系里, 进去是能量函数的极小值。 能量函数在极小值附近越陡峭,记忆就越好。 凡事都有两面, 记性好, 认的越清楚, 那么很容易差一点就不认了,这叫泛化能力弱,过学习。但是对神经网路不会过学习, 因为网络里有很多层,很多极小,不是各个都记忆好, 有的认识的多, 有的认的准, 大家互帮互助,就什么都认识了。

 

熵和能量是一回事, 但是数学处理不同, 一正一负。 各有各的用途。

 

好了, 以上从计算的角度说了说什么是记忆, 如果看完没有理解, 说明我是在胡说。下次我们换个角度, 看看心理学是怎么研究记忆的。 谢谢观赏!

从弗洛伊德到马斯洛-人是什么系列之一

去年的文章提到了研究人工智能需要理解人,把人做为一个整体来研究的唯有心理学。说起来是去年,其实也没多久,这次就展开写写。从心理学的发展脉络以及相应的观点谈起, 直到对人工智能研究的启示。 因为网络文章篇幅所限,一次肯定写不完。 也不知道会写多少。 应当是个系列, 至少会有3到四篇。 今天是第一篇, 讲讲心理学的三大主流门派, 和我的一点浅薄理解。 学识所限, 请批判性阅读。

开宗名义, 心理学三大门派, 精神分析, 行为学派, 人本主义。 因为我们要讨论的是人, 所以一家找一个代表人物: 弗洛伊德医生, 斯金纳老师和马斯洛教授。

凡事从源头说起, 在人类构建知识的初期, 就有各路哲学家和思想家在讨论人, 一些核心问题包括,人性是善是恶? 人性是天生还是后天培养(后天培养的也就无所谓善恶)?人的内涵是什么和动物有何区别等等。早期学科知识还不能分化, 提出了大问题, 只能从系统宏观角度泛泛而谈。 所以相关的学说基本上都属于哲学层面的思辨。直到十九世纪, 科学理论和实验研究方法的引入, 才真正开始规范化的思考。德国人威廉冯特, 第一个提出了实验心理学的概念。把人的意识划分成:感觉、情感、意志、知觉 和思维。后人的研究基本上就是在此基础上往下走的, 因此冯特被尊称为心理学之父。

冯特的理论提出不久之后,十九世纪末期, 人类历史上的天才人物之一, 犹太人弗洛伊德医生开创了心理学的精神分析学派。

弗洛伊德医生的早年生平不可考, 因为他不知道为什么主动销毁了自己的相关记录, 而且是两次。 大概知道,他是一个大家庭的长子,家里并不太富,小时候是个学霸。17岁进入维也纳大学, 获得医学博士,毕业后留在维也纳生活, 主业是给人治病,特别是精神疾病。 他的理论,主要是从自己给人治病的经历发展而来。

可能有人会好奇,为什么当时的维也纳有那么多精神科疾病。 按照同在维也纳出生成长,时代稍晚一些的管理学之父彼得德鲁克的回忆录, 那个时代对维也纳人来说正是新旧交革,大变迁,大动荡的时代。 在19世纪末以前,作为帝国的首都, 维也纳实际上一直维持者旧时代的秩序。 贵族和平民有严格的界限, 上下守序, 时代的发展很缓慢。而19世纪末期, 一切传统秩序都被打破, 因为战争,维也纳发生过严重的通货膨胀。  迅速变革的时代,引发的各种混乱,反映到人身上就是人人无所适从。 特别是贵族的地位变化, 对人的心理冲击可想而知。 也为弗洛伊德医生带来了看不完的病号。

弗洛依德医生在治病救人的同时, 一直在思考人为什么会有这么多的冲突, 导致各种奇奇怪怪的行为。 最后他终于得出结论, 每个人一出生就有各种欲望,这种欲望至始至终存在在潜意识里, 但是因为外界条件的种种限制, 被压抑了, 所以就导致了种种不平衡。

弗洛伊德据此把人分为在潜意识动物层面的欲望集合本我,代表意识层面的思考动机的自我,和社会道德等等所代表的超我。 因为超我约束本我, 自我就需要在两者之间找到平衡。特别是本我集中体现,所谓libido, 力比多代表各类快感,主要是性, 被弗大夫当作了人性的源动力。 弗大夫开出的药方是爱欲eros, 与此相关的各种心理机制,可以被用来平衡超我和自我的冲突。

由此可见, 弗大夫是一个对人性的悲观主义者, 他认为人的本性是动物性, 天生会和外界产生冲突,尤其会和人的社会层面,道德,法规等等产生冲突。 被特别拿来举例的就是众所周知的恋父恋母情节。 弗博士的天才之处在于他一下就抓住了欲望,这种相当基础的东西。他的局限在于他是一个精神科医生,天天混在精神病人堆里,这些人代表的是社会的暗面, 所以他只给出了暗面的理论和解释。

弗洛伊德的精神分析学说因为极其有效,而且理论相当基础, 在提出之后就大获成功。 并且随后渗透影响了整个西方人文社科的方方面面。 直到今天, 欲望的释放和被约束仍然是各种艺术门类试图表现的冲突主题。

几乎在精神分析理论大获成功的同时,又有一派天天和动物打交道的学者, 从研究观察动物的行为开始, 试图用观察行为的表现来理解人。这一派的先驱当然是鼎鼎大名的巴甫洛夫,条件反射理论。 从小我们就学过狗一摇铃就流口水的故事。 巴甫洛夫只研究了狗,在他之后, 用类似的一套理论和方法来研究人的承前启后集大成者就是斯金纳老师。

斯金纳老师童年生活在美国宾州的一个小镇上,他从小就是一个熊孩子,喜欢各种冒险和折腾。 比如自造一个独木舟带领几个小伙伴漂流了一千里。 又把一个旧锅炉改造成蒸汽炮, 用土豆和萝卜当炮弹打破邻居的窗户,打穿他们的屋顶。他还自造了一个滑翔机并随后坠毁等等。按照弗大夫的观点, 熊孩子的欲望得到了各种释放。 所以斯老师对人性看法没有那么悲观。 甚至说, 没有所谓人性!

在行为主义者看来, 人就是动物。 动物的条件反射是底层的低级行为, 而有各种高级行为的人,也不过是对外界各种环境变化,刺激做出的反应。 所以要研究一个人, 可以把他当成一个黑箱, 只要从外部行为上观察,就一切尽在掌握中了。

斯金纳老师正是践行了这种观点, 并且用这种理论指导了自己的一生。  和很多伟大心理学家一样,斯老师一开始学习的专业也不是心理学。他起初是学习英国文学的作家苗子。 读书期间, 因为看到了动物行为研究中的条件反射, 觉得自己找到了真爱,就转去学习心理学, 研究动物行为。 找到真爱后, 他拒绝一切娱乐活动,拒绝和女生约会, 全身心投入到各种实验中去, 因此而顺利拿到哈佛大学的博士学位,并且当上了教授。

斯金纳研究动物的各种条件反射行为。 特别是他用奖励和惩罚两种刺激来改造引导动物的行为,发现十分的有效。 于是他觉得应该把自己的理论应用到教育上, 用奖励和惩罚来指导小孩的学习。

斯金纳观察了当时的教育体系, 老师主要是在惩罚孩子, 不听话的孩子, 学习不好的孩子等等。 于是斯金纳指出, 传统的教育方法光用惩罚来约束小孩的行为,这是不对的, 应当奖惩并用。随后他特别提出了所谓强化学习的方法。其中的要点包括,要强化正确的行为,给予正确引导和奖赏,特别是要及时强化。这在教育领域产生了深远的影响。斯老师特别反对大班教学,因为如果大班教育,一个老师管不了那么多孩子, 老师也就没法对每一个学生的行为进行及时的指导。要做好强化, 及时反馈非常非常关键, 这样一个老师带不了几个学生。 由此可见, 斯老师要搞的还是精英教育。

斯老师一生著书立说,晚年得到了各种奖励和回报。他曾经拿到过美国国家科学奖章(美国科学最高奖项),美国心理学系会更是给了他各种荣誉。面对一个伟大的精英人物, 当然就有各种嫉妒。 一种被广泛引用的谣传是斯老师曾经把自己的女儿,放进斯金纳箱里,研究了两年。 因此导致他女儿成年以后自杀。 实际上这是一个编造的谎言, 他女儿幼年时可能是被研究了, 但是是在舒适的摇篮里, 成年后也没有自杀, 而是成为了艺术家, 还出版了父亲的传记。 可见精英主义经常会遭到各种污蔑, 但是事情的最后,污蔑总改变不了事实。

弗大夫整天跟精神病人打交道, 斯老师主要在教育动物。 因此他们两者的观点随然有效, 但是并不全面。 在以上两派学说提出之后, 作为人本主义学说的代表人物,马斯洛教授终于来了。

马斯洛教授也是一个犹太人, 与斯老师相反, 他有一个十分不幸的童年。 他父亲酗酒, 母亲十分冷漠残暴。据说他小时候曾经抱了两只小猫回家, 被母亲当着他的面活活打死。 因此母亲去世时, 他拒绝参加葬礼。 从小就没有母爱和父爱, 得不到正确的引导, 按照弗大夫的理论, 和斯老师的观点, 这会是一个失败的人生。 不是变成精神病, 就是去坐牢。 然而并不是。 马斯洛没有父爱和母爱, 变得孤独内向, 然而他家附近有一个图书馆, 他从小就在书籍中找到了慰藉。 读书改变人生!

作为人类历史上的又一个天才人物, 马斯洛教授的家庭虽然没有提供条件, 但是他的天分极高, 靠自己读书, 他进入大学, 在那个年代, 并不容易。 而后改变一生的时刻到来了, 他爱上了自己的表妹, 并在众人的反对声中, 与表妹结了婚, 那年他才20岁, 表妹19岁。

天才人物受到爱情的滋养, 进入了爆发期。 当时美国的各大学心理学系被行为主义主导, 都在训练各种动物。 马斯洛教授一开始接触到的也是行为主义, 并且以为自己找到了真理。然而不久之后, 特别是看到了精神分析学说,聪明如他就产生了怀疑, 人性如此复杂,光研究动物就能搞明白吗? 特别是他的第一个小孩出生后,通过观察自己小孩的成长,他彻底意识到了行为主义的局限性。人终究不是动物, 小孩和小狗小猫还是有点不一样。 于是他开始研究猿猴的行为,并拿到博士论文。在开始教学生涯之后, 更是提出了众所周知的马斯洛层次理论。

按照马斯洛层次理论, 人之所以为人, 既不是所谓力比多驱动, 也不是象动物一样仅仅是对外界刺激的反应。 这些理论只是观察到了部分现象。 不是全部真理。 把精神分析中的本我,自我,超我的三层概念重新划分, 把内在的冲突变成没有冲突的层级结构, 就构成了人性。

力比多只是最底层。 满足了最底层欲望, 上面一层是安全感, 这两层都满足,动物的问题就解决了,可以变成人。 第三层是归属与爱,在弗大夫的学说里对应的是自我。弗大夫那里是平衡冲突的关键,在马教授这里只是承前启后的一层。 再往上的是社会承认和尊重。也就是超我层面的东西。 在弗教授那里,超我和力比多是冲突的。 马教授这里的谈超我,是从正面意义上来讲的, 得到了社会承认和尊重,是自我的进一步发展, 而不是本我的冲突。 因为马斯洛教授接触的正常人比较多, 而不是整天接触病人。

最上面一层, 所谓的自我实现。 是最难讲明白的。 马斯洛教授的人生经历, 就可以被当作一个自我实现的样板。从童年的各种折磨, 成长为名教授, 直至美国心理学会的会长。 可以说自我实现是一个大筐,里面装了各种人生圆满所代表的内涵。

因为自己的身份地位很高,可以接触到各种成功人士。 马斯洛教授的晚年,专门考察了很多当时的成功人士。通常情况下, 这些成功人士都达到了自我实现的层次。但是经过仔细对比, 马教授发现这些自我实现的人里面还是有两个层次, 一个是简单的自我实现, 只是偶尔满足了自己, 另外一类人自我实现已经升华了, 经常会有所谓巅峰体验, 达到了所谓超验。 可惜他并没有完成自己的研究, 就因为突发心脏病而去世了。这些看法总结在他的遗作, 人性能达的境界这本书里。

马斯洛死后, 一些人顺着超验体验继续下去, 推出了所谓超验心理学。 为了与之前的三大门派区别, 超验心理学又叫第四心理学。而所谓超验,本身能够到达的人就太少。 一般人想理解很难, 曲高和寡, 也就变成了所谓玄学。 研究超心理学的不是大师就是神棍, 基本都是神神秘秘的。这类超验体验,在东方实际上叫做证悟。

本文到此结束, 下一篇我们来讲超验和证悟, 谢谢观赏!

请看今日之域中,竟是谁家之天下?

帝都的秋天比秋蝉还要短暂. 前几日一阵寒流路过, 早起出门, 路人都纷纷臃肿起来, 已见几分冬意. 幸而有温暖的阳光, 落在脸上,勉强可以冒充秋天. 今天雾霾爆表,昨晚就有各种警告, 早起不见阳光,只见阴冷, 恍然冬日降临. 冬日适合围炉夜话,讲史论今. 一早看到忙总的大作什么是精明强干, 回复里提到徐敬业反唐这段, 以前也琢磨过, 十分有意思. 写一篇小文记录一下. 所以今天不谈科技, 谈历史.

大部分小孩子, 学的第一首诗都是,鹅鹅鹅, 曲项向天歌. 传说是骆宾王七岁时候写的.七岁就写出了流传千年的名作,是何等的大才. 除了一首诗,还有一篇文章是中国人学古文必读的,代李敬业讨武曌檄. 这一片文辞华丽又情深意切的文章没几个字. 却有不少名句可以摘出. 先骂武则天:

洎乎晚节,秽乱春宫.

蛾眉不肯让人, 狐媚偏能惑主.

人神之所同嫉,天地之所不容.

包藏祸心,窥窃神器.

再表扬徐敬业:

是用气愤风云,志安社稷.

因天下之失望,顺宇内之推心,

班声动而北风起,剑气冲而南斗平.

喑呜则山岳崩颓,叱吒则风云变色.

最后写给天下人:

言犹在耳,忠岂忘心.

一抔之土未干,六尺之孤何托.

还有本文的标题: 请看今日之域中,竟是谁家之天下?

史载, 武则天看这篇檄文,读至“一抔之土未干,六尺之孤何托”,皇然问:“谁为之?”

或以宾王对,武则天感叹曰:“宰相安得失此人?”
徐敬业反唐, 本身是一场闹剧, 没几个月就事败身死了, 要不是骆宾王这篇文章, 估计更没几个人会知道. 反唐失败, 相关人等自然通通死掉.
史载684年徐敬业在扬州起兵, 两 个月后聚集了10万众, 与朝廷军队在高邮下阿溪决战,很快全军溃败. 当晚,骆宾王与徐敬业等人连夜奔赴润州,也就是今天的镇江, 准备入海逃往高丽,却未料到,手下王那相带头反叛, 将徐敬业等二十五人杀掉,把人头献给了朝廷。资治通鉴和旧唐书里都说骆宾王当场身亡, 新唐书里却说,骆宾王不知下落.  唐时就有人考证, 王那相在泊舟山畔时造反, 一干人等被杀的被杀,投水的投水, 骆宾王从小就写出红掌拨青波,自然会水,加之离岸也不远, 于是就游泳跑掉了.
中晚唐之交的孟棨在他所撰写的《本事诗.征异》中也有一段记载唐朝诗人宋老五宋之问的见闻,  故事大概意思如下:
时间, 公元709年,地点, 浙江灵隐寺, 人物, 诗人宋之问.
梗概: 宋在被贬职江南的路上,夜游灵隐寺。

灵隐寺名不虚传,眼前的景色让宋诗兴大发。做了一句诗,“鹫岭郁岹峣,龙宫锁寂寥。”可是下句却怎么也续不上来。旁边有个正在打坐的老和尚,看到宋的本事有限,心存怜悯,  就随口吟出一句 “楼观沧海日,门听浙江潮。” 宋听后欣喜万分。反复吟诵,觉得老和尚赠的诗联实在是全诗的点睛之笔。第二天一早,宋之问去拜访老和尚,老和尚已不见踪影。询问寺僧,原来续诗者竟然是大名鼎鼎的骆宾王!

史书记载, 骆是公元619年出生(也有说法是640年,有点对不上). 因此到公元684年反唐的时候,他已经65岁了. 70古来稀,  65岁还能游水跑掉,这体格不是一般的好. 到宋之问夜游灵隐寺, 骆时年九十整, 竟然还能作诗, 还能一夜之间不知去向, 这已经是神话了.

按过骆的生死不说, 回头说说徐敬业反唐这件事情,  忙总的意思, 这都是武则天的安排. 所以徐的反叛,一起兵就完蛋, 所以她才能安心的坐在殿上读那篇骂她的文章, 还责怪为什么没有招揽人才. 这又是怎么一回事?

武则天改元称帝, 通鉴里说: 九月,甲寅,赦天下,改元。旗帜皆从金色。八品以
下,旧服青者更服碧。改东都为神都,宫名太初。又改尚书省为文昌台,左、右仆射为左、右相,六曹为天、地、四时六官;门下省为鸾台,中书省为凤阁,侍中为纳言,中书令为内史;御史台为左肃政台,增置右肃政台…  这动静就大了, 旗子改了, 衣服改了, 官职也改了, 还给这些大臣们增设了个监督机构, 右肃政台, 本来就有御史台了. 又弄一个, 弄了好多新御史. 看上去跟明朝弄锦衣卫,东厂,西厂似的. 改动这么大, 传统势力肯定有很大反弹啊, 搞不好武则天就完蛋了.

武则天精明强干, 怎么收拾这帮官呢, 当然是要抓住重点, 重点是什么?  是一帮不服气的老臣. 通鉴里说武则天自己后来总结: 且卿辈有受遗老臣,倔强难制过裴炎者乎﹖有将门贵种,能纠合亡命过徐敬业者乎﹖握兵宿将,攻战必胜过程务挺者乎﹖此三人者,人望也,不利于朕,朕能戮之。卿等有能过此三者,掌即为之;不然,须革心事朕,无为天下笑。 直白的意思就是, 这帮人里面, 就这三个有本事不服管的, 老子把他们都收拾了, 你们还待如何? 这一段恐怕不是武则天的原话, 这明显是个得意猖狂的小人口吻,  应当是司马光用来黒武则天的. 文人都是一肚子坏水. 不过正好梳理了武则天当时要做的事情.

徐敬业是个功勋子弟, 他爷爷徐可不得了, 说唐里鼎鼎大名的徐茂公. 后来赐姓李, 所以写檄文的时候是叫李敬业. 后来失败, 这个赐姓自然要拿掉. 他继承的是祖父传给他的英国公,是红三代一帮勋贵子弟里面的代表人物, 结交名士, 身价亿万, 自以为了不起.

裴炎是高宗的托孤老臣, 为人耿直, 人望很高, 能力也强. 特别是裴家本身就是关陇望族, 数数唐朝宰相里有多少姓裴的就知道这个姓的厉害. 这样的人,那里是随便可以搞定的.

程务挺是个战将, 他老爹程明振是投降给李渊的, 后来多次攻打高丽,很能打, 公侯地位都是打出来的.  程本人也曾击破西突厥, 立过很大军功, 是当时带领军队防突厥的主力. 可见这父子是军营世家, 都靠军功吃饭,  在军中必然威望很高. 然而也被拿下.

徐,裴,程, 估计早早就是武则天要算计的人了, 这三个人里面, 富三代没脑子,  武将没脑子,最难搞的还是裴炎. 何况裴家是望族, 是旧势力的集中代表. 一定要拿下, 这个就是重点. 定好了目标, 下面就是手段.

武则天先把一帮勋贵子弟包括徐敬业都贬了, 还把他们贬到一起, 贬到了杨州,为什么是杨州?  腰缠十万贯,骑鹤下扬州, 这种富贵地方, 人的日子过的都太好了, 消磨意志, 是拉不出能打仗的军队来的, 你本来就呆在最好的地方, 那里会有出去打的动力?  一帮人被贬, 还整天混在一起.  一喝小酒, 自然互相抱怨, 牢骚发着发着就弄大了, 起兵造反吧! 这里面有个关键人物. 通鉴里说:  盩厔尉魏思温尝为御史,复被黜。皆会于扬州,各自以失职怨望,乃谋作乱,以匡复庐陵王为辞。魏思温为之谋主. 我们要造反了, 谋主是魏思温!

但是富家子好好的日子过着, 就算贬官, 也能花天酒地,嘴上说的容易, 真要造反,赌上身家性命,行动起来也难. 你不反, 有人帮你反! 造反过程如下: 先使其党监察御史薛仲璋求奉使江都;令雍州人韦超诣仲璋告变,云「扬州长史陈敬之谋反」。仲璋收敬之系狱。居数日,敬业乘传而至,矫称扬州司马来之官,云「奉密旨,以高州酋长冯子猷谋反,发兵讨之。」于是开府库,令士曹参军李宗臣就钱坊,驱囚徒、工匠授以甲。斩敬之于系所 .   先诬赖别人,再矫称, 最后驱囚徒工匠授以甲. 完全没见自己的私兵, 这能有什么战斗力?

徐敬业起兵, 靠的是奉史江都的监察御史薛仲璋, 薛是裴炎的外甥, 这条线总算是接上了. 于是武则天去问裴炎该怎么办, 裴炎说你还是归政给李家吧, 贼军不就为了保李唐吗? 根本不用打仗啊, 这下好, 归政李家? 恐怕是归政于你裴炎吧? 你这肯定是勾结你自己的外甥, 要夺朕的权啊, 还是去牢里想想吧! 于是收炎下狱. 炎为此谋,必有同党! 又有长安小儿做歌曰: 一片火,两片火,绯衣小儿当殿坐.  又说裴炎写了一封信, 内有青娥两个字. 武则天说,:  此青字者十二月,鹅字者,我自与也。』 遂诛炎。 各种证据都在嘛, 当然就杀掉啦. 顺便再杀几个同党. 裴炎不是那么好杀的, 下了狱,天下不少人为他求情, 直到这几个所谓证据都落实, 才杀掉. 程务挺当裴炎在牢里的时候,上表求情, 也是同党, 杀! 具体细节就不多说了.  至于徐敬业, 那后来随手就平了.

读史至此, 明眼人一定看出来了, 魏思温, 薛仲璋都有问题. 这两人都是御史. 一个先被贬了去卧底, 还有一个直接派过去造反. 徐敬业等小儿辈被玩弄于股掌之上. 最终干掉了裴炎. 过程里面动了刀兵, 几个州的百姓跟着陪葬,不知又有多少家破人亡. 所以政治真不是一般人玩的啊!

至于魏薛两人的下落, 魏是明写了, 王那相交到朝廷的二十五个人头里没有, 是余党. 后来被捕杀. 一笔带过, 薛就不知下落了.  这两人到底是死是活, 尤其魏是真死还是假死, 看你对人性的判断, 可以留给小说家.

最后,回头看看文章的标题, 骆宾王是天下奇才, 文章千古流传, 但是想跟精明强干的武则天问一问是谁的天下? 那自然是死都不知道怎么死的.

就是讨论历史, 全文没有影射, 读者君不要胡猜!

(全文完)