风雨中的达摩院

十一长假后帝都是一场接一场的冷雨,今天终于放晴, 一大早迎着初升的阳光起飞, 到杭州落地, 竟然也是冷雨。 机场出来的路上略读, 很多很多车,正在疑惑,就 听到车上收音机里主持人激动的说,来到了云栖大会。 原来是赶上了一场盛会。 一刷手机, 果然爆屏。 朋友圈全是转发各种会议动态, 其中最抓人眼球的是阿里请了十大科学家, 要成立达摩院,承诺要投1千亿。搞出一桩大事情。

一千亿当然是个虚数。随手做了点简单的功课,最权威的应当是阿里自己的财务数字: 2017年Q1季报里研发费用号称近40亿, 也就是折算合一年160亿 。但是按照2016年的一个欧盟的企业研发费用排行榜, 研发投入最高的中国企业是华为, 616亿(单位都换算成人民币),全球排行第八。第二名中兴通讯142亿,排行65, 上榜科技企业第三是百度,排行93, 随后是腾讯,排行117。欧盟的榜单有意思的是, BAT三家只有两家,缺阿里。前200名里没看到。 而按照160亿,不光足够上榜了。 而且应该超过中兴通讯,高居第二,不知是谁对。先按下不表。

按照多的那个160亿算, 要三年投1千亿, 每年的研发投入要接近翻倍才行。阿里这个钱怎么花, 是个问题。众所周知,搞研究要靠人,1000亿花在人身上,尤其是阿里号称的研究方向, 全世界加起来也找不到那么多研究工作者。  一条热传的评论,『研发投入1000亿,能拿10亿做研究不错了』,大概是真的。当然还有更厉害的的质疑文章『阿里巴巴的『达摩院』,必是一场闹剧』被广泛转发。可见有不少人心里都不怎么相信。也许觉得这是说大话, 放卫星。 刚刚成立的达摩院, 就围绕在风言风语中,如同今天的杭州天气,风雨飘摇。又想起谭校长一句歌词, 凄风冷雨中,多少繁华如梦。

达摩院这个名称,我这把年纪的看到可能才会会意一笑。 因为这如同谭校长一样古老,大概或许必须出自金庸的武侠小说。而金庸武侠新世纪里早就被各路网络爽文取代,现在的年轻人大多不看。能用金庸小说里的梗起名字,大概或许必须和谭校长一般年纪。

吹完毛,求完呲, 认真看阿里的想法,并无不妥。 其实成立阿里全球研究院, 搜罗全球精英为阿里服务,这本身没有错。 中国互联网三家BAT,市值顺序是阿里,腾讯,百度。 看市值, 百度甚至有些掉队, 研发投入的顺序不应该倒过来。

Jack Ma 也在成立大会上表示,对达摩院的展望是要做成标志, 对标贝尔,intel, IBM和微软的研究院。 并且规定了研究院三大原则,要持久,要服务全球大多数,要自营。这三大原则看起来志存高远,脚不踏实地。尤其是最后一条。

自营意味着自己养自己。而自企业研究院出现以来就有所谓研究院之迷。本人提出的研究院第一定律, 自营的研究院不是研究院。 自全球第一个企业研究院,贝尔研究院出现以来, 到 intel, IBM, 微软的研究院,都反复证明了这个规律。 以下是解释。

============我是隔夜饭的分割线 ===============================

前面那一半写于杭州机场, 本来想蹭个热点, 结果赶飞机没写完, 各种工作杂事一拖又是两天。达摩研究院虽然余波未平, 但各种文章评论不计其数,再抄就是剩饭, 就此揭过不提。 再说两句企业研究院。

作为一个混过IBM,微软等各种企业研究院多年的人,  说说自己的看法。 先澄清概念, 因为这个名字有点滥用, 很多企业都有研究院, 其实是研发院, 挂羊头卖狗肉,  并不是研究院。真正的研究院, 就是要做Jack Ma所说的造福全人类那种研究工作的研究院。这样的研究院, 只有大企业有, 只有垄断平台大企业有, 因为只有靠垄断平台大企业的因为垄断地位具有的高额盈利能力才养的起造福全人类的情怀。

从人类历史上的第一个研究院贝尔研究院, 到IBM, 微软, Intel等等概莫如此, 研究院都成立在企业已经掌握垄断地位, 钱来的容易,多到花不完的时候。 用来搞搞研究,合情合理。 例子无数, 不展开。

历史证明,这类情怀研究院确实做出了很多造福全人类的研究, 贝尔研究院, IBM研究院, 微软研究院都是如此。 而一旦公司的经营出状况, 垄断地位遭到威胁甚至不保, 研究院的好日子就到头了。 要么变成研发院, 要么就消失在历史长河中。

“不经历风雨, 怎能见彩虹”  送给达摩院。

BTW 研发院并无贬义。

逻辑, 音乐,绘画的联系与人工智能的叙事故事

世上有两种人,读过GEB的人,和没有读过GEB的人!GEB是一本大书, 书名是三个人名, 哥德尔,埃舍尔,巴赫三个人的首字母。全书大概有900多页。GEB也是一本怪书, 书中穿插着,类比巴赫音乐结构的故事, 埃舍尔的奇怪的话,和上一个人工智能火爆时代,1970年代,也可以说是符号推理时代,作者对计算, 心智, 和生物学的理解。这篇不是读后感, 只是随遍写写。

GEB本身并不难读, 除了稍长一点的篇幅以外, 没有难懂的部分。特别是对码农来说, 对数理逻辑本身就比较熟悉,大约一个周末的时间就可以轻松愉快的读完。 但是为什么有GEB党把这本书推崇的那么高? 是因为读完并不意味着读懂, 该书作者本人对音乐和艺术有自己的理解, 并试图通过文字隐喻的方式呈现出来。 所以要读懂,得文理都通一点,这样的人就比较少了。 最后这本书延伸到了哲学层面, 试图从解读大脑,来说明智能是什么,自我是什么, 自由意识是什么。 作者提出的符号自我的设想与当下的认知神经科学研究不谋而合。 读到这一层意思,就比较的难了。 每个弄明白这个问题(或者自以为弄明白)的人, 都能感受到灵机一动时刻的愉悦。也就会自觉归类,这就是文章开篇说的世上分为两种人的原因。

同样的说法, 在音乐爱好者里也存在, 古典音乐爱好者因为贴着高雅艺术的标签, 是小众而又爱好自我标榜的一群。其中又分为两种, 听巴赫的人, 其他的人。 听巴赫的人, 如果真能听懂的话,可以从巴赫粗听起来单调,然而结构非常复杂, 技巧达到某种极致的音乐里,感受到神性。 这些音乐本来大部分都是献给上帝的赞歌, 听着听着往往就会进入某种难以描述的状态,似乎与上帝或者世界融为一体 ,感受到非同反响的愉悦和平静。因此也会自觉归类。

而埃舍尔的画, 是粗看起来人人都能看懂, 细看起来却充满矛盾细节的奇妙叙事。 因为他学习绘画时主要学的是版画, 大概可以称他为一个版画家。他的作品虽然大都是版画的形式,然而其中充满着数学和计算的韵味,不同于一般的版画,自成一格。埃舍尔小时候学过木工和钢琴,读书的时候成绩并不好, 还留过两次级,不过他很早就表现出了绘画的天分,并且选择了正确的职业,成为一个画家。在绘画技术日渐成熟之后,埃舍尔选择了向内寻求结构,表达无限和冲突。这在当时不能被他人接受,因此长期默默无闻,这是也对他本人的磨练,长期积累中作品的层次不断突破, 终于达到了内含思想的高度。其中对他有很大帮助的一个人。 也是后来的终生好友,是加拿大几何学家H.S.M.Coxeter。正是受到Coxeter的启发, 埃舍尔创作了圆极限等一系列作品。

考克斯特是二十世纪最有名的几何学家, 被称作是拯救经典几何学的人。考克斯特出生在伦敦,后来移民到加拿大。他从小就学习钢琴和作曲,并且小有成就。在19岁进入剑桥三一学院学习数学,他本人回忆自己因为“发现了音乐和数学的联系”而从学音乐变成了学数学的人。 在考克斯特的年代,因为非欧几何的兴起,传统几何被认为是过时的东西, 不为大多数人重视,而考克斯特却不这么想,他仍然研究传统几何的对象,比如多面体和镶嵌,并通过引入代数来研究几何变换的结构,特别是高维多面体。考克斯特还曾经和布尔的四女儿(一个了不起的科学家族)合作研究四维空间的几何。他的一些数学工作对后来的晶体物理有重要影响。

考克斯特的大部分数学思想和理论是埃舍尔看不懂的, 但这不妨碍他创作出带有自己独特韵味的伟大作品。其中一类自我矛盾的, 正是对应着哥德尔的理论。哥德尔理论的哲学意义是告诉我们任何形式的逻辑符号系统都是不完美的 。而矛盾的根源是自指,也就是系统如果具有谈论自身的能力,就会引入矛盾。 简单的例子比如“这句话是假的” ,就构成了一个自我循环的逻辑怪圈。 人的智能的核心是能够用符号和逻辑推演来表征世界,这样一类系统也类似会存在着不完美和矛盾,这种天生的不完美在哲学层面也导致很大影响。 比如后现代的解构主义, 甚至反对一切主义的虚无主义。 这句定义本身就是逻辑的怪圈。

二十一世纪最新的人工智能热潮并不是符号主义和逻辑推演,而且是走到了完全反面, 并没有符号和逻辑。 这大概也是GEB想表达的螺旋上升的一种。既然是螺旋,就该有回归。 期待着在当下研究的基础上, 能对语言和符号处理有进一步的突破。那样的人工智能才是让人期待的艺术吧?

 

 

 

秋日杂记

北京的秋天是一年四季最好的时节。虽然也时不时有雾霾作怪, 一夜北风吹过,就迅速切换到了北京欢迎您模式。此时的天很蓝,微风清凉,空气透亮,还有暖暖的阳光。如此舒适惬意的日子, 适合外出走走逛逛,关在屋子里敲键盘就浪费好时光了。 这次就不长篇大论,随手写写,抓紧写完,好出门去浪。

美好的日子, 总有不幸的消息作伴。美国南部人民经历了一场又一场飓风,西北部人民被无聊小青年点燃的山火烧烤。中国人民的关注点是两场跳楼, 一女一男。 一个孕妇一个码农。

美国人民遭受的水火之痛,总可以归结为自然的伟力。而中国人民在刷朋友圈的纯属人祸。朋友圈刷屏的文章已经详细描述的事情的经过。 通常的观点是把事情归结为某个恶人或者某种恶制。更进一步有“深度”的会扯扯所谓人性之恶或者社会之恶,比如谈谈女权或者码农权。 也少有一些文章只是单纯抒发一下同情心。码农和孕妇,在此时同样都是弱者。

抛开这些方方面面,最核心的问题其实只有一个, 人为什么会自杀?这个问题也可以反过来问, 人为什么会活着? 自杀可以归结为一个简单的公式, 活着的正面意义<负面意义时, 就会自杀。

在研究人的学科心理学里, 自杀也是一个被广泛探讨过的话题, 甚至可以说有一个专门的自杀心理学分支。 然而如同心理学的其他分支一样, 对人这么复杂的个体, 只有各种学说,没有一致结论。

研究自杀最早的权威著作是法国人埃米尔·迪尔凯姆,社会学三元老之一写的自杀论, 该书写于1897年。作者试图从社会系统的因果关系角度来解释自杀现象。书中的核心观点是当个体与社会的联系发生障碍或者冲突时,就会导致自杀。 书里把自杀分成四种类型, 利己型、利他型、失范型以及宿命型。

利己型是个人受到挫折无人救助时的行为,也是最常见的一类。利他型主要指那种因为义务或者负疚感导致的,比如日本人的切腹。失范型是因为社会急剧变化,原有的道德规范解体,无法给人提供人生目标和生活意义导致的自杀行为。而宿命型则是社会规范过严,限制了个人的发展,形成宿命人生所引发的行为。

以上分类总结相比把自杀当作个体体验前进了一大步, 然而基本概念不够清晰和明确,如果拿来分析问题完全依赖于人的主观判断,可能过于随意。 以现代科学的观点来看,所谓看似包容一切, 其实等于没说。这样评价对当年的开创者来说可能过于吹毛求疵了 。后来的理论发展绕不开这个基础。

在之前的心理学系列里,提到心理学主流三派, 弗洛伊德大夫开创的精神分析,斯金纳箱代表的行为主义和马斯洛教授的人本主义。 这三派也从分别各自的角度和理论框架讨论自杀。

在精神分析学派看来, 自杀来源于潜意识层的内部冲突, 有可能来自于长期积累的自己对别人的愤怒的自我转化,也有可能是社会对自我的长期敌意的积累。潜意识的矛盾遇到了某种应激时间, 就会导致自杀行为。

对行为主义来说, 自杀也是在社会环境中训练,学习,培养起来的。 在行为主义黑箱派看来, 通过研究一个人周围的社会生态,可以预期他的行为。比如一个详细报道的自杀新闻可能会诱发跟随者。而典型的自杀, 也是自杀者认为的一种问题解决方式, 而且自然是跟别人模仿学习来的。

对人本主义来说, 生活的意义在于需求的满足, 潜能得到发挥和释放。 如果爬不动需求金字塔, 甚至跌下去, 就失去了生活的意义。 也可能就会导致自杀行为。

以上说法那个更对? 心理学的迷人之处就是都对也都不对, 因为研究的对象本身太复杂, 一经概括形成理论,也就自带边界,无法完全包容全部现实。

那么说了这么多,有什么用?所有的事情都是一分为二的, 看似没有用的东西其实是很有用的, 理论需要在实践中应用才能升华。 当然这里不是教唆人去实践自杀。不管对己还是对人, 在面临感情冲动时, 如果能跳开当下的处境,以旁观者的角度开展抽丝剥茧的理性思考, 往往负面情绪就能在不知不觉中消解。而此时不管什么理论的带入, 都是有用的。

时间终究会消解一切。 活着就还有时间, 而死就没有了,这是本质的区别。

话题越写越沉重, 还是出门吹风去吧!

AI就要开过去了, 倒车请注意倒车!

最近写了不接地气的一系列文章, 讨论了数学, 科学, 生命, 几何的基本概念,看上去是不同话题, 其实都在探讨一件事:科学研究的思维方式和思维方法。目前作者所能触及到的深度, 写下来的基本也就这些内容了。今天来接一下地气,参合一下最近有关AI的一场论战。

事起一篇访谈文章:“人物特写”清华大学教授,IEEE Fellow 王志华”几乎所有的AI, 到现在为止都是胡扯。 这当然是标准的标题党 。 有清华大学教授, IEEE Fellow的身份背书, 然后直指当前科技投资界最火的AI方向, 结论是都是胡扯。 偏激到一定程度当然够抓眼球, 从媒体的利益:只为广泛传播的角度来看, 这是一篇成功抄作的文章。

不光观点炸人,这篇“镁客网”的文章中还罕见的贴出了采访记者和王老师的立姿合影,验明正身,可能是用来增加这就是本人观点的信度。回到文章主要内容, 前半部分王老师主要是强调了集成电路的作用,认为集成电路已经是构成现代社会的基石之一。随着集成电路的发展, 也替代一些传统的行业,比如感光集成电路取代了胶片。后半部分话锋一转, 开黑了一些当前热点技术, 王老师认为类似碳纳米管,石墨烯之类的技术都不可能起到集成电路对社会这么大的影响和作用。行文至此都还正常, 突然话锋一转,可能是记者问您对当前热点AI怎么看, 就冒出了标题里的观点, 所有AI都是胡扯。王老师认为“人类发明史上,从来都是应用,需求领先,从来都不是技术领先的。”,“人们并没有要AI”,作为补充, 王老师认为AI可知的应用只有图像解析,“(安防还是互联网应用中做图像解析的)你就老老实实说做图像解析,不要吆喝所谓的“人工智能 ”“。文章最后又回到了对摩尔定律的讨论上来。 就不再多提了。

简单的总结,王老师认为所有做AI的都是胡扯理由有二, 1是现在做AI的是拿技术找需求, 技术发展的历史不是这样的, 2是唯一有应用的做“图像解析”的不是AI。 对于做图像解析的不是AI,大概是所谓“白马非马”的逻辑。 这里先不展开。

如此旗帜鲜明的反对AI, 自然有回应者:“易联视讯陈建文:关于AI,需要从人类愿景上整体思考”。 文章中提到陈建文是一个从事视频和人工智能领域研究15年的海归博士。按照媒体公开资料, 陈建文博士自清华毕业后留学海外, 主要研究方向是视频编码和视频云平台,2014年回国创立易直播, 主打视频直播平台, 三年后的公司易联视讯网站主页标题是“AI”之梦。

陈博士的文章先讲了个美国总统访问肯尼迪航天中心遇到扫地老头的段子。总统问老头是做什么的,老头自豪的说,我是在把人类松开月球。接着陈博士强调这就是愿景的力量。并且随后指出:“王教授和我的理解不在一个维度上”是因为“中国教育带来的实用主义狭隘”。“把AI放在商业应用场景中,关注点会细分,甚至可能失去宏观的想象和预测。”;而“人工智能就是人类的未来” 从科幻电影中可以得到启示,“AI技术是未来虚拟世界的构建者”。“AI之梦,人类之梦”

陈博士的文章如此高调宣扬愿景,避实就虚,自然落了马脚。不过制造话题的任务圆满达成,随后有跟进文章李光满冰点时评的“清华大学教授与电子科大教授交锋人工智能:谁在胡扯”,该文除了指出陈博士是电子科大教授之外,再重述了以上两篇文章内容之后,又提出了三个自己的观点,简述如下:

1,市场和资本浸透了的中国各界,太关注现实层名而无法冲破思想禁锢,无法进行原创思考。

2.中国教育体制导致中国学生失去想象力

3.人工智能是我们童年梦想不断实现的过程。

作者就是看到了这一篇,才回头去翻了翻前面两篇, 看上去参与讨论的这三位, 都不是做人工智能的。 要么是梦想, 要么是胡扯。 广大人工智能的从业人员,不知作何敢想。

人工智能即不是梦想, 也不是胡扯,而是通过“计算”来实现传统看来属于“智能”范畴的工作。正如工业革命用机器来部分取代人的体力劳动,与此同时用化学能/机械能/电能的有效控制和释放大大拓展了人力的边界。 蒸汽机,内燃机,电动机,汽船,火车,汽车,飞机取代了马车,帆船。人工智能在用“电脑”部分取代人的脑力劳动,与此同时用对计算的运用,大大拓展了人的脑力的边界。

具体到实际应用, 消费者能够看到的:从扫地机器人, 到语音输入法,到美颜相机。 都是节省了人力,提升了效率,或者做到了之前不能做到的事情,比如美颜相机的实时视频处理相对于人力手工ps。王老师提到了“图像解析”, 可能忘记了还有语音识别。机器已经能听,能看,当然因为自然语言处理常待突破,机器目前还做不到“懂”。

另一方面, 科学发展和突破是建立在严格的实验观察手段,和审慎的科学思维逻辑推导的基础上的。所谓的灵机一动,啊哈的时刻,前提是艰辛的工作和长期的思考。这里不需要所谓天马行空的想象力,这是对科研创造的极大误解。

最后, 现代科研从需求出发没错, 然而终究是靠技术发展推动的。 用户只会要更快的马, 会飞的翅膀,科学研究和工程实践结合才能造出造出汽车,飞机。 技术发展不能脱离需求引导,同样单单强调需求本身,不可能单凭想象得到被拓展的需求边界。

媒体曾经炒作过的热点, 从引爆未来制造的3d打印,到主导未来媒体娱乐方式的VR技术,再到今天的AI。 历史表明,一开始水涨船高,过度炒作之后,常常又走到另外一个极端, 斥之为“一群骗子”。  也许今天的AI也会有类似的遭遇, 然而吹尽黄沙始见金 ,技术发展终归会落在实处,成为推动人类社会进步的根本力量。

 

 

闲谈几何

最近一段时间几篇文章写的都是科普话题,先后说过科学,数学,生命等等。本来觉得会应者聊聊无几,没想到还挺受欢迎。于是就鼓起勇气,再写一篇几何。说实话,这个话题写起来有点心虚,因为很多东西,作者本人也没学透,权当抛砖引玉吧。

最近AI火爆,也带火了计算机视觉这个方向。几个专业会议CVPR,ICCV都空前火爆,参会人数连创新高。而且以前只有本专业学者才关注,现在竟也有公众媒体追捧。拜深度学习的研究热潮所赐, 现在的会上大半工作和深度学习相关。而回到十几年前,确不是这样。当年的计算机视觉研究是百花齐放的, 各种问题和方法都有人触及,并没有什么一桶姜山的东西。然而百花园中还有牡丹称王, 其中最正宗的计算机视觉问题, 是立体视觉相关。

众所周知, 人有两只眼睛,能感知到三维世界。计算机视觉也想做同样的事情, 就是从二维的图像集合中得到三维信息。这个图像集合可以是几个相机同时, 也可以一个相机在不同位置获取,如果是静态场景,两者其实没有区别。要从二维图像中恢复三维场景,其中的关键就是要搞清楚背后的几何关系。 当年计算机视觉中也有个鄙视链, 懂几何的鄙视不懂几何的。代表性言论是:没有几何能叫什么计算机视觉,那只是图像处理。

如此偏见,建议一笑置之。不过要学习计算机视觉,搞懂几何还是很有帮助的。计算机视觉期望通过图像来恢复三维世界,而图像是三维世界通过相机成像的结果。因此这个恢复过程包括建立相机本身的模型,得到相机的位置(特定情况下不需要),以及得到真实场景中物体的三维描述信息。其中的核心是三维实体相对位置和映射关系,这也正是几何研究的主要内容。

数学史料上的普遍观点, 几何的出现最早是用来丈量土地的, 特别是在古埃及, 尼罗河泛滥之后,肥沃的土地露出水面,如何分割,怎么计算面积大小就变成了问题,这样的事情, 每年泛滥都得做一次。古埃及人的学问被地中海文明继承。 其中几何的部分经过进一步研究和发展,最后被欧几里得总结为几何原本,这是古代文明最灿烂的成就之一。

著名的古希腊数学家欧几里得,据说出生在雅典,后人对他的生平所知甚少,实际上他主要的工作都是在属于埃及托勒密王朝的亚历山大城做出的。因为地中海一带的所有文明成就都叫希腊文明,所以欧几里得也是希腊文明的杰出代表。几何原本可以被称作是现代数学和科学的基础,或者是史上最成功的科学教科书,因为其中给出通过公理化方法建立知识体系的思维方式。欧几里得总结出通过一些公认的基础事实或者定义,通过形式逻辑得到定理的一整套方法,并据此建立一个基于逻辑体系的几何学。这可能是中国古代实用主义思想体系所缺少的部分。几何原本直到十七世纪初才有徐光启翻译介绍到中国,随后几百年也没激起什么浪花。但在西方,影响了一大批知名学者,比如牛顿。

很多人都知道几何原理中提出了五大公设, 列举如下:

  1. 两点之间存在唯一线段
  2. 任何直线段两端可以无限的延伸
  3. 过一点和任意半径可以有一个圆
  4. 所有的直角都相等
  5. 如果平面上两条直线为另外一条直接所截, 使得第三条线其中一边的两个同旁内角和小于两个直角,则前两条线无限延伸后比在一点相交。

以上几条粗看起来只是一些定义。但其中其实隐含着一些更深层次的东西。第一假设说的是点,线这两个基本几何元素。 第2,第3假设除了定义直线和圆以外,还隐含着空间是无限的, 而且是连续稠密没有任何空隙的。第4条看上去挺奇怪,  直角相等需要特别强调吗? 这正是需要审慎思维的地方, 其实第4条说的是空间的均匀和一致性, 一个几何性质不管在空间中移动到哪里都是不变的。以上四条从抽象层面定义了一个无限范围,处处连续,处处均匀不变的空间。这和我们直观看起来的周边世界是一致的。

欧几里得第五公设是最奇怪的一条,首先从定义上就比其他四条复杂的多, 其次看起来也和其他公设没有什么直接关联。 第五公设主要是定义了一种成为平行的关系,所以也叫平行公设。 又了平行, 我们才可以有平行四边形,矩形和正方形的概念。由平行公设还可以推出欧式几何中的一些基本定理, 比如三角形内角和是180度(欧几里得喜欢说两个直角),还有勾股定理(毕达哥拉斯定理)也需要通过平行公设来证明。

虽然平行公设如此基础, 但是数学家们都对它不满意, 不管是它的表述方式还是和其它公设的关系。于是历来就有人想通过逻辑手段来探讨第五公设是否有更完美的形式。其中的先驱之一是意大利数学萨凯里(1667-1733)。萨凯里试图通过反证法来证明平行公理,他首先假设平行公理不成立, 按照反证法,于是就应当推出一些矛盾之处,这样就证明了平行公理成立。 萨凯里试图通过假设三角形内角和小于两个直角来推导出矛盾,而事实上,他不仅没有推导出任何逻辑矛盾,反而发现了一些有趣,奇怪且难以置信的结论。但是思维惯性让他放弃了深入思考自己的发现, 而是简单总结为或许可能平行公理是成立的。

萨凯里之后,德国数学家兰伯特(1728-1777)也曾长期研究第五公设,他给出了如果平行公设不成立下三角形的面积公式, 甚至猜测可能存在虚半径球面的概念。这些相关的研究工做,在数学的集大成者高斯那里得到了总结,历史上公认高斯提出了非欧几何。但是高斯在世的时候并没有公布他的发现, 直到30年后,通过假设第五公理不成立推出的非欧几何中的双曲几何才有后来人独立发现,其中之一是俄国人罗巴切夫斯基,双曲几何又叫罗氏几何。由此可见想挑战传统的思维惯性是多么的困难。

有关非欧几何的发现还有很多动人的故事,相关的文章太多了, 这里就不再重复了。因为我们日常生活的空间或者说直觉体验到的是欧式空间, 所以通常也需要借助欧式空间来理解非欧空间, 比如表现双曲几何的著名艺术作品:埃舍尔的园极限, 就是双曲几何在欧式空间的投影。

非欧几何之后几何学的进一步发展是黎曼几何。 黎曼提出通过提出对几何实体的进一步抽象所谓黎曼曲面上的微观结构黎曼度量来进一步拓展了几何学理论。 在黎曼几何提出之后,欧式几何和非欧几何都变成了特例。 在黎曼几何微分流形概念上建立起来的张量分析方法,是后来广义相对论的基础。 黎曼几何在提出时只侧重于微观结构,进一步拓展到宏观要借助拓扑的概念。拓扑也是在几何上的再次抽象。  微分流形和拓扑的结合是当代物理的数学基础。 笔者也是一知半解,就不再多说了。

从以上几何的发展路径来看, 通过逐次抽象,建立更普遍的概念表示, 几何理论一次次拓展自己的边界。 数学本身更是如此。 从特殊到一般, 从实体到抽象,再到抽象的抽象, 建立更高级的概念层次,研究之上的抽象概念的结构和关系,可以得到更为普适和一般的结论。

回到一开始提到的计算机视觉。 我们不单单要理解三维空间的实体结构和之间的关系,这是古典几何研究侧重的”静态“内容。 更重要的是要研究从实体到图像的投影变换。相机在空间可以处于不同的位置和角度, 这通常是位置的,从相机得到的只有经过变换后的图像。因此研究不同变换下保持不变的那些东西是计算机视觉背后理论应当侧重的内容。而这正好符合几何学的现代定义。1827年,只有23岁的德国数学家克莱因在一个名字叫”爱尔兰根”的小城发表演讲,这篇演讲被后人称为“爱尔兰根纲领(Erlanger Programme)”。其中指出:几何学是研究空间曲线在变换群下不变性质的一门学科。

从不变性的角度来看, 传统的欧式几何对应刚体的运动, 其中形状的角和距离都是不变量。 欧式几何的进一步拓展是仿射几何,欧式几何中的不变量,在仿射几何除了平行性不变,角和距离都是可变的。 在仿射几何里, 正方形可以变换成平行四边形,圆可以变成椭圆,而任何三角形都是等价的。在仿射几何基础上,如果平行性也变化了,就拓展成了射影几何。射影几何下 平行四边形可以变成梯形, 所有的圆锥曲线都是等价的。

这样的拓展粗看上去失去了很多东西, 比如垂直性在仿射几何下就没有意义了, 所谓的三角形面积公式也不成立, 在射影几何里更是丧失了平行性。所有的直线都相交了。然而抽象的强大之处正是在这里, 因为存在着等价性, 可以研究特例来得到更一般的关系。 比如在仿射变换下圆和椭圆等价,根据等价关系可以很容易从圆面积公式得到椭圆面积公式。 此时任何三角形都是等价的, 因此挑出特例,比如直角三角形,在其上发现的某种性质只要不受仿射变换影响, 对所有的三角形都是成立的。 这实际上简化了问题的复杂性。

在计算机视觉中, 理想相机的变换在射影几何中是等价类,虽然无法保持形状的不变,图像里的直线对应空间中的直线, 通过研究图像之间的对应关系,就可以建立射影几何结构。而找到图像中的无穷远直线, 就可以恢复空间的平行结构,这样就升级到了仿射几何。 在无穷远直线上找到虚圆环点, 还可以进一步恢复欧式几何结构。 理解了背后几何结构的关系, 就可以方便设计面向实际应用更为稳定可靠的算法。

几何作为数学中的基础和非常重要的分支,贯穿从古代数学到最现代数学前沿的全部数学历史。又因为与直觉思维相关,具备强大的引导思维的能力,本文只是浅尝即止。从欧几里得到中西方的数学历史比较中可以得出结论, 只关注实用性算法早晚会原地踏步,卓越的研究工作应当关注揭示更深层次的结构,通过建立新的概念表示方法来持续拓展边界,这是可能得到突破贡献的主要路径。

 

 

 

 

 

 

 

 

 

 

生命是什么

如果说上个世纪有关科普的名著里面有什么必读之作, 薛定谔的“生命是什么”必是排在前列的作品,也许没有之一。 这本书是基于二战期间薛定谔在英国做的一系列演讲,最早于1944年编著出版, 后来又加上了1958年系列讲座中讨论意识和物质的内容,以及薛定谔本人的自传, 作为一个合集出版。就算是最晚的合集版本, 到今天已经过了半个世纪, 相关生物学科作为科学前沿取得了巨大的进展。然而这本书中基本思想并不过时。特别是这本作为给普通人写的科普小品,在当年甚至启发了有关DNA和复杂理论等一系列科学发现,可见其深邃。 今天就借这本书的思路, 谈一谈生命是什么这个大话题,话题本身很重要,而更重要的是思维方式。

作者在开篇的序言里就提到, 自己是作为一个物理学家在谈生物这个问题。 而作为一个科学家通常不会就自己不精通的论题著书立说,这样可能不负责任。 他之所以愿意谈谈这个话题, 是因为自己对所谓普遍性的理解,现代科学的复杂程度让每个人都只能掌握自己一小块领域的知识, 然而构成科学的全部知识应该是一个“普遍”的整体。这本身是两难, 除非有人肯做一些总结和整合的工作。这是他写书的原因。 薛定谔应当是过谦了, 他本人实际上属于通才, 对各个领域的知识有广泛的了解, 对生物也不能说是外行, 同时在哲学层面,他也有自己的相当深入和全面的认识。 而在当时, 物理学应当已经算是搭建好了框架,有了普遍接受的研究范式。而生物科学正在早期混乱和含糊的阶段, 非常需要有人定义明晰基本概念,提出正确的研究问题。由物理学家定义生物问题看似转行,其实相当自然。  这也是这本小书能在随后启发生物领域和系统科学领域若干发现的主要原因。

书的开篇就提到, 对生物学所面临的各种复杂问题, 当时的物理和化学看似无能为力,然而这不是否定物理和化学在生物中起作用的理由。两者之间的主要差别是生物物质中的结构和传统物理和化学研究的内容有很大的差别, 不能简单的把在物理化学已经取得的规律平移过去。比如对当时的物理学家来说, 晶体(有明显的周期性)已经是足够复杂和有趣的了。 而细胞中的染色体, 所谓非周期的结构又远比晶体复杂,这样当然不能简单应用在晶体研究中的物理规律。

这个问题直到今天仍然是如此, 物理学家倾向于研究微观极小基本粒子的规律和性质,以及宏观巨大的宇宙和星体的性质,也都可以总结出比较清晰严谨的规律,而对于中间尺度的生命特别是与人的各种现象, 传统的方法并没有那么有效。

薛定谔有远见的提出, 正是这种尺度上的差别, 才能让生命在分子的无序运动中,基于统计形成了某种有序结构。而统计特性要稳定存在, 必须要一定量的基本粒子的支持。 这里有所谓的sqrt(n)律, 对数目n的分子集合, 统计特性的偏差在 sqrt(n)量级,而相对误差是 sqrt(n)/ n  =  1/ sqrt(n) 。 大量的分子存在, 才可以构成某种稳定。 这是为什么生命出现在远大于基本粒子尺度的根本原因。

在随后的讨论中, 薛定谔又指出光讨论统计结论的想法过于简略了, 生物中有很多大于分子而又远小于生命本身的结构。 其中最重要的就是染色体。当时dna的结构还没有被发现,但是有关生物遗传的研究已经了解到了染色体的分裂,复制, 结合, 交换是影响遗传的关键。 特别是对应着生物各种千奇百怪不同的特性, 作为表征基因的概念, 已经被明确的提出来(还不知道基因的载体是什么)。书中仅从生物进化所需要的复杂程度,和初步观察结果, 从逻辑就可以推断出所谓的基因在染色体上应当是多大的结构(当时的推断是不超过几百个原子尺度, 这和后来的基因片段基本相符)

因为基本粒子的随机性,染色体能够非常精确的复制已经是让人惊奇的事实,毕竟可以按照统计和尺度在解释这种稳定性。  而在遗传过程中又存在着突变更加让人奇怪。突变是能够遗传继承的变异。在薛定谔的时代,不知道突变的分子机制,  通过使用x射线照射麦种, 通过改变射线强度观察对麦种性态改变的统计规律, 书中估算出引起突变的尺度“不超过10个原子距离” , 今天知道这个猜想也是正确的,对应着一对碱基。

薛定谔认为导致遗传物质的稳定性和突变现象两种矛盾同时存在就不能依靠传统的统计物理了。 合理解释应当是统计叠加量子效应,因为量子不连续, 存在着量子跃迁。因此由不同能级的原子可能构成不同稳定形态的分子。而分子的稳定性又和温度相关, 由量子效应可以导致非常复杂的化学变化。 这种提法在今天看来也对也不对, 从量子效应特别是电子能级影响任何分子化学键的角度来说, 量子效应在分子化学中起着基本作用。然而主要的生物化学反应比如三羟酸循环类似一种冷燃烧, 与一般化学反应没有什么不同,这里不需要考虑量子效应。而一些特定反应, 比如自由基, 荧光性, 或者叶绿素的光合作用,量子效应起着核心作用。 另外一个引起广泛争议的话题是量子效应是否与意识相关, 按照薛定谔有关尺度的讨论, 个人倾向于比较保守的看法,意识仍然是电化学反应, 而不是直接利用量子的不确定性。

在讨论过遗传物质可能的尺度和工作机制后。 薛定谔突出的强调了遗传物质的非周期性, 也就是所谓编码, 这在今天差不多已经是常识了。 而在成书的时刻,还只是一种假说, 因此书里小心翼翼的从各种层面, 量子效应, 统计特性, x射线的诱发突变率来反复讨论是否存在类似编码的东西, 这是涉及到具体的科学理论时应有的态度。 理论和逻辑推出的东西, 总需要事实验证, 再没有经过明确检验之前,应尽量小心。 而对应理论的实验,在现代科学中通常涉及到非常高端的技术, 专业领域的大量知识,和辛苦的重复试验过程收集数据。这是科学和民科的关键区别。 所谓造谣一张嘴,辟谣跑断腿。 科学工作者工作很辛苦,但往往拙于把自己的工作对等的呈现出来。给爱耍嘴皮子的民科留下了大量空间。 于是世间总有各路科学“骗子”, 对普通人来说, 又极难分辨。

遗传和生命过程的“有序”,在书中引发了更一般的思考: 这种有序是如何出现的?因为热力学第二定律的存在, 孤立系统总是趋向于所谓热平衡的无序状态,为解决这个问题, 薛定谔观察到生命体的新陈代谢, 所谓以负熵为生, 通过从外界获取能量来维系自身的有序。 这应当说是这本书中遗传编码思想之外另一重大贡献。 配合所谓负熵的概念, 达尔文提出的生存竞争可以被最大流原理来解释。 在生物进化中, 能够最高效率利用负熵的种群胜出。 这个原理直到今天人类社会都是成立的。 谁能消耗最多负熵或者能量, 谁就是进化出来的高级形态。 站在全局来看, 其实没有违反热力学第二定律。生命的存在局部有序竞争, 会加快整体达到热平衡的过程。 如果把平衡定义为死的话,生也是死的一部分。

更进一步的解释中, 薛定谔认为无序中产生有序需要在现有的物理规律基础上定义出新的原理才能更加清晰的给出有序产生的条件和发展过程模型。 薛定谔已经意识到了生命的存在远离平衡态, 他把这个归结为动力学。并且举例说明一个时钟变冷时还是能工作的,而受热就融化了。 类似的思路应当启发了普利高津等人后来提出的耗散结构。

在有关生命讨论的最后, 薛定谔认为生命应当不受所谓量子测不准的影响,“ 就算不是拉普拉斯决定论,也是统计意义上决定论的”。 这大概是作为一个物理学家的唯物倾向。 合编在书后一部分的意识和物质相关章节中有进一步的讨论。 这里就不展开了。

薛定谔的自传中提到他曾经非常沉迷于植物学,特别是达尔文的物种起源, 这也是他作为一个进化论的支持者能够洞见到遗传选择和远离平衡的负熵代谢这两大构成生命的关键机制的一个原因。而更重要的则是他作为物理学家的科学思辨过程, 大胆假设, 小心求证。 对应到生命的过程, 在今天还没有一个完整的科学理论, 仍有各种各样的伪科学流传。掌握思路,才能辨析真伪, 这是再次复习这本科普著作的现实意义。

如果给以上冗长的文章做一个总结的话, 掌握科学方法论不仅对科学研究,而且对现实生活存在重要的指导意义。这一目标不能通过看完一篇文章就达成,十篇,一百篇也不行,  需要持久的修炼。

 

 

 

 

 

科学是什么

最近一段时间因为是暑假,很多在欧在美的同学都回国探亲,陆陆续续参加了好几次同学聚会。承蒙同学们抬爱,都提到了这个我在写的公号。大家纷纷表示最近写的文章越来越看不懂。一帮留美理工科硕博都说看不懂, 也难怪微信后台的阅读数连创新低。其实本公号文章写了一年,文章五花八门,大多随性而至。一直没有什么特别的主题,虽然作者专业正是当前大火的人工智能,而所写文章提到人工智能的却越来越少。实在是十分偏执,不可理喻。姑且就这样任性下去吧。今天谈谈科学和所谓科学精神。笔者自以为这种固执,偏执其实是科学精神的一部分。

科学是什么, 是一个非常大的话题。 特别是在当下的中国, 谈到科学, 不能简单的归结为在实验室里做研究,所谓穿着白大褂的科学家们的工作内容。科学已经紧密的和思想,信仰,文化,甚至政治联系了在一起。

一百多年前中国传统社会被西方从天下共主的幻想中痛击出局。 一开始的表象是输给了西方的坚船利炮,随后有人意识到坚船利炮可以买,然而背后隐藏所谓技术和科学原理得之不易。再后来就有了所谓德先生和赛先生。 而最后在中国赢得统治的是赛先生基础上推导出的德先生,也即最广泛的德先生M主义。这个说法看上去很奇怪,其实M主义本身是最讲科学的, 非常强调科学精神和推导过程, 在自然科学的基础上推导社会科学,也就会本着人定胜天的精神把人工控制推广到经济领域。只是建立在十九世纪的唯物机械决定论的思维方式过度自信, 没有意识到社会领域的内在机制其实是二十世纪才发现的复杂系统。机械论的思想和管理方式因为不适应复杂而最终失败,甚至造成了很多悲剧。 有人就此走到了反面,其实沿着二十一世纪的最新科学进展,在加入了强大计算能力和对复杂的理解之后,未来靠计算管理社会未必不可能。也许计算社会才是M主义的自然延续和未来图景。当然很多人可能不同意这个看法,就当是一孔之见吧。

回到科学本身,通常的解释是科学来源于西方古希腊时代的哲学思辨, 特别是毕达哥拉斯学派,在发现了毕达哥拉斯定理等数学的奥秘之后,把数学中的抽象表示和内在逻辑一致性拔高到神圣的地位,利用数学来解释世界。在毕达哥拉斯学派看来, 世界应当是稳定和永恒的, 可以用数学来精确描述。 按照当时的数学知识,就是能够用整数和分数来表示。如果出现了整数不能表述的东西, 破坏了世界的完美, 将是不可原谅的。于是发现了根号2不能被分数表示的毕达哥拉斯的学生希帕索斯, 被绑起来扔进了大海。 这个史上科学的第一个牺牲品说明, 宣扬理性和神圣的人,其实很容易被情感操控。

古希腊或者说地中海在科学思想上取得了很高的成就, 然而并不能阻止他们败于蛮族和后来的上帝信仰。 所谓原始的科学, 在一开始并没有表现出很强的战斗力。我们儿时熟知的阿基米德故事里阿基米德虽然发明了很多战斗机械, 但是最终难逃罗马士兵的刀枪。地中海早期的科学终结为黑暗的中世纪。

按照西方的通用说法,经过了乏味一千年, 文艺复兴终于来临, 日心说取代地心说是一个标志, 科学终于突破了宗教的禁锢。 后来又引发了工业革命, 推进了资本主义,于是西方之外其余世界中从野蛮人到大大小小文明古国全都遭了殃。 其中借助的力量之一就是科学。

在机器文明数学本质这本书里, 作者认为, 古代科学没有形成战斗力的主要原因是没有火药。 在没有火药代表的可利用化学能量之前, 打仗比拼主要看谁人多, 对人的控制和管理更好, 这时科学技术比拼不过个人素质。 而在火药发明之后, 战争的输赢取决于谁能更好的控制和使用火药代表的化学能量, 其中最典型的就是大炮, 从大炮的加工制造到炮弹轨迹的计算,都需要科学的参与和推动。

于是所谓文艺复兴中科学和古典科学的的区别, 就是从静态的几何和力学(历法,建筑,测量使用),  转变为动态的分析(研究炮弹的轨迹, 各种化学燃烧动力),最后导致了增量分析方法-微积分的出现。 从而一举奠定了在已知世界中的领先地位。

科学一旦突破了人力的束缚, 就开始了自我驱动的过程。在18和19世纪, 科学经历了伟大的长征。在这一阶段, 所谓科学研究方法:客观调查, 实验研究, 逻辑推理结合起来解决了一个又一个难题。并且在社会中赢得了极高的信任。 最有代表性的就是所谓拉普拉斯论断:如果知道宇宙中所有粒子的位置和速度,并且有足够的算力, 就可以预知未来。19世纪末从物理到数学普遍存在着乐观情绪,认为科学的大厦即将建成。这个乐观也当然影响了M主义。

随后的故事众所周知, 量子理论和不确定性出现了, 哥德尔不完备定理也表明不存在完美的数学大厦。对世界的科学理解又从决定论中退回,变成了由偶然主导的理论并且确知不能完美。

当下对科学的认识,比较广泛接受的观点是科学是通过实证研究不断拓展认识的边界。当前的科学理解并不一定绝对正确,都有一定的使用范围,在适用范围之外, 特别涉及到极大,极小或者复杂, 未知多于已知。

纵使如此, 从事科学研究的人普遍存在的信念仍然是,构成宇宙的秩序是可以被理解的,也就是可以被数学描述和进行逻辑推断的。 同时这个描述是脱离人的主观意愿的客观存在。这中信念,可能就是开篇提到的偏执部分, 无此坚定信念,就难以克服科学发现过程中的种种疑难。

总结一下, 科学建立在实验的基础上, 现有的科学和认识有边界条件和应用范围, 时刻可能出现各种矛盾, 而矛盾之处正是拓展边界的机会。 例如量子力学理论和相对论的矛盾正是当前物理的攻坚之处。

利用科学和计算, 人类控制和利用了远远超出人力范围的能量,这是近几百年来西方领先的基础。 经过几十年的追赶,东方终于慢慢赶上。 对未来的争夺可能会进体现在计算所代表的智能上。 究竟胜负如何,不是一个简单问题, 是传统思维人多力量大,还是科学致胜,仍不可知。路径也许左右成败,当慎之又慎。

 

 

睡眠与梦

八月的帝都,似乎已经告别了桑拿模式。 虽然中午阳光之下仍然烧烤,只要太阳落山,温度就会迅速下降,如果再有点小风,就如同吹着空调, 令人十分惬意。 如此天气,睡的也比其他季节多些。想起之前心理学系列里面有个欠账,就是有关梦的话题,今天借机写一篇。有关梦的理解,因为事关对大脑思维模式的研究,还在不断进展中,至今不能说有结论。 今后有什么新的理解或者纠正, 可以再谈。

要说梦, 先得说睡眠。 睡觉这件事情看起来是如此的简单和平凡,如果不是因为失眠或者做噩梦,日常生活中基本不会想起它。然而只要原因粗粗思考过,一个高等生物居然有很长时间失去意识,失去对自己行为的控制, 当然也失去防卫能力。付出了如此之高的代价, 必然是因为要换取什么, 才能被自然选择出来。

请注意, 这里对睡眠的定义,是部分丧失行为控制, 反应下降,肌肉放松的特定状态。 严格意义下只针对鸟和哺乳动物这类高等生物。 爬行动物,鱼类,甚至昆虫,比如说苍蝇,都有活跃状态和深度休息状态转换的周期。但是因为神经系统相对简单,也不会涉及到做梦,不在讨论之列。

为什么高等动物包括人要睡觉?很不幸,这个问题至今没有被广泛接受的结论。从苍蝇之类的低等生物也会有类似睡觉的休息周期来看,一种看法是认为这是生物为了节约能量消耗的所进化出的一个周期机制。 生物活跃一阵之后进入一个休息态,通常也伴有体温降低,可以降低不必要的新陈代谢消耗。同时集中收集代谢废物,恢复平衡,能够帮助在活跃时提升运转效率。 高等生物因为这个周期的存在, 给休息的状态赋予了更多的内容。 特别是对于人, 睡觉明显和人的意识活动特别是记忆有紧密的关系。

如同数学上如果找不到构造证明可以使用反证法类似, 研究睡眠对动物和人的作用如果没法正面推演,也可以采用反证法,剥夺睡眠,看看会发生什么。一个著名的剥夺睡眠实验是1989年对老鼠做的。 如图所示,两只老鼠对照,监控老鼠的脑电,一旦发现其中一只要睡觉,就让转轮转动,强迫老鼠走动。结果是一开始老鼠吃得越来越多,体重却越来越轻(能量消耗加大),随后开始体温紊乱, 最后就死了(对照老鼠还活着). 这样这个实验就说明睡眠的功能应该包括: 减少能量代谢, 维持体温平衡等功效。

与老鼠实验类似,也可以通过睡眠剥夺实验来研究人,不过对人显然不能象对老鼠这么过火。如果让人不睡觉或者少睡觉,能观察到的有注意力下降,记忆衰退,情绪失控甚至免疫力大幅下降导致生病等现象,这跟老鼠是类似的。

但同时人的问题又比老鼠复杂多了。 日常生活中不同人所需要的睡眠时间就不一样。有些人睡的很少。 甚至有完全不睡觉的人,2006年有报告,一个出生在1942年的越南人Thai Ngoc, 31岁时因为一场发烧,到报道时为止33年没有睡觉。 在美国海军睡眠实验室曾经做过的剥夺睡眠实验里, 1964年一个17岁的高中生Randy Gardner曾经连续11天完全清醒,这段时间内,他只是偶尔恶心,记忆失误。实验结束后, Randy连续睡了14个小时就恢复了正常。 后来的剥夺睡眠发现,这些长期保持清醒的人会有短至数秒种的入睡状态,而本人完全没有记忆, 如果研究者不注意也会忽略。

睡眠看起来是有必要, 但需要睡那么多吗?一些最新的研究里, 比如Jeff Lliff 2014年的TED演讲里说, 大脑是个高耗能的器官以相当2%全身体重的重量, 却要消耗全身能量的20~30%。大脑所需营养靠血液输送,而代谢废物则收集在脑脊髓液里, 可以想象这是一个大水池,收集各种废物最后随着淋巴系统和静脉流掉。 研究证明,睡眠就好比拧开阀门加速排泄废物。睡觉是脑内神经细胞的间隙更大,加速脑脊髓液流动,就好比给神经细胞洗个澡,把脏东西都洗掉。洗澡要洗干净需要时间,这个时间正好是8小时。

粗粗梳理了一下睡眠, 就可以说到梦了。人们关注梦的原因之一是因为其中包含有非常激动人心的部分:创造和灵感。历史上很多名人回忆和口述史里都说曾经做出的科学发现和艺术创作是在梦里完成的。其中最著名的是发现苯环结构的德国化学家柯库勒Kekule声称梦到的衔尾蛇。类似的名人故事还有,英国诗人柯立芝的诗作忽必烈,俄罗斯作曲家斯特拉文斯基的八电奏作品,保罗麦卡特尼的yesterday曲调等等。 达利以梦为主题的一系列绘画更是把梦作为20世纪象征艺术的标志物之一。

为什么做梦会产生灵感, 一种解释是和大脑在做梦时的状态相关, 做梦时大脑并不是整体在休息。在做梦阶段,也就是快速眼动阶段REM(rapid eye movement) 与记忆形成相关的部位,海马回和关联的新皮层都相当的活跃。在这个时候,传统的意识决策区在休息,正因为没有意识区的控制和引导,反倒容易形成一些“弱”联结。这些弱联结可能大部分是天马行空不靠谱的胡思乱想,而其中也许包含着一星半点真金,如果能留存下来, 就就是所谓灵感。换句话说, 清醒状态下意识和思维加工过程是深度导向逻辑和推理的, 而做梦时大体上是在一个宽度导向的状态, 更容易产生所谓创造和创新。灵感本质上还是试错和筛选,如果没有平时的积累,和正确的思维结构, 光凭碰运气,那概率可以低到没有。 更进一步, 就算有了灵感,也要经过深度加工才能成为作品。没有这个加工的能力, 普通人靠随机游走能做出伟大创作的可能性为零。

回到对梦的解释上, 历史上有各种不同的看法,最早期的神秘主义,宗教,和今天大部分将信将疑的,都是把梦解释为预期,未来即将发生事情的预兆。在很多宗教的早期阶段里,梦是沟通神灵的主要渠道之一。比如圣经旧约里就提到过很多梦,其中最著名的就是雅各的7头牛对应丰年和荒年的梦了。在基督教较晚期,对梦的态度曾经有180度转变,比如中世纪的宗教法庭和新教改革的马丁路德都认为梦是魔鬼的诱惑,代表罪恶,因为凡人的梦不应该代表上帝的预示,这样岂不是抢夺了教会的权力。

与之相对的,自古就有朴素的哲学思想。比如在亚里士多德看来,梦是身体状况的反应,医生可以根据梦来诊断疾病。古罗马人阿提米德罗的大作“详梦术”中,也主张做梦者的职业,社会地位,健康状态都对梦有所影响。

文艺复兴之后的欧洲,研究过梦的著名人物包括号称研究过三千个梦的法国医生毛利(Ailed Maury)和最早提出解释态度的费雪(Johann Fichte)和他的追随着谢林(Friedrich Schelling)等人。直到弗洛伊德大夫的梦的解析,可以说是奠定了当代科学释梦的基础。 有关弗洛伊德大夫的观点,在心理学系列里曾经写过,就不在重复了。 需要特别说明的是, 弗大夫可能因为所处的环境,固执的把一切关联到性,或者力比多,今天已经很少有人这么理解。

弗大夫的学生,后来因为观点相作和他分道扬镳的荣格,提出的观点更为今天大多数学者接受。在荣格看来, 梦不是性,或者只是性或者隐藏欲望的表达。梦是内心深度的深沉愿望或者渴望,或者说是潜意识野心的暴露。 也是自我传达给自我的重要信息。荣格于弗大夫不同之处,除了指出非单一来源之外,还有所谓集体潜意识,也就是文化直至全人类在个体内心深处留有的共同象征。 荣格之后的大多数心理学家都认为,梦不过是生活的另一面,是在记忆形成和丢弃过程中外溢的经验和情绪。格式塔学派则认为梦是代表心中愿望的若干元素结合而成的一种结构。

对于不同的理解,心理学家乌尔曼(Montague Ullman)曾经有个很好的比喻:弗洛伊德的方法好像是蒸汽壶,荣格则是旋转的镜子, 格式塔学派则是填补坑洞的人。

既然梦是反应内心的窗口。适度研究一下梦,应当可以提升对自我的认知。有很多常见的梦,特别是重复出现的梦, 能够很好的揭示人的内心状态。甚至做梦的本人并没有自觉意识到。 比如人在面临压力和重大决策事,经常会做梦回到学校。从已经经历过的考试和毕业中寻得安慰。梦见躺在水里, 通常是和感情问题相关。 而追逐之梦则来源于不安全感。

大部分梦在醒来以后都忘记了,能让人记忆犹新的, 噩梦是其中之一, 每个人应当都有做梦被吓醒的经历吧。对于噩梦,有一派学者认为是对危险情况如何处置的预演,一个人每年大约要坐300-1000次噩梦。如果同意这个学说,为了更好的应对危险,代价不小。

从神经生理学的角度, 目前对梦的成因虽然没有一致结论, 但相对比较普遍接受的观点是梦是在长期记忆清理和形成过程中所释放出来的一些偶尔进入意识并被捕捉到的片段,意识把这一些片段进一步计算生成完整的感观感受的综合。越接近做梦当天的经历和记忆对形成梦的作用可能性就越大。 一些研究结果认为,这个刺激影响以最近6-7天为限。当然这只是说梦的形成, 梦的内容涉及长期记忆,不以这些刺激的时间为限。

进一步的生理学研究认为, 快速眼动阶段的梦, 是由桥脑的活化来启动,与意识有关的大脑网络受刺激而活化,因为刺激来源是随机,封闭的由桥脑产生,缺乏清醒状态的意识整合,此时的梦通常光怪陆离, 不合逻辑, 而非快速眼动阶段也有做梦,但梦比较平淡且符合逻辑。 如果一个人的桥脑受损, 也会有梦,就是这些相对平淡的梦。而如果负责躯体感觉整合的顶叶受损的话, 就不会再做梦了。

最近(2004)的一些研究提出, 快速眼动阶段主要是程序化记忆的生成,而非快速眼动阶段负责陈述式记忆的生成, 这也符合两种不同梦各自的特点。快速眼动阶段,脑的无意识部分在形成程序性记忆, 意识部分特别是感官整合区域与外界感官联系的通路被阻断而处于休息态。 此时形成记忆的脉冲如果偶尔“错误”触发意识,意识会开始解释功能,把这个信号,解释为一段经历,也就是梦。而另一个记忆脉冲会触发另外一段梦境。梦经常是支离破碎的。

一个有意思的现象是,如果此时有外界的刺激, 在达不到惊醒的程度时,也可能会刺激到意识,成为梦的一部分。 如果你碰巧遇到说梦话的, 可以尝试跟他对话。 通常他会回答。

从睡眠和记忆的关系。站在神经网络的角度来理解, 可以认为睡眠是大脑神经网络集中学习训练的时间。因为睡觉时不需要做inference推断。 所以可以集中凋参。而记忆正是在网络训练过程中生成的新参数和新结构。

文章写到现在已经太长了。 梦令人不解和神秘之处还有许多,一篇小文业只能是管中窥豹大略谈谈。从梦,到意识,到思维,其实是一个研究大脑工作状态窗口。 今天的人工智能主要还是靠数学驱动,基本都不是模仿生物智能。 能否从生物中得到一点借鉴,比如做出会要睡觉会做梦的深度神经网络,也许还是相当遥远的事情吧。

 

数学的天空

​最近这几天在读一本奇书, 书名叫做机器文明数学本质。 作者试图在书里面回答著名的李约瑟问题, 问什么中国古代文明没有发展出西方现代科技。 为此这本书包含三章, 第一章是西方科技史,第二章是东方思想史,第三章展望未来。虽然只有三章, 作者洋洋洒洒写了900多页, 其中包含各种书摘和五花八门的史料。 作者涉猎之广,令人叹为观止。这本书可能讨论的问题太深刻, 应者了了, 各大网站包括豆瓣都没有书评, 甚至没有短评。 其实作者的思路由浅入深,最后结论总结为书名:西方在最近两三百年的竞争中胜出, 而中国没有发展出同样竞争力的科技,归根结底是因为西方思想包含数学本质,并由此可以利用机器,利用超越人力的能量,发展出了机器文明。沿着这边书的思路, 今天用一篇小文来回顾一下数学的天空中,曾经闪耀的众星。

要讲数学, 先要说明数学是什么,最简单的回答:数学是抽象。 进一步解释就是把现实世界中的实体和关系抽象成概念和表示, 并且在概念和表示之上用逻辑建立联系。 整部数学发展的历史, 就是一部创造概念和表示的历史。

人类社会的原始时代, 最先有的是数的概念。早期与数字相联系的最重要概念就是天文和时间。 在原始社会,天文是少数人的权力。而随后伴随着商品交换的发生和发展, 刺激了四则运算的需求, 数字的概念得到了普及。  与此同时为了测量土地面积, 搭建房屋,发展出了图形之上的几何。

数字和图形的研究构成了早期数学的全部。 其中最关键的是数字的表示。 不同数字的表示方式, 严重影响运算的效率。 中国古代在数字表示上曾经使用过算筹, 立杆为个位数,横杆的多少为十,百,千, 这样的表示在效率上曾经大大优于古埃及-希腊-罗马数字。 然而具体到文字书写, 又放弃了这一体系。众所周知,今天我们从小学习的数字叫阿拉伯数字, 更精确的讲, 是印度-阿拉伯数字。 主要是源于印度的书写符号,特别是零, 最后在阿拉伯定型。印度古代在数学上也有不小的成就, 从婆罗摩笈多到Madhava, 从负数到无限。 印度数字在抽象概念上比中国古代跑的更远。

而关于几何, 最重要的早期定律当然是勾股定理, 也就是毕达哥拉斯定理。这个定理的表现形式, 尤其凸显东西方的数学区别, 西方侧重于抽象和逻辑, 毕达哥拉斯本人据此创立了学派, 认为研究数字的奥秘可以接触到神或者真理。而在中国, 是勾三股四弦五。 是一种用于实际的计算技巧。 中国的古代数学成就,从鸡兔同笼,韩信点兵,解方程的消去法到中国剩余定理, 都是快速计算技巧, 也就是算法,而不是从公理到定理的抽象逻辑思辨。这是东西方思维方式一开始就不同的地方。 中国古代数学也包含神秘化的成分,比如从河图洛书到八卦, 幻方和阴阳被中国古人当作是自然的秩序,赋予了崇高的含义。

古代数学里最卓越的成绩当然是几何原本, 欧几里得从一般公理出发, 用逻辑手段构建了几何的大厦。直到今天, 小孩子们上学学习的几何与两千年前没有什么变化, 也有一种说法, 是我们其实不知道欧几里得的原文, 现在看到的欧几里得几何原本主要是来源于阿拉伯的转译, 其中的评论部分, 甚至包括部分定理, 都有可能是阿拉伯人的贡献。

在西方数学历史上有一个承前启后的人是意大利的斐波那契。斐波那契本人对数学没有做出太多创见, 只是提出了所谓斐波那契数列。他最大的成就就是从阿拉伯人哪里学习了数学。在早年游历四方后,他回到了意大利, 把阿拉伯数字介绍给西方, 写出了算经等著作,系统的介绍了阿拉伯继承的数学成就, 并以此引领了此后西方的数学启蒙。

古代东方,古希腊,阿拉伯那个的成就大?那家对后来的数学贡献更多? 是打不完的口水仗。事关民族尊严, 可能会一直吵下去。 把这些纠纷抛开, 数的学问, 早期集中于方程, 和由此基础之上发展出来的代数, 欧洲人在中世纪后半段的神学院里试图恢复中断的希腊文明时, 早期也集中于三次方程求解之类的问题。

在机器文明数学本质这本书里, 作者强调隐含在西方的史料里面, 没有被公开挑明的, 推动数学进展, 特别是从伽利略到牛顿发明的运动定律, 主要原因是因为火药被蒙古人传入了欧洲。 为了研究武器, 特别研究炮弹的运动, 必须研究关于运动的物理和数学计算。于是古代的静态数字和几何,变成了研究运动和动态的学问。而其中最关键的就是微积分的发明, 也就是数学里新开一类的分析方法。微积分的核心思想, 通过微小的增量来研究局部来把握整体性质,正好用来推算大炮的控制和炮弹的轨迹。

有关微积分的发明, 历史上曾有牛顿和莱布尼茨之间的一段公案。 按今天的史料分析, 两个人应当是各自独立发明了微积分。在当年的争执中, 牛顿利用自己的皇家学会会长的身份,压倒了莱布尼茨。 而在随后的历史上, 莱布尼茨因为对微积分的表达更简洁而胜出。 今天我们使用的微积分符号就来源于莱布尼茨。 更细节一点, 牛顿的思路是运动变化的思路, 从微分到积分, 莱布尼茨是从积分到微分。 直到今天,怎么来讲微积分也有两派。

在数学的历史上, 不能忽略的一个最著名的“业余”数学家是法国人费马。 费马比牛顿早出生40年, 两个人的生平没有什么交集。但是牛顿,莱布尼茨以及后来的很多著名数学家都受到了费马的影响。  费马本人是个律师, 数学只是业余爱好。他对早期的数学有全面的贡献, 其中让他特别知名的是很多有关数的问题, 费马大小定理引导了后来数论的研究。 不仅如此, 费马对概率论, 早期微积分思想, 和解析几何都有贡献。 特别是对解析几何, 他从方程,推导轨迹,独立于笛卡尔提出了解析几何的关键思想。 在数学票友里, 费马是空前绝后的一个, 也许只有在他那个时代, 数学的萌芽时期, 才能给出如此之多的贡献吧。

说到几何, 和费马平行提出解析几何, 并且给出更严格数学关系的是用代数方法来表示几何的笛卡尔。 在笛卡尔这里, 代数和几何得到了统一。 笛卡尔更重要的历史作用是作为一个哲学家, 他提出了 一种思辨哲学的方法论。 而他的名言,我思故我在,至今被不断引用。从笛卡尔的解析几何,到牛顿-莱布尼茨的微积分, 东西方数学就此分野。 西方数学从此开始踏上了抽象演化之路。不断有历史上的天才加入推进数学像抽象世界前进的图景。篇幅所限, 后面只是简述其中一条主要的传承路径。

在费马和笛卡尔的基础上发明了微积分的莱布尼茨,有个好朋友来自著名的伯努利家族。这也许是史上唯一数学家族。 通常大数学家的儿子都不是大数学家, 只有伯努利家族例外。

伯努利家族居住在瑞士的巴塞尔, 从十七世纪到十八世纪, 为世界贡献了六位著名的数学家。 除了他们的数学成就之外,他们的另一主要贡献是在欧洲广泛传播以微积分为代表的数学知识,特冰是教导了很多弟子。 其中之一就是欧拉。

欧拉是数学史上最杰出和多产的人之一, 或者没有之一。 欧拉也是出生在巴塞尔的瑞士人。 他早期的主要成就, 是在俄罗斯圣彼得堡做出的, 他在俄罗斯呆了14年, 当年的俄国因为彼得大帝的缘故成立了科学院从事科学研究,然而彼得大帝去世两代以后,科学院就不再受到重视。 欧拉随后受邀来到普鲁士, 居住在柏林,直到自己的生命终点, 死前一刻, 还给出了计算刚刚发现的天王星轨道的思路。 临死一刻, 欧拉说出了, “我死了”的名言, 然后就”停止了生命和计算”。

以欧拉名字命名的欧拉方程可能是数学里最美的公式之一e^(i*Pi) = -1. 把数学上三个著名的表示, e, i, pi 联系在了一起。

在欧拉的时代, 数学和工程特别是军事更紧密的联系起来。 不光是计算炮弹的轨道, 从准备战争, 筹划物资, 到规划运输, 制定战略计划, 以及无处离不开数学。 因为抽象和表示的能力, 可以用于分析, 建立模型, 更重要的是控制, 把庞大的非人力,导向预期的结果。 这是数学的核心能力。

从欧拉开始, 欧洲数学的中心一直在德国。 欧拉之后,下一个数学巨人就是高斯。 高斯的数学成就毋庸赘述, 他对数学的贡献不光是个人的贡献, 他本人就是欧洲数学的枢纽。 年轻的数学家们,有的聚集在高斯周围,有的离得远,就通过给高斯写信,来验证自己的思想。 这其中有被高斯错误打击的甚至后来疯掉的可怜的匈牙利数学老师鲍耶·雅诺什。 也有高斯的学生, 在他之后终于提出完整非欧几何理论的黎曼。

德国数学在当年引领世界的证明之一,就是在二十世纪初希尔伯特总结提出的二十三个数学问题。 希尔伯特认为通过研究这二十三个问题能够构筑数学大厦。事实上,虽然因为哥德尔的结果, 数学大厦没有建筑成功。 希尔伯特的问题仍然引领了现代数学直到今天。 希尔伯特本人1943年死在德国。 死前他的主要数学伙伴和学生都已经被纳粹赶到了美国, 聚集地之一是普林斯顿。

有关现代数学, 我在春节闲谈-说说思维方式里曾经讲过一些。 数学本身看似抽象, 然而一旦联系实际, 又是控制自然界非人能量的唯一路径。 数学家的贡献, 可以用于造福人类, 也可以用于毁灭人类。 为此在60年代, 法国布尔巴基学派的领军人物之一,代数几何的创立者alexander grothendieck放弃了研究, 去法国南部教书, 变成了和平主义者, 一个晚年的佛教徒(2014年86岁时去世).

在未来的AI时代, 可以想象, 对操控这一更加强大的非人能量,甚至智慧。  数学思维会起到更大的影响和作用。 数学的天空会归于平谈还是更加灿烂, 是令人浮想联翩的未来。

 

 

 

 

说说创造力。

据说,今年帝都的夏天是史上最热。对于我,就是苦也,苦也。热到出门就浑身冒汗, 热到空调下都不觉凉爽, 热到写几个字都浑身发燥。 好吧, 我并不是写不出文章怨气温的人。只是最近热点太多, 层出不穷, 分散注意力。从跑路的贾布斯, 到绝代双骄之唯我独行,到最新的管钱大会,每一件事情想理解都不容易。可惜要想文章能活,不可以写,所以这次说说没毛病的,创造力。

公号写文章有很多套路, 预期反差套路,小城故事套路, 积善得福套路,快速成功套路等等。这几种里快速成功套路里最吸引人,受众最广。而其中常被提及的一条就是创造力。通常此类文章会指出,中国人从小接受的教育就缺乏创造力,而因为缺乏创造力就所以难以成功,所以中国人都难以成功。在这个基本逻辑的前提下,自然能够推导出,要想成功,就得培养创造力。要想有创造力,只要花 5分钟读完这篇文章,就可以帮你习得,然后奔向成功的金光大道云云。什么?没看过,那你可能不是成功人士!

玩笑开完,切入正题。要讨论什么,先得下个定义。创造力是个名词,按照通常的提法即可以指创造性思维,也可以指创新活动。思想和行为两方面都涵盖。创造力总是和“新”也就是前所未有的事物挂钩,同时创造出来的结果应当有价值,或者说对社会有点意义。 以上是相对比较公认的。再往后就没有定论了, 创造力是一个过程还是一种能力?创造力是描述个人的特质, 还是要看结果产出?至今没有定论。因为跟人和社会紧密联系,主要靠一帮心理学家在捣鼓,有个叫创造心理学的心理学分支。所以稀里糊涂也是应有之意。含含糊糊竟然不妨碍大家沟通交流,这也是大脑的奇妙之处之一。

功利的说,如果把创造力定义为个人能力,甚至归因到基因和遗传上去,这样文章就没法看了。所以这里还是讨论创造过程,从方法和技巧的层面来谈。回到创造心理学,奠基人之一心理学家沃勒斯G.Wallas提出:创造包括准备、孕育、明朗、证实四个阶段。

理论要称之为科学需要有实验验证。而涉及到创造力的研究很难设计试验,特别是在早期,沃勒斯的年代(1926年提出理论),所谓实验研究就是研究自己,主要靠自省的能力。沃勒斯提出的四个阶段本身也是一个创造的过程。这四个步骤简单明了,而且基本上从字面就可以理解。近一百年后,大家仍然基本同意他的提法。真是天才。

沃勒斯之后,研究创造心理学的大家,有玩格式塔认知过程的海默Wert.heimer,研究智力结构的吉尔福德Guilford(此人在美国心理学家上发表的创造力一文也是经典),Teresa M. Amabile的社会结果导向研究, 以及Arne Dietrich等人最近的认知神经学研究结果等等(The cognitive neuroscience of creativity,2004)。因为没有公论,一篇短文也不是学术文章,这里不再详解。感兴趣的请自行搜索。

含糊的定义之后, 大家就要开始研究如何学习,训练和培养创造力了。 而要想控制什么,先要给出测量。学习到底有没有效果,总得有个说法。需求提出,问题确很难解决。创造力本身的定义都很含糊,测量看上去就更是无从下嘴。

解决这个问题本身也是一个创造的过程。Amabile曾经用过自我评价的量表,让人自己给出自己有多少创造力的评估,这听上去似乎不太靠谱,然而心理学的很多研究就是这么做的。另外一类评价手段是考虑到创造力和发散性思维的联系, 通过回答一些发散性的问题,比如给出一个抽象形状的不同解释,靠统计回答的多少来指代创造力。这只能算是差强人意吧。

一个含糊的定义,接着一个不如人意评价手段之后,终于可以研究如何提高创造力了。 这又包括被动和主动两个方面。被动主要是研究环境,包括教育,文化, 组织结构,管理方式对创造力的影响。主动是指个人如何提高创造力,包括培养好奇心,自信,怀疑能力,思维发散行等等。

本文还是主要说说针对个人的主动行为。 之前曾经推荐过一本书,象外行一样思考,象专家一样实践。标题的前一句象外行一样思考就是涉及创造力的。回到沃勒斯的四个阶段:准备阶段,主要是要找到问题, 做相应的知识积累和准备。 没有背景知识的积累和理解的深度, 创造是无从谈起的。 其次是孕育阶段, 大概就是脑子里在想问题, 白天想,晚上想, 出门想,在家想, 吃饭想, 睡觉想, 紧张的想,放松的想。第三步,Eureka, aha 灵机一动,想通了。 第四步, 赶紧去验证, 如果不对, 重复一,二,三。 问题基本都是这么解决的。

整个过程里, 第三步最激动人心,也是大家关注最多的。 第三步到底是怎么来的,有各种理解, 本文的观点,关键在外行两个字上。按照当前认知神经科学的研究,创造力活动几乎涉及整个大脑,特别是边缘系统。 有实验证据表明, 创造力跟多巴胺较高的浓度直接关联。 而创造发生的时刻,大脑通常有多个功能模块同时激活。 换一种说法,在原本不存在的概念联系直接建立联系,需要跳出原本训练成生的局部极小,这需要足够的扰动。不能过于具象,要更全局。而所谓,外行思考,就是指这种保持距离的思维方式。玄之又玄,众妙之门。

以上不是空口无凭, 当今的心理学研究,明确提出了调节心理距离(时间距离、空间距离、社会距离、真实性),能够影响创造力的说法。在社会心理学最近10几年流行所谓解释水平理论(Construal Level Therory,CLT),一个人对认知客体的解释水平,与心理距离相关。越亲密, 越熟悉,解释水平越低, 就更具象, 更细微,也更表面。反之对陌生,无关物和人,解释水平就高,更抽象,更本质,更全局。 高解释水平与高创造力直接关联。

纽约大学教授伯尔曼(Evan Polman)的一系列行为实验表明, 甚至换一个人称代词, 就可以显著影响创造力。 伯尔曼为了研究创造力,做过很多实验。 其中之一是让任务参与者给自己, 给于自己生日在一个月份的人, 和生日无关联的人策划生日活动。最后结果是给陌生人的创意最好,给自己的最差。而另外一个囚犯脱逃实验, 让参与者相信自己从监狱里逃跑, 对比想象是自己要逃跑,还是和帮别人脱逃, 两者给出的方案做创造性评估, 帮助自己显著低于帮助别人。

所以跳出自己, 变成外行或者陌生人, 仅仅做出这种设想, 就可以帮助创造思维。 这大概是创造力的三秒速成班吧。

如果事情都那么简单, 创造力也就不能成为大家谈论的话题了。 别忘了,评价创造力的标准,除了新以外, 还要有价值。 光是奇思妙想,装满一箩筐,也都是无用功。 而想法要有用,还得要积累。 这是一个艰苦的过程,也是讲创造思维成功学的人不愿多讲,通常一嘴带过的东西。

真正有价值的创造力,谈何容易?