《生活大爆炸》中,天才Sheldon提出了一个问题:最棒的数字是几?答案是唯一的。
天文学家Raj答道:“5318008?”
Sheldon解释道:“错误答案。最棒的数字应该是73。这是因为,73是第21个质数,而它反过来说,37是第12个质数,而它再反过来21则是构成73的两个数字,也就是7和3相乘的结果。同时73用二进制表示的结果是1-0-0-1-0-0-1,而它反过来念还是1-0-0-1-0-0-1,两者是一致的。”
看到这里,不得不感叹数字的神秘与纯粹的美感。天才数学家高斯曾说:“数学是科学的女王,而数论是数学的女王。”在数学界,有众多天才投入到数论这一暂时还看不到实用之处的领域,他们的唯一目的就是追求纯粹的数学之美。
数学之美!正如企业家王小川所说:“数学可以和音乐、美术一样,具有美感。康德认为数学式之所以美,在于它的合理性——合理是大脑天生的逻辑演绎系统,人人皆有。因此,当我们讨论数学之美时,不是比喻,不是人为造作,而是真的人性之感受。”
吴军博士的科普著作《数学之美》,深受读者好评,曾获得了国家图书馆第八届文津图书奖和中华优秀出版物提名奖。其实,更准确地说,这是一本介绍如何用数学公式解决计算机、信息技术领域中与人类生活息息相关问题的书籍。在这本书中,你将看到大学时期学习的离散数学中的图论、布尔代数、线性代数中的矩阵运算竟神奇般的分别解决了网络爬虫、搜索引擎和网页排名三大难题。即使是高中时期所学的余弦定理,竟然也被用来解决了计算机对新闻分类的难题。读完之后,不得不感叹数学的魅力,原来我们生活中的一切全都离不开数学。正如近代物理学之父伽利略所说:“数学是上帝描写自然的语言。”
这本书最大的特点有两个。其一,作者在书中介绍了“信息熵”这个概念,用来对信息的量化度量。《数学之美》这本由34个章节组成的书籍,除了个别介绍科学家生平与研究领域、方式的章节,横跨了30多个对细小但极为重要领域的思考,每一章都信息量满满,充满着无数个好点子。因此,绝不用担心这本书的信息量不够多。其二,作者在书中介绍自然语言处理教父马库斯之所以贡献和地位如此之高,并不是源于他自己的直接发明,而是因为马库斯对几乎所有自然语言处理领域都有独到见解,因而为他的博士生弟子指明了正确的研究方向,避免了所谓的“无谓尝试”时间。弟子都是大牛,老师马库斯地位自然不会低。这本科普书有点像马库斯的做法,书中的数学公式与技术细节并不多,更多的内容用来讲述科学家遇到问题后,对问题产生的最本质思考,以及如何运用数学解决问题的思路,其中的创新之处令人赞叹不已、回味无穷。
下面,谈一谈其中的几点感悟。
英语语法学习的思考
20世纪50年代到70年代,科学家试图用计算机算法描述语法规则来处理自然语言的理解问题,结果出乎意料的是,这20年的研究成果近乎为零。
问题出在哪里,我们不是一直通过语法书来学习语言的吗?在18、19世纪,西方语言学家对自然语言的语法规则总结已经非常完善,为何将这些语法规则输入到计算机中却并不能达到很高的准确率呢?
作者在书中给出了解答,有两个原因。一方面是因为用语法规则试图解析所有语句,到最后会出现一些矛盾现象。而为了处理这些矛盾,又必须用大量的算法说明各个语法规则的使用环境,这就会导致代码的成倍增加。另一方面,作者指出即使可以写完涵盖所有自然语言的语法规则,计算机也很难用来解析,这是因为计算机太难处理词义和上下文相关特性的问题。
虽然基于规则的自然语言处理进展不顺,但是相关的争论还是在70年代之后持续了近15年之久。直到到了90年代,更多的研究人员才相信这条路行不通。此时,自然语言处理才完成了由语法规则到统计方式的过渡。
现在,大家更倾向于相信的是:“任何语言都有语法覆盖不到的地方,总会有例外或者一些不确定性的存在。”按照数学语言的说法,那就是语言是无限和开放的集合,因此语法并不具备对语言完备的解编码规则。
回想起自己学习英语的经历,当时也犯了很多错误。学生时期,我非常倾向于用逻辑来理解,尤其是欧几里得《几何原本》中公理化的严密逻辑方式,这给我在理科的学习中带来了巨大帮助。但是,我想当然地认为语法就是英语中的逻辑,掌握好语法就能掌握好英语。
于是,我花了很大力气钻研一本语法书,但总是对书中一些不精确、逻辑矛盾的地方感到困惑,甚至我向多个老师请教,也会有一些解释不同的情况出现。有人认为是固定搭配;有人认为是理解某种底层逻辑,就能很好理解为什么是这样。各有各的说法。
即使是现在,互联网上还有类似的争论。语法书与语法书之间总有一些地方的逻辑不同;课外培训机构鄙视固定搭配,认为英语中没有所谓的固定搭配,那是老师基本功不够,纯靠理解也可以掌握所有词组;而学校的传统教育依然要求学生对词组、句型进行背诵。
吴军博士在书中拿“科学家用语法规则处理自然语言的失败”案例就是对这种现象的一种解释,我没有太多对语言学的深层次理解,不过这个科学案例让我更加倾向于相信下面这个观点:不必太纠结于语法中那些稍有矛盾和不精确的地方,学习英语应该把语法学习和广泛阅读两者相结合,而后者还更加重要一些。
好教育的畅想
吴军博士的《数学之美》这本书在每章开头都提出了很多问题,而这些问题与我们的生活息息相关,能够瞬间激发我们的好奇心与求知欲。
比如:相比于英语这种罗马拼音式语言,汉语的输入法应该如何解决?自然音节编码输入?还是偏旁笔画拆字输入?输入法输入汉字需要同时考虑每个汉字的平均击键次数和寻找这个键所需时间,那么如何平衡二者?如果只考虑平均击键次数,这确实可以缩短输入时间,但是这与我们的思维模式相同吗,是否会有一些阻碍?据说当时有3000多种中文输入法出现,如果要占领市场,你会选择哪种中文编码方式?为什么曾经火爆的五笔输入法,现在几乎全军覆没?
相比于解决问题,好的教育更应该鼓励提出问题。正如互联网上流传的这样一种说法:好的学生善于解决问题,而聪明的学生善于找到重要的问题。
另外,读过吴军博士这本书的读者,很多人都发出了这样一种感叹:读了“数学之美”,才发现大学时学的数学知识竟然如此亲切,比如马尔可夫链、矩阵计算、图论、余弦定理,竟然可以解决这么多信息技术领域的问题。
国外一些网络公开课的结尾总会有很多延伸阅读、推荐阅读的文章,这恰恰可以把学生从独立知识的理解引入到多个层面,大大加强了知识与知识之间的联系。
好的教育本该如此,这本书中的单个章节如果加入到相应的数学章节作为延伸阅读补充,想必会有不一样的效果。
结语
数学不仅有纯粹之美,数学应用依然很美。你觉得呢?