原文:Computer Scientist Tells Mathematicians How To Write Proofs

对比一下下面两个证明哪个更好?

  • 版本一:

  • 版本二:

Leslie Lamport (https://en.wikipedia.org/wiki/Leslie_Lamport) 又在教数学家们如何写证明了。他说在一个小范围调查显示,1/3的出版物(包括经过同行评议, peer reviewed)包含一个错误的定理,有一些是由于证明本身是错的,有些是由于引用了有错的定理。这篇文章认为,17世纪大家都是用文字来写数学证明,冗长又容易出错,如今很难想象没有代数符号的话数学证明将会多么复杂,因此作者认为虽然Lamport的方式不是那么容易接受,但是也许是对的,正如上面的例子,在代数符号被普遍接受之前,同样的证明很长又不易被人们所掌控,而有了代数系统,就简洁明了。

:符号提供了组合抽象的工具,我认为很多概念,由于缺乏有效的可组合抽象工具,导致人们需要用线性的文字去长篇描述,并且还达不到清晰解释的目的。也因此,在没有共识的通用可组合抽象符号系统的领域,如何把思想、概念用线性文字描述清楚,就成为了人们的一项重要技能,一般来说写作者经过长时间的写作训练,可以达到更好的组织效果。但是,从这个角度来看,说明这个方面还不能成长为一门使用上符号系统的学科,想必这可以作为“文科”与“理科”之间的边界。

Lamport在《How to Write a 21st Century Proof》这篇2011年的文章里提出了他认为更好的编写数学证明的方式:
https://www.microsoft.com/en-us/research/uploads/prod/2016/12/How-to-Write-a-21st-Century-Proof.pdf

首先,Lamport认为文字形式的证明,很难看清楚一句话的作用:

  • 是否包含一个新的断言(assert)

    • 如果是,那么文本中描述的事实(fact)是否可以明显看出结论是对的还是错的。
  • 是否使用了上一句话的断言、状态(state)、和事实。

Lamport提出了清晰证明的两个核心要素:

  • 命名(name),对所有的事实(fact)命名,让人一眼看出哪个事实被使用了。
  • 结构化(structure),证明中补充文本(prose,有更好的翻译么)让读者理解此刻正在说明的要点,但是让人难以掌控整个完整的证明逻辑。结构化则可以让这个过程清晰可见。结构化也使得错误消除更容易。

:对这点,我深表赞同,即使只是纯文本方面,适当使用结构化,可以使得重要的逻辑清晰可见。写作课上,写作老师一般也推荐多多使用:list、table、picture,这都是为了突破线性文本(可以看作是array)的局限,在线性文本中,制造结构效果。例如,2-3层的短list就是一个适合经常使用的结构。

Lamport认为自己早期犯的一个错误是提倡证明同时满足下面两点:

  • 使得读者易于理解
  • 更加严密

但是同时做到这两个目标对数学家来说是一个有门槛的事情。Lamport试着把这两个目标分开,通过结构化证明,使得数学家们更容易看到自己的证明是否草率。重要的是要停止17世纪的证明写法。

第二个错误是早期Lamport认为自己懂得最好的证明写法。Lamport基于自己过去20多年写证明的经验,提出结构化的证明写法,并鼓励数学家们发现可以改进的地方,就可以对这种方式做改进。大家不必再像17世纪那样写证明了。

文章中也介绍形式证明,因为作者认为通过形式证明的训练,数学家们可以更好的写通常的证明,从而达到目的。

通过一个例子做对比:

版本一,现在的数学证明常见写法:
译注(2): How to Write a 21st Century Proof-LMLPHP

版本二,使用structure+fact:
译注(2): How to Write a 21st Century Proof-LMLPHP

通过结构化,读者直观的看到了证明中的5个关键步骤以及每个步骤的断言(assert)是如何被前面已经证明过的事实(fact)所证明。并且,通过结构化证明,可以看到第1步并不是显而易见的,第1步需要读者自己做推导(数学证明里到处都是这类“显而易见”,但是需要读者自己发现并get到“此处隐含着一个点,你自己推导一下”。Lamport认为至少可以通过在第5个步骤的地方展开并显式的表达这个洞:
译注(2): How to Write a 21st Century Proof-LMLPHP

但是这还不够,在结构化证明里,可以进一步改进步骤1和步骤5,结果如下:
译注(2): How to Write a 21st Century Proof-LMLPHP

最后的证明步骤比原来的方式有了巨大的提升。

:这个过程,对于程序员来说是很好理解的,结构化编程就是这种思想的典型体现。以及,在给程序编写注释的时候,结构化的注释也往往更清晰。例如:
译注(2): How to Write a 21st Century Proof-LMLPHP

你会问说,细化到怎样的粒度才可以?比如1.1和1.2是否还需要细化?这取决于你的读者,如果是针对初学者,则需要以初学者的视角来写。如果是给你自己的,那么,只要你觉的有一点点可能一个地方可能会有不正确的地方,你就应该细化它。避免错误的做法,就是你应该对你的所有定理都100%确认它是对的,你应该无情的怀疑可能发生的错误。

:在程序的代码中,这一点也是类似的,你应当无情的对绝对不应该发生的条件做断言。这个注释也说明了目前数学和程序的区别之一是,程序是可以执行的,同样的断言,在程序里面会直接造成崩溃,而数学证明里的断言,目前还是靠人来做peer-review。除非,你选择使用形式证明的方式去断言。

观察步骤2,它依然是文本形式的证明,每一点都需要补充细节才能知道是否是正确的。传统的数学证明方式,将会引入一堆的引理,引理多起来就把你淹没在细节之中,你看不到证明的完整轮廓。看看结构化证明的方式:
译注(2): How to Write a 21st Century Proof-LMLPHP

未来的阅读会越来越多的使用超文本(Hypertext)的方式展示数学证明,随着VR等现代技术的进步,也许还会有更新的方式展示。使用超文本的方式展示结构化的证明,证明甚至可以展开到那些基本的公理。则读者可以根据自己的需要展开到足够的层级去阅读,以确保自己100%理解和验证了证明的正确性。

接下来的一节,Lamport简单介绍了形式验证系统TLA+的内容,这部分就跳过了,可以在TLA+的网站上( http://lamport.azurewebsites.net/tla/tla.html )进一步学习,按Lamport的说法,现在的数学虽然还不能直接达到用这种严格的形式验证系统证明,但是接受形式验证系统的训练,则可以训练数学家们更好的写无错的结构化证明。

最后,Lamport自己是一个计算机科学家,但是接受的是数学教育,在并发算法的研究中,发现了结构化证明的方式。在并发算法里面,一个集合是否非空,都会导致算法里有无数的BUG,证明算法的正确性十分复杂和琐碎,使用传统的数学证明方式,Lamport发现自己很难确认是否忘记了一个某个细节的验证。计算机科学家掌控复杂性的方式之一就是层次结构,这使得层次结构证明是一个自然的对传统数学证明方式的升级。作者从1991年发表并发算法的论文开始,大部分论文都是以结构化的方式证明的。Lamport用这种方式重新发现了一个Schröder–Bernstein定理的证明错误。有一个数学家发邮件给Lamport说他用结构化证明的方式发现不了自己论文里的错误,Lamport让他把证明发过来,结果这个数学家回邮件说他发现他在把手写的证明打下来(电子化)的过程中发现里错误!可见消灭错误需要十分小心。

作为对比,Lamport这些年的论文都是这么写的,读者们很少问他写法的问题,结构化的写法清晰,使得读者直接关注证明的内容,而不会在形式上有疑问。这进一步说明了大量采用这种证明写法是可行的。把在线论文的结构化形式证明作为Appendix,期刊的编辑找审稿人阅读,收到正面的反馈:

针对结构化证明,其他数学家们提出的典型问题(FAQ):

  • 结构化证明是否太复杂了,Lamport的证明PPT常常要翻好几页?Lamport回答说,看上去简短的证明,实际上漏洞百出,而结构化证明则能消灭错误。证明之所以为证明,是要消除错误的。

  • 结构化证明没有解释为什么这样证明?Lamport回答说,证明的结构和为什么能证明是两件事,能任意添加结构的证明方式更有能力(表达力)解释为什么证明能工作。

  • 结构化证明不是伟大的文学?Lamport回答说,证明不是文学,证明是数学,证明应该首先为清晰无错服务,而不是文学。

最后,Lamport再次无情的做了对比:

版本一,“文学的方式”:

版本二,数学的方式:
译注(2): How to Write a 21st Century Proof-LMLPHP

Lamport说,数学家们应该用21世纪的方式写证明。

--end--

05-11 13:42