算法语言Scheme修订6报告 R6RS简体中文翻译
来源 https://r6rs.mrliu.org/
MICHAEL SPERBERR. KENT DYBVIG, MATTHEW FLATT, ANTON VAN STRAATEN(编辑)RICHARD KELSEY, WILLIAM CLINGER, JONATHAN REES(编辑,算法语言Scheme修订5报告)ROBERT BRUCE FINDLER, JACOB MATTHEWS(作者,形式语义)
2007年09月26日
最后修改于2017年04月29日
摘要
报告给出了程序设计语言Scheme的定义性描述。Scheme是由Guy Lewis Steele Jr.和Gerald Jay Sussman设计的具有静态作用域和严格尾递归特性的Lisp程序设计语言的方言。它的设计目的是以异常清晰,语义简明和较少表达方式的方法来组合表达式。包括函数(functional)式,命令(imperative)式和消息传递(message passing)式风格在内的绝大多数程序设计模式都可以用Scheme方便地表述。
和本报告一起的还有一个描述标准库的报告1;用描述符“库的第多少小节(library section)”或“库的第多少章(library chapter)”来识别此文档的引用。和它一起的还有一个包含非规范性附录的报告2。第四次报告在语言和库的许多方面阐述了历史背景和基本原理3。
上面列到的人不是这篇报告文字的唯一作者。多年来,下面这些人也参与到Scheme语言设计的讨论中,我们也将他们列为之前报告的作者:
Hal Abelson,Norman Adams,David Bartley,Gary Brooks,William Clinger,R. Kent Dybvig,Daniel Friedman,Robert Halstead,Chris Hanson,Christopher Haynes,Eugene Kohlbecker,Don Oxley,Kent Pitman,Jonathan Rees,Guillermo Rozas,Guy L. Steele Jr.,Gerald Jay Sussman和Mitchell Wand。
为了突出最近的贡献,他们没有被列为本篇报告的作者。然而,他们的贡献和服务应被确认。
我们认为这篇报告属于整个Scheme社区,并且我们授权任何人复制它的全部或部分。我们尤其鼓励Scheme的实现者使用本报告作为手册或其它文档的起点,必要时也可以对它进行修改。
目录
- 摘要
- 目录
- 概述
- 语言描述
- 1. Scheme概论
- 2. 需求等级
- 3. 数字(Numbers)
- 4. 词汇语法(Lexical syntax)和数据语法(datum syntax)
- 5. 语义概念
- 6. 条目格式(Entry format)
- 7. 库
- 8. 顶层程序
- 9. 基本语法
- 10. 扩展过程
- 11. 基本库
- 附录
- 附录A. 形式语义
- 附录B. 衍生形式的定义示例
- 附录C. 附加材料
- 附录D. 示例
- 附录E. 语言的变化
- 参考文献
概述
程序设计语言的设计不应该是特征的堆砌,而应消除那些需要依赖于多余特征的弱点和局限。Scheme语言证明,极少的表达式构造规则和不加限制的表达式复合方式可以构造出实用而高效的程序设计语言,其灵活性足以支持今天的大部分主流编程模型。
Scheme是最早的像在lambda演算里一样提供了第一级过程的程序设计语言之一,并由此在动态类型的语言中提供了有用的静态作用域规则和块结构的特征。在Lisp的主要方言中,Scheme第一次使过程有别于lambda表达式和符号,为所有变量使用单一的词法环境,在确定运算符的位置时采用与确定运算对象位置一样的方式。Scheme完全依赖过程调用来表示迭代,并以此强调,尾递归过程调用在本质上就是传递参数的goto。Scheme是第一种被广泛使用的,采纳第一级逃逸过程(escape procedure)的程序设计语言,通过第一级逃逸过程可以合成所有已知的顺序控制结构。Scheme的后续版本引入了精确和非精确数的概念,这是CommonLisp语言通用算术功能的扩展。最近,Scheme成为了第一种支持卫生宏(hygienic macro)的程序设计语言,该机制允许我们以一种一致和可靠的方式扩展块结构语言的语法。
指导原则
为帮助指导标准化的工作,编辑采纳了如下的一系列原则。正如《算法语言Scheme修订5报告》4定义的Scheme语言,本报告描述的语言致力于:
- 允许程序员互相阅读别人的代码,允许能被任何符合标准的Scheme实现执行的可移植程序的开发;
- 得益于它简单的力量,只有少量有用的核心形式和过程,并且在它们如何组合方面没有不必要的限制;
- 允许程序定义新的过程和新的语法形式;
- 支持以数据的形式呈现程序源代码;
- 使过程调用足够强大以表达任意形式的顺序控制,也允许在不使用全局程序变换的情况下执行非本地控制操作;
- 允许有趣的纯函数式程序无限期运行而不被中断且在有限内存的机器上不会内存不足;
- 允许教育工作者在各个层次用各种教育方法使用本语言去有效地进行编程教学;并
- 允许研究工作者使用这门语言去探索编程语言的设计,实现和语义。
此外,本报告致力于:
- 允许程序员创建和分发大量的程序和库,比如:Scheme要求的在不修改的情况下在各个Scheme实现中运行的实现;
- 通过任意作用域的过程和卫生宏以及允许程序定义卫生弯曲(hygiene-bending)和卫生破坏(hygiene-breaking)的语法抽象和新的独特的数据类型来更全面地支持程序,语法和数据抽象;
- 允许程序员在一定程度上依赖足够确保类型安全的自动的运行时类型和边界检查;且
- 允许实现在不要求程序员使用实现定义的运算符和声明的情况下生成高效的代码。
尽管在《算法语言Scheme修订5报告》表述的Scheme中编写可移植的程序是可能的,且在这篇报告之前也确实有可移植的程序被写出,但是许多Scheme程序是不可移植的,这主要是因为标准库的缺乏和繁多的实现定义的语言扩展。
通常,Scheme应当包含能够编写各种库程序的积木,包括以提高库和用户程序的可移植性(portability)和可读性(readability)为目的的常用的用户层特性,并排除可以在单独库中轻松实现的不常用的特性。
本报告描述的语言同样致力于在不违背上述原则和语言未来发展的情况下尽可能与用《算法语言Scheme修订5报告》表述的Scheme编写的程序反向兼容。
致谢
许多人对本版本的报告做出了有意义的贡献。我们尤其感谢Aziz Ghuloum和André van Tonder贡献的库系统的参考实现。我们感谢Alan Bawden,John Cowan,Sebastian Egner,Aubrey Jaffer,Shiro Kawai,Bradley Lucier和André van Tonder在语言设计上的洞察力。Marc Feeley,Martin Gasbichler,Aubrey Jaffer,Lars T Hansen,Richard Kelsey,Olin Shivers和André van Tonder编写了用于本报告文本直接录入的SRFIs。Marcus Crestani,David Frese,Aziz Ghuloum,Arthur A. Gleckler,Eric Knauel,Jonathan Rees和André van Tonder细致彻底地校对了本报告的早期版本。
我们同样感谢下面这些人对本报告的帮助: Lauri Alanko,Eli Barzilay,Alan Bawden,Brian C. Barnes,Per Bothner,Trent Buck,Thomas Bushnell,Taylor Campbell,Ludovic Courtès,Pascal Costanza,John Cowan,Ray Dillinger,Jed Davis,J.A. “Biep” Durieux,Carl Eastlund,Sebastian Egner,Tom Emerson,Marc Feeley,Matthias Felleisen,Andy Freeman,Ken Friedenbach,Martin Gasbichler,Arthur A. Gleckler,Aziz Ghuloum,Dave Gurnell,Lars T Hansen,Ben Harris,Sven Hartrumpf,Dave Herman,Nils M. Holm,Stanislav Ievlev,James Jackson,Aubrey Jaffer,Shiro Kawai,Alexander Kjeldaas,Eric Knauel,Michael Lenaghan,Felix Klock,Donovan Kolbly,Marcin Kowalczyk,Thomas Lord,Bradley Lucier,Paulo J. Matos,Dan Muresan,Ryan Newton,Jason Orendorff,Erich Rast,Jeff Read,Jonathan Rees,Jorgen Schäfer,Paul Schlie,Manuel Serrano,Olin Shivers,Jonathan Shapiro,Jens Axel Søgaard,Jay Sulzberger,Pinku Surana,Mikael Tillenius,Sam Tobin-Hochstadt,David Van Horn,André van Tonder,Reinder Verlinde,Alan Watson,Andrew Wilcox,Jon Wilson,Lynn Winebarger,Keith Wright和Chongkai Zhu。
我们同样感谢下面这些人对本报告以前版本的帮助: Alan Bawden,Michael Blair,George Carrette,Andy Cromarty,Pavel Curtis,Jeff Dalton,Olivier Danvy,Ken Dickey,Bruce Duba,Marc Feeley,Andy Freeman,Richard Gabriel,Yekta Gürsel,Ken Haase,Robert Hieb,Paul Hudak,Morry Katz,Chris Lindblad,Mark Meyer,Jim Miller,Jim Philbin,John Ramsdell,Mike Shaff,Jonathan Shapiro,Julie Sussman,Perry Wagle,Daniel Weise,Henry Wu和Ozan Yigit。
我们感谢Carol Fessenden,Daniel Friedman和Christopher Haynes,他们允许我们使用Scheme 311第4版参考手册的内容。我们感谢德州仪器公司(Texas Instruments, Inc.)允许我们使用《TI Scheme语言参考手册》(TI Scheme Language Reference Manual)5的内容。我们衷心感谢MIT Scheme6, T7, Scheme 848, Common Lisp9, Chez Scheme10, PLT Scheme11和Algol 6012的手册对本报告的影响。
我们也感谢Betty Dexter,她在将本报告设为TEXTEX格式的工作中做出了杰出的贡献;感谢高德纳(Donald Knuth),他设计的程序给Betty添了不少麻烦。
The Artificial Intelligence Laboratory of the Massachusetts Institute of Technology, the Computer Science Department of Indiana University, the Computer and Information Sciences Department of the University of Oregon和the NEC Research Institute支持了本报告的预备工作。The Advanced Research Projects Agency of the Department of Defense根据Office of Naval Research的N00014-80-C-0505号合同为MIT的工作提供了部分支持。NSF的NCS 83-04567和NCS 83-03325号基金为Indiana University的工作提供了支持。
语言描述
1. Scheme概论
本章概述了Scheme的语义。此概述的目的在于充分解释语言的基本概念,以帮助理解本报告的后面的章节,这些章节以参考手册的形式被组织起来。因此,本概述不是本语言的完整介绍,在某些方面也不够精确和规范。
像Algol语言一样,Scheme是一种静态作用域的程序设计语言。对变量的每一次使用都对应于该变量在词法上的一个明显的绑定。
Scheme中采用的是隐式类型而非显式类型13。类型与对象(也称值)相关联,而非与变量相关联。(一些作者将隐式类型的语言称为弱类型或动态类型的语言。)其它采用隐式类型的语言有Python, Ruby, Smalltalk和Lisp的其他方言。采用显式类型的语言(有时被称为强类型或静态类型的语言)包括Algol 60, C, C#, Java, Haskell和ML。
在Scheme计算过程中创建的所有对象,包括过程和继续(continuation),都拥有无限的生存期(extent)。Scheme对象从不被销毁。Scheme的实现(通常!)不会耗尽空间的原因是,如果它们能证明某个对象无论如何都不会与未来的任何计算发生关联,它们就可以回收该对象占据的空间。其他允许多数对象拥有无限生存期的语言包括C#, Java, Haskell, 大部分Lisp方言, ML, Python, Ruby和Smalltalk。
Scheme的实现必须支持严格尾递归。这一机制允许迭代计算在常量空间内执行,即便该迭代计算在语法上是用递归过程描述的。借助严格尾递归的实现,迭代就可以用普通的过程调用机制来表示,这样一来,专用的迭代结构就只剩下语法糖衣的用途了。
Scheme是最早支持把过程在本质上当作对象的语言之一。过程可以动态创建,可以存储于数据结构中,可以作为过程的结果返回,等等。其他拥有这些特性的语言包括Common Lisp, Haskell, ML, Ruby和Smalltalk。
在大多数其他语言中只在幕后起作用的继续,在Scheme中也拥有“第一级”状态,这是Scheme的一个独树一帜的特征。第一级继续可用于实现大量不同的高级控制结构,如非局部退出(non-local exits)、回溯(backtracking)和协作程序(coroutine)等。
在Scheme中,过程的参数表达式会在过程获得控制权之前被求值,无论这个过程需不需要这个值。C, C#, Common Lisp, Python, Ruby和Smalltalk是另外几个总在调用过程之前对参数表达式进行求值的语言。这和Haskell惰性求值(lazy-evaluation)的语义以及Algol 60按名求值(call-by-name)的语义不同,在这些语义中,参数表达式只有在过程需要这个值的时候才会被求值。
Scheme的算术模型被设计为尽量独立于计算机内数值的特定表示方式。此外,他还区分精确数和非精确数对象:本质上,一个精确数对象精确地等价于一个数,一个非精确数对象是一个涉及到近似或其它误差的计算结果。
1.1. 基本类型
Scheme程序操作对象(object),有时也被成为值(value)。Scheme对象被组织为叫做类型(type)的值的集合。本节将给你Scheme语言十分重要的类型的一个概述。更多的类型将在后面章节进行描述。
注意:由于Scheme采用隐式类型,所以本报告中术语类型的使用与其它语言文本中本术语的使用不同,尤其是与那些显式语言中的不同。
布尔(Booleans) 布尔类型是一个真值,可以是真或假。在Scheme中,对象“假”被写作#f
。对象“真”被写作#t
。然而,在大部分需要一个真值的情况下,凡是不同于#f
的对象被看作真。
数值(Numbers) Scheme广泛支持各类数值数据结构,包括任意精度的整数,有理数,复数和各种类型的非精确数。第3章给了Scheme数值塔结构的概述。
字符(Characters) Scheme字符多半等价于一个文本字符。更精确地说,它们同构与Unicode字符编码标准的标量值(scalar values)。
字符串(Strings) 字符串是确定长度字符的有限序列,因此它代表任意的Unicode文本。
符号(Symbols) 符号是一个表示为字符串的对象,即它的名字。不同于字符串,两个名字拼写一样的符号永远无法区分。符号在许多应用中十分有用;比如:它们可以像其它语言中枚举值那样使用。
点对(Pairs)和表(lists) 一个点对是两个元素的数据结构。点对最常用的用法是(逐一串联地)表示表,在这种表结构中,第一个元素(即“car”)表示表的第一个元素,第二个元素(即“cdr”)表示表的剩余部分。Scheme还有一个著名的空表,它是表中一串点对的最后一个cdr。
向量(Vectors) 像表一样,向量是任意对象有限序列的线性数据结构。然而,表的元素循环地通过链式的点对进行访问,向量的元素通过整数索引进行标识。所以,比起表,向量更适合做元素的随机访问。
过程(Procedures) 在Scheme中过程是值。
1.2. 表达式(Expressions)
Scheme代码中最重要的元素是表达式。表达式可以被计算(evaluated),产生一个值(value)。(实际上,是任意数量的值—参见5.8节。)最基本的表达式就是字面的表达式:
#t ⇒ #t
23 ⇒ 23
这表明表达式#t
的结果就是#t
,也就是“真”的值,同时,表达式23计算得出一个表示数字23的对象。
复合表达式通过在子表达式周围放置小括号来组合。第一个子表达式表示一个运算;剩余的子表达式是运算的操作数:
(+ 23 42) ⇒ 65
(+ 14 (* 23 42)) ⇒ 980
上面例子中的第一个例子,+
是内置的表示加法的运算的名字,23和42是操作数。表达式(+ 23 42)
读作“23和42的和”。复合表达式可以被嵌套—第二个例子读作“14和23和42的积的和”。
正如这些例子所展示的,Scheme中的复合表达式使用相同的前缀表示法(prefix notation)书写。所以,括号在表达这种结构的时候是必要的。所以,在数学表示和大部分语言中允许的“多余的”括号在Scheme中是不被允许的。
正如其它许多语言,空白符(包括换行符)在表达式中分隔子表达式的时候不是很重要,它也可以用来表示结构。
1.3. 变量(variable)和绑定(binding)
Scheme允许标识符(identifier)代表一个包含值得位置。这些标识符叫做变量。在许多情况下,尤其是这个位置的值在创建之后再也不被修改的时候,认为变量直接代表这个值是非常有用的。
(let ((x 23)
(y 42))
(+ x y)) ⇒ 65
在这种情况下,以let
开头的表达式是一种绑定结构。跟在let
之后的括号结构列出了和表达式一起的变量:和23一起的变量x
,以及和42一起的变量y
。let
表达式将x
绑定到23,将y
绑定到42。这些绑定在let
表达式的内部(body)是有效的,如上面的(+ x y)
,也仅仅在那是有效的。
1.4. 定义
let
表达式绑定的变量是局部的(local),因为绑定只在let
的内部可见。Scheme同样允许创建标识符的顶层绑定,方法如下:
(define x 23)
(define y 42)
(+ x y) ⇒ 65
(这些实际上是在顶层程序或库的内部的“顶层”;参见下面的1.12节。)
开始的两个括号结构是定义,它们创造了顶层的绑定,绑定x
到23,绑定y
到42。定义不是表达式,它不能出现在所有需要一个表达式出现的地方。而且,定义没有值。
绑定遵从程序的词法结构:当存在相同名字的绑定的时候,一个变量参考离它最近的绑定,从它出现的地方开始,并且以从内而外的方式进行,如果在沿途没有发现局部绑定的话就使用顶层绑定:
(define x 23)
(define y 42)
(let ((y 43))
(+ x y)) ⇒ 66
(let ((y 43))
(let ((y 44))
(+ x y))) ⇒ 67
1.5. 形式(Forms)
尽管定义不是表达式,但是复合表达式和定义有相同的语法形式:
(define x 23)
(* x 2)
尽管第一行包含一个定义,第二行包含一个表达式,但它们的不同依赖于define
和*
的绑定。在纯粹的语法层次上,两者都是形式,形式是Scheme程序一个语法部分的名字。特别地,23是形式(define x 23)
的一个子形式(subform)。
1.6. 过程
定义也可以被用作定义一个过程:
(define (f x)
(+ x 42))
(f 23) ⇒ 65
简单地说,过程是一个表达式对象的抽象。在上面这个例子中,第一个定义定义了一个叫f
的过程。(注意f x
周围的括号,这表示这是一个过程的定义。)表达式(f 23)
是一个过程调用,大概意思是“将x
绑定到23计算(+ x 42)
(过程的内部)的值”。
由于过程是一个对象,所以它们可以被传递给其它过程:
(define (f x)
(+ x 42))
(define (g p x)
(p x))
(g f 23) ⇒ 65
在上面这个例子中,g
的内部被视为p
绑定到f
,x
绑定到23,这等价于(f 23)
,最终结果是65。
实际上,Scheme许多预定义的操作不是通过语法提供的,而是值是过程的变量。比如,在其它语言中受到特殊对待的+
操作,在Scheme中只是一个普通的标识符,这个标识符绑定到一过程,这个过程将数字对象加起来。*
和许多其它的操作也是一样的:
(define (h op x y)
(op x y))
(h + 23 42) ⇒ 65
(h * 23 42) ⇒ 966
过程定义不是定义过程的唯一方法。一个lambda表达式可以在不指定一个名字的情况下以对象的形式生成一个过程:
((lambda (x) (+ x 42)) 23) ⇒ 65
这个例子中的整个表达式是一个过程调用;(lambda (x) (+ x 42))
,相当于一个输入一个数字并加上42的过程。
1.7. 过程调用和语法关键词(syntactic keywords)
尽管(+ 23 42)
, (f 23)
和((lambda (x) (+ x 42)) 23)
都是过程调用的例子,但lambda
和let
表达式不是。这时因为尽管let
是一个标识符,但它不是一个变量,而是一个语法关键词。以一个语法关键词作为第一个子表达式的形式遵从关键词决定的特殊规则。define
标识符是一个定义,也是一个语法关键词。因此,定义也不是一个过程调用。
lambda
关键词的规则规定第一个子形式是一个参数的表,其余的子形式是过程的内部。在let
表达式中,第一个子形式是一个绑定规格的表,其余子形式构成表达式的内部。
通过在形式的第一个位置查找语法关键词的方法,过程调用通常可以和这些特殊形式区别开来:如果第一个位置不包含一个语法关键词,则这个表达式是一个过程调用。(所谓的标识符的宏(identifier macros)允许创建另外的特殊形式,但相当不常见。)Scheme语法关键词的集合是非常小的,这通常使这项任务变得相当简单。可是,创建新的语法关键词的绑定也是有可能的,见下面的1.9节。
1.8. 赋值(Assignment)
Scheme变量通过定义或let
或lambda
表达式进行的绑定不是直接绑定在各自绑定时指定的对象上,而是包含这些对象的位置上。这些位置的内容随后可通过赋值破坏性地改写:
(let ((x 23))
(set! x 42)
x) ⇒ 42
在这种情况下,let
的内部包括两个表达式,这两个表达式被顺序地求值,最后一个表达式的值会成为整个let
表达式的值。表达式(set! x 42)
是一个赋值,表示“用42代替x
所指向位置的对象”。因此,x
以前的值,23,被42代替了。
1.9. 衍生形式(Derived forms)和宏(macros)
在本报告中,许多特殊的形式可被转换成更基本的特殊形式。比如,一个let
表达式可以被转换成一个过程调用和一个lambda表达式。下面两个表达式是等价的:
(let ((x 23)
(y 42))
(+ x y)) ⇒ 65
((lambda (x y) (+ x y)) 23 42) ⇒ 65
像let
表达式这样的特殊形式叫做衍生形式,因为它们的语义可以通过语法转换衍生自其它类型的形式。一些过程定义也是衍生形式。下面的两个定义是等价的:
(define (f x)
(+ x 42))
(define f
(lambda (x)
(+ x 42)))
在Scheme中,一个程序通过绑定语法关键词到宏以定义它自己的衍生形式是可能的:
(define-syntax def
(syntax-rules ()
((def f (p ...) body)
(define (f p ...)
body))))
(def f (x)
(+ x 42))
define-syntax
结构指定一个符合(def f (p ...) body)
模式的括号结构,其中f
,p
和body
是模式变量,被转换成(define (f p ...) body)
。因此,这个例子中的def
形式将被转换成下面的语句:
(define (f x)
(+ x 42))
创建新的语法关键词的能力使得Scheme异常灵活和负有表现力,允许许多内建在其它语言的特性在Scheme中以衍生形式出现。
1.10. 语法数据(Syntactic data)和数据值(datum values)
Scheme对象的一个子集叫做数据值。这些包括布尔,数据对象,字符,符号,和字符串还有表和向量,它们的元素是数据。每一个数据值都可以以语法数据的形式被表现成字面形式,语法数据可以在不丢失信息的情况下导出和读入。一个数据值可以被表示成多个不同的语法数据。而且,每一个数据值可以被平凡地转换成一个一个字面表达式,这种转换通过在程序中加上一个'
在其对应的语法数据前:
'23 ⇒ 23
'#t ⇒ #t
'foo ⇒ foo
'(1 2 3) ⇒ (1 2 3)
'#(1 2 3) ⇒ #(1 2 3)
在数字对象和布尔中,前一个例子中的'
是不必要的。语法数据foo
表示一个名字是“foo”的符号,且'foo
是一个符号作为其值对的字面表达式。(1 2 3)
是一个元素是1,2和3的表的语法数据,且'(1 2 3)
是一个值是表的字面表达式。同样,#(1 2 3)
是一个元素是1,2和3的向量,且'#(1 2 3)
是对应的字面量。
语法数据是Scheme形式的超集。因此,数据可以被用作以数据对象的形式表示Scheme形式。特别地,符号可以被用作表示标识符。
'(+ 23 42) ⇒ (+ 23 42)
'(define (f x) (+ x 42))
⇒ (define (f x) (+ x 42))
这方便了操作Scheme源代码程序的编写,尤其是解释和程序转换。
1.11. 继续(Continuations)
在Scheme表达式被求值的时候,总有一个继续在等待这个结果。继续表示计算的一整个(默认的)未来。比如,不正式地说,表达式
(+ 1 3)
中3的继续给它加上了1。一般地,这些普遍存在的继续是隐藏在背后的,程序员不需要对它们考虑太多。可是,偶尔,一个程序员需要显示地处理继续。过程call-with-current-continuation
(见11.15节)允许Scheme程序员通过创建一个接管当前继续的过程来处理这些。过程call-with-current-continuation
传入一个过程,并以一个逃逸过程作为参数,立刻调用这个过程。随后,这个逃逸过程可以用一个参数调用,这个参数会成为call-with-current-continuation
的结果。也就是说,这个逃逸过程放弃了它自己的继续,恢复了call-with-current-continuation
调用的继续。
在下面这个例子中,一个代表加1到其参数的逃逸过程被绑定到escape
上,且然后以参数3被调用。escape
调用的继续被放弃,取而代之的是3被传递给加1这个继续:
(+ 1 (call-with-current-continuation
(lambda (escape)
(+ 2 (escape 3)))))
⇒ 4
一个逃逸过程有无限的生存期:它可以在它捕获的继续被调用之后被调用,且它可以被调用多次。这使得call-with-current-continuation
相对于特定的非本地跳转,如其它语言的异常,显得异常强大。
1.12. 库
Scheme代码可以被组织在叫做库的组件中。每个库包含定义和表达式。它可以从其它的库中导入定义,也可以向其它库中导出定义。
下面叫做(hello)
的库导出一个叫做hello-world
的定义,且导入基础库(base library)(见第11章)和简单I/O库(simple I/O library)(见库的第8.3小节)。hello-world
导出的是一个在单独的行上显示Hello World的过程。
(library (hello)
(export hello-world)
(import (rnrs base)
(rnrs io simple))
(define (hello-world)
(display "Hello World")
(newline)))
1.13. 顶层程序
一个Scheme程序被一个顶层程序调用。像库一样,一个顶层程序包括导入,定义和表达式,且指定一个执行的入口。因此,一个顶层程序通过它导入的库的传递闭包定义了一个Scheme程序。
下面的程序通过来自(rnrs programs (6))
库(见库的第10章)的command-line
过程从命令行获得第一个参数。它然后用open-file-input-port
(见库的第8.2小节)打开一个文件,产生一个端口(port),也就是作为一个数据源的文件的一个连接,并调用get-bytes-all
过程以获得文件的二进制数据。程序然后使用put-bytes
输出文件的内容到标准输出:
(译注:以下的示例程序已根据勘误表进行了修正。)
#!r6rs
(import (rnrs base)
(rnrs io ports)
(rnrs programs))
(let ((p (standard-output-port)))
(put-bytevector p
(call-with-port
(open-file-input-port
(cadr (command-line)))
get-bytevector-all))
(close-port p))
2. 需求等级
本报告中的关键词“必须(must)”, “必须不(must not)”, “应该(should)”, “不应该(should not)”, “推荐的(recommended)”, “可以(may)”和“可选的(optional)”按照RFC211914描述的进行解释。特别地:
必须 这个词意味着一个陈述是规范的一个绝对必要条件。
必须不 这个短语意味着一个陈述是规范绝对禁止的。
应该 这个词,或形容词“推荐的”,意味着有合适的理由的时候,在特定的情况下可以忽略这个陈述,但应当理解其含义,并在选择不同的做法前要仔细权衡。
不应该 这个短语,或短语“不推荐”,意味着有合适的理由的时候,在特定的情况下,一个陈述的行为是可接受的,但应当理解其含义,且选择本陈述的描述前应当仔细权衡。
可以 这个词,或形容词“可选的”,意味着一个条目是真正可选的。
尤其,本报告偶尔使用“应该”去指定本报告规范之外但是实际上无法被一个实现检测到的情况;见5.4小节。在这种情况下,一个特定的实现允许程序员忽略本报告的建议甚至表现出其它合理的行为。然而,由于本报告没有指定这种行为,这些程序可能是不可移植的,也就是说,它们的执行在不同的实现上可能产生不同的结果。
此外,本报告偶尔使用短语“不要求”来指示绝对必要条件的缺失。
3. 数字(Numbers)
本章描绘Scheme的数字模型。区别如下对象的不同是重要的:数学上的数字,尝试去建模这些数字的Scheme对象,用于实现这些数字的机器表示和用于书写数字的符号。在本报告中,术语数字表示数学上的数字,术语数字对象(number object)表示代表一个数字的Scheme对象。本报告使用类型复数(complex),实数(real),有理数(rational)和整数(integer)同时表示数学上的数字和数字对象。定长数(fixnum)和浮点数(flonum)类型表示这些数字对象的特殊子集,由通常的机器表示决定,这些会在下面说明。
3.1. 数值塔(Numeracal tower)
数字可以被组织在一个子集的塔中,在这个塔中,每一层是上一层的子集:
number
complex
real
rational
integer
比如,5是一个整数。因此,5也是一个有理数,实数和复数。为5建模的数字对象也一样。
数字对象也被组织为一个对应的子类型的塔,这些类型被谓词(predicates)number?
, complex?
, real?
, rational?
和integer?
定义;见11.7.4.1节。整形数字对象也被叫做整数对象(integer objects)。
包含一个数字的子集和它在计算机中的表示是没有简单的关系的。比如,整数5可以有多个表示。Scheme的数值操作将数字对象当作抽象数据对待,尽可能和它们的表示相独立。尽管Scheme的实现可以使用不同的数字表示方法,但这些对于偶尔编些简单程序的程序员来说不应该是明显可见的。
3.2. 精确性(Exactness)
区分一个已知的精确等于一个数字的数字对象和那些在计算过程中有近似和误差的数字对象是有用的。比如,数据结构的索引操作可能需要精确地了解索引,符号代数系统中的多项式系数也应如此。另一方面,测量的结果在本质上就是不精确的,无理数可以被近似地表示为有理数,这也是不精确的近似。为了在需要精确数的地方使用非精确数,Scheme显式区分精确(exact)和非精确(inexact)数。这种区分和类型的划分是正交的(orthogonal)关系。
如果一个数值被写作精确的常量,或是完全通过精确运算从精确数得出,它就是精确的。一个精确的数字对象明显地与一个数学上的数字相一致。
同样地,如果一个数值被写作非精确的常量,或者是由非精确的成分得出的,或者是由非精确的运算得出的,它就是非精确的。也就是说,非精确性是数值的一种可传染的特性。
精确算术在下面的场景是可靠的:一个精确数对象被传递到11.7.1节描述的任意一个算术过程,并返回一个精确数对象,这个结果是数学上正确的。然而在涉及到非精确数的计算的时候,这通常是不正确的,这时因为像浮点算法的近似方法可能被使用,但是,让结果尽可能接近数学上的理想结果是每个实现的职责。
3.3. 定长数和浮点数
一个定长数是一个精确的整数对象,这个整数对象在精确的整数对象的一个特定的实现相关的子范围(subrange)。(库的第11.2小节描绘了一个计算定长数的库。)同样地,每个实现应当指定一个非精确实数对象的子集作为浮点数,并将特定的外部表示转换成浮点数。(库的第11.3小节描绘了一个计算浮点数的库。)注意,这并不意味着实现必须使用浮点表示。
3.4. 实现要求
Scheme的实现必须支持3.1节给出的子类型的整个塔的数字对象。此外,实现必须支持几乎无限(Practically unlimited)大小和精度的精确整数对象和精确有理数对象,并实现特定的过程(在11.7.1节列出),当给它们精确参数的时候这些过程总是返回精确结果。(“几乎无限”意味着这些数字的大小和精度应当仅受可用内存大小的限制。)
实现可以只支持任意类型非精确数字对象的一个有限的值域(range),但需要遵从本节的要求。比如,一个实现可以限制非精确实数对象的值域(且因此限制非精确整数和有理数对象的值域)在浮点格式的动态值域内。此外,在使用这种值域限制的实现中,非精确整数对象和有理数之间的差异很可能会很大。
一个实现可以为非精确数字使用浮点或其它近似表示方法。本报告推荐但不要求实现遵从IEEE的浮点格式标准,使用其他表示方法的实现应当在精度上达到或超过这些浮点标准15。
特别地,使用浮点数表示法的Scheme实现必须遵循以下规则:浮点数结果的表示精度必须达到或超过参与该运算的任意非精确参数的表示精度。只要有可能,像sqrt
这样潜在的非精确操作当传递一个精确的参数时,应该返回一个精确的结果(比如精确数4的平方根应当是精确的2)。可是,这不是必须的。另一方面,如果参数是精确数的运算会产生非精确的结果(如通过sqrt),且该结果被表示为浮点数,那么就必须使用当前可用的精度最高的浮点数格式;不过,如果该结果是用其他形式表示的,那么该表示方法在精度上就必须达到或超过当前可用的精度最高的浮点数格式。
避免使用量级或有效数字大到实现无法表示的非精确数是程序员的责任。
3.5. 无穷大(Infinities)和非数(NaNs)
一些Scheme实现,尤其是那些遵从IEEE浮点格式标准的实现区别叫做正无穷大,负无穷大和非数的特殊数字对象。
正无穷大被认为是一个非精确的实数(但不是有理数)对象,它表示大于所以有理数对象表示的数字的一个模糊的数字。负无穷大被认为是一个非精确的实数(但不是有理数)对象,它表示小于所以有理数对象表示的数字的一个模糊的数字。
一个非数被认为是一个非精确数(但不是一个实数)对象,它是如此不确定以至于它可以表示任何数,包括正负无穷大,且甚至可能大于正无穷大或小于负无穷大。
3.6. 可区别的-0.0
一些Scheme实现,尤其是那些遵从IEEE浮点格式标准的实现区别数字对象0.0和-0.0。也就是说,正的和负的非精确的零。本报告有时会指定在这些数字对象上的特定算术操作的行为。这些说明会被写作“如果-0.0的话是不一样的”或“实现区分-0.0”。
4. 词汇语法(Lexical syntax)和数据语法(datum syntax)
Scheme的语法被组织进三个层次:
- 词汇语法描述一个程序文本怎样被分成语义(lexemes)的序列。
- 数据语法,按词汇语法制定,将句法(syntactic)数据的序列组织为语义的序列,其中一个句法数据递归地组织一个实体。
- 程序语法按数据语法制定,实施进一步的句法数据含义的组织和分配。(本句已根据勘误表修改。)
句法数据(也叫做外部表示(external representations))兼作为对象的一个符号,且Scheme的(rnrs io ports (6))
库(见库的8.2小节)提供了get-datum
和put-datum
过程用作句法数据的读写,在它们的文本表示和对应的对象之间进行转换。每一个句法数据表示一个对应的数据值。一个句法数据可以使用quote
在一个程序中获得对应的数据值(见第11.4.1节)。
Scheme源程序包含句法数据和(不重要的)注释。Scheme源程序中的句法数据叫做形式。(嵌套在另一个形式中的形式叫做子形式。)因此,Scheme的语法有如下性质,字符的任何序列是一个形式也是一个代表一些对象的句法数据。这可能导致混淆,因为在脱离上下文的情况下,一个给定的字符序列是用于对象的表示还是一个程序的文本可能不是很明显。它可能也是使Scheme强大的原因,因为它使得编写解释器或编译器这类把程序当作对象(或相反)的程序变得简单。
一个数据值可能有多个不同的外部表示。比如“#e28.000
”和“#x1c
”都是表示精确整数对象28的句法数据,句法数据“(8 13)
”, “( 08 13 )
”和“(8 . (13 . ()))
”都表示包含精确整数对象8和13的表。表示相同对象(从equal?
的意义来说;见11.5小节)的句法数据作为程序的形式来说总是等价的。
因为句法数据和数据值之间密切的对应关系,所以当根据上下文精确含义显而易见时,本报告有时使用术语数据(datum)来表示句法数据或数据值。
一个实现不允许以任何方式扩展词汇或数据语法,仅有一个例外:对任何不是r6rs
内建的<identifier>
(见3.8.4小节),实现不需要把#!<identifier>
当作一个语法错误,且实现可以使用特定的#!
前缀的标识符作为指示接下来的输入包含标准词汇和数据语法的扩展的标记。语法#!r6rs
可被用作预示接下来的输入是用本报告中描述的词汇语法和数据语法写成的。或者,#!r6rs
被当作注释对待,见4.2.3小节。
4.1. 符号(Notation)
Scheme的形式语法(formal syntax)被用扩展的BNF写成。非终结符(Non-terminals)使用尖角括号进行书写。非终结符名字的大小写是无关紧要的。
语法中的空格都是为了便于阅读而存在的。<Empty>
代表空字符串。
对BNF的以下扩展可以使描述更加简洁:<thing>*
代表零个或更多的<thing>
;<thing>+
代表至少一个<thing>
。
一些非终结符的名字表示相同名字的Unicode标量值:<character tabulation> (U+0009)
, <linefeed> (U+000A)
, <line tabulation> (U+000B)
, <form feed> (U+000C)
, <carriage return> (U+000D)
, <space> (U+0020)
, <next line> (U+0085)
, <line separator> (U+2028)
和<paragraph separator> (U+2029)
。(本句已根据勘误表修改。)
4.2. 词汇语法
词汇语法决定了怎样将字符的序列分隔成语义(lexemes)的序列,省略不重要的部分如注释和空白。字符序列被假定是Unicode标准16的文本。词汇语法的一些语义,比如标识符,数字对象的表示,字符串等等,是数据语法中的句法数据,且因此代表对象。除了语法的形式解释(formal account),本节还描述了这些句法数据表示什么数据值。
注释中描述的词汇语法包含<datum>
的一个向前引用,这是数据语法的一部分。然而,作为注释,这些<datum>
在语法中并不起什么重要的作用。
除了布尔,数字对象以及用16进制表示的Unicode标量是不区分大小写的,其它情况下大小写是敏感的。比如,#x1A
和#X1a
是一样的。然而,标识符Foo
和标识符FOO
是有区别的。
4.2.1. 形式解释
<Interlexeme space>
可以出现在任意词位(lexeme)的两侧,但不允许出现在一个词位的中间。
<Identifier>
, .
, <number>
, <character>
和<boolean>
必须被一个<delimiter>
或输入的结尾终结。
下面的两个字符保留用作未来的语言扩展:{
}
(以下规则已根据勘误表修改。)
<lexeme> → <identifier> ∣ <boolean> ∣ <number>
∣ <character> ∣ <string>
∣ ( ∣ ) ∣ [ ∣ ] ∣ #( ∣ #vu8( | ' ∣ ` ∣ , ∣ ,@ ∣ .
∣ #' ∣ #` ∣ #, ∣ #,@
<delimiter> → ( ∣ ) ∣ [ ∣ ] ∣ " ∣ ; ∣ #
∣ <whitespace>
<whitespace> → <character tabulation>
∣ <linefeed> ∣ <line tabulation> ∣ <form feed>
∣ <carriage return> ∣ <next line>
∣ <any character whose category is Zs, Zl, or Zp>
<line ending> → <linefeed> ∣ <carriage return>
∣ <carriage return> <linefeed> ∣ <next line>
∣ <carriage return> <next line> ∣ <line separator>
<comment> → ; <all subsequent characters up to a
<line ending> or <paragraph separator>>
∣ <nested comment>
∣ #; <interlexeme space> <datum>
∣ #!r6rs
<nested comment> → #| <comment text>
<comment cont>* |#
<comment text> → <character sequence not containing
#| or |#>
<comment cont> → <nested comment> <comment text>
<atmosphere> → <whitespace> ∣ <comment>
<interlexeme space> → <atmosphere>*
<identifier> → <initial> <subsequent>*
∣ <peculiar identifier>
<initial> → <constituent> ∣ <special initial>
∣ <inline hex escape>
<letter> → a ∣ b ∣ c ∣ ... ∣ z
∣ A ∣ B ∣ C ∣ ... ∣ Z
<constituent> → <letter>
∣ <any character whose Unicode scalar value is greater than
127, and whose category is Lu, Ll, Lt, Lm, Lo, Mn,
Nl, No, Pd, Pc, Po, Sc, Sm, Sk, So, or Co>
<special initial> → ! ∣ $ ∣ % ∣ & ∣ * ∣ / ∣ : ∣ < ∣ =
∣ > ∣ ? ∣ ^ ∣ _ ∣ ~
<subsequent> → <initial> ∣ <digit>
∣ <any character whose category is Nd, Mc, or Me>
∣ <special subsequent>
<digit> → 0 ∣ 1 ∣ 2 ∣ 3 ∣ 4 ∣ 5 ∣ 6 ∣ 7 ∣ 8 ∣ 9
<hex digit> → <digit>
∣ a ∣ A ∣ b ∣ B ∣ c ∣ C ∣ d ∣ D ∣ e ∣ E ∣ f ∣ F
<special subsequent> → + ∣ - ∣ . ∣ @
<inline hex escape> → \x<hex scalar value>;
<hex scalar value> → <hex digit>+
<peculiar identifier> → + ∣ - ∣ ... ∣ -> <subsequent>*
<boolean> → #t ∣ #T ∣ #f ∣ #F
<character> → #\<any character>
∣ #\<character name>
∣ #\x<hex scalar value>
<character name> → nul ∣ alarm ∣ backspace ∣ tab
∣ linefeed ∣ newline ∣ vtab ∣ page ∣ return
∣ esc ∣ space ∣ delete
<string> → " <string element>* "
<string element> → <any character other than " or \>
∣ \a ∣ \b ∣ \t ∣ \n ∣ \v ∣ \f ∣ \r
∣ \" ∣ \\
∣ \<intraline whitespace>*<line ending>
<intraline whitespace>*
∣ <inline hex escape>
<intraline whitespace> → <character tabulation>
∣ <any character whose category is Zs>
<hex scalar value>
表示0
到#x10FFFF
的Unicode标量值,这个范围要排除[#xD800, #xDFFF]
。
让R = 2, 8, 10 和 16,然后重复下面的规则<num R>
, <complex R>
, <real R>
, <ureal R>
, <uinteger R>
和<prefix R>
。没有<decimal 2>
, <decimal 8>
和<decimal 16>
的规则,这意味着包含小数点和指数的数字表示必须使用十进制基数。
下面的规则中,大小写是不重要的。(本句根据勘误表添加。)
(以下规则已根据勘误表修改。)
<number> → <num 2> ∣ <num 8>
∣ <num 10> ∣ <num 16>
<num R> → <prefix R> <complex R>
<complex R> → <real R> ∣ <real R> @ <real R>
∣ <real R> + <ureal R> i ∣ <real R> - <ureal R> i
∣ <real R> + <naninf> i ∣ <real R> - <naninf> i
∣ <real R> + i ∣ <real R> - i
∣ + <ureal R> i ∣ - <ureal R> i
∣ + <naninf> i ∣ - <naninf> i
∣ + i ∣ - i
<real R> → <sign> <ureal R>
∣ + <naninf> ∣ - <naninf>
<naninf> → nan.0 ∣ inf.0
<ureal R> → <uinteger R>
∣ <uinteger R> / <uinteger R>
∣ <decimal R> <mantissa width>
<decimal 10> → <uinteger 10> <suffix>
∣ . <digit 10>+ <suffix>
∣ <digit 10>+ . <digit 10>* <suffix>
<uinteger R> → <digit R>+
<prefix R> → <radix R> <exactness>
∣ <exactness> <radix R>
<suffix> → <empty>
∣ <exponent marker> <sign> <digit 10>+
<exponent marker> → e ∣ E ∣ s ∣ S ∣ f ∣ F
∣ d ∣ D ∣ l ∣ L
<mantissa width> → <empty>
∣ | <digit 10>+
<sign> → <empty> ∣ + ∣ -
<exactness> → <empty>
∣ #i∣ #I ∣ #e∣ #E
<radix 2> → #b∣ #B
<radix 8> → #o∣ #O
<radix 10> → <empty> ∣ #d ∣ #D
<radix 16> → #x∣ #X
<digit 2> → 0 ∣ 1
<digit 8> → 0 ∣ 1 ∣ 2 ∣ 3 ∣ 4 ∣ 5 ∣ 6 ∣ 7
<digit 10> → <digit>
<digit 16> → <hex digit>
4.2.2. 换行符
在Scheme单行注释(见4.2.3小节)和字符串字面量中,换行符是重要的。在Scheme源代码中,在<line ending>
中的任意换行符都指示一个行的结束。此外,两字符的换行符<carriage return> <linefeed>
和<carriage return> <next line>
都仅表示一个单独的换行。
在一个字符串字面量中,一个之前没有\
的<line ending>
表示一个换行字符(linefeed character),这个字符是Scheme中的标准换行符。
4.2.3. 空白和注释
空白字符是空格,换行,回车,字符制表符,换页符,行制表符和其它种类是Zs,Zl或Zp的任意其它字符。空白字符用于提高可读性和必要地相互分隔词位。空白可以出现在两个词位中间,但不允许出现在一个词位的中间。空白字符也可以出现在一个字符串中,但此时空白是有意义的。
词汇语法包括一些注释形式。在所有的情况下,注释对Scheme是不可见的,除非它们作为分隔符,所以,比如,一个注释不能出现在标识符或一个数字对象的表示的中间。
一个分号(;
)指示一个行注释的开始。注释一直延续到分号出现的那一行的结尾。
另一个指示注释的方法是在<datum>
(参见4.3.1节)前加一个前缀#;
,可选的在<datum>
前加上<interlexeme space>
。注释包括注释前缀#;
和<datum>
。这个符号用作“注释掉”代码段。
块注释可用正确嵌套的#|
和|#
指示。
#|
FACT过程计算一个非负数的阶乘。
|#
(define fact
(lambda (n)
;; 基础条件
(if (= n 0)
#;(= n 1)
1 ; *的单位元(identity)
(* n (fact (- n 1))))))
词位#!r6rs
,表示接下来的输入是用本报告中描述的词汇语法和数据语法写成的,另外,它也被当作注释对待。
4.2.4. 标识符
其他程序设计语言认可的大多数标识符也能被Scheme接受。通常,第一个字符不是任何数值的字母、数字和“扩展字符”序列就是一个标识符。此外,+
、-
和...
都是标识符,以两个字符序列->
开始的字母、数字和“扩展字符”序列也是。这里有一些标识符的例子:
lambda q soup
list->vector + V17a
<= a34kTMNs ->-
the-word-recursion-has-many-meanings
扩展字符可以像字母那样用于标识符内。以下是扩展字符:
! $ % & * + - . / : < = > ? @ ^ _ ~
此外,所有Unicode标量值大于127且类型属于Lu, Ll, Lt, Lm, Lo, Mn, Mc, Me, Nd, Nl, No, Pd, Pc, Po, Sc, Sm, Sk, So或Co的字符都可以被用在标识符中。当通过一个<inline hex escape>
表示的时候,任何字符都可以用在标识符中。比如,标识符H\x65;llo
和标识符Hello
是一样的,标识符\x3BB;
和标识符λ
是一样的。
在Scheme程序中,任意标识符可作为一个变量或一个语法关键词(见5.2和9.2节)。任何标识符也可以作为一个句法数据,在这种情况下,它表示一个符号(见11.10小节)。
4.2.5. 布尔
标准布尔对象真和假有外部表示#t
和#f
。
4.2.6.字符
字符可以用符号#\<character>
或#\<character name>
或#\x<hex scalar value>
表示。
比如:
#\a | 小写字母a |
#\A | 大写字母A |
#\( | 做小括号 |
#\ | 空格 |
#\nul | U+0000 |
#\alarm | U+0007 |
#\backspace | U+0008 |
#\tab | U+0009 |
#\linefeed | U+000A |
#\newline | U+000A |
#\vtab | U+000B |
#\page | U+000C |
#\return | U+000D |
#\esc | U+001B |
#\space | U+0020 |
表示一个空格时优先使用这种方法 | |
#\delete | U+007F |
#\xFF | U+00FF |
#\x03BB | U+03BB |
#\x00006587 | U+6587 |
#\λ | U+03BB |
#\x0001z | 词法 异常(&lexical exception) |
#\λx | 词法 异常 |
#\alarmx | 词法 异常 |
#\alarm x | U+0007 |
跟着x | |
#\Alarm | 词法 异常 |
#\alert | 词法 异常 |
#\xA | U+000A |
#\xFF | U+00FF |
#\xff | U+00FF |
#\x ff | U+0078 |
跟着另外一个数据,ff | |
#\x(ff) | U+0078 |
跟着另外一个数据, | |
一个被括号括着的ff | |
#\(x) | 词法 异常 |
#\(x | 词法 异常 |
#\((x) | U+0028 |
跟着另外一个数据, | |
一个被括号括着的x | |
#\x00110000 | 词法 异常 |
超出范围 | |
#\x000000001 | U+0001 |
#\xD800 | 词法 异常 |
在被排除的范围内 |
(词法
异常记号表示有问题的行违反了词汇语法。)
在#\<character>
和#\<character name>
中,大小写是敏感的,但#\x<hex scalar value>
中<hex scalar value>
的大小写是不敏感的。(上句已根据勘误表进行修改。)一个<character>
必须跟着一个<delimiter>
或输入的结束。此规则解决了关于命名字符的各种歧义,比如,要求字符序列#\space
被解释为一个空白字符而不是字符#\s
和跟着的标识符pace
。
注意:由于反向兼容的原因我们保留符号#\newline
。它的使用是不赞成的;应使用#\linefeed
代替。
4.2.7. 字符串
字符串使用被双引号("
)括起来的字符序列表示。在字符串字面量中,各种转义序列(escape sequences)被用来表示字符,而不是字符自己。转义序列总是以一个反斜杠(\
)开始:
\a
: 响铃(alarm), U+0007\b
: 退格(backspace), U+0008\t
: 制表(character tabulation), U+0009\n
: 换行(linefeed), U+000A\v
: 行制表(line tabulation), U+000B\f
: 换页(formfeed), U+000C\r
: 回车(return), U+000D\"
: 双引号(doublequote), U+0022\\
: 反斜杠(backslash), U+005C\<intraline whitespace><line ending><intraline whitespace>
: 无\x<hex scalar value>;
: 指定字符(注意结尾的分号)。
这些转义序列是大小写敏感的,除了<hex scalar value>
中的字母数字(alphabetic digits)可以是大写也可以是小写。
字符串中反斜杠后的任意其它字符都是违反语法的。除了行结尾外,任意在转义序列外且不是一个双引号的字符在字符串字面量中代表它自己。比如,但字符字符串字面量"λ"
(双引号,一个小写的lambda,双引号)和"\x03bb;"
表示一样的字符串。一个前面不是反斜杠的行结尾表示一个换行字符。
比如:
“abc” | U+0061, U+0062, U+0063 |
“\x41;bc” | “Abc” ; U+0041, U+0062, U+0063 |
“\x41; bc” | “A bc” |
U+0041, U+0020, U+0062, U+0063 | |
“\x41bc;” | U+41BC |
“\x41” | 词法 异常 |
“\x;” | 词法 异常 |
“\x41bx;” | 词法 异常 |
“\x00000041;” | “A” ; U+0041 |
“\x0010FFFF;” | U+10FFFF |
“\x00110000;” | 词法 异常 |
超出范围 | |
“\x000000001;” | U+0001 |
“\xD800;” | 词法 异常 |
在被排除的范围内 | |
“A | |
bc” | U+0041, U+000A, U+0062, U+0063 |
如果A后面没有空格 |
4.2.8. 数字
数字对象外部表示的语法在形式语法的<number>
规则中被正式描述。在数字对象的外部表示中,大小写是不重要的。
数字对象的表示可以通过特定的基数前缀被写作二进制,八进制,十进制和十六进制。基数前缀是#b
(二进制),#o
(八进制),#d
(十进制)和#x
(十六进制)。在没有基数前缀时,一个数字对象的表示被假设是十进制的。
一个数字对象的表示可通过前缀被指定为精确的货非精确的。前缀#e
表示精确的,前缀#i
表示非精确的。如果使用基数前缀的话,精确性前缀可使用在其之前或之后。如果一个数字对象的表示没有精确性前缀,则在下列情况是非精确的,包含一个小数点,指数,或一个非空的尾数宽度(mantissa width),否则它是精确的。
在一个非精确数可以有不同精度的系统中,指定一个常数的精度可能是有用的。如果这样的话,数字对象的表示可以用一个指示非精确数预期精度的指数标记写成。字母s
, f
, d
和l
分别表示使用short,single,double和long精度。(当内部非精确表示少于四种时,这四个精度定义被映射到当前可用的定义。例如,只有两种内部表示的实现可以将short和single映射为一种精度,将long和double映射为一种)。另外,指数标记e
指明了Scheme实现的缺省精度。缺省精度应达到或超过double的精度,但Scheme实现也许会希望用户可设置此缺省精度。
3.1415926535898F0
舍入到single, 大概是3.141593
0.6L0
扩展到long, 大概是.600000000000000
一个有非空尾数宽度数字对象的表示,x|p
,代表有p位有效数字的x的最好的二进制浮点数近似。比如,1.1|53
是使用IEEE double精度的1.1最好的近似的表示。如果x是一个不包含竖线的非精确实数对象的外部表示,那么它的数值应该被认为有53或更多的尾数宽度。
如果实际可行的话,实数对象使用二进制浮点表示的实现应该用p位精度表示x|p
,或者如果实际不行的话,应该使用大于p位精度的实现,或者如果以上两个都不行的话,应该使用实现中最大的精度。
注意:有效数字的精度不应该和用作表示有效数字的位的数量相混淆。在IEEE浮点标准中,比如,有效数字的最高有效位暗示在single和double精度之间但明确使用扩展精度。不管那一位是不是明确指定的都不影响数学精度。使用二进制浮点的实现,默认的精度可通过调用下面的过程计算:
(define (precision)
(do ((n 0 (+ n 1))
(x 1.0 (/ x 2.0)))
((= 1.0 (+ 1.0 x)) n)))
注意:当优先使用的浮点表示是IEEE double精度时,|p
后缀不应该总是被省略:非规范化浮点数在精度上有所松懈,所以它们的外部表示应该加上一个使用有效数字真实宽度的|p
后缀。
字面量+inf.0
和-inf.0
分别表示正无穷大和负无穷大。字面量+nan.0
表示非数,它是(/ 0.0 0.0)
的结果,且同样也可以表示其它非数。字面量-nan.0
也表示一个非数。(上句根据勘误表添加。)
如果x是一个非精确实数对象的外部表示且不包括竖线且不包括除了e
之外的指数标记,这个非精确实数对象表示一个浮点数(见库的第11.3小节)。其它非精确实数对象外部表示的一些或所有也可以表示浮点数,但这不是本报告要求的。
4.3. 数据语法
数据语法按照词汇语法中定义的<lexeme>
的序列描述句法数据(syntactic data,句法数据)的语法。
句法数据包括本报告前面章节描述的语义数据以及以下用于组织复合数据的结构:
- 点对和表,被
( )
或[ ]
(见4.3.2节)括起来 - 向量(见4.3.3节)
- 字节向量(bytevectors)(见4.3.4节)
4.3.1. 形式解释
下面的语法按照定义在4.2节的语法的各种语义描述句法数据的语法:
<datum> → <lexeme datum>
∣ <compound datum>
<lexeme datum> → <boolean> ∣ <number>
∣ <character> ∣ <string> ∣ <symbol>
<symbol> → <identifier>
<compound datum> → <list> ∣ <vector> ∣ <bytevector>
<list> → (<datum>*) ∣ [<datum>*]
∣ (<datum>+ . <datum>) ∣ [<datum>+ . <datum>]
∣ <abbreviation>
<abbreviation> → <abbrev prefix> <datum>
<abbrev prefix> → ' ∣ ` ∣ , ∣ ,@
∣ #' | #` | #, | #,@
<vector> → #(<datum>*)
<bytevector> → #vu8(<u8>*)
<u8> → <any <number> representing an exact
integer in {0, ..., 255}>
4.3.2. 点对和表
表示值对和值的列表(见11.9节)的列表和点对数据使用小括号和中括号表示。规则<list>
中匹配的中括号对等价于匹配的小括号对。
Scheme点对的句法数据最常用的符号是“点”符号(<datum1> . <datum2>),其中<datum1>是car区域的值的表示,<datum2>是cdr区域的值的表示。比如(4 . 5)
是一个car是4,cdr是5的点对。
表可以使用一个改进的记号:表中的元素被简单地括进小括号中并用空格分隔。空表用()
表示。比如:
(a b c d e)
和
(a . (b . (c . (d . (e . ())))))
作为符号的表是等价的表示。
一个通用的规则是,如果一个点跟着一个左小括号,则在外部表示中可以省略这个点,左小括号和对应的右小括号。
符号序列“(4 . 5)
”是一个点对的外部表示,而不是一个计算结果为点对的表达式。类似的,符号序列“(+ 2 6)
”不是整数8的外部表示,虽然它是一个计算结果是整数8的表达式(在(rnrs base (6))
库的语言中);当然,它是一个句法数据,这个句法数据表示一个三个元素的表,这个表的元素是符号+
,整数2和6。
4.3.3. 向量
表示向量对象(见11.13小节)的向量数据使用#(<datum> ...)
表示。比如:一个长度是3,且0号元素位置是数字对象零,1号元素位置是表(2 2 2 2)
,2号元素位置是字符串"Anna"
,的向量可以如下表示:
#(0 (2 2 2 2) "Anna")
这是一个向量的外部表示,而不是一个计算结果为向量的表达式。
4.3.4. 字节向量
表示字节向量(见库的第2章)的向量数据使用符号#vu8(<u8> ...)
表示,其中<u8>
表示字节向量的八位字节(octets)。比如:一个长度是3且包含八位字节2,24和123的字节向量可以如下表示:
#vu8(2 24 123)
这是一个字节向量的外部表示,也是一个计算结果为字节向量的表达式。
4.3.5 缩写(Abbreviations)
'<datum>
`<datum>
,<datum>
,@<datum>
#'<datum>
#`<datum>
#,<datum>
#,@<datum
上面的每一个都是一个缩写:
'<datum>
是(quote <datum>)
的缩写, `<datum>
是(quasiquote <datum>)
的缩写, ,<datum>
是(unquote <datum>)
的缩写, ,@<datum>
是(unquote-splicing <datum>)
的缩写, #'<datum>
是(syntax <datum>)
的缩写, #`<datum>
是(quasisyntax <datum>)
的缩写, #,<datum>
是(unsyntax <datum>)
的缩写,且 #,@<datum>
是(unsyntax-splicing <datum>)
的缩写。
5. 语义概念
5.1. 程序和库
一个Scheme程序由一个顶层程序以及一系列的库组成,每个库通过显式地指定导入和导出定义了和其它程序相联系的程序的一部分。一个库由一系列的导入导出说明和程序体组成,程序体由定义和表达式组成。一个顶层程序和一个库差不多,但是没有导出说明。第7章和第8章分别描述了库和顶层程序的语法和语义。第11章描述了定义了通常和Scheme一起的结构的一个基本库。一个单独的报告1描述了Scheme系统提供的各种标准库。
基本库和其它标准库的划分是根据使用而不是结构。尤其那些通常被编译器或运行时系统实现为“原语(primitives)”而不是根据其它标准调用或句法形式的功能不是基本库的一部分,而是被定义在单独的库中。例子包括定长数和浮点数库,异常和条件库,以及用于记录的库。
5.2. 变量,关键词和作用域
在一个库或顶层程序的内部,一个标识符可以命名一种语法,或者它可以命名一个值可以被存储的位置。命名一种语法的标识符叫做关键词,或句法关键词,也可以说是关键词被绑定到那个语法(或者说是一个句法抽象,也就是一个将语法转换成更基本的形式的转换器;见7.2小节)。命名一个位置的标识符叫做变量,也可以说是变量被绑定到那个位置。在一个顶层程序或一个库的每一个位置,一个特定的固定集合的标识符被绑定。这些标识符的集合,也就是可见绑定(visible bindings)的集合,被称为影响该位置的环境(environment)。
特定的形式被用作创建语法抽象并绑定关键词到用于这些新的语法抽象的转换,同时其它的形式创建新的位置并将变量绑定到那些位置。这些表达式被统称为绑定结构(binding constructs)。一些绑定结构使用定义的形式,其它的是表达式。除了导出的库绑定是一个例外,一个定义创建的绑定只在这个定义出现的内部可见,例如,库,顶层程序或lambda
表达式的内部。导出的库绑定在导入这些绑定的库和程序的内部是可见的(见第7章)。
绑定变量的表达式包括来自基础库的lambda
,let
,let*
,letrec
, letrec*
, let-values
和let*-values
形式(见11.4.2和11.4.6小节)。在这些当中,lambda
是最基本的。出现在这样的表达式内部,或出现在库或顶层程序内部的变量定义被当作一系列的letrec*
对待。另外,在库的内部,从库中导出的变量可以被导入的库或顶层程序引用。
绑定关键词的表达式包括let-syntax
和letrec-syntax
形式(见11.18小节)。一个define
形式(见11.2.1小节)是一个创建变量绑定(见11.2小节)的定义,同时一个define-syntax
形式是一个创建关键词绑定(见11.2.2小节)的定义。
Scheme是一个拥有块结构的静态作用域的语言。顶层程序或库的内部的每一个地方,一个标识符被绑定到代码的作用域,在这个作用域中绑定是可见的。这个作用域被特定的建立绑定的绑定结构决定;比如,如果一个绑定通过lambda
表达式建立,那么作用域是整个lambda
表达式。每当标识符引用标识符的绑定的时候,它总是引用包含这次使用的最内层绑定。如果找不到作用域包含该引用的标识符绑定,它可以引用库或顶层程序最上面的定义或导入建立的绑定(见第7章)。如果找不到标识符的绑定,它就被称为未绑定的。
5.3. 异常情况
在本报告中各种异常情况是有区别的,包括违反语法,违反过程调用,违反实现限制和环境中的异常情况。当实现检测到一个异常情况时,一个异常被抛出,这意味着一个被称为当前异常处理程序(current exception handler)的特殊过程被调用。一个程序也可以抛出一个异常且覆盖当前异常处理程序;见库的第7.1小节。
当一个异常被抛出时,会提供一个描述异常情况性质的对象。本报告使用库的第7.2小节描述的条件系统来描述异常情况,通过条件类型来区分它们。
如果异常处理程序采取适当动作的话,一些异常情况允许程序继续运行。对应的异常被称为是可继续的(continuable)。对于本报告描述的大部分异常情况,可移植的程序不应该依赖在异常被检测到的地方异常是可继续的。在那些异常中,被异常调用的异常处理程序不应该返回。可是,在有些情况下,继续是被允许的,这时处理程序应该返回。见库的第7.1小节。
当实现由于实现限制(implementation restriction)无法正确执行一个正确的程序时,实现必须抛出一个异常。比如,一个不支持无穷大的实现计算一个结果是无穷大的表达式时必须抛出一个条件类型是&implementation-restriction
的异常。
一些可能的异常比如缺乏非数和无穷大的表示(见11.7.2小节)是本报告预知的,且实现必须在遭遇到这样的情况的时候抛出条件类型适当的异常。
本报告使用的措辞“一个异常被抛出”等价于“一个异常必须被抛出”。本报告使用措辞“一个条件类型为t的异常”指示跟随异常抛出的对象是一个有特定类型的条件对象。措辞“一个可继续的异常被抛出”指示一个异常情况允许异常处理程序返回。
5.4. 参数检查
本报告中的许多或一个标准库中的部分调用限制它们接受的参数。典型地,一个调用只接受特定的数字和参数类型。许多句法形式同样限制它们的一个或多个子形式计算结果的值。这些限制暗示着程序员和实现共同的责任。尤其,程序员负责确保这些值确实符合本规范描述的限制。实现必须检查本规范描述的限制确实被遵守,在某种程度上来说允许特定的操作成功完成是合理的,可能的,也是必要的。在第6章以及整个报告中,实现的责任会被更加仔细地描述。
注意,一个实现完全检查一个规范的限制并不总是可行的。比如,如果一个操作接受一个有特定属性的过程,检查这些属性通常是不可行的。同样地,一些操作同时接受表和过程,并且这些操作会调用这些过程。因为表可以被来自(rnrs mutable-pairs (6))
库(见库的第17章)的过程改变,所以,一个操作开始时还是表的参数可能在操作执行过程中变成一个非表。并且,过程可能逃逸到一个不同的继续中,从而阻止操作进行检查。要求操作检查参数在这样的过程的每一次调用后都是一个表是不现实的。并且,一些接受表参数操作仅仅需要部分地遍历表中的元素;要求实现去遍历表中的其它元素以检查所有的限制被满足可能违反合理的性能假设。由于这些原因,这些检查是程序员的义务而不是实现的检查义务。
当一个实现检测到参数违反限制的时候,它必须以5.6小节描述的符合执行安全性的方法抛出一个条件类型是&assertion
的异常。
5.5. 违反语法
一个特定形式的子形式通常需要遵循特定的句法限制。由于形式可能要遵从宏扩展,其可能不会终结,所以,它们是否符合特定的限制的问题通常是无法解答的。
可是,当宏扩展终结时,实现必须检测违反语法的地方。一个语法错误是一个关于库内部,顶层程序内部,或本报告基本库或标准库“语法”入口的错误。此外,试图给一个不可改变的变量(也就是一个库导出的变量;见7.1小节)也被认为是一个语法错误。
如果一个程序中的一个顶层或库形式是句法上不正确的,那么实现必须抛出一个条件类型是&syntax
的异常,且顶层程序或库必须不能被允许开始。
5.6. 安全性
导出被本文档描述的标准库被认为是安全库。只从安全库导入的库或顶层程序也被认为是安全的。
正如本文档所定义的,Scheme编程语言在下列的场景下是安全的:一个顶层程序的执行不能严重错误到以至于崩溃或不能以和本报告描述的语义相一致的行为执行,除非一个异常被抛出。
违反实现限制的时候必须抛出一个条件类型是&implementation-restriction
的异常,且必须是所有的违规和错误,其可能威胁系统的完整性,使得执行的结果无法和本报告中描述的语义相一致。
上面的安全性属性只有在顶层程序或库被认为是安全的时候被确保。特别地,实现可以提供访问非安全库的方法,这种方法不能保证安全性。
5.7. 布尔值
尽管有单独的布尔值的存在,但是,Scheme的任何值可在条件测试中被当作一个布尔值使用,除了#f
,所有的值在测试中被当成真。本报告使用词语“真”表示任意除了#f
的Scheme值,用词语“假”表示#f
。
5.8. 多个返回值
一个Scheme表达式的结果可以是任意多个有限数量的值。这些值被传递给表达式的继续。
不是所有的继续都接受任意数量的值。比如,一个接受调用参数的继续可以确保精确地接受一个值。传递其它数量的值到这样一个继续的效果是未定义的。11.15小节描述的过程call-with-values
使创建接受特定数量返回值的继续成为可能。如果传递给一个call-with-values
过程创建的继续的返回值的数量不被这个继续接受,那么一个异常被抛出。11.15小节values
过程的描述给了一个关于不同继续接受的值的数量的更全面的描述。
基本库的许多的形式有作为子形式的表达式的序列,这个序列被按顺序求值,但除了最后一个表达式的值,其它所有的值都会被忽略。丢弃这些值得继续接受任意数量的值。
5.9. 未定义(Unspecified)的行为
如果说一个表达式“返回未定义的值”,那么这个表达式必须正确计算而不是抛出一个异常,但是返回值是依赖于实现的;本报告故意不说多少值或什么值被返回。程序员不应该依赖返回值是特定的数量或依赖返回值是特定的值。
5.10. 存储模型
变量和对象,比如点对,向量,字节向量,字符串,哈希表和含蓄地引用位置或位置序列的记录。一个字符串,比如说,包含很多位置因为在一个字符串中有许多的字符。(这些位置不需要对应于一个完整的机器字。)通过使用string-set!
过程,一个新的值可以被存进这些位置的一个当中,但是,字符串的位置和以前还是一样的。
从一个位置获取的对象,不管是通过一个变量,还是通过一个类似car
,vector-ref
或string-ref
的过程,在eqv?
(11.5小节)的意义来说与在获取之前最后存进的对象是等价的。但,当对象是一个过程时,这是一个例外。当对象是一个过程的时候,从这个位置获取的过程和最后存到这个位置的过程的行为是一样的,但是,它们可能不是相同的对象。(本节已根据勘误表进行修改。)
每一个位置都被标记以指示它是否在被使用。没有变量或对象会指向一个不在使用的位置。不管何时本报告谈及为变量或对象分配位置,这意味着一个适当数量的位置被从未被使用的位置的集合选择,且被选择的位置在变量或对象引用它们之前被标记为现在正在使用。
常数(也就是,字面量表达式的值)被存进只读存储器是可取的。为了表达这个,想象一下,每一个引用位置的对象被用一个标记指示为可变的或不可变的是很方便的。字面常量,symbol->string
返回的字符串,不可变区域的记录和其它被显式地被指定为不可变的值是不可变的对象,被本报告列出的其它过程创建的对象是可以改变的。尝试给一个引用不可改变对象的位置赋值应该抛出一个条件类型是&assertion
的异常。
5.11. 严格尾递归(Proper tail recursion)
Scheme的实现必须是严格尾递归的。发生在叫做尾上下文(tail contexts)的特定句法上下文的过程调用是尾调用(tail calls)。一个Scheme实现是严格尾递归的,如果它支持无限数量的活动尾调用。一个调用时活动的(active)如果被调用的过程可以返回。注意,这里所说的返回既包括了通过当前继续从调用中返回的情况,也包括了事先以call-with-current-continuation
过程捕获继续,后来再调用该继续以便从调用中返回的情况。不存在被捕获的继续时,调用最多只能返回一次,活动调用就是那些还没有返回的调用。一个严格尾递归的正式定义可以在Clinger的论文17中被发现。来自(rnrs base (6))
库的结构上识别尾调用的规则在11.20小节被描述。
5.12. 动态生存期(Dynamic extent)和动态环境
对于一个过程调用,在它开始和它返回的过程之间的时间叫做它的动态生存期。在Scheme中,call-with-current-continuation
(11.15小节)允许在它的过程调用返回之后重新进入一个动态生存期。因此,一个调用的动态生存期可能不是一个单独的,连贯的时间段。
本报告描述的一些操作除了从它们显式的参数中获得信息,还会从动态环境中获得信息。比如,call-with-current-continuation
会访问一个dynamic-wind
(11.15小节)创建的隐式的上下文,且抛出过程(库的第7.1小节)访问当前的异常处理程序。改变动态环境的操作是动态的,为了类似dynamic-wind
或with-exception-handler
的过程的调用的动态作用域。当这样的调用返回时,前一个动态环境被恢复。动态环境可以被认为是一个调用的动态生存期的一部分。因此,它可以被call-with-current-continuation
捕获,并可以通过调用它创建的逃逸过程恢复。
6. 条目格式(Entry format)
描述基础库和标准库绑定的章节被用条目组织。每个条目描述一个语言特性或一组相关的特性,其中,一个特性是一个句法结构,或者是一个内置过程。一个条目以一个或多个标题行(header lines)开始,标题行有如下格式:
模板 类别
template category
类别定义了条目描述的绑定的种类,其中类别通常要么是“语法”要么是“过程”。一个条目可以指定子形式或参数的各种限制。对于这些的背景知识,见5.4小节。
6.1. 语法条目
如果类别是“语法”,则这个条目描述一个特定的句法结构,且模板给了这个结构的形式的语法。模板使用类似于第4章BNF规则右侧的符号,且描述了等价于匹配作为句法数据的模板的形式的形式的集合。一些“语法”条目带有一个后缀(扩展(expand)),指明结构的句法关键词是以级别0(level 0)被导出的。否则,句法关键词以级别1被导出;见7.2小节。
一个模板描述的形式的要素(component)被句法变量(syntactic variables)指定,这些句法变量使用尖括号书写,比如:<expression>
, <variable>
。句法变量中的大小写是无关紧要的。句法变量代表其它的形式或它们的序列。一个句法变量可以在语法中为句法数据(见4.3.1小节)引用一个非终结符,在这种情况下,只有匹配非终结符的形式才被允许在那个位置。比如,<identifier>
代表一个必须是标识符的形式。同样,<expression>
代表一个句法上是一个合法表达式的形式。其它用在模板中的非终结符被定义为本规范的一部分。
符号
<thing1> ...
代表零个或多个<thing>
,且
<thing1> <thing2> ...
代表一个或多个<thing>
。
确保一个形式的每一个要素有模板指定的形状是程序员的责任。语法的描述可以表达一个形式的要素的其它限制。通常,这样的限制被格式化成如下形式的短语“<x>
必须是(must be)一个…”。再次强调,这些是程序员的责任。只要宏转换涉及扩展形式终结符,检查这些限制被满足就是实现的责任。如果实现检测到一个要素不满足限制,一个条件类型是&syntax
的异常被抛出。
6.2. 过程条目
如果类别是“过程”,则条目描述一个过程,标题行给出一个过程调用的模板。模板中参数的名字是斜体。因此,标题行
(vector-ref vector k) 过程
表示一个内建的过程vector-ref
接受两个参数,一个是向量vector
,和一个精确的非负整数对象k
(参见下面的内容)。标题行
(make-vector k) 过程 (make-vector k fill) 过程
表示过程make-vector
可以接受一个或两个参数。参数名字的大小写是不敏感的:Vector
和vector
是一样的。
正如语法模板,标题行的结尾有一个省略号…,如下所示
(= z1 z2 z3 ..) 过程
表示过程接受和最后一个参数名相同类型的任意多个参数。在上面那个例子中,=
接受两个或更多的复数对象参数。
一个过程当检测到它没有指定的参数时必须抛出一个条件类型是&assertion
的异常,并且,参数规格是详尽的:如果一个过程调用提供的参数数量不匹配过程接受参数的任何一个数量,一个条件类型是 &assertion
的异常必须被抛出。
简单地说,本报告遵循如下的惯例,如果一个参数的名字也是一个类型的名字,那么,对应的参数必须是这个类型。比如,上面的vector-ref
的标题行指明vector-ref
的第一个参数必须是一个向量。下面的命名惯例暗示类型的限制:
obj | 任何对象 |
z | 复数对象 |
x | 实数对象 |
y | 实数对象 |
q | 有理数对象 |
n | 整数对象 |
k | 精确的非负整数对象 |
bool | 布尔(#f 或#t ) |
octet | 范围在{0, …, 255}的精确的整数对象 |
byte | 范围在{−128, …, 127}的精确的整数对象 |
char | 字符(见11.11小节) |
pair | 点对(见11.9小节) |
vector | 向量(见11.13小节) |
string | 字符串(见11.12小节) |
condition | 条件(见库的第7.2小节) |
bytevector | 字节向量(见库的第2章) |
proc | 过程(见1.6小节) |
其它类型限制通过特定章节描述的变量名字惯例表达。比如,库的第11章为数字的各种子集使用了很多特别的参数变量。
当使用上面列出的限制的时候,确保对应的参数拥有指定的类型是程序员的责任。检查那些类型是实现的责任。
一个叫做表的参数意味着传递一个类型是表(见11.9小节)的参数是程序员的责任。在某种程度上,将检查参数是为了操作执行它的功能适当组织的作为实现的责任是可能的也是合理的。实现必须至少检查参数或者是一个空表或者是一个点对。
过程的描述可以在过程的参数上表达其它的限制。代表性地,这样的限制被格式化成如下形式的短语“x
必须是一个…”(或者,否则使用词语“必须”)。
6.3. 实现责任
除了通过命名惯例进行隐含的限制,一个条目可以列出另外的显式的限制。这些显式的限制通常同时描述程序员的责任和实现的责任,程序员的责任意味着程序员必须确保一个形式的子形式是适当的,或一个适当的参数被传递,实现的责任意味着实现必须检查子形式符合规范的限制(如果宏扩展终结的话),或检查参数是不是适当的。通过为参数或子形式打上“实现责任”的标签,一个描述可以显式地列出实现的责任。在这种情况下,在描述的其它部分为这些子形式或参数指定的责任就只是程序员的责任。一个描述实现责任的段落不影响那一段没有描述的实现检查子形式或参数的责任。
6.4. 其它种类的条目
如果类别既不是“语法”也不是“过程”,那么,那个条目描述一个非过程值,且类别描述了这个值的种类。标题行
&who
条件类型
指示&who
是一个条件类型。标题行
unquote
辅助语法
指示unquote
是一个语法绑定,这个语法绑定只会作为特定周边表达式的部分出现。任何作为一个独立的句法结构或标识符的使用是一个语法错误。和“语法”条目一样,一些“辅助语法”条目带有一个语法后缀(扩展),指明结构的句法关键词以级别1导出。
6.5. 等价的条目
一个条目的描述偶尔会说它和另外一个条目是一样的。这意味着这两个条目是等价的。特别地,它意味着如果两个条目有一样的形式,且从不同的库导出,则两个库的条目可以使用同样的名字导入而没有冲突。
6.6. 求值(Evaluation)的例子
用在程序例子中的符号“⇒”可以被读作“的值是(evaluates to)”。比如,
(* 5 8) ⇒ 40
意味着表达式(* 5 8)
的值是对象40。或者,更精确地说:符号序列“(* 5 8)
”给出的表达式求值,在导入了相应的库的环境中,得到一个对象,这个对象在外部使用符号的序列“40
”表示。见4.3小节对对象外部表示的讨论。
“⇒”符号也在表达式的计算导致错误的时候使用。比如,
(integer->char #xD800)
⇒ &assertion
异常
意味着表达式(integer->char #xD800)
的求值必须抛出一个条件类型是&assertion
的异常。
此外,“⇒”符号也被用作显式地说明一个表达式的值是未定义的。比如:
(eqv? "" "")
⇒ 未定义的
通常,例子仅仅阐述了条目中指定的行为。可是在有些时候,它们帮助规范中模糊不清的地方消歧义,所以此时它们是规范性的。注意,在有些情况下,特别是在非精确数字对象的情况下,返回值只会有条件地或近似的指明。比如
(atan -inf.0)
⇒ -1.5707963267948965 ; 近似地
6.7. 命名惯例
依照惯例,将值存进上次分配的位置(见5.10小节)的过程的名字通常使用“!
”。
依照惯例,“->
”出现在以一个类型的对象作为参数,返回另一个类型的类似对象的过程名字中。比如,list->vector
接受一个表并返回一个元素和此表一样的向量。
按照惯例,谓词(predicates)—总是返回一个布尔的过程—以“?
”结尾,只有当名字不包含任何字母的时候,谓词才不以问号结尾。
按照惯例,复合名字的要素使用“-
”进行分隔。尤其,是一个实际单词或可以像一个实际单词一样发音的单词的前缀会跟着一个连字符,除非跟在连字符后面的第一个字符不是一个字母,在这种情况下,连字符可以省略。简单地说,连字符不会跟在不可发音的前缀(“fx”和“fl”)后面。
按照惯例,条件类型的名字以“&
”开头。
7. 库
库是一个程序可以被独立发布的部分。库系统支持库内的宏定义,宏导出,且区别需要定义和导出的不同阶段。本章为库定义了符号,且为库的扩展(expansion )和执行定义了语义。
7.1. 库形式
一个库定义必须有下面的形式:
(library <library name>
(export <export spec> ...)
(import <import spec> ...)
<library body>)
一个库的声明包含下面的要素:
<library name>
指定了库的名字(可能还有版本)。export
子形式指定一个导出的列表,这个列表命名了定义在或导入到这个库的绑定的子集。import
子形式指定了作为一个导入依赖列表导入的绑定,其中每一个依赖指定:- 导入的库的名字,且可以可选地包含它的版本,
- 相应的级别,比如,扩展(expand)或运行时(run time)(见7.2小节)和
- 为了在导入库中可用的库导出的子集,和为在导入库中可用的为每一个库导出准备的名字。
<library body>
是库的内部,由一系列定义和紧随其后的表达式组成。标识符可以既是本地的(未导出的)也是导出绑定的,且表达式是为它们的效果求值的初始化表达式。
一个标识符可以从两个或更多的库中使用相同的本地名字导入,或者使用两个不同的级别从相同的库中导入,只要每个库导出的绑定是一样的(也就是说,绑定在一个库中被定义,它只能通过导出和再导出经过导入)。否则,没有标识符可以被导入多次,被定义多次,或者同时被定义和导入。除了被显式地导入到库中或在库中定义的标识符,其它标识符在库中都是不可见的。
一个<library name>
在一个实现中唯一地标识一个库,且在实现中的其它所有的库的import
子句(clauses)(见下面)中是全局可见的。一个<library name>
有下面的形式:
(<identifier1> <identifier2> ... <version>)
其中<version>
或者是空的,或者有以下的形式:
(<sub-version> ...)
每一个<sub-version>
必须表示一个精确的非负整数对象。一个空的<version>
等价于()
。
一个<export spec>
命名一个集合,这个集合包含导入的和本地的定义,这个集合将被导出,可能还会使用不同的外部名字。一个<export spec>
必须是如下的形式当中的一个:
<identifier>
(rename (<identifier\(_1\)> <identifier\(_2\)>) ...)
在一个<export spec>
中,一个<identifier>
命名一个被定义在或被导入到库中的单独的绑定,其中,这个导入的外部名字和库中绑定的名字是一样的。一个rename
指明在每一个\(\texttt{(<identifier$_1$> <identifier$_2$>)}\)
这样的配对中,被命名为\(\texttt{<identifier$_1$>}\)
的绑定使用\(\texttt{<identifier$_2$>}\)
作为外部名字。
每一个<import spec>
指定一个被导入到库中的绑定的集合,在这个集合中,级别是可见的,且通过它可以知道本地的名字。一个<import spec>
必须是下面的一个:
<import set>
(for <import set> <import level> ...)
一个<import level>
是下面中的一个:
run
expand
(meta <level>)
其中<level>
表示一个精确的整数对象。
在一个<import level>
中,run
是(meta 0)
的缩写,且expand
是(meta 1)
的缩写。级别和阶段(phases)在7.2小节讨论。
一个<import set>
命名一个来自另一个库的绑定的集合,且可能为导入的绑定指定一个本地的名字。它必须是下面的一个:
<library reference>
(library <library reference>)
(only <import set> <identifier> ...)
(except <import set> <identifier> ...)
(prefix <import set> <identifier>)
(rename <import set> (<identifier\(_1\)> <identifier\(_2\)>) ...)
一个<library reference>
通过它的名字和可选的版本标识一个库。它有下面形式中的一个:
(<identifier\(_1\)> <identifier\(_2\)> ...)
(<identifier\(_1\)> <identifier\(_2\)> ... <version reference>)
一个第一个<identifier>
是for
, library
, only
, except
, prefix
,或rename
的<library reference>
只允许出现在一个library <import set>
中。否则<import set> (library <library reference>)
等价于<library reference>
。
一个没有<version reference>
(上面的第一个形式)的<library reference>
等价于<version reference>
是()
的<library reference>
。
一个<version reference>
指定它匹配的<version>
的一个子集。<library reference>
指定所有相同名字且版本匹配<version reference>
的库。一个<version reference>
有下面的形式:
(<sub-version reference\(_1\)> ... <sub-version reference\(_n\)>)
(and <version reference> ...)
(or <version reference> ...)
(not <version reference>)
第一个形式的一个<version reference>
匹配<version>
至少n个要素的,且<sub-version reference>
匹配对应的<sub-version>
。一个and <version reference>
匹配一个版本,如果所有的跟在and
后的<version references>
都匹配的话。相应地,or <version reference>
匹配一个版本,如果跟在or
后的一个<version references>
匹配的话。一个not <version reference>
匹配一个版本,如果跟在其后的<version reference>
都不匹配的话。
一个<sub-version reference>
有下列形式之一:
<sub-version>
(>= <sub-version>)
(<= <sub-version>)
(and <sub-version reference> ...)
(or <sub-version reference> ...)
(not <sub-version reference>)
第一个形式的一个<sub-version reference>
匹配一个版本,如果二者相等。第一个形式的>= <sub-version reference>
匹配一个子版本如果它大于等于跟在它后面的<sub-version>
;<=
与其类似。一个and <sub-version reference>
匹配一个子版本,如果所有随后的<sub-version reference>
都匹配的话。相应地,一个or <sub-version reference>
匹配一个子版本,如果随后的<sub-version reference>
中的一个匹配的话。一个not <sub-version reference>
匹配一个子版本,如果随后的<sub-version reference>
都不匹配的话。
例子:
版本参考(version reference) | 版本(version) | 匹配?(match?) |
() | (1) | yes |
(1) | (1) | yes |
(1) | (2) | no |
(2 3) | (2) | no |
(2 3) | (2 3) | yes |
(2 3) | (2 3 5) | yes |
(or (1 (>= 1)) (2)) | (2) | yes |
(or (1 (>= 1)) (2)) | (1 1) | yes |
(or (1 (>= 1)) (2)) | (1 0) | no |
((or 1 2 3)) | (1) | yes |
((or 1 2 3)) | (2) | yes |
((or 1 2 3)) | (3) | yes |
((or 1 2 3)) | (4) | no |
当多于一个库被库参考引用的时候,库的选择有实现定义的方法决定。
为了避免诸如不兼容的类型和重复的状态这些问题,实现必须禁止库名字由相同标识符序列组成但版本不匹配的两个库在同一个程序中共存。
默认情况下,一个被导入的库导出的所有的绑定在一个使用被导入的库给的绑定的名字的导入库中是可见的。被导入的绑定和那些绑定的名字的精确的集合可以通过下面描述的only
, except
, prefix
, 和rename
形式进行调整。
- 一个
only
形式产生来自另一个<import set>
的绑定的一个子集,只包括被列出的<identifier>
。被包含的<identifier>
必须在原始的<import set>
中。 - 一个
except
形式产生来自另一个<import set>
的绑定的一个子集,包括除了被列出的所有的<identifier>
。所有被排除的<identifier>
必须在原始的<import set>
中。 - 一个
prefix
从另一个<import set>
中添加一个<identifier>
前缀到每个名字中。 - 一个
rename
形式,\(\texttt{(rename (<identifier$_1$> <identifier$_2$>) ...)}\)
,从一个中间的<import set>
删除\(\texttt{<identifier$_1$> ...}\)
的绑定,然后将对应的\(\texttt{<identifier$_2$> ...})
添加回到最终的<import set>
中。每一个\(\texttt{<identifier$_1$>}\)
必须在原始的<import set>
中,每一个\(\texttt{<identifier$_2$>})
必须不在中间的<import set>
中,且\(\texttt{<identifier$_2$>})
必须是不一样的。
不符合上面的约束是一个语法错误。
一个库形式的<library body>
由被分类为定义或表达式的形式组成。哪些形式属于哪些类型是根据被导入的库和表达式的结果来决定的—见第10章。通常,不是定义(见11.2小节,有基本库可见的定义)的形式是表达式。
一个<library body>
和<body>
差不多(见11.3小节),除了一个<library body>
不需要包括任何表达式。它必须有下面的形式:
<definition> ... <expression> ...
当begin
, let-syntax
, 或letrec-syntax
形式先于第一个表达式出现在顶层内部的时候,它们被拼接成内部;见11.4.7小节。内部的一些或所以,包括在begin
, let-syntax
, 或letrec-syntax
形式里面的部分,可以通过一个句法抽象指定(见9.2小节)。
转换表达式和绑定像第10章描述的,按从左向右的顺序被求值和被创建。变量的表达式按从左向右求值,就像在一个隐式的letrec*
中,且内部的表达式也在变量定义的表达式之后从左向右进行求值。每一个导出的变量和它本地副本值得初始化都会创建一个新的位置。两次返回给内部最后表达式的继续的行为是未定义的。
注意:出现在库语法的名字library
, export
, import
, for
, run
, expand
, meta
, import
, export
, only
,except
, prefix
, rename
, and
, or
, not
, >=
, 和<=
是语法的一部分,且不是被保留的,也就是说,相同的名字可以在库中用作其它的用途,甚至以不同的含义导出或导入到其它库中,这些都不会影响它们在库形式中的使用。
在一个库的里面定义的绑定在库外面的代码中是不可见的,除非绑定被显式地从这个库中导出。可是,一个导出的宏可能隐式地导出一个另外的标识符,其是在库中定义的或导入到库中的。也就是说,它可以插入标识符的一个引用到其产生的代码中。
所有的显式地导出的变量在导出的和导入的的库中都是不可变的。因此,不管是在导入的还是导出的库中,一个显式地导出的变量出现在一个set!
表达式的左边是一个语法错误。
所有的隐式地导出的变量在导出的和导入的的库中也都是不可变的。因此,在一个变量被定义的库的外面通过宏产生的代码中,如果这个变量出现在一个set!
表达式的左边,那么这是一个语法错误。如果一个被赋值的变量的引用出现在这个变量被定义的库的外面通过宏产生的代码中,那么这也是一个语法错误,其中,一个被赋值的变量指出现在导出库中一个set!
表达式左边的变量。
所有其它的定义在一个库中的变量是可变的。
7.2. 导入和导出级别
扩展一个库可能需要来自其它库的运行时信息。比如,如果一个宏转换调用一个来自库A的过程,那么在库B中扩展宏的任何使用之前,库A必须被实例化(instantiated)。当库B作为一个程序的部分被最终运行的时候,库A可能不被需要,或者,它可能也被库B的运行时需要。库机制使用阶段来区别这些时间,这会在本小节解释。
每个库可用通过扩展时(expand-time)信息(最低限度地,它的导入的库,导出的关键词的一个列表,导出的变量的一个列表,计算转换表达式的代码)和运行时信息(最低限度地,计算变量定义的右边表达式的代码,计算内部表达式的代码)表现其特征。扩展时信息必须对任何导出绑定的扩展引用可见,且运行时信息必须对任何导出变量绑定的求值引用可见。
一个阶段(phase)是一段时间,在这段时间里库中的表达式被求值。在一个库的内部,顶层表达式和define
形式的右边在运行时,也就是阶段0,被求值,且define-syntax
形式的右边在扩展时,也就是阶段1,被求值。当define-syntax
, let-syntax
, 或letrec-syntax
出现在在阶段n被求值的代码中时,它们的右边将在阶段n + 1被求值。
这些阶段和库它自己使用的阶段是相关的。库的一个实例(instance)对应于一个与另一个库相关的特定阶段的它的变量定义和表达式的求值过程—一个叫做实例化(instantiation)的过程。比如,如果库B中的一个顶层表达式引用库A中导出的一个变量,那么它在阶段0(相对于B的阶段)从A的一个实例中引用这个导出。但是,B中一个阶段1的表达式引用A中相同的绑定,那么,它在阶段1(相对于B的阶段)从A的一个实例中引用这个导出。
一个库的访问(visit)对应于在一个特定阶段与另一个库相关的语法定义的计算过程—一个叫做访问(visiting)的过程。比如,如果库B中的一个顶层表达式引用来库A导出的一个宏,那么,它在阶段0(相对应B的阶段)从A的访问中引用这个导出,其对应于在阶段1宏转换表达式的求职过程。
一个级别(level)是一个标识符的词法属性,其决定了它可以在哪个阶段被引用。在一个库中,每个用定义绑定的标识符的级别是0;也就是说,在库中只能在阶段0引用这个标识符。除了导出库中标识符的级别之外,每一个导入的绑定的级别由导入库中import
的封装的for
形式决定。导入和导出级别通过所有级别组合的成对相加的方式组合。比如,一个以\(p_a\)
和\(p_b\)
级别导出,以\(q_a\)
,\(q_b\)
和\(q_c\)
级别导入的被导入的标识符的引用在以下级别是有效的:\(p_a + q_a\)
, \(p_a + q_b\)
, \(p_a + q_c\)
, \(p_b + q_a\)
, \(p_b + q_b\)
, 和\(p_b + q_c\)
。一个没有封装的for
的<import set>
等价于(for <import set> run)
,它和(for <import set> (meta 0))
是一样的。
对于所有的定义在导出库中的绑定来说,一个被导出的的绑定的级别是0。一个重新导出的绑带,也就是一个从其它库导入的导出,的级别和重新导出库中的绑定的有效导入级别是一样的。
对于定义在库报告中的库来说,几乎所有的绑定,导出级别是0。例外是来自(rnrs base (6))
库的syntax-rules
, identifier-syntax
, ...
, 和_
形式以级别1被导出,来自(rnrs base (6))
库的set!
形式以级别0和1被导出,来自复合(rnrs (6))
库(见库的第15章)的所有绑定以级别0和1被导出。
一个库中的宏扩展可以引出标识符的一个引用,其中这个标识符没有显式地导入到这个库中。在这种情况下,引用的阶段必须符合标识符的作为偏移的级别,这个偏移是源库(也就是提供标识符词法上下文的库)和封装引用的库的阶段的不同。比如,假设扩展一个库调用一个宏转换,且宏转换的求值引用一个标识符,这个标识符被从另一个库中被导出(所以,库的阶段1的实例被使用);进一步假设绑定的值是一个表示一个指示级别n绑定的标识符的语法对象;那么,在库被扩展的时候,标识符必须只能在n + 1阶段被使用。这个级别和阶段的组合就是为什么标识符负的级别是有用的,甚至,尽管库只存在非负的阶段。
如果在一个程序的扩展形式中,一个库的定义中的任何一个在阶段0被引用,那么被引用的库的一个作为阶段0实例会在程序的定义和表达式被求值之前被创建。这条规则的应用是透明的:如果一个库的扩展形式在阶段0从另一个库引用一个标识符,那么,在引用库在阶段n被实例化之前,被引用的库必须在阶段n被实例化。当一个标识符在任何大于0的阶段n被引用,那么于此相反,定义库会在阶段n被实例化,其在引用被求值之前的一些未定义的时间。同样地,在一个库的扩展期间,当一个宏关键词在阶段n被引用的时候,定义库在阶段n被访问,其是引用被计算之前的一定未定义的时间。
一个实现可以为不同的阶段区别实例/访问,或者在任何阶段使用一个实例/访问就像在任何其它阶段的一个实例/访问一样。更进一步,一个实现可以扩展每一个库形式以区别在任何阶段的库的访问和/或在大于0的阶段的库的实例。一个实现可以创建更多库的实例/访问在比要求的安全引用的更多的阶段。当一个标识符作为一个表达式出现在一个与标识符级别不一致的阶段时,那么一个实现可以抛出一个异常,异常的抛出可以在扩展时也可以在运行时,或者,它也可以允许这个引用。因此,一个库可能是不可移植的,当其含义依赖于一个库的实例在库的整个阶段或library
扩展时是有区别的还是共享的时候。
7.3. 例子
各种<import spec>
和<export spec>
的例子:
(注:下面的例子已根据勘误表更正。)
(library (stack)
(export make push! pop! empty!)
(import (rnrs)
(rnrs mutable-pairs))
(define (make) (list '()))
(define (push! s v) (set-car! s (cons v (car s))))
(define (pop! s) (let ([v (caar s)])
(set-car! s (cdar s))
v))
(define (empty! s) (set-car! s '())))
(library (balloons)
(export make push pop)
(import (rnrs))
(define (make w h) (cons w h))
(define (push b amt)
(cons (- (car b) amt) (+ (cdr b) amt)))
(define (pop b) (display "Boom! ")
(display (* (car b) (cdr b)))
(newline)))
(library (party)
;; 所有的导出:
;; make, push, push!, make-party, pop!
(export (rename (balloon:make make)
(balloon:push push))
push!
make-party
(rename (party-pop! pop!)))
(import (rnrs)
(only (stack) make push! pop!) ; 非空的!
(prefix (balloons) balloon:))
;; 以气球的堆栈创建一个派对(party),
;; 从两个气球开始
(define (make-party)
(let ([s (make)]) ; from stack
(push! s (balloon:make 10 10))
(push! s (balloon:make 12 9))
s))
(define (party-pop! p)
(balloon:pop (pop! p))))
(library (main)
(export)
(import (rnrs) (party))
(define p (make-party))
(pop! p) ; 显示"Boom! 108"
(push! p (push (make 5 5) 1))
(pop! p)) ; 显示"Boom! 24"
宏和阶段的例子:
(library (my-helpers id-stuff)
(export find-dup)
(import (rnrs))
(define (find-dup l)
(and (pair? l)
(let loop ((rest (cdr l)))
(cond
[(null? rest) (find-dup (cdr l))]
[(bound-identifier=? (car l) (car rest))
(car rest)]
[else (loop (cdr rest))])))))
(library (my-helpers values-stuff)
(export mvlet)
(import (rnrs) (for (my-helpers id-stuff) expand))
(define-syntax mvlet
(lambda (stx)
(syntax-case stx ()
[(_ [(id ...) expr] body0 body ...)
(not (find-dup (syntax (id ...))))
(syntax
(call-with-values
(lambda () expr)
(lambda (id ...) body0 body ...)))]))))
(library (let-div)
(export let-div)
(import (rnrs)
(my-helpers values-stuff)
(rnrs r5rs))
(define (quotient+remainder n d)
(let ([q (quotient n d)])
(values q (- n (* q d)))))
(define-syntax let-div
(syntax-rules ()
[(_ n d (q r) body0 body ...)
(mvlet [(q r) (quotient+remainder n d)]
body0 body ...)])))
8. 顶层程序
一个顶层程序为定义和运行一个Scheme程序制定一个入口点。一个顶层程序指定导入库和准备运行的程序的一个集合。通过被导入的库,不管是直接地还是通过导入的传递闭包(transitive closure),一个顶层程序定义了一个完整的Scheme程序。
8.1. 顶层程序语法
顶层程序是带分隔符的文本片段,通常是一个文件,其有如下的形式:
<import form> <top-level body>
一个<import form>
有如下的形式:
(import <import spec> ...)
一个<top-level body>
有如下的形式:
<top-level body form> ...
一个<top-level body form>
或者是一个<definition>
或者是一个<expression>
。
<import form>
和库中的导入子句是相同的(见7.1小节),且指定要导入的库的一个集合。一个<top-level body>
就像一个<library body>
(见7.1小节)一样,除了定义和表达式可以以任何次序出现。因此,<top-level body form>
指定的语法引用了宏扩展的结果。
当使用来自(rnrs base (6))
库的begin
, let-syntax
, 或letrec-syntax
的时候,如果其先于第一个表达式出现在顶层程序的内部时,那么它们被拼接到内部中;见11.4.7小节。内部的一些或所有,包括begin
, let-syntax
, 或letrec-syntax
里面的部分,可以通过一个句法抽象指定(见9.2小节)。
8.2. 顶层程序语义
一个顶层程序被执行的时候,程序就像一个库一样被对待,执行其定义和表达式。一个顶层内部的语义可以通过一个简单的转换将其转换到库内部来解释:在顶层内部中每一个出现在定义前的<expression>
被转换为一个哑(dummy)定义
(define <variable> (begin <expression> <unspecified>))
其中,<variable>
是一个新鲜的标识符,<unspecified>
是一个返回未定义值得无副作用的表达式。(如果不同时对内部进行扩展,那么,判断哪个形式是定义,哪个形式是表达式通常是不可能的,因此,实际的转换多少会更加复杂;见第10章。)
在支持它的平台上,一个顶层程序可以通过调用command-line
过程(见库的第10章)访问它的命令行。
9. 基本语法
在一个library
形式或顶层程序的import
形式的后面,构成库或顶层程序内部的形式依赖于被导入的库。尤其,被导入的句法关键词决定可用的句法抽象以及每个形式是一个定义还是一个表达式。可是,一些形式总是可用的,它们独立于被导入的库,包括常量字面量,变量引用,过程调用,和宏的使用。
9.1. 基本表达式类型(Primitive expression types)
本节的条目都是都是描述表达式,其可以出现在<expression>
句法变量的地方。也可以参见第11.4小节。
常量字面量
<number>
syntax <boolean>
syntax <character>
syntax <string>
syntax <bytevector>
syntax
一个由一个数字对象,或一个布尔,或一个字符,或一个字符串,或一个字节向量组成的表达式求值“等于它自己”。
145932 ⇒ 145932
#t ⇒ #t
"abc" ⇒ "abc"
#vu8(2 24 123) ⇒ #vu8(2 24 123)
就像5.10小节描述的那样,一个字面量表达式的值是不可改变的。
变量引用
<variable>
syntax
由一个变量组成的表达式(5.2小节)是一个变量引用,如果它不是一个宏使用(见下面)的话。这个变量引用的值是被存储在这个变量绑定的位置的值。引用一个未绑定的变量是一个语法错误。
下面的例子假设基本库已经被导入:
(define x 28)
x ⇒ 28
过程调用
(<operator> <operand1> ...)
语法
一个过程调用由被调用的过程表达式,传递给这个过程的参数以及两边的下括号组成。在一个表达式上下文中,如果<operator>
不是一个作为句法关键字绑定的标识符(见下面的9.2小节),那么这个形式是一个过程调用。
当一个过程调用被求值的时候,操作和操作数被(以一个未定义的顺序)求值,且最终产生的过程接受最终产生的参数。
下面的例子假设(rnrs base (6))
库已被导入:
(+ 3 4) ⇒ 7
((if #f + *) 3 4) ⇒ 12
如果<operator>
的值不是一个过程,那么一个条件类型是&assertion
的异常被抛出。并且,如果一个过程接受的参数的数量不是<operand>
的数量,那么一个条件类型是&assertion
的异常被抛出。
注意: 相比于其它的Lisp方言,求值的顺序是未定义的,且操作表达式和操作数表达式总是以相同的求值规则被求值。
此外,尽管求值的顺序是未定义,但是对操作和操作数表达式进行的任何并发求值的结果必须与按某种顺序求值的结果一致。对每个过程调用的求值顺序可以有不同的选择。
注意:在许多Lisp方言中,空组合式()
是合法的表达式。在Scheme中,写成表/点对形式的表达式至少要包含一个子表达式,因此()
不是一个语法上有效的表达式。
9.2. 宏
库的顶层程序可以定义和使用新的叫做句法抽象(syntactic abstraction)或宏派生表达式和定义。一个句法抽象通过绑定一个关键词到一个宏转换(macro transformer),或简称为转换(transformer),来创建。转换决定一个宏的使用(被称为宏使用(macro use))怎样被转录我一个更加基本的形式。
大部分宏有形式:
(<keyword> <datum> ...)
其中<keyword>
是唯一决定形式种类的标识符。这个标识符叫做宏的句法关键词(syntactic keyword),或简称为宏的关键词。<datum>
的数量和每一个的语法由句法抽象决定。
宏使用可以表现为不正确的表形式,单独的标识符或set!
形式,其中set!
形式的第二个子形式是关键字(见第11.19小节,库的第12.3小节):
(<keyword> <datum> ... . <datum>)
<keyword>
(set! <keyword> <datum>)
在11.2.2和11.18小节描述的define-syntax
, let-syntax
和letrec-syntax
形式创建关键词的绑定,将它们与宏转换的形式联系起来,且控制它们可见的范作用域。
在11.19小节描述的syntax-rules
和identifier-syntax
形式通过一个模式语言创建转换。并且,库的第12章描述的syntax-case
形式允许通过任意的Scheme代码创建转换。
关键词和变量占据相同的名字空间。也就是,在相同的作用域内,一个标识符可以被绑定到一个变量或一个关键词中的零个或一个,不能同时绑定到两个,且任何一种本地绑定可以覆盖任何一种其它的绑定。
使用syntax-rules
和identifier-syntax
定义的宏是“卫生的(hygienic)”和“引用透明的(referentially transparent)”,且因此保持了Scheme词法作用域的特点1819202122:
- 如果一个宏转换为一个没有出现在宏使用中的标识符(变量或关键词)插入一个绑定,就实际效果而言,该标识符在其整个作用域中将被改名使用,以避免与其他标识符冲突。
- 如果一个宏转换器插入了对某标识符的自由引用,那么,无论是否存在包围该宏的使用的局部绑定,该引用都将指向定义转换器时可见的绑定。
使用syntax-case
工具定义的宏也是卫生的,除非datum->syntax
(见库的第12.6小节)被使用。
10. 扩展过程
宏使用(见第9.2小节)在求值开始的时候(在编译或解释之前)通过语法扩展器(expander)被扩展为核心形式。核心形式的集合石实现定义的,在扩展器输出中这些形式的表示也是。如果扩展器遇到一个句法抽象,那么他会调用相关的转换器去扩展句法抽象,然后对转换器(transformer)返回的形式重复扩展过程。如果扩展器遇到一个核心形式,它会递归地处理表达式或定义上下文中它的子形式,如果有的话,且从被扩展的子形式中重建形式。关于标识符绑定的信息在为变量和关键词实施词法作用域扩展的时候被维持。
为了处理定义,扩展器从左向右地处理<body>
(见11.3小节)或<library body>
(见7.1小节)中的初始形式。扩展器怎样处理每个遇到的形式取决于形式的种类。
- 宏使用
- 扩展器调用相关的转换器来转换宏使用,然后对产生的形式递归地执行适当的操作。
define-syntax
形式- 扩展器扩展和求值右边的表达式,且绑定关键词到最终的转换器。
define
形式- 扩展器记录这样的事实直到所有的定义都被处理,被定义的标识符是一个变量,而不是右边表达式的推迟扩展。
begin
形式- 扩展器将子形式拼接到它正在处理的内部形式的表中。(见11.4.7小节)
let-syntax
或letrec-syntax
形成- 扩展器将里面的内部形式拼接到它正在处理的(外面的)内部形式的表中,使得通过
let-syntax
和letrec-syntax
绑定的关键词只在里面的内部形式可见。 - 表达式,也就是,非定义
- 扩展器完成推迟的右边表达式和内部当前的即遗留的表达式的扩展,且然后从被定义的变量,被扩展的右边的表达式,和被扩展的内部表达式创建等价于
letrec*
的形式。
对于一个变量定义的右边,扩展被推迟到所以的定义可见之后。因此,如果可以的话,右边的每个关键词和变量引用都解析到本地绑定。
在形式序列中的一个定义必须不能定义任意下列的标识符,其绑定被用作判断定义或形式序列中任何在其之前的定义的含义。比如,下列表达式的内部违反了这个限制:
(let ()
(define define 17)
(list define))
(let-syntax ([def0 (syntax-rules ()
[(_ x) (define x 0)])])
(let ([z 3])
(def0 z)
(define def0 list)
(list z)))
(let ()
(define-syntax foo
(lambda (e)
(+ 1 2)))
(define + 2)
(foo))
下面的没有违反这个限制:
(let ([x 5])
(define lambda list)
(lambda x x)) ⇒ (5 5)
(let-syntax ([def0 (syntax-rules ()
[(_ x) (define x 0)])])
(let ([z 3])
(define def0 list)
(def0 z)
(list z))) ⇒ (3)
(let ()
(define-syntax foo
(lambda (e)
(let ([+ -]) (+ 1 2))))
(define + 2)
(foo)) ⇒ -1
实现应当将违反限制当作语法错误对待。
注意这个算法不直接地再处理任何形式。它要求整个定义中一个单独的从左到右的途径,其后是表达式和推迟的右手边里的一个单独的途径(任何顺序)。
例如:
(lambda (x)
(define-syntax defun
(syntax-rules ()
[(_ x a e) (define x (lambda a e))]))
(defun even? (n) (or (= n 0) (odd? (- n 1))))
(define-syntax odd?
(syntax-rules () [(_ n) (not (even? n))]))
(odd? (if (odd? x) (* x x) x)))
在这个例子中,第一次遇到defun
的定义,且关键词defun
与转换器相关,转换器从扩展和对应的右手边的求值得来。defun
的一个使用在接下来被遇到,且扩展到一个define
形式中。这个定义形式右手边的扩展是推迟的。odd?
的定义是下一个且是与其相关的关键词odd?
的结果,其转换器从对应的右手边的扩展和求值得来。odd?
的一个使用出现在旁边,且被扩展;作为结果的对not
的调用被认为是一个表达式,这是因为not
作为一个变量被绑定。此时,扩展器完成当前表达式(not
的调用)和被推迟的even?
定义右侧的扩展;出现在这些表达式中的odd?
的使用通过使用与odd?
关联的转换器扩展。最终的输出等价于:
(lambda (x)
(letrec* ([even?
(lambda (n)
(or (= n 0)
(not (even? (- n 1)))))])
(not (even? (if (not (even? x)) (* x x) x)))))
尽管输出的结构是实现定义的。
因为定义被表达式在一个<top-level body>
中可以交错地出现(见第8章),所以<top-level body>
扩展器的处理有时更加复杂。它的行为想上面描述的<body>
或<library body>
以及以下例外:当扩展器发现一个非定义,它推迟其扩展并继续扫描定义。一旦它到达形式集合 的结尾,那么它处理推迟的右手边和内部表达式,然后从被定义的变量中生成等价于letrec*
的形式,扩展右手边表达式,且扩展内部表达式。对于每一个出现在内部变量定义之前的内部表达式<expression>
,在对应的地方一个哑绑定被创建以letrec*
绑定的集合的形式,其左边是一个新鲜的临时变量,右边等价于(begin <expression> <unspecified>)
,其中<unspecified>
是没有副作用的,所以从左到右的求值顺序被保留。begin
的包装使得<expression>
可以求值得到任意数量的值。
11. 基本库
本章描述Scheme的(rnrs base (6))
库,其导出了很多通常和Scheme一起的过程和语法绑定。
第11.20小节定义了来自(rnrs base (6))
库的从结构上识别尾调用和尾上下文的规则。
11.1. 基本类型
没有变量满足下列谓词中的多个:
boolean? pair?
symbol? number?
char? string?
vector? procedure?
null?
这些谓词定义了基本的类型布尔,点对,符号,数字,字符,字符串,向量,以及过程。此外,空表是一个特殊的对象,它有自己的类型。
注意,尽管有一个单独的布尔类型,但是,任何Scheme值在条件测试中都可以被当作一个布尔值使用;见5.7小节。
11.2. 定义
定义出现在一个<top-level body>
(8.1小节)中,<library body>
的最上面(7.1小节),或<body>
的最上面(11.3小节)。
一个<definition>
可以是一个变量定义(11.2.1小节),或一个关键词定义(11.2.1小节)。扩展到定义或定义组(打包在一个begin
, let-syntax
, 或letrec-syntax
形式中见11.4.7小节)中的宏使用也可以出现在任何其它定义可以出现的地方。
11.2.1. 变量定义
本节描述的define
形式是一个用作创建变量绑定的<definition>
,且可以出现在其它定义可以出现的任何地方。
(define <variable> <expression>) | 语法 |
(define <variable>) | 语法 |
(define (<variable> <formals>) <body>) | 语法 |
(define (<variable> . <formal>) <body>) | 语法 |
define
的第一个形式绑定<variable>
到一个新的位置,然后将<expression>
的值赋值给这个位置。
(define add3
(lambda (x) (+ x 3)))
(add3 3) ⇒ 6
(define first car)
(first '(1 2)) ⇒ 1
<expression>
的继续不应该被调用多于一次。
实现的责任:实现应当检测<expression>
的继续被调用多于一次的情况。如果实现检测到这个的话,它必须抛出一个条件类型是&assertion
的异常。
define
的第二种形式等价于
(define <variable> <unspecified>)
其中<unspecified>
是一个返回未定义值得无副作用的表达式。
在define
的第三个形式中,<formals>
必须或者是零个或多个变量的序列,或者是一个或多个变量的序列,其跟着一个点.
和另一个变量(就像在一个lambda
表达式中一样,见11.4.2小节)。这个形式等价于
(define <variable>
(lambda (<formals>) <body>)).
在define
的第四个形式中,<formal>
必须是一个单独的变量。这个形式等价于
(define <variable>
(lambda <formal> <body>)).
11.2.2. 语法定义
本节描述的define-syntax
形式是一个用作创建关键词绑定的<definition>
,其可以出现在任何其它定义可以出现的地方。
(define-syntax <keyword> <expression>)
语法
绑定<keyword>
到<expression>
的值,其必须在宏扩展的阶段求值得到一个转换器。宏转换器可以使用11.19小节描述的syntax-rules
和identifier-syntax
形式创建。见库的第12.3小节,那儿有一个转换器更全面的描述。
通过define-syntax
建立的关键词绑定在其出现的整个内部都是可见的,除非被其它绑定覆盖外都是可见的,就像define
建立的变量绑定一样。通过一组定义建立的绑定,不管是关键词还是变量定义,在定义它们自己中是可见的。
实现的责任:实现应该检测<expression>
的值是不是一个适当的转换器。
例子:
(let ()
(define even?
(lambda (x)
(or (= x 0) (odd? (- x 1)))))
(define-syntax odd?
(syntax-rules ()
((odd? x) (not (even? x)))))
(even? 10)) ⇒ #t
从左到右的处理顺序(第10章)的言外之意是一个定义可以影响后续的形式是否也是一个定义。
例子:
(let ()
(define-syntax bind-to-zero
(syntax-rules ()
((bind-to-zero id) (define id 0))))
(bind-to-zero x)
x) ⇒ 0
任何出现在let
表达式外面的bind-to-zero
的绑定都不会影响其行为。
11.3. 内部
lambda
, let
, let*
, let-values
, let*-values
, letrec
, 或letrec*
表达式的<body>
,或由零个或多个跟着一个或多个表达式的定义。
<definition> ... <expression1> <expression2> ...
通过一个定义定义的标识符在<body>
中局部的。也就是说,标识符被绑定到,且绑定的作用域是这个<body>
(见第5.2小节)。
例子
(let ((x 5))
(define foo (lambda (y) (bar x y)))
(define bar (lambda (a b) (+ (* a b) a)))
(foo (+ x 3))) ⇒ 45
当begin
, let-syntax
, 或letrec-syntax
形式先于第一个表达式出现在内部的时候,它们被拼接到内部;见第11.4.7小节。内部的一些或所以,包括begin
, let-syntax
, 或letrec-syntax
形式里面的部分,可以通过一个宏使用指定(见第9.2小节)。
一个包含变量定义的被扩展的<body>
(见第10章)总是可以被转换成一个等价的letrec*
表达式。比如,上面例子中的let
表达式等价于
(let ((x 5))
(letrec* ((foo (lambda (y) (bar x y)))
(bar (lambda (a b) (+ (* a b) a))))
(foo (+ x 3))))
11.4. 表达式
本节的条目描述(rnrs base (6))
库中的表达式,除了第9.1小节描述的基本表达式类型,其可以出现在<expression>
句法变量的位置中。
11.4.1. 引用(Quotation)
(quote <datum>)
语法
语法:<Datum>
应该是一个句法数据。
语义:quote <datum>)
的值是<datum>
表示的数据值(见第4.3小节)。这个符号被用作包含常量。
(quote a) ⇒ a
(quote #(a b c)) ⇒ #(a b c)
(quote (+ 1 2)) ⇒ (+ 1 2)
正如第4.3.5小节所说,(quote <datum>)
可以使用缩写'<datum>
:
'"abc" ⇒ "abc"
'145932 ⇒ 145932
'a ⇒ a
'#(a b c) ⇒ #(a b c)
'() ⇒ ()
'(+ 1 2) ⇒ (+ 1 2)
'(quote a) ⇒ (quote a)
''a ⇒ (quote a)
正如第5.10小节所说,常量是不可变得。
注意:一个quote
表达式值的不同常数可以共享相同的位置。
11.4.2 过程
(lambda <formals> <body>)
语法
语法:<Formals>
必须是一个下面描述的形参(formal parameter)列表,且<body>
必须和第11.3小节描述的一样。
语义:lambda
表达式的值是过程。当lambda
表达式被求值时的有效环境被作为过程的一部分被记忆。当过程随后以一些参数被调用的时候,lambda
表达式被求值时使用的环境通过绑定参数列表中的变量到新的位置的方式被扩展,且相应的实参值被存储到那些位置。然后,lambda
表达式内部的表达式(其可能包含定义,因此可能表现为一个letrec*
形式,见第11.3小节)在扩展的环境中被顺序地求值。内部最后一个表达式的结果作为过程调用的结果被返回。
(lambda (x) (+ x x)) ⇒ 一个过程
((lambda (x) (+ x x)) 4) ⇒ 8
((lambda (x)
(define (p y)
(+ y 1))
(+ (p x) x))
5) ⇒ 11
(define reverse-subtract
(lambda (x y) (- y x)))
(reverse-subtract 7 10) ⇒ 3
(define add4
(let ((x 4))
(lambda (y) (+ x y))))
(add4 6) ⇒ 10
<Formals>
必须有下列的形式之一:
\(\texttt{(<variable$_1$> ...)}\)
:过程拥有固定数量的参数。当过程被调用时,参数将被存储在相应变量的绑定中。<variable>
:过程拥有任意数量的参数。当过程被调用时,实参的序列被转换为一个新创建的表,该表存储在的绑定中。\(\texttt{(<variable$_1$> ... <variable$_n$> . <variable$_{n+1}$>)}\)
:如果一个由空格分隔的.
出现在最后一个变量之前,该过程就拥有n个或更多个参数,这里的n是句点前面形参的个数(至少要有一个)。存储在最后一个参数绑定中的值是一个新创建的表。除了已和其他形参匹配的所有其他实参外,剩余的实参都被存入该表中。
((lambda x x) 3 4 5 6) ⇒ (3 4 5 6)
((lambda (x y . z) z)
3 4 5 6) ⇒ (5 6)
在<formals>
中任何<variable>
必须不能出现超过一次。
11.4.3. 条件表达式(Conditionals)
(if <test> <consequent> <alternate>) | 语法 |
(if <test> <consequent>) | 语法 |
语法:<Test>
, <consequent>
, 和<alternate>
必须是表达式。
语义:if
表达式按如下方式计算:首先,计算<test>
的值。如果产生一个真值(见第5.7小节),然后<consequent>
被计算,且它的值被返回。否则,<alternate>
被计算,且它的值被返回。如果<test>
产生#f
且没有指定<alternate>
,那么,表达式的结果是未定义的。
(if (> 3 2) 'yes 'no) ⇒ yes
(if (> 2 3) 'yes 'no) ⇒ no
(if (> 3 2)
(- 3 2)
(+ 3 2)) ⇒ 1
(if #f #f) ⇒ unspecified
<Consequent>
和<alternate>
表达式在尾上下文中,如果if
表达式它自己在的话;见第11.20小节。
11.4.4. 赋值
(set! <variable> <expression>)
语法
<Expression>
被计算,且结果值被存进<variable>
绑定的位置。必须在包含`set!`表达式的区域或顶层被绑定。`set!`表达式的结果是未定义的。
(let ((x 2))
(+ x 1)
(set! x 4)
(+ x 1)) ⇒ 5
如果<variable>
引用一个不可修改的绑定,那么这时一个语法错误。
注意:标识符set!
同时以级别1被导出。见第11.19小节。
11.4.5. 派生条件表达式(Derived conditionals)
(cond <cond clause1> <cond clause2> ...) | 语法 |
=> | 辅助语法 |
else | 辅助语法 |
语法:每一个 <cond clause>
必须是形式
(<test> <expression1> ...)
其中<test>
是一个表达式。或有另一种选择,一个<cond clause>
可以是形式
(<test> => <expression>)
最后一个<cond clause>
可以是一个“else
子句”,其有形式
(else <expression1> <expression2> ...)
。
语义:一个cond
表达式通过以下方式求值,按顺序连续地对<test>
表达式进行求值直到它们其中一个的值是真值(见第5.7小节)。当一个<test>
的值是真值的时候,就会顺序地对它<cond clause>
中剩余的<expression>
进行求值,且<cond clause>
中最后一个<expression>
的结果会作为整个cond
表达式的结果被返回。如果被选择的<cond clause>
只包含<test>
且没有<expression>
,那么<test>
的值会作为结果被返回。如果被选择的<cond clause>
使用=>
辅助形式,那么<expression>
被计算。它的值必须是一个过程。这个过程必须接受一个参数;它被以<test>
的值调用,且过程返回的值作为cond
表达式的值返回。如果所有的<test>
的值都是#f
,并且没有else
子句,那么条件表达式返回未定义的值;如果有一个else
子句,那么它的<expression>
被计算,且最后一个的值被返回。
(cond ((> 3 2) 'greater)
((< 3 2) 'less)) ⇒ greater
(cond ((> 3 3) 'greater)
((< 3 3) 'less)
(else 'equal)) ⇒ equal
(cond ('(1 2 3) => cadr)
(else #f)) ⇒ 2
对于一个有下列的形式之一的<cond clause>
(<test> <expression1> ...)
(else <expression1> <expression2> ...)
最后一个<expression>
在尾上下文中,如果cond
形式它自己在的话。一个如下形式的<cond clause>
(<test> => <expression>)
来自<expression>
求值结果的过程的(隐式)调用在尾上下文中如果cond
形式它自己在的话。见第11.20小节。
一个更简单形式的cond
的参考定义可以在附录B中被找到。
\(\texttt{(case <key> <case clause$_1$> <case clause$_2$> ...)}\)
语法
语法:<Key>
必须是一个表达式。每一个<case clause>
必须有下列形式之一:
((<datum\(_1\)> ...) <expression\(_1\)> <expression\(_2\)> ...)
(else <expression\(_1\)> <expression\(_2\)> ...)
第二个形式,其指定一个“else
子句”,只可以作为最后一个<case clause>
出现。每一个<datum>
是一些对象的一个外部表示。<Datum>
表示的数据不需要有区别。
语义:一个case
按如下求值。<key>
被求值,且它的结果被和每个<case clause>
中的<datum>
表示的数据轮流比较,比较的依据是eqv?
(见第11.5小节),以从左到右的顺序在整个子句的集合中进行。如果求值后<key>
的值等于一个<case clause>
的数据,对应的表达式被从左向右地求值,且<case clause>
最后一个表达式的结果将作为case
表达式的结果被返回。如果求值后的<key>
的值和每个子句中的数据都不一样,那么如果有一个else
子句的话,它的表达式被计算且最后一个的结果作为case
表达式的结果被返回;否则case
表达式的返回未定义的值。
; 本示例已根据勘误表修改
(case (* 2 3)
((2 3 5 7) 'prime)
((4 6 8 9) 'composite)) ⇒ composite
(case (car '(c d))
((a) 'a)
((b) 'b)) ⇒ unspecified
(case (car '(c d))
((a e i o u) 'vowel)
((w y) 'semivowel)
(else 'consonant)) ⇒ consonant
一个<case clause>
的最后一个<expression>
在尾上下文中,如果case
表达式它自己在的话;见第11.20小节。
\(\texttt{(and <test$_1$> ...)}\)
语法
语法:<Test>
必须是一个表达式。
语义:如果没有<test>
,#t
被返回。否则<test>
表达式被从左向右地求值,直到一个<test>
返回#f
,或到达最后一个<test>
。前一种情况下,and
表达式在不计算剩余表达式的情况下返回#f
。后一种情况,最后一个表达式被计算且它的值被返回。
(and (= 2 2) (> 2 1)) ⇒ #t
(and (= 2 2) (< 2 1)) ⇒ #f
(and 1 2 'c '(f g)) ⇒ (f g)
(and) ⇒ #t
and
关键词可以使用syntax-rules
(见第11.19小节)根据if
进行定义,如下所示:
(define-syntax and
(syntax-rules ()
((and) #t)
((and test) test)
((and test1 test2 ...)
(if test1 (and test2 ...) #f))))
最后一个<test>
表达式在尾上下文中,如果and
表达式它自己在的话;见第11.20小节。
\(\texttt{(or <test$_1$> ...)}\)
语法
语法:<Test>
必须是表达式。
语义:如果没有<test>
,那么#f
被返回。否则,<test>
按照从左到右的顺序被求值,直到一个<tesst>
返回真值val(见第5.7小节),或到达最后一个<test>
。在前一种情况,or
表达式在不计算剩余表达式的情况下返回val。后一种情况,最后一个表达式被求值,且它的值被返回。
(or (= 2 2) (> 2 1)) ⇒ #t
(or (= 2 2) (< 2 1)) ⇒ #t
(or #f #f #f) ⇒ #f
(or '(b c) (/ 3 0)) ⇒ (b c)
or
关键词可以使用syntax-rules
(见第11.19小节)根据if
进行定义,如下所示:
(define-syntax or
(syntax-rules ()
((or) #f)
((or test) test)
((or test1 test2 ...)
(let ((x test1))
(if x x (or test2 ...))))))
最后一个<test>
表达式在尾上下文中,如果or
表达式它自己也在的话;见第11.20小节。
11.4.6. 绑定结构
本节描述的绑定结构为变量创建本地绑定,它们只可以在一个限定的区域可见。结构let
, let*
, letrec
, 和letrec*
的语法是一样的,但是它们为它们的变量绑定建立的作用域(region)(见5.2小节)是不一样的,且绑定的值计算的顺序是不一样的。在一个let
表达式中,初始值被计算在任何变量被绑定之前;在一个let*
表达式中,绑定和求值依次地执行。在一个letrec
或letrec*
表达式中,当所有的绑定正在被计算的时候所以的绑定生效,因此允许相互递归的定义。在一个letrec
表达式中,初始值在赋值给变量之前被计算;在一个letrec*
中,计算和赋值依次地进行。
此外,绑定结构let-values
和let*-values
使得let
和let*
更加通用,起允许多个变量绑定到值是多个值得表达式的结果。在建立作用域的方面,它们类似于let
和let*
:在一个let-values
表达式中,初始值被计算在任何变量被绑定之前;在一个let*-values
表达式中,绑定依次进行。
本节提到的所有绑定形式根据更简单形式的参考定义可以在附录B中找到。
(let <bindings> <body>)
语法
语法:<Bindings>
必须有形式
\(\texttt{((<variable$_1$> <init$_1$>) ...)}\)
,
其中,每一个<init>
是一个表达式,且<body>
如第11.3小节描述。在<variable>
中任何变量不能出现超过一次。
语义:<Init>
在当前的环境被求值(以一个未定义的顺序),<variable>
被绑定到存有结果的新鲜的位置,<body>
在扩展后的环境被求值,且<body>
的最后一个表达式的值被返回。每个<variable>
的绑定都将<body>
作为它的作用域。
(let ((x 2) (y 3))
(* x y)) ⇒ 6
(let ((x 2) (y 3))
(let ((x 7)
(z (+ x y)))
(* z x))) ⇒ 35
另参见命名let
,见第11.16小节。
(let* <bindings> <body>)
语法
语义:<Bindings>
必须是形式
\(\texttt{((<variable$_1$> <init$_1$>) ...)}\)
,
其中,每一个<init>
是一个表达式,且<body>
如第11.3小节描述。
语义:let*
形式类似于let
,但是<init>
的求值和绑定的创建是从左向右顺序进行的,但其作用域不但包括<body>
,还包括其右边的部分。因此,第二个<init>
在第一个绑定可见且初始化的环境中被计算,以此类推。
(let ((x 2) (y 3))
(let* ((x 7)
(z (+ x y)))
(* z x))) ⇒ 70
注意:通过let
表达式绑定的变量必须是不一样的,而通过let*
表达式绑定的变量则没有这个限制。
(letrec <bindings> <body>)
语法
语法:<Bindings>
必须有形式
\(\texttt{((<variable$_1$> <init$_1$>) ...)}\)
,
其中,每一个<init>
是一个表达式,且<body>
如第11.3小节描述。在<variable>
中任何变量不能出现超过一次。
语义:<variable>
被绑定到新的位置,<init>
在结果环境中被求值(以一些未定义的顺序),每一个<variable>
被分配给对应的<init>
的结果,<body>
在结果环境中被求值,且<body>
中最后一个表达式的值被返回。每个<variable>
的绑定将整个letrec
表达式作为它的作用域,这使得定义相互递归的过程成为可能。
(letrec ((even?
(lambda (n)
(if (zero? n)
#t
(odd? (- n 1)))))
(odd?
(lambda (n)
(if (zero? n)
#f
(even? (- n 1))))))
(even? 88))
⇒ #t
在不赋值或引用任何<variable>
的值的情况下,计算每个<init>
应该是可能的。在letrec
的大部分常规使用中,所有的<init>
是lambda
表达式,此时限制被自动满足。另一个限制是,每个<init>
的继续不能被调用多于一次。
实现的责任:实现必须在<init>
表达式求值(使用一个特定的求值顺序且顺序<init>
表达式的值)期间检测<variable>
的引用。如果实现检测到这样一个限制的违反,它必须抛出一个条件类型是&assertion
的异常。实现可以也可以不检测每个<init>
的继续是否被调用多于一次。可是,如果实现检测到的话,它必须抛出一个条件类型是&assertion
的异常。
(letrec* <bindings> <body>)
语法
语法:<Bindings>
必须有形式
\(\texttt{((<variable$_1$> <init$_1$>) ...)}\)
,
其中,每一个<init>
是一个表达式,且<body>
如第11.3小节描述。在<variable>
中任何变量不能出现超过一次。
语义:<Variable>
被绑定到新鲜的位置,每个<variable>
被按从左向右的顺序分配给对应的<init>
的求值结果,<body>
在结果环境中被求值,且<body>
中最后一个表达式的值被返回。尽管求值和赋值的顺序是从左向右的,但是每一个<variable>
的绑定将整个letrec*
表达式作为其作用域,这使得定义相互递归的过程成为可能。
(letrec* ((p
(lambda (x)
(+ 1 (q (- x 1)))))
(q
(lambda (y)
(if (zero? y)
0
(+ 1 (p (- y 1))))))
(x (p 5))
(y x))
y)
⇒ 5
在不赋值或引用对应的<variable>
或任何在<bindings>
跟随它的任何绑定的<variable>
的值的情况下,计算每个<init>
必须是可能的。另一个限制是每个<init>
的继续不能被调用多于一次。
实现的责任:实现必须在<init>
表达式求值期间检测<variable>
或任何在<bindings>
跟随它的任何绑定的<variable>
的引用。如果实现检测到这样一个限制的违反,它必须抛出一个条件类型是&assertion
的异常。实现可以也可以不检测每个<init>
的继续是否被调用多于一次。可是,如果实现检测到的话,它必须抛出一个条件类型是&assertion
的异常。
(let-values <mv-bindings> <body>)
语法
语法:<Mv-bindings>
必须有形式
\(\texttt{((<formals$_1$> <init$_1$>) ...)}\)
,
其中,每一个<init>
是一个表达式,且<body>
如第11.3小节描述。在<formals>
集合中任何变量必须不能出现超过一次。
语义:<Init>
在当前的环境中被求值(以一些未定义的顺序),且出现在<formals>
中的变量被绑定到包含<init>
返回值的新鲜位置,其中<formals>
匹配返回值就像lambda
表达式中的<formals>
在过程调用中匹配参数一样。然后,<body>
在扩展后的环境中被求值,且<body>
中最后一个表达式的值被返回。每个变量绑定将<body>
作为它的作用域。如果<formals>
不匹配的话,那么一个条件类型是&assertion
的异常被抛出。
(let-values (((a b) (values 1 2))
((c d) (values 3 4)))
(list a b c d)) ⇒ (1 2 3 4)
(let-values (((a b . c) (values 1 2 3 4)))
(list a b c)) ⇒ (1 2 (3 4))
(let ((a 'a) (b 'b) (x 'x) (y 'y))
(let-values (((a b) (values x y))
((x y) (values a b)))
(list a b x y))) ⇒ (x y a b)
(let*-values <mv-bindings> <body>)
语法
语法:<Mv-bindings>
必须有形式
\(\texttt{((<formals$_1$> <init$_1$>) ...)}\)
,
其中,每一个<init>
是一个表达式,且<body>
如第11.3小节描述。在每个<formals>
中,任何变量必须不能出现超过一次。
语义:let*-value
形式类似于let-value
,但是<init>
被计算和绑定被创建是按从左到右的顺序进行的,每个<formals>
绑定的作用域除了<body>
还包括它的右边。因此,第二个<init>
在第一个<formals>
可见且被初始化的环境中被求值,以此类推。
(let ((a 'a) (b 'b) (x 'x) (y 'y))
(let*-values (((a b) (values x y))
((x y) (values a b)))
(list a b x y))) ⇒ (x y x y)
注意:通过let-values
表达式绑定的变量必须是不一样的,而通过let*-values
表达式的不同<formals>
绑定的变量则没有这个限制。
11.4.7. 顺序结构(Sequencing)
(begin <form> ...) | 语法 |
(begin <expression> <expression> ...) | 语法 |
<Begin>
关键词有两个不同的作用,取决于它的上下文:
它可以作为一个形式出现在一个
<body>
中(见第11.3小节),一个<library body>
中(见第7.1小节),或一个<top-level body>
(见第3章),或直接嵌套在一个内部的begin
形式中。在这种情况下,begin
形式必须有第一个标题行指定的形状。begin
的这种用法作为一种拼接(splicing)形式—<body>
里面的形式被拼接到内部周围,就好像原来的begin
包装不存在一样。<Body>
或<library body>
中的begin
形式必须是非空的,如果它在内部出现在第一个<expression>
之后。它可以作为一个普通的表达式出现,且必须有第二个标题行指定的形状。在这种情况下,
<expression>
被按从左到右的顺序求值,且最后一个<expression>
的值被返回。这种表达式类型被用作按顺序排列副作用,如赋值或输入输出。
(define x 0)
(begin (set! x 5)
(+ x 1)) ⇒ 6
(begin (display "4 plus 1 equals ")
(display (+ 4 1))) ⇒ unspecified
并打印 4 plus 1 equals 5
11.5 等价谓词
一个谓词是一个总是返回布尔值(#t
或#f
)的过程。一个等价谓词在计算上模拟数学上的等价关系(它是对称的(symmetric),自反的(reflexive),且传递的(transitive))。在本节表述的等价谓词中,eq?
是最好或最精细的,equal?
是最粗糙的。eqv?
比eq?
的辨别能力稍差。
\(\texttt{(eqv? obj$_1$ obj$_2$)}\)
过程
eqv?
定义在对象上定义一个有用的等价关系。简单地说,它返回#t
,如果obj11和obj22在通常情况下被认为是相等的对象的话,否则返回#f
。这种关系不太好解释,但下面所列的eqv?
部分规范必须被所有的实现遵守。
eqv?
过程在以下情况返回#t
:
- Obj11和obj22都是布尔,且根据
boolean=?
过程它们是一样的(第11.8小节)。 - Obj11和obj22都是符号,且根据
symbol=?
过程它们是一样的(第11.10小节)。 - Obj11和obj22都是精确数,且在数学上相等(见
=
,第11.7小节)。 - Obj11和obj22都是非精确数字对象,且在数学上相等(见
=
,第11.7小节),且作为参数传递给任意其它可以通过Scheme标准算术过程定义的过程时产生的结果都是一样的(从eqv?
的意义上说),只要计算过程中不涉及非数。(本句已根据勘误表补全。) - Obj11和obj22都是字符,且根据
char=?
过程它们是一样的(见第11.11小节)。 - Obj11和obj22都是空表。
- Obj11和obj22都是对象,比如点对,向量,字节向量(库的第2章),字符串,记录(库的第6章),端口(库的第8.2小节),或哈希表(库的第13章),且指向相同的存储位置(第5.10小节)。(原文中有一个重复的“哈希表”,已被删除。)
- Obj11和obj22都是记录类型(record-type)描述符,它们在库的第6.3小节被指定为是
eqv?
等价的。
eqv?
过程在以下情况返回#f
:
- Obj11和obj22是不同的类型(第11.1小节)。
- Obj11和obj22是布尔,但
boolean=?
过程返回#f
。 - Obj11和obj22是符号,但
symbol=?
过程返回#f
。 - Obj11和obj22一个是精确数字对象,另一个是非精确数字对象。
- Obj11和obj22是有理数字对象,但
=
过程返回#f
。 - Obj11和obj22作为参数传递给任意其它可以通过Scheme标准算术过程定义的过程时产生不一样的结果(从
eqv?
的意义上说),只要计算过程中不涉及非数。(本句已根据勘误表补全。) - Obj11和obj22是字符,但
char=?
过程返回#f
。 - Obj11和obj22一个是空表,但另一个不是。
- Obj11和obj22是对象,比如点对,向量,字节向量(库的第2章),字符串,记录(库的第6章),端口(库的第8.2小节),或哈希表(库的第13章),但指向不同的位置。
- Obj11和obj22是点对,向量,字符串,或记录,或哈希表,向其内部应用相同的访问器(也就是
car
,cdr
,vector-ref
,string-ref
, 或记录访问器)但产生的值在eqv?
下返回#f
。 - Obj11和obj22是过程,但对于某些参数有不同的行为(返回不同的值或有不同的副作用)。
注意:当obj11和obj22是数字对象时,`eqv?`过程返回`#t`并不意味着`=`在相同的obj11和obj22参数下也返回`#t`。
(eqv? 'a 'a) ⇒ #t
(eqv? 'a 'b) ⇒ #f
(eqv? 2 2) ⇒ #t
(eqv? '() '()) ⇒ #t
(eqv? 100000000 100000000) ⇒ #t
(eqv? (cons 1 2) (cons 1 2)) ⇒ #f
(eqv? (lambda () 1)
(lambda () 2)) ⇒ #f
(eqv? #f 'nil) ⇒ #f
下面的例子展示了上面的规则没有完全定义的eqv?
的行为。对于这些情况,我们只能说eqv?
的返回值必须是一个布尔。
(let ((p (lambda (x) x)))
(eqv? p p)) ⇒ unspecified
(eqv? "" "") ⇒ unspecified
(eqv? '#() '#()) ⇒ unspecified
(eqv? (lambda (x) x)
(lambda (x) x)) ⇒ unspecified
(eqv? (lambda (x) x)
(lambda (y) y)) ⇒ unspecified
(eqv? +nan.0 +nan.0) ⇒ unspecified
下面的例子集合展示了对有本地状态的过程使用eqv?
的情况。对gen-counter
的每一次调用都必须付汇一个不同的过程,因为每个过程都有它自己内部的计数。gen-loser
的调用返回的过程被调用的时候行为是一样的。然而,eqv?
可以不检测这种相等。
(define gen-counter
(lambda ()
(let ((n 0))
(lambda () (set! n (+ n 1)) n))))
(let ((g (gen-counter)))
(eqv? g g)) ⇒ unspecified
(eqv? (gen-counter) (gen-counter))
⇒ #f
(define gen-loser
(lambda ()
(let ((n 0))
(lambda () (set! n (+ n 1)) 27))))
(let ((g (gen-loser)))
(eqv? g g)) ⇒ unspecified
(eqv? (gen-loser) (gen-loser))
⇒ unspecified
(letrec ((f (lambda () (if (eqv? f g) 'both 'f)))
(g (lambda () (if (eqv? f g) 'both 'g))))
(eqv? f g)) ⇒ unspecified
(letrec ((f (lambda () (if (eqv? f g) 'f 'both)))
(g (lambda () (if (eqv? f g) 'g 'both))))
(eqv? f g)) ⇒ #f
实现可以在适当的时候在常量间共享结构。(根据勘误表,此处省略一句话。)因此,作用在常量上的eqv?
的返回值有时是实现定义的。
(eqv? '(a) '(a)) ⇒ unspecified
(eqv? "a" "a") ⇒ unspecified
(eqv? '(b) (cdr '(a b))) ⇒ unspecified
(let ((x '(a)))
(eqv? x x)) ⇒ #t
\(\texttt{(eq? obj$_1$ obj$_2$)}\)
过程
eq?
谓词和eqv?
类似,除了在一些情况其识别差别的能力比eqv?
更加精细之外。
eq?
和eqv?
确保在符号,布尔,空表,点对,过程,非空字符串,字节向量,和向量,以及记录的行为是一样的。eq?
在数字对象,字符上的行为是实现定义的,但是它总是或者返回#t
或者返回#f
,且只有当eqv?
返回#t
时它才有可能返回#t
。eq?
谓词在空表,空向量,空字节向量和空字符串上的行为也可以是不一样的。
(eq? 'a 'a) ⇒ #t
(eq? '(a) '(a)) ⇒ unspecified
(eq? (list 'a) (list 'a)) ⇒ #f
(eq? "a" "a") ⇒ unspecified
(eq? "" "") ⇒ unspecified
(eq? '() '()) ⇒ #t
(eq? 2 2) ⇒ unspecified
(eq? #\A #\A) ⇒ unspecified
(eq? car car) ⇒ unspecified(本条已根据勘误表修改)
(let ((n (+ 2 3)))
(eq? n n)) ⇒ unspecified
(let ((x '(a)))
(eq? x x)) ⇒ #t
(let ((x '#()))
(eq? x x)) ⇒ unspecified
(let ((p (lambda (x) x)))
(eq? p p)) ⇒ unspecified
\(\texttt{(equal? obj$_1$ obj$_2$)}\)
过程
equal?
谓词返回#t
当且仅当它的参数(可能无限地)到正则树(regular trees)的展开作为有序树是一样的(ordered trees)。
equal?
谓词对待点对和向量作为有出边(outgoing edges)的节点,使用string=?
比较字符串,使用bytevector=?
比较字节向量(见库的第2章),且使用eqv?
比较其它节点。
(equal? 'a 'a) ⇒ #t
(equal? '(a) '(a)) ⇒ #t
(equal? '(a (b) c)
'(a (b) c)) ⇒ #t
(equal? "abc" "abc") ⇒ #t
(equal? 2 2) ⇒ #t
(equal? (make-vector 5 'a)
(make-vector 5 'a)) ⇒ #t
(equal? '#vu8(1 2 3 4 5)
(u8-list->bytevector
'(1 2 3 4 5)) ⇒ #t
(equal? (lambda (x) x)
(lambda (y) y)) ⇒ unspecified
(let* ((x (list 'a))
(y (list 'a))
(z (list x y)))
(list (equal? z (list y x))
(equal? z (list x x))))
⇒ (#t #t)
注意:equal?
必须总是可以终止的,哪怕它的参数存在循环。
11.6. 过程谓词
(procedure? obj)
过程
返回#t
如果obj是一个过程,否则返回#f
。
(procedure? car) ⇒ #t
(procedure? 'car) ⇒ #f
(procedure? (lambda (x) (* x x)))
⇒ #t
(procedure? '(lambda (x) (* x x)))
⇒ #f
11.7. 算术(Arithmetic)
这里描述的过程实现了在第3章描述的数值塔上通用的算术。本节描述的通用过程既接受精确数也接受非精确数对象作为其参数,并根据它们参数的数值子类型执行强制转换和选取适当的操作。
库的第11章描述了定义其它数值过程的库。
11.7.1. 精确性和非精确性的传播
下面列出的过程在传递给它们的参数都是精确的时候必须返回数学上正确的精确结果:
+ - *
max min abs
numerator denominator gcd
lcm floor ceiling
truncate round rationalize
real-part imag-part make-rectangular
下面列出的过程当传递给它们的参数都是精确的且没有除数是零的时候必须返回正确的精确结果:
/
div mod div-and-mod
div0 mod0 div0-and-mod0
此外,过程expt
必须返回正确的精确结果,当传递给它的第一个参数是一个精确的实数对象且第二个参数是一个精确的整数对象。
通用的规则是,一般操作返回正确精确的结果,当所有传递给它们的参数都是精确的且结果是数学上明确定义的,但是当任何一个参数是非精确的时候返回一个非精确结果。这条规则的例外包括sqrt
, exp
, log
, sin
, cos
, tan
, asin
, acos
, atan
, expt
, make-polar
, magnitude
, 和angle
,其甚至可以(但不要求)在传递精确参数的时候返回非精确的结果,如这些过程的规范所示。
上面规则的一个普遍的例外是,一个实现可以返回一个精确结果尽管其参数是非精确的,但这个精确的结果对于所有可能的对这个非精确参数的精确替代,都应该是正确的。一个例子是(* 1.0 0)
,其可以返回0
(精确地)或0.0
(非精确的)。
11.7.2. 无穷大和非数的表示性(Representability)
数值操作的规范被书写就好像无穷大和非数是可以表示的,且指定许多操作,这些操作和数字对象相关,其在方法上和IEEE-754的二进制浮点算术标准相一致。Scheme的一个实现可以也可以不表示无穷大和非数;可是,一个实现必须抛出一个可继续的条件类型是&no-infinities
或&no-nans
(分别地见库的第11.3小节)的异常,在任何不能表示一个按规范说明的无穷大或非数的时候。在这种情况下,异常处理程序的继续是一个可以接受无穷大或非数的继续。这个要求也适用于数字对象和外部表示之间的转换,包括读取程序源代码。
11.7.3 常用操作的语义
一些操作是几个算术过程的语义基础。本节描述的这些操作的行为用作以后的参考。
11.7.3.1. 整数除法
Scheme执行整数除法的操作依赖于数学操作div, mod, div00, 和mod00,它们定义如下:
div, mod, div00, 和mod00每个都接受两个实数x11和x22做为操作数,其中x22必须是非零。
div返回一个整数,mod返回一个实数。它们的结果规定如下:
其中
例子:
div00和mod00与div和mod类似,除了mod00的结果在一个以零为中点的半开的区间中。它们的结果规定如下:
其中
例子:
11.7.3.2. 超越函数(Transcendental functions)
通常,超越函数\(\log\)
, \(\sin^{-1}\)
(arcsine), \(\cos^{-1}\)
(arccosine), 和\(\tan^{-1}\)
是多重定义的。\(\log z\)
被定义为虚部的值域是\(-\pi\)
(包括,如果区分-0.0
的话,否则不包括)到\(\pi\)
(包括)。\(\log 0\)
是未定义的。
对于非实数的\(z\)
,\(\log z\)
根据实数上的log定义如下
其中\(\mathrm{angle}~z\)
是\(z = a\cdot e^{ib}\)
按如下方式指定的角
其中,\(-\pi \leq \mathrm{angle}~z\leq \pi\)
,且对某些整数\(n\)
,\(\mathrm{angle}~z = b+2\pi n\)
。
在一个参数log定义版本的基础上,两参数版本\(\log\)
, \(\sin^{-1} z\)
, \(\cos^{-1} z\)
,\(\tan^{-1} z\)
, 和两参数版本\(\tan^{-1}\)
的值可以根据下列公式定义:
\(\tan^{-1} x~y\)
的值域如下表所示。星号(*)指示这个条目适用于区别负零的实现。
11.7.4. 数值操作
11.7.4.1. 数值类型谓词
(number? obj) | 过程 |
(complex? obj) | 过程 |
(real? obj) | 过程 |
(rational? obj) | 过程 |
(integer? obj) | 过程 |
这些数值类型谓词可以被应用于任何类型的参数。如果对象是命名类型的数字对象,它们返回#t
,否则返回#f
。通常,如果一个类型谓词对一个数字对象返回真,那么,所有更高的类型谓词对那些数字对象也返回真。因此,如果一个类型谓词对一个数字对象返回假,那么,所有更低的类型谓词对那些数字对象也返回假。
如果z是一个复数对象,那么(real? z)
为真,当且仅当(zero? (imag-part z))
和(exact? (imag-part z))
同时为真。
如果x是一个实数对象,那么(rational? x)
为真,当且仅当存在精确的整数对象k11和k22使得\(\texttt{(= x (/ k$_1$ k$_2$))}\)
和\(\texttt{(= (numerator x) k$_1$)}\)
和\(\texttt{(= (denominator x) k$_2$)}\)
都为真。因此,无限大和非数不是有理数对象。
如果q是一个有理数字对象,那么,(integer? q)
为真,当且仅当如果(= (denominator q) 1)
为真。如果q不是一个有利数字对象,那么(integer? q)
是#f
。
(complex? 3+4i) ⇒ #t
(complex? 3) ⇒ #t
(real? 3) ⇒ #t
(real? -2.5+0.0i) ⇒ #f
(real? -2.5+0i) ⇒ #t
(real? -2.5) ⇒ #t
(real? #e1e10) ⇒ #t
(rational? 6/10) ⇒ #t
(rational? 6/3) ⇒ #t
(rational? 2) ⇒ #t
(integer? 3+0i) ⇒ #t
(integer? 3.0) ⇒ #t
(integer? 8/4) ⇒ #t
(number? +nan.0) ⇒ #t
(complex? +nan.0) ⇒ #t
(real? +nan.0) ⇒ #t
(rational? +nan.0) ⇒ #f
(complex? +inf.0) ⇒ #t
(real? -inf.0) ⇒ #t
(rational? -inf.0) ⇒ #f
(integer? -inf.0) ⇒ #f
注意:除了number?
之外,这些类型谓词的行为在非精确数字对象上是不可靠的,因为任何不精确都可以影响结果。
(real-valued? obj) | 过程 |
(rational-valued? obj) | 过程 |
(integer-valued? obj) | 过程 |
这些数值类型谓词可被应用于任何类型的参数。real-valued?
过程返回#t
,如果这个对象是一个数字对象且在=
的意义上等于某个实数对象,或如果这个对象是一个非数,或一个实部是非数虚部在zero?
的意义上是零的复数对象。rational-valued?
和integer-valued?
过程返回#t
,如果这个对象是一个数字对象,且在=
的意义下等于名字中的类型的某些对象,否则返回#f
。
(real-valued? +nan.0) ⇒ #t
(real-valued? +nan.0+0i) ⇒ #t
(real-valued? -inf.0) ⇒ #t
(real-valued? 3) ⇒ #t
(real-valued? -2.5+0.0i) ⇒ #t
(real-valued? -2.5+0i) ⇒ #t
(real-valued? -2.5) ⇒ #t
(real-valued? #e1e10) ⇒ #t
(rational-valued? +nan.0) ⇒ #f
(rational-valued? -inf.0) ⇒ #f
(rational-valued? 6/10) ⇒ #t
(rational-valued? 6/10+0.0i) ⇒ #t
(rational-valued? 6/10+0i) ⇒ #t
(rational-valued? 6/3) ⇒ #t
(integer-valued? 3+0i) ⇒ #t
(integer-valued? 3+0.0i) ⇒ #t
(integer-valued? 3.0) ⇒ #t
(integer-valued? 3.0+0.0i) ⇒ #t
(integer-valued? 8/4) ⇒ #t
注意:这些过程测试一个给定的数字对象在住损失数值精度的情况下是否可以被正确地转换为指定的类型。特别地,这些谓词的行为和real?
, rational?
, 和integer?
在虚部是非精确的零的复数对象上的行为是不一样的。
注意:这些类型谓词在非精确数字对象上的行为是不可靠的,这是因为任何的非精确可能影响结果。
(exact? z) | 过程 |
(inexact? z) | 过程 |
这些数值谓词给出了量的精确性的测试。对任意的数字对象,有且只有一个谓词的值为真。
(exact? 5) ⇒ #t
(inexact? +inf.0) ⇒ #t
11.7.4.2. 通用转换
(inexact z) | 过程 |
(exact z) | 过程 |
inexact
过程返回z
的非精确表示。如果适当类型的非精确数字对象被绑定了精度,那么,返回值是一个接近参数的非精确数字对象。如果一个精确参数没有合理地接近非精确等价物,那么一个条件类型是&implementation-restriction
(此异常类型已根据勘误表修改)的异常可以被抛出。
注意:对于一个量级有限的实数对象,如果它大到以至于没有合理的作为一个非精确数的合理的近似,一个合理的非精确等价物可以是+inf.0
或-inf.0
。类似地,一个各部分都是有限的复数对象的非精确表示可以有无限的部分。
exact
过程返回z
的一个精确表示。返回值是数值上最接近于参数的精确数字对象;在大部分情况下,这个过程的结果应当在数值上等于它的参数。如果一个非精确参数没有合理的精确等价物,那么一个条件类型是&implementation-restriction
(此异常类型已根据勘误表修改)的异常可以被抛出。
这些过程在一个实现定义的范围中实现了精确和非精确整数对象的自然的一一对应。
inexact
和exact
过程是幂等(idempotent)的。
11.7.4.3. 算术操作
\(\texttt{(= z$_1$ z$_2$ z$_3$ ...)}\) | 过程 |
\(\texttt{(< x$_1$ x$_2$ x$_3$ ...)}\) | 过程 |
\(\texttt{(> x$_1$ x$_2$ x$_3$ ...)}\) | 过程 |
\(\texttt{(<= x$_1$ x$_2$ x$_3$ ...)}\) | 过程 |
\(\texttt{(>= x$_1$ x$_2$ x$_3$ ...)}\) | 过程 |
这些过程返回#t
,如果它们的参数(分别地):相等,单调递增,单调递减,单调非递减,单调非递增,其它情况返回#f
。
(= +inf.0 +inf.0) ⇒ #t
(= -inf.0 +inf.0) ⇒ #f
(= -inf.0 -inf.0) ⇒ #t
对于任何的既不是无穷大也不是非数的实数对象x
(以下条目已根据勘误表修改):
(< -inf.0 x +inf.0)) ⇒ #t
(> +inf.0 x -inf.0)) ⇒ #t
对任何数字对象z
:
(= +nan.0 z) ⇒ #f
对任何实数对象x
,
(< +nan.0 x) ⇒ #f
(> +nan.0 x) ⇒ #f
这些谓词必须是传递的。
注意:这些谓词在类Lisp语言的传统实现中不是传递的。
注意:尽管用这些谓词比较非精确数字对象是可以的,但是,结果可能是不可靠的,这时因为很小的不精确都可能影响结果;对`=`和`zero?`(下面)尤其是这样。
如果有疑问的话,请咨询数值分析师。
(zero? z) | 过程 |
(positive? x) | 过程 |
(negative? x) | 过程 |
(odd? n) | 过程 |
(even? n) | 过程 |
(finite? x) | 过程 |
(infinite? x) | 过程 |
(nan? x) | 过程 |
这些数值谓词测试一个数字对象的一个特定的属性,返回#t
或#f
。zero?
过程测试数字对象是否=
零,positive?
测试是否大于零,negative?
测试是否小于零,odd?
测试是否是奇数,even?
测试是否是偶数,finit?
测试是否既不是无穷大也不是一个非数,infinite?
测试是否是一个无穷大,nan?
测试是否是一个非数。
(zero? +0.0) ⇒ #t
(zero? -0.0) ⇒ #t
(zero? +nan.0) ⇒ #f
(positive? +inf.0) ⇒ #t
(negative? -inf.0) ⇒ #t
(positive? +nan.0) ⇒ #f
(negative? +nan.0) ⇒ #f
(finite? +inf.0) ⇒ #f
(finite? 5) ⇒ #t
(finite? 5.0) ⇒ #t
(infinite? 5.0) ⇒ #f
(infinite? +inf.0) ⇒ #t
注意:就上面的谓词而言,结果可能是不可靠的,这时因为一个晓得不精确都可以影响结果。
\(\texttt{(max x$_1$ x$_2$ ...)}\) | 过程 |
\(\texttt{(min x$_1$ x$_2$ ...)}\) | 过程 |
这些过程返回它们参数的最大值和最小值。
(max 3 4) ⇒ 4
(max 3.9 4) ⇒ 4.0
对于任何不是非数的实数对象x(本句已根据勘误表修改):
(max +inf.0 x) ⇒ +inf.0
(min -inf.0 x) ⇒ -inf.0
注意:如果每个参数都是非精确的,那么结果也是非精确的(除非过程可以证明误差没有大到可以影响结果,这只有在不寻常的实现中才有可能)。如果min
和max
被用作比较混合有不同精确性的对象,且结果的数值值也不能在不丢失准确的情况下被表示成一个非精确数,那么这个过程抛出一个条件类型是&implementation-restriction
的异常。
\(\texttt{(+ z$_1$ ...)}\) | 过程 |
\(\texttt{(* z$_1$ ...)}\) | 过程 |
这些过程返回它们的参数的和和积。
(+ 3 4) ⇒ 7
(+ 3) ⇒ 3
(+) ⇒ 0
(+ +inf.0 +inf.0) ⇒ +inf.0
(+ +inf.0 -inf.0) ⇒ +nan.0
(* 4) ⇒ 4
(*) ⇒ 1
(* 5 +inf.0) ⇒ +inf.0
(* -5 +inf.0) ⇒ -inf.0
(* +inf.0 +inf.0) ⇒ +inf.0
(* +inf.0 -inf.0) ⇒ -inf.0
(* 0 +inf.0) ⇒ 0 or +nan.0
(* 0 +nan.0) ⇒ 0 or +nan.0
(* 1.0 0) ⇒ 0 or 0.0
对任何既不是无穷大也不是非数的实数对象x:
(+ +inf.0 x) ⇒ +inf.0
(+ -inf.0 x) ⇒ -inf.0
对任何实数对象x:
(+ +nan.0 x) ⇒ +nan.0
对任何不是精确的0的x:
(* +nan.0 x) ⇒ +nan.0
如果这些过程中任何一个被用于混合了非有理实数和非实数复数参数,它们或者抛出一个条件类型是&implementation-restriction
的异常或者返回一个未定义的数字对象。
区别-0.0
的实现必须接受和下面例子一致行为:
(+ 0.0 -0.0) ⇒ 0.0
(+ -0.0 0.0) ⇒ 0.0
(+ 0.0 0.0) ⇒ 0.0
(+ -0.0 -0.0) ⇒ -0.0
\(\texttt{(- z)}\) | 过程 |
\(\texttt{(- z$_1$ z$_2$ z$_3$ ...)}\) | 过程(已根据勘误表修改) |
有两个或多个参数时,这个过程以左结合的方式返回它参数的差。有一个参数时,它返回它参数的加法逆元。
(- 3 4) ⇒ -1
(- 3 4 5) ⇒ -6
(- 3) ⇒ -3
(- +inf.0 +inf.0) ⇒ +nan.0
如果这个过程被用于混合了非有理实数和非实数复数参数,它们或者抛出一个条件类型是&implementation-restriction
的异常或者返回一个未定义的数字对象。
区别-0.0
的实现必须接受和下面例子一致行为:
(- 0.0) ⇒ -0.0
(- -0.0) ⇒ 0.0
(- 0.0 -0.0) ⇒ 0.0
(- -0.0 0.0) ⇒ -0.0
(- 0.0 0.0) ⇒ 0.0
(- -0.0 -0.0) ⇒ 0.0
\(\texttt{(/ z)}\) | 过程 |
\(\texttt{(/ z$_1$ z$_2$ z$_3$ ...)}\) | 过程(已根据勘误表修改) |
如果所有的参数都是精确的,那么除数必须是非零。有两个或多个参数时,这个过程以左结合的方式返回它参数的商。有一个参数时,它返回它参数的除法逆元。
(/ 3 4 5) ⇒ 3/20
(/ 3) ⇒ 1/3
(/ 0.0) ⇒ +inf.0
(/ 1.0 0) ⇒ +inf.0
(/ -1 0.0) ⇒ -inf.0
(/ +inf.0) ⇒ 0.0
(/ 0 0) ⇒ &assertion异常
(/ 3 0) ⇒ &assertion异常
(/ 0 3.5) ⇒ 0.0
(/ 0 0.0) ⇒ +nan.0
(/ 0.0 0) ⇒ +nan.0
(/ 0.0 0.0) ⇒ +nan.0
如果这个过程被用于混合了非有理实数和非实数复数参数,它们或者抛出一个条件类型是&implementation-restriction
的异常或者返回一个未定义的数字对象。
(abs x)
过程
返回它参数的绝对值。
(abs -7) ⇒ 7
(abs -inf.0) ⇒ +inf.0
\(\texttt{(div-and-mod x$_1$ x$_2$)}\) | 过程 |
\(\texttt{(div x$_1$ x$_2$)}\) | 过程 |
\(\texttt{(mod x$_1$ x$_2$)}\) | 过程 |
\(\texttt{(div0-and-mod0 x$_1$ x$_2$)}\) | 过程 |
\(\texttt{(div0 x$_1$ x$_2$)}\) | 过程 |
\(\texttt{(mod0 x$_1$ x$_2$)}\) | 过程 |
这些过程实现了数论整数除法,且返回对应于第11.7.3.1小节指定的数学运算的结果。如果x1x1和x2x2是精确的,x2x2必须是非零。在这些过程实现了数论整数除法,且返回对应于第11.7.3.1小节中的数学要求不能被任何数字对象满足的情况下,或者一个条件类型是&implementation-restriction
的异常被抛出,或者未定义的数字对象(对于div
,mod
, div0
和mod0
来说是一个,对于div-and-mod
和div0-and-mod0
来说是两个)被返回(本段已根据勘误表修改)。
(div \(x_1\) \(x_2\)) ⇒ \(x_1\) div \(x_2\)
(mod \(x_1\) \(x_2\)) ⇒ \(x_1\) mod \(x_2\)
(div-and-mod \(x_1\) \(x_2\)) ⇒ \(x_1\) div \(x_2\), \(x_1\) mod \(x_2\)
; 两个返回值
(div0 \(x_1\) \(x_2\)) ⇒ \(x_1\) div0 \(x_2\)
(mod0 \(x_1\) \(x_2\)) ⇒ \(x_1\) mod0 \(x_2\)
(div0-and-mod0 \(x_1\) \(x_2\))
⇒ \(x_1\) div0 \(x_2\), \(x_1\) mod0 \(x_2\)
; 两个返回值
\(\texttt{(gcd n$_1$ ...)}\) | 过程 |
\(\texttt{(lcm n$_1$ ...)}\) | 过程 |
这些过程返回它们参数的最大公因数或最小公倍数。结果总是非负的。
(gcd 32 -36) ⇒ 4
(gcd) ⇒ 0
(lcm 32 -36) ⇒ 288
(lcm 32.0 -36) ⇒ 288.0
(lcm) ⇒ 1
(numerator q) | 过程 |
(denominator q) | 过程 |
这些过程返回它们参数的分子或分母;结果根据其参数的最简分数计算。分母总是正的。0的分母被定义为1。
(numerator (/ 6 4)) ⇒ 3
(denominator (/ 6 4)) ⇒ 2
(denominator
(inexact (/ 6 4))) ⇒ 2.0
(floor x) | 过程 |
(ceiling x) | 过程 |
(truncate x) | 过程 |
(round x) | 过程 |
对于不是无穷大或非零的非精确参数,这些过程返回非精确的整数对象。对于这些参数,floor
过程返回不大于x的最大整数对象。ceiling
过程返回不小于x的最小整数对象。truncate
过程返回绝对值不大于x绝对值的最接近x的整数对象。round
过程返回最接近x的整数对象,当x正好在两个整数的中间位置时舍入到偶数。
注意:如果这些过程中的一个参数是非精确的,那么结果也是非精确的。如果需要一个精确的值,结果应该被传递给`exact`过程。
尽管无穷大和非数不是整数对象,这些过程会返回一个无穷大当给一个无穷大参数时,返回一个非数当给一个非数时。
(floor -4.3) ⇒ -5.0
(ceiling -4.3) ⇒ -4.0
(truncate -4.3) ⇒ -4.0
(round -4.3) ⇒ -4.0
(floor 3.5) ⇒ 3.0
(ceiling 3.5) ⇒ 4.0
(truncate 3.5) ⇒ 3.0
(round 3.5) ⇒ 4.0
(round 7/2) ⇒ 4
(round 7) ⇒ 7
(floor +inf.0) ⇒ +inf.0
(ceiling -inf.0) ⇒ -inf.0
(round +nan.0) ⇒ +nan.0
\(\texttt{(rationalize x$_1$ x$_2$)}\) | 过程 |
retionalize
过程返回一个与x1x1和差值不大于x2x2的最简有理数(simplest rational number)(本句已根据勘误表修改)。有理数r1r1比有理数r2r2更简单(simpler)意味着\(r_1 = p_1/q_1\)
,\(r_2 = p_2/q_2\)
(以最简分数表示),且\(|p_1| \leq |p_2|\)
,且\(|q_1| \leq |q_2|\)
。因此3/5比4/7更简单。尽管不是所有的有理数都可以用这种顺序比较(考虑2/7和3/5),但是任何区间都包含一个比区间中的任何其它有理数都简单的有理数(比较简单的2/5位于2/7和3/5之间)。注意0 = 0/1是所有有理数中最简单的一个。
(rationalize (exact .3) 1/10)
⇒ 1/3
(rationalize .3 1/10)
⇒ #i1/3 ; 大约
(rationalize +inf.0 3) ⇒ +inf.0
(rationalize +inf.0 +inf.0) ⇒ +nan.0
(rationalize 3 +inf.0) ⇒ 0.0
前两个例子只在非精确实数对象有足够精度时有效。
\(\texttt{(exp z)}\) | 过程 |
\(\texttt{(log z)}\) | 过程 |
\(\texttt{(log z$_1$ z$_2$)}\) | 过程 |
\(\texttt{(sin z)}\) | 过程 |
\(\texttt{(cos z)}\) | 过程 |
\(\texttt{(tan z)}\) | 过程 |
\(\texttt{(asin z)}\) | 过程 |
\(\texttt{(acos z)}\) | 过程 |
\(\texttt{(atan z)}\) | 过程 |
\(\texttt{(atan x$_1$ x$_2$)}\) | 过程 |
这些过程计算通常的超越函数。exp
过程计算以e为基数的z的指数。有一个参数的log
过程计算z的自然对数(不是以十为基数的对数);\(\texttt{(log $z_1$ $z_2$)}\)
计算以z2z2为基数的z1z1的对数。asin
,acos
和atan
过程分别计算反正弦,反余弦和反正切。两个参数版本的atan
计算\(\texttt{(angle (make-rectangular $x_2$ $x_1$))}\)
。
基本的数学运算见第11.7.3.2小节。当传递非精确数作为参数的时候这些过程可以返回非精确的结果。
(exp +inf.0) ⇒ +inf.0
(exp -inf.0) ⇒ 0.0
(log +inf.0) ⇒ +inf.0
(log 0.0) ⇒ -inf.0
(log 0) ⇒ &assertion异常
(log -inf.0)
⇒ +inf.0+3.141592653589793i
; 大约
(atan -inf.0)
⇒ -1.5707963267948965 ; 大约
(atan +inf.0)
⇒ 1.5707963267948965 ; 大约
(log -1.0+0.0i)
⇒ 0.0+3.141592653589793i ; 大约
(log -1.0-0.0i)
⇒ 0.0-3.141592653589793i ; 大约
; 如果区别-0.0的话
(sqrt z)
过程
返回z的主平方根。对于实数z,结果或者是正的实部,或者是零实部和非负的虚部。根据第11.7.3.2小节定义的log
,(sqrt z)
的值可以被表示成\(e^{\frac{\log z}{2}}\)
。
当传递的参数是一个精确的参数时,sqrt
过程可以返回一个非精确的结果。
(sqrt -5)
⇒ 0.0+2.23606797749979i ; 大约
(sqrt +inf.0) ⇒ +inf.0
(sqrt -inf.0) ⇒ +inf.0i
(exact-integer-sqrt k)
过程
exact-integer-sqrt
过程返回两个非负精确整数对象s和r,其中\(k = s^2 + r\)
且\(k < (s+1)^2\)
。
(exact-integer-sqrt 4) ⇒ 2 0
; 两个返回值
(exact-integer-sqrt 5) ⇒ 2 1
; 两个返回值
\(\texttt{(expt $z_1$ $z_2$)}\)
过程
返回z1z1的z2z2次幂。对于非零的z1z1,是\(e^{z_2 \log z_1}\)
。\(0.0^{z}\)
是1.0如果z = 0.0,或0.0如果(real-part z)
是正的。在其它第一个参数是零的情况下,或者抛出一个条件类型是&implementation-restriction
的异常,或者一个未定义的数字对象呗返回。
对一个精确的实数对象z1z1和一个精确的整数对象z2z2,\(\texttt{(expt $z_1$ $z_2$)}\)
必须返回一个精确的结果。对于其它所有的z1z1和z2z2,\(\texttt{(expt $z_1$ $z_2$)}\)
可以返回一个非精确的结果,甚至当z1z1和z2z2都是精确的时候。
(expt 5 3) ⇒ 125
(expt 5 -3) ⇒ 1/125
(expt 5 0) ⇒ 1
(expt 0 5) ⇒ 0
(expt 0 5+.0000312i) ⇒ 0.0(本条已根据勘误表修改)
(expt 0 -5) ⇒ 未定义
(expt 0 -5+.0000312i) ⇒ 未定义
(expt 0 0) ⇒ 1
(expt 0.0 0.0) ⇒ 1.0
\(\texttt{(make-rectangular x$_1$ x$_2$)}\) | 过程 |
\(\texttt{(make-polar x$_3$ x$_4$)}\) | 过程 |
\(\texttt{(real-part z)}\) | 过程 |
\(\texttt{(imag-part z)}\) | 过程 |
\(\texttt{(magnitude z)}\) | 过程 |
\(\texttt{(angle z)}\) | 过程 |
假设a1a1,a2a2,a3a3和a4a4是实数,且c是一个复数,那么下面的式子成立:
如果x1x1,x2x2,x3x3和x4x4分别是表示a1a1,a2a2,a3a3和a4a4的数字对象,那么,\(\texttt{(make-rectangular $x_1$ $x_2$}\)
返回c,\(\texttt{(make-polar $x_3$ $x_4$)}\)
也返回c。
(make-rectangular 1.1 2.2)
⇒ 1.1+2.2i ; 大约
(make-polar 1.1 2.2)
⇒ 1.1@2.2 ; 大约
对应地,如果\(-\pi \leq a_4 \leq \pi\)
,且如果z是一个表示c的数字对象,那么(real-part z)
返回a1a1,(imag-part z)
返回a2a2,(magnitude z)
返回a3a3,(angle z)
返回a4a4。
(real-part 1.1+2.2i) ⇒ 1.1 ; 大约
(imag-part 1.1+2.2i) ⇒ 2.2 ; 大约(本条已根据勘误表修改)
(magnitude 1.1@2.2) ⇒ 1.1 ; 大约
(angle 1.1@2.2) ⇒ 2.2 ; 大约
(angle -1.0)
⇒ 3.141592653589793 ; 大约
(angle -1.0+0.0i)
⇒ 3.141592653589793 ; 大约
(angle -1.0-0.0i)
⇒ -3.141592653589793 ; 大约
; 如果区别-0.0的话
(angle +inf.0) ⇒ 0.0
(angle -inf.0)
⇒ 3.141592653589793 ; 大约
此外,假设x1x1和x2x2是这样的,x1x1,x2x2其中一个是无穷大,那么
(make-rectangular \(x_1\) \(x_2\)) ⇒ z
(magnitude z) ⇒ +inf.0
make-polar
,magnitude
和angle
过程可以返回非精确的结果甚至当传递精确参数的时候。
(angle -1)
⇒ 3.141592653589793 ; 大约
11.7.4.4. 数值输入和输出
(number->string z) | 过程 |
(number->string z radix) | 过程 |
(number->string z radix precision) | 过程 |
Radix(基数)必须是一个精确的整数对象,可以是2,8,10或16。如果省略的话,radix默认是10。如果一个precision(精度)被指定的话,那么z必须是一个非精确的复数对象,precision必须是一个精确的整数对象,且radix必须是10。number->string
过程接受一个数字对象和一个基数且在给定的基数下返回一个作为传入的数字对象的外部表示的字符串,使得
(let ((number z) (radix radix))
(eqv? (string->number
(number->string number radix)
radix)
number))
为真。如果没有可能的结果让这个表达式为真,那么一个条件类型是&implementation-restriction
的异常被抛出。
注意:错误情况只会出现在当z不是一个复数对象或是一个实部或虚部是非有理的时候。
如果一个precision被指定,那么结果的非精确实部的表示指定一个显式的<mantissa width>
p,除非它们是无穷大或非数,且为了上面的表达式为真p至少是p ≥ precision。
如果z是非精确的,基数是10,且上面的表达式和条件可以被一个包含小数点的结果满足,那么这个结果包含小数点且使用能让上面表达式和条件为真的最少的数字表示2324(不包括指数,尾部的零,和位数宽度);否则结果的格式是未定义的。
number->string
的结果从不包含一个显式的基数前缀。
(string->number string) | 过程 |
(string->number string radix) | 过程 |
返回string表示的最大精度的数字对象。Radix必须是一个必须是一个精确的整数对象,可以是2,8,10或16。如果提供的话,radix是可以被字符串中的显式的基数前缀(比如,"#o177"
)覆盖的默认基数。如果radix没有被提供,那么默认的基数是10.如果string不是一个语法上合法的数字对象的表示或者不是一个零分母的实数对象的符号,那么string->number
返回#f
。
(string->number "100") ⇒ 100
(string->number "100" 16) ⇒ 256
(string->number "1e2") ⇒ 100.0
(string->number "0/0") ⇒ #f
(string->number "+inf.0") ⇒ +inf.0
(string->number "-inf.0") ⇒ -inf.0
(string->number "+nan.0") ⇒ +nan.0
注意(已根据勘误表修改):如果string->number
的参数是一个字符串,且指定了一个合法的基数,它必须返回一个数字对象或#f
;它不可以抛出一个异常。
(也就是说,string->number
可以在它的参数不是一个字符串时抛出一个异常。)
11.8. 布尔
标准布尔对象真和假又外部表示#t
和#f
。然而,所有的对象当中,只有#f
在条件表达式中被认为是假。见第5.7小节。
注意:习惯于其它Lisp方言的程序员应当注意Scheme区分`#t`和空表,同时也区分符号`nil`。
(not obj)
过程
如果obj是#f
返回#t
,否则返回#f
。
(not #t) ⇒ #f
(not 3) ⇒ #f
(not (list 3)) ⇒ #f
(not #f) ⇒ #t
(not '()) ⇒ #f
(not (list)) ⇒ #f
(not 'nil) ⇒ #f
(boolean? obj)
过程
如果obj是#t
或f
返回#t,否则返回
#f`。
(boolean? #f) ⇒ #t
(boolean? 0) ⇒ #f
(boolean? '()) ⇒ #f
\(\texttt{(boolean=? $bool_1$ $bool_2$ $bool_3$ ...)}\)
过程
如果所有的布尔是一样的话返回#t
。
11.9. 点对和表
一个点对是一个有两个域的组合结构,这两个域叫做car和cdr域(由于历史原因)。点对通过过程cons
创建。car和cdr域可以通过过程car
和cdr
访问。
点对主要用于表示表。表可以递归定义为:或者是一个空表,或者是一个cdr域为表的点对。更准确地说,表的集合被定义为符合以下条件的最小集合X:
- 空表在X中。
- 如果list在X中,则任何cdr域包含着list的点对也在X中。
表中连续各点对的car域内的对象是表的元素。例如,一个拥有两个元素的表是一个点对,该点对的car域包含表的第一个元素,其cdr域又是一个点对,这个点对的car域包含表的第二个元素,cdr域是空表。表的长度是元素的数量,也等于其点对的数量。
空表是一个隶属于其自身类型的特殊对象。它不是点对。它不包含任何元素,且长度为零。
注意:上述定义意味着所有表都有有限的长度,都以空表结尾。
不是以空表结尾的点对链称为*非严格表(improper list)。注意,非严格表不是表。可以使用表和点记法的组合表示非严格表:
(a b c . d)
等价于
(a . (b . (c . d)))
一个给定的点对是不是一个表取决于其cdr域存储的内容。
(pair? obj)
过程
如果obj是一个点对则返回#t
,否则返回#f
。
(pair? '(a . b)) ⇒ #t
(pair? '(a b c)) ⇒ #t
(pair? '()) ⇒ #f
(pair? '#(a b)) ⇒ #f
\(\texttt{(cons $obj_1$ $obj_2$)}\)
过程
返回一个新分配的点对,其car是\($obj_1$\)
且cdr是\($obj_2$\)
。这个点对保证(从eqv?
的意义来说)和任何一个存在的对象都是不一样的。
(cons 'a '()) ⇒ (a)
(cons '(a) '(b c d)) ⇒ ((a) b c d)
(cons "a" '(b c)) ⇒ ("a" b c)
(cons 'a 3) ⇒ (a . 3)
(cons '(a b) 'c) ⇒ ((a b) . c)
(car pair)
过程
返回点对car域的内容。
(car '(a b c)) ⇒ a
(car '((a) b c d)) ⇒ (a)
(car '(1 . 2)) ⇒ 1
(car '()) ⇒ &assertion异常
(cdr pair)
过程
返回点对cdr域的内容。
(cdr '((a) b c d)) ⇒ (b c d)
(cdr '(1 . 2)) ⇒ 2
(cdr '()) ⇒ &assertion异常
⋮⋮ | |
(cdddar pair) | 过程 |
(cddddr pair) | 过程 |
这些过程是car
和cdr
的组合。例如,caddr
可定义为:
(define caddr (lambda (x) (car (cdr (cdr x)))))
。
Scheme提供最高可达四层的任意组合。总共有二十八个这样的过程。
(null? obj)
过程
如果obj是一个空表则返回#t
,否则返回#f
。
(list? obj)
过程
如果obj是一个表则返回#t
,否则返回#f
。按照定义,所有的表都是长度有限且以空表结尾的点对链。
(list? '(a b c)) ⇒ #t
(list? '()) ⇒ #t
(list? '(a . b)) ⇒ #f
(list obj ...)
过程
返回新分配的它的参数的表。
(list 'a (+ 3 4) 'c) ⇒ (a 7 c)
(list) ⇒ ()
(length list)
过程
返回表的长度。
(length '(a b c)) ⇒ 3
(length '(a (b) (c d e))) ⇒ 3
(length '()) ⇒ 0
(append list ... obj) | 过程 |
(append) | 过程(根据勘误表添加) |
返回一个可能的非严格表,其包含第一个list以及跟在其后的其它list的元素,obj作为最后点对的cdr域。如果obj不是一个表,那么结果是一个非严格表。如果在没有参数的情况下调用,append
过程返回空表。
(append '(x) '(y)) ⇒ (x y)
(append '(a) '(b c d)) ⇒ (a b c d)
(append '(a (b)) '((c))) ⇒ (a (b) (c))
(append '(a b) '(c . d)) ⇒ (a b c . d)
(append '() 'a) ⇒ a
(append) ⇒ ()
(append 'a) ⇒ a
如果append
包含非空的点对链,它总是新分配。如果没有点对被分配,obj被返回。返回值由所有参数的新的点对组成,除了最后一个参数;最后一个参数仅仅是被放在新的结构的结尾(本句根据勘误表添加)。
(reverse list)
过程
返回一个新分配的表,其以逆序的方式包含list中的元素。
(reverse '(a b c)) ⇒ (c b a)
(reverse '(a (b c) d (e (f))))
⇒ ((e (f)) d (b c) a)
(list-tail list k)
过程
List应该是一个长度至少是k的表。list-tail
过程返回list点对的子链,通过省略前k个元素获得。
(list-tail '(a b c d) 2) ⇒ (c d)
实现责任:实现必须检测list至少是长度k的点对的链。它不需要检查超过这个长度的点对的链。
(list-ref list k)
过程
List必须是一个长度至少是k + 1的表。list-ref
过程返回list的第k个元素(已根据勘误表修改)。
(list-ref '(a b c d) 2) ⇒ c
实现责任:实现必须检测list至少是长度k + 1的点对的链。它不需要检查超过这个长度的点对的链。
\(\texttt{(map proc $list_1$ $list_2$ ...)}\)
过程
所有的list应该有相同的长度。Proc应该接受和list一样多的参数且返回一个单独的值。Proc不应该更改任何一个list。
map
过程将proc逐个元素地应用到list的元素上且返回一个按顺序的结果的表。Proc总是在相同的map
本身的动态环境中被调用。proc应用到list元素的顺序是未定义的。如果从map
出现多个返回,早期返回的返回值不会被改变。
(map cadr '((a b) (d e) (g h)))
⇒ (b e h)
(map (lambda (n) (expt n n))
'(1 2 3 4 5))
⇒ (1 4 27 256 3125)
(map + '(1 2 3) '(4 5 6)) ⇒ (5 7 9)
(let ((count 0))
(map (lambda (ignored)
(set! count (+ count 1))
count)
'(a b))) ⇒ (1 2) or (2 1)
实现责任:实现应该检查所有的list有相同的长度。实现必须检查在proc上应用了上面描述的生存期的限制。一个实现可以在应用之前检查proc是不是一个合适的参数。
\(\texttt{(for-each proc $list_1$ $list_2$ ...)}\)
过程
所有的list应该有相同的长度。Proc应该接受和list一样多的参数。Proc不应该更改任何一个list。
for-each
过程以副作用为目的将proc逐个元素地应用到list的元素上,以从第一个元素到最后一个元素的顺序。Proc总是在相同的for-each
本身的动态环境中被调用。for-each
的返回值是未定义的。
(let ((v (make-vector 5)))
(for-each (lambda (i)
(vector-set! v i (* i i)))
'(0 1 2 3 4))
v) ⇒ #(0 1 4 9 16)
(for-each (lambda (x) x) '(1 2 3 4))
⇒ 未定义
(for-each even? '()) ⇒ 未定义
实现责任:实现应该检查所有的list有相同的长度。实现必须检查在proc上应用了上面描述的生存期的限制。一个实现可以在应用之前检查proc是不是一个合适的参数。
注意:proc
的实现可以也可以不在最后一个元素上对proc实行尾调用。
11.10. 符号
符号是建立在如下事实上的对象,两个符号是相同的(从eq?
,eqv?
和equal?
的意义来说)当且仅当它们的名字以同样的方式拼写。一个符号字面量使用quote
形式。
(symbol? obj)
过程
如果obj是一个符号则返回#t
,否则返回#f
。
(symbol? 'foo) ⇒ #t
(symbol? (car '(a b))) ⇒ #t
(symbol? "bar") ⇒ #f
(symbol? 'nil) ⇒ #t
(symbol? '()) ⇒ #f
(symbol? #f) ⇒ #f
(symbol->string symbol)
过程
以不可变字符串的形式返回symbol的名字。
(symbol->string 'flying-fish)
⇒ "flying-fish"
(symbol->string 'Martin) ⇒ "Martin"
(symbol->string
(string->symbol "Malvina"))
⇒ "Malvina"
\(\texttt{(symbol=? $symbol_1$ $symbol_2$ $symbol_3$ ...)}\)
如果符号是一样的则返回#t
,也就是说如果它们的名字拼写相同的话。
(string->symbol string)
过程
返回名字是string的符号。
(eq? 'mISSISSIppi 'mississippi)
⇒ #f
(string->symbol "mISSISSIppi")
⇒the symbol with name "mISSISSIppi"
(eq? 'bitBlt (string->symbol "bitBlt"))
⇒ #t
(eq? 'JollyWog
(string->symbol
(symbol->string 'JollyWog)))
⇒ #t
(string=? "K. Harper, M.D."
(symbol->string
(string->symbol "K. Harper, M.D.")))
⇒ #t
11.11. 字符
字符是表示Unicode标量值得对象16。
注意: Unicode在最新版本的*Unicode标量值*(在0到#x10FFF之间的整数,不包括区间#xD800到#xDFFF)和人类可读“字符”直接定义了一个标准的映射。更精确地说,Unicode区别字形(glyphs),其被印刷供人类阅读,和字符(characters),其实映射到字形的抽象入口(有时那在某种程度上对周围字符敏感)。此外,标量值的不同序列有时对应于相同的字符。标量,字符,字形之间的关系是微妙和复杂的。
尽管有这样的复杂性,大部分一个有教养的人可以称之为“字符”的东西可以被单个Unicode标量值表示(尽管一些Unicode标量值的序列可以表示那个同样的字符)。比如,罗马字母,斯拉夫字母,希伯来辅音,和大部分中文字符都在这个类别中。 Unicode标量值不包括区间#xD800到#xDFFF,其是Unicode*码位(code points)*范围的一部分。然而,这个范围内的Unicode码位,即所谓的*代理(surrogates)*,是一个UTF-16编码的人工制品,且只能出现在特定的Unicode编码中。因此,所有的字符代表码位,但是,代理码位没有字符的表示法。
(char? obj)procedure
过程
如果obj是一个字符则返回#t
,否则返回#f
。
(char->integer char) | 过程 |
(integer->char sv) | 过程 |
Sv必须是一个Unicode标量值,也就是说,一个属于\(\left[0, \#x\textrm{D7FF}\right] \cup \left[\#x\textrm{E000}, \#x\textrm{10FFFF}\right]\)
的非负精确整数对象。
传递一个字符,char->integer
以一个精确整数对象的形式返回它的Unicode标量值。对于一个Unicode标量值sv,integer->char
返回与其相关的字符。
(integer->char 32) ⇒ #\space
(char->integer (integer->char 5000))
⇒ 5000
(integer->char #\xD800) ⇒ &assertion异常
\(\texttt{(char=? $char_1$ $char_2$ $char_3$ ...)}\) | 过程 |
\(\texttt{(char<? $char_1$ $char_2$ $char_3$ ...)}\) | 过程 |
\(\texttt{(char>? $char_1$ $char_2$ $char_3$ ...)}\) | 过程 |
\(\texttt{(char<=? $char_1$ $char_2$ $char_3$ ...)}\) | 过程 |
\(\texttt{(char>=? $char_1$ $char_2$ $char_3$ ...)}\) | 过程 |
这些过程根据根据字符的标量值给它们强加了一个总体的顺序。
(char<? #\z #\ß) ⇒ #t
(char<? #\z #\Z) ⇒ #f
11.12. 字符串
字符串是字符的序列。
字符串的长度是它包含的字符的数量。当字符串被创建的时候这个数被固定。一个字符串的合法索引(valid indices)是小于字符串长度的整数。一个字符串的第一个字符的索引是0,第二个是1,以此类推。
(string? obj)
过程
如果obj是一个字符串则返回#t
,否则返回#f
。
(make-string k) | 过程 |
(make-string k char) | 过程 |
返回一个新分配的长度是k的字符串。如果传递了char参数,那么这个字符串的所有元素被初始化为char,否则字符串的内容是未定义的。
(string char ...)
过程
返回一个新分配的由其参数组成的字符串。
(string-length string)
过程
以一个精确整数对象的形式返回给定的string中字符的数量。
(string-ref string k)
过程
K必须是string的一个合法的索引。string-ref
以从零开始的索引返回string的第k个字符。
注意:实现应该让string-ref
在常数时间内运行完成。
\(\texttt{(string=? $string_1$ $string_2$ $string_3$ ...)}\)
如果所有的字符串的长度都是一样的且包含相同的字符则返回#t
。否则string=?
过程返回#f
。
(string=? "Straße" "Strasse")
⇒ #f
\(\texttt{(string<? $string_1$ $string_2$ $string_3$ ...)}\) | 过程 |
\(\texttt{(string>? $string_1$ $string_2$ $string_3$ ...)}\) | 过程 |
\(\texttt{(string<=? $string_1$ $string_2$ $string_3$ ...)}\) | 过程 |
\(\texttt{(string>=? $string_1$ $string_2$ $string_3$ ...)}\) | 过程 |
这些操作是字符上对应于顺序的字符串的词典扩展。比如,string<?
是char<?
在字符上的顺序在字符串上的词典序。如果两个字符串长度不同,但多达较短字符串的长度是一样的,那么较短的字符串在词典序上被认为小于较长的字符串。
(string<? "z" "ß") ⇒ #t
(string<? "z" "zz") ⇒ #t
(string<? "z" "Z") ⇒ #f
(substring string start end)
过程
String必须是一个字符串,且start和end必须是一个精确的整数对象,且符合
substring
过程返回一个新分配的字符串,其形成于string以索引start(包括)开始及以end结束(不包括)的字符。
(string-append string ...)
过程
返回一个新分配的字符串,其字符是给定字符串的串联。
(string->list string) | 过程 |
(list->string list) | 过程 |
List必须是一个字符的表。string->list
过程返回一个新分配的字符的表,这些字符是组成给定字符串的字符。list->string
过程返回一个新分配的字符串,其由list当中的字符组成。从equal?
的角度来说,string->list
和list->string
是互逆的过程。
\(\texttt{(string-for-each proc $string_1$ $string_2$ ...)}\)
过程
所有的string必须有相同的长度。Proc应该接受和string个数相同的参数。string-for-each
过程将proc逐个元素地应用到string的字符上,其以副作用为目的,并且是按照从第一个字符到最后一个的顺序。Proc总是在相同的string-for-each
本身的动态环境中被调用。string-for-each
的返回值是未定义的。
类似于for-each
。
实现责任:实现必须检查在proc上应用了上面描述的生存期的限制。一个实现可以在应用之前检查proc是不是一个合适的参数。
(string-copy string)
过程
返回给定string的一个新分配的副本。
11.13. 向量
向量是一个异构结构(heterogeneous structures),其元素由整数索引。向量通常比相同长度的表占据更少的空间,访问随机选定的元素时,向量需要的平均时间通常也比表少。
一个向量的长度是其包含的元素的数量。这个数量是一个非负整数,其在向量创建的时候就被确定。一个向量的合法索引是小于向量长度的精确非负整数对象。在向量中,第一个元素的索引是零,且最后一个元素的索引比向量的长度小一。
和表常量一样,向量常量必须被引用(quoted):
'#(0 (2 2 2 2) "Anna")
⇒ #(0 (2 2 2 2) "Anna")
(vector? obj)
过程
如果obj是一个向量则返回#t
,否则过程返回#f
。
(make-vector k) | 过程 |
(make-vector k fill) | 过程 |
返回一个新分配的k个元素的向量。如果给了第二个参数,那么每个元素被初始化为fill。否则每个元素的初始化内容是未定义的。
(vector obj ...)
过程
返回一个新分配的向量,其元素包含给定的参数。类似与list
。
(vector 'a 'b 'c) ⇒ #(a b c)
(vector-length vector)
过程
以一个精确整数对象的形式返回vector中元素的数量。
(vector-ref vector k)
过程
K必须是vector的一个合法的索引。vector-ref
过程返回vector元素k的内容。
(vector-ref '#(1 1 2 3 5 8 13 21) 5)
⇒ 8
(vector-set! vector k obj)
过程
K必须是vector的一个合法的索引。vector-set!
过程将obj存储到vector的元素k中,且返回未定义的值。
给vector-set!
传递一个不可改变的向量应当导致一个条件类型是&assertion
的异常被抛出。
(let ((vec (vector 0 '(2 2 2 2) "Anna")))
(vector-set! vec 1 '("Sue" "Sue"))
vec)
⇒ #(0 ("Sue" "Sue") "Anna")
(vector-set! '#(0 1 2) 1 "doe")
⇒ 未定义的
; 常向量
; 应当抛出&assertion异常
(vector->list vector) | 过程 |
(list->vector list) | 过程 |
vector->list
过程返回一个新分配的由包含在vector中元素的对象组成的表。list->vector
过程返回一个新创建的由表list中的元素初始化的向量。
(vector->list '#(dah dah didah))
⇒ (dah dah didah)
(list->vector '(dididit dah))
⇒ #(dididit dah)
(vector-fill! vector fill)
过程
将fill存储到vector的每一个元素中,且返回未定义的值。
\(\texttt{(vector-map proc $vector_1$ $vector_2$ ...)}\)
过程
所有的vector必须有相同的长度。Proc应该接受和vector个数相同的参数,且返回一个单独的值。
vector-map
过程将proc逐个元素地应用到vector的元素上且返回一个按顺序的结果的向量。Proc总是在相同的vector-map
本身的动态环境中被调用。proc应用到vector元素的顺序是未定义的。如果从vector-map
出现多个返回,早期返回的返回值不会被改变。
类似于map
。
实现责任:实现必须检查在proc上应用了上面描述的生存期的限制。一个实现可以在应用之前检查proc是不是一个合适的参数。
\(\texttt{(vector-for-each proc $vector_1$ $vector_2$ ...)}\)
过程
所有的vector必须有相同的长度。Proc应该接受和vector个数相同的参数。vector-for-each
过程将proc逐个元素地应用到vector的字符上,其以副作用为目的,并且是按照从第一个字符到最后一个的顺序。Proc总是在相同的vector-for-each
本身的动态环境中被调用。vector-for-each
的返回值是未定义的。
类似于for-each
。
实现责任:实现必须检查在proc上应用了上面描述的生存期的限制。一个实现可以在应用之前检查proc是不是一个合适的参数。
11.14. 错误(Errors)和违规行为(violations)
\(\texttt{(error $who$ $message$ $irritant_1$ ...)}\) | 过程 |
\(\texttt{(assertion-violation $who$ $message$ $irritant_1$ ...)}\) | 过程 |
Who必须是一个字符串或一个符号或#f
。Message必须是一个字符串。Irritant是任意的对象。
这些过程抛出一个异常。当一个错误出现的时候,error
过程应当被调用,通常由程序在与外部世界或用户交互时已经出错的一些事情导致。assertion-violation
过程在一个过程被非法调用的时候应当被调用,或者是传递了非法数量的参数,或者传递了未被指定处理的参数。
Who参数应当描述检测到异常的过程或操作。Message参数应当应当描述外部情况。Irritant应当是检测到操作的操作的参数。
异常提供的条件对象(见库的第7章)有下列的条件类型:
- 如果who不是
#f
,那么条件有条件类型&who
,who作为它的域的值。在哪种情况下,who应当是检测到异常的过程或条目的名字。如果它是#f
,那么条件没有条件类型&who
。 - 条件有条件类型
&message
,message作为它的域的值。 - 条件有条件类型
&irritant
,irritant的表作为它的域的值。
此外,error
创建的条件有条件类型&error
,且assertion-violation
创建的条件有条件类型&assertion
。
(define (fac n)
(if (not (integer-valued? n))
(assertion-violation
'fac "non-integral argument" n))
(if (negative? n)
(assertion-violation
'fac "negative argument" n))
(letrec
((loop (lambda (n r)
(if (zero? n)
r
(loop (- n 1) (* r n))))))
(loop n 1)))
(fac 5) ⇒ 120
(fac 4.5) ⇒ &assertion异常
(fac -3) ⇒ &assertion异常
(assert <expression>)
语法
一个assert
形式通过计算<expression>
被求值。如果<expression>
返回一个真值,那么那个值被从assert
表达式返回。如果<expression>
返回#f
,那么一个条件类型是&assertion
和&message
的异常被抛出。条件对象提供的消息是实现定义的。
注意:实现应当利用这样的事实,assert
是提供尽可能多关于断言(assertion)错误位置信息的语法。
11.15. 控制特性
本章描述了各种以特殊方式控制程序执行流程的基本过程。
\(\texttt{(apply proc $arg_1$ ... rest-args)}\)
过程
rest-args
必须是一个表。Proc应当接受n个元素,其中n是arg的数量加上rest-args的长度。apply
过程以表\(\texttt{(append (list $arg_1$ ...) rest-args)}\)
的元素作为真实参数调用proc。
如果一个apply
的调用在尾上下文中,那么对proc
的调用也在尾上下文中。
(apply + (list 3 4)) ⇒ 7
(define compose
(lambda (f g)
(lambda args
(f (apply g args)))))
((compose sqrt *) 12 75) ⇒ 30
(call-with-current-continuation proc) | 过程 |
(call/cc proc) | 过程 |
Proc应当接受一个参数。过程call-with-current-continuation
(这和过程call/cc
是一样的)将当前的继续作为“逃逸过程”打包,且作为参数传递给proc。这个逃逸过程是一个Scheme过程,如果它在随后被调用的话,将会放弃任何在随后起作用的继续,取而代之以恢复逃逸过程创建时起作用的继续。调用逃逸过程可以导致dynamic-wind
安装的before
和after
过程被调用。
逃逸过程的参数数量与最初调用call-with-current-continuation
时的继续的参数数量相同。
传入proc
的逃逸过程像其他Scheme过程那样拥有无限的生存期。它可以被存入变量或数据结构中,可以被调用任意多次。
如果对call-with-current-continuation
的调用发生在尾上下文中,那么对proc的调用也在尾上下文中。
以下示例只显示了call-with-current-continuation
的一些用法。如果所有真实的应用都像这些示例一样简单,像call-with-current-continuation
这样强大的过程也就没有存在的必要了。
(call-with-current-continuation
(lambda (exit)
(for-each (lambda (x)
(if (negative? x)
(exit x)))
'(54 0 37 -3 245 19))
#t)) ⇒ -3
(define list-length
(lambda (obj)
(call-with-current-continuation
(lambda (return)
(letrec ((r
(lambda (obj)
(cond ((null? obj) 0)
((pair? obj)
(+ (r (cdr obj)) 1))
(else (return #f))))))
(r obj))))))
(list-length '(1 2 3 4)) ⇒ 4
(list-length '(a b . c)) ⇒ #f
(call-with-current-continuation procedure?)
⇒ #t
注意:调用一个逃逸过程会从新进入调用call-with-current-continuation
的动态生存期,且因此恢复它的动态环境;见第5.12小节。
(values obj ...)
过程
把所有的参数传递给它的继续。values
过程可以像如下方式定义:
(define (values . things)
(call-with-current-continuation
(lambda (cont) (apply cont things))))
一系列中表达式中所有非最终表达式的继续,比如在lambda
, begin
, let
, let*
, letrec
, letrec*
, let-values
, let*-values
, case
, 和`cond形式中,通常接受任意数量的值。
除了这些和call-with-values
, let-values
, 以及let*-values
创建的继续,继续隐式地接受一个单独的值,比如<operator>
和过程调用的<operator>
或在条件语句中的<text>
表达式的继续,都精确地接受一个值。给继续传递不当数量的值的效果是未定义的。
(call-with-values producer consumer)
过程
Producer必须是一个过程,且必须接受零个值。Consumer必须是一个过程,且必须接受和produce过程返回值个数一样多的值。call-with-values
过程会调用producer,调用时没有参数且有如下继续,当传递给这个继续一些值,会以这些值作为参数调用consumer过程。consumer调用的继续和call-with-values调用的继续相同。
(call-with-values (lambda () (values 4 5))
(lambda (a b) b))
⇒ 5
(call-with-values * -) ⇒ -1
如果call-with-values调用发生在尾上下文中,那么consumer调用也在尾上下文中。
实现责任:在producer返回后,实现必须检查consumer必须接受和producer返回值一样多的值。
(dynamic-wind before thunk after)
过程
Before, thunk, 和after必须是过程,且每个都应当接受零个参数。这些过程可以返回任意数量的值。dynamic-wind
以无参数的方式调用thunk,返回这个调用的结果。此外,每当进入trunk调用的动态生存期的时候,dynamic-wind
会以无参数的方式调用before,每当离开trunk调用的动态生存期的时候,dynamic-wind
会以无参数的方式调用after。因此,在缺少call-with-current-continuation
创建的逃逸过程调用的情况下,dynamic-wind
按顺序调用before, thunk, after。
尽管对before和after的调用不被认为是在thunk调用的动态生存期内,但是,出现在thunk调用动态生存期内的任何其它的dynamic-wind
调用的before和after过程被认为是在thunk调用的动态生存期里面的。
更精确地说,一个逃逸过程将控制权转移出一组零个或多个活动的dynamic-wind
调用x……的动态生存期且将控制权转移入一组零个或多个活动的dynamic-wind
调用y……它离开最近x的动态生存期,且以无参数的方式调用其对应的after过程。如果after过程返回的话,逃逸过程继续到下一个最近的x,以此类推。一旦每一个x都以这种方式被处理了,逃逸过程以无参数的方式调用最不接近的y对应的before过程。如果before过程返回的话,逃逸过程重新进入最近y的动态生存期,然后继续处理下一个最近的y,以此类推。一旦每一个y都以这种方式被处理了,控制权被转移到逃逸过程打包的继续。
实现责任:实现必须检查在thunk和after上的限制,只要它们被实际调用。
(let ((path '())
(c #f))
(let ((add (lambda (s)
(set! path (cons s path)))))
(dynamic-wind
(lambda () (add 'connect))
(lambda ()
(add (call-with-current-continuation
(lambda (c0)
(set! c c0)
'talk1))))
(lambda () (add 'disconnect)))
(if (< (length path) 4)
(c 'talk2)
(reverse path))))
⇒ (connect talk1 disconnect
connect talk2 disconnect)
(let ((n 0))
(call-with-current-continuation
(lambda (k)
(dynamic-wind
(lambda ()
(set! n (+ n 1))
(k))
(lambda ()
(set! n (+ n 2)))
(lambda ()
(set! n (+ n 4))))))
n) ⇒ 1
(let ((n 0))
(call-with-current-continuation
(lambda (k)
(dynamic-wind
values
(lambda ()
(dynamic-wind
values
(lambda ()
(set! n (+ n 1))
(k))
(lambda ()
(set! n (+ n 2))
(k))))
(lambda ()
(set! n (+ n 4))))))
n) ⇒ 7
注意:进入一个动态生存期会恢复它的动态环境;见第5.12小节。
11.16. 迭代
(let <variable> <bindings> <body>)
语法
“命名let
(Named let
)”是let
在语法上的一个变体,其提供一个通用的循环结构,同时也被用作表达递归。除了<variable>
用<body>
绑定到一个过程之外,它和普通的let
有相同的语法和语义,其中这个过程的变量是被绑定的变量,内部是<body>
。因此,<body>
的执行可以通过调用<variable>
命名的过程被重复。
(let loop ((numbers '(3 -2 1 6 -5))
(nonneg '())
(neg '()))
(cond ((null? numbers) (list nonneg neg))
((>= (car numbers) 0)
(loop (cdr numbers)
(cons (car numbers) nonneg)
neg))
((< (car numbers) 0)
(loop (cdr numbers)
nonneg
(cons (car numbers) neg)))))
⇒ ((6 1 3) (-5 -2))
11.17. 准引用(Quasiquotation)
(quasiquote <qq template>) | 语法 |
unquoteauxiliary | 辅助语法 |
unquote-splicingauxiliary | 辅助语法 |
“反引用(Backquote)”或“准引用”在构造表或向量结构时是有用的,尤其是在需要的结构中只有一些是提前知道的时候。
语法:<Qq template>
应该与本条目最后的语法说明的一样。
语义:如果没有unquote
或unquote-splicing
形式出现在<qq template>
里面,那么(quasiquote <qq template>)
计算结果和(quote <qq template>)
计算结果是一样的。
如果一个(unquote <expression> ...)
形式出现在<qq template>
里面,那么<expression>
会被求值(“解引用(unquoted)”)且它们的结果会被插入到结构中来代替unquote
形式。
如果一个(unquote-splicing <expression> ...)
形式出现在<qq template>
里面,那么<expression>
的结果必须是一个表;然后,表中的左右小括号会被“剥离(stripped away)”,且表中的元素会被插入到结构中来代替unquote-splicing
形式。
任何unquote-splicing
或多操作的unquote
形式智能出现在一个表或向量的<qq template>
中。
正如第4.3.5小节所提到的,(quasiquote <qq template>)
可以被简写成`<qq template>
,(unquote <expression>)
可以被简写成,<expression>
,且(unquote-splicing <expression>)
可以被简写成,@<expression>
。
`(list ,(+ 1 2) 4) ⇒ (list 3 4)
(let ((name 'a)) `(list ,name ',name))
⇒ (list a (quote a))
`(a ,(+ 1 2) ,@(map abs '(4 -5 6)) b)
⇒ (a 3 4 5 6 b)
`(( foo ,(- 10 3)) ,@(cdr '(c)) . ,(car '(cons)))
⇒ ((foo 7) . cons)
`#(10 5 ,(- 4) ,@(map - '(16 9)) 8)
⇒ #(10 5 -4 -16 -9 8)
(let ((name 'foo))
`((unquote name name name)))
⇒ (foo foo foo)
(let ((name '(foo)))
`((unquote-splicing name name name)))
⇒ (foo foo foo)
(let ((q '((append x y) (sqrt 9))))
``(foo ,,@q))
⇒ `(foo
(unquote (append x y) (sqrt 9)))
(let ((x '(2 3))
(y '(4 5)))
`(foo (unquote (append x y) (- 9)))) ;(已根据勘误表修改)
⇒ (foo (2 3 4 5) -9)
准引用格式可以嵌套。置换操作只作用于那些与最外层quasiquote
有同样嵌套级别的解除引用的元素。每进入一个后续的准引用,嵌套级别就增加一,每进入一个解除引用的语法单元,嵌套级别就减少一。
`(a `(b ,(+ 1 2) ,(foo ,(+ 1 3) d) e) f)
⇒ (a `(b ,(+ 1 2) ,(foo 4 d) e) f)
(let ((name1 'x)
(name2 'y))
`(a `(b ,,name1 ,',name2 d) e))
⇒ (a `(b ,x ,'y d) e)
一个quasiquote
表达式可以返回新鲜的,可变的结构,也可以返回字面结构,其中每个结构都是在表达式求值期间在运行时被构造。不需要被重建的部分总是字面的。因此,
(let ((a 3)) `((1 2) ,a ,4 ,'five 6))
可以等价于下面两个表达式之一:
'((1 2) 3 4 five 6)
(let ((a 3))
(cons '(1 2)
(cons a (cons 4 (cons 'five '(6))))))
可是,它不等价于这个表达式:
(let ((a 3)) (list (list 1 2) a 4 'five 6))
<Qq template>
中的quasiquote
、unquote
或 unquote-splicing
标识符出现在不符合上述描述的其它位置是一个语法错误。
下面准引用表达式的语法不是上下文无关的。他作为生成无限数量产生式规则的一个配方。想象在D = 1, 2, 3, …时下列规则的副本。D跟踪嵌套深度。
<qq template> → <qq template 1>
<qq template 0> → <expression>
<quasiquotation D> → (quasiquote <qq template D>)
<qq template D> → <lexeme datum>
∣ <list qq template D>
∣ <vector qq template D>
∣ <unquotation D>
<list qq template D> → (<qq template or splice D>*)
∣ (<qq template or splice D>+ . <qq template D>)
∣ <quasiquotation D + 1>
<vector qq template D> → #(<qq template or splice D>*)
<unquotation D> → (unquote <qq template D−1>)
<qq template or splice D> → <qq template D>
∣ <splicing unquotation D>
<splicing unquotation D> →
(unquote-splicing <qq template D−1>*)
∣ (unquote <qq template D−1>*)
在<quasiquotation>
中,<list qq template D>
有时会和<unquotation D>
或<splicing unquotation D>
混淆。解释为<unquotation D>
或<splicing unquotation D>
是优先的。
11.18. 句法关键词的绑定结构
let-syntax
和letrec-syntax
形式绑定关键词。就像begin
形式一样,一个let-syntax
或letrec-syntax
形式可以出现在定义上下文中,在这种情况下,它被当作一个定义,且在内部的形式必须也是定义。一个let-syntax
或letrec-syntax
形式也可以出现在一个表达式上下文中,在这种情况下,它们内部的形式必须是表达式。
(let-syntax <bindings> <form> ...)
语法
语法:<Bindings>
必须有如下形式:
((<keyword> <expression>) ...)
每个<keyword>
是一个标识符,且每个<expression>
是一个在宏扩展时期可以被求值为转换器的表达式。转换器可以通过syntax-rules
或identifier-syntax
(见第11.19小节)创建,或通过库的第12章描述的其它机制之一创建。在关键词绑定列表中<keyword>
出现超过一个是一个语法语法错误。
语义:<Form>
在语法环境中被扩展,此句法环境通过扩展let-syntax
形式的句法环境以宏的方式获得,其关键词是<keyword>
,绑定到特定的转换器。每个<keyword>
的绑定以<form>
作为它的作用范围。
不管是在定义还是在表达式上下文中,let-syntax
形式中的<form>
被当作在一个隐含的begin
中;见第11.4.7小节。因此,在<form>
扩展结果中的定义和出现在let-syntax
形式中的定义有相同的作用范围。
实现责任:实现应当检测<expression>
的值是否有可能不是一个转换器。
(let-syntax ((when (syntax-rules ()
((when test stmt1 stmt2 ...)
(if test
(begin stmt1
stmt2 ...))))))
(let ((if #t))
(when if (set! if 'now))
if)) ⇒ now
(let ((x 'outer))
(let-syntax ((m (syntax-rules () ((m) x))))
(let ((x 'inner))
(m)))) ⇒ outer
(let ()
(let-syntax
((def (syntax-rules ()
((def stuff ...) (define stuff ...)))))
(def foo 42))
foo) ⇒ 42
(let ()
(let-syntax ())
5) ⇒ 5
(letrec-syntax <bindings> <form> ...)
语法
语法:和let-syntax
一样。
语义:<Form>
在语法环境中被扩展,此句法环境通过扩展letrec-syntax
形式的句法环境以宏的方式获得,其关键词是<keyword>
,绑定到特定的转换器。每个<keyword>
的绑定以<bindings>
以及<form>
作为它的作用范围,所以,转换器可以将形式转译成通过letrec-syntax
形式引入的宏的使用。
不管是在定义还是在表达式上下文中,letrec-syntax
形式中的<form>
被当作在一个隐含的begin
中;见第11.4.7小节。因此,在<form>
扩展结果中的定义和出现在letrec-syntax
形式中的定义有相同的作用范围。
实现责任:实现应当检测<expression>
的值是否有可能不是一个转换器。
(letrec-syntax
((my-or (syntax-rules ()
((my-or) #f)
((my-or e) e)
((my-or e1 e2 ...)
(let ((temp e1))
(if temp
temp
(my-or e2 ...)))))))
(let ((x #f)
(y 7)
(temp 8)
(let odd?)
(if even?))
(my-or x
(let temp)
(if y)
y))) ⇒ 7
下面的例子突出了let-syntax
和letrec-syntax
的不同。
(let ((f (lambda (x) (+ x 1))))
(let-syntax ((f (syntax-rules ()
((f x) x)))
(g (syntax-rules ()
((g x) (f x)))))
(list (f 1) (g 1))))
⇒ (1 2)
(let ((f (lambda (x) (+ x 1))))
(letrec-syntax ((f (syntax-rules ()
((f x) x)))
(g (syntax-rules ()
((g x) (f x)))))
(list (f 1) (g 1))))
⇒ (1 1)
除了第一个表达式中的let-syntax
形式和第二个当中的letrec-syntax
之外,两个表达式是一样的。在第一个表达式中,出现在g
中的f
引用let
绑定中的变量f
,而在第二个当中它引用的关键词f
其绑定是letrec-syntax
形式建立的。
11.19. 宏转换器
(syntax-rules (<literal> ...) <syntax rule> ...) | 语法(扩展) |
_ | 辅助语法(扩展) |
... | 辅助语法(扩展) |
语法:每一个<literal>
必须是一个标识符。每一个<syntax rule>
必须有如下形式:
(<srpattern> <template>)
一个<srpattern>
是<pattern>
的受限形式,也就是说,一个非空的<pattern>
是下列的四个由小括号包围的形式之一,其第一个子形式是一个标识符或一个下划线_
。一个<pattern>
是一个标识符,常量,或下面当中的一个。
(<pattern> ...)
(<pattern> <pattern> ... . <pattern>)
(<pattern> ... <pattern> <ellipsis> <pattern> ...)
(<pattern> ... <pattern> <ellipsis> <pattern> ... . <pattern>)
#(<pattern> ...)
#(<pattern> ... <pattern> <ellipsis> <pattern> ...)
一个<ellipsis>
是标识符“...
”(三个句号(译注:必须是西文句号))。<Template>
是一个模式变量,一个不是模式变量的标识符,一个模式数据,或下列形式之一。
(<subtemplate> ...)
(<subtemplate> ... . <template>)
#(<subtemplate> ...)
一个<subtemplate>
是一个<template>
跟着零个或多个省略号(译注:必须是西文省略号)。
语义:在宏扩展期间,syntax-rules
的实例通过指定一系列的卫生重写规则被求值为一个新的宏转换器。一个关键词与syntax-rules
指定的转换器相关联的宏的使用与<syntax rule>
包含的模式相匹配,以最左边的<syntax rule>
开始。当发现一个匹配的时候,宏使用根据模板被卫生地转录。没有匹配是一个语法错误。
出现在<pattern>
中的标识符可以是一个下划线(_
),一个列在字面量(<literal> ...)
的表中的字面量标识符,或一个省略号(...
)。所有出现在<pattern>
中的其它标识符都是模式变量(pattern variables)。省略号或下划线出现在(<literal> ...)
中是一个语法错误。
尽管<srpattern>
的第一个子形式可以是一个标识符,但是标识符不涉及到匹配,且不被认为是一个模式变量或一个字面量标识符。
模式变量匹配任意的输入子形式且被用作引用输入的元素。在<pattern>
中同样的模式变量出现超过一次是一个语法错误。
下划线也匹配任意的输入子形式,但不是模式变量,且不能被用作引用那些元素。<Pattern>
中可以出现多个下划线。
一个字面量标识符匹配一个输入子形式当且仅当输入子形式是一个标识符且或者在输入表达式中它的出现和在字面量的表中它的出现有相同的词法绑带,或者两个标识符有相同的名字且都没有词法绑定。
一个跟着一个省略号的子模式可以匹配零个或多个输入元素。
更正式地说,一个输入形式F匹配一个模式P当且仅当下列之一成立:
- P是一个下划线(
_
)。 - P是一个模式变量。
- P是一个字面量标识符且F是一个标识符,其使得如果P和F都出现在被插入宏输出的任何绑定的外部的宏的输出中,那么它们都指向相同的绑定。(如果两个类似命名的标识符没有一个指向任意的绑定,也就是说,两个都是未定义的,它们被认为是指向相同的绑定。)
- P有形式
\(\texttt{($P_1$ ... $P_n$)}\)
,且F是一个有n个元素的表,其分别与\(P_1\)
到\(P_n\)
匹配。 - P有形式
\(\texttt{($P_1$ ... $P_n$ . $P_x$)}\)
,且F是一个有n个元素或多于n个元素的表或非严格表,其前n个元素分别与\(P_1\)
到\(P_n\)
匹配,且其第n个cdr匹配\(P_x\)
。 - P有形式
\(\texttt{($P_1$ ... $P_k$ $P_e$ <ellipsis> $P_{m+1}$ ... $P_n$)}\)
,其中<ellipsis>
是标识符...
,且F是一个有n个元素的表,其前k个元素分别匹配\(P_1\)
到\(P_k\)
,接下来的m - k个元素匹配\(P_e\)
,且剩余的n - m个元素匹配\(P_{m+1}\)
到\(P_n\)
。 - P有形式
\(\texttt{($P_1$ ... $P_k$ $P_e$ <ellipsis> $P_{m+1}$ ... $P_n$ . $P_x$)}\)
,其中<ellipsis>
是标识符...
,且F是一个有n个元素的表或非严格表,其前k个元素分别匹配\(P_1\)
到\(P_k\)
,接下来的m - k个元素匹配\(P_e\)
,且剩余的n - m个元素匹配\(P_{m+1}\)
到\(P_n\)
,且其第n个和最终的cdr匹配\(P_x\)
。 - P有形式
\(\texttt{#($P_1$ ... $P_n$)}\)
,且F是一个有n个元素的向量,其分别与\(P_1\)
到\(P_n\)
匹配。 - P有形式
\(\texttt{#($P_1$ ... $P_k$ $P_e$ <ellipsis> $P_{m+1}$ ... $P_n$)}\)
,其中<ellipsis>
是标识符...
,且F是一个有n个元素或多余n个元素的向量,其前k个元素分别匹配\(P_1\)
到\(P_k\)
,接下来的m - k个元素匹配\(P_e\)
,且剩余的n - m个元素匹配\(P_{m+1}\)
到\(P_n\)
。 - P是一个模式数据(任何非表,非向量,非符号数据)且F在过程
equal?
的意义下等价于P。
当一个宏使用根据匹配的<syntax rule>
模板转录的时候,出现在模板中的模式变量被输入中匹配的子形式替代。
不是模式变量或省略号的模式数据和标识符被复制到输出中。一个跟着一个省略号的子模版扩展成一个或多个子模版的出现。出现在子模式并跟着一个或多个省略号的模式变量只可以出现在跟着(至少)何其一样多省略号的子模版中。这些模式变量在输出中被替换成它们绑定的按指定分布的输入子形式。如果一个模式变量在子模版中比在与其相关联的子模式跟着更多的省略号,那么输入形式根据需要重复。子模版必须至少包含一个来自跟着一个省略号的子模式的模式变量,且至少有一个这样的模式变量,其子模版必须跟着和其中出现模式变量的子模式中省略号数量精确相等的省略号。(否则,扩展器可能不能决定子形式应该在输出中重复多少次。)不符合本段的约束是一个语法错误。
形式(<ellipsis> <template>)
的模板和<template>
是相同的,除了模板中的省略号没有特殊的意义之外。换言之,任何包含在<template>
中的省略号被当作普通的标识符对待。特别地,模板(... ...)
产生一个单独的省略号,...
。这允许句法抽象扩展包含省略号的形式。
(define-syntax be-like-begin
(syntax-rules ()
((be-like-begin name)
(define-syntax name
(syntax-rules ()
((name expr (... ...))
(begin expr (... ...))))))))
(be-like-begin sequence)
(sequence 1 2 3 4) ⇒ 4
考虑一个辅助标识符卫生使用的例子,如果let
和cond
按第11.16小节和附录B所定义,那么它们是卫生的(和要求一样),且下面的不是一个错误。
(let ((=> #f))
(cond (#t => 'ok))) ⇒ ok
cond
的宏转换器注意到=>
是一个局部变量,且因此是一个表达式,而不是标识符=>
,宏转换器将其当作句法关键词对待。因此例子扩展成
(let ((=> #f))
(if #t (begin => 'ok)))
而不是
(let ((=> #f))
(let ((temp #t))
(if temp ('ok temp))))
后者可以导致一个断言违规。
(identifier-syntax <template>)(identifier-syntax(<id1> <template1>)((set! <id2> <pattern>)<template2>))set!语法(扩展)语法(扩展)辅助语法(扩展)(identifier-syntax <template>)语法(扩展)(identifier-syntax(<id1> <template1>)((set! <id2> <pattern>)<template2>))语法(扩展)set!辅助语法(扩展)
语法:<Id>
必须是标识符。<Template>
必须为syntax-rules
。
语义:当一个关键词被绑定到一个由identifier-syntax
的第一个形式产生的转换器的时候,关键词的引用在绑定的范围内被<template>
代替。
(define p (cons 4 5))
(define-syntax p.car (identifier-syntax (car p)))
p.car ⇒ 4
(set! p.car 15) ⇒ &syntax(语法)异常
更常用的,identifier-syntax
的第二个形式允许转换器决定当set!
被使用时会发生什么。在这种情况下,标识符它自己的使用被\(<template_1>\)
代替,和标识符一起set!
的使用被\(<template_2>\)
代替。
(define p (cons 4 5))
(define-syntax p.car
(identifier-syntax
(_ (car p))
((set! _ e) (set-car! p e))))
(set! p.car 15)
p.car ⇒ 15
p ⇒ (15 . 5) ; (已根据勘误表修改)
11.20. 尾调用和尾上下文
尾调用是一个发生在尾上下文中的过程调用。尾上下文被以归纳的方式定义。注意,对于一个特定的lambda表达式,其尾上下文总是确定的。
- 一个lambda表达式内部的最后一个表达式,即下面用
<tail expression>
表示的,是在尾上下文中。
(lambda <formals>
<definition>*
<expression>* <tail expression>)
- 如果下面表达式的一个在尾上下文中,那么用
<tail expression>
表示的子表达式也在尾上下文中。这些来源于本章中所描述的形式语法规范,把有些<expression>
出现的地方改成了<tail expression>
。只有那些包含尾上下文的规则被列在了这儿。
(if <expression> <tail expression> <tail expression>)
(if <expression> <tail expression>)
(cond <cond clause>+)
(cond <cond clause>* (else <tail sequence>))
(cāse <expression>
<case clause>+)
(cāse <expression>
<case clause>*
(else <tail sequence>))
(and <expression>* <tail expression>)
(or <expression>* <tail expression>)
(let <bindings> <tail body>)
(let <variable> <bindings> <tail body>)
(let* <bindings> <tail body>)
(letrec* <bindings> <tail body>)
(letrec <bindings> <tail body>)
(let-values <mv-bindings> <tail body>)
(let*-values <mv-bindings> <tail body>)
(let-syntax <bindings> <tail body>)
(letrec-syntax <bindings> <tail body>)
(begin <tail sequence>)
一个<cond clause>
是
(<test> <tail sequence>)
,
一个<case clause>
是
((<datum>*) <tail sequence>)
,
一个<tail body>
是
<definition>* <tail sequence>
,
且一个<tail sequence>
是
<expression>* <tail expression>
。
- 如果一个
cond
表达式在尾上下文中,且有一个\(\texttt{($<expression_1>$ => $<expression_2>$)}\)
形式的子句,那么对\(<expression_2>\)
求值结果的过程的(隐含)调用在尾上下文中。\(<Expression_2>\)
它自己不在尾上下文中。
特定的内置过程也必须执行尾调用。传递给apply
和call-with-current-continuation
的第一个参数,和传递给call-with-values
的第二个参数必须通过尾调用被调用。
在下面的例子中,唯一的尾调用是f
调用。g
和h
调用都不是尾调用。x
的引用在尾上下文中,但它不是一个调用,因此不是一个尾调用。
(lambda ()
(if (g)
(let ((x (h)))
x)
(and (g) (f))))
注意:实现可以把一些非尾调用,比如上面的h
调用,当作尾调用来求值。在上面的例子中,let
表达式可以以尾调用f
的方式来编译。(h
返回不确定数量值得可能性可以被忽略,这时因为在那种情况下let
的作用明显是未定义且依赖于实现的。)
附录
附录A. 形式语义
本附录为Scheme提供了一个非正式的,形式的,操作语义,其基于一个早期的语义25。它没有覆盖整个语言。明显没有包含的特性是宏系统,I/O,和数值塔。包含特性的精确列表在第A.2小节给出。
规范的核心是一个单步术语重写的关系,其指出一个(抽象的)机器行为。通常,报告不是完整的规范,已给予实现不同行为的自由,特别是在可以优化的时候。这种不指明在语义中以两种方式展示。
第一个是减少规则,其减少到特定的“未知:字符串”状态(其中字符串提供未知状态的一个描述)。意图是减少到这种状态的规则可以用任意的减少规则取代。怎样代替这些规则的精确规范在第A.12小节被给出。
另一个是单步关系涉及到一个程序到多个程序,每一个对应于一个抽象机器可以做的合法的转换。相应地,我们使用单步关系\(\rightarrow^*\)
的传递闭包来定义语义,\(\cal S\)
,作为一个从程序(\(\cal P\)
)到观察结果集合(\(\cal R\)
)的函数。
其中函数\(\scr O\)
将一个答案(\(\cal A\)
)从语义转换到一个观察结果。大概的说,\(\scr O\)
在简单的基本值上是恒等函数,对于更加复杂的值,像过程和点对,则返回特定的标签。
所以,一个实现符合这样的语义如果,对所有的程序\(\cal P\)
,实现产生\(\cal S(\cal P)\)
中结果的一个或,如果实现无限循环,那么有一个无限的减少序列以\(\cal P\)
开始,假设减少关系\(\rightarrow\)
已经被调整去取代未知:状态。
\(\cal P\)
, \(\cal A\)
, \(\cal R\)
, 和\(\scr O\)
的精确定义也在第A.2小节被给出。
为帮助理解语义和它的行为,我们在PLT Redex中实现了它。我们可以在这篇报告的官方网站发现这个实现:http://www.r6rs.org/。在本语义图表中展示的所有的减少规则和元方程都是从源代码自动生成的。
A.1. 背景
我们假设读者对上下文敏感的减少语义有基础的了解。对此系统不了解的读者可能想要查阅Felleisen和Flatt的专题著作26或Wright和Felleisen27的一个全面的介绍,其包括相关的技术背景,或者轻松一点的PLT Redex28的一个介绍。
作为一个简单的指南,我们通过程序术语的关系定义一个语言的操作语义,其中这个关系对应于一个抽象机器的单步。这个关系使用求值上下文定义,也就是它们当中有区别地方的术语,叫做孔(holes),求值的下一步在这里进行。我们说一个术语e分解成一个表达式上下文E和宁一个术语e’,如果e和E是一样的但孔被e’代替。我们写成E[e’]来指示术语在E中用e’来代替孔。
比如,我们为表达式上下文(E),表达式(e),变量(x),和值(v)定义了一个包含了非终结符的语法。我们可以这样写:
去定义\(\beta_v\)
重写规则(作为\(\rightarrow\)
单步关系的一部分)。我们在重写规则中使用非终结符的名字(可能和下标一起使用)来限制规则的应用,所以只有当一些语法产生的条款出现在条款中对应的位置时,它才起作用。如果相同的非终结符和相同的下标出现多次,那么规则只有当相应的条款在结构上是一样的时候才起作用(没有下标的非终结符不强迫相互匹配。因此,上面规则中,\(E_1\)
同时出现在左手边和右手边意味着应用表达式的上下文在使用这条规则的时候没有改变。省略号是Kleene星号的一个形式,意味着零个或多个省略号之前的匹配模式条款的事件可以出现在省略号和它之前模式的位置。我们使用符号\(\{ x_1 \cdots \mapsto v_1 \cdots \} e_1\)
表示捕获避免的替代;在这种情况下它意味着每一个\(x_1\)
在\(e_1\)
中被替代成相应的\(v_1\)
。最后,除了规则,我们在小括号中写附加条件(side-conditions);上面规则的附加条件指示\(x_1\)
的数量必须和\(v_1\)
的数量相等。我们有时在附加条件中使用等式;当我们这样做时仅仅意味着简单的条目相等,也就是说,这两个条目必须有相同的句法形状。
在规则中指明求值上下文E允许我们定义操作它们上下文的关系。作为一个简单的例子,我们可以添加另一条规则,其在程序应用错误数量参数的时候通过丢弃规则右手边求值上下文的方式产生错误:
以后,我们会以更复杂的方式利用显示的求值上下文。
A.2. 语法
图A.2a:程序和观测的语法
图A.2a展示了本报告语义模型的子集。非终结符被写成斜体或一种艺术字体(\(\cal P\)
\(\cal A\)
, \(\cal R\)
, 和\(\cal R_v\)
)且字面量被写成\(\texttt{等宽}\)
字体。
非终结符\(\cal P\)
表示可能的程序状态。第一个选择是有一个存储和一个表达式的程序。第二个选择是一个未捕获的异常,及第三个被用作指示它建模的模型没有完全指定原语行为的地方(那些情况具体的细节见第A.12小节)。非终结符\(\cal A\)
表示程序的最终结果。它和\(\cal P\)
是一样的除了表达式已经被减少到一些值得序列之外。
非终结符\(\cal R\)
和\(\cal R_v\)
表示程序的可观测结果。每个\(\cal R\)
或者是一个对应于正常终止的程序产生的值的值的序列,或者是一个指示未捕获异常被抛出的标签,或者是\(\sy{unknown}\)
如果程序到达一个本语义没有指明的情况的话。非终结符\(\cal R_v\)
指明对于一个特定的值来说可观测的结果是什么:一个点对,空表,一个符号,一个自引用的值(\(\schtrue\)
, \(\schfalse\)
和数字),一个条件,或一个过程。
非终结符\(\nt{sf}\)
产生存储的一个单独元素。存储保持一个程序所有的可变状态。它,连同操作它的规则一起,被更加详细地解释了。
表达式(\(\mathit{es}\)
)包括被引用的数据,\(\sy{begin}\)
表达式,\(\sy{begin0}\)
表达式[注1],应用表达式,\(\sy{if}\)
表达式,\(\sy{set!}\)
表达式,变量,非过程值(nonproc),基本过程(pproc),lambda表达式,\(\sy{letrec}\)
和\(\sy{letrec*}\)
表达式。
注1:\(\sy{begin0}\)
不是标准的一部分,但为了\(\va{dynamic-wind}\)
和\(\va{letrec}\)
的规则更加易读,我们包含了它。尽管我们直接给它建模,但是它可以根据我们在此定义的来自标准的其它形式被定义: (begin0 e1 e2 ⋯)=(call−with−values (lambda () e1) (lambda x e2 ⋯ (apply values x)))(begin0 e1 e2 ⋯)=(call−with−values (lambda () e1) (lambda x e2 ⋯ (apply values x)))
最后几个表达式形式仅仅是为了中间状态生成的(\(\sy{dw}\)
为了\(\sy{dynamic-wind}\)
,\(\sy{throw}\)
为了继续,\(\sy{unspecified}\)
为了赋值操作的规则,\(\sy{handlers}\)
为了异常处理,及\(\sy{l!}\)
和\(\sy{reinit}\)
为了\(\sy{letrec}\)
),且在初始程序中不应该出现。它们的使用在本附录的相关章节被描述。
非终结符\(\nt{f}\)
描述lambda
表达式的形式。(dot
代替(西文)句号来描述接受任意数量参数的过程,这是为了避免和我们PLT Redex模型中的元圆(meta-circular)相混淆。)
非终结符\(\nt{s} \)
覆盖所有的数据,其可以是非空序列(seq),空序列,自引用值(sqv),或符号。非空序列或者仅是一个数据的序列,或者以一个点终结,这个点或者跟着一个符号,或者跟着一个自引用值。最后,自引用值是数字和布尔\(\semtrue{}\)
与\(\semfalse{}\)
。
非终结符\(\nt{p} \)
表示没有引用数据的程序。大部分消去规则重写p到p,而不是\(\cal P\)
到\(\cal P\)
,这是因为在平常的求值之前被引用的数据第一次被重写成表构造函数的调用。平行于es,e表示没有被引用表达式的表达式。
值(v)被分成四类:
- 非过程(nonproc)包括点对指针(pp),空表(null),符号,自引用值(sqv),和条件。条件表示报告的条件值,但这儿只包含一条信息且其它情况无效。
- 用户过程(
(lambda f e e ···)
)包括多参数的lambda表达式和伴随点参数列表的表达式。 - 基本函数(pproc)包括
- 算术过程(aproc):
+
,-
,/
, 和*
, - 一个参数的过程(proc1):
null?
,pair?
,car
,cdr
,call/cc
,procedure?
,condition?
,unspecified?
,raise
, 和raise-continuable
, - 两个参数的过程(proc2):
cons
,set-car!
,set-cdr!
,eqv?
, 和call-with-values
, - 以及
list
,dynamic-wind
,apply
,values
, 和with-exception-handler
。
- 算术过程(aproc):
- 最后,继续被表示为
throw
表达式,其内部由捕获继续的上下文组成。
图A.2a中非终结符的下面三个集合表示点对(pp),其分为不可变点对(ip)和可变点对(mp)。图A.2a中非终结符的最终集合,sym,x和n,分别表示符号,变量和数字。我们假设非终结符ip,mp和sym全被认为是不想交的。除此之外,假设变量x不包括任何关键词或基础操作,因此任何名字和它们相一致的程序变量必须在语义给予程序意义之前被重命名。
图A.2b:求值上下文的语法
图A.2b展示求值上下文的非终结符集合。非终结符P控制在不包含任何引用数据的程序中求值在哪儿发生。E和F求值上下文用于表达式。它们以这种方式被作为考虑因素以至于PG,G,和H求值上下文可以重复使用F,且对支持异常和dynamic-wind
的上下文具有细粒度的控制权。星号变量和圆圈变量,\(\Estar{}\)
, \(\Eo{}\)
, \(\Fstar{}\)
, 和\(\Fo{}\)
指示在哪儿单个值被提升为多个值,及在哪儿多个值被降级为单个值。U上下文被用作管理报告中set!
, set-car!
, 和set-cdr!
未指定的结果(具体细节见第A.12小节)。最后,S上下文是被引用表达式可以被简化的地方。求值上下文的精确使用伴随着相关的规则被解释。
为了将语义的答案(\(\calA\)
)转换成可观察的结果,我们使用这两个方程:
它们排除了存储,且以简单的标签代替复杂的值,这些标签仅仅指示产生的值得种类或者,如果没有值产生的话,命令产生一个未捕获的异常,或者程序到达一个本语义没有指明的状态。
A.3. 引用
图A.3:引用
第一个应用到所有程序的消去规则是图A.3中的规则。前两个规则为被引用的没有引入任何点对的表达式消去引用。最后两个规则将被引用的数据提到表达式的顶部,所以它们只被求值一次,且通过源方程\(\mathscr{Q}_i\)
和\(\mathscr{Q}_m\)
将数据转换成对cons
或者consi
的调用。
注意,规则\(\rulename{6qcons}\)
和\(\rulename{6qconsi}\)
的左边是一样的,这意味着对某一项,一条规则适用,另一条也适用。因此,一个被引用的表达式可以被提出到一系列的consi
表达式中,其创造不可变点对(见第A.7小节中关于其怎样发生的规则)。
这些规则在任何其它规则之前被应用,这是由它们,及所有的其它规则,应用的上下文决定的。特别地,这些规则在S上下文中应用。图A.2b展示了S上下文允许这种消去应用到一个e的任意的子表达式中,以及左边没有被引用表达式在其中的所有的子表达式,尽管右边的表达式可以有被引用的表达式。相应地,在程序中,这条规则在每个被引用的表达式上应用一次,然后移到程序的开头。剩余的规则在不包含任何被引用的表达式的上下文中应用,其确保在那些规则引用之前这些规则将所有被引用的数据转换成表。
尽管标识符qp没有下标,但是PLT Redex的“fresh(新鲜)”声明的语义特别注意确保规则右边的qp确实和附加条件中的是一样的。
A.4. 多个值
图A.4:多个值和call-with-values
多个值的基本策略是添加一个将\((\va{values}~v)\)
降级为v的规则和另一个将v提升为\((\va{values}~v)\)
的规则。如果我们允许这些规则应用在一个任意的求值上下文中,可是那么,我们可能会在降级和提升中得到无尽替代的无穷的消去序列。所以,语义只允许在期待单个值得上下文中降级,只允许在期待多个值的上下文中提升。我们通过Felleisen-Hieb框架的一个小的扩展获得这个行为(R5RS29的操作模型也同样提供)。我们扩展符号使得孔有名字(以下标写成),以及上下文匹配语法可以要求一个特定名字的孔(同样以下标写成,比如\(E[e]_{\star}\)
)。这个扩展允许我们给孔不同的名字,其期待多个值,以及那些期待单个值,且因此组织上下文的语法。
为了开发这个扩展,图A.2b中我们在求值上下文中使用三种形式的孔。普通的孔\(\hole{}\)
出现在通常种类求值可以出现的地方。孔\(\holes{}\)
出现在允许多个值和\(\holeone{}\)
出现在期待单个值得上下文的上下文中。因此,规则\(\rulename{6promote}\)
只应用\(\holes{}\)
上下文,\(\rulename{6demote}\)
只应用在\(\holeone{}\)
上下文中。
为了知道求值上下文怎样被组织以确保提升和降级出现在正确的地方,请考虑\(\nt{F}\)
, \(\Fstar{}\)
和\(\Fo{}\)
求值上下文。\(\Fstar{}\)
和\(\Fo{}\)
求值上下文和\(\nt{F}\)
几乎是一样的,除了它们分别允许提升到多个值和降级到单个值之外。所以,\(\nt{F}\)
求值上下文,相比于就其自己被定义,利用\(\Fstar{}\)
和\(\Fo{}\)
去指示提升和降级可以出现的地方。比如,\(\nt{F}\)
可以是\(\texttt{(}\sy{if}~\Fo{}~e~e\texttt{)}\)
意味着从\(\texttt{(}\va{values}~v\texttt{)}\)
到v的降级可以出现在if
表达式的测试中。同样地\(\nt{F}\)
可以是\(\texttt{(}\sy{begin}~\Fstar{}~e~e~\cdots\texttt{)}\)
意味着在begin
的第一个子表达式中v可以被提升为\(\texttt{(}\va{values}~v\texttt{)}\)
。
通常,提升和降级规则简化了其它规则的定义。比如,if
规则不需要考虑在第一个子表达式中的多个值。同样地,begin
规则不需要考虑单个值作为其第一个子表达式的情况。
图A.4中的其它两个规则处理call-with-values
。(在非终结符F中)call-with-values
的求值上下文允许在一个已被作为第一个参数传递给call-with-values
的过程的内部求值,只有第二个参数被消去成一个值。一旦过程里面的求值完成,它会产生多个值(因为它属于一个\(\Fstar{}\)
位置),且整个call-with-values
表达式消去成其第二个参数通过规则\(\rulename{6cwvd}\)
对那些值的一个应用。最终,在传递给call-with-values
的第一个参数是一个值,但不是(lambda () e)
,的情况下,规则\(\rulename{6cwvw}\)
将它封装到一个槽(thunk)中以触发求值。
A.5. 异常
图A.5: 异常
异常系统的苦力是
表达式以及G和PG求值上下文(在图A.2b中展示)。handlers
表达式在某个上下文(e)中记录活动的异常处理程序(proc …)。此意图是只有最内部靠近的handlers
表达式和被抛出的异常是相关的,且G和PG求值上下文帮助达到这个目标。它们和对应的E和P是一样的,除了handlers
表达式不能出现在孔的路径上之外,且异常系统规则利用那个上下文去发现最内部靠近的处理程序。
为了查看上下文怎样和handler
表达式一起工作,考虑图A.5中\(\rulename{6xunee}\)
规则的左侧。它在PG求值上下文中匹配有raise
或raise-continuable
(非终结符\(\nt{raise*}\)
匹配这两个抛出异常的过程)调用的表达式。因为PG上下文不包含任何的handlers
表达式,所以这个异常不能被捕获,因此这个表达式消去到一个被指示为未捕获异常的最终状态。规则\(\rulename{6xuneh}\)
同样产生一个为捕获的异常,但是它包含handlers
表达式耗尽所有可用的处理程序的情况。这条规则在任意的求值上下文中应用到有(不包含异常处理程序的)handlers
表达式的表达式上,在这个求值上下文中一个抛出异常的程序的调用在handlers
表达式中被嵌套。G求值上下文的使用确保在这个和抛出之间没有其它的handler
表达式。
下面的两条规则覆盖过程with-exception-handler
的调用。当没有handler
表达式的时候,规则\(\rulename{6xwh1}\)
。它构造了一个新的,且将\(\nt{v}_2\)
作为handler
内部的一个槽应用。如果已经有了一个处理函数表达式,那么\(\rulename{6xwhn}\)
应用。它收集当前的处理函数,并添加新的到新的handlers
表达式中,且和前一条表达式一样,调用with-exception-handlers
的第二个参数。
下面两个规则覆盖在handlers
表达式上下文中抛出的异常。如果可继续的异常被抛出,那么\(\rulename{6xrc}\)
应用。它从最内部靠近的表达式中使用最近安装的处理程序,且将其应用到raise-continuable
的参数中,但是是在一个异常处理程序不包含最后一个处理程序的上下文中。规则\(\rulename{6xr}\)
行为类似,除了在处理程序返回的时候它抛出一个新的异常之外。特殊形式make-cond
创建这个新的异常。
特殊形式make-cond
是报告条件的一个替身。它不计算它的参数(注意图A.2b语法E中是没有它的)。那个参数仅仅是描述抛出异常的上下文的字符串字面量。条件上唯一的操作是condition?
,\(\rulename{6ct}\)
和\(\rulename{6cf}\)
这两个规则给出了其语义。
最后,规则\(\rulename{6xdone}\)
在它的内部被完全计算的时候终止handlers
表达式,同时规则\(\rulename{6weherr}\)
当with-exception-handler
被提供错误的参数的时候抛出一个异常。
A.6. 算术和基本形式
图A.6:算术和基本形式
本模型不包括报告的算术,但为了和其它特性做实验和为本模型写测试套件更加简单,包括理想化的形式。图A.6展示了实现加减乘除基本过程的消去规则。它们尊重它们的数学类似物。此外,当减法和除法没有参数,或除非收到一个零作为除数,或非数传递给任意的算术过程的时候,一个异常被抛出。
图A.6的下半部展示了if
, begin
, 以及begin0
的规则。相关的求值上下文通过非终结符F被给出。
if
的求值上下文只允许在它的测试表达式中求值。一旦求出一个值,如果测试不是#f
,那么if
表达式被规则消去成它的后项(consequent),如果测试是#f
的话,则被消去成替代项(alternative)。
begin
求值上下文允许在begin的第一个子表达式中求值,但只有在有两个或更多子表达式的时候才可以。在那种情况下,一旦第一个表达式被完全简化,消去规则就会丢弃它的值。如果只有一个子表达式的话,begin
它自己被丢弃。
和begin
求值上下文类似,当有两个或更多的子表达式的时候,begin0
求值上下文允许字第一个子表达式中求值。begin0
求值上下文同时允许在begin0
表达式的第二个子表达式中求值,只要第一个子表达式被完全简化。begin0
的\(\rulename{6begin0n}\)
规则然后丢弃被完全简化的第二个子表达式。最终,在begin0
中只有一个单独的表达式,在这时规则\(\rulename{begin01}\)
开火,且删除begin0
表达式。
A.7. 表
图A.7:表
图A.7中的规则处理表。前两个规则通过将它们消去成一系列跟着null
的cons
调用来处理表。
下面两个规则\(\rulename{6cons}\)
和\(\rulename{6consi}\)
分配新的cons
单元。它们都将\(\texttt{(}\va{cons}~v_1~v_2\texttt{)}\)
移到存储中,被绑定到一个新鲜的点对指针上(同时参加第A.3小节“新生(fresh)”的描述)。\(\rulename{6cons}\)
使用一个mp变量去指示点对是可变的,\(\rulename{6consi}\)
使用一个ip变量去指示点对是不可变的。
当提供一个点对指针(如图A.2a所示,pp可以是mp也可以是ip)的时候,规则\(\rulename{6car}\)
和\(\rulename{6cdr}\)
从存储中提取一个点对的元素。
规则\(\rulename{6setcar}\)
和\(\rulename{6setcdr}\)
处理可变点对的赋值。它们以新的值在存储中替换适当位置的内容,且消去成unspecified
。第A.12小节解释了怎样减少成unspecified
。
下面四个规则处理null?
谓词和pair?
谓词,且当car
, cdr
, set-car!
或set-cdr!
接收到不是点对的参数的时候,最后的四个规则会抛出异常。
A.8. Eqv等价
图A.8:Eqv等价
eqv?
规则在图A.8中展示。前两个规则覆盖了eqv?
的大部分行为。第一个说当eqv?
的两个参数是句法上完全相同的时候,那么eqv?
产生#t
,第二个说,当参数不是句法上完全相同的时候,eqv?
产生#f
。v的结构被仔细地设计使得简单的术语相等紧密地对应于eqv?
的行为。比如,点对被表示成存储位置的指针,且eqv?
只是简单地比较那些指针。
前两条规则的附加条件确保当简单的术语相等不匹配eqv?
的行为的时候,它们不会被应用。有两种不匹配的情况:比较两个条件和比较两个过程。对于第一个,本报告没有指定eqv?
的行为,除了指明它必须返回一个布尔之外,所以剩下的两个规则(\(\rulename{6eqct}\)
和\(\rulename{6eqcf}\)
)允许这样的比较返回#t
或#f
。比较两个过程在第A.12小节有讲述。
A.9. 过程和应用(application)
图A.9a:过程&应用
图A.9b:变量赋值关系
图A.9c:应用
在对一个过程调用进行求值的时候,本报告故意让参数的求值顺序是未定义的。所以,我们的消去系统允许发生多个不同的消去,每个对应一个可能的求值顺序。
虽然没有指定求值顺序,但程序子表达式的求值结果应该就像以某种顺序求值一样,只有在我们还没有承诺消去其它子表达式的时候,我们才使用未确定的选择来挑选第一个被消去的子表达式。为了获得那个效果,我们将应用表达式的求值限制到只有那些有一个单独的没有完全消去的表达式,如图A.2b中非终结符F所示。求值有超过两个参数需要的求值的的应用表达式,规则\(\rulename{6mark}\)
挑选没有完全简化的应用中的一个子表达式,且将它提升到它自己的应用中,以允许其被求值。一旦被提升的表达式中的一个被求值,那么\(\rulename{6appN}\)
将它的值替换回原来的应用中。
规则\(\rulename{6appN}\)
也处理这样的应用,其完成其参数通过在表达式中以第一个参数替代其第一个形式参数。附加条件使用图A.9b中的关系来确保没有以\(x_1\)
作为目标的set!
表达式。如果没有这样的赋值,那么应用规则\(\rulename{6appN!}\)
(同时参考第A.3小节对“新生(fresh)”的描述)。我们没有直接将形式参数替换为实际参数,而是创建了一个新的存储位置,初始地绑定实际参数,并将形式参数替换为代表这个位置的变量。然后,这个参数负责处理任何最终的参数赋值。一旦所有的参数都被替换掉,就应用规则\(\rulename{6app0}\)
以及开始过程内部的计算。
乍一看,规则\(\rulename{6appN}\)
是多余的,因为好像这条规则只能通过\(\rulename{6appN!}\)
第一次消去,且在被求值的时候查找变量。然而,有两个保留\(\rulename{6appN}\)
的原因。第一个纯粹是传统:我们在早期就被教育使用替代来消去程序,且在文献当中,其也被在写系统中广泛使用。第二个是更技术上的原因:规则\(\rulename{6mark}\)
要求一旦\(e_i\)
被消去成一个值,就要应用\(\rulename{6appN}\)
。\(\rulename{6appN!}\)
会将值提进存储中,且在应用中放入一个变量引用,其导致\(\rulename{6mark}\)
的另一个使用,以及\(\rulename{6appN!}\)
的另一个使用,并继续下去。
规则\(\rulename{6$\mu$app}\)
处理点参数列表的函数的应用。通过将额外的参数组织成一个表,一个这样的应用被转换成普通过程的应用。类似地,规则\(\rulename{6$\mu$app1}\)
处理单个变量作为参数列表的过程的应用。
规则\(\rulename{6var}\)
处理存储中的变量查找,\(\rulename{6set}\)
处理变量赋值。
下面两个规则\(\rulename{6proct}\)
和\(\rulename{6procf}\)
处理procedure?
的应用,其余的规则覆盖了非过程和任意错误的应用。
图A.9c中的规则覆盖了apply
。第一个规则\(\rulename{6applyf}\)
,覆盖了apply
的最后一个参数是空表的情况,并通过消去删去空表和apply
来进行简单的消去。第二个规则,\(\rulename{6applyc}\)
覆盖一个形式良好的apply
应用,其中,apply的最后一个参数是一个点对。它通过从存储中萃取点对的组件以及将它们放到apply
的应用中来进行消去。这样重复本规则的应用可以萃取存储外的传递给apply
的表的所有元素。
剩余的五条规则覆盖在使用apply
的过程中可能出现的各种各样的错误。第一个覆盖apply
应用到循环表的情况。后四个覆盖应用到非过程,传递非表作为最后一个参数,以及传递给apply
过少的参数。
A.10. Call/cc和动态缠绕(dynamic wind)
图A.10:Call/cc和动态缠绕
dynamic-wind
的规范使用表达式(dw x e e e)
来记录在计算的每个点哪些dynamic-wind槽是活动的。它的第一个参数是一个全局唯一的标识符,且可以用作指示dynamic-wind
的调用,其作用是为了避免在一个继续的切换中推出并重新进入相同的动态上下文中。第二三四个参数是来自dynamic-wind
调用的一些before,thunk和after过程调用。求值只发生在中间的表达式中;dw
表达式只用作记录哪个before和after过程需要在继续切换期间被运行。相应地,dynamic-wind
应用的消去规则消去到before过程的调用,dw
表达式和after
过程的调用,如图A.10中规则\(\rulename{6wind}\)
所示。下面两条规则覆盖dynamic-wind
过程的滥用:传递非过程调用,以错误数量的参数调用。规则\(\rulename{6dwdone}\)
在它的第二个参数已经完成计算的时候消除dw
表达式。
下面两条规则覆盖call/cc
。规则\(\rulename{6call/cc}\)
创建一个新的继续。这个继续拥有call/cc
的上下文,且将其打包到表示这个继续的throw
表达式中。throw
表达式使用新生的x来记录call/cc
应用在上下文中发生的地方,这时为了在继续被应用的时候在规则\(\rulename{6throw}\)
中使用。那个规则取得继续的参数,使用values
调用将其打包,并将其放回到原始call/cc
调用出现的地方,以元函数\(\mathscr{T}\)
返回的上下文替换当前的上下文。
元函数\(\mathscr{T}\)
(为了“修正”)接受两个D上下文,且绑定一个匹配其第二个参数的上下文,即目的上下文,这在已经被加入的上下文中排除了来自dw
表达式的before和after过程的多余的调用。
元函数\(\mathscr{T}\)
的第一个子句利用H上下文,这是一个包含除了dynamic-wind
上下文之外任何东西的上下文。它确保dynamic-wind
上下文的公共部分被忽略,更深地返回到两个表达式的上下文中,只要每个里面的第一个dw
表达式有匹配的标识符\((x_1)\)
。最后的规则是一个大杂烩;它只有在其它规则失败的时候才应用,且因此或者在没有dw
的时候应用,或者在dw
表达式不匹配的时候应用。它调用定义在图A.10中的两个其它的元函数,且将它们的结果一起放进begin
表达式中。
元函数\(\mathscr{R}\)
从其参数中提前所有的before过程,元函数\(\mathscr{S}\)
从其参数中提前所有的after过程。它们都构造新的上下文,且利用H处理完它们的参数,每次一个dw
。在任何情况下,元函数小心地保持正确的在每个过程周围的上下文,以防万一一个继续跳转发生在它们的求值中。由于\(\mathscr{R}\)
接收目的上下文,所以它在其结果中保持上下文的中间部分。这和\(\mathscr{S}\)
抛弃所有除了dw
之外的上下文形成对比,因为那是继续发生的上下文。
A.11. Letrec
图A.11:Letrec和letrec*
图A.11显示了处理letrec
,letrec*
,及它们产生的补充表达式,l!
和reinit
。作为第一个近似,letrec
和letrec*
两者都通过在新的位置分配空间来保持初始表达式的值的方式来消去,并将这些位置初始化为bh
(是“black hole(黑洞)”的简写),计算初始表达式,并使用l!
更新存储有初始表达式的值的位置。我们同时使用reinit
去检测一个letrec中的初始表达式是通过继续重新进入的情况。
在考虑letrec
和letrec*
怎样使用l!
和reinit
之前,首先考虑l!
和reinit
怎样工作。图A.11中的前两个规则覆盖了l!
。它和set!
的行为非常像,但它同时初始化普通的变量和当前绑定到黑洞(bh
)的变量。
下面两个规则覆盖当普通的set!
应用到当前被绑定到黑洞的情况。这种情况在程序在letrec初始化变量之前赋值给它的时候会发生,比如,(letrec ((x (set! x 5))) x)
。本报告指定一个实现应当或者执行一个赋值,如规则\(\rulename{6setdt}\)
所示,或是抛出一个异常,如规则\(\rulename{6setdte}\)
所示。
规则\(\rulename{6dt}\)
覆盖变量在初始化之前被引用的情况,在这种情况下必须总是抛出一个异常。
reinit
表达式用作检测在一个初始化表达式中捕获了一个继续的程序,并重新进入其中,这在\(\rulename{6init}\)
,\(\rulename{6reinit}\)
和\(\rulename{6reinite}\)
这三个规则中被展示。reinit
形式接受一个标识符,其被作为参数绑定到一个布尔的存储位置。它们被初始化为#f
。当reinit
被计算,它就会检查这个变量的值,如果其还是#f
,就将其改为#t
。如果其已经是#t
,reinit
或者什么都不做,或者抛出一个异常,并与letrec
和letrec*
两个的合法行为相一致。
图A.11中的最后两个规则将l!
和reinit
放在一起。为了获得初始表达式未定义的求值顺序,规则\(\rulename{6letrec}\)
将一个letrec
表达式消去为一个应用表达式。每个初始表达式被包裹进一个记录初始值的begin0
中,然后使用reinit
去检测返回到初始表达式中的继续。一旦所有的初始表达式被求值,规则右手边的过程被调用,其导致初始表达式的值被填充到存储位置,且求值以原始的letrec
表达式的内部继续。
规则\(\rulename{6letrec*}\)
的行为类似,但使用begin
表达式而不是一个应用,这是因为初始表达式被从左到右进行求值。此外,每个初始表达式在其被求值的时候被填充到存储位置,以便接下来的初始表达式可以引用它的值。
A.12. 规范不足(Underspecification)
图A.12:显式未定义的行为
图A.12中的规则覆盖未显式定义的语义部分。实现可以用不同的覆盖左边的规则替换规则\(\rulename{6ueqv}\)
和\(\rulename{6uval}\)
,只要它们遵守非正式的规范,任何的替换都是合法的。那三种情况对应于eqv?
应用到两个过程和多值被用在单值的上下文中的情况。
图A.12中剩余的规则覆盖从赋值操作,set!
,set-car!
和set-cdr!
的结果。实现不调整这些规则,而是通过调整插入unspecified:
\(\rulename{6setcar}\)
,\(\rulename{6setcdr}\)
,\(\rulename{6set}\)
和\(\rulename{6setd}\)
的规则使其失效。那些规则可通过在其中将unspecified
替换为任意数量的值来调整。
所以,剩余的规则只是指定了我们知道的一个值或多个值必须有的最小的行为,否则消去到unknown:
状态。规则\(\rulename{6udemand}\)
使unspecified
掉落到上下文U
中。U
的精确定义见图A.2b,但是直观地,他是一个只有一个单独的表达式层深度的上下文,其包含值取决于子表达式的表达式,就像if
的第一个子表达式。以下是在表达式中忽略unspecified
的规则,这些表达式忽略它们的一些子表达式的值。\(\rulename{6ubegin}\)
展示了begin
怎样在有多个表达式要求值的时候忽略其第一个表达式。接下来的两个规则,\(\rulename{6uhandlers}\)
和\(\rulename{6udew}\)
将unspecified
传播到它们的上下文中,这是因为它们也返回任意数量的值到它们的上下文中。最后,两个begin0
规则保留unspecified
直到规则\(\rulename{6begin01}\)
可以将其返回到它的上下文中。
附录B. 衍生形式的定义示例
本附录包含本报告描述的一些关键词根据比较简单的形式的定义示例。
cond
cond
关键词(第11.4.5小节)可以根据if
,let
和begin
通过syntax-rules
定义如下:
(define-syntax cond
(syntax-rules (else =>)
((cond (else result1 result2 ...))
(begin result1 result2 ...))
((cond (test => result))
(let ((temp test))
(if temp (result temp))))
((cond (test => result) clause1 clause2 ...)
(let ((temp test))
(if temp
(result temp)
(cond clause1 clause2 ...))))
((cond (test)) test)
((cond (test) clause1 clause2 ...)
(let ((temp test))
(if temp
temp
(cond clause1 clause2 ...))))
((cond (test result1 result2 ...))
(if test (begin result1 result2 ...)))
((cond (test result1 result2 ...)
clause1 clause2 ...)
(if test
(begin result1 result2 ...)
(cond clause1 clause2 ...)))))
case
case
关键词(第11.4.5小节)可以根据let
,cond
和memv
(见库的第3章)通过syntax-rules
定义如下:
(define-syntax case
(syntax-rules (else)
((case expr0
((key ...) res1 res2 ...)
...
(else else-res1 else-res2 ...))
(let ((tmp expr0))
(cond
((memv tmp '(key ...)) res1 res2 ...)
...
(else else-res1 else-res2 ...))))
((case expr0
((keya ...) res1a res2a ...)
((keyb ...) res1b res2b ...)
...)
(let ((tmp expr0))
(cond
((memv tmp '(keya ...)) res1a res2a ...)
((memv tmp '(keyb ...)) res1b res2b ...)
...)))))
let*
let*
关键词(第11.4.6小节)可以根据let
通过syntax-rules
定义如下:
(define-syntax let*
(syntax-rules ()
((let* () body1 body2 ...)
(let () body1 body2 ...))
((let* ((name1 expr1) (name2 expr2) ...)
body1 body2 ...)
(let ((name1 expr1))
(let* ((name2 expr2) ...)
body1 body2 ...)))))
letrec
let*
关键词(第11.4.6小节)可以大概根据let
和set!
通过syntax-rules
定义,使用一个辅助对象来产生需要在赋值前被创造需要保存值得临时变量,如下所示:
(define-syntax letrec
(syntax-rules ()
((letrec () body1 body2 ...)
(let () body1 body2 ...))
((letrec ((var init) ...) body1 body2 ...)
(letrec-helper
(var ...)
()
((var init) ...)
body1 body2 ...))))
(define-syntax letrec-helper
(syntax-rules ()
((letrec-helper
()
(temp ...)
((var init) ...)
body1 body2 ...)
(let ((var <undefined>) ...)
(let ((temp init) ...)
(set! var temp)
...)
(let () body1 body2 ...)))
((letrec-helper
(x y ...)
(temp ...)
((var init) ...)
body1 body2 ...)
(letrec-helper
(y ...)
(newtemp temp ...)
((var init) ...)
body1 body2 ...))))
语法<undefined>
表示一个返回一些东西的表达式,当被存储在一个位置时,导致一个条件类型是&assertion
的异常被抛出,如果一个读或写这个位置的尝试发生在letrec
转换产生的赋值发生之前的话。(Scheme中没有这样的表达式定义。)
一个使用syntax-case
和generate-temporaries
的更简单的定义在库的第12章被给出。
letrec*
letrec*
关键词可以大概根据let
和set!
通过syntax-rules
定义如下:
(define-syntax letrec*
(syntax-rules ()
((letrec* ((var1 init1) ...) body1 body2 ...)
(let ((var1 <undefined>) ...)
(set! var1 init1)
...
(let () body1 body2 ...)))))
语法<undefined>
和上面letrec
中定义的一样。
let-values
使用syntax-rules
的let-values
(第11.4.6小节)的下列定义采用一对帮助对象来为形参创建临时的名字。
(define-syntax let-values
(syntax-rules ()
((let-values (binding ...) body1 body2 ...)
(let-values-helper1
()
(binding ...)
body1 body2 ...))))
(define-syntax let-values-helper1
;; map over the bindings
(syntax-rules ()
((let-values
((id temp) ...)
()
body1 body2 ...)
(let ((id temp) ...) body1 body2 ...))
((let-values
assocs
((formals1 expr1) (formals2 expr2) ...)
body1 body2 ...)
(let-values-helper2
formals1
()
expr1
assocs
((formals2 expr2) ...)
body1 body2 ...))))
(define-syntax let-values-helper2
;; create temporaries for the formals
(syntax-rules ()
((let-values-helper2
()
temp-formals
expr1
assocs
bindings
body1 body2 ...)
(call-with-values
(lambda () expr1)
(lambda temp-formals
(let-values-helper1
assocs
bindings
body1 body2 ...))))
((let-values-helper2
(first . rest)
(temp ...)
expr1
(assoc ...)
bindings
body1 body2 ...)
(let-values-helper2
rest
(temp ... newtemp)
expr1
(assoc ... (first newtemp))
bindings
body1 body2 ...))
((let-values-helper2
rest-formal
(temp ...)
expr1
(assoc ...)
bindings
body1 body2 ...)
(call-with-values
(lambda () expr1)
(lambda (temp ... . newtemp)
(let-values-helper1
(assoc ... (rest-formal newtemp))
bindings
body1 body2 ...))))))
let*-values
下列的宏根据let
和let-values
通过syntax-rules
定义了let*-values
:
(define-syntax let*-values
(syntax-rules ()
((let*-values () body1 body2 ...)
(let () body1 body2 ...))
((let*-values (binding1 binding2 ...)
body1 body2 ...)
(let-values (binding1)
(let*-values (binding2 ...)
body1 body2 ...)))))
let
let
关键词可以根据lambda
和letrec
通过syntax-rules
被定义如下:
(define-syntax \ide{let}
(syntax-rules ()
((let ((name val) ...) body1 body2 ...)
((lambda (name ...) body1 body2 ...)
val ...))
((let tag ((name val) ...) body1 body2 ...)
((letrec ((tag (lambda (name ...)
body1 body2 ...)))
tag)
val ...))))
附录C. 附加材料
本报告本身,以及更多的关于本报告的材料,比如Scheme一些部分的参考实现,以及讨论本报告的邮件列表的集合在
位于
的Scheme网站,以及位于
http://library.readscheme.org/
的Readscheme网站包含广泛的Scheme参考文献,以及论文,程序,实现,以及其它关于Scheme的材料。
附录D. 示例
本节包含一个组成(runge-kutta)
库的示例,这个库提供一个integrate-system
过程,其以Runge-Kutta的方法对微分方程系统
求积分。
因为(runge-kutta)
库利用了(rnrs base (6))
库,所以其骨架如下所示:
#!r6rs
(library (runge-kutta)
(export integrate-system
head tail)
(import (rnrs base))
<library body>)
下面描述的过程定义放入那里。
参数system-derivative
是一个函数,其接受一个系统状态(一个代表状态变量\(y_1, \ldots, y_n\)
的向量值)且产生系统的导函数(值\(y_1^\prime, \ldots, y_n^\prime\)
)。参数initial-state
提供一个初始的系统状态,以及h
是综合系统步长的一个初始猜测。
integrate-system
的返回值是一个无限的系统状态流。
(define integrate-system
(lambda (system-derivative initial-state h)
(let ((next (runge-kutta-4 system-derivative h)))
(letrec ((states
(cons initial-state
(lambda ()
(map-streams next states)))))
states))))
runge-kutta-4
过程接受一个函数,h
,其从一个系统状态产生一个系统积分。runge-kutta-4
过程产生一个接受系统状态并产生一个新的系统状态的过程。
(define runge-kutta-4
(lambda (f h)
(let ((*h (scale-vector h))
(*2 (scale-vector 2))
(*1/2 (scale-vector (/ 1 2)))
(*1/6 (scale-vector (/ 1 6))))
(lambda (y)
;; y is a system state
(let* ((k0 (*h (f y)))
(k1 (*h (f (add-vectors y (*1/2 k0)))))
(k2 (*h (f (add-vectors y (*1/2 k1)))))
(k3 (*h (f (add-vectors y k2)))))
(add-vectors y
(*1/6 (add-vectors k0
(*2 k1)
(*2 k2)
k3))))))))
(define elementwise
(lambda (f)
(lambda vectors
(generate-vector
(vector-length (car vectors))
(lambda (i)
(apply f
(map (lambda (v) (vector-ref v i))
vectors)))))))
(define generate-vector
(lambda (size proc)
(let ((ans (make-vector size)))
(letrec ((loop
(lambda (i)
(cond ((= i size) ans)
(else
(vector-set! ans i (proc i))
(loop (+ i 1)))))))
(loop 0)))))
(define add-vectors (elementwise +))
(define scale-vector
(lambda (s)
(elementwise (lambda (x) (* x s)))))
map-streams
过程和map
类似:它将其第一个参数(一个过程)应用到其第二个参数(一个流)的所有元素上面。
(define map-streams
(lambda (f s)
(cons (f (head s))
(lambda () (map-streams f (tail s))))))
无限流以点对的方式实现,其car保存流的第一个元素,其cdr交付一个产生流的其余部分的过程。
(define head car)
(define tail
(lambda (stream) ((cdr stream))))
下列的程序展示了在对系统
进行积分时使用integrate-system
,此系统模拟了一个阻尼振荡器。
#!r6rs
(import (rnrs base)
(rnrs io simple)
(runge-kutta))
(define damped-oscillator
(lambda (R L C)
(lambda (state)
(let ((Vc (vector-ref state 0))
(Il (vector-ref state 1)))
(vector (- 0 (+ (/ Vc (* R C)) (/ Il C)))
(/ Vc L))))))
(define the-states
(integrate-system
(damped-oscillator 10000 1000 .001)
'#(1 0)
.01))
(letrec ((loop (lambda (s)
(newline)
(write (head s))
(loop (tail s)))))
(loop the-states))
; (根据勘误表添加。)
(close-output-port (current-output-port))
其会像下面一样打印输出:
#(1 0)
#(0.99895054 9.994835e-6)
#(0.99780226 1.9978681e-5)
#(0.9965554 2.9950552e-5)
#(0.9952102 3.990946e-5)
#(0.99376684 4.985443e-5)
#(0.99222565 5.9784474e-5)
#(0.9905868 6.969862e-5)
#(0.9888506 7.9595884e-5)
#(0.9870173 8.94753e-5)
附录E. 语言的变化
本章描述了自“修订5报告”4出版以来Scheme发生的大部分变化:
- 现在,Scheme源代码使用Unicode字符集。尤其,可被用作标识符的字符集被大大地扩展了。
- 现在,标识符可以以
->
字符开始。 - 现在,标识符和符号字面量是大小写敏感的。
- 标识符和字符,布尔,数字对象和
.
的表示必须被显式地区分。 - 现在,
#
是定界符(delimiter)。 - 字节向量字面量语法已被添加。
- 匹配的中括号可以和小括号等价得使用。
- 数据语法的简写
#'
(即syntax
),#`
(即quasisyntax
),#,
(即unsyntax
), and#,@
(即unsyntax-splicing
)被添加;见第4.3.5小节。 #
不再可以用在数字的表示中替换数字。- 现在,数字对象的外部表示可以包括一个尾数宽度。
- 非输和无限大的字面量被添加。
- 现在,字符串和字符字面量可以使用各种转移序列。
- 块注释和数据注释被添加。
- 用作报告兼容的
#!r6rs
注释词汇语法被添加。 - 现在,字符指定对应的Unicode标量值。
- 现在,许多的程序和语言的句法形式是
(rnrs base (6))
库的一部分。一些过程和句法形式被转移到其它库中;见表A.1。
assoc | (rnrs lists (6)) |
assv | (rnrs lists (6)) |
assq | (rnrs lists (6)) |
call-with-input-file | (rnrs io simple (6)) |
call-with-output-file | (rnrs io simple (6)) |
char-upcase | (rnrs unicode (6)) |
char-downcase | (rnrs unicode (6)) |
char-ci=? | (rnrs unicode (6)) |
char-ci<? | (rnrs unicode (6)) |
char-ci>? | (rnrs unicode (6)) |
char-ci<=? | (rnrs unicode (6)) |
char-ci>=? | (rnrs unicode (6)) |
char-alphabetic? | (rnrs unicode (6)) |
char-numeric? | (rnrs unicode (6)) |
char-whitespace? | (rnrs unicode (6)) |
char-upper-case? | (rnrs unicode (6)) |
char-lower-case? | (rnrs unicode (6)) |
close-input-port | (rnrs io simple (6)) |
close-output-port | (rnrs io simple (6)) |
current-input-port | (rnrs io simple (6)) |
current-output-port | (rnrs io simple (6)) |
display | (rnrs io simple (6)) |
do | (rnrs control (6)) |
eof-object? | (rnrs io simple (6)) |
eval | (rnrs eval (6)) |
delay | (rnrs r5rs (6)) |
exact->inexact | (rnrs r5rs (6)) |
force | (rnrs r5rs (6)) |
inexact->exact | (rnrs r5rs (6)) |
member | (rnrs lists (6)) |
memv | (rnrs lists (6)) |
memq | (rnrs lists (6)) |
modulo | (rnrs r5rs (6)) |
newline | (rnrs io simple (6)) |
null-environment | (rnrs r5rs (6)) |
open-input-file | (rnrs io simple (6)) |
open-output-file | (rnrs io simple (6)) |
peek-char | (rnrs io simple (6)) |
quotient | (rnrs r5rs (6)) |
read | (rnrs io simple (6)) |
read-char | (rnrs io simple (6)) |
remainder | (rnrs r5rs (6)) |
scheme-report-environment | (rnrs r5rs (6)) |
set-car! | (rnrs mutable-pairs (6)) |
set-cdr! | (rnrs mutable-pairs (6)) |
string-ci=? | (rnrs unicode (6)) |
string-ci<? | (rnrs unicode (6)) |
string-ci>? | (rnrs unicode (6)) |
string-ci<=? | (rnrs unicode (6)) |
string-ci>=? | (rnrs unicode (6)) |
string-set! | (rnrs mutable-strings (6)) |
string-fill! | (rnrs mutable-strings (6)) |
with-input-from-file | (rnrs io simple (6)) |
with-output-to-file | (rnrs io simple (6)) |
write | (rnrs io simple (6)) |
write-char | (rnrs io simple (6)) |
图A.1:标识符转移到库中
- 基本语言有下列新的过程和句法形式:
letrec*
,let-values
,let*-values
,real-valued?
,rational-valued?
,integer-valued?
,exact
,inexact
,finite?
,infinite?
,nan?
,div
,mod
,div-and-mod
,div0
,mod0
,div0-and-mod0
,exact-integer-sqrt
,boolean=?
,symbol=?
,string-for-each
,vector-map
,vector-for-each
,error
,assertion-violation
,assert
,call/cc
,identifier-syntax
。 - 下列的过程被移除:
char-ready?
,transcript-on
,transcript-off
,load
。 - 大小写不敏感的字符串比较(
string-ci=?
,string-ci<?
,string-ci>?
,string-ci<=?
,string-ci>=?
)操作字符串大小写折叠(case-folded)的版本,而不是其对应的字符比较过程的简单的字典序。 - 库被加到了语言当中。
- 许多的标准库在一个单独的报告1中被描述。
- 许多“是一个错误”的情况现在有了预定义的或强制的行为。尤其,其中许多现在按照异常系统指定。
- 现在,完整的数值塔是必须的。
- 超越函数(transcendental functions)的语义被更加完整地指定。
- 以零为底数的
expt
的语义被改善 - 在
syntax-rules
形式中,一个_
可以被用作取代关键词。 let-syntax
和letrec-syntax
不再为它们的内部引入一个新的环境。- 对于支持非数和无限大的实现,在这些值上的许多算术操作被指定和IEEE 754相一致。
- 对于支持严格的-0.0的实现,关于-0.0的许多算术操作的语义被指定和IEEE 754相一致。
- 现在,Scheme的实数对象有一个精确的零作为它们的虚部。
quasiquote
的规范被扩展了。现在,嵌套的quasiquotation可以正确地工作,且unquote
和unquote-splicing
被扩展到一些操作数上。- 现在,过程可以指向一个位置,或者也可以不指向一个位置。因此,在一些以前
eqv?
有指定行为的地方,现在,其是未定义的。 quasiquote
结构的值的易变性在某种程度上被指定。- 现在,
dynamic-wind
的before和after过程的动态环境是定义的。 - 现在,只有副作用的各种表达式允许返回任意数量的值。
- 宏扩展的顺序和语义被更加完整地指定。
- 现在,内部定义按照
letrec*
定义。 - 程序结构和Scheme顶层环境的旧符号被顶层程序和库代替。
- 指称语义(denotational semantics)被一个基于“修订5报告”4一个早期语义的操作语义(operational semantics)25取代。
参考文献
Michael Sperber, R. Kent Dybvig, Matthew Flatt, Anton van Straaten, Richard Kelsey, William Clinger, and Jonathan Rees. Revised6 report on the algorithmic language Scheme (Libraries). http://www.r6rs.org/, 2007. ↩ ↩2 ↩3
Michael Sperber, R. Kent Dybvig, Matthew Flatt, and Anton van Straaten. Revised6 report on the algorithmic language Scheme (Non-Normative appendices). http://www.r6rs.org/, 2007. ↩
Michael Sperber, R. Kent Dybvig, Matthew Flatt, and Anton van Straaten. Revised6 report on the algorithmic language Scheme (Rationale). http://www.r6rs.org/, 2007. ↩
Richard Kelsey, William Clinger, and Jonathan Rees. Revised5 report on the algorithmic language Scheme. Higher-Order and Symbolic Computation, 11(1):7–105, 1998. ↩ ↩2 ↩3
Texas Instruments, Inc. TI Scheme Language Reference Manual, November 1985. Preliminary version 1.0. ↩
MIT Department of Electrical Engineering and Computer Science. Scheme manual, seventh edition, September 1984. ↩
Jonathan A. Rees, Norman I. Adams IV, and James R. Meehan. The T manual. Yale University Computer Science Department, fourth edition, January 1984. ↩
Daniel P. Friedman, Christopher Haynes, Eugene Kohlbecker, and Mitchell Wand. Scheme 84 interim reference manual. Indiana University, January 1985. Indiana University Computer Science Technical Report 153. ↩
Guy Lewis Steele Jr. Common Lisp: The Language. Digital Press, Burlington, MA, second edition, 1990. ↩
R. Kent Dybvig. Chez Scheme Version 7 User’s Guide. Cadence Research Systems, 2005. http://www.scheme.com/csug7/. ↩
Matthew Flatt. PLT MzScheme: Language Manual. Rice University, University of Utah, July 2006. http://download.plt-scheme.org/doc/352/html/mzscheme/. ↩
J. W. Backus, F.L. Bauer, J.Green, C. Katz, J. McCarthy P. Naur, A. J. Perlis, H. Rutishauser, K. Samuelson, B. Vauquois J. H. Wegstein, A. van Wijngaarden, and M. Woodger. Revised report on the algorithmic language Algol 60. Communications of the ACM, 6(1):1–17, 1963. ↩
William M. Waite and Gerhard Goos. Compiler Construction. Springer-Verlag, 1984. ↩
Scott Bradner. Key words for use in RFCs to indicate requirement levels. http://www.ietf.org/rfc/rfc2119.txt, March 1997. RFC 2119. ↩
IEEE standard 754-1985. IEEE standard for binary floating-point arithmetic, 1985. Reprinted in SIGPLAN Notices, 22(2):9-25, 1987. ↩
The Unicode Consortium. The Unicode standard, version 5.0.0. defined by: The Unicode Standard, Version 5.0 (Boston, MA, Addison-Wesley, 2007. ISBN 0-321-48091-0), 2007. ↩ ↩2
William Clinger. Proper tail recursion and space efficiency. In Keith Cooper, editor, Proceedings of the 1998 Conference on Programming Language Design and Implementation, pages 174–185, Montreal, Canada, June 1998. ACM Press. Volume 33(5) of SIGPLAN Notices. ↩
Eugene E. Kohlbecker Jr. Syntactic Extensions in the Programming Language Lisp. PhD thesis, Indiana University, August 1986. ↩
Eugene E. Kohlbecker, Daniel P. Friedman, Matthias Felleisen, and Bruce Duba. Hygienic macro expansion. In Proceedings of the 1986 ACM Conference on Lisp and Functional Programming, pages 151–161, 1986. ↩
Alan Bawden and Jonathan Rees. Syntactic closures. In ACM Conference on Lisp and Functional Programming, pages 86–95, Snowbird, Utah, 1988. ACM Press. ↩
William Clinger and Jonathan Rees. Macros that work. In Proceedings 1991 ACM SIGPLAN Symposium on Principles of Programming Languages, pages 155–162, Orlando, Florida, January 1991. ACM Press. ↩
R. Kent Dybvig, Robert Hieb, and Carl Bruggeman. Syntactic abstraction in Scheme. Lisp and Symbolic Computation, 1(1):53–75, 1988. ↩
Robert G. Burger and R. Kent Dybvig. Printing floating-point numbers quickly and accurately. In Proceedings of the ACM SIGPLAN ‘96 Conference on Programming Language Design and Implementation, pages 108–116, Philadelphia, PA, USA, May 1996. ACM Press. ↩
William D. Clinger. How to read floating point numbers accurately. In Proceedings Conference on Programming Language Design and Implementation ‘90, pages 92–101, White Plains, New York, USA, June 1990. ACM. ↩
Jacob Matthews and Robert Bruce Findler. An operational semantics for Scheme. Journal of Functional Programming, 2007. From http://www.cambridge.org/journals/JFP/. ↩ ↩2
Matthias Felleisen and Matthew Flatt. Programming languages and lambda calculi. http://www.cs.utah.edu/plt/publications/pllc.pdf, 2003. ↩
Andrew Wright and Matthias Felleisen. A syntactic approach to type soundness. Information and Computation, 115(1):38–94, 1994. First appeared as Technical Report TR160, Rice University, 1991. ↩
Jacob Matthews, Robert Bruce Findler, Matthew Flatt, and Matthias Felleisen. A visual environment for developing context-sensitive term rewriting systems. In Proceedings 15th Conference on Rewriting Techniques and Applications, Aachen, June 2004. Springer-Verlag. ↩
Jacob Matthews and Robert Bruce Findler. An operational semantics for R5RS Scheme. In J. Michael Ashley and Michael Sperber, editors, Proceedings of the Sixth Workshop on Scheme and Functional Programming, pages 41–54, Tallin, Estonia, September 2005. Indiana University Technical Report TR619. ↩
© 2017 Jks Liu with help from Jekyll Bootstrap and Twitter Bootstrap