概述
规格文件是计算机语言的官方标准,详细描述语法规则和实现方法。
一般来说,没有必要阅读规格,除非你要写编译器。因为规格写得非常抽象和精炼,又缺乏实例,不容易理解,而且对于解决实际的应用问题,帮助不大。但是,如果你遇到疑难的语法问题,实在找不到答案,这时可以去查看规格文件,了解语言标准是怎么说的。规格是解决问题的“最后一招”。
这对 JavaScript 语言很有必要。因为它的使用场景复杂,语法规则不统一,例外很多,各种运行环境的行为不一致,导致奇怪的语法问题层出不穷,任何语法书都不可能囊括所有情况。查看规格,不失为一种解决语法问题的最可靠、最权威的终极方法。
本章介绍如何读懂 ECMAScript 6 的规格文件。
ECMAScript 6 的规格,可以在 ECMA 国际标准组织的官方网站(www.ecma-international.org/ecma-262/6.0/)免费下载和在线阅读。
这个规格文件相当庞大,一共有 26 章,A4 打印的话,足足有 545 页。它的特点就是规定得非常细致,每一个语法行为、每一个函数的实现都做了详尽的清晰的描述。基本上,编译器作者只要把每一步翻译成代码就可以了。这很大程度上,保证了所有 ES6 实现都有一致的行为。
ECMAScript 6 规格的 26 章之中,第 1 章到第 3 章是对文件本身的介绍,与语言关系不大。第 4 章是对这门语言总体设计的描述,有兴趣的读者可以读一下。第 5 章到第 8 章是语言宏观层面的描述。第 5 章是规格的名词解释和写法的介绍,第 6 章介绍数据类型,第 7 章介绍语言内部用到的抽象操作,第 8 章介绍代码如何运行。第 9 章到第 26 章介绍具体的语法。
对于一般用户来说,除了第 4 章,其他章节都涉及某一方面的细节,不用通读,只要在用到的时候,查阅相关章节即可。
术语
ES6 规格使用了一些专门的术语,了解这些术语,可以帮助你读懂规格。本节介绍其中的几个。
抽象操作
所谓”抽象操作“(abstract operations)就是引擎的一些内部方法,外部不能调用。规格定义了一系列的抽象操作,规定了它们的行为,留给各种引擎自己去实现。
举例来说,Boolean(value)
的算法,第一步是这样的。
这里的ToBoolean
就是一个抽象操作,是引擎内部求出布尔值的算法。
许多函数的算法都会多次用到同样的步骤,所以 ES6 规格将它们抽出来,定义成”抽象操作“,方便描述。
Record 和 field
ES6 规格将键值对(key-value map)的数据结构称为 Record,其中的每一组键值对称为 field。这就是说,一个 Record 由多个 field 组成,而每个 field 都包含一个键名(key)和一个键值(value)。
[[Notation]]
ES6 规格大量使用[[Notation]]
这种书写法,比如[[Value]]
、[[Writable]]
、[[Get]]
、[[Set]]
等等。它用来指代 field 的键名。
举例来说,obj
是一个 Record,它有一个Prototype
属性。ES6 规格不会写obj.Prototype
,而是写obj.[[Prototype]]
。一般来说,使用[[Notation]]
这种书写法的属性,都是对象的内部属性。
所有的 JavaScript 函数都有一个内部属性[[Call]]
,用来运行该函数。
F.[[Call]](V, argumentsList)
上面代码中,F
是一个函数对象,[[Call]]
是它的内部方法,F.[[call]]()
表示运行该函数,V
表示[[Call]]
运行时this
的值,argumentsList
则是调用时传入函数的参数。
Completion Record
每一个语句都会返回一个 Completion Record,表示运行结果。每个 Completion Record 有一个[[Type]]
属性,表示运行结果的类型。
[[Type]]
属性有五种可能的值。
- normal
- return
- throw
- break
- continue
如果[[Type]]
的值是normal
,就称为 normal completion,表示运行正常。其他的值,都称为 abrupt completion。其中,开发者只需要关注[[Type]]
为throw
的情况,即运行出错;break
、continue
、return
这三个值都只出现在特定场景,可以不用考虑。
抽象操作的标准流程
抽象操作的运行流程,一般是下面这样。
上面的第一步是调用抽象操作AbstractOp()
,得到resultCompletionRecord
,这是一个 Completion Record。第二步,如果这个 Record 属于 abrupt completion,就将resultCompletionRecord
返回给用户。如果此处没有返回,就表示运行结果正常,所得的值存放在resultCompletionRecord.[[Value]]
属性。第三步,将这个值记为result
。第四步,将result
返回给用户。
ES6 规格将这个标准流程,使用简写的方式表达。
这个简写方式里面的ReturnIfAbrupt(result)
,就代表了上面的第二步和第三步,即如果有报错,就返回错误,否则取出值。
甚至还有进一步的简写格式。
上面流程的?
,就代表AbstractOp()
可能会报错。一旦报错,就返回错误,否则取出值。
除了?
,ES 6 规格还使用另一个简写符号!
。
上面流程的!
,代表AbstractOp()
不会报错,返回的一定是 normal completion,总是可以取出值。
相等运算符
下面通过一些例子,介绍如何使用这份规格。
相等运算符(==
)是一个很让人头痛的运算符,它的语法行为多变,不符合直觉。这个小节就看看规格怎么规定它的行为。
请看下面这个表达式,请问它的值是多少。
0 == null
如果你不确定答案,或者想知道语言内部怎么处理,就可以去查看规格,7.2.12 小节是对相等运算符(==
)的描述。
规格对每一种语法行为的描述,都分成两部分:先是总体的行为描述,然后是实现的算法细节。相等运算符的总体描述,只有一句话。
上面这句话的意思是,相等运算符用于比较两个值,返回true
或false
。
下面是算法细节。
上面这段算法,一共有 12 步,翻译如下。
由于0
的类型是数值,null
的类型是 Null(这是规格4.3.13 小节的规定,是内部 Type 运算的结果,跟typeof
运算符无关)。因此上面的前 11 步都得不到结果,要到第 12 步才能得到false
。
0 == null // false
数组的空位
下面再看另一个例子。
const a1 = [undefined, undefined, undefined];
const a2 = [, , ,];
a1.length // 3
a2.length // 3
a1[0] // undefined
a2[0] // undefined
a1[0] === a2[0] // true
上面代码中,数组a1
的成员是三个undefined
,数组a2
的成员是三个空位。这两个数组很相似,长度都是 3,每个位置的成员读取出来都是undefined
。
但是,它们实际上存在重大差异。
0 in a1 // true
0 in a2 // false
a1.hasOwnProperty(0) // true
a2.hasOwnProperty(0) // false
Object.keys(a1) // ["0", "1", "2"]
Object.keys(a2) // []
a1.map(n => 1) // [1, 1, 1]
a2.map(n => 1) // [, , ,]
上面代码一共列出了四种运算,数组a1
和a2
的结果都不一样。前三种运算(in
运算符、数组的hasOwnProperty
方法、Object.keys
方法)都说明,数组a2
取不到属性名。最后一种运算(数组的map
方法)说明,数组a2
没有发生遍历。
为什么a1
与a2
成员的行为不一致?数组的成员是undefined
或空位,到底有什么不同?
规格的12.2.5 小节《数组的初始化》给出了答案。
翻译如下。
上面的规格说得很清楚,数组的空位会反映在length
属性,也就是说空位有自己的位置,但是这个位置的值是未定义,即这个值是不存在的。如果一定要读取,结果就是undefined
(因为undefined
在 JavaScript 语言中表示不存在)。
这就解释了为什么in
运算符、数组的hasOwnProperty
方法、Object.keys
方法,都取不到空位的属性名。因为这个属性名根本就不存在,规格里面没说要为空位分配属性名(位置索引),只说要为下一个元素的位置索引加 1。
至于为什么数组的map
方法会跳过空位,请看下一节。
数组的 map 方法
规格的22.1.3.15 小节定义了数组的map
方法。该小节先是总体描述map
方法的行为,里面没有提到数组空位。
后面的算法描述是这样的。
翻译如下。
仔细查看上面的算法,可以发现,当处理一个全是空位的数组时,前面步骤都没有问题。进入第 10 步中第 2 步时,kPresent
会报错,因为空位对应的属性名,对于数组来说是不存在的,因此就会返回,不会进行后面的步骤。
const arr = [, , ,];
arr.map(n => {
console.log(n);
return 1;
}) // [, , ,]
上面代码中,arr
是一个全是空位的数组,map
方法遍历成员时,发现是空位,就直接跳过,不会进入回调函数。因此,回调函数里面的console.log
语句根本不会执行,整个map
方法返回一个全是空位的新数组。
V8 引擎对map
方法的实现如下,可以看到跟规格的算法描述完全一致。
function ArrayMap(f, receiver) {
CHECK_OBJECT_COERCIBLE(this, "Array.prototype.map");
// Pull out the length so that modifications to the length in the
// loop will not affect the looping and side effects are visible.
var array = TO_OBJECT(this);
var length = TO_LENGTH_OR_UINT32(array.length);
return InnerArrayMap(f, receiver, array, length);
}
function InnerArrayMap(f, receiver, array, length) {
if (!IS_CALLABLE(f)) throw MakeTypeError(kCalledNonCallable, f);
var accumulator = new InternalArray(length);
var is_array = IS_ARRAY(array);
var stepping = DEBUG_IS_STEPPING(f);
for (var i = 0; i < length; i++) {
if (HAS_INDEX(array, i, is_array)) {
var element = array[i];
// Prepare break slots for debugger step in.
if (stepping) %DebugPrepareStepInIfStepping(f);
accumulator[i] = %_Call(f, receiver, element, i, array);
}
}
var result = new GlobalArray();
%MoveArrayContents(accumulator, result);
return result;
}