3.1符号表

符号表最主要的目的就是将一个键和一个值联系起来。用例能够将一个键值对插入符号表并希望在之后能够从符号表的所有键值对中按照键值姐找到对应的值。要实现符号表,我们首先要定义其背后的数据结构,并指明创建并操作这种数据结构以实现插入、查找操作所需要的算法。

查找在大多数应用程序中都至关重要,许多编程环境也因此将符号表实现为高级的抽象数据结构,包括Java——我们会在3.5节中讨论Java的符号表实现。下标给出的例子是在一些典型的应用场景中可能出项的键和值。我们马上会看到一些参考性的用例。3.5节的目的就是向你展示如何在程序中有效的使用符号表。本书中我们还会在其他算法中使用符号表。

定义。符号表是一种存储键值对的数据结构,支持两种操作:插入(put),即将一组新的键值对存入表中;查找(get),即根据给定的键得到相应的值。

《Algorithms 4th Edition》读书笔记——3.1 符号表(Elementary Symbol Tables)-Ⅰ-LMLPHP

3.1.1 API

符号表是一种典型的抽象数据类型:它代表着一组定义清晰的值以及相应的操作,使得我们能够将类型的实现和使用区分开来。和以前一样,我们要用应用程序编程接口(API)来精确地定义这些操作,为数据类型的实现和用例提供一份“契约”。

在查看用例代码之前,为了保证代码的一致、简洁和实用,我们要先说明具体实现中的几个设计决策。

《Algorithms 4th Edition》读书笔记——3.1 符号表(Elementary Symbol Tables)-Ⅰ-LMLPHP

3.1.1.1 泛型

和排序一样,在设计方法时我们没有指定处理对象的类型,而是使用了泛型。对于符号表,我们通过明确地制定查找时键和值的类型来区分它们的不用角色,而被忽视优先队列那样将键和元素本身混为一谈。在考虑了这份基本的API后(例如,这里没有说明键的有序性),我们会用Copparable的对象来扩展典型的用例。这也会为数据类型带来许多新的方法。

3.1.1.2 重复的键

我们的所有实现都遵循以下规则:

◆每个键值能对应着一个值(表中不允许存在重复的键)

◆当用例代码向表中存入的键值对和表中已有的键(及关联的值)冲突时,新的值会代替旧的值。

这些规则定义了关联数组的抽象形式。你可以将符号表想象成一个数组,新的值会代替旧的值。关联数组(符号表)中,键可以是任意类型,但我们可以用它阿里快速访问数组的内容。一些编程语言(非Java)值姐支持程序员使用st[key]来代替st.get(key), st[key] = val来代替st.put(key, val),其中key(键)和val(值)都可以是任意类型的对象。

3.1.1.3 空(null)键

键不能为空。和Java中的许多其他机制一样,使用空键会产生一个运行时异常。

3.1.1.4 空(null)值

我们还规定不允许有空值。这个规定的值姐原因是在我们的API定义中,当键不存在时get()方法会返回空,这也意味着任何不在表中的键关联的值都是空。这个规定产生了两个(我们所期望的)结果:第一,我们可以用get()方法是否返回空来测试给定的键是否存在于符号表中;第二,我们可以将空值作为put()方法的第二个参数存入表中来实现删除,也就是删除操作的主要内容。

3.1.1.5 删除操作

在符号表中,删除的实现可以有两种方法:延时删除,也就是将键对应的值置为空,然后在某个时候删除所有值为空的键;或是即时删除,也就是立刻从表中删除指定的键。刚才已经说过,put(key, null)是delete(key)的一种简单的(延时型)delete()就是为了代替这种默认的方案。在我们的符号表实现中不会使用默认的方案,而在本书的网站上put()实现的开头有这样一句防御性代码:

if(val == null)  {delete(key); return ;}

这保证了符号表中任何键的值都不为空。

3.1.1.6 便捷方法

为了用例代码的清晰,我们在API中加入了contains()和isEmpty()方法,他们的实现如下表。

方法默认实现
boolean contains(key key)return get(key) != null;
void delete(Key key)put(key, null);
boolean isEmpty()return size() == 0;

3.1.1.7 迭代

为了方便用例处理表中的所有键值,我们有时会在API的第一行加上implements Iterable<Key>这句话,强制所有实现都必须包含iterator() 方法来返回一个实现了hasNext()和next()方法的迭代器。但是对于符号表我们采用了一个更简单的方法。我们定义了keys()方法来返回一个Iterable<Key>队形以方便用例遍历所有的键。这么做是为了和以后的有序符号表的所有方法保持一直,使得用例可以遍历表的键集的一个指定的部分。

3.1.1.8 键的等价性

要确定一个给定的键是否存在于符号表中,首先要确立对象等价性的概念。在Java中,按照约定所有的对象都继承了一个equals()方法,Java也为它标准数据类型例如Integer、Double和String 以及一些更复杂的类型,如File和URL,实现了equals()方法——当使用这些数据类型时你可以直接使用内置的实现。例如,如果x和y都是String类型,当且仅当x和y的长度相同且每个位置上的字母都相同时,x.equals(y)返回true。而自定义的键则需要重写equals()方法。


05-11 13:59