我使用Ternary Search Tree已有一段时间,因为它是实现自动完成下拉组合框的数据结构。这意味着,当用户键入“fo”时,将显示下拉组合框


餐饮
足球

问题是,我当前使用的三元搜索树区分大小写。我的实现如下。它已被现实世界使用了大约1 ++年。因此,我认为它非常可靠。

My Ternary Search Tree code

但是,我正在寻找一个不区分大小写的三元搜索树,这意味着当我键入“fo”时,下拉组合框将向我显示

O
餐饮
足球

这是TST的一些关键接口,我希望新的区分大小写的TST可能也具有类似的接口。

    /**
 * Stores value in the TernarySearchTree. The value may be retrieved using key.
 * @param key A string that indexes the object to be stored.
 * @param value The object to be stored in the tree.
 */
public void put(String key, E value) {
    getOrCreateNode(key).data = value;
}

/**
 * Retrieve the object indexed by key.
 * @param key A String index.
 * @return Object The object retrieved from the TernarySearchTree.
 */
public E get(String key) {
    TSTNode<E> node = getNode(key);
    if(node==null) return null;
    return node.data;
}

用法示例如下。 TSTSearchEngine使用TernarySearchTree作为核心骨干。

Example usage of Ternary Search Tree
// There is stock named microsoft and MICROChip inside stocks ArrayList.
TSTSearchEngine<Stock> engine = TSTSearchEngine<Stock>(stocks);
// I wish it would return microsoft and MICROCHIP. Currently, it just return microsoft.
List<Stock> results = engine.searchAll("micro");

最佳答案

使当前三元搜索树难以支持不区分大小写的搜索的关键因素之一是,我的底层数据结构是一对一映射。请看下面的测试代码:

public void testPut() {
    System.out.println("put");
    Name name0 = new Name("abc");
    Name name1 = new Name("abc");
    TernarySearchTree<Name> instance = new TernarySearchTree<Name>();
    instance.put(name0.toString(), name0);
    instance.put(name1.toString(), name1);
    assertEquals(2, instance.matchPrefix("a").size()); // fail here. Result is 1
}

我当前的短期解决方案是,我正在使用TSTSearchEngine来包装整个TernarySearchTree。 TSTSearchEngine包含

(1)TernarySearchTree,提供要映射的大写键。
(2)String-To-ArrayList映射。

这是我表演时发生的事情:
TSTSearchEngine<Name> engine = TSTSearchEngine<Name>();
engine.put(name0); // name0 is new Name("Abc");
engine.put(name1); // name0 is new Name("aBc");

(1)name0.toString()将被转换为大写(“ABC”)。它将插入到TernarySearchTree中。对于TernarySearchTree,“ABC”既是键又是值。
(2)“ABC”将用作映射的键​​,以将name0插入到数组列表中。
(3)name1.toString()将转换为大写(“ABC”)。它将插入到TernarySearchTree中。 S1将是TernarySearchTree的键和值。
(4)“ABC”将用作映射的键​​,以将name1插入到数组列表中。

当我尝试
engine.searchAll("a");

(1)TernarySearchTree将返回“ABC”。
(2)“ABC”将用作访问地图的密钥。 Map将返回一个数组列表,其中包含name0和name1。

此解决方案有效。示例代码可以参考Sample Code for New TSTSearchEngine

但是,这可能不是一个有效的解决方案,因为它需要两次搜索。我发现在C++ C++ Implementation of Case Insensitive Ternary Search Tree中有一个实现。因此,有机会将C++代码移植到Java。

10-05 18:11