我读过很多帖子,比如:
Levenshtein distance based methods Vs Soundex
Lightweight fuzzy search library
我已经找到了double metaphone code。
但是双元音素算法返回给定字符串的元组,假设该字符串是单个单词。有人知道一种拼音算法可以处理同一个名字中的多个单词吗如果不是,最好的方法是编写一个脚本来计算此列中每个单词的单词数,然后在数据集中最频繁出现的单元格中对单词运行双变音?
最佳答案
实际上,元音位或双元音位的设计并非只适用于专有名称,而不适用于“字典词”metaphone、double metaphone和metaphone 3都是为同时处理名称和单词而设计的,并且是针对同时包含名称和单词的数据库开发的