我有两个项目清单,应该匹配的全名只。对于确切的名称,应该没有问题,但是如果全名包含缺少的或缩写的部分,比如
“约翰·布莱尔·史密斯”对“约翰·B·史密斯”或
“约翰·布莱尔·史密斯”对“约翰·B·坎贝尔·史密斯”
哪种算法可以用于计算加权相似度,然后根据此相似度得分从不同列表中匹配这些名称?

最佳答案

使用字符串距离算法之一。其中有很多:
汉明距离
编辑距离
达梅劳距离
最佳串对齐
还有更多…
让我们在这篇关于Comparison of String Distance Algorithms的文章中激励自己。

关于algorithm - 如何计算全名之间的相似度?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/28914768/

10-11 03:33