是否有一种算法,可以给定两个字符串,从而产生它们之间的相等程度,并应用可以从外部提供的指标?例如,两个字符串"Plant code"
和"PlantCode"
可以等于0.8,"Plant code"
和"Plant"
可以等于0.6,"Truck no"
和"shipment details"
可以等于0.6(使用外部提供的同义词字典)。这些数字是虚构的,但我希望他们能阐明这一点。是否存在这样的算法?我希望它作为一个库来提供,而不是必须自己实现。任何帮助将不胜感激。谢谢。
最佳答案
试试Simmetrics库。它提供了大量的相似度指标。