是否有一种算法,可以给定两个字符串,从而产生它们之间的相等程度,并应用可以从外部提供的指标?例如,两个字符串"Plant code""PlantCode"可以等于0.8,"Plant code""Plant"可以等于0.6,"Truck no""shipment details"可以等于0.6(使用外部提供的同义词字典)。这些数字是虚构的,但我希望他们能阐明这一点。是否存在这样的算法?我希望它作为一个库来提供,而不是必须自己实现。任何帮助将不胜感激。谢谢。

最佳答案

试试Simmetrics库。它提供了大量的相似度指标。

10-04 23:09