我试图统一数据库中的记录,我使用levenshtein算法,并在某些情况下有效,
工作样品(距离

* --------- * ---------- * -------- *
|  Looking  |    Finds   | Distance |
* --------- * ---------- * -------- *
| No existe | No Existe  |     1    |
| desempleo | Desempleo  |     1    |
* --------- * ---------- * -------- *

这很好,但忽略了市长距离的情况,比如:
FemeninoFEMENINO距离为7
注意:我正在寻找一个php解决方案

最佳答案

比较

   echo levenshtein("Femenino", "FEMENINO");    // 7


 echo levenshtein(strtolower("Femenino"), strtolower("FEMENINO"));  //0

如果字母大小写对您的应用程序不重要,请在比较之前使两个字符串大小写相同,这样您将得到显著的改进。

10-06 13:54