我试图统一数据库中的记录,我使用levenshtein算法,并在某些情况下有效,
工作样品(距离
* --------- * ---------- * -------- *
| Looking | Finds | Distance |
* --------- * ---------- * -------- *
| No existe | No Existe | 1 |
| desempleo | Desempleo | 1 |
* --------- * ---------- * -------- *
这很好,但忽略了市长距离的情况,比如:
Femenino
和FEMENINO
距离为7注意:我正在寻找一个php解决方案
最佳答案
比较
echo levenshtein("Femenino", "FEMENINO"); // 7
对
echo levenshtein(strtolower("Femenino"), strtolower("FEMENINO")); //0
如果字母大小写对您的应用程序不重要,请在比较之前使两个字符串大小写相同,这样您将得到显著的改进。