我们有用户生成的各种雇主的名字。例如,人们输入或导入了:
谷歌
谷歌公司
谷歌公司
谷歌公司
对一个数据库搜索这个,看起来像一个不同的公司在一起。我们已经做了一些改变,将每个雇主的名字映射成一个“标准化”的名字,但是总共有70000个,手工操作变得很困难。
有没有人对如何规范化现有条目以及如何维护我们对所有传入名称的规范化有什么建议?
最佳答案
有两件事你可以帮忙:
当用户添加公司名称时,给他们一个自动完成框,以便他们在公司名称已经存在时获得建议。或者像stackoverflow在添加问题时那样建议现有的问题。
查询数据库时使用搜索工具,以便可以汇总所有变体。您可以在这里找到搜索宝石https://www.ruby-toolbox.com/categories/rails_search
我认为事后“正常化”他们既不容易也不准确。
关于ruby-on-rails - 如何规范公司名称,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/7974972/