我正在尝试提出一个隐式拼写检查器,该检查器将使用输入单词到某种更通用的语音表示形式的映射来解决可能出现的拼写错误,基本上是针对一个搜索栏,它将自动将您的拼写纠正到一定程度。我一直在研究的两件事是变音器,nysiis和soundex,但我真的不知道哪个对这个应用程序会更好。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
我希望有更多的匹配项而不是更少的匹配项,并且我希望匹配项更通用,因此出于这个原因,我正在考虑使用soundex,它看起来比原始的元音素更近似映射,但是我真的不知道模糊性有多大。我知道nysiis与soundex非常相似,但是我不知道它们有多相似,或者nysiis与metaphone相比如何。
我也在寻找最快执行的解决方案。我知道这些语音映射器通常很快,但是我不确定哪一个最快,考虑到我希望能够在不增加搜索时间的情况下检查拼写,因此速度是一个考虑因素。有什么想法吗?
最佳答案
我在这里找到了一篇很棒的文章:
http://www.informit.com/articles/article.aspx?p=1848528
并不是我想要的所有东西,而是很大一部分。
关于machine-learning - 对讲机与Soundex与NYSIIS,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/11578533/