我阅读了一些教程和介绍,但不确定是否能掌握它,而且最重要的是,我不确定我是否完全理解ML与NN。

假设我要对程序进行指令(例如使用scikit-learn),以使其具有一些语言词典作为其输入集。例如,我有一个大型的意大利语单词字典,可以将其输入为数组数组(数组的每个项目都是一个单词,每个单词都是ascii值的数组,每个字符对应一个世界):

[
    [112, 105, 122, 122, 97], // pizza
    [109, 097, 109, 109, 97], // mamma
    ...
]


是可能的/最好的库是什么/怎么做:


给定一个单词,让程序推断是否可能是意大利语单词,以便“黑手党”被认为是潜在的实际意大利语单词,而“Eichhörnchen”则不是(它比一般的意大利世界更长,它包含诸如“在初始集合中找不到的“ rnch”,其中包含“ö”,这是意大利语中未使用的字符)
根据初始集合生成其他(可能)意大利语单词。例如,“ potomo”不是实际的意大利语单词,但是根据意大利语拼写法,它可能是

最佳答案

我认为可以使用朴素贝叶斯分类和KNN。事实证明,朴素贝叶斯分类可以过滤垃圾邮件,但在此之前您需要一个词库。

关于python - Python中的机器学习:scikit-learn/Pybrain,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/35801405/

10-12 22:18