ngram_range在诸如countvectorizer和TFidf矢量化器等矢量化器中的用途是什么。我的意思是ngram_range(1,1)用于unigram。这对ngram_range(1,2)和(2,2)意味着什么???

最佳答案

ngram_range(1,2)表示字母和二元组,(2,2)表示仅二元组。
您是否认为docstring不够精确:

要提取的不同n-gram的n值范围的上下边界。将使用所有min_n
您将如何更改文档字符串以更有用?

关于scikit-learn - scikit学习矢量化器中的ngram_range目的,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/20300479/

10-13 08:37