我想从 sklearn 的 Tfidfvectorizer 对象中获取矩阵。这是我的代码:

from sklearn.feature_extraction.text import TfidfVectorizer
text = ["The quick brown fox jumped over the lazy dog.",
        "The dog.",
        "The fox"]

vectorizer = TfidfVectorizer()
vectorizer.fit_transform(text)

这是我尝试并返回错误的内容:
vectorizer.toarray()



另一种尝试
vectorizer.todense()

最佳答案

请注意, vectorizer.fit_transform 返回您想要获得的术语文档矩阵。所以保存它返回的内容,并使用 todense ,因为它将采用稀疏格式:


a = vectorizer.fit_transform(text)
a.todense()

matrix([[0.36388646, 0.27674503, 0.27674503, 0.36388646, 0.36388646,
         0.36388646, 0.36388646, 0.42983441],
        [0.        , 0.78980693, 0.        , 0.        , 0.        ,
         0.        , 0.        , 0.61335554],
        [0.        , 0.        , 0.78980693, 0.        , 0.        ,
         0.        , 0.        , 0.61335554]])

关于python - 来自 sklearn 的 Tfidfvectorizer - 如何获得矩阵,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/54098026/

10-12 18:23