谷歌表示,可以使用“术语向量算法”来确定流行的关键字。我研究过http://en.wikipedia.org/wiki/Vector_space_model,但不懂术语向量算法。
请用一个简短的总结,非常简单的语言来解释,就像读者是一个孩子一样。
我相信“向量”是指数学定义,一个既有方向又有大小的量。为什么关键字的数量会朝一个方向移动?
“每个维度对应一个单独的术语”,我认为维度与基数有关,对吗?
摘自亚历克斯·霍姆斯的《Hadoop in Practice》,第12页。

最佳答案

意思是每个词都构成一个独立的维度:
例子:(不知羞耻地从here
对于只包含三个单词的模型,您将得到:

dict = { dog, cat, lion }

Document 1
“cat cat” → (0,2,0)

Document 2
“cat cat cat” → (0,3,0)

Document 3
“lion cat” → (0,1,1)

Document 4
“cat lion” → (0,1,1)

关于algorithm - 什么是“项向量算法”?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/17846314/

10-11 15:21
查看更多