我一直在看一本书中的以下一行,描述了挖掘频繁项集的apriori算法,我似乎无法理解它。
注意,给定一个候选k-项集,我们只需要检查它的(k-1)-子集是否频繁,因为apriori算法使用了一个水平搜索策略。
在上面,候选意味着成为潜在的频繁k项集。
很明显,频繁k-项集的(k-1)-子集是频繁的,但即使所有的(k-1)-子集都是频繁的,我也看不到其他含义但也许我读错了?
最佳答案
“很明显,频繁k项集的(k-1)-子集是频繁的,但即使所有(k-1)-子集都是频繁的,我也看不到其他含义。”
你说得对,另一个暗示是不对的。(k-1)子集用于生成需要测试频率或支持度的k项集(正如最初的论文所称)您需要测试对(k-1)子集生成的k项集的支持。
原稿可读性很强,而且here。第4页第1栏有一个例子,使这里的想法非常清楚。
关于algorithm - 先验算法:具有频繁的(k-1)个子集意味着频繁吗?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/5059319/