有人可以向我解释一下,为什么关联规则学习被认为是一种监督学习方法?我理解的方式是该算法采用一堆连贯的数据集并基于这些集计算关联:
{a, b, c}
{a, b, d}
=> a -> b
=> b -> a
在我看来,只有任意数据集。没有特定的目标向量。为什么这被称为监督?
最佳答案
如果将 Association rule learning
视为 unsupervised
或 supervised learning task
,我想这是一个公开的讨论。虽然 Wikipedia 将其计入监督学习算法组,但 other resources 将其计入非监督学习算法类:
我想这归结为实际学习部分是如何实现的。可以创建一个 training data - label
对的数据集,例如在您的示例中:
{a, b, c}
{a, b, d}
=> a -> b
=> b -> a
拥有数百或数千对这样的对,可以训练神经网络以相当好的准确度理解数据集中的潜在模式,正如我所想的那样。这将是一个
Supervised Learning task
,神经网络从预先分类的例子中学习。另一方面,如果算法的实现方式是基于以下条件计算关联: Support - Confidence - Lift - Conviction 它将是
Unsupervised Learning task
。关于machine-learning - 为什么关联规则学习被认为是一种监督学习方法?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43570002/