我正在尝试解决一些分类问题。似乎许多经典方法都遵循类似的范例。也就是说,使用一些训练集训练模型,然后使用它来预测新实例的类标签。
我想知道是否可以在范式中引入一些反馈机制。在控制理论中,引入反馈回路是提高系统性能的有效方法。
目前,在我看来,一种直截了当的方法是,首先我们从一组初始实例开始,并使用它们来训练模型。然后,每次模型做出错误的预测时,我们都会将错误的实例添加到训练集中。这不同于盲目地扩大训练集,因为它更具针对性。这可以看作是控制理论语言中的某种负面反馈。
反馈方法是否正在进行任何研究?谁能给我一些启示?
最佳答案
我想到了两个研究领域。
第一个是Reinforcement Learning。这是一个在线学习范例,可让您在观察结果时获得反馈并更新策略(在本例中为分类器)。
第二个是active learning,分类器从未分类的示例池中选择示例以进行标记。关键是要让分类器选择标签示例,从而通过在当前分类器假设下选择困难的示例来最好地提高其准确性。
关于machine-learning - 在机器学习中使用反馈或强化?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/22854131/