我有个问题,
在机器学习中,我们为培训经历的类型定义了两种类型:
直接和间接。
我搜索了很多有关差异的内容,但找不到。有谁熟悉这些吗?
先感谢您
最佳答案
汤姆·米切尔(Tom Mitchell)在他的《 "Machine Learning" (1st ed.)》一书中对此进行了如下解释(请参阅第5.2.1节,第5页):
例如,在学习演奏checkers时,系统可能会从直接的训练示例中学习,这些示例包括单独的棋盘状态和每种状态的正确动作。可替代地,它可能仅具有间接信息,该间接信息包括移动顺序和玩过的各种游戏的最终结果。在后一种情况下,必须从游戏最终获胜或失败的事实间接推断出游戏初期特定动作的正确性信息。
他进一步指出:
在这里[使用间接反馈],学习者面临一个额外的学分分配问题,或者确定序列中的每个动作在多大程度上应归功于或归咎于最终结果。信用分配可能是一个特别困难的问题,因为即使早先的操作达到最佳状态,游戏也可能会输掉比赛,但如果随后又进行了不正确的操作,那么游戏就会失败。因此,从直接训练反馈中学习通常比从间接反馈中学习容易。
关于machine-learning - 直接或间接针对培训经验的类型,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/25815299/