我正在追踪How to build your own AlphaZero AI using Python and Keras

git是here
在run.ipynb中,这部分代码:

memory.clear_stmemory()

if len(memory.ltmemory) >= config.MEMORY_SIZE:


帖子对此没有太多解释。
memory.ltmemorymemory.stmemory用于什么?

最佳答案

如果您尚未意识到,ltmemory代表长期记忆,而stmemory代表短期记忆。我还没有看过github代码,但是我对AlphaZero和强化学习如何结合在一起(自己是一名国际象棋爱好者)有基本的了解。

基本上,使AlphaZero如此强大的原因是,它像人类一样使用长期和短期记忆。通过能够根据本地时间数据(即最近发生的事件)和更多全局数据(即整个游戏及其结果)做出决策,AlphaZero能够做出不仅在短期内受益的决策,但从长远来看也会使它受益。

这有意义还是根本可以回答您的问题?我快速键入了一些信息,并对所发生的事情进行了较高水平的描述。如果您要我详细介绍一部分,请留下问题评论。

10-06 06:30