我正在追踪How to build your own AlphaZero AI using Python and Keras
git是here
在run.ipynb中,这部分代码:
memory.clear_stmemory()
if len(memory.ltmemory) >= config.MEMORY_SIZE:
帖子对此没有太多解释。
memory.ltmemory
和memory.stmemory
用于什么? 最佳答案
如果您尚未意识到,ltmemory
代表长期记忆,而stmemory
代表短期记忆。我还没有看过github代码,但是我对AlphaZero和强化学习如何结合在一起(自己是一名国际象棋爱好者)有基本的了解。
基本上,使AlphaZero如此强大的原因是,它像人类一样使用长期和短期记忆。通过能够根据本地时间数据(即最近发生的事件)和更多全局数据(即整个游戏及其结果)做出决策,AlphaZero能够做出不仅在短期内受益的决策,但从长远来看也会使它受益。
这有意义还是根本可以回答您的问题?我快速键入了一些信息,并对所发生的事情进行了较高水平的描述。如果您要我详细介绍一部分,请留下问题评论。