对于ai级项目,我需要实现一种强化学习算法,该算法胜过简单的俄罗斯方块游戏。游戏是用Java编写的,我们有源代码。我知道强化学习理论的基础知识,但我想知道SO社区中是否有人有这种经验。
编辑:越具体越好,但是欢迎您提供有关该主题的一般资源。
跟进:
我以为如果发表后续报告会很好。
这是我为将来的任何学生准备的解决方案(代码和写作):)。
Paper / Code
最佳答案
看看2009年RL-competition。问题域之一是tetris game。前一年也有俄罗斯方块问题。这是当年第五名入围者的52-page final report,其中详细介绍了代理商的工作方式。
关于language-agnostic - 强化学习的良好实现?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/740389/