目前 Lair Dice (1dice vs 1 dice)的游戏, 使用 FSICFR 训练了一个策略概率分布的 Information Set. 发现不知道怎么应用到游戏之中了, 我碰到的问题如下:
-
选择相应的游戏回合的 next move 中的最大概率, 每次选择最大概率的 next move (这些最大概率的 next move 都是有先觉条件的--predetermined chance outcome) 效果不是太好, 只能避免 stupid 的走法而已(例如自己有 1 个 2 的情况下不会抓对方叫 1 个 2)
-
如何实时更新这个 Information Set 里面的概率? 如第 1 点, 目前只是引用 next move 中的最大概率来使用这个训练好的 information Set.
本人是半路出家, 全靠自学, 理论基础较差, 希望各位高手, 有点耐心, 不吝赐教。
先谢谢了。
更多内容请访问:IT源点
注意:本文归作者所有,未经作者允许,不得转载