强化学习吧 关注:345贴子:674
  • 1回复贴,共1

强化学习在随机结束之后就一直只选择一个动作值了是为什么?

只看楼主收藏回复

强化学习在随机结束之后就一直只选择一个动作值了是为什么?是因为根本就没学起来还是因为环境太简单了?并且在更改神经网络初始化的随机种子之后也会对选择的动作产生影响是为什么


IP属地:江苏1楼2024-04-16 14:44回复
    奖励可能太单一了


    IP属地:广东来自Android客户端2楼2024-08-08 16:08
    回复