- 博客(2)
- 收藏
- 关注
原创 DQN学习第二天,从搭建框架开始
搭建DQN基本框架第一步 搭建主函数基本框架在主函数中设置全局变量,设置环境参数,设置学习方式设置学习所需要的参数(s,a,等等)开始主循环的设计:设置回合数 每回合都要重置环境设置步数 调用环境的渲染选择行为a = choose_action(s)通过行为获取下一状态信息s_,r,done=env.step(a)将状态信息记录到经验池中rl.store_t...
2019-08-05 17:19:40
831
原创 第一天学习DQN,从Qlearning基础开始
参数代表的意义state 当前位置状态 通常用s表示 在预测神经网络中作为输入state_ 下一个位置状态 通常用s_表示 在目标神经网络中作为输入action 动作 机器人所能选择的动作a 代表在s(当前状态下)所选择的动作r 代表reward奖励值q 代表Q(S,A),我在使用时分为q_eval预测的Q值和q_target现实的Q值epsilon 贪婪度 假设改值为0.9则代表...
2019-08-02 16:00:49
525
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人