liyuanxiang213-CSDN博客

原创 DQN学习第二天，从搭建框架开始

搭建DQN基本框架第一步搭建主函数基本框架在主函数中设置全局变量，设置环境参数，设置学习方式设置学习所需要的参数（s，a，等等）开始主循环的设计：设置回合数每回合都要重置环境设置步数调用环境的渲染选择行为a = choose_action(s)通过行为获取下一状态信息s_,r,done=env.step(a)将状态信息记录到经验池中rl.store_t...

2019-08-05 17:19:40 831

原创第一天学习DQN，从Qlearning基础开始

参数代表的意义state 当前位置状态通常用s表示在预测神经网络中作为输入state_ 下一个位置状态通常用s_表示在目标神经网络中作为输入action 动作机器人所能选择的动作a 代表在s（当前状态下）所选择的动作r 代表reward奖励值q 代表Q（S，A），我在使用时分为q_eval预测的Q值和q_target现实的Q值epsilon 贪婪度假设改值为0.9则代表...

2019-08-02 16:00:49 525

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 DQN学习第二天，从搭建框架开始

原创 第一天学习DQN，从Qlearning基础开始

空空如也

空空如也

原创第一天学习DQN，从Qlearning基础开始