自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

绵羊小墨的青青草原

为了饭碗子

  • 博客(2)
  • 收藏
  • 关注

原创 DQN学习第二天,从搭建框架开始

搭建DQN基本框架第一步 搭建主函数基本框架在主函数中设置全局变量,设置环境参数,设置学习方式设置学习所需要的参数(s,a,等等)开始主循环的设计:设置回合数 每回合都要重置环境设置步数 调用环境的渲染选择行为a = choose_action(s)通过行为获取下一状态信息s_,r,done=env.step(a)将状态信息记录到经验池中rl.store_t...

2019-08-05 17:19:40 831

原创 第一天学习DQN,从Qlearning基础开始

参数代表的意义state 当前位置状态 通常用s表示 在预测神经网络中作为输入state_ 下一个位置状态 通常用s_表示 在目标神经网络中作为输入action 动作 机器人所能选择的动作a 代表在s(当前状态下)所选择的动作r 代表reward奖励值q 代表Q(S,A),我在使用时分为q_eval预测的Q值和q_target现实的Q值epsilon 贪婪度 假设改值为0.9则代表...

2019-08-02 16:00:49 525

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除