聯合隨機性策略的深度強化學習探索方法
所屬分類:技術論文
上傳者:zhoubin333
文檔大?。?span>679 K
標簽: 強化學習 深度強化學習 探索利用困境
所需積分:0分積分不夠怎么辦?
文檔介紹: 目前深度強化學習算法已經可以解決許多復雜的任務,然而如何平衡探索和利用的關系仍然是強化學習領域的一個基本的難題,為此提出一種聯合隨機性策略的深度強化學習探索方法。該方法利用隨機性策略具有探索能力的特點,用隨機性策略生成的經驗樣本訓練確定性策略,鼓勵確定性策略在保持自身優勢的前提下學會探索。通過結合確定性策略算法DDPG和提出的探索方法,得到基于隨機性策略指導的確定性策略梯度算法(SGDPG)。在多個復雜環境下的實驗表明,面對探索問題,SGDPG的探索效率和樣本利用率要優于DDPG算法。
現在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。
主站蜘蛛池模板: 国产91精品久久| 久久久亚洲精品视频| 免费播放在线日本感人片| 国产三级观看久久| 国内精品videofree720| 天堂网www在线资源中文| 小小的日本乱码在线观看免费| 故意短裙公车被强好爽在线播放| 日本精品一区二区三区在线视频一| 日韩欧美亚洲天堂| 成人年无码av片在线观看| 天天操天天舔天天干| 国产精品国色综合久久| 国产人伦视频在线观看| 免费国产a理论片| 亚洲va无码va在线va天堂| 中文字幕在线观看第二页| 99精品视频在线观看re| 欧美bbbbxxxx| 青青青久97在线观看香蕉| 99国产精品免费视频观看| 97se亚洲国产综合自在线| 韩国伦理电影我妻子的秘密| 男人插女人30分钟| 最近高清日本免费| 好男人视频社区精品免费| 国产激情精品一区二区三区| 再来一次好吗动漫免费观看| 亚洲一级免费毛片| ts人妖另类在线| 80s国产成年女人毛片| 老司机福利深夜亚洲入口| 欧美日韩一区二区视频图片| 成人欧美精品大91在线| 国产精品久久久久久久久电影网| 女人隐私秘视频黄www免费| 国产精品一区二区久久国产| 午夜精品久久久久久| 亚洲а∨天堂久久精品| littlesulaa小苏拉| 韩国一级在线观看|