聯合隨機性策略的深度強化學習探索方法
所屬分類:技術論文
上傳者:zhoubin333
文檔大?。?span>679 K
標簽: 強化學習 深度強化學習 探索利用困境
所需積分:0分積分不夠怎么辦?
文檔介紹: 目前深度強化學習算法已經可以解決許多復雜的任務,然而如何平衡探索和利用的關系仍然是強化學習領域的一個基本的難題,為此提出一種聯合隨機性策略的深度強化學習探索方法。該方法利用隨機性策略具有探索能力的特點,用隨機性策略生成的經驗樣本訓練確定性策略,鼓勵確定性策略在保持自身優勢的前提下學會探索。通過結合確定性策略算法DDPG和提出的探索方法,得到基于隨機性策略指導的確定性策略梯度算法(SGDPG)。在多個復雜環境下的實驗表明,面對探索問題,SGDPG的探索效率和樣本利用率要優于DDPG算法。
現在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。
主站蜘蛛池模板: 国产成人精品999在线观看| 成人福利免费视频| 亚洲色国产欧美日韩| 青青草91在线| 国产美女在线播放| 两性色午夜视频免费网| 最新中文字幕电影免费观看| 亚洲色欲www综合网| 舌头伸进去里面吃小豆豆| 国产特黄1级毛片| 99RE久久精品国产| 性欧美video在线播放| 久久精品欧美一区二区| 欧美精品香蕉在线观看网| 十七岁免费观看高清| 香蕉大战欧美在线看黑人| 国产精品自线在线播放| yy6080理论影院旧里番| 无码无套少妇毛多69XXX| 亚洲一区二区影视| 污视频网站在线观看免费| 午夜三级限制福利电影在线看| 风间由美性色一区二区三区| 国产精品伦一区二区三级视频 | 一本久久综合亚洲鲁鲁五月天 | 四虎影视永久在线观看| 国产成人三级视频在线观看播放 | 精品久久久久久中文字幕大豆网| 国产亚洲精久久久久久无码77777| 亚洲网站www| 国产美女91视频| XXX2高清在线观看免费视频| 成人精品视频一区二区三区| 久久男人资源站| 欧美va天堂va视频va在线| 亚洲福利一区二区| 禁忌2电影在线观看完整版免费观看 | 在线电影一区二区| 一级特黄aaa大片| 无码人妻精品一区二| 久久夜色精品国产嚕嚕亚洲av|