《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 交通場景下基于深度強化學習的感知型路徑分配算法
交通場景下基于深度強化學習的感知型路徑分配算法
信息技術與網絡安全 6期
曹 歡
(中國科學技術大學 信息科學技術學院,安徽 合肥230026)
摘要: 路徑分配問題是交通數字孿生系統的重要研究方向之一,其重點是綜合考量行駛需求的動態變化以及路網信息的實時改變,實現高效合理的路徑規劃。現階段一些經典的分配算法如粒子群、Dijkstra等算法及其優化模型僅能達到全局靜態最優,忽略了現實交通中的復雜變化。而逐漸推出的各種深度學習算法雖能進行全面的時空預測,但受限于海量歷史數據的歸納分析以及較高的運算成本,難以大規模應用。鑒于此,提出了一種靜態分配算法與深度強化學習算法結合的感知型路徑分配算法,在行駛中依據實時路網信息和車輛當前狀態,實現全局路徑動態再分配及更新,相關算法的精度和效率在仿真實驗中得到驗證。
中圖分類號: TP181
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2022.06.008
引用格式: 曹歡. 交通場景下基于深度強化學習的感知型路徑分配算法[J].信息技術與網絡安全,2022,41(6):43-49.
Perceptual path allocation algorithm based on deep reinforcement learning in traffic scene
Cao Huan
(School of Information Science and Technology,University of Science and Technology of China,Hefei 230026,China)
Abstract: Path allocation problem is one of the important research directions of traffic digital twin system. Its focus is to comprehensively consider the dynamic changes of driving demand and the real-time changes of road network information, so as to realize efficient and reasonable path planning. At present, some classical allocation algorithms such as particle swarm optimization, Dijkstra and their optimization models can only achieve global static optimization, ignoring the complex changes in real traffic. Although various depth learning algorithms gradually introduced can carry out comprehensive spatio-temporal prediction, they are difficult to be applied on a large scale due to the inductive analysis of massive historical data and high operation cost. In view of this, this paper proposes a perceptual path allocation algorithm based on the combination of static allocation algorithm and deep reinforcement learning algorithm. During driving, the global path is dynamically redistributed and updated according to the real-time road network information and the current state of vehicles. The accuracy and efficiency of the proposed algorithm are verified in the simulation experiment.
Key words : path allocation;deep reinforcement learning;road network;traffic perception

0 引言

目前我國交通環境日益復雜,現有交通體系的服務能力難以滿足城市居民的出行期望,城市面臨日益嚴峻的交通管理挑戰。研究者們希望借助交通數字孿生技術,通過數據驅動、精準建模,實現交通的模擬、預測診斷和優化[1]。然而在交通仿真模擬層次,現有的路徑分配模塊不能反映出現實交通的多變狀況。在人-車-路的核心體系中,天氣氣候、交通管制、突發事故等影響因子將時刻影響駕駛員的判斷以及路網的狀態[2]。

在當前的交通數字孿生系統中,現有的路徑分配方法主要分為兩類,第一類為用于實現靜態全局路徑最優的傳統算法,如經典的蟻群算法、Floyd算法、A-Star、粒子群算法、Dijkstra及其改進算法等,本質為基于圖論中重要的最短路徑問題所提出的各種方案,也即在一個加權有向圖中,按一定要求尋找一條權重總和最短的路徑[3]。如Xu[4]等基于二叉樹結構,通過雙向搜索方法加快搜索效率,作為A-Star改進算法;Lee[5]等基于遺傳算法實現蟻群算法中的參數調節優化。在路網信息發生變化時,該類算法難以做出及時反饋。如果需要滿足動態路徑規劃的需求,則需要施加額外的更新優化和重規劃機制。第二類指的是通過機器學習、時空神經網絡、強化學習等技術來實現路徑分配。這一類更加強調數據的搜集、分析和處理,通過提取海量歷史數據的價值信息,為解決路徑規劃問題提供了一個新的思路[6]。

本文的中心工作是研究了一種基于傳統路徑算法與深度強化學習的感知型路徑分配算法,首先通過改進版Dijkstra算法為所有車輛分配初始路徑,路網中的車輛在不斷感知當前位置、行駛軌跡以及目標路網中各路段的車流等信息后,通過DDQN(Double DQN)將自動選擇是否重新進行全局的路徑規劃,實現路徑更新。與現有的經典路徑規劃方法相比,本文提出的規劃方案填補了傳統模型在路況變化下的泛化性、拓展性不足,優化了深度學習型方法的資源損耗,同時基于強化學習模型在長期收益方面的優越性,本文模型更加滿足路徑分配模型對當今城市路網交通出行的各種需求。




本文詳細內容請下載http://www.xxav2194.com/resource/share/2000004534





作者信息:

曹  歡

(中國科學技術大學 信息科學技術學院,安徽 合肥230026)




微信圖片_20210517164139.jpg

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 欧美一级片在线| 国产一级毛片高清视频完整版| 国产AV寂寞骚妇| 丁香花高清在线观看完整版 | 欧美日韩精品一区二区三区高清视频| 国产精品国产三级国产专不∫| 久操视频在线免费观看| 美美哒韩国免费高清在线观看 | 无码中文字幕av免费放| 伊人色综合97| 美女被免费网站91色| 日本网站在线看| 免费高清小黄站在线观看| 99re视频精品全部免费| 杨晨晨被老师掀裙子露内内| 国产AV无码专区亚洲AV| 男女真实无遮挡xx00动态图120秒| 好多水好硬好紧好爽视频| 亚洲成aⅴ人片| 韩国二级毛片免费播放| 少妇高潮惨叫喷水在线观看| 亚洲欧洲日产国码一级毛片| 香蕉精品一本大道在线观看| 小明发布永久在线成人免费| 久久成人综合网| 男人用嘴添女人下身免费视频| 国产精品国产三级国产专不∫| а√天堂资源8在线官网在线| 欧美一级欧美一级高清| 伊人久久大香线| 黄色a级片免费看| 女人16一毛片| 亚洲av永久无码精品秋霞电影影院| 色www视频永久免费男的天堂| 国外免费直播性xxxx18| 久久人人爽人人爽人人片dvd| 男人女人做30分爽爽视频| 国产一区二区三区在线观看影院| 99re最新视频| 日本人成动漫网站在线观看| 免费国产不卡午夜福在线|