《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計應(yīng)用 > 基于多智能體深度強(qiáng)化學(xué)習(xí)的無人機(jī)集群自主決策
基于多智能體深度強(qiáng)化學(xué)習(xí)的無人機(jī)集群自主決策
信息技術(shù)與網(wǎng)絡(luò)安全 5期
劉志飛,曹 雷,賴 俊,陳希亮
(陸軍工程大學(xué) 指揮控制工程學(xué)院,江蘇 南京210007)
摘要: 由于傳統(tǒng)的無人機(jī)由人工進(jìn)行操控,無人機(jī)群在強(qiáng)電磁干擾和復(fù)雜多變的戰(zhàn)場環(huán)境中表現(xiàn)較為呆板。在這項研究中,開發(fā)了一種靈活智能的無人機(jī)控制器。通過使用一個經(jīng)過多智能體深度強(qiáng)化學(xué)習(xí)技術(shù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò),無人機(jī)可以在飛行中控制自己的行為,從戰(zhàn)場環(huán)境中獲取狀態(tài)信息,自主決策,并且和其他無人機(jī)形成有效戰(zhàn)斗隊形,靈活協(xié)調(diào)和配合,并產(chǎn)生了最優(yōu)的動作。
中圖分類號: TP181
文獻(xiàn)標(biāo)識碼: A
DOI: 10.19358/j.issn.2096-5133.2022.05.012
引用格式: 劉志飛,曹雷,賴俊,等. 基于多智能體深度強(qiáng)化學(xué)習(xí)的無人機(jī)集群自主決策[J].信息技術(shù)與網(wǎng)絡(luò)安全,2022,41(5):77-81.
Utonomous decision making of UAV cluster with multi-agent deep reinforcement learning
Li Zhifei,Cao Lei,Lai Jun,Chen Xiliang
(College of Command and Control Engineering,Army Engineering University,Nanjing 210007,China)
Abstract: Because the traditional UAV is controlled manually, UAV cluster is more rigid in the strong electromagnetic interference and complex and changeable battlefield environment. In the study, a flexible and intelligent UAV controller is developed. With a neural network trained by multi-agent deep reinforcement learning technology,UAV can control his behavior in flight. At the same time,UAV obtains state information from the battlefield environment, makes independent decisions, forms an effective combat formation with other UAVs, flexibly coordinates and cooperates with each other, and produces the optimal action.
Key words : unmanned aerial vehicle;reinforcement learning;multi agent;autonomous decisio

0 引言

對人工操縱無人機(jī)來說,同時操控多架無人機(jī)完成多項任務(wù)且無人機(jī)之間形成有效配合是相當(dāng)困難的,注意力分散或者操控失誤都會造成較大的安全風(fēng)險。無人機(jī)的操控還受到電磁干擾和遠(yuǎn)程控制距離的限制,因此,無人機(jī)靈活自主決策能力顯得尤為重要。近年來,多智能體深度強(qiáng)化學(xué)習(xí)(Multi-Agent Deep Reinforcement Learning,MADRL)在復(fù)雜游戲中取得完勝人類專家水平的勝利,表明多智能體深度強(qiáng)化學(xué)習(xí)在解決復(fù)雜序貫問題上取得重要突破。強(qiáng)化學(xué)習(xí)技術(shù)應(yīng)用到無人機(jī)群可以提高無人機(jī)群的靈活智能性。本文以一個由6架無人機(jī)組成的無人機(jī)群為例,使用墨子AI仿真實(shí)驗(yàn)平臺,無人機(jī)群組成一個巨大的動作空間,時間步內(nèi)有200多個組合的動作空間,為每架無人機(jī)在每一步行為的機(jī)動方向、航線或向目標(biāo)發(fā)出攻擊都有提供了上千種選擇。使用深度神經(jīng)網(wǎng)絡(luò)來預(yù)測每個無人機(jī)在每個時間步的最優(yōu)動作,并根據(jù)每個無人機(jī)的局部觀察產(chǎn)生自主決策。MADRL方法生成無人機(jī)群作戰(zhàn)決策對無人機(jī)作戰(zhàn)研究具有重要的參考價值,是未來人工智能應(yīng)用在軍事領(lǐng)域的重要方向。




本文詳細(xì)內(nèi)容請下載:http://www.xxav2194.com/resource/share/2000004251





作者信息:

劉志飛,曹  雷,賴  俊,陳希亮

(陸軍工程大學(xué) 指揮控制工程學(xué)院,江蘇 南京210007)


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
主站蜘蛛池模板: 成人免费播放视频777777 | 麻豆91免费视频| 婷婷六月久久综合丁香可观看| 亚洲av无码专区电影在线观看| 香港特级三A毛片免费观看| 成人无码A级毛片免费| 免费a级毛片无码av| 非洲黑人最猛性xxxx_欧美| 日本三人交xxx69视频| 免费黄色a级片| 67pao强力打造高清免费| 成年人性生活视频| 亚洲av无码乱码在线观看| 狼友av永久网站免费观看| 国产亚洲3p无码一区二区| av无码精品一区二区三区四区 | 中文字幕日韩精品一区二区三区 | 一级毛片看一个| 日韩不卡在线视频| 出轨的女人2电影| 18美女腿打开无遮挡| 尤果圈3.2.6破解版| 久久天天躁狠狠躁夜夜| 精品人妻无码一区二区色欲产成人 | 亚洲六月丁香婷婷综合| 边吃奶边摸下面| 天天躁天天狠天天透| 久久久久亚洲AV成人网人人网站| 男人的肌肌捅女人的肌肌| 国产日韩精品欧美一区喷水| 伊人影院在线视频| 78成人精品电影在线播放 | 日韩理论电影在线观看| 啊灬用力啊灬啊灬快灬深| 国产精品乳摇在线播放| 国产综合久久久久鬼色| 久久久国产成人精品| 热久久国产精品| 同人本里番h本子全彩本子| 曰批全过程免费视频网址| 成人黄色电影在线观看 |