《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計應(yīng)用 > 基于多智能體深度強化學(xué)習(xí)的無人機集群自主決策
基于多智能體深度強化學(xué)習(xí)的無人機集群自主決策
信息技術(shù)與網(wǎng)絡(luò)安全 5期
劉志飛,曹 雷,賴 俊,陳希亮
(陸軍工程大學(xué) 指揮控制工程學(xué)院,江蘇 南京210007)
摘要: 由于傳統(tǒng)的無人機由人工進行操控,無人機群在強電磁干擾和復(fù)雜多變的戰(zhàn)場環(huán)境中表現(xiàn)較為呆板。在這項研究中,開發(fā)了一種靈活智能的無人機控制器。通過使用一個經(jīng)過多智能體深度強化學(xué)習(xí)技術(shù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò),無人機可以在飛行中控制自己的行為,從戰(zhàn)場環(huán)境中獲取狀態(tài)信息,自主決策,并且和其他無人機形成有效戰(zhàn)斗隊形,靈活協(xié)調(diào)和配合,并產(chǎn)生了最優(yōu)的動作。
中圖分類號: TP181
文獻標(biāo)識碼: A
DOI: 10.19358/j.issn.2096-5133.2022.05.012
引用格式: 劉志飛,曹雷,賴俊,等. 基于多智能體深度強化學(xué)習(xí)的無人機集群自主決策[J].信息技術(shù)與網(wǎng)絡(luò)安全,2022,41(5):77-81.
Utonomous decision making of UAV cluster with multi-agent deep reinforcement learning
Li Zhifei,Cao Lei,Lai Jun,Chen Xiliang
(College of Command and Control Engineering,Army Engineering University,Nanjing 210007,China)
Abstract: Because the traditional UAV is controlled manually, UAV cluster is more rigid in the strong electromagnetic interference and complex and changeable battlefield environment. In the study, a flexible and intelligent UAV controller is developed. With a neural network trained by multi-agent deep reinforcement learning technology,UAV can control his behavior in flight. At the same time,UAV obtains state information from the battlefield environment, makes independent decisions, forms an effective combat formation with other UAVs, flexibly coordinates and cooperates with each other, and produces the optimal action.
Key words : unmanned aerial vehicle;reinforcement learning;multi agent;autonomous decisio

0 引言

對人工操縱無人機來說,同時操控多架無人機完成多項任務(wù)且無人機之間形成有效配合是相當(dāng)困難的,注意力分散或者操控失誤都會造成較大的安全風(fēng)險。無人機的操控還受到電磁干擾和遠程控制距離的限制,因此,無人機靈活自主決策能力顯得尤為重要。近年來,多智能體深度強化學(xué)習(xí)(Multi-Agent Deep Reinforcement Learning,MADRL)在復(fù)雜游戲中取得完勝人類專家水平的勝利,表明多智能體深度強化學(xué)習(xí)在解決復(fù)雜序貫問題上取得重要突破。強化學(xué)習(xí)技術(shù)應(yīng)用到無人機群可以提高無人機群的靈活智能性。本文以一個由6架無人機組成的無人機群為例,使用墨子AI仿真實驗平臺,無人機群組成一個巨大的動作空間,時間步內(nèi)有200多個組合的動作空間,為每架無人機在每一步行為的機動方向、航線或向目標(biāo)發(fā)出攻擊都有提供了上千種選擇。使用深度神經(jīng)網(wǎng)絡(luò)來預(yù)測每個無人機在每個時間步的最優(yōu)動作,并根據(jù)每個無人機的局部觀察產(chǎn)生自主決策。MADRL方法生成無人機群作戰(zhàn)決策對無人機作戰(zhàn)研究具有重要的參考價值,是未來人工智能應(yīng)用在軍事領(lǐng)域的重要方向。




本文詳細內(nèi)容請下載:http://www.xxav2194.com/resource/share/2000004251





作者信息:

劉志飛,曹  雷,賴  俊,陳希亮

(陸軍工程大學(xué) 指揮控制工程學(xué)院,江蘇 南京210007)


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
主站蜘蛛池模板: 自拍偷自拍亚洲精品播放| 99久久国产亚洲综合精品| 欧美一级免费在线观看| 北条麻妃大战黑人| 日本3p视频在线看高清| 天堂网在线最新版www| 久久99精品国产麻豆宅宅| 欧美国产在线看| 免费看的黄网站| 调教羞耻超短裙任务| 国产精品亚洲一区二区三区在线| xxxxwww日本在线| 日日碰狠狠添天天爽超碰97| 亚洲午夜久久久久久尤物| 男男动漫全程肉无删减彩漫| 国产乱人视频在线播放不卡| 1000部拍拍拍18免费网站| 在线观看黄网站| 一级艳片加勒比女海盗1| 日本电影痴汉电车| 亚洲婷婷综合色高清在线| 男操女视频免费| 国产123在线观看| 黄色片子在线观看| 国产精品女同久久久久电影院| baoyu122.永久免费视频| 成年大片免费视频| 久久精品久噜噜噜久久| 欧美成人国产精品高潮| 人人干在线视频| 精品国产粉嫩内射白浆内射双马尾| 国产在线观看网站萌白酱视频| 18禁无遮挡羞羞污污污污免费| 天堂а√在线地址| 丁香六月激情综合| 日本三级视频网站| 久青草中文字幕精品视频| 欧美日本在线观看| 亚洲精品国产高清嫩草影院| 福利片一区二区| 啦啦啦中文在线观看日本|