講演抄録/キーワード |
講演名 |
2022-09-15 13:30
DA6-X:マルチエージェント深層強化学習における条件付き協調行動の解釈性確立 ○元川善就・菅原俊治(早大) AI2022-18 |
抄録 |
(和) |
本稿では,マルチエージェント深層強化学習における条件付き協調行動を自律的に学習するemph{textbf{d}istributed textbf{a}ttentional textbf{a}ctor textbf{a}rchitecture textbf{a}fter conditiontextbf{a}l textbf{a}ttention}(DA6-X)を提案する.本提案であるDA6-X内部のネットワークでemph{saliency vector}をattention mechanismにて再利用することで,環境の条件付き状態(エージェントやタスクの位置・種類などの事前情報)を柔軟に認識し,効率的な協調行動の創発と,その行動の説明性を向上できる.実験結果から,環境の条件付き状態はエージェントのより高い学習性能の達成・効率的な協調行動の獲得へと作用することを示す.また,DA6-Xが内包するattention weightsを解析することで,これまで不明瞭であった条件付き協調行動の解釈性を検証する. |
(英) |
|
キーワード |
(和) |
マルチエージェント深層強化学習 / 分散型自律学習 / 注意機構 / 協調行動解釈性 / / / / |
(英) |
/ / / / / / / |
文献情報 |
信学技報, vol. 122, no. 186, AI2022-18, pp. 1-6, 2022年9月. |
資料番号 |
AI2022-18 |
発行日 |
2022-09-08 (AI) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
AI2022-18 |