時相論理仕様を満足するマルチエージェント監視システムの強化学習における報酬分配について

寺嶋,啓太; 小林,孝一; 山下,裕

ご案内入会して研究会活動をもっとお得に！研究会参加費・年間登録費が会員価格になります。
お知らせ【重要】研究会参加費の支払いおよび原稿アップロード手続きの変更に関するご案内

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2023-03-14 13:00 時相論理仕様を満足するマルチエージェント監視システムの強化学習における報酬分配について ○寺嶋啓太・小林孝一・山下　裕（北大） IT2022-81 ISEC2022-60 WBS2022-78 RCC2022-78
抄録	（和）	マルチエージェントシステムでは，効率的な学習のために，エージェントの貢献度に応じた報酬分配方法の設計が重要である．本論文では、以前に著者らが提案した，アグリゲータを用いたマルチエージェント強化学習法を基に，監視システムを対象とした報酬の分配方法について提案する．ここで，各エージェントに与えられる制御仕様は線形時相論理式で記述される．この方法では，監視システム上のパスの長さに応じて，アグリゲータが報酬を計算して分配する．最後に，監視問題を例として，計算機実験により性能を示す．
	（英）	In multi-agent systems, it is important to design a reward distribution method based on the contribution of agents for efficient learning. In this paper, we propose a reward distribution method for a surveillance system based on a multi-agent reinforcement learning method using aggregators, where the control specification is described by a linear time-phase logic formula, which was previously proposed by the authors. In this method, the aggregator computes and distributes rewards according to the length of paths on the surveillance system. Finally, the performance is shown by numerical simulation with a surveillance problem as an example.
キーワード	（和）	マルチエージェントシステム / 強化学習 / 線形時相論理 / アグリゲータ / 報酬分配問題 / 監視問題 / /
	（英）	multi-agent systems / reinforcement learning / linear temporal logic / aggregator / reward distribution problem / surveillance / /
文献情報		信学技報, vol. 122, no. 430, RCC2022-78, pp. 86-90, 2023年3月.
資料番号		RCC2022-78
発行日		2023-03-07 (IT, ISEC, WBS, RCC)
ISSN		Online edition: ISSN 2432-6380
著作権について		技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します．(許諾番号：10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード		IT2022-81 ISEC2022-60 WBS2022-78 RCC2022-78

研究会情報
研究会	RCC ISEC IT WBS
開催期間	2023-03-14 - 2023-03-15
開催地（和）	山口大学常盤キャンパス
開催地（英）
テーマ（和）	RCC・ISEC・IT・WBS合同研究会
テーマ（英）
講演論文情報の詳細
申込み研究会	RCC
会議コード	2023-03-RCC-ISEC-IT-WBS
本文の言語	日本語
タイトル（和）	時相論理仕様を満足するマルチエージェント監視システムの強化学習における報酬分配について
サブタイトル（和）
タイトル（英）	On Reward Distribution in Reinforcement Learning of Multi-Agent Surveillance Systems with Temporal Logic Specifications
サブタイトル（英）
キーワード(1)（和/英）	マルチエージェントシステム / multi-agent systems
キーワード(2)（和/英）	強化学習 / reinforcement learning
キーワード(3)（和/英）	線形時相論理 / linear temporal logic
キーワード(4)（和/英）	アグリゲータ / aggregator
キーワード(5)（和/英）	報酬分配問題 / reward distribution problem
キーワード(6)（和/英）	監視問題 / surveillance
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	寺嶋啓太 / Keita Terashima / テラシマケイタ
第1著者所属（和/英）	北海道大学 (略称：北大) Hokkaido University (略称： Hokkaido Univ.)
第2著者氏名（和/英/ヨミ）	小林孝一 / Koichi Kobayashi / コバヤシコウイチ
第2著者所属（和/英）	北海道大学 (略称：北大) Hokkaido University (略称： Hokkaido Univ.)
第3著者氏名（和/英/ヨミ）	山下裕 / Yuh Yamashita / ヤマシタユウ
第3著者所属（和/英）	北海道大学 (略称：北大) Hokkaido University (略称： Hokkaido Univ.)
第4著者氏名（和/英/ヨミ）	/ /
第4著者所属（和/英）	(略称： ) (略称： )
第5著者氏名（和/英/ヨミ）	/ /
第5著者所属（和/英）	(略称： ) (略称： )
第6著者氏名（和/英/ヨミ）	/ /
第6著者所属（和/英）	(略称： ) (略称： )
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
第21著者氏名（和/英/ヨミ）	/ /
第21著者所属（和/英）	(略称： ) (略称： )
第22著者氏名（和/英/ヨミ）	/ /
第22著者所属（和/英）	(略称： ) (略称： )
第23著者氏名（和/英/ヨミ）	/ /
第23著者所属（和/英）	(略称： ) (略称： )
第24著者氏名（和/英/ヨミ）	/ /
第24著者所属（和/英）	(略称： ) (略称： )
第25著者氏名（和/英/ヨミ）	/ /
第25著者所属（和/英）	(略称： ) (略称： )
第26著者氏名（和/英/ヨミ）	/ /
第26著者所属（和/英）	(略称： ) (略称： )
第27著者氏名（和/英/ヨミ）	/ /
第27著者所属（和/英）	(略称： ) (略称： )
第28著者氏名（和/英/ヨミ）	/ /
第28著者所属（和/英）	(略称： ) (略称： )
第29著者氏名（和/英/ヨミ）	/ /
第29著者所属（和/英）	(略称： ) (略称： )
第30著者氏名（和/英/ヨミ）	/ /
第30著者所属（和/英）	(略称： ) (略称： )
第31著者氏名（和/英/ヨミ）	/ /
第31著者所属（和/英）	(略称： ) (略称： )
第32著者氏名（和/英/ヨミ）	/ /
第32著者所属（和/英）	(略称： ) (略称： )
第33著者氏名（和/英/ヨミ）	/ /
第33著者所属（和/英）	(略称： ) (略称： )
第34著者氏名（和/英/ヨミ）	/ /
第34著者所属（和/英）	(略称： ) (略称： )
第35著者氏名（和/英/ヨミ）	/ /
第35著者所属（和/英）	(略称： ) (略称： )
第36著者氏名（和/英/ヨミ）	/ /
第36著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2023-03-14 13:00:00
発表時間	25分
申込先研究会	RCC
資料番号	IT2022-81, ISEC2022-60, WBS2022-78, RCC2022-78
巻番号（vol）	vol.122
号番号（no）	no.427(IT), no.428(ISEC), no.429(WBS), no.430(RCC)
ページ範囲	pp.86-90
ページ数	5
発行日	2023-03-07 (IT, ISEC, WBS, RCC)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会