講演抄録/キーワード |
講演名 |
2022-03-10 16:25
連合強化学習における蒸留手法の検討 ○劉 世芾・高前田伸也(東大) CPSY2021-52 DC2021-86 |
抄録 |
(和) |
強化学習は環境との相互作用の中で高い報酬を獲得するための方策を学習する枠組みである. エージェントが環境について知れば知るほど学習は有利である.そのため,複数のエージェントを用いた探索がしばしば行われる.しかし,エッジデバイスで集めた情報は必ずしもサーバーや他のデバイスに公開できるとは限らない.学習データのプライバシーを守りながら共同で学習する枠組みは連合学習と呼ばれ,特に教師あり学習の分野では盛んに研究されている.
本研究では教師あり学習において通信効率などの面で優れていることが確認された,知識蒸留を用いた手法を強化学習に応用する.我々は環境モデルを用いた連合強化学習の蒸留手法を提案し,この手法が通信コストを3桁削減できることを実験によって示した.ところが,同時にこの手法はエピソードの利用効率がベースライン手法に比べて良くないことも分かった.そこでパラメータ変化量を観察することでその原因を分析し改善を試みた. |
(英) |
|
キーワード |
(和) |
連合学習 / 強化学習 / DQN / 知識蒸留 / 通信効率 / / / |
(英) |
/ / / / / / / |
文献情報 |
信学技報, vol. 121, no. 425, CPSY2021-52, pp. 44-49, 2022年3月. |
資料番号 |
CPSY2021-52 |
発行日 |
2022-03-03 (CPSY, DC) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
CPSY2021-52 DC2021-86 |
研究会情報 |
研究会 |
CPSY DC IPSJ-SLDM IPSJ-EMB IPSJ-ARC |
開催期間 |
2022-03-10 - 2022-03-11 |
開催地(和) |
オンライン開催 |
開催地(英) |
Online |
テーマ(和) |
組込み技術とネットワークに関するワークショップ ETNET2022 |
テーマ(英) |
ETNET2021 |
講演論文情報の詳細 |
申込み研究会 |
CPSY |
会議コード |
2022-03-CPSY-DC-SLDM-EMB-ARC |
本文の言語 |
日本語(英語タイトルなし) |
タイトル(和) |
連合強化学習における蒸留手法の検討 |
サブタイトル(和) |
|
タイトル(英) |
|
サブタイトル(英) |
|
キーワード(1)(和/英) |
連合学習 / |
キーワード(2)(和/英) |
強化学習 / |
キーワード(3)(和/英) |
DQN / |
キーワード(4)(和/英) |
知識蒸留 / |
キーワード(5)(和/英) |
通信効率 / |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
劉 世芾 / / リュウ セフツ |
第1著者 所属(和/英) |
東京大学 (略称: 東大)
(略称: ) |
第2著者 氏名(和/英/ヨミ) |
高前田 伸也 / / タカマエダ シンヤ |
第2著者 所属(和/英) |
東京大学 (略称: 東大)
(略称: ) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2022-03-10 16:25:00 |
発表時間 |
20分 |
申込先研究会 |
CPSY |
資料番号 |
CPSY2021-52, DC2021-86 |
巻番号(vol) |
vol.121 |
号番号(no) |
no.425(CPSY), no.426(DC) |
ページ範囲 |
pp.44-49 |
ページ数 |
6 |
発行日 |
2022-03-03 (CPSY, DC) |
|