講演抄録/キーワード |
講演名 |
2023-03-17 16:25
Option-Critic強化学習におけるOptionの多様性向上に関する検討 ○中川亜耶・中野秀洋(東京都市大) MSS2022-109 NLP2022-154 |
抄録 |
(和) |
近年, 自動制御やゲーム AI などの様々な分野で強化学習が注目されている. 目的タスクを分割化することで探索性能を改善し, 大規模な環境での学習性能を向上させる階層型強化学習の手法の 1 つに Option-Critic (OC)がある. OC は分割化されたサブタスクに対応する Option を確率的に生成することで学習を行うが, Option の縮退問題により, 類似した Option が生成され Option の多様性が低下するという問題点がある. 本研究では方策オン型の更新式により, 従来手法で生成される Option とは異なる特徴の Option を生成し, 従来手法と組み合わせることでOption の多様性の向上を図る手法を提案する. |
(英) |
Recently, reinforcement learning has been attracting attention in various fields such as automatic control and game AI. One of the methods of hierarchical reinforcement learning is Option-Critic (OC), which improves search performance by partitioning the target task, thereby enhancing learning performance in large-scale environments. OC learns by probabilistically generating Options corresponding to segmented subtasks, but it has a problem that similar Options are generated due to the Option degeneracy problem, which reduces the diversity of Options. In this study, we propose a method to improve the diversity of Options by generating Options with different characteristics from those generated by conventional methods using on-policy updating formulas, and combining them with conventional methods. |
キーワード |
(和) |
強化学習 / 階層型強化学習 / Option-Critic / / / / / |
(英) |
Reinforcement Learning / Hierarchical Reinforcement Learning / Option-Critic / / / / / |
文献情報 |
信学技報, vol. 122, no. 436, NLP2022-154, pp. 225-230, 2023年3月. |
資料番号 |
NLP2022-154 |
発行日 |
2023-03-08 (MSS, NLP) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
MSS2022-109 NLP2022-154 |
研究会情報 |
研究会 |
NLP MSS |
開催期間 |
2023-03-15 - 2023-03-17 |
開催地(和) |
長崎大学 文教キャンパス |
開催地(英) |
|
テーマ(和) |
MSS,NLP,一般,およびWIP(MSSのみ) |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
NLP |
会議コード |
2023-03-NLP-MSS |
本文の言語 |
日本語 |
タイトル(和) |
Option-Critic強化学習におけるOptionの多様性向上に関する検討 |
サブタイトル(和) |
|
タイトル(英) |
Investigation on improving diversity of options in option-critic reinforcement learning |
サブタイトル(英) |
|
キーワード(1)(和/英) |
強化学習 / Reinforcement Learning |
キーワード(2)(和/英) |
階層型強化学習 / Hierarchical Reinforcement Learning |
キーワード(3)(和/英) |
Option-Critic / Option-Critic |
キーワード(4)(和/英) |
/ |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
中川 亜耶 / Aya Nakagawa / ナカガワ アヤ |
第1著者 所属(和/英) |
東京都市大学 (略称: 東京都市大)
Tokyo City University (略称: Tokyo City Univ.) |
第2著者 氏名(和/英/ヨミ) |
中野 秀洋 / Hidehiro Nakano / ナカノ ヒデヒロ |
第2著者 所属(和/英) |
東京都市大学 (略称: 東京都市大)
Tokyo City University (略称: Tokyo City Univ.) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2023-03-17 16:25:00 |
発表時間 |
20分 |
申込先研究会 |
NLP |
資料番号 |
MSS2022-109, NLP2022-154 |
巻番号(vol) |
vol.122 |
号番号(no) |
no.435(MSS), no.436(NLP) |
ページ範囲 |
pp.225-230 |
ページ数 |
6 |
発行日 |
2023-03-08 (MSS, NLP) |
|