Option-Critic強化学習におけるOptionの多様性向上に関する検討

中川,亜耶; 中野,秀洋

ご案内入会して研究会活動をもっとお得に！研究会参加費・年間登録費が会員価格になります。
お知らせ【重要】研究会参加費の支払いおよび原稿アップロード手続きの変更に関するご案内

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2023-03-17 16:25 Option-Critic強化学習におけるOptionの多様性向上に関する検討 ○中川亜耶・中野秀洋（東京都市大） MSS2022-109 NLP2022-154
抄録	（和）	近年, 自動制御やゲーム AI などの様々な分野で強化学習が注目されている. 目的タスクを分割化することで探索性能を改善し, 大規模な環境での学習性能を向上させる階層型強化学習の手法の 1 つに Option-Critic (OC)がある. OC は分割化されたサブタスクに対応する Option を確率的に生成することで学習を行うが, Option の縮退問題により, 類似した Option が生成され Option の多様性が低下するという問題点がある. 本研究では方策オン型の更新式により, 従来手法で生成される Option とは異なる特徴の Option を生成し, 従来手法と組み合わせることでOption の多様性の向上を図る手法を提案する.
	（英）	Recently, reinforcement learning has been attracting attention in various fields such as automatic control and game AI. One of the methods of hierarchical reinforcement learning is Option-Critic (OC), which improves search performance by partitioning the target task, thereby enhancing learning performance in large-scale environments. OC learns by probabilistically generating Options corresponding to segmented subtasks, but it has a problem that similar Options are generated due to the Option degeneracy problem, which reduces the diversity of Options. In this study, we propose a method to improve the diversity of Options by generating Options with different characteristics from those generated by conventional methods using on-policy updating formulas, and combining them with conventional methods.
キーワード	（和）	強化学習 / 階層型強化学習 / Option-Critic / / / / /
	（英）	Reinforcement Learning / Hierarchical Reinforcement Learning / Option-Critic / / / / /
文献情報		信学技報, vol. 122, no. 436, NLP2022-154, pp. 225-230, 2023年3月.
資料番号		NLP2022-154
発行日		2023-03-08 (MSS, NLP)
ISSN		Online edition: ISSN 2432-6380
著作権について		技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します．(許諾番号：10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード		MSS2022-109 NLP2022-154

研究会情報
研究会	NLP MSS
開催期間	2023-03-15 - 2023-03-17
開催地（和）	長崎大学文教キャンパス
開催地（英）
テーマ（和）	MSS，NLP，一般，およびWIP（MSSのみ）
テーマ（英）
講演論文情報の詳細
申込み研究会	NLP
会議コード	2023-03-NLP-MSS
本文の言語	日本語
タイトル（和）	Option-Critic強化学習におけるOptionの多様性向上に関する検討
サブタイトル（和）
タイトル（英）	Investigation on improving diversity of options in option-critic reinforcement learning
サブタイトル（英）
キーワード(1)（和/英）	強化学習 / Reinforcement Learning
キーワード(2)（和/英）	階層型強化学習 / Hierarchical Reinforcement Learning
キーワード(3)（和/英）	Option-Critic / Option-Critic
キーワード(4)（和/英）	/
キーワード(5)（和/英）	/
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	中川亜耶 / Aya Nakagawa / ナカガワアヤ
第1著者所属（和/英）	東京都市大学 (略称：東京都市大) Tokyo City University (略称： Tokyo City Univ.)
第2著者氏名（和/英/ヨミ）	中野秀洋 / Hidehiro Nakano / ナカノヒデヒロ
第2著者所属（和/英）	東京都市大学 (略称：東京都市大) Tokyo City University (略称： Tokyo City Univ.)
第3著者氏名（和/英/ヨミ）	/ /
第3著者所属（和/英）	(略称： ) (略称： )
第4著者氏名（和/英/ヨミ）	/ /
第4著者所属（和/英）	(略称： ) (略称： )
第5著者氏名（和/英/ヨミ）	/ /
第5著者所属（和/英）	(略称： ) (略称： )
第6著者氏名（和/英/ヨミ）	/ /
第6著者所属（和/英）	(略称： ) (略称： )
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
第21著者氏名（和/英/ヨミ）	/ /
第21著者所属（和/英）	(略称： ) (略称： )
第22著者氏名（和/英/ヨミ）	/ /
第22著者所属（和/英）	(略称： ) (略称： )
第23著者氏名（和/英/ヨミ）	/ /
第23著者所属（和/英）	(略称： ) (略称： )
第24著者氏名（和/英/ヨミ）	/ /
第24著者所属（和/英）	(略称： ) (略称： )
第25著者氏名（和/英/ヨミ）	/ /
第25著者所属（和/英）	(略称： ) (略称： )
第26著者氏名（和/英/ヨミ）	/ /
第26著者所属（和/英）	(略称： ) (略称： )
第27著者氏名（和/英/ヨミ）	/ /
第27著者所属（和/英）	(略称： ) (略称： )
第28著者氏名（和/英/ヨミ）	/ /
第28著者所属（和/英）	(略称： ) (略称： )
第29著者氏名（和/英/ヨミ）	/ /
第29著者所属（和/英）	(略称： ) (略称： )
第30著者氏名（和/英/ヨミ）	/ /
第30著者所属（和/英）	(略称： ) (略称： )
第31著者氏名（和/英/ヨミ）	/ /
第31著者所属（和/英）	(略称： ) (略称： )
第32著者氏名（和/英/ヨミ）	/ /
第32著者所属（和/英）	(略称： ) (略称： )
第33著者氏名（和/英/ヨミ）	/ /
第33著者所属（和/英）	(略称： ) (略称： )
第34著者氏名（和/英/ヨミ）	/ /
第34著者所属（和/英）	(略称： ) (略称： )
第35著者氏名（和/英/ヨミ）	/ /
第35著者所属（和/英）	(略称： ) (略称： )
第36著者氏名（和/英/ヨミ）	/ /
第36著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2023-03-17 16:25:00
発表時間	20分
申込先研究会	NLP
資料番号	MSS2022-109, NLP2022-154
巻番号（vol）	vol.122
号番号（no）	no.435(MSS), no.436(NLP)
ページ範囲	pp.225-230
ページ数	6
発行日	2023-03-08 (MSS, NLP)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会