お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2021-11-19 11:10
Toward Human Cognition-inspired High-Level Decision Making For Hierarchical Reinforcement Learning Agents
Rousslan Fernand Julien DossaKobe Univ.)・Takashi MatsubaraOsaka Univ.CCS2021-28
抄録 (和) Hierarchical reinforcement learning (HRL) methods aim to leverage the concept of temporal abstraction to efficiently solve long-horizon, sequential decision-making problems with sparse and delayed rewards.
However, the decision-making process of the agent in most HRL methods is often based directly on low-level observations, while also using fixed temporal abstraction.
We propose the hierarchical world model (HWM), which can capture more flexible high-level, temporally abstract dynamics, as well as low-level dynamics of the system.
We posit such model is a natural extension to the HRL framework toward a decision-making process closer to that of humans. 
(英) Hierarchical reinforcement learning (HRL) methods aim to leverage the concept of temporal abstraction to efficiently solve long-horizon, sequential decision-making problems with sparse and delayed rewards.
However, the decision-making process of the agent in most HRL methods is often based directly on low-level observations, while also using fixed temporal abstraction.
We propose the hierarchical world model (HWM), which can capture more flexible high-level, temporally abstract dynamics, as well as low-level dynamics of the system.
We posit such model is a natural extension to the HRL framework toward a decision-making process closer to that of humans.
キーワード (和) Reinforcement learning / Hierarchical reinforcement learning / World models / Temporal abstraction / Hierarchically organized behavior / / /  
(英) Reinforcement learning / Hierarchical reinforcement learning / World models / Temporal abstraction / Hierarchically organized behavior / / /  
文献情報 信学技報, vol. 121, no. 253, CCS2021-28, pp. 61-66, 2021年11月.
資料番号 CCS2021-28 
発行日 2021-11-11 (CCS) 
ISSN Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード CCS2021-28

研究会情報
研究会 CCS  
開催期間 2021-11-18 - 2021-11-19 
開催地(和) 大阪大学 
開催地(英) Osaka Univ. 
テーマ(和) 一般 
テーマ(英)  
講演論文情報の詳細
申込み研究会 CCS 
会議コード 2021-11-CCS 
本文の言語 英語 
タイトル(和)  
サブタイトル(和)  
タイトル(英) Toward Human Cognition-inspired High-Level Decision Making For Hierarchical Reinforcement Learning Agents 
サブタイトル(英)  
キーワード(1)(和/英) Reinforcement learning / Reinforcement learning  
キーワード(2)(和/英) Hierarchical reinforcement learning / Hierarchical reinforcement learning  
キーワード(3)(和/英) World models / World models  
キーワード(4)(和/英) Temporal abstraction / Temporal abstraction  
キーワード(5)(和/英) Hierarchically organized behavior / Hierarchically organized behavior  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) ドッサ ルスラン フェルナン ジュリアン / Rousslan Fernand Julien Dossa /
第1著者 所属(和/英) 神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Univ.)
第2著者 氏名(和/英/ヨミ) 松原 崇 / Takashi Matsubara /
第2著者 所属(和/英) 大阪大学 (略称: 阪大)
Osaka University (略称: Osaka Univ.)
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2021-11-19 11:10:00 
発表時間 25分 
申込先研究会 CCS 
資料番号 CCS2021-28 
巻番号(vol) vol.121 
号番号(no) no.253 
ページ範囲 pp.61-66 
ページ数
発行日 2021-11-11 (CCS) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会