お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2018-12-07 15:30
2次元迷路課題における進化的計算を利用したマルチタスク深層強化学習
今井翔太清 雄一田原康之大須賀昭彦電通大AI2018-29
抄録 (和) 深層強化学習においては,探索が不十分であったり,報酬がスパースである場合には最適解への収束が難しい.また,特定のタスクにおいては,探索の回数自体が限られている場合がある.したがって,解決したいタスクとは別の似たタスク(ソースタスク)で探索をして事前に学習を行うことで,解決したいタスク(ターゲットタスク)における学習を促進することが有効であると考えられる.本研究では,ソースタスクにおいて進化的計算を用いたモデルの学習を行い,ターゲットとなる様々なタスクに適用可能なモデルを作成する手法を提案する.本手法では,様々なパラメータを持った複数のニューラルネットと,それに対応するエージェントで環境の探索を行い,様々なタスクに適用可能な汎用的学習モデルの構築を行う.実験では,2D迷路課題において,ゴールの位置が異なる複数のソースタスクを仮定する.提案手法によるソースタスクの学習後,ターゲットタスクの迷路課題に対して,どれだけそのモデルが有効であるか示す. 
(英) In Deep reinforcement learning, it is difficult to converge when the exploration is insufficient or a reward is sparse.
Besides, in a specific task, the number of exploration may be limited. Therefore, it is considered effective to learn in source tasks previously to promote leaning in the target tasks. In this research, we propose a method to train a model that can work well on variety of target tasks with Evolutionary Computation in source task. In this method, agents explore multiple environments with diverse set of neural net works to train a general model. In the experiments, we assume multiple maze source tasks. After the model training with our method in the source tasks, we shows how effective the model is for the maze tasks of the target tasks
キーワード (和) 強化学習 / 深層学習 / 深層強化学習 / 進化的計算 / マルチタスク学習 / ニューロエボリューション / /  
(英) Reinforcement Learning / Deep Learning / Deep Reinforcement Learning / Evolutionary Computation / Multitask Leaning / Neuroevolution / /  
文献情報 信学技報, vol. 118, no. 350, AI2018-29, pp. 19-24, 2018年12月.
資料番号 AI2018-29 
発行日 2018-11-30 (AI) 
ISSN Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード AI2018-29

研究会情報
研究会 AI  
開催期間 2018-12-07 - 2018-12-08 
開催地(和) 九州大学 伊都キャンパス 
開催地(英)  
テーマ(和) 「コンテキストを意識した知識の利用」および一般 
テーマ(英)  
講演論文情報の詳細
申込み研究会 AI 
会議コード 2018-12-AI 
本文の言語 日本語(英語タイトルなし) 
タイトル(和) 2次元迷路課題における進化的計算を利用したマルチタスク深層強化学習 
サブタイトル(和)  
タイトル(英) Evolutionary Multitask Deep Reinforcement Learning in 2D Maze Task 
サブタイトル(英)  
キーワード(1)(和/英) 強化学習 / Reinforcement Learning  
キーワード(2)(和/英) 深層学習 / Deep Learning  
キーワード(3)(和/英) 深層強化学習 / Deep Reinforcement Learning  
キーワード(4)(和/英) 進化的計算 / Evolutionary Computation  
キーワード(5)(和/英) マルチタスク学習 / Multitask Leaning  
キーワード(6)(和/英) ニューロエボリューション / Neuroevolution  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 今井 翔太 / Shota Imai / イマイ ショウタ
第1著者 所属(和/英) 電気通信大学 (略称: 電通大)
The University of Electro-Communications (略称: UEC)
第2著者 氏名(和/英/ヨミ) 清 雄一 / Yuichi Sei / セイ ユウイチ
第2著者 所属(和/英) 電気通信大学 (略称: 電通大)
The University of Electro-Communications (略称: UEC)
第3著者 氏名(和/英/ヨミ) 田原 康之 / Yasuyuki Tahara / タハラ ヤスユキ
第3著者 所属(和/英) 電気通信大学 (略称: 電通大)
The University of Electro-Communications (略称: UEC)
第4著者 氏名(和/英/ヨミ) 大須賀 昭彦 / Akihiko Ohsuga /
第4著者 所属(和/英) 電気通信大学 (略称: 電通大)
The University of Electro-Communications (略称: UEC)
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2018-12-07 15:30:00 
発表時間 25分 
申込先研究会 AI 
資料番号 AI2018-29 
巻番号(vol) vol.118 
号番号(no) no.350 
ページ範囲 pp.19-24 
ページ数
発行日 2018-11-30 (AI) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会