講演抄録/キーワード |
講演名 |
2018-12-07 15:30
2次元迷路課題における進化的計算を利用したマルチタスク深層強化学習 ○今井翔太・清 雄一・田原康之・大須賀昭彦(電通大) AI2018-29 |
抄録 |
(和) |
深層強化学習においては,探索が不十分であったり,報酬がスパースである場合には最適解への収束が難しい.また,特定のタスクにおいては,探索の回数自体が限られている場合がある.したがって,解決したいタスクとは別の似たタスク(ソースタスク)で探索をして事前に学習を行うことで,解決したいタスク(ターゲットタスク)における学習を促進することが有効であると考えられる.本研究では,ソースタスクにおいて進化的計算を用いたモデルの学習を行い,ターゲットとなる様々なタスクに適用可能なモデルを作成する手法を提案する.本手法では,様々なパラメータを持った複数のニューラルネットと,それに対応するエージェントで環境の探索を行い,様々なタスクに適用可能な汎用的学習モデルの構築を行う.実験では,2D迷路課題において,ゴールの位置が異なる複数のソースタスクを仮定する.提案手法によるソースタスクの学習後,ターゲットタスクの迷路課題に対して,どれだけそのモデルが有効であるか示す. |
(英) |
In Deep reinforcement learning, it is difficult to converge when the exploration is insufficient or a reward is sparse.
Besides, in a specific task, the number of exploration may be limited. Therefore, it is considered effective to learn in source tasks previously to promote leaning in the target tasks. In this research, we propose a method to train a model that can work well on variety of target tasks with Evolutionary Computation in source task. In this method, agents explore multiple environments with diverse set of neural net works to train a general model. In the experiments, we assume multiple maze source tasks. After the model training with our method in the source tasks, we shows how effective the model is for the maze tasks of the target tasks |
キーワード |
(和) |
強化学習 / 深層学習 / 深層強化学習 / 進化的計算 / マルチタスク学習 / ニューロエボリューション / / |
(英) |
Reinforcement Learning / Deep Learning / Deep Reinforcement Learning / Evolutionary Computation / Multitask Leaning / Neuroevolution / / |
文献情報 |
信学技報, vol. 118, no. 350, AI2018-29, pp. 19-24, 2018年12月. |
資料番号 |
AI2018-29 |
発行日 |
2018-11-30 (AI) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
AI2018-29 |