講演抄録/キーワード |
講演名 |
2021-02-12 16:50
サッカータスクの協調行動獲得におけるカリキュラム学習を用いた強化学習 ○阿部宇志・折原良平・清 雄一・田原康之・大須賀昭彦(電通大) AI2020-37 |
抄録 |
(和) |
本研究では, サッカータスクでの協調行動を促すため, カリキュラム学習を用いた強化学習の研究を行った.サッカータスクは報酬がスパースなタスクであるため, どんな行動が報酬や罰につながるかを明確にすることが難しく, 状態の多さや行動の複雑さから学習が困難になる. そのため, 内発的動機付けのような学習を促すアプローチの研究が多く行われている. 本研究では, 簡単なタスクから学習を始め, 徐々に難しいタスクを学習させる, カリキュラム学習を強化学習と組み合わせることで協調行動獲得の学習の効率化を目指した. これまでのサッカータスクにおけるカリキュラム学習は協調行動の獲得に関して研究が行われてこなかった. カリキュラム学習で協調行動を学習させるために, 本稿では人が行うサッカーの練習に似せて, コーンのような障害物を敵に見立てることや段階的に敵のエージェントを増やすことで, タスクを難しくしてカリキュラム学習を行った. 実験ではシュートチャンスでの2 体のエージェントの協調行動を試みた学習を行い, カリキュラム学習をした場合がカリキュラム学習をしなかった場合に比べて, 目標達成率を上回ることを示した. |
(英) |
(Not available yet) |
キーワード |
(和) |
サッカー / マルチエージェント強化学習 / カリキュラム学習 / MuJoCo / / / / |
(英) |
/ / / / / / / |
文献情報 |
信学技報, vol. 120, no. 362, AI2020-37, pp. 79-84, 2021年2月. |
資料番号 |
AI2020-37 |
発行日 |
2021-02-05 (AI) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
AI2020-37 |
|