講演抄録/キーワード |
講演名 |
2009-02-28 09:40
マルチエージェント環境における経路決定問題への強化学習アルゴリズムの適用 ○増田健司・三堀邦彦(拓殖大) NLP2008-132 |
抄録 |
(和) |
近年、多くの研究者がセルオートマトンによる歩行者の流れのモデルの構築を試みている。人工知能の分野では、そうしたモデルがマルチエージェントシステムとして解釈される。本稿は、マルチエージェント環境における強化学習アルゴリズムに基づく経路決定について議論する。その環境における経路決定能力を向上させるために、我々はエージェントの周りに「エージェント自身の領域」を設ける。学習エージェントは複数のエージェント間におけるこの領域の重なりを回避しつつ、強化学習アルゴリズムに基づきその行動を決定する。 |
(英) |
Recently, many researchers try to construct the models of the pedestrian flow by using the cellular automata. In the field of the artificial intelligence, such model can be interpreted as a kind of the multi-agent systems. This article discusses finding route based on the reinforcement learning algorithm in the multi-agent environment. In order to improve the ability to find the route in the environment, we prepare "the agent's own area" around the agent. While the learning agent avoids the overlapping of the areas between the plural agents, and it decides the action based on the reinforcement learning algorithm.
Keyword Reinforcement learning algorithm, Finding route, Multi-agent, Pedestrian flow. |
キーワード |
(和) |
強化学習アルゴリズム / 経路決定 / マルチエージェント / 歩行者の流れ / / / / |
(英) |
Reinforcement learning algorithm / Finding route / Multi-agent / Pedestrian flow / / / / |
文献情報 |
信学技報, vol. 108, no. 442, NLP2008-132, pp. 7-11, 2009年2月. |
資料番号 |
NLP2008-132 |
発行日 |
2009-02-21 (NLP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLP2008-132 |