講演抄録/キーワード |
講演名 |
2006-03-21 10:50
状態空間の自律的構成による強化学習の高速化 ○大島郁郎・中野秀洋・宮内 新(武蔵工大) |
抄録 |
(和) |
強化学習を実際のタスクに適用する場合,状態数の増加に伴い計算量が増加する.そのため,学習に要する計算時間が膨大なものとなる.本稿では,状態空間の自律的構成による強化学習の高速化手法を提案する.学習エージェントは学習過程において知覚情報に基づき状態空間を自律的に構成する.提案手法は,学習の合理性を保ったま
ま状態数の増加を抑制でき,学習に要する計算時間の削減が可能となる.いくつかの迷路問題を例とした数値実験を行い,提案手法の有効性を示す. |
(英) |
Then reinforcement learning is applied to real tasks, the calculation amount increases as the number of states increases. Therefore, the computation time for the learning significantly increases. In this paper, we propose
a method of speeding up reinforcement learning by autonomous construction of state space. A learning agent autonomously constructs state space based on sensory information in learning process. The proposed method can
control the increase of the number of states with keeping rationality of learning and can reduce computation time for the learning. We perform numerical experiments by some maze problems as examples and show ffectivity of the proposed method. |
キーワード |
(和) |
強化学習 / 自律的構成 / 状態の統合 / 学習性能 / / / / |
(英) |
reinforcement learning / autonomous construction / state merging / learning performance / / / / |
文献情報 |
信学技報, vol. 105, no. 676, NLP2005-153, pp. 13-17, 2006年3月. |
資料番号 |
NLP2005-153 |
発行日 |
2006-03-14 (NLP) |
ISSN |
Print edition: ISSN 0913-5685 |
PDFダウンロード |
|