講演抄録/キーワード |
講演名 |
2013-10-17 10:30
オープンソースソフトウェアを用いた強化学習アルゴリズムの実現 ○内部英治・銅谷賢治(沖縄科技大) CNR2013-9 |
抄録 |
(和) |
強化学習は自律的な行動学習手法として研究され,これまでに非常に多くのアルゴリズムが提案され,近年はヒューマノイドロボットのような高自由度なシステムにも適用可能なものが増えてきた.しかしながら,これらのアルゴリズムを強化学習の非専門家がすぐに利用できるかというとそうではない.オープンソースソフトウェア(OSS)として公開されているものも増えているが,周知不足のこともあって有効活用されているとは言い難い状況が続いている.本稿ではRL-Glue, PyBrainといった既存の強化学習に関連するOSSについて概説し,それらの利点・欠点をロボット制御の観点から述べる.次に我々が開発している脚式ロボットやスマートフォンロボットにRL-Glueを使った強化学習アルゴリズムを実装する取り組みについて述べる. |
(英) |
Reinforcement learning has been studied as an autonomous learning framework for robots. Several learning algorithms have been proposed and some studies have been applied to the robot control with many degrees of freedoms such as humanoid robots successfully. However, it is difficult for researchers/developers who are not familiar with reinforcement learning to use those algorithms. Some of them are distributed as free, open source software (OSS), but they are not fully exploited because of several problems. This paper overviews existing open source software in the field of reinforcement learning such as RL-Glue, PyBrain, and so on, and we discuss the advantages and disadvantages from a viewpoint of robot control. Next, we show how we apply open source software such as RL-Glue introduced here to our robot such as legged robots and smartphone robots in order to implement the specific reinforcement learning algorithm. |
キーワード |
(和) |
強化学習 / オープンソースソフトウェア / RL-Glue / PyBrain / / / / |
(英) |
reinforcement learning / open source software / RL-Glue / PyBrain / / / / |
文献情報 |
信学技報, vol. 113, no. 248, CNR2013-9, pp. 1-6, 2013年10月. |
資料番号 |
CNR2013-9 |
発行日 |
2013-10-10 (CNR) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
CNR2013-9 |
研究会情報 |
研究会 |
CNR |
開催期間 |
2013-10-17 - 2013-10-18 |
開催地(和) |
グランフロント大阪 |
開催地(英) |
Grand Front Osaka |
テーマ(和) |
オープンソースソフト/ハードとサービスを繋ぐクラウドネットワークロボティクス |
テーマ(英) |
Cloud Networked Robotics based on Open Source Software and Hardware |
講演論文情報の詳細 |
申込み研究会 |
CNR |
会議コード |
2013-10-CNR |
本文の言語 |
日本語 |
タイトル(和) |
オープンソースソフトウェアを用いた強化学習アルゴリズムの実現 |
サブタイトル(和) |
|
タイトル(英) |
Implementation of reinforcement learning using open source software |
サブタイトル(英) |
|
キーワード(1)(和/英) |
強化学習 / reinforcement learning |
キーワード(2)(和/英) |
オープンソースソフトウェア / open source software |
キーワード(3)(和/英) |
RL-Glue / RL-Glue |
キーワード(4)(和/英) |
PyBrain / PyBrain |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
内部 英治 / Eiji Uchibe / ウチベ エイジ |
第1著者 所属(和/英) |
沖縄科学技術大学院大学 (略称: 沖縄科技大)
Okinawa Institute of Science and Technology (略称: OIST) |
第2著者 氏名(和/英/ヨミ) |
銅谷 賢治 / Kenji Doya / ドウヤ ケンジ |
第2著者 所属(和/英) |
沖縄科学技術大学院大学 (略称: 沖縄科技大)
Okinawa Institute of Science and Technology (略称: OIST) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2013-10-17 10:30:00 |
発表時間 |
30分 |
申込先研究会 |
CNR |
資料番号 |
CNR2013-9 |
巻番号(vol) |
vol.113 |
号番号(no) |
no.248 |
ページ範囲 |
pp.1-6 |
ページ数 |
6 |
発行日 |
2013-10-10 (CNR) |