オープンソースソフトウェアを用いた強化学習アルゴリズムの実現

内部,英治; 銅谷,賢治

ご案内入会して研究会活動をもっとお得に！研究会参加費・年間登録費が会員価格になります。
お知らせ【重要】研究会参加費の支払いおよび原稿アップロード手続きの変更に関するご案内

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2013-10-17 10:30 オープンソースソフトウェアを用いた強化学習アルゴリズムの実現 ○内部英治・銅谷賢治（沖縄科技大） CNR2013-9
抄録	（和）	強化学習は自律的な行動学習手法として研究され，これまでに非常に多くのアルゴリズムが提案され，近年はヒューマノイドロボットのような高自由度なシステムにも適用可能なものが増えてきた．しかしながら，これらのアルゴリズムを強化学習の非専門家がすぐに利用できるかというとそうではない．オープンソースソフトウェア(OSS)として公開されているものも増えているが，周知不足のこともあって有効活用されているとは言い難い状況が続いている．本稿ではRL-Glue, PyBrainといった既存の強化学習に関連するOSSについて概説し，それらの利点・欠点をロボット制御の観点から述べる．次に我々が開発している脚式ロボットやスマートフォンロボットにRL-Glueを使った強化学習アルゴリズムを実装する取り組みについて述べる．
	（英）	Reinforcement learning has been studied as an autonomous learning framework for robots. Several learning algorithms have been proposed and some studies have been applied to the robot control with many degrees of freedoms such as humanoid robots successfully. However, it is difficult for researchers/developers who are not familiar with reinforcement learning to use those algorithms. Some of them are distributed as free, open source software (OSS), but they are not fully exploited because of several problems. This paper overviews existing open source software in the field of reinforcement learning such as RL-Glue, PyBrain, and so on, and we discuss the advantages and disadvantages from a viewpoint of robot control. Next, we show how we apply open source software such as RL-Glue introduced here to our robot such as legged robots and smartphone robots in order to implement the specific reinforcement learning algorithm.
キーワード	（和）	強化学習 / オープンソースソフトウェア / RL-Glue / PyBrain / / / /
	（英）	reinforcement learning / open source software / RL-Glue / PyBrain / / / /
文献情報		信学技報, vol. 113, no. 248, CNR2013-9, pp. 1-6, 2013年10月.
資料番号		CNR2013-9
発行日		2013-10-10 (CNR)
ISSN		Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380
著作権について		技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します．(許諾番号：10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード		CNR2013-9

研究会情報
研究会	CNR
開催期間	2013-10-17 - 2013-10-18
開催地（和）	グランフロント大阪
開催地（英）	Grand Front Osaka
テーマ（和）	オープンソースソフト／ハードとサービスを繋ぐクラウドネットワークロボティクス
テーマ（英）	Cloud Networked Robotics based on Open Source Software and Hardware
講演論文情報の詳細
申込み研究会	CNR
会議コード	2013-10-CNR
本文の言語	日本語
タイトル（和）	オープンソースソフトウェアを用いた強化学習アルゴリズムの実現
サブタイトル（和）
タイトル（英）	Implementation of reinforcement learning using open source software
サブタイトル（英）
キーワード(1)（和/英）	強化学習 / reinforcement learning
キーワード(2)（和/英）	オープンソースソフトウェア / open source software
キーワード(3)（和/英）	RL-Glue / RL-Glue
キーワード(4)（和/英）	PyBrain / PyBrain
キーワード(5)（和/英）	/
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	内部英治 / Eiji Uchibe / ウチベエイジ
第1著者所属（和/英）	沖縄科学技術大学院大学 (略称：沖縄科技大) Okinawa Institute of Science and Technology (略称： OIST)
第2著者氏名（和/英/ヨミ）	銅谷賢治 / Kenji Doya / ドウヤケンジ
第2著者所属（和/英）	沖縄科学技術大学院大学 (略称：沖縄科技大) Okinawa Institute of Science and Technology (略称： OIST)
第3著者氏名（和/英/ヨミ）	/ /
第3著者所属（和/英）	(略称： ) (略称： )
第4著者氏名（和/英/ヨミ）	/ /
第4著者所属（和/英）	(略称： ) (略称： )
第5著者氏名（和/英/ヨミ）	/ /
第5著者所属（和/英）	(略称： ) (略称： )
第6著者氏名（和/英/ヨミ）	/ /
第6著者所属（和/英）	(略称： ) (略称： )
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
第21著者氏名（和/英/ヨミ）	/ /
第21著者所属（和/英）	(略称： ) (略称： )
第22著者氏名（和/英/ヨミ）	/ /
第22著者所属（和/英）	(略称： ) (略称： )
第23著者氏名（和/英/ヨミ）	/ /
第23著者所属（和/英）	(略称： ) (略称： )
第24著者氏名（和/英/ヨミ）	/ /
第24著者所属（和/英）	(略称： ) (略称： )
第25著者氏名（和/英/ヨミ）	/ /
第25著者所属（和/英）	(略称： ) (略称： )
第26著者氏名（和/英/ヨミ）	/ /
第26著者所属（和/英）	(略称： ) (略称： )
第27著者氏名（和/英/ヨミ）	/ /
第27著者所属（和/英）	(略称： ) (略称： )
第28著者氏名（和/英/ヨミ）	/ /
第28著者所属（和/英）	(略称： ) (略称： )
第29著者氏名（和/英/ヨミ）	/ /
第29著者所属（和/英）	(略称： ) (略称： )
第30著者氏名（和/英/ヨミ）	/ /
第30著者所属（和/英）	(略称： ) (略称： )
第31著者氏名（和/英/ヨミ）	/ /
第31著者所属（和/英）	(略称： ) (略称： )
第32著者氏名（和/英/ヨミ）	/ /
第32著者所属（和/英）	(略称： ) (略称： )
第33著者氏名（和/英/ヨミ）	/ /
第33著者所属（和/英）	(略称： ) (略称： )
第34著者氏名（和/英/ヨミ）	/ /
第34著者所属（和/英）	(略称： ) (略称： )
第35著者氏名（和/英/ヨミ）	/ /
第35著者所属（和/英）	(略称： ) (略称： )
第36著者氏名（和/英/ヨミ）	/ /
第36著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2013-10-17 10:30:00
発表時間	30分
申込先研究会	CNR
資料番号	CNR2013-9
巻番号（vol）	vol.113
号番号（no）	no.248
ページ範囲	pp.1-6
ページ数	6
発行日	2013-10-10 (CNR)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会