講演抄録/キーワード |
講演名 |
2013-01-24 10:30
経路積分強化学習による猫ひねり運動の制御 ○中野太智・前田新一・石井 信(京大) NLP2012-107 NC2012-97 |
抄録 |
(和) |
猫ひねり運動は,落下中のネコが外力なしに行う姿勢制御運動であり,その制御法は,宇宙ロボットの制御にも応用可能なものとして実用性を有する.しかし,ネコの姿勢制御システムは非ホロノミックシステムに分類されるものであり,一般的な状態フィードバック則での制御が困難であることが知られている.本研究では,状態には依存せずに時間のみに依存するものとして表現した方策を,経路積分強化学習法によって学習するアプローチを提案する.提案する手法により,ネコの姿勢制御を模したシステムにおける目標状態を達成する制御則を効率よく獲得できることを示す. |
(英) |
The falling-cat motion is a motion for controlling the cat's posture under no existence of external force. To obtain a controller that emits such a motion is of practice, because of its applicability to controlling problems of various systems including space robots. It is not an easy task, however, because the cat's posture control is a nonholonomic system to which general state feedback control is hard to be applied. In this study, we propose an approach to use path integral reinforcement learning for identifying a control policy that is dependent on time but independent of system state. We will show that the proposed method can acquire such a control policy that achieves a goal state (a goal posture) of a dynamical system which models the cat's posture control, in an efficient manner. |
キーワード |
(和) |
非ホロノミックシステム / 猫ひねり / 経路積分強化学習 / / / / / |
(英) |
Nonholonomic system / falling-cat motion / path integral reinforcement learning / / / / / |
文献情報 |
信学技報, vol. 112, no. 390, NC2012-97, pp. 19-24, 2013年1月. |
資料番号 |
NC2012-97 |
発行日 |
2013-01-17 (NLP, NC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLP2012-107 NC2012-97 |
研究会情報 |
研究会 |
NC NLP |
開催期間 |
2013-01-24 - 2013-01-25 |
開催地(和) |
北海道大学百年記念会館 |
開催地(英) |
Hokkaido University Centennial Memory Hall |
テーマ(和) |
一般 |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
NC |
会議コード |
2013-01-NC-NLP |
本文の言語 |
日本語 |
タイトル(和) |
経路積分強化学習による猫ひねり運動の制御 |
サブタイトル(和) |
|
タイトル(英) |
Control of the falling cat motion by using path-integral reinforcement learning |
サブタイトル(英) |
|
キーワード(1)(和/英) |
非ホロノミックシステム / Nonholonomic system |
キーワード(2)(和/英) |
猫ひねり / falling-cat motion |
キーワード(3)(和/英) |
経路積分強化学習 / path integral reinforcement learning |
キーワード(4)(和/英) |
/ |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
中野 太智 / Daichi Nakano / ナカノ ダイチ |
第1著者 所属(和/英) |
京都大学 (略称: 京大)
Kyoto University (略称: Kyoto Univ) |
第2著者 氏名(和/英/ヨミ) |
前田 新一 / Shin-ichi Maeda / マエダ シンイチ |
第2著者 所属(和/英) |
京都大学 (略称: 京大)
Kyoto University (略称: Kyoto Univ) |
第3著者 氏名(和/英/ヨミ) |
石井 信 / Shin Ishii / イシイ シン |
第3著者 所属(和/英) |
京都大学 (略称: 京大)
Kyoto University (略称: Kyoto Univ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2013-01-24 10:30:00 |
発表時間 |
20分 |
申込先研究会 |
NC |
資料番号 |
NLP2012-107, NC2012-97 |
巻番号(vol) |
vol.112 |
号番号(no) |
no.389(NLP), no.390(NC) |
ページ範囲 |
pp.19-24 |
ページ数 |
6 |
発行日 |
2013-01-17 (NLP, NC) |