お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2006-03-17 11:00
モデル誤差を考慮した強化学習法による実ロボットの適応制御
時田陽一中村 泰奈良先端大)・吉本潤一郎沖縄先端大)・石井 信奈良先端大
抄録 (和) 強化学習(RL)法は制御対象に関する知識を持たずとも制御則を自動的に獲得できるという利点があるため,近年,cart-poleのバランス制御問題などの自動制御問題に広く適用されている.しかしながら,多くの実問題は非線形で高自由度なダイナミクスを有するため,「次元の呪い」と呼ばれる問題が発生する.この問題のために,強化学習法による制御則の獲得はしばしば困難になる.我々の先行研究では,制御理論とシステム同定を利用した強化学習法を提案し,acrobotの自動制御課題に適用した.しかし,シミュレータでは安定に制御できたが,実ロボットの制御は不安定であった.本研究では,システム同定誤差に対してロバストな制御則学習法を提案し,それにより実ロボットを安定して制御できる制御器の獲得を実現した結果を示す. 
(英) Because reinforcement learning (RL) methods have an advantage such that a control rule can be obtained autonomously without any knowledge of the target system. RL methods have been successfully applied to automatic control of various robots such as balancing control of a cart-pole. However, most real control problems have non-linear dynamics with a large number of degrees of freedom, therefore it is necessary to develop an RL method to deal with such situations. This difficulty is called ``curse of dimensionality'' in the context of RL. We formarly proposed an RL method that switches controllers which had been developed in the field of control theory, and applied our method to an automatic control problem of an acrobot. The results showed that a good controller for a simulator can be obtained autonomously but the control of the real acrobot was not stable. In the current study, we propose an RL method which is robust against the system identification error, and show that a good controller for a real robot can be obtained by our method.
キーワード (和) 強化学習 / システム同定 / acrobot / / / / /  
(英) reinforcement learning / system identification / acrobot / / / / /  
文献情報 信学技報, vol. 105, no. 659, NC2005-154, pp. 19-24, 2006年3月.
資料番号 NC2005-154 
発行日 2006-03-10 (NC) 
ISSN Print edition: ISSN 0913-5685
PDFダウンロード

研究会情報
研究会 NC  
開催期間 2006-03-15 - 2006-03-17 
開催地(和) 玉川大学 
開催地(英) Tamagawa University 
テーマ(和) 一般 
テーマ(英) General 
講演論文情報の詳細
申込み研究会 NC 
会議コード 2006-03-NC 
本文の言語 日本語 
タイトル(和) モデル誤差を考慮した強化学習法による実ロボットの適応制御 
サブタイトル(和)  
タイトル(英) Considering model error when applying an reinforcement learning method to control of a real robot 
サブタイトル(英)  
キーワード(1)(和/英) 強化学習 / reinforcement learning  
キーワード(2)(和/英) システム同定 / system identification  
キーワード(3)(和/英) acrobot / acrobot  
キーワード(4)(和/英) /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 時田 陽一 / Yoichi Tokita / トキタ ヨウイチ
第1著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: NAIST)
第2著者 氏名(和/英/ヨミ) 中村 泰 / Yutaka Nakamura / ナカムラ ユタカ
第2著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: NAIST)
第3著者 氏名(和/英/ヨミ) 吉本 潤一郎 / Junichiro Yoshimoto / ヨシモト ジュンイチロウ
第3著者 所属(和/英) 沖縄新大学院大学先行的研究事業 (略称: 沖縄先端大)
Okinawa Institute of Science and Technology (略称: OIST)
第4著者 氏名(和/英/ヨミ) 石井 信 / Shin Ishii / イシイ シン
第4著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: NAIST)
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2006-03-17 11:00:00 
発表時間 25分 
申込先研究会 NC 
資料番号 NC2005-154 
巻番号(vol) vol.105 
号番号(no) no.659 
ページ範囲 pp.19-24 
ページ数
発行日 2006-03-10 (NC) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会