お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2019-06-18 13:30
Hybrid Reinforcement and Imitation Learning for Human-Like Agents
Rousslan Fernand Julien DossaXinyu LianKobe Uni)・Hirokazu NomotoEQUOS RESEARCH)・Takashi MatsubaraKuniaki UeharaKobe UniNC2019-16 IBISML2019-14
抄録 (和) 強化学習では,収益の最大化を目指して訓練することで,様々な課題が解決できる.
しかしながら,ゲームAIや自動運転などに応用する際,ユーザに不安や危害を与える恐れがあるため,性能以外のことも考慮する必要がある.
一方で,模倣学習では、エキスパートのデータ上でエージェントを訓練することで,そのエキスパートを模倣することができる.
ただし,振る舞いが不自然であったり性能がエキスパートの性能に限られる場合がある.
本論文では,連続行動空間に適用可能な強化学習と模倣学習の融合モデルを提案する.
この融合モデルは,単なる模倣学習のエージェントと比較して高い性能を示し,強化学習モデルより人間らしい振る舞いを学習することができた. 
(英) Reinforcement learning methods achieve performance superior to humans in a wide range of complex tasks and uncertain environments.
However, high performance is not the sole metric for practical use, namely when used as a game AI or autonomous driving agent, since highly efficient agent tends to perform greedily and selfishly, therefore inconveniencing the users.
Consequently, there is a need for more human-like agents.
Imitation learning, on the other hand, aims at reproducing the behavior of a human expert and can be used to train a human-like agent, the caveat being that its performance is generally limited by the expert's skill.
In the study, we propose a training scheme to construct a human-like and efficient agent through a hybrid of reinforcement and imitation learning, and apply it to a racing car simulator.
The proposed hybrid agent achieves a higher performance than a strictly imitation learning agent while exhibits more human-like behavior, which is measured via a human sensitivity test.
キーワード (和) 自動運転 / ゲームAI / 人間らしさ / 模倣学習 / 強化学習 / / /  
(英) Autonomous Driving / Game AI / Human-Like Behavior / Imitation Learning / Reinforcement Learning / / /  
文献情報 信学技報, vol. 119, no. 88, NC2019-16, pp. 69-74, 2019年6月.
資料番号 NC2019-16 
発行日 2019-06-10 (NC, IBISML) 
ISSN Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード NC2019-16 IBISML2019-14

研究会情報
研究会 NC IBISML IPSJ-MPS IPSJ-BIO  
開催期間 2019-06-17 - 2019-06-19 
開催地(和) 沖縄科学技術大学院大学 
開催地(英) Okinawa Institute of Science and Technology 
テーマ(和) NC、機械学習によるバイオデータマイニング、一般 
テーマ(英) Neurocomputing, Machine Learning Approach to Biodata Mining, and General 
講演論文情報の詳細
申込み研究会 NC 
会議コード 2019-06-NC-IBISML-MPS-BIO 
本文の言語 英語 
タイトル(和)  
サブタイトル(和)  
タイトル(英) Hybrid Reinforcement and Imitation Learning for Human-Like Agents 
サブタイトル(英)  
キーワード(1)(和/英) 自動運転 / Autonomous Driving  
キーワード(2)(和/英) ゲームAI / Game AI  
キーワード(3)(和/英) 人間らしさ / Human-Like Behavior  
キーワード(4)(和/英) 模倣学習 / Imitation Learning  
キーワード(5)(和/英) 強化学習 / Reinforcement Learning  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) ドッサ ルスラン フェルナン ジュリアン / Rousslan Fernand Julien Dossa / ドッサ ルスラン フェルナン ジュリアン
第1著者 所属(和/英) 神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Uni)
第2著者 氏名(和/英/ヨミ) 連 欣瑜 / Xinyu Lian / レン シンユ
第2著者 所属(和/英) 神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Uni)
第3著者 氏名(和/英/ヨミ) 野本 洋一 / Hirokazu Nomoto / ノモト ヒロカズ
第3著者 所属(和/英) 株式会社エクォス・リサーチ (略称: エクォス・リサーチ)
EQUOS RESEARCH Co., Ltd. (略称: EQUOS RESEARCH)
第4著者 氏名(和/英/ヨミ) 松原 崇 / Takashi Matsubara / マツバラ タカシ
第4著者 所属(和/英) 神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Uni)
第5著者 氏名(和/英/ヨミ) 上原 邦昭 / Kuniaki Uehara / ウエハラ クニアキ
第5著者 所属(和/英) 神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Uni)
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2019-06-18 13:30:00 
発表時間 25分 
申込先研究会 NC 
資料番号 NC2019-16, IBISML2019-14 
巻番号(vol) vol.119 
号番号(no) no.88(NC), no.89(IBISML) 
ページ範囲 pp.69-74(NC), pp.91-96(IBISML) 
ページ数
発行日 2019-06-10 (NC, IBISML) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会