ドッサ,ルスラン,フェルナン,ジュリアン; 連,欣瑜; 野本,洋一; 松原,崇; 上原,邦昭

お知らせ 2023年度・2024年度学生員会費割引キャンペーン実施中です
お知らせ技術研究報告と和文論文誌Ｃの同時投稿施策(掲載料1割引き)について
お知らせ電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2019-06-18 13:30 Hybrid Reinforcement and Imitation Learning for Human-Like Agents ○Rousslan Fernand Julien Dossa・Xinyu Lian（Kobe Uni）・Hirokazu Nomoto（EQUOS RESEARCH）・Takashi Matsubara・Kuniaki Uehara（Kobe Uni） NC2019-16 IBISML2019-14
抄録	（和）	強化学習では，収益の最大化を目指して訓練することで，様々な課題が解決できる．しかしながら，ゲームAIや自動運転などに応用する際，ユーザに不安や危害を与える恐れがあるため，性能以外のことも考慮する必要がある. 一方で，模倣学習では、エキスパートのデータ上でエージェントを訓練することで，そのエキスパートを模倣することができる．ただし，振る舞いが不自然であったり性能がエキスパートの性能に限られる場合がある．本論文では，連続行動空間に適用可能な強化学習と模倣学習の融合モデルを提案する．この融合モデルは，単なる模倣学習のエージェントと比較して高い性能を示し，強化学習モデルより人間らしい振る舞いを学習することができた．
	（英）	Reinforcement learning methods achieve performance superior to humans in a wide range of complex tasks and uncertain environments. However, high performance is not the sole metric for practical use, namely when used as a game AI or autonomous driving agent, since highly efficient agent tends to perform greedily and selfishly, therefore inconveniencing the users. Consequently, there is a need for more human-like agents. Imitation learning, on the other hand, aims at reproducing the behavior of a human expert and can be used to train a human-like agent, the caveat being that its performance is generally limited by the expert's skill. In the study, we propose a training scheme to construct a human-like and efficient agent through a hybrid of reinforcement and imitation learning, and apply it to a racing car simulator. The proposed hybrid agent achieves a higher performance than a strictly imitation learning agent while exhibits more human-like behavior, which is measured via a human sensitivity test.
キーワード	（和）	自動運転 / ゲームAI / 人間らしさ / 模倣学習 / 強化学習 / / /
	（英）	Autonomous Driving / Game AI / Human-Like Behavior / Imitation Learning / Reinforcement Learning / / /
文献情報		信学技報, vol. 119, no. 88, NC2019-16, pp. 69-74, 2019年6月.
資料番号		NC2019-16
発行日		2019-06-10 (NC, IBISML)
ISSN		Online edition: ISSN 2432-6380
著作権について		技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します．(許諾番号：10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード		NC2019-16 IBISML2019-14

研究会情報
研究会	NC IBISML IPSJ-MPS IPSJ-BIO
開催期間	2019-06-17 - 2019-06-19
開催地（和）	沖縄科学技術大学院大学
開催地（英）	Okinawa Institute of Science and Technology
テーマ（和）	NC、機械学習によるバイオデータマイニング、一般
テーマ（英）	Neurocomputing, Machine Learning Approach to Biodata Mining, and General
講演論文情報の詳細
申込み研究会	NC
会議コード	2019-06-NC-IBISML-MPS-BIO
本文の言語	英語
タイトル（和）
サブタイトル（和）
タイトル（英）	Hybrid Reinforcement and Imitation Learning for Human-Like Agents
サブタイトル（英）
キーワード(1)（和/英）	自動運転 / Autonomous Driving
キーワード(2)（和/英）	ゲームAI / Game AI
キーワード(3)（和/英）	人間らしさ / Human-Like Behavior
キーワード(4)（和/英）	模倣学習 / Imitation Learning
キーワード(5)（和/英）	強化学習 / Reinforcement Learning
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	ドッサルスランフェルナンジュリアン / Rousslan Fernand Julien Dossa / ドッサルスランフェルナンジュリアン
第1著者所属（和/英）	神戸大学 (略称：神戸大) Kobe University (略称： Kobe Uni)
第2著者氏名（和/英/ヨミ）	連欣瑜 / Xinyu Lian / レンシンユ
第2著者所属（和/英）	神戸大学 (略称：神戸大) Kobe University (略称： Kobe Uni)
第3著者氏名（和/英/ヨミ）	野本洋一 / Hirokazu Nomoto / ノモトヒロカズ
第3著者所属（和/英）	株式会社エクォス・リサーチ (略称：エクォス・リサーチ) EQUOS RESEARCH Co., Ltd. (略称： EQUOS RESEARCH)
第4著者氏名（和/英/ヨミ）	松原崇 / Takashi Matsubara / マツバラタカシ
第4著者所属（和/英）	神戸大学 (略称：神戸大) Kobe University (略称： Kobe Uni)
第5著者氏名（和/英/ヨミ）	上原邦昭 / Kuniaki Uehara / ウエハラクニアキ
第5著者所属（和/英）	神戸大学 (略称：神戸大) Kobe University (略称： Kobe Uni)
第6著者氏名（和/英/ヨミ）	/ /
第6著者所属（和/英）	(略称： ) (略称： )
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2019-06-18 13:30:00
発表時間	25分
申込先研究会	NC
資料番号	NC2019-16, IBISML2019-14
巻番号（vol）	vol.119
号番号（no）	no.88(NC), no.89(IBISML)
ページ範囲	pp.69-74(NC), pp.91-96(IBISML)
ページ数	6
発行日	2019-06-10 (NC, IBISML)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会