比較バンディット問題における最適なアルゴリズム ～ ランキング手法比較や選好情報学習を目的として ～

小宮山,純平; 本多,淳也; 鹿島,久嗣; 中川,裕志

お知らせ技術研究報告と和文論文誌Ｃの同時投稿施策(掲載料1割引き)について
お知らせ【重要】研究会・各種料金のお支払い方法変更について

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2015-06-23 16:10 比較バンディット問題における最適なアルゴリズム～ランキング手法比較や選好情報学習を目的として～ ○小宮山純平・本多淳也（東大）・鹿島久嗣（京大）・中川裕志（東大） IBISML2015-14
抄録	（和）	バンディット問題（multi-armed bandit problem）は、情報の活用と探索の間のトレードオフをモデル化した問題である。バンディット問題にはいくつかの亜種があるが、そのうち比較バンディット問題（dueling bandit problem）と呼ばれるものは、一対比較によるフィードバックを用いて最適化を行う。比較バンディット問題の枠組みを用いることによって、検索エンジンのランキング手法の比較や、人間の選好抽出の問題に対して、効率的な最適化を行うことができる。本研究では、比較バンディット問題における理論的な性能限界およびそれを達成するアルゴリズムを提案する。このアルゴリズムは、経験尤度を用いた通常のバンディット問題におけるアルゴリズム（本多，竹村，2010）の比較バンディット問題への拡張である。提案手法を評価するため、検索エンジンの実データにおけるランキング手法の比較や、寿司データセット（神嶌，2003）などによる人間の選好抽出における性能を既存手法と比較する。
	（英）	We study the K-armed dueling bandit problem, a variation of the standard stochastic bandit problem where the feedback is limited to relative comparisons of a pair of arms. Algorithms that are inspired by the Deterministic Minimum Empirical Divergence algorithm (Honda and Takemura, 2010) are proposed. The effectiveness of the proposed algorithms are assessed both theoretically and empirically.
キーワード	（和）	バンディット問題 / 比較バンディット問題 / オンライン学習 / 選好学習 / / / /
	（英）	multi-armed bandit problem / dueling bandit problem / online learning / preference elicitation / / / /
文献情報		信学技報, vol. 115, no. 112, IBISML2015-14, pp. 87-94, 2015年6月.
資料番号		IBISML2015-14
発行日		2015-06-16 (IBISML)
ISSN		Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380
著作権について		技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します．(許諾番号：10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード		IBISML2015-14

研究会情報
研究会	NC IPSJ-BIO IBISML IPSJ-MPS
開催期間	2015-06-23 - 2015-06-25
開催地（和）	沖縄科学技術大学院大学
開催地（英）	Okinawa Institute of Science and Technology
テーマ（和）	機械学習によるバイオデータマインニング、一般
テーマ（英）	Machine Learning Approach to Biodata Mining, and General
講演論文情報の詳細
申込み研究会	IBISML
会議コード	2015-06-NC-BIO-IBISML-MPS
本文の言語	日本語
タイトル（和）	比較バンディット問題における最適なアルゴリズム
サブタイトル（和）	ランキング手法比較や選好情報学習を目的として
タイトル（英）	Optimal Algorithms in Dueling Bandit Problem
サブタイトル（英）	*
キーワード(1)（和/英）	バンディット問題 / multi-armed bandit problem
キーワード(2)（和/英）	比較バンディット問題 / dueling bandit problem
キーワード(3)（和/英）	オンライン学習 / online learning
キーワード(4)（和/英）	選好学習 / preference elicitation
キーワード(5)（和/英）	/
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	小宮山純平 / Junpei Komiyama / コミヤマジュンペイ
第1著者所属（和/英）	東京大学 (略称：東大) The University of Tokyo (略称： U-Tokyo)
第2著者氏名（和/英/ヨミ）	本多淳也 / Junya Honda / ホンダジュンヤ
第2著者所属（和/英）	東京大学 (略称：東大) The University of Tokyo (略称： U-Tokyo)
第3著者氏名（和/英/ヨミ）	鹿島久嗣 / Hisashi Kashima / カシマヒサシ
第3著者所属（和/英）	京都大学 (略称：京大) Kyoto University (略称： Kyoto University)
第4著者氏名（和/英/ヨミ）	中川裕志 / Hiroshi Nakagawa / ナカガワヒロシ
第4著者所属（和/英）	東京大学 (略称：東大) The University of Tokyo (略称： U-Tokyo)
第5著者氏名（和/英/ヨミ）	/ /
第5著者所属（和/英）	(略称： ) (略称： )
第6著者氏名（和/英/ヨミ）	/ /
第6著者所属（和/英）	(略称： ) (略称： )
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
第21著者氏名（和/英/ヨミ）	/ /
第21著者所属（和/英）	(略称： ) (略称： )
第22著者氏名（和/英/ヨミ）	/ /
第22著者所属（和/英）	(略称： ) (略称： )
第23著者氏名（和/英/ヨミ）	/ /
第23著者所属（和/英）	(略称： ) (略称： )
第24著者氏名（和/英/ヨミ）	/ /
第24著者所属（和/英）	(略称： ) (略称： )
第25著者氏名（和/英/ヨミ）	/ /
第25著者所属（和/英）	(略称： ) (略称： )
第26著者氏名（和/英/ヨミ）	/ /
第26著者所属（和/英）	(略称： ) (略称： )
第27著者氏名（和/英/ヨミ）	/ /
第27著者所属（和/英）	(略称： ) (略称： )
第28著者氏名（和/英/ヨミ）	/ /
第28著者所属（和/英）	(略称： ) (略称： )
第29著者氏名（和/英/ヨミ）	/ /
第29著者所属（和/英）	(略称： ) (略称： )
第30著者氏名（和/英/ヨミ）	/ /
第30著者所属（和/英）	(略称： ) (略称： )
第31著者氏名（和/英/ヨミ）	/ /
第31著者所属（和/英）	(略称： ) (略称： )
第32著者氏名（和/英/ヨミ）	/ /
第32著者所属（和/英）	(略称： ) (略称： )
第33著者氏名（和/英/ヨミ）	/ /
第33著者所属（和/英）	(略称： ) (略称： )
第34著者氏名（和/英/ヨミ）	/ /
第34著者所属（和/英）	(略称： ) (略称： )
第35著者氏名（和/英/ヨミ）	/ /
第35著者所属（和/英）	(略称： ) (略称： )
第36著者氏名（和/英/ヨミ）	/ /
第36著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2015-06-23 16:10:00
発表時間	25分
申込先研究会	IBISML
資料番号	IBISML2015-14
巻番号（vol）	vol.115
号番号（no）	no.112
ページ範囲	pp.87-94
ページ数	8
発行日	2015-06-16 (IBISML)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会