講演抄録/キーワード |
講演名 |
2015-06-23 16:10
比較バンディット問題における最適なアルゴリズム ~ ランキング手法比較や選好情報学習を目的として ~ ○小宮山純平・本多淳也(東大)・鹿島久嗣(京大)・中川裕志(東大) IBISML2015-14 |
抄録 |
(和) |
バンディット問題(multi-armed bandit problem)は、情報の活用と探索の間のトレードオフをモデル化した問題である。バンディット問題にはいくつかの亜種があるが、そのうち比較バンディット問題(dueling bandit problem)と呼ばれるものは、一対比較によるフィードバックを用いて最適化を行う。比較バンディット問題の枠組みを用いることによって、検索エンジンのランキング手法の比較や、人間の選好抽出の問題に対して、効率的な最適化を行うことができる。本研究では、比較バンディット問題における理論的な性能限界およびそれを達成するアルゴリズムを提案する。このアルゴリズムは、経験尤度を用いた通常のバンディット問題におけるアルゴリズム(本多,竹村,2010)の比較バンディット問題への拡張である。提案手法を評価するため、検索エンジンの実データにおけるランキング手法の比較や、寿司データセット(神嶌,2003)などによる人間の選好抽出における性能を既存手法と比較する。 |
(英) |
We study the K-armed dueling bandit problem, a variation of the standard stochastic bandit problem where the feedback is limited to relative comparisons of a pair of arms. Algorithms that are inspired by the Deterministic Minimum Empirical Divergence algorithm (Honda and Takemura, 2010) are proposed. The effectiveness of the proposed algorithms are assessed both theoretically and empirically. |
キーワード |
(和) |
バンディット問題 / 比較バンディット問題 / オンライン学習 / 選好学習 / / / / |
(英) |
multi-armed bandit problem / dueling bandit problem / online learning / preference elicitation / / / / |
文献情報 |
信学技報, vol. 115, no. 112, IBISML2015-14, pp. 87-94, 2015年6月. |
資料番号 |
IBISML2015-14 |
発行日 |
2015-06-16 (IBISML) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
IBISML2015-14 |
研究会情報 |
研究会 |
NC IPSJ-BIO IBISML IPSJ-MPS |
開催期間 |
2015-06-23 - 2015-06-25 |
開催地(和) |
沖縄科学技術大学院大学 |
開催地(英) |
Okinawa Institute of Science and Technology |
テーマ(和) |
機械学習によるバイオデータマインニング、一般 |
テーマ(英) |
Machine Learning Approach to Biodata Mining, and General |
講演論文情報の詳細 |
申込み研究会 |
IBISML |
会議コード |
2015-06-NC-BIO-IBISML-MPS |
本文の言語 |
日本語 |
タイトル(和) |
比較バンディット問題における最適なアルゴリズム |
サブタイトル(和) |
ランキング手法比較や選好情報学習を目的として |
タイトル(英) |
Optimal Algorithms in Dueling Bandit Problem |
サブタイトル(英) |
* |
キーワード(1)(和/英) |
バンディット問題 / multi-armed bandit problem |
キーワード(2)(和/英) |
比較バンディット問題 / dueling bandit problem |
キーワード(3)(和/英) |
オンライン学習 / online learning |
キーワード(4)(和/英) |
選好学習 / preference elicitation |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
小宮山 純平 / Junpei Komiyama / コミヤマ ジュンペイ |
第1著者 所属(和/英) |
東京大学 (略称: 東大)
The University of Tokyo (略称: U-Tokyo) |
第2著者 氏名(和/英/ヨミ) |
本多 淳也 / Junya Honda / ホンダ ジュンヤ |
第2著者 所属(和/英) |
東京大学 (略称: 東大)
The University of Tokyo (略称: U-Tokyo) |
第3著者 氏名(和/英/ヨミ) |
鹿島 久嗣 / Hisashi Kashima / カシマ ヒサシ |
第3著者 所属(和/英) |
京都大学 (略称: 京大)
Kyoto University (略称: Kyoto University) |
第4著者 氏名(和/英/ヨミ) |
中川 裕志 / Hiroshi Nakagawa / ナカガワ ヒロシ |
第4著者 所属(和/英) |
東京大学 (略称: 東大)
The University of Tokyo (略称: U-Tokyo) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
第21著者 氏名(和/英/ヨミ) |
/ / |
第21著者 所属(和/英) |
(略称: )
(略称: ) |
第22著者 氏名(和/英/ヨミ) |
/ / |
第22著者 所属(和/英) |
(略称: )
(略称: ) |
第23著者 氏名(和/英/ヨミ) |
/ / |
第23著者 所属(和/英) |
(略称: )
(略称: ) |
第24著者 氏名(和/英/ヨミ) |
/ / |
第24著者 所属(和/英) |
(略称: )
(略称: ) |
第25著者 氏名(和/英/ヨミ) |
/ / |
第25著者 所属(和/英) |
(略称: )
(略称: ) |
第26著者 氏名(和/英/ヨミ) |
/ / |
第26著者 所属(和/英) |
(略称: )
(略称: ) |
第27著者 氏名(和/英/ヨミ) |
/ / |
第27著者 所属(和/英) |
(略称: )
(略称: ) |
第28著者 氏名(和/英/ヨミ) |
/ / |
第28著者 所属(和/英) |
(略称: )
(略称: ) |
第29著者 氏名(和/英/ヨミ) |
/ / |
第29著者 所属(和/英) |
(略称: )
(略称: ) |
第30著者 氏名(和/英/ヨミ) |
/ / |
第30著者 所属(和/英) |
(略称: )
(略称: ) |
第31著者 氏名(和/英/ヨミ) |
/ / |
第31著者 所属(和/英) |
(略称: )
(略称: ) |
第32著者 氏名(和/英/ヨミ) |
/ / |
第32著者 所属(和/英) |
(略称: )
(略称: ) |
第33著者 氏名(和/英/ヨミ) |
/ / |
第33著者 所属(和/英) |
(略称: )
(略称: ) |
第34著者 氏名(和/英/ヨミ) |
/ / |
第34著者 所属(和/英) |
(略称: )
(略称: ) |
第35著者 氏名(和/英/ヨミ) |
/ / |
第35著者 所属(和/英) |
(略称: )
(略称: ) |
第36著者 氏名(和/英/ヨミ) |
/ / |
第36著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2015-06-23 16:10:00 |
発表時間 |
25分 |
申込先研究会 |
IBISML |
資料番号 |
IBISML2015-14 |
巻番号(vol) |
vol.115 |
号番号(no) |
no.112 |
ページ範囲 |
pp.87-94 |
ページ数 |
8 |
発行日 |
2015-06-16 (IBISML) |