講演抄録/キーワード |
講演名 |
2017-06-24 09:30
敵対的組合せバンディット問題に対する ZDD を用いたアルゴリズム ○坂上晋作(NTT)・石畠正和・湊 真一(北大) IBISML2017-1 |
抄録 |
(和) |
本研究では,敵対的組合せバンディット問題に対するアルゴリズムを提案する.この問題は,各時刻における行動を逐次的に選択する問題であり,提案法は経過時間に対して劣線形なリグレットを常に達成する.また,提案法の手続きはゼロサプレス型二分決定グラフ(ZDD)を用いて計算可能なため,選択可能な行動の総数が指数的に増加する場合であっても,各時刻での行動を効率的に計算することができる. |
(英) |
We propose an algorithm for the adversarial combinatorial bandit problem, which is a sequential decision problem. The proposed algorithm achieves sublinear regret, and it can be performed efficiently using zero-suppressed decision diagrams. |
キーワード |
(和) |
敵対的組合せバンディット / ゼロサプレス型二分決定グラフ / / / / / / |
(英) |
adversarial combinatorial bandit / zero-suppersed binary decision diagram / / / / / / |
文献情報 |
信学技報, vol. 117, no. 110, IBISML2017-1, pp. 43-48, 2017年6月. |
資料番号 |
IBISML2017-1 |
発行日 |
2017-06-17 (IBISML) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
IBISML2017-1 |