講演抄録/キーワード |
講演名 |
2010-06-25 14:15
WEB検索高度化のためのアンサンブル学習に基づく訓練事例の精錬 平林宏基・○岩沼宏治・山本泰生・鍋島英知(山梨大) AI2010-5 |
抄録 |
(和) |
WEB の専門検索エンジンを簡便に構築するための手法として,小山らは“検索隠し味” と呼ばれる検索質問へ拡張語を付加する方法を提案している.この検索隠し味を生成するには決定木学習が必要となるが,その決定木学習用の良質な学習データの準備には大きな労力を必要とする.本研究では,バギングと呼ばれるアンサンブル学習法を用いて,決定木の学習のための良質な学習データを自動生成する手法について実証的な考察を行う.検証実験を通して,先行研究よりも安定的に良質な学習用データを生成できる可能性が高いことを示す. |
(英) |
The Keyword Spices, proposed Oyama et al., is a sort of a query-expansion technology, which adds pre-computed additional words to a given query in order to perform an effective domain-specific WEB search. The Keyword Spice technology can achieve a significant performance, but needs a great deal of high-quality training data for learning a decision tree, from which adequate additional words to a query are generated. In this paper, we study an ensemble learning method, especially so-called a bagging, for decision trees used to refine noisy training data for synthesizing good keyword spice words. Throughout experimental evaluations, we show that a bagging method has a high possibility for stabilizing the effects for refining noisy data. |
キーワード |
(和) |
WEB検索 / 検索隠し味 / アンサンブル学習 / 決定木 / 専門検索 / バギング / / |
(英) |
WEB search / keyword spice / ensemble learning / decision tree / domain-specific search / refinement / bagging / |
文献情報 |
信学技報, vol. 110, no. 105, AI2010-5, pp. 25-30, 2010年6月. |
資料番号 |
AI2010-5 |
発行日 |
2010-06-18 (AI) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
AI2010-5 |