講演抄録/キーワード |
講演名 |
2012-11-07 15:30
ベイジアンネットワークを用いたLDAの特徴選択 ○大畑亮介・植野真臣(電通大) IBISML2012-53 |
抄録 |
(和) |
近年,文書などの離散データにおける様々な特徴(著者など)を付加情報として組み込んだトピックモデルが注目されている.しかし,これまでの研究では特徴の選択方法については考慮されていない.本論では,特徴をデータ生成過程に取り入れたトピックモデルにおける特徴選択方法を提案する.具体的には,ベイジアンネットワークの枠組みを用いて特徴と潜在トピックの因果関係を明らかにし,データ生成に影響を与える特徴の組み合わせを選択する.本手法の利点は次の2つである.(1)評価する特徴の組み合わせごとに潜在トピックを学習する必要がないため計算効率が良い(2)統計的一致性を持つため特徴選択の精度が良い.シミュレーションにより提案手法の有効性を示す. |
(英) |
Recently there has been great interest in topic model analyzing discrete data accompanied by arbitrary features, such as authors. However, previous work in such topic modeling does not take account of feature selection. This paper presents a feature selection method for such topic model. The proposed method selects the feature set involving data generation by clarifying causality between the latent topic and features using bayesian network-based approach. The Advantages of the proposed method are as follows: First, computational time is short because the proposed method can select the feature set without learning latent topic of any combination of features. Second, feature selection accuracy is high because the proposed method has consistency. We demonstrate the effectiveness of the proposed method by simulation. |
キーワード |
(和) |
トピックモデル / 特徴選択 / ベイジアンネットワーク / / / / / |
(英) |
topic model / feature selection / bayesian network / / / / / |
文献情報 |
信学技報, vol. 112, no. 279, IBISML2012-53, pp. 135-142, 2012年11月. |
資料番号 |
IBISML2012-53 |
発行日 |
2012-10-31 (IBISML) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
IBISML2012-53 |