講演抄録/キーワード |
講演名 |
2008-03-10 15:00
分類問題における属性間依存性の再構築とその解釈 ~ ベイジアンネットワーククラシファイアによる実験報告 ~ ○植野 研・北原洋一・ポール トポン クマル・折原良平(東芝) KBSE2007-59 |
抄録 |
(和) |
近年,属性間の依存性を考慮した分類モデルとして,ベイジアンネットワーククラシファイア(BNC)の研究が盛んになっている.本報告では,属性間依存性をどのように再構築すべきか,という観点からベイジアンネットワーククラシファイアの1種であるTree Augmented Network (TAN)を改変し,相互情報量に基づく手法k-Bayesian Network Classifier 1 (k-BNC1)と,確率分布のカルバックライブラ擬距離に基づく手法k-BNC2を提案する.これらの手法はいずれも依存性の高い属性ペアを上位k個のみ採用して属性間依存性を再構築できる.検証実験では,属性間依存性を考慮しないNaïve Bayes Classifierや,Bayesian Networkの構造推定法(K2アルゴリズム, Hill Climbing Searchアルゴリズム)と比較し分類パフォーマンスを評価した.検証実験により提案手法の優位性を示唆する結果を得た. また,依存性制約の有無と属性間依存性の解釈の関係性についても考察し,依存性制約を導入することで分類精度が向上する傾向にあることが分かった. |
(英) |
Recently, many researchers have been focusing on Bayesian Network Classifiers (BNC) as classifiers which can consider dependencies between attributes. In this paper we propose new methods called k-Bayesian Network Classifier 1 (k-BNC1), and k-BNC2 to reconstruct the attribute-dependencies from data, which is based on the conditional mutual information criteria, and the standardized Kullback-Leibler divergence measure, respectively. We compared these classification performances with the performance by the naïve Bayes classifier as well as K2 algorithm and hill climbing search algorithm, both of which can automatically construct Bayesian network structures from data. We also discuss the interpretation of the model generated by our proposed methods, and the advantage of the constraint on directions of arcs between two attributes. Our experimental results show the tendency that k-BNC1 and k-BNC2 perform better than the other methods. The results also suggest that the model with the direction constraints make the classification performance better than the one without the constraints. |
キーワード |
(和) |
ベイジアンネットワーククラシファイア / 属性間依存性 / / / / / / |
(英) |
Bayesian Network Classifiers / Attribute Dependency / / / / / / |
文献情報 |
信学技報, vol. 107, no. 540, KBSE2007-59, pp. 31-36, 2008年3月. |
資料番号 |
KBSE2007-59 |
発行日 |
2008-03-03 (KBSE) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
KBSE2007-59 |
|