講演抄録/キーワード |
講演名 |
2019-06-14 15:30
非線形ロジスティック回帰モデルに基づいたソフトウェア fault-prone モジュールの識別比較 山中一成・○土肥 正・岡村寛之(広島大) R2019-12 |
抄録 |
(和) |
本稿では, fault-prone モジュールの識別問題に用いられる非線形ロジスティック回帰モデルの予測性能
比較を行う. 実際のソフトウェア開発において計測されたプロジェクトデータに対して, 適合率と再
現率から定義されるF値を評価し, 通常の線形ロジスティック回帰モデル, 半正定値ロジスティック回帰
モデル, およびカーネルロジステック回帰モデルを比較する. カーネル法を用いることによって, 特徴量
ベクトルの次元を高めることが可能であり, 内積計算を正定値カーネル関数に置換することで複雑な非
線形計算を高速に行うことができるという利点がある. 結果として, カーネルロ
ジスティック回帰モデルを用いることで, 従来法よりも高精度に fault-prone モジュールの識別を
行うことができることを示す. |
(英) |
In this article, we compare several non-linear logistic regression models used in a fault-prone
identification problem in terms of the predictive performance. For the project data measured
in actual software development projects, we evaluate the F-score defined by the tradeoff
between accuracy and recall, and compare three logistic regression models; linear logistic regression,
semi-definite logistic regression and kernel regressions. Especially, using the kernel method
yields increase of the dimension in the feature vector. Also, since the computation of inner products
can be easily replaced by the computation of positive definite kernel functions, we have an advantage
to execute the complex non-linear computation with higher speed. Finally, it is shown
that the kernel logistic regression models could identify the fault-prone modules more accurately
than the existing logistic regression models. |
キーワード |
(和) |
ソフトウェアフォールト予測 / fault-proneモジュール / 非線形ロジスティック回帰 / 識別問題 / カーネル法 / F値 / / |
(英) |
software fault prediction / fault-prone module / non-linear logistic regression / identification problem / kernel method / F-score / / |
文献情報 |
信学技報, vol. 119, no. 82, R2019-12, pp. 19-24, 2019年6月. |
資料番号 |
R2019-12 |
発行日 |
2019-06-07 (R) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
R2019-12 |
|