講演抄録/キーワード |
講演名 |
2017-02-24 16:10
系列データマイニングによるコードクローン検出 ~ Java SWINGソースコードの解析実験報告 ~ ○宇田川佳久(東京工芸大) SWIM2016-21 |
抄録 |
(和) |
本文は,頻出系列検出アルゴリズムをソフトウェアのコードクローン(類似したソースコード片)の検出に適用する方法を提案し,Java SDK SWINGのソースコードを使った実験により有効性を評価した結果について述べる.一般に,頻出系列検出アルゴリズムでは,最小支持度 (minSup)が小さくなるほど,大量の頻出系列を検出し,コードクローン検出の障害となっていた.本研究では,ソースコードの特性を反映した刈り込み処理と極大頻出系列を使うことで,検出する頻出系列の数を減少させた.実験の結果,本文で提案する手法はminSupが 2に至るまで実用レベルの性能を維持できる. |
(英) |
This paper proposes a method for applying a sequential data mining algorithm to detect code clones (duplicated code fragments) and shows the experimental results using the source code of Java SDK SWING package. A frequent sequential data mining algorithm generally extracts vast amounts of sequential patterns when a minimum support threshold (minSup) is small, which is an obstacle to the detection of code clones. The proposed method reduces the number of extracted frequent sequences by incorporating pruning processes and techniques to extract the maximal frequent sequences. The result shows that the proposed sequential data mining algorithm maintains a practical level of performance until the minSup reaches to 2. |
キーワード |
(和) |
コードクローン / 極大頻出系列 / 最長共通部分列(LCS)アルゴリズム / Javaソースコード / / / / |
(英) |
Code clone / Maximal frequent sequence / Longest common subsequence (LCS) algorithm / Java source code / / / / |
文献情報 |
信学技報, vol. 116, no. 473, SWIM2016-21, pp. 17-22, 2017年2月. |
資料番号 |
SWIM2016-21 |
発行日 |
2017-02-17 (SWIM) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SWIM2016-21 |
研究会情報 |
研究会 |
SWIM |
開催期間 |
2017-02-24 - 2017-02-24 |
開催地(和) |
機械振興会館 |
開催地(英) |
Kikai-Shinko-Kaikan Bldg. |
テーマ(和) |
ビジネス評価と信頼性、学生セッション、一般 |
テーマ(英) |
Evaluation of business model and reliability, Student session, etc. |
講演論文情報の詳細 |
申込み研究会 |
SWIM |
会議コード |
2017-02-SWIM |
本文の言語 |
日本語 |
タイトル(和) |
系列データマイニングによるコードクローン検出 |
サブタイトル(和) |
Java SWINGソースコードの解析実験報告 |
タイトル(英) |
Detecting code clone using sequential data mining |
サブタイトル(英) |
Experimental results on Java SWING source code |
キーワード(1)(和/英) |
コードクローン / Code clone |
キーワード(2)(和/英) |
極大頻出系列 / Maximal frequent sequence |
キーワード(3)(和/英) |
最長共通部分列(LCS)アルゴリズム / Longest common subsequence (LCS) algorithm |
キーワード(4)(和/英) |
Javaソースコード / Java source code |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
宇田川 佳久 / Yoshihisa Udagawa / ウダガワ ヨシヒサ |
第1著者 所属(和/英) |
東京工芸大学 (略称: 東京工芸大)
Tokyo Polytechnic University (略称: Tokyo Polytechnic Univ.) |
第2著者 氏名(和/英/ヨミ) |
/ / |
第2著者 所属(和/英) |
(略称: )
(略称: ) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2017-02-24 16:10:00 |
発表時間 |
25分 |
申込先研究会 |
SWIM |
資料番号 |
SWIM2016-21 |
巻番号(vol) |
vol.116 |
号番号(no) |
no.473 |
ページ範囲 |
pp.17-22 |
ページ数 |
6 |
発行日 |
2017-02-17 (SWIM) |