講演抄録/キーワード |
講演名 |
2013-05-24 11:00
ソースコード検索のためのシーケンスに基づく類似度について ○宇田川佳久(東京工芸大) SWIM2013-1 |
抄録 |
(和) |
高品質なソフトウェアを開発・管理する基本はソースコードを確認することであるが,実用的なシステムは数万行から数十万行に及ぶソースコードで構成ことから十分に実施されていない現状がある.本文では,制御文とメソッド名のシーケンスを検索条件とし,この検索条件から有意な検索条件を派生させて検索を行う手法について論じる.この検索機能により,与えられた検索条件を完全に満たすソースコードだけでなく,部分的に満たすソースコードをも検索することができる.Struts 2 Coreソースコードを対象とした実験では,ベクトル空間モデルによる検索よりも,本研究で開発した検索機能が16%から93%の効率化を達成していることを確認した. |
(英) |
In this paper, we presented an approach that improves source code retrieval using the structural information of programs. Our key contribution in this research is the development of an algorithm that derives meaningful search conditions from a given sequence, and then performs retrieval using all of the derived conditions. Thus our source code retrieval model retrieves all of source codes that partially match the given sequence. Experiments on the source code of Struts 2 Core show that the derived structure retrieval model outperforms the vector space retrieval model and it's variant by 16% to 93% in the number of retrieved methods. |
キーワード |
(和) |
構造派生検索モデル / 制御文 / メソッド名 / ベクトル空間検索モデル / / / / |
(英) |
Derived structure retrieval model / Control statement / Method identifier / Vector space model / / / / |
文献情報 |
信学技報, vol. 113, no. 65, SWIM2013-1, pp. 7-12, 2013年5月. |
資料番号 |
SWIM2013-1 |
発行日 |
2013-05-17 (SWIM) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SWIM2013-1 |