講演抄録/キーワード |
講演名 |
2009-07-28 11:00
マージン最大化によるメトリック空間分割手法 ○倉沢 央(東大)・深川大路・高須淳宏・安達 淳(NII) DE2009-3 |
抄録 |
(和) |
メトリック空間を対象とした類似検索索引では,検索処理の枝刈りのために空間を効果的に分割することが求められる.本稿は,最大マージン化によるメトリック空間分割手法,Maximal Metric Margin Partitioning (MMMP)を提案する.MMMPではデータの分布,特にクラスタ形状にもとづいて空間を分割する.クラスタの境界間の距離が最大になる分割面となるように工夫されている点が本手法の特徴である.本稿はさらに,MMMPを用いた類似検索索引の一例としてMMMP-Indexも提案する.実験により,MMMP-IndexはMMMPの枝刈り効果により検索処理コストを削減できることを示した.特にクラスタ化したデータに対して効果を発揮し,比較手法の3分の2程度にまで距離計算コストを削減できた. |
(英) |
A fundamental issue that confronts the development of an index for similarity searches in metric spaces is how to divide the data effectively for search pruning. We propose Maximal Metric Margin Partitioning (MMMP), a partitioning scheme for similarity search indexes. MMMP divides the data space based on its distribution patterns, especially the boundaries of clusters. A partitioning surface created by MMMP is at maximum distances from the two cluster boundaries. MMMP is the first similarity search index approach to focus on the partitioning surfaces and data distribution patterns. We also present an indexing scheme, named the MMMP-Index, that uses MMMP and pivot filtering. The MMMP-Index discards many objects that are not relevant to a query by MMMP, and it reduces the query execution cost. Experimental results show that MMMP effectively indexes clustered data and reduces the search cost. For clustered vector data, the MMMP-Index reduces the computational cost to less than two thirds that of the compared schemes. |
キーワード |
(和) |
類似検索 / 検索索引 / メトリック空間 / マージン / ピボット分割 / / / |
(英) |
Similarity Search / Index / Metric Space / Margin / Pivot partitioning / / / |
文献情報 |
信学技報, vol. 109, no. 153, DE2009-3, pp. 13-18, 2009年7月. |
資料番号 |
DE2009-3 |
発行日 |
2009-07-21 (DE) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
DE2009-3 |