講演抄録/キーワード |
講演名 |
2013-02-22 09:30
1億ページのデータベースを対象とした大規模文書画像検索 ○竹田一貴・黄瀬浩一・岩村雅一(阪府大) PRMU2012-161 |
抄録 |
(和) |
本稿では,1億ページのデータベースを対象とした大規模実時間文書画像検索法を提案する.我々はすでに,1,000万ページのデータベースから実時間で検索可能な手法を提案している.この手法を用いてさらなる大規模化を実現するためには,より一層のメモリ削減が求められる.同時に,メモリ削減による検索精度の低下を抑制する必要がある.これを実現するため,検索に有効な特徴量のサンプリング法と,特徴量の柔軟な照合を実現するための多重探索法を提案する.1,000万ページのデータベースを用いた実験から,従来手法と比較して,検索精度を維持したまま70%のメモリ削減を実現できることが分かった.また,1億ページのデータベースから,必要メモリ量236GB,精度98.7%,処理時間26.8msで検索でき,高いスケーラビリティを持つこと確認した. |
(英) |
(Not available yet) |
キーワード |
(和) |
文書画像検索 / 文書画像処理 / 大規模データベース / LLAH / / / / |
(英) |
/ / / / / / / |
文献情報 |
信学技報, vol. 112, no. 441, PRMU2012-161, pp. 131-136, 2013年2月. |
資料番号 |
PRMU2012-161 |
発行日 |
2013-02-14 (PRMU) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2012-161 |