講演抄録/キーワード |
講演名 |
2015-06-13 14:20
Ukkonenのオンライン接尾辞木構築アルゴリズムの多重ストリーム文字列への拡張について ○髙木拓也・有村博紀(北大) COMP2015-13 |
抄録 |
(和) |
本論文では,次第に伸長する$K$本の文字列の集合に対するテキスト索引のオンライン構築を研究する.
この問題は,多数のセンサーストリームに対する文字列検索に役立つ.
特にテキスト索引として,一般化接尾辞トライと一般化接尾辞木を対象とする.
はじめに,Ukkonenによる接尾辞トライのオンライン構築アルゴリズムを拡張して,
$N$文字からなる$K$本の文字列の集合$S$に対して,
共通の一般化接尾辞トライを$O(N^2)$時間と領域でオンライン構築し,
文字列照合クエリ$P$に$O(|P|)$時間で答えるアルゴリズムを与える.
提案手法は,$K$個の接尾辞トライを同時に構築する素朴な方法に比べて,
構築時間と領域は変わらないが,1つの木にまとめることでクエリ時間を$O(K|P|)$から$O(|P|)$に小さくする.
次に,WeinerのRight-To-Left構築と
UkkonenのLeft-to-Right構築のアルゴリズムを用いて,
一般化接尾辞木に基づく線形領域のテキスト索引をオンライン構築する方法について議論する. |
(英) |
In this paper, we consider online construction of a text index for a set $S$ of $K$ strings in the dynamic setting that
a new letter is appended to one of the strings from time to time.
First, we present an online algorithm that constructs the generalized suffix trie of $S$ in $O(N^2)$ time and space
supporting string matching query $P$ in $O(|P|)$ time, where $N$ is the total number of letters in $S$.
Next, we discuss online construction of a linear space text index based on generalized suffix trees using
Weiner's algorithms and Ukkonen's algorithm. |
キーワード |
(和) |
文字列アルゴリズム / テキスト索引 / 一般化接尾辞トライ / 一般化接尾辞木 / 先行者クエリ構造 / / / |
(英) |
string algorithm / text index / generalized suffix trie and tree / predecessor dictionary / / / / |
文献情報 |
信学技報, vol. 115, no. 84, COMP2015-13, pp. 125-132, 2015年6月. |
資料番号 |
COMP2015-13 |
発行日 |
2015-06-05 (COMP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
COMP2015-13 |