講演抄録/キーワード |
講演名 |
2009-06-29 10:00
VF符号上における圧縮照合アルゴリズム ○喜田拓也(北大) COMP2009-18 |
抄録 |
(和) |
本稿では,VF符号で圧縮されたテキスト上でのパターン照合アルゴリズムについて論じる.まず,圧縮照合問題の形式的枠組みであるCollage systemを用いて,VF符号上でKMP型の圧縮照合を行う汎用的なアルゴリズムを導出する.そのアルゴリズムは,$O(m^2+D)$時間・領域の前処理の後,$O(n+R)$時間で圧縮テキストを走査できる.ここで,$m,n,R,D$はそれぞれ,パターン長,テキスト長,パターンの出現回数,圧縮辞書のサイズである.ただし,ここでいう圧縮辞書のサイズとは,各符号語に対応する文字列すべてを連結した長さに等しい.本稿では,さらに,文節木上の各ラベルが相互に文字列を共有した形で表現されている場合に,効率良く前処理を行う改善アルゴリズムを提案する.各ラベルがある文字列$S$の一部分として表現されているとすると,提案アルゴリズムは$O(m^2+|S|+|\calT|)$時間・領域で前処理を行う.ここで,$\calT$は文節木の大きさである. |
(英) |
We discuss the problem of pattern matching on a VF coded text. We introduce a KMP-type pattern matching algorithm that runs on a VF code, by using the Collage system, which is a general framework to capture the essence of compressed pattern matching. The algorithm runs on a compressed text directly in $O(n+R)$ time after $O(m^2+D)$ time and space preprocessing, where $m,n,R,D$ are the pattern length, the compressed text length, the number of occurrences, and the size of the dictionary for the VF code. In this paper, we also present an improved algorithm which can preprocess more efficiently if each label on the parse tree of the VF code shares substrings mutually. For the pattern of length $m$ and the parse tree of size $|\calT|$, it runs in $O(m^2+|S|+|\calT|)$ time and space for preprocessing if each label is represented as a pointer to the string $S$. |
キーワード |
(和) |
VF符号 / 接尾辞木 / 圧縮パターンマッチング / Collage system / / / / |
(英) |
VF code / Suffix tree / Compressed pattern matching / Collage system / / / / |
文献情報 |
信学技報, vol. 109, no. 108, COMP2009-18, pp. 1-8, 2009年6月. |
資料番号 |
COMP2009-18 |
発行日 |
2009-06-22 (COMP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
COMP2009-18 |
研究会情報 |
研究会 |
COMP |
開催期間 |
2009-06-29 - 2009-06-29 |
開催地(和) |
北海道大学 |
開催地(英) |
Hokkaido University |
テーマ(和) |
|
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
COMP |
会議コード |
2009-06-COMP |
本文の言語 |
日本語 |
タイトル(和) |
VF符号上における圧縮照合アルゴリズム |
サブタイトル(和) |
|
タイトル(英) |
Compressed Pattern Matching on VF Codes |
サブタイトル(英) |
|
キーワード(1)(和/英) |
VF符号 / VF code |
キーワード(2)(和/英) |
接尾辞木 / Suffix tree |
キーワード(3)(和/英) |
圧縮パターンマッチング / Compressed pattern matching |
キーワード(4)(和/英) |
Collage system / Collage system |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
喜田 拓也 / Takuya Kida / キダ タクヤ |
第1著者 所属(和/英) |
北海道大学 (略称: 北大)
Hokkaido University (略称: Hokkaido Univ.) |
第2著者 氏名(和/英/ヨミ) |
/ / |
第2著者 所属(和/英) |
(略称: )
(略称: ) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2009-06-29 10:00:00 |
発表時間 |
35分 |
申込先研究会 |
COMP |
資料番号 |
COMP2009-18 |
巻番号(vol) |
vol.109 |
号番号(no) |
no.108 |
ページ範囲 |
pp.1-8 |
ページ数 |
8 |
発行日 |
2009-06-22 (COMP) |
|