講演抄録/キーワード |
講演名 |
2012-10-31 13:30
圧縮文字列に対する省メモリなパターンマッチアルゴリズム ○相原高雄・篠原 歩・成澤和志(東北大) COMP2012-37 |
抄録 |
(和) |
本論文では,テキストとパターンがいずれも直線的プログラム(Straight-Line Program: SLP)を用いて圧縮されているとき,それらに対しパターンマッチを行う確率的アルゴリズムを提案する.我々はまずSchmidt-Schau{\ss}らの確率的等価性判定法を拡張することにより,関数${\rm FirstMismatch}$を新しい方法で確率的に実現する.${\rm FirstMismatch}$とは,テキストの非終端記号とパターンの非終端記号を与えられた位置から照合したときの最初の相違位置を返す関数である.FirstMismatchの新しい実現法をMiyazakiらのパターンマッチ手法と組み合わせることで,計算時間$O(n(n \log N +m \log M) \log M)$,計算領域$O(n \log N+m \log M)$でのパターンマッチを実現する.ここで$n,m$はテキストとパターンを表すSLPのサイズであり,$N,M$はテキストとパターンの文字列長である.Je{\.z}らに提案されたアルゴリズムと比較すると,計算時間は劣るが計算領域が小さいため,使用できる領域が限られている場合に有効な手法である. |
(英) |
In this paper, we propose a randomized algorithm for pattern matching on strings represented by straight-line programs (SLPs). Using the equivalence checking algorithm presented by Schmidt-Schau{\ss} and Schnitger, we realize FirstMismatch (a function which returns the first position at which a nonterminal of text and a nonterminal of pattern have different symbols, when comparison is started at a given position) in a way that is different from Miyazaki's. Then we use Miyazaki's algorithm to solve the problem. Our algorithm runs in $O(n(n \log N +m \log M) \log M)$ time using $O(n \log N+m \log M)$ space, where $n$ and $m$ are the sizes of the SLPs which represent the text and pattern respectively, while $N$ and $M$ are the lengths of the decompressed text and pattern respectively. Our algorithm is slower than the fastest one known today, but uses smaller space. Therefore it is effective when only limited space is available. |
キーワード |
(和) |
データ圧縮 / 直線的プログラム / パターンマッチ / 確率的アルゴリズム / / / / |
(英) |
Data Compression / Straight-line Programs / Pattern Matching / Randomized Algorithms / / / / |
文献情報 |
信学技報, vol. 112, no. 272, COMP2012-37, pp. 17-24, 2012年10月. |
資料番号 |
COMP2012-37 |
発行日 |
2012-10-24 (COMP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
COMP2012-37 |
研究会情報 |
研究会 |
COMP |
開催期間 |
2012-10-31 - 2012-10-31 |
開催地(和) |
東北大学 |
開催地(英) |
Tohoku University |
テーマ(和) |
|
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
COMP |
会議コード |
2012-10-COMP |
本文の言語 |
日本語 |
タイトル(和) |
圧縮文字列に対する省メモリなパターンマッチアルゴリズム |
サブタイトル(和) |
|
タイトル(英) |
Pattern matching on compressed text using smaller space |
サブタイトル(英) |
|
キーワード(1)(和/英) |
データ圧縮 / Data Compression |
キーワード(2)(和/英) |
直線的プログラム / Straight-line Programs |
キーワード(3)(和/英) |
パターンマッチ / Pattern Matching |
キーワード(4)(和/英) |
確率的アルゴリズム / Randomized Algorithms |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
相原 高雄 / Takao Aihara / アイハラ タカオ |
第1著者 所属(和/英) |
東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ.) |
第2著者 氏名(和/英/ヨミ) |
篠原 歩 / Ayumi Shinohara / シノハラ アユミ |
第2著者 所属(和/英) |
東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ.) |
第3著者 氏名(和/英/ヨミ) |
成澤 和志 / Kazuyuki Narisawa / ナリサワ カズユキ |
第3著者 所属(和/英) |
東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ.) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2012-10-31 13:30:00 |
発表時間 |
35分 |
申込先研究会 |
COMP |
資料番号 |
COMP2012-37 |
巻番号(vol) |
vol.112 |
号番号(no) |
no.272 |
ページ範囲 |
pp.17-24 |
ページ数 |
8 |
発行日 |
2012-10-24 (COMP) |