講演抄録/キーワード |
講演名 |
2010-05-19 14:30
非巡回正規表現に対する効率的なパターン照合 ○金田悠作・湊 真一・有村博紀(北大) COMP2010-11 |
抄録 |
(和) |
正規表現は,アルファベット$\Sigma$の文字と,結合``$\cdot$''と選択``$|$''だけから構成されるとき,非巡回正規表現(acyclic regularexpression)と呼ばれる.本稿では,非巡回正規表現のクラスに対して,長さ$m$と深さ$d$をもつ非巡回正規表現と長さ$n$をもつ入力テキストを入力として受け取り,$O(md)$前処理時間と$O(md/w)$領域を用いて,$O(nmd/w)$時間で正規表現照合問題を解く効率よいアルゴリズムを与える.このために,正規表現と等価な非決定性有限オートマトン(NFA)の状態遷移計算をビット演算と加減算を用いて模倣する分配集積演算と呼ぶビット並列計算手法を開発し,WuとManberらのSHIFT-AND手法(CACM 35(10), 1992)を,非巡回正規表現パターンに拡張している.本結果は,定数深さの非巡回正規表現に対して,$O(m/w)$領域を達成しつつ,一般の正規表現照合に対するBilleのアルゴリズム(ICALP, 2006)よりも時間計算量が小さい. |
(英) |
A regular expression is \name{acyclic} if it is over the basis in $\Sigma$, dot ``$\cdot$'', and union ``$|$''. In this paper, for the subclass of acyclic regular expressions, we give an efficient algorithm that solves the regular expression matching problem for an acyclic regular expression of length $m$ and depth $d$ and an input text of length $n$ in $O(nmd/w)$ time using $O(md)$ preprocessing and $O(md/w)$ space in words on unit-cost RAM model with word length $w$. We introduce new bit-parallel techniques, called scatter and gather operations to simulate Thompson NFA for a given regular expression, and naturally extend SHIFT-AND approach by Wu and Manber (CACM 35(10), 1992) to the regular expression matching problem. For an acyclic regular expression with unbounded depth $d = O(1)$, our approach is faster than Bille's approach for any regular expression keeping $O(m/w)$ space. |
キーワード |
(和) |
パターン照合 / 正規表現 / ビット並列 / / / / / |
(英) |
Pattern matching / Regular expression / Bit-parallel / / / / / |
文献情報 |
信学技報, vol. 110, no. 37, COMP2010-11, pp. 23-29, 2010年5月. |
資料番号 |
COMP2010-11 |
発行日 |
2010-05-12 (COMP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
COMP2010-11 |