講演抄録/キーワード |
講演名 |
2007-04-26 17:00
プロパティ付き接尾辞木の効率よいオフライン構築について ○上村卓史・喜田拓也・有村博紀(北大) COMP2007-10 |
抄録 |
(和) |
高度なテキスト検索処理においては,テキストの特性(プロパティ)を考慮し,ある条件を満たす区間のみを対象として検索を行うという要求が存在する.
本論文では,このプロパティを考慮した索引構造を構築する問題に取り組む.
2006年にAmirらは,プロパティに属する区間に含まれる部分文字列のみを格納するプロパティ付き接尾辞木PSTを提案した.
彼らの構築アルゴリズムは,接尾辞木から不要なノードを削除することでプロパティ付き接尾辞木を得るものである.
本論文では,PSTの線形時間構築のへの第一歩として,必要な部分と不要な部分との境界となる位置を見つけるための新たなアルゴリズムを提案する.
アルゴリズム全体の線形時間性の証明は今後の課題である. |
(英) |
In some intelligent application of text retrieval, it is required to do a search just through particular parts of target text data with consideration for some properties that the text have.
Namely, the texts are followed by additional information, and the each target part satisfies a certain condition on it.
In this paper, we address the problem to construct an efficient index structure for this kind of search.
In 2006, Amir \etal \ proposed a modified suffix tree for this problem, called the property suffix tree ,which stores only substrings that belong to the given property.
This algorithm constructs a suffix tree at first, and then pluning edges indicating substrings which are not included in the property.
In this paper, we present an algorithm for finding all borders between nodes to be remained and nodes to be eliminated in the suffix tree. |
キーワード |
(和) |
プロパティ付き文字列 / 文字列照合 / 接尾辞木 / / / / / |
(英) |
text with property / pattern matching / suffix trees / / / / / |
文献情報 |
信学技報, vol. 107, no. 24, COMP2007-10, pp. 71-78, 2007年4月. |
資料番号 |
COMP2007-10 |
発行日 |
2007-04-19 (COMP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
COMP2007-10 |
研究会情報 |
研究会 |
COMP |
開催期間 |
2007-04-26 - 2007-04-26 |
開催地(和) |
京都大学(桂キャンパス) |
開催地(英) |
Katsura Campus, Kyoto University |
テーマ(和) |
|
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
COMP |
会議コード |
2007-04-COMP |
本文の言語 |
日本語 |
タイトル(和) |
プロパティ付き接尾辞木の効率よいオフライン構築について |
サブタイトル(和) |
|
タイトル(英) |
On an Efficient Off-Line Construction of Property Suffix Trees |
サブタイトル(英) |
|
キーワード(1)(和/英) |
プロパティ付き文字列 / text with property |
キーワード(2)(和/英) |
文字列照合 / pattern matching |
キーワード(3)(和/英) |
接尾辞木 / suffix trees |
キーワード(4)(和/英) |
/ |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
上村 卓史 / Takashi Uemura / ウエムラ タカシ |
第1著者 所属(和/英) |
北海道大学 (略称: 北大)
Hokkaido University (略称: Hokkaido Univ.) |
第2著者 氏名(和/英/ヨミ) |
喜田 拓也 / Takuya Kida / キダ タクヤ |
第2著者 所属(和/英) |
北海道大学 (略称: 北大)
Hokkaido University (略称: Hokkaido Univ.) |
第3著者 氏名(和/英/ヨミ) |
有村 博紀 / Hiroki Arimura / アリムラ ヒロキ |
第3著者 所属(和/英) |
北海道大学 (略称: 北大)
Hokkaido University (略称: Hokkaido Univ.) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2007-04-26 17:00:00 |
発表時間 |
35分 |
申込先研究会 |
COMP |
資料番号 |
COMP2007-10 |
巻番号(vol) |
vol.107 |
号番号(no) |
no.24 |
ページ範囲 |
pp.71-78 |
ページ数 |
8 |
発行日 |
2007-04-19 (COMP) |