講演抄録/キーワード |
講演名 |
2017-09-07 10:10
ピンポイントフォーカス型テキストマイニング手法の研究 ○菰田文男(埼玉学園大)・中山厚穂(首都大東京) NLC2017-13 |
抄録 |
(和) |
テキストマイニングには出現頻度の多い語に着目しテキスト全体の捉える鳥瞰図描画型と,出現頻度は少ないが特定の文脈で重要な意味を持つ語・文を発見し深い意味を獲得するピンポイントフォーカス型がある。本稿ではテキストを前後の5文ごとにテキストブロックと加工することによって求める解が書かれている箇所をピンポイントで発見しアクセスすることを可能とするとともに,これを基本句・文として精密な意味を持つように変える作業を容易にする手法を提起する。
具体的には、まず求める解を含んでいる可能性の大きいテキストブロックから係り受け関係を持つ基本句を作成する。次に、このテキストブロックと類似性の大きいテキストブロックをクラスター分析によって発見し、基本句を進化させる。このようにして、多義性と曖昧さを含み、膨大な量から成るテキストデータから、必要な部分のみを抽出し、精緻な知識を得ることが出来る。 |
(英) |
Text mining technique is classified into “birds-eye type”, in which words with much frequency of appearance are payed attention and “pinpoint focus type”, in which words with important meaning in a particular context in spite of little frequency of appearance are payed attention. In this article, authors propose the technique that users for text mining discover at pinpoint the text block every five sentences where solution is written, and express its meanings as “basic phrase”.
To put it concretely, first, basic phrase with dependency relation is created from text block which is more likely to contain solutions. Next, a few of text blocks similar to this text block are discovered based on cluster analysis, and basic phrase is evolved, refering to these text blocks. In this way, only necessary parts are extracted from enormous text data including ambiguity, and deep and rich knowledge can be acquired. |
キーワード |
(和) |
テキストマイニング / ピンポイントフォーカス型 / テキストブロック / 基本句 / BOP / / / |
(英) |
text mining / pinpoint focus type / text block / basic phrase / base of the pyramid / / / |
文献情報 |
信学技報, vol. 117, no. 207, NLC2017-13, pp. 1-6, 2017年9月. |
資料番号 |
NLC2017-13 |
発行日 |
2017-08-31 (NLC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2017-13 |