講演抄録/キーワード |
講演名 |
2019-02-08 10:20
テキストデータに対する局所相関推論と構造類似性の検出 ○笹原啓佑・原口 誠(北大) NLC2018-44 |
抄録 |
(和) |
本稿では、複数のテキスト中の名詞を、そのロールをもとにデータ行列として表し、このデータ行列の部分に限定して成立する局所相関をヒントによる制約つきの偏NMFで求める。そして、この局所相関をもとに、複数のテキスト間の論理的な構造のマッチングを行う。方針としては、比較的少数の名詞をユーザーが自身の観点で対応付けし、ヒントと呼ばれる名詞対の集合を作る。そして、残りの名詞について、ヒントに照らして類似しているものを発見、抽出するということを行う。この名詞間の類似性をもとに、名詞とそれに係る動詞の構造をクロスクラスタ制約と拡張 k-Plexを用いて求める。 |
(英) |
We propose in this report methods for searching local correlations among features on text data and for detecting sentences whose logical structures are similar. We build matrices based on the role of nouns in sentences and regard these nouns as features. Local correlations are verified only for some parts of non-negative data matrix. As the number of such local correlations is large, we try to control the diversity by giving a hint set. We build subsets of nouns which have similar behaviors with respect to the hint by applying a partial NMF with graph regularization term. We build a subspace whose bases are a vector which can explain subsets of nouns. We search nouns which are adjacent to each other on this subspace. We search structures of nouns and its verbs based on this similarity using cross-cluster constraints and extended k-Plex. |
キーワード |
(和) |
局所相関 / 偏NMF / テキストの構造類似性 / / / / / |
(英) |
/ / / / / / / |
文献情報 |
信学技報, vol. 118, no. 439, NLC2018-44, pp. 47-52, 2019年2月. |
資料番号 |
NLC2018-44 |
発行日 |
2019-01-31 (NLC) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2018-44 |