講演抄録/キーワード |
講演名 |
2013-12-04 13:30
照応解析システムANASYS ~ 文の意味解析から得た意味素性に対するナイーブベイズ法によるゼロ照応解析 ~ ○服部真智・原田 実(青学大) NLC2013-34 |
抄録 |
(和) |
日本語において度々省略される主語を同定することは,機械翻訳などの自然言語処理の応用研究において,高精度を達成するために必要な要素技術とされている.そこで意味解析システムSAGEによる文の意味解析結果を基にゼロ代名詞の照応解析を行うことでより高精度の照応解析システムANASYSを開発した.先行詞に成りやすさを数値化するために,意味解析によって得られた語意の類似度に基づく概念距離得点や,共起関係詞と照応詞距離の2次元の座標軸を持つ確率分布など12種類の意味素性を設定した.NAISTテキストコーパスを用いてナイーブベイズ法で正解率の確率分布を学習し,最高確率を持つ語を先行詞とする.5分割交差検定で評価した結果,外界照応を含めて62.47%の適合率を達成することができた. |
(英) |
Zero-anaphora resolution is a required key techniques to achieve high accuracy in many recently-developed natural language processing applications such as the machine translation system and so on. We developed an anaphoric analysis system ANASYS having more accurate resolution than the conventional by using word meaning gained by using semantic analysis system SAGE.ANASYS learned probabilities of correct/incorrect antecedent by using the NAIST text corpus. To express the likelihood to become the antecedent, we proposed 12 kinds of semantic features. Consequently, in the experiment (five-fold cross-validation) on NAIST text corpus, the precision of the antecedent identification was 62.47%. |
キーワード |
(和) |
ゼロ照応 / 意味解析 / ナイーブベイズ法 / / / / / |
(英) |
Zero-Anaphora / Semantic Analysis / Naive Bayes Method / / / / / |
文献情報 |
信学技報, vol. 113, no. 338, NLC2013-34, pp. 7-12, 2013年12月. |
資料番号 |
NLC2013-34 |
発行日 |
2013-11-27 (NLC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2013-34 |