講演抄録/キーワード |
講演名 |
2009-01-27 11:00
多義性を考慮した同時共起クラスタリングによる動詞の類語抽出 ○高橋秀幸・竹内孔一(岡山大) NLC2008-77 |
抄録 |
(和) |
動詞間で共通する概念を有する動詞の類語をテキストデータから注することを目
的としている.動詞の語義は係り関係にある名詞との組み合わせにより決まるが,
問題は動詞だけでなく名詞も多義性を有することである.これに対して本研究で
は動詞と名詞を同時にクラスタリングする手法を提案してきたが,各初期クラス
タから有益なクラスタを十分獲得できなかった.本発表では初期クラスタから抽
出された動詞の語義を消去し繰り返しクラスタリングを行うことで格のバリエー
ションや動詞の複数の語義を積極的に取り出す方法を提案する.毎日新聞
ならびに均衡コーパスに対して動詞クラスタ抽出実験を行いその結果について
報告する. |
(英) |
In the previous work we show that a co-clustering approach is suitable
for verb synonym extraction because of polysemy of both noun and verb.
The proposed approach is promising, however, it has not succeeded in
initial graphs of verb-noun pairs. Thus in this paper we present a
modified co-clustering approach with recursively extracting other
possible verb gourps from the same verb-noun pairs; this enables us to
actively obtain other meanings of each verb. The experimental results of
verb synonym extraction from Japanese news paper corpus and balanced
corpus show that the modified approach outperformed the previous one
in precision and recall rates. |
キーワード |
(和) |
同時クラスタリング / 動詞の語義 / 多義性 / 類義語 / / / / |
(英) |
Co-clustering / Verb synonyms / Polysemy / Extraction of synonyms / / / / |
文献情報 |
信学技報, vol. 108, no. 408, NLC2008-77, pp. 37-42, 2009年1月. |
資料番号 |
NLC2008-77 |
発行日 |
2009-01-19 (NLC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2008-77 |