講演抄録/キーワード |
講演名 |
2007-01-31 16:00
単語・意味属性間共起に基づく単語間の階層関係の抽出 ○別所克人・内山俊郎・片岡良治(NTT) |
抄録 |
(和) |
単語と、単語に付随する意味属性とがコーパス中で共起する頻度を算出することにより得られる共起ベクトルは、単語間の意味的類似性を反映する性質をもつ。本稿では、共起ベクトル間の距離尺度として、カルバック・ライブラー距離をとることにより、ユークリッド距離をとる場合と比べて、兄弟概念の単語への連想が抑制され、上位・下位概念の単語への連想が強まることを示す。また、単語と意味属性との共起頻度をとる際、該単語自身の意味属性との共起を考慮するか否かで、連想の様相が変わることも示す。 |
(英) |
The co-occurrence vectors that are the co-occurrence frequencies between words and semantic attributes in a corpus reflect the semantic similarities between words. This paper shows that the association to words of sibling concept is restrained and the association to words of superordinate or subordinate concept is enhanced by applying Kullback-Leibler metric comparing with applying Euclid metric. This paper also shows that the aspect of association differs according to whether or not considering the co-occurrences between words and their own semantic attributes. |
キーワード |
(和) |
意味属性 / 共起 / カルバック・ライブラー距離 / 上位・下位概念 / / / / |
(英) |
Semantic Attribute / Co-occurrence / Kullback-Leibler Metric / Superordinate or Subordinate Concept / / / / |
文献情報 |
信学技報, vol. 106, no. 518, NLC2006-92, pp. 31-36, 2007年1月. |
資料番号 |
NLC2006-92 |
発行日 |
2007-01-24 (NLC) |
ISSN |
Print edition: ISSN 0913-5685 |
PDFダウンロード |
|