講演抄録/キーワード |
講演名 |
2008-06-30 16:55
質問応答Webサイトからの関連語ネットワークの自動抽出 吉田知訓・○間瀬心博・北村泰彦(関西学院大) AI2008-13 |
抄録 |
(和) |
本論文では,質問応答Webサイトの口コミ情報から,関連するキーワードを結んだ関連語ネットワークを抽出する手法を提案する.質問応答Webサイトの回答文には質問文に関連する事柄が記述されていることを用い,質問文と回答文に含まれる同じ属性の単語を関連語として抽出し,単語間の上位下位関係を表現する関連度の高い語を結んで関連語ネットワークを抽出する.関連度として共起頻度,Jaccard係数,Simpson係数を用いて関連度ネットワークを抽出し,Simpson係数が上位下位関係の抽出には有効であることがわかった. |
(英) |
This paper describes a method to extract related term network which shows relationships of terms from word-of-mouth information in FAQ sites on the Internet. We extract terms with the same attribute as related terms and create a related term network by connecting the terms with high relevance. We evaluate co-occurrence frequency, Jaccard and Simpson coefficients and the Simpson coefficient led to the best result. |
キーワード |
(和) |
関連語ネットワーク / シソーラス / 共起情報 / Webマイニング / / / / |
(英) |
related term network / thesaurus / co-occurrence information / Web mining / / / / |
文献情報 |
信学技報, vol. 108, no. 119, AI2008-13, pp. 75-80, 2008年6月. |
資料番号 |
AI2008-13 |
発行日 |
2008-06-23 (AI) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
AI2008-13 |