講演抄録/キーワード |
講演名 |
2008-05-30 10:00
評判分析のための仕様表現辞書の構築手法 ○丸山 広・鈴木健之・中村太一(東京工科大) SS2008-7 KBSE2008-7 |
抄録 |
(和) |
企業にとってWeb上にある自社商品の評判を把握することは重要である.本稿ではWebドキュメントから信憑性の高い仕様表現辞書を構築する手法を提案する.辞書構築の基本的な手法は,商品の仕様を表わす語と評価を表わす語を,評判を表わす構文パタンを用いて交互に拡張する方法である.本提案手法では,各構文パタンが正しい表現を抽出できる確率を求め,その確率を用いて抽出した語に与えた信頼度が,予め定めた閾値を上回った語のみを辞書に登録することで,信憑性の高い仕様表現辞書を得る.本提案手法の有効性を38,904件の携帯電話に関するWebドキュメントを用いて検証した結果,適合率がより高く,また閾値によって再現率と適合率を調節できることが判明した. |
(英) |
To extract reputations of own product from Web is important for companies. This paper proposes the method of building feature dictionary for extracting reputation information. Basic method of the dictionary building is expanding dictionaries that consist of feature expressions and evaluation expressions with syntax structure pattern. The principle of our proposed method is based on assigning a certainty factor which represents the probability that extracted words really do express a feature or evaluation expression and registering only words which have a certainty factor greater than a pre-set threshold value. We evaluated the effectiveness of our proposed method with 38,904 web documents about the mobile telephone. |
キーワード |
(和) |
評判 / 抽出 / 構文パタン / テキストマイニング / 確信度 / 信頼度 / / |
(英) |
Reputation / Extract / Syntax Structure pattern / Text Mining / Confidence factor / Certainty factor / / |
文献情報 |
信学技報, vol. 108, no. 65, KBSE2008-7, pp. 35-40, 2008年5月. |
資料番号 |
KBSE2008-7 |
発行日 |
2008-05-22 (SS, KBSE) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SS2008-7 KBSE2008-7 |