講演抄録/キーワード |
講演名 |
2011-03-09 09:00
楽天GORAのレビューデータに関する分析 ○福井知子・川村秀憲・鈴木恵二(北大) AI2010-61 |
抄録 |
(和) |
近年,チャット,Weblog等の普及により,個人が気軽に情報発信できる環境が整ってきており,その気軽さから利用者は年々増加している.個人が発する情報にはしばしば,自分が経験したある対象に関する意見,感想,評価などが含まれているため,そういった自由回答文から有用な情報を収集したいというニーズがある.しかし,個人が自由に記述する自由回答文は数値データとは異なりその定量的な分析は困難である.そこで今回,数値データである5段階評価と自由回答文からなる楽天GORAのレビューデータを対象として,自由回答文中に出現する5段階評価の各項目と関連のある名詞とその名詞の係り受け関係にある単語を抽出し,それらと5段階評価の各項目への評価との関連性についての分析行い,自由回答文から5段階評価の推定手法を提案する.また,その推定手法を評価用レビューデータに対して適用し,推定した5段階評価の平均値と実際の5段階評価の平均値とを比較し,その有用性を検討する. |
(英) |
In these days, the internet, chat and weblog have lowered our barriers to the posting comments and information on Web sites. Because they are easy to use, their users are increasing yearly. These comments and information involve user's opinions, impressions and evaluations of certain objects, so there is a need for extraction of valuable information from these comments posted by many people. But it is harder to analyze those free descriptions quantitatively than to analyze numerical data. In this paper, we propose an estimation approach by using Rakuten GORA reviews. It estimates 5-point scale from free descriptions. First, we extract nouns related to each question and words of modification relation. Second, we analyze relationship between distributions of 5-point scales and those extracted words and find an estimation approach. Then we apply that method to the other reviews and compare estimation result to real data. |
キーワード |
(和) |
テキストマイニング / 自由回答文 / 5段階評価 / / / / / |
(英) |
text mining / free description / 5-point scale / / / / / |
文献情報 |
信学技報, vol. 110, no. 462, AI2010-61, pp. 17-20, 2011年3月. |
資料番号 |
AI2010-61 |
発行日 |
2011-03-01 (AI) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
AI2010-61 |