講演抄録/キーワード |
講演名 |
2015-06-23 10:45
訪問・評点データ統合解析のための非負値行列分解手法の検討 ○幸島匡宏・松林達史・澤田 宏(NTT) IBISML2015-4 |
抄録 |
(和) |
近年様々な分野でデータ解析を用いた取り組みが増加しており, 企業がスマートフォンのアプリやウェブサイトで収集したユーザの閲覧履歴やチェックイン履歴, 評点などのフィードバック履歴を統合的に解析する手法が必要とされている. これまで複数の異なるデータを同時に分析する手法として, 行列表現された複数のデータを非負値制約のもと同時に因子分解する手法等が提案されているものの, この既存手法においては, 訪問数を表す行列と評点を表す行列の組のように解析対象となる各行列がそれぞれ異なる性質を持つ状況を想定してはいなかった. そこで本研究は行列毎に要素の従う確率分布の属する分布族が異なり, それぞれ正規分布とポアソン分布に従う行列の組を解析する非負値行列分解手法を提案する. 人工データを用いた検証実験を通して, 提案手法が平均二乗誤差の精度改善を達成できること, ユーザの評価と回数に関する知見を発見しうるクラスタリング出力が可能であることを報告する. |
(英) |
As the number of projects on data collection and analysis increases in many business fields, it is required that the method which can deal with various type of information such as browsing, check-in and rating collected through company's web-page, smart-phone app and so on. In this paper, we extend collective matrix factorization method in order to analyze multiple matrices whose element of each matrix follows Normal distribution and Poisson distribution, respectively. Using artificial dataset, experiment shows that proposed method improves mean squared error performance and provides the clustering result which reflects the relation between the user's viewing and evaluation activity. |
キーワード |
(和) |
非負値行列分解 / 集合行列分解 / ユークリッド距離 / 一般化カルバックライブラーダイバージェンス / 補助関数法 / / / |
(英) |
Non-negative Matrix Factorization / Collective Matrix Factorization / Euclid Distance / Generalized Kullback Leibler Divergence / Auxiliary Function Method / / / |
文献情報 |
信学技報, vol. 115, no. 112, IBISML2015-4, pp. 21-26, 2015年6月. |
資料番号 |
IBISML2015-4 |
発行日 |
2015-06-16 (IBISML) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
IBISML2015-4 |