講演抄録/キーワード |
講演名 |
2012-12-19 15:30
地域特徴語選択を用いたマルチクラス分類によるTwitterユーザの居住地推定 ○西村駿人(奈良先端大)・数原良彦・鷲崎誠司(NTT) NLC2012-37 |
抄録 |
(和) |
本研究では,Twitterユーザのプロフィールに記述されている居住地とユーザが投稿したツイートに出現する単語情報をもとに地域特徴語の選択手法を提案する.またTwitterユーザの居住地をラベル,ユーザが投稿した単語情報を素性とすることでマルチクラス分類を用いてユーザの居住地の推定を行う.日本語Twitterデータに対して評価実験を行い,提案手法が地域特徴語選択を行わないベースライン手法に比べて高い正解率で推定することを確認した. |
(英) |
In this paper, we propose area-specific term selection method based on users' residential information described in their profile and the users' tweets.Our method extracts bag-of-words from a user's tweet and regards the residence as a label to predict a user's residence in the multiclass classification framework.We conducted experiments on Japanese Twitter dataset, and we confirmed that our proposed method outperforms baseline method in terms of accuracy. |
キーワード |
(和) |
マイクロブログ / Twitter / 居住地推定 / / / / / |
(英) |
MicroBlog / Twitter / Location Estimation / / / / / |
文献情報 |
信学技報, vol. 112, no. 367, NLC2012-37, pp. 23-27, 2012年12月. |
資料番号 |
NLC2012-37 |
発行日 |
2012-12-12 (NLC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2012-37 |