講演抄録/キーワード |
講演名 |
2012-08-30 16:15
日中時系列ニュース・ブログにおけるトピックモデルの推定と分析 ○胡 碩・鄭 立儀・高橋佑介・小池大地・牧田健作・宇津呂武仁(筑波大)・吉岡真治(北大) NLC2012-14 |
抄録 |
(和) |
本研究では,日本語および中国語の時系列ニュースおよびブログを対象として,
教師なしの(時系列)トピックモデルを適用し,時系列のトピックの推移を推定
することにより,二言語間あるいはニュース・ブログの間でのトピックの対応
の有無,および,関心事項の差異を分析するアプローチをとる.特に,本論文
では,日中時系列ニュースの間でトピック対応を同定する方式についてその詳
細および評価結果を述べる.また,中国語において,多様なニュースサイトに
おいてバーストするトピックを中心として,中国語ブログの収集を行い,中国
語におけるニュースとブログの間での関心事項の違いや意見の有無について
分析する. |
(英) |
This paper studies issues regarding topic modeling of information flow
in multilingual news and blog streams. If someone wants to find
differences in the topics of Japanese and Chinese news / blog, it is
usually necessary for him/her to carefully watch every article in
Japanese and Chinese news streams at every moment. In such a situation,
topic models such as LDA (Latent Dirichlet Allocation) and DTM (dynamic
topic model) are quite effective in estimating distribution of topics
over a document collection such as articles in a news / blog stream.
Based on the results of estimating distribution of topics in Japanese /
Chinese news streams, this paper proposes how to analyze cross-lingual
alignment of topics in time series Japanese / Chinese news streams.
This paper also proposes how to analyze differences of concerns and
opinions among various Chinese news sites as well as blog hosts. |
キーワード |
(和) |
ニュース / ブログ / トピックモデル / 時系列分析 / / / / |
(英) |
news / blog / topic model / time series analysis / / / / |
文献情報 |
信学技報, vol. 112, no. 196, NLC2012-14, pp. 25-30, 2012年8月. |
資料番号 |
NLC2012-14 |
発行日 |
2012-08-23 (NLC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2012-14 |