講演抄録/キーワード |
講演名 |
2015-09-11 09:30
ニュース記事を用いた地域間関連性分析手法 ○福地柾斗・横井 健・小早川倫広(都立産技高専) NLC2015-28 |
抄録 |
(和) |
ニュース記事は速報性,地域性を有する情報発信媒体のひとつであり,ある地域が関心を持つ日々のできごとを表している.本稿では,異なる地域のニュース記事における関心ごとを比較することで,地域間の関連度合いを分析できると考え,ニュース記事の集合から地域間の関連の強さを可視化する手法を提案する.提案手法では,記事の本文に含まれる名詞による記事間の類以度から非軽量多次元尺度構成法(nMDS)によって記事をユークリッド空間上に射影し,その空間上でクラスタリングを行うことで記事に新たな地域ラベルを付与する.実験では,5つの地域のニュース記事から地域間関連性の分析を試みた結果,関係性のありそうな地域ラベルが混在することを確認した.また,nMDSによって射影先のユーグリッド空間の次元数を変化させることにより,高次元で過剰適合してしまうデータに対しても有効であることを確認した. |
(英) |
News article is an information dissemination media which has promptly and locality characteristics. It shows the daily news that people in local area are interested in. We have proposed the method that visualizes the strength of relations among areas with analysis of news article in each area. The method consists of following four components for news articles assigned an area label: 1) extraction of feature from news articles, 2) calculation of similarity, 3) nonmetric multidimensional scaling (nMDS), and 4) k-means clustering. In the experiment, we have applied the proposed method to news articles which collected from five locations. As the result of experiment, we have confirmed that the area label are mixed between relational areas. Also, we have found that it is effective for the data over fitting in high dimension, by changing the projected dimension scale using nMDS. |
キーワード |
(和) |
テキストマイニング / 関連性分析 / 地域性 / 視覚化 / / / / |
(英) |
text mining / relation analysis / locality / visualization / / / / |
文献情報 |
信学技報, vol. 115, no. 222, NLC2015-28, pp. 53-56, 2015年9月. |
資料番号 |
NLC2015-28 |
発行日 |
2015-09-03 (NLC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2015-28 |