講演抄録/キーワード |
講演名 |
2005-03-04 15:40
Blogの二連結成分分解によるグルーピング ○菊谷幸雄・太田昌克・山口正泰(NTT) |
抄録 |
(和) |
既知のBlog周辺の関連記事を効率よく発見するために、Blog記事をメタ情報および記事内のリンク情報を用いてグラフ表現し、これを二連結成分分解によってグルーピングする方法を提案する。Blogでは一記事あたりの記述量が少なく他記事へのリンクの記述数も少ないので、グルーピングに当たって書き手によるBlogの分類情報も活用する。さらにグルーピングを効率化するために、Blog記事内の機械的に付与されたリンクを除去する。約22万個のBlogから約560万個の記事を収集しグルーピング実験を行った。実験の結果、本手法によりグループ抽出の起点となる記事に関連性の高い記事群が抽出可能であることを確認した。また、メタ情報をグラフ表現に使用することで、リンクだけの情報では検出できないグループを発見できることも確認した。 |
(英) |
For efficient discovery of unknown blog items related to known blog items, we propose a blog grouping method by using a graph decomposition into bi-connected components based on a metadata structure and links between the items. It is necessary when using a metadata structure in a blog environment that the blog page item has a little description and a few links. We tried grouping real blog data consisting of about 220,000 channels and 5.6 million items. We found that this method needs to be able to eliminate automatically added links in items for grouping items efficiently. The experiments indicate that this method can extract items grouped according to the blog page item. It also appears that the metadata structure is useful for blog page item grouping. |
キーワード |
(和) |
Blog / メタ情報 / RSS / グラフ / 二連結成分分解 / 機械的付与リンク / / |
(英) |
Blog / Metadata / RSS / graph / decomposition into bi-connected components / automatically added link / / |
文献情報 |
信学技報, vol. 104, no. 692, IN2004-322, pp. 383-388, 2005年3月. |
資料番号 |
IN2004-322 |
発行日 |
2005-02-25 (NS, IN) |
ISSN |
Print edition: ISSN 0913-5685 |
PDFダウンロード |
|
|