講演抄録/キーワード |
講演名 |
2008-09-16 15:00
集合知によるWebページの構造情報の収集 ○沢田洋平・江渡浩一郎(産総研) AI2008-21 |
抄録 |
(和) |
様々なWebページの構造情報を,不特定多数のユーザの集合知によって収集・
利用する手法(SITEINFO方式)を提案する.これにより,多種多様なWeb上の膨
大な情報を,外部のアプリケーションから柔軟に利用できるようになる.イン
ターネット上の誰でも編集可能なデータベース(wedata)の構築・運用を行い,
SITEINFOを利用するアプリケーション(AutoPagerize)を開発し,1年7ヶ月で
821件の構造情報を収集することができた.本論文では,SITEINFO方式の基本
思想,システムの実装,運用によって得られた知見について述べる. |
(英) |
We propose a method for collecting and utilizing structure information appearing on various Web pages using the collective intelligence of an unspecified number of users (SITEINFO method). This method enables flexible utilization of large amounts of information available on diversified Web Pages from external applications. We built and operated a database (wedata) that anyone using the Internet can edit. In addition, we developed an application (AutoPagerize) for utilization of SITEINFO. Using them, we collected 821 items of structure information in 19 months. This paper describes basic concepts of the SITEINFO method, system implementation, and findings obtained through its operation. |
キーワード |
(和) |
集合知 / Web / Wiki / メタデータ / microformats / / / |
(英) |
Collective Intelligence / Web / Wiki / Metadata / microformats / / / |
文献情報 |
信学技報, vol. 108, no. 208, AI2008-21, pp. 27-32, 2008年9月. |
資料番号 |
AI2008-21 |
発行日 |
2008-09-09 (AI) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
AI2008-21 |