講演抄録/キーワード |
講演名 |
2010-11-19 15:45
役割に基づくWebページの分割手法とその応用について ○佐野博之・土井達也・白松 俊・大囿忠親・新谷虎松(名工大) AI2010-41 |
抄録 |
(和) |
本稿で提案するWebページ分割手法では,Webページを最小ブロックという単位まで分割した後に,最小ブロックが持つ役割に基づいてブロックの結合を行う.
最小ブロックは様々な役割を持つが,本稿ではWebコンテンツのタイトルを表す最小ブロック(タイトルブロック)に着目した.
最小ブロックが持つ9つのパラメータを用いて決定木学習を行い,計算機によるタイトルブロックの自動抽出を試みた.
評価実験では95%の精度でタイトルブロックの抽出に成功し,本手法が有効であることを確かめた. |
(英) |
Our web page segmentation method divides a web page into Smallest-Blocks, and then assemble some Smallest-Blocks into Content-Blocks.
While smallest-Blocks have many roles, we focused on the title of Web contents.
We adopted 9 parameters for each Smallest-Block in our decision tree learning,
and tried to obtain the extraction of Title-Blocks from web pages.
The experimental results show that the system can extract Title-Blocks in a 95% recall. |
キーワード |
(和) |
Webマイニング / Webページ分割 / Webページレイアウト / / / / / |
(英) |
Web Mining / Web Page Segmentation / Web Page Layout / / / / / |
文献情報 |
信学技報, vol. 110, no. 301, AI2010-41, pp. 61-66, 2010年11月. |
資料番号 |
AI2010-41 |
発行日 |
2010-11-12 (AI) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
AI2010-41 |