講演抄録/キーワード |
講演名 |
2005-09-21 09:30
文書拡張によるキーワード抽出 ○長町健太・武田善行・梅村恭司(豊橋技科大) |
抄録 |
(和) |
キーワード抽出は情報検索に有用な技術の一つである.その中でも辞書を用いないでキーワード抽出を行う手法がある.この方法では反復度と呼ばれる統計量が用いられる.この方法には,文書長が短い場合に反復度の推定がうまく行えず,キーワード抽出精度が低下するという問題がある.そこで本研究では,類似した文書を結合することで長く拡張した文書を元に反復度の推定を行った.従来法との比較実験の結果,精度改善まではいたらなかったが,従来法に比べてキーワードの再現率が上がり,また,非一般的な分野に特化したキーワードが抽出できるという新たな一面を発見した.結論として,キーワード抽出における文書拡張の有用性を報告する. |
(英) |
Keyword extraction is one of the technology useful for information retrieval. Currently, there is keyword extraction method using Adaptaion. This method has problem that its precision becomes low when the document length in a corpus is short. In such situation, we cannot estimate Adaptation well. In this research, we have tried to make documents long virtually using a information retrieval system. Then, we investigated whether the precision of keyword extraction would be improved by document expansion. But the improvement is not so large. We discovered new one side that the key word that specialized in non-general field can extract. Therefore, it could conclude that we were able to show the utility of the document expansion. |
キーワード |
(和) |
文書拡張 / フレーズ / 複合語 / 反復度 / キーワード抽出 / / / |
(英) |
Document expansion / Phrase / Compound word / Adaptation / Keyword extraction / / / |
文献情報 |
信学技報, vol. 105, no. 299, NLC2005-27, pp. 17-22, 2005年9月. |
資料番号 |
NLC2005-27 |
発行日 |
2005-09-14 (NLC, PRMU) |
ISSN |
Print edition: ISSN 0913-5685 |
PDFダウンロード |
|
研究会情報 |
研究会 |
PRMU NLC |
開催期間 |
2005-09-21 - 2005-09-22 |
開催地(和) |
東大(本郷) |
開催地(英) |
|
テーマ(和) |
ロボットとの相互作用のための言語処理・パターン認識・メディア理解 |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
NLC |
会議コード |
2005-09-PRMU-NLC |
本文の言語 |
日本語 |
タイトル(和) |
文書拡張によるキーワード抽出 |
サブタイトル(和) |
|
タイトル(英) |
A keyword extraction method by document expansion |
サブタイトル(英) |
|
キーワード(1)(和/英) |
文書拡張 / Document expansion |
キーワード(2)(和/英) |
フレーズ / Phrase |
キーワード(3)(和/英) |
複合語 / Compound word |
キーワード(4)(和/英) |
反復度 / Adaptation |
キーワード(5)(和/英) |
キーワード抽出 / Keyword extraction |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
長町 健太 / Kenta Nagamachi / ナガマチ ケンタ |
第1著者 所属(和/英) |
豊橋技術科学大学 (略称: 豊橋技科大)
Toyohashi University Of Technology (略称: TUT) |
第2著者 氏名(和/英/ヨミ) |
武田 善行 / Yoshiyuki Takeda / タケダ ヨシユキ |
第2著者 所属(和/英) |
豊橋技術科学大学 (略称: 豊橋技科大)
Toyohashi University Of Technology (略称: TUT) |
第3著者 氏名(和/英/ヨミ) |
梅村 恭司 / Kyoji Umemura / ウメムラ キョウジ |
第3著者 所属(和/英) |
豊橋技術科学大学 (略称: 豊橋技科大)
Toyohashi University Of Technology (略称: TUT) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2005-09-21 09:30:00 |
発表時間 |
30分 |
申込先研究会 |
NLC |
資料番号 |
NLC2005-27, PRMU2005-54 |
巻番号(vol) |
vol.105 |
号番号(no) |
no.299(NLC), no.301(PRMU) |
ページ範囲 |
pp.17-22 |
ページ数 |
6 |
発行日 |
2005-09-14 (NLC, PRMU) |
|