講演抄録/キーワード |
講演名 |
2013-09-13 10:55
経済新聞記事より株価変動に影響を与える重要な記事の自動抽出 ○中山 大・酒井浩之(成蹊大) NLC2013-26 |
抄録 |
(和) |
現在、個人投資家が増加している.しかし,すべての個人投資家が投資に対して知識や経験を持ち合わせているとは言い難い.そこで,本研究では,日本経済新聞記事より過去にある企業の株価に変動を与える重要な記事を自動で抽出する方法を提案した.具体的には,株価のデータより前日比を計算し,前日比が大きかった日付を取得する.取得した日付をもとに,その周辺の日付でその企業に関連した新聞記事を抽出する.そこから訓練データを作成し,訓練データに含まれる単語を素性とし,SVMにより生成した分類器で記事を分類する.評価実験では,F値が44となった.F値を上げるために,改良手法として,企業WEBページに含まれる単語を素性に加え,さらに,全実行結果より誤りとなった結果をもとに特徴を見つけ除去することも行った.再度評価したところ,F値は57,精度は73%となり,良好な結果が得られた. |
(英) |
Currently, the number of private investors is increasing. However, all private investors don’t have the knowledge on investment. Therefore, we proposed a method for extracting important articles that influence the stock price of companies from financial articles. Actually, we calculate change of stock price from previous day. Then, we extract newspaper articles related to companies from set of articles issued on the day.
We create a training data set from extracted newspaper articles. Our method extracts features from words contained in the training data set, and classifies the extracted articles into important articles that influence the stock price of companies and unimportant articles by SVM. Experimental results showed that our method achieved 44 F-measure.
Moreover, we adds keywords extracted from web pages of companies to features of SVM for improving F-measure. In this result, our method achieved 57 F-measure and 73% accuracy. |
キーワード |
(和) |
重要記事抽出 / 投資判断支援 / テキストマイニング / / / / / |
(英) |
Important articles extraction / Investment decision support / Text Mining / / / / / |
文献情報 |
信学技報, vol. 113, no. 213, NLC2013-26, pp. 61-66, 2013年9月. |
資料番号 |
NLC2013-26 |
発行日 |
2013-09-05 (NLC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
査読に ついて |
本技術報告は査読を経ていない技術報告であり,推敲を加えられていずれかの場に発表されることがあります. |
PDFダウンロード |
NLC2013-26 |
研究会情報 |
研究会 |
NLC |
開催期間 |
2013-09-12 - 2013-09-13 |
開催地(和) |
青少年総合センター |
開催地(英) |
National Olympics Memorial Youth Center |
テーマ(和) |
第3回テキストマイニング・シンポジウム |
テーマ(英) |
The Third Symposium on Text Mining |
講演論文情報の詳細 |
申込み研究会 |
NLC |
会議コード |
2013-09-NLC |
本文の言語 |
日本語 |
タイトル(和) |
経済新聞記事より株価変動に影響を与える重要な記事の自動抽出 |
サブタイトル(和) |
|
タイトル(英) |
Extraction of important articles that influence the stock price of companies from financial articles |
サブタイトル(英) |
|
キーワード(1)(和/英) |
重要記事抽出 / Important articles extraction |
キーワード(2)(和/英) |
投資判断支援 / Investment decision support |
キーワード(3)(和/英) |
テキストマイニング / Text Mining |
キーワード(4)(和/英) |
/ |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
中山 大 / Masaru Nakayama / ナカヤマ マサル |
第1著者 所属(和/英) |
成蹊大学 (略称: 成蹊大)
Seikei University (略称: Seikei Univ.) |
第2著者 氏名(和/英/ヨミ) |
酒井 浩之 / Hiroyuki Sakai / サカイ ヒロユキ |
第2著者 所属(和/英) |
成蹊大学 (略称: 成蹊大)
Seikei University (略称: Seikei Univ.) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2013-09-13 10:55:00 |
発表時間 |
25分 |
申込先研究会 |
NLC |
資料番号 |
NLC2013-26 |
巻番号(vol) |
vol.113 |
号番号(no) |
no.213 |
ページ範囲 |
pp.61-66 |
ページ数 |
6 |
発行日 |
2013-09-05 (NLC) |