講演抄録/キーワード |
講演名 |
2016-03-03 12:40
自律学習能力を有する悪性スパムメール検出システム ○小坂翔吾・北園 淳・小澤誠一(神戸大)・班 涛・中里純二(NICT)・島村隼平(クルウィット) ICSS2015-50 |
抄録 |
(和) |
近年,悪性なWebページに受信者を誘導するスパムメールによる被害が深刻化している.本研究では,それらの悪性なスパムメールの検出を行う自律学習型のシステムを
提案する.提案システムでは,メール本文のテキストをtf- idf重みを用いて特徴ベクトルに変換し,機械学習手法を用いて識別を行う.また,時間経過に伴うスパムメールの内容変化に対応するため,外れ値検知をone-class SVMを用いて行い,識別器のオンライン学習を行う.実験では,NICTのダブルバウンスメール収集システムによって集められた120日間のスパムメールを用いて評価を行う.提案システムによって,F値の平均が$97.25%$という高い性能で,悪性スパムメールを検出可能であることを示す. |
(英) |
Recently, damages caused by spam mails that guide receivers to malicious
web pages become more and more serious. In this study, we propose an
autonomous learning system to detect such malicious spam mails. In the
proposed system, the main body of a mail is transformed into a feature
vector based on the tf-idf weight, and the feature vector is classified
by machine learning classifiers. In addition, to keep up with the trend
of mail-body contents, we adopt one-class SVM to detect outliers, and
continuously update the classifiers. In the experiments, we use
double-bounce mails collected by NICT for 120 days. We demonstrate that
the proposed system can detect malicious spam mails with a high
F-measure of $97.25%$ on average. |
キーワード |
(和) |
機械学習 / SVM / スパムメール / 自律学習 / / / / |
(英) |
machine learning / support vector machine / spam mail / autonomous learning / / / / |
文献情報 |
信学技報, vol. 115, no. 488, ICSS2015-50, pp. 19-24, 2016年3月. |
資料番号 |
ICSS2015-50 |
発行日 |
2016-02-25 (ICSS) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
ICSS2015-50 |