講演抄録/キーワード |
講演名 |
2017-11-16 16:05
転移学習によるクラス未知の文書分類 ○白井匡人(島根大)・劉 健全(NEC) CAS2017-48 MSS2017-32 |
抄録 |
(和) |
本研究では,学習データ内に出現しないクラスを対象として,転移学習を用いて文書分類を行う新たな学習手法を提案する.従来の文書分類では,学習データから得られた各クラスの特徴に基づきクラスが未知の文書を既知のクラスに分類する.クラスを表す特徴を得るにはクラスごとに大量のラベル付きデータが必要となる.このため,学習データ内に存在しない新規のクラスを分類先とすることができない.転移学習を用いた文書分類では,対象領域の文書を分類するために情報源領域に存在するラベル付き文書を利用する.提案手法は,学習データ内に存在しない新規のクラスを対象として分類を行うために,学習済みのクラスと新規クラスのクラス名自体の情報に基づき知識の転移を行う.これにより学習データ内に存在しないクラスを持つ対象領域の文書を分類する. |
(英) |
In this investigation, we propose a new classification method based on transfer learning to classify new classes without training data of that class.
Generally,features of classes is obtained from labelled data.
However, large amount of labeled data is required to obtain features of classes . Transfer learning utilizes extracted knowledge from source domain to analyze the target domain. We extract latent topics based on topic model from source domain. And we select appropriate source domain corresponding to class of target domain using features of class tag. We estimate a class of document in target domain by class information of source domain. |
キーワード |
(和) |
転移学習 / 文書分類 / トピックモデル / / / / / |
(英) |
Transfer learning / Document classification / Topic model / / / / / |
文献情報 |
信学技報, vol. 117, no. 301, MSS2017-32, pp. 51-56, 2017年11月. |
資料番号 |
MSS2017-32 |
発行日 |
2017-11-09 (CAS, MSS) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
CAS2017-48 MSS2017-32 |