講演抄録/キーワード |
講演名 |
2017-03-20 10:00
識別境界付近のデータを選択的に用いる半教師あり学習 ○田中遼平・丁 皛・小野聡一郎・古畑彰夫(東芝) BioX2016-33 PRMU2016-196 |
抄録 |
(和) |
半教師あり学習は少数のラベルありデータに加え多数のラベルなしデータも学習に利用することで効率的に高精度な辞書を生成する手法として注目されている.従来,ラベルありデータの学習結果からラベルなしデータのラベル付けを行い学習に利用するself-trainingという半教師あり学習手法では,設計者の設定した基準以上の確信度の高いデータをラベル付けの対象としてきた.本研究では,認識精度向上への貢献が大きい識別境界付近のデータを選択的に辞書に取り込むことで精度の向上を図る方法と,識別境界付近の選別閾値を最適化する最適領域蓄積法を提案し,実験によってそれらの有効性を示した. |
(英) |
Semi-supervised learning (SSL) is a technique which makes use of unlabeled data in addition to labeled data to obtain better learning accuracies. The most fundamental and widely applicable subtype of SSL is called self-training, which produces additional labeled data from unlabeled data using the results of the classifier trained with the existing labeled data. Conventionally, the additional labeling is performed only on unlabeled data with high prediction confidence above the built-in threshold predetermined by the designer. On the other hand, it is known that learning data near the decision boundary play a crucial role for classification performances. In this paper, we introduce this knowledge to self-training by selectively labeling unconfident unlabeled data near the decision boundary. We also propose a novel method using optimal region accumulation which automatically optimizes the labeling threshold to accumulate data near the boundary. |
キーワード |
(和) |
半教師あり学習 / self-training / 部分空間法 / 手書き数字認識 / / / / |
(英) |
Semi-supervised learning / self-training / subspace method / handwritten digits recognition / / / / |
文献情報 |
信学技報, vol. 116, no. 528, PRMU2016-196, pp. 1-6, 2017年3月. |
資料番号 |
PRMU2016-196 |
発行日 |
2017-03-13 (BioX, PRMU) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
BioX2016-33 PRMU2016-196 |
研究会情報 |
研究会 |
PRMU BioX |
開催期間 |
2017-03-20 - 2017-03-21 |
開催地(和) |
名城大 |
開催地(英) |
|
テーマ(和) |
安心安全と社会 |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
PRMU |
会議コード |
2017-03-PRMU-BioX |
本文の言語 |
日本語 |
タイトル(和) |
識別境界付近のデータを選択的に用いる半教師あり学習 |
サブタイトル(和) |
|
タイトル(英) |
Selection of Near-Boundary Data for Semi-Supervised Learning |
サブタイトル(英) |
|
キーワード(1)(和/英) |
半教師あり学習 / Semi-supervised learning |
キーワード(2)(和/英) |
self-training / self-training |
キーワード(3)(和/英) |
部分空間法 / subspace method |
キーワード(4)(和/英) |
手書き数字認識 / handwritten digits recognition |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
田中 遼平 / Ryohei Tanaka / タナカ リョウヘイ |
第1著者 所属(和/英) |
株式会社東芝 (略称: 東芝)
Toshiba Corporation (略称: Toshiba) |
第2著者 氏名(和/英/ヨミ) |
丁 皛 / Xiao Ding / テイ キョウ |
第2著者 所属(和/英) |
株式会社東芝 (略称: 東芝)
Toshiba Corporation (略称: Toshiba) |
第3著者 氏名(和/英/ヨミ) |
小野 聡一郎 / Soichiro Ono / オノ ソウイチロウ |
第3著者 所属(和/英) |
株式会社東芝 (略称: 東芝)
Toshiba Corporation (略称: Toshiba) |
第4著者 氏名(和/英/ヨミ) |
古畑 彰夫 / Akio Furuhata / |
第4著者 所属(和/英) |
株式会社東芝 (略称: 東芝)
Toshiba Corporation (略称: Toshiba) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2017-03-20 10:00:00 |
発表時間 |
25分 |
申込先研究会 |
PRMU |
資料番号 |
BioX2016-33, PRMU2016-196 |
巻番号(vol) |
vol.116 |
号番号(no) |
no.527(BioX), no.528(PRMU) |
ページ範囲 |
pp.1-6 |
ページ数 |
6 |
発行日 |
2017-03-13 (BioX, PRMU) |