講演抄録/キーワード |
講演名 |
2017-11-10 13:00
[ポスター講演]Binary Classification from Positive-Confidence Data ○Takashi Ishida(SMAM/UTokyo/RIKEN)・Gang Niu(UTokyo/RIKEN)・Masashi Sugiyama(RIKEN/UTokyo) IBISML2017-62 |
抄録 |
(和) |
機械学習の多くの実問題では、ラベル付きデータの収集コストを下げることが極めて重要である。そこで本論文では、正例度の付いた正例のみから二値分類器を学習する正例度分類を考える。正例度分類は、正のクラスを記述する1クラス分類の識別問題への拡張と捉えることができ、正例と負例を分類するようにハイパーパラメータを調整する機能も有する。正例度分類は、正のハードラベルを持つデータとラベルなしのデータを用いる正例とラベルなし(PU)分類にも設定が近いが、PU分類はクラス事前確率の推定が難しいという欠点があるのに対して、正例度分類はクラス事前確率の推定を避けることができる。本論文では正例度分類をリスク最小化問題として定式化し、パラメータに対して線形なモデルを用いた、実装が簡単で効率的な定式化を与える。さらに正例度分類の一致性及び推定誤差の上界を理論的に求め、その有用性を実験的に示す。 |
(英) |
Reducing labeling costs in supervised learning is a critical issue in many practical machine learning applications. In this paper, we consider positive-confidence (Pconf) classification, the problem of training a binary classifier only from positive data equipped with confidence. Pconf classification can be regarded as a discriminative extension of one-class classification (which is aimed at ``describing'' the positive class), with ability to tune hyper-parameters for ``classifying'' positive and negative samples. Pconf classification is also related to positive-unlabeled (PU) classification (which uses hard-labeled positive data and unlabeled data), allowing us to avoid estimating the class priors, which is a critical bottleneck in typical PU classification methods. For the Pconf classification problem, we provide a simple empirical risk minimization framework and give a formulation for linear-in-parameter models that can be implemented easily and computationally efficiently. We also theoretically establish the consistency and generalization error bounds for Pconf classification, and demonstrate the practical usefulness of the proposed method through experiments. |
キーワード |
(和) |
正例度 / 弱教師付き学習 / / / / / / |
(英) |
pconf / positive-confidence / weakly-supervised learning / / / / / |
文献情報 |
信学技報, vol. 117, no. 293, IBISML2017-62, pp. 207-214, 2017年11月. |
資料番号 |
IBISML2017-62 |
発行日 |
2017-11-02 (IBISML) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
IBISML2017-62 |