講演抄録/キーワード |
講演名 |
2018-11-05 15:10
[ポスター講演]反復識別法を用いた臨床データのミスラベル探索 ○藤田雄一郎・野田 陽(島津製作所)・吉村健太郎・竹田 扇(山梨大)・梶原茂樹(島津製作所) IBISML2018-73 |
抄録 |
(和) |
我々は識別モデルの性能を下げるミスラベルサンプルを特定する反復識別 (ID; Iterative Discrimination) 法を提案する.ID法は,識別モデルの構築と検証データへの適用を繰り返し,誤識別率が高いサンプルをミスラベルと評価する。本研究では(1) シミュレーションデータ (2) ヒト肝臓がん組織の質量分析スペクトルデータ を使ってID法を評価した。 |
(英) |
We describe here an iterative discrimination (ID) method to specify the mislabeled samples mitigating the performance of discriminative model. This method predicts mislabeled samples by repeatedly running different types of discriminant model, such as SVM and random forest, to supervise and remove the data, which have mislabeled probability exceeding the threshold of error. In this study, we assessed and validated the performance of ID method by applying it either to (1) the data generated by simulation or to (2) the real mass spectra obtained from clinical samples of human liver cancer. |
キーワード |
(和) |
ミスラベルサンプル探索 / SVM / Random Forest / 臨床データ / / / / |
(英) |
Mislabeled Samples Identification / SVM / Random Forest / Clinical Data / / / / |
文献情報 |
信学技報, vol. 118, no. 284, IBISML2018-73, pp. 221-225, 2018年11月. |
資料番号 |
IBISML2018-73 |
発行日 |
2018-10-29 (IBISML) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
IBISML2018-73 |