講演抄録/キーワード |
講演名 |
2023-06-29 13:30
複数の特徴選択アルゴリズムの組み合わせにおける選択的推論 ○松川竜也(名大)・三輪大貴(名工大)・Vo Nguyen Le Duy(理研)・田地宏一(名大)・竹内一郎(名大/理研) NC2023-1 IBISML2023-1 |
抄録 |
(和) |
データ駆動型科学においては,仮説がデータに基づいて選択されるため,古典的な統計的仮説検定では適切な信頼 性評価を行えない.この問題を解決するため,データに基づく仮説の選択を考慮した条件付き選択的推論 (Conditional Selective Inference(CSI))と呼ばれるアプローチによる信頼性の定量化が注目されている. CSIは特徴選択の分野で多く研究されており,マージナルスクリーニング,Lasso,逐次特徴選択(SFS)など, 単一の特徴選択アルゴリズムに対する手法が提案されてきた.しかし,実践的なデータ分析では複数の特徴選択ア ルゴリズムが組み合わせて利用される場合がある.本研究では,複数のアルゴリズムを組み合わせて特徴選択を行 う場合に,全体として信頼性の定量化を行えるようなCSIの方法を提案する.また,計算機実験において,提案手 法の妥当性を示す. |
(英) |
In data-driven science, classical statistical hypothesis testing does not provide an adequate reliability assessment because hypotheses are selected based on the data. To solve this problem, an approach called Conditional Selective Inference (CSI), which takes into account the hypotheses selected by data, has attracted much attention. Some literature proposed CSI for single feature selection algorithms such as marginal screening, Lasso, and sequential feature selection(SFS). However, in practical data analysis, a combination of multiple feature selection algorithms is sometimes used. In this paper, we propose a new method for quantifying reliability of multiple feature selection algorithms in combination using CSI. Additionally, we demonstrate the validity of the proposed method through numerical experiments. |
キーワード |
(和) |
条件付き選択的推論 / データ駆動型仮説 / マージナルスクリーニング / Lasso / SFS / / / |
(英) |
conditional SI / data-driven hypothesis / marginal screening / Lasso / SFS / / / |
文献情報 |
信学技報, vol. 123, no. 91, IBISML2023-1, pp. 1-8, 2023年6月. |
資料番号 |
IBISML2023-1 |
発行日 |
2023-06-22 (NC, IBISML) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NC2023-1 IBISML2023-1 |
|