講演抄録/キーワード |
講演名 |
2018-11-05 15:10
[ポスター講演]階層型クラスタリングに基づく特徴選択のためのSelective Inference ○鈴木健太・井上茂乗・梅津佑太(名工大)・竹内一郎(名工大/物質・材料研究機構/理研) IBISML2018-70 |
抄録 |
(和) |
遺伝子発現量データや顧客の購買履歴データなど, 背後に複数のクラスタを持つデータを分析し, 各クラスタに特有の傾向を発見することは重要な課題である. このような分析を行う際には, まず, クラスタリングによって複数のクラスタに分割する. そして, 各クラスタに固有の特徴を持つ変数の同定を行う. しかし, このようなクラスタリング後の推論を行う場合, クラスタリングによって生じるバイアスを考慮し, 適切に補正する必要がある. 本研究では, まず, クラスタごとで異なる平均構造をもつデータに対し, 階層型クラスタリングの一つであるウォード法を適用し, クラスタの階層構造を得る. 次に, Selective Inferenceの枠組みを利用することで, 各階層で得られたクラスタにおける各変数での検定を提案する. さらに, 人工データと実データの数値実験により, 提案手法の有用性を確認する. |
(英) |
It is important to find characteristic features behind the data from, e.g., gene expression level or customer's purchase history, by conducting clustering analysis. In this scenario, we first make clusters by some specific clustering methods, and then identify features those are characteristic to each cluster. However, when we perform a statistical inference after clustering, we have to take into account the bias suffered from the clustering and to correct it appropriately. In this paper, we first apply Ward method which is a famous one for hierarchical clustering to obtain a dendrogram. After that, we perform hypothesis testing for each variable in each branch by exploiting the framework of Selective Inference. Finally, we confirm the performance of the proposed method through synthetic and real data analysis. |
キーワード |
(和) |
仮説検定 / 階層型クラスタリング / ウォード法 / Selective Inference / / / / |
(英) |
Hypothesis testing / Hierarchical Clustering / Ward Method / Selective Inference / / / / |
文献情報 |
信学技報, vol. 118, no. 284, IBISML2018-70, pp. 197-204, 2018年11月. |
資料番号 |
IBISML2018-70 |
発行日 |
2018-10-29 (IBISML) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
IBISML2018-70 |
|