講演抄録/キーワード |
講演名 |
2018-06-13 10:50
Post Clustering Inferenceとシングルセル解析への応用 ○井上茂乗・梅津佑太(名工大)・坪田庄真(名大)・竹内一郎(名工大/理研/物質・材料研究機構) IBISML2018-3 |
抄録 |
(和) |
顧客データや遺伝子発現量データなど, 背後に複数のサブグループをもつようなデータは数多く存在する. このようなデータに対する解析手法の一つにクラスタリングがある. クラスタリングは, 標本の類似度に基づき, データをいくつかのクラスタに分割し, 得られたクラスタに関する何らかの知見を得ることを目標とする. そのため, クラスタリング結果から各クラスタの特徴を吟味することは, データの本質的な構造を理解するうえでも非常に重要な課題である. これまで, 数多くのクラスタリング手法に関する研究が行われてきたが, クラスタリング後の各クラスタの特徴に関する統計的推論についての議論はほとんどない. 本研究では, $K$平均法適用後の各クラスタの特徴における仮説検定を, Selective Inferenceの枠組みで定式化する. 提案手法を人工データと医療分野において注目を集めているシングルセルデータに対して適用することで, その有用性を確認する. |
(英) |
There are many data with several subgroups, such as customer data and gene expression data and so on. One way to analyze such data is clustering. It aims to divide the data into several clusters based on the similarity of samples and obtain knowledge on the resulting clusters. Therefore, examining the features of each cluster from the result of clustering is a very important task for understanding the essential structure of data. Various clustering methods have been studied so far, but none of them have focused on statistical guarantee for the features after clustering. In this study, we develop the framework of selective inference for a hypothesis testing problem of the features in each cluster after $K$-means clustering. We confirm the usefulness of the proposed method through synthetic data and single cell data analysis. |
キーワード |
(和) |
仮説検定 / $K$平均法 / Post Selection Inference / シングルセルデータ / / / / |
(英) |
Hypothesis Testing / $K$-means Clustering / Post Selection Inference / Single Cell Data / / / / |
文献情報 |
信学技報, vol. 118, no. 81, IBISML2018-3, pp. 15-22, 2018年6月. |
資料番号 |
IBISML2018-3 |
発行日 |
2018-06-06 (IBISML) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
IBISML2018-3 |
|