講演抄録/キーワード |
講演名 |
2012-03-12 16:55
無限長モデル距離を用いた異種時系列クラスタリング ○広瀬俊亮・泉水克之(SAS) IBISML2011-97 |
抄録 |
(和) |
本稿では長さと位相が異なる時系列のクラスタリング(異種時系列クラスタリング) の問題を取り扱う。時系列クラスタリングは、基礎的かつ応用範囲の広い分析手法である。他のクラスタリング問題を扱う場合と比べて、時系列クラスタリングで特に問題となるのが時系列間の距離である。異なる長さと位相を持つ時系列(異種時系列) をどのように比較すれば良いかは自明ではなく、不適切な距離を採用すれば無意味な結果しか得られない。特に、位相差
を無視して時系列をクラスタリングするとデータに含まれる特徴的なパターンの情報を含まない無意味なクラスター中心が得られるという問題は「正弦波問題」としてよく知られている。
本稿では異種時系列クラスタリングの手法を提案する。提案手法の核となるアイデアは時系列間の距離として観測されたデータ間の距離ではなくデータから学習されたモデル間の距離(KL 距離) を用いてクラスタリングを実行することである。この方法を採用する利点は以下の二点である:(1) KL 距離を計算する際の積分範囲を揃えることで異なる長さの観測データを直接比較でき、(2) KL距離の積分範囲の端(初期状態・境界条件) を固定することで位相を揃えた比較ができる。このため、提案手法によって長さと位相の異なる時系列のクラスタリングを実現できる。 |
(英) |
This paper addresses the issue of heterogeneous time series clustering, which means clustering of time series having various phases and various length. Time series clustering is a data analysis method, which is basic
and has wide variety of applications. Comparing with the other clustering tasks, we usually face a problem of a distance function, in the case of time series clustering. This is because it is not trivial how to compare time series having different length and different phases. If we employ an inappropriate distance, meaningless results are derived.
Especially, it is well known as “sine wave problem” that time series clustering without taking into account phase difference usually derives meaningless cluster centers, which have no information of the observed time series.
We propose a method for heterogeneous time series clustering. The key idea of the method is that we do not employ distance
between observed time series but employ distance between models learned from observed time series (namely we employ KL distance). The reasons for this employment are as follows: (1) We can directly compare time series of different length by employing the same integral ranges in the calculation of KL distance between two models, and (2) we can align the phases by giving the same intial conditions ( boundary conditions or the lower edges of the integral ranges) to two time series. Therefore we can conduct clustering of time series having various length and various phases by empoying the proposed method. |
キーワード |
(和) |
異種時系列クラスタリング / 無限長モデル距離 / Szegoの定理 / / / / / |
(英) |
heterogeneous time series clustering / infinite-length model distance / Szego theorem / / / / / |
文献情報 |
信学技報, vol. 111, no. 480, IBISML2011-97, pp. 69-76, 2012年3月. |
資料番号 |
IBISML2011-97 |
発行日 |
2012-03-05 (IBISML) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
IBISML2011-97 |
研究会情報 |
研究会 |
IBISML |
開催期間 |
2012-03-12 - 2012-03-13 |
開催地(和) |
統計数理研究所 |
開催地(英) |
The Institute of Statistical Mathematics |
テーマ(和) |
統計数理、データベース、一般 |
テーマ(英) |
Mathematical Statistics, Databases, etc. |
講演論文情報の詳細 |
申込み研究会 |
IBISML |
会議コード |
2012-03-IBISML |
本文の言語 |
日本語 |
タイトル(和) |
無限長モデル距離を用いた異種時系列クラスタリング |
サブタイトル(和) |
|
タイトル(英) |
Heterogeneous Time Series Clustering based on Infinite-Length Model Distance |
サブタイトル(英) |
|
キーワード(1)(和/英) |
異種時系列クラスタリング / heterogeneous time series clustering |
キーワード(2)(和/英) |
無限長モデル距離 / infinite-length model distance |
キーワード(3)(和/英) |
Szegoの定理 / Szego theorem |
キーワード(4)(和/英) |
/ |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
広瀬 俊亮 / Shunsuke Hirose / ヒロセ シュンスケ |
第1著者 所属(和/英) |
SAS Institute Japan (略称: SAS)
SAS Institute Japan (略称: SAS) |
第2著者 氏名(和/英/ヨミ) |
泉水 克之 / Katsuyuki Izumi / |
第2著者 所属(和/英) |
SAS Institute Japan (略称: SAS)
SAS Institute Japan (略称: SAS) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2012-03-12 16:55:00 |
発表時間 |
25分 |
申込先研究会 |
IBISML |
資料番号 |
IBISML2011-97 |
巻番号(vol) |
vol.111 |
号番号(no) |
no.480 |
ページ範囲 |
pp.69-76 |
ページ数 |
8 |
発行日 |
2012-03-05 (IBISML) |