講演抄録/キーワード |
講演名 |
2013-01-21 15:35
LZ78符号に基づく交叉符号化とその応用 ○樫原崇人(徳島大)・大濱靖匡(電通大) IT2012-57 |
抄録 |
(和) |
武内と大濱は,交叉符号化とよばれる新しい符号化手法に基づく類似尺度
を提案し,データクラスタリングにおけるその有用性を明らかにした.
この研究では,交叉符号化の基礎となる符号化法として,データから
計算される文脈木を符号化に利用する算術符号化法が使われていた.
本稿では,交叉符号化の基礎となる符号化法として,新たにデータ
から計算される辞書を利用するLZ78符号化に基づく交叉符号化法を提案
する.さらに提案した交叉符号化法に基づく類似尺度を用いて,
データクラスタリングに適用し,その有効性を検討する. |
(英) |
Takeuchi and Oohama proposed a universal similarity metric based
on a new encoding method called the cross coding. They apply this metric
to the data clustering and evaluated its effectiveness.
The cross coding proposed by them is based on an online
adaptive data compression scheme using the context tree model.
In this paper we propose a new cross coding based on an online adaptive
data compression scheme proposed by Lempel and Ziv in 1978. This data
compression scheme uses a dictionary computed from the text data.
Application of our method to the data clustering is also discussed. |
キーワード |
(和) |
交叉符号化 / LZ78符号 / 汎用類似尺度 / NCD / CCD / / / |
(英) |
Cross Coding / LZ78 Code / universal similarity metric / Normalized Compression Distance / Cross Coding Distance / / / |
文献情報 |
信学技報, vol. 112, no. 382, IT2012-57, pp. 47-52, 2013年1月. |
資料番号 |
IT2012-57 |
発行日 |
2013-01-14 (IT) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
IT2012-57 |