講演抄録/キーワード |
講演名 |
2009-12-22 15:50
音声信号の2重自己相関関数のスペクトル表現とその雑音環境下単語認識システムへの応用 ○Nguyen Ngoc Dinh・島村徹也(埼玉大) NLC2009-22 SP2009-86 |
抄録 |
(和) |
本論文では雑音環境下での音声認識システムのための新しいスペクトル表現,2重自己相関関数のスペクトル表現,を提案する.この方法では,初めに,“un-windowed”タイプの自己相関関数(ACF)を使って,4つフレームの音声信号から,2つフレームの自己相関系列を算出し,その2つのフレームの自己相関系列から,改めてACFを使って,自己相関系列を求める.結果として,1つのフレームの2重自己相関系列を得る.その2重自己相関系列を音声信号の代わりに線形予測分析(LPC分析)の入力として用い,2重自己相関系列のLPCスペクトルを求める. 実験では,Likelihood ratioスペクトル歪み推定で,提案法が白色ガウス雑音に対する耐性を改善できることを示す.また,提案スペクトル表現から構成された特徴ベクトルを用い,白色ガウス雑音環境下で単語認識を行い,10dB以下の強雑音環境の場合に従来法より高い認識率が得られることを示す.
キーワード 2重自己相関関数,線形予測分析,スペクトル表現,スペクトル歪み推定,雑音環境下単語認識,信号雑音比,白色ガウス雑音 |
(英) |
In this paper, we propose a new spectral representation for noisy word recognition system, that we call Spectral Representation of Double Autocorrelation Function. In this method, we, firstly, calculate 2 frames of autocorrelation sequence from 4 frames of speech signal by using “un-windowed type” of autocorrelation function (ACF). Then 1 frame of autocorrelation sequence is calculated from the resulting autocorrelation sequence at the first step by using the same “un-windowed type” of ACF. This results in double autocorrelation sequence, which is used as the input of Linear Predictive Coding (LPC) analysis. We demonstrate the robustness of the proposed spectral representation against white Gaussian noise in term of Likelihood ratio spectral distortion measure. A word recognition system that uses feature vectors built from the proposed spectral representation is also implemented. The results show a better performance than other conventional methods when be used in white Gaussian noisy environment of SNR less than 10dB. |
キーワード |
(和) |
2重自己相関関数 / 線形予測分析 / スペクトル表現 / スペクトル歪み推定 / 雑音環境下単語認識 / 信号雑音比 / 白色ガウス雑音 / |
(英) |
double autocorrelation function / LPC / spectral representation / spectral distortion measure / noisy word recognition / SNR / white Gaussian noise / |
文献情報 |
信学技報, vol. 109, no. 356, SP2009-86, pp. 135-140, 2009年12月. |
資料番号 |
SP2009-86 |
発行日 |
2009-12-14 (NLC, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2009-22 SP2009-86 |
研究会情報 |
研究会 |
SP NLC |
開催期間 |
2009-12-21 - 2009-12-22 |
開催地(和) |
東京大学・山上会館 |
開催地(英) |
Univ. of Tokyo |
テーマ(和) |
第11回音声言語シンポジウム(SP・NLC共催/SLP連催) |
テーマ(英) |
11th Spoken Language Symposium (SP/NLC/SLP) |
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2009-12-SP-NLC |
本文の言語 |
日本語 |
タイトル(和) |
音声信号の2重自己相関関数のスペクトル表現とその雑音環境下単語認識システムへの応用 |
サブタイトル(和) |
|
タイトル(英) |
Spectral Representation of Double Autocorrelation Functions for Speech Signals and Its Application to Noisy Word Recognition System |
サブタイトル(英) |
|
キーワード(1)(和/英) |
2重自己相関関数 / double autocorrelation function |
キーワード(2)(和/英) |
線形予測分析 / LPC |
キーワード(3)(和/英) |
スペクトル表現 / spectral representation |
キーワード(4)(和/英) |
スペクトル歪み推定 / spectral distortion measure |
キーワード(5)(和/英) |
雑音環境下単語認識 / noisy word recognition |
キーワード(6)(和/英) |
信号雑音比 / SNR |
キーワード(7)(和/英) |
白色ガウス雑音 / white Gaussian noise |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
Nguyen Ngoc Dinh / Nguyen Ngoc Dinh / グェン ゴック ディン |
第1著者 所属(和/英) |
埼玉大学 (略称: 埼玉大)
Saitama University (略称: Saitama Univ.) |
第2著者 氏名(和/英/ヨミ) |
島村 徹也 / Tetsuya Shimamura / シマムラ テツヤ |
第2著者 所属(和/英) |
埼玉大学 (略称: 埼玉大)
Saitama University (略称: Saitama Univ.) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2009-12-22 15:50:00 |
発表時間 |
120分 |
申込先研究会 |
SP |
資料番号 |
NLC2009-22, SP2009-86 |
巻番号(vol) |
vol.109 |
号番号(no) |
no.355(NLC), no.356(SP) |
ページ範囲 |
pp.135-140 |
ページ数 |
6 |
発行日 |
2009-12-14 (NLC, SP) |