お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2008-07-17 13:30
残響に頑健な音声認識のための前処理:音声特有の特徴の利用
Rico Petricドレスデン工科大)・Xugang Lu・○鵜木祐史赤木正人北陸先端大)・Ruediger Hoffmannドレスデン工科大SP2008-44
抄録 (和) 本論文では,残響環境に頑健な音声認識のための二つの前処理法を提案する.従
来法では,残響除去を行うために室内インパルス応答をブラインド推定し,その
逆フィルタを適用する.これに対し,提案法は音声特有の特徴に基づき,残響に
頑健な特徴を利用する.一つのは,調波性に基づく特徴分析であり,もう一つの
方法は,時間的パワーエンベロープに関する特徴分析である.前者は,音声の調
波成分を利点を利用するものであり,後者は,音声明瞭度に関連する音韻レベル
の時間特性を表す音声の時間的な振幅変調を利用するものである.両方とも,異
なる方法で,著しく認識精度を高めることができる.これらを組み合わせた方法
は,更に,個々の方法利点を共有することができる.ここでは,残響環境下の音
声認識に対するこの組合せ法の有効性を調べるために,それぞれの方法と組合せ
法を,静音環境と残響環境それぞれのトレーニング後にテストした.その結果,
強残響環境においても,提案法が残響環境でのトレーニングに対して実用的な性
能を得ることがわかった.ここでは,残響時間,話者ーマイクロホン間距離を条
件として認識性能を評価したことが新しい点である. 
(英) This paper proposes two methods of robust automatic speech recognition (ASR) in reverberant environments. Unlike other methods that mostly apply inverse filtering by blindly estimated room impulse responses to achieve dereverberation, the proposed methods are based on the utilization of speech properties. The first method -- Harmonicity-based Feature Analysis -- takes advantage of the harmonic components of speech, which are assumed to be undistorted. The second method -- Temporal Power Envelope Feature Analysis -- utilizes the temporal modulation structure of speech, containing most intelligibility information. Both methods increase recognition remarkably in different ways. Combining them connects their individual advantages. To evaluate the effectiveness of utilizing harmonicity and the modulation temporal structure for reverberant ASR, the methods were tested using clean and reverberant training. As the results revealed, even under strong reverberant conditions both methods obtained practical recognition rate for reverberant training. In addition, to test their dependency on the reverberation time, the speaker-to-microphone distance was tested, which is also one of the main contributions in this paper.
キーワード (和) 残響 / ロバスト音声認識 / 調波性に基づく特徴分析 / 時間パワーエンベロープに / / / /  
(英) reverberation / robust ASR / harmonicity based feature analysis / temporal power envelope feature analysis / / / /  
文献情報 信学技報, vol. 108, no. 142, SP2008-44, pp. 7-12, 2008年7月.
資料番号 SP2008-44 
発行日 2008-07-10 (SP) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード SP2008-44

研究会情報
研究会 SP  
開催期間 2008-07-17 - 2008-07-19 
開催地(和) 岩手県大 
開催地(英) Iwate Prefectural Univ. 
テーマ(和) 認識,理解,対話,一般 
テーマ(英) Speech Recognition, Speech Understanding, Speech Dialogue, etc. 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2008-07-SP 
本文の言語 英語(日本語タイトルあり) 
タイトル(和) 残響に頑健な音声認識のための前処理:音声特有の特徴の利用 
サブタイトル(和)  
タイトル(英) Robust Front End Processing for Speech Recognition in Reverberant Environments: Utilization of Speech Properties 
サブタイトル(英)  
キーワード(1)(和/英) 残響 / reverberation  
キーワード(2)(和/英) ロバスト音声認識 / robust ASR  
キーワード(3)(和/英) 調波性に基づく特徴分析 / harmonicity based feature analysis  
キーワード(4)(和/英) 時間パワーエンベロープに / temporal power envelope feature analysis  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) Rico Petric / Rico Petric /
第1著者 所属(和/英) ドレスデン工科大学 (略称: ドレスデン工科大)
Dresden Univercity of Technology (略称: Dresden Univ. of Tech)
第2著者 氏名(和/英/ヨミ) Xugang Lu / Xugang Lu /
第2著者 所属(和/英) 北陸先端科学技術大学院大学 (略称: 北陸先端大)
Japan Advanced Institute of Sicence and Technology (略称: JAIST)
第3著者 氏名(和/英/ヨミ) 鵜木 祐史 / Masashi Unoki / ウノキ マサシ
第3著者 所属(和/英) 北陸先端科学技術大学院大学 (略称: 北陸先端大)
Japan Advanced Institute of Sicence and Technology (略称: JAIST)
第4著者 氏名(和/英/ヨミ) 赤木 正人 / Masato Akagi / アカギ マサト
第4著者 所属(和/英) 北陸先端科学技術大学院大学 (略称: 北陸先端大)
Japan Advanced Institute of Sicence and Technology (略称: JAIST)
第5著者 氏名(和/英/ヨミ) Ruediger Hoffmann / Ruediger Hoffmann /
第5著者 所属(和/英) ドレスデン工科大学 (略称: ドレスデン工科大)
Dresden Univercity of Technology (略称: Dresden Univ. of Tech)
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第3著者 
発表日時 2008-07-17 13:30:00 
発表時間 30分 
申込先研究会 SP 
資料番号 SP2008-44 
巻番号(vol) vol.108 
号番号(no) no.142 
ページ範囲 pp.7-12 
ページ数
発行日 2008-07-10 (SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会