お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2010-06-11 11:30
線形予測に基づいた骨導音声回復法の総合評価
Phung Trung-Nghia鵜木祐史赤木正人北陸先端大EA2010-31
抄録 (和) 高騒音環境下での音声コミュニケーションを実現するために,雑音の影響を最も受け易い気導音声の代わりに骨導音声を利用することは,非常に有効な手段の一つである.しかし,骨導音声は,雑音に対して頑健であるものの,その音質や明瞭度に関しては,骨伝導の影響により著しく低下してしまうという問題があるため,骨導音声の音質や明瞭度を回復するための手法が必要とされている.著者らは,この課題に対する有効な方法として,SRNベースの予測法を組み込んだ線形予測分析に基づいたブラインド回復法を提案した.しかし,高騒音環境での性能評価,SRNベースの学習/予測法の改良,LP残差比の動的操作,といった検討課題が残っていた. 本稿では,SRNベースの学習/予測法をGMMベースのものに改良し,LP残差比をセグメント単位に推定する方法を提案する.高騒音環境において,従来法と改良法の性能を評価するために,ここでは,音質ならびに明瞭度の回復について,客観評価(PESQ, LSD, CD)ならびに主観評価実験(単語了解度試験)を行った.総合評価の結果,両方法とも,高騒音環境で骨導音声の音質・明瞭度を有効に回復できることがわかった.また,GMMベースのものがSRNベースのものよりも有効に機能することもわかった. 
(英) The restoration of bone-conducted (BC) speech is a very important issue for robust speech communication in extremely noisy environments. In our previous studies, we proposed a blind restoration method based on liner-prediction (LP) scheme with a prediction method based on the Simple Recurrent Neural network (SRN). However, this has not yet been shown their ability for blindly restoring BC speech in high noisy environments. In addition, since SRN-based prediction is not suitable for training with the huge corpus, the over-training problem of SRN makes difficult to train various kinds of BC speech in one session. Thus, in this paper, we use a prediction method based on the Gaussian Mixture Model (GMM) instead of SRN. We also modify a method for estimating the LP residual ratio. We then investigate whether how the method works to restore BC speech in high noisy environments. Objective and subjective evaluations were carried out to evaluate the improvements in sound quality and intelligibility of the restored speech. The results revealed that our proposed LP-GMM method outperforms the original LP-SRN method and both of the two methods can adequately improve the voice quality and intelligibility of BC speech, in clean and high noisy environments.
キーワード (和) 線形予測 / 骨導音声 / ブラインド回復 / GMM / 音声明瞭度 / / /  
(英) linear prediction / bone-conducted speech / blind restoration / GMM / speech intelligibility / / /  
文献情報 信学技報, vol. 110, no. 71, EA2010-31, pp. 53-58, 2010年6月.
資料番号 EA2010-31 
発行日 2010-06-03 (EA) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード EA2010-31

研究会情報
研究会 EA  
開催期間 2010-06-10 - 2010-06-11 
開催地(和) 北海道医療大学 
開催地(英) Health Sci. Univ. of Hokkaido 
テーマ(和) 応用(電気)音響/音楽音響/聴覚 
テーマ(英) Engineering/Electro Acoustics, Musical Acoustics, Psychological and Physiological Acoustics, and Related Topics 
講演論文情報の詳細
申込み研究会 EA 
会議コード 2010-06-EA 
本文の言語 英語(日本語タイトルあり) 
タイトル(和) 線形予測に基づいた骨導音声回復法の総合評価 
サブタイトル(和)  
タイトル(英) Comparative evaluation of bone-conducted-speech restoration based on linear prediction scheme 
サブタイトル(英)  
キーワード(1)(和/英) 線形予測 / linear prediction  
キーワード(2)(和/英) 骨導音声 / bone-conducted speech  
キーワード(3)(和/英) ブラインド回復 / blind restoration  
キーワード(4)(和/英) GMM / GMM  
キーワード(5)(和/英) 音声明瞭度 / speech intelligibility  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) Phung Trung-Nghia / Trung-Nghia Phung /
第1著者 所属(和/英) 北陸先端科学技術大学院大学 (略称: 北陸先端大)
Japan Advanced Institute of Science and Technology (略称: JAIST)
第2著者 氏名(和/英/ヨミ) 鵜木 祐史 / Masashi Unoki / ウノキ マサシ
第2著者 所属(和/英) 北陸先端科学技術大学院大学 (略称: 北陸先端大)
Japan Advanced Institute of Science and Technology (略称: JAIST)
第3著者 氏名(和/英/ヨミ) 赤木 正人 / Masato Akagi / アカギ マサト
第3著者 所属(和/英) 北陸先端科学技術大学院大学 (略称: 北陸先端大)
Japan Advanced Institute of Science and Technology (略称: JAIST)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2010-06-11 11:30:00 
発表時間 30分 
申込先研究会 EA 
資料番号 EA2010-31 
巻番号(vol) vol.110 
号番号(no) no.71 
ページ範囲 pp.53-58 
ページ数
発行日 2010-06-03 (EA) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会