講演抄録/キーワード |
講演名 |
2009-06-26 14:00
変調伝達関数に基づいた骨導音声ブラインド回復法の検討 衣笠光太・鵜木祐史・○赤木正人(北陸先端大) EA2009-31 |
抄録 |
(和) |
骨導音声は,外部雑音の影響を受け難いため,高騒音環境での音声コミュニケーションに有用である.しかし,骨導音声の音質や明瞭度は,それに対応する気導音声に比べ著しく低下するため,何らかの骨導音声の回復処理が必要である.本稿では,変調伝達関数(MTF)の概念に基づいた骨導音声ブラインド回復法を提案する.ここでは,いくつかの評価尺度を利用して大規模な気導・骨導音声データを分析することで,気導音声から骨導音声への変換関係を調査した.また,気導音声と骨導音声の帯域毎のパワーエンベロープ間の関係をMTFとしてモデル化し,骨導音声回復に必要なMTFモデルのパラメータ値を求める方法を考案した.音質・音声明瞭度ならびに重要な特徴量の改善度合を調べるために,対数スペクトル歪(LSD)と明瞭度指数の重み付きLSD,線形予測係数やメルケプストラム係数に基づいた距離尺度を利用して提案手法を評価した.この結果,提案手法が気導音声を利用せずに,ブラインド回復法として,骨導音声の音質・明瞭度ならびに重要な特徴を適切に改善できることがわかった. |
(英) |
Bone-conducted (BC) speech is more advantageous for speech communication in extremely noisy environments because of its stability against surrounding noise. However, both the sound quality and intelligibility of BC speech are very poor so that restoring BC speech is both an important task. We propose a method of blind restoration for improving BC speech based on the concept of the modulation transfer function (MTF). We investigated the relationship between air-conducted (AC) and BC speech signals by analyzing an AC/BC speech database using several measures for evaluation. We then modeled these relations between the power envelopes of AC and BC speech signals as MTF. We propose a method of determining the parameters of the MTF-based model without AC speech. Log-spectrum distortion (LSD) and speech intelligibility weighted LSD were used to evaluate the improvements in intelligibility, which are useful for human-hearing systems. The distances based on LP coefficients and mel-frequency cepstral coefficients were used to evaluate the improvements in cepstral distances that are useful for ASR systems. The results revealed that the new model can adequately improve the intelligibility of BC speech. |
キーワード |
(和) |
骨導音声 / 気導音声 / 変調伝達関数 / パワーエンベロープ逆フィルタ法 / ブラインド回復 / / / |
(英) |
Bone-conducted speech / Air-conducted speech / Modulation transfer function / Power envelope inverse filtering / Blind restoration / / / |
文献情報 |
信学技報, vol. 109, no. 100, EA2009-31, pp. 79-84, 2009年6月. |
資料番号 |
EA2009-31 |
発行日 |
2009-06-18 (EA) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2009-31 |