講演抄録/キーワード |
講演名 |
2016-08-24 16:15
[ポスター講演]音声のスペクトル領域とケプストラム領域における同時強調 ○李 莉(筑波大)・亀岡弘和・樋口卓哉(NTT)・猿渡 洋(東大)・牧野昭二(筑波大) SP2016-32 |
抄録 |
(和) |
従来の音声強調法は特徴量強調法と信号強調法に大別される.
前者は音声特徴量を直接的に強調するため,特に雑音特性が既知の場合において音声認識などの性能向上に直結する一方で,未知雑音環境にいかに対応するかが重要課題である.
後者は音声スペクトルモデルとスペクトル領域において音声と雑音の成分が加法的な関係にあることを利用できるため,未知雑音環境においても高い信号復元精度を実現できる一方で,音声特徴量が直接的に強調できるとは限らず音声認識などの性能に必ずしも直結しない傾向があった.
そこで,本研究では両者の長所を併せ持つ新しい音声強調法の枠組を提案する.
さらに,シミュレーション実験で提案手法の有効性を実証する. |
(英) |
While spectral domain speech enhancement algorithms using non-negative matrix factorization (NMF) are powerful in terms of signal recovery accuracy (e.g., signal-to-noise ratio), they do not necessarily lead to an improvement in the quality of the enhanced speech in the feature domain.
This implies that naively using these algorithms as front-end processing for e.g., speech recognition and speech conversion does not always lead to satisfactory results.
To address this problem, this paper proposes a novel method that aims to jointly enhance the spectral and cepstral sequences of noisy speech, by optimizing a combined objective function consisting of an NMF-based model-fitting criterion defined in the spectral domain and a Gaussian mixture model (GMM)-based probability distribution defined in the cepstral domain. |
キーワード |
(和) |
音声強調 / 非負値行列因子分解 / 補助関数法 / メル周波数ケプストラム係数 / 混合正規分布 / / / |
(英) |
speech enhancement / Gaussian mixture model / non-negative matrix factorization / mel-frequency cepstral coefficients / majorization-minimization / / / |
文献情報 |
信学技報, vol. 116, no. 189, SP2016-32, pp. 29-32, 2016年8月. |
資料番号 |
SP2016-32 |
発行日 |
2016-08-17 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2016-32 |