音声のスペクトル領域とケプストラム領域における同時強調

李,莉; 亀岡,弘和; 樋口,卓哉; 猿渡,洋; 牧野,昭二

ご案内入会して研究会活動をもっとお得に！研究会参加費・年間登録費が会員価格になります。
お知らせ【重要】研究会参加費の支払いおよび原稿アップロード手続きの変更に関するご案内

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2016-08-24 16:15 ［ポスター講演］音声のスペクトル領域とケプストラム領域における同時強調 ○李　莉（筑波大）・亀岡弘和・樋口卓哉（NTT）・猿渡　洋（東大）・牧野昭二（筑波大） SP2016-32
抄録	（和）	従来の音声強調法は特徴量強調法と信号強調法に大別される．前者は音声特徴量を直接的に強調するため，特に雑音特性が既知の場合において音声認識などの性能向上に直結する一方で，未知雑音環境にいかに対応するかが重要課題である．後者は音声スペクトルモデルとスペクトル領域において音声と雑音の成分が加法的な関係にあることを利用できるため，未知雑音環境においても高い信号復元精度を実現できる一方で，音声特徴量が直接的に強調できるとは限らず音声認識などの性能に必ずしも直結しない傾向があった．そこで，本研究では両者の長所を併せ持つ新しい音声強調法の枠組を提案する．さらに，シミュレーション実験で提案手法の有効性を実証する．
	（英）	While spectral domain speech enhancement algorithms using non-negative matrix factorization (NMF) are powerful in terms of signal recovery accuracy (e.g., signal-to-noise ratio), they do not necessarily lead to an improvement in the quality of the enhanced speech in the feature domain. This implies that naively using these algorithms as front-end processing for e.g., speech recognition and speech conversion does not always lead to satisfactory results. To address this problem, this paper proposes a novel method that aims to jointly enhance the spectral and cepstral sequences of noisy speech, by optimizing a combined objective function consisting of an NMF-based model-fitting criterion defined in the spectral domain and a Gaussian mixture model (GMM)-based probability distribution defined in the cepstral domain.
キーワード	（和）	音声強調 / 非負値行列因子分解 / 補助関数法 / メル周波数ケプストラム係数 / 混合正規分布 / / /
	（英）	speech enhancement / Gaussian mixture model / non-negative matrix factorization / mel-frequency cepstral coefficients / majorization-minimization / / /
文献情報		信学技報, vol. 116, no. 189, SP2016-32, pp. 29-32, 2016年8月.
資料番号		SP2016-32
発行日		2016-08-17 (SP)
ISSN		Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380
著作権について		技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します．(許諾番号：10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード		SP2016-32

研究会情報
研究会	SP
開催期間	2016-08-24 - 2016-08-25
開催地（和）	京都大学学術情報メディアセンター
開催地（英）	ACCMS, Kyoto Univ.
テーマ（和）	音響イベント処理，一般
テーマ（英）	Audio event processing, etc.
講演論文情報の詳細
申込み研究会	SP
会議コード	2016-08-SP
本文の言語	日本語
タイトル（和）	音声のスペクトル領域とケプストラム領域における同時強調
サブタイトル（和）
タイトル（英）	Joint Enhancement of Spectral and Cepstral Sequences of Noisy Speech
サブタイトル（英）
キーワード(1)（和/英）	音声強調 / speech enhancement
キーワード(2)（和/英）	非負値行列因子分解 / Gaussian mixture model
キーワード(3)（和/英）	補助関数法 / non-negative matrix factorization
キーワード(4)（和/英）	メル周波数ケプストラム係数 / mel-frequency cepstral coefficients
キーワード(5)（和/英）	混合正規分布 / majorization-minimization
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	李莉 / Li Li / リィリィ
第1著者所属（和/英）	筑波大学 (略称：筑波大) University of Tsukuba (略称： Univ.Tsukuba)
第2著者氏名（和/英/ヨミ）	亀岡弘和 / Hirokazu Kameoka / カメオカヒロカズ
第2著者所属（和/英）	日本電信電話株式会社 (略称： NTT) Nippon Telegraph and Telephone Corporation (略称： NTT)
第3著者氏名（和/英/ヨミ）	樋口卓哉 / Takuya Higuchi / ヒグチタクヤ
第3著者所属（和/英）	日本電信電話株式会社 (略称： NTT) Nippon Telegraph and Telephone Corporation (略称： NTT)
第4著者氏名（和/英/ヨミ）	猿渡洋 / Hiroshi Saruwatari / サルワタリヒロシ
第4著者所属（和/英）	東京大学 (略称：東大) University of Tokyo (略称： Univ.Tokyo)
第5著者氏名（和/英/ヨミ）	牧野昭二 / Shoji Makino / マキノショウジ
第5著者所属（和/英）	筑波大学 (略称：筑波大) University of Tsukuba (略称： Univ.Tsukuba)
第6著者氏名（和/英/ヨミ）	/ /
第6著者所属（和/英）	(略称： ) (略称： )
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
第21著者氏名（和/英/ヨミ）	/ /
第21著者所属（和/英）	(略称： ) (略称： )
第22著者氏名（和/英/ヨミ）	/ /
第22著者所属（和/英）	(略称： ) (略称： )
第23著者氏名（和/英/ヨミ）	/ /
第23著者所属（和/英）	(略称： ) (略称： )
第24著者氏名（和/英/ヨミ）	/ /
第24著者所属（和/英）	(略称： ) (略称： )
第25著者氏名（和/英/ヨミ）	/ /
第25著者所属（和/英）	(略称： ) (略称： )
第26著者氏名（和/英/ヨミ）	/ /
第26著者所属（和/英）	(略称： ) (略称： )
第27著者氏名（和/英/ヨミ）	/ /
第27著者所属（和/英）	(略称： ) (略称： )
第28著者氏名（和/英/ヨミ）	/ /
第28著者所属（和/英）	(略称： ) (略称： )
第29著者氏名（和/英/ヨミ）	/ /
第29著者所属（和/英）	(略称： ) (略称： )
第30著者氏名（和/英/ヨミ）	/ /
第30著者所属（和/英）	(略称： ) (略称： )
第31著者氏名（和/英/ヨミ）	/ /
第31著者所属（和/英）	(略称： ) (略称： )
第32著者氏名（和/英/ヨミ）	/ /
第32著者所属（和/英）	(略称： ) (略称： )
第33著者氏名（和/英/ヨミ）	/ /
第33著者所属（和/英）	(略称： ) (略称： )
第34著者氏名（和/英/ヨミ）	/ /
第34著者所属（和/英）	(略称： ) (略称： )
第35著者氏名（和/英/ヨミ）	/ /
第35著者所属（和/英）	(略称： ) (略称： )
第36著者氏名（和/英/ヨミ）	/ /
第36著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2016-08-24 16:15:00
発表時間	90分
申込先研究会	SP
資料番号	SP2016-32
巻番号（vol）	vol.116
号番号（no）	no.189
ページ範囲	pp.29-32
ページ数	4
発行日	2016-08-17 (SP)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会