音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識

藤本,雅清; 石塚,健太郎; 中谷,智広

ご案内入会して研究会活動をもっとお得に！研究会参加費・年間登録費が会員価格になります。
お知らせ【重要】研究会参加費の支払いおよび原稿アップロード手続きの変更に関するご案内

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2008-12-09 10:50 音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識 ○藤本雅清・石塚健太郎・中谷智広（NTT） NLC2008-26 SP2008-81
抄録	（和）	本研究では，雑音下音声認識における頑健なフロントエンド処理について述べる．提案するフロントエンド処理は音声区間検出（VAD: Voice Activity Detection）と雑音抑圧を統合した処理となっており，(1) 確率モデルの共有，(2) 音声／非音声状態確率を用いたWienerフィルタ設計，(3) 雑音抑圧音声を用いたVAD性能の改善の3点が手法を構成する大きな要素となっている．また提案手法は逐次処理によりフレーム遅延無しで処理を行うことが可能である．本研究では提案手法を用いることにより，連続発話音声の認識をフレーム遅延無しで実行し，かつ認識性能の大幅な改善が得られることを示す．また，CMNと音響モデルの逐次適応との併用による評価についても述べる．
	（英）	This paper addresses robust front-end processing for automatic speech recognition in noise. The proposed method integrates voice activity detection (VAD) and noise suppression, and consists of three core techniques, i.e., (1) statistical model sharing, (2) Wiener filter design by using speech / non-speech probabilities, and (3) VAD improvement by using enhance speech. In addition, the proposed method can perform sequential processing without frame delay. In an evaluation, the proposed method significantly improves accuracy of concatenated speech recognition without frame delay. In addition, we investigate to combine cepstrum mean normalization and sequential acoustic model adaptation with the proposed method.
キーワード	（和）	統合的フロントエンド処理 / 音声区間検出 / 雑音抑圧 / 逐次処理 / 音声認識 / / /
	（英）	integrated front-end processing / voice activity detection / noise suppression / sequential processing / speech recognition / / /
文献情報		信学技報, vol. 108, no. 338, SP2008-81, pp. 13-18, 2008年12月.
資料番号		SP2008-81
発行日		2008-12-02 (NLC, SP)
ISSN		Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380
著作権について		技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します．(許諾番号：10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード		NLC2008-26 SP2008-81

研究会情報
研究会	SP NLC
開催期間	2008-12-09 - 2008-12-10
開催地（和）	早稲田大学（小野記念講堂）
開催地（英）	Waseda Univ.
テーマ（和）	第10回音声言語シンポジウム（SP/NLC/SLP共催）
テーマ（英）
講演論文情報の詳細
申込み研究会	SP
会議コード	2008-12-SP-NLC
本文の言語	日本語
タイトル（和）	音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識
サブタイトル（和）
タイトル（英）	Noisy speech recognition using integrated method of statistical model-based voice activity detection and noise suppression
サブタイトル（英）
キーワード(1)（和/英）	統合的フロントエンド処理 / integrated front-end processing
キーワード(2)（和/英）	音声区間検出 / voice activity detection
キーワード(3)（和/英）	雑音抑圧 / noise suppression
キーワード(4)（和/英）	逐次処理 / sequential processing
キーワード(5)（和/英）	音声認識 / speech recognition
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	藤本雅清 / Masakiyo Fujimoto / フジモトマサキヨ
第1著者所属（和/英）	日本電信電話株式会社 (略称： NTT) NTT Corporation (略称： NTT Corporation)
第2著者氏名（和/英/ヨミ）	石塚健太郎 / Kentaro Ishizuka / イシヅカケンタロウ
第2著者所属（和/英）	日本電信電話株式会社 (略称： NTT) NTT Corporation (略称： NTT Corporation)
第3著者氏名（和/英/ヨミ）	中谷智広 / Tomohiro Nakatani / ナカタニトモヒロ
第3著者所属（和/英）	日本電信電話株式会社 (略称： NTT) NTT Corporation (略称： NTT Corporation)
第4著者氏名（和/英/ヨミ）	/ /
第4著者所属（和/英）	(略称： ) (略称： )
第5著者氏名（和/英/ヨミ）	/ /
第5著者所属（和/英）	(略称： ) (略称： )
第6著者氏名（和/英/ヨミ）	/ /
第6著者所属（和/英）	(略称： ) (略称： )
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
第21著者氏名（和/英/ヨミ）	/ /
第21著者所属（和/英）	(略称： ) (略称： )
第22著者氏名（和/英/ヨミ）	/ /
第22著者所属（和/英）	(略称： ) (略称： )
第23著者氏名（和/英/ヨミ）	/ /
第23著者所属（和/英）	(略称： ) (略称： )
第24著者氏名（和/英/ヨミ）	/ /
第24著者所属（和/英）	(略称： ) (略称： )
第25著者氏名（和/英/ヨミ）	/ /
第25著者所属（和/英）	(略称： ) (略称： )
第26著者氏名（和/英/ヨミ）	/ /
第26著者所属（和/英）	(略称： ) (略称： )
第27著者氏名（和/英/ヨミ）	/ /
第27著者所属（和/英）	(略称： ) (略称： )
第28著者氏名（和/英/ヨミ）	/ /
第28著者所属（和/英）	(略称： ) (略称： )
第29著者氏名（和/英/ヨミ）	/ /
第29著者所属（和/英）	(略称： ) (略称： )
第30著者氏名（和/英/ヨミ）	/ /
第30著者所属（和/英）	(略称： ) (略称： )
第31著者氏名（和/英/ヨミ）	/ /
第31著者所属（和/英）	(略称： ) (略称： )
第32著者氏名（和/英/ヨミ）	/ /
第32著者所属（和/英）	(略称： ) (略称： )
第33著者氏名（和/英/ヨミ）	/ /
第33著者所属（和/英）	(略称： ) (略称： )
第34著者氏名（和/英/ヨミ）	/ /
第34著者所属（和/英）	(略称： ) (略称： )
第35著者氏名（和/英/ヨミ）	/ /
第35著者所属（和/英）	(略称： ) (略称： )
第36著者氏名（和/英/ヨミ）	/ /
第36著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2008-12-09 10:50:00
発表時間	25分
申込先研究会	SP
資料番号	NLC2008-26, SP2008-81
巻番号（vol）	vol.108
号番号（no）	no.337(NLC), no.338(SP)
ページ範囲	pp.13-18
ページ数	6
発行日	2008-12-02 (NLC, SP)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会