講演抄録/キーワード |
講演名 |
2020-03-02 13:00
End-to-end音声認識における会議音声への適応および回り込み音声の影響軽減 ○大内一亜・甲斐充彦(静岡大) EA2019-111 SIP2019-113 SP2019-60 |
抄録 |
(和) |
会議音声の自動書き起こしのような実環境下での複数話者音声認識では,話者別に与えた近接マイクで収録しても,周囲の話者の音声が回り込んで重畳することで音声認識性能が低下する.本稿では,大規模読み上げ音声データセットからの転移学習によって会議音声に適応したEnd-to-end 音声認識モデルを用い,回り込み音声によって生じる悪影響について調査する.まず,サブワード単位を出力ラベルに用いるEnd-to-end 音声認識モデルの転移学習により,従来のDNN/HMM ハイブリッド型音声認識モデルと同等以上の認識精度が得られることを示す.更に話者へ焦点を当てる構造を組み込むことで,音声特徴量系列から話者の発話区間を推定しその書き起こしを予測するという一連の処理を1 つのモデルとして扱い全体として最適化するモデル化手法を提案する.英語会議音声のAMI コーパスを用いて提案手法の評価を行ったところ,不正確な発話区間による音声認識システムの性能劣化を抑えられることが明らかになった. |
(英) |
(Not available yet) |
キーワード |
(和) |
音声認識 / 会議音声 / 回り込み音声 / End-to-end音声認識 / AMIコーパス / / / |
(英) |
/ / / / / / / |
文献情報 |
信学技報, vol. 119, no. 441, SP2019-60, pp. 59-64, 2020年3月. |
資料番号 |
SP2019-60 |
発行日 |
2020-02-24 (EA, SIP, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2019-111 SIP2019-113 SP2019-60 |
研究会情報 |
研究会 |
SP EA SIP |
開催期間 |
2020-03-02 - 2020-03-03 |
開催地(和) |
沖縄産業支援センター |
開催地(英) |
Okinawa Industry Support Center |
テーマ(和) |
音声,応用/電気音響,信号処理,一般 |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2020-03-SP-EA-SIP |
本文の言語 |
日本語 |
タイトル(和) |
End-to-end音声認識における会議音声への適応および回り込み音声の影響軽減 |
サブタイトル(和) |
|
タイトル(英) |
Adaptation to Meeting Speech and Mitigation of Wraparound Speech for End-to-end Speech Recognition |
サブタイトル(英) |
|
キーワード(1)(和/英) |
音声認識 / |
キーワード(2)(和/英) |
会議音声 / |
キーワード(3)(和/英) |
回り込み音声 / |
キーワード(4)(和/英) |
End-to-end音声認識 / |
キーワード(5)(和/英) |
AMIコーパス / |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
大内 一亜 / Kazua Ouchi / オオウチ カズア |
第1著者 所属(和/英) |
静岡大学大学院 (略称: 静岡大)
Shizuoka University (略称: Shizuoka Univ.) |
第2著者 氏名(和/英/ヨミ) |
甲斐 充彦 / Atsuhiko Kai / カイ アツヒコ |
第2著者 所属(和/英) |
静岡大学 (略称: 静岡大)
Shizuoka University (略称: Shizuoka Univ.) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2020-03-02 13:00:00 |
発表時間 |
90分 |
申込先研究会 |
SP |
資料番号 |
EA2019-111, SIP2019-113, SP2019-60 |
巻番号(vol) |
vol.119 |
号番号(no) |
no.439(EA), no.440(SIP), no.441(SP) |
ページ範囲 |
pp.59-64 |
ページ数 |
6 |
発行日 |
2020-02-24 (EA, SIP, SP) |
|