講演抄録/キーワード |
講演名 |
2020-03-03 14:25
円滑な音声対話のためのセミブラインド音源分離と音声区間検出の統合 ○和気雅弥・戸上真人(LINE)・吉井和佳・河原達也(京大) EA2019-163 SIP2019-165 SP2019-112 |
抄録 |
(和) |
本稿では音声対話システムの発話音源とその音声区間が既知の条件で,ユーザの発話音源の分離と音声区 間の検出を統合した単一の再帰型ニューラルネットワークで行う手法について述べる.ユーザとシステムが円滑な音 声対話を行うために音源分離と音声区間検出が必要となる.音源分離と音声区間検出それぞれに対する手法はこれま でに多数研究されており,ヒューリスティックな手法や統計的手法を用いたもの,ニューラルネットワークを用いた手 法などが検討されている.本研究では音源分離と音声区間検出を統合して行うが,これらを同時に行うか,順番に行 う場合はどちらを先に行うか検討を行った.提案手法では単一チャネルのマイクロホン観測スペクトル及びシステム の発話音源スペクトルと音声区間を入力として,ユーザの発話音源と音声区間を推定する.それぞれのネットワーク には LSTM を採用し,音声が時間軸方向に持つ依存関係を考慮する.ユーザとアンドロイド ERICA の対話を収録し たデータセットによる実験において,音源分離・音声区間検出の順にネットワークを構成し,全体のファインチュー ニングを行う手法が最も高い性能を示すことを確認した. |
(英) |
|
キーワード |
(和) |
ロボット対話 / セミブラインド音源分離 / 音声区間検出 / End-to-Endモデル / マルチタスク学習 / / / |
(英) |
/ / / / / / / |
文献情報 |
信学技報, vol. 119, no. 441, SP2019-112, pp. 361-366, 2020年3月. |
資料番号 |
SP2019-112 |
発行日 |
2020-02-24 (EA, SIP, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2019-163 SIP2019-165 SP2019-112 |
研究会情報 |
研究会 |
SP EA SIP |
開催期間 |
2020-03-02 - 2020-03-03 |
開催地(和) |
沖縄産業支援センター |
開催地(英) |
Okinawa Industry Support Center |
テーマ(和) |
音声,応用/電気音響,信号処理,一般 |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2020-03-SP-EA-SIP |
本文の言語 |
日本語(英語タイトルなし) |
タイトル(和) |
円滑な音声対話のためのセミブラインド音源分離と音声区間検出の統合 |
サブタイトル(和) |
|
タイトル(英) |
|
サブタイトル(英) |
|
キーワード(1)(和/英) |
ロボット対話 / |
キーワード(2)(和/英) |
セミブラインド音源分離 / |
キーワード(3)(和/英) |
音声区間検出 / |
キーワード(4)(和/英) |
End-to-Endモデル / |
キーワード(5)(和/英) |
マルチタスク学習 / |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
和気 雅弥 / / ワケ マサヤ |
第1著者 所属(和/英) |
LINE株式会社 (略称: LINE)
(略称: ) |
第2著者 氏名(和/英/ヨミ) |
戸上 真人 / / トガミ マサヒト |
第2著者 所属(和/英) |
LINE株式会社 (略称: LINE)
(略称: ) |
第3著者 氏名(和/英/ヨミ) |
吉井 和佳 / / ヨシイ カズヨシ |
第3著者 所属(和/英) |
京都大学 (略称: 京大)
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
河原 達也 / / カワハラ タツヤ |
第4著者 所属(和/英) |
京都大学 (略称: 京大)
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2020-03-03 14:25:00 |
発表時間 |
25分 |
申込先研究会 |
SP |
資料番号 |
EA2019-163, SIP2019-165, SP2019-112 |
巻番号(vol) |
vol.119 |
号番号(no) |
no.439(EA), no.440(SIP), no.441(SP) |
ページ範囲 |
pp.361-366 |
ページ数 |
6 |
発行日 |
2020-02-24 (EA, SIP, SP) |
|