講演抄録/キーワード |
講演名 |
2015-06-18 14:50
i-vectorによる短い発話の話者識別の検討 ○辻川美沙貴(パナソニック/総研大)・西川剛樹(パナソニック)・松井知子(統計数理研) PRMU2015-43 SP2015-12 WIT2015-12 |
抄録 |
(和) |
年,音声認識技術の発展により音声操作に対応したテレビやスマートフォンの機能が増加している.こうした音声認識技術の普及と共に,話者認識技術に対する期待も高まっている.これらの技術によりユーザと発話内容を特定し,ユーザの嗜好に応じた検索が可能な,より簡単で便利なインタフェースの実現が期待できる.この話者識別の実用化にあたって,操作コマンドのような単語レベルの数秒の発話による課題があると想定される.そこで本稿では,話者認識の最新研究で注目されるi-vectorを用いて,短い発話の話者識別の評価および検討を行う. |
(英) |
Recently, voice controlled system is growing popular due to the development of speech recognition technology. For example, speech recognition is used for searching a keyword in a smart TV or a smartphone. Also, speaker identification technology that can identify an individual from voice becomes an active area of research across the world. These technologies will enable us to voice controlled system suited to individual about home electronics. However, the performance of speaker identification becomes worse because of short utterances such as voice control command. Thus, we study speaker identification for short utterances by i-vector which is attracted attention in the latest study. |
キーワード |
(和) |
話者認識 / 話者識別 / i-vector / 短時間発話 / / / / |
(英) |
speaker recognition / speaker identification / i-vector / short utterance / / / / |
文献情報 |
信学技報, vol. 115, no. 99, SP2015-12, pp. 65-70, 2015年6月. |
資料番号 |
SP2015-12 |
発行日 |
2015-06-11 (PRMU, SP, WIT) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2015-43 SP2015-12 WIT2015-12 |