講演抄録/キーワード |
講演名 |
2016-12-20 11:45
i-vectorによるランキングを用いた短い発話における話者照合の検討 ○辻川美沙貴(パナソニック/総研大)・西川剛樹(パナソニック)・松井知子(統計数理研) SP2016-53 |
抄録 |
(和) |
一般的に,話者認識の性能は発話長が短いときに劣化する.しかしながら音声による機器操作などで話者認識機能を実用化する場合,非常に短い発話である可能性が高く話者認識精度の低下が懸念される.本稿では話者認識の実用的な課題として単語レベルの短い発話に着目し,i-vectorによる不特定多数話者内でのランキングを利用した話者照合手法を検討した.ランキングに利用する不特定多数話者に3,268名の話者を用いて従来のスコアによる手法と比較し,従来法より精度が向上する傾向を示した.更にランキングに利用する話者の人数や構成を変更し,精度改善方法について検討する. |
(英) |
Generally, short utterance test data seriously degrades the accuracy of speaker verification. However, in many voice-operated systems, utterances with a length of less than a few seconds are often used in practice and it is concerned that the accuracy is degraded. In this paper, we focus on short utterances of just a few words as the practical problem and propose a rank-based verification method with i-vector. This method used 3,268 speakers for ranking and compared with conventional method with scoring. The experimental results show the improvement when using rank-based method. Moreover, we investigate the effect of improvement by changing the construction of speakers for ranking. |
キーワード |
(和) |
話者認識 / 話者照合 / i-vector / 短時間発話 / 順序統計量 / ランキング / / |
(英) |
speaker recognition / speaker verification / i-vector / short utterance / order statistic / ranking / / |
文献情報 |
信学技報, vol. 116, no. 378, SP2016-53, pp. 23-26, 2016年12月. |
資料番号 |
SP2016-53 |
発行日 |
2016-12-13 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
査読に ついて |
本技術報告は査読を経ていない技術報告であり,推敲を加えられていずれかの場に発表されることがあります. |
PDFダウンロード |
SP2016-53 |