講演抄録/キーワード |
講演名 |
2019-03-15 13:30
[ポスター講演]言語モデルに基づく音素セット縮小 ○古明地秀治・田中聡久(東京農工大) EA2018-134 SIP2018-140 SP2018-96 |
抄録 |
(和) |
言語モデルに基づく音素セット縮小方法を提案する.音素セットの縮小は,学習データが少なく全音素の学習が難しいタスクにおいて音素識別性能を向上させる一方,同音単語を増加させ,音声認識の精度劣化を誘発する弊害を併せもつ.提案する音素セット縮小方法では,言語モデルにおけるN-gram の出現確率から算出した「発音/単語列混同率」に基づき,音声認識の精度劣化を抑えながら音素数を減らす事を可能にする.提案法で得られた縮小音素セットを日本語大語彙音声認識システムに適用したところ,単語誤り率が全39 音素で14.6% のところ,10 音素に減らしても17.7% と,精度劣化を3% 程度にとどめることができた. |
(英) |
A design of reduced phoneme set based on a language model is proposed. The reduction of the phoneme set improves discriminability of phonemes under the condition where the amount of training data is too small to train each phoneme model. On the other hand, it increases homophones that yield degradation of speech recognition. In the proposed approach, it is possible to reduce phonemes preventing degradation, regarding pronunciation/word sequence confusion rate calculated from N-grams in a language model. In an experiment, the phoneme set designed with proposed approach was applied to Japanese large vocabulary speech recognition system. The word error rate with the 10 phonemes set was 14.6%, while the error rate with full 39 phonemes set was 17.7%. The degradation was able to be suppressed in about 3%. |
キーワード |
(和) |
音声認識 / 脳波デコーディング / 音素セット / 言語モデル / N-gram / / / |
(英) |
Automatic speech recognition / Brain machine interface / Phoneme set / Language model / N-gram / / / |
文献情報 |
信学技報, vol. 118, no. 496, SIP2018-140, pp. 205-210, 2019年3月. |
資料番号 |
SIP2018-140 |
発行日 |
2019-03-07 (EA, SIP, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2018-134 SIP2018-140 SP2018-96 |
|