講演抄録/キーワード |
講演名 |
2012-12-17 15:55
[ポスター講演]2.4倍速実時間6万語彙連続音声認識プロセッサの開発 ○宮本優貴・何 光霽・和泉慎太郎・川口 博・吉本雅彦(神戸大) ICD2012-101 エレソ技報アーカイブへのリンク:ICD2012-101 |
抄録 |
(和) |
本稿では,6万語彙の実時間連続音声認識のための低消費電力VLSIチップについて説明する.GMM演算時の外部メモリ帯域削減用圧縮デコーダ,VITERBI並列アーキテクチャを実装した.内部SRAM容量を最適化するために,近似GMM演算アルゴリズムの導入,先読みフレーム数の調整を行った.その結果,実時間処理時において従来研究より必要動作周波数を34.2%削減し83.3MHz,消費電力を48.5%削減し74.14mWを実現した.また,標準電圧(1.1 V)で最大200MHz (168 mW) 動作を確認し,2.4倍速で動作することを確認出来た. |
(英) |
This paper describes a low-power VLSI chip for 60-kWord continuous speech recognition based on a context-dependent Hidden Markov Model (HMM). Our implementation includes a compression–decoding scheme to reduce the external memory bandwidth for Gaussian Mixture Model (GMM) computation and multi-path Viterbi transition units. We optimize the internal SRAM size using the max-approximation GMM calculation and adjusting the number of look-ahead frames. The measured results show that our implementation achieves 34.2% required frequency reduction (83.3 MHz) and reduces 48.5% power consumption (74.14 mW) for 60 k-Word real-time continuous speech recognition compared to the previous work. This chip can maximally process 2.4× faster than real-time at 200 MHz and 1.1 V with power consumption of 168 mW. |
キーワード |
(和) |
40nm VLSI / 隠れマルコフモデル(HMM) / 大語彙連続音声認識システム(LVCSR) / / / / / |
(英) |
40nm VLSI / Hidden Markov Model (HMM) / large vocabulary continuous speech recognition (LVCSR) / / / / / |
文献情報 |
信学技報, vol. 112, no. 365, ICD2012-101, pp. 49-53, 2012年12月. |
資料番号 |
ICD2012-101 |
発行日 |
2012-12-10 (ICD) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
ICD2012-101 エレソ技報アーカイブへのリンク:ICD2012-101 |