お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2012-12-17 15:55
[ポスター講演]2.4倍速実時間6万語彙連続音声認識プロセッサの開発
宮本優貴何 光霽和泉慎太郎川口 博吉本雅彦神戸大ICD2012-101 エレソ技報アーカイブへのリンク:ICD2012-101
抄録 (和) 本稿では,6万語彙の実時間連続音声認識のための低消費電力VLSIチップについて説明する.GMM演算時の外部メモリ帯域削減用圧縮デコーダ,VITERBI並列アーキテクチャを実装した.内部SRAM容量を最適化するために,近似GMM演算アルゴリズムの導入,先読みフレーム数の調整を行った.その結果,実時間処理時において従来研究より必要動作周波数を34.2%削減し83.3MHz,消費電力を48.5%削減し74.14mWを実現した.また,標準電圧(1.1 V)で最大200MHz (168 mW) 動作を確認し,2.4倍速で動作することを確認出来た. 
(英) This paper describes a low-power VLSI chip for 60-kWord continuous speech recognition based on a context-dependent Hidden Markov Model (HMM). Our implementation includes a compression–decoding scheme to reduce the external memory bandwidth for Gaussian Mixture Model (GMM) computation and multi-path Viterbi transition units. We optimize the internal SRAM size using the max-approximation GMM calculation and adjusting the number of look-ahead frames. The measured results show that our implementation achieves 34.2% required frequency reduction (83.3 MHz) and reduces 48.5% power consumption (74.14 mW) for 60 k-Word real-time continuous speech recognition compared to the previous work. This chip can maximally process 2.4× faster than real-time at 200 MHz and 1.1 V with power consumption of 168 mW.
キーワード (和) 40nm VLSI / 隠れマルコフモデル(HMM) / 大語彙連続音声認識システム(LVCSR) / / / / /  
(英) 40nm VLSI / Hidden Markov Model (HMM) / large vocabulary continuous speech recognition (LVCSR) / / / / /  
文献情報 信学技報, vol. 112, no. 365, ICD2012-101, pp. 49-53, 2012年12月.
資料番号 ICD2012-101 
発行日 2012-12-10 (ICD) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード ICD2012-101 エレソ技報アーカイブへのリンク:ICD2012-101

研究会情報
研究会 ICD  
開催期間 2012-12-17 - 2012-12-18 
開催地(和) 東工大蔵前会館 ロイアルブルーホール 
開催地(英) Tokyo Tech Front 
テーマ(和) 学生・若手研究会 
テーマ(英)  
講演論文情報の詳細
申込み研究会 ICD 
会議コード 2012-12-ICD 
本文の言語 日本語 
タイトル(和) 2.4倍速実時間6万語彙連続音声認識プロセッサの開発 
サブタイトル(和)  
タイトル(英) A 2.4x-Real-Time VLSI Processor for 60-kWord Continuous Speech Recognition 
サブタイトル(英)  
キーワード(1)(和/英) 40nm VLSI / 40nm VLSI  
キーワード(2)(和/英) 隠れマルコフモデル(HMM) / Hidden Markov Model (HMM)  
キーワード(3)(和/英) 大語彙連続音声認識システム(LVCSR) / large vocabulary continuous speech recognition (LVCSR)  
キーワード(4)(和/英) /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 宮本 優貴 / Yuki Miyamoto / ミヤモト ユウキ
第1著者 所属(和/英) 神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Univ)
第2著者 氏名(和/英/ヨミ) 何 光霽 / Guangji He / カ コウサイ
第2著者 所属(和/英) 神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Univ)
第3著者 氏名(和/英/ヨミ) 和泉 慎太郎 / Shintaro Izumi / イズミ シンタロウ
第3著者 所属(和/英) 神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Univ)
第4著者 氏名(和/英/ヨミ) 川口 博 / Hiroshi Kawaguchi / カワグチ ヒロシ
第4著者 所属(和/英) 神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Univ)
第5著者 氏名(和/英/ヨミ) 吉本 雅彦 / Masahiko Yoshimoto / ヨシモト マサヒコ
第5著者 所属(和/英) 神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Univ)
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2012-12-17 15:55:00 
発表時間 120分 
申込先研究会 ICD 
資料番号 ICD2012-101 
巻番号(vol) vol.112 
号番号(no) no.365 
ページ範囲 pp.49-53 
ページ数
発行日 2012-12-10 (ICD) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会