講演抄録/キーワード |
講演名 |
2013-02-02 15:25
コミュニケーション支援のための眼球動作入力音声合成インタフェースの研究 ○房 福明・篠崎隆宏・堀内靖雄・黒岩眞吾(千葉大)・古井貞煕(東工大)・武者利光(脳機能研) WIT2012-38 |
抄録 |
(和) |
身体的なハンディキャップにより意思疎通が難しい患者,特に筋萎縮性側索硬化症(ALS) の患者に対し代替となる効率的なコミュニケーション手段を提供することを目的として,眼電位を入力とした音声合成インタフェースを提案し研究を行っている.システムは目の周囲に配置した生体電極から眼電位信号を取り込み,音声認識技術を応用した認識器を用いて眼球動作を認識する.そしてその結果をもとに,実時間で音声合成を行う.これまでのシステムでは認識器においてコンテキスト非依存隠れマルコフモデル(HMM) や一部の眼動素のみ直前のコンテキストに依存化させたバイ眼動素モデルを用いていたが,認識性能の点で不十分であった.そこで本研究では,直前および直後のコンテキストに依存化させた状態共有トライ眼動素モデルの利用を検討する.さらに,眼動素の並びをモデル化したN-gram モデルの導入を行う.従来のコンテキスト非依存HMM のみを用いた場合の仮名認識精度が4.3%,バイ眼動素モデルを用いた場合が89.1%であったのに対し,トライ眼動素モデルを用いた場合は96.2%と認識精度が大きく向上した.さらに,N-gram モデルとして仮名3-gram モデルを使用することで,97.3%の高い認識精度が得られた. |
(英) |
In order to provide an efficient means of communication for those who cannot move muscles of their whole body except eyes due to amyotrophic lateral sclerosis (ALS), we are studying a speech synthesis interface based on electrooculogram (EOG) input. The system consists of an EOG input module, an eye motion recognizer, and a speech synthesizer. In this paper, we improve the EOG input based eye motion recognizer applying speech recognition techniques. In our previous system, a hidden Markov model (HMM) based bi eye-motion model was used. However, it was not enough to effectively model the context effects of eye motions. In this study, we investigate using a tied-state tri eye-motion model. Moreover, an N-gram model is integrated to the recognition system. In the experiment, it is shown that 96.2% of character ecognition accuracy is obtained by using the tri eye-motion model whereas it is 84.3% and 89.1% for mono and bi eye-motion models, respectively. By using a character 3-gram model in combination with the tri eye motion-model, the highest character accuracy of 97.3% has been obtained. |
キーワード |
(和) |
眼電位 / 隠れマルコフモデル / N-gram モデル / 音声合成 / 情報保障 / / / |
(英) |
Electrooculogram / Hidden Markov model / N-gram / Speech synthesis / Communication aids / / / |
文献情報 |
信学技報, vol. 112, no. 426, WIT2012-38, pp. 29-34, 2013年2月. |
資料番号 |
WIT2012-38 |
発行日 |
2013-01-26 (WIT) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
WIT2012-38 |