講演抄録/キーワード |
講演名 |
2013-11-19 13:00
無意味3連音節を用いた音素別明瞭度における話者映像の寄与の分析 ○長谷川 玄・坂本修一・阿部 享・大谷智子・鈴木陽一・川瀬哲明(東北大) HIP2013-60 |
抄録 |
(和) |
本研究では,音声の聴き取りにおいて視覚情報,すなわち,口周辺のどの情報が
読唇効果に寄与するかを音素ごとに調べるため,全ての母音と全ての子音の組を
バランスよく作成した無意味3 連音節を様々に加工した顔映像と組み合わせて
提示した条件で明瞭度試験を行い,各音素に対する明瞭度から音素ごとの特徴を
調べた.その結果,/t/,/n/,/h/,/m/,/w/,/d/,/b/,/p/らの音素は,視覚
的影響を受ける音素であることが示された.一方で,映像条件間の正答率に着目
すると,話者の顔映像を呈示した条件と口唇のみを呈示した条件に有意な差は
見られなかった.これは,口唇のみを呈示していれば,聴き取りの貢献には充分
であることを示唆している.しかし,顔の口唇と周辺部分をマスクし,その周り
を呈示する映像を呈示する条件でも正答率が有意に上昇しており,口唇以外にも
聴き取りに寄与するなんらかの情報が含まれていることが示唆された. |
(英) |
This study focuses on which detailed parts around the speaker’s mouse contribute speech intelligibility.To examine this, nonsense tri-syllables speeches were combined with several kinds of speaker’s video including the original face and those with and without the mouse to measure audio-visual speech intelligibility. The results showed that intelligibility scores of several phonemes (/n/,/h/, /m/, /w/, /d/, /b/, /p/) were increased by adding visual information. However, there was no significant difference between the score with original speaker’s face video and
that obtained by the stimuli with only mouse part. It suggests that only the mouse provides sufficient information for speech intelligibility. Moreover, no significance was also observed between the original audio-visual stimuli and those with speakers face without the mouse. It suggests that the visual information around mouse also provide
important information for speech intelligibility. |
キーワード |
(和) |
音素 / 口唇 / 先行母音 / 読唇 / / / / |
(英) |
phoneme / lips / preceding vowel / lip-reading / / / / |
文献情報 |
信学技報, vol. 113, no. 299, HIP2013-60, pp. 1-6, 2013年11月. |
資料番号 |
HIP2013-60 |
発行日 |
2013-11-12 (HIP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
HIP2013-60 |