講演抄録/キーワード |
講演名 |
2017-03-01 10:25
光マイクロホンを用いた深層ニューラルネットワークに基づく騒音下音声復元 ○水野智之・福森隆寛・中山雅人・西浦敬信(立命館大) EA2016-84 SIP2016-139 SP2016-79 |
抄録 |
(和) |
遠隔発話音声の受音は, セキュリティや監視を目的としたシステムに有用である. また, 遠方で発生した音の観測を目的として様々なマイクロホンが開発されており, パラボラ型マイクロホンやガンマイクロホンなどが挙げられる. しかし, このようなマイクロホンは, 周囲が騒がしい環境において目的音声のみを計測することが困難である. そこで本稿では, レーザ光を利用した音響計測システムである光マイクロホンに着目する. 光マイクロホンの一つであるレーザドップラ振動計は, 音声によって振動している発話者付近の薄膜上の物体にレーザ光を照射し遠隔発話音声を得る. しかし, 強く張られていない薄膜状の物体は高周波数の振動が発生しにくいため, 遠隔発話音声は高域が欠落した状態で受音される. 本稿では, 深層ニューラルネットワーク(Deep Neural Network, DNN)を用いた観測音声の復元手法を光マイクロホンの観測音声に適用し, 性能改善を試みる. DNNの入力には複素スペクトルを用いて学習を実施する. 最後に, 評価実験にて提案システムによる出力音声の音質を評価し, 提案システムの有効性を確認する. |
(英) |
Measuring distant-talking speech with high accuracy is important for detecting criminal activity. Various microphones such as the parabolic and shotgun microphones have been developed for measuring it. However, most of them have difficulty in extracting distant-talking speech at a target position if they are surrounded by noisy sound sources. Therefore, this study focuses on an optical microphone which uses a laser light for extracting the distant-talking speech. The optical microphone is realized by a laser doppler vibrometer. The sound quality of the optical microphone is especially degraded at higher frequencies because it utilizes an external diaphragm consisting of various materials as the vibrating papery object. In this study, we therefore propose a reconstruction method with a deep neural network that uses a complex spectrum as an input signal. Finally, we confirmed the effectiveness of the proposed system through an evaluation experiment. |
キーワード |
(和) |
光マイクロホン / 音声復元 / 深層ニューラルネットワーク / レーザドップラ振動計 / 複素スペクトル / / / |
(英) |
Optical microphone / Speech reconstruction / Deep neural network / Laser doppler vibrometer / Complex spectrum / / / |
文献情報 |
信学技報, vol. 116, no. 475, EA2016-84, pp. 13-18, 2017年3月. |
資料番号 |
EA2016-84 |
発行日 |
2017-02-22 (EA, SIP, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2016-84 SIP2016-139 SP2016-79 |
|