講演抄録/キーワード |
講演名 |
2007-06-29 11:20
雑音環境下における呼びかけ音声の検出と到来方向の同定 ○鈴木基之・北舘航太・伊藤彰則・牧野正三(東北大) SP2007-19 |
抄録 |
(和) |
音声などを含む雑音環境下において,特定の「呼びかけ語」が話された時にそれを検出し,同時にその到来方向を推定するシステムを提案する。
様々な方向に対し,遅延和アレイを用いて到来する音信号を抽出し,連続DPとFrame Relation Matrix を組み合わせて呼びかけ語の検出を行う。その後それぞれの方向における音のパワーと呼びかけ語の検出スコアを考慮して到来方向の推定を行う。
複数のスピーカーを用い,3モーラの呼びかけ語と音楽や朗読音声などの雑音を0 ~20dB で同時に再生させた条件において,再現率95%,適合率96%程度の精度で呼びかけ語の検出と方向同定を行うことができた。 |
(英) |
If the robot understands user’s calling voice, it can approach the user to hear the user’s commands. In this paper we developed a method to detect user’s calling voice and estimate the direction of arrival (DoA) of the voice in a real environment.
Many works have been proposed for estimation of DoA, but most of those methods do not assume more than one voice sources. Our method detects pre-registered voice even when other voice and heavy noise exist.
The method combines two distinct technologies. One is the multi-channel spectrum subtraction(MSS). Using MSS we record sound from every five degree. The next technology is word spotting using continuous DP (CDP) matching. We perform CDP for all of 72 directions in parallel. When a registered word is detected, the word is verified using the frame relation matrix, which expresses word-internal similarities. Finally, the scores of CDP are combined with power of each direction to determine the DoA.
We carried out experiments and obtained 95% accuracy for from 0 to 20 dB SNR conditions. |
キーワード |
(和) |
呼びかけ語の検出 / 方向推定 / Frame Relation Matrix / マイクロホンアレイ / / / / |
(英) |
Detection of calling voice / Estimation of direction of arrival / Frame Relation Matrix / Microphone array / / / / |
文献情報 |
信学技報, vol. 107, no. 116, SP2007-19, pp. 67-72, 2007年6月. |
資料番号 |
SP2007-19 |
発行日 |
2007-06-21 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2007-19 |