講演抄録/キーワード |
講演名 |
2022-06-17 15:00
[ポスター講演]局所的な真偽判定を用いた敵対的学習に基づく教師なし音声処理歪み補正 ○荻野里久・西城耕平(早大)・藤枝 大(OKI)・小川哲司(早大) SP2022-13 |
抄録 |
(和) |
本研究では,収音したいエリアに含まれる音源を強調するエリア収音の後処理として用いる歪み補正器を,教師無し学習する方式について検討した. エリア収音は非線形なアプローチに基づく音声強調処理である. 目的音と同方向に妨害音が配置されているなど, 線形のビームフォーミングに基づく手法では目的音の強調が困難な場面で用いられるが,人工的な処理歪みがスペクトル上で局所的に生じるという課題を持つ.先行研究では,観測信号と正解信号の対(ペアデータ)を用いた教師あり学習により, 処理歪みを低減するネットワークの学習が行われた.しかし,実環境において正解信号を大量に得ることは現実的でなく,正解信号なしにネットワークを学習できることが望ましい.そこで本研究では,教師なし敵対的生成ネットワーク(GAN)の枠組みを用い,人工的な歪みを補正するネットワークの構築を試みた.また,局所的に生じる処理歪みを効果的に補正するために,敵対的学習における識別器に真偽判定を局所的に行える枠組みを適用した.妨害音と同方向にある目的音を強調する実験において,エリア収音の出力信号で生じた歪みを提案方式で補正することの有効性を確認した. |
(英) |
|
キーワード |
(和) |
敵対的生成ネットワーク / 深層ニューラルネットワーク / 教師なし音声強調 / 信号処理歪補正 / / / / |
(英) |
/ / / / / / / |
文献情報 |
信学技報, vol. 122, no. 81, SP2022-13, pp. 49-54, 2022年6月. |
資料番号 |
SP2022-13 |
発行日 |
2022-06-10 (SP) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2022-13 |