講演抄録/キーワード |
講演名 |
2023-02-28 16:55
基本周波数適応型聴覚表現による声道長推定 ○入野俊夫・土庵晋太郎(和歌山大) EA2022-92 SIP2022-136 SP2022-56 |
抄録 |
(和) |
音声のソースフィルタ理論は広く理解されており、音声処理の基本的概念となっている。ところが音声か ら、声道形状情報(フィルタ特性)と声帯振動情報(ソース特性)を分離抽出する逆問題は解決に至っていない。本 報告では、声道長を音声から効果的に推定する手法について述べる。安定化ウェーブレットーメリン変換における Size-Shape Image(SSI) を簡素化した基本周波数適応型の重み関数 SSI-weight を、ガンマチャープ聴覚フィルタバンク (GCFB) 出力の励起パターン (Excitation Pattern, EP) にかけることにより、声道長推定精度が向上することを示す。従 来手法の WORLD スペクトル、フーリエスペクトル、メルスペクトルに対して精度が高く、さらには、これらスペク トル表現に SSI-weight をかけることにより、精度が向上することも示した。これは、さまざまな音声情報処理フロン トエンドに簡便に導入でき、精度向上が期待できる。 |
(英) |
Source-filter theory of speech sounds is a common knowledge in speech research. But as , as an inverse problem, segregating information about the vocal tract (filter) and the glottal excitation (source) is not throughly resolved . We report a method which estimates vocal tract length (VTL) from speech sounds effectively. We adapted Size-Shape Image(SSI) which is a part of Stabilized Wavelet-Mellin Transform (SWMT) into a simple weighting function, named “SSI-weight’’, applicable to any spectrum representation. We show the use of an auditory excitation pattern (EP) with the SSI-weight improved the correlation between the estimated VTL and the VTL measured by using MRI. The results were better than when using WORLD, Fourier, and Mel spectrums. Moreover, the SSI-weight applied to these spectrums improved the correlation. The SSI-weight is a simple, fundamental-frequency dependent, weighting function applicable to any spectrum. It may improve the performance of various speech applications when introduced into the front-end processing. |
キーワード |
(和) |
ソースフィルタ理論 / ガンマチャープフィルタバンク / 安定化ウェーブレットメリン変換 / 寸法形状イメー ジ / 励起パターン / / / |
(英) |
Source-filter theory / Source-filter theory / Stabilized Wavelet-Mellin Transform / Size-Shape Image / Excitation Pattern / / / |
文献情報 |
信学技報, vol. 122, no. 389, SP2022-56, pp. 95-100, 2023年2月. |
資料番号 |
SP2022-56 |
発行日 |
2023-02-21 (EA, SIP, SP) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2022-92 SIP2022-136 SP2022-56 |
研究会情報 |
研究会 |
SP IPSJ-SLP EA SIP |
開催期間 |
2023-02-28 - 2023-03-01 |
開催地(和) |
沖縄県立博物館・美術館 |
開催地(英) |
|
テーマ(和) |
音声,応用/電気音響, 信号処理,一般 |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2023-02-SP-SLP-EA-SIP |
本文の言語 |
日本語 |
タイトル(和) |
基本周波数適応型聴覚表現による声道長推定 |
サブタイトル(和) |
|
タイトル(英) |
Vocal tract length estimation using fundamental frequency adaptive auditory representation |
サブタイトル(英) |
|
キーワード(1)(和/英) |
ソースフィルタ理論 / Source-filter theory |
キーワード(2)(和/英) |
ガンマチャープフィルタバンク / Source-filter theory |
キーワード(3)(和/英) |
安定化ウェーブレットメリン変換 / Stabilized Wavelet-Mellin Transform |
キーワード(4)(和/英) |
寸法形状イメー ジ / Size-Shape Image |
キーワード(5)(和/英) |
励起パターン / Excitation Pattern |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
入野 俊夫 / Toshio Irino / イリノ トシオ |
第1著者 所属(和/英) |
和歌山大学 (略称: 和歌山大)
Wakayama University (略称: Wakayama Univ.) |
第2著者 氏名(和/英/ヨミ) |
土庵 晋太郎 / Shintaro Doan / ドアン シンタロウ |
第2著者 所属(和/英) |
和歌山大学 (略称: 和歌山大)
Wakayama University (略称: Wakayama Univ.) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2023-02-28 16:55:00 |
発表時間 |
20分 |
申込先研究会 |
SP |
資料番号 |
EA2022-92, SIP2022-136, SP2022-56 |
巻番号(vol) |
vol.122 |
号番号(no) |
no.387(EA), no.388(SIP), no.389(SP) |
ページ範囲 |
pp.95-100 |
ページ数 |
6 |
発行日 |
2023-02-21 (EA, SIP, SP) |
|