お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2023-02-28 16:55
基本周波数適応型聴覚表現による声道長推定
入野俊夫土庵晋太郎和歌山大EA2022-92 SIP2022-136 SP2022-56
抄録 (和) 音声のソースフィルタ理論は広く理解されており、音声処理の基本的概念となっている。ところが音声か ら、声道形状情報(フィルタ特性)と声帯振動情報(ソース特性)を分離抽出する逆問題は解決に至っていない。本 報告では、声道長を音声から効果的に推定する手法について述べる。安定化ウェーブレットーメリン変換における Size-Shape Image(SSI) を簡素化した基本周波数適応型の重み関数 SSI-weight を、ガンマチャープ聴覚フィルタバンク (GCFB) 出力の励起パターン (Excitation Pattern, EP) にかけることにより、声道長推定精度が向上することを示す。従 来手法の WORLD スペクトル、フーリエスペクトル、メルスペクトルに対して精度が高く、さらには、これらスペク トル表現に SSI-weight をかけることにより、精度が向上することも示した。これは、さまざまな音声情報処理フロン トエンドに簡便に導入でき、精度向上が期待できる。 
(英) Source-filter theory of speech sounds is a common knowledge in speech research. But as , as an inverse problem, segregating information about the vocal tract (filter) and the glottal excitation (source) is not throughly resolved . We report a method which estimates vocal tract length (VTL) from speech sounds effectively. We adapted Size-Shape Image(SSI) which is a part of Stabilized Wavelet-Mellin Transform (SWMT) into a simple weighting function, named “SSI-weight’’, applicable to any spectrum representation. We show the use of an auditory excitation pattern (EP) with the SSI-weight improved the correlation between the estimated VTL and the VTL measured by using MRI. The results were better than when using WORLD, Fourier, and Mel spectrums. Moreover, the SSI-weight applied to these spectrums improved the correlation. The SSI-weight is a simple, fundamental-frequency dependent, weighting function applicable to any spectrum. It may improve the performance of various speech applications when introduced into the front-end processing.
キーワード (和) ソースフィルタ理論 / ガンマチャープフィルタバンク / 安定化ウェーブレットメリン変換 / 寸法形状イメー ジ / 励起パターン / / /  
(英) Source-filter theory / Source-filter theory / Stabilized Wavelet-Mellin Transform / Size-Shape Image / Excitation Pattern / / /  
文献情報 信学技報, vol. 122, no. 389, SP2022-56, pp. 95-100, 2023年2月.
資料番号 SP2022-56 
発行日 2023-02-21 (EA, SIP, SP) 
ISSN Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード EA2022-92 SIP2022-136 SP2022-56

研究会情報
研究会 SP IPSJ-SLP EA SIP  
開催期間 2023-02-28 - 2023-03-01 
開催地(和) 沖縄県立博物館・美術館 
開催地(英)  
テーマ(和) 音声,応用/電気音響, 信号処理,一般 
テーマ(英)  
講演論文情報の詳細
申込み研究会 SP 
会議コード 2023-02-SP-SLP-EA-SIP 
本文の言語 日本語 
タイトル(和) 基本周波数適応型聴覚表現による声道長推定 
サブタイトル(和)  
タイトル(英) Vocal tract length estimation using fundamental frequency adaptive auditory representation 
サブタイトル(英)  
キーワード(1)(和/英) ソースフィルタ理論 / Source-filter theory  
キーワード(2)(和/英) ガンマチャープフィルタバンク / Source-filter theory  
キーワード(3)(和/英) 安定化ウェーブレットメリン変換 / Stabilized Wavelet-Mellin Transform  
キーワード(4)(和/英) 寸法形状イメー ジ / Size-Shape Image  
キーワード(5)(和/英) 励起パターン / Excitation Pattern  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 入野 俊夫 / Toshio Irino / イリノ トシオ
第1著者 所属(和/英) 和歌山大学 (略称: 和歌山大)
Wakayama University (略称: Wakayama Univ.)
第2著者 氏名(和/英/ヨミ) 土庵 晋太郎 / Shintaro Doan / ドアン シンタロウ
第2著者 所属(和/英) 和歌山大学 (略称: 和歌山大)
Wakayama University (略称: Wakayama Univ.)
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2023-02-28 16:55:00 
発表時間 20分 
申込先研究会 SP 
資料番号 EA2022-92, SIP2022-136, SP2022-56 
巻番号(vol) vol.122 
号番号(no) no.387(EA), no.388(SIP), no.389(SP) 
ページ範囲 pp.95-100 
ページ数
発行日 2023-02-21 (EA, SIP, SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会