お知らせ 研究会の開催と会場に参加される皆様へのお願い(2022年6月開催~)
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2021-07-16 13:50
二つの音響管が縦続接続された簡易声道モデルのサウンドスペクトログラムからのCNNを用いた形状逆推定
千葉拓弥松﨑博季和田直史竹沢 恵真田博文北海道科学大EA2021-19
抄録 (和) 機械学習を用いて発話音声から声道形状を逆推定することを試みている.これまで学習データとして出力には声道断面積関数を,入力には声道伝達関数を用い,複数の全結合層からなるニューラルネットワークで逆推定を試みてきたが,十分な推定精度が得られなかった.また,音声データそのものを学習に用いていないという問題もあった.そこで,音声からサウンドスペクトログラムを求めて,これを入力データとし,ニューラルネットワークに画像処理分野で大きな成果を上げている畳み込みニューラルネットワーク(CNN)を用いて推定精度向上が可能か確認を行なった.CNN として,分類問題で用いられることが多いInceptionV3,VGG16 およびResNet50の3モデルを,本研究の回帰問題に合わせ出力層で用いる活性化関数をsoftmax関数から恒等関数に変更した上で使用した.結果として,いずれの CNN モデルでも本導入方法では高い精度を得ることができなかった. 
(英) We are attempting to use machine learning to vocal tract shape from speaking voice. For this purpose, we have used the vocal tract area function as the output and the vocal tract transfer function as the input as the training data, and have attempted inverse estimation using a neural network consisting of multiple fully connected layers, but have not been able to obtain sufficient estimation accuracy. Another problem was that the voice data itself was not used for training. In this study, we used a convolutional neural network (CNN), which has been widely used in image processing, as the input data to obtain a sound spectrogram from speaking voice. InceptionV3, VGG16, and ResNet50, which are often used in classification problems, were used as CNNs after changing the activation function used in the output layer from a softmax function to an equality function to fit the regression problem of this study. As a result, we were not able to obtain high accuracy with this implementation method for any of the CNN models.
キーワード (和) サウンドスペクトログラム / 声道断面積関数 / 逆推定 / CNN / / / /  
(英) Sound Spectrogrum / Vocal Tract Area / Inverse Estimation / CNN / / / /  
文献情報 信学技報, vol. 121, no. 112, EA2021-19, pp. 89-94, 2021年7月.
資料番号 EA2021-19 
発行日 2021-07-08 (EA) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード EA2021-19

研究会情報
研究会 EA ASJ-H  
開催期間 2021-07-15 - 2021-07-16 
開催地(和) オンライン開催 
開催地(英) Online 
テーマ(和) 応用/電気音響,聴覚,音声,音楽音響,音響教育,一般 
テーマ(英) Engineering/Electro Acoustics, Psychological and Physiological Acoustics, Speech, Musical Acoustics, Education in Acoustics, and Related Topics 
講演論文情報の詳細
申込み研究会 EA 
会議コード 2021-07-EA-H 
本文の言語 日本語 
タイトル(和) 二つの音響管が縦続接続された簡易声道モデルのサウンドスペクトログラムからのCNNを用いた形状逆推定 
サブタイトル(和)  
タイトル(英) Inverse esitimaion of shapes of vocal-tract models with cascading two acoustic tubes from sound spectrogram using CNN 
サブタイトル(英)  
キーワード(1)(和/英) サウンドスペクトログラム / Sound Spectrogrum  
キーワード(2)(和/英) 声道断面積関数 / Vocal Tract Area  
キーワード(3)(和/英) 逆推定 / Inverse Estimation  
キーワード(4)(和/英) CNN / CNN  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 千葉 拓弥 / Takuya Chiba / チバ タクヤ
第1著者 所属(和/英) 北海道科学大学 (略称: 北海道科学大)
Hokkaido University of Science (略称: Hokkaido Univ of Science)
第2著者 氏名(和/英/ヨミ) 松﨑 博季 / Hiroki Matsuzaki / マツザキ ヒロキ
第2著者 所属(和/英) 北海道科学大学 (略称: 北海道科学大)
Hokkaido University of Science (略称: Hokkaido Univ of Science)
第3著者 氏名(和/英/ヨミ) 和田 直史 / Naofumi Wada / ワダ ナオフミ
第3著者 所属(和/英) 北海道科学大学 (略称: 北海道科学大)
Hokkaido University of Science (略称: Hokkaido Univ of Science)
第4著者 氏名(和/英/ヨミ) 竹沢 恵 / Megumi Takezawa / タケザワ メグミ
第4著者 所属(和/英) 北海道科学大学 (略称: 北海道科学大)
Hokkaido University of Science (略称: Hokkaido Univ of Science)
第5著者 氏名(和/英/ヨミ) 真田 博文 / Hirofumi Sanada / サナダ ヒロフミ
第5著者 所属(和/英) 北海道科学大学 (略称: 北海道科学大)
Hokkaido University of Science (略称: Hokkaido Univ of Science)
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2021-07-16 13:50:00 
発表時間 25分 
申込先研究会 EA 
資料番号 EA2021-19 
巻番号(vol) vol.121 
号番号(no) no.112 
ページ範囲 pp.89-94 
ページ数
発行日 2021-07-08 (EA) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会