お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2009-12-21 10:35
話者不変な相対関係特徴を音響単位とする音響モデリングに関する実験的検討
齋藤大輔松浦 良峯松信明広瀬啓吉東大NLC2009-13 SP2009-77
抄録 (和) 音声は年齢,性別,声道長や音響機器などの非言語的要因によって変形し,多様性に富んでいる.筆者らはこれらの非言語的な音響変形におよそ不変な音声の構造的・抽象的表象を提案してきた.この表象は音声の動きのみに着眼した物理表象である.先行研究において,音声の構造的表象に基づく音声認識について種々の検討を行ってきた.構造に基づく音声認識の問題点として,特徴量に対する次元の呪いと,大語彙音声認識や任意語彙への対応が難しい,という点が挙げられる.本報ではこれらの問題に対処するため,パラメータ共有学習に基づく学習の効率化と得られた共有モデルを用いた単語音響モデリングを提案する.相対関係を記述するエッジべクトルを考え,エッジべクトル空間におけるボトムアップクラスタリングによって共有関係をモデル化する.一方,新規単語をモデル化する際には,登録用発声に対して共有エッジモデルを割り当てることでモデル化する.日本語5母音連結発声による孤立単語音声認識実験を行い,提案手法の有効性について確認した. 
(英) Speech acoustics vary due to differences in age, gender, vocal tract length, microphone, and so on. The authors recently proposed a structural and abstract representation of speech, where these variations were effectively removed. This representation captures only dynamics of speech. In our previous studies, using this abstract representation, an ASR framework, which we call the structure-based ASR, was proposed and examined. However, there are two problems for the structure-based ASR; the curse of dimensionality and the large size of modeling unit. As a solution for these problems, this report proposes a new acoustic modeling based on parameter sharing of statistical structure models and efficient reuse of the shared models. In the proposed method, edge vectors, which represent speech contrasts between any two acoustic events, are considered and parameter sharing is carried out based on clustering in the parametric space of edge vectors. To construct an acoustic model for a new word, the most likely edge models are selected and allocated for each edge vector in the structure of that new word. Experiments of recognition using continuous utterances of Japanese vowels show the validity of the proposed method.
キーワード (和) 構造的表象 / 話者不変特徴 / 相対関係 / クラスタリング / 音響モデリング / / /  
(英) structural representation / invariant features / speech contrasts / clustering / acoustic modeling / / /  
文献情報 信学技報, vol. 109, no. 356, SP2009-77, pp. 7-12, 2009年12月.
資料番号 SP2009-77 
発行日 2009-12-14 (NLC, SP) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード NLC2009-13 SP2009-77

研究会情報
研究会 SP NLC  
開催期間 2009-12-21 - 2009-12-22 
開催地(和) 東京大学・山上会館 
開催地(英) Univ. of Tokyo 
テーマ(和) 第11回音声言語シンポジウム(SP・NLC共催/SLP連催) 
テーマ(英) 11th Spoken Language Symposium (SP/NLC/SLP) 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2009-12-SP-NLC 
本文の言語 日本語 
タイトル(和) 話者不変な相対関係特徴を音響単位とする音響モデリングに関する実験的検討 
サブタイトル(和)  
タイトル(英) Experimental study of acoustic modeling using speaker-invariant speech contrast as modeling unit 
サブタイトル(英)  
キーワード(1)(和/英) 構造的表象 / structural representation  
キーワード(2)(和/英) 話者不変特徴 / invariant features  
キーワード(3)(和/英) 相対関係 / speech contrasts  
キーワード(4)(和/英) クラスタリング / clustering  
キーワード(5)(和/英) 音響モデリング / acoustic modeling  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 齋藤 大輔 / Daisuke Saito / サイトウ ダイスケ
第1著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: Univ. of Tokyo)
第2著者 氏名(和/英/ヨミ) 松浦 良 / Ryo Matsuura / マツウラ リョウ
第2著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: Univ. of Tokyo)
第3著者 氏名(和/英/ヨミ) 峯松 信明 / Nobuaki Minematsu / ミネマツ ノブアキ
第3著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: Univ. of Tokyo)
第4著者 氏名(和/英/ヨミ) 広瀬 啓吉 / Keikichi Hirose / ヒロセ ケイキチ
第4著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: Univ. of Tokyo)
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2009-12-21 10:35:00 
発表時間 25分 
申込先研究会 SP 
資料番号 NLC2009-13, SP2009-77 
巻番号(vol) vol.109 
号番号(no) no.355(NLC), no.356(SP) 
ページ範囲 pp.7-12 
ページ数
発行日 2009-12-14 (NLC, SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会