お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2008-12-10 15:05
会議録作成支援のための国会審議の音声認識システム
秋田祐哉三村正人河原達也京大NLC2008-44 SP2008-99
抄録 (和) 我々は国会審議の会議録作成支援を想定した音声認識システムの研究に取り組んでいる.会議録では原則として発話をすべて書き起こして記録することから,音声認識を活用する際は高い認識精度が求められる.このため,本研究では衆議院の審議音声からなるコーパスの整備を進めるとともに,これを用いたより高性能な音響モデル・言語モデル・発音辞書の検討を行っている.音響モデルについては,種々の正規化手法に加えて最小音素誤り(MPE)学習を導入した.また言語モデルと発音辞書に関しては,話し言葉音声向けのモデルを生成するために発話スタイルの統計的変換手法を適用し,4-gram統計言語モデルと発音の変異形を含む辞書を構築した.これらのモデルに基づく音声認識システムについて実際の会議音声における評価を行ったところ,85%の単語正解精度が得られた. 
(英) We have been developping an automatic speech recognition (ASR) system for creation of meeting records of the National Congress (Diet) of Japan. Since almost all utterances in the meetings must be transcribed and recorded, an ASR system should provide accurate transcripts as drafts. Therefore, we have compiled meeting speech of the Congress into a corpus for development of an ASR system, and investigated more powerful acoustic, language and pronunciation models base on the corpus. As for acoustic model, we introduce minimum phone error (MPE) training, as well as several normalization methods. To build language and pronunciation models, our speaking-style transformation approach is applied to the corpus, and models for spontaneous speech recognition are generated. The proposed ASR system using these models was evaluated on real meeting speech of the Congress, and realized 85% of word accuracy.
キーワード (和) 会議 / 話し言葉音声認識 / 言語モデル / 音響モデル / 発音辞書 / / /  
(英) Meeting / Spontaneous speech recognition / Language model / Acoustic model / Pronunciation model / / /  
文献情報 信学技報, vol. 108, no. 338, SP2008-99, pp. 121-126, 2008年12月.
資料番号 SP2008-99 
発行日 2008-12-02 (NLC, SP) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード NLC2008-44 SP2008-99

研究会情報
研究会 SP NLC  
開催期間 2008-12-09 - 2008-12-10 
開催地(和) 早稲田大学(小野記念講堂) 
開催地(英) Waseda Univ. 
テーマ(和) 第10回 音声言語シンポジウム (SP/NLC/SLP共催) 
テーマ(英)  
講演論文情報の詳細
申込み研究会 SP 
会議コード 2008-12-SP-NLC 
本文の言語 日本語 
タイトル(和) 会議録作成支援のための国会審議の音声認識システム 
サブタイトル(和)  
タイトル(英) An automatic transcription system for creation of meeting records in the Japanese Congress 
サブタイトル(英)  
キーワード(1)(和/英) 会議 / Meeting  
キーワード(2)(和/英) 話し言葉音声認識 / Spontaneous speech recognition  
キーワード(3)(和/英) 言語モデル / Language model  
キーワード(4)(和/英) 音響モデル / Acoustic model  
キーワード(5)(和/英) 発音辞書 / Pronunciation model  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 秋田 祐哉 / Yuya Akita / アキタ ユウヤ
第1著者 所属(和/英) 京都大学 (略称: 京大)
Kyoto University (略称: Kyoto Univ.)
第2著者 氏名(和/英/ヨミ) 三村 正人 / Masato Mimura / ミムラ マサト
第2著者 所属(和/英) 京都大学 (略称: 京大)
Kyoto University (略称: Kyoto Univ.)
第3著者 氏名(和/英/ヨミ) 河原 達也 / Tatsuya Kawahara / カワハラ タツヤ
第3著者 所属(和/英) 京都大学 (略称: 京大)
Kyoto University (略称: Kyoto Univ.)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2008-12-10 15:05:00 
発表時間 25分 
申込先研究会 SP 
資料番号 NLC2008-44, SP2008-99 
巻番号(vol) vol.108 
号番号(no) no.337(NLC), no.338(SP) 
ページ範囲 pp.121-126 
ページ数
発行日 2008-12-02 (NLC, SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会