講演抄録/キーワード |
講演名 |
2014-05-15 15:15
[チュートリアル講演]音声言語処理のための要素技術と音声ドキュメント処理への応用 ○西崎博光(山梨大) EMM2014-3 |
抄録 |
(和) |
近年,マルチメディア情報の一つとして,「音声ドキュメント処理」の研究が活発に行われている.音声ドキュメントとは,ニュース音声や講演・講義音声など,ある内容に関する音声データのことを指す.音声ドキュメント処理の基本は,音声認識処理であり,音声認識結果(文字化された音声)に対して様々な処理を行う.本稿では,音声認識の基礎ならびに,これを使った応用例として音声ドキュメント検索・要約・翻訳や,音声(映像)コンテンツの生成処理について紹介する. |
(英) |
Recently, the number of studies on ``spoken document processing'' as one kind of multimedia information have increased. A spoken document is a speech including a consistent content such as lecture speech in a university and a news article speech. A basic process of spoken document processing is automatic speech recognition (ASR). ASR system's output (automatically-transcribed speech) is processed like retrieving spoken documents and summarization of a spec document. This paper describes an introduction of a basic framework for ASR and its applications such as spoken document retrieval. |
キーワード |
(和) |
音声認識 / 音声ドキュメント処理 / 音声ドキュメント検索 / 音声・映像コンテンツ / / / / |
(英) |
speech recognition / spoken document processing / spoken document retrieval / speech and movie contents / / / / |
文献情報 |
信学技報, vol. 114, no. 33, EMM2014-3, pp. 11-16, 2014年5月. |
資料番号 |
EMM2014-3 |
発行日 |
2014-05-08 (EMM) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EMM2014-3 |