IEICE Technical Report

Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380

Volume 108, Number 337

Natural Language Understanding and Models of Communication

Workshop Date : 2008-12-09 - 2008-12-10 / Issue Date : 2008-12-02

[TOP] | [2006] | [2007] | [2008] | [2009] | [2010] | [2011] | [2012] | [Japanese] / [English]

NLC2008-24
Two-channel input speech recognition using sparsness-based blind source separation
Kenta Nishiki, Yosuke Izumi (Univ. of Tokyo), Shinji Watanabe (NTT), Takuya Nishimoto, Nobutaka Ono, Shigeki Sagayama (Univ. of Tokyo)
pp. 1 - 6

NLC2008-25
Hands-free speech recognition system for robot
Kosuke Hosoya, Tetsuji Ogawa, Shinya Fujie, Daichi Watanabe, Yuhi Ichikawa, Hikaru Taniyama, Tetsunori Kobayashi (Waseda Univ.)
pp. 7 - 12

NLC2008-26
Noisy speech recognition using integrated method of statistical model-based voice activity detection and noise suppression
Masakiyo Fujimoto, Kentaro Ishizuka, Tomohiro Nakatani (NTT Corporation)
pp. 13 - 18

NLC2008-27
Music suppression method for single channel speech mixed with BGM using Bayesian networks
Hiroaki Itou, Takanori Nishino, Norihide Kitaoka, Kazuya Takeda (Nagoya Univ.)
pp. 19 - 24

NLC2008-28
Speaker diarization of multi-party conversations based on audio and visual information integration
Kentaro Ishizuka, Shoko Araki, Kazuhiro Otsuka, Masakiyo Fujimoto, Tomohiro Nakatani (NTT)
pp. 25 - 30

NLC2008-29
[Invited Talk] Cognitive competence required for spoken language performance and computational competence realized by spoken language engineering
Nobuaki Minematsu (Univ. of Tokyo)
pp. 31 - 36

NLC2008-30
Acoustic Model Training Technique for Speech Recognition using Style Estimation with Multiple-Regression HMM
Yusuke Ijima, Makoto Tachibana, Takashi Nose, Takao Kobayashi (Tokyo Tech)
pp. 37 - 42

NLC2008-31
Speech Feature Extraction Using Constrained Nonnegative Matrix Factorization
Hyunsin Park, Tetsuya Takiguchi, Yasuo Ariki (Kobe Univ.)
pp. 43 - 48

NLC2008-32
Evaluation of annealing schadule for PLSA language model adaptaion
Masaharu Kato, Tetsuo Kosaka (Yamagata Univ.), Akinori Ito, Shozo Makino (Tohoku Univ.)
pp. 49 - 53

NLC2008-33
Speech Recognition by Topic Models with Continuous/Discontinuous Topic Changes
Atsushi Sako, Yasuo Ariki (Kobe Univ.), Tomoharu Iwata, Shinji Watanabe, Takaaki Hori (NTT)
pp. 55 - 60

NLC2008-34
User modeling for a satisfaction evaluation of a speech recognition system
Sunao Hara, Norihide Kitaoka, Kazuya Takeda (Nagoya Univ.)
pp. 61 - 66

NLC2008-35
Segmentation of Spoken Language into unit of Utterance Fragment using Acoustics Features
Katsuyoshi Setoyama (Nara Institute of Science and Technology), Hideki Kashioka, Nick Campbell (Nara Institute of Science and Technology/National Institute of I)
pp. 67 - 72

NLC2008-36
Bayesian Context Clustering Using Cross Validation for HMM-Based Speech Synthesis
Kei Hashimoto, Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda (Nagoya Institute of Technology)
pp. 73 - 78

NLC2008-37
Simultaneous Transformation of Duration and Spectrum Using Statistical Models Including Time-Sequence Matching
Kaori Yutani, Yoshihiko Nankaku (Nagoya Institute of Technology), Tomoki Toda (Nara Institute of Science and Technology), Keiichi Tokuda (Nagoya Institute of Technology)
pp. 79 - 84

NLC2008-38
Aperiodicity extraction based on linear prediction and temporal axis warping using fundamental frequency information
Hideki Kawahara (Wakayama Univ.), Masanori Morise (Kwansei Univ.), Toru Takahashi (Kyoto Univ.), Hideki Banno (Meijo Univ.), Ryuichi Nisimura, Toshio Irino (Wakayama Univ.)
pp. 85 - 90

NLC2008-39
Mutually-Adaptive Generation of Utterances Based on Belief Shared by Human And Robots in Real World.
Shinya Nakamura (UEC/NICT), Naoto Iwahashi (NICT/ATR), Takayuki Nagai (The University of Electro-Communications)
pp. 91 - 96

NLC2008-40
Controlling thought-evoking dialogue using POMDP
Yasuhiro Minami, Minako Sawaki, Ryuichiro Higashinaka, Kohji Dohsaka (NTT)
pp. 97 - 102

NLC2008-41
Speech recognition system for spoken dialogue system
Toru Taniguchi, Shinya Fujie, Tetsunori Kobayashi (Waseda Univ.)
pp. 103 - 108

NLC2008-42
[Invited Talk] A New Paradigm for Speech Application System Development
Tetsunori Kobayashi (Waseda Univ.)
pp. 109 - 114

NLC2008-43
Progress Report of SLP Spoken Document Processing Working Group
Tomoyoshi Akiba (Toyohashi Univ. of Tech.), Kiyoaki Aikawa (Tokyo Univ. of Tech.), Yoshiaki Itoh (Iwate Prefectural Univ.), Tatsuya Kawahara (Kyoto Univ.), Hiroaki Nanjo (Ryukoku Univ.), Hiromitsu Nishizaki (Univ. of Yamanashi), Norihito Yasuda (NTT), Yoichi Yamashita (Ritsumeikan Univ.), Tomoko Matsui (The Institute of Statistical Mathematics), Xinhui Hu (NICT/ATR), Seiichi Nakagawa (Toyohashi Univ. of Tech.), Katunobu Itou (Hosei Univ.)
pp. 115 - 120

NLC2008-44
An automatic transcription system for creation of meeting records in the Japanese Congress
Yuya Akita, Masato Mimura, Tatsuya Kawahara (Kyoto Univ.)
pp. 121 - 126

NLC2008-45
Effect of punctuation marks for speech translatio unit boundary detection
Tohru Shimizu (NICT/ATR), Satoshi Nakamura (National Institute of Information and Communication), Tatsuya Kawahara (Kyoto University)
pp. 127 - 131

NLC2008-46
Characteristics of pitch accents in infant-directed speech -- An analysis of Riken Japanese Mother-Infant Conversation Corpus --
Mafuyu Kitahara (Waseda Univ.), Ken'ya Nishikawa (RIKEN/Keio Univ.), Yosuke Igarashi (NIJL/RIKEN), Takahito Shinya (Sophi Univ./RIKEN), Reiko Mazuka (RIKEN/Duke Univ.)
pp. 133 - 136

NLC2008-47
The effect of associated conditions on the received emotional information transferred by sound effects
Mari Sato, Kiyoaki Aikawa (Univ. of Technology)
pp. 137 - 142

NLC2008-48
Physical Model of the Vocal Tract with Flexible Velum
Takayuki Arai, Kimi Tanaka (Sophia Univ.), Ryuta Kataoka (Showa Univ.)
pp. 143 - 148

NLC2008-49
Articulatory feature extraction based on 3-stage MLNs and Inhibition/Enhancement Network
Mohammad Nurul Huda, Hiroaki Kawashima, Tsuneo Nitta (Toyohashi Univ. of Tech.)
pp. 149 - 154

NLC2008-50
Parameter optimization for a fundamental frequency extractor based on TANDEM-STRAIGHT
Hanae Itagaki, Masanori Morise, Ryuichi Nisimura, Toshio Irino, Hideki Kawahara (Wakayama Univ.)
pp. 155 - 160

NLC2008-51
Study on Spectro-Temporal Features Based on Gradient Histograms
Takashi Muroi, Tetsuya Takiguchi, Yasuo Ariki (Kobe Univ.)
pp. 161 - 165

NLC2008-52
Automatic Speech Character Identification using Vocal Tract information
Yusuke Watanabe, Naoki Matsumoto (Meiji Univ.)
pp. 167 - 172

NLC2008-53
Evaluation of speaker identification/verification method using phase information
Longbiao Wang (Shizuoka Univ.), Kazue Minami, Kazumasa Yamamoto, Seiichi Nakagawa (Toyohashi Univ. of Tech.)
pp. 173 - 178

NLC2008-54
Dialect-based speaker classification of Chinese using acoustic features invariant with extra-linguistic factors
XueBin Ma, Nobuaki Minematsu, Yu Qiao, Keikichi Hirose (Univ. of Tokyo), Akira Nemoto (Nankai Univ.), Feng Shi (nankai Univ.)
pp. 179 - 184

NLC2008-55
Speaker Recognition Based on Gaussian Mixture Models Using Variational Bayesian Method
Tatsuya Ito, Kei Hashimoto, Yoshihiko Nankaku, Akinobu Lee, Keiichi Tokuda (Nitech)
pp. 185 - 190

NLC2008-56
Sudden noise reduction using dynamic speech feature model
Nobuyuki Miyake, Tetsuya Takiguchi, Yasuo Ariki (Kobe Univ.)
pp. 191 - 196

NLC2008-57
Speech period detection using Hough transform of distance matrix images
Hiroyuki Nishi, Yoshimasa Kimura, Nguyen Van Don (Sojo Univ.)
pp. 197 - 202

NLC2008-58
Isolated word recognition based on speech structures and discriminant analysis
Satoshi Asakawa, Yu Qiao, Nobuaki Minematsu, Keikichi Hirose (Univ. of Tokyo)
pp. 203 - 208

NLC2008-59
Speech recognition using localized affine invariant features
Masayuki Suzuki, Yu Qiao, Nobuaki Minematsu, Keikichi Hirose (Univ. of Tokyo)
pp. 209 - 214

NLC2008-60
Tying covariance parameters for HMM-based speech synthesis
Keiichiro Oura, Heiga Zen, Yoshihiko Nankaku, Akinobu Lee, Keiichi Tokuda (Nagoya Inusitute of Technology)
pp. 215 - 220

NLC2008-61
Speech Recognition Based on Statistical Models Including Multiple Decision Trees
Sayaka Shiota, Kei Hashimoto, Yoshihiko Nankaku, Akinobu Lee, Keiichi Tokuda (Nagoya Institute of Technology)
pp. 221 - 226

NLC2008-62
Recording system for controlling speaking rate (ReCoK5) and public domain speech database with speaking rate variations (SRV-DB)
Kota Takahashi, Keigo Tsutaki, Toru Yoshihara (The University of Electro-Communications)
pp. 227 - 232

NLC2008-63
Speaking rate estimation and utterance analysis of fast speech for high-speed reproduction -- A practical example of speech database with speaking rate variations --
Toru Yoshihara, Keigo Tsutaki, Kota Takahashi (The University of Electro-Communications)
pp. 233 - 238

NLC2008-64
All directional Fatigue Detection Using Noise Ration at Vocal Cords Level and Spectrum Q -- Considering Working Efficiency and MAnagement for Crisis of a Speaker --
Kazuhide Okada (Toyota)
pp. 239 - 244

NLC2008-65
Driver's irritation detection using speech recognition results
Lucas Malta, Chiyomi Miyajima, Akira Ozaki, Norihide Kitaoka, Kazuya Takeda (Nagoya Univ.)
pp. 245 - 248

NLC2008-66
Language Model Adaptation by Topic Model Based on Sequence of Words
Atsushi Sako, Tetsuya Takiguchi, Yasuo Ariki (Kobe Univ.)
pp. 249 - 254

NLC2008-67
Discriminative Rescoring Based on Minimization of Word Errors for Speech Recognition
Akio Kobayashi, Takahiro Oku, Shinichi Homma, Shoei Sato, Toru Imai, Tohru Takagi (NHK)
pp. 255 - 260

NLC2008-68
Verification of Speech Recognition Results Based on the Utterance Classification Using Conditional Random Fields
Kenko Ota, Terumasa Ehara (TUS, Suwa)
pp. 261 - 266

NLC2008-69
Estimation of Spoken Dialog System using Automatically-generated question-and-answer database
Takahiro Morimoto, Masashi Ito (Tohoku Univ.), Motoyuki Suzuki (The Univ. of Tokushima), Akinori Ito, Shozo Makino (Tohoku Univ.)
pp. 267 - 272

NLC2008-70
Building a Question-Answer System based on RIME-TK, a Toolkit for Dialogue and Behavior Controller of Robots and Agents
Hiromi Narimatsu (Tsuda College), Mikio Nakano (Honda Research Institute Japan Co., Ltd.), Kotaro Funakoshi, Yuji Hasegawa, Hiroshi Tsujino (Tsuda College)
pp. 273 - 278

Note: Each article is a technical report without peer review, and its polished version will be published elsewhere.

The Institute of Electronics, Information and Communication Engineers (IEICE), Japan

IEICE Technical Report

Volume 108, Number 337

Natural Language Understanding and Models of Communication

Table of contents