IEICE Technical Report

Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380

Volume 118, Number 496

Signal Processing

Workshop Date : 2019-03-14 - 2019-03-15 / Issue Date : 2019-03-07

[TOP] | [2015] | [2016] | [2017] | [2018] | [2019] | [2020] | [2021] | [Japanese] / [English]

SIP2018-105
Hue Correction Scheme Based on CIELAB Color Space
Yuma Kinoshita, Hitoshi Kiya (Tokyo Metro. Univ.)
pp. 1 - 6

SIP2018-106
Blind speech separation based on approximate joint diagonalization utilizing correlation between neighboring frequency bins
Taiki Asamizu, Toshihiro Furukawa (TUS)
pp. 7 - 12

SIP2018-107
Nearest sound source extraction for hearable devices
Eiji Saito, Arata Kawamura (Kyoto Sangyo Univ.)
pp. 13 - 18

SIP2018-108
[Poster Presentation] Voice activity detection under high levels of noise using gated convolutional neural networks
Li Li, Koshino Yuki, Matsumoto Mitsuo, Makino Shoji (Univ. Tsukuba)
pp. 19 - 24

SIP2018-109
[Poster Presentation] Automatic Design Support System for Micro Speaker Mounted on Smartphone
Kai Hirai, Yoshinobu Kajikawa (Kansai Univ.)
pp. 25 - 30

SIP2018-110
[Poster Presentation] Prototype of an electronic earplug for music
Lixue Chen, Yoshinori Yokoo, Kohichi Matsuda, Hirofumi Nakajima (Kogakuin Univ.), Yohichi Fujisaka (RION Co., Ltd.)
pp. 31 - 36

SIP2018-111
[Poster Presentation] An Initialization Method for Multichannel Nonnegative Matrix Factorization using Nonnegative Independent Component Analysis
Takahiro Ushijima, Takanobu Uramoto, Shingo Uenohara, Ken'ichi Furuya (Oita Univ.)
pp. 37 - 42

SIP2018-112
[Poster Presentation] Snore sound identification using noise suppression and multi-class classification under real environments
Keisuke Nishijima, Ken'ichi Furuya (Oita Univ.)
pp. 43 - 48

SIP2018-113
[Poster Presentation] Prototyping of Interaction Software Based on Selective Synthesis and Superposition of Multiple Sound Fields
Toshiharu Horiuchi, Sumaru Niida (KDDI Research)
pp. 49 - 53

SIP2018-114
[Poster Presentation] Steganographic Audio Secret Sharing
Shu Noguchi, Kotaro Sonoda, Senya Kiyasu (Nagasaki Univ.)
pp. 55 - 60

SIP2018-115
[Poster Presentation] Design of automatic soundscape generation with a privacy protection
Yoshifumi Chisaki (CIT), Toshiharu Horiuchi (KDDI Research)
pp. 61 - 64

SIP2018-116
[Poster Presentation] Design of an autonomous control for intelligent public address node
Takumi Kawashima, Takumi Shirai, Yoshifumi Chisaki (CIT)
pp. 65 - 68

SIP2018-117
[Poster Presentation] Multi-channel ANC Window with Virtual Sensing Technique
Rina Hasegawa (Kansai Univ.), Dong-Yuan Shi (NTU), Yoshinobu Kajikawa (Kansai Univ.), Woon-Seng Gan (NTU)
pp. 69 - 74

SIP2018-118
[Poster Presentation] MR Image Reconstruction Using Two Types of Dictionaries and the Diagonalization of a BCCB Matrix
Kazuma Nakamoto, Kosuke Fujii, Daichi Kitahara, Akira Hirabayashi (Ritsumeikan Univ.)
pp. 75 - 80

SIP2018-119
[Poster Presentation] A Fricative Sound /z/ Detector Based on Zero-Crossing Rate
Yuki Katagiri, Arata Kawamura (Kyoto Sangyo Univ.)
pp. 81 - 86

SIP2018-120
[Poster Presentation] Headrest ANC System for Broadband Noise at the Desired Position
Reo Maeda, Yoshinobu Kajikawa (Kansai Univ.)
pp. 87 - 92

SIP2018-121
[Poster Presentation] Image Super-Resolution via Generative Adversarial Network Considering Objective Quality
Hiroya Yamamoto, Daichi Kitahara, Akira Hirabayashi (Ritsumeikan Univ.)
pp. 93 - 98

SIP2018-122
Beamforming for Brain-Activity Reconstruction under Time-Correlated Interference
Takehiro Kono (Keio Univ.), Masahiro Yukawa (Keio Univ./Riken), Tomasz Piotrowski (Nicolaus Copernicus Univ./Interdisciplinary Center for Modern Te)
pp. 99 - 104

SIP2018-123
[Poster Presentation] An Efficient Online Learning Method Based on Self-tuned Gaussian Kernels
Masaaki Takizawa, Masahiro Yukawa (Keio Univ.)
pp. 105 - 111

SIP2018-124
[Poster Presentation] An experimental study of influence of classroom babble noise on automatic assessment of learners' shadowing speech
Suguru Kabashima, Daisuke Saito, Nobuaki Minematsu (UTokyo), Yutaka Yamauchi (Soka Univ.), Kayoko Ito (Koyasan Univ.)
pp. 113 - 118

SIP2018-125
[Poster Presentation] Modeling learners’ pronunciation variations and its application to automatic phoneme error detection
Zhang Haoyu, Saito Daisuke, Minematsu Nobuaki (UTokyo), Kobashikawa Satoshi, Masumura Ryo (NTT)
pp. 119 - 124

SIP2018-126
[Poster Presentation] Initial analysis of emotional speech acted in noise
Yi Zhao (NII), Atsushi Ando (NTT), Shinji Takaki, Junichi Yamagishi (NII), Satoshi Kobashikawa (NTT)
pp. 125 - 130

SIP2018-127
[Poster Presentation] CWT spectral loss for training a DNN-based speech waveform model
Shinji Takaki (NII), Hirokazu Kameoka (NTT), Junichi Yamagishi (NII)
pp. 131 - 135

SIP2018-128
[Poster Presentation] A robust algorithm of phase recovery for speech enhancement
Dongxiao Wang, Koichi Shinoda (TokyoTech), Hirokazu Kameoka (NTT)
pp. 137 - 142

SIP2018-129
[Poster Presentation] Adaptive beamformer for desired source extraction with neural network based direction of arrival estimation
Yu Nakagome (Waseda Univ.), masahito togami (LINE)
pp. 143 - 147

SIP2018-130
[Poster Presentation] MVDR beamformer based on time-frequency-bin-wise switching technique for underdetermined speech enhancement
Kouei Yamaoka (Univ. of Tsukuba), Nobutaka Ono (Tokyo Metropolitan Univ.), Shoji Makino, Takeshi Yamada (Univ. of Tsukuba)
pp. 149 - 154

SIP2018-131
[Poster Presentation] Diffuse noise reduction using adversarial denoising autoencoder
Hikari Tanabe, Naohiro Tawara, Tetsunori Kobayashi (Waseda Univ.), Masaru Fujieda, Katagiri Kazuhiro, Takashi Yazu (OKI), Tetsuji Ogawa (Waseda Univ.)
pp. 155 - 160

SIP2018-132
[Poster Presentation] Use and evaluation of Tacotron and context features in rakugo speech synthesis
Shuhei Kato (SOKENDAI/NII), Shinji Takaki, Junichi Yamagishi (NII), Yusuke Yasuda (SOKENDAI/NII), Xin Wang (NII)
pp. 161 - 166

SIP2018-133
Convergence-guaranteed independent positive semidefinite tensor analysis for blind source separation
Kanta Fukushige, Norihiro Takamune (UTokyo), Daichi Kitamura (Kagawa-NICT), Hiroshi Saruwatari (UTokyo), Rintaro Ikeshita, Tomohiro Nakatani (NTT)
pp. 167 - 172

SIP2018-134
Estimation of rank-constrained spatial covariance model based on multivariate complex Student's t distribution for blind source separation
Yuki Kubo, Norihiro Takamune (UTokyo), Daichi Kitamura (Kagawa NCIT), Hiroshi Saruwatari (UTokyo)
pp. 173 - 178

SIP2018-135
A Study on Speech Synthesis Based on Deep Gaussain Processes and Latent Variable Representation of Accent
Tomoki Koriyama, Takao Kobayashi (Tokyo Tech)
pp. 179 - 184

SIP2018-136
Consideration on Effectiveness of Relative Phase from Residual Speech for Speaker Recognition
Seiichi Nakagawa, Kazumasa Yamamoto, Kazumasa Yamamoto (Chubu Univ.)
pp. 185 - 190

SIP2018-137
Neural Language Models based on Conditional Hierarchical Recurrent Encoder-Decoder for Multi-Party Conversational Speech Recognition
Ryo Masumura, Tomohiro Tanaka, Atsushi Ando, Takanobu Oba, Yushi Aono (NTT)
pp. 191 - 196

SIP2018-138
Likability Estimation Model Training of Call-center Agents Based on Annotators' Skills
Hosana Kamiyama, Atsushi Ando, Ryo Masumura, Satoshi Kobashikawa, Yushi Aono (NTT)
pp. 197 - 202

SIP2018-139
[Invited Talk] Realization of real-time blind source separation with auxiliary-function-based algorithms
Nobutaka Ono (TMU)
p. 203

SIP2018-140
[Poster Presentation] A Design of Reduced Phoneme Set Based on a Language Model
Shuji Komeiji, Toshihisa Tanaka (Tokyo Univ. of Agriculture and Tech.)
pp. 205 - 210

SIP2018-141
[Poster Presentation] Pseudo-Multidimensional Processing of Geomagnetic Field Data Measured using HTS-SQUID Magnetometers for Removing Flux Trapping Noise
Kai Yokoyama, Kiyoshi Nishikawa (Tokyo Metro Univ)
pp. 211 - 216

SIP2018-142
(See Japanese page.)
pp. 217 - 222

SIP2018-143
[Poster Presentation] A compressed sensing approach to hyperspectral pansharpening
Saori Takeyama, Shunsuke Ono, Itsuo Kumazawa (Tokyo Tech)
pp. 223 - 227

SIP2018-144
[Poster Presentation] Epileptic Focus Detection from Interictal Electroencephalogram using RNN
Byambadorj Nyamradnaa, Kosuke Fukumori, Toshihisa Tanaka (TAT), Yasushi Iimura, Takumi Mitsuhashi, Hidenori Sugano (Juntendo Univ.)
pp. 229 - 231

SIP2018-145
[Poster Presentation] Epileptic Spike Detection and Identification of Effective Frequency Band with Neural Networks
Kosuke Fukumori (TUAT), Noboru Yoshida (Juntendo Univ.), Toshihisa Tanaka (TUAT)
pp. 233 - 235

SIP2018-146
[Poster Presentation] Effect of Entrainment by Selective Attention to Music and Speech
Ryosuke Matsui, Toshihisa Tanaka (TUAT)
pp. 237 - 242

SIP2018-147
[Poster Presentation] A study on sound source direction detection method using coefficients of adaptive filter
Kensaku Fujii (Kodaway Lab.), Mitsuji Muneyasu (Kansai Univ.)
pp. 243 - 250

SIP2018-148
[Poster Presentation] Study of acoustic scene analysis using sound-to-light conversion devices "blinky''
Yuto Oishi, Jin-cheng Zhang, Yutaka Yamamoto, Fumikazu Saze, Hiroyuki Moriyama, Robin Scheibler, Yukoh Wakabayashi, Nobutaka Ono (TMU)
pp. 251 - 256

SIP2018-149
[Poster Presentation] Multimodal Blind Source Separation using Microphones and Sound-to-light Conversion Devices "Blinkies"
Robin Scheibler, Nobutaka Ono (TMU)
pp. 257 - 262

SIP2018-150
[Poster Presentation] Subjective evaluation of power saving audio playback algorithm based on auditory masking
Tsukasa Nakashima (Kyutech), Mitsuhiro Nakagawara (Panasonic), Mitsunori Mizumachi (Kyutech)
pp. 263 - 269

SIP2018-151
[Poster Presentation] Study on 3D audio coding based on spatial auditory masking
Kodai Kato, Masayuki Nishiguchi, Kanji Watanabe, Shouichi Takane, Koji Abe (Akita Pref. Univ.)
pp. 271 - 278

SIP2018-152
[Poster Presentation] A Study on Stimuli Bandwidth of Monaural Directional Band
Michika Yamada, Fumikazu Saze (TMU), Toshiharu Horiuchi (KDDI Research), Kan Okubo (TMU)
pp. 279 - 284

SIP2018-153
[Poster Presentation] Acoustic particle cannon using ultrasonic hemispherical transducers array
Yutaka Yamamoto, Kan Okubo (Tokyo Met. Univ.)
pp. 285 - 288

SIP2018-154
[Poster Presentation] Effective Hammering Method for Determining Dead Alkaline Dry Battery
Tomoaki Magome, Kan Okubo (Tokyo Metropolitan Univ.)
pp. 289 - 294

SIP2018-155
[Poster Presentation] Distributed Microphone Wireless Network System for Wide Area Synchronous Recording
Akihiro Watanabe, Kan Okubo, Norio Tagawa (TMU)
pp. 295 - 300

SIP2018-156
[Poster Presentation] Classification of Coins with Similar Designs Using High Resolution Acoustic Characteristics
Naoko Nakazato, Yuka Manabe, Kan Okubo (TMU)
pp. 301 - 304

SIP2018-157
[Poster Presentation] Faster than real-time and audio sampling rate extraction of fo candidates using an analytic signal with prolate spheroidal wave function as envelope
Hideki Kawahara (Wakayama Univ.), Ken-Ichi Sakakibara (Health Science Univ. Hokkaido), Masanori Morise (Univ. Yamanashi), Yuichi Ishimoto (NINJAL)
pp. 305 - 310

SIP2018-158
[Poster Presentation] F0 estimation using TV-CAR speech analysis based on Regularized LP
Keiichi Funaki (Univ. of the Ryukyus)
pp. 311 - 316

SIP2018-159
[Poster Presentation] Robustness of statistical voice conversion based on waveform modification against external noise
Yusuke Kurita, Kazuhiro Kobayashi, Kazuya Takeda (Nagoya Univ.), Tomoki Toda (Nagoya Univ./JST PRESTO)
pp. 317 - 322

SIP2018-160
[Poster Presentation] An Evaluation of Underdetermined Source Separation Based on Multichannel Variational Autoencoder
Shogo Seki (Nagoya Univ.), Hirokazu Kameoka (NTT), Li Li (Univ. Tsukuba), Tomoki Toda, Kazuya Takeda (Nagoya Univ.)
pp. 323 - 328

SIP2018-161
[Poster Presentation] Design and Evaluation of Ladder Denoising Autoencoder for Auditory Speech Feature Extraction of Overlapped Speech Separation
Hiroshi Sekiguchi, Yoshiaki Narusue, Hiroyuki Morikawa (Univ. of Tokyo)
pp. 329 - 333

SIP2018-162
[Poster Presentation] Data augmentation using multiple databases for end-to-end dysarthric speech recognition
Yuki Takashima, Tetsuya Takiguchi, Yasuo Ariki (Kobe Univ.)
pp. 335 - 340

SIP2018-163
[Poster Presentation] Simultaneous Japanese Flexible-Keyword Detection and Speaker Recognition for Low-Resource Devices
Hiroshi Fujimura (TOSHIBA)
pp. 341 - 346

SIP2018-164
[Poster Presentation] Evaluation of non-linear artificial bandwidth extension with x-vector-based speaker verification
Ryota Kaminishi, Sayaka Shiota, Hitoshi Kiya (Tokyo Metro. Univ.)
pp. 347 - 352

SIP2018-165
A Basic Study on Azimuth Estimation Model of Sound Image in Car Cabin by Using a Gammachirp Auditory Filterbank
Koji Sakamoto (Denso Ten Technology), Masashi Nakamura, Masanobu Maeda (Denso Ten)
pp. 353 - 358

Note: Each article is a technical report without peer review, and its polished version will be published elsewhere.

The Institute of Electronics, Information and Communication Engineers (IEICE), Japan

IEICE Technical Report

Volume 118, Number 496

Signal Processing

Table of contents