IEICE Technical Report

Online edition: ISSN 2432-6380

Signal Processing

Workshop Date : 2021-03-03 - 2021-03-04 / Issue Date : 2021-02-24

SIP2020-90
A Constrained Alternating Minimization Approach to End-to-End Graph Signal Denoising
Eisuke Yamagata, Shunsuke Ono (Titech)
pp. 1 - 4

SIP2020-91
Remote Sensing Data Restoration by Constraining the Gradients of Stripe Noise
Kazuki Naganuma, Saori Takeyama, Shunsuke Ono (Titech)
pp. 5 - 8

SIP2020-92
Design of Graph Signal Sampling Matrices for Arbitrary Signal Subspaces
Junya Hara, Koki Yamada (TUAT), Shunsuke Ono (TIT), Yuichi Tanaka (TUAT)
pp. 9 - 14

SIP2020-93
Automatic Detection of Epileptic Abnormal EEG Using Deep Learning
Taku Shoji (TUAT), Noboru Yoshida (Juntendo Univ.), Toshihisa Tanaka (TUAT)
pp. 15 - 20

SIP2020-94
Estimation of Imagined Rhythm and Its Active Area from Electroencephalogram Using Deep Learning
Naoki Yoshimura, Toshihisa Tanaka (TUAT)
pp. 21 - 26

SIP2020-95
[Invited Talk] *
Masahito Togami (LINE)
pp. 27 - 32

SIP2020-96
[Poster Presentation] A Study on active sinusoidal noise reduction system not requiring adaptive algorithm and secondary path filter
Kensaku Fujii (Kodaway Lab.), Mitsuji Muneyasu (Kansai Univ.), Yoshifumi Chisaki (CIT)
pp. 33 - 40

SIP2020-97
[Poster Presentation] Issues on automatic soundscape generation based on image object detection
Yoshifumi Chisaki (CIT), Toshiharu Horiuchi (KDDI Research, Inc.)
pp. 41 - 44

SIP2020-98
[Poster Presentation] A study of loudspeaker design for measuring near-field head-related transfer functions
Atsuro Ito, Kentaro Matsui, Shu Kitajima (NHK)
pp. 45 - 50

SIP2020-99
[Poster Presentation] Subjective optimization of stereo width shrink algorithm in headphones reproduction
Yui Ueno, Mitsunori Mizumachi (kyutech.), Toshiharu Horiuchi (KDDI Research, Inc.)
pp. 51 - 56

SIP2020-100
[Poster Presentation] A unified source-filter network for neural vocoder
Reo Yoneyama, Yi-Chiao Wu, Tomoki Toda (Nagoya Univ.)
pp. 57 - 62

SIP2020-101
[Poster Presentation] Noise-robust time-domain speech separation with basis signals for noise
Kohei Ozamoto (Tokyo Tech), Koji Iwano (TCU), Kuniaki Uto, Koichi Shinoda (Tokyo Tech)
pp. 63 - 67

SIP2020-102
[Poster Presentation] Investigation of DNN-based speech synthesis utilizing oral reading skills obtained from large scale subjective evaluation
Shun Akui (UTokyo), Yusuke Ijima (NTT), Daisuke Saito, Nobuaki Minematsu (UTokyo)
pp. 68 - 73

SIP2020-103
[Poster Presentation] Psychological evaluation of popping-out voice quality
Takashi Nakao, Tatsuya Kitamura (Konan Univ.)
pp. 74 - 78

SIP2020-104
[Poster Presentation] Comparison of speech intelligibility results between laboratory and crowd-sourcing experiments
Ayako Yamamoto, Toshio Irino (Wakayama Univ.), Kenichi Arai, Shoko Araki, Atunori Ogawa, Keisuke Kinoshita, Tomohiro Nakatani (NTT)
pp. 79 - 84

SIP2020-105
[Poster Presentation] End-to-end incremental TTS with lookahead generation with large pretrained language model
Takaaki Saeki, Shinnosuke Takamichi, Hiroshi Saruwatari (UTokyo)
pp. 85 - 90

SIP2020-106
[Invited Talk] Early Days of Adaptive Beamforming for Sound Acquisition
Osamu Hoshuyama (Kyocera), Yutaka Kaneda (TDU)
pp. 91 - 96

SIP2020-107
An optimal prediction of phoneme under Bayes criterion by weighting multiple hidden Markov models
Taishi Yamaoka, Shota Saito, Toshiyasu Matsushima (Waseda Univ.)
pp. 97 - 102

SIP2020-108
An investigation of rhythm-based speaker embeddings for phoneme duration modeling
Kenichi Fujita, Atsushi Ando, Yusuke Ijima (NTT)
pp. 103 - 108

SIP2020-109
[Short Paper] Comparison of End-to-End Models for Joint Speaker and Speech Recognition
Kak Soky (Kyoto Univ.), Sheng Li (NICT), Masato Mimura, Chenhui Chu, Tatsuya Kawahara (Kyoto Univ.)
pp. 109 - 113

SIP2020-110
Anomalous Sound Detection Using a Binary Classification Model Considering Class Centroids
Ibuki Kuroyanagi, Tomiki Hayashi, Kazuya Takeda, Tomoki Toda (Nagoya Univ)
pp. 114 - 121

SIP2020-111
Development and Evaluation of Automatic Accompaniment System Using Foot Switch for Acoustical Signals
Ryota Abe, Toshiyuki Kimura (Tohoku Gakuin Univ.)
pp. 122 - 127

SIP2020-112
Subjective Evaluation of Recording System for Personal 3D Sound Field Reproduction
Fumi Hanyu, Toshiyuki Kimura (Tohoku Gakuin Univ.)
pp. 128 - 133

SIP2020-113
A quantitative measure of discriminability between NMF dictionaries
Eisuke Konno, Daisuke Saito, Nobuaki Minematsu (UTokyo)
pp. 134 - 139

SIP2020-114
Estimation of Attentional Direction using EEG during Simultaneous Presentation of Music from Two Sources
Kana Mizokuchi, Toshihisa Tanaka (TUAT), Takashi G. Sato, Yoshifumi Shiraki (NTT)
pp. 140 - 145

SIP2020-115
Parameter estimation of an IIR sound correction system in a real environment
Kento Kudo, Shinichi Inoue, Toshihisa Tanaka (TUAT)
pp. 146 - 151

SIP2020-116
Design of sparse IIR filters using LARS algorithm
Yuki Shimozaki, Masayoshi Nakamoto (Hiroshima Univ.)
pp. 152 - 157

SIP2020-117
Nonlinear Modeling of Electro-dynamic Loudspeaker by Nonlinear IIR Filter
Kenta Iwai, Takanobu Nishiura (Ritsumeikan Univ.)
pp. 158 - 163

SIP2020-118
Estimation of imagined speech from electrocorticogram with an encoder-decoder model
Kotaro Hayashi, Shuji Komeiji (TUAT), Takumi Mitsuhashi, Yasushi Iimura, Hiroharu Suzuki, Hidenori Sugano (Juntendo Univ.), Koichi Shinoda (TokyoTech), Toshihisa Tanaka (TUAT)
pp. 164 - 169

SIP2020-119
Evaluation of Attention Fusion based Audio-Visual Target Speaker Extraction on Real Recordings
Hiroshi Sato, Tsubasa Ochiai, Keisuke Kinoshita, Marc Delcroix, Tomohiro Nakatani, Shoko Araki (NTT)
pp. 170 - 175

SIP2020-120
A Vocoder-free Any-to-Many Voice Conversion using Pre-trained vq-wav2vec
Takeshi Koshizuka, Hidefumi Ohmura, Kouichi Katsurada (TUS)
pp. 176 - 181

Note: Each article is a technical report without peer review, and its polished version will be published elsewhere.

The Institute of Electronics, Information and Communication Engineers (IEICE), Japan