IEICE Technical Report

Online edition: ISSN 2432-6380

Pattern Recognition and Media Understanding

Workshop Date : 2018-06-28 - 2018-06-29 / Issue Date : 2018-06-21

PRMU2018-21
[Invited Talk] Active perception and object handling by robots with deep learning
Tetsuya Ogata (Waseda University/AIST)
pp. 1 - 2

PRMU2018-22
Language model utilizing image features for automatic speech recognition
Aiko Hagiwara, Hitoshi Ito, Manon Ichiki, Takeshi Mishima, Shoei Sato (NHK)
pp. 3 - 6

PRMU2018-23
Study of improving speech intelligibility for glossectomy patients via voice conversion with sound and lip movement.
Seiya Ogino, Hiroki Murakami, Sunao Hara, Masanobu Abe (Okayama Univ.)
pp. 7 - 12

PRMU2018-24
Multimodal voice conversion using deep bottleneck features and deep canonical correlation analysis
Satoshi Tamura, Kento Horio, Hajime Endo, Satoru Hayamizu (Gifu Univ.), Tomoki Toda (Nagoya Univ.)
pp. 13 - 18

PRMU2018-25
Sound recovery using vibration mode of an object in video
Yohei Fuse, Yusuke Yasumi, Tetsuya Takiguchi (Kobe Univ.)
pp. 19 - 24

PRMU2018-26
Analysis of solution diversity about topic model
Toshio Uchiyama (HIU)
pp. 25 - 30

PRMU2018-27

Saemi Choi (UT), Gloria Zen, Nicu Sebe (UniTrento), Kiyoharu Aizawa (UT)
pp. 31 - 33

PRMU2018-28
(See Japanese page.)
pp. 35 - 39

PRMU2018-29
Revisiting interference-free power spectral representations of periodic signals
Hideki Kawahara (Wakayama Univ.), Masanori Morise (Univ. Yamanashi), Kanru Hua (Univ. Illinois)
pp. 41 - 46

PRMU2018-30
Analysis of speech-to-texture sentiment association characteristics
Win Thuzar Kyaw, Yoshinori Sagisaka (Waseda Univ.)
pp. 47 - 52

PRMU2018-31
Speaker adaptation in speech synthesis based on neural networks including temporal structure modeling
Kento Nakao, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, Keiichi Tokuda (NIT)
pp. 53 - 58

PRMU2018-32
Mapping Acoustic Vector Sequence to Document Vector Based on RNN
Ryota Nishimura, Miho Higaki, Norihide Kitaoka (Tokushima Univ.)
pp. 59 - 64

PRMU2018-33
[Invited Talk]
Koichi Shinoda (TokyoTech)
p. 65

PRMU2018-34
Discovery of Corresponding Dimensions Between Multiple Multidimensional Sequences -- Applications and Accelerations of Equivalence Structure Extraction --
Seiya Satoh (AIST), Yoshinobu Takahashi (UEC), Hiroshi Yamakawa (Dwango)
pp. 67 - 71

PRMU2018-35
Symbol Classification and Pitch Recognition in Offline Handwritten Musical Score
Yuki Hayakawa, Tetsushi Wakabayashi, Yasuji Miyake (Mie Univ.), Wataru Ohyama (Kyushu Univ.)
pp. 73 - 77

Note: Each article is a technical report without peer review, and its polished version will be published elsewhere.

The Institute of Electronics, Information and Communication Engineers (IEICE), Japan