電子情報通信学会技術研究報告

Online edition: ISSN 2432-6380

Volume 122, Number 389

音声

開催日 2023-02-28 - 2023-03-01 / 発行日 2023-02-21

[TOP] | [2019] | [2020] | [2021] | [2022] | [2023] | [2024] | [2025] | [Japanese] / [English]

[PROGRAM] [BULK PDF DOWNLOAD]

目次

SP2022-39
基本周波数制御可能な高速ニューラル波形生成モデルの比較
○清水聡太（神戸大/NICT）・岡本拓磨（NICT）・高島遼一・滝口哲也（神戸大）・戸田智基（名大/NICT）・河井　恒（NICT）
pp. 1 - 6

SP2022-40
MS-FC-HiFiGAN : 学習可能な軽量アップサンプリングを用いた高速ニューラル波形生成モデル
○山下陽生（神戸大/NICT）・岡本拓磨（NICT）・高島遼一・滝口哲也（神戸大）・戸田智基（名大/NICT）・河井　恒（NICT）
pp. 7 - 12

SP2022-41
real-time MRIで収録した調音運動に基づくend-to-end音声合成
○大谷祐人・澤田　隼・大村英史・桂田浩一（東京理科大）
pp. 13 - 18

SP2022-42
発声タイミングのずれを考慮したフレーム駆動型アテンション機構に基づく歌声合成
○西原美玖・法野行哉・橋本　佳・南角吉彦・徳田恵一（名工大）
pp. 19 - 24

SP2022-43
信号保護に基づく音響システム測定法の拡張について～繰り返しと直交化による後付けでの分析～
○河原英紀（和歌山大）・矢田部浩平（東京農工大）・榊原健一（北海道医療大）・水町光徳（九工大）
pp. 25 - 30

SP2022-44
オイラーグラフ系列にもとづく非可聴音波通信のためのホッピングパターンの設計に関する一検討
○青木直史・尾関剛成（北大）・池田研一・安田　寛・難波弘行（スマート・ソリューション・テクノロジー）
pp. 31 - 34

SP2022-45
小規模無響室内測定における反射音の影響
○樋口達也・金田　豊・陶山健仁（東京電機大）
pp. 35 - 40

SP2022-46
正中面のPNPモデルによる全天空個人化頭部伝達関数の生成
○中村風香・飯田一博（千葉工大）
pp. 41 - 48

SP2022-47
未知の劣化に頑健な画像分類のための拡散モデルを用いた画像再構成法
○赤澤輝昭（都立大）・木下裕磨（東海大）・貴家仁志（都立大）
pp. 49 - 54

SP2022-48
自己共分散行列空間における信号検出手法とそのロバスト性解析
○小野悠介・彭　林玉（慶大）
pp. 55 - 60

SP2022-49
LiGMEモデルを用いた多層非凸正則化によるグループスパース・低ランク凸最適化信号復元
○勝間朱里・京地清介（工学院大）・小野峻佑（東工大）・アイヴァンセレスニック（ニューヨーク大）
pp. 61 - 66

SP2022-50
共通誤差最小化に基づく音響エコー・雑音キャンセラ
○岩居健太・西浦敬信（立命館大）
pp. 67 - 72

SP2022-51
［招待講演］マルチスポット再生 meets 多言語ニューラル音声合成～実装 is ホンマに all we need ～
○岡本拓磨（NICT）
pp. 73 - 76

SP2022-52
［招待講演］深層生成モデルと信号の独立性に基づく多チャンネル音源分離
○李　莉（サイバーエージェント）
p. 77

SP2022-53
音響イベント定位・検出のための空間情報付き映像・音響信号を用いた自己教師あり学習
○藤田陽斗（京大）・坂東宜昭（産総研）・井本桂右（同志社大/産総研）・大西正輝（産総研）・吉井和佳（京大）
pp. 78 - 82

SP2022-54
Visual onoma-to-wave：画像オノマトペと音源画像を利用した環境音合成の提案
○大中緋慧（徳山高専）・高道慎之介（東大）・井本桂右（同志社大）・岡本悠希（立命館大）・藤井一貴・猿渡　洋（東大）
pp. 83 - 88

SP2022-55
リー群論に基づく一般化ワーピング
○宮下敦志・戸田智基（名大）
pp. 89 - 94

SP2022-56
基本周波数適応型聴覚表現による声道長推定
○入野俊夫・土庵晋太郎（和歌山大）
pp. 95 - 100

SP2022-57
目的信号に雑音を用いるDNN雑音除去の検討
○広政遼汰・大中緋慧・宮崎亮一（徳山高専）
pp. 101 - 106

SP2022-58
1-2-2マルチチャネル能動騒音制御システムの新しい構成法
○藤井健作（コダウェイ研）・棟安実治（関西大）・苣木禎史（千葉工大）
pp. 107 - 114

SP2022-59
能動騒音制御システムにおける帰還系の常時推定法
○藤井健作（コダウェイ研）・棟安実治（関西大）・苣木禎史（千葉工大）
pp. 115 - 122

SP2022-60
複素重み付け加算回路の抑圧量に基づく音源定位法
○日高　司・陶山健仁（東京電機大）
pp. 123 - 128

SP2022-61
周波数領域適応フィルタの残留ノイズ除去への適用
○古澤　魁・陶山健仁（東京電機大）
pp. 129 - 134

SP2022-62
CSD係数FIRフィルタ設計のためのグループ化ACOの分割数の検討
○森川まり花・陶山健仁（東京電機大）
pp. 135 - 140

SP2022-63
自己教師有り学習モデルXLSRと日本語諸方言コーパスを利用した諸方言音声認識モデル
○三輪祥吾・甲斐充彦（静岡大）
pp. 141 - 146

SP2022-64
Neural Transducer型音声認識におけるScheduled Samplingの検討
○森谷崇史・芦原孝典・佐藤　宏・松浦孝平・田中智大・増村　亮（NTT）
pp. 147 - 152

SP2022-65
Domain Adaptation for Improving End-to-end ASR Performance of Classroom Speech with Variable Recording Condition
○Raufun Nahar・Rino Suzuki・Atsuhiko Kai（Shizuoka Univ.）
pp. 153 - 158

SP2022-66
日本語音声認識における語彙集合分割とマルチタスク学習による目的語彙抽出
○伊藤　葵（LINE/法政大）・小松達也・藤田雄介（LINE）
pp. 159 - 164

SP2022-67
半教師あり学習に基づく音響シーンと音響イベントの同時分析
○五十嵐彩美・椿　竣介・井本桂右（同志社大）
pp. 165 - 170

SP2022-68
摩擦音の特徴抽出とハンドトラッキングを用いた振幅変調信号生成に基づく超音波空中ハプティクスの質感再現
○上田明日斗・高橋　徹・中山雅人（阪産大）
pp. 171 - 176

SP2022-69
多チャネル音源分離のための独立低ランク行列分析に対するスペクトログラム無矛盾性に基づく正則化項の設計
○三澤颯大・高宗典玄（東大）・矢田部浩平（東京農工大）・北村大地（香川高専）・猿渡　洋（東大）
pp. 177 - 184

SP2022-70
位相変動を考慮した複素数値ハイブリッドニューラルネットワークによる異常音検知
○西山翔大・玉森　聡（愛知工大）
pp. 185 - 190

SP2022-71
入力特徴量で条件づけた拡散確率モデルによるパラレル声質変換
○岸田拓也・中鹿　亘（電通大）
pp. 191 - 196

SP2022-72
日本語音声合成におけるアクセント句韻律特徴量の表現と予測
○佐藤匡紀・高道慎之介・猿渡　洋（東大）
pp. 197 - 202

SP2022-73
音声対話システムのための入力音声の感情に同調する声質変換とx-vector埋め込みを用いたテキストからの音声合成方式の検討
○小原俊一・阿部匡伸・原　直（岡山大）
pp. 203 - 208

SP2022-74
音響特徴量系列の変調に基づいた斉唱音声合成の検討
○宮沢　宙・菊地晏南・齋藤大輔・峯松信明（東大）
pp. 209 - 214

SP2022-75
4マイクロホンの音圧レベル比に基づくスピーカー放射方向のオンライン推定
○津田龍星・前川大樹・粟谷朋留・中山雅人・高橋　徹（阪産大）
pp. 215 - 220

SP2022-76
DNN音声強調におけるNoisy-target Trainingの分析と実応用に向けた調査
○藤村拓弥・戸田智基（名大）
pp. 221 - 226

SP2022-77
スライディングDCT入力2DCNNを用いた固定フィルタ選択ANCシステムに関する検討
○土井健矢・梶川嘉延（関西大）
pp. 227 - 231

SP2022-78
Predominant Instrument Recognition in Polyphonic Music Based on Transfer Learning with Vanilla ResNet-50
○Lifan Zhong・Daisuke Saito・Nobuaki Minematsu（UTokyo）
pp. 232 - 237

SP2022-79
［招待講演］What Do Self-Supervised Speech Representation Models Know? -- A Layer-Wise Analysis --
○Karen Livescu・Ankita Pasad・Ju-Chieh Chou・Bowen Shi（TTI-Chicago）
p. 238

SP2022-80
［招待講演］Speech and Language Research in the Google Tokyo Office
○Michiel Bacchiani（Google）
pp. 239 - 240

SP2022-81
Personality Recognition on Dyadic Interactions with Representation Learning
○Nathania Nah（Tokyo Tech）・Takafumi Koshinaka（YCU）・Koichi Shinoda（Tokyo Tech）
pp. 241 - 246

SP2022-82
自己教師あり学習に基づく話者照合における言語性の影響
○若松智花（都立大）・安藤厚志（NTT）・塩田さやか（都立大）・増村　亮（NTT）・貴家仁志（都立大）
pp. 247 - 252

SP2022-83
Increasing speech intelligibility for evacuation guidance by mimicking professional announcers' voice -- Discussion on speech intelligibility and its physical correlates --
○KimDung Tran・Masato Akagi・Masashi Unoki（JAIST）
pp. 253 - 258

SP2022-84
合成音検出を用いた話者照合のためのデータクレンジングの検討
○和田賢造・塩田さやか・貴家仁志（都立大）
pp. 259 - 263

SP2022-85
音声エージェントの見た目と音声の印象合致度に対する人工感付与の影響
○井浦昂太・増田尚建・齋藤大輔・峯松信明（東大）
pp. 264 - 269

SP2022-86
クラス事後確率に基づくミックスボイスを含めた声区情報の定量化
○北村　悠・菊地晏南・齋藤大輔・峯松信明（東大）
pp. 270 - 275

SP2022-87
Multiscale Manifold Clustering and Embedding with Multiple Kernels
○Kyohei Suzuki・Masahiro Yukawa（Keio Univ.）
pp. 276 - 281

SP2022-88
有向グラフ信号に対する実フィルタ設計に関する検討
○村松正吾・北村帆高・安田浩保（新潟大）・田中雄一（阪大）
pp. 282 - 287

SP2022-89
ループ展開ISTAによる低ビット画像復元
○阿部　周・高橋颯志・村松正吾（新潟大）
pp. 288 - 293

SP2022-90
ハイブリッドANCシステムにおけるバーチャルセンシング法の検討
○豊岡祥太・梶川嘉延（関西大）
pp. 294 - 299

SP2022-91
顕著性とエッジの融合によるReverse Attentionを用いたRGB-D顕著物体検出
○池田智輝・池原雅章（慶大）
pp. 300 - 305

注：本技術報告は査読を経ていない技術報告であり，推敲を加えられていずれかの場に発表されることがあります．

IEICE / 電子情報通信学会