Online edition: ISSN 2432-6380
[TOP] | [2018] | [2019] | [2020] | [2021] | [2022] | [2023] | [2024] | [Japanese] / [English]
SIP2023-108
話者照合のための声道長摂動に基づく疑似話者生成によるデータ拡張
○若松智花・塩田さやか・貴家仁志(都立大)
pp. 1 - 6
SIP2023-109
話者照合のための話者性の変動量を考慮した声道長摂動による疑似話者生成
○大野史夏・若松智花・塩田さやか(都立大)
pp. 7 - 12
SIP2023-110
音声品質と音響環境の潜在変数で条件付けたDenoising Trainingによるノイズロバスト音声変換
○五十嵐琢斗・齋藤佑樹・関 健太郎・高道慎之介(東大)・山本龍一・橘 健太郎(LY)・猿渡 洋(東大)
pp. 13 - 18
SIP2023-111
年齢情報とのマルチタスク学習による高齢者音声認識の高精度化
○新惠拓実・木内貴浩・若林佑幸・北岡教英(豊橋技科大)
pp. 19 - 24
SIP2023-112
非負値行列因子分解を用いた音光変換デバイス「ブリンキー」の光信号飽和時における伝達係数と信号の同時推定
○西田光佑・植野夏樹・小野順貴(都立大)・北村大地(香川高専)
pp. 25 - 30
SIP2023-113
プロジェクションバックされた分離行列の直接更新
○栗城結衣・中嶋大志・小野順貴(都立大)
pp. 31 - 36
SIP2023-114
日常会話の発話重畳分析と非同期分散録音に対するオンライン独立ベクトル分析による分離の検討
○南木春希・中嶋大志・山岡洸瑛・若林佑幸・小野順貴(都立大)
pp. 37 - 42
SIP2023-115
空間正則化付き独立低ランク行列分析におけるベクトルワイズ座標降下法の高速化・安定化アルゴリズム
○石川悠人・大久保拓哉・高宗典玄(東大)・中村友彦(産総研)・北村大地(香川高専)・猿渡 洋(東大)・高橋 祐・近藤多伸(ヤマハ)
pp. 43 - 50
SIP2023-116
カーネル補間による入射音場推定における散乱体形状の影響評価
○小塚詩穂里(NTT)・小山翔一(NII)・伊藤弘章・鎌土記良(NTT)
pp. 51 - 56
SIP2023-117
騒音制御フィルタ選択によるバーチャルセンシングフィードバックANCシステムに関する検討
○豊岡祥太・梶川嘉延(関西大)
pp. 57 - 60
SIP2023-118
大規模モノラルダークデータを用いた音響イベント定位・検出の構築
○坂東宜昭(産総研)・廣橋義寛・新原竜馬(デンソー)
pp. 61 - 64
SIP2023-119
Filtered-x法型能動騒音制御システムを安定に動作させる条件について
○藤井健作(コダウェイ研)・棟安実治(関西大)・苣木禎史(千葉工大)
pp. 65 - 72
SIP2023-120
クワドロコプタを用いた災害時生存者捜索のための音源定位の検討 ~ PyRoomAcousticsを用いた環境モデリングとMUSIC法に関わる要因の分析 ~
○鎌田賢知(早大)・大和淳司(工学院大)・及川靖広・奥乃 博・大谷 淳(早大)
pp. 73 - 78
SIP2023-121
音声を用いた心理的ストレスによる心の不調有無推定モデルの構築
○加藤花歩・高島瑛彦・菊入 圭・吉村 健(NTTドコモ)
pp. 79 - 84
SIP2023-122
複数のラグ窓対を用いた音声基本周波数と周期性尺度の推定
○越森道貴(電通大)・嵯峨山茂樹(東大/電通大)・中鹿 亘(電通大)
pp. 85 - 90
SIP2023-123
A Study on Automatic Performance for Emulating the Playing Style of a Specific Pianist using Feature Extraction with LSTM and Score Analysis
○Li Senhao・Matsuno Yutaka(Nihon Univ.)
pp. 91 - 96
SIP2023-124
サンプリング定理とオンライン辞書学習に基づくグラフ上の動的なセンサ配置選択
○野村紗希(東京農工大)・原 惇也・東 広志・田中雄一(阪大)
pp. 97 - 102
SIP2023-125
グラフ転移学習と最適輸送に基づく時変ネットワークのための非同期カルマンフィルタ
○福原伝博・原 惇也・東 広志・田中雄一(阪大)
pp. 103 - 108
SIP2023-126
Kernel-Induced Sampling Theorem for A Class of Mapping-Prescribed Reproducing Kernel Hilbert Spaces
○Akira Tanaka(Hokkaido Univ.)
pp. 109 - 114
SIP2023-127
Vision Transformer の連合学習のためのモデル精度の劣化を生じないプライバシー保護強化法
○麻生 伶・塩田さやか・貴家仁志(都立大)
pp. 115 - 120
SIP2023-128
スパース係数の秘匿を考慮した深層展開でのISTAによるLASSO解推定
○由解仁知翔・仲地孝之(琉球大)
pp. 121 - 126
SIP2023-129
軽量で解釈可能な深層学習モデルを用いた脳波の睡眠段階分類
○伊藤青空・田中聡久(東京農工大)
pp. 127 - 132
SIP2023-130
非凸スパース最適化を用いた分類性基準の要素選択
○河村泰雅・植野夏樹・小野順貴(都立大)
pp. 133 - 138
SIP2023-131
不可逆な飽和歪みを伴う観測系に基づくパラメータ推定におけるクラメール・ラオの下界の導出
○植野夏樹・亀岡弘和(NTT)
pp. 139 - 144
SIP2023-132
行列補間のための適応的部分空間クラスタリング
○和田拓土(法政大)・佐々木亮平(東京工科大)・小西克巳(法政大)
pp. 145 - 149
SIP2023-133
連合学習における更新情報の類似度に基づくビザンチン攻撃検出法
○大野賢太・山岸昌夫(法政大)
pp. 150 - 155
SIP2023-134
分散マイクロホンアレイネットワークに基づく矩形領域内部の複数音源定位システム
○高橋 徹・福田光太郎・上林大輝・大垣 斉(阪産大)・東川諒央(coroutine)・中山雅人(阪産大)
pp. 156 - 161
SIP2023-135
IVAとDNNを近接平均化した優決定BSSに用いるDNNのアーキテクチャの比較
○松本和樹(早大)・山田宏樹・矢田部浩平(東京農工大)
pp. 162 - 167
SIP2023-136
全方位音源追尾のためのマイクロホン対の役割選択
○佐々木遥人・陶山健仁(東京電機大)
pp. 168 - 173
SIP2023-137
音源信号の独立化に基づく残留ノイズ除去
○古澤 魁・陶山健仁(東京電機大)
pp. 174 - 179
SIP2023-138
指向性設計の抑圧区間に対する指定誤差の有効性
○日高 司・陶山健仁(東京電機大)
pp. 180 - 184
SIP2023-139
高空間解像度マイクロホン対を用いた複数音源定位
○堀 智也・陶山健仁(東京電機大)
pp. 185 - 189
SIP2023-140
話者性を制御可能な音声合成のための話者埋め込み空間に関する実験的検討
○森田湧大・齋藤大輔・峯松信明(東大)
pp. 190 - 195
SIP2023-141
下位N位スコア平均に基づくMOS予測モデル学習
○近藤祐斗・亀岡弘和・田中 宏・金子卓弘(NTT)
pp. 196 - 201
SIP2023-142
Remixed2Remixedを用いた音声強調のモデル学習法の改善
○李 莉・関 翔悟(サイバーエージェント)
pp. 202 - 207
SIP2023-143
仮想歩行アプリケーションにおける静止状態での環境音合成に関する検討
○西島大史・森田湧大・齋藤大輔・峯松信明(東大)
pp. 208 - 213
SIP2023-144
テキストのない音声に対する自己教師あり学習モデルによる音声合成の分析 ~ 多言語活用を中心に ~
○朴 浚鎔・齋藤大輔・峯松信明(東大)
pp. 214 - 219
SIP2023-145
VQ-VAEに基づく解釈可能なアクセント潜在変数を用いた多方言音声合成
○山内一輝・齋藤佑樹・猿渡 洋(東大)
pp. 220 - 225
SIP2023-146
大規模言語モデルを活用した電子カルテ一括音声入力インタフェースの構築と評価
○前島 亮・北岡教英(豊橋技科大)
pp. 226 - 231
SIP2023-147
多言語SSLモデルに基づく音声認識のノンパラレルコーパスのみを用いたドメイン適応
○木内貴浩(豊橋技科大)・小川厚徳(NTT)・若林佑幸(豊橋技科大)・太田健吾(阿南高専)・北岡教英(豊橋技科大)
pp. 232 - 237
SIP2023-148
複数音声認識モデルを統合した音声認識システムの高精度化
○北條圭悟・若林佑幸(豊橋技科大)・太田健吾(阿南高専)・小川厚徳(NTT)・北岡教英(豊橋技科大)
pp. 238 - 243
SIP2023-149
話者適応による聴覚障害者音声認識の評価
○高橋快斗・木内貴浩・若林佑幸(豊橋技科大)・太田健吾(阿南高専)・小林彰夫(大和大)・北岡教英(豊橋技科大)
pp. 244 - 249
SIP2023-150
x-vectorの話者空間を利用した2話者間の中間話者音声合成
○細井颯太・木内貴浩・若林佑幸・北岡教英(豊橋技科大)
pp. 250 - 255
SIP2023-151
潜在変数と観測データにガンマ分布を仮定したVAEによる音声振幅スペクトル表現
○今市夏菜子・中鹿 亘(電通大)
pp. 256 - 261
SIP2023-152
音声認識器の継続学習のためのモデルアベレージング手法における重み設定方法に関する検討
○品山健太朗・佐藤 宏・岩田具治・森 岳至・浅見太一(NTT)
pp. 262 - 267
SIP2023-153
CTC音声認識モデルにおけるビームサーチデコーディング内での暗黙的言語情報の置換
○高城巽成・若林佑幸(豊橋技科大)・小川厚徳(NTT)・北岡教英(豊橋技科大)
pp. 268 - 273
SIP2023-154
異常検知を目的とした音響信号による織機動作解析の検討
○酒向慎司(名工大)
pp. 274 - 276
SIP2023-155
Transformerを用いた脳波信号からの音声復元の検討
○水野友暁(電通大)・岸田拓也(愛知淑徳大)・吉村奈津江(東工大)・中鹿 亘(電通大)
pp. 277 - 282
SIP2023-156
音源波形状に着目した地声-裏声変換と音源波パラメータの制御
○岡田翔太・北村 悠・齋藤大輔・峯松信明(東大)
pp. 283 - 288
SIP2023-157
Black-Box Adversarial Attack for Math Formula Recognition Model
○Haruto Namura・Masatomo Yoshida(Doshisha Univ.)・Nicola Adami(UNIBS)・Masahiro Okuda(Doshisha Univ.)
pp. 289 - 293
SIP2023-158
共通誤差最小化に基づく音響エコー・雑音キャンセラのための可変ステップサイズ
○岩居健太・西浦敬信(立命館大)
pp. 294 - 299
SIP2023-159
音楽想起時における脳波の時間周波数,事象関連電位,有向接続性解析
○後藤麻友・チャンポーンパックディー インオン・松永華月・伊藤秀真・田中聡久(東京農工大)
pp. 300 - 305
SIP2023-160
混合音声の無相関化に基づくブラインド信号源分離
○齋藤晋哉・大石邦夫(東京工科大)
pp. 306 - 308
SIP2023-161
ピッチシフトおよびソフトクリッピングによるヴィオラからチェロへの音色変換
○吉野夏樹・田中 章(北大)
pp. 309 - 314
SIP2023-162
微分方程式に基づく有限次数調波信号の多重ピッチ推定
○山田健太・升山義紀・山岡洸瑛・植野夏樹・小野順貴(都立大)
pp. 315 - 320
SIP2023-163
H∞制御理論を用いた肩掛け型ウェアラブルスピーカの逆フィルタ設計 ~ MIMOシステムへの拡張と評価 ~
○喜田健司(大同大)
pp. 321 - 326
SIP2023-164
スパース表現を用いた成分選択によるリモート合唱音源の混合法
○太田晴紀・高橋弘太(電通大)
pp. 327 - 332
SIP2023-165
[招待講演]これから始める環境音分析・合成
○井本桂右(同志社大)
p. 333
SIP2023-166
Clarity Prediction Challenge 2のための音声基盤モデルベースの音声了解度の客観評価指標の調査
○山本克彦(サイバーエージェント)
pp. 334 - 339
SIP2023-167
正中面及び矢状面上の異なる仰角に配置された2音源間の空間的マスキング効果について
○藤城博人・西口正之・渡邉貫治・安倍幸治(秋田県立大)
pp. 340 - 345
SIP2023-168
ピアノ音に対する音階と残響のモーフィング
○箱田由馬・土屋隆生(同志社大)
pp. 346 - 351
SIP2023-169
マイクロホン数を削減したビームフォーミングが音空間合成に与える要因
○大屋敷凌佑・渡邉貫治・西口正之・安倍幸治(秋田県立大)
pp. 352 - 359
SIP2023-170
動的な音源の方位及び帯域が再生音の遅延の検知限に与える影響
○齋藤優季・西口正之・渡邉貫治・安倍幸治(秋田県立大)
pp. 360 - 367
SIP2023-171
パンニングによるバイノーラルレンダリングのための学習による代表頭部インパルス応答の生成
○法師人和希・西口正之・渡邉貫治・安倍幸治(秋田県立大)
pp. 368 - 375
SIP2023-172
音源の放射特性を用いたバイノーラル合成における仮想音源の回転方向の弁別
○西山織絵(千葉工大)・堀内俊治・大久保翔太(KDDI総合研)・苣木禎史(千葉工大)
pp. 376 - 381
SIP2023-173
音光変換デバイス「ブリンキー」の分散配置に基づく発話検出のシミュレーション評価
○本山智司・植野夏樹・安田昌弘(都立大)・木下裕磨(東海大)・小野順貴(都立大)
pp. 382 - 387
SIP2023-174
車内環境における音声認識のための多チャンネルブラインド音源分離の性能評価
○竹内柚月・植野夏樹・小野順貴(都立大)・高沢剛史・島ノ江修平・種村友貴(ミライズテクノロジーズ)
pp. 388 - 393
SIP2023-175
大規模事前学習と動的畳み込みを用いた悪天候による劣化の除去
○山下修吾・池原雅章(慶大)
pp. 394 - 399
SIP2023-176
定位的頭蓋内脳波からの傾聴メロディの再合成
○稲葉湧大・熊谷優惟子・吉村直己・古明地秀治(東京農工大)・三橋 匠・飯村康司・鈴木皓晴・菅野秀宜(順天堂大)・田中聡久(東京農工大)
pp. 400 - 405
SIP2023-177
無向グラフ信号解析のための高グラフ周波数密度グラフフーリエフレームの設計
二谷海都・○京地清介(工学院大)
pp. 406 - 410
SIP2023-178
Generating Japanese-accented English voices of 3 types according to the listening proficiency of Japanese ESL learners
○Kiyotada Mori・Yasuo Miyoshi・Ryo Okamoto(Kochi Univ.)
pp. 411 - 414
SIP2023-179
音声エージェントの印象に合致する音声の加工強度の予測
○宮本 蓮・森田湧大・齋藤大輔・峯松信明(東大)
pp. 415 - 420
SIP2023-180
テキスト生成の自動評価尺度に基づく音声生成の自動評価
○佐伯高明(東大)・マイティ ソウミ(カーネギーメロン大)・高道慎之介(東大)・渡部晋治(カーネギーメロン大)・猿渡 洋(東大)
pp. 421 - 426
注: 本技術報告は査読を経ていない技術報告であり,推敲を加えられていずれかの場に発表されることがあります.