6月23日(金) 午前 開会の辞 09:20 - 09:30 |
(1) |
09:20-09:30 |
音学シンポジウム2023の開催にあたって
相原龍 (三菱電機), 中村栄太 (京都大学), 橋本佳 (名古屋工業大学), 橘亮輔 (産業技術総合研究所), 若山圭吾 (日本電信電話) |
6月23日(金) 午前 招待講演 09:30 - 12:00 |
(2) |
09:30-10:40 |
LINE CLOVAの音声認識技術
木田祐介 (ワークスモバイルジャパン), 藤田雄介 (LINE) |
|
10:40-10:50 |
休憩 ( 10分 ) |
(3) |
10:50-12:00 |
ダイナフォーミックス:音楽を創造する喜びを創出する研究・開発・教育
古屋晋一 (ソニーコンピュータサイエンス研究所) |
|
12:00-12:10 |
休憩 ( 10分 ) |
6月23日(金) 午後 ポスター概要発表1 12:10 - 12:50 |
|
- |
ポスター概要発表1 |
|
12:50-13:50 |
休憩 ( 60分 ) |
6月23日(金) 午後 ポスターセッション1 13:50 - 16:10 |
(4) |
13:50-16:10 |
JTubeSpeech-ASV: YouTube から構築された話者照合のための日本語を主とした音声コーパス
○塩田さやか, 永森輝, 若松智花 (東京都立大学), 高道慎之介 (東京大学) |
(5) |
13:50-16:10 |
睡眠を誘発する音声刺激の生成に向けた分析と評価
◎熊田順一, 齋藤佑樹, 高道慎之介, 渡邊亞椰, 丹治尚子 (東京大学), 長野瑞生, 井島勇祐 (NTT), 猿渡洋 (東京大学) |
(6) |
13:50-16:10 |
ChatGPT-EDSS: ChatGPT由来のContext Word Embeddingから学習される共感的対話音声合成モデル
○齋藤佑樹, 高道慎之介, 飯森英治 (東京大学), 橘健太郎 (LINE株式会社), 猿渡洋 (東京大学) |
(7) |
13:50-16:10 |
低資源な叫び声合成に対するデータ拡張方法の影響
◎白鳥恵大, 有本泰子 (千葉工業大学) |
(8) |
13:50-16:10 |
CVAEを用いたウェーブテーブル合成の意味的な音色制御
◎湯谷承将, 山本雄也 (筑波大学), 中谷秀洋 (サイボウズ・ラボ株式会社), 寺澤洋子 (筑波大学) |
(9) |
13:50-16:10 |
個別楽器音に基づいた楽曲間類似度のための分離表現学習
○橋爪優果, 李莉, 宮下敦志, 戸田智基 (名古屋大学) |
(10) |
13:50-16:10 |
歌唱中の手の動きが歌唱のテンポ維持に及ぼす影響について
◎小野坂浩, 常盤達司 (広島市立大学大学院) |
(11) |
13:50-16:10 |
少量データからの対旋律生成を目的とした深層学習モデルの検討
◎大森陽 (早稲田大学), 北原鉄朗 (日本大学), 菅野由弘 (早稲田大学) |
(12) |
13:50-16:10 |
Sensitivity to Phonemic Contrasts and Insensitivity to Non-phonemic Contrasts of Various Speech Representations Examined for Pronunciation Assessment
◎Sun Haitong, Gao Yingxiang, Yusuke Shozui, Ma Tong, Minematsu Nobuaki (The University of Tokyo) |
(13) |
13:50-16:10 |
メロディスロットマシンHD
○浜中雅俊 (理化学研究所) |
(14) |
13:50-16:10 |
VAEを用いたヴァイオリン製作者の分類
○石垣優弥, 横山真男 (明星大学) |
(15) |
13:50-16:10 |
絶対音感保有者と声のピッチ感の錯覚: 疑似歌声・疑似ささやき声を用いた検討
○内田照久 (大学入試センター 研究開発部), 饗庭絵里子 (電気通信大学) |
(16) |
13:50-16:10 |
私たちが声から読み取る性別情報: 日本語母語話者を対象とした性別弁別能の調査
◎菅野聖真 (豊橋技術科学大学院), 河原英紀 (和歌山大学), 松井淑恵 (豊橋技術科学大学) |
(17) |
13:50-16:10 |
モーラ単位で高さを制御可能な音声デザインを前提とした日本語テキスト音声合成システムの試作
○森勢将雅 (明治大学) |
(18) |
13:50-16:10 |
歌声識別タスクのための事前学習済み自己教師ありフロントエンドの調査
○山本雄也 (筑波大学) |
(19) |
13:50-16:10 |
複素スパースベイズ推定に基づく小規模マイクロホンアレイによる音源測距に関する考察
◎有泉千太, 鳥谷輝樹, 小澤賢司 (山梨大学) |
(20) SP |
13:50-16:10 |
[ポスター講演]非同期検波方式による楽器音の基本周波数推定に関する研究 SP2023-1 |
○三堀二知加・山川拓真・三輪賢一郎(サレジオ高専) |
(21) SP |
13:50-16:10 |
FaderNetを用いた未知話者に対する音声印象変換 SP2023-2 |
○釘本 咲・中鹿 亘(電通大) |
(22) SP |
13:50-16:10 |
日本語のピッチアクセントの特徴表現とその知覚的妥当性 ~ 日本語音声教育への応用のための基礎的検討 ~ SP2023-3 |
○勝瀬郁代(近畿大) |
(23) SP |
13:50-16:10 |
深層学習を用いたアカペラ歌声分離における歌声合成による教師データ拡張の検討 SP2023-4 |
○風間香伽(都立大)・木下裕磨(東海大)・植野夏樹・小野順貴(都立大) |
(24) SP |
13:50-16:10 |
[ポスター講演]MS-Harmonic-Net++ vs SiFi-GAN: 基本周波数制御可能な高速ニューラル波形生成モデルの比較 SP2023-5 |
○清水聡太(神戸大/NICT)・岡本拓磨(NICT)・高島遼一(神戸大)・大谷大和(NICT)・滝口哲也(神戸大)・戸田智基(名大/NICT)・河井 恒(NICT) |
(25) SP |
13:50-16:10 |
[ポスター講演]リアルタイムMRIを用いたオペラ歌唱における音高変化時の声道形状の制御 SP2023-6 |
○戸田菜月・竹本浩典(千葉工大)・高橋 純(阪芸術大) |
(26) SP |
13:50-16:10 |
[ポスター講演]Diff-SVCを用いたオペラ歌唱音声合成 SP2023-7 |
○菅原碧斗(神戸大)・岸本宗真・足立優司・田井清登(メック)・高島遼一・滝口哲也(神戸大) |
(27) SP |
13:50-16:10 |
オールパスフィルタの接続に基づく拡張された時間伸長パルスの位相設定に用いる関数の選択について SP2023-8 |
○河原英紀(和歌山大)・矢田部浩平(東京農工大) |
(28) SP |
13:50-16:10 |
音素クラス属性を考慮した感情ラベル列の推定による音声感情認識 SP2023-9 |
○永瀬亮太郎・福森隆寛・山下洋一(立命館大) |
(29) SP |
13:50-16:10 |
[ポスター講演]歌詞と歌唱音声のアライメント崩れに基づく替え歌検知 SP2023-10 |
○有賀智輝・樋口陽祐(早大)・菅野光則・執行里恵・水口天都・岡本直紀(第一興商)・小川哲司(早大) |
(30) SP |
13:50-16:10 |
[ポスター講演]発話音声の感情情報に基づく色つき字幕画像生成の検討 SP2023-11 |
○中村史也(神戸大)・相原 龍(三菱電機)・高島遼一・滝口哲也(神戸大)・伊谷裕介(三菱電機) |
(31) SP |
13:50-16:10 |
暗黙的言語情報を置換するCTCデコーダを用いた ストリーミング音声認識 SP2023-12 |
○高城巽成(豊橋技科大)・小川厚徳(NTT)・北岡教英・若林佑幸(豊橋技科大) |
(32) SP |
13:50-16:10 |
[ポスター講演]音響・言語情報が自身の録音音声の評価に与える影響 SP2023-13 |
○長村秀一・冨岡晟多・田中太一朗・小林耕太(同志社大) |
|
16:10-16:30 |
休憩 ( 20分 ) |
6月23日(金) 午後 招待講演 16:30 - 17:40 |
(33) |
16:30-16:40 |
聴覚脳チュートリアル
橘亮輔 (産業技術総合研究所) |
(34) |
16:40-17:40 |
大脳皮質聴覚野の構造と機能
宋文杰 (熊本大学) |
6月24日(土) 午前 招待講演 09:30 - 12:00 |
(35) |
09:30-10:40 |
音源分離技術の基礎と応用~音源分離チョットワカルになるための手引き~
北村大地 (香川高等専門学校), 中村友彦 (産業技術総合研究所) |
|
10:40-10:50 |
休憩 ( 10分 ) |
(36) |
10:50-12:00 |
拡散モデルと反復型音声波形生成のやさしい解説
小泉悠馬 (Google Research) |
|
12:00-12:10 |
休憩 ( 10分 ) |
6月24日(土) 午後 ポスター概要発表2 12:10 - 12:50 |
|
- |
ポスター概要発表2 |
|
12:50-13:50 |
休憩 ( 60分 ) |
6月24日(土) 午後 ポスターセッション2 13:50 - 16:10 |
(37) |
13:50-16:10 |
聴取訓練用音源からの音声・言語特徴量を用いた英語学習者のリスニング能力の自動予測
◎高英翔, 崔ジェヒョン, 峯松信明 (東京大学), 中西のりこ (神戸学院大学), 齋藤大輔 (東京大学) |
(38) |
13:50-16:10 |
対話時に人が距離に応じて無意識に発声を変える現象"距離感"は、普遍的か
○村上遥 (玉川大学、国立情報学研究所) |
(39) |
13:50-16:10 |
Attention及びCTCに基づく笑い声/叫び声検出モデルの比較
◎松田匠翔, 有本泰子 (千葉工業大学) |
(40) |
13:50-16:10 |
オノマトペ音声を用いた効果音合成技術におけるニューラルボコーダの検討
◎滝沢力, 平井重行 (京都産業大学) |
(41) |
13:50-16:10 |
専門英語のコミュニケーション力向上を目的とした学習者応答音声の自動内容評価に関する検討
◎仁科久那斗, 峯松信明, 齋藤大輔 (東京大学), 常本亜希 (関西大学) |
(42) |
13:50-16:10 |
VocalRemixer: 複数人歌唱楽曲を分析・操作可能な能動的音楽鑑賞インタフェース
○須田仁志, 齋藤大輔 (東京大学) |
(43) |
13:50-16:10 |
トークン表現を用いたギター自動採譜における系列変換ネットワークの学習法
◎金世訓, 武田一哉, 戸田智基 (名古屋大学)
【都合により発表を1日目に移動】 |
(44) |
13:50-16:10 |
単旋律撥弦楽器の奏法変化と音韻変化の音響的類似に着目した統計的楽器音合成
○小口純矢, 森勢将雅 (明治大学) |
(45) |
13:50-16:10 |
TransformerとVAEを用いたリズム構造に基づくコードチェンジと進行の自動生成
◎肥田歩華, 澤田隼, 桂田浩一, 大村英史 (東京理科大学) |
(46) |
13:50-16:10 |
Polarized Self-Attention を用いたセマンティックセグメンテーションによる複数楽器の自動採譜
◎陸井まなみ, 井上勝文, 吉岡理文 (大阪公立大学) |
(47) |
13:50-16:10 |
気分に合った音楽推薦に向けた動画共有サイト上のコメント分析
◎倉持友哉 (筑波大学大学院), 濱崎雅弘, 中野倫靖 (産業技術総合研究所) |
(48) |
13:50-16:10 |
正中面内の異なる仰角に配置された2音源間の空間的マスキング効果について
◎藤城博人, 西口正之, 渡邉貫治, 安倍幸治 (秋田県立大学) |
(49) |
13:50-16:10 |
音響信号のバイノーラルレンダリングにおける頭部インパルス応答のクラスタリングに関する検討
◎法師人和希, 西口正之, 渡邉貫治, 安倍幸治 (秋田県立大学) |
(50) |
13:50-16:10 |
DNN音声合成による嫌悪感情の表現と基礎評価
◎俣野文義 (明治大学), 松井淑恵 (豊橋技術科学大学), 森勢将雅 (明治大学) |
(51) |
13:50-16:10 |
ChatGPTを活用した日本語コーパス文生成の基礎検討
◎石川真大 (明治大学), 小田恭央 (SSS合同会社), 森勢将雅 (明治大学) |
(52) |
13:50-16:10 |
CNN-VAEを用いたドラム音源のモーフィングの試み
◎川原瑞樹, 奥田真輝, 香西智雄, 北原鉄朗 (日本大学) |
(53) SP |
13:50-16:10 |
[ポスター講演]雑音あるいは残響に頑健な基本周波数推定法の研究 SP2023-14 |
○山川拓真・三輪賢一郎(サレジオ高専) |
(54) SP |
13:50-16:10 |
全結合層型アップサンプリングを導入した高速ニューラル波形生成モデル SP2023-15 |
○山下陽生(神戸大/NICT)・岡本拓磨(NICT)・高島遼一(神戸大)・大谷大和(NICT)・滝口哲也(神戸大)・戸田智基(名大/NICT)・河井 恒(NICT) |
(55) SP |
13:50-16:10 |
時間周波数マスクの膨張処理と位相差拘束位相復元による両耳性ピッチの改善の検討 SP2023-16 |
○菅原大基・中嶋大志・植野夏樹・小野順貴(都立大) |
(56) SP |
13:50-16:10 |
[ポスター講演]チューブ発声訓練支援システムにおけるゲーミフィケーション導入の試み SP2023-17 |
○村井武人・北村達也(甲南大)・川村直子(姫路獨協大) |
(57) SP |
13:50-16:10 |
[ショートペーパー]SBERT-based Musical Components Estimation from Lyrics Trained with Imbalanced "Orpheus" Data SP2023-18 |
○Mastuti Puspitasari・Takuya Takahashi(UEC)・Gen Hori(AU)・Shigeki Sagayama・Toru Nakashika(UEC) |
(58) SP |
13:50-16:10 |
目標ドメイン音声を用いた自己教師あり学習に基づく音声認識モデルのドメイン適応 SP2023-19 |
○木内貴浩(豊橋技科大)・小川厚徳(NTT)・若林佑幸・北岡教英(豊橋技科大) |
(59) SP |
13:50-16:10 |
音楽分析・生成のための非和声音データベースの構築 SP2023-20 |
○髙橋拓椰・金子仁美・中鹿 亘・嵯峨山茂樹(電通大) |
(60) SP |
13:50-16:10 |
[ポスター講演]アブラコウモリのディストレスコールに対するフリージング反応と心拍変動解析 SP2023-21 |
○橋澤(吉野) 寿紀(同志社大/学振)・西内唯夏・平垣内 緑・木原幹樹・小林耕太・飛龍志津子(同志社大) |
(61) SP |
13:50-16:10 |
言語情報と言語・非言語現象を同時認識する音声認識モデルの構築 SP2023-22 |
○塩根凪人・若林佑幸・北岡教英(豊橋技科大) |
(62) SP |
13:50-16:10 |
音声長におけるポーズ長の割合が音声長によって知覚される主観的話速に及ぼす影響 SP2023-23 |
○玉川真帆・坂本修一(東北大) |
(63) SP |
13:50-16:10 |
分離歪みと再混合誤差を考慮した環境音分離 SP2023-24 |
○下西莞太・福森隆寛・山下洋一(立命館大) |
(64) SP |
13:50-16:10 |
x-vectorと音声認識コーパスを用いた多様な発話スタイルに対応する複数話者テキスト音声合成の評価 SP2023-25 |
○日田光紀(和歌山大/NICT)・岡本拓磨(NICT)・西村竜一(和歌山大)・大谷大和(NICT)・戸田智基(名大/NICT)・河井 恒(NICT) |
(65) SP |
13:50-16:10 |
リーダー・フォロワの役割意識がペアタッピングのテンポ上昇に与える影響 SP2023-26 |
○渡慶次和希・松井淑恵(豊橋技科大) |
|
16:10-16:30 |
休憩 ( 20分 ) |
6月24日(土) 午後 招待講演 16:30 - 17:40 |
(66) |
16:30-17:40 |
短時間フーリエ変換入門への入門
矢田部浩平 (東京農工大学) |
6月24日(土) 午後 表彰・閉会 17:40 - 18:00 |
|
- |
表彰・閉会 |