12月12日(木) 午前 オープニング 10:45 - 10:55 |
(1) |
10:45-10:55 |
オープニング |
12月12日(木) 午前 音声認識 10:55 - 12:00 |
(1) |
10:55-11:20 |
再帰的フィードバックを用いた階層的 End-to-End 音声認識
○楠奈穂美・樋口陽祐・小川哲司・小林哲則(早大) |
(2) |
11:20-11:45 |
大規模事前学習モデルとMixture-of-adaptersを用いた多言語音声認識
○品山健太朗・松浦孝平・三村正人(NTT) [下記から変更] 大規模事前学習モデルとMixture-of-expertsを用いた多言語音声認識
○品山健太朗・松浦孝平・三村正人(NTT) |
(3) |
11:45-12:00 |
文単位音声要約のためのデータセット構築とEnd-to-Endモデルの検討
○松浦孝平・芦原孝典・森谷崇史・三村正人・叶高朋・小川厚徳・デルクロアマーク(NTT) |
|
- |
休憩 |
12月12日(木) 午後 招待講演 13:30 - 14:30 |
(4) |
13:30-14:30 |
【招待講演】日本における大規模言語モデルの研究開発動向
小田悠介(国立情報学研究所) [下記から変更] 招待講演(NII 小田様) |
|
- |
休憩 |
12月12日(木) 午後 ポスターセッション 14:50 - 16:20 |
(5) |
14:50-16:20 |
Hybrid H3-Conformerを用いた頑健な長時間音声認識
○本多智揮・坂井信輔・河原達也(京大) |
(6) |
14:50-16:20 |
話し言葉音声合成のためのテキスト発話スタイル変換の改良
○中田優翔(徳山工業高等専門学校)・吉岡大貴・ホワンウェンチン・戸田智基(名大) |
(7) |
14:50-16:20 |
大学学生窓口における RAG の適用
○井柳匠人(東海大) |
(8) |
14:50-16:20 |
Linear Effect of Neuron Activations in Transformer-based Language Models
○趙信・江澤輝・吉永直樹(東大) [下記から変更] 言語モデルにおける知識ニューロンの活性度の影響の線形性: 経験勾配が捉える言語知識
○趙信・江澤輝・吉永直樹(東大) |
(9) |
14:50-16:20 |
敵対的学習による記号的知識蒸留のフィルタ構築とその評価
○日浦隆博(NAIST/理研)・河野誠也(理研/NAIST)・Angel GarciaContreras(理研)・吉野幸一郎(東工大/理研/NAIST) |
(10) |
14:50-16:20 |
役割情報付与に基づく重要文強調音声合成 ーピッチ予測の重みづけによる強調度合の制御
○平田瑞葵(早大)・藤江真也(千葉工大)・小林哲則(早大) |
(11) |
14:50-16:20 |
話者変換された叫び声に対する話者類似性評価
○白鳥恵大・有本泰子(千葉工大) |
(12) |
14:50-16:20 |
評価スコアとしての適切な類似度を得るためのベクトル変換モデルを用いた自動評価法
○藤﨑晴大・越前谷博(北海学園大) |
(13) SP |
14:50-16:20 |
[ポスター講演]英語話者の合成音声検出に有効な音響特徴量の検討 |
○根本結菜・大田健紘(日本工大) |
(14) SP |
14:50-16:20 |
[ポスター講演]発話重複を含む会話音声認識のための話者識別CTC損失関数の検討 [下記から変更] [ポスター講演]発話被りを含む会話音声認識のための多話者CTC損失関数の検討 |
○佐久間 旭・佐藤裕明・菅野竜雅・熊野 正・河合吉彦(NHK)・小川哲司(早大) |
(15) SP |
14:50-16:20 |
音声感情キャプショニングのためのデータ作成とモデル構築の検討 |
○永瀬亮太郎・福森隆寛・山下洋一(立命館大) |
|
- |
休憩 |
12月12日(木) 午後 LLM応用 16:40 - 17:55 |
(16) |
16:40-17:05 |
登録に議論が必要なWikipedia項目への自動登録に向けた調査
○多田智貴(北大)・林克彦(東大)・上垣外英剛(NAIST)・松野省吾(電通大) |
(17) |
17:05-17:30 |
大規模言語モデルを活用したテクニカルライティングに基づく文章修正手法の開発
○上前諒輔・横山想一郎・山下倫央・川村秀憲(北大)・永田功(YAMAGATA) |
(18) NLC |
17:30-17:55 |
RAGを用いたヒューマンエラー事象の対策立案 |
○村上一彦(中電CTI)・瀬川 修(中部電力)・木村佳央(中電CTI) |
12月13日(金) 午前 機械翻訳 09:30 - 10:35 |
(19) |
09:30-09:55 |
出力系列のタスク指向初期化を用いた編集に基づくニューラル機械翻訳
○大矢一穂・吉永直樹(東大) |
(20) |
09:55-10:10 |
ベクトル間類似度に基づくベクトル変換モデルを用いた低資源言語のためのニューラル機械翻訳
○田中蒼大郎・越前谷博(北海学園大)・荒木健治(北大) |
(21) |
10:10-10:35 |
機械は仕様を考慮して翻訳できるか:統合報告書の英訳の場合
○萱野陽子・菅原朔(NII) |
|
- |
休憩 |
12月13日(金) 午前 音声合成・符号化 10:55 - 11:45 |
(22) |
10:55-11:20 |
離散トークンの継続長予測に基づく母語話者音声コーパスのみを用いた外国語訛り音声合成手法の改善
○恩田健太郎(東大/産総研)・朴浚鎔(東大)・井本桂右(同志社大)・深山覚(産総研)・齋藤大輔・峯松信明(東大) |
(23) |
11:20-11:45 |
音声の収録・符号化・提示環境を註記するための試験信号の設計と評価について
○河原英紀(和歌山大)・矢田部浩平(東京農工大)・榊原健一(北海道医療大)・水町光徳(九工大)・北村達也(甲南大) |
|
- |
休憩 |
12月13日(金) 午後 特別招待講演 13:00 - 14:00 |
(24) |
13:00-14:00 |
【特別招待講演】音声合成研究の楽しみ ~個人的視点から雑談を交えて~
徳田恵一(名工大) [下記から変更] 特別招待講演(名工大 徳田先生) |
|
- |
休憩 |
12月13日(金) 午後 特別セッション:分野横断 14:20 - 16:25 |
(25) |
14:20-14:45 |
自己教師あり学習モデルとT5モデルを用いた G2P フリー音声合成に関する研究
○朴浚鎔・齋藤大輔・峯松信明(東大) |
(26) |
14:45-15:10 |
End-to-End 多言語音声認識における帰納バイアスとしての IPA および調音素性の効果
○李在詠(京大)・三村正人(NTT)・河原達也(京大) |
(27) |
15:10-15:35 |
End-to-End音声認識における指示チューニングされた大規模言語モデルの活用
○樋口陽祐・小川哲司・小林哲則(早大) |
(28) |
15:35-16:00 |
大規模視覚言語モデルによる芸術作品の多言語説明生成
○尾崎慎太郎・林和樹・坂井優介・上垣外英剛(NAIST)・林克彦(東大)・渡辺太郎(NAIST) |
(29) NLC |
16:00-16:25 |
画像ベース中間表現を用いた多言語音声翻訳システムの提案と評価 |
○趙 澤毅・林 実(明星大) |
|
- |
休憩 |
12月13日(金) 午後 テキスト分析 16:45 - 18:00 |
(30) |
16:45-17:10 |
ECサイトレビューの多角的な有用性判別のための分類モデル構築と精度改善手法の検討
○屋比久博文・當間愛晃(琉球大) [下記から変更] ECサイトレビューの多角的な有用性判別のための分類モデル構築と精度改善方法の検討
○屋比久博文・當間愛晃(琉球大) |
(31) NLC |
17:10-17:35 |
ローカル大規模言語モデルによるセンチメント分析において評価の参照点の有無や提示方法が予測精度に与える影響の検証 ~ レストラン評価に関するオンラインレビューのセンチメント分析から ~ |
○新美潤一郎(名城大) |
(32) |
17:35-18:00 |
特許検索報告書に基づいた特許構成要件の統計的自動分説モデルの構築と評価
○河野誠也(理研/NAIST)・丸崎恒司(長岡技科大)・野中尋史(愛工大)・吉野幸一郎(東京科学大/理研/NAIST) |
12月14日(土) 午前 意味論 09:30 - 10:35 |
(33) |
09:30-09:55 |
埋め込みベクトル空間と難度アノテーションの互換性定理
○江原遥(東京学芸大) [下記から変更] 埋込ベクトル空間と難度アノテーションの互換性定理
○江原遥(東京学芸大) |
(34) |
09:55-10:20 |
単語の通時的な類似度行列による意味変化パターンの分析
○木山朔・相田太一(都立大)・小町守(一橋大)・小木曽智信(国研)・高村大也(産総研)・持橋大地(統数研) |
(35) |
10:20-10:35 |
Formal Semantic Analysis of an Adjunct in a Sentence by ChatGPT
○Katsumi Naoki (Otaru Univ. of Commerce) |
|
- |
休憩 |
12月14日(土) 午前 要約 10:55 - 11:45 |
(36) |
10:55-11:20 |
長文要約タスクにおける複数学習条件の効果検証
○樋本一晴・池田大志・寺中駿人(コニカミノルタ) |
(37) NLC |
11:20-11:45 |
Optimizing Automatic Summarization of Long Clinical Records Using Dynamic Context Extension: Testing and Evaluation of the NBCE Method |
○Guoqing Zhang(Kyoto Univ.)・Keita Fukuyama(KUHP)・Kazumasa Kishimoto(Kyoto Univ.)・Tomohiro Kuroda(KUHP) |
|
- |
休憩 |
12月14日(土) 午後 国際会議参加報告 13:00 - 14:10 |
(38) |
13:00-13:40 |
国際会議INTERSPEECH2024参加報告
上乃聖(名工大)金子卓弘(NTT) [下記から変更] INTERSPEECH参加報告 |
(39) |
13:40-14:10 |
国際会議ACL2024参加報告
三田雅人(サイバーエージェント) [下記から変更] ACL参加報告 |
|
- |
休憩 |
12月14日(土) 午後 LLM評価 14:30 - 15:20 |
(40) |
14:30-14:55 |
大規模言語モデルによる選択肢間の関係を考慮した回答分布予測手法の提案
○鈴木刀磨・片山歩希・郷原聖士・辻本陵・中谷響・林和樹・坂井優介・上垣外英剛・渡辺太郎(NAIST) [下記から変更] JSON形式による意見分布予測手法の提案
○鈴木刀磨・片山歩希・郷原聖士・辻本陵・中谷響・林和樹・坂井優介・上垣外英剛・渡辺太郎(NAIST) |
(41) |
14:55-15:20 |
大規模言語モデルの数値時系列解釈能力の検証
○新井深月(お茶大)・石垣達也(産総研/人工知能研究センター)・宮尾祐介(東大)・高村大也(産総研/人工知能研究センター)・小林一郎(お茶大) [下記から変更] 数値プローブを用いた大規模言語モデルの時系列数値解釈能力の検証
○新井深月(お茶大)・石垣達也・高村大也(産総研/人工知能研究センター)・宮尾祐介(東大)・小林一郎(お茶大) |
|
- |
休憩 |
12月14日(土) 午後 話者認識・音声分析 15:40 - 16:55 |
(42) |
15:40-16:05 |
Simulating Native Speaker Shadowing for Non-Native Speech Assessment with Latent Speech Representation
○耿浩彭・齋藤大輔・峯松信明(東大) [下記から変更] Applying Native Speaker Shadowing for Non-Native Speech Intelligibility Assessment Using Continuous and Discrete Latent Speech Representations
○耿浩彭・齋藤大輔・峯松信明(東大) |
(43) |
16:05-16:30 |
Comparing Likert Scale and Pairwise Comparison for Human Evaluation in Rapport-Building Dialogue Systems
○Baihaqi Muhammad Yeza(NAIST/RIKEN)・Contreras Angel F. Garcia(RIKEN)・Kawano Seiya(RIKEN/NAIST)・Yoshino Koichiro(Institute of Science Tokyo/RIKEN/NAIST) |
(44) SP |
16:30-16:55 |
話者埋め込みの差異に基づく敵対的サンプルの複数の話者認証モデルへの攻撃性能の調査 |
○北村 悠・齋藤大輔・峯松信明(東大) |
12月14日(土) 午後 クロージング 16:55 - 17:25 |
(45) |
16:55-17:25 |
クロージング |