研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
EA |
2024-05-22 16:50 |
ONLINE |
オンライン開催 |
[招待講演]拡散モデルを用いた生成モデルの基礎と音声強調と分離への応用 ○シャイブラー ロビン(LINEヤフー) EA2024-9 |
拡散過程モデルは、反復的にノイズを目標分布に変換する生成モデルの一種である.これらは,最近の高 品質なテキスト画... [more] |
EA2024-9 p.38 |
NLP, MSS (共催) |
2024-03-13 17:20 |
その他 |
機械振興会館 |
日本語基盤モデルにおけるデータ拡張の適用 ○江良和樹・中野秀洋(東京都市大) MSS2023-84 NLP2023-136 |
近年のトピックの一つとしてデータ拡張がある. データ拡張は,教師あり学習においてその性能を改善させるために,訓練データを... [more] |
MSS2023-84 NLP2023-136 pp.66-69 |
SS |
2024-03-07 17:45 |
沖縄 |
石垣市健康福祉センター(沖縄) (ハイブリッド開催,主:現地開催,副:オンライン開催) |
リファクタリング推薦におけるCodeT5の転移学習有効性評価に向けて ○中島悠斗・藤原賢二(東京都市大) SS2023-62 |
リファクタリングとは 「外部から見たときの振舞いを保ちつつ,理解や修正が簡単になるように,ソフトウェアの内部構造を整理す... [more] |
SS2023-62 pp.79-84 |
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-02-29 15:45 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声言語モデル学習における方言音声コーパスの録音品質と書き起こしの影響について ○甲斐充彦・三輪祥吾・神谷悠太・遠山拓実(静岡大) |
我々は2022年に公開された日本語諸方言コーパスCOJADSを利用し、多言語音声による大規模事前学習モデルを応用した自動... [more] |
|
SIP, SP, EA (共催) IPSJ-SLP (連催) [詳細] |
2024-03-01 10:40 |
沖縄 |
沖縄産業支援センター (ハイブリッド開催,主:現地開催,副:オンライン開催) |
CTC音声認識モデルにおけるビームサーチデコーディング内での暗黙的言語情報の置換 ○高城巽成・若林佑幸(豊橋技科大)・小川厚徳(NTT)・北岡教英(豊橋技科大) EA2023-106 SIP2023-153 SP2023-88 |
自動音声認識の分野ではニューラルネットワークの台頭により, 音声認識モデルの精度が向上し, 字幕生成や議事録作成など様々... [more] |
EA2023-106 SIP2023-153 SP2023-88 pp.268-273 |
ITS, IE (共催) ITE-MMS, ITE-ME, ITE-AIT (共催) (連催) [詳細] |
2024-02-20 10:15 |
北海道 |
北海道大学 |
Vision-Languageモデルを用いた説明性のある画像魅力解析 ○吉田 舜・塩原 楓・山崎俊彦(東大) ITS2023-61 IE2023-50 |
画像の魅力を計算機に分析させる取り組みは過去多く行われてきており, 近年ではContrastive Language-I... [more] |
ITS2023-61 IE2023-50 pp.82-87 |
ITS, IE (共催) ITE-MMS, ITE-ME, ITE-AIT (共催) (連催) [詳細] |
2024-02-20 11:00 |
北海道 |
北海道大学 |
拡散モデル画像生成のスケッチガイダンスによる修正 ○Zhang Ding Sandra・毛 家豊・相澤清晴(東大) ITS2023-64 IE2023-53 |
大規模画像生成モデルは、多様かつ高品質な画像を生み出す卓越した能力を持っていますが、実際のコンテンツ制作で、特にユーザー... [more] |
ITS2023-64 IE2023-53 pp.95-99 |
HCGSYMPO (第二種研究会) |
2023-12-11 - 2023-12-13 |
福岡 |
北九州観光コンベンションAIM-3F (ハイブリッド開催,主:現地開催,副:オンライン開催) |
ソフトラベルを用いたクロスモーダル対照学習による人間の感情認識傾向を模擬する低次元感情空間 ○原田誠一・佐久間拓人・加藤昇平(名工大) |
本研究は,人間が感情表出したデータから感情を意味する潜在空間を抽出することによる,データ駆動型感情モデリングを目指す.特... [more] |
|
PRMU, IPSJ-CVIM, IPSJ-DCC, IPSJ-CGVI (連催) |
2023-11-17 14:40 |
鳥取 |
鳥取県立生涯学習センター(県民ふれあい会館) (ハイブリッド開催,主:現地開催,副:オンライン開催) |
潜在拡散モデルを用いた文書画像の歪み補正と再照明 ○今林颯大・ハオ グオチン・飯塚里志・福井和広(筑波大) PRMU2023-36 |
本研究では,潜在拡散モデルを用いて文書画像の歪み補正と再照明を行い,その視認性を向上させる手法 を提案する. 文書画像は... [more] |
PRMU2023-36 pp.113-118 |
BioX |
2023-10-13 10:20 |
沖縄 |
大濱信泉記念館(石垣島) |
発話人物のジェスチャに対するリアルと自動生成とのクラス判別 ~ 自己教師あり学習による未学習生成法への汎化性能向上の試み ~ ○牟 耕(青学大)・金子直史(東京電機大)・鷲見和彦(青学大) BioX2023-67 |
現在,人工的に生成された偽情報の判別は社会の重要課題であり,生成されたビデオを判別する研究が進んでいる.これまでの研究は... [more] |
BioX2023-67 pp.44-49 |
MIKA (第三種研究会) |
2023-10-10 15:35 |
沖縄 |
沖縄県市町村自治会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[ポスター講演]ソーシャルネットワークにおけるインフルエンサー予測モデルの異なるドメインへの汎化性能の評価 ○田原幸太・津川 翔(筑波大) |
ソーシャルメディア上のインフルエンサーを特定することは、重要な研究課題の一つである。インフルエンサーの特定手法はこれまで... [more] |
|
IPSJ-DBS, IPSJ-IFAT (共催) DE (連催) [詳細] |
2023-09-21 15:50 |
福岡 |
北九州国際会議場 |
BoxPlotQA: 箱ひげ図による五数要約と比較性能を測るための視覚的質問応答 ○戸崎友輔・宮森 恒(京都産大) DE2023-16 |
近年,自然画像だけでなく,文書画像やチャート画像に対する視覚的質問応答(VQA)の研究が注目されている.特に,棒グラフな... [more] |
DE2023-16 pp.31-36 |
IPSJ-DBS, IPSJ-IFAT (共催) DE (連催) [詳細] |
2023-09-22 10:30 |
福岡 |
北九州国際会議場 |
視覚言語モデルに関する順序数の的確な把握と活用能力の調査 ○増田琉斗・宮森 恒(京都産大) DE2023-20 |
本稿では,視覚言語モデルが,順序数の概念を的確に把握し活用する能力をどの程度有するのかについて調査する.Transfor... [more] |
DE2023-20 pp.54-59 |
AI |
2023-09-12 16:50 |
北海道 |
登別グランドホテル |
大規模条件付き画像生成モデルを用いたテキストによる出力制御可能なアイコン線画彩色 ○宮内洸希・折原良平・清 雄一・田原康之・大須賀昭彦(電通大) AI2023-34 |
Webサイトにはアイコンを使用することはユーザーインターフェースの観点から欠かせない. Webサイト制作者にとって, ア... [more] |
AI2023-34 pp.201-206 |
NLC |
2023-09-07 15:55 |
大阪 |
大阪公立大学 中百舌鳥キャンパス (ハイブリッド開催,主:現地開催,副:オンライン開催) |
センチメントによる景気動向指数DIの補正と解釈 ○鄭 弯弯(名大) NLC2023-12 |
景気を判断するためには,経済指標を読み解くことは一般的である.しかし,経済の主体である人々のセンチメントは,消費行動に影... [more] |
NLC2023-12 pp.63-68 |
CQ, MIKA (併催) |
2023-08-31 15:55 |
福島 |
天神岬スポーツ公園 |
Semantic Communication with Masked Autoencoders: Enhancing Efficiency in Image Transmission ○Jiale Wu・Zhaoyang Du・Celimuge Wu・Tsutomu Yoshinaga(UEC) CQ2023-29 |
6G テクノロジーの有望な候補であるセマンティック通信は、研究のホットスポットとなっています。 ただし、既存の研究では、... [more] |
CQ2023-29 pp.20-25 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-23 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[ポスター講演]発話音声の感情情報に基づく色つき字幕画像生成の検討 ○中村史也(神戸大)・相原 龍(三菱電機)・高島遼一・滝口哲也(神戸大)・伊谷裕介(三菱電機) SP2023-11 |
従来の音声認識による自動字幕生成システムでは,発話に含まれる感情などのパラ言語情報を考慮していないため,皮肉表現や多義語... [more] |
SP2023-11 pp.54-59 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
[ショートペーパー]SBERT-based Musical Components Estimation from Lyrics Trained with Imbalanced "Orpheus" Data ○Mastuti Puspitasari・Takuya Takahashi(UEC)・Gen Hori(AU)・Shigeki Sagayama・Toru Nakashika(UEC) SP2023-18 |
[more] |
SP2023-18 pp.86-90 |
IPSJ-MUS, IPSJ-SLP (共催) SP (連催) [詳細] |
2023-06-24 13:50 |
東京 |
電気通信大学 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
目標ドメイン音声を用いた自己教師あり学習に基づく音声認識モデルのドメイン適応 ○木内貴浩(豊橋技科大)・小川厚徳(NTT)・若林佑幸・北岡教英(豊橋技科大) SP2023-19 |
本研究では,目標ドメインの書き起こしテキストデータを利用せず,目標ドメインの音声データのみを用い,目標外ドメインで事前学... [more] |
SP2023-19 pp.91-96 |
ET, IPSJ-CLE (連催) |
2023-06-17 16:05 |
東京 |
都立大(南大沢)+オンライン開催 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
完全情報ゲームにおける他者行動モデル構築支援システム ○栢野凌磨・小尻智子(関西大) ET2023-6 |
オセロのような完全情報ゲームにおいては、相手プレイヤの行動を推測して自身の行動を決定することは重要である。行動は各自が持... [more] |
ET2023-6 pp.11-17 |