Online edition: ISSN 2432-6380
[TOP] | [2018] | [2019] | [2020] | [2021] | [2022] | [2023] | [2024] | [Japanese] / [English]
PRMU2024-46
骨格推定情報の静止画像化を介した手話認識手法の提案
○依田萌々子・井上真郷(早大)
pp. 1 - 6
PRMU2024-47
一貫性を重視した線画による3D点群編集
○會澤智大・顧 淳祉・栗山 繁(豊橋技科大)
pp. 7 - 12
PRMU2024-48
部分的に食材が遮蔽された料理画像のためのCLIPを利用したレシピ文ベースの食材状態認識
○田上鈴奈・平松直人・小林大起・秋月秀一・橋本 学(中京大)
pp. 13 - 18
PRMU2024-49
広域多視点マルチモーダル行動認識のためのセンサ統合手法とMultiSensor-Homeデータセットの提案
○グエン チュンタイン(名大)・川西康友・ビジェイ ジョン(理研)・駒水孝裕・井手一郎(名大)
pp. 19 - 24
PRMU2024-50
[招待講演]基盤モデルの実ロボット応用
○河原塚健人(東大)
p. 25
PRMU2024-51
[招待講演]大規模視覚言語モデルによる画像の認識と理解
○鈴木哲平(SB Intuitions)
pp. 26 - 27
PRMU2024-52
SVGEditBench V2: テキストプロンプトに基づくSVG編集モデルの評価ベンチマーク
○仁科久那斗・松井勇佑(東大)
pp. 28 - 40
PRMU2024-53
アクティブ音響センシングによるセマンティックセグメンテーション結果の推定
○森 太紀・本間純平・米澤祥吾・小玉星弥・入江 豪(東京理科大)
pp. 41 - 46
PRMU2024-54
クラス間で良く分離された説明文を自動生成する大規模視覚言語モデルを用いた対照学習による歩行者年齢層認識
○尾崎 匠(鳥取大)・栗林英範(グローリー)・井上路子・西山正志(鳥取大)
pp. 47 - 52
PRMU2024-55
Sign-to-text matching space for new sign selection
○Matheus Silva de Lima・Pedro H. V. Valois(ITF)・Erica Kido Shimomoto(AIST)・Nobuko Kato(NTUT)・Kazuhiro Fukui(ITF)
pp. 53 - 57
PRMU2024-56
Panoptic Liftingにおける破滅的忘却抑制のための可視領域を最大化する視点選択による増分学習法
○幸壬 晃(滋賀大)・薗頭元春(理研)・飯山将晃(滋賀大)・川西康友(理研)
pp. 58 - 63
PRMU2024-57
Neural Real-Time RGB-D SLAM in Dynamic Environments
○Qinyuan Zhou・Kazuhiko Sumi(Aoyama Gakuin Univ.)
pp. 64 - 69
PRMU2024-58
大規模言語モデルを用いた卒業アルバムにおけるレイアウト生成に関する提案
○松田 展・佐野睦夫(阪工大)
pp. 70 - 75
PRMU2024-59
新たな視線動的パラメータを用いた運転シミュレーターにおける視線方向検出モデルの改良
○リク テツイン・鷲見和彦(青学大)
pp. 76 - 81
PRMU2024-60
拡散モデルのLLMへの埋め込みに基づくText2Motion生成器のファインチューニングに関する研究
○田中慎一・王 釗・加藤洋一・大谷 淳(早大)
pp. 82 - 87
PRMU2024-61
局所位相損失を用いた画像次元削減のためのVQ-VAEの学習
○市村直幸(産総研)
pp. 88 - 93
PRMU2024-62
数式駆動型データを用いた知識蒸留の初期評価
藤林文人・○森 稔(神奈川工科大)
pp. 94 - 99
PRMU2024-63
Siamese Network-based Answer Similarity for Automatically Scoring Handwritten Very Short Answers
○Tuan Nam Ly・Hung Tuan Nguyen・Masaki Nakagawa(TUAT)
pp. 100 - 105
注: 本技術報告は査読を経ていない技術報告であり,推敲を加えられていずれかの場に発表されることがあります.