研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-03-01 09:30 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Neural Transducer型音声認識におけるScheduled Samplingの検討 ○森谷崇史・芦原孝典・佐藤 宏・松浦孝平・田中智大・増村 亮(NTT) EA2022-100 SIP2022-144 SP2022-64 |
本研究ではRecurrent neural network-transducer(RNNT)を用いた音声認識におけるSc... [more] |
EA2022-100 SIP2022-144 SP2022-64 pp.147-152 |
SP, EA, SIP (共催) IPSJ-SLP (連催) [詳細] |
2023-03-01 15:50 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
自己教師あり学習に基づく話者照合における言語性の影響 ○若松智花(都立大)・安藤厚志(NTT)・塩田さやか(都立大)・増村 亮(NTT)・貴家仁志(都立大) EA2022-118 SIP2022-162 SP2022-82 |
近年様々な分野において自己教師あり学習(Self-Supervised Learning; SSL)を用いた研究が活発に... [more] |
EA2022-118 SIP2022-162 SP2022-82 pp.247-252 |
NLC, SP (共催) IPSJ-NL, IPSJ-SLP (共催) (連催) [詳細] |
2022-11-30 15:30 |
東京 |
機械振興会館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
音声合成と音声認識に対するテキストデータを用いた半教師あり統合学習 ○牧島直輝・鈴木聡志・安藤厚志・増村 亮(NTT) NLC2022-14 SP2022-34 |
本稿では,音声合成と音声認識をテキストと音声の少規模ペアデータ及び大規模なテキストデータで学習する新しい学習手法を提案す... [more] |
NLC2022-14 SP2022-34 pp.27-32 |
EA, SIP, SP (共催) IPSJ-SLP (連催) [詳細] |
2022-03-02 10:20 |
沖縄 |
沖縄県立博物館・美術館 (ハイブリッド開催,主:現地開催,副:オンライン開催) |
Hybrid RNN-T/Attention構造を用いたストリーミング型End-to-End音声認識モデルと内部言語モデル統合の検討 ○森谷崇史・芦原孝典・安藤厚志・佐藤 宏・田中智大・松浦孝平・増村 亮・デルクロア マーク(NTT)・篠崎隆宏(東工大) EA2021-78 SIP2021-105 SP2021-63 |
本研究ではストリーミング音声認識におけるRecurrent neural network-transducer(RNN-... [more] |
EA2021-78 SIP2021-105 SP2021-63 pp.90-95 |
NLC, IPSJ-NL, SP, IPSJ-SLP (連催) (連催) [詳細] |
2021-12-03 11:00 |
ONLINE |
オンライン開催 |
VQVAEによって獲得されたキャラクター演技スタイルに基づく多話者オーディオブック音声合成 ○中田 亘・郡山知樹・高道慎之介・斎藤佑樹(東大)・井島勇祐・増村 亮(NTT)・猿渡 洋(東大) NLC2021-26 SP2021-47 |
本研究では,Vector Quantized Variational AutoEncoder (VQVAE)を用いたキャ... [more] |
NLC2021-26 SP2021-47 pp.42-47 |
NLC |
2020-09-10 15:25 |
ONLINE |
オンライン開催 |
発話単位系列ラベリングの教師なしドメイン適応 ~ コンタクトセンタタスクへの適用 ~ ○折橋翔太・牧島直輝・庵 愛・高島瑛彦・田中智大・増村 亮(NTT) NLC2020-8 |
本稿では,会話ドキュメントへの発話単位の系列ラベリングに対する,教師なしドメイン適応を提案する.発話単位系列ラベリングは... [more] |
NLC2020-8 pp.34-39 |
SP, EA, SIP (共催) |
2020-03-02 13:00 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
系列分類型ニューラルネットワークを用いた日本語方言識別の検討 ○今泉 遼(首都大東京)・増村 亮(NTT)・塩田さやか・貴家仁志(首都大東京) EA2019-108 SIP2019-110 SP2019-57 |
ある地域特有の言語を方言といい, 入力音声がどの方言かを識別するタスクを方言識別という. 音声認識モデルの多くは標準語で... [more] |
EA2019-108 SIP2019-110 SP2019-57 pp.41-46 |
SP, EA, SIP (共催) |
2020-03-02 13:00 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
[ポスター講演]複数の補助ネットワークを利用したニューラル音声区間検出の大規模学習の検討 ○増村 亮・松井清彰・小泉悠馬・大庭隆伸(NTT) EA2019-109 SIP2019-111 SP2019-58 |
[more] |
EA2019-109 SIP2019-111 SP2019-58 pp.47-52 |
SP, EA, SIP (共催) |
2020-03-02 13:00 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
時間反転音声を用いた音声認識のためのデータ拡張 ~ 特徴量系列における反転 ~ ○芦原孝典・田中智大・森谷崇史・増村 亮・篠原雄介・柏野牧夫(NTT) EA2019-110 SIP2019-112 SP2019-59 |
音声認識システムにおいて,学習データの音響的な網羅性を可能な限り担保し,過学習を防ぐ事を目的としたアプローチの一つに d... [more] |
EA2019-110 SIP2019-112 SP2019-59 pp.53-58 |
SP, EA, SIP (共催) |
2020-03-02 13:00 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
DNNに基づく話し言葉音声合成における追加コンテキストの効果 ○山下優樹・郡山知樹・齋藤佑樹・高道慎之介(東大)・井島勇祐・増村 亮(NTT)・猿渡 洋(東大) EA2019-112 SIP2019-114 SP2019-61 |
ディープニューラルネットワーク(DNN)に基づく音声合成では, パラ言語, 非言語情報を追加することで, 読み上げ音声よ... [more] |
EA2019-112 SIP2019-114 SP2019-61 pp.65-70 |
SP, EA, SIP (共催) |
2020-03-02 15:45 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
音声認識におけるEncoder-Decoderモデルの注意重みを用いたCTCモデルへの知識蒸留の評価 ○森谷崇史・佐藤 宏・田中智大・芦原孝典・増村 亮・篠原雄介(NTT) EA2019-131 SIP2019-133 SP2019-80 |
本研究ではConnectionist Temporal Classification(CTC)ベースの音声認識システムの... [more] |
EA2019-131 SIP2019-133 SP2019-80 pp.175-180 |
SP, EA, SIP (共催) |
2020-03-03 09:00 |
沖縄 |
沖縄産業支援センター (開催中止,技報発行あり) |
長期文脈を考慮したPointer-Generator Networkに基づく話し言葉・書き言葉変換 ○庵 愛・高島瑛彦・増村 亮(NTT) EA2019-142 SIP2019-144 SP2019-91 |
本稿では,談話や会話などの連続した複数のテキストから構成される文章を扱うことに適した,話し言葉テキストを書き言葉テキスト... [more] |
EA2019-142 SIP2019-144 SP2019-91 pp.237-242 |
SP |
2019-08-28 17:00 |
京都 |
京都大学 |
マルチラベル感情表出推定に基づく音声感情分類 ○安藤厚志・増村 亮・神山歩相名・小橋川 哲・青野裕司(NTT) SP2019-16 |
本稿では,感情の曖昧性を考慮した新しい音声感情分類手法を提案する.一般的な感情分類手法では各発話が支配的な感情クラス(主... [more] |
SP2019-16 pp.39-44 |
EA, SIP, SP (共催) |
2019-03-14 13:30 |
長崎 |
アイランド ナガサキ(長崎市) |
[ポスター講演]学習者音声に見られる発音多様性のモデリングとその音素誤り自動検出への応用 ○張 昊宇・齋藤大輔・峯松信明(東大)・小橋川 哲・増村 亮(NTT) EA2018-119 SIP2018-125 SP2018-81 |
[more] |
EA2018-119 SIP2018-125 SP2018-81 pp.119-124 |
EA, SIP, SP (共催) |
2019-03-15 10:25 |
長崎 |
アイランド ナガサキ(長崎市) |
条件付き階層再帰型エンコーダデコーダに基づく複数人会話音声認識向け言語モデル ○増村 亮・田中智大・安藤厚志・大庭隆伸・青野裕司(NTT) EA2018-131 SIP2018-137 SP2018-93 |
本稿では,会話に登場する各話者の役割が明確な複数人会話(ロールプレイ会話) 向けの新たな言語モデルを提案する.提案手法の... [more] |
EA2018-131 SIP2018-137 SP2018-93 pp.191-196 |
EA, SIP, SP (共催) |
2019-03-15 10:50 |
長崎 |
アイランド ナガサキ(長崎市) |
アノテータのラベル付与能力を考慮した電話応対音声の好感度推定モデル学習法の検討 ○神山歩相名・安藤厚志・増村 亮・小橋川 哲・青野裕司(NTT) EA2018-132 SIP2018-138 SP2018-94 |
本研究では,コンタクトセンタのオペレータの応対の好感度の自動推定に取り組む.
従来の好感度推定では,ラベルが対象音声デ... [more] |
EA2018-132 SIP2018-138 SP2018-94 pp.197-202 |
NLC, IPSJ-IFAT (連催) |
2019-02-07 14:45 |
京都 |
龍谷大学大宮キャンパス |
対話コンテキストを考慮したニューラル通話シーン分割 ○増村 亮・田中智大・安藤厚志・神山歩相名・大庭隆伸・青野裕司(NTT) NLC2018-39 |
通話シーン分割は,人手で定めたいくつかのシーンに通話全体を自動分割する技術であり,コンタクトセンタにおいて,オペレータの... [more] |
NLC2018-39 pp.21-26 |
SP |
2018-08-27 15:30 |
京都 |
京都大学 |
複数仮説を考慮したニューラル誤り訂正言語モデルの検討 ○田中智大・増村 亮・青野裕司(NTT) SP2018-29 |
[more] |
SP2018-29 pp.31-36 |
SIP, EA, SP (共催) MI (併催) [詳細] |
2018-03-19 13:00 |
沖縄 |
石垣島 ホテルミヤヒラ |
[ポスター講演]日本人英語に観測される発音多様性に関するコーパスに基づく定量的分析 ○椛島 優・張 昊宇・齋藤大輔・峯松信明(東大)・小橋川 哲・増村 亮(NTT) EA2017-113 SIP2017-122 SP2017-96 |
外国語発音教育において,学習者音声に適切な教示を返すことの重要性は広く知られており,音声情報処理技術を用いた教示呈示の自... [more] |
EA2017-113 SIP2017-122 SP2017-96 pp.69-74 |
SP, SIP, EA (共催) |
2017-03-01 12:40 |
沖縄 |
沖縄産業支援センター |
[ポスター講演]DNN音声合成のためのProsodic Word Embeddingの検討 ○井島勇祐・北条伸克・増村 亮・浅見太一(NTT) EA2016-109 SIP2016-164 SP2016-104 |
本論文では,DNN音声合成のための韻律情報の類似性を考慮したWord Embedding(Prosodic Word E... [more] |
EA2016-109 SIP2016-164 SP2016-104 pp.153-158 |