電子情報通信学会 研究会発表申込システム 研究会 詳細情報 |
|||||||||||||||
スケジュール情報 | |||||||||||||||
|
|||||||||||||||
開催案内 | |||||||||||||||
---------------------------------------------------------------------- 電子情報通信学会「サービスコンピューティング」研究会 第17回研究会 発表募集のご案内 「クラウド・サービスによる大規模データ処理」および一般 ---------------------------------------------------------------------- 日 程:2016年3月25日(金) 場 所:国立情報学研究所 (NII) 20F ミーティングルーム(2010&2009室) http://www.nii.ac.jp/about/access/ テ ー マ:「クラウド・サービスによる大規模データ処理」および一般 電子情報通信学会サービスコンピューティング研究会では,「クラウド・サー ビスによる大規模データ処理」および一般と題して,研究会を開催いたします. 近年,大規模データ処理は,科学技術計算・言語処理・IoTなど,様々な分野 で注目されています.クラウドやサービスの技術は,初期投資の大きい計算 機資産を所有する必要がないこと,またスケーリングが容易になることから, 大規模データ処理の分野においても重要性を増しています.そこで本研究会 では,そのような大規模データ処理を目的とした,クラウド・サービスの 技術,方法論,プラクティス等に関する論文を募集します. また本研究会のテーマに合わせ,以下のチュートリアルを開催いたします. ===================================================================== [チュートリアル: 大規模テキスト分析の課題と実践] 講師 田仲 正弘(国立研究開発法人 情報通信研究機構) 本チュートリアルは,大規模テキスト分析を例題に,様々な分析プログラム を連携させた,大規模データ分析のための並列分散処理について概説するも のです. 前半では,始めに大規模データ分析における課題について,実例を挙げながら 解説します.本チュートリアルで例題として取り上げるテキスト分析では, 係り受け解析器や,SVM分類器といった機械学習ツールなど,既存の様々な分析 プログラムを組み合わせるのが一般的です.しかし,複数の分析プログラムを 組み合わせて大規模なデータを処理する場合,プログラムの起動オーバヘッドや, データの受け渡し方法に起因するレイテンシ,分析処理の記述における制限と いった課題があります.そのため,Hadoop, Spark等の,既存のよく知られた 大規模処理フレームワークの利用が難しいことがあります.そこで,こうした 課題の解決のため,国立研究開発法人 情報通信研究機構が開発した大規模分析 のための基盤ソフトウェアRaSCを紹介します.RaSCは,レガシーなものも含めて, 様々な分析プログラムをRPCサービスとして利用可能にするもので,分析プログラ ムのプロセスをプーリングすることで,起動オーバヘッドを軽減するとともに, 分析プログラムの並列実行を容易にします.RaSCは40億ページのWebページを 処理して様々な質問に回答する大規模Web情報分析システムWISDOM X (http://wisdom-nict.jp)及び、大規模災害時の被災状況の把握のため, Twitter情報をリアルタイムに意味的に分析し,質問に回答したり,被災報告を リストアップするなどの処理を行う対災害SNS情報分析システムDISAANA (http://disaana.jp)において,実際に使用されています.WISDOM Xでは, RaSCを用いることで,20種類以上のプログラムを数百台の計算機上で連携しながら, 一日1億件以上のWeb文書の分析を実現し,また,毎秒10問程度の質問に回答でき ます.DISAANAでは,100台の計算機を用いて,最大で毎秒1万5千ツイートを 意味的に処理し,質問応答や被災報告のリストアップに利用できる形にまで落とし 込み,毎秒400リクエストに対応します.RaSCはすでにオープンソースで公開され ていますが(https://alaginrc.nict.go.jp/rasc/),本チュートリアルでは, プーリングするプロセス数を最適化する機能等が加わった,今後公開予定の 新バージョンについて紹介します. 後半はハンズオンとして、Amazon EC2クラウド上で、Twitterを対象に, 映画等についての評判情報の分析(肯定意見・否定意見の分類)を行うことを 予定しています.近年注目を集めているディープラーニングのツールを含め, 著名な機械学習プログラムや,論文の成果の一部として公開されている分析 プログラムや自作の分析プログラムを、RaSCを用い、簡単なコマンドライン やGUIで容易に組み合わせ,利用できることを示します.また,RaSCを用いる ことで,複数の計算機ノード上で分析処理を分散並列実行しながら,全体の 処理を停止することなく,計算規模のスケーリングや計算機リソース利用の 最適化が可能なことを体験していただきます. (聴講のみの参加も可能です) ※ハンズオンでは,ご自身でお持ち込みのラップトップをご利用ください. サーバへログインしての操作を行いますので,一般的なLinuxマシンの知識 と,SSHログインが可能な環境を前提とします.また,当日の技術サポート はありません.ご使用の環境等によっては,進行の通り操作できない可能性 もありますが,どうぞご容赦ください. ===================================================================== 当日はおおよそ以下のスケジュールを想定しておりますが,研究発表申込の 件数に応じて,ある程度変更される予定です. --------------- 10:00-12:00 研究発表セッション1 13:00-15:50 チュートリアル 16:00-18:00 研究発表セッション2 --------------- チュートリアル参加は無料ですが,参加人数の把握のため事前登録をお願い しております。参加を希望される方は,以下の情報を mtnk@nict.go.jp まで お送りください. --------------- [チュートリアル 大規模データ分析のためのプログラム連携] 参加申込 氏名: 所属: E-mail: 住所: 電話番号: ハンズオンへの参加: 希望する・希望しない --------------- 多数のお申し込みがあった場合,ご希望に添えない場合があります.どうか ご了承ください. 研究発表のお申し込みについては,以下のURLからお願い致します (氏名、所属、論文タイトル、アブストラクト100~200字)。 電子情報通信学会 研究会発表申込システム http://ken.ieice.org/ken/program/index.php 申込〆切:2016年1月13日 (水) 原稿の提出〆切は,開催日の約3週間前となります.正確な日付は,お申し 込み後,学会事務局より送付される案内メールをご参照ください.また, 原稿フォーマットや,その他の規定については,以下をご参照下さい. 研究会発表・参加方法,FAQ http://www.ieice.org/jpn/toukou/kenkyukai.html 問合せ先: 田仲 正弘(国立研究開発法人 情報通信研究機構) mtnk[at]nict.go.jp ----------------------------------------------------------------------- サービスコンピューティング研究会(http://sig-sc.org/) 委員長:細野 繁(NEC),副委員長:Incheon Paik (会津大), 幹 事:田仲 正弘(NICT),井垣 宏(大阪大学) |
|||||||||||||||
[研究会発表申込システムのトップページに戻る] |