講演抄録/キーワード |
講演名 |
2018-11-16 12:20
ワークフローエンジンを用いたインシデント切り分け自動化 ○瓦井太雄・吉田直樹(阪市大)・中山裕貴・林 經正(ボスコ・テクノロジーズ)・阿多信吾(阪市大) ICM2018-34 |
抄録 |
(和) |
近年の情報インフラの普及と大規模化に伴い,ネットワークを含む情報システムの構造複雑化による運 用管理者の負担増加が深刻な問題となっている.特に機器の多種多様化,対象機器数の増大,さらに NFV などの仮 想化技術の活用によりインシデントに対して物理的・論理的検証が必要になるなど複雑化しつつある.これにとも ない人による手作業では障害復旧までの時間がかかりすぎることから,インシデント対応の自動化が求められてい る.本稿では,特に運用管理者の経験が求められていた障害に対する要因切り分けの課題について考察し,それにも とづく障害切り分け自動化手法を提案する.手法は 1. 依存関係を記述した検査処理の定義,2. インシデントアラー トの取得による検査項目の選定,3. レイヤ情報にもとづく検査処理の分類およびレピュテーションを考慮した対応 フローの作成,4. レピュテーションの更新の手順より構成され,多様化する障害に対し柔軟かつシステマティック に障害切り分けを行うことを目指す.検証実装ではワークフローエンジンである StackStorm(st2) を用い,web ア プリケーション運用における障害切り分けを取り上げる. |
(英) |
Recent years, increasing the operational cost of network management due to complicated IT infrastructure is becoming a serious problem. Especially, diversification and/or huge volume of networking devices and spread using virtualization technology leads more complex operations including physical and virtual perspectives, and the cost of incident handling are increasing year by year. Automation of the treatment for incidents are therefore becoming much attracted. In this paper, we propose a method of automatic fault isolation. Our method proceed, following four steps, i.e., 1.definition of inspection processes with dependency, 2.choose inspection processes, 3.make fault isolation flow after the classification processes by layers of networking architecture, and 4.update reputations. We develop an fault isolation system using StackStorm (st2) as a Proof-of-Concept system. |
キーワード |
(和) |
障害切り分け / ネットワーク運用管理 / ワークフロー自動化 / StackStorm / / / / |
(英) |
Fault isolation / Network operations and management / workflow automation / StackStorm / / / / |
文献情報 |
信学技報, vol. 118, no. 303, ICM2018-34, pp. 57-62, 2018年11月. |
資料番号 |
ICM2018-34 |
発行日 |
2018-11-08 (ICM) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
ICM2018-34 |