講演抄録/キーワード |
講演名 |
2019-11-26 10:30
[依頼講演]自動構築スクリプトを用いた構成管理情報による障害原因自動特定・復旧機能の実装と評価 ○沼田晋作・橋本昭二・柏 大(NTTコミュニケーションズ) |
抄録 |
(和) |
情報システムの運用では、システムに発生する障害に対応するために、運用手順書やRCA(RouteCauseAnalysis)ツールなどを準備する。これらの手順書やツールは予め想定される障害については原因特定と対処を迅速に行うことが可能である。しかし、想定されていない障害が発生すると開発者へのエスカレーションなどによって障害の原因を特定し、原因を取り除く復旧手順を作成する必要がある。これには多くの時間を要するという問題がある。本取り組みでは、自動構築スクリプトから生成した構成管理情報を用いて問題の解決を行う。自動構築スクリプトから生成した構成管理情報はシステムの構成要素間の依存関係を保持しており、これとシステムを自動的に比較することで、発生している障害を構成管理情報とシステムとの差分として特定する。特定した差分を構成管理情報で定められている正常状態に修正し、システムの障害復旧を行う。この障害復旧手順を構成管理情報から自動的に生成する機能を開発し実装した。この機能によって、障害原因を特定しシステムの復旧を自動的に行うことができるか評価を行い、有効性を確認することができた。 |
(英) |
In operation scene of the information system, an operation procedure manual and RCA (RouteCauseAnalysis) tool are prepared for recovering failures occurred in the system. These procedure manuals and tools enable to quickly identify the cause of the failure and recovery them. But if an unexpected failure occurs, it is necessary to identify the cause of the failure by escalation to the developer and create a new recovery procedure to recovery system. It is problem that it is required a lot of time to create new procedure. In this report, the problem is solved by using the CMDB from the automatic construction script. The CMDB generated from the automatic configuration script holds the dependency relationship between the system components, and by comparing with this CMDB and the system can identify the cause of system failure. The difference between CMDB and system is the cause of system fault, and it will be corrected to a normal state as defined on CMDB. We have developed and implemented a function that automatically generates this failure recovery procedure from CMDB from automation construction scripts. And we evaluated effectiveness of this system to find the cause of failure and automatic recovering the failure of the information systems. |
キーワード |
(和) |
構成管理 / 自動構築スクリプト / ansible / RCA / 設計書 / 障害復旧手順書 / Route Cause Analysis / |
(英) |
Configuration Management / Automatic building script / ansible / RCA / Design Document / recovery procedure / Route Cause Analysis / |
文献情報 |
信学技報 |
資料番号 |
|
発行日 |
|
ISSN |
|
PDFダウンロード |
|