講演抄録/キーワード |
講演名 |
2022-05-20 13:50
アラートスコアリングによるITシステムの障害箇所推定方式の提案 ○近藤玲子・荻原一隆・白石 崇(富士通) ICM2022-8 |
抄録 |
(和) |
多数のアプリの組み合わせからなるサービス(マイクロサービス)が複数の仮想マシンや物理マシン上に配置されているシステムでは、各機器が連携して動作するため障害が発生すると広範な機器からアラートが発生し、障害個所の特定が難しい。さらに障害個所特定のためアラート発出の閾値設定を行うが、その設定が不適切だった場合に、その機器を障害箇所として特定できない問題もある。また多数の機器があるため複数の異なる障害が短時間の内に発生することも考えられ、異なる障害個所から発生した複数のアラートを同じ障害として原因調査してしまうこともあり得る。
そこで我々は、各機器のアラートから障害個所である可能性をスコアリングする障害箇所推定方式を提案する。障害箇所推定方式は次の3つの特徴を持つ。アプリとインフラの依存関係を統合して分析することで、アプリとインフラを跨いだ広範な機器のアラートから障害個所を推定できる。また機器間のアラートの伝搬をスコアに反映することで、閾値設定ミス等でアラートが上がらない機器も障害個所として推定できる。さらに構成情報と機器間の依存関係から関連するアラートをグループ化することで、複数障害の分類への応用も期待できる。本提案技術で運用者はスコアの高い機器から調査を行うことができ、障害復旧時間の短縮が見込める。 |
(英) |
In a system where services (microservices) consisting of a combination of many applications are deployed on multiple virtual and physical machines, each device works together, so when a failure occurs, alerts are generated from a wide range of devices, making it difficult to identify the location of the failure. In addition, the alert thresholds are set to identify the failure location, but if the settings are inappropriate, the equipment cannot be identified as the failure location. Also, because of the large number of devices, multiple different failures can occur in a short period of time, and it is possible that multiple alerts generated from different failure locations may be investigated as the same failure.
Therefore, we propose a failure location estimation method that evaluates possibility of a failure location from the alerts of each device. The failure location estimation method has the following three features. By integrating and analyzing the dependencies between applications and infrastructure, the failure location can be estimated from alerts for a wide range of devices from applications to infrastructures. In addition, by reflecting the propagation of alerts between devices in the score, even devices that do not raise alerts due to a threshold setting error, etc., can be estimated as fault locations. Furthermore, by grouping related alerts based on configuration information and dependencies between devices, it is expected to be applied to the classification of multiple failures. By using the proposed technology, operators can investigate the equipment with the highest score first, which is expected to shorten the time required for fault recovery. |
キーワード |
(和) |
コンテナ / 運用 / システム構成 / スコアリング / 複合障害 / Docker / Kubernetes / Istio |
(英) |
Container / Operation / System configuration / Scoring / Multiple failures / Docker / Kubernetes / Istio |
文献情報 |
信学技報, vol. 122, no. 32, ICM2022-8, pp. 36-41, 2022年5月. |
資料番号 |
ICM2022-8 |
発行日 |
2022-05-12 (ICM) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
ICM2022-8 |
研究会情報 |
研究会 |
ICM IPSJ-CSEC IPSJ-IOT |
開催期間 |
2022-05-19 - 2022-05-20 |
開催地(和) |
長野ターミナル会館+サブ会場 |
開催地(英) |
|
テーマ(和) |
サービス管理,運用管理技術,セキュリティ管理,一般 |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
ICM |
会議コード |
2022-05-ICM-CSEC-IOT |
本文の言語 |
日本語 |
タイトル(和) |
アラートスコアリングによるITシステムの障害箇所推定方式の提案 |
サブタイトル(和) |
|
タイトル(英) |
Proposal for a Method of Estimating IT System Failure Locations Using Alert Scoring |
サブタイトル(英) |
|
キーワード(1)(和/英) |
コンテナ / Container |
キーワード(2)(和/英) |
運用 / Operation |
キーワード(3)(和/英) |
システム構成 / System configuration |
キーワード(4)(和/英) |
スコアリング / Scoring |
キーワード(5)(和/英) |
複合障害 / Multiple failures |
キーワード(6)(和/英) |
Docker / Docker |
キーワード(7)(和/英) |
Kubernetes / Kubernetes |
キーワード(8)(和/英) |
Istio / Istio |
第1著者 氏名(和/英/ヨミ) |
近藤 玲子 / Reiko Kondo / コンドウ レイコ |
第1著者 所属(和/英) |
富士通株式会社 (略称: 富士通)
FUJITSU LIMITED (略称: FUJITSU) |
第2著者 氏名(和/英/ヨミ) |
荻原 一隆 / Kazutaka Ogihara / カズタカ オギハラ |
第2著者 所属(和/英) |
富士通株式会社 (略称: 富士通)
FUJITSU LIMITED (略称: FUJITSU) |
第3著者 氏名(和/英/ヨミ) |
白石 崇 / Takashi Shiraishi / シライシ タカシ |
第3著者 所属(和/英) |
富士通株式会社 (略称: 富士通)
FUJITSU LIMITED (略称: FUJITSU) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2022-05-20 13:50:00 |
発表時間 |
25分 |
申込先研究会 |
ICM |
資料番号 |
ICM2022-8 |
巻番号(vol) |
vol.122 |
号番号(no) |
no.32 |
ページ範囲 |
pp.36-41 |
ページ数 |
6 |
発行日 |
2022-05-12 (ICM) |
|