ANAのシステム障害で、原因は「機械・・・」という文言はいかがなものか
「機械」って何?
また、
ルータ とか スイッチ とか書いてる記事やネットコメントを見かけました。
情報システム屋としては違和感があります。
「機械」といったら、メカを思ってしまいますから。
まだ、「ハードウェア」と書いた方がベターだと思います。
それでも、ルータやスイッチといったネットワーク機器だって、結局、ロジックで制御されwているわけで。
どうも、ANAさんのシステムは、4系で構成されていて、障害状況によって、適宜縮退運転をする様な仕掛けだと
類推するのですが、こういう障害対策機能のテストは、昔から、結局あまり時間をかけられず破綻するのが
お決まりのケースなんです。
また、刻々と追加変更される最新の情報を漏れ無く、重複無く、4つの系が共有あるいは引き継ぐのは至難の技
なんです。
本番運用中に、いきなり、障害対応訓練をやるというのも無理がありますから。大変ですよ。
とにかく、包み隠さず、障害情報と対策を公開していただきたいのですが、これがまた、システムベンダーの秘密ノウハウだったりするので、難しいのでしょう。
何があっても、最後は、人間系で対応できるようにしておくということでしょうか。
でも、人間系でこなせる業務量はとっくにオーバしていて、おそらく、無理なんですよ。
世の中には、どうしてもダウンしてもらっては困るシステムばかりになっているのではないでしょうか?
当方の日常生活で、すぐに思うのは
・ライフライン系;水道、電気、ガスなど
・交通系;列車制御、無人運転、航空機制御
・生命、医療系;ICUとか細菌、ウィルス管理など、手術支援
などです。
・ATM、銀行のセンタシステムなどは、以前に有りましたが、決済ができないと倒産、不渡りに繋がるという
ので、困りますが、直接生命事故にはならないのかも知れません。