トラブル発生に備えた鉄則を軽視、忘れたのでは(全銀ネット、トヨタ) | きままなひととき

きままなひととき

いらっしゃい!
きままなひとときをご覧ください。

今年10月10日に発生した全銀ネットのトラブルで、主要銀行間の振り込み送金ができなくなり、社会の市民生活に多大な混乱を生じました。3日目にやっと正常化しましたが、丸2日間のシステムトラブル中の送金トラブルは約500万件にも及びました。

システム開発での鉄則は、以下の通りです。

システム更新時は、

・システム更新前に想定できるあらゆるテストをしていても常に予期せぬトラブルに即応するため、トラブル発生時に直前のシステムにすぐに戻せるようにバックアップを絶対に行う。

物理的に更新前後のシステムを別々のコンピュータ機器や大容量ハードディスクで2個持ちとしてしばらく併用できるようにし、更新後のシステムが安定稼働するのを見届けてから直前のシステムを停止し撤去する。

です。スイッチひとつですぐに直前のシステムに戻せるようにする、のが鉄則です。

私がシステム開発していた当時は、システムは更新前後のコンピュータ間の相性、つまり異なるシステムのバージョンやメモリーやディスク容量、通信許容容量・速度、中継器、OS、機器の新旧による相性、メーカー等の違い、更新する新規システムソフト(アプリ)の信頼性などにより、予期せぬトラブルが発生することもあり、その際には、すぐに安定稼働していた直前のシステムに戻せるように物理的にしてきました。でないと、社内での基幹システムがトラブルで停止すると、業務に多大な悪影響(受発注停止、工場停止等)を及ぼすからです。そして、万が一のトラブル対応のためにシステム切換え時は24時間体制でシステム要員を配置し、トラブルに即応できるように常時監視していました。

全銀ネットは、こうした鉄則を守っていれば、トラブル発生直後に安定稼働していた直前のシステムに戻していれば、影響はほとんどなかったはずです。

システム開発でのこの鉄則をなぜ守らなかったのかと不思議です。過去に記載した当ブログの、情報システム要員の冷遇、情報システムへの経営陣の軽視と不理解が根底にあるようにも感じます。

 

それから、トヨタの仕入先のトラブルによるトヨタ工場停止です。バネメーカー1社の工場で爆発があり稼働停止しているために部品供給できなくなり、在庫を持たないジャストインタイムのトヨタ生産方式を堅持しているトヨタの工場のほとんどが稼働停止中です。生産に多大な影響を及ぼしています。

 

以前のトヨタでは、調達先選定の鉄則は、

同じ部品は必ず最低2社発注する

です。仕入れ価格を競争させて原価低減させること以外に、万が一、1社の仕入先にトラブルがあっても、もう1社の仕入先から部品調達できるからです。保険の役割も兼ねている鉄則です。

 

でも、たった1社の仕入先のトラブルでトヨタのほとんどの工場の稼働が大規模停止するということは、この鉄則を守っていなかったわけで、いったいトヨタはどうしているのかと不思議です。

以前も同様に仕入先1社のトラブルでトヨタの全工場が停止していました。この時も、この鉄則を守らなかったのでしょうし、その時のトラブルの教訓が活かされていませんでした。最低2社発注していればこれほど大規模な工場停止を避けられていたのは間違いないです。トヨタ生産方式を堅持するなら、この鉄則とセットです。在庫をもっていないので、1社がトラブルと、即工場停止してしまうからです。

 

いずれも、トラブル時のバックアップ体制ができていないことで共通であり、今回が初めてではなく、過去の積み上げからくる経験による知恵の鉄則を守らなかった、軽視した、忘れたからだと感じます。技術の伝承を軽視しているのではないかと感じます。

過去からの知恵の塊である鉄則にのっとり、2社~3社発注を厳守すれば、今後大規模な工場停止は避けられます。

 

トラブル発生はしない、との過信は禁物で、今回のトラブルを是非教訓にし、過去からの積み上げの知恵の鉄則、原理原則に立ち返っていただきたいと思います。

 

ではでは。

 

#トラブル時のバックアップ体制、#システム更新、#2社発注、#原理原則、#鉄則、#過去の知恵軽視、#教訓を生かしていない、#過信、#調達先、#全銀ネット、#トヨタ、#工場停止、#再発防止ができていない