「どの」システムも落ちますよ | A Day In The Boy's Life

A Day In The Boy's Life

とあるエンジニアのとある1日のつぶやき。

「このシステムは落ちます」と言えますか? @ ITpro


私の場合、「落ちても良いシステム構築依頼 」に書いたようにこれとは逆のパターンの相談を受けたこともあります。

ただ、「落ちてもよい」と「落とさないでくれ」というのは情報システム部門にとってはニアリーイコールの世界です。

例え業務主管部門が「落ちても良いよ」といったところで、落ちてしまうとユーザー部門からクレームがくるわけですから。

その時に、業務主管部門が「こちらが落ちても良いといったんです。情報システム部は悪くありません!」なんて盾になってくれることはまずありません。

どちらの要件定義を行っても情報システム部は一定のサービスレベルで運用する必要に迫られます。


システムが落ちるのは確率の問題と言うのは確かで、どんな構成をとろうともシステムを停止させる事はできます。

故に稼働率100%というのはある意味幻想です。

サーバーを2台並べました。

2台のサーバーが同時に故障する確率はゼロではありません。

サーバーを3台並べました。

これでも同時に故障する確率はゼロにはなりえません。

10台並べようが100台並べようが実質、システムが停止する確率は限りなくゼロに近くなりますが、ゼロにはなりえません。

じゃあ、ディザスタリカバリまで考えますか?と言う事になると莫大な運用保守費用がかかります。

結局のところトレードオフでどこかに落しどころを見つけるしかありません。


また、稼働率が全てではありません。

例えシステムが落ちたとしても、その障害復旧が迅速かつ、完全に行えればよしというシステムもあります。

稼動し続けることに金をかけるよりも、バックアップ構成に金をかけたほうがずっと低コストになる場合がありますし、1年のダウンタイムを9時間以内(稼働率99.9%)に抑えられるシステム構成を考えるよりも、落ちたらそのダウンタイム以内で復旧できる構成を目指した方がかなり低コストです。

例えば、ホットスタンバイの構成をとるのではなく、コールドスタンバイにしておきましょうなど構成が考えられます。


もちろんシステムの重要性によってコストの考え方は異なってきますが、金のなら無いシステムと文句を言うのはシステムに必要以上に金をかけているからでもあります。


システムは完全にはなりえません。

だから「このシステムの不完全さを何処まで許容しますか?」という質問になるわけです。

完全を求めてはいけません。

もう一度。システムは完全ではありません。