面接で、印象に残るシステムの仕事のエピソードを良く聞かれるが、難しい障害の根本原因を真っ先に把握してるのに、障害対応なんて出さなくて、あたりまえと結果を出してないと思われることが多く、正直納得してないから、ここに障害対応の事例を書いてアピールする。

【ミッション】
経費削減のため、富士通のサーバセンターにおいてた、コンテンツ配信サービスのサーバ群を都内の安いサーバセンター(サービスレベルかなり低い)に移設する。金曜日の夜の業務終了後から、月曜日の朝一までの対応でミッション完了させる。

【障害事例報告】
 メーカーのネットワーク担当が、新規に取り扱うファイアーウォールを導入したいということで、サーバ移設時に既存のファイアーウォールとの入れ替えを行うことを承認したが、トヨタガズー様のサーバとFTPの通信ができない。
 どうしようと、統括のコンテンツプロバイダの私も含めて、悩ませてると、課長から電話が来て
「なぜ、決まった時間に報告を入れない」
と怒られた。状況を把握すれば、課長は手をまわすこともできますし。

 しばらくして、係長のネットワーク担当から電話がかかってきて、
状況を説明
「君の説明だけじゃ、よくわかんないから、メーカーのネットワーク担当と直接話すよ」
で対策法としては、以前のファイアーウォールに戻すんですけど、その場合、管理ソフトの対応OSが異なるため、Windowsの再インストールが必要。
「何分かかりますか」
「30分で終わります」

ここで、コロンブスの本で読んだ、馬鹿正直に報告を信じないで、少し時間に余裕をもたせる采配。トヨタガズーのオペレータさんに電話して
「今、元に戻す対応中で、接続テストの再開は1時間かかると思うので、昼飯先にすませておいてください」
といった。

案の定、あせってるのか、30分で終わってないけど、ほっといて、45分ぐらいたったぐらい
たってから催促。これなら、さすがに
「何度も催促してうるさいな」
と思わないだろうから、
「状況どうですか」
「あと、OS再起動すれば終わりです」
ということで、無事完了。

よかった、トヨタの担当に嘘つかなくて。トヨタ恐いもん(笑)。

【学習してほしいこと】
現場の作業者は、厳しい時間ノルマの中、失敗が許されないオペレーションをしているので、管理者が近くでイライラしているようではだめで、別室でお茶でも飲んでるのがよいこともおおい。ルネッサンスの巨匠ミケランジェロは、仕事を急がせる教皇にノミを投げつけたという、逸話もある。