容易に予測できる人的ミスを回避できない設計にした、容易に予測できる条件の組み合わせを見落とした、要件定義ミスであり設計ミスであり実装ミス。
それ以外の何者でもないミスだ。
そんなもん午前4時まで残業してもカバーできんし、新しいマニュアルを配っても収束できんよw
この手の大規模ユーザーのWebサービスをSIerに作らせるからこうなるんだわ。
なんか、SREが障害報告のレポートのフォーマット整えたりSlackBotを充実させたりで安定運用頑張ってます的な話をちらっと聞いたけど、割れ鍋で料理作って汁漏れてますとか報告されても汁は漏れ続けるでしょうよ。
大事なのは割れてない鍋、割れない鍋を最初から使うこと。
今の割れ鍋を継いで使い続けてもいいかもしれないけど、それよりは鋳潰して全く新しい鍋を作った方が早いし確実。
それが休みの日もみんな安心して眠れる「設計レベルの障害対策」って言って言うんですよ、お嬢さん、ご存知でした?
おいらはそれをメインの業務としてやってるんですわ。
ってな感じで、できるだけ耐障害性の高い仕組みにして去った元現場なんですが、今現在、着実に破壊工作が進んでます。
やることなさげに見えてるんだろうけど、もうやることないんやw
今ある仕組みに乗っかって、コピペに近い形で新機能を実装していくだけ。
その状態にまで持って行って、契約終了にしたから。
やること作って、自分がどれほどすごいか主張したい連中が集まってきたらしい。
無能ほど吠えたがるってのの典型例に、元現場が成り下がってるのは、あまり見たくない光景ではある。
半年は持つと思ったけど、夏休み明けには不安定度が増してるような気がする……。