あれもこれもログに吐き出して、それっぽいグラフを常時表示させて……って。
ぶっちゃけ、「は?」ですわ。
どこかに障害が起きたら、それを全部、詳しくログに吐かせて、スラックだ何だにメッセージ飛ばして。
で、「ああ、また××の調子が悪いんだな。いつものやつだから無視していいよ」って。
無視していいエラーなら、そもそも出力すんな。
で、出力を抑制したら、似てるけど違う、致命的なエラーも握りつぶされたり。
CPUやメモリの利用率とか、そんなもん、専用サーバ時代の遺物なわけで、今時の運用なら、事前に予測立てて仮想サーバを増減させたりすりゃ済むわけだろ? ってか、そのためのクラウドの仮想化な訳で。
エラーだって、AWSなんか、サービスが落ちるの当然なんで(落ちまくる、って意味じゃなく、数十年間、1msすら止まらない、なんてサービスは存在しない。その1msが10年後か、3分後かは予測不能だから、落ちるの当然と考えておくように、って意味な)、リトライとかの準備しとくように、みたいなスタンスだし、そういう対策していれば、基本的には入力データエラー以外はそんなエラー吐きまくることはないはずだし、エラー吐きまくられるような事態にあるということは、運用担当者には手出しできないところで起きているわけで、利用者への自動通知の仕組みを用意しておけば済む話(もちろん、そのあと、範囲調査とかはするけどな)。
「今までやってきたことだから」って、何の検討もしないで惰性で続けてる無駄なこと、見当違いなこと、過剰なこと、無意味なこと、多すぎないか? と思う。
まぁ、↑をやるための「仕込み」が必要で、大変で、「理解してもらえない」ことが多いのがしんどいんだ。
AIの時間だ〜!
とかいうくせに、異常検知/変化検知とか、これっぽっちも検討しないし。
ちゅうか、「これが最新の関数型プログラミング」とかいうより、こういう奴の方が、地味に大切だと思うんだが、これがなかなか理解してもらえないんだよね。
まぁ、そもそもが
for {
x <- ......
y<- .......
_ <- ....
} yield (x,y)
って書くことが、って書きさえすれば関数型プログラミング、ってわけはないんだがな。