7月は客先のサーバー故障が続いた。どちらも結構遠い客先なので、出かけると一日がかり。

一台は「朝来たらサーバーが落ちていた。電源を入れても起動しない」ってことで現地へ。
ほこりっぽいので中を掃除しコンセントを接続するタップの口を変えて電源を入れると起動した。で、ちゃんとシステムも動くのでと確認頂いて帰途に着くが、その1時間後に電話があり「またダメ」ってことで「こりゃ電源ユニットの問題ちゃうの?」とH/Wメーカーに連絡した。
翌営業日、サーバーの保守の範囲内で修理完了。電源ユニット交換でビンゴであった。


もう一台は「毎日サーバーを落として返っているが、今朝はなんかセーフモードとかになるみたい」という事で、電話対応だけでは復旧しなかったので現地へ。
確かに、こりゃどうやっても起動しない。この症状だとHDDかRAIDコントローラーかな?業務が停まるとまずいので、あるPCをサーバー替わりにして環境構築とソフトのインストールを実施し、H/Wメーカーに連絡。
翌営業日、ハーバーの保守の範囲で修理完了。HDDがダメらしく、OSからの再インストールはこちらで実施・・。購入時点ではインストール済みだったのに・・。再インストール作業にもう一回現地作業を実施した。


こちらではシステムのソフトウェアを入れており、障害がソフトかハードかの切り分けは本来は客側であるが、客にしてみればソフトだろうがハードだろうが知ったこっちゃないに違いない。動かないものは動かないんだから。
まあ、その辺は日本ではきっちりと線引きをしにくいところで致し方ない部分だろう。


なお、該当H/Wは両方とも同じメーカーであった。こういう事を書くと失礼だとは思うが、元はパソコンメーカーなので弱いのか?と勘ぐりたくなったりもする。ハードウェアメーカーによる故障率なんてもの、メーカーは当然数字を出さないだろうけれど、ここいらの情報は集められるだろうか?