DELLのサーバは、あかん! 保守があかんわ。
ドキュメンタリー
1月末 ハードディスク異常ランプ点滅
替えのハードディスクが届く。自分で替えろとのこと。替えた。
3月末同じ個所のハードディスクが異常ランプ点滅
1月に替えた時から直ってなかったのかもしれない。よくあることだと思って、サーバ室が離れているので直ったかどうかを見てなかった。
また替えのハードディスクが届き、自分で替えた。
4月初旬 見に行ってもリビルドが終わっていない。(ようなランプ)
Dellに問い合わせる。再起動したら直るかもと言われる。GWにでも再起動かけようかと。
うちの担当者がサーバを再起動してしまう。一応無事に起動した。
4月18日ごろ なんと別のハードディスクが異常ランプ点滅している!!
Raid構成上の仕様で、2個同時にハードディスクが故障すると全体が死ぬことになっている。
4月20日の夜 2個目のハードディスクを取り換える。そのとき1個目の異常のハードディスクは正常ランプだった(らしい) システムの正常動作確認はしたとのこと。
4月21日 サーバ死んでいる!
Raidの2本のハードディスクがオフライン!! 当然死んでる。
あきらめて、バックアップサーバから1TB以上のデータを新規に立てたサーバに、コピー開始。
しかし、DELLのオンサイト保守に契約しているのに、来ないし、指示通りやってたのに、サーバが死ぬなんて!と憤慨して電話するが、拉致があかない。
コピー中の長い待ち時間の間に、いろいろやって、なんと!奇跡の生還を果たす。
(Raidをいろいろさわっていたら、オフラインの1本が認識しだした。データが詰まっているDドライブが生きているようだった。 さらに、Windows2012 のCDからシステムが破損しているようだったので、修復したら奇跡的にうまくいった。)
DELLの保守のやりとりで、サーバの情報のデータよこせとのことで、送る。RaidのForeignとなっているディスクをInportしたら直るとのこと。
DELLを信じてないので、やったらサーバが今度こそ死んで生き返らないかもと思った。
今日、5月3日19:00 ゴールデンウィークに、新サーバも用意して、完全にデータバックアップして、エンドユーザさんに事前に周知して、万全な状態で、いざ DELLの言うように、 Import してみた。 結果、サーバは起動したものの Raidの異常はなおらず、DELLにあきれて電話するとディスクを替えると直るかも? しかし、発送は8日になります。 と・・・ そんなあほなー。
グループウェアのライセンス有効化もあるので、今日のところは触らない。
新サーバへ移行をすすめる。これ以上、異常のあるサーバを触っていても危険なだけ。
今後、DELLやめて、HPにしよう。
それか、かえって、自作のマシンのほうがいいかもしれないなー。部品調達や管理もできるしなー。安易にメーカーにゆだねると とんでもないことが起こるわ。
どっちにしてもバックアップですね。