皆様こんばんは。
大雨により被害に遭われた皆様に、心からお見舞い申し上げます。
今回の大雨で全国各地で甚大な被害が発生しておりますが、大雨警報が継続されている地域も御座いますので、どうか身の安全を確保して頂ける様に宜しくお願い致します。
本日は、大手サーバーでインターネット設備影響による通信障害が生じていた様です。
突然今日スタッフさんから、今日の朝8:45過ぎからレコードクイーンで利用しているクラウド型の業務システムが利用できなくなったと言われました
なんでもお盆休みで保守を担当している方との連絡も取れないし、サーバー運営会社もお盆休みに入っていて困っているというのです
異なるサーバー運営会社に設置されているシステム全部が朝8:45過ぎから利用できなくなったという事だったので、アクセス元の回線・ISPを疑いしましたが、他の通信は通っている様子だったので私も検証してみた所、確かにかなり遅延とパケットロスが生じていて、それによりタイムアウトしている様な印象でした
サーバー側の障害も疑いたかったものの、複数のサーバー運営会社で同様のネットワーク障害というのはやはり納得が出来ませんでした
私はガジェットは好きなのでガジェットならば少し明るいものの、複雑な事が苦手でサーバーやネットワークはかなり疎いので私が復旧を手伝うのは辞めておこうと思ったのですがと思ったのですが、他のスタッフさんよりはまだ私の方が明るそうだったので、私なりに問題の切り分けと復旧を試みてみました
まずメインで利用しているシステムが収容されているサーバーのコントロールパネルにもアクセスがしにくい状態になっていましたアクセスしようとしてもタイムアウトしてしまう感じです
仕方が無いので、SSHからアクセスしようとしましたが、22番ポートが何かしらの問題で塞がっていてSSHもアクセスが無理でした多分設置した方がセキュリティー上SSHのポートを変えているんだと思いますでもよく考えてみるとSSHが繋がってもrootのパスワードは保守の方しかわからないと思うのでどうしようもなかったんですよね
もうお手上げです~
そんな事をしている間に、サブのシステムが収容されているアズポケットさんが障害情報を更新してくれました
アズポケットさんは「管理外の他社のインターネット設備の影響」によるものにも関わらず、速やかに障害情報として掲載して下さったので本当に助かりました
他社サーバー事業者さんは、「管理外の他社のインターネット設備の影響」だからという事なのか、障害情報としての掲載は見受けられませんでした
しかし、アズポケットさんのおかげで私なりにの解釈をする事が出来ました
恐らく、の図の様にサーバー運営会社は資本関係の無い他社であっても、同一のトランジット(バックボーン)を使っていた場合には、トランジット側でネットワーク障害が生じてしまうと各サーバーにも影響する事になってしまうので、今回は恐らくトランジット側のネットワーク障害だと解釈しました(違っていたら申し訳ありません。今回の障害情報を公表されているアズポケットさん以外の社名を伏字にしています。)
仕方が無いので、メインのシステムが収容されてるサーバーのコントロールパネルでどうにかコンソールにアクセスを試みました1時間くらい粘ったら無事にコンソールにたどり着けました
幸いな事に、コンソールは既にrootでログインされている状態だったので、「reboot」コマンドを送る事ができ、サーバーを再起動する事が出来ました
ちなみに、私が使えるコマンドは再起動=「reboot」・電源を切る「shutdown」の2つだけです
しかし、再起動しても改善しませんでしたお力になれず申し訳ありません
もしかすると、今日は色々な方とのメールのやり取り(特にgmailをお使いの方⇔独自ドメインメールとのやり取り)において、遅延したり届かなかったりすることがあったかもしれません
もしメールの返事が暫くなければ、再送してみた方がいいかもしれませんね
私は役に立つ事が出来ませんでしたが、普段しない事を出来て楽しかったです
勉強にもなって良かった~
甲斐犬人
■甲斐犬人 最新CDのご案内