以前クラスタ設定 をしたのはこのテストをするためでした。

最初HAとDRS両方とも機能を有効にしていたのですが二つとも最初っから設定すると話がややこしくなるので、今はHA機能のみ有効にしています。

先ずは設定のおさらいをします。

vCenterに接続して、クラスタを選択して右クリック「設定の編集」を選択します。


VMware vSphereのテスト環境構築

まずは、「■VMware HAをオンにする」にチェックがある事を確認

VMware vSphereのテスト環境構築

次に「VMware HA」をクリックします。


「■ホスト監視の有効化」をチェックするとESXサーバ間でハートビートを行います。所謂一般的なHAの設定です。
「アドミッションコントロール」は、簡単にいうと、HA発生時にHA先ESXのリソース不足になっても無視してサーバーを起動させることを優先するのかどうかって事です。
「アドミッションコントロールポリシー」は「アドミッションコントロール」に影響する設定になります。
今回は2台のESXしかないので、必然的に「●ホスト障害のクラスタ許容:1」にしています。
ESX2台でも片方向にしかHAしないなら「●フェイルオーバーホストの指定」をする事もOKです。
でもそれを選ぶと昔ながらのActive/Standby構成のHAになるので仮想化の意味が無くなっちゃいます。
3台以上あるときに例えば普段は開発・テスト用に使っているESX(多分スペックダウンになる)にHAするとき
なんかには有効です。
「●フェイルオーバーの予備容量として予約されたクラスタリソースの割合」のリソースとは、可用性ガイド を読んでもイマイチはっきりしないですがESXのリソースとしては「CPU,メモリ」がサマリをみるとあるので、クラスタ内にあるESXのCPU、メモリ等の各リソースの割合を指定するのではないかと思います。

多分これはESXのハードウェアリソースにばらつきがある場合に有効な指定だと思いますが、
一般的にはブレードサーバを導入し、全部同じスペックで行く所が多いので、あまり使わない設定と思います。

VMware vSphereのテスト環境構築

次にクラスタのオプション画面です。

「仮想マシン再起動の優先順位」は「無効・低・中・高」が選択できます。
無効を選択すると文字通り再起動が無効化されるのでHAが無効化されます。あとはHAされるサーバー間で起動順序の優先度が低い順に「低・中・高」を設定します。私が実験で低と高のサーバでHAを発生させた所、ほぼ同時と言っていいような微妙なタイミングでしたが、一応「高」の方が先にログイン画面が表示されました。サーバーアプリケーションなどをインストールしたらまた違うんでしょうけどね。あとは、再起動のタイミングが先なので、アドミッションコントロールを有効化の状態のときに制限に引っかからず起動出来る可能性が高くなります。

「ホストの隔離時の対応」は可用性ガイド 読んでても色んな要素があるため、マニュアル読んでもらった方がはやいです。取りあえずホストの隔離状態とは、仮想マシンは起動しているけど、管理ネットワーク上は通信が遮断されている状態だそうです。多分サービスコンソールが実行されているネットワークの事を指していると思われます。隔離時の対応としては、「パワーオンのままにする・パワーオフ・シャットダウン」の3つがあります。
パワーオンのままはHAしないと同義です。パワーオフとシャットダウンの違いは、いきなり仮想マシンの電源OFFしてメモリ内情報を破棄してHAしちゃうのか、ちゃんとメモリ情報をディスクに吐き出(シャットダウン)してからHAするのかの違いです。

VMware vSphereのテスト環境構築

次に「仮想マシンの監視」について

仮想マシンの監視設定では「無効・仮想マシンの監視のみ・仮想マシンとアプリケーションの監視」の3つから選択できます。
仮想マシン(OS)がちゃんと動作しているか確認し、正常動作していないと判断されると仮想マシンの再起動をします。その機能を「無効」とするか、OSやVMToolsのハング状態のとき再起動する「仮想マシンの監視のみ」(判断基準はVMToolsとESX間のハートビート及びIOアクティビティだそうです)、もしくは「仮想マシンとアプリケーションの監視」では、仮想マシンの監視にプラスして、VMware社のアプリケーションの監視に対応するように開発されたアプリケーションまで監視対象に含める事が出来ます。

VMware vSphereのテスト環境構築


設定のおさらいは、こんな所で。

テストは、
①ESXサーバが障害起こった時のHA動作
 ケース1:停止・起動の状態の仮想マシンのHA
 ケース2:起動状態2台で隔離時の対応「低・高」に分けた場合
 ケース3:隔離時の対応「無効」にした場合
 ケース4:HA発生2台中1台分はリソース不足となるように設定した場合
 ケース5:HA発生2台中1台分はリソース不足となるように設定しつつ、無視する設定にした場合

②ESXサーバのNICポートをDisableにする。
 ケース1:ホスト隔離時の対応を「無効」
 ケース2:ホスト隔離時の対応を「パワーオンのまま」
 ケース3:ホスト隔離時の対応を「パワーオフ」
 ケース4:ホスト隔離時の対応を「シャットダウン」

②仮想マシンの監視に対して、OSをハングアップさせる。
 ケース1:設定が無効の場合、
 ケース2:「仮想マシンの監視のみ」の場合

結構ありますがこんな感じでテストしていきます。