【VMware】vSphere 5.0 u1 におけるVMware HAの仕様変更 | IAサーバーの仮想化メモ

【VMware】vSphere 5.0 u1 におけるVMware HAの仕様変更

全く気が付きませんでしたが、vSphere 5.0 update 1では、VMware HAに関する仕様変更があるそうです。

Slight change in “restart” behavior for HA with vSphere 5.0 Update 1

上記のブログによると、変更点は以下になります。

・各ESXホストや仮想マシンの情報をprotectedlistファイルだけでなく、vCenterからも取得できるようになった
・複数のマスターが存在する場合に、各マスターがHAトリガー時に仮想マシンの再起動を実行できるようになった

最初この記事を読んだときは、さっぱりわかりませんでした。
いろいろと調べていくうちに、ようやく意味が分かりかけてきたので、備忘録としてメモを残したいと思います・・・。

まずは、protectedlistファイルについてです。

vSphere 5.0環境でVMware HAを初めて構成すると、HAクラスターの中でマスターとなるESXiホストが1台選出されます。
そして、protectedlistファイルが、HAクラスター内に存在する仮想マシンが稼働しているすべてのデータストアで生成されます。
このファイルには、そのデータストアに存在する仮想マシンの情報が記録されています。
すなわち、VMware HAの保護対象の仮想マシンについて記録されていることになります。

このprotectedlistファイルは、HAクラスターのマスターとして選出されたESXiホストが所有権を持ち、排他的ロックをかけます。
こうすることで、マスターではない他のESXiホスト(スレーブ)は、マスターがクラスター内に存在することを知ることができます。

マスターが、スレーブのダウンもしくは隔離状態を検知すると、マスターがそのスレーブで稼働している仮想マシンの再起動を実行します。
マスターは、protectedlistファイルを参照することで、再起動対象の仮想マシンを判断しています。

ここでポイントとなるのは、protectedlistファイルを所有できるのは1台のマスターに限られる、という点です。
排他的ロックをかけるので、1台に限られるわけです。
したがって、複数のマスターが存在するような事態に陥った場合、protectedlistファイルを所有できないマスターが発生します。
今回の仕様のアップデートは、このような状態になった場合に意味があるようです。

「複数のマスターが存在するような事態」というのは、通常運用時には発生しません。
しかしながら、ネットワーク障害等で発生する場合があります。
これを、「ネットワークパーティション状態」と呼ぶようですが、このあたりについては次のエントリーで整理しようと思います。
(protectedlistファイルについてメモ書きしたものの、理解不十分な部分がある点はご容赦ください。。。)