vSphere HA 関連で問題が発生した場合、HAマスターホストのfdm.log を調査する必要があります。
このログはvm-supportに含まれますが、ローテーションが早く、すぐ流れてしまうため、問題が起こった場合は原因調査のため、早めにvm-supportを取得する必要があります。
Contents
HAプライマリ ホスト、セカンダリ ホストの関係
vSphere HAは、各ホスト上で稼働する、Fault Domain Manager (FDM) と呼ばれるAgentによりその機能が提供されています。vSphere5.0以降に採用された FDM では、サーバの死活を監視するため基本的にクラスタに1台存在するマスターノードとその他のスレーブノード間でハートビートが実行されます。このハートビートが途切れたことをトリガーに仮想マシンの再稼働等の動作に移るというのが大まかな動作となります。
なお、上記記事ではマスターノード、スレーブノードという用語ですが、現在はプライマリ ホスト、セカンダリ ホストという名称へ変更されています。
vSphere ClientからHAプライマリホストを確認する方法
クラスタ選択 > 監視 > vSphere HA > サマリ にて確認することができます。
vm-supportからHAプライマリホストを確認する方法
1. どれか適当なホストのvm-supportを解凍し、fdm.logを"master=" のキーワードでgrepします。
# grep "master=" ./var/run/log/fdm.log
2. 下記赤字の箇所(state=XXXX)でプライマリホストか、セカンダリホストか判別ができます。
該当ホストがプライマリ ホストの場合
2023-07-04T06:06:02.154Z info fdm[2110701] [Originator@6876 sub=Cluster opID=SWI-3ab50c2a] hostId=host-22 state=Master master=None isolated=false host-list-version=80 config-version=69 vm-metadata-version=601102 slv-mst-tdiff-sec=0
該当ホストがセカンダリ ホストの場合
2023-07-04T05:28:36.957Z info fdm[2110669] [Originator@6876 sub=Cluster opID=SWI-3ab50c2a] hostId=host-20 state=Slave master=host-22 isolated=false host-list-version=80 config-version=69 vm-metadata-version=601068 slv-mst-tdiff-sec=0
上記より、host-22がプライマリ ホストであることがわかります。
補足
Host IDは下記ファイルから確認できます。
./commands/prettyPrint.sh_hostlist.txt
<host>
<hostId>host-22</hostId>
<hostName>esxi01.test.local</hostName>