vSAN の障害には3種類あります。
ディスクの障害、ホストの障害、ネットワークの障害
許容する障害の数で定義されている最大の障害範囲はホスト障害です。
ホストが1台壊れても仮想マシンを止めない!→FTT=1
ホストが2台壊れても仮想マシンを止めない!→FTT=2
このあたりの復習をしたいかたはまずこちらから
モノは壊れるシリーズ④- vSAN 6.6.1までの再同期エンハンスメント
モノは壊れるシリーズ⑤- vSAN 6.6.1までの再同期エンハンスメント続
もう一度ストレッチクラスタの基本を復習する場合はこちら
vSAN ストレッチクラスタ②:ストレッチクラスタの要件 そのいち
vSAN ストレッチクラスタ③:ストレッチクラスタの要件 そのに
vSAN ストレッチクラスタ⑤:ストレッチクラスタの仮想マシンのストレージポリシー
vSAN ストレッチクラスタ⑥:ストレッチクラスタの仮想マシンのストレージポリシー New!!!
vSAN ストレッチクラスタ⑦:ストレッチクラスタのアフィニティ設定
では本題に入ります。
ストレッチクラスタならではのキーワードはサイト、ウィットネスVMです。
さらに6.7U1からはローカル保護(Nested Fault Domain)も追加されています。
ストレッチクラスタの場合はどのような挙動になるのか、通常のクラスタとは異なる点を中心に確認していきましょう。
以前の記事でストレッチクラスタと括弧書きがついているポリシーが4つありました。
ここでは
かつ
ローカル保護あり(FTT=1以上)
であることを前提に進めていきます。
ディスクの障害:プライマリサイト
プライマリサイトに所属するホストのディスクに障害が発生した場合、仮想マシンはプライマリサイトで稼働し続けます。
アクセシビリティはありますが、サイト内のローカル保護ポリシーに準拠していない状態です。
ディスクの障害なので、もともと配置されていたデータがなくなってしまった、即時に再同期が行われます。
ディスクの障害:セカンダリサイト
セカンダリサイトに所属するホストのディスクに障害が発生した場合も、仮想マシンはプライマリサイトで稼働し続けます。
アクセシビリティはありますが、サイト内のローカル保護ポリシーに準拠していない状態です。
ディスクの障害なので、もともと配置されていたデータがなくなってしまった、即時に再同期が行われます。
ホストの障害:プライマリサイト
プライマリサイトに所属するホストの障害が発生した場合、そのホスト上で稼働していた仮想マシンは落ちてしまいます。(通常のvSphere クラスタと同様)
アクセシビリティはありますが、サイト内のローカル保護ポリシーに準拠していない状態です。
障害が発生したホスト上で稼働していた仮想マシンはプライマリサイト内の異なるホストにHAして再起動されます。
一定時間後、プライマリサイト内で再同期が開始されます。
ホストの障害:セカンダリサイト
セカンダリサイトに所属するホストの障害が発生した場合、プライマリサイトの仮想マシンはそのまま稼働し続けます。
アクセシビリティはありますが、サイト内のローカル保護ポリシーに準拠していない状態です。
セカンダリサイトで稼働していた仮想マシンがある場合、セカンダリサイト内でHAにより再起動され異なるホスト上で稼働します。
一定時間後、セカンダリサイト内で再同期が開始されます。
ディスクの障害もホストの障害もローカル保護されている場合、通常のvSAN クラスタと同様の動きですね。
アフィニティをきちんと設定し、仮想マシンをグルーピングすることでサイト内での運用、サイト内でのホスト障害があった場合もサイト内でHAを行います。
ただ、ストレッチクラスタだったらどうなるんだっけ?と思うことも多いので、一度整理してみました。
ストレッチクラスタシリーズ長くなってきましたが、次回はストレッチクラスタならでは、サイトの障害(ネットワークの障害)についてご紹介します!
vSAN ストレッチクラスタ②:ストレッチクラスタの要件 そのいち
vSAN ストレッチクラスタ③:ストレッチクラスタの要件 そのに
vSAN ストレッチクラスタ⑤:ストレッチクラスタの仮想マシンのストレージポリシー
vSAN ストレッチクラスタ⑥:ストレッチクラスタの仮想マシンのストレージポリシー New!!!
vSAN ストレッチクラスタ⑦:ストレッチクラスタのアフィニティ設定