"HCI" はじめました。

vSAN担当小佐野舞です。VMwareのHCIを広めるため日々活動していきます。

vSAN ストレッチクラスタ⑧:ストレッチクラスタの障害時の挙動 その1

vSAN の障害には3種類あります。

ディスクの障害、ホストの障害、ネットワークの障害

許容する障害の数で定義されている最大の障害範囲はホスト障害です。

ホストが1台壊れても仮想マシンを止めない!→FTT=1

ホストが2台壊れても仮想マシンを止めない!→FTT=2

このあたりの復習をしたいかたはまずこちらから

モノは壊れるシリーズ①- HCIの障害って?

モノは壊れるシリーズ②- HWコンポーネントごとの影響範囲

モノは壊れるシリーズ③- ハイブリッドとオールフラッシュ

モノは壊れるシリーズ④- vSAN 6.6.1までの再同期エンハンスメント

モノは壊れるシリーズ⑤- vSAN 6.6.1までの再同期エンハンスメント続

 

 

もう一度ストレッチクラスタの基本を復習する場合はこちら 

vSAN ストレッチクラスタ①:ストレッチクラスタとは?

vSAN ストレッチクラスタ②:ストレッチクラスタの要件 そのいち

vSAN ストレッチクラスタ③:ストレッチクラスタの要件 そのに

vSAN ストレッチクラスタ④:ストレッチクラスタ構成方法

vSAN ストレッチクラスタ⑤:ストレッチクラスタの仮想マシンのストレージポリシー

vSAN ストレッチクラスタ⑥:ストレッチクラスタの仮想マシンのストレージポリシー New!!!

vSAN ストレッチクラスタ⑦:ストレッチクラスタのアフィニティ設定

 

では本題に入ります。 

ストレッチクラスタならではのキーワードはサイト、ウィットネスVMです。

さらに6.7U1からはローカル保護(Nested Fault Domain)も追加されています。

ストレッチクラスタの場合はどのような挙動になるのか、通常のクラスタとは異なる点を中心に確認していきましょう。

 

以前の記事でストレッチクラスタと括弧書きがついているポリシーが4つありました。

ここでは

デュアルサイトミラーリング(ストレッチクラスタ)

 かつ

ローカル保護あり(FTT=1以上)

であることを前提に進めていきます。

 

f:id:vmwarekkHCI:20191218125148p:plain

 

ディスクの障害:プライマリサイト

f:id:vmwarekkHCI:20191218125456p:plain

プライマリサイトに所属するホストのディスクに障害が発生した場合、仮想マシンはプライマリサイトで稼働し続けます。

アクセシビリティはありますが、サイト内のローカル保護ポリシーに準拠していない状態です。

 

f:id:vmwarekkHCI:20191218125551p:plain

ディスクの障害なので、もともと配置されていたデータがなくなってしまった、即時に再同期が行われます。

 

  

ディスクの障害:セカンダリサイト

f:id:vmwarekkHCI:20191218125731p:plain

セカンダリサイトに所属するホストのディスクに障害が発生した場合も、仮想マシンはプライマリサイトで稼働し続けます。

アクセシビリティはありますが、サイト内のローカル保護ポリシーに準拠していない状態です。

 

f:id:vmwarekkHCI:20191218130423p:plain

ディスクの障害なので、もともと配置されていたデータがなくなってしまった、即時に再同期が行われます。
 

 

ホストの障害:プライマリサイト

f:id:vmwarekkHCI:20191218133914p:plain

プライマリサイトに所属するホストの障害が発生した場合、そのホスト上で稼働していた仮想マシンは落ちてしまいます。(通常のvSphere クラスタと同様)

アクセシビリティはありますが、サイト内のローカル保護ポリシーに準拠していない状態です。

 

f:id:vmwarekkHCI:20191218133954p:plain

障害が発生したホスト上で稼働していた仮想マシンはプライマリサイト内の異なるホストにHAして再起動されます。

一定時間後、プライマリサイト内で再同期が開始されます。

 

 

ホストの障害:セカンダリサイト

f:id:vmwarekkHCI:20191218134026p:plain

セカンダリサイトに所属するホストの障害が発生した場合、プライマリサイトの仮想マシンはそのまま稼働し続けます。

アクセシビリティはありますが、サイト内のローカル保護ポリシーに準拠していない状態です。

セカンダリサイトで稼働していた仮想マシンがある場合、セカンダリサイト内でHAにより再起動され異なるホスト上で稼働します。

 

f:id:vmwarekkHCI:20191218134053p:plain

一定時間後、セカンダリサイト内で再同期が開始されます。

 

 


ディスクの障害もホストの障害もローカル保護されている場合、通常のvSAN クラスタと同様の動きですね。

アフィニティをきちんと設定し、仮想マシンをグルーピングすることでサイト内での運用、サイト内でのホスト障害があった場合もサイト内でHAを行います。

ただ、ストレッチクラスタだったらどうなるんだっけ?と思うことも多いので、一度整理してみました。

ストレッチクラスタシリーズ長くなってきましたが、次回はストレッチクラスタならでは、サイトの障害(ネットワークの障害)についてご紹介します!
 

 

 

 

vSAN ストレッチクラスタ①:ストレッチクラスタとは?

vSAN ストレッチクラスタ②:ストレッチクラスタの要件 そのいち

vSAN ストレッチクラスタ③:ストレッチクラスタの要件 そのに

vSAN ストレッチクラスタ④:ストレッチクラスタ構成方法

vSAN ストレッチクラスタ⑤:ストレッチクラスタの仮想マシンのストレージポリシー

vSAN ストレッチクラスタ⑥:ストレッチクラスタの仮想マシンのストレージポリシー New!!!

vSAN ストレッチクラスタ⑦:ストレッチクラスタのアフィニティ設定