前回に引き続き障害のコンポーネントの一覧と、その影響範囲について見ていきたいと思います。
よくある構成でHWコンポーネントを書き出してみました。
上から3つは今までのサーバ仮想化でもおなじみのものです。
これらが壊れたとき、は全てホストが壊れたときに、に相当します。
下から3つがvSAN を使用する場合ストレージとして物理的に機能する、必ずホストに搭載が必要なものです。
IOコントローラ
キャッシュデバイス
キャパシティデバイス
vSAN のハードウェア互換性リストに適切なドライバ、ファームウェア、物理機器の記載がありますので一度ご確認ください。
VMware Compatibility Guide - vsan
ではホスト、ストレージのコンポーネントが壊れたらどうなるのか?
影響範囲はこちらです。
仮想マシンのストレージポリシーで許容する障害の数が1以上(ミラーリンングまたはイレイジャーコーディング)で、ストレージ要件が定義されいている前提です。
仮想マシン、ユーザの影響ともに、ストレージコンポーネントが単一障害にあっただけでは全く影響なく稼働し続けます!
上から下へと影響範囲が大きくなるのですが、もちろんホストへの電源共有やホストのネットワーク断(チーミングしていてが両パスダウン)であればHAが発動します。
外部ストレージのRAIDを構成するディスク1本壊れたら?という障害影響範囲、復旧方法は広く理解されていますが、ハイパーコンバージドインフラになるとまだまだです。
HCIでも、
ストレージコンポーネントの障害は稼働する仮想マシンには影響ありません!
ストレージの世界に閉じて、影響範囲をまとめると下記となります。
IOコントローラ
IOコントローラ配下のストレージデバイスにアクセスできなくなります。
ディスクグループまたは複数ディスクグループがあればその全て
キャッシュデバイス
ディスクグループにアクセスできなくなります。
ディスクグループはキャッシュデバイス1本+キャパシティデバイス複数本から構成される
キャパシティデバイス
対象キャパシティデバイスにアクセスできなくなります。
オールフラッシュ構成で重複排除が有効の場合、ディスクグループ全体にアクセスできなくなります。