"HCI" はじめました。

vSAN担当小佐野舞です。VMwareのHCIを広めるため日々活動していきます。

モノは壊れるシリーズ②- HWコンポーネントごとの影響範囲

前回に引き続き障害のコンポーネントの一覧と、その影響範囲について見ていきたいと思います。

 

よくある構成でHWコンポーネントを書き出してみました。 

f:id:vmwarekkHCI:20171213151714p:plain

上から3つは今までのサーバ仮想化でもおなじみのものです。

これらが壊れたとき、は全てホストが壊れたときに、に相当します。

下から3つがvSAN を使用する場合ストレージとして物理的に機能する、必ずホストに搭載が必要なものです。

IOコントローラ

キャッシュデバイス

キャパシティデバイス

vSAN のハードウェア互換性リストに適切なドライバ、ファームウェア、物理機器の記載がありますので一度ご確認ください。

VMware Compatibility Guide - vsan

 

 

ではホスト、ストレージのコンポーネントが壊れたらどうなるのか?

影響範囲はこちらです。

f:id:vmwarekkHCI:20171213150508p:plain

仮想マシンのストレージポリシーで許容する障害の数が1以上(ミラーリンングまたはイレイジャーコーディング)で、ストレージ要件が定義されいている前提です。 

仮想マシン、ユーザの影響ともに、ストレージコンポーネントが単一障害にあっただけでは全く影響なく稼働し続けます!

上から下へと影響範囲が大きくなるのですが、もちろんホストへの電源共有やホストのネットワーク断(チーミングしていてが両パスダウン)であればHAが発動します。

 

外部ストレージのRAIDを構成するディスク1本壊れたら?という障害影響範囲、復旧方法は広く理解されていますが、ハイパーコンバージドインフラになるとまだまだです。

HCIでも、

ストレージコンポーネントの障害は稼働する仮想マシンには影響ありません!

 

ストレージの世界に閉じて、影響範囲をまとめると下記となります。

IOコントローラ

IOコントローラ配下のストレージデバイスにアクセスできなくなります。

ディスクグループまたは複数ディスクグループがあればその全て

 

キャッシュデバイス

ディスクグループにアクセスできなくなります。

ディスクグループはキャッシュデバイス1本+キャパシティデバイス複数本から構成される

 

キャパシティデバイス

対象キャパシティデバイスにアクセスできなくなります。

オールフラッシュ構成で重複排除が有効の場合、ディスクグループ全体にアクセスできなくなります。