"HCI" はじめました。

vSAN担当小佐野舞です。VMwareのHCIを広めるため日々活動していきます。

モノは壊れるシリーズ①- HCIの障害って?

障害。

ひとことで言ってもその障害の種類にはさまざまあります。

障害が発生すれば仮想基盤は何らかの影響があり、何が起こるかこれもさまざまです。

まず大きく分けると、ハードウェア障害とソフトウェア障害。

ハードウェア

字の通り物理的なサーバやストレージの障害です。

モノが壊れた、という障害。

ソフトウェアは

ハイパーバイザ、仮想マシンのOS、ミドルウェア、その上/中で稼働するアプリケーションの障害です。 

物理に起因しない障害がソフトウェアの障害ですかね。

 

仮想化することによって、ハードウェア障害が発生しても仮想マシンが止まらず継続稼働するもしくは自動的に再起動行うことで復旧時間を短縮することで、仮想基盤、システム全体のダウンタイムを小さくすることができます。

 

これだけ続けていて障害があったらどうなるのかまだポストしていなかったので、vSAN における物理的な障害発生時の挙動、復旧の仕組みについてNewなことも交えながら書いていければと思います。

 

運用管理、障害シリーズ開始します!

全部で5回か6回くらいになるかなぁと考えていますが、増えるかもしれません。

 

仮想基盤の種類をまず2つに分けます。

サーバ+外部ストレージとHCIです。

f:id:vmwarekkHCI:20171211175111p:plain

そして物理的なコンポーネントをリストアップしてみたのですが、機器数が増えれば当然コンポーネント数も増えます。

この図の中にはありませんが、FCスイッチももちろん含まれてきます。

 

 

このようなHWコンポーネントがあげられる中でどのような挙動になるのか、そして復旧の内部的な仕組みについて次回から詳しく書いていきたいと思います!