"HCI" はじめました。

vSAN担当小佐野舞です。VMwareのHCIを広めるため日々活動していきます。

モノは壊れるシリーズ①- HCIの障害って?

障害。

ひとことで言ってもその障害の種類にはさまざまあります。

障害が発生すれば仮想基盤は何らかの影響があり、何が起こるかこれもさまざまです。

まず大きく分けると、ハードウェア障害とソフトウェア障害。

ハードウェア

字の通り物理的なサーバやストレージの障害です。

モノが壊れた、という障害。

ソフトウェアは

ハイパーバイザ、仮想マシンのOS、ミドルウェア、その上/中で稼働するアプリケーションの障害です。 

物理に起因しない障害がソフトウェアの障害ですかね。

 

仮想化することによって、ハードウェア障害が発生しても仮想マシンが止まらず継続稼働するもしくは自動的に再起動行うことで復旧時間を短縮することで、仮想基盤、システム全体のダウンタイムを小さくすることができます。

 

これだけ続けていて障害があったらどうなるのかまだポストしていなかったので、vSAN における物理的な障害発生時の挙動、復旧の仕組みについてNewなことも交えながら書いていければと思います。

 

運用管理、障害シリーズ開始します!

全部で5回か6回くらいになるかなぁと考えていますが、増えるかもしれません。

 

仮想基盤の種類をまず2つに分けます。

サーバ+外部ストレージとHCIです。

f:id:vmwarekkHCI:20171211175111p:plain

そして物理的なコンポーネントをリストアップしてみたのですが、機器数が増えれば当然コンポーネント数も増えます。

この図の中にはありませんが、FCスイッチももちろん含まれてきます。

 

 

このようなHWコンポーネントがあげられる中でどのような挙動になるのか、そして復旧の内部的な仕組みについて次回から詳しく書いていきたいと思います! 

パートナーさんたちが大集合!

昨日、VxRAIL チャンピオンクラブの忘年会、ではなくMeetUp をちょっとのぞきに行って来ました!

http://www.networld.co.jp/files/1115/0770/1424/VxRail.jpg

VxRAIL のパートナーさんたちが集結、ネットワールドさんとデルさんによるセッションでアップデートや振り返り。

年明けには最新モデル!の検証機が準備されるとか。

Ready NodeとVxRAILの売りわけのポイントとか。

ベンダーもパートナーさんも売るという行為は同じなのですが、手法や観点は全く違っているのでとても勉強になりました。

 

VxRAIL チャンピオンクラブとは?という方はこちら。

VxRailチャンピオンクラブ | ネットワールド

 

楽しそうな様子が日々わかるのはこちら。イイネ👍募集中らしいです。

www.facebook.com

 

遊びに来てーと言われて向かったのですが、懇親会でふられたので少しだけ!お話しました。

やっぱり気になるこれからのことをふんわりと。

こういうオフ会的なものがあるとこぼれ話が聞けたりするのが良い!というお声をいただいたのでまた遊びに行こうと思います。

パートナーさんでご興味ある方はぜひご参加をー!

参加要件はURLをご確認ください。

ストライプ - ポリシーベース管理⑨

一段と寒くなった本日のテーマはオブジェクトあたりのディスクのストライプ数。 

f:id:vmwarekkHCI:20170908171003p:plain

 

ストライプというとスピンドルを増やし並列度をあげるイメージです。

vSAN 環境でもその通りです!

ただ、物理デバイスを束ねてストライプするのではなく、オブジェクト単位の考え方でオブジェクトを分割してストライプします。

 

vSAN のポリシーのひとつにデータ保護に関する許容する障害の数があります。

このポリシーで、ミラーリングまたはイレイジャーコーディングによってデータ保護されます。

f:id:vmwarekkHCI:20171206152423p:plain

さらに今回のテーマ、ストライプをすると下記のようになります。

f:id:vmwarekkHCI:20171206152417p:plain

大きなかたまりだったコンポーネントが2分割されます。

ここでは同一ホストの異なる物理デバイスに入っていますが、これは容量により同一ホストの同じ物理デバイスに格納される場合もありますし、異なるホストに配置される可能性もあります。

許容する障害の数(FTT)で定義されたデータ保護は守りつつ、適当な物理デバイスに分割されたコンポーネントが格納されます。

 

オブジェクトあたりのディスク ストライプの数
仮想マシン オブジェクトの各レプリカがストライピングされるキャパシティ デバイスの最小数。 値が 1 より大きい場合、パフォーマンスが向上することがありますが、システム リソースの使用量も増加します。
デフォルト値は 1 です。 最大値は 12 です。
デフォルトのストライピング値は変更できません。
ハイブリッド環境では、ディスク ストライプが磁気ディスクにまたがって分散されます。 オールフラッシュ構成の場合は、キャパシティ レイヤーを構成するフラッシュ デバイスにまたがってストライピングされます。 要求に対応できる十分なキャパシティ デバイスが vSAN 環境に配置されていることを確認してください。

vSAN ポリシーについて

 

オブジェクトあたりのストライプ数を増やすメリットとは?

ストライプが増えた!並列度が上がった!→性能が大きく向上!と考えられますが、vSAN 環境の場合、そこまで体感することはありません。

なぜならIO処理が通常の外部ストレージと異なるからです。

書き込みは必ずキャッシュデバイスに対して行われます。

読み取りはハイブリッド構成の場合はキャッシュデバイスから、オールフラッシュの場合はキャパシティデバイスから直接行われます。

どんなときにこの並列が活かされるかというと

このような場合にはストライプを設定していない仮想マシンより性能が向上する場合があります。

 

ということでポリシーシリーズ9回目は以上でしたー!

主役は仮想マシン!- ポリシーベース管理①

仮想マシンのデプロイとともに、ストレージをプロビジョニング! - ポリシーベース管理②

どうやって可用性を担保するのか - ポリシーベース管理③

オブジェクトとは - ポリシーベース管理④

コンポーネントの配置 - ポリシーベース管理⑤

強制プロビジョニング - ポリシーベース管理⑥

許容される障害数が2つに - ポリシーベース管理⑦

ソフトウェアチェックサム - ポリシーベース管理⑧

2ノードクラスタ、大人気!

Google検索でvSAN 関連のキーワードからこのブログに辿りついている方が多かったここ数ヶ月。

ここ最近、検索からアクセスが多いページの順位が入れ替わりました。

f:id:vmwarekkHCI:20171204173125p:plain

 

2ノードクラスタ、やはり日本語のドキュメントや情報が少ないということですよね。。

ブログのトップページよりも回数多く見ていただいています。

ただ記事としてまとまっていなかったので、ここと目次に載せ直しました。

3本立てシリーズはこちらになります。

2ノードクラスタ その1

2ノードクラスタ その2

2ノードクラスタ その3

 

vSAN クラスタを構成する最小ホスト台数は?

2ノードからです。

ただし、物理ホストとしてvSAN として動くのは2ノード、仮想アプライアンスを稼働させるためのホストがクラスタの外に1ノード必要です。

この構成を2ノードvSAN と呼んでいます。

構成手順は上記または下記デルさんのリンクから!

 

最近デルさんのテックセンターブログでも連載されています!

vSANの新たなカタチ “ 2ノードvSAN ” ~ 概要 ~ - テックセンター - Blog - テックセンター - Dell コミュニティ

全8回と盛りだくさんですね。

トラブルシューティングまであるようなので、連載終了まで目が離せないですねー!

vSAN 、2017上半期のWW市場を埋め尽くす?

12月に入りました。

2017年も残すところ、あと31日です。営業日で計算すると、あと20日です。

総括はまた年末の押し迫った時期にするので今日は嬉しいニュースから。

 

米国のプレスリリースにVMware の第三四半期の結果が発表されました。

その中で。IDCさんからの評価として、2017年前半で一番がVMware vSAN でした!

ワールドワイドということはアメリカはもちろん日本や各国に広まった今年だからこそ、獲得できたと言えると思います。

VMware, Inc. - VMware Reports Fiscal 2018 Third Quarter Results

• According to IDC's 2Q2017 Worldwide Quarterly Converged Systems Tracker, VMware, based on sales of hyperconverged solutions running VMware vSAN™, was the largest hyperconverged infrastructure software vendor during the first half of calendar year 2017.(1)

 

より詳細な情報があったので、追記

blogs.vmware.com

 

国内市場も12月ごろにレポートサマリが毎年上がっているので、昨年と比較をやってみたいです。

 

ハードウェアベンダと組み合わせて+vSAN というように、ハードウェアベンダが中心となっており、以前からこのような調査会社の項目にハイパーコンバジドインフラプレイヤーとしてVMware は4象限の中にリストされていませんでした。

今年はどうなんでしょうね!そろそろ単独で入れてもらえますかね!

数えにくいのは確かにそうなのですが、VMware vSAN が10,000社を超えるお客様にお使いいただいているのが数字でもわかると良いなぁと期待しています。

 

 

独り言

著作権、肖像権、引用元

かなり厳しくなって来ていると思うのですが、USのvSAN チームは相変わらず新しいTシャツ作ったり、ステッカー作ったりしています。

これは個人の楽しむ範囲ということなのでしょうか。

今年はロケットのようです。

 

 

では、今年もあと少し駆け抜けまーす!!!

ソフトウェアチェックサム - ポリシーベース管理⑧

vSAN の場合、データストアに格納される単位はブロックではなくオブジェクト単位です。

ポリシーに従いデータ保護が行われ、ミラーリングやイレイジャーコーディングによりオブジェクトが分割されたり複製されたりします。 

 このオブジェクトが正しいものなのか?

 整合性がきちんと取れているか?

ということをしっかりとチェックする、オブジェクト チェックサム機能が実装されています!

 

ポリシーのひとつにオブジェクト チェックサムの無効化という項目があり、何も設定しないとチェックサムは有効化された状態がデフォルトとなります。

f:id:vmwarekkHCI:20171130113908p:plain

 

 

オブジェクト チェックサムの無効化

このオプションを いいえ に設定すると、オブジェクトはチェックサム情報を計算してそのデータの整合性を保ちます。 このオプションを はい に設定すると、オブジェクトはチェックサム情報を計算しません。

vSAN はエンドツーエンド チェックサムを使用して、ファイルの各コピーがソース ファイルとまったく同じであることを確認してデータの整合性を保ちます。システムは読み取り/書き込み操作中にデータの妥当性を確認し、エラーが検出されると、vSAN はデータを修復するかエラーを報告します。

チェックサムの不一致が検出された場合、vSAN は正しくないデータを正しいデータで上書きすることによって自動的にデータを修復します。チェックサム計算とエラー修正はバックグラウンド操作として実行されます。

クラスタ内のすべてのオブジェクトのデフォルト設定は いいえ で、チェックサムは有効です。

 

ストレージはデータを格納するためのものであり、データは正しいものが保管されているのか特に気にされる項目でもあります。

ハードウェアとしてディスクのブロックのチェックサムもありますが、データを取り出せなかったら意味がないので、vSAN ではオブジェクトのレイヤでチェックサムをつけ確認を行うようになっています。

もちろん整合性をIOごとにチェックするため、チェックサムが無効になっている場合と比較すると、オーバーヘッドはある程度あります。

チェックサムを無効にした場合のIOPS参考値としては1.2-1.4倍程度となります。

 

何か不整合が発生した時も自動修復されるので、これでストレージデータとしての整合性も安心!

冬のVMware HCI もっと知ってみよう祭り

今週は12月が始まるってご存知でしたか?

感覚的にはまだ秋に入ったばかりです。1年あっという間に過ぎていくのが恐ろしい...

 

告知するのが遅くなってしまったのですが。

エンドユーザ様向けとパートナー様向け、それぞれのセミナーのご案内です!

f:id:vmwarekkHCI:20170823203518p:plain

 

 

エンドユーザ様向けのセミナー

www.event-vmware.net

東京
2017.11.30(木)14:30~17:00
2017.12.6  (水)14:30~17:00
2017.12.15(金)14:30~17:00

愛知
2017.12.13(水)14:30~17:00

大阪
2017.12.12(火)14:30~17:00

 

 

www.event-vmware.net

石川 2017.12.1(金)13:30~17:15

愛知 2017.12.5(火)13:30~17:15

広島 2017.12.8(金)13:30~17:15

 

 

パートナー様向けセミナー 

www.event-vmware.net

石川 2017.12.1(金)9:30~12:05

愛知 2017.12.5(火)9:30~12:05

広島 2017.12.8(金)9:30~12:05

 

開催が東京以外のものもあるので、ぜひご都合の良い場所、日程でご参加くださーい!

 

vSphere HA とvSAN、ハートビート

2022年度版で書き直しています!

中身は変わっていませんが、もう少し詳しく書いてみました。

vSphere HA とvSAN、ハートビート、3Tier構成と何が違うの?

vSphere HA とvSAN、ハートビート、2 ノード/ストレッチクラスタの場合は?

 

 

 

 

 

vSAN にすると変わること、のひとつになります。

マニュアルを一度読んでいただいた方に、かなりの確率で聞かれます。 

 

 vSphere HA と合わせて使う時の設定、ベストプラクティスってなに? 

 

HA に関連する設定手順のマニュアルはこちら

vSAN Operations Guide HA Settings

 

ベストプラクティスをわかりやすく説明している元ネタはDuncan Eppingのブログ記事はこちら

vSphere HA heartbeat datastores, the isolation address and vSAN - Yellow Bricks

f:id:vmwarekkHCI:20171122142921p:plain

前提としてHA が発動し仮想マシンが再起動されるために、常に監視されているネットワークがハートビートネットワークとなります。

vSAN を有効化した場合、vSAN ネットワークがハートビートネットワークとなります。

f:id:vmwarekkHCI:20171122142925p:plain

マスターと呼ばれるホストからクラスタメンバであるホストがどのような状態であるのか、隔離状態であるかを判断するために、共有ストレージをハートビートデータストアとして選択されることが一般的となっていました。

ただし、外部ストレージと異なりvSAN はハートビートデータストアとして指定することはできません。

 

では、きちんとマスターのホストが他ホストの隔離状態であると判断できて、仮想マシンの電源操作を行うためにはどうするのか!

 

隔離アドレスを設定することにより解決します。

 

どのようなときに隔離状態とホスト自身が宣言するのか?

  1. マスターのホストとコミュニケーションが取れない場合
  2. 隔離アドレスへPingが通らない場合

隔離アドレスとは

ホストが隔離状態かどうかを判断するための、全てのホストが通信可能なアドレスのことを示します。

このアドレスは管理ネットワークのデフォルトゲートウェイが指定されています。

これはハートビートネットワークが管理ネットワークとなっているためです。

もし隔離状態になった際にはこのアドレスにPingで疎通確認を行い、隔離状態!と宣言することになります。

 

vSAN 環境における隔離アドレスの設定

vSAN 環境ではvSAN ネットワークがハートビートネットワークです。

vSAN ネットワークのデフォルトゲートウェイを手動で設定する必要があります。 

 

vSAN ネットワークがストレージ用として独立しており、裏側で使用するだけのためルーティングがされていないということもあると思います。

その場合は物理スイッチに仮想インターフェースとしてvSAN セグメントのIPアドレスを割り当て、そのアドレスを隔離アドレスとしてvSphere 側で設定をおこなってください。

 

 

 

ちょっとTechっぽい!

いちまんの波と最新事例予告

いま、札幌に向かっています。 

この時期に空港上空で30分ほど旋回を続け、羽田に折り返した経験があります。

そのための前入りというわけではないのですが、大阪vFORUM今年はお留守番でした。

 

 

お客様数が10,000社達成とこの夏のVMWorldで発表されました。

1年前の5,500社からみなさまに広く導入いただき、国内での採用もますます進んでいます!

 

youtu.be

 

記念すべき動画がありました。

日本のお客様もコメントで参加されています!

大企業から中小企業までどんな業種の方もお使いいただいています。

 

国内のお客様で、アジア、事例としてはもしかすると世界初となるストレッチクラスタの公開事例を紙や資料ベースでお届けできる準備ができました!

まだWebページにはなっていないので、事例が欲しい!という方はVMware社員までおしらせください。 

vFORUM 2017 OSAKA 前夜

急に寒くなって、体が追いついていかないです。

月曜のマグロで白米1合くらい食べたので、午後はあったか。

 

明日はvFORUM 2017 OSAKA です!

vforum.jp

f:id:vmwarekkHCI:20171120161513p:plain

登録がまだの方はお急ぎください!

HCI 関連セッションはこちらから。

 

お客様事例講演

13:00 - 13:30

【お客様事例講演】ゲームサーバ&認証課金システムを刷新!! カプコンのSDDC化への第一章はvSAN導入から! | vFORUM 2017 OSAKA

登録は満席となっていますが当日席に空きがあれば入ることができますので、直前まで諦めないでください!

 

VMware セッション

12:05 - 12:35

vSANから自動化まで! vRealize Operations Manager 6.6 で変わる運用最適化とは? | vFORUM 2017 OSAKA

15:20 - 15:50

HCI powered by vSANが提供する7つの価値 | vFORUM 2017 OSAKA

17:20〜18:05

これで安心、設計から運用まで。 vSAN の全てを完全解説!! | vFORUM 2017 OSAKA

 

パートナー様セッション

13:00 - 13:45

日立が贈るHCIソリューションでVMware vSANを使い倒す | vFORUM 2017 OSAKA

15:20〜16:05

柔軟性、高効率性、安全性がポイント!DX時代に向けたHCI導入のポイント | vFORUM 2017 OSAKA

15:20〜16:05

ハードウエア好き大集合! HPE最新プロダクトで実現する次世代 SDDC | vFORUM 2017 OSAKA

16:20〜17:05

運用工数70%削減!HCIで実現できるスモールスタートハイブリッドクラウドとは? | vFORUM 2017 OSAKA

17:20〜18:05

HCI適用について本気で考える | vFORUM 2017 OSAKA

 

vSAN KB 通信 10月 リリース情報

いくつか新しいパッチがリリースされていましたので、そのご紹介です。

 

vSphere 6.0をお使いの方(vSAN 6.2)

Express Patch 11が出ております。

vSphere/vSAN 6.0 EP11 - VMware ESXi 6.0, Patch Release ESXi600-201710301

KB 2151042

 

vSphere 6.5をお使いの方 (vSAN 6.6.x)

Express Patch 4が出ております!

vSphere/vSAN 6.5 EP4 - VMware ESXi 6.5, Patch Release ESXi650-201710401

KB 2151042

 

 

vSAN のバージョンで同じ6.x台のものでも6.5なのか6.2なのか、機能がかなり異なりますので、ESXiのバージョンとの相互関係はご確認を!

Build numbers and versions of VMware vSAN (2150753)

 

 

10月のトップアクセスKB一覧です! 

Top VSAN articles for October 2017

Top VSAN articles for October 2017 - Support Insider - VMware Blogs

  1. Diskgroups fail to mount due to heap exhaustion
  2. Adding additional hosts to an existing vSAN cluster
  3. Component metadata health check fails with invalid state error
  4. vCenter Server task list shows several erroneous messages stating: Update vSAN configuration
  5. VMware vSAN witness appliance may be using evaluation license key instead of embedded key
  6. vSAN Build Recommendation Engine Health fails
  7. Adding existing vSAN hosts to a new vSAN cluster after rebuilding vCenter Server
  8. Local Disks goes into Permanent Device Loss (PDL) state with inbox drivers for mpt2sas
  9. Redirecting system logs to a vSAN object causes an ESXi host lock up
  10. Virtual Machine with more than 64GB memory fails to Storage vMotion to vSAN cluster
  11. VMware vSAN datastore not listed as a matching datastore when creating a storage based policy
  12. vSAN 6.2 hybrid disk group performance degradation
  13. vSAN health test fails on Performance Service
  14. vSAN PCIE/NVMe SSDs Receive Warning for HCL Health Check

vSAN 5.5のみのものや、6.2固有のものもあります。

 

vSAN のiSCSI とは② すぐ試せる

vSAN って iSCSI 共有できるんだよね?とまた聞かれましたので。

物理サーバにvSAN データストアから切り出したiSCSI ターゲットを提供する機能です。

 

vSAN の iSCSI ターゲットサービスはこちらからどういうものかご確認ください!

vmwarekkhci.hatenablog.jp

 

手順自体はvSAN のハンズオンラボにもあるので実際にお試し可能です!

HOL-1808-01-HCI - vSAN v6.6 - Getting Started

vSAN 6.6 環境が用意されていますので、モジュール4のiSCSI ターゲットの有効化、構成、監視がすべてわかります!

f:id:vmwarekkHCI:20171114163854p:plain

 

 

ユーザガイドはこちら

iSCSI Target Usage Guide

 

既存環境からVMware HCIへ移行 ④

Migrating to vSAN

 

物理環境からの移行

ローカルディスクかもしれませんし、共有ストレージかもしれません。

物理から仮想へ=vSAN 環境へ!

 

vMotion は仮想化されたサーバがファイルとなっているため、格納するデータストアや稼働するホストを自由に選ぶことができます。

仮想化されていない場合は、まずこのサーバを仮想化してファイルにしてしまうことから始まります。 

f:id:vmwarekkHCI:20171108162322p:plain

VMware Converter を使用して物理サーバを仮想化します。

変換先のデータストアをvSAN データストア、vmdkはシンプロビジョニングを選択。

これで完了です。

他にもVMware 以外が提供している有償無償のP2Vツールはありますので、使いやすいものを選んでまず仮想化を!

既存環境からVMware HCIへ移行 ③

Migrating to vSAN

RDMからの移行

RDM(Raw Device Mapping)として仮想マシンが握っている物理領域からvSAN データストアへ

 

 

RDM仮想マシンの仮想ハードディスクではなく、直接的に外部ストレージのLUNをストレージ領域となります。

もう少し丁寧な説明をKBから抜粋します。

RDM は、マッピング済みのデバイスメタデータを管理する VMFS ボリュームに含まれる特別なマッピング ファイルです。 マッピング ファイルは、通常のファイル システムの操作に使用できる、通常のディスク ファイルとして管理ソフトウェアに提供されます。 仮想マシンには、ストレージ仮想化レイヤにより、マッピング済みのデバイスが仮想 SCSIバイスとして提供されます。

 

今回のRDM の移行では、ディスク監視として使用されているRDMWindows の場合ファイル共有監視に変更してしまいましょう!という手順の紹介がされています。

f:id:vmwarekkHCI:20171108161009p:plain

従来型のクラスタでの監視コンポーネント/クォーラムとしてRDMでマウントされたLUNをディスク監視として指定することが多くありました。

直接SCSIバイスを握るクォーラム方式ではなく、Windowsクラスタの機能であるファイル共有監視により通常のVMFSやvSAN データストアにあるWindows 仮想マシンをそのファイルを配置先に指定することが可能です。

 

データベースでの RDM領域を直接マウントからの移行するための手順ではないので、ご注意ください。

 

vFORUM 2017 オンライン編

vFORUM 2017 から1週間経ちました。

通常モードに戻りつつ、期末、年度末に向けて準備を色々しております。

 

vFORUM ONLINEというサイトはご存知でしょうか。

f:id:vmwarekkHCI:20171107142619p:plain

2017年の登録をされている方。

ログインした状態で、下記リンクをクリックすると各セッションの資料がダウンロードできます!

HCI 関連でダウンロード可能なもののリンクまとめとなります。

特にお客様事例がDLできるのは珍しいので、ぜひ。

ここだけの話、大阪講演でさらにパワーアップするらしいです。DL資料も変わるかも...?

 

Day 1

バッチリ分かるHCI ! 入門編 | vFORUM ONLINE

HCI Powered by VMware vSAN、やっぱり気になる運用管理 | vFORUM ONLINE

日立が贈るHCIソリューションでVMware vSANを使い倒す | vFORUM ONLINE

ザ・ノンフィクション『ユーザ事例から見るvSANのリアル』 | vFORUM ONLINE

SDDC と HCI を支える高信頼性と高性能の新基準vSAN ReadyNode のご案内 | vFORUM ONLINE

HCI適用について本気で考える | vFORUM ONLINE

コンテナオブジェクトで自動化!ハイパーコンバージドインフラの効率的なバックアップとは | vFORUM ONLINE

HCI powered by vSANが提供する7つの価値 | vFORUM ONLINE

 

Day 2

これで安心、設計から運用まで。 vSAN の全てを完全解説!! | vFORUM ONLINE

柔軟性、高効率性、安全性がポイント!DX時代に向けたHCI導入のポイント | vFORUM ONLINE

【お客様事例講演】ゲームサーバ&認証課金システムを刷新!! カプコンのSDDC化への第一章はvSAN導入から! | vFORUM ONLINE

業務継続を最大化するVDI feat. HCI powered by vSAN | vFORUM ONLINE

vSANから自動化まで! vRealize Operations Manager 6.6 で変わる運用最適化とは? | vFORUM ONLINE