"HCI" はじめました。

vSAN担当小佐野舞です。VMwareのHCIを広めるため日々活動していきます。

vSAN と ESXi と VxRAIL

本日3日目、狭い部屋にぎゅうぎゅうに詰め込まれて。

ありがとうを言いたかった人にも直接会えた良い1日でした!

 

今日は今までで一番短いです。

バージョン

 

vSANのバージョン=vSphere(ESXi)のバージョンです。

アプライアンス型でもカスタマイズできる、もしくは最新バージョンのインストールを行いますと明記されて入れば、vSphereだけ見れば良いのですが... 

アプライアンス自体にバージョンがあると中身が何か気になります。

 

VxRAILにプリインストールされているvSAN がどのバージョンなのか、という対応表がまとまっていました! 

Correlating VxRAIL Release with VMware build numbers (52075)

 

アップグレードを実際に行なった記事もこちらに。

EMC Community Network - DECN: 仮想化関連で調べて試したことの備忘録: VxRail 4.0.x から VxRail 4.5 へのメジャーアップグレード

 

vSAN 単体とESXi のビルドの対応表はこちら。

Build numbers and versions of VMware vSAN (2150753)

 

 

では、良い1日をお過ごしくださいー!

モノは壊れるシリーズ④- vSAN 6.6.1までの再同期エンハンスメント

今週はお出かけしているため、更新がスローペースになりそうです。

現在、火曜日の11時です。本社に来ています! 

 

 

エンハンスメントとして下記のアップデートが紹介されています。 

リバランスおよび修復の機能強化。

ディスクのリバランス操作がさらに効率化されました。手動によるリバランス操作によってより詳細な進捗レポートが提供されます。
リバランス プロトコルが調整され、より効率的に動作し、クラスタのバランスをさらに向上させます。手動によるリバランスによって、より多くの更新情報とより詳細な進捗レポートが提供されます。
より少ないクラスタ再同期でより効率的な修復操作を行います。vSAN は、低下または不完全コンポーネントを部分的に修復して、vSAN がオブジェクトを準拠させることができない場合でも、許容する障害を増やすことができます。 

 

参考リンク

VMware Virtual SAN 6.6 リリース ノート

vSphere 6.5 P02 – What’s new with vSAN (51891)

 

 

2つ目の効率的な修復操作をおって見ていきましょう!

 

まず前提として、ミラーリング、FTT2のポリシーが適用された仮想マシンのVMDKです。

正常な状態の場合、下のように異なる5ホストにデータ本体が3つ、ウィットネスが2つ分散されます。

f:id:vmwarekkHCI:20180131034535p:plain

 

いわゆる二重障害、2つのホストが同時にアクセスできない状態になりました。

この場合、データとしては3番目のホストにレプリカがあり、仮想マシンとしては継続稼働しています。

f:id:vmwarekkHCI:20180131032854p:plain

 

従来、特にコンポーネントの種類により優先度等がありませんでしたが、データの復旧が優先されるようになりました。 

ウィットネスはあくまでメタデータ、データに対してアクセスできるかを判断するための投票権となるので、仮想マシンのデータではありません。

できるだけデータ部分をは早く復旧するようにします。

f:id:vmwarekkHCI:20180131032928p:plain

 

ここでは5つのコンポーネント、データ3つ、ウィットネス2つのコンポーネントを配置するための正常なホストがクラスタにあり、すべてのコンポーネントが復旧され、ポリシーに準拠しすべての復旧が完了します。

f:id:vmwarekkHCI:20180131033001p:plain

 

まとめ

コンプライアンスに非準拠(許容される障害数で指定したコンポーネント数を満たせていない)場合、正常な状態にするため、できるだけ多くのコンポーネントの再同期を行います。
そのほかのコンポーネントは十分なリソースがあれば再同期が実施されます
ストレッチクラスタではこの方法での再同期は行われません。

 

ほぼ意識しない、見えない部分でのエンハンスメントですがデータの復旧がきちんと優先されるように、内部的なプロセスも最適化が行われています。

この1年を振り返って。

1年前の今日、このブログに初めて投稿したようです。

たまに出張のことを書いたりもしていますが、ほぼvSAN 一色。

こんなにも長い期間、(そこそこ)真面目に続けられるとは正直思っていませんでした!

 

f:id:vmwarekkHCI:20180125132513p:plain

 

初めの3ヶ月はひたすら壁打ち。

  • 書くのにも慣れていないから時間がかかる (自分のスキルの問題)
  • プレビュー数も多いのか少ないのかもわからない (効果測定ができていない)
  • 反応がない (広めていないので当然の結果)

そんな時もありましたが、今はネタさえ決まれば細切れにしてシリーズ物にするワザを身につけたり、あまり書き直したりもせず作っていけるようになってきたかなぁと。

みなさまにvSAN の最新情報他、お届けできるよう引き続きがんばります!

 

最近はFacebookからではなく、Google検索でトップページにアクセスいただいている方が多いです。

ぜひリピーターとなって、ひと月に一回、二回と継続的に遊びにきてくださーい!

 

双方向な活動ができていないのですが、こういう内容をぜひ書いてほしい!というようなエンドユーザ様、パートナー様、リクエストをこっそりと受付中です。

 

 

フライ(揚げ物)食べる日として定着してきているような気がしますが、プレミアムなフライデーをお過ごしください!

 

モンハンワールドは筐体がないので見送りです。

デモでわかる、資料ダウンロード開始!

雪、たくさん降りましたねー!

私は予定通りのお客様訪問から直帰したのですが、ホームからあふれる人が律儀に階段に列を作っていたり、電車だって安全確認で止まったり、いつもよりは少し時間がかかりました。

雪だるまを作れなかったので、次回雪が降るなら土日に重なってくれないかなぁと期待しています。

f:id:vmwarekkHCI:20170823203518p:plain

 

vmware-juku.jp

11−12月にかけて全国で実施したセミナーの資料がダウンロードできるようになっています!

vSAN の基礎と最新6.6の情報、そして実機のデモを詰め込んでいます。

PDFにすると動画がどうなるんだろう...

気になるのでぜひダウンロードして、教えていただけると嬉しいです。

VMware HCI - Lenovoさん編

まだご紹介していなかったVMware HCI がありました...!

発表からかなり出遅れましたが、LenovoさんのVMware HCI です。

 

f:id:vmwarekkHCI:20180119150335p:plain

 

ハードウェアベンダーさんから出されるアプライアンスの場合、ReadyNodesと何が違うの?思われることが多いかもしれません。

が、アプライアンス型にすると嬉しいことが一目でわかりますね!

f:id:vmwarekkHCI:20180119145805p:plain

管理ソフトウェアはXClarity、ハードの特有のツールとしてシステム全体管理が可能です。

サポートではハードもソフトもおまとめ窓口、迷わずまず!電話ができます!

 

独り言:他のベンダーさんのVMware HCIもこの観点でまとめたいですね...

 

 

 

 詳しくは小宮さんが熱い思いを込めて書いているこちらの記事をご覧ください!

ThinkAgile VXのご紹介 - LTN Blog 〜 Lenovo Technology Network 〜

 

 

HCI環境で vCenter + の運用管理を!

お休みが長かったので社会復帰のペースがまだ戻っておりません。。

毎日毎日電車が遅延するのもそのペースが戻らない原因の一つだと思っています。

個人的な嬉しいこととして通勤で使っている路線が、3月中旬、複々線化が完了します!

きっとその効果を体感してほしいということで、無理やり遅延を起こしているんだと言い聞かせて毎日通勤です。

 

 

VMware 環境、そしてハイブリッドクラウドの運用管理も可能なクラウドプラットフォームといえばvRealize。 

そんなvRealizeの中からOperations(可視化/分析/予測)とLog Insight(リアルタイムログ管理/解析)とvSAN の組み合わせるホワイトペーパーがリリースされました!

vRealize Operations and Log Insight in vSAN Environments

 

このブログでは全く触れていなかったので、後日ご紹介しますねー!

f:id:vmwarekkHCI:20180116192528p:plain

お客様事例:株式会社日本キャンパック様

事例のご紹介です。

すでに10月11月のvFORUMで紙やPDFでの配布は行なっていましたが、Web掲載が開始されました!

 

vSAN だけでなくさまざまなVMware製品やソリューションのお客様の事例リンクは下記にまとまっています。

PDFがダウンロードできるのはこちらです。

お客様の成功事例

 

こちらはIT価値創造塾というマイクロサイトです。

両方に掲載させていただいています。

vmware-juku.jp

 

 

 

vSAN ストレッチクラスタという点では世界初となる公開事例かもしれません。

vSAN のSite Redundancy の機能としてストレッチクラスタがあります。

異なるサイトにあるホストからひとつのクラスタを構成する一般的にはメトロクラスタと呼ばれるものです。

vMotion により仮想マシンが自由に行ったり来たりすることはもちろん、同一クラスタでの機能といえば自動的に仮想マシンが再起動するHAも、サイト間をまたいだクラスタで実現可能となります。

 

メトロクラスタを構成する場合、メトロクラスタを構成可能なストレージが必要です。

メトロクラスタ vmware

と検索すると、このようなKBが出て来ます。

EMC VPLEX を使用して VMware vSphere Metro Storage Cluster (vMSC) を実装する (2077195)

Hitachi Storage Cluster を使用した VMware vSphere への vSphere Metro Storage Cluster の実装について (2075209)

HP 3PAR Peer Persistence を使用して vSphere Metro Storage Cluster (vMSC) を実装する (2110883)

 

メトロクラスタを実現するための要件をクリアしているストレージではやはりミッドレンジ-ハイエンドのストレージと言うこともわかります。

 

正確にはメトロクラスタとvSAN ストレッチクラスタは異なりますが、異なるサイトのホストを同一クラスタとし、クラスタとしての機能を活かすということは変わりません。

vSAN を使用する場合、サイトを意識することなく共有データストア = vSAN データストアを手に入れることができますが、もちろんこのストレッチクラスタも同様です。

 

vSAN のストレッチクラスタ機能により、アクティブ-アクティブのデータセンターを実現したお客様の事例、ぜひご覧ください。

新年のご挨拶

遅くなりましたが。

あけましておめでとうございます!

今年、2018年は、もっともっとVMware HCI 年度にしていきたいので、みなさま引き続きよろしくお願いします。

 

 

USでDuncanやCormacが著者のvSAN の徹底入門的な書籍が出ていました。

初版もそうなのですが、ユーザガイドやホワイトペーパーよりもアーキテクチャがとても詳しく書かれています。

しかし、定価は50ドル、vSANだけにしてはそこそこ高いです。

a.co

 

その書籍が、少し前にDuncan Eppingからのプレゼントとして無料公開されています!!

f:id:vmwarekkHCI:20180109095457p:plain

Introduction to the book - vSAN Essentials 6.2

 

現在新しいバージョンでの本を書いているということなのでそれも楽しみにしつつ。 

 

(もちろん50$ぐらいするでしょう…

 

お客様、私たち、どちらにとっても嬉しい仕組み。

先日最新パッチ、vSphere 6.5 Patch 02 がリリースされ、vSAN のアップデートにvSAN Support Insightというものがありました。

  

CEIPというプログラムをご存知でしょうか?

「CEIPプログラムに参加しますか?」

とWeb Client ログイン時やHost Client ログイン時にポップアップが出てきたことはないでしょうか。

なかなかvCenter サーバをインターネットに接続していないことが多いとは考えていますが、このCEIPプログラムに参加すると嬉しいことをご紹介します!

 

VMware カスタマーエクスペリエンス向上プログラム

製品とサービスの改善、問題の修正、製品の導入と使用の最適な方法についてのアドバイスを行うために必要な情報を収集 

そもそもCEIPはお客様の環境情報を収集し、VMware の開発に役立てる、そしてお客様に還元するとプログラムです。

重要なシステムでどんな情報を取られるかわからない、有効になんてできない!と思ってしまいがちですが、お客様固有のシステムや個人を特定するような情報は取得していません。

安心して有効にしていただきたいです。

 

今回のリリースvSphere 6.5 Patch 02では vSAN サポートインサイトが実装されています。

vSAN Support Insight

下記のような情報を収集するので、いつかきっとそのうちバグフィックスするための情報だけではなく、もし何か障害が発生した時にすぐに役立ちます。

  • お客様の環境情報(仮想マシンではなくホストレベル)
  • vSAN としてどのような設定がされているのかという構成情報
  • vSAN 構成として健全性やパフォーマンス

サポートにリクエストをあげる場合、ホストは何台、バージョンは、vSAN のディスク構成、と必ずハードウェアを含め環境情報の把握から始まります。

このプログラムは上記の情報があるため、お客様に聞くことなく、中身のデータではなく、箱としてのvSANの情報を事前に共有しておくことができます。

ホワイトペーパーの中に取得できる情報例がありますので、ご覧ください。

 

CEIPの設定は簡単です!

クラスタ > 監視 > vSAN > 健全性

f:id:vmwarekkHCI:20171226174458p:plain

オンライン健全性 > カスタマ エクスペリエンス改善プログラム(CEIP)
ここで有効化されているか確認できます。

vSphere としての設定と同じなので、vSAN としての設定はありません。

 

続きを読む

モノは壊れるシリーズ③- ハイブリッドとオールフラッシュ

ちょっとだけ違う、よ!をもう少し詳しめに説明させていただきます。

 

 キャパシティデバイスが障害にあった際の影響範囲について、前回構成により異なることをお伝えしました。

具体的にどうなるの?というと。図にまとめています。

f:id:vmwarekkHCI:20171222151602p:plain

一般的な、ハイブリッド構成は必ずこちらになります。

オールフラッシュ構成でも重複排除圧縮を使用していない場合は同様です。

キャパシティデバイスに入っているデータだけが影響を受け、その使用された容量が他のキャパシティデバイスにコピーされます。

上の図の場合は障害が発生したデバイスに格納されていない仮想マシンのData部分は影響を受けないことがわかります。

 

f:id:vmwarekkHCI:20171222151606p:plain

こちらがオールフラッシュ構成で重複排除圧縮を有効にした影響範囲の図です。

ディスクグループ単位で重複排除が行われているため、ディスクグループ全体に対してアクセス不可となります。

ディスクグループ全体の復旧/再同期が行われるので、デバイス1本の障害より復旧まで時間がかかる場合があります。

上の図では各ホストに1つのディスクグループがあるため影響範囲はホスト障害と等しくなります。

もし2つのディスクグループがあれば、そのグループ単位で影響範囲となります。

もちろんどちらの構成も許容する障害の数(FTT)が1以上となっていますので、仮想マシンに対するアクセスは可能です。

 

 

 

 

次回予告

再同期のエンハンスメントって?vSAN 6.6以降で何が変わった?

オールフラッシュもハイブリッドも、同じツールでサイジング

サイジングツールにハイブリッド構成が追加されました!

f:id:vmwarekkHCI:20171221165832p:plain

 

VMware 公式の vSAN サイジングツールとしては3種類ほどありました。

ReadyNode Configurator:ReadyNodeを一覧で確認

vSAN Hybrid TCO and Sizing Calculator:ハイブリッド構成のサイジングツール

vSAN ReadyNode Sizer:オールフラッシュ構成のサイジングツール

という役割でした。

 

ハイブリッド構成のTCO and Sizing Calculatorはかなり初期の頃から使われており、どこに何のパラメータを入れて、どのように結果を解釈すれば良いのか、わかりにくいと評判でした。(慣れればできるけれど、初見は無理!という声が多かったです。)

ついに、最新の vSAN ReadyNode Sizer にハイブリッド構成も追加されました!

 

これで同じツールでのサイジングが可能となりましたので、どの構成を見積もる時にもこのサイザーをお使いください。

 

使い方は以前オールフラッシュ構成の時に書いたものとほぼ同じですので、リンクは下記となります。

New!!! for All-flash!!! ①

New!!! for All-flash!!! ②

New!!! for All-flash!!! ③

最新パッチ、リリースされました!

ESXi 6.5 Patch02 がリリースされました!

f:id:vmwarekkHCI:20171220122850p:plain

 

一部vSAN の修正もありますので、vSphere 6.5をお使いの方はリリースノートを確認の上、アップデートの検討をお願いします。

VMware ESXi 6.5, Patch Release ESXi650-201712001 (2151102)

 

パッチの主な vSAN 関連情報は下記となります。

vSphere 6.5 P02 – What’s new with vSAN (51891)

再同期のエンハンスメント

クライアントI/O(仮想マシンへのI/O)と競合していない場合、再同期の帯域を確保する。 

 

vSAN サポートインサイト

リモートサポートサービスやPhone Home のシステムが導入されました。

CEIP(Customer Experience Improvement Program)への参加が必須となります。

 

SAS 構成に置けるマルチパスのサポート

マルチパスドライバーを使用することにより、ストレージデバイスへのマルチパスをサポート。(例 HPE コンポーサブルシステム)

 

 

 

より詳細なアップデート情報はこちらから!

VMware ESXi 6.5, Patch Release ESXi650-201712401-BG: Updates esx-base, esx-tboot, vsan, and vsanhealth VIBs (2151104)

 

 

 

うちの子も今日アップデートしてみます。

 

物理サーバを停止するとき②

本日は以前ご紹介した物理サーバを安全に停止するときのメンテナンスモードの続きを投稿していきます。

  1. メンテナンスモードの3種類の呼び方がが変わりました
  2. メンテナンスモードが実行できないとき、どうする?

 

 

まずひとつめ。

変わった、というよりはわかりやすくなったといった方が良いかもしれません。

メンテナンスモードのvSAN データ移行オプションとして3種類あります。

f:id:vmwarekkHCI:20171218152357p:plain

 

  • すべてのデータを他のホストに退避する(全データの移行)
  • 他のホストからデータにアクセスできることを確認する(=アクセシビリティの確保)
  • データを退避しない

メンテナンスモードする対象のホストが何をするのか、vSAN として内部に保管しているデータをどうするのか、を選択します。

 

 

そして各オプションの下にこのオプションを選択したことによってどのような影響があるか注釈が出るようになっています。

操作を実行するために必要な容量を使用できるかどうか。
移動するデータのサイズ。
準拠しなくなるオブジェクトの数。
アクセスできなくなるオブジェクトの数。

 

 

ふたつめ。メンテナンスモードに入れない!とき、どうする?です。

もちろん、その原因を探します。

3種類ほど経験したので

 

1つ目は、他ホストもメンテナンスモードに移行中だったとき。

他のホストからデータにアクセスできることを確認する(=アクセシビリティの確保)

特にクラスタに参加している台数が少ない構成の場合、うっかりで起こります。

3ホスト構成で、1ホストメンテナンスモードに移行済み、忘れていてもう1ホストしてしまうことがありました。

本番環境ではなかなかないと思いますが、同時操作には注意です。

 

2つ目は、クラスタをシャットダウンしようと全台メンテナンスモードにしたいとき。

メンテナンスモードのオプションを指定し忘れて、デフォルト(初期値)の他のホストからデータにアクセスできることを確認する(=アクセシビリティの確保)のまま進んでしまうと他のホストからアクセスできない台数になった時点でメンテナンスモードの移行に失敗します。

これ!よくお客様から聞かれます。

コマンドラインでのメンテナンスモード移行も、vSAN オプションを忘れずに!

 

3つ目は、ホストの台数がコンポーネントが配置されている台数が一致していて、全データの移行をしようとしたとき。

ミラーリングのFTT1であれば3ホスト、イレイジャーコーディングのRAID5のFTT1であれば4ホスト、ミラーリングのFTT2であれば5ホストといったように必要な最小台数が異なります。

PoCでさまざまな仮想マシンのストレージポリシーを作成した時、イレイジャーコーディングとミラーリングが混在しているとうっかり台数を忘れてしまうことがありました。

 

どんなときもメンテナンスモードがなぜ失敗したのかは慌てずタスク/イベントでご確認ください!

一般的なエラーとなっていても、失敗した原因については中に書いてあります。

f:id:vmwarekkHCI:20171218173507p:plain

国産ベンダーさんのReadyNode 大量追加!

寒くて寒くて嫌になりますねぇ。まだ12月なのに。

 

 

vSAN ReadyNode をご存知でしょうか。

VMware のハイパーコンバージド、vSAN を簡単に始めるために各ハードウェアベンダーさん組み上げ済みハードウェア構成のことを指します。

アプライアンス型とは異なり、様々なハードウェアベンダーさんの環境で選択することができます。

各HWベンダーさんのReadyNodeはこちらから。

VMware Compatibility Guide - vsan

 

もし要件がReadyNodeで合わない!という、ベースのReadyNode から変更する場合はこちらの記事を参考に。

vmwarekkhci.hatenablog.jp

 

本題です。

f:id:vmwarekkHCI:20171215170349p:plain

日立製作所さんNECさんにおいて、最新HWのReadyNodeが大量に追加されました...!

VMware Compatibility Guide - vsan - Hitachi

VMware Compatibility Guide - vsan - NEC

 

今までラインナップが少なめだったので、以前見たことがある方も!

あらためて構成をご確認ください!

 

 

 

 

おまけです。

 

vSAN 2017 Quarterly Advisory for Q3 (50348)

Q3(おそらく8月から10月)の間にリリースされたKBまとめが出ていました。

KBは3種類のカテゴリに分けられています。

  • 最新バージョンvSAN 6.6.1(vSphere 6.5 U1)で解決されている問題
  • まだ解決されていない、もしくはワークアラウンドが提示されている問題
  • 情報やベストプラクティス

アップデートすればFixされるものも出ていますので必要に応じてご確認ください。

モノは壊れるシリーズ②- HWコンポーネントごとの影響範囲

前回に引き続き障害のコンポーネントの一覧と、その影響範囲について見ていきたいと思います。

 

よくある構成でHWコンポーネントを書き出してみました。 

f:id:vmwarekkHCI:20171213151714p:plain

上から3つは今までのサーバ仮想化でもおなじみのものです。

これらが壊れたとき、は全てホストが壊れたときに、に相当します。

下から3つがvSAN を使用する場合ストレージとして物理的に機能する、必ずホストに搭載が必要なものです。

IOコントローラ

キャッシュデバイス

キャパシティデバイス

vSAN のハードウェア互換性リストに適切なドライバ、ファームウェア、物理機器の記載がありますので一度ご確認ください。

VMware Compatibility Guide - vsan

 

 

ではホスト、ストレージのコンポーネントが壊れたらどうなるのか?

影響範囲はこちらです。

f:id:vmwarekkHCI:20171213150508p:plain

仮想マシンのストレージポリシーで許容する障害の数が1以上(ミラーリンングまたはイレイジャーコーディング)で、ストレージ要件が定義されいている前提です。 

仮想マシン、ユーザの影響ともに、ストレージコンポーネントが単一障害にあっただけでは全く影響なく稼働し続けます!

上から下へと影響範囲が大きくなるのですが、もちろんホストへの電源共有やホストのネットワーク断(チーミングしていてが両パスダウン)であればHAが発動します。

 

外部ストレージのRAIDを構成するディスク1本壊れたら?という障害影響範囲、復旧方法は広く理解されていますが、ハイパーコンバージドインフラになるとまだまだです。

HCIでも、

ストレージコンポーネントの障害は稼働する仮想マシンには影響ありません!

 

ストレージの世界に閉じて、影響範囲をまとめると下記となります。

IOコントローラ

IOコントローラ配下のストレージデバイスにアクセスできなくなります。

ディスクグループまたは複数ディスクグループがあればその全て

 

キャッシュデバイス

ディスクグループにアクセスできなくなります。

ディスクグループはキャッシュデバイス1本+キャパシティデバイス複数本から構成される

 

キャパシティデバイス

対象キャパシティデバイスにアクセスできなくなります。

オールフラッシュ構成で重複排除が有効の場合、ディスクグループ全体にアクセスできなくなります。