vSphere で Hadoop してみる。BDE 第4回

今回は、前回までの流れをひきついで

vSphere Big Data Extensions（BDE）で Hadoop クラスタを作成してみます。

Web ブラウザからでも、CLI でもクラスタ作成することができますが、

今回は Web ブラウザ（BDE の vSphere Web Client プラグイン）から実施します。

この Web Client は、普段 vCenter にアクセスする Web Client と同じものです。

これまでの BDE ポストはこちら。

BDE でデプロイする Hadoop ディストリビューションについて

BDE には、デフォルトでは

Apache のコミュニティ版の Hadoop 1.2 と bigtop が

ディストリビューションとして登録されています。

BDE に登録されているディストリビューションは、

BDE の vSphere Web Client プラグインの「Hadoop Distributions」から確認できます。

他にもいくつかの Hadoop ディストリビューション（CDH や MapR など）

に対応していて、追加するとこの画面に表示されるようになります。

マニュアルでは下記のあたりを参照・・・

VMware vSphere Big Data Extensions Administrator's and User's Guide

Hadoop Feature Support By Distribution

BDE での Hadoop クラスタ自動構築

それでは、Hadoop クラスタを作成してみます。

「ホーム」から「Big Data Extentions」の画面を開いて、

「Big Data Clusters」→「Getting Started」→

「Create a New Big Data Cluster」をクリックします。

Name and node group 画面で、下記を指定します。

Name
BDE で独自に使用するクラスタの名前を指定します。
Hadoop distribution
使用する Hadoop ディストリビューションを選択します。
今回はコミュニティ版 Hadoop を使用します。
Deployment type
Hadoop をどのようなクラスタ構成にするか、HBbase クラスタにするかなど。
この選択内容によって、すぐ下に表示されている Node group で
設定できるものが変化します。

Hadoop クラスタのノード構成を決めます。今回のように

Deployment type で「Basic Hadoop Cluster」を指定している場合は

ノードグループは下記の4つになります。

それぞれのグループで、仮想マシン数を指定し、

「Resource template」で割り当てるリソースを指定します。

Large、Medium...といったあらかじめ用意されたテンプレートがありますが、

今回は出来るだけ小規模にしたいので、すべて「Customize」を指定しました。

DataMaster と ComputeMaster は下記が最小リソース構成です。

「Basic Hadoop Cluster」を指定する場合は、

DataMaster、ComputeMaster どちらも 1台だけになります。

Worker と Client は下記が最小リソース構成のようです。

Worker は、せっかくなので2台にしました。（デフォルトは3台）

「Resource template」で「Customize」を選択する場合は、

下記のような指定ができます。

vCPU 数
メモリ容量
ストレージ容量
各サーバに、この容量の VMDK ファイルが自動追加されます。
Datastore type
事前に BDE で使用できるようにリソース登録したデータストアのうち、
Local、Shared どちらとして定義したものを使用するか指定します。