Quantcast
Channel: VMware Communities : Blog List - All Communities
Viewing all articles
Browse latest Browse all 3135

【VxRail】NodeがDiscoverできないときに確認すべきこと(初期構築&Node追加・交換時)

$
0
0

**** 留意事項 *****

こちらのブログの内容はDECN(Dell EMC Community Network)に投稿されたブログの再掲です。

DECNが近い将来に廃止となるためこちらに移行させていただいております。

内容についてはオリジナルの執筆当時のものとなりますので最新ではない場合がありますがご容赦ください。

 

 

※本記事は以下のDell EMCのインサイドコミュニティ投稿をもとに作成しています。(外部アクセス不可)

https://inside.dell.com/docs/DOC-362113

https://inside.dell.com/docs/DOC-362080

 

 

対象のNodeのコンソールを起動する

  1. KVMもしくはiDRAC経由で仮想コンソールを起動する
    • KVMを使う場合。
      • 通常のサーバと同じくKVMを接続する
      • G560についてはMini Display portケーブルが必要なので注意
    • iDRAC(ネットワーク接続)の場合
      • 事前にiDRACのIPを確認・もしくは設定しておく(デフォルトは192.168.0.120 もしくはDHCP
  2. 仮想コンソールが起動出来たらESXiが起動完了していることを確認する。
    • Dell Modelの場合はRASRが正常に完了していることを確認する

 

VxRail Manager から Ping が通るかを確認(IPv6)

  1. 対象Nodeで以下のコマンドを実行し、vmk0のIPv6アドレスを取得する
    • esxcfg-vmknic -l
  2. VxRail Managerから以下のコマンドを発行し、VxRail Managerから対象NodeへのIPv6疎通を確認する
    • ping6 -I eth0 <対象Nodeのipv6 IP>
    • 例: ping6 -I eth0 fe80::xxxx:dddd:ffff:xxxx
  3. Ping疎通できない場合はネットワーク設定(VLAN等)を確認する。疎通できた場合は次に進む

 

VxRail ManagerからSSHできるかを確認(IPv6)

  1. VxRail Manager から以下のコマンドを発行して対象NodeにデフォルトパスワードでSSHログインできるかを確認
    • sshpass -p 'Passw0rd!' ssh -6 -o 'UserKnownHostsFile=/dev/null' -o 'StrictHostKeyChecking=no' -l root <ipv6>%eth0
    • 例: sshpass -p 'Passw0rd!' ssh -6 -o 'UserKnownHostsFile=/dev/null' -o 'StrictHostKeyChecking=no' -l root fe80::xxxx:dddd:ffff:xxxx%eth0
  2. ログインできた場合は次に進む。できなかった場合はNodeをReimage(RASR)する。

 

Loudmouthサービスが問題なく稼働していることを確認する

  1. 対象Nodeにて以下のコマンドでloudmouth サービスをリスタートする
    • /etc/init.d/loudmouth restart
  2. VxRail Managerにて以下のコマンドでLoudmouthサービスをリスタートする
    • systemctl restart vmware-loudmouth
  3. VxRail Managerで以下のコマンドを発行し、対象のNodeがDiscoverされていることを確認する
    • /usr/lib/vmware-loudmouth/bin/loudmouthc query | tail -n 1 | cut -c 10- | python -mjson.tool
  4. Discoverされていない場合はMulticast疎通確認に進む。Discoverされていた場合は時刻確認に進む

 

Multicast疎通確認

  1. VxRail Manager にて以下のコマンドでeth0のIPv6アドレスのLink Localアドレスを確認する (fe80から始まるアドレス)
    • ip address
  2. 対象NodeにSSHでログインする(IPv6)
  3. 対象Nodeで以下のコマンドでMulticast Address宛にPingする
    • ping -6 -I vmk0 ff02::fb
  4. Ping応答の中にVxRail ManagerのIPv6が含まれていることを確認する
  5. 確認できない場合はスイッチののマルチキャスト設定を確認する

 

Node時刻の確認

  1. VxRail Managerの時刻を確認する(dateコマンド)
  2. 対象Nodeの時刻を確認する(date コマンド)
  3. 時刻にずれがあった場合はKB#521094のスクリプトを実行し、時刻ずれが修正されることを確認する
  4. スクリプトが動作しない、もしくは効果がない場合は次に進む

 

VxRail Manager DBの確認

  1. VxRail Managerにて以下のコマンドを発行する
    • psql -U postgres marvin -c "select applianceid,nodeposition,ip,model,morefid,number,primarynode,configurationstate from vxrailhost;"
  2. 対象Nodeの行があることを確認する。無い場合は対象NodeとVxRail ManagerをRebootする
  3. 対象Nodeの行のconfigurationstate の列が0であることを確認する。0 でない場合はWebExの準備をしてEscalationする

 

ハードウェア構成の確認(初期構築時のみ)

  1. VxRail Manager DBに記載があるにもかかわらず初期構築のウィザードでNodeがDiscoverされない場合は、下記のKBに従いハードウェア構成をチェックする
    • https://support.emc.com/kb/501464
    • CPUのミスマッチがある場合はiDRACから全NodeのモデルとCPU情報を確認する。(Core数。ベンダ。周波数など)
    • メモリのミスマッチがある場合は、iDRACよりメモリ障害や認識不良が発生していないかチェックする
    • メモリのサイズが3バイトのみ違う場合は下記KBに基づきTPMの設定を確認する
    • Diskのミスマッチの場合はiDRACからDisk数、Slot位置、サイズ、SSD or HDDを確認する
    • NICのミスマッチの場合は、すべてのNodeが同じNIC数、同じ速度で認識していることを確認する
      • esxcfg-nics -l

 

VxRail Managerの再起動

  1. 最後にVxRail Managerを再起動する
  2. 再起動後にNodeがDiscoverされていることを確認する
    • Node 追加・交換時はAdd Nodeができる状態になっていることを確認する
  3. 状況が解決しない場合はEscalationをする

 

その他・ログ・Tips

  • Node交換のタイミング
    • Quantaの場合
      • Disk/PSU/Fan以外のパーツ(CPU/メモリ/BMCなど)が壊れた場合はすべてNode交換となる
    • Dell モデルの場合
      • 細かい粒度で交換可能なためNode全体交換は存在しない(営業手配の特別ケースを除く)
      • ただし、NodeのReimageが発生した場合はNode交換と同じ影響・手順になる
        • OS破損、NDC交換(4.5.150以前)、Bootデバイス交換(SATADOM/BOSS/M2.SSD)の場合はReimageが発生する
    • VxRail 4.7.100以降はNode交換用の手順・スクリプトは存在せず、Node RemoveとNode Addの複合手順となる
  • 初期構築およびNode追加・交換時のVxRail Managerのログの場所
    • /var/log/vmware/marvin /tomcat/logs/marvin.log
  • 各NodeのPSNTは適切でなくてはならない。
  • Quanta Nodeの場合BMCの設定はデフォルトでなくてはならない(IP設定とパスワードを除く)
  • Dell Modelの場合、iDRAC設定とBIOS設定は工場出荷のデフォルトでなくてはならない(IP設定とパスワード)
    • Dell EMC KB#498837  & Dell EMC KB#492642
  • 初期構築時のNodeはすべて全く同じ構成(メモリ・CPU・Disk・Network・Model)でなくてはならい
    • TPMの設定も共通でなくてはならない
    • Add Node時はAF/HYとNIC数・速度以外には制限はない
  • どうしてもうまくいかない場合はVxRail Managerが起動するPrimary Nodeを変更して改善があるかどうかを確認する
  • G560の場合はPSNTが文字化けする不具合が発生することがある。
  • 初期構築およびNode追加・交換完了後はサポートマトリクス通りのVersionとなっていることを確認する

Viewing all articles
Browse latest Browse all 3135

Trending Articles



<script src="https://jsc.adskeeper.com/r/s/rssing.com.1596347.js" async> </script>