運用ちゃんのblog

Linux・Windowsサーバー・PCの運用管理に役立つネタをご紹介します。

カテゴリ: ハードウェア

メモリや、電源ユニット、内蔵RAIDコントローラなどサーバー内部の部品にアクセスする際に、一般的なプラスドライバーやマイナスドライバーでは使えないことがあります。

HP製のProLiantがその代表です。プラスドライバで開くだろうと思ってよく見ると六角星形の妙なネジをつかっています。プラスドライバでは開けることができません。

トルクスレンチとかトルクスドライバーを用意しておくことがお勧めですが、HPの場合は小ぶりなトルクスレンチがサーバーに備え付け?されています。ラックマウント型の DL3xx や DL1xx であれば背面に用意されています。

HP ProLiant サーバー - 六角の星形ネジを外す道具 (トルクスレンチ) はサーバー付属しています。

 

VMware ESXi は、VMware Inc サイトからインストールイメージ(ISO形式)をダウンロードしてCDを作成、ブートしてインストールします。

しかし、一部のDELLサーバーでは、インストールに失敗します。 

DELLが、カスタマイズイメージの ISO  ファイルを提供しています。

VMware ESXi 5.1 Update 1 Recovery Image
http://www.dell.com/support/drivers/jp/ja/19/driverdetails?driverid=RD5JN

これでブートさせれば大丈夫です。

 

データセンターに機器を設置するときに注意しなければいけないことの一つに、電力使用量があります。

ラック単位で契約する場合、20A とか 30A という感じで制限があります(最近のデータセンターだと 50A とかいけるかもしれません)。「A」というのは「アンペア」と呼びます。

非常に大雑把な計算では、1U のサーバーだと 1A 使っています。 1ラックの高さは 42U あるのが一般的ですが、サーバーを全部詰めたら42Aになってしまい、ブレーカーが落ちてしまいます。

あと、電力使用量には「運転中」と「始動時」で違いがあります。サーバーの仕様には「始動時」の電力使用量はあまり書いてありませんが、HDDをたくさん積んだストレージは特に始動時の電力がバカになりません。運転中の2倍は見込んでおいていいのではないかと思われます。

逆に、サーバーの仕様にある「最大消費電力」はメモリやHDDなどオプションフル装備で、負荷もかけた状態で出しているため、目安を得られるよう、サーバーのメーカーはそれぞれ電力計算用のツールを提供しています。

富士通
サーバ消費電力/質量計算ツール(Web上のツール)
http://jp.fujitsu.com/platform/server/primergy/technical/calculate/

IBM
IBM System x and BladeCenter Power Configurator (専用ツール)
http://www-06.ibm.com/systems/jp/bladecenter/powerconfig/

DELL
The Dell Energy Smart Solution Advisor and Data Center Capacity Planner (Web上のツール)
http://www.dell.com/content/topics/topic.aspx/global/products/pedge/topics/en/config_calculator?c=us&cs=04&l=en&s=bsd
 
HP
http://h22174.www2.hp.com/SimplifiedConfig/Index 

サーバーがダウンしたときに、管理用のインターフェースを使えるようにしておくと良いです。管理用インタフェースはメーカーによって呼び名が違っていますが、ブラウザで管理画面を表示させて再起動をリモートで実施できます。

何もつながっていないときは、LANケーブルをつないで

IBMサーバーの場合は、IMM という管理機能があります。DHCPサーバーからアドレスが割り当てられないとき、192.168.70.125 がデフォルトのアドレスになります。ブラウザで以下のIPアドレスにつなぎます。
http://192.168.70.125 
HPサーバーの場合は、iLO という管理機能があります。ブラウザで
http://ILOnnnnnnnnnnn

nnnnnnnnnnn はシリアル番号です。DHCPサーバーにアクセスできないときはIPアドレスが自動構成になるようです。

DELLサーバーの場合は、iDRAC という管理機能があります。固定IPアドレス 192.168.0.120 になっています。 
http://192.168.0.120

 

RAIDは複数のHDDを使い高速化・可用性の向上のために使われる技術ですが、いざ問題が発生した時に「こんなはずではなかった」ということがあります。

  • 稼働中に交換できない

RAIDだからといって稼働中に交換できるとは限りません。家庭用のNASだと交換のためにはシャットダウン必須のことがあります。タワー型サーバでもこの罠があります。稼働中に交換できるかどうかは「ホットプラグ対応」または「ホットスワップ対応」といった用語で判断してください。

ラックマウント型サーバで外見上正面から取り外し可能なHDDを使っていても、RAIDボードのファームウェアが対応していないため、停止が免れない場合もあります。

ハードウェアもファームウェアも対応していても、RAIDソフトウェアを入れていないため、HDD交換結果を確認できないので結局再起動が必要になることがあります。RAIDソフトウェアというのは、OS上で動作するアプリケーションでRAIDを構成するHDDの状態を確認できるものです。

こういったのは「非機能要件」にあたるのですが、考慮されていないことが多いのでしょう。

  • 立て続けに2台故障する

RAID1は2台単位で構成し、それぞれに同じデータを書き込みます。1台故障してももう1台で運用ができますが、その間にもう1台壊れたら本当にディスクは使用できなくなります。
RAID5 は3台以上で構成してあり、1台分の領域がパリティとなっていて、どれか1台が故障しても残ったディスクで運用ができますが、構成しているディスクの台数に関係なく、もう1台壊れたらアウトです。故障率の理論からいけば、構成しているディスクの台数が多いほど危険は高いことになります。

故障したディスクは早急に交換するしかありません。ただし、交換した直後から安心というものではありません。交換直後のディスクは「リビルド」といって、RAID1の場合はデータの複製が終わるまで、RAID5 の場合はパリティ情報からデータの再構成が終わるまでは、HDDの故障が発生したらやはりダメです。

なのでRAIDだからバックアップが必要ない、ということは決してありません。

RAID6という構成をとることで、2台まで故障しても運用できるサーバもあります。

また、故障時に備えて未使用のディスクをあらかじめサーバのシャーシに入れておくことで、ディスク故障時に即座に予備のディスクがRAIDに組み込まれてリビルドが開始される仕組み「ホットスペア」も検討しておくとよいです。

ディスクが故障したのが金曜日で、サーバーの保守が平日のみ対応、ということがあると、かなりスリリングな事態になります。ホットスペアはそういった事態にも安心をあたえてくれます。

このページのトップヘ