(58)【調査した分野】(Int.Cl.,DB名)
第1のファンと、前記第1のファンと共回りする位置に設けられた複数の第2のファンとを備えるファンユニットと、前記ファンユニットの前記複数の第2のファンの異常を判定する異常判定装置とを備える異常判定システムであって、
前記異常判定装置が、
前記複数の第2のファンのうちのいずれか1つの前記第2のファンを判定対象として選択する判定対象選択部と、
前記判定対象の第2のファンの回転数と、他の第2のファンのファン回転数の平均値との乖離と、予め定められる異常判定閾値とに基づいて、前記判定対象の第2のファンが異常であるか否かを判定する異常判定部と、
を備えることを特徴とする異常判定システム。
【背景技術】
【0002】
サーバ装置の性能の向上にともない、サーバ装置を冷却するファンの高風量化が年々進められている。
図10に示すようなモジュラーサーバ装置500の冷却に用いられるファンは、稼働中に1つのファンが故障しても必要な風量が確保できるように、前方ファン131〜134と後方ファン141〜144との送風面が同一方向で、かつ平行になるように、直列に2重に配置される。前方ファン131〜134及び後方ファン141〜144が高風量のファンである場合に、例えば、後方ファン141〜144のうち後方ファン142が故障したとする。このとき、故障した後方ファン142に対向する位置に存在する前方ファン132からの風量のため、かなり高い回転数で故障した後方ファン142が共回りする。
【0003】
一般的なサーバ装置では、予め定められる閾値回転数を定め、その閾値回転数を下回ると、ファンが故障していると判定しているが、高風量化に伴い、高い回転数で共回りしていると、このような判定手法で故障を検出するのが難しくなっている。そのため、例えば、特許文献1や特許文献2に記載の技術が、提案されている。特許文献1に記載の技術では、共回りの現象を発生させているファンの回転数を減少させて、診断対象のファンが故障しているか否かを判定している。また、特許文献2に記載の技術では、ファンモータの通電電流を検出する通電電流検出回路と、ファンの回転数の異常を検出する異常回転数検出回路とを備え、異常回転数検出回路で異常を検出できない場合、通電電流検出回路で故障を検出するようにしている。
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に記載の技術では、共回りの現象を発生させているファンの回転数を減少させる必要があり、高発熱化が進んだサーバ装置の稼働中に、ファンの故障検出のために一時的とはいえ冷却性能を低下させるのは適切でないという問題がある。
【0006】
また、特許文献2に記載の技術では、通電電流に異常が発生した場合、ファンの異常を検出することができるが、ファンの回転そのものを異常検出の対象としているわけではない。そのため、通電電流以外の原因でファンに異常が発生して共回りしている場合、正確に異常を検出することができないという問題がある。
【0007】
本発明は、上記問題を解決すべくなされたもので、その目的は、共回りが発生するようなファンの配置においても、冷却性能を低下させることなく、正確にファンの異常判定を行うことができる異常判定装置、異常判定システム、異常判定方法、及び異常判定プログラムを提供することにある。
【課題を解決するための手段】
【0008】
上記問題を解決するために、本発明の一態様は、第1のファンにより共回りする位置に設けられた複数の第2のファンの異常を判定する異常判定装置が、
前記複数の第2のファンのうちのいずれか1つの前記第2のファンを判定対象として選択する判定対象選択部と、前記判定対象の第2のファンの回転数と、他の第2のファンのファン回転数の平均値との乖離と、予め定められる異常判定閾値とに基づいて、前記判定対象の第2のファンが異常であるか否かを判定する異常判定部と、を備えることを特徴とする。
【0009】
上記問題を解決するために、本発明の一態様は、第1のファンと、前記第1のファンと共回りする位置に設けられた複数の第2のファンとを備えるファンユニットと、前記ファンユニットの前記複数の第2のファンの異常を判定する異常判定装置とを備える異常判定システムにおいて前記異常判定装置が、
前記複数の第2のファンのうちのいずれか1つの前記第2のファンを判定対象として選択する判定対象選択部と、前記判定対象の第2のファンの回転数と、他の第2のファンのファン回転数の平均値との乖離と、予め定められる異常判定閾値とに基づいて、前記判定対象の第2のファンが異常であるか否かを判定する異常判定部と、を備えることを特徴とする。
【0010】
上記問題を解決するために、本発明の一態様は、第1のファンにより共回りする位置に設けられた複数の第2のファンの異常を判定する異常判定方法において、
前記複数の第2のファンのうちのいずれか1つの前記第2のファンを判定対象として選択し、前記判定対象の第2のファンの回転数と、他の第2のファンのファン回転数の平均値との乖離と、予め定められる異常判定閾値とに基づいて、前記判定対象の第2のファンが異常であるか否かを判定することを特徴とする。
【0011】
上記問題を解決するために、本発明の一態様は、異常判定プログラムが、第1のファンにより共回りする位置に設けられた複数の第2のファンの異常を判定するコンピュータに、
前記複数の第2のファンのうちのいずれか1つの前記第2のファンを判定対象として選択する判定対象選択手順、前記判定対象の第2のファンの回転数と、他の第2のファンのファン回転数の平均値との乖離と、予め定められる異常判定閾値とに基づいて、前記判定対象の第2のファンが異常であるか否かを判定する異常判定手順、を実行させることを特徴とする。
【発明の効果】
【0012】
この発明によれば、共回りが発生するようなファンの配置においても、冷却性能を低下させることなく、正確にファンの異常判定を行うことができる。
【発明を実施するための形態】
【0014】
以下、本発明の実施形態について図面を参照して説明する。
図1は、本発明の一実施形態による異常判定システム1の構成を示すブロック図である。異常判定システム1は、ファンユニット50と、異常判定装置10を備える。ファンユニット50は、温度センサ20と、前方ファン31〜34と、後方ファン41〜44とを備えている。ファンユニット50は、例えば、
図2に示すようにモジュラーサーバ装置100に挿入され、モジュラーサーバ装置100内で送風して風の流れを作り、モジュラーサーバ装置100のスロットに挿入される複数のサーバモジュール70を冷却する。温度センサ20は、ファンユニット50内やモジュラーサーバ装置100の筐体内の温度を検出する。前方ファン31〜34と、後方ファン41〜44とは、稼働中に故障が発生しても必要な風量が確保できるように、送風面が同一方向でかつ、送風面が平行に並ぶように2重に直列に配置されている。そのため、後方ファン41〜44のいずれかに異常が発生しても、各々に対向する位置に存在する前方ファン31〜34が送風する風のために異常が発生した後方ファン41〜44において共回りが発生する。
【0015】
異常判定装置10は、第1のファンにより共回りする位置に設けられた複数の第2のファンの異常を判定する異常判定装置である。異常判定装置10は、複数の第2のファンの回転数を比較し、第2のファンの間の回転数に乖離がある場合、複数の第2のファンに異常があると判定する。
【0016】
異常判定装置10は、いずれか1つの第2のファンを判定対象として選択する判定対象選択部12を少なくとも備える。判定対象選択部12は、判定対象の第2のファンの回転数と、他の第2のファンのファン回転数が所定値以上離れている場合、当該判定対象のファンが異常であると判定する。
以下、異常判定装置10の詳細について説明する。
【0017】
異常判定装置10は、回転数検出部11、判定対象選択部12、平均値算出部13、閾値記憶部14、異常判定部15を備える。回転数検出部11は、各後方ファン41〜44に備えられているエンコーダ等の回転数を検出するセンサに接続されており、各後方ファン41〜44の回転数を検出する。判定対象選択部12は、判定対象とするいずれか1つのファンを後方ファン41〜44の中から1つ選択する。平均値算出部13は、判定対象選択部12が選択したいずれか1つの後方ファン41〜44以外の後方ファン41〜44の回転数の平均値を算出する。例えば、判定対象選択部12が、後方ファン42を選択した場合、平均値算出部13は、後方ファン41、43、44の回転数の平均値を算出する。
【0018】
閾値記憶部14は、
図3に示すデータ構成を有しており、「環境温度」と「異常判定閾値」の項目を有する。「環境温度」には、ファンユニット50内の温度の範囲を示す情報が書き込まれている。
図3の例では、ファンユニット50内の温度の範囲を示す情報として、例えば、25℃以下の場合を、「25℃環境」、25℃を超えて30℃以下の場合を、「30℃環境」、30℃を超える場合を、「35℃環境」が書き込まれている。「異常判定閾値」の項目には、各環境温度に対応する異常判定閾値となる回転数が、[rpm(revolution per minute)]の単位、すなわち1分当たりの回転数の単位で書き込まれている。
【0019】
異常判定部15は、平均値算出部13が算出した判定対象以外の後方ファン41〜44の回転数の平均値と、判定対象の後方ファン41〜44の回転数との差を異常判定値として算出する。また、異常判定部15は、温度センサ20が検出した温度に応じた異常判定閾値を閾値記憶部14から読み出し、算出した異常判定値が、読み出した異常判定閾値よりも大きいか否かを判定する。また、異常判定部15は、算出した異常判定値が、読み出した異常判定閾値よりも大きい場合、判定対象の後方ファン41〜44が異常であると判定する。
【0020】
次に、異常判定装置10による処理について、
図4に示すフローチャートを参照しつつ説明する。回転数検出部11は、各後方ファン41〜44の回転数を検出する(ステップS1)。判定対象選択部12は、後方ファン41〜44の中で判定対象とされていない、いずれか1つを判定対象として選択する。ここでは、最初に、後方ファン41を選択するとする(ステップS2)。平均値算出部13は、判定対象選択部12が選択した以外の後方ファン42〜44の回転数の平均値を算出する(ステップS3)。異常判定部15は、平均値算出部13が算出した回転数の平均値と、判定対象選択部12が選択した後方ファン41の回転数の差を異常判定値として算出する(ステップS4)。
【0021】
異常判定部15は、温度センサ20から取得した温度値に対応する異常判定閾値を閾値記憶部14から読み出す。例えば、温度センサ20が示す温度が、28℃であった場合、「環境温度」の項目が「30℃環境」である「異常判定閾値」の「6500rpm」を読み出す。異常判定部15は、算出した異常判定値が、読み出した異常判定閾値よりも大きいか否かを判定する(ステップS5)。異常判定部15は、算出した異常判定値が、読み出した異常判定閾値よりも大きいと判定した場合(ステップS5、Yes)、判定対象選択部12が選択した後方ファン41〜44が異常であるとして出力し(ステップS6)、処理を終了する。
【0022】
一方、異常判定部15は、算出した異常判定値が、読み出した異常判定閾値よりも大きくないと判定した場合(ステップS5、No)、判定対象選択部12によって全ての後方ファン41〜44が選択されたか否かを判定する(ステップS7)。異常判定部15は、判定対象選択部12によって全ての後方ファン41〜44が選択されたと判定した場合(ステップS7、Yes)、処理を終了する。一方、異常判定部15は、判定対象選択部12によって全ての後方ファン41〜44が選択されていないと判定した場合(ステップS7、Yes)、ステップS2からの処理、すなわち判定対象選択部12が、判定対象とされていない後方ファン42〜44からいずれか1つ選択して、ステップS3以降の処理が行われる。例えば、後方ファン41が最初の判定対象である場合、順に後方ファン42を次の判定対象として判定対象選択部12が選択してもよいし、ランダムに選択するようにしてもよい。
【0023】
(判定結果の説明)
図4に示す処理を行うことにより、例えば、
図5及び
図6に示すような結果が得られる。
図5に示す例は、後方ファン42に異常が発生しており、前方ファン32からの風を受けて後方ファン42が共回りしている状態で、
図4に示す処理を適用した例である。後方ファン42の回転数は、25℃環境では、2000[rpm]、30℃環境では、5000[rpm]、35℃環境では、8000[rpm]として回転数検出部11により検出されている。これに対して、他の後方ファン41,43,44は、25℃環境では、7200[rpm]、30℃環境では、12500[rpm]、35℃環境では、16800[rpm]として回転数検出部11により検出されている。
【0024】
したがって、判定対象選択部12によって、後方ファン42が判定対象として選択された場合、平均値算出部13は、後方ファン41,43,44の回転数の平均値として、25℃環境では、7200[rpm]、30℃環境では、12500[rpm]、30℃環境では、16800[rpm]を算出する。
【0025】
(25℃環境の場合)
温度センサ20が示す温度が、25℃環境の場合、異常判定部15は、平均値の7200[rpm]と、後方ファン42の回転数である2000[rpm]の差、すなわち5200[rpm]を異常判定値として算出する。異常判定部15は、閾値記憶部14から25℃環境の場合に対応する4500[rpm]を異常判定閾値として読み出す。異常判定部15は、異常判定値の5200[rpm]が、異常判定閾値の4500[rpm]よりも大きいので、後方ファン42が異常であるとして判定結果を出力する。
【0026】
これに対して、判定対象選択部12が、後方ファン41を判定対象として選択した場合、平均値算出部13は、後方ファン42,43,44の回転数の平均値、すなわち(2000+7200+7200)/3=5467[rpm]となる(小数点以下を四捨五入)。異常判定部15は、後方ファン41の回転数である7200[rpm]と、平均値の5467[rpm]の差である1733[rpm]を異常判定値として算出する。異常判定値の1733[rpm]は、異常判定閾値の4500[rpm]よりも大きくないため、異常判定部15は、後方ファン41は異常でない、すなわち正常であると判定し、ステップS7以降の処理を行う。
【0027】
(30℃環境の場合)
温度センサ20が示す温度が、30℃環境の場合、異常判定部15は、平均値の12500[rpm]と、後方ファン42の回転数である5000[rpm]の差、すなわち7500[rpm]を異常判定値として算出する。異常判定部15は、閾値記憶部14から30℃環境の場合に対応する6500[rpm]を異常判定閾値として読み出す。異常判定部15は、異常判定値の7500[rpm]が、異常判定閾値の6500[rpm]よりも大きいので、後方ファン42が異常であるとして判定結果を出力する。
【0028】
これに対して、判定対象選択部12が、後方ファン41を判定対象として選択した場合、平均値算出部13は、後方ファン42,43,44の回転数の平均値、すなわち(5000+12500+12500)/3=10000[rpm]となる。異常判定部15は、後方ファン41の回転数である12500[rpm]と、平均値の10000[rpm]の差である2500[rpm]を異常判定値として算出する。異常判定値の2500[rpm]は、異常判定閾値の6500[rpm]よりも大きくないため、異常判定部15は、後方ファン41は異常でない、すなわち正常であると判定し、ステップS7以降の処理を行う。
【0029】
(35℃環境の場合)
温度センサ20が示す温度が、35℃環境の場合、異常判定部15は、平均値の16800[rpm]と、後方ファン42の回転数である8000[rpm]の差、すなわち8800[rpm]を異常判定値として算出する。異常判定部15は、閾値記憶部14から35℃環境の場合に対応する8000[rpm]を異常判定閾値として読み出す。異常判定部15は、異常判定値の8800[rpm]が、異常判定閾値の8000[rpm]よりも大きいので、後方ファン42が異常であるとして判定結果を出力する。
【0030】
これに対して、判定対象選択部12が、後方ファン41を判定対象として選択した場合、平均値算出部13は、後方ファン42,43,44の回転数の平均値、すなわち(8000+16800+16800)/3=13867[rpm]となる(小数点以下を四捨五入)。異常判定部15は、後方ファン41の回転数である16800[rpm]と、平均値の13867[rpm]の差である2933[rpm]を異常判定値として算出する。異常判定値の2933[rpm]は、異常判定閾値の8000[rpm]よりも大きくないため、異常判定部15は、後方ファン41は異常でない、すなわち正常であると判定し、ステップS7以降の処理を行う。
【0031】
図6は、全ての後方ファン41〜42が、正常に動作している場合を示しており、この場合、判定対象の後方ファン41〜44の回転数と、判定対象以外の後方ファン41〜44の回転数の平均値は同じ値となる。そのため、これらの差である異常判定値の値は、0となり、いずれも異常判定閾値よりも大きくないため、全ての後方ファン41〜44が正常であるとして判定される。
【0032】
これに対して、前述した一般的な手法では、異常判定閾値が1つしか用いられず、各後方ファン41〜44の回転数が異常判定閾値より小さいか否かに基づいて異常の判定を行っている。例えば、
図7に示すように、後方ファン42が異常である場合、異常判定閾値を6500[rpm]とすると、25℃環境、30℃環境では、誤りなく、後方ファン42が異常であると判定する。これに対して、35℃環境では、共回りしているとはいえ、後方ファン42の回転数が8000[rpm]と高いため、正常であると誤判定してしまう。また、
図8に示すように、異常判定閾値を8500[rpm]とすると、30℃環境、35℃環境では、誤りなく、後方ファン42が、正常であると判定する。これに対して、25℃環境において後方ファン42が正常に動作しているのにも関わらず、異常であると判定してしまう。
【0033】
上記の実施形態の構成により、異常判定システム1では、第1のファンとしての前方ファン31〜34と、第1のファンからの風を受けて共回りする位置に配置される第2のファンとしての後方ファン41〜44を備えている。判定対象選択部12が、いずれか1つの後方ファン41〜44を選択する。平均値算出部13は、判定対象選択部12が選択した後方ファン41〜44以外の後方ファン41〜44の回転数の平均値を算出する。異常判定部15は、算出した平均値と、判定対象選択部12が選択した後方ファン41〜44の回転数の差を異常判定値として算出する。異常判定部15は、温度センサ20から温度を取得し、取得した温度に対応する異常判定閾値を閾値記憶部14から読み出す。異常判定部は、算出した異常判定値が、読み出した異常判定閾値よりも大きい場合、判定対象選択部12が選択した後方ファン41〜44が異常であると判定する。そのため、
図7や
図8に示したような誤判定を行うことなく、異常のある後方ファン41〜44を正確に判定することができる。また、共回りを発生させる前方ファン31〜34の速度を減少させることもないため、冷却性能を低下させることなく、正確にファンの異常判定を行うことができる。
【0034】
また、上記の実施形態の構成において、前方ファン31〜34のいずれかに異常が発生してファンの回転が停止したとしても、対向する位置に存在する後方ファン41〜44が送風する風のために、異常が発生した前方ファン31〜34に共回りが発生する。この場合、後方ファン41〜44を第1のファンとし、前方ファン31〜34を第2のファンとして、前方ファン31〜34に対して、上記の実施形態の構成を適用してもよい。すなわち、回転数検出部11は、前方ファン31〜34の回転数を検出する。判定対象選択部12は、前方ファン31〜34のいずれか1つを判定対象として選択する。平均値算出部13は、判定対象選択部12が選択した前方ファン31〜34以外の前方ファン31〜34の回転数の平均値を算出する。異常判定部15は、判定対象選択部12が選択した前方ファン31〜34の回転数と、平均値算出部13が算出した平均値の差を異常判定値として算出する。異常判定部15は、温度センサ20が示す温度に対応する異常判定閾値を閾値記憶部14から読み出し、算出した異常判定値が、読み出した異常判定閾値よりも大きいか否かを判定する。異常判定部15は、算出した異常判定値が、読み出した異常判定閾値よりも大きい場合、判定対象選択部12が選択した前方ファン31〜34が異常であると判定する。
【0035】
また、上記の実施形態の構成では、いずれか1つの後方ファン41〜44の回転数と、残りの後方ファン41〜44の回転数の平均値とに基づいて、後方ファン41〜44の間の回転数のばらつきによって生じる違いから異常を検出しているが、本発明の構成は、当該実施の形態に限られない。後方ファン41〜44の回転数のばらつき、すなわち乖離の度合いを検出することができる手法であればどのような手法を用いてもよい。
【0036】
また、上記の実施形態では、前方ファン31〜34が4個、後方ファン41〜44が4個の例について示したが、本発明の構成は、当該実施の形態に限られず、少なくとも3つ以上あればよく、4つ以上であってもよい。また、
図9に示すように、後方ファン41〜44の4個に対向するように1つの前方ファン30が配置されるような構成であってもよい。
【0037】
また、上記の実施形態では、後方ファン41〜44の数を4個としているが、本発明の構成は、当該実施の形態に限られない。後方ファン41〜44の数が多ければ多いほど、判定対象以外のファンに故障しているファンが含まれていたとしても、判定対象以外のファンを対象として算出する平均値は、正常なファンの回転数に近づくため、異常判定閾値の値として選択できる範囲が広くなる。そのため、各々の温度において選択できる異常判定閾値の範囲に重複する範囲が存在する場合、同一の異常判定値を選択できることになる。その場合、温度ごとに異なる異常判定値とせず、全ての温度において、同一の異常判定値を適用するようにしてもよい。
【0038】
また、上記の実施形態では、ファンユニット50をモジュラーサーバ装置100に適用する例について示したが、本発明の構成は、当該実施の形態に限られない。
図1に示すように前方ファン31〜34と後方ファン41〜44のように直列で二重に横方向に並べた上で、更に縦方向に並列に並べたファンユニットを構成して、ラックサーバに適用するようにしてもよい。
【0039】
また、上記の実施形態では、温度センサ20を、ファンユニット50が備える構成としているが、後方ファン41〜44の近傍であればいずれの場所であってもよく、ファンユニット50内ではなく、モジュラーサーバ装置100内に備えられていてもよい。
【0040】
また、上記の実施形態における数値の比較において、「より大きいか否か」といった比較は、一例であり、「より大きいか否か」という比較に替えて「以上であるか否か」という比較としてもよい。
【0041】
図11は異常判定装置の最少構成を示す図である。
異常判定装置10は、第1のファンにより共回りする位置に設けられた複数の第2のファンの異常を判定する。異常判定装置10は、少なくとも上記複数の第2のファンの回転数を比較し、第2のファンの間の回転数に乖離がある場合、複数の第2のファンに異常があると判定する異常判定部15を備えればよい。
【0042】
上述した実施形態における異常判定装置10をコンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、FPGA(Field Programmable Gate Array)等のプログラマブルロジックデバイスを用いて実現されるものであってもよい。
【0043】
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。