(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0014】
以下、本発明の例示的な実施形態が開示される。以下に示される実施形態の構成、ならびに当該構成によってもたらされる作用および効果は、一例である。本発明は、以下の実施形態に開示される構成以外によっても実現可能である。また、本発明の実施形態によれば、構成によって得られる種々の効果(派生的な効果も含む)のうち少なくとも一つを得ることが可能である。
【0015】
なお、本明細書では、序数は、部品や、部材、部位、位置、方向等を区別するためだけに用いられており、順番や優先度を示すものではない。
【0016】
[外観の例]
図1は、実施形態の情報処理装置10の外観の例を示す図である。情報処理装置10は、情報処理装置10の状態を表示する表示部1を備える。情報処理装置10の状態は、例えば所定のエラーを示すエラー情報等により表される。
【0017】
[内部構造の例]
図2は、実施形態の情報処理装置10の内部構造の例を示す図である。
図2は、実施形態の情報処理装置10の上カバーを外した状態を示す。
図3は、実施形態のベース基板2と子基板3a〜3gとの接続関係の例を示す図である。なお、子基板3a〜3gの数は、7つに限られず、任意でよい。
【0018】
図2及び
図3を参照して、実施形態の情報処理装置10の冷却に係る構造について説明する。実施形態の情報処理装置10は、表示部1、ベース基板2、子基板3a〜3g、ファン4a〜4g、熱拡散プレート5、プロセッサ6及びメモリ7を備える。
【0019】
以下、子基板3a〜3gを区別しない場合は、単に子基板3という。同様に、ファン4a〜4gを区別しない場合は、単にファン4という。
【0020】
表示部1は、情報処理装置10の状態を表示する。表示部1は、例えば故障したファン4の位置を示すエラーコード等を表示する。表示部1により、ユーザーがファン4の故障を容易に認識できるようにして、ユーザーに故障したファン4の交換を促す。
【0021】
ベース基板2は、子基板3a〜3g、プロセッサ6及びメモリ7が実装される基板(ブリッジボード)である。
【0022】
子基板3a〜3gは、例えばPCIe(Peripheral Component Interconnect Express;登録商標)バスを用いて、ベース基板2に接続される。子基板3a〜3gは、それぞれが独立のプラットフォームとして動作する。
【0023】
子基板3aには、例えばインテル社製x86互換プロセッサが搭載されている。子基板3aは、Windows(登録商標)やLinux(登録商標)等の汎用OS(Operating System)が動作するPC(Personal Computer)プラットフォームである。子基板3b〜3gは、所定の処理を実行するプロセッサ(演算プロセッサ)が搭載される。所定の処理は、例えば、AI(Artificial Intelligence)推論処理、及び、画像処理等の負荷が高い演算を含む。子基板3aに搭載されるプロセッサは、例えばPCのデバイスとして利用可能なGPU(Graphics Processing Unit)、及び、FPGA(Field Programmable Gate Array)等である。
【0024】
ファン4a〜4gは、子基板3a〜3gを冷却する冷却装置である。
【0025】
熱拡散プレート5は、各子基板3a〜3gから生じる熱を拡散させるプレートである。例えば1つのファン4が故障して止まったとしても、熱拡散プレート5によって繋げられた別の子基板3のファン4が冷却を助ける。これにより、次回のメンテナンス時や保守員が来るまでの間、情報処理装置10を止めずに継続動作させることを可能にする。
【0026】
プロセッサ6は、ベース基板2の動作を制御する制御装置(マイコン)である。プロセッサ6は、例えばベース基板2に接続された子基板3a〜3gの間のデータ通信制御を行う。また例えば、プロセッサ6は、ファン4a〜4gの回転数を制御する。
【0027】
メモリ7は、プロセッサ6により使用される記憶装置である。メモリ7は、例えばデータ通信制御に係るソフトウェアプログラムやこのプログラム用のデータ類が書き込まれている。メモリ7上のソフトウェアプログラムは、プロセッサ6に適宜読み込まれて実行される。
【0028】
上述の
図3の構成によれば、例えば、所定の処理の分散・並列処理が可能になるとともに、それぞれの処理に合わせて、より適切なハードウェア(処理に最適なプロセッサ等)を選択することができる。また例えば、ベース基板2に搭載されたプロセッサ6が、子基板3a〜3gの制御対象(例えば、FAN4の回転数等)を統括的に制御する仕組みにすることにより、子基板3a〜3gに搭載されたプロセッサで別々に制御させる場合に比べて、制御ソフトウェア等の開発及び更新等をより容易にすることができる。
【0029】
[ハードウェア構成の例]
図4は、実施形態の情報処理装置10のハードウェア構成の例を示す図である。実施形態の情報処理装置10は、プラットフォーム20−1〜20−7、及び、ブリッジボード30を備える。
【0030】
各プラットフォーム20−1〜20−7は、それぞれブリッジボード30にPCIe接続されている。PCIeにおいては、インテルプロセッサ等のプロセッサがホスト側として動作可能なRC(Root Complex)となり、デバイスがEP(End Point)となり、ホストとデバイスとの間でのデータ転送が行なわれる。
【0031】
なお、以下、プラットフォームを示す符号としては、複数のプラットフォームのうち1つを特定する必要があるときには符号20−1〜20−8を用いるが、任意のプラットフォームを指すときには符号20を用いる。
【0032】
<プラットフォーム>
実施形態のプラットフォーム20−1は、プロセッサ21−1及びファン4aを備える。プラットフォーム20−1は、上述の子基板3aにより実装される。ファン4aは、子基板3aに接続される。同様に、プラットフォーム20−2〜20−7はプロセッサ21−2〜21−7、及び、ファン4b〜4gをそれぞれ備える。プラットフォーム20−2〜20−7は、上述の子基板3a〜3gにより実現される。ファン4b〜4gは、それぞれ子基板3b〜3gに接続される。
【0033】
プロセッサ21−1〜21−7はそれぞれ違うメーカ(ベンダ)から提供されてもよい。例えば、プロセッサ21−1,21−2,21−3,21−4,21−5,21−6,21−7は、それぞれ、A社,B社,C社,D社,E社,F社,G社が提供するものであるとする。
【0034】
また、ブリッジボード30に搭載されているEPに対して、それぞれが異なる種類のプラットフォーム20を接続しても良い。さらに、2つ以上の複数のEPを1つのプラットフォーム20に接続し、プラットフォーム20側が複数のRCを用いてブリッジボード30と通信しても良い。
【0035】
なお、以下、プロセッサを示す符号としては、複数のプロセッサのうち1つを特定する必要があるときには符号21−1〜21−7を用いるが、プロセッサ21−1〜21−7のうち、任意のプロセッサを指すときには符号21を用いる。
【0036】
プラットフォーム20−1〜20−7は、AI推論処理や画像処理等の所定の処理を行なうコンピュータ環境である。プラットフォーム20においては、プロセッサ21(第1の制御部)がプログラムを実行することで、所定の処理を実行し、各種機能を実現する。
【0037】
プロセッサ21は、プラットフォーム2全体を制御する。プロセッサ21は、マルチプロセッサであってもよい。プロセッサ21は、例えばCPU(Central Processing Unit),MPU(Micro Processing Unit),DSP(Digital Signal Processor),ASIC(Application Specific Integrated Circuit),PLD(Programmable Logic Device),FPGA(Field Programmable Gate Array)のいずれか一つであってもよい。また、プロセッサ21は、CPU,MPU,DSP,ASIC,PLD,FPGAのうちの2種類以上の要素の組み合わせであってもよい。
【0038】
<ブリッジボード>
実施形態のブリッジボード30は、プロセッサ6、メモリ7及び内部バス31を備える。ブリッジボード30は、上述のベース基板2に実装される。
【0039】
ブリッジボード30は、例えば、7チャネルのEPを有する。
【0040】
プロセッサ6及びメモリ7は、内部バス31(Internal Bus)及びEPを介して、それぞれのプラットフォーム20のRCに接続される。
【0041】
プロセッサ6(第2の制御部)は、プラットフォーム20及びブリッジボード30を含む情報処理装置10全体を制御する。例えば、プロセッサ6は、各プラットフォーム20を実装する子基板3に接続されたファン4を制御する。
【0042】
プロセッサ6は、マルチプロセッサであってもよい。プロセッサ6は、例えばCPU31,MPU,DSP,ASIC,PLD,FPGAのいずれか一つが用いられてもよい。また、プロセッサ6は、CPU,MPU,DSP,ASIC,PLD,FPGAのうちの2種類以上の要素の組み合わせであってもよい。
【0043】
プロセッサ6がメモリ7に格納されたソフトウェアプログラムを実行することで、ブリッジボード30におけるプラットフォーム20間(プロセッサ21間)のデータ転送を実現する。
【0044】
ブリッジボード30は、プラットフォーム20間のデータ転送を高速化するためにPCIeを用い、
図4に示すように、各プラットフォーム20に備えられるプロセッサ21をそれぞれRCとして動作させ、デバイスとして動作するEP間でデータ転送を実現する。
【0045】
[子基板の構造の例]
図5Aは、実施形態の子基板3の底面の構造の例を示す図である。
図5Bは、実施形態の子基板3の上面の構造の例を示す図である。子基板3の上面には、ファン4及びヒートシンク8が取り付けられている。各子基板3に取り付けられたヒートシンク8は、熱拡散プレート5と接する。子基板3は、ファン4により冷却され、子基板3から生じる熱は、背面に排熱されるとともに、ヒートシンク8を介して熱拡散プレート5に伝わる。
【0046】
[ファン故障時の動作例]
図6は、実施形態のファン4が故障した場合の動作の例を説明するための図である。
図6の例は、子基板3eに取り付けられたファン4eが故障した場合を示す。ファン4eが故障した場合でも、子基板3eから生じる熱は、ヒートシンク8(
図5B参照)を介して熱拡散プレート5に伝わることによって拡散される。また、ファン4eが故障した場合でも、別の子基板3のファン4による冷却効果が、熱拡散プレート5及びヒートシンク8によって子基板3eにも伝わるので、子基板3eの冷却を助けることができる。
【0047】
ファン4eの故障は、ベース基板2に搭載されているプロセッサ6が、ファン4eからの信号を定期的に確認することによって検出する。
【0048】
プロセッサ6は、ファン4eから異常値を示す信号(ファン4eの故障を示す信号)を受信した場合、故障していないファン4a〜4d、4f及び4gの回転数を、より高い回転数に変更する。これにより、例えば1つのファン4eが故障して止まったとしても、熱拡散プレート5によって繋げられた別の子基板3a〜3d、3f及び3gのファン4a〜4d、4f及び4gによって、故障したファン4eが取り付けられた子基板3eの冷却を助けることができる。
【0049】
なお、プロセッサ6は、ファン4eから異常値を示す信号(ファン4eの故障を示す信号)を受信した場合、故障していないファン4a〜4d、4f及び4gのうち、故障したファン4eが取り付けられた子基板3eにより近い子基板3d及び3fに取り付けられたファン4d及び4fの回転数を、より高い回転数に変更してもよい。これにより、例えば、故障したファン4eが取り付けられた子基板3eに対する冷却効率がより高いファン4d及び4fの回転数が、より高い回転数に変更され、その他のファン4の回転数は変更されないため、消費電力の向上を抑えることができる。
【0050】
また、プロセッサ6は、ファン4eから異常値を示す信号(ファン4eの故障を示す信号)を受信した場合、表示部1に、故障したファン4eを特定するエラー情報を表示する。
【0051】
図7は、実施形態のエラー情報の表示例を示す図である。
図7の例は、「E4」によって、AI推論処理・画像処理などの負荷が高い演算を実行する子基板3b〜3gのうち、左から4番目の子基板3eに取り付けられたファン4eが故障したことを示す。
図7のようにエラー情報を表示情報によって通知することにより、ユーザーがファン4の故障を容易に認識できるため、ユーザーに故障したファン4の交換を促すことができる。
【0052】
なお、プロセッサ6は、別の方法によりエラー情報を通知してもよい。例えば、プロセッサ6は、エラー情報を外部モニターへ表示してもよい。また例えば、プロセッサ6は、ユーザーのメールアドレス等を使用して、ユーザーへエラー情報を通知してもよい。
【0053】
以上説明したように、実施形態の情報処理装置10は、ベース基板2と、ベース基板2に接続された複数の子基板3と、を備える。子基板3は、所定の処理を実行する第1の制御部(プロセッサ21)と、子基板3を冷却するファン4と、を備える。ベース基板2は、ファン4を制御する第2の制御部(プロセッサ6)を備える。
【0054】
このような構成によれば、例えば、1つのファン4が故障して止まったとしても、第2の制御部(プロセッサ21)が、故障していないファン4を制御することにより、故障したファン4が取り付けられた子基板3の冷却を助けることができる。また例えば、このような構成によれば、所定の処理の分散・並列処理が可能になるとともに、それぞれの処理に合わせて、より適切なハードウェアを選択することができる。
【0055】
また、実施形態の情報処理装置10では、複数の子基板3のそれぞれに取り付けられたヒートシンク8と、それぞれのヒートシンク8と接し、複数の子基板3から生じる熱を拡散する熱拡散プレート5と、を更に備える。
【0056】
このような構成によれば、複数のファン4のうち一部(例えば1つ)のファン4が故障しても、故障していないファン4による冷却効果を、熱拡散プレート5及びヒートシンク8によって、故障したファン4が取り付けられた子基板3に伝えることができる。これにより、情報処理装置10を、複数のファン4のうち一部のファン4が故障しても、継続して動作させることができる。すなわち、情報処理装置10全体が停止することが無くなるため、信頼性の高い情報処理装置を提供可能になる。
【0057】
また、実施形態の情報処理装置10では、例えば、ベース基板2は、それぞれのファン4から、ファン4の状態を示す信号を定期的に受信し、当該信号がファン4の故障を示す場合、故障したファン4を特定するエラー情報を通知するプロセッサ6を備える。
【0058】
このような構成によれば、例えば、ユーザーがファン4の故障を容易に認識できるようにして、ユーザーに故障したファン4の交換を促すことができる。
【0059】
また、実施形態の情報処理装置10では、例えば、プロセッサ6は、複数のファン4のうち、一部のファン4が故障した場合、故障していないファン4の回転数を、より高い回転数に変更する。
【0060】
このような構成によれば、例えば、1つのファン4が故障して止まったとしても、熱拡散プレート5によって繋げられた別の子基板3のファン4によって、故障したファン4が取り付けられた子基板3の冷却を助けることができる。
【0061】
また、実施形態の情報処理装置10では、例えば、プロセッサ6は、故障していないファン4のうち、故障したファン4が取り付けられた子基板3により近い子基板3に取り付けられたファン4の回転数を、より高い回転数に変更する。
【0062】
このような構成によれば、例えば、故障したファン4が取り付けられた子基板3に対する冷却効率がより高いファン4の回転数が、より高い回転数に変更され、その他のファン4の回転数は変更されないため、消費電力の向上を抑えることができる。
【0063】
また、実施形態の情報処理装置10では、例えば、プロセッサ6から通知されるエラー情報を示す表示情報を表示する表示部1を備える。
【0064】
このような構成によれば、例えば、ユーザーがファン4の故障を、表示情報から容易に認識できるため、ユーザーに故障したファン4の交換を促すことができる。
【0065】
以上、本発明の実施形態が例示されたが、上記実施形態は一例であって、発明の範囲を限定することは意図していない。上記実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、組み合わせ、変更を行うことができる。また、各構成や、形状、等のスペック(構造や、種類、方向、形式、大きさ、長さ、幅、厚さ、高さ、数、配置、位置、材質等)は、適宜に変更して実施することができる。