(58)【調査した分野】(Int.Cl.,DB名)
パケットバッファとして使用する運用用のスタティック・ランダム・アクセス・メモリにメモリハードエラーが発生した時に、当該運用用のスタティック・ランダム・アクセス・メモリのみの電源をオフにし、予備のスタティック・ランダム・アクセス・メモリに切り替えて通信を継続することを特徴とするパケット通信方法であって、
前記メモリハードエラーが発生した場合であって、故障原因の特定が必要な場合にパケット通信装置運用者に対してエラー検出情報を通知し、前記パケット通信装置運用者が前記予備のスタティック・ランダム・アクセス・メモリへの切り替え/運用用のスタティック・ランダム・アクセス・メモリへの切り戻しを遠隔操作により手動で行うことを特徴とするパケット通信方法。
前記予備のスタティック・ランダム・アクセス・メモリに切り替えた後、前記メモリハードエラーが発生した運用用のスタティック・ランダム・アクセス・メモリの電源をオンにして、パリティエラーのチェックを行い、パリティエラーが検出されない場合に、前記予備のスタティック・ランダム・アクセス・メモリから前記運用用のスタティック・ランダム・アクセス・メモリに切り戻しすることを特徴とする請求項1に記載のパケット通信方法。
前記予備のスタティック・ランダム・アクセス・メモリが、上位回線に接続する前記運用用のスタティック・ランダム・アクセス・メモリと下位回線に接続する前記運用用のスタティック・ランダム・アクセス・メモリとに供用するように接続されていることを特徴とする請求項4に記載のパケット通信装置。
前記予備のスタティック・ランダム・アクセス・メモリが、上位回線に接続する前記運用用のスタティック・ランダム・アクセス・メモリと下位回線に接続する前記運用用のスタティック・ランダム・アクセス・メモリとにそれぞれ個別に接続されていることを特徴とする請求項4に記載のパケット通信装置。
【背景技術】
【0002】
パケットバッファを有するパケット通信装置において、パケットバッファとして使用するSRAM(スタティック・ランダム・アクセス・メモリ)に対し、ソフトエラーや外来ノイズなどによりメモリデバイス内でハードエラーが発生し、それに伴いパケットロスが発生することがある。ハードエラーの代表的な例はシングルイベント・ラッチアップである。
【0003】
ソフトエラーにおいては、宇宙空間に存在する放射線が半導体素子に影響を与えることで偶発的に発生する事象であり、機構/回路構成などでは抑止できない事象である。このようなソフトエラーは、メモリの上書き、即ち、write処理によって、以降は正常に使用することができる。
【0004】
しかし、メモリハードエラー、特に、ラッチアップ事象は、write処理や通常のリセット処理では復旧せず、電源のOFF/ONでのみ復旧する。このようなメモリハードエラーは、装置(パッケージ)当たり一月に一回程度の頻度で発生する。
【0005】
そこで、従来においては、SRAMのラッチアップ等におけるパケットロス等の不具合事象発生に対しては、
装置(パッケージ)の二重化対応による切替え処理(例えば、特許文献1参照)、
装置(パッケージ)交換、或いは、
装置(パッケージ)の電源OFF/ON(例えば、特許文献2参照)
などにより対応を行なってきた。
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかし、メモリハードエラー事象発生時の対応として、二重化による対応を実施してしまうと複数スロットを持つ装置などでは、同時に多パッケージ不具合事象発生時に使用できなくなるという問題がある。また、通常はハードエラー事象発生時にもSRAMデバイスの電源はONのままであるので大電流が流れている可能性があり、そのため、そのまま放置することで、装置故障に至る虞があるという問題もある。
【0008】
また、装置(パッケージ)交換による対応は、局舎など遠地で使用される場合は、本事象復旧のため、管理者が現地まで行く必要があり、迅速な対応が困難で復旧までに時間がかかるという問題がある。
【0009】
また、装置(パッケージ)の電源OFF/ONによる対応では、その間通信断が発生するため、多回線収容装置では、正常に通信している他の回線も通信断が発生することになる。
【0010】
したがって、本発明は、装置構成を大掛かりにすることなく、メモリハードエラーに迅速に対応してパケット通信を継続することを目的とする。
【課題を解決するための手段】
【0011】
上記の課題を解決するために、(1)本発明は、パケット通信方法において、パケットバッファとして使用する運用用のスタティック・ランダム・アクセス・メモリにメモリハードエラーが発生した時に、当該運用用のスタティック・ランダム・アクセス・メモリのみの電源をオフにし、予備のスタティック・ランダム・アクセス・メモリに切り替えて通信を継続することを特徴とする
パケット通信方法であって、前記メモリハードエラーが発生した場合であって、故障原因の特定が必要な場合にパケット通信装置運用者に対してエラー検出情報を通知し、前記パケット通信装置運用者が前記予備のスタティック・ランダム・アクセス・メモリへの切り替え/運用用のスタティック・ランダム・アクセス・メモリへの切り戻しを遠隔操作により手動で行うことを特徴とする。
【0012】
このように、予備のスタティック・ランダム・アクセス・メモリを設けることにより、パッケージを二重化することなく、パッケージを交換することなく且つ電源のオフ/オン操作をすることなく、パケットロスに対応して通信を継続することができる。また、パッケージを二重化した場合にも、その他パッケージ故障用として二重化されたパッケージの使用が可能になる。
【0013】
また、メモリハードエラーが発生した運用用のスタティック・ランダム・アクセス・メモリのみの電源をオフにするので、大電流が流れることがなく、装置故障を未然に防ぐことができる。
特に、切り替え/切り戻しをパケット通信装置運用者の遠隔操作により手動で行うことにより、メモリハードエラー事象の故障原因の特定が可能になる。即ち、メモリハードエラーが発生したパッケージは、電源OFF/ONにより事象回復することが多いため、故障品として返却されても、故障原因の特定ができないことが多い。しかし、事象発生時の切り替え/切り戻し処理を手動で行えるようにすることで、切り戻しを行わずに、ハードエラー発生時の状態を保持することが可能となり、故障原因の切り分けが容易となる。また、手動で切替えを行うことにより、装置運用者が意図したタイミング(装置の稼働閑散期等)に切替えを行うことが可能となる。
【0014】
(2)また、本発明は、上記(1)において、予備のスタティック・ランダム・アクセス・メモリに切り替えた後、前記メモリハードエラーが発生した運用用のスタティック・ランダム・アクセス・メモリの電源をオンにして、パリティエラーのチェックを行い、パリティエラーが検出されない場合に、前記予備のスタティック・ランダム・アクセス・メモリから前記運用用のスタティック・ランダム・アクセス・メモリに切り戻しすることを特徴とする。
【0015】
このように、切り戻しを行うことによって、運用用のスタティック・ランダム・アクセス・メモリに再度メモリハードエラーが発生しても、再度、予備のスタティック・ランダム・アクセス・メモリに切り替えて通信を継続することができる。
【0019】
(
3)また、本発明は、上記(1)
または(2)において、前記予備のスタティック・ランダム・アクセス・メモリに、常時、前記運用用のパケットバッファとして使用するスタティック・ランダム・アクセス・
メモリと同じ書き込みを行うことを特徴とする。
【0020】
このような書き込みの二重化を行うことにより、メモリハードエラー事象が発生した場合に、パケットロスを発生させることなく、パケット通信を継続することが、即ち、無瞬断切り替えが可能になる。
【0021】
(
4)また、本発明は、パッケージ通信装置において、パケットバッファとして使用する運用用のスタティック・ランダム・アクセス・メモリと、前記運用用のスタティック・ランダム・アクセス・メモリに対してスイッチング手段を介して並列的に接続された予備のスタティック・ランダム・アクセス・メモリと、前記運用用のスタティック・ランダム・アクセス・メモリ及び前記予備のスタティック・ランダム・アクセス・メモリへの電源のオン/オフを制御するメモリ電源制御部と
、前記メモリハードエラーが発生した場合にパケット通信装置運用者に対してエラー検出情報を通知する機構と、前記パケット通信装置運用者が前記予備のスタティック・ランダム・アクセス・メモリへの切り替え/運用用のスタティック・ランダム・アクセス・メモリへの切り戻しを遠隔操作により手動で行う機構とを備えていることを特徴とする。
【0022】
このような、装置構成を採用することにより、メモリハードエラー事象が発生しても、簡単なパッケージ構成により且つパッケージ故障を発生させることなくパケット通信を継続することが可能な通信装置を構築することができる。
【0023】
(
5)また、本発明は、上記(
4)において、前記予備のスタティック・ランダム・アクセス・メモリが、上位回線に接続する前記運用用のスタティック・ランダム・アクセス・メモリと下位回線に接続する前記運用用のスタティック・ランダム・アクセス・メモリとに供用するように接続されていることを特徴とする。
【0024】
このように、一つの予備のスタティック・ランダム・アクセス・メモリを上位回線に接続する運用用のスタティック・ランダム・アクセス・メモリと下位回線に接続する運用用のスタティック・ランダム・アクセス・メモリとに供用するように接続することによって、部品点数を少なくすることができる。
【0025】
(
6)また、本発明は、上記(
4)において前記予備のスタティック・ランダム・アクセス・メモリが、上位回線に接続する前記運用用のスタティック・ランダム・アクセス・メモリと下位回線に接続する前記運用用のスタティック・ランダム・アクセス・メモリとにそれぞれ個別に接続されていることを特徴とする。
【0026】
このように、予備のスタティック・ランダム・アクセス・メモリを、上位回線に接続する運用用のスタティック・ランダム・アクセス・メモリと下位回線に接続する運用用のスタティック・ランダム・アクセス・メモリとにそれぞれ個別に接続することにより、予備のスタティック・ランダム・アクセス・メモリに常時書き込みが可能になり、メモリハードエラー発生時のパケットロスをなくすことができる。
【発明の効果】
【0027】
開示のパケット通信方法及びパケット通信装置によれば、装置構成を大掛かりにすることなく、メモリハードエラーに迅速に対応してパケット通信を継続することが可能になる。
【発明を実施するための形態】
【0029】
ここで、
図1及び
図2を参照して、本発明の実施の形態のパケット通信装置を説明する。
図1は、本発明の実施の形態の瞬断ありの切り替え方式のパケット通信装置の切替機構の原理的構成図である。パケット通信装置を構成する装置パッケージ部1には、電源入力部3
1を有するメモリ機能部2
1と電源入力部3
2を有する予備メモリ機能部2
2とが設けられ、スイッチ部4
1,4
2を介してパリティ検出部5に接続する。また、パリティ検出部5の出力は電源OFF/ON判定部6に出力され、その出力により電源OFF/ON制御部7を介してメモリ機能部2
1及び予備メモリ機能部2
2の電源のOFF/ONを制御する。また、パリティ検出部5の出力によりセレクタ部8を介してパケット通信において運用するメモリを選択する。
【0030】
また、必要に応じて遠隔装置通知部9を設け、電源OFF/ON判定部6の出力を遠隔監視制御装置11にメモリ機能部2
1及び予備メモリ機能部2
2の電源状態を通報し、必要に応じて異常警報を発令する。なお、メモリ機能部2
1及び予備メモリ機能部2
2には例えば、128MbitのSRAMが装着されている。
【0031】
図2は、メモリハードエラー事象発生時のメモリ切り替えフロー図であり、まず、
S
1:メモリ機能部2
1にwrite/readを行うたびにパリティエラーの検出を行う。
S
2:パリティエラーが検出された場合には、予備メモリ機能部2
2の電源をONにして、予備メモリ機能部2
2に切り替える。
S
3:予備メモリ機能部2
2へのwrite/read処理を開始する。
S
4:事象発生のメモリ機能部2
1に対して全アドレス番地へのwrite/read処理を行い、再度のパリティエラー検出を行い、ハードエラーかソフトエラーかの判定を行う。
S
5:パリティエラーがない場合には、ソフトエラーと判定して元のメモリ機能部2
1へ切り戻し、予備メモリ機能部2
2の電源をOFFにして、通信を継続する。
S
6:パリティエラーが検出された場合には、ハードエラーと判定してメモリ機能部2
1の電源をOFFにし、予備メモリ機能部2
2での運用を継続する。
【0032】
この場合には、事象発生時のパケットは失われるので、その旨の通報を発生する。以降は、必要に応じてハードエラーと判定されたメモリ機能部2
1の電源のOFF/ONを行ってラッチアップ等を回復させたり、あるいは、故障原因の解明のために、電源をONすることなく装置パッケージを適当なタイミングで回収する。ラッチアップ回復のための電源のOFF/ONは自動的に行うようにプログラムしても良いし、装置運用管理者が遠隔装置通報部からの通報に基づいて遠隔操作により行うようにしても良い。
【0033】
次に、
図3及び
図4を参照して本発明の実施の形態の無瞬断切り替え式のパケット通信装置を説明する。
図3は、本発明の実施の形態の無瞬断切り替え方式のパケット通信装置の切替機構の原理的構成図である。基本的構成は上記の実施の形態と同様であるが、パリティ検出部5とスイッチ部4
1,4
2との間にバッファ10を挿入し、write動作はメモリ機能部2
1と予備メモリ動作部2
2に対して常時パケットの書き込みを行い、通常運用時の読み出しはメモリ機能部2
1から行う。
【0034】
図4は、メモリハードエラー事象発生時のメモリ切り替えフロー図であり、まず、
S
1:メモリ機能部2
1及び予備メモリ機能部2
2にwriteを行い、メモリ機能部2
1からreadを行うたびにパリティエラーの検出を行う。
S
2:パリティエラーが検出された場合には、そのまま予備メモリ機能部2
2に切り替える。
S
3:予備メモリ機能部2
2へのwrite/read処理を開始する。
S
4:事象発生のメモリ機能部2
1に対して全アドレス番地へのwrite/read処理を行い、再度のパリティエラー検出を行い、ハードエラーかソフトエラーかの判定を行う。
S
5:パリティエラーがない場合には、ソフトエラーと判定して元のメモリ機能部2
1へ切り戻し、メモリ機能部2
1からreadして通信を継続する。
S
6:パリティエラーが検出された場合には、ハードエラーと判定してメモリ機能部2
1の電源をOFFにし、予備メモリ機能部2
2での運用を継続する。
【0035】
この場合には、事象発生時にも予備メモリ機能部2
2にも同じパケットが書き込まれているので、パケットロスが発生することはない。以降は、必要に応じてハードエラーと判定されたメモリ機能部2
1の電源のOFF/ONを行ってラッチアップ等を回復させたり、あるいは、故障原因解明のために、電源をONすることなく装置パッケージを適当なタイミングで回収する。ラッチアップ回復のための電源のOFF/ONは自動的に行うようにプログラムしても良いし、装置運用管理者が遠隔装置通報部からの通報に基づいて遠隔操作により行うようにしても良い。
【0036】
このように、本発明の実施の形態においては、予備メモリ機構2
2を設けるだけで、装置パッケージを二重化しなくとも、通信を中断することなくメモリハードエラーに対応することが可能になる。
【0037】
また、メモリハードエラーが発生した場合にも、事象発生のメモリ機能部2
1のみの電源をOFFにするだけであるので、多回線収容装置の場合、正常に通信している他の回線の通信断が発生することがない。
【0038】
事象発生のメモリ機能部2
1のみの電源をOFFにしているので、メモリ機能部2
1に大電流が流れることはなく、したがって、メモリハードエラーに伴って装置パッケージ1が破壊されることがない。
【実施例1】
【0039】
次に、
図5及び
図6を参照して、本発明の実施例1のパケット通信装置を説明する。
図5は、本発明の実施例1のパケット通信装置の概念的構成図であり、多回線を1パッケージに有する複数の回線パッケージ20及びパッケージ多重/分離部41を備えた共通パッケージ40をバックワイヤリングボード50に装着して、共通パッケージ40を介して下位回線と上位回線とを接続する。
【0040】
各回線パッケージ20は回線多重/分離部21を備え、多数のインタフェース変換部22を介して下位回線に接続される。上り方向/下り方向にそれぞれパケットバッファとなる上位方向SRAM23と下位方向SRAM24が通信線に接続されたリレースイッチ25,26を介して回線多重/分離部21に接続されている。
【0041】
また、上位方向SRAM23と下位方向SRAM24に対して1個の共通の予備SRAM27が設けられており、
図1に示したように、電源28は電源供給線に接続した電源OFF/ON制御部となるリレースイッチ29,30を介して上位方向SRAM23,下位方向SRAM24及び予備SRAM27に接続されている。
【0042】
なお、図示は省略するが、
図1に示したパリティエラー検出部、電源OFF/ON判定部、セレクタ部、遠隔装置通知部が備えられており、メモリハードエラーが発生した場合に、遠隔装置通知部から遠隔監視制御装置60にその旨の通報がなされる。
【0043】
図6は、本発明の実施例1におけるメモリハードエラー事象発生時のメモリ切り替えフロー図である。まず、
S
1:上位方向SRAM23及び下位方向SRAM24にwrite/readを行うたびにパリティエラーの検出を行う。
S
2:パリティエラーが検出された場合には、予備SRAM27の電源をONにして、予備SRAMに切り替える。事象の発生していない側のSRAMについてはそのまま運用を継続する。
S
3:予備SRAM27へのwrite/read処理を開始する。
S
4:事象発生のSRAMに対して全アドレス番地へのwrite/read処理を行い、再度のパリティエラー検出を行い、ハードエラーかソフトエラーかの判定を行う。
S
5:パリティエラーがない場合には、ソフトエラーと判定して元のSRAMへ切り戻し、予備SRAM27の電源をOFFにして、通信を継続する。
S
6:パリティエラーが検出された場合には、ハードエラーと判定して事象発生のSRAMの電源をOFFにし、予備SRAM27での運用を継続する。
S
7:事象発生のSRAMについて電源をONにしてメモリハードエラーの復旧を試みる。
S
8:メモリハードエラー復旧を試みたSRAMに対して全アドレス番地へのwrite/read処理を行い、再度のパリティエラー検出を行い、ハードエラーかソフトエラーかの判定を行う。
S
9:パリティエラーが検出されない場合には、復旧したSRAMに切り戻し、予備SRAM27の電源をOFFにする。
S
10:パリティエラーが検出された場合には、再び、当該SRAMの電源をOFFにし、予備SRAM27での運用を継続する。
【0044】
事象発生のSRAMに対するメモリハードエラー回復の試みは、自動的に行われるようにプログラムしても良いし、遠隔監視制御装置60により装置管理者が、遠隔操作で手動で行うようにしても良い。
【0045】
また、遠隔監視制御装置1により装置管理者が事象発生のSRAMに対するメモリハードエラー回復の試みを行わないようにしても良く、装置の稼働閑散期等のタイミングを見計らって回線パッケージを回収して、故障原因を究明するようにしても良い。
【0046】
このように、本発明の実施例1においては、上り方向と下り方向のパケットバッファに対して一個の共通の予備SRAMを設けるだけの簡単な構成により、回線パッケージを二重化したり或いは回線パッケージ全体の電源をOFFにして通信を中断することなくメモリハードエラーに対応することが可能になる。
【0047】
また、事象が発生したのちの電源復旧実施によってもハードメモリエラーが回復されない場合には、当該SRAMの電源をOFFにしたままにするので、このSRAMに大電流が流れることはなく、メモリハードエラーに伴って回線パッケージ20が破壊されることはない。
【実施例2】
【0048】
次に、
図7及び
図8を参照して、本発明の実施例2のパケット通信装置を説明するが、上位方向SRAMと下位方向SRAMの双方に個別の予備SRAMを設けたものであり、それ以外の基本的構成は上記の実施例1と同様である。
【0049】
図7は、本発明の実施例2のパケット通信装置の概念的構成図であり、実施例1と同様に多回線を1パッケージに有する複数の回線パッケージ20及びパッケージ多重/分離部41を備えた共通パッケージ40をバックワイヤリングボード50に装着して、共通パッケージ40を介して下位回線と上位回線とを接続する。
【0050】
各回線パッケージ20には回線多重/分離部21を備え、インタフェース変換部22を介して下位回線に接続される。上り方向/下り方向にそれぞれパケットバッファとなる上位方向SRAM23と下位方向SRAM24が通信線に接続されたリレースイッチ25,26を介して回線多重/分離部21に接続されている。
【0051】
本発明の実施例2においては、上位方向SRAM23に対して予備SRAM31が並列的に接続されるともに、下位方向SRAM24に対しても予備SRAM32が並列的に接続される。この場合、
図3に示したように、予備SRAM31及び予備SRAM32に対してはバッファ(図示を省略)を介してパケットが常時書き込まれる。また、電源28は電源供給線に接続した電源OFF/ON制御部となるリレースイッチ29,30を介して上位方向SRAM23,下位方向SRAM24及び予備SRAM31,32に接続されている。
【0052】
なお、図示は省略するが、この場合も、
図3に示したパリティエラー検出部、電源OFF/ON判定部、セレクタ部、遠隔装置通知部が備えられており、メモリハードエラーが発生した場合に、遠隔装置通知部から遠隔監視制御装置60にその旨の通報がなされる。
【0053】
図8は、本発明の実施例2におけるメモリハードエラー事象発生時のメモリ切り替えフロー図である。まず、
S
1:上位方向SRAM23と予備SRAM31及び下位方向SRAM24と予備SRAM32にwriteにwriteを行い、上位方向SRAM23及び下位方向SRAM24からreadを行うたびにパリティエラーの検出を行う。
S
2:パリティエラーが検出された場合には、対応する予備SRAM31(32)の電源をONにして、予備SRAM31(32)に切り替える。事象の発生していない側のSRAMについてはそのまま運用を継続する。
S
3:予備SRAM31(32)へのwrite/read処理を開始する。
S
4:事象発生のSRAMに対して全アドレス番地へのwrite/read処理を行い、再度のパリティエラー検出を行い、ハードエラーかソフトエラーかの判定を行う。
S
5:パリティエラーがない場合には、ソフトエラーと判定して元のSRAMへ切り戻し、通信を継続する。対応するSRAM31(32)へのwriteはそのまま継続する。
S
6:パリティエラーが検出された場合には、ハードエラーと判定して事象発生のSRAMの電源をOFFにし、予備SRAM31(32)での運用を継続する。
S
7:事象発生のSRAMについて電源をONにしてメモリハードエラーの復旧を試みる。
S
8:メモリハードエラー復旧を試みたSRAM事象発生のSRAMに対して全アドレス番地へのwrite/read処理を行い、再度のパリティエラー検出を行い、ハードエラーかソフトエラーかの判定を行う。
S
9:パリティエラーが検出されない場合には、復旧したSRAMに切り戻して運用を継続する。対応するSRAM31(32)へのwriteはそのまま継続する。
S
10:パリティエラーが検出された場合には、再び、当該SRAMの電源をOFFにし、予備SRAM31(32)での運用を継続する。
【0054】
この場合も事象発生のSRAMに対するメモリハードエラー回復の試みは、自動的に行われるようにプログラムしても良いし、遠隔監視制御装置60により装置管理者が、遠隔操作で手動で行うようにしても良い。
【0055】
また、事象発生のSRAMに対するメモリハードエラー回復の試みは、遠隔監視制御装置11により装置管理者が回復の試みを行わないようにしても良く、装置の稼働閑散期等のタイミングを見計らって回線パッケージを回収して、故障原因を究明するようにしても良い。
【0056】
このように、本発明の実施例2においては、上り方向と下り方向のパケットバッファに対して個別の予備SRAMを設けて、この予備SRAMに対してもパケットを常時書き込んでいるので、メモリハードエラーが発生した場合にも、パケットロスを発生することなく、無瞬断切り替えが可能になる。