(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024096455
(43)【公開日】2024-07-12
(54)【発明の名称】トレース回路、半導体装置、トレーサ、トレースシステム、トレース方法
(51)【国際特許分類】
G06F 11/30 20060101AFI20240705BHJP
G06F 11/36 20060101ALI20240705BHJP
【FI】
G06F11/30 140H
G06F11/36 140
【審査請求】有
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2024077940
(22)【出願日】2024-05-13
(62)【分割の表示】P 2021552457の分割
【原出願日】2020-10-16
(31)【優先権主張番号】P 2019191068
(32)【優先日】2019-10-18
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】000116024
【氏名又は名称】ローム株式会社
(74)【代理人】
【識別番号】110001933
【氏名又は名称】弁理士法人 佐野特許事務所
(72)【発明者】
【氏名】西山 高浩
(57)【要約】
【課題】装置外部でプログラムメモリのリードアドレスを簡易かつ完全にトレースする。
【解決手段】トレース回路120は、mビット(ただし2≦m)のプログラムカウンタ(PC)116を備えたマイクロプロセッサ110とともに半導体装置100に集積化されており、トレースクロック(trace_clk)に同期してトレースデータ(trace_data)を外部出力する。トレース回路120は、プログラムカウンタ116の動作に応じて、外部出力するトレースデータ(trace_data)の出力値を変更させる。
【選択図】
図2
【特許請求の範囲】
【請求項1】
mビット(ただし2≦m)のプログラムカウンタを備えたマイクロプロセッサとともに半導体装置に集積化され、トレースクロックに同期してトレースデータを外部出力するトレース回路であって、
前記プログラムカウンタの動作に応じて、外部出力する前記トレースデータの出力値を変更させるように構成される、トレース回路。
【請求項2】
前記トレースデータは、nビット(ただし2≦n≦m)であるように構成される、請求項1に記載のトレース回路。
【請求項3】
前記プログラムカウンタの不変時には、前記トレースクロックに同期して前記トレースデータを第1出力値とし、
前記プログラムカウンタのインクリメント時には、前記トレースクロックに同期して前記トレースデータを第2出力値とし、
前記プログラムカウンタへのロード時には、前記トレースクロックに同期して前記トレースデータを第3出力値とし、前記マイクロプロセッサのステートマシンを一時停止した上で、前記プログラムカウンタにロードされた分岐先アドレス又は割込先アドレスを前記トレースデータとして分割出力する、
ように構成される、請求項1又は2に記載のトレース回路。
【請求項4】
前記プログラムカウンタの不変時に前記第1出力値となり、前記プログラムカウンタのインクリメント時に前記第2出力値となり、前記プログラムカウンタへのロード時に前記第3出力値となるステータス信号を生成するステータス生成部と、
前記ステータス信号が前記第3出力値となったときに動作を開始し、前記分岐先アドレス又は前記割込先アドレスの分割出力期間が満了したときに動作を停止するカウンタと、
前記カウンタの停止中には前記ステータス信号を前記トレースデータとして選択し、前記カウンタの動作中には前記分岐先アドレス又は前記割込先アドレスの一部を前記トレースデータとして選択するセレクタと、
を備えるように構成される、請求項3に記載のトレース回路。
【請求項5】
請求項1~4のいずれか一項に記載のトレース回路と、
前記マイクロプロセッサと、
を備えるように構成される、半導体装置。
【請求項6】
前記マイクロプロセッサは、前記プログラムカウンタの出力値をリードアドレスとしてプログラムメモリから命令コードを読み出し、その命令コードをデコード及び実行するように構成される、請求項5に記載の半導体装置。
【請求項7】
請求項5又は6に記載の半導体装置から前記トレースクロックと前記トレースデータを受け取り、前記トレースデータを監視し、トレース結果を出力するように構成される、トレーサ。
【請求項8】
請求項4に記載のトレース回路と、前記マイクロプロセッサと、を備えるように構成される半導体装置から前記トレースクロックと前記トレースデータを受け取り、前記トレースデータを監視し、トレース結果を出力するように構成される、トレーサであって、
模擬プログラムカウンタと、
前記トレースデータが前記第1出力値であるときには前記模擬プログラムカウンタを不変とし、前記トレースデータが前記第2出力値であるときには前記模擬プログラムカウンタをインクリメントし、前記トレースデータが前記第3出力値であるときにはこれに引き続いて分割入力される前記分岐先アドレス又は前記割込先アドレスを前記模擬プログラムカウンタに順次格納させるデコーダと、
前記分岐先アドレス又は前記割込先アドレスの分割入力期間を除き、前記トレースクロックに同期して前記模擬プログラムカウンタの出力値を確定値として取り込むラッチと、
前記ラッチに順次取り込まれる前記確定値を前記トレース結果として格納するトレースメモリと、
を備えるように構成される、トレーサ。
【請求項9】
請求項5又は6に記載の半導体装置と、
請求項7又は8に記載のトレーサと、
前記トレース結果の表示、記憶、及び、解析を行うホストと、
を備えるように構成される、トレースシステム。
【請求項10】
トレース動作が開始すると、プログラムカウンタがインクリメントされたか否かの判定を行う第1ステップと、
前記第1ステップにて、ノー判定が下された場合、前記プログラムカウンタが変更されたか否かの判定を行う第2ステップと、
前記第2ステップにて、ノー判定が下された場合、トレースデータを第1出力値とする第3ステップと、
前記第1ステップにて、イエス判定が下された場合、前記トレースデータを第2出力値とする第4ステップと、
前記第2ステップにて、イエス判定が下された場合、前記トレースデータを第3出力値とする第5ステップと、
カウンタによるトレースクロックのパルスカウント動作を開始するとともに、ステートマシンを一時停止状態にする第6ステップと、
前記トレースクロックに同期して、分岐先アドレス又は割込先アドレスの一部を前記トレースデータとして分割出力する第7ステップと、
前記カウンタのカウント値が所定値に達したか否かの判定を行う第8ステップと、
前記第8ステップにて、イエス判定が下された場合、前記カウンタのカウント値を0にリセットし、前記ステートマシンを前記一時停止状態から復帰し、フローを前記第1ステップに戻す第9ステップと、
を備え、
前記第8ステップにて、ノー判定が下された場合、フローを前記第7ステップに戻して一連の動作を繰り返すように構成される、トレース方法。
【請求項11】
トレース動作が開始すると、模擬プログラムカウンタの出力値を初期化する第1ステップと、
入力されたトレースデータが第2出力値であるか否かの判定を行う第2ステップと、
前記第2ステップにて、ノー判定が下された場合、入力された前記トレースデータが第3出力値であるか否かの判定を行う第3ステップと、
前記第3ステップにて、ノー判定が下された場合、入力された前記トレースデータが第1出力値であると判断し、フローを前記第2ステップに戻す第4ステップと、
前記第2ステップにて、イエス判定が下された場合、前記模擬プログラムカウンタをインクリメントし、フローを前記第2ステップに戻す第5ステップと、
前記第3ステップにて、イエス判定が下された場合、前記トレースデータとして分割入力される分岐先アドレス又は割込先アドレスの一部を前記模擬プログラムカウンタの該当ビットに格納する第6ステップと、
前記分岐先アドレス又は前記割込先アドレスの全ビット値が前記模擬プログラムカウンタに格納されたか否かを判定する第7ステップと、
前記第7ステップにて、イエス判定が下された場合、前記模擬プログラムカウンタの出力値を模擬PC確定値として確定し、フローを前記第2ステップに戻す第8ステップと、
前記第7ステップにて、ノー判定が下された場合、フローを前記第6ステップに戻し、前記分岐先アドレス又は前記割込先アドレスの分割入力を継続して一連の動作を繰り返すように構成される、トレース方法。
【発明の詳細な説明】
【技術分野】
【0001】
本明細書中に開示されている発明は、トレース回路に関する。
【背景技術】
【0002】
プログラム動作を行うマイクロプロセッサ(CPU[central processing unit]等)が搭載されているLSIにおいて、LSIの外部からプログラム動作をトレースしたい、すなわち、プログラムがどのように動いたかを知りたい、という要求がある。
【0003】
その理由は、思ったようにプログラムが動いていない不具合の原因を探るためであったり、プログラム動作のテストにおけるコードカバレッジ(全てのコードを網羅したテストとなっているか)を調査するためであったりする。
【0004】
上記の要求に応えるためには、CPUがプログラムメモリ上の命令コードをどのように読み込んでいったかを知る、言い換えれば、CPU内部におけるプログラムメモリのリードアドレスをトレースする必要がある。
【0005】
なお、上記に関連する従来技術の一例としては、特許文献1や特許文献2を挙げることができる。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特許第2727947号明細書
【特許文献2】特許第3775462号明細書
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、特許文献1では、LSIの内部にトレース記憶手段(トレースメモリ)が必要となる。若しくは、LSIの外部にアドレスバス全てを出力する必要がある。
【0008】
また、特許文献2では、分岐命令の実行時に一部の情報しかLSIの外部に出力されないので、LSIの外部で分岐先アドレスの解析が必要になる。そのため、分岐先アドレス候補の中から分岐先アドレスを一つに絞れない場合、トレースが不可能となってしまう。
【0009】
本明細書中に開示されている発明は、本願の発明者により見出された上記課題に鑑み、半導体装置の外部からプログラムメモリのリードアドレスを簡易かつ完全にトレースするためのトレース回路を提供することを目的とする。
【課題を解決するための手段】
【0010】
本明細書中に開示されているトレース回路は、mビットのプログラムカウンタを備えたマイクロプロセッサとともに半導体装置に集積化され、トレースクロックとnビット(ただし2≦n≦m)ビットのトレースデータを外部出力するトレース回路であって、前記プログラムカウンタの不変時には、前記トレースクロックに同期して前記トレースデータを第1出力値とし、前記プログラムカウンタのインクリメント時には、前記トレースクロックに同期して前記トレースデータを第2出力値とし、前記プログラムカウンタへのロード時には、前記トレースクロックに同期して前記トレースデータを第3出力値とし、前記マイクロプロセッサのステートマシンを一時停止した上で、前記プログラムカウンタにロードされた分岐先アドレス又は割込先アドレスを前記トレースデータとして分割出力する構成(第1の構成)とされている。
【0011】
なお、上記第1の構成から成るトレース回路は、前記プログラムカウンタの不変時に前記第1出力値となり、前記プログラムカウンタのインクリメント時に前記第2出力値となり、前記プログラムカウンタへのロード時に前記第3出力値となるステータス信号を生成するステータス生成部と;前記ステータス信号が前記第3出力値となったときに動作を開始し、前記分岐先アドレス又は前記割込先アドレスの分割出力期間が満了したときに動作を停止するカウンタと;前記カウンタの停止中には前記ステータス信号を前記トレースデータとして選択し、前記カウンタの動作中には前記分岐先アドレス又は前記割込先アドレスの一部を前記トレースデータとして選択するセレクタと;を有する構成(第2の構成)にするとよい。
【0012】
また、上記第2の構成から成るトレース回路において、前記ステータス生成部は、前記マイクロプロセッサの内部制御信号を監視して前記ステータス信号を生成する構成(第3の構成)にするとよい。
【0013】
また、第1~第3いずれかの構成から成るトレース回路において、前記トレースクロックは、前記マイクロプロセッサの駆動クロックである構成(第4の構成)にするとよい。
【0014】
また、本明細書中に開示されている半導体装置は、上記第1~第4いずれかの構成から成るトレース回路と;前記プログラムカウンタの出力値をリードアドレスとしてプログラムメモリから命令コードを読み出し、その命令コードをデコード及び実行するマイクロプロセッサと;を集積化して成る構成(第5の構成)とされている。
【0015】
なお、上記第5の構成から成る半導体装置において、前記マイクロプロセッサは、パイプライン構造を持つ構成(第6の構成)にするとよい。
【0016】
また、本明細書中に開示されているトレーサは、上記第5または第6の構成から成る半導体装置に外付けされ、前記トレースクロックに同期して前記トレースデータを監視し、前記プログラムカウンタを模擬することにより、前記リードアドレスのトレース結果を出力する構成(第7の構成)とされている。
【0017】
なお、上記第7の構成から成るトレーサは、模擬プログラムカウンタと;前記トレースデータが前記第1出力値であるときには前記模擬プログラムカウンタを不変とし、前記トレースデータが前記第2出力値であるときには前記模擬プログラムカウンタをインクリメントし、前記トレースデータが前記第3出力値であるときにはこれに引き続いて分割入力される前記分岐先アドレス又は前記割込先アドレスを前記模擬プログラムカウンタに順次格納させるデコーダと;前記分岐先アドレス又は前記割込先アドレスの分割入力期間を除き、前記トレースクロックに同期して前記模擬プログラムカウンタの出力値を確定値として取り込むラッチと;前記ラッチに順次取り込まれる前記確定値を前記トレース結果として格納するトレースメモリと;を有する構成(第8の構成)にするとよい。
【0018】
また、本明細書中に開示されているトレースシステムは、上記第5または第6の構成から成る半導体装置と;上記第7または第8の構成から成るトレーサと;前記トレース結果の表示、記憶、及び、解析を行うホストと;を有する構成(第9の構成)とされている。
【0019】
さらに、本明細書中に開示されているトレースプログラムは、コンピュータ上で実行され、前記コンピュータの入力部、表示部、記憶部、及び、演算部をそれぞれ、前記トレース結果の入力手段、表示手段、記憶手段、及び、解析手段として動作させることにより、上記第9の構成から成るトレースシステムにおける前記ホストとして前記コンピュータを機能させる構成(第10の構成)とされている。
【発明の効果】
【0020】
本明細書中に開示されているトレース回路によれば、半導体装置の外部からプログラムメモリのリードアドレスを簡易かつ完全にトレースすることが可能となる。
【図面の簡単な説明】
【0021】
【
図6】トレース動作(システム全体)の一例を示す図
【発明を実施するための形態】
【0022】
<トレースシステム>
図1は、トレースシステムの全体構成を示す図である。本構成例のトレースシステムXは、LSI100と、トレーサ200と、ホスト300と、を有する。
【0023】
LSI100は、CPU110を搭載する半導体装置の一例である。なお、LSI100は、外部からCPU110のプログラム動作(=プログラムメモリのリードアドレス)を簡易かつ完全にトレースするために、1本のトレースクロックtrace_clkとこれに同期したnビット(例えばn=2)のトレースデータtrace_dataをトレーサ200に外部出力する機能を備えている(詳細は後述)。
【0024】
トレーサ200は、LSI100に外付けされるアダプタ(デバッグツール)の一例であり、トレースクロックtrace_clkに同期してトレースデータtrace_dataを監視し、CPU110内部のプログラムカウンタを模擬することにより、上記したリードアドレスのトレース結果trace_resultを取得してホスト300に出力する(詳細は後述)。なお、トレーサ200とホスト300との通信手段としては、USB[universal serial bus]などを好適に用いることができる。
【0025】
ホスト300は、トレーサ200からトレース結果trace_resultの入力を受け付けて、その表示、記憶、及び、解析などを行う。例えば、パーソナルコンピュータをホスト300として用いる場合には、当該パーソナルコンピュータ上で実行されるトレースプログラム310を用意しておき、パーソナルコンピュータの入力部(USBポートなど)、表示部(LCD[liquid crystal display]など)、記憶部(HDD[hard disc drive]、SSD[solid state drive]など)、及び、演算部(CPU、DSP[digital signal processor]など)を、それぞれ、トレース結果trace_resultの入力手段、表示手段、記憶手段、及び、解析手段として機能させるとよい。
【0026】
なお、上記のトレーサ200及びトレースプログラム310は、LSI100とともに提供されることが望ましい。
【0027】
<LSI>
図2は、LSI100の一構成例を示す図である。本構成例のLSI100には、先出のCPU110とともに、トレース回路120が集積化されている。
【0028】
CPU110は、駆動クロックCLK(例えば100MHz)に同期してプログラム動作を行うマイクロプロセッサの一例であり、ステートマシン111と、デコード/実行部112と、インクリメント部113と、分岐先アドレス格納部114と、セレクタ115と、プログラムカウンタ(PC[program counter])116と、プログラムメモリ117と、を有する。
【0029】
ステートマシン111は、CPU110の状態遷移を司る3ビットの順序回路(論理回路)であり、最大8通りの動作状態state(FETCH、WAIT_KEEP、TRACE、PRE_FETCHなど)を取り得る。TRACEステートは、トレース回路120の実装に伴い新規導入された動作状態stateの一つである。詳細は後述するが、プログラムカウンタ116にロードされた分岐先アドレス又は割込先アドレスをトレース回路120がトレースデータtrace_dataとして分割出力している間、ステートマシン111は、TRACEステートで一時停止される。
【0030】
デコード/実行部112は、プログラムカウンタ116の出力値pc_regをリードアドレスとしてプログラムメモリ117から命令コードを読み出し、その命令コードをデコードして実行する。
【0031】
インクリメント部113は、プログラムカウンタ116の出力値pc_regを所定のインクリメント値だけ増やして出力する。
【0032】
分岐先アドレス格納部114は、プログラムカウンタ116へのロード時において、デコード/実行部112から出力される分岐先アドレス又は割込先アドレスを保持する。
【0033】
セレクタ115は、デコード/実行部112から出力される内部制御信号(例えば、PCロード命令pc_loadとPCインクリメント命令pc_inc)に応じて、インクリメント部113及び分岐先アドレス格納部114いずれか一方の出力をプログラムカウンタ116に選択出力する。
【0034】
例えば、pc_inc=”H”(=PCインクリメント時の論理レベル)であるときには、インクリメント部113の出力がプログラムカウンタ116に選択出力される。その結果、CPU110がパイプライン構造を持つ場合には、命令コードのデコード/実行と並行してプログラムカウンタ116がインクリメントされる。若しくは、CPU110がパイプライン構造を持たない場合には、命令コードのデコード/実行後にプログラムカウンタ116がインクリメントされる。
【0035】
一方、pc_load=”H”(=PCロード時の論理レベル)であるときには、分岐先アドレス格納部114の出力がプログラムカウンタ116に選択出力される。従って、例えば割込命令NMI[non-maskable interrupt]及びIRQ[interrupt request]、ジャンプ命令JMP(絶対/相対)、サブルーチンコール命令CALL、並びに、リターン命令RET及びRETIのいずれかが実行されたことにより、pc_load=”H”となった場合には、プログラムカウンタ116に分岐先アドレス又は割込先アドレスがロードされる。
【0036】
プログラムカウンタ116は、駆動クロックCLKに同期して動作するmビット(例えばm=16)のレジスタである。なお、プログラムカウンタ116の出力値pc_regは、プログラムメモリ117のリードアドレスとして用いられる。
【0037】
プログラムメモリ117は、CPU110の命令コードを格納する記憶手段である。なお、リードアドレス(pc_reg)に応じて読み出された命令コードは、先出のデコード/実行部112でデコード/実行される。
【0038】
トレース回路120は、1本のトレースクロックtrace_clkとこれに同期したnビット(ただし2≦n≦m、例えばn=2)のトレースデータtrace_dataをトレーサ200に外部出力する新規な機能ブロックであり、ステータス生成部121と、カウンタ122と、セレクタ123と、を有する。
【0039】
なお、上記のトレースクロックtrace_clkとしては、CPU110の駆動クロックCLKをそのまま用いればよい。
【0040】
ステータス生成部121は、トレースクロックtrace_clkに同期して動作し、CPU110の内部制御信号(例えばPCロード命令pc_loadとPCインクリメント命令pc_inc)を監視して2ビットのステータス信号statusを生成する。
【0041】
より具体的に述べると、ステータス信号statusは、プログラムカウンタ116の不変時(pc_load=”L”かつpc_inc=”L”)に第1出力値「0d(00b)」となり、プログラムカウンタ116のインクリメント時(pc_inc=”H”)に第2出力値「1d(01b)」となり、プログラムカウンタ116へのロード時(pc_load=”H”)に第3出力値「2d(10b)」となる。ステータス信号statusの第4出力値「3d(11b)」については、リザーブ値(未使用値)としておけばよい。
【0042】
カウンタ122は、4ビットのパルスカウンタである。カウンタ122は、ステータス信号statusが第3出力値「2d(10b)」となったとき、すなわち、プログラムカウンタ116へのロードが発生したときに、トレースクロックtrace_clkのパルスカウント動作を開始する。また、カウンタ122は、そのカウント値trace_countが所定値(例えば8d(1000b))に達したとき、すなわち、分岐先アドレス又は割込先アドレスの分割出力期間(詳細は後述)が満了したときに、パルスカウント動作を停止してカウント値trace_countを0にリセットする。
【0043】
セレクタ123は、カウンタ122の動作状態(カウント値trace_countが0であるか否か)に応じて、ステータス信号statusとプログラムカウンタ116の出力値pc_reg(そのうち最大nビット)の一方を選択し、トレースデータtrace_dataとして出力する。
【0044】
より具体的に述べると、カウンタ122の停止中(trace_count=0)には、ステータス信号statusがトレースデータtrace_dataとして出力される。一方、カウンタ122の動作中(trace_count≠0)には、プログラムカウンタ116の出力値pc_reg(=分岐先アドレス又は割込先アドレスの一部)がトレースデータtrace_dataとして順次出力される。
【0045】
なお、トレースデータtrace_dataとして分岐先アドレス又は割込先アドレスを完全に出力させるためには、カウンタ122の動作中(trace_count≠0)において、CPU110のステートマシン111を一時停止状態(TRACEステート)とすることが望ましい。
【0046】
上記の構成から成るトレース回路120であれば、極めて簡易な回路構成により、プログラムカウンタ116の不変時には、トレースクロックtrace_clkに同期してトレースデータtrace_dataを第1出力値「0d(00b)」とし、プログラムカウンタ116のインクリメント時には、トレースクロックtrace_clkに同期してトレースデータtrace_dataを第2出力値「1d(01b)」とし、プログラムカウンタ116へのロード時には、トレースクロックtrace_clkに同期してトレースデータtrace_dataを第3出力値「2d(10b)」とし、CPU110のステートマシン111を一時停止させた上で、プログラムカウンタ116にロードされた分岐先アドレス又は割込先アドレスをトレースデータtrace_dataとして分割出力することができる。以下、フローチャートを参照しながら詳述する。
【0047】
<トレース動作(LSI側)>
図3は、LSI100(特にトレース回路120)におけるトレース動作の一例を示すフローチャートである。トレース動作が開始すると、ステップS11では、プログラムカウンタ116がインクリメントされたか否か(pc_inc=”H”であるか否か)の判定が行われる。ここで、ノー判定が下された場合には、フローがステップS12に進み、イエス判定が下された場合には、フローがステップS14に進む。
【0048】
ステップS11でノー判定が下された場合、ステップS12では、プログラムカウンタ116が変更(分岐又は割込)されたか否か(pc_load=”H”であるか否か)の判定が行われる。ここで、ノー判定が下された場合には、フローがステップS13に進み、イエス判定が下された場合には、フローがステップS15に進む。
【0049】
ステップS12でノー判定が下された場合には、プログラムカウンタ116が不変であることをトレーサ200に伝える必要がある。そこで、ステップS13では、トレースデータtrace_dataが第1出力値「0d(00b)」とされる。その後、フローは、ステップS11に戻される。
【0050】
一方、ステップS11でイエス判定が下された場合には、プログラムカウンタ116がインクリメントされたことをトレーサ200に伝える必要がある。そこで、ステップS14では、トレースデータtrace_dataが第2出力値「1d(01b)」とされる。その後、フローは、ステップS11に戻される。
【0051】
また、ステップS12でイエス判定が下された場合には、プログラムカウンタ116へのロードが発生したことをトレーサ200に伝える必要がある。そこで、ステップS15では、トレースデータtrace_dataが第3出力値「2d(10b)」とされる。
【0052】
さらに、プログラムカウンタ116へのロード時には、分岐先アドレス又は割込先アドレスをトレーサ200に伝える必要がある。そこで、続くステップS16~S18では、分岐先アドレス又は割込先アドレスの分割出力が行われる。
【0053】
具体的に述べると、まずステップS16では、カウンタ122によるトレースクロックtrace_clkのパルスカウント動作が開始されるとともに、CPU110のステートマシン111が一時停止状態(TRACEステート)とされる。
【0054】
次に、ステップS17では、トレースクロックtrace_clkに同期して、分岐先アドレス又は割込先アドレスの一部がトレースデータtrace_dataとして分割出力される。
【0055】
次に、ステップS18では、カウンタ122のカウント値trace_countが所定値に達したか否か、すなわち、分割出力期間のカウントが満了したか否かの判定が行われる。
【0056】
例えば、プログラムカウンタ116の出力値pc_reg(=分岐先アドレス又は割込先アドレス)が16ビットであり、トレースデータtrace_dataが2ビットである場合には、分岐先アドレス又は割込先アドレスの全ビット値を出力するために、最低8パルスのトレースクロックtrace_clkが必要となる。
【0057】
なお、ステップS18でノー判定が下された場合には、フローがステップS17に戻されて、分岐先アドレス又は割込先アドレスの分割出力が継続される。一方、イエス判定が下された場合には、フローがステップS19に進められる。
【0058】
ステップS19では、カウンタ122のカウント値trace_countが0にリセットされるとともに、CPU110のステートマシン111が一時停止状態(TRACEステート)から復帰される。その後、フローがステップS11に戻されて、上記一連の動作が繰り返される。
【0059】
<トレーサ>
図4は、トレーサ200の一構成例を示す図である。本構成例のトレーサ200は、デコーダ201と、インクリメント部202と、セレクタ203と、模擬プログラムカウンタ204と、ラッチ205と、トレースメモリ206と、を有する。
【0060】
デコーダ201は、トレースクロックtrace_clkに同期してトレースデータtrace_dataを監視し、トレーサ200の各部(セレクタ203やラッチ205など)を制御する。
【0061】
具体的に述べると、デコーダ201は、トレースデータtrace_dataが第1出力値「0d(00b)」であるときには模擬プログラムカウンタ204を不変とし、トレースデータtrace_dataが第2出力値「1d(01b)」であるときには模擬プログラムカウンタ204をインクリメントし、トレースデータtrace_dataが第3出力値「2d(10b)」であるときにはこれに引き続いて分割入力される分岐先アドレス又は割込先アドレスを模擬プログラムカウンタ204に順次格納させるように、セレクタ203を制御する。
【0062】
また、デコーダ201は、トレースデータtrace_dataの監視結果に基づいて確定値取込指示信号fetch_instを生成し、模擬プログラムカウンタ204の出力値pc_countを模擬PC確定値dump_pcとしてラッチ205で取り込むべきか否かを制御する。
【0063】
インクリメント部202は、模擬プログラムカウンタ204の出力値pc_countを所定のインクリメント値だけ増やして出力する。
【0064】
セレクタ203は、トレースデータtrace_data、インクリメント部113の出力値、及び、模擬プログラムカウンタ204の出力値pc_countのうち、いずれか一つを模擬プログラムカウンタ204に選択出力する。
【0065】
より具体的に述べると、トレースデータtrace_dataが第1出力値「0d(00b)」であるときには、模擬プログラムカウンタ204を不変とすべく、模擬プログラムカウンタ204の出力値pc_countが模擬プログラムカウンタ204に選択出力される。なお、模擬プログラムカウンタ204のフェッチ動作を禁止することにより、模擬プログラムカウンタ204を不変としてもよい。
【0066】
一方、トレースデータtrace_dataが第2出力値「1d(01b)」であるときには、模擬プログラムカウンタ204をインクリメントすべく、インクリメント部113の出力値が模擬プログラムカウンタ204に選択出力される。
【0067】
また、トレースデータtrace_dataが第3出力値「2d(10b)」であるときには、これに引き続いて分割入力される分岐先アドレス又は割込先アドレスを模擬プログラムカウンタ204に順次格納させるように、トレースtrace_dataが模擬プログラムカウンタ204に選択出力される。
【0068】
模擬プログラムカウンタ204は、トレースクロックtrace_clkに同期して動作するmビット(例えばm=16)のレジスタであり、CPU110のプログラムカウンタ116を模擬する。
【0069】
ラッチ205は、分岐先アドレス又は割込先アドレスの分割入力期間(詳細は後述)を除き、トレースクロックtrace_clkに同期して模擬プログラムカウンタ204の出力値pc_countを模擬PC確定値dump_pcとして取り込む。なお、ラッチ205の動作可否は、確定値取込指示信号fetch_instに基づいて決定される。より具体的に述べると、fetch_inst=”H”であるときにはラッチ動作が許可される一方、fetch_inst=”L”であるときにはラッチ動作が禁止される。
【0070】
トレースメモリ206は、ラッチ205に順次取り込まれる模擬PC確定値dump_pcをトレース結果trace_resultとして格納する。なお、トレース結果trace_resultの出力動作については、例えば、ホスト300からの要求に応じて随時出力してもよいし、或いは、一定量がバッファされる毎に定期的に出力してもよい。
【0071】
このように、LSI100(特にトレース回路120)から、1本のトレースクロックtrace_clkとこれに同期したnビット(例えばn=2)のトレースデータtrace_dataを外部出力し、LSI100に外付けされたトレーサ200を用いてCPU110のプログラムカウンタ116を模擬する構成であれば、LSI100にトレースメモリを実装せずに済む。従って、LSI100のオーバーヘッドを増すことなく、僅かなピン数でCPU110のプログラム動作(リードアドレス)を簡易かつ完全にトレースすることができる。
【0072】
なお、高速の駆動クロックCLK(例えば100MHz)に同期するCPU110のプログラム動作をトレースするためには、トレースクロックtrace_clk(=駆動クロックCLK)に同期して動作するトレーサ200のハードウェア処理が不可欠であると言える。
【0073】
<トレース動作(トレーサ側)>
図5は、トレーサ200におけるトレース動作の一例を示すフローチャートである。トレース動作が開始すると、ステップS21では、まず模擬プログラムカウンタ204の出力値pc_countが初期化される。
【0074】
例えば、プログラムの先頭からトレースを開始する場合には、通常、プログラムカウンタ116の出力値pc_regが0から始まることから、模擬プログラムカウンタ204の出力値pc_countも0に初期化すればよい。一方、プログラムの途中からトレースを開始する場合には、トレースを始めたいアドレスでプログラム動作に一旦ブレークを掛け、同プログラム動作の再開後にトレースデータを記録すればよいことから、模擬プログラムカウンタ204の出力値pc_countを上記ブレーク時点でのアドレスに初期化すればよい。
【0075】
次に、ステップS22では、LSI100から入力されたトレースデータtrace_dataが第2出力値「1d(01b)」であるか否かの判定が行われる。ここで、ノー判定が下された場合には、フローがステップS23に進み、イエス判定が下された場合には、フローがステップS25に進む。
【0076】
ステップS22でノー判定が下された場合、ステップS23では、LSI100から入力されたトレースデータtrace_dataが第3出力値「2d(10b)」であるか否かの判定が行われる。ここで、ノー判定が下された場合には、フローがステップS24に進み、イエス判定が下された場合には、フローがステップS26に進む。
【0077】
ステップS23でノー判定が下された場合には、LSI100から入力されたトレースデータtrace_dataが第1出力値「0d(00b)」であると考えられる。そこで、ステップS24では、模擬プログラムカウンタ204が不変とされた後、フローがステップS22に戻される。
【0078】
一方、ステップS22でイエス判定が下された場合、ステップS25では、模擬プログラムカウンタ204がインクリメントされた後、フローがステップS22に戻される。
【0079】
また、ステップS23でイエス判定が下された場合には、分岐先アドレス又は割込先アドレスを模擬プログラムカウンタ204にロードする必要がある。そこで、ステップS26及びS27では、分岐先アドレス又は割込先アドレスの分割入力が行われる。
【0080】
具体的に述べると、まずステップS26では、トレースデータtrace_dataとして分割入力される分岐先アドレス又は割込先アドレスの一部(2ビット分)が模擬プログラムカウンタ204の該当ビットに格納される。
【0081】
次に、ステップS27では、分岐先アドレス又は割込先アドレスの全ビット値が模擬プログラムカウンタ204に格納されたか否か、すなわち、分岐先アドレス又は割込先アドレスの分割入力が完了したか否かの判定が行われる。
【0082】
なお、ステップS27でノー判定が下された場合には、フローがステップS26に戻されて、分岐先アドレス又は割込先アドレスの分割入力が継続される。一方、イエス判定が下された場合には、フローがステップS28に進められる。
【0083】
ステップS28では、模擬プログラムカウンタ204の出力値pc_countが模擬PC確定値dump_pcとして確定される。その後、フローがステップS22に戻されて、上記一連の動作が繰り返される。
【0084】
<トレース動作(システム全体)>
図6は、トレースシステムX全体におけるトレース動作の一具体例を示すタイミングチャートであり、上から順に、PCロード命令pc_load、PCインクリメント命令pc_inc、プログラムカウンタ116の出力値pc_reg、トレースクロックtrace_clk、トレースデータtrace_data、カウンタ122のカウント値trace_count、ステートマシン111の動作状態state、模擬プログラムカウンタ204の出力値pc_count、確定値取込指示信号fetch_inst、及び、模擬PC確定値dump_pcが描写されている。
【0085】
なお、
図6では、CPU110が3段のパイプライン構造を持つ場合を想定している。すなわち、CPU110では、一つの命令コードに対する信号処理が3つの単位信号処理(フェッチ(F)、デコード(D)、実行(E))に分解されており、それぞれが独立して同時並列処理される。ただし、パイプライン構造の段数は、2段でもよいし、4段以上でもよい。もちろん、CPU110は、パイプライン構造を持たなくてもよい。
【0086】
また、
図6では、CPU110が8ビットCPUであり、命令コードが16ビット用である場合を想定している。ただし、CPU110のビット数や命令コードのビット数は、これに限定されるものではない。
【0087】
図7は、
図6のトレース動作に供されるプログラムコードの一例(一部抜粋)を示す図である。ここで例示したプログラムコードでは、アドレス0x0000~0x0058それぞれに種々の命令(JMPC、HLT、STR、LDR、SDR、CALL、RET、及び、ORなど)が記載されている。
【0088】
以下では、
図6及び
図7を適宜参照しながら、トレースシステムX全体におけるトレース動作を4つの期間T1~T4に大別してそれぞれ詳細に説明する。
【0089】
まず、期間T1(=時刻t1~t6)に着目する。期間T1では、pc_load=”L”かつpc_inc=”H”となっている。従って、プログラムカウンタ116の出力値pc_regは、トレースクロックtrace_clk(=駆動クロックCLK)に同期して、「+2」ずつインクリメントされていく(0C→0E→10→12→14→16)。
【0090】
なお、プログラムカウンタ116のインクリメント値が「+2」であるのは、CPU110が8ビットCPUであり、命令コードが16ビット用であるため、プログラムメモリ117のリードアドレスが2バイトずつインクリメントされることによる。このように、プログラムカウンタ116のインクリメント値は、CPU110のビット数や命令コードのビット数に応じて決定される。
【0091】
また、先にも述べた通り、CPU110は、3段のパイプライン構造を持つ。従って、例えば、時刻t1でフェッチされたアドレス0x000CのLDR命令は、時刻t2でデコードされ、時刻t3で実行される。その他の命令についても、基本的には上記と同様である。ただし、分岐命令や割込命令の実行により、同時並列的にフェッチないしデコードされていた命令が実行されることなく破棄される場合もある。もちろん、パイプライン構造を持たないCPUやパイプライン段数の深いCPUについては、その限りでない。
【0092】
また、期間T1では、トレースデータtrace_dataが第2出力値「1」(=PCインクリメント)となっている。このとき、カウンタ122が非動作状態(trace_count=0)となり、ステートマシン111の動作状態stateがFETCHステートとなる。
【0093】
また、期間T1では、模擬プログラムカウンタ204の出力値pc_countがプログラムカウンタ116の出力値pc_regから1クロック遅れて「+2」ずつインクリメントされていく(0A→0C→0E→10→12→14)。
【0094】
また、期間T1では、fetch_inst=”H”となっている。従って、模擬PC確定値dump_pcは、模擬プログラムカウンタ204の出力値pc_countから1クロック遅れて「+2」ずつインクリメントされていく(08→0A→0C→0E→10→12)。
【0095】
次に、期間T2(=時刻t6~t8)に着目する。時刻t6において、アドレス0x0012のCALL命令(=サブルーチンを呼び出すための分岐命令)が実行されると、pc_inc=”L”となり、続く時刻t7において、pc_load=”H”となり、さらに続く時刻t8において、分岐先アドレス0x004Cがプログラムカウンタ116の出力値pc_regとしてフェッチされる。このとき、トレースデータtrace_dataは、それまでの第2出力値「1」(=PCインクリメント)から、第1出力値「0」(=PC不変)に切り替わり、続いて第3出力値「2」(=PC変更(分岐))に切り替わる。また、ステートマシン111の動作状態stateは、FETCHステートからWAIT_KEEPステートに切り替わる。
【0096】
また、期間T2では、模擬プログラムカウンタ204の出力値pc_countが不変値(それまでの「14」を保持)となる。さらに、fetch_inst=”L”となるので、模擬PC確定値dump_pcも不変値(それまでの「12」を保持)となる。
【0097】
次に、期間T3(=時刻t8~t16)に着目する。トレースデータtrace_dataが第3出力値「2」(=PC変化(分岐))となった場合には、次サイクルから分岐先アドレス0x004C(=0000 0000 0100 1100)の分割出力が開始される。
【0098】
より具体的に述べると、時刻t8において、カウンタ122のパルスカウント動作(=カウント値trace_countのカウントアップ)が開始され、同パルスカウント動作が継続されている間、トレースクロックtrace_clkに同期して、分岐先アドレス0x004Cが2ビットずつトレースデータtrace_dataとして分割出力される(図中のハッチング領域を参照)。
【0099】
例えば、プログラムカウンタ116の出力値pc_reg(=分岐先アドレス又は割込先アドレス)が16ビットであり、トレースデータtrace_dataが2ビットである場合には、分岐先アドレス又は割込先アドレスの全ビット値を出力するために、最低8パルスのトレースクロックtrace_clkが必要となる。仮に、トレースデータtrace_dataを4ビットに拡張すれば4パルスで済み、8ビットに拡張すれば2パルスで済み、16ビット(すなわちn=m)に拡張すれば1パルスで済む。
【0100】
また、このとき、分岐先アドレス0x004Cの全ビット値を完全に出力するために、ステートマシン111の動作状態stateがTRACEステート(一時停止状態)とされる。
【0101】
一方、模擬プログラムカウンタ204には、トレースデータtrace_dataとして2ビットずつ分割入力される分岐先アドレス0x004Cが順次格納されていく。
【0102】
図8は、分岐先アドレスの分割入力動作を示す図であり、カウンタ122のカウント値trace_counter、模擬プログラムカウンタ204の出力値pc_counter、及び、トレースデータtrace_dataそれぞれの変遷が描写されている。以下、先出の
図6も適宜参照しながら分岐先アドレス0x004C(=0000 0000 0100 1100)の分割入力動作を説明する。
【0103】
trace_counter=「0」では、pc_counter=「0000 0000 0001 0100 (0x0014)」である(
図6の時刻t7を参照)。
【0104】
trace_counter=「1」では、16ビットの分岐先アドレス0x004Cのうち、第1ビット値及び第2ビット値([1:0]=”0d(00b)”)が2ビットのトレースデータtrace_dataとして、模擬プログラムカウンタ204の第1ビット値及び第2ビット値にそれぞれ入力される。その結果、pc_counter=「0000 0000 0001 0100b (0x0014)」となる(
図6の時刻t8を参照)。
【0105】
trace_counter=「2」では、16ビットの分岐先アドレス0x004Cのうち、第3ビット値及び第4ビット値([3:2]=”3d(11b)”)が2ビットのトレースデータtrace_dataとして、模擬プログラムカウンタ204の第3ビット値及び第4ビット値にそれぞれ入力される。その結果、pc_counter=「0000 0000 0001 1100b (0x001C)」となる(
図6の時刻t9を参照)。
【0106】
trace_counter=「3」では、16ビットの分岐先アドレス0x004Cのうち、第5ビット値及び第6ビット値([5:4]=”0d(00b)”)が2ビットのトレースデータtrace_dataとして、模擬プログラムカウンタ204の第5ビット値及び第6ビット値にそれぞれ入力される。その結果、pc_counter=「0000 0000 0000 1100b (0x000C)」となる(
図6の時刻t10を参照)。
【0107】
trace_counter=「4」では、16ビットの分岐先アドレス0x004Cのうち、第7ビット値及び第8ビット値([7:6]=”1d(01b)”)が2ビットのトレースデータtrace_dataとして、模擬プログラムカウンタ204の第7ビット値及び第8ビット値にそれぞれ入力される。その結果、pc_counter=「0000 0000 0100 1100b (0x004C)」となる(
図6の時刻t11を参照)。
【0108】
trace_counter=「5」では、16ビットの分岐先アドレス0x004Cのうち、第9ビット値及び第10ビット値([9:8]=”0d(00b)”)が2ビットのトレースデータtrace_dataとして、模擬プログラムカウンタ204の第9ビット値及び第10ビット値にそれぞれ入力される。その結果、pc_counter=「0000 0000 0100 1100b (0x004C)」となる(
図6の時刻t12を参照)。
【0109】
trace_counter=「6」では、16ビットの分岐先アドレス0x004Cのうち、第11ビット値及び第12ビット値([11:10]=”0d(00b)”)が2ビットのトレースデータtrace_dataとして、模擬プログラムカウンタ204の第11ビット値及び第12ビット値にそれぞれ入力される。その結果、pc_counter=「0000 0000 0100 1100b (0x004C)」となる(
図6の時刻t13を参照)。
【0110】
trace_counter=「7」では、16ビットの分岐先アドレス0x004Cのうち、第13ビット値及び第14ビット値([13:12]=”0d(00b)”)が2ビットのトレースデータtrace_dataとして、模擬プログラムカウンタ204の第13ビット値及び第14ビット値にそれぞれ入力される。その結果、pc_counter=「0000 0000 0100 1100b (0x004C)」となる(
図6の時刻t14を参照)。
【0111】
trace_counter=「8」では、16ビットの分岐先アドレス0x004Cのうち、第15ビット値及び第16ビット値([15:14]=”0d(00b)”)が2ビットのトレースデータtrace_dataとして、模擬プログラムカウンタ204の第15ビット値及び第16ビット値にそれぞれ入力される。その結果、pc_counter=「0000 0000 0100 1100b (0x004C)」となる(
図6の時刻t15を参照)。
【0112】
このように、16ビットの分岐先アドレス0x004Cは、2ビットずつ8回に分けて模擬プログラムカウンタ204に分割入力される。
【0113】
図6に戻り、期間T4(=時刻t16~t19)に着目して、トレース動作の詳細な説明を続ける。
【0114】
時刻t16において、分岐先アドレス0x004Cの分割出力が完了すると、カウンタ122のカウント値trace_countが0に戻り、ステートマシン111がTRACEステート(一時停止状態)からPRE_FETCHステートを経てFETCHステートに復帰する。
【0115】
なお、時刻t16では、分岐先アドレス0x004CのLDR命令がデコードされたことを受けて、pc_inc=”H”となっている。従って、プログラムカウンタ116の出力値pc_regは、次サイクルからトレースクロックtrace_clk(=駆動クロックCLK)に同期して、「+2」ずつインクリメントされていく(4C→4E→50→52→…)。
【0116】
また、期間T4では、トレースデータtrace_dataが第2出力値「1」(=PCインクリメント)となる。従って、模擬プログラムカウンタ204の出力値pc_countは、期間T3で書き込まれた分岐先アドレス0x004Cから「+2」ずつインクリメントされていく(4C→4E→50→…)。
【0117】
また、期間T4では、trace_data=「1」(=PCインクリメント)が2サイクル連続したときにfetch_inst=”H”となり、模擬プログラムカウンタ204の出力値pc_count(=0x004C)が模擬PC確定値dump_pcとしてラッチされる。そして、それ以降、模擬PC確定値dump_pcは、模擬プログラムカウンタ204の出力値pc_countから1クロック遅れて「+2」ずつインクリメントされていく(4C→4E→…)。
【0118】
なお、trace_data=「1」が2サイクル連続したときに模擬プログラムカウンタ204の出力値pc_countを模擬PC確定値dump_pcとして確定させる理由は、CPU110が3段のパイプライン構造を持っており、PCインクリメントが2回連続したときに初めて、読み出された命令コードが実行されるからである。
【0119】
図9は、プログラムコード(
図7)の実行結果を示す図である。本図で示したように、CPU110は、…→0x0008→0x000A→0x000C→0x000E→0x0010→0x0012→0x004C→0x004E→0x0050→…という順に、各アドレスの命令コードを実行していく。
【0120】
一方、模擬PC確定値dump_pcは、先出の
図6で示したように、…→0x0008→0x000A→0x000C→0x000E→0x0010→0x0012→0x004C→0x004E→0x0050→…という順に、その値が変遷していく。すなわち、トレーサ200で得られる模擬PC確定値dump_pcは、上記したプログラムコードの実行結果と完全に一致している。
【0121】
従って、これまでに説明してきたトレーサシステムXによれば、CPU110のプログラム動作を完全に把握することが可能となる。
【0122】
<その他の変形例>
なお、本明細書中に開示されている種々の技術的特徴は、上記実施形態のほか、その技術的創作の主旨を逸脱しない範囲で種々の変更を加えることが可能である。すなわち、上記実施形態は、全ての点で例示であって制限的なものではないと考えられるべきであり、本発明の技術的範囲は、上記実施形態に限定されるものではなく、特許請求の範囲と均等の意味及び範囲内に属する全ての変更が含まれると理解されるべきである。
【産業上の利用可能性】
【0123】
本明細書中に開示されている発明は、例えば、種々の情報処理装置(スマートフォン、ゲーム機器、カーナビゲーションシステムなど)に実装されるマイクロプロセッサのデバッグに利用することが可能である。
【符号の説明】
【0124】
100 LSI(半導体装置)
110 CPU(マイクロプロセッサ)
111 ステートマシン
112 デコード/実行部
113 インクリメント部
114 分岐先アドレス格納部
115 セレクタ
116 プログラムカウンタ
117 プログラムメモリ
120 トレース回路
121 ステータス生成部
122 カウンタ
123 セレクタ
200 トレーサ
201 デコーダ
202 インクリメント部
203 セレクタ
204 模擬プログラムカウンタ
205 ラッチ
206 トレースメモリ
300 ホスト
310 トレースプログラム
X トレースシステム