特開2023-84642 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 東芝メディカルシステムズ株式会社の特許一覧

特開2023-84642医用画像処理装置、および医用情報処理方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023084642

(43)【公開日】2023-06-19

(54)【発明の名称】医用画像処理装置、および医用情報処理方法

(51)【国際特許分類】

G06T 15/00 20110101AFI20230612BHJP

G06T 15/08 20110101ALI20230612BHJP

A61B 6/03 20060101ALI20230612BHJP

【ＦＩ】

G06T15/00 501

G06T15/08

A61B6/03 360G

【審査請求】未請求

【請求項の数】21

【出願形態】ＯＬ

(21)【出願番号】P 2022066769

(22)【出願日】2022-04-14

(31)【優先権主張番号】17/643,031

(32)【優先日】2021-12-07

(33)【優先権主張国・地域又は機関】US

(71)【出願人】

【識別番号】594164542

【氏名又は名称】キヤノンメディカルシステムズ株式会社

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】マグナス・ワレンバーグ

(72)【発明者】

【氏名】スティーブン・レイノルズ

【テーマコード（参考）】

4C093

5B080

【Ｆターム（参考）】

4C093AA26

4C093DA02

4C093FF43

5B080AA17

5B080BA02

5B080CA01

5B080CA04

5B080CA08

5B080DA06

5B080FA02

5B080FA15

5B080GA00

5B080GA11

(57)【要約】

【課題】大域照明（グローバルイルミネーション）を伴うボリュームレンダリングの処理を、低コストかつ高速に実行すること。
【解決手段】本実施形態に係る、医用画像をレンダリングする医用画像処理装置は、仮想メモリに記憶されるデータ構造からの読み出し及びデータ構造への書き込みを行う第１のＧＰＵと第２のＧＰＵとを備える。データ構造は、第１のＧＰＵと第２のＧＰＵとから読み込まれる。データ構造は、第１のＧＰＵがデータ構造の第１のサブスペースに書き込み可能であって、第２のＧＰＵがデータ構造の第２のサブスペースに書き込み可能である。第１のサブスペースと第２のサブスペースとは独立する。第１のＧＰＵは、レンダリングの前処理に関するデータを第１のサブスペースに対して書き込む。第２のＧＰＵは、書き込まれたデータを読み込み、書き込まれたデータに基づいて少なくとも１つの画像をレンダリングする。
【選択図】図２

【特許請求の範囲】

【請求項1】

医用画像をレンダリングする医用画像処理装置であって、
仮想メモリに記憶されるデータ構造からの読み出し及び前記データ構造への書き込みを行う第１のＧＰＵと第２のＧＰＵとを備え、
前記データ構造は、
前記第１のＧＰＵと前記第２のＧＰＵとから読み込み可能であって、
前記第１のＧＰＵが前記データ構造の第１のサブスペースに書き込み可能であって、前記第２のＧＰＵが前記データ構造の第２のサブスペースに書き込み可能であり、
前記第１のサブスペースと前記第２のサブスペースとは独立し、
前記第２のＧＰＵは、レンダリングの前処理に関するデータを前記第２のサブスペースに対して書き込み可能であって、
前記第１のＧＰＵは、前記書き込まれたデータを読み込み、前記書き込まれたデータに基づいて少なくとも１つの画像をレンダリングする、
医用画像処理装置。

【請求項2】

前記データ構造は、前記第１のＧＰＵが前記第２のサブスペースに書き込むことを禁止し、前記第２のＧＰＵが前記第１のサブスペースに書き込むことを禁止するように構成される、
請求項１に記載の医用画像処理装置。

【請求項3】

前記データ構造は、前記第１のＧＰＵの物理メモリ内にデータを格納するため、および前記第２のＧＰＵの物理メモリ内にデータを格納するために構成される、
請求項１または２に記載の医用画像処理装置。

【請求項4】

前記データ構造は、仮想アドレススペースを有し、
前記第１のサブスペースは、前記仮想アドレススペースの第１のサブスペースであり、
前記第２のサブスペースは、前記仮想アドレススペースの第２のサブスペースである、
請求項１に記載の医用画像処理装置。

【請求項5】

前記第１のＧＰＵと前記第２のＧＰＵとの処理回路は、前記第１のＧＰＵと前記第２のＧＰＵとの間で、前記仮想アドレススペースのインデックス構造を同期する、
請求項４に記載の医用画像処理装置。

【請求項6】

前記第２のＧＰＵは、前記前処理を第１のフレームレートで行い、
前記第１のＧＰＵは、前記レンダリングを、前記第１のフレームレートより速い第２のフレームレートで行う、
請求項１に記載の医用画像処理装置。

【請求項7】

前記レンダリングの前処理は、ライティング計算を含む、
請求項１に記載の医用画像処理装置。

【請求項8】

前記ライティング計算は、グローバルイルミネーション処理を含む、
請求項７に記載の医用画像処理装置。

【請求項9】

前記書き込まれたデータは、放射照度データを含む、
請求項１に記載の医用画像処理装置。

【請求項10】

前記放射照度データは、フォトンマップ、放射照度クエリの空間ツリー、密ボリュームのうちの少なくとも１つの一部を含むまたは形成する、
請求項９に記載の医用画像処理装置。

【請求項11】

前記第２のＧＰＵの処理回路は、前記第２のＧＰＵのメモリから前記第１のＧＰＵのメモリへ、前記書き込まれたデータを、仮想メモリページとして転送する、
請求項１に記載の医用画像処理装置。

【請求項12】

前記第２のＧＰＵの前記処理回路は、前記書き込まれたデータが転送可能となることに応じて、前記書き込まれたデータを転送する、
請求項１１に記載の医用画像処理装置。

【請求項13】

前記第１のＧＰＵの処理回路は、
ライティング計算の第１の部分を実行し、
前記ライティング計算の前記第１の部分の結果を前記第１のサブスペースに書き込み、
前記第２のＧＰＵの処理回路は、
前記ライティング計算の第２の部分を実行し、
前記ライティング計算の前記第２の部分の結果を前記第２のサブスペースに書き込み、
前記第１のＧＰＵの処理回路または前記第２のＧＰＵの処理回路は、前記ライティング計算の前記第１の部分の結果を前記ライティング計算の前記第２の部分の結果にマージする、
請求項１に記載の医用画像処理装置。

【請求項14】

前記データ構造に又は前記データ構造からデータが転送されるときに、ブロックアクセス順序は維持される、
請求項１に記載の医用画像処理装置。

【請求項15】

前記第１のＧＰＵと前記第２のＧＰＵとを接続するインターＧＰＵリンクをさらに備え、
前記第２のＧＰＵは、前記書き込まれたデータを前記第１のＧＰＵに前記インターＧＰＵリンクを介して送信する、
請求項１に記載の医用画像処理装置。

【請求項16】

前記書き込まれたデータに基づく前記少なくとも１つの画像の前記レンダリングは、仮想現実（ｖｉｒｔｕａｌｒｅａｌｉｔｙ：ＶＲ）ヘッドセットに表示するための画像をレンダリングすることを含む、
請求項１に記載の医用画像処理装置。

【請求項17】

前記データ構造を読み込む及び書き出すように構成される少なくとも１つの更なるＧＰＵをさらに備え、
前記データ構造は、
前記少なくとも１つの更なるＧＰＵから読み込まれ、
前記少なくとも１つの更なるＧＰＵが前記データ構造の少なくとも１つの更なるサブスペースに書き込み可能である、
請求項１に記載の医用画像処理装置。

【請求項18】

前記データは、医用撮像データを含む、
請求項１に記載の医用画像処理装置。

【請求項19】

医用画像をレンダリングする医用画像処理方法であって、
第１のＧＰＵと第２のＧＰＵとのそれぞれにより、仮想メモリに記憶されるデータ構造から個別のデータを読み出し、
前記第１のＧＰＵと前記第２のＧＰＵとのそれぞれにより、個別のデータを前記データ構造へ書き込むことを含み、
前記データ構造は、
前記第１のＧＰＵと前記第２のＧＰＵとから読み込まれ、
前記第１のＧＰＵが前記データ構造の第１のサブスペースに書き込み可能であって、前記第２のＧＰＵが前記データ構造の第２のサブスペースに書き込み可能であり、
前記第１のサブスペースと前記第２のサブスペースとは独立し、
前記第２のＧＰＵは、レンダリングの前処理に関するデータを前記第２のサブスペースに対して書き込み、
前記第１のＧＰＵは、前記書き込まれたデータを読み込み、前記書き込まれたデータに基づいて少なくとも１つの画像をレンダリングする、
医用画像処理方法。

【請求項20】

医用画像をレンダリングする医用画像処理装置であって、
仮想メモリに記憶されるデータ構造からの読み出し及び前記データ構造への書き込みを行うマルチカーネルＧＰＵを備え、
前記データ構造は、
前記マルチカーネルＧＰＵの第１のカーネルと前記マルチカーネルＧＰＵの第２のカーネルとから読み込まれ、
前記第１のカーネルが前記データ構造の第１のサブスペースに書き込み可能であって、前記第２のカーネルが前記データ構造の第２のサブスペースに書き込み可能であり、
前記第１のサブスペースと前記第２のサブスペースとは独立し、
前記第２のカーネルは、レンダリングの前処理に関するデータを前記第２のサブスペースに対して書き込み、
前記第１のカーネルは、前記書き込まれたデータを読み込み、前記書き込まれたデータに基づいて少なくとも１つの画像をレンダリングする、
医用画像処理装置。

【請求項21】

ライティング計算およびレンダリング計算は、最後のライティング計算からの経過時間に基づく重み付け方法を用いて、前記第１のカーネルと前記第２のカーネルとに割り当てられる、
請求項２０に記載の医用画像処理装置。

【発明の詳細な説明】

【技術分野】

【0001】

本明細書に記載の実施形態は、概して、例えば、１つ又は複数のグラフィックスプロセッシングユニット（ｇｒａｐｈｉｃｓｐｒｏｃｅｓｓｉｎｇｕｎｉｔ：ＧＰＵ）を用いてデータを処理するなどのデータを処理するための医用画像処理方法と医用画像処理装置に関する。

【背景技術】

【0002】

例えばボリューメトリック医用撮像データなどのボリューメトリック撮像データから、画像をレンダリングすることが知られている。ボリューメトリック撮像データセットは、画像ボリュームと称されることがある。ボリューメトリック撮像データセットは、関連するボクセル値を有する複数のボクセルであって、それぞれが医用撮像スキャン内の対応する空間ロケーションを表すボクセルを備えてよい。例えばコンピュータ断層撮影（ｃｏｍｐｕｔｅｄｔｏｍｏｇｒａｐｈｙ：ＣＴ）データの場合、各ボクセルに関連するボクセル値は、当該ボクセルにより表されるロケーションに照射されるＸ線放射の減衰を表すボクセル強度値であってよい。

【0003】

３次元（３Ｄ）撮像データをレンダリングして、３次元に見えるレンダリング画像を生成することが知られている。４次元（４Ｄ）撮像システムでは、異なる時間で得られた一連の３次元画像を動的にレンダリングし、例えば３Ｄ超音波動画などの動く３Ｄ画像を生成することがある。

【0004】

３Ｄまたは４Ｄ画像の対象が所与の位置および／または方向から照明されて見えるように、３Ｄまたは４Ｄ画像にライティング（Ｌｉｇｈｔｉｎｇ：照明）効果を与えてもよい。近年、以前用いられていたものよりも物理的精度が高いモデルで照明をシミュレートする高度なライティング技術（グローバルイルミネーション、勾配フリーライティング（ｇｒａｄｉｅｎｔｆｒｅｅｌｉｇｈｔｉｎｇ）、サブサーフェス・スキャタリング、またはフォトンマッピングと称される）の使用により、３Ｄおよび４Ｄ医用画像がより写実的になっている。グローバルイルミネーションでは、光源から直接来る光による直接照明と、例えば別の表面から散乱された光による照明などの間接照明の両方を含むライティングモデルを使用してよい。

【0005】

いくつかのグローバルイルミネーション・レンダリング方法では、第１パスで光ボリュームを生成し、表示用画像をレンダリングするために第２パスで当該光ボリュームを使用するツーパス（ｔｗｏ－ｐａｓｓ）法を用いて、ボリューメトリック撮像データセットから画像をレンダリングする。

【0006】

第１パスは、光源からボリューメトリック撮像データセットへのトラバーサルを含んでよく、垂直光が当該ボリューメトリック撮像データセットに放射される。光源による放射照度を、ボリューメトリック画像データセットの大規模ポイントアレイの各ポイントで、当該ボクセルに割り当てられた吸収特性を用いて、当該ボクセル強度に依存して決定してよい。ポイントアレイでの放射照度値を、光ボリュームとして記憶してよい。光ボリュームをメモリに記憶してよい。光ボリュームは視点から独立してよい。

【0007】

第２のパスは、仮想カメラから光ボリュームを通過するトラバーサルを含み、グローバルライティング情報を提供するために光ボリュームを用いてよい。仮想カメラから光線が放射され（例えば、結果として生じるレンダリング画像の各ピクセルにつき１光線）、各光線に沿うポイントからの放射照度を統合して、最終レンダリング画像の画素色値を提供してよい。

【0008】

グローバルイルミネーション（Ｇｌｏｂａｌｉｌｌｕｍｉｎａｔｉｏｎ：ＧＩ）は、評判が高まりつつあり、超音波においてユビキタスであると考えられ得る。グローバルイルミネーションは、産科領域においてニッチな市場を占めると以前は考えられていたが、現在では広範囲のアプリケーションで用いられている。例えば、グローバルイルミネーションは心臓、放射線、または血管撮像に用いられることがある。グローバルイルミネーションは、３次元のドップラー撮像に用いられることがある。また、例えばコンピュータ断層撮影（ｃｏｍｐｕｔｅｄｔｏｍｏｇｒａｐｈｙ：ＣＴ）や磁気共鳴（ｍａｇｎｅｔｉｃｒｅｓｏｎａｎｃｅ：ＭＲ）撮影など他のモダリティへのグローバルイルミネーションの使用についても関心が集まっている。

【0009】

仮想現実（ｖｉｒｔｕａｌｒｅａｌｉｔｙ：ＶＲ）を含む広範囲のアプリケーションへのグローバルイルミネーションの使用に関心が集まっている。ＶＲでは、視聴者の片目にそれぞれ対応する２つのビューが、フレームごとにレンダリングされる。ビューのレンダリングに用いられる視点は、視聴者の頭部位置に依存する。視聴者の頭部位置は、フレーム間でしばしば移動するだろう。

【0010】

見た目を滑らかにするために、１秒当たり６０から９０フレーム（ｆｒａｍｅｓｐｅｒｓｅｃｏｎｄ：ｆｐｓ）のフレームレートがビューごとに使用されるだろう。遅延を最小化するように、フレームレートを選択してよい。表示画像がユーザの頭部の動作から遅れたときに生じ得るラグを回避するように、フレームレートを選択してよい。

【0011】

ＶＲに用いられるフレームレートは、４次元撮像に典型的に用いられるフレームレートよりも高いだろう。例えば、スクリーンに表示される動画は、ＶＲで使用される６０から９０ｆｐｓのフレームレートではなく、２０から３０ｆｐｓのフレームレートで表示されるだろう。

【0012】

高フレームレートであるため、ＶＲはレンダリングに関して、とりわけグローバルイルミネーションに関して、厳しい用途であると考えられるだろう。複雑な光効果の決定には、ライティングへの単純なアプローチと比べて、追加的な処理能力が必要になるだろう。

【0013】

いくつかの状況では、選択されたフレームレートでグローバルイルミネーションを使用するＶＲ画像のレンダリングは、単一のグラフィックスプロセッシングユニット（ｇｒａｐｈｉｃｓｐｒｏｃｅｓｓｉｎｇｕｎｉｔ：ＧＰＵ）の実行能力を超えることがある。

【先行技術文献】

【非特許文献】

【0014】

【非特許文献1】ＭａｒｋＨａｒｒｉｓ、ＵｎｉｆｉｅｄＭｅｍｏｒｙｆｏｒＣＵＤＡＢｅｇｉｎｎｅｒｓ、［ｏｎｌｉｎｅ］、２０１７年６月１９日、［２０２１年４月６日検索］、インターネット＜ＵＲＬ：ｈｔｔｐｓ：／／ｄｅｖｅｌｏｐｅｒ．ｎｖｉｄｉａ．ｃｏｍ／ｂｌｏｇ／ｕｎｉｆｉｅｄ－ｍｅｍｏｒｙ－ｃｕｄａ－ｂｅｇｉｎｎｅｒｓ／＞

【発明の概要】

【発明が解決しようとする課題】

【0015】

本明細書及び図面に開示の実施形態が解決しようとする課題の一つは、大域照明（グローバルイルミネーション）を伴うボリュームレンダリングの処理を、低コストかつ高速に実行することにある。ただし、本明細書及び図面に開示の実施形態により解決しようとする課題は上記課題に限られない。後述する実施形態に示す各構成による各効果に対応する課題を他の課題として位置づけることもできる。

【課題を解決するための手段】

【0016】

本実施形態に係る医用画像処理装置は、医用画像をレンダリングする。医用画像処理装置は、仮想メモリに記憶されるデータ構造からの読み出し及び前記データ構造への書き込みを行う第１のＧＰＵと第２のＧＰＵとを備える。前記データ構造は、前記第１のＧＰＵと前記第２のＧＰＵとから読み込まれる。前記データ構造は、前記第１のＧＰＵが前記データ構造の第１のサブスペースに書き込み可能であって、前記第２のＧＰＵが前記データ構造の第２のサブスペースに書き込み可能である。前記第１のサブスペースと前記第２のサブスペースとは独立している。前記第２のＧＰＵは、レンダリングの前処理に関するデータを前記第２のサブスペースに対して書き込む。前記第１のＧＰＵは、前記書き込まれたデータを読み込み、前記書き込まれたデータに基づいて少なくとも１つの画像をレンダリングする。前記サブスペースは、前記仮想メモリにおける仮想アドレススペース（仮想アドレス空間）に対応する。前記第１のサブスペースと前記第２のサブスペースとの独立は、書き込みのアクセスが排他的に機能することにある。

【図面の簡単な説明】

【0017】

【図1】図１は、実施形態に従った医用撮像装置の概略図である。

【図2】図２は、実施形態の比較例に係り、単一のＧＰＵにより実行されるライティング及びレンダリング処理の概略図である。

【図3】図３は、実施形態の比較例に係り、単一のＧＰＵによりアクセスされるデータ構造の概略図である。

【図4】図４は、実施形態に従ったデータ構造の概略図であり、当該データ構造は少なくとも２つのＧＰＵによりアクセスされる概略図である。

【図5】図５は、実施形態に従った２つのＧＰＵにより実行されるライティング及びレンダリング処理の概略図である。

【図6】図６は、１つＧＰＵが光シミュレーションを行い、もう１つのＧＰＵが画像をレンダリングする実施形態の方法の概略を示すフローチャートである。

【図7】図７は、ライティング計算が２つのＧＰＵで共有される実施形態の方法の概略を示すフローチャートである。

【図8】図８は、ＧＰＵの第１のカーネルによりレンダリングが行われ、同一ＧＰＵの第２のカーネルにより光シミュレーションが行われる実施形態の方法の概略を示すフローチャートである。

【発明を実施するための形態】

【0018】

ある実施形態は、仮想メモリに記憶されるデータ構造からの読み出し及び前記データ構造への書き込みを行うようにそれぞれ構成される第１のＧＰＵと第２のＧＰＵとを備えた、医用画像をレンダリングする医用画像処理装置を提供する。前記データ構造は前記第１のＧＰＵと前記第２のＧＰＵとから読み込まれるように構成される。前記データ構造は、前記第１のＧＰＵが前記データ構造の第１のサブスペースに書き込み可能であり、前記第２のＧＰＵが前記データ構造の第２のサブスペースに書き込み可能であるように構成される。前記第１のサブスペースと前記第２のサブスペースとは独立している。前記第１のＧＰＵは、レンダリングの前処理に関するデータを前記第１のサブスペースに対して書き込むように構成される。前記第２のＧＰＵは、前記書き込まれたデータを読み込み、前記書き込まれたデータに基づいて少なくとも１つの画像をレンダリングするように構成される。

【0019】

ある実施形態は、第１のＧＰＵと第２のＧＰＵのそれぞれにより仮想メモリに記憶されるデータ構造から個別のデータを読み出すこと、及び、第１のＧＰＵと第２のＧＰＵのそれぞれにより個別のデータを前記データ構造へ書き込むこと、を含む医用画像をレンダリングする医用画像処理方法を提供する。前記データ構造は前記第１のＧＰＵと前記第２のＧＰＵとから読み込まれるように構成される。前記データ構造は、前記第１のＧＰＵが前記データ構造の第１のサブスペースに書き込み可能であり、前記第２のＧＰＵが前記データ構造の第２のサブスペースに書き込み可能であるように構成される。前記第１のサブスペースと前記第２のサブスペースとは独立している。前記第１のＧＰＵは、レンダリングの前処理に関するデータを前記第１のサブスペースに対して書き込むように構成される。前記第２のＧＰＵは、前記書き込まれたデータを読み込み、前記書き込まれたデータに基づいて少なくとも１つの画像をレンダリングするように構成される。

【0020】

ある実施形態は、仮想メモリに記憶されるデータ構造からの読み出し及び前記データ構造への書き込みを行うように構成されるマルチカーネルＧＰＵを備えた、医用画像をレンダリングする医用画像処理装置を提供する。前記データ構造は、前記ＧＰＵの第１のカーネルと第２のカーネルとから読み込まれるように構成される。前記データ構造は、前記第１のカーネルが前記データ構造の第１のサブスペースに書き込み可能であり、前記第２のカーネルが前記データ構造の第２のサブスペースに書き込み可能であるように構成される。前記第１のサブスペースと前記第２のサブスペースとは独立している。前記第１のカーネルは、レンダリングの前処理に関するデータを前記第１のサブスペースに対して書き込むように構成される。前記第２のカーネルは、前記書き込まれたデータを読み込み、前記書き込まれたデータに基づいて少なくとも１つの画像をレンダリングするように構成される。

【0021】

実施形態に従った装置１０が、図１に概略的に示される。装置１０は、１つまたは複数の医用撮像スキャナ１４により取得された撮像データのボリュームレンダリングを行うように構成される。すなわち、図１に示す装置１０は、医用画像をレンダリングする医用画像処理装置に相当する。医用撮像スキャナ１４は、コンピュータ断層撮影（ｃｏｍｐｕｔｅｄｔｏｍｏｇｒａｐｈｙ：ＣＴ）スキャナ、磁気共鳴（ｍａｇｎｅｔｉｃｒｅｓｏｎａｎｃｅｉｍａｇｉｎｇ：ＭＲＩ）スキャナ、Ｘ線スキャナ、陽電子放出断層撮影（ｐｏｓｉｔｒｏｎｅｍｉｓｓｉｏｎｔｏｍｏｇｒａｐｈｙ：ＰＥＴ）スキャナ、単一光子放射コンピュータ断層撮影（ｓｉｎｇｌｅｐｈｏｔｏｎｅｍｉｓｓｉｏｎｃｏｍｐｕｔｅｄｔｏｍｏｇｒａｐｈｙ：ＳＰＥＣＴ）スキャナ、または超音波スキャナ、または任意の好適なスキャナのうちの少なくとも１つを含んでよい。図１の実施形態では、当該レンダリングは、ＶＲヘッドセット１５上のディスプレイ用画像のレンダリングである。

【0022】

装置１０は、本例ではパーソナルコンピュータ（ＰＣ）またはワークステーションであるコンピューティング装置１２を備える。他の実施形態では、コンピューティング装置１２は、例えばサーバ、デスクトップコンピュータ、ラップトップコンピュータ、またはモバイルデバイスなどの任意の好適なコンピューティング装置であってよい。更なる実施形態では、コンピューティング装置１２の機能が、２つ以上のコンピューティング装置により提供されてよい。

【0023】

コンピューティング装置１２は、１つまたは複数のスキャナ１４に、データ記憶部２０を介して接続される。

【0024】

コンピューティング装置１２は、ＶＲヘッドセット１５と、分離したディスプレイスクリーン１６とに接続される。他の実施形態では、ＶＲヘッドセット１５および／またはディスプレイスクリーン１６に加えて、または、それらの代わりに、任意の好適な１つまたは複数のディスプレイ装置を用いてよい。

【0025】

コンピューティング装置は、コンピュータキーボード、マウス、またはハンドコントローラなどの１つまたは複数の入力装置１８に接続される。代替となる実施形態では、ディスプレイスクリーン１６は、入力装置１８としても機能するタッチスクリーンである。

【0026】

本実施形態では、コンピューティング装置１２は、処理対象の医用撮像データをデータ記憶部２０から受け取るように構成される。データ記憶部は、医用撮像スキャナ１４または複数のスキャナにより取得されたデータを記憶する。すなわち、医用画像処理装置１０において用いられるデータは、医用撮像スキャナ１４または複数のスキャナにより取得された医用撮像データを含む。

【0027】

代替となる実施形態において、コンピューティング装置１２は、データ記憶部２０の代わりに、または、それに加えて、１つまたは複数の更なるデータ記憶部（図示しない）からデータを受け取る。例えば、コンピューティング装置１２は、医用画像保管伝送システム（ＰｉｃｔｕｒｅＡｒｃｈｉｖｉｎｇａｎｄＣｏｍｍｕｎｉｃａｔｉｏｎＳｙｓｔｅｍ：ＰＡＣＳ）または臨床検査値アーカイブ、電子医療記録（ＥｌｅｃｔｒｏｎｉｃＭｅｄｉｃａｌＲｅｃｏｒｄ：ＥＭＲ）システムまたは入退院転院（ＡｄｍｉｓｓｉｏｎＤｉｓｃｈａｒｇｅａｎｄＴｒａｎｓｆｅｒ：ＡＤＴ）システムなどの他の情報システムの一部を形成し得る１つまたは複数の遠隔のデータ記憶部（図示しない）から医用画像データを受け取ってよい。

【0028】

更なる実施形態では、コンピューティング装置１２はスキャナ１４に接続されていない。コンピューティング装置１２は、以前に取得した医用撮像データを、任意の好適なデータ記憶部から受け取ってよい。

【0029】

コンピューティング装置１２は、中央演算処理装置（ｃｅｎｔｒａｌｐｒｏｃｅｓｓｉｎｇｕｎｉｔ：ＣＰＵ）２２と、２つのグラフィックスプロセッシングユニット（ｇｒａｐｈｉｃｓｐｒｏｃｅｓｓｉｎｇｕｎｉｔｓ：（ＧＰＵ）であるＧＰＵ０とＧＰＵ１を備える。他の実施形態では、コンピューティング装置１２は、例えば３，４，５，６つのＧＰＵなど、任意の好適な数のＧＰＵを備えてよい。ＧＰＵ０，１はそれぞれ、ライティング計算およびレンダリング計算を含む画像処理操作を行うように構成される処理回路（図１には示さない）を備える。ＣＰＵ２２とＧＰＵは、自動的にまたは半自動的に医用撮像データを処理するための処理リソースを共に与える。

【0030】

ＣＰＵ２２は、メモリ２４と、ライティング計算を制御するためのライティング制御回路（ライティング制御部）２６と、レンダリングを制御するためのレンダリング制御回路（レンダリング制御部）２８と、レンダリング画像をＶＲヘッドセット１５に表示するための表示回路（表示部）２９と、を備える。ＣＰＵ２２の回路は、例えば１００ＧＢ／ｓ付近のレートでデータを送信するように構成されるメモリバス（図示しない）を介して、メモリ２４から及びメモリ２４へデータを転送してよい。メモリ２４からのデータ読み出し及びメモリ２４へのデータ書き込みを制御するために、メモリコントローラ（図示しない）を使用してよい。他の実施形態では、装置１０は、それぞれが個別のメモリを有する複数のＣＰＵを備えてよい。

【0031】

本実施形態では、回路２６，２８，２９は、各々、実施形態の方法を実行するために実行可能であるコンピュータが読み出し可能な命令を有するコンピュータプログラムにより、コンピューティング装置１２に実装される。しかし、他の実施形態では、種々の回路が、１つまたは複数の特定用途向け集積回路（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ：ＡＳＩＣ）またはフィールドプログラマブルゲートアレイ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ：ＦＰＧＡ）として実装されてよい。更なる実施形態では、任意の好適なＣＰＵコンポーネントおよび／またはＧＰＵコンポーネントを、１つ又は複数のＡＳＩＣまたはＦＰＧＡとして実装してよい。

【0032】

各ＧＰＵは、個別のＧＰＵメモリを備える。ＧＰＵ０はＧＰＵメモリ３０を、ＧＰＵ１はＧＰＵメモリ３１を備える。バス１９は、ＧＰＵ０とＧＰＵ１とを接続する。例えば、バス１９は１００ＧＢ／ｓのＮＶＬｉｎｋバスであってよい。バス１９は、ＧＰＵ０とＧＰＵ１の間のデータ転送を容易にする。他の実施形態では、ＧＰＵ０とＧＰＵ１とを任意の好適な方法で接続してよい。

【0033】

ＧＰＵ０，１は、例えばＰＣＩ－ｅバスなどの周辺機器用バス（図示しない）でＣＰＵ２２に接続される。周辺機器用バスは、例えば１０から６４ＧＢ／ｓ付近でデータを転送するように構成されてよい。周辺機器用バスは共有バスであってよく、ＧＰＵ０，１の両方が同一バスを介して通信し、当該共有バスのデータ転送容量を共有してよい。

【0034】

また、コンピューティング装置１２は、ハードドライブと、ＲＡＭ、ＲＯＭ、１つまたは複数の更なるデータバス、種々のデバイスドライバを含むオペレーティングシステム、および、グラフィックカードを含むハードウェア装置を含んだＰＣの他のコンポーネントとを有する。その様なコンポーネントは、明瞭化のために、図１には示されない。

【0035】

図２は、実施形態の比較例に係り、単一のＧＰＵ、例えばＧＰＵ０により実行されるレンダリング処理の一例を概略的に示す。図２のレンダリング処理では、ライティング計算がレンダリング計算よりも低いレートで行われる。

【0036】

図２のステージ４０では、ライティング制御回路２６は、患者の医用撮像スキャンから得られるボリューメトリック撮像データセットで第１の光シミュレーションを行うように、ＧＰＵ０に命令する。当該ボリューメトリック撮像データセットは、ボクセルアレイを有する。当該ボクセルアレイは、当該患者の３次元領域の一部または全てに対応する３次元のボリュームを表す。各ボクセルは、ボリューメトリック撮像データセットの座標スペースにおける位置と、関連する信号強度とを有する。

【0037】

ステージ４０の第１の光シミュレーションでは、複数の仮想光源からの光をシミュレートする。各仮想光源の位置は、ボリューメトリック撮像データセットの座標スペースに対して定義される。いくつかの実施形態では、仮想光源のうちの１つまたは複数の光源の位置が、ＶＲヘッドセット１５の位置に関してよい。例えば、仮想光源は、ヘッドセットのユーザの視点に取り付けられているようにみえる位置であってよい。当該１つまたは複数の仮想光源の位置は、ＶＲヘッドセットの位置に基づいて、任意の好適な方法で定義されてよい。

【0038】

いくつかの実施形態では、仮想光源のうちの１つまたは複数の光源の位置は、例えばハンドコントローラなどのコントローラの位置に関してよい。

【0039】

第１の光シミュレーションは、各光源からボリューメトリック撮像データセットのボリュームを通る光線を放射することを含む。仮想光源からシミュレートされた光線のそれぞれは、光線のパスに沿って仮想光エネルギーを当該ボリュームに分配する。光線ごとに、当該光線による放射照度が、当該光線に沿った一連のサンプルポイントそれぞれで計算される。各サンプルポイントにおける放射照度は、当該サンプルポイント到着時の当該光線の仮想光エネルギーと、当該サンプルポイントでの吸収関数との積である。サンプルポイントでの放射照度は、任意の好適な方法を用いて、複数の近隣ボクセルに分配される。第１の光シミュレーションは、追加して、ダイレクトイルミネーションと同様に散乱および／または反射をシミュレートしてよい。

【0040】

ステージ４０の第１の光シミュレーションの出力は、放射照度ボリュームである。放射照度ボリュームは、ボリューメトリック撮像データセットの座標スペース内のボクセルセットの各ボクセルにおける個別の放射照度値を含む。各ボクセルの関連放射照度は、当該ポイントに近いサンプルポイントで堆積された仮想光エネルギーを有する複数の光線からの放射照度コントリビューションの組み合わせであってよい。

【0041】

放射照度ボリュームは、読み書きデータ構造５０に記憶される。図２の方法では、読み書きデータ構造５０は、ＧＰＵ０のメモリ３０において実装される。

【0042】

ステージ４２では、レンダリング制御回路２８は、ボリューメトリック撮像データセットとステージ４０で得た放射照度ボリュームを用いて第１の画像レンダーを行うように、ＧＰＵ０に命令する。第１の画像レンダーで用いられる視点位置と方向は、第１の時点でのＶＲヘッドセット１５の位置に基づいて決定される。ＶＲヘッドセット１５の位置は、例えば、ＶＲヘッドセット１５上および／またはＶＲヘッドセット１５の周辺環境に位置する複数のセンサーからの信号を処理するなど、任意の好適な方法で決定されてよい。

【0043】

画像は、ＶＲヘッドセット１５の各スクリーンから見ているようにレンダリングされる。ＶＲヘッドセット１５は２つのスクリーンを有し、ＶＲヘッドセットの装着者の片目にスクリーンの１つが対応する。光線は、ボリューメトリック撮像データセットにより表されるボリュームに放射される。各光線は、レンダリングにより得られる２次元画像データセットの１画素に対応してよい。カメラから放射される所与の光線において、放射照度値は、光線に沿った一連のインクリメンタルポイントのそれぞれで、当該放射照度ボリュームの近隣ボクセルから補間放射照度を読み取って決定される。放射照度値は、読み書きデータ構造５０からデータを読み込んで得られる。

【0044】

光線に沿った各インクリメンタルポイントでの放射照度を統合して、当該光線の画素色値を得る。これにより、レンダリング制御回路２８は、ＶＲヘッドセット１５の各スクリーン用の個別の２次元画像データセット内の各画素の色値を決定する。

【0045】

第１の画像レンダーの出力は、一対の第１のレンダリング画像である。各レンダリング画像を表すデータが記憶される。各レンダリング画像を表すデータは、放射照度データとは別に記憶され、データ構造５０には記憶されない。表示回路２９は、レンダリング画像をＶＲヘッドセット１５上に表示するように命令する。

【0046】

ステージ４４では、レンダリング制御回路２８は、ボリューメトリック撮像データセットとステージ４０で得た放射照度ボリュームを用いて第２の画像レンダーを行うように、ＧＰＵ０に命令する。第２の画像レンダーで用いられる視点位置と方向は、第１の時点よりも遅い第２の時点でのＶＲヘッドセット１５の位置に基づいて決定される。視点位置と方向は、例えばＶＲヘッドセット１５の動作のため、第１の時点と第２の時点の間に変化してもよいし。レンダリングは、ステージ４２を参照して上述したように行われる。第２の画像レンダーの出力は一対の第２のレンダリング画像であり、これらは記憶され、表示回路２９によりＶＲヘッドセット１５上に表示される。

【0047】

ステージ４６では、レンダリング制御回路２８は、ボリューメトリック撮像データセットとステージ４０で得た放射照度ボリュームを用いて第３の画像レンダーを行うように、ＧＰＵ０に命令する。第３の画像レンダーで用いられる視点位置と方向は、第２の時点よりも遅い第３の時点でのＶＲヘッドセット１５の位置に基づいて決定される。視点位置と方向は、例えばＶＲヘッドセット１５の動作のため、第２の時点と第３の時点の間に変化してもよい。レンダリングは、ステージ４２を参照して上述したように行われる。第３の画像レンダーの出力は一対の第３のレンダリング画像であり、これらは記憶され、表示回路２９によりＶＲヘッドセット１５上に表示される。

【0048】

なお、使用される放射照度ボリュームは、第１画像レンダーと第３画像レンダーの間で変化しない。複数の画像レンダーにライティングを提供するために、単一の光シミュレーション処理が用いられる。

【0049】

ステージ４８では、ライティング制御回路２６は、ボリューメトリック撮像データセットで第２の光シミュレーションを行うよう、ＧＰＵ０に命令する。仮想光源の位置は、第１の光シミュレーションと第２の光シミュレーションとの間で移動していてもよい。例えば、仮想光源を視点と同一のインターアクティビティで、例えばＶＲヘッドセット１５の動作に応じて頻繁に移動してよい。仮想光源の位置は、ハンドコントローラに関連してよい。他のシナリオでは、仮想光源を静止させボリュームを動かしてもよい。

【0050】

ステージ４８の出力は、更新された放射照度ボリュームである。更新された放射照度ボリュームでは、読み書きデータ構造５０に記憶される。例えば、更新された放射照度ボリュームのデータは、ステージ４０で得た放射照度ボリュームのデータの一部または全てに対して上書きしてよい。

【0051】

ＧＰＵ０は、更新された放射照度ボリュームを用いて、後続のフレームをレンダリングする（後続レンダーは図２に示されない）。ＧＰＵ０は、ライティング計算よりレンダリング計算を多く行うように、ライティング計算とレンダリング計算を交互に行い続ける。ライティングは、画像レンダリングよりも低いレートで更新される。

【0052】

一般に、画像レンダリングよりもライティングの更新が遅いことに、視聴者は気が付かないだろう。しかし、図２の方法では、ライティングシミュレーションのステージを含有することで画像レンダリングに遅延が生じ、画像レンダリングは一貫したフレームレートで行われない。連続してレンダーが行われる間は、画像レンダリングは安定したレートで進むだろう。例えば、第２のレンダーが行われた時と第３のレンダーが行われた時の時間間隔は、第１のレンダーが行われた時と第２のレンダーが行われた時の時間間隔と同じであるだろう。しかし、第３のレンダーの後、ＧＰＵがライティングシミュレーションを実行できるように、レンダリングが中断される。その結果、待ち時間が生じる。ライティングシミュレーションを実行している間、画像レンダリングはＶＲヘッドセット１５の現在の動作から遅れを取るだろう。レンダリングが光シミュレーションのステージで中断されているときは、ＧＰＵ０は望ましいフレームレート（例えば、６０から９０ｆｐｓ）で画像レンダリングを提供できないだろう。

【0053】

図３は、実施形態の比較例に係り、光データヒープ５０とも称することがある読み書きデータ構造５０にデータボリュームを記憶する方法の概略図である。単一の特定の光データヒープ５０は、ダイナミックブロック５２ａから５２ｌを備える。各ブロックは、複数のデータ値を含む。例えば、ブロックは、８×８×８データ値のブロックであってよい。実際には、読み書きデータ構造５０は、図３に示されるものより数が多い多数のブロックを備えてよい。図３では簡略化のため数を減らしている。

【0054】

インデックス構造５１は、主ヒープ構造５０内のデータを参照する整数インデックスを含むより小さなボリュームである。

【0055】

第１のボリュームのためのデータは、データ構造５０のブロック５２ａから５２ｄに記憶される。ポインタ５３は、第１のボリュームのブロックを表すインデックス構造５１のインデックスを、データ構造５０の対応ブロックへマッピングする。実際には、第１のボリュームの各ブロックは、インデックス構造５１からデータ構造５０内のデータへのマッピングを与える対応ポインタを有してよい。

【0056】

データ構造５０では、メモリを効率に使用できるように疎データを記憶できるようにしてよい。例えば、データ構造５０は、関連データを含むブロックのみを記憶してよい。第１のボリュームの複数のブロックが同一データを有する場合は、当該データをデータ構造５０の１つのブロックに記憶し、複数のポインタが当該１つのブロックを示すようにしてよい。第１のボリュームのあるブロックが関連データを有さない場合は、ｎｕｌｌポインタを使って圧縮してよい。

【0057】

第２のボリュームのためのデータは、データ構造５０のブロック５２ｅから５２ｈに記憶される。ポインタ５５は、第２のボリュームのブロックを表すインデックス構造５１のインデックスを、データ構造５０の対応ブロックへマッピングする。実際には、データ構造５０に記憶される第２のボリュームの各ブロックは、インデックス構造５１からデータ構造５０へのマッピングを与える対応ポインタを有してよい。

【0058】

インデックス構造５１は、ボリュームと、これらのボリュームのためのデータが記憶されるブロックとの間のマッピングをリスト化する。当該ボリュームは、例えば、放射照度ボリュームまたはボリューメトリックデータセットであってよい。

【0059】

更なるポインタ５６は次に利用可能なブロック、図示例ではブロック５２ｉの位置を示す。

【0060】

図３のデータ構造５０において、各ボリュームのためのデータは隣接するブロックのセットに記憶される。隣接するブロックのセットを使用することで、後続のデータ処理の手助けとなるだろう。

【0061】

ＧＰＵ０は、従来の方法でデータ構造５０から読み出しデータ構造５０に書き込むように構成される。例えば、ＧＰＵ０は、放射照度ボリュームのためのデータをデータ構造５０に書き込み、その後、後続のレンダリングを行うときに当該放射照度ボリュームのためのデータを読み出してよい。

【0062】

図２では、データ（例えば放射照度データ）は、例えば図３に示されるような単一のデータ構造５０へ書き込み及びデータ構造５０から読み出す。データ構造５０は、ＧＰＵ０に対してローカルにメモリ３０に記憶される。

【0063】

一般的に、グローバルイルミネーション・アルゴリズムは、例えば図３に示されるデータ構造などの単純な読み書きデータ構造を利用する。このようなデータ構造を使用することで、複数のＧＰＵ間でのグローバルイルミネーションの分配が非自明（ｎｏｎ－ｔｒｉｖｉａｌ）となる。読み書きデータ構造へ書き込む及び読み書きデータ構造から読み出すためのアルゴリズムは、自動的にＧＰＵにわたって拡張しないだろう。

【0064】

図１に示される装置１０を検討する。ＣＰＵ２２はローカルメモリ２４を備える。ＧＰＵ０はローカルメモリ３０を備える。ＧＰＵ１はローカルメモリ３１を備える。例えば、ＧＰＵ０は、第１のＧＰＵに相当し、ＧＰＵ１は、第２のＧＰＵに相当する。異なるローカルメモリ間の過度なデータ転送が要求されると、結果として遅延が生じる。例えば、フルセットのデータを両ＧＰＵで保持するように全データが複製される場合は、データを明示的に指定して同期を繰り返す必要があるだろう。また、バス１９は、例えば、第１のＧＰＵと第２のＧＰＵとを接続するインターＧＰＵリンクに対応する。

【0065】

複数のメモリのうちの任意のメモリ内のロケーションにアドレスが参照する仮想メモリを使用することが知られている。例えば、仮想メモリの仮想バッファは、ＣＰＵメモリ２４にストレージを、ＧＰＵメモリ３０にストレージを、ＧＰＵメモリ３１にストレージを備えてよい。アドレスは、ＣＰＵメモリ２４、ＧＰＵメモリ３０、ＧＰＵメモリ３１のうちの任意の１つまたは複数のメモリ内のロケーションを指摘してよい。ポインタは、メモリ２４，３０，３１の任意のメモリ内の任意の場所を、またはメモリ２４，３０，３１内のいくつかの場所を指摘する１対多ポインタであってよい。

【0066】

仮想メモリをグローバルイルミネーションへ素朴に実装すると、メモリ間の過度な転送を伴う非効率な処理が結果として生じることがある。例えば、ＧＰＵ０は所与のデータ項目にアクセスしようとする。当該データ項目がＧＰＵ０のメモリ３０以外のメモリにのみ記憶されている場合は、当該データ項目はそのストレージロケーションからＧＰＵ０へ複製される。典型的には、当該データ項目は、より大きなデータバッファの一部として複製される。仮想メモリの実装がデータ転送を要するインスタンスを多く含む場合、とりわけ、データ転送が周辺機器用バスを介しデータレートが限定される場合は、処理が遅くなるだろう。

【0067】

図４は、実施形態に従った読み書きデータ構造８０内にデータボリュームを記憶する方法の概略図である。データ構造８０は、ＧＰＵ０とＧＰＵ１両方のメモリを使用する単一の仮想バッファ（例えば、仮想メモリ）として実装される。第１のＧＰＵと第２のＧＰＵとは、仮想メモリに記憶されるデータ構造８０からの読み出し及びデータ構造への書き込みを行う。すなわち、データ構造８０は、第１のＧＰＵと第２のＧＰＵとから読み込み可能である。

【0068】

データ構造８０は、ＧＰＵ０のメモリ３０内に記憶されるデータとＧＰＵ１のメモリ３１内に記憶されるデータを包含するアドレスの単一セットを有する。当該アドレスセットは、仮想アドレススペースまたは仮想クロスＧＰＵアドレススペースと称されることがある。各ＧＰＵは、放射照度データを書き込むために確保されるアドレスのサブセットを有する。放射照度ストレージのインテックス構造だけがＧＰＵ間で明示的に同期され、放射照度データは、転送可能であれば直ちに仮想メモリページとして転送される状態にしておく。すなわち、第２のＧＰＵの処理回路は、第２のＧＰＵのメモリから第１のＧＰＵのメモリへ、後述の第２のサブスペースに書き込まれたデータを、仮想メモリページとして転送する。例えば、第２のＧＰＵの処理回路は、当該書き込まれたデータが転送可能となることに応じて、当該書き込まれたデータを転送する。仮想メモリページは、仮想メモリのページであって、仮想メモリのどこにデータが書きこまれているかを示す情報に対応する。

【0069】

データ構造８０は、ＧＰＵ０により生成されたデータが仮想アドレススペースの第１のサブスペースに記憶され、ＧＰＵ１により生成されたデータが仮想アドレススペースの第２のサブスペースに記憶されるように、データを分離する。すなわち、データ構造８０は、仮想アドレススペース（仮想アドレス空間）を有する。このとき、第１のサブスペースは、仮想アドレススペース（仮想アドレス空間）のサブスペースであり、また、第２のサブスペースは、仮想アドレススペース（仮想アドレス空間）のサブスペースである。

【0070】

データ構造８０は、ダイナミックブロック８２ａから８２ｂｂを備える。各ブロックは複数のデータ値を含む。例えば、ブロックは、８×８×８データ値のブロックであってよい。実際には、読み書きデータ構造８０は、図４に示されるもの数が多い多数のブロックを備えてよい。図４では簡略化のため数を減らしている。

【0071】

ブロック８２ａから８２ｌの第１のセットは、第１のサブスペースとして説明されることがある。ブロック８２ｍから８２ｂｂの第２のセットは、第２のサブスペースとして説明されることがある。ＧＰＵ０とＧＰＵ１の両方は、第１のサブスペースと第２のサブスペースの両方への読み取りアクセスを有する。しかし、ＧＰＵ０だけが第１のサブスペースへ書き込み可能であり、ＧＰＵ１だけが第２のサブスペースへ書き込み可能である。すなわち、第１のＧＰＵは、データ構造８０の第１のサブスペースに書き込み可能である。また、第２のＧＰＵは、データ構造８０の第２のサブスペースに書き込み可能である。異なるＧＰＵが書き込み可能なブロックを分離することで、不必要なデータ転送が回避されるだろう。換言すれば、第１のサブスペースと第２のサブスペースとは互いに独立している。第１のサブスペースと第２のサブスペースとの独立は、例えば、書き込みアクセスが排他的に機能することにある。

【0072】

インデックス構造８１は、主ヒープ構造８０内のデータを参照する整数インデックスを含むより小さなボリュームである。

【0073】

第１のボリュームのためのデータは、第１のサブスペースのブロック８２ａから８２ｄに記憶される。ポインタ８３は、第１のボリュームのブロックを表すインデックス構造８１のインデックスを、データ構造８０の対応ブロックへマッピングする。第２のボリュームのためのデータもまた、第１のサブスペースに記憶される。例えば図３を参照して上述したように、疎データを記憶してよい。

【0074】

光ブロックマッピングはＧＰＵ０専用であるが、共通メモリを参照する。インデックス構造８１は、ボリュームと、これらのボリュームのためのデータが記憶されるブロックとの間のマッピングをリスト化する。当該ボリュームは、例えば放射照度ボリュームまたはボリューメトリックデータセットであってよい。各ボリュームのためのデータは、隣接するブロックのセットに記憶される。隣接するブロックのセットを使用することで、後続のデータ処理の手助けとなるだろう。

【0075】

ポインタ８６は、ＧＰＵ０で次に利用可能なブロックの位置を示す。図示例では、次に利用可能なブロックはブロック８２ｉである。ポインタ８６は、書き込みポインタまたはヒープ書き込みポインタと称されることがある。ポインタ８６はＧＰＵ０の次のブロックオフセットを指摘する。

【0076】

第２のサブスペースでは、更なるボリュームのためのデータがＧＰＵ１により第２のサブスペースのブロック８２ｍから８２ｐに記憶される。

【0077】

ポインタ８９は、第３のボリュームのブロックを表すインデックス構造８１のインデックスを、データ構造８０の対応ブロックへマッピングする。

【0078】

ポインタ８８は、ＧＰＵ１で次に利用可能なブロックの位置を示す。図示例では、次に利用可能なブロックはブロック８２ｑである。ポインタ８８は、書き込みポインタまたはヒープ書き込みポインタと称されることがある。ポインタ８８はＧＰＵ１の次のブロックオフセットを指摘する。

【0079】

第１のサブスペースは、ＧＰＵ０（第１のＧＰＵ）により排他的に書き込まれ、第２のサブスペースは、ＧＰＵ１（第２のＧＰＵ）により排他的に書き込まれる。すなわち、データ構造８０は、第１のＧＰＵが第２のサブスペースに書き込むことを禁止し、第２のＧＰＵが第１のサブスペースに書き込むことを禁止するように構成される。各ＧＰＵは、自身のヒープ書き込みポインタ８６，８８を有し、ヒープ書き込みポインタ８６，８８は次に利用可能な当該ＧＰＵにより書き込まれるブロックを示す。ＧＰＵがデータ構造８０に書き込むと、自身のヒープ書き込みポインタの位置にのみ影響する。例えば、ＧＰＵ０がデータ構造８０に書き込むと、ヒープ書き込みポインタ８６の位置は変わるが、ヒープ書き込みポインタ８８の位置は変わらない。ヒープ書き込みポインタ８６，８８は、パラレルなヒープ書き込みポインタであると考えられるだろう。ヒープ書き込みポインタ８６，８８は独立して機能する。

【0080】

ＧＰＵが排他的書き込みアクセスを有する独立領域が各ＧＰＵに与えられる。データ構造８０のフルアドレス範囲は、ページ転送により両ＧＰＵからアクセス可能だが、書き込みアクセスは制限される。共通メモリ被ページマッピング領域が与えられる。単一のアドレス範囲が使用される。

【0081】

ＧＰＵ０、ＧＰＵ１のそれぞれは、インデックス構造８１の自分用コピーを有する。所与のＧＰＵで保持されるインデックス構造８１のデータは、当該ＧＰＵにより実行されるアクションと、他のＧＰＵのインデックス構造にインデックス構造を同期するアクションと、に応じて更新される。いくつかの実施形態では、インデックスデータをあるＧＰＵ例えばＧＰＵ１から別のＧＰＵ例えばＧＰＵ０に送信して、同期を一方向で実行する。他の実施形態では、同期は双方向であってよい。具体的には、第１のＧＰＵと第２のＧＰＵとの処理回路は、第１のＧＰＵと第２のＧＰＵとの間で、仮想アドレススペースのインデックス構造を同期する。例えば、インデックスデータはＧＰＵ０からＧＰＵ１へ送信され、更なるインデックスデータがＧＰＵ１からＧＰＵ０へ送信されてよい。例えば、第２のＧＰＵは、第２のサブスペースに書き込まれたデータを第１のＧＰＵに、インターＧＰＵリンクを介して送信する。

【0082】

ページは、アクセスで明示的に又は自動的に転送されてよい。例えば、ＧＰＵが、自身のローカルメモリ内で利用できないデータ構造内のデータへのアクセスを試みる場合、当該データが保持されるメモリと当該ローカルメモリとの間で自動ページ転送が開始される。ページ転送は、図６，７を参照して下で更に説明される。

【0083】

図５は、実施形態に従ったレンダリング方法の概略を示し、そこでは図４を参照して上述したデータ構造８０が用いられる。同様の実施形態が図６を参照して下で詳細に説明される。

【0084】

図５の方法を、図１の装置１０により実行してよい。図５のレンダリング方法では、レンダリングとライティングは異なるＧＰＵに割り当てられ、最小の同期で、独立レートで実行するようにパイプライン化される。ライティング計算は、レンダリング計算よりも低いレートで、不均一な更新またはラグを生じることなく行われてよい。例えば、レンダリング計算を６０から９０ｆｐｓのフレームレートで更新する間に、ライティング計算を２０から３０ｆｐｓのフレームレートで更新してよい。すなわち、第２のＧＰＵは、レンダリングの前処理を第１のフレームレートで行い、第１のＧＰＵは、レンダリングを、第１のフレームレートより速い第２のフレームレートで行う。

【0085】

画像データと光データの両方の安定したストリームを可能にするために、協調マルチＧＰＵアプローチが用いられる。一方のレンダリング専用ＧＰＵ（本実施形態ではＧＰＵ０）がＶＲヘッドセット１５用の画像を生成し、別のＧＰＵ（本実施形態ではＧＰＵ１）が異なるレートでライティングを生成する。他の実施形態では、任意の好適な数のＧＰＵが画像を生成し、別の１つまたは１セットのＧＰＵがライティングを生成してよい。

【0086】

画像のレンダリングが開始できるようになる前に光シミュレーションが要求されるため、両ＧＰＵは光シミュレーションを行ってスタートする。すなわち、光シミュレーションは、画像のレンダリングの前処理に相当する。

【0087】

ステージ６０では、ライティング制御回路２６は、第１の光シミュレーション第１の光シミュレーションを行うように、ＧＰＵ０に命令する。ＧＰＵ０は、第１の光シミュレーションを、患者の医用撮像スキャンから得られるボリューメトリック撮像データセットで行う。当該光シミュレーションは、ライティングシミュレーション、光計算、またはライティング計算と称されることもある。例えば、光シミュレーションにおけるライティング計算は、グローバルイルミネーション処理を含んでよい。光シミュレーションは、任意の好適な数および／または種類の仮想光源をシミュレートしてよい。光シミュレーションは、図２を参照して上述したものと類似していてよい。例えば、第１のＧＰＵの処理回路は、ライティング計算の第１の部分を実行し、ライティング計算の第１の部分の結果を第１のサブスペースに書き込む。なお、光シミュレーションの処理は、後続のレンダリングに対する前処理ステップとして説明されてよい。他の実施形態では、任意の他の好適な前処理ステップに対して同様の方法を使用してよい。

【0088】

ステージ６０の第１の光シミュレーションの出力は、放射照度ボリュームである。本実施形態では、ステージ４０の光シミュレーション処理はフォトンマッピングを含み、放射照度ボリューム（放射照度データ）はフォトンマップである。フォトンマップは疎であってよい。フォトンマップは、座標スペース内の全てのポイントにおける個々の放射照度値を含まなくてもよい。

【0089】

他の実施形態では、光シミュレーション処理はモンテカルロ・パストレーシングを含み、放射照度キャッシュが記憶される。更なる実施形態において、空間データ構造のレベルが個々の放射照度クエリを記憶する空間データ構造を用いてよい。すなわち、放射照度データは、放射照度クエリの空間ツリーであってもよい。他の実施形態では、通常の光空間マッピングが密ボリュームを読み書きする。

【0090】

図５を参照して下で更に説明するように、放射照度ボリュームは読み書きデータ構造８０に記憶される。例えば、データ構造８０は、第１のＧＰＵの物理メモリ内にデータを格納するため、および第２のＧＰＵの物理メモリ内にデータを格納するために構成される。放射照度ボリュームは、ＧＰＵ０だけが書き込みアクセスを有するデータ構造８０の第１のサブスペースに記憶される。当該放射照度ボリュームが記憶される物理メモリは、ＧＰＵ０のメモリ３０である。

【0091】

ステージ７０では、ライティング制御回路２６は、第２の光シミュレーション処理を行うように、ＧＰＵ１に命令する。ステージ７０は、少なくとも部分的にステージ６０と共通する時間間隔で生じてよい。ＧＰＵ１は、第２の光シミュレーションを、ステージ６０で使用したものと同一のボリューメトリック撮像データセットで行う。第２の光シミュレーション処理は、任意の好適な光シミュレーション処理を用いて行われてよい。例えば、第２のＧＰＵの処理回路は、ライティング計算の第２の部分を実行し、ライティング計算の第２の部分の結果を第２のサブスペースに書き込む。また、第２の光シミュレーション処理は、ステージ６０の第１の光シミュレーション処理でシミュレートされるものとは異なる光源および／または異なるライティング効果をシミュレートするために用いられてよい。

【0092】

図５の実施形態では、図５の方法の開始時点では、使用可能な光状態が手に入らない。そのため両ＧＰＵ０，１は、連携して可能な限り急いでライティングをシミュレートする。レンダリングステージと重なる後続のライティングシミュレーションは、連携せずに、代わりに単一のＧＰＵで実行される。

【0093】

ステージ７０の第２の光シミュレーションの出力は、放射照度ボリュームである。放射照度ボリュームは、ＧＰＵ１だけが書き込みアクセスを有するデータ構造８０の第２のサブスペースに記憶される。すなわち、第２のＧＰＵは、レンダリングの前処理に関するデータを第２のサブスペースに対して書き込み可能である。例えば、第２のサブスペースに書き込まれたデータは、放射照度データを含む。放射照度データは、例えば、フォトンマップ、放射照度クエリの空間ツリー、密ボリュームのうちの少なくとも１つの一部を含むまたは形成する。当該放射照度ボリュームが記憶される物理メモリは、ＧＰＵ１のメモリ３１である。

【0094】

矢印７１に示されるように、ＧＰＵ１は、ステージ７０の光シミュレーションの出力の少なくとも一部をＧＰＵ０に渡す。この転送は、図６を参照して下で詳しく説明される。当該転送は、過去にメモリ３１に記憶されたデータがメモリ３０に記憶されるように、バス１９を介したＧＰＵ１からＧＰＵ０へのデータ転送を含んでよい。なお、データストレージの物理ロケーションにおける変更は、データ構造８０における当該データの位置を変更するものではない。データ構造８０の当該データの任意のものを、メモリ３０に、またはメモリ３１に、若しくはメモリ３０とメモリ３１の両方に記憶してよい。

【0095】

データ構造８０の任意の部分が読み出されているとき、データ構造８０の当該部分は、当該読み出しの期間はリードオンリーだとみなされる。

【0096】

ステージ６１では、レンダリング制御回路２８は、第１の画像レンダーを行うようにＧＰＵ０に命令する。ＧＰＵ０は、ステージ６０の第１の光シミュレーション処理からのデータとステージ７０の第２の光シミュレーション処理からのデータを用いて、第１の画像レンダーを行う。すなわち、第１のＧＰＵは、第２のサブスペースに書き込まれたデータを読み込み可能であって、当該読み込まれたデータに基づいて、少なくとも一つの画像をレンダリングする。具体的には、第１のＧＰＵの処理回路または第２のＧＰＵの処理回路は、ライティング計算の第１の部分の結果を、ライティング計算の第２の部分の結果にマージする。次いで、第１のＧＰＵは、マージされたデータを用いて、第１の画像レンダーを行う。任意の好適なレンダリング方法、例えば、ステージ４２を参照して上述したレイキャスティング法などを用いてよい。第１の画像レンダーの結果、一対の第１のレンダリング画像が得られる。表示回路２９は、一対の第１のレンダリング画像をＶＲヘッドセット１５上に表示するように命令する。

【0097】

ステージ６２では、レンダリング制御回路２８は、ステージ６１で使用したものと同じ放射照度ボリュームを用いて第２の画像レンダーを行うようにＧＰＵ０に命令する。ＧＰＵ０は、ステージ６１で使用したものと同じ放射照度ボリュームを用いて、第２の画像レンダーを行う。第２の画像レンダーの結果、一対の第２のレンダリング画像が得られる。表示回路２９は、一対の第２のレンダリング画像をＶＲヘッドセット１５上に表示するように命令する。

【0098】

ステージ７２では、ライティング制御回路２６は、第３の光シミュレーション処理を行うようにＧＰＵ１に命令する。ＧＰＵ１は、当該ボリューメトリック撮像データセットで第３の光シミュレーション処理を行う。第３の光シミュレーション処理は、画像レンダーよりも時間がかかる。ステージ７２の第３の光シミュレーションの出力は、更新された放射照度ボリュームである。更新された放射照度ボリュームは、ＧＰＵ１だけが書き込みアクセスを有するデータ構造８０の第２のサブスペースに記憶される。ＧＰＵ１は、第２の画像レンダー６２が行われている間に、第３の光シミュレーション処理の出力の少なくとも一部を、バス１９を介してＧＰＵ０に転送する（矢印７３に示される転送）。

【0099】

ステージ６３では、レンダリング制御回路２８は、第３の画像レンダーを行うようにＧＰＵ０に命令する。ＧＰＵ０は、ステージ７３の更新された放射照度ボリュームを用いて、第３の画像レンダーを当該ボリューメトリック撮像データセットに行う。第３の画像レンダーの結果、一対の第３のレンダリング画像が得られる。表示回路２９は、一対の第３のレンダリング画像をＶＲヘッドセット１５上に表示するように命令する。

【0100】

ステージ６４では、レンダリング制御回路２８は、第４の画像レンダーを行うようにＧＰＵ０に命令する。ＧＰＵ０は、ボリューメトリック撮像データセットとステージ７３の更新された放射照度ボリュームを用いて、第４の画像レンダーを行う。第４の画像レンダーの結果、一対の第４のレンダリング画像が得られる。表示回路２９は、一対の第４のレンダリング画像をＶＲヘッドセット１５上に表示するように命令する。

【0101】

ステージ６５では、レンダリング制御回路２８は、第５の画像レンダーを行うようにＧＰＵ０に命令する。ＧＰＵ０は、ボリューメトリック撮像データセットとステージ７３の更新された放射照度ボリュームを用いて、第５の画像レンダーを行う。第５の画像レンダーの結果、一対の第５のレンダリング画像が得られる。表示回路２９は、一対の第５のレンダリング画像をＶＲヘッドセット１５上に表示するように命令する。以上のように、例えば、ステージ６１乃至６５において、第２のサブスペースに書き込まれたデータに基づく少なくとも１つの画像の上記レンダリングは、仮想現実（ｖｉｒｔｕａｌｒｅａｌｉｔｙ：ＶＲ）ヘッドセット１５に表示するための画像をレンダリングすることを含む。

【0102】

ステージ７４では、ライティング制御回路２６は、別の光シミュレーション処理を行うようにＧＰＵ１に命令する。ＧＰＵ１は、ＧＰＵ０により第３，４，５の画像レンダー６３，６４，６５が行われている期間に、ステージ７４の光シミュレーション処理を行う。ステージ７４の光シミュレーションの出力は、別の放射照度ボリュームである。ステージ７４の放射照度ボリュームは、ＧＰＵ１だけが書き込みアクセスを有するデータ構造８０の第２のサブスペースに記憶される。ＧＰＵ１は、ステージ７４の光シミュレーション処理の出力の少なくとも一部を、第５の画像レンダー６５が行われている間に、バス１９を介してＧＰＵ０に転送する（矢印７５に示される転送）。

【0103】

その後、ＧＰＵ０は、ステージ７４の光シミュレーションの結果を使い、更なる画像をレンダリングする（図４に示されない）。

【0104】

ＧＰＵ０でレンダリングが行われている間にＧＰＵ１で光シミュレーションを行うことで、当該光シミュレーションはレンダリングにラグを生じることなく更新される。光シミュレーションは、レンダリングより遅いフレームレートで行われることがある。ＧＰＵ０による書き込みとＧＰＵ１による書き込みで別々のサブスペースを有するデータ構造８０を使用することで、ＧＰＵ間の効率の良いデータ転送を提供するだろう。当該データ構造は、仮想メモリシステムを介してアクセスされる。図６は、図５を参照して上述したものと類似するが、より詳細にデータ転送を示す光シミュレーションおよびレンダリングの処理を示すフローチャートである。

【0105】

図６は、ＧＰＵ０とＧＰＵ１により行われる複数のステップを表す。水平方向は、左から右へ時間を表す。図６の上半分は、ＧＰＵ０により行われるステップを表す。図６の下半分は、ＧＰＵ１により行われるステップを表す。

【0106】

ＧＰＵ０，１のそれぞれは、任意の所与の時間に動作する２つのスレッドを有すると考えてよい。第１のスレッドは、例えばレンダーまたは光シミュレーションを計算するなど、計算を行う。第１のスレッドは、図６ではＧＰＵ０計算及びＧＰＵ１計算として示される。第２のスレッドはデータを管理する。第２のスレッドは、図６ではＧＰＵ０データ及びＧＰＵ１データとして示される。

【0107】

図６の第１のステージ１００は、図６に明示的に示されるものに過去に実行されたレンダリングを表す。図６は、進行中のレンダリング処理内の期間を表し、そこでは多くのフレームが代わる代わるレンダリングされる。

【0108】

ステージ１３０では、ライティング制御回路２６は、光シミュレーションを行うようにＧＰＵ１に命令する。当該光シミュレーションは図６に示される第１の光シミュレーションであるが、図６に示される期間の前に過去の光シミュレーションが行われている。ＧＰＵ１は、当該光シミュレーションを行う。ステージ１３０の光シミュレーションの結果、早期光データ１２０が得られ、続いて光データ１２１が得られる。早期光データ１２０は、ステージ１３０の光シミュレーションにより出力されるデータの第１の部分である。光データ１２１は、ステージ１３０の光シミュレーションにより出力されるデータの第２の部分である。早期光データ１２０と光データ１２０は、データ構造８０の第２のサブスペース内に、メモリ３１内に記憶される。

【0109】

ステージ１０１では、レンダリング制御回路２８は、一対の画像をレンダリングするようにＧＰＵ０に命令する。下記における検討では、ステージ１０１の画像を一対の第１の画像と称することがある。しかし、過去の画像が、第１の画像のレンダリングの前にＧＰＵ０によって既にレンダリングされている。ＧＰＵ０は、図６に示されていない光シミュレーション処理から得られた放射照度データを用いて、一対の第１の画像をレンダリングする。ＧＰＵ０による第１の画像のレンダリングは、ＧＰＵ１がステージ１３０の光シミュレーションを行っている期間に生じる。

【0110】

ステージ１１０では、ＧＰＵ０は、ＧＰＵ１からの第１のページ転送を要求する。第１のページ転送は、早期ページ転送と称されることがある。早期ページ転送では、早期光データ１２０がＧＰＵ１からＧＰＵ０へ転送され、メモリ３０に記憶される。ステージ１１０の早期ページ転送は、ステージ１０１のレンダリングとほぼ同時に行われる。ステージ１１０の早期ページ転送は、ステージ１３０の光シミュレーションが完了する前に行われる。

【0111】

ステージ１１１では、ＧＰＵ０は、ＧＰＵ１からの第２のページ転送を要求する。第２のページ転送は、後期ページ転送と称されることがある。後期ページ転送では、光データ１２１がＧＰＵ１からＧＰＵ０へ転送され、メモリ３０に記憶される。

【0112】

図６では、ステージ１３０の光シミュレーションからのデータは、２つのページ転送で転送される２つの部分１２０，１２１に分割される。実際には、光シミュレーションからのデータを、任意の好適な数のページ転送で転送される任意の好適な数の部分に分割してよい。ＧＰＵ０により行われるページ転送は、全てページキャッシング命令を含む。

【0113】

レンダリングまたはマージ処理は、当該転送を当該レンダリングまたはマージ処理に効率良く重ねるために、ブロックアクセス順序のリストを維持してよい。すなわち、データ構造８０に、又はデータ構造８０からデータが転送されるときに、ブロックアクセス順序は、維持される。これは、過去のフレームから測定されてよい。レンダリングまたはマージ処理は、当該ブロックがはじめてアクセスされたときに、経過したフレーム期間をマーキングしてよい。その後、経過フレーム期間は、ブロックをアクセス順のブロックリストにソートするために用いられてよい。

【0114】

ブロックは、第２の管理スレッドからヒープポインタを観察して、光シミュレーション中にジャストインタイムで転送されてもよい。例えば、ヒープポインタは、どのブロックがスタートしたかを示してもよい。追加変数は、各ブロックが完了しているかについて、当該ブロックを横断する追加の光線がないように示してもよい。第２の管理スレッドは、スタートしたブロックをスキャンして終了ステータスを探し、その後、終了としてマーキングされたブロックを転送してもよい。いくつかの状況では、このような転送を行うために、非常に限定された同期が必要となるかもしれない。当該転送は、アクティブブロックの範囲を示すブロックヒープポインタへのアトミックアクセスと、ブロックの完了を信号化するために用いられるフラグを要求してもよい。

【0115】

ステージ１０２では、レンダリング制御回路２８は、一対の第２の画像をレンダリングするようにＧＰＵ０に命令する。ＧＰＵ０が一対の第２の画像のレンダリングを行うとき、ステージ１３０の光シミュレーションからのデータはまだＧＰＵ０で利用できない。ＧＰＵ０は、図６に示されていない光シミュレーション処理から得られた放射照度データを用いて、第２の画像をレンダリングする。

【0116】

ステージ１０３では、レンダリング制御回路２８は、一対の第３の画像をレンダリングするようにＧＰＵ０に命令する。ＧＰＵ０は、ステージ１１０及び１１１のページ転送で得られる放射照度データセットを用いて、一対の第３の画像をレンダリングする。

【0117】

ステージ１０４では、レンダリング制御回路２８は、一対の第４の画像をレンダリングするようにＧＰＵ０に命令する。ＧＰＵ０は、ステージ１１０及び１１１のページ転送で得られる放射照度データセットを用いて、一対の第４の画像をレンダリングする。

【0118】

再びＧＰＵ１に戻ると、ステージ１４０では、ＧＰＵ１は、インデックス構造が両ＧＰＵ０，１間でコピーされ同期されるインデックス化処理を行う。本実施形態では、ＧＰＵ１のインデックス構造のインデックスデータがＧＰＵ０へ送信される。インデックス構造は、データのメモリロケーションへのマッピングを含む。当該コピーは、明示的に指定してコピーとして説明されてよい。明示的に指定したコピーでは、ＣＰＵの回路は、メモリ領域を直ちに転送するように、仮想メモリまたはページ化システムに依拠することなく直接ＧＰＵに命令する。光シミュレーション後のインデックス構造の同期を、キー同期ポイントとして考えてよい。

【0119】

ステージ１５０では、ＧＰＵ１は、転送したページをデコミットし、転送したページに関連する物理メモリを解放する。

【0120】

ステージ１３１では、ライティング制御回路２６は、更なる光シミュレーションを行うように、ＧＰＵ１に命令する。ステージ１３１の更なる光シミュレーションは、ステージ１３０の光シミュレーションの直後に、パイプライン式にスタートしてよい。

【0121】

更なる光シミュレーション１３１の結果、早期光データ１２２が得られ、続いて光データ１２３が得られる。早期光データ１２２は、光シミュレーション１３１により出力されるデータの第１の部分である。光データ１２３は、更なる光シミュレーション１３１により出力されるデータの第２の部分である。早期光データ１２２と光データ１２３は、データ構造８０内に、メモリ３１内に記憶される。

【0122】

ステージ１１２では、ＧＰＵ０は、早期ページ転送と称されることがあるＧＰＵ１からの第１のページ転送を要求する。早期ページ転送では、早期光データ１２２がＧＰＵ１からＧＰＵ０へ転送され、メモリ３０に記憶される。ステージ１１２の早期ページ転送が行われる期間は、ステージ１０４での第４画像のレンダリングと重なる。ステージ１１２の早期ページ転送は、ステージ１３１の更なる光シミュレーションが完了する前に行われる。

【0123】

ステージ１１３では、ＧＰＵ０は、後期ページ転送と称されることがあるＧＰＵ１からの第２のページ転送を要求する。後期ページ転送では、光データ１２３がＧＰＵ１からＧＰＵ０へ転送され、メモリ３０に記憶される。

【0124】

ステージ１４１は、更なる光シミュレーション１３１が完了した後に生じる。ステージ１４１では、ＧＰＵ１は、データをメモリロケーションへマッピングするインデックのコピーが両ＧＰＵ０，１間でコピーされ同期されるインデックス化処理を行う。

【0125】

ステージ１０５では、レンダリング制御回路２８は、ステージ１１２及び１１３のページ転送で得られる放射照度データセットを用いて、一対の第５の画像をレンダリングするよう、ＧＰＵ０に命令する。

【0126】

図６の実施形態では、ＧＰＵ０によりレンダリングが行われる間に、光シミュレーションがＧＰＵ１により行われる。図２に示される処理とは異なり、光シミュレーションが行われる間にレンダリングは遅延されない。レンダリングは一貫したフレームレートで進む。光シミュレーションもまた、レンダリングに使用されるフレームレートよりも低い一貫したフレームレートで進む。データは、利用可能になるとＧＰＵ１からＧＰＵ０へ自動的に転送される。

【0127】

ＧＰＵ０とＧＰＵ１間で光情報を転送する処理は、光情報を用いるレンダリング呼と同様に、ＧＰＵ１により行われる光計算に重なる。

【0128】

データ構造の見た目を共通化し、転送で修正されないように見せてよい。データ構造は、完全には全データが両ＧＰＵで共通していない場合でも、全てが両ＧＰＵに存在するように見せてよい。要求されるＧＰＵからデータ構造の部分をアクセス可能とするために、自動ページ転送が用いられる。転送は、情報内容そのものを変えるのではなく、各ＧＰＵにおける情報内容の可用性を変えるだけであると考えてよい。新しいライティングシミュレーションは結果としてデータ構造の内容の修正をもたらし、これをＧＰＵ間で転送してよい。

【0129】

図６の方法は、協調放射照度ストレージの方法を提供すると言われてもよい。書き込みは、ＧＰＵにより分離されている。ＧＰＵにより書き込みを分離することで、不必要な読み書きステージを回避するだろう。ＧＰＵ間のデータ転送が最小化されるだろう。光シミュレーション及びレンダリングが、ＧＰＵ間の１００ＧＢ／ｓデータ転送能力の制約内で効率よく行われるだろう。

【0130】

多くのケースでは、レンダリング処理を単一の高性能ＧＰＵで実行するよりも、複数のＧＰＵで実行するほうが、費用対効果において優れているだろう。データ構造８０を使用することで、効率のよいマルチＧＰＵ性能が達成されるだろう。

【0131】

レンダリングは、ライティング計算とは異なる安定したレートで行われる。図４を参照して上述したデータ構造を使用することで、当該データ構造の内容への影響を最小にして、転送が効率よく重なるだろう。

【0132】

他のアクションを実行する前に、転送の完了を待つ必要はない。ＧＰＵが、自身が所有しないデータを要求する計算を行っている場合、自動的に当該データを他のＧＰＵから要求するだろう。図６に関して説明された自動データ転送は、インターＧＰＵページフォールトを最小化するように設計されるが、レンダリング方法を深刻に中断させずに、一部のページフォールトを生じさせることが可能だ。

【0133】

効率のよいページのキャッシングにより、有用なレンダリング速度が獲得できるだろう。データ構造は、光ブロックマッピングを同期し、ＧＰＵ間のバックグラウンドでのページ転送を開始する機会を有する。重複転送が行われる。転送は、典型的には、レンダリングエンジンが転送データを必要とする前に行われ、レンダリングエンジンをビジーに保つ。

【0134】

また、図５及び図６の方法は２つより多いＧＰＵに拡張され得る。使用されるデータ構造は、サブスペースの数がＧＰＵの数と同じになるように、２つより多いサブスペースを含んでよい。各ＧＰＵは、データ構造のいずれの場所でも読み出し可能だが、専用のサブスペースにしか書き込めない。各サブスペースは、次に利用可能なブロックを示す個々のヒープポインタを有する。例えば、医用画像処理装置１０は、データ構造８０を読み込む及び書き出すように構成される少なくとも１つの更なるＧＰＵをさらに備える。このとき、データ構造８０は、当該少なくとも１つの更なるＧＰＵから読み込まれる。また、当該少なくとも１つの更なるＧＰＵは、データ構造８０の少なくとも１つの更なるサブスペースに書き込み可能である。

【0135】

図７は、光シミュレーション及びレンダリングの処理を示すフローチャートである。図７に示す方法では、ライティング計算がＧＰＵ０とＧＰＵ１で共有される協調ライティング計算が行われる。高価な光計算（図７の実施形態における環境光）が、サイレントで転送およびマージされつつ、ＧＰＵ０とＧＰＵ１の両方で進められる。転送とマージが生じている間に、現在または次のフレームのために他のライティング処理が行われる。

【0136】

図７は、ＧＰＵ０とＧＰＵ１により行われる複数のステップを表す。水平方向は、左から右へ時間を表す。図７の上半分は、ＧＰＵ０により行われるステップを表し、ＧＰＵ０計算として示される第１のスレッドと、ＧＰＵ０データとして示される第２のスレッドに分かれる。図７の下半分は、ＧＰＵ１により行われるステップを表し、ＧＰＵ１計算として示される第１のスレッドと、ＧＰＵ１データとして示される第２のスレッドに分かれる。

【0137】

ステージ２１０と２４０は、同時または時間を重複して行われる。ステージ２１０では、ライティング制御回路２６は、第１の環境光計算を行うようにＧＰＵ０に命令する。ステージ２４０では、ライティング制御回路２６は、第２の環境光計算を行うようにＧＰＵ０に命令する。ＧＰＵ０とＧＰＵ１による環境光の計算は協調して行う。例えば、ＧＰＵ０が第１の半球の環境光計算を行い、ＧＰＵ１が第２の半球の環境光計算を行うように、計算を半球で分割してよい。

【0138】

ＧＰＵ０による環境光計算の結果、データ構造８０内に、メモリ３０内に記憶される光データ２００のセットが得られる。ＧＰＵ１による環境光計算の結果、まず早期光データ２３０が、次に光データ２３２が得られ、これらはデータ構造８０内に、メモリ３１内に記憶される。

【0139】

ステージ２５０は、ステージ２４０の後にＧＰＵ１で生じる。ステージ２５０では、ＧＰＵ１は、データをメモリロケーションへマッピングするインデックスのコピーが両ＧＰＵ０，１間でコピーされ同期されるインデックス化処理を行う。

【0140】

ステージ２２０では、ＧＰＵ０は早期ページ転送を行う。ＧＰＵ０は、早期光データ２３０の転送を要求する。早期光データ２３０はＧＰＵ１からＧＰＵ０へ転送され、メモリ３０に記憶される。ステージ２２２では、ＧＰＵ０は、後期ページ転送２２２を行う。ＧＰＵ０は、光データ２３２の転送を要求する。光データ２３２は、ＧＰＵ１からＧＰＵ０へ転送され、メモリ３０に記憶される。

【0141】

ステージ２１２は、ステージ２１０に続きＧＰＵ０で行う。ステージ２１２では、ＧＰＵ０のカーネルは、環境光の２つの部分表現をマージする環境光マージを行う。第１の部分表現は、ＧＰＵ０によりステージ２１０で得られ、光データ２００として記憶されるものである。第２の部分表現は、ＧＰＵ１によりステージ２４０で得られ、早期および後期ページ転送２２０，２２２でＧＰＵ０へ転送されるものである。マージは、ステージ２５０のインデックス同期を利用する。

【0142】

ステージ２４２では、ライティング制御回路２６は、指向性光計算を行うようにＧＰＵ１に命令する。指向性光計算は環境光計算よりも資源集約的ではないため、両ＧＰＵに分けるよりは、単一のＧＰＵで行われる。ＧＰＵ１による指向性光の計算の結果として、まずは早期光データ２３４が、次に光データ２３６が得られる。早期光データ２３４と光データ２３６はデータ構造８０内に、メモリ３１内に記憶される。

【0143】

ステージ２５２は、ステージ２４２の後にＧＰＵ１で生じる。ステージ２５０では、ＧＰＵ１は、データをメモリロケーションにマッピングするインデックスのコピーが両ＧＰＵ０，１の間でコピーされ同期されるインデックス化処理を行う。

【0144】

ステージ２２４では、ＧＰＵ０は、早期ページ転送を行う。ＧＰＵ０は、早期光データ２３４の転送を要求する。早期光データ２３４はＧＰＵ１からＧＰＵ０へ転送され、メモリ３０に記憶される。ステージ２２６では、ＧＰＵ０は、後期ページ転送を行う。ＧＰＵ０は、光データ２３６の転送を要求する。光データ２３６はＧＰＵ１からＧＰＵ０へ転送され、メモリ３０に記憶される。

【0145】

ステージ２１４では、レンダリング制御回路２８は、第１の画像レンダーを行うようにＧＰＵ０に命令する。ＧＰＵ０は、光データ２００と、ステージ２１２の環境光マージの結果と、ステージ２２２の後期ページ転送からの光データと、ステージ２２６の後期ページ転送からの指向性光データと、を用いて一対の第１の画像をレンダリングする。

【0146】

ステージ２１６では、レンダリング制御回路２８は、ステージ２１４で用いたものと同じ光データを使って第２の画像レンダーを行うように、ＧＰＵ０に命令する。ＧＰＵ０は、ステージ２１４で用いたものと同じライティング情報を使って、一対の第２の画像をレンダリングした。

【0147】

図７の実施形態では、ＧＰＵ０とＧＰＵ１は、費用のかかるライティング計算において協調する。費用のかかる光計算での協調により、独立したライティングまたはレンダリングが準最適である場合には、イメージ化の時間が短縮されるだろう。

【0148】

ライティング計算は２つの部分に分割される。完了したページは重複してジャストインタイム式に転送され、その後マージされる。

【0149】

各ＧＰＵは、必要に応じてライティングタスクとレンダリング（画像生成）タスクの両方に寄与できる。

【0150】

いくつかの実施形態では、人工知能（ａｒｔｉｆｉｃｉａｌｉｎｔｅｌｌｉｇｅｎｃｅ：ＡＩ）および再構成に共有マルチＧＰＵアクセラレータを用いる。共有マルチＧＰＵアクセラレータは、迅速なＧＩ体験を可能にするために使用されてもよい。いくつかの状況では、他のタスクを当該システム上で実行してよく、ＧＰＵにライティングとレンダリングタスクを割り当てるアルゴリズムは、そのような他のタスクに道を譲るために、タスクおよび後続のデータ転送を動的にスケジューリングしなければならない場合がある。

【0151】

図８は、単一のＧＰＵの複数のカーネルにより行われる処理を示すフローチャートである。他の実施形態では、複数のＧＰＵで行われる上述した方法のうち任意のものを、マルチカーネル実行サポートで単一のＧＰＵにおいて行ってよい。図８に示す処理において、医用画像をレンダリングする医用画像処理装置１０は、仮想メモリに記憶されるデータ構造８０からの読み出し及びデータ構造８０への書き込みを行うマルチカーネルＧＰＵを備える。このとき、データ構造８０は、マルチカーネルＧＰＵの第１のカーネルとマルチカーネルＧＰＵの第２のカーネルとから読み込まれる。

【0152】

同時マルチスレッディングを有する近年のＧＰＵでは、単一のＧＰＵ内でタスクを重複してよい。

【0153】

図８では、ＧＰＵ０の第１のカーネルがＧＰＵ０カーネル１として示され、ＧＰＵ０の第２のカーネルがＧＰＵ０カーネル２として示される。例えば、第１のカーネルは、データ構造８０の第１のサブスペースに書き込み可能である。また、第２のカーネルは、データ構造８０の第２のサブスペースに書き込み可能である。このとき、第１のサブスペースと第２のサブスペースとは独立している。

【0154】

第１のカーネルは、図８に示される期間の前に、数多くの過去のレンダリングステージを行う。これらの過去のレンダリングステージはステージ３００として示される。その後、第１のカーネルは、図８に示される複数のレンダリングステージ３０２，３０４，３０６，３１０、３１２を行う。図８に示される期間の後のレンダリングステージが、ステージ３１４として示される。

【0155】

第２のカーネルは、図８に示される期間の間に３つの光シミュレーション３２０，３２２，３２４を行う。例えば、第２のカーネルは、レンダリングの前処理に関するデータを第２のサブスペースに対して書き込む。

【0156】

図８の第１の画像レンダー３０２は、過去の光シミュレーション（図示せず）の結果を使用する。第２の画像レンダー３０４と第３の画像レンダー３０６は、それぞれ第１の光シミュレーション３２０の結果を使用する。第４の画像レンダー３１０と第５の画像レンダー３１２は、それぞれ第２の光シミュレーション３２２の結果を使用する。例えば、第１のカーネルは、第２のサブスペースに書き込まれたデータを読み込み、前記書き込まれたデータに基づいて少なくとも１つの画像をレンダリングする。

【0157】

図８の方法では、ライティングとレンダリングの両方が並列にパイプライン式に実行され、当該レンダリングは最後の完了結果を用いる。

【0158】

操作をカーネルに割り当てるときには、待ち時間を低下させる操作が有利であるだろう。レンダリングと光シミュレーションの場合、待ち時間を低下させる操作は、典型的にはレンダリングだろう。

【0159】

最後のライティング更新からの経過時間により、実行の優先度を重み付けしてよい。例えば、ライティング計算ｖ．ｓ．レンダリング計算でどちらの操作を行うべきか決定するために、重み付けを使用してよい。重み付けは、ライティング状態の陳腐化（ｓｔａｌｅｎｅｓｓ）と説明されることがある最後にライティング状態が計算されてからどれだけ経ったかに依存してもよく、これは、ライティング状態の陳腐化（ｓｔａｌｅｎｅｓｓ）と説明されることがある。重み付けは、生成されたレンダリング計算の待ち時間に依存してよい。重み付けは、ライティング状態の陳腐化ｖ．ｓ．生成されたレンダリング計算の待ち時間とのバランスを取ってもよい。重み付けスキームを駆動するために、目標画像フレームレートと目標ライティングフレームレートとを使用できる。例えば、ライティング計算およびレンダリング計算は、最後のライティング計算からの経過時間に基づく重み付け方法を用いて、第１のカーネルと第２のカーネルとに割り当てられる。

【0160】

十分なメモリが利用可能である限りは、パイプライン化から利益が得られるだろう。パイプライン化は一連の処理をステップに分割することを含んでよく、各ステップは一連の処理全体にかかる時間の一部を占める。各ステップの容量が１アイテムに限定されている場合であっても、当該処理は一度に複数のインスタンスに取り掛かってよい。例えば、過去のライティングシミュレーションの結果が現在のレンダリング処理により使用されているときに、次のライティングシミュレーションを開始してよい。パイプライン化は、処理の高速化を減じる可能性がある。

【0161】

更なる実施形態において、それぞれがマルチスレッディング可能な複数のＧＰＵを使用してよい。

【0162】

上述した実施形態では、画像がレンダリングされるボリューメトリックデータセットは、連続する画像をレンダリングする間に変化しない静的データセットである。例えば、ボリューメトリックデータセットは、医用スキャンにより過去に得られた医用画像データセットであってよい。スキャンされた解剖学的構造を通り抜けるためにＶＲヘッドセットを使用してよい。他の実施形態では、レンダリングが行われている間にボリューメトリックデータセットが変化してよい。異なるボリューメトリックデータを用いて異なるレンダリングステップを行ってよい。そのような実施形態では、ボリューメトリックデータセットが変更されると、ライティング計算が自動的に再スタートされるようにしてよい。レンダリング再スタートの前に新しいライティング状態を計算するために、両または全てのＧＰＵを使用してよい。

【0163】

仮想現実はとくに高いフレームレートを使用するアプリケーションであるため、上では仮想現実に関して実施形態を説明した。他の実施形態では、ＶＲヘッドセットではない任意の好適なディスプレイ装置上に表示するために、画像をレンダリングしてよい。任意の好適なフレームレートで画像をレンダリングしてよい。

【0164】

上記実施形態は医用撮像データについて説明されているが、他の実施形態では、上述した方法を用いて任意のデータをレンダリングしてよい。例えば、当該データは石油やガスデータを含んでよい。当該データは３次元の顕微鏡データを含んでよい。当該データは、例えば、気候データ、地質調査、人口統計、またはゲームデータを含んでよい。

【0165】

ある実施形態は、医用画像をレンダリングする医用画像処理装置を提供する。当該医用画像処理装置は、第１のＧＰＵと、第２のＧＰＵと、共通メモリとを備える。当該共通メモリは、当該第１のＧＰＵと当該第２のＧＰＵの両方により読み出され、当該第１のＧＰＵにより書き込み可能な第１のサブスペースと当該第２のＧＰＵにより書き込み可能な第２のサブスペースとを有するように構成される。当該第１のサブスペースと当該第２のサブスペースは互いに独立し、当該第１のＧＰＵはレンダリングの前処理に関するデータを当該第１のサブスペースに書き込むように構成され、当該第２のＧＰＵは当該書き込まれたデータを読み出し、当該書き込まれたデータに基づいて画像をレンダリングする、ように構成される。

【0166】

ある実施形態は医用撮像方法を提供する。当該医用撮像方法では、単一の放射照度ストレージデータ構造が仮想クロスＧＰＵアドレススペースに広がり、各ＧＰＵは、放射照度データを書き込むために確保されている当該アドレススペースのサブセットを得る。当該方法は、光シミュレーション方法および／またはレンダリング方法のセットを備え、放射照度ストレージのインデックス構造だけがＧＰＵ間で明示的に同期され、放射照度データは、転送可能であれば直ちに仮想メモリページとして転送される状態にしておく。

【0167】

レンダリング及びライティングを異なるＧＰＵに割り当て、独立したレートで最小の同期を用いて実行するようにパイプライン化してよい。

【0168】

ライティング作業を部分に分けてよい。完了ページは重複してジャストインタイム式で転送され、その後単一のＧＰＵ上のカーネルでマージされてよい。

【0169】

放射照度構造は、フォトンマップ、放射照度クエリ（別名、放射照度キャッシュ）の空間ツリー、または密ボリュームであってよい。

【0170】

レンダリング／マージ処理は、当該転送を当該レンダリングまたはマージ処理に効率良く重ねるために、ブロックアクセス順序のリストを維持してよい。

【0171】

ＶＲヘッドセットを駆動するために協調マルチＧＰＵレンダリング方法を用いてよい。１つのＧＰＵにユーザ動作応答性を確保するタスクを課してよい。

【0172】

第２のＧＰＵは、システムメモリにアクセスしＰＣＩｅを介して通信するＳｏＣ内蔵ＧＰＵであってよい。

【0173】

ページを転送するために、ＮＶＬｉｎｋのようなインターＧＰＵリンクを用いてよい。

【0174】

ブロックは、第２の管理スレッドからヒープポインタを観察して、光シミュレーション中にジャストインタイムで転送されてよい。

【0175】

ＡＩおよび再構成に使用される共有マルチＧＰＵアクセラレータは、迅速なＧＩ体験を可能にするために使用されてもよい。

【0176】

ある実施形態では、マルチカーネル実行サポートを有する単一のＧＰＵと、フォトンマップまたは密放射照度ボリュームの形式の放射照度データ構造と、マルチパス・グローバルイルミネーション・アルゴリズムと、を備える医用撮像装置を提供する。ライティングとレンダリングの両方が並列にパイプライン式に実行され、レンダリングは最後の完了結果を用いる。

【0177】

最後のライティング更新からの経過時間により、実行の優先度を重み付けしてよい。

【0178】

重み付けスキームを駆動するために、目標画像フレームレートと目標ライティングフレームレートとを使用してよい。

【0179】

ある実施形態は、複数のＧＰＵを用いてレンダリングおよびライティング処理を行う画像レンダリング方法を提供する。当該方法は、放射照度データを生成し、仮想アドレススペースを有するストレージ構造に当該放射照度データを記憶すること；当該仮想アドレススペースの個別のサブスペースへのアクセスを各ＧＰＵに与えること；当該仮想アドレススペースのインデックス構造を当該ＧＰＵ間で同期すること；当該複数のＧＰＵを用いて当該ライティングおよびレンダリング処理を行うこと、を含む。

【0180】

当該レンダリング処理と当該ライティング処理は、当該ＧＰＵの第１のＧＰＵと当該ＧＰＵの第２のＧＰＵによりそれぞれ実行されてよい。

【0181】

当該第１のＧＰＵと当該第２のＧＰＵは、当該レンダリング処理と当該ライティング処理を異なる独立したレートで実行するように構成されてよい。

【0182】

当該方法は、放射照度データが転送可能になることに応答して、放射照度データを仮想メモリページとして転送することを更に含んでよい。

【0183】

ライティング処理の結果は、重複してジャストインタイム式で転送される完了ページに分割され、その後単一のＧＰＵ上のカーネルでマージされてよい。

【0184】

放射照度構造は、フォトンマップ、放射照度クエリ（別名、放射照度キャッシュ）の空間ツリー、または密ボリュームのいずれであってよい。

【0185】

ブロックアクセス順序を維持してよい。

【0186】

当該方法はＶＲヘッドセットを駆動することを更に含んでよく、当該ＧＰＵのうち少なくとも１つのＧＰＵにユーザ動作応答性を確保するタスクを課してよい。

【0187】

特定の回路が本明細書において説明されているが、代替の実施形態において、これらの回路の内の１つまたは複数の機能を、１つの処理リソースまたは他のコンポーネントによって提供することができ、または、１つの回路によって提供される機能を、２つまたはそれより多くの処理リソースまたは他のコンポーネントを組み合わせることによって提供することができる。１つの回路への言及は、当該回路の機能を提供する複数のコンポーネントを包含し、そのようなコンポーネントがお互いに隔たっているか否かにかかわらない。複数の回路への言及は、それらの回路の機能を提供する１つのコンポーネントを包含する。

【0188】

所定の実施形態が説明されているが、これらの実施形態は、例示のためにのみ提示されており、発明の範囲を限定することは意図されない。実際は、本明細書において説明された新規な方法およびシステムは、様々な他の形態で具体化することができる。更に、本明細書において説明された方法およびシステムの形態における様々な省略、置き換え、および、変更が、発明の要旨を逸脱することなくなされてよい。添付の特許請求の範囲の請求項およびそれらに均等な範囲は、発明の範囲にはいるような形態および変更をカバーすると意図される。

【0189】

実施形態における技術的思想を医用画像処理方法で実現する場合、当該医用画像処理方法は、医用画像をレンダリングする医用画像処理方法であって、第１のＧＰＵと第２のＧＰＵとのそれぞれにより、仮想メモリに記憶されるデータ構造から個別のデータを読み出し、第１のＧＰＵと第２のＧＰＵとのそれぞれにより、個別のデータを前記データ構造へ書き込むことを含み、データ構造８０は、第１のＧＰＵと第２のＧＰＵとから読み込まれ、第１のＧＰＵがデータ構造８０の第１のサブスペースに書き込み可能であって、第２のＧＰＵがデータ構造８０の第２のサブスペースに書き込み可能であり、第１のサブスペースと第２のサブスペースとは独立し、第２のＧＰＵは、レンダリングの前処理に関するデータを第２のサブスペースに対して書き込み、第１のＧＰＵは、書き込まれたデータを読み込み、当該書き込まれたデータに基づいて少なくとも１つの画像をレンダリングする。医用画像処理方法における各種処理の手順および効果は、実施形態と同様なため、説明は省略する。

【0190】

以上説明した少なくとも１つの実施形態によれば、大域照明（グローバルイルミネーション）を伴うボリュームレンダリングの処理を、低コストかつ高速に実行することができる。

【0191】

本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。

【符号の説明】

【0192】

１０装置（医用画像処理装置）
１２コンピューティング装置
１４ＣＴスキャナ
１５ＶＲヘッドセット
１６ディスプレイスクリーン
１８入力装置
１９バス
２０データ記憶部
２２ＣＰＵ
２４ＣＰＵメモリ
２６ライティング制御回路
２８レンダリング制御回路
２９表示回路
３０ＧＰＵメモリ
３１ＧＰＵメモリ

【図1】