【文献】
P. Wang et al.,"Action Recognition From Depth Maps Using Deep Convolutional Neural Networks",IEEE Transactions on Human-Machine Systems,米国,IEEE,2016年08月,vol. 46, no. 4,pp. 498-509
(58)【調査した分野】(Int.Cl.,DB名)
前記ディープラーニングアルゴリズム解析部は、前記複数の3次元データに対する前記2次元畳み込みニューラルネットワークの適用結果を畳み込み層(convolutional layer)、完全接続層(fully−connected layer)、出力層(output layer)、及び最終結果の平均を出す判定レベル融合(decision level fusion)のうちのいずれかで合わせる、請求項1に記載の仮想3次元深層ニューラルネットワークを利用する画像解析装置。
前記合わせるステップは、前記複数の3次元データに対する前記2次元畳み込みニューラルネットワークの適用結果を畳み込み層(convolutional layer)、完全接続層(fully−connected layer)、出力層(output layer)、及び最終結果の平均を出す判定レベル融合(decision level fusion)のうちのいずれかで合わせる、請求項4に記載の仮想3次元深層ニューラルネットワークを利用する画像解析方法。
【背景技術】
【0002】
人工ニューラルネットワーク(artificial neural network、ANN)は、機械学習(machine learning)を実現する技法の一つである。
【0003】
一般に、人工ニューラルネットワークは、入力層(input layer)、隠れ層(hidden layer)及び出力層(output layer)で構成されている。各層は、ニューロン(neuron)で構成されており、各層のニューロンは、以前層のニューロンの出力に接続されている。以前層のニューロンの各出力値とそれに相応する接続重み(weight)を内積(inner product)した値にバイアス(bias)を加えた値を、一般的に非線形(non−linear)である活性化関数(activation function)に入れ、その出力値を次の段階層のニューロンへ伝達する。
【0004】
従来の機械学習手法は、入力データからヒトにより設計された特徴抽出(feature extraction)過程を介して得た情報から分類器(classifier)を学習するのに対し、人工ニューラルネットワークは、特徴抽出と分類器を最初から最後まで学習(エンドツーエンド学習(end−to−end learning))することが特徴である。
【0005】
畳み込みニューラルネットワーク(convolutional neural network、CNN)は、画像認識分野で従来の機械学習手法の性能を圧倒し、大きく注目されている。畳み込みニューラルネットワークの構造は、一般的な人工ニューラルネットワークの構造とほぼ同一であるが、追加の構成要素としては、畳み込み層(convolutional layer)とプーリング層(pooling layer)がある。
【0006】
一般的な畳み込みニューラルネットワークの構造は、畳み込み層とプーリング層が交互に配置され、二・三個程度の完全接続層(fully−connected layer)を経て最終的に出力層がくる。畳み込み層のニューロンは、以前層のすべてのニューロンに完全接続(fully−connected)される人工ニューラルネットワークとは異なり、以前層の小さな地域にのみ接続(local connectivity)されている。
【0007】
また、特徴マップ(feature map)と同じスライス(slice)に属するニューロンは、同一の値(パラメータ共有(parameter sharing))の重みとバイアスを有する。このように行われる演算が畳み込みであり、適用される重みの集合をフィルタ(filter)またはカーネル(kernel)と呼ぶ。畳み込みニューラルネットワークは、画像での特徴を効果的に抽出することができ、パラメータの数を減らして過適合(overfitting)を防止し、一般化(generalization)性能を向上させることができる。
【0008】
プーリング層は、畳み込み層同士の間に位置し、特徴マップ(feature map)の空間的(spatial)サイズを低減する役割を果たす。このような過程も、パラメータの数を減らして過適合を防止する役割を果たす。最もよく使われる形式は、2×2のフィルタを2の間隔で適用させる最大プーリング(max−pooling)方法である。この過程は、特徴マップのサイズを幅、高さ方向に対してそれぞれ半分ずつ減少させる。
【0009】
一方、従来技術としては、ビジュアルコンテンツベースの画像認識のためのディープラーニングフレームワーク及び画像認識方法に関する韓国公開特許第10−2016−0122452号公報(2016年10月24日公開)がある。しかし、上記の技術は、基本的なディープラーニングモデルを適用するフレームワークを提供するもので、特定の構造のモデルを構成するのとは多少距離がある。
【発明の概要】
【発明が解決しようとする課題】
【0011】
上述した従来技術の問題点を解決するための本発明の目的は、2次元画像を3次元空間で3次元データに再構成し、再構成した3次元データを回転させて他の3次元データを生成し、生成された複数の3次元データのそれぞれに2次元畳み込みニューラルネットワークを適用して合わせることにより、深層ニューラルネットワークで容易に3次元画像データを解析することができる画像解析装置及び方法を提供することにある。
【課題を解決するための手段】
【0012】
上記の技術的課題を解決するための本発明のある観点による仮想3次元深層ニューラルネットワークを利用する画像解析装置は、複数の2次元画像データを所定の順に積む画像取得部と、前記画像取得部からの積んだ形態の複数の2次元画像データに対する互いに異なる形態の複数の情報に基づいて複数の3次元データを生成する3次元画像生成部と、前記3次元画像生成部からの複数の3次元データに対して2次元畳み込みニューラルネットワークを適用し、前記複数の3次元データに対する2次元畳み込みニューラルネットワークの適用結果を合わせるディープラーニングアルゴリズム解析部と、を含む。
【0013】
一実施形態において、前記3次元画像生成部は、前記複数の3次元データを生成する前に、前記複数の2次元画像データのそれぞれに対してゼロ平均(zero−mean)または単位分散(unit−variance)演算を行うことができる。
【0014】
一実施形態において、前記互いに異なる形態の複数の情報は、前記積んだ2次元画像データの時間または位置による動きまたは模様の変化に対応するパターンを認識したことを含むことができる。
【0015】
一実施形態において、前記ディープラーニングアルゴリズム解析部は、前記複数の3次元データに対する前記2次元畳み込みニューラルネットワークの適用結果を畳み込み層(convolutional layer)、完全接続層(fully−connected layer)、出力層(output layer)、及び最終結果の平均を出す判定レベル融合(decision level fusion)のうちのいずれかで合わせることができる。
【0016】
上記の技術的課題を解決するための本発明の他の観点による仮想3次元深層ニューラルネットワークを利用する画像解析方法は、画像取得部で、複数の2次元画像データを所定の順に積むステップと、3次元画像生成部で、積んだ形態の前記複数の2次元画像データに対する互いに異なる形態の複数の情報に基づいて複数の3次元データを生成するステップと、ディープラーニングアルゴリズム解析部で、前記複数の3次元データのそれぞれに対して2次元畳み込みニューラルネットワークを適用し、前記複数の3次元データに対する2次元畳み込みニューラルネットワークの適用結果を合わせるステップと、を含む。
【0017】
一実施形態において、前記生成するステップは、前記複数の3次元データを生成する前に、前記複数の2次元画像データのそれぞれに対してゼロ平均(zero−mean)または単位分散(unit−variance)演算を行うことができる。
【0018】
一実施形態において、前記合わせるステップは、前記複数の3次元データに対する前記2次元畳み込みニューラルネットワークの適用結果を畳み込み層(convolutional layer)、完全接続層(fully−connected layer)、出力層(output layer)、及び最終結果の平均を出す判定レベル融合(decision level fusion)のうちのいずれかで合わせることができる。
【0019】
上記の技術的課題を解決するための本発明の別の観点による仮想3次元深層ニューラルネットワークを利用する画像解析装置は、2次元画像を撮影位置または時間順に積む画像取得部と、前記画像取得部から伝達された2次元画像で第1の3次元画像データを生成し、前記第1の3次元画像データから、前記撮影位置または時間を示す軸が残りの2つの軸のいずれかに一致するように回転させた第2の3次元画像データを生成する3次元画像生成部と、前記3次元画像生成部から伝達された複数の3次元データのそれぞれに対して2次元畳み込みニューラルネットワークを適用し、各3次元データに対する適用結果を合わせるディープラーニングアルゴリズム解析部と、を含む。
【0020】
一実施形態において、前記3次元画像生成部は、前記2次元画像のフレーム間の差異またはオプティカルフローを介して得られた前記2次元画像を回転させて得た他の2次元画像に基づいて、追加の3次元データを生成することができる。
【0021】
上記の技術的課題を解決するための本発明の別の観点による仮想3次元深層ニューラルネットワークを利用する画像解析方法、画像取得部から2次元画像を撮影位置または時間順に積むステップと、3次元画像生成部で前記画像取得部からの2次元画像で第1の3次元画像データを生成し、前記第1の3次元画像データから、前記撮影位置または時間を示す軸が残りの2つの軸のいずれかに一致するように回転させた第2の3次元画像データを生成するステップと、ディープラーニングアルゴリズム解析部で、前記3次元画像生成部からの複数の3次元データのそれぞれに対して2次元畳み込みニューラルネットワークを適用し、各3次元データに対する適用結果を合わせるステップと、を含む。
【0022】
一実施形態において、前記生成するステップは、前記2次元画像のフレーム間の差異またはオプティカルフローを介して得られた前記2次元画像を回転させて得た他の2次元画像に基づいて、追加の3次元データを生成することができる。
【発明の効果】
【0023】
本発明によれば、一般的な3次元畳み込みニューラルネットワーク方法に比べてさらに少ないパラメータを持つ2次元畳み込みニューラルネットワークを利用して3次元データをさらに効率よく学習し、画像解析することができるという利点がある。
【0024】
また、本発明によれば、パラメータの数が非常に多いためメモリを多く占め、学習するときに長い時間がかかり、学習されたモデルを使用するときに計算時間が長い3次元畳み込みニューラルネットワークモデルの問題点を解決することができるとともに、3次元画像データに対して効率の良い学習と画像解析を行うことができる新しい画像解析モデルを提供することができる。
【発明を実施するための形態】
【0026】
以下、添付図面を参照して、本発明の好適な実施形態をより詳細に説明する。本発明を説明するにあたり、全体的な理解を容易にするために、図面上の同一の構成要素については同一の参照符号を使用し、同一の構成要素について重複した説明は省略する。
【0027】
図1は本発明の一実施形態に係る仮想3次元深層ニューラルネットワークを利用する画像解析装置のブロック図である。
【0028】
図1を参照すると、本実施形態に係る画像解析装置100は、画像取得部110、3次元画像生成部120及びディープラーニングアルゴリズム解析部130を含む。
【0029】
画像取得部110は、2次元画像の撮影角度または時間に応じて順次積んだ2次元画像を準備する。画像取得部110は、カメラ、制御部、通信部などに接続できる。
【0030】
3次元画像生成部120は、画像取得部110から受信した2次元画像で複数の3次元データを生成する。簡単な例として、3次元画像生成部120は、2次元画像を積層して第1の3次元データに変換し、変換された第1の3次元データを3次元空間で任意の角度で、好ましくは3次元空間上における3軸(x、y、z)のいずれかの軸がもう一つの軸の位置に回転して第2の3次元データを生成するように3次元データを複数個に再構成することができる。
【0031】
これは、所定の基準に基づいて、例えば、時間軸に沿って積層される複数の2次元画像データを前記複数の2次元画像データに対する相対的な時間または位置変化に応じて互いに異なる形態の複数の3次元データを得ることができることを示す。すなわち、本実施形態では、2次元画像データを積み、積んだ2次元画像データに対する時間または位置変化に基づいて複数の演算をそれぞれ行って複数の3次元データを取得することができる。3次元データは3次元画像データを含むことができる。
【0032】
また、一例として、細胞画像のように動く動画像についての情報を含む2次元画像データは、2次元画像データのそれぞれでモフォロジーが変わることができ、位置が変わりうる形態、すなわち、トラッキングを行うことができる状態を持つ。ここで、画像認識装置は、外郭線を考慮する場合、位置または時間による2次元画像データから、輪郭線が変わっているか位置が少し変わっているなどの差異を抽出し、2次元画像データを3次元データ化する場合において、抽出された情報に基づいて動きの変化または模様の変化に対応するパターンを認識することができる。画像認識装置は、ボリュームメトリーなどを用いてパターン認識を行うことができる。
【0033】
つまり、2次元画像データをX−Y平面上に時間軸(Z)方向に積むとするとき、積んだ2次元画像データは、3次元データ形態を有し、ここで積んだ2次元画像データを上方から見たときと側方から見たときの差異が発生し、例えば、2次元画像データを上方からみた場合、その差異はモフォロジーの差異が主な差異として認識でき、2次元画像データを側方から見た場合、その差異は時間的な差に応じてその位置に対する変化として認識できる。このように、本実施形態では、積んだ2次元画像データに対する他の形態として認識される複数のデータ、すなわち複数の仮想3次元データを取得して利用する。
【0034】
ディープラーニングアルゴリズム解析部130は、再構成された複数の3次元データのそれぞれに対して2次元畳み込みニューラルネットワーク(2D Convolutional Neural Network、CNN)を適用し、各3次元データに対する適用結果を合わせて3次元画像を解析する。
【0035】
このように、本実施形態では、2次元画像データを積んだ後、積んだ2次元画像データに対する異なる形態の情報を2次元畳み込みニューラルネットワークで学習して3次元画像解析を行うことを主な技術的特徴とする。
【0036】
前述した構成要素110乃至130は、ハードウェア的に構成できるが、これに限定されない。画像解析装置100の構成要素は、ソフトウェアモジュール形態でメモリなどの記憶装置に格納され、記憶装置に接続されるプロセッサがソフトウェアモジュールを実行して仮想3次元深層ニューラルネットワークをベースに、3次元画像データを効率よく学習し解析するように実現できる。
【0037】
以下、仮想3次元深層ニューラルネットワークを利用する画像解析装置について詳細に説明する。
【0038】
図2は
図1の画像解析装置の作動原理を図式的に示す例示図である。
【0039】
図2を参照すると、画像取得部は、外部から受信または取得した2次元画像、或いは画像解析装置の外部または内部のメモリなどに格納されていることを読み出した2次元画像を撮影位置または撮影時間に基づいて積むことができる。
【0040】
3次元画像生成部は、画像取得部から伝達された2次元画像を用いて複数の3次元データを生成する。3次元データは3次元画像データを含むことができる。
【0041】
3次元画像生成部は、複数の2次元画像を撮影位置または時間順に積層させて3次元画像データを生成することができる。3次元画像生成部は、生成された3次元画像データを所定の角度で回転させて追加の3次元画像データを生成することができる。
【0042】
例えば、3次元画像データに対して互いに直交する3つの方向について解析を行う場合には、次の過程によって複数の3次元画像データを生成することができる。すなわち、2次元画像の二軸をx、yとし、2次元画像の撮影位置または時間を示す軸をzとすれば、z軸の順序そのまま2次元画像を積層させて作った3次元データDxyz(第1の3次元データ)と、Dxyzを他の2つの軸方向にそれぞれ回転させて作った3次元データDyzxと3次元データDzxyを使用することができる。
【0043】
もちろん、最終モデルのメモリサイズ、計算速度または目標性能に応じて3方向のうちの2方向に対してのみ進行することができる。
【0044】
また、3次元画像生成部は、上述した複数の3次元データに加えて、別の3次元データをさらに生成して使用することができる。すなわち、3次元画像生成部は、本来の2次元画像から、予め準備された計算によって得た別の画像に対して上述の方法を適用して複数の3次元画像を生成することができる。例えば、各2次元画像に対してゼロ平均(zero−mean)と単位分散(unit−variance)を持つように正規化(normalization)を経た後、上述の方法によって複数の3次元データを生成することができる。
【0045】
別の実現において、3次元画像生成部は、ビデオの場合には、フレーム間の差異またはオプティカルフロー(optical flow)などの計算を介して得た画像と、それらの画像を回転させて追加の3次元画像を生成することができる。
【0046】
ディープラーニングアルゴリズム解析部は、必要に応じて、3次元画像生成部から受信した複数の3次元データに対してそれぞれ任意の間隔で分割し投影することにより、複数の2次元データセットを生成することができる。複数の2次元データセットを3次元データに含むことができる。
【0047】
ディープラーニングアルゴリズム解析部は、3次元画像生成部から受信した複数の3次元データのそれぞれに対して2次元畳み込みニューラルネットワークを適用し、これらを合わせる過程を経て画像解析結果を得ることができる。
【0048】
ディープラーニングアルゴリズム解析部において、各2次元畳み込みニューラルネットワークが合わさるところは、畳み込み層(convolutional layer)、完全接続層(fully−connected layer)または出力層(output layer)、または最終結果の平均を出す判定レベル融合(decision level fusion)であり得る。
【0049】
図3は
図1の画像解析装置に採用することができる2次元畳み込みニューラルネットワークの作動原理を説明するための例示図である。
図4は比較例に係る3次元畳み込みニューラルネットワークの作動原理を説明するための例示図である。
【0050】
まず、
図3を参照すると、2次元畳み込みニューラルネットワークの畳み込み(convolution)計算構造が示されている。2次元畳み込みニューラルネットワークの畳み込み計算構造は、下記数式1で表される。
【0052】
前述した2次元畳み込みニューラルネットワークは、画像認識において優れた性能を示している。しかし、行われる畳み込み(convolution)が2次元空間(spatial)特徴のみを計算するから、2次元畳み込みニューラルネットワークのみを利用する場合には、複数の2次元画像が集まった3次元画像における深さまたは時間方向への情報を学習することができない。
【0053】
上述した問題を克服するために、3次元畳み込みニューラルネットワークモデルを代替して使用しても、一般的な3次元畳み込みニューラルネットワークは、3次元画像を解析するために3次元フィルタを学習するので、パラメータの数が多いためメモリを多く占め、学習に長い時間がかかる(数式2参照)。このため、本実施形態では、2次元畳み込みニューラルネットワークを利用する畳み込み計算構造と3次元畳み込みニューラルネットワークを利用する畳み込み計算構造を新しい方法で組み合わせて使用する。
【0054】
2次元畳み込みニューラルネットワークの畳み込み計算構造に結合する3次元畳み込みニューラルネットワークの畳み込み計算構造は、
図4のように図示でき、下記数式2で表される。
【0056】
このように、前述した3次元畳み込みニューラルネットワークモデルのみを用いる従来の技術は、基本的にパラメータの数が非常に多いためメモリを多く占め、学習させるときに長い時間がかかり、さらには学習されたモデルを使用するときにも計算時間が長い。従って、本実施形態では、3次元畳み込みニューラルネットワークよりもさらに少ない数のパラメータを持つ2次元畳み込みニューラルネットワークを利用して3次元画像データに対して効率の良い学習を行い、画像を解析することができる。
【0057】
つまり、ディープラーニングアルゴリズム解析部は、3次元画像生成部から受信した複数の2次元データセット(複数の3次元データ)それぞれに対して2次元畳み込みニューラルネットワークを適用し、その適用結果を合わせる過程を含む「仮想3次元深層ニューラルネットワーク」による画像解析結果を導出することができる。
【0058】
図5は本発明の他の実施形態による仮想3次元深層ニューラルネットワークを利用する画像解析方法のフローチャートである。
【0059】
図5を参照すると、本実施形態に係る仮想3次元深層ニューラルネットワークを利用する画像解析方法は、まず、画像解析装置内の画像取得部で特定のグループの2次元画像を撮影位置または時間に基づいて積むステップ(S51)、2次元画像を用いて3次元画像(第1の3次元データ)を生成し、第1の3次元データを回転させた第2の3次元データを生成するステップ(S52)と、複数の3次元画像(第1および第2の3次元データ)それぞれに対して、2次元畳み込みニューラルネットワークを適用し、各3次元画像に対する適用結果を合わせるステップ(S53)と、を含む。
【0060】
本実施形態に係る仮想3次元深層ニューラルネットワークを利用する画像解析方法は、一般的な3次元畳み込みニューラルネットワーク方法に比べてさらに少ないパラメータを持つ2次元畳み込みニューラルネットワークを利用して3次元データをさらに効率よく学習し、画像解析に適用することができる。このような方法は、「仮想3次元深層ニューラルネットワーク」による方法と命名できる。
【0061】
図6は本発明の別の実施形態に係る仮想3次元深層ニューラルネットワークを利用する画像解析装置のブロック図である。
【0062】
図6を参照すると、本実施形態に係る画像解析装置100は、通信部160、制御部170及びメモリ180を含むことができる。画像解析装置100は、コントローラまたはコンピューティング装置を含んで実現できる。画像解析装置100は、ユーザー、管理者、制御端末などから入力に応じてデータまたは信号を処理した後、その結果を出力するための入出力装置190に接続できる。また、画像解析装置100は、データベースを備えるデータベースシステム200に接続できる。データベースは、解析しようとする画像を提供する装置の識別情報、接続情報及び認証情報のうちの少なくとも一つを含むことができる。
【0063】
本実施形態において、入出力装置190及びデータベースシステム200は、画像解析装置100に含まれない形態で示されているが、本発明は、そのような構成に限定されず、実現に応じて、入出力装置190およびデータベースシステム200のうちの少なくとも一つをさらに含むように実現できる。
【0064】
通信部160は、画像解析装置100を通信ネットワークに接続する。通信部160は、ネットワークを介してアクセスするユーザー端末、サーバ、管理者端末などから画像または画像解析に関連する情報或いは信号を受信することができる。
【0065】
通信部160は、一つ以上の通信プロトコルを支援する1つ以上の有線および/または無線通信サブシステムを含むことができる。有線通信サブシステムは、PSTN(public switched telephone network)、ADSL(Asymmetric Digital Subscriber Line)またはVDSL(Very high−data rate Digital Subscriber Line)ネットワーク、PES(PSTN Emulation Service)のためのサブシステム、IP(internet protocol)マルチメディアサブシステム(IMS)などを含むことができる。無線通信サブシステムは、無線周波数(radio frequency、RF)受信機、RF送信機、RF送受信機、光(例えば、赤外線)受信機、光送信機、光送受信機、またはこれらの組み合わせを含むことができる。
【0066】
無線ネットワークは、基本的にWi−Fiを指すが、これに限定されない。本実施形態において、通信部160は、様々な無線ネットワーク、例えば、GSM(登録商標)(Global System for Mobile Communication)、EDGE(Enhanced Data GSM(登録商標)(Environment)、CDMA(Code Division Multiple Access)、W−CDMA(W−Code Division Multiple Access)、LTE(Long Term Evolution)、LET−A(LET−Advanced)、OFDMA(Orthogonal Frequency Division Multiple Access)、WiMax、Wi−Fi(Wireless Fidelity)、及びBluetooth(登録商標)などから選択される少なくとも一つを支援するように実現できる。
【0067】
制御部170は、内蔵メモリ或いはメモリ180に格納されるソフトウェアモジュールまたはプログラムを行って画像解析方法を実現することができる。制御部170は、例えば、プロセッサと呼ばれることもあり、
図5に示した一連の手続きを行うことができる。
【0068】
制御部170は、少なくとも一つの中央処理装置(CPU)またはコアを含むプロセッサやマイクロプロセッサで実現できる。中央処理装置またはコアは、処理する命令語を格納するレジスタ(register)と、比較、判断、演算を担当する演算論理装置(arithmetic logical unit、ALU)と、命令語の解釈と実行のためにCPUを内部的に制御する制御ユニット(control unit)と、これらを接続する内部バスなどを備えることができる。中央処理装置またはコアは、MCU(micro control unit)と周辺装置(外部拡張装置のための集積回路)が一緒に配置されるSOC(system on chip)で実現できるが、これに限定されない。
【0069】
また、制御部170は、一つ以上のデータプロセッサ、イメージプロセッサまたはコーデック(CODEC)を含むことができるが、これに限定されない。制御部170は、周辺装置インターフェースとメモリインターフェースを備えることができる。周辺装置インターフェースは、制御部170と入出力装置190などの入出力システムまたは他の周辺装置とを接続し、メモリインターフェースは、制御部170とメモリ180とを接続することができる。
【0070】
メモリ180は、仮想3次元深層ニューラルネットワークを利用して画像を解析するためのソフトウェアモジュールを格納することができる。ソフトウェアモジュールは、
図5のステップ(S51乃至S53)をそれぞれ行う第1モジュール乃至第3モジュールを含むことができる。
【0071】
前述したメモリ180は、不揮発性ランダムアクセスメモリ(non−volatile RAM、NVRAM)、代表的な揮発性メモリであるDRAM(dynamic random access memory)などの半導体メモリ、ハードディスクドライブ(hard disk drive、HDD)、光ストレージ装置、フラッシュメモリなどで実現できる。そして、メモリ180は、仮想3次元深層ニューラルネットワークを利用して画像を解析するためのソフトウェアモジュールの他に、オペレーティングシステム、プログラム、命令セットなどを格納することができる。
【0072】
一方、本実施形態に係る画像解析方法は、様々なコンピュータ手段を介して実行できるプログラム命令形態で実現され、コンピュータ可読媒体に記録できる。コンピュータ可読媒体は、プログラム命令、データファイル、データ構造などを単独でまたは組み合わせて含むことができる。コンピュータ可読媒体に記録されるプログラム命令は、本発明のために特別に設計され構成されたもの、またはコンピュータソフトウェアの当業者に公知になって使用可能なものであり得る。
【0073】
コンピュータ可読媒体の例には、ROM、RAM、フラッシュメモリ(flash memory)などのようにプログラム命令を格納し実行するように特別に構成されたハードウェア装置が含まれる。プログラム命令の例には、コンパイラ(compiler)によって作られるような機械語コードだけでなく、インタプリター(interpreter)などを用いてコンピュータによって実行できる高級言語コードを含む。上述したハードウェア装置は、本発明の動作を行うために少なくとも一つのソフトウェアモジュールで作動するように構成でき、その逆も同様である。
【0074】
以上のように、本実施形態では、3次元画像データを解析するための深層ニューラルネットワークの構造を構成する方法を提供する。本実施形態に係る仮想3次元深層ニューラルネットワークの構造は、入力された医療画像から疾病の診断を下したり、病変の位置を見付けたり、ビデオからヒトの行動を認識したりするなどの3次元画像データの解析に活用できる。
【0075】
以上、本発明の好適な実施形態を参照して説明したが、当該技術分野における熟練した当業者は、下記特許請求の範囲に記載された本発明の思想及び領域から逸脱することなく、本発明を多様に修正及び変更させることができることが理解できるだろう。