(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024104011
(43)【公開日】2024-08-02
(54)【発明の名称】形状推定システム、形状推定方法及びプログラム
(51)【国際特許分類】
G01S 17/894 20200101AFI20240726BHJP
【FI】
G01S17/894
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2023008001
(22)【出願日】2023-01-23
(71)【出願人】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(71)【出願人】
【識別番号】504143441
【氏名又は名称】国立大学法人 奈良先端科学技術大学院大学
(74)【代理人】
【識別番号】110001634
【氏名又は名称】弁理士法人志賀国際特許事務所
(72)【発明者】
【氏名】柴田 剛志
(72)【発明者】
【氏名】木村 昭悟
(72)【発明者】
【氏名】五十川 麻理子
(72)【発明者】
【氏名】向川 康博
(72)【発明者】
【氏名】舩冨 卓哉
(72)【発明者】
【氏名】藤村 友貴
(72)【発明者】
【氏名】櫛田 貴弘
(72)【発明者】
【氏名】田中 賢一郎
【テーマコード(参考)】
5J084
【Fターム(参考)】
5J084AA04
5J084AA05
5J084AA10
5J084CA65
(57)【要約】
【課題】形状の推定の精度を向上させること。
【解決手段】環境中に一つ以上の物体が存在した場合における前記環境を光学系を用いて計測した観測データを所定の時間分解能以上の時間分解能を持つ時系列データとして取得するデータ入力部と、前記観測系のパラメタと時空間畳み込み関数の積分核と変換関数モデルとを観測モデルとして取得する観測モデル入力部と、前記時系列データを正規化処理により変換する前処理部と、前記前処理部の変換した時系列データに基づき得られる観測データ制約項と、推定される物体形状が空間的に滑らかであるという条件を表現する形状制約項とからなる最適化関数、が最小となるように前記物体の密度場を最適化する最適化部と、最適化関数を最小にすることで、観測系のパラメタと時空間畳み込み関数の積分核と変換関数モデルとを推定する観測モデル推定部と、を備える形状推定システム。
【選択図】
図1
【特許請求の範囲】
【請求項1】
環境中に一つ以上の物体が存在した場合における前記環境を光学系を用いて計測した観測データを所定の時間分解能以上の時間分解能を持つ時系列データとして取得するデータ入力部と、
前記データ入力部の得た観測データを得る観測系のパラメタと時空間畳み込み関数の積分核と変換関数モデルとを観測モデルとして取得する観測モデル入力部と、
前記データ入力部の得た時系列データを正規化処理により変換する前処理部と、
前記前処理部の変換した時系列データに基づき得られる項であり、前記観測モデルと前記時系列データとの差分が所定の値より小さいという条件を表現する項である観測データ制約項と、推定される物体形状が空間的に滑らかであるという条件を表現する形状制約項とからなる所定の関数である最適化関数、が最小となるように前記物体の密度場を最適化する最適化部と、
前記観測モデル入力部の得た前記観測系のパラメタと前記時空間畳み込み関数の積分核と前記変換関数モデルとを初期値として、前記最適化関数を最小にすることで、前記観測系のパラメタと前記時空間畳み込み関数の積分核と前記変換関数モデルとを推定する観測モデル推定部と、
前記最適化部の最適化の結果を出力するモデル出力部と、
を備える形状推定システム。
【請求項2】
観測環境のみを計測した時系列データを背景データとして取得する背景データ入力部と、
前記前処理部にて前処理がされた二次元時系列データを、前記背景データと各前記物体のそれぞれに対応する観測値とに分離する観測データ分離部と、
を備え、
前記観測データ制約項は、前記観測データ分離部が取得した物体ごとに分離された観測データと前記時系列データとの差分が所定の値より小さいという条件を表現する、
請求項1に記載の形状推定システム。
【請求項3】
前記データ入力部の取得する時系列データは、単一光子計測によって得られたデータである、
請求項1に記載の形状推定システム。
【請求項4】
前記観測モデル入力部は、前記光学系のパラメタとして空間方向及び時間方向の解像度と、形状の推定対象の物体までの大まかなスケールと、時間方向及び空間方向の積分核の概形と、を取得する、
請求項1に記載の形状推定システム。
【請求項5】
環境中に一つ以上の物体が存在した場合における前記環境を光学系を用いて計測した観測データを所定の時間分解能以上の時間分解能を持つ時系列データとして取得するデータ入力ステップと、
前記データ入力ステップの得た観測データを得る観測系のパラメタと時空間畳み込み関数の積分核と変換関数モデルとを観測モデルとして取得する観測モデル入力ステップと、
前記データ入力ステップの得た時系列データを正規化処理により変換する前処理ステップと、
前記前処理ステップの変換した時系列データに基づき得られる項であり、前記観測モデルと前記時系列データとの差分が所定の値より小さいという条件を表現する項である観測データ制約項と、推定される物体形状が空間的に滑らかであるという条件を表現する形状制約項とからなる所定の関数である最適化関数、が最小となるように前記物体の密度場を最適化する最適化ステップと、
前記観測モデル入力ステップの得た前記観測系のパラメタと前記時空間畳み込み関数の積分核と前記変換関数モデルとを初期値として、前記最適化関数を最小にすることで、前記観測系のパラメタと前記時空間畳み込み関数の積分核と前記変換関数モデルとを推定する観測モデル推定ステップと、
前記最適化ステップの最適化の結果を出力するモデル出力ステップと、
を有する形状推定方法。
【請求項6】
請求項1~4のいずれか一項に記載の形状推定システムとしてコンピュータを機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、形状推定システム、形状推定方法及びプログラムに関する。
【背景技術】
【0002】
劣悪な環境下での物体や環境の三次元形状の推定は、マシンビジョンとその応用において未だに重要な課題である。例えば、三次元の形状を推定することで、より高い精度で画像中の物体の種別・属性や、空間構造の把握が可能となる。例えば、複数の可視画像から形状を推定する方法が開示されている。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】O’Toole, Matthew, David B. Lindell, and Gordon Wetzstein. “Confocal non-line-of-sight imaging based on the light-cone transform.” Nature 555.7696 (2018): 338-341.
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、例えば,照明条件が悪い場合,霧などにより視認性が悪い、遮蔽物があるなど、可視画像で高精細画像の取得不可能な状況で、形状推定精度が著しく低下する。特に、半透明な物体や壁面など、計測対象のオブジェクトがセンサーから遮蔽されているという状況下での、形状の推定は、既存の可視画像を用いた場合に非常に困難である。
【0005】
近年、NLOS(Non-Line-of-Sight Launch System)イメージングとして知られている、パルスレーザー光とSPAD(Single Photon Avalanche Diode)センサー(以下、単一光子計測と呼ぶこともある)によるアクティブ計測および、その計測結果を用いた形状推定方法により、中継壁面上の反射・散乱光から壁の向こう側にある物体の形状を推定する方法が、非特許文献2に開示されている。
【0006】
しかしながら、これらの方法は、例えば、半透明物体越しの物体など、より一般的な撮像環境下での形状推定に適用することができない。
【0007】
上記事情に鑑み、本発明は、形状の推定の精度を向上させる技術を提供することを目的としている。
【課題を解決するための手段】
【0008】
本発明の一態様は、環境中に一つ以上の物体が存在した場合における前記環境を光学系を用いて計測した観測データを所定の時間分解能以上の時間分解能を持つ時系列データとして取得するデータ入力部と、前記データ入力部の得た観測データを得る観測系のパラメタと時空間畳み込み関数の積分核と変換関数モデルとを観測モデルとして取得する観測モデル入力部と、前記データ入力部の得た時系列データを正規化処理により変換する前処理部と、前記前処理部の変換した時系列データに基づき得られる項であり、前記観測モデルと前記時系列データとの差分が所定の値より小さいという条件を表現する項である観測データ制約項と、推定される物体形状が空間的に滑らかであるという条件を表現する形状制約項とからなる所定の関数である最適化関数、が最小となるように前記物体の密度場を最適化する最適化部と、前記観測モデル入力部の得た前記観測系のパラメタと前記時空間畳み込み関数の積分核と前記変換関数モデルとを初期値として、前記最適化関数を最小にすることで、前記観測系のパラメタと前記時空間畳み込み関数の積分核と前記変換関数モデルとを推定する観測モデル推定部と、前記最適化部の最適化の結果を出力するモデル出力部と、を備える形状推定システムである。
【0009】
本発明の一態様は、環境中に一つ以上の物体が存在した場合における前記環境を光学系を用いて計測した観測データを所定の時間分解能以上の時間分解能を持つ時系列データとして取得するデータ入力ステップと、前記データ入力ステップの得た観測データを得る観測系のパラメタと時空間畳み込み関数の積分核と変換関数モデルとを観測モデルとして取得する観測モデル入力ステップと、前記データ入力ステップの得た時系列データを正規化処理により変換する前処理ステップと、前記前処理ステップの変換した時系列データに基づき得られる項であり、前記観測モデルと前記時系列データとの差分が所定の値より小さいという条件を表現する項である観測データ制約項と、推定される物体形状が空間的に滑らかであるという条件を表現する形状制約項とからなる所定の関数である最適化関数、が最小となるように前記物体の密度場を最適化する最適化ステップと、前記観測モデル入力ステップの得た前記観測系のパラメタと前記時空間畳み込み関数の積分核と前記変換関数モデルとを初期値として、前記最適化関数を最小にすることで、前記観測系のパラメタと前記時空間畳み込み関数の積分核と前記変換関数モデルとを推定する観測モデル推定ステップと、前記最適化ステップの最適化の結果を出力するモデル出力ステップと、を有する形状推定方法である。
【0010】
本発明の一態様は、上記の形状推定システムとしてコンピュータを機能させるためのプログラムである。
【発明の効果】
【0011】
本発明によれば、形状の推定の精度を向上させることができる。
【図面の簡単な説明】
【0012】
【
図1】第1実施形態の形状推定システムの概要を説明する説明図。
【
図2】第1実施形態における学習装置の備える制御部の構成の一例を示す図。
【
図3】第1実施形態におけるモデル化の第1の例を示す図。
【
図4】第1実施形態におけるモデル化の第2の例を示す図。
【
図5】第1実施形態における光路の第1の例を示す図である。
【
図6】第1実施形態における光路の第2の例を示す図である。
【
図7】第1実施形態における光路の第3の例を示す図である。
【
図8】第1実施形態における形状推定装置の備える制御部の構成の一例を示す図。
【
図9】第1実施形態の学習装置の備える制御部が実行する処理の流れの一例を示すフローチャート。
【
図10】第1実施形態の形状推定装置の備える制御部が実行する処理の流れの一例を示すフローチャート。
【
図11】第1実施形態の学習装置のハードウェア構成の一例を示す図。
【
図12】第1実施形態の形状推定装置のハードウェア構成の一例を示す図。
【
図13】第2実施形態の形状推定システムの概要を説明する説明図。
【
図14】第2実施形態における形状推定装置の備える制御部の構成の一例を示す図。
【
図15】第2実施形態における形状推定装置の備える制御部が実行する処理の流れの一例を示すフローチャート。
【
図16】第2実施形態における形状推定装置のハードウェア構成の一例を示す図。
【
図17】第1実施形態及び第2実施形態における環境を計測した観測データを得る光学系の一例を示す図。
【発明を実施するための形態】
【0013】
(第1実施形態)
図1は、第1実施形態の形状推定システム100の概要を説明する説明図である。形状推定システム100は、学習装置1と形状推定装置2とを備える。
【0014】
学習装置1は、学習処理を実行する。学習処理は、深層学習等の機械学習の方法によって形状推定モデルの学習を行う処理である。形状推定モデルは、入力されたデータに基づいて推定対象の形状を推定する数理モデルである。推定対象の形状は、例えば推定対象の密度場である。
【0015】
形状推定モデルに入力されるデータは、推定対象の存在する環境下で光学系を用いて得られた時系列データ(以下「入力時系列データ」という。)である。推定対象の存在する環境下で得られた時系列データは、例えば、推定対象の存在する環境下で実行された単一光子計測により得られた時系列データである。
【0016】
機械学習の分野では学習済みという言葉がある。そこでこの表現を用いれば、学習の終了に関する所定の条件である学習終了条件が満たされた時点の形状推定モデルは、学習済みの形状推定モデルである。学習終了条件は、例えば、形状推定モデルの学習が所定の回数行われた、という条件であってもよいし、学習による形状推定モデルの変化が所定の変化よりも小さい、という条件であってもよい。
【0017】
学習済みの形状推定モデルは、形状推定装置2によって用いられる。形状推定装置2は、学習済みの形状推定モデルを用いて推定対象の形状の推定を行う。
【0018】
<学習装置1について>
学習装置1は、バスで接続されたCPU(Central Processing Unit)等のプロセッサ91とメモリ92とを備える制御部11を備え、プログラムを実行する。
図2は、第1実施形態における学習装置1の備える制御部11の構成の一例を示す図である。
【0019】
制御部11は、データ入力部101、観測モデル入力部102、前処理部201、観測モデル推定部202、観測データ制約部203、形状制約部204、最適化部205及びモデル出力部300を備える。以下、下付き文字については、アンダーバーを用いて表現する場合もある。アンダーバーを用いた表現は、例えばA_Bであれば、ABを意味する。
【0020】
データ入力部101は、入力時系列データを取得する。具体的には、データ入力部101は、環境中に一つ以上の物体が存在した状態にて、これらの環境を計測した観測データを高い時間分解能を持つ時系列データとして取得することを特徴とする。したがって、入力時系列データは、二次元時系列データである。
【0021】
なお、データ入力部101は、より具体的には、例えば、単一光子計測などにて、観測環境中に一つ以上の物体が存在した状態にて、これらの環境を計測した観測データ(各空間座標上における光子カウント数の時系列データ)を入力することを特徴とする。あるいは、ここで言う時系列データとは、ToFセンサー(Time of Flight)などのセンサーを用いて得られた時系列データであってもよい。以下では例えば、時系列データをI_rawと表す。例えば、I_rawは引数として、座標x、yおよびtの三つの引数を含めればよい。すなわちI_raw (x,y,t)は、座標(x、y)における観測時刻tにおける信号の強さであり、単一光子計測の場合、これは光子の数であればよい。
【0022】
観測モデル入力部102は、光学系のパラメタと、時間方向および空間方向の畳み込みカーネルと、を取得する。なお、「時間方向および空間方向の畳み込みカーネル」との用語は、当業者には周知の用語である。観測モデル入力部102は、具体的には、観測系のパラメタと時空間畳み込み関数の積分核と変換関数モデルとを観測モデルとして取得することを特徴とする。より具体的には、観測モデル入力部102は、光学系のパラメタと、時間方向及び空間方向の畳み込みカーネル(以下では積分核と呼ぶこともある)を取得することを特徴とする。
【0023】
なお光学系のパラメタとは、入力時系列データの取得に用いられた光学系を示すパラメタを意味する。パラメタは、例えば、光学系のXY座標軸及び時間軸の解像度であってもよいし、物体までの大まかなスケールであってもよい。物体までの大まかなスケールが、どこから物体までの大まかなスケールであるかは、周知である。なお、大まかの程度は周知である。
【0024】
例えば積分核としては、矩形関数、指数関数、ガウス関数などを用いればよく、以下ではこれらをW(t-t´)と表すこととする。例えば、矩形関数の場合には、以下のようにあらわせばよい。
【0025】
【0026】
【0027】
【0028】
ここで、Δtは、時間スケールの大きさを調整するためのパラメタであり、τあるいはηは、利用者によりあらかじめ定められた値である。さらに、観測モデル入力部102は、観測系のパラメタを取得してもよい。より具体的には、光学中心の位置、座標系の原点、光の速度、焦点の位置(共焦点であるかなど)を取得すればよい。
【0029】
さらに、観測モデル入力部102は、三次元座標(x、y、z)から対象となる物体の密度場σ(x、y、z)および反射率あるいはアルベドρ(x、y、z)を出力する関数を入力してもよい。ここでいう関数(以下ではモデルとも言う)とは、ある座標値を入力したときに、その座標値における密度場と物体の反射率を出力する関数をいう。例えば、この関数は、最適化されたフィッティングパラメタを含む関数として与えてもよいし、より複雑な入れ子構造の関数として与えてもよい。
【0030】
あるいはニューラルネットワークによりこの関数を表現してもよいし、より具体的にはニューラル・ラディアンス・フィールドのような方法でこの関数を表現してもよい。より具体的には、
図3又は
図4に示すように、空間を周期関数でコード化するポジショナルエンコーディングPEと複数の関数の入れ子構造となる関数でモデル化すればよい。
図3は、第1実施形態におけるモデル化の第1の例を示す図である。
図4は、第1実施形態におけるモデル化の第2の例を示す図である。より具体的には、以下のような関数を入力すればよい。そして、例えば、F,H,Gなどの関数に含まれるパラメタ(w_F、w_G,w_H)を後述する最適化部205などで最適化すればよい。
【0031】
【0032】
【0033】
このように、観測モデル入力部102は、例えば、光学系のパラメタとして空間方向及び時間方向の解像度と、形状の推定対象の物体までの大まかなスケールと、時間方向及び空間方向の積分核の概形と、を取得する。なお、上述のW(t-t´)で表現される矩形関数、指数関数、ガウス関数はいずれも時間方向及び空間方向の積分核の概形の一例である。なお、観測モデル入力部102による観測モデルの取得は、例えば予め取得対象の情報を記憶する記憶部からの読み出しである。
【0034】
前処理部201は、データ入力部101にて取得された二次元時系列データを変換することを特徴とする。具体的には、正規化処理などにより値を変換することを特徴とする。例えば、データ入力部101にて取得された時系列データをI_raw (x,y,t)と表し、I_raw (x,y,t)は引数として、座標x,yおよびtの三つの引数を含んでいる場合、前処理部201は、時間方向の平均<I_raw (x,y,t)>_t、空間方向の平均<I_raw (x,y,t)>_(x,y)、あるいは全引数での平均<I_raw (x,y,t)>_(x,y,t)により、正規化をすればよい。より具体的には、下記のような式により平均化をすればよい。
【0035】
【0036】
【0037】
【0038】
観測モデル推定部202は、観測モデル入力部102にて取得された時間方向および空間方向の畳み込みカーネルを初期値とし、最適化部205にて定義される最適化関数が最小になるように観測モデルのパラメタ(時間方向および空間方向の畳み込みカーネルおよび光学系のパラメタ)を再推定することを特徴とする。すなわち、式(1)~(3)における、時間スケールΔt、あるいはWの中に含まれるτあるいはηなどのパラメタを再推定すればよい。なお、最適化部205にて定義される最適化関数は、後述する観測データ制約項と形状制約項とからなる周知の所定の関数である。
【0039】
観測データ制約部203は、前処理部201にて前処理がされた時系列データと、観測モデル推定部202にて推定された観測モデルのパラメタ(時間方向および空間方向の畳み込みカーネルおよび光学系のパラメタ)とから、観測モデルと時系列データとの差分が小さくなるように最適化部205にて定義される観測データ制約項を構成すること特徴とする。より具体的には、まず
図5~
図7ように光路をすべて直線的な経路であると仮定する場合には、下記に、物体から反射される光、あるいは遮蔽版および遮蔽版を経由して物体から反射される光をモデル化し、センサー面に届く光の強さ(単一光子の数)を以下のようなI_1 (x,y,t)あるいはI_2 (x,y,t)として表せばよい。
【0040】
なお、
図5は、第1実施形態における光路の第1の例を示す図である。
図6は、第1実施形態における光路の第2の例を示す図である。
図7は、第1実施形態における光路の第3の例を示す図である。
【0041】
【0042】
【0043】
なお、Γ_0はパラメタ、I_0は遮蔽物から反射される光の強さ、δ(・)はディラックのデルタ関数である。あるいは、遮蔽版を経由する光が放射状に拡散する(遮蔽板が拡散反射する)ことを想定する場合には、下記式のようにセンサー面に届く光の強さ(単一光子の数)を算出してもよい。
【0044】
【0045】
あるいは、遮蔽版を経由する光が放射状に拡散する(遮蔽板が拡散反射する)光と、直接通過する光の混合であることを想定する場合には、下記式のようにセンサー面に届く光の強さ(単一光子の数)を算出してもよい。
【0046】
【0047】
そして、観測データ制約部203にて与えられる観測データ制約項は、このように算出したセンサー面に届く光の強さ(単一光子の数)と、前処理部201により得られた正規化後の観測値I(x,y,t)との差分が大きいほど、値が大きくなる関数として定義すればよい。より具体的には、下記式(13)~(16)のようにL2ノルムとして与えればよい。
【0048】
【0049】
【0050】
【0051】
【0052】
形状制約部204は、密度場(あるいは密度場に加えて反射率)が、空間的に滑らかになるように推定されること、最適化部205にて定義される最適化関数に制約項として加え、この最適化関数を最小させることで制約することを特徴とする。より具体的には、例えば、密度σ(x,y,z)あるいは反射率あるいはアルベドρ(x,y,z)が空間的に滑らかであることを制約として設ければよい。より具体的には、下記式に示すように、密度あるいは反射率あるいはアルベドの空間微分の大きさのLpノルムが小さくなることを制約として設ければよい。
【0053】
【0054】
【0055】
あるいは、例えば、密度σ(x,y,z)あるいは反射率あるいはアルベドρ(x,y,z)が空間的に疎(スパース)であることを制約として設ければよい。より具体的には、下記式に示すように、密度あるいは反射率あるいはアルベドの大きさ(絶対値)のLpノルムが小さくなることを制約として設ければよい。
【0056】
【0057】
【0058】
最適化部205は、観測データ制約部203にて定義された観測モデルと二次元時系列データとの差分が小さくなることを特徴とする観測データ制約項と、形状制約部204にて定義される形状制約項とからなる最適化関数が最小となるように、推定対象の物体の密度場(あるいは密度場に加えて反射率)を最適化することを特徴とする。具体的には、例えば以下式で定義されるエネルギー関数が最小化されるように関数を最小させるように、式(4)及び(5)で表されるF,G,Hなどの関数に含まれるパラメタ(w_F、w_G、w_H)を最小化させればよい。
【0059】
【0060】
ここで、aあるいはbは式(21)の各項の大きさを調整するためのパラメタであり、利用者により事前に与えればよい。また、式(21)の最適化関数を、最小化をさせる方法としては、例えば勾配法などを用いればよい。
【0061】
モデル出力部300は、最適化部205にて最適化されたモデルを出力することを特徴とする。なお、最適化部205による最適化の対象が形状推定モデルであり、最適化部205にて最適化されたモデルが、学習済みの形状推定モデルである。
【0062】
モデル出力部300における出力形態は、例えば表示部にリアルタイムで出力してもよいし、画像データとして半導体メモリやHDD(Hard disk drive)などの記憶部に保存してもよい。この記憶部は、形状復元装置内に設けてもよいし、外部記憶装置を使用してもよい。
【0063】
<形状推定装置2について>
形状推定装置2は、複数の入力データ群を受け付けて、算出した識別結果を所要に出力する。出力形態は、例えば表示部にリアルタイムで出力してもよいし、画像データとして半導体メモリやHDD(Hard Disk Drive)などの記憶部に保存してもよい。この記憶部は、形状推定装置2内に設けてもよいし、外部記憶装置を使用してもよい。
【0064】
形状推定装置2は、バスで接続されたCPU等のプロセッサ93とメモリ94とを備える制御部21を備え、プログラムを実行する。
図8は、第1実施形態における形状推定装置2の備える制御部21の構成の一例を示す図である。
【0065】
制御部21は、モデル入力部103、復元座標入力部104、推論部206及び出力部301を備える。
【0066】
モデル入力部103は、モデル出力部300にて出力されたモデルを、推論を行うために取得することを特徴とする。より具体的には、式(4)及び(5)で表されるF,G,Hなどの関数と最適化部205にて最適化したパラメタ(w_F、w_G、w_H)を取得すればよい。
【0067】
復元座標入力部104は、モデル入力部103にて取得されたモデルから、推論するために必要な入力値として、推定対象の位置する座標を取得することを特徴とする。復元座標入力部104は、より具体的には、算出したい密度場およびアルベド(あるいは反射率)の空間座標(x、y、z)と入射角度(θ、Φ)を取得すればよい。
【0068】
推論部206は、モデル入力部103にて取得されたモデルと、復元座標入力部104で取得された座標から、物体の形状(例えば密度場あるいは物体の反射率やアルベド)を算出することを特徴とする。より具体的には、式(4)及び(5)および最適化部205にて最適化したパラメタ(w_F、w_G、w_H)および、復元座標入力部104にて入力した空間座標(x、y、z)と入射角度(θ、Φ)から、密度場σ(x、y、z)とアルベドρ(x、y、z、θ、Φ)を算出すればよい。
【0069】
出力部301は、推論部206にて算出された物体の形状を出力することを特徴とする。より具体的には、推論部206にて算出した密度場σ(x、y、z)とアルベドρ(x、y、z、θ、Φ)を出力すればよい。
【0070】
図9は、第1実施形態の学習装置1の備える制御部11が実行する処理の流れの一例を示すフローチャートである。データ入力部101が、観測データを取得する(ステップS101)。次に、観測モデル入力部102が、観測モデルを取得する(ステップS102)。次に、前処理部201が、データ入力部の取得したデータを前処理する(ステップS103)。次に、観測モデル推定部202が、観測モデル入力部102の取得した観測モデルから、観測モデルのパラメタを推定する(ステップS104)。次に、観測データ制約部203が、観測データ制約項を構成する(ステップS105)。
【0071】
次に、形状制約部204が形状制約項を構成する(ステップS106)。次に、最適化部205が、前処理部201にて前処理がされた二次元時系列データと観測モデル推定部202にて推定された観測モデルのパラメタ(時間方向および空間方向の畳み込みカーネルおよび光学系のパラメタ)とに基づき、観測モデルと二次元時系列データとの差分が小さくなるように、推定対象の各物体の密度場(あるいは密度場に加えて反射率)を最適化する(ステップS107)。なお、観測モデルと二次元時系列データとの差分が小さくなることは、観測データ制約項と形状制約項とからなる最適化関数が最小となることである。
【0072】
次に、制御部11が収束判定を行い、最適化関数の最適値が一定以下、あるいは繰り返し回数が一定以上である場合、最適化を終了する。より具体的には、制御部11が収束判定を行う(ステップS108)。収束した場合(ステップS108:YES)、最適化を終了する。一方、収束していない場合(ステップS108:NO)、ステップS104の処理に戻る。なお、収束するとは、上述したように、最適化関数の最適値が一定以下、あるいは繰り返し回数が一定以上であること、を意味する。収束した場合、次に、モデル出力部300にて、最適化により得られた各物体の密度場を出力する(ステップS109)。
【0073】
図10は、第1実施形態の形状推定装置2の備える制御部21が実行する処理の流れの一例を示すフローチャートである。モデル入力部103が、モデル出力部300の出力したモデルを、推論を行うために取得する(ステップS201)。次に、復元座標入力部104が、モデル入力部103が取得したモデルから、推論するために必要な入力値として、推定する座標を取得する(ステップS202)。次に推論部206が、モデル入力部103が取得したモデルと、復元座標入力部104が取得した座標とから、物体の形状(例えば密度場)を算出する(ステップS203)。次に出力部301が、推論部206が算出した物体の形状を出力する(ステップS204)。
【0074】
図11は、第1実施形態の学習装置1のハードウェア構成の一例を示す図である。学習装置1は、上述したように、バスで接続されたCPU等のプロセッサ91とメモリ92とを備える制御部11を備え、プログラムを実行する。学習装置1は、プログラムの実行によって制御部11、入力部12、通信部13、記憶部14及び出力部15を備える装置として機能する。
【0075】
より具体的には、プロセッサ91が記憶部14に記憶されているプログラムを読み出し、読み出したプログラムをメモリ92に記憶させる。プロセッサ91が、メモリ92に記憶させたプログラムを実行することによって、学習装置1は、制御部11、入力部12、通信部13、記憶部14及び出力部15を備える装置として機能する。
【0076】
制御部11は、学習装置1が備える各種機能部の動作を制御する。
【0077】
入力部12は、マウスやキーボード、タッチパネル等の入力装置を含んで構成される。入力部12は、これらの入力装置を学習装置1に接続するインタフェースとして構成されてもよい。入力部12は、学習装置1に対する各種情報の入力を受け付ける。
【0078】
通信部13は、学習装置1を外部装置に接続するための通信インタフェースを含んで構成される。通信部13は、有線又は無線を介して外部装置と通信する。外部装置は例えば形状推定装置2である。通信部13は、形状推定装置2との通信によって、例えばモデル出力部300の出力したモデルを形状推定装置2に送信する。
【0079】
なおデータ入力部101の得た観測データは、例えば入力部12又は通信部13に入力された情報である。
【0080】
記憶部14は、磁気ハードディスク装置や半導体記憶装置などのコンピュータ読み出し可能な記憶媒体装置(non-transitory computer-readable recording medium)を用いて構成される。記憶部14は学習装置1に関する各種情報を記憶する。記憶部14は、例えば入力部12又は通信部13を介して入力された情報を記憶する。記憶部14は、例えば制御部11の実行する処理で生じた各種情報を記憶する。記憶部14は、例えば、予めパラメタと時空間畳み込み関数の積分核と変換関数モデルを記憶する。
【0081】
出力部15は、各種情報を出力する。出力部15は、例えばCRT(Cathode Ray Tube)ディスプレイや液晶ディスプレイ、有機EL(Electro-Luminescence)ディスプレイ等の表示装置を含んで構成される。出力部15は、これらの表示装置を学習装置1に接続するインタフェースとして構成されてもよい。出力部15は、例えば入力部12又は通信部13に入力された情報を出力する。出力部15は、例えばモデル出力部300の出力した情報を出力してもよい。
【0082】
図12は、第1実施形態の形状推定装置2のハードウェア構成の一例を示す図である。形状推定装置2は、上述したように、バスで接続されたCPU等のプロセッサ93とメモリ94とを備える制御部21を備え、プログラムを実行する。形状推定装置2は、プログラムの実行によって制御部21、入力部22、通信部23、記憶部24及び出力部25を備える装置として機能する。
【0083】
より具体的には、プロセッサ93が記憶部24に記憶されているプログラムを読み出し、読み出したプログラムをメモリ94に記憶させる。プロセッサ93が、メモリ94に記憶させたプログラムを実行することによって、形状推定装置2は、制御部21、入力部22、通信部23、記憶部24及び出力部25を備える装置として機能する。
【0084】
制御部21は、形状推定装置2が備える各種機能部の動作を制御する。
【0085】
入力部22は、マウスやキーボード、タッチパネル等の入力装置を含んで構成される。入力部22は、これらの入力装置を形状推定装置2に接続するインタフェースとして構成されてもよい。入力部22は、形状推定装置2に対する各種情報の入力を受け付ける。
【0086】
通信部23は、形状推定装置2を外部装置に接続するための通信インタフェースを含んで構成される。通信部23は、有線又は無線を介して外部装置と通信する。外部装置は例えば学習装置1である。通信部23は、学習装置1との通信によって、例えばモデル出力部300の出力したモデル取得する。
【0087】
なおモデル入力部103の得たモデルと、復元座標入力部104の得た入力値とは、例えば入力部22又は通信部23に入力された情報である。
【0088】
記憶部24は、磁気ハードディスク装置や半導体記憶装置などのコンピュータ読み出し可能な記憶媒体装置(non-transitory computer-readable recording medium)を用いて構成される。記憶部24は形状推定装置2に関する各種情報を記憶する。記憶部24は、例えば入力部22又は通信部23を介して入力された情報を記憶する。記憶部24は、例えば制御部21の実行する処理で生じた各種情報を記憶する。
【0089】
出力部25は、各種情報を出力する。出力部25は、例えばCRTディスプレイや液晶ディスプレイ、有機ELディスプレイ等の表示装置を含んで構成される。出力部25は、これらの表示装置を形状推定装置2に接続するインタフェースとして構成されてもよい。出力部25は、例えば入力部22又は通信部23に入力された情報を出力する。出力部25は、例えば出力部301の出力した情報を出力してもよい。
【0090】
このように、形状推定システム100は、
環境中に一つ以上の物体が存在した場合におけるその環境を光学系を用いて計測した観測データを所定の時間分解能以上の時間分解能を持つ時系列データとして取得するデータ入力部101と、
データ入力部101の得た観測データを得る観測系のパラメタと時空間畳み込み関数の積分核と変換関数モデルとを観測モデルとして取得する観測モデル入力部102と、
データ入力部101の得た時系列データを正規化処理により変換する前処理部201と、
前処理部201の変換した時系列データに基づき得られる項であり、観測モデルと時系列データとの差分が所定の値より小さいという条件を表現する項である観測データ制約項と、推定される物体形状が空間的に滑らかであるという条件を表現する形状制約項とからなる所定の関数である最適化関数、が最小となるように物体の密度場を最適化する最適化部205と、
観測モデル入力部102の得た観測系のパラメタと時空間畳み込み関数の積分核と変換関数モデルとを初期値として、最適化関数を最小にすることで、観測系のパラメタと時空間畳み込み関数の積分核と変換関数モデルとを推定する観測モデル推定部202と、
最適化部205の最適化の結果を出力するモデル出力部300と、
を備える。
【0091】
そのため、このように構成された形状推定システム100は、形状を推定する数理モデルの最適化を行うことができる。したがって、形状推定システム100は、形状の推定の精度を向上させることができる。
【0092】
(第2実施形態)
図13は、第2実施形態の形状推定システム100aの概要を説明する説明図である。形状推定システム100aは、形状推定装置2aを備える。
【0093】
形状推定装置2aは、複数の入力データ群として受け付けて、算出した識別結果を所要に出力する。出力形態は、例えば表示部にリアルタイムで出力してもよいし、画像データとして半導体メモリやHDDなどの記憶部に保存してもよい。この記憶部は、形状推定システム100内に設けてもよいし、外部記憶装置を使用してもよい。
【0094】
形状推定装置2aは、バスで接続されたCPU等のプロセッサ93aとメモリ94aとを備える制御部21aを備え、プログラムを実行する。
図14は、第2実施形態における形状推定装置2aの備える制御部21aの構成の一例を示す図である。
【0095】
以下、形状推定システム100の備える機能と同様の機能を有するものについては、
図1~
図12と同じ符号を付すことで説明を省略する。
【0096】
制御部21aは、データ入力部101、観測モデル入力部102、背景データ入力部105と、前処理部201と、観測モデル推定部202と、観測データ制約部203aと、形状制約部204と、最適化部205aと、観測データ分離部207と、を備える。
【0097】
背景データ入力部105は、背景データ入力部105は単一光子計測にて、観測環境(例えば前景の半透明物体など)を計測した二次元時系列データ(各xy座標上における光子カウント数の時系列データ)を背景データとして取得することを特徴とする。より具体的には、式(10)~(12)において与えられているI_0(x、y、t)を、背景データとして取得すればよい。なお観測環境の定義は周知である。背景データの定義は周知である。
【0098】
観測データ制約部203aは、観測モデルにおいて、観測データ分離部207の得た物体ごとに分離された観測データと二次元時系列データとの差分が小さくなることを特徴とする観測データ制約項を構成することを特徴とする。なお、ここでいう観測モデルは、第1実施形態の観測データ制約部203にて定義された観測モデルを意味する。このように、観測データ制約部203aの構成する観測データ制約項は、観測データ制約部203の構成する観測データ制約項のより具体的な形式の項である。
【0099】
最適化部205aは、前処理部201にて前処理がされた二次元時系列データと観測モデル推定部202にて推定された観測モデルのパラメタ(時間方向および空間方向の畳み込みカーネルおよび光学系のパラメタ)とに基づき、観測モデルと二次元時系列データとの差分が小さくなるように、推定対象の各物体の密度場(あるいは密度場に加えて反射率)を最適化することを特徴とする。観測モデルと二次元時系列データとの差分が小さくなることは、観測データ制約項と形状制約項とからなる最適化関数が最小となることである。
【0100】
観測データ分離部207は、前処理部201にて前処理がされた二次元時系列データを、背景データ入力部105の取得した背景データと推定対象の各物体のそれぞれに対応する観測値と、に分離することを特徴とする。より具体的には、式(10)~(12)において与えられるI_2(x,y,t)、I_3(x,y,t)、I_4(x,y,t)からI_0(x,y,t)を除算すればよい。
【0101】
図15は、第2実施形態における形状推定装置2aの備える制御部21aが実行する処理の流れの一例を示すフローチャートである。なお、
図15が示す処理の流れは学習時の処理の流れの一例である。推論時の処理の流れは、第1実施形態における形状推定装置2が実行する処理の流れと同様であるため、説明を省略する。
【0102】
データ入力部101が、観測データを取得する(ステップS301)。次に、観測モデル入力部102が、観測モデルを取得する(ステップS302)。次に、背景データ入力部105が、背景データを取得する(ステップS303)。次に、前処理部201が、データ入力部101の取得したデータを前処理する(ステップS304)。次に、観測モデル推定部202が、観測モデル入力部102の取得した観測モデルから、観測モデルのパラメタを推定する(ステップS305)。次に、観測データ分離部207が、前処理部201にて前処理がされた二次元時系列データを、背景データ入力部105の取得した背景データと各物体のそれぞれに対応する観測値とに分離する(ステップS306)。
【0103】
次に、観測データ制約部203aが、観測データ制約項を構成する(ステップS307)。次に、形状制約部204が形状制約項を構成する(ステップS308)。
【0104】
次に、最適化部205aが、前処理部201にて前処理がされた二次元時系列データと観測モデル推定部202aにて推定された観測モデルのパラメタ(時間方向および空間方向の畳み込みカーネルおよび光学系のパラメタ)とに基づき、観測モデルと二次元時系列データとの差分が小さくなるように、各物体の密度場(あるいは密度場に加えて反射率)を最適化する(ステップS309)。
【0105】
次に制御部21aが収束判定を行い、最適化関数の最適値が一定以下、あるいは繰り返し回数が一定以上である場合、最適化を終了する。より具体的には、制御部21aが収束判定を行う(ステップS310)。収束した場合(ステップS310:YES)、最適化を終了する。一方、収束していない場合(ステップS310:NO)、ステップS305の処理に戻る。なお、収束するとは、上述したように、最適化関数の最適値が一定以下、あるいは繰り返し回数が一定以上であること、を意味する。次にモデル出力部300が、最適化により得られた各物体の密度場を出力する(ステップS311)。
【0106】
図16は、第2実施形態における形状推定装置2aのハードウェア構成の一例を示す図である。形状推定装置2aは、上述したように、バスで接続されたCPU等のプロセッサ93aとメモリ94aとを備える制御部21aを備え、プログラムを実行する。形状推定装置2aは、プログラムの実行によって制御部21a、入力部22、通信部23、記憶部24及び出力部25を備える装置として機能する。
【0107】
より具体的には、プロセッサ93aが記憶部24に記憶されているプログラムを読み出し、読み出したプログラムをメモリ94aに記憶させる。プロセッサ93aが、メモリ94aに記憶させたプログラムを実行することによって、形状推定装置2aは、制御部21a、入力部22、通信部23、記憶部24及び出力部25を備える装置として機能する。制御部21aは、形状推定装置2aが備える各種機能部の動作を制御する。
【0108】
このように、形状推定システム100aは、
環境中に一つ以上の物体が存在した場合における前記環境を光学系を用いて計測した観測データを所定の時間分解能以上の時間分解能を持つ時系列データとして取得するデータ入力部101と、
前記データ入力部101の得た観測データを得る観測系のパラメタと時空間畳み込み関数の積分核と変換関数モデルとを観測モデルとして取得する観測モデル入力部102と、
前記データ入力部101の得た時系列データを正規化処理により変換する前処理部201と、
前記前処理部201の変換した時系列データに基づき得られる項であり、前記観測モデルと前記時系列データとの差分が所定の値より小さいという条件を表現する項である観測データ制約項と、推定される物体形状が空間的に滑らかであるという条件を表現する形状制約項とからなる所定の関数である最適化関数、が最小となるように前記物体の密度場を最適化する最適化部205aと、
前記観測モデル入力部102の得た前記観測系のパラメタと前記時空間畳み込み関数の積分核と前記変換関数モデルとを初期値として、前記最適化関数を最小にすることで、前記観測系のパラメタと前記時空間畳み込み関数の積分核と前記変換関数モデルとを推定する観測モデル推定部202と、
前記最適化部205aの最適化の結果を出力するモデル出力部300と、
観測環境のみを計測した時系列データを背景データとして取得する背景データ入力部105と、
前記前処理部201にて前処理がされた二次元時系列データを、前記背景データと各前記物体のそれぞれに対応する観測値とに分離する観測データ分離部207と、
を備え、
前記観測データ制約項は、前記観測データ分離部が取得した物体ごとに分離された観測データと前記時系列データとの差分が所定の値より小さいという条件を表現する。
【0109】
このように構成された第2実施形態の形状推定システム100aは、形状を推定する数理モデルの最適化を行うことができる。したがって、形状推定システム100aは、形状の推定の精度を向上させることができる。
【0110】
(第1実施形態及び第2実施形態における環境を計測した観測データを得る光学系の一例)
図17は、第1実施形態及び第2実施形態における環境を計測した観測データを得る光学系の一例を示す図である。
図17の“250”は、1センチメートル等の所定の単位長さの250倍の距離を意味する。
図17の“75”は、“250”と同じ単位における単位長さの75倍の距離を意味する。
【0111】
(変形例)
なお、学習装置1、形状推定装置2及び形状推定装置2aのそれぞれは、ネットワークを介して通信可能に接続された複数台の情報処理装置を用いて実装されてもよい。この場合、学習装置1、形状推定装置2及び形状推定装置2aのそれぞれが備える各機能部は、複数の情報処理装置に分散して実装されてもよい。
【0112】
学習装置1、形状推定装置2及び形状推定装置2aの各機能の全て又は一部は、ASIC(Application Specific Integrated Circuit)やPLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されてもよい。プログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置である。プログラムは、電気通信回線を介して送信されてもよい。
【0113】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
【符号の説明】
【0114】
100、100a…形状推定システム、 1…学習装置、 2、2a…形状推定装置、 11…制御部、 12…入力部、 13…通信部、 14…記憶部、 15…出力部、 21、21a…制御部、 22…入力部、 23…通信部、 24…記憶部、 25…出力部、 91、93、93a…プロセッサ、 92、94、94a…メモリ、 101…データ入力部、 102…観測モデル入力部、 201…前処理部、 202…観測モデル推定部、 203、203a…観測データ制約部、 204…形状制約部、 205、205a…最適化部、 300…モデル出力部、 103…モデル入力部、 104…復元座標入力部、 206…推論部、 301…出力部、 105…背景データ入力部、 207…観測データ分離部