(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024092837
(43)【公開日】2024-07-08
(54)【発明の名称】画像生成装置、画像生成方法、及び、プログラム
(51)【国際特許分類】
G06T 7/55 20170101AFI20240701BHJP
G06V 10/62 20220101ALI20240701BHJP
H04N 23/60 20230101ALI20240701BHJP
【FI】
G06T7/55
G06V10/62
H04N23/60 500
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2022209026
(22)【出願日】2022-12-26
(71)【出願人】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】100147485
【弁理士】
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【弁護士】
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100161148
【弁理士】
【氏名又は名称】福尾 誠
(74)【代理人】
【識別番号】230128026
【弁護士】
【氏名又は名称】駒木 寛隆
(72)【発明者】
【氏名】杉之下 太一
(72)【発明者】
【氏名】三須 俊枝
(72)【発明者】
【氏名】三ツ峰 秀樹
【テーマコード(参考)】
5C122
5L096
【Fターム(参考)】
5C122DA03
5C122DA13
5C122EA68
5C122FA18
5C122FH01
5C122FH12
5C122FH15
5C122FH23
5C122HA13
5C122HA35
5C122HA42
5C122HA88
5C122HB01
5C122HB02
5C122HB05
5C122HB10
5L096AA09
5L096CA04
5L096EA39
5L096FA66
5L096FA69
5L096HA04
(57)【要約】
【課題】より品質が高い補間デプス画像を取得可能とする。
【解決手段】画像生成装置10は、第1、第2、第3時刻に撮影された第1、第2、第3カメラ画像を取得し、第1、第3時刻に撮影された第1、第3デプス画像を取得し、第1、第2、第3カメラ画像と、第1、第3デプス画像と、に基づき、第2時刻のデプス画像である第2デプス画像を生成する、制御部11を備える。制御部11は、第2デプス画像の注目画素について、第1、第2カメラ画像に基づき第1動きベクトルを取得し、第2、第3カメラ画像に基づき第2動きベクトルを取得し、第1動きベクトルに基づき、第1デプス画像の注目画素に対応する画素における第1デプス値を取得し、第2動きベクトルに基づき、第3デプス画像の注目画素に対応する画素における第3デプス値を取得し、第1、第3デプス値の重み付き調和平均により、第2デプス画像の注目画素のデプス値である第2デプス値を取得する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
被写体を含む撮影範囲における輝度に関する情報を画素毎に含むカメラ画像であって、第1時刻に撮影された第1カメラ画像と、前記第1時刻の後の時刻である第2時刻に撮影された第2カメラ画像と、前記第2時刻の後の時刻である第3時刻に撮影された第3カメラ画像と、を取得し、
前記撮影範囲における距離に関する情報を画素毎に含むデプス画像であって、前記第1時刻に撮影された第1デプス画像と、前記第3時刻に撮影された第3デプス画像と、を取得し、
前記第1カメラ画像と、前記第2カメラ画像と、前記第3カメラ画像と、前記第1デプス画像と、前記第3デプス画像と、に基づき、前記第2時刻の前記デプス画像である第2デプス画像を生成し、
生成した前記第2デプス画像を出力する、
制御部を備え、
前記制御部は、
前記第2デプス画像の注目画素について、
前記第1カメラ画像と、前記第2カメラ画像とに基づき、前記第1時刻と前記第2時刻との間における前記被写体の動きを示す第1動きベクトルを取得し、
前記第2カメラ画像と、前記第3カメラ画像とに基づき、前記第2時刻と前記第3時刻との間における前記被写体の動きを示す第2動きベクトルを取得し、
前記第1動きベクトルに基づき、前記第1デプス画像の前記注目画素に対応する画素における第1デプス値を取得し、
前記第2動きベクトルに基づき、前記第3デプス画像の前記注目画素に対応する画素における第3デプス値を取得し、
前記第1デプス値と、前記第3デプス値と、の重み付き調和平均により、前記第2デプス画像の前記注目画素のデプス値である第2デプス値を取得する、
画像生成装置。
【請求項2】
前記制御部は、前記第1デプス値に対しては前記第1動きベクトルのノルムを重みとし、前記第3デプス値に対しては前記第2動きベクトルのノルムを重みとする重み付き調和平均により、前記第2デプス値を取得する、請求項1に記載の画像生成装置。
【請求項3】
前記制御部は、
前記第2カメラ画像を複数のブロックに区分し、
前記複数のブロックの各々について、前記第2カメラ画像の前記ブロックと前記第1カメラ画像とを比較して、当該ブロックとの類似度が最も高い領域の当該ブロックの画素位置に対する位置関係に基づき、前記第1動きベクトルを取得し、
前記複数のブロックの各々について、前記第2カメラ画像の前記ブロックと前記第3カメラ画像とを比較して、当該ブロックとの類似度が最も高い領域の当該ブロックの画素位置に対する位置関係に基づき、前記第2動きベクトルを取得する、
請求項1に記載の画像生成装置。
【請求項4】
前記制御部は、
前記第1デプス画像の全画素にわたる平均デプス値と、前記第3デプス画像の全画素にわたる平均デプス値とに基づいて、前記第2カメラ画像の前記ブロックの大きさを前記第1デプス画像に合わせて変更し、当該大きさが変更された前記第2カメラ画像の前記ブロックと前記第1カメラ画像とを比較して、前記第1動きベクトルを取得し、
前記第1デプス画像の全画素にわたる平均デプス値と、前記第3デプス画像の全画素にわたる平均デプス値とに基づいて、前記第2カメラ画像の前記ブロックの大きさを前記第3デプス画像に合わせて変更し、当該大きさが変更された前記第2カメラ画像の前記ブロックと前記第3カメラ画像とを比較して、前記第2動きベクトルを取得する、
請求項3に記載の画像生成装置。
【請求項5】
前記制御部は、
カメラにより前記第1時刻、前記第2時刻、前記第3時刻に撮影された前記カメラ画像を、前記第1カメラ画像、前記第2カメラ画像、前記第3カメラ画像として取得し、
デプスカメラにより前記第1時刻、前記第3時刻に撮影された前記デプス画像を、前記第1デプス画像、前記第3デプス画像として取得する、
請求項1に記載の画像生成装置。
【請求項6】
前記制御部は、
第1カメラにより前記第1時刻、前記第2時刻、前記第3時刻に撮影された前記カメラ画像を、前記第1カメラ画像、前記第2カメラ画像、前記第3カメラ画像として取得し、
前記第1カメラに対して予め定められた位置関係に設けられた第2カメラにより前記第1時刻、前記第3時刻に撮影された前記カメラ画像を、第4カメラ画像、第5カメラ画像として取得し、
前記第1カメラ画像と、前記第4カメラ画像と、のステレオマッチングにより取得されたデプス画像を前記第1デプス画像として取得し、
前記第3カメラ画像と、前記第5カメラ画像と、のステレオマッチングにより取得されたデプス画像を前記第3デプス画像として取得する、
請求項1に記載の画像生成装置。
【請求項7】
前記制御部は、
第1カメラにより前記第1時刻、前記第2時刻、前記第3時刻に撮影された前記カメラ画像を、前記第1カメラ画像、前記第2カメラ画像、前記第3カメラ画像として取得し、
前記第1カメラに対して予め定められた位置関係に設けられた第2カメラにより前記第1時刻、前記第3時刻に撮影された前記カメラ画像を、第4カメラ画像、第5カメラ画像として取得し、
デプスカメラにより前記第1時刻、前記第2時刻、前記第3時刻に撮影された前記デプス画像を、第4デプス画像、第5デプス画像、第6デプス画像として取得し、
前記第1カメラ画像と前記第4デプス画像とを比較して、前記第4デプス画像における前記被写体の領域の欠損部分に当たる第1切抜範囲を判定し、前記第1カメラ画像及び前記第4カメラ画像のステレオマッチングにより、前記第1切抜範囲におけるデプス画像である第1切抜デプス画像を取得し、
前記第3カメラ画像と前記第6デプス画像とを比較して、前記第6デプス画像における前記被写体の領域の欠損部分に当たる第3切抜範囲を判定し、前記第3カメラ画像及び前記第5カメラ画像のステレオマッチングにより、前記第3切抜範囲におけるデプス画像である第3切抜デプス画像を取得し、
前記第2カメラ画像と前記第5デプス画像とを比較して、前記第5デプス画像における前記被写体の領域の欠損部分に当たる第2切抜範囲を判定し、
前記第1切抜範囲における前記第1カメラ画像と、前記第2切抜範囲における前記第2カメラ画像とに基づき、前記第2切抜範囲における前記第1動きベクトルを取得し、
前記第2切抜範囲における前記第2カメラ画像と、前記第3切抜範囲における前記第3カメラ画像とに基づき、前記第2切抜範囲における前記第2動きベクトルを取得し、
前記第1切抜デプス画像のデプス値と、前記第3切抜デプス画像のデプス値と、の前記第1動きベクトル及び前記第2動きベクトルに基づく重み付き調和平均により、前記第2切抜範囲におけるデプス画像である第2切抜デプス画像を取得する、
請求項1に記載の画像生成装置。
【請求項8】
前記制御部は、
カメラにより前記第1時刻、前記第2時刻、前記第3時刻に撮影された前記カメラ画像を、前記第1カメラ画像、前記第2カメラ画像、前記第3カメラ画像として取得し、
前記被写体の3次元画像から取得された前記第1時刻、前記第3時刻の前記デプス画像を、前記第1デプス画像、前記第3デプス画像として取得する、
請求項1に記載の画像生成装置。
【請求項9】
制御部を備える画像生成装置の画像生成方法であって、
前記制御部が、
被写体を含む撮影範囲における輝度に関する情報を画素毎に含むカメラ画像であって、第1時刻に撮影された第1カメラ画像と、前記第1時刻の後の時刻である第2時刻に撮影された第2カメラ画像と、前記第2時刻の後の時刻である第3時刻に撮影された第3カメラ画像と、を取得する工程と、
前記撮影範囲における距離に関する情報を画素毎に含むデプス画像であって、前記第1時刻に撮影された第1デプス画像と、前記第3時刻に撮影された第3デプス画像と、を取得する工程と、
前記第1カメラ画像と、前記第2カメラ画像と、前記第3カメラ画像と、前記第1デプス画像と、前記第3デプス画像と、に基づき、前記第2時刻の前記デプス画像である第2デプス画像を生成する工程と、
生成した前記第2デプス画像を出力する工程と、
を含み、
前記制御部は、
前記第2デプス画像の注目画素について、
前記第1カメラ画像と、前記第2カメラ画像とに基づき、前記第1時刻と前記第2時刻との間における前記被写体の動きを示す第1動きベクトルを取得し、
前記第2カメラ画像と、前記第3カメラ画像とに基づき、前記第2時刻と前記第3時刻との間における前記被写体の動きを示す第2動きベクトルを取得し、
前記第1動きベクトルに基づき、前記第1デプス画像の前記注目画素に対応する画素における第1デプス値を取得し、
前記第2動きベクトルに基づき、前記第3デプス画像の前記注目画素に対応する画素における第3デプス値を取得し、
前記第1デプス値と、前記第3デプス値と、の重み付き調和平均により、前記第2デプス画像の前記注目画素のデプス値である第2デプス値を取得する、
画像生成方法。
【請求項10】
コンピュータを請求項1に記載の画像生成装置として動作させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、画像生成装置、画像生成方法、及び、プログラムに関する。
【背景技術】
【0002】
被写体を取り囲むように配置した複数台の同期のとれたカメラ及びセンサ等が取得したデータを使って、被写体の3次元形状データを取得するボリュメトリックキャプチャー技術が知られている。
【0003】
3次元形状データを取得するためには、被写体までの3次元的な距離を含む3次元位置情報が必要となる。3次元位置情報を取得するための代表的な方式として、2台のカメラを用いて三角測量法を適応して求める方式(ステレオ法)、及び、深度センサを用いて3次元位置を物理的に計測する方式が知られている。これらの方式に対応して、一般的なボリュメトリックキャプチャースタジオには、カメラのみを使用するスタジオと、深度センサを組合せて使用するスタジオとの大きく2つの種類のスタジオが知られている。
【0004】
カメラのみを使用する場合は、ステレオ法による2台のカメラ間の視差を利用するため、カメラから被写体までの距離に関係なく被写体の3次元位置を求めることができる。一方で、カメラのみを使用する場合においては、対応点探索の計算量が大きく、被写体を取り囲むカメラの解像度又は台数が増えれば、それに応じて処理時間が増加する。
【0005】
カメラの解像度又は台数を変更せずに、ステレオ法でリアルタイムに3次元位置を得る手法として、処理する対象のフレームを間引くことが知られている。しかし、フレームを間引けば動画像間の滑らかさが失われてしまうため、3次元形状データにおいても滑らかな動きを再現することができなくなる。そこで、低フレームレートの動画像の時間分解能を向上させる方式であるフレーム補間技術(例えば、特許文献1)を3次元位置が記録されたデプス画像に適用することで、3次元位置の時間分解能を高めることが知られている(特許文献2)。
【0006】
深度センサを用いる手法では、被写体までの3次元位置を直接計測することができるため、カメラのみに比べて高速に3次元形状を取得することができる。例えば、照射した光が被写体に反射して戻ってくるまでの時間にて距離を計算するToF(Time of Flight)を使用する深度センサが知られている。このような深度センサは、実際にボリュメトリックキャプチャーの撮影サービスとして展開されている。しかし、多くの深度センサは赤外光を用いているため、複数台の深度センサを用いる場合は同時に発光してしまうと機器間で干渉してしまうため、発光タイミングの調整、配置の工夫、及び、計測間隔の調整等をする必要がある。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特許第6313588号公報
【特許文献2】特許第5887267号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかし、特許文献2では、デプス画像(距離画像)とカメラ画像(テクスチャ画像)が同一のフレームレートで得られることが前提であり、デプス画像と比べてカメラ画像のフレームレートが高い状況においてはデプス画像の補間結果に改善の余地があった。
【0009】
そこで、本開示の目的は、より品質が高い補間デプス画像を取得可能とすることである。
【課題を解決するための手段】
【0010】
本開示によれば、画像生成装置は、
(1)被写体を含む撮影範囲における輝度に関する情報を画素毎に含むカメラ画像であって、第1時刻に撮影された第1カメラ画像と、前記第1時刻の後の時刻である第2時刻に撮影された第2カメラ画像と、前記第2時刻の後の時刻である第3時刻に撮影された第3カメラ画像と、を取得し、
前記撮影範囲における距離に関する情報を画素毎に含むデプス画像であって、前記第1時刻に撮影された第1デプス画像と、前記第3時刻に撮影された第3デプス画像と、を取得し、
前記第1カメラ画像と、前記第2カメラ画像と、前記第3カメラ画像と、前記第1デプス画像と、前記第3デプス画像と、に基づき、前記第2時刻の前記デプス画像である第2デプス画像を生成し、
生成した前記第2デプス画像を出力する、
制御部を備え、
前記制御部は、
前記第2デプス画像の注目画素について、
前記第1カメラ画像と、前記第2カメラ画像とに基づき、前記第1時刻と前記第2時刻との間における前記被写体の動きを示す第1動きベクトルを取得し、
前記第2カメラ画像と、前記第3カメラ画像とに基づき、前記第2時刻と前記第3時刻との間における前記被写体の動きを示す第2動きベクトルを取得し、
前記第1動きベクトルに基づき、前記第1デプス画像の前記注目画素に対応する画素における第1デプス値を取得し、
前記第2動きベクトルに基づき、前記第3デプス画像の前記注目画素に対応する画素における第3デプス値を取得し、
前記第1デプス値と、前記第3デプス値と、の重み付き調和平均により、前記第2デプス画像の前記注目画素のデプス値である第2デプス値を取得する。
【0011】
(2)(1)の画像生成装置において、
前記制御部は、前記第1デプス値に対しては前記第1動きベクトルのノルムを重みとし、前記第3デプス値に対しては前記第2動きベクトルのノルムを重みとする重み付き調和平均により、前記第2デプス値を取得してもよい。
【0012】
(3)(1)又は(2)の画像生成装置において、
前記制御部は、
前記第2カメラ画像を複数のブロックに区分し、
前記複数のブロックの各々について、前記第2カメラ画像の前記ブロックと前記第1カメラ画像とを比較して、当該ブロックとの類似度が最も高い領域の当該ブロックの画素位置に対する位置関係に基づき、前記第1動きベクトルを取得し、
前記複数のブロックの各々について、前記第2カメラ画像の前記ブロックと前記第3カメラ画像とを比較して、当該ブロックとの類似度が最も高い領域の当該ブロックの画素位置に対する位置関係に基づき、前記第2動きベクトルを取得してもよい。
【0013】
(4)(3)の画像生成装置において、
前記制御部は、
前記第1デプス画像の全画素にわたる平均デプス値と、前記第3デプス画像の全画素にわたる平均デプス値とに基づいて、前記第2カメラ画像の前記ブロックの大きさを前記第1デプス画像に合わせて変更し、当該大きさが変更された前記第2カメラ画像の前記ブロックと前記第1カメラ画像とを比較して、前記第1動きベクトルを取得し、
前記第1デプス画像の全画素にわたる平均デプス値と、前記第3デプス画像の全画素にわたる平均デプス値とに基づいて、前記第2カメラ画像の前記ブロックの大きさを前記第3デプス画像に合わせて変更し、当該大きさが変更された前記第2カメラ画像の前記ブロックと前記第3カメラ画像とを比較して、前記第2動きベクトルを取得してもよい。
【0014】
(5)(1)から(4)のいずれかの画像生成装置において、
前記制御部は、
カメラにより前記第1時刻、前記第2時刻、前記第3時刻に撮影された前記カメラ画像を、前記第1カメラ画像、前記第2カメラ画像、前記第3カメラ画像として取得し、
デプスカメラにより前記第1時刻、前記第3時刻に撮影された前記デプス画像を、前記第1デプス画像、前記第3デプス画像として取得してもよい。
【0015】
(6)(1)から(4)のいずれかの画像生成装置において、
前記制御部は、
第1カメラにより前記第1時刻、前記第2時刻、前記第3時刻に撮影された前記カメラ画像を、前記第1カメラ画像、前記第2カメラ画像、前記第3カメラ画像として取得し、
前記第1カメラに対して予め定められた位置関係に設けられた第2カメラにより前記第1時刻、前記第3時刻に撮影された前記カメラ画像を、第4カメラ画像、第5カメラ画像として取得し、
前記第1カメラ画像と、前記第4カメラ画像と、のステレオマッチングにより取得されたデプス画像を前記第1デプス画像として取得し、
前記第3カメラ画像と、前記第5カメラ画像と、のステレオマッチングにより取得されたデプス画像を前記第3デプス画像として取得してもよい。
【0016】
(7)(1)から(4)のいずれかの画像生成装置において、
前記制御部は、
第1カメラにより前記第1時刻、前記第2時刻、前記第3時刻に撮影された前記カメラ画像を、前記第1カメラ画像、前記第2カメラ画像、前記第3カメラ画像として取得し、
前記第1カメラに対して予め定められた位置関係に設けられた第2カメラにより前記第1時刻、前記第3時刻に撮影された前記カメラ画像を、第4カメラ画像、第5カメラ画像として取得し、
デプスカメラにより前記第1時刻、前記第2時刻、前記第3時刻に撮影された前記デプス画像を、第4デプス画像、第5デプス画像、第6デプス画像として取得し、
前記第1カメラ画像と前記第4デプス画像とを比較して、前記第4デプス画像における前記被写体の領域の欠損部分に当たる第1切抜範囲を判定し、前記第1カメラ画像及び前記第4カメラ画像のステレオマッチングにより、前記第1切抜範囲におけるデプス画像である第1切抜デプス画像を取得し、
前記第3カメラ画像と前記第6デプス画像とを比較して、前記第6デプス画像における前記被写体の領域の欠損部分に当たる第3切抜範囲を判定し、前記第3カメラ画像及び前記第5カメラ画像のステレオマッチングにより、前記第3切抜範囲におけるデプス画像である第3切抜デプス画像を取得し、
前記第2カメラ画像と前記第5デプス画像とを比較して、前記第5デプス画像における前記被写体の領域の欠損部分に当たる第2切抜範囲を判定し、
前記第1切抜範囲における前記第1カメラ画像と、前記第2切抜範囲における前記第2カメラ画像とに基づき、前記第2切抜範囲における前記第1動きベクトルを取得し、
前記第2切抜範囲における前記第2カメラ画像と、前記第3切抜範囲における前記第3カメラ画像とに基づき、前記第2切抜範囲における前記第2動きベクトルを取得し、
前記第1切抜デプス画像のデプス値と、前記第3切抜デプス画像のデプス値と、の前記第1動きベクトル及び前記第2動きベクトルに基づく重み付き調和平均により、前記第2切抜範囲におけるデプス画像である第2切抜デプス画像を取得してもよい。
【0017】
(8)(1)から(4)のいずれかの画像生成装置において、
前記制御部は、
カメラにより前記第1時刻、前記第2時刻、前記第3時刻に撮影された前記カメラ画像を、前記第1カメラ画像、前記第2カメラ画像、前記第3カメラ画像として取得し、
前記被写体の3次元画像から取得された前記第1時刻、前記第3時刻の前記デプス画像を、前記第1デプス画像、前記第3デプス画像として取得してもよい。
【0018】
本開示によれば、画像生成方法は、
(9)制御部を備える画像生成装置の画像生成方法であって、
前記制御部が、
被写体を含む撮影範囲における輝度に関する情報を画素毎に含むカメラ画像であって、第1時刻に撮影された第1カメラ画像と、前記第1時刻の後の時刻である第2時刻に撮影された第2カメラ画像と、前記第2時刻の後の時刻である第3時刻に撮影された第3カメラ画像と、を取得する工程と、
前記撮影範囲における距離に関する情報を画素毎に含むデプス画像であって、前記第1時刻に撮影された第1デプス画像と、前記第3時刻に撮影された第3デプス画像と、を取得する工程と、
前記第1カメラ画像と、前記第2カメラ画像と、前記第3カメラ画像と、前記第1デプス画像と、前記第3デプス画像と、に基づき、前記第2時刻の前記デプス画像である第2デプス画像を生成する工程と、
生成した前記第2デプス画像を出力する工程と、
を含み、
前記制御部は、
前記第2デプス画像の注目画素について、
前記第1カメラ画像と、前記第2カメラ画像とに基づき、前記第1時刻と前記第2時刻との間における前記被写体の動きを示す第1動きベクトルを取得し、
前記第2カメラ画像と、前記第3カメラ画像とに基づき、前記第2時刻と前記第3時刻との間における前記被写体の動きを示す第2動きベクトルを取得し、
前記第1動きベクトルに基づき、前記第1デプス画像の前記注目画素に対応する画素における第1デプス値を取得し、
前記第2動きベクトルに基づき、前記第3デプス画像の前記注目画素に対応する画素における第3デプス値を取得し、
前記第1デプス値と、前記第3デプス値と、の重み付き調和平均により、前記第2デプス画像の前記注目画素のデプス値である第2デプス値を取得する。
【0019】
本開示によれば、プログラムは、
(10)コンピュータを(1)から(8)のいずれかの画像生成装置として動作させる。
【発明の効果】
【0020】
本開示の一実施形態によれば、より品質が高い補間デプス画像を取得することができる。
【図面の簡単な説明】
【0021】
【
図1】一実施形態に係る画像生成システムの機能構成例を示すブロック図である。
【
図2】一実施形態に係る画像生成装置のハードウェア構成例を示すブロック図である。
【
図3】
図1の画像生成装置による補間デプス画像の取得を説明する図である。
【
図4】
図1の画像生成装置による補間デプス画像の取得を説明する図である。
【
図5】一実施形態に係る画像生成システムの機能構成例を示すブロック図である。
【
図6】
図5の画像生成装置による補間デプス画像の取得を説明する図である。
【
図7】一実施形態に係る画像生成装置の動作例を示すフローチャートである。
【
図8】一実施形態に係る画像生成システムの機能構成例を示すブロック図である。
【
図9A】
図8の画像生成装置による補間デプス画像の取得を説明する図である。
【
図9B】
図8の画像生成装置による補間デプス画像の取得を説明する図である。
【
図10】一実施形態に係る画像生成装置の動作例を示すフローチャートである。
【
図11】一実施形態に係る画像生成システムの機能構成例を示すブロック図である。
【
図12】
図11の画像生成装置による補間デプス画像の取得を説明する図である。
【発明を実施するための形態】
【0022】
以下、本開示の一実施形態について、図面を参照して説明する。各図面中、同一の構成又は機能を有する部分には、同一の符号を付している。本実施形態の説明において、同一の部分については、重複する説明を適宜省略又は簡略化する場合がある。
【0023】
<<実施形態1>>
図1は、一実施形態に係る画像生成システム1aの機能構成例を示すブロック図である。画像生成システム1aは、画像生成装置10a、カメラ20、及び、デプスカメラ30を備える。
【0024】
カメラ20は、一定のフレームレートで、被写体のカメラ画像を取得する。カメラ画像は、被写体を含む撮影範囲における輝度に関する情報を画素毎に含む。例えば、カメラ画像は、複数の画素の各々について、RGB(Red,Green,Blue、カラー画像)、輝度(グレースケール画像)、又は、二値(白黒二値画像)等の値を有してもよい。カメラ20は、光情報を電気信号に変換する光電変換素子を画素毎に備えてもよい。
【0025】
デプスカメラ30は、一定のフレームレートで、被写体のデプス画像を取得する。デプス画像は、撮影範囲における距離に関する情報を画素毎に含む。例えば、デプス画像は、複数の画素の各々についてデプスカメラ30から被写体までの距離(深さ)の情報(デプス値)を有する。デプスカメラ30は、例えば、ToF等の深度センサを用いて、デプスカメラ30から被写体までの距離を測定してデプス画像を取得してもよい。以下、デプスカメラ30は、カメラ20よりも低いフレームレートでデプス画像を取得する例を説明する。
【0026】
画像生成装置10aは、カメラ20及びデプスカメラ30と通信可能に接続され、カメラ20からカメラ画像を受信し、デプスカメラ30からデプス画像を受信する。画像生成装置10aは、機能要素として、動きベクトル取得部101、及び、補間画像生成部102を備える。動きベクトル取得部101は、カメラ画像の互いに時間的に隣接するフレームを用いて、カメラ画像に映り込んでいる被写体領域の時間的変動を示す動きベクトルを取得する。補間画像生成部102は、デプス画像の互いに時間的に隣接するフレームを、対応する時刻の動きベクトルを用いて補間し、補間デプス画像を取得する。
【0027】
このように、画像生成装置10aは、デプス画像のみを用いてデプス画像のフレームを補間するのではなく、カメラ画像から取得された対応する時刻の動きベクトルを用いてデプス画像のフレームを補間する。したがって、画像生成装置10aは、高いフレームレートで取得された情報を反映した、より品質が高い補間デプス画像を取得することができる。
【0028】
以下、カメラ20及びデプスカメラ30は、同一の光軸上にあり、同一の被写体を撮影して、同一の画角及び同一の解像度の、カメラ画像及びデプス画像を取得する場合の例を説明する。また、以下、カメラ20及びデプスカメラ30の位置及び撮影方向等は不変だが、被写体は移動する場合の例を説明する。
【0029】
図2は、一実施形態に係る画像生成装置10aのハードウェア構成例を示すブロック図である。後述する画像生成装置10b,10c,10dは、画像生成装置10aと同一のハードウェア構成を備えてもよい。そこで、以下、画像生成装置10a,10b,10c,10dをまとめて「画像生成装置10」と称する場合がある。
図1に示すように、画像生成装置10は、制御部11、記憶部12、通信部13、入力部14、及び出力部15を備える。画像生成装置10は、例えば、PC(Personal Computer)又はタブレット端末等の汎用のコンピュータにより実現されるが、デプス画像の処理を行うための専用の装置により実現されてもよい。
【0030】
制御部11は、1つ以上のプロセッサを含む。一実施形態において「プロセッサ」は、汎用のプロセッサ、又は、特定の処理に特化した専用のプロセッサであるが、これらに限定されない。制御部11は、画像生成装置10を構成する各構成部と通信可能に接続され、画像生成装置10全体の動作を制御する。
【0031】
記憶部12は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、ROM(Read-Only Memory)、及びRAM(Random Access Memory)等の任意の記憶モジュールを含む。記憶部12は、例えば、主記憶装置、補助記憶装置、又はキャッシュメモリとして機能してもよい。記憶部12は、画像生成装置10の動作に用いられる任意の情報を記憶する。例えば、記憶部12は、システムプログラム、アプリケーションプログラム、通信部13によって受信された各種情報(例えば、カメラ20によって取得されたカメラ画像、及び、デプスカメラ30によって取得されたデプス画像等)等を記憶してもよい。記憶部12は、画像生成装置10に内蔵されているものに限定されず、外付けのデータベース又は外付け型の記憶モジュールであってもよい。
【0032】
通信部13は、任意の通信技術によってカメラ20又はデプスカメラ30等の他の装置と通信接続可能な、任意の通信モジュールを含む。通信部13は、さらに、他の装置との通信を制御するための通信制御モジュール、及び他の装置との通信に必要となる識別情報等の通信用データを記憶する記憶モジュールを含んでもよい。
【0033】
入力部14は、操作者の入力操作を受け付けて、操作者の操作に基づく入力情報を取得する1つ以上の入力インターフェースを含む。例えば、入力部14は、物理キー、静電容量キー、ポインティングディバイス、又は、出力部15のディスプレイと一体的に設けられたタッチスクリーン等であるが、これらに限定されない。
【0034】
出力部15は、操作者に対して情報を出力し、操作者に通知する1つ以上の出力インターフェースを含む。例えば、出力部15は、情報を画像として出力するディスプレイ等であるが、これらに限定されない。このようなディスプレイは、例えば、液晶パネルディスプレイ又は有機EL(Electro Luminescence)ディスプレイ等としてもよい。なお、上述の入力部14及び出力部15の少なくとも一方は、画像生成装置10と一体に構成されてもよいし、別体として設けられてもよい。
【0035】
画像生成装置10の各機能要素(例えば、動きベクトル取得部101、補間画像生成部102等)は、本実施形態に係るコンピュータプログラム(プログラム)を、制御部11に含まれるプロセッサで実行することにより実現されうる。すなわち、画像生成装置10の各機能要素は、ソフトウェアにより実現されうる。コンピュータプログラムは、画像生成装置10の動作に含まれるステップの処理をコンピュータに実行させることで、各ステップの処理に対応する機能をコンピュータに実現させる。すなわち、コンピュータプログラムは、コンピュータを本実施形態に係る画像生成装置10として機能させるためのプログラムである。コンピュータプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータプログラムをサーバのストレージに格納しておき、ネットワークを介して、サーバから他のコンピュータにプログラムを転送することにより、プログラムは流通されてもよい。
【0036】
画像生成装置10の一部又は全ての機能が、制御部11に含まれる専用回路により実現されてもよい。すなわち、画像生成装置10の一部又は全ての機能が、ハードウェアにより実現されてもよい。また、画像生成装置10は単一のコンピュータにより実現されてもよいし、互いに通信可能な複数のコンピュータの協働により実現されてもよい。
【0037】
図3及び
図4は、
図1の画像生成装置10aによる補間デプス画像の取得を説明する図である。
図3は、カメラ画像51(51t,51(t+1),51(t+2))、及び、デプス画像61(61t,61(t+1),61(t+2))を示している。カメラ画像51(51t,51(t+1),51(t+2))は、時間的に連続して取得されたカメラ画像である。カメラ画像51は、第1時刻、第2時刻、第3時刻としての、時刻t,時刻(t+1),時刻(t+2)に取得されている。デプス画像61t,61(t+2)は、時間的に連続して取得されたデプス画像である。デプス画像61t,61(t+2)は、時刻t,時刻(t+2)に取得されている。デプス画像61(t+1)は、デプス画像61t,61(t+2)を補間して取得されるデプス画像である。以下、カメラ画像51のフレームレートは、例えば、60fpsとしてもよい。デプス画像61t,61(t+2)のフレームレートは、例えば、30fpsとしてもよい。
【0038】
カメラ画像51(51t,51(t+1),51(t+2))には、被写体の領域71(71t,71(t+1),71(t+2))が映り込んでいる。
図3の例では、被写体は、時間の経過に伴い、カメラ20及びデプスカメラ30の前方を左から右へ横切っている。画像生成装置10aの動きベクトル取得部101は、公知の手法を用いて、カメラ画像51から、被写体の領域71を検出する。そして、動きベクトル取得部101は、隣接するカメラ画像のフレーム間における被写体の位置の変化を動きベクトルとして取得する。具体的には、動きベクトル取得部101は、時刻(t+1)のカメラ画像51(t+1)における被写体の領域71(t+1)の位置に対する、時刻tのカメラ画像51tにおける被写体の領域71tの相対的な位置を動きベクトルV
0として取得する。動きベクトル取得部101は、時刻(t+1)のカメラ画像51(t+1)における被写体の領域71(t+1)の位置に対する、時刻(t+2)のカメラ画像51(t+2)における被写体の領域71(t+2)の相対的な位置を動きベクトルV
1として取得する。例えば、動きベクトル取得部101は、領域71(t+1)の各画素について、領域71t内の対応する画素を判定して、画素毎に動きベクトルV
0を取得してもよい。動きベクトル取得部101は、領域71(t+1)の各画素について、領域71(t+2)内の対応する画素を判定して、画素毎に動きベクトルV
1を取得してもよい。
【0039】
デプス画像61t,61(t+2)には、被写体の領域72t,72(t+2)が含まれる。前述のように、カメラ画像及びデプス画像は、同一の被写体を撮影して取得された、同一の画角及び同一の解像度の画像である。そこで、画像生成装置10aの補間画像生成部102は、カメラ画像51t,51(t+2)において被写体が占める領域71t,71(t+2)に対応するデプス画像61t,61(t+2)における領域を、領域72t,72(t+2)として判定してもよい。また、補間画像生成部102は、カメラ画像51(t+1)において被写体が占める領域71(t+1)に対応するデプス画像61(t+1)における領域を、被写体が占める領域72(t+1)として判定してもよい。
【0040】
補間画像生成部102は、デプス画像61tにおける領域72tのデプス値Z0と、デプス画像61(t+2)における領域72(t+2)のデプス値Z1との、動きベクトルV0,V1に基づく重み付き調和平均により、デプス画像61(t+1)における領域72(t+1)のデプス値Zpを算出する。すなわち、補間画像生成部102は、デプス画像61(t+1)における領域72(t+1)内の各画素の位置(以下「注目画素位置」と称する。)について、動きベクトルV0,V1に基づく重み付き調和平均によりデプス値Zpを算出する。具体的には、補間画像生成部102は、注目画素位置に動きベクトルV0を加えて定まる画素位置における時刻tのデプス画像61tのデプス値Z0と、注目画素位置に動きベクトルV1を加えて定まる画素位置における時刻(t+2)のデプス画像61(t+2)のデプス値Z1と、に基づき、注目画素位置におけるデプス値Zpを算出する。例えば、補間画像生成部102は、デプス値Z0に対しては動きベクトルV1のノルムを重みとし、デプス値Z1に対しては動きベクトルV0のノルムを重みとして、数1のように、注目画素位置におけるデプス値Zpを算出してもよい。
【0041】
【0042】
このように、画像生成装置10aは、時刻(t+1)のデプス画像61(t+1)を時刻t、(t+2)のデプス画像61t、61(t+2)、及び、時刻t~(t+2)のカメラ画像51t、51(t+2)から取得された動きベクトルV
0、V
1に基づき生成する。画像生成装置10aは、このような処理を、取得されたカメラ画像及びデプス画像の全時間範囲にわたって実行する。したがって、画像生成装置10aは、被写体がカメラ20及びデプスカメラ30から見て奥行方向の成分を含む方向に移動した場合であっても、実際の被写体の位置を反映した適切なデプス画像61(t+1)を取得することが可能である。また、本実施形態において、画像生成装置10aは、一定のフレームレートのカメラ画像及びデプス画像を取得してデプス画像の補間を行う例を説明したが、カメラ画像及びデプス画像の各フレームの時間的間隔は一定でなくてもよい。例えば、カメラ画像及びデプス画像の互いに時間的に隣接するフレームの時間的間隔が時間の経過に応じて変動してもよい。また、
図3の例において、被写体は直線状の軌跡を描いて移動しているが、被写体の移動の軌跡は曲線状でもよい。被写体の移動の速度は一定でなくてもよい。
【0043】
画像生成装置10aは、ブロックマッチング法、及び、勾配法等を含む任意の手法を用いて動きベクトルを取得してもよい。以下、ブロックマッチング法を用いて動きベクトルを取得する例を説明する。
【0044】
図4は、ブロックマッチング法により動きベクトルを取得して、補間デプス画像を取得する場合の動作例を示している。ブロックマッチング法において、画像生成装置10aの動きベクトル取得部101は、補間デプス画像を取得する時刻t+1のカメラ画像(基準フレーム)51(t+1)を一定の大きさのブロックB
n
102に分割する。ブロックB
n
102は、カメラ画像51(t+1)から抽出されたn番目のブロックである。動きベクトル取得部101は、過去又は未来のカメラ画像(対象フレーム)51t,51(t+2)に含まれる、ブロックB
n
102と類似度が高い領域のブロックB
n
101、B
n
103を、基準フレームのブロックB
n
102と対応付けることで、動きベクトルV
n
12、V
n
23を取得する。動きベクトルV
n
12は、カメラ画像51(t+1)を基準フレーム、カメラ画像51tを対象フレームとして取得される動きベクトルである。動きベクトルV
n
23は、カメラ画像51(t+1)を基準フレーム、カメラ画像51(t+2)を対象フレームとして取得される動きベクトルである。
【0045】
ここで、被写体が奥行方向の成分を含む方向に移動する場合、時間的に隣接するカメラ画像51t、51(t+1)、51(t+2)において被写体が占める領域のサイズは変化する。そこで、動きベクトル取得部101は、対象フレームと時刻が同一のデプス画像61t,61(t+2)のデプス(深さ)の情報を基に、基準フレームから抽出したブロックBn
102の大きさを調整してから、そのブロックBn
102と類似する領域のブロックBn
101、Bn
103を対象フレームにおいて探索する。
【0046】
例えば、時刻tのデプス画像61tにおける被写体領域72tの全画素の平均デプス値をZt、時刻t+2のデプス画像を61(t+2)における被写体領域72(t+2)の全画素の平均デプス値をZt+2とする。この場合、Zt+2-Ztの正負に基づき、奥行方向の移動の有無及び向きは、次のとおりである。
Zt+2-Zt<0:被写体は手前方向に移動している
Zt+2-Zt=0:被写体は奥行方向に移動していない
Zt+2-Zt>0:被写体は奥方向に移動している
なお、動きベクトル取得部101は、デプス画像61t、61(t+2)の全画素について、互いに対応する画素間でデプス値の差分を求め、その差分の値が0又は一定の閾値以下となる領域を、被写体の領域72t、72(t+2)として判定してもよい。
【0047】
例えば、カメラ画像51(t+1)に設定したブロックBn
102を、一辺の長さがwt+1=wの正方形とする。この場合、被写体の奥行方向の移動速度が一定であるとして、カメラ画像51t、51(t+2)に設定されるブロックBn
103の一辺の長さwt、wt+2は、数2、数3のようにしてもよい。
【0048】
【0049】
【0050】
動きベクトル取得部101は、基準フレームから取得された画像のブロックBn
102を数2、数3により示される大きさにリサイズし、リサイズされたブロックBn
102との類似度が高いブロックを対象フレームの中で探索する。動きベクトル取得部101は、ブロックBn
102のリサイズを任意の手法で行うことができ、例えば、最近傍法、平均画素法、又は、線形補間法を用いてブロックBn
102をリサイズしてもよい。
【0051】
動きベクトル取得部101は、リサイズされたブロックBn
102との類似度を任意の手法で評価することができる。動きベクトル取得部101は、例えば、SSD(Sum of Squared Difference)、SAD(Sum of Absolute Difference)、NCC(Normalized Cross Correlation)、及び、ZNCC(Zero means Normalized Cross Correlation)等を用いてもよい。例えば、SSDでは、リサイズされたブロックBn
102と同じ大きさのブロックを対象フレームの中から抽出し、両画像のブロック内の各画素についての画素値の差の二乗和を算出して、二乗和の値が小さい場合に、ブロック間の一致度が高いと評価する。具体的には、画素の座標(i,j)について、基準フレームのブロックの画素値をI1(i,j)、対象フレームのブロックの画素値をI2(i,j)とすると、SSD値SSSDは数4で示される。
【0052】
【0053】
動きベクトル取得部101は、基準フレームに含まれる各ブロックB
n
102について、そのブロックB
n
102とのSSD値S
SSDが最も小さい対象フレームのブロックを対応するブロックB
n
101、B
n
103として判定する。動きベクトル取得部101は、ブロックB
n
102に対するブロックB
n
101の相対位置を動きベクトルV
n
12として判定する。動きベクトル取得部101は、ブロックB
n
102に対するブロックB
n
103の相対位置を動きベクトルV
n
23として判定する。動きベクトルV
n
12、V
n
23は、
図3を参照して説明した動きベクトルV
0、V
1に対応する。
【0054】
画像生成装置10aの補間画像生成部102は、時刻t+1のデプス画像(補間デプス画像)を、数1に基づき算出してもよい。あるいは、補間画像生成部102は、時刻t+1のデプス画像61(t+1)に含まれるブロックBn
102のデプス値Dn
102を、動きベクトルVn
12、Vn
23により位置が特定された時刻t,t+2のブロックBn
101、Bn
103のデプス値Dn
101、Dn
103の相加平均、調和平均、又は相乗平均により算出してもよい。
【0055】
【0056】
【0057】
【0058】
数5は、ブロックBn
102のデプス値Dn
102をブロックBn
101、Bn
103のデプス値Dn
101、Dn
103の相加平均により算出する場合の計算式である。数6は、デプス値Dn
102をデプス値Dn
101、Dn
103の調和平均により算出する場合の計算式である。数7は、デプス値Dn
102をデプス値Dn
101、Dn
103の相乗平均により算出する場合の計算式である。
【0059】
なお、以上の説明では、カメラ20及びデプスカメラ30は、同一の光軸上にあり、同一の画角及び同一の解像度の、カメラ画像及びデプス画像を取得する場合の例を説明したが、カメラ20及びデプスカメラ30の画角及び解像度等は異なってもよい。画像生成装置10は、カメラ20とデプスカメラ30とで撮影の画角が異なる場合、カメラ20とデプスカメラ30の位置関係に基づき、カメラ20とデプスカメラ30とで、画素を対応付けてもよい。例えば、画像生成装置10aは、カメラ20及びデプスカメラ30の相対的な位置関係に基づき予め算出された外部パラメータを用いて、デプスカメラ30が取得したデプス画像を、カメラ20の位置姿勢及び画素数等に応じた画像に射影変換してもよい。その場合、デプス画像の解像度は、一般にカメラ画像よりも低いことが多いため、デプス画像の変換の際に欠損領域が生じる場合がある。画像生成装置10aは、そのような欠損領域を、メディアンフィルタ等を用いて補間してもよい。また、画像生成装置10aは、カメラ画像とデプス画像の解像度を合わせるために、最近傍補間法又はバイリニア補間法等を用いて画像を補間してもよい。
【0060】
以上のように、画像生成装置10aは、被写体を含む撮影範囲における輝度に関する情報を画素毎に含むカメラ画像であって、第1時刻、第2時刻、第3時刻に撮影された第1カメラ画像、第2カメラ画像、第3カメラ画像を取得する。ここで、第2時刻は第1時刻の後の時刻であり、第3時刻は第2時刻の後の時刻である。画像生成装置10aは、撮影範囲における距離に関する情報を画素毎に含むデプス画像であって、第1時刻に撮影された第1デプス画像と、第3時刻に撮影された第3デプス画像と、を取得する。画像生成装置10aは、これらの第1カメラ画像と、第2カメラ画像と、第3カメラ画像と、第1デプス画像と、第3デプス画像と、に基づき、第2時刻のデプス画像である第2デプス画像を生成し、生成した第2デプス画像を出力する。具体的には、画像生成装置10aは、第2デプス画像の注目画素について、第1カメラ画像と、第2カメラ画像とに基づき、第1時刻と第2時刻との間における被写体の動きを示す第1動きベクトルを取得する。画像生成装置10aは、第2カメラ画像と、第3カメラ画像とに基づき、第2時刻と第3時刻との間における被写体の動きを示す第2動きベクトルを取得する。画像生成装置10aは、第1動きベクトルに基づき、第1デプス画像の注目画素に対応する画素における第1デプス値を取得する。画像生成装置10aは、第2動きベクトルに基づき、第3デプス画像の注目画素に対応する画素における第3デプス値を取得する。画像生成装置10aは、第1デプス値と、第3デプス値と、の重み付き調和平均により、第2デプス画像の注目画素のデプス値である第2デプス値を取得する。
【0061】
このように、画像生成装置10aは、デプス画像の注目画素について、時間的に対応するカメラ画像に基づき動きベクトルを取得し、動きベクトルに基づき、デプス画像を補間する。したがって、画像生成装置10aによれば、カメラ画像に映り込んでいる被写体の動きの情報を利用して、デプス画像を適切に補間することが可能である。よって、より品質が高い補間デプス画像を取得ことができる。
【0062】
なお、本実施形態では、時間的に連続して撮影されたカメラ画像51のフレームに基づき動きベクトルを取得する例を説明したが、画像生成装置10aは、時間的に連続しないフレームに基づき動きベクトルを取得してもよい。例えば、60fpsのカメラ画像を利用して、15fpsのデプス画像を補間して30fpsのデプス画像を生成する場合、画像生成装置10aは、1フレームおきのカメラ画像に基づき動きベクトルを取得してもよい。
【0063】
また、画像生成装置10aは、第1デプス値に対しては第1動きベクトルのノルムを重みとし、第3デプス値に対しては第2動きベクトルのノルムを重みとする重み付き調和平均により、第2デプス値を取得してもよい。このような構成によれば、カメラ画像及びデプス画像の各フレームの時間的間隔が一定でなく、被写体の軌跡が直線でなく、あるいは、被写体の移動速度が一定でなくても、品質が高い補間デプス画像を取得ことができる。
【0064】
また、画像生成装置10aは、第2カメラ画像を複数のブロックに区分する。画像生成装置10aは、複数のブロックの各々について、第2カメラ画像のブロックと第1カメラ画像とを比較して、当該ブロックとの類似度が最も高い領域の当該ブロックの画素位置に対する位置関係に基づき、第1動きベクトルを取得する。画像生成装置10aは、複数のブロックの各々について、第2カメラ画像のブロックと第3カメラ画像とを比較して、当該ブロックとの類似度が最も高い領域の当該ブロックの画素位置に対する位置関係に基づき、第2動きベクトルを取得する。このような構成によれば、ブロック単位で効率的に動きベクトルを取得することができる。
【0065】
なお、
図4を参照した説明において、画像生成装置10aは、第2カメラ画像を複数のブロックに区分して、ブロックごとに第1動きベクトル、第2動きベクトルを取得したが、ブロックの特定はこのような手法に限られない。例えば、画像生成装置10aは、第2カメラ画像上においてブロックを少しずつずらして移動させながら、各位置のブロックの第2カメラ画像に最も類似する領域を第1カメラ画像、第3カメラ画像において検出することで第1、第2動きベクトルを取得してもよい。換言すると、画像生成装置10aは、互いに重畳する領域を含む複数のブロックごとに、第1動きベクトル、第2動きベクトルを取得してもよい。
【0066】
また、画像生成装置10aは、第1デプス画像の全画素にわたる平均デプス値と、第3デプス画像の全画素にわたる平均デプス値とに基づいて、第2カメラ画像のブロックの大きさを第1デプス画像に合わせて変更してもよい。画像生成装置10aは、当該大きさが変更された第2カメラ画像のブロックと第1カメラ画像とを比較して、第1動きベクトルを取得してもよい。画像生成装置10aは、第1デプス画像の全画素にわたる平均デプス値と、第3デプス画像の全画素にわたる平均デプス値とに基づいて、第2カメラ画像のブロックの大きさを第3デプス画像に合わせて変更してもよい。画像生成装置10aは、当該大きさが変更された第2カメラ画像のブロックと第3カメラ画像とを比較して、第2動きベクトルを取得してもよい。このような構成によれば、被写体の奥行方向の移動に応じてブロックの大きさを変更することができ、第2カメラ画像と、第1カメラ画像、第3カメラ画像とを適切に対応付けて、第1動きベクトル、第2動きベクトルを取得することができる。
【0067】
また、画像生成装置10aは、カメラ20により第1時刻、第2時刻、第3時刻に撮影されたカメラ画像を、第1カメラ画像、第2カメラ画像、第3カメラ画像として取得する。画像生成装置10aは、デプスカメラ30により第1時刻、第3時刻に撮影されたデプス画像を、第1デプス画像、第3デプス画像として取得する。したがって、画像生成装置10aは、デプスカメラ30により取得されたデブス画像を補間することが可能である。
【0068】
また、画像生成装置10aは、カメラ画像としてカラー画像を用いてもよい。このような構成によれば、被写体に関して豊富な情報を利用して、被写体が占める領域、及び、動きベクトル等をより正確に求めることができる。したがって、画像生成装置10aは、より精緻な補間デプス画像を取得することが可能である。
【0069】
<<実施形態2>>
実施形態1では、デプスカメラ30を用いてデプス画像を取得し、そのデプス画像を動きベクトルを用いて補間する構成例を説明した。本実施形態では、複数のカメラを用いて複数のカメラ画像を取得し、これらのカメラ画像から三角測量の原理に基づくステレオマッチングによりデプス画像を取得する。一般にステレオマッチングによりデプス画像を取得する処理は計算量が多く、処理負荷が大きい。そこで、本実施形態においては、ステレオマッチングに基づくデプス画像の取得は一部のフレームについてのみ行い、その他のデプス画像については、実施形態1と同様に、カメラ画像により取得された動きベクトルを用いてデプス画像を補間することにより取得する。そのため、本実施形態に係る構成によれば、複数のカメラを用いて効率的にデプス画像の動画像を生成することが可能である。以下、実施形態1と異なる構成及び動作を中心に説明し、実施形態1と同一の構成及び動作については、詳細な説明を省略する。
【0070】
図5は、一実施形態に係る画像生成システム1bの機能構成例を示すブロック図である。画像生成システム1bは、画像生成装置10b、及び、カメラ20a,20bを備える。
【0071】
カメラ20a,20bの各々は、
図1を参照して説明したカメラ20と同様である。本実施形態では、カメラ20a,20bは、既知の位置関係に配置されて、同一の被写体を同時に撮影する。カメラ20aは、撮影により取得したカメラ画像aを画像生成装置10bへ出力する。カメラ20bは、撮影により取得したカメラ画像bを画像生成装置10bへ出力する。カメラ画像a,bを用いたステレオマッチングにより、デプス画像を生成することができる。
【0072】
画像生成装置10bは、動きベクトル取得部101、補間画像生成部102、及び、デプス計算部103を備える。動きベクトル取得部101、及び、補間画像生成部102は、
図1を参照して説明した画像生成装置10aが備える動きベクトル取得部101、及び、補間画像生成部102と同様である。デプス計算部103は、カメラ画像a,bを用いたステレオマッチングによりデプス画像を生成する。補間画像生成部102は、デプス計算部103において生成されたデプス画像を動きベクトルにより補間して、所望のフレームレートのデプス画像を生成する。
【0073】
図6は、
図5の画像生成装置10bによる補間デプス画像の取得を説明する図である。
図6において、カメラ画像a(カメラ画像51(51t,51(t+1),51(t+2)))は、カメラ20aにより時間的に連続して取得されたカメラ画像である。カメラ画像51t,51(t+1),51(t+2)は、時刻t,時刻(t+1),時刻(t+2)に取得されている。カメラ画像b(カメラ画像52(52t,52(t+1),52(t+2)))は、カメラ20bにより時間的に連続して取得されたカメラ画像である。カメラ画像52t,52(t+1),52(t+2)は、時刻t,時刻(t+1),時刻(t+2)に取得されている。カメラ画像a、及び、カメラ画像bのフレームレートは同一であり、例えば、60fpsとしてもよい。カメラ画像a,bは、欠損がない被写体の領域71a(71at,71a(t+1),71a(t+2)),72b(71bt,71b(t+1),71b(t+2))を含む。
【0074】
図6の例において、画像生成装置10bのデプス計算部103は、2つのカメラ画像a,bに対して1フレームおきにステレオマッチングを行い、デプス画像61t,61(t+2)を取得している。カメラ画像a,bのフレームレートが60fpsの場合、デプス画像61t,61(t+2)のフレームレートは、30fpsである。デプス計算部103は、カメラ20a,20bの視差D、カメラ間距離B、及び、焦点距離Fを用いて、三角測量の原理から、被写体の領域71a,71bについて、数8により距離(デプス値)Zを取得することができる。
【0075】
【0076】
デプス計算部103は、同一時刻のカメラ画像a,bのフレームを比較して被写体の領域71a,71bについて画素の対応付けを行い、互いに対応する点につき、数8により、被写体の領域72t,72(t+2)のデプス値を取得することができる。同一時刻のカメラ画像a,b間の画素間の対応点の探索は、例えば、前述のSSDを用いてブロックごとに実行することができる。
【0077】
デプス画像61tは、カメラ画像51t及び52tから取得されるデプス画像である。デプス画像61(t+2)は、カメラ画像51(t+2)及び52(t+2)から取得されるデプス画像である。デプス計算部103は、デプス画像61t,61(t+2)の光軸が、カメラ画像51t、51(t+2)の光軸と同一となるように、デプス画像61t,61(t+2)を生成してもよい。
【0078】
画像生成装置10bの動きベクトル取得部101は、実施形態1と同様に、カメラ画像51(t+1)を基準フレーム、カメラ画像51t,51(t+2)を対象フレームとして、時間的に隣接するカメラ画像のフレームの組ごとに、被写体の領域71aにおけるフレーム間の動きベクトルを取得する。画像生成装置10bの補間画像生成部102は、取得した動きベクトルに基づき、デプス画像61t,61(t+2)を補間して、被写体の領域72(t+1)を含む補間デプス画像61(t+1)を取得する。
【0079】
以上のように、画像生成装置10bは、第1カメラ(カメラ20a)により第1時刻、第2時刻、第3時刻に撮影されたカメラ画像を、第1カメラ画像、第2カメラ画像、第3カメラ画像として取得する。画像生成装置10bは、第1カメラ(カメラ20a)に対して予め定められた位置関係に設けられた第2カメラ(カメラ20b)により第1時刻、第3時刻に撮影されたカメラ画像を、第4カメラ画像、第5カメラ画像として取得する。画像生成装置10bは、第1カメラ画像と、第4カメラ画像と、のステレオマッチングにより取得されたデプス画像を第1デプス画像として取得する。画像生成装置10bは、第3カメラ画像と、第5カメラ画像と、のステレオマッチングにより取得されたデプス画像を第3デプス画像として取得する。画像生成装置10bが、第1動きベクトル、第2動きベクトルを用いて、第1デプス画像、第3デプス画像を補間する処理内容は実施形態1と同様である。
【0080】
したがって、画像生成装置10bによれば、デプスカメラ30がなくても最大でカメラ画像と同一のフレームレートのデプス画像を取得することができる。また、画像生成装置10bは、全てのデプス画像をカメラ画像のステレオマッチングにより取得するのではなく、一部のデプス画像をステレオマッチングにより取得し、それ以外のデプス画像はカメラ画像を解析して取得された動きベクトルに基づき取得する。したがって、計算負荷が大きいステレオマッチングの利用を抑えて、少ない計算量で効率的にデプス画像を補間することが可能である。
【0081】
図7は、実施形態1、2に係る画像生成装置10a,10bの動作例を示すフローチャートである。
図7を参照して説明する画像生成装置10a,10bの動作は、本実施形態に係る画像生成方法の少なくとも一部に相当し得る。
図7の各ステップは、画像生成装置10の制御部11の制御に基づき実行される。
【0082】
ステップS1において、制御部11は、カメラ20により撮影されたカメラ画像を取得する。実施形態1のように、1台のカメラ20により撮影された場合は、そのカメラ20により撮影されたカメラ画像を取得する。実施形態2のように、2台のカメラ20a,20bにより撮影された場合は、カメラ20a,bにより撮影されたカメラ画像a,bを取得する。カメラ画像のフレームレートは、例えば、60fpsとしてもよい。
【0083】
ステップS2において、制御部11は、ステップS1で取得されたカメラ画像に基づき、動きベクトルを取得する。具体的には、実施形態1のように、1台のカメラ20により撮影された場合は、そのカメラ20により撮影されたカメラ画像に基づき、フレーム間における動きベクトルを取得する。実施形態2のように、2台のカメラ20a,20bにより撮影された場合は、カメラ画像a,bのいずれか一方に基づき、フレーム間における動きベクトルを取得する。以下、カメラ画像aに基づき、フレーム間における動きベクトルを取得する場合の例を説明する。
【0084】
ステップS3において、制御部11は、デプスカメラ30が出力するデプス信号を利用可能であるか否かを判定する。実施形態1のように、デプスカメラ30が設けられている場合、制御部11は、デプス信号が利用可能であると判定する。実施形態2のように、デプスカメラ30が設けられていない場合、制御部11は、デプス信号が利用可能でないと判定する。制御部11は、デプス信号が利用可能である場合(ステップS3でYES)はステップS4へ進み、そうでない場合(ステップS3でNO)はステップS5へ進む。
【0085】
ステップS4において、制御部11は、デプスカメラ30により撮影されたデプス画像を取得する。
【0086】
ステップS5において、制御部11は、撮影時刻が同一のカメラ画像a,bに基づき、ステレオマッチングによりデプス画像を計算する。ステップS4又はステップS5で取得されるデプス画像のフレームレートは、例えば、30fpsとしてもよい。
【0087】
ステップS6において、制御部11は、ステップS4又はステップS5で取得されたデプス画像を、ステップS2で取得した動きベクトルを用いて補間し、補間デプス画像を生成する。制御部11は、ステップS4又はステップS5で取得されたデプス画像に補間デプス画像を追加し、カメラ画像と同じフレームレート(例えば、60fps)のデプス画像を生成してもよい。制御部11は、生成したデプス画像を記憶部12に出力して、記憶部12に記憶させてもよい。制御部11は、生成したデプス画像を、通信部13を介して他の装置へ出力してもよい。制御部11は、生成したデプス画像を、出力部15のディスプレイに出力して表示させてもよい。
【0088】
なお、画像生成装置10aは、ステップS1~ステップS6の各処理を、カメラ20及びデプスカメラ30の撮影と並行して、カメラ20及びデプスカメラ30からカメラ画像及びデプス画像を受信しながらリアルタイムに実行してもよい。
あるいは、画像生成装置10aは、カメラ20及びデプスカメラ30が処理対象の画像を撮影後、記憶部12に記憶されたカメラ画像及びデプス画像を読み出して、ステップS1~ステップS6の各処理を実行してもよい。
【0089】
<<実施形態3>>
実施形態1では、カメラ画像に対応するデプス画像の全画素の範囲にわたってデプスカメラがデプス値を計測することができた場合の処理を説明した。しかし、市販されているデプスカメラの多くは光源として赤外光を用いており、被写体までの距離又は被写体表面の反射特性によって、反射光の検出が難しく、デプス値を計測できない部分が生じる場合がある。そこで、本実施形態では、2台のカメラと1台のデプスカメラを備え、デプスカメラが取得したデプス画像においてデプス値が計測できなかった欠損部分を2つのカメラ画像に基づき補間する構成について説明する。以下、実施形態1、2と異なる構成及び動作を中心に説明し、実施形態1、2と同一の構成及び動作については、詳細な説明を省略する。
【0090】
図8は、一実施形態に係る画像生成システム1cの機能構成例を示すブロック図である。画像生成システム1cは、画像生成装置10c、カメラ20a,20b、及び、デプスカメラ30を備える。
【0091】
カメラ20a,20bは、
図5を参照して説明したカメラ20a,20bと同様である。本実施形態では、カメラ20a,20bは、既知の位置関係に配置されて、同一の被写体を一定のフレームレート(例えば、60fps)で同時に撮影する。カメラ20aは、撮影により取得したカメラ画像aを画像生成装置10bへ出力する。カメラ20bは、撮影により取得したカメラ画像bを画像生成装置10bへ出力する。画像生成装置10cは、デプス画像における欠損部分について、カメラ画像a,bを用いたステレオマッチングにより、切抜デプス画像を生成することができる。
【0092】
デプスカメラ30は、
図1を参照して説明したデプスカメラ30と同様である。以下、デプスカメラ30は、カメラ20aと同一の光軸上にあり、同一の画角及び同一の解像度の、デプス画像を取得する例を説明する。本実施形態において、デプスカメラ30は、カメラ20a,20bと同一のフレームレート(例えば、60fps)でデプス画像を取得する例を説明するが、デプスカメラ30のフレームレートは、カメラ20a,20bよりも小さくてもよい(例えば、30fps)。なお、デプスカメラ30の光軸、画角、又は、解像度等がカメラ20aと異なる場合、実施形態1と同様に、画像生成装置10cは、デプスカメラ30及びカメラ20aの画素を対応付けたり、画素を補間して解像度をそろえたりしてもよい。
【0093】
画像生成装置10cは、動きベクトル取得部101、補間画像生成部102、デプス計算部103、シルエット判定部104、マスク判定部105、切抜範囲判定部106、及び、デプス合成部107を備える。動きベクトル取得部101、及び、補間画像生成部102は、
図1を参照して説明した画像生成装置10aが備える動きベクトル取得部101、及び、補間画像生成部102と同様である。デプス計算部103は、
図5を参照して説明したデプス計算部103と同様である。ただし、後述するように、本実施形態において、動きベクトル取得部101、補間画像生成部102、及び、デプス計算部103は、切抜範囲判定部106が判定した切抜範囲に含まれるカメラ画像及びデプス画像について処理を行う。
【0094】
シルエット判定部104は、カメラ20aが取得したカメラ画像aにおいて被写体が占める領域をシルエットとして判定する。マスク判定部105は、デプスカメラ30が取得したデプス画像において被写体が占める領域をマスクとして判定する。切抜範囲判定部106は、シルエット判定部104が判定したシルエットと、マスク判定部105が判定したマスクとを比較して、デプスカメラ30が取得したデプス画像における被写体を示す領域の欠損部分に対応する切抜範囲を判定する。
【0095】
動きベクトル取得部101は、カメラ画像a,bに基づき、切抜範囲判定部106が判定した切抜範囲における被写体の動きベクトルを取得する。デプス計算部103は、カメラ画像a,bのステレオマッチングにより、切抜範囲判定部106が判定した切抜範囲における切抜デプス画像を生成する。デプス計算部103は、例えば、カメラ画像a,bよりも低いフレームレート(例えば、30fps)で切抜デプス画像を生成してもよい。補間画像生成部102は、動きベクトル取得部101が取得した切抜範囲における被写体の動きベクトルと、デプス計算部103が生成した切抜範囲における切抜デプス画像に基づき、切抜範囲におけるデプス画像である補間切抜デプス画像を生成する。補間画像生成部102は、実施形態1、2の補間画像生成部102と同様に、動きベクトルを用いて切抜デプス画像を補間することで、高いフレームレート(例えば、60fps)の切抜デプス画像を取得することができる。デプス合成部107は、デプス計算部103が取得した切抜デプス画像に対して、補間画像生成部102が補間切抜デプス画像を補間した切抜デプス画像と、デプスカメラ30が取得したデプス画像を合成して、欠損部分がないデプス画像を取得する。
【0096】
画像生成装置10cは、カメラ画像a,bに基づき判定されたシルエットとデプスカメラ30が取得したデプス画像とを比較してマスクを判定し、デプス画像の欠損部分に当たる切抜範囲を判定する。画像生成装置10cは、カメラ画像a,bのステレオマッチングにより切抜範囲のデプス画像を取得する。画像生成装置10cは、切抜範囲のデプス画像を取得する際に、動きベクトルを用いてデプス画像を取得するため、少ない計算量で効率的に切抜範囲のデプス画像を取得することができる。
【0097】
図9A及び
図9Bは、
図8の画像生成装置10cによる補間デプス画像の取得を説明する図である。
図9Aにおいて、カメラ画像a(カメラ画像51(51t,51(t+1),51(t+2)))は、カメラ20aにより時間的に連続して取得されたカメラ画像である。カメラ画像51t,51(t+1),51(t+2)は、時刻t,時刻(t+1),時刻(t+2)に取得されている。カメラ画像b(カメラ画像52(52t,52(t+1),52(t+2)))は、カメラ20bにより時間的に連続して取得されたカメラ画像である。カメラ画像52t,52(t+1),52(t+2)は、時刻t,時刻(t+1),時刻(t+2)に取得されている。デプス画像61(61t,61(t+1),61(t+2))は、デプスカメラ30により時間的に連続して取得されたデプス画像である。デプス画像61t,61(t+1),61(t+2)は、時刻t,時刻(t+1),時刻(t+2)に取得されている。カメラ画像a、カメラ画像b、及び、デプス画像のフレームレートは同一であり、例えば、60fpsとしてもよい。カメラ画像a,bは、欠損がない被写体の領域71a(71at,71a(t+1),71a(t+2)),72b(71bt,71b(t+1),71b(t+2))を含む。デプス画像は、欠損がある被写体の領域76(76t,76a(t+1),76a(t+2))を含む。
【0098】
画像生成装置10cのシルエット判定部104は、カメラ画像aに含まれる被写体の領域71aの輪郭を被写体のシルエットとして判定する。画像生成装置10cのマスク判定部105は、デプスに含まれる被写体の領域76aの輪郭を被写体のマスクとして判定する。画像生成装置10cの切抜範囲判定部106は、シルエット判定部104が判定したシルエット、及び、マスク判定部105が判定したマスクの差分により、デプス画像61における被写体の欠損部分に対応する切抜範囲を判定する。切抜範囲判定部106は、カメラ画像aから切抜範囲の領域75(75t,75(t+1),75(t+2))を抽出した切抜カメラ画像81(81t,81(t+1),81(t+2))を取得する。さらに、切抜範囲判定部106は、カメラ画像bから切抜範囲の領域を抽出した切抜カメラ画像を取得する。
【0099】
画像生成装置10cのデプス計算部103は、実施形態2と同様に、切抜範囲の領域を抽出した2つのカメラ画像a,bに対して1フレームおきにステレオマッチングを行い、切抜範囲の領域77t,77(t+2)を含むデプス画像91t,91(t+2)を取得している。カメラ画像a,bのフレームレートが60fpsの場合、デプス画像91t,91(t+2)のフレームレートは、30fpsである。デプス計算部103は、実施形態2と同様に、式8に基づき、デプス画像91t,91(t+2)を取得してもよい。
【0100】
画像生成装置10cの動きベクトル取得部101は、実施形態1,2と同様に、カメラ画像81(t+1)を基準フレーム、カメラ画像81t,81(t+2)を対象フレームとして、時間的に隣接するカメラ画像のフレームの組ごとに、被写体の切抜範囲の領域75におけるフレーム間の動きベクトルを取得する。画像生成装置10cの補間画像生成部102は、取得した動きベクトルに基づき、デプス画像91t,91(t+2)を補間して、被写体の切抜範囲の領域77(t+1)を含む補間デプス画像91(t+1)を取得する。これにより、切抜範囲の領域77(77t,77(t+1),77(t+2))を含むデプス画像91(91t,91(t+1),91(t+2))が生成される。このように、画像生成装置10cは、切抜範囲におけるデプス値を取得するために、全フレームにおいてステレオマッチングを用いるのではなく、1フレームおきに動きベクトルを用いて隣接するデプス画像を補間する。したがって、画像生成装置10cは、切抜範囲のデプス値を取得するための計算量を低減することができる。
【0101】
画像生成装置10cのデプス合成部107は、デプス画像61のマスクの領域76と、デプス画像91の切抜範囲の領域77とを合成して、被写体の領域の欠損がないデプス画像121(121t,121(t+1),121(t+2))を生成する。デプス画像121(121t,121(t+1),121(t+2))は、欠損がない被写体の領域72(72t,72(t+1),72(t+2))を含む。
【0102】
図10は、一実施形態に係る画像生成装置10cの動作例を示すフローチャートである。
図10を参照して説明する画像生成装置10cの動作は、本実施形態に係る画像生成方法の少なくとも一部に相当し得る。
図10の各ステップは、画像生成装置10cの制御部11の制御に基づき実行される。
【0103】
ステップS11において、制御部11は、カメラ20a,20bにより撮影されたカメラ画像a,bを取得する。カメラ画像のフレームレートは、例えば、60fpsとしてもよい。
【0104】
ステップS12において、制御部11は、デプスカメラ30により撮影されたデプス画像を取得する。デプス画像のフレームレートは、例えば、60fpsとしてもよい。
【0105】
ステップS13において、制御部11は、ステップS11で取得したカメラ画像aの各フレームを解析して、カメラ画像aにおいて被写体が占める領域をフレーム毎にシルエットとして判定する。
【0106】
ステップS14において、制御部11は、ステップS12で取得したデプス画像の各フレームを解析して、デプス画像において被写体が占める領域をフレーム毎にマスクとして判定する。
【0107】
ステップS15において、制御部11は、ステップS13で判定したシルエットと、ステップS14で判定したマスクとをフレーム毎に比較して、ステップS12で取得したデプス画像における切抜範囲を判定する。
【0108】
ステップS16において、制御部11は、ステップS1で取得したカメラ画像a,bの切抜範囲における動きベクトルを1フレーム毎に取得する。制御部11は、
図7のステップS2と同様の手法により、動きベクトルを取得してもよい。
【0109】
ステップS17において、制御部11は、ステップS1で取得したカメラ画像a,bのステレオマッチングにより、切抜範囲におけるデプス画像を1フレーム毎に取得する。制御部11は、
図7のステップS5と同様の手法により、デプス画像を取得してもよい。ステレオマッチングにより取得されるデプス画像のフレームレートは、例えば、30fpsとしてもよい。
【0110】
ステップS18において、制御部11は、ステップS17で取得した切抜範囲におけるデプス画像をステップS17で取得した動きベクトルを用いて補間することにより、補間切抜デプス画像を取得する。
【0111】
ステップS19において、制御部11は、ステップS12で取得したデプス画像と、ステップS17で取得したデプス画像と、ステップS18で取得した補間切抜デプス画像と、を合成して、カメラ画像a,bと同一のフレームレートのデプス画像を生成する。制御部11は、生成したデプス画像を記憶部12に出力して、記憶部12に記憶させてもよい。制御部11は、生成したデプス画像を、通信部13を介して他の装置へ出力してもよい。制御部11は、生成したデプス画像を、出力部15のディスプレイに出力して表示させてもよい。
【0112】
以上のように、画像生成装置10cは、第1カメラ(カメラ20a)により第1時刻、第2時刻、第3時刻に撮影されたカメラ画像を、第1カメラ画像、第2カメラ画像、第3カメラ画像として取得する。画像生成装置10cは、第1カメラ(カメラ20a)に対して予め定められた位置関係に設けられた第2カメラ(カメラ20b)により第1時刻、第3時刻に撮影されたカメラ画像を、第4カメラ画像、第5カメラ画像として取得する。画像生成装置10cは、デプスカメラ30により第1時刻、第2時刻、第3時刻に撮影されたデプス画像を、第4デプス画像、第5デプス画像、第6デプス画像として取得する。画像生成装置10cは、第1カメラ画像と第4デプス画像とを比較して、第4デプス画像における被写体の領域の欠損部分に当たる第1切抜範囲を判定する。画像生成装置10cは、第1カメラ画像及び第4カメラ画像のステレオマッチングにより、第1切抜範囲におけるデプス画像である第1切抜デプス画像を取得する。画像生成装置10cは、第3カメラ画像と第6デプス画像とを比較して、第6デプス画像における被写体の領域の欠損部分に当たる第3切抜範囲を判定する。画像生成装置10cは、第3カメラ画像及び第5カメラ画像のステレオマッチングにより、第3切抜範囲におけるデプス画像である第3切抜デプス画像を取得する。画像生成装置10cは、第2カメラ画像と第5デプス画像とを比較して、第5デプス画像における被写体の領域の欠損部分に当たる第2切抜範囲を判定する。画像生成装置10cは、第1切抜範囲における第1カメラ画像と、第2切抜範囲における第2カメラ画像とに基づき、第2切抜範囲における第1動きベクトルを取得する。画像生成装置10cは、第2切抜範囲における第2カメラ画像と、第3切抜範囲における第3カメラ画像とに基づき、第2切抜範囲における第2動きベクトルを取得する。画像生成装置10cは、第1切抜デプス画像のデプス値と、第3切抜デプス画像のデプス値と、の第1動きベクトル及び第2動きベクトルに基づく重み付き調和平均により、第2切抜範囲におけるデプス画像である第2切抜デプス画像を取得する。
【0113】
このように、画像生成装置10cは、カメラ画像とデプスカメラにより撮影されたデプス画像とを比較して、デプス画像における欠損部分に当たる切抜範囲を判定する。そして、画像生成装置10cは、切抜範囲において、カメラ画像に基づくステレオマッチングにより切抜デプス画像を取得するとともに、カメラ画像を解析して取得された動きベクトルを利用して切抜デプス画像を補間する。したがって、仮にデプスカメラ30により撮影されたデプス画像に被写体の欠損部分が存する場合でも、効率的な処理により欠損のないデプス画像を取得することが可能である。
【0114】
<<実施形態4>>
3台以上のカメラにより取得されたカメラ画像により3次元モデリングを行って、3次元画像を取得するシステムが知られている。本実施形態では、このようなシステムにより取得された3次元画像に基づき、動きベクトルに基づき効率的にデプス画像を取得する構成を説明する。以下、実施形態1~3と異なる構成及び動作を中心に説明し、実施形態1と同一の構成及び動作については、詳細な説明を省略する。
【0115】
図11は、一実施形態に係る画像生成システム1dの機能構成例を示すブロック図である。画像生成システム1dは、画像生成装置10d、及び、カメラ20a,20b,20c,20dを備える。
【0116】
カメラ20a,20b,20c,20dの各々は、
図1を参照して説明したカメラ20と同様である。本実施形態では、カメラ20a,20b,20c,20dは、既知の位置関係に配置されて、同一の被写体を同時に撮影する。カメラ20a,20b,20c,20dは、撮影により取得したカメラ画像a,b,c,dを画像生成装置10dへ出力する。
カメラ画像a,b,cは、3次元モデリングを行って被写体の3次元画像を取得するために用いられる。カメラ画像dは、動きベクトルを取得するために用いられる。カメラ画像a,b,cのフレームレートは、例えば、30fpsとしてもよい。カメラ画像dのフレームレートは、例えば、60fpsとしてもよい。
【0117】
画像生成装置10bは、動きベクトル取得部101、補間画像生成部102、及び、3次元モデリング部108を備える。動きベクトル取得部101、及び、補間画像生成部102は、
図1を参照して説明した画像生成装置10aが備える動きベクトル取得部101、及び、補間画像生成部102と同様である。
【0118】
3次元モデリング部108は、カメラ20a,20b,20cにより撮影されたカメラ画像a,b,cと、カメラ20a,20b,20cの位置姿勢の情報に基づき、被写体の3次元形状データを取得する。カメラ20a,20b,20cの位置姿勢の情報は、予め3次元モデリング部108に設定されている。なお、3次元モデリング部108は、例えば、3次元位置が既知であるマーカー座標をカメラ画像a,b,cの各々から6点以上取得して線型方程式を解くことで、カメラ20a,20b,20cの位置姿勢を取得してもよい。3次元形状データは、例えば、被写体の3次元位置を点の集合で再現するポイントクラウドの形式としてもよい。なお、3次元形状データのデータ形式は任意であり、例えば、2次元の平面である三角形又は四角形等が集まって構成されるポリゴンメッシュの形式でもよい。
【0119】
3次元モデリング部108は、このようにして取得された被写体の3次元形状データに基づきデプス画像を取得する。3次元モデリング部108は、カメラ画像dと同一の光軸、画角、及び、解像度のデプス画像を取得してもよい。3次元モデリング部108が取得するデプス画像のフレームレートは、例えば、30fpsとしてもよい。動きベクトル取得部101は、カメラ画像dに基づき、被写体の領域の動きベクトルを取得し、3次元モデリング部108により取得されたデプス画像を補間して、例えば、60fpsのデプス画像を生成する。画像生成装置10dは、動きベクトルの取得及びデプス画像の補間を実施形態1~3と同様の手法により実行してもよい。
【0120】
図12は、
図11の画像生成装置10dによる補間デプス画像の取得を説明する図である。
図12において、カメラ画像a,b,c(カメラ画像51(51t,51(t+2)),52(52t,52(t+2)),53(53t,53(t+2)))は、カメラ20a,20b,20cにより時間的に連続して取得されたカメラ画像である。カメラ画像a,b,cは、被写体の領域111(111t,111(t+2))を含む。
【0121】
画像生成装置10dの3次元モデリング部108は、カメラ画像a,b,cを用いて、被写体の3次元画像131(131t,131(t+2))を取得する。3次元画像131は、被写体の領域112(112t,112(t+2))を含む。3次元モデリング部108は、3次元画像131をレンダリングして、カメラ画像dと同一の光軸、画角、及び、解像度のデプス画像141(141t,141(t+2))を取得する。デプス画像141は、被写体の領域113t,113(t+2)を含む。
【0122】
画像生成装置10dの動きベクトル取得部101は、実施形態1と同様に、カメラ画像dのカメラ画像161(t+1)を基準フレーム、カメラ画像161t,161(t+2)を対象フレームとして、時間的に隣接するカメラ画像のフレームの組ごとに、被写体の領域114(t+1)におけるフレーム間の動きベクトルを取得する。画像生成装置10dの補間画像生成部102は、取得した動きベクトルに基づき、デプス画像141t,141(t+2)を補間して、被写体の領域113(t+1)を含む補間デプス画像141(t+1)を取得する。
【0123】
以上のように、画像生成装置10dは、カメラ20により第1時刻、第2時刻、第3時刻に撮影されたカメラ画像を、第1カメラ画像、第2カメラ画像、第3カメラ画像として取得する。画像生成装置10dは、被写体の3次元画像から取得された第1時刻、第3時刻のデプス画像を、第1デプス画像、第3デプス画像として取得する。画像生成装置10dが、第1カメラ画像、第2カメラ画像、第3カメラ画像に基づき第1動きベクトル、第2動きベクトルを取得する処理、及び、第1動きベクトル、第2動きベクトルを用いて、第1デプス画像、第3デプス画像を補間する処理の内容は実施形態1と同様である。
【0124】
このように、画像生成装置10dは、3次元画像から取得されたデプス画像に基づきデプス画像の補間を行う。したがって、画像生成装置10dによれば、3次元再構成を行うシステム等により取得された3次元画像を用いて、カメラ画像のフレームレートに応じたデプス画像を効率的に習得することができる。
【0125】
本開示は上述の実施形態に限定されるものではない。例えば、ブロック図に記載の複数のブロックは統合されてもよいし、又は一つのブロックは分割されてもよい。フローチャートに記載の複数のステップは、記述に従って時系列に実行する代わりに、各ステップを実行する装置の処理能力に応じて、又は必要に応じて、並列的に又は異なる順序で実行されてもよい。その他、本開示の趣旨を逸脱しない範囲での変更が可能である。
【0126】
また、例えば、画像生成装置10の構成及び動作を、互いに通信可能な複数のコンピュータに分散させてもよい。また、例えば、画像生成装置10の一部又は全部の構成要素をクラウドサーバ等の他の装置に設けてもよい。
【符号の説明】
【0127】
1(1a,1b,1c,1d) 画像生成システム
10(10a,10b,10c,10d) 画像生成装置
11 制御部
12 記憶部
13 通信部
14 入力部
15 出力部
20(20a,20b,20c,20d) カメラ
30 デプスカメラ
51~53 カメラ画像
61 デプス画像
71(71a,71b),72 被写体の領域
75 切抜カメラ画像
76 マスク画像
77 切抜デプス画像
101 動きベクトル取得部
102 補間画像生成部
103 デプス計算部
104 シルエット判定部
105 マスク判定部
106 切抜範囲判定部
107 デプス合成部
108 3次元モデリング部
131 3次元画像
141 デプス画像
161 カメラ画像