(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-18
(45)【発行日】2024-06-26
(54)【発明の名称】画像処理装置、画像処理方法、およびプログラム
(51)【国際特許分類】
G06T 19/00 20110101AFI20240619BHJP
G06T 15/20 20110101ALI20240619BHJP
【FI】
G06T19/00 A
G06T15/20 500
(21)【出願番号】P 2020045609
(22)【出願日】2020-03-16
【審査請求日】2023-03-16
(73)【特許権者】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】110003281
【氏名又は名称】弁理士法人大塚国際特許事務所
(72)【発明者】
【氏名】古川 剛史
【審査官】鈴木 圭一郎
(56)【参考文献】
【文献】特開2019-114269(JP,A)
【文献】特開2014-071870(JP,A)
【文献】特開2006-072805(JP,A)
【文献】国際公開第2018/030206(WO,A1)
【文献】国際公開第2020/209108(WO,A1)
【文献】国際公開第2019/244944(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 19/00
G06T 15/20
(57)【特許請求の範囲】
【請求項1】
複数の撮像装置により得られた画像に基づいて
生成されたオブジェクトの3次元形状
データを用い
て仮想視点画像を生成する生成手段と、
前記オブジェクトの位置の情報を取得する位置取得手段と、
前記オブジェクトの
一部が、前記3次元形状
データが生成される領域
の外に存在すると前記オブジェクトの位置の情報に基づいて判断される場合に警
告を行
い、前記オブジェクトの全体が前記領域の外に存在すると前記オブジェクトの位置の情報に基づいて判断される場合に前記警告を行わないと判定する判定手段と、を有し、
前記判定手段によ
り前記警
告を行うと判定された場合に、前記生成手段は、前記仮想視点画像
に警告表示を
行うことを特徴とする画像処理装置。
【請求項2】
前記判定手段は、
前記オブジェクトの3次元形状と前記オブジェクトの位置の情報と前
記領域
とに基づいて、前記警
告を行うか否かを判定することを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記オブジェクトの位置の情報は、前記オブジェクトの3次元形状が外接する直方体の頂点の座標であり、
前記判定手段は、前記頂点の座標のいずれかが、
前記領域の
外に存在する場合に、前記警
告を行うと判定することを特徴とする請求項2に記載の画像処理装置。
【請求項4】
前記判定手段
は、前記頂点の座標のいずれかが、前
記領域の境界と、当該境界より所定距離内側の別の境界との間に存在すると判定された場合に、
前記警告とは異なる別の警告を行うと判定し、
前記生成手段は、
前記判定手段により前記別の警告を行うと判定された場合、前記仮想視点画像
に前記警告表示と異なる別の警告表示を
行うことを特徴とする請求項3に記載の画像処理装置。
【請求項5】
前記生成手段は、前記警告表示と前記別の警告表示とで、色および/またはメッセージを異ならせることを特徴とする請求項4に記載の画像処理装置。
【請求項6】
複数の撮像装置により得られた画像に基づいて生成されたオブジェクトの3次元形状データを用いて仮想視点画像を生成する生成手段と、
前記オブジェクトの位置の情報を取得する位置取得手段と、
前記オブジェクトの位置の情報と前記3次元形状データが生成される領域とに基づいて警告を行うか否かを判定する判定手段と、を有し、
前記判定手段によ
り前記警
告を行うと判定された場合に、前記生成手段は、前記仮想視点画像
に警告表示と、当該判定における時刻情報
の表示とを
行うことを特徴とす
る画像処理装置。
【請求項7】
複数の撮像装置により得られた画像に基づいて生成されたオブジェクトの3次元形状データを用いて仮想視点画像を生成する生成手段と、
前記オブジェクトの位置の情報を取得する位置取得手段と、
前記オブジェクトの位置の情報と前記3次元形状データが生成される領域とに基づいて警告を行うか否かを判定する判定手段と、を有し、
前記判定手段により、前記警
告を行うと判定された場合に、前記生成手段は、前記複数の撮像装置による撮像対象全体を表示する画像において、前記オブジェクトに対して警告表示を
行うことを特徴とする請求項1から6のいずれか1項に記載の画像処理装置。
【請求項8】
複数の撮像装置により得られた画像に基づいて生成されたオブジェクトの3次元形状データを用いて仮想視点画像を生成する生成手段と、
前記オブジェクトの位置の情報を取得する位置取得手段と、
前記オブジェクトの位置の情報と前記3次元形状データが生成される領域とに基づいて警告を行うか否かを判定する判定手段と、を有し、
前記判定手段により前記警告を行うと判定された場合に、前記生成手段は、前記仮想視点画像に警告表示を行い、
前記判定手段は、
さらに前記
オブジェクトの移動速度に基づいて、前記警
告を行うか否かを判定することを特徴とす
る画像処理装置。
【請求項9】
前記判定手段は、前記
オブジェクトの前記3次元形状
データが生成される領域の境界に到達するまでの時間が所定の閾値以下である場合に、前記警
告を行うと判定することを特徴とする請求項8に記載の画像処理装置。
【請求項10】
前記複数の撮像装置により得られた画像に基づいて、前記オブジェクトの3次元形状データを生成する形状生成手段をさらに有し、
前記生成手段は、前記形状生成手段によって生成された前記オブジェクトの3次元形状データを用いて前記仮想視点画像を生成することを特徴とする請求項1から9のいずれか1項に記載の画像処理装置。
【請求項11】
複数の撮像装置により得られた画像に基づいて
生成されたオブジェクトの3次元形状
データを用い
て仮想視点画像を生成する生成工程と、
前記オブジェクトの位置の情報を取得する位置取得工程と、
前記オブジェクトの
一部が、前記3次元形状
データが生成される領域
の外に存在すると前記オブジェクトの位置の情報に基づいて判断される場合に警
告を行
い、前記オブジェクトの全体が前記領域の外に存在すると前記オブジェクトの位置の情報に基づいて判断される場合に前記警告を行わないと判定する判定工程と、を有し、
前記判定工程におい
て前記警
告を行うと判定された場合に、前記生成工程では、前記仮想視点画像
に警告表示を
行うことを特徴とする画像処理方法。
【請求項12】
複数の撮像装置により得られた画像に基づいて生成されたオブジェクトの3次元形状データを用いて仮想視点画像を生成する生成工程と、
前記オブジェクトの位置の情報を取得する位置取得工程と、
前記オブジェクトの位置の情報と前記3次元形状データが生成される領域とに基づいて警告を行うか否かを判定する判定工程と、を有し、
前記判定工程において前記警告を行うと判定された場合に、前記生成工程では、前記仮想視点画像に警告表示と、当該判定における時刻情報の表示とを行うことを特徴とする画像処理方法。
【請求項13】
複数の撮像装置により得られた画像に基づいて生成されたオブジェクトの3次元形状データを用いて仮想視点画像を生成する生成工程と、
前記オブジェクトの位置の情報を取得する位置取得工程と、
前記オブジェクトの位置の情報と前記3次元形状データが生成される領域とに基づいて警告を行うか否かを判定する判定工程と、を有し、
前記判定工程において前記警告を行うと判定された場合に、前記生成工程では、前記複数の撮像装置による撮像対象全体を表示する画像において、前記オブジェクトに対して警告表示を行うことを特徴とする請求項1から6のいずれか1項に記載の画像処理装置。
【請求項14】
複数の撮像装置により得られた画像に基づいて生成されたオブジェクトの3次元形状データを用いて仮想視点画像を生成する生成工程と、
前記オブジェクトの位置の情報を取得する位置取得工程と、
前記オブジェクトの位置の情報と前記3次元形状データが生成される領域とに基づいて警告を行うか否かを判定する判定工程と、を有し、
前記判定工程により前記警告を行うと判定された場合に、前記生成工程では、前記仮想視点画像に警告表示を行い、
前記判定工程では、さらに前記オブジェクトの移動速度に基づいて、前記警告を行うか否かを判定することを特徴とする画像処理方法。
【請求項15】
コンピュータを、請求項1から
10のいずれか1項に記載の画像処理装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、仮想視点画像の生成技術に関する。
【背景技術】
【0002】
昨今、被写体(オブジェクト)をさまざまな視点や角度から見た映像を視聴できる仮想視点映像(自由視点画像)の技術が注目されている。例えば、サッカーやバスケットボールのハイライトシーンを様々な角度から視聴することが出来るため、仮想視点映像は通常の映像と比較してユーザに高臨場感を与えることが出来る。このような仮想視点映像は、被写体を取り囲むように設置された複数のカメラを用いて同一のタイミングで多方向から撮影することで得られた複数の画像から生成される。
【0003】
仮想視点映像の生成の具体的手法が、特許文献1に記載されている。当該文献に開示されている技術では、まず、複数のカメラにより撮影された画像を被写体と被写体以外の背景に分離し、被写体のシルエット画像を抽出する。続いて、複数の異なる視点のシルエット画像から、視体積交差法などにより被写体の3次元形状を導出する。そして、オペレータ等から指示された視点の情報に基づき、3次元形状に対して、カメラを用いた撮影により得られたテクスチャ情報をマッピングしてレンダリングすることにより、任意の視点の映像を生成する。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
上記特許文献に開示された技術では、複数のカメラにより撮影された画像に基づいてオブジェクトの3次元形状を導出し、当該3次元形状を用いて仮想視点映像を生成している。そのため、複数のカメラの配置などによってオブジェクトの3次元形状を導出可能な領域は限定され、当該領域の境界付近に位置するオブジェクトの3次元形状が正しく導出できない場合がある。例えば、3次元形状を導出可能な領域の境界に人物が位置する場合において、当該人物の一部が欠けた3次元形状が導出されてしまうことが考えられる。このように3次元形状が正しく導出されていないオブジェクトが仮想視点画像に含まれると、視聴者に違和感を与えてしまうという課題がある。
【0006】
本発明は上記課題に鑑みてなされたものであり、違和感のある仮想視点画像の生成を抑制することを目的とする。
【課題を解決するための手段】
【0007】
上記目的を達成するための一手段として、本発明の画像処理装置は以下の構成を有する。すなわち、複数の撮像装置により得られた画像に基づいて生成されたオブジェクトの3次元形状データを用いて仮想視点画像を生成する生成手段と、前記オブジェクトの位置の情報を取得する位置取得手段と、前記オブジェクトの一部が前記3次元形状データが生成される領域の外に存在すると前記オブジェクトの位置の情報に基づいて判断される場合に警告を行い、前記オブジェクトの全体が前記領域の外に存在すると前記オブジェクトの位置の情報に基づいて判断される場合に前記警告を行わないと判定する判定手段と、を有し、前記判定手段により前記警告を行うと判定された場合に、前記生成手段は、前記仮想視点画像に警告表示を行う。
【発明の効果】
【0008】
本発明によれば、違和感のある仮想視点画像の生成を抑制することが可能となる。
【図面の簡単な説明】
【0009】
【
図1A】画像処理システムおよび画像処理装置の機能構成の一例を示す図である。
【
図1B】画像処理装置のハードウェア構成の一例を示す図である。
【
図3】(a)は3次元形状導出可能な領域を説明するための図であり、(b)は座標情報の例を示す図である。
【
図4】実施形態1における警告判定処理を示すフローチャートである。
【
図5】実施形態1におけるオブジェクトの位置情報の例を示す。
【
図6】移動するオブジェクト(ボクセル群)の例を示す図である。
【
図7】実施形態2におけるオブジェクトの位置情報の例を示す。
【
図8】実施形態2における警告判定処理を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下、添付図面を参照して実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
【0011】
[実施形態1]
(画像処理システムおよび画像処理装置の構成)
図1に、本実施形態における画像処理システムおよび画像処理装置の機能構成の一例を示す。本実施形態における画像処理装置1000は、センサシステム11a~11f、操作装置1140、および表示装置1130に接続されている。画像処理装置1000はさらに、クライアント装置1150に接続されていてもよい。画像処理装置1000と前述の各装置への接続形態は、有線または無線であり得る。
【0012】
センサシステム11a~11fはそれぞれ、撮像部1110とシルエット画像導出部1120を備える。なお、
図1Aではセンサシステムの数は6(センサシステム11a~11f)とするが、その数は特定の数に限定されるものではない。また、以下の説明では、センサシステム11a~11fを総称してセンサシステム11と表現する場合もある。撮像部1110は、デジタルビデオカメラ等に代表される撮像手段であり、撮像処理により映像データを生成する。複数の撮像部1110は、撮影対象領域(例えばサッカーが行われるフィールド)をそれぞれ異なる方向から撮影する。例えば、撮像部1110は、シリアルデジタルインターフェイス(SDI)に代表される映像信号インターフェイスを備えたデジタルビデオカメラである。撮像部1110は、例えば映像信号インターフェイスを介して、映像データをシルエット画像導出部1120に出力する。シルエット画像導出部1120は、撮像部1110から取得した映像データからシルエット画像を導出する。シルエット画像とは、オブジェクトの輪郭の中が塗りつぶされた白黒の画像である。シルエット画像は、オブジェクトの輪郭の中と外を各ピクセル2値の情報で表すことにより、オブジェクトの形状の情報を有する。なお、オブジェクトとは、仮想視点画像の前景や背景に含まれる対象物(被写体)であり、例えば、センサシステム11の撮像部1110により撮像可能な範囲に存在する人物、当該範囲に存在する構造物等である。シルエット画像導出部1120は、例えば、背景差分法などに代表される方法による演算処理により、シルエット画像を導出(生成)する。
【0013】
操作装置1140は、画像処理装置1000に仮想視点カメラの位置(仮想視点の位置)を指示する入力装置である。操作装置1140は、例えば、オペレータが仮想視点カメラの位置を指示(指定)するために、レバーとスイッチで構成される。画像処理装置1000は、操作装置1140から入力された仮想カメラ(仮想視点)の位置及び向きに基づき、仮想視点画像の生成を行う。なお、本説明において、「画像」は、静止画および動画(映像)を含むものとする。
【0014】
表示装置1130は、表示画面を有する装置である。表示画面は、液晶ディスプレイ(Liquid Crystal Display(LCD))、LED(Light Emitting Diode)等で構成され得る。画像処理装置1000により生成された仮想視点画像は表示装置1130に表示され、オペレータが見る(映像の場合は視聴)することが可能となる。オペレータは、表示装置1130に表示される仮想視点画像を見ながら、操作装置1140を用いて仮想カメラの位置及び向きの指定を行うことができる。なお、操作装置1140と表示装置1130は、1つの制御装置として構成することも可能である。
【0015】
クライアント装置1150は、視聴者(クライアント)が画像処理装置1000により生成された仮想視点画像を見る(映像の場合は視聴)することが可能な装置であり、少なくとも表示部(不図示)を有する。当該表示部は、表示装置1130と同様に、LCDやLED等で構成され得る。クライアント装置1150の例は、スマートフォン、ラップトップ、タブレット等である。
【0016】
画像処理装置1000は、一例として、3次元形状導出部1010、位置情報導出部1020、領域情報保持部1030、警告判定部1040、仮想視点画像生成部1050で構成される。画像処理装置1000は、センサシステム11のシルエット画像導出部1120により導出されたシルエット画像、および、センサシステム11の撮像部1110の撮像処理により得られた画像データであるテクスチャ情報(オブジェクトの表面(質感)を含む画像情報)を取得する。
【0017】
3次元形状導出部1010は、センサシステム11のシルエット画像導出部1120から入力されたシルエット画像から、オブジェクトの3次元形状の情報を導出する機能を有する。本実施形態では、当該3次元形状は、ボクセル群として導出される。シルエット画像から3次元形状情報を導出する手法は、一般的に使用されている視体積交差法などを用いてもよい。視体積交差法とは、複数の撮像部からのシルエット画像を3次元空間に逆投影し、それぞれの視体積の交差部分を求めることにより3次元形状情報を得る手法である。
【0018】
位置情報導出部1020は、3次元形状導出部1010により導出されたオブジェクトの3次元形状(ボクセル群)に対する3次元の座標(X,Y,Z)を導出(算出)することにより、当該オブジェクトの位置導出を行う機能を有する。本実施形態では、位置情報導出部1020は、ボクセル群を3次元空間座標にマッピングをして、該3次元形状情報の位置情報(ボクセル群の座標)を導出する。位置情報導出部1020は、各フレームにおいて、または、任意のタイミングにおいて、オブジェクトの位置情報を導出し得る。位置情報導出部1020は導出した位置情報を記憶部1210(
図1B)に格納する。
【0019】
領域情報保持部1030は、3次元形状導出部1010が3次元形状を導出可能な3次元空間(以後3次元形状導出可能な領域と呼ぶ)の情報を導出し、記憶部1210において保持する機能を有する。本実施形態では、3次元形状導出可能な領域は、座標により表される。なお、3次元形状導出可能な領域は、3次元形状導出部1010が導出し、記憶部1210において保持してもよい。3次元形状を導出可能な3次元空間の座標情報の例については後述する。
【0020】
警告判定部1040は、位置情報導出部1020により導出されたオブジェクトの位置情報と、領域情報保持部1030により保持される3次元形状導出可能な領域に基づき、警告表示を行うか否かの判定を行う。警告判定部1040の処理フローについては、
図4のフローチャートを用いて後述する。
【0021】
仮想視点画像生成部1050は、3次元形状導出部1010により導出された3次元形状の情報、および、センサシステム11から取得したテクスチャ情報から、仮想視点画像を生成する。仮想視点画像生成部1050は、例えば、3次元形状とテクスチャ情報から、レンダリング処理を行い、仮想視点画像を生成する。また、仮想視点画像生成部1050は、警告判定部1040からの指示に基づく情報を、生成した仮想視点画像に付与(重畳)することができる。仮想視点画像生成部1050は、仮想視点画像を表示装置1130に出力する。また、画像処理装置1000がクライアント装置1150に接続される場合は、仮想視点画像生成部1050は、仮想視点画像をクライアント装置1150に出力してもよい。
【0022】
図1Bに、画像処理装置1000のハードウェア構成例を示す。記憶部1210はROM、RAMの両方、もしくは、いずれか一方により構成され、後述する各種動作を行うためのプログラムや、無線通信のための通信パラメータ等の各種情報を記憶する。なお、記憶部1210として、ROM、RAM等のメモリの他に、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD-ROM、CD-R、磁気テープ、不揮発性のメモリカード、DVDなどの記憶媒体を用いてもよい。制御部1220はCPU、または、MPUにより構成され、記憶部1210に記憶されたプログラムを実行することにより画像処理装置1000全体を制御する。なお、制御部1220は、記憶部1210に記憶されたプログラムとOS(Operating System)との協働により画像処理装置1000全体を制御するようにしてもよい。通信部1230は、有線または無線で、各種情報/データの外部への出力および入力を行う。例えば、通信部1230は、IEEE802.11シリーズに準拠した無線通信の制御や、IP通信の制御を行う。また、通信部1230はアンテナ1240を制御して、無線通信のための無線信号の送受信を行ってもよい。センサシステム11、操作装置1140、表示装置1130、およびクライアント装置1150と画像処理装置1000との通信は、通信部1230を介して行われ得る。
【0023】
(オブジェクトの3次元形状と当該オブジェクトの位置情報の説明)
続いて、オブジェクトの3次元形状と当該オブジェクトの位置情報について、
図2と
図3を参照して説明する。
図2は、仮想視点画像の例を示す図である。本実施形態では、センサシステム11a~11fのそれぞれがスタジアムの周囲に配置され、スタジアム内のフィールドを含むエリアにおいて、画像処理装置1000が仮想視点画像を生成するものとする。また、本実施形態では、スタジアム内のフィールド上で複数の選手がサッカーを行っているシーンを想定する。
【0024】
図2(e)に、画像処理装置1000により生成される仮想視点画像の例として、仮想視点画像2400を示す。仮想視点画像2400は以下の処理により生成することができる。まず、センサシステム11a~11fにおけるそれぞれの撮像部1110がスタジアムの周囲から撮像を行い、シルエット画像導出部1120が、各オブジェクトのシルエット画像の導出を行う。シルエット画像導出部1120により導出された各オブジェクトのシルエット画像は、画像処理装置1000に入力される。また、センサシステム11a~11fからテクスチャ情報も、画像処理装置1000に入力される。入力された不図示のシルエット画像には、
図2(e)におけるオブジェクトである選手2010、2011とボール2012のシルエット画像が含まれている。画像処理装置1000は、シルエット画像とテクスチャ情報から、3次元形状の導出とレンダリングを行い、仮想視点画像2400を生成する。仮想視点画像2400には、選手2010、2011とボール2012が映し出されている。
【0025】
しかしながら、設置された撮像部1110の配置状況により、正しく3次元形状が導出できる領域は限定される。
図2(e)の仮想視点画像2400において、ゴールライン2060およびタッチライン2070で構成されるフィールド2050よりも外側に設定される境界2030から内側の領域が3次元形状導出可能な領域とする(後述する
図3(a)も参照)。このような場合、3次元形状導出可能な領域の内側にある選手2010およびボール2012については、正しく3次元形状を導出することが可能である。一方、3次元形状導出可能な領域の境界にある選手2011については、3次元形状導出可能な領域の外側にある形状が正しく導出されない。もしくは、3次元形状導出可能な領域の外側にあるオブジェクトは形状導出を行わないとすると、
図2(e)の仮想視点画像2400に映されている選手2011のように、体の一部が可視できない仮想視点画像が生成されてしまう。このような仮想視点画像を視聴者に提供してしまうと、現実世界では起きえない状況が表された画像により臨場感を損ない、視聴者に違和感を与えてしまう。
【0026】
臨場感のある仮想視点画像を提供するために、本実施形態における画像処理装置1000は、3次元形状導出可能な領域の境界付近にオブジェクトが存在する場合に、オペレータに対して警告を発するように構成される。
【0027】
図3を参照して、画像処理装置1000が、3次元形状導出可能な領域の境界付近にオブジェクトが存在するかを判定する処理について説明する。
図3(a)に、3次元形状導出可能な領域を説明するための図を示す。本実施形態では、サッカーのフィールド2050(長さ3100×長さ3110で囲まれる領域)の全面において3次元形状が導出可能になるようにセンサシステム11a~11fがフィールド2050の周囲に配置されているものとする。境界2030は、ゴールライン2060とタッチライン2070より、それぞれ長さ3400と長さ3300の分、外側に設定された境界であり、境界2030から内側の領域(長さ3200×長さ3210で囲まれる領域)が3次元形状導出可能な領域である。なお、本実施形態では長さ3400と長さ3300はともに10mであるとする。
【0028】
画像処理装置1000の3次元形状導出部1010は、ボクセルサイズを10×10×10cm=1ボクセルとして、ボクセル群で構成される3次元形状を導出する。当該ボクセルサイズを用いる場合、実寸で10mの距離は、3次元空間上では100ボクセル分の距離となる。なお、ボクセルを用いることは説明を簡単にするためであり、他の任意の単位を用いて3次元形状を導出してもよい。また、説明を簡単にするためにボクセルの1辺を10cmにしたが、ボクセルの1辺のサイズは任意のサイズでよい。当該ボクセルサイズを用いる場合、ゴールライン2060およびタッチライン2070より100ボクセル分外側に、境界2030が存在することになる。前述したように、3次元形状導出可能な領域の境界2030の内側にあるオブジェクトについては3次元形状が正しく導出されることになる。また、3次元形状導出可能な領域の境界2030の外側にあるオブジェクトは3次元形状が正しく導出されない。
【0029】
このように定義された3次元導出可能な領域の境界2030を表す4頂点の座標は、3次元空間上の原点を原点3010(x、y、z)=(0,0,0)とした時、
図3に示した以下の座標である。
頂点3020(x、y、z)=(100、100、0)
頂点3021(x、y、z)=(800、100、0)
頂点3022(x、y、z)=(100、1100、0)
頂点3023(x、y、z)=(800、1100、0)
【0030】
なお、本実施形態では説明を簡単にするためにz方向の説明を省略しているが、x方向、y方向同様にz方向にも、3次元導出可能な領域に制限を設けてもよい。
図3には示していないが、例えば、z方向はフィールド2050の位置(地面)から10mの高さまで3次元形状導出が可能とすると、3次元空間上では、z方向の座標は100ボクセル未満であれば3次元導出可能となる。
【0031】
よって、3次元形状導出可能な空間(領域)は、以下の(式1)~(式3)を満たす座標(x、y、z)で囲まれる領域となる。
100<= x < 800 (式1)
100<= y < 1100 (式2)
0 <= z < 100 (式3)
【0032】
この空間(領域)は、前述の説明の通り、ゴールライン2060およびタッチライン2070よりも100ボクセル外側にある。本実施形態では、3次元導出可能な領域の境界2030の座標情報(3次元形状導出可能な領域)は、予め領域情報保持部1030により設定・導出され、保持され得る。
【0033】
図3(a)において、丸と四角の合成マークで示すボクセル群2010v、2011v、2012vは、3次元形状化されたオブジェクトのボクセル群を表す。ボクセル群2010v、2011v、2012vは、それぞれ、
図2(e)の仮想視点画像2400におけるオブジェクトである選手2011、2011、ボール2012について、3次元形状導出部1010が導出した3次元形状(すなわちボクセル群)に対応する。なお、説明を簡単にするために、すべてのオブジェクトのボクセル群について図示しないが、実際にはすべてのサッカー選手およびボールについて3次元形状(ボクセル群)が導出される。
【0034】
図3(b)に、画像処理装置1000の位置情報導出部1020により導出(生成)される、選手2011についてのボクセル群2011vの座標情報の例を示す。位置情報導出部1020は、3次元形状導出部1010により導出されたボクセル群について、原点3010に対する3次元の座標(X,Y,Z)を導出する。位置情報導出部1020は、ボクセル群の位置情報として、当該ボクセル群に外接する直方体(以後バウンディングボックスと呼ぶ)の頂点の座標を算出する。
図3(b)の例では、位置情報導出部1020は、ボクセル群2011vの位置情報として、ボクセル群2011vに対するバウンディングボックスの頂点(
図3(b)に示す頂点3501~3508の8点)を算出する。
【0035】
ここで、バウンディングボックスの頂点3501~3508の8点の算出方法について説明する。位置情報導出部1020は、複数のボクセルで構成されているボクセル群2011vの各軸の最大座標値と最小座標値を算出する。なお、各軸の最大座標値と最小座標値を算出することが困難な場合には、位置情報導出部1020は、これらの座標値を推定して導出してもよい。ボクセル群2011vのX軸の最小座標値(Xmin)、X軸の最大座標値(Xmax)は、それぞれ798と803とする。同様に、ボクセル群2011vのY軸の最小座標値(Ymin)、Y軸の最大座標値(Ymax)は、それぞれ195、200であり、ボクセル群2011vのZ軸の最小座標値(Zmin)、Z軸の最大座標値(Zmax)は、それぞれ0、18とする。位置情報導出部1020は、これらの各軸の最大座標値、最小座標値を組み合わせることにより、各頂点の座標を算出する。例えば、頂点3501は、各軸の最小座標値を組み合わせた座標となる。よって頂点3501の座標は、Xmin,Ymin,Zmin)=(798、195、0)となる。同様に、位置情報導出部1020は、頂点3502~3508を以下のように算出する。
頂点3501=(Xmin,Ymin,Zmin)=(798,195,0)
頂点3502=(Xmax,Ymin,Zmin)=(803,195,0)
頂点3503=(Xmin,Ymax,Zmin)=(798,200,0)
頂点3504=(Xmax,Ymax,Zmin)=(803,200,0)
頂点3505=(Xmin,Ymin,Zmax)=(798,195,18)
頂点3506=(Xmax,Ymin,Zmax)=(803,195,18)
頂点3507=(Xmin,Ymax,Zmax)=(798,200,18)
頂点3508=(Xmax,Ymax,Zmax)=(803,200,18)
【0036】
これら頂点3501~3508の座標は、ボクセル群2011v(選手2011)の位置情報である。同様に、位置情報導出部1020は、ボクセル群2010v(選手2010)とボクセル群2012v(ボール2012)に対して位置情報(バウンディングボックスの8つの頂点)を算出する。ボクセル群2011v(選手2011)、2010v(選手2010)、および2012v(ボール2012)の位置情報5010、5020、5030を
図5に示す。例えば、ボクセル群2011v(選手2011)に対するバウンディングボックスの頂点3501~3508は、
図5における位置情報5010の座標ID=1~8が示す座標にそれぞれ対応する。
【0037】
(警告判定処理の流れ)
次に、本実施形態における画像処理装置1000の警告判定処理の流れについて、
図4を参照して説明する。
図4は、画像処理装置1000の警告判定部1040により実行される処理を示すフローチャートである。
図4に示すフローチャートは、制御部1220が記憶部1210に記憶されている制御プログラムを実行し、情報の演算および加工並びに各ハードウェアの制御を実行することにより実現され得る。
【0038】
S4010において、警告判定部1040は、領域情報保持部1030(または3次元形状導出部1010)により導出され、記憶部1210において保持されている、3次元形状導出可能な領域の情報を取得する。3次元形状導出可能な領域は、例えば上述したように、
図3(a)において境界2030で囲まれる領域であり、上記の(式1)~(式3)を満たす座標である。よって、3次元形状導出可能な領域の情報は、例えば、(式1)~(式3)を表すための情報である。
【0039】
次に、S4020において、警告判定部1040は、位置情報導出部1020により導出され、記憶部1210に格納されている、オブジェクトの位置情報(オブジェクトのバウンディングボックスの座標)を取得する。位置情報の導出方法は前述の通りである。ここでは、警告判定部1040は、
図3(a)、
図3(b)に示すボクセル群2011v(選手2011)の位置情報を取得するものとする。次に、S4030において、警告判定部1040は、オブジェクトの位置情報が3次元形状導出可能な領域内にあるか否かの判定を行う。ボクセル群2011v(選手2011)の場合、警告判定部1040は、ボクセル群2011のバウンディングボックスの頂点3501~3508について、(式1)~(式3)の領域に入っているかの確認を行う。頂点3501~3508の座標は
図5に示す通りである(頂点3501~3508は、
図5における位置情報5010の座標ID=1~8が示す座標にそれぞれ対応する)。警告判定部1040は、バウンディングボックスの頂点3502、3504、3506、3508について、x座標が800を超えていることから、当該頂点は(式1)~(式3)の範囲に入っていないと判断する。すなわち、警告判定部1040は、ボクセル群2011v(選手2011)のバウンディングボックスの少なくとも一部が3次元形状導出可能な領域外にあると判断し、処理はS4040に遷移する。
【0040】
S4040において、警告判定部1040は、選手2011(警告対象のオブジェクト)に対する警告を出力(表示)するように、仮想視点画像生成部1050に対して指示する。このような、位置が3次元形状導出可能領域外と判定されたオブジェクトに対する警告を出力するように指示を受けた場合の仮想視点画像生成部1050の動作については後述する。S4060において、警告判定部1040は、すべてのオブジェクトの処理が完了したかの判断を行う。S4030において、ボクセル群2011v(選手2011)についての判定を行った場合、ボクセル群2010v(選手2010)、ボクセル群2012v(ボール2012)についての判定が残っているため、処理はS4020へ戻る。
【0041】
S4020で、警告判定部1040は、例えば、
図3(a)、
図3(b)に示すボクセル群2010v(選手2010)の位置情報を取得する。続いて、S4030において、警告判定部1040は、ボクセル群2010v(選手2010)のバウンディングボックスの8つの頂点について、(式1)~(式3)の領域に入っているか確認を行う。当該8つの頂点は、
図5における位置情報5020の座標ID=1~8が示す座標にそれぞれ対応する。警告判定部1040は、位置情報5020の座標ID=1~8が示す座標は、(式1)~(式3)の領域に入っていると判断し、処理はS4050へ進む。S4050では、警告判定部1040は、選手2010に対する警告出力(表示)を停止する(行わない)ように、仮想視点画像生成部1050に対して指示する。なお、本ステップでは、警告判定部1040は、何ら処理を行わなくてもよい。
【0042】
S4020~4060の処理は、すべてのオブジェクトに対して繰り返される。すべてのオブジェクトに対してS4020~4060の処理が完了すると、処理はS4070へ遷移する。S4070では、警告判定部1040は、すべてのフレームで処理が完了したかの判定を行う。次フレームの処理があれば、処理はS4020へ遷移し、S4020~4060の処理が繰り返される。例えば、30フレーム毎秒で処理している場合、1フレームごとにオブジェクトの位置が移動するため、1秒間に30回すべてのオブジェクトの位置情報に基づき、警告表示の有無が判断されることになる。
【0043】
なお、
図4を用いた上記の説明では、特定のオブジェクトに対応するボクセル群のバウンディングボックスの8つの頂点の少なくとも何れかが3次元形状導出可能領域外である場合に警告が出力されるものとした。しかし警告を出力する条件はこれに限定されない。例えば、バウンディングボックスの8つの頂点のうち一部の頂点が3次元形状導出可能領域内に位置し、その他の頂点が3次元形状導出可能領域外に位置する場合に、警告が出力されるようにしてもよい。そして、バウンディングボックスの8つの頂点の全てが3次元形状導出可能領域外に位置する場合には、警告が出力されないようにしてもよい。このような構成によれば、オブジェクトが3次元形状導出可能領域の境界に位置することにより3次元形状の一部が欠けたオブジェクトが仮想視点画像に表示されてしまう虞があるような状況においては警告が出力される。一方、オブジェクトが3次元形状導出可能領域の外に位置することによりオブジェクトが仮想視点画像に全く表示されないような状況においては、仮想視点画像の違和感が大きくないため、警告が出力されない。
【0044】
ここで、S4040において、警告判定部1040により、位置が3次元形状導出可能領域外と判定されたオブジェクトに対する警告を出力するよう指示を受けた場合の仮想視点画像生成部1050の動作について説明する。具体例として、警告判定部1040により、選手2011に対する警告を出力するように指示された場合、仮想視点画像生成部1050は、生成した仮想視点画像に警告用のラインを付与する。警告用のラインは、例えば、ボクセル群2011v(選手2011)のバウンディングボックスの頂点を結ぶように構成される。
図2(a)の仮想視点画像2000に、選手2011に対して付与した警告用のライン2020を示す。当該ラインは点群であってもよい。仮想視点画像生成部1050はさらに、警告用のライン2020に対して、例えば赤色などの警告表示用の色で着色しレンダリングを行うことで、より視覚的な警告表示を行うことが可能となる。仮想視点画像生成部1050は、警告用のライン2020を示すとともに、3次元形状が正しく導出できていないことを示す警告メッセージ2021を表示してもよい。その他、仮想視点画像生成部1050は、仮想視点カメラの座標に基づき3次元オブジェクト(選手2010、2911、ボール2012)をレンダリングしたのち、選手2011を2次元の枠で囲った警告を表示してもよい。3次元オブジェクトの座標位置をカメラ外部パラメータ及びカメラ内部パラメータを用いて仮想視点カメラの画面座標に変換を行うことにより、該当するオブジェクトに警告表示を付与することが可能となる。
【0045】
上記説明では、画像処理装置1000は、1種類の境界(境界2030)で囲まれる領域外にオブジェクトが位置する場合に、仮想視点画像に警告を表示するように構成した。段階的な警告を行うために、複数の境界を導出(設定)してもよい。例えば、3次元形状導出可能な領域の境界から50ボクセル(5m)分内側(所定距離内側)に第2の境界を設定する。第2の境界と、3次元導出可能な領域の境界(境界2030)とで囲まれる空間(領域)を、注意喚起領域と表現する。注意喚起領域は、領域情報保持部1030(または3次元形状導出部1010)により導出され、記憶部1210において保持され得る。警告判定部1040は、注意喚起領域にオブジェクトが入った場合に注意を促す表示を行ってもよい。
【0046】
図4の処理フローを参照して説明すると、S4010において、警告判定部1040は、記憶部1210から、3次元形状導出可能な領域および注意喚起領域の情報を取得する。前述したS4020の処理の後、S4030において、警告判定部1040は、オブジェクトの位置情報が3次元形状導出可能な領域内にあるか否かの判定に加えて、オブジェクトの位置情報が注意喚起領域内にあるか否かの判定を行う。オブジェクトが注意喚起領域内にあることは、オブジェクトに対するボクセル群のバウンディングボックスの8頂点のいずれかが、(式1)~(式3)を満たすが以下の(式4)~(式6)を満たさない位置に存在することを意味する。
150<= x < 750 (式4)
150<= y < 1050 (式5)
0 <= z < 50 (式6)
【0047】
バウンディングボックスの8頂点のいずれかが、(式1)~(式3)を満たすが(式4)~(式6)を満たさない場合、警告判定部1040は、オブジェクトが注意喚起領域に入っていると判断する。この場合、S4040の処理に替えて、警告判定部1040は、当該オブジェクトに対する注意喚起を出力(表示)するように、仮想視点画像生成部1050に対して指示する。仮想視点画像生成部1050は当該指示に従い、生成した仮想視点画像に、注意喚起用のラインを付与する。
図2(b)の仮想視点画像2100に、注意喚起領域に入ったオブジェクトとして、選手2011に対して付与した注意喚起用のライン2120を示す。当該注意喚起用のライン2120は、
図2(a)における警告用のライン2020とは別の警告用のラインとも言える。仮想視点画像生成部1050はさらに、注意喚起用のライン2120に対して、例えば黄色などの注意喚起表示用の色で着色しレンダリングを行うことで、より視覚的な警告表示を行ってもよい。
図2(a)における警告用のライン2020と異なる色を用いることで、警告のレベルを視覚的に表現することが可能となる。仮想視点画像生成部1050は、注意喚起用のライン2120を示すとともに、3次元形状導出可能領域の境界に近いことを示す注意メッセージ2121を表示してもよい。注意メッセージ2121は、
図2(a)の警告メッセージ2021とは別の警告メッセージともいえる。これにより、オペレータは3次元形状が正しく導出されない可能性があるオブジェクトに対しても認識することが可能となり、不自然な仮想視点画像を生成する可能性を低減することが可能となる。
【0048】
図2(a)や
図2(b)を参照して説明した警告・注意喚起表示により、オペレータは、警告・注意喚起表示されているオブジェクトの3次元形状が正しく導出されない可能性があることを認識する。その後、オペレータは当該オブジェクトを仮想視点カメラの視野から外すなどの操作を、操作装置1140から指示してもよい。この操作に応じて、仮想視点画像生成部1050は、警告表示されているオブジェクトが含まれない仮想視点画像を生成することができる。
図2(c)に、オペレータによる操作により、警告表示されているオブジェクトが含まれない仮想視点画像2200を示す。
図2(c)の仮想視点画像2200では、前述の3次元形状が正しく導出されていない選手2011が仮想視点カメラの視野に入っていないことから、違和感を与えることのない仮想視点画像が提供可能となる。
【0049】
なお、
図2(c)の仮想視点画像2200はオペレータ向けの画像である。オペレータに3次元形状導出可能領域を認識させるため、3次元形状導出可能領域の境界2030が示されている。画像処理装置1000がクライアント装置1150(すなわち視聴者)に提供する仮想視点画像は、
図2(d)の仮想視点画像2300に示されるように、3次元形状導出可能領域の境界2030が表示されていない画像であってもよい。
【0050】
上記実施形態では、
図2のように仮想視点カメラ(仮想視点)からの仮想視点画像の上に警告表示を示す例を示したが、オペレータへの警告の表示は撮影対象全体を俯瞰する画像において行ってもよい。例えば、仮想視点画像生成部1050は、
図3に示すようにフィールド全体を俯瞰した仮想視点画像(センサシステム11a~11fのそれぞれにおける撮像部1110による撮像対象全体を表示する画像)において、警告対象のオブジェクトに対して警告を表示しても良い。この場合、例えば、
図3(a)に示すような画像上のボクセル群2011vに警告表示が表示される。このようにすることでオペレータに対して、フィールド全体の警告情報を提供することが可能となる。
【0051】
また、警告表示には、警告表示を行うと判定された(警告が発生した)時刻情報を表示させても良い。時刻情報とは、撮像部1110による撮像により得られる画像に付与されているタイムコードであり、センサシステム11から画像処理装置1000に入力される。仮想視点画像生成部1050は、仮想視点画像において、3次元形状導出可能な領域を超過している開始時刻と超過が完了した時刻を表示しても良い。このことにより、オペレータは3次元形状の導出が正しくない時刻情報を知ることが可能となる。
【0052】
このように、上記実施形態および変形例によれば、仮想視点画像生成のオペレータに3次元形状が正しく導出されない可能性があることを警告することにより、不自然な仮想視点画像の生成の抑止を促し、視聴者に臨場感を損なうことなく違和感を与えない仮想視点画像の提供が可能となる。
【0053】
[実施形態2]
実施形態1では、オブジェクトの位置情報と3次元形状導出可能領域の情報に基づいて、オブジェクトに対して警告表示を行う例を示した。実施形態2では、オブジェクトの移動速度と3次元形状導出可能領域の情報に基づいて警告を表示する例を示す。本実施形態における画像処理装置1000は、実施形態1と同様のため、説明を省略する。
【0054】
本実施形態では、位置情報導出部1020は、3次元形状導出部1010により導出されたオブジェクトの3次元形状(ボクセル群)の時間的な座標変化(位置情報の時間的変化)を導出する。警告判定部1040は、位置情報導出部1020により導出された位置情報の時間的変化と、領域情報保持部1030が保持する3次元形状を導出可能な3次元空間の座標情報を比較し、警告表示を行うか否かの判断を行う。
【0055】
図6に、移動するオブジェクト(ボクセル群)の例を示す。
図6には、異なる時刻T及び時刻T+1におけるボール2012のボクセル群2012v(
図2を参照)の位置の変化が図示されている。時刻Tにおける位置6010は、時刻T+1においては位置6011に移動している。
図6における境界2030は、実施形態1で説明した
図3(a)の境界2030と同じであり、3次元形状導出可能領域の境界である。位置情報導出部1020は、オブジェクトの位置情報に加え、位置情報の時間的変化を導出する。位置情報の時間的変化は、オブジェクトのボクセル群に外接する(ボクセル群を内包する)バウンディングボックスの座標を用いて導出される。
【0056】
図7に、時刻Tおよび時刻T+1におけるボクセル群2012vの各位置(位置6010、位置6011)のバウンディングボックスの座標である、位置情報7010、7020を示す。例えば、位置6010におけるバウンディングボックスの頂点は、
図7における位置情報7010の座標ID=1~8が示す座標にそれぞれ対応する。
【0057】
位置情報導出部1020は、時刻T+1と時刻Tにおけるバウンディングボックスの各頂点の座標の差分を算出することにより、単位時間(例えば秒)当たりの移動量を算出する。例えば、時刻T+1と時刻TのID=1(
図7における位置情報7010、7020の頂点ID=1)の座標を比較すると、以下の式から移動量が算出することができる。
Xt+1 = 600-500 = 100
Yt+1 - Yt = 700-800 = -100
Zt+1 - Zt = 11-10 = 1
当該移動量から、ボール2012は、単位時間においてX軸には順方向に100ボクセル、Y軸には逆方向で100ボクセル、z軸は1ボクセルで移動していることがわかる。位置情報導出部1020は、当該単位時間当たりの移動量と現在(時刻T+1)の座標情報を、警告判定部1040に出力する。
【0058】
次に、本実施形態における画像処理装置1000の警告判定処理の流れについて、
図8を参照して説明する。
図8は、画像処理装置1000の警告判定部1040により実行される処理を示すフローチャートである。
図8に示すフローチャートは、制御部1220が記憶部1210に記憶されている制御プログラムを実行し、情報の演算および加工並びに各ハードウェアの制御を実行することにより実現され得る。
図4と同様の処理については、
図4と同じ参照番号を付すことにより、説明を省略する。
【0059】
S8010において、警告判定部1040は、3次元形状導出可能な領域の座標情報と、現在(時刻T+1)の座標情報から、オブジェクトの位置と3次元形状導出可能な領域の境界までの距離を算出する。
図6に示すボール2012の場合、警告判定部1040は、ボール2012の位置6010と3次元形状導出可能な領域の境界2030までの距離を算出する。現在(時刻T+1)の頂点ID=1(
図7における位置情報7020の頂点ID=1)の座標情報は、(X,Y,Z)=(600、700、11)である。3次元形状導出可能な領域の境界2030までの距離Xd、Yd、Zdは、それぞれ以下に示すように演算される。説明を簡単にするために、オブジェクトの移動方向にある3次元形状導出可能な領域の境界2030(式(1)~式(3)を参照)までの距離を示している。
Xd = |800-600| =200
Yd = |100-700| =600
Zd = |100-11| =89
【0060】
次に、警告判定部1040は、3次元形状導出可能な領域の境界2030までの距離と単位時間当たりの移動量から、オブジェクトが境界2030に到達するまでの時間を算出する(S8020)。
図6に示すボール2012の場合、境界2030に到達するまでの時間(例えば秒)は、以下のように算出される。
Xt = 200/100 =2
Yt = 600/100 =6
Zt = 89/1 =90
【0061】
次に、警告判定部1040は、境界2030に到達するまでの時間が所定の閾値以下か否かを判定する(S8020)。境界2030に到達するまでの時間が所定の閾値以下である場合には、処理はS4040へ進み、そうでない場合は、処理はS4050へ進む。本実施形態では、閾値を3秒と設定する。ボール2012の位置6010から、境界2030に到達するまでの時間は、上記のように、X軸、Y軸、Z軸それぞれ2秒、6秒、90秒と演算され、X軸の2秒が閾値である3秒を下回っている。このことから、警告判定部1040は、ボール2012に3秒後に3次元形状導出が正しく行えない可能性があるとして、警告を出力(表示)するように、仮想視点画像生成部1050に対して指示する(S4040)。
【0062】
このようにして、本実施形態における画像処理装置は、オブジェクトが存在する座標は問題ないが移動しており、時間経過後に3次元形状導出が正しく行えない可能性があるオブジェクトに対して警告表示を行うことができる。本実施形態によれば、3次元形状導出可能な領域から距離が離れているオブジェクトであっても、蹴られたボールのように高速で移動して3次元形状導出可能領域に接近するオブジェクトに対して、警告を表示することが可能となる。
【0063】
[その他の実施形態]
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
【0064】
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
【符号の説明】
【0065】
1000 画像処理装置、1010 3次元形状導出部、1020 位置情報導出部、1030 領域情報保持部、1040 警告判定部