IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本放送協会の特許一覧

<>
  • 特許-画像処理装置およびそのプログラム 図1
  • 特許-画像処理装置およびそのプログラム 図2
  • 特許-画像処理装置およびそのプログラム 図3
  • 特許-画像処理装置およびそのプログラム 図4
  • 特許-画像処理装置およびそのプログラム 図5
  • 特許-画像処理装置およびそのプログラム 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-02
(45)【発行日】2024-07-10
(54)【発明の名称】画像処理装置およびそのプログラム
(51)【国際特許分類】
   G06T 15/20 20110101AFI20240703BHJP
【FI】
G06T15/20 500
【請求項の数】 7
(21)【出願番号】P 2020116455
(22)【出願日】2020-07-06
(65)【公開番号】P2022014229
(43)【公開日】2022-01-19
【審査請求日】2023-06-05
(73)【特許権者】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】110001807
【氏名又は名称】弁理士法人磯野国際特許商標事務所
(72)【発明者】
【氏名】三須 俊枝
(72)【発明者】
【氏名】三ツ峰 秀樹
(72)【発明者】
【氏名】洗井 淳
【審査官】鈴木 肇
(56)【参考文献】
【文献】特開2003-256874(JP,A)
【文献】国際公開第2020/068960(WO,A1)
【文献】国際公開第2000/064175(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 15/20
G06T 19/00 - 19/20
(57)【特許請求の範囲】
【請求項1】
複数の入力画像から、所定の世界座標系に設置した仮想カメラにより仮想的に撮影した出力画像を生成する画像処理装置であって、
前記世界座標系に参照平面を予め設定し、前記参照平面に前記出力画像の各画素の画像座標である出力画像座標を逆投影するようにして参照座標を求める逆投影部と、
前記参照平面上の参照座標を各入力画像に写像して対応座標に変換し、写像した前記各入力画像の品質を示す評価値を算出する変換部と、
前記各入力画像の対応座標の画素値である入力画素値と前記評価値との対に基づいて、前記出力画像の各画素の画素値である出力画素値を算出する算出部と、
を備え
前記変換部は、前記参照平面と前記各入力画像との座標変換式、または、予め設定した射影変換行列による変換式を用いて、前記参照座標を前記各入力画像に写像して前記対応座標に変換し、
前記座標変換式または前記射影変換行列による変換式において、前記出力画像座標を前記対応座標で偏微分した偏導関数に基づいて、前記評価値を算出することを特徴とする画像処理装置。
【請求項2】
前記変換部は、前記各入力画像の辺縁側より中心側で大きな値の前記評価値を算出することを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記世界座標系において、前記各入力画像に含まれる被写体が、前記参照平面から予め設定した範囲内に位置することを特徴とする請求項1または請求項に記載の画像処理装置。
【請求項4】
前記世界座標系において、前記各入力画像の視点および前記出力画像の視点が、予め設定した範囲内に位置することを特徴とする請求項1から請求項の何れか一項に記載の画像処理装置。
【請求項5】
前記逆投影部は、前記仮想カメラの位置、姿勢および焦点距離を含む逆投影パラメータに基づいて、前記出力画像座標を前記参照平面に逆投影することを特徴とする請求項1から請求項の何れか一項に記載の画像処理装置。
【請求項6】
前記算出部は、前記評価値を重みとした前記入力画素値の加重平均により前記出力画素値を算出することを特徴とする請求項1から請求項の何れか一項に記載の画像処理装置。
【請求項7】
コンピュータを、請求項1から請求項の何れか一項に記載の画像処理装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数の入力画像から所望の範囲を切り出し・合成した画像と同等な出力画像を生成する画像処理装置およびそのプログラムに関する。
【背景技術】
【0002】
複数の入力画像から所望の範囲を切り出し・合成してより大きな画像を生成するスティッチング技術やモザイキング技術が知られている(特許文献1)。また、画像の一部を切り出し・射影変換を施して所望の画像を生成する技術も知られている。これら従来技術を用いれば、複数の入力画像から所望の範囲を切り出し・合成した画像を生成できる(以後、「従来技術1」と表記)。
【0003】
また、複数の入力画像を貼り合わせてパノラマ画像を生成する機能、パノラマ画像における関心領域を受信する機能、および関連する入力画像のフレームのみを取得して、隣接する画像間に知覚不能境界を有する高解像度フレームを得る機能を有するテレビ番組制作システムが知られている(特許文献2)。
【先行技術文献】
【特許文献】
【0004】
【文献】特許第6427688号公報
【文献】特許第6432029号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、従来技術1では、一旦大きな画像を生成する必要があることから、演算コストが増大し、メモリやプロセッサの規模が大きくなるという問題がある。特に、8Kのような高精細画像では、これらの問題が顕著となる。また、特許文献2に記載の技術では、隣接する画像間において知覚不能境界を得る具体的手法が開示されておらず、所望の高解像度フレームが必ずしも得られない。
【0006】
そこで、本発明は、演算コストを低減し、構成を簡略化できる画像処理装置およびそのプログラムを提供することを課題とする。
【課題を解決するための手段】
【0007】
前記課題を解決するため、本発明に係る画像処理装置は、複数の入力画像から、所定の世界座標系に設置した仮想カメラにより仮想的に撮影した出力画像を生成する画像処理装置であって、逆投影部と、変換部と、算出部とを備える構成とした。
【0008】
かかる構成によれば、逆投影部は、世界座標系に参照平面を予め設定し、参照平面に出力画像の各画素の画像座標である出力画像座標を逆投影するようにして参照座標を求める。
また、変換部は、参照平面上の参照座標を各入力画像に写像して対応座標に変換し、写像した各入力画像の品質を示す評価値を算出する。
そして、算出部は、各入力画像の対応座標の画素値である入力画素値と評価値との対に基づいて、出力画像の各画素の画素値である出力画素値を算出する。
そして、変換部は、参照平面と各入力画像との座標変換式、または、予め設定した射影変換行列による変換式を用いて、参照座標を各入力画像に写像して対応座標に変換し、座標変換式または射影変換行列による変換式において、出力画像座標を対応座標で偏微分した偏導関数に基づいて、評価値を算出する。
【0009】
このように、画像処理装置では、画像の切り出し・合成処理と同等の処理を一括で実行し、各入力画像から出力画像を生成できる。このとき、画像処理装置では、参照平面を介するため、出力画像に無関係な入力画像の画素については演算処理を適用せず、演算コストを低減できる。さらに、画像処理装置では、従来技術のように大きな画像を扱う必要がないので、構成を簡略化できる。
【0010】
なお、本発明は、コンピュータを、前記した画像処理装置として機能させるためのプログラムで実現することもできる。
【発明の効果】
【0011】
本発明によれば、演算コストを低減し、構成を簡略化することができる。
【図面の簡単な説明】
【0012】
図1】実施形態に係る画像合成・切り出し装置の構成を示すブロック図である。
図2】画像合成・切り出し装置の処理内容を説明する図である。
図3】実施形態において、世界座標系と仮想カメラ座標系との関係を説明する図である。
図4】実施形態において、世界座標系とカメラ座標系との関係を説明する図である。
図5】実施形態に係る画像合成・切り出し装置の動作を示すフローチャートである。
図6】実施例において、入力画像の枚数と撮影範囲を説明する図である。
【発明を実施するための形態】
【0013】
以下、本発明の実施形態について図面を参照して説明する。但し、以下に説明する実施形態は、本発明の技術思想を具体化するためのものであって、特定的な記載がない限り、本発明を以下のものに限定しない。
【0014】
(実施形態)
[画像合成・切り出しシステムの概要]
図1を参照し、本実施形態に係る画像合成・切り出しシステム1の概要について説明する。
画像合成・切り出しシステム1は、複数の入力画像I(cn)に対して、切り出し処理・合成処理と同等の処理を行って、画像座標(x,y)における出力画像Jの画素値J(x,y)を演算するものである。この出力画像Jは、複数の入力画像I(cn)から所望の範囲を切り出し・合成した画像と同等の画像である。
【0015】
なお、n∈{1,…,N}であり、Nは入力画像I(cn)の最大枚数を表す。本実施形態では、一例として説明を簡単にするため、第1入力画像I(c1)および第2入力画像I(c2)という2枚の入力画像I(cn)であることとする(N=2)。従って、n∈{1,2}となる。
【0016】
以下、出力画像Jの画像座標(x,y)を「出力画像座標」と略記する場合がある。また、出力画像Jの画像座標(x,y)の画素値J(x,y)を「出力画素値」と略記する場合がある。
【0017】
図1に示すように、画像合成・切り出しシステム1は、後記する画像合成・切り出し装置(画像処理装置)10と、走査部20と、画素値書込部21と、出力フレームメモリ22とを備える。
【0018】
まず、画像合成・切り出し装置10には、第1フレームメモリ13に第1入力画像I(c1)を書き込み、第2フレームメモリ13に第2入力画像I(c2)を書き込む。続いて、出力画像Jの画像座標(x,y)を出力画像座標として、画像合成・切り出し装置10に入力する。ここで、画像合成・切り出し装置10に出力画像座標を入力する順序は任意である。例えば、走査部20が、ラスタスキャンにより出力画像座標を画像合成・切り出し装置10に順次入力すればよい。
【0019】
すると、画像合成・切り出し装置10は、出力画像座標(x,y)の画素値J(x,y)を演算し、出力画素値として画素値書込部21に出力する。画素値書込部21は、走査部20から入力した出力画像座(x,y)に対応する出力フレームメモリ22のアドレスに対し、画像合成・切り出し装置10から入力した出力画素値J(x,y)を記録する。走査部20が出力画像全体の画素位置の走査を終了すると、出力フレームメモリ22には出力画像Jが保持されている。
【0020】
[画像合成・切り出し装置の構成]
図1及び図2を参照し、本実施形態に係る画像合成・切り出し装置10の構成について説明する。
画像合成・切り出し装置10は、複数の入力画像I(cn)から、所定の世界座標系に設置した仮想カメラにより仮想的に撮影した出力画像Jを生成するものである。このとき、画像合成・切り出し装置10は、図2に示すように、参照平面Kを介して、複数の入力画像I(cn)から出力画像Jを生成する。
【0021】
世界座標系とは、第1入力画像I(c1)または第2入力画像I(c2)で撮影された被写界における3次元的な座標系のことである。以後、世界座標系の座標を(X,Y,Z)と表記する。
【0022】
参照平面Kとは、世界座標系に予め設定した任意の曲面(平面を含む)のことである。この参照平面Kは、被写体全体が収まる面であることが好ましい。例えば、サッカー試合のケースでは、被写体となるサッカー選手や遊具がサッカーフィールド(地面)上に位置するので、図2に示すように、参照平面Kをサッカーフィールド(地面)に設定すればよい。また、例えば、被写体となる複数の絵画が壁面に配置されているケースでは、参照平面Kをその壁面に設定すればよい(不図示)。
【0023】
ここで、画像合成・切り出し装置10の動作条件について説明する。画像合成・切り出し装置10では、以下の条件甲または条件乙の何れかの動作条件を満たすことが好ましい。条件甲または条件乙の何れか一方が成立すれば、後記する逆投影部11、第1変換部12および第2変換部12において、被写体の幾何学的な歪を抑制することができる。
【0024】
<条件甲>
条件甲では、世界座標系において、各入力画像I(cn)で撮影された被写体が、近似的に参照平面K内に存在する。すなわち、条件甲は、第1入力画像I(c1)または第2入力画像I(c2)の被写体が、参照平面Kから予め設定した範囲内に位置するという動作条件である。第1入力画像I(c1)または第2入力画像I(c2)の撮影範囲(例えば、撮影範囲に内接する円の直径)に比して、参照平面Kから被写体までの距離が十分に小さな値(例えば、0.01倍)となる。具体的には、第1入力画像I(c1)または第2入力画像I(c2)が直径100mの範囲を撮影している場合、参照平面Kから被写体までの距離が±1mの範囲内になる。
【0025】
<条件乙>
条件乙では、各入力画像I(cn)および出力画像Jの視点が近似的に同一位置になる。すなわち、条件乙は、第1入力画像I(c1)、第2入力画像I(c2)および出力画像Jの3画像の視点が、予め設定した範囲内に位置するという動作条件である。従って、これら3画像の視点が、有限の大きさの3次元領域内に存在する。有限の大きさの3次元領域は、3次元領域内の代表点から第1入力画像I(c1)または第2入力画像I(c2)で撮影されている被写体までの距離の最小値(最短被写体距離)に比して十分に小さくなる。例えば、有限の大きさの3次元領域は、最短被写体距離の0.01倍の直径を有する球体となる。なお、3次元領域内の代表点は、例えば、重心、第1入力画像I(c1)の視点、第2入力画像I(c2)の視点、出力画像Jの視点、または、これらの視点を按分した点である。
【0026】
図1に示すように、画像合成・切り出し装置10は、逆投影部11と、変換部12と、フレームメモリ13と、画素値読出部14と、合成部(算出部)15とを備える。本実施形態では、画像合成・切り出し装置10は、第1入力画像I(c1)および第2入力画像I(c2)のそれぞれに対応させて、第1変換部12と、第2変換部12と、第1フレームメモリ13と、第2フレームメモリ13と、第1画素値読出部14と、第2画素値読出部14とを備える。
【0027】
以後、第1入力画像I(c1)および第2入力画像I(c2)を個別に説明する場合、「第1変換部12」、「第2変換部12」のように表記する場合がある。また、第1入力画像I(c1)および第2入力画像I(c2)をまとめて説明する場合、「第n変換部12」のように表記する場合がある(他の手段も同様)。
【0028】
<逆投影部>
図2に示すように、逆投影部11は、世界座標系に参照平面Kを予め設定し、参照平面Kに出力画像Jの各画素の画像座標[x,y]である出力画像座標を逆投影するようにして参照座標[X,Y,Z]を求めるものである。このとき、逆投影部11は、外部から入力した逆投影パラメータに基づいて、出力画像座標[x,y]を参照平面Kに逆投影(例えば、逆透視投影)する。この逆投影パラメータは、出力画像Jを仮想的に撮影する仮想カメラの姿勢(パン角α、チルト角δ、ロール角θ)、仮想カメラの位置tおよび仮想カメラの焦点距離fと、参照平面Kの形状とを含んでいる。
【0029】
世界座標系は、任意に設定可能である。図3に示すように、世界座標系(X,Y,Z)は、X軸(水平方向)、Y軸(奥行方向)、Z軸(垂直方向)の順序で右手系をなす直交座標系とする。また、世界座標系の原点をO(w)とする。
【0030】
また、仮想カメラを基準とした座標系を仮想カメラ座標系とする。仮想カメラ座標系のx軸(水平方向)は、出力画像JのX軸と平行である。x軸の正方向は、被写界において、出力画像Jで右向きに撮影される側である。また、仮想カメラ座標系のy軸(垂直方向)は、出力画像JのZ軸と平行である。y軸の正方向は、被写界において、出力画像Jで下向きに撮影される側である。図3に示すように、仮想カメラ座標系の原点O(v)は、出力画像Jの視点とする。また、仮想カメラ座標系のz軸は、x軸およびy軸に対し、x軸、y軸、z軸の順序で右手系の直交座標系となるようにする。すなわち、仮想カメラ座標系のz軸は、仮想カメラの光軸と平行である。また、z軸の正方向は、仮想カメラから被写界に向いた側である。
【0031】
出力画像Jは、以下の式(1)に示すように、世界座標系における位置tに第一光学主点を有する仮想カメラで撮影されたものとする。なお、仮想カメラの第一光学主点が出力画像Jの視点となる。
【0032】
【数1】
【0033】
世界座標系における方向ベクトルの各成分を仮想カメラ座標系における各成分に変換するための回転行列Rは、以下の式(2)で表される。
【0034】
【数2】
【0035】
仮想カメラの姿勢をパン角α、チルト角δおよびロール角φにより表すこととする。また、α=δ=φ=0のときの仮想カメラの姿勢を基準姿勢と表記する。基準姿勢の3軸をx、yおよびzとする。図3に示すように、x軸がX軸方向であり、y軸が-Z軸方向であり、z軸がY軸方向である場合、世界座標から基準姿勢の座標系への回転行列Rは、以下の式(3)で表される。
【0036】
【数3】
【0037】
パン角αによる回転行列Rは、以下の式(4)で表される。
【0038】
【数4】
【0039】
チルト角δによる回転行列Rは、以下の式(5)で表される。
【0040】
【数5】
【0041】
ロール角φによる回転行列Rは、以下の式(6)で表される。
【0042】
【数6】
【0043】
以上のように、パン角α、チルト角δおよびロール角φが式(4)~式(6)でそれぞれ表されることから、回転行列Rは、以下の式(7)で表される。
【0044】
【数7】
【0045】
参照平面Kは、以下の式(8)で表される。なお、式(8)では、a、b、c、dは、参照平面Kの形状を表す係数であり、任意に設定できる。
【0046】
【数8】
【0047】
出力画像座標[x,y]に対応する参照平面K上の点[X,Y,Z]は、出力画像Jの視点から仮想カメラの座標[x,y,f]に向かうベクトルが、式(8)の参照平面Kと交差する点である。出力画像Jの視点から仮想カメラの座標[x,y,f]に向かうベクトルは、以下の(9)に示すように世界座標系で表すことができる。なお、λは、正の実数である。
【0048】
【数9】
【0049】
式(9)のベクトルが式(8)の参照平面Kと交差するときのλの値を求める。式(8)及び式(9)より、λの値は、以下の式(10)で求めることができる。
【0050】
【数10】
【0051】
式(10)で求めたλの値を式(9)に代入すると、出力画像座標[x,y]から参照平面K上の点[X,Y,Z]への変換式は、以下の式(11)で表される。
【0052】
【数11】
【0053】
ここで、参照平面Kで以下の式(12)が成立する場合、すなわち、式(8)において、a=b=d=0、かつ、c≠0の場合、式(11)は、以下の式(13)で表される。
【0054】
【数12】
【数13】
【0055】
以上より、逆投影部11は、式(11)または式(13)の変換式によって、出力画像座標[x,y]を参照平面Kに逆投影し、世界座標系における参照座標[X,Y,Z]を求める。例えば、参照平面Kをサッカーフィールド(地面)に設定した場合、式(12)が成立するので、逆投影部11は、式(13)の変換式によって参照座標[X,Y,Z]を求めればよい。
その後、逆投影部11は、参照座標[X,Y,Z]を第1変換部12および第2変換部12に出力する。
【0056】
<変換部>
図2に示すように、第n変換部12は、参照平面K上の参照座標[X,Y,Z]を各入力画像I(cn)に写像して第n対応座標[ξ(cn),η(cn)に変換し、写像した各入力画像I(cn)の品質を示す第n評価値e(cn)を算出するものである。本実施形態では、第n変換部12は、透視投影変換または射影変換により参照座標[X,Y,Z]を第n対応座標[ξ(cn),η(cn)に変換し、その後、第n評価値e(cn)を算出する。
なお、第n対応座標[ξ(cn),η(cn)とは、参照平面K上の参照座標[X,Y,Z]に対応する各入力画像I(cn)の座標のことである。
【0057】
<<透視投影変換>>
まず、第n変換部12による透視投影変換を説明する。
図4に示すように、第n入力画像I(cn)を撮影した第n撮影カメラの位置u(cn)=[u (cn),u (cn),u (cn)]は、世界座標系において、以下の式(14)で表される。なお、第n撮影カメラのカメラ座標系を「第nカメラ座標系」と略記し、第nカメラ座標系の原点をO(cn)とする。また、第n撮影カメラの第一光学主点が第n入力画像I(cn)の視点となる。
【0058】
【数14】
【0059】
また、世界座標系から第nカメラ座標系への回転行列Sは、以下の式(15)で表される。
【0060】
【数15】
【0061】
ここで、第n撮影カメラの姿勢をパン角α(cn)、チルト角δ(cn)およびロール角φ(cn)により表すこととする。また、α(cn)=δ(cn)=φ(cn)=0のときの第n撮影カメラの姿勢を基準姿勢と表記する。基準姿勢において、第nカメラ座標系のξ(cn)、η(cn)、ζ(cn)の各軸が、世界座標系のX、-Z、Yの各軸方向である場合を考える。この場合、式(3)および式(7)と同様、世界座標から第nカメラ座標への回転行列S(cn)は、以下の式(16)で表される。
【0062】
【数16】
【0063】
ここで、世界座標[X,Y,Z]にある被写体を、第n撮影カメラによって撮影した場合を考える。この場合、その画像座標[ξ(cn),η(cn)は、以下の式(17)に示すように、透視投影による座標変換式で求められる。なお、第n撮影カメラの焦点距離をg(cn)とする。
【0064】
【数17】
【0065】
すなわち、第n変換部12は、外部から入力した第n変換パラメータに基づいて、式(17)の座標変換式を用いて、参照座標[X,Y,Z]を第n対応座標[ξ(cn),η(cn)に変換する。この場合、第n変換パラメータは、第n撮影カメラの姿勢(パン角α(cn)、チルト角δ(cn)、ロール角θ(cn))、第n撮影カメラの位置u(cn)、および、第n撮影カメラの焦点距離g(cn)を含んでいる。
【0066】
以上より、透視投影変換を行う場合、第1変換部12は、第1変換パラメータに基づいて、式(17)でn=1とした座標変換式を用いて、参照座標[X,Y,Z]を第1対応座標[ξ(c1),η(c1)に変換する。
また、第2変換部12は、第2変換パラメータに基づいて、式(17)でn=2とした座標変換式を用いて、参照座標[X,Y,Z]を第2対応座標[ξ(c2),η(c2)に変換する。
この透視投影変換によれば、第n撮影カメラの姿勢、位置および焦点距離が既知であれば、後記するランドマークが不要なため、被写体を問わずに適用できるという利点がある。
【0067】
<<射影変換>>
次に、第n変換部12による射影変換を説明する。
第n変換部12は、透視投影変換の代わりに射影変換(ホモグラフィー)を行ってもよい。以下、参照平面KがZ=0の場合について説明する。
第n変換部12における射影変換行列は、下の式(18)で表される。
【0068】
【数18】
【0069】
この場合、参照座標[X,Y,Z]から第n対応座標[ξ(cn),η(cn)への変換式は、以下の式(19)に示すように、式(18)の射影変換行列による変換式となる。従って、第n変換部12は、外部から入力した第n変換パラメータに基づいて、式(19)を用いて、参照座標[X,Y,Z]を第n対応座標[ξ(cn),η(cn)に変換すればよい。この場合、第n変換パラメータは、第n撮影カメラの射影変換行列を含んでいる。
【0070】
【数19】
【0071】
以上より、射影変換を行う場合、第1変換部12は、第1変換パラメータに基づいて、式(19)でn=1とした変換式を用いて、参照座標[X,Y,Z]を第1対応座標[ξ(c1),η(c1)に変換する。
また、第2変換部12は、第2変換パラメータに基づいて、式(19)でn=2とした変換式を用いて、参照座標[X,Y,Z]を第2対応座標[ξ(c2),η(c2)に変換する。
【0072】
この射影変換によれば、世界座標で記述された既知の4点(ランドマーク)が各入力画像I(cn)に含まれていれば、第n撮影カメラの姿勢、位置および焦点距離が未知でもよいため、利便性に優れるという利点がある。なお、各ランドマークは、同一平面上に位置する。
【0073】
<<評価値の算出:第1例>>
以下、第n変換部12による評価値の算出法として、第1例~第3例をあげて説明する。
写像を行うと、画像の歪み、ぼやけ、色のにじみなどの収差、口径食(ビネッティング)や周辺減光が発生する。また、画像の中心側より辺縁側において、収差などの悪影響を受けやすく、品質が低下しやすくなる。そこで、第n変換部12は、写像後の第n入力画像I(cn)の品質を定量化した第n評価値e(cn)を算出する。この第n評価値e(cn)は、その値が大きいほど、写像後の第n入力画像I(cn)が高品質であることを示す。
【0074】
第1例の第n評価値e(cn)は、第n対応座標[ξ(cn),η(cn)が第n入力画像I(cn)の中心側で大きな値となり、第n入力画像I(cn)の辺縁側で小さな値となるように定義したものである。また、第n対応座標[ξ(cn),η(cn)が第n入力画像I(cn)から外れる場合、第n評価値e(cn)=0となる。
【0075】
例えば、第n評価値e(cn)は、以下の式(20)で表される。ここでは、第n入力画像I(cn)の水平画素をW(cn)垂直画素をH(cn)とする。
【0076】
【数20】
【0077】
この第1例によれば、後記する合成部15が、複数の入力画像I(cn)のうち、より中心側に近い方の画素を重視して画素値を算出できる。その結果、出力画像Jが、画像の辺縁側で多く発生する収差などの悪影響を受けにくくなる。
【0078】
<<評価値の算出:第2例>>
第2例の第n評価値e(cn)は、第n入力画像I(cn)の辺縁線(外周線)から第n対応座標[ξ(cn),η(cn)までの距離に応じて定義したものである。また、第1例と同様、第n対応座標[ξ(cn),η(cn)が第n入力画像I(cn)から外れる場合、第n評価値e(cn)=0となる。
【0079】
例えば、第n評価値e(cn)は、以下の式(21)で表される。ここでは、第n入力画像I(cn)の外周線から第n対応座標[ξ(cn),η(cn)までの距離をρ(cn)とする。なお、定数σ(cn)は、正の実数で任意に設定できる。また、minは、最小値を返す関数である。
【0080】
【数21】
【0081】
なお、距離ρ(cn)は、第n入力画像I(cn)で最外周の各画素の中心から第n対応座標[ξ(cn),η(cn)までの最短距離であってもよい。また、距離ρ(cn)は、第n入力画像I(cn)を上下左右に1画素分または0.5画素分だけ拡張した各画素の中心から第n対応座標[ξ(cn),η(cn)までの最短距離であってもよい。
【0082】
この第2例によれば、第1例と同様、出力画像Jが画像の辺縁側で多く発生する収差などの悪影響を受けにくくなる。
【0083】
<<評価値の算出:第3例>>
第3例の第n評価値e(cn)は、式(16)の座標変換式、または、式(19)の変換式において、出力画像座標[X,Y,Z]を第n対応座標[ξ(cn),η(cn)で偏微分した偏導関数として定義したものである。なお、Z成分の偏微分は、式(16)の場合のみ行う。
【0084】
例えば、第n評価値e(cn)は、以下の式(22)で表される。また、第n評価値e(cn)は、Z成分を扱わない場合、以下の式(23)で表される。
【0085】
【数22】
【数23】
【0086】
このとき、解像感が高い入力画像I(cn)ほど、第n評価値e(cn)が大きくなる。また、第1例および第2例と同様、第n対応座標[ξ(cn),η(cn)が第n入力画像I(cn)から外れる場合、第n評価値e(cn)=0となる。
なお、第n評価値e(cn)は、(20)乃至式(23)の合成(例えば線形和)によって定義してもよい。
【0087】
この第3例によれば、後記する合成部15において、複数の入力画像I(cn)のうち、より解像感が高くなる方を重視して画素値を算出できる。その結果、出力画像Jのぼやけを抑制し、高精細な出力画像Jを生成できる。
【0088】
以上より、第1変換部12は、式(20)~式(23)の何れかでn=1として、第1評価値e(c1)を算出する。そして、第1変換部12は、第1対応座標[ξ(c1),η(c1)]を第1画素値読出部14に出力し、第1評価値e(c1)を合成部15に出力する。
第2変換部12は、式(20)~式(23)の何れかでn=2として、第2評価値e(c2)を算出する。そして、第2変換部12は、第2対応座標[ξ(c2),η(c2)]を第2画素値読出部14に出力し、第2評価値e(c2)を合成部15に出力する。
【0089】
<フレームメモリ>
第nフレームメモリ13は、第n入力画像I(cn)を保持するメモリであり、任意に指定する画像座標の画素値を読み出すことのできるランダムアクセスが可能なものとする。本実施形態では、第1フレームメモリ13が第1入力画像I(c1)を保持し、第2フレームメモリ13が第2入力画像I(c2)を保持する。
【0090】
<画素値読出部>
第n画素値読出部14は、第n入力画素値I(cn)(ξ(cn),η(cn))を第nフレームメモリ13から読み出すものである。なお、第n入力画素値I(cn)(ξ(cn),η(cn))とは、第n入力画像I(cn)における対応座標(ξ(cn),η(cn))の画素値のことである
【0091】
ここで、第n画素値読出部14は、対応座標の座標値ξ(cn),η(cn)の何れか一方または両方が整数でない場合、その座標値を最近傍の整数値に丸めてもよい。この場合、第n画素値読出部14は、以下の式(24)により、第n入力画素値I(cn)(ξ(cn),η(cn))を求める。
【0092】
【数24】
【0093】
また、第n画素値読出部14は、対応座標の座標値ξ(cn),η(cn)の何れか一方または両方が整数でない場合、双一次補間により第n入力画素値I(cn)(ξ(cn),η(cn))を決定してもよい。この場合、第n画素値読出部14は、以下の式(25)で表される補間式により、第n入力画素値I(cn)(ξ(cn),η(cn))を求める。
【0094】
【数25】
【0095】
また、第n画素値読出部14は、図2に示すように、第n入力画像I(cn)の周縁から対応座標(ξ(cn),η(cn))までの距離dに応じて、双一次補間により第n入力画素値I(cn)(ξ(cn),η(cn))を決定してもよい。例えば、入力画像I(cn)が2枚の場合、第n画素値読出部14は、以下の式(26)で表される補間式により、第n入力画素値I(cn)(ξ(cn),η(cn))を求める。
【0096】
【数26】
【0097】
この他、第n画素値読出部14は、対応座標の座標値ξ(cn),η(cn)の何れか一方または両方が整数でない場合、双三次補間、Lanczos補間、スプライン補間などの補間式を用いて、第n入力画素値I(cn)(ξ(cn),η(cn))を決定してもよい。
【0098】
以上より、第1画素値読出部14は、第1入力画素値I(c1)(ξ(c1),η(c1))を読み出し、読み出した第1入力画素値I(c1)(ξ(c1),η(c1))を合成部15に出力する。
第2画素値読出部14は、第2入力画素値I(c2)(ξ(c2),η(c2))を読み出し、読み出した第2入力画素値I(c2)(ξ(c2),η(c2))を合成部15に出力する。
【0099】
<合成部>
合成部15は、第n画素値読出部14から入力した第n入力画素値I(cn)(ξ(cn),η(cn))と第n変換部12から入力した第n評価値e(cn)との対に基づいて、出力画素値J(x,y)を算出するものである。
【0100】
本実施形態では、合成部15は、第1入力画素値I(c1)(ξ(c1),η(c1))と第2入力画素値I(c2)(ξ(c2),η(c2))とを、第1評価値e(c1)と第2評価値e(c2)とに応じて合成することで、出力画素値J(x,y)を算出する。例えば、合成部15は、以下の式(27)に示すように、第1評価値e(c1)と第2評価値e(c2)とを重みとした、第1入力画素値I(c1)(ξ(c1),η(c1))と第2入力画素値I(c2)(ξ(c2),η(c2))との加重平均により出力画素値J(x,y)を算出する。
【0101】
【数27】
【0102】
なお、式(27)において、画素値G(x,y)は、出力画像座標[x,y]に対応する第1入力画像I(c1)の画素および第2入力画像I(c2)の画素が存在しない場合や解像感が得られない場合に、第1入力画像I(c1)および第2入力画像I(c2)を穴埋めするための穴埋画像の各画素の画素値である。例えば、画素値G(x,y)は、第1入力画像I(c1)の画素および第2入力画像I(c2)に存在しない画素の最も近傍に位置するe(c1)=e(c2)=0でない画素からの外挿値(例えば、0次ホールド)であってもよい。また、穴埋画像は、黒や青などの単色を表す画像としてもよい。また、穴埋画像は、画像座標に応じて濃淡を変えたグラデーション画像、カラーバー、市松格子状などの任意のパターンを有するパターン画像、または、雑音画像としてもよい。
【0103】
[画像合成・切り出し装置の動作]
図5を参照し、画像合成・切り出し装置10の動作について説明する。
図5に示すように、ステップS1において、逆投影部11は、出力画像座標[x,y]を参照平面Kに逆投影し、参照座標[X,Y,Z]を求める。
【0104】
ステップS2において、第1変換部12は、参照平面K上の参照座標[X,Y,Z]を第1入力画像I(c1)に写像して第1対応座標[ξ(c1),η(c1)に変換する。また、第2変換部12は、参照平面K上の参照座標[X,Y,Z]を第2入力画像I(c2)に写像して第2対応座標[ξ(c2),η(c2)に変換する。
【0105】
ステップS3において、第1変換部12は、写像した第1入力画像I(c1)の品質を示す第1評価値e(c1)を算出する。また、第2変換部12は、写像した第2入力画像I(c2)の品質を示す第2評価値e(c2)を算出する。
【0106】
ステップS4において、第1画素値読出部14は、第1入力画素値I(c1)(ξ(c1),η(c1))を第1フレームメモリ13から読み出す。また、第2画素値読出部14は、第2入力画素値I(c2)(ξ(c2),η(c2))を第2フレームメモリ13から読み出す。
【0107】
ステップS5において、合成部15は、第1入力画素値I(c1)(ξ(c1),η(c1))と第2入力画素値I(c2)(ξ(c2),η(c2))とを、第1評価値e(c1)と第2評価値e(c2)とに応じて合成することで、出力画素値J(x,y)を算出する。
【0108】
[作用・効果]
以上のように、画像合成・切り出し装置10は、画像の切り出し・合成処理と同等の処理を一括で実行し、各入力画像I(cn)から出力画像Jを生成できる。このとき、画像合成・切り出し装置10では、参照平面Kを介するため、出力画像Jに無関係な各入力画像I(cn)の画素については演算処理を適用せず、演算コストを低減できる。さらに、画像合成・切り出し装置10は、では、従来技術のように大きな画像を扱う必要がないので、小規模なメモリやプロセッサで演算処理を実行可能であり、構成を簡略化できる。
【0109】
なお、参照平面Kを介さず、各入力画像I(cn)から出力画像Jを直接生成できるようにも思われる。しかし、画像合成・切り出し装置10は、出力画像Jを直接生成する手法と比較し、以下で述べるような利点がある。
画像合成・切り出し装置10では、参照平面Kに一度マッピングすることで、仮想カメラのパン・チルト・ズーム操作により、直感的に出力画像Jを生成できる。さらに、画像合成・切り出し装置10では、入力画像I(cn)の枚数変更、つまり、撮影カメラの台数変更にも容易に対応できる。例えば、画像合成・切り出し装置10では、3台目の撮影カメラを追加する場合、3台目の撮影カメラに対応した変換パラメータを入力するだけでよい。
一方、出力画像Jを直接生成する手法では、仮想カメラのパン・チルト・ズームに応じた射影変換行列を都度生成する必要があり、非常に手間がかかる。また、出力画像Jを直接生成する手法では、撮影カメラの台数変更にも柔軟に対応できない。
【0110】
(変形例)
以上、本発明の実施形態を詳述してきたが、本発明はこれに限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
前記した実施形態では、画像合成・切り出し装置と、走査部、画素値書込部および出力フレームメモリとを別々に構成したが、これらを一体化してもよい。
前記した実施形態において、入力画像がサッカーの試合を撮影した例で説明したが、入力画像は、これに限定されない。
【0111】
前記した実施形態では、入力画像I(cn)が2枚であることとして説明したが、入力画像は3枚以上であってもよい。例えば、入力画像は、2枚~30枚の間に収まる。図6には、入力画像を3枚、つまり、撮影カメラが3台の例を図示した。図6に示すように、第1入力画像I(c1)は、1台目の撮影カメラでサッカーフィールドの左半面をやや望遠で撮影したものである。また、第2入力画像I(c2)は、2台目の撮影カメラでサッカーフィールドの右半面をやや望遠で撮影したものである。また、第3入力画像I(c3)は、3台目の撮影カメラでサッカーフィールド全面を広角で撮影したものである。これら3枚の入力画像I(c1)~I(c3)を用いれば、サッカーフィールド内を高解像度でカバーしつつ、観客席もカバーすることができる。
なお、入力画像I(cn)を3枚以上とした場合(N≧3)、画像合成・切り出し装置は、第n変換部、第nフレームメモリおよび第n画素値読出部を入力画像と同数備えればよい。また、入力画像I(cn)の枚数、つまり、撮影カメラの台数を変更することも可能である。
【0112】
前記した実施形態では、参照平面が平面であるものとして説明したが、参照平面は、既知の曲面であってもよい。例えば、既知の曲面とは、二次曲面などのように数式によってモデル化された曲面であってもよく、ポリゴンのように面要素の集合として表現された曲面であってもよい。また、既知の曲面は、高度地図(DEM: Digital Elevation Map)やボクセルのような標本化された表現の曲面であってもよい。これらの場合、逆投影部は、視点から仮想カメラの座標[x,y,f]に向かうベクトルと前記した既知の曲面との交点とを求め、その交点を参照座標[X,Y,Z]とすればよい。
【0113】
前記した実施形態において、逆投影部は、第n変換部と同様、射影変換(ホモグラフィー)により出力画像座標を参照平面に逆投影し、参照座標[X,Y,Z]を求めてもよい。
【0114】
また、コンピュータが備えるCPU、メモリ、ハードディスク等のハードウェア資源を、前記した画像合成・切り出し装置として動作させるプログラムで実現することもできる。これらのプログラムは、通信回線を介して配布してもよく、CD-ROMやフラッシュメモリ等の記録媒体に書き込んで配布してもよい。
【符号の説明】
【0115】
1 画像合成・切り出しシステム
10 画像合成・切り出し装置(画像処理装置)
11 逆投影部
12 変換部
12 第1変換部
12 第2変換部
13 フレームメモリ
13 第1フレームメモリ
13 第2フレームメモリ
14 画素値読出部
14 第1画素値読出部
14 第2画素値読出部
15 合成部(算出部)
20 走査部
21 画素値書込部
22 出力フレームメモリ
図1
図2
図3
図4
図5
図6