IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧

特許7598392回転状態推定装置、その方法、およびプログラム
<>
  • 特許-回転状態推定装置、その方法、およびプログラム 図1
  • 特許-回転状態推定装置、その方法、およびプログラム 図2
  • 特許-回転状態推定装置、その方法、およびプログラム 図3
  • 特許-回転状態推定装置、その方法、およびプログラム 図4
  • 特許-回転状態推定装置、その方法、およびプログラム 図5
  • 特許-回転状態推定装置、その方法、およびプログラム 図6
  • 特許-回転状態推定装置、その方法、およびプログラム 図7
  • 特許-回転状態推定装置、その方法、およびプログラム 図8
  • 特許-回転状態推定装置、その方法、およびプログラム 図9
  • 特許-回転状態推定装置、その方法、およびプログラム 図10
  • 特許-回転状態推定装置、その方法、およびプログラム 図11
  • 特許-回転状態推定装置、その方法、およびプログラム 図12
  • 特許-回転状態推定装置、その方法、およびプログラム 図13
  • 特許-回転状態推定装置、その方法、およびプログラム 図14
  • 特許-回転状態推定装置、その方法、およびプログラム 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-03
(45)【発行日】2024-12-11
(54)【発明の名称】回転状態推定装置、その方法、およびプログラム
(51)【国際特許分類】
   G06T 7/70 20170101AFI20241204BHJP
   G06T 7/246 20170101ALI20241204BHJP
   G06V 10/22 20220101ALI20241204BHJP
【FI】
G06T7/70 Z
G06T7/246
G06V10/22
【請求項の数】 3
(21)【出願番号】P 2022577914
(86)(22)【出願日】2021-01-28
(86)【国際出願番号】 JP2021003022
(87)【国際公開番号】W WO2022162829
(87)【国際公開日】2022-08-04
【審査請求日】2023-07-20
【前置審査】
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(74)【代理人】
【識別番号】100128314
【弁理士】
【氏名又は名称】沖川 仁
(74)【代理人】
【識別番号】100229725
【弁理士】
【氏名又は名称】中島 裕美
(72)【発明者】
【氏名】三上 弾
(72)【発明者】
【氏名】山本 奏
(72)【発明者】
【氏名】柏野 牧夫
(72)【発明者】
【氏名】西條 直樹
(72)【発明者】
【氏名】山口 真澄
(72)【発明者】
【氏名】福田 岳洋
【審査官】松浦 功
(56)【参考文献】
【文献】国際公開第2016/148247(WO,A1)
【文献】特開2002-015311(JP,A)
【文献】国際公開第2020/189265(WO,A1)
【文献】米国特許出願公開第2017/0200277(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00 - 7/90
G01B 11/00 -11/30
G01P 3/36 - 3/40
G06T 1/00
G06V 10/00 -20/90
H04N 7/18
(57)【特許請求の範囲】
【請求項1】
時系列の複数フレームの入力映像から得られる対象物に対応する画像から前記複数フレームに共通する領域の少なくとも一部である影領域を除外して得られる対象物画像を用い、前記対象物の回転状態を推定する回転状態推定部と、
wの絶対値を1以上の整数とし、uを単位時間として、時刻tの前記対象物画像中の対象物を回転状態の仮説に基づいてw単位時間だけ回転させた時刻t+w・uの対象物の画像である対象推定画像と、時刻t+w・uの前記対象物画像とを用い、前記対象推定画像の尤度が高くなる回転状態の仮説を複数の回転状態の仮説の中から選択することで、前記対象物の回転状態を推定する回転状態推定部とを有し、
前記回転状態推定部は、前記対象推定画像の尤度が高くなる回転状態の仮説およびwを、複数の回転状態の仮説および複数のwの中から選択することで、前記対象物の回転状態を推定する、回転状態推定装置。
【請求項2】
時系列の複数フレームの入力映像から得られる対象物に対応する画像から前記複数フレームに共通する領域の少なくとも一部である影領域を除外して得られる対象物画像を用い、前記対象物の回転状態を推定する回転状態推定ステップと、
wの絶対値を1以上の整数とし、uを単位時間として、時刻tの前記対象物画像中の対象物を回転状態の仮説に基づいてw単位時間だけ回転させた時刻t+w・uの対象物の画像である対象推定画像と、時刻t+w・uの前記対象物画像とを用い、前記対象推定画像の尤度が高くなる回転状態の仮説を複数の回転状態の仮説の中から選択することで、前記対象物の回転状態を推定する回転状態推定ステップとを有し、
前記回転状態推定ステップは、前記対象推定画像の尤度が高くなる回転状態の仮説およびwを、複数の回転状態の仮説および複数のwの中から選択することで、前記対象物の回転状態を推定する、回転状態推定方法。
【請求項3】
請求項1の回転状態推定装置としてコンピュータを機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、飛翔するボール等の対象物の回転状態を推定する技術に関する。
【背景技術】
【0002】
飛翔するボール等の対象物の回転状態を推定する技術として非特許文献1に開示されたものがある。この技術では、入力映像から或るフレームtにおけるボールの外見が再び現れる時刻t+Tを検出することで回転周期Tを求め、それからボールの回転数を求め、さらに隣接フレーム間で最もフィットするボールの回転軸を求める。しかし、非特許文献1の技術では、一周期分の入力映像が得られていない場合には、対象物の回転状態を推定することができない。
【0003】
これに対し、一周期分の入力映像が得られていない場合であっても対象物の回転状態を推定できる技術として、特許文献1に記載されたものがある。この技術では、tを所定の1以上の整数として、入力映像から得られる時刻tの対象物画像と時刻t+tの対象物画像とを用い、時刻tの対象物画像中の対象物を回転状態の仮説に基づいてt単位時間だけ回転させた対象物の画像の尤度が高くなる回転状態の仮説を複数の回転状態の仮説の中から選択することで、対象物の回転状態を推定する。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2020-153677号公報
【非特許文献】
【0005】
【文献】Takashi Ijiri, Atsushi Nakamura, Akira Hirabayashi, Wataru Sakai, Takeshi Miyazaki, Ryutaro Himeno, "Automatic spin measurements for pitched Baseballs via consumer-grade high-speed cameras", Signal, Image and Video Processing, Vol. 11, Issue 7, 2017.
【発明の概要】
【発明が解決しようとする課題】
【0006】
対象物に太陽光などの強い光が当たる場合、対象物画像の光が直接当たっている部分と影になる部分とでは、画素値(輝度)が大きく異なる。このような場合、対象物が本来持つテクスチャ(例えば、ボールの縫い目など)に基づいて対象物の回転状態を推定することが非常に困難になる。
【0007】
本発明はこのような点に鑑みてなされたものであり、対象物画像の光が直接当たっている部分と影になる部分とで画素値が大きく異なる場合であっても、対象物の回転状態を推定できる技術を提供することを目的とする。
【課題を解決するための手段】
【0008】
上記の課題を解決するために、時系列の複数フレームの入力映像から得られる対象物に対応する画像から前記複数フレームに共通する領域の少なくとも一部を除外して得られる対象物画像を用い、前記対象物の回転状態を推定する。
【発明の効果】
【0009】
本発明では、対象物画像の光が直接当たっている部分と影になる部分とで画素値が大きく異なる場合であっても、対象物の回転状態を推定できる。
【図面の簡単な説明】
【0010】
図1図1は実施形態の回転状態推定装置の機能構成を例示するためのブロック図である。
図2図2は実施形態の回転状態推定方法を例示するためのフロー図である。
図3図3は実施形態の回転状態推定処理を例示するためのフロー図である。
図4図4は実施形態の回転状態推定方法を例示するための図である。
図5図5は実施形態の回転状態推定方法を例示するための図である。
図6図6Aから図6Cは実施形態で推定される回転状態の不確定性を説明するための図である。
図7図7は実施形態で推定される回転状態の不確定性を説明するための図である。
図8図8は実施形態の回転状態推定方法を例示するための図である。
図9図9は実施形態の回転状態推定方法を例示するための図である。
図10図10は球に現れた影を例示するための図である。
図11図11Aは影が現れた球の映像を例示するための図である。図11B図11Aに例示した映像から抽出したエッジ領域を例示するための図である。図11C図11Aに例示した映像から推定した回転状態を例示するための図である。
図12図12は実施形態の影領域除外処理を例示するためのフロー図である。
図13図13Aは影が現れた対象物の映像を例示するための図であり、図13B図13Aに例示した映像に対応するマスクを例示するための図である。図13Cは影が現れた球の映像を例示するための図であり、図13D図13Cに例示した映像に対応するマスクを例示するための図である。図13Eは影が現れた球の映像を例示するための図であり、図13F図13Eに例示した映像に対応するマスクを例示するための図である。
図14図14Aは、ほとんど影が現れていない対象物の映像に対応するマスクを例示するための図である。図14Bは、対象物の映像において複数フレームに共通して現れる回転軸の軸心部分の領域を例示するための図である。
図15図15は実施形態の回転状態推定装置のハードウェア構成を例示するためのブロック図である。
【発明を実施するための形態】
【0011】
以下、図面を参照して本発明の実施形態を説明する。なお、同じ機能を有する構成部および同じ処理には同じ参照番号を付し、重複説明を省略する。
【0012】
[第1実施形態]
図1に例示するように、本実施形態の回転状態推定装置1は、例えば対象物画像生成部11および回転状態推定部13を有する。図2に例示するように、本実施形態の回転状態推定方法は、例えば、回転状態推定装置1の各構成部が、以下に説明するステップS11およびS13の処理を行うことで実現される。以下、詳細に説明する。
【0013】
<対象物画像生成部11(ステップS11)>
対象物画像生成部11には、対象物の映像(以下、「入力映像」という)が入力される。対象物とは、回転状態の推定の対象となる物体のことである。対象物の例はボールである。以下、対象物が野球のボールである場合を例に挙げて説明する。もちろん、対象物は野球のボールに限られず、ソフトボールのボール、ボーリングの球、サッカーボールなどであってもよい。対象物の回転状態とは、対象物の回転軸および回転量の少なくとも一方に対応する情報である。対象物の回転軸に対応する情報とは、例えば、対象物の回転軸(対象物の自転の回転軸)を表す情報であり、その一例は当該回転軸を表す座標や角度などである。より好ましくは、対象物の回転軸に対応する情報は、対象物の回転軸および回転方向を表す情報である。このような情報の例は2次元座標(x,y)であり、対象物の回転軸が当該2次元座標(x,y)と原点(0,0)とを通る直線Lと平行となり、かつ、原点(0,0)から2次元座標(x,y)を見たときの当該直線L周りの所定回転方向R(右回転方向または左回転方向)が、対象物の回転方向となる。対象物の回転量に対応する情報とは、例えば、当該回転量を表す角度や回転数、所定時間(例えば、1分、1秒、フレーム間隔など)当たりの回転数(例えば、回毎分(rpm: revolutions per minute)、回毎秒(rps: revolutions per second)、回毎フレームなど)などである。入力映像は時系列の映像であり、複数のフレームの画像を有する。例えば、入力映像は投じられた球の様子を撮影して得られた動画である。入力映像は事前に撮影されたものであってもよいし、リアルタイムに撮影されるものであってもよい。
【0014】
対象物画像生成部11は、入力映像から、対象物の画像である対象物画像を生成する。対象物画像は、例えば、対象物の中心を画像の中心として、対象物の全体が含まれるように切り出された、入力映像中の1フレーム画像中の部分領域である。対象物画像生成部11は、対象物の映像全体を含み、周辺に既知のサイズの余白を含むサイズの矩形となるように、入力された映像中の1フレーム画像中から部分領域を切り出して、対象物画像とする。既知のサイズの余白の例として、対象物の半径の0.5倍とすることができる。すなわち、左側の余白(対象物の半径の0.5倍)、対象物(半径の2倍の直径)、対象物の右側の余白で合計対象物の半径の3倍の長さを持つ辺と、上側の余白、対象物、対象物の下側の余白で合計対象物の半径の3倍の長さを持つ辺と、を持つ正方形の対象物画像とすることが考えられる。
【0015】
対象物画像生成部11は、対象物の特徴が抽出された(特徴強調された)対象物画像を生成してもよい。例えば、対象物画像生成部11は、上述のように入力映像から切り出された部分領域に対してエッジ抽出を行って得られる画像を対象物画像として得てもよい。これにより、対象物の特徴を抽出することができ、後続の回転状態推定部13の処理の精度が高まるというメリットがある。
【0016】
上述のように入力映像は時系列の映像であり、対象物画像も時系列の画像となる。例えば、入力映像の各フレーム画像に対して対象物画像が生成される場合、対象物画像も各フレームに対応する。時刻tの対象物画像をOと表すことにする。時刻tは時刻に対応する時系列情報であればどのようなものでもよく、例えば、実時間であってもよいし、フレーム番号であってもよい。生成された対象物画像は、回転状態推定部13に出力される。
【0017】
<回転状態推定部13(ステップS13)>
回転状態推定部13には、対象物画像生成部11で生成された対象物画像が入力される。回転状態推定部13は、上述のように時系列の入力映像から得られた或る時刻tの対象物の画像である対象物画像O中の対象物を回転状態の仮説に基づいてw単位時間だけ回転させた時刻t+w・uの対象物の画像である対象推定画像Et+w・uと、入力映像から得られた時刻t+w・uの対象物画像Ot+w・uとを用い、対象推定画像Et+w・uの尤度が高くなる回転状態の仮説およびwを、複数の回転状態の仮説および複数のwの中から選択することで、対象物の回転状態を推定する。
【0018】
言い換えると、時系列の入力映像から得られた或る時刻tの対象物の画像である対象物画像O中の対象物を回転状態の仮説に基づいてw単位時間だけ回転させた時刻t+w・uの対象物の画像である対象推定画像Et+w・uと、入力映像から得られた時刻t+w・uの対象物画像Ot+w・uとが近くなる回転状態の仮説およびwを、複数の回転状態の仮説および複数のwの中から選択することで、対象物の回転状態を推定する。
【0019】
ここで、単位時間uは予め定められた時間区間である。単位時間uは、フレーム間隔(すなわち、互いに隣接するフレーム間の時間区間)であってもよいし、2以上離れたフレーム間の時間区間であってもよいし、その他の予め定められた時間区間であってもよい。以下では、一例としてフレーム間隔を単位時間uとする例を説明する。また、wは絶対値が1以上の整数である。すなわち、wはw≦-1またはw≧1の整数である。wが負の場合、対象物を回転状態の仮説に基づいてw単位時間だけ回転させるとは、対象物を回転状態の仮説が示す回転方向の逆回転方向に|w|単位時間だけ回転させること(対象物をw単位時間だけ過去に遡らせた状態にすること)を意味する。wを1以上の整数のみに限定してもよいし、-1以下の整数のみに限定してもよい。wの絶対値の上限に限定はないが、対象物の想定される回転周期以下にwの絶対値が制限されてもよい。回転状態の仮説は、例えば、対象物の回転軸に対応する情報rおよび回転量に対応する情報θを表す。
【0020】
図3を用い、ステップS13の処理の具体例を説明する。
回転状態推定部13は、wの探索範囲a≦w≦bに属する各wについて、対象推定画像Et+w・uと対象物画像Ot+w・uとを用い、対象推定画像Et+w・uの尤度が高くなる回転状態の仮説(r,θ)を複数の回転状態の仮説(r,θ)の中から選択し、それぞれのマッチングスコアsを得る(ステップS131)。ただし、a<bであり、aおよびbは事前に定められていてもよいし、入力値に基づいて設定されてもよいし、他の処理に基づいて自動的に設定されてもよい。なお、探索範囲a≦w≦bに0が含まれる場合であっても、w=0でのステップS131の処理は不要であるが、w=0についてステップS131の処理が実行されてもよい。また、各wについて対象推定画像Et+w・uの尤度が高くなる回転状態の仮説(r,θ)を選択するには、例えば特許文献1に記載された方法を用いればよい。以下にこの方法の概要を示す。
【0021】
《各wの回転状態の仮説(r,θ)を選択する方法の一例》
各wについての回転状態の仮説(r,θ)の選択に特許文献1に記載された方法を用いる場合、回転状態推定部13は、探索範囲a≦w≦bに属する各wについて以下の処理を実行する。
【0022】
まず、回転状態推定部13は、回転状態の仮説(r,θ)を複数(複数種類)生成する。生成された複数の仮説を(r,θ)=(r(1),θ(1)),…,(r(J),θ(J))と表現する。ただし、Jは2以上の整数である。例えば、回転状態推定部13は、事前に与えられた確率分布に基づいて複数の仮説(r(1),θ(1)),…,(r(J),θ(J))を生成する。なお、初期状態においては、一般に事前情報が存在しないため、回転状態推定部13は、例えば一様分布の確率分布に基づいて複数の仮説(r(1),θ(1)),…,(r(J),θ(J))を生成する(ステップS1311)。
【0023】
回転状態推定部13は、対象物画像O中の対象物を各回転状態の仮説(r(j),θ(j))(j=1,…,J)に基づいてw単位時間だけ回転させた時刻t+w・uの対象物の画像である対象推定画像Et+w・uを生成する。すなわち、回転状態推定部13は、探索範囲a≦w≦bに属する各wについて、各回転状態の仮説(r(j),θ(j))に対応する対象推定画像Et+w・uを生成する。図4に探索範囲1≦w≦5の場合を例示する。図4の直線の矢印は時間の流れを表す。この例では、1≦w≦5の各wについて、J個の仮説(r(1),θ(1)),…,(r(J),θ(J))にそれぞれ対応するJ個の対象推定画像Et+w・uが生成される。回転状態推定部13は、各仮説(r(j),θ(j))に対応する対象推定画像Et+w・uと、入力映像から得られた時刻t+w・uの対象物画像Ot+w・uを比較することで、各仮説(r(j),θ(j))の尤度(尤もらしさ)を検証する。例えば、回転状態推定部13は、対象推定画像Et+w・uと対象物画像Ot+w・uとの類似度を計算し、得られた類似度または当該類似度の関数値を当該仮説(r(j),θ(j))の尤度とする。ここで、2個の画像の類似度とは、例えば2個の画像の中の対応するサンプルのユークリッド距離を所定の非増加関数に入力したときの出力値である。所定の非増加関数の例はf(x)=1/xである。回転状態推定部13は、当該仮説(r(j),θ(j))の尤度の計算を、生成された複数の仮説それぞれについて行う。回転状態推定部13は、この仮説の尤度の計算を、生成された複数の仮説(r(1),θ(1)),…,(r(J),θ(J))のそれぞれについて行う(ステップS1312)。
【0024】
回転状態推定部13は、計算された仮説(r(1),θ(1)),…,(r(J),θ(J))の尤度が所定の収束条件を満たしているか判断する。所定の収束条件の例は、前回計算された仮説の尤度の最大値と、今回計算された仮説の尤度の最大値との差の大きさが、所定の閾値以下であるかである。計算された仮説の尤度が所定の収束条件を満たしていない場合には、処理がステップS1311に戻る。この際、ステップS1311では、回転状態推定部13は、ステップS1312で計算された尤度によって定まる仮説の確率分布に基づくランダムサンプリングにより、複数の仮説(r(1),θ(1)),…,(r(J),θ(J))を新たに生成する。一方、計算された仮説の尤度が所定の収束条件を満たしている場合には、回転状態推定部13は、今回計算された仮説(r(1),θ(1)),…,(r(J),θ(J))から尤度を大きくなる仮説(r,θ)=(r,θ)を選択する。例えば、回転状態推定部13は、今回計算された仮説の尤度の最大値に対応する仮説(r,θ)を選択してもよいし、尤度が閾値以上または閾値を超えることになる仮説(r,θ)を選択してもよいし、尤度の大きい順で基準順位以上の尤度の仮説(r,θ)を選択してもよい(ステップS1313)(《各wの回転状態の仮説(r,θ)を選択する方法の一例》の説明終わり)。
【0025】
回転状態推定部13は、各wの回転状態の仮説(r,θ)を選択すると、さらに各wについて、選択した仮説(r,θ)に対応する対象推定画像Et+w・uと対象物画像Ot+w・uとのマッチングスコアsを得る。マッチングスコアsは、対象推定画像Et+w・uと対象物画像Ot+w・uとの類似度を表した指標である。例えば、ステップS1312で得られた仮説(r,θ)の尤度、すなわち、仮説(r,θ)に対応する対象推定画像Et+w・uと対象物画像Ot+w・uとの類似度をそのままマッチングスコアsとしてもよいし、当該類似度の関数値をマッチングスコアsとしてもよいし、仮説(r,θ)に対応する対象推定画像Et+w・uと対象物画像Ot+w・uとから新たにマッチングスコアsが計算されてもよい。探索範囲a≦w≦bに属する各wについて上述の処理が行われることにより、以下のようなリストが得られる。
【表1】
【0026】
回転状態推定部13は、上述のように得られたマッチングスコアs,…,sに基づいて特定のwを選択する(ステップS132)。すなわち、回転状態推定部13は、大きなマッチングスコアに対応する特定のwを選択する。例えば、回転状態推定部13は、マッチングスコアs,…,sのうち最大のマッチングスコアに対応するwを選択してもよいし、マッチングスコアs,…,sのうち閾値以上または閾値を超えることとなるwを選択してもよいし、マッチングスコアs,…,sのうち大きい順で基準順位以上のマッチングスコアに対応するwを選択してもよい。
【0027】
回転状態推定部13は、選択した特定のwに対応する仮説(r,θ)から対象物の回転状態を推定し、その推定結果を出力する(ステップS133)。すなわち、回転状態推定部13は、仮説(r,θ)から対象物の回転軸および回転量の少なくとも一方に対応する情報を推定し、その推定結果を出力する。例えば、回転状態推定部13は、選択した回転状態の仮説(r,θ)が表す対象物の回転軸に対応する情報rおよび回転量に対応する情報θとwとに基づき、対象物の回転軸および単位時間当たりの回転量の少なくとも一方に対応する情報を対象物の回転状態として得る。
【0028】
ここで選択された仮説(r,θ)に対応する対象物画像Ot+w・uと同じ画像は対象物の回転周期ごとに現れる。そのため、選択された仮説(r,θ)のみからは、対象物画像Ot+w・uが対象物画像Oに表された対象物をどの程度回転させたときの画像なのかを完全に特定することはできない。また、対象物画像Ot+w・uと同じ画像は、対象物が或る回転軸周りのいずれの方向に回転しても現れる。そのため、選択された仮説(r,θ)のみからは、対象物画像Ot+w・uが対象物画像Oに表された対象物をどの方向に回転させたときの画像なのかも完全に特定することができない。
【0029】
図5にw=3が選択された場合の例を示す。この場合、選択された回転状態の仮説(r,θ)に対応する対象推定画像Et+3uと対象物画像Ot+3uとの類似度は高い。図6Aから図6Cに、この場合の対象物の回転状態の可能性を示す。ここでは、rが対象物の回転軸および回転方向を表す二次元座標であり、θが対象物の回転量を表す角度であるとする。図6Aは、対象物画像Oに表された対象物がrで表される回転軸および回転方向について角度θだけ回転したときの当該対象物の画像が対象物画像Ot+3uとなった例である。図6Bは、対象物画像Oに表された対象物がrで表される回転軸および回転方向について角度θ+2nπだけ回転したときの当該対象物の画像が対象物画像Ot+3uとなった例である。ただしnは整数である。図6Cは、対象物画像Oに表された対象物が-rで表される回転軸および回転方向について角度-θ+2nπだけ回転したときの当該対象物の画像が対象物画像Ot+3uとなった例である。図6Aから図6Cのいずれの対象物画像Ot+3uも同一となり、いずれも回転状態の仮説(r,θ)に対応する対象推定画像Et+3uとの類似度は高い(図5)。
【0030】
つまり、ステップS132で選択された特定のwに対応する回転状態の仮説(r,θ)のみからステップS133で推定可能な回転状態は以下の通りである。
(1)対象物がrに対応する回転軸を中心として回転していること。
(2)対象物がw単位時間の間に、Θ+2nπだけ回転しているか、または-Θ+2nπだけ回転していること。ただし、Θはθに対応する回転量を表し、θが回転量そのものを表す場合にはΘ=θである。
【0031】
単位時間当たりの回転量(フレームあたりの回転量)は、(Θ+2nπ)/wまたは(-Θ+2nπ)/wと推定できる。また、単位時間当たりの回転量に対応する情報の一例である1分当たりの回転数は、{(Θ+2nπ)/w}*fr*60/2π[rpm]または{(-Θ+2nπ)/w}*fr*60/2π[rpm]となる。ただし、fr[fps]は入力映像のフレームレートを表す。例えば、fr=120や480などである。
【0032】
また回転状態推定部13は、選択した特定のwに対応する回転状態の仮説(r,θ)に加え、他の補助情報を用いて、対象物の回転状態を推定してもよい。例えば、投じられる可能性のある対象物の回転数の範囲や球種が予め分かっている場合には、それらの情報を補助情報としてもよい。また、ドップラーセンサーなどのセンサを用いて球種、位置、球速などを検出し、その検出結果を補助情報として用いてもよい。また、入力映像内での対象物の位置変化から球種を抽出し、それを補助情報として用いてもよい。
【0033】
また、入力映像のフレームレートと対象物の単位時間当たりの回転量との関係によっては、対象物の回転軸に対応する情報が全く得られない場合もある。例えば、図7に例示するように、対象物の単位時間u(フレーム)当たりの回転量がπ+2nπである場合、対象物の回転軸がrである場合の各時刻t,t+u,t+2u,t+3u,…での対象物画像O,Ot+u,Ot+2u,Ot+3u・・・と、対象物の回転軸がrに垂直なrである場合の各時刻t,t+u,t+2u,t+3u,…での対象物画像O,Ot+u,Ot+2u,Ot+3u・・・とがそれぞれ同一になる。このような場合、回転状態推定部13は、正しい回転軸の方向を推定することができない。そのため、選択された特定のwに対応する回転状態の仮説(r,θ)から得られる単位時間u当たりの回転量がπ+2nπである場合、回転状態推定部13は、対象物の回転状態として対象物の回転軸に対応する情報を推定せず、対象物の回転数に対応する情報のみを推定し、その推定結果を出力してもよい。すなわち、回転状態推定部13は、選択した回転状態の仮説が表す対象物の回転量に対応する情報θとwとに基づいて得られる単位時間当たりの回転量がπ+2nπである場合に、当該単位時間当たりの回転量に対応する情報を含み、対象物の回転軸に対応する情報を含まない情報を対象物の回転状態として得、その推定結果を出力してもよい。言い換えると、回転状態推定部13は、選択した回転状態の仮説が表す対象物の回転量に対応する情報θとwとに基づいて得られる単位時間当たりの回転量がπ+2nπでない場合に、対象物の回転軸に対応する情報を含む情報を対象物の回転状態として得、その推定結果を出力してもよい。あるいは、単位時間u当たりの回転量がπ+2nπである場合、回転状態推定部13が、対象物の回転状態として対象物の回転軸に対応する情報を推定せず、対象物の回転軸に対応する情報の推定が不可能である旨を出力してもよい。
【0034】
<本実施形態の特徴>
本実施形態では、回転状態推定部13が、時系列の入力映像から得られた或る時刻tの対象物の画像である対象物画像O中の対象物を回転状態の仮説に基づいてw単位時間だけ回転させた時刻t+w・uの対象物の画像である対象推定画像Et+w・uと、入力映像から得られた時刻t+w・uの対象物画像Ot+w・uとを用い、対象推定画像Et+w・uの尤度が高くなる回転状態の仮説およびwを、複数の回転状態の仮説および複数のwの中から選択することで、対象物の回転状態を推定する。これにより、いずれかのw(例えばw=1)について対象物画像O中の対象物を回転状態の仮説に基づいてw単位時間だけ回転させた対象推定画像Et+w・uを生成することができない場合であっても、その他のwについては対象推定画像Et+w・uを生成でき、最適なwを選択することで対象物の回転状態を推定できる。その結果、本実施形態では、入力映像のフレームレートにかかわらず、対象物の回転状態を推定することができる。
【0035】
なお図3では、回転状態推定部13が、a≦w≦bの各wについてそれぞれ最適な回転状態の仮説(r,θ)を選択し、それぞれのマッチングスコアsを得(ステップS131)、マッチングスコアsに基づいて探索範囲a≦w≦bから特定のwを選択し(ステップS132)、選択したwに対応する仮説(r,θ)に基づき、対象物の回転状態を推定する例を示した。しかし、これは本発明を限定するものではなく、回転状態推定部13が、探索範囲a≦w≦bのすべてのwについての複数の回転状態の仮説(r,θ)の中から最適な仮説(r,θ)を選択し、選択したwに対応する仮説(r,θ)に基づき、対象物の回転状態を推定してもよい。すなわち、対象推定画像Et+w・uと対象物画像Ot+w・uとを用い、対象推定画像Et+w・uの尤度が高くなる回転状態の仮説およびwを、複数の回転状態の仮説および複数のwの中から選択することで、対象物の回転状態を推定するのであれば、その処理過程はどのようなものであってもよい。言い換えると、対象推定画像Et+w・uと対象物画像Ot+w・uとが近くなる回転状態の仮説およびwを、複数の回転状態の仮説および複数のwの中から選択することで、対象物の回転状態を推定するのであれば、その処理過程はどのようなものであってもよい。なお、対象推定画像の尤度が高くなる回転状態の仮説およびwとは、例えば、対象推定画像の尤度が何らかの条件下で最大になる回転状態の仮説およびwであってもよいし、当該尤度が閾値以上または閾値を超えることとなる回転状態の仮説およびwであってもよいし、当該尤度の大きい順の順序が基準となる順位より上位となる回転状態の仮説およびwであってもよい。また、対象推定画像Et+w・uと対象物画像Ot+w・uとが近くなる回転状態の仮説およびwとは、対象推定画像Et+w・uと対象物画像Ot+w・uとの類似度が何らかの条件下で最大になる回転状態の仮説およびwであってもよいし、当該類似度が閾値以上または閾値を超えることとなる回転状態の仮説およびwであってもよいし、当該類似度の大きい順の順序が基準となる順位より上位となる回転状態の仮説およびwであってもよい。
【0036】
[第1実施形態の変形例1]
一般的な傾向としてwの絶対値が大きくなるほど、回転状態の推定精度の向上が期待できる。以下にその理由を説明する。対象推定画像Et+w・uと対象物画像Ot+w・uとを用い、対象推定画像Et+w・uの尤度が高くなる回転状態の仮説を選択することで、対象物の回転状態(例えば、対象物の回転量に対応する情報)を推定する場合の誤差(ノイズ)をeとする。ここでeの大きさはwの絶対値の大きさにさほど依存しないことが想定される。例えば、w=1の場合も、w=12の場合も全体としてのeはあまり変わらないことが想定される。そのため、wの値にかかわらず、回転状態の推定当たりの誤差がeであると仮定する。ここで、単位時間u(1フレーム間)当たりの対象物の真の回転量をθとすると、w=1およびw=12として推定された対象物の1分当たりの回転数[rpm]は、それぞれ以下のようになる。
w=1として推定された場合:
(θ+e)*fr*60/2π=θ*fr*60/2π+e*fr*60/2π
w=12として推定された場合:
{(θ*12+e)/12}*fr*60/2π=θ*fr*60/2π+(e/12)*fr*60/2π
このように、w=12の場合の単位時間当たりの誤差((e/12)*fr*60/2π)は、w=1の場合の単位時間当たりの誤差(e*fr*60/2π)の1/12に低減できていることが分かる。一般化すると、w=c(ただし、cはa≦c≦bを満たす整数であり、a<bでありc≠0である)の場合の単位時間当たりの誤差は、w=1の場合の単位時間当たりの誤差の約1/|c|となると見込まれる。そのため、wの絶対値が大きくなるほど、回転状態の推定精度の向上が見込まれる。
【0037】
そのため、wの絶対値が大きくなるように探索範囲a≦w≦bを限定してもよい。例えば、wの絶対値が2以上に制約されてもよい。すなわち、wの絶対値を2以上の整数とし、uを単位時間として、回転状態推定部13が時系列の複数フレームの入力映像から得られた或る時刻tの対象物の画像である対象物画像中の対象物を回転状態の仮説に基づいてw単位時間だけ回転させた時刻t+w・uの対象物の画像である対象推定画像と、前記入力映像から得られた時刻t+w・uの対象物画像とを用い、前記対象推定画像の尤度が高くなる回転状態の仮説およびwを複数の回転状態の仮説および絶対値が2以上の複数のwの中から選択することで、前記対象物の回転状態を推定してもよい。これにより、第1実施形態のようにw=1が選択される可能性がある場合に比べ、回転状態の推定精度の向上が見込まれる。
【0038】
[第1実施形態の変形例2]
図3に例示するように、回転状態推定部13が事前処理(ステップS130)で対象物の暫定回転量に対応する情報を推定し、その後の回転状態推定処理(ステップS131~S133)で、対象推定画像の尤度が高くなる回転状態の仮説およびwを複数の回転状態の仮説および暫定回転量に対応する情報に基づくwの探索範囲a≦w≦bの中からそれぞれ選択することで、対象物の回転状態を推定してもよい。
【0039】
回転状態推定処理は、第1実施形態または第1実施形態の変形例1の処理と同一である。暫定回転量に対応する情報とは、例えば、対象物の回転量を表す角度や回転数、所定時間(例えば、1分、1秒、フレーム間隔など)当たりの回転数(例えば、回毎分、回毎秒、回毎フレームなど)などである。以下に事前処理(ステップS130)を例示する。
・特許文献1や非特許文献1などに記載された公知の処理。
・第1実施形態においてwを予め定められた値(例えば、w=1)または範囲に限定した処理。
・回転状態推定処理(ステップS131~S133)で用いられる入力映像とフレームレートが異なる入力映像(例えば、回転状態推定処理で用いられる入力映像(例えば、120fps)よりもフレームレートが高い入力映像(例えば、480fps)、または回転状態推定処理で用いられる入力映像よりもフレームレートが低い入力映像)を用い、第1実施形態に記載された処理を実行する処理。
・回転状態推定処理(ステップS131~S133)で用いられる入力映像とフレームレートが異なる入力映像を用い、さらにwを予め定められた値または範囲に限定して第1実施形態に記載された方法を実行する処理。
【0040】
また暫定回転量に対応する情報に基づくwの探索範囲a≦w≦bは、暫定回転量に対応する情報に基づくものであればどのようなものでもよい。例えば、暫定回転量に対応する情報から得られる、対象物が1回転するために必要なフレーム数をWtmpとし、Wtmpを含む範囲を探索範囲a≦w≦bとしてもよい。例えば、回転状態推定部13が、暫定回転量に対応する情報から1フレーム間での対象物の回転角θ[ラジアン]としてWtmp=2π/θを求め、探索範囲a≦w≦bを以下のいずれかのように定めてもよい。ただし、Nは正の整数であり、d,dはd<dを満たす正の実数(例えば、d=0.7,d=1.3)であり、Vが2以上の整数である。
・Wtmp-N≦w≦Wtmp+Nを探索範囲a≦w≦bとする。
・Wtmp*d≦w≦Wtmp*dを探索範囲a≦w≦bとする。
・実数区分CL,…,CLのそれぞれの実数区分CL(ただしv=1,…,V)に対して(a,b)=(a,b)が定められ、Wtmpが属する実数区分CL(ただしi∈{1,…,V})に対応するa≦w≦bをwの探索範囲a≦w≦bとする。
【0041】
[第2実施形態]
第1実施形態およびその変形例1,2の手法は、時刻tの対象物画像O中の対象物を回転状態の仮説に基づいてw単位時間だけ回転させた時刻t+w・uの対象推定画像Et+w・uと、時刻t+w・uの対象物画像Ot+w・uとを用い、対象推定画像Et+w・uの尤度が高くなる回転状態の仮説およびwを選択することで、対象物の回転状態を推定するものであった。すなわち、或る時刻tの対象物画像Oと時刻t+w・uの対象物画像Ot+w・uとの2つの画像に基づき、対象物の回転状態を推定するものであった。これに対し、この処理を複数の時刻t,t,…,tの対象物画像Ot1,Ot1,…,OtKと、複数の時刻t+w・u,t+w・u,…,t+w・uの対象物画像Ot1+w・u,Ot2+w・u,…,OtK+w・uの2K個の画像に基づき、対象物の回転状態を推定してもよい。ただし、Kは2以上の整数である。例えば、t≠t≠…≠tであり、tk+1=t+uである。なお、下付き添え字の「tα」(ただし、α=1,…,K)は本来「tα」と表記すべきであるが、記載表記の制約上、「tα」と表記している。
【0042】
すなわち、回転状態推定部13は、Kを2以上の整数として、入力映像から得られた時刻t,t,…,tの対象物画像Ot1,Ot1,…,OtK中の対象物を回転状態の仮説に基づいてw単位時間だけ回転させた時刻t+w・u,t+w・u,…,t+w・uの対象物の画像である対象推定画像Et1+w・u,Et2+w・u,…,EtK+w・uと、入力映像から得られた時刻t+w・u,t+w・u,…,t+w・uの対象物画像Ot1+w・u,Ot2+w・u,…,OtK+w・uとを用い、対象推定画像Et1+w・u,Et2+w・u,…,EtK+w・uの尤度が高くなる回転状態の仮説およびwを複数の回転状態の仮説および複数のwの中からそれぞれ選択することで、対象物の回転状態を推定してもよい。
【0043】
言い換えると、回転状態推定部13は、対象推定画像Et1+w・u,Et2+w・u,…,EtK+w・uと対象物画像Ot1+w・u,Ot2+w・u,…,OtK+w・uとを用い、対象推定画像Et1+w・u,Et2+w・u,…,EtK+w・uと対象物画像Ot1+w・u,Ot2+w・u,…,OtK+w・uとが近くなる回転状態の仮説およびwを、複数の回転状態の仮説および複数のwの中から選択することで、対象物の回転状態を推定してもよい。
【0044】
このように対象物画像Ot1,Ot1,…,OtKと対象物画像Ot1+w・u,Ot2+w・u,…,OtK+w・uの2K個の画像に基づき、対象物の回転状態を推定することで、2つの画像に基づいて対象物の回転状態を推定するよりも、画像中に表れた対象物の特徴のばらつきの影響を低減させ、推定精度を向上させることができる。
【0045】
図1に例示するように、本実施形態の回転状態推定装置2は、例えば対象物画像生成部11および回転状態推定部23を有する。図2に例示するように、本実施形態の回転状態推定方法は、例えば、回転状態推定装置1の各構成部が、以下に説明するステップS11およびS23の処理を行うことで実現される。以下、詳細に説明する。
【0046】
<対象物画像生成部11(ステップS11)>
対象物画像生成部11によるステップS11の処理は第1実施形態のものと同一である。ただし、ステップS11で生成された対象物画像は、回転状態推定部23に出力される。
【0047】
<回転状態推定部23(ステップS23)>
回転状態推定部23には、対象物画像生成部11で生成された対象物画像が入力される。回転状態推定部23は、上述のように入力映像から得られた時刻t,t,…,tの対象物画像Ot1,Ot1,…,OtK中の対象物を回転状態の仮説に基づいてw単位時間だけ回転させた時刻t+w・u,t+w・u,…,t+w・uの対象物の画像である対象推定画像Et1+w・u,Et2+w・u,…,EtK+w・uと、入力映像から得られた時刻t+w・u,t+w・u,…,t+w・uの対象物画像Ot1+w・u,Ot2+w・u,…,OtK+w・uとを用い、対象推定画像Et1+w・u,Et2+w・u,…,EtK+w・uの尤度が高くなる回転状態の仮説およびwを複数の回転状態の仮説および複数のwの中からそれぞれ選択することで、対象物の回転状態を推定し、その推定結果を出力する。図8にw=7の場合の対象物画像Ot1,Ot1,…,OtKと対象物画像Ot1+w・u,Ot2+w・u,…,OtK+w・uとの関係を例示し、図9にw=12の場合の対象物画像Ot1,Ot1,…,OtKと対象物画像Ot1+w・u,Ot2+w・u,…,OtK+w・uとの関係を例示する。ただし、図8および図9ではtk+w=t+w・u(ただしk=1,…,K)である。ステップS23のステップS13との相違点は、ステップS13の対象推定画像Et+w・uの尤度が対象推定画像Et1+w・u,Et2+w・u,…,EtK+w・uの尤度に置換された点である。対象推定画像Et1+w・u,Et2+w・u,…,EtK+w・uの尤度の例は、対象推定画像Et1+w・u,Et2+w・u,…,EtK+w・uの尤度の合計値、平均値、最大値、最小値などである。言い換えると、ステップS13では対象推定画像Et+w・uと対象物画像Ot+w・uとが近くなる回転状態の仮説およびwを選択することで対象物の回転状態を推定していたが、ステップS23では対象推定画像Et1+w・u,Et2+w・u,…,EtK+w・uと対象物画像Ot1+w・u,Ot2+w・u,…,OtK+w・uとが近くなる回転状態の仮説およびwを選択することで対象物の回転状態を推定する。対象推定画像Et1+w・u,Et2+w・u,…,EtK+w・uと対象物画像Ot1+w・u,Ot2+w・u,…,OtK+w・uとが近くなるとは、対象推定画像Etk+w・uと対象物画像Otk+w・u(ただしk=1,…,K)の類似度の合計値、平均値、最大値、最小値などが何らかの条件下で最大になることであってもよいし、閾値以上または閾値を超えることであってもよいし、当該類似度の合計値、平均値、最大値、最小値などの大きい順の順序が基準となる順位より上位となることであってもよい。例えば、回転状態推定部23は、wの探索範囲a≦w≦bに属する各wについて、対象推定画像Et1+w・u,Et2+w・u,…,EtK+w・uと対象物画像Ot1+w・u,Ot2+w・u,…,OtK+w・uとを用い、対象推定画像Et+w・uの尤度が高くなる回転状態の仮説(r,θ)を複数の回転状態の仮説(r,θ)の中から選択し、それぞれのマッチングスコアsを得る(ステップS231)。その後、回転状態推定部23は、第1実施形態で説明したステップS132およびS133の処理を実行する。その他は第1実施形態と同じである。
【0048】
<本実施形態の特徴>
本実施形態でも、第1実施形態と同様、入力映像のフレームレートにかかわらず、対象物の回転状態を推定することができる。さらに、本実施形態では、対象物画像Ot1,Ot1,…,OtKと対象物画像Ot1+w・u,Ot2+w・u,…,OtK+w・uの2K個の画像に基づき、対象物の回転状態を推定することで、2つの画像に基づいて対象物の回転状態を推定するよりも推定精度を向上させることができる。
【0049】
[第2実施形態の変形例1]
第1実施形態の変形例1と同様、第2実施形態において、wの絶対値が大きくなるように探索範囲a≦w≦bが限定されてもよい。例えば、wの絶対値が2以上に制約されてもよい。
【0050】
[第2実施形態の変形例2]
第1実施形態の変形例2と同様、第2実施形態において、回転状態推定部23が、事前処理(ステップS130)で対象物の暫定回転量に対応する情報を推定し、その後の回転状態推定処理(ステップS231,S132,S133)で、対象推定画像の尤度が高くなる回転状態の仮説およびwを複数の回転状態の仮説および暫定回転量に対応する情報に基づくwの探索範囲a≦w≦bの中からそれぞれ選択することで、対象物の回転状態を推定してもよい。
【0051】
[第3実施形態]
図10に時系列の対象物画像Ot1,Ot2,Ot3,Ot4,Ot5,・・・を例示する。なお、図10の直線の矢印は時間の流れを表す。図10に例示するように、対象物に太陽光などの強い光が当たる場合、対象物画像Ot1,Ot2,Ot3,Ot4,Ot5,・・・の光が直接当たっている部分qt1,qt2,qt3,qt4,qt5,・・・と影になる部分pt1,pt2,pt3,pt4,pt5,・・・とでは、画素値(輝度)が大きく異なる。このような場合、対象物が本来持つテクスチャ(例えば、ボールの縫い目など)に基づいて対象物の回転状態を推定することが非常に困難になる。そのため、エッジ抽出などの対象物の特徴を抽出する処理を行い、対象物の特徴が抽出された対象物画像を用いて回転状態の推定を行うことが考えられる。
【0052】
しかしながら、このような場合にエッジ抽出などの対象物の特徴を抽出する処理を行うと、光が直接当たっている部分と影になる部分との境界部分の特徴が抽出されてしまい、対象物の回転状態を正しく推定できない場合がある。例えば、図11Aに例示する対象物画像Oのエッジ抽出を行うと、図11Bのようなエッジ領域Eを表す対象物画像Oが得られる。図11Aおよび図11Bに例示するように、エッジ領域Eは対象物(ボール)やそれが本来持つテクスチャ(例えば、ボールの縫い目など)のエッジの特徴だけではなく、光が直接当たっている部分qと影になる部分pとの境界部分eの特徴までも表していることがわかる。図10にも例示したように、対象物画像Ot1,Ot2,Ot3,Ot4,Ot5,・・・の影になる部分pt1,pt2,pt3,pt4,pt5,・・・は時間の経過によってほとんど変化せず、境界部分et1,et2,et3,et4,et5,・・・も時間の経過によってほとんど変化しない。そのため、図11Bのようなエッジ領域Eを表す対象物画像Oから回転状態を推定すると、図11Cのように境界部分eに沿って対象物が回転していると推定してしまい、当該対象物が境界部分eと垂直な回転軸rを中心として回転量θで回転していると誤って推定してしまう場合がある。
【0053】
これについて、公知の画像処理技術によって対象物画像から影を除去する方法も考えられるが、太陽の位置や天候などが異なる様々な環境で撮影された入力映像に基づいて得られた対象物画像において影か否かの判断を適切に行うことは困難であり、十分に影を除去できない場合も多い。また、対象物画像のうち予め設定された固定領域の画素を回転状態の推定に用いないという方法も考えられる。しかしながら、影や境界部分の位置は太陽の位置などの環境によって異なり、様々な環境で撮影された入力映像に基づいて得られた対象物画像において適切な固定領域を設定することはできない。
【0054】
そこで本実施形態では、回転状態推定装置が、時系列の複数フレームの入力映像から得られる対象物に対応する画像から複数フレームに共通する領域の少なくとも一部を除外して得られる対象物画像を用い、対象物の回転状態を推定する。対象物に対応する画像とは、対象物の画像であってもよいし、対象物の特徴を抽出して得られた画像であってもよい。対象物の特徴を抽出して得られた画像の例は、対象物のエッジ抽出を行って得られる画像である。対象物のエッジ抽出を行って得られる画像の例は、対象物のエッジ領域の画素値をpix1(例えば、黒を表す画素値)とし、エッジ領域以外の画素値をpix2(例えば、白を表す画素値)とした画像である。好ましくは、入力映像から対象物の特徴を抽出して得られた画像から、複数フレームに共通する領域の少なくとも一部を除外して得られる対象物画像を用い、対象物の回転状態を推定する。前述のように撮影環境によって影や境界部分の位置は異なるが、図10に例示したように、同じ入力映像から得られる対象物の画像の影や境界部分の位置はほとんど変化しない。一方、対象物が本来持つテクスチャ(例えば、ボールの縫い目など)は対象物の回転に応じて変化する。そのため、複数フレームに共通する領域の少なくとも一部を除外して得られる対象物画像を用いて回転状態の推定を行うことで、影や境界部分による影響を自動的に低減させることができる。なお、除外される「複数フレームに共通する領域の少なくとも一部」は、複数フレームに共通する領域のすべてであってもよいし、その一部であってもよいが、前者のほうが好ましい。また、「複数フレームに共通する領域の少なくとも一部」を除外するのであれば、これと他の領域とを含む領域が除外されてもよい。すなわち、「複数フレームに共通する領域の少なくとも一部」を含む領域が除外されればよい。以下、詳細に説明する。
【0055】
図1に例示するように、本実施形態の回転状態推定装置3は、例えば対象物画像生成部11、影領域除外部32、および回転状態推定部13(または回転状態推定部23)を有する。図2に例示するように、本実施形態の回転状態推定方法は、例えば、回転状態推定装置3の各構成部が、以下に説明するステップS11,S32、およびS13(またはS23)の処理を行うことで実現される。
【0056】
<対象物画像生成部11(ステップS11)>
対象物画像生成部11によるステップS11の処理は第1実施形態のものと同一である。ただし、ステップS11で生成された対象物画像は、影領域除外部32に出力される。
【0057】
<影領域除外部32(ステップS32)>
影領域除外部32には、対象物画像生成部11から出力された対象物画像が入力される。前述のように、当該対象物画像は、入力映像から切り出された画像であってもよいし、さらに対象物の特徴を抽出して得られた画像であってもよい。影領域除外部32は、入力された対象物画像(時系列の複数フレームの入力映像から得られる対象物に対応する画像)から、複数フレームに共通する領域の少なくとも一部を除外して得られる対象物画像を得て出力する。
【0058】
図12にステップS32の処理を例示する。
図12に例示するように、影領域除外部32は、入力された複数フレームの対象物画像から複数フレームに共通する領域を抽出する(ステップS321)。複数フレームに共通する領域の例は、複数フレームで画素値(または輝度値)が同一となっている画素からなる領域、複数フレームで画素値(または輝度値)の相違が閾値以下となっている画素からなる領域、このような画素を含む領域などである。
【0059】
次に影領域除外部32は、抽出した複数フレームに共通する領域の少なくとも一部(以下、「除去領域」という)を含む領域の情報を除外するためのマスクmを生成する(ステップS322)。例えば、影領域除外部32は、除去領域の画素値がpix3(例えば、pix3=0)であり、除去領域以外の領域の画素値がpix4(例えば、pix4=1)となる画像をマスクmとして生成する。あるいは、除去領域と除去領域以外との境界付近において、座標の変化に応じた画素値の変化が連続的(滑らか)になるように、pix3およびpix4が設定されてもよい。図13B図13D図13Fに、図13A図13C図13Eに記載された対象物画像Oに対応するマスクmをそれぞれ例示する。図13B図13D図13Fに例示したマスクmは、それぞれ光が直接当たっている部分qと影になる部分pとの境界部分eの領域および対象物の輪郭領域を表す画像である。
【0060】
次に影領域除外部32は、ステップS322で得られたマスクmを、ステップS321で入力された対象物画像に適用し、入力された対象物画像から、除去領域を除外して得られる対象物画像を得て出力する(ステップS323)。例えば、影領域除外部32は、マスクmの各座標(x,y)の画素値をステップS321で入力された対象物画像(例えば、対象物の特徴を抽出して得られた画像)の当該各座標(x,y)の画素値に乗じて得られる値を当該各座標(x,y)の画素値とした対象物画像を得て出力する。
【0061】
影領域除外部32が生成した除外領域が除外して得られる対象物画像は回転状態推定部13(または回転状態推定部23)に対して出力される。
【0062】
<回転状態推定部13または23(ステップS13またはS23)>
この処理は、影領域除外部32から出力された対象物画像が用いられる以外、第1実施形態、第2実施形態、またはその変形例と同じである。
【0063】
<本実施形態の特徴>
本実施形態でも、第1実施形態と同様、入力映像のフレームレートにかかわらず、対象物の回転状態を推定することができる。さらに、本実施形態では、時系列の複数フレームの入力映像から得られる対象物に対応する画像から前記複数フレームに共通する領域の少なくとも一部を除外して得られる対象物画像を用い、対象物の回転状態を推定する。そのため、対象物に表れる影や境界領域の影響を低減させ、対象物の回転状態の推定精度を向上させることができる。
【0064】
なお、対象物に影が現われていない場合であっても、対象物の回転状態の推定精度を低下させることはほとんどない。図14Aに対象物に影が現われていない場合のマスクmを例示する。図14Aに例示するように、図14Aに対象物に影が現われていない場合、マスクmは対象物の輪郭領域を除外するものとなる。このようなマスクmを適用しても、対象物の回転推定に必要な対象物本来のテクスチャ(例えば、ボールの縫い目など)にはほとんど影響を与えず、回転状態の推定精度を低下させることはほとんどない。
【0065】
また、対象物が回転しても、当該対象物の回転軸の軸心部分の像は大きく変化しない。そのため、軸心部分が除去領域に含まれてしまう場合もある。しかし、このような場合であっても、軸心部分の領域は小さいため、対象物の回転状態の推定精度を低下させることはほとんどない。図14Bに対象物に影が現われていないが、軸心部分が除去領域に含まれた場合のマスクmを例示する。図14Bに例示するマスクmは、対象物の輪郭領域および軸心部分mを除外するものとなる。しかし、このようなマスクmを適用しても、対象物の回転推定に必要な対象物本来のテクスチャにはほとんど影響を与えず、回転状態の推定精度を低下させることはほとんどない。
【0066】
[ハードウェア構成]
各実施形態における回転状態推定装置1,2,3は、例えば、CPU(central processing unit)等のプロセッサ(ハードウェア・プロセッサ)やRAM(random-access memory)・ROM(read-only memory)等のメモリ等を備える汎用または専用のコンピュータが所定のプログラムを実行することで構成される装置である。このコンピュータは1個のプロセッサやメモリを備えていてもよいし、複数個のプロセッサやメモリを備えていてもよい。このプログラムはコンピュータにインストールされてもよいし、予めROM等に記録されていてもよい。また、CPUのようにプログラムが読み込まれることで機能構成を実現する電子回路(circuitry)ではなく、単独で処理機能を実現する電子回路を用いて一部またはすべての処理部が構成されてもよい。また、1個の装置を構成する電子回路が複数のCPUを含んでいてもよい。
【0067】
図15は、各実施形態における回転状態推定装置1,2,3のハードウェア構成を例示したブロック図である。図15に例示するように、この例の回転状態推定装置1,2,3は、CPU(Central Processing Unit)10a、入力部10b、出力部10c、RAM(Random Access Memory)10d、ROM(Read Only Memory)10e、補助記憶装置10fおよびバス10gを有している。この例のCPU10aは、制御部10aa、演算部10abおよびレジスタ10acを有し、レジスタ10acに読み込まれた各種プログラムに従って様々な演算処理を実行する。また、入力部10bは、データが入力される入力端子、キーボード、マウス、タッチパネル等である。また、出力部10cは、データが出力される出力端子、ディスプレイ、所定のプログラムを読み込んだCPU10aによって制御されるLANカード等である。また、RAM10dは、SRAM (Static Random Access Memory)、DRAM (Dynamic Random Access Memory)等であり、所定のプログラムが格納されるプログラム領域10daおよび各種データが格納されるデータ領域10dbを有している。また、補助記憶装置10fは、例えば、ハードディスク、MO(Magneto-Optical disc)、半導体メモリ等であり、所定のプログラムが格納されるプログラム領域10faおよび各種データが格納されるデータ領域10fbを有している。また、バス10gは、CPU10a、入力部10b、出力部10c、RAM10d、ROM10eおよび補助記憶装置10fを、情報のやり取りが可能なように接続する。CPU10aは、読み込まれたOS(Operating System)プログラムに従い、補助記憶装置10fのプログラム領域10faに格納されているプログラムをRAM10dのプログラム領域10daに書き込む。同様にCPU10aは、補助記憶装置10fのデータ領域10fbに格納されている各種データを、RAM10dのデータ領域10dbに書き込む。そして、このプログラムやデータが書き込まれたRAM10d上のアドレスがCPU10aのレジスタ10acに格納される。CPU10aの制御部10aaは、レジスタ10acに格納されたこれらのアドレスを順次読み出し、読み出したアドレスが示すRAM10d上の領域からプログラムやデータを読み出し、そのプログラムが示す演算を演算部10abに順次実行させ、その演算結果をレジスタ10acに格納していく。このような構成により、回転状態推定装置1,2,3の機能構成が実現される。
【0068】
上述のプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体の例は非一時的な(non-transitory)記録媒体である。このような記録媒体の例は、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等である。
【0069】
このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。上述のように、このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
【0070】
各実施形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
【0071】
[その他の変形例]
なお、本発明は上述の実施形態に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
【符号の説明】
【0072】
1,2,3 回転状態推定装置
11 対象物画像生成部
32 影領域除外部
13,23 回転状態推定部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15