(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2023-07-25
(45)【発行日】2023-08-02
(54)【発明の名称】コンピュータ、プログラム、情報処理方法およびモデル生成方法
(51)【国際特許分類】
G01B 11/00 20060101AFI20230726BHJP
【FI】
G01B11/00 D
G01B11/00 H
(21)【出願番号】P 2023064860
(22)【出願日】2023-04-12
【審査請求日】2023-04-12
【早期審査対象出願】
(73)【特許権者】
【識別番号】523138563
【氏名又は名称】株式会社Knowhere
(74)【代理人】
【識別番号】100131842
【氏名又は名称】加島 広基
(74)【代理人】
【識別番号】100215267
【氏名又は名称】古屋 秀人
(74)【代理人】
【識別番号】100215555
【氏名又は名称】今井 貴裕
(72)【発明者】
【氏名】今井 達也
(72)【発明者】
【氏名】伊藤 久史
【審査官】仲野 一秀
(56)【参考文献】
【文献】特開2021-71387(JP,A)
【文献】国際公開第2022/137450(WO,A1)
【文献】特開2021-68356(JP,A)
【文献】特開2012-169844(JP,A)
【文献】国際公開第2021/064912(WO,A1)
【文献】特開2000-102000(JP,A)
【文献】特開2018-205074(JP,A)
【文献】特開2007-101304(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G01B 11/00-11/30
G06T 1/00-19/20
G01C 3/00-3/32
(57)【特許請求の範囲】
【請求項1】
カメラを含む端末から送信された、前記カメラにより撮像された予め設定されている大きさの球形状の対象物の静止画像と、前記対象物を撮像した前記カメラの画角または焦点距離の情報とを受け付ける受付部と、
前記受付部が受け付けた前記対象物の静止画像から当該対象物を囲う長方形の四隅の座標を演算し、演算された前記対象物を囲う長方形の四隅の座標と、前記カメラの画角または焦点距離とから、前記カメラのレンズの焦点から前記対象物を囲う長方形の四隅の座標に向かう方向ベクトルを演算する演算部と、
球形状の前記対象物の大きさに基づいて、前記演算部により演算された方向ベクトル
から前記対象物の中心の3次元座標を推定する推定部と、
前記推定部により推定された前記対象物の中心の3次元座標を出力する出力部と、
を備えた、コンピュータ。
【請求項2】
前記推定部は、
球形状の前記対象物の大きさに基づいた第1推定モデルであって、前記対象物を撮像した前記カメラのレンズの焦点から前記対象物に向かう方向ベクトルと、前記対象物の中心の3次元座標とを含む教師データを用いて機械学習により得られた第1推定モデルを用いて、前記演算部により演算された方向ベクトル
から前記対象物の中心の3次元座標を推定する、請求項1記載のコンピュータ。
【請求項3】
球形状の前記対象物を撮像した前記カメラのレンズの焦点から前記対象物に向かう方向ベクトルと、前記対象物の中心の3次元座標とを含む教師データを用い、前記カメラのレンズの焦点から前記対象物に向かう方向ベクトルから前記対象物の中心の3次元座標を推定する第1推定モデルを機械学習により生成するモデル生成部を更に備えた、請求項2記載のコンピュータ。
【請求項4】
カメラを含む端末から送信された、前記カメラにより撮像された
予め設定されている大きさの球形状の対象物の静止画像と、前記対象物を撮像した前記カメラの画角または焦点距離の情報とを受け付ける受付部と、
前記受付部が受け付けた前記対象物の静止画像から当該対象物を囲う長方形の四隅の座標を演算する演算部と、
前記演算部により演算された長方形の四隅の座標と、前記カメラの画角または焦点距離とに基づいて、前記カメラのレンズの焦点から前記対象物を囲う長方形の四隅に向かう方向ベクトルを演算することなく、前記対象物の中心の3次元座標を推定する推定部と、
前記推定部により推定された前記対象物の中心の3次元座標を出力する出力部と、
を備え
、
前記推定部は、球形状の前記対象物の大きさに基づいた第2推定モデルであって、球形状の前記対象物の静止画像から取得される当該対象物を囲う長方形の四隅の座標と、前記対象物を撮像した前記カメラの画角または焦点距離と、前記対象物の中心の3次元座標とを含む教師データを用いて機械学習により得られた第2推定モデルを用いて、前記演算部により演算された長方形の四隅の座標と、前記カメラの画角または焦点距離とから前記対象物の中心の3次元座標を推定する、コンピュータ。
【請求項5】
球形状の前記対象物の静止画像から取得される当該対象物を囲う長方形の四隅の座標と、前記対象物を撮像した前記カメラの画角または焦点距離と、前記対象物の中心の3次元座標とを含む教師データを用い、前記対象物を囲う長方形の四隅の座標と、前記対象物を撮像した前記カメラの画角または焦点距離とから前記対象物の中心の3次元座標を推定する前記第2推定モデルを機械学習により生成するモデル生成部を更に備えた、請求項
4記載のコンピュータ。
【請求項6】
前記端末において、前記カメラにより前記対象物を撮像する前に前記カメラの画角または焦点距離を調整可能となっており、前記カメラにより前記対象物が撮像されると撮像された前記対象物の静止画像と調整された前記カメラの画角または焦点距離の情報とが前記端末から前記コンピュータに送信される、請求項1乃至
5のいずれか一項に記載のコンピュータ。
【請求項7】
前記端末に撮像用アプリケーションをインストール可能となっており、前記端末において前記撮像用アプリケーションが起動されると、前記カメラにより前記対象物が撮像されたときに前記撮像用アプリケーションによって撮像された前記対象物の静止画像と前記対象物が撮像されたときの前記カメラの画角または焦点距離の情報とが前記端末から前記コンピュータに送信される、請求項1乃至
5のいずれか一項に記載のコンピュータ。
【請求項8】
前記端末のモニタに表示されるブラウザにおいて前記カメラにより前記対象物を撮像する前に前記カメラの画角または焦点距離の情報が入力可能となっており、前記カメラにより前記対象物が撮像されると撮像された前記対象物の静止画像と前記ブラウザで入力された前記カメラの画角または焦点距離の情報とが前記端末から前記コンピュータに送信される、請求項1乃至
5のいずれか一項に記載のコンピュータ。
【請求項9】
コンピュータを、受付手段と、演算手段と、推定手段と、出力手段として機能させるプログラムであって、
前記受付手段は、カメラを含む端末から送信された、前記カメラにより撮像された予め設定されている大きさの球形状の対象物の静止画像と、前記対象物を撮像した前記カメラの画角または焦点距離の情報とを受け付け、
前記演算手段は、前記受付手段が受け付けた前記対象物の静止画像から当該前記対象物を囲う長方形の四隅の座標を演算し、演算された前記対象物を囲う長方形の四隅の座標と、前記カメラの画角または焦点距離とから、前記カメラのレンズの焦点から前記対象物を囲う長方形の四隅の座標に向かう方向ベクトルを演算し、
前記推定手段は、
球形状の前記対象物の大きさに基づいて、前記演算手段により演算された方向ベクトル
から前記対象物の中心の3次元座標を推定し、
前記出力手段は、前記推定手段により推定された前記対象物の中心の3次元座標を出力する、プログラム。
【請求項10】
コンピュータを、受付手段と、演算手段と、推定手段と、出力手段として機能させるプログラムであって、
前記受付手段は、カメラを含む端末から送信された、前記カメラにより撮像された
予め設定されている大きさの球形状の対象物の静止画像と、前記対象物を撮像した前記カメラの画角または焦点距離の情報とを受け付け、
前記演算手段は、前記受付手段が受け付けた前記対象物の静止画像から当該対象物を囲う長方形の四隅の座標を演算し、
前記推定手段は、前記演算手段により演算された長方形の四隅の座標と、前記カメラの画角または焦点距離とに基づいて、前記カメラのレンズの焦点から前記対象物を囲う長方形の四隅に向かう方向ベクトルを演算することなく、前記対象物の中心の3次元座標を推定し、
前記出力手段は、前記推定手段により推定された前記対象物の中心の3次元座標を出力
し、
前記推定手段は、球形状の前記対象物の大きさに基づいた第2推定モデルであって、球形状の前記対象物の静止画像から取得される当該対象物を囲う長方形の四隅の座標と、前記対象物を撮像した前記カメラの画角または焦点距離と、前記対象物の中心の3次元座標とを含む教師データを用いて機械学習により得られた第2推定モデルを用いて、前記演算手段により演算された長方形の四隅の座標と、前記カメラの画角または焦点距離とから前記対象物の中心の3次元座標を推定する、プログラム。
【請求項11】
制御部を有するコンピュータにより行われる情報処理方法であって、
前記制御部が、カメラを含む端末から送信された、前記カメラにより撮像された予め設定されている大きさの球形状の対象物の静止画像と、前記対象物を撮像した前記カメラの画角または焦点距離の情報とを受け付ける工程と、
前記制御部が、受け付けた前記対象物の静止画像から当該対象物を囲う長方形の四隅の座標を演算し、演算された前記対象物を囲う長方形の四隅の座標と、前記カメラの画角または焦点距離とから、前記カメラのレンズの焦点から前記対象物を囲う長方形の四隅の座標に向かう方向ベクトルを演算する工程と、
前記制御部が、
球形状の前記対象物の大きさに基づいて、演算された方向ベクトル
から前記対象物の中心の3次元座標を推定する工程と、
前記制御部が、推定された前記対象物の中心の3次元座標を出力する工程と、
を備えた、情報処理方法。
【請求項12】
制御部を有するコンピュータにより行われる情報処理方法であって、
前記制御部が、カメラを含む端末から送信された、前記カメラにより撮像された
予め設定されている大きさの球形状の対象物の静止画像と、前記対象物を撮像した前記カメラの画角または焦点距離の情報とを受け付ける工程と、
前記制御部が、受け付けた前記対象物の静止画像から当該対象物を囲う長方形の四隅の座標を演算
する工程と、
前記制御部が、演算された長方形の四隅の座標と、前記カメラの画角または焦点距離とに基づいて、前記カメラのレンズの焦点から前記対象物を囲う長方形の四隅に向かう方向ベクトルを演算することなく、前記対象物の中心の3次元座標を推定する工程と、
前記制御部が、推定された前記対象物の中心の3次元座標を出力する工程と、
を備え
、
前記制御部は、球形状の前記対象物の大きさに基づいた第2推定モデルであって、球形状の前記対象物の静止画像から取得される当該対象物を囲う長方形の四隅の座標と、前記対象物を撮像した前記カメラの画角または焦点距離と、前記対象物の中心の3次元座標とを含む教師データを用いて機械学習により得られた第2推定モデルを用いて、演算された長方形の四隅の座標と、前記カメラの画角または焦点距離とから前記対象物の中心の3次元座標を推定する、情報処理方法。
【請求項13】
予め設定されている大きさの球形状の対象物を撮像したカメラのレンズの焦点から前記対象物を囲う長方形の四隅の座標に向かう方向ベクトルと、前記対象物の中心の3次元座標とを含む教師データを用い、
球形状の前記対象物の大きさに基づいた第1推定モデルであって、前記カメラのレンズの焦点から前記対象物を囲う長方形の四隅に向かう方向ベクトルから前記対象物の中心の3次元座標を推定する第1推定モデルを機械学習により生成する、モデル生成方法。
【請求項14】
予め設定されている大きさの球形状の対象物の静止画像から取得される当該対象物を囲う長方形の四隅の座標と、前記対象物を撮像したカメラの画角または焦点距離と、前記対象物の中心の3次元座標とを含む教師データを用い、
球形状の前記対象物の大きさに基づいた第2推定モデルであって、前記対象物を囲う長方形の四隅の座標と、前記対象物を撮像した前記カメラの画角または焦点距離とから前記対象物の中心の3次元座標を推定する第2推定モデルを機械学習により生成する、モデル生成方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンピュータ、プログラム、情報処理方法およびモデル生成方法に関する。
【背景技術】
【0002】
野球、サッカー、ゴルフ、バスケットボール等のボールを用いた球技について、ボールの軌道を追跡する技術として様々なものが知られている。例えば、特許文献1乃至5には、短時間で高速に連続撮影を可能にする高速度カメラを用い、3次元空間を移動する対象球体の位置や速度を推定する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特許第6236600号
【文献】特許第6763559号
【文献】特表2016-540185号公報
【文献】特開2019-219373号公報
【文献】特表2005-529339号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ボールの軌道を追跡する従来のシステムでは、ボールを撮像するための専用のカメラを用い、このカメラの位置を固定した上で、カメラのズーム倍率やピントの位置を固定してボールを撮像していた。しかしながら、このような従来のシステムでは、専用の位置固定のカメラが必要であり導入コストが高くなってしまうという問題があった。また、撮影の途中でカメラのズーム倍率やピントの位置を変えることができる場合は利便性をより高めることができる。
【0005】
本発明は、このような点を考慮してなされたものであり、専用の位置固定のカメラを用いることなく球形状の対象物の3次元座標を精度良く推定することができるコンピュータ、プログラム、情報処理方法およびモデル生成方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明のコンピュータは、
カメラを含む端末から送信された、前記カメラにより撮像された球形状の対象物の静止画像と、対象物を撮像した前記カメラの画角または焦点距離の情報とを受け付ける受付部と、
前記受付部が受け付けた対象物の静止画像から当該対象物を囲う長方形の四隅の座標を演算し、演算された対象物を囲う長方形の四隅の座標と、前記カメラの画角または焦点距離とから、前記カメラのレンズの焦点から対象物に向かう方向ベクトルを演算する演算部と、
前記演算部により演算された方向ベクトルに基づいて、対象物の3次元座標を推定する推定部と、
前記推定部により推定された対象物の3次元座標を出力する出力部と、
を備えたことを特徴とする。
【0007】
本発明のコンピュータにおいては、
前記推定部は、対象物を撮像した前記カメラのレンズの焦点から対象物に向かう方向ベクトルと、対象物の3次元座標とを含む教師データを用いて機械学習により得られた第1推定モデルを用いて、前記演算部により演算された方向ベクトルに基づいて対象物の3次元座標を推定してもよい。
【0008】
本発明のコンピュータは、
球形状の対象物を撮像した前記カメラのレンズの焦点から対象物に向かう方向ベクトルと、対象物の3次元座標とを含む教師データを用い、前記カメラのレンズの焦点から対象物に向かう方向ベクトルから対象物の3次元座標を推定する第1推定モデルを機械学習により生成するモデル生成部を更に備えてもよい。
【0009】
本発明のコンピュータは、
カメラを含む端末から送信された、前記カメラにより撮像された球形状の対象物の静止画像と、対象物を撮像した前記カメラの画角または焦点距離の情報とを受け付ける受付部と、
前記受付部が受け付けた対象物の静止画像から当該対象物を囲う長方形の四隅の座標を演算する演算部と、
前記演算部により演算された長方形の四隅の座標と、前記カメラの画角または焦点距離とに基づいて、対象物の3次元座標を推定する推定部と、
前記推定部により推定された対象物の3次元座標を出力する出力部と、
を備えたことを特徴とする。
【0010】
本発明のコンピュータにおいては、
前記推定部は、球形状の対象物の静止画像から取得される当該対象物を囲う長方形の四隅の座標と、対象物を撮像した前記カメラの画角または焦点距離と、対象物の3次元座標とを含む教師データを用いて機械学習により得られた第2推定モデルを用いて、前記演算部により演算された長方形の四隅の座標と、前記カメラの画角または焦点距離とに基づいて、対象物の3次元座標を推定してもよい。
【0011】
本発明のコンピュータは、
球形状の対象物の静止画像から取得される当該対象物を囲う長方形の四隅の座標と、対象物を撮像した前記カメラの画角または焦点距離と、対象物の3次元座標とを含む教師データを用い、対象物を囲う長方形の四隅の座標と、対象物を撮像した前記カメラの画角または焦点距離とから対象物の3次元座標を推定する前記第2推定モデルを機械学習により生成するモデル生成部を更に備えてもよい。
【0012】
本発明のコンピュータにおいては、
前記端末において、前記カメラにより対象物を撮像する前に前記カメラの画角または焦点距離を調整可能となっており、前記カメラにより対象物が撮像されると撮像された対象物の静止画像と調整された前記カメラの画角または焦点距離の情報とが前記端末から前記コンピュータに送信されてもよい。
【0013】
また、前記端末に撮像用アプリケーションをインストール可能となっており、前記端末において前記撮像用アプリケーションが起動されると、前記カメラにより対象物が撮像されたときに前記撮像用アプリケーションによって撮像された対象物の静止画像と対象物が撮像されたときの前記カメラの画角または焦点距離の情報とが前記端末から前記コンピュータに送信されてもよい。
【0014】
また、前記端末のモニタに表示されるブラウザにおいて前記カメラにより対象物を撮像する前に前記カメラの画角または焦点距離の情報が入力可能となっており、前記カメラにより対象物が撮像されると撮像された対象物の静止画像と前記ブラウザで入力された前記カメラの画角または焦点距離の情報とが前記端末から前記コンピュータに送信されてもよい。
【0015】
本発明のプログラムは、
コンピュータを、受付手段と、演算手段と、推定手段と、出力手段として機能させるプログラムであって、
前記受付手段は、カメラを含む端末から送信された、前記カメラにより撮像された球形状の対象物の静止画像と、対象物を撮像した前記カメラの画角または焦点距離の情報とを受け付け、
前記演算手段は、前記受付手段が受け付けた対象物の静止画像から当該対象物を囲う長方形の四隅の座標を演算し、演算された対象物を囲う長方形の四隅の座標と、前記カメラの画角または焦点距離とから、前記カメラのレンズの焦点から対象物に向かう方向ベクトルを演算し、
前記推定手段は、前記演算手段により演算された方向ベクトルに基づいて、対象物の3次元座標を推定し、
前記出力手段は、前記推定手段により推定された対象物の3次元座標を出力することを特徴とする。
【0016】
本発明のプログラムは、
コンピュータを、受付手段と、演算手段と、推定手段と、出力手段として機能させるプログラムであって、
前記受付手段は、カメラを含む端末から送信された、前記カメラにより撮像された球形状の対象物の静止画像と、対象物を撮像した前記カメラの画角または焦点距離の情報とを受け付け、
前記演算手段は、前記受付手段が受け付けた対象物の静止画像から当該対象物を囲う長方形の四隅の座標を演算し、
前記推定手段は、前記演算手段により演算された長方形の四隅の座標と、前記カメラの画角または焦点距離とに基づいて、対象物の3次元座標を推定し、
前記出力手段は、前記推定手段により推定された対象物の3次元座標を出力することを特徴とする。
【0017】
本発明の情報処理方法は、
制御部を有するコンピュータにより行われる情報処理方法であって、
前記制御部が、カメラを含む端末から送信された、前記カメラにより撮像された球形状の対象物の静止画像と、対象物を撮像した前記カメラの画角または焦点距離の情報とを受け付ける工程と、
前記制御部が、受け付けた対象物の静止画像から当該対象物を囲う長方形の四隅の座標を演算し、演算された対象物を囲う長方形の四隅の座標と、前記カメラの画角または焦点距離とから、前記カメラのレンズの焦点から対象物に向かう方向ベクトルを演算する工程と、
前記制御部が、演算された方向ベクトルに基づいて、対象物の3次元座標を推定する工程と、
前記制御部が、推定された対象物の3次元座標を出力する工程と、
を備えたことを特徴とする。
【0018】
本発明の情報処理方法は、
制御部を有するコンピュータにより行われる情報処理方法であって、
前記制御部が、カメラを含む端末から送信された、前記カメラにより撮像された球形状の対象物の静止画像と、対象物を撮像した前記カメラの画角または焦点距離の情報とを受け付ける工程と、
前記制御部が、受け付けた対象物の静止画像から当該対象物を囲う長方形の四隅の座標を演算し、
前記制御部が、演算された長方形の四隅の座標と、前記カメラの画角または焦点距離とに基づいて、対象物の3次元座標を推定する工程と、
前記制御部が、推定された対象物の3次元座標を出力する工程と、
を備えたことを特徴とする。
【0019】
本発明のモデル生成方法は、
球形状の対象物を撮像したカメラのレンズの焦点から対象物に向かう方向ベクトルと、対象物の3次元座標とを含む教師データを用い、前記カメラのレンズの焦点から対象物に向かう方向ベクトルから対象物の3次元座標を推定する第1推定モデルを機械学習により生成することを特徴とする。
【0020】
本発明のモデル生成方法は、
球形状の対象物の静止画像から取得される当該対象物を囲う長方形の四隅の座標と、対象物を撮像したカメラの画角または焦点距離と、対象物の3次元座標とを含む教師データを用い、対象物を囲う長方形の四隅の座標と、対象物を撮像した前記カメラの画角または焦点距離とから対象物の3次元座標を推定する第2推定モデルを機械学習により生成することを特徴とする。
【0021】
本発明の推定モデルは、
球形状の対象物を撮像したカメラのレンズの焦点から対象物に向かう方向ベクトルと、対象物の3次元座標とを含む教師データを用いて機械学習により得られた、前記カメラのレンズの焦点から対象物に向かう方向ベクトルを入力、対象物の3次元座標を出力としたときのパラメータを含むことを特徴とする。
【0022】
本発明の推定モデルは、
球形状の対象物の静止画像から取得される当該対象物を囲う長方形の四隅の座標と、対象物を撮像したカメラの画角または焦点距離と、対象物の3次元座標とを含む教師データを用いて機械学習により得られた、対象物を囲う長方形の四隅の座標と、対象物を撮像した前記カメラの画角または焦点距離とを入力、対象物の3次元座標を出力としたときのパラメータを含むことを特徴とする。
【発明の効果】
【0023】
本発明のコンピュータ、プログラム、情報処理方法およびモデル生成方法によれば、専用の位置固定のカメラを用いることなく球形状の対象物の3次元座標を精度良く推定することができる。
【図面の簡単な説明】
【0024】
【
図1】本発明の実施の形態によるコンピュータの構成を概略的に示す概略構成図である。
【
図2】
図1に示すコンピュータにおいて制御部がプログラムを実行することにより行われる情報処理の流れを示す図である。
【
図3】
図1に示すコンピュータによる情報処理の流れを概略的に示すフローチャートである。
【
図4】ボールを含む静止画像において当該ボールを囲うバウンディングボックスを形成する方法を説明するための説明図である。
【
図5】ボールを囲うバウンディングボックスの四隅の座標から、カメラのレンズの焦点からボールに向かう方向ベクトルを演算する方法を説明するための説明図である。
【
図6】カメラのズーム倍率を調整する前後での携帯通信端末のモニタに表示される画像を示す図である。
【発明を実施するための形態】
【0025】
以下、図面を参照して本発明の実施の形態について説明する。
図1乃至
図6は、本実施の形態に係るコンピュータ10および情報処理方法等を示す図である。本実施の形態に係るコンピュータ10は、専用の位置固定のカメラを用いることなく予め設定されている大きさの球形状の対象物(具体的には、ボール200)の3次元座標を推定するものである。
【0026】
まず、本実施の形態のコンピュータ10の構成について
図1を用いて説明する。
図1は、本実施の形態によるコンピュータ10の構成を概略的に示す概略構成図である。
図1に示すように、本実施の形態のコンピュータ10はコンピュータ等から構成されており、制御部20と、記憶部40と、通信部42と、表示部44と、操作部46とを備えている。
【0027】
制御部20は、CPU(中央演算処理装置)やGPU(画像処理装置)等で構成され、コンピュータ10の動作を制御する。具体的には、制御部20は、後述する記憶部40に記憶されているプログラムを実行することにより、教師データ受付手段22と、モデル生成手段24と、受付手段26と、演算手段28と、推定手段30と、出力手段32として機能する。
【0028】
教師データ受付手段22は、ボール200(対象物)を撮像した携帯通信端末50のカメラ52のレンズの焦点から対象物に向かう方向ベクトルと、対象物の3次元座標とを含む教師データ100を受け付ける。なお、別の態様として、教師データ受付手段22は、静止画像におけるボール200を囲うバウンディングボックスとしての長方形210(
図4参照、正方形を含む)の四隅の座標と、ボール200を撮像した携帯通信端末50のカメラ52の画角と、ボール200の3次元座標とを含む教師データ100を受け付けてもよい。
【0029】
モデル生成手段24は、ボール200を撮像した携帯通信端末50のカメラ52のレンズの焦点から対象物に向かう方向ベクトルと、対象物の3次元座標とを含む教師データ100を用い、カメラ52のレンズの焦点から対象物に向かう方向ベクトルから対象物の3次元座標を推定する推定モデル110(第1推定モデル)を機械学習により生成する。なお、モデル生成手段24は、ボール200の静止画像から取得される当該ボール200を囲う長方形210の四隅の座標と、ボール200を撮像したカメラ52の画角または焦点距離と、ボール200の3次元座標とを含む教師データ100を用い、ボール200を囲う長方形210の四隅の座標と、ボール200を撮像したカメラ52の画角または焦点距離とからボール200の3次元座標を推定する推定モデル110(第2推定モデル)を機械学習により生成してもよい。このような機械学習としては、深層学習等の既知の様々なものを用いることができる。
【0030】
受付手段26は、携帯通信端末50から送信された、ボール200の静止画像120およびボール200を撮像したカメラ52の画角または焦点距離の情報を受け付ける。受付手段26が受け付けるカメラ52の画角または焦点距離は、カメラ52のズーム倍率や解像度設定によって異なるようになっている。
【0031】
演算手段28は、ボール200の静止画像120から当該ボール200を囲う長方形210の四隅の座標を演算する。また、演算手段28は、ボール200を囲う長方形210の四隅の座標と、カメラ52の画角または焦点距離とから、カメラ52のレンズの焦点から対象物に向かう方向ベクトルを演算する。
【0032】
推定手段30は、演算手段28により演算された長方形210の四隅の座標と、カメラ52の画角または焦点距離とに基づいて、または、演算手段28により演算された方向ベクトルに基づいて、ボール200の3次元座標を推定する。この際に、推定手段30は、ボール200を撮像したカメラ52のレンズの焦点から対象物に向かう方向ベクトルと、ボール200の3次元座標とを含む教師データ100を用いて機械学習により得られた推定モデル110(第1推定モデル)を用いて、演算手段28により演算された方向ベクトルに基づいてボール200の3次元座標を推定してもよい。あるいは、推定手段30は、ボール200の静止画像から取得される当該ボール200を囲う長方形210の四隅の座標と、ボール200を撮像したカメラ52の画角または焦点距離と、ボール200の3次元座標とを含む教師データ100を用いて機械学習により得られた推定モデル110(第2推定モデル)を用いて、演算手段28により演算された長方形210の四隅の座標と、カメラ52の画角または焦点距離とに基づいてボール200の3次元座標を推定してもよい。
【0033】
出力手段32は、推定手段30により推定されたボール200の3次元座標を出力する。出力手段32により出力されたボール200の3次元座標はコンピュータ10から携帯通信端末50に送信され、この携帯通信端末50のモニタ53に表示される。
【0034】
これらの各手段22、24、26、28、30、32の機能の詳細については後述する。
【0035】
記憶部40は、例えばHDD(Hard Disk Drive)、RAM(Random Access Memory)、ROM(Read Only Memory)およびSSD(Solid State Drive)などで構成されている。また、記憶部40はコンピュータ10に内蔵されるものに限定されることはなく、コンピュータ10に着脱自在に装着可能な記憶媒体(例えば、USBメモリ)等であってもよい。本実施の形態では、記憶部40は、制御部20により実行されるプログラム、推定モデル110等をそれぞれ記憶するようになっている。
【0036】
通信部42は、無線または有線により外部装置との信号の送受信を行うための通信インターフェースを含む。通信部42により制御部20は後述する携帯通信端末50と信号の送受信を行うことができるようになる。
【0037】
表示部44は例えばモニタ等であり、制御部20から表示指令信号を受け取ることにより様々な画面を表示するようになっている。操作部46は例えばキーボード等であり、制御部20に対して様々な指令を与えることができるようになっている。なお、本実施の形態では、これらの表示部44および操作部46が一体化したタッチパネル等の表示操作部が用いられてもよい。
【0038】
次に、ボール200の撮像を行う携帯通信端末50の構成について
図1を用いて説明する。
図1に示すように、携帯通信端末50は、カメラ52と、モニタ53と、通信部54とを備えている。カメラ52はボール200の動画を撮像するようになっている。このようなカメラ52により撮像されたボール200の動画からボール200の各フレームの静止画像120が取得される。モニタ53には、カメラ52により撮像されるボール200の動画や静止画像120が表示されるようになっている。ここで、
図6に示すように、カメラ52のピントを調整することにより、モニタ53に表示される画面も変化する。通信部54は、無線または有線により外部装置との信号の送受信を行うための通信インターフェースを含む。カメラ52により撮像されたボール200の各フレームの静止画像120は通信部54によりコンピュータ10に送信されるようになっている。このような携帯通信端末50として、例えばスマートフォン、PCタブレット等を用いることができる。また、携帯通信端末50として、外部装置との通信が可能なビデオカメラ等が用いられてもよい。
【0039】
本実施の形態では、携帯通信端末50に撮像用アプリケーションをインストール可能となっている。携帯通信端末50においてインストールされた撮像用アプリケーションが起動されると、この撮像用アプリケーションによってカメラ52によりボール200が撮像可能となる。また、カメラ52によりボール200が撮像されたときに撮像用アプリケーションによって撮像されたボール200の静止画像とボール200が撮像されたときのカメラ52の画角または焦点距離の情報とが携帯通信端末50からコンピュータ10に送信される。
【0040】
また、携帯通信端末50のモニタ53に表示されるブラウザにおいてカメラ52によりボール200を撮像する際にカメラ52の画角または焦点距離の情報が入力可能となっていてもよい。カメラ52によりボール200が撮像されると撮像されたボール200の静止画像とブラウザで入力されたカメラ52の画角または焦点距離の情報とが携帯通信端末50からコンピュータ10に送信される。
【0041】
図2に示すように、本実施の形態では、記憶部40に記憶されているプログラムを制御部20が実行して教師データ受付手段22として機能することにより教師データ受付部22aが構成される。また、記憶部40に記憶されているプログラムを制御部20が実行してモデル生成手段24として機能することによりモデル生成部24aが構成される。また、記憶部40に記憶されているプログラムを制御部20が実行して受付手段26として機能することにより受付部26aが構成される。また、記憶部40に記憶されているプログラムを制御部20が実行して演算手段28として機能することにより演算部28aが構成される。また、記憶部40に記憶されているプログラムを制御部20が実行して推定手段30として機能することにより推定部30aが構成される。また、記憶部40に記憶されているプログラムを制御部20が実行して出力手段32として機能することにより出力部32aが構成される。
【0042】
次に、演算手段28(演算部28a)が、ボール200の静止画像120から当該ボール200を囲うバウンディングボックスとしての長方形210の四隅の座標を演算する方法について
図4を用いて説明する。
図4(a)は、ボール200を含む静止画像120である。記憶部40に記憶されているプログラムを制御部20が実行することにより、演算手段28は、
図4(b)に示すような静止画像120におけるボール200を囲う長方形210を生成する。このような長方形210の上辺および底辺のy座標は、それぞれ、ボール200の色の全ピクセルのうち最もy座標が小さいピクセルのy座標(y1)および最もy座標が大きいピクセルのy座標(y2)となる。また、長方形210の左辺および右辺のx座標は、ボール200の色の全ピクセルのうち最もx座標が小さいピクセルのx座標(x1)および最もx座標が大きいピクセルのx座標(x2)となる。そして、長方形210の四隅の座標は、(x1、y1)(x1、y2)(x2、y2)(x2、y1)で表されるようになる。
【0043】
また、本実施の形態では、演算手段28は、画像に写る物体を検出するAIを用いて、ボール200の静止画像120から当該ボール200を囲う長方形210の四隅の座標を演算してもよい。具体的には、ボール200の静止画像120およびこのボール200を囲う長方形210の四隅の座標を含む教師データを用い、ボール200の静止画像120を入力、ボール200を囲う長方形210の四隅の座標を出力とする推定モデルを機械学習により生成する。このような機械学習としては、深層学習等の既知の様々なものを用いることができる。そして、演算手段28は、生成された推定モデルを用いて、ボール200の静止画像120から当該ボール200を囲う長方形210の四隅の座標を演算する。
【0044】
次に、演算手段28(演算部28a)が、ボール200を囲う長方形210の四隅の座標と、カメラ52の画角(
図5において参照符号130で表示)とから、カメラ52のレンズの焦点からボール200に向かう方向ベクトル(具体的には、例えば対象物を囲った四隅の座標へ向かう方向ベクトル)を演算する方法について
図5を用いて説明する。
図5は、
図4に示す静止画像120を真上から見た図である。
図4に示す静止画像120を上方から見たときの線分を
図5では参照符号120´で示す。また、
図5では、説明のため、ボール200の3次元座標を、カメラ52のレンズの焦点を原点として、右方向をx座標の正、紙面の奥行き方向をy座標の正、上方向をz座標の正、とする。また、方向ベクトルをz=1mとなるようスケーリングする。すなわち、方向ベクトルの3次元座標上のz座標を1(単位:m)とする。
図4に示す長方形210の左辺全てのx座標がx1、右辺全てのx座標がx2となるため、
図4に示す長方形210は、
図5において座標x1と座標x2の間に存在する。
図4に示す長方形210を上方から見たときの線分を
図5では参照符号210´で示す。
【0045】
方向ベクトルをz=1mとなるようスケーリングした場合、すなわち、方向ベクトルの3次元座標上のz座標を1(単位:m)とした場合、画像の横幅(ピクセル数)をwとすると、長方形210の右辺に向かう方向ベクトルの3次元座標上のx座標は、((x2/w-0.5)×2×tan(水平画角/2))(単位:m)となる。同様に、長方形210の左辺に向かう方向ベクトルの3次元座標上のx座標は、((x1/w-0.5)×2×tan(水平画角/2))(単位:m)となる。なぜならば、カメラ52のレンズの焦点から1mの距離においた静止画像120の左右端のx座標は(±tan(画角/2))(単位:m)となるからである。なお、水平画角とは、カメラ52の水平方向のおける画角のことをいう。また、同様にして、カメラ52の視野を真横から見ることにより、長方形210の上辺に向かう方向ベクトルの3次元座標上のy座標および長方形210の下辺に向かう方向ベクトルの3次元座標上のy座標も算出することができる。具体的には、方向ベクトルの3次元座標上のz座標を1(単位:m)とした場合、画像の高さ(ピクセル数)をhとすると、長方形210の上辺に向かう方向ベクトルの3次元座標上のy座標は、((y1/h-0.5)×2×tan(垂直画角/2))(単位:m)となる。同様に、長方形210の下辺に向かう方向ベクトルの3次元座標上のx座標は、((y2/h-0.5)×2×tan(垂直画角/2))(単位:m)となる。なお、垂直画角とは、カメラ52の垂直方向のおける画角のことをいう。
【0046】
長方形210の四隅への方向ベクトルは、x方向、y方向、z方向の3成分×4つ(四隅の座標)=12個であるが、z=1(単位:m)にスケールされており、左上・左下ベクトルのx成分、右上・右下ベクトルのx成分、左上・右上ベクトルのy成分および左下・右下ベクトルのy成分は共通している。このため、教師データ100としてのカメラ52のレンズの焦点からボール200に向かう方向ベクトルの要素としては、以下の4つのデータで十分となる。
(a) (x1/w-0.5)×2×tan(水平画角/2)
(b) (x2/w-0.5)×2×tan(水平画角/2)
(c) (y1/h-0.5)×2×tan(垂直画角/2)
(d) (y2/h-0.5)×2×tan(垂直画角/2)
【0047】
また、既知の方法により、カメラ52の画角ではなくカメラ52の焦点距離と、ボール200を囲う長方形210の四隅の座標とから、カメラ52のレンズの焦点からボール200に向かう方向ベクトルを演算してもよい。ここで、カメラ52の焦点距離とは、レンズの中心点からイメージセンサ(フイルム面)までの距離のことをいう。
【0048】
次に、このようなコンピュータ10による動作について説明する。
【0049】
まずは、推定モデル110の生成方法について説明する。コンピュータ10の制御部20に対して、ボール200を撮像した携帯通信端末50のカメラ52のレンズの焦点から対象物に向かう方向ベクトルと、ボール200の3次元座標とを含む教師データ100を入力する。このような教師データ100は操作部46により入力してもよいし、外部装置から通信部42を介して教師データ100が制御部20に送信されるようになっていてもよい。コンピュータ10の制御部20に教師データ100が入力されると、教師データ受付手段22は教師データ100を受け付ける。そして、モデル生成手段24は、教師データ100を用いて機械学習を行うことにより、ボール200を撮像した携帯通信端末50のカメラ52のレンズの焦点から対象物に向かう方向ベクトルと、ボール200を撮像したカメラ52の画角または焦点距離とからボール200の3次元座標を推定する推定モデル110(第1推定モデル)を生成する。
【0050】
なお、推定モデル110の生成方法はこのような態様に限定されない。他の態様について以下に述べる。コンピュータ10の制御部20に対して、ボール200の静止画像から取得される当該ボール200を囲う長方形210の四隅の座標と、ボール200を撮像したカメラ52の画角または焦点距離と、ボール200の3次元座標とを含む教師データ100を入力する。このような教師データ100は操作部46により入力してもよいし、外部装置から通信部42を介して教師データ100が制御部20に送信されるようになっていてもよい。コンピュータ10の制御部20に教師データ100が入力されると、教師データ受付手段22は教師データ100を受け付ける。そして、モデル生成手段24は、教師データ100を用いて機械学習を行うことにより、ボール200の静止画像から取得される当該ボール200を囲う長方形210の四隅の座標と、ボール200を撮像したカメラ52の画角または焦点距離とからボール200の3次元座標を推定する推定モデル110(第2推定モデル)を生成する。
【0051】
次に、携帯通信端末50のカメラ52によりボール200を撮像したときの動作について説明する。上述したように、本実施の形態では、携帯通信端末50のカメラ52によりボール200を撮像する際に、カメラ52のズーム倍率やピントの位置を調整することにより、撮像されたボール200の動画や静止画像120を鮮明なものとすることができる。カメラ52のズーム倍率が調整されると、カメラ52の画角や焦点距離も変化する。また、
図6に示すように、カメラ52のズーム倍率を調整することにより、モニタ53に表示される画面も変化する。
【0052】
カメラ52によりボール200の動画が撮像されると、撮像されたボール200の動画からボール200の各フレームの静止画像120が取得される。ボール200の各フレームの静止画像120は携帯通信端末50からコンピュータ10に送信され、受付手段26により受け付けられる。また、携帯通信端末50からカメラ52の画角または焦点距離に関する情報がコンピュータ10に送信され、受付手段26により受け付けられる(
図3のステップS1)。なお、カメラ52の画角や焦点距離は、携帯通信端末50からコンピュータ10に送信される代わりに、操作部46によって作業者によりコンピュータ10に直接入力されるようになっていてもよい。
【0053】
次に、演算手段28は、ボール200の静止画像120から当該ボール200を囲う長方形210の四隅の座標を演算する(
図3のステップS2)。このようにして、
図4に示すような4つの座標(x1、y1)(x1、y2)(x2、y1)(x2、y2)の情報が取得される。また、演算手段28は、ボール200を囲う長方形210の四隅の座標と、カメラ52の画角または焦点距離とから、カメラ52のレンズの焦点からボール200に向かう方向ベクトルを演算する(
図3のステップS3)。
【0054】
次に、推定手段30は、演算手段28により演算された長方形210の四隅の座標と、カメラ52の画角または焦点距離とに基づいて、または、演算手段28により演算された方向ベクトルに基づいて、ボール200の3次元座標を推定する(
図3のステップS4)。そして、出力手段32は、推定されたボール200の3次元座標を出力する(
図3のステップS5)。具体的には、ボール200の各フレームの静止画像120から得られるボール200の3次元座標をつなぎ合わせることにより、ボール200の3次元における軌跡の情報が出力される。出力手段32により出力された情報は表示部44に表示されたり、通信部42によって外部装置に送信されることによりこの外部装置のモニタ(例えば、携帯通信端末50のモニタ53)に表示されたりする。
【0055】
以上のような構成からなる本実施の形態のコンピュータ10、プログラムおよび情報処理方法によれば、コンピュータ10は、カメラ52を含む端末(携帯通信端末50)から送信された、カメラ52により撮像されたボール200(球形状の対象物)の静止画像と、ボール200を撮像したカメラ52の画角または焦点距離の情報とを受け付ける受付部26aと、受付部26aが受け付けたボール200の静止画像から当該ボール200を囲う長方形210の四隅の座標を演算し、演算されたボール200を囲う長方形210の四隅の座標と、カメラ52の画角または焦点距離とから、カメラ52のレンズの焦点からボール200に向かう方向ベクトルを演算する演算部28aと、演算部28aにより演算された長方形210の四隅の座標と、カメラ52の画角または焦点距離とに基づいて、または、演算部28aにより演算された方向ベクトルに基づいて、ボール200の3次元座標を推定する推定部30aと、推定部30aにより推定されたボール200の3次元座標を出力する出力部32aとを備えている。このようなコンピュータ10、プログラムおよび情報処理方法によれば、カメラ52のピントを変えた場合でも、調整されたカメラ52のピントに応じたカメラ52の画角または焦点距離の情報が携帯通信端末50からコンピュータ10に送信され、コンピュータ10ではこのカメラ52の画角または焦点距離に基づいて、またはカメラ52のレンズの焦点からボール200に向かう方向ベクトルに基づいてボール200の3次元座標が推定される。このことにより、専用の位置固定のカメラを用いることなくボール200の3次元座標を精度良く推定することができる。より詳細には、従来のシステムでは、ボールを撮像するための専用のカメラを用い、このカメラの位置を固定した上で、ズーム倍率やピントの位置を固定してボール200を撮像していた。しかしながら、このような従来のシステムでは、専用の位置固定のカメラが必要であり導入コストが高くなってしまうという問題があった。また、撮影の途中でカメラのズーム倍率やピントの位置を変えることができる場合は利便性をより高めることができる。これに対し、本実施の形態では、スマートフォン等の携帯通信端末50に備え付けられているカメラ52を使用することができ、また、カメラ52のズーム倍率やピントの位置、解像度等を調整することができるため、このような従来のシステムの課題を解決することができる。
【0056】
また、推定部30aは、ボール200を撮像したカメラ52のレンズの焦点からボール200に向かう方向ベクトルと、ボール200の3次元座標とを含む教師データ100を用いて機械学習により得られた推定モデル110(第1推定モデル)を用いて、演算部28aにより演算された方向ベクトルに基づいてボール200の3次元座標を推定する。この場合、モデル生成部24aは、ボール200を撮像したカメラ52のレンズの焦点からボール200に向かう方向ベクトルと、ボール200の3次元座標とを含む教師データ100を用い、カメラ52のレンズの焦点からボール200に向かう方向ベクトルからボール200の3次元座標を推定する推定モデル110(第1推定モデル)を機械学習により生成する。この場合は、機械学習により得られた推定モデル110(第1推定モデル)を用いることにより、ボール200の3次元座標をより精度良く推定することができる。
【0057】
また、推定部30aは、ボール200の静止画像120から取得されるボール200を囲う長方形210の四隅の座標と、ボール200を撮像したカメラ52の画角または焦点距離と、ボール200の3次元座標とを含む教師データ100を用いて機械学習により得られた推定モデル110(第2推定モデル)を用いて、演算部28aにより演算された長方形210の四隅の座標と、カメラ52の画角または焦点距離とに基づいて、ボール200の3次元座標を推定してもよい。この場合、モデル生成部24aは、ボール200の静止画像120から取得される当該ボール200を囲う長方形210の四隅の座標と、ボール200を撮像したカメラ52の画角または焦点距離と、ボール200の3次元座標とを含む教師データ100を用い、ボール200を囲う長方形210の四隅の座標と、ボール200を撮像したカメラ52の画角または焦点距離とからボール200の3次元座標を推定する推定モデル110(第2推定モデル)を機械学習により生成する。この場合は、機械学習により得られた推定モデル110(第2推定モデル)を用いることにより、ボール200の3次元座標をより精度良く推定することができる。
【0058】
また、本実施の形態のコンピュータ10、プログラムおよび情報処理方法においては、上述したように、携帯通信端末50において、カメラ52によりボール200を撮像する前にカメラ52の画角または焦点距離を調整可能となっており、カメラ52によりボール200が撮像されると撮像されたボール200の静止画像と調整されたカメラ52の画角または焦点距離の情報とが携帯通信端末50からコンピュータ10に送信されるようになっている。
【0059】
また、本実施の形態のコンピュータ10、プログラムおよび情報処理方法においては、上述したように、携帯通信端末50に撮像用アプリケーションをインストール可能となっており、携帯通信端末50において撮像用アプリケーションが起動されると、カメラ52によりボール200が撮像されたときに撮像用アプリケーションによって撮像されたボール200の静止画像とボール200が撮像されたときのカメラ52の画角または焦点距離の情報とが携帯通信端末50からコンピュータ10に送信されるようになっている。
【0060】
また、携帯通信端末50のモニタ53に表示されるブラウザにおいてカメラ52によりボール200を撮像する前にカメラ52の画角または焦点距離の情報が入力可能となっており、カメラ52によりボール200が撮像されると撮像されたボール200の静止画像とブラウザで入力されたカメラ52の画角または焦点距離の情報とが携帯通信端末50からコンピュータ10に送信されるようになっていてもよい。
【0061】
また、本実施の形態のモデル生成方法によれば、ボール200(球形状の対象物)を撮像したカメラ52のレンズの焦点からボール200に向かう方向ベクトルと、ボール200の3次元座標とを含む教師データ100を用い、カメラ52のレンズの焦点からボール200に向かう方向ベクトルからボール200の3次元座標を推定する推定モデル110(第1推定モデル)を機械学習により生成する。このようなモデル生成方法により生成される推定モデル110を用いることにより、ボール200の静止画像120から当該ボール200の3次元座標を精度良く推定することができるようになる。
【0062】
また、本実施の形態の他のモデル生成方法によれば、ボール200(球形状の対象物)の静止画像120から取得される当該ボール200を囲う長方形210(バウンディングボックス)の四隅の座標と、ボール200を撮像したカメラ52の画角または焦点距離と、ボール200の3次元座標とを含む教師データ100を用い、カメラ52のレンズの焦点からボール200に向かう方向ベクトルからボール200の3次元座標を推定する推定モデル110(第2推定モデル)を機械学習により生成する。このようなモデル生成方法により生成される推定モデル110を用いることにより、ボール200の静止画像120から当該ボール200の3次元座標を精度良く推定することができるようになる。
【0063】
また、本実施の形態の推定モデル110(第1推定モデル)は、ボール200を撮像したカメラ52のレンズの焦点からボール200に向かう方向ベクトルと、ボール200の3次元座標とを含む教師データ100を用いて機械学習により得られた、カメラ52のレンズの焦点からボール200に向かう方向ベクトルを入力、ボール200の3次元座標を出力としたときのパラメータを含んでいる。このような推定モデル110を用いることにより、ボール200の静止画像120から当該ボール200の3次元座標を精度良く推定することができるようになる。
【0064】
また、本実施の形態の他の推定モデル110(第1推定モデル)は、ボール200の静止画像120から取得される当該ボール200を囲う長方形210の四隅の座標と、ボール200を撮像したカメラ52の画角または焦点距離と、ボール200の3次元座標とを含む教師データ100を用いて機械学習により得られた、ボール200を囲う長方形210の四隅の座標と、ボール200を撮像したカメラ52の画角または焦点距離とを入力、ボール200の3次元座標を出力としたときのパラメータを含んでいる。このような推定モデル110を用いることにより、ボール200の静止画像120から当該ボール200の3次元座標を精度良く推定することができるようになる。
【0065】
なお、本発明によるコンピュータ、プログラム、情報処理方法、モデル生成方法および推定モデル等は、上述したような態様に限定されることはなく、様々な変更を加えることができる。
【0066】
例えば、ボール200の静止画像120から当該ボール200を囲うバウンディングボックスとしての長方形210の四隅の座標を演算する方法は、上述した方法に限定されることはない。ボール200の静止画像120から当該ボール200を囲うバウンディングボックスとしての長方形210の四隅の座標を演算する方法として、上述した方法以外の様々な方法が用いられてもよい。
【0067】
また、モデル生成手段24と、受付手段26、演算手段28、推定手段30、出力手段32等とが別々のコンピュータに設けられていてもよい。
【0068】
また、演算手段28は、受付手段26が受け付けたボール200の静止画像から当該ボール200を囲う長方形210の四隅の座標を演算するが、カメラ52のレンズの焦点からボール200に向かう方向ベクトルを演算しないようになっていてもよい。また、カメラ52のレンズの焦点からボール200に向かう方向ベクトルの演算方法として、上述した方法以外の既知の方法が用いられてもよい。
【0069】
また、推定モデル110を用いてボール200の3次元座標を推定する方法は、上述した方法に限定されることはない。推定モデル110を用いてボール200の3次元座標を推定する方法として、上述した方法以外の様々な方法が用いられてもよい。
【0070】
また、本発明に係るプログラムがコンピュータ10の記憶部40に記憶され、記憶部40に記憶されているプログラムが制御部20により実行される代わりに、本発明に係るプログラムがスマートフォン等の携帯通信端末50の記憶部に記憶され、記憶部に記憶されているプログラムが携帯通信端末50の制御部(CPU等)により実行されるようになっていてもよい。
【符号の説明】
【0071】
10 コンピュータ
20 制御部
22 教師データ受付手段
24 モデル生成手段
26 受付手段
28 演算手段
30 推定手段
32 出力手段
22a 教師データ受付部
24a モデル生成部
26a 受付部
28a 演算部
30a 推定部
32a 出力部
40 記憶部
42 通信部
44 表示部
46 操作部
50 携帯通信端末
52 カメラ
53 モニタ
54 通信部
100 教師データ
110 推定モデル
120、120´ 静止画像
130 画角
200 ボール
210 長方形
【要約】
【課題】専用の位置固定のカメラを用いることなく球形状の対象物の3次元座標を精度良く推定することができるコンピュータ、プログラム、情報処理方法、モデル生成方法および推定モデルを提供する。
【解決手段】受付部26aは、カメラ52を含む端末(例えば、携帯通信端末50)から送信された、カメラ52により撮像された球形状の対象物の静止画像と、対象物を撮像したカメラ52の画角または焦点距離の情報とを受け付ける。演算部28aは、受付部26aが受け付けた対象物の静止画像から当該対象物を囲う長方形210の四隅の座標を演算し、演算された対象物を囲う長方形210の四隅の座標と、カメラ52の画角または焦点距離とから、カメラ52のレンズの焦点から対象物に向かう方向ベクトルを演算する。推定部30aは、演算部28aにより演算された方向ベクトルに基づいて、対象物の3次元座標を推定する。
【選択図】
図2