(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6192107
(24)【登録日】2017年8月18日
(45)【発行日】2017年9月6日
(54)【発明の名称】撮影動画像に指示画像を重畳することができる映像指示方法、システム、端末及びプログラム
(51)【国際特許分類】
H04N 7/15 20060101AFI20170828BHJP
H04N 21/431 20110101ALI20170828BHJP
H04N 5/232 20060101ALI20170828BHJP
【FI】
H04N7/15
H04N21/431
H04N5/232 290
【請求項の数】12
【全頁数】15
(21)【出願番号】特願2013-255496(P2013-255496)
(22)【出願日】2013年12月10日
(65)【公開番号】特開2015-115723(P2015-115723A)
(43)【公開日】2015年6月22日
【審査請求日】2016年7月7日
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100135068
【弁理士】
【氏名又は名称】早原 茂樹
(72)【発明者】
【氏名】荒井 大輔
(72)【発明者】
【氏名】大岸 智彦
(72)【発明者】
【氏名】小林 達也
(72)【発明者】
【氏名】辻 智弘
(72)【発明者】
【氏名】加藤 晴久
【審査官】
長谷川 素直
(56)【参考文献】
【文献】
特開2012−156820(JP,A)
【文献】
特開2000−231625(JP,A)
【文献】
特開2012−068885(JP,A)
【文献】
特開2012−254243(JP,A)
【文献】
特開2007−208458(JP,A)
【文献】
特開2000−165847(JP,A)
【文献】
特開2013−109773(JP,A)
【文献】
特開2012−216074(JP,A)
【文献】
特開2012−059263(JP,A)
【文献】
米国特許出願公開第2012/0299962(US,A1)
【文献】
米国特許出願公開第2004/0070674(US,A1)
【文献】
特開2007−208741(JP,A)
【文献】
特開2004−112824(JP,A)
【文献】
特開2006−048484(JP,A)
【文献】
特開2012−204991(JP,A)
【文献】
特表2010−517129(JP,A)
【文献】
倉持元陽(外2名),自然特徴点を利用した投影型デザイン支援システムの開発,映像情報メディア学会技術報告,日本,社団法人映像情報メディア学会,2011年 2月12日,Vol.35, No.8,p.49-52
(58)【調査した分野】(Int.Cl.,DB名)
H04N 7/14−7/15
H04N 21/00−21/858
H04N 5/225−5/232
G06F 3/01
G09G 5/00
(57)【特許請求の範囲】
【請求項1】
ディスプレイ及びカメラを有する第1の端末と、ディスプレイを有する第2の端末とが、ネットワークを介して接続されたシステムにおける映像指示方法において、
第1の端末が、前記カメラによる撮影動画像を逐次、第2の端末へ送信する第1のステップと、
第2の端末が、受信した前記撮影動画像を前記ディスプレイに表示し、当該撮影動画像に対する指示静止画像をユーザに書き込ませる第2のステップと、
第2の端末が、ユーザに書き込まれた指示静止画像と、当該指示静止画像を含む範囲で前記撮影動画像を静止画像としてトリミングした撮影静止画像とを、第1の端末へ送信する第3のステップと、
第1の端末が、前記カメラによって撮影された撮影動画像に、前記撮影静止画像を射影変換(透視投影変換)又は姿勢変換をさせながらマッチングさせ、一致した部分の撮影動画像に、前記撮影静止画像と同じ射影変換又は姿勢変換をさせた前記指示静止画像を重畳させて前記ディスプレイに表示する第4のステップと
を有することを特徴とする映像指示方法。
【請求項2】
第4のステップについて、
前記撮影動画像に前記撮影静止画像がマッチングした際の射影変換行列又は姿勢変換行列を算出し、
前記指示静止画像を前記射影変換行列又は姿勢変換行列によって変換した画像を、前記撮影動画像に重畳させて表示する
ことを特徴とする請求項1に記載の映像指示方法。
【請求項3】
第1のステップについて、第1の端末は、前記撮影動画像を、所定時間幅で間引いたフレームのみを、第2の端末へ送信することを特徴とする請求項1又は2のいずれか1項に記載の映像指示方法。
【請求項4】
第1のステップについて、前記撮影動画像は、動き補償フレーム間予測方式の基準となるI(Intra-picture)フレームのみを、第2の端末へ送信することを特徴とする請求項3に記載の映像指示方法。
【請求項5】
第1のステップについて、第1の端末は、前記Iフレームのデータレートを、1つのGOP(Group Of Pictures)のデータレート以下であって比較的高いレートに設定することを特徴とする請求項4に記載の映像指示方法。
【請求項6】
前記撮影静止画像は、前記マッチングのための特徴量画像、又は、低データ量のための解像度圧縮画像であり、
前記指示静止画像は、低データ量のための解像度圧縮画像である
ことを特徴とする請求項1から5のいずれか1項に記載の映像指示方法。
【請求項7】
第2の端末に搭載されたディスプレイは、タッチパネルディスプレイであって、
第2のステップについて、第2の端末は、前記タッチパネルディスプレイ上でユーザに指によって描かれた画像を指示静止画像とする
ことを特徴とする請求項1から6のいずれか1項に記載の映像指示方法。
【請求項8】
第2の端末は、前記ディスプレイに表示された撮影動画像に、ユーザによって描かせるタッチペン入力装置を更に接続しており、
第2のステップについて、第2の端末は、前記タッチペンによってユーザに描かれた画像を指示静止画像とする
ことを特徴とする請求項1から6のいずれか1項に記載の映像指示方法。
【請求項9】
第4のステップについて、第1の端末は、AR(拡張現実、Augmented Reality)のマーカレス型・物体認識方式を適用したものであることを特徴とする請求項1から8のいずれか1項に記載の映像指示方法。
【請求項10】
ディスプレイ及びカメラを有する第1の端末と、ディスプレイを有する第2の端末とが、ネットワークを介して接続された映像指示システムにおいて、
第1の端末は、
前記カメラによる撮影動画像を逐次、第2の端末へ送信する撮影動画像送信手段と、
前記カメラによって撮影された撮影動画像に、第2の端末から受信した撮影静止画像を射影変換(透視投影変換)又は姿勢変換をさせながらマッチングさせ、一致した部分の撮影動画像に、前記撮影静止画像と同じ射影変換又は姿勢変換をさせた指示静止画像を重畳させて前記ディスプレイに表示する映像表示制御手段と
を有し、
第2の端末は、
受信した撮影動画像を前記ディスプレイに表示し、当該撮影動画像に対する指示静止画像をユーザに書き込ませる指示静止画像入力手段と、
ユーザに書き込まれた指示静止画像と、当該指示静止画像を含む範囲で前記撮影動画像を静止画像としてトリミングした撮影静止画像とを、第1の端末へ送信する指示静止画像送信手段と
を有することを特徴とする映像指示システム。
【請求項11】
ディスプレイ及びカメラを搭載した端末において、
前記カメラによる撮影動画像を逐次、相手方端末へ送信する撮影動画像送信手段と、
相手方端末から受信した撮影動画像を前記ディスプレイに表示し、当該撮影動画像に対する指示静止画像をユーザに書き込ませる指示静止画像入力手段と、
ユーザに書き込まれた指示静止画像と、当該指示静止画像を含む範囲で前記撮影動画像を静止画像としてトリミングした撮影静止画像とを、相手方端末へ送信する指示静止画像送信手段と、
前記カメラによって撮影された撮影動画像に、相手方端末から受信した撮影静止画像を射影変換(透視投影変換)又は姿勢変換をさせながらマッチングさせ、一致した部分の撮影動画像に、前記撮影静止画像と同じ射影変換又は姿勢変換をさせた指示静止画像を重畳させて前記ディスプレイに表示する映像表示制御手段と
を有することを特徴とする端末。
【請求項12】
ディスプレイ及びカメラを搭載した端末に搭載されたコンピュータを機能させるプログラムにおいて、
前記カメラによる撮影動画像を逐次、相手方端末へ送信する撮影動画像送信手段と、
相手方端末から受信した撮影動画像を前記ディスプレイに表示し、当該撮影動画像に対する指示静止画像をユーザに書き込ませる指示静止画像入力手段と、
ユーザに書き込まれた指示静止画像と、当該指示静止画像を含む範囲で前記撮影動画像を静止画像としてトリミングした撮影静止画像とを、相手方端末へ送信する指示静止画像送信手段と、
前記カメラによって撮影された撮影動画像に、相手方端末から受信した撮影静止画像を射影変換(透視投影変換)又は姿勢変換をさせながらマッチングさせ、一致した部分の撮影動画像に、前記撮影静止画像と同じ射影変換又は姿勢変換をさせた指示静止画像を重畳させて前記ディスプレイに表示する映像表示制御手段と
してコンピュータを機能させることを特徴とする端末用のプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、端末間のオンラインビデオサービスの技術に関する。
【背景技術】
【0002】
近年、スマートフォンやタブレット等の端末の普及に伴って、地理的に離れた端末間で、ネットワークを介したオンラインビデオサービスが提供されている(例えば非特許文献1参照)。このサービスによれば、例えば現場作業の用途として、現場作業員が持つ端末で撮影された映像を、遠隔の作業管理者へリアルタイムに送信することができる。これに対し、作業管理者は、映像でその作業現場の状況を認識し、音声で指示することができる。
【0003】
図1は、オンラインビデオサービスのシステム構成図である。
【0004】
図1のシステムによれば、携帯電話機やスマートフォンのような端末が、撮影した映像データを、ネットワークを介してリアルタイムに他方の端末へ、ストリーミングで伝送している。近年、携帯端末のようなポータブル型機器でも、HD(High-Definition)クラスの映像を撮影することができる。
【0005】
図1によれば、端末1は、現場作業員(被指示者)によって所持され、搭載されたカメラによってその映像が撮影される。一方で、端末2は、作業管理者(指示者)によって所持される。そして、端末1は、アクセスネットワーク及びインターネットを介して、その映像データを端末2へリアルタイムに送信する。端末2は、受信した映像データをディスプレイに再生することによって、作業管理者に対し、現場作業員の状況を視認させることができる。
【0006】
しかしながら、作業管理者にとって、音声だけでは、現場作業員に対して明確に指示できない場合も多い。例えば、作業管理者としては、現場の多種多様な機器や操作部分の位置を、現場作業員へ映像で指示することできれば望ましい。
【0007】
従来、現場作業員が、自ら所持する端末によって撮影した静止画像を、作業管理者の端末へ送信し、これに対し、作業管理者が指示情報を重畳した静止画像を、現場作業員の端末へ送信する技術がある(例えば非特許文献2参照)。これによって、作業管理者は、音声以外の静止画像によって現場作業員へ指示することができる。
【0008】
また、映像上の所定位置を特定するために、拡張現実感(AR(Augmented Reality))の技術を適用することもできる(例えば非特許文献3、4参照)。映像の中からARマーカを画像認識することよって、その位置を特定する。また、ARマーカを用いることなく、多数のオブジェクト画像の中から、その映像に写るオブジェクトを検出するマーカレス型・物体認識方式を用いることもできる。
【先行技術文献】
【非特許文献】
【0009】
【非特許文献1】「Skype」、[online]、[平成25年11月13日検索]、インターネット<URL:http://www.skype.com/ja/>
【非特許文献2】構造計画研究所、「Remote Guideware」、[online]、[平成25年11月13日検索]、インターネット<http://www4.kke.co.jp/guideware/>
【非特許文献3】富士通、「ARを利用した作業支援技術」、[online]、[平成25年11月13日検索]、インターネット<http://jp.fujitsu.com/solutions/industry/nextvalue/technology/tec_ar.html>
【非特許文献4】NTT技研、「ARを用いた設備管理業務システム」、[online]、[平成25年11月13日検索]、インターネット<http://www.ntt.co.jp/journal/1302/files/jn201302042.pdf>
【非特許文献5】「カメラキャリブレーションと3次元再構成」、[online]、[平成25年12月10日検索]、インターネット<http://opencv.jp/opencv-2svn/cpp/camera_calibration_and_3d_reconstruction.html>
【非特許文献6】「3次元幾何解析」、[online]、[平成25年12月10日検索]、インターネット<http://www.ieice-hbkb.org/files/02/02gun_02hen_03.pdf>
【発明の概要】
【発明が解決しようとする課題】
【0010】
しかしながら、非特許文献2に記載の技術によれば、現場作業員の端末に搭載されたカメラを固定しておく必要がある。撮影位置が動いた場合、作業管理者から送信された静止画像と位置のずれを生じ、現場作業員にとって、密集した機器や操作部分に対して指示された位置を認識することができない場合もある。
【0011】
非特許文献3,4に記載の技術によれば、指示画像を重畳配置する映像上の位置を特定するために、特殊なパターンが印刷されたARマーカを必要とする。機器や操作部分に予めARマーカを貼り付けることは、極めて手間がかかる。
【0012】
また、マーカレス型・物体認識方式の技術によれば、予め多数のオブジェクト画像を事前登録しておく必要がある。勿論、映像に写る対象物と、オブジェクト画像との形状が類似する場合、誤ったオブジェクト画像を対応付けてしまう場合もある。
【0013】
そこで、本発明は、マーカや登録オブジェクト画像を用いることなく、一方の端末のカメラに写る映像に対して、他方の端末から画像的に指示することができる映像指示方法、システム、端末及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0014】
本発明によれば、ディスプレイ及びカメラを有する第1の端末と、ディスプレイを有する第2の端末とが、ネットワークを介して接続されたシステムにおける映像指示方法において、
第1の端末が、カメラによる撮影動画像を逐次、第2の端末へ送信する第1のステップと、
第2の端末が、受信した撮影動画像をディスプレイに表示し、当該撮影動画像に対する指示静止画像をユーザに書き込ませる第2のステップと、
第2の端末が、ユーザに書き込まれた指示静止画像と、当該指示静止画像を含
む範囲で撮影動画像を静止画像としてトリミングした撮影静止画像とを、第1の端末へ送信する第3のステップと、
第1の端末が、カメラによって撮影された撮影動画像
に、撮影静止画像
を射影変換(透視投影変換)又は姿勢変換をさせながらマッチングさせ、一致した部分の撮影動画像に
、撮影静止画像と同じ射影変換又は姿勢変換をさせた指示静止画像を重畳させてディスプレイに表示する第4のステップと
を有することを特徴とする。
【0015】
本発明の映像指示方法における他の実施形態によれば、
第4のステップについて、
撮影動画像に撮影静止画像がマッチングした際の射影変換行列又は姿勢変換行列を算出し、
指示静止画像を射影変換行列又は姿勢変換行列によって変換した画像を、撮影動画像に重畳させて表示することも好ましい。
【0016】
本発明の映像指示方法における他の実施形態によれば、
第1のステップについて、第1の端末は、撮影動画像を、所定時間幅で間引いたフレームのみを、第2の端末へ送信することも好ましい。
【0017】
本発明の映像指示方法における他の実施形態によれば、
第1のステップについて、撮影動画像は、動き補償フレーム間予測方式の基準となるI(Intra-picture)フレームのみを、第2の端末へ送信することも好ましい。
【0018】
本発明の映像指示方法における他の実施形態によれば、
第1のステップについて、第1の端末は、Iフレームのデータレートを、1つのGOP(Group Of Pictures)のデータレート以下であって比較的高いレートに設定することも好ましい。
【0019】
本発明の映像指示方法における他の実施形態によれば、
撮影静止画像は、マッチングのための特徴量画像、又は、低データ量のための解像度圧縮画像であり、
指示静止画像は、低データ量のための解像度圧縮画像である
ことも好ましい。
【0020】
本発明の映像指示方法における他の実施形態によれば、
第2の端末に搭載されたディスプレイは、タッチパネルディスプレイであって、
第2のステップについて、第2の端末は、タッチパネルディスプレイ上でユーザに指によって描かれた画像を指示静止画像とする
ことも好ましい。
【0021】
本発明の映像指示方法における他の実施形態によれば、
第2の端末は、ディスプレイに表示された撮影動画像に、ユーザによって描かせるタッチペン入力装置を更に接続しており、
第2のステップについて、第2の端末は、タッチペンによってユーザに描かれた画像を指示静止画像とする
ことも好ましい。
【0022】
本発明の映像指示方法における他の実施形態によれば、
第4のステップについて、第1の端末は、AR(拡張現実、Augmented Reality)のマーカレス型・物体認識方式を適用したものであることも好ましい。
【0023】
本発明によれば、ディスプレイ及びカメラを有する第1の端末と、ディスプレイを有する第2の端末とが、ネットワークを介して接続された映像指示システムにおいて、
第1の端末は、
カメラによる撮影動画像を逐次、第2の端末へ送信する撮影動画像送信手段と、
カメラによって撮影された撮影動画像
に、第2の端末から受信した撮影静止画像
を射影変換(透視投影変換)又は姿勢変換をさせながらマッチングさせ、一致した部分の撮影動画像に、
撮影静止画像と同じ射影変換又は姿勢変換をさせた指示静止画像を重畳させてディスプレイに表示する映像表示制御手段と
を有し、
第2の端末は、
受信した撮影動画像をディスプレイに表示し、当該撮影動画像に対する指示静止画像をユーザに書き込ませる指示静止画像入力手段と、
ユーザに書き込まれた指示静止画像と、当該指示静止画像を含
む範囲で撮影動画像を静止画像としてトリミングした撮影静止画像とを、第1の端末へ送信する指示静止画像送信手段と
を有することを特徴とする。
【0024】
本発明によれば、ディスプレイ及びカメラを搭載した端末において、
カメラによる撮影動画像を逐次、相手方端末へ送信する撮影動画像送信手段と、
相手方端末から受信した撮影動画像をディスプレイに表示し、当該撮影動画像に対する指示静止画像をユーザに書き込ませる指示静止画像入力手段と、
ユーザに書き込まれた指示静止画像と、当該指示静止画像を含
む範囲で撮影動画像を静止画像としてトリミングした撮影静止画像とを、相手方端末へ送信する指示静止画像送信手段と、
カメラによって撮影された撮影動画像
に、相手方端末から受信した撮影静止画像
を射影変換(透視投影変換)又は姿勢変換をさせながらマッチングさせ、一致した部分の撮影動画像に、
撮影静止画像と同じ射影変換又は姿勢変換をさせた指示静止画像を重畳させてディスプレイに表示する映像表示制御手段と
を有することを特徴とする。
【0025】
本発明によれば、ディスプレイ及びカメラを搭載した端末に搭載されたコンピュータを機能させるプログラムにおいて、
カメラによる撮影動画像を逐次、相手方端末へ送信する撮影動画像送信手段と、
相手方端末から受信した撮影動画像をディスプレイに表示し、当該撮影動画像に対する指示静止画像をユーザに書き込ませる指示静止画像入力手段と、
ユーザに書き込まれた指示静止画像と、当該指示静止画像を含
む範囲で撮影動画像を静止画像としてトリミングした撮影静止画像とを、相手方端末へ送信する指示静止画像送信手段と、
カメラによって撮影された撮影動画像
に、相手方端末から受信した撮影静止画像
を射影変換(透視投影変換)又は姿勢変換をさせながらマッチングさせ、一致した部分の撮影動画像に、
撮影静止画像と同じ射影変換又は姿勢変換をさせた指示静止画像を重畳させてディスプレイに表示する映像表示制御手段と
してコンピュータを機能させることを特徴とする。
【発明の効果】
【0026】
本発明の映像指示方法、システム、端末及びプログラムによれば、マーカや登録オブジェクト画像を用いることなく、一方の端末のカメラに写る映像に対して、他方の端末から画像的な指示をすることができる。
【図面の簡単な説明】
【0027】
【
図1】オンラインビデオサービスのシステム構成図である。
【
図3】本発明における撮影動画像のフレームを表す説明図である。
【
図4】第1の端末によって撮影された映像を、第2の端末のディスプレイに表示した画面図である。
【
図5】指示者が第2の端末に指示を書き込んでいる画面図である。
【
図6】指示静止画像及び撮影静止画像を表す説明図である。
【
図7】撮影静止画像の部分に指示静止画像が重畳して表示された第1の端末の画面図である。
【
図8】
図7について撮影対象物に対する撮影位置が平行回転移動した場合における第1の端末の画面図である。
【
図9】
図7について撮影対象物に対する撮影位置が射影移動した場合における第1の端末の画面図である
【
図10】第1の端末及び第2の端末の機能構成図である。
【
図11】送信側及び受信側の両方の機能を搭載した両用端末の機能構成図である。
【発明を実施するための形態】
【0028】
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
【0029】
本発明によれば、ARのマーカレス型・物体認識方式の適用について、マッチングのキーとなる「撮影静止画像」(所定範囲)を自動的に設定するものである。
【0030】
図2は、本発明におけるシーケンス図である。
【0031】
図2によれば、ディスプレイ及びカメラを有する端末1(被指示側端末)と、少なくともディスプレイを有する端末2(指示側端末)とが、ネットワークを介して接続されている。ディスプレイやカメラは、当該端末に予め搭載されたものであってもよいし、外部に接続されたものであってもよい。
【0032】
[第1のステップS1]端末1が、カメラによる撮影動画像を逐次、端末2へ送信する。例えば作業現場員(被指示者)によって操作される端末1は、作業状況(対象物)を、動画像(ビデオ)として撮影する。ここで、「撮影動画像」としては、所定時間幅で間引いたフレームのみを送信することが好ましい。言い換えれば、動画像を「パラパラ画像」とすることによって、端末2を操作する指示者にとって、撮影動画像を認識しやすくする。
【0033】
図3は、本発明における撮影動画像のフレームを表す説明図である。
【0034】
図3(a)によれば、例えばMotion JPEGの場合であって、撮影動画像は、全ての各フレームがJPEG圧縮されたものであり、単に所定時間幅でフレームを間引いたものである。
【0035】
図3(b)によれば、例えば動き補償フレーム間予測方式の場合であって、複数のフレームがGOP(Group Of Pictures)単位で構成されている。GOPは、一般に、1つのI(Intra-picture)フレームと、複数のP(Predictive-picture)フレーム及びB(Bidirectionally-picture)フレームとから構成される。そして、本発明によれば、撮影動画像として、I(Intra-picture)フレームのみが抽出される。即ち、画像全体が符号化されたフレームのみを、パラパラ画像として送信する。
【0036】
また、Iフレームのデータレートを、1つのGOPのデータレート以下であって比較的高いレートに設定することも好ましい。例えばIフレーム1枚のデータレートと、GOPのデータレートとを同一にすることもできる。これによって、撮影動画像におけるパラパラ画像1枚の解像度を高くし、端末2を操作する指示者に対して、撮影動画像を細部に渡って認識しやすくすることができる。
【0037】
[第2のステップS2]端末2は、受信した撮影動画像をディスプレイに表示し、当該撮影動画像に対する「指示静止画像」をユーザに書き込ませる。
【0038】
図4は、第1の端末によって撮影された映像を、第2の端末のディスプレイに表示した画面図である。
【0039】
図4によれば、作業管理者(指示者)が所持する端末2には、作業現場員(被指示者)の操作する端末1によって撮影された現場状況が、動画像(パラパラ画像)として表示される。また、端末2のディスプレイの右上に、「指示書込」用ボタンが明示されている。指示者は、撮影動画像がパラパラ画像として逐次進行していく途中で、「指示書込」用ボタンを押下することによって1枚の画像を対象として、停止させることができる。
【0040】
図5は、指示者が第2の端末に指示を書き込んでいる画面図である。
【0041】
図5によれば、端末2に搭載されたディスプレイが、タッチパネルディスプレイである。そのために、端末2は、タッチパネルディスプレイ上でユーザに指によって描かれた画像を指示静止画像とすることができる。ここでは、ユーザは、キーボードのキー[R]の部分を差して、「←ココ」と描いている。
【0042】
また、他の実施形態として、端末2は、ディスプレイに表示された撮影動画像に、ユーザによって描かせるタッチペン入力装置を更に接続しているものであってもよい。この場合、端末2は、タッチペンによってユーザに描かれた画像を指示静止画像とすることができる。
【0043】
[第3のステップS3]端末2は、以下の2つの静止画像を抽出し、端末1へ送信する。
「指示静止画像」:ユーザに書き込まれた静止画像
「撮影静止画像」:当該指示静止画像を含む「所定範囲」で撮影動画像を静止画像としてトリミングした静止画像
【0044】
図6は、指示静止画像及び撮影静止画像を表す説明図である。
【0045】
(S31)撮影静止画像の「所定範囲」は、指示静止画像を含むように、自動的に、例えば矩形状の所定範囲に設定される。
【0046】
「撮影静止画像」は、後述するように、画像マッチングの「キー画像」として用いられるものである。そのために、撮影静止画像は、画像そのものである必要はなく、マッチングのための特徴量画像であってもよい。特徴量画像とは、画像の局所領域から算出された特徴量であって、例えば画像内のエッジやコーナー等の局所領域から抽出される。代表的には例えばSIFT(Scale-Invariant Feature Transform)やSURF(Speeded Up Robust Features)が用いられる。その他、計算コストに優れるバイナリ特徴量を用いることもできる。また、SSD(Sum of Squared Difference)や、正規化相互相関(NCC)でマッチングを行うための、局所的な切り出し画像(パッチ)であってもよい。
【0047】
更に、「撮影静止画像」及び「指示静止画像」は、低データ量のための解像度圧縮画像であってもよい。これら画像は、bitmap形式の画像である必要はなく、例えばJPEGのような圧縮画像であってもよい。
【0048】
(S32)
図5によれば、端末2のディスプレイの右上に、「指示送信」用ボタンが明示されている。ユーザは、指示静止画像を書き込んだ後、「指示送信」用ボタンを押下することによって、「指示静止画像」及び「撮影静止画像」が被指示側端末1へ送信される。
【0049】
[第4のステップS4]端末1は、カメラによって撮影された「撮影動画像」(撮影プレビュー映像)と、端末2から受信した「撮影静止画像」とをマッチングさせる。撮影動画像は常に動いているものであるので、撮影静止画像とのマッチングの追従処理は常に実行されている。そして、一致した部分の撮影動画像に「指示静止画像」を重畳させてディスプレイに表示する。具体的には、ARのマーカレス型・物体認識方式を適用したものである。
【0050】
図6によれば、「撮影静止画像」を射影変換(透視投影変換)又は姿勢変換させながら撮影動画像にマッチングさせている(例えば特許文献5及び6参照)。マッチングした際に、その「射影変換行列」又は「姿勢変換行列」を算出する。そして、指示静止画像をその射影変換行列又は姿勢変換行列によって変換した画像を、撮影動画像に重畳させる。
【0051】
「射影変換」とは、平行回転移動に、平面の遠近感を表現する射影を更に加えたものである。例えば以下のような行列式によって表される。
【数1】
x,y:撮影静止画像におけるx座標及びy座標
x',y':マッチング先のx座標及びy座標
h
11〜h
33:パラメータ
【0052】
「姿勢変換」とは、三次元空間内の剛体運動として表すものであって、6自由度の姿勢行列で表現する。ここで「姿勢行列」とは、3次元特殊ユークリッド群SE(3)に属し、3自由度の3次元回転行列と3次元並進ベクトルとで表される。例えば以下のような行列式によって表される。
【数2】
A:カメラの内部パラメータ
予めカメラキャリブレーションによって導出しておくことが望ましい。
しかしながら、実際の値とずれた場合であっても、最終的に姿勢行列と打ち消
し合うために、重畳表示の位置には影響しない。そのため、本発明の利用用途
の場合、一般的なカメラの値で代用することができる。
R(r11〜r33):3次元空間内の回転を表すパラメータ
各パラメータは、オイラー角の表現によって3パラメータで表現可能である。
t(t1〜t3):3次元空間内の平行移動を表すパラメータ。
x,y:撮影静止画像におけるx座標及びy座標
x',y':マッチング先のx座標及びy座標
【0053】
図7は、撮影静止画像の部分に指示静止画像が重畳して表示された第1の端末の画面図である。
図7によれば、撮影動画像に対して、矩形状の「撮影静止画像」と一致する部分が検出でき、その部分に「指示静止画像」を重畳して表示している。
【0054】
図8は、
図7について撮影対象物に対する撮影位置が平行回転移動した場合における第1の端末の画面図である。
図8によれば、撮影動画像が平行回転移動した場合であっても、マッチングの追従処理は常に実行されている。そのために、撮影動画像に対して、矩形状の「撮影静止画像」と一致する部分が検出できれば、その部分に「指示静止画像」を重畳して表示することができる。
【0055】
図9は、
図7について撮影対象物に対する撮影位置が射影移動した場合における第1の端末の画面図である。
図9によれば、射影変換を用いることによって、撮影対象物に対する撮影位置に追従して、指示静止画像が重畳的に表示される。
【0056】
図10は、第1の端末及び第2の端末の機能構成図である。
【0057】
被指示側端末としての端末1は、ネットワークに接続すると共に、ディスプレイ13及びカメラ14とを有する。また、端末1は、撮影動画像送信部11と、映像表示制御部12とを有する。これら機能構成部は、端末1に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。
撮影動画像送信部11は、カメラ14による撮影動画像を逐次、相手方端末2へ送信する(
図2のS1と同様)。
映像表示制御部12は、カメラ14によって撮影された撮影動画像と、相手方端末2から受信した撮影静止画像とをマッチングさせる。そして、一致した部分の撮影動画像に、相手方端末2から受信した指示静止画像を重畳させてディスプレイ13に表示する(
図2のS4と同様)。
【0058】
指示側端末としての端末2は、ネットワークに接続すると共に、タッチパネルディスプレイ23を有する。また、端末2は、指示静止画像入力部21と、指示静止画像送信部22とを有する。これら機能構成部は、端末2に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。
指示静止画像入力部21は、受信した撮影動画像をタッチパネルディスプレイ23に表示し、当該撮影動画像に対する指示静止画像をユーザに書き込ませる(
図2のS2と同様)。
指示静止画像送信部22は、ユーザに書き込まれた指示静止画像と、当該指示静止画像を含む所定範囲で撮影動画像を静止画像としてトリミングした撮影静止画像とを、相手方端末1へ送信する(
図2のS31及びS32と同様)。
【0059】
図11は、送信側及び受信側の両方の機能を搭載した両用端末の機能構成図である。
【0060】
図11によれば、両用端末3における各機能構成部は、
図9における被指示側端末1及び指示側端末2の機能構成部と全く同様のものである。また、これら機能構成部は、端末3に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。
【0061】
以上、詳細に説明したように、本発明の映像指示方法、システム、端末及びプログラムによれば、マーカや登録オブジェクト画像を用いることなく、一方の端末のカメラに写る映像に対して、他方の端末から画像的な指示をすることができる。
【0062】
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
【符号の説明】
【0063】
1 被指示側端末
11 撮影動画像送信部
12 映像表示制御部
13 ディスプレイ
14 カメラ
2 指示側端末
21 指示静止画像入力部
22 指示静止画像送信部
23 タッチパネルディスプレイ
3 両用端末