IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ KDDI株式会社の特許一覧

特許7163257移動可能な画像生成元の画像を用いて多視点画像を生成する方法、装置及びプログラム
<>
  • 特許-移動可能な画像生成元の画像を用いて多視点画像を生成する方法、装置及びプログラム 図1
  • 特許-移動可能な画像生成元の画像を用いて多視点画像を生成する方法、装置及びプログラム 図2
  • 特許-移動可能な画像生成元の画像を用いて多視点画像を生成する方法、装置及びプログラム 図3
  • 特許-移動可能な画像生成元の画像を用いて多視点画像を生成する方法、装置及びプログラム 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-10-21
(45)【発行日】2022-10-31
(54)【発明の名称】移動可能な画像生成元の画像を用いて多視点画像を生成する方法、装置及びプログラム
(51)【国際特許分類】
   G06T 1/00 20060101AFI20221024BHJP
   H04N 7/18 20060101ALI20221024BHJP
【FI】
G06T1/00 330A
H04N7/18 U
【請求項の数】 9
(21)【出願番号】P 2019156889
(22)【出願日】2019-08-29
(65)【公開番号】P2021033934
(43)【公開日】2021-03-01
【審査請求日】2021-06-17
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100135068
【弁理士】
【氏名又は名称】早原 茂樹
(74)【代理人】
【識別番号】100141313
【弁理士】
【氏名又は名称】辰巳 富彦
(72)【発明者】
【氏名】田坂 和之
(72)【発明者】
【氏名】菅野 勝
【審査官】村松 貴士
(56)【参考文献】
【文献】特開2008-122286(JP,A)
【文献】国際公開第2013/094406(WO,A1)
【文献】特開2008-140297(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00
H04N 7/18
(57)【特許請求の範囲】
【請求項1】
複数の画像生成元で生成された、所定対象を含む生成元画像から、多視点画像を生成する多視点画像生成装置であって、
前記複数の画像生成元のうち少なくとも1つは移動可能な画像生成元であってその位置に係る情報が決定可能となっており、前記多視点画像生成装置は、
当該移動可能な画像生成元を含む当該画像生成元の各々における当該所定対象に対する位置に係る情報に基づいて、当該所定対象に対して互いに異なる複数の視点となり得るような複数の位置若しくは位置範囲であって、当該所定の対象を原点とした方位角が互いに所定条件を満たすまでに離隔又は離散することになる複数の位置若しくは位置範囲に存在する複数の画像生成元を選定する画像生成元選定手段と、
選定された当該画像生成元より取得された当該生成元画像から、当該所定対象を含む多視点画像を生成する多視点画像生成手段
を有することを特徴とする多視点画像生成装置
【請求項2】
前記画像生成元選定手段は、当該方位角が互いに所定条件を満たすまでに離散することになる所定の数の画像生成元を選定することを特徴とする請求項1に記載の多視点画像生成装置。
【請求項3】
記画像生成元選定手段は、当該移動可能な画像生成元を含む当該画像生成元の各々における画像生成の際の視線向きに係る情報にも基づいて、当該画像生成元を選定することを特徴とする請求項1又は2に記載の多視点画像生成装置
【請求項4】
記画像生成元選定手段は、当該移動可能な画像生成元を含む当該画像生成元の各々における当該所定対象に対する1つの時点又は時間範囲での位置に係る情報に基づいて、当該画像生成元を選定し、
前記多視点画像生成手段は、選定された当該画像生成元から取得された前記1つの時点又は時間範囲での生成元画像を含む当該生成元画像から、当該多視点画像を生成する
ことを特徴とする請求項1から3のいずれか1項に記載の多視点画像生成装置
【請求項5】
該画像生成元の各々における当該所定対象に対する位置に係る情報、当該画像生成元の各々で生成された生成元画像における当該所定対象の画像内での位置に基づいて決定する位置情報取得手段を更に有することを特徴とする請求項1からのいずれか1項に記載の多視点画像生成装置
【請求項6】
少なくとも1つの移動体に、画像生成の際の視線向きが互いに異なっている複数の移動可能な画像生成元が設けられており、
記画像生成元選定手段は、前記複数の移動可能な画像生成元を含む当該画像生成元の各々における当該視線向きに係る情報にも基づいて、当該画像生成元を選定する
ことを特徴とする請求項1からのいずれか1項に記載の多視点画像生成装置
【請求項7】
当該移動体は通行エリアを進行する移動手段であって、当該所定対象は当該通行エリア内又はその近傍に存在する対象であり、当該移動体に設けられた当該画像生成元は、進行向きの状況を撮影可能なカメラ、及び反進行向きの状況を撮影可能なカメラを少なくとも含み、
記画像生成元選定手段は、当該移動体から画像生成元であるカメラを選定する場合において、当該移動体が当該所定対象に近づくように当該通行エリアを進行する際、前記進行向きの状況を撮影可能なカメラを選定し、当該移動体が当該所定対象から遠ざかるように当該通行エリアを進行する際、前記反進行向きの状況を撮影可能なカメラを選定する
ことを特徴とする請求項に記載の多視点画像生成装置
【請求項8】
複数の画像生成元で生成された、所定対象を含む生成元画像から、多視点画像を生成するコンピュータによって実施される多視点画像生成方法であって、
前記複数の画像生成元のうち少なくとも1つは移動可能な画像生成元であってその位置に係る情報が決定可能となっており、前記多視点画像生成方法は、
当該移動可能な画像生成元を含む当該画像生成元の各々における当該所定対象に対する位置に係る情報に基づいて、当該所定対象に対して互いに異なる複数の視点となり得るような複数の位置若しくは位置範囲であって、当該所定の対象を原点とした方位角が互いに所定条件を満たすまでに離隔又は離散することになる複数の位置若しくは位置範囲に存在する複数の画像生成元を選定するステップと、
選定された当該画像生成元より取得された当該生成元画像から、当該所定対象を含む多視点画像を生成するステップ
を有することを特徴とする多視点画像生成方法
【請求項9】
複数の画像生成元で生成された、所定対象を含む生成元画像から、多視点画像を生成するコンピュータを機能させるプログラムであって、
前記複数の画像生成元のうち少なくとも1つは移動可能な画像生成元であってその位置に係る情報が決定可能となっており、前記プログラムは、
当該移動可能な画像生成元を含む当該画像生成元の各々における当該所定対象に対する位置に係る情報に基づいて、当該所定対象に対して互いに異なる複数の視点となり得るような複数の位置若しくは位置範囲であって、当該所定の対象を原点とした方位角が互いに所定条件を満たすまでに離隔又は離散することになる複数の位置若しくは位置範囲に存在する複数の画像生成元を選定する画像生成元選定手段と、
選定された当該画像生成元より取得された当該生成元画像から、当該所定対象を含む多視点画像を生成する多視点画像生成手段と
してコンピュータを機能させることを特徴とする多視点画像生成プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数の画像生成元からの画像を用いて多視点画像を生成する技術に関する。
【背景技術】
【0002】
現在、街中に設置された監視カメラや、スタジアムのような施設内に設置されたイベント撮影用のカメラ等の普及に伴い、複数の設置カメラで撮影された映像データを取り扱い、そこから新たな映像を生成する技術が注目されている。例えば、複数の映像データから多視点映像を生成し、さらにこの多視点映像から、高い臨場感を提供可能なメディアとして注目されている自由視点映像を生成して配信する技術の開発が盛んに進められている。
【0003】
このような映像技術の例として、特許文献1には、2次元画像(参照画像)を、フレーム毎に予め作成しておいた背景マスクと照合して背景領域を抽出し、これにより自由視点映像を生成する技術が開示されている。この技術では、背景マスクをJBIGによって圧縮した上で奥行データに加えて伝送することによって、自由視点映像における必要なデータ伝送量の低減を図っている。
【0004】
また、例えば特許文献2には、複数対象の撮影された多視点のカメラ画像における各カメラ画像から、対象を包含する1つ以上の画像領域を抽出し、各カメラ画像において抽出された1つ以上の画像領域が複数対象のいずれに該当するかを、カメラ画像間での対象の対応関係と共に決定し、決定された対応関係で結ばれる各カメラ画像における、抽出された画像領域に基づいて、対応関係にある対象を包含する空間領域を抽出する技術が開示されている。
【0005】
この特許文献2では、上述したような処理によって、複数対象が撮影された多視点カメラ画像において対象のオクルージョンが発生するような場合であっても、ビジュアルハル生成及びこれに基づく自由視点映像生成に好適となる個別対象の空間領域を抽出することができるとしている。
【0006】
さらに、例えば特許文献3には、撮影領域を含む施設内における表示端末の位置情報に基づいて定まる仮想視点情報であって仮想視点の位置に関する情報を含む仮想視点情報を判定し、判定された仮想視点情報に応じた自由視点画像を前記表示端末へ送信する技術が開示されている。この技術では、ユーザが配信された映像と実空間との関係をより容易に認識できるような映像を配信することを目的としているのである。
【先行技術文献】
【特許文献】
【0007】
【文献】特開2006-302011号公報
【文献】特開2018-125642号公報
【文献】特開2019-012533号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
以上説明した特許文献1~3に記載された技術を含む従来技術では、いずれにしても、多視点映像(自由視点映像)を生成するため、撮影対象の周囲に設置された複数のカメラを使用し、これらのカメラによる撮影によって生成された映像(画像)データを収集して加工することを基本としている。
【0009】
これに対し現在、自動車、ロボットやドローン等の移動体に搭載されたカメラで生成された映像(画像)データを利用して種々の情報を形成し、様々なサービスを提供する技術の開発が盛んに進められている。このような状況の下、本願発明者等は、上述したような移動体に搭載されたカメラの映像(画像)データを利用して多視点映像や自由視点映像を生成できないかと考えた。
【0010】
例えば従来、道路の交差点や中央分離帯といった所定の地点、さらには事故現場等についての自由視点映像を生成することは、映像構成に好適な位置に複数のカメラが予め都合よく存在していない限り、非常に困難であった。しかしながら、例えば車載カメラを上手く利用すれば、そのような従来取得困難であった自由視点映像も生成可能となると考えたのである。
【0011】
そこで、本発明は、車載カメラ等の移動し得る画像生成元を利用して、多視点画像を生成することを可能にする多視点画像生成方法、装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0012】
本発明によれば、複数の画像生成元で生成された、所定対象を含む生成元画像から、多視点画像を生成する多視点画像生成装置であって、
複数の画像生成元のうち少なくとも1つは移動可能な画像生成元であってその位置に係る情報が決定可能となっており、本多視点画像生成装置は、
当該移動可能な画像生成元を含む当該画像生成元の各々における当該所定対象に対する位置に係る情報に基づいて、当該所定対象に対して互いに異なる複数の視点となり得るような複数の位置若しくは位置範囲であって、当該所定の対象を原点とした方位角が互いに所定条件を満たすまでに離隔又は離散することになる複数の位置若しくは位置範囲に存在する複数の画像生成元を選定する画像生成元選定手段と、
選定された当該画像生成元より取得された当該生成元画像から、当該所定対象を含む多視点画像を生成する多視点画像生成手段
を有することを特徴とする多視点画像生成装置が提供される。この本発明による多視点画像生成装置において、画像生成元選定手段は、当該方位角が互いに所定条件を満たすまでに離散することになる所定の数の画像生成元を選定することも好ましい。
【0013】
また、この本発明による多視点画像生成装置における画像生成元選定手段は、当該移動可能な画像生成元を含む当該画像生成元の各々における画像生成の際の視線向きに係る情報にも基づいて、当該画像生成元を選定することも好ましい。
【0014】
さらに、この画像生成元選定手段は、当該移動可能な画像生成元を含む当該画像生成元の各々における当該所定対象に対する1つの時点又は時間範囲での位置に係る情報に基づいて、当該画像生成元を選定し、
視点画像生成手段は、選定された当該画像生成元から取得された、上記の1つの時点又は時間範囲での生成元画像を含む当該生成元画像から、当該多視点画像を生成することも好ましい。
【0015】
また、本発明による多視点画像生成装置は、一実施形態として、当該画像生成元の各々における当該所定対象に対する位置に係る情報、当該画像生成元の各々で生成された生成元画像における当該所定対象の画像内での位置に基づいて決定する位置情報取得手段を更に有することも好ましい。
【0016】
さらに、本発明による多視点画像生成装置の他の実施形態として、少なくとも1つの移動体に、画像生成の際の視線向きが互いに異なっている複数の移動可能な画像生成元が設けられており、
像生成元選定手段は、複数の移動可能な画像生成元を含む当該画像生成元の各々における当該視線向きに係る情報にも基づいて、当該画像生成元を選定することも好ましい。
【0017】
また、この(複数の画像生成元を備えた移動体に係る)実施形態において、当該移動体は通行エリアを進行する移動手段であって、当該所定対象は当該通行エリア内又はその近傍に存在する対象であり、当該移動体に設けられた当該画像生成元は、進行向きの状況を撮影可能なカメラ、及び反進行向きの状況を撮影可能なカメラを少なくとも含み、
像生成元選定手段は、当該移動体から画像生成元であるカメラを選定する場合において、当該移動体が当該所定対象に近づくように当該通行エリアを進行する際、進行向きの状況を撮影可能なカメラを選定し、当該移動体が当該所定対象から遠ざかるように当該通行エリアを進行する際、反進行向きの状況を撮影可能なカメラを選定することも好ましい。
【0018】
本発明によれば、また、複数の画像生成元で生成された、所定対象を含む生成元画像から、多視点画像を生成するコンピュータによって実施される多視点画像生成方法であって、
複数の画像生成元のうち少なくとも1つは移動可能な画像生成元であってその位置に係る情報が決定可能となっており、本多視点画像生成方法は、
当該移動可能な画像生成元を含む当該画像生成元の各々における当該所定対象に対する位置に係る情報に基づいて、当該所定対象に対して互いに異なる複数の視点となり得るような複数の位置若しくは位置範囲であって、当該所定の対象を原点とした方位角が互いに所定条件を満たすまでに離隔又は離散することになる複数の位置若しくは位置範囲に存在する複数の画像生成元を選定するステップと、
選定された当該画像生成元より取得された当該生成元画像から、当該所定対象を含む多視点画像を生成するステップ
を有することを特徴とする多視点画像生成方法が提供される。
【0020】
本発明によれば、さらに、複数の画像生成元で生成された、所定対象を含む生成元画像から、多視点画像を生成するコンピュータを機能させるプログラムであって、
複数の画像生成元のうち少なくとも1つは移動可能な画像生成元であってその位置に係る情報が決定可能となっており、本プログラムは、
当該移動可能な画像生成元を含む当該画像生成元の各々における当該所定対象に対する位置に係る情報に基づいて、当該所定対象に対して互いに異なる複数の視点となり得るような複数の位置若しくは位置範囲であって、当該所定の対象を原点とした方位角が互いに所定条件を満たすまでに離隔又は離散することになる複数の位置若しくは位置範囲に存在する複数の画像生成元を選定する画像生成元選定手段と、
選定された当該画像生成元より取得された当該生成元画像から、当該所定対象を含む多視点画像を生成する多視点画像生成手段と
してコンピュータを機能させることを特徴とする多視点画像生成プログラムが提供される。
【発明の効果】
【0021】
本発明の多視点画像生成方法、装置及びプログラムによれば、車載カメラ等の移動し得る画像生成元を利用して、多視点画像を生成することができる。
【図面の簡単な説明】
【0022】
図1】本発明に係る多視点画像生成システムの一実施形態を説明するための模式図及び機能ブロック図である。
図2】クラウドサーバ(画像生成元選定部)における本発明に係る画像生成元選定処理の具体例を説明するための模式図である。
図3】クラウドサーバにおける多視点画像生成処理及び自由視点画像生成処理の具体例を説明するための模式図である。
図4】本発明による多視点画像生成方法における一実施形態の概略を示すシーケンス図である。
【発明を実施するための形態】
【0023】
以下、本発明の実施形態について、図面を用いて詳細に説明する。
【0024】
[多視点画像生成システム]
図1は、本発明に係る多視点画像生成システムの一実施形態を説明するための模式図及び機能ブロック図である。
【0025】
図1に示した本実施形態の多視点映像生成システムは、
(a)移動可能なクライアントである複数の端末20A~20D(以後、総称して「端末20」とする場合もあることに留意)と、
(b)これらの端末20から画像データを取得可能なサーバであるクラウドサーバ1と
を有し、クラウドサーバ1において、複数の端末20より取得された画像データから、多視点画像(映像)が生成可能となっており、さらに生成された多視点画像(映像)から自由視点映像が生成可能となっている。
【0026】
ここで、上記(a)の端末20は本実施形態において、通信機能を有するドライブレコーダであり自動車2に設置されている。このドライブレコーダ(端末20)は、
(a1)自動車2の車両前方を撮影可能な前方カメラ203a、及び
(a2)自動車2の車両後方を撮影可能な後方カメラ203b
と接続されており、又はこれらのカメラ203a及び203b(以後、総称して「カメラ203」とする場合もあることに留意)を備えており、これらのカメラ203によって自動車2の進行向き及び反進行向きの状況を常時撮影して画像(映像)データを生成し、さらに、自身に設けられたメモリやストレージに保存することが可能となっている。
【0027】
また、各端末20は、例えば携帯電話通信網やインターネット等を介してクラウドサーバ1と無線通信接続が可能となっており、保存した画像(映像)データの一部を、自発的に又は送信要求に応じ、クラウドサーバ1へ送信することができる。
【0028】
さらに、各端末20は本実施形態において測位部202を有し、自らの位置情報(例えば自らの所在位置の緯度及び経度並びに測位時刻)を取得してクラウドサーバ1へ通知することも可能となっている。また変更態様として、各端末20は、自動車2における測位情報を取得可能なCAN(Controller Area Network)と無線又は有線で接続されていて、このCANから、自動車2の位置情報を取得してクラウドサーバ1へ通知してもよい。ここでクラウドサーバ1にとって、端末20や自動車2の位置情報は、自動車2に係る端末20に搭載された又は接続されたカメラ203(画像生成元)の位置情報でもあると解釈することができる。
【0029】
一方、上記(b)のクラウドサーバ1は、複数の自動車2に搭載された複数のカメラ203(画像生成元)で生成された、所定対象を含むカメラ画像(生成元画像)から多視点画像(映像)を生成するが、具体的には、
(A)複数のカメラ203の各々における「所定対象に対する位置に係る情報」に基づいて、所定対象に対して互いに異なる複数の視点となり得るような複数の位置若しくは位置範囲に存在する複数のカメラ203を選定する画像生成元選定部112と、
(B)選定されたカメラ203より取得されたカメラ画像(生成元画像)から、所定対象を含む多視点画像を生成する多視点画像生成部113と
を有することを特徴としている。
【0030】
ここで上記(A)の「所定対象に対する位置に係る情報」は、例えば、所定対象の位置を原点とした実空間座標系を設定した場合における、カメラ203(端末20)の位置座標値であってもよく、又は原点(所定対象)からの距離値及び方位(角)値とすることもできる。また、このような実空間座標系での相対位置の代わりに、画像内座標系での相対位置(座標値)を採用してもよい。
【0031】
いずれにしてもクラウドサーバ1は、所定対象に対して互いに異なる複数の視点からの画像データが生成可能な複数のカメラ203(画像生成元)を、その位置に係る情報に基づいて選定可能となっており、その結果、移動し得る画像生成元を利用して所定対象を含む多視点画像を生成することができるのである。
【0032】
例えば、クラウドサーバ1は、所定対象として1つの交差点又は当該交差点に存在する落下物若しくは事故車両(図1のバツ印)を設定し、この所定対象の自由視点映像を生成するものとする。この場合、この交差点の位置を特定した上で、それぞれ自動車2に搭載された端末20A~20Dにおける「所定対象に対する位置に係る情報」を考慮し、
端末20Aに係る前方カメラ203aと、端末20Bに係る後方カメラ203bと、
端末20Cに係る前方カメラ203aと、端末20Dに係る前方カメラ203aと
を選定して、これらのカメラ203からのカメラ画像を取得し、最終的に自由視点映像を生成することができるのである。
【0033】
なお、生成する多視点画像(映像)に含むべき所定対象は勿論、交差点(の落下物や事故車両)に限定されるものではない。例えば複数の視点から撮影可能なものならば、静止しているか又は移動しているかにかかわらず種々様々な物や事象が、この所定対象となり得るのである。
【0034】
また、端末20は当然に、自動車2に設置された車載装置(ドライブレコーダ)に限定されるものではなく、例えば自転車や鉄道車両、さらにはロボットやドローン等の他の移動体に設置された又は搭乗した装置であってもよい。さらに、端末20は、例えばHMD(Head Mounted Display)やグラス型端末等のウェアラブル端末であってもよい。この場合、例えば複数の人物が歩きながら撮影した画像データに基づいて多視点画像(映像)が生成されることとなる。
【0035】
さらに、本発明に係る画像生成元も、各自動車2の前方カメラ203aや後方カメラ203bに限定されるものではなく、例えば自動車側方のカメラや自動車上方のカメラであってもよい。また画像生成元として、地上や建物・設備等に設置された固定カメラが含まれていてもよい。すなわち、画像生成元選定部112における選定候補となる画像生成元には、少なくとも1つの移動可能な画像生成元が含まれていればよく、例えば選定候補の過半数は固定カメラとなっていてもよい。また勿論、選定候補となるのが全て、移動可能な画像生成元であるような態様をとることも可能である。
【0036】
いずれにしても本発明によれば、所定対象の多視点画像(映像)を生成するにあたり、従来のように固定カメラのみに依存する必要がないので、従来生成が困難であった多視点画像(映像)が生成できたり、また、最終的に多視点画像(映像)生成処理の負担が低減されたりする場合も多くなるのである。またさらに、移動する画像生成元(カメラ)を、移動途中の個々の位置で利用することによって、使用する画像生成元(カメラ)の数を超える、より多数の視点からの画像データを取得することもできるのであり、その結果、生成される多視点・自由視点画像(映像)の品質をより向上させることも可能となるのである。
【0037】
また、各端末20からクラウドサーバ1へ送信される画像データは、例えばMPEG(Moving Picture Experts Group)で符号化されてもよい。この場合、クラウドサーバ1は、受信した(圧縮された)画像データを復号化し(伸張させ)、復号化された画像データを基にして多視点画像(映像)、さらには自由視点画像(映像)を生成することができる。
【0038】
[多視点画像生成装置の機能構成]
図1に示した機能ブロック図によれば、クラウドサーバ1は、通信インタフェース101と、プロセッサ・メモリとを有する。ここで、このプロセッサ・メモリは、本発明による多視点画像生成プログラムの一実施形態を保存しており、また、コンピュータ機能を有していて、この多視点画像生成プログラムを実行することによって、多視点画像生成処理を実施する(なお本実施形態では、生成した多視点画像から自由視点画像を生成する自由視点画像生成処理も実施される)。
【0039】
このことから、本発明による多視点画像生成装置として、本クラウドサーバ1に代えて、本発明による多視点画像生成プログラムを搭載した、例えば非クラウドのサーバ装置、パーソナル・コンピュータ(PC)、ノート型若しくはタブレット型コンピュータ、又はスマートフォン等を採用することも可能となる。
【0040】
例えば、端末20に本発明による多視点画像生成プログラムを搭載し、当該端末20を本発明による多視点画像生成装置とすることもできる。また、本発明による多視点画像生成装置を、端末20とともに自動車2に設置する実施形態も可能となるのである。
【0041】
さらに、プロセッサ・メモリは、画像解析部111aを含む位置情報取得部111と、画像生成元選定部112と、多視点画像生成部113と、自由視点画像生成部114と、入出力制御部115とを有する。なお、これらの機能構成部は、プロセッサ・メモリに保存された多視点画像生成プログラムの機能と捉えることができる。また、図1におけるクラウドサーバ1の機能構成部間を矢印で接続して示した処理の流れは、本発明による多視点画像生成方法の一実施形態としても理解される。
【0042】
同じく図1の機能ブロック図において、位置情報取得部111は、各カメラ203(画像生成元)の位置情報、及び所定対象(図1では交差点(の落下物や事故車両))の位置情報を取得する。例えば、各カメラ203の位置情報は、各カメラ203に係る端末20から送信され、通信インタフェース101で受信して取得されたGPS(Global Positioning System)位置情報とすることができる。なお、所定対象の位置情報は、例えば自由視点画像生成対象の所在位置として、予めクラウドサーバ1に設定・入力されたものであってもよい。
【0043】
また変更態様として、位置情報取得部111は、所定対象(交差点)に対する各カメラ203(画像生成元)の相対位置に係る情報を取得するものであってもよい。この場合、位置情報取得部111の画像解析部111aが、各カメラ203で生成されたカメラ画像(生成元画像)における所定対象の画像内での位置に基づき、各カメラ203における所定対象に対する相対位置情報を決定してもよい。
【0044】
ここで、このようなカメラ画像に含まれる所定対象と、このカメラ画像の生成元であるカメラとの位置関係は、例えば公知の画像座標系-実空間座標系の座標変換処理を用いて算出することができる。例えば、所定対象の位置を原点とした実空間座標系を設定した場合における、各カメラ203の位置座標値を求めてもよい。また、このような実空間座標系での相対位置の代わりに、画像内座標系での相対位置(座標値)を採用することも可能である。
【0045】
画像生成元選定部112は、移動可能なカメラ203(画像生成元)を含む、選定対象となる全てのカメラ(画像生成元)の各々における「所定対象に対する位置情報」に基づいて、所定対象に対して互いに異なる複数の視点となり得るような複数の位置若しくは位置範囲に存在する複数のカメラ(画像生成元)を選定する。ここで、選定対象となるカメラには、移動可能なカメラ203だけでなく、固定カメラが含まれていてもよい。
【0046】
画像生成元選定部112は、さらに、移動可能なカメラ203(画像生成元)を含む、選定対象となる全てのカメラ(画像生成元)の各々における「画像生成の際の視線向きに係る情報」にも基づいて、複数のカメラ(画像生成元)を選定することも好ましい。この場合例えば、そもそもカメラ画像に所定対象が含まれている(映り込んでいる)カメラ(画像生成元)を選定対象としてもよい。
【0047】
また、画像生成元選定部112は、各カメラの撮影向き(画像生成の際の視線向き)に係る情報、例えば
・カメラ203における自動車2の前方を基準とした場合の撮影向き(視線向き)角度、及び画角や、
・固定カメラにおける撮影向き(視線向き)の方位角、及び画角
等を予め取得していて、各カメラの位置、撮影向き(視線向き)、及び画角(さらにはカメラ203の場合、自動車2の進行向き)に基づいて、「所定対象を含むカメラ画像を生成可能」なカメラ(画像生成元)を選定してもよい。
【0048】
画像生成元選定部112はより具体的に、例えば、所定対象の位置(例えば交差点ならばその中心位置)を原点とした実空間座標系において、選定対象である各カメラにおけるその位置座標値から、所定対象との「距離」、及び原点(所定対象)周りの「方位角」を算出し、
(a)「距離」がいずれも所定範囲内(例えば3~15メートル)であって、且つ「方位角」が互いに所定角度閾値(例えば30°)以上離隔した値となっており、
(b)「所定対象を含むカメラ画像を生成可能」であるような撮影向き(視線向き)角度及び画角を有する、
(c)予め設定された上限数(例えば6)内の数だけの
カメラ(画像生成元)を選定することも好ましい。
【0049】
ここで上記(a)及び(b)の条件を満たすカメラ(画像生成元)が上記(c)の上限数を超えて存在する場合は、そのうちからランダムに当該上限数分を選定してもよく、または、上記(a)における互いの「方位角」の離散度が最も高くなるような(標準偏差が最大となるような)当該上限数分を選定することもできる。
【0050】
なお、以上に述べた「距離」及び「方位角」(画像生成元の位置に係る情報)や、(所定対象を含むカメラ画像が生成可能か否かを決める)「撮影向き(視線向き)角度」及び「画角」(画像生成元の視線向きに係る情報)等のカメラ選定のための情報は、1つの時点又は時間範囲における情報とすることも好ましい。例えばこれらの情報を生成する元となる画像データを、共通の1つの時刻に生成(撮影)されたものとしてもよい。
【0051】
言い換えると、画像生成元選定部112は、(移動可能なカメラ203を含む画像生成元としての)カメラの各々における同じ1つの時点又は時間範囲での「所定対象に対する位置に係る情報」に基づいて、使用するカメラ(画像生成元)を選定し、またさらに、これらの選定されたカメラから取得されるカメラ画像(生成元画像)は、この同じ1つの時点又は時間範囲でのカメラ画像を含むものとすることも好ましい。これは特に、所定対象が移動可能であったり見た目が刻々と変化したりするものである場合に必要な技術事項となる。
【0052】
ここで、特に所定対象が静止しておりその位置や見た目が変化するものではない場合、上述したような(距離や方位角といった)カメラ選定のための情報は、同じ1つの時点又は時間範囲における情報ではなく、カメラ毎に異なった時点(時刻)での情報とすることも可能である。例えば具体例として、交差点内に落下した荷物を所定対象とする場合、選定された複数のカメラ203は、互いに異なる時刻において上記(a)及び(b)の条件を満たすものであってもよいのである。
【0053】
ただし、このような場合でも、選定された各カメラからは、当該カメラにおける(距離や方位角といった)カメラ選定のための情報に係る時点又は時間範囲と同一の時点又は時間範囲でのカメラ画像を含むカメラ画像が取得されることが好ましい。
【0054】
なお、画像生成元選定部112はこの後、カメラの指定情報(例えば、選定したカメラのIDや、送信要求対象である画像データの時刻・時間範囲(又はフレーム番号・番号範囲)の情報)を入出力制御部115に出力し、入出力制御部115は、このカメラの指定情報に基づき、各端末20宛ての画像送信要求を生成して、当該画像送信要求を、通信インタフェース101を介して各端末20へ送信するのである。
【0055】
図2は、クラウドサーバ1(画像生成元選定部112)における本発明に係る画像生成元選定処理の具体例を説明するための模式図である。
【0056】
ここで以下に示す図2(A)~(C)の各例において、クラウドサーバ1は、各自動車2のGPS位置情報を取得して、各自動車2における時刻Tにおける所定対象に対する相対位置とその進行向きとを決定した上で、カメラ203を選定している。また、所定対象は、自動車2の走行する道路(通行エリア)内又はその近傍に存在する事物となっている。さらに、クラウドサーバ1は、各自動車2が前方カメラ203a及び後方カメラ203bを備えていることを予め知得しており、また、これらのカメラの撮影向き(視線向き)及び画角等の情報も把握している。
【0057】
最初に図2(A)の例では、クラウドサーバ1の画像生成元選定部112は、時刻Tにおいて所定対象である「交差点における落下物(バツ印)」を適切に撮影し得る5つのカメラ:端末20Aの前方カメラ203a、端末20Bの後方カメラ203b、端末20Cの前方カメラ203a、端末20Dの前方カメラ203a、及び端末20Eの後方カメラ203bを選定している。
【0058】
次いで図2(B)の例では、クラウドサーバ1の画像生成元選定部112は、時刻Tにおいて所定対象である「中央分離帯における落下物(バツ印)」を適切に撮影し得る4つのカメラ:端末20Fの前方カメラ203a、端末20Gの後方カメラ203b、端末20Hの前方カメラ203a、及び端末20Iの後方カメラ203bを選定している。
【0059】
さらに図2(C)の例では、クラウドサーバ1の画像生成元選定部112は、時刻Tにおいて所定対象である「カーブした道路脇の落下物(バツ印)」を適切に撮影し得る3つのカメラ:端末20Lの前方カメラ203a、端末20Mの後方カメラ203b、及び端末20Nの前方カメラ203aを選定している。ちなみに、端末20Kの前方カメラ203aは、その画角内に「カーブした道路脇の落下物(バツ印)」を含まず、この落下物を撮影し得ないので選定されていない。
【0060】
ここで上述した各例において、画像生成元選定部112は、各端末20(自動車2)の位置情報だけではなく、各カメラ203の撮影向き(視線向き)、すなわち進行向きを撮影可能であるのか反進行向きを撮影可能であるのかの情報をも考慮してカメラ選定を行っている。
【0061】
具体的には1つの選定基準として、自動車2からカメラ203を選定する際、当該自動車2が所定対象に近づくように道路(通行エリア)を進行する際、進行向きの状況を撮影可能な前方カメラ203aを選定しており、当該自動車2が所定対象から遠ざかるように道路(通行エリア)を進行する際、反進行向きの状況を撮影可能な後方カメラ203bを選定しているのである。
【0062】
ちなみに、以上に説明したカメラ選定処理では、移動可能な自動車2に搭載されたカメラ203のみが選定対象であったが、例えば、道路脇や交差点に設置された固定カメラも含めて選定対象とすることが可能である。この場合、クラウドサーバ1は、このような固定カメラにおける設置位置、撮影向き(視線向き)及び画角等の情報を把握していることも好ましい。
【0063】
以上に説明したようなカメラ選定処理の後、クラウドサーバ1は、上述したように指定したカメラ203(に係る端末20)の各々から、時刻Tに生成(撮影)された画像データを含む画像データ群を取得することによって、交差点の落下物を含む多視点画像、さらには自由視点画像を生成することができるのである。
【0064】
図1の機能ブロック図に戻って、多視点画像生成部113は、画像生成元選定部112で選定されたカメラより(通信インタフェース101を介して)取得されたカメラ画像(生成元画像)から、所定対象を含む多視点画像(映像)を生成する。例えば、選定された各カメラから取得したカメラ画像のうちで、この後、自由視点映像(画像)を生成するのに利用可能となるカメラ画像、いわゆる参照画像を選択して、多視点画像(映像)としてもよい。
【0065】
特に、移動中であるカメラ203からのカメラ画像は、例え時刻(時間範囲)を指定して取得したものであっても、含まれる所定対象の画像内での位置が所望の位置からずれていることも少なくない。したがって、上記のカメラ画像の選択処理は、好適な自由視点映像(画像)を生成する際に重要となるのである。
【0066】
自由視点画像生成部114は、このように生成された多視点画像(映像)を用いて自由視点映像(画像)を生成する。ここで、自由視点映像(画像)とは、任意の指定された仮想視点位置から所定対象を見た際の映像(画像)のことである。
【0067】
具体的に自由視点画像生成部114は、
(a)参照画像(多視点画像)の画素毎に、画像の視点位置から当該画素に映っている対象までの距離値(デプス値)を算出して、対象を表す3次元点の集合を生成して自由視点映像(画像)を生成してもよく、
(b)参照画像(多視点画像)に含まれる所定対象の輪郭情報を算出し、所定対象をビジュアルハル(3次元形状)として近似的に表現して自由視点映像(画像)を生成してもよく、
(c)参照画像(多視点画像)から、ライトフィールドを算出して自由視点映像(画像)を生成してもよい。
【0068】
ここで、上記(b)のビジュアルハルは、視体積交差法、特にボクセルモデルによってビジュアルハルを表現するボクセルベースの視体積交差法によって生成されることも好ましい。また、上記(c)のライトフィールドとは、視点位置(x, y, z)、光線向き(θ, φ)、光線波長λ、及び時間tの関数であるPlenoptic関数をもって表現される、3次元空間内の全ての光線場のことである。
【0069】
なお、以上説明したように生成された、所定対象を含む多視点画像(映像)や自由視点映像(画像)は、適宜又は要求に応じて、通信インタフェース101を介し端末20やその他の外部の情報処理装置へ送信され、様々な形で利用されてもよい。勿論、クラウドサーバ1自身が、生成した多視点画像(映像)や自由視点映像(画像)を利用して種々のサービス情報を生成し外部に提供することも好ましい。
【0070】
図3は、クラウドサーバ1における多視点画像生成処理及び自由視点画像生成処理の具体例を説明するための模式図である。
【0071】
図3によれば、クラウドサーバ1は、選定した3つのカメラ203(に係る端末20)から要求した画像データを取得し、これらの画像データから多視点画像、さらには自由視点画像を生成している。
【0072】
具体的に、クラウドサーバ1の多視点画像生成部113は、所定対象としての1つの交差点を撮影した(a)端末20Pの後方カメラ203bと、(b)端末20Qの前方カメラ203aと、(c)端末20Rの前方カメラ203aとから、時刻Tの画像データを含む画像データ群を取得し、これら3つのカメラ毎に、自由視点画像を生成するのに好適な画像データを選択して多視点画像としている。
【0073】
次いで自由視点画像生成部114は、多視点画像生成部113で生成された多視点画像を用いて、所定対象である交差点を含む自由視点画像を生成しているのである。ここで、生成された自由視点画像においては、上記の3つのカメラの位置とは異なる任意の視点を指定した場合に、この指定された視点から見た交差点の画像が出力可能となっている。
【0074】
このように、クラウドサーバ1は、特定の「交差点」といったような、必ずしも複数の固定カメラが適切に配置されているわけではない「所定対象」についての自由視点画像を、車載カメラ等の移動し得る画像生成元を利用することによって生成可能としているのである。
【0075】
[端末20の機能構成]
図1の機能ブロック図に戻って、端末20(図1では端末20A)は、通信インタフェース201と、測位部202と、映像生成元としての前方カメラ203a及び後方カメラ203bと、ディスプレイ(DP)204と、プロセッサ・メモリとを有する。ここで、このプロセッサ・メモリは、本発明に係る多視点画像生成支援プログラムの一実施形態を保存しており、また、コンピュータ機能を有していて、この多視点画像生成支援プログラムを実行することによって、多視点画像生成支援処理を実施する。
【0076】
このことから、本発明に係る映像生成元を含む又は当該映像生成元と接続された多視点画像生成支援装置として、ドライブレコーダである本端末20に代えて、本発明による多視点画像生成支援プログラムを搭載した他の車載情報処理装置や、さらにはカメラを備えた又はカメラと接続されたスマートフォン、ノート型若しくはタブレット型コンピュータ、又はパーソナル・コンピュータ(PC)等を採用することも可能となる。また、ドライブレコーダとWi-Fi(登録商標)やBluetooth(登録商標)等で通信接続された端末、例えばスマートフォンを本多視点画像生成支援装置としてもよい。
【0077】
さらに、プロセッサ・メモリは、映像生成部211と、対象検出部212と、位置情報取得部213と、カメラ画像選択部214と、提示情報生成部215と、入出力制御部216とを有する。なお、これらの機能構成部は、プロセッサ・メモリに保存された多視点画像生成支援プログラムの機能と捉えることができる。また、図1における端末20の機能構成部間を矢印で接続して示した処理の流れは、本発明に係る多視点画像生成支援方法の一実施形態としても理解される。
【0078】
同じく図1の機能ブロック図において、位置情報取得部213は、自らに係る端末20(自動車2)の位置情報(例えば緯度、経度、高度、及び測位した時刻)を測位部202から取得し、この位置情報を、通信インタフェース201を介してクラウドサーバ1へ通知させる。
【0079】
ちなみに測位部202は、GPS(Global Positioning System)衛星から受信した測位電波を解析し、端末20の現在位置を測位する公知のデバイスとすることができる。または測位部202は、複数基地局測位方式を用いて測位を行うデバイスであってもよい。ここで複数基地局測位方式は、端末20が複数の周辺基地局から受信する電波によって現在位置を測位する方式である。
【0080】
映像生成部211は、映像生成元としての前方カメラ203a及び後方カメラ203bから出力された撮影データに基づいて映像データ(画像フレーム群)を生成する。ここで、生成された映像データには、映像生成元が前方カメラ203aであることを示すタグ又は後方カメラ203bであることを示すタグが付与されることも好ましい。また本実施形態において端末20はドライブレコーダであり、映像生成部213は、デフォルトの設定として少なくとも自動車2の走行時は常に、車外の状況を撮影した撮影データを前方カメラ203a及び後方カメラ203bから取得し、各カメラによる映像データ(画像フレーム群)を生成している。
【0081】
対象検出部212は、生成された画像データにおいて所定「対象」を検出する。具体的には、周知の機械学習を用いた物体検出技術を用いて「対象」検出処理を実施することができる。例えば、画像データ内の各小画像領域に対し、「対象」検出用に学習された物体検出器を用いて「対象」らしさを示すスコアを算出し、当該スコアの最も高い小画像領域を「対象」領域に決定してもよい。
【0082】
また、このような物体検出器として、例えば非特許文献:Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexander C. Berg, “SSD: single shot multibox detector”, European Conference on Computer Vision, Computer Vision-ECCV 2016, 2016年, 21~37頁に記載されたものを使用することができる。ここで、決定される「対象」領域は、例えば、物体検出器によって検出された「対象」の画像部分に対し各辺が外接している外接矩形(バウンディングボックス,bounding box)の領域であってもよい。勿論当然に、他の形状の対象領域を設定することも可能である。
【0083】
ちなみに、工事現場という「対象」については、ロードコーンや車両等の物体を検出してそれらが所定数以上近接して連続している場合に、工事現場を検出したとすることができる。
【0084】
同じく図1の機能ブロック図において、入出力制御部216は、画像データにおいて検出された所定対象に係る情報と当該画像データとを、当該画像データの生成元である端末20の位置情報とともに通信インタフェース201を介してクラウドサーバ1へ提供し、一方で、クラウドサーバ1から自らに係る端末20宛てに送信されてきた、カメラ(画像生成元)指定情報を含む画像送信要求を、通信インタフェース201を介して受け取るクライアント入出力制御手段である。
【0085】
カメラ画像選択部214は、取得された画像送信要求に含まれているカメラ指定情報で指定されたカメラ(画像生成元)において、このカメラ指定情報で指定された時点若しくは時間範囲(又はフレーム番号若しくは番号範囲)に生成された画像データを、映像生成部211で生成され保存された画像データ(画像フレーム群)の中から選択する。例えば、カメラ指定情報が、前方カメラ203aと、指定日時時間:2019年7月1日15時08分30秒~35秒とを指定するものである場合、前方カメラ203aに係る当該時間範囲の画像(映像)データを選択するのである。カメラ画像選択部214は、次いで、このように選択した画像データを、要求元であるクラウドサーバ1へ送信させるのである。
【0086】
提示情報生成部215は、クラウドサーバ1から配信された、所定対象(例えば交差点の落下物)を含む多視点画像(映像)や自由視点映像(画像)を、通信インタフェース201を介して取得し、例えばこのような映像(画像)をディスプレイ204に表示させるとともに、所定対象に関する情報、例えば所定対象の種別や、所定対象の撮影された時刻・時間(期間)等も併せてディスプレイ204に表示させてもよい。
【0087】
さらに、例えばディスプレイ204がタッチパネルも備えていて、提示情報生成部215は、所定対象の存在位置にアイコンを配した道路マップを、ディスプレイ204に表示させ、当該アイコンがタップされた際、該当する所定対象の多視点画像(映像)や自由視点映像(画像)を同じくディスプレイ204に表示させてもよい。
【0088】
[多視点画像生成方法]
図4は、本発明による多視点画像生成方法における一実施形態の概略を示すシーケンス図である。ここで本実施形態では、端末20A~20Cは各々、常時、自動車2周辺の状況を撮影して映像を生成しており(ステップS101)、また自らの位置情報も、常時取得していて、当該位置情報を常時、定期的に又は適宜クラウドサーバ1へ通知している(ステップS102)。
【0089】
(S103)端末20Cは、所定対象を検出する。
(S104)端末20Cは、検出した所定対象を含む画像データ、及び対象検出結果を、当該画像データの生成元である端末20Cの位置情報とともにクラウドサーバ1へ送信する。
(S105)クラウドサーバ1は、受信した画像データ及び対象検出結果、並びに周辺の端末20から取得した位置情報に基づいて、画像送信を要求するカメラ(画像生成元)を選定し、さらに指定した各カメラにおいて同時刻に又は同じ時間範囲に生成された画像データを取得すべく、画像生成時刻情報を決定する。
【0090】
ちなみに、本実施形態では画像送信を要求するカメラとして、端末20Aに係る前方カメラ203aと、端末20Bに係る後方カメラ203bと、端末20Cに係る前方カメラ203aとが、選定される。
【0091】
(S106)クラウドサーバ1は、カメラ指定情報及び画像生成時刻情報を含む画像送信要求を端末20A~20Cの各々へ送信する。
(S107)端末20A~20Cは各々、受信したカメラ指定情報及び画像生成時刻情報に基づいて、指定されたカメラの画像データを選択する。
【0092】
ここで、本実施形態では具体的に、
(a)端末20Aは、生成済みの画像データ群から、前方カメラ203aに係る画像データであって、取得した画像生成時刻情報において指定された時刻又は時間範囲の画像データを選択し、
(b)端末20Bは、生成済みの画像データ群から、後方カメラ203bに係る画像データであって、取得した画像生成時刻情報において指定された時刻又は時間範囲の画像データを選択し、
(c)端末20Cは、生成済みの画像データ群から、前方カメラ203aに係る画像データであって、取得した画像生成時刻情報において指定された時刻又は時間範囲の画像データを選択するのである。
【0093】
(S108)端末20A~20Cは各々、選択した画像データをクラウドサーバ1へ送信する。
ここでクラウドサーバ1は、受信した各端末からの画像データが、この後多視点映像を生成するのになお十分ではない場合、該当する端末に対し、画像送信継続要求又は画像送信追加要求を送信し、足りていない画像データを送信させてもよい。
【0094】
(S109)クラウドサーバ1は、端末20A~20Cから受信した画像データを用いて多視点映像を生成する。
ここでクラウドサーバ1は、端末20A~20Cの各々から受信した画像データのうちで、この後自由視点映像を生成するのに適した画像データを選択して多視点映像としてもよい。例えば、1つの時刻において所定対象を互いに異なる視点から捉えている複数の画像データであって、画像フレーム内における所定対象の位置が各々適切な位置範囲内にある複数の画像データを、当該時刻での多視点画像データとして選定し、これらを時系列化して多視点映像を生成することができる。
【0095】
(S110)クラウドサーバ1は、生成した多視点映像に基づいて自由視点映像を生成する。
(S111)クラウドサーバ1は、生成した自由視点映像を、端末20A~20Cや、他の情報処理装置、例えばPC3へ配信する。
【0096】
以上詳細に説明したように、本発明によれば、所定対象に対し互いに異なる複数の視点からの画像データを生成可能な複数の画像生成元が、その位置に係る情報に基づいて選定可能となっており、その結果、移動し得る画像生成元を利用して所定対象を含む多視点画像(映像)を生成することができる。
【0097】
さらに本発明によれば、所定対象の多視点画像(映像)を生成するにあたり、従来のように固定カメラのみに依存する必要がないので、従来生成が困難であった多視点画像(映像)が生成できたり、また、最終的に多視点画像(映像)生成処理の負担が低減されたりする場合も多くなるのである。
【0098】
ちなみに、本発明の構成及び方法は、膨大な量の映像データ伝送が可能となる5G(第5世代移動通信システム)を利用し、多数のクライアントから映像データをサーバへアップロードする状況において、それらの映像データを利用して所定対象の多視点映像や自由視点映像を生成するのに大いに役立つものと考えられる。例えば自動運転車、ドローンや、自律歩行ロボット等の移動体によって撮影された高解像度映像を5Gによって収集し、従来生成が困難であった所望の自由視点映像を確実に生成することも可能となるのである。
【0099】
以上に述べた本発明の種々の実施形態について、本発明の技術思想及び見地の範囲内での種々の変更、修正及び省略は、当業者によれば容易に行うことができる。以上に述べた説明はあくまで例示であって、何ら制約を意図するものではない。本発明は、特許請求の範囲及びその均等物によってのみ制約される。
【符号の説明】
【0100】
1 クラウドサーバ(サーバ)
101、201 通信インタフェース
111 位置情報取得部
111a 画像解析部
112 画像生成元選定部
113 多視点画像生成部
114 自由視点画像生成部
115、216 入出力制御部
2 自動車
20、20A、20B、20C、20D、20E、20F、20G、20H、20I、20J、20K、20L、20M、20N、20P、20Q、20R 端末(クライアント)
202 測位部
203a 前方カメラ
203b 後方カメラ
204 ディスプレイ(DP)
211 映像生成部
212 対象検出部
213 位置情報取得部
214 カメラ画像選択部
215 提示情報生成部
3 PC(パーソナル・コンピュータ)
図1
図2
図3
図4