IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ インテル コーポレイションの特許一覧

特許7146747パノラマビデオのための提案されるビューポート指示
<>
  • 特許-パノラマビデオのための提案されるビューポート指示 図1
  • 特許-パノラマビデオのための提案されるビューポート指示 図2
  • 特許-パノラマビデオのための提案されるビューポート指示 図3
  • 特許-パノラマビデオのための提案されるビューポート指示 図4
  • 特許-パノラマビデオのための提案されるビューポート指示 図5
  • 特許-パノラマビデオのための提案されるビューポート指示 図6
  • 特許-パノラマビデオのための提案されるビューポート指示 図7
  • 特許-パノラマビデオのための提案されるビューポート指示 図8
  • 特許-パノラマビデオのための提案されるビューポート指示 図9
  • 特許-パノラマビデオのための提案されるビューポート指示 図10
  • 特許-パノラマビデオのための提案されるビューポート指示 図11
  • 特許-パノラマビデオのための提案されるビューポート指示 図12
  • 特許-パノラマビデオのための提案されるビューポート指示 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-09-26
(45)【発行日】2022-10-04
(54)【発明の名称】パノラマビデオのための提案されるビューポート指示
(51)【国際特許分類】
   H04N 21/431 20110101AFI20220927BHJP
   H04N 19/597 20140101ALI20220927BHJP
   H04N 19/70 20140101ALI20220927BHJP
   H04N 7/18 20060101ALI20220927BHJP
   H04N 21/435 20110101ALI20220927BHJP
   H04N 13/161 20180101ALI20220927BHJP
   H04N 13/178 20180101ALI20220927BHJP
【FI】
H04N21/431
H04N19/597
H04N19/70
H04N7/18 U
H04N21/435
H04N13/161
H04N13/178
【請求項の数】 20
(21)【出願番号】P 2019517788
(86)(22)【出願日】2017-11-15
(65)【公表番号】
(43)【公表日】2020-01-16
(86)【国際出願番号】 US2017061731
(87)【国際公開番号】W WO2018093851
(87)【国際公開日】2018-05-24
【審査請求日】2020-09-28
(31)【優先権主張番号】62/423,343
(32)【優先日】2016-11-17
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】593096712
【氏名又は名称】インテル コーポレイション
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100091214
【弁理士】
【氏名又は名称】大貫 進介
(72)【発明者】
【氏名】ボイス,ジル エム.
【審査官】富樫 明
(56)【参考文献】
【文献】国際公開第2018/038523(WO,A1)
【文献】国際公開第2015/126144(WO,A1)
【文献】国際公開第2016/010668(WO,A1)
【文献】特開2005-136810(JP,A)
【文献】米国特許出願公開第2012/0092348(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00-21/858
H04N 19/597
H04N 19/70
H04N 7/18
H04N 13/161
H04N 13/178
(57)【特許請求の範囲】
【請求項1】
ビューポートメタデータを含む符号化されたビデオを受け取ることと、
前記ビデオを復号することと、
前記ビューポートメタデータを取り出すことと、
関心領域の変化に応じて前記ビューポートメタデータに設定されたフラグに従って、前記ビューポートメタデータに基づき前記復号されたビデオのビューポートを生成することと、
表示のために前記生成されたビューポートをバッファリングすることと
を有する方法。
【請求項2】
前記ビューポートメタデータは、前記関心領域の中心を含む、
請求項1に記載の方法。
【請求項3】
前記中心は、ビューポート表示の緯度及び経度として示される、
請求項2に記載の方法。
【請求項4】
前記ビューポートメタデータは、前記中心からの距離に基づく前記関心領域の視野を含む、
請求項2に記載の方法。
【請求項5】
前記視野は、水平角及び鉛直角として示される、
請求項4に記載の方法。
【請求項6】
前記ビューポートメタデータは、付加拡張情報メッセージとして符号化される、
請求項1乃至5のうちいずれか一項に記載の方法。
【請求項7】
前記受け取られた符号化されたビデオは、広視野の平面投影である、
請求項1乃至6のうちいずれか一項に記載の方法。
【請求項8】
前記平面投影は正距円筒図法であり、前記広視野はパノラマである、
請求項7に記載の方法。
【請求項9】
前記ビューポートメタデータは、前記受け取られた符号化されたビデオのフレームに関連し、
当該方法は、前記符号化されたビデオのフレームごとにビューポートメタデータを受け取ることを有する、
請求項1乃至8のうちいずれか一項に記載の方法。
【請求項10】
ユーザ選択のビューポートを使用することをユーザが指示しているかどうかを判定し、そうである場合には、次いで、前記ビューポートメタデータを用いてビューポートを生成することの代わりに、前記ユーザ選択のビューポートを用いてビューポートを生成することを更に有する
請求項1乃至9のうちいずれか一項に記載の方法。
【請求項11】
前記ビューポートメタデータは、複数のビューポートを含み、
当該方法は、前記複数のビューポートから1つを選択することを更に有し、
ビューポートを生成することは、前記複数のビューポートの中の前記選択された1つを用いてビューポートを生成することを有する、
請求項1乃至10のうちいずれか一項に記載の方法。
【請求項12】
前記複数のビューポートから1つを選択することは、前記複数のビューポートの中の1つのユーザ選択を受け取ることを有する、
請求項11に記載の方法。
【請求項13】
前記複数のビューポートのサイズは、ズーム効果をもたらすために使用される、
請求項12に記載の方法。
【請求項14】
前記符号化されたビデオは、回転方向メタデータを更に含み、
当該方法は、
前記回転方向メタデータを取り出すことと、
前記回転方向メタデータに基づき前記復号されたビデオを回転させることと
を有し、
前記ビューポートを生成することは、前記回転された復号されたビデオを用いてビューポートを生成することを有する、
請求項1乃至13のうちいずれか一項に記載の方法。
【請求項15】
マシンによって実行される場合に、該マシンに、
ビューポートメタデータを含む符号化されたビデオを受け取ることと、
前記ビデオを復号することと、
前記ビューポートメタデータを取り出すことと、
関心領域の変化に応じて前記ビューポートメタデータに設定されたフラグに従って、前記ビューポートメタデータに基づき前記復号されたビデオのビューポートを生成することと、
表示のために前記生成されたビューポートをバッファリングすることと
を有する動作を実行させる命令を含むプログラム。
【請求項16】
ビューポートメタデータを含む広視野ビデオを受け取り、前記ビューポートメタデータを取り出すビデオ復号部と、
関心領域の変化に応じて前記ビューポートメタデータに設定されたフラグに従って、復号されたビデオのビューポートを前記ビューポートメタデータに基づき生成し、該生成されたビューポートを表示のためにバッファリングするビューポート生成部と
を有する装置。
【請求項17】
広視野ビデオを受け取ることと、
前記ビデオを平面投影にマッピングすることと、
前記ビデオに含まれる選択された関心領域を受け取ることと、
前記選択された関心領域を記述するビューポートメタデータを生成することと、
前記ビューポートメタデータを含む符号化されたビデオとして前記平面投影を符号化することと、
前記符号化されたビデオを記憶することと
を有し、
前記ビューポートメタデータは、前記関心領域の変化に応じてフラグを立てられる、方法。
【請求項18】
前記ビューポートメタデータは、ビューポート表示の緯度及び経度として示される前記関心領域の中心と、水平角及び鉛直角として示される、前記中心からの距離に基づく前記関心領域の視野とを含む、
請求項17に記載の方法。
【請求項19】
動きについて前記ビデオのシーンを解析し、該シーンのどの部分が最も速い動きを含むかを決定することによって、前記選択された関心領域を選択することを更に有する
請求項17又は18に記載の方法。
【請求項20】
請求項15に記載のプログラムを記憶しているマシン読出可能な媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本明細書は、符号化されたビデオの通信に関係があり、特に、提案されるビューポートをビデオとともに送ることに関係がある。
【背景技術】
【0002】
安価な高精細ビデオカメラ及び高速インターネット接続の出現とともに、ビデオインターネットトラフィックは急速に成長している。360度ビデオは、特に、仮想現実、ビデオ会議、自動車、及び監視用途における最新動向であり、180及び360度視野カメラを含む広視野カメラによってサポートされている。専用のウェブサイト及びチャネルも、仮想現実コンテンツを含む360度ビデオを投稿及び鑑賞するために利用可能である。ユーザのグループ間の協力のために、360度ビデオは、より高い柔軟性を提供する。複数台のカメラを切り替えることに代えて、遠隔の視聴者は、360度ビューを用いて部屋を横断し、カメラのビュー内の関心のある人々又は対象にズームインすることができる。
【0003】
仮想現実(VR)ヘッドマウント型ディスプレイを使用するパノラマビデオ再生システムは、コンシューマユースのために新たに興っている。パノラマ及び360度ビデオコンテンツは、通常、複数台のカメラによって撮影された2Dビデオを球表現に縫合することによって生成される。いくつかの場合に、複数のビューがソフトウェアにおいてレンダリングされる。球面ビデオは、その場合に、正距円筒図法フォーマット又はキューブマップ投影フォーマットのような、ビデオ符号化に適したフォーマットに投影される。
【0004】
クライアントにおいて、完全パノラマの圧縮ビデオフレームを含むビットストリームが受け取られ復号されて、全パノラマ視野の表示が生成される。より小さいビューポートが表示のために選択される。ビューポートによって表示される復号されたビデオの部分は、ヘッドマウント型ディスプレイのヘッド位置によって、又は通常の2D表示で見る場合に位置選択ユーザインターフェイスを通じて、決定される。
【0005】
本明細書で記載される題材は、限定ではなく、例として、添付の図面において説明される。説明の簡単及び明りょうさのために、図示される要素は、必ずしも実寸通りではない。例えば、いくつかの要素の大きさは、明りょうさのために互いに対して誇張されることがある。
【図面の簡単な説明】
【0006】
図1】実施形態に従うパノラマビデオ符号化システムのブロック図である。
図2】実施形態に従う代替のパノラマビデオ符号化システムのブロック図である。
図3】ピッチ、ヨー、及びロールのための回転方向を示す3軸直交座標系の図である。
図4】球から平面への正距円筒図法フォーマット投影の図である。
図5】0から5のラベルを付された6つの平面上に球が投影されるキューブマップ投影の図である。
図6】キューブマップ投影の6つの面を含む4×3平面グリッドの図である。
図7】簡潔さのために配列し直されたキューブマップ投影の6つの面を含む2×3平面グリッドの図である。
図8】球から平面への正20面体フォーマット投影の図である。
図9】実施形態に従って、回転なしでの球から平面への2つのオブジェクトの正距円筒図法フォーマット投影の図である。
図10】実施形態に従って、回転ありでの球から平面への2つのオブジェクトの正距円筒図法フォーマット投影の図である。
図11】実施形態に従って、符号化及び鑑賞のために広視野ビデオのためのビューポート指示を提案するプロセスフロー図である。
図12】実施形態に適した計算資源を接続されているヘッドマウント型ディスプレイのブロック図である。
図13】実施形態に従って、ビデオの捕捉、符号化、復号化及び表示に適したコンピュータデバイスのブロック図である。
【発明を実施するための形態】
【0007】
パノラマビデオ再生システムの視聴者は、パノラマビデオの全体の一部分、例えば、所与の時点での利用可能なエリアの12分の1しか見ていないので、ビデオの最も関心がある領域は見られていない可能性がある。長方形の関心領域を信号伝達する既存の方法は、球面パノラマビデオ又は何らかの他の球形若しくは曲線フォーマットビデオからのビューポートの生成に直接には適用されない。
【0008】
付加拡張情報(SEI)メッセージが使用されてよく、これは、視聴者のために表示されるべき提案される最も関心があるビューポートを信号伝達することをパノラマビデオコンテンツクリエータに可能にするメタデータを含む。提案される最も関心があるビューポートは、パノラマビデオのビューポートを生成するために必要とされる情報を信号伝達するメタデータを通じて、パノラマビデオの球表現のために示されてよい。球表現を使用することは、この信号伝達が、例えば、正距円筒図法、キューブマップ、8面体、四角すい台、などを含む多種多様な平面投影フォーマットのいずれかのために使用されることを可能にする。それはまた、信号伝達があらゆるタイプのエンコーダ及びデコーダのために使用されることも可能にする。
【0009】
クライアントにおいて、ビューポート生成部は、視聴者のために表示すべく、提案される最も関心がある直線的ビューポートを生成するために、受け取られたメタデータを使用することができる。このビューポートは、さもなければ視聴者のヘッド位置に基づき選択されるか又は他の位置指示ユーザインターフェイスに基づき選択されることになるものに代わるものを提供する。
【0010】
長方形の関心領域がいくつかのシステムで容易に信号伝達され得るが、長方形領域アプローチは、投影フォーマットにおいて符号化された球面ビデオにとって有効でない。平面投影フォーマットにおいて符号化されたフレームの長方形関心領域は、ビューポートの生成のために使用されたビデオフレームの部分に対応していない。ビューポートを生成することにおいて使用された対応する位置は、投影フォーマットの符号化されたビデオフレームにおける、場合により不連続の、1つ以上の非長方形領域に対応する。
【0011】
図1は、パノラマビデオ符号化システムのブロック図である。ビデオは、サーバ、プロダクションシステム、又は別のシステム102の組み合わせで生成される、サーバにおいて、複数台のカメラ106が2Dビデオを捕捉する。6台のカメラが示されているが、使用されるカメラは、より多くても又はより少なくてもよい。カメラは第1モジュール108へ接続されている。第1モジュールにおいて、複数台のビデオは縫合され、投影フォーマットにマッピングされる。投影フォーマットにおける縫合されたビデオは、HEVC又はAVCのようなビデオエンコーダ110へ入力される。エンコーダは、ビデオを符号化し、それを、ビットストリームとしての後の伝送のために、送出又はバッファリングする。エンコーダは、内部バッファ又は大容量記憶装置を備えてよく、あるいは、適切なバッファ又はデータストアが、エンコーダの外部に設けられてもよい。
【0012】
符号化されたビデオは、ネットワーク、インターネット、ブロードキャスト、又はポイント・ツー・ポイント接続112を通じて、サーバ又はヘッドエンドから1つ以上のクライアント104へビットストリームとして送られる。クライアントにおいて、ビデオデコーダ114は、サーバからのビデオを受け取り、圧縮されたビットストリームを復号する。復号されたビデオの一部分のみが見られる場合に、ビューポートは、その選択された領域のためにビューポートモジュール116において生成される。見るべき符号化されたビデオの部分は、ポジションセレクタ120によって、例えば、ヘッドマウント型ディスプレイのヘッド位置又は位置選択ユーザインターフェイスを用いて、決定される。位置は、復号されたビデオを受け取り、適切なビデオストリームをディスプレイ118へ供給するビューポート生成部へ送られる。ディスプレイは、ビューポートが通常の2D表示で見られることを可能にする。表示の前にビデオをセーブするための、ビューポート生成部に関連した又はそれに組み込まれているバッファが存在してよい。
【0013】
図2は、代替のパノラマビデオ符号化システムのブロック図である。ビデオは、サーバ202、プロダクションシステム、又は別のシステムの組み合わせである。複数台のカメラ206が2Dビデオを捕捉し、それを第1の縫合及び投影モジュール208へ供給する。複数のビデオが、モジュール内のバッファにバッファリングされる。ビデオは、このモジュールで縫合され、投影フォーマットにマッピングされる。投影フォーマットにおける縫合されたビデオは、モジュールの他のバッファに記憶され、次いで、HEVC又はAVCのようなビデオエンコーダ210へ入力される。
【0014】
コンテンツクリエータ、コメンテータ、エディタ、又はあらゆる他の主体が、最も関心のあるビューポート領域を選択してよい。代替的に、自動システムが、ビューポート領域を、例えば、高い運動速度又は高いテクスチャ特徴を持ったエリアとして選択してよい。選択は、ビデオエンコーダ210へ結合されている関心領域(ROI)選択部212へ適用される。ビデオエンコーダは、ビデオ縫合及びマッピング投影208から受け取られたビデオを符号化する。選択されたROIは、メタデータ216のような情報としてビデオエンコーダへ供給され、エンコーダによってビデオビットストリーム218に含められる。情報は、多種多様な方法のいずれかにおいて符号化され得る。ROIは、エンコーダから出力されるビデオビットストリームに加えられるメタデータの形で供給され得る。それは、SEIメッセージの形で又は他の形で加えられ得る。ROIメタデータは、フレーム又はフレームのグループに関連することができ、従って、フレームごとに1回更新され得る。
【0015】
情報を符号化するための1つのそのような方法は、付加拡張情報(SEI)メッセージの構造内のメタデータとしてであるが、様々な他のメッセージ構造のいずれが使用されてもよい。異なるエディタ又はコメンテータから複数のSEIメッセージとして供給される複数のROI選択が存在してよい。また、1よりも多いROIを示すよう1人のエディタからの複数のROI選択が存在してもよい。ユーザは、次いで、同時に表示不可能であるいずれかの中から選択してよい。メッセージは、衝突し合うか又は互いを補完し得る。SEIメッセージは特定のフレームと関連するので、ビューポート又はROI選択又は提案は、いずれかのフレームで変更され得る。
【0016】
ビデオエンコーダはビデオを符号化し、それをSEIメッセージ及び何らかの他のメタデータと結合し、それをビットストリームとしての後の伝送のために送出又はバッファリングする。エンコーダは、適切なバッファを含んでよく、あるいは、他の記憶デバイスがエンコーダ又はサーバの他の部分に組み込まれてもよい。
【0017】
符号化されたビデオは、ネットワーク、インターネット、ブロードキャスト、又はポイント・ツー・ポイント・リンクのようなデータ・リンク218を通じて、サーバ202又はヘッドエンドから1つ以上のクライアント204へビットストリームとして送られる。クライアントにおいて、ビデオデコーダ224は、サーバからのビデオ218を受け取り、圧縮されたビットストリーム218を復号し、あらゆるSEIメッセージを取り出す。ビューポート生成モジュール226は、ビデオについての選択されたROIを含むSEIメッセージ、更にはユーザ位置選択部230からの位置を受け取る。ビューポート生成部は、復号されたビデオを受け取り、適切なビデオストリームをディスプレイ228へ供給する。このビデオストリームは、直ちに表示されるか、あるいは、ビューポート生成部内にあるか又はビューポート生成部へ接続されているバッファ又は他のストレージに記憶されてよい。クライアントエンドにおいて、視聴者は、SEIメッセージの提案されるビューポートを見るためにコンテンツ提供者の提言に従うことを選択することでき、あるいは、クライアントが、位置選択230又は他のセンサを用いてビューポートを選択することができる。このようにして、選択又は推奨されたROIは視聴者によって優先され得る。
【0018】
提案されるビューポートメタデータはフレームに関連し、従って、フレームごとに1回更新される。1よりも多い提案されるビューポートは、コンテンツクリエータが、例えば、複数の動作物体を別々に追跡するために、1よりも多く示したい場合に、示され得る。これは、視聴者が、例えば、パノラマビュー内の特定の人又は事象を見ることを選択することを可能にする。
【0019】
ビューポート位置又は球面回転方向を表すメタデータは、緯度、経度及び視野、ピッチ、ヨー及びロール、又は方位角、仰角及び傾きのような、3つ以上のパラメータを含んでよい。図3は、ピッチ254、ヨー256、及びロール252の回転方向を示す3軸直交座標系の図である。3軸はx軸242、y軸244、及びz軸246である。回転方向は、参照系(frame of reference)の原点から見られる各軸周りの時計回りの回転である。ロールはx軸周りである。ピッチはy軸周りであり、ヨーはz軸周りである。軸は、水平、垂直、若しくは深さ、又は何らかの他の適切な名称のような、別の名称を有してもよい。方位角、仰角及び傾きは、原点と、原点からその原点の周りの球面上の位置への放射線との間の角度に対応する。一方、本実施形態は、参照直交座標系の軸周りの回転の形をとる。球面投影の回転は、他のタイプの座標系及び投影を用いて如何なる他の所望の方法でも表されてよい。
【0020】
メタデータは、HEVC及びAVC標準で使用されるような付加拡張情報(SEI)メッセージに含まれてよい。SEIメッセージを使用することは、規範的な符号化及び復号化プロセスが不変であるということで、レガシー・エンコーダ及びデコーダが使用されることを可能にする。回転は、特定の実施に応じて、送信側202での予備処理214として及び受信側204での後処理222として、又はプロセス中の他の位置で適用されてよい。後処理球面回転は、デコーダの出力ピクチャに適用される。
【0021】
SEI及びメタデータに代わるものとして、回転方向メタデータが、ビデオコーデックにおけるパラメータセットに、又はスライスヘッダに含まれてもよい。この場合に、適合した出力ピクチャの定義は、ピクチャが出力される前に既に逆球面回転が適用されているように、変更され得る。
【0022】
表1は、ROI提案又は選択シンタックスについてのメタデータパラメータを含むSEIメッセージのためのシンタックスの例である。このシンタックスは、それがコアな符号化又は復号化プロセスを変えないので、HEVC及びAVCのような既存のビデオコーデック標準とともに使用され得る。メタデータは、ビューポートが前のビューポートに取って代わるかどうかを示すフラグを有する。それはまた、画像の球面上の位置並びに水平及び垂直視野を提供する。
【0023】
メタデータは、ID及びキャンセルフラグによって識別される、ビューポートを生成するのに必要な情報を含む。情報は、角度において、緯度及び経度、並びに水平及び垂直視野サイズによって表されるような、球表現におけるビューポートの中心の位置を含む。角度は、度、ラジアン、又は直線距離において示され得る。なお、他のタイプの表現がROIの位置及びサイズを示すために使用されてもよい。球表現を基準として使用することは、同じシンタックスが、正距円筒図法、キューブマップ投影、8面体投影、正20面体投影、四角すい台投影、などのような、如何なる投影フォーマット又はレイアウトのためにも使用されることを可能にする。
【0024】
【表1】
ROI位置は、符号化されたビデオシーケンスの全体について、及び/又はフレームごとに、メタデータにおいて送出され得る。信号伝達される値、すなわち、メタデータ内の緯度、経度、及び視野パラメータは、デコーダの後に出力画像に適用されるビューポートを示す。
【0025】
表2は、代替の全方向性のビューポートSEIメッセージシンタックスを与える。
【0026】
【表2】
いくつかの実施形態において、全方向性のビューポートSEIメッセージは、ユーザが見る方向の制御を有してないか又は見る方向の制御をビューポート提言に解放している場合に表示のために推奨されるビューポートに対応する、4つの大円によって境界された球面座標ジオメトリの1つ以上の領域の座標を指定する。
【0027】
omni_viewport_idは、1つ以上の推奨されるビューポート領域を特定するために使用され得る識別番号を含む。
【0028】
1に等しいomni_viewport_cancel_flagは、SEIメッセージが出力順序におけるいずれかの前の全方向性ビューポートSEIメッセージの持続をキャンセルすることを示す。0に等しいomni_viewport_cancel_flagは、全方向性ビューポート情報が続くことを示す。これは、ビューポートSEIがビューポートに変化があるときにのみ使用されるように、使用され得る。
【0029】
omni_viewport_persitence_flagは、現在のレイヤについての全方向性ビューポートSEIメッセージの持続を指定する。0に等しいomni_viewport_persitence_flagは、全方向性ビューポートSEIメッセージが現在の復号されたピクチャのみに適用されることを指定する。1に等しいomni_viewport_persitence_flagは、次の条件のうちの1つ以上が真であるまで全方向性ビューポートSEIメッセージが出力順序において現在のレイヤのために持続することを指定する。picAを現在のピクチャであるとする:
現在のレイヤの新しいCLVSが開始する。
ビットストリームが終了する。
現在のレイヤに適用可能である全方向性ビューポートSEIメッセージを含むアクセスユニットにおける現在のレイヤ内のピクチャpicBは、picBのピクチャ順カウントについての復号化プロセスの起動の後直ちに、PicOrderCnt(picB)及びPicOrderCnt(picA)がpicB及びpicAのPicOrderCntVal値であるとして、PicOrderCnt(picB)がPicOrderCnt(pica)よりも大きい場合に、出力される。
【0030】
0に等しいerp_cancel_flagを含む正距円筒図法SEIメッセージ又は0に等しいcmp_cancel_flagを含むキューブマップ投影SEIメッセージが、現在のピクチャに適用されるCLVSに存在せず、復号化順序において全方向性ビューポートSEIメッセージに先行する場合に、0に等しいomni_viewport_cancel_flagを含む全方向性ビューポートSEIメッセージは、現在のピクチャに適用されるCLVSにおいて存在してはならない。デコーダは、現在のピクチャに適用されるCLVSにおいて、復号化順序において0に等しいerp_cancel_flagを含む全方向性ビューポートSEIメッセージ又は0に等しいcmp_cancel_flagを含むキューブマップ投影SEIメッセージに続かない、0に等しいomni_viewport_cancel_flagを含む全方向性ビューポートSEIメッセージを無視すべきである。
【0031】
omni_viewport_cnt_minus1 plus1は、SEIメッセージによって示されている推奨されるビューポート領域の数を特定する。omni_viewport_cnt_minus1が0よりも大きく、且つ、推奨されるビューポートが表示されるよう提案される情報がない場合に、以下が適用される:
omni_viewport_idが0又は1に等しい場合に、0番目の推奨されるビューポートは、ユーザが見る方向の制御を有してないか又は見る方向の制御を解放している場合に、表示されるよう提案される。
【0032】
omni_viewport_azimuth_centre[i]及びomni_viewport_elevation_centre[i]は、2-16度やラジアンの単位、又はグローバル座標軸に対する何らかの他の所望の単位で、i番目の推奨されるビューポート領域の中心を示す。
【0033】
omni_viewport_tilt_centre[i]は、2-16度の単位で、i番目の推奨されるビューポート領域の傾斜角を示す。omni_viewport_hor_range[i]は、i番目の推奨されるビューポート領域の方位角範囲を示す。omni_viewport_ver_range[i]は、i番目の推奨されるビューポート領域の仰角範囲を示す。
【0034】
それらのパラメータ、単位、及び値の範囲の夫々の具体的な定義は、如何なる他の特定の実施にも適するよう変更されてよい。同様に、パラメータのうちのいずれか1つ以上は、他の実施に適するよう削除されても又は別のパラメータに置換されてもよい。更なるパラメータが加えられてもよく、パラメータの順序は、種々の実施に適するよう変更されてよい。
【0035】
図4は、正距円筒図法フォーマット投影の図である。オリジナルの球面ビュー266が左に示されており、包まれていない平面グリッド260上への球の投影が右に示されている。不連続性が右側の長方形平面フレーム260の左端262及び右端264で導入されている。左側の現実世界の球表現では、左右の端はつながっている。その上、有意なワーピングが、右側のフレームの上及び下に沿ったピクセルを変形させる。これは、左側の北極及び南極領域に対応する。特定の提案されるビューポートは、正距円筒図法フォーマットの左右の端を横断し得るので、符号化された投影フォーマットフレームにおける2つの異なった領域に対応することになる。同様に、特定の提案されるビューポートは、変形されている上端の異なる部分にわたってもよい。
【0036】
空間方向イントラ予測及びブロック並進運動補償を使用する現在のビデオ符号化標準は、極の近くで又は左右の端に沿ってよりも、正距円筒図法の予測の中心の近くでより良く機能する。左/右端の不連続性を横切って広がるオブジェクトは、空間イントラダイレクション(intra-direction)位置を用いて又は動き補償により満足に予測され得ない。
【0037】
キューブマップ投影では、6つの立方体面が長方形フレームに配置される。図5は、球が0から5のラベルを付された6つの平面上に投影されるキューブマップ投影の図である。6つの面の夫々は、球の一部の上に投影される。面は、次いで、平面グリッドにおいて表示され得る。図6は、投影の隣接エリアが互いに隣に置かれている6つの面の4×3平面レイアウトを表す。図示されるように、面1と2、1と3、1と4、4と0、及び0と5の間の境界は隣接したまま保たれる。しかし、他の境界は、それらが図6においてあるように、互いに隣接して置かれていない。2及び3の面は、面4、5、又は0のいずれかの辺上にあるよう動かされて、代わりにそれらの境界を保持してもよい。平面グリッド表現は、多くのコーデック並びに他のデジタル処理及び圧縮システムに大変都合良くできているが、一方で、立方体を表すピクセルを含まない図6の平面フレームのいくつかのエリアが存在する。面4、5及び0の上及び下にはエリアが存在する。それらの面は、背景色に設定されるが、符号化するためにいくらかのデータを必要とする。図7は、3×2平面レイアウトを表し、立方体面が、よりコンパクトなレイアウトに適合するよう並べ直されている。図7の表現は、エッジを処理することにおいていくらかの追加の複雑性を必要とし得るが、ピクセル数は、4×3から3×2まで半分に減らされる。
【0038】
キューブマップ投影フォーマットの符号化のための回転方向の選択は、投影フォーマットが不連続性の数及び位置で異なるということで、選択された特定のレイアウトに依存する。夫々の立方体面のエッジ領域は、立方体面の中心領域よりもひずみが大きい。回転方向の選択は、特に、立方体面エッジにおける不連続性にまたがるオブジェクトを最小限にしようと試みる。エッジとともに面を含む他の投影フォーマットも、同様の不連続性及びひずみを導入する。
【0039】
図8は、正20面体投影の図である。これは、球表現から20面体を使用する平面表現への他のタイプの投影である。この例では、左側は、図5のキューブマップの6つのみの小面よりもむしろ、周囲の20面体の20個の小面上に投影された球280を示す。20個の小面は、次いで、右側で2次元空間282に配置されるよう示されている。他の投影と同様に、小面の夫々の端にはひずみ及び不一致が存在する。より多くの小面を使用することは、ひずみの量を減らすが、継ぎ目の数及び位置を増やす。
【0040】
様々な他の投影のいずれもが、8面体、四角すい台、及び様々な他のタイプの多角形投影のいずれかを含め、上述されたように使用されてよい。より多くの小面によれば、夫々の小面のひずみは低減されるが、複雑性は増大されることになり、エッジを回避することがより困難になる。
【0041】
いくつかの実施形態において、推奨されるビューポートは、符号化プロセスの部分として選択され得る。いくつかの実施形態において、推奨されるビューポートは、動き又は他の特性についてシーンを解析し、シーンのどの部分が最も関心がある特徴を含むかを決定することによって、“帰納的”(posteriori)プロセスを通じて選択され得る。いくつかの実施形態において、階層化法が、そのアプローチとともに使用可能であり、それにより、フレームのダウンサンプリングされたバージョンが、フル解像度フレームよりもむしろ符号化される。
【0042】
代替のアプローチは、パノラマフレームにおいて高速な動作及び高いテクスチャのエリアを検出し、それらのエリアを、使用される投影フォーマットに応じて、正距円筒図法フレームにおいて、又は立方体面において中心に置くことを目指すことである。
【0043】
上記のSEIメッセージは、球状の選択されたビューポートSEIメッセージと組み合わせて使用されてよい。2つのSEIメッセージが一緒に使用される場合に、球回転情報方向SEIメッセージによって提案される回転が最初に適用されてよく、次いで、提案されるビューポートSEIメッセージからの提案されるビューポート位置が、回転される球表現に対して決定される。
【0044】
フレームパック形式のステレオビデオがビデオフレーム内に含まれる場合には、方向値が夫々のビューについて別々に送出されてよく、あるいは、第2ビューのための値は、場合により、第1ビューに対する台にビューの相対位置に関する如何なる情報も考慮して、第1ビューの値に基づき導出されてよい。
【0045】
図9は、パノラマ多重カメラビューを有する球302、及び平面304への球の正距円筒図法の図である。この例では、ビデオコンテンツは、球面における楕円314、316及び三角形312として表現される。楕円の2つの部分314、316は、パノラマビューの2つの側で見られる同じ楕円を表す。それらのオブジェクトは、正距円筒図法マッピング304に投影され、同じ楕円の2つの部分324、326及び三角形322となって現れる。正距円筒図法マッピングにおいて、楕円は、左右の端にまたがる不連続性を有している。それはまた、それが北極に近いということで、水平方向に伸ばされている。
【0046】
図10は、球面回転が球に適用された後の同じコンテンツの球334及び長方形マッピング336の図である。回転された球の楕円332は、このとき、フレームの中心により近い。三角形330は、楕円と同じくらい中心に近く、それにより、2つのアイテムのひずみはおおよそ同じになる。正距円筒図法では、あらゆる2次元オブジェクトがひずんでいる。ひずみの量は、中心からの距離とともに増大する。回転なしの同じ球302と比較して、回転された球334により示されるように、楕円の不連続性はもはやない。楕円はフレームの中心により近いので、ひずみも小さくなる。三角形も改善されるがそれほど重要でない。投影の平面グリッド336は、投影された楕円340及び投影された三角形338がグリッドの真ん中に近いことをより明らかにする。グリッドの真ん中ではひずみがより小さく、楕円は回転前の投影304のように2つではなく1つの部分にある。回転されたフレームに基づき符号化されるビデオは、回転されないフレームを使用するビデオよりもレガシー・ビデオエンコーダによって効率的に符号化するはずである。
【0047】
様々な他の投影のいずれもが、8面体、四角すい台、及び様々な他のタイプの多角形投影のいずれかを含め、上述されたように使用されてよい。より多くの小面によれば、夫々の小面のひずみは低減されるが、複雑性は増大されることになり、エッジを回避することがより困難になる。選択されたビューポートは、それでもなお、緯度、経度、又は他の座標を用いて示され得る。
【0048】
図2に戻ると、特異な構造及び構成は、投影を使用するパノラマビデオ、360度ビデオ、VRビデオシステム及び何らかの他の広視野システムについてのユーザの経験を改善する。その構造の動作は、上記の球から長方形へのマッピングの記載に照らして、より良く理解され得る。
【0049】
図11は、上述されたように、好ましいビューポートを使用し、ビューポート指示を送出するプロセスフロー図である。サーバ又はサーバ側202では、投影マッピングが、404で広視野ビデオを受け取る。図中、ビデオは複数台のカメラから受け取られ、そうして、マッピングモジュール又は他のビデオ縫合部は、402で、複数台のカメラからのビデオをまとめて、単一の広視野ビデオを生成する。他の場合に、ビデオは、前もって記憶され、次いで、符号化のために取り出されてもよく、あるいは、ビデオの一部又は全ては、ソフトウェア及びユーザ入力に基づきグラフィクスシステムによって生成されてもよい。ビデオ入力は、シミュレーションされた又は仮想の世界を含んでもよく、あるいは、仮想部分及び現実部分が組み合わされて存在してもよい。ビデオは、180度、360度、パノラマ、又は何らかの他の広視野であってよい。ビデオは、垂直視野よりも広い水平視野を有してもよい。
【0050】
どんなふうにでも生成又は受け取られた、完全な縫合された広視野ビデオは、次いで、406で平面投影にマッピングされる。多種多様な投影のいずれかが使用されてよい。正距円筒図法、球面キューブ投影、及び8面体投影が図示及び記載されているが、他の投影も存在してよい。
【0051】
本明細書で示される例では、ビデオは球状であるが、完全な球は必要とされない。ビデオは、球の一部分のみを含んでよい。上記の180度視野は球の半分のみである。視野は、球の一部分のみを示すよう水平方向及び垂直方向の両方で小さくされ得る。他方で、視野は、球の一部のように湾曲している。これは、画像が全ての方向で視聴者から同じ距離であることを可能にする。
【0052】
この湾曲した画像は、次いで、上記の例を含むあらゆる望ましいタイプのジオメトリも用いて平面上に投影される。球の一部の全て及び部分である湾曲した視野は固有ひずみを有さない一方、そのような湾曲面の平面投影はひずみを有する。平面投影は、しかしながら、符号化、圧縮、及び他の画像処理に適している。
【0053】
ビデオがマッピングされる前又は後で、適切なビューポート選択が408でシーンについて受け取られる。選択は、いくつかの実施形態では、重要なエリア又は関心領域がビューポート内にあるように行われる。いくつかの実施形態において、シーンは、ビューポートを選択するために解析される。代替的に、ビューポート選択は製作者又はクリエータからであり、あるいは、視聴者統計値に基づく。いくつかの実施形態において、仮想現実の場合のように、ビューポートはまた、ユーザからも受け取られる。これは、サーバエンドで選択されたビューポートを使用したくないユーザのための選択肢を提供し得る。ビューポートは、広視野ビデオのどの部分がユーザの視野内、従って、ユーザの視野の真ん中になるかを示す。このエリア又は領域は、それを他のエリアを重要ならしめる話者、キャラクタ、新たに現れるオブジェクト又はその他特徴を有し得る。このエリア又は領域は、次いで、推奨又は選択されるビューポートに対応する最重要として選択されてよい。
【0054】
受け取られた又は生成されたビューポートは、次いで、410で、ビデオ内のその位置を決定するようビデオと比較される。位置は、球面投影における緯度及び経度として、又は平面投影における位置として特定され得る。平面投影位置は、直交座標として又は何らかの他の方法で示されてよい。その上、ビューポートのサイズが示されてもよい。表1及び2の例では、サイズは、水平及び垂直視野として示されるが、ピクセルの数又は水平及び垂直方向における角度若しくは直線距離を含む他の単位が使用されてもよい。
【0055】
ビューポートのサイズは、ユーザのビューがビューポートの大きさに応じてより大きく又はより狭くされるズーム効果を作り出すために使用されてよい。他の実施形態では、ビューポートのためのより大きい視野がユーザの視野全体を満たし得るように、ユーザのビューは同じサイズのままである。ビューポートのためのより小さい視野は、ユーザの視野の一部分しか満たさない。より小さい視野は、ユーザが、推奨されるビューポートの傍らの要素を見るためにビューポートを別の位置へ動かすことを可能にし得る。
【0056】
球面ビデオにおける位置は、多種多様な方法で表現され得る。球面座標では、ロール、ピッチ、及びヨーが、代替的に、球面上の位置を表現するために使用され得る。それらのうちの1つ以上が使用されてよく、あるいは、直交座標、例えば、垂直及び水平が投影を参照して使用されてもよい。ロール、ピッチ、及びヨーについて、3つ全てが使用される必要はない。関心領域を極から離すために1つしか必要とされないことがある。ロール、ピッチ、及びヨーについての回転情報は角度として表現され得る。回転の角度は、ビデオの元の座標に対する。その上、ビデオの絶対的な向き(absolute orientation)がメタデータに含まれてもよい。絶対的な向きは、カメラの、又はカメラ配列が存在する場合には、複数台のカメラのうちの1台以上の、向きを反映する。
【0057】
ビューポートが決定された後、次いで、関心領域選択部212が、412で、選択されたビューポートを記述するビューポートメタデータを生成する。これはビデオエンコーダへ供給され、それにより、ビデオエンコーダが414で球面ビデオの平面投影を符号化する場合に、ビューポートメタデータが、416で、符号化されたビデオに含まれるようにする。回転方向メタデータも417で含まれてもよい。メタデータを伴った符号化されたビデオは、次いで送信、バッファリング、又は記憶され、それにより、それは、即時又は後の伝送及び表示のために、符号化されたビデオとして供給され得る。HEVC及びAVCのような多くのタイプの符号化の場合に、SEIメッセージが使用されてよい。なお、本発明はそのように制限されない。
【0058】
ビューポートの選択は、ビデオの各フレームについて、又は関心領域が動く各フレームについて行われてよい。SEIメッセージは特定のフレームに関係しており、それにより、関心領域が動いたフレームは、それ自体のビューポートメッセージを有し得る。いくつかの場合に、メッセージは、新しいビューポートメッセージが受け取られるまで次の組のフレームについてのビューポート選択をキャンセルすることであってよい。これは、表1及び2において先に図示及び記載されたフラグを用いて行われ得る。これは、夫々のシーン及び関心領域の変化が、対応するフレームについてのビューポートを変更するよう、異なるSEIメッセージによりフラグを立てられることを可能にする。
【0059】
受信器又はクライアント側204では、SEIメッセージのようなメタデータを含む符号化されたビデオが、422で、サーバ及び放送局から受け取られる。クライアントは、424でビデオを復号し、426でビューポートメタデータを取り出すデコーダを備える。ビューポートが、次いで、ビューポートメタデータに基づき、復号されたビデオについて生成され得る。回転方向メタデータもメタデータに含まれる場合には、次いで、回転が427で実行されてよい。回転は、ピッチ、ロール、及びヨー角によって、又はメッセージにおいて示される何らかの他の方法で決定される。これは、カメラ又はエンコーダで適用された回転を逆にする球面ビデオの回転である。ビデオのこのビューポートは次いで、ユーザによる鑑賞のためのヘッドセット、3Dモニタ、又は2D表示画面のようなディスプレイへ供給される。
【0060】
多くの用途について、ユーザインターフェイスの位置選択部230を通じてユーザによって選択されたビューポートが存在する。これは、従来のユーザ入力デバイスを通じて、又は何らかの他のセンサを通じて行われてよい。VRヘッドセットの場合に、ヘッドセット又はユーザの目の動きが検出され、ビューポートは、ユーザがどこを見ているかに基づき決定され得る。ビューポート生成部226は次いで、メタデータからの推奨されるビューポート、ユーザが選択したビューポート、又はそれら2つの組み合わせのいずれか1つを用いて、復号されたビデオのビューを生成してよい。
【0061】
428で、位置選択部から受け取られたもののような、ユーザ選択のビューポートを使用すべきかどうかが決定される。決定は、ユーザ入力又はユーザ入力の欠如に基づいてよい。ユーザが選択を行った場合且つユーザ選択が如何なる他のビューポートにも優先することをユーザが示している場合にのみ、ユーザ選択入力を使用するデフォルトが存在してよい。ユーザ選択のビューポートが使用されるべきでない場合には、次いで432で、ビューポートは、取り出されたメタデータを用いて生成される。述べられているように、いくつかの場合に、メタデータにおいて受け取られる1よりも多いビューポート選択が存在してよい。そのような場合に、ディレクターズ・カットのようなデフォルトが存在し、ユーザは、メタデータに含まれる他のビューポートの中から異なるビューポートを選択することを可能にされ得る。
【0062】
ユーザの選択が使用されるべきである場合には、次いで430で、ビューポート生成部は、ユーザ選択を用いてビューポートを生成する。いずれの場合にも、生成されたビューポートは、434で表示のためにビデオとして供給される。
【0063】
上述されたように、受け取られた符号化されたビデオは、複数台のカメラから受け取られるか又はグラフィクスシステムによって生成された広視野の投影である。投影は、正距円筒図法又はあらゆる他の適切な平面投影であってよい。多くのビデオ符号化システムは、SEIメッセージのようなメタデータが、符号化されたビデオの特定のフレームに関連することを可能にする。結果として、デコーダが新しいSEIビューポートメッセージを見つける場合に、ビューポート生成部は、新しいメッセージを用いて対応するフレームについてのビューポートを変更するよう命令され得る。ビューポートは次いで、次のメッセージが来るまで保持され得る。結果として、更なるメタデータが、符号化されたビデオの更なるフレームのために受け取られ得る。
【0064】
図12は、複数の遠隔情報源を伴った高性能HMD(Head Mounted Display)の図である。HMD502は、本体504及び取り付けストラップ506を備える。本体は、仮想世界を装着者に描画するためのユーザディスプレイ及びスピーカを備えている。本体はまた、慣性センサ、マイクロホン及び他のユーザ入力デバイスを備える。処理、通信、及び電力又はバッテリ・スイートは、HMDがビデオ及び音響をレンダリングすること並びにテザリングされたコンピュータ510と無線508で通信することを可能にする。
【0065】
ユーザは、頭部及び身体の動きを通じて仮想世界と相互作用し、更には、音声コマンド、手のジェスチャ及び他のユーザ入力デバイスを用いて相互作用してもよい。ゲームコントローラ520は、更なる制御を供給するよう、テザリングされたコンピュータへ無線508又は他の無線インターフェイス522を通じて結合されてよい。HMDは、レンダリング又は圧縮されたビデオフレーム及びオーディオをユーザへの表示のためにコンピュータから受け取るために、WiFi、WiDi、又は他の高速デジタル無線接続を通じてコンピュータへ結合されてよい。更なる記述、データ、パラメータ、及びコマンドも、コンピュータから受け取られてよい。HMDはまた、コマンド、制御、及び仮想インタラクションデータをコンピュータへ同じ又は他の無線リンクを通じて送出してもよい。コントローラは、例えば、Bluetooth(登録商標)又は免許不要周波数帯(unlicensed bands)を通じて通信してよい。複数の無線インターフェイスが、完全なユーザ経験を提供するよう組み合わされてよい。
【0066】
いくつかの場合に、コンピュータは持ち運び可能であり、ユーザによって携行される。これは、望まれる場合に、有線接続を可能にする。携行されるコンピュータは、ノートブック、タブレット、スマートフォン、又はあらゆる他の望ましい物理構成を有してもよい。他の場合に、コンピュータは固定であり、有線接続によりHMDに取り付けられている。
【0067】
コンピュータは更に、インターネット、LAN(Local Area Network)又は他の有線若しくは無線接続を通じて遠隔サーバ516へ接続されてよい。遠隔サーバは、符号化されたビデオを供給し、そして、仮想世界に関する追加情報を供給し得る。遠隔サーバはまた、同じ又は関連する仮想世界を経験している他のユーザとのやり取りも提供し得る。代替的に、HMDは、コンピュータ510を経由することなしにサーバと直接に通信してもよい。他の実施形態では、遠隔サーバは使用されず、テザリングされたコンピュータが独立して動作する。
【0068】
本明細書中の例では、ワイヤレスHMDは、受け取られた符号化されたビデオを記憶及びレンダリングすることをHMDに可能にするようGPU(Graphics Processing Unit)、グラフィクスプロセッサ、メモリ及び他の資源へ結合され得るスCPU(Central Processing Unit)のようなローカル計算資源又はクライアントデバイスを備える。ローカルレンダリングは、数あるタスクの中でも特に、記載された回転及びビューポート生成を含み得る。
【0069】
図13は、1つの実施に従うコンピュータデバイス100を表す。コンピュータデバイス100はシステムボード42を内蔵する。ボード42は、制限なしに、プロセッサ44及び少なくとも1つの通信パッケージ46を含む多数のコンポーネントを含んでよい。通信パッケージは、1つ以上のアンテナ16へ結合されている。プロセッサ44は、物理的及び電気的にボード42へ結合されている。
【0070】
その用途に応じて、コンピュータデバイス100は、ボードへ物理的及び電気的に結合されても又はされなくてもよい他のコンポーネントを含んでもよい。それらの他のコンポーネントは、制限なしに、揮発性メモリ(例えば、DRAM)48、不揮発性メモリ(例えば、ROM)49、フラッシュメモリ(図示せず。)、グラフィクスプロセッサ12、デジタル信号プロセッサ(図示せず。)、暗号化プロセッサ(図示せず。)、チップセット14、アンテナ16、タッチスクリーンディスプレイのようなディスプレイ18、タッチスクリーンコントローラ20、バッテリ22、オーディオコーデック(図示せず。)、ビデオコーデック(図示せず。)、電力増幅器24、グローバルポジショニングシステム(GPS)デバイス26、コンパス28、加速度計(図示せず。)、ジャイロスコープ(図示せず。)、スピーカ30、カメラアレイ32、マイクロホンアレイ34、及び大容量記憶デバイス(例えば、ハードディスクドライブ)10、コンパクトディスク(CD)(図示せず。)、デジタルバーサタイルディスク(DVD)(図示せず。)、などを含む。それらのコンポーネントは、システムボード42へ接続されるか、システムボードに実装されるか、又は他のコンポーネントのいずれかと組み合わされてよい。
【0071】
カメラアレイは、イメージチップ36へ、且つ、直接に又はイメージチップを通じて、プロセッサ44へ結合されてよい。イメージチップは、グラフィクス・コプロセッサ、デジタル信号プロセッサ(DSP)、イメージ信号プロセッサ(ISP)、又はあらゆる他のタイプの別個の専用のイメージング管理モジュールのような、多種多様な形態をとり得る。そのようなデバイス又はモジュールは、1つ以上の画像を捕捉、処理、編集、圧縮、記憶、印刷、及び/又は表示するよう動作可能なロジック、アルゴリズム、及び/又は命令を有してよい。いくつかの実施形態において、イメージング管理モジュールは、イメージングアプリケーション又はオペレーティングシステム内にソフトウェアとして実装されるプログラミングルーチン、関数、及び/又はプロセスを有してよい。様々な他の実施形態では、画像処理は、スタンドアローンのチップ若しくは集積回路として、あるいは、プロセッサ内、グラフィクスチップ又は他の集積回路若しくはチップ内、又はカメラモジュール内に含まれる回路構成として実装されてよい。上記の技術は、プロセッサのイメージチップにおいて実装されてよく、あるいは、機能は、カメラ、イメージチップ、プロセッサ、及び他のコンポーネントを含み得る異なるコンポーネント間で分配されてもよい。
【0072】
通信パッケージ46は、コンピュータデバイス100への及びそれからのデータの転送のための無線及び/又は有線通信を可能にする。語「無線」及びその派生語は、非固体媒体を経る変調された電磁放射の使用によりデータを通信し得る回路、デバイス、システム、方法、技術、通信チャネルなどを記載するために使用され得る。その語は、関連するデバイスが如何なる配線も含まないことを暗示するものではないが、いくつかの実施形態ではそうでないことがある。通信パッケージ46は、制限なしに、Wi-Fi(IEEE802.11ファミリー)、WiMAX(IEEE802.16ファミリー)、IEEE802.20、ロングタームエボリューション(LTE)、Ev-DO、HSPA+、HSDPA+、HSUPA+、EDGE、GSM(登録商標)、GPRS、CDMA、TDMA、DECT、Bluetooth(登録商標)、そのEthernet(登録商標)派生物、並びに3G、4G、5G以上と表されるあらゆる他の無線及び有線プロトコルを含む多数の無線又は無線標準又はプロトコルのいずれかを実装してよい。コンピュータデバイス100は、複数の通信パッケージ46を含んでもよい。例えば、第1通信パッケージ46は、Wi-Fi及びBluetooth(登録商標)のような短距離無線通信に専用であってよく、第2通信パッケージ46は、GPS、EDGE、GPRS、CDMA、WiMAX、LTE、Ev-DO、及び他のような長距離無線通信に専用であってよい。
【0073】
様々な実施において、コンピュータデバイス100は、ラップトップ、ネットブック、ノートブック、ウルトラブック、スマートフォン、ウェアラブルデバイス、タブレット、パーソナルデジタルアシスタント(PDA)、ウルトラモバイルPC、携帯電話機、デスクトップコンピュータ、サーバ、プリンタ、スキャナ、モニタ、セットトップボックス、エンターテイメント制御ユニット、デジタルカメラ、携帯型音楽プレーヤ、又はデジタルビデオレコーダであってよい。コンピュータデバイスは、固定、ポータブル、又はウェラブルであってよい。更なる実施では、コンピュータデバイス100は、データを処理する如何なる他の電子デバイスであってもよい。
【0074】
カメラアレイ32は、図1及び2を参照して記載されるタイプ又は他の適切な構成のものであってよい。カメラアレイは、コンピュータデバイス100の残りと同じ筐体に組み込まれてよく、あるいは、それは、適切な有線又は無線コネクタを通じて取り付けられた別個の周辺機器であってもよい。コンピュータデバイスは、固定又はポータブル構成においてサーバデバイス、編集デバイス、又はクライアントデバイスとして使用されてもよい。
【0075】
実施形態は、1つ以上のメモリチップ、コントローラ、CPU(Central Processing Unit)、マザーボードを用いて相互に接続されたマイクロチップ若しくは集積回路、特定用途向け集積回路(ASIC)、及び/又はフィールドプログラマブルゲートアレイ(FPGA)の一部として実装されてよい。
【0076】
「1つの実施形態」、「実施形態」、「例となる実施形態」、「様々な実施形態」等への言及は、そのように記載される実施形態が特定の特徴、構造、又は特性を含み得るが、あらゆる実施形態が必ずしも特定の特徴、構造、又は特性を含むわけではないことを示す。更に、いくつかの実施形態は、他の実施形態について記載されている特徴の一部又は全てを有してよく、あるいは、全く有さなくてもよい。
【0077】
以下の記載及び特許請求の範囲で、語「結合される」はその派生語とともに、使用されることがある。「結合される」は、2つ以上の要素が互いと協働又は相互作用することを示すために使用されるが、それらは、それらの間に介在する物理的又は電気的なコンポーネントを有しても又は有さなくてもよい。
【0078】
特許請求の範囲で使用されるように、特段示されない限りは、共通の要素について説明するための序数形容詞「第1」、「第2」、「第3」などの使用は、同じ要素の異なるインスタンスが参照されていることを示すにすぎず、そのように記載される要素が時間的に、空間的に、順位付けにおいて、又はあらゆる他の方法において所与の順序でなければならいことを示す意図はない。
【0079】
図面及び前述の記載は、実施形態の例を与える。当業者に明らかなように、記載される要素のうちの1つ以上は単一の機能要素にまとめられる。代替的に、特定の要素は複数の機能要素に分けられてもよい。1つの実施形態からの要素は、他の実施形態に加えられてもよい。例えば、本明細書で記載されるプロセスの順序は変更されてよく、本明細書で記載される様態に制限されない。更に、如何なるフロー図の動作も、示されている順序で実装される必要はなく、全ての動作が必ずしも実行される必要もない。また、他の動作に依存しないそれらの動作は、他の動作と並行して実行されてもよい。実施形態の適用範囲は、それらの具体的な例によって決して制限されない。構造、大きさ、及び材料の使用の違いといった多数の変形例は、明細書中で明示的に与えられていようとなかろうと、可能である。実施形態の適用範囲は、少なくとも、続く特許請求の範囲によって与えられているのと同じ広さである。種々の実施形態の様々な特徴は、多種多様な用途に適するよういくつかの特徴が含まれて他が除外された状態で様々に組み合わされてよい。
【0080】
いくつかの実施形態は、ビューポートメタデータを含む符号化されたビデオを受け取ることと、前記ビデオを復号することと、前記ビューポートメタデータを取り出すことと、前記ビューポートメタデータに基づき前記復号されたビデオのビューポートを生成することと、表示のために前記生成されたビューポートをバッファリングすることとを含む方法に関連する。
【0081】
更なる実施形態では、前記ビューポートメタデータは、関心領域の中心を含む。
【0082】
更なる実施形態では、前記中心は、ビューポート表示の緯度及び経度として示される。
【0083】
更なる実施形態では、前記ビューポートメタデータは、前記中心からの距離に基づく前記関心領域の視野を含む。
【0084】
更なる実施形態では、前記視野は、水平角及び鉛直角として示される。
【0085】
更なる実施形態では、前記ビューポートメタデータは、付加拡張情報メッセージとして符号化される。
【0086】
更なる実施形態では、前記受け取られた符号化されたビデオは、広視野の平面投影である。
【0087】
更なる実施形態では、前記平面投影は正距円筒図法であり、前記広視野はパノラマである。
【0088】
更なる実施形態では、前記ビューポートメタデータは、前記受け取られた符号化されたビデオのフレームに関連し、当該方法は、前記符号化されたビデオの追加フレームのための追加のビューポートメタデータを受け取ることを有する。
【0089】
更なる実施形態は、ユーザ選択のビューポートを使用することをユーザが指示しているかどうかを判定し、そうである場合には、次いで、前記ビューポートメタデータを用いてビューポートを生成することの代わりに、前記ユーザ選択のビューポートを用いてビューポートを生成することを含む。
【0090】
更なる実施形態では、前記ビューポートメタデータは、複数のビューポートを含み、当該方法は、前記複数のビューポートから1つを選択することを更に有し、ビューポートを生成することは、前記複数のビューポートの中の前記選択された1つを用いてビューポートを生成することを有する。
【0091】
更なる実施形態では、前記複数のビューポートから1つを選択することは、前記複数のビューポートの中の1つのユーザ選択を受け取ることを有する。
【0092】
更なる実施形態では、前記複数のビューポートのサイズは、ズーム効果をもたらすために使用される。
【0093】
更なる実施形態では、前記ビューポートメタデータは、前記受け取られた符号化されたビデオのフレームに関連し、当該方法は、前記符号化されたビデオの追加フレームのための追加のビューポートメタデータを受け取ることを有する。
【0094】
更なる実施形態では、前記符号化されたビデオは、回転方向メタデータを更に含み、当該方法は、前記回転方向メタデータを取り出すことと、前記回転方向メタデータに基づき前記復号されたビデオを回転させることとを含み、前記ビューポートを生成することは、前記回転された復号されたビデオを用いてビューポートを生成することを有する。
【0095】
更なる実施形態は、マシン読出可能な媒体であって、実行される場合に、前記マシンに、ビューポートメタデータを含む符号化されたビデオを受け取ることと、前記ビデオを復号することと、前記ビューポートメタデータを取り出すことと、前記ビューポートメタデータに基づき前記復号されたビデオのビューポートを生成することと、表示のために前記生成されたビューポートをバッファリングすることとを有する動作を実行させる命令を記憶している媒体に関連する。
【0096】
更なる実施形態は、ビューポートメタデータを含む広視野ビデオを受け取り、前記ビューポートメタデータを取り出すビデオ復号部と、復号されたビデオのビューポートを前記ビューポートメタデータに基づき生成し、該生成されたビューポートを表示のためにバッファリングするビューポート生成部とを含む装置に関連する。
【0097】
更なる実施形態は、広視野ビデオを受け取ることと、前記ビデオを平面投影にマッピングすることと、前記ビデオに含まれる選択された関心領域を受け取ることと、前記選択された関心領域を記述するビューポートメタデータを生成することと、前記ビューポートメタデータを含む符号化されたビデオとして前記平面投影を符号化することと、前記符号化されたビデオを記憶することとを含む方法に関連する。
【0098】
更なる実施形態では、前記ビューポートメタデータは、前記関心領域の中心を含む。
【0099】
更なる実施形態では、前記中心は、ビューポート表示の緯度及び経度として示される。
【0100】
更なる実施形態では、前記ビューポートメタデータは、前記中心からの距離に基づく前記関心領域の視野を含む。
【0101】
更なる実施形態では、前記視野は、水平角及び鉛直角として示される。
【0102】
更なる実施形態では、前記ビューポートメタデータは、付加拡張情報メッセージとして符号化される。
【0103】
更なる実施形態では、前記受け取られた広視野ビデオは、複数台のカメラから受け取られ、当該方法は、前記複数台のカメラからのビデオを縫合して単一の広視野ビデオを生成することを更に有する。
【0104】
更なる実施形態では、前記ビデオをマッピングすることは、前記ビデオを正距円筒図法にマッピングすることを有し、前記広視野はパノラマである。
【0105】
更なる実施形態は、前記投影の回転を選択することと、該選択された回転を記述する回転方向メタデータを生成することと、前記選択された回転に基づき前記投影を回転させることとを含み、前記平面投影を符号化することは、前記投影を回転させた後に符号化し、前記回転方向メタデータを前記符号化されたビデオに含めることを有する。
【0106】
いくつかの実施形態は、マシン読出可能な媒体であって、実行される場合に、前記マシンに、広視野ビデオを受け取ることと、前記ビデオを平面投影にマッピングすることと、前記ビデオに含まれる選択された関心領域を受け取ることと、前記選択された関心領域を記述するビューポートメタデータを生成することと、前記ビューポートメタデータを含む符号化されたビデオとして前記平面投影を符号化することと、前記符号化されたビデオを記憶することとを有する動作を実行させる命令を記憶している媒体に関連する。
【0107】
更なる実施形態は、動きについて前記ビデオのシーンを解析し、該シーンのどの部分が最も速い動きを含むかを決定することによって、前記選択された関心領域を選択することを含む。
【0108】
いくつかの実施形態は、広視野ビデオを受け取るバッファと、前記ビデオを平面投影にマッピングする投影マッピングモジュールと、前記ビデオに含まれる選択された関心領域を受け取り、前記選択された関心領域を記述するビューポートメタデータを生成する関心領域選択部と、前記ビューポートメタデータを含む符号化されたビデオとして前記平面投影を符号化し、該符号化されたビデオを記憶する符号化部とを含む装置に関連する。
【0109】
更なる実施形態では、前記関心領域選択部は、最も高い複雑性を持った特徴を有するとして前記選択された関心領域を選択するよう前記ビデオを更に解析する。
【0110】
[関連出願の相互参照]
本願は、“SUGGESTED VIEWPORT INDICATION FOR PANORAMIC VIDEO”と題されて2016年11月17日に出願された米国特許仮出願第62/423343号に基づく優先権を主張する。優先権の基礎をなすこの特許出願の開示は、これをもって、参照により本願に援用される。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13