IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ソニー・コンピュータエンタテインメントの特許一覧

特表2022-548335マルチセグメント時間リサンプリングを使用した高速対象領域コーディング
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-11-17
(54)【発明の名称】マルチセグメント時間リサンプリングを使用した高速対象領域コーディング
(51)【国際特許分類】
   H04N 19/132 20140101AFI20221110BHJP
   H04N 19/167 20140101ALI20221110BHJP
   H04N 19/17 20140101ALI20221110BHJP
   H04N 19/31 20140101ALI20221110BHJP
【FI】
H04N19/132
H04N19/167
H04N19/17
H04N19/31
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2022527739
(86)(22)【出願日】2020-10-20
(85)【翻訳文提出日】2022-06-14
(86)【国際出願番号】 US2020056442
(87)【国際公開番号】W WO2021096644
(87)【国際公開日】2021-05-20
(31)【優先権主張番号】62/934,284
(32)【優先日】2019-11-12
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】16/721,733
(32)【優先日】2019-12-19
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】310021766
【氏名又は名称】株式会社ソニー・インタラクティブエンタテインメント
(74)【代理人】
【識別番号】100105924
【弁理士】
【氏名又は名称】森下 賢樹
(72)【発明者】
【氏名】ワン、ジェイソン
(72)【発明者】
【氏名】クリシュナン、ラティシュ
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159MA33
5C159MB02
5C159MB26
5C159TA07
5C159TB18
5C159TC34
5C159UA02
5C159UA05
(57)【要約】
【解決手段】ビデオ符号化のための方法、システム、及びコンピュータ可読命令は、ピクチャストリーム内及び時間ダウンサンプリング間隔内のピクチャについての1つ以上の対象領域(ROI)パラメータを判定することを含む。ピクチャストリーム内のピクチャ内のROIの外側の1つ以上のエリアは、間隔に従って時間的にダウンサンプリングされる。次いで、結果として生じる時間的ダウンサンプリング済みピクチャが符号化され、符号化された時間的ダウンサンプリング済みピクチャが伝送される。加えて、符号化済みピクチャストリーム内のこのようにして符号化されたピクチャが復号されてもよく、ピクチャのROIの外側のエリアが時間的にアップサンプリングされてもよい。ROIの外側の時間的アップサンプリング済みエリアは、復号された符号化済みピクチャストリームに挿入されてもよい。
【選択図】図1A
【特許請求の範囲】
【請求項1】
ビデオ符号化のための方法であって、
a)ピクチャストリーム内及び時間ダウンサンプリング間隔内のピクチャについての1つ以上の対象領域(ROI)パラメータを判定することと、
b)時間的ダウンサンプリング済みピクチャを生成するよう、前記時間ダウンサンプリング間隔に従って前記ピクチャストリーム内のピクチャ内のROIの外側の1つ以上のエリアを時間的にダウンサンプリングすることと、
c)前記時間的ダウンサンプリング済みピクチャを符号化することと、
d)前記符号化された時間的ダウンサンプリング済みピクチャを伝送することと、
を備えた、方法。
【請求項2】
前記ROIの外側のエリアを時間的にダウンサンプリングすることは、前記ROIの外側の前記エリアを判定するために前記ROIパラメータを使用することと、前記時間ダウンサンプリング間隔の内のフレームについての前記ROIの外側のエリアについて動き情報を省略することと、を含む、請求項1に記載の方法。
【請求項3】
前記動き情報は、動きベクトル、動きベクトルが差す参照ピクチャを識別する情報、または動きベクトルが網羅するセクションサイズを含む、請求項2に記載の方法。
【請求項4】
前記時間的ダウンサンプリング済みピクチャを符号化することは、前記ROIの外側のダウンサンプリング済みエリアを有する前記ピクチャをエントロピ符号化することを含む、請求項1に記載の方法。
【請求項5】
前記ROIの外側のエリアを時間的にダウンサンプリングすることは、前記ROIの外側の前記1つ以上のエリアを判定するために前記ROIパラメータを使用することと、前記ROIの外側のエリアについての前記フレームレートを減少させることと、を含む、請求項1に記載の方法。
【請求項6】
前記時間ダウンサンプリング間隔は、前記ROIの外側の前記エリアについてのフレームレートを決定する、請求項5に記載の方法。
【請求項7】
前記時間ダウンサンプリング間隔は、ピクチャ内のダウンサンプリング位置及び前記対象領域パラメータに基づいて変化する、請求項1に記載の方法。
【請求項8】
前記時間ダウンサンプリング間隔は、前記ピクチャ内の前記ダウンサンプリング位置が前記ROIの位置から離れて移動するにつれて増大する、請求項7に記載の方法。
【請求項9】
前記時間ダウンサンプリング間隔は、前記ピクチャ内の前記ダウンサンプリング位置が前記ROIの位置から離れて移動するにつれて線形レートにおいて増大する、請求項8に記載の方法。
【請求項10】
前記時間ダウンサンプリング間隔は、前記ピクチャ内の前記ダウンサンプリング位置が前記ROIの位置から離れて移動するにつれて非線形レートにおいて増大する、請求項8に記載の方法。
【請求項11】
前記時間ダウンサンプリング間隔は、ROIからの距離に対するダウンサンプリングレートのS字状関数において増大する、請求項10に記載の方法。
【請求項12】
前記時間ダウンサンプリング間隔は、ROIからの距離に対するダウンサンプリングレートに応じて指数関数において増大する、請求項10に記載の方法。
【請求項13】
前記時間的ダウンサンプリング済みピクチャを符号化する前に、サッケードの間に前記ピクチャストリーム内のピクチャにロウパスフィルタを適用することを更に備えた、請求項1に記載の方法。
【請求項14】
前記時間ダウンサンプリング間隔を符号化することと、ネットワークを通じて前記時間ダウンサンプリング間隔を送信することと、を更に備えた、請求項1に記載の方法。
【請求項15】
前記時間的ダウンサンプリング済みピクチャを符号化する前に、前記ROIの外側の前記エリアにマルチセグメント空間ダウンサンプリングを適用することを更に備えた、請求項1に記載の方法。
【請求項16】
前記ROIの外側の前記1つ以上のエリアの特定のエリアについての前記時間ダウンサンプリング間隔は、前記ROIに対する前記特定のエリアの距離に依存する、請求項1に記載の方法。
【請求項17】
前記時間的ダウンサンプリング済みピクチャを前記符号化する前に、前記ROIの外側の前記エリアにマルチセグメント空間ダウンサンプリングを適用することを更に備えた、請求項1に記載の方法。
【請求項18】
ビデオ復号のための方法であって、
a)符号化済みピクチャストリーム内の符号化済みピクチャを復号することと、
b)前記符号化済みピクチャストリームから前記ピクチャのROIの外側のエリアを時間的にアップサンプリングすることと、
c)前記ROIの外側の前記時間的アップサンプリング済みエリアを、前記符号化済みピクチャストリームから前記復号された符号化済みピクチャストリームへの前記ピクチャに挿入することと、
d)前記時間的アップサンプリング済みピクチャを記憶することと、
を備えた、方法。
【請求項19】
前記ROIの外側のエリアを前記時間的にアップサンプリングすることは、前記ダウンサンプリング間隔内のフレームごとに前記ROIの外側のエリアについての動き情報を生成するよう、時間ダウンサンプリング間隔の先頭フレーム及び最後フレームからの前記ROIの外側のエリア内の前記動き情報を補間することを含む、請求項18に記載の方法。
【請求項20】
前記動き情報は、動きベクトルである、請求項19に記載の方法。
【請求項21】
前記ROIの外側のエリアを前記時間的にアップサンプリングすることは、前記ダウンサンプリング間隔内のフレームごとに前記ROIの外側のエリアについての画像を生成するよう、時間ダウンサンプリング間隔の先頭フレームと最後フレームとの間の前記ROIの外側の前記エリアを補間することを含む、請求項18に記載の方法。
【請求項22】
ダウンサンプリング間隔を復号することを更に備えた、請求項18に記載の方法。
【請求項23】
前記ROIの外側の前記時間的アップサンプリング済みエリアを前記ピクチャに挿入した後、マルチセグメント空間アップサンプリングを実行することを更に備えた、請求項18に記載の方法。
【請求項24】
e)において記憶装置に前記時間的アップサンプリング済みピクチャを記憶することと、ディスプレイデバイス上で前記時間的アップサンプリング済みピクチャを表示することと、を更に備えた、請求項18に記載の方法。
【請求項25】
前記符号化済みピクチャストリームから前記ピクチャへの前記ROIの外側の前記時間的アップサンプリング済みエリアを、前記復号された符号化済みピクチャストリームに前記挿入した後、マルチセグメント空間アップサンプリングを実行することを更に備えた、請求項18に記載の方法。
【請求項26】
プロセッサと、
前記プロセッサに結合されたメモリと、
前記メモリに組み込まれた非一時的命令と、を備え、前記非一時的命令は、実行されるとき、
a)ピクチャストリーム内及び時間ダウンサンプリング間隔内のピクチャについての1つ以上の対象領域(ROI)パラメータを判定することと、
b)時間的ダウンサンプリング済みピクチャを生成するよう、前記時間ダウンサンプリング間隔に従って前記ピクチャストリーム内のピクチャ内のROIの外側の1つ以上のエリアを時間的にダウンサンプリングすることと、
c)前記時間的ダウンサンプリング済みピクチャを符号化することと、
d)前記符号化され時間的ダウンサンプリング済みピクチャを伝送することと、
を含む、ビデオ符号化のための方法を前記プロセッサに実行させる、システム。
【請求項27】
前記ROIの外側のエリアを時間的にダウンサンプリングすることは、前記ROIの外側の前記エリアを判定するために前記ROIパラメータを使用することと、前記時間ダウンサンプリング間隔の内のフレームについての前記ROIの外側のエリアについて動き情報を省略することと、を含む、請求項25に記載のシステム。
【請求項28】
前記ROIの外側のエリアを時間的にダウンサンプリングすることは、前記ROIの外側の前記1つ以上のエリアを判定するために前記ROIパラメータを使用することと、前記ROIの外側のエリアについての前記フレームレートを減少させることと、を含む、請求項25に記載のシステム。
【請求項29】
ビデオ符号化のための前記方法は、前記時間的ダウンサンプリング済みピクチャを前記符号化する前に、前記ROIの外側の前記エリアにマルチセグメント空間ダウンサンプリングを適用することを更に含む、請求項25に記載のシステム。
【請求項30】
コンピュータ可読媒体に組み込まれた非一時的命令であって、前記非一時的命令は、実行されるとき、
a)ピクチャストリーム内及び時間ダウンサンプリング間隔内のピクチャについての1つ以上の対象領域(ROI)パラメータを判定することと、
b)時間的ダウンサンプリング済みピクチャを生成するよう、前記時間ダウンサンプリング間隔に従って前記ピクチャストリーム内のピクチャ内のROIの外側の1つ以上のエリアを時間的にダウンサンプリングすることと、
c)前記時間的ダウンサンプリング済みピクチャを符号化することと、
d)前記符号化された時間的ダウンサンプリング済みピクチャを伝送することと、
を含む、ビデオ符号化のための方法をコンピュータに実行させる、非一時的命令。
【請求項31】
前記ROIの外側のエリアを時間的にダウンサンプリングすることは、前記ROIの外側の前記エリアを判定するために前記ROIパラメータを使用することと、前記時間ダウンサンプリング間隔の内のフレームについての前記ROIの外側のエリアについて動き情報を省略することと、を含む、請求項30に記載の非一時的命令。
【請求項32】
前記ROIの外側のエリアを時間的にダウンサンプリングすることは、前記ROIの外側の前記1つ以上のエリアを判定するために前記ROIパラメータを使用することと、前記ROIの外側のエリアについての前記フレームレートを減少させることと、を含む、請求項30に記載の非一時的命令。
【請求項33】
ビデオ符号化のための前記方法は、前記時間的ダウンサンプリング済みピクチャを前記符号化する前に、前記ROIの外側の前記エリアにマルチセグメント空間ダウンサンプリングを適用することを更に含む、請求項30に記載の非一時的命令。
【請求項34】
プロセッサと、
前記プロセッサに結合されたメモリと、
前記メモリに組み込まれた非一時的命令と、を備え、前記非一時的命令は、実行されるとき、
a)符号化済みピクチャストリーム内の符号化済みピクチャを復号することと、
b)前記符号化済みピクチャストリームから前記ピクチャのROIの外側のエリアを時間的にアップサンプリングすることと、
c)前記ROIの外側の前記時間的アップサンプリング済みエリアを、前記符号化済みピクチャストリームから前記復号された符号化済みピクチャストリームへの前記ピクチャに挿入することと、
d)前記時間的アップサンプリング済みピクチャを記憶することと、
を含む、ビデオ復号のための方法を前記プロセッサに実行させる、システム。
【請求項35】
前記ROIの外側のエリアを前記時間的にアップサンプリングすることは、前記ダウンサンプリング間隔内のフレームごとに前記ROIの外側のエリアについての動き情報を生成するよう、時間ダウンサンプリング間隔の先頭フレーム及び最後フレームからの前記ROIの外側のエリア内の前記動き情報を補間することを含む、請求項34に記載のシステム。
【請求項36】
前記ROIの外側のエリアを前記時間的にアップサンプリングすることは、前記ダウンサンプリング間隔内のフレームごとに前記ROIの外側のエリアについての画像を生成するよう、時間ダウンサンプリング間隔の先頭フレームと最後フレームとの間の前記ROIの外側の前記エリアを補間することを含む、請求項34に記載のシステム。
【請求項37】
ビデオ復号のための前記方法は、前記符号化済みピクチャストリームから前記ピクチャへの前記ROIの外側の前記時間的アップサンプリング済みエリアを、前記復号された符号化済みピクチャストリームに前記挿入した後、マルチセグメント空間アップサンプリングを実行することを更に含む、請求項34に記載のシステム。
【請求項38】
コンピュータ可読媒体に組み込まれた非一時的命令であって、前記非一時的命令は、実行されるとき、
a)符号化済みピクチャストリーム内の符号化済みピクチャを復号することと、
b)前記符号化済みピクチャストリームから前記ピクチャのROIの外側のエリアを時間的にアップサンプリングすることと、
c)前記ROIの外側の前記時間的アップサンプリング済みエリアを、前記符号化済みピクチャストリームから前記復号された符号化済みピクチャストリームへの前記ピクチャに挿入することと、
d)前記時間的アップサンプリング済みピクチャを記憶することと、
を含む、ビデオ復号のための方法をコンピュータに実行させる、非一時的命令。
【請求項39】
前記ROIの外側のエリアを前記時間的にアップサンプリングすることは、前記ダウンサンプリング間隔内のフレームごとに前記ROIの外側のエリアについての動き情報を生成するよう、時間ダウンサンプリング間隔の先頭フレーム及び最後フレームからの前記ROIの外側のエリア内の前記動き情報を補間することを含む、請求項38に記載の非一時的命令。
【請求項40】
前記ROIの外側のエリアを前記時間的にアップサンプリングすることは、前記ダウンサンプリング間隔内のフレームごとに前記ROIの外側のエリアについての画像を生成するよう、時間ダウンサンプリング間隔の先頭フレームと最後フレームとの間の前記ROIの外側の前記エリアを補間することを含む、請求項38に記載の非一時的命令。
【請求項41】
ビデオ復号のための前記方法は、前記符号化済みピクチャストリームから前記ピクチャへの前記ROIの外側の前記時間的アップサンプリング済みエリアを、前記復号された符号化済みピクチャストリームに前記挿入した後、マルチセグメント空間アップサンプリングを実行することを更に含む、請求項38に記載の非一時的命令。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の態様は、デジタル画像符号化及び復号に関連する。特に、本開示は、対象領域コーディングに関連する。
【背景技術】
【0002】
ビデオ処理では、対象領域(ROI)コーディングは典型的には、ビデオフレームの残りに対するビデオフレームの選択された部分の視覚品質を高める処理を指す。ROIコーディングは、帯域幅削減のために使用されることがあり、ネットワーク輻輳の間にシーンの重要部分における視覚的忠実度が維持されることを保証する。
【0003】
慣習的なROIコーディングは、ROIの内部のエリアに対してより低い量子化パラメータ(QP)が使用され、残りに対してより高いQPが使用されるように、符号化処理の間にQPを操作することを伴う。これは、ROIの外側のエリアについてのビットの共有を削減することを結果としてもたらし、それは次いで、背景のピクチャ品質を低下させる。このアプローチは、ビットレートを低下させることがあると共に、処理される画素の数を低減させないので、符号化処理を加速化させない。
【0004】
一部の既存の非一様リサンプリング方法は、画像全体に変換関数を適用し、それは、一般的な画像及びビデオ圧縮標準規格に適合しない非矩形画像を結果としてもたらすことがある。非矩形画像配列をコーディングするために、パディング済み画素と共に矩形の境界ボックスが使用され、パディング済み矩形画像は次いで、慣習的な手段を使用して圧縮される。エンコーダが、表示されないパディング済み画素を処理する必要がある場合があるので、このツールは最適でない。
【0005】
他のアプローチは、1つがROIに対するものであり、もう一方が背景に対するものである、2つの別個のビットストリームを利用することがある。符号化時間を削減するために、より低い分解能に背景がダウンサンプリングされることがある。背景に対してROIを混合することによって、最終画像が生成される。この方法の欠点は、2つのエンコーダインスタンスが2つのビットストリームを生成する必要があることである。ディスプレイ側において、2つのデコーダインスタンスが必要であり、追加の同期が必要であり、それは、複雑度を増大させる。
【0006】
本開示の態様が生じるのはこのコンテキストにおいてである。
【図面の簡単な説明】
【0007】
図1A】本開示の態様に従った、時間ダウンサンプリングまたは動き情報により符号化する方法を示す。
図1B】本開示の態様に従った、時間ダウンサンプリングまたは動き情報により符号化する方法のグラフィカル表現である。
図2】本開示の態様に従った、時間的ダウンサンプリング済み画像ストリームを復号する方法を表す。
図3A】本開示の態様に従った、時間ダウンサンプリングする代替的な方法を表す。
図3B】本開示の態様に従った、フレームレート時間ダウンサンプリングする方法をグラフィカルに表す。
図3C】本開示の態様に従った、時間ダウンサンプリングの別の実施態様をグラフィカルに示す。
図3D】本開示の態様に従った、時間ダウンサンプリング及びマルチセグメント空間ダウンサンプリングの両方を有する別の実施態様をグラフィカルに表す。
図4A】本開示の態様に従った、ダウンサンプリング済みフレームレート情報を有する符号化された時間的ダウンサンプリング済みフレームを復号する方法をグラフィカルに表す。
図4B】時間的にダウンサンプリングされたフレームレートである、符号化された撮像済みフレームを復号する方法をグラフィカルに表す。
図4C】本開示の態様に従った、時間的にダウンサンプリングされたフレームレートであり、中間フレーム内のROIの外側の前のフレームからの情報を含む、画像フレームを復号する別の実施態様をグラフィカルに示す。
図4D】本開示の態様に従った、時間的にダウンサンプリングされたフレームレートである画像フレーム及びマルチセグメント空間的ダウンサンプリング済みフレームを復号する別の実施態様を示す。
図5A】本開示の態様に従った、その間に対象領域からの距離に応じて空白にされた情報を有するフレームの事項として時間ダウンサンプリング間隔がどのように変化するかの実施例を例示するグラフである。
図5B】本開示の態様に従った、凝視トラッキングを使用して符号化済みデータサイズを更に削減する方法を表す。
図6A】本開示の態様に従った、動き情報時間ダウンサンプリング処理を表す。
図6B】本開示の態様に従った、フレームレート時間ダウンサンプリング処理を示す。
図7】本開示の態様に従った、ROIパラメータにより時間的ダウンサンプリング済みストリーミングデータを復号する実施例の方法を例示する。
図8A】本開示のコンテキストにおいて使用することができる暗瞳孔凝視トラッキングシステムの実施例を表す。
図8B】本開示の態様に従った、対象領域を判定するアイトラッキングを示す。
図9】本開示の態様に従った、時間ダウンサンプリングにより符号化または復号する実施例のシステムを表す。
【発明を実施するための形態】
【0008】
導入
ROIコーディングを実行する新たな方法は、ROI内の詳細の損失なしに、伝送の間に画像のビットカウントを削減するために、時間ダウンサンプリングを使用する。削減したビットカウントは、圧縮済みビットストリームを作成する符号化処理を加速化させ、符号化済みピクチャデータを伝送するために必要とされる帯域幅を削減する。デコーダ側では、元の分解能における元の画像のほぼ複写(a near facsimile)に画像を再構築するよう、圧縮済みビットストリームが圧縮解除の間に時間的にアップサンプリングされる。提案される方法は、ROIコーディングを達成すると共に、符号化を実行するために必要な時間を削減し、圧縮済み画像ストリームのサイズを実質的に削減する。
【0009】
本明細書で使用されるように、「時間ダウンサンプリング」は、圧縮の間に使用される画像フレームまたは画像フレームの一部に関する情報を取り除くことによって、或る時間間隔(時間ダウンサンプリング間隔と称される)の間に画像フレームまたは画像フレームの一部についての符号化済みビットカウントの削減を指す。加えて本明細書で使用されるように、「時間アップサンプリング」は、時間ダウンサンプリング間隔の間に符号化済み画像内に存在する画像フレームまたは画像フレームの一部についての情報の生成を指す。
【0010】
提案される解決策は、既存のROIコーディング技術に対するいくつかの利点を有する。提案される解決策は、ROI内の詳細の損失なしに、時間ダウンサンプリング間隔の間に符号化済み入力画像のビットカウントを著しく削減し、より高速な符号化につながる。提案される解決策を使用したROIコーディングは、既存の圧縮標準規格を使用して実行されてもよい。ROI及び背景のピクチャ品質を制御するようQPを調節することを回避することができる。提案される解決策を使用したROIコーディングは、単一のエンコーダインスタンスを使用して実装されてもよい。提案される解決策は、ROIサイズ及びビデオフレームの間の位置を変えることを可能にする。提案される解決策はまた、ROIと背景との間のピクチャ品質差の制御を可能にする。更に、提案される解決策の一部の態様は、矩形のROI及び同一の画像内の複数のROIに拡張されてもよい。
【0011】
方法論
上記議論されたような時間ダウンサンプリングは、時間ダウンサンプリング間隔の内部のフレームのビットカウントを相当に削減する。これは、フレームのより効率的な符号化及び伝送を可能にする。時間ダウンサンプリングをROI符号化と組み合わせることは、観察者が見ている画像のエリアの高い忠実度またはより正確なレンダリング、及び観察者があまり知覚的能力を有さないエリアのより低い忠実度またはあまり正確でないレンダリングを可能にする。
【0012】
時間ダウンサンプリングする1つのアプローチは、ROIの外側のエリアについての動き情報を削減することである。例として、及び限定なしに、動き情報は、動きベクトル、動きベクトルが差すピクチャを識別する情報、動きベクトルが網羅するセクションサイズ、例えば、ブロックサイズ、またはそれらのうちの2つ以上の何らかの組み合わせを含んでもよい。
【0013】
それらの詳細に入る前にダウン/アップサンプリングする方法の2つの実施例を簡潔に説明することが有益である。第1の方法は、本明細書でインループダウン/アップサンプリングと称される。この方法に従って、エンコーダ側でのダウンサンプリングは、符号化ループの一部であり、デコーダ側でのアップサンプリングは、復号ループの一部である。この方法では、エンコーダは、ダウンサンプリング間隔内のピクチャについてのROIの外側の領域についての動き情報を省略し、または部分的に省略する。デコーダは、復号済み画素を再構築するために動き情報を使用する前に、動き情報をアップサンプリングする。
【0014】
第2の方法では、エンコーダは、静止画素を符号化し、またはダウンサンプリング間隔内のピクチャについてのROIの外側の画素を省略するかのいずれかである。次いで、デコーダは、圧縮済みピクチャを最初に復号する。ピクチャが圧縮解除された後、デコーダは、復号済み画素を時間的にアップサンプリングする。ダウンサンプリングが符号化の前に行われ、アップサンプリングが復号の後に行われることを理由に、ダウンサンプリング及びアップサンプリングは、符号化/復号ループの外側で行われると見なされてもよい。したがって、この方法は、本明細書でアウトオブループアップ/ダウンサンプリングと称される。
【0015】
図1Aは、本開示の態様に従った、動き情報の時間インループダウン/アップサンプリングにより符号化する方法を示す。101に示されるように、例えば、ROIのサイズ、位置、及び形状に関連するROIパラメータが判定されてもよい。例として、及び限定なしに、矩形のROIのケースでは、それらのパラメータは、矩形画像の各々のエッジから対応するROI境界までのオフセットと共に、画像及びROIについての寸法、例えば、長さ及び幅を含んでもよい。参照によりその内容が本明細書に組み込まれる、同一出願人による係属中の米国特許出願第16/004,271号、Krishnan et al.「FAST REGION OF INTEREST CODING USINGMULTI-SEGMENT RESAMPLING」において、ROIパラメータ、画素オフセット、及びマルチセグメント空間ダウンサンプリングを判定することに関する更なる情報を発見することができる。
【0016】
ROIパラメータが判定されると、102に示されるように、ROIパラメータにより画像を符号化することが開始してもよい。画像の符号化は、後のセクションにおいて議論されるように、多段階処理である。多段階処理は、画像ごとの動きベクトル及び関連する情報などの動き情報の計算を含む。復号処理の間にそれらが利用可能であることを保証するために、この符号化ステップと共にROIパラメータが含まれてもよい。本開示の態様に従って、方法は、ROIを判定するためにROIパラメータを使用してもよく、103に示されるように、時間ダウンサンプリング間隔においてROIの外側のエリアについての動き情報の計算を省略してもよい。本開示の態様に従って、時間ダウンサンプリング間隔の先頭フレーム及び最後フレームは、時間ダウンサンプリング間隔内の他のフレームについての動き情報を再生成することができることを保証するために、ROIの外側の部分についての動き情報を保持することができる。時間ダウンサンプリング間隔内の追加のフレームは、ROIの外側、例えば、限定なしに、大きな値の動き情報を有するエリアまたは認識された動きパターンを有するエリアの外側のそれらの動き情報を保持することができる。時間ダウンサンプリングは、ROIの外側の動き情報を簡易化し、それによって、符号化処理を加速化する。いくつかの実施態様は加えて、一部の動きベクトルを取り除き、エンコーダの動き予測の複雑度を削減するために、パターン認識を使用してもよい。
【0017】
いくつかの実施態様では、本開示の態様に従って、104に示されるように、符号化済み画像フレームと共に、時間ダウンサンプリング間隔が含まれてもよい。符号化処理が完了した後、105に示されるように、符号化済み画像フレームがクライアント、別のメモリ位置、または別のデバイスに伝送されてもよい。そのような伝送は、例えば、デバイス内のデータバス、インターネットなどのワイドエリアネットワーク(WAN)、ローカルエリアネットワーク(LAN)、またはBluetooth(登録商標)ネットワークなどのパーソナルエリアネットワーク(PAN)を伴ってもよい。
【0018】
図1Bは、図1Aに関して上記説明された方法をグラフィカルに表す。示されるように、102における符号化処理の間、画像フレーム112に対して動きベクトルが生成される。示される簡易化された表現では、矢印は、グリッドによって表される、画像のセクションごとに生成された動きベクトルを表す。103における動き情報のダウンサンプリングは、ROI113の外側のエリアからの動き情報を除去することができる。代わりに、ROIの外側のエリアについての動き情報は、符号化処理の間に単純に計算されなくてもよい(図示せず)。示されるようなROI113についてのデータは、限定なしに、動きベクトルなどの動き情報を保持することができる。ピクチャのストリームについてのROIの外側の1つ以上のエリアについての動き情報は、時間ダウンサンプリング間隔において除去されてもよい。時間ダウンサンプリング間隔の先頭ピクチャ115及び最後ピクチャ116は、それらの動き情報を保持することができると共に、全ての他の中間ピクチャ114は、それらの動き情報を省略させ、例えば、計算させないようにし、または除去させる。
【0019】
時間ダウンサンプリング間隔を記述した情報は、ピクチャと共にまたは別個に符号化されてもよい(104)。代替的な実施形態では、時間ダウンサンプリング情報は、例えば、限定なしに、ネットワーク抽象レイヤ(NAL)符号化において、符号化済みピクチャと共にパッケージ化されてもよい。
【0020】
本開示の態様に従ったいくつかの代替的な実施態様では、時間ダウンサンプリング間隔は、品質の損失なしに、符号化遅延及び符号化済み画像を伝送するために必要とされる帯域幅を最小化するために選択された固定間隔であってもよい。そのような実施態様では、エンコーダ及びデコーダの両方は、時間ダウンサンプリング間隔を単純に保持することができ、デバイスの間で伝送される必要がある時間ダウンサンプリング間隔情報を保持しない。他の実施態様では、時間ダウンサンプリング間隔は、可変であってもよく、したがって、エンコーダは、符号化済みピクチャデータを有する一部の時間ダウンサンプリング情報を含んでもよい。更なる他の実施態様では、時間ダウンサンプリング間隔情報は単純に、デコーダに既知の事前設定された間隔であってもよい。いくつかの実施態様では、時間ダウンサンプリング間隔は、ROIに対する領域の距離に依存してもよい。ROIの周りの画像の複数の領域が存在してもよい。ROIにより近い領域は、ROIから更に遠い領域よりも小さいダウンサンプリング間隔を要してもよい。
【0021】
図2は、本開示の態様に従った、時間的ダウンサンプリング済み画像ストリームを復号する方法を表す。201に示されるように、符号化済み画像ストリームがネットワークを通じてデバイスにおいて最初に受信されてもよい。いくつかの実施態様では、画像ストリームは、画像ストリーム内でまたは別個の伝送として符号化された時間ダウンサンプリング間隔を含んでもよい。202に示されるように、デバイスは、画像ストリームを復号することを開始してもよい。復号処理の一部として、時間ダウンサンプリング間隔は、エントロピ復号されてもよく、処理において後に使用されてもよい。
【0022】
標準的な復号処理では、動きベクトルなどの符号化済み動き情報が復号され、画像内のマクロブロック移動を再構築するために使用される。動き情報を使用した時間ダウンサンプリング処理に起因して、ROIの外側の動き情報は、時間ダウンサンプリング間隔内のフレームに対して存在しない。したがって、ROIの外側の省略済み動き情報が生成または再構築される必要がある(203)。動き情報の生成は、補間を使用して実行されてもよい。本開示の態様に従って、時間ダウンサンプリング間隔内の先頭画像及び最後画像は、それらの動き情報を保持する。デバイスは、時間ダウンサンプリング間隔内のフレームごとの補間済み動き情報を生成するよう、先頭フレームの動き情報と最後フレームの動き情報との間を補間してもよい。いくつかの実施態様では、動き情報を生成するよう、いくつかの時間ダウンサンプリング周期にわたるいくつかの先頭フレーム及び最後フレームが補間されてもよい。他の実施態様では、高い値の動き情報を有するエリア内でなど、時間ダウンサンプリング間隔の間の追加の動き情報は、情報のより正確な再生成のために補間の間に使用されてもよい。補間は、本分野において既知のいずれかの補間方法、例えば、限定なしに、線形補間、多項式補間、またはスプライン補間であってもよい。
【0023】
時間ダウンサンプリング間隔内のフレームについての動き情報の生成の後、204に示されるように、ROIの外側のエリア内の不明動き情報である対応するフレームに動き情報が適用される。生成済み動き情報を有する時間ダウンサンプリング間隔内のフレームは次いで、完全復号済み及び再構築済み画像を生成するよう、復号の間に更に処理されてもよい。206に示されるように、完全復号済み画像に対応するデータは、メモリまたは記憶装置に記憶されてもよく、ネットワークを通じて伝送されてもよく、またはディスプレイデバイスに送信されてもよく、ディスプレイデバイス上で表示されてもよい。
【0024】
図3Aは、本開示の態様に従った、時間ダウンサンプリングする代替的な方法を表す。従来のように、301において、ROIのサイズ、位置、及び形状に関連するROIパラメータが判定される。302において、ROIを特定するためにROIパラメータを使用して、ROIの外側の1つ以上のエリアは、それらのフレームレートを減少させる。ここで、フレームレートは、元の画素の周波数を指してもよく、全体的に、複製されていないクロマ情報及びルマ情報が利用可能であるレートを指してもよい。例として、及び限定なしに、ROIの外側のマクロブロックについてのクロマ情報及びルマ情報は、ヌル値まで変化してもよく、よって、それらのマクロブロックについての画像情報を取り除く。別の実施例では、ROIの外側の画素についてのクロマ情報及びルマ情報は、前のフレームからコピーされる。加えて、どのフレームをドロップさせるかを判定するために、時間ダウンサンプリング間隔が使用されてもよい。本実施形態の態様に従って、ROIの外側の1つ以上のエリアのフレームレートまたはフレームレートの何らかの倍数があってもよい。
【0025】
ROIの外側の1つ以上のエリア内の削減したフレームレートを有する画像フレームは次いで、後のセクションにおいて議論されるような画像符号化方法を使用して303において完全に符号化される。時間的ダウンサンプリング済み画像フレームを符号化することは、少なくともエントロピコーディングを含んでもよい。
【0026】
いくつかの代替的な実施態様では、本開示の態様に従って、304に示されるように、時間ダウンサンプリング間隔は、メタデータとして含まれてもよく、各々の画像フレームと共に符号化されてもよく、または画像ストリームに含まれてもよく、画像ストリームと共に符号化されてもよい。他の実施態様では、時間ダウンサンプリング間隔情報は、画像ストリームとは別個のデータとして送信されてもよく、またはネットワーク抽象レイヤに符号化済みデータとして含まれてもよい。
【0027】
最終的に、符号化された時間的ダウンサンプリング済み画像は、ネットワークを通じてデバイスに、またはキャッシュからメモリに伝送されてもよい(305)。
【0028】
図3Bは、本開示の態様に従った、フレームレート時間ダウンサンプリングする上記方法をグラフィカルに表す。ROIを有するピクチャは、302に関して上記説明されたようにROIの外側の部分についてのフレームレートを減少させることができる。示されるように、ROIの外側のフレームレートを減少させた後、ROI312は、同一のフレームレートを維持すると共に、ROI312の外側のエリア313が取り除かれる。時間ダウンサンプリング間隔は、何個のフレームがROIの周りの1つ以上のエリア内のクロマ情報及びルマ情報を保持するかを指示する。上記のように、時間ダウンサンプリング間隔内の先頭フレーム314及び最後フレーム316は、それらのクロマ情報及びルマ情報を保持すると共に、中間フレーム315のみが、ROIについてのクロマ情報及びルマ情報を有する。ROIの外側の1つ以上のエリア内の削減したフレームレートを有するピクチャは次いで、更に符号化される(303)。時間ダウンサンプリング間隔情報は、ピクチャと共に符号化されてもよく(304)、またはNAL符号化の一部としてピクチャと共にパッケージ化されてもよい。符号化の後、符号化済みパッケージは、別のデバイスに、または記憶装置もしくはメモリなどの符号化デバイス上の別の位置に伝送されてもよい。
【0029】
図3Cは、本開示の態様に従った、時間ダウンサンプリングの別の実施態様を示す。示される実施態様では、ROIの324、325、326をそれぞれ有する前のフレーム321、中間フレーム322、及び最終フレーム323は、時間ダウンサンプリング演算において使用される。この演算では、中間フレーム322からのROIの外側のクロマ情報及びルマ情報を取り除く代わりに、前のフレーム321からのクロマ情報及びルマ情報が単純に繰り返される(327)。加えて、ROI位置は、前のフレーム324から中間フレーム325に移動する。時間ダウンサンプリングの間、前のフレーム324のROI内のクロマ情報及びルマ情報は、ダウンサンプリング済み中間フレーム内のROI329の外側のエリア328についての不明情報を生成するよう、中間フレーム325についてのクロマ情報及びルマ情報と組み合わされる。ROI内のクロマ値及びルマ値は、前のフレーム内のROIの外側から存在することがあるいずれかのクロマ値及びルマ値を置き換える。図3C及び図3Dに示されるパターンは、フレームについての元のクロマ情報及びルマ情報を表し、新たなパターンは、新たなクロマ情報及びルマ情報を表す。時間ダウンサンプリングの後、フレームが符号化されてもよい。
【0030】
図3Dは、時間ダウンサンプリング及びマルチセグメント空間ダウンサンプリングの両方を有する別の実施態様を表す。示される実施態様では、ROIの334、335、336をそれぞれ有する前のフレーム331、中間フレーム332、及び最終フレーム333は、時間ダウンサンプリング演算において使用される。従来のようにこの演算では、中間フレーム332からのROIの外側のクロマ情報及びルマ情報を取り除く代わりに、前のフレーム331からのROIの外側のクロマ情報及びルマ情報は、時間的ダウンサンプリング済み中間フレーム337内で複製される。前のフレーム337、中間フレーム340、及び最終フレーム内のマルチセグメントダウンサンプリングの後のROIの外側のエリアは、マルチセグメントダウンサンプリング演算に起因して削減される。加えて、示されるように、ROI位置は、前のフレーム324から中間フレーム325に移動する。時間ダウンサンプリング及びマルチセグメントダウンサンプリングの間、前のフレーム334のROI内のクロマ情報及びルマ情報は、ダウンサンプリング済み中間フレーム内のROI335の外側のエリア339についての不明情報を生成するよう、中間フレーム335についてのクロマ情報及びルマ情報と組み合わされる。ROI内のクロマ値及びルマ値は、前のフレーム内のROIの外側から存在することがあるいずれかのクロマ値及びルマ値を置き換える。マルチセグメントダウンサンプリングは、ROIを包含したセクションフレームに適用されず、したがって、中間フレーム内の前のROI339の位置の空間分解能が保持される。時間ダウンサンプリング及びマルチセグメントダウンサンプリングの後、フレームが符号化されてもよい。
【0031】
図4Aは、ダウンサンプリング済みフレームレート情報を有する符号化された時間的ダウンサンプリング済みフレームを復号する方法を表す。401に示されるように、最初に、デバイスは、別のデバイスから、またはデバイスの別の部分から、ネットワークを通じて伝送された、符号化済み画像フレームを受信してもよい。
【0032】
402に示されるように、符号化された時間的ダウンサンプリング済み画像は、後のセクションにおいて議論される方法に従って、または画像フレームが符号化された何らかの方法に従って復号されてもよい。
【0033】
復号の間、403に示されるように、時間アップサンプリングが時間ダウンサンプリング間隔内のフレームに適用されてもよい。時間的ダウンサンプリング済みフレームについての画像を生成するために、前のフレームからの複製された画素情報を有し、または時間ダウンサンプリングに起因してカラー情報もしくは他の画像情報を欠いているフレームにフレームレート時間アップサンプリングが適用されてもよい。例として、及び限定なしに、時間アップサンプリングの1つの方法は、時間ダウンスケーリング間隔内の先頭フレームのROIの外側のエリアを時間ダウンスケーリング間隔内の最後フレームのROIの外側のエリアにより補間することである。動き情報に関して上記説明された実施形態とは異なり、現在の実施形態では、1つ以上のエリアのカラー情報またはクロマ情報及びルマ情報などの画像情報が補間される。上記議論されたように、補間方法は、本分野においていずれかの既知の、例えば、限定なしに、オプティカルフロー、線形補間、多項式補間、またはスプライン補間であってもよい。この補間は、ROIの外側の1つ以上のエリア内の画像または補間によって作成されたROIの外側の1つ以上のエリア内で作成された合成画像と考えられてもよい。いくつかの実施態様では、補間は、計算サイクルを節約するために、前のフレームを単純に繰り返すことにより置き換えられてもよい。
【0034】
オプティカルフローは、画素の輝度が経時的にスクリーンにわたってどのように移動するかを推定する画素ごとの予測である。オプティカルフローは、所与の時間tにおける画素特性(例えば、クロマ値またはルマ値)が後の時間t+Δtであるが異なる位置において同一であると推定し、位置における変化は、フローフィールドによって予測される。オプティカルフローは、補間を実行するためにより正確であるが、処理が遅い。参照によって本明細書に組み込まれ、以下のURL:https://medium.com/swlh/what-is-optical-flow-and-why-does-it-matter-in-deep-learning-b3278bb205b5においてそのコピーにアクセスすることができる、Mark Gitumaによる「What is Optical Flow and why does it matter in deep learning」においてオプティカルフローが詳細に説明される。
【0035】
いくつかの合成画像を作るために、時間ダウンサンプリング間隔の先頭画像及び最後画像の補間が使用されてもよい。404に示されるように、それらの合成画像は、符号化の間にそれらの情報を保持した、ROI内の非合成画像と組み合わされる。再構築済みエリア内での表示のためにより多くのクロマ情報及びルマ情報が利用可能であるように、時間ダウンサンプリング間隔内のフレームのROIの外側の1つ以上のエリアを再構築することは、画像エリアのフレームレートを効果的に増大させる。
【0036】
時間ダウンサンプリング間隔内のフレームが再生成されると、それは後の使用のために記憶装置に記憶されてもよい(405)。代わりに、ディスプレイデバイス上で表示されることになり、またはディスプレイデバイスに送信されることになる再生成済みフレームは、ディスプレイバッファに記憶されてもよい。別の実施態様では、再生成済みフレームが記憶されてもよく、テレビなどのリモートディスプレイデバイスに送信されてもよい。
【0037】
図4Bは、時間的にダウンサンプリングされたフレームレートである符号化済み画像フレームを復号する方法をグラフィカルに表す。復号の間、ROI411の外側のクロマ情報及びルマ情報を有する画像と共に、ROI412内のクロマ情報及びルマ情報のみを有する画像が復号される。403において、ROI412の外側のエリア内のピクチャ不明クロマ情報及びルマ情報に対して上記説明されたような補間を使用してクロマ情報及びルマ情報が再構築される。生成済み画像内でのROI413の配置をガイドするために、ROIパラメータが使用される。再構築済み画像は次いで、時間ダウンサンプリング間隔情報を使用して画像ストリーム内のそれらの適切な位置に挿入される(414)。
【0038】
図4Cは、時間的にダウンサンプリングされたフレームレートであり、中間フレーム内のROIの外側の前のフレームからの情報を含む画像フレームを復号する方法を示す。時間的ダウンサンプリング済みピクチャは、限定なしに、後のセクションにおいて全体的に説明されるような、AVC/H.264、HEVC/H.265などの既知の符号化方法において最初に符号化されてもよい。復号済み画像フレームは、初期画像フレーム421、中間画像427、及び最終画像フレーム423を含んでもよい。画像フレームは、提示の過程の間に移動するROIを包含してもよい。示されるように、前のフレームは、ROI424を有し、中間フレームは、ROI429を有し、最終フレームは、ROI426を有する。中間フレームは、符号化処理の間に時間的にダウンサンプリングされており、この実施態様では、前のフレームのROIの外側のエリアから複製されたROIの外側のクロマ値及びルマ値を有する。加えて、中間フレーム427のROI429の位置が移動したことを理由に、中間フレームのROI428の外側のエリアを埋めるために、初期フレーム421のROI424からのクロマ情報及びルマ情報が使用される。
【0039】
ROIの外側のエリアについてのクロマ情報及びルマ情報は、時間アップサンプリングを通じて復号の間に再構築されてもよい。時間アップサンプリングは、時間ダウンサンプリング間隔430を通じて中間フレーム422内のROI425の外側のエリアについてのクロマ値及びルマ値を補間してもよい。示される実施例では、初期フレーム421及び最終フレーム423のROIの外側のエリアについてのクロマ値及びルマ値は、中間フレーム422のROI425の外側のエリアについてのクロマ値及びルマ値を作るために補間される。ROIが前のフレーム421から最終フレーム426への間に移動することを理由に、中間フレーム内のROIの外側のエリアを再構築するために、前のフレーム424及び最終フレーム426のROI内のクロマ値及びルマ値が補間の間に使用されてもよい。前のフレーム内のROIの一部であり、補間の間に使用されていた領域は、正確なフレームサイズを維持するために、中間フレーム内で空間的にアップサンプリングされない。ROIの位置及び時間ダウンサンプリング間隔に関する情報は、画像フレームについてのメタデータに、または別個に伝送されるデータとして記憶されてもよい。
【0040】
図4Dは、時間的にダウンサンプリングされたフレームレートである画像フレーム及びマルチセグメント空間的ダウンサンプリング済みフレームを復号する方法を示す。時間的および空間的ダウンサンプリング済みピクチャは、限定なしに、後のセクションにおいて全体的に説明されるような、AVC/H.264、HEVC/H.265などの既知の符号化方法において最初に符号化されてもよい。復号済み画像フレームは、空間的にダウンサンプリングされた、初期画像フレーム437、中間画像438、及び最終画像フレーム440を含んでもよい。示されるように、復号済み画像フレームは、マルチセグメント空間ダウンサンプリングに起因してソース画像フレームよりも小さい。画像フレームは、提示の過程の間に移動するROIを包含してもよい。示されるように、前のフレームは、ROI434を有し、中間フレームは、ROI435を有し、最終フレームは、ROI436を有する。中間フレームは、符号化処理の間に時間的にダウンサンプリングされており、この実施態様では、前のフレームのROIの外側のエリアから複製されたROIの外側のクロマ値及びルマ値を有する。加えて、中間フレーム438のROI435の位置が移動したことを理由に、中間フレームのROI439の外側のエリアを埋めるために、初期フレーム437のROI434からのクロマ情報及びルマ情報が使用される。
【0041】
ROIの外側のエリアについてのクロマ情報及びルマ情報は、時間アップサンプリング及びマルチセグメント空間アップサンプリングを通じて復号の間に再構築されてもよい。空間アップサンプリングは、各々の画像フレーム内のROIの位置を使用してもよく、アップサンプリング済み画像フレームを生成するために、ROIの外側のエリア内で隣接する画素の間を補間してもよい。いくつかの実施態様では、ROIは、そのサイズ及び位置がROIパラメータによって固定されるので、空間アップサンプリングの間に補間を受けなくてもよい。時間アップサンプリングは、時間ダウンサンプリング間隔430を通じて中間フレーム432内のROI435の外側のエリアについてのクロマ値及びルマ値を補間してもよい。示される実施例では、初期フレーム431及び最終フレーム433のROIの外側のエリアについてのクロマ値及びルマ値は、中間フレーム432のROI435の外側のエリアについてのクロマ値及びルマ値を作るために補間される。ROIが前のフレーム431から最終フレーム436への間に移動することを理由に、中間フレーム内のROIの外側のエリアを再構築するために、前のフレーム434及び最終フレーム426のROI内のクロマ値及びルマ値が補間の間に使用されてもよい。ROIの位置及び時間ダウンサンプリング間隔に関する情報は、画像フレームについてのメタデータに、または別個に伝送されるデータとして記憶されてもよい。本開示の態様に従って、時間ダウンサンプリング間隔の間に発生するフレーム内の不明情報を生成するために、補間が使用されてもよい。線形補間、多項式補間、及びスプライン補間を含む、多数の異なる既知の補間技術が存在する。概して、補間は、2つ以上のデータ点の間の接続に適合し、曲線を使用した他のデータの生成を可能にする、曲線または直線についての方程式を生成する。
【0042】
本開示の追加の態様に従って、時間ダウンサンプリング間隔は、画像フレームの全体を通じて固定されなくてもよい。時間ダウンサンプリング間隔は、画像フレーム内の位置に応じて変わってもよい。例えば、限定なしに、図5Aに示されるように、時間ダウンサンプリング間隔は、ROIに近いと小さくてもよく、フレーム内のROIから離れると大きくてもよい。図5Aは、本開示の態様に従った、その間に対象領域からの距離に対して空白にされた情報を有するフレームの事項として時間ダウンサンプリング間隔がどのように変化するかを記述したグラフを示す。線形のケースに示されるように、ROIにより近いエリアは、ROIから更に離れたエリアよりも除去された情報を有するフレームが少ない。加えて、ROIからの距離が増大するにつれての時間ダウンサンプリング間隔内の変化は、例えば、限定なしに、図5Aに示されるように、線形的、指数関数的、またはS字状であってもよい。
【0043】
サッケードの間のロウパスフィルタリング
本開示の態様に従って、サッケードの間に画像をフィルタリングすることによって、伝送帯域幅を更に減少させることができる。ユーザが瞬きするとき、まぶたは、ユーザの目への光の形式において視覚情報を遮断する。人間の目も、サッケードとして既知の素早い目の移動を示す。サッケードマスキングとして既知の現象は、サッケードの間に発生する。サッケードマスキングは、目の移動の間に脳に視覚情報を抑制させる。サッケードまたは瞬きの持続時間内に相対的に大きな変動が存在する。例えば、サッケードは典型的には、20~200ミリ秒続く。これは、毎秒120フレーム(fps)のフレームレートにおける2~25フレームに対応する。サッケードの開始を検出するために10ミリ秒を要し、サッケードが20ミリ秒のみ続く場合でさえ、グラフィックシステムは、1つのフレームを節約することができ、例えば、計算を削減し、もしくは電力を節約するためにディスプレイをターンオフし、またはその両方のために、レンダリングしない。瞬きは典型的には、約100ミリ秒~約150ミリ秒続き、それは、120fpsにおける12~18フレームに対して十分な時間である。
【0044】
図5Bは、本開示の態様に従った、凝視トラッキングを使用して符号化済みデータサイズを更に削減する方法を表す。ROIパラメータの判定は、瞬きまたはサッケードの検出または予測を含んでもよい(501)。ROIパラメータを判定するために使用される凝視トラッキング情報または画像情報は、サッケードまたは瞬きの発現を検出し、その持続時間を予測するよう分析されてもよい。例えば、サッケードの発現は、目の回転速度または加速度に相関付けられてもよい。瞬きの発現は、画像の分析またはセンサによって収集された電気生理学情報から判定されるようなまぶたの移動に相関付けられてもよい。例として、及び限定なしに、サッケードの持続時間は、凝視トラッキングから取得された目の測定済み回転速度及び回転速度とサッケード持続時間との間の既知の相関から推定されてもよい。例えば、サッケードマスキングの持続時間は、サッケードの発現における目の回転速度を増大させると共に増大する傾向がある。瞬き及びサッケードの検出と共に処理操作に関する更なる情報について、Young et al.への米国特許第10,372,205号を参照されたい。
【0045】
瞬きまたはサッケードに応答して、502に示されるように、デバイスは、符号化の間にROIを含む画像にロウパスフィルタを適用してもよい。サッケードの間に発生する画像フレームがそれらにロウパスフィルタを適用させると共に、サッケードの間に発生しない画像フレームがそれらにロウパスフィルタを適用させないように、デバイスは、ロウパスフィルタの適用をサッケードと同期させてもよい。画像フレームへのロウパスフィルタの適用は、画像フレームを符号化するために必要とされるビットの量を削減する。符号化済み画像のビットカウントを削減するために、ロウパスフィルタのカットオフ及び減衰が選択されてもよい。ユーザのサッケードと同期して発生すると判定された画像フレームにロウパスフィルタが適用された後、503に示されるように、画像フレームが完全に符号化される。
【0046】
符号化の後、結果として生じる符号化済み画像データは、例えば、限定なしに、ネットワークを通じてクライアントデバイスに、またはキャッシュからメモリに、またはパーソナルエリアネットワークを通じて別のデバイスに伝送されてもよい(504)。上記説明された態様は、符号化済み画像サイズを減少させるために時間ダウンサンプリングと共に適用されてもよい。
【0047】
符号化
図6Aに示されるような動きベクトル時間ダウンサンプリング符号化処理は、システムによって生成することができ、または一部の他のソースから受信することができる、符号化されていない画像フレームデータ601により最初に開始する。システムは、予測的アルゴリズム、凝視トラッキング装置、または他のそのような方法もしくはデバイスを使用して、ROIパラメータ612を解く。613において動きベクトル時間ダウンサンプリングを実行するために、デジタルピクチャ601のセットと共にROIパラメータ612が使用される。608に示されるように、ROIパラメータが保存及び符号化され、またはコーディング済みピクチャデータ611と共に含まれる。デジタルピクチャのセット内の各々のフレームまたはピクチャが、その自身のROIパラメータを有してもよいこと、及びROIパラメータがフレームごと、またはピクチャごとに変化してもよいことが理解されるべきである。同様に、いくつかの実施形態では、デジタルピクチャのセットは、限定なしに、静止画像であってもよい。
【0048】
符号化されていないデジタルピクチャデータ601は、標準的な手段によって符号化されてもよい。例として、及び限定なしに、デジタルデータは、一般化された方法600に従って符号化されてもよい。エンコーダは、複数のデジタル画像601に対応するデータを受信し、画像ごとにデータを符号化する。デジタルピクチャデータ601の符号化は、セクションごとの単位で続行してもよい。セクションごとの符号化処理は任意選択で、パディング602、画像圧縮604、及び画素再構築606を伴ってもよい。イントラコーディング済みピクチャ及びインターコーディング済みピクチャの両方についての共通処理フローを促進するために、602に示されるように、現在処理しているピクチャ601内の全ての復号されていない画素は、パディング済みピクチャを作成するよう、一時的画素値によりパディングされてもよい。例えば、参照によって本明細書に組み込まれる米国特許第8,711,933号において上記説明されたように、パディングが続行してもよい。パディング済みピクチャは、バッファに記憶された参照ピクチャ603のリストに追加されてもよい。602においてピクチャをパディングすることは、画像圧縮604及び画素再構築606の間の後続の処理において参照ピクチャとして現在処理しているピクチャの使用を促進する。そのようなパディングは、参照によって本明細書に組み込まれる、同一出願人による米国特許第8,218,641号において詳細に説明される。
【0049】
本明細書で使用されるように、画像圧縮は、デジタル画像へのデータ圧縮の適用を指す。画像圧縮604の目的は、圧縮済みデータの効率的な形式にある所与の画像601についてのデータを記憶または伝送することを可能にするために、その画像についての画像データの冗長性を削減することである。画像圧縮604は、非可逆または可逆であってもよい。可逆圧縮は、製図、アイコン、またはコミックなどの人工的画像に対して好ましいことがある。これは、特に低ビットレートにおいて使用されるとき、非可逆圧縮方法が圧縮アーチファクトを導入するからである。可逆圧縮方法も、記録文書の目的のために行われる医療撮像または画像スキャンなど、高い値のコンテンツに対して好ましいことがある。非可逆方法は、忠実度の僅かな(時に、知覚できない)損失がビットレートにおける相当な削減を達成するために許容可能である適用における写真などの自然な画像に対して特に適切である。
【0050】
可逆画像圧縮のための方法の例は、それらに限定されないが、PCXにおけるデフォルトの方法として、及びBMP、TGA、TIFFの可能な1つとして使用されるランレングス符号化、GIF及びTIFFにおいて使用されるエントロピコーディング、LZWなどの適応的辞書アルゴリズム、並びにPNG、MNG、及びTIFFにおいて使用されるデフレーションを含む。非可逆圧縮のための方法の例は、画像内の最も共通したカラーまでピクチャ604のカラー空間を削減すること、クロマサブサンプリング、変換コーディング、及びフラクタル圧縮を含む。
【0051】
カラー空間削減では、圧縮済み画像のヘッダ内のカラーパレットにおいて選択済みカラーが指定されてもよい。各々の画素はまさに、カラーパレット内のカラーのインデックスを参照する。この方法は、ポスタリゼーションを回避するために、ディザリングと組み合わされてもよい。クロマサブサンプリングは、画像内のクロミナンス情報の半分またはそれ以上をドロップさせることによって、目がカラーよりも鮮明に輝度を知覚するという事実を利用する。変換コーディングはおそらく、もっとも一般的に使用される画像圧縮方法である。変換コーディングは典型的には、離散コサイン変換(DCT)またはウェーブレット変換などのフーリエ関連変換と、それに続いて量子化及びエントロピコーディングを適用する。フラクタル圧縮は、特定の画像内で、画像の部分が同一の画像の他の部分に似ているという事実に依存する。フラクタルアルゴリズムは、符号化済み画像を再度作るために使用される「フラクタルコード」と称される数学的データに、それらの部分、またはより正確に、幾何学形状を変換する。
【0052】
604における画像圧縮は、画像601の特定の部分が他の部分よりも高い品質により符号化される対象領域コーディングを含んでもよい。これは、画像の特定の部分を最初に符号化し、他の部分を後に符号化することを伴う、スケーラビリティと組み合わされてもよい。圧縮済みデータは、画像を分類、探索、及び閲覧するために使用することができる画像に関する情報(メタ情報またはメタデータと称されることがある)を包含してもよい。そのような情報は、カラー及びテキスチャ統計、小さなプレビュー画像、並びに著者/著作権情報を含んでもよい。
【0053】
例として、及び限定なしに、604における画像圧縮の間、エンコーダは、画素のブロックを圧縮するための最良の方式を探索してもよい。エンコーダは、良好な整合のために、現在パディングされているピクチャを含む、参照ピクチャリスト603内の参照ピクチャの全てを探索してもよい。現在ピクチャ(または、サブセクション)がイントラピクチャとしてコーディングされる場合、(または、サブセクション)パディング済みピクチャのみが参照リスト内で利用可能である。604における画像圧縮は、606における画素再構築の間に参照ピクチャ(パディング済みピクチャを含む)のうちの1つ以上に沿ってその後に使用される、動きベクトルMV及び変換係数607を作成する。
【0054】
画像圧縮604は全体的に、最良のインター予測整合のための動き探索MS、最良のイントラ予測整合のためのイントラ探索IS、現在マクロブロックがインターコーディングされるかまたはイントラコーディングされるどうかを決定するためのインター/イントラ比較C、可逆残差画素605を計算するために最良に整合した予測済み画素により符号化されるセクションからの元の入力画素の差し引きSを含む。残差画素は次いで、変換係数607を作成するために、変換及び量子化XQを受ける。変換は典型的には、離散コサイン変換(DCT)などのフーリエ変換に基づいている。
【0055】
変換は、計数のセットを出力し、その各々は、標準基底パターンについての重み値である。組み合わされるとき、重み付け基底パターンは、残差サンプルのブロックを再度作る。変換の出力、変換係数のブロックが量子化され、すなわち、各々の係数は、整数値により除算される。量子化は、量子化パラメータ(QP)に従って変換係数の精度を減少させる。典型的には、結果は、係数のほとんどまたは全てがゼロであると共に、非ゼロ係数が少ないブロックである。高い値にQPを設定することは、より多くの係数がゼロに設定されることを意味し、不良な復号済み画像品質を犠牲にして、高い圧縮を結果としてもたらす。低QP値について、より多くの非ゼロ係数が量子化の後に残り、より良好な復号済み画像品質を結果としてもたらすが、圧縮が低い。逆に、高QP値について、より少ない非ゼロ係数が量子化の後に残り、より高い画像圧縮を結果としてもたらすが、画像品質が低い。
【0056】
モード決定とも称されるインター/イントラ比較Cは、QPに関連するラグランジュ乗数λとして既知のパラメータを使用する。コスト関数Jは、QPの値から判定されたλの値を使用して計算される。符号化モードは、インターモードコーディングのための計算済みコスト関数Jが、イントラモードコーディングのための計算済みコスト以上であるかどうかに基づいて判定される。例として、H.264/AVCコーデックは、セクションのオーバヘッド(例えば、動きベクトル、タイプ)を符号化するための実際のビット消費R及び再構築歪みD(例えば、元のセクションと再構築済みセクションとの間の絶対差和(SAD)として測定された)を計算することによって最小化されるべきである、コスト関数JHをサポートする。そのようなケースでは、コスト関数JHは、以下の式に従って比較される。
【数1】
【0057】
代替的な実施態様では、歪みDは、異なって計算されてもよい。歪み、例えば、二乗差和(SSD)、絶対変換差和(SATD)、及び平均絶対差などを表す多数の方式が存在する。当業者は、異なる歪み測定のために、コスト関数がそれに従って修正または再調整される必要があることを認識するであろう。
【0058】
いくつかの状況下で、不適切な符号化モード決定は、不要なIDRまたはI-フレーム挿入をトリガすることがある。オンラインビデオゲーミングの間にビデオをストリーミングする例を考える。エンコーダは、ゲームアプリケーションによって生成されたビデオストリームについてのターゲットビットレートを満たすことを試みる。ターゲットビットレートは、フレームごとのビットの数に関連する。ゲームが中断される場合、ビデオは必然的に静止フレームのストリームである。静止フレームについて、レート歪み最適化処理におけるフレームについてのターゲットビットを満たすために、QPが低い。QPが低いとき、モード決定は、静止フレーム内のほとんどのセクション(例えば、マクロブロック)に対してイントラコーディングを選択する。フレーム内のイントラコーディング済みセクションの数が閾値を上回る場合、コーデックは、シーン変化検出をトリガし、符号化するのに大多数のビットを必要とする、極端に低いQPにより次のフレームがイントラフレームとしてコーディングされる。これは、QPの極端に低い値(例えば、QP=1、2)が、このケースでは、ほぼ可逆のコーディングを暗に意味するという事実に起因する。例として、及び限定なしに、シーン変化検出をトリガするための閾値は、フレーム内の約60~80%のイントラMBであってもよい。一連の静止フレームは、同一のフレームが繰り返されるときでさえ、一連のシーン変化検出を生じさせる。一連のイントラフレームは、帯域幅制限された通信チャネルにおけるビットレート使用の大きく且つ頻繁なスパイクを生じさせることがある。
【0059】
通常、λとQPの間の関係は、コーデックによって固定され、全てのピクチャに対して同一である。本開示の態様に従って、λとQPとの間の関係は、ピクチャ内のセクションごとのビットの数に応じてピクチャごとに調節されてもよい。
【0060】
本開示の態様に従って、λとQPとの間の関係は、セクションごとのビットの数に基づいて適合されてもよく、その結果、不要なIDRまたはI-フレーム挿入の尤度を削減する方式において符号化モード決定を構成することができる。
【0061】
本開示の態様に従って、λとQPとの間の関係は、例えば、ビデオストリームの符号化の開始またはストリーム内の各々のビデオフレームの開始において、セクション符号化モード決定が、「イントラ」コーディングモードの代わりに、「インター」コーディング決定を結果としてもたらす可能性をより高くする方式において、符号化の間に選択的に調節されてもよい。
【0062】
いくつかの実施態様では、例えば、H.265において可能であるように、フレーム内で異なるサイズのセクションが存在する場合、セクションごとにλ対QPの関係を変化させることさえ可能である。これは、より良好なコーディングモード決定を行うことができるように、第1のパスがピクチャセクションのコンテンツに関する更なる洞察を提供するので、例えば、2パス符号化ユースケースにおいて有益である。
【0063】
例として、及び限定なしに、λとQPとの間の関係への調節は、セクション内のビットの数(NBS)に依存してもよく、それは全体的に、ターゲットビットレート(例えば、毎秒ビット内の)、フレームレート(例えば、毎秒フレーム内の)、及びフレーム内のセクションの数に依存する。セクション内のビットの数NBSは、フレームレートFR及びフレームごとのセクションの数(NSF)の積によりターゲットビットレートBRを除算することによって計算されてもよい。例として、及び限定なしに、これは、以下の式によって表現されてもよい。
【数2】
【0064】
より一般的に、セクションごとのビットの数(NBS)は、NBS=(BPF)/(NSF)としてより広義に表現されてもよく、BPFは、フレームごとのビットのターゲット数である。
【0065】
この広義の表現は、例えば、基本的なレート制御スキームによって割り当てられたターゲットビットに応じて、NBSの値がフレームごとに異なる可能性を許容する。フレームごとのビットの固定のターゲット数のケースでは、BPFは、BR/FRになる。
【0066】
フレームごとのセクションの数(例えば、MB)は、分解能に依存する。テーブルへの変更は、分解能、フレームレート、及びビットレートの組み合わせによってトリガされてもよい。例えば、テーブル変更は、960×540の分解能、30fpsのフレームレート、及び8~10Mbpsまたはそれよりも高いターゲットレートを有するフレームに対してトリガされる。所与のビットレート及びフレームレートについて、分解能が増大する場合、テーブル変更がトリガされる可能性は低い。所与のビットレート及び分解能について、フレームレートが増大する場合、テーブル変更がトリガされる可能性は低い。所与のフレームレート及び分解能について、ビットレートが減少する場合、テーブル変更がトリガされる可能性は低い。
【0067】
λとQPとの間の関係は典型的には、非線形的である。全体的に、QPが高く、λが高いとき、及びQPが低く、λが低いときである。λとQPとの間の関係の例は、参照によってその内容全体が本明細書に組み込まれた、米国特許第9,386,317号において説明される。
【0068】
QP値は、ターゲットビットレートに応じて調節されてもよい。QPが符号化においてビット使用率を制御するので、多くの符号化プログラムは、所望のビットレートを達成するためにQPを調節するレートコントローラを利用する。エンコーダは、圧縮されていないソースデータ(例えば、入力ビデオ)を受信し、圧縮済み出力を作成する。ビデオコーディング方法は典型的には、ビデオセクションを符号化するためのビット使用率に影響を及ぼし、したがって、ビットレートに影響を及ぼすQP値を使用する。一般的に、より低いQPは、より高いビットレートを結果としてもたらす。レートコントローラは、外部アプリケーションによって指定することができる、要望されたビットレートに基づいてQP値を判定する。エンコーダは、レートコントローラによって判定されたQP値を使用し、実際の結果として生じるビット使用率及びビットレートを判定する。レートコントローラは、フィードバックループにおけるQP値を調節するために、実際のビットレートを使用してもよい。
【0069】
QPのビットレートと値との間の関係は、画像の存在の複雑度に部分的に依存する。ビットレート対QP関係は、異なるレベルの複雑度についての異なる曲線を有する曲線のセットに関して表現されてもよい。レートコントローラによって実装されたアルゴリズムの核心は、QP、実際のビットレート、及び複雑度の或る測定値の間の関係を記述した定量的モデルである。量子化パラメータQPが、変換済み残差において運ばれる情報の詳細にのみ影響することがあることを理由に、関連するビットレート及び複雑度は全体的に、ソース画素と予測済み画素との間の差(残差と称されることが多い)のみと関連付けられる。
【0070】
複雑度は一般的に、ピクチャまたはピクチャの部分内の空間的変動の量を指す。ローカルレベル、例えば、ブロックまたはマクロブロックレベルでは、空間的変動は、関連するセクション内の画素値の分散によって測定されてもよい。しかしながら、ビデオシーケンスについて、複雑度も、一連の画像のシーンの時間的変動に関連することがある。時間予測が単一の参照ピクチャ及び連続の動きベクトルを使用して動きを容易に捕捉することができることを理由に、例えば、視野にわたって低速に移る相当な空間的変動を有する1つのオブジェクトから構成されたビデオシーケンスは、非常に多くのビットを必要としないことがある。計算するのも容易である包括的ビデオ複雑度メトリックを定義するのは困難であるが、予測誤差(ソース画素値と予測済み画素値との間の差)の平均標準差(MAD)がこの目的のために使用されることが多い。
【0071】
量子化パラメータQPは、それらに限定されないが、ソースピクチャのピクチャタイプ、ソースピクチャの複雑度、推定済みターゲット数のビット、及び基本的なレート歪みモデルを含む複数の因子から判定されてもよいことに留意されよう。例えば、QPは、現在符号化しているピクチャのセクションについての変動、例えば、セクション(例えば、MB)分散を使用してセクションごとの単位で判定されてもよい。代わりに、現在符号化しているセクションについてのQPは、前のフレーム内の同一位置にあるセクション(例えば、MB)を符号化するための実際のビットカウントを使用して判定されてもよい。そのようなQPレベル計算の例は、参照によって本明細書に組み込まれる、例えば、Hung-Ju Leeへの同一出願人による米国特許出願公開第2011/0051806号明細書、今では米国特許第8,879,623号において説明される。
【0072】
動き探索及び予測は、符号化されるピクチャのタイプに依存する。図6を再度参照して、イントラピクチャがコーディングされることになる場合、動き探索MS及びインター/イントラ比較Cがターンオフされる。しかしながら、本発明の実施形態では、パディング済みピクチャが参照として利用可能であるので、それらの関数は、ターンオフされない。結果として、604における画像圧縮は、イントラコーディング済みピクチャ及びインターコーディング済みピクチャに対して同一である。
【0073】
動き探索MSは、インターコーディング済みピクチャに対する画素再構築の一部として通常行われるように、動き補償のための最良整合ブロックまたはマクロブロックに対してピクチャ601を探索することによって、動きベクトルMVを生成することができる。対照的に、現在ピクチャ601がイントラコーディング済みピクチャである場合、既存のコーデックは典型的には、ピクチャにわたる予測を可能にしない。代わりに、イントラピクチャ(例えば、I-フレーム)及び変換係数を生成し、画素予測を実行することによってコーディングされたピクチャに対して、全ての動き補償が通常はターンオフされる。いくつかの実施態様では、しかしながら、現在ピクチャ内のセクションをその同一のピクチャ内の別のオフセットセクションに整合させることによって、インター予測を行うためにイントラピクチャが使用されてもよい。2つのセクションの間のオフセットは、606における画素再構築のために使用することができる動きベクトルMV’としてコーディングされてもよい。例として、エンコーダは、イントラピクチャ内のブロックまたはマクロブロックを、同一のピクチャ内の一部の他のオフセットセクションと整合させ、次いで、2つの間のオフセットを動きベクトルとしてコーディングすることを試みてもよい。次いで、「イントラ」ピクチャに対する動きベクトル補償を行うために、「インター」ピクチャに対するコーデックの通常の動きベクトル補償が使用されてもよい。特定の既存のコーデックは、606における画素再構築を行うために従うことができる、2つのブロックまたはマクロブロックの間のオフセットを動きベクトルに変換することができる関数を有する。しかしながら、それらの関数は、イントラピクチャの符号化のために従来通りターンオフされる。本発明の実施形態では、イントラピクチャの符号化のためのそのような「インター」ピクチャ関数をターンオフしないよう、コーデックが指示されてもよい。
【0074】
本開示の態様に従って、動きベクトルMV及びMV’などの動き情報は、各々のピクチャ内のROI613の外側の1つ以上のエリアから省略されてもよい。画像フレーム内のROIの位置を判定するために、ROIパラメータ612が使用されてもよい。イントラピクチャを生成するための間隔(「イントラ間隔」)を時間ダウンサンプリング間隔と、両方の間隔が一定である場合に同期させることが望ましい。例えば、イントラ間隔は、ダウンサンプリング間隔によって分割可能である。イントラピクチャがシーン変化検出の結果として挿入されることになる場合、イントラ間隔が一定ではない。そのようなケースでは、イントラピクチャ決定は、ダウンサンプリング間隔とは独立して行われる。
【0075】
通常、エンコーダは、前に符号化済み動きベクトルと現在動きベクトルとの間の差を符号化するだけである。次いで、デコーダは、現在動きベクトルを再構築するために、差動動きベクトル及び前の動きベクトルを使用してもよい。本開示の態様に従って、フレームが時間ダウンサンプリング間隔内であると判定される場合、ROIの外側の領域に対して差動動きベクトルが単純に生成されない。ROIの外側の領域を再構築するために、前に符号化済み動きベクトルが代わりに使用されてもよい。加えて、対応する参照ピクチャは、ヌル値による置き換えによって空白にされたROIの外側の対応する1つ以上のエリアを有してもよい。よって、再構築されることになる(606)情報の量を削減する。加えて、どのピクチャが動き情報を省略させるかを判定するために、時間ダウンサンプリング間隔612が使用されてもよい。代替的な実施形態では、計算613の後に動きベクトルを空白にする代わりに、動き圧縮606の間にROIの外側の1つ以上のエリアについての動きベクトルが単純に生成されず、参照ピクチャは、この代替的な実施形態では、画素再構築に送信される前に613においてROIの外側の1つ以上のエリアを空白にさせる。ROIの外側のエリアを空白にさせたままにするとエンコーダが判定する場合、動きベクトル及びDCT係数の両方が生成されない。
【0076】
本開示の態様に従った、時間ダウンサンプリング間隔は、動きベクトル情報を維持するフレーム内で開始及び終了する。動きベクトル時間ダウンサンプリング間隔は、フレーム動きベクトル情報の量が計算から空白にされ、または計算から省略されることを指示する。時間ダウンサンプリング間隔は、ピクチャのセクションごとに利用可能であってもよい。例えば、限定なしに、ピクチャの各々のマクロブロック、ブロック、またはサブブロックは、時間ダウンサンプリング間隔を有してもよい。時間ダウンサンプリング間隔はまた、動き情報を有さない、イントラ予測済みピクチャを説明するために、符号化の間に修正されてもよい。いくつかの実施形態では、時間ダウンサンプリング間隔はまた、大きな値の動きベクトルを有するROIの外側のエリアなど、それらの動き情報を保持するフレームを規定することができる。大きな値の動きベクトルを有するエリアは、動きベクトルの省略613の間に検出されてもよく、大きな値の動きベクトルを有するそのエリアについての時間ダウンサンプリング間隔612内のエントリは、復号の間に追加の情報に適合するよう編集されてもよい。上述したように、領域についてのダウンサンプリング間隔は、ROIに対するその距離に依存する。
【0077】
本開示の態様に従って、時間アップサンプリング(補間)において支援する残差は、画素再構築の一部として生成されてもよい。本明細書で使用されるように、画素再構築は、現在処理している画像への参照画像の変換に関してピクチャを記述するための技術を指す。概して、画素再構築606は、符号化処理600を実装するエンコーダ内のローカルデコーダとしての役割を果たす。特に、画素再構築606は、画像圧縮604から動きベクトルMVまたはMV’を使用して予測済み画素PPを取得し、参照リスト内のピクチャから参照画素を取得するためのインター予測IP1及び(任意選択で)イントラ予測IP2を含む。画像圧縮604からの変換係数607を使用した逆量子化及び逆変換IQXは、復号済み画素609を生成するよう予測済み画素PPに追加される不可逆残差画素605Lを生じさせる。復号済み画素609は、参照ピクチャに挿入され、現在処理しているピクチャ601の後続のセクションに対する画像圧縮604及び画素再構築606における使用のために利用可能である。復号済み画素が挿入された後、参照ピクチャ内の復号されていない画素は、パディング602を受けてもよい。インループダウン/アップサンプリングのために、エンコーダローカルデコーダは、時間アップサンプリング結果を計算してもよい。エンコーダは次いで、元の入力ピクチャ画素と対応するアップサンプリング画素との間の差を残差画素として見なす。ROIの外側のエリアの品質がより低いことを理由に、それらの残差画素は、より大きな量子化パラメータ(QP)により符号化される。
【0078】
いくつかのエンコーダの実施態様では、現在ピクチャがイントラコーディングされる場合、画素再構築のために使用することができる他のピクチャが存在しないことを理由に、画素再構築606のインター予測部がターンオフされる。代わりに、特定のピクチャがインターコーディングされることになるか、またはイントラコーディングされることになるかどうかとは独立して、いずれかのピクチャ601に対して画素再構築が実行されてもよい。いくつかの実施態様では、実装するエンコーダは、参照ピクチャリスト603にパディング済みピクチャを追加するよう修正されてもよく、現在処理している画像がイントラコーディングされることになる場合でさえ、画素再構築606のインター予測部がターンオフされない。結果として、インターコーディング済みセクション及びイントラコーディング済みセクションの両方についての処理フローは、画素再構築606の間は同一である。唯一の大きな差は、符号化のために使用されることになる参照ピクチャの選択である。いくつかの実施態様では、全てのピクチャに対して動き補償が実行される必要がなく、パディング済みピクチャが参照ピクチャリストに追加される必要がないことに留意されよう。
【0079】
例として、及び限定なしに、ブロック画素再構築(BMC)として既知の、1つのタイプの画素再構築では、各々の画像は、画素のブロック(例えば、16×16の画素のマクロブロック)に区画化されてもよい。各々のブロックは、参照フレーム内の等しいサイズのブロックから予測される。予測済みブロックの位置にシフトされることとは別にいずれの方式においてもブロックが変換されない。動きベクトルMVは、このシフトを表す。隣接するブロックベクトルの間の冗長性を活用するために(例えば、複数のブロックによって網羅される単一の動くオブジェクトに対して)、ビットストリーム内の現在動きベクトルと前の動きベクトルとの間の差のみを符号化することが一般的である。この差分処理の結果は、パンニングの能力を有する大域的画素再構築と数学的に同等である。更に、符号化パイプラインの下で、方法600は任意選択で、出力サイズを削減するよう、ゼロベクトルの周りの動きベクトルの結果として生じる統計的分布を利用するために、エントロピコーディング608を使用してもよい。いくつかの実施形態では、ネットワーク抽象レイヤ(NAL)内のネットワークラッパの一部として、デジタルピクチャ611と共にROIパラメータ及び時間ダウンサンプリング間隔612が含まれる。他の実施形態では、エントロピコーディング608の間にROIパラメータ及び時間ダウンサンプリング間隔612がデジタルピクチャに含まれてもよい。
【0080】
部分画素精度と称される、非整数の数の画素だけブロックをシフトさせることが可能である。隣接する画素を補間することによって、その間で画素が生成される。一般的に、1/2画素精度または1/4画素精度が使用される。部分画素精度の計算的労力は、補間のために必要とされる特別の処理に起因してより高く、エンコーダ側では、より多くの数の潜在的なソースブロックが評価されることになる。
【0081】
ブロック画素再構築は、現在符号化している画像を重ならないブロックに分割し、それらのブロックが参照画像から来る場所を示す画素再構築ベクトルを計算する。参照ブロックは典型的には、ソースフレーム内で重なる。いくつかのビデオ圧縮アルゴリズムは、参照画像リスト603内のいくつかの異なる参照画像の部分から現在画像を組み立てる。
【0082】
画像圧縮604及び画素再構築606、並びに(任意選択で)エントロピコーディング608の結果は、便宜のためにコーディング済みピクチャと称されるデータのセット611である。動きベクトルMV(及び/または、イントラ予測モード動きベクトルMV’)並びに変換係数607は、コーディング済みピクチャ611に含まれてもよい。
【0083】
図6Bは、ピクチャフレームレートを使用した時間ダウンサンプリングを実装する本開示の代替的な実施形態を表す。デジタルピクチャ601は、ROIの外側の1つ以上のエリア内でそれらのフレームレートをダウンサンプリングさせてもよい(614)。ROIの位置、形状、及びサイズを判定するために、ROIパラメータ612が使用される。ROIの外側のエリアのフレームレートを判定するために、時間ダウンサンプリング間隔が使用される。例えば、限定なしに、ROIの外側の1つ以上のエリア内のクロマ値及びルマ値をヌル値と置き換えることによって、フレームレートダウンサンプリング614を達成することができる。
【0084】
この実施例では、時間ダウンサンプリング間隔は、何個のフレームがクロマ及びルマについてのヌル値を有するエリアを有するかを規定することができる。時間ダウンサンプリング間隔は、異なるサイズのエリアに対して規定されてもよく、例えば、限定なしに、時間ダウンサンプリング間隔は、ライン、マクロブロック、ブロック、またはサブブロックのスケールにあってもよい。上記議論されたように、時間ダウンサンプリング間隔の先頭フレーム及び最後フレームは、ROIの外側のそれらの情報を保持することができる。ここで、時間ダウンサンプリング間隔の先頭フレーム及び最後フレームについて、ROIの外側のエリアについてのクロマ情報及びルマ情報が保持される。フレームレートダウンサンプリングを実行した後、時間的ダウンサンプリング済みフレーム615は、上記議論されたような604における画像圧縮及び(任意選択で)602におけるパディングを含む他の符号化演算を受ける。それらの実施形態では、動きベクトル時間ダウンサンプリングが実行されず、したがって、ROIの外側のエリアについての動きベクトルが除去されないことに留意されるべきである。
【0085】
復号
図7は、本開示の態様と共に使用することができるROIパラメータにより時間的ダウンサンプリング済みストリーミングデータ701を復号する方法700におけるとり得る処理フローの実施例を例示する。この特定の実施例は、例えば、AVC(H.264)標準規格を使用したビデオ復号のための処理フローを示す。コーディング済みストリーミングデータ701は、バッファに最初に記憶されてもよい。コーディング済みストリーミングデータ701(例えば、ビデオデータビットストリーム)がネットワーク、例えば、インターネットを通じて転送された場合、データ701は、702において示される、ネットワーク抽象レイヤ(NAL)復号と称される処理を最初に受けてもよい。ネットワーク抽象レイヤ(NAL)は、H.264/AVC及びHEVCビデオコーディング標準規格など、ストリーミングデータ標準規格の一部である。NALの主要な目標は、「会話型」アプリケーション(例えば、ビデオ電話)及び「非会話型」(記憶、ブロードキャスト、またはストリーミング)アプリケーションについてのストリーミングデータの「ネットワークフレンドリ」表現のプロビジョンである。NAL復号は、データ701から、データを伝送する際に支援する情報を除去することができる。「ネットワークラッパ」と称されるそのような情報は、ビデオデータとしてデータを識別することができ、あるいはビットストリームの先頭もしくは最後、データの整列のためのビット、及び/またはビデオデータ自体に関するメタデータを示すことができる。
【0086】
加えて、例として、ネットワークラッパは、例えば、分解能、ピクチャ表示フォーマット、データを表示するためのカラーパレット変換マトリックス、各々のピクチャ、スライス、またはマクロブロック内のビットの数に関する情報を含む、データ701に関する情報と共に、下位レベルの復号において使用される情報、例えば、スライスの先頭または最後を示すデータを含んでもよい。単一のセクション内のタスクグループの各々に渡すマクロブロックの数を判定するために、この情報が使用されてもよい。その複雑度に起因して、NAL復号は典型的には、ピクチャ及びスライスレベルで行われる。NAL復号のために使用される最小NALバッファは通常、スライスのサイズにされる。図7に例示される例は、マクロブロック及びAVC(H.264)標準規格に関して説明される。しかしながら、それらは、本開示の態様の特徴に限定されない。例えば、最新のH.265(HEVC)標準規格では、マクロブロックの概念が存在しない。代わりに、より柔軟なコーディングユニット(CU)、予測ユニット、(PU)、変換ユニット(TU)の概念が導入される。本開示の態様は、そのようなコーディング標準規格と共に作用することができる。例として、及び限定なしに、ネットワークラッパは、ROIパラメータ及び時間ダウンサンプリング間隔727を含んでもよい。代わりに、ROIパラメータ及び時間ダウンサンプリング間隔は、別個に受信されてもよく、または符号化されていなくてもよい。加えて、ビットストリームを成すフレームのヘッダまたは他のフレームメタデータ内で時間ダウンサンプリング間隔が符号化されてもよい。代わりに、ビットストリームに挿入することができる特別な情報である、補足強化情報の一部として時間ダウンサンプリング間隔が含まれてもよい。
【0087】
いくつかの実施形態では、702におけるNAL復号の後、本明細書でビデオコーディングレイヤ(VCL)復号704、動きベクトル(MV)再構築710、及びピクチャ再構築714と称される3つの異なるスレッドグループまたはタスクグループにおいて、図7に例示される残りの復号が実装されてもよい。ピクチャ再構築タスクグループ714は、画素予測及び再構築716並びに事後処理720を含んでもよい。本発明のいくつかの実施形態では、それらのタスクグループは、データ依存性に基づいて選択されてもよく、その結果、マクロブロックが後続の処理のために次のタスクグループに送信される前に、ピクチャ(例えば、フレームもしくはフィールド)またはセクション内の全てのマクロブロックのその処理を完了することができる。
【0088】
特定のコーディング標準規格は、空間ドメインから周波数ドメインへの画素情報の変換を伴うデータ圧縮の形式を使用してもよい。1つのそのような変換は、とりわけ、離散コサイン変換(DCT)として既知である。そのような圧縮済みデータに対する復号処理は、周波数ドメインから空間ドメインに戻る逆変換を伴う。DCTを使用して圧縮されたデータのケースでは、逆の処理は、逆離散コサイン変換(IDCT)として既知である。変換済みデータは、離散変換済みデータ内の数を表すために使用されるビットの数を削減するよう量子化される場合がある。例えば、数1、2、3は全てが2にマッピングされてもよく、数4、5、6は全てが5にマッピングされてもよい。データを圧縮解除するために、周波数ドメインから空間ドメインへの逆変換を実行する前に、逆量子化(IQ)として既知の処理が使用される。VCL IQ/IDCT復号処理704についてのデータ依存性は典型的には、同一のスライス内のマクロブロックについてのマクロブロックレベルにある。その結果、VCL復号処理704によって生じた結果は、マクロブロックレベルにおいてバッファリングされてもよい。
【0089】
VCL復号704は、VCLシンタックスを復号するために使用される、エントロピ復号706と称される処理を含むことが多い。AVC(H.264)などの多くのコーデックは、エントロピ符号化と称される符号化のレイヤを使用する。エントロピ符号化は、コード長を信号の確率と整合させるように信号にコードを割り振るコーディングスキームである。典型的には、等しい長さのコードによって表されるシンボルを、負の対数確率に比例したコードによって表されるシンボルと置き換えることによって、データを圧縮するためにエントロピエンコーダが使用される。AVC(H.264)は、2つのエントロピ符号化スキーム、コンテキスト適応型可変長コーディング(CAVLC)及びコンテキスト適応型バイナリ算術コーディング(CABAC)をサポートする。CABACがCAVLCよりも約10%上回る圧縮をもたらす傾向があるので、AVC(H.264)ビットストリームを生成する際に、多くのビデオエンコーダによってCABACが好まれる。AVC(H.264)コーディング済みデータストリームのエントロピレイヤを復号することが、計算集中的であることがあり、汎用マイクロプロセッサを使用してAVC(H.264)コーディング済みビットストリームを復号するデバイスに対して課題を提示することがある。この理由のために、多くのシステムは、ハードウェアデコーダアクセラレータを使用する。
【0090】
エントロピ復号706に加えて、VCL復号処理704は、708に示されるような逆量子化(IQ)及び/または逆離散コサイン変換(IDCT)を伴ってもよい。それらの処理は、マクロブロックからのヘッダ709及びデータを復号することができる。隣接するマクロブロックのVCL復号において支援するために、復号済みヘッダ709が使用されてもよい。ROIパラメータが符号化される実施形態では、復号済みヘッダは、ROIパラメータを包含してもよい。
【0091】
VCL復号704は、マクロブロックレベルデータ依存性頻度において実装されてもよい。特に、同一のスライス内の異なるマクロブロックは、並列してVCL復号を受けてもよく、更なる処理のために、動きベクトル再構築タスクグループ710に結果が送信されてもよい。
【0092】
本開示の態様に従って、示される復号方法は、動き情報時間ダウンサンプリングと729におけるフレームレート時間ダウンサンプリングとの間を区別する。本開示のいくつかの実施形態では、時間ダウンサンプリングタイプは、例えば、限定なしに、メタデータ内の、または時間ダウンサンプリング間隔情報727内のビット識別子によって区別されてもよい。加えて、動き情報時間ダウンサンプリング復号能力のみを有するデコーダ、またはフレームレート時間ダウンサンプリング復号能力のみを有するデコーダのいずれかが可能であることが明らかであるはずである。制限された復号能力による実施形態では、動き情報時間ダウンサンプリング復号能力のみによる実施形態について、パスMVのみが存在する。同様に、フレームレートダウンサンプリング復号のみによる実施形態について、パスフレームレートのみが存在する。
【0093】
その後、ピクチャまたはセクション内の全てのマクロブロックは、動きベクトル再構築710を受けてもよい。MV再構築処理710は、所与のマクロブロック711及び/または同一位置にあるマクロブロックヘッダ713からのヘッダを使用した動きベクトル再構築712を伴ってもよい。動きベクトルは、ピクチャ内の明白な動きを記述する。そのような動きベクトルは、前のピクチャの画素の知識及びピクチャからピクチャへのそれらの画素の相対的な動きに基づいて、ピクチャ(または、それらの一部)の再構築を可能にする。動きベクトルが回復すると、画素は、VCL復号処理704からの残差画素及びMV再構築処理710からの動きベクトルに基づいた処理を使用して、716において再構築されてもよい。MVについてのデータ依存性頻度(及び、並列性のレベル)は、MV再構築処理710が他のピクチャからの同一位置にあるマクロブロックを含むかどうかに依存する。他のピクチャからの同一位置にあるMBヘッダを伴わないMV再構築のために、MV再構築処理710は、スライスレベルまたはピクチャレベルにおいて並列に実装されてもよい。同一位置にあるMBヘッダを伴うMV再構築のために、データ依存性頻度は、ピクチャレベルにあり、MV再構築処理710は、スライスレベルにおいて並列性により実装されてもよい。
【0094】
ピクチャは、動き情報の時間ダウンサンプリングの影響を受けやすく、間隔の間の先頭フレームと最後フレームとの間の時間ダウンサンプリング間隔内のフレームについてのROIの外側のエリア内の動き情報がない。よって、MV再構築処理710の間、時間ダウンサンプリング間隔内のフレームについての動きベクトルが生成される必要がある。それらのフレームについての動きベクトルの生成は、先頭フレーム及び最後フレームを判定するために、時間ダウンサンプリング間隔情報727を使用してもよい。上記議論されたように、時間ダウンサンプリング間隔の先頭フレーム及び最後フレームは、それらの動き情報を保持する。動き再構築処理は、時間ダウンサンプリング間隔内の先頭フレーム及び最後フレームの動きベクトルの間を補間するように構成されてもよい。時間ダウンサンプリング間隔内のフレームの数を説明するために、補間が調節されてもよい。加えて、時間ダウンサンプリング間隔情報727は、時間ダウンサンプリング間隔内のそれらの動き情報を保持する追加のフレームを示すことができ、補間の適合を更に精緻化するためにそれらのフレームの動き情報が使用されてもよい。補間は、上記議論されたように、例えば、限定なしに、線形補間であってもよい。
【0095】
フレーム内の動きROIを特定するために、動きベクトル再構築710によってROIパラメータが使用されてもよい。上記議論されたように、ROIは、その動きベクトルを保持し、したがって、ROIの正確な再構築が常に可能である。動きベクトル再構築の間、ROIの動きベクトルは、補間によって生成された動きベクトルと組み合わされてもよい。ROIパラメータは、フレーム内のROI動きベクトルを特定する際に支援する。
【0096】
動きベクトル生成の間の1つの問題は、サンプルの実際の位置がスクリーンから離れて移動し、またはそうでなければ変化することがあることである。このケースでは、オブジェクトのエッジに対して望ましくない画像効果が発生することがある。このケースでは、符号化の間に残差が生成されることがあり、再構築の間に問題のあるエリアを識別及び補正するために残差が使用されることがある。例として、及び限定なしに、インループダウン/アップサンプリングのために、エンコーダのローカルデコーダは、デコーダと同一のアップサンプリングを実行する。エンコーダは、デコーダのアップサンプリング結果に従って、残差画素を計算する。エンコーダがオブジェクトのエッジに対するアップサンプリングギャップを検出する場合、エンコーダは、そのような望ましくないアップサンプリング効果をカバーするために、より高い品質によりエッジに対して残差画素を符号化する。
【0097】
動きベクトル再構築710の結果は、ピクチャ周波数レベルに対して並列化することができる、ピクチャ再構築タスクグループ714に送信される。ピクチャ再構築タスクグループ714内で、ピクチャまたはセクション内の全てのマクロブロックは、デブロッキング720と共に画素予測及び再構築716を受けてもよい。画素予測及び再構築タスク716並びにデブロッキングタスク720は、復号の効率を高めるために並列化されてもよい。それらのタスクは、データ依存性に基づいてマクロブロックレベルにおいてピクチャ再構築タスクグループ714内で並列化されてもよい。例えば、画素予測及び再構築716は、1つのマクロブロックに対して実行されてもよく、デブロッキング720がそれに続いてもよい。デブロッキング720によって取得された復号済みピクチャからの参照画素は、後続のマクロブロックに対して画素予測及び再構築716において使用されてもよい。画素予測及び再構築718は、後続のマクロブロックについての画素予測及び再構築処理718への入力として使用することができる隣接画素を含む復号済みセクション719(例えば、復号化済みブロックまたはマクロブロック)を作成する。画素予測及び再構築716についてのデータ依存性は、同一のスライス内のマクロブロックについてのマクロブロックレベルにおける或る程度の並列処理を可能にする。
【0098】
事後処理タスクグループ720は、ブロックコーディング技術が使用されるとき、ブロックの間で形成することができる鮮明なエッジを平滑化することによって、視覚品質及び予測性能を改善するために、復号済みセクション719内のブロックに適用されるデブロッキングフィルタ722を含んでもよい。結果として生じるデブロッキング済みセクション724の外観を改善するために、デブロッキングフィルタ722が使用されてもよい。
【0099】
復号済みセクション719またはデブロッキング済みセクション724は、隣接するマクロブロックをデブロッキングする際に使用するための隣接する画素を提供することができる。加えて、現在復号しているピクチャからのセクションを含む復号済みセクション719は、後続のマクロブロックについての画素予測及び再構築718のための参照画素を提供することができる。それは、現在ピクチャ内からのその画素が任意選択で、ピクチャ(または、それらのサブセクション)がインターコーディングされ、またはイントラコーディングされているかどうかに関わらず、上記説明されたように、その同一の現在ピクチャ内で画素予測のために使用されてもよい段階の間である。デブロッキング720は、同一のピクチャ内のマクロブロックについてのマクロブロックレベルで並列化されてもよい。
【0100】
事後処理720の前に作成された復号済みセクション719、及び事後処理済みセクション724は、同一のバッファ、例えば、伴う特定のコーデック応じた復号済みピクチャバッファ725に記憶されてもよい。デブロッキングがH.264における事後処理フィルタであることに留意されよう。H.264は、隣接するマクロブロックのイントラ予測についての参照としての事前デブロッキングマクロブロック及び後のピクチャマクロブロックインター予測についての事後デブロッキングマクロブロックを使用する。事前デブロッキング画素及び事後デブロッキング画素の両方が予測のために使用されることを理由に、デコーダまたはエンコーダは、事前デブロッキングマクロブロック及び事後デブロッキングマクロブロックの両方をバッファリングする必要がある。最も低いコスト消費者アプリケーションについて、事前デブロッキング済みピクチャ及び事後デブロッキング済みピクチャは、メモリ使用率を削減するために同一のバッファを共有する。MPEG2またはMPEG4 part 10を除くMPEG4などH.264よりも前に来る標準規格について(注:H.264は、MPEG4 part 10とも称される)、他のマクロブロック予測のための参照として、事後-事前処理マクロブロック(例えば、事前-事後デブロッキングマクロブロック)のみが使用される。そのようなコーデックでは、事前フィルタリング済みピクチャは、事後フィルタリング済みピクチャと同一のバッファを共有しなくてもよい。
【0101】
フレームレート時間ダウンサンプリングを含む実施形態について、処理の後、時間ダウンサンプリング間隔内の先頭ピクチャ及び最後ピクチャのROIの外側の1つ以上のエリアが補間される(726)。上述したように、非圧縮処理全体が行われた後に、アウトオブループがある。時間ダウンサンプリングに起因した不明ルマ値及びクロマ値であるROIの外側のエリアについてのルマ値及びクロマ値を生成するために補間が使用される。フレーム内のROIを特定するために、ROIパラメータが使用されてもよい。フレームレート時間ダウンサンプリングに起因したROIの外側の1つ以上のエリア内の不明クロマ情報及びルマ情報であるフレームの数を判定するために、時間ダウンサンプリング間隔が使用されてもよい。補間ステップ726の間、正確なフィッティング補間を生じさせるために、時間ダウンサンプリング間隔が使用されてもよい。
【0102】
ROIの外側の1つ以上のエリアについての画像が生成されると、復号処理によって生成された、ROIの内部の実際の画像が組み合わされてもよい。終了済みピクチャ728を生成するために、ROIの内部の画像の配置がROIパラメータ727によってガイドされてもよい。動き情報時間ダウンサンプリングの影響を受けやすかったピクチャについて、補間なしに、復号処理の後に終了済みピクチャ728が生成されてもよい。終了済みピクチャ728は、出力バッファに記憶されてもよい。
【0103】
H.264について、画素復号の後、復号済みセクション719は、復号済みピクチャバッファ725に保存されてもよい。後に、事後処理済みセクション724は、補間726の前に復号済みピクチャバッファ725内の復号済みセクション719を置き換える。H.264でないケースでは、デコーダは、復号済みピクチャバッファ725に復号済みセクション719を保存するだけである。補間726が表示時間に行われ、アップサンプリング済み出力728は、復号済みピクチャバッファ725と同一のバッファを共有しなくてもよい。エンコーダ/デコーダプログラムに関する情報は、参照によりその内容が組み込まれる、公開された特許出願第2018/0007362号明細書において発見することができる。
【0104】
ROI判定
対象領域は、観察者に対して重要となるアプリケーションによって判定されたスクリーン空間の一部を表し、したがって、利用可能なグラフィック計算リソースのより大きな共有を割り当てられる。ROIデータは、スクリーン空間内の中心窩領域の重心の位置、スクリーン空間に対する中心窩領域のサイズ、及び中心窩領域の形状を識別する情報を含んでもよい。(a)観察者が見ている可能性が高い領域であること、(b)観察者が実際に見ている領域であること、または(c)ユーザが見るのに引き付けるのが望ましい領域であること、を理由に、アプリケーションによって、ROIが観察者に対する対象のものであると判定されてもよい。
【0105】
(a)に関して、コンテキストに応じた方式において、中心窩領域が見られる可能性が高いと判定されてもよい。いくつかの実施態様では、アプリケーションは、スクリーン空間の特定の部分または対応する三次元仮想空間内の特定のオブジェクトが「対象のもの」であると判定してもよく、そのようなオブジェクトは、仮想空間内の他のオブジェクトよりも多い数の頂点を使用して一貫して描かれてもよい。中心窩領域は、静的な様式または動的な様式において対象のものであるとコンテキスト的に定義されてもよい。静的な定義の非限定的な実施例として、中心窩領域は、スクリーン空間の固定部分、例えば、この領域が、観察者が見ている可能性が最も高いスクリーン空間の一部であると判定される場合、スクリーンの中心の近くの領域であってもよい。例えば、アプリケーションが、車両のダッシュボード及びフロントガラスの画像を表示するドライビングシミュレータである場合、観察者は、画像のそれらの部分を見ている可能性が高い。この実施例では、中心窩領域は、対象領域がスクリーン空間の固定部分であるという意味で、統計的に定義されてもよい。動的な定義の非限定的な実施例として、ビデオゲーム内で、ユーザのアバタ、フェローゲーマのアバタ、敵の人工知能(AI)キャラクタ、特定の対象のオブジェクト(例えば、スポーツゲーム内のボール)は、ユーザに対する対象のものであってもよい。そのような対象のオブジェクトは、スクリーン空間に対して移動してもよく、したがって、中心窩領域は、対象のオブジェクトと共に移動するように定義されてもよい。
【0106】
(b)に関して、観察者がディスプレイのどの部分を見ているかを判定するよう、観察者の凝視を追跡することが可能である。観察者の凝視を追跡することは、ユーザの頭部姿勢及びユーザの目の瞳孔の方位の何らかの組み合わせを追跡することによって実装されてもよい。そのような凝視トラッキングのいくつかの実施例は、参照によりその内容の全てが本明細書に組み込まれる、例えば、米国特許出願公開第2015/0085250号明細書、米国特許出願公開第2015/0085251号明細書、及び米国特許出願公開第2015/0085097号明細書において説明される。頭部姿勢の推定の更なる詳細は、参照によりその内容が本明細書に組み込まれる、例えば、“Head Pose Estimation in Computer Vision:A Survey” by Erik Murphy,in IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE,Vol.31,No.4,April2009,pp607-626において発見することができる。本発明の実施形態と共に使用することができる頭部姿勢推定の他の例は、参照によりその内容全体が本明細書に組み込まれる、Athanasios Nikolaidisによる“Facial feature extraction and pose determination” Pattern Recognition,Vol.33(July 7,2000)pp.1783-1791において説明される。本発明の実施形態と共に使用することができる頭部姿勢推定の追加の例は、参照によりその内容全体が本明細書に組み込まれる、Yoshio Matsumoto 及びAlexander Zelinskyによる“An Algorithm for Real-time Stereo Vision Implementation of Head Pose and Gaze Direction Measurement”,Proceedings of the Fourth IEEE International Conference on Automatic Face and Gesture Recognition(FG ’00),2000,pp 499-505 において説明される。本発明の実施形態と共に使用することができる頭部姿勢推定の更なる例は、参照によりその内容全体が本明細書に組み込まれる、Qiang Ji and Ruong Huによる“3D Face Pose Estimation from a Monocular Camera”, Image and Vision Computing,Vol.20,Issue7,20 February,2002,pp 499-511において説明される。
【0107】
(c)に関して、それは、対象の部分、例えば、話している特定のアクタに焦点を当てるようシーンの焦点の深度を変化させる一般のシネマティックデバイスである。これは、焦点内にある画像の部分への観察者の注意を引くために行われる。本開示の態様に従って、スクリーンの所望の部分がより大きな密度の頂点を有し、結果としてより詳細にレンダリングされるように、その部分に対する中心窩領域を移動させることによって、同様の効果がコンピュータグラフィックにより実装されてもよい。
【0108】
凝視トラッキングとしても既知である、アイトラッキングのためのいくつかの技術が存在する。視線トラッキング及び選択的レンダリング圧縮のための技術は、参照によって本明細書でその内容が組み込まれる、公開された特許出願公開第2017/0285736号明細書において説明される。これら技術の一部は、ユーザの目の瞳孔の方位からユーザの凝視方向を判定する。一部の既知の視線トラッキング技術は、1つ以上の光源から光を放射し、放射された光の角膜からの反射をセンサにより検出することによって目を照射することを伴う。典型的には、これは、赤外線範囲内の非可視光源を使用して、及び赤外線感知カメラによる照射された目の画像データ(例えば、画像またはビデオ)を捕捉して達成される。次いで、視線方向を判定するよう画像データを分析するために、画像処理アルゴリズムが使用される。
【0109】
全体的に、アイトラッキング画像分析は、光が目からどのように反射されるかに特有の特性を利用して、画像から視線方向を判定する。例えば、画像データにおける角膜反射に基づいて目の位置を識別するよう、画像が分析されてもよく、画像内の瞳孔の相対位置に基づいて凝視方向を判定するよう、画像が更に分析されてもよい。
【0110】
瞳孔の位置に基づいて凝視方向を判定するための2つの一般的な凝視トラッキング技術は、明瞳孔トラッキング及び暗瞳孔トラッキングとして既知である。明瞳孔トラッキングは、カメラの光軸と実質的に一致する光源による目の照射を伴い、放射された光を網膜に反射させ、瞳孔を通じてカメラに戻す。瞳孔は、従来のフラッシュ撮影中に画像に発生する赤目効果と同様に、瞳孔の位置に識別可能な明るいスポットとして画像内に存在する。この凝視トラッキングの方法では、瞳孔と虹彩のコントラストが十分でない場合に、瞳孔自体からの明るい反射が、システムが瞳孔を特定することを助ける。
【0111】
暗瞳孔トラッキングは、カメラの光軸から実質的にずれている光源による照射を伴い、瞳孔を通じて方向付けられた光を、カメラの光軸から離れる方に反射させ、その結果、瞳孔の位置において、画像に特定可能な暗いスポットを生じさせる。別の暗瞳孔トラッキングシステムでは、目に向けられた赤外光源及びカメラは、角膜反射を見ることができる。そのようなカメラベースのシステムは、瞳孔及び角膜の反射の位置を追跡し、それは、異なる深度の反射が追加的な精度を与えることに起因した視差をもたらす。
【0112】
図8Aは、本開示のコンテキストにおいて使用することができる暗瞳孔凝視トラッキングシステム800の実施例を表す。凝視トラッキングシステムは、可視画像が提示されるディスプレイ画面801に対するユーザの目Eの方位を追跡する。図8Aの実施例のシステムではディスプレイスクリーンが使用されると共に、特定の代替的な実施形態は、ユーザの目に直接画像を投影することが可能な画像投影システムを利用してもよい。これらの実施形態では、ユーザの目Eは、ユーザの目に投影された画像に対して追跡される。図8Aの実施例では、目Eは、可変虹彩Iを通じてスクリーン801から光を集め、レンズLは、網膜Rに画像を投影する。虹彩内の開口は、瞳孔として既知である。筋肉は、脳からの神経インパルスに応答して目Eの回転を制御する。上まぶた及び下まぶたの筋肉ULM、LLMは、それぞれ、他の神経インパルスに応答して、上まぶた及び下まぶたUL、LLを制御する。
【0113】
網膜R上の感光性細胞は、視神経ONを介してユーザの脳(図示せず)に送信される電気インパルスを生成する。脳の視覚野は、インパルスを解釈する。網膜Rの全ての部分に同等な感光性があるわけではない。具体的には、感光性細胞は、中心窩として知られている領域に集中している。
【0114】
例示される画像トラッキングシステムは、目Eに向かって非可視光(例えば、赤外線光)を方向付ける1つ以上の赤外線光源802、例えば、発光ダイオード(LED)を含む。非可視光の一部は、目の角膜Cから反射し、一部は、虹彩から反射する。反射された非可視光は、波長選択ミラー806によって適切なセンサ804(例えば、赤外線カメラ)に向かって方向付けられる。ミラーは、スクリーン801からの可視光を透過するが、目から反射された非可視光を反射する。
【0115】
センサ804は好ましくは、画像センサ、例えば、瞳孔の相対位置から凝視方向GDを判定するために分析することができる目Eの画像を作成することができるデジタルカメラである。この画像は、ローカルプロセッサ820により、またはリモートコンピューティングデバイス860への取得された凝視トラッキングデータの伝送を介して作成されてもよい。ローカルプロセッサ820は、例えば、シングルコア、デュアルコア、クアッドコア、マルチコア、プロセッサコプロセッサ、及びセルプロセッサなどの周知のアーキテクチャに従って構成されてもよい。画像トラッキングデータは、有線接続(図示せず)を介してセンサ804とリモートコンピューティングデバイス860の間で、またはアイトラッキングデバイス810に含まれる無線送受信機825とリモートコンピューティングデバイス860に含まれる第2の無線送受信機826との間で、無線で伝送されてもよい。無線送受信機は、ローカルエリアネットワーク(LAN)またはパーソナルエリアネットワーク(PAN)を、適切なネットワークプロトコル、例えば、PANについてのBluetoothを介して実装するように構成されてもよい。
【0116】
凝視トラッキングシステム800は、目Eの上及び下にそれぞれ配置されるように構成された上部センサ808及び下部センサ809をも含んでもよい。センサ808及び809は、独立した構成要素であってもよく、または代わりに、ユーザの頭部に装着された構成要素810の一部であってもよく、それらに限定されないが、以下で説明されるセンサ804、ローカルプロセッサ820、または慣性センサ815のいずれかの組み合わせを含んでもよい。図1Aに示される実施例のシステムでは、センサ808及び809は、目Eを囲むそれらのエリアから、神経系の電気インパルス並びに/または筋肉系の移動及び/もしくは振動に関するデータを収集することが可能である。このデータは、例えば、上部センサ808及び下部センサ809によって監視されるような目Eを囲む筋肉及び/または神経の電気生理学情報及び/または振動情報を含んでもよい。センサ808及び809によって収集された電気生理学情報は、例えば、脳波記録(EEG)、筋電図検査(EMG)、または目Eを囲むエリア(複数可)内の神経機能の結果として収集された誘発電位情報を含んでもよい。センサ808及び809は、例えば、筋肉の振動または目Eを囲む筋肉のひきつりを検出した結果としての筋音図情報または表面筋電図情報を収集することも可能であってもよい。センサ808はまた、例えば、心拍データ、心電図検査(ECG)、またはガルバニック皮膚反応データを含む、乗り物酔い反応に関連する情報を収集することが可能であってもよい。センサ808及び809によって収集されたデータは、画像トラッキングデータと共に、上記説明されたようなローカルプロセッサ820及び/またはリモートコンピューティングデバイス860に配信されてもよい。
【0117】
凝視トラッキング800はまた、ユーザの頭部を追跡することも可能であってもよい。頭部トラッキングは、ユーザの頭部の位置、動き、方位、または方位における変化に応答して信号を作成することが可能である慣性センサ815によって実行されてもよい。このデータは、ローカルプロセッサ820に送信されてもよく、及び/またはリモートコンピューティングデバイス860に伝送されてもよい。慣性センサ815は、独立した構成要素であってもよく、または代わりに、それらに限定されないが、センサ804、ローカルプロセッサ820、または上記説明されたセンサ808及び809のいずれかの組み合わせを含むことができる、ユーザの頭部に装着された構成要素810の一部であってもよい。代替的な実施形態では、頭部トラッキングは、構成要素810上での光源の追跡を介して実行されてもよい。凝視トラッキングシステム800はまた、1つ以上のメモリユニット877(例えば、ランダムアクセスメモリ(RAM)、ダイナミックランダムアクセスメモリ(DRAM)、及びリードオンリメモリ(ROM)など)を含んでもよい。
【0118】
ローカルプロセッサ820は、ネットワーク接続825から符号化済みデータを受信するように構成されてもよい。ローカルプロセッサ820は、1つ以上のメモリユニット877に動作可能に結合されてもよく、メモリユニット877に記憶された1つ以上のプログラムを実行するように構成されてもよい。そのようなプログラムの実行は、システムに、リモートコンピューティングデバイス860からのビデオストリームを復号させ、ディスプレイ801上での表示のために高い忠実度ROIによりビデオを生成させることができる。例として、及び限定なしに、プログラムは、ブレンダ/変換空間構成プログラム879、時間アップサンプラ/ダウンサンプラプログラム876、及びデコーダプログラム880を含んでもよい。
【0119】
リモートコンピューティングデバイス860は、本開示の態様に従って、視線アイトラッキングを実行し、照明条件を判定するために、アイトラッキングデバイス810及びディスプレイスクリーン801と連携して動作するように構成されてもよい。コンピューティングデバイス860は、1つ以上のプロセッサユニット870を含んでもよく、1つ以上のプロセッサユニット870は、例えば、シングルコア、デュアルコア、クアッドコア、マルチコア、プロセッサ-コプロセッサ、及びセルプロセッサなどの公知のアーキテクチャに従って構成されてもよい。コンピューティングデバイス860はまた、1つ以上のメモリユニット872(例えば、ランダムアクセスメモリ(RAM)、ダイナミックランダムアクセスメモリ(DRAM)、及びリードオンリメモリ(ROM)など)を含んでもよい。
【0120】
プロセッサユニット870は、1つ以上のプログラムを実行してもよく、その一部はメモリ872に格納されてもよく、プロセッサ870は、例えば、データバス878を介してメモリにアクセスすることによって、メモリ872に動作可能に結合されてもよい。プログラムは、視線トラッキングを実行し、システム800に対する照明条件を判定するように構成されてもよい。例として、及び限定なしに、プログラムは、その実行によってシステム800が、例えば、上記議論されたようなユーザの凝視を追跡することができる凝視トラッキングプログラム873、ディスプレイデバイスによって提示することができる形式にビデオフレームストリームを変換するカラー空間変換プログラム(CSC)874、エンコーダプログラム875、並びにその実行が、表示の前に符号化済みビデオフレームが復号され、ダウンサンプリング済みセクションが生成される、ディスプレイに送信されることになるそのままの動き情報またはクロマ情報及びルマ情報を有するビデオフレームの時間的ダウンサンプリング済みセクション及び選択済み元のセクションによりストリームビデオフレームを符号化するビデオストリーム時間アップサンプラ/ダウンサンプラプログラム876を含んでもよい。
【0121】
例として、及び限定なしに、凝視トラッキングプログラム873は、システム800に、光が光源802から放射される間、画像センサ804により集められたアイトラッキングデータ並びに上部センサ808及び下部センサ809から集められた目の動きデータそれぞれから、システム800の1つ以上の凝視トラッキングパラメータを判定させるプロセッサ実行可能命令を含んでもよい。凝視トラッキングプログラム873はまた、照明条件における変化の存在を検出するために、画像センサ804により集められた画像を分析する命令を含んでもよい。
【0122】
図8Bに見られるように、ユーザの頭部Hを示す画像881は、瞳孔の相対位置から凝視方向GDを判定するよう分析されてもよい。例えば、画像分析は、画像における目Eの中心からの瞳孔Pの2次元オフセットを判定することができる。中心に対する瞳孔の位置は、眼球の既知のサイズ及び形状に基づく三次元ベクトルの単純な幾何学的計算によって、画面801に対する凝視方向に変換されてもよい。判定された凝視方向GDは、目Eが画面801に対して動くときの目Eの回転及び加速度を示すことが可能である。
【0123】
また、図8Bに見られるように、画像は、角膜C及びレンズLそれぞれからの非可視光の反射887及び888を含をも含んでもよい。角膜とレンズが異なる深度にあるので、凝視方向GDを判定する際の精度を高めるために、反射の間の視差と屈折率が使用されてもよい。このタイプのアイトラッキングシステムの例は、デュアルプルキニエトラッカであり、ここで、角膜反射は、第1のプルキニエ像であり、レンズ反射は、第4のプルキニエ像である。ユーザがそれらを装着している場合、ユーザの眼鏡893からの反射190も存在してもよい。
【0124】
現在のHMDパネルは、製造者に応じて90または120ヘルツ(Hz)の一定レートにおいてリフレッシュする。高いリフレッシュレートは、パネルの電力消費及びフレーム更新を送信するための伝送媒体の帯域幅要件を増大させる。中心窩視野及びスケーリングされた符号化による凝視トラッキングデバイスに関する情報は、参照によりその内容が組み込まれる、米国特許出願第20180192058号明細書として公開された、係属中の特許出願第15/840,893号において発見することができる。
【0125】
実施態様
図9は、本開示の様々な態様を更に例示するための実施例のシステム900を表す。システム900は、アイトラッキングディスプレイシステム901に結合されたコンピューティングデバイス960を含んでもよい。アイトラッキングディスプレイデバイス901は、本開示の態様に従って視線トラッキング及び/またはアイトラッキングに対する較正を実行するために、ローカルプロセッサ903、ローカルメモリ917、公知のサポート回路905、ネットワークインタフェース916、アイトラッキングデバイス902、及びディスプレイデバイス904を含む。ディスプレイデバイス904は、陰極線管(CRT)、フラットパネルスクリーン、タッチスクリーン、またはテキスト、数字、グラフィックシンボル、もしくは他の視覚的オブジェクトを表示する他のデバイスの形態にあってもよい。ローカルプロセッサ903は、例えば、シングルコア、デュアルコア、クアッドコア、マルチコア、プロセッサコプロセッサ、セルプロセッサなどといった周知のアーキテクチャに従って構成されてもよい。アイトラッキングディスプレイシステム901はまた、1つ以上のメモリユニット917(例えば、ランダムアクセスメモリ(RAM)、ダイナミックランダムアクセスメモリ(DRAM)、及びリードオンリメモリ(ROM)など)を含んでもよい。
【0126】
ローカルプロセッサユニット903は、1つ以上のプログラムを実行してもよく、1つ以上のプログラムの一部は、メモリ917に記憶されてもよく、プロセッサ903は、例えば、データバス918を介してメモリにアクセスすることによって、メモリ917に動作可能に結合されてもよい。プログラムは、アイトラッキングディスプレイシステム901に対して高い忠実度によりビデオを生成するように構成されてもよい。例として、及び限定なしに、プログラムは、CSC913、ビデオ時間アップサンプラ/ダウンサンプラプログラム914、及びデコーダプログラム915を含んでもよい。例として、及び限定なしに、CSC913は、システム901に、上記説明された方法904に従ってディスプレイデバイス上での表示のために高い忠実度ROIによりビデオを生成するよう、時間アップサンプラ/ダウンサンプラプログラム914から受信された、再生成済みビデオストリームをフォーマットさせるプロセッサ実行可能命令を含んでもよい。サンプラ914は、実行されるとき、ローカルプロセッサに、ダウンサンプリング間隔内にビデオフレームについてのROIの外側のエリア内の先頭フレームと最後フレームとの間を補間させ、デコーダ915から受信された、ビデオストリームを再生成するよう、ROI画像データを補間済み画像データと組み合わされる命令を包含してもよい。デコーダプログラム915は、ローカルプロセッサによって実行されるとき、システムに、ネットワークインタフェース916からの符号化済みビデオストリームデータを受信及び復号させる命令を包含してもよい。デコーダプログラムは代わりに、例えば、メインバス918によってローカルプロセッサに通信可能に結合された離散論理ユニット(図示せず)として実装されてもよい。本開示の態様に従って、アイトラッキングディスプレイデバイス901は、組み込みシステム、携帯電話、パーソナルコンピュータ、タブレットコンピュータ、ポータブルゲームデバイス、ワークステーション、ゲームコンソール、及びヘッドマウントディスプレイデバイスなどであってもよい。その上、コンピューティングデバイス960も、組み込みシステム、携帯電話、パーソナルコンピュータ、タブレットコンピュータ、ポータブルゲームデバイス、ワークステーション、及びゲームコンソールなどであってもよい。
【0127】
アイトラッキングディスプレイデバイス901は、コンピューティングデバイス960に結合されてもよく、及び図8A~8Bの光源910と同様の動的光源910を含んでもよい。例として、及び限定なしに、光源910は、1つ以上の赤外線LED形式にあるの非可視光源であってもよく、これは、センサ912によりアイトラッキングデータを集めるために、ユーザの目を照射するように構成されてもよい。アイトラッキングデバイスのセンサ912は、光源910から放射された光を感知する検出器であってもよい。例えば、センサ912は、赤外線カメラなどの光源を感知するカメラであってもよく、カメラ912は、光源910によって照射されたエリアの画像を捕捉することができるように、アイトラッキングデバイス及び光源に対して位置付けられてもよい。
【0128】
コンピューティングデバイス960は、本開示の態様に従って、視線トラッキングを実行し、照明条件を判定するために、アイトラッキングディスプレイシステム901と連携して動作するように構成されてもよい。コンピューティングデバイス960は、1つ以上のプロセッサユニット970を含んでもよく、1つ以上のプロセッサユニット970は、例えば、シングルコア、デュアルコア、クアッドコア、マルチコア、プロセッサ-コプロセッサ、及びセルプロセッサなどの公知のアーキテクチャに従って構成されてもよい。コンピューティングデバイス960はまた、1つ以上のメモリユニット972(例えば、ランダムアクセスメモリ(RAM)、ダイナミックランダムアクセスメモリ(DRAM)、及びリードオンリメモリ(ROM)など)を含んでもよい。
【0129】
プロセッサユニット970は、1つ以上のプログラムを実行してもよく、その一部は、メモリ972に記憶されてもよく、プロセッサ970は、例えば、データバス976を介してメモリにアクセスすることによって、メモリ972に動作可能に結合されてもよい。プログラムは、凝視トラッキングを実行し、システム900についての照明条件を判定するように構成されてもよい。例として、及び限定なしに、プログラムは、その実行により、システム900がユーザの凝視を追跡することができる、凝視トラッキングプログラム973を含んでもよい。例として、及び限定なしに、凝視トラッキングプログラム973は、システム900に、動的光源910から光が放射される間、カメラ912により集められたアイトラッキングデータからシステム900の1つ以上の凝視トラッキングパラメータを判定させるプロセッサ実行可能命令を含んでもよい。凝視トラッキングプログラム973はまた、例えば、図8Bに関して上記説明されたように、カメラ912により集められた画像を分析する命令を含んでもよい。凝視トラッキングプログラムは代わりに、例えば、メインバス918によってローカルプロセッサに通信可能に結合された離散論理ユニット(図示せず)として実装されてもよい。
【0130】
いくつかの実施態様では、凝視トラッキングプログラム973は、例えば、瞬きの間、または非活性、例えば、サッケードの間、ユーザの視覚的知覚が曖昧になる周期を予測するよう、凝視トラッキング情報を分析してもよい。そのような周期を予測することは、不要なレンダリング計算、電力消費、及びネットワーク帯域幅使用を削減するために使用されてもよい。そのような技術の例は、参照によりその内容が本明細書に組み込まれる、2016年3月31日に出願された同一人による米国特許出願第15/086,953号において説明される。
【0131】
コンピューティングデバイス960及びアイトラッキングディスプレイデバイス901は、例えば、バス976 918のそれぞれを介してシステムの構成要素と通信することができる、入力/出力(I/O)回路979 906、電力供給装置(P/S)980 909、クロック(CLK)981 908、及びキャッシュ982 907などの公知のサポート回路978 905をも含んでもよい。コンピューティングデバイス960は、アイトラッキングディスプレイデバイス901上で同様に構成されたネットワークインタフェース916との通信を促進するためのネットワークインタフェース990を含んでもよい。プロセッサユニット970 903及びネットワークインタフェース990 916は、例えば、適切なネットワークプロトコル、例えば、パーソナルエリアネットワーク(PAN)についてのBluetoothを介して、ローカルエリアネットワーク(LAN)またはPANを実装するように構成されてもよい。コンピューティングデバイス960は任意選択で、ディスクドライブ、CD-ROMドライブ、テープドライブ、及びフラッシュメモリなどの大容量記憶装置984を含んでもよく、大容量記憶装置984は、プログラム及び/またはデータを記憶してもよい。コンピューティングデバイス960はまた、システム900とユーザとの間の対話を促進するためのユーザインタフェース988を含んでもよい。ユーザインタフェース988は、キーボード、マウス、ライトペン、ゲームコントロールパッド、タッチインタフェース、または他のデバイスを含んでよい。代替的な実施形態では、ユーザインタフェース988はまた、ディスプレイスクリーンを含んでもよく、コンピューティングデバイス960は、ネットワークからデータパケット999内の符号化済みビデオストリームを復号するエンコーダ/デコーダ(コーデック)975を有してもよく、時間アップサンプラ/ダウンサンプラプログラム974は、ダウンサンプリング間隔内にビデオフレームについてのROIの外側のエリア内の先頭フレームと最後フレームとの間を補間し、ビデオストリームの画像フレームを再生成するよう、ROI画像データを補間された画像データと組み合わせてもよい。上記説明されたように、CSCプログラム976は、アップサンプリング済みビデオスクリーンを要してもよく、ユーザインタフェース988に結合されたディスプレイスクリーン上での表示のためにそれを構成してもよい。例えば、CSCは、符号化の前に、1つのカラーフォーマットから別のカラーフォーマットに(例えば、RGBからYUVに、またはその逆)入力画像を変換する。この実施形態では、ヘッドトラッカが存在しなくてもよく、上記説明された予測方法によってROI位置が判定されてもよい。他の実施形態では、ヘッドトラッカが存在してもよいが、ディスプレイスクリーンがトラッキングデバイスに結合されなくてもよい。他の実施形態では、エンコーダは、ネットワークインタフェース916を通じて、符号化済みビデオストリームデータ及びROIパラメータを伝送してもよく、符号化済みビデオストリームデータ及びROIパラメータは、デコーダプログラム915によって受信及び処理される。
【0132】
システム900は、プロセッサユニット970によって実行されるプログラムと対話するために、アイトラッキングディスプレイデバイス901とインタフェースするコントローラ(描かれず)をも含んでもよい。システム900は、トラッキングデバイス902によって検知され、トラッキングプログラム993、CSC976、ディスプレイデバイスによって提示することができる形式にビデオフレームデータを変換する時間アップサンプラ/ダウンサンプラ974、及びビデオストリームエンコーダ975によって処理されるように、視線トラッキングの態様を組み込むことができる、ビデオゲームまたはビデオストリームなど、1つ以上の汎用コンピュータアプリケーション(描かれず)をも実行してもよい。
【0133】
コンピューティングデバイス960は、Wi-Fi、イーサネット(登録商標)ポート、または他の通信方法の使用を可能にするように構成されたネットワークインタフェース990を含んでもよい。ネットワークインタフェース990は、電気通信ネットワークを介した通信を容易にするために、適切なハードウェア、ソフトウェア、ファームウェア、またはそのなんらかの組み合わせを組み込んでよい。ネットワークインタフェース990は、ローカルエリアネットワーク及びインターネットなどのワイドエリアネットワークを通じた有線通信または無線通信を実装するように構成されてもよい。ネットワークインタフェース990はまた、アイトラッキングデバイス902及びディスプレイデバイス979との無線通信を促進する前述の無線送受信機を含んでもよい。コンピューティングデバイス960は、ネットワークを通じて1つ以上のデータパケット999を介してデータ及び/またはファイルについての要求を送信及び受信してもよい。
【0134】
本開示の態様は、ROI内の詳細の損失なしに、画像データの伝送の間にビットカウントを削減することを可能にする。削減したビットカウントは、圧縮されたビットストリームを作成する符号化処理を加速化し、符号化済みピクチャデータを伝送するために必要とされる帯域幅を削減する。削減したビットカウントは有利なことに、符号化済みデータを復号するのに必要な時間を著しく増大させることなく、画像データを符号化するのに必要な時間を削減する。
【0135】
上記は、本発明の好ましい実施形態の完全な説明であるが、多様な代替策、修正、及び均等物を使用することが可能である。したがって、本発明の範囲は、上記説明を参照して判定されるべきでなく、代わりに、均等物のそれらの全範囲に従った、添付の特許請求の範囲を参照して判定されるべきである。好ましいか否かに関わらず、本明細書で説明されたいずれかの特徴は、好ましいか否かに関わらず、本明細書で説明されたいずれかの他の特徴と組み合わされてもよい。以下の請求項では、不定冠詞「A」または「An」は、明確に述べられる場合を除き、冠詞に続く項目のうちの1つ以上の量を指す。添付の特許請求の範囲は、ミーンズプラスファンクションの限定が語句「するための手段(means for)」を使用し、所与の請求項に明示的に説明されない限り、係る限定を含むものとして解釈されるべきではない。
図1A
図1B
図2
図3A
図3B
図3C
図3D
図4A
図4B
図4C
図4D
図5A
図5B
図6A
図6B
図7
図8A
図8B
図9
【手続補正書】
【提出日】2022-06-16
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ビデオ符号化のための方法であって、
a)ピクチャストリーム内及び時間ダウンサンプリング間隔内のピクチャについての1つ以上の対象領域(ROI)パラメータを判定することと、
b)時間的ダウンサンプリング済みピクチャを生成するよう、前記時間ダウンサンプリング間隔に従って前記ピクチャストリーム内のピクチャ内のROIの外側の1つ以上のエリアを時間的にダウンサンプリングすることと、
c)前記時間的ダウンサンプリング済みピクチャを符号化することと、
d)前記符号化された時間的ダウンサンプリング済みピクチャを伝送することと、
を備えた、方法。
【請求項2】
前記ROIの外側のエリアを時間的にダウンサンプリングすることは、前記ROIの外側の前記エリアを判定するために前記ROIパラメータを使用することと、前記時間ダウンサンプリング間隔の内のフレームについての前記ROIの外側のエリアについて動き情報を省略することと、を含む、請求項1に記載の方法。
【請求項3】
前記動き情報は、動きベクトル、動きベクトルが差す参照ピクチャを識別する情報、または動きベクトルが網羅するセクションサイズを含む、請求項2に記載の方法。
【請求項4】
前記時間的ダウンサンプリング済みピクチャを符号化することは、前記ROIの外側のダウンサンプリング済みエリアを有する前記ピクチャをエントロピ符号化することを含む、請求項1に記載の方法。
【請求項5】
前記ROIの外側のエリアを時間的にダウンサンプリングすることは、前記ROIの外側の前記1つ以上のエリアを判定するために前記ROIパラメータを使用することと、前記ROIの外側のエリアについてのフレームレートを減少させることと、を含む、請求項1に記載の方法。
【請求項6】
前記時間ダウンサンプリング間隔は、前記ROIの外側の前記エリアについてのフレームレートを決定する、請求項5に記載の方法。
【請求項7】
前記時間ダウンサンプリング間隔は、ピクチャ内のダウンサンプリング位置及び前記対象領域パラメータに基づいて変化する、請求項1に記載の方法。
【請求項8】
前記時間ダウンサンプリング間隔は、前記ピクチャ内の前記ダウンサンプリング位置が前記ROIの位置から離れて移動するにつれて増大する、請求項7に記載の方法。
【請求項9】
前記時間ダウンサンプリング間隔は、前記ピクチャ内の前記ダウンサンプリング位置が前記ROIの位置から離れて移動するにつれて線形レートにおいて増大する、請求項8に記載の方法。
【請求項10】
前記時間ダウンサンプリング間隔は、前記ピクチャ内の前記ダウンサンプリング位置が前記ROIの位置から離れて移動するにつれて非線形レートにおいて増大する、請求項8に記載の方法。
【請求項11】
前記時間ダウンサンプリング間隔は、ROIからの距離に対するダウンサンプリングレートのS字状関数において増大する、請求項10に記載の方法。
【請求項12】
前記時間ダウンサンプリング間隔は、ROIからの距離に対するダウンサンプリングレートに応じて指数関数において増大する、請求項10に記載の方法。
【請求項13】
前記時間的ダウンサンプリング済みピクチャを符号化する前に、サッケードの間に前記ピクチャストリーム内のピクチャにロウパスフィルタを適用することを更に備えた、請求項1に記載の方法。
【請求項14】
前記時間ダウンサンプリング間隔を符号化することと、ネットワークを通じて前記時間ダウンサンプリング間隔を送信することと、を更に備えた、請求項1に記載の方法。
【請求項15】
前記時間的ダウンサンプリング済みピクチャを符号化する前に、前記ROIの外側の前記エリアにマルチセグメント空間ダウンサンプリングを適用することを更に備えた、請求項1に記載の方法。
【請求項16】
前記ROIの外側の前記1つ以上のエリアの特定のエリアについての前記時間ダウンサンプリング間隔は、前記ROIに対する前記特定のエリアの距離に依存する、請求項1に記載の方法。
【請求項17】
前記時間的ダウンサンプリング済みピクチャを前記符号化する前に、前記ROIの外側の前記エリアにマルチセグメント空間ダウンサンプリングを適用することを更に備えた、請求項1に記載の方法。
【請求項18】
ビデオ復号のための方法であって、
a)符号化済みピクチャストリーム内の符号化済みピクチャを復号することと、
b)前記符号化済みピクチャストリームから前記ピクチャのROIの外側のエリアを時間的にアップサンプリングすることと、
c)前記ROIの外側の前記時間的アップサンプリング済みエリアを、前記符号化済みピクチャストリームから前記復号された符号化済みピクチャストリームへの前記ピクチャに挿入することと、
d)前記時間的アップサンプリング済みピクチャを記憶することと、
を備えた、方法。
【請求項19】
前記ROIの外側のエリアを前記時間的にアップサンプリングすることは、ダウンサンプリング間隔内のフレームごとに前記ROIの外側のエリアについての動き情報を生成するよう、時間ダウンサンプリング間隔の先頭フレーム及び最後フレームからの前記ROIの外側のエリア内の前記動き情報を補間することを含む、請求項18に記載の方法。
【請求項20】
前記動き情報は、動きベクトルである、請求項19に記載の方法。
【請求項21】
前記ROIの外側のエリアを前記時間的にアップサンプリングすることは、ダウンサンプリング間隔内のフレームごとに前記ROIの外側のエリアについての画像を生成するよう、時間ダウンサンプリング間隔の先頭フレームと最後フレームとの間の前記ROIの外側の前記エリアを補間することを含む、請求項18に記載の方法。
【請求項22】
ダウンサンプリング間隔を復号することを更に備えた、請求項18に記載の方法。
【請求項23】
前記ROIの外側の前記時間的アップサンプリング済みエリアを前記ピクチャに挿入した後、マルチセグメント空間アップサンプリングを実行することを更に備えた、請求項18に記載の方法。
【請求項24】
e)において記憶装置に前記時間的アップサンプリング済みピクチャを記憶することと、ディスプレイデバイス上で前記時間的アップサンプリング済みピクチャを表示することと、を更に備えた、請求項18に記載の方法。
【請求項25】
前記符号化済みピクチャストリームから前記ピクチャへの前記ROIの外側の前記時間的アップサンプリング済みエリアを、前記復号された符号化済みピクチャストリームに前記挿入した後、マルチセグメント空間アップサンプリングを実行することを更に備えた、請求項18に記載の方法。
【請求項26】
プロセッサと、
前記プロセッサに結合されたメモリと、
前記メモリに組み込まれた非一時的命令と、を備え、前記非一時的命令は、実行されるとき、
a)ピクチャストリーム内及び時間ダウンサンプリング間隔内のピクチャについての1つ以上の対象領域(ROI)パラメータを判定することと、
b)時間的ダウンサンプリング済みピクチャを生成するよう、前記時間ダウンサンプリング間隔に従って前記ピクチャストリーム内のピクチャ内のROIの外側の1つ以上のエリアを時間的にダウンサンプリングすることと、
c)前記時間的ダウンサンプリング済みピクチャを符号化することと、
d)前記符号化され時間的ダウンサンプリング済みピクチャを伝送することと、
を含む、ビデオ符号化のための方法を前記プロセッサに実行させる、システム。
【請求項27】
前記ROIの外側のエリアを時間的にダウンサンプリングすることは、前記ROIの外側の前記エリアを判定するために前記ROIパラメータを使用することと、前記時間ダウンサンプリング間隔の内のフレームについての前記ROIの外側のエリアについて動き情報を省略することと、を含む、請求項26に記載のシステム。
【請求項28】
前記ROIの外側のエリアを時間的にダウンサンプリングすることは、前記ROIの外側の前記1つ以上のエリアを判定するために前記ROIパラメータを使用することと、前記ROIの外側のエリアについてのフレームレートを減少させることと、を含む、請求項26に記載のシステム。
【請求項29】
ビデオ符号化のための前記方法は、前記時間的ダウンサンプリング済みピクチャを前記符号化する前に、前記ROIの外側の前記エリアにマルチセグメント空間ダウンサンプリングを適用することを更に含む、請求項26に記載のシステム。
【請求項30】
コンピュータ可読媒体に組み込まれた非一時的命令であって、前記非一時的命令は、実行されるとき、
a)ピクチャストリーム内及び時間ダウンサンプリング間隔内のピクチャについての1つ以上の対象領域(ROI)パラメータを判定することと、
b)時間的ダウンサンプリング済みピクチャを生成するよう、前記時間ダウンサンプリング間隔に従って前記ピクチャストリーム内のピクチャ内のROIの外側の1つ以上のエリアを時間的にダウンサンプリングすることと、
c)前記時間的ダウンサンプリング済みピクチャを符号化することと、
d)前記符号化された時間的ダウンサンプリング済みピクチャを伝送することと、
を含む、ビデオ符号化のための方法をコンピュータに実行させる、非一時的命令。
【請求項31】
前記ROIの外側のエリアを時間的にダウンサンプリングすることは、前記ROIの外側の前記エリアを判定するために前記ROIパラメータを使用することと、前記時間ダウンサンプリング間隔の内のフレームについての前記ROIの外側のエリアについて動き情報を省略することと、を含む、請求項30に記載の非一時的命令。
【請求項32】
前記ROIの外側のエリアを時間的にダウンサンプリングすることは、前記ROIの外側の前記1つ以上のエリアを判定するために前記ROIパラメータを使用することと、前記ROIの外側のエリアについてのフレームレートを減少させることと、を含む、請求項30に記載の非一時的命令。
【請求項33】
ビデオ符号化のための前記方法は、前記時間的ダウンサンプリング済みピクチャを前記符号化する前に、前記ROIの外側の前記エリアにマルチセグメント空間ダウンサンプリングを適用することを更に含む、請求項30に記載の非一時的命令。
【請求項34】
プロセッサと、
前記プロセッサに結合されたメモリと、
前記メモリに組み込まれた非一時的命令と、を備え、前記非一時的命令は、実行されるとき、
a)符号化済みピクチャストリーム内の符号化済みピクチャを復号することと、
b)前記符号化済みピクチャストリームから前記ピクチャのROIの外側のエリアを時間的にアップサンプリングすることと、
c)前記ROIの外側の前記時間的アップサンプリング済みエリアを、前記符号化済みピクチャストリームから前記復号された符号化済みピクチャストリームへの前記ピクチャに挿入することと、
d)前記時間的アップサンプリング済みピクチャを記憶することと、
を含む、ビデオ復号のための方法を前記プロセッサに実行させる、システム。
【請求項35】
前記ROIの外側のエリアを前記時間的にアップサンプリングすることは、ダウンサンプリング間隔内のフレームごとに前記ROIの外側のエリアについての動き情報を生成するよう、時間ダウンサンプリング間隔の先頭フレーム及び最後フレームからの前記ROIの外側のエリア内の前記動き情報を補間することを含む、請求項34に記載のシステム。
【請求項36】
前記ROIの外側のエリアを前記時間的にアップサンプリングすることは、ダウンサンプリング間隔内のフレームごとに前記ROIの外側のエリアについての画像を生成するよう、時間ダウンサンプリング間隔の先頭フレームと最後フレームとの間の前記ROIの外側の前記エリアを補間することを含む、請求項34に記載のシステム。
【請求項37】
ビデオ復号のための前記方法は、前記符号化済みピクチャストリームから前記ピクチャへの前記ROIの外側の前記時間的アップサンプリング済みエリアを、前記復号された符号化済みピクチャストリームに前記挿入した後、マルチセグメント空間アップサンプリングを実行することを更に含む、請求項34に記載のシステム。
【請求項38】
コンピュータ可読媒体に組み込まれた非一時的命令であって、前記非一時的命令は、実行されるとき、
a)符号化済みピクチャストリーム内の符号化済みピクチャを復号することと、
b)前記符号化済みピクチャストリームから前記ピクチャのROIの外側のエリアを時間的にアップサンプリングすることと、
c)前記ROIの外側の前記時間的アップサンプリング済みエリアを、前記符号化済みピクチャストリームから前記復号された符号化済みピクチャストリームへの前記ピクチャに挿入することと、
d)前記時間的アップサンプリング済みピクチャを記憶することと、
を含む、ビデオ復号のための方法をコンピュータに実行させる、非一時的命令。
【請求項39】
前記ROIの外側のエリアを前記時間的にアップサンプリングすることは、ダウンサンプリング間隔内のフレームごとに前記ROIの外側のエリアについての動き情報を生成するよう、時間ダウンサンプリング間隔の先頭フレーム及び最後フレームからの前記ROIの外側のエリア内の前記動き情報を補間することを含む、請求項38に記載の非一時的命令。
【請求項40】
前記ROIの外側のエリアを前記時間的にアップサンプリングすることは、ダウンサンプリング間隔内のフレームごとに前記ROIの外側のエリアについての画像を生成するよう、時間ダウンサンプリング間隔の先頭フレームと最後フレームとの間の前記ROIの外側の前記エリアを補間することを含む、請求項38に記載の非一時的命令。
【請求項41】
ビデオ復号のための前記方法は、前記符号化済みピクチャストリームから前記ピクチャへの前記ROIの外側の前記時間的アップサンプリング済みエリアを、前記復号された符号化済みピクチャストリームに前記挿入した後、マルチセグメント空間アップサンプリングを実行することを更に含む、請求項38に記載の非一時的命令。
【国際調査報告】