IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン バイトダンス ネットワーク テクノロジー カンパニー リミテッドの特許一覧

<>
  • 特表-ビデオの超解像化方法及び装置 図1
  • 特表-ビデオの超解像化方法及び装置 図2
  • 特表-ビデオの超解像化方法及び装置 図3
  • 特表-ビデオの超解像化方法及び装置 図4
  • 特表-ビデオの超解像化方法及び装置 図5
  • 特表-ビデオの超解像化方法及び装置 図6
  • 特表-ビデオの超解像化方法及び装置 図7
  • 特表-ビデオの超解像化方法及び装置 図8
  • 特表-ビデオの超解像化方法及び装置 図9
  • 特表-ビデオの超解像化方法及び装置 図10
  • 特表-ビデオの超解像化方法及び装置 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-12-09
(54)【発明の名称】ビデオの超解像化方法及び装置
(51)【国際特許分類】
   G06T 3/4053 20240101AFI20241202BHJP
   G06T 3/4046 20240101ALI20241202BHJP
   G06T 7/223 20170101ALI20241202BHJP
【FI】
G06T3/4053
G06T3/4046
G06T7/223
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024539756
(86)(22)【出願日】2023-03-17
(85)【翻訳文提出日】2024-07-03
(86)【国際出願番号】 CN2023082228
(87)【国際公開番号】W WO2023174416
(87)【国際公開日】2023-09-21
(31)【優先権主張番号】202210265124.7
(32)【優先日】2022-03-17
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
(71)【出願人】
【識別番号】520476341
【氏名又は名称】北京字節跳動網絡技術有限公司
【氏名又は名称原語表記】Beijing Bytedance Network Technology Co., Ltd.
【住所又は居所原語表記】Room B-0035, 2/F, No.3 Building, No.30, Shixing Road, Shijingshan District Beijing 100041 China
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100229448
【弁理士】
【氏名又は名称】中槇 利明
(72)【発明者】
【氏名】ドォン,ハン
【テーマコード(参考)】
5B057
5L096
【Fターム(参考)】
5B057BA02
5B057CA01
5B057CA08
5B057CA12
5B057CA16
5B057CB01
5B057CB08
5B057CB12
5B057CB16
5B057CC01
5B057CD05
5B057CE10
5B057DA16
5B057DB02
5B057DB06
5B057DB09
5B057DC17
5B057DC36
5B057DC40
5L096AA02
5L096AA06
5L096CA04
5L096DA01
5L096HA02
5L096HA11
5L096KA04
5L096MA03
(57)【要約】
本開示の実施例は、ビデオの超解像化方法及び装置を提供し、画像処理技術分野に関する。この方法は、超解像化すべきビデオのt番目の画像フレームとt番目の画像フレームの近傍画像フレームをN個の画像ブロックにそれぞれ分解することと、N個の画像ブロックシーケンスを生成することであって、画像ブロックシーケンスにおける各画像ブロックがそれぞれ異なる画像フレームの同じ位置に位置することと、各画像ブロックシーケンスの運動パラメータを計算することであって、画像ブロックシーケンスの運動パラメータは、この画像ブロックシーケンスにおける各隣接する画像フレームの画像ブロックの間の運動パラメータを含むことと、各画像ブロックシーケンスの運動パラメータに基づいて各画像ブロックシーケンスに対応する超解像化ネットワークモデルを決定することと、対応する超解像化ネットワークモデルを採用して各画像ブロックシーケンスにおけるt番目の画像フレームの画像ブロックを超解像化し、t番目の画像フレームの各超解像化画像ブロックを取得することと、t番目の画像フレームの各超解像化画像ブロックに基づいてt番目の画像フレームの超解像化画像フレームを生成することとを含む。
【特許請求の範囲】
【請求項1】
ビデオの超解像化方法であって、
超解像化すべきビデオのt番目の画像フレームと前記t番目の画像フレームの近傍画像フレームをN個の画像ブロックにそれぞれ分解することであって、t、Nがいずれも正整数であることと、
前記t番目の画像フレームと前記近傍画像フレームを分解して得られた画像ブロックに基づいて、N個の画像ブロックシーケンスを生成することであって、前記画像ブロックシーケンスにおける各画像ブロックがそれぞれ異なる画像フレームの同じ位置に位置することと、
各画像ブロックシーケンスの運動パラメータを計算することであって、いずれか一つの画像ブロックシーケンスの運動パラメータは、この画像ブロックシーケンスにおける各隣接する画像フレームの画像ブロックの間のオプティカルフローを表すために用いられることと、
各画像ブロックシーケンスの運動パラメータに基づいて各画像ブロックシーケンスに対応する超解像化ネットワークモデルを決定することと、
各画像ブロックシーケンスに対応する超解像化ネットワークモデルを採用して各画像ブロックシーケンスにおける前記t番目の画像フレームの画像ブロックを超解像化し、前記t番目の画像フレームの各超解像化画像ブロックを取得することと、
前記t番目の画像フレームの各超解像化画像ブロックに基づいて前記t番目の画像フレームの超解像化画像フレームを生成することとを含む、ビデオの超解像化方法。
【請求項2】
各画像ブロックシーケンスの運動パラメータを計算することは、
各画像ブロックシーケンスに対して、前記画像ブロックシーケンスにおける各隣接する画像フレームの画像ブロックの間のオプティカルフローを計算することと、
各対の隣接する画像フレームの画像ブロックの間のオプティカルフローに対して、各画素に対応するオプティカルフローの絶対値の平均値を計算し、前記隣接する画像フレームの画像ブロックの間の運動パラメータを取得することと、
前記画像ブロックシーケンスにおける各隣接する画像フレームの画像ブロックの間の運動パラメータに基づいて、前記画像ブロックシーケンスの運動パラメータを取得することとを含む、請求項1に記載のビデオの超解像化方法。
【請求項3】
前記t番目の画像フレームの近傍画像フレームは、
t-2番目の画像フレーム、t-1番目の画像フレーム、t+1番目の画像フレーム及びt+2番目の画像フレームを含む、請求項1に記載のビデオの超解像化方法。
【請求項4】
各画像ブロックシーケンスの運動パラメータに基づいて各画像ブロックシーケンスに対応する超解像化ネットワークモデルを決定することは、
各画像ブロックシーケンスに対して、前記画像ブロックシーケンスの第一の運動パラメータと第二の運動パラメータがいずれも予め設定された閾値よりも小さいかどうかを決定することであって、前記第一の運動パラメータは、前記t番目の画像フレームの画像ブロックと前記t-1番目の画像フレームの画像ブロックとの間の運動パラメータであり、前記第二の運動パラメータは、前記t番目の画像フレームの画像ブロックと前記t+1番目の画像フレームの画像ブロックとの間の運動パラメータであることと、
前記第一の運動パラメータと前記第二の運動パラメータがいずれも前記予め設定された閾値よりも小さい場合に、前記画像ブロックシーケンスに対応する超解像化ネットワークモデルを第一の超解像化ネットワークモデルとして決定することと、
前記第一の運動パラメータ及び/又は前記第二の運動パラメータが前記予め設定された閾値以上である場合に、前記画像ブロックシーケンスの第三の運動パラメータと第四の運動パラメータがいずれも予め設定された閾値よりも小さいかどうかを決定することであって、前記第三の運動パラメータは、前記t-2番目の画像フレームの画像ブロックと前記t-1番目の画像フレームの画像ブロックとの間の運動パラメータであり、前記第四の運動パラメータは、前記t+1番目の画像フレームの画像ブロックと前記t+2番目の画像フレームの画像ブロックとの間の運動パラメータであることと、
前記第三の運動パラメータと前記第四の運動パラメータがいずれも前記予め設定された閾値よりも小さい場合に、前記画像ブロックシーケンスに対応する超解像化ネットワークモデルを第二の超解像化ネットワークモデルとして決定することと、
前記第三の運動パラメータ及び/又は前記第四の運動パラメータが前記予め設定された閾値以上である場合に、前記画像ブロックシーケンスに対応する超解像化ネットワークモデルを第三の超解像化ネットワークモデルとして決定することとを含む、請求項3に記載のビデオの超解像化方法。
【請求項5】
前記第一の超解像化ネットワークモデルは、単一フレームの超解像化ネットワークモデルであり、
前記第二の超解像化ネットワークモデルは、前記t-1番目の画像フレームの画像ブロック、前記t番目の画像フレームの画像ブロック及び前記t+1番目の画像フレームの画像ブロックに基づいて、前記t番目の画像フレームの画像ブロックを超解像化するために用いられ、
前記第三の超解像化ネットワークモデルは、画像ブロックシーケンスにおけるすべての画像ブロックに基づいて前記t番目の画像フレームの画像ブロックを超解像化するために用いられる、請求項4に記載のビデオの超解像化方法。
【請求項6】
前記第一の超解像化ネットワークモデルにより前記t番目の画像フレームの画像ブロックを超解像化することは、
カスケード変形可能な畳み込みPCD整列モジュールにより前記t番目の画像フレームの画像ブロックを処理して第一の特徴を取得することと、
特徴融合モジュールにより前記第一の特徴を処理し、チャンネル次元で複数の前記第一の特徴をスティッチングして得られる特徴である第二の特徴を取得することと、
再構築モジュールにより前記第二の特徴を再構築し、第一の画像ブロックを取得することと、
アップサンプリングモジュールにより前記第一の画像ブロックに対してアップサンプリングを行い、前記t番目の画像フレームの画像ブロックに対応する超解像化画像ブロックを取得することとを含む、請求項5に記載のビデオの超解像化方法。
【請求項7】
前記第二の特徴は、チャンネル次元で五つの前記第一の特徴をスティッチングして得られる特徴である、請求項6に記載のビデオの超解像化方法。
【請求項8】
前記第二の超解像化ネットワークモデルにより前記t番目の画像フレームの画像ブロックを超解像化することは、
PCD整列モジュールにより前記t-1番目の画像フレームの画像ブロック、前記t番目の画像フレームの画像ブロック及び前記t+1番目の画像フレームの画像ブロックを処理し、第三の特徴を取得することであって、前記第三の特徴は、チャンネル次元で第四の特徴、第五の特徴及び第六の特徴をスティッチングして得られる特徴であり、前記第四の特徴は、前記PCD整列モジュールにより前記t-1番目の画像フレームの画像ブロックと前記t番目の画像フレームの画像ブロックを処理して得られる特徴であり、前記第五の特徴は、前記PCD整列モジュールにより前記t番目の画像フレームの画像ブロックを処理して得られる特徴であり、前記第六の特徴は、前記PCD整列モジュールにより前記t番目の画像フレームの画像ブロックと前記t+1番目の画像フレームの画像ブロックを処理して得られる特徴であることと、
特徴融合モジュールにより前記第三の特徴を処理し、第七の特徴を取得することであって、前記第七の特徴は、チャンネル次元で前記第四の特徴、前記第三の特徴及び前記第五の特徴をスティッチングして得られる特徴であることと、
再構築モジュールにより前記第七の特徴を再構築し、第二の画像ブロックを取得することと、
アップサンプリングモジュールにより前記第二の画像ブロックに対してアップサンプリングを行い、前記t番目の画像フレームの画像ブロックに対応する超解像化画像ブロックを取得することとを含む、請求項5に記載のビデオの超解像化方法。
【請求項9】
前記第三の超解像化ネットワークモデルにより画像ブロックシーケンスにおける前記t番目の画像フレームの画像ブロックを超解像化することは、
PCD整列モジュールにより画像ブロックシーケンスにおけるすべての画像ブロックを処理し、第八の特徴を取得することであって、前記第八の特徴は、チャンネル次元で第九の特徴、第十の特徴、第十一の特徴、第十二の特徴及び第十三の特徴をスティッチングして得られる特徴であり、前記第九の特徴は、前記PCD整列モジュールにより前記t-2番目の画像フレームの画像ブロックと前記t-1番目の画像フレームの画像ブロックを処理して得られる特徴であり、前記第十の特徴は、前記PCD整列モジュールにより前記t-1番目の画像フレームの画像ブロックと前記t番目の画像フレームの画像ブロックを処理して得られる特徴であり、前記第十一の特徴は、前記PCD整列モジュールにより前記t番目の画像フレームの画像ブロックを処理して得られる特徴であり、前記第十二の特徴は、前記PCD整列モジュールにより前記t番目の画像フレームの画像ブロックと前記t+1番目の画像フレームの画像ブロックを処理して得られる特徴であり、前記第十三の特徴は、前記PCD整列モジュールにより前記t+1番目の画像フレームの画像ブロックと前記t+2番目の画像フレームの画像ブロックを処理して得られる特徴であることと、
特徴融合モジュールにより前記第八の特徴を処理し、第十四の特徴を取得することと、
再構築モジュールにより前記第十四の特徴を再構築し、第三の画像ブロックを取得することと、
アップサンプリングモジュールにより前記第三の画像ブロックに対してアップサンプリングを行い、画像ブロックシーケンスにおける前記t番目の画像フレームの画像ブロックに対応する超解像化画像ブロックを取得することとを含む、請求項5に記載のビデオの超解像化方法。
【請求項10】
前記t番目の画像フレームと前記近傍画像フレームを分解して得られた画像ブロックのうちの隣接する画像ブロックは、重なり領域を有し、前記t番目の画像フレームの各超解像化画像ブロックに基づいて前記t番目の画像フレームの超解像化画像フレームを生成することは、
前記t番目の画像フレームの各超解像化画像ブロックをスティッチングし、スティッチング画像を生成することと、
前記スティッチング画像における各超解像化画像ブロックの重なり領域の各画素の画素値を、各超解像化画像ブロックにおける対応する画素の画素値の平均値として設定し、前記t番目の画像フレームの超解像化画像フレームを生成することとを含む、請求項1に記載のビデオの超解像化方法。
【請求項11】
超解像化すべきビデオのt番目の画像フレームをN個の画像ブロックに分解することは、
一つの画像ブロックのサイズであるサンプリングウィンドウにより、前記t番目の画像フレームの一番目の画素から始まり、予め設定されるステップサイズでスライドして前記t番目の画像フレームの各位置をサンプリングし、サンプリングウィンドウの各サンプリング領域を一つの画像ブロックとし、N個の画像ブロックを得ることを含む、請求項1に記載のビデオの超解像化方法。
【請求項12】
ビデオの超解像化装置であって、
超解像化すべきビデオのt番目の画像フレームと前記t番目の画像フレームの近傍画像フレームをN個の画像ブロックにそれぞれ分解するための画像分解モジュールであって、t、Nがいずれも正整数である画像分解モジュールと、
前記t番目の画像フレームと前記近傍画像フレームを分解して得られた画像ブロックに基づいて、N個の画像ブロックシーケンスを生成するためのシーケンス生成モジュールであって、前記画像ブロックシーケンスにおける各画像ブロックがそれぞれ異なる画像フレームの同じ位置に位置するシーケンス生成モジュールと、
各画像ブロックシーケンスの運動パラメータを計算するためのパラメータ計算モジュールであって、いずれか一つの画像ブロックシーケンスの運動パラメータは、この画像ブロックシーケンスにおける各隣接する画像フレームの画像ブロックの間のオプティカルフローを表すために用いられるパラメータ計算モジュールと、
各画像ブロックシーケンスの運動パラメータに基づいて各画像ブロックシーケンスに対応する超解像化ネットワークモデルを決定するためのモデル決定モジュールと、
各画像ブロックシーケンスに対応する超解像化ネットワークモデルを採用して各画像ブロックシーケンスにおける前記t番目の画像フレームの画像ブロックを超解像化し、前記t番目の画像フレームの各超解像化画像ブロックを取得するための画像超解像化モジュールと、
前記t番目の画像フレームの各超解像化画像ブロックに基づいて前記t番目の画像フレームの超解像化画像フレームを生成する画像生成モジュールとを含む、ビデオの超解像化装置。
【請求項13】
電子機器であって、
メモリとプロセッサとを含み、
前記メモリは、命令を記憶するために用いられ、
前記プロセッサは、前記命令を実行する時、請求項1から11のいずれか1項に記載のビデオの超解像化方法を前記電子機器に実現させるために用いられる、電子機器。
【請求項14】
コンピュータ可読記憶媒体であって、前記コンピュータ可読記憶媒体には命令が記憶されており、前記命令がプロセッサにより実行される時、請求項1から11のいずれか1項に記載のビデオの超解像化方法を実現する、コンピュータ可読記憶媒体。
【請求項15】
コンピュータプログラム製品であって、前記コンピュータプログラム製品がコンピュータ上で運行される時、請求項1から11のいずれか1項に記載のビデオの超解像化方法を前記コンピュータに実現させる、コンピュータプログラム製品。
【請求項16】
コンピュータプログラムであって、
命令を含み、前記命令がプロセッサにより実行される時、請求項1から11のいずれか1項に記載のビデオの超解像化方法を前記プロセッサに実行させる、コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
[関連出願の相互参照]
本開示は、中国出願番号が202210265124.7であり、出願日が2022年03月17日の出願をベースとし、その優先権を主張し、この中国出願の開示内容は、ここでは全体として本開示に組み込まれる。
【0002】
[技術分野]
本開示は、画像処理の技術分野に関し、特に、ビデオの超解像化方法及び装置に関する。
【背景技術】
【0003】
ビデオの超解像技術は、ビデオ超解像化(超解像度)技術とも呼ばれ、低解像度のビデオから高解像度のビデオを復元する技術である。ビデオ超解像化業務は、現在、すでにビデオ画質の強化における重要な業務となっているため、ビデオ超解像化技術は、現在画像処理という分野の研究ホットスポットのうちの一つである。
【0004】
近年、深層学習技術の発展に伴い、深層学習ニューラルネットワークに基づくビデオ超解像化ネットワークモデルは、より良い超解像化効果及びより良いリアルタイム性を含む多くの突破を実現する。現在、主流のスライドウィンドウ型ビデオ超解像化ネットワークモデルは、いずれも、ビデオのほとんどの画像フレームがいずれも運動中にあり、ビデオにおける各画像フレームを超解像化する時、ビデオ超解像化ネットワークモデルが現在画像フレームを超解像化するために、その近傍画像フレームがいずれも大量の時間領域情報を提供できることを利用する。
【発明の概要】
【課題を解決するための手段】
【0005】
第一の態様によれば、本開示の実施例は、ビデオの超解像化方法を提供し、このビデオの超解像化方法は、
それぞれ超解像化すべきビデオのt番目の画像フレームと前記t番目の画像フレームの近傍画像フレームをN個の画像ブロックに分解することであって、t、Nがいずれも正整数であることと、
前記t番目の画像フレームと前記近傍画像フレームを分解して得られた画像ブロックに基づいて、N個の画像ブロックシーケンスを生成することであって、前記画像ブロックシーケンスにおける各画像ブロックがそれぞれ異なる画像フレームの同じ位置に位置することと、
各画像ブロックシーケンスの運動パラメータを計算することであって、いずれか一つの画像ブロックシーケンスの運動パラメータは、この画像ブロックシーケンスにおける各隣接する画像フレームの画像ブロックの間のオプティカルフローを表すために用いられることと、
各画像ブロックシーケンスの運動パラメータに基づいて各画像ブロックシーケンスに対応する超解像化ネットワークモデルを決定することと、
各画像ブロックシーケンスに対応する超解像化ネットワークモデルを採用して各画像ブロックシーケンスにおける前記t番目の画像フレームの画像ブロックを超解像化し、前記t番目の画像フレームの各超解像化画像ブロックを取得することと、
前記t番目の画像フレームの各超解像化画像ブロックに基づいて前記t番目の画像フレームの超解像化画像フレームを生成することとを含む。
【0006】
第二の態様によれば、本開示の実施例は、ビデオの超解像化装置を提供し、このビデオの超解像化装置は、
超解像化すべきビデオのt番目の画像フレームと前記t番目の画像フレームの近傍画像フレームをN個の画像ブロックにそれぞれ分解するための画像分解モジュールであって、t、Nがいずれも正整数である画像分解モジュールと、
前記t番目の画像フレームと前記近傍画像フレームを分解して得られた画像ブロックに基づいて、N個の画像ブロックシーケンスを生成するためのシーケンス生成モジュールであって、前記画像ブロックシーケンスにおける各画像ブロックがそれぞれ異なる画像フレームの同じ位置に位置するシーケンス生成モジュールと、
各画像ブロックシーケンスの運動パラメータを計算するためのパラメータ計算モジュールであって、いずれか一つの画像ブロックシーケンスの運動パラメータは、この画像ブロックシーケンスにおける各隣接する画像フレームの画像ブロックの間のオプティカルフローを表すために用いられるパラメータ計算モジュールと、
各画像ブロックシーケンスの運動パラメータに基づいて各画像ブロックシーケンスに対応する超解像化ネットワークモデルを決定するためのモデル決定モジュールと、
各画像ブロックシーケンスに対応する超解像化ネットワークモデルを採用して各画像ブロックシーケンスにおける前記t番目の画像フレームの画像ブロックを超解像化し、前記t番目の画像フレームの各超解像化画像ブロックを取得するための画像超解像化モジュールと、
前記t番目の画像フレームの各超解像化画像ブロックに基づいて前記t番目の画像フレームの超解像化画像フレームを生成するための画像生成モジュールとを含む。
【0007】
第三の態様によれば、本開示の実施例は、電子機器を提供し、この電子機器は、メモリとプロセッサとを含み、前記メモリは、コンピュータプログラムを記憶するために用いられ、前記プロセッサは、コンピュータプログラムを呼び出す時、第一の態様又は第一の態様のいずれか一つの選択的な実施形態に記載のビデオの超解像化方法を前記電子機器に実現させるために用いられる。
【0008】
第四の態様によれば、本開示の実施例は、コンピュータプログラムが保存されているコンピュータ可読記憶媒体を提供し、前記コンピュータプログラムがコンピューティング機器により実行される時、第一の態様又は第一の態様のいずれか一つの選択的な実施形態に記載のビデオの超解像化方法を前記コンピューティング機器に実現させる。
【0009】
第五の態様によれば、本開示の実施例は、コンピュータプログラム製品を提供し、前記コンピュータプログラム製品がコンピュータ上で運行される時、第一の態様又は第一の態様のいずれか一つの選択的な実施形態に記載のビデオの超解像化方法を前記コンピュータに実現させる。
【図面の簡単な説明】
【0010】
ここで、図面は、明細書に組み込まれ且つ本明細書の一部を構成し、本開示に適合する実施例を示し、明細書とともに本開示の原理を解釈するために使用される。
【0011】
本開示の実施例又は関連技術における技術案をより明確に説明するために、以下は、実施例又は関連技術記述において使用される必要のある図面を簡単に紹介し、明らかに、当業者にとって、創造的な労力を払わない前提で、これらの図面に基づいて他の図面を得ることもできる。
図1】本開示の実施例によるビデオの超解像化方法のステップフローチャートである。
図2】本開示の実施例による画像フレームを分解して得られる画像ブロックの概略図である。
図3】本開示の実施例による画像ブロックシーケンスの概略図である。
図4】本開示の実施例による画像ブロック方式の概略図である。
図5】本開示の実施例による超解像化方法を実現するモデルの概略図である。
図6】本開示の実施例による適応型超解像化モジュールの概略図である。
図7】本開示の実施例による第一の超解像化ネットワークモデルの概略図である。
図8】本開示の実施例による第二の超解像化ネットワークモデルの概略図である。
図9】本開示の実施例による第三の超解像化ネットワークモデルの概略図である。
図10】本開示の実施例によるビデオの超解像化装置の概略図である。
図11】本開示の実施例による電子機器のハードウェア構造概略図である。
【発明を実施するための形態】
【0012】
本開示の上記目的、特徴及び利点をより明瞭に理解することができるように、以下に本開示の方案をさらに記述する。説明すべきこととして、矛盾しない限り、本開示の実施例及び実施例における特徴は、互いに組み合わせられる可能である。
【0013】
以下の記述において本開示を十分に理解するために多くの具体的な詳細を説明するが、本開示は、ここで記述されていない他の方式で実施することもでき、明らかに、明細書における実施例は、本開示の一部の実施例にすぎず、すべての実施例ではない。
【0014】
説明すべきこととして、本開示の実施例の技術案を容易で明瞭に記述するために、本開示の実施例では、「第一」、「第二」などの文字を採用して、機能や作用が基本的に同じである同一項又は類似項を区別し、当業者であれば理解できるように、「第一」、「第二」などの文字は、数及び実行手順を限定するものではない。例えば、第一の特徴画像セットと第二の特徴画像セットは、ただ異なる特徴画像セットを区別するためのものにすぎず、特徴画像セットの順序などを限定するものではない。
【0015】
本開示の実施例では、「例示的」又は「例えば」などの用語は、例、例証又は説明として表すために用いられる。本開示の実施例では「例示的」又は「例えば」と記述される任意の実施例又は設計案は、他の実施例又は設計案に比べてより好ましいか、又はより優位性があると解釈されるべきではない。正確に言えば、「例示的」又は「例えば」などの用語を使用することは、関連概念を具体的な方式で示すことを意図する。なお、本開示の実施例の記述において、特に断りのない限り、「複数の」の意味は、二つ以上である。
【0016】
関連技術において、スライドウィンドウ型ビデオ超解像化ネットワークモデルは、いずれも、ビデオのほとんどの画像フレームがいずれも運動中にあり、ビデオにおける各画像フレームを超解像化する時、ビデオ超解像化ネットワークモデルが現在画像フレームを超解像化するために、その近傍画像フレームがいずれも大量の時間領域情報を提供できることを利用する。しかしながら、いくつかのビデオにおける一部の領域は、常に静止した物体又は背景であり、このようなビデオを超解像化する時、静止した物体又は背景による時間領域冗長情報により、近傍画像フレームを入力として採用すると、理想的なビデオ超解像化効果を取得できず、ひいては超解像化効果が単一の画像フレームに基づいて超解像化する超解像化効果に及ばないことが多い。以上をまとめると、ビデオに時間領域冗長情報が存在する時、どのようにビデオの超解像化効果を高めるかは、一つの早急に解決すべき課題である。
【0017】
そこで、本開示は、ビデオの超解像化効果を高めるためのビデオの超解像化方法及び装置を提供する。
【0018】
本開示の実施例は、ビデオの超解像化方法を提供し、図1に示すステップフローチャートを参照すると、本開示の実施例によるビデオの超解像化方法は、以下のようなステップS11~S16を含む。
【0019】
S11:超解像化すべきビデオのt番目の画像フレームと前記t番目の画像フレームの近傍画像フレームをN個の画像ブロックにそれぞれ分解する。
【0020】
ここで、t、Nがいずれも正整数である。
【0021】
いくつかの実施例では、いずれか一つの画像フレームをN個の画像ブロックに分解する実現方式は、一つの画像ブロックのサイズであるサンプリングウィンドウにより、この画像フレームの一番目の画素から始まり、予め設定されるステップサイズでスライドしてこの画像フレームの各位置をサンプリングし、サンプリングウィンドウの各サンプリング領域を一つの画像ブロックとし、それによってこの画像フレームをN個の画像ブロックに分解することを含む。
【0022】
例示的には、図2に示すように、超解像化すべきビデオのt番目の画像フレームは、1024*512個の画素を含み、サンプリングウィンドウのサイズが72*72、ステップサイズが64である時、超解像化すべきビデオのt番目の画像フレームを16*8個の画像ブロックに分解することができ、各画像ブロックは、72*72個の画素を含み、且つ隣接する画像ブロックの間は重なり領域を有し、重なり領域の幅は、8つの画素である。
【0023】
S12:前記t番目の画像フレームと前記近傍画像フレームを分解して得られた画像ブロックに基づいて、N個の画像ブロックシーケンスを生成する。
【0024】
ここで、前記画像ブロックシーケンスにおける各画像ブロックがそれぞれ異なる画像フレームの同じ位置に位置する。
【0025】
例示的には、図3に示すように、前記t番目の画像フレーム33の近傍画像フレームがt-2番目の画像フレーム31、t-1番目の画像フレーム32、t+1番目の画像フレーム34及びt+2番目の画像フレーム35を含むことを例とする。各画像ライブラリシーケンスには5つの画像ブロックが含まれ、この5つの画像ブロックは、それぞれt-2番目の画像フレーム31、t-1番目の画像フレーム32、t番目の画像フレーム33、t+1番目の画像フレーム34及びt+2番目の画像フレーム35の画像ブロックであり、且つ同一画像ブロックシーケンスに位置する各画像ブロックの、それぞれの属する画像フレームにおける位置が同じである。
【0026】
S13:各画像ブロックシーケンスの運動パラメータを計算する。
【0027】
ここで、いずれか一つの画像ブロックシーケンスの運動パラメータは、この画像ブロックシーケンスにおける各隣接する画像フレームの画像ブロックの間のオプティカルフローを表すために用いられる。
【0028】
例示的には、画像ブロックシーケンス
【数1】
は、t-2番目の画像フレームの画像ブロック
【数2】
、t-1番目の画像フレームの画像ブロック
【数3】
、t番目の画像フレームの画像ブロック
【数4】
、t+1番目の画像フレームの画像ブロック
【数5】
及びt+2番目の画像フレームの画像ブロック
【数6】
を含み、画像ブロックシーケンス
【数7】
の運動パラメータは、画像ブロック
【数8】
と画像ブロック
【数9】
との間のオプティカルフロー、画像ブロック
【数10】
と画像ブロック
【数11】
との間のオプティカルフロー、画像ブロック
【数12】
と画像ブロック
【数13】
との間のオプティカルフロー及び画像ブロック
【数14】
と画像ブロック
【数15】
との間のオプティカルフローを表すために用いられる。
【0029】
本開示の実施例の一つの選択的な実施形態としては、前記した、各画像ブロックシーケンスの運動パラメータを計算することは、各画像ブロックシーケンスに対して以下のようなステップa~ステップcを実行することを含む。
【0030】
ステップa:前記画像ブロックシーケンスにおける各隣接する画像フレームの画像ブロックの間のオプティカルフローを計算する。
【0031】
以上のように、画像ブロックシーケンス
【数16】
は、t-2番目の画像フレームの画像ブロック
【数17】
、t-1番目の画像フレームの画像ブロック
【数18】
、t番目の画像フレームの画像ブロック
【数19】
、t+1番目の画像フレームの画像ブロック
【数20】
及びt+2番目の画像フレームの画像ブロック
【数21】
を含み、画像ブロック
【数22】
と画像ブロック
【数23】
との間のオプティカルフロー、画像ブロック
【数24】
と画像ブロック
【数25】
との間のオプティカルフロー、画像ブロック
【数26】
と画像ブロック
【数27】
との間のオプティカルフロー及び画像ブロック
【数28】
と画像ブロック
【数29】
との間のオプティカルフローを計算する。
【0032】
例示的には、密集逆探索(Dense Inverse Search、DIS)というオプティカルフローアルゴリズムに基づいて、前記画像ブロックシーケンスにおける各隣接する画像フレームの画像ブロックの間のオプティカルフローを計算することができる。
【0033】
ステップb:各対の隣接する画像フレームの画像ブロックの間のオプティカルフローに対して、各画素に対応するオプティカルフローの絶対値の平均値を計算し、前記隣接する画像フレームの画像ブロックの間の運動パラメータを取得する。
【0034】
画像ブロックシーケンス
【数30】
における隣接する画像フレームの画像ブロックの間の運動パラメータを、
【数31】
と表し、オプティカルフローアルゴリズムを
【数32】
と表し、各画素に対応するオプティカルフローの平均値を
【数33】
と表し、絶対値を|...|と表すと、
【数34】
例えば、画像ブロック
【数35】
と画像ブロック
【数36】
との間の運動パラメータは、以下のとおりであり、
【数37】
また例えば、画像ブロック
【数38】
と画像ブロック
【数39】
との間の運動パラメータは、以下のとおりであり、
【数40】
S14:各画像ブロックシーケンスの運動パラメータに基づいて各画像ブロックシーケンスに対応する超解像化ネットワークモデルを決定する。
【0035】
本開示の実施例の一つの選択的な実施形態としては、前記t番目の画像フレームの近傍画像フレームは、t-2番目の画像フレーム、t-1番目の画像フレーム、t+1番目の画像フレーム及びt+2番目の画像フレームを含み、上記ステップS14(各画像ブロックシーケンスの運動パラメータに基づいて各画像ブロックシーケンスに対応する超解像化ネットワークモデルを決定する)は、各画像ブロックシーケンスに対して以下のようなステップ1~ステップ5を実行することを含む。
【0036】
ステップ1:前記画像ブロックシーケンスの第一の運動パラメータと第二の運動パラメータがいずれも予め設定された閾値よりも小さいかどうかを決定する。
【0037】
ここで、前記第一の運動パラメータは、前記t番目の画像フレームの画像ブロックと前記t-1番目の画像フレームの画像ブロックとの間の運動パラメータであり、前記第二の運動パラメータは、前記t番目の画像フレームの画像ブロックと前記t+1番目の画像フレームの画像ブロックとの間の運動パラメータである。
【0038】
t番目の画像フレームの画像ブロック
【数41】
と前記t-1番目の画像フレームの画像ブロック
【数42】
との間の運動パラメータを
【数43】
、t+1番目の画像フレームの画像ブロック
【数44】
と前記t番目の画像フレームの画像ブロック
【数45】
との間の運動パラメータを
【数46】
、予め設定された閾値をγとすると、上記ステップ1において、
【数47】
がγよりも小さいかどうかをそれぞれ判断する。
【0039】
上記ステップ1において、前記第一の運動パラメータと前記第二の運動パラメータがいずれも前記予め設定された閾値よりも小さい場合に、以下のようなステップ2を実行する。
【0040】
ステップ2:前記画像ブロックシーケンスに対応する超解像化ネットワークモデルを第一の超解像化ネットワークモデルとして決定する。
【0041】
本開示の実施例の一つの選択的な実施形態としては、前記第一の超解像化ネットワークモデルは、単一フレームの超解像化ネットワークモデルである。
【0042】
上記ステップ1において、前記第一の運動パラメータ及び/又は前記第二の運動パラメータが前記予め設定された閾値以上である場合に、以下のようなステップ3を実行する。
【0043】
ステップ3:前記画像ブロックシーケンスの第三の運動パラメータと第四の運動パラメータがいずれも予め設定された閾値よりも小さいかどうかを決定する。
【0044】
ここで、前記第三の運動パラメータは、前記t-2番目の画像フレームの画像ブロックと前記t-1番目の画像フレームの画像ブロックとの間の運動パラメータであり、前記第四の運動パラメータは、前記t+1番目の画像フレームの画像ブロックと前記t+2番目の画像フレームの画像ブロックとの間の運動パラメータである。
【0045】
t-2番目の画像フレームの画像ブロック
【数48】
と前記t-1番目の画像フレームの画像ブロック
【数49】
との間の運動パラメータを
【数50】
とし、t+1番目の画像フレームの画像ブロック
【数51】
と前記t+2番目の画像フレームの画像ブロック
【数52】
との間の運動パラメータを
【数53】
とし、予め設定された閾値をγとすると、上記ステップ3において、
【数54】
がγよりも小さいかどうかをそれぞれ判断する。
【0046】
上記ステップ3において、前記第三の運動パラメータと前記第四の運動パラメータがいずれも前記予め設定された閾値よりも小さい場合に、以下のようなステップ4を実行する。
【0047】
ステップ4:前記画像ブロックシーケンスに対応する超解像化ネットワークモデルを第二の超解像化ネットワークモデルとして決定する。
【0048】
本開示の実施例の一つの選択的な実施形態としては、前記第二の超解像化ネットワークモデルは、前記t-1番目の画像フレームの画像ブロック、前記t番目の画像フレームの画像ブロック及び前記t+1番目の画像フレームの画像ブロックに基づいて、前記t番目の画像フレームの画像ブロックを超解像化するために用いられる。
【0049】
上記ステップ3において、前記第三の運動パラメータ及び/又は前記第四の運動パラメータが前記予め設定された閾値以上である場合に、以下のようなステップ5を実行する。
【0050】
ステップ5:前記画像ブロックシーケンスに対応する超解像化ネットワークモデルを第三の超解像化ネットワークモデルとして決定する。
【0051】
本開示の実施例の一つの選択的な実施形態としては、前記第三の超解像化ネットワークモデルは、画像ブロックシーケンスにおけるすべての画像ブロックに基づいて前記t番目の画像フレームの画像ブロックを超解像化するために用いられる。
【0052】
t番目の画像フレームの画像ブロック
【数55】
と前記t-1番目の画像フレームの画像ブロック
【数56】
との間の運動パラメータを
【数57】
とし、t+1番目の画像フレームの画像ブロック
【数58】
と前記t番目の画像フレームの画像ブロック
【数59】
との間の運動パラメータを
【数60】
とし、t-2番目の画像フレームの画像ブロック
【数61】
と前記t-1番目の画像フレームの画像ブロック
【数62】
との間の運動パラメータを
【数63】
とし、t+1番目の画像フレームの画像ブロック
【数64】
と前記t+2番目の画像フレームの画像ブロック
【数65】
との間の運動パラメータを
【数66】
とし、予め設定された閾値をγとする。第一の超解像化ネットワークモデルが
【数67】
であり、第二の超解像化ネットワークモデルが
【数68】
であり、第三の超解像化ネットワークモデルが、
【数69】
であり、上記ステップ1~5を以下のように表すことができる。
【0053】
【数70】
S15:各画像ブロックシーケンスに対応する超解像化ネットワークモデルを採用して各画像ブロックシーケンスにおける前記t番目の画像フレームの画像ブロックを超解像化し、前記t番目の画像フレームの各超解像化画像ブロックを取得する。
【0054】
具体的には、各画像ブロックシーケンスに基づいて前記t番目の画像フレームの一つの超解像化画像ブロックを取得することができ、且つ合計N個の画像ブロックシーケンスを含むため、前記t番目の画像フレームのN個の超解像化画像ブロックを取得することができる。
【0055】
S16:前記t番目の画像フレームの各超解像化画像ブロックに基づいて前記t番目の画像フレームの超解像化画像フレームを生成する。
【0056】
本開示の実施例の一つの選択的な実施形態としては、前記t番目の画像フレームと前記近傍画像フレームを分解して得られた画像ブロックにおける隣接する画像ブロックが重なり領域を有さない場合に、上記ステップS16(前記t番目の画像フレームの各超解像化画像ブロックに基づいて前記t番目の画像フレームの超解像化画像フレームを生成する)は、
前記t番目の画像フレームの各超解像化画像ブロックを前記t番目の画像フレームの超解像化画像フレームとしてスティッチングすることを含む。
【0057】
本開示の実施例の一つの選択的な実施形態としては、前記t番目の画像フレームと前記近傍画像フレームを分解して得られた画像ブロックのうちの隣接する画像ブロックが重なり領域を有する場合に、上記ステップS16(前記t番目の画像フレームの各超解像化画像ブロックに基づいて前記t番目の画像フレームの超解像化画像フレームを生成する)は、
前記t番目の画像フレームの各超解像化画像ブロックをスティッチングし、スティッチング画像を生成することと、
前記スティッチング画像における各超解像化画像ブロックの重なり領域の各画素の画素値を、各超解像化画像ブロックにおける対応する画素の画素値の平均値として設定し、前記t番目の画像フレームの超解像化画像フレームを生成することと、を含む。
【0058】
例示的には、図4に示すように、図4における超解像化画像ブロック41の開始画素列が第P列、超解像化画像ブロック41の終止画素列が第P+m列、超解像化画像ブロック42の開始画素列が第P+n列、超解像化画像ブロック42の終止画素列が第P+m+n列であり、超解像化画像ブロック41と超解像化画像ブロック42をスティッチングする時、超解像化画像ブロック41の領域411と超解像化画像ブロック42の領域421と重なるため、重なり領域400のいずれか一つの画素の画素値は、領域411と領域421におけるこの画素に対応する画素値の平均値である。例えば、重なり領域400における画素(x1,y1)の画素値に対して、領域411における画素(x1,y1)の画素値と領域412における画素(x1,y1)の画素値の平均値である。
【0059】
図5に示すように、図5は、上記ビデオ超解像化方法を実現するためのビデオ超解像化ネットワークの構造概略図である。上記ビデオ超解像化方法を実現するためのビデオ超解像化ネットワークは、画像分解モジュール51、シーケンス生成モジュール52、冗長情報検出モジュール53、適応型超解像化モジュール54及び画像スティッチングモジュール55を含む。
【0060】
ここで、画像分解モジュール51は、t-2番目の画像フレーム
【数71】
をN個の画像ブロック
【数72】
に分解し、t-1番目の画像フレーム
【数73】
をN個の画像ブロック
【数74】
に分解し、t番目の画像フレーム
【数75】
をN個の画像ブロック
【数76】
に分解し、t+1番目の画像フレーム
【数77】
をN個の画像ブロック
【数78】
に分解し、t番目の画像フレーム
【数79】
をN個の画像ブロック
【数80】
に分解するために用いられる。
【0061】
シーケンス生成モジュール52は、
【数81】
に基づいて、N個の画像ブロックシーケンス
【数82】
を生成するために用いられる。
【0062】
冗長情報監視モジュール53は、各画像ブロックシーケンス
【数83】
の運動パラメータを計算し、各画像ブロックシーケンス
【数84】
の運動パラメータに基づいて、各画像ブロックシーケンスの超解像化ネットワークモデル
【数85】
を決定するために用いられる。
【0063】
適応型超解像化モジュール54は、各画像ブロックシーケンスに対応する超解像化ネットワークモデルを含み、各画像ブロックシーケンスに対応する超解像化ネットワークモデルを採用して、各画像ブロックシーケンスにおける前記t番目の画像フレームの画像ブロックを超解像化し、前記t番目の画像フレームの各超解像化画像ブロック
【数86】
を取得するために用いられる。
【0064】
画像スティッチングモジュール55は、前記t番目の画像フレームの各超解像化画像ブロック
【数87】
に基づいて前記t番目の画像フレームの超解像化画像フレーム
【数88】
を生成するために用いられる。
【0065】
本開示の実施例によるビデオの超解像化方法では、t番目の画像フレーム画像を超解像化する時、まず超解像化すべきビデオのt番目の画像フレームと前記t番目の画像フレームの近傍画像フレームをN個の画像ブロックにそれぞれ分解し、前記t番目の画像フレームと前記近傍画像フレームを分解して得られた画像ブロックに基づいて、N個の画像ブロックシーケンスを生成し、そして各画像ブロックシーケンスの運動パラメータを計算し、各画像ブロックシーケンスの運動パラメータに基づいて各画像ブロックシーケンスに対応する超解像化ネットワークモデルを決定し、各画像ブロックシーケンスの運動パラメータに基づいて各画像ブロックシーケンスに対応する超解像化ネットワークモデルを決定し、各画像ブロックシーケンスに対応する超解像化ネットワークモデルを採用して各画像ブロックシーケンスにおける前記t番目の画像フレームの画像ブロックを超解像化し、前記t番目の画像フレームの各超解像化画像ブロックを取得し、及び前記t番目の画像フレームの各超解像化画像ブロックに基づいて前記t番目の画像フレームの超解像化画像フレームを生成する。本開示の実施例によるビデオの超解像化方法では、t番目の画像フレーム画像を超解像化する時、各画像ブロックシーケンスの運動パラメータに基づいて各画像ブロックシーケンスに対応する超解像化ネットワークモデルを決定し、異なる場合に対して異なる超解像化ネットワークモデルを適応して採用して超解像化するため、本開示の実施例によるビデオの超解像化方法は、ビデオの超解像化効果を高めることができる。
【0066】
例示的には、図6に示すように、図5に示す適応型超解像化モジュール54には第一の超解像化ネットワークモデル541、第二の超解像化ネットワークモデル542及び第三の超解像化ネットワークモデル543が含まれる。ここで、第一の超解像化ネットワークモデル541は、前記t番目の画像フレームの画像ブロックを超解像化する時にt番目の画像フレームの画像ブロック
【数89】
を使用し、第二の超解像化ネットワークモデル542は、前記t番目の画像フレームの画像ブロックを超解像化する時にt-1番目の画像フレームの画像ブロック、前記t番目の画像フレームの画像ブロック及び前記t+1番目の画像フレームの画像ブロック
【数90】
を使用し、第三の超解像化ネットワークモデル543は、前記t番目の画像フレームの画像ブロックを超解像化する時に、画像ブロックシーケンスにおけるすべての画像ブロック
【数91】
を使用する。
【0067】
本開示の実施例の一つの選択的な実施形態としては、図7に示す第一の超解像化ネットワークモデルのモデル構造概略図に示すように、第一の超解像化ネットワークモデルにより前記t番目の画像フレームの画像ブロックを超解像化する実現方式は、以下のようなステップI~ステップIVを含む。
【0068】
ステップI:カスケード変形可能な畳み込み(Pyramid Cascading and Deformable Convolutions)PCD整列モジュール71により前記t番目の画像フレームの画像ブロック
【数92】
を処理して第一の特徴T1を取得する。
【0069】
図7に示すように、PCD整列モジュール71の入力は、二つの画像ブロックであるが、上記ステップIにおいて、PCD整列モジュールの入力は、一つの画像ブロック(t番目の画像フレームの画像ブロック)のみを含むため、t番目の画像フレームの画像ブロックを1回コピーし、元の画像ブロックとともに、PCD整列モジュールの入力とすることができる。
【0070】
ステップII:特徴融合モジュール72により前記第一の特徴を処理し、第二の特徴T2を取得する。
【0071】
ここで、前記第二の特徴は、チャンネルの次元で五つの前記第一の特徴をスティッチングして得られる特徴である。当業者であればわかるように、第二の特徴は、チャンネル次元で複数の前記第一の特徴をスティッチングして得られる特徴であってもよく、ここでスティッチングするための第一の特徴の数を制限しない。
【0072】
即ち、第一の特徴の張量をC*H*Wすると、第二の特徴の張量は、5*C*H*Wである。ここで、Cが第一の特徴のチャンネル数、Hが第一の特徴の長さ、Wが第一の特徴の幅である。
【0073】
例示的には、図7に示すように、特徴融合モジュール72は、時間注意力ユニット721、特徴コピーユニット722、特徴融合ユニット723及び空間注意力ユニット724を含んでもよい。ここで、特徴コピーユニット722は、第一の特徴を4回コピーし、元の第一の特徴をスティッチングするために用いられる。
【0074】
ステップIII:再構築モジュール73により前記第二の特徴T2を再構築し、第一の画像ブロックB1を取得する。
【0075】
ステップIV:アップサンプリングモジュール74により前記第一の画像ブロックB1に対してアップサンプリングを行い、前記t番目の画像フレームの画像ブロックに対応する超解像化画像ブロック
【数93】
を取得する。
【0076】
本開示の実施例の一つの選択的な実施形態としては、図8に示す第二の超解像化ネットワークモデルのモデル構造概略図に示すように、第二の超解像化ネットワークモデルにより前記t番目の画像フレームの画像ブロックを超解像化する実現方式は、以下のようなステップi~ステップivを含む。
【0077】
ステップi:PCD整列モジュール81により前記t-1番目の画像フレームの画像ブロック
【数94】
、前記t番目の画像フレームの画像ブロック
【数95】
及び前記t+1番目の画像フレームの画像ブロック
【数96】
を処理し、第三の特徴T3を取得する。
【0078】
ここで、前記第三の特徴T3は、チャンネル次元で第四の特徴T4、第五の特徴T5及び第六の特徴T6をスティッチングして得られる特徴であり、前記第四の特徴T4は、前記PCD整列モジュールにより前記t-1番目の画像フレームの画像ブロック
【数97】
と前記t番目の画像フレームの画像ブロック
【数98】
を処理して得られる特徴であり、前記第五の特徴T5は、前記PCD整列モジュールにより前記t番目の画像フレームの画像ブロック
【数99】
を処理して得られる特徴であり、前記第六の特徴は、前記PCD整列モジュールにより前記t番目の画像フレームの画像ブロック
【数100】
と前記t+1番目の画像フレームの画像ブロック
【数101】
を処理して得られる特徴である。
【0079】
図8に示すように、PCD整列モジュール81は、第一のPCD整列ユニット811、第二のPCD整列ユニット812、第三のPCD整列ユニット813及びスティッチングユニット814を含む。ここで、第一のPCD整列ユニット811は、前記t-1番目の画像フレームの画像ブロック
【数102】
と前記t番目の画像フレームの画像ブロック
【数103】
を処理し、第四の特徴T4を取得するために用いられ、第二のPCD整列ユニット812は、t番目の画像フレームの画像ブロック
【数104】
を処理し、第五の特徴T5を取得するために用いられ、第三のPCD整列ユニット813は、前記t番目の画像フレームの画像ブロック
【数105】
と前記t+1番目の画像フレームの画像ブロック
【数106】
を処理し、第五の特徴T6を取得するために用いられ、スティッチングユニット814は、第四の特徴T4、第五の特徴T5及び第六の特徴T6をスティッチングし、第三の特徴T3を取得するために用いられる。
【0080】
ステップii:特徴融合モジュールにより82により前記第三の特徴T3を処理し、第七の特徴T7を取得する。
【0081】
ここで、前記第七の特徴T7は、前記第四の特徴T4、前記第三の特徴T3及び前記第五の特徴T5をチャンネル次元でスティッチングして得られる特徴である。
【0082】
例示的には、図8に示すように、特徴融合モジュール82は、時間注意力ユニット821、特徴コピーユニット822、特徴融合ユニット823及び空間注意力ユニット824を含んでもよい。ここで、特徴コピーユニット822は、前記第三の特徴T3における前記第四の特徴T4と第五の特徴T5を1回コピーし、第三の特徴T3をスティッチングするために用いられる。
【0083】
ステップiii:再構築モジュール83により前記第七の特徴T7を再構築し、第二の画像ブロックB2を取得する。
【0084】
ステップiv:アップサンプリングモジュール84により前記第二の画像ブロックB2に対してアップサンプリングを行い、前記t番目の画像フレームの画像ブロックに対応する超解像化画像ブロック
【数107】
を取得する。
【0085】
本開示の実施例の一つの選択的な実施形態としては、図9に示す第三の超解像化ネットワークモデルのモデル構造概略図に示すように、第三の超解像化ネットワークモデルにより画像ブロックシーケンスにおける前記t番目の画像フレームの画像ブロックを超解像化することは、以下のようなステップ1~ステップ4を含む。
【0086】
ステップ1:PCD整列モジュール91により画像ブロックシーケンス
【数108】
におけるすべての画像ブロックを処理し、第八の特徴T8を取得する。
【0087】
ここで、前記第八の特徴T8は、チャンネル次元で第九の特徴T9、第十の特徴T10、第十一の特徴T11、第十二の特徴T12及び第十三の特徴T13をスティッチングして得られる特徴であり、前記第九の特徴T9は、前記PCD整列モジュールにより前記t-2番目の画像フレームの画像ブロック
【数109】
と前記t-1番目の画像フレームの画像ブロック
【数110】
を処理して得られる特徴であり、前記第十の特徴は、前記PCD整列モジュールにより前記t-1番目の画像フレームの画像ブロック
【数111】
と前記t番目の画像フレームの画像ブロック
【数112】
を処理して得られる特徴であり、前記第十一の特徴は、前記PCD整列モジュールにより前記t番目の画像フレームの画像ブロック
【数113】
を処理して得られる特徴であり、前記第十二の特徴は、前記PCD整列モジュールにより前記t番目の画像フレームの画像ブロック
【数114】
と前記t+1番目の画像フレームの画像ブロック
【数115】
を処理して得られる特徴であり、前記第十三の特徴は、前記PCD整列モジュールにより前記t+1番目の画像フレームの画像ブロック
【数116】
と前記t+2番目の画像フレームの画像ブロック
【数117】
を処理して得られる特徴である。
【0088】
例示的には、図9に示すように、PCD整列モジュール91は、第一のPCD整列ユニット911、第二のPCD整列ユニット912、第三のPCD整列ユニット913、第四のPCD整列ユニット914、第五のPCD整列ユニット915及びスティッチングユニット916を含む。第一のPCD整列ユニット911は、前記t-2番目の画像フレームの画像ブロック
【数118】
と前記t-1番目の画像フレームの画像ブロック
【数119】
を処理し、第九の特徴T9を取得するために用いられ、第二のPCD整列ユニット912は、前記t-1番目の画像フレームの画像ブロック
【数120】
と前記t番目の画像フレームの画像ブロック
【数121】
処理し、第十の特徴T10を取得するために用いられ、第三のPCD整列ユニット913は、t番目の画像フレームの画像ブロック
【数122】
を処理し、第十一の特徴T11を取得するために用いられ、第四のPCD整列ユニット915は、前記t番目の画像フレームの画像ブロック
【数123】
と前記t+1番目の画像フレームの画像ブロック
【数124】
を処理し、第十二の特徴T12を取得するために用いられ、第五のPCD整列ユニット915は、前記t+1番目の画像フレームの画像ブロック
【数125】
と前記t+2番目の画像フレームの画像ブロック
【数126】
を処理し、第十三の特徴T13を取得するために用いられ、スティッチングユニット916は、第九の特徴T9、第十の特徴T10、第十一の特徴T11、第十二の特徴T12及び第十三の特徴T13をスティッチングし、第八の特徴T8を取得するために用いられる。
【0089】
ステップ2:特徴融合モジュールにより92は、前記第八の特徴T8を処理し、第十四の特徴T14を取得する。
【0090】
例示的には、図9に示すように、特徴融合モジュール92は、時間注意力ユニット921、特徴融合ユニット922及び空間注意力ユニット923を含んでもよい。
【0091】
ステップ3:再構築モジュール93により前記第十四の特徴T14を再構築し、第三の画像ブロックB3を取得する。
【0092】
ステップ4:アップサンプリングモジュール94により、前記第三の画像ブロックB3に対してアップサンプリングを行い、画像ブロックシーケンスにおける前記t番目の画像フレームの画像ブロックに対応する超解像化画像ブロック
【数127】
を取得する。
【0093】
同一の発明構思に基づいて、上記方法の実現として、本開示の実施例は、ビデオの超解像化装置をさらに提供し、この装置の実施例と前述方法の実施例とは対応し、容易に閲読するために、本装置の実施例では、前述方法の実施例における詳細内容を一々説明しないが、本実施例におけるビデオの超解像化装置が前述方法の実施例におけるすべての内容を対応して実現できることを明確にすべきである。
【0094】
本開示の実施例は、ビデオの超解像化装置を提供し、図10は、このビデオの超解像化装置の構造概略図であり、図10に示すように、このビデオの超解像化装置100は、
超解像化すべきビデオのt番目の画像フレームと前記t番目の画像フレームの近傍画像フレームをN個の画像ブロックにそれぞれ分解するための画像分解モジュール101であって、t、Nがいずれも正整数である画像分解モジュール101と、
前記t番目の画像フレームと前記近傍画像フレームを分解して得られた画像ブロックに基づいて、N個の画像ブロックシーケンスを生成するためのシーケンス生成モジュールであって、前記画像ブロックシーケンスにおける各画像ブロックがそれぞれ異なる画像フレームの同じ位置に位置するシーケンス生成モジュール102と、
各画像ブロックシーケンスの運動パラメータを計算するためのパラメータ計算モジュールであって、いずれか一つの画像ブロックシーケンスの運動パラメータは、この画像ブロックシーケンスにおける各隣接する画像フレームの画像ブロックの間のオプティカルフローを表すために用いられるパラメータ計算モジュール103と、
各画像ブロックシーケンスの運動パラメータに基づいて各画像ブロックシーケンスに対応する超解像化ネットワークモデルを決定するためのモデル決定モジュール104と、
各画像ブロックシーケンスに対応する超解像化ネットワークモデルを採用して各画像ブロックシーケンスにおける前記t番目の画像フレームの画像ブロックを超解像化し、前記t番目の画像フレームの各超解像化画像ブロックを取得するための画像超解像化モジュール105と、
前記t番目の画像フレームの各超解像化画像ブロックに基づいて前記t番目の画像フレームの超解像化画像フレームを生成するための画像生成モジュール106とを含む。
【0095】
本開示の実施例の一つの選択的な実施形態としては、前記パラメータ計算モジュール103は、具体的には、各画像ブロックシーケンスに対して、前記画像ブロックシーケンスにおける各隣接する画像フレームの画像ブロックの間のオプティカルフローを計算し、各対の隣接する画像フレームの画像ブロックの間のオプティカルフローに対して、各画素に対応するオプティカルフローの絶対値の平均値を計算し、前記隣接する画像フレームの画像ブロックの間の運動パラメータを取得し、前記画像ブロックシーケンスにおける各隣接する画像フレームの画像ブロックの間の運動パラメータに基づいて、前記画像ブロックシーケンスの運動パラメータを取得するために用いられる。
【0096】
本開示の実施例の一つの選択的な実施形態としては、前記t番目の画像フレームの近傍画像フレームは、
前記超解像化すべきビデオのt-2番目の画像フレーム、t-1番目の画像フレーム、t+1番目の画像フレーム及びt+2番目の画像フレームを含む。
【0097】
本開示の実施例の一つの選択的な実施形態としては、前記モデル決定モジュール104は、具体的には、各画像ブロックシーケンスに対して、前記画像ブロックシーケンスの第一の運動パラメータと第二の運動パラメータがいずれも予め設定された閾値よりも小さいかどうかを決定することであって、前記第一の運動パラメータは、前記t番目の画像フレームの画像ブロックと前記t-1番目の画像フレームの画像ブロックとの間の運動パラメータであり、前記第二の運動パラメータは、前記t番目の画像フレームの画像ブロックと前記t+1番目の画像フレームの画像ブロックとの間の運動パラメータであることと、前記第一の運動パラメータと前記第二の運動パラメータがいずれも前記予め設定された閾値よりも小さい場合に、前記画像ブロックシーケンスに対応する超解像化ネットワークモデルを第一の超解像化ネットワークモデルとして決定することと、前記第一の運動パラメータ及び/又は前記第二の運動パラメータが前記予め設定された閾値以上である場合に、前記画像ブロックシーケンスの第三の運動パラメータと第四の運動パラメータがいずれも予め設定された閾値よりも小さいかどうかを決定することであって、前記第三の運動パラメータは、前記t-2番目の画像フレームの画像ブロックと前記t-1番目の画像フレームの画像ブロックとの間の運動パラメータであり、前記第四の運動パラメータは、前記t+1番目の画像フレームの画像ブロックと前記t+2番目の画像フレームの画像ブロックとの間の運動パラメータであることと、前記第三の運動パラメータと前記第四の運動パラメータがいずれも前記予め設定された閾値よりも小さい場合に、前記画像ブロックシーケンスに対応する超解像化ネットワークモデルを第二の超解像化ネットワークモデルとして決定することと、前記第三の運動パラメータ及び/又は前記第四の運動パラメータが前記予め設定された閾値以上である場合に、前記画像ブロックシーケンスに対応する超解像化ネットワークモデルを第三の超解像化ネットワークモデルとして決定することとに用いられる。
【0098】
本開示の実施例の一つの選択的な実施形態としては、
前記第一の超解像化ネットワークモデルは、単一フレームの超解像化ネットワークモデルであり、
前記第二の超解像化ネットワークモデルは、前記t-1番目の画像フレームの画像ブロック、前記t番目の画像フレームの画像ブロック及び前記t+1番目の画像フレームの画像ブロックに基づいて、前記t番目の画像フレームの画像ブロックを超解像化するために用いられ、
前記第三の超解像化ネットワークモデルは、画像ブロックシーケンスにおけるすべての画像ブロックに基づいて前記t番目の画像フレームの画像ブロックを超解像化するために用いられる。
【0099】
本開示の実施例の一つの選択的な実施形態としては、前記画像超解像化モジュール105は、具体的には、カスケード変形可能な畳み込みPCD整列モジュールにより前記t番目の画像フレームの画像ブロックを処理して第一の特徴を取得するために用いられ、特徴融合モジュールにより前記第一の特徴を処理し、第二の特徴を取得し、前記第二の特徴は、チャンネル次元で五つの前記第一の特徴をスティッチングして得られる特徴であり、再構築モジュールにより前記第二の特徴を再構築し、第一の画像ブロックを取得し、アップサンプリングモジュールにより前記第一の画像ブロックに対してアップサンプリングを行い、前記t番目の画像フレームの画像ブロックに対応する超解像化画像ブロックを取得する。
【0100】
本開示の実施例の一つの選択的な実施形態としては、前記画像超解像化モジュール105は、具体的には、PCD整列モジュールにより前記t-1番目の画像フレームの画像ブロック、前記t番目の画像フレームの画像ブロック及び前記t+1番目の画像フレームの画像ブロックを処理し、第三の特徴を取得するために用いられ、前記第三の特徴は、チャンネル次元で第四の特徴、第五の特徴及び第六の特徴をスティッチングして得られる特徴であり、前記第四の特徴は、前記PCD整列モジュールにより前記t-1番目の画像フレームの画像ブロックと前記t番目の画像フレームの画像ブロックを処理して得られる特徴であり、前記第五の特徴は、前記PCD整列モジュールにより前記t番目の画像フレームの画像ブロックを処理して得られる特徴であり、前記第六の特徴は、前記PCD整列モジュールにより前記t番目の画像フレームの画像ブロックと前記t+1番目の画像フレームの画像ブロックを処理して得られる特徴であり、特徴融合モジュールにより前記第三の特徴を処理し、第七の特徴を取得し、前記第七の特徴は、チャンネル次元で前記第四の特徴、前記第三の特徴及び前記第五の特徴をスティッチングして得られる特徴であり、再構築モジュールにより前記第七の特徴を再構築し、第二の画像ブロックを取得し、アップサンプリングモジュールにより前記第二の画像ブロックに対してアップサンプリングを行い、前記t番目の画像フレームの画像ブロックに対応する超解像化画像ブロックを取得する。
【0101】
本開示の実施例の一つの選択的な実施形態としては、前記画像超解像化モジュール105は、具体的には、PCD整列モジュールにより画像ブロックシーケンスにおけるすべての画像ブロックを処理し、第八の特徴を取得するために用いられ、前記第八の特徴は、チャンネル次元で第九の特徴、第十の特徴、第十一の特徴、第十二の特徴及び第十三の特徴をスティッチングして得られる特徴であり、前記第九の特徴は、前記PCD整列モジュールにより前記t-2番目の画像フレームの画像ブロックと前記t-1番目の画像フレームの画像ブロックを処理して得られる特徴であり、前記第十の特徴は、前記PCD整列モジュールにより前記t-1番目の画像フレームの画像ブロックと前記t番目の画像フレームの画像ブロックを処理して得られる特徴であり、前記第十一の特徴は、前記PCD整列モジュールにより前記t番目の画像フレームの画像ブロックを処理して得られる特徴であり、前記第十二の特徴は、前記PCD整列モジュールにより前記t番目の画像フレームの画像ブロックと前記t+1番目の画像フレームの画像ブロックを処理して得られる特徴であり、前記第十三の特徴は、前記PCD整列モジュールにより前記t+1番目の画像フレームの画像ブロックと前記t+2番目の画像フレームの画像ブロックを処理して得られる特徴であり、特徴融合モジュールにより前記第八の特徴を処理し、第十四の特徴を取得し、再構築モジュールにより前記第十四の特徴を再構築し、第三の画像ブロックを取得し、アップサンプリングモジュールにより前記第三の画像ブロックに対してアップサンプリングを行い、画像ブロックシーケンスにおける前記t番目の画像フレームの画像ブロックに対応する超解像化画像ブロックを取得する。
【0102】
本開示の実施例の一つの選択的な実施形態としては、前記t番目の画像フレームと前記近傍画像フレームを分解して得られた画像ブロックのうちの隣接する画像ブロックは、重なり領域を有し、
前記画像生成モジュール106は、具体的には、前記t番目の画像フレームの各超解像化画像ブロックをスティッチングし、スティッチング画像を生成し、前記スティッチング画像における各超解像化画像ブロックの重なり領域の各画素の画素値を、各超解像化画像ブロックにおける対応する画素の画素値の平均値として設定し、前記t番目の画像フレームの超解像化画像フレームを生成するために用いられる。
【0103】
上記モジュールは、一つ又は複数の汎用プロセッサ上で実行されるソフトウェアアセンブリとして実現されてもよく、例えばいくつかの機能又はその組み合わせを実行するハードウェア、例えばプログラマブルロジックデバイス及び/又は特定用途向け集積回路として実現されてもよい。いくつかの実施例では、これらのモジュールは、ソフトウェア製品の形式として具現化されてもよく、このソフトウェア製品は、非揮発性記憶媒体に記憶されてもよく、これらの非揮発性記憶媒体には、コンピュータ機器(例えばパーソナルコンピュータ、サーバ、ネットワーク機器、移動端末など)に本開示の実施例に記述された方法を実現させるプログラムが含まれる。別のいくつかの実施例では、上記モジュールは、単一の機器上で実現されてもよく、複数の機器上に分布してもよい。これらのモジュールの機能は、相互に統合されてもよく、複数のサブモジュールに分割されてもよい。
【0104】
本実施例によるビデオの超解像化装置は、上記方法の実施例によるビデオの超解像化方法を実行することができ、その実現原理と技術的効果が類似し、ここでこれ以上説明しない。
【0105】
同一の発明構思に基づいて、本開示の実施例は、電子機器をさらに提供する。図11は、本開示の実施例による電子機器の構造概略図であり、図11に示すように、本実施例による電子機器は、メモリ111とプロセッサ112とを含み、前記メモリ111は、コンピュータプログラムを記憶するために用いられ、前記プロセッサ112は、コンピュータプログラムを呼び出す時に上記実施例によるビデオの超解像化方法を実行するために用いられる。
【0106】
同一発明構思に基づいて、本開示の実施例は、コンピュータ可読記憶媒体をさらに提供し、このコンピュータ可読記憶媒体にはコンピュータプログラムが記憶されており、コンピュータプログラムがプロセッサにより実行される時、上記実施例によるビデオの超解像化方法を前記コンピューティング機器に実現させる。
【0107】
同一の発明構思に基づいて、本開示の実施例は、コンピュータプログラム製品をさらに提供し、前記コンピュータプログラム製品がコンピュータ上で運行される時、上記実施例によるビデオの超解像化方法を前記コンピューティング機器に実現させる。
【0108】
同一の発明構思に基づいて、本開示の実施例は、コンピュータプログラムをさらに提供し、このコンピュータプログラムは、命令を含み、命令がプロセッサにより実行される時、上記実施例によるビデオの超解像化方法をプロセッサに実行させる。
【0109】
本開示の実施例が方法、システム、又はコンピュータプログラム製品として提供できることは、当業者にとって理解すべきである。そのため、本開示は、完全なハードウェア実施例、完全なソフトウェア実施例、又はソフトウェアとハードウェアとを組み合わせた態様の実施例の形式を採用してもよい。そして、本開示は、コンピュータ使用可能なプログラムコードを含む一つ又は複数のコンピュータ使用可能な記憶媒体上で実施されるコンピュータプログラム製品の形式を採用してもよい。
【0110】
プロセッサは、中央処理ユニット(Central Processing Unit、CPU)であってもよく、他の汎用プロセッサ、デジタルシグナルプロセッサ(Digital Signal Processor、DSP)、特定用途向け集積回路(Application Specific Integrated Circuit、ASIC)、フィールドプログラマブルゲートアレイ(Field-Programmable Gate Array、FPGA)又は他のプログラマブルロジックデバイス、ディスクリートゲート又はトランジスターロジックデバイス、ディスクリートハードウェアアセンブリなどであってもよい。汎用プロセッサは、マイクロプロセッサであってもよく、又はこのプロセッサは、任意の一般的なプロセッサなどであってもよい。
【0111】
メモリは、コンピュータ可読媒体における非永続的メモリ、ランダムアクセスメモリ(RAM)及び/又は非揮発性メモリなどの形式、例えばリードオンリーメモリ(ROM)又はフラッシュメモリ(flash RAM)を含む可能性がある。メモリは、コンピュータ可読媒体の例である。
【0112】
コンピュータ可読媒体は、永続的記憶媒体と非永続的記憶媒体、リムーバブル記憶媒体と非リムーバブル記憶媒体を含む。記憶媒体は、任意の方法又は技術により情報記憶を実現してもよく、情報は、コンピュータ可読命令、データ構造、プログラムのモジュール又は他のデータであってもよい。コンピュータの記憶媒体の例は、相変化メモリ(PRAM)、スタティックランダムアクセスメモリ(SRAM)、ダイナミックランダムアクセスメモリ(DRAM)、他のタイプのランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、電気的に消去可能なプログラマブルリードオンリーメモリ(EEPROM)、フラッシュメモリ又は他のメモリ技術、リードオンリー光ディスクリードオンリーメモリ(CD-ROM)、デジタル多機能光ディスク(DVD)又は他の光学記憶、磁気カセットテープ、磁気ディスク記憶又は他の磁性記憶機器又は任意の他の非伝送媒体を含むが、これらに限定されず、コンピューティング機器によりアクセスされる情報を記憶するために用いることができる。本明細書における定義に基づいて、コンピュータ可読媒体は、一時保存コンピュータ可読メディア(transitory media)、例えば変調されたデータ信号とキャリアを含まない。
【0113】
最後に説明すべきこととして、以上の各実施例は、本開示の技術案を説明するためにのみ使用され、それを限定するものではない。前述各実施例を参照して本開示について詳細に説明したが、依然として前述各実施例に記載された技術案を修正したり、その一部又はすべての技術的特徴を同等に置き換えたりすることができ、これらの修正又は置き換えが該当する技術案の本質を本開示の各実施例の技術案の範囲から逸脱させるものではないことは、当業者にとって理解すべきである。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
【国際調査報告】