(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022180137
(43)【公開日】2022-12-06
(54)【発明の名称】画像処理装置および画像処理方法
(51)【国際特許分類】
H04N 7/01 20060101AFI20221129BHJP
G06T 7/00 20170101ALI20221129BHJP
【FI】
H04N7/01 170
G06T7/00 350C
【審査請求】有
【請求項の数】13
【出願形態】OL
(21)【出願番号】P 2021087069
(22)【出願日】2021-05-24
(11)【特許番号】
(45)【特許公報発行日】2022-01-24
(71)【出願人】
【識別番号】519092071
【氏名又は名称】Navier株式会社
(74)【代理人】
【識別番号】100131451
【弁理士】
【氏名又は名称】津田 理
(74)【代理人】
【識別番号】100167933
【弁理士】
【氏名又は名称】松野 知紘
(72)【発明者】
【氏名】前田 舜太
(72)【発明者】
【氏名】ウデイ パンダリカクシャ ボンディ
【テーマコード(参考)】
5C063
5L096
【Fターム(参考)】
5C063BA03
5C063BA12
5C063CA05
5C063CA07
5L096BA08
5L096CA04
5L096DA01
5L096EA39
5L096HA11
5L096KA04
(57)【要約】 (修正有)
【課題】高性能に動画シーケンスを高解像度化できる画像処理装置及び画像処理方法を提供する。
【解決手段】画像処理装置は、複数のフレームにおける処理対象フレームがリセット対象フレームであるか否かを判定するリセット判定部と、第1機械学習モデルを有する。処理対象フレームがリセット対象フレームでない場合、処理対象フレームと、処理対象フレームの前および/または後のフレームと、処理対象フレームの前のフレームを高解像化処理した際に生成される特徴マップと、を用いて、処理対象フレームを高解像化した高解像フレームおよび特徴マップを生成し、処理対象フレームがリセット対象フレームである場合、処理対象フレームと、処理対象フレームの前および/または後のフレームと、を用いるが、処理対象フレームの前のフレームを高解像化処理した際に生成される特徴マップを用いず、高解像フレームおよび特徴マップを生成する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
複数のフレームから構成される動画シーケンスを高解像化処理する画像処理方法であって、
前記複数のフレームにおける処理対象フレームがキーフレームであるか否かを判定するステップと、
(i)前記処理対象フレームがキーフレームであると判定された場合、
前記処理対象フレームの高解像度化難易度を推定するステップと、
互いに計算量が異なる複数の機械学習モデルのうち、推定された高解像度化難易度に応じた機械学習モデルを決定するステップと、
前記処理対象フレームがシーンチェンジに対応するキーフレームであるか否かを判定するステップと、
前記処理対象フレームがシーンチェンジに対応するキーフレームでない場合、前記決定された機械学習モデルを用いて高画質化処理部が、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、前記処理対象フレームの前のフレームを高解像化処理した際に生成される特徴マップと、を用いて、前記処理対象フレームを高解像化した高解像フレームを生成するステップと、
前記処理対象フレームがシーンチェンジに対応するキーフレームである場合、
前記処理対象フレームと、前記処理対象フレームの後のフレームと、を用いて代替特徴マップを生成し、
前記決定された機械学習モデルを用いて高画質化処理部が、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、前記処理対象フレームと、前記代替特徴マップと、を用いて、前記処理対象フレームを高解像化した高解像フレームを生成するステップと、
(ii)前記処理対象フレームがキーフレームでないと判定された場合、前記決定された機械学習モデルを用いて高画質化処理部が、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、前記処理対象フレームの前のフレームを高解像化処理した際に生成される特徴マップと、を用いて、前記処理対象フレームを高解像化した高解像フレームを生成するステップと、を備える画像処理方法。
【請求項2】
複数のフレームから構成される動画シーケンスを高解像化処理する画像処理装置であって、
前記複数のフレームにおける処理対象フレームがリセット対象フレームであるか否かを判定するリセット判定部と、
第1機械学習モデルを有し、
前記処理対象フレームがリセット対象フレームでない場合、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、前記処理対象フレームの前のフレームを高解像化処理した際に生成される特徴マップと、を用いて、前記処理対象フレームを高解像化した高解像フレームおよび特徴マップを生成し、
前記処理対象フレームがリセット対象フレームである場合、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、を用いるが、前記処理対象フレームの前のフレームを高解像化処理した際に生成される特徴マップを用いず、前記高解像フレームおよび前記特徴マップを生成する高解像度化処理部と、を備える画像処理装置。
【請求項3】
前記リセット判定部は、前記複数のフレームに含まれるキーフレームに基づいて、前記処理対象フレームがリセット対象フレームであるか否かを判定する、請求項2に記載の画像処理装置。
【請求項4】
前記リセット判定部は、前記処理対象フレームがキーフレームである場合、前記処理対象フレームがリセット対象フレームであると判定する、請求項2または3に記載の画像処理装置。
【請求項5】
前記リセット判定部は、前記処理対象フレームがシーンチェンジに対応するフレームである場合、前記処理対象フレームがリセット対象フレームであると判定する、請求項2に記載の画像処理装置。
【請求項6】
前記リセット判定部は、前記処理対象フレームがシーンチェンジに対応するキーフレームである場合、前記処理対象フレームがリセット対象フレームであると判定する、請求項2に記載の画像処理装置。
【請求項7】
前記リセット判定部は、前記処理対象フレームが前記複数のフレームのうちの先頭フレームである場合、前記処理対象フレームがリセット対象フレームであると判定する、請求項2に記載の画像処理装置。
【請求項8】
前記リセット判定部は、所定フレーム毎に、前記処理対象フレームがリセット対象フレームであると判定する、請求項2に記載の画像処理装置。
【請求項9】
前記第1機械学習モデルとは異なる第2機械学習モデルを有し、前記処理対象フレームと、前記処理対象フレームの後のフレームと、を用いて、代替特徴マップを生成する特徴マップ生成部を備え、
前記高解像度化処理部は、前記処理対象フレームがリセット対象フレームである場合、前記代替特徴マップを用いて前記高解像フレームおよび前記特徴マップを生成する、請求項2乃至8のいずれかに記載の画像処理装置。
【請求項10】
複数のフレームから構成される動画シーケンスを高解像化処理する画像処理装置であって、
前記複数のフレームにおける処理対象フレームの高解像度化難易度を推定する難易度推定部と、
互いに計算量が異なる機械学習モデルを有する複数の高解像度化処理部と、を備え、
前記複数の高解像度化処理部のうち、前記処理対象フレームの高解像度化難易度に応じた機械学習モデルを有する高解像度化処理部が、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、を用いて、前記処理対象フレームを高解像化した高解像フレームを生成する、画像処理装置。
【請求項11】
前記高解像度化難易度が高いほど、計算量が大きい機械学習モデルを有する高解像度化処理部が前記高解像フレームを生成する、請求項10に記載の画像処理装置。
【請求項12】
前記難易度推定部は、前記処理対象フレームがキーフレームである場合に、前記処理対象フレームの高解像度化難易度を推定し、
前記処理対象フレームがキーフレームである場合には、前記複数の高解像度化処理部のうち、前記難易度推定部によって推定された前記処理対象フレームの高解像度化難易度に応じた機械学習モデルを有する高解像度化処理部が前記高解像フレームを生成し、
前記処理対象フレームがキーフレームでない場合には、前記処理対象フレームより1つ前のフレームの高解像度化処理を行った高解像度化処理部が前記処理対象フレームの高解像度化処理を行う、請求項10または11に記載の画像処理装置。
【請求項13】
複数のフレームから構成される動画シーケンスを高解像化処理する画像処理方法であって、
前記複数のフレームにおける処理対象フレームがリセット対象フレームであるか否かを判定するステップと、
機械学習モデルを用いて高画質化処理部が、
前記処理対象フレームがリセット対象フレームでない場合、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、前記処理対象フレームの前のフレームを高解像化処理した際に生成される特徴マップと、を用いて、前記処理対象フレームを高解像化した高解像フレームおよび特徴マップを生成し、
前記処理対象フレームがリセット対象フレームである場合、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、を用いるが、前記処理対象フレームの前のフレームを高解像化処理した際に生成される特徴マップを用いず、前記高解像フレームおよび前記特徴マップを生成するステップと、を含む画像処理方法。
【請求項14】
複数のフレームから構成される動画シーケンスを高解像化処理する画像処理方法であって、
前記複数のフレームにおける処理対象フレームの高解像度化難易度を推定するステップと、
互いに計算量が異なる複数の機械学習モデルのうち、前記処理対象フレームの高解像度化難易度に応じた機械学習モデルを用いて高画質化処理部が、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、を用いて、前記処理対象フレームを高解像化した高解像フレームを生成するステップと、含む画像処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、動画シーケンスの高解像度化処理を行う画像処理装置および画像処理方法に関する。
【背景技術】
【0002】
従来から、機械学習モデル(特に、畳み込みニューラルネットワーク(Convolution Neural Network、以下「CNN」という。)等のニューラルネットワーク)を用いて動画の解像度を高くする(画素数を増やす)高解像度化手法が提案されている(非特許文献1,2)。このような超解像度化手法では、位置合わせ、特徴抽出および再構成といった各機能がCNNを組み合わせることで実現されている。なかでも、リカレント方式と呼ばれる手法が知られている(非特許文献2,3)。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】https://arxiv.org/pdf/2007.12928.pdf
【非特許文献2】https://arxiv.org/pdf/1801.04590.pdf
【非特許文献3】https://arxiv.org/pdf/1909.08080.pdf
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の課題は、リカレント方式において、より高性能に動画シーケンスを高解像度化できる画像処理装置および画像処理方法を提供することである。
【課題を解決するための手段】
【0005】
本発明の一態様によれば、複数のフレームから構成される動画シーケンスを高解像化処理する画像処理方法であって、前記複数のフレームにおける処理対象フレームがキーフレームであるか否かを判定するステップと、(i)前記処理対象フレームがキーフレームであると判定された場合、前記処理対象フレームの高解像度化難易度を推定するステップと、互いに計算量が異なる複数の機械学習モデルのうち、推定された高解像度化難易度に応じた機械学習モデルを決定するステップと、前記処理対象フレームがシーンチェンジに対応するキーフレームであるか否かを判定するステップと、前記処理対象フレームがシーンチェンジに対応するキーフレームでない場合、前記決定された機械学習モデルを用いて高画質化処理部が、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、前記処理対象フレームの前のフレームを高解像化処理した際に生成される特徴マップと、を用いて、前記処理対象フレームを高解像化した高解像フレームを生成するステップと、前記処理対象フレームがシーンチェンジに対応するキーフレームである場合、前記処理対象フレームと、前記処理対象フレームの後のフレームと、を用いて代替特徴マップを生成し、前記決定された機械学習モデルを用いて高画質化処理部が、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、前記処理対象フレームと、前記代替特徴マップと、を用いて、前記処理対象フレームを高解像化した高解像フレームを生成するステップと、(ii)前記処理対象フレームがキーフレームでないと判定された場合、前記決定された機械学習モデルを用いて高画質化処理部が、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、前記処理対象フレームの前のフレームを高解像化処理した際に生成される特徴マップと、を用いて、前記処理対象フレームを高解像化した高解像フレームを生成するステップと、を備える画像処理方法が提供される。
【0006】
本発明の別の態様によれば、複数のフレームから構成される動画シーケンスを高解像化処理する画像処理装置であって、前記複数のフレームにおける処理対象フレームがリセット対象フレームであるか否かを判定するリセット判定部と、第1機械学習モデルを有し、前記処理対象フレームがリセット対象フレームでない場合、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、前記処理対象フレームの前のフレームを高解像化処理した際に生成される特徴マップと、を用いて、前記処理対象フレームを高解像化した高解像フレームおよび特徴マップを生成し、前記処理対象フレームがリセット対象フレームである場合、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、を用いるが、前記処理対象フレームの前のフレームを高解像化処理した際に生成される特徴マップを用いず、前記高解像フレームおよび前記特徴マップを生成する高解像度化処理部と、を備える画像処理装置が提供される。
【0007】
前記リセット判定部は、前記複数のフレームに含まれるキーフレームに基づいて、前記処理対象フレームがリセット対象フレームであるか否かを判定してもよい。
【0008】
前記リセット判定部は、前記処理対象フレームがキーフレームである場合、前記処理対象フレームがリセット対象フレームであると判定してもよい。
【0009】
前記リセット判定部は、前記処理対象フレームがシーンチェンジに対応するフレームである場合、前記処理対象フレームがリセット対象フレームであると判定してもよい。
【0010】
前記リセット判定部は、前記処理対象フレームがシーンチェンジに対応するキーフレームである場合、前記処理対象フレームがリセット対象フレームであると判定してもよい。
【0011】
前記リセット判定部は、前記処理対象フレームが前記複数のフレームのうちの先頭フレームである場合、前記処理対象フレームがリセット対象フレームであると判定してもよい。
【0012】
前記リセット判定部は、所定フレーム毎に、前記処理対象フレームがリセット対象フレームであると判定してもよい。
【0013】
前記第1機械学習モデルとは異なる第2機械学習モデルを有し、前記処理対象フレームと、前記処理対象フレームの後のフレームと、を用いて、代替特徴マップを生成する特徴マップ生成部を備え、前記高解像度化処理部は、前記処理対象フレームがリセット対象フレームである場合、前記代替特徴マップを用いて前記高解像フレームおよび前記特徴マップを生成してもよい。
【0014】
本発明の別の態様によれば、複数のフレームから構成される動画シーケンスを高解像化処理する画像処理装置であって、前記複数のフレームにおける処理対象フレームの高解像度化難易度を推定する難易度推定部と、互いに計算量が異なる機械学習モデルを有する複数の高解像度化処理部と、を備え、前記複数の高解像度化処理部のうち、前記処理対象フレームの高解像度化難易度に応じた機械学習モデルを有する高解像度化処理部が、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、を用いて、前記処理対象フレームを高解像化した高解像フレームを生成する、画像処理装置が提供される。
【0015】
前記高解像度化難易度が高いほど、計算量が大きい機械学習モデルを有する高解像度化処理部が前記高解像フレームを生成してもよい。
【0016】
前記難易度推定部は、前記処理対象フレームがキーフレームである場合に、前記処理対象フレームの高解像度化難易度を推定し、前記処理対象フレームがキーフレームである場合には、前記複数の高解像度化処理部のうち、前記難易度推定部によって推定された前記処理対象フレームの高解像度化難易度に応じた機械学習モデルを有する高解像度化処理部が前記高解像フレームを生成し、前記処理対象フレームがキーフレームでない場合には、前記処理対象フレームより1つ前のフレームの高解像度化処理を行った高解像度化処理部が前記処理対象フレームの高解像度化処理を行ってもよい。
【0017】
本発明の別の態様によれば、複数のフレームから構成される動画シーケンスを高解像化処理する画像処理方法であって、前記複数のフレームにおける処理対象フレームがリセット対象フレームであるか否かを判定するステップと、機械学習モデルを用いて高画質化処理部が、前記処理対象フレームがリセット対象フレームでない場合、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、前記処理対象フレームの前のフレームを高解像化処理した際に生成される特徴マップと、を用いて、前記処理対象フレームを高解像化した高解像フレームおよび特徴マップを生成し、前記処理対象フレームがリセット対象フレームである場合、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、を用いるが、前記処理対象フレームの前のフレームを高解像化処理した際に生成される特徴マップを用いず、前記高解像フレームおよび前記特徴マップを生成するステップと、を含む画像処理方法が提供される。
【0018】
本発明の別の態様によれば、複数のフレームから構成される動画シーケンスを高解像化処理する画像処理方法であって、前記複数のフレームにおける処理対象フレームの高解像度化難易度を推定するステップと、互いに計算量が異なる複数の機械学習モデルのうち、前記処理対象フレームの高解像度化難易度に応じた機械学習モデルを用いて高画質化処理部が、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、を用いて、前記処理対象フレームを高解像化した高解像フレームを生成するステップと、含む画像処理方法が提供される。
【発明の効果】
【0019】
より高性能に動画シーケンスを高解像度化できる。
【図面の簡単な説明】
【0020】
【
図1A】CNNを用いたリカレント方式の高解像度化処理を模式的に示す図。
【
図1B】
図1Aに示すCNNを用いたリカレント方式の高解像度化処理を行う画像処理装置の概略構成を模式的に示すブロック図。
【
図2】第1実施形態に係る画像処理装置の概略構成を模式的に示すブロック図。
【
図3】
図2の画像処理装置の処理動作の一例を示すフローチャート。
【
図4】第2実施形態に係る画像処理装置の概略構成を模式的に示すブロック図。
【
図5】
図4の画像処理装置の処理動作の一例を示すフローチャート。
【
図6】第3実施形態に係る画像処理装置の概略構成を模式的に示すブロック図。
【
図7】
図6の画像処理装置の処理動作の一例を示すフローチャート。
【発明を実施するための形態】
【0021】
以下、本発明に係る実施形態について、図面を参照しながら具体的に説明する。
まず、前提となるCNNを用いたリカレント方式の高解像度化処理(非特許文献3)について説明する。
【0022】
図1Aは、CNNを用いたリカレント方式の高解像度化処理を模式的に示す図であり、低解像度の動画シーケンスXを高解像度化して高解像度の動画シーケンスYを生成する様子を示している。なお、本明細書での「高解像度」は「低解像度」に対する相対的な意味であって、特定の画素数以上であることを意味するものではない。
【0023】
以下では、動画シーケンスXがn枚の低解像度フレームから構成され、t(t=1~n)枚目の低解像度フレームをx(t)と表記することとする。そして、生成される動画シーケンスYもn枚の高解像度フレームから構成され、t(t=1~n)枚目の高解像度フレームをy(t)と表記することとする。
【0024】
図示のように、位置合わせ、特徴抽出および再構成を行う処理モジュールがCNNを用いて構成されている。そして、低解像度フレームx(t)を高解像度化処理するために、その前フレームx(t-1)および/または後フレームx(t+1)が用いられる。以下では、高解像度化処理される対象となる低解像度化フレームx(t)を「処理対象フレームx(t)」と呼ぶことがある。なお、処理モジュールは前フレームおよび後フレームの一方のみを用いてもよいし、2以上の前フレームおよび/または後フレームを用いてもよい。
【0025】
リカレント方式の特徴の1つとして、処理対象フレームx(t)を高解像度化処理する際に、前フレームx(t-1)の高解像度化処理時にCNNの中間層から出力される特徴マップh(t-1)が用いられる。特徴マップh(t-1)を用いることにより、高解像度化の精度が向上する。さらに、前フレームx(t-1)を高解像度化処理して得られた高解像度フレームy(t-1)が高解像度化処理に用いられてもよい。
【0026】
そして、処理モジュールはCNNを適用して高解像度化処理を行い、処理対象フレームx(t)を高解像度化した高解像度フレームy(t)と、特徴マップh(t)とを出力する。特徴マップh(t)は後フレームx(t+1)を高解像度化処理する際に用いられる。
【0027】
処理モジュールが低解像度の動画シーケンスXを構成する各低解像度フレームx(1)~x(n)に対して以上の処理を再帰的に順次適用することで、高解像度化された動画シーケンスYが得られる。
【0028】
図1Bは、
図1Aに示すCNNを用いたリカレント方式の高解像度化処理を行う画像処理装置の概略構成を模式的に示すブロック図である。
【0029】
この画像処理装置はCNN10を有する高解像度化処理部100を備えている。CNN10は、動画シーケンスXを構成する低解像度フレームx(1)~x(n)のそれぞれを高解像度化処理して、高解像度フレームy(1)~y(n)を出力する。すなわち、CNN10は複数の重みパラメータを含んでおり、高解像度化に適した重みパラメータの値が予め学習され、設定されている。
【0030】
CNN10は、処理対象フレームx(t)を高解像度化処理する際、前フレームx(t-1)の高解像度化処理時にCNN10の中間層から出力される特徴マップh(t-1)を用いる。
【0031】
このような非特許文献3に記載のリカレント方式の高解像度化処理において、以下のような課題があることに発明者らは想到した。
【0032】
(1)低解像度フレームを順次高解像度化処理する過程において、生成される特徴マップh(t)には少しずつエラーが蓄積し、伝播する。その結果、後半の低解像度フレームに対する高解像度化の精度が低下することがある。
【0033】
(2)1番初めの低解像度フレームx(1)(以下「先頭フレーム」という。)を高解像度化処理する際、前フレームが存在しないため、初期化された特徴マップh(0)(例えば定数0)を用いざるを得ない。その結果、先頭フレームおよびその後の数フレームについて、高解像度化の精度が低下することがある。
【0034】
(3)現実の動画シーケンスでは各低解像度化フレームの高解像度化の難易度は様々であって時間変化が大きいが、常に同じCNNが用いられる。その結果、高解像度化処理の効率が低下する。具体的には、高解像度化が容易である低解像度化フレームについては処理時間が無駄に長くなり、高解像度化が困難である低解像度化フレームについては高解像度化の精度が低下することがある。
【0035】
そこで、本発明はこれらの課題の少なくとも一部を解決することを目的とする。以下、第1実施形態は主として(1)及び(2)の課題に対応しており、第2実施形態は主として(3)の課題に対応しており、第3実施形態は(1)~(3)の課題に対応している。
【0036】
なお、以下の各実施形態では、従来のCNNを用いたリカレント方式の高解像度化処理(
図1Aおよび
図1B)と共通する点についての説明を省略する。
【0037】
(第1実施形態)
図2は、第1実施形態に係る画像処理装置の概略構成を示すブロック図である。この画像処理装置は複数のフレームから構成される動画シーケンスを高解像度化処理するものであり、CNN11を有する高解像度化処理部101に加え、リセット判定部1と、代替特徴マップ生成部2とを備えている。これらの一部または全部は、プロセッサが所定のプログラムを実行することによって実現されてもよい。
【0038】
高解像度化処理部101は、処理対象フレームx(t)と、処理対象フレームx(t)の前フレームx(t-1)および/または後フレームx(t+1)とを用いて、処理対象フレームx(t)を高解像化した高解像フレームy(y)を生成する。用いる前フレームおよび後フレームの数は任意である。高解像度化された1以上の前フレームyがさらに用いられてもよい。
【0039】
高解像度化処理の際、処理対象フレームx(t)がリセット対象フレーム(後述)でなければ、高解像度化処理部101は前フレームx(t-1)を高解像度化処理した際に生成される特徴マップh(t-1)を用いる。一方、処理対象フレームx(t)がリセット対象フレームである場合、高解像度化処理部101は、特徴マップh(t-1)を用いることなく、代替特徴マップh’(後述)を用いる。
【0040】
リセット判定部1は処理対象フレームx(t)がリセット対象フレームであるか否かを判定する。判定結果は高解像度化処理部101に通知される。ここで、リセット対象フレームについて説明する。
【0041】
一般に、圧縮動画ではシーンチェンジの際にキーフレーム(例えば、MPEGで圧縮された動画におけるIピクチャ)が挿入され、シーンチェンジが長時間に渡って発生しない場合には一定間隔でキーフレームが挿入される。
【0042】
そこで、リセット判定部1はキーフレームに基づいて処理対象フレームx(t)がリセット対象フレームであるか否かの判定を行ってもよい。低解像度化フレームx(1)~x(n)のそれぞれがキーフレームであるか否かの情報は、動画シーケンスXに含まれている(あるいは各低解像度化フレームx(1)~x(n)に付与されている)。
【0043】
より具体的には、リセット判定部1は、処理対象フレームx(t)がキーフレームである場合には、その処理対象フレームx(t)がリセット対象フレームであると判定し、キーフレームでない場合には、リセット対象フレームでないと判定してもよい。
【0044】
また、キーフレームそのものをリセットフレームにするのではなく、リセット判定部1は、処理対象フレームx(t)がキーフレームの1または数フレーム前または後のフレームである場合に、その処理対象フレームx(t)がリセット対象フレームであると判定してもよい。
【0045】
また、リセット判定部1は、処理対象フレームx(t)が動画のシーンチェンジに対応する場合には、その処理対象フレームx(t)がリセット対象フレームであると判定し、シーンチェンジに対応しない場合には、リセット対象フレームでないと判定してもよい。
【0046】
シーンチェンジに対応するか否かは公知の手法でリセット判定部1が判定すればよい。一例として、リセット判定部1がまた別のCNN(不図示)を有し、処理対象フレームx(t)の前後数フレームを用いて処理対象フレームx(t)がシーンチェンジか否かを判定してもよい。また、低解像度化フレームx(1)~x(n)のそれぞれがシーンチェンジに対応するか否かの情報が、動画シーケンスXに含まれていてもよい(あるいは各低解像度化フレームx(1)~x(n)に付与されていてもよい)。
【0047】
さらに、リセット判定部1は、処理対象フレームx(t)が動画のシーンチェンジに対応するキーフレームである場合には、その処理対象フレームx(t)がリセット対象フレームであると判定し、シーンチェンジに対応するキーフレームでない場合(すなわち、キーフレームでない場合およびシーンチェンジに対応しないキーフレームである場合)には、リセット対象フレームでないと判定してもよい。処理対象フレームx(t)がキーフレームであったとしもシーンチェンジに対応しない場合には前フレームx(t-1)の高解像化処理した際に生成された特徴マップh(t-1)を用いることで、高解像度化処理の連続性を保てる。
【0048】
その他、リセット判定部1は処理対象フレームx(t)が先頭フレームx(0)である場合に、リセット対象フレームであると判定してもよい。また、リセット判定部1は所定フレーム毎(例えば、第1フレーム、第11フレーム、第21フレーム・・・といった一定間隔毎)にリセット対象フレームであると判定してもよい。なお、本明細書における一定間隔とは、厳密な一定間隔の場合と、厳密に一定ではないが上記の課題を解決できる程度の小さな変動にすぎない場合と、を含むものとする。
【0049】
代替特徴マップ生成部2は処理対象フレームx(t)がリセット対象フレームである場合に用いられる代替特徴マップh’を生成する。生成された代替特徴マップh’は高解像度化処理部101に入力される。
【0050】
代替特徴マップh’は予め定めた定数であってもよい。しかし、代替特徴マップ生成部2はCNN11とは別のCNN21を有し、低解像度フレームから代替特徴マップh’を生成するのが望ましい。すなわち、CNN21は複数の重みパラメータを含んでおり、適切な代替特徴マップh’を生成するのに適した重みパラメータの値が予め学習され、設定されている。
【0051】
一例として、代替特徴マップ生成部2は処理対象フレームx(t)および/または後フレームから代替特徴マップh’を生成してもよい。用いる後フレームの数に特に制限はなく、例えば5フレーム程度である。
【0052】
図3は、
図2の画像処理装置の処理動作の一例を示すフローチャートである。まず、高解像度化処理部101は低解像度化フレームx(1)~x(n)のうちの1つを処理対象フレームx(t)として設定する(ステップS1)。そして、リセット判定部1は処理対象フレームx(t)がリセット対象フレームであるか否かを判定する(ステップS2)。
【0053】
処理対象フレームx(t)がリセット対象フレームでないと判定された場合(ステップS2のNO)、高解像度化処理部101は、処理対象フレームx(t)と、処理対象フレームの前フレームx(t-1)および/または後フレームx(t+1)と、前フレームx(t-1)を高解像化処理した際に生成され特徴マップh(t-1)とを用いて、処理対象フレームx(t)を高解像化した高解像フレームy(t)を生成する(ステップS3a)。この際、特徴マップh(t)も生成される。
【0054】
一方、処理対象フレームx(t)がリセット対象フレームであると判定された場合(ステップS2のYES)、高解像度化処理部101は、処理対象フレームx(t)と、処理対象フレームの前フレームx(t-1)および/または後フレームx(t+1)と、代替特徴マップ生成部2によって生成された代替特徴マップh’とを用いて(特徴マップh(t-1)を用いず)、処理対象フレームx(t)を高解像化した高解像フレームy(t)を生成する(ステップS3b)。この際、特徴マップh(t)も生成される。生成された高解像度フレームy(t)はディスプレイに表示されてもよい。
【0055】
以上の処理を、処理対象フレームx(t)が最終フレームとなるまで(t=nとなるまで)、tをインクリメントしながらステップS1以降の処理を繰り返す(ステップS4のNO)。すべての低解像度フレームx(1)~x(n)の高解像度化処理が完了すると、画像処理装置の処理動作は終了する(ステップS4のYES)。処理の終了後に、高解像度化処理部101は高解像度フレームy(1)~y(n)から高解像度動画シーケンスYを生成してもよい。
【0056】
このように、第1実施形態では、リセット判定部1を設け、処理対象フレームx(t)がリセット対象フレームである場合には、前フレームx(t-1)を高解像度化処理した際に生成される特徴マップh(t-1)を用いない。これにより、特徴マップにエラーが蓄積されて伝播するのを抑えられ、後半の低解像度フレームに対する高解像度化の精度が低下するのを抑制できる。
【0057】
特に、キーフレームをリセット対象フレームとすることで、シーンチェンジが長時間に渡って発生しない場合でも、定期的に特徴マップをリセットできる。また、シーンチェンジに対応するキーフレームをリセット対象フレームとすることで、高解像度フレームy(t)の連続性を保てる。
【0058】
リセット対象フレームにおいては、処理対象フレームx(t)および/または後フレームに基づいて、CNN21を有する代替特徴マップ生成部2によって生成された代替特徴マップh’を用いることで、高解像度化の精度を向上できる。
【0059】
また、先頭フレームをリセット対象フレームとし、代替特徴マップh’を用いることで、先頭フレームおよびその後の数フレームについても高解像度化の精度を向上できる。
【0060】
(第2実施形態)
図4は、第2実施形態に係る画像処理装置の概略構成を模式的に示すブロック図である。この画像処理装置は、高解像度化処理部102と、難易度推定部3とを備えている。これらの一部または全部は、プロセッサが所定のプログラムを実行することによって実現されてもよい。以下、第1実施形態との相違点を中心に説明する。
【0061】
難易度推定部3は処理対象フレームx(t)の高解像度化難易度を推定する。本実施形態の難易度推定部3は処理対象フレームx(t)の難易度が高いか低いかの2値判定を行うものとする。判定は公知の技術を適用してよい。
【0062】
一例として、難易度推定部3は処理対象フレームx(t)における時間方向の動きの大きさに基づいて難易度を判定してもよい。より具体的には、処理対象フレームx(t)と、1または複数の前フレームおよび/または後フレームxとを対比し、フレーム間の差が大きい場合に難易度推定部3は処理対象フレームx(t)の高解像度化難易度が高いと推定してもよい。
【0063】
あるいは、難易度推定部3は処理対象フレームx(t)に含まれる周波数成分に基づいて難易度を判定してもよい。より具体的には、処理対象フレームx(t)に高周波数成分を多く含む場合に難易度推定部3は処理対象フレームx(t)の高解像度化難易度が高いと推定してもよい。
【0064】
難易度推定部3はCNN31を有し、処理対象フレームx(t)の高解像度化難易度を判定するのが望ましい。すなわち、CNN31は複数の重みパラメータを含んでおり、適切に高解像度化難易度を判定できるよう重みパラメータの値が予め学習され、設定されている。
【0065】
高解像度化処理部102は、複数の高解像度化処理部として、CNN13を有する高難易度用高解像度化処理部103と、CNN14を有する低難易度用高解像度化処理部104とを有する。高難易度用高解像度化処理部103および低難易度用高解像度化処理部104のそれぞれは、第1実施形態と同様、処理対象フレームx(t)を高解像度化して高解像度フレームy(t)と特徴マップh(t)を生成できる。
【0066】
ここで、CNN13とCNN14はサイズが互いに異なる。詳細には、CNN13のサイズはCNN14のサイズより大きい。さらに詳細には、CNN13は、CNN14より計算量が多い(例えば、層数が多い、あるいは、CNN14より多い重みパラメータ数を含んでいる)。すなわち、CNN13は、CNN14より高解像度化の精度は高いが、CNN14より処理速度が遅い。
【0067】
よって、高解像度化の難易度が高い処理対象フレームx(t)については、多少処理時間がかかるとしても、CNN13を適用するのが好適である。一方、高解像度化の難易度が低い処理対象フレームx(t)については、CNN14を適用して処理時間を短縮するのが好適である。
【0068】
そこで、本実施形態では、難易度推定部3によって処理対象フレームx(t)の高解像度化難易度が高いと推定された場合には高難易度用高解像度化処理部103が高解像度化処理を行い、難易度推定部3によって処理対象フレームx(t)の高解像度化難易度が低いと推定された場合には低難易度用高解像度化処理部103が高解像度化処理を行うこととする。すなわち、処理対象フレームx(t)の高解像度間難易度に応じてサイズが異なるCNN13,14を適応的に適用する。
【0069】
なお、処理対象フレームx(t)ごとに高解像度化難易度を判定してフレーム単位で適用するCNN13,14を切り替えてもよいが、一定間隔ごと(例えばキーフレームごと)に適用するCNN13,14を切り替えてもよい。高解像度化難易度は隣接フレームでは大きく変わらないと考えられるためである。
【0070】
図5は、
図4の画像処理装置の処理動作の一例を示すフローチャートである。まず、高解像度化処理部102は低解像度フレームx(1)~x(n)のうちの1つを処理対象フレームx(t)として設定する(ステップS11)。そして、難易度推定部3は処理対象フレームx(t)が切替対象フレームであるか否かを判定する(ステップS12)。
【0071】
ここで、一例として、難易度推定部3はキーフレームである処理対象フレームx(t)を切替対象フレームとしてもよい。別の例として、難易度推定部3は、シーンチェンジに対応するキーフレームである処理対象フレームx(t)を切替対象フレームとしてもよいし、全フレームを切替対象フレームとしてもよい。
【0072】
処理対象フレームx(t)が切替対象フレームである場合(ステップS12のYES)、難易度推定部3は処理対象フレームx(t)の高解像度化難易度を推定する(ステップS13)。本実施形態では、難易度推定部3は処理対象フレームx(t)の高解像度化難易度が高いか低いかを判定する。具体的な推定手法は上述したものでもよい。キーフレームを切替対象フレームとする場合、当該キーフレームから次のキーフレームまでの間の1またはすべてのフレームの平均的な高解像度化難易度を推定し、推定された難易度を処理対象フレームx(t)の高解像度化難易度としてもよい。
【0073】
続いて、高解像度化処理部102は、難易度推定部3によって推定された処理対象フレームx(t)の高解像度化難易度に応じて、高難易度用高解像度化処理部103および低難易度用高解像度化処理部104のいずれを適用するかを決定する(ステップS14)。具体的には、高解像度化の難易度が高いと判定された処理対象フレームx(t)には高難易度用高解像度化処理部103が適用され、高解像度化の難易度が低いと判定された処理対象フレームx(t)には低難易度用高解像度化処理部104が適用される。
【0074】
そして、決定された高難易度用高解像度化処理部103および低難易度用高解像度化処理部104のいずれが処理対象フレームx(t)の高解像度化処理を行う(ステップS15)。生成された高解像度フレームy(t)はディスプレイに表示されてもよい。なお、処理対象フレームx(t)に適用される高解像度化処理部と、前フレームx(t-1)に適用された高解像度化処理部とが異なる場合、前フレームx(t-1)を高解像度化した際に生成される特徴マップh(t-1)を処理対象フレームx(t)の高解像度化に使えないのであれば、適宜、定数の特徴マップあるいは第1実施形態で述べたような代替特徴マップを使うようにすればよい。
【0075】
一方、処理対象フレームx(t)が切替対象フレームでない場合(ステップS12のNO)、前フレームx(t-1)を処理した高難易度用高解像度化処理部103および低難易度用高解像度化処理部104のいずれが処理対象フレームx(t)の高解像度化処理を行う(ステップS15)。言い換えると、処理対象フレームx(t)より前の切替対象フレームの高解像度化難易度に応じて決定された高難易度用高解像度化処理部103および低難易度用高解像度化処理部104のいずれが、処理対象フレームx(t)の高解像度化を行う。生成された高解像度フレームy(t)はディスプレイに表示されてもよい。
【0076】
以上の処理を、処理対象フレームx(t)が最終フレームとなるまで(t=nとなるまで)、tをインクリメントしながらステップS11以降の処理を繰り返す(ステップS16のNO)。すべての低解像度フレームx(1)~x(n)の高解像度化処理が完了すると、画像処理装置の処理動作は終了する(ステップS16のYES)。処理の終了後に、高解像度化処理部101は高解像度フレームy(1)~y(n)から高解像度動画シーケンスYを生成してもよい。
【0077】
ステップS12においてキーフレームを切替対象フレームとする例においては、1つのキーフレームから次のキーフレームの前のフレームまでが同一の高解像度化処理部103または高解像度化処理部104が適用されることとなる。
【0078】
なお、本実施形態では難易度推定部3が高解像度化難易度を2段階(難易度が高いか低いか)で推定する例を示したが、3段階以上で推定してもよい。この場合、高解像度化処理部102が互いにサイズが異なるCNNを有する3つ以上の高解像度化処理部を有し、高解像度化の難易度が高いほどサイズが大きいCNNを有する高解像度化処理部が処理対象フレームx(t)を高解像度化すればよい。
【0079】
このように、第2実施形態では、互いにサイズが異なるCNNを有する複数の高解像度化処理部を設け、処理対象フレームx(t)の高解像度化難易度に応じたサイズのCNNを用いて高解像度化処理を行う。これにより、高解像度化の精度と処理速度と両立させることができ、高解像度化処理の効率を向上できる。
【0080】
なお、本実施形態は、リカレント方式の高解像度化処理に限らず、前のフレームを高解像度化処理した際に生成された情報を次のフレームの高解像度化処理に用いない場合にも適用可能である。
【0081】
(第3実施形態)
次に述べる第3実施形態は第1実施形態と第2実施形態とを組み合わせたものである。
【0082】
図6は、第3実施形態に係る画像処理装置の概略構成を模式的に示すブロック図である。各部の機能は第1実施形態および第2実施形態で述べたとおりである。
【0083】
図7は、
図6の画像処理装置の処理動作の一例を示すフローチャートである。以下、処理対象フレームがキーフレームである場合に、難易度推定部3は処理対象フレームが切り替え対象フレームであると判定するものとする。また、処理対象フレームがシーンチェンジに対応するキーフレームである場合に、リセット判定部1は処理対象フレームがリセット対象フレームであると判定するものとする。
【0084】
まず、高解像度化処理部102は低解像度化フレームx(1)~x(n)のうちの1つを処理対象フレームx(t)として設定する(ステップS21)。そして、難易度推定部3は処理対象フレームx(t)が切替対象フレームであるか否か(本例では、キーフレームであるか否か)を判定する(ステップS22)。
【0085】
処理対象フレームx(t)が切替対象フレームでない場合(ステップS22のNO)、ステップS26aの処理に進む。
【0086】
処理対象フレームx(t)が切替対象フレームである場合(ステップS22のYES)、すなわち、処理対象フレームx(t)がキーフレームである場合、難易度推定部3は処理対象フレームx(t)の高解像度化難易度を推定する(ステップS23)。本実施形態では、難易度推定部3は処理対象フレームx(t)の高解像度化難易度が高いか低いかを判定する。
【0087】
続いて、高解像度化処理部102は、難易度推定部3によって推定された処理対象フレームx(t)の高解像度化難易度に応じて、高難易度用高解像度化処理部103および低難易度用高解像度化処理部104のいずれを適用するかを決定する(ステップS24)。具体的には、高解像度化の難易度が高いと判定された処理対象フレームx(t)には高難易度用高解像度化処理部103が適用され、高解像度化の難易度が低いと判定された処理対象フレームx(t)には低難易度用高解像度化処理部104が適用される。
【0088】
次に、リセット判定部1は処理態様フレームx(t)がリセット対象フレームであるか否か(本例では、シーンチェンジに対応するキーフレームであるか否か)を判定する(ステップS25)。
【0089】
処理対象フレームx(t)がリセット対象フレームでない場合(ステップS25のNO)、ステップS24で決定された高難易度用高解像度化処理部103および低難易度用高解像度化処理部104のいずれかが、処理対象フレームx(t)と、処理対象フレームの前フレームx(t-1)および/または後フレームx(t+1)と、前フレームx(t-1)を高解像化処理した際に生成され特徴マップh(t-1)とを用いて、処理対象フレームx(t)を高解像化した高解像フレームy(t)および特徴マップh(t)を生成する(ステップS26a)。生成された高解像度フレームy(t)はディスプレイに表示されてもよい。
【0090】
一方、処理対象フレームx(t)がリセット対象フレームである場合(ステップS25のYES)、ステップS24で決定された高難易度用高解像度化処理部103および低難易度用高解像度化処理部104のいずれかが、処理対象フレームx(t)と、処理対象フレームの前フレームx(t-1)および/または後フレームx(t+1)と、代替特徴マップ生成部2によって生成された代替特徴マップh’とを用いて(特徴マップh(t-1)を用いず)、処理対象フレームx(t)を高解像化した高解像フレームy(t)および特徴マップh(t)を生成する(ステップS26b)。生成された高解像度フレームy(t)はディスプレイに表示されてもよい。
【0091】
以上の処理を、処理対象フレームx(t)が最終フレームとなるまで(t=nとなるまで)、tをインクリメントしながらステップS21以降の処理を繰り返す(ステップS27のNO)。すべての低解像度フレームx(1)~x(n)の高解像度化処理が完了すると、画像処理装置の処理動作は終了する(ステップS27のYES)。処理の終了後に、高解像度化処理部102は高解像度フレームy(1)~y(n)から高解像度動画シーケンスYを生成してもよい。
【0092】
このように、第3実施形態では、リセット判定部1を設けることによりエラーの蓄積および伝播を抑制でき、難易度推定部3を設けることにより高解像度化処理を効率化できる。なお、第1および第2実施形態で述べた事項を適宜第3実施形態にも適用してよい。
【0093】
なお、上述した各実施形態は機械学習手法の一例としてCNNを示したが、他の一般的な機械学習手法にも本発明は適用可能である。すなわち、各高解像度化処理部は任意の機械学習モデルを用いて処理を行えばよく、その一例としてニューラルネットワークを用いた処理、さらにその一例としてCNNを用いた処理を行ってよい。
【0094】
本明細書で言及したプログラムは、コンピュータ読み取り可能な記録媒体に非一時的に記録して頒布されてもよいし、インターネットなどの通信回線(無線通信も含む)を介して頒布されてもよいし、任意の端末にインストールされた状態で頒布されてもよい。
【0095】
上記の記載に基づいて、当業者であれば、本発明の追加の効果や種々の変形例を想到できるかもしれないが、本発明の態様は、上述した個々の実施形態には限定されるものではない。特許請求の範囲に規定された内容およびその均等物から導き出される本発明の概念的な思想と趣旨を逸脱しない範囲で種々の追加、変更および部分的削除が可能である。
【0096】
例えば、本明細書において1台の装置として説明されるもの(図面において1台の装置として描かれているものを含む)を複数の装置によって実現してもよい。逆に、本明細書において複数の装置として説明されるもの(図面において複数の装置として描かれているものを含む)を1台の装置によって実現してもよい。あるいは、ある装置に含まれるとした手段や機能の一部または全部が、他の装置に含まれるようにしてもよい。
【0097】
また、本明細書に記載された事項の全てが必須の要件というわけではない。特に、本明細書に記載され、特許請求の範囲に記載されていない事項は任意の付加的事項ということができる。
【0098】
なお、本出願人は本明細書の「先行技術文献」欄の文献に記載された文献公知発明を知っているにすぎず、本発明は必ずしも同文献公知発明における課題を解決することを目的とするものではないことにも留意されたい。本発明が解決しようとする課題は本明細書全体を考慮して認定されるべきものである。例えば、本明細書において、特定の構成によって所定の効果を奏する旨の記載がある場合、当該所定の効果の裏返しとなる課題が解決されるということもできる。ただし、必ずしもそのような特定の構成を必須の要件とする趣旨ではない。
【符号の説明】
【0099】
100,101,102 高解像度化処理部
10,11,13,14,21,31 CNN
1 リセット判定部
2 代替特徴マップ生成部
3 難易度推定部
【手続補正書】
【提出日】2021-11-29
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
複数のフレームから構成される動画シーケンスを高解像化処理する画像処理方法であって、
前記複数のフレームにおける処理対象フレームがキーフレームであるか否かを判定するステップと、
(i)前記処理対象フレームがキーフレームであると判定された場合、
前記処理対象フレームの高解像度化難易度を推定するステップと、
互いに計算量が異なる複数の機械学習モデルのうち、推定された高解像度化難易度に応じた機械学習モデルを決定するステップと、
前記処理対象フレームがシーンチェンジに対応するキーフレームであるか否かを判定するステップと、
前記処理対象フレームがシーンチェンジに対応するキーフレームでない場合、前記決定された機械学習モデルを用いて高画質化処理部が、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、前記処理対象フレームの前のフレームを高解像化処理した際に生成される特徴マップと、を用いて、前記処理対象フレームを高解像化した高解像フレームを生成するステップと、
前記処理対象フレームがシーンチェンジに対応するキーフレームである場合、
前記処理対象フレームと、前記処理対象フレームの後のフレームと、を用いて代替特徴マップを生成し、
前記決定された機械学習モデルを用いて高画質化処理部が、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、前記代替特徴マップと、を用いて、前記処理対象フレームを高解像化した高解像フレームを生成するステップと、
(ii)前記処理対象フレームがキーフレームでないと判定された場合、前記決定された機械学習モデルを用いて高画質化処理部が、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、前記処理対象フレームの前のフレームを高解像化処理した際に生成される特徴マップと、を用いて、前記処理対象フレームを高解像化した高解像フレームを生成するステップと、を備える画像処理方法。
【請求項2】
複数のフレームから構成される動画シーケンスを高解像化処理する画像処理装置であって、
前記複数のフレームにおける処理対象フレームがリセット対象フレームであるか否かを判定するリセット判定部と、
第1機械学習モデルを有し、
前記処理対象フレームがリセット対象フレームでない場合、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、前記処理対象フレームの前のフレームを高解像化処理した際に生成される特徴マップと、を用いて、前記処理対象フレームを高解像化した高解像フレームおよび特徴マップを生成し、
前記処理対象フレームがリセット対象フレームである場合、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、を用いるが、前記処理対象フレームの前のフレームを高解像化処理した際に生成される特徴マップを用いず、前記高解像フレームおよび前記特徴マップを生成する高解像度化処理部と、を備える画像処理装置。
【請求項3】
前記リセット判定部は、前記複数のフレームに含まれるキーフレームに基づいて、前記処理対象フレームがリセット対象フレームであるか否かを判定する、請求項2に記載の画像処理装置。
【請求項4】
前記リセット判定部は、前記処理対象フレームがキーフレームである場合、前記処理対象フレームがリセット対象フレームであると判定する、請求項2または3に記載の画像処理装置。
【請求項5】
前記リセット判定部は、前記処理対象フレームがシーンチェンジに対応するフレームである場合、前記処理対象フレームがリセット対象フレームであると判定する、請求項2に記載の画像処理装置。
【請求項6】
前記リセット判定部は、前記処理対象フレームがシーンチェンジに対応するキーフレームである場合、前記処理対象フレームがリセット対象フレームであると判定する、請求項2に記載の画像処理装置。
【請求項7】
前記リセット判定部は、前記処理対象フレームが前記複数のフレームのうちの先頭フレームである場合、前記処理対象フレームがリセット対象フレームであると判定する、請求項2に記載の画像処理装置。
【請求項8】
前記リセット判定部は、所定フレーム毎に、前記処理対象フレームがリセット対象フレームであると判定する、請求項2に記載の画像処理装置。
【請求項9】
前記第1機械学習モデルとは異なる第2機械学習モデルを有し、前記処理対象フレームと、前記処理対象フレームの後のフレームと、を用いて、代替特徴マップを生成する特徴マップ生成部を備え、
前記高解像度化処理部は、前記処理対象フレームがリセット対象フレームである場合、前記代替特徴マップを用いて前記高解像フレームおよび前記特徴マップを生成する、請求項2乃至8のいずれかに記載の画像処理装置。
【請求項10】
複数のフレームから構成される動画シーケンスを高解像化処理する画像処理装置であって、
前記複数のフレームにおける処理対象フレームがキーフレームである場合、前記処理対象フレームの高解像度化難易度を推定する難易度推定部と、
互いに計算量が異なる機械学習モデルを有する複数の高解像度化処理部と、を備え、
前記処理対象フレームがキーフレームである場合には、前記複数の高解像度化処理部のうち、前記処理対象フレームの高解像度化難易度に応じた機械学習モデルを有する高解像度化処理部が、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、を用いて、前記処理対象フレームを高解像化した高解像フレームを生成し、
前記処理対象フレームがキーフレームでない場合には、前記処理対象フレームより1つ前のフレームの高解像度化処理を行った高解像度化処理部が前記処理対象フレームの高解像度化処理を行う、画像処理装置。
【請求項11】
前記高解像度化難易度が高いほど、計算量が大きい機械学習モデルを有する高解像度化処理部が前記高解像フレームを生成する、請求項10に記載の画像処理装置。
【請求項12】
複数のフレームから構成される動画シーケンスを高解像化処理する画像処理方法であって、
前記複数のフレームにおける処理対象フレームがリセット対象フレームであるか否かを判定するステップと、
機械学習モデルを用いて高画質化処理部が、
前記処理対象フレームがリセット対象フレームでない場合、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、前記処理対象フレームの前のフレームを高解像化処理した際に生成される特徴マップと、を用いて、前記処理対象フレームを高解像化した高解像フレームおよび特徴マップを生成し、
前記処理対象フレームがリセット対象フレームである場合、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、を用いるが、前記処理対象フレームの前のフレームを高解像化処理した際に生成される特徴マップを用いず、前記高解像フレームおよび前記特徴マップを生成するステップと、を含む画像処理方法。
【請求項13】
複数のフレームから構成される動画シーケンスを高解像化処理する画像処理方法であって、
前記複数のフレームにおける処理対象フレームがキーフレームである場合、前記処理対象フレームの高解像度化難易度を推定するステップと、
前記処理対象フレームがキーフレームである場合には、互いに計算量が異なる複数の機械学習モデルのうち、前記処理対象フレームの高解像度化難易度に応じた機械学習モデルを用いて高画質化処理部が、前記処理対象フレームと、前記処理対象フレームの前および/または後のフレームと、を用いて、前記処理対象フレームを高解像化した高解像フレームを生成するステップと、
前記処理対象フレームがキーフレームでない場合には、前記処理対象フレームより1つ前のフレームの高解像度化処理を行った高解像度化処理部が前記処理対象フレームの高解像度化処理を行うステップと、含む画像処理方法。