IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ イノワイアレス カンパニー、リミテッドの特許一覧

<>
  • 特許-非参照映像基盤の映像品質評価方法 図1
  • 特許-非参照映像基盤の映像品質評価方法 図2
  • 特許-非参照映像基盤の映像品質評価方法 図3
  • 特許-非参照映像基盤の映像品質評価方法 図4
  • 特許-非参照映像基盤の映像品質評価方法 図5
  • 特許-非参照映像基盤の映像品質評価方法 図6
  • 特許-非参照映像基盤の映像品質評価方法 図7
  • 特許-非参照映像基盤の映像品質評価方法 図8
  • 特許-非参照映像基盤の映像品質評価方法 図9
  • 特許-非参照映像基盤の映像品質評価方法 図10
  • 特許-非参照映像基盤の映像品質評価方法 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-03-19
(45)【発行日】2024-03-28
(54)【発明の名称】非参照映像基盤の映像品質評価方法
(51)【国際特許分類】
   G06T 7/00 20170101AFI20240321BHJP
   G06V 10/82 20220101ALI20240321BHJP
   G06N 3/044 20230101ALI20240321BHJP
   G06N 3/0464 20230101ALI20240321BHJP
   G06N 3/08 20230101ALI20240321BHJP
【FI】
G06T7/00 Q
G06T7/00 350C
G06V10/82
G06N3/044
G06N3/0464
G06N3/08
【請求項の数】 6
(21)【出願番号】P 2023053810
(22)【出願日】2023-03-29
(65)【公開番号】P2023152957
(43)【公開日】2023-10-17
【審査請求日】2023-03-29
(31)【優先権主張番号】10-2022-0039854
(32)【優先日】2022-03-30
(33)【優先権主張国・地域又は機関】KR
(73)【特許権者】
【識別番号】516157382
【氏名又は名称】イノワイアレス カンパニー、リミテッド
(74)【代理人】
【識別番号】100121382
【弁理士】
【氏名又は名称】山下 託嗣
(72)【発明者】
【氏名】クワク,ヨン ス
(72)【発明者】
【氏名】ホン,ソン マン
【審査官】新井 則和
(56)【参考文献】
【文献】韓国公開特許第10-2020-0044652(KR,A)
【文献】韓国登録特許第10-1279705(KR,B1)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
G06V 10/82
G06N 3/044
G06N 3/0464
G06N 3/08
(57)【特許請求の範囲】
【請求項1】
映像の一フレームに対してRGB値を抽出する(a)過程と、
抽出したRGB値を1番目のCNNに与えて出力を獲得する(b)過程と、
抽出されたRGB値をn番(n≧2以上の整数)目のCNNに提供して出力を獲得する(c)過程と、
(a)~(c)過程をすべてのフレームに対して繰り返し、すべてのCNNの出力を併合する(d)過程と、
時間次元の学習のために併合された出力値をRNNに伝達した後、時間次元を1に減らしたRNNの出力を獲得する(e)過程と、
出力値が1個の次元となるようにRNNの最終出力に回帰アルゴリズムを適用した後、この値をビデオ品質値として予測する(f)過程と、
を含んでなる、非参照映像基盤の映像品質評価方法。
【請求項2】
1番目のCNNの一部の畳み込み層は学習が不可能である反面、残りは学習が可能であるように設定することを特徴とする、請求項1に記載の非参照映像基盤の映像品質評価方法。
【請求項3】
1番目のCNNの一部の畳み込み層は、複数のImageNet学習データで事前学習されて係数が固定されており、
1番目のCNNの残りの畳み込み層は、事前学習された係数で学習を始めるが追加の学習が可能であることを特徴とする、請求項2に記載の非参照映像基盤の映像品質評価方法。
【請求項4】
前記nは2であり、
2番目のCNNの一部の畳み込み層は、1番目のCNNとは異なる複数のイメージ学習データで事前学習されて係数が固定されており、
2番目のCNNの残りの畳み込み層は、事前学習された係数で学習を始めるが追加の学習が可能であることを特徴とする、請求項3に記載の非参照映像基盤の映像品質評価方法。
【請求項5】
学習過程で誤差逆伝播法(backpropagation)を使うことを特徴とする、請求項4に記載の非参照映像基盤の映像品質評価方法。
【請求項6】
RNNで時間概念を担当するフレーム数次元を除いた残りのデータは、全域平均プーリング(global average pooling)を通じて全体フィルタ数の次元に変更して1次元RNNとして動作することを特徴とする、請求項1~請求項5のいずれか一項に記載の非参照映像基盤の映像品質評価方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、非参照映像基盤の映像品質評価方法に関し、特に学習範囲の設定が可能な複数の畳み込みニューラルネットワーク(CNN)と循環ニューラルネットワーク(RNN)で構成された人工知能を利用して、オリジナル映像なしに受信した映像の品質を評価する非参照映像基盤の映像品質評価方法に関する。
【背景技術】
【0002】
図1は、無線通信環境で増加する映像のトラフィック需要を示したグラフである。図1に図示した通り、最近、5世代移動通信システムの導入およびそれによる5世代加入者数の増加と遠隔勤務需要の増加などにより、映像に対するネットワークトラフィックの需要が増加している。
【0003】
しかし、これに反して使用者が感じる受信映像に対する品質をオリジナル映像なしに非参照方式で評価する方法としては、人が直接手作業で設計したアルゴリズムが知られている。すなわち、映像のBPS(Bit Per Second)、明るさ、およびブラーの程度など、約10個程度のKPI(Key Performance Indicator)をSVM(Support Vector Machine)等のアルゴリズムの入力で使って評価するが、これは人間が映像に対する品質を評価する方法が非常に高次元的であるということを勘案する時、正しく動作し難い問題がある。
【0004】
具体的には、従来受信した映像データの品質を評価する方式は大きく三つに区分され得る。
【0005】
a.オリジナル映像と受信映像をすべて獲得した後、数学的なアルゴリズムを通じて遅延時間などを計算して受信した映像データの品質を評価する(全参照方式)。
【0006】
b.オリジナル映像に対する一部の情報と受信映像を獲得した後、数学的なアルゴリズムを通じて色空間の変化の程度などを計算して受信した映像データの品質を評価する(縮小参照方式)。
【0007】
c.受信映像のみで受信した映像データの品質を評価する(非参照方式)。
【0008】
前述した全参照方式の場合、オリジナル映像と受信映像を活用できるので、受信映像の品質を求めるアルゴリズムの設計が容易であり、非参照方式より受信映像の予測品質と実際に人が感じた品質間の誤差が少ない。反面、実際の通信環境で受信機がオリジナル映像を有している場合は極めて珍しいので、殆どの実際環境で適用が不可能である(下記の特許文献1を参照)。
【0009】
前述した縮小参照方式の場合、尾尻なる映像をすべて有しておらずに一部の情報のみ有していても受信映像に対する品質の予測が可能であるという長所がある反面、実環境で適用するには追加的な情報処理および情報の伝送が必要な負担があるので、実環境への適用の障害となる。
【0010】
最後に、非参照方式の場合、受信映像のみで品質の予測が可能であるという長所がある反面、受信映像のみで受信した映像データの品質を判断するアルゴリズムの設計が非常に難しいという短所がある。これに伴い、殆どの非参照方式は、BPS、明るさ、およびブラーなどの数十個のKPIを活用して受信映像の品質を予測するアルゴリズムで設計されているが、アルゴリズムが相対的に単純であるので、全参照方式に比べて受信映像の予測品質と実際に人が感じた品質間の誤差が大きいという問題点があった(下記の特許文献2を参照)。
【先行技術文献】
【特許文献】
【0011】
【文献】韓国公開特許公報第10-2020-0044652号(発明の名称:映像の主観的品質を評価する方法および装置)
【文献】韓国登録特許公報第10-1279705号(発明の名称:映像フレーム内のブラー測定方法とこれを利用して映像フレームの画質測定装置および方法)
【発明の概要】
【発明が解決しようとする課題】
【0012】
本発明は、前述した問題点を解決するために案出されたもので、学習範囲の設定が可能な複数の畳み込みニューラルネットワーク(CNN)と循環ニューラルネットワーク(RNN)で構成された人工知能を利用して、オリジナル映像なしに受信した映像の品質を評価する非参照映像基盤の映像品質評価方法を提供することを目的とする。
【課題を解決するための手段】
【0013】
前述した目的を達成するための本発明の非参照映像基盤の映像品質評価方法は、映像の一フレームに対してRGB値を抽出する(a)過程と、抽出したRGB値を1番目のCNNに与えて出力を獲得する(b)過程と、抽出されたRGB値をn番(n≧2以上の整数)目のCNNに提供して出力を獲得する(c)過程と、(a)~(c)過程をすべてのフレームに対して繰り返し、すべてのCNNの出力を併合する(d)過程と、時間次元の学習のために併合された出力値をRNNに伝達した後、時間次元を1に減らしたRNNの出力を獲得する(e)過程と、出力値が1個の次元となるようにRNNの最終出力に回帰アルゴリズムを適用した後、この値をビデオ品質値として予測する(f)過程と、を含んでなる。
【0014】
前述した構成で、1番目のCNNの一部の畳み込み層は学習が不可能である反面、残りは学習が可能であるように設定する。
【0015】
1番目のCNNの一部の畳み込み層は、複数のImageNet学習データで事前学習されて係数が固定されており、1番目のCNNの残りの畳み込み層は、事前学習された係数で学習を始めるが追加の学習が可能である。
【0016】
前記nは2であり、2番目のCNNの一部の畳み込み層は、1番目のCNNとは異なる複数のイメージ学習データで事前学習されて係数が固定されており、2番目のCNNの残りの畳み込み層は、事前学習された係数で学習を始めるが追加の学習が可能である。
【0017】
学習過程で誤差逆伝播法(backpropagation)を使う。
【0018】
RNNで時間概念を担当するフレーム数次元を除いた残りのデータは、全域平均プーリング(global average pooling)を通じて全体フィルタ数の次元に変更して1次元RNNとして動作する。
【発明の効果】
【0019】
本発明の非参照映像基盤の映像品質評価方法によると、従来KPIを使う方式や人が数学的に考案した品質評価アルゴリズムの代わりに学習範囲の設定が可能な複数の畳み込みニューラルネットワークをAI構造設計に反映することによって、映像それ自体のみを要求する真の非参照映像品質モニタリングシステムをAIで実現するとともに、人によるMOS(Mean Opinion Score)値とAIの予測値の相関度を増加させることができ、これに伴い、アンタクト時代の到来につれて急増する映像の需要に合わせて消費者の満足度を大きく増進させることができる。
【0020】
一方、低いMOS値は撮影環境の障害とも相関関係があるが、本発明の方法は映像それ自体のみを活用して映像のMOS値を測定するシステムであるので、今後自律走行システムなどでカメラ撮影環境に障害があるかどうかを高い正確度でリアルタイムに検出するのに役に立ち得、その結果、自律走行システムなどでカメラがホコリやチップなどで遮られている時に、これを正しく把握できないことによってもたらされ得る大きな人身事故を未然に防止することができる。
【図面の簡単な説明】
【0021】
図1】無線通信環境で増加する映像のトラフィック需要を示したグラフである。
図2】本発明の非参照映像基盤の映像品質評価方法の概要を説明するための図面である。
図3】本発明の非参照映像基盤の映像品質評価方法を要約して説明するための模式図である。
図4】本発明の非参照映像基盤の映像品質評価方法を説明するためのフローチャートである。
図5】本発明の非参照映像基盤の映像品質評価方法で映像をフレーム別にデコーディングする過程を例示的に示した図面である。
図6】本発明の非参照映像基盤の映像品質評価方法でCNNの動作を要約して説明するための模式図である。
図7】本発明の非参照映像基盤の映像品質評価方法でRNNの動作を要約して説明するための模式図である。
図8】本発明の非参照映像基盤の映像品質評価方法で回帰層(Regression layer)の動作を要約して説明するための模式図である。
図9】本発明の非参照映像基盤の映像品質評価方法をより具体的に要約して整理した模式図である。
図10】本発明の非参照映像基盤の映像品質評価方法でCNNの学習範囲を設定する例を説明するための図面である。
図11】本発明の非参照映像基盤の映像品質評価方法で複数のCNNを使って過剰適合を防止する例を説明するための図面である。
【発明を実施するための形態】
【0022】
以下、添付した図面を参照して本発明の非参照映像基盤の映像品質評価方法の好ましい実施例について詳細に説明する。
【0023】
広く知られている通り、人工ニューラルネットワークは、人間の主観を介在することなくデータのみで学習されるだけでなく、入力特性として映像のオリジナルそれ自体を使うという点で数十個内外のKPIを使う方式よりさらに高次元的に動作できる。
【0024】
図2は、本発明の非参照映像基盤の映像品質評価方法の概要を説明するための図面である。図2に図示した通り、本発明の方法によると、人工ニューラルネットワークが映像のピクセル値だけで有意な特性を十分に抽出できるように複数の畳み込みニューラルネットワークを使用し、時間の概念を学習できるように循環ニューラルネットワークを使うものの、人工知能学習時の測定(予測)の正確度を高めるために、畳み込みニューラルネットワークと循環ニューラルネットワークが同時に学習されるようにする。
【0025】
また、BPS、明るさ、ブラーなどの数十個のKPIに基づいて動作するアルゴリズムの代わりに、受信映像のピクセル値のみを入力として受けて動作するようにする。
【0026】
もし、KPIを使う場合、使うKPIが20個であれば、アルゴリズムの入力値は(20×映像の長さ)となるが、ピクセル値を使う場合、「チャネル数×映像の横幅×映像の縦幅(高さ)×映像の長さ」が入力値となって、はるかに高次元的でありながらもKPIなどのいかなる追加の情報も要求しない真の非参照映像品質評価アルゴリズムが設計され得る。既存の学習過程の困難な点はAI構造の改善で達成する。
【0027】
図3は、本発明の非参照映像基盤の映像品質評価方法を要約して説明するための模式図である。図3に図示した通り、本発明の方法によると、複数の学習範囲の設定が可能な畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)と循環ニューラルネットワーク(RNN:Recurrent Neural Network)を使うものの、これらを一度に学習させる。映像と人が付けた品質値とが正解として存在する学習データを数十万個以上大量に確保することが難しいため、前記のようにピクセル値を使う方式で動作するAIの学習過程には、過剰適合(over-fitting)が発生する恐れがある。これに伴い、例えば、イメージデータベースであるImageNetにある数百万枚のイメージに対してCNNを事前学習させるものの、ImageNetに対する過剰適合を追加的に防止するために、CNNの一部の畳み込み層(Convolution Layer)に対してのみ選択的に学習が可能であるようにする。
【0028】
これを通じて、ImageNetと映像データの双方に対して過剰適合を防止することができる。また、選択的に学習可能なCNNが複数となるようにImageNet以外の多くのイメージ学習データを使えるようにすることによって、イメージ基盤学習データセットの増加による一般化の効果をさらに増加できる。
【0029】
図4は、本発明の非参照映像基盤の映像品質評価方法を説明するためのフローチャートである。図4に図示した通り、本発明の非参照映像基盤の映像品質評価方法は、例えばCNNの数を2とする時、映像の一フレームに対してRGB値を抽出する(a)過程と、抽出したRGB値を1番目のCNNに与えて出力を獲得(この時、1番目のCNNに存在する畳み込み層のうち一部は学習が不可能であるようにする反面、一部は学習が可能であるように設定する。このように、CNNの一部の畳み込み層のみ学習が可能であるのでイメージに対して事前学習されたCNNがイメージや映像データのいずれか一つにのみ過剰適合(overfitting)となることが防止されながらも、映像データに対してCNNが追加の学習ができるようになる。)する(b)過程と、抽出されたRGB値を2番目のCNNに提供して出力を獲得する(c)過程と、(a)~(c)過程をすべてのフレームに対して繰り返して二つのCNNの出力を併合する(d)過程と、時間次元の学習のために併合された出力値をRNNに伝達した後、時間次元を1に減らしたRNNの出力を獲得する(e)過程と、出力値が1個の次元となるようにRNNの最終出力に回帰アルゴリズムを適用した後、この値をビデオ品質値として予測する(f)過程と、を含んでなり得る。本発明の方法では学習過程で誤差逆伝播法(backpropagation)を使って学習されることになる。
【0030】
以下では、本発明の非参照映像基盤の映像品質評価方法の各過程について具体的に説明する。
【0031】
(a)過程:映像の一フレームに対してRGB値抽出
本発明の非参照映像基盤の映像品質評価方法に係る非参照映像品質評価人工ニューラルネットワークは、受信映像以外に他の情報を要求しない、すなわち受信映像以外の他の情報の必要などの他の先決条件を要求しないことによって、安定的に非参照方式の映像品質の評価を可能にしている。また、受信映像以外の他の情報が不要であるので、情報の計算などの時間が追加的に必要でない長所がある。
【0032】
しかし、機械が映像を理解するためには数学的に映像が表現される必要があるので、映像の各フレームに対してRGB値に変換する過程が要求される。
【0033】
図5は、本発明の非参照映像基盤の映像品質評価方法で映像をフレーム別にデコーディングする過程を例示的に示した図面である。図5に図示した通り、例えば、映像が30fps(frame per second)からなり8秒の再生長さを有していれば、240個のフレームを有する映像となる。また、例えば映像の高さが540ピクセルであり幅が960ピクセルであれば、一つのフレームは3×540×960で表現される行列となり、この時、前記3はRGB色空間を意味する。もし、RGB値が8ビットで表現されるのであれば各RGB値は0~255で表現され得るが、最大値を255とし最小値を0にして正規化する場合、0~1で表現され得、各段階は1/255の解像度を有するようになる。また、映像は「フレーム数×3(R、G、B色空間の数)×高さピクセル数×幅ピクセル数」の行列(形態)で表現されることになる。
【0034】
(b)過程:(a)過程で抽出されたRGB値を1番目のCNN(学習範囲の設定が可能な)に提供して出力を獲得
映像と人が付けた品質値とが正解として存在する学習データを数十万個以上大量に確保するのが難しいため、映像でのみ人工ニューラルネットワークの学習を進めることになる場合、実際の予測時に学習過程だけの性能が発揮されない過剰適合現象が発生することを避けるために、本発明の非参照映像基盤の映像品質評価方法で提案するCNNは、イメージで事前学習されたCNNである。この時、1番目のCNNは、数百万枚のImageNet学習データで事前学習されたCNNであり得る。
【0035】
ここで、CNNのすべての畳み込み層を最初から学習させないことになると、映像と品質値との間に含まれたパターンを学習できない問題がある。反面、CNNのすべての畳み込み層を学習させると、学習用映像データの数が数十万本以下である場合、映像データにのみ過剰適合、すなわちイメージに対して学習した一般的なパターンを喪失し、映像データに存在するパターンにのみ過度に学習される過剰適合現象が発生することによって、かえってCNNを学習させない場合より低い一般化性能を示す可能性がある。したがって、ImageNetと映像データの双方が過剰適合とならないようにするために、CNNを構成する一部の畳み込み層はImageNetから事前学習された係数を固定することによって学習されないようにし、残りの畳み込み層は事前学習された係数で学習を始めるが追加の学習が可能であるように設定する。
【0036】
図6は、本発明の非参照映像基盤の映像品質評価方法でCNNの動作を要約して説明するための模式図である。
【0037】
例えば、CNN構造で広く知られているResnet50の場合、一つのCNNに合計48個の畳み込み層があるが、本発明の方法では、例えば39個の畳み込み層は学習が不可能であるように設定し、9個の畳み込み層のみ学習が可能であるように設定することによって、ImageNetと映像データの双方に過剰適合が発生しないようにすることができる。また、図6に図示した通り、一フレーム当たり3(R、G、B色空間)×高さピクセル数×幅ピクセル数の長さを有するデータが1番目のCNNの入力であるとすれば、1番目のCNNの出力はフィルタ数(CNNの最終畳み込み層のフィルタ数)×高さピクセル数×幅ピクセル数に変わることになる。これはCNNの一般的な入出力データの形態であって、3というRGB色空間の数がCNNのフィルタ数に変わって表現されるためである。
【0038】
(c)過程:(a)過程で抽出されたRGB値を2番CNN(学習範囲の設定が可能な)に提供して出力を獲得
この過程でのCNNを(b)過程のように数百万枚のImageNet学習データで事前学習されたCNNと仮定すれば、ImageNetのみで学習されたパターンに過剰適合となる恐れがあるため、本発明の方法では複数のCNNの使用を提案する。例えば、2番目のCNNは、1番目のCNNとは異なる数万枚以上のイメージ学習データで事前学習されたニューラルネットワークと仮定する。この場合、2番目のCNNもイメージデータと映像データの双方に過剰適合が発生しないようにするために、CNNの一部の畳み込み層は事前学習された係数を固定し、残りの畳み込み層は事前学習された係数で学習を始めるが追加の学習が可能であるように設定する。
【0039】
一フレーム当たり3(R、G、B色空間)×高さピクセル数×幅ピクセル数の長さを有するデータが2番目のCNNの入力であるとすれば、2番目のCNNの出力はフィルタ数(CNNの最終畳み込み層のフィルタ数)×高さピクセル数×幅ピクセル数に変わることになる。
【0040】
(d)過程:(a)~(c)過程をすべてのフレームに対して繰り返し遂行した後、二つのCNNの出力を併合
具体的には、(a)過程~(c)過程を繰り返すと、その出力にフレーム数の次元が追加されることによって、その結果、2個のフレーム数×フィルタ数×高さピクセル数×幅ピクセル数を有するデータが出力される。二つのCNNで使われるイメージの高さピクセル数および幅ピクセル数が同一であると仮定する時、(d)過程を経るとフレーム数×全体フィルタ数(複数のCNNのフィルタ数をすべて足した値)×高さピクセル数×幅ピクセル数を有するデータが出力される。
【0041】
(e)過程:(d)過程の出力値を時間次元の学習のためにRNNに伝達した後、時間次元を1に減らしたRNNの出力獲得
図7は、本発明の非参照映像基盤の映像品質評価方法でRNNの動作を要約して説明するための模式図である。図7に図示した通り、本発明の方法では(d)過程の出力であるフレーム数×全体フィルタ数(複数のCNNのフィルタ数をすべて足した値)×高さピクセル数×幅ピクセル数の長さを有するデータに対して時間概念が学習されるようにするためにRNNを使う。この時、RNNで時間概念を担当するフレーム数次元を除いた残りのデータは、全域平均プーリング(global average pooling)を通じて全体フィルタ数の次元に変更して1次元RNNとして動作できるようにする。以後、RNNがすべてのフレーム数だけのデータの入力を受けた以後の出力である全体フィルタ数の次元を有するデータをRNNの出力として獲得する(RNNを経ながらフレーム数次元のデータが除去される)。
【0042】
(f)過程:RNNの最終出力に出力値が1個の次元となるように回帰アルゴリズムを適用
図8は、本発明の非参照映像基盤の映像品質評価方法で回帰層(Regression layer)の動作を要約して説明するための模式図である。図8に図示した通り、本発明の方法では、(e)過程の出力値である全体フィルタ数で1の次元(MOS値)となるように回帰アルゴリズムを適用する。具体的には、ReLU(Rectified Linear Unit)レイヤを通じて回帰アルゴリズムが適用されるが、他の活性化関数(activation function)等が使われてもよい。
【0043】
もし、ニューラルネットワークが学習が完了したニューラルネットワークであれば、前述した過程を通じて受信映像をニューラルネットワークに入力として与えて映像の品質値であるMOS値を得ることができることになる。
【0044】
図9は、本発明の非参照映像基盤の映像品質評価方法をより具体的に要約して整理した模式図である。図9に図示した通り、本発明の方法では、まず、予めCNNをイメージデータによって学習させて準備するが、この過程で例えば、数百万枚のイメージ学習データが存在するImageNetのデータセットが使われ得る。
【0045】
次に、学習しようとする映像データを準備する。
【0046】
最後に、準備されたイメージによって学習されたCNNの畳み込み層の中で一部を選別し、該当畳み込み層を再学習が可能であるように構成する反面、残りの畳み込み層を再学習が不可能であるようにして、すでに学習された畳み込み層の特性が、学習が進行しても変更されないようにする。
【0047】
図10は、本発明の非参照映像基盤の映像品質評価方法でCNNの学習範囲を設定する例を説明するための図面である。
【0048】
通常、学習しようとする映像データセットよりはイメージデータセットが相対的にさらに大きい数で存在するので、本発明の方法では、映像データセット以外にイメージデータセットも活用することによって学習データが少ない限界を克服しているが、これを転移学習(transfer learning)という。この過程で、図10に図示した通り、イメージデータとイメージデータに対する正解ラベルで予めCNNを学習させた後、一部の畳み込み層のみを選別して映像データを学習する過程で係数が変更されるようにする。もし、映像データセットを学習する過程ですべての畳み込み層が学習可能であるようにする場合、人工ニューラルネットワークが映像データにのみ過剰適合となる恐れが存在するためである。
【0049】
一方、CNNを一個のみ使うことになると、たとえImageNetに過剰適合は発生しないものの、ImageNetにのみ依存的な人工ニューラルネットワークが発生する可能性がある。これを防止するために、本発明の方法では、学習範囲の設定が可能な畳み込みニューラルネットワークを複数に拡張している。図11は、本発明の非参照映像基盤の映像品質評価方法で複数のCNNを使って過剰適合を防止する例を説明するための図面である。
【0050】
図11に図示した通り、本発明の方法によると学習範囲の設定が可能なCNNが複数で存在し、各CNNは互いに異なるイメージデータセットに基づいて事前学習された姿を示す。これを通じて、本発明の方法に係る人工ニューラルネットワークはより一層一般化が可能であり、多様なイメージデータセットのすべてのパターンを活用できることになる。
【0051】
以上、添付した図面を参照して本発明の非参照映像基盤の映像品質評価方法の好ましい実施例について詳細に説明したが、これは例示に過ぎず、本発明の技術的思想の範疇内で多様な変形と変更が可能であろう。したがって、本発明の権利範囲は、以下の請求の範囲の記載によって定められるべきである。例えばCNNを3個またはそれ以上で構成してもよい。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11