特許7239116 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 三星電子株式会社の特許一覧 ▶ ソウル　ナショナル　ユニヴァーシティ　アール　アンド　ディービー　ファウンデーションの特許一覧

特許7239116映像復元方法及び装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-03-06

(45)【発行日】2023-03-14

(54)【発明の名称】映像復元方法及び装置

(51)【国際特許分類】

G06T 5/00 20060101AFI20230307BHJP

G06N 3/08 20230101ALI20230307BHJP

G06T 1/40 20060101ALI20230307BHJP

【ＦＩ】

G06T5/00 700

G06N3/08

G06T1/40

【請求項の数】 24

(21)【出願番号】P 2021205680

(22)【出願日】2021-12-20

(65)【公開番号】P2022114440

(43)【公開日】2022-08-05

【審査請求日】2021-12-20

(31)【優先権主張番号】10-2021-0010638

(32)【優先日】2021-01-26

(33)【優先権主張国・地域又は機関】KR

(31)【優先権主張番号】10-2021-0034480

(32)【優先日】2021-03-17

(33)【優先権主張国・地域又は機関】KR

【新規性喪失の例外の表示】特許法第３０条第２項適用ｈｔｔｐｓ：／／ａｒｘｉｖ．ｏｒｇ／ａｂｓ／２０１２．１１２２５にて「ＳｅａｒｃｈｉｎｇｆｏｒＣｏｎｔｒｏｌｌａｂｌｅＩｍａｇｅＲｅｓｔｏｒａｔｉｏｎＮｅｔｗｏｒｋｓ」として公開

(73)【特許権者】

【識別番号】390019839

【氏名又は名称】三星電子株式会社

【氏名又は名称原語表記】ＳａｍｓｕｎｇＥｌｅｃｔｒｏｎｉｃｓＣｏ．，Ｌｔｄ．

【住所又は居所原語表記】１２９，Ｓａｍｓｕｎｇ－ｒｏ，Ｙｅｏｎｇｔｏｎｇ－ｇｕ，Ｓｕｗｏｎ－ｓｉ，Ｇｙｅｏｎｇｇｉ－ｄｏ，ＲｅｐｕｂｌｉｃｏｆＫｏｒｅａ

(73)【特許権者】

【識別番号】521081975

【氏名又は名称】ソウルナショナルユニヴァーシティアールアンドディービーファウンデーション

(74)【代理人】

【識別番号】100107766

【弁理士】

【氏名又は名称】伊東忠重

(74)【代理人】

【識別番号】100070150

【弁理士】

【氏名又は名称】伊東忠彦

(74)【代理人】

【識別番号】100135079

【弁理士】

【氏名又は名称】宮崎修

(72)【発明者】

【氏名】權基南

(72)【発明者】

【氏名】金熙元

(72)【発明者】

【氏名】李 ▲きょん▼武

(72)【発明者】

【氏名】李炯旭

【審査官】板垣有紀

(56)【参考文献】

【文献】特開２０２０－０９５４０７（ＪＰ，Ａ）

【文献】国際公開第２０２０／１６５１９６（ＷＯ，Ａ１）

【文献】成冨志優他，ＣｏｎｄｉｔｉｏｎａｌＧＡＮによる食事写真の属性操作，第１０回データ工学と情報マネジメントに関するフォーラム（第１６回日本データベース学会年次大会）［Ｏｎｌｉｎｅ］，日本，電子情報通信学会データ工学研究専門委員会日本データベース学会情報処理学会データベースシステム研究会，2018年03月06日

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｔ５／００

Ｇ０６Ｎ３／０８

Ｇ０６Ｔ１／４０

(57)【特許請求の範囲】

【請求項1】

入力映像、及び、複数の候補映像効果のうち第１映像効果を指示する第１タスクベクトルを受信するステップと、
ソースニューラルネットワークのタスク－非依存アーキテクチャに基づいて、前記入力映像から前記複数の候補映像効果が共有している共通特徴を抽出するステップと、
前記ソースニューラルネットワークのタスク－特化アーキテクチャ及び前記第１タスクベクトルに基づいて、前記共通特徴を前記第１映像効果に対応する第１復元映像に復元するステップと、
を含む、映像復元方法。

【請求項2】

前記復元するステップは、
前記タスク－特化アーキテクチャに前記第１タスクベクトルを適用して第１タスク－特化ネットワークを決定するステップと、
前記第１タスク－特化ネットワークに基づいて、前記共通特徴を前記第１復元映像に復元するステップと、
を含む、請求項１に記載の映像復元方法。

【請求項3】

前記復元するステップは、
前記第１タスク－特化ネットワークに基づいて、前記共通特徴から前記第１映像効果に特化した第１特化特徴を抽出するステップと、
前記第１タスク－特化ネットワークに基づいて、前記第１特化特徴を前記第１映像効果に対応する第１復元映像に復元するステップと、
を含む、請求項２に記載の映像復元方法。

【請求項4】

前記第１タスク－特化ネットワークを決定するステップは、
アーキテクチャ制御ネットワークを用いて、前記第１タスクベクトルに対応する第１チャネル選択情報を生成するステップと、
前記第１チャネル選択情報に基づいて、前記タスク－特化アーキテクチャの少なくとも一部のチャネルを除去し前記第１タスク－特化ネットワークを決定するステップと、
を含む、請求項２に記載の映像復元方法。

【請求項5】

前記第１チャネル選択情報を生成するステップは、
前記アーキテクチャ制御ネットワークを介して、前記第１タスクベクトルを処理して第１実数ベクトルを生成するステップと、
変換関数を介して前記第１実数ベクトルの各実数エレメントを真又は偽りに変換して、前記第１チャネル選択情報を生成するステップと、
を含む、請求項４に記載の映像復元方法。

【請求項6】

前記抽出するステップは、
前記タスク－非依存アーキテクチャに共有パラメータを適用して、タスク－非依存ネットワークを決定するステップと、
前記タスク－非依存ネットワークに基づいて、前記入力映像から前記共通特徴を抽出するステップと、
を含む、請求項１に記載の映像復元方法。

【請求項7】

前記複数の候補映像効果のうち第２映像効果に対応する第２タスクベクトルを受信するステップと、
前記タスク－特化アーキテクチャ及び前記第２タスクベクトルに基づいて、前記共通特徴を前記第２映像効果に対応する第２復元映像に復元するステップと、
をさらに含み、
前記共通特徴は、前記第２復元映像の復元のためにリユースされる、
請求項１に記載の映像復元方法。

【請求項8】

前記第１タスクベクトルは、前記第１映像効果の各効果タイプの調整レベルを含む、
請求項１に記載の映像復元方法。

【請求項9】

第１トレーニング入力映像、複数の候補映像効果のうち第１映像効果を指示する第１タスクベクトル、及び、前記第１映像効果による第１トレーニング目標映像を含む第１トレーニングデータセット、を受信するステップと、
ソースニューラルネットワークのタスク－非依存アーキテクチャに基づいて、前記第１トレーニング入力映像から前記複数の候補映像効果が共有している共通特徴を抽出するステップと、
前記ソースニューラルネットワークのタスク－特化アーキテクチャ及び前記第１タスクベクトルに基づいて、前記共通特徴を第１復元映像に復元するステップと、
前記第１トレーニング目標映像と前記第１復元映像との間の差、及び、前記共通特徴の抽出及び前記第１復元映像の復元に関する演算量に基づいて、前記ソースニューラルネットワークを更新するステップと、
を含む、トレーニング方法。

【請求項10】

前記ソースニューラルネットワークを更新するステップは、
前記タスク－非依存アーキテクチャに含まれたレイヤの数が増加し、前記演算量が減少するように前記ソースニューラルネットワークを更新するステップ、を含む、
請求項９に記載のトレーニング方法。

【請求項11】

前記第１タスクベクトルは、前記第１映像効果の各効果タイプの調整レベルを含み、
前記調整レベルの値は、前記第１トレーニング入力映像の入力効果レベルと前記第１トレーニング目標映像の目標効果レベルとの間の差によって決定される、
請求項９に記載のトレーニング方法。

【請求項12】

第２トレーニング入力映像、第２映像効果を指示する第２タスクベクトル、及び、前記第２映像効果による第２トレーニング目標映像を含む第２トレーニングセットが存在し、前記第２トレーニング入力映像の入力効果レベルと前記第２トレーニング目標映像の目標効果レベルとの間の差が、前記第１トレーニング入力映像の入力効果レベルと前記第１トレーニング目標映像の目標効果レベルとの間の差と同一である場合、前記第２タスクベクトルは前記第１タスクベクトルと同じ値を有する、
請求項１１に記載のトレーニング方法。

【請求項13】

コンピュータで読み出し可能な記憶媒体に格納されたコンピュータプログラムであって、
コンピュータで実行可能な複数の命令を含み、
実行されると、前記コンピュータのハードウェアに、請求項１～請求項１２のいずれか１項に記載の方法を実施させる、
コンピュータプログラム。

【請求項14】

入力映像を生成するカメラと、
プロセッサであり、
前記入力映像、及び、複数の候補映像効果のうち第１映像効果を指示する第１タスクベクトルを受信し、
ソースニューラルネットワークのタスク－非依存アーキテクチャに基づいて、前記入力映像から前記複数の候補映像効果が共有している共通特徴を抽出し、
前記ソースニューラルネットワークのタスク－特化アーキテクチャ及び前記第１タスクベクトルに基づいて、前記共通特徴を前記第１映像効果に対応する第１復元映像に復元する、プロセッサと、
を含む、電子装置。

【請求項15】

前記プロセッサは、
前記タスク－特化アーキテクチャに前記第１タスクベクトルを適用して第１タスク－特化ネットワークを決定し、
前記第１タスク－特化ネットワークに基づいて、前記共通特徴を前記第１復元映像に復元する、
請求項１４に記載の電子装置。

【請求項16】

前記プロセッサは、
前記第１タスク－特化ネットワークに基づいて、前記共通特徴から前記第１映像効果に特化した第１特化特徴を抽出し、
前記第１タスク－特化ネットワークに基づいて、前記第１特化特徴を前記第１映像効果に対応する第１復元映像に復元する、
請求項１５に記載の電子装置。

【請求項17】

前記プロセッサは、
アーキテクチャ制御ネットワークを用いて前記第１タスクベクトルに対応する第１チャネル選択情報を生成し、
前記第１チャネル選択情報に基づいて、前記タスク－特化アーキテクチャの少なくとも一部のチャネルを除去して前記第１タスク－特化ネットワークを決定する、
請求項１５に記載の電子装置。

【請求項18】

前記プロセッサは、
前記アーキテクチャ制御ネットワークを介して、前記第１タスクベクトルを処理して第１実数ベクトルを生成し、
変換関数を介して前記第１実数ベクトルの各実数エレメントを真又は偽りに変換して、前記第１チャネル選択情報を生成する、
請求項１７に記載の電子装置。

【請求項19】

前記プロセッサは、
前記タスク－非依存アーキテクチャに共有パラメータを適用して、タスク－非依存ネットワークを決定し、
前記タスク－非依存ネットワークに基づいて、前記入力映像から前記共通特徴を抽出する、
請求項１４に記載の電子装置。

【請求項20】

前記プロセッサは、
前記複数の候補映像効果のうち第２映像効果に対応する第２タスクベクトルを受信し、
前記タスク－特化アーキテクチャ及び前記第２タスクベクトルに基づいて、前記共通特徴を前記第２映像効果に対応する第２復元映像に復元し、
前記共通特徴は、前記第２復元映像の復元のためにリユースされる、
請求項１４に記載の電子装置。

【請求項21】

プロセッサであり、
入力映像、及び、候補映像効果のうち第１映像効果を指示する第１タスクベクトルを受信し、
タスク－非依存アーキテクチャを用いて、前記入力映像から前記候補映像効果が共有している共通特徴を抽出し、
前記第１タスクベクトルに基づいて、タスク－特化アーキテクチャの少なくとも１つのチャネルを除去して、第１タスク－特化ネットワークを生成し、
前記第１タスク－特化ネットワークを用いて、前記共通特徴から前記第１映像効果に特化した第１特化特徴を抽出し、
前記第１タスク－特化ネットワークを用いて、前記第１特化特徴を第１復元映像に復元する、プロセッサ、
を含む、電子装置。

【請求項22】

前記プロセッサは、
前記タスク－特化アーキテクチャに共有パラメータを適用して、前記第１タスク－特化ネットワークを生成する、
請求項２１に記載の電子装置。

【請求項23】

前記プロセッサは、
アーキテクチャ制御ネットワークを介して、前記第１タスクベクトルを処理して第１実数ベクトルを生成し、
変換関数を介して前記第１実数ベクトルの実数エレメントの各実数エレメントを変換し、前記タスク－特化アーキテクチャの前記少なくとも１つのチャネルを除去するために用いられる第１チャネル選択情報を生成する、
請求項２１に記載の電子装置。

【請求項24】

前記プロセッサは、
前記候補映像効果のうち第２映像効果を指示する第２タスクベクトルを受信し、
前記第２タスクベクトルに基づいて、前記タスク－特化アーキテクチャの少なくとも１つのチャネルを除去して第２タスク－特化ネットワークを生成し、
前記第２タスク－特化ネットワークを用いて、前記共通特徴から前記第２映像効果に特化した第２特化特徴を抽出し、
前記第２タスク－特化ネットワークを用いて、前記第２特化特徴を第２復元映像に復元する、
請求項２１に記載の電子装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、映像復元方法及び装置に関する。

【背景技術】

【0002】

映像復元は、劣化状態の映像を、向上した画質の映像に復元する技術である。映像復元のためにディープラーニング基盤のニューラルネットワークが用いられる。ニューラルネットワークは、ディープラーニングに基づいてトレーニングされた後、非線形関係にある入力データ及び出力データを互いにマッピングすることで目的に適する推論（ｉｎｆｅｒｅｎｃｅ）を実行することができる。このようなマッピングを生成するトレーニングされた能力は、ニューラルネットワークの学習能力といえる。しかも、映像復元のような特化した目的のためにトレーニングされたニューラルネットワークは、例えば、トレーニングしていない入力パターンに対して比較的正確な出力を生成する一般化能力を有することができる。

【発明の概要】

【発明が解決しようとする課題】

【0003】

本発明の目的は、映像復元方法及び装置を提供することにある。

【課題を解決するための手段】

【0004】

一実施形態によれば、映像復元方法は、入力映像、及び、複数の候補映像効果のうち第１映像効果を指示する第１タスクベクトルを受信するステップと、ソースニューラルネットワークのタスク－非依存アーキテクチャに基づいて、前記入力映像から前記複数の候補映像効果が共有している共通特徴を抽出するステップと、前記ソースニューラルネットワークのタスク－特化アーキテクチャ及び前記第１タスクベクトルに基づいて、前記共通特徴を前記第１映像効果に対応する第１復元映像に復元するステップと、を含む。

【0005】

一実施形態によれば、第１トレーニング入力映像、複数の候補映像効果のうち第１映像効果を指示する第１タスクベクトル、及び、前記第１映像効果による第１トレーニング目標映像を含む第１トレーニングデータセットを受信するステップと、ソースニューラルネットワークのタスク－非依存アーキテクチャに基づいて、前記第１トレーニング入力映像から前記複数の候補映像効果が共有している共通特徴を抽出するステップと、前記ソースニューラルネットワークのタスク－特化アーキテクチャ及び前記第１タスクベクトルに基づいて、前記共通特徴を第１復元映像に復元するステップと、前記第１トレーニング目標映像と前記第１復元映像との間の差、及び、前記共通特徴の抽出及び前記第１復元映像の復元に関する演算量に基づいて、前記ソースニューラルネットワークを更新するステップと、を含む。

【0006】

一実施形態によれば、電子装置は、入力映像を生成するカメラと、前記入力映像、及び、複数の候補映像効果のうち第１映像効果を指示する第１タスクベクトルを受信し、ソースニューラルネットワークのタスク－非依存アーキテクチャに基づいて、前記入力映像から前記複数の候補映像効果が共有している共通特徴を抽出し、前記ソースニューラルネットワークのタスク－特化アーキテクチャ及び前記第１タスクベクトルに基づいて、前記共通特徴を前記第１映像効果に対応する第１復元映像に復元する、プロセッサと、を含む。

【0007】

一実施形態によれば、電子装置は、入力映像、及び、候補映像効果のうち第１映像効果を指示する第１タスクベクトルを受信し、タスク－非依存アーキテクチャを用いて前記入力映像から前記候補映像効果が共有している共通特徴を抽出し、前記第１タスクベクトルに基づいて、タスク－特化アーキテクチャの少なくとも１つのチャネルを除去して第１タスク－特化ネットワークを生成し、前記第１タスク－特化ネットワークを用いて、前記共通特徴から前記第１映像効果に特化した第１特化特徴を抽出し、前記第１タスク－特化ネットワークを用いて前記第１特化特徴を第１復元映像に復元する。

【発明の効果】

【0008】

本発明によれば、映像復元方法及び装置を提供することができる。

【図面の簡単な説明】

【0009】

【図1】一実施形態に係る映像復元装置の概略的な動作を示す図である。

【図2】一実施形態に係るソースニューラルネットワーク及び変形ネットワークを示す図である。

【図3】一実施形態に係るタスク－特化アーキテクチャ及び制御アーキテクチャを示す図である。

【図4】一実施形態に係る第１タスクベクトルに基づいた映像復元動作を示したフローチャートである。

【図5】一実施形態に係るトレーニング装置を示すブロック図である。

【図6】一実施形態に係るソースニューラルネットワークのアーキテクチャを示す図である。

【図7】一実施形態に係るチャネル選択動作を示す図である。

【図8】一実施形態に係るアーキテクチャ制御ネットワークの構成を示す図である。

【図9】絶対的な目標を有するトレーニングデータセットを示す図である。

【図10】一実施形態に係る相対的目標を有するトレーニングデータセットを示す図である。

【図11】一実施形態に係るトレーニングデータセットの構成を示す図である。

【図12】一実施形態に係る第１トレーニングデータセットに基づいたトレーニング動作を示したフローチャートである。

【図13】一実施形態に係る映像復元装置を示すブロック図である。

【図14】一実施形態に係る電子装置を示すブロック図である。

【発明を実施するための形態】

【0010】

本明細書で開示する特定の構造的又は機能的な説明は、単に実施形態を説明することを目的として例示したものであり、実施形態は、様々な異なる形態で実施され、本発明は、本明細書で説明した実施形態に限定されるものではなく、本発明の範囲は、実施形態で説明した技術的な思想に含まれている変更、均等物、または代替物を含む。

【0011】

第１又は第２などの用語を複数の構成要素を説明するために用いることがあるが、このような用語は、１つの構成要素を他の構成要素から区別する目的としてのみ解釈されなければならない。例えば、第１構成要素は第２構成要素と命名することができ、同様に、第２構成要素は第１構成要素にも命名することができる。

【0012】

いずれかの構成要素が他の構成要素に「連結」されているか「接続」されていると言及されたときには、その他の構成要素に直接的に連結されているか又は接続されているが、中間に他の構成要素が存在し得るものと理解されなければならない。

【0013】

単数の表現は、文脈上、明白に異なる意味をもたない限り、複数の表現を含む。本明細書において、「含む」又は「有する」等の用語は、明細書上に記載した特徴、数字、ステップ、動作、構成要素、部品、又は、これらを組み合わせたものが存在することを示すものであって、１つ又はそれ以上の他の特徴や数字、ステップ、動作、構成要素、部品、又は、これを組み合わせたものなどの存在又は付加の可能性を予め排除しないものとして理解しなければならない。

【0014】

異なるように定義さがれない限り、技術的又は科学的な用語を含む、ここにおいて使用される全ての用語は、本実施形態が属する技術分野で通常の知識を有する者によって一般的に理解されるものと同じ意味を有する。一般的に用いられる予め定義された用語は、関連技術の文脈上で有する意味と一致する意味を有するものと解釈すべきであって、本明細書で明白に定義しない限り、理想的又は過度に形式的な意味として解釈されることはない。

【0015】

以下、添付する図面を参照しながら実施形態を詳細に説明する。添付図面を参照して説明するが、図面符号に関係なく、同一の構成要素には同一の参照符号を付与し、これに対する重複する説明は省略することにする。

【0016】

図１は、一実施形態に係る映像復元装置の概略的な動作を示す。図１を参照すると、映像復元装置１００は、入力映像１０１及び様々なタスクベクトル１０２を受信し、様々な復元映像１０３を出力する。様々なタスクベクトル１０２は、様々な映像効果（ｉｍａｇｅｅｆｆｅｃｔｓ）に対応する。様々なタスクベクトル１０２は、１つ以上のディメンション（ｄｉｍｅｎｓｉｏｎ）を有する。各ディメンションは効果タイプを示し、各ディメンションの値は調整レベルを示す。調整レベルは、タスクベクトル１０２によって調整される効果レベルの大きさを示す。劣化の観点で、効果タイプ及び効果レベルは、劣化タイプ及び劣化レベルと称する。様々なタスクベクトル１０２は、映像復元装置１００の設計者及び／又は運営者によって予め設定され、あるいは、映像復元装置１００の使用過程においてユーザに応じて設定されてもよい。

【0017】

様々な映像効果の効果タイプは、ノイズ効果、ブラー効果、ＪＰＥＧ圧縮効果、ホワイトバランス効果、露出効果、対比効果、レンズ歪み効果、及び、これらの少なくとも１つの組み合わせを含む。例えば、３－ディメンションのタスクベクトルの第１ディメンションはノイズ効果を示し、第１ディメンションの値はノイズレベルを示す。第２ディメンションはブラー効果を示し、第２ディメンションの値はブラーレベルを示す。第３ディメンションはＪＰＥＧ圧縮（ＪｏｉｎｔＰｈｏｔｏｇｒａｐｈｉｃＥｘｐｅｒｔｓＧｒｏｕｐｃｏｍｐｒｅｓｓｉｏｎ）効果を示し、第３ディメンションの値はＪＰＥＧ圧縮レベルを示す。但し、これは１つの例示に過ぎず、タスクベクトルは、他のディメンション、他の効果タイプ、及び／又は、他の効果レベルを有し得る。

【0018】

映像復元は、映像効果の適用を含む。きれいな映像を優れた品質の映像であると仮定すれば、映像効果の適用により、映像品質は向上されてもよく、劣化されてもよい。例えば、映像品質は、ノイズ除去効果を介して向上されてもよく、ノイズ追加効果を介して劣化されてもよい。映像復元は、このような映像品質の向上及び／又は劣化を誘発し得る。

【0019】

映像復元装置１００は、様々なタスクベクトル１０２によって指示される様々な映像効果を入力映像１０１に適用して、様々な復元映像１０３を生成する。映像復元装置１００は、ソースニューラルネットワーク１１０に様々なタスクベクトル１０２を適用して変形ネットワーク１２０を決定し、変形ネットワーク１２０を用いて様々な復元映像１０３を生成する。映像復元装置１００は、ソースニューラルネットワーク１１０及び変形ネットワーク１２０を用いて映像復元に必要な演算を最小化することができる。

【0020】

ソースニューラルネットワーク１１０及び変形ネットワーク１２０は、複数のレイヤを含むディープニューラルネットワーク（ｄｅｅｐｎｅｕｒａｌｎｅｔｗｏｒｋ、ＤＮＮ）を含む。複数のレイヤは、入力層、少なくとも１つの隠れ層、及び、出力層を含む。

【0021】

ディープニューラルネットワークは、完全接続ネットワーク（ｆｕｌｌｙｃｏｎｎｅｃｔｅｄｎｅｔｗｏｒｋ、ＦＣＮ）、畳み込みニューラルネットワーク（ｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋ、ＣＮＮ）、及び、リカレントニューラルネットワーク（ｒｅｃｕｒｒｅｎｔｎｅｕｒａｌｎｅｔｗｏｒｋ、ＲＮＮ）のうち少なくとも１つを含んでもよい。例えば、ニューラルネットワーク内の複数のレイヤのうち少なくとも一部は、ＣＮＮに該当し、他の一部はＦＣＮに該当する。この場合、ＣＮＮは畳み込みレイヤと称してもよく、ＦＣＮを完全接続レイヤと称してもよい。

【0022】

ＣＮＮの場合、各レイヤに入力されるデータは入力特徴マップと称してもよく、各レイヤから出力されるデータは出力特徴マップと称してもよい。入力特徴マップ及び出力特徴マップは、活性化データ（ａｃｔｉｖａｔｉｏｎｄａｔａ）と称してもよい。畳み込みレイヤが入力層に該当する場合、入力層の入力特徴マップは入力映像であってもよい。入力特徴マップとウェイトカーネル（ｗｅｉｇｈｔｋｅｒｎｅｌ）との間の畳み込み演算を介して出力特徴マップが生成される。入力特徴マップ、出力特徴マップ、及び、ウェイトカーネルは、それぞれテンソル（ｔｅｎｓｏｒ）単位で区分される。

【0023】

ニューラルネットワークは、ディープラーニングに基づいてトレーニングされた後、非線形関係にある入力データ及び出力データを互いにマッピングすることで、トレーニング目的に適する推論（ｉｎｆｅｒｅｎｃｅ）を実行することができる。ディープラーニングは、ビッグデータセットから映像又は音声認識のような問題を解決するための機械学習方式である。ディープラーニングは、準備されたトレーニングデータを用いてニューラルネットワークをトレーニングし、エネルギーの最小化された地点に行く最適化問題解説過程として理解される。

【0024】

ディープラーニングの教師あり（ｓｕｐｅｒｖｉｓｅｄ）学習又は教師無し（ｕｎｓｕｐｅｒｖｉｓｅｄ）学習を介して、ニューラルネットワークの構造、あるいはモデルに対応するウェイトが求められ、このようなウェイトを介して入力データ及び出力データが互いにマッピングされる。ニューラルネットワークの幅と深さが十分に大きければ、任意の関数を実現できる程の容量を有し得る。ニューラルネットワークが適切なトレーニング過程を介して十分に多い量のトレーニングデータを学習すれば、最適な性能を達成することができる。

【0025】

以下では、ニューラルネットワークが「予め」トレーニングされたものとして表現されるが、ここで「予め」とは、ニューラルネットワークが「開始」される前を示す。ニューラルネットワークが「開始」されたということは、ニューラルネットワークが推論のための準備ができたことを意味する。例えば、ニューラルネットワークが「開始」されたことは、ニューラルネットワークがメモリにロードされたこと、あるいは、ニューラルネットワークがメモリにロードされた後にニューラルネットワークに推論のための入力データが入力されたことを含む。

【0026】

ソースニューラルネットワーク１１０は、タスク－非依存アーキテクチャ（ｔａｓｋ－ａｇｎｏｓｔｉｃａｒｃｈｉｔｅｃｔｕｒｅ）、タスク－特化アーキテクチャ（ｔａｓｋ－ｓｐｅｃｉｆｉｃａｒｃｈｉｔｅｃｔｕｒｅ）、及び、制御アーキテクチャ（ｃｏｎｔｒｏｌａｒｃｈｉｔｅｃｔｕｒｅ）を含む。タスク－非依存アーキテクチャは、入力映像１０１から各タスクに共通して用いられる特徴を抽出する。このような特徴は、共通特徴と呼ぶことができる。タスク－特化アーキテクチャは、共通特徴に基づいて各タスクに特化した特徴を抽出する。このような特徴は、特化特徴と呼ぶことができる。タスク－特化アーキテクチャは、特化特徴を復元映像に復元する。制御アーキテクチャは、各タスクベクトル及びタスク－特化アーキテクチャに基づいて各タスク－特化ネットワークを決定する。図２及び図３を参照して、ソースニューラルネットワーク１１０及び変形ネットワーク１２０をさらに説明する。

【0027】

図２は、一実施形態に係るソースニューラルネットワーク及び変形ネットワークを示している。図２を参照すると、ソースニューラルネットワーク２００は、タスク－非依存アーキテクチャ２０１及びタスク－特化アーキテクチャ２０２を含む。ソースニューラルネットワーク２２０に第１タスクベクトル２０３が適用されて、第１変形ネットワーク２１０が生成され、第２タスクベクトル２０４が適用されて、第２変形ネットワーク２２０が生成され得る。追加的なタスクベクトルに基づいて追加的な変形ネットワークが生成され、本発明は、追加的なタスクベクトル及び追加的な変形ネットワークに適用されてもよい。

【0028】

第１変形ネットワーク２１０は、入力映像２０５に基づいて第１復元映像２０６を復元する。第１変形ネットワーク２１０は、タスク－非依存ネットワーク２１１及び第１タスク－特化ネットワーク２１２を含む。タスク－非依存ネットワーク２１１は、タスク－非依存アーキテクチャ２０１に共有パラメータを適用して決定され、第１タスク－特化ネットワーク２１２は、タスク－特化アーキテクチャ２０２に第１タスクベクトル２０３を適用して決定される。例えば、第１タスクベクトル２０３を用いてタスク－特化アーキテクチャ２０２に関するチャネルプルーニング（ｃｈａｎｎｅｌｐｒｕｎｉｎｇ）を行って、第１タスク－特化ネットワーク２１２が決定されてもよい。このようなプルーニングを介して演算が縮小され得る。タスク－非依存ネットワーク２１１は、入力映像２０５から共通特徴を抽出し、第１タスク－特化ネットワーク２１２は、共通特徴から第１タスクベクトル２０３により指示される第１映像効果に特化した第１特化特徴を抽出することができる。第１タスク－特化ネットワーク２１２は、第１特化特徴を第１復元映像２０６に復元することができる。

【0029】

第２変形ネットワーク２２０は、入力映像２０５に基づいて第２復元映像２０７を復元する。第２変形ネットワーク２２０は、タスク－非依存ネットワーク２２１及び第２タスク－特化ネットワーク２２２を含む。タスク－非依存ネットワーク２１１とタスク－非依存ネットワーク２２１とは同一であってもよい。タスク－非依存ネットワーク２２１は、タスク－非依存アーキテクチャ２０１に共有パラメータを適用して決定され、タスク－非依存ネットワーク２２１は、入力映像２０５から共通特徴を抽出することができる。この共通特徴は、タスク－非依存ネットワーク２１１の出力と同一であってもよい。従って、タスク－非依存ネットワーク２１１の出力が第２復元映像２０７の復元のためにリユースされ、タスク－非依存ネットワーク２２１の決定のための動作、及び、タスク－非依存ネットワーク２２１の特徴抽出の動作が省略されてもよい。第２タスク－特化ネットワーク２２２は、タスク－特化アーキテクチャ２０２に第２タスクベクトル２０４を適用して決定されてもよい。第２タスク－特化ネットワーク２２２は、共通特徴から第２タスクベクトル２０４により指示される第２映像効果に特化した第２特化特徴を抽出し、第２特化特徴を第２復元映像２０７に復元することができる。

【0030】

図３は、一実施形態に係るタスク－特化アーキテクチャ及び制御アーキテクチャを示している。図３を参照すると、タスク－特化アーキテクチャ３１０は、チャネル選択器３１１～３１３、及び、複数のレイヤ３１５～３１７を含み、制御アーキテクチャ３２０は、複数のアーキテクチャ制御ネットワーク３２１～３２３を含む。複数のアーキテクチャ制御ネットワーク３２１～３２３それぞれは、少なくとも１つの畳み込みレイヤ及び少なくとも１つの活性化関数を含む。例えば、畳み込みレイヤは、１×１畳み込みレイヤであってもよく、活性化関数はＲｅＬＵ関数であってもよい。但し、これは１つの例示に過ぎず、１×１以外の他のディメンションの畳み込みレイヤ、及び／又は、シグモイド（Ｓｉｇｍｏｉｄ）、ハイパボリックタンジェント（ｈｙｐｅｒｂｏｌｉｃｔａｎｇｅｎｔ、ｔａｎｈ）のような他の非線型関数が用いられてもよい。チャネル選択器３１１～３１３及びアーキテクチャ制御ネットワーク３２１～３２３の対は、複数のレイヤ３１５～３１７に対応する。

【0031】

映像復元装置は、タスクベクトル３０１をタスク－特化アーキテクチャ３１０に適用してタスク－特化ネットワークを決定することができる。

【0032】

映像復元装置は、アーキテクチャ制御ネットワーク３２１～３２３及びチャネル選択器３１１～３１３を用いて、複数のレイヤ３１５～３１７それぞれに関するチャネル選択情報を生成する。アーキテクチャ制御ネットワーク３２１～３２３それぞれは、タスクベクトルに基づいて、タスクに対するチャネル重要度（又は、チャネルに対するタスク選好度）を決定する。チャネル重要度（又は、タスク選好度）は、実数ベクトルの形式を有する。アーキテクチャ制御ネットワーク３２１～３２３によって出力されたチャネル重要度それぞれは、互いに異なる値を有してもよい。チャネル選択器３１１～３１３のそれぞれは、チャネル重要度に基づいてチャネル選択情報を生成する。チャネル選択器３１１～３１３のそれぞれは、チャネル重要度を示す実数ベクトルの各実数エレメントを真（ｔｒｕｅ）又は偽り（ｆａｌｓｅ）に変換して、チャネル選択情報を生成してもよい。チャネル選択情報は、２進ベクトルの形式を有してもよい。

【0033】

映像復元装置は、複数のレイヤ３１５～３１７のそれぞれに関するチャネル選択情報に基づいて、タスクベクトル３０１に対応するタスク－特化ネットワークを決定する。映像復元装置は、チャネル選択情報に基づいて複数のレイヤ３１５～３１７のそれぞれにチャネルプルーニングを適用して、タスク－特化ネットワークを決定する。例えば、第１レイヤ３１５がｃ個の出力チャネルを有する場合、第１チャネル選択器３１１によって生成されたチャネル選択情報を介して、ｃ個の出力チャネルのうち少なくとも一部が除去されてもよい。チャネル選択情報の真に対応するチャネルは保持され、偽りに対応するチャネルは除去される。チャネルの除去は、チャネルのスキップ（ｓｋｉｐ）を意味する。例えば、ウェイトカーネルをそれぞれ出力チャネルに対応するウェイトテンソルに区分される場合、映像復元装置は、除去対象チャネルのウェイトテンソルをレジスタでロードしないまま、残りのチャネルのウェイトテンソルで該当レイヤの畳み込み演算を行ってもよい。このように特定タスクベクトル３０１によるチャネルスキップを介して、該当タスクベクトル３０１に特化されたタスク－特化ネットワークを実現することができる。

【0034】

図４は、一実施形態に係る第１タスクベクトルに基づいた映像復元動作を示したフローチャートである。図４に示すステップＳ４１０～Ｓ４３０は、順次実行され、あるいは非順次に実行されてもよい。例えば、ステップＳ４１０～Ｓ４３０の順序が変更され、かつ／あるいは、ステップＳ４１０～Ｓ４３０の少なくとも２つが並列に実行されてもよい。ステップＳ４１０～Ｓ４３０は、映像復元装置１００、１３００、及び／又は、電子装置１４００の少なくとも１つの構成要素（例えば、プロセッサ１３１０、１４１０）によって実行されてもよい。

【0035】

図４を参照すると、ステップＳ４１０において、入力映像、及び、複数の候補映像効果のうち第１映像効果を指示する第１タスクベクトルが受信される。ステップＳ４２０において、ソースニューラルネットワークのタスク－非依存アーキテクチャに基づいて、入力映像から複数の候補映像効果が共有している共通特徴が抽出される。ステップＳ４２０で、タスク－非依存アーキテクチャに共有パラメータを適用してタスク－非依存ネットワークが決定され、タスク－非依存ネットワークに基づいて入力映像から共通特徴を抽出することができる。

【0036】

ステップＳ４３０において、ソースニューラルネットワークのタスク－特化アーキテクチャ及び第１タスクベクトルに基づいて、共通特徴が第１映像効果に対応する第１復元映像に復元される。ステップＳ４３０で、タスク－特化アーキテクチャに第１タスクベクトルを適用して第１タスク－特化ネットワークが決定され、第１タスク－特化ネットワークに基づいて、共通特徴が第１復元映像に復元され得る。ここで、第１タスク－特化ネットワークに基づいて、共通特徴から第１映像効果に特化された第１特化特徴が抽出され、第１タスク－特化ネットワークに基づいて、第１特化特徴が第１映像効果に対応する第１復元映像に復元され得る。

【0037】

また、アーキテクチャ制御ネットワークを用いて第１タスクベクトルに対応する第１チャネル選択情報が生成され、第１チャネル選択情報に基づいてタスク－特化アーキテクチャの少なくとも一部のチャネルを除去して、第１タスク－特化ネットワークが決定される。ここでは、アーキテクチャ制御ネットワークを介して第１タスクベクトルを処理して第１実数ベクトルが生成され、変換関数により第１実数ベクトルの各実数エレメントを真又は偽りに変換し、第１チャネル選択情報を生成することができる。

【0038】

ステップＳ４１０～Ｓ４３０に関連して、第２タスクベクトルに基づいた映像復元動作が実行され得る。例えば、複数の候補映像効果のうち第２映像効果に対応する第２タスクベクトルが受信され、タスク－特化アーキテクチャ及び第２タスクベクトルに基づいて、共通特徴が第２映像効果に対応する第２復元映像に復元される。この共通特徴は、ステップＳ４２０で抽出された共通特徴に該当し、当該共通特徴は、第２復元映像の復元のためにリユースされる。ある入力映像から共通特徴が抽出されれば、該当の共通特徴は、同じ入力映像に対する様々な映像効果の復元映像を復元するためにリユースされてもよい。このようなリユースにより、特徴抽出のための演算が縮小され得る。その他に、映像復元には、図１～図３及び図５～図１４に対する説明が適用され得る。

【0039】

図５は、一実施形態に係るトレーニング装置を示すブロック図である。図５を参照すると、トレーニング装置５００は、プロセッサ５１０及びメモリ５２０を含む。プロセッサ５１０は、トレーニングデータに基づいて、メモリ５２０に格納されたソースニューラルネットワーク５３０をトレーニングする。ソースニューラルネットワーク５３０のトレーニングは、ソースニューラルネットワーク５３０を更新すること、および／又は、ソースニューラルネットワーク５３０のパラメータ（例えば、ウェイト）を更新することを含む。ソースニューラルネットワーク５３０は、予めトレーニングされ、及び／又は、使用過程でオン－デバイスでトレーニングされてもよい。トレーニングデータは、トレーニング入力及びトレーニング出力を含む。言い換えれば、トレーニング出力は、トレーニング目標のように称されてもよい。トレーニング入力はトレーニング入力映像及びタスクベクトルを含み、トレーニング出力はトレーニング目標映像を含む。

【0040】

ソースニューラルネットワーク５３０は、タスク－非依存アーキテクチャ、タスク－特化アーキテクチャ、及び、制御アーキテクチャを含む。トレーニング装置５００は、タスク－特化プルーニング及びタスク－非依存プルーニングを介して、効率よくアーキテクチャを検索することができる。タスク－特化プルーニングは、各タスクに関連のないネットワークパラメータを適応的に除去する方法を学習し、タスク－非依存プルーニングは、様々なタスクにわたってネットワークの初期レイヤを共有して、効率よくアーキテクチャを検索する方法を学習することができる。

【0041】

制御可能な映像復元又は映像変調は、各効果タイプに対して効果の程度が異なる映像を復元することができる。Ｄ個の効果タイプが与えられれば、タスクベクトルｔ_ｍ∈Ｒ^Ｄはｍ番目の映像復元作業、言い換えれば、ｍ番目の映像効果（ｍ∈｛１、２、．．．、Ｍ｝）を符号化し、ｔ_ｍ（ｔ_ｍ,ｄ∈［０、１］）の各ｄ番目の構成要素は、該当ｄ番目の劣化タイプに対する調整レベルを決定する。ニューラルネットワークをトレーニングする間に、タスクベクトルｔ_ｍは、入力映像と対象映像の対応トレーニング対と共にランダムにサンプリングされてもよい。推論の際に、タスクベクトルは映像効果を決定する制御変数に該当する。

【0042】

現実の劣化映像において、所定の測定値（例えば、ＰＳＮＲ（ｐｅａｋｓｉｇｎａｌ－ｔｏ－ｎｏｉｓｅｒａｔｉｏ）、ＬＰＩＰＳ（ｌｅａｒｎｅｄｐｅｒｃｅｐｔｕａｌｉｍａｇｅｐａｔｃｈｓｉｍｉｌａｒｉｔｙ）、ユーザの選好度など）に関して、最上の映像効果を生成する最適なタスクベクトルが分からないと仮定する。従って、このようなタスクベクトルを検索するために制御可能な映像復元ネットワークが、入力映像当たり複数の映像効果を生成する過程が要求される。ここで、ユーザの選好度又は要求が満たされるまで、与えられたタスクに対して生成された任意の数の映像効果をＭに示す。

【0043】

以前作業のアーキテクチャは、固定された状態で、映像効果当たり、ネットワークの全体推論を行ってもよい。実施形態によれば、復元プロセスの算出費用を最小化して、入力映像当たり、様々な映像効果を正確に生成するネットワークアーキテクチャが提供され得る。与えられたＭ個の映像効果を生成するための平均算出費用について、数式（１）のように示す。

【数1】

Ｒ（ｆ，ｘ，ｔ_ｍ）はネットワークアーキテクチャｆ、入力映像ｘ、及びタスクベクトルｔ_ｍを用いてｍ番目の映像効果を生成するためのＦＬＯＰＳ（ｆｌｏａｔｉｎｇｐｏｉｎｔｏｐｅｒａｔｉｏｎｓｐｅｒｓｅｃｏｎｄ）又は遅延時間を示す。タスク－特化プルーニングは、各映像効果に特化した効率的なネットワークアーキテクチャを検索することができる。これは数式（２）のような平均算出費用を示す。

【数2】

固定されたアーキテクチャｆは、タスク－特化プルーニングプロセスに必要な補助算出費用ε_ｍを有するｍ番目の映像効果の特定効率的なネットワークｆ_ｍに代替されてもよい。その次に、タスク－非依存プルーニングは、特徴リユース可能にするために、作業の全般にわたって初期レイヤの特徴マップを共有しているタスク－非依存アーキテクチャｆ^ａを決定することができる。これは数式（３）のように示す。

【数3】

ｆ_ｍ ^Sはｆ^ａ後のｆ_ｍの残りのタスク－特化レイヤであり、ｘ^～はｆ^ａ(ｘ)の特徴マップ出力である。特徴マップ出力は、各タスク間の共通特徴に該当する。その結果、全てのＭ個の映像効果に対してｘ^～の単一算出のみが要求されてもよく、共有初期レイヤの特徴マップに対する重複したＭ－１個の算出が除去される。これについて、数式（４）のように示す。

【数4】

Ｒ（ｆ^ａ，ｘ）はｆ^ａに対する単一算出の算出費用である。トレーニング装置５００は、損失関数に基づいてソースニューラルネットワーク５３０をトレーニングする。損失関数は、復元性能に関する第１損失成分及び演算量に関する第２損失成分を含む。トレーニング装置５００は、ソースニューラルネットワーク５３０の復元性能が向上され、ソースニューラルネットワーク５３０に関する演算量が縮小されるように、ソースニューラルネットワーク５３０をトレーニングする。より具体的に、トレーニング装置５００は、トレーニング入力（トレーニング入力映像及びタスクベクトル）に対するソースニューラルネットワーク５３０の出力（復元映像）をトレーニング出力（トレーニング目標映像）と比較し、比較結果に基づいて損失関数の第１損失成分を決定する。また、トレーニング装置５００は、復元性能の損傷を最小化して演算量が縮小されるように、ソースニューラルネットワーク５３０をトレーニングする。例えば、演算量の縮小は、タスク－非依存アーキテクチャに含まれているレイヤの数及び／又はタスク－特化アーキテクチャから除去されるチャネルの数の増加により達成することができる。

【0044】

トレーニング装置５００の検索アルゴリズムは、スーパーネットワークと呼ばれる大規模ネットワークから効率的であるか、性能ごとの最適なネットワークを検索する、ことを目標とするスーパーネットワーク基盤アクセス方式である。検索プロセスは、動作又は構成要素の検索空間で行われ、検索プロセスの各組み合せは、スーパーネットワークから導き出された候補ネットワークを提供することができる。ソースニューラルネットワーク５３０は、スーパーネットワークに該当し、ソースニューラルネットワーク５３０から導き出された変形ネットワークは、候補ネットワークに該当する。トレーニング装置５００は、タスクの間にレイヤが共有されなければならないかの有無、及び、チャネルがスーパーネットワークから除去されなければならないかの有無を、アーキテクチャコントローラと共にエンドツーエンド方式（ｅｎｄ－ｔｏ－ｅｎｄｍａｎｎｅｒ）により決定する。

【0045】

図６は、一実施形態に係るソースニューラルネットワークのアーキテクチャを示す。図６を参照すると、ソースニューラルネットワーク６００は、タスク－非依存アーキテクチャ６１０、タスク－特化アーキテクチャ６２０、及び、制御アーキテクチャ６３０を含む。タスク－非依存アーキテクチャ６１０は、複数のレイヤ６１０１～６１０３及び複数のチャネル選択器６１１１～６１１４を含む。タスク－非依存アーキテクチャ６１０は、チャネル選択器６１１１の出力をチャネル選択器６１１４の出力に加える動作に対応する、スキップコネクション６１２１をさらに含んでもよい。複数のレイヤ６１０１～６１０３は、畳み込み動作及び／又は活性化関数の演算に対応する。例えば、レイヤ６１０１，６１０３は３×３畳み込み演算に対応し、レイヤ６１０２は、３×３畳み込み演算及び活性化演算（例えば、ＲｅＬＵ演算）に対応する。レイヤ６１０１のストライド（ｓｔｒｉｄｅ）は、レイヤ６１０２，６１０３に比べて２倍大きくてもよい。３×３及び／又は２倍のような数値は相違に調整されてもよい。

【0046】

タスク－特化アーキテクチャ６２０は、特徴抽出パート６２１及び映像復元パート６２２を含む。特徴抽出パート６２１は、複数のチャネル選択器６２１１～６２１３及び複数のレイヤ６２１５，６２１６を含む。特徴抽出パート６２１は、畳み込みブロック６２１９によるタスクベクトルｔ_ｍの畳み込み結果を、チャネル選択器６２１３の出力に乗算される乗算動作、及び、スキップコネクション６２１８によりタスク－非依存アーキテクチャ６１０の出力を乗算結果に加える足し算動作をさらに含んでもよい。複数のレイヤ６２１５，６２１６は、畳み込み動作及び／又は活性化関数の演算に対応する。例えば、レイヤ６２１５は、３×３畳み込み演算及び活性化演算（例えば、ＲｅＬＵ演算）に対応し、レイヤ６２１６は、３×３畳み込み演算に対応する。レイヤ６２１５，６２１６のストライドは、レイヤ６１０２，６１０３と同一であってもよい。

【0047】

映像復元パート６２２は、複数のレイヤ６２２１，６２２２、及び、チャネル選択器６２２４を含む。映像復元パート６２２は、畳み込みブロック６２２９によるタスクベクトルｔ_ｍの畳み込み結果をレイヤ６２２２の出力に乗算される乗算動作、及び、スキップコネクション６２２７によりタスク－非依存アーキテクチャ６１０の入力を乗算結果に加える足し算動作をさらに含んでもよい。制御アーキテクチャ６３０は、複数のアーキテクチャ制御ネットワーク６３０１～６３０４を含む。複数のレイヤ６２２１，６２２２は、畳み込み動作、活性化関数の演算、及び、ピクセルシャッフル動作のうち少なくとも１つに対応する。例えば、レイヤ６２２１は、×２ピクセルシャッフル動作、３×３畳み込み演算、及び活性化演算（例えば、ＲｅＬＵ演算）に対応し、レイヤ６２２２は、３×３畳み込み演算に対応する。レイヤ６１０１の２倍のストライドとレイヤ６２２１の２倍のピクセルシャッフルを介して、入力映像と復元映像の大きさが同一に保持され得る。

【0048】

トレーニング装置は、各チャネルが与えられたタスクに重要であるか、全てのタスクに重要であるか、又は、何でもないかを決定して、ネットワークを効率よく検索することができる。タスク－特化アーキテクチャ６２０を検索するために、与えられたタスクに対して重要なチャネルは保持され、関係のないチャネルは除去される。以下、タスク－特化アーキテクチャはｆ^Sに示す。同様に、タスク－非依存アーキテクチャ６１０の場合、ほとんどのタスクに重要なチャネルは保持され、関係のないチャネルは除去される。以下、タスク－非依存アーキテクチャはｆ^ａに示す。タスクに対するチャネル重要度（又は、チャネルに対するタスク選好度）Ｚ^ａ∈Ｒ^Ｎ×Ｃ及びＺ^S _ｍ∈Ｒ^Ｎ×Ｃによって決定される。チャネル重要度Ｚ^S _ｍは、制御アーキテクチャ６３０の出力に該当する。以下で再び説明するが、チャネル重要度Ｚ^ａは、チャネル重要度Ｚ^S _ｍに基づいて決定される。ここで、ｍ、Ｎ、及びＣは、タスクインデックス、チャネル選択モジュールインデックス、及びチャネルインデックスを示す。

【0049】

図７をさらに参照して、チャネル選択動作を説明する。チャネル選択器７１０は、チャネル重要図７０１をチャネル選択情報７０２に変換し、チャネル選択情報７０２に基づいて、スーパー特徴マップ７０５で少なくとも一部のチャネルを選択（又は、少なくとも一部のチャネルを除去）して、変形特徴マップ７０６を決定する。チャネル重要図７０１は、実数ベクトルに該当し、チャネル選択情報７０２は、２進ベクトルに該当する。チャネル選択器７１０は、変換関数７１１を介して、実数ベクトルの各実数エレメントを真又は偽りに変換して、２進ベクトルを決定することができる。変換関数７１１は、数式（５）のように提供される微分可能な（ｄｉｆｆｅｒｅｎｔｉａｂｌｅ）ゲーティング関数（ｇａｔｉｎｇｆｕｎｃｔｉｏｎ）である。

【数5】

＊∈｛ａ，ｓ｝であり、Ｚ^＊はＺ^＊ _ｍの構成要素を示し、II［］は、入力が真であるときに１を返還し、そうでなければ、０をリターンする指示関数（ｉｎｄｉｃａｔｏｒｆｕｎｃｔｉｏｎ）である。従って、Ｚ^S _ｍ及びＺ^ａの各パラメータは、スーパーネットワークで対応チャネルがｆ^S及びｆ^ａに対してそれぞれ活性化又は不活性化されるように決定される。トレーニング時に、乗算演算７１２を介して、スーパー特徴マップ７０５にチャネル選択情報７０２を乗算して、変形特徴マップ７０６が生成される。推論の場合、乗算演算７１２がスキップ処理に代替されてもよく、そのため、演算量の減少が実現され得る。より具体的に、チャネル選択情報７０２の偽りに対応するウェイトテンソルのロードはスキップし、真に対応するウェイトテンソルのみが選択的にロードされて畳み込み演算に用いられて実行され得る。

【0050】

図８をさらに参照すると、アーキテクチャ制御ネットワークについて説明する。図８を参照すると、アーキテクチャ制御ネットワークｆ^Ｃは、畳み込みレイヤ８１１及び活性化関数８１２を含み、完全接続ネットワークから構成される。ｆ^Ｃは、ｆ^Ｓのネットワークアーキテクチャを適応的に修正することができる。ｆ^Ｃは、数式（６）のように定義される。

【数6】

ｆ^Ｃ _ｎは、ｎ番目のチャネル選択器のアーキテクチャ制御ネットワークを示す。Ｚ^Ｓ _ｍがチャネルに対するタスク選好度を示し、各タスクベクトルがスーパーネットワークでチャネルを適応的に活性化するため、ｔ_ｍの関数である。

【0051】

再び図６を参照すると、タスク－非依存レイヤを検索するために、数式（７）のようにトレーニングの全般にわたるタスクから各チャネルに対する選好度Ｚ^Ｓ _ｍ,ｎ,ｃを収集し、各チャネルに対する選好度Ｚ^ａ _ｎ,Ｃを決定する。

【数7】

Ｚ^ａは０値に初期化されてもよい。ｃはｎ番目のチャネル選択モジュールのチャネルインデックス、αは指数移動平均（ｅｘｐｏｎｅｎｔｉａｌｍｏｖｉｎｇａｖｅｒａｇｅ）に対するハイパーパラメータを示す。Ｚ^ａは数式（８）のように合意の基準（ａｇｒｅｅｍｅｎｔｃｒｉｔｅｒｉｏｎ）を算出して各チャネルの選好度に対する大きさＭのミニバッチ（ｍｉｎｉ－ｂａｔｃｈ）でタスクの合意を推定するために用いられる。

【数8】

γは閾値ハイパーパラメータである。数式（８）が成立されるか否かは、ブーリアン変数（Ｂｏｏｌｅａｎｖａｒｉａｂｌｅ）ηによって示される。数式（８）が成立すれば（η＝１）、ほとんどのタスクは、チャネルをプルーニングしてレイヤを共有することに同意する。しかし、数式（８）の条件は、現在のトレーニングミニバッチにあるタスクによって成立したり、成立しないこともある。従って、ηは、数式（７）と同様に、数式（９）のように全体データセットからタスクの合意を得るために、トレーニングの間にＳ_ｎを通じて累積される。

【数9】

Ｓ_ｎが０に初期化されてもよい。Ｓ_ｎが大きいほど、より多くのタスクがｎ番目のチャネルに対する選好度に同意し、より多くの戦略がｎ番目のチャネル選択モジュールがタスク－非依存となることを好む。タスク－非依存レイヤは、ネットワークの初期ステップに共に位置し、タスク間に特徴リユースを可能にする。ｎ番目のチャネル選択モジュールは、ｎ番目のチャネル選択器と以前チャネル選択器の全てが数式（１０）のように与えられた閾値γよりも大きいＳ_ｉを有する場合タスク－非依存に該当する。これは数式（１０）のように示される。

【数10】

φ∈Ｚ^Ｎ _２は決定変数を示す。ｎ番目のチャネル選択器がタスク－非依存である場合、ｎ番目の構成要素φ_ｎは１である。

【0052】

効率的なアーキテクチャを検索するために、実施形態は正規化ターム（ｒｅｇｕｌａｒｉｚａｔｉｏｎｔｅｒｍ）を使用する。Ｌ（、）は、映像復元作業のための標準ｌ_１損失関数を示す。リソース正規化関数Ｒ_１（）は、現在検索されたアーキテクチャのリソース量を数式（４）によって算出される。様々な映像効果をより効率よく生成するためのタスク－非依存レイヤ数を最大化するために、正規化関数Ｒ_２が用いられてもよい。全般的な目的関数は数式（１１）のように示すことができる。

【数11】

θは復元ネットワークｆ（ｆ^S及びｆ^ａ）、ψはアーキテクチャ制御ネットワークｆ^Ｃの学習可能なパラメータであり、λ_１及びλ_２はこれらの均衡をとるためのハイパーパラメータである。可能であれば性能を犠牲することなくネットワークをタスク－非依存にするために、Ｒ_２は、数式（１２）のようにチャネル重要度に対するタスク間の不一致にペナルティを与えることができる。

【数12】

ｎ＝０のレイヤは入力映像を示し、入力映像が与えられたタスクに対する様々な映像効果に対して共有されるため、φ_０≡１であってもよい。数式（１１）において、Ｌは復元性能に関する第１損失成分であり、Ｒ_１及びＲ_２は演算量に関する第２損失成分である。第１損失成分は、トレーニング目標映像と復元映像との間の差が減少するようにソースニューラルネットワークをトレーニングし、第２損失成分は、タスク－非依存アーキテクチャに含まれたレイヤの数が増加し、演算量は減少するようにソースニューラルネットワークをトレーニングすることができる。

【0053】

図９は、絶対的な目標を有するトレーニングデータセットを示す。従来における映像復元作業は、様々な劣化レベルの劣化映像を本来の映像に復元するものと定義される。例えば、トレーニング入力映像９１１～９１３は、互いに異なる劣化レベル（例えば、１～３）を有しているにも関わらず、それぞれ同じ劣化レベル（例えば、０）のトレーニング目標映像９２１とトレーニング対をなすことがある。図９の例示において、トレーニング目標映像９２１は絶対的な目標である。

【0054】

図１０は、一実施形態に係る相対的目標を有するトレーニングデータセットを示し、図１１は、一実施形態に係るトレーニングデータセットの構成を示す。実施形態に係る制御可能な映像復元は、視覚的に満足する様々な映像効果を生成することを目標とし、これは単一オリジナル映像への復元にフォーカスした従来におけるトレーニング基盤で達成することは難しい。実施形態によれば、復元作業は、劣化レベル（又は、効果レベル）を調整して様々な効果を付与することで再定義される。例えば、トレーニング入力映像１０１１～１０１３は、それぞれトレーニング目標映像１０２１～１０２３のいずれか１つとトレーニングの対をなすことができる。図１０の例示において、トレーニング目標映像１０２１～１０２３は相対的な目標である。

【0055】

復元程度は、入力と目標との間のレベル差を示す調整レベルで与えられる。例えば、トレーニング入力映像１０１１をトレーニング目標映像１０２１に、トレーニング入力映像１０１２をトレーニング目標映像１０２２に、トレーニング入力映像１０１３をトレーニング目標映像１０２３に復元することは、０の調整レベルに対応する。トレーニング入力映像１０１２をトレーニング目標映像１０２１に、トレーニング入力映像１０１３をトレーニング目標映像１０２２に復元することは、１の調整レベルに対応する。トレーニング入力映像１０１３をトレーニング目標映像１０２１に復元することは、２の調整レベルに対応する。反対に、劣化効果の追加のための－１、－２の調整レベルも存在し得る。このような調整レベルに基づいて、タスクベクトルｔ_ｍが数式（１３）のように定義される得る。

【数13】

ｌ^ｉｎ、ｌ^ｇｔ∈Ｒ^Ｄは、入力映像及び目標映像の劣化レベルないし効果レベルを示す。ｄ番目の劣化タイプに対してｌ^ｉｎ _ｄ、ｌ^ｇｔ _ｄ∈［０、１］に定義される。例えば、図１１示す像１１０１～１１０６は、標準偏差σ＝０～５０のノイズを有する。このようなノイズに基づいて、映像１１０１～１１０６に劣化レベルｌ＝０ないし１が付与される。ｌ^ｇｔ _ｄ＜ｌ^ｉｎ _ｄの場合、目標映像が入力映像よりも少なく劣化されたシナリオ、言い換えれば、入力映像をよりも優れる品質の目標映像に復元するシナリオに対応する。ｌ^ｇｔ _ｄ＞ｌ^ｉｎ _ｄの場合は、目標映像が入力映像よりも劣化されたシナリオ、言い換えれば、入力映像に劣化効果を追加するシナリオに対応する。

【0056】

第２映像１１０２が第１トレーニング入力映像であり、第４映像１１０４が第１トレーニング目標映像である場合、第１タスクベクトルはノイズレベルを０．４だけ低くする第１映像効果を指示し、このような第１トレーニング入力映像、第１タスクベクトル、及び、第１トレーニング目標映像は、第１トレーニングセットを構成する。第３映像１１０３が第２トレーニング入力映像に該当し、第５映像１１０５が第２トレーニング目標映像に該当する場合、第２タスクベクトルはノイズレベルを０．４だけ低くする第２映像効果を指示し、このような第２トレーニング入力映像、第２タスクベクトル、及び、第２トレーニング目標映像は、第２トレーニングセットを構成する。ここで、第２トレーニング入力映像の入力効果レベルと第２トレーニング目標映像の目標効果レベルとの間の差が、第１トレーニング入力映像の入力効果レベルと第１トレーニング目標映像の目標効果レベルとの間の差が同一である。従って、第１タスクベクトルと第２タスクベクトルは同じ値を有する。そのため、第１タスクベクトルと第２タスクベクトルは０．４のレベル差という相対的な目標にトレーニング方向を設定することができる。各ミニバッチに対してトレーニング映像の対は、単一劣化タイプに対する均一分布、全ての劣化タイプに対する２進分布、及び、全ての劣化タイプに対する均一分布に対して同一にサンプリングされ得る。

【0057】

図１２は、一実施形態に係る第１トレーニングデータセットに基づいたトレーニング動作を示したフローチャートである。図１２のステップＳ１２１０～Ｓ１２４０は順次実行され、あるいは、順次に実行されなくてもよい。例えば、ステップＳ１２１０～Ｓ１２４０の順序が変更され、かつ／あるいは、ステップＳ１２１０～Ｓ１２４０の少なくとも２つが並列的に実行されてもよい。ステップＳ１２１０～Ｓ１２４０は、トレーニング装置５００及び／又は電子装置１４００の少なくとも１つの構成要素（例えば、プロセッサ５１０，１４１０）によって実行されてもよい。

【0058】

ステップＳ１２１０において、第１トレーニング入力映像、複数の候補映像効果から第１映像効果を指示する第１作業ベクトル、及び、第１映像効果による第１トレーニング目標映像を含む第１トレーニングデータセットが受信される。ステップＳ１２２０において、ソースニューラルネットワークのタスク－非依存アーキテクチャに基づいて、第１トレーニング入力映像から複数の候補映像効果が共有している共通特徴が抽出される。ステップＳ１２３０において、ソースニューラルネットワークのタスク－特化アーキテクチャ及び第１作業ベクトルに基づいて、共通特徴が第１復元映像に復元される。ステップＳ１２４０において、第１トレーニング目標映像と第１復元映像との間の差、及び共通特徴の抽出及び第１復元映像の復元に関する演算量に基づいて、ソースニューラルネットワークが更新される。例えば、ソースニューラルネットワークは、タスク－非依存アーキテクチャに含まれているレイヤ数が増加し、演算量が減少されるように更新され得る。

【0059】

第１タスクベクトルは、第１映像効果の各効果タイプの調整レベルを含んでもよく、調整レベルの値は、第１トレーニング入力映像の入力効果レベルと第１トレーニング目標映像の目標効果レベルとの間の差により決定される。第２トレーニング入力映像、第２映像効果を指示する第２タスクベクトル、及び第２映像効果による第２トレーニング目標映像を含む第２トレーニングセットが存在し、第２トレーニング入力映像の入力効果レベルと第２トレーニング目標映像の目標効果レベルとの間の差が、第１トレーニング入力映像の入力効果レベルと第１トレーニング目標映像の目標効果レベルとの間の差と同一である場合、第２タスクベクトルは第１タスクベクトルと同じ値を有する。その他に、トレーニングには、図１～図１１及び図１３～図１４に関する説明が適用され得る。

【0060】

図１３は、一実施形態に係る映像復元装置を示すブロック図である。図１３を参照すると、装置１３００は、プロセッサ１３１０及びメモリ１３２０を含む。メモリ１３２０はプロセッサ１３１０に接続され、プロセッサ１３１０によって実行可能な命令語、プロセッサ１３１０が演算するデータ又はプロセッサ１３１０によって処理されたデータを格納する。メモリ１３２０は非一時的なコンピュータで読み出し可能な記憶媒体、例えば、高速ランダムアクセスメモリ及び／又は不揮発性のコンピュータで読み出し可能な記憶媒体（例えば、１つ以上のディスク記憶装置、フラッシュメモリ装置、又は、その他の不揮発性固体メモリ装置）を含む。

【0061】

プロセッサ１３１０は、図１～図１２及び図１４に示す動作を行うための命令語を実行する。例えば、プロセッサ１３１０は、入力映像、及び、複数の候補映像効果のうち第１映像効果を指示する第１タスクベクトルを受信し、ソースニューラルネットワークのタスク－非依存アーキテクチャに基づいて、入力映像から複数の候補映像効果が共有している共通特徴を抽出し、ソースニューラルネットワークのタスク－特化アーキテクチャ及び第１タスクベクトルに基づいて、共通特徴を第１映像効果に対応する第１復元映像に復元することができる。その他に、映像復元装置１３００には、図１～図１２及び図１４の説明が適用され得る。

【0062】

図１４は、一実施形態に係る電子装置を示すブロック図である。図１４を参照すると、電子装置１４００は、プロセッサ１４１０、メモリ１４２０、カメラ１４３０、格納装置１４４０、入力装置１４５０、出力装置１４６０、及び、ネットワークインターフェース１４７０を含み、これらは通信バス１４８０を介して通信できる。例えば、電子装置１４００は、移動電話、スマートフォン、ＰＤＡ、ネットブック、タブレットコンピュータ、ラップトップコンピュータなどのようなモバイル装置、スマートウォッチ、スマートバンド、スマートメガネなどのようなウェアラブルデバイス、デスクトップ、サーバなどのようなコンピューティング装置、テレビ、スマートテレビ、冷蔵庫などのような家電製品、ドアラックなどのようなセキュリティー装置、自律走行車両、スマート車両などのような車両の少なくとも一部として実現され得る。電子装置１４００は、図１に示す映像復元装置１００、図５に示すトレーニング装置５００、及び、図１３に示す映像復元装置１３００の少なくとも１つを構造的及び／又は機能的に含むことができる。

【0063】

プロセッサ１４１０は、電子装置１４００内で実行するための機能及び命令語を実行する。例えば、プロセッサ１４１０は、メモリ１４２０又は格納装置１４４０に格納された命令語を処理する。プロセッサ１４１０は、図１～図１３を参照して説明された動作を行うことができる。例えば、プロセッサ１４１０は、入力映像、及び、複数の候補映像効果のうち、第１映像効果を指示する第１タスクベクトルを受信し、ソースニューラルネットワークのタスク－非依存アーキテクチャに基づいて、入力映像から複数の候補映像効果が共有している共通特徴を抽出し、ソースニューラルネットワークのタスク－特化アーキテクチャ及び第１タスクベクトルに基づいて、共通特徴を第１映像効果に対応する第１復元映像に復元する。メモリ１４２０は、コンピュータで読み出し可能な記憶媒体又はコンピュータで読み出し可能な記憶装置を含む。メモリ１４２０は、プロセッサ１４１０によって実行するための命令語を格納し、電子装置１４００によりソフトウェア及び／又はアプリケーションが実行される間に関連情報を格納する。

【0064】

カメラ１４３０は、入力映像（写真及び／又はビデオ）を生成する。格納装置１４４０は、コンピュータで読み出し可能な記憶媒体又はコンピュータで読み出し可能な記憶装置を含む。格納装置１４４０は、メモリ１４２０よりもさらに多い量の情報を格納し、情報を長期間格納することができる。例えば、格納装置１４４０は、磁気ハードディスク、光ディスク、フラッシュメモリ、フロッピーディスク、又は技術分野で知られた他の形態の不揮発性メモリを含んでもよい。

【0065】

入力装置１４５０は、キーボード及びマウスを通した伝統的な入力方式、並びに、タッチ入力、音声入力、及びイメージ入力のような新しい入力方式を介してユーザから入力を受信されてもよい。例えば、入力装置１４５０は、キーボード、マウス、タッチスクリーン、マイクロホン、又は、ユーザから入力を検出し、検出された入力を電子装置１４００に伝達できる任意の他の装置を含む。出力装置１４６０は、視覚的、聴覚的、又は触覚的なチャネルを介してユーザに電子装置１４００の出力を提供する。出力装置１４６０は、例えば、ディスプレイ、タッチスクリーン、スピーカ、振動発生装置、又はユーザに出力を提供できる任意の他の装置を含む。ネットワークインターフェース１４７０は、有線又は無線ネットワークを介して外部装置と通信することができる。

【0066】

以上で説明した実施形態は、ハードウェア構成要素、ソフトウェア構成要素、又は、ハードウェア構成要素及びソフトウェア構成要素の組み合せで具現される。例えば、本実施形態で説明した装置及び構成要素は、例えば、プロセッサ、コントローラ、ＡＬＵ（ａｒｉｔｈｍｅｔｉｃｌｏｇｉｃｕｎｉｔ）、デジタル信号プロセッサ（ｄｉｇｉｔａｌｓｉｇｎａｌｐｒｏｃｅｓｓｏｒ）、マイクロコンピュータ、ＦＰＡ（ｆｉｅｌｄｐｒｏｇｒａｍｍａｂｌｅａｒｒａｙ）、ＰＬＵ（ｐｒｏｇｒａｍｍａｂｌｅｌｏｇｉｃｕｎｉｔ）、マイクロプロセッサー、又は、命令（ｉｎｓｔｒｕｃｔｉｏｎ）を実行して応答する異なる装置のように、１つ以上の汎用コンピュータ又は特殊目的コンピュータを用いて具現される。処理装置は、オペレーティングシステム（ＯＳ）及び前記オペレーティングシステム上で行われる１つ以上のソフトウェアアプリケーションを行うことができる。また、処理装置は、ソフトウェアの実行に応答してデータをアクセス、格納、操作、処理、及び生成することもできる。理解の利便のために、処理装置は、１つが使用されるものと説明される場合もあるが、当該技術分野において通常の知識を有する者は、処理装置が複数の処理要素（ｐｒｏｃｅｓｓｉｎｇｅｌｅｍｅｎｔ）及び／又は複数のタイプの処理要素を含んでいることが分かる。例えば、処理装置は、複数のプロセッサ又は一のプロセッサ及び一つのコントローラを含んでもよい。また、並列プロセッサのような、他の処理構成も可能である。

【0067】

ソフトウェアは、コンピュータプログラム、コード、命令、又は、そのうちの一つ以上の組合せを含み、希望の通りに動作するよう処理装置を構成したり、独立的又は結合的に処理装置を命令することができる。ソフトウェア及び／又はデータは、処理装置によって解釈され、処理装置に命令又はデータを提供するために、いずれかの類型の機械、構成要素、物理的装置、仮想装置、コンピュータ格納媒体又は装置、もしくは、送信される信号波に永久的又は一時的に具体化することができる。ソフトウェアはネットワークに連結されたコンピュータシステム上に分散され、分散した方法で格納され、実行され得る。ソフトウェア及びデータは一つ以上のコンピュータで読出し可能な記憶媒体に格納され得る。

【0068】

本実施形態による方法は、様々なコンピュータ手段を介して実施されるプログラム命令の形態で具現され、コンピュータ読み取り可能な記憶媒体に格納される。記憶媒体は、プログラム命令、データファイル、データ構造などを単独で又は組み合せで含む。記憶媒体及びプログラム命令は、本発明の目的のために特別に設計して構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知のものであり、使用可能なものであってもよい。コンピュータ読み取り可能な記憶媒体の例として、ハードディスク、フロッピー（登録商標）ディスク、及び磁気テープのような磁気媒体、ＣＤ－ＲＯＭ、ＤＶＤのような光記録媒体、フロプティカルディスクのような磁気－光媒体、並びに、ＲＯＭ、ＲＡＭ、フラッシュメモリなどのようなプログラム命令を保存して実行するように特別に構成されたハードウェア装置を含む。プログラム命令の例としては、コンパイラによって生成されるような機械語コードだけでなく、インタプリタなどを用いてコンピュータによって実行される高級言語コードを含む。

【0069】

上記で説明したハードウェア装置は、本発明に示す動作を実行するために１つ以上のソフトウェアモジュールとして作動するように構成してもよく、その逆も同様である。

【0070】

上述のように、実施形態が限定された図面によって説明されてきたが、当技術分野で通常の知識を有する者であれば、上記の説明に基づいて様々な技術的な修正及び変形を適用することができる。例えば、説明された技術が、説明された方法と異なる順で実行されてよく、かつ／あるいは、説明されたシステム、構造、装置、回路などの構成要素が説明された方法と異なる形態で結合又は組み合わせられてもよく、他の構成要素又は均等物によって置き換え又は置換されたとしても適切な結果を達成することができる。

【0071】

したがって、本発明の範囲は、開示された実施形態に限定されて定められるものではなく、特許請求の範囲及び特許請求の範囲と均等なものなどによって定められるものである。

【符号の説明】

【0072】

１１０映像復元装置
１１０ソースニューラルネットワーク
１２０変形ネットワーク
２００ソースニューラルネットワーク
２１０第１変形ネットワーク
２２０第２変形ネットワーク
３１０タスク－特化アーキテクチャ
３２０制御アーキテクチャ

【図1】