特許6857712 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 三星電子株式会社の特許一覧

特許6857712電子装置及びその映像処理方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3A
3B
4
5
6
7
8A
8B
9A
9B
10A
10B
10C
10D
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6857712

(24)【登録日】2021年3月24日

(45)【発行日】2021年4月14日

(54)【発明の名称】電子装置及びその映像処理方法

(51)【国際特許分類】

G06T 1/40 20060101AFI20210405BHJP

G06N 3/04 20060101ALI20210405BHJP

G06T 7/00 20170101ALI20210405BHJP

G06T 3/40 20060101ALI20210405BHJP

G06T 5/00 20060101ALI20210405BHJP

【ＦＩ】

G06T1/40

G06N3/04

G06T7/00 350C

G06T3/40 725

G06T5/00 705

【請求項の数】14

【全頁数】28

(21)【出願番号】特願2019-237838(P2019-237838)

(22)【出願日】2019年12月27日

(65)【公開番号】特開2020-184300(P2020-184300A)

(43)【公開日】2020年11月12日

【審査請求日】2019年12月27日

(31)【優先権主張番号】10-2019-0051386

(32)【優先日】2019年5月2日

(33)【優先権主張国】KR

(31)【優先権主張番号】10-2019-0078248

(32)【優先日】2019年6月28日

(33)【優先権主張国】KR

【早期審査対象出願】

(73)【特許権者】

【識別番号】390019839

【氏名又は名称】三星電子株式会社

【氏名又は名称原語表記】ＳａｍｓｕｎｇＥｌｅｃｔｒｏｎｉｃｓＣｏ．，Ｌｔｄ．

(74)【代理人】

【識別番号】100107766

【弁理士】

【氏名又は名称】伊東忠重

(74)【代理人】

【識別番号】100070150

【弁理士】

【氏名又は名称】伊東忠彦

(74)【代理人】

【識別番号】100091214

【弁理士】

【氏名又は名称】大貫進介

(72)【発明者】

【氏名】朴勝浩

(72)【発明者】

【氏名】文永秀

【審査官】松浦功

(56)【参考文献】

【文献】特開２０１８−２０６３８２（ＪＰ，Ａ）

【文献】特開２０１３−２５８５９６（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１９／０１１４７４２（ＵＳ，Ａ１）

【文献】米国特許出願公開第２０１８／０２９３７６２（ＵＳ，Ａ１）

【文献】特開２０１９−２０８９９０（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｔ１／００ − １／４０

Ｇ０６Ｔ５／００

Ｇ０６Ｔ７／００ − ７／９０

Ｇ０６Ｎ３／０２ − ３／１０

ＧｏｏｇｌｅＳｃｈｏｌａｒ

(57)【特許請求の範囲】

【請求項1】

少なくとも一つの命令語を保存するメモリと、
前記メモリと電気的に接続され、
前記命令語を実行することで、入力イメージから前記入力イメージの品質を示すノイズマップを獲得し、前記入力イメージ及び前記ノイズマップを複数のレイヤを含む学習ネットワークモデルに適用し、前記入力イメージの品質の改善された出力イメージを獲得するプロセッサと
を含み、
前記プロセッサは、
前記複数のレイヤのうち少なくとも一つの中間レイヤに前記ノイズマップを提供し、
前記学習ネットワークモデルは、
複数のサンプルイメージ、各サンプルイメージに対するノイズマップ及び前記各サンプルイメージに対応する原本イメージの関係を人工知能アルゴリズムを通じて学習して獲得された学習済み人工知能モデルであり、
前記複数のサンプルイメージのそれぞれは、
原本イメージの圧縮された圧縮イメージであり、
前記各サンプルイメージに対するノイズマップは、
前記各サンプルイメージ及び前記各サンプルイメージに対応する原本イメージに基づいて獲得されたノイズマップである電子装置。

【請求項2】

前記学習ネットワークモデルは、
少なくとも一つのサブレイヤを更に含み、
前記プロセッサは、
前記少なくとも一つのサブレイヤを用いて前記ノイズマップを処理し、前記少なくとも一つの中間レイヤに前記処理されたノイズマップを提供することを特徴とする請求項１に記載の電子装置。

【請求項3】

前記プロセッサは、
前記少なくとも一つの中間レイヤのそれぞれの以前レイヤから出力される出力データに対応する複数のチャネル及び追加チャネルを前記少なくとも一つの中間レイヤのそれぞれに提供し、
前記追加チャネルは、前記少なくとも一つの中間レイヤのそれぞれに対応するサブレイヤから出力される前記処理されたノイズマップであることを特徴とする請求項２に記載の電子装置。

【請求項4】

前記プロセッサは、
前記複数のレイヤのうち出力レイヤの出力データ及び前記入力イメージをミキシングして前記出力イメージを獲得することを特徴とする請求項１−３のうちの何れか１項に記載の電子装置。

【請求項5】

前記プロセッサは、
前記入力イメージを複数のレイヤを含むノイズマップ生成モデルに適用して前記ノイズマップを獲得し、
前記ノイズマップ生成モデルは、
前記複数のサンプルイメージ及び各サンプルイメージに対するノイズマップの関係を人工知能アルゴリズムを通じて学習して獲得された人工知能モデルであることを特徴とする請求項１に記載の電子装置。

【請求項6】

前記プロセッサは、
前記複数のレイヤのそれぞれに前記ノイズマップを提供するか、前記複数のレイヤのうち入力レイヤを除く残りのレイヤのそれぞれに前記ノイズマップを提供することを特徴とする請求項１−５のうちの何れか１項に記載の電子装置。

【請求項7】

前記学習ネットワークモデルは、
前記複数のレイヤのうち入力レイヤに提供された前記複数のサンプルイメージのそれぞれと、前記少なくとも一つの中間レイヤに提供された前記複数のサンプルイメージのそれぞれのノイズマップが、前記複数のレイヤによって順次に処理されて獲得された出力イメージ、及び前記複数のサンプルイメージのそれぞれに対応する原本イメージの関係を前記人工知能アルゴリズムを通じて学習して獲得された人工知能モデルであることを特徴とする請求項１に記載の電子装置。

【請求項8】

前記プロセッサは、
動画に含まれた複数のフレームのそれぞれを前記入力イメージとして前記学習ネットワークモデルに適用し、前記動画の品質の改善された出力動画を獲得することを特徴とする請求項１−７のうちの何れか１項に記載の電子装置。

【請求項9】

ディスプレイを更に含み、
前記プロセッサは、
前記ディスプレイの解像度に基づいて前記出力イメージの解像度を変換し、前記解像度の変換されたイメージをディスプレイするように前記ディスプレイを制御し、
前記解像度の変換されたイメージは、
４ＫＵＨＤイメージ又は８ＫＵＨＤイメージであることを特徴とする請求項１に記載の電子装置。

【請求項10】

プロセッサは、
前記入力イメージを客体領域及び背景領域に区分し、
前記入力イメージ、前記ノイズマップ及び前記背景領域に対する情報を前記学習ネットワークモデルに適用して前記背景領域の品質を改善し、
前記入力イメージ、前記ノイズマップ及び前記客体領域に対する情報を、他の学習ネットワークモデルに適用して前記客体領域の品質を改善し、
前記品質の改善された客体領域及び前記品質の改善された背景領域に基づいて前記出力イメージを獲得することを特徴とする請求項１に記載の電子装置。

【請求項11】

前記学習ネットワークモデルは、ノイズを除去するための学習ネットワークモデルであり、
前記他の学習ネットワークモデルは、イメージの解像度をアップスケーリングするための学習ネットワークモデルであることを特徴とする請求項１０に記載の電子装置。

【請求項12】

前記プロセッサは、
前記入力イメージを客体領域及び背景領域に区分し、
前記客体領域に対する情報又は背景領域に対する情報のうち少なくとも一つを前記学習ネットワークモデルに適用して前記入力イメージの品質の改善された出力イメージを獲得することを特徴とする請求項１に記載の電子装置。

【請求項13】

電子装置の映像処理方法において、
入力イメージから前記入力イメージの品質を示すノイズマップを獲得するステップと、
学習ネットワークモデルに含まれた複数のレイヤのうち入力レイヤに入力イメージを提供し、前記複数のレイヤのうち少なくとも一つの中間レイヤに前記ノイズマップを提供するステップと、
前記入力イメージ及び前記ノイズマップを前記学習ネットワークモデルに適用し、前記入力イメージの品質の改善された出力イメージを獲得するステップと
を含み、
前記学習ネットワークモデルは、
複数のサンプルイメージ、各サンプルイメージに対するノイズマップ及び前記各サンプルイメージに対応する原本イメージの関係を人工知能アルゴリズムを通じて学習して獲得された学習済み人工知能モデルであり、
前記複数のサンプルイメージのそれぞれは、
原本イメージの圧縮された圧縮イメージであり、
前記各サンプルイメージに対するノイズマップは、
前記各サンプルイメージ及び前記各サンプルイメージに対応する原本イメージに基づいて獲得されたノイズマップである映像処理方法。

【請求項14】

前記学習ネットワークモデルは、
少なくとも一つのサブレイヤを更に含み、
前記提供するステップは、
前記少なくとも一つのサブレイヤを用いて前記ノイズマップを処理し、前記少なくとも一つの中間レイヤに前記処理されたノイズマップを提供することを特徴とする請求項１３に記載の映像処理方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、電子装置及びその映像処理方法に関し、より詳細には、入力データの品質が改善された出力イメージを獲得する電子装置及びその映像処理方法に関する。

【0002】

なお、本発明は、機械学習アルゴリズムを活用して人間の頭脳の認知、判断などの機能を模倣する人工知能（ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ：ＡＩ）システム及びその応用に関する。

【背景技術】

【0003】

近来は、人間のレベルに匹敵する知能を実現する人工知能システムが様々な分野で利用されている。人工知能システムは、従来のルール（ｒｕｌｅ）ベースのスマートシステムと違って、機械が自ら学習して判断することで賢くなるシステムである。人工知能システムは、使えば使うほど、認識率が向上し、ユーザの好みをより正確に理解することができるようになる。人工知能技術は、機械学習（例えば、ディープラーニング）及び機械学習を活用した要素技術で構成される。従来のルールベースのスマートシステムは、次第にディープラーニングベースの人工知能システムに切り替わりつつある。

【0004】

機械学習は、入力データの特徴を自ら分類／学習するアルゴリズム技術であり、要素技術は、ディープラーニングなどの機械学習アルゴリズムを活用して人間の頭脳の認知、判断などの機能を模倣する技術として、言語的な理解、視覚的な理解、推論／予測、知識表現、動作制御などの技術分野で構成される。

【0005】

このような人工知能技術は、多様かつ複雑なタイプのイメージノイズ除去に用いられてよい。特に、ビデオをストリーミングする場合、低いビット伝送率への圧縮過程でブロックエッジ及びリンギングノイズのように、視覚的に不愉快なノイズが生じるため、圧縮ノイズ減少（ＣＡＲ）が重要である。

【0006】

ノイズ除去のために、通常、イメージ劣化モデルｙ＝ｘ＋ｅが使用される。ここで、ｙは、ノイズのない綺麗なイメージｘとノイズｅで構成されたノイズのある観察されたイメージである。複数のイメージノイズ除去に関する学習は、非ローカル磁気類似性（ＮＳＳ）モデルとスパース（ｓｐａｒｓｅ）モデルとを含み、イメージ推定モデルを使用してｘを推定する。ＮＳＳモデルを使用する代表的な方法としては、ＢＭ３Ｄ又はＷＮＮがあるが、高いノイズ除去性能を達成するのには限界があった。

【0007】

最近は、このような限界を克服するために、識別（ｄｉｓｃｒｉｍｉｎａｔｉｖｅ）学習方法が開発されている。ＢＭ３ＤのようなＮＳＳモデルに比べて、より良い性能を提供する訓練が可能な非線形反応拡散（ＴＮＲＤ）が提案されているが、特定のノイズモデルに対してのみ学習されていることはデメリットになる可能性がある。

【0008】

そして、残差（ｒｅｓｉｄｕａｌ）学習法及びバッチ正規化（ｂａｔｃｈｎｏｒｍａｌｉｚａｔｉｏｎ）を採用したＤｎＣＮＮが提案されているが、イメージ品質評価のための別途のＣＮＮがないというデメリットがある。

【0009】

なお、不均一なノイズレベルマップを入力として使用し、空間的に変化するノイズを除去するＦＦＤＮｅｔが提案されているが、ノイズマップが与えられたと仮定すること、及びノイズマップが一番目のレイヤに対して一度だけ使用されるため、ＦＦＤＮｅｔの他のレイヤがノイズマップを完全に活用しきれないという限界がある。

【0010】

そして、単一画像超解像度（ＳｉｎｇｌｅＩｍａｇｅＳｕｐｅｒ−Ｒｅｓｏｌｕｔｉｏｎ：ＳＩＳＲ））のような残差高密度ネットワーク（ｒｅｓｉｄｕａｌｄｅｎｓｅｎｅｔｗｏｒｋ：ＲＤＮ）の場合には、残差高密度ブロックを有する全ての階層的特徴を完全に使用することができるというメリットがあるが、各ノイズレベルに合った特定のモデルのみを学習したという限界がある。

【0011】

それにより、入力イメージ内の空間的に変化するノイズを適応的に除去するための方法が開発される必要がある。

【先行技術文献】

【特許文献】

【0012】

【特許文献1】特許第３５８０９４７号公報

【特許文献2】米国特許第１００４３２４３号明細書

【発明の概要】

【発明が解決しようとする課題】

【0013】

そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、入力イメージに応じて適応的に品質を改善する電子装置及びその映像処理方法を提供することにある。

【課題を解決するための手段】

【0014】

以上のような目的を達成するための本発明の一実施形態に係る電子装置は、少なくとも一つの命令語を保存するメモリと、前記メモリと電気的に接続され、前記命令語を実行することで、入力イメージから前記入力イメージの品質（又はクオリティー）を示すノイズマップを獲得し、前記入力イメージ及び前記ノイズマップを複数のレイヤを含む学習ネットワークモデルに適用し、前記入力イメージの品質の改善された出力イメージを獲得するプロセッサとを含み、前記プロセッサは、前記複数のレイヤのうち少なくとも一つの中間レイヤに前記ノイズマップを提供し、前記学習ネットワークモデルは、複数のサンプルイメージ、各サンプルイメージに対するノイズマップ及び前記各サンプルイメージに対応する原本イメージの関係を人工知能アルゴリズムを通じて学習して獲得された学習済み人工知能モデルであってよい。

【0015】

なお、前記学習ネットワークモデルは、少なくとも一つのサブレイヤを更に含み、前記プロセッサは、前記少なくとも一つのサブレイヤを用いて前記ノイズマップを処理し、前記少なくとも一つの中間レイヤに前記処理されたノイズマップを提供してよい。

【0016】

ここで、前記プロセッサは、前記少なくとも一つの中間レイヤのそれぞれの以前レイヤから出力される出力データに対応する複数のチャネル及び追加チャネルを前記少なくとも一つの中間レイヤのそれぞれに提供し、前記追加チャネルは、前記少なくとも一つの中間レイヤのそれぞれに対応するサブレイヤから出力される前記処理されたノイズマップであってよい。

【0017】

一方、前記プロセッサは、前記複数のレイヤのうち出力レイヤの出力データ及び前記入力イメージをミキシングして前記出力イメージを獲得してよい。

【0018】

そして、前記プロセッサは、前記入力イメージを複数のレイヤを含むノイズマップ生成モデルに適用して前記ノイズマップを獲得し、前記ノイズマップ生成モデルは、前記複数のサンプルイメージ及び各サンプルイメージに対するノイズマップの関係を人工知能アルゴリズムを通じて学習して獲得された人工知能モデルであってよい。

【0019】

一方、前記プロセッサは、前記複数のレイヤのそれぞれに前記ノイズマップを提供するか、前記複数のレイヤのうち入力レイヤを除く残りのレイヤのそれぞれに前記ノイズマップを提供してよい。

【0020】

そして、前記学習ネットワークモデルは、前記複数のレイヤのうち入力レイヤに提供された前記複数のサンプルイメージのそれぞれと、前記少なくとも一つの中間レイヤに提供された前記複数のサンプルイメージのそれぞれのノイズマップが、前記複数のレイヤによって順次に処理されて獲得された出力イメージ、及び前記複数のサンプルイメージのそれぞれに対応する原本イメージの関係を前記人工知能アルゴリズムを通じて学習して獲得された人工知能モデルであってよい。

【0021】

一方、前記複数のサンプルイメージのそれぞれは、原本イメージの圧縮された圧縮イメージであり、前記各サンプルイメージに対するノイズマップは、前記各サンプルイメージ及び前記各サンプルイメージに対応する原本イメージから獲得されたノイズマップであってよい。

【0022】

そして、前記プロセッサは、動画に含まれた複数のフレームのそれぞれを前記入力イメージとして前記学習ネットワークモデルに適用し、前記動画の品質の改善された出力動画を獲得してよい。

【0023】

一方、電子装置は、ディスプレイを更に含み、前記プロセッサは、前記ディスプレイの解像度に基づいて前記出力イメージの解像度を変換し、前記解像度の変換されたイメージをディスプレイするように前記ディスプレイを制御し、前記解像度の変換されたイメージは、４ＫＵＨＤ（ＵｌｔｒａＨｉｇｈＤｅｆｉｎｉｔｉｏｎ）イメージ又は８ＫＵＨＤイメージであってよい。

【0024】

そして、プロセッサは、前記入力イメージを客体領域及び背景領域に区分し、前記入力イメージ、前記ノイズマップ及び前記背景領域に対する情報を前記学習ネットワークモデルに適用して前記背景領域の品質を改善し、前記入力イメージ、前記ノイズマップ及び前記客体領域に対する情報を、他の学習ネットワークモデルに適用して前記客体領域の品質を改善し、前記品質の改善された客体領域及び前記品質の改善された背景領域に基づいて前記出力イメージを獲得してよい。

【0025】

ここで、前記学習ネットワークモデルは、ノイズを除去するための学習ネットワークモデルであり、前記他の学習ネットワークモデルは、イメージの解像度をアップスケーリングするための学習ネットワークモデルであってよい。

【0026】

一方、前記プロセッサは、前記入力イメージを客体領域及び背景領域に区分し、前記客体領域に対する情報又は背景領域に対する情報のうち少なくとも一つを前記学習ネットワークモデルに適用して前記入力イメージの品質の改善された出力イメージを獲得してよい。

【0027】

一方、本発明の一実施形態に係る電子装置の映像処理方法は、入力イメージから前記入力イメージの品質を示すノイズマップを獲得するステップと、学習ネットワークモデルに含まれた複数のレイヤのうち入力レイヤに入力イメージを提供し、前記複数のレイヤのうち少なくとも一つの中間レイヤに前記ノイズマップを提供するステップと、前記入力イメージ及び前記ノイズマップを前記学習ネットワークモデルに適用し、前記入力イメージの品質の改善された出力イメージを獲得するステップとを含み、前記学習ネットワークモデルは、複数のサンプルイメージ、各サンプルイメージに対するノイズマップ及び前記各サンプルイメージに対応する原本イメージの関係を人工知能アルゴリズムを通じて学習して獲得された学習済み人工知能モデルであってよい。

【0028】

なお、前記学習ネットワークモデルは、少なくとも一つのサブレイヤを更に含み、前記提供するステップは、前記少なくとも一つのサブレイヤを用いて前記ノイズマップを処理し、前記少なくとも一つの中間レイヤに前記処理されたノイズマップを提供してよい。

【0029】

ここで、前記提供するステップは、前記少なくとも一つの中間レイヤのそれぞれの以前レイヤから出力される出力データに対応する複数のチャネル及び追加チャネルを前記少なくとも一つの中間レイヤのそれぞれに提供し、前記追加チャネルは、前記少なくとも一つの中間レイヤのそれぞれに対応するサブレイヤから出力される前記処理されたノイズマップであってよい。

【0030】

一方、前記出力イメージを獲得するステップは、前記複数のレイヤのうち出力レイヤの出力データ及び前記入力イメージをミキシングして前記出力イメージを獲得してよい。

【0031】

そして、前記ノイズマップを獲得するステップは、前記入力イメージを複数のレイヤを含むノイズマップ生成モデルに適用して前記ノイズマップを獲得し、前記ノイズマップ生成モデルは、前記複数のサンプルイメージ及び各サンプルイメージに対するノイズマップの関係を人工知能アルゴリズムを通じて学習して獲得された人工知能モデルであってよい。

【0032】

一方、前記提供するステップは、前記複数のレイヤのそれぞれに前記ノイズマップを提供するか、前記複数のレイヤのうち入力レイヤを除く残りのレイヤのそれぞれに前記ノイズマップを提供してよい。

【0033】

【0034】

【0035】

そして、前記出力イメージを獲得するステップは、動画に含まれた複数のフレームのそれぞれを前記入力イメージとして前記学習ネットワークモデルに適用し、前記動画の品質の改善された出力動画を獲得してよい。

【0036】

一方、電子装置のディスプレイの解像度に基づいて前記出力イメージの解像度を変換するステップと、前記解像度の変換されたイメージをディスプレイするステップとを含み、前記解像度の変換されたイメージは、４ＫＵＨＤ（ＵｌｔｒａＨｉｇｈＤｅｆｉｎｉｔｉｏｎ）イメージ又は８ＫＵＨＤイメージであってよい。

【発明の効果】

【0037】

以上説明したように、本発明によれば、電子装置は、入力イメージからノイズマップを獲得して入力イメージの品質をより正確に識別し、ノイズマップに基づいて適応的に動作する学習ネットワークモデルを用いることで入力イメージの品質を改善することができる。

【図面の簡単な説明】

【0038】

【図1】本発明の一実施形態に係る電子装置の実現例を説明するための図である。

【図2】本発明の一実施形態に係る電子装置の構成を示すブロック図である。

【図3A】本発明の多様な実施形態に係る学習ネットワークモデル及びノイズマップ生成モデルを説明するための図である。

【図3B】本発明の多様な実施形態に係る学習ネットワークモデル及びノイズマップ生成モデルを説明するための図である。

【図4】本発明の一実施形態に係るノイズマップ生成モデルの学習方法を説明するための図である。

【図5】本発明の一実施形態に係るイメージの品質を改善する学習ネットワークモデルの学習方法をするための図である。

【図6】本発明の一実施形態に係る電子装置の細部構成を示すブロック図である。

【図7】本発明の一実施形態に係る学習ネットワークモデルを学習して利用するための構成を示すブロック図である。

【図8A】本発明の多様な実施形態に係るノイズマップ生成モデルの性能を説明するための図である。

【図8B】本発明の多様な実施形態に係るノイズマップ生成モデルの性能を説明するための図である。

【図9A】本発明の多様な実施形態に係る入力イメージの品質を改善する学習ネットワークモデルの性能を説明するための図である。

【図9B】本発明の多様な実施形態に係る入力イメージの品質を改善する学習ネットワークモデルの性能を説明するための図である。

【図10A】本発明の多様な拡張実施形態を説明するための図である。

【図10B】本発明の多様な拡張実施形態を説明するための図である。

【図10C】本発明の多様な拡張実施形態を説明するための図である。

【図10D】本発明の多様な拡張実施形態を説明するための図である。

【図11】本発明の一実施形態に係る電子装置の映像処理方法を説明するためのフローチャートである。

【発明を実施するための形態】

【0039】

本発明の実施形態で使われる用語は、本発明における機能を考慮しつつ可能な限り、現在広く使われる一般的な用語を選択しているが、それは、当分野に携わる技術者の意図又は判例、新たな技術の出現などによって変わることがある。なお、特定の場合は、出願人が任意に選定した用語もあり、この場合は、該当する発明の説明部分で詳細にその意味を記載する。よって、本発明で使われる用語は、単なる用語の名称ではなく、その用語のもつ意味と本発明の全般に亘る内容に基づいて定義されるべきである。

【0040】

本明細書において、「有する」、「有してよい」、「含む」又は「含んでよい」などの表現は、当該特徴（例えば、数値、機能、動作又は部品などの構成要素）の存在を指し、更なる特徴の存在を排除するものではない。

【0041】

Ａ又は／及びＢのうち少なくとも一つという表現は、「Ａ」又は「Ｂ」、又は「Ａ及びＢ」のうちいずれか一つを示すものとして理解されるべきである。

【0042】

本明細書で使われた「第１」、「第２」、「第一」又は「第二」などの表現は、多様な構成要素を、順番及び／又は重要度によらず、数式することができ、いずれの構成要素を別の構成要素と区分するために使うだけで、当該構成要素を限定しない。

【0043】

いずれの構成要素（例えば、第１構成要素）が別の構成要素（例えば、第２構成要素）に「（機能的に又は通信的に）接続されて（（ｏｐｅｒａｔｉｖｅｌｙｏｒｃｏｍｍｕｎｉｃａｔｉｖｅｌｙ）ｃｏｕｐｌｅｄｗｉｔｈ/ｔｏ）」いるか、「接続されて（ｃｏｎｎｅｃｔｅｄｔｏ）」いると言及された際には、いずれの構成要素が別の構成要素に直接的に接続されるか、別の構成要素（例えば、第３構成要素）を介して接続され得ると理解されるべきである。

【0044】

単数の表現は、文脈上明白にそうでないことを意味しない限り、複数の表現を含む。本出願において、「含む」又は「構成される」などの用語は、明細書上に記載された特徴、数字、ステップ、動作、構成要素、部品又はそれらを組み合わせたものが存在することを指定するためのものであって、一つ又はそれ以上の別の特徴や数字、ステップ、動作、構成要素、部品又はそれらを組み合わせたものの存在又は付加可能性を予め排除しないと理解されるべきである。

【0045】

本発明において、「モジュール」或いは「部」は、少なくとも一つの機能や動作を行い、ハードウェア又はソフトウェアで実現されたり、ハードウェアとソフトウェアとの結合で実現されてよい。なお、複数の「モジュール」或いは複数の「部」は、特定のハードウェアで実現される必要がある「モジュール」或いは「部」を除いては、少なくとも一つのモジュールで一体化されて少なくとも一つのプロセッサ（図示せず）で実現されてよい。

【0046】

本明細書において、ユーザという用語は、電子装置を使う人又は電子装置を使う装置（例えば、人工知能電子装置）を指してよい。

【0047】

以下に、添付の図を参照し、本発明の一実施形態をより詳細に説明する。

【0048】

図１は、本発明の一実施形態に係る電子装置１００の実現例を説明するための図である。電子装置１００は、図１に示すように、テレビ、モニタ、スマートフォン、タブレットパソコン、ノートパソコン、ＨＭＤ（ＨｅａｄＭｏｕｎｔｅｄＤｉｓｐｌａｙ）、ＮＥＤ（ＮｅａｒＥｙｅＤｉｓｐｌａｙ）、ＬＦＤ（ＬａｒｇｅＦｏｒｍａｔＤｉｓｐｌａｙ）、ＤｉｇｉｔａｌＳｉｇｎａｇｅ（デジタル看板）、ＤＩＤ（ＤｉｇｉｔａｌＩｎｆｏｒｍａｔｉｏｎＤｉｓｐｌａｙ）、ビデオウォール（ｖｉｄｅｏｗａｌｌ）、プロジェクタディスプレイなどのように、ディスプレイ機能を備えた装置で実現されてよい。

【0049】

又は、電子装置１００は、サーバ、BDプレーヤ、ディスクプレーヤ、ストリーミングボックスのように、外部のディスプレイが備えられた装置としてイメージを提供する装置であってよい。

【0050】

電子装置１００は、これらの例に限定されるものではなく、イメージを映像処理できる装置なら如何なる装置でも構わない。

【0051】

電子装置１００は、多様なタイプのイメージを受信することができる。具体的に、電子装置１００は、ＳＤ（ＳｔａｎｄａｒｄＤｅｆｉｎｉｔｉｏｎ）、ＨＤ（ＨｉｇｈＤｅｆｉｎｉｔｉｏｎ）、ＦｕｌｌＨＤ、ＵｌｔｒａＨＤイメージのうちいずれか一つのイメージを受信することができる。又は、電子装置１００は、ＭＰＥＧ（例えば、ＭＰ２、ＭＰ４、ＭＰ７など）、ＡＶＣ、Ｈ.２６４、ＨＥＶＣなどに圧縮した形でイメージを受信することもできる。

【0052】

例えば、電子装置１００は、図１に示すように、電子装置１００のディスプレイと解像度が同一で、圧縮されていないイメージ１０−１を受信することができる。この場合、電子装置１００は、受信されたイメージ１０−１に対する映像処理なしに、イメージ１０−１をディスプレイすることができるが、常にイメージ１０−１のように品質の保障されたイメージが受信されるものではない。

【0053】

例えば、電子装置１００は、電子装置１００のディスプレイと解像度が同一だが、圧縮によって劣化しているイメージ１０−２を受信することもできる。この場合、電子装置１００は、劣化しているイメージ１０−２の品質を改善する必要がある。

【0054】

又は、電子装置１００は、電子装置１００のディスプレイより解像度の低いイメージ１０−３を受信することもできる。この場合、イメージ１０−３に対するアップスケーリングが行われてよいが、品質は低くなることがある。よって、電子装置１００は、アップスケーリングされる前のイメージ１０−３の品質を改善した後、品質の改善されたイメージをアップスケーリングするかアップスケーリングされたイメージの品質を改善する必要がある。

【0055】

その他にも、電子装置１００は、多様なタイプのイメージを受信することができ、各イメージの特性を考慮した品質改善を行う必要がある。以下では、電子装置１００のイメージ品質改善方法及び多様な実施形態について説明する。

【0056】

図２は、本発明の一実施形態に係る電子装置１００の構成を示すブロック図である。図２によると、電子装置１００は、メモリ１１０及びプロセッサ１２０を含む。

【0057】

メモリ１１０は、プロセッサ１２０と電気的に接続され、本発明の多様な実施形態のために必要なデータを保存することができる。例えば、メモリ１１０は、プロセッサ１２０に含まれたＲＯＭ（例えば、ＥＥＰＲＯＭ（ｅｌｅｃｔｒｉｃａｌｌｙｅｒａｓａｂｌｅｐｒｏｇｒａｍｍａｂｌｅｒｅａｄ−ｏｎｌｙｍｅｍｏｒｙ））、ＲＡＭなどの内部メモリで実現されたり、プロセッサ１２０と別途のメモリで実現されてよい。この場合、メモリ１１０は、データ保存用途に応じて、電子装置１００にエンベデッドされたメモリで実現されたり、電子装置１００に着脱可能なメモリで実現されてよい。例えば、電子装置１００の駆動のためのデータの場合、電子装置１００にエンベデッドされたメモリに保存され、電子装置１００の拡張機能のためのデータの場合、電子装置１００に着脱が可能なメモリに保存されてよい。一方、電子装置１００にエンベデッドされたメモリの場合、揮発性メモリ（例えば、ＤＲＡＭ（ｄｙｎａｍｉｃＲＡＭ）、ＳＲＡＭ（ｓｔａｔｉｃＲＡＭ）、又はＳＤＲＡＭ（ｓｙｎｃｈｒｏｎｏｕｓｄｙｎａｍｉｃＲＡＭ）など）、非揮発性メモリ（ｎｏｎ−ｖｏｌａｔｉｌｅＭｅｍｏｒｙ）（例えば、ＯＴＰＲＯＭ（ｏｎｅｔｉｍｅｐｒｏｇｒａｍｍａｂｌｅＲＯＭ）、ＰＲＯＭ（ｐｒｏｇｒａｍｍａｂｌｅＲＯＭ）、ＥＰＲＯＭ（ｅｒａｓａｂｌｅａｎｄｐｒｏｇｒａｍｍａｂｌｅＲＯＭ）、ＥＥＰＲＯＭ（ｅｌｅｃｔｒｉｃａｌｌｙｅｒａｓａｂｌｅａｎｄｐｒｏｇｒａｍｍａｂｌｅＲＯＭ）、ｍａｓｋＲＯＭ、ｆｌａｓｈＲＯＭ、フラッシュメモリ（例えば、ＮＡＮＤｆｌａｓｈ又はＮＯＲｆｌａｓｈなど）、ハードドライブ、又はソリッドステートドライブ（ｓｏｌｉｄｓｔａｔｅｄｒｉｖｅ（ＳＳＤ））のうち少なくとも一つで実現され、電子装置１００に着脱が可能なメモリの場合、メモリカード（例えば、ＣＦ（ｃｏｍｐａｃｔｆｌａｓｈ）、ＳＤ（ｓｅｃｕｒｅＤｉｇｉｔａｌ）、Ｍｉｃｒｏ−ＳＤ（ＭｉｃｒｏｓｅｃｕｒｅＤｉｇｉｔａｌ）、Ｍｉｎｉ−ＳＤ（ｍｉｎｉｓｅｃｕｒｅＤｉｇｉｔａｌ）、ｘＤ（ｅｘｔｒｅｍｅＤｉｇｉｔａｌ）、ＭＭＣ（ｍｕｌｔｉ−ｍｅｄｉａｃａｒｄ）など）、ＵＳＢポートに接続可能な外部メモリ（例えば、ＵＳＢメモリ）などのような形態で実現されてよい。

【0058】

メモリ１１０は、入力イメージの品質を改善するために用いられる学習ネットワークモデルを保存することができる。ここで、学習ネットワークモデルは、複数のサンプルイメージ、各サンプルイメージに対するノイズマップ及び各サンプルイメージに対応する原本イメージに基づいて機械学習（ＭａｃｈｉｎｅＬｅａｒｎｉｎｇ）されたモデルであってよい。例えば、学習ネットワークモデルは、複数のサンプルイメージ、各サンプルイメージに対するノイズマップ及び各サンプルイメージに対応する原本イメージにＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎＮｅｕｒａｌＮｅｔｗｏｒｋ、畳み込みニューラルネットワーク）学習されたモデルであってよい。ここで、ＣＮＮは、音声処理、イメージ処理などのために考案された特殊な接続構造を有する多層ニューラルネットワークである。

【0059】

ただし、それは一実施形態に過ぎず、学習ネットワークモデルは、ＲＮＮ（ＲｅｃｕｒｒｅｎｔＮｅｕｒａｌＮｅｔｗｏｒｋ）、ＤＮＮ（ＤｅｅｐＮｅｕｒａｌＮｅｔｗｏｒｋ）など、多様なニューラルネットワーク（ＮｅｕｒａｌＮｅｔｗｏｒｋ）に基づいた学習ネットワークモデルであってよい。

【0060】

一方、ノイズマップは、入力イメージの品質を示してよい。例えば、ノイズマップは、入力イメージに含まれた各ピクセルの品質を示す情報を含み、この場合、ノイズマップの大きさは、入力イメージの大きさと同じであってよい。仮に、入力イメージが４×４サイズなら、ノイズマップも４×４サイズであってよい。ただ、それに限定されるものではなく、ノイズマップが入力イメージの品質を示すとしたら、その形態、情報の表示方法などはいくらでも様々な方法が用いられてよい。仮に、ノイズマップの単位情報は、入力イメージの各ピクセル値に対応するものではなく、入力イメージの予め設定された大きさの領域別平均値に対応してよい。

【0061】

メモリ１１０は、入力イメージのノイズマップを獲得するためのノイズマップ生成モデルを更に保存することができる。ここで、ノイズマップ生成モデルは、複数のサンプルイメージ及び各サンプルイメージに対するノイズマップに基づいて機械学習されたモデルであってよい。

【0062】

入力イメージの品質を改善するために用いられる学習ネットワークモデル及びノイズマップ生成モデルに対する具体的な説明は、図面を参照して後述する。

【0063】

プロセッサ１２０は、メモリ１００と電気的に接続され、電子装置１００の動作全般を制御する。

【0064】

一実施形態によって、プロセッサ１２０は、デジタル映像信号を処理するデジタルシグナルプロセッサ（ｄｉｇｉｔａｌｓｉｇｎａｌｐｒｏｃｅｓｓｏｒ（ＤＳＰ））、マイクロプロセッサ（ｍｉｃｒｏｐｒｏｃｅｓｓｏｒ）、Ｔ−ＣＯＮ（Ｔｉｍｉｎｇｃｏｎｔｒｏｌｌｅｒ）で実現されてよい。ただ、それに限定されるものではなく、中央処理装置（ｃｅｎｔｒａｌｐｒｏｃｅｓｓｉｎｇｕｎｉｔ（ＣＰＵ））、ＭＣＵ（ＭｉｃｒｏＣｏｎｔｒｏｌｌｅｒＵｎｉｔ）、ＭＰＵ（ＭｉｃｒｏＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、コントローラ（ｃｏｎｔｒｏｌｌｅｒ）、アプリケーションプロセッサ（ＡｐｐｌｉｃａｔｉｏｎＰｒｏｃｅｓｓｏｒ（ＡＰ））、又はコミュニケーションプロセッサ（ＣｏｍｍｕｎｉｃａｔｉｏｎＰｒｏｃｅｓｓｏｒ（ＣＰ））、ＡＲＭプロセッサのうち、一つ又はそれ以上を含むか、当該用語で定義されてよい。なお、プロセッサ１２０は、プロセッシングアルゴリズムの内蔵されたＳｏＣ（ＳｙｓｔｅｍｏｎＣｈｉｐ）、ＬＳＩ（ＬａｒｇｅＳｃａｌｅＩｎｔｅｇｒａｔｉｏｎ）で実現されてよく、ＦＰＧＡ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）形態で実現されてよい。

【0065】

プロセッサ１２０は、入力イメージを映像処理して入力イメージの品質の改善された出力イメージを獲得することができる。

【0066】

特に、プロセッサ１２０は、入力イメージから入力イメージの品質を示すノイズマップを獲得し、入力イメージ及びノイズマップを複数のレイヤを含む学習ネットワークモデルに適用して入力イメージの品質の改善された出力イメージを獲得することができる。入力イメージの品質改善過程で入力イメージから獲得されたノイズマップが用いられることで、入力イメージのタイプに応じて適応的に品質改善が行われ、品質改善効果が向上し得る。

【0067】

ここで、学習ネットワークモデルは、複数のサンプルイメージ、各サンプルイメージに対するノイズマップ及び各サンプルイメージに対応する原本イメージの関係を人工知能アルゴリズムを通じて学習して獲得された人工知能モデルであってよい。なお、学習ネットワークモデルの複数のレイヤは、入力レイヤ、中間レイヤ及び出力レイヤを含んでよい。入力レイヤは、複数のレイヤのうち最も先に演算が行われるレイヤであり、出力レイヤは、複数のレイヤのうち最も最後に演算が行われるレイヤであり、中間レイヤは、入力レイヤ及び出力レイヤの間に配置されたレイヤであってよい。

【0068】

そして、プロセッサ１２０は、複数のレイヤのうち、少なくとも一つの中間レイヤにノイズマップを提供することができる。特に、プロセッサ１２０は、複数のレイヤのそれぞれにノイズマップを提供するか、複数のレイヤのうち入力レイヤを除く残りのレイヤのそれぞれにノイズマップを提供することができる。このような動作を通じ、入力イメージの品質改善過程でイメージの品質が継続的に反映されて品質改善性能が向上されてよい。

【0069】

仮に、複数のレイヤのうち、入力レイヤにのみノイズマップが提供されるとすると、複数のレイヤを通るうちに、ノイズマップの特性が劣化して品質改善性能が低下してしまうことが懸念される。

【0070】

又は、複数のレイヤのうち、出力レイヤにのみノイズマップが提供されるとすると、複数のレイヤを通る間にノイズマップが反映されず、結局出力レイヤにのみノイズマップを反映させた状態で品質改善を試みることになる。通常、学習ネットワークモデルのレイヤが多くなるにつれて性能が向上するという点を考慮すると、出力レイヤ一つのみでノイズマップを反映しようとしても性能の向上は期待し難いことが予想される。

【0071】

よって、プロセッサ１２０は、少なくとも一つの中間レイヤにノイズマップを提供することにより、入力レイヤ又は出力レイヤにのみノイズマップを提供する場合よりも品質改善効果を向上させることができる。

【0072】

一方、学習ネットワークモデルは、少なくとも一つのサブレイヤを更に含み、プロセッサ１２０は少なくとも一つのサブレイヤを用いてノイズマップを処理し、少なくとも一つの中間レイヤに処理されたノイズマップを提供することができる。

【0073】

プロセッサ１２０は、少なくとも一つの中間レイヤのそれぞれの以前レイヤから出力される出力データに対応する複数のチャネル及び追加チャネルを少なくとも一つの中間レイヤのそれぞれに提供することができる。ここで、追加チャネルは、少なくとも一つの中間レイヤのそれぞれに対応するサブレイヤから出力される処理されたノイズマップであってよい。即ち、プロセッサ１２０は、少なくとも一つの中間レイヤのそれぞれの以前レイヤから出力される出力データと少なくとも一つの中間レイヤのそれぞれに対応するサブレイヤから出力される処理されたノイズマップをミキシングせずに、並列的に接続して少なくとも一つの中間レイヤのそれぞれに提供してよい。

【0074】

一方、プロセッサ１２０は、学習ネットワークモデルに含まれた複数のレイヤのうち、入力レイヤに入力イメージを提供してよい。この場合、学習ネットワークモデルは、複数のレイヤのうち入力レイヤに提供された複数のサンプルイメージのそれぞれと少なくとも一つの中間レイヤに提供された複数のサンプルイメージのそれぞれのノイズマップが、複数のレイヤによって順次に処理されて獲得された出力イメージ、及び複数のサンプルイメージのそれぞれに対応する原本イメージの関係を人工知能アルゴリズムを通じて学習して獲得された人工知能モデルであってよい。

【0075】

又は、プロセッサ１２０は、入力レイヤに入力イメージを提供し、出力レイヤの出力データ及び入力イメージをミキシングして出力イメージを獲得することもできる。即ち、プロセッサ１２０は、入力レイヤだけでなく、出力レイヤの後端にも入力レイヤを提供することもできる。この場合、学習ネットワークモデルは、複数のレイヤのうち入力レイヤに提供された複数のサンプルイメージのそれぞれと少なくとも一つの中間レイヤに提供された複数のサンプルイメージのそれぞれのノイズマップが、複数のレイヤによって順次に処理されて獲得された出力データと複数のサンプルイメージのそれぞれがミキシングされた出力イメージ、及び複数のサンプルイメージのそれぞれに対応する原本イメージの関係を人工知能アルゴリズムを通じて学習して獲得された人工知能モデルであってよい。

【0076】

ここで、複数のサンプルイメージのそれぞれは、原本イメージの圧縮された圧縮イメージであり、各サンプルイメージに対するノイズマップは、各サンプルイメージ及び各サンプルイメージに対応する原本イメージから獲得されたノイズマップであってよい。

【0077】

一方、プロセッサ１２０は、入力イメージを複数のレイヤを含むノイズマップ生成モデルに適用してノイズマップを獲得することができる。ここで、ノイズマップ生成モデルは、複数のサンプルイメージ及び各サンプルイメージに対するノイズマップの関係を人工知能アルゴリズムを通じて学習して獲得された人工知能モデルであってよい。

【0078】

一方、イメージの品質改善のための学習ネットワークモデルを学習する場合、及びノイズマップ生成モデルを学習する場合、いずれも同様の複数のサンプルイメージ及び各サンプルイメージに対するノイズマップを用いることができる。ただ、それに限定されるものではなく、イメージの品質改善のための学習ネットワークモデルを学習する場合の学習データとノイズマップ生成モデルを学習する場合の学習データとは相互異なってよい。

【0079】

一方、電子装置１００は、ディスプレイ（図示せず）を更に含み、プロセッサ１２０は、ディスプレイの解像度に基づいて出力イメージの解像度を変換し、解像度の変換されたイメージをディスプレイするようにディスプレイを制御することができる。ここで、解像度の変換されたイメージは、４ＫＵＨＤ（ＵｌｔｒａＨｉｇｈＤｅｆｉｎｉｔｉｏｎ）イメージ又は８ＫＵＨＤイメージであってよい。

【0080】

又は、プロセッサ１２０は、動画に含まれた複数のフレームのそれぞれを入力イメージとして学習ネットワークモデルに適用して動画の品質の改善された出力動画を獲得することもできる。例えば、プロセッサ１２０は、動画をデコードし、デコードされた動画の各フレームを入力イメージとして学習ネットワークモデルに適用して品質を改善し、複数の品質の改善されたフレームを組み合わせて品質の改善された出力動画を獲得することもできる。ここで、プロセッサ１２０は、各フレームのノイズマップを獲得し、各フレームの品質改善に獲得されたノイズマップを用いることもできる。

【0081】

以上のように、プロセッサ１２０は、ノイズマップを入力イメージとして獲得することにより、適応的に入力イメージの品質を改善することができる。なお、プロセッサ１２０は、学習ネットワークモデルに含まれた複数のレイヤのうち少なくとも一つの中間レイヤにノイズマップを提供することで、入力イメージの品質を継続的に反映いした状態で映像処理を行うことができる。それにより、入力イメージの品質改善性能が向上してよい。

【0082】

以下では、図面を参照し、プロセッサ１２０の動作をより具体的に説明する。

【0083】

図３Ａ及び図３Ｂは、本発明の多様な実施形態に係る学習ネットワークモデル及びノイズマップ生成モデルを説明するための図である。

【0084】

まず、プロセッサ１２０は、図３Ａに示すように、入力イメージをノイズマップ生成モデル（ＱｕａｌｉｔｙＥｓｔｉｍａｔｉｏｎＣｏｎｖｏｌｕｔｉｏｎＮｅｕｒａｌＮｅｔｗｏｒｋ：ＱＥＣＮＮ）３１０に適用してノイズマップを獲得することができる。

【0085】

ノイズマップ生成モデル３１０は、複数の畳み込みレイヤを含んでよい。例えば、複数の畳み込みレイヤのそれぞれは、５×５のカーネルを用いて入力データに対する畳み込みを行うことができる。ただ、それに限定されるものではなく、任意の別の形態のカーネルが用いられてよい。なお、一つの畳み込みレイヤは、複数のカーネルをそれぞれ用いて入力データに対する畳み込みを行うこともできる。

【0086】

複数の畳み込みレイヤのうちの一部は畳み込みを行った後、ＲｅＬＵ（ＲｅｃｔｉｆｉｅｄＬｉｎｅａｒＵｎｉｔ）関数を用いて入力データを処理することもできる。ＲｅＬＵ関数は、入力値が０より小さい場合は０に変換し、入力値が０より大きい場合には入力値をそのまま出力する関数である。ただ、それに限定されるものではなく、様々な活性化関数を利用することができる。例えば、複数の畳み込みレイヤのうちの一部は、シグモイド関数を用いて入力データを処理することもできる。

【0087】

プロセッサ１２０は、入力イメージを学習ネットワークモデル（ＣｏｍｐｒｅｓｓｉｏｎＡｒｔｉｆａｃｔＲｅｄｕｃｔｉｏｎＣｏｎｖｏｌｕｔｉｏｎＮｅｕｒａｌＮｅｔｗｏｒｋ：ＣＡＲＣＮＮ）３２０−１に適用して入力イメージの品質の改善された出力イメージを獲得することができる。このとき、プロセッサ１２０は、複数のレイヤのうち少なくとも一つの中間レイヤにノイズマップを提供することができる。例えば、プロセッサ１２０は、図３Ａに示すように、複数のレイヤのうち入力レイヤを除く残りのレイヤのそれぞれにノイズマップを提供することができる。

【0088】

学習ネットワークモデル３２０−１は、複数の畳み込みレイヤ及び複数のサブ畳み込みレイヤ３３０を含んでよい。例えば、複数の畳み込みレイヤのそれぞれは、３×３のカーネルを用いて入力データに対する畳み込みを行い、複数のサブ畳み込みレイヤ３３０は、１×１のカーネルを用いてノイズマップに対する畳み込みを行うことができる。ただ、それに限定されるものではなく、いくらでも別の形態のカーネルが用いられてよい。なお、一つの畳み込みレイヤは、複数のカーネルをそれぞれを用いて入力データに対する畳み込みを行うこともできる。

【0089】

複数の畳み込みレイヤのうちの一部は畳み込みを行った後、ＲｅＬＵ関数を用いて入力データを処理することもできる。複数の畳み込みレイヤのうちの別の一部は、畳み込みを行った後、バッチ正規化（ＢａｔｃｈＮｏｒｍａｌｉｚａｔｉｏｎ：ＢＮ）及びＲｅＬＵ関数を用いて、入力データを処理することもできる。バッチ正規化は、速い学習速度の確保のために、各レイヤの分布を同様にする作業である。

【0090】

複数の畳み込みレイヤのうち入力レイヤから出力される出力データは、入力レイヤに含まれたカーネルの数に対応するチャネルに区分されてよい。そして、複数のサブ畳み込みレイヤ３３０のうち入力レイヤに対応するサブ畳み込みレイヤ３３０から出力される出力データは、入力レイヤから出力される出力データに接続（ｃｏｎｃａｔｅｎａｔｉｏｎ）され、入力レイヤの次のレイヤに入力されてよい。例えば、入力レイヤから３６のチャネルで構成された出力データが出力され、入力レイヤに対応するサブ畳み込みレイヤ３３０から１のチャネルで構成された出力データが出力され、計３７のチャネルで構成された出力データが入力レイヤの次のレイヤに入力されてよい。チャネルの数は、複数の畳み込みレイヤのそれぞれの特性に応じて異なってよく、残りの畳み込みレイヤでも類似する動作を行うことができる。

【0091】

プロセッサ１２０は、複数の畳み込みレイヤのうち、出力レイヤの出力データ及び入力イメージをミキシングして入力イメージの品質の改善された出力イメージを獲得することができる。

【0092】

以上のように、プロセッサ１２０は、入力イメージに対応するノイズマップを獲得し、入力イメージの品質改善過程でノイズマップを継続的に反映することで品質改善性能を向上させることができる。

【0093】

一方、図３Ａの学習ネットワークモデル３２０−１は、ＤｎＣＮＮ（ＤｅｎｏｉｓｅＣｏｎｖｏｌｕｔｉｏｎＮｅｕｒａｌＮｅｔｗｏｒｋ）形態にノイズマップを継続的に反映するための複数のサブ畳み込みレイヤ３３０が追加された形態を示しているが、図３Ｂのように、学習ネットワークモデル３２０−２は、ＲＤＮ（ＲｅｓｉｄｕａｌＤｅｎｓｅＮｅｔｗｏｒｋ）形態にノイズマップを継続的に反映するための複数のサブ畳み込みレイヤ３３０が追加された形態で実現されてよい。図３ＢのＲＤＢ（ＲｅｓｉｄｕａｌＤｅｎｓｅＢｌｏｃｋ）レイヤは、ＲｅｓｉｄｕａｌブロックとＤｅｎｓｅブロックとが組み合わせられた形態で複数の畳み込みレイヤを含み、複数の畳み込みレイヤのそれぞれの出力が順次に次の畳み込みレイヤに入力されて更に別の位置に配置された畳み込みレイヤにも入力されてよい。そして、ＲＤＢレイヤの最初の入力データと最後のレイヤを通ったデータのミキシングされた出力データがＲＤＢレイヤから出力されてよい。図３Ｂの場合にも、図３Ａと同様のノイズマップ生成モデル３１０が用いられてよい。

【0094】

学習ネットワークモデル３２０−１は、これらの例に限定されるものではなく、ノイズマップを継続的に反映することができる形態なら、如何なる基本モデルを用いるとしても構わない。

【0095】

一方、図３Ａ及び図３Ｂのモデルは、ソフトウェアとして実現されてメモリ１１０に保存された状態であり、プロセッサ１２０は、メモリ１１０から各レイヤの動作を行うためのデータを読み出して入力イメージに対する処理を行うことができる。

【0096】

図４は、本発明の一実施形態に係るノイズマップ生成モデルの学習方法を説明するための図である。

【0097】

ノイズマップ生成モデルは、複数のサンプルイメージ及び各サンプルイメージに対するノイズマップの関係を人工知能アルゴリズムを通じて学習して獲得された人工知能モデルであってよい。例えば、図４に示すように、ノイズマップ生成モデルは、第１サンプルイメージ４１０−１の入力による出力データと第１サンプルイメージ４１０−１の第１ノイズマップ４２０−１の関係を人工知能アルゴリズムを通じて学習してよい。そして、残りのデータの対（４１０−２、４２０−２）、（４１０−３、４２０−３）、（４１０−４、４２０−４）、…の関係についても、同様の学習過程を繰り返してノイズマップ生成モデルが獲得されてよい。ここで、各サンプルイメージに対するノイズマップは、ルールベースの予め設定されたアルゴリズムを通じて獲得されたノイズマップであってよい。例えば、第１サンプルイメージ４１０−１ないし第４サンプルイメージ４１０−４は、それぞれＪＰＥＧ品質１０、３０、５０、９０のイメージであり、第１ノイズマップ４２０−１ないし第４ノイズマップ４２０−４は、それぞれ第１サンプルイメージ４１０−１ないし第４サンプルイメージ４１０−４の対するノイズマップであってよい。

【0098】

一方、ノイズマップ生成モデルは、電子装置１００ではない、他の装置で学習されたモデルであってよい。ただ、それに限定されるものではなく、電子装置１００のプロセッサ１２０がノイズマップ生成モデルを学習することもできる。

【0099】

図５は、本発明の一実施形態に係るイメージの品質を改善する学習ネットワークモデルの学習方法をするための図である。

【0100】

学習ネットワークモデルの学習方法は、複数のサンプルイメージ、各サンプルイメージに対するノイズマップ及び各サンプルイメージに対応する原本イメージの関係を人工知能アルゴリズムを通じて学習して獲得された人工知能モデルであってよい。例えば、図５に示すように、学習ネットワークモデルは、第１サンプルイメージ５２０−１の入力及び第１サンプルイメージ５２０−１に対する第１ノイズマップ５３０−１の入力による出力データと第１サンプルイメージ５２０−１に対応する原本イメージ５１０の関係を人工知能アルゴリズムを通じて学習してよい。そして、残りのデータグループ（５２０−２、５３０−２、５１０）、（５２０−３、５３０−３、５１０）の関係に対しても、同じ学習過程を繰り返して学習ネットワークモデルが獲得されてよい。ここで、各サンプルイメージに対するノイズマップは、ルールベースの予め設定されたアルゴリズムを通じて獲得されたノイズマップであってよい。

【0101】

一方、図５では、原本イメージ５１０が一種類であるとして示されているが、実際の学習過程では複数の原本イメージが用いられてよい。即ち、図５の原本イメージ５１０の他に、追加の原本イメージ及び追加の原本イメージを様々な圧縮率で圧縮した複数のサンプルイメージ、及び各サンプルイメージに対するノイズマップが学習過程で用いられてよい。

【0102】

一方、学習ネットワークモデルは、電子装置１００でない別の装置で学習されたモデルであってよい。ただ、それに限定されるものではなく、電子装置１００のプロセッサ１２０が学習ネットワークモデルを学習することもできる。

【0103】

図６は、本発明の一実施形態に係る電子装置１００の細部構成を示すブロック図である。図６によると、電子装置１００は、メモリ１１０、プロセッサ１２０、入力部１３０、ディスプレイ１４０及びユーザインターフェース１５０を含んでよい。

【0104】

メモリ１１０には、少なくとも一つの命令語が保存されてよい。プロセッサ１２０は、メモリ１１０に保存された命令語を実行し、上述のような入力イメージのノイズマップ獲得動作、入力イメージの品質改善動作、各人工知能モデルの学習動作などを行うことができる。図６に示す構成のうち、図２に示す構成と重複する構成については、詳細な説明を省略する。

【0105】

入力部１３０は、多様なタイプのコンテンツ、例えば、入力イメージを受信する、例えば、入力部１３０は、ＡＰベースのＷｉ−Ｆｉ（ＷｉｒｅｌｅｓｓＬＡＮネットワーク）、ブルートゥース（登録商標（Ｂｌｕｅｔｏｏｔｈ））、Ｚｉｇｂｅｅ、有／無線ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、ＷＡＮ、イーサネット（登録商標）、ＩＥＥＥ１３９４、ＨＤＭＩ（登録商標（ＨｉｇｈＤｅｆｉｎｉｔｉｏｎＭｕｌｔｉｍｅｄｉａＩｎｔｅｒｆａｃｅ））、ＭＨＬ（ＭｏｂｉｌｅＨｉｇｈ−ＤｅｆｉｎｉｔｉｏｎＬｉｎｋ）、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）、ＤＰ（ＤｉｓｐｌａｙＰｏｒｔ）、サンダーボルト（Ｔｈｕｎｄｅｒｂｏｌｔ）、ＶＧＡ（ＶｉｄｅｏＧｒａｐｈｉｃｓＡｒｒａｙ）ポート、ＲＧＢポート、D−ＳＵＢ（Ｄ−ｓｕｂｍｉｎｉａｔｕｒｅ）、ＤＶＩ（ＤｉｇｉｔａｌＶｉｓｕａｌＩｎｔｅｒｆａｃｅ）などのような通信方式を通じて外部装置（例えば、ソース装置）、外部保存媒体（例えば、ＵＳＢ）、外部サーバ（例えば、ウェブハード）などからストリーミング又はダウンロードの方式で映像信号を受信することができる。ここで、入力イメージは、デジタル信号であってよいが、それに限定されるものではない。なお、入力部１３０を介して動画が受信されてよい。

【0106】

ディスプレイ１４０は、ＬＣＤ（ｌｉｑｕｉｄｃｒｙｓｔａｌｄｉｓｐｌａｙ）、ＯＬＥＤ（ｏｒｇａｎｉｃｌｉｇｈｔ−ｅｍｉｔｔｉｎｇＤｉｏｄｅ）、ＥＤ（Ｌｉｇｈｔ−ＥｍｉｔｔｉｎｇＤｉｏｄｅ）、ｍｉｃｒｏＬＥＤ、ＬＣｏＳ（ＬｉｑｕｉｄＣｒｙｓｔａｌｏｎＳｉｌｉｃｏｎ）、ＤＬＰ（ＤｉｇｉｔａｌＬｉｇｈｔＰｒｏｃｅｓｓｉｎｇ）、ＱＤ（ｑｕａｎｔｕｍｄｏｔ）ディスプレイパネルなどのような多様な形態で実現できる。

【0107】

プロセッサ１２０は、入力イメージの品質の改善された出力イメージをディスプレイするようにディスプレイ１４０を制御してよい。

【0108】

ユーザインターフェース１５０は、ボタン、タッチパッド、マウス及びキーボードのような装置で実現されるか、上述のディスプレイ機能及び操作入力機能も併せて実行可能なタッチスクリーン、リモコン受信部などで実現されてよい。ここで、ボタンは、電子装置１００の本体外観の全面部や側面部、背面部などの任意の領域に形成された機械的ボタン、タッチパッド、ホイールなどのような多様なボタンであってよい。

【0109】

プロセッサ１２０は、ユーザインターフェース１５０を介して入力されたユーザ命令に応じて入力イメージの品質改善動作を行ってよい。

【0110】

図７は、本発明の一実施形態に係る学習ネットワークモデルを学習して利用するための構成を示すブロック図である。学習と映像処理が別個の装置で行われてよいが、図７では、説明の便宜上、電子装置１００が学習ネットワークモデルを学習するものとして説明する。

【0111】

図７を参照すると、プロセッサ１２０は、学習部７１０又は映像処理部７２０のうち少なくとも一方を含んでよい。

【0112】

学習部７１０は、入力イメージからノイズマップを獲得するモデル及び入力イメージの品質を改善するモデルを生成又は学習させることができる。学習部７１０は、収集された学習データを用いて判断基準を有する認識モデルを生成することができる。

【0113】

一例として、学習部７１０は、入力イメージ及び入力イメージに対するノイズマップを学習データとして用いて入力イメージからノイズマップを獲得するためのモデルを生成、学習又は更新させることができる。なお、学習部７１０は、入力イメージ、入力イメージに対するノイズマップ及び入力イメージに対応する原本イメージを学習データとして用いて、入力イメージ及びノイズマップから原本イメージを獲得するためのモデルを生成、学習又は更新させることができる。

【0114】

映像処理部７２０は、所定のデータ（例えば、入力イメージ）を学習ネットワークモデルの入力データとして使用し、所定のデータの品質の改善された出力データを獲得することができる。

【0115】

一例として、映像処理部７２０は、入力イメージのノイズマップを獲得し、ノイズマップに基づいて入力イメージの品質の改善された出力イメージを獲得することができる。

【0116】

学習部７１０の少なくとも一部及び映像処理部７２０の少なくとも一部は、ソフトウェアモジュールで実現されてもよいし、少なくとも一つのハードウェアチップで製作され、電子装置１００に搭載されてよい。例えば、学習部７１０及び映像処理部７２０のうち少なくとも一つは、人工知能（ＡＩ：ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ）のための専用ハードウェアチップで製作されてよく、又は従来の汎用プロセッサ（例えば、ＣＰＵ又はＡｐｐｌｉｃａｔｉｏｎＰｒｏｃｅｓｓｏｒ）又はグラフィック専用プロセッサ（例えば、ＧＰＵ）の一部で製作され、上述の各種電子装置又は客体認識装置に搭載されてよい。このとき、人工知能のための専用ハードウェアチップは、確率演算に特化している専用プロセッサとして、従来の汎用プロセッサより並列処理性能が高く、機械学習のような人工知能分野の演算作業を素早く処理することができる。学習部７１０及び映像処理部７２０がソフトウェアモジュール（又は、命令（ｉｎｓｔｒｕｃｔｉｏｎ）を含むプログラムモジュール）で実現される場合、ソフトウェアモジュールは、コンピュータで読み取れる読み取り可能な非一時的な読み取り可能記録媒体（ｎｏｎ−ｔｒａｎｓｉｔｏｒｙｃｏｍｐｕｔｅｒｒｅａｄａｂｌｅｍｅｄｉａ）に保存されてよい。この場合、ソフトウェアモジュールは、ＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）によって提供されるか、所定のアプリケーションによって提供されてよい。又は、ソフトウェアモジュールのうち一部は、ＯＳによって提供され、残りの一部は所定のアプリケーションによって提供されてよい。

【0117】

この場合、学習部７１０及び映像処理部７２０は、一つの電子装置に搭載されてよく、又は別個の映像処理装置にそれぞれ搭載されてよい。例えば、学習部７１０及び映像処理部７２０のうちの一方は、電子装置１００に含まれ、他方は外部のサーバに含まれてよい。なお、学習部７１０及び映像処理部７２０は、有線又は無線で学習部７１０の構築したモデル情報を映像処理部７２０に提供することもでき、学習部７１０に入力されたデータが追加学習データとして学習部７１０に提供されてよい。

【0118】

図８Ａ及び図８Ｂは、本発明の多様な実施形態に係るノイズマップ生成モデルの性能を説明するための図である。

【0119】

まず、図８Ａには、イメージの品質による第１ノイズマップとノイズマップ生成モデルから出力された第２ノイズマップの平均二乗誤差（ＭｅａｎＳｑｕａｒｅＥｒｒｏｒ）を示しており、ＬＩＶＥ１映像データセットが用いられている。例えば、原本イメージを圧縮する場合、圧縮されたイメージからルールベースの予め設定されたアルゴリズムを通じて第１ノイズマップを獲得することができ、圧縮されたイメージをノイズマップ生成モデルに適用して第２ノイズマップを獲得することができ、第１ノイズマップ及び第２ノイズマップの平均二乗誤差を獲得することができる。

【0120】

図８ＡのＱ（圧縮因子）は、圧縮による品質を示し、１０から９０に進むにつれて原本イメージに近づく。なお、レイヤが８個である場合、１２個の場合及び１６個の場合を区分しており、レイヤが多くなるにつれて平均二乗誤差が低くなり得る。それは、図８Ｂにより明確に示されている。

【0121】

そして、レイヤが一定数以上である場合、Ｑとは関係なく、第１ノイズマップと非常に類似する第２ノイズマップが獲得されていることが分かる。

【0122】

図９Ａ及び図９Ｂは、本発明の多様な実施形態に係る入力イメージの品質を改善する学習ネットワークモデルの性能を説明するための図である。

【0123】

図９Ａは、ｃｌａｓｓｉｃ５又はＬＩＶＥ１映像データセットでＱが１０から９０までの圧縮イメージを多様な方法で圧縮雑音を軽減させた後、算出した平均ＰＳＮＲ／ＳＳＩＭ結果を示す。ＰＳＮＲ（ＰｅａｋＳｉｇｎａｌ−ｔｏ−ＮｏｉｓｅＲａｔｉｏ）は、最大信号対雑音比として、信号が有することができる最大電力に対する雑音の電力を示し、ＳＳＩＭ（ＳｔｒｕｃｔｕｒａｌＳｉｍｉｌａｒｉｔｙＩｎｄｅｘ）は、構造的な類似指数として、圧縮及び変換によって発生する歪曲に対して原本映像に対する類似度を示す。

【0124】

図９Ａに示すように、Ｑが高くなるにつれて品質改善性能が優れており、従来のＤｎＣＮＮよりＱＥＤｎＣＮＮの性能が改善されており、従来のＲＤＮよりＱＥＲＤＮの性能が改善されていることを確認することができる。

【0125】

図９Ｂは、ＱＥＤｎＣＮＮとＱＥＲＤＮとを比較した図として、通常、ＱＥＤｎＣＮＮがＱＥＲＤＮより性能が優れていることが分かる。

【0126】

図１０Ａ及び図１０Ｂは、本発明の多様な拡張実施形態を説明するための図である。

【0127】

プロセッサ１２０は、入力イメージ内の客体領域及び背景領域を区分して入力イメージの品質を改善することもできる。例えば、プロセッサ１２０は、図１０Ａに示すように、原本イメージを客体のみを含む客体イメージおよび客体を除く残りの領域のみを含む背景イメージに区分し、客体イメージ及び背景イメージのそれぞれの品質を改善し、品質の改善された客体イメージ及び品質の改善された背景イメージを合成して品質の改善された出力イメージを獲得することもできる。

【0128】

プロセッサ１２０は、多様な方法で入力イメージの客体領域及び背景領域を識別することができる。例えば、プロセッサ１２０は、ピクセル値に基づいて入力イメージ内で予め設定された形状の客体を識別し、客体の識別された領域を除く残りの領域を背景領域に識別することができる。

【0129】

又は、プロセッサ１２０は、客体認識のための人工知能モデルを用いて入力イメージ内で予め設定された形状の客体を識別し、客体の識別された領域を除く残りの領域を背景領域に識別することもできる。

【0130】

以上の例は一実施形態に過ぎず、プロセッサ１２０は、いくらでも多様な方法で入力イメージ内の客体領域及び背景領域を識別することができる。

【0131】

プロセッサ１２０は、複数のイメージ品質改善モデルを用いて客体領域及び背景領域を区分してイメージ処理することができる。例えば、プロセッサ１２０は、図１０Ｂに示すように、入力イメージ及び入力イメージ内の客体領域情報を第１イメージ品質改善モデル１０１０に適用して入力イメージ内の客体領域の品質を改善し、入力イメージ及び入力イメージ内の背景領域情報を第２イメージ品質改善モデル１０２０に適用して入力イメージ内の背景領域の品質を改善することができる。そして、プロセッサ１２０は、品質の改善された客体領域及び品質の改善された背景領域を合成し、入力イメージの品質の改善された出力イメージを獲得することができる。

【0132】

ここで、客体領域情報は、図１０Ａの左下のような図であり、背景領域情報は、図１０Ａの右下のような図であってよい。又は、客体領域情報及び背景領域情報は、ピクセル値を含まずに、客体領域と背景領域とを区分するための領域情報のみを含むこともできる。例えば、客体領域情報は、客体領域を１に表示し、背景領域を０に表示するイメージであり、背景領域情報は背景領域を１に表示し、客体領域を０に表示するイメージであってよい。

【0133】

第１イメージ品質改善モデル１０１０は、入力イメージからノイズマップを獲得するための第１ノイズマップ生成モデル及び入力イメージの客体領域の品質を改善するための第１学習ネットワークモデルを含んでよい。そして、第２イメージ品質改善モデル１０２０は、入力イメージからノイズマップを獲得するための第２ノイズマップ生成モデル及び入力イメージの背景領域の品質を改善するための第２学習ネットワークモデルを含んでよい。

【0134】

第１ノイズマップ生成モデルは、客体領域のノイズマップを生成するためのモデルであり、第２ノイズマップ生成モデルは、背景領域のノイズマップを生成するためのモデルであってよい。

【0135】

第１学習ネットワークモデルは、客体領域のイメージ品質を改善するためのモデルであり、第２学習ネットワークモデルは、背景領域のイメージ品質を改善するためのモデルであってよい。そのために、第１学習ネットワークモデル及び第２学習ネットワークモデルは、学習過程で相互異なるサンプルイメージが用いられてよい。例えば、第１学習ネットワークモデルは、原本イメージと原本イメージの解像度を下げた後でアップスケーリングしたイメージを学習させて生成され、第２学習ネットワークモデルは、原本イメージと原本イメージにノイズを追加したイメージを学習させて生成されてよい。この場合、プロセッサ１２０は、第１学習ネットワークモデルを用いて客体領域の解像度が拡大されたような鮮明な結果物を獲得し、第２学習ネットワークモデルを用いて背景領域のノイズが除去された結果物を獲得することができる。プロセッサ１２０は、以上のような方法を通じ、客体領域及び背景領域に対して異なるイメージ処理を行うことができる。

【0136】

図１０Ｂでは、入力イメージのみが第１ノイズマップ生成モデル及び第２ノイズマップ生成モデルに適用するものとして示しているが、それに限定されるものではない。例えば、入力イメージだけでなく、客体領域情報を第１ノイズマップ生成モデルに更に適用し、入力イメージだけでなく背景領域情報を第２ノイズマップ生成モデルに更に適用することもできる。

【0137】

又は、プロセッサ１２０は、一つのイメージ品質改善モデルを用いて客体領域及び背景領域を区分してイメージ処理することができる。例えば、プロセッサ１２０は、図１０Ｃに示すように、入力イメージ及びノイズマップだけでなく、客体領域情報又は背景領域情報のうち、少なくとも一方を学習ネットワークモデル（ＣＡＲＣＮＮ）に更に適用して入力イメージの品質の改善された出力イメージを獲得することもできる。

【0138】

ここで、客体領域情報及び背景領域情報は、図１０Ｂと同様であってよい。又は、客体領域情報及び背景領域情報として客体領域を１に表現し、背景領域を０に表現する一つのイメージが用いられてよい。ただ、それに限定されるものではなく、客体領域及び背景領域を区分することができれば、如何なる方法でも構わない。

【0139】

学習ネットワークモデルは、客体領域情報及び背景領域情報のタイプに対応するように学習されたモデルであってよい。仮に、客体領域を１に表現し、背景領域を０に表現した一つのイメージを用いる場合、学習過程でも同じタイプのイメージが用いられてよい。

【0140】

なお、学習ネットワークモデルの学習過程で用いられる複数のサンプルイメージも、客体領域及び背景領域の品質改善方式が相互異なるサンプルイメージであってよい。仮に、複数のサンプルイメージの客体領域は、背景領域より高い水準で品質の改善された領域であってよい。ここで、複数のサンプルイメージは、原本イメージの劣化を通じて獲得されてよい。即ち、複数のサンプルイメージは、原本イメージの客体領域と背景領域とが相互異なる水準で劣化する方法を通じて獲得されてよい。又は、複数のサンプルイメージのそれぞれは、対応する原本イメージの客体領域及び背景領域が異なる方式で圧縮された圧縮イメージであってよい。

【0141】

即ち、図１０Ｃの学習ネットワークモデルは、入力イメージの客体領域及び背景領域を識別し、客体領域及び背景領域を区分して品質改善を行うことができる。

【0142】

図１０Ｃにおいて、イメージ品質改善モデルは、ノイズマップ生成モデル（ＱＥＣＮＮ）及び学習ネットワークモデルを含み、入力イメージのみがノイズマップ生成モデルに適用されるものとして示しているが、それに限定されるものではない。例えば、プロセッサ１２０は、入力イメージだけでなく、客体領域情報又は背景領域情報のうち少なくとも一方をノイズマップ生成モデルに更に適用して入力イメージに対するノイズマップを獲得することもできる。

【0143】

又は、プロセッサ１２０は、入力イメージを複数のブロックに区分し、各ブロックを客体領域及び背景領域に区分し、客体領域及び背景領域を別途の人工知能アルゴリズムを通じて処理することもできる。例えば、プロセッサ１２０は、図１０Ｄに示すように、入力イメージを予め設定された大きさのブロックに順次に区分し、各ブロックが客体領域か背景領域かを識別することができる。そして、プロセッサ１２０は、客体領域に識別されたブロックを第１イメージ品質改善モデル１０３０に適用して第１出力ブロック１０５０−１を獲得し、背景領域に識別されたブロックを第２イメージ品質改善モデル１０４０に適用して第２出力ブロック１０５０−２を獲得し、第１出力ブロック１０５０−１及び第２出力ブロック１０５０−２を組み合わせて出力イメージを獲得することができる。

【0144】

ここで、第１イメージ品質改善モデル１０３０の学習過程では客体領域を示す複数のサンプルブロックが用いられてよく、第２イメージ品質改善モデル１０４０の学習過程では背景領域を示す複数のサンプルブロックが用いられてよい。

【0145】

以上のように、プロセッサ１２０は、入力イメージ内の客体領域と背景領域とを区分し、入力イメージの品質を改善することもできる。

【0146】

図１１は、本発明の一実施形態に係る電子装置の映像処理方法を説明するためのフローチャートである。

【0147】

まず、入力イメージから入力イメージの品質を示すノイズマップを獲得する（Ｓ１１１０）。そして、学習ネットワークモデルに含まれた複数のレイヤのうち、入力レイヤに入力イメージを提供し、複数のレイヤのうち、少なくとも一つの中間レイヤにノイズマップを提供する（Ｓ１１２０）。そして、入力イメージ及びノイズマップを学習ネットワークモデルに適用して入力イメージの品質の改善された出力イメージを獲得する（Ｓ１１３０）。ここで、学習ネットワークモデルは、複数のサンプルイメージ、各サンプルイメージに対するノイズマップ及び各サンプルイメージに対応する原本イメージの関係を人工知能アルゴリズムを通じて学習して獲得された人工知能モデルであってよい。

【0148】

ここで、学習ネットワークモデルは、少なくとも一つのサブレイヤを更に含み、提供するステップ（Ｓ１１２０）は、少なくとも一つのサブレイヤを用いてノイズマップを処理し、少なくとも一つの中間レイヤに処理されたノイズマップを提供することができる。

【0149】

そして、提供するステップ（Ｓ１１２０）は、少なくとも一つの中間レイヤのそれぞれの以前レイヤから出力される出力データに対応する複数のチャネル及び追加チャネルを少なくとも一つの中間レイヤのそれぞれに提供し、追加チャネルは、少なくとも一つの中間れいやのそれぞれに対応するサブレイヤから出力される処理されたノイズマップであってよい。

【0150】

一方、出力イメージを獲得するステップ（Ｓ１１３０）は、複数のレイヤのうち、出力レイヤの出力データ及び入力イメージをミキシングして出力イメージを獲得することができる。

【0151】

そして、ノイズマップを獲得するステップ（Ｓ１１１０）は、入力イメージを複数のレイヤを含むノイズマップ生成モデルに適用してノイズマップを獲得し、ノイズマップ生成モデルは、複数のサンプルイメージ及び各サンプルイメージに対するノイズマップの関係を人工知能アルゴリズムを通じて学習して獲得された人工知能モデルであってよい。

【0152】

一方、提供するステップ（Ｓ１１２０）は、複数のレイヤのそれぞれにノイズマップを提供するか、複数のレイヤのうち入力レイヤを除く残りのレイヤのそれぞれにノイズマップを提供することができる。

【0153】

そして、学習ネットワークモデルは、複数のレイヤのうち、入力レイヤに提供された複数のサンプルイメージのそれぞれと、少なくとも一つの中間レイヤに提供された複数のサンプルイメージのそれぞれのノイズマップが、複数のレイヤによって順次に処理されて獲得された出力イメージ、及び複数のサンプルイメージのそれぞれに対応する原本イメージの関係を人工知能アルゴリズムを通じて学習して獲得された人工知能モデルであってよい。

【0154】

一方、複数のサンプルイメージのそれぞれは、原本イメージの圧縮された圧縮イメージであり、各サンプルイメージに対するノイズマップは、各サンプルイメージ及び各サンプルイメージに対応する原本イメージから獲得されたノイズマップであってよい。

【0155】

そして、出力イメージを獲得するステップ（Ｓ１１３０）は、動画に含まれた複数のフレームのそれぞれを入力イメージとして学習ネットワークモデルに適用して動画の品質の改善された出力動画を獲得することができる。

【0156】

一方、電子装置のディスプレイの解像度に基づいて出力イメージの解像度を変換するステップ及び解像度の変換されたイメージをディスプレイするステップを更に含み、解像度の変換されたイメージは、４ＫＵＨＤ（ＵｌｔｒａＨｉｇｈＤｅｆｉｎｉｔｉｏｎ）イメージ又は８ＫＵＨＤイメージであってよい。

【0157】

以上のような本発明の多様な実施形態によれば、電子層装置は、入力イメージからノイズマップを獲得して入力イメージの品質をより正確に識別し、ノイズマップに基づいて適応的に動作する学習ネットワークモデルを用いることで入力イメージの品質を改善することができる。即ち、電子装置は、入力イメージからノイズマップを獲得して雑音除去に用いるため、空間的に変化するイメージの雑音除去効果が優れており、圧縮アーティファクトを軽減させることができる。

【0158】

一方、本発明の一実施形態によると、以上で説明された多様な実施形態は、機器（ｍａｃｈｉｎｅ）（例えば、コンピュータ）で読み取れる保存媒体（ｍａｃｈｉｎｅ−ｒｅａｄａｂｌｅｓｔｏｒａｇｅｍｅｄｉａ）に保存された命令語を含むソフトウェアで実現されてよい。機器は、保存媒体から保存された命令語を呼び出し、呼び出された命令語に応じて動作が可能な装置として、開示された実施形態に係る映像処理装置（例えば、映像処理装置Ａ）を含んでよい。命令がプロセッサによって実行される場合、プロセッサが直接、又はプロセッサの制御下に別の構成要素を用いて命令語に該当する機能を行うことができる。命令は、コンパイラー又はインタープリターによって生成又は実行されるコードを含んでよい。機器で読み取れる保存媒体は、非一時的（ｎｏｎ−ｔｒａｎｓｉｔｏｒｙ）保存媒体の形態で提供されてよい。ここで、「非一時的」とは、保存媒体が信号（ｓｉｇｎａｌ）を含まずに、実在（ｔａｎｇｉｂｌｅ）することを意味するだけで、データが保存媒体に半永久的又は一時的に保存されることを区分しない。

【0159】

なお、本発明の一実施形態によると、以上で説明された多様な実施形態に係る方法は、コンピュータプログラム製品（ｃｏｍｐｕｔｅｒｐｒｏｇｒａｍｐｒｏｄｕｃｔ）に含まれて提供されてよい。コンピュータプログラム製品は、商品として販売者及び購入者の間に取引されてよい。コンピュータプログラム製品は、機器で読み取れる保存媒体（例えば、ｃｏｍｐａｃｔｄｉｓｃｒｅａｄｏｎｌｙｍｅｍｏｒｙ（ＣＤ−ＲＯＭ））の形態で、又は、アプリケーションストア（例えば、プレイストアＴＭ）を通じてオンラインで配布されてよい。オンライン配布の場合に、コンピュータプログラム製品の少なくとも一部は、製造社のサーバ、アプリケーションストアのサーバ、又は中継サーバのメモリのような保存媒体に少なくとも一次保存されたり、一時的に生成されてよい。

【0160】

なお、本発明の一実施形態によると、以上で説明された多様な実施形態は、ソフトウェア（ｓｏｆｔｗａｒｅ）、ハードウェア（ｈａｒｄｗａｒｅ）又はこれらの組み合わせを用いてコンピュータ又はそれに類似する装置で読み込むことができる記録媒体内で実現されてよい。一部の場合において、本発明で説明される実施形態がプロセッサそのもので実現されてよい。ソフトウェア的な実現によると、本明細書で説明される手続き及び機能のような実施形態は、別途のソフトウェアモジュールで実現されてよい。ソフトウェアモジュールのそれぞれは、本明細書で説明される一つ以上の機能及び動作を行うことができる。

【0161】

一方、上述の多様な実施形態に係る音響出力装置１００のプロセッシング動作を行うためのコンピュータ命令語（ｃｏｍｐｕｔｅｒｉｎｓｔｒｕｃｔｉｏｎｓ）は、非一時的な読み取り可能な媒体（ｎｏｎ−ｔｒａｎｓｉｔｏｒｙｃｏｍｐｕｔｅｒｒｅａｄａｂｌｅｍｅｄｉｕｍ）に保存されてよい。このような非一時的な読み取り可能な媒体に保存されたコンピュータ命令語は、特定の機器のプロセッサによって実行された際、上述の多様な実施形態に係る音響出力装置１００における処理動作を特定の機器が行うようにする。非一時的な読み取り可能な媒体とは、レジスタやキャッシュ、メモリ等のような短い間データを保存する媒体ではなく、半永久的にデータを保存し、機器によって読み取り（Ｒｅａｄｉｎｇ）が可能な媒体を意味する。非一時的な読み取り可能な媒体の具体的な例としては、ＣＤやＤＶＤ、ハードディスク、ブルーレイディスク、ＵＳＢ、メモリカード、ＲＯＭ等であってよい。

【0162】

なお、上述の多様な実施形態に係る構成要素（例えば、モジュール又はプログラム）のそれぞれは、単数又は複数の個体で構成されてよく、上述の当該サブ構成要素のうちの一部のサブ構成要素が省略されたり、又は、他のサブ構成要素が多様な実施形態に更に含まれてよい。代替的に又は追加的に、一部の構成要素（例えば、モジュール又はプログラム）は、一つの個体で統合され、統合される前のそれぞれの当該構成要素によって行われる機能を同一又は類似するように行うことができる。多様な実施軽形態に係るモジュール、プログラム又は他の構成要素によって行われる動作は、順次に、並列的に、繰り返し、又はヒューリスティックに行われるか、少なくとも一部の動作が他の順で行われるか、省略されるか、又は他の動作が追加されてよい。

【0163】

以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明は以上の実施形態に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的趣旨の範疇内において、各種の変更例又は修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。

【図1】