IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッドの特許一覧

特許7419226画像変換方法及び装置、画像変換モデルのトレーニング方法及び装置
<>
  • 特許-画像変換方法及び装置、画像変換モデルのトレーニング方法及び装置 図1
  • 特許-画像変換方法及び装置、画像変換モデルのトレーニング方法及び装置 図2a
  • 特許-画像変換方法及び装置、画像変換モデルのトレーニング方法及び装置 図2b
  • 特許-画像変換方法及び装置、画像変換モデルのトレーニング方法及び装置 図2c
  • 特許-画像変換方法及び装置、画像変換モデルのトレーニング方法及び装置 図2d
  • 特許-画像変換方法及び装置、画像変換モデルのトレーニング方法及び装置 図2e
  • 特許-画像変換方法及び装置、画像変換モデルのトレーニング方法及び装置 図3
  • 特許-画像変換方法及び装置、画像変換モデルのトレーニング方法及び装置 図4
  • 特許-画像変換方法及び装置、画像変換モデルのトレーニング方法及び装置 図5
  • 特許-画像変換方法及び装置、画像変換モデルのトレーニング方法及び装置 図6
  • 特許-画像変換方法及び装置、画像変換モデルのトレーニング方法及び装置 図7
  • 特許-画像変換方法及び装置、画像変換モデルのトレーニング方法及び装置 図8
  • 特許-画像変換方法及び装置、画像変換モデルのトレーニング方法及び装置 図9
  • 特許-画像変換方法及び装置、画像変換モデルのトレーニング方法及び装置 図10
  • 特許-画像変換方法及び装置、画像変換モデルのトレーニング方法及び装置 図11
  • 特許-画像変換方法及び装置、画像変換モデルのトレーニング方法及び装置 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-01-12
(45)【発行日】2024-01-22
(54)【発明の名称】画像変換方法及び装置、画像変換モデルのトレーニング方法及び装置
(51)【国際特許分類】
   G06T 5/50 20060101AFI20240115BHJP
   G06T 7/00 20170101ALI20240115BHJP
【FI】
G06T5/50
G06T7/00 350B
【請求項の数】 21
(21)【出願番号】P 2020217692
(22)【出願日】2020-12-25
(65)【公開番号】P2021190088
(43)【公開日】2021-12-13
【審査請求日】2020-12-25
【審判番号】
【審判請求日】2023-01-13
(31)【優先権主張番号】202010484274.8
(32)【優先日】2020-06-01
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】514322098
【氏名又は名称】ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus, No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】110000578
【氏名又は名称】名古屋国際弁理士法人
(72)【発明者】
【氏名】ヤン シャション
(72)【発明者】
【氏名】ザオ チェン
【合議体】
【審判長】五十嵐 努
【審判官】川崎 優
【審判官】樫本 剛
(56)【参考文献】
【文献】Sangwoo Mo, et al.、 InstaGAN: Instance-aware Image-to-Image Translation、arxiv:1812.10889v2、2019年1月2日、https://arxiv.org/pdf/1812.10889.pdf
【文献】Shuyang Gu, et al.、Mask-Guided Portrait Editing with Conditional GANs、2019年5月24日、arXiv:1905.10346v1、https://arxiv.org/pdf/1905.10346.pdf
【文献】Hyeon Seok Yang, et al.、Face Attribute Editing using AttGAN and Guided Mask、2019年5月6日、Proceedings of 2019 International Conference on Electronics, Information, and Communication (ICEIC)、IEEE
(58)【調査した分野】(Int.Cl.,DB名)
G06T 3/00-3/60,5/00-5/50,7/00-7/90
(57)【特許請求の範囲】
【請求項1】
画像変換方法であって
元の画像を含む画像変換要求を取得するステップと、
前記元の画像を処理し、前記元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成するステップであって、予め変換された画像は元の画像を直接変換して得られた画像であるステップと、
前記変形パラメータに基づいて、前記元の画像に対して変形処理を行って、変形された画像を取得するステップと、
前記変形された画像、前記予め変換された画像及び前記マスク画像を融合して、ターゲット変換画像を生成するステップとを含み、
前記元の画像を処理し、前記元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成するステップは、
前記元の画像を処理して、前記元の画像に含まれたターゲットオブジェクトの第1ドメインでの特徴を取得するステップと、
前記ターゲットオブジェクトの第1ドメインでの特徴に基づいて、ターゲットオブジェクトの第2ドメインでの画像を再構築し、前記元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成するステップとを含み、前記変形パラメータは元の画像中の各ピクセルが並進する必要がある距離である、
ことを特徴とする画像変換方法。
【請求項2】
前記変換要求は、前記ターゲット変換画像が属する第1ドメインをさらに含み、画像変換要求を取得するステップの後に、
前記ターゲット変換画像が属する第1ドメインに基づいて、ターゲット生成器を取得するステップをさらに含み、
前記元の画像を処理し、前記元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成するステップは、
前記ターゲット生成器を利用して、前記元の画像を処理し、前記元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成するステップを含む、
ことを特徴とする請求項1に記載の方法。
【請求項3】
前記ターゲット変換画像が属する第1ドメインに対応する生成器がN(Nは1より大きい整数である)種であると、画像変換要求を取得するステップの後に、
前記元の画像を認識して、前記元の画像が属する第2ドメインを決定するステップと、
前記元の画像が属する第2ドメイン及び前記ターゲット変換画像が属する第1ドメインに基づいて、前記N種の生成器から前記ターゲット生成器を選択するステップとをさらに含む、
ことを特徴とする請求項2に記載の方法。
【請求項4】
前記画像変換要求を取得するステップの後に、
前記元の画像を認識して、前記元の画像が属する第2ドメインを決定するステップと、
前記元の画像が属する第2ドメインに基づいて、ターゲット生成器を取得するステップをさらに含み、
前記元の画像を処理し、前記元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成するステップは、
前記ターゲット生成器を利用して、前記元の画像を処理し、前記元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成するステップを含む、
ことを特徴とする請求項1に記載の方法。
【請求項5】
前記元の画像が属する第2ドメインに対応する生成器がN(Nは1より大きい整数である)種であると、画像変換要求を取得するステップの後に、
ターゲット変換画像が属する第1ドメインを取得するステップと、
前記ターゲット変換画像が属する第1ドメイン及び前記元の画像が属する第2ドメインに基づいて、前記N種の生成器から前記ターゲット生成器を選択するステップとをさらに含む、
ことを特徴とする請求項4に記載の方法。
【請求項6】
前記変形された画像、前記予め変換された画像及び前記マスク画像を融合して、ターゲット変換画像を生成するステップは、
前記マスク画像中の各ピクセルの画素値に基づいて、前記予め変換された画像の第1加重及び前記変形された画像の第2加重を決定するステップと、
前記第1加重及び前記第2加重に基づいて、前記予め変換された画像中の各ピクセルの画素値と前記変形された画像中の各ピクセルの画素値とを融合して、前記ターゲット変換画像を生成するステップとを含む、
ことを特徴とする請求項1~5のいずれか1項に記載の方法。
【請求項7】
画像変換モデルのトレーニング方法であって
第1ドメインに属する第1画像セット、及び第2ドメインに属する第2画像セットを含むトレーニングサンプルセットを取得するステップと、
第1初期生成器を利用して前記第1画像セットにおける画像をそれぞれ処理して、第1予め変換された画像セット、第1マスク画像セット及び第1変形パラメータセットを生成するステップと、
前記第1変形パラメータセットに基づいて、前記第1画像セットにおける画像に対してそれぞれ変形処理を行って、第1変形された画像セットを取得するステップと、
前記第1変形された画像セット、前記第1予め変換された画像セット及び前記第1マスク画像セットにおける対応する画像をそれぞれ融合して、第3画像セットを取得するステップと、
前記第3画像セットにおける画像及び前記第2画像セットにおける画像をそれぞれ第1初期判断装置に入力して、前記第1初期判断装置から出力された前記第3画像セットにおける画像がそれぞれ実際の画像に属する第1確率セット、及び前記第2画像セットにおける画像がそれぞれ実際の画像に属する第2確率セットを取得するステップと、
前記第1確率セット及び前記第2確率セットに基づいて、前記第1初期生成器及び前記第1初期判断装置を補正して、第1ドメインに位置する画像を第2ドメインに位置する画像に変換するための第1ドメインに属するターゲット生成器を生成するステップとを含み、前記第1変形パラメータセットにおける変形パラメータは元の画像中の各ピクセルが並進する必要がある距離である、
ことを特徴とする画像変換モデルのトレーニング方法。
【請求項8】
前記第1画像セットにおける画像がそれぞれ前記第2画像セットにおける画像に1つずつマッチングする、ことを特徴とする請求項7に記載のトレーニング方法。
【請求項9】
第1画像セットにおける画像が前記第2画像セットにおける画像にマッチングしておらず、前記第1確率セット及び前記第2確率セットに基づいて、前記第1初期生成器及び前記第1初期判断装置を補正した後に、
第2初期生成器を利用して前記第3画像セットにおける画像をそれぞれ処理して、第2予め変換された画像セット、第2マスク画像セット及び第2変形パラメータセットを生成するステップと、
前記第2変形パラメータセットに基づいて、前記第3画像セットにおける画像に対してそれぞれ変形処理を行って、第2変形された画像セットを取得するステップと、
前記第2変形された画像セット、第2予め変換された画像セット及び前記第2マスク画像セットにおける対応する画像をそれぞれ融合して、第4画像セットを取得するステップと、
前記第4画像セットにおける画像及び前記第1画像セットにおける画像をそれぞれ第2初期判断装置に入力して、前記第2初期判断装置から出力された前記第4画像セットにおける画像がそれぞれ実際の画像に属する第3確率セット、及び前記第1画像セットにおける画像がそれぞれ実際の画像に属する第4確率セットを取得するステップと、
前記第3確率セット及び前記第4確率セットに基づいて、前記第1初期生成器、前記第2初期生成器、前記第1初期判断装置及び前記第2初期判断装置を補正して、第1ドメインに位置する画像を第2ドメインに位置する画像に変換するための第1ドメインに属するターゲット生成器、及び第2ドメインに位置する画像を第1ドメインに位置する画像に変換するための第2ドメインに属するターゲット生成器を生成するステップとをさらに含む、
ことを特徴とする請求項7に記載のトレーニング方法。
【請求項10】
画像変換装置であって
元の画像を含む画像変換要求を取得するための第1取得モジュールと、
前記元の画像を処理し、前記元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成するための第1処理モジュールであって、予め変換された画像は元の画像を直接変換して得られた画像であり、前記変形パラメータは元の画像中の各ピクセルが並進する必要がある距離である、第1処理モジュールと、
前記変形パラメータに基づいて、前記元の画像に対して変形処理を行って、変形された画像を取得するための第2処理モジュールと、
前記変形された画像、前記予め変換された画像及び前記マスク画像を融合して、ターゲット変換画像を生成するための第1融合モジュールとを備え、
前記第1処理モジュールは、
前記元の画像を処理して、前記元の画像に含まれたターゲットオブジェクトの第1ドメインでの特徴を取得するための第1処理ユニットと、
前記ターゲットオブジェクトの第1ドメインでの特徴に基づいて、ターゲットオブジェクトの第2ドメインでの画像を再構築し、前記元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成するための構築ユニットとを備える、
ことを特徴とする画像変換装置。
【請求項11】
前記変換要求は、前記ターゲット変換画像が属する第1ドメインをさらに含み、前記第1取得モジュールは、画像変換要求を取得した後に、さらに、
前記ターゲット変換画像が属する第1ドメインに基づいて、ターゲット生成器を取得するために用いられ、
前記第1処理モジュールは、具体的には、
前記ターゲット生成器を利用して、前記元の画像を処理し、前記元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成するために用いられる、
ことを特徴とする請求項10に記載の装置。
【請求項12】
前記ターゲット変換画像が属する第1ドメインに対応する生成器がN(Nは1より大きい整数である)種であると、前記第1取得モジュールは、画像変換要求を取得した後に、さらに、
前記元の画像を認識して、前記元の画像が属する第2ドメインを決定し、
前記元の画像が属する第2ドメイン及び前記ターゲット変換画像が属する第1ドメインに基づいて、前記N種の生成器から前記ターゲット生成器を選択するために用いられる、
ことを特徴とする請求項11に記載の装置。
【請求項13】
前記第1取得モジュールは、画像変換要求を取得した後に、さらに、
前記元の画像を認識して、前記元の画像が属する第2ドメインを決定し、
前記元の画像が属する第2ドメインに基づいて、ターゲット生成器を取得するために用いられ、
前記第1処理モジュールは、具体的には、
前記ターゲット生成器を利用して、前記元の画像を処理し、前記元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成するために用いられる、
ことを特徴とする請求項10に記載の装置。
【請求項14】
前記元の画像が属する第2ドメインに対応する生成器がN(Nは1より大きい整数である)種であると、前記第1取得モジュールは、画像変換要求を取得した後に、さらに、
ターゲット変換画像が属する第1ドメインを取得し、
前記ターゲット変換画像が属する第1ドメイン及び前記元の画像が属する第2ドメインに基づいて、前記N種の生成器から前記ターゲット生成器を選択するために用いられる、
ことを特徴とする請求項13に記載の装置。
【請求項15】
前記第1融合モジュールは、
前記マスク画像中の各ピクセルの画素値に基づいて、前記予め変換された画像の第1加重及び前記変形された画像の第2加重を決定するための決定ユニットと、
前記第1加重及び前記第2加重に基づいて、前記予め変換された画像中の各ピクセルの画素値と前記変形された画像中の各ピクセルの画素値とを融合して、前記ターゲット変換画像を生成するための第1融合ユニットとを備える、
ことを特徴とする請求項10~14のいずれか1項に記載の装置。
【請求項16】
画像変換モデルのトレーニング装置であって
第1ドメインに属する第1画像セット、及び第2ドメインに属する第2画像セットを含むトレーニングサンプルセットを取得するための第2取得モジュールと、
第1初期生成器を利用して前記第1画像セットにおける画像をそれぞれ処理して、第1予め変換された画像セット、第1マスク画像セット及び第1変形パラメータセットを生成するための第3処理モジュールであって、前記第1変形パラメータセットにおける変形パラメータは元の画像中の各ピクセルが並進する必要がある距離である第3処理モジュールと、
前記第1変形パラメータセットに基づいて、前記第1画像セットにおける画像に対してそれぞれ変形処理を行って、第1変形された画像セットを取得するための第4処理モジュールと、
前記第1変形された画像セット、前記第1予め変換された画像セット及び前記第1マスク画像セットにおける対応する画像をそれぞれ融合して、第3画像セットを取得するための第2融合モジュールと、
前記第3画像セットにおける画像及び前記第2画像セットにおける画像をそれぞれ第1初期判断装置に入力して、前記第1初期判断装置から出力された前記第3画像セットにおける画像がそれぞれ実際の画像に属する第1確率セット、及び前記第2画像セットにおける画像がそれぞれ実際の画像に属する第2確率セットを取得するための第3取得モジュールと、
前記第1確率セット及び前記第2確率セットに基づいて、前記第1初期生成器及び前記第1初期判断装置を補正して、第1ドメインに位置する画像を第2ドメインに位置する画像に変換するための第1ドメインに属するターゲット生成器を生成するための第1補正モジュールとを備える、
ことを特徴とする画像変換モデルのトレーニング装置。
【請求項17】
前記第1画像セットにおける画像がそれぞれ前記第2画像セットにおける画像に1つずつマッチングする、
ことを特徴とする請求項16に記載のトレーニング装置。
【請求項18】
第1画像セットにおける画像が前記第2画像セットにおける画像にマッチングしておらず、前記トレーニング装置は、
第2初期生成器を利用して前記第3画像セットにおける画像をそれぞれ処理して、第2予め変換された画像セット、第2マスク画像セット及び第2変形パラメータセットを生成するための第5処理モジュールと、
前記第2変形パラメータセットに基づいて、前記第3画像セットにおける画像に対してそれぞれ変形処理を行って、第2変形された画像セットを取得するための第6処理モジュールと、 前記第2変形された画像セット、第2予め変換された画像セット及び前記第2マスク画像セットにおける対応する画像をそれぞれ融合して、第4画像セットを取得するための第3融合モジュールと、
前記第4画像セットにおける画像及び前記第1画像セットにおける画像をそれぞれ第2初期判断装置に入力して、前記第2初期判断装置から出力された前記第4画像セットにおける画像がそれぞれ実際の画像に属する第3確率セット、及び前記第1画像セットにおける画像がそれぞれ実際の画像に属する第4確率セットを取得するための第4取得モジュールと、
前記第3確率セット及び前記第4確率セットに基づいて、前記第1初期生成器、前記第2初期生成器、前記第1初期判断装置及び前記第2初期判断装置を補正して、第1ドメインに位置する画像を第2ドメインに位置する画像に変換するための第1ドメインに属するターゲット生成器、及び第2ドメインに位置する画像を第1ドメインに位置する画像に変換するための第2ドメインに属するターゲット生成器を生成するための第2補正モジュールとをさらに備える、
ことを特徴とする請求項16に記載のトレーニング装置。
【請求項19】
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信接続されるメモリとを備え、
前記メモリには、前記少なくとも1つのプロセッサにより実行可能な命令が記憶され、前記命令が前記少なくとも1つのプロセッサにより実行されることにより、前記少なくとも1つのプロセッサが請求項1~7のいずれか1項に記載の方法または請求項7~9のいずれか1項に記載のトレーニング方法を実行できる、ことを特徴とする電子機器。
【請求項20】
コンピュータ命令が記憶されている非一時的なコンピュータ可読記憶媒体であって、
前記コンピュータ命令は、コンピュータに請求項1~7のいずれか1項に記載の方法または請求項7~9のいずれか1項に記載のトレーニング方法を実行させる、
ことを特徴とするコンピュータ命令が記憶されている非一時的なコンピュータ可読記憶媒体。
【請求項21】
コンピュータプログラムであって、
前記コンピュータプログラムにおける命令が実行された場合に、コンピュータに請求項1~6のいずれか1項に記載の方法または請求項7~9のいずれか1項に記載のトレーニング方法が実行される、
ことを特徴とするコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本願は画像処理技術分野に関し、具体的にはディープラーニング及び画像処理技術分野に関し、特に画像変換方法及び装置、画像変換モデルのトレーニング方法及び装置に関する。
【背景技術】
【0002】
画像変換ネットワークは、画像コンテンツを変更せずに、1つのタイプの画像を他のタイプの画像に直接変換することができ、画像生成、シーン分割、画像スタイル化などの分野で幅広く応用されている。
【0003】
関連技術では、一般的には従来の画像変換方法、たとえば、CycleGANに基づく画像変換方法を用いて、画像を変換する。しかし、従来の画像変換方法により1つのタイプの画像を他のタイプの画像に直接変換することしか実現できず、変換後の画像の解像度が低く、変換後の画像の背景部分がオリジナル画像と異なるため、画像が融合されるとき、明瞭な縁を招き、自然なつながり及びシームレス融合を実現できない。
【発明の概要】
【発明が解決しようとする課題】
【0004】
画像変換方法及び装置、画像変換モデルのトレーニング方法及び装置、電子機器並びに記憶媒体が提供される。
【課題を解決するための手段】
【0005】
第1の態様によれば、元の画像を含む画像変換要求を取得するステップと、前記元の画像を処理し、前記元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成するステップと、前記変形パラメータに基づいて、前記元の画像に対して変形処理を行って、変形された画像を取得するステップと、前記変形された画像、前記予め変換された画像及び前記マスク画像を融合して、ターゲット変換画像を生成するステップとを含む、画像変換方法が提供される。
【0006】
第2の態様によれば、第1ドメインに属する第1画像セット、及び第2ドメインに属する第2画像セットを含むトレーニングサンプルセットを取得するステップと、第1初期生成器を利用して前記第1画像セットにおける画像をそれぞれ処理して、第1予め変換された画像セット、第1マスク画像セット及び第1変形パラメータセットを生成するステップと、前記第1変形パラメータセットに基づいて、前記第1画像セットにおける画像に対してそれぞれ変形処理を行って、第1変形された画像セットを取得するステップと、前記第1変形された画像セット、前記第1予め変換された画像セット及び前記第1マスク画像セットにおける対応する画像をそれぞれ融合して、第3画像セットを取得するステップと、前記第3画像セットにおける画像及び前記第2画像セットにおける画像をそれぞれ第1初期判断装置に入力して、前記第1初期判断装置から出力された前記第3画像セットにおける画像がそれぞれ実際の画像に属する第1確率セット、及び前記第2画像セットにおける画像がそれぞれ実際の画像に属する第2確率セットを取得するステップと、前記第1確率セット及び前記第2確率セットに基づいて、前記第1初期生成器及び前記第1初期判断装置を補正して、第1ドメインに位置する画像を第2ドメインに位置する画像に変換するための第1ドメインに属するターゲット生成器を生成するステップとを含む、画像変換モデルのトレーニング方法が提供される。
【0007】
第3の態様によれば、元の画像を含む画像変換要求を取得するための第1取得モジュールと、前記元の画像を処理し、前記元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成するための第1処理モジュールと、前記変形パラメータに基づいて、前記元の画像に対して変形処理を行って、変形された画像を取得するための第2処理モジュールと、前記変形された画像、前記予め変換された画像及び前記マスク画像を融合して、ターゲット変換画像を生成するための第1融合モジュールとを備える、画像変換装置が提供される。
【0008】
第4の態様によれば、第1ドメインに属する第1画像セット、及び第2ドメインに属する第2画像セットを含むトレーニングサンプルセットを取得するための第2取得モジュールと、第1初期生成器を利用して前記第1画像セットにおける画像をそれぞれ処理して、第1予め変換された画像セット、第1マスク画像セット及び第1変形パラメータセットを生成するための第3処理モジュールと、前記第1変形パラメータセットに基づいて、前記第1画像セットにおける画像に対してそれぞれ変形処理を行って、第1変形された画像セットを取得するための第4処理モジュールと、前記第1変形された画像セット、前記第1予め変換された画像セット及び前記第1マスク画像セットにおける対応する画像をそれぞれ融合して、第3画像セットを取得するための第2融合モジュールと、前記第3画像セットにおける画像及び前記第2画像セットにおける画像をそれぞれ第1初期判断装置に入力して、前記第1初期判断装置から出力された前記第3画像セットにおける画像がそれぞれ実際の画像に属する第1確率セット、及び前記第2画像セットにおける画像がそれぞれ実際の画像に属する第2確率セットを取得するための第3取得モジュールと、前記第1確率セット及び前記第2確率セットに基づいて、前記第1初期生成器及び前記第1初期判断装置を補正して、第1ドメインに位置する画像を第2ドメインに位置する画像に変換するための第1ドメインに属するターゲット生成器を生成するための第1補正モジュールとを備える、画像変換モデルのトレーニング装置が提供される。
【0009】
第5の態様によれば、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサに通信接続されるメモリとを備え、前記メモリには、前記少なくとも1つのプロセッサにより実行可能な命令が記憶され、前記命令が前記少なくとも1つのプロセッサにより実行されることにより、前記少なくとも1つのプロセッサが以上に記載の画像変換方法または画像変換モデルのトレーニング方法を実行できる、電子機器が提供される。
【0010】
第6の態様によれば、前記コンピュータに以上に記載の画像変換方法または画像変換モデルのトレーニング方法を実行させるためのコンピュータ命令が記憶されている、非一時的なコンピュータ可読記憶媒体が提供される。
第7の態様によれば、コンピュータプログラムを提供し、前記コンピュータプログラムのおける命令が実行された場合に、第1の態様の実施例に記載の画像変換方法または第2の態様の実施例に記載の画像変換モデルのトレーニング方法が実行される。
【発明の効果】
【0011】
本願の技術に基づいて、従来の画像変換方法により画像を変換するとき、変換後の画像の解像度が低く、変換後の画像の背景部分がオリジナル画像と異なるため、画像が融合されるとき、明瞭な縁を招き、自然なつながり及びシームレス融合を実現できないという技術課題を解決し、オリジナル画像で入力された高精細かつ豊かな高周波詳細情報を活用し、生成されたターゲット変換画像の解像度を向上させるとともに、生成されたターゲット変換画像の背景部分がオリジナル画像に一致し、それにより、画像のシームレス融合を実現でき、生成されたターゲット変換画像の自然さを大幅に向上させる。
【0012】
なお、本部分で説明される内容は、本開示の実施例の肝心な特徴または重要な特徴を限定することを意図しておらず、本開示の範囲を限定することも意図していない。本開示の他の特徴は、以下の明細書にて理解しやすくなる。
【図面の簡単な説明】
【0013】
図面は、本技術案がよりよく理解されるためのものであり、本願を限定するものではない。
図1図1は、本願の実施例に係る1つの画像変換方法のフローチャートである。
図2a図2aは、本願の実施例に係る、男女性顔の性別を変換する応用シーンにおいて元の画像、予め変換された画像、マスク画像、変形された画像及びターゲット変換画像の模式図である。
図2b図2bは、本願の実施例に係る、男女性顔の性別を変換する応用シーンにおいて元の画像、予め変換された画像、マスク画像、変形された画像及びターゲット変換画像の模式図である。
図2c図2cは、本願の実施例に係る、男女性顔の性別を変換する応用シーンにおいて元の画像、予め変換された画像、マスク画像、変形された画像及びターゲット変換画像の模式図である。
図2d図2dは、本願の実施例に係る、男女性顔の性別を変換する応用シーンにおいて元の画像、予め変換された画像、マスク画像、変形された画像及びターゲット変換画像の模式図である。
図2e図2eは、本願の実施例に係る、男女性顔の性別を変換する応用シーンにおいて元の画像、予め変換された画像、マスク画像、変形された画像及びターゲット変換画像の模式図である。
図3図3は、本願の実施例に係る他の画像変換方法のフローチャートである。
図4図4は、本願の実施例に係るまた他の画像変換方法のフローチャートである。
図5図5は、本願の実施例に係る1つの画像変換装置の構造模式図である。
図6図6は、本願の実施例に係る他の画像変換装置の構造模式図である。
図7図7は、本願の実施例に係るまた他の画像変換装置の構造模式図である。
図8図8は、本願の実施例に係る1つの画像変換モデルのトレーニング方法のフローチャートである。
図9図9は、本願の実施例に係る他の画像変換モデルのトレーニング方法のフローチャートである。
図10図10は、本願の実施例に係る1つの画像変換モデルのトレーニング装置の構造模式図である。
図11図11は、本願の実施例に係る他の画像変換モデルのトレーニング装置の構造模式図である。
図12図12は、本願の実施例の画像変換方または画像変換モデルのトレーニング方法を実現するための電子機器のブロック図である。
【発明を実施するための形態】
【0014】
以下、本願の例示的な実施例を、図面を参照して説明し、理解を容易にするためにその中には本願の実施例の様々な詳細を含んでおり、それらは単なる例示するものと見なされるべきである。したがって、当業者は、本願の範囲及び趣旨から逸脱することなく、ここで説明される実施例に対して様々な変更と修正を行うことができることを理解すべきである。同様に、明確及び簡潔するために、以下の説明では、周知の機能及び構成の説明を省略する。
【0015】
以下、図を参照しながら、本願の実施例の画像変換方法及び装置、画像変換モデルのトレーニング方法及び装置、電子機器並びに記憶媒体について説明する。
【0016】
本願は、関連技術で、従来の画像変換方法により画像を変換するとき、変換後の画像の解像度が低く、変換後の画像の背景部分がオリジナル画像と異なるため、画像が融合されるとき、明瞭な縁を招き、自然なつながり及びシームレス融合を実現できないという課題に対して、画像変換方法を提案する。
【0017】
本願に係る画像変換方法は、まず画像変換要求を取得し、次に画像変換要求内の元の画像を処理して、元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成し、さらに変形パラメータに基づいて元の画像に対して変形処理を行って、変形された画像を取得し、最後に変形された画像、予め変換された画像及びマスク画像を融合して、ターゲット変換画像を生成する。これにより、生成されたターゲット変換画像に元の画像から変形して生成された変形された画像が含まれるため、ターゲット変換画像がオリジナル画像で入力された高精細かつ豊かな高周波詳細情報を活用し、生成されたターゲット変換画像の解像度を向上させるとともに、生成されたターゲット変換画像の背景部分がオリジナル画像に一致し、それにより、画像のシームレス融合を実現でき、生成されたターゲット変換画像の自然さを大幅に向上させる。
【0018】
図1は本願の実施例に係る1つの画像変換方法のフローチャートである。
【0019】
なお、本願の実施例の画像変換方法の実行本体は画像変換装置であり、画像変換装置は、電子機器に配置されてもよく、変形パラメータに基づいて元の画像に対して変形処理を行って、変形された画像を取得した後に、変形された画像、予め変換された画像及びマスク画像を融合して、ターゲット変換画像を生成することを実現する。電子機器は、データ処理をできる任意の端末装置またはサーバなどであり得、本願は、これについて制限しない。
【0020】
図1に示すように、画像変換方法は、以下のステップを含むことができる。
ステップ101:元の画像を含む画像変換要求を取得する。
【0021】
実際に応用するとき、異なるシーンにおいて異なる実施形態にて画像変換要求を取得することができる。1つの可能な実現形態としては、ユーザは、画像変換要求命令を入力ボックスを介して入力してもよい。
【0022】
他の可能な実現形態としては、ユーザによる画像変換プログラムに対するトリガー動作を取得すると、画像変換要求を取得したと見なし、たとえば、ユーザがタッチディスプレイスクリーンにおける画像変換スタートキーをクリックすると、画像変換要求を取得すると見なす。
【0023】
また他の可能な実現形態としては、画像変換プログラムのメッセージコントロール類にフック関数が予め設定されてもよく、該フック関数に基づいて画像変換要求メッセージを検出する。具体的には、ユーザが画像変換要求を送信するとき、トリガーメッセージを送信し、このとき、メッセージコントロール類関数が呼び出され、従って、メッセージコントロール類関数に設定されたフック関数は、該メッセージコントロール類関数の呼び出しを検出し、現在トリガーされたメッセージコントロール類関数のメッセージタイプに基づいて画像変換要求メッセージを認識することができる。
【0024】
ステップ102:元の画像を処理して、元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成する。
【0025】
予め変換された画像は元の画像を直接変換して得られた画像である。変形パラメータは元の画像を処理するときに決定された、元の画像を変形する必要があるパラメータ情報であり、すなわち、元の画像中の各ピクセルが並進する必要がある距離であり、つまり、変形パラメータには各ピクセルに対応するx軸方向の並進量及びy軸方向の並進量が含まれ、マスク画像は画像フィルター処理テンプレートであり、マスク画像の主要作用は、処理されないか、または処理パラメータで計算されないように、マスクを用いて画像のある領域を遮蔽することであり、あるいは、類似性変数または画像マッチング方法を用いて画像中の、マスクに類似する構造特徴を検出して抽出することである。
【0026】
例としては、男女性顔の性別変換の応用シーンにおいて、元の画像が男性顔の画像(図2a)であれば、直接男性顔を女性顔に変換した後、未融合の女性化された顔、すなわち、元の画像に対応する予め変換された画像(図2b)を生成することができる。
【0027】
なお、元の画像の解像度が256*256であれば、予め変換された画像の解像度も256*256であり、変形パラメータが256*256組であり、各組の変形パラメータがx軸方向パラメータ及びy軸方向パラメータを含む。
【0028】
つまり、変換要求から元の画像を取得した後、まず、元の画像に対して対応する処理を行って、元の画像に対応する予め変換された画像を取得するとともに、対応するマスク画像(たとえば、男女性顔の性別変換の応用シーンにおいて、マスク画像が図2cに示す)及び変形パラメータを取得し、次に予め変換された画像、変形パラメータ及びマスク画像に基づいて、元の画像に対応するターゲット変換画像を取得することができる。
【0029】
ステップ103:変形パラメータに基づいて元の画像に対して変形処理を行って、変形された画像を取得する。
【0030】
画像変換ツールにより、変形パラメータに基づいて元の画像に対して対応する変更を行って、変形された画像を生成することができる。
【0031】
例としては、元の画像がオリジナルの男性顔の画像である場合、変形パラメータにおいて、男性の眉領域を指示するための変形方式がy軸方向に狭くなることであれば、画像変換ツールにより変形パラメータに基づいて、元の画像を変形した後、図2dに示すように、取得された変形された画像中のオリジナルの男性顔の眉が狭くなり、それにより、女性の眉の特徴に近くなるようにする。
【0032】
ステップ104:変形された画像、予め変換された画像及びマスク画像を融合して、ターゲット変換画像を生成する。
【0033】
具体的には、実際の動作では、元の画像を処理して、予め設定された変換画像を生成し、予め設定された変換画像を最終的に出力する画像とすれば、生成された画像は、解像度が低く、変換後の画像の背景部分がオリジナル画像と異なるため、画像が融合されるとき、明瞭な縁を招き、自然なつながり及びシームレス融合を実現できない。
【0034】
従って、本願では、元の画像を処理した後、元の画像に対応する予め変換された画像を生成するほか、対応するマスク画像及び変形パラメータを生成し、次に変形パラメータに基づいて元の画像に対して変形処理を行って、変形された画像を取得し、最後に変形された画像と予め変換された画像に対して、マスク画像の加重に従って融合動作を行ってターゲット変換画像を生成する(たとえば、男女性顔の性別変換の応用シーンにおいて、ターゲット変換画像が図2eに示してもよい)。これにより、変形された画像は、元の画像から直接変形して得られたものであり、元の画像の詳細情報が保持されるため、融合して得られたターゲット変換画像は、変形された画像と予め変換された画像に対してマスク画像により融合動作を行い、オリジナル画像で入力された高精細かつ豊かな高周波詳細情報を活用でき、それにより、生成されたターゲット変換画像の解像度を向上させるとともに、生成されたターゲット変換画像の背景部分がオリジナル画像に一致し、画像のシームレス融合を実現でき、生成されたターゲット変換画像の自然さを大幅に向上させる。
【0035】
例としては、他の可能な実施形態としては、上記の画像変換方法によって、さらに画像のスタイルを変換することができ、たとえば、男性/女性顔の画像を油画、水彩画、中国絵画などのスタイルに変換することができる。男性/女性顔の画像を油画に変換することを例として、画像変換要求を取得した後、まず、直接男性/女性顔の画像を未融合の油画スタイルの男性/女性顔の画像、すなわち、元の画像に対応する予め変換された画像に変換するとともに、対応するマスク画像及び変形パラメータを取得し、次に変形パラメータに基づいて元の画像に対して変形処理を行い、たとえば、変形パラメータにおいて、線輪郭領域を指示するための変形方式がx軸及びy軸方向にいずれも広くなることであり、画像変換ツールにより変形パラメータに基づいて、元の画像を変形した後、取得された変形された画像中のオリジナルの男性/女性顔の画像内の線がいずれも広くなり、対応する変形された画像を得、最後に変形された画像と予め変換された画像に対してマスク画像の加重にしたがって融合動作を行ってターゲット変換画像を生成する。これにより、男性/女性顔の画像を油画スタイルに変換することができ、男性/女性顔の画像を水彩画、中国絵画などのスタイルに変換する方式も上記方式に同様であり、冗長さを回避するために、ここで詳しく説明しない。
【0036】
なお、上記実施例では、ターゲット生成器により元の画像を処理して、元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成することができる。そのうち、異なる応用シーンにおいて、ターゲット生成器の取得方式は異なる。
【0037】
1つの可能な実現形態としては、まずターゲット変換画像が属する第1ドメインを取得して、ターゲット変換画像が属する第1ドメインに基づいてターゲット生成器を取得することができる。これに対応して、本願の1つの実施例では、変換要求にはターゲット変換画像が属する第1ドメインがさらに含まれ、従って、上記ステップ101の後に、
ターゲット変換画像が属する第1ドメインに基づいて、ターゲット生成器を取得するステップをさらに含む。
【0038】
これに対応して、上記ステップ102は、
ターゲット生成器を利用して、元の画像を処理して、元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成するステップをさらに含むことができる。
【0039】
画像変換分野では、異なるドメインを利用して元の画像とターゲット変換画像との違いを区別する。例としては、性別変換を行うとき、男性顔画像及び女性顔画像がそれぞれ異なるドメインに位置する画像であり、または、画像内のリンゴをオレンジに変換するとき、リンゴを含む画像及びオレンジを含む画像がそれぞれ異なるドメインに属する。
【0040】
これに対応して、本願では、ターゲット変換画像が属する第1ドメインは、ある指定されたオブジェクトを含む画像、例えば女性顔の画像であるか、または、リンゴを含むオブジェクトなどである。
【0041】
具体的には、異なるドメインにおける画像を変換するとき、使用される生成器が異なり、従って、本開示は、変換要求を受信し、ターゲット変換画像が属する第1ドメインを変換要求から取得した後、ターゲット変換画像が属する第1ドメインに基づいて、ターゲット変換画像が属する第1ドメインに対応する生成器を決定することができる。ターゲット変換画像が属する第1ドメインに対応する生成器が1種しかない場合、ターゲット変換画像が属する第1ドメインに基づいて、対応するターゲット生成器を直接決定することができる。
【0042】
例としては、ターゲット変換画像が属する第1ドメインが女性顔である場合、該ターゲット変換画像に対応する生成器が男性顔から女性顔への生成器しかないと決定することができ、従って、ターゲット生成器が男性顔から女性顔への生成器であると決定することができ、ターゲット変換画像が属する第1ドメインが子供顔である場合、該ターゲット変換画像に対応する生成器が老人顔から子供顔への生成器しかないと決定することができ、従って、ターゲット生成器が老人顔から子供顔への生成器であると決定することができる。
【0043】
さらに、ターゲット生成器を決定した後に、ターゲット生成器により直接元の画像に対して対応する処理を行って、元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成することができる。
【0044】
これにより、元の画像を処理する前に、ターゲット変換画像が属する第1ドメインに基づいて、専用のターゲット生成器を決定して元の画像に対して対応する処理を行うことができ、それにより、画像処理の効率及び正確性を大幅に向上させる。
【0045】
なお、実際の動作では、ターゲット変換画像が属する第1ドメインに対応する生成器が複数種ある場合も存在する。
【0046】
これに対応して、ターゲット変換画像が属する第1ドメインに対応する生成器がN(Nは1より大きい整数である)種であると、上記ステップ101の後に、
元の画像を認識し、元の画像が属する第2ドメインを決定するステップと、元の画像が属する第2ドメイン及びターゲット変換画像が属する第1ドメインに基づいて、N種の生成器からターゲット生成器を選択するステップとをさらに含む。
【0047】
具体的には、ターゲット変換画像が属する第1ドメインに基づいて、ターゲット変換画像が属する第1ドメインに対応する生成器が複数種あると決定した場合、元の画像を認識して、元の画像が属する第2ドメインを取得し、次にターゲット変換画像が属する第1ドメイン、及び元の画像が属する第2ドメインに基づいて、複数種の生成器から1種の生成器をターゲット生成器として選択することができる。
【0048】
例としては、ターゲット変換画像が属する第1ドメインがリンゴを含む画像である場合、該ターゲット変換画像が属する第1ドメインに基づいて、ターゲット変換画像が属する第1ドメインに対応する生成器は、オレンジからリンゴへの生成器、梨からリンゴへの生成器、桃からリンゴへの生成器など複数種あると決定することができる。このとき、元の画像が属する第2ドメインがオレンジを含む画像であると決定すれば、オレンジからリンゴへの生成器をターゲット生成器として上記複数の生成器から選択することができる。
【0049】
さらに、ターゲット生成器を決定した後、ターゲット生成器により直接元の画像に対して対応する処理を行って、元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成することができる。
【0050】
これにより、ターゲット変換画像が属する第1ドメインに基づいて、それに対応する生成器が複数種あると決定した場合、さらに元の画像が属する第2ドメインに基づいて、唯一の生成器をターゲット生成器として複数種の生成器から選択して、元の画像に対して対応する処理を行うことにより、画像処理の効率及び正確性をさらに向上させる。
【0051】
他の可能な実現形態として、さらに、まず元の画像が属する第2ドメインを取得して、元の画像が属する第2ドメインに基づいて、ターゲット生成器を取得してもよい。これに対応して、本願の他の実施例では、上記ステップ101の後に、
元の画像を認識して、元の画像が属する第2ドメインを決定するステップと、元の画像が属する第2ドメインに基づいて、ターゲット生成器を取得するステップとをさらに含む。
【0052】
これに対応して、上記ステップ102は、
ターゲット生成器を利用して、元の画像を処理して、元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成するステップを含むことができる。
【0053】
具体的には、元の画像を取得した後、元の画像を認識して、元の画像が属する第2ドメインを取得することができる。元の画像が属する第2ドメインを決定した後、元の画像が属する第2ドメインに基づいて、元の画像が属する第2ドメインに対応する生成器を決定することができる。元の画像が属する第2ドメインに対応する生成器が1種しかない場合、元の画像が属する第2ドメインに基づいて、対応するターゲット生成器を直接決定することができる。
【0054】
例としては、元の画像が属する第2ドメインが男性顔であると決定した場合、元の画像が属する第2ドメインに対応する生成器が男性顔から女性顔への生成器しかないと決定することができ、従って、ターゲット生成器が男性顔から女性顔への生成器であると決定することができ、元の画像が属する第2ドメインが老人顔であると決定した場合、元の画像が属する第2ドメインに対応する生成器が老人顔から子供顔への生成器しかないと決定することができ、従って、ターゲット生成器が老人顔から子供顔への生成器であると決定することができる。
【0055】
さらに、ターゲット生成器を決定した後、ターゲット生成器により直接元の画像に対して対応する処理を行って、元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成することができる。
【0056】
これにより、元の画像を処理する前、元の画像が属する第2ドメインに基づいて、専用のターゲット生成器を決定して元の画像に対して対応する処理を行うことにより、画像処理の効率及び正確性を大幅に向上させることができる。
【0057】
なお、実際の動作では、元の画像が属する第2ドメインに対応する生成器が複数種ある場合も存在する。これに対応して、元の画像が属する第2ドメインに対応する生成器がN(Nは1より大きい整数である)種であると、上記ステップ101の後に、
ターゲット変換画像が属する第1ドメインを取得するステップと、ターゲット変換画像が属する第1ドメイン、及び元の画像が属する第2ドメインに基づいて、N種の生成器からターゲット生成器を選択するステップとをさらに含む。
【0058】
具体的には、元の画像が属する第2ドメインに対応する生成器が複数種あると決定した場合、ターゲット変換画像が属する第1ドメインを取得することができる。変換要求が、ターゲット変換画像が属する第1ドメインを含むと、直接変換要求からターゲット変換画像が属する第1ドメインを取得することができ、変換要求が、ターゲット変換画像が属する第1ドメインを含まないと、元の画像が属する第2ドメインに対応する生成器が複数種あると決定したとき、ユーザがターゲット変換画像の画像タイプ及び特徴情報に基づいて選択するように、ターゲット変換画像が属する第1ドメインの選択オプションをポップアップすることができる。ターゲット変換画像が属する第1ドメインを決定した後、ターゲット変換画像が属する第1ドメイン、及び元の画像が属する第2ドメインに基づいて、複数種の生成器から1種の生成器をターゲット生成器として選択することができる。
【0059】
例としては、元の画像が属する第2ドメインがオレンジである場合、元の画像が属する第2ドメインに基づいて、元の画像が属する第2ドメインに対応する生成器は、オレンジからリンゴへの生成器、オレンジから梨への生成器、オレンジから桃への生成器など複数種あると決定することができる。このとき、ターゲット変換画像が属する第1ドメインが梨であると取得すれば、上記複数の生成器からオレンジから梨への生成器をターゲット生成器として選択することができる。
【0060】
さらに、ターゲット生成器を決定した後、ターゲット生成器により直接元の画像に対して対応する処理を行って、元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成することができる。
【0061】
これにより、元の画像が属する第2ドメインに基づいて、それに対応する生成器が複数種あると決定した場合、さらにターゲット変換画像が属する第1ドメインに基づいて、複数種の生成器から唯一の生成器をターゲット生成器として選択して、元の画像に対して対応する処理を行うことにより、画像処理の効率及び正確性をさらに向上させる。
【0062】
なお、画像を処理する際、一般的に、該画像中の特徴情報を抽出し、特徴情報に対して対応する処理を行うことにより、画像を処理することを実現する。
【0063】
以下、図3を参照して説明し、図3に示すように、上記ステップ102は、具体的には以下のステップを含む。
ステップ201:元の画像を処理して、元の画像に含まれたターゲットオブジェクトの第1ドメインでの特徴を取得する。
【0064】
ターゲットオブジェクトは、元の画像内の、ターゲット変換画像に比べて変更したオブジェクトである。例えば、元の画像が男性顔を含む画像であり、ターゲット変換画像が男性顔に対応する女性顔であると、ターゲットオブジェクトが元の画像中の男性顔である。これに対応して、ターゲットオブジェクトの第1ドメインでの特徴は、ターゲットオブジェクトの特徴及びターゲットオブジェクトの背景部分での特徴を含むことができる。
【0065】
ステップ202:ターゲットオブジェクトの第1ドメインでの特徴に基づいて、ターゲットオブジェクトの第2ドメインでの画像を再構築し、元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成する。
【0066】
具体的には、生成器がターゲットオブジェクトの第1ドメインでの特徴を取得した後、ターゲットオブジェクトの特徴を復号化して、ターゲットオブジェクトの第2ドメインでの画像を再構築して、予め変換された画像を生成し、ターゲットオブジェクトの再構築では、マスク画像及び変形パラメータを生成することができる。
【0067】
予め変換された画像、マスク画像及び変形パラメータは、すべてターゲットオブジェクトの第1ドメインでの特徴に基づいて生成されるものであり、すなわち、マスク画像及び変形パラメータは、すべて予め変換された画像と元の画像の違いに基づいて生成されるものであり、それにより、最後にマスク画像を融合して、変形パラメータに基づいて得られた変形された画像のターゲット変換画像がより正確になることが理解され得る。
【0068】
さらに、高精細かつ高い自然さのターゲット変換画像を生成するために、元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを取得した後、さらに、変形パラメータに基づいて元の画像に対して変形処理を行って、変形された画像を取得し、変形された画像及び予め変換された画像に対してマスク画像の加重に従って、融合動作を行ってターゲット変換画像を生成することができる。
【0069】
以下、図4を参照して、如何にターゲット変換画像を生成するかについて詳細に説明し、図4に示すように、上記ステップ104は、具体的には以下のステップを含む。
ステップ301:マスク画像中の各ピクセルの画素値に基づいて、予め変換された画像の第1加重及び変形された画像の第2加重を決定する。
【0070】
ステップ302:第1加重及び第2加重に基づいて、予め変換された画像中の各ピクセルの画素値と変形された画像中の各ピクセルの画素値を融合して、ターゲット変換画像を生成する。
【0071】
具体的には、マスク画像中の各ピクセルの画素値に基づいて、予め変換された画像の第1加重及び変形された画像の第2加重を決定することにより、第1加重と第2加重との加重比に基づいて、ターゲット変換画像の各ピクセルのうち、予め変換された画像の画素値と変形された画像中の画素値の比を取得し、それにより、該比に基づいて、予め変換された画像中の各ピクセルの画素値と変形された画像中の各ピクセルの画素値とを融合することができる。
【0072】
実際の使用に当たって、マスク画像中のピクセルの画素値は、予め変換された画像中の同じピクセルの加重であってもよく、変形された画像中の同じピクセルの加重であってもよい。例えば、マスク画像中のi番目のピクセルの画素値が0.7であると、予め変換された画像中のi番目のピクセルの加重が0.7(または0.3)であると決定することができ、これに対応して、変形された画像中のi番目のピクセルの加重が0.3(または0.7)であり、予め変換された画像中のi番目のピクセルの画素値が10であると、変形された画像中のi番目のピクセルの画素値が30であり、融合して生成されたターゲット変換画像中のi番目のピクセルの画素値が22または24である。
【0073】
これにより、変形された画像と予め変換された画像中の各ピクセルの画素値に対して、それぞれマスク画像の加重にしたがって融合動作を行うことにより、融合して生成されたターゲット変換画像中の各ピクセルの画素値が変換ニーズを満たすことができるとともに、オリジナル画像の高精細かつ豊かな高周波詳細情報を十分に示すことができ、それにより、生成されたターゲット変換画像の解像度を向上させるとともに、生成されたターゲット変換画像の背景部分がオリジナル画像に一致し、画像のシームレス融合を実現でき、生成されたターゲット変換画像の自然さを大幅に向上させる。
【0074】
よって、本願に係る画像変換方法は、まず画像変換要求を取得し、次に画像変換要求内の元の画像を処理して、元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成し、さらに変形パラメータに基づいて元の画像に対して変形処理を行って、変形された画像を取得し、最後に変形された画像、予め変換された画像及びマスク画像を融合して、ターゲット変換画像を生成する。これにより、生成されたターゲット変換画像に元の画像から変形して生成された変形された画像が含まれるため、ターゲット変換画像がオリジナル画像で入力された高精細かつ豊かな高周波詳細情報を活用し、生成されたターゲット変換画像の解像度を向上させるとともに、生成されたターゲット変換画像の背景部分がオリジナル画像に一致し、それにより、画像のシームレス融合を実現でき、生成されたターゲット変換画像の自然さを大幅に向上させる。
【0075】
上記実施例を実現するために、本願の実施例は、画像変換装置をさらに提案する。該画像変換装置が電子機器に設けることができる。図5は本願の実施例に係る画像変換装置の構造模式図である。
【0076】
図5に示すように、該画像変換装置400は第1取得モジュール410、第1処理モジュール420、第2処理モジュール430及び第1融合モジュール440を備えることができる。
【0077】
第1取得モジュール410は、元の画像を含む画像変換要求を取得するために用いられ、第1処理モジュール420は、前記元の画像を処理し、前記元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成するために用いられ、第2処理モジュール430は、前記変形パラメータに基づいて、前記元の画像に対して変形処理を行って、変形された画像を取得するために用いられ、第1融合モジュール440は、前記変形された画像、前記予め変換された画像及び前記マスク画像を融合して、ターゲット変換画像を生成するために用いられる。
【0078】
本願の実施例の1つの可能な実現形態では、変換要求は、ターゲット変換画像が属する第1ドメインをさらに含み、第1取得モジュール410は、画像変換要求を取得した後に、さらに、ターゲット変換画像が属する第1ドメインに基づいて、ターゲット生成器を取得するために用いられ、第1処理モジュール420は、具体的には、ターゲット生成器を利用して、元の画像を処理して、元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成するために用いられる。
【0079】
本願の実施例の他の可能な実現形態では、ターゲット変換画像が属する第1ドメインに対応する生成器がN(Nは1より大きい整数である)種であると、第1取得モジュール410は、画像変換要求を取得した後に、さらに、元の画像を認識し、元の画像が属する第2ドメインを決定し、元の画像が属する第2ドメイン、及びターゲット変換画像が属する第1ドメインに基づいて、N種の生成器からターゲット生成器を選択するために用いられる。
【0080】
本願の実施例のまた他の可能な実現形態では、第1取得モジュール410は、画像変換要求を取得した後に、さらに、元の画像を認識して、元の画像が属する第2ドメインを決定し、元の画像が属する第2ドメインに基づいて、ターゲット生成器を取得するために用いられ、第1処理モジュール420は、具体的には、ターゲット生成器を利用して、元の画像を処理して、元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成するために用いられる。
【0081】
本願の実施例のさらにまた他の可能な実現形態では、元の画像が属する第2ドメインに対応する生成器がN(Nは1より大きい整数である)種であると、第1取得モジュール410は、画像変換要求を取得した後に、さらに、ターゲット変換画像が属する第1ドメインを取得し、ターゲット変換画像が属する第1ドメイン、及び元の画像が属する第2ドメインに基づいて、N種の生成器からターゲット生成器を選択するために用いられる。
【0082】
図6は本願の実施例に係る他の画像変換装置の構造模式図である。本願の実施例の1つの可能な実現形態では、図6に示すように、第1処理モジュール420は、第1処理ユニット421と最構築ユニット422とを備えることができる。
【0083】
第1処理ユニット421は、元の画像を処理して、元の画像に含まれたターゲットオブジェクトの第1ドメインでの特徴を取得するために用いられ、最構築ユニット422は、ターゲットオブジェクトの第1ドメインでの特徴に基づいて、ターゲットオブジェクトの第2ドメインでの画像を再構築して、元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成するために用いられる。
【0084】
図7は本願の実施例に係るまた他の画像変換装置の構造模式図である。本願の実施例の1つの可能な実現形態では、図7に示すように、第1融合モジュール440は、決定ユニット441と第1融合ユニット442とを備えることができる。
【0085】
決定ユニット441は、マスク画像中の各ピクセルの画素値に基づいて、予め変換された画像の第1加重及び変形された画像の第2加重を決定するために用いられ、第1融合ユニット442は、第1加重及び第2加重に基づいて、予め変換された画像中の各ピクセルの画素値と変形された画像中の各ピクセルの画素値を融合して、ターゲット変換画像を生成するために用いられる。
【0086】
なお、本願の実施例の画像変換装置に開示されていない詳細については、本願の実施例の画像変換方法に開示された詳細を参照でき、ここで具体的に説明しない。
【0087】
本願の実施例の画像変換装置は、まず第1取得モジュールにより元の画像を含む画像変換要求を取得し、次に第1処理モジュールにより元の画像を処理して、元の画像に対応する予め変換された画像、マスク画像及び変形パラメータを生成し、さらに第2処理モジュールにより変形パラメータに基づいて元の画像に対して変形処理を行って、変形された画像を取得し、最後に第1融合モジュールにより変形された画像、予め変換された画像及びマスク画像を融合して、ターゲット変換画像を生成する。これにより、生成されたターゲット変換画像に元の画像から変形して生成された変形された画像が含まれるため、ターゲット変換画像がオリジナル画像で入力された高精細かつ豊かな高周波詳細情報を活用し、生成されたターゲット変換画像の解像度を向上させるとともに、生成されたターゲット変換画像の背景部分がオリジナル画像に一致し、それにより、画像のシームレス融合を実現でき、生成されたターゲット変換画像の自然さを大幅に向上させる。
【0088】
上記実施例を実現するために、本願の実施例は、画像変換モデルによって上記の画像変換方法を実現するように、画像変換モデルのトレーニング方法をさらに提案する。図7は本願の実施例に係る画像変換モデルのトレーニング方法のフローチャートである。
【0089】
なお、本願の実施例の画像変換モデルのトレーニング方法の実行本体は画像変換モデルのトレーニング装置であり、画像変換モデルのトレーニング装置は、電子機器に配置されてもよく、画像変換モデルをトレーニングすることにより、第1生成器を得ることを実現する。電子機器は、データ処理をできる任意の端末機器またはサーバなどであり得、本願は、これについて制限しない。
【0090】
図8に示すように、画像変換モデルのトレーニング方法は、以下のステップを含むことができる。
ステップ701:トレーニングサンプルセットを取得する。
【0091】
トレーニングサンプルセットは、第1ドメインに属する第1画像セット、及び第2ドメインに属する第2画像セットを含む。
【0092】
ステップ702:第1初期生成器を利用して第1画像セットにおける画像をそれぞれ処理して、第1予め変換された画像セット、第1マスク画像セット及び第1変形パラメータセットを生成する。
【0093】
ステップ703:第1変形パラメータセットに基づいて、第1画像セットにおける画像に対してそれぞれ変形処理を行って、第1変形された画像セットを取得する。
【0094】
ステップ704:第1変形された画像セット、第1予め変換された画像セット及び第1マスク画像セットにおける対応する画像をそれぞれ融合して、第3画像セットを取得する。
【0095】
ステップ705:第3画像セットにおける画像及び第2画像セットにおける画像をそれぞれ第1初期判断装置に入力して、第1初期判断装置から出力された第3画像セットにおける画像がそれぞれ実際の画像に属する第1確率セット、及び第2画像セットにおける画像がそれぞれ実際の画像に属する第2確率セットを取得する。
【0096】
ステップ706:第1確率セット及び第2確率セットに基づいて、第1初期生成器及び第1初期判断装置を補正して、第1ドメインに属するターゲット生成器を生成する。第1ドメインに属するターゲット生成器は、第1ドメインに位置する画像を第2ドメインに位置する画像に変換するために用いられる。
【0097】
第1画像セットにおける画像がそれぞれ第2画像セットにおける画像に1つずつマッチングする。
【0098】
具体的には、トレーニングサンプルセット内の第1画像セットにおける画像が第2画像セットにおける画像に1つずつマッチングすると、第1画像セットにおける画像を第1初期生成器の入力として、第1初期生成器により第1画像セットにおける画像をそれぞれ変換し、第2ドメインに属する第3画像セットを取得し、第1画像セットにおける画像をそれぞれ変換するプロセスについては、上記実施例に提案される画像変換方法を参照でき、冗長さを回避するために、ここで詳しく説明しない。
【0099】
第3画像セットを取得した後、第3画像セットにおける画像及び第2画像セットにおける画像をそれぞれ第1初期判断装置に入力して、第3画像セットにおける画像がそれぞれ実際の画像に属する第1確率セット、及び第2画像セットにおける画像がそれぞれ実際の画像に属する第2確率セットを第1初期判断装置により出力する。このとき、第1確率セットと第2確率セットの大きさを比較することによって、第1初期生成器及び第1初期判断装置を補正することができる。
【0100】
第1確率セットと第2確率セットとの偏差が大きいと、第1初期生成器により画像を変換するとき、誤差が大きいことが示され、従って、第1初期生成器及び第1初期判断装置に対して対応する補正を行って、第1ドメインに属するターゲット生成器を取得する必要があり、第1確率セットと第2確率セット偏差との偏差が小さいと、第1初期生成器により画像を変換するとき、誤差が小さいことが示され、従って、第1初期生成器及び第1初期判断装置に対して対応する補正を行う必要がなく、直接第1初期生成器を第1ドメインに属するターゲット生成器とすることができる。第1ドメインに属するターゲット生成器を画像変換モデルとして、第1ドメインに位置する画像を第2ドメインに位置する画像に変換することができる。
【0101】
これにより、画像変換モデルをトレーニングし、トレーニングされた画像変換モデルにより画像を変換し、生成されたターゲット変換画像に元の画像から変形して生成された変形された画像が含まれるため、ターゲット変換画像がオリジナル画像で入力された高精細かつ豊かな高周波詳細情報を活用し、生成されたターゲット変換画像の解像度を向上させるとともに、生成されたターゲット変換画像の背景部分がオリジナル画像に一致し、それにより、画像のシームレス融合を実現でき、生成されたターゲット変換画像の自然さを大幅に向上させるとともに、該画像変換モデルのトレーニング方法が簡単かつ効率的であり、画像変換モデルの担持が低い。
【0102】
なお、第1画像セットにおける画像が第2画像セットにおける画像にマッチングしていないと、上記実施例にて取得された第3画像セットにおける画像が第2画像セットにおける画像にマッチングしていないため、第1確率セット及び第2確率セットに基づいて第1初期生成器及び第1初期判断装置を正確に補正できず、生成された画像変換モデルの誤差が大きくなってしまう。
【0103】
従って、本願の1つの実施例では、第1画像セットにおける画像が第2画像セットにおける画像にマッチングしていないと、図9に示すように、上記ステップ706の後に、該方法は、以下のステップをさらに含む。
ステップ801:第2初期生成器を利用して第3画像セットにおける画像をそれぞれ処理して、第2予め変換された画像セット、第2マスク画像セット及び第2変形パラメータセットを生成する。
【0104】
ステップ802:第2変形パラメータセットに基づいて、第3画像セットにおける画像に対してそれぞれ変形処理を行って、第2変形された画像セットを取得する。
【0105】
ステップ803:第2変形された画像セット、第2予め変換された画像セット及び第2マスク画像セットにおける対応する画像をそれぞれ融合して、第4画像セットを取得する。
【0106】
ステップ804:第4画像セットにおける画像及び第1画像セットにおける画像をそれぞれ第2初期判断装置に入力して、第2初期判断装置から出力された第4画像セットにおける画像がそれぞれ実際の画像に属する第3確率セット、及び第1画像セットにおける画像がそれぞれ実際の画像に属する第4確率セットを取得する。
【0107】
ステップ805:第3確率セット及び第4確率セットに基づいて、第1初期生成器、第2初期生成器、第1初期判断装置及び第2初期判断装置を補正して、第1ドメインに属するターゲット生成器及び第2ドメインに属するターゲット生成器を生成する。第1ドメインに属するターゲット生成器は、第1ドメインに位置する画像を第2ドメインに位置する画像に変換するために用いられ、第2ドメインに属するターゲット生成器は、第2ドメインに位置する画像を第1ドメインに位置する画像に変換するために用いられる。
【0108】
具体的には、トレーニングサンプルセット内の第1画像セットにおける画像が第2画像セットにおける画像にマッチングしていないと、第3画像セットにおける画像を第2初期生成器の入力として、第2初期生成器により第3画像セットにおける画像をそれぞれ変換して、第1ドメインに属する第4画像セットを取得することができ、第3画像セットにおける画像をそれぞれ変換するプロセスについては、上記実施例で提案される画像変換方法を参照でき、冗長さを回避するために、ここで詳しく説明しない。
【0109】
第4画像セットを取得した後、第4画像セットにおける画像及び第1画像セットにおける画像をそれぞれ第2初期判断装置に入力して、第4画像セットにおける画像がそれぞれ実際の画像に属する第3確率セット、及び第1画像セットにおける画像がそれぞれ実際の画像に属する第4確率セットを第2初期判断装置により出力する。このとき、第3確率セットと第4確率セットの大きさを比較することにより、第1初期生成器、第2初期生成器、第1初期判断装置及び第2初期判断装置を補正することができる。
【0110】
第3確率セットと第4確率セットとの偏差が大きいと、第1初期生成器及び第2初期生成器により画像を変換するとき、誤差が大きいことが示され、従って、第1初期生成器、第2初期生成器、第1初期判断装置及び第2初期判断装置に対して対応する補正を行って、第1ドメインに属するターゲット生成器及び第2ドメインに属するターゲット生成器を取得する必要があり、第3確率セット及び第4確率セット偏差が小さいと、第1初期生成器及び第2初期生成器により画像を変換するとき、誤差が小さいことが示され、従って、第1初期生成器、第2初期生成器、第1初期判断装置及び第2初期判断装置を補正する必要がなく、直接第1初期生成器を第1ドメインに属するターゲット生成器とし、第2初期
生成器を第2ドメインに属するターゲット生成器とすることができる。第1ドメインに属するターゲット生成器を画像変換モデルとして、第1ドメインに位置する画像を第2ドメインに位置する画像に変換し、第2ドメインに属するターゲット生成器を他の画像変換モデルとして、第2ドメインに位置する画像を第1ドメインに位置する画像に変換することができ、該実施例の第1ドメインに属するターゲット生成器は、上記実施例の第1ドメインに属するターゲット生成器と同じであってもよく、異なってもよく、具体的には、実際な状況に応じて選択することができる。
【0111】
これにより、画像変換モデルをトレーニングし、トレーニングされた画像変換モデルにより画像を変換し、生成されたターゲット変換画像に元の画像から変形して生成された変形された画像が含まれるため、ターゲット変換画像がオリジナル画像で入力された高精細かつ豊かな高周波詳細情報を活用し、生成されたターゲット変換画像の解像度を向上させるとともに、生成されたターゲット変換画像の背景部分がオリジナル画像に一致し、それにより、画像のシームレス融合を実現でき、生成されたターゲット変換画像の自然さを大幅に向上させるとともに、該画像変換モデルのトレーニング方法が簡単かつ効率的であり、画像変換モデルの担持が低い。
【0112】
よって、本願に係る画像変換モデルのトレーニング方法は、第1ドメインに属する第1画像セット、及び第2ドメインに属する第2画像セットを含むトレーニングサンプルセットを取得し、第1初期生成器を利用して第1画像セットにおける画像をそれぞれ処理して、第1予め変換された画像セット、第1マスク画像セット及び第1変形パラメータセットを生成し、第1変形パラメータセットに基づいて、第1画像セットにおける画像に対してそれぞれ変形処理を行って、第1変形された画像セットを取得し、第1変形された画像セット、第1予め変換された画像セット及び第1マスク画像セットにおける対応する画像をそれぞれ融合して、第3画像セットを取得し、第3画像セットにおける画像及び第2画像セットにおける画像をそれぞれ第1初期判断装置に入力して、第1初期判断装置から出力された第3画像セットにおける画像がそれぞれ実際の画像に属する第1確率セット、及び第2画像セットにおける画像がそれぞれ実際の画像に属する第2確率セットを取得し、第1確率セット及び第2確率セットに基づいて、第1初期生成器及び第1初期判断装置を補正して、第1ドメインに位置する画像を第2ドメインに位置する画像に変換するための第1ドメインに属するターゲット生成器を生成する。これにより、画像変換モデルをトレーニングし、トレーニングされた画像変換モデルにより画像を変換し、生成されたターゲット変換画像に元の画像から変形して生成された変形された画像が含まれるため、ターゲット変換画像がオリジナル画像で入力された高精細かつ豊かな高周波詳細情報を活用し、生成されたターゲット変換画像の解像度を向上させるとともに、生成されたターゲット変換画像の背景部分がオリジナル画像に一致し、それにより、画像のシームレス融合を実現でき、生成されたターゲット変換画像の自然さを大幅に向上させるとともに、該画像変換モデルのトレーニング方法が簡単かつ効率的であり、画像変換モデルの担持が低い。
【0113】
上記実施例を実現するために、本願の実施例は、さらに、画像変換モデルのトレーニング装置を提案する。該画像変換モデルのトレーニング装置は電子機器に設けられてもよい。図10は本願の実施例に係る1つの画像変換モデルのトレーニング装置の構造模式図である。
【0114】
図10に示すように、該画像変換モデルのトレーニング装置900は、第2取得モジュール901、第3処理モジュール902、第4処理モジュール903、第2融合モジュール904、第3取得モジュール905及び第1補正モジュール906を備える。
【0115】
第2取得モジュール901は、第1ドメインに属する第1画像セット、及び第2ドメインに属する第2画像セットを含むトレーニングサンプルセットを取得するために用いられ、第3処理モジュール902は、第1初期生成器を利用して第1画像セットにおける画像をそれぞれ処理して、第1予め変換された画像セット、第1マスク画像セット及び第1変形パラメータセットを生成するために用いられ、第4処理モジュール903は、第1変形パラメータセットに基づいて、第1画像セットにおける画像に対してそれぞれ変形処理を行って、第1変形された画像セットを取得するために用いられ、第2融合モジュール904は、第1変形された画像セット、第1予め変換された画像セット及び第1マスク画像セットにおける対応する画像をそれぞれ融合して、第3画像セットを取得するために用いられ、第3取得モジュール905は、第3画像セットにおける画像及び第2画像セットにおける画像をそれぞれ第1初期判断装置に入力して、第1初期判断装置から出力された第3画像セットにおける画像がそれぞれ実際の画像に属する第1確率セット、及び第2画像セットにおける画像がそれぞれ実際の画像に属する第2確率セットを取得するために用いられ、第1補正モジュール906は、第1確率セット及び第2確率セットに基づいて、第1初期生成器及び第1初期判断装置を補正して、第1ドメインに位置する画像を第2ドメインに位置する画像に変換するための第1ドメインに属するターゲット生成器を生成するために用いられる。
【0116】
本願の1つの実施例では、第1画像セットにおける画像がそれぞれ第2画像セットにおける画像に1つずつマッチングする。
【0117】
図11は本願の実施例に係る他の画像変換モデルのトレーニング装置の構造模式図である。本願の実施例の1つの可能な実現形態では、第1画像セットにおける画像が第2画像セットにおける画像にマッチングしておらず、図11に示すように、該トレーニング装置は、第5処理モジュール907、第6処理モジュール908、第3融合モジュール909、第4取得モジュール910及び第2補正モジュール911をさらに備える。
【0118】
第5処理モジュール907は、第2初期生成器を利用して第3画像セットにおける画像をそれぞれ処理して、第2予め変換された画像セット、第2マスク画像セット及び第2変形パラメータセットを生成するために用いられ、第6処理モジュール908は、第2変形パラメータセットに基づいて、第3画像セットにおける画像に対してそれぞれ変形処理を行って、第2変形された画像セットを取得するために用いられ、第3融合モジュール909は、第2変形された画像セット、第2予め変換された画像セット及び第2マスク画像セットにおける対応する画像をそれぞれ融合して、第4画像セットを取得するために用いられ、第4取得モジュール910は、第4画像セットにおける画像及び第1画像セットにおける画像をそれぞれ第2初期判断装置に入力して、第2初期判断装置から出力された第4画像セットにおける画像がそれぞれ実際の画像に属する第3確率セット、及び第1画像セットにおける画像がそれぞれ実際の画像に属する第4確率セットを取得するために用いられ、第2補正モジュール911は、第3確率セット及び第4確率セットに基づいて、第1初期生成器、第2初期生成器、第1初期判断装置及び第2初期判断装置を補正して、第1ドメインに位置する画像を第2ドメインに位置する画像に変換するための第1ドメインに属するターゲット生成器、及び第2ドメインに位置する画像を第1ドメインに位置する画像に変換するための第2ドメインに属するターゲット生成器を生成するために用いられる。
【0119】
なお、本願の実施例の画像変換モデルのトレーニング装置に開示されている詳細については、本願の実施例の画像変換モデルのトレーニング方法に開示されている詳細を参照し、ここで具体的に説明しない。
【0120】
本願の実施例の画像変換モデルのトレーニング装置は、第1ドメインに属する第1画像セット、及び第2ドメインに属する第2画像セットを含むトレーニングサンプルセットを第2取得モジュールにより取得し、第3処理モジュールにより第1初期生成器を利用して第1画像セットにおける画像をそれぞれ処理して、第1予め変換された画像セット、第1マスク画像セット及び第1変形パラメータセットを生成し、第4処理モジュールにより第1変形パラメータセットに基づいて、第1画像セットにおける画像に対してそれぞれ変形処理を行って、第1変形された画像セットを取得し、第2融合モジュールにより第1変形された画像セット、第1予め変換された画像セット及び第1マスク画像セットにおける対応する画像をそれぞれ融合して、第3画像セットを取得し、第3取得モジュールにより第3画像セットにおける画像及び第2画像セットにおける画像をそれぞれ第1初期判断装置に入力して、第1初期判断装置から出力された第3画像セットにおける画像がそれぞれ実際の画像に属する第1確率セット、及び第2画像セットにおける画像がそれぞれ実際の画像に属する第2確率セットを取得し、第1補正モジュールにより第1確率セット及び第2確率セットに基づいて、第1初期生成器及び第1初期判断装置を補正して、第1ドメインに位置する画像を第2ドメインに位置する画像に変換するための第1ドメインに属するターゲット生成器を生成する。これにより、画像変換モデルをトレーニングし、トレーニングされた画像変換モデルにより画像を変換し、生成されたターゲット変換画像に元の画像から変形して生成された変形された画像が含まれるため、ターゲット変換画像がオリジナル画像で入力された高精細かつ豊かな高周波詳細情報を活用し、生成されたターゲット変換画像の解像度を向上させるとともに、生成されたターゲット変換画像の背景部分がオリジナル画像に一致し、それにより、画像のシームレス融合を実現でき、生成されたターゲット変換画像の自然さを大幅に向上させるとともに、該画像変換モデルのトレーニング方法が簡単かつ効率的であり、画像変換モデルの担持が低い。
【0121】
本願の実施例によれば、本願は、電子機器及び可読記憶媒体をさらに提供する。本願の実施例によれば、コンピュータプログラムが提供される。当該コンピュータプログラムにおける命令が実行された場合に、上記画像変換方法又は上記画像変換モデルのトレーニング方法が実行される。
【0122】
図12に示すように、本願の実施例による画像変換方法または画像変換モデルのトレーニング方法の電子機器のブロック図である。電子機器は、ラップトップ、デスクトップ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータの様な形式のデジタルコンピュータを表すことを目的とする。電子機器は、パーソナルデジタルアシスタント、セルラーホン、スマートフォン、ウェアラブルデバイス及び他の同様のコンピューティングデバイスなどの様な形式のモバイルデバイスを備えることができる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は、単なる例示的なものとなることを意図されており、本明細書で説明された及び/または請求された本願の実装を制限することを意図したものではない。
【0123】
図12に示すように、該電子機器は、1つまたは複数のプロセッサ1101、メモリ1102、及び高速インターフェースと低速インターフェースを含んだ、各コンポーネントを接続するためのインターフェースを備える。各部材は、様々なバスを使って相互接続され、共通のマザーボード上に取り付けられるか、または必要に応じて他の方式で取り付けられることができる。プロセッサは、メモリ内またはメモリ上において外部入力/出力装置(例えば、インターフェースにカップリングされた表示機器)にGUIのグラフィック情報を表示する命令を含んだ、電子機器内に実行される命令を処理する。他の実施形態では、必要があれば、複数のプロセッサ及び/または複数のバスを複数のメモリ及び複数のメモリとともに使用できる。同様に、複数の電子機器を接続することができ、各機器は、部分的な必要な操作(たとえば、サーババンク、1群のブレードサーバ、またはマルチプロセッサシステムとして)を提供する。図12では、1つのプロセッサ1101を例とする。
【0124】
メモリ1102は、本願に係る非一時的なコンピュータ可読記憶媒体である。前記メモリには、少なくとも1つのプロセッサにより実行可能な命令が記憶され、前記少なくとも1つのプロセッサに本願に係る画像変換方法または画像変換モデルのトレーニング方法を実行させる。本願の非一時的なコンピュータ可読記憶媒体には、コンピュータに本願に係る画像変換方法または画像変換モデルのトレーニング方法を実行させるためのコンピュータ命令が記憶されている。
【0125】
メモリ902は、非一時的なコンピュータ可読記憶媒体として、本願の実施例の画像変換方法または画像変換モデルのトレーニング方法に対応するプログラム命令/モジュール(たとえば、図5に示す第1取得モジュール410、第1処理モジュール420、第2処理モジュール430及び第1融合モジュール440、図10に示す第2取得モジュール901、第3処理モジュール902、第4処理モジュール903、第2融合モジュール904、第3取得モジュール905及び第1補正モジュール906)などの、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能プログラム及びモジュールを記憶することができる。プロセッサ1101は、メモリ1102に記憶された非一時的なソフトウェアプログラム、命令及びモジュールを実行することにより、サーバの様々な機能アプリケーション及びデータ処理を実行し、すなわち、上記方法実施例の画像変換方法または画像変換モデルのトレーニング方法を実現する。
【0126】
メモリ1102は、プログラムストレージエリア及びデータストレージエリアを含み、プログラムストレージエリアは、オペレーティングシステム、少なくとも1つの機能によって必要とされるアプリケーションプログラムを記憶することができ、データストレージエリアは、画像の変換または画像変換モデルのトレーニングの電子機器の利用に従って形成されるデータなどを記憶することができる。また、メモリ902は、高速ランダムアクセスメモリを備えてもよく、少なくとも1つのディスクストレージデバイス、フラッシュメモリデバイスのような非一時的なメモリ、または他の非一時的な固体状態記憶デバイスをさらに含んでもよい。いくつかの実施例では、メモリ1102は、好ましくは、ネットワークを介して画像の変換または画像変換モデルのトレーニングの電子機器に接続できた、プロセッサ1101に対して遠隔に配置されるメモリを含む。上記ネットワークの例には、インターネット、企業イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、およびそれらの組み合わせが含まれるがこれらに限られない。
【0127】
画像変換方法または画像変換モデルのトレーニング方法の電子機器は、さらに、入力装置1103及び出力装置1104を含んでもよい。プロセッサ1101、メモリ1102、入力装置1103及び出力装置1104は、バスまたは他の形式で接続されてもよく、図11において、バスを介する接続を例とする。
【0128】
入力装置1103は、入力された数字またはキャラクタ情報を受信し、画像の変換または画像変換モデルのトレーニングの電子機器のユーザ設定及び機能制御に関連するキー信号入力を生成してもよく、たとえばタッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、インジケータースティック、1つのまたは複数のマウスキー、トラックボール、ジョイスティックなどの入力装置である。出力装置1104は、表示機器、補助照明装置(たとえば、LED)及び触覚フィードバック装置(たとえば、バイブラモータ)などを含んでもよい。該表示機器は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ及びプラズマディスプレイを含んでもよいがこれらに限られない。いくつかの実施形態では、ディスプレイ装置は、タッチスクリーンであり得る。
【0129】
ここで説明されるシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/またはそれらの組合せで実現することができる。これらの様々な実施形態は、1つまたは複数のコンピュータプログラムで実施されることを含むことができ、該1つまたは複数のコンピュータプログラムは、少なくとも1つのプログラム可能プロセッサを含むプログラム可能システムで実行及び/または解釈でき、該プログラム可能プロセッサは、特定用途向けまたは汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、該ストレージシステム、該少なくとも1つの入力装置、及び該少なくとも1つの出力装置に伝送することができる。
【0130】
これらのコンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、またはコードとも称される)は、プログラム可能プロセッサに対するマシン命令を含み、高レベル手続き型及び/またはオブジェクト指向プログラミング言語、および/またはアセンブリ/マシン言語で実装することができる。本明細書で使用される際、「マシン可読媒体」及び「コンピュータ可読媒体」という用語は、マシン命令及び/またはデータをプログラム可能プロセッサに提供するための任意のコンピュータプログラム製品、機器、及び/または装置(たとえば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))であり、マシン可読信号であるマシン命令を受信する機器可読媒体を含む。用語「マシン可読信号」とは、マシン命令及び/またはデータをプログラム可能プロセッサに提供するための任意の信号である。
【0131】
ユーザとのインタラクションを提供するために、コンピュータ上で、ここで説明されているシステム及び技術を実施することができ、該コンピュータは、ユーザに情報を表示するためのディスプレイ装置(例えば、CRT(陰極線管)またはLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウスまたはトラックボール)とを有し、ユーザは、該キーボード及び該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置は、ユーザとのインタラクションを提供するために用いられてもよい。例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック)であってもよく、任意の形式(音響入力と、音声入力と、触覚入力とを含む)でユーザからの入力を受信することができる。
【0132】
ここで説明されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム(例えば、データサーバとする)、またはミドルウェアコンポーネントを含むコンピューティングシステム(例えば、アプリケーションサーバ)、またはフロントエンドコンポーネントを含むコンピューティングシステム(例えば、グラフィカルユーザインタフェースまたはウェブブラウザを有するユーザコンピュータ、ユーザは、該グラフィカルユーザインタフェースまたは該ウェブブラウザによってここで説明されるシステム及び技術の実施形態とインタラクションする)、またはこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実施することができる。任意の形式または媒体のデジタルデータ通信(例えば、通信ネットワーク)によってシステムのコンポーネントを相互に接続されてもよい。通信ネットワークの例としては、ローカルエリアネットワーク(LAN)と、ワイドエリアネットワーク(WAN)と、インターネットとを含む。
【0133】
コンピュータシステムは、クライアント側とサーバとを含むことができる。クライアント側とサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、互いにクライアント-サーバ関係を有するコンピュータプログラムによってクライアント側とサーバとの関係が生成される。サーバは、クラウドサーバであってもよく、また、クラウドコンピューティングサーバまたはクラウドホストと呼称され、クラウドコンピューティングサービス系における1つのホストコンピュータ製品であり、従来の物理ホストコンピュータ及びVPSサービスに存在する、管理難度が高く、サービス拡張性が弱いという欠陥を解決する。
【0134】
上記に示される様々な形式のフローを使用して、ステップを並べ替え、追加、または削除することができることを理解されたい。例えば、本願に記載されている各ステップは、並列に実行されてもよいし、順次的に実行されてもよいし、異なる順序で実行されてもよいが、本願で開示されている技術案が所望の結果を実現することができれば、本明細書では限定されない。
【0135】
上記の具体的な実施形態は、本願の保護範囲を制限するものではない。当業者は、設計要件及び他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション、及び置換を行うことができる。本願の精神と原則内で行われる任意の修正、同等の置換、及び改良などは、いずれも本願の保護範囲内に含まれるべきである。
図1
図2a
図2b
図2c
図2d
図2e
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12