(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-05-16
(45)【発行日】2022-05-24
(54)【発明の名称】ネットワーク最適化方法及び装置、画像処理方法及び装置、記憶媒体及びコンピュータプログラム
(51)【国際特許分類】
G06T 7/00 20170101AFI20220517BHJP
【FI】
G06T7/00 350C
(21)【出願番号】P 2020552759
(86)(22)【出願日】2019-11-15
(86)【国際出願番号】 CN2019118922
(87)【国際公開番号】W WO2020147414
(87)【国際公開日】2020-07-23
【審査請求日】2020-09-28
(31)【優先権主張番号】201910036096.X
(32)【優先日】2019-01-15
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】519454811
【氏名又は名称】北京市商▲湯▼科技▲開▼▲発▼有限公司
【氏名又は名称原語表記】BEIJING SENSETIME TECHNOLOGY DEVELOPMENT CO., LTD.
【住所又は居所原語表記】Room 710-712, 7th Floor, 3rd Building, 1st Courtyard, Zhongguancun East Road, Haidian District, Beijing 100084 China
(74)【代理人】
【識別番号】110002468
【氏名又は名称】特許業務法人後藤特許事務所
(72)【発明者】
【氏名】葛 芸瀟
(72)【発明者】
【氏名】沈 岩涛
(72)【発明者】
【氏名】陳 大鵬
(72)【発明者】
【氏名】王 暁剛
(72)【発明者】
【氏名】李 鴻昇
【審査官】千葉 久博
(56)【参考文献】
【文献】米国特許出願公開第2018/0039867(US,A1)
【文献】中国特許出願公開第109117744(CN,A)
【文献】中国特許出願公開第109101866(CN,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
(57)【特許請求の範囲】
【請求項1】
ニューラルネットワークを最適化するネットワーク最適化方法であって、
同じ対象物の画像で構成されたペア画像、及び異なる対象物の画像で構成されたペア画像を含む画像サンプル群を取得することと、
前記画像サンプル群中の画像の、身元特徴を含む第1特徴及び属性特徴を含む第2特徴を取得し、画像の第1特徴を用いて第1分類結果を得ることと、
前記画像サンプル群内のペア画像に対して、前記ペア画像の第1画像の第1特徴と第2画像の第2特徴を用いて新しい第1画像を生成し、且つ前記第1画像の第2特徴と前記第2画像の第1特徴を用いて新しい第2画像を生成する特徴交換処理であって、前記第1画像の第2特徴と前記第2画像の第2特徴を交換することを含む前記特徴交換処理を実行して、新しいペア画像を得ることと、
前記第1画像、前記第2画像、前記新しい第1画像及び前記新しい第2画像に基づいて、前記第1分類結果の第1損失値、前記新しいペア画像の第2損失値、及び前記新しいペア画像の第1特徴と第2特徴の第3損失値を取得することと、
前記第1損失値、前記第2損失値又は前記第3損失値に基づいて、前記ニューラルネットワークの損失値を取得することと、
前記ニューラルネットワークの損失値が損失閾値よりも低いという所定要求が満たされるまでに、少なくとも前記第1損失値、前記第2損失値及び前記第3損失値に基づいてニューラルネットワークのパラメータを調整することと、を含むことを特徴とするネットワーク最適化方法。
【請求項2】
前記画像サンプル群中の画像の第1特徴と第2特徴を取得することは、
前記ペア画像の2つの画像を前記ニューラルネットワークの身元コーディングネットワークモジュール及び属性コーディングネットワークモジュールに入力することと、
前記身元コーディングネットワークモジュールを用いて前記ペア画像の2つの画像の第1特徴を取得し、前記属性コーディングネットワークモジュールを用いて前記ペア画像の2つの画像の第2特徴を取得することと、を含むことを特徴とする請求項1に記載の方法。
【請求項3】
前記第1画像、前記第2画像、前記新しい第1画像及び前記新しい第2画像に基づいて、前記第1分類結果の第1損失値、前記新しいペア画像の第2損失値、及び前記新しいペア画像の第1特徴と第2特徴の第3損失値を取得することは、
前記身元コーディングネットワークモジュールによって取得された前記第1特徴の前記第1分類結果を取得することと、
前記第1分類結果及び前記画像サンプル群中の画像に対応する真の分類結果に基づいて、前記第1損失値を取得することと、を含むことを特徴とする請求項2に記載の方法。
【請求項4】
前記ペア画像の2つの画像を前記身元コーディングネットワークモジュールに入力する前に、
前記ペア画像の2つの画像における対象物の画像領域にノイズを加えることを更に含むことを特徴とする請求項2又は3に記載の方法。
【請求項5】
前記画像サンプル群内のペア画像に対して特徴交換処理を実行して新しいペア画像を得ることは、
前記画像サンプル群内のペア画像の画像の第1特徴と第2特徴を前記ニューラルネットワークの生成ネットワークモジュールに入力することと、
前記生成ネットワークモジュールによって前記画像サンプル群内のペア画像に対する前記特徴交換処理を実行して、前記新しいペア画像を得ることと、を含むことを特徴とする請求項1~4のいずれか一項に記載の方法。
【請求項6】
入力されたペア画像が同じ対象物の画像である場合に、前記画像サンプル群内のペア画像に対して特徴交換処理を実行して新しいペア画像を得ることは、前記ペア画像の画像に対して1回の特徴交換処理を実行して前記新しいペア画像を得ることを含み、
前記ペア画像の画像に対して1回の特徴交換処理を実行して前記新しいペア画像を得ることは、
前記ペア画像の第1画像の第1特徴と第2画像の第2特徴を用いて新しい第1画像を生成し、前記第1画像の第2特徴と前記第2画像の第1特徴を用いて新しい第2画像を生成することを含み、
及び/又は、入力されたペア画像が異なる対象物の画像である場合に、前記画像サンプル群内のペア画像に対して特徴交換処理を実行して新しいペア画像を得ることは、前記ペア画像の画像に対して2回の特徴交換処理を実行して新しいペア画像を得ることを含み、
前記ペア画像の画像に対して2回の特徴交換処理を実行して新しいペア画像を得ることは、
前記ペア画像の第1画像の第1特徴と第2画像の第2特徴を用いて新しい第1中間画像を生成し、前記第1画像の第2特徴と第2画像の第1特徴を用いて新しい第2中間画像を生成することと、
前記第1中間画像の第1特徴と前記第2中間画像の第2特徴を用いて新しい第1画像を生成し、前記第1中間画像の第2特徴と第2中間画像の第1特徴を用いて新しい第2画像を生成することと、を含むことを特徴とする請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記第1画像、前記第2画像、前記新しい第1画像及び前記新しい第2画像に基づいて、前記第1分類結果の第1損失値、前記新しいペア画像の第2損失値、及び前記新しいペア画像の第1特徴と第2特徴の第3損失値を取得することは、
原ペア画像及び前記生成ネットワークモジュールによって取得された新しいペア画像に基づいて、前記新しいペア画像の、対応する前記原ペア画像に対する第2損失値を取得することを含むことを特徴とする請求項
5に記載の方法。
【請求項8】
前記第1画像、前記第2画像、前記新しい第1画像及び前記新しい第2画像に基づいて、前記第1分類結果の第1損失値、前記新しいペア画像の第2損失値、及び前記新しいペア画像の第1特徴と第2特徴の第3損失値を取得することは、
前記新しいペア画像の第1特徴と第2特徴、及び前記新しいペア画像に対応する原ペア画像の第1特徴と第2特徴に基づいて、前記新しいペア画像の第1特徴と第2特徴の第3損失値を得ることを含むことを特徴とする請求項1~7のいずれか一項に記載の方法。
【請求項9】
前記画像サンプル群内のペア画像に対して特徴交換処理を実行して新しいペア画像を得る後、
生成した前記新しいペア画像を前記ニューラルネットワークの識別ネットワークモジュールに入力して、前記新しいペア画像の真の程度を示すラベル特徴を得ることと、
前記ラベル特徴に基づいて前記新しいペア画像の第4損失値を取得することと、を更に含むことを特徴とする請求項1~8のいずれか一項に記載の方法。
【請求項10】
前記ニューラルネットワークの損失値が損失閾値よりも低いという所定要求が満たされるまでに、少なくとも前記第1損失値、前記第2損失値及び前記第3損失値に基づいてニューラルネットワークのパラメータを調整することは、
前記第1損失値、前記第2損失値、前記第3損失値及び前記第4損失値に基づいて前記ニューラルネットワークの損失値を得ることと、
前記所定要求が満たされるまでに、前記ニューラルネットワークの損失値に基づいて前記ニューラルネットワークのパラメータを調整することと、を含むことを特徴とする請求項9に記載の方法。
【請求項11】
前記第1損失値、前記第2損失値、前記第3損失値及び前記第4損失値に基づいて前記ニューラルネットワークの損失値を得ることは、
前記ニューラルネットワークに入力された画像サンプル群が同じ対象物のペア画像である場合、前記第1損失値、前記第2損失値、前記第3損失値及び前記第4損失値に基づいて前記ニューラルネットワークの第1ネットワーク損失値を得ることと、
前記ニューラルネットワークに入力された画像サンプル群が異なる対象物のペア画像である場合、前記第1損失値、前記第2損失値、前記第3損失値及び前記第4損失値に基づいて前記ニューラルネットワークの第2ネットワーク損失値を得ることと、
前記第1ネットワーク損失値と前記第2ネットワーク損失値との加算結果に基づいて、前記ニューラルネットワークの損失値を得ることと、を含むことを特徴とする請求項10に記載の方法。
【請求項12】
入力画像を受信することと、
ニューラルネットワークモデルによって前記入力画像の第1特徴を認識することと、
前記第1特徴に基づいて前記入力画像における対象物の身元を決定することと、を含み、
前記ニューラルネットワークモデルは、請求項1~11のいずれか一項に記載のネットワーク最適化方法によって最適化処理されて得られたネットワークモデルであることを特徴とする画像処理方法。
【請求項13】
同じ対象物の画像で構成されたペア画像、及び異なる対象物の画像で構成されたペア画像を含む画像サンプル群を取得するための取得モジュールと、
前記画像サンプル群中の画像の第1特徴と第2特徴を取得するための特徴コーディングネットワークモジュールと、
画像の第1特徴に基づいて第1分類結果を得るための分類モジュールと、
前記画像サンプル群内のペア画像に対して、前記ペア画像の第1画像の第1特徴と第2画像の第2特徴を用いて新しい第1画像を生成し、且つ前記第1画像の第2特徴と前記第2画像の第1特徴を用いて新しい第2画像を生成する特徴交換処理であって、前記第1画像の第2特徴と前記第2画像の第2特徴を交換することを含む前記特徴交換処理を実行して、新しいペア画像を得るための生成ネットワークモジュールと、
前記第1画像、前記第2画像、前記新しい第1画像及び前記新しい第2画像に基づいて、前記第1分類結果の第1損失値、前記新しいペア画像の第2損失値、及び前記新しいペア画像の第1特徴と第2特徴の第3損失値を取得し、前記第1損失値、前記第2損失値又は前記第3損失値に基づいて、
ニューラルネットワークの損失値を取得する損失値取得モジュールと、
前記ニューラルネットワークの損失値が損失閾値よりも低いという所定要求が満たされるまでに、少なくとも前記第1損失値、前記第2損失値及び前記第3損失値に基づいてニューラルネットワークのパラメータを調整するための調整モジュールと、を含むネットワーク最適化装置。
【請求項14】
プロセッサと、
プロセッサにより実行可能な命令を記憶するためのメモリと、を含み、
前記プロセッサは、請求項1~11のいずれか一項に記載の方法を実行するように構成されることを特徴とする画像処理装置。
【請求項15】
コンピュータプログラム命令が記憶されているコンピュータ読取可能な記憶媒体であって、前記コンピュータプログラム命令は、プロセッサにより実行されると、請求項1~11のいずれか一項に記載の方法を実現させることを特徴とするコンピュータ読取可能な記憶媒体。
【請求項16】
コンピュータ読取可能なコードを含み、前記コンピュータ読取可能なコードが電子機器上で実行されると、前記電子機器のプロセッサに請求項1~11のいずれか一項に記載の方法を実現するための命令を実行させることを特徴とするコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、ネットワーク最適化に関し、特に、ネットワーク最適化方法及び装置、画像処理方法及び装置、並びに記憶媒体に関する。
【背景技術】
【0002】
歩行者再識別は、識別性ある特徴を学習して歩行者の検索とマッチングを行うことを主旨とする。一般的に、画像データセットにおける歩行者姿勢の多様性、背景の多様性等は、身元特徴の抽出に影響を与える。現在、関連技術において深度ニューラルネットワークによって特徴を抽出し分解して身元を認識するようになっている。
【発明の概要】
【0003】
本開示の実施例は、ネットワーク最適化の技術的解決手段を提供する。
【0004】
本開示の一方面によれば、ニューラルネットワークを最適化するネットワーク最適化方法であって、同じ対象物の画像で構成されたペア画像及び異なる対象物の画像で構成されたペア画像を含む画像サンプル群を取得することと、前記画像サンプル群中の画像の、身元特徴を含む第1特徴及び属性特徴を含む第2特徴を取得し、画像の第1特徴を用いて第1分類結果を得ることと、前記画像サンプル群内のペア画像に対して、ペア画像の第1画像の第1特徴と第2画像の第2特徴を用いて新しい第1画像を生成し、且つ第1画像の第2特徴と第2画像の第1特徴を用いて新しい第2画像を生成する特徴交換処理を実行して、新しいペア画像を得ることと、所定方式を用いて、前記第1分類結果の第1損失値、前記新しいペア画像の第2損失値、及び前記新しいペア画像の第1特徴と第2特徴の第3損失値を取得することと、所定要求が満たされるまでに、少なくとも前記第1損失値、第2損失値及び第3損失値に基づいてニューラルネットワークのパラメータを調整することと、を含むネットワーク最適化方法を提供する。
【0005】
いくつかの可能な実施形態では、前記画像サンプル群中の画像の第1特徴と第2特徴を取得することは、前記ペア画像の2つの画像を前記ニューラルネットワークの身元コーディングネットワークモジュール及び属性コーディングネットワークモジュールに入力することと、前記身元コーディングネットワークモジュールを用いて前記ペア画像の2つの画像の第1特徴を取得し、前記属性コーディングネットワークモジュールを用いて前記ペア画像の2つの画像の第2特徴を取得することと、を含む。
【0006】
いくつかの可能な実施形態では、所定方式を用いて、前記第1分類結果の第1損失値、前記新しいペア画像の第2損失値、及び前記新しいペア画像の第1特徴と第2特徴の第3損失値を取得することは、前記身元コーディングネットワークモジュールによって取得された第1特徴の第1分類結果を取得することと、第1所定方式を用いて、前記第1分類結果及び前記画像サンプル群中の画像に対応する真の分類結果に基づいて、前記第1損失値を取得することと、を含む。
【0007】
いくつかの可能な実施形態では、前記方法は、前記ペア画像の2つの画像を前記身元コーディングネットワークモジュールに入力する前に、前記ペア画像の2つの画像における対象物の画像領域にノイズを加えることを更に含む。
【0008】
いくつかの可能な実施形態では、前記画像サンプル群内のペア画像に対して特徴交換処理を実行して新しいペア画像を得ることは、前記画像サンプル群内のペア画像の画像の第1特徴と第2特徴を前記ニューラルネットワークの生成ネットワークモジュールに入力することと、前記生成ネットワークモジュールによって前記画像サンプル群内のペア画像に対して前記特徴交換処理を実行して、前記新しいペア画像を得ることと、を含む。
【0009】
いくつかの可能な実施形態では、入力されたペア画像が同じ対象物の画像である場合に、前記画像サンプル群内のペア画像に対して特徴交換処理を実行して新しいペア画像を得ることは、前記ペア画像の画像に対して1回の特徴交換処理を実行して前記新しいペア画像を得るステップを含み、前記ペア画像の画像に対して1回の特徴交換処理を実行して前記新しいペア画像を得ることは、ペア画像の第1画像の第1特徴と第2画像の第2特徴を用いて新しい第1画像を生成し、前記第1画像の第2特徴と第2画像の第1特徴を用いて新しい第2画像を生成することを含む。
【0010】
いくつかの可能な実施形態では、入力されたペア画像が異なる対象物の画像である場合に、前記画像サンプル群内のペア画像に対して特徴交換処理を実行して新しいペア画像を得ることは、前記ペア画像の画像に対して2回の特徴交換処理を実行して新しいペア画像を得ることを含み、前記ペア画像の画像に対して2回の特徴交換処理を実行して新しいペア画像を得ることは、ペア画像の第1画像の第1特徴と第2画像の第2特徴を用いて新しい第1中間画像を生成し、前記第1画像の第2特徴と第2画像の第1特徴を用いて新しい第2中間画像を生成することと、前記第1中間画像の第1特徴と第2中間画像の第2特徴を用いて新しい第1画像を生成し、前記第1中間画像の第2特徴と第2中間画像の第1特徴を用いて新しい第2画像を生成することと、を含む。
【0011】
いくつかの可能な実施形態では、所定方式を用いて、前記第1分類結果の第1損失値、前記新しいペア画像の第2損失値、及び前記新しいペア画像の第1特徴と第2特徴の第3損失値を取得することは、第2所定方式を用いて、前記生成ネットワークモジュールによって取得された新しいペア画像の、対応する原ペア画像に対する第2損失値を取得することを含む。
【0012】
いくつかの可能な実施形態では、所定方式を用いて、前記第1分類結果の第1損失値、前記新しいペア画像の第2損失値、及び前記新しいペア画像の第1特徴と第2特徴の第3損失値を取得することは、第3所定方式に従って、前記新しいペア画像の第1特徴と第2特徴、及び前記新しいペア画像に対応する原ペア画像の第1特徴と第2特徴に基づいて、前記新しいペア画像の第1特徴と第2特徴の第3損失値を得ることを含む。
【0013】
いくつかの可能な実施形態では、前記方法は、前記画像サンプル群内のペア画像に対して特徴交換処理を実行して新しいペア画像を得る後、生成した新しいペア画像を前記ニューラルネットワークの識別ネットワークモジュールに入力して、前記新しいペア画像の真の程度を示すラベル特徴を得ることと、第4所定方式を用いて、前記ラベル特徴に基づいて前記新しいペア画像の第4損失値を取得することと、を更に含む。
【0014】
いくつかの可能な実施形態では、所定要求が満たされるまでに、少なくとも前記第1損失値、第2損失値及び第3損失値に基づいてニューラルネットワークのパラメータを調整することは、前記第1損失値、第2損失値、第3損失値及び第4損失値に基づいて前記ニューラルネットワークの損失値を得ることと、所定要求が満たされるまでに、前記ニューラルネットワークの損失値に基づいて前記ニューラルネットワークのパラメータを調整することと、を含む。
【0015】
いくつかの可能な実施形態では、前記第1損失値、第2損失値、第3損失値及び第4損失値に基づいて前記ニューラルネットワークの損失値を得ることは、前記ニューラルネットワークに入力された画像サンプル群が同じ対象物のペア画像である場合、第5所定方式を用いて、前記第1損失値、第2損失値、第3損失値及び第4損失値に基づいて前記ニューラルネットワークの第1ネットワーク損失値を取得することと、前記ニューラルネットワークに入力された画像サンプル群が異なる対象物のペア画像である場合、第6所定方式を用いて、前記第1損失値、第2損失値、第3損失値及び第4損失値に基づいて前記ニューラルネットワークの第2ネットワーク損失値を得ることと、前記第1ネットワーク損失値と第2ネットワーク損失値との加算結果に基づいて前記ニューラルネットワークの損失値を得ることと、を含む。
【0016】
本開示の第2方面によれば、入力画像を受信することと、ニューラルネットワークモデルによって前記入力画像の第1特徴を認識することと、前記第1特徴に基づいて前記入力画像における対象物の身元を決定することと、を含み、前記ニューラルネットワークモデルは、第1方面のいずれか一項に記載のネットワーク最適化方法によって最適化処理されて得られたネットワークモデルである画像処理方法を提供する。
【0017】
本開示の第3方面によれば、同じ対象物の画像で構成されたペア画像、及び異なる対象物の画像で構成されたペア画像を含む画像サンプル群を取得するための取得モジュールと、前記画像サンプル群中の画像の第1特徴と第2特徴を取得するための特徴コーディングネットワークモジュールと、画像の第1特徴に基づいて第1分類結果を得るための分類モジュールと、前記画像サンプル群内のペア画像に対して、ペア画像の第1画像の第1特徴と第2画像の第2特徴を用いて新しい第1画像を生成し、且つ第1画像の第2特徴と第2画像の第1特徴を用いて新しい第2画像を生成する特徴交換処理を実行して、新しいペア画像を得るための生成ネットワークモジュールと、所定方式を用いて、前記第1分類結果の第1損失値、前記新しいペア画像の第2損失値、及び前記新しいペア画像の第1特徴と第2特徴の第3損失値を取得するための損失値取得モジュールと、所定要求が満たされるまでに、少なくとも前記第1損失値、第2損失値及び第3損失値に基づいてニューラルネットワークのパラメータを調整するための調整モジュールと、を含むネットワーク最適化装置を提供する。
【0018】
いくつかの可能な実施形態では、前記特徴コーディングネットワークモジュールは、身元コーディングネットワークモジュール及び属性コーディングネットワークモジュールを含み、前記取得モジュールは、更に、前記ペア画像の2つの画像を前記身元コーディングネットワークモジュール及び属性コーディングネットワークモジュールに入力するために用いられ、前記身元コーディングネットワークモジュールは、前記ペア画像の2つの画像の第1特徴を取得するために用いられ、前記属性コーディングネットワークモジュールは、前記ペア画像の2つの画像の第2特徴を取得するために用いられる。
【0019】
いくつかの可能な実施形態では、前記損失値取得モジュールは、更に、前記身元コーディングネットワークモジュールによって取得された第1特徴に対応する第1分類結果を取得し、第1所定方式を用いて、前記第1分類結果及び前記画像サンプル群中の画像に対応する真の分類結果に基づいて、前記第1損失値を取得するために用いられる。
【0020】
いくつかの可能な実施形態では、前記装置は、前記ペア画像の2つの画像を前記身元コーディングネットワークモジュールに入力する前に、前記ペア画像の2つの画像における対象物の画像領域にノイズを加えるための前処理モジュールを更に含む。
【0021】
いくつかの可能な実施形態では、前記生成ネットワークモジュールは、更に、入力されたペア画像が同じ対象物の画像である場合に、前記ペア画像の画像に対して1回の特徴交換処理を実行して前記新しいペア画像を得るために用いられ、具体的には、ペア画像の第1画像の第1特徴と第2画像の第2特徴を用いて新しい第1画像を生成し、前記第1画像の第2特徴と第2画像の第1特徴を用いて新しい第2画像を生成するために用いられる。
【0022】
いくつかの可能な実施形態では、前記生成ネットワークモジュールは、更に、入力されたペア画像が異なる対象物の画像である場合に、前記ペア画像の画像に対して2回の特徴交換処理を実行して新しいペア画像を得るために用いられ、具体的には、ペア画像の第1画像の第1特徴と第2画像の第2特徴を用いて新しい第1中間画像を生成し、前記第1画像の第2特徴と第2画像の第1特徴を用いて新しい第2中間画像を生成することと、前記第1中間画像の第1特徴と第2中間画像の第2特徴を用いて新しい第1画像を生成し、前記第1中間画像の第2特徴と第2中間画像の第1特徴を用いて新しい第2画像を生成することとに用いられる。
【0023】
いくつかの可能な実施形態では、前記損失値取得モジュールは、更に、第2所定方式を用いて、前記生成ネットワークモジュールによって取得された新しいペア画像の、対応する原ペア画像に対する第2損失値を取得するために用いられる。
【0024】
いくつかの可能な実施形態では、前記損失値取得モジュールは、更に、第3所定方式に従って、前記新しいペア画像の第1特徴と第2特徴、及び前記新しいペア画像に対応する原ペア画像の第1特徴と第2特徴に基づいて、前記新しいペア画像の第1特徴と第2特徴の第3損失値を得るために用いられる。
【0025】
いくつかの可能な実施形態では、前記装置は、前記新しいペア画像を受信し、前記新しいペア画像の真の程度を示すラベル特徴を得るための識別ネットワークモジュールを更に含み、前記損失値取得モジュールは、更に、第4所定方式を用いて、前記ラベル特徴に基づいて前記新しいペア画像の第4損失値を取得するために用いられる。
【0026】
いくつかの可能な実施形態では、前記調整モジュールは、更に、前記第1損失値、第2損失値、第3損失値及び第4損失値に基づいて前記ニューラルネットワークの損失値を得ることと、所定要求が満たされるまでに、前記ニューラルネットワークの損失値に基づいて前記ニューラルネットワークのパラメータを調整することとに用いられる。
【0027】
いくつかの可能な実施形態では、前記調整モジュールは、更に、前記ニューラルネットワークに入力された画像サンプル群が同じ対象物のペア画像である場合、第5所定方式を用いて、前記第1損失値、第2損失値、第3損失値及び第4損失値に基づいて前記ニューラルネットワークの第1ネットワーク損失値を得ることと、前記ニューラルネットワークに入力された画像サンプル群が異なる対象物のペア画像である場合、第6所定方式を用いて、前記第1損失値、第2損失値、第3損失値及び第4損失値に基づいて前記ニューラルネットワークの第2ネットワーク損失値を得ることと、前記第1ネットワーク損失値と第2ネットワーク損失値との加算結果に基づいて前記ニューラルネットワークの損失値を得ることとに用いられる。
【0028】
本開示の第4方面によれば、入力画像を受信するための受信モジュールと、ニューラルネットワークモデルによって前記入力画像の第1特徴を認識するための認識モジュールと、前記第1特徴に基づいて前記入力画像における対象物の身元を決定するための身元決定モジュールと、を含み、前記ニューラルネットワークモデルは、第1方面のいずれか一項に記載のネットワーク最適化方法によって最適化処理されて得られたネットワークモデルである画像処理装置を提供する。
【0029】
本開示の第5方面によれば、プロセッサと、プロセッサにより実行可能な命令を記憶するためのメモリと、を含み、前記プロセッサは、第1方面及び第2方面のいずれか一項に記載の方法を実行するように構成される電子機器を提供する。
【0030】
本開示の第6方面によれば、コンピュータプログラム命令が記憶されているコンピュータ読取可能な記憶媒体であって、前記コンピュータプログラム命令は、プロセッサにより実行されると、第1方面及び第2方面のいずれか一項に記載の方法を実現させるコンピュータ読取可能な記憶媒体を提供する。
【0031】
本開示の一方面によれば、コンピュータ読取可能なコードを含み、前記コンピュータ読取可能なコードが電子機器上で実行されると、前記電子機器のプロセッサに上記ネットワーク最適化方法を実現するための命令を実行させるコンピュータプログラムを提供する。
【0032】
本開示の実施例は、入力画像の第1特徴(身元特徴)と第1特徴以外の第2特徴を効果的に抽出することができ、2枚の画像の第2特徴を交換して新しいピクチャーを形成することによって、身元に関連する特徴と身元に関連しない特徴を成功的に分離することができ、ここで、身元に関連する特徴は歩行者再識別に効果的に利用可能である。本開示の実施例は、訓練段階でも適用段階でも画像データセット以外の補助情報を一切必要とせず、十分な監督を提供し、認識精度を効果的に高めることができる。
【0033】
以上の一般的な説明と以下の詳細的な説明は、解釈的や例示的なものに過ぎず、本開示を制限しないことを理解すべきである。
【0034】
図面を参照しながら例示的な実施例を詳細に説明することによって、本開示の他の特徴および方面は明確になる。
【図面の簡単な説明】
【0035】
明細書の一部として含まれる図面は、本開示に合致する実施例を示し、明細書と共に本開示の技術的手段を説明するために用いられる。
【0036】
【
図1】本開示の実施例に係るネットワーク最適化方法のフローチャートを示す。
【
図2】本開示の実施例に係るネットワーク最適化方法におけるステップS200のフローチャートを示す。
【
図3】本開示の実施例に係るネットワーク最適化方法におけるステップS300のフローチャートを示す。
【
図4】本開示の実施例に係るネットワーク最適化方法におけるステップS303のフローチャートを示す。
【
図5】本開示の実施例に係る画像処理方法におけるステップS400のフローチャートを示す。
【
図6】本開示の実施例に係る第1タイプのサンプルを用いてネットワーク最適化処理を実行する過程模式図を示す。
【
図7】本開示の実施例に係る第2タイプのサンプルを用いてネットワーク最適化処理を実行する過程模式図を示す。
【
図8】本開示の実施例に係る画像処理方法のフローチャートを示す。
【
図9】本開示の実施例に係るネットワーク最適化装置のブロック図を示す。
【
図10】本開示の実施例に係る画像処理装置のブロック図を示す。
【
図11】本開示の実施例に係る電子機器800のブロック図を示す。
【
図12】本開示の実施例に係る電子機器1900のブロック図を示す。
【発明を実施するための形態】
【0037】
以下に図面を参照しながら本開示の様々な例示的実施例、特徴および方面を詳細に説明する。図面において、同じ符号が同じまたは類似する機能の要素を表す。図面において実施例の様々な方面を示したが、特に断らない限り、比例に従って図面を描く必要がない。
【0038】
ここの用語「例示的」とは、「例、実施例として用いられることまたは説明的なもの」を意味する。ここで「例示的」に説明されたいかなる実施例も他の実施例より好ましい又は優れたるものであると理解すべきではない。
【0039】
本明細書において、用語の「及び/又は」は、関連対象の関連関係を記述するためのものに過ぎず、3つの関係が存在可能であることを示し、例えば、A及び/又はBは、Aのみが存在し、AとBが同時に存在し、Bのみが存在するという3つの場合を示すことができる。また、本明細書において、用語の「少なくとも1つ」は複数のうちのいずれか1つ又は複数のうちの少なくとも2つの任意の組合を示し、例えば、A、B、Cのうちの少なくとも1つを含むということは、A、B及びCから構成される集合から選択されたいずれか1つ又は複数の要素を含むことを示すことができる。
【0040】
また、本開示をより効果的に説明するために、以下の具体的な実施形態において様々な具体的な詳細を示す。当業者であれば、何らかの具体的な詳細がなくても、本開示は同様に実施できるということを理解すべきである。いくつかの実施例では、本開示の趣旨を強調するために、当業者に既知の方法、手段、要素および回路について、詳細な説明を省略する。
【0041】
本開示の実施例は、ニューラルネットワーク又は他の機械学習ネットワークの訓練に利用可能なネットワーク最適化方法を提供する。例えば、目標ユーザの顔認識、身元検証等を行うシーンの機械学習ネットワークの訓練過程に用いられてもよく、画像真偽判定等の高精度要求のネットワークの訓練過程に用いられてもよく、本開示は具体的な適用シーンを制限しなく、本開示で提供されるネットワーク最適化方法を用いて実施される過程であれば、全て本開示の保護範囲内に含まれる。本開示の実施例は、ニューラルネットワークを例として説明するが、これに限定されない。本開示の実施例のネットワーク最適化方法によって訓練した後、ネットワークは、対象物である人物に対する認識精度が高くなり、また、画像以外の他の補助情報の入力の必要がなくなり、簡単で便利である特徴を有する。
【0042】
本開示の実施例で提供されるネットワーク最適化方案は、ユーザ機器(User Equipment、UE)、携帯機器、ユーザ端末、端末、セルラーホン、コードレス電話、パーソナル・デジタル・アシスタント(Personal Digital Assistant、PDA)、手持ち装置、計算装置、車載装置、ウエアラブルデバイス等の端末装置、サーバ又は他の種類の電子機器により実行されてもよい。いくつかの可能な実施形態では、このネットワーク最適化方法はプロセッサによってメモリに記憶されているコンピュータ読取可能な命令を呼び出して実現されてもよい。
【0043】
図1は本開示の実施例に係るネットワーク最適化方法のフローチャートを示す。
図1に示すように、本開示の実施例のネットワーク最適化方法は、同じ対象物の画像で構成されたペア画像、及び異なる対象物の画像で構成されたペア画像を含む画像サンプル群を取得するS100と、前記画像サンプル群中の画像の、身元特徴を含む第1特徴及び属性特徴を含む第2特徴を取得し、画像の第1特徴を用いて第1分類結果を得るS200と、前記画像サンプル群内の画像に対して、ペア画像の第1画像の第1特徴と第2画像の第2特徴を用いて新しい第1画像を生成し、且つ第1画像の第2特徴と第2画像の第1特徴を用いて新しい第2画像を生成する特徴交換処理を実行して、新しいペア画像を得るS300と、所定方式を用いて、前記第1分類結果の第1損失値、前記新しいペア画像の第2損失値、及び前記新しいペア画像の第1特徴と第2特徴の第3損失値を取得するS400と、所定要求が満たされるまでに、少なくとも前記第1損失値、第2損失値及び第3損失値に基づいて、ニューラルネットワークのパラメータを調整するS500と、を含んでもよい。
【0044】
本開示の実施例では、ニューラルネットワークを訓練する時に、まずニューラルネットワークに、ニューラルネットワークを訓練するサンプル画像である画像サンプル群を入力するようにしてもよい。本開示の実施例では、画像サンプル群は、同じ対象物の異なる画像で構成されたペア画像である第1タイプのサンプル、及び異なる対象物の異なる画像で構成されたペア画像である第2タイプのサンプルといった2つのタイプの画像サンプルを含み、即ち、第1タイプのサンプルにおいて、各ペア画像毎の画像は同じ対象物の異なる画像であり、第2タイプのサンプルにおいて、各ペア画像毎の画像は異なる対象物の異なる画像であるようにしてもよい。ここで、各ペア画像毎は、下記の第1画像及び第2画像のような2つの画像を含んでもよい。また、本開示の実施例は、この2つのタイプの画像サンプルをそれぞれ用いてニューラルネットワークを訓練するようにしてもよい。
【0045】
更に、本開示の実施例の画像サンプル群中の少なくとも1つの画像は、画像における対象物に対応し、画像における対象物の人物の身元を識別するための身元標識を有するようにしてもよい。本開示の実施例では、画像サンプル群中の少なくとも1つの画像は、それに含まれる対象物に対応する、行列の形式で示す真の分類ラベルを有してもよい。この真の分類ラベルに基づいて、ニューラルネットワークモデルによる分類結果の正確度を比較し、例えば、対応する損失値を決定することができる。
【0046】
いくつかの可能な実施形態では、画像サンプル群を取得する方式は、通信コンポーネントを用いて、他の電子機器、例えばサーバ、携帯電話、任意のコンピュータ装置等から画像サンプル群を受信する方式を含んでもよい。ここで、画像サンプル群中の少なくとも1つの画像は、カメラによって取得された映像画像、コーディング処理した複数のペア画像であってもよいが、本開示を具体的に限定するものでない。
【0047】
画像サンプル群を取得した後、ニューラルネットワークの具体的な最適化過程を実行することができる。ステップS200において、まず、各ペア画像毎の第1画像と第2画像の第1特徴及び第2特徴を認識するようにしてもよい。ここで、第1特徴は、例えば、服飾の色、形状、アクセサリー特徴等画像における対象物の身元特徴を含んでもよく、第2特徴は、例えば、属性特徴のような第1特徴以外の特徴であってもよく、対象物である人物の姿勢特徴、背景特徴、環境特徴等を含んでもよい。以下、第1特徴と第2特徴の取得方式について例を挙げて説明する。
【0048】
図2は本開示の実施例に係るネットワーク最適化方法におけるステップS200のフローチャートを示す。前記画像サンプル群中の画像の第1特徴と第2特徴を取得し、画像の第1特徴を用いて第1分類結果を得ることは、前記ペア画像の2つの画像を前記ニューラルネットワークの身元コーディングネットワークモジュール及び属性コーディングネットワークモジュールに入力するS201と、前記身元コーディングネットワークモジュールを用いて前記ペア画像の2つの画像の第1特徴を取得し、前記属性コーディングネットワークモジュールを用いて前記ペア画像の2つの画像の第2特徴を取得するS202と、前記ニューラルネットワークの分類モジュールを用いて前記第1特徴に対応する第1分類結果を得るS203と、を含む。
【0049】
ここで、本開示の実施例のニューラルネットワークは、画像における対象物の身元特徴を認識するための身元コーディングネットワークモジュール、及び画像における対象物の属性特徴を認識するための属性コーディングネットワークモジュールを含んでもよい。従って、取得された画像サンプル群中の少なくとも1つのペア画像を上記身元コーディングネットワークモジュール及び属性コーディングネットワークモジュールにそれぞれ入力し、身元コーディングネットワークモジュールによって、受信したペア画像の2つの画像の第1特徴を取得し、属性コーディングネットワークモジュールによって、受信したペア画像の2つの画像の第2特徴を取得することができる。例えば、入力されたペア画像の2つの画像をそれぞれA及びBで示すと、身元コーディングネットワークモジュールによって取得されたAの第1特徴がAuであり、身元コーディングネットワークモジュールによって取得されたBの第1特徴がBuであり、属性コーディングネットワークモジュールによって取得されたAの第2特徴がAvであり、属性コーディングネットワークモジュールによって取得されたBの第2特徴がBvである。
【0050】
ここで、身元コーディングネットワークモジュールは、所定の人物特徴の抽出アルゴリズムを用いて画像の第1特徴を抽出してもよく、又は、畳み込みモジュール、プーリングモジュール等の第1特徴を取得するためのモジュールユニットを含んでもよい。本開示の実施例は、身元コーディングネットワークモジュールの構造について、具体的に限定しなく、画像の第1特徴を抽出できれば、本開示の実施例の身元コーディングネットワークモジュールとすることができる。
【0051】
以上と同様に、属性コーディングネットワークモジュールは、所定の姿勢特徴及び背景特徴のアルゴリズムを用いて画像の第2特徴を抽出してもよく、又は、畳み込みモジュール等のモジュールユニットを含んでもよい。本開示の実施例は、属性コーディングネットワークモジュールの構造について、具体的に限定しなく、画像の第2特徴を抽出できれば、本開示の実施例の属性コーディングネットワークモジュールとすることができる。
【0052】
本開示の実施例は、ペア画像の2つの画像の第1特徴と第2特徴が抽出された後、第1特徴を利用して分類認識を実行し、また、後続の特徴交換処理を実行するようにしてもよい。
【0053】
本開示の実施例のニューラルネットワークは、入力側が身元コーディングネットワークモジュールの出力側に接続されて、前記身元コーディングネットワークモジュールから出力された第1特徴を受信し、受信した第1特徴に基づいて第1分類結果を得る分類モジュールを更に含んでもよい。ここで、前記第1分類結果は、第1特徴に対応する身元標識の予測結果を示し、対象標識と予測される確率を要素とする行列の形式で示してもよい。本開示の実施例の分類モジュールの構成については、所定の分類原則によって第1特徴の分類を実行し、第1特徴に対応する第1分類結果を得るものであれば、自由に設定することができる。第1分類結果が得られた後、この第1分類結果に対応する第1損失値を取得し、更にこの第1損失値に基づいてニューラルネットワークの損失値を決定し、ネットワークのパラメータをフィードバック調整することができる。
【0054】
また、各画像の第1特徴と第2特徴が得られた後、ペア画像の2つの画像に対して特徴交換処理を行うことができる。ここで、上記の実施例の通り、特徴交換処理は、ペア画像の第1画像の第2特徴と第2画像の第2特徴を交換し、第1特徴と交換後の第2特徴に基づいて新しい画像を得ることができる。
【0055】
特徴交換処理によって、1つの画像の第1特徴と別の1つの画像の第2特徴を組み合わせて新しい画像を形成することができる。この新しい画像を用いて分類することにより、身元特徴に基づく人物身元の認識を効果的に実現し、背景、姿勢等の属性の影響を低減することができる。
【0056】
図3は本開示の実施例に係る画像処理方法におけるステップS300のフローチャートを示す。前記画像サンプル群内のペア画像に対して特徴交換処理を実行して新しいペア画像を得ることは、前記画像サンプル群内のペア画像を前記ニューラルネットワークの生成ネットワークモジュールに入力するS301と、前記生成ネットワークモジュールによって前記画像サンプル群内のペア画像に対して前記特徴交換処理を実行して、前記新しいペア画像を得るS302と、を含んでもよい。
【0057】
本開示の実施例では、ニューラルネットワークは、身元コーディングネットワークモジュール及び属性コーディングネットワークモジュールによって得られた第1特徴と第2特徴に対して特徴交換処理を実行し、交換後の特徴に基づいて新しい画像を得る生成ネットワークモジュールを更に含んでもよい。具体的には、本開示の実施例では、上記の実施例の通り、入力された画像サンプル群は、2つのタイプの画像サンプル群を含んでもよい。ここで、第1タイプのサンプル中のペア画像は同じ対象物の画像である。本開示の実施例は、第1タイプのサンプルのペア画像について、各ペア画像毎の画像に対して1回の特徴交換処理を実行するようにしてもよい。
【0058】
第1タイプのサンプルについて、前記画像サンプル群内の画像に対して特徴交換処理を実行して新しいペア画像を得ることは、前記ペア画像の画像に対して1回の特徴交換処理を実行して前記新しいペア画像を得ることを含んでもよい。この過程は、各ペア画像の第1画像の第1特徴と第2画像の第2特徴を用いて新しい第1画像を生成し、前記第1画像の第2特徴と第2画像の第1特徴を用いて新しい第2画像を生成することを含んでもよい。
【0059】
第1タイプのサンプル内のペア画像の2つの画像が同一対象物の異なる画像であるので、特徴交換処理を実行して得られた新しい画像は、依然として同一対象物の画像である。特徴交換処理が完了した後、得られた新しい画像と対応する原画像との相違、及び新しい画像の第1特徴及び第2特徴と対応する原画像の第1特徴及び第2特徴の相違に応じて、ニューラルネットワークの損失値を決定してもよい。また、生成した新しい画像を直接利用して認識分類を実行してもよく、この場合、生成した新しいペア画像を分類モジュールに入力し、分類を実行して第2分類結果を得てもよい。
【0060】
例えば、第1タイプのサンプル中のペア画像は、画像A及び画像Bを含み、身元コーディングネットワークモジュールによって取得されたAの第1特徴がAuであり、身元コーディングネットワークモジュールによって取得されたBの第1特徴がBuであり、属性コーディングネットワークモジュールによって取得されたAの第2特徴がAvであり、属性コーディングネットワークモジュールによって取得されたBの第2特徴がBvである。A及びBはそれぞれ同じ対象物の第1画像及び第2画像であり、第1画像と第2画像が異なるものである。特徴交換処理を実行する時に、Aの第1特徴Au及びBの第2特徴Bvを用いて新しい第1画像A′を得て、Bの第1特徴Bu及びAの第2特徴Avを用いて新しい第2画像B′を得るようにしてもよい。
【0061】
以上のように、本開示の実施例のニューラルネットワークは、受信した第1特徴と第2特徴に基づいて新しい画像を生成するための生成ネットワークモジュールを含んでもよい。例えば、生成ネットワークモジュールは、少なくとも1つの畳み込みユニットを含んでもよく、又は、他の処理ユニットを含んでもよい。生成ネットワークモジュールによって、第1特徴と第2特徴に対応する画像を得ることができる。即ち、生成ネットワークによって、上記第2特徴の交換、交換後の特徴に基づく画像生成の過程を実施することができる。
【0062】
上記特徴交換処理によって、2枚の画像の第2特徴を交換することで新しいピクチャーを形成でき、それによって身元に関連する特徴と身元に関連しない特徴を成功的に分離することができる。このような方式でニューラルネットワークを訓練することにより、ニューラルネットワークによる身元特徴の認識精度を高めることができる。
【0063】
また、本開示の実施例の画像サンプル群は、含まれるペア画像が異なる対象物の画像である第2タイプのサンプル群を更に含んでもよい。本開示の実施例は、第2タイプのサンプル内のペア画像について、各ペア画像毎の画像に対して2回の特徴交換処理を実行するようにしてもよい。
【0064】
図4は、第2タイプのサンプル群について、本開示の実施例に係るネットワーク最適化方法におけるステップS303のフローチャートを示す。入力されたペア画像が異なる対象物の画像である場合に、前記画像サンプル群内の画像に対して特徴交換処理を実行して新しいペア画像を得ることは、前記ペア画像の画像に対して2回の特徴交換処理を実行して新しいペア画像を得ることを含んでもよい。この過程は、前記第2タイプのサンプル内の各ペア画像毎の第1画像の第1特徴と第2画像の第2特徴を用いて新しい第1中間画像を生成し、前記第1画像の第2特徴と第2画像の第1特徴を用いて新しい第2中間画像を生成するS3031と、前記第1中間画像の第1特徴と第2中間画像の第2特徴を用いて新しい第1画像を生成し、前記第1中間画像の第2特徴と第2中間画像の第1特徴を用いて新しい第2画像を生成するS3032と、を含んでもよい。
【0065】
例えば、身元コーディングネットワークモジュールによって取得されたAの第1特徴がAuであり、身元コーディングネットワークモジュールによって取得されたBの第1特徴がBuであり、属性コーディングネットワークモジュールによって取得されたAの第2特徴がAvであり、属性コーディングネットワークモジュールによって取得されたBの第2特徴がBvである。AとBはそれぞれ異なる対象物の第1画像と第2画像である。一回目の特徴交換処理を実行する時に、Aの第1特徴AuとBの第2特徴Bvを用いて新しい第1中間画像A′を得、Bの第1特徴BuとAの第2特徴Avを用いて新しい第2中間画像B′を得るようにしてもよい。二回目の特徴交換処理を実行する時に、身元コーディングネットワークモジュール及び属性コーディングネットワークモジュールを再度用いて第1中間画像A′の第1特徴A′uと第2特徴A′v、及び第2中間画像B′の第1特徴B′uと第2特徴B′vをそれぞれ取得し、更に、生成ネットワークを用いて第1中間画像A′の第2特徴A′vと第2中間画像B′の第2特徴B′vの交換処理を実行し、第1中間画像A′の第1特徴A′uと第2中間画像B′の第2特徴B′vを用いて新しい第1画像A′′を生成し、第1中間画像A′の第2特徴A′vと第2中間画像B′の第1特徴B′uを用いて新しい第2画像B′′を生成するようにしてもよい。
【0066】
上記の2回の特徴交換処理によって、2枚の画像の第2特徴を交換することで新しいピクチャーを形成することができる。第2タイプのサンプルについて、同じ対象物のペア画像の場合の訓練過程との相違は、一回目の特徴交換処理の後、直接的な画素レベルの監督がないので、二回目の特徴交換処理を行って原画像に対応する画像を生成し、この過程を循環生成過程にしてもよい点にある。
【0067】
特徴交換処理の実行が完了した後、得られた新しい画像と対応する原画像との間の相違、及び新しい画像の第1特徴及び第2特徴と対応する原画像の第1特徴及び第2特徴の相違を利用してもよく、また、この新しい画像の第1特徴を分類モジュールに入力し、分類処理を実行して第2分類結果を得てもよい。ここで、第1タイプのサンプルの場合に、最終的な新しい画像の第1特徴の第2分類結果を直接得ることができるが、第2タイプのサンプルの場合に、最終的な新しい画像の第1特徴の第2分類結果を得ることに加えて、中間画像の第1特徴の第2分類結果も得ることができる。本開示の実施例は、上記第2分類結果、新しい画像と原画像との間の相違、及び特徴間の相違に基づいてニューラルネットワークを最適化してもよい。即ち、本開示の実施例は、ニューラルネットワークの損失値が所定要求を満たし、例えば、損失閾値より低くなるまでに、ニューラルネットワークの各ネットワークモジュールによって得られた出力結果の損失値に基づいて、ニューラルネットワークをフィードバック調整してもよい。本開示の実施例のニューラルネットワークの損失関数は、ネットワークモジュールの損失関数に関連し、例えば、複数のネットワークモジュールの損失関数の加重和であってもよい。それによって、各ネットワークモジュールの損失値に基づいてニューラルネットワークの損失値を得て、損失値が損失閾値より低いという所定要求を満たすまでに、ニューラルネットワークの各ネットワークモジュールのパラメータを調整することができる。この損失閾値について、当業者により必要に応じて設定してもよく、本開示は具体的に限定しない。
【0068】
以下、本開示の実施例のフィードバック調整過程を詳細に説明する。
【0069】
身元コーディングネットワークモジュールによって画像の第1特徴が得られた後、分類モジュールによってこの第1特徴に基づいて第1分類結果を得ることができる。本開示の実施例は、第1所定方式を用いて、前記身元コーディングネットワークモジュールによって取得された第1特徴を用いて得られた第1分類結果の第1損失値を取得してもよい。ここで、
図5は本開示の実施例に係る画像処理方法におけるステップS400のフローチャートを示す。第1損失値を取得する過程は、前記身元コーディングネットワークモジュールによって取得された第1特徴の第1分類結果を取得するS401と、第1所定方式を用いて、前記第1分類結果及び前記画像サンプル群中の画像に対応する真の分類結果に基づいて、前記第1損失値を取得するS402と、を含む。
【0070】
上記の実施例の通り、ステップS200において、サンプル中の画像の第1特徴を取得した場合に、分類モジュールによってこの第1特徴の分類認識を実行して、第1特徴に対応する第1分類結果を得て、この第1分類結果は、各身元ラベルに対応する確率を要素とする行列の形式で示してもよい。本開示の実施例では、この第1分類結果と真の分類結果を比較することにより第1差値を得て、この第1差値を第1損失値として決定してもよい。又は、別の実施例では、第1分類結果と真の分類結果を分類モジュールの第1損失関数に入力して第1損失値を得てもよい。本開示は、第1損失値の取得方式を具体的に限定しない。
【0071】
本開示の実施例では、第1タイプのサンプル及び第2タイプのサンプルによってニューラルネットワークを訓練する場合に、採用される損失関数は同じであっても、異なってもよい。また、本開示の実施例は、第1タイプのサンプルによって訓練して得られたニューラルネットワークの損失値、と第2タイプのサンプルによって訓練して得られたニューラルネットワークの損失値を加算処理して、最終的なニューラルネットワークの損失値を得て、この損失値を用いてネットワークに対するフィードバック調整処理を行うようにしてもよい。ここで、フィードバック調整は、ニューラルネットワークの各ネットワークモジュールのパラメータを調整してもよく、一部のネットワークモジュールのパラメータのみを調整してもよく、本開示は具体的に限定しない。
【0072】
まず、本開示の実施例は、第1所定方式を用いて、前記身元コーディングネットワークモジュールによって取得された第1特徴を用いて得られた第1分類結果の第1損失値を得てもよい。ここで、第1所定方式は以下の式(1)で示してもよい。
【数1】
ただし、
【数2】
は要素の乗算を示し、C(I)は第1分類結果に対応するN次元の予測特徴ベクトルを示し、Lは対応する原画像の真のラベルに対応するN次元の特徴ベクトル(真の分類結果)であり、I
tは第1損失関数に対応する第1損失値であり、iが1以上N以下の変数である。
【0073】
上記形態によれば、分類モジュールによって得られた第1分類結果の第1損失値を得ることができる。ここで、本開示の実施例は、この第1損失値に基づいて身元コーディングネットワークモジュール、属性コーディングネットワークモジュール及び分類モジュールのパラメータをフィードバック調整してもよく、この第1損失値及び他のネットワークモジュールの損失値に基づいてニューラルネットワークの全体の損失値を決定して、ニューラルネットワークの少なくとも1つのネットワークモジュールを統一的にフィードバック調整してもよく、本開示はフィードバック調整を限定しない。
【0074】
本開示の実施例は、更に、生成ネットワークモジュールによって生成した新しいペア画像を処理して、新しいペア画像の第2損失値及び対応する特徴の第3損失値を得るようにしてもよい。ここで、第2損失値の決定方式は、第2所定方式を用いて、前記生成ネットワークモジュールによって取得された新しいペア画像の、原ペア画像に対する第2損失値を取得する方式を含んでもよい。
【0075】
本開示の実施例では、生成ネットワークによって新しいペア画像を得て、新しいペア画像と原ペア画像との間の相違に基づいて、第2損失値を決定するようにしてもよい。
第1タイプのサンプルについて、前記第2所定方式は式(2)で示してもよい。
【数3】
ただし、X
u及びX
vはそれぞれ原ペア画像の第1画像及び第2画像であり、
【数4】
及び
【数5】
はそれぞれ新しいペア画像の新しい第1画像及び新しい第2画像であり、L
irは第2損失関数に対応する第2損失値であり、|| ||
1は1ノルムを示す。
【0076】
上記形態によれば、第1タイプのサンプルについて、生成ネットワークモジュールによって生成した新しいペア画像に対応する第2損失値を得ることができる。
【0077】
第2タイプのサンプルについて、前記第2所定方式は式(3)で示してもよい。
【数6】
ただし、X
uは原ペア画像の第1画像であり、
【数7】
は新しいペア画像の第1画像であり、Y
wは原ペア画像の第2画像であり、
【数8】
は新しいペア画像の第2画像である。
【0078】
また、本開示の実施例は、更に、新しい第2ペア画像の特徴に対応する第3損失値を取得してもよい。第3所定方式によって前記第3損失値を取得してもよい。
ここで、第3所定方式は式(4)で示してもよい。
【数9】
ただし、I
Xuは原ペア画像の第1画像X
uの第1特徴を示し、
【数10】
は新しい第1画像
【数11】
の第1特徴であり、I
xvは原ペア画像の第2画像X
vの第2特徴を示し、
【数12】
は新しい第2画像
【数13】
の第2特徴であり、Tは転置演算であり、L
sは第3損失関数に対応する損失値であり、|| ||
2は2ノルムを示す。
【0079】
上記形態によれば、分類モジュールによって、生成ネットワークモジュールで生成した新しいペア画像の特徴に対応する第3損失値を得ることができる。
【0080】
以上と同様に、本開示の実施例は、それぞれ第2損失値及び第3損失値に基づいて、生成ネットワークモジュールのパラメータをフィードバック調整してもよく、第1損失値、第2損失値及び第3損失値に基づいて、ニューラルネットワークの複数のネットワークモジュールを一括にフィードバック調整してもよい。例えば、本開示のいくつかの可能な実施形態では、上記第1損失値、第2損失値及び第3損失値の加重和によってニューラルネットワークの損失値を得てもよく、つまり、ニューラルネットワークの損失関数が上記第1損失関数、第2損失関数及び第3損失関数の加重和であり、それぞれの損失関数の重みを具体的に限定しなく、当業者により必要に応じて自由に設定可能である。得られた損失値が損失閾値より大きい場合、複数のネットワークモジュールのパラメータをフィードバック調整し、損失値が損失閾値より小さくなると、訓練を終了して、ニューラルネットワークの最適化を完成させる。また、本開示の実施例では、第1タイプのサンプルのペア画像に基づいて訓練する場合の第1損失関数、第2損失関数及び第3損失関数は、第2タイプのサンプルのペア画像に基づいて訓練する場合の第1損失関数、第2損失関数及び第3損失関数と異なってもよいが、本開示を具体的に限定するものでない。
【0081】
また、本開示の実施例のニューラルネットワークをより精度よく訓練するために、本開示の実施例のニューラルネットワークは、生成した新しいペア画像の真偽程度(真の程度のラベル特徴)を識別するための識別ネットワークモジュールを更に含み、この真偽程度に基づいて、識別ネットワークモジュールで決定された、生成した新しいペア画像に対応する第4損失値を取得するようにしてもよい。本開示の実施例の識別ネットワーク及び生成ネットワークは敵対的生成ネットワークを構成してもよい。この敵対的生成ネットワークの具体的な構造について、当業者により従来の技術手段に基づいて適切な構造を選択して配置することができ、本開示で具体的に限定しない。ここで、本開示の実施例は、生成した新しいペア画像を前記ニューラルネットワークの識別ネットワークモジュールに入力し、第4所定方式を用いて前記新しいペア画像の第4損失値を取得するようにしてもよい。
【0082】
ここで、第4所定方式は式(5)で示す。
【数14】
ただし、Dは識別ネットワークモジュールのモデル関数を示し、E[]は期待値を示し、Xは新しい画像に対応する原画像、即ち真の画像を示し、
【数15】
は識別ネットワークモジュールに入力される新しい画像を示し、D(X)は識別ネットワークモジュールによる、真の画像のラベル特徴を示し、
【数16】
は識別ネットワークモジュールによる、入力された新しい画像のラベル特徴を示す。ただし、
【数17】
の要素は0~1の数値であり、1に近接するほど、この要素の真の程度が高い。
【0083】
本開示の実施例では、識別ネットワークモジュールの訓練過程を単独して実行し、即ち、識別ネットワークモジュールに生成した新しい画像及び対応する真の画像を入力し、第4損失関数に対応する損失値が要求される損失閾値より低くなるまでに、上記第4損失関数に基づいて識別ネットワークモジュールを訓練するようにしてもよい。
【0084】
他のいくつかの可能な実施例では、識別ネットワークモジュールを上記の身元コーディングネットワークモジュール、属性コーディングネットワークモジュール及び生成ネットワークモジュールとともに訓練するようにしてもよい。それに対応して、本開示の実施例のステップS400は、上記第1損失値、第2損失値、第3損失値及び第4損失値に基づいてニューラルネットワークの損失値を取得するようにしてもよい。つまり、ニューラルネットワークの損失関数は、上記第1損失関数、第2損失関数、第3損失関数及び第4損失関数の加重和であり、各損失関数の重みについて、本開示は具体的に限定しなく、当業者により必要に応じて自由に設定可能である。得られた損失値が損失閾値より大きい場合、ニューラルネットワークの複数のネットワークモジュールのパラメータをフィードバック調整し、損失値が損失閾値より小さくなると、訓練を終了し、ニューラルネットワークの最適化を完成させる。
【0085】
また、本開示の実施例では、第1タイプのサンプルのペア画像に基づいて訓練する場合の第1損失関数、第2損失関数及び第3損失関数は、第2サンプル群のペア画像に基づいて訓練する場合の第1損失関数、第2損失関数及び第3損失関数と異なってもよいが、本開示を具体的に限定するものではない。
【0086】
本開示のいくつかの可能な実施例では、身元コーディングネットワークモジュール及び属性コーディングネットワークモジュールに入力した画像サンプル群が同じ対象物のペア画像である場合(第1タイプのサンプル)、第5所定方式を用いて、前記第1損失値、第2損失値、第3損失値及び第4損失値に基づいて前記ニューラルネットワークの第1ネットワーク損失値を取得し、ただし、第5所定方式は式(6)で示す。
【数18】
ただし、λ
ir、λ
s及びλ
advはそれぞれ第2損失関数、第3損失関数及び第4損失関数の重みであり、L
intraは第1ネットワーク損失値である。
【0087】
身元コーディングネットワークモジュール及び属性コーディングネットワークモジュールに入力した画像サンプル群が異なる対象物のペア画像である場合、第6所定方式を用いて、前記第1損失値、第2損失値、第3損失値及び第4損失値に基づいて前記ニューラルネットワークの第2ネットワーク損失値を得る。ただし、第6所定方式は式(7)で示す。
【数19】
ただし、λ
cr、λ
s及びλ
advはそれぞれ第2損失関数、第3損失関数及び第4損失関数の重みであり、L
interは第2ネットワーク損失値である。
【0088】
本開示の実施例は、第1ネットワーク損失値と第2ネットワーク損失値の加算結果に基づいて、ニューラルネットワークの損失値を得るようにしてもよく、即ち、ニューラルネットワークの損失値L=Lintra+Linterでってもよい。訓練過程で、得られた損失値が損失閾値より大きい場合、ニューラルネットワークのパラメータをフィードバック調整し、例えば、複数のネットワークモジュール(身元コーディングネットワークモジュール、属性コーディングネットワークモジュール、生成ネットワークモジュール及び識別ネットワークモジュール等)のパラメータをフィードバック調整し、ニューラルネットワークの損失値が損失閾値より小さくなると、訓練を終了し、ニューラルネットワークの最適化を完成させするようにしてもよい。又は、別の実施例では、第1損失値に基づいて身元コーディングネットワークモジュール、属性コーディングネットワークモジュール及び分類モジュールのパラメータを調整し、第2損失値及び第3損失値に基づいて生成ネットワークモジュールのパラメータをフィードバック調整し、第4損失値に基づいて識別ネットワークモジュールのパラメータを調整し、損失値が対応する損失関数の損失閾値より小さくなると、訓練を終了するようにしてもよい。即ち、本開示の実施例は、任意のネットワークモジュールを単独してフィードバック調整し訓練してもよく、ニューラルネットワークの損失値に基づいて、ニューラルネットワークの一部又は全部のネットワークモジュールを一括的調整してもよく、当業者により必要に応じて適切な方式を選択してこの調整過程を実行することができる。
【0089】
また、本開示の実施例では、ニューラルネットワークの身元特徴の認識精度を高めるために、前記画像サンプル群を身元コーディングネットワークモジュールに入力する前に、画像にノイズを加え、例えば、前記ペア画像の2つの画像における対象物の画像領域にノイズを加えるようにしてもよい。本開示の実施例では、対象物である人物の画像領域の一部に被覆層を加えるようにノイズを加えることができる。前記被覆層の大きさは、当業者により必要に応じて自由に設定することができ、本開示は限定しない。本開示の実施例では、身元コーディングネットワークモジュールに入力される画像のみにノイズを加え、他のネットワークモジュールにノイズを導入しない。このようにすれば、ニューラルネットワークの身元認識の精度を効果的に高めることができる。
【0090】
本開示の実施例をより明瞭に説明するために、以下、例を挙げて第1タイプのサンプル及び第2タイプのサンプルに基づく訓練過程を説明する。
【0091】
図6は本開示の実施例に係わる第1タイプのサンプルを用いてネットワーク最適化処理を実行する過程模式図を示す。ここで、同一対象物の2つの画像Xu及びXvを身元コーディングネットワークEidに入力して第1特徴を取得し、画像Xu及びXvを属性コーディングネットワークEaに入力して第2特徴を取得し、第1特徴を分類器Cに入力して第1分類結果を取得し、また第1損失値Lcを取得するようにしてもよい。ここで、身元コーディングネットワークEidに入力される画像にノイズを加え、例えば、対象物である人物の領域に被覆マップを加えて一部の領域を遮蔽してもよい。
【0092】
ペア画像の第2特徴を交換し、生成ネットワークモジュールGを用いて交換処理後の2つの新しい画像を取得し、2つの新しい画像に対応する第2損失値Lir、及び2つの新しい画像の第1特徴と第2特徴に対応する第3損失値Lsを得、新しい画像を識別ネットワークモジュールDに入力して第4損失値Ladvを得る。この時に、第1損失値Lc、第2損失値Lir、第3損失値Ls及び第4損失値Ladvを用いてニューラルネットワークの損失値を得て、この損失値が損失閾値より小さくなると、訓練を終了し、そうでなければ、ニューラルネットワークの少なくとも1つのネットワークモジュールのパラメータをフィードバック調整することができる。
【0093】
図7は本開示の実施例に係わる第2タイプのサンプルを用いてネットワーク最適化処理を実行する過程模式図を示す。ここで、異なる対象物の2つの画像Xu及びYwを身元コーディングネットワークEidに入力して第1特徴を取得し、画像Xu及びYwを属性コーディングネットワークEaに入力して第2特徴を取得し、第1特徴を分類器Cに入力して第1分類結果を取得し、また第1損失値Lcを取得するようにしてもよい。ここで、身元コーディングネットワークEidに入力される画像にノイズを加え、例えば、対象物である人物の領域に被覆マップを加えて一部の領域を遮蔽してもよい。
【0094】
ペア画像の第2特徴を交換し、生成器によって交換処理後の2つの中間画像を得、更に身元コーディングネットワークモジュールEid及び属性コーディングネットワークモジュールEaによって、これらの2つの中間画像の第1特徴と第2特徴を得、続いて中間画像の第2特徴を交換して新しい画像を得る。この時に、2つの新しい画像に対応する第2損失値Ls、及び2つの新しい画像の第1特徴と第2特徴に対応する第3損失値Lcrを得、中間画像又は新しい画像を識別ネットワークモジュールDに入力して第4損失値Ladvを得る。この時に、第1損失値、第2損失値、第3損失値及び第4損失値を用いてニューラルネットワークの損失値を得て、この損失値が損失閾値より小さくなると、訓練を終了し、そうでなければ、ニューラルネットワークの少なくとも1つのネットワークモジュールのパラメータをフィードバック調整することができる。
【0095】
本開示の実施例は、入力画像の第1特徴(身元特徴)と第1特徴以外の第2特徴を効果的に抽出することができ、2枚の画像の第2特徴を交換して新しいピクチャーを形成することによって、身元に関連する特徴と身元に関連しない特徴を効果的に分離することができ、ここで、身元に関連する特徴は、歩行者再識別に効果的に利用可能である。本開示の実施例では、訓練段階でも適用段階でも画像データセット以外の補助情報を一切必要とせず、十分な監督を提供し、認識精度を効果的に高めることができる。
【0096】
具体的な実施形態の上記方法において、各ステップの記述順序は厳しい実行順序であるというわけではなく、実施プロセスの何の制限にもならなく、各ステップの具体的な実行順序はその機能と可能な内在的論理に依存することが当業者に理解される。
【0097】
また、本開示の実施例は、第1方面で提供された画像最適化方法によって得られたニューラルネットワークを用いて画像認識を実行して、入力画像に対応する身元の認識結果を取得することができる画像処理方法更に提供する。
【0098】
図8は本開示の実施例に係る画像処理方法のフローチャートを示す。ここで、前記方法は、入力画像を受信するS10と、ニューラルネットワークモデルによって前記入力画像の第1特徴を認識するS20と、前記第1特徴に基づいて前記入力画像における対象物の身元を決定するS30と、を含み、前記ニューラルネットワークモデルは、第1方面のいずれか一項に記載のネットワーク最適化方法によって最適化処理されて得られたネットワークモデルである。
【0099】
本開示の実施例では、第1方面によって訓練して、要求を満たすニューラルネットワークモデルを得て、更にこのニューラルネットワークモデルを用いて画像における対象物の身元認識を実行するようにしてもよく、即ち、ニューラルネットワークモデルを用いて、画像認識等を実行可能な画像処理装置を形成して、この装置を用いて上記身元認識過程を実行するようにしてもよい。
【0100】
本開示の実施例では、複数の人物の情報、例えば、人物の画像、及び対応する氏名、年齢、職務等のような身元情報を含むデータベースを有してもよく、本開示はこれを限定しない。
【0101】
本開示の実施例では、入力画像が受信した後、受信した入力画像の第1特徴をデータベースにおける人物の画像と照合し、データベースにおいてマッチングする人物を判定することができる。本開示の実施例において、ニューラルネットワークモデルは、上記実施例によって訓練されて精度要求を満たすものであるので、入力画像とマッチングする対象物を精確に検索して、更にそれに対応する身元情報を取得することができる。
【0102】
本開示の実施例の画像処理方法によければ、画像における対象物の身元を高速に認識し、認識精度を高めることができる。
【0103】
本開示で言及される上記各方法の実施例は、原理と論理に違反しない限り、相互に組み合わせて実施例を形成することができることが理解され、紙数に限りがあるので、本開示では詳細な説明を省略する。
【0104】
また、本開示は、画像処理装置、電子機器、コンピュータ読取可能な記憶媒体、プログラムを更に提供し、それらはいずれも本開示で提供される画像処理方法のいずれか1つを実現することに利用可能であり、対応する技術的解決手段及び説明については、方法部分の対応の記載を参照すればよく、詳細な説明を省略する。
【0105】
図9は本開示の実施例に係るネットワーク最適化装置のブロック図を示す。
図9に示すように、前記ネットワーク最適化装置は、同じ対象物の画像で構成されたペア画像、及び異なる対象物の画像で構成されたペア画像を含む画像サンプル群を取得するための取得モジュール10と、前記画像サンプル群中の画像の第1特徴と第2特徴を取得するための特徴コーディングネットワークモジュール20と、画像の第1特徴に基づいて第1分類結果を得るための分類モジュール30と、前記画像サンプル群内のペア画像に対して、ペア画像の第1画像の第1特徴と第2画像の第2特徴を用いて新しい第1画像を生成し、且つ第1画像の第2特徴と第2画像の第1特徴を用いて新しい第2画像を生成する特徴交換処理を実行して、新しいペア画像を得るための生成ネットワークモジュール40と、所定方式を用いて、前記第1分類結果の第1損失値、前記新しいペア画像の第2損失値、及び前記新しいペア画像の第1特徴と第2特徴の第3損失値を取得するための損失値取得モジュール50と、所定要求が満たされるまでに、少なくとも前記第1損失値、第2損失値及び第3損失値に基づいてニューラルネットワークのパラメータを調整するための調整モジュール60と、を含む。
【0106】
いくつかの可能な実施形態では、前記特徴コーディングネットワークモジュールは、身元コーディングネットワークモジュール及び属性コーディングネットワークモジュールを含み、前記取得モジュールは、更に、前記ペア画像の2つの画像を前記身元コーディングネットワークモジュール及び属性コーディングネットワークモジュールに入力するために用いられ、前記身元コーディングネットワークモジュールは、前記ペア画像の2つの画像の第1特徴を取得するために用いられ、前記属性コーディングネットワークモジュールは、前記ペア画像の2つの画像の第2特徴を取得するために用いられる。
【0107】
いくつかの可能な実施形態では、前記損失値取得モジュールは、更に、前記身元コーディングネットワークモジュールによって取得された第1特徴に対応する第1分類結果を取得し、第1所定方式を用いて、前記第1分類結果及び前記画像サンプル群中の画像に対応する真の分類結果に基づいて、前記第1損失値を取得するために用いられる。
【0108】
いくつかの可能な実施形態では、前記装置は、前記ペア画像の2つの画像を前記身元コーディングネットワークモジュールに入力する前に、前記ペア画像の2つの画像における対象物の画像領域にノイズを加えるための前処理モジュールを更に含む。
【0109】
いくつかの可能な実施形態では、前記生成ネットワークモジュールは、更に、入力されたペア画像が同じ対象物の画像である場合に、前記ペア画像の画像に対して1回の特徴交換処理を実行して前記新しいペア画像を得るために用いられ、それは、ペア画像の第1画像の第1特徴と第2画像の第2特徴を用いて新しい第1画像を生成することと、前記第1画像の第2特徴と第2画像の第1特徴を用いて新しい第2画像を生成することを含む。
【0110】
いくつかの可能な実施形態では、前記生成ネットワークモジュールは、更に、入力されたペア画像が異なる対象物の画像である場合に、前記ペア画像の画像に対して2回の特徴交換処理を実行して新しいペア画像を得るために用いられ、それは、ペア画像の第1画像の第1特徴と第2画像の第2特徴を用いて新しい第1中間画像を生成し、前記第1画像の第2特徴と第2画像の第1特徴を用いて新しい第2中間画像を生成することと、前記第1中間画像の第1特徴と第2中間画像の第2特徴を用いて新しい第1画像を生成し、前記第1中間画像の第2特徴と第2中間画像の第1特徴を用いて新しい第2画像を生成すること、を含む。
【0111】
いくつかの可能な実施形態では、前記損失値取得モジュールは、更に、第2所定方式を用いて、前記生成ネットワークモジュールによって取得された新しいペア画像の、対応する原ペア画像に対する第2損失値を取得するために用いられる。
【0112】
いくつかの可能な実施形態では、前記損失値取得モジュールは、更に、第3所定方式に従って、前記新しいペア画像の第1特徴と第2特徴、及び前記新しいペア画像に対応する原ペア画像の第1特徴と第2特徴に基づいて、前記新しいペア画像の第1特徴と第2特徴の第3損失値を得るために用いられる。
【0113】
いくつかの可能な実施形態では、前記装置は、前記新しいペア画像を受信し、前記新しいペア画像の真の程度を示すラベル特徴を得るための識別ネットワークモジュールを更に含み、前記損失値取得モジュールは、更に、第4所定方式を用いて、前記ラベル特徴に基づいて前記新しいペア画像の第4損失値を取得するために用いられる。
【0114】
いくつかの可能な実施形態では、前記調整モジュールは、更に、前記第1損失値、第2損失値、第3損失値及び第4損失値を用いて前記ニューラルネットワークの損失値を得ることと、所定要求が満たされるまでに、前記ニューラルネットワークの損失値に基づいて前記ニューラルネットワークのパラメータを調整することとに用いられる。
【0115】
いくつかの可能な実施形態では、前記調整モジュールは、更に、前記ニューラルネットワークに入力された画像サンプル群が同じ対象物のペア画像である場合に、第5所定方式を用いて、前記第1損失値、第2損失値、第3損失値及び第4損失値に基づいて前記ニューラルネットワークの第1ネットワーク損失値を得ることと、前記ニューラルネットワークに入力された画像サンプル群が異なる対象物のペア画像である場合に、第6所定方式を用いて、前記第1損失値、第2損失値、第3損失値及び第4損失値に基づいて前記ニューラルネットワークの第2ネットワーク損失値を得ることと、前記第1ネットワーク損失値と第2ネットワーク損失値との加算結果に基づいて、前記ニューラルネットワークの損失値を得ることとに用いられる。
【0116】
図10は本開示の実施例に係る画像処理装置のブロック図を示す。図に示すように、画像処理装置は、入力画像を受信するための受信モジュール100と、ニューラルネットワークモデルによって前記入力画像の第1特徴を認識するための認識モジュール200と、前記第1特徴に基づいて前記入力画像における対象物の身元を決定するための身元決定モジュール300と、を含み、前記ニューラルネットワークモデルは、第1方面のいずれか一項に記載のネットワーク最適化方法によって最適化処理されて得られたネットワークモデルであるようにしてもよい。
【0117】
いくつかの実施例では、本開示の実施例で提供された装置が備えた機能又はモジュールは、上記方法実施例に記載の方法を実行するために用いられ、その具体的な実現形態については、上記方法実施例の説明を参照すればよく、簡単化するために、ここで重複説明は割愛する。
【0118】
本開示の実施例は、更に、コンピュータプログラム命令が記憶されているコンピュータ読取可能な記憶媒体であって、前記コンピュータプログラム命令は、プロセッサにより実行されると、上記方法を実現させるコンピュータ読取可能な記憶媒体を提供する。コンピュータ読取可能な記憶媒体は、不揮発性コンピュータ読取可能な記憶媒体であってもよい。
【0119】
本開示の実施例は、更に、プロセッサと、プロセッサにより実行可能な命令を記憶するためのメモリと、を含み、前記プロセッサは上記方法を実行するように構成される電子機器を提供する。
【0120】
本開示の実施例は、更に、コンピュータ読取可能なコードを含み、コンピュータ読取可能なコードが機器上で実行されと、機器のプロセッサに以上の実施例のいずれか1つで提供された上記方法を実現するための命令を実行させるコンピュータプログラム製品を提供する。
【0121】
電子機器は、端末、サーバ又は他の形態の装置として提供されてもよい。
【0122】
図11は本開示の実施例に係る電子機器800のブロック図を示す。例えば、装置800は携帯電話、コンピュータ、デジタル放送端末、メッセージ送受信装置、ゲームコンソール、タブレット装置、医療機器、フィットネス器具、パーソナル・デジタル・アシスタントなどの端末であってもよい。
【0123】
図11を参照すると、電子機器800は処理コンポーネント802、メモリ804、電源コンポーネント806、マルチメディアコンポーネント808、オーディオコンポーネント810、入力/出力(I/O)インタフェース812、センサコンポーネント814、および通信コンポーネント816のうちの一つ以上を含んでもよい。
【0124】
処理コンポーネント802は通常、電子機器800の全体的な動作、例えば表示、電話の呼び出し、データ通信、カメラ動作および記録動作に関連する動作を制御する。処理コンポーネント802は、命令を実行して上記方法の全てまたは一部のステップを実行するために、一つ以上のプロセッサ820を含んでもよい。また、処理コンポーネント802は、他のコンポーネントとのインタラクションのための一つ以上のモジュールを含んでもよい。例えば、処理コンポーネント802は、マルチメディアコンポーネント808とのインタラクションのために、マルチメディアモジュールを含んでもよい。
【0125】
メモリ804は、電子機器800での動作をサポートするための様々なタイプのデータを記憶するように構成される。これらのデータは、例として、電子機器800において運用するあらゆるアプリケーションプログラムまたは方法の命令、連絡先データ、電話帳データ、メッセージ、ピクチャー、ビデオなどを含む。メモリ804は、例えば静的ランダムアクセスメモリ(SRAM)、電気的消去可能プログラマブル読み取り専用メモリ(EEPROM)、消去可能なプログラマブル読み取り専用メモリ(EPROM)、プログラマブル読み取り専用メモリ(PROM)、読み取り専用メモリ(ROM)、磁気メモリ、フラッシュメモリ、磁気ディスクまたは光ディスクなどの様々なタイプの揮発性または非揮発性記憶装置またはそれらの組み合わせによって実現できる。
【0126】
電源コンポーネント806は電子機器800の各コンポーネントに電力を供給する。電源コンポーネント806は電源管理システム、一つ以上の電源、および電子機器800のための電力生成、管理および配分に関連する他のコンポーネントを含んでもよい。
【0127】
マルチメディアコンポーネント808は前記電子機器800とユーザとの間で出力インタフェースを提供するスクリーンを含む。いくつかの実施例では、スクリーンは液晶ディスプレイ(LCD)およびタッチパネル(TP)を含んでもよい。スクリーンがタッチパネルを含む場合、ユーザからの入力信号を受信するタッチスクリーンとして実現してもよい。タッチパネルは、タッチ、スライドおよびタッチパネルでのジェスチャを検知するために、一つ以上のタッチセンサを含む。前記タッチセンサはタッチまたはスライド動きの境界を検知するのみならず、前記タッチまたはスライド操作に関する持続時間および圧力を検出するようにしてもよい。いくつかの実施例では、マルチメディアコンポーネント808は前面カメラおよび/または後面カメラを含む。電子機器800が動作モード、例えば撮影モードまたは撮像モードになる場合、前面カメラおよび/または後面カメラは外部のマルチメディアデータを受信するようにしてもよい。各前面カメラおよび後面カメラは固定された光学レンズ系、または焦点距離および光学ズーム能力を有するものであってもよい。
【0128】
オーディオコンポーネント810はオーディオ信号を出力および/または入力するように構成される。例えば、オーディオコンポーネント810は、一つのマイク(MIC)を含み、マイク(MIC)は、電子機器800が動作モード、例えば呼び出しモード、記録モードおよび音声認識モードになる場合、外部のオーディオ信号を受信するように構成される。受信されたオーディオ信号はさらにメモリ804に記憶されるか、または通信コンポーネント816を介して送信されてもよい。いくつかの実施例では、オーディオコンポーネント810はさらに、オーディオ信号を出力するための一つのスピーカーを含む。
【0129】
I/Oインタフェース812は処理コンポーネント802と周辺インタフェースモジュールとの間でインタフェースを提供し、上記周辺インタフェースモジュールはキーボード、クリックホイール、ボタンなどであってもよい。これらのボタンはホームボタン、音量ボタン、スタートボタンおよびロックボタンを含んでもよいが、これらに限定されない。
【0130】
センサコンポーネント814は電子機器800の各面の状態評価のための一つ以上のセンサを含む。例えば、センサコンポーネント814は、電子機器800のオン/オフ状態、例えば電子機器800の表示装置およびキーパッドのようなコンポーネントの相対的位置決めを検出でき、センサコンポーネント814はさらに、電子機器800または電子機器800のあるコンポーネントの位置の変化、ユーザと電子機器800との接触の有無、電子機器800の方位または加減速および電子機器800の温度変化を検出できる。センサコンポーネント814は、いかなる物理的接触もない場合に近傍の物体の存在を検出するように構成された近接センサを含む。センサコンポーネント814はさらに、CMOSまたはCCDイメージセンサのような、イメージングアプリケーションにおいて使用するための光センサを含んでもよい。いくつかの実施例では、該センサコンポーネント814はさらに、加速度センサ、ジャイロスコープセンサ、磁気センサ、圧力センサまたは温度センサを含んでもよい。
【0131】
通信コンポーネント816は電子機器800と他の機器との間の有線または無線通信を実現するように構成される。電子機器800は通信規格に基づく無線ネットワーク、例えばWiFi、2Gまたは3G、またはそれらの組み合わせにアクセスできる。一例示的実施例では、通信コンポーネント816は放送チャネルを介して外部の放送管理システムからの放送信号または放送関連情報を受信する。一例示的実施例では、前記通信コンポーネント816はさらに、近距離通信を促進させるために、近距離無線通信(NFC)モジュールを含む。例えば、NFCモジュールは無線周波数識別(RFID)技術、赤外線データ協会(IrDA)技術、超広帯域(UWB)技術、ブルートゥース(登録商標/BT)技術および他の技術によって実現できる。
【0132】
例示的な実施例では、電子機器800は一つ以上の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理デバイス(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、コントローラ、マイクロコントローラ、マイクロプロセッサまたは他の電子要素によって実現され、上記方法を実行するために用いることができる。
【0133】
例示的な実施例では、さらに、非揮発性コンピュータ読み取り可能な記憶媒体、例えばコンピュータプログラム命令を含むメモリ804が提供され、上記コンピュータプログラム命令は電子機器800のプロセッサ820によって実行されると、上記方法を実行することができる。
【0134】
図12は例示的な一実施例に基づいて示された電子機器1900のブロック図である。例えば、電子機器1900はサーバとして提供されてもよい。
図12を参照すると、電子機器1900は、さらに一つ以上のプロセッサを含む処理コンポーネント1922、および、処理コンポーネント1922によって実行可能な命令、例えばアプリケーションプログラムを記憶するための、メモリ1932を代表とするメモリ資源を含む。メモリ1932に記憶されたアプリケーションプログラムは、それぞれが1つの命令群に対応する一つ以上のモジュールを含んでもよい。また、処理コンポーネント1922は、命令を実行することによって上記方法を実行するように構成される。
【0135】
電子機器1900はさらに、電子機器1900の電源管理を実行するように構成された一つの電源コンポーネント1926、電子機器1900をネットワークに接続するように構成された一つの有線または無線ネットワークインタフェース1950、および一つの入出力(I/O)インタフェース1958を含んでもよい。電子機器1900はメモリ1932に記憶されたオペレーティングシステム、例えばWindows(登録商標) ServerTM、Mac OS XTM、UnixTM、LinuxTM、FreeBSDTMまたは類似するものに基づいて動作できる。
【0136】
例示的な実施例では、さらに、非揮発性コンピュータ読み取り可能な記憶媒体、例えばコンピュータプログラム命令を含むメモリ1932が提供され、上記コンピュータプログラム命令は、電子機器1900の処理コンポーネント1922によって実行されると、上記方法を実行することができる。
【0137】
本開示はシステム、方法および/またはコンピュータプログラム製品であってもよい。コンピュータプログラム製品は、プロセッサに本開示の各方面を実現させるためのコンピュータ読み取り可能なプログラム命令を有しているコンピュータ読み取り可能な記憶媒体を含んでもよい。
【0138】
コンピュータ読み取り可能な記憶媒体は命令実行装置に使用される命令を保存および記憶可能な有形装置であってもよい。コンピュータ読み取り可能な記憶媒体は例えば、電気記憶装置、磁気記憶装置、光記憶装置、電磁記憶装置、半導体記憶装置または上記の任意の適当な組み合わせであってもよいが、これらに限定されない。コンピュータ読み取り可能な記憶媒体のさらなる具体的な例(非網羅的リスト)としては、携帯型コンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROMまたはフラッシュメモリ)、静的ランダムアクセスメモリ(SRAM)、携帯型コンパクトディスク読み取り専用メモリ(CD-ROM)、デジタル多用途ディスク(DVD)、メモリスティック、フロッピーディスク、例えば命令が記憶されているせん孔カードまたはスロット内の突起構造のような機械的符号化装置、および上記の任意の適当な組み合わせを含む。ここで使用されるコンピュータ読み取り可能な記憶媒体は瞬時信号自体、例えば無線電波または他の自由に伝播される電磁波、導波路または他の伝送媒体を経由して伝播される電磁波(例えば、光ファイバーケーブルを通過する光パルス)、または電線を経由して伝送される電気信号と解釈されるものではない。
【0139】
ここで記述したコンピュータ読み取り可能なプログラム命令はコンピュータ読み取り可能な記憶媒体から各計算/処理機器にダウンロードされてもよいし、またはネットワーク、例えばインターネット、ローカルエリアネットワーク、広域ネットワークおよび/または無線ネットワークを経由して外部のコンピュータまたは外部記憶装置にダウンロードされてもよい。ネットワークは銅伝送ケーブル、光ファイバー伝送、無線伝送、ルーター、ファイアウォール、交換機、ゲートウェイコンピュータおよび/またはエッジサーバを含んでもよい。各計算/処理機器内のネットワークアダプタカードまたはネットワークインタフェースは、ネットワークからコンピュータ読み取り可能なプログラム命令を受信し、該コンピュータ読み取り可能プログラム命令を転送し、各計算/処理機器内のコンピュータ読み取り可能な記憶媒体に記憶させる。
【0140】
本開示の動作を実行するためのコンピュータプログラム命令はアセンブラ命令、命令セットアーキテクチャ(ISA)命令、機械語命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはSmalltalk、C++などのオブジェクト指向プログラミング言語および「C」言語または類似するプログラミング言語などの一般的な手続き型プログラミング言語を含む一つ以上のプログラミング言語の任意の組み合わせで書かれたソースコードまたは目標コードであってもよい。コンピュータ読み取り可能なプログラム命令は、完全にユーザのコンピュータにおいて実行されてもよく、部分的にユーザのコンピュータにおいて実行されてもよく、スタンドアロンソフトウェアパッケージとして実行されてもよく、部分的にユーザのコンピュータにおいてかつ部分的にリモートコンピュータにおいて実行されてもよく、または完全にリモートコンピュータもしくはサーバにおいて実行されてもよい。リモートコンピュータに関与する場合、リモートコンピュータは、ローカルエリアネットワーク(LAN)または広域ネットワーク(WAN)を含む任意の種類のネットワークを経由してユーザのコンピュータに接続されてもよく、または、(例えばインターネットサービスプロバイダを利用してインターネットを経由して)外部コンピュータに接続されてもよい。いくつかの実施例では、コンピュータ読み取り可能なプログラム命令の状態情報を利用して、例えばプログラマブル論理回路、フィールドプログラマブルゲートアレイ(FPGA)またはプログラマブル論理アレイ(PLA)などの電子回路をパーソナライズし、該電子回路によりコンピュータ読み取り可能なプログラム命令を実行することにより、本開示の各方面を実現できるようにしてもよい。
【0141】
ここで本開示の実施例に係る方法、装置(システム)およびコンピュータプログラム製品のフローチャートおよび/またはブロック図を参照しながら本開示の各態様を説明した。フローチャートおよび/またはブロック図の各ブロック、およびフローチャートおよび/またはブロック図の各ブロックの組み合わせは、いずれもコンピュータ読み取り可能なプログラム命令によって実現できることを理解すべきである。
【0142】
これらのコンピュータ読み取り可能なプログラム命令は、汎用コンピュータ、専用コンピュータまたは他のプログラマブルデータ処理装置のプロセッサへ提供されて、これらの命令がコンピュータまたは他のプログラマブルデータ処理装置のプロセッサによって実行ると、フローチャートおよび/またはブロック図の一つ以上のブロックにおいて指定された機能/動作を実現するように機械を製造してもよい。また、これらのコンピュータ読み取り可能なプログラム命令は、コンピュータ読み取り可能な記憶媒体に記憶し、それによってコンピュータ、プログラマブルデータ処理装置および/または他の機器を特定の方式で動作させるようにしてもよい。命令が記憶されているコンピュータ読み取り可能な記憶媒体は、フローチャートおよび/またはブロック図の一つ以上のブロックにおいて指定された機能/動作の各方面を実現するための命令を有する製品を含む。
【0143】
コンピュータ読み取り可能なプログラムは、コンピュータ、他のプログラマブルデータ処理装置、または他の機器にロードし、コンピュータ、他のプログラマブルデータ処理装置または他の機器に一連の動作ステップを実行させることにより、コンピュータにより実施なプロセスを生成し、コンピュータ、他のプログラマブルデータ処理装置、または他の機器において実行される命令によりフローチャートおよび/またはブロック図の一つ以上のブロックにおいて指定された機能/動作を実現する。
【0144】
図面のうちフローチャートおよびブロック図は本開示の複数の実施例に係るシステム、方法およびコンピュータプログラム製品の実現可能なシステムアーキテクチャ、機能および動作を示す。この点では、フローチャートまたはブロック図における各ブロックは一つのモジュール、プログラムセグメントまたは命令の一部分を代表することができ、前記モジュール、プログラムセグメントまたは命令の一部分は指定された論理機能を実現するための一つ以上の実行可能命令を含む。いくつかの代替としての実現形態では、ブロックに表記される機能は図面に付した順序と異なる順序で実現してもよい。例えば、連続的な二つのブロックは実質的に並行に実行してもよく、また、係る機能によって、逆な順序で実行してもよい場合がある。なお、ブロック図および/またはフローチャートにおける各ブロック、およびブロック図および/またはフローチャートにおけるブロックの組み合わせは、指定される機能または動作を実行するハードウェアに基づく専用システムによって実現してもよいし、または専用ハードウェアとコンピュータ命令との組み合わせによって実現してもよいことにも注意すべきである。
【0145】
以上、本開示の各実施例を記述したが、上記説明は例示的なものに過ぎず、網羅的なものではなく、かつ披露された各実施例に限定されるものでもない。当業者にとって、説明された各実施例の範囲および精神から逸脱することなく、様々な修正および変更が自明である。本明細書に用いられた用語は、各実施例の原理、実際の適用または従来技術への技術的改善を好適に解釈するか、または他の当業者に本明細書に披露された各実施例を理解させるためのものである。
【0146】
本開示は、2019年1月15日に中国特許局に提出された、出願番号が201910036096.Xで、発明の名称が「ネットワーク最適化方法及び装置、画像処理方法及び装置、並びに記憶媒体」である中国特許出願の優先権を主張し、その開示の全ての内容が参照によって本開示に組み込まれる。