IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ シェンチェン センスタイム テクノロジー カンパニー リミテッドの特許一覧

特表2023-501028車両識別方法及び装置、電子デバイス及び記憶媒体
<>
  • 特表-車両識別方法及び装置、電子デバイス及び記憶媒体 図1
  • 特表-車両識別方法及び装置、電子デバイス及び記憶媒体 図2
  • 特表-車両識別方法及び装置、電子デバイス及び記憶媒体 図3
  • 特表-車両識別方法及び装置、電子デバイス及び記憶媒体 図4
  • 特表-車両識別方法及び装置、電子デバイス及び記憶媒体 図5
  • 特表-車両識別方法及び装置、電子デバイス及び記憶媒体 図6
  • 特表-車両識別方法及び装置、電子デバイス及び記憶媒体 図7
  • 特表-車両識別方法及び装置、電子デバイス及び記憶媒体 図8
  • 特表-車両識別方法及び装置、電子デバイス及び記憶媒体 図9
  • 特表-車両識別方法及び装置、電子デバイス及び記憶媒体 図10
  • 特表-車両識別方法及び装置、電子デバイス及び記憶媒体 図11
  • 特表-車両識別方法及び装置、電子デバイス及び記憶媒体 図12
  • 特表-車両識別方法及び装置、電子デバイス及び記憶媒体 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-01-18
(54)【発明の名称】車両識別方法及び装置、電子デバイス及び記憶媒体
(51)【国際特許分類】
   G06V 10/40 20220101AFI20230111BHJP
   G06T 7/00 20170101ALI20230111BHJP
   G06V 10/82 20220101ALI20230111BHJP
   G06V 20/54 20220101ALI20230111BHJP
【FI】
G06V10/40
G06T7/00 300F
G06T7/00 650B
G06T7/00 350C
G06V10/82
G06V20/54
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2021575043
(86)(22)【出願日】2020-12-28
(85)【翻訳文提出日】2021-12-16
(86)【国際出願番号】 CN2020140315
(87)【国際公開番号】W WO2022052375
(87)【国際公開日】2022-03-17
(31)【優先権主張番号】202010947349.1
(32)【優先日】2020-09-10
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
(71)【出願人】
【識別番号】518209698
【氏名又は名称】シェンチェン センスタイム テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】SHENZHEN SENSETIME TECHNOLOGY CO.,LTD
(74)【代理人】
【識別番号】110001427
【氏名又は名称】弁理士法人前田特許事務所
(72)【発明者】
【氏名】ホー ジーチュン
(72)【発明者】
【氏名】ウー ウェイ
(72)【発明者】
【氏名】ジュー チョンカイ
(72)【発明者】
【氏名】イエン ジュンジエ
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA06
5L096BA04
5L096BA18
5L096DA02
5L096EA11
5L096EA39
5L096EA43
5L096FA32
5L096GA30
5L096GA51
5L096HA11
5L096JA03
5L096JA11
5L096JA22
5L096KA04
(57)【要約】
本発明は、車両識別方法及び装置、電子デバイス及び記憶媒体を開示する。当該方法は、第1の識別対象車両を含む処理対象画像を取得することと、前記処理対象画像に対して第1の特徴抽出処理を行うことで、前記第1の識別対象車両のローカル特徴情報を含む第1の特徴データを取得することと、前記処理対象画像に対して第2の特徴抽出処理を行うことで、前記第1の識別対象車両のグローバル特徴情報を含む第2の特徴データを取得することと、前記第1の特徴データと前記第2の特徴データに対して融合処理を行うことで、前記第1の識別対象車両の第3の特徴データを取得することであって、前記第3の特徴データは前記第1の識別対象車両の識別結果を取得するために使用されることと、を含む。
【選択図】図1
【特許請求の範囲】
【請求項1】
車両識別方法であって、
第1の識別対象車両を含む処理対象画像を取得することと、
前記処理対象画像に対して第1の特徴抽出処理を行うことで、前記第1の識別対象車両のローカル特徴情報を含む第1の特徴データを取得することと、
前記処理対象画像に対して第2の特徴抽出処理を行うことで、前記第1の識別対象車両のグローバル特徴情報を含む第2の特徴データを取得することと、
前記第1の特徴データと前記第2の特徴データに対して融合処理を行うことで、前記第1の識別対象車両の第3の特徴データを取得することであって、前記第3の特徴データは、前記第1の識別対象車両の識別結果を取得するために使用されることと、を含む、
車両識別方法。
【請求項2】
前記ローカル特徴情報は、キーポイントの特徴情報を含み、前記第1の特徴データは、前記識別対象車両の少なくとも1つのキーポイントの特徴情報を含むことを特徴とする
請求項1に記載の方法。
【請求項3】
前記ローカル特徴情報は、ローカル画素点領域の特徴情報をさらに含み、前記第1の特徴データは、前記識別対象車両の少なくとも1つのローカル画素点領域の特徴情報をさらに含むことを特徴とする
請求項2に記載の方法。
【請求項4】
前記処理対象画像に対して第1の特徴抽出処理を行うことで、前記第1の識別対象車両のローカル特徴情報を含む第1の特徴データを取得することは、
前記処理対象画像に対して第3の特徴抽出処理を行うことで、第4の特徴データを取得することであって、前記第4の特徴データは前記第1の識別対象車両の少なくとも1つのキーポイントの特徴情報を含むことと、
前記処理対象画像に対して第4の特徴抽出処理を行うことで、第5の特徴データを取得することであって、前記第5の特徴データは前記第1の識別対象車両の少なくとも1つのローカル画素点領域の特徴情報を含み、前記ローカル画素点領域は前記第1の識別対象車両によって覆われた画素点領域に属し、前記ローカル画素点領域の面積が前記第1の識別対象車両によって覆われた画素点領域の面積よりも小さいことと、
前記第4の特徴データと第5の特徴データに対して融合処理を行うことで、前記第1の特徴データを取得することと、を含むことを特徴とする
請求項3に記載の方法。
【請求項5】
前記処理対象画像に対して第3の特徴抽出処理を行うことで、第4の特徴データを取得することは、
前記処理対象画像に対して第5の特徴抽出処理を行うことで、少なくとも1つの第6の特徴データを取得することであって、前記第6の特徴データは前記キーポイントの特徴情報を含み、任意の2つの前記第6の特徴データに含まれる特徴情報が異なるキーポイントに属することと、
前記少なくとも1つの第6の特徴データから含まれる情報量の最も多いk個の特徴データを選択することで、k個の第7の特徴データを取得することであって、前記kは1以上の整数であることと、
前記k個の第7の特徴データに基づいて、前記第4の特徴データを取得することと、を含むことを特徴とする
請求項4に記載の方法。
【請求項6】
前記処理対象画像に対して第5の特徴抽出処理を行うことで、少なくとも1つの第6の特徴データを取得することは、
前記処理対象画像に対して第6の特徴抽出処理を行うことで、少なくとも1つのヒートマップを取得することであって、前記第1のヒートマップは前記処理対象画像における前記キーポイントの位置情報を含み、任意の2つの前記第1のヒートマップに含まれる情報が異なるキーポイントに属することと、
前記処理対象画像に対して第7の特徴抽出処理を行うことで、前記処理対象画像の第1の特徴画像を取得することであって、前記第1の特徴画像は前記処理対象画像におけるキーポイントの特徴情報を含むことと、
各前記第1のヒートマップと前記第1の特徴画像との間のドット積をそれぞれ確定することで、前記少なくとも1つの第6の特徴データを取得することと、を含むことを特徴とする
請求項5に記載の方法。
【請求項7】
前記少なくとも1つの第6の特徴データから含まれる情報量の最も多いk個の特徴データを選択することで、k個の第7の特徴データを取得することは、
前記少なくとも1つの第6の特徴データにおける特徴データに対してプール化処理をそれぞれ行うことで、少なくとも1つの第8の特徴データを取得することと、
前記少なくとも1つの第8の特徴データに含まれる情報量に基づいて、少なくとも1つの第1の確率を取得することであって、前記第1の確率は前記第6の特徴データに含まれる情報量を特徴付けるために使用され、前記第1の確率は前記第6の特徴データと1対1で対応していることと、
前記第1の確率が前記第6の特徴データに含まれる情報量と正の相関にある場合、最大のk個の前記第1の確率に対応する前記第6の特徴データを前記k個の第7の特徴データとして選択すること、又は、
前記第1の確率が前記第6の特徴データに含まれる情報量と負の相関にある場合、最小のk個の前記第1の確率に対応する前記第6の特徴データを前記k個の第7の特徴データとして選択することと、を含むことを特徴とする
請求項5又は6に記載の方法。
【請求項8】
前記処理対象画像に対して第4の特徴抽出処理を行うことで、第5の特徴データを取得することは、
前記処理対象画像に対して第10の特徴抽出処理を行うことで、少なくとも1つの第9の特徴データを取得することであって、前記第9の特徴データは前記キーポイントの特徴情報を含み、任意の2つの前記第9の特徴データに含まれる特徴情報が異なるローカル画素点領域に属することと、
前記少なくとも2つの第9の特徴データから含まれる情報量の最も多いm個の特徴データを選択することで、m個の第10の特徴データを取得することであって、前記mは1以上の整数であることと、
前記m個の第10の特徴データに基づいて、前記第5の特徴データを取得することと、を含むことを特徴とする
請求項3~7のいずれか一項に記載の方法。
【請求項9】
前記処理対象画像に対して第10の特徴抽出処理を行うことで、少なくとも1つの第9の特徴データを取得することは、
前記処理対象画像に対して第11の特徴抽出処理を行うことで、前記少なくとも1つの第2のヒートマップを取得することであって、前記第2のヒートマップは前記処理対象画像における前記ローカル画素点領域の位置情報を含み、任意の2つの前記第2のヒートマップに含まれる情報が異なるローカル画素点領域に属することと、
前記処理対象画像に対して第12の特徴抽出処理を行うことで、前記処理対象画像の第2の特徴画像を取得することであって、前記第2の特徴画像は前記処理対象画像におけるローカル画素点領域の特徴情報を含むことと、
各前記第2のヒートマップと前記第2の特徴画像との間のドット積をそれぞれ確定することで、前記少なくとも1つの第9の特徴データを取得することと、を含むことを特徴とする
請求項8に記載の方法。
【請求項10】
前記少なくとも2つの第9の特徴データから含まれる情報の最も多いm個の特徴データを選択することで、m個の第10の特徴データを取得することは、
前記第9の特徴データにおける特徴データに対してプール化処理をそれぞれ行うことで、少なくとも1つの第11の特徴データを取得することと、
前記少なくとも1つの第11の特徴データに含まれる情報量に基づいて、少なくとも1つの第2の確率を取得することであって、前記第2の確率は前記第9の特徴データに含まれる情報量を特徴付けるために使用され、前記第2の確率が前記第9の特徴データと1対1で対応していることと、
前記第2の確率が前記第9の特徴データに含まれる情報量と正の相関にある場合、最大のm個の前記第2の確率に対応する前記第9の特徴データを前記m個の第10の特徴データとして選択すること、又は、
前記第2の確率が前記第9の特徴データに含まれる情報量と負の相関にある場合、最小のm個の前記第2の確率に対応する前記第9の特徴データを前記m個の第10の特徴データとして選択することとを含むことを特徴とする
請求項8又は9に記載の方法。
【請求項11】
前記少なくとも1のローカル画素点領域は、第1の画素点領域と第2の画素点領域を含み、前記第9の特徴データの数及び前記mの両方はいずれも1よりも大きく、前記m個の第10の特徴データは、第12の特徴データと第13の特徴データを含み、前記第12の特徴データは、前記第1の画素点領域の特徴情報を含み、前記第13の特徴データは、前記第2の画素点領域の特徴情報を含み、
前記m個の第10の特徴データに基づいて前記第5の特徴データを取得することは、
前記第12の特徴データに含まれる情報量に基づいて第1の重みを取得し、前記第13の特徴データに含まれる情報量に基づいて第2の重みを取得ことであって、前記第1の重みが前記第12の特徴データに含まれる情報量と正の相関にあり、前記第2の重みが前記第13の特徴データに含まれる情報量と正の相関にあることと、
前記第1の重み及び前記第2の重みに基づいて、前記第12の特徴データ及び前記第13の特徴データを加重融合することで、前記第5の特徴データを取得することと、を含むことを特徴とする
請求項8~10のいずれか一項に記載の方法。
【請求項12】
前記車両識別方法は、車両識別ネットワークに応用され、
前記車両識別ネットワークのトレーニング方法は、
第2の識別対象車両を含むトレーニング画像及びトレーニング対象ネットワークを取得することと、
前記トレーニング対象ネットワークを使用して前記トレーニング画像を処理することで、前記第2の識別対象車両のグローバル特徴情報を含む第14の特徴データと、前記第2の識別対象車両のキーポイントの特徴情報を含む第15の特徴データとを取得することと、
前記第14の特徴データ及び前記トレーニング画像のラベルに基づいて、第1のグローバルロスを取得することと、
前記第15の特徴データ及び前記ラベルに基づいて、第1のキーポイントロスを取得することと、
前記第1のグローバルロス及び前記第1のキーポイントロスに基づいて、前記トレーニング対象ネットワークの総ロスを取得することと、
前記総ロスに基づいて前記トレーニング対象ネットワークのパラメータを調整することで、前記車両識別ネットワークを取得することと、を含むことを特徴とする
請求項1~11のいずれか一項に記載の方法。
【請求項13】
前記第1のグローバルロス及び前記第1のキーポイントロスに基づいて、前記トレーニング対象ネットワークの総ロスを取得することの前に、前記方法は、
前記トレーニング対象ネットワークを使用して前記トレーニング画像を処理することで、前記第2の識別対象車両のローカル画素点領域の特徴情報を含む第16の特徴データを取得することと、
前記第16の特徴データ及び前記ラベルに基づいて、第1のローカル画素点領域ロスを取得することと、をさらに含み、
前記第1のグローバルロス及び前記第1のキーポイントロスに基づいて、前記トレーニング対象ネットワークの総ロスを取得することは、
前記第1のグローバルロス、前記第1のキーポイントロス及び前記第1のローカル画素点領域ロスに基づいて、前記総ロスを取得することを含むことを特徴とする
請求項12に記載の方法。
【請求項14】
前記トレーニング対象ネットワークを使用して前記トレーニング画像を処理することで、前記第2の識別対象車両のキーポイントの特徴情報を含む第15の特徴データを取得することは、
前記トレーニング対象ネットワークを使用して前記トレーニング画像を処理することで、少なくとも1つの第17の特徴データを取得することであって、前記第17の特徴データは前記第2の識別対象車両のキーポイントの特徴情報を含み、任意の2つの前記第17の特徴データに含まれる特徴情報が異なるキーポイントに属することと、
前記少なくとも1つの第17の特徴データから含まれる情報量の最も多いs個の特徴データを選択することで、s個の第18の特徴データを取得することであって、前記sは1以上の整数であることと、
前記s個の第18の特徴データに対して融合処理を行うことで、前記第15の特徴データを取得することと、を含むことを特徴とする
請求項13に記載の方法。
【請求項15】
前記第1のグローバルロス、前記第1のキーポイントロス及び前記第1のローカル画素点領域ロスに基づいて、前記総ロスを取得することの前に、前記方法は、
前記s個の第18の特徴データに基づいて、前記第2の識別対象車両のs個の第1の識別結果を取得することと、
前記s個の第1の識別結果のそれぞれと前記ラベルとの違いに基づいて、キーポイントカテゴリロスを取得することと、をさらに含み、
前記第1のグローバルロス、前記第1のキーポイントロス及び前記第1のローカル画素点領域ロスに基づいて、前記総ロスを取得することは、
前記第1のグローバルロス、前記第1のキーポイントロス、前記第1のローカル画素点領域ロス及び前記キーポイントカテゴリロスに基づいて、前記総ロスを取得することを含むことを特徴とする
請求項14に記載の方法。
【請求項16】
前記少なくとも1つの第17の特徴データから含まれる情報量の最も多いs個の特徴データを選択することで、s個の第18の特徴データを取得することは、
含まれる情報量に基づいて前記少なくとも1つの第17の特徴データをソートすることで、第1の順序を取得することであって、前記第1の順序が含まれる情報量の降順であり、又は、前記第1の順序が含まれる情報量の昇順であることと、
前記第1の順序に基づいて前記の少なくとも1つの第17の特徴データから含まれる情報量の最も多いs個の特徴データを選択することで、前記s個の第18の特徴データを取得することと、を含み、
前記第1のグローバルロス、前記第1のキーポイントロス、前記第1のローカル画素点領域ロス及び前記キーポイントカテゴリロスに基づいて、前記総ロスを取得することの前に、前記方法は、
対応する前記キーポイントカテゴリロスに基づいて前記s個の第1の識別結果をソートすることで、第2の順序を取得することであって、前記第2の順序が前記キーポイントカテゴリロスの降順であり、又は、前記第2の順序が前記キーポイントカテゴリロスの昇順であることと、
前記第1の順序と前記第2の順序との違いに基づいて、キーポイントソートロスを取得することと、をさらに含み、
前記第1のグローバルロス、前記第1のキーポイントロス、前記第1のローカル画素点領域ロス及び前記キーポイントカテゴリロスに基づいて、前記総ロスを取得することは、
前記第1のグローバルロス、前記第1のキーポイントロス、前記第1のローカル画素点領域ロス、前記記キーポイントカテゴリロス及び前記キーポイントソートロスに基づいて、前記総ロスを取得することを含むことを特徴とする
請求項14又は15に記載の方法。
【請求項17】
前記トレーニング対象ネットワークを使用して前記トレーニング画像を処理することで、前記第2の識別対象車両のローカル画素点領域の特徴情報を含む第16の特徴データを取得することは、
前記トレーニング対象ネットワークを使用して前記トレーニング画像を処理することで、少なくとも1つの第19の特徴データを取得することであって、前記第19の特徴データは前記ローカル画素点領域の特徴情報を含み、任意の2つの前記第19の特徴データに含まれる特徴情報が異なるローカル画素点領域に属することと、
前記少なくとも1つの第19の特徴データから含まれる情報量の最も多いp個の特徴データを選択し、p個の第20の特徴データを取得することであって、前記pは1以上の整数であることと、
前記p個の第20の特徴データに対して融合処理を行い、前記第16の特徴データを取得することと、を含むことを特徴とする
請求項16に記載の方法。
【請求項18】
前記第1のグローバルロス、前記第1のキーポイントロス、前記第1のローカル画素点領域ロス、前記記キーポイントカテゴリロス及び前記キーポイントソートロスに基づいて、前記総ロスを取得することの前に、前記方法は、
前記p個の第20の特徴データに基づいて、前記第2の識別対象車両のp個の第2の識別結果を取得することと、
前記p個の第2の識別結果のそれぞれと前記ラベルの違いに基づいて、ローカル画素点領域カテゴリロスを取得することと、をさらに含み、
前記第1のグローバルロス、前記第1のキーポイントロス、前記第1のローカル画素点領域ロス、前記記キーポイントカテゴリロス及び前記キーポイントソートロスに基づいて、前記総ロスを取得することは、
前記第1のグローバルロス、前記第1のキーポイントロス、前記第1のローカル画素点領域ロス、前記記キーポイントカテゴリロス、前記キーポイントソートロス及び前記ローカル画素点領域カテゴリロスに基づいて、前記総ロスを取得することを含むことを特徴とする
請求項17に記載の方法。
【請求項19】
前記少なくとも1つの第19の特徴データから含まれる情報量の最も多いp個の特徴データを選択することで、p個の第20の特徴データを取得することは、
含まれる情報量に基づいて前記少なくとも1つの第19の特徴データをソートすることで、第3の順序を取得することであって、前記第3の順序が含まれる情報量の降順であり、又は、前記第3の順序が含まれる情報量の昇順であることと、
前記第3の順序に基づいて前記少なくとも1つの第19の特徴データから含まれる情報量の最も多いp個の特徴データを選択することで、前記p個の第20の特徴データを取得することと、を含み、
前記第1のグローバルロス、前記第1のキーポイントロス、前記第1のローカル画素点領域ロス、前記記キーポイントカテゴリロス、前記キーポイントソートロス及び前記ローカル画素点領域カテゴリロスに基づいて、前記総ロスを取得することの前に、前記方法は、
対応する前記ローカル画素点領域カテゴリロスに基づいて前記p個の第2の識別結果をソートすることで、第4の順序を取得することであって、前記第4の順序が前記ローカル画素点領域カテゴリロスの降順であり、又は、前記第4の順序が前記ローカル画素点領域カテゴリロスの昇順であることと、
前記第3の順序と前記第4の順序との違いに基づき、ローカル画素点領域ソートロスを取得することと、をさらに含み、
前記第1のグローバルロス、前記第1のキーポイントロス、前記第1のローカル画素点領域ロス、前記記キーポイントカテゴリロス、前記キーポイントソートロス及び前記ローカル画素点領域カテゴリロスに基づいて、前記総ロスを取得することは、
前記第1のグローバルロス、前記第1のキーポイントロス、前記第1のローカル画素点領域ロス、前記記キーポイントカテゴリロス、前記キーポイントソートロス、前記ローカル画素点領域カテゴリロス及び前記ローカル画素点領域ソートロスに基づいて、前記総ロスを取得することと、を含むことを特徴とする
請求項17又は18に記載の方法。
【請求項20】
前記第1のグローバルロスは、グローバルフォーカスロスを含み、
前記第14の特徴データ及び前記トレーニング画像のラベルに基づいて、第1のグローバルロスを取得することは、
前記第14の特徴データに基づいて、前記第2の識別対象車両の第3の識別結果を取得することと、
前記第3の識別結果及び前記ラベルに基づいて、前記第3の識別結果のフォーカスロスを前記グローバルフォーカスロスとして取得することと、を含むことを特徴とする
請求項12~19のいずれか一項に記載の方法。
【請求項21】
前記トレーニング画像は、トレーニング画像セットに属し、前記トレーニング画像セットは、前記トレーニング画像の第1の正サンプル画像及び前記トレーニング画像の第1の負サンプル画像をさらに含み、前記第1のグローバルロスは、グローバルトリプレットロスをさらに含み、
前記方法は、
前記トレーニング対象ネットワークを使用して前記第1の正サンプル画像に対して特徴抽出処理を行うことで、前記第1の正サンプル画像の特徴データを取得することと、
前記トレーニング対象ネットワークを使用して前記第1の負サンプル画像に対して特徴抽出処理を行うことで、前記第1の負サンプル画像の特徴データを取得することと、
前記第12の特徴データ、前記第1の正サンプル画像の特徴データ及び前記第1の負サンプル画像の特徴データに基づいて、前記グローバルトリプレットロスを取得することと、を含むことを特徴とする
請求項20に記載の方法。
【請求項22】
車両識別装置であって、
第1の識別対象車両を含む処理対象画像を取得するように構成される取得ユニットと、
前記処理対象画像に対して第1の特徴抽出処理を行うことで、前記第1の識別対象車両のローカル特徴情報を含む第1の特徴データを取得するように構成される第1の処理ユニットと、
前記処理対象画像に対して第2の特徴抽出処理を行うことで、前記第1の識別対象車両のグローバル特徴情報を含む第2の特徴データを取得するように構成される第2の処理ユニットと、
前記第1の特徴データと前記第2の特徴データに対して融合処理を行うことで、前記第1の識別対象車両の第3の特徴データを取得するように構成され、前記第3の特徴データは前記第1の識別対象車両の識別結果を取得するために使用される融合処理ユニットと、を備える、
車両識別装置。
【請求項23】
電子デバイスであって、
プロセッサとメモリとを備え、
前記メモリは、コンピュータプログラムコードを記憶するように構成され、
前記コンピュータプログラムコードは、コンピュータ命令を含み、
前記電子デバイスは、前記プロセッサが前記コンピュータ命令を実行する場合、請求項1~21のいずれか一項に記載の方法を実行する、
電子デバイス。
【請求項24】
コンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ読み取り可能な記憶媒体にはコンピュータプログラムが記憶されており、
前記コンピュータプログラムはプログラム命令を含み、
前記プログラム命令がプロセッサによって実行される場合、前記プロセッサに請求項1~21のいずれか一項に記載の方法を実行させる、
コンピュータ読み取り可能な記憶媒体。

【発明の詳細な説明】
【技術分野】
【0001】
(関連出願への相互参照)
本発明は、出願番号が202010947349.1であり、出願日が2020年9月10日である中国特許出願に基づいて提案され、当該中国特許出願に基づく優先権を主張し、当該中国特許の全ての内容がここで参照によって本発明に組み込まれる。
【0002】
本発明は、コンピュータビジョン技術の分野に関し、特に車両識別方法及び装置、電子デバイス及び記憶媒体に関する。
【背景技術】
【0003】
現代社会における車両の数が益々多くなるにつれて、様々な交通問題が次々と続いている。関連技術において、車両識別方法は、2つの画像から車両の特徴をそれぞれ抽出して、2つの車両特徴データを取得し、2つの車両特徴データを比較して、2つの画像における車両が同じ車であるか否かを確定する。しかし、このように抽出された車両特徴データに含まれる情報の精度は高くない。
【発明の概要】
【課題を解決するための手段】
【0004】
本発明は、車両識別方法及び装置、電子デバイス及び記憶媒体を提供する。
【0005】
第1の態様は、車両識別方法であって、
第1の識別対象車両を含む処理対象画像を取得することと、
前記処理対象画像に対して第1の特徴抽出処理を行うことで、前記第1の識別対象車両のローカル特徴情報を含む第1の特徴データを取得することと、
前記処理対象画像に対して第2の特徴抽出処理を行うことで、前記第1の識別対象車両のグローバル特徴情報を含む第2の特徴データを取得することと、
前記第1の特徴データ及び前記第2の特徴データに対して融合処理を行うことで、前記第1の識別対象車両の第3の特徴データを取得することであって、前記第3の特徴データは、前記第1の識別対象車両の識別結果を取得するために使用されることと、を含む前記車両識別方法を提供する。
【0006】
第2の態様は、車両識別装置であって、
第1の識別対象車両を含む処理対象画像を取得するように構成される取得ユニットと、
前記処理対象画像に対して第1の特徴抽出処理を行うことで、前記第1の識別対象車両のローカル特徴情報を含む第1の特徴データを取得するように構成される第1の処理ユニットと、
前記処理対象画像に対して第2の特徴抽出処理を行うことで、前記第1の識別対象車両のグローバル特徴情報を含む第2の特徴データを取得するように構成される第2の処理ユニットと、
前記第1の特徴データ及び前記第2の特徴データに対して融合処理を行うことで、前記第1の識別対象車両の第3の特徴データを取得するように構成され、前記第3の特徴データは前記第1の識別対象車両の識別結果を取得するために使用される融合処理ユニットと、を備える前記車両識別装置を提供する。
【0007】
第3の態様は、電子デバイスであって、プロセッサとメモリとを備え、前記メモリは、コンピュータプログラムコードを記憶するように構成され、前記コンピュータプログラムコードは、コンピュータ命令を含み、前記電子デバイスは、前記プロセッサが前記コンピュータ命令を実行する場合、上記第1の態様及びそのいずれか1つの可能な実施形態の方法を実行する前記電子デバイスを提供する。
【0008】
第4の態様は、電子デバイスであって、プロセッサ、送信装置、入力装置、出力装置及びメモリを備え、前記メモリは、コンピュータプログラムコードを記憶するように構成され、前記コンピュータプログラムコードは、コンピュータ命令を含み、前記電子デバイスは、前記プロセッサが前記コンピュータ命令を実行する場合、上記第1の態様及びそのいずれか1つの可能な実施形態の方法を実行する前記電子デバイスを提供する。
【0009】
第5の態様は、コンピュータ読み取り可能な記憶媒体であって、前記コンピュータ読み取り可能な記憶媒体にはコンピュータプログラムが記憶されており、前記コンピュータプログラムはプログラム命令を含み、前記プログラム命令がプロセッサによって実行される場合、前記プロセッサに上記の第1態様及びそのいずれか1つの可能な実施形態の方法を実行させる前記コンピュータ読み取り可能な記憶媒体を提供する。
【0010】
第6態様は、コンピュータプログラム製品であって、コンピュータプログラム又は命令を含み、前記コンピュータプログラム又は命令がコンピュータで実行される場合、前記コンピュータに上記第1の態様及びそのいずれか1つの可能な実施形態の方法を実行させる。
【発明の効果】
【0011】
本発明の実施例は、取得された、第1の識別対象車両を含む処理対象画像に対して、第1の識別対象車両のローカル特徴情報の第1の特徴データ、及び第1の識別対象車両のグローバル特徴情報の第二特徴データを抽出し、第1の特徴データと第2の特徴データを融合することにより、第1の識別対象車両の詳細特徴情報を豊かにすることができ、さらにこの豊かな詳細特徴情報に基づいて第1の識別対象車両の識別結果を確定し、識別結果の精度を向上させることができる。
【0012】
以上の一般的な説明及び以下の詳細な説明が例示的及び解釈的なものだけであり、本発明を制限するものではないことを理解すべきである。
【図面の簡単な説明】
【0013】
本発明の実施例又は背景技術における技術的解決策をより明確に説明するために、以下に本発明の実施例又は背景技術で使用される必要がある図面を説明する。
【0014】
ここでの添付図面は、本明細書に組み込まれて本明細書の一部を構成し、これらの図面は、本発明に合致する実施例を示しており、明細書と共に本発明の技術的解決策を解釈するために使用される。
図1】本発明の実施例による車両識別方法のフローチャートである。
図2】本発明の実施例によるキーポイントの概略図である。
図3】本発明の実施例によるローカル画素点領域の概略図である。
図4】本発明の実施例による車両識別ネットワークの構造概略図である。
図5】本発明の実施例による特徴抽出モジュールの構造概略図である。
図6】本発明の実施例によるキーポイント及びローカル画素点領域生成モジュールの構造概略図である。
図7】本発明の実施例によるジョイントトレーニングモジュールの構造概略図である。
図8】本発明の実施例による第1の俳優-評論家の構造概略図である。
図9】本発明の実施例による第1のスコアリングサブモジュールの構造概略図である。
図10】本発明の実施例による第2の俳優-評論家モジュールの構造概略図である。
図11】本発明の実施例による第2のスコアリングサブモジュールの構造概略図である。
図12】本発明の実施例による車両識別装置の構造概略図である。
図13】本発明の実施例による車両識別装置のハードウェア構造概略図である。
【発明を実施するための形態】
【0015】
当業者が本発明の解決策をより良く理解するために、以下に本発明の実施例の図面を組み合わせながら、本発明の実施例における技術的解決策を明確且つ完全に説明し、明らかに、説明した実施例は、本発明の実施例の一部だけであり、全ての実施例ではない。本発明の実施例に基づき、当業者が創造的な労働をせずに得る全ての他の実施例は、本発明の保護範囲に属する。
【0016】
本発明の明細書と特許請求の範囲及び上記図面における用語「第1」、「第2」などは、異なるオブジェクトを区別するために使用されるものであり、特定の順序を説明するためのものではない。また、用語「含む」と「有する」及びそれらのいかなる変形は、非排他的な包含をカバーすることを意図する。例えば、一連のステップ又はユニットを含むプロセス、方法、システム、製品又はデバイスは、示されたステップ又はユニットに限定されず、選択可能に、示されていないステップ又はユニットをさらに含み、又は、選択可能に、これらのプロセス、方法、製品又はデバイスに固有の他のステップ又はユニットをさらに含む。
【0017】
本明細書に言及される「実施例」は、実施例と組み合わせて説明される特定の特徴、構造又は特性が本発明の少なくとも1つの実施例に含まれてもよいことを意味する。本明細書の様々な箇所に当該フレーズが現れることは、必ずしも同じ実施例ではなく、他の実施例と相互に排他的に独立した実施例又は代替実施例ではないことを意味する。当業者は、本明細書で説明される実施例が他の実施例と組合わせられてもよいことを明示的及び暗黙的に理解できる。
【0018】
仕事、生活又は社会環境の安全性を高めるため、各地域の場所内にいずれも監視デバイスが取り付けられている。人々の生活レベルの向上に伴い、道路上の車両が益々多くなり、交通事故も益々多くなり、どのように監視デバイスで収集されたビデオストリームによって車両(以下はターゲット車両と呼ばれる)のトレースを効果的に確定することは、非常に重要な意味がある。例えば、ひき逃げ車両を追跡する場合、車両識別方法を使用して、異なるカメラによって収集された画像を処理することにより、ひき逃げ車両のトレースを確定することができる。
【0019】
関連技術において、車両識別方法は、画像における確認対象車両の全体的な外観特徴情報を抽出することにより、確認対象車両の特徴を取得し、確認対象車両の車両特徴をターゲット車両の全体的な外観特徴情報を含むターゲット車両特徴と比較して、ターゲット車両と確認対象車両との間の類似度を取得し、全体的な外観特徴が車種、色を含む。類似度が類似度閾値を超える場合、確認対象車両とターゲット車両が同一の車両であることを確定する。
【0020】
全体的な外観特徴情報だけで2台の車両が同一の車両であるか否かを判断することは大きな誤差をもたらし、現在の車両識別方法によって画像から抽出された車両特徴は全体的な外観特徴情報のみを含むため、現在の車両識別方法の識別精度は低い。これに基づき、本発明の実施例は、車両特徴に含まれる情報を豊かにすることができる車両識別方法を提供する。以下、本発明の実施例における図面と組み合わせて本発明の実施例を説明する。
【0021】
本発明の実施例の実行主体は、車両識別装置である。選択可能な車両識別装置は、携帯電話、サーバ、コンピュータ、タブレットコンピュータ、ウェアラブルデバイスのいずれか1つであってもよい。図1を参照して、図1は本発明の実施例による車両識別方法のフローチャートである。
【0022】
ステップ101において、第1の識別対象車両を含む処理対象画像を取得する。
【0023】
本発明の実施例では、処理対象画像には、第1の識別対象車両が含まれる。処理対象画像を取得するための実現方式の一つでは、車両識別装置は、ユーザが入力部品によって入力した処理対象画像を受信する。上記入力部品は、キーボード、マウス、タッチスクリーン、タッチパッド及びオーディオ入力デバイスなどを含む。
【0024】
処理対象画像を取得するための別の実現方式では、車両識別装置は、データ端末から送信された処理対象画像を受信する。上記データ端末は、携帯電話、コンピュータ、タブレット、サーバのいずれか1つであってもよい。
【0025】
処理対象画像を取得するためのさらなる別の実現方式では、車両識別装置は、監視カメラから送信された処理対象画像を受信する。例えば、当該監視カメラは、道路(高速道路、快速道路、都市道路を含む)に配置されている。
【0026】
ステップ102において、上記処理対象画像に対して第1の特徴抽出処理を行い、上記第1の識別対象車両のローカル特徴情報を含む第1の特徴データを取得する。
【0027】
本発明の実施例では、ローカル特徴情報は、車両の詳細特徴情報、例えば、車両ライトの特徴情報、車両ロゴの特徴情報、車両窓の特徴情報などを含む。
【0028】
車両識別装置は、処理対象画像に対して第1の特徴抽出処理を行うことにより、処理対象画像から第1の識別対象車両のローカル特徴情報を抽出し、第1の特徴データを取得することができる。
【0029】
1つの可能な実施形態では、第1の特徴抽出処理は、第1の畳み込みニューラルネットワークによって実現されてもよい。注釈情報が付された画像をトレーニングデータとして畳み込みニューラルネットワークをトレーニングすることにより、トレーニングによって得られた第1の畳み込みニューラルネットワークは、処理対象画像に対する第1の特徴抽出処理を完了することができる。トレーニングデータの注釈情報は、画像における車両の詳細特徴情報(例えば、車両ライトのタイプ、車両ロゴのカテゴリ、車両窓のカテゴリなど)であってもよい。トレーニングデータを使用して畳み込みニューラルネットワークをトレーニングする過程において、畳み込みニューラルネットワークは、トレーニングデータから車両の詳細特徴情報を含む特徴データを抽出し、抽出された特徴データに基づいて車両の詳細情報をトレーニング結果として取得する。トレーニングデータのラベルを使用してトレーニング結果を監視することにより、畳み込みニューラルネットワークのトレーニングを完了し、第1の畳み込みニューラルネットワークを取得することができる。このようにして、車両識別装置は、第1の畳み込みニューラルネットワークを使用して処理対象画像を処理し、第1の識別対象車両の詳細特徴情報を取得及び抽出し、第1の特徴データを取得することができる。
【0030】
別の可能な実施形態では、車両識別装置は、第1の畳み込みカーネルを使用して処理対象画像に対して畳み込み処理を行い、処理対象画像における車両の詳細特徴情報を含むセマンティック情報を抽出し、第1の特徴データを取得する。
【0031】
ステップ103において、上記処理対象画像に対して第2の特徴抽出処理を行い、上記第1の識別対象車両のグローバル特徴情報を含む第2の特徴データを取得する。
【0032】
本発明の実施例では、車両のグローバル特徴情報は、車両の全体的な外観特徴情報を含む。車両識別装置は、処理対象画像に対して第2の特徴抽出処理を行うことにより、処理対象画像から第1の識別対象車両のグローバル特徴情報を抽出し、第2の特徴データを取得することができる。
【0033】
1つの可能な実施形態では、第2の特徴抽出処理は、第2の畳み込みニューラルネットワークによって実現されてもよい。注釈情報が付された画像をトレーニングデータとして畳み込みニューラルネットワークをトレーニングすることにより、トレーニングによって得られた第2の畳み込みニューラルネットワークは、処理対象画像に対する第2の特徴抽出処理を完了することができる。トレーニングデータの注釈情報は、画像における車両の全体的な外観特徴情報(車種、車体の色など)であってもよい。トレーニングデータを使用して畳み込みニューラルネットワークをトレーニングする過程において、畳み込みニューラルネットワークは、トレーニングデータから車両の全体的な外観特徴情報を含む特徴データを抽出し、抽出された特徴データに基づいて車両の全体的な外観特徴情報をトレーニング結果として取得する。トレーニングデータのラベルを使用してトレーニング結果を監視することにより、畳み込みニューラルネットワークのトレーニングを完了し、第2の畳み込みニューラルネットワークを取得することができる。このようにして、車両識別装置は、第2の畳み込みニューラルネットワークを使用して処理対象画像を処理し、第1の識別対象車両の全体的な外観特徴情報を取得及び抽出し、第2の特徴データを取得することができる。
【0034】
別の可能な実施形態では、車両識別装置は、第2の畳み込みカーネルを使用し、処理対象画像に対して畳み込み処理を行い、処理対象画像における車両の全体的な外観特徴情報を含むセマンティック情報を抽出し、第2の特徴データを取得する。ここで、第1の畳み込みカーネルのパラメータは、第2の畳み込みカーネルのパラメータと異なる。
【0035】
ステップ104において、上記第1の特徴データ及び上記第2の特徴データに対して融合処理を行い、上記第1の識別対象車両の第3の特徴データを取得する。
【0036】
本発明の実施例では、第3の特徴データは、第1の識別対象車両の識別結果を取得するために使用され、ここで、識別結果には第1の識別対象車両の身元が含まれる。例えば、車両識別装置は、さらに第3の特徴データに基づいて、識別対象車両が車両aであることを確定することができる。また、例えば、車両識別装置は、第3の特徴データを車両特徴データベースにおける特徴データと比較して、車両特徴データベースにおけるターゲット車両特徴データと第3の特徴データとの間の類似度が類似度閾値を超えていることを確定する。さらに、ターゲット車両特徴データに対応する車両が車両bであることに基づき、車両識別装置は、第3の特徴データに対応する車両が車両bであること即ち、第3の特徴データに基づいて確定された第1の識別対象車両の識別結果は車両bであることを確定することができる。
【0037】
車両識別装置は、第1の特徴データ及び第2の特徴データに対して融合処理を行うことにより、第1の識別対象車両のグローバル特徴情報だけでなく、第1の識別対象車両のローカル特徴情報も含む第3の特徴データを取得することができる。第3の特徴データを第1の識別対象車両の特徴データとして使用することにより、第1の識別対象車両の特徴データに含まれる情報を豊かにすることができる。
【0038】
1つの選択可能な実施形態として、上記ローカル特徴情報は、キーポイントの特徴情報を含む。キーポイントの特徴情報は、処理対象画像におけるキーポイントの位置、キーポイントのセマンティック情報を含む。例えば、図2に示すキーポイント6は、左フロントタイヤのキーポイントであり、キーポイント6のセマンティック情報は、左フロントタイヤの情報(例えば、タイヤの仕様、ホイールハブのサイズ、タイヤのブランド)を含む。図2に示すキーポイント23は、後部ナンバープレートのキーポイントであり、キーポイント23のセマンティック情報は、後部ナンバープレートの情報(例えば、ナンバープレート番号)を含む。
【0039】
本発明の実施例では、車両のキーポイントの注釈方式は図2に示すとおりである。図2に示す車種は例に過ぎず、実際の応用において、図2に示すキーポイント注釈方式に従って任意の車種(例えば、ダンプトラック、バス又はトラック)の車両を注釈することができることを理解すべきである。
【0040】
1つの可能な実施形態では、車両識別装置は、処理対象画像に対して第1の特徴抽出処理を行うことにより、第1の識別対象車両のキーポイントの特徴情報を含む第1の特徴データを取得する。図2に示すキーポイントを例として、第1の特徴データは、識別対象車両の左フロントタイヤのキーポイントの特徴情報と、後部ナンバープレートのキーポイントの特徴情報とを含むことができる。
【0041】
1つの実現可能な実施形態として、ローカル特徴情報は、キーポイントの特徴情報だけでなく、ローカル画素点領域の特徴情報も含む。本発明の実施例では、ローカル画素点領域は、第1の識別対象車両によって覆われた画素点領域に属し、ローカル画素点領域の面積は、第1の識別対象車両によって覆われた画素点領域の面積よりも小さい。例えば、図3では、右側ローカル画素点領域301は、第1の識別対象車両300の右側領域を含み、車両ヘッド画素点領域302は、第1の識別対象車両の車両ヘッド領域を含む。
【0042】
ローカル画素点領域の特徴情報は、ローカル画素点領域のセマンティック情報を含む。例えば、ローカル画素点領域がフロント車両ライトによって覆われた画素点領域を含む場合、ローカル画素点領域のセマンティック情報は、フロント車両ライトの型番を含み、ローカル画素点領域が車両窓によって覆われた画素点領域を含む場合、ローカル画素点領域のセマンティック情報は、車両窓のカテゴリ、車両窓を通して観察できる車内の物件を含み、ローカル画素点領域がフロントウインドシールドガラスによって覆われた画素点領域を含む場合、ローカル画素点領域のセマンティック情報は、フロントウインドシールドガラスのカテゴリ、フロントウインドシールドガラスを通して観察できる車内の物件、フロントウインドシールドガラスにおける年次検査マーク、フロントウインドシールドガラスにおける年次検査マークの位置を含む。
【0043】
ローカル特徴情報について、車両識別装置は、ステップ102を実行する過程において以下のステップを実行する。
【0044】
ステップ1では、上記処理対象画像に対して第3の特徴抽出処理を行い、第4の特徴データを取得する。
【0045】
本発明の実施例では、第4の特徴データは、第1の識別対象車両の少なくとも1つのキーポイントの特徴情報を含む。車両識別装置は、処理対象画像に対して第3の特徴抽出処理を行うことにより、処理対象画像から第1の識別対象車両の少なくとも1つのキーポイントの特徴情報を抽出し、第4の特徴データを取得することができる。
【0046】
1つの可能な実施形態では、第3の特徴抽出処理は、第3の畳み込みニューラルネットワークによって実現されてもよい。注釈情報が付された画像をトレーニングデータとして畳み込みニューラルネットワークをトレーニングすることにより、トレーニングによって得られた第3の畳み込みニューラルネットワークは、処理対象画像に対する第3の特徴抽出処理を完了することができる。トレーニングデータの注釈情報は、画像における車両のキーポイントの特徴情報(例えば、キーポイントの位置、キーポイントのセマンティック情報)であってもよい。トレーニングデータを使用して畳み込みニューラルネットワークをトレーニングする過程において、畳み込みニューラルネットワークは、トレーニングデータから車両のキーポイントの特徴情報を含む特徴データを抽出し、抽出された特徴データに基づいてキーポイントの特徴情報をトレーニング結果として取得する。トレーニングデータのラベルを使用してトレーニング結果を監視することにより、畳み込みニューラルネットワークのトレーニングを完了し、第3の畳み込みニューラルネットワークを取得することができる。このようにして、車両識別装置は、第3の畳み込みニューラルネットワークを使用して処理対象画像を処理し、第1の識別対象車両のキーポイントの特徴情報を取得及び抽出し、第4の特徴データを取得することができる。
【0047】
別の可能な実施形態では、車両識別装置は、第3の畳み込みカーネルを使用し、処理対象画像に対して畳み込み処理を行い、処理対象画像の車両の全体的な外観特徴情報を含むセマンティック情報を抽出し、第4の特徴データを取得する。ここで、第3の畳み込みカーネルのパラメータは、第1の畳み込みカーネルのパラメータと異なり、第3の畳み込みカーネルのパラメータは第2の畳み込みカーネルのパラメータとも異なる。
【0048】
ステップ2では、上記処理対象画像に対して第4の特徴抽出処理を行い、第5の特徴データを取得する。
【0049】
本発明の実施例では、第5の特徴データは、第1の識別対象車両の少なくとも1つのローカル画素点領域の特徴情報を含む。
【0050】
1つの可能な実施形態では、第4の特徴抽出処理は、第4の畳み込みニューラルネットワークによって実現されてもよい。注釈情報が付された画像をトレーニングデータとして畳み込みニューラルネットワークをトレーニングすることにより、トレーニングによって得られた第4の畳み込みニューラルネットワークは、処理対象画像に対する第4の特徴抽出処理を完了することができる。トレーニングデータの注釈情報は、画像における車両のローカル画素点領域の特徴情報であってもよい。トレーニングデータを使用して畳み込みニューラルネットワークをトレーニングする過程において、畳み込みニューラルネットワークは、トレーニングデータから車両のローカル画素点領域の特徴情報を含む特徴データを抽出し、抽出された特徴データに基づいてローカル画素点領域の特徴情報をトレーニング結果として取得する。トレーニングデータのラベルを使用してトレーニング結果を監視することにより、畳み込みニューラルネットワークのトレーニングを完了し、第4の畳み込みニューラルネットワークを取得することができる。このようにして、車両識別装置は、第4の畳み込みニューラルネットワークを使用して処理対象画像を処理し、第1の識別対象車両のローカル画素点領域の特徴情報を取得及び抽出し、第5の特徴データを取得することができる。
【0051】
別の可能な実施形態では、車両識別装置は、第4の畳み込みカーネルを使用し、処理対象画像に対して畳み込み処理を行い、処理対象画像の第1の識別対象車両のローカル画素点領域の特徴情報を抽出し、第5の特徴データを取得する。ここで、第4の畳み込みカーネルのパラメータは、第1の畳み込みカーネルのパラメータ、第2の畳み込みカーネルのパラメータ、第3の畳み込みカーネルのパラメータのいずれかと異なる。
【0052】
ステップ3では、上記第4の特徴データ及び上記第5の特徴データに対して融合処理を行い、上記第1の特徴データを取得する。
【0053】
ローカル画素点領域の特徴情報はローカル画素点領域のセマンティック情報を含み、画像における隣接する画素点同士は相関性(ここでの相関性はセマンティック相関性を含む)を有するため、ローカル画素点領域のセマンティック情報とキーポイントの特徴情報を融合させることにより、車両の詳細特徴情報を豊かにすることができる。
【0054】
車両識別装置は、第4の特徴データ及び第5の特徴データに対して融合処理を行うことにより、第1の識別対象車両のキーポイントの特徴情報と第1の識別対象車両のローカル画素点領域の特徴情報を融合させ、第1の識別対象車両の詳細特徴情報を豊かにして、第1の特徴データを取得する。
【0055】
1つの選択可能な実施形態として、車両識別装置は、ステップ1を実行する過程において以下のステップを行う。
【0056】
ステップ4では、上記処理対象画像に対して第5の特徴抽出処理を行い、少なくとも1つの第6の特徴データを取得する。
【0057】
本発明の実施例では、第6の特徴データは、第1の識別対象車両のキーポイントの特徴情報を含み、任意の2つの第6の特徴データに含まれる特徴情報は、異なるキーポイントに属する。例えば、第1の識別対象車両は、左バックミラーのキーポイントと右テールライトのキーポイントを含む。少なくとも1つの第6の特徴データは、特徴データ1及び特徴データ2を含み、特徴データ1は、左バックミラーのキーポイントの特徴情報を含み、特徴データ2は、右テールライトのキーポイントの特徴情報を含む。
【0058】
1つの可能な実施形態では、車両識別装置は、処理対象画像に対して第5の特徴抽出処理を行うことにより、第1の識別対象車両のキーポイントの特徴情報を抽出し、チャネル数が1以上である第1の中間特徴データを取得し、第1の中間特徴データにおける各チャネルのデータにはいずれも第1の識別対象車両のキーポイントの特徴情報が含まれ、任意の2つのチャネルのデータに含まれる情報は、異なるキーポイントに属する。車両識別装置は、第1の中間特徴データにおける1つのチャネルデータを1つの第6の特徴データとして使用することができる。
【0059】
ステップ5では、上記の少なくとも1つの第6の特徴データから含まれる情報量の最も多いk個の特徴データを選択し、k個の第7の特徴データを取得する。
【0060】
異なる第6の特徴データに含まれる情報量は異なるため、後続処理におけるデータ処理量を減らすために、車両識別装置は、少なくとも1つの第6の特徴データから含まれる情報量の最も多いk個の特徴データ(即ち、k個の第7の特徴データ)を後続処理のために選択することができ、kが1以上の整数である。
【0061】
ステップ6では、上記k個の第7の特徴データに基づいて、上記第4の特徴データを取得する。
【0062】
k=1の場合、ステップ5を実行することで1つの第7の特徴データを取得することができ、このとき、車両識別装置は、第7の特徴データを第4の特徴データとして使用することができ、即ち、第4の特徴データには1つのキーポイントの特徴情報が含まれる。
【0063】
kが1よりも大きい場合、ステップ5を実行することで少なくとも2つの第7の特徴データを取得することができ、このとき、車両識別装置は、少なくとも2つの第7の特徴データに対して融合処理を行い、第4の特徴データを取得することができる。
【0064】
例えば、少なくとも2つの第7の特徴データは、第7の特徴データ1、第7の特徴データ2、第7の特徴データ3を含み、第7の特徴データ1は、左フロント車両ライトのキーポイントの特徴情報を含み、第7の特徴データ2は、左リア車両ライトのキーポイントの特徴情報を含み、第7の特徴データ3は、左バックミラーのキーポイントの特徴情報を含む。車両識別装置は、第7の特徴データ1及び第7の特徴データ2に対して融合処理を行うことにより、第4の特徴データを取得することができる。このとき、第4の特徴データは、左フロント車両ライトのキーポイントの特徴情報と、左リア車両ライトのキーポイントの特徴情報とを含む。車両識別装置は、第7の特徴データ1、第7の特徴データ2及び第7の特徴データ3に対して融合処理を行うことにより、第4の特徴データを取得することもできる。このとき、第4の特徴データは、左フロント車両ライトのキーポイントの特徴情報、左リア車両ライトのキーポイントの特徴情報及び左バックミラーのキーポイントの特徴情報を含む。
【0065】
1つの実現可能な実施形態として、車両識別装置は、ステップ4を実行する過程において以下のステップを実行する。
【0066】
ステップ7では、上記処理対象画像に対して第6の特徴抽出処理を行い、少なくとも1つの第1のヒートマップを取得する。
【0067】
本発明の実施例では、第1のヒートマップは、処理対象画像におけるキーポイントの位置情報を含み、任意の2つの第1のヒートマップに含まれる情報は、異なるキーポイントに属する。例えば、第1の識別対象車両のキーポイントは、左バックミラーのキーポイントと右テールライトのキーポイントを含む。少なくとも1つの第1のヒートマップは、第1のヒートマップ1及び第1のヒートマップ2を含み、第1のヒートマップ1は、処理対象画像における左バックミラーのキーポイントの位置情報を含み、第1のヒートマップ2は、処理対象画像における右テールライトのキーポイントの位置情報を含む。
【0068】
2つの画像における同じ位置にある画素点は、同位ポイントと呼ばれる。例えば、第1のヒートマップ1における画素点Aの位置が第1のヒートマップ2における画素点Bの位置と同じである場合、画素点Aは、第1のヒートマップにおける画素点Bと相互に同位ポイントである画素点であり、画素点Bは、処理対象画像における画素点Aと相互に同位ポイントである画素点である。
【0069】
1つの可能な実施形態では、第1のヒートマップのサイズは、処理対象画像のサイズと同じである。第1のヒートマップ内の画素点の画素値は、処理対象画像における当該画素点と相互に同位ポイントである画素点の所在する位置にキーポイントが存在する信頼度を特徴付ける。例えば、第1のヒートマップ1における画素点Aは、処理対象画像における画素点Bと相互に同位ポイントである。第1のヒートマップ1が処理対象画像における左フロント車両ライトのキーポイントの位置情報を含み、画素点Aの画素値が0.7である場合、画素点Bに左フロント車両ライトが存在する信頼度は0.7である。
【0070】
本発明の実施例では、第6の特徴抽出処理は、畳み込み処理であってもよいし、プール化処理であってもよいし、畳み込み処理とプール化処理との組み合わせであってもよく、本発明では限定されない。
【0071】
1つの可能な実施形態では、第6の特徴抽出処理は、第5の畳み込みニューラルネットワークによって実現されてもよい。注釈情報が付された画像をトレーニングデータとして畳み込みニューラルネットワークをトレーニングすることにより、トレーニングによって得られた第5の畳み込みニューラルネットワークは、処理対象画像に対する第6の特徴抽出処理を完了することができる。トレーニングデータの注釈情報は、画像におけるキーポイントの位置であってもよい。トレーニングデータを使用して畳み込みニューラルネットワークをトレーニングする過程において、畳み込みニューラルネットワークは、トレーニングデータからキーポイントの位置情報を含む特徴データを抽出し、抽出された特徴データに基づいて画像におけるキーポイントの位置をトレーニング結果として取得する。トレーニングデータのラベルを使用してトレーニング結果を監視することにより、畳み込みニューラルネットワークのトレーニングを完了し、第5の畳み込みニューラルネットワークを取得することができる。このようにして、車両識別装置は、第5の畳み込みニューラルネットワークを使用して処理対象画像を処理し、第1の識別対象車両のキーポイントの位置情報を取得及び抽出し、第1のヒートマップを取得することができる。
【0072】
ステップ8では、上記処理対象画像に対して第7の特徴抽出処理を行い、上記処理対象画像の第1の特徴画像を取得する。
【0073】
処理対象画像における各画素点は、いずれもセマンティック情報を含み、セマンティック情報内にキーポイントの特徴情報が含まれ、処理対象画像に対して第7の特徴抽出処理を行うことにより、各画素点に含まれるキーポイントの特徴情報を抽出し、第1の特徴画像を取得することができる。
【0074】
第1の特徴画像は画素点のキーポイントの特徴情報だけでなく、画素点同士の相対位置情報も含むことを理解すべきである。第4の特徴データに含まれる情報には画素点同士の相対位置情報が含まれていない。
【0075】
ステップ9では、各上記第1のヒートマップと上記第1の特徴画像との間のドット積をそれぞれ確定し、上記の少なくとも1つの第6の特徴データを取得する。
【0076】
第1のヒートマップに含まれる位置情報が属するキーポイントは、第1のヒートマップのキーポイントと呼ばれ、例えば、第1のヒートマップ1には左フロント車両ライトのキーポイントの位置情報が含まれ、即ち、第1のヒートマップ1に含まれる情報は、左フロント車両ライトのキーポイントに属し、このとき、第1のヒートマップ1のキーポイントは、左フロント車両ライトのキーポイントである。
【0077】
本発明の実施例では、処理対象画像のサイズ、第1のヒートマップのサイズ、及び第1の特徴画像のサイズは、いずれも同じである。例えば、処理対象画像の長さ50、幅30の場合、第1のヒートマップの長さ及び第1の特徴画像の長さの両方はいずれも50であり、第1のヒートマップの幅及び第1の特徴画像の幅の両方はいずれも30である。
【0078】
本発明の実施例では、ドット積は、エレメントワイズ積(element-wise)を指す。第1の特徴画像と第1のヒートマップとの間のドット積を確定することにより、第1の特徴画像から第1のヒートマップのキーポイントの特徴情報を抽出して、第6の特徴データを取得することができる。
【0079】
一部の実施例では、第1の特徴画像と第1のヒートマップとの間のドット積を確定する前に、車両識別装置は、第1の特徴画像における画素値を正規化して、正規化された第1のヒートマップを取得し、例えば、0.6以上の画素値を1に調整し、0.6未満の画素値を0.3に調整することができる。車両識別装置は、正規化された第1のヒートマップと第1の特徴画像との間のドット積を確定することにより、第1のヒートマップのキーポイントの特徴情報を抽出して、第6の特徴データを取得することができる。
【0080】
1つの実施形態として、車両識別装置は、ステップ5を実行する過程において以下のステップを実行する。
【0081】
ステップ10では、上記の少なくとも1つの第6の特徴データにおける特徴データに対してプール化処理をそれぞれ行い、少なくとも1つの第8の特徴データを取得する。
【0082】
車両識別装置は、1つの第6の特徴データに対してプール化処理を行うことにより、第6の特徴データのデータ量を削減し、1つの第8の特徴データを取得することができる。このようにして、後続処理で第8の特徴データを処理することにより、車両識別装置のデータ処理量を減らすことができる。
【0083】
車両識別装置は、少なくとも1つの第6の特徴データにおける特徴データに対してプール化処理をそれぞれ行い、少なくとも1つの第8の特徴データを取得する。例えば、少なくとも1つの第6の特徴データは、第6の特徴データ1、第6の特徴データ2、第6の特徴データ3を含む。車両識別装置は、第6の特徴データ1に対してプール化処理を行うことにより、第8の特徴データ1を取得し、第6の特徴データ2に対してプール化処理を行うことにより、第8の特徴データ2を取得し、このとき、少なくとも1つの第8の特徴データは、第8の特徴データ1と第8の特徴データ2を含む。車両識別装置は、第6の特徴データ1に対してプール化処理を行うことにより第8の特徴データ1を取得し、第6の特徴データ2に対してプール化処理を行うことにより第8の特徴データ2を取得し、第6の特徴データ3に対してプール化処理を行うことにより第8の特徴データ3を取得し、このとき、少なくとも1つの第8の特徴データは、第8の特徴データ1、第8の特徴データ2、第8の特徴データ3を含む。
【0084】
一部の実施例では、ステップ10におけるプール化処理は、グローバル平均プール化処理である。
【0085】
ステップ11、上記の少なくとも1つの第8の特徴データに含まれる情報量に基づいて、少なくとも1つの第1の確率を取得する。
【0086】
本発明の実施例では、第1の確率は、第1の確率に対応する第6の特徴データに含まれる情報量を特徴づけるために使用される。例えば(例1)、少なくとも1つの第8の特徴データは、第8の特徴データ1を含み、少なくとも1つの第1の確率は、第1の確率1を含み、第1の確率1は、第8の特徴データ1に含まれる情報量に基づいて得られるものであり、第8の特徴データ1は、第6の特徴データ1に対してプール化処理を行うことで得られるものである。第1の確率1は、第6の特徴データ1に含まれる情報量を特徴づけるために使用される。
【0087】
一部の実施例では、第1の確率は、第6の特徴データに含まれる情報量と相関性を有している。例えば、第1の確率が第6の特徴データに含まれる情報量と正の相関にある場合、例1では、第1の確率1が大きいほど、第6の特徴データ1に含まれる情報量が多くなることを示し、第1の確率が第6の特徴データに含まれる情報量と負の相関にある場合、例1では、第1の確率1が大きいほど、第6の特徴データ1に含まれる情報量が小さくなることを示す。
【0088】
第8の特徴データは第6の特徴データに基づいて得られるため、第8の特徴データに含まれる情報量は、第6の特徴データに含まれる情報量と正の相関にある。したがって、車両識別装置は、第8の特徴データに含まれる情報量に基づいて、第1の確率を取得することができる。
【0089】
1つの可能な実施形態では、車両識別装置は、第8の特徴データをソフトマックス(softmax)関数に入力して、第1の確率を取得することができる。
【0090】
車両識別装置は、1つの第8の特徴データに含まれる情報量に基づいて、1つの第1の確率を取得することができ、少なくとも1つの第8の特徴データに含まれる情報量に基づいて、少なくとも1つの第1の確率を取得することができる。例えば、少なくとも1つの第8の特徴データは、第8の特徴データ1と第8の特徴データ2を含む。車両識別装置は、第8の特徴データ1に含まれる情報量に基づいて、第1の確率を取得し、このとき、少なくとも1つの第1の確率は第1の確率1を含む。車両識別装置は、第8の特徴データ1に含まれる情報量に基づいて、第1の確率1を取得し、第8の特徴データ2に含まれる情報量に基づいて、第1の確率2を取得し、このとき、少なくとも1つの第1の確率は、第1の確率1と第1の確率2を含む。
【0091】
第1の確率が第6の特徴データに含まれる情報量と正の相関にある場合、車両識別装置は、ステップ12を実行し、第1の確率が第6の特徴データに含まれる情報量と負の相関にある場合、車両識別装置は、ステップ13を実行する。
【0092】
ステップ12では、最大のk個の第1の確率に対応する上記第6の特徴データを、上記のk個の第7の特徴データとして選択する。
【0093】
ステップ13では、最小のk個の第1の確率に対応する上記第6の特徴データを、上記のk個の第7の特徴データとして選択する。
【0094】
1つの選択可能な実施形態として、1つの第7の特徴データは1つのキーポイントの特徴情報を含むため、少なくとも1つのキーポイントのうちのキーポイントの数が1を超える場合、第7の特徴データの数が1を超える。異なる第7の特徴データに含まれる情報量は異なる。第1の識別対象車両のキーポイントの特徴情報の精度を向上させるために、車両識別装置は、第7の特徴データに含まれる情報量に基づいて各第7の特徴データの重みをそれぞれ確定し、第7の特徴データの重みに基づいて少なくとも1つの第7の特徴データを加重融合して、第4の特徴データを取得する。
【0095】
1つの選択可能な実施形態として、車両識別装置は、ステップ2を実行する過程において以下のステップを実行する。
【0096】
ステップ14では、上記処理対象画像に対して第10の特徴抽出処理を行い、少なくとも1つの第9の特徴データを取得する。
【0097】
本発明の実施例では、第9の特徴データは、第1の識別対象車両のキーポイントの特徴情報を含み、任意の2つの第9の特徴データに含まれる特徴情報は、異なるローカル画素点領域に属する。例えば、第1の識別対象車両は、ローカル画素点領域1及びローカル画素点領域2を含み、ローカル画素点領域1は、フロントウインドシールドガラスによって覆われた画素点領域を含み、ローカル画素点領域2は、左側のガラスによって覆われた画素点領域を含む。少なくとも1つの第9の特徴データは、特徴データ1及び特徴データ2を含み、特徴データ1は、ローカル画素点領域1の特徴情報を含み、特徴データ2は、ローカル画素点領域2の特徴情報を含む。
【0098】
1つの可能な実施形態では、車両識別装置は、処理対象画像に対して第10の特徴抽出処理を行うことにより、第1の識別対象車両のキーポイントの特徴情報を抽出し、チャネル数が1以上である第4の中間特徴データを取得し、第4の中間特徴データにおける各チャネルのデータがいずれも第1の識別対象車両のローカル画素点領域の特徴情報を含み、任意の2つのチャネルのデータに含まれる情報は、異なるローカル画素点領域に属する。車両識別装置は、第4の中間特徴データにおける1つのチャネルデータを1つの第9の特徴データとして使用することができる。
【0099】
ステップ15では、上記の少なくとも2つの第9の特徴データから含まれる情報量の最も多いm個の特徴データを選択し、m個の第10の特徴データを取得する。
【0100】
異なる第9の特徴データに含まれる情報量は異なるため、後続処理におけるデータ処理量を減らすために、車両識別装置は、少なくとも1つの第9の特徴データから含まれる情報量の最も多いm個の特徴データ(即ちm個の第10の特徴データ)を後続処理のために選択することができ、mが1以上の整数である。
【0101】
ステップ16では、上記のm個の第10の特徴データに基づいて、上記第5の特徴データを取得する。
【0102】
k=1の場合、ステップ17を実行することで1つの第10の特徴データを取得することができ、このとき、車両識別装置は、第10の特徴データを第5の特徴データとして使用することができ、即ち、第5の特徴データには1つのキーポイントの特徴情報が含まれる。
【0103】
kが1よりも大きい場合、ステップ5を実行することで少なくとも2つの第10の特徴データを取得することができ、このとき、車両識別装置は、少なくとも2つの第10の特徴データに対して融合処理を行い、第5の特徴データを取得することができる。
【0104】
例えば、少なくとも2つの第10の特徴データは、第10の特徴データ1、第10の特徴データ2、第10の特徴データ3を含み、第10の特徴データ1は、車両ヘッドによって覆われた画素点領域の特徴情報を含み、第10の特徴データ2は、右フロントウインドシールドガラスによって覆われた画素点領域の特徴情報を含み、第10の特徴データ3は、左タイヤによって覆われた画素点領域の特徴情報を含む。車両識別装置は、第10の特徴データ1及び第10の特徴データ2に対して融合処理を行うことにより、第5の特徴データを取得することができる。このとき、第5の特徴データには、車両ヘッドによって覆われた画素点領域の特徴情報と、右フロントウインドシールドガラスによって覆われた画素点領域の特徴情報が含まれている。車両識別装置は、第10の特徴データ1、第10の特徴データ2及び第10の特徴データ3に対して融合処理を行うことにより、第5の特徴データを取得することもできる。このとき、第5の特徴データは、車両ヘッドによって覆われた画素点領域の特徴情報、右フロントウインドシールドガラスによって覆われた画素点領域の特徴情報及び左タイヤによって覆われた画素点領域の特徴情報を含む。
【0105】
1つの実施形態として、車両識別装置は、ステップ14を実行する過程において以下のステップを実行する。
【0106】
ステップ17、上記処理対象画像に対して第11の特徴抽出処理を行い、少なくとも1つの第2のヒートマップを取得する。
【0107】
本発明の実施例では、第2のヒートマップは、処理対象画像におけるキーポイントの位置情報を含み、任意の2つの第2のヒートマップに含まれる情報は、異なるローカル画素点領域に属する。例えば、第1の識別対象車両のローカル画素点領域はフロントウインドシールドガラス領域と車両ヘッド領域を含む。少なくとも1つの第2のヒートマップは、第2のヒートマップ1及び第2のヒートマップ2を含み、第2のヒートマップ1は、処理対象画像におけるフロントウインドシールドガラス領域の位置情報を含み、第2のヒートマップ2は、処理対象画像におけるローカル画素点領域の位置情報を含む。
【0108】
2つの画像における同じ位置にある画素点は、同位ポイントと呼ばれる。例えば、第2のヒートマップ1における画素点Aの位置が第2のヒートマップ2における画素点Bの位置と同じである場合、画素点Aは、第2のヒートマップにおける画素点Bと相互に同位ポイントである画素点であり、画素点Bは、処理対象画像における画素点Aと相互に同位ポイントである画素点である。
【0109】
1つの可能な実施形態では、第2のヒートマップのサイズは、処理対象画像のサイズと同じである。第2のヒートマップにおける画素点の画素値は、処理対象画像における当該画素点と相互に同位ポイントである画素点の所在する位置がローカル画素点領域に属する信頼度を特徴付ける。例えば、第2のヒートマップ1における画素点Aは、処理対象画像における画素点Bと相互に同位ポイントである。第2のヒートマップ1が処理対象画像における車両ヘッド領域の位置情報を含み、画素点Aの画素値が0.7である場合、画素点Bが車両ヘッド領域に属する信頼度は0.7である。
【0110】
本発明の実施例では、第11の特徴抽出処理は、畳み込み処理であってもよいし、プール化処理であってもよいし、畳み込み処理とプール化処理との組み合わせであってもよく、本発明では限定されない。
【0111】
1つの可能な実施形態では、第11の特徴抽出処理は、第6の畳み込みニューラルネットワークによって実現されてもよい。注釈情報が付された画像をトレーニングデータとして畳み込みニューラルネットワークをトレーニングすることにより、トレーニングによって得られた第6の畳み込みニューラルネットワークは、処理対象画像に対する第11の特徴抽出処理を完了することができる。トレーニングデータの注釈情報は、画像におけるローカル画素点領域の位置であってもよい。トレーニングデータを使用して畳み込みニューラルネットワークをトレーニングする過程において、畳み込みニューラルネットワークは、トレーニングデータからローカル画素点領域の位置情報を含む特徴データを抽出し、抽出された特徴データに基づいて画像におけるローカル画素点領域の位置をトレーニング結果として取得する。トレーニングデータのラベルを使用してトレーニング結果を監視することにより、畳み込みニューラルネットワークのトレーニングを完了し、第6の畳み込みニューラルネットワークを取得することができる。このようにして、車両識別装置は、第6の畳み込みニューラルネットワークを使用して処理対象画像を処理し、第1の識別対象車両のキーポイントの位置情報を抽出し、第2のヒートマップを取得することができる。
【0112】
ステップ18では、上記処理対象画像に対して第12の特徴抽出処理を行い、上記処理対象画像の第2の特徴画像を取得する。
【0113】
処理対象画像における各画素点は、いずれもセマンティック情報を含み、処理対象画像に対して第7の特徴抽出処理を行うことにより、各画素点のセマンティック情報を抽出し、第2の特徴画像を取得することができる。
【0114】
第2の特徴画像は画素点のセマンティック情報だけでなく、画素点同士の相対位置情報も含むことを理解すべきである。第5の特徴データに含まれる情報には画素点同士の相対位置情報が含まれていない。
【0115】
一部の実施例では、第1の特徴画像は第2の特徴画像と同じであってもよく、このとき、第1の特徴画像及び第2の特徴画像の両方は、いずれも処理対象画像における各画素点のセマンティック情報を含む。
【0116】
ステップ19では、各上記第2のヒートマップと上記第2の特徴画像との間のドット積をそれぞれ確定し、上記の少なくとも1つの第9の特徴データを取得する。
【0117】
第2のヒートマップに含まれる位置情報が属するローカル画素点領域は、第2のヒートマップのローカル画素点領域と呼ばれ、例えば、第2のヒートマップ1にはフロントウインドシールドガラス領域の位置情報が含まれ、即ち第2のヒートマップ1に含まれる情報は、フロントウインドシールドガラス領域に属し、このとき、第2のヒートマップ1のローカル画素点領域はフロントウインドシールドガラス領域である。
【0118】
本発明の実施例では、処理対象画像のサイズ、第2のヒートマップのサイズ、及び第2の特徴画像のサイズは、いずれも同じである。例えば、処理対象画像の長さ50、幅30の場合、第2のヒートマップの長さ及び第2の特徴画像の長さの両方はいずれも50であり、第2のヒートマップの幅及び第2の特徴画像の幅の両方はいずれも30である。
【0119】
第2の特徴画像と第2のヒートマップとの間のドット積を確定することにより、第2の特徴画像から第2のヒートマップのローカル画素点領域の特徴情報を抽出して、第9の特徴データを取得することができる。
【0120】
一部の実施例では、第2の特徴画像と第2のヒートマップとの間のドット積を確定する前に、車両識別装置は、第2の特徴画像における画素値を正規化して、正規化された第2のヒートマップを取得し、例えば、0.7を超える画素値を1に調整し、0.7以下の画素値を0に調整することができる。車両識別装置は、正規化された第2のヒートマップと第2の特徴画像との間のドット積を確定することにより、第2のヒートマップのキーポイントの特徴情報を抽出して、第9の特徴データを取得することができる。
【0121】
1つの選択可能な実施形態として、車両識別装置は、ステップ15を実行する過程において以下のステップを実行する。
【0122】
ステップ20では、上記第9の特徴データにおける特徴データに対してプール化処理をそれぞれ行い、少なくとも1つの第11の特徴データを取得する。
【0123】
車両識別装置は、1つの第9の特徴データに対してプール化処理を行うことにより、第9の特徴データのデータ量を削減し、1つの第11の特徴データを取得することができる。このようにして、後続処理で第11の特徴データを処理することにより、車両識別装置のデータ処理量を減らすことができる。
【0124】
車両識別装置は、少なくとも1つの第9の特徴データにおける特徴データに対してプール化処理をそれぞれ行い、少なくとも1つの第11の特徴データを取得する。例えば、少なくとも1つの第9の特徴データは、第9の特徴データ1、第9の特徴データ2、第9の特徴データ3を含む。車両識別装置は、第9の特徴データ1に対してプール化処理を行うことにより第11の特徴データ1を取得し、第9の特徴データ2に対してプール化処理を行うことにより第11の特徴データ2を取得し、このとき、少なくとも1つの第11の特徴データは、第11の特徴データ1と第11の特徴データ2を含む。車両識別装置は、第9の特徴データ1に対してプール化処理を行うことにより第11の特徴データ1を取得し、第9の特徴データ2に対してプール化処理を行うことにより第11の特徴データ2を取得し、第9の特徴データ3に対してプール化処理を行うことにより第11の特徴データ3を取得し、このとき、少なくとも1つの第11の特徴データは、第11の特徴データ1、第11の特徴データ2、第11の特徴データ3を含む。
【0125】
ステップ20におけるプール化処理は、グローバル平均プール化処理である。
【0126】
ステップ21では、上記の少なくとも1つの第11の特徴データに含まれる情報量に基づいて、少なくとも1つの第2の確率を取得する。
【0127】
本発明の実施例では、第2の確率は、第2の確率に対応する第9の特徴データに含まれる情報量を特徴づけるために使用される。例えば(例2)、少なくとも1つの第11の特徴データは、第11の特徴データ1を含み、少なくとも1つの第2の確率は、第2の確率1を含み、第2の確率1は、第11の特徴データ1に含まれる情報量に基づいて得られるものであり、第11の特徴データ1は、第9の特徴データ1に対してプール化処理を行うことで得られるものである。即ち、第2の確率1は、第9の特徴データ1に含まれる情報量を特徴づけるために使用される。
【0128】
第2の確率は、第9の特徴データに含まれる情報量と相関性を有している。例えば、第2の確率が第9の特徴データに含まれる情報量と正の相関にある場合、例2では、第2の確率1が大きいほど、第9の特徴データ1に含まれる情報量が多くなることを示し、第2の確率が第9の特徴データに含まれる情報量と負の相関にある場合、例2では、第2の確率1が大きいほど、第9の特徴データ1に含まれる情報量が小さくなることを示す。
【0129】
第11の特徴データが第9の特徴データに基づいて得られるため、第11の特徴データに含まれる情報量は、第9の特徴データに含まれる情報量と正の相関にある。したがって、車両識別装置は、第11の特徴データに含まれる情報量に基づいて、第2の確率を取得することができる。
【0130】
1つの可能な実施形態では、車両識別装置は、第11の特徴データをソフトマックス(softmax)関数に入力して、第2の確率を取得することができる。
【0131】
車両識別装置は、1つの第11の特徴データに含まれる情報量に基づいて、1つの第2の確率を取得することができ、少なくとも1つの第11の特徴データに含まれる情報量に基づいて、少なくとも1つの第2の確率を取得することができる。例えば、少なくとも1つの第11の特徴データは、第11の特徴データ1と第11の特徴データ2を含む。車両識別装置は、第11の特徴データ1に含まれる情報量に基づいて第2の確率を取得し、このとき、少なくとも1つの第2の確率には第2の確率1が含まれる。車両識別装置は、第11の特徴データ1に含まれる情報量に基づいて第2の確率1を取得し、第11の特徴データ2に含まれる情報量に基づいて第2の確率2を取得し、このとき、少なくとも1つの第2の確率には第2の確率1と第2の確率2が含まれる。
【0132】
第2の確率が第9の特徴データに含まれる情報量と正の相関にある場合、車両識別装置は、ステップ22を実行し、第2の確率が第9の特徴データに含まれる情報量と負の相関にある場合、車両識別装置は、ステップ23を実行する。
【0133】
ステップ22では、最大のm個の第2の確率に対応する上記第9の特徴データを、上記のm個の第10の特徴データとして選択する。
【0134】
ステップ23では、最小のm個の第2の確率に対応する上記第9の特徴データを、上記のm個の第10の特徴データとして選択する。
【0135】
1つの実施形態として、1つの第10の特徴データに1つのローカル画素点領域の特徴情報が含まれるため、少なくとも1つのローカル画素点領域におけるローカル画素点領域の数が1を超える場合、第10の特徴データの数が1を超える。異なる第10の特徴データに含まれる情報量は異なる。第1の識別対象車両のローカル画素点領域の特徴情報の精度を向上させるために、車両識別装置は、第10の特徴データに含まれる情報量に基づいて各第10の特徴データの重みをそれぞれ確定し、第10の特徴データの重みに基づいて少なくとも1つの第10の特徴データを加重融合して、第5の特徴データを取得することができる。
【0136】
1つの可能な実施形態では、少なくとも1つのローカル画素点領域は第1のローカル画素点領域及び第2のローカル画素点領域を含み、第9の特徴データの数及びmの両方はいずれも1よりも大きい。車両識別装置は、少なくとも2つの第9の特徴データから含まれる情報量の最も多いm個の特徴データを選択し、第1のローカル画素点領域の特徴情報を含む第12の特徴データ及び第2のローカル画素点領域の特徴情報を含む第13の特徴データを取得する。車両識別装置は、ステップ18を実行する過程において、以下のステップを実行する。
【0137】
ステップ24では、上記第12の特徴データに含まれる情報量に基づいて第1の重みを取得し、上記第13の特徴データに含まれる情報量に基づいて第2の重みを取得する。
【0138】
本発明の実施例では、第1の重みは、第12の特徴データに含まれる情報量と正の相関があり、第2の重みは、第13の特徴データに含まれる情報量と正の相関がある。
【0139】
ステップ25では、上記第1の重みと上記第2の重みに基づいて、上記第12の特徴データ及び上記第13の特徴データを加重融合し、上記第5の特徴データを取得する。
【0140】
車両識別装置は、第1の重みと第2の重みに基づいて第9の特徴データ及び第10の特徴データを加重融合し、第1の識別対象車両のローカル画素点領域の特徴情報を含む第4の特徴データを取得することにより、第1の識別対象車両のローカル画素点領域の特徴情報の精度を向上させることができる。
【0141】
1つの可能な実施形態では、車両識別装置は、第1の重みと第2の重みに基づき、第12の特徴データ及び第13の特徴データを加重合計して第5の特徴データを取得する。例えば、第1の重みがω3であり、第2の重みがω4であり、第12の特徴データがn4であり、第13の特徴データがn5であり、第5の特徴データがn6であると仮定すると、ω3、ω4、n4、n5、n6は次の式
を満たし、dが実数である。一部の実施例では、d=0。
【0142】
別の可能な実施形態では、車両識別装置は、第1の重みと第12の特徴データとを乗算して第5の中間特徴データを取得し、第2の重みと第13の特徴データとを乗算して第6の中間特徴データを取得し、第5の中間特徴データと第6の中間特徴データに対して融合処理を行って第5の特徴データを取得する。
【0143】
本発明の実施例は、さらに車両識別ネットワークを提供し、当該車両識別ネットワークは上述に開示された技術的解決策を実現するように構成されてもよい。図4を参照して、図4は、本発明の実施例による車両識別ネットワークの構造概略図である。図4に示すように、車両識別ネットワークは、特徴抽出モジュール401、キーポイント及びローカル画素点領域生成モジュール402及びジョイントトレーニングモジュール403を含む。特徴抽出モジュール401により、処理対象画像400を処理して、処理対象画像の第3の特徴画像404を取得する。キーポイント及びローカル画素点領域生成モジュールにより処理対象画像を処理し、少なくとも1つの第1のヒートマップ及び少なくとも1つの第2のヒートマップ405を取得する。第3の特徴画像、少なくとも1つの第1のヒートマップ及び少なくとも1つの第2のヒートマップをジョイントトレーニングモジュールに入力し、第3の特徴データ406を取得する。
【0144】
具体的には、図5は特徴抽出モジュールの構造概略図である。図5に示すように、特徴抽出モジュールは、順次直列に接続されている3つの畳み込み層を含む。特徴抽出モジュールにおいて、第1の畳み込み層501はResNet50におけるconv2_xであり、第2の畳み込み層502はResNet50におけるconv3_xであり、第3の畳み込み層503はResNet50におけるconv4_xである。処理対象画像500について、これらの3つの畳み込み層によって特徴抽出を行い、第3の特徴画像504を取得する。
【0145】
図6はキーポイント及びローカル画素点領域生成モジュールの構造概略図である。図6に示すように、キーポイント及びローカル画素点領域生成モジュールは、順次直列に接続されている4つの畳み込み層を含む。一部の実施例では、キーポイント及びローカル画素点領域生成モジュールにおいて、第1の畳み込み層601は、ResNet50におけるconv2_xであり、第2の畳み込み層602は、ResNet50におけるconv3_xであり、第3の畳み込み層603は、ResNet50におけるconv4_xであり、第4の畳み込み層604は、ResNet50におけるconv5_xである。処理対象画像600について、これらの4つの畳み込み層によって処理し、少なくとも1つの第1のヒートマップ及び少なくとも1つの第2のヒートマップ605を取得する。
【0146】
図7はジョイントトレーニングモジュールの構図概略図である。図7に示すように、ジョイントトレーニングモジュールの第1の畳み込み層701により第3の特徴第3の特徴画像700を処理して、第1の汎用特徴画像を取得する。第1の次元削減層702によって第1の汎用特徴画像をチャネル次元で次元削減して第1の特徴画像を取得する。第1の俳優-評論家モジュール703により第1の特徴画像及び少なくとも1つの第1のヒートマップ704を処理して、k個の第1の評論家特徴データ705を取得する。第1のプール化層71及び第1の正規化層72によりそれらの順に従って、k個の第1の評論家特徴データをそれぞれ処理して、k個の第7の特徴データ705を取得する。
【0147】
ジョイントトレーニングモジュールの第1の畳み込み層701により第3の特徴画像を処理して、第2の汎用特徴画像を取得する。第2の次元削減層711により第2の汎用特徴画像をチャネル次元で次元削減して第2の特徴画像を取得する。第2の俳優-評論家モジュール712により第2の特徴画像及び少なくとも1つの第2のヒートマップ713を処理して、m個の第2の評論家特徴データを取得する。第2のプール化層73及び第2の正規化層74によりそれらの順に従って、m個の第2の評論家特徴データをそれぞれ処理して、m個の第10の特徴データ714を取得する。
【0148】
ジョイントトレーニングモジュールの第2の畳み込み層721、第3の次元削減層722、第3のプール化層75、第3の正規化層76によりそれらの順に従って、第3の特徴画像を処理して、第2の特徴データ723を取得する。
【0149】
ジョイントトレーニングモジュールでは、第1の畳み込み層701と第2の畳み込み層721の両方は、いずれもResNet50におけるconv5_xである。第1の次元削減層702、第2の次元削減層711、第3の次元削減層722には、いずれも1*1サイズの畳み込みカーネルを含む。
【0150】
図8を参照して、図8は第1の俳優-評論家モジュールの構造概略図である。第1の俳優-評論家モジュールへの入力は、少なくとも1つの第1のヒートマップ801及び第1の特徴画像802である。第1の俳優-評論家モジュールは、各第1のヒートマップと第1の特徴画像との間のドット積をそれぞれ確定し、少なくとも1つの第6の特徴データ803を取得する。第1のスコアリングサブモジュール804により1つの第6の特徴データを処理すると、当該第6の特徴データに対応する第1の確率を取得することができる。少なくとも1つの第6の特徴データから最大のk個の第1の確率805に対応する第6の特徴データを選択してk個の第1の俳優特徴データ806を取得し、又は、少なくとも1つの第6の特徴データから最小のk個の第1の確率に対応する第6の特徴データを選択してk個の第1の俳優特徴データを取得する。k個の第1の俳優特徴データに対して正規化処理をそれぞれ行い、k個の第1の評論家特徴データ807を取得する。
【0151】
図9を参照して、図9は第1のスコアリングサブモジュールの構造概略図である。第1のスコアリングサブモジュールにおいて、第6の特徴データ901が正規化層902、プール化層903、完全接続層904を順次通過することにより、第8の特徴データが取得され、ソフトマックス(softmax)層905により第8の特徴データを処理し、第1の確率906を取得する。
【0152】
図10を参照して、図10は第2の俳優-評論家モジュールの構造概略図である。第2の俳優-評論家モジュールへの入力は、少なくとも1つの第2のヒートマップ及び第3の特徴画像である。第2の俳優-評論家モジュールは、各第2のヒートマップ1001と第3の特徴画像1002との間のドット積をそれぞれ確定し、少なくとも1つの第9の特徴データ1003を取得する。第2のスコアリングサブモジュール1004により1つの第9の特徴データを処理すると、当該第9の特徴データに対応する第2の確率1005を取得することができる。少なくとも1つの第9の特徴データから最大のm個の第2の確率に対応する第9の特徴データを選択してm個の第9の俳優特徴データを取得し、又は、少なくとも1つの第9の特徴データから最小のm個の第2の確率に対応する第9の特徴データを選択してm個の第2の俳優特徴データ1006を取得する。m個の第2の俳優特徴データに対して正規化処理をそれぞれ行い、m個の第1の評論家特徴データ1007を取得する。
【0153】
図11を参照して、図11は第2のスコアリングサブモジュールの構造概略図である。第2のスコアリングサブモジュールにおいて、第9の特徴データ1101が正規化層1102、プール化層1103、完全接続層1104を順次通過することにより、第11の特徴データが取得され、ソフトマックス(softmax)層1105により第8の特徴データを処理し、第2の確率1106を取得する。
【0154】
図4に示す車両識別ネットワークを使用して画像における車両の特徴データを抽出する前に、車両識別ネットワークをトレーニングする必要がある。このため、本発明は、車両識別ネットワークのトレーニング方法をさらに提供する。当該トレーニング方法は以下のステップを含むことができる。
【0155】
ステップ26では、第2の識別対象車両を含むトレーニング画像及びトレーニング対象ネットワークを取得する。
【0156】
本発明の実施例では、トレーニング画像は、第1の識別対象車両を含む。トレーニング画像を取得する実施形態では、車両識別装置は、ユーザが入力部品によって入力したトレーニング画像を受信する。上記入力部品は、キーボード、マウス、タッチスクリーン、タッチパッド及びオーディオ入力デバイスなどを含む。
【0157】
トレーニング画像を取得する別の実施形態では、車両識別装置は、トレーニングデータ端末から送信されたトレーニング画像を受信する。上記トレーニングデータ端末は、携帯電話、コンピュータ、タブレット、サーバのいずれか1つであってもよい。
【0158】
本発明の実施例では、トレーニング対象ネットワークの具体的な構造について図4を参照する。トレーニング対象ネットワークを取得する実施形態では、車両識別装置は、ユーザが入力部品によって入力したトレーニング対象ネットワークを受信する。上記入力部品は、キーボード、マウス、タッチスクリーン、タッチパッド及びオーディオ入力デバイスなどを含む。
【0159】
トレーニング対象ネットワークを取得する別の実施形態では、車両識別装置は、トレーニングデータ端末から送信されたトレーニング対象画像を受信する。上記トレーニングデータ端末は、携帯電話、コンピュータ、タブレット、サーバのいずれか1つであってもよい。
【0160】
ステップ27では、上記トレーニング対象ネットワークを使用して上記トレーニング画像を処理し、上記第2の識別対象車両のグローバル特徴情報を含む第14の特徴データと、上記第2の識別対象車両のキーポイントの特徴情報を含む第15の特徴データとを取得する。
【0161】
本発明の実施例では、第2の識別対象車両のグローバル特徴情報は、第2の識別対象車両の全体的な外観特徴情報を含む。
【0162】
ステップ28では、上記第14の特徴データ及び上記トレーニング画像のラベルに基づいて、第1のグローバルロスを取得する。
【0163】
本発明の実施例では、トレーニング画像のラベルには、第2の識別対象車両のカテゴリ情報が含まれている。例えば、全てのトレーニングデータには合計で車両1と車両2が含まれている。第2の識別対象車両のカテゴリ情報が車両1である場合、第2の識別対象車両が車両1であることを示す。
【0164】
1つの可能な実施形態では、車両識別装置は、第14の特徴データに基づいて第2の識別対象車両のカテゴリ(以下にグローバルカテゴリと呼ばれる)を取得することができ、グローバルカテゴリとラベルに含まれるカテゴリ情報との違いに基づいて第1のグローバルロスを取得することができる。
【0165】
ステップ29では、上記第15の特徴データ及び上記ラベルに基づいて、第1のキーポイントロスを取得する。
【0166】
1つの可能な実施形態では、車両識別装置は、第15の特徴データに基づいて第2の識別対象車両のカテゴリ(以下にキーポイントカテゴリと呼ばれる)を取得することができ、キーポイントカテゴリとラベルに含まれるカテゴリ情報との違いに基づいて第1のキーポイントロスを取得することができる。
【0167】
ステップ30では、上記第1のグローバルロス及び上記第1のキーポイントロスに基づいて、上記トレーニング対象ネットワークの総ロスを取得する。
【0168】
第1のグローバルロスがG1であり、第1のキーポイントロスがp1であり、総ロスがLtであると仮定すると、1つの可能な実施形態では、G1,p1,Ltは式(1)を満たしている。
式(1)
ここで、c1は実数である。c1=0。
【0169】
別の可能な実施形態では、式(2)を満たしている。
式(2)
ここで、α1は実数である。α1=1。
【0170】
別の可能な実施形態では、G1,p1,Ltは式(3)を満たしている。
式(3)
ここで、α1、c1はいずれも実数である。c1=0、α1=1。
【0171】
ステップ31では、上記総ロスに基づいて上記トレーニング対象ネットワークのパラメータを調整し、上記車両識別ネットワークを取得する。
【0172】
車両識別装置は、総ロスが収束閾値を下回るまで、総ロスに基づいてトレーニング対象ネットワークのパラメータを調整して、車両識別ネットワークを取得する。
【0173】
総ロスに第1のグローバルロス及び第1のキーポイントロスが含まれるため、総ロスに基づいてトレーニング対象ネットワークのパラメータを調整して車両識別ネットワークを取得することにより、車両識別ネットワークを使用して処理対象画像を処理し、第1の識別対象車両のグローバル特徴情報とキーポイントの特徴情報を取得することができる。
【0174】
1つの実施形態として、ステップ30を実行する前に、車両識別装置は、さらに以下のステップを実行する。
【0175】
ステップ32では、上記トレーニング対象ネットワークを使用して上記トレーニング画像を処理し、上記第2の識別対象車両のローカル画素点領域の特徴情報を含む第16の特徴データを取得する。
【0176】
ステップ33では、上記第16の特徴データ及び上記ラベルに基づいて、第1のローカル画素点領域ロスを取得する。
【0177】
1つの可能な実施方式では、車両識別装置は、第16の特徴データに基づいて第2の識別対象車両のカテゴリ(以下にローカル画素点領域カテゴリと呼ばれる)を取得することができ、ローカル画素点領域カテゴリとラベルに含まれるカテゴリ情報との違いに基づいて第1のローカル画素点領域ロスを取得することができる。
【0178】
第1のローカル画素点領域ロスが取得された後、車両識別装置は、ステップ30を実行する過程において、以下のステップを実行する。
【0179】
ステップ34では、上記第1のグローバルロス、上記第1のキーポイントロス及び上記第1のローカル画素点領域ロスに基づいて、上記総ロスを取得する。
【0180】
第1のグローバルロスがG1であり、第1のキーポイントロスがp1であり、第1のローカル画素点領域ロスがγ1であり、総ロスがLtであると仮定すると、1つの可能な実施形態では、G1,p11,Ltは式(4)を満たしている。
式(4)
ここで、c2は実数である。c2=0。
【0181】
別の可能な実施形態では、G1,p11,Ltは式(5)を満たしている。
式(5)
ここで、α2は実数である。α2=1。
【0182】
さらなる別の可能な実施形態では、G1,p11,Ltは式(6)を満たしている。
式(6)
ここで、α2,c2はいずれも実数である。c2=0、α2=1。
【0183】
総ロスに第1のグローバルロス、第1のキーポイントロス及び第1のローカル画素点領域ロスが含まれるため、総ロスに基づいてトレーニング対象ネットワークのパラメータを調整し、車両識別ネットワークを取得することにより、車両識別ネットワークを使用して処理対象画像を処理し、第1の識別対象車両のグローバル特徴情報、キーポイントの特徴情報及びローカル画素点領域の特徴情報を取得することができる。
【0184】
1つの選択可能な実施形態として、車両識別装置は、ステップ27を実行する過程において以下のステップを実行する。
【0185】
ステップ35では、上記トレーニング対象ネットワークを使用して上記トレーニング画像を処理し、少なくとも1つの第17の特徴データを取得する。
【0186】
本発明の実施例では、第17の特徴データは、第2の識別対象車両のキーポイントの特徴情報を含み、任意の2つの第17の特徴データに含まれる特徴情報は、異なるキーポイントに属する。
【0187】
ステップ36において、上記の少なくとも1つの第17の特徴データから含まれる情報量の最も多いs個の特徴データを選択し、s個の第18の特徴データを取得し、sが1以上の整数である。
【0188】
ステップ37において、上記s個の第18の特徴データに対して融合処理を行い、上記第15の特徴データを取得する。
【0189】
トレーニング対象ネットワークに対するトレーニング過程において、s個の第18の特徴データに対して融合処理を行い、第15の特徴データを取得することにより、車両識別ネットワークを使用して処理対象画像を処理する過程において、k個の第7の特徴データに基づいて第4の特徴データを取得することができる。
【0190】
1つの実施形態として、s個の第18の特徴データが取得された後、ステップ34を実行する前に、車両識別装置は、さらに以下のステップを実行する。
【0191】
ステップ38において、上記のs個の第18の特徴データに基づいて、上記第2の識別対象車両のs個の第1の識別結果を取得する。
【0192】
本発明の実施例では、第1の識別結果には第2の識別対象車両のカテゴリ情報が含まれている。車両識別装置は、1つの第18の特徴データに基づいて、1つの第1の識別結果を取得することができる。s個の第18の特徴データに基づいて、第2の識別対象車両のs個の第1の識別結果を取得することができる。
【0193】
ステップ39において、上記のs個の第1の識別結果のそれぞれと上記ラベルとの違いに基づいて、キーポイントカテゴリロスを取得する。
【0194】
1つの可能な実施形態では、車両識別装置は、1つの第1の識別結果及びラベルに基づいて1つの第1の識別違いを取得することができ、s個の第1の識別結果及びラベルに基づいてs個の第1の識別違いを取得することができる。車両識別デバイスは、s個の第1の識別違いの和を確定することにより、キーポイントカテゴリロスを取得する。
【0195】
キーポイントカテゴリロスが取得された後、車両識別装置は、ステップ34を実行する過程において、以下のステップを実行する。
【0196】
ステップ40において、上記第1のグローバルロス、上記第1のキーポイントロス、上記第1のローカル画素点領域ロス及び上記キーポイントカテゴリロスに基づいて、上記総ロスを取得する。
【0197】
第1のグローバルロスがG1であり、第1のキーポイントロスがp1であり、第1のローカル画素点領域ロスがγ1であり、キーポイントカテゴリロスがp2であり、総ロスがLtであると仮定すると、1つの可能な実施形態では、G1,p1,p21,Ltは式(7)を満たしている。
式(7)
ここで、c3は実数である。c3=0。
【0198】
別の可能な実施形態では、G1,p1,p21,Ltは式(8)を満たしている。
式(8)
ここで、α3は実数である。α3=1。
【0199】
別の可能な実施形態では、G1,p1,p21,Ltは式(9)を満たしている。
式(9)
ここで、α3、c3は、いずれも実数である。c3=0、α3=1。
【0200】
総ロスにキーポイントカテゴリロスが含まれるため、車両識別ネットワークを使用して処理対象画像を処理する過程において、k個の第7の特徴データに基づいて第4の特徴データを取得することができる。
【0201】
1つの選択可能な実施形態として、車両識別装置は、ステップ36を実行する過程において以下のステップを実行する。
【0202】
ステップ41において、含まれる情報量に基づいて上記の少なくとも1つの第17の特徴データをソートし、第1の順序を取得する。
【0203】
本発明の実施例では、第1の順序は、含まれる情報量の降順であり、又は、第1の順序は、含まれる情報量の昇順である。
【0204】
ステップ42において、上記第1の順序に基づいて上記の少なくとも1つの第17の特徴データから含まれる情報量の最も多いs個の特徴データを選択し、上記s個の第18の特徴データを取得する。
【0205】
第1の順序が含まれる情報量の降順である場合、車両識別装置は、第1の順序にける先頭のs個の特徴データをs個の第18の特徴データとして選択し、第1の順序が含まれる情報量の昇順である場合、車両識別装置は、第1の順序における最後のs個の特徴データをs個の第18の特徴データとして選択する。
【0206】
第1の順序が取得された場合、車両識別装置は、ステップ40を実行する前に以下のステップを実行する。
【0207】
ステップ43において、対応する上記キーポイントカテゴリロスに基づいて上記s個の第1の識別結果をソートし、第2の順序を取得する。
【0208】
本発明の実施例では、第1の順序が含まれる情報量の降順である場合、第2の順序は、キーポイントカテゴリロスの昇順である。即ち、キーポイントカテゴリロスが小さいほど、第2の順序での第1の識別結果の順位が高くなる。
【0209】
第1の順序が含まれる情報量の昇順である場合、第2の順序は、キーポイントカテゴリロスの降順である。即ち、キーポイントカテゴリロスが大きいほど、第2の順序での第1の識別結果の順位が高くなる。
【0210】
ステップ44において、上記第1の順序と上記第2の順序との違いに基づき、キーポイントソートロスを取得する。
【0211】
キーポイントソートロスが取得された後、車両識別装置は、ステップ34を実行する過程において以下のステップを実行する。
【0212】
ステップ45において、上記第1のグローバルロス、上記第1のキーポイントロス、上記第1のローカル画素点領域ロス、上記キーポイントカテゴリロス及び上記キーポイントソートロスに基づいて、上記総ロスを取得する。
【0213】
第1のグローバルロスがG1であり、第1のキーポイントロスがp1であり、第1のローカル画素点領域ロスがγ1であり、キーポイントカテゴリロスがp2であり、キーポイントソートロスがp3であり、総ロスがLtであると仮定すると、1つの可能な実施形態では、G1,p1,p2,p31,Ltが式(10)を満たしている。
式(10)
ここで、c4は実数である。c4=0。
【0214】
別の可能な実現形態では、G1,p1,p2,p31,Ltは式(11)を満たしている。
式(11)
ここで、α4は実数である。α4=1。
【0215】
さらなる別の可能な実施形態では、G1,p1,p2,p31,Ltは式(12)を満たしている。
式(12)
ここで、α4、c4は、いずれも実数である。c4=0、α4=1。
【0216】
トレーニング対象ネットワークに対するトレーニング過程において、総ロスにキーポイントカテゴリロスを加えることにより、s個の第18の特徴データの精度を向上させ、さらに第15の特徴データに含まれる情報の精度を向上させることができる。このようにして、車両識別ネットワークを使用して処理対象画像を処理する過程において、k個の第7の特徴データの精度を向上させ、さらに第4の特徴データに含まれる情報の精度を向上させることができる。
【0217】
1つの選択可能な実施形態として、車両識別装置は、ステップ32を実行する過程において以下のステップを実行する。
【0218】
ステップ46において、上記トレーニング対象ネットワークを使用して上記トレーニング画像を処理し、少なくとも1つの第19の特徴データを取得する。
【0219】
本発明の実施例では、第19の特徴データは、第2の識別対象車両のローカル画素点領域の特徴情報を含み、任意の2つの第19の特徴データに含まれる特徴情報は、異なるローカル画素点領域に属する。
【0220】
ステップ47において、上記の少なくとも1つの第19の特徴データから含まれる情報量の最も多いp個の特徴データを選択し、p個の第20の特徴データを取得し、pが1以上の整数である。
【0221】
ステップ48において、上記のp個の第20の特徴データに対して融合処理を行い、上記第16の特徴データを取得する。
【0222】
トレーニング対象ネットワークに対するトレーニング過程において、p個の第20の特徴データに対して融合処理を行い、第16の特徴データを取得することにより、車両識別ネットワークを使用して処理対象画像を処理する過程において、m個の第10の特徴データに基づいて第5の特徴データを取得することができる。
【0223】
1つの選択可能な実施形態として、p個の第20の特徴データが取得された後、ステップ45を実行する前に、車両識別装置は、さらに以下のステップを実行する。
【0224】
ステップ49において、上記のp個の第20の特徴データに基づいて、上記第2の識別対象車両のp個の第2の識別結果を取得する。
【0225】
本発明の実施例では、第2の識別結果には第2の識別対象車両のカテゴリ情報が含まれている。車両識別装置は、1つの第20の特徴データに基づいて、1つの第2の識別結果を取得することができ、p個の第18の特徴データに基づいて、第2の識別対象車両のp個の第2の識別結果を取得することができる。
【0226】
ステップ50において、上記のp個の第2の識別結果のそれぞれと上記ラベルとの違いに基づいて、ローカル画素点領域カテゴリロスを取得する。
【0227】
1つの可能な実施形態では、車両識別装置は、1つの第2の識別結果及びラベルに基づいて1つの第2の識別違いを取得することができ、p個の第2の識別結果及びラベルに基づいてp個の第2の識別違いを取得することができる。車両識別デバイスは、p個の第2の識別違いの和を確定することにより、ローカル画素点領域カテゴリロスを取得する。
【0228】
ローカル画素点領域カテゴリロスが取得された後、車両識別装置は、ステップ45を実行する過程において以下のステップを実行する。
【0229】
ステップ51において、上記第1のグローバルロス、上記第1のキーポイントロス、上記第1のローカル画素点領域ロス、上記キーポイントカテゴリロス、上記キーポイントソートロス及び上記ローカル画素点領域カテゴリロスに基づいて、上記総ロスを取得する。
【0230】
第1のグローバルロスがG1であり、第1のキーポイントロスがp1であり、第1のローカル画素点領域ロスがγ1であり、キーポイントカテゴリロスがp2であり、キーポイントソートロスがp3であり、ローカル画素点領域カテゴリロスがγ2であり、総ロスがLtであると仮定すると、1つの可能な実施形態では、G1,p1,p2,p312,Ltは式(13)を満たしている。
式(13)
ここで、c5は実数である。c5=0。
【0231】
別の可能な実施形態では、G1,p1,p2,p312,Ltは式(14)を満たしている。
式(14)
ここで、α5は実数である。α5=1。
【0232】
さらなる別の可能な実施形態では、G1,p1,p2,p312,Ltは式(15)を満たしている。
式(15)
ここで、α5、c5は、いずれも実数である。c5=0、α5=1。
【0233】
総ロスにローカル画素点領域カテゴリロスが含まれるため、車両識別ネットワークを使用して処理対象画像を処理する過程において、m個の第10の特徴データに基づいて第5の特徴データを取得することができる。
【0234】
1つの選択可能な実施形態として、車両識別装置は、ステップ47を実行する過程において以下のステップを実行する。
【0235】
ステップ52において、含まれる情報量に基づいて上記の少なくとも1つの第19の特徴データをソートし、第3の順序を取得する。
【0236】
本発明の実施例では、第3の順序は、含まれる情報量の降順であり、又は、第3の順序は、含まれる情報量の昇順である。
【0237】
ステップ53において、上記第3の順序に基づいて上記の少なくとも1つの第19の特徴データから含まれる情報量の最も多いp個の特徴データを選択し、上記p個の第20の特徴データを取得する。
【0238】
第3の順序が含まれる情報量の降順である場合、車両識別装置は、第3の順序における先頭のp個の特徴データをp個の第20の特徴データとして選択し、第3の順序が含まれる情報量の昇順である場合、車両識別装置は、第3の順序における最後のp個の特徴データをp個の第20の特徴データとして選択する。
【0239】
第3の順序が取得された場合、車両識別装置は、ステップ51を実行する前に以下のステップを実行する。
【0240】
ステップ54において、対応する上記ローカル画素点領域カテゴリロスに基づいて上記p個の第2の識別結果をソートし、第4の順序を取得する。
【0241】
本発明の実施例では、第3の順序が含まれる情報量の降順である場合、第4の順序は、ローカル画素点領域カテゴリロスの昇順である。即ち、ローカル画素点領域カテゴリロスが小さいほど、第4の順序での第2の識別結果の順位が高くなる。
【0242】
第3の順序が含まれる情報量の昇順である場合、第4の順序は、ローカル画素点領域カテゴリロスの降順である。即ち、ローカル画素点領域カテゴリロスが大きいほど、第4の順序での第2の識別結果の順位が高くなる。
【0243】
ステップ55において、上記第3の順序と上記第4の順序との違いに基づき、ローカル画素点領域ソートロスを取得する。
【0244】
ローカル画素点領域ソートロスが取得された後、車両識別装置は、ステップ51を実行する過程において以下のステップを実行する。
【0245】
ステップ56において、上記第1のグローバルロス、上記第1のキーポイントロス、上記第1のローカル画素点領域ロス、上記キーポイントカテゴリロス、上記キーポイントソートロス、上記ローカル画素点領域カテゴリロス及び上記ローカル画素点領域ソートロスに基づいて、上記総ロスを取得する。
【0246】
第1のグローバルロスがG1であり、第1のキーポイントロスがp1であり、第1のローカル画素点領域ロスがγ1であり、キーポイントカテゴリロスがp2であり、キーポイントソートロスがp3であり、ローカル画素点領域カテゴリロスがγ2であり、ローカル画素点領域ソートロスがγ3であり、総ロスがLtであると仮定すると、1つの可能な実施形態では、G1,p1,p2,p3123,Ltが式(16)を満たしている。
式(16)
ここで、c6は実数である。c6=0。
【0247】
別の可能な実施形態では、G1,p1,p2,p3123,Ltは式(17)を満たしている。
式(17)
ここで、α6は実数である。α6=1。
【0248】
さらなる別の可能な実施形態では、G1,p1,p2,p3123,Ltは式(18)を満たしている。
式(18)
ここで、α6、c6は、いずれも実数である。c6=0、α6=1。
【0249】
トレーニング対象ネットワークに対するトレーニング過程において、総ロスにローカル画素点領域カテゴリロスを加えることにより、p個の第20の特徴データの精度を向上させ、さらに第16の特徴データに含まれる情報の精度を向上させることができる。このようにして、車両識別ネットワークを使用して処理対象画像を処理する過程において、k個の第7の特徴データの精度を向上させ、さらに第4の特徴データに含まれる情報の精度を向上させることができる。
【0250】
1つの選択可能な実施形態として、第1のグローバルロスはグローバルフォーカスロスを含み、車両識別装置は、ステップ28を実行する過程において以下のステップを実行する。
【0251】
ステップ57において、上記第14の特徴データに基づいて、上記第2の識別対象車両の第3の識別結果を取得する。
【0252】
本発明の実施例では、第3の識別結果には第2の識別対象車両のカテゴリ情報が含まれている。車両識別装置は、第14の特徴データに基づいて、第2の識別対象車両のカテゴリを確定し、さらに第3の識別結果を取得することができる。
【0253】
ステップ58において、上記第3の識別結果及び上記ラベルに基づいて、上記第3の識別結果のフォーカスロスを上記グローバルフォーカスロスとして取得する。
【0254】
第3の識別結果のフォーカスロスがLF1であると仮定すると、LF1は式(19)を満たしている。
式(19)
ここで、Bはトレーニング画像の数であり、βnが正数であり、γが非負数であり、unが第3の識別結果のうち、ラベルのカテゴリに対応する確率である。βn=2,γ=2。
【0255】
例えば、トレーニング画像には画像aが含まれており、トレーニング対象ネットワークを使用して画像aを処理して第3の識別結果1を取得する。画像aのラベルに含まれるカテゴリが車両1である場合(即ち画像aのラベルが車両1である)、第3の識別結果1において、画像aにおける第2の識別対象車両が車両1である確率は0.9であり、画像aにおける第2の識別対象車両が車両2である確率は0.1である。βn=2,γ=2と仮定し、このとき、
【0256】
また、例えば、トレーニング画像には画像aと画像bが含まれており、トレーニング対象ネットワークを使用して画像aを処理して第3の識別結果1を取得し、トレーニング対象ネットワークを使用して画像bを処理して第3の識別結果2を取得する。画像aのラベルに含まれるカテゴリが車両1である(即ち画像aのラベルが車両1である)場合、画像bのラベルに含まれるカテゴリは車両2である(即ち画像aのラベルが車両2である)。第3の識別結果1において、画像aにおける第2の識別対象車両が車両1である確率は0.3であり、画像aの第2の識別対象車両が車両2である確率は0.7である。第3の識別結果2において、画像bにおける第2の識別対象車両が車両1である確率は0.2であり、画像bの第2の識別対象車両が車両2である確率は0.8である。βn=2,γ=2と仮定し、このとき、
【0257】
最大確率が第1の確率閾値と第2の確率閾値との間にある第3の識別結果に対応する画像を第1の容易サンプルと呼び、トレーニング画像のうちの第1の容易サンプル以外の画像を第1の困難サンプルと呼ぶ。例えば、第1の確率閾値が0.4であり、第2の確率閾値0.7であると仮定する。トレーニング過程において、トレーニング対象ネットワークは、画像aを処理することにより、第3の識別結果1を取得する。
【0258】
第3の識別結果1において、画像aにおける第2の識別対象車両が車両1である確率が0.8である場合、画像aにおける第2の識別対象車両が車両2である確率は0.2である。第3の識別結果1の最大確率が0.8であるため、当該最大確率は、第2の確率閾値よりも大きく、画像aは第1の容易サンプルである。
【0259】
第3の識別結果1において、画像aにおける第2の識別対象車両が車両1である確率が0.5である場合、画像aにおける第2の識別対象車両が車両2である確率は0.5である。第3の識別結果1の最大確率が0.5であるため、当該最大確率閾値は、第1の確率閾値よりも大きく、且つ当該最大確率は、第2の閾値未満であり、画像aは、第1の困難サンプルである。
【0260】
トレーニング過程において、第3の識別結果のフォーカスロスを計算してキーポイントフォーカスロスを取得し、さらに総ロスを確定することにより、トレーニング対象ネットワークに対するトレーニング効果を向上させることができる。
【0261】
1つの選択可能な実施形態として、トレーニング画像は、トレーニング画像セットに属し、トレーニング画像セットは、トレーニング画像の第1の正サンプル画像及びトレーニング画像の第1の負サンプル画像をさらに含み、第1のグローバルロスは、グローバルトリプレットロスをさらに含む。車両識別装置は、ステップ28を実行する過程において、以下のステップを実行する。
【0262】
ステップ59において、上記トレーニング対象ネットワークを使用して上記第1の正サンプル画像に対して特徴抽出処理を行い、上記第1の正サンプル画像の特徴データを取得する。
【0263】
本発明の実施例では、第1の正サンプル画像のラベルに含まれるカテゴリ情報は、トレーニング画像のラベルに含まれるカテゴリ情報と同じであり、第1の負サンプル画像のラベルに含まれるカテゴリ情報は、トレーニング画像のラベルに含まれるカテゴリ情報と異なる。
【0264】
第1の正サンプル画像の特徴データは、第1の正サンプル画像のセマンティック情報を含み、当該セマンティック情報は、第1の正サンプル画像における第2の識別対象車両のカテゴリを識別するために使用されてもよい。
【0265】
ステップ60において、上記トレーニング対象ネットワークを使用して上記第1の負サンプル画像に対して特徴抽出処理を行い、上記第1の負サンプル画像の特徴データを取得する。
【0266】
第1の負サンプル画像の特徴データは、第1の正サンプル画像のセマンティック情報を含み、当該セマンティック情報は、第1の負サンプル画像における第2の識別対象車両のカテゴリを識別するために使用されてもよい。
【0267】
ステップ61において、上記第12の特徴データ、上記第1の正サンプル画像の特徴データ及び第1の負サンプル画像の特徴データに基づいて、上記グローバルトリプレットロスを取得する。
【0268】
車両識別装置は、第12の特徴データと第1の正サンプル画像の特徴データとの間の類似度を計算して第1の正類似度を取得し、第12の特徴データと第1の負サンプル画像の特徴データとの間の類似度を計算して第1の負類似度を取得する。
【0269】
第12の特徴データがxaであり、第1の正類似度がs1であり、第1の負類似度がs2であり、グローバルトリプレットロスがLT1であると仮定すると、LT1,s1,s2,xaは式(20)を満たしている。
式(20)
ここで、v1は実数である。v1=1。
【0270】
一部の実施例では、第1の正類似度は、第12の特徴データと第1の正サンプル画像の特徴データとの間の第2のノルムである。第1の負類似度は、第12の特徴データと第1の負サンプル画像の特徴データとの間の第2のノルムである。
一部の実施例では、トレーニング画像セットがトレーニング画像、第1の正サンプル画像及び第1の負サンプル画像以外の画像を含む場合、車両識別装置は、トレーニング画像セットにおけるトレーニング画像以外の画像を正サンプル画像セットと負サンプル画像セットに分けることができる。正サンプル画像セットにおける画像のラベルに含まれるカテゴリ情報は、トレーニング画像のラベルに含まれるカテゴリ情報と同じであり、負サンプル画像セットにおける画像のラベルに含まれるカテゴリ情報は、トレーニング画像におけるラベルに含まれるカテゴリ情報と異なる。
【0271】
車両識別装置は、正サンプル画像セットにおける画像に対して特徴抽出処理を行って正サンプル特徴データセットを取得し、負サンプル画像セットにおける画像に対して特徴抽出処理を行って負サンプル特徴データセットを取得する。車両識別装置は、第12の特徴データと正サンプル特徴データセットにおける特徴データとの間の類似度を計算して第1の正類似度セットを取得し、第12の特徴データと負サンプル特徴データセットにおける特徴データとの間の類似度を計算して第1の負類似度セットを取得する。第1の正類似度セットにおける最小値は、第1のカテゴリ内の最小類似度と呼ばれ、第1の負類似度セットにおける最大値は、第1のカテゴリ外の最大類似度と呼ばれる。
【0272】
第12の特徴データがxaであり、第1のカテゴリ内の最小類似度がmaxd(xa,xp)であり、第1のカテゴリ外の最大類似度がmind(xa,xn)であり、グローバルトリプレットロスがLT1であると仮定すると、LT1,maxd(xa,xp),mind(xa,xn),xaは式(21)を満たしている。
式(21)
ここで、v1は実数である。v1=1。
【0273】
一部の実施例では、第12の特徴データと第1の正サンプル特徴データセットにおける特徴データとの間の類似度は、第12の特徴データと第1の正サンプル特徴データセットにおける特徴データとの間の第2のノルムである。第12の特徴データと第1の負サンプル特徴データセットにおける特徴データとの間の類似度は、第12の特徴データと第1の負サンプル特徴データセットにおける特徴データとの間の第2のノルムである。
【0274】
トレーニング過程において、グローバルトリプレットロスにより、第12の特徴データに基づいたトレーニング対象ネットワークによる第2の識別対象車両の識別結果の精度を向上させ、それによって車両識別ネットワークによる第1の識別対象車両の分類精度を向上させることができる。
【0275】
第1のグローバルロスがグローバルフォーカスロス及びグローバルトリプレットロスを含む場合、第1のグローバルロスは、グローバルフォーカスロスとグローバルトリプルロスとの和であってもよいことを理解すべきである。
【0276】
1つの選択可能な実施形態として、ステップ56を実行する前に、車両識別装置は、さらに以下のステップを実行する。
【0277】
ステップ62において、上記第15の特徴データに基づいて、上記第2の識別対象車両の第4の識別結果を取得する。
【0278】
本発明の実施例では、第4の識別結果には第2の識別対象車両のカテゴリ情報が含まれている。車両識別装置は、第15の特徴データに基づいて、第2の識別対象車両のカテゴリを確定し、さらに第4の識別結果を取得することができる。
【0279】
ステップ63において、上記第4の識別結果及び上記ラベルに基づいて、上記第4の識別結果のフォーカスロスをキーポイントフォーカスロスとして取得する。
【0280】
第4の識別結果のフォーカスロスがLF2であると仮定すると、LF2は式(22)を満たしている。
式(22)
ここで、Bはトレーニング画像の数であり、βnが正数であり、γが非負数であり、umが第4の識別結果のうち、ラベルのカテゴリに対応する確率である。βn=2,γ=2。
【0281】
例えば、トレーニング画像には画像aが含まれており、トレーニング対象ネットワークを使用して画像aを処理して第4の識別結果1を取得する。画像aのラベルに含まれるカテゴリが車両1である(即ち画像aのラベルが車両1である)場合、第4の識別結果1において、画像aにおける第2の識別対象車両が車両1である確率は0.9であり、画像aにおける第2の識別対象車両が車両2である確率は0.1である。βn=2,γ=2と仮定し、このとき、
【0282】
また、例えば、トレーニング画像には画像aと画像bが含まれており、トレーニング対象ネットワークを使用して画像aを処理して第4の識別結果1を取得し、トレーニング対象ネットワークを使用して画像bを処理して第4の識別結果2を取得する。画像aのラベルに含まれるカテゴリが車両1である(即ち画像aのラベルが車両1である)場合、画像bのラベルに含まれるカテゴリは車両2である(即ち画像aのラベルが車両2である)。第4の識別結果1において、画像aにおける第2の識別対象車両が車両1である確率は0.3であり、画像aにおける第2の識別対象車両が車両2である確率は0.7である。第4の識別結果2において、画像bにおける第2の識別対象車両が車両1である確率は0.2であり、画像bにおける第2の識別対象車両が車両2である確率は0.8である。βn=2,γ=2と仮定し、このとき、
【0283】
キーポイントフォーカスロスが取得された後、車両識別装置は、ステップ58を実行する過程において以下のステップを実行する。
【0284】
ステップ64において、上記第1のグローバルロス、上記第1のキーポイントロス、上記第1のローカル画素点領域ロス、上記キーポイントカテゴリロス、上記キーポイントソートロス、上記ローカル画素点領域カテゴリロス、上記キーポイントフォーカスロス及び上記ローカル画素点領域ソートロスに基づいて、上記総ロスを取得する。
【0285】
第1のグローバルロスがG1であり、第1のキーポイントロスがp1であり、第1のローカル画素点領域ロスがγ1であり、キーポイントカテゴリロスがp2であり、キーポイントソートロスがp3であり、ローカル画素点領域カテゴリロスがγ2であり、ローカル画素点領域ソートロスがγ3であり、キーポイントフォーカスロスがp4であり、総ロスがLtであると仮定すると、1つの可能な実施形態では、G1,p1,p2,p3,p4123,Ltが式(23)を満たしている。
式(23)
ここで、c7は実数である。c7=0。
【0286】
別の可能な実施形態では、式(24)を満たしている。
式(24)
ここで、α7は実数である。α7=1。
【0287】
さらなる別の可能な実施形態では、G1,p1,p2,p3,p4123,Ltは式(25)を満たしている。
式(25)
ここで、α7、c7は、いずれも実数である。c7=0、α7=1。
【0288】
最大確率が第3の確率閾値と第4の確率閾値との間にある第4の識別結果に対応する画像を第2の容易サンプルと呼び、トレーニング画像のうちの第2の容易サンプル以外の画像を第2の困難サンプルと呼ぶ。例えば、第3の確率閾値が0.4であり、第4の確率閾値が0.7であると仮定する。トレーニング過程において、トレーニング対象ネットワークは、画像aを処理することにより、第4の識別結果1を取得する。
【0289】
第4の識別結果1において、画像aにおける第2の識別対象車両が車両1である確率が0.8である場合、画像aにおける第2の識別対象車両が車両2である確率は0.2である。第4の識別結果1の最大確率が0.8であるため、当該最大確率は、第4の閾値よりも大きく、画像aは第2の容易サンプルである。
【0290】
第4の識別結果1において、画像aにおける第2の識別対象車両が車両1である確率が0.5である場合、画像aにおける第2の識別対象車両が車両2である確率は0.5である。第4の識別結果1の最大確率が0.5であるため、当該最大確率は、第3の確率閾値よりも大きく、且つ当該最大確率は、第4の確率閾値未満であり、画像aは、第2の困難サンプルである。
【0291】
トレーニング過程において、第4の識別結果のフォーカスロスを計算してローカル画素点領域フォーカスロスを取得し、総ロスにローカル画素点領域ロスを加えることにより、トレーニング対象ネットワークに対するトレーニング効果を向上させることができる。
【0292】
1つの選択可能な実施形態として、ステップ63を実行する前に、車両識別装置は、さらに以下のステップを実行する。
【0293】
ステップ65において、上記第15の特徴データ、上記第1の正サンプル画像の特徴データ及び第1の負サンプル画像の特徴データに基づいて、キーポイントトリプレットロスを取得する。
【0294】
車両識別装置は、第15の特徴データと第1の正サンプル画像の特徴データとの間の類似度を計算して第2の正類似度を取得し、第15の特徴データと第1の負サンプル画像の特徴データとの間の類似度を計算して第2の負類似度を取得する。
【0295】
第15の特徴データがxbであり、第2の正類似度がs3であり、第2の負類似度がs4であり、キーポイントトリプレットロスがLT2であると仮定すると、LT2,s4,s3,xbは式(26)を満たしている。
式(26)
ここで、v2は実数である。v2=1。
【0296】
一部の実施例では、第2の正類似度は、第15の特徴データと第1の正サンプル画像の特徴データとの間の第2のノルムである。第2の負類似度は、第15の特徴データと第1の負サンプル画像の特徴データとの間の第2のノルムである。
【0297】
車両識別装置は、正サンプル画像セットにおける画像に対して特徴抽出処理を行って正サンプル特徴データセットを取得し、負サンプル画像セットにおける画像に対して特徴抽出処理を行って負サンプル特徴データセットを取得する。車両識別装置は、第15の特徴データと正サンプル特徴データセットにおける特徴データとの間の類似度を計算して第2の正類似度セットを取得し、第15の特徴データと負サンプル特徴データセットにおける特徴データとの間の類似度を計算して第2の負類似度セットを取得する。第2の正類似度セットにおける最小値は、第2のカテゴリ内の最小類似度と呼ばれ、第2の負類似度セットにおける最大値は、第2のカテゴリ外の最大類似度と呼ばれる。
【0298】
第15の特徴データがxbであり、第2のカテゴリ内の最小類似度がmaxd(xb,xp)であり、第2のカテゴリ外の最大類似度がmind(xb,xn)であり、キーポイントトリプレットロスがLT2であると仮定すると、LT2,maxd(xb,xp),mind(xb,xn),xbは式(27)を満たしている。
式(27)
ここで、v2は実数である。v2=1。
【0299】
一部の実施例では、第15の特徴データと正サンプル特徴データセットにおける特徴データとの間の類似度は、第15の特徴データと正サンプル特徴データセットにおける特徴データとの間の第2のノルムである。第15の特徴データと負サンプル特徴データセットにおける特徴データとの間の類似度は、第15の特徴データと負サンプル特徴データセットにおける特徴データとの間の第2のノルムである。
【0300】
キーポイントフォーカスロスが取得された後、車両識別装置は、ステップ63を実行する過程において以下のステップを実行する。
【0301】
ステップ66において、上記第1のグローバルロス、上記第1のキーポイントロス、上記第1のローカル画素点領域ロス、上記キーポイントカテゴリロス、上記キーポイントソートロス、上記ローカル画素点領域カテゴリロス、上記キーポイントフォーカスロス、上記キーポイントトリプレットロス及び上記ローカル画素点領域ソートロスに基づいて、上記総ロスを取得する。
【0302】
第1のグローバルロスがG1であり、第1のキーポイントロスがp1であり、第1のローカル画素点領域ロスがγ1であり、キーポイントカテゴリロスがp2であり、キーポイントソートロスがp3であり、ローカル画素点領域カテゴリロスがγ2であり、ローカル画素点領域ソートロスがγ3であり、キーポイントフォーカスロスがp4であり、キーポイントトリプレットロスがp5であり、総ロスがLtであると仮定すると、1つの可能な実施形態では、G1,p1,p2,p3,p4,p5123,Ltは式(28)を満たしている。
式(28)
ここで、c8は実数である。c8=0。
【0303】
別の可能な実施形態では、G1,p1,p2,p3,p4,p5123,Ltは式(29)を満たしている。
式(29)
ここで、α8は実数である。α8=1。
【0304】
さらなる別の可能な実施形態では、G1,p1,p2,p3,p4,p5123,Ltは式(30)を満たしている。
式(30)
ここで、α8、c8はいずれも実数である。c8=0、α8=1。
【0305】
トレーニング過程において、キーポイントトリプレットロスにより、第15の特徴データに基づいたトレーニング対象ネットワークによる第2の識別対象車両の識別結果の精度を向上させ、それによって車両識別ネットワークによる第1の識別対象車両の分類精度を向上させることができる。
【0306】
1つの選択可能な実施形態として、ステップ66を実行する前に、車両識別装置は、さらに以下のステップを実行する。
【0307】
ステップ67において、上記第16の特徴データに基づいて、上記第2の識別対象車両の第5の識別結果を取得する。
【0308】
本発明の実施例では、第5の識別結果には第2の識別対象車両のカテゴリ情報が含まれている。車両識別装置は、第16の特徴データに基づいて、第2の識別対象車両のカテゴリを確定し、さらに第5の識別結果を取得することができる。
【0309】
ステップ68において、上記第5の識別結果及び上記ラベルに基づいて、上記第5の識別結果のフォーカスロスをローカル画素点領域フォーカスロスとして取得する。
【0310】
第5識別結果のフォーカスロスがLF3であると仮定すると、LF3は式(31)を満たしている。
式(31)
ここで、Bはトレーニング画像の数であり、βnが正数であり、γが非負数であり、ukが第5の識別結果のうち、ラベルのカテゴリに対応する確率である。βn=2,γ=2。
【0311】
例えば、トレーニング画像には画像aが含まれており、トレーニング対象ネットワークを使用して画像aを処理して第5の識別結果1を取得する。画像aのラベルに含まれるカテゴリが車両1である(即ち画像aのラベルが車両1である)場合、第5の識別結果1において、画像aにおける第2の識別対象車両が車両1である確率は0.9であり、画像aにおける第2の識別対象車両が車両2である確率は0.1である。βn=2,γ=2と仮定し、このとき、
【0312】
また、例えば、トレーニング画像には画像aと画像bが含まれており、トレーニング対象ネットワークを使用して画像aを処理して第5の識別結果1を取得し、トレーニング対象ネットワークを使用して画像bを処理して第5の識別結果2を取得する。画像aのラベルに含まれるカテゴリが車両1である(即ち画像aのラベルが車両1である)場合、画像bのラベルに含まれるカテゴリは車両2である(即ち画像aのラベルが車両2である)。第5の識別結果1において、画像aにおける第2の識別対象車両が車両1である確率は0.3であり、画像aにおける第2の識別対象車両が車両2である確率は0.7である。第5の識別結果2において、画像bにおける第2の識別対象車両が車両1である確率は0.2であり、画像bにおける第2の識別対象車両が車両2である確率は0.8である。βn=2,γ=2と仮定し、このとき、
【0313】
ローカル画素点領域フォーカスロスが取得された後、車両識別装置は、ステップ66を実行する過程において、以下のステップを実行する。
【0314】
ステップ69において、上記第1のグローバルロス、上記第1のキーポイントロス、上記第1のローカル画素点領域ロス、上記キーポイントカテゴリロス、上記キーポイントソートロス、上記ローカル画素点領域カテゴリロス、上記キーポイントフォーカスロス、上記キーポイントトリプレットロス、上記ローカル画素点領域フォーカスロス及び上記ローカル画素点領域ソートロスに基づいて、上記総ロスを取得する。
【0315】
第1のグローバルロスがG1であり、第1のキーポイントロスがp1であり、第1のローカル画素点領域ロスがγ1であり、キーポイントカテゴリロスがp2であり、キーポイントソートロスがp3であり、ローカル画素点領域カテゴリロスがγ2であり、ローカル画素点領域ソートロスがγ3であり、ローカル画素点領域フォーカスロスがγ4であり、キーポイントフォーカスロスがp4であり、キーポイントトリプレットロスがp5であり、総ロスがLtであると仮定すると、1つの可能な実施形態では、G1,p1,p2,p3,p4,p51234,Ltは式(32)を満たしている。
式(32)。
ここで、c9は実数である。c9=0。
【0316】
別の可能な実施形態では、G1,p1,p2,p3,p4,p51234,Ltは式(33)を満たしている。
式(33)
ここで、α9は実数である。α9=1。
【0317】
さらなる別の可能な実施形態では、G1,p1,p2,p3,p4,p51234,Ltは式(34)を満たしている。
式(34)。
ここで、α9、c9はいずれも実数である。c9=0、α9=1。
【0318】
最大確率が第5の確率閾値と第6の確率閾値との間にある第5の識別結果に対応する画像を第3の容易サンプルと呼び、トレーニング画像のうちの第3の容易サンプル以外の画像を第3の困難サンプルと呼ぶ。例えば、第5の確率閾値が0.4であり、第6の確率閾値が0.7であると仮定する。トレーニング過程において、トレーニング対象ネットワークは、画像aを処理することにより、第5の識別結果1を取得する。
【0319】
第5の識別結果1において、画像aにおける第2の識別対象車両が車両1である確率が0.8である場合、画像aにおける第2の識別対象車両が車両2である確率は0.2である。第5の識別結果1の最大確率が0.8であるため、当該最大確率は、第6の確率閾値よりも大きく、画像aは第3の容易サンプルである。
【0320】
第5の識別結果1において、画像aにおける第2の識別対象車両が車両1である確率が0.5である場合、画像aにおける第2の識別対象車両が車両2である確率は0.5である。第5の識別結果1の最大確率が0.5であるため、当該最大確率閾値は、第5の確率閾値よりも大きく、且つ当該最大確率は、第6の閾値未満であり、画像aは、第3の困難サンプルである。
【0321】
トレーニング過程において、第5の識別結果のフォーカスロスを計算してローカル画素点領域フォーカスロスを取得し、さらに総ロスを確定することにより、第3の困難サンプルに対するトレーニング効果を向上させ、さらにトレーニング対象ネットワークに対するトレーニング効果を向上させることができる。
【0322】
1つの選択可能な実施形態として、ステップ69を実行する前に、車両識別装置は、さらに以下のステップを実行する。
【0323】
ステップ70において、上記第16の特徴データ、上記第1の正サンプル画像の特徴データ及び第1の負サンプル画像の特徴データに基づいて、ローカル画素点領域トリプレットロスを取得する。
【0324】
車両識別装置は、第16の特徴データと第1の正サンプル画像の特徴データとの間の類似度を計算して第3の正類似度を取得し、第16の特徴データと第1の負サンプル画像の特徴データとの間の類似度を計算して第3の負類似度を取得する。
【0325】
第16の特徴データがxcであり、第3の正類似度がs5であり、第3の負類似度がs6であり、ローカル画素点領域トリプレットロスがLT3であると仮定すると、LT3,s5,s6,xcは式(35)を満たしている。
式(35)
ここで、v3は実数である。v3=1。
【0326】
一部の実施例では、第3の正類似度は、第16の特徴データと第1の正サンプル画像の特徴データとの間の第2のノルムである。第3の負類似度は、第16の特徴データと第1の負サンプル画像の特徴データとの間の第2のノルムである。
【0327】
車両識別装置は、第16の特徴データと正サンプル特徴データセットにおける特徴データとの間の類似度を計算して第3の正類似度セットを取得し、第16の特徴データと負サンプル特徴データセットにおける特徴データとの間の類似度を計算して第3の負類似度セットを取得する。第3の正類似度セットにおける最小値は、第3のカテゴリ内の最小類似度と呼ばれ、第3の負類似度セットにおける最大値は、第3のカテゴリ外の最大類似度と呼ばれる。
【0328】
第16の特徴データがxcであり、第3のカテゴリ内の最小類似度がmaxd(xc,xp)であり、第3のカテゴリの最大類似度がmind(xc,xn)であり、ローカル画素点領域トリプレットロスがLT3であると仮定すると、LT3,maxd(xc,xp),mind(xc,xn),xcは式(36)を満たしている。
式(36)
ここで、v3は実数である。v3=1。
【0329】
一部の実施例では、第16の特徴データと正サンプル特徴データセットにおける特徴データとの間の類似度は、第16の特徴データと正サンプル特徴データセットにおける特徴データとの間の第2のノルムである。第16の特徴データと負サンプル特徴データセットにおける特徴データとの間の類似度は、第16の特徴データと負サンプル特徴データセットにおける特徴データとの間の第2のノルムである。
【0330】
ローカル画素点領域フォーカスロスが取得された後、車両識別装置は、ステップ69を実行する過程において、以下のステップを実行する。
【0331】
ステップ71において、上記第1のグローバルロス、上記第1のキーポイントロス、上記第1のローカル画素点領域ロス、上記キーポイントカテゴリロス、上記キーポイントソートロス、上記ローカル画素点領域カテゴリロス、上記キーポイントフォーカスロス、上記キーポイントトリプレットロス、上記ローカル画素点領域フォーカスロス、上記ローカル画素点トリプレットロス及び上記ローカル画素点領域ソートロスに基づいて、上記総ロスを取得する。
【0332】
第1のグローバルロスがG1であり、第1のキーポイントロスがp1であり、第1のローカル画素点領域ロスがγ1であり、キーポイントカテゴリロスがp2であり、キーポイントソートロスがp2であり、ローカル画素点領域カテゴリロスがγ2であり、ローカル画素点領域ソートロスがγ3であり、ローカル画素点領域フォーカスロスがγ4であり、ローカル画素点トリプレットロスがγ5であり、キーポイントフォーカスロスがp4であり、キーポイントトリプレットロスがp5であり、総ロスがLtであり、1つの可能な実施形態では、G1,p1,p2,p2,p4,p512345,Ltが式(37)を満たしている。
式(37)
ここで、α10は実数である。α10=1。
【0333】
別の可能な実施形態では、G1,p1,p2,p2,p4,p512345,Ltは式(38)を満たしている。
式(38)。
ここで、α10は実数である。α10=1。
【0334】
さらなる別の可能な実施形態では、G1,p1,p2,p2,p4,p512345,Ltは式(39)を満たしている。
式(39)。
ここで、α10、c10は、いずれも実数である。c10=0、α10=1。
【0335】
最大確率が第5の確率閾値と第6の確率閾値との間にある第5の識別結果に対応する画像を第3の容易サンプルと呼び、トレーニング画像のうちの第3の容易サンプル以外の画像を第3の困難サンプルと呼ぶ。例えば、第5の確率閾値が0.4であり、第6の確率閾値0.7であると仮定する。トレーニング過程において、トレーニング対象ネットワークは、画像aを処理することにより、第5の識別結果1を取得する。
【0336】
第5の識別結果1において、画像aにおける第2の識別対象車両が車両1である確率が0.8である場合、画像aにおける第2の識別対象車両が車両2である確率は0.2である。第5の識別結果1の最大確率が0.8であるため、当該最大確率は、第6の確率閾値よりも大きく、画像aは第3の容易サンプルである。
【0337】
第5の識別結果1において、画像aにおける第2の識別対象車両が車両1である確率が0.5である場合、画像aにおける第2の識別対象車両が車両2である確率は0.5である。第5の識別結果1の最大確率が0.5であるため、当該最大確率閾値は、第5の確率閾値よりも大きく、当該最大確率は、第6の閾値未満であり、画像aは、第3の困難サンプルである。
【0338】
トレーニング過程において、ローカル画素点領域トリプレットロスにより、第16の特徴データに基づいたトレーニング対象ネットワークによる第2の識別対象車両の識別結果の精度を向上させ、それによって車両識別ネットワークによる第1の識別対象車両の分類精度を向上させることができる。
【0339】
1つの選択可能な実施形態として、車両識別装置は、生成されたデータセットを取得し、生成されたデータセットを使用して、キーポイント及びローカル画素点領域生成モジュールをトレーニングする。
【0340】
本発明の実施例では、生成されたデータセットは、少なくとも1つのヒートマップトレーニング画像を含み、各ヒートマップトレーニング画像のラベルは、キーポイントラベルヒートマップ及びローカル画素点領域ラベルヒートマップを含む。ここで、キーポイントラベルヒートマップには、ヒートマップトレーニング画像におけるキーポイントの位置情報が含まれ、ローカル画素点領域ラベルヒートマップには、ヒートマップトレーニング画像におけるローカル画素点領域の位置情報が含まれる。
【0341】
本発明の実施例によって提供される技術的解決策に基づいて、本発明の実施例は、車両識別方法の応用シーンをさらに提供する。公共場所でのカメラの数が急速に増加していると伴に、どのように大規模なビデオストリームによって事故発生の原因となる車両のトレースを効果的に確定することは、非常に重要な意味がある。
【0342】
場所Aで交通事故が発生し、事故の原因となった車両が逃げる。事故現場Aの監視カメラでひき逃げ車両の画像を収集する。警察はひき逃げ車両の画像を車両識別装置に入力することができる。
【0343】
車両識別装置は、本発明の実施例によって提供される技術的解決策を使用して、ひき逃げ車両の画像からひき逃げ車両の特徴データを抽出する。
【0344】
車両識別装置は、複数の監視カメラに接続可能であり、異なる監視カメラは異なる場所に取り付けられ、車両識別装置は、各監視カメラから、リアルタイムで収集されたビデオストリームを取得することができる。車両識別装置は、本発明の実施例によって提供される技術的解決策を使用して、ビデオストリームにおける画像からビデオストリームにおける車両の特徴データを抽出し、特徴データベースを取得する。
【0345】
車両識別装置は、ひき逃げ車両の特徴データを特徴データベースにおける特徴データと比較して、ひき逃げ車両の特徴データとマッチングする特徴データをターゲット特徴データとして取得する。ターゲット特徴データに対応する画像がひき逃げ車両を含む画像であることを確定し、さらにひき逃げ車両を含む画像からひき逃げ車両のトレースを確定することができる。
【0346】
当業者は、具体的な実施形態の上記方法において、各ステップの書き込み順序が厳密な実行順序を意味して実施プロセスに対する制限を構成せず、各ステップの具体的な実行順序がその機能及び可能な内部論理で確定されるべきである。
【0347】
以上に本発明の実施例の方法を詳細に説明し、以下に本発明の実施例の装置を提供する。
【0348】
図12を参照して、図12は本発明の実施例による車両識別装置1の構造概略図である。当該車両識別装置1は、取得ユニット11、第1の処理ユニット12、第2の処理ユニット13、融合処理ユニット14、第3の処理ユニット15、第4の処理ユニット16を備える。
【0349】
取得ユニット11は、第1の識別対象車両を含む処理対象画像を取得するように構成される。
【0350】
第1の処理ユニット12は、前記処理対象画像に対して第1の特徴抽出処理を行い、前記第1の識別対象車両のローカル特徴情報を含む第1の特徴データを取得するように構成される。
【0351】
第2の処理ユニット13は、前記処理対象画像に対して第2の特徴抽出処理を行い、前記第1の識別対象車両のグローバル特徴情報を含む第2の特徴データを取得するように構成される。
【0352】
融合処理ユニット14は、前記第1の特徴データ及び前記第2の特徴データに対して融合処理を行い、前記第1の識別対象車両の第3の特徴データを取得するように構成され、前記第3の特徴データが前記第1の識別対象車両の識別結果を取得するために使用される。
【0353】
本発明のいずれか1つの実施形態と組み合わせると、前記ローカル特徴情報は、キーポイントの特徴情報を含み、前記第1の特徴データは、前記識別対象車両の少なくとも1つのキーポイントの特徴情報を含む。
【0354】
本発明のいずれか1つの実施形態と組み合わせると、前記ローカル特徴情報は、ローカル画素点領域の特徴情報をさらに含み、前記第1の特徴データは、前記識別対象車両の少なくとも1つのローカル画素点領域の特徴情報をさらに含む。
【0355】
本発明のいずれか1つの実施形態と組み合わせると、前記第1の処理ユニット12は、
前記処理対象画像に対して第3の特徴抽出処理を行い、第4の特徴データを取得し、前記第4の特徴データが前記第1の識別対象車両の少なくとも1つのキーポイントの特徴情報を含み、
前記処理対象画像に対して第4の特徴抽出処理を行い、第5の特徴データを取得し、前記第5の特徴データが前記第1の識別対象車両の少なくとも1つのローカル画素点領域の特徴情報を含み、前記ローカル画素点領域が前記第1の識別対象車両によって覆われた画素点領域に属し、前記ローカル画素点領域の面積が前記第1の識別対象車両によって覆われた画素点領域の面積よりも小さく、
前記第4の特徴データ及び第5の特徴データに対して融合処理を行い、前記第1の特徴データを取得するように構成される。
【0356】
本発明のいずれか1つの実施形態と組み合わせると、前記第1の処理ユニット12は、
前記処理対象画像に対して第5の特徴抽出処理を行い、少なくとも1つの第6の特徴データを取得し、前記第6の特徴データが前記キーポイントの特徴情報を含み、任意の2つの前記第6の特徴データに含まれる特徴情報が異なるキーポイントに属し、
前記少なくとも1つの第6の特徴データから含まれる情報量の最も多いk個の特徴データを選択し、k個の第7の特徴データを取得し、kが1以上の整数であり、
前記k個の第7の特徴データに基づいて、前記第4の特徴データを取得するように構成される。
【0357】
本発明のいずれか1つの実施形態と組み合わせると、前記第1の処理ユニット12は、
前記処理対象画像に対して第6の特徴抽出処理を行い、少なくとも1つのヒートマップを取得し、前記第1のヒートマップが前記処理対象画像における前記キーポイントの位置情報を含み、任意の2つの前記第1のヒートマップに含まれる情報が異なるキーポイントに属し、
前記処理対象画像に対して第7の特徴抽出処理を行い、前記処理対象画像の第1の特徴画像を取得し、前記第1の特徴画像が前記処理対象画像におけるキーポイントの特徴情報を含み、
各前記第1のヒートマップと前記第1の特徴画像との間のドット積をそれぞれ確定し、前記少なくとも1つの第6の特徴データを取得するように構成される。
【0358】
本発明のいずれか1つの実施形態と組み合わせると、前記第1の処理ユニット12は、
前記少なくとも1つの第6の特徴データにおける特徴データに対してプール化処理をそれぞれ行い、少なくとも1つの第8の特徴データを取得し、
前記少なくとも1つの第8の特徴データに含まれる情報量に基づいて、少なくとも1つの第1の確率を取得し、前記第1の確率が前記第6の特徴データに含まれる情報量を特徴付けるために使用され、前記第1の確率が前記第6の特徴データと1対1で対応し、
前記第1の確率が前記第6の特徴データに含まれる情報量と正の相関にある場合、最大のk個の前記第1の確率に対応する前記第6の特徴データを前記k個の第7の特徴データとして選択し、又は、
前記第1の確率が前記第6の特徴データに含まれる情報量と負の相関にある場合、最小のk個の前記第1の確率に対応する前記第6の特徴データを前記k個の第7の特徴データとして選択するように構成される。
【0359】
本発明のいずれか1つの実施形態と組み合わせると、前記第1の処理ユニット12は、
前記処理対象画像に対して第10の特徴抽出処理を行い、少なくとも1つの第9の特徴データを取得し、前記第9の特徴データが前記キーポイントの特徴情報を含み、任意の2つの前記第9の特徴データに含まれる特徴情報が異なるローカル画素点領域に属し、
前記少なくとも2つの第9の特徴データから含まれる情報量の最も多いm個の特徴データを選択し、m個の第10の特徴データを取得し、前記mが1以上の整数であり、
前記m個の第10の特徴データに基づいて、前記第5の特徴データを取得するように構成される。
【0360】
本発明のいずれか1つの実施形態と組み合わせると、前記第1の処理ユニット12は、
前記処理対象画像に対して第11の特徴抽出処理を行い、前記少なくとも1つの第2のヒートマップを取得し、前記第2のヒートマップが前記処理対象画像における前記ローカル画素点領域の位置情報を含み、任意の2つの前記第2のヒートマップに含まれる情報が異なるローカル画素点領域に属し、
前記処理対象画像に対して第12の特徴抽出処理を行い、前記処理対象画像の第2の特徴画像を取得し、前記第2の特徴画像が前記処理対象画像におけるローカル画素点領域の特徴情報を含み、
各前記第2のヒートマップと前記第2の特徴画像との間のドット積をそれぞれ確定し、前記少なくとも1つの第9の特徴データを取得するように構成される。
【0361】
本発明のいずれか1つの実施形態と組み合わせると、前記第1の処理ユニット12は、
前記第9の特徴データにおける特徴データに対してプール化処理をそれぞれ行い、少なくとも1つの第11の特徴データを取得し、
前記少なくとも1つの第11の特徴データに含まれる情報量に基づいて、少なくとも1つの第2の確率を取得し、前記第2の確率が前記第9の特徴データに含まれる情報量を特徴付けるために使用され、前記第2の確率が前記第9の特徴データと1対1で対応し、
前記第2の確率が前記第9の特徴データに含まれる情報量と正の相関にある場合、最大のm個の前記第2の確率に対応する前記第9の特徴データを前記m個の第10の特徴データとして選択し、又は、
前記第2の確率が前記第9の特徴データに含まれる情報量と負の相関にある場合、最小のm個の前記第2の確率に対応する前記第9の特徴データを前記m個の第10の特徴データとして選択するように構成される。
【0362】
本発明のいずれか1つの実施形態と組み合わせると、前記少なくとも1のローカル画素点領域は、第1の画素点領域と第2の画素点領域を含み、前記第9の特徴データの数及び前記mの両方はいずれも1よりも大きく、前記m個の第10の特徴データは、第12の特徴データと第13の特徴データを含み、前記第12の特徴データは、前記第1の画素点領域の特徴情報を含み、前記第13の特徴データは、前記第2の画素点領域の特徴情報を含み、
前記第1処理ユニット12は、
前記第12の特徴データに含まれる情報量に基づいて第1の重みを取得し、前記第13の特徴データに含まれる情報量に基づいて第2の重みを取得し、前記第1の重みが前記第12の特徴データに含まれる情報量と正の相関にあり、前記第2の重みが前記第13の特徴データに含まれる情報量と正の相関にあり、
前記第1の重み及び前記第2の重みに基づいて、前記第12の特徴データ及び前記第13の特徴データを加重融合し、前記第5の特徴データを取得するように構成される。
【0363】
本発明のいずれか1つの実施形態と組み合わせると、前記車両識別装置によって実行される車両識別方法は、車両識別ネットワークに応用され、前記取得ユニットは、さらに、第2の識別対象車両を含むトレーニング画像及びトレーニング対象ネットワークを取得するように構成され、
前記第1の処理ユニット12は、さらに、前記トレーニング対象ネットワークを使用して前記トレーニング画像を処理し、前記第2の識別対象車両のグローバル特徴情報を含む第14の特徴データと、前記第2の識別対象車両のキーポイントの特徴情報を含む第15の特徴データとを取得するように構成され、
第3の処理ユニット15は、前記第14の特徴データ及び前記トレーニング画像のラベルに基づいて、第1のグローバルロスを取得するように構成され、
前記第3の処理ユニット15は、さらに、前記第15の特徴データ及び前記ラベルに基づいて、第1のキーポイントロスを取得するように構成され、
前記第3の処理ユニット15は、さらに、前記第1のグローバルロス及び前記第1のキーポイントロスに基づいて、前記トレーニング対象ネットワークの総ロスを取得するように構成され、
第4の処理ユニット16は、前記総ロスに基づいて前記トレーニング対象ネットワークのパラメータを調整し、前記車両識別ネットワークを取得するように構成される。
【0364】
本発明のいずれか1つの実施形態と組み合わせると、前記第1の処理ユニット12は、さらに、前記第1のグローバルロス及び前記第1のキーポイントロスに基づいて、前記トレーニング対象ネットワークの総ロスを取得するステップの前に、前記トレーニング対象ネットワークを使用して前記トレーニング画像を処理し、前記第2の識別対象車両のローカル画素点領域の特徴情報を含む第16の特徴データを取得するように構成され、
前記第3の処理ユニット15は、さらに、前記第16の特徴データ及び前記ラベルに基づいて、第1のローカル画素点領域ロスを取得するように構成され、
前記第3の処理ユニット15は、さらに、前記第1のグローバルロス、前記第1のキーポイントロス及び前記第1のローカル画素点領域ロスに基づいて、前記総ロスを取得するように構成される。
【0365】
本発明のいずれか1つの実施形態と組み合わせると、前記第1の処理ユニット12は、
前記トレーニング対象ネットワークを使用して前記トレーニング画像を処理し、少なくとも1つの第17の特徴データを取得し、前記第17の特徴データが第2の識別対象車両のキーポイントの特徴情報を含み、任意の2つの第17の特徴データに含まれる特徴情報が異なるキーポイントに属し、
前記少なくとも1つの第17の特徴データから含まれる情報量の最も多いs個の特徴データを選択し、s個の第18の特徴データを取得し、前記sが1以上の整数であり、
前記s個の第18の特徴データに対して融合処理を行い、前記第15の特徴データを取得するように構成される。
【0366】
本発明のいずれか1つの実施形態と組み合わせると、前記第3の処理ユニットは、さらに、前記第1のグローバルロス、前記第1のキーポイントロス及び前記第1のローカル画素点領域ロスに基づいて、前記総ロスを取得するステップの前に、前記s個の第18の特徴データに基づいて、前記第2の識別対象車両のs個の第1の識別結果を取得し、
前記s個の第1の識別結果と前記ラベルとの違いのそれぞれに基づいて、キーポイントカテゴリロスを取得するように構成され、
前記第4処理ユニット16は、
前記第1のグローバルロス、前記第1のキーポイントロス、前記第1のローカル画素点領域ロス及び前記キーポイントカテゴリロスに基づいて、前記総ロスを取得するように構成される。
【0367】
本発明のいずれか1つの実施形態と組み合わせると、前記第1の処理ユニット12は、
含まれる情報量に基づいて前記少なくとも1つの第17の特徴データをソートし、第1の順序を取得し、第1の順序が含まれる情報量の降順であり、又は、第1の順序は、含まれる情報量の昇順であり、
前記第1の順序に基づいて前記少なくとも1つの第17の特徴データから含まれる情報量の最も多いs個の特徴データを選択し、前記s個の第18の特徴データを取得するように構成され、
前記第3の処理ユニット15は、前記第1のグローバルロス、前記第1のキーポイントロス、前記第1のローカル画素点領域ロス及び前記キーポイントカテゴリロスに基づいて、前記総ロスを取得するステップの前に、対応する前記キーポイントカテゴリロスに基づいて前記s個の第1の識別結果をソートし、第2の順序を取得し、前記第2の順序が前記キーポイントカテゴリロスの降順であり、又は、前記第2の順序は前記キーポイントカテゴリロスの昇順であり、
前記第1の順序と前記第2の順序との違いに基づき、キーポイントソートロスを取得するように構成され、
前記第4の処理ユニット16は、
前記第1のグローバルロス、前記第1のキーポイントロス、前記第1のローカル画素点領域ロス、前記記キーポイントカテゴリロス及び前記キーポイントソートロスに基づいて、前記総ロスを取得するように構成される。
【0368】
本発明のいずれか1つの実施形態と組み合わせると、前記第1の処理ユニット12は、
前記トレーニング対象ネットワークを使用して前記トレーニング画像を処理し、少なくとも1つの第19の特徴データを取得し、前記第19の特徴データが前記ローカル画素点領域の特徴情報を含み、任意の2つの前記第19の特徴データに含まれる特徴情報が異なるローカル画素点領域に属し、
前記少なくとも1つの第19の特徴データから含まれる情報量の最も多い情報を含むp個の特徴データを選択し、p個の第20の特徴データを取得し、前記pが1以上の整数であり、
前記p個の第20の特徴データに対して融合処理を行い、前記第16の特徴データを取得するように構成される。
【0369】
本発明のいずれか1つの実施形態と組み合わせると、前記第3の処理ユニット15は、前記第1のグローバルロス、前記第1のキーポイントロス、前記第1のローカル画素点領域ロス、前記キーポイントカテゴリロス及び前記キーポイントソートロスに基づいて、前記総ロスを取得するステップの前に、前記p個の第20の特徴データに基づいて、前記第2の識別対象車両のp個の第2の識別結果を取得し、
前記p個の第2の識別結果と前記ラベルとの違いのそれぞれに基づいて、ローカル画素点領域カテゴリロスを取得するように構成され、
前記第4の処理ユニット16は、
前記第1のグローバルロス、前記第1のキーポイントロス、前記第1のローカル画素点領域ロス、前記記キーポイントカテゴリロス、前記キーポイントソートロス及び前記ローカル画素点領域カテゴリロスに基づいて、前記総ロスを取得するように構成される。
【0370】
本発明のいずれか1つの実施形態と組み合わせると、前記第1の処理ユニット12は、
含まれる情報量に基づいて前記少なくとも1つの第19の特徴データをソートし、第3の順序を取得し、第3の順序が含まれる情報量の降順であり、又は、第3の順序が含まれる情報量の昇順であり、
前記第3の順序に基づいて前記少なくとも1つの第19の特徴データから含まれる情報量の最も多いp個の特徴データを選択し、前記p個の第20の特徴データを取得するように構成され、
前記第3の処理ユニット15は、前記第1のグローバルロス、前記第1のキーポイントロス、前記第1のローカル画素点領域ロス、前記キーポイントカテゴリロス、前記キーポイントソートロス及び前記ローカル画素点領域カテゴリロスに基づいて、前記総ロスを取得するステップの前に、対応する前記ローカル画素点領域カテゴリロスに基づいて前記p個の第2の識別結果をソートし、第4の順序を取得し、前記第4の順序が前記ローカル画素点領域カテゴリロスの降順であり、又は、前記第4の順序が前記ローカル画素点領域カテゴリロスの昇順であり、
前記第3の順序と前記第4の順序との違いに基づき、ローカル画素点領域ソートロスを取得するように構成され、
前記第4の処理ユニット16は、
前記第1のグローバルロス、前記第1のキーポイントロス、前記第1のローカル画素点領域ロス、前記記キーポイントカテゴリロス、前記キーポイントソートロス、前記ローカル画素点領域カテゴリロス及び前記ローカル画素点領域ソートロスに基づいて、前記総ロスを取得するように構成される。
【0371】
本発明のいずれか1つの実施形態と組み合わせると、前記第1のグローバルロスは、グローバルフォーカスロスを含み、前記第3の処理ユニット15は、
前記第14の特徴データに基づいて、前記第2の識別対象車両の第3の識別結果を取得し、
前記第3の識別結果及び前記ラベルに基づいて、前記第3の識別結果のフォーカスロスを前記グローバルフォーカスロスとして取得するように構成される。
【0372】
本発明のいずれか1つの実施形態と組み合わせると、前記トレーニング画像は、トレーニング画像セットに属し、前記トレーニング画像セットは、前記トレーニング画像の第1の正サンプル画像及び前記トレーニング画像の第1の負サンプル画像をさらに含み、前記第1のグローバルロスは、グローバルトリプレットロスをさらに含み、
前記第3の処理ユニット15は、さらに、
前記トレーニング対象ネットワークを使用して前記第1の正サンプル画像に対して特徴抽出処理を行い、前記第1の正サンプル画像の特徴データを取得し、
前記トレーニング対象ネットワークを使用して前記第1の負サンプル画像に対して特徴抽出処理を行い、前記第1の負サンプル画像の特徴データを取得し、
前記第12の特徴データ、前記第1の正サンプル画像の特徴データ及び前記第1の負サンプル画像の特徴データに基づいて、前記グローバルトリプレットロスを取得するように構成される。
【0373】
本実施例では、車両識別装置は、第1の特徴データ及び第2の特徴データに対して融合処理を行うことにより、第1の識別対象車両のグローバル特徴情報だけでなく、第1の識別対象車両のローカル特徴情報も含む第3の特徴データを取得することができる。第3の特徴データを第1の識別対象車両の特徴データとして使用することにより、第1の識別対象車両の特徴データに含まれる情報を豊かにすることができる。
【0374】
一部の実施例では、本発明の実施例によって提供される装置が備える機能又は当該装置に含まれるモジュールは、上記の方法の実施例で説明される方法を実行するために使用されてもよく、その具体的な実現については上記の方法の実施例の説明を参照することができ、簡潔のために、ここでは説明を省略する。
【0375】
図13は本発明の実施例による車両識別装置のハードウェア構造概略図である。当該車両識別装置2は、プロセッサ21、メモリ22、入力装置23、出力装置24を備える。当該プロセッサ21、メモリ22、入力装置23及び出力装置24は、コネクタを介して結合され、当該コネクタは、様々なインターフェース、伝送ライン又はバスなどを含むが、本発明の実施例で限定されない。本発明の様々な実施例では、結合とは、特定の方式での相互接続を指し、直接接続又は他のデバイスを介した間接接続を含み、例えば様々なインターフェース、伝送ライン、バスなどを介して接続することができる。
【0376】
プロセッサ21は、1つ又は複数のグラフィックス処理ユニット(GPU:graphics processing unit)であってもよく、プロセッサ21が1つのGPUである場合、当該GPUは、シングルコアGPUであってもよいし、マルチコアGPUであってもよい。一部の実施例では、プロセッサ21は、複数のGPUから構成されるプロセッサグループであってもよく、複数のプロセッサ同士は、1つ又は複数のバスを介して互いに結合される。一部の実施例では、当該プロセッサは、他のタイプのプロセッサなどであってもよく、本発明の実施例では限定されない。
【0377】
メモリ22は、コンピュータプログラム命令、及び本発明の解決策を実行するためのプログラムコードを含む様々なタイプのコンピュータプログラムコードを記憶するように構成されてもよい。選択可能に、メモリは、ランダムアクセスメモリ(RAM:Access Memory)、読み取り専用メモリ(ROM:Read-Only Memory)、消去可能なプログラマブル読み取り専用メモリ(EPROM:Erasable Programmable Read Only Memory)、又はポータブル読み取り専用メモリ(CD-ROM:Compact Disc Read-Only Memory)を含むがこれらに限定されず、当該メモリは、関連する命令及びデータに用いられる。
【0378】
入力装置23は、データ及び/又は信号を入力するように構成され、出力装置24は、データ及び/又は信号を出力するように構成される。入力装置23と出力装置24は、独立したデバイスであってもよいし、一体のデバイスであってもよい。
【0379】
本発明の実施例では、メモリ22は、関連する命令ためだけでなく、関連するデータを記憶するように構成されてもよいことが理解でき、例えば、当該メモリ22は、入力装置23によって取得された処理対象画像を記憶するように構成されてもよく、又は、当該メモリ22は、プロセッサ21によって取得された第3の特徴データなどを記憶するように構成されてもよく、本発明の実施例では当該メモリに具体的に記憶されているデータが限定されない。
【0380】
図13が車両識別装置の簡素化された設計のみを示していることを理解できる。実際の応用中、車両識別装置は、さらに任意の数の入力/出力装置、プロセッサ、メモリなどを含むがこれらに限定されない他の必要な部品をそれぞれ含むことができ、本発明の実施例を実施可能な車両識別装置は、本発明の保護範囲内にある。
【0381】
当業者であれば、本明細書で開示される実施例と組み合わせて説明された各例のユニット及びアルゴリズムステップは、電子ハードウェア、又はコンピュータソフトウェアと電子ハードウェアの組み合わせで実現されてもよいと理解できる。これらの機能がハードウェア又はソフトウェアで実行されるかは、技術的解決策の特定アプリケーションと設計制約条件に依存する。当業者は、各特定のアプリケーションに対して異なる方法を用いて記述される機能を実現することができるが、このような実現は本発明の範囲を超えると考えられるべきではない。
【0382】
当業者は、説明の便宜及び簡潔のために、上述したシステム、デバイス及びユニットの具体的な動作プロセスについて、前記方法の実施例における対応するプロセスを参照でき、ここで説明を省略することを明確に理解することができる。当業者は、本発明の各実施例が異なる重点で説明されることを明確に理解することができ、説明の便宜及び簡潔のために、同一又は類似の部分は異なる実施例において説明が省略される可能性があり、したがって、ある実施例で説明されていない部分又は詳しく説明されていない部分については、他の実施例の記載を参照することができる。
【0383】
本発明で提供される一部の実施例では、開示されるシステム、装置及び方法は、他の方式により実現されてもよいと理解すべきである。例えば、上記装置の実施例は、例示的なものだけであり、例えば、前記ユニットの区分は、論理機能的な区分だけであり、実際に実施する時に他の区分方式もあり得て、例えば複数のユニット又は構成要素は、組み合わせられてもよく又は別のシステムに統合されてもよく、又は一部の特徴は無視されて又は実行されなくてもよい。また、示され又は議論される相互結合又は直接結合又は通信接続は一部のインターフェース、装置又はユニットを介した間接結合又は通信接続であってもよく、電気的、機械的又は他の形態であってもよい。
【0384】
分離部材として説明された前記ユニットは物理的に分離するものであってもよく又は物理的に分離するものでなくてもよく、ユニットとして表示された部材は、物理ユニットであってもよく又は物理ユニットでなくてもよく、即ち1つの箇所に位置してもよく、又は複数のネットワークユニットに分布してもよい。実際のニーズに応じてそのうちの一部又は全てのユニットを選択して本実施例の解決策の目的を達成することができる。
【0385】
また、本発明の各実施例における各機能ユニットは、1つの処理ユニットに統合されてもよく、個々のユニットは単独で物理に存在してもよく、2つ又は2つ以上のユニットは1つのユニットに統合されてもよい。
【0386】
上記実施例では、全部又は一部でソフトウェア、ハードウェア、ファームウェア又はそれらの任意の組み合わせによって実現されてもよい。ソフトウェアで実現される場合、全て又は部分的にコンピュータプログラム製品の形で実現されてもよい。前記コンピュータプログラム製品は1つ又は複数のコンピュータ命令を含む。コンピュータで前記コンピュータプログラム命令をロードして実行する場合、本発明の実施例に従って説明されたプロセス又は機能を全部で又は部分的に生成する。前記コンピュータは、汎用コンピュータ、専用コンピュータ、コンピュータネットワーク、又は他のプログラマブルデバイスであってもよい。前記コンピュータ命令は、コンピュータ読み取り可能な記憶媒体に記憶されてもよく、又は前記コンピュータ読み取り可能な記憶媒体を介して伝送されてもよい。前記コンピュータ命令は、1つのウェブサイト、コンピュータ、サーバ又はデータセンターから別のウェブサイト、コンピュータ、サーバ又はデータセンターに有線(例えば同軸ケーブル、光ファイバ、デジタル加入者線(DSL:digital subscriber line)又は無線(例えば赤外線、無線、マイクロ波など)で伝送されてもよい。前記コンピュータ読記憶媒体は、コンピュータがアクセスできるいかなる利用可能な媒体であってもよく、又は1つ又は複数の利用可能な媒体で集積されたサーバ、データセンターなどのデータ記憶装置を含む。前記利用可能な媒体は、磁気媒体(例えばフロッピーディスク、ハードディスク、磁気テープ)、光学媒体(例えばデジタルビデオディスク(DVD:Digital Video Disc))、又は半導体媒体(例えばソリッドステートディスク(SSD:Solid State Disk))などであってもよい。
【0387】
当業者は、上記実施例の方法の全て又は一部のフローを実現することを理解し、当該フローは、コンピュータプログラムで関連するハードウェアを指令して完了されてもよく、当該プログラムがコンピュータ読み取り可能記憶媒体に記憶されてもよく、当該プログラムが実行されるとき、上記の各方法の実施例のフローを含むことができる。前記憶媒体は読み出し専用メモリ(ROM:read-only memory)又はランダムアクセスメモリ(RAM:random access memory)、磁気ディスク又は光ディスク等のプログラムコードを記憶できる様々な媒体を含む。
【産業上の利用可能性】
【0388】
本発明は、車両識別方法及び装置、電子デバイス及び記憶媒体を開示する。当該方法は、第1の識別対象車両を含む処理対象画像を取得するステップと、前記処理対象画像に対して第1の特徴抽出処理を行い、前記第1の識別対象車両のローカル特徴情報を含む第1の特徴データを取得するステップと、前記処理対象画像に対して第2の特徴抽出処理を行い、前記第1の識別対象車両のグローバル特徴情報を含む第2の特徴データを取得するステップと、前記第1の特徴データ及び前記第2の特徴データに対して融合処理を行い、前記第1の識別対象車両の第3の特徴データを取得するステップであって、前記第3の特徴データが前記第1の識別対象車両の識別結果を取得するために応用されるステップと、を含む。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
【手続補正書】
【提出日】2021-12-16
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
車両識別方法であって、
第1の識別対象車両を含む処理対象画像を取得することと、
前記処理対象画像に対して第1の特徴抽出処理を行うことで、前記第1の識別対象車両のローカル特徴情報を含む第1の特徴データを取得することと、
前記処理対象画像に対して第2の特徴抽出処理を行うことで、前記第1の識別対象車両のグローバル特徴情報を含む第2の特徴データを取得することと、
前記第1の特徴データと前記第2の特徴データに対して融合処理を行うことで、前記第1の識別対象車両の第3の特徴データを取得することであって、前記第3の特徴データは、前記第1の識別対象車両の識別結果を取得するために使用されることと、を含む、
車両識別方法。
【請求項2】
前記ローカル特徴情報は、キーポイントの特徴情報を含み、前記第1の特徴データは、前記識別対象車両の少なくとも1つのキーポイントの特徴情報を含むことを特徴とする
請求項1に記載の方法。
【請求項3】
前記ローカル特徴情報は、ローカル画素点領域の特徴情報をさらに含み、前記第1の特徴データは、前記識別対象車両の少なくとも1つのローカル画素点領域の特徴情報をさらに含むことを特徴とする
請求項2に記載の方法。
【請求項4】
前記処理対象画像に対して第1の特徴抽出処理を行うことで、前記第1の識別対象車両のローカル特徴情報を含む第1の特徴データを取得することは、
前記処理対象画像に対して第3の特徴抽出処理を行うことで、第4の特徴データを取得することであって、前記第4の特徴データは前記第1の識別対象車両の少なくとも1つのキーポイントの特徴情報を含むことと、
前記処理対象画像に対して第4の特徴抽出処理を行うことで、第5の特徴データを取得することであって、前記第5の特徴データは前記第1の識別対象車両の少なくとも1つのローカル画素点領域の特徴情報を含み、前記ローカル画素点領域は前記第1の識別対象車両によって覆われた画素点領域に属し、前記ローカル画素点領域の面積が前記第1の識別対象車両によって覆われた画素点領域の面積よりも小さいことと、
前記第4の特徴データと第5の特徴データに対して融合処理を行うことで、前記第1の特徴データを取得することと、を含むことを特徴とする
請求項3に記載の方法。
【請求項5】
前記処理対象画像に対して第3の特徴抽出処理を行うことで、第4の特徴データを取得することは、
前記処理対象画像に対して第5の特徴抽出処理を行うことで、少なくとも1つの第6の特徴データを取得することであって、前記第6の特徴データは前記キーポイントの特徴情報を含み、任意の2つの前記第6の特徴データに含まれる特徴情報が異なるキーポイントに属することと、
前記少なくとも1つの第6の特徴データから含まれる情報量の最も多いk個の特徴データを選択することで、k個の第7の特徴データを取得することであって、前記kは1以上の整数であることと、
前記k個の第7の特徴データに基づいて、前記第4の特徴データを取得することと、を含むことを特徴とする
請求項4に記載の方法。
【請求項6】
前記処理対象画像に対して第5の特徴抽出処理を行うことで、少なくとも1つの第6の特徴データを取得することは、
前記処理対象画像に対して第6の特徴抽出処理を行うことで、少なくとも1つのヒートマップを取得することであって、前記第1のヒートマップは前記処理対象画像における前記キーポイントの位置情報を含み、任意の2つの前記第1のヒートマップに含まれる情報が異なるキーポイントに属することと、
前記処理対象画像に対して第7の特徴抽出処理を行うことで、前記処理対象画像の第1の特徴画像を取得することであって、前記第1の特徴画像は前記処理対象画像におけるキーポイントの特徴情報を含むことと、
各前記第1のヒートマップと前記第1の特徴画像との間のドット積をそれぞれ確定することで、前記少なくとも1つの第6の特徴データを取得することと、を含むことを特徴とする
請求項5に記載の方法。
【請求項7】
前記処理対象画像に対して第4の特徴抽出処理を行うことで、第5の特徴データを取得することは、
前記処理対象画像に対して第10の特徴抽出処理を行うことで、少なくとも1つの第9の特徴データを取得することであって、前記第9の特徴データは前記キーポイントの特徴情報を含み、任意の2つの前記第9の特徴データに含まれる特徴情報が異なるローカル画素点領域に属することと、
前記少なくとも2つの第9の特徴データから含まれる情報量の最も多いm個の特徴データを選択することで、m個の第10の特徴データを取得することであって、前記mは1以上の整数であることと、
前記m個の第10の特徴データに基づいて、前記第5の特徴データを取得することと、を含むことを特徴とする
請求項3~のいずれか一項に記載の方法。
【請求項8】
前記処理対象画像に対して第10の特徴抽出処理を行うことで、少なくとも1つの第9の特徴データを取得することは、
前記処理対象画像に対して第11の特徴抽出処理を行うことで、前記少なくとも1つの第2のヒートマップを取得することであって、前記第2のヒートマップは前記処理対象画像における前記ローカル画素点領域の位置情報を含み、任意の2つの前記第2のヒートマップに含まれる情報が異なるローカル画素点領域に属することと、
前記処理対象画像に対して第12の特徴抽出処理を行うことで、前記処理対象画像の第2の特徴画像を取得することであって、前記第2の特徴画像は前記処理対象画像におけるローカル画素点領域の特徴情報を含むことと、
各前記第2のヒートマップと前記第2の特徴画像との間のドット積をそれぞれ確定することで、前記少なくとも1つの第9の特徴データを取得することと、を含むことを特徴とする
請求項に記載の方法。
【請求項9】
前記少なくとも2つの第9の特徴データから含まれる情報の最も多いm個の特徴データを選択することで、m個の第10の特徴データを取得することは、
前記第9の特徴データにおける特徴データに対してプール化処理をそれぞれ行うことで、少なくとも1つの第11の特徴データを取得することと、
前記少なくとも1つの第11の特徴データに含まれる情報量に基づいて、少なくとも1つの第2の確率を取得することであって、前記第2の確率は前記第9の特徴データに含まれる情報量を特徴付けるために使用され、前記第2の確率が前記第9の特徴データと1対1で対応していることと、
前記第2の確率が前記第9の特徴データに含まれる情報量と正の相関にある場合、最大のm個の前記第2の確率に対応する前記第9の特徴データを前記m個の第10の特徴データとして選択すること、又は、
前記第2の確率が前記第9の特徴データに含まれる情報量と負の相関にある場合、最小のm個の前記第2の確率に対応する前記第9の特徴データを前記m個の第10の特徴データとして選択することとを含むことを特徴とする
請求項又はに記載の方法。
【請求項10】
前記少なくとも1のローカル画素点領域は、第1の画素点領域と第2の画素点領域を含み、前記第9の特徴データの数及び前記mの両方はいずれも1よりも大きく、前記m個の第10の特徴データは、第12の特徴データと第13の特徴データを含み、前記第12の特徴データは、前記第1の画素点領域の特徴情報を含み、前記第13の特徴データは、前記第2の画素点領域の特徴情報を含み、
前記m個の第10の特徴データに基づいて前記第5の特徴データを取得することは、
前記第12の特徴データに含まれる情報量に基づいて第1の重みを取得し、前記第13の特徴データに含まれる情報量に基づいて第2の重みを取得ことであって、前記第1の重みが前記第12の特徴データに含まれる情報量と正の相関にあり、前記第2の重みが前記第13の特徴データに含まれる情報量と正の相関にあることと、
前記第1の重み及び前記第2の重みに基づいて、前記第12の特徴データ及び前記第13の特徴データを加重融合することで、前記第5の特徴データを取得することと、を含むことを特徴とする
請求項のいずれか一項に記載の方法。
【請求項11】
前記車両識別方法は、車両識別ネットワークに応用され、
前記車両識別ネットワークのトレーニング方法は、
第2の識別対象車両を含むトレーニング画像及びトレーニング対象ネットワークを取得することと、
前記トレーニング対象ネットワークを使用して前記トレーニング画像を処理することで、前記第2の識別対象車両のグローバル特徴情報を含む第14の特徴データと、前記第2の識別対象車両のキーポイントの特徴情報を含む第15の特徴データとを取得することと、
前記第14の特徴データ及び前記トレーニング画像のラベルに基づいて、第1のグローバルロスを取得することと、
前記第15の特徴データ及び前記ラベルに基づいて、第1のキーポイントロスを取得することと、
前記第1のグローバルロス及び前記第1のキーポイントロスに基づいて、前記トレーニング対象ネットワークの総ロスを取得することと、
前記総ロスに基づいて前記トレーニング対象ネットワークのパラメータを調整することで、前記車両識別ネットワークを取得することと、を含むことを特徴とする
請求項1~10のいずれか一項に記載の方法。
【請求項12】
前記第1のグローバルロス及び前記第1のキーポイントロスに基づいて、前記トレーニング対象ネットワークの総ロスを取得することの前に、前記方法は、
前記トレーニング対象ネットワークを使用して前記トレーニング画像を処理することで、前記第2の識別対象車両のローカル画素点領域の特徴情報を含む第16の特徴データを取得することと、
前記第16の特徴データ及び前記ラベルに基づいて、第1のローカル画素点領域ロスを取得することと、をさらに含み、
前記第1のグローバルロス及び前記第1のキーポイントロスに基づいて、前記トレーニング対象ネットワークの総ロスを取得することは、
前記第1のグローバルロス、前記第1のキーポイントロス及び前記第1のローカル画素点領域ロスに基づいて、前記総ロスを取得することを含むことを特徴とする
請求項11に記載の方法。
【請求項13】
前記トレーニング対象ネットワークを使用して前記トレーニング画像を処理することで、前記第2の識別対象車両のキーポイントの特徴情報を含む第15の特徴データを取得することは、
前記トレーニング対象ネットワークを使用して前記トレーニング画像を処理することで、少なくとも1つの第17の特徴データを取得することであって、前記第17の特徴データは前記第2の識別対象車両のキーポイントの特徴情報を含み、任意の2つの前記第17の特徴データに含まれる特徴情報が異なるキーポイントに属することと、
前記少なくとも1つの第17の特徴データから含まれる情報量の最も多いs個の特徴データを選択することで、s個の第18の特徴データを取得することであって、前記sは1以上の整数であることと、
前記s個の第18の特徴データに対して融合処理を行うことで、前記第15の特徴データを取得することと、を含むことを特徴とする
請求項12に記載の方法。
【請求項14】
前記第1のグローバルロス、前記第1のキーポイントロス及び前記第1のローカル画素点領域ロスに基づいて、前記総ロスを取得することの前に、前記方法は、
前記s個の第18の特徴データに基づいて、前記第2の識別対象車両のs個の第1の識別結果を取得することと、
前記s個の第1の識別結果のそれぞれと前記ラベルとの違いに基づいて、キーポイントカテゴリロスを取得することと、をさらに含み、
前記第1のグローバルロス、前記第1のキーポイントロス及び前記第1のローカル画素点領域ロスに基づいて、前記総ロスを取得することは、
前記第1のグローバルロス、前記第1のキーポイントロス、前記第1のローカル画素点領域ロス及び前記キーポイントカテゴリロスに基づいて、前記総ロスを取得することを含むことを特徴とする
請求項13に記載の方法。
【請求項15】
前記少なくとも1つの第17の特徴データから含まれる情報量の最も多いs個の特徴データを選択することで、s個の第18の特徴データを取得することは、
含まれる情報量に基づいて前記少なくとも1つの第17の特徴データをソートすることで、第1の順序を取得することであって、前記第1の順序が含まれる情報量の降順であり、又は、前記第1の順序が含まれる情報量の昇順であることと、
前記第1の順序に基づいて前記の少なくとも1つの第17の特徴データから含まれる情報量の最も多いs個の特徴データを選択することで、前記s個の第18の特徴データを取得することと、を含み、
前記第1のグローバルロス、前記第1のキーポイントロス、前記第1のローカル画素点領域ロス及び前記キーポイントカテゴリロスに基づいて、前記総ロスを取得することの前に、前記方法は、
対応する前記キーポイントカテゴリロスに基づいて前記s個の第1の識別結果をソートすることで、第2の順序を取得することであって、前記第2の順序が前記キーポイントカテゴリロスの降順であり、又は、前記第2の順序が前記キーポイントカテゴリロスの昇順であることと、
前記第1の順序と前記第2の順序との違いに基づいて、キーポイントソートロスを取得することと、をさらに含み、
前記第1のグローバルロス、前記第1のキーポイントロス、前記第1のローカル画素点領域ロス及び前記キーポイントカテゴリロスに基づいて、前記総ロスを取得することは、
前記第1のグローバルロス、前記第1のキーポイントロス、前記第1のローカル画素点領域ロス、前記記キーポイントカテゴリロス及び前記キーポイントソートロスに基づいて、前記総ロスを取得することを含むことを特徴とする
請求項13又は14に記載の方法。
【請求項16】
前記第1のグローバルロスは、グローバルフォーカスロスを含み、
前記第14の特徴データ及び前記トレーニング画像のラベルに基づいて、第1のグローバルロスを取得することは、
前記第14の特徴データに基づいて、前記第2の識別対象車両の第3の識別結果を取得することと、
前記第3の識別結果及び前記ラベルに基づいて、前記第3の識別結果のフォーカスロスを前記グローバルフォーカスロスとして取得することと、を含むことを特徴とする
請求項1115のいずれか一項に記載の方法。
【請求項17】
前記トレーニング画像は、トレーニング画像セットに属し、前記トレーニング画像セットは、前記トレーニング画像の第1の正サンプル画像及び前記トレーニング画像の第1の負サンプル画像をさらに含み、前記第1のグローバルロスは、グローバルトリプレットロスをさらに含み、
前記方法は、
前記トレーニング対象ネットワークを使用して前記第1の正サンプル画像に対して特徴抽出処理を行うことで、前記第1の正サンプル画像の特徴データを取得することと、
前記トレーニング対象ネットワークを使用して前記第1の負サンプル画像に対して特徴抽出処理を行うことで、前記第1の負サンプル画像の特徴データを取得することと、
前記第12の特徴データ、前記第1の正サンプル画像の特徴データ及び前記第1の負サンプル画像の特徴データに基づいて、前記グローバルトリプレットロスを取得することと、を含むことを特徴とする
請求項16に記載の方法。
【請求項18】
車両識別装置であって、
第1の識別対象車両を含む処理対象画像を取得するように構成される取得ユニットと、
前記処理対象画像に対して第1の特徴抽出処理を行うことで、前記第1の識別対象車両のローカル特徴情報を含む第1の特徴データを取得するように構成される第1の処理ユニットと、
前記処理対象画像に対して第2の特徴抽出処理を行うことで、前記第1の識別対象車両のグローバル特徴情報を含む第2の特徴データを取得するように構成される第2の処理ユニットと、
前記第1の特徴データと前記第2の特徴データに対して融合処理を行うことで、前記第1の識別対象車両の第3の特徴データを取得するように構成され、前記第3の特徴データは前記第1の識別対象車両の識別結果を取得するために使用される融合処理ユニットと、を備える、
車両識別装置。
【請求項19】
電子デバイスであって、
プロセッサとメモリとを備え、
前記メモリは、コンピュータプログラムコードを記憶するように構成され、
前記コンピュータプログラムコードは、コンピュータ命令を含み、
前記電子デバイスは、前記プロセッサが前記コンピュータ命令を実行する場合、請求項1~17のいずれか一項に記載の方法を実行する、
電子デバイス。
【請求項20】
コンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ読み取り可能な記憶媒体にはコンピュータプログラムが記憶されており、
前記コンピュータプログラムはプログラム命令を含み、
前記プログラム命令がプロセッサによって実行される場合、前記プロセッサに請求項1~17のいずれか一項に記載の方法を実行させる、
コンピュータ読み取り可能な記憶媒体。
【国際調査報告】