IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッドの特許一覧

特許7357114生体検出モデルのトレーニング方法、装置、電子機器および記憶媒体
<>
  • 特許-生体検出モデルのトレーニング方法、装置、電子機器および記憶媒体 図1
  • 特許-生体検出モデルのトレーニング方法、装置、電子機器および記憶媒体 図2
  • 特許-生体検出モデルのトレーニング方法、装置、電子機器および記憶媒体 図3
  • 特許-生体検出モデルのトレーニング方法、装置、電子機器および記憶媒体 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-09-27
(45)【発行日】2023-10-05
(54)【発明の名称】生体検出モデルのトレーニング方法、装置、電子機器および記憶媒体
(51)【国際特許分類】
   G06N 20/00 20190101AFI20230928BHJP
【FI】
G06N20/00
【請求項の数】 17
【外国語出願】
(21)【出願番号】P 2022088153
(22)【出願日】2022-05-31
(65)【公開番号】P2022116231
(43)【公開日】2022-08-09
【審査請求日】2022-05-31
(31)【優先権主張番号】202111026802.6
(32)【優先日】2021-09-02
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】514322098
【氏名又は名称】ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus, No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【弁理士】
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】グオシュヨン ジャン
(72)【発明者】
【氏名】コォヤオ ワーン
(72)【発明者】
【氏名】ハオチュヨン フオン
(72)【発明者】
【氏名】ハイシヤオ ユエ
【審査官】武田 広太郎
(56)【参考文献】
【文献】特開2017-224184(JP,A)
【文献】特開2020-101856(JP,A)
【文献】米国特許出願公開第2020/0202253(US,A1)
【文献】特開2017-111731(JP,A)
【文献】原 佑輔 ほか,車載カメラを用いたCNNによる方向別歩行者頭部検出法の提案 Proposal of Head Detection Method Based on CNN Using Drive Recorders,情報処理学会 研究報告 高度交通システムとスマートコミュニティ(ITS) 2016-ITS-067 [online] ,日本,情報処理学会,2017年
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
生体検出モデルのトレーニング装置が実行する、生体検出モデルのトレーニング方法であって、
生体検出モデルをトレーニングするためのトレーニングセットおよびテストセットを構築することと、
前記トレーニングセットに基づいて、予め設定された生体検出モデルをトレーニングし、第1生体検出モデルを取得することと、
前記テストセットに基づいて第1生体検出モデルをトレーニングし、テスト結果を生成することと、
前記テスト結果に基づいて前記テストセットを分析し、第1サンプルデータを取得することと、
第1サンプルデータに基づいて、トレーニングセット、テストセットを更新して、前記生体検出モデルをさらにトレーニングすることとを含み、
前記第1サンプルデータに基づいてトレーニングセット、テストセットを更新することは、第1サンプルデータにおいてそれぞれ一部のサンプルデータを抽出してトレーニングセットおよびテストセットに加え、更新後のトレーニングセットと更新後のテストセットを構成することを含み、
第1サンプルデータにおいてそれぞれ一部のサンプルデータを抽出してトレーニングセットおよびテストセットに加え、更新後のトレーニングセットと更新後のテストセットを構成することは、
前記第1サンプルデータにおいて、予め設定されたサンプリングレートで第2サンプルデータを抽出し、抽出された第2サンプルデータをトレーニングセットに加え、更新後のトレーニングセットを構成し、第2サンプルデータを除く第1サンプルデータをテストセットに加え、更新後のテストセットを構成することと、
予め設定されたサンプリングレートを予め設定された減衰率で減衰更新し、減衰更新後のサンプリングレートを取得することと、
更新されたトレーニングセットと更新されたテストセットに基づいて生体検出モデルをトレーニングすることと、
トレーニングステップを反復的に実行し、生体検出モデルが予め設定された精度に収束したと判断すると、トレーニングを停止し、トレーニングされた生体検出モデルを出力することとを含む生体検出モデルのトレーニング方法。
【請求項2】
前記生体検出モデルをトレーニングするためのトレーニングセットおよびテストセットを構築することは、混合データセットに基づいてトレーニングセットおよびテストセットを構築することを含み、前記混合データセットは新データおよび元データを含む請求項1に記載の方法。
【請求項3】
前記混合データセットに基づいてトレーニングセットおよびテストセットを構築することは、前記混合データセットにおいてランダムサンプリングを行うことと、サンプリングされたデータをトレーニングセットとして構成することと、サンプリングされたデータ以外のデータをテストセットとして構成することとを含む、請求項2に記載の方法。
【請求項4】
前記テスト結果に基づいて前記テストセットを分析し、第1サンプルデータを取得することは、
テスト結果に基づいてテストセットにおけるデータを採点して予測スコアを取得し、前記予測スコアに基づいてテストセットにおけるデータをソーティングし、前記予測スコアが所定閾値を満たすデータを第1サンプルデータとして確定することを含む請求項1に記載の方法。
【請求項5】
前記混合データセットにおいてランダムサンプリングを行うことは、予め設定されたハイパーパラメータの初期サンプリングレートに基づいて、前記混合データセットにおいてランダムサンプリングを行うことを含む請求項3に記載の方法。
【請求項6】
前記ハイパーパラメータの初期サンプリングレートは、0%より大きくかつ50%より小さい値をとる請求項に記載の方法。
【請求項7】
前記予め設定されたサンプリングレートは、0%より大きくかつ30%より小さい値をとる請求項に記載の方法。
【請求項8】
生体検出モデルのトレーニング装置であって、
生体検出モデルをトレーニングするためのトレーニングセットおよびテストセットを構築するための構築モジュールと、
前記トレーニングセットに基づいて予め設定された生体検出モデルをトレーニングし、第1生体検出モデルを取得し、前記テストセットに基づいて第1生体検出モデルをトレーニングし、テスト結果を生成するためのトレーニングモジュールと、
前記テスト結果に基づいて前記テストセットを分析し、第1サンプルデータを取得するためのサンプル取得モジュールと、
第1サンプルデータに基づいて、トレーニングセット、テストセットを更新して、前記生体検出モデルをさらにトレーニングするための更新モジュールとを含み、
前記更新モジュールは、第1サンプルデータにおいてそれぞれ一部のサンプルデータを抽出してトレーニングセットおよびテストセットに加え、更新後のトレーニングセットと更新後のテストセットを構成し、
前記更新モジュールは、
前記第1サンプルデータにおいて、予め設定されたサンプリングレートで第2サンプルデータを抽出し、抽出された第2サンプルデータをトレーニングセットに加え、更新後のトレーニングセットを構成し、第2サンプルデータを除く第1サンプルデータをテストセットに加え、更新後のテストセットを構成し、
予め設定されたサンプリングレートを予め設定された減衰率で減衰更新し、減衰更新後のサンプリングレートを取得し、
更新されたトレーニングセットと更新されたテストセットに基づいて生体検出モデルをトレーニングし、
トレーニングステップを反復的に実行し、生体検出モデルが予め設定された精度に収束したと判断すると、トレーニングを停止し、最終的にトレーニングされた生体検出モデルを出力する生体検出モデルのトレーニング装置。
【請求項9】
前記構築モジュールが生体検出モデルをトレーニングするためのトレーニングセットおよびテストセットを構築することは、混合データセットに基づいてトレーニングセットおよびテストセットを構築することを含み、前記混合データセットは新データおよび元データを含む請求項に記載の装置。
【請求項10】
前記構築モジュールが混合データセットに基づいてトレーニングセットおよびテストセットを構築することは、前記混合データセットにおいてランダムサンプリングを行うことと、サンプリングされたデータをトレーニングセットとして構成することと、サンプリングされたデータ以外のデータをテストセットとして構成することとを含む請求項に記載の装置。
【請求項11】
前記サンプル取得モジュールが前記テスト結果に基づいて前記テストセットを分析し、第1サンプルデータを取得することは、
テスト結果に基づいてテストセットにおけるデータを採点して予測スコアを取得し、前記予測スコアに基づいてテストセットにおけるデータをソーティングし、前記予測スコアが所定閾値を満たすデータを第1サンプルデータとして確定することを含む請求項に記載の装置。
【請求項12】
前記構築モジュールが前記混合データセットにおいてランダムサンプリングを行うことは、予め設定されたハイパーパラメータの初期サンプリングレートに基づいて、前記混合データセットにおいてランダムサンプリングを行うことを含む請求項10に記載の装置。
【請求項13】
前記構築モジュールが予め設定されたハイパーパラメータの初期サンプリングレートに基づいて、前記混合データセットにおいてランダムサンプリングを行うことは、前記ハイパーパラメータの初期サンプリングレートが、0%より大きくかつ50%より小さい値をとることを含む請求項12に記載の装置。
【請求項14】
前記サンプル取得モジュールは、0%より大きくかつ30%より小さい予め設定されたサンプルレートを予め設定された減衰率で減衰更新するために用いられる請求項に記載の装置。
【請求項15】
電子機器であって、
少なくとも1つのプロセッサ、および
前記少なくとも1つのプロセッサに通信接続されたメモリを含み、
前記メモリは、前記少なくとも1つのプロセッサによって実行可能な命令を記憶し、前記命令は前記少なくとも1つのプロセッサによって実行されることにより、前記少なくとも1つのプロセッサに請求項1乃至7の何れかに記載の方法を実行させる電子機器。
【請求項16】
コンピュータに請求項1乃至7の何れかに記載の方法を実行させるためのコンピュータ命令が記憶された非一時的コンピュータ可読記憶媒体。
【請求項17】
プロセッサによって実行されると、請求項1乃至7の何れかに記載の方法を実現するコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は人工知能技術分野に関し、具体的には、コンピュータ視覚と深層学習技術の分野に関し、顔認識などのシーンに応用することができる。
【背景技術】
【0002】
顔生体検出は、すなわち1枚の画像が真の人間の撮影であるか否かを区別することであり、顔認識システムの基本モジュールであり、顔認識システムの安全性を保証する。深層学習技術を用いた顔生体検出方法は、現在、当分野の主流であり、従来の方法に比べて精度が大幅に向上している。しかしながら、実際の応用では、顔アタックサンプルの多様化により、様々なアタック方式は絶えず出現し、最適化されたモデルはまだ見ていない新しいアタックに対して抵抗能力が非常に限られており、トレーニングコストが高く、効率が低い。
【発明の概要】
【0003】
本開示は生体検出モデルのトレーニング方法、装置、電子機器および記憶媒体を提供する。
【0004】
本開示の一態様によれば、生体検出モデルをトレーニングするためのトレーニングセットおよびテストセットを構築することと、前記トレーニングセットに基づいて予め設定された生体検出モデルをトレーニングし、第1生体検出モデルを取得することと、前記テストセットに基づいて第1生体検出モデルをトレーニングし、テスト結果を生成することと、前記テスト結果に基づいて前記テストセットを分析し、第1サンプルデータを取得することと、第1サンプルデータに基づいて、トレーニングセット、テストセットを更新して、前記生体検出モデルをさらにトレーニングすることとを含む生体検出モデルのトレーニング方法を提供する。
【0005】
本開示の他の一態様によれば、生体検出モデルをトレーニングするためのトレーニングセットおよびテストセットを構築するための構築モジュールと、前記トレーニングセットに基づいて予め設定された生体検出モデルをトレーニングし、第1生体検出モデルを取得し、前記テストセットに基づいて第1生体検出モデルをトレーニングし、テスト結果を生成するためのトレーニングモジュールと、前記テスト結果に基づいて前記テストセットを分析し、第1サンプルデータを取得するためのサンプル取得モジュールと、第1サンプルデータに基づいて、トレーニングセット、テストセットを更新して、前記生体検出モデルをさらにトレーニングするための更新モジュールとを含む生体検出モデルのトレーニング装置を提供する。
【0006】
本開示の別の態様によれば、電子機器を提供し、前記電子機器は、少なくとも1つのプロセッサ、および前記少なくとも1つのプロセッサに通信接続されたメモリを含み、前記メモリは、前記少なくとも1つのプロセッサによって実行可能な命令を記憶し、前記命令は前記少なくとも1つのプロセッサによって実行されることにより、前記少なくとも1つのプロセッサに以上に記載の方法を実行させる。
【0007】
本開示の別の態様によれば、コンピュータに以上に記載の方法を実行させるためのコンピュータ命令が記憶された非一時的コンピュータ可読記憶媒体を提供する。
【0008】
本開示の別の態様によれば、プロセッサによって実行されると、以上に記載の方法を実現するコンピュータプログラムを含むコンピュータプログラム製品を提供する。
【0009】
本開示はデータ層からサンプルマイニングの思想を導入し、大量の冗長性の、指導意義のないサンプルを効果的に減少させ、モデルトレーニング効率を向上させることができる。
【0010】
理解すべきことは、この部分に説明される内容が、本開示の実施例の要点または重要な特徴を示すことを意図しておらず、本開示の保護範囲を限定するためのものではないことである。本開示の他の特徴は、以下の明細書によって理解されやすくなる。
【図面の簡単な説明】
【0011】
図面は、本発明をより良く理解するためのものであり、本開示に対する制限を構成しない。
図1】本発明の第1実施例による生体検出モデルのトレーニング方法を示す図である。
図2】本発明の第2実施例による生体検出モデルのトレーニング方法を示す図である。
図3】本開示の第3実施例による生体検出モデルのトレーニング装置の構成を示す図である。
図4】本開示の実施例に係る生体検出モデルのトレーニング方法を実現するための電子機器のブロック図である。
【発明を実施するための形態】
【0012】
以下、図面に合わせて本開示の例示的な実施例を説明して、それに含まれる本開示の実施例における様々な詳細が理解を助けるためので、それらは単なる例示的なものと考えられるべきである。したがって、当業者であれば、本開示の範囲および精神から逸脱することなく、本明細書で説明される実施例に対して様々な変更および修正を行うことができることを理解すべきである。同様に、明瞭と簡潔のために、以下の説明では公知の機能および構造についての説明を省略する。
【0013】
本開示の実施例では、新データは生体検出モデルが最適化された後に新しく出現する新しい顔アタックサンプルデータを指す。元データとは、生体検出モデルが本来トレーニングされる際に用いられるデータを意味する。
【0014】
本開示はハードサンプルマイニングに基づく生体検出モデルのトレーニング方法を提供し、新データと元データとの混合を用いてモデルを再トレーニングすることでモデルの破滅的な忘れ問題による精度損失を解決し、同時にハードサンプルマイニングの思想に基づいて、トレーニングサンプルにおけるハードサンプルの割合を向上させることによって、冗長サンプルを減少し、モデルトレーニング効率を向上させ、また、モデルをハードサンプルに一層注目させ、モデルの検査性能を向上させる。
【0015】
図1は、本開示の第1実施例による生体検出モデルのトレーニング方法を示す図である。図1に示すように、本開示の第1実施例に係る生体検出モデルのトレーニング方法は、以下のステップを含む。
【0016】
ステップ101では、生体検出モデルをトレーニングするためのトレーニングセットおよびテストセットを構築する。
【0017】
前記生体検出モデルをトレーニングするためのトレーニングセットおよびテストセットを構築することは、混合データセットに基づいてトレーニングセットおよびテストセットを構築することを含み、前記混合データセットは新データおよび元データを含む。
【0018】
新データおよび元データを用いて混合データセットを構成し、かつ混合データセットに基づいてトレーニングセットおよびテストセットを構築することにより、モデルの破滅的な忘れ問題による精度損失を解決することができる。
【0019】
前記混合データセットに基づいてトレーニングセットおよびテストセットを構築することは、前記混合データセットにおいてランダムサンプリングを行うことと、サンプリングされたデータをトレーニングセットとして構成することと、サンプリングされたデータ以外のデータをテストセットとして構成することを含む。
【0020】
混合データセットにおいてランダムサンプリングを行うことにより初期トレーニングセットおよび初期テストセットを構成することで、モデルに対するトレーニング効果をより良く実現することができる。
【0021】
前記混合データセットにおいてランダムサンプリングを行うことは、予め設定されたハイパーパラメータの初期サンプリングレートに基づいて、前記混合データセットにおいてランダムサンプリングを行うことを含む。
【0022】
ランダムサンプリングのハイパーパラメータの初期サンプリングレートを設定することにより、ランダムサンプリングの指標を具体的に限定することができる。
【0023】
ここで、本実施例では、前記ハイパーパラメータの初期サンプリングレートは0%より大きくかつ50%より小さい値をとる。もちろん、実際の応用では、必要に応じてハイパーパラメータの初期サンプリングレートに他の設定を行ってもよく、本開示はこれについて限定しない。
【0024】
ハイパーパラメータの初期サンプリングレートの値を選択することによって、実際の応用のガイドラインを提供し、本開示の実施例の具体的な実現方法を提供し、実際の応用における選択を容易にする。
【0025】
ステップ102では、前記トレーニングセットに基づいて予め設定された生体検出モデルをトレーニングし、第1生体検出モデルを取得する。
【0026】
ステップ103では、前記テストセットに基づいて第1生体検出モデルをトレーニングし、テスト結果を生成する。
【0027】
ステップ104では、前記テスト結果に基づいて前記テストセットを分析し、第1サンプルデータを取得する。
【0028】
本開示の実施例では、前記テスト結果に基づいて前記テストセットを分析し、第1サンプルデータを取得することは、テスト結果に基づいてテストセットにおけるデータを採点して予測スコアを取得し、前記予測スコアに基づいてテストセットにおけるデータをソーティングし、前記予測スコアが所定閾値を満たすデータを第1サンプルデータとして確定することを含む。
【0029】
したがって、本発明の実施例は第1サンプルデータを取得する具体的な実現方法を実現し、第1サンプルデータすなわちハードサンプルデータのマイニングを実現し、これによってマイニングされた第1サンプルデータを用いてモデルをトレーニングすることができ、トレーニングサンプルにおけるハードサンプルの割合を向上させることによって、冗長サンプルを減少させ、モデルトレーニング効率を向上させ、同時にモデルをハードサンプルに一層注目させ、モデルの検出性能を向上させる。
【0030】
ステップ105では、第1サンプルデータに基づいて、トレーニングセット、テストセットを更新して、前記生体検出モデルをさらにトレーニングする。
【0031】
前記第1サンプルデータに基づいてトレーニングセット、テストセットを更新することは、第1サンプルデータにおいてそれぞれ一部のサンプルデータを抽出してトレーニングセットおよびテストセットに加え、更新後のトレーニングセットと更新後のテストセットを構成することを含む。
【0032】
本開示の実施例は第1サンプルデータすなわちハードサンプルデータのそれぞれにおいて一部のサンプルデータを抽出して更新後のトレーニングセットおよび更新後のテストセットを構成することによって、トレーニング過程全体に使用されるデータは完全な新データプラス元データではなく、その中の一部のサンプルであり、さらにハードサンプルであってもよく、トレーニングサンプルにおけるハードサンプルの割合を向上させることによって、冗長サンプルを減少させ、モデルトレーニング効率を向上させると同時に、モデルをハードサンプルに一層注目させ、モデルの検出性能を向上させる。
【0033】
第1サンプルデータにおいてそれぞれ一部のサンプルデータを抽出してトレーニングセットおよびテストセットに加え、更新後のトレーニングセットと更新後のテストセットを構成することは、前記第1サンプルデータにおいて、予め設定されたサンプリングレートで第2サンプルデータを抽出し、抽出された第2サンプルデータをトレーニングセットに加え、更新後のトレーニングセットを構成し、第2サンプルデータを除く第1サンプルデータをテストセットに加え、更新後のテストセットを構成することと、予め設定されたサンプリングレートを予め設定された減衰率で減衰更新し、減衰更新後のサンプリングレートを取得することと、更新されたトレーニングセットと更新されたテストセットに基づいて生体検出モデルをトレーニングすることと、トレーニングステップを反復的に実行し、生体検出モデルが予め設定された精度に収束したと判断すると、トレーニングを停止し、最終的にトレーニングされた生体検出モデルを出力することとを含む。
【0034】
本開示の実施例では、前記予め設定されたサンプリングレートは、0%より大きくかつ30%より小さい値をとる。もちろん、実際の応用では、必要に応じて予め設定されたサンプリングレートに他の設定を行ってもよく、本開示はこれについて限定しない。サンプリングレート値の参考を与えることによって、本開示の具体的な実施例の実現を示し、実際の応用のガイドラインを提供し、実際の応用における選択を容易にする。
【0035】
トレーニング過程全体で使われるデータは完全な新データプラス元データではなく、その中の一部のサンプルであり、トレーニング過程で次第にデータをトレーニングセットに加えるが、加えた割合は指数的に減衰するため、ハードサンプルマイニングに基づくトレーニング方法で使われるデータは完全な全データよりはるかに小さく、これはモデルのトレーニング効率を大幅に向上させる。
【0036】
図2に示すように、本発明の第2実施例による生体検出モデルのトレーニング方法を示す図である。前記生体検出モデルのトレーニング方法は以下のステップを含む。
【0037】
ステップ201では、データセットΦ、初期サンプリングレートρを入力し、ハードサンプルレート
(外1)
を設定し、減衰率εを設定し、新データ+元データの混合データセットΦを含むモデルトレーニングの入力を与え、ハイパーパラメータの初期サンプリングレートρを設定し、モデルの初期開始トレーニングのトレーニングセットの分割に使用し、データセットΦにおいて、ハイパーパラメータの初期サンプリングレートρで定量のデータをランダムにサンプリングして初期トレーニングセットΦtrainを構成し、ハイパーパラメータの初期サンプリングレートρは0%より大きくかつ50%より小さい値をとる。ハードサンプルレート
(外2)
を設定し、データにおけるハードサンプルの割合を仮定するために用いられ、0%より大きくかつ30%より小さい値をとる。減衰率εを設定し、ハードサンプルレートの減衰を特徴付けるために用いられ、モデルが次第に収束するにつれて、データ中に残っているハードサンプルの割合が次第に減少し、したがって、減衰率はハードサンプルレートの減衰程度を特徴付けるために用いられる。ここでは、ハイパーパラメータの初期サンプリングレート、ハードサンプルレート、減衰率はすべて応用ニーズに応じて人為的に設定することができる。このようにして様々な異なる応用ニーズを満たすことができ、より良いモデルトレーニング効果を達成する。
【0038】
ステップ202では、ハイパーパラメータの初期サンプリングレートρに基づいてデータセットΦを均一に用いて初期トレーニングセット
(外3)
を構成し、残りのデータは初期テストセット
(外4)
を構成するために使用される。
【0039】
ステップ203では、Φtrainにおいてモデルをトレーニングし、Φtestにおいてモデルをテストし、Φtestにおけるサンプルを予測スコアに従ってソーティングする。
【0040】
モデルは、まずトレーニングセットΦtrainにおいて一定の反復回数のトレーニングを行い、続いてモデルを初期テストセットにおいてテストし、テストセットにおけるサンプルに対してサンプル予測スコアを採点し、予測スコアをソーティングし、ソーティングを行う目的はハードサンプルを選択することであり、閾値を設定することによって、この所定閾値の要件を満たすものをハードサンプルと確定することができる。このようにハードサンプルの確定方法を設定することで、ハードサンプルをよりうまく見つけることができる。理論的には、正のサンプルの予測スコアは1であり、負のサンプルの予測スコアは0であり、正のサンプルの予測スコアが1よりもはるかに小さい(例えば、0.5よりも小さい)場合、このサンプルはハードサンプルと考えられる。同様に、負のサンプルの予測スコアが0よりはるかに大きい場合、このサンプルもハードサンプルと考えられる。
【0041】
ステップ204では、Φtestにおけるサンプルにハードサンプル抽出を行い、トレーニングセットおよびテストセットを、
(外5)

(外6)

(外7)
のように更新する。
【0042】
設定されたハードサンプルレートに応じて、Φtestにおいて、予測スコアに基づいて、低予測スコアの正のサンプルと高予測スコアの負のサンプルを抽出し、サンプリングレートはハードサンプルレート
(外8)
であり、抽出されたサンプルをトレーニングセットに戻し、それによってトレーニングセット
(外9)
とテストセット
(外10)
を更新し、それと同時に、ハードサンプルレートを
(外11)
のように減衰更新する。
【0043】
ステップ205では、モデルが予め設定された精度に収束したか否かを判断し、そうであれば終了し、トレーニングを停止し、そうでなければステップ203に移行して実行する。
【0044】
モデルは漸進的なハードサンプルマイニングという方法を用いるため、抽出されるサンプルは大きい確率でモデルがハードサンプルと考えるものであり、トレーニング過程において、ハードサンプルを絶えず抽出してトレーニングセットに戻すため、トレーニングセットにおけるハードサンプルの割合は次第に増大する。ハードサンプルトレーニングは効果的であるため、モデルの予め設定された精度はかなり向上する。
【0045】
本開示のキーポイントは、モデルへのハードサンプルマイニングのモデリング過程であり、漸進式ハードサンプルマイニングの思想を通じて、トレーニングサンプルにおけるハードサンプルの割合を向上させ、トレーニングセットにおける冗長サンプルを減少させ、それによってモデルのトレーニング効率を向上させる。また、モデルの性能も向上させ、すなわち、ハードサンプルを用いてより良いトレーニング効果を達成するため、モデル予測の正確率を向上させる。従来のトレーニング方式と比較して、漸進式ハードサンプルマイニングのトレーニング方法を用いて、トレーニングコストを大幅に削減することができ、生体検出モデルを後期に絶えず迅速に反復最適化させることができる。
【0046】
以上から分かるように、本開示はハードサンプルマイニングに基づいて生体検出モデルをトレーニングする方法を設計し、この方法は漸進的にエンドからエンドまで動的にハードサンプルを選択してトレーニングすることを実現でき、大量の冗長性の指導意義のないサンプルを効果的に減少させることができ、これによって生体検出のトレーニング効率を向上させ、さらに検出モデルの性能を向上させることができる。
【0047】
顔の生体検出は顔関連分野の基礎技術の一つであり、安全、出勤考査、金融、セキュリティ通行などの多くのシーンに応用されている。現在の多くの業務に広く応用されている。本開示を用いて生体モデル後期の最適化コストを削減し、最適化効率を向上させ、データ増加に伴うモデルの成長効果を最大限に提供する。トレーニング効率を向上させるために、トレーニング時間を減少させ、効率が高くなれば、データを増やしてよりうまくトレーニングすることができ、トレーニングできるデータがますます多くなり、データの成長性がよくなり、業務項目の更なる普及に有利である。
【0048】
本開示で設計するトレーニング方法は任意の顔生体の深層学習ニューラルネットワークモデルの最適化に応用することができ、モデルの最適化効率を向上させることに役立つ。この方法はハードサンプルの割合を向上させることによって顔生体検出モデルの性能を向上させ、定期的に継続的に最適化する必要のある顔生体検出モデルの応用シーンに応用することができる。
【0049】
図3に示すように、本開示の第3実施例による生体検出モデルのトレーニング装置の構成を示す図であり、前記生体検出モデルのトレーニング装置は、生体検出モデルをトレーニングするためのトレーニングセットおよびテストセットを構築するための構築モジュール301と、前記トレーニングセットに基づいて予め設定された生体検出モデルをトレーニングし、第1生体検出モデルを取得し、前記テストセットに基づいて第1生体検出モデルをトレーニングし、テスト結果を生成するためのトレーニングモジュール302と、前記テスト結果に基づいて前記テストセットを分析し、第1サンプルデータを取得するためのサンプル取得モジュール303と、第1サンプルデータに基づいて、トレーニングセット、テストセットを更新して、前記生体検出モデルをさらにトレーニングするための更新モジュール304とを含む。
【0050】
本開示の実施例では、前記構築モジュール301が生体検出モデルをトレーニングするためのトレーニングセットおよびテストセットを構築することは、混合データセットに基づいてトレーニングセットおよびテストセットを構築することを含み、前記混合データセットは新データおよび元データを含む。
【0051】
本開示の実施例では、前記構築モジュール301が混合データセットに基づいてトレーニングセットおよびテストセットを構築することは、前記混合データセットにおいてランダムサンプリングを行うことと、サンプリングされたデータをトレーニングセットとして構成することと、サンプリングされたデータ以外のデータをテストセットとして構成することとを含む。
【0052】
本開示の実施例では、前記サンプル取得モジュール303が前記テスト結果に基づいて前記テストセットを分析し、第1サンプルデータを取得することは、テスト結果に基づいてテストセットにおけるデータを採点して予測スコアを取得し、前記予測スコアに基づいてテストセットにおけるデータをソートし、前記予測スコアが所定閾値を満たすデータを第1サンプルデータとして確定することを含む。
【0053】
本開示の実施例では、前記サンプル取得モジュール303が第1サンプルデータに基づいてトレーニングセット、テストセットを更新することは、第1サンプルデータにおいてそれぞれ一部のサンプルデータを抽出してトレーニングセットおよびテストセットに加え、更新後のトレーニングセットと更新後のテストセットを構成することを含む。
【0054】
本開示の実施例では、前記サンプル取得モジュール303が第1サンプルデータにおいてそれぞれ一部のサンプルデータを抽出してトレーニングセットおよびテストセットに加え、更新後のトレーニングセットと更新後のテストセットを構成することは、前記第1サンプルデータにおいて、予め設定されたサンプリングレートで第2サンプルデータを抽出し、抽出された第2サンプルデータをトレーニングセットに加え、更新後のトレーニングセットを構成し、第2サンプルデータを除く第1サンプルデータをテストセットに加え、更新後のテストセットを構成することと、予め設定されたサンプリングレートを予め設定された減衰率で減衰更新し、減衰更新後のサンプリングレートを取得することと、更新されたトレーニングセットと更新されたテストセットに基づいて生体検出モデルをトレーニングすることと、トレーニングステップを反復的に実行し、生体検出モデルが予め設定された精度に収束したと判断すると、トレーニングを停止し、最終的にトレーニングされた生体検出モデルを出力することとを含む。
【0055】
本開示の実施例では、前記構築モジュール301が前記混合データセットにおいてランダムサンプリングを行うことは、予め設定されたハイパーパラメータの初期サンプリングレートに基づいて、前記混合データセットにおいてランダムサンプリングを行うことを含む。
【0056】
本開示の実施例では、前記構築モジュール301が予め設定されたハイパーパラメータの初期サンプリングレートに基づいて、前記混合データセットにおいてランダムサンプリングを行うことは、前記ハイパーパラメータの初期サンプリングレートが、0%より大きくかつ50%より小さい値をとることを含む。
【0057】
本開示の実施例では、前記サンプル取得モジュール303が0%より大きくかつ30%より小さい値をとる、予め設定されたサンプルレートを予め設定された減衰率で減衰更新するために用いられる。
【0058】
本開示の技術案では、係るユーザ個人情報の収集、記憶、使用、加工、伝送、提供と公開などの処理は、すべて関連法律法規の規定に符合し、かつ公序良俗に違反しない。
【0059】
本開示の実施例によれば、本開示は、電子機器、コンピュータ命令が記憶された非一時的コンピュータ可読記憶媒体およびコンピュータプログラム製品をさらに提供する。
【0060】
図4は本開示の実施例を実施できる例示的な電子機器400を示すブロック図である。電子機器は、様々な形態のデジタルコンピュータ、例えば、ラップトップ型コンピュータ、デスクトップ型コンピュータ、ワークステーション、パーソナル・デジタル・アシスタント、サーバ、ブレードサーバ、大型コンピュータ、その他の適切なコンピュータを示す。電子機器は更に、様々な形態の移動装置、例えば、個人デジタルプロセッサ、セルラー電話、スマートフォン、着用可能な装置とその他の類似する計算装置を示してもよい。本明細書に示される部品、これらの接続関係およびこれらの機能は例示的なものに過ぎず、本明細書に説明した本開示および/または請求した本開示の実現を制限しない。
【0061】
図4に示すように、機器400は、計算ユニット401を含み、それはリードオンリーメモリ(ROM)402に記憶されるコンピュータプログラムまた記憶ユニット408からランダムアクセスメモリ(RAM)403にロードされるコンピュータプログラムによって、種々の適当な操作と処理を実行することができる。RAM 403において、更に機器400を操作するために必要な様々なプログラムとデータを記憶してもよい。計算ユニット401、ROM 402およびRAM 403はバス404によって互いに接続される。入力/出力(I/O)インターフェース405もバス404に接続される。
【0062】
機器400における複数の部品はI/Oインターフェース405に接続され、複数の部品は、キーボード、マウスなどの入力ユニット406、様々なタイプのディスプレイ、スピーカーなどの出力ユニット407、磁気ディスク、光ディスクなどの記憶ユニット408、およびネットワークカード、モデム、無線通信送受信機などの通信ユニット409を含む。通信ユニット409は、機器400が例えばインターネットなどのコンピュータネットワークおよび/または様々な電気通信ネットワークを介して他の機器と情報/データを交換することを可能にする。
【0063】
計算ユニット401は処理および計算能力を有する様々な汎用および/または専用の処理コンポーネントであってもよい。計算ユニット401の例には、中央処理ユニット(CPU)、グラフィックス処理ユニット(GPU)、様々な専用人工知能(AI)計算チップ、様々な機械学習モデルアルゴリズムを実行する計算ユニット、デジタル信号プロセッサ(DSP)、および任意の適当なプロセッサ、コントローラ、マイクロコントローラなどが含まれるがこれらに限定されないことである。計算ユニット401は、例えば生体検出モジュールトレーニング方法などの以上に記載の各方法および処理を実行する。例えば、いくつかの実施例では、生体検出モジュールトレーニング方法はコンピュータソフトウェアプログラムとして実現されてもよく、機械可読媒体、例えば、記憶ユニット408に有形に含まれる。いくつかの実施例では、コンピュータプログラムの一部または全てはROM 402および/または通信ユニット409を経由して機器400にロードおよび/またはインストールされてもよい。コンピュータプログラムがRAM 403にロードされて計算ユニット401によって実行される場合、以上で説明される生体検出モジュールトレーニング方法の1つまたは複数のステップを実行することができる。代替的に、別の実施例では、計算ユニット401は他のいかなる適切な方式で(例えば、ファームウェアにより)生体検出モジュールトレーニング方法を実行するように構成されてもよい。
【0064】
本明細書で上述したシステムおよび技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールド・プログラマブル・ゲート・アレイ(FPGA)、特定用途向け集積回路(ASIC)、特定用途向け標準製品(ASSP)、システムオンチップ(SOC)、ロードプログラマブル論理デバイス(CPLD)、ソフトウェア・ハードウェア、ファームウェア、ソフトウェア、および/またはこれらの組み合わせにおいて実装することができる。これらの様々な実施形態は、1つまたは複数のコンピュータプログラムに実施され、この1つまたは複数のコンピュータプログラムは少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステムで実行しおよび/または解釈してもよく、このプログラマブルプロセッサは専用または汎用プログラマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置、少なくとも1つの出力装置からデータと命令を受信し、データと命令をこの記憶システム、この少なくとも1つの入力装置、この少なくとも1つの出力装置に送信してもよいこと、を含んでもよい。
【0065】
本開示の方法を実施するプログラムコードは1つまたは複数のプログラミング言語のいかなる組み合わせで書かれてもよい。これらのプログラムコードを汎用コンピュータ、特殊目的のコンピュータまたは他のプログラマブルデータ処理装置のプロセッサまたはコントローラに提供してよく、よってプログラムコードはプロセッサまたはコントローラにより実行される時にフローチャートおよび/またはブロック図に規定の機能/操作を実施する。プログラムコードは完全に機械で実行されてよく、部分的に機械で実行されてよく、独立ソフトウェアパッケージとして部分的に機械で実行されかつ部分的に遠隔機械で実行されてよく、または完全に遠隔機械またはサーバで実行されてもよい。
【0066】
本開示のコンテキストにおいて、機械可読媒体は有形の媒体であってもよく、命令実行システム、装置またはデバイスに使用されるまたは命令実行システム、装置またはデバイスに結合されて使用されるプログラムを具備または記憶してもよい。機械可読媒体は機械可読信号媒体または機械可読記憶媒体であってもよい。機械可読媒体は、電子、磁気、光学、電磁、赤外線、または半導体システム、装置またはデバイス、または上記内容のいかなる適切な組み合わせを含んでもよいが、これらに限定されない。機械可読記憶媒体のより具体的な例は、1つまたは複数のリード線による電気接続、ポータブルコンピュータディスク、ハードディスク、ランダム・アクセス・メモリ(RAM)、読み出し専用メモリ(ROM)、消去可能なプログラマブル読み出し専用メモリ(EPROMまたはフラッシュメモリ)、光ファイバー、ポータブルコンパクトディスク読み出し専用メモリ(CD-ROM)、光記憶装置、磁気記憶装置、または上記内容のいかなる適切な組み合わせを含む。
【0067】
ユーザとのインタラクションを提供するために、コンピュータにはここで説明したシステムと技術を実施してよく、このコンピュータは、ユーザに情報を表示する表示装置(例えば、CRT(陰極線管、Cathode Ray Tube)またはLCD(液晶ディスプレイ、Liquid Crystal Display)監視モニタ)およびキーボードとポインティング装置(例えば、マウスやトラックボール)を備え、ユーザはこのキーボードとこのポインティング装置を介してコンピュータに入力してもよい。その他の種類の装置は更に、ユーザとのインタラクションを提供してもよい。例えば、ユーザに提供するフィードバックはいかなる形態の感覚フィードバック(例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック)であってもよく、いかなる形態(音入力、音声入力、または触覚入力を含む)でユーザからの入力を受信してもよい。
【0068】
ここで述べたシステムや技術は、バックステージ部材を含む計算システム(例えば、データサーバとして)や、ミドルウェア部材を含む計算システム(例えば、アプリケーションサーバ)や、フロントエンド部材を含む計算システム(例えば、グラフィカルユーザインタフェースやウェブブラウザを有するユーザコンピュータ、ユーザが、そのグラフィカルユーザインタフェースやウェブブラウザを通じて、それらのシステムや技術の実施形態とのインタラクティブを実現できる)、あるいは、それらのバックステージ部材、ミドルウェア部材、あるいはフロントエンド部材の任意の組み合わせからなる計算システムには実施されてもよい。システムの部材は、任意の形式や媒体のデジタルデータ通信(例えば、通信ネットワーク)により相互に接続されてもよい。通信ネットワークの一例は、例えば、ローカルネットワーク(LAN)、広域ネットワーク(WAN)、インターネットを含む。
【0069】
コンピュータシステムは、クライアント側とサーバを含んでもよい。クライアント側とサーバは、一般的に相互に遠く離れ、通常、通信ネットワークを介してインタラクションを行う。互にクライアント側-サーバという関係を有するコンピュータプログラムを対応するコンピュータで運転することによってクライアント側とサーバの関係を生成する。サーバは、クラウドサーバであってもよく、分散型システムのサーバでも、またはブロックチェーンと組み合わせたサーバであってもよい。
【0070】
理解すべきことは、前述した様々な形態のフローを用いて、ステップを改めて順位付け、増加又削除してもよいことである。例えば、本開示に記載された各ステップは、並行して実行してもよいし、順次実行してもよいし、異なる順序で実行させてもよいし、本開示に開示された技術案が所望する結果を実現できれば、本文はこれに限定されないことである。
【0071】
以上に記載の具体的な実施形態は、本開示の特許請求の範囲を限定するものではない。当業者が理解すべきことは、設計要求と他の要因に基づいて、様々な修正、組み合わせ、一部の組み合わせと代替を行うことができることである。本開示における精神および原則から逸脱することなく行われるいかなる修正、同等物による置換や改良などは、いずれも本開示の保護範囲に含まれるものである。
図1
図2
図3
図4