(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023138492
(43)【公開日】2023-10-02
(54)【発明の名称】ランダム化およびサンプル拒否を使用して、ディープニューラルネットワークにおける事前トレーニング済みシステムのロバストネスを向上させるためのシステムおよび方法
(51)【国際特許分類】
G06N 3/02 20060101AFI20230922BHJP
【FI】
G06N3/02
【審査請求】未請求
【請求項の数】20
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023043517
(22)【出願日】2023-03-17
(31)【優先権主張番号】17/698,556
(32)【優先日】2022-03-18
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.BLUETOOTH
2.ZIGBEE
3.JAVA
4.PYTHON
5.Java Script
(71)【出願人】
【識別番号】390023711
【氏名又は名称】ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング
【氏名又は名称原語表記】ROBERT BOSCH GMBH
【住所又は居所原語表記】Stuttgart, Germany
(71)【出願人】
【識別番号】591236068
【氏名又は名称】カーネギー-メロン ユニバーシティ
【氏名又は名称原語表記】CARNEGIE-MELLON UNIVERSITY
(74)【代理人】
【識別番号】100114890
【弁理士】
【氏名又は名称】アインゼル・フェリックス=ラインハルト
(74)【代理人】
【識別番号】100098501
【弁理士】
【氏名又は名称】森田 拓
(74)【代理人】
【識別番号】100116403
【弁理士】
【氏名又は名称】前川 純一
(74)【代理人】
【識別番号】100134315
【弁理士】
【氏名又は名称】永島 秀郎
(74)【代理人】
【識別番号】100162880
【弁理士】
【氏名又は名称】上島 類
(72)【発明者】
【氏名】ファーテメ シェイコレスラミ
(72)【発明者】
【氏名】ホアン ジャン
(72)【発明者】
【氏名】ヤン ヘンドリク メッツェン
(72)【発明者】
【氏名】ジェレミー ジーグ コルター
(72)【発明者】
【氏名】ワン-イー リン
(57)【要約】 (修正有)
【課題】機械学習ネットワークの重みを変更することなく、ロバストな分類器を構築する方法、システム及びプログラムを提供する。
【解決手段】教師なしハイブリッドセマンティックセグメンテーションは、入力データを受信し、入力データを使用して、入力データの摂動を含む摂動入力データセットを生成し、ノイズ除去済みデータセットを生成するノイズ除去器を使用して、摂動入力データセットをノイズ除去し、ノイズ除去済みデータセットを分類する事前トレーニング済み分類器と、ノイズ除去済みデータセットの分類を拒否するリジェクタとの双方に、ノイズ除去済みデータセットを送信し、トレーニング済みリジェクタを達成するために、ノイズ除去済み入力データセットを使用してリジェクタをトレーニングし、トレーニング済みリジェクタの取得に応答して、入力データに関連づけられた、分類にあたり無視される棄却分類を出力する。
【選択図】
図3
【特許請求の範囲】
【請求項1】
機械学習ネットワークをトレーニングするための、コンピュータ実装された方法であって、当該方法は以下のステップを含む、すなわち、
画像、レーダ、ソナーまたは音響の情報を表す入力データをセンサから受信するステップと、
前記入力データを使用して、摂動データを含む摂動入力データセットを生成するステップと、
前記摂動入力データセットをノイズ除去して、ノイズ除去済みデータセットを生成するステップと、
前記ノイズ除去済みデータセットを使用して前記機械学習ネットワークをトレーニングするステップであって、該機械学習ネットワークは、分類確率が、前記ノイズ除去済みデータセットの分類に関連づけられている分類閾値を下回ったならば、前記ノイズ除去済みデータセットを拒否するように構成されているステップと、
前記分類確率が前記分類閾値を下回ったことに応答して、前記入力データに関連づけられた、分類にあたり無視される棄却分類を出力するステップと
を含む、機械学習ネットワークをトレーニングするための、コンピュータ実装された方法。
【請求項2】
当該方法は、分類時に前記棄却分類に比べ多数決を有する最終分類を出力するステップを含む、コンピュータ実装された請求項1記載の方法。
【請求項3】
当該方法は、前記入力データに関連づけられた元のクラスに対するバイナリ検出器であるクラスごとのリジェクタを含む分類器を使用するステップを含む、コンピュータ実装された請求項1記載の方法。
【請求項4】
当該方法は、前記入力データを分類するように構成された事前トレーニング済み分類器、および前記ノイズ除去済みデータセットの分類を拒否するように構成されたリジェクタを使用するステップを含む、コンピュータ実装された請求項1記載の方法。
【請求項5】
前記事前トレーニング済み分類器はさらにノイズ除去器を含む、コンピュータ実装された請求項4記載の方法。
【請求項6】
当該方法は、前記ノイズ除去済みデータセットの複数回の反復を使用するステップを含む、コンピュータ実装された請求項1記載の方法。
【請求項7】
当該方法はさらに、前記入力データを分類するように構成された分類器を使用するステップを含む、コンピュータ実装された請求項1記載の方法。
【請求項8】
機械学習ネットワークを含むシステムであって、当該システムは、
カメラ、レーダ、ソナーまたはマイクロフォンを含むセンサから入力データを受信するように構成された入力インタフェースと、
該入力インタフェースと通信するプロセッサと
を含み、該プロセッサは以下のようにプログラミングされている、すなわち、
画像、レーダ、ソナーまたは音響の情報を表す入力データを受信し、
前記入力データを使用して、該入力データの摂動を含む摂動入力データセットを生成し、
ノイズ除去済みデータセットを生成するように構成されたノイズ除去器を使用して、前記摂動入力データセットをノイズ除去し、
前記ノイズ除去済みデータセットを分類するように構成された事前トレーニング済み分類器と、前記ノイズ除去済みデータセットの分類を拒否するように構成されたリジェクタとの双方に、前記ノイズ除去済みデータセットを送信し、
トレーニング済みリジェクタを達成するために、前記ノイズ除去済み入力データセットを使用して前記リジェクタをトレーニングし、
前記トレーニング済みリジェクタの取得に応答して、前記入力データに関連づけられた、分類にあたり無視される棄却分類を出力する
ようにプログラミングされている、
機械学習ネットワークを含むシステム。
【請求項9】
前記ノイズ除去器は事前トレーニング済みノイズ除去器である、請求項8記載のシステム。
【請求項10】
前記プロセッサはさらに、前記入力データに関連づけられた最終分類を出力するようにプログラミングされている、請求項8記載のシステム。
【請求項11】
前記リジェクタのトレーニングは、前記入力データに関連づけられたモンテカルロサンプリングを使用することを含む、請求項8記載のシステム。
【請求項12】
前記リジェクタは、パラメータ化されるように構成された1つの共通のバックボーンを含む、請求項8記載のシステム。
【請求項13】
前記ノイズ除去器は、入力に加わるガウスノイズを除去または緩和するように構成されている、請求項8記載のシステム。
【請求項14】
命令を格納するコンピュータプログラム製品であって、前記命令は、コンピュータにより実行されると該コンピュータに以下のことを行わせる、すなわち、
画像、レーダ、ソナーまたは音響の情報を表す入力データをセンサから受信し、
前記入力データを使用して、該入力データの摂動を含む摂動入力データセットを生成し、
ノイズ除去済みデータセットを生成するように構成された事前トレーニング済みノイズ除去器を使用して、前記入力データセットをノイズ除去し、
事前トレーニング済み分類器およびリジェクタを使用して、前記ノイズ除去済みデータセットを分類または拒否し、
前記ノイズ除去済みデータセットを使用して前記リジェクタをトレーニングし、該リジェクタは、分類確率が、前記ノイズ除去済みデータセットの分類に関連づけられている分類閾値を下回ったならば、前記ノイズ除去済みデータセットを拒否するように構成されており、
前記分類確率が前記分類閾値を下回ったことに応答して、前記入力データに関連づけられた、分類を無視する棄却分類を出力する、
命令を格納するコンピュータプログラム製品。
【請求項15】
前記入力データは、前記コンピュータと通信するカメラから受信された画像を含む、請求項14記載のコンピュータプログラム製品。
【請求項16】
命令はさらに前記コンピュータに指示して前記リジェクタをトレーニングさせ、トレーニングは、モンテカルロサンプリングを使用して定義された上界および下界を含む、請求項14記載のコンピュータプログラム製品。
【請求項17】
前記命令はさらに前記コンピュータに指示して、複数回の反復にわたり前記事前トレーニング済み分類器を使用して前記ノイズ除去済みデータセットを分類または拒否させる、請求項14記載のコンピュータプログラム製品。
【請求項18】
前記事前トレーニング済みノイズ除去器は、トレーニングされてガウスノイズを緩和またはガウスノイズを除去するように構成されている、請求項14記載のコンピュータプログラム製品。
【請求項19】
前記リジェクタのパラメータは、正しい分類と誤分類とを区別するよう、前記リジェクタのトレーニングを介して学習するように構成されている、請求項14記載のコンピュータプログラム製品。
【請求項20】
前記入力データは、マイクロフォンから取得された音響情報を含む、請求項14記載のコンピュータプログラム製品。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、機械学習を使用した画像(または他の入力)の拡張および処理に関する。
【0002】
背景技術
ディープラーニングモデルは、敵対的攻撃に対して脆弱であると言ってもさしつかえなく、この場合、入力画像における知覚できない小さな摂動によって、モデル予測が大幅に変えられてしまうおそれがある。敵対的攻撃に対し、多くの経験的防御メカニズムおよびトレーニング手順が提案されてきたが、他方ではそれらを打ち破るために、もっと強力な攻撃がその後に続いて行われることも少なくない。このような進展の結果として、ロバストな分類精度の下界を規定する防御手段が生じるに至り、これにはランダム化スムージングおよびそのバリエーションを含めることができる。とはいうものの、これらの防御手段の大半は、分類器を再トレーニングする一方で、クリーンな画像における精度も犠牲にする。これは望ましくない特性であると言ってもよく、いくつかの理由でかかる防御手段の配備を制限するものである。たとえば、再トレーニングは大幅に余分なリソースを必要とする可能性がある。これに加え、配備されたシステムは、クリーンな入力によるなど通常の環境下では、たいていの場合には動作することが期待されるであろうから、クリーン精度をかかる程度まで低減するということは、十中八九、これらの方法が大部分の実際の状況において配備されることはない、ということを意味する。
【0003】
ランダム化スムージングは一般に、事前トレーニング済み分類器には直接的に効力が及ぼされない可能性がある。具体的には、標準的な分類器は一般に、それらの分類器の入力のガウス摂動に対しロバストであるようにはトレーニングされていないため、入力がガウスノイズに晒されると(それによって小さなπAひいては小さな認証半径Rとなる)、既製の分類器の性能が著しく劣化する。
【0004】
所与のネットワークfの基礎となる重みを変更することなく、ロバストな分類器を構築する目的で、いくつかのシステムは、入力をfを通過させる前の前処理ステップとして、画像ノイズ除去器を使用することができ、ここではノイズ除去器は、ランダム化スムージングにおいて、入力に加わったガウスノイズを除去することを目的としている。具体的には、このことは、カスタムトレーニング済みノイズ除去器Dθ:Rd→Rdを用いて分類器fを拡張することによって行われ、これによりシステム全体が合成関数
【数1】
として表現される。
【0005】
かかるノイズ除去器を、複雑さのレベルが様々な種々の目標を用いてトレーニングすることができる。最も単純な目標は、再構成された画像の平均二乗誤差(MSE)または安定性損失の最小化であり、これによって、ノイズ除去済み画像の分類出力が(ノイズのない)元の画像xiの分類出力に近いままとなるように、ノイズ除去器の重みθが求められる。
【0006】
分類器をすぐにロバスト化するために、この目標を用いてノイズ除去モジュールをトレーニングすることは、うまくいくことが判明している一方、MSE損失最小化を使用するもっと安価なノイズ除去器を用いたトレーニング時間と比較して、トレーニング時間および複雑さを最大1桁増加させることを強いれば、最良のパフォーマンスが達成される。経験的な結果によって示されたのは、単純なMSE損失を用いてノイズ除去器をトレーニングし、それに続いて安定性損失に応じてそれを微調整することにより、ノイズ除去器のトレーニングの複雑さおよび照合されたロバストネス半径に関して、良好に調整されたパフォーマンスを提供できる、ということである。
【0007】
概要
第1の例示的な実施形態によれば、機械学習ネットワークをトレーニングするための、コンピュータ実装された方法が開示され、この方法は以下のステップを含む、すなわち画像、レーダ、ソナーまたは音響の情報を表す入力データをセンサから受信するステップと、入力データを使用して、摂動データを含む摂動入力データセットを生成するステップと、摂動入力データセットをノイズ除去して、ノイズ除去済みデータセットを生成するステップと、ノイズ除去済みデータセットを使用して機械学習ネットワークをトレーニングするステップであって、機械学習ネットワークは、分類確率が、ノイズ除去済みデータセットの分類に関連づけられている分類閾値を下回ったならば、ノイズ除去済みデータセットを拒否するように構成されているステップと、分類確率が分類閾値を下回ったことに応答して、入力データに関連づけられた、分類にあたり無視される棄却分類を出力するステップとを含む。
【0008】
第2の例示的な実施形態によれば、機械学習ネットワークを含むシステムが開示される。このネットワークは、カメラ、レーダ、ソナーまたはマイクロフォンを含むセンサから入力データを受信するように構成された入力インタフェースと、この入力インタフェースと通信するプロセッサとを含む。プロセッサは以下のようにプログラミングされている。すなわち画像、レーダ、ソナーまたは音響の情報を表す入力データを受信し、入力データを使用して、入力データの摂動を含む摂動入力データセットを生成し、ノイズ除去済みデータセットを生成するように構成されたノイズ除去器を使用して、摂動入力データセットをノイズ除去し、ノイズ除去済みデータセットを分類するように構成された事前トレーニング済み分類器と、ノイズ除去済みデータセットの分類を拒否するように構成されたリジェクタとの双方に、ノイズ除去済みデータセットを送信し、トレーニング済みリジェクタを達成するために、ノイズ除去済み入力データセットを使用してリジェクタをトレーニングし、トレーニング済みリジェクタの取得に応答して、入力データに関連づけられた、分類にあたり無視される棄却分類を出力するようにプログラミングされている。
【0009】
第3の例示的な実施形態によれば、命令を格納するコンピュータプログラム製品が開示され、この命令は、コンピュータにより実行されるとコンピュータに以下のことを行わせる、すなわち、画像、レーダ、ソナーまたは音響の情報を表す入力データをセンサから受信し、入力データを使用して、入力データの摂動を含む摂動入力データセットを生成し、ノイズ除去済みデータセットを生成するように構成された事前トレーニング済みノイズ除去器を使用して、入力データセットをノイズ除去し、事前トレーニング済み分類器およびリジェクタを使用して、ノイズ除去済みデータセットを分類または拒否し、ノイズ除去済みデータセットを使用してリジェクタをトレーニングし、リジェクタは、分類確率が、ノイズ除去済みデータセットの分類に関連づけられている分類閾値を下回ったならば、ノイズ除去済みデータセットを拒否するように構成されており、分類確率が分類閾値を下回ったことに応答して、入力データに関連づけられた、分類を無視する棄却分類を出力する。
【図面の簡単な説明】
【0010】
【
図1】ニューラルネットワークをトレーニングするためのシステム100を示す図である。
【
図2】ニューラルネットワークをトレーニングするための、コンピュータ実装された方法200を示す図である。
【
図3】教師なしハイブリッドセマンティックセグメンテーションのフローチャートを示す図である。
【
図4】教師なしハイブリッドセマンティックセグメンテーションを使用してネットワークをトレーニングするためのフローチャートを示す図である。
【
図5】コンピュータ制御機械10と制御システム12との間のインタラクションを示す概略図である。
【
図6】部分的に自律的な輸送手段または部分的に自律的なロボットとすることができる輸送手段を制御するように構成された、
図1の制御システムを示す概略図である。
【
図7】生産ラインの一部であるような製造システムのパンチカッター、カッタードリルまたはガンドリルといった製造機械を制御するように構成された、
図1の制御システムを示す概略図である。
【
図8】少なくとも部分的に自律的なモードを有する電動ドリルまたは電動ドライバなどの電動工具を制御するように構成された、
図1の制御システムを示す概略図である。
【
図9】自動パーソナルアシスタントを制御するように構成された、
図1の制御システムを示す概略図である。
【
図10】制御アクセスシステムまたはサーベイランスシステムといったような監視システムを制御するように構成された、
図1の制御システムを示す概略図である。
【
図11】撮像システム、たとえばMRI装置、X線撮像装置または超音波装置、を制御するように構成された、
図1の制御システムを示す概略図である。
【0011】
詳細な説明
ここでは本開示の実施形態について説明する。ただし、開示された実施形態は例示にすぎず、他の実施形態が様々な択一的形態をとることができる、ということを理解されたい。図面は必ずしも縮尺どおりではなく、いくつかの特徴は、特定の構成要素の詳細を示すために、誇張されているかまたは最小化されている場合もある。よって、本明細書に開示された特定の構造および機能の詳細は、限定するものであると解釈されるべきではなく、実施形態が多種多様に使用されることを当業者に教示するための代表的なベースにすぎないものとして解釈されたい。当業者には理解されるように、図面のいずれか1つを参照して図示および説明される様々な特徴を、1つまたは複数の他の図面に示される特徴と組み合わせて、明示的には図示または説明されていない実施形態を作り出すことができる。図示されている特徴の組み合わせによって、典型的な用途のための代表的な実施形態が提供される。しかしながら、本開示の教示と一致する特徴の様々な組み合わせおよび変形は、特定の用途または実装のためには望ましい可能性がある。
【0012】
本開示は、証明可能なロバストな(ワーストケース/敵対的)パフォーマンスを有する棄却(拒否)オプションによって、事前トレーニング済みニューラルネットワーク分類システムをロバスト化する方法に関する。分類器への敵対的攻撃に対する典型的な設定をfと称することにし、これを以下のようなものとすることができる。すなわち入力xが、fによって正しく分類される本当のラベルyを有するとするならば(つまり(x)=y)、攻撃者は、x+δがCによって間違って分離されるように(つまりf(x+δ)≠y)、小さい(理想的には人間が知覚できない)摂動δを見つけ出すことを目的とするであろう。ロバストネスであると主張できるのは、分類結果を変えてしまうような摂動が存在する可能性がない場合であり、換言すれば、「許容可能な摂動セット」内のすべての摂動させられた入力が、クリーンな(摂動させられていない)入力の結果と同じように元の結果をもたらす場合である。
【0013】
(拒否/棄却/検出を行わない)多数の研究によってトレーニング手順が提案されてきたが、それらのトレーニング手順では、結果として得られたロバスト化された分類器が証明可能な性能を有し、つまり摂動に対するノルム制約に応じて敵対的に摂動させられた画像について、誤り率(誤分類確率)に対する上界を有する。ロバストネスをもたらすためにランダム化が使用されるならば、以下のことを提供することができる。すなわち、(1)クリーンな入力画像が摂動させられ、ガウスノイズの種々の実現について分類され、(2)多数派クラスおよび次点クラスの確率が推定され、さらに(3)ロバストネスについて証明可能な保証が計算される。かかるネットワークを、自明でない性能に対するかかるガウス摂動拡張によってトレーニングする必要がある。
【0014】
これに加えて重要であるのは、敵対的摂動に対して事前トレーニング済みネットワークをロバスト化することである。1つの実施形態によって提案することができるのは、システムにノイズ除去器モジュールを追加すると共に、ランダム化の着想を活用することによってこれを行う、ということである。
【0015】
最終的に、実際の運用において重要であるのは、敵対的に摂動させられたサンプルを検出することである。しかしながら、文献において利用可能な検出方法すべてには、証明可能な性能が欠けており、検出を回避すると同時に誤分類も引き起こすよう、注意深く巧妙に作り上げた「適応摂動」を攻撃者が編み出したならば、検出に失敗することが判明した。
【0016】
いくつかの実施形態によれば、追加のクラスすなわちKクラスの分類タスクに対しK+1個のクラスを用いて、分類器をトレーニングすることが提案されており、この追加のクラスは「棄却クラス」と称される。このクラスに画像を分類することによって、分類器は、入力を他のKクラスのいずれかとして断言することを要するに棄却しており、したがって、敵対的入力を棄却する(あるいは検出または拒否する)と考えることができる。しかしながらこの研究は、証明可能な性能保証を有しておらず、トレーニングプロセスは本発明において提案したものとは異なる。
【0017】
本開示は、敵対的攻撃に対する事前トレーニング済みニューラルネットワークをロバスト化するための証明可能なロバストトレーニング手順を定式化する。提案されたシステムを、(1)事前トレーニング済み分類器と、(2)事前トレーニング済みノイズ除去器(画像対画像変換器)と、(3)提案されたモジュールすなわちクラスごとのリジェクタとから構成することができる。
【0018】
システムおよび方法は、ノイズ除去済みスムージングと共に拒否クラスを活用するアプローチを利用して、結果として得られたシステムの精度、特にクリーンな精度、を改善しながら、その望ましい特性を維持することができる(つまり事前トレーニング済み分類器のロバストなバージョンを作り出すことができる)。
【0019】
このシステムは、認定可能な精度を提供しつつ、事前トレーニング済み分類器をサンプル拒否によってロバスト化することができる。かかるアプローチにとって1つの鍵となるのは、低コストでトレーニング可能なクラスごとのリジェクタによって実現される拒否クラスを使用することであり、このリジェクタは、クリーンサンプルの予測と矛盾する予測を有するノイズの多いサンプルを拒否するようにトレーニングされる。必然的にこれによって、正しく分類された少数のサンプルも拒否されることになる可能性があるけれども、事前トレーニング済みノイズ除去器による全体的な認証半径が、以下の理由により改善される。すなわち、(a)拒否クラスが、誤ったクラス確率に対しいっそう低い(かついっそう狭い)上界をもたらすために使用され、これに続いて(b)次点クラスの下げられた確率によって、逆ガウスCDF関数を介したその非線形の依存性ゆえに、いっそう高い認証半径がもたらされるからである。
【0020】
この目的で、すべての摂動に対する完全なシステムを、ノイズ除去器および検出器/リジェクタのモジュールによって拡張された分類器と見なすことができる:その結果、元の(K)クラス分類タスクに対し(K+1)クラス分類器が得られることになる。
【0021】
(1)画像は、N回摂動させられて、すべての摂動は、これらの(K+1)クラスのうちの1つに分類されることになり、この場合、追加のクラスは、棄却/検出/拒否クラスと呼ばれる。
【0022】
(2)最終的な分類結果は、多数決を有するK個のクラス(当初のクラス、したがって拒否クラスを除く)のいずれかである。
【0023】
(3)次点クラスならびに拒否クラスの確率が推定され、これらのジョイント量を利用することにより、従来技術よりも改善された性能および大きくなった認証半径がもたらされる。
【0024】
(4)提案された方法において不可欠であるのは、正しく分類された画像と誤分類されたランダムに摂動させられた画像とを区別(分類)するように、提案されたリジェクタモジュールをトレーニングすることである。
【0025】
開示された実施形態によれば、敵対的入力を拒否クラスに分類することによって、それらを検出することができる。さらにこれによって、ある1つの摂動群において考えられるすべての摂動が正しく分類されることになる、という証明書を与えることによって、ひいては敵対者による攻撃が失敗することを保証することによって、分類器の性能に対する証明可能な保証がもたらされる。これによって、検出能力を備えていない他の技術によって達成される性能保証を付加的に高めることができる。
【0026】
この研究の別の重要な態様は、事前トレーニング済みの既製の分類器およびノイズ除去器をロバスト化する能力である。このことは、分類器および/または検出器の重みを変更することが、コスト/プライバシー/その他の理由で実行不可能である場合、非常に重要なものである。
【0027】
このことを、敵対的な環境の検出に使用することもでき、したがって、敵対者の検出を危険な/敵対的な環境として解釈することにより、安全上クリティカルなタスクに対する手動制御を要求するために使用することもできる。
【0028】
分類の棄却が、分類タスク結果の確実性が分類器には欠けていると分類器が断言しているものと解釈されることもあり、したがって高い不確実性を断言するために使用することができる。
【0029】
1つの実施形態において、システムは、ランダム化スムージングを可能にすることができる。たとえば、R
dからクラスY:={1,2,...,K}への分類問題について考察する。ランダム化スムージング法によれば、
【数2】
を定義することによって、任意のベース分類器fから「スムージングされた」分類器gを構築することができる。
【0030】
つまりスムージングされた分類器gは、ベース分類器fがxの近傍付近で最も返しそうなクラスを返し、ここで近傍におけるサンプルの密度はガウスノイズε~N(0,σ2I)として表される。
【0031】
ランダム化スムージング法の1つの利点は、有界のl2ノルムのワーストケースの摂動に対し認証可能なロバストネスを提供するその固有の能力である。形式的には、任意の決定論的関数またはランダム関数f:R
d→Y:={1,2,...,K}について、c
A,c
BεYおよびπ
A,π
Bε[0,1]が、
【数3】
を満たすと仮定する。
【0032】
1つの実施例の場合、狭い照合境界を、以下のように利用することができる。すなわち、すべての||δ||≦Rについてg(x+δ)=c
A、ここで
【数4】
であり、Φ
-1(.)は、標準ガウスCDFの逆数である。
【0033】
πA=P(f(x+ε)=cA)およびπB=P(f(x+ε)=cB)の正確な値を計算するのは実際的ではないので、モンテカルロサンプリングを使用して、任意の高い信頼度で確率が最も高いクラスを推定し、その後、πB=1-πAの近似により、
R=σΦ-1(πA)
が得られる。
【0034】
実際には、上述の結果は任意の関数fについて保持されるけれども、標準的な分類器を使用すると、それらはガウスノイズに対してロバストではないことから、通常はトリビアルな認証境界をもたらすことになるので、効率的な認証のためにはガウス摂動に対しベース分類器fをトレーニングする必要がある。モンテカルロ推定においていっそう多くの個数のサンプルを実行することによって、認証信頼度の増大を達成することができるが、これにより推定時間が増加することになる。さらに、上述の結果は任意の関数fについて保持されるけれども、標準的な分類器を使用すると、それらはガウスノイズに対してロバストではないことから、通常はトリビアルな認証境界をもたらすことになるので、効率的な認証のためにはガウス摂動に対しベース分類器fをトレーニングする必要がある。
【0035】
図1には、ニューラルネットワークをトレーニングするためのシステム100が示されている。システム100は、ニューラルネットワークのためのトレーニングデータ102にアクセスするための入力インタフェースを含むことができる。たとえば、
図1に示されているように、データ記憶装置106からトレーニングデータ102にアクセスすることができるデータ記憶装置インタフェース104によって、入力インタフェースを構成することができる。たとえば、データ記憶装置インタフェース104を、メモリインタフェースまたは持続的記憶装置インタフェース、たとえばハードディスクインタフェースまたはSSDインタフェースとすることができるが、Bluetoothインタフェース、ZigbeeインタフェースまたはWi-Fiインタフェースまたはイーサネットインタフェースまたは光ファイバインタフェースといった、パーソナルエリアネットワークインタフェース、ローカルエリアネットワークインタフェースまたはワイドエリアネットワークインタフェースとすることもできる。データ記憶装置106を、ハードディスクドライブまたはSSDといった、システム100の内部データ記憶装置とすることができるけれども、外部データ記憶装置、たとえばネットワークアクセス可能なデータ記憶装置、とすることもできる。
【0036】
いくつかの実施形態において、データ記憶装置106はさらに、システム100によってデータ記憶装置106からアクセス可能な、ニューラルネットワークの未トレーニングバージョンのデータ表現108を含むことができる。ただし自明のとおり、トレーニングデータ102と未トレーニングニューラルネットワークのデータ表現108とに各々、異なるデータ記憶装置から、たとえばデータ記憶装置インタフェース104の異なるサブシステムを介して、アクセスすることもできる。各サブシステムを、データ記憶装置インタフェース104に関して先に述べたタイプのものとすることができる。別の実施の形態において、未トレーニングニューラルネットワークのデータ表現108を、ニューラルネットワークのための設計パラメータに基づき、システム100によって内部的に生成することができ、したがってデータ記憶装置106に明示的に格納しなくてもよい。システム100はさらにプロセッササブシステム110を含むことができ、このプロセッササブシステム110を、システム100の動作中、トレーニングすべきニューラルネットワークの層スタックの代替として反復関数を提供するように、構成することができる。この場合、置き換えられる層スタックの個々の層は、互いに共有された重みを有することができ、入力として先行する層の出力を受け取ることができ、または層スタックの第1の層の場合であれば、初期活性化および層スタックの入力の一部を受け取ることができる。プロセッササブシステム110をさらに、トレーニングデータ102を使用してニューラルネットワークを反復的にトレーニングするように、構成することができる。この場合、プロセッササブシステム110によるトレーニングの反復は、順方向伝播部分および逆方向伝播部分を含むことができる。プロセッササブシステム110を、実行可能な順方向伝播部分を定義する他のオペレーションのうち、反復関数が1つの決められた点に収束する反復関数の平衡点を決定することによって、順方向伝播部分を実行するように、構成することができ、ここで平衡点を決定することは、数値的求根アルゴリズムを使用して反復関数の根解からその入力を差し引いたものを求めること、およびニューラルネットワークにおける層スタックの出力の代替として平衡点を供給することを含む。システム100はさらに、トレーニング済みニューラルネットワークのデータ表現112を出力するための出力インタフェースを含むことができ、このデータをトレーニング済みモデルデータ112と称することができる。たとえば、
図1にも示されているように出力インタフェースを、データ記憶装置インタフェース104によって構成することができ、このインタフェースは、これらの実施形態では入/出力(“IO”)インタフェースであり、この入/出力インタフェースを介して、トレーニング済みモデルデータ112をデータ記憶装置106に格納することができる。たとえば、トレーニングデータ102にトレーニングを反映させるために、ニューラルネットワークの重み、ハイパーパラメータおよび他のタイプのパラメータのようなニューラルネットワークのパラメータを適応化できるという点で、トレーニング中またはトレーニング後、「未トレーニング」ニューラルネットワークを定義するデータ表現108を、トレーニング済みニューラルネットワークのデータ表現112によって少なくとも部分的に置き換えることができる。このことは
図1において、データ記憶装置106上の同じデータレコードを指している参照符号108,112によっても表されている。別の実施形態において、データ表現112を、「未トレーニング」ニューラルネットワークを定義するデータ表現108とは別個に格納することができる。いくつかの実施形態において、出力インタフェースを、データ記憶装置インタフェース104とは別個のものとすることができるけれども、一般的にはデータ記憶装置インタフェース104に関して先に述べたタイプのものとすることができる。
【0037】
図2には、データにアノテーションを付すためのシステムを実装するデータアノテーションシステム200が示されている。データアノテーションシステム200は、少なくとも1つのコンピューティングシステム202を含むことができる。コンピューティングシステム202は、メモリユニット208と作動的に接続された少なくとも1つのプロセッサ204を含むことができる。プロセッサ204は、中央処理ユニット(CPU)206の機能を実装する1つまたは複数の集積回路を含むことができる。CPU206を、x86、ARM、PowerまたはMIPSの命令セットファミリーのうちの1つなどのような命令セットを実装する市販の処理ユニットとすることができる。オペレーション中、CPU206は、メモリユニット208から取り出されたストアドプログラム命令を実行することができる。ストアドプログラム命令は、本明細書で説明するオペレーションを実施するために、CPU206のオペレーションを制御するソフトウェアを含むことができる。いくつかの実施例において、プロセッサ204を、CPU206、メモリユニット208、ネットワークインタフェース、および入/出力インタフェースの機能を単一の集積デバイスに集積するシステムオンチップ(SoC)とすることができる。コンピューティングシステム202は、オペレーションの様々な態様を管理するためのオペレーティングシステムを実装することができる。
【0038】
メモリユニット208は、命令およびデータを格納するために、揮発性メモリおよび不揮発性メモリを含むことができる。不揮発性メモリは、NANDフラッシュメモリのようなソリッドステートメモリ、磁気記憶媒体および光学記憶媒体、またはコンピューティングシステム202が非アクティブ状態のときまたは電力を失ったときにデータを保持する他の任意の適切なデータ記憶デバイスを含むことができる。揮発性メモリは、プログラム命令およびデータを格納するスタティックランダムアクセスメモリおよびダイナミックランダムアクセスメモリ(RAM)を含むことができる。たとえば、メモリユニット208は、機械学習モデル210またはアルゴリズムと、機械学習モデル210のためのトレーニングデータセット212と、未加工ソースデータセット215とを格納することができる。
【0039】
コンピューティングシステム202は、外部のシステムおよびデバイスとの通信を提供するように構成されたネットワークインタフェースデバイス222を含むことができる。たとえば、ネットワークインタフェースデバイス222は、Institute of Electrical and Electronics Engineers (IEEE) 802.11標準ファミリによって定義された有線および/または無線のイーサネットインタフェースを含むことができる。ネットワークインタフェースデバイス222は、セルラネットワーク(たとえば3G,4G,5G)と通信するためのセルラ通信インタフェースを含むことができる。ネットワークインタフェースデバイス222をさらに、外部ネットワーク224またはクラウドに対する通信インタフェースを提供するように、構成することができる。
【0040】
外部ネットワーク224を、ワールドワイドウェブまたはインターネットと称することができる。外部ネットワーク224は、コンピューティングデバイス間において標準通信プロトコルを確立することができる。外部ネットワーク224によって、コンピューティングデバイスとネットワークとの間において情報およびデータを容易に交換可能にすることができる。1つまたは複数のサーバ230が、外部ネットワーク224と通信することができる。
【0041】
コンピューティングシステム202は入/出力(I/O)インタフェース220を含むことができ、この入出力インタフェースを、ディジタルおよび/またはアナログの入力および出力を供給するように、構成することができる。I/Oインタフェース220は、外部デバイスと通信するための付加的なシリアルインタフェース(たとえばユニバーサルシリアルバス(USB)インタフェース)を含むことができる。
【0042】
コンピューティングシステム202は、ヒューマンマシンインタフェース(HMI)デバイス218を含むことができ、このヒューマンマシンデバイスは、システム200が制御入力を受信できるようにする任意のデバイスを含むことができる。入力デバイスの例として、キーボード、マウス、タッチスクリーン、音声入力デバイスおよび他の同様のデバイスなどのようなヒューマンインタフェース入力を挙げることができる。コンピューティングシステム202は、ディスプレイデバイス232を含むことができる。コンピューティングシステム202は、グラフィックスおよびテキスト情報をディスプレイデバイス232に出力するためのハードウェアおよびソフトウェアを含むことができる。ディスプレイデバイス232は、電子ディスプレイスクリーン、プロジェクタ、プリンタ、あるいはユーザまたはオペレータに情報を表示するための他の適切なデバイスを含むことができる。コンピューティングシステム202をさらに、ネットワークインタフェースデバイス222を介したリモートHMIおよびリモートディスプレイ装置とのインタラクションを可能にするように、構成することができる。
【0043】
システム200を、1つまたは複数のコンピューティングシステムを使用して実装することができる。この実施例は、説明した特徴のすべてを実装する単一のコンピューティングシステム202を示しているが、ここで意図しているのは、様々な特徴および機能を、互いに通信し合う複数のコンピューティングユニットによって分割して実装することができる、ということである。選択される特定のシステムアーキテクチャは、様々なファクタに左右される可能性がある。
【0044】
システム200は、未加工ソースデータセット215を解析するように構成されている機械学習アルゴリズム210を実装することができる。未加工ソースデータセット215は、機械学習システムのための入力データセットを表すことができる未加工または未処理のセンサデータを含むことができる。未加工ソースデータセット215は、ビデオ、ビデオセグメント、画像、テキストベースの情報、および未加工または部分的に処理されたセンサデータ(たとえば物体のレーダマップ)を含むことができる。いくつかの実施例において、機械学習アルゴリズム210を、予め定義された機能を実施するように設計されたニューラルネットワークアルゴリズムとすることができる。たとえばニューラルネットワークアルゴリズムを、自動車の用途においてビデオ画像内の歩行者を識別するように、構成することができる。
【0045】
コンピュータシステム200は、機械学習アルゴリズム210のためのトレーニングデータセット212を格納することができる。トレーニングデータセット212は、機械学習アルゴリズム210をトレーニングするために予め構築されたデータのセットを表すことができる。ニューラルネットワークアルゴリズムに関連づけられた重み付け係数を学習するために、機械学習アルゴリズム210によってトレーニングデータセット212を使用することができる。トレーニングデータセット212は、対応する成果または結果を有するソースデータのセットを含むことができ、機械学習アルゴリズム210は学習プロセスを介して、それらの成果または結果を再現しようと試みる。この実施例において、トレーニングデータセット212は、歩行者を含むおよび含んでいないソースビデオならびに対応する存在およびロケーションの情報を含むことができる。ソースビデオは、歩行者が識別される様々なシナリオを含むことができる。
【0046】
機械学習アルゴリズム210を、トレーニングデータセット212を入力として使用する学習モードで動作させることができる。機械学習アルゴリズム210を、トレーニングデータセット212からのデータを使用し、多数の反復にわたり実行させることができる。反復のたびに機械学習アルゴリズム210は、達成された結果に基づき内部重み付け係数を更新することができる。たとえば、機械学習アルゴリズム210は、出力結果(たとえばアノテーション)を、トレーニングデータセット212に含まれている出力結果と比較することができる。トレーニングデータセット212は予期される結果を含んでいるので、機械学習アルゴリズム210は、いつパフォーマンスが許容可能であるかを判定することができる。機械学習アルゴリズム210が予め定められたパフォーマンスレベル(たとえばトレーニングデータセット212に関連づけられた成果と100%の一致)を達成した後、トレーニングデータセット212内にないデータを使用して機械学習アルゴリズム210を実行させることができる。トレーニング済み機械学習アルゴリズム210を、アノテーションが付されたデータを生成するために新たなデータセットに適用することができる。
【0047】
機械学習アルゴリズム210を、未加工ソースデータ215における特定の特徴を識別するように、構成することができる。未加工ソースデータ215は、アノテーション結果が望まれる複数のインスタンスまたは入力データセットを含むことができる。たとえば機械学習アルゴリズム210を、ビデオ画像内の歩行者の存在を識別し、発生事象にアノテーションを付すように、構成することができる。未加工ソースデータ215を処理して特定の特徴の存在を識別するように、機械学習アルゴリズム210をプログラミングすることができる。機械学習アルゴリズム210を、未加工ソースデータ215における特徴を予め定められた特徴(たとえば歩行者)として識別するように、構成することができる。未加工ソースデータ215を様々なソースから導出することができる。たとえば未加工ソースデータ215を、機械学習システムによって収集された実際の入力データとすることができる。未加工ソースデータ215を、システムのテストのために機械生成することができる。たとえば、未加工ソースデータ215は、カメラからの未加工ビデオ画像を含むことができる。
【0048】
この実施例において、機械学習アルゴリズム210は、未加工ソースデータ215を処理し、画像の表現の表示を出力することができる。出力は、画像の拡張表現も含むことができる。機械学習アルゴリズム210は、生成された出力ごとに信頼度レベルまたは信頼度係数を生成することができる。たとえば、予め定められた高信頼度閾値を上回る信頼度値によって、識別された特徴が特定の特徴に一致していると機械学習アルゴリズム210が確信している、ということを表すことができる。低信頼度閾値を下回る信頼度値は、特定の特徴が存在することに機械学習アルゴリズム210が何らかの不確実性を有する、ということを表すことができる。
【0049】
図3には、事前トレーニング済み分類器をロバスト化することに関するフローチャートの実施形態が示されている。ステップ301において、入力(たとえば画像または類似のデータ)xを、プロセッサ、コンピュータ、サーバなどで受信することができる。ステップ302において、ノイズεにより入力を摂動させることができる。ステップ303において、摂動データは、D(x+ )を介して前処理(たとえばノイズ除去)ステップを通過することができる。ノイズ除去器を、事前トレーニング済みノイズ除去器とすることができる。ステップ305において、結果として得られたノイズ除去済みデータは、拒否クラスを有するベース分類器を通過することができる。ベース分類器は、事前トレーニング済み分類器(たとえばKクラス分類器)とリジェクタの両方を含むことができる。ベース分類器f(.)によりクラスkに割り当てられている、正しく分類されたノイズ除去済み入力と誤分類されたノイズ除去済み入力とを首尾よく区別するように、リジェクタをトレーニングすることができる。ステップ307において、
【数5】
のスムージングされたジョイントシステムの分類出力を、ノイズ分布にわたって最も可能性の高いクラスとして主張することができる(またはN.i.i.d.サンプルを介したその経験的実現)。かかるシステムの概略図が以下で
図4に示されており、システム全体を
【数6】
として定義することができる。
【0050】
かかる実施形態において、事前トレーニング済みKクラス分類器および事前トレーニング済みノイズ除去器が、元のK個のクラス各々について、バイナリ検出器であるクラス別除去器によって拡張される。明示的な「拒否」クラスをベース分類器に組み込むことにより、事前トレーニング済み分類器の認証精度を向上させることを目的とする一方、l2ノルムが有界であるワーストケース摂動に対する認証性は維持されている。
【0051】
分類器f、ノイズ除去器D、リジェクタ{h
1,...h
k}を含む完全なシステムに対して提案される分類手順において、画像xは以下のステップを通過することになる。すなわち、(a)画像は最初に、分散σ
2を有するガウスノイズから引き出されたノイズεによって摂動させられる。(b)ノイズのある画像は、D(x+ε)を介して画像処理(ノイズ除去)ステップを通過する。(c)結果として得られたノイズ除去された画像は、
【数7】
として定義された拒否を伴うベース分類器を表すf
R(D(x+ε))を通過する。(d)最後に、スムージングされたジョイントシステムの分類出力が、ノイズ分布にわたって最も可能性の高いクラスとして主張される(またはN.i.i.d.サンプルを介したその経験的実現、すなわち異なるノイズ実現で合計N回だけステップa~cを繰り返し、多数クラスを採用する)。
【0052】
概略図は、S={f、D,h1,...hk}として表されるシステム全体における構成要素の視覚的な配置を示している。
【0053】
アルゴリズム1,2,3は、システム全体の予測および認証のための擬似コードを規定しており、この場合、関数LowerConfBound(S,n,1-α)は、サンプルs~Binomia(n,q)であるとすると、二項パラメータqに対して一方の側の1-αの低い方の信頼インタバールを返す。
【0054】
【0055】
【0056】
リジェクタをトレーニングするために、リジェクタネットワーク{h
1,...h
k}のパラメータが、正しく分類されたノイズのあるサンプルと誤分類されたノイズのあるサンプルとを区別するように、リジェクタをトレーニングすることによって学習させられる。すなわち具体的には、リジェクタh
kに対する分類の損失を
【数10】
として定義し、ここでH
kは、リジェクタkのソフトマックス出力であり、画像x
iに対する目標ラベルb
iは、
【数11】
として定義されている。
【0057】
つまり分類器fが、ノイズのない画像と同じクラスにノイズ除去済み入力を分類したならば、目標ラベルbi=0であり、さもなければbi=1であり、したがって分類結果が変化したノイズのある画像を拒否する。
【0058】
すべての可能なK個のクラスによってデータセット全体にわたり集計された総損失は、
【数12】
となり、ここでパラメータセットφ={φ
1,...,φ
k}は、K個のリジェクタすべてのパラメータのセットを捕捉する。
【0059】
トレーニングをいっそう手ごろなものにする目的で提案されるのは、K個のリジェクタを、φBBによってパラメータ化された1つの共通のバックボーンhBBを介して結び付け、ωkによってパラメータ化された完全に結合された層を、バックボーンネットワークを介して抽出された特徴に付加することによって、各hkを定義する、ということである。
【0060】
図4には、1つの実施形態による線図の実施形態が示されている。システムは、入力401を受け取ることができる。入力401は、ビデオデータ、レーダ、LiDAR、超音波撮像カメラ、モーション撮像カメラ、熱撮像カメラなどのような、1つまたは複数のセンサからのデータを含むことができる。敵対的攻撃に対する事前トレーニング済みニューラルネットワークのロバスト化プロセスを支援するために、ノイズ403を入力に加えることができる。次いでシステムは、事前トレーニング済みノイズ除去器405を使用することができる。事前トレーニング済みノイズ除去器405を画像間変換器とすることができ、したがってこのノイズ除去器405は、ノイズ除去済み画像またはノイズ除去済み画像セットを生成するために、画像前処理を利用する。所与のネットワークfの基礎となる重みを変更することなく、ロバストな分類器を構築する目的で、システムは、入力をfを通過させる前の前処理ステップとして、画像ノイズ除去器405を利用することができ、この場合、ノイズ除去器405は、ランダム化スムージングにおいて、入力に加わったガウスノイズを除去することを目的としている。具体的にはこのことは、カスタムトレーニング済みノイズ除去器D
θ:R
d→R
dを用いて分類器fを拡張することによって行われ、これによりシステム全体が合成関数
【数13】
として表現される。画像または入力401を、N回だけ摂動させることができ、すべての摂動を(K+1)個のクラスのうちの1つに分類することができる。付加的なクラスを、棄却/検出/拒否クラスと呼ぶことができる。
【0061】
(事前にトレーニングしておくことができる)Kクラス分類器409およびノイズ除去器405を、クラスごとの除去器410によって拡張することができる。リジェクタ410を、元のK個のクラス各々のための2値検出器とすることができる。システムは、ノイズが付加されかつノイズ除去器を介して前処理されたデータの反復各々を利用して、リジェクタ410をトレーニングするように動作可能である。システムは、明示的な「拒否」クラスをベース分類器に組み込むことにより、事前トレーニング済み分類器の認証精度を向上させることを目的とすることができる一方、l2ノルムが有界であるワーストケース摂動に対する認証性は維持されている。リジェクタモジュール411を利用して、正しく分類された画像と誤分類されたランダムに摂動させられた画像とを区別(分類)するように、提案されたリジェクタモジュールをトレーニングすることができる。リジェクタセレクタモジュール411は、事前トレーニング済み分類器409との双方により動作可能である。
【0062】
トレーニングをいっそう手ごろなものにする目的で、システムは、K個のリジェクタを、1つの共通のバックボーン410を介して結び付けることができる。かくしてシステムは、誤分類される可能性が高い入力を分類するのを拒否することができる。1つまたは複数のエジェクタ410を、かかる入力を阻止するのに利用することができる。リジェクタセレクタモジュールは、入力に関連づけられたクラスk412または拒否413のいずれかを出力することになる。ノイズの種々の反復が加えられ(たとえば摂動させられ)、前処理された入力データの様々な反復を、n回使用することができる。
【0063】
ステップ415において、システムおよび分類器は、最終クラス417および棄却分類416の双方を認証および予測するように動作可能である。システムは、ノイズ除去された摂動データの様々なカウントをサンプリングすることができる。次いでシステムは、入力のロバストネスを認証するための適切な境界を決定することができる。入力が認証されていないかぎり、その入力を誤分類または棄却クラスとして戻すことができる。
【0064】
かくしてシステムは、明示的な「拒否」クラスをベース分類器に組み込むことにより、事前トレーニング済み分類器の認証精度を向上させることを目的とすることができる一方、l2ノルムが有界であるワーストケース摂動に対する認証性は維持されている。この目的で、h:Rd→{0,1}は、バイナリ出力を有する一般的な関数を表すことができ、これは、h(x)=1である場合には入力xに効果的に「フラグ」を付与し、したがってこれを拒否クラスに割り当てる一方、h(x)=0は、入力を通過させることを許可し、したがってそれを拒否しないことを表す。したがってこのシステムおよびアルゴリズムは、事前トレーニング済み分類器のロバストな性能を改善する目的で、事前にトレーニングされノイズ除去されたスムージングと組み合わせて、かかる「リジェクタ」を効果的にトレーニングおよび動作させることができる。
【0065】
図5には、コンピュータ制御機械500と制御システム502との間のインタラクションの概略図が示されている。コンピュータ制御機械500は、アクチュエータ504およびセンサ506を含む。アクチュエータ504は、1つまたは複数のアクチュエータを含むことができ、センサ506は、1つまたは複数のセンサを含むことができる。センサ506は、コンピュータ制御機械500の状態をセンシングするように構成されている。センサ506を、センシングされた状態をセンサ信号508となるよう符号化し、このセンサ信号508を制御システム502に送信するように、構成することができる。センサ506の非限定的な例には、ビデオ、レーダ、LiDAR、超音波センサおよびモーションセンサが含まれる。1つの実施形態において、センサ506は、コンピュータ制御機械500に近接する環境の光学画像をセンシングするように構成された光学センサである。
【0066】
制御システム502は、コンピュータ制御機械500からセンサ信号508を受け取るように構成されている。以下で述べるように制御システム502をさらに、センサ信号に応じてアクチュエータ制御命令510を計算し、アクチュエータ制御命令510をコンピュータ制御機械500のアクチュエータ504にアクチュエータ制御命令510を送信するように、構成することができる。
【0067】
図5に示されるように、制御システム502は受信ユニット512を含む。受信ユニット512を、センサ506からセンサ信号508を受信し、センサ信号508を入力信号xに変換するように、構成することができる。1つの択一的な実施形態において、センサ信号508は、受信ユニット512を用いず入力信号xとして直接受信される。各入力信号xを、各センサ信号508の一部とすることができる。受信ユニット512を、各センサ信号508を処理して各入力信号xを生成するように構成することができる。入力信号xは、センサ506により記録された画像に対応する画像データを含むことができる。
【0068】
制御システム502は分類器514を含む。分類器514を、上述のニューラルネットワークのような機械学習(ML)アルゴリズムを使用して、入力信号xを1つまたは複数のラベルに分類するように、構成することができる。分類器514は、上述のようなパラメータ(たとえばパラメータθ)によってパラメータ化されるように構成されている。パラメータθを、不揮発性記憶装置516に格納することができ、それによって供給することができる。分類器514は、入力信号xから出力信号yを決定するように構成されている。各出力信号yは、各入力信号xに1つまたは複数のラベルを割り当てる情報を含む。分類器514は、出力信号yを変換ユニット518に送信することができる。変換ユニット518は、出力信号yをアクチュエータ制御命令510に変換するように構成されている。制御システム502は、アクチュエータ制御命令510をアクチュエータ504に送信するように構成されており、アクチュエータ504は、アクチュエータ制御命令510に応答してコンピュータ制御機械500を作動させるように構成されている。別の実施形態において、アクチュエータ504は、出力信号yに直接基づき、コンピュータ制御機械500を作動させるように構成されている。
【0069】
アクチュエータ504がアクチュエータ制御命令510を受信すると、アクチュエータ504は、関連するアクチュエータ制御命令510に対応するアクションを実行するように構成されている。アクチュエータ504は、アクチュエータ制御命令510を第2のアクチュエータ制御命令に変換するように構成された制御ロジックを含むことができ、この第2のアクチュエータ制御命令は、アクチュエータ504を制御するために利用される。1つまたは複数の実施形態において、アクチュエータの代わりにまたはアクチュエータに加えて、ディスプレイを制御するために、アクチュエータ制御命令510を利用することができる。
【0070】
別の実施形態において、制御システム502は、センサ506を含むコンピュータ制御機械500の代わりに、またはこのコンピュータ制御機械500に加えて、センサ506を含む。制御システム502は、アクチュエータ504を含むコンピュータ制御機械500の代わりに、またはこのコンピュータ制御機械500に加えて、アクチュエータ504も含むことができる。
【0071】
図5に示されているように、制御システム502は、プロセッサ520およびメモリ522も含む。プロセッサ520は、1つまたは複数のプロセッサを含むことができる。メモリ522は、1つまたは複数のメモリデバイスを含むことができる。1つまたは複数の実施形態の分類器514(たとえばMLアルゴリズム)を、不揮発性記憶装置516、プロセッサ520およびメモリ522を含む制御システム502によって実装することができる。
【0072】
不揮発性記憶装置516は、ハードディスクドライブ、光学ドライブ、テープドライブ、不揮発性ソリッドステートデバイス、クラウド記憶装置、または情報を持続的に格納することができる他の任意のデバイスといった、1つまたは複数の持続的データ記憶デバイスを含むことができる。プロセッサ520は、高性能コア、マイクロプロセッサ、マイクロコントローラ、ディジタル信号プロセッサ、マイクロコンピュータ、中央処理ユニット、フィールドプログラマブルゲートアレイ、プログラマブルロジック装置、ステートマシン、論理回路、アナログ回路、ディジタル回路、またはメモリ522内に常駐するコンピュータ実行可能命令に基づき信号(アナログまたはディジタル)を操作する他の任意のデバイスを含む、高性能コンピューティング(HPC)システムから選択された1つまたは複数のデバイスを含むことができる。メモリ522は、単一のメモリデバイスまたは複数のメモリデバイスを含むことができ、以下に限定されるものではないが、これにはランダムアクセスメモリ(RAM)、揮発性メモリ、不揮発性メモリ、スタティックランダムアクセスメモリ(SRAM)、ダイナミックランダムアクセスメモリ(DRAM)、フラッシュメモリ、キャッシュメモリ、または情報を格納可能な他の任意のデバイスが含まれる。
【0073】
プロセッサ520を、不揮発性記憶装置516に常駐し、1つまたは複数のMLアルゴリズムおよび/または1つまたは複数の実施形態の方法論を具現化するコンピュータ実行可能命令を、メモリ522に読み込んで実行するように、構成することができる。不揮発性記憶装置516は、1つまたは複数のオペレーティングシステムおよびアプリケーションを含むことができる。不揮発性記憶装置516は、様々なプログラミング言語および/または技術を使用して作成されたコンピュータプログラムからコンパイルされた、かつ/または解釈されたものを格納することができ、様々なプログラム言語および/または技術には、以下に限定されるものではないが、Java、C、C++、C#、Objective C、Fortran、Pascal、Java Script、Python、Perl、およびPL/SQLが、単独でまたは組み合わせとして含まれる。
【0074】
プロセッサ520により実行されると、不揮発性記憶装置516のコンピュータ実行可能命令は、本明細書で開示されたMLアルゴリズムおよび/または方法論のうちの1つまたは複数を、制御システム502に実施させることができる。不揮発性記憶装置516は、本明細書で説明した1つまたは複数の実施形態の機能、特徴、およびプロセスを支援する(データパラメータを含む)MLデータも含むことができる。
【0075】
本明細書で説明したアルゴリズムおよび/または方法論を具現化するプログラムコードを、様々な種々の形態でプログラム製品として個別にまたはまとめて配布することができる。1つまたは複数の実施形態の態様をプロセッサに実行させるためのコンピュータ可読プログラム命令が格納されたコンピュータ可読記憶媒体を使用して、プログラムコードを配布することができる。本質的に非一時的なコンピュータ可読記憶媒体は、コンピュータ可読命令、データ構造、プログラムモジュールまたはその他のデータのような情報を格納するために、任意の方法または技術で実装された、揮発性および不揮発性ならびに取り外し可能および取り外し不可能な有形の媒体を含むことができる。コンピュータ可読記憶媒体はさらに、RAM、ROM、消去可能なプログラマブルリードオンリメモリ(EPROM)、電気的に消去可能なプログラマブルリードオンリメモリ(EEPROM)、フラッシュメモリまたは他のソリッドステートメモリ技術、携行可能なコンパクトディスクリードオンリメモリ(CD-ROM)、またはその他の光学記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置または他の磁気記憶デバイス、あるいは所望の情報を格納するために使用可能かつコンピュータにより読み出し可能なその他の任意の媒体を含むことができる。コンピュータ可読プログラム命令を、コンピュータ可読記憶媒体からコンピュータ、他のタイプのプログラマブルデータ処理装置または他のデバイスへ、あるいはネットワークを介して外部のコンピュータまたは外部の記憶デバイスへ、ダウンロード可能である。
【0076】
コンピュータ可読媒体に格納された命令によって、フローチャートまたは図面において指定された機能、アクションおよび/またはオペレーションを実装する命令を含む製品が作り出されるように、コンピュータ、他のタイプのプログラマブルデータ処理装置または他のデバイスに対し、特定の手法で機能するよう命令するために、コンピュータ可読媒体に格納されたコンピュータ可読プログラム命令を使用することができる。特定の択一的な実施形態において、フローチャートおよび図面において指定された機能、アクションおよび/またはオペレーションを、1つまたは複数の実施形態と矛盾することなく、順序を変更することができ、順次に処理することができ、かつ/または同時に処理することができる。しかもフローチャートおよび/または図面のいずれかは、1つまたは複数の実施形態と矛盾することなく、示されたものよりも多いまたは少ないノードまたはブロックを含むことができる。
【0077】
プロセス、方法またはアルゴリズムを、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ステートマシン、コントローラ、または他のハードウェア構成要素またはハードウェアデバイス、あるいはハードウェア、ソフトウェアおよびファームウェアの構成要素の組み合わせといった適切なハードウェア構成要素を使用して、全体または一部を具現化することができる。
【0078】
図6には、輸送手段600を制御するように構成された制御システム502の概略図が示されており、このシステムを、少なくとも部分的に自律的な輸送手段または少なくとも部分的に自律的なロボットとすることができる。輸送手段600は、アクチュエータ504およびセンサ506を含む。センサ506は、1つまたは複数のビデオセンサ、カメラ、レーダセンサ、超音波センサ、LiDARセンサ、および/またはポジションセンサ(たとえばGPS)を含むことができる。1つまたは複数の特定のセンサのうちの1つまたは複数を、輸送手段600に組み込むことができる。択一的に、または先に挙げた1つまたは複数の特定のセンサに加えて、センサ506は、実行時にアクチュエータ504の状態を判定するように構成されたソフトウェアモジュールを含むことができる。ソフトウェアモジュールの1つの非限定的な実施例は、輸送手段600または他のロケーションの近くの天候の現在または今後の状態を判定するように構成された天候情報ソフトウェアモジュールを含む。
【0079】
輸送手段600の制御システム502の分類器514を、入力信号xに応じて輸送手段600付近の物体を検出するように構成することができる。かかる実施形態において、出力信号yは、物体が輸送手段600に近いことを表す情報を含むことができる。この情報に従い、アクチュエータ制御命令510を決定することができる。検出された物体との衝突を回避するために、アクチュエータ制御命令510を使用することができる。
【0080】
輸送手段600が少なくとも部分的に自律的な輸送手段である実施形態において、アクチュエータ504を、輸送手段600のブレーキ、推進システム、エンジン、ドライブトレイン、またはステアリングシステムにおいて具現化することができる。輸送手段600が検出された物体との衝突を回避するようアクチュエータ504が制御されるように、アクチュエータ制御命令510を決定することができる。検出された物体を、歩行者または樹木など、分類器514がそれらを最も可能性が高いと見なしたものに従って分類することもできる。アクチュエータ制御命令510を、この分類に応じて決定することができる。敵対的攻撃が発生する可能性のある状況では、上述のシステムをさらに、物体をいっそう良好に検出するように、あるいは輸送手段600におけるセンサまたはカメラに関して、照明コンディションまたは角度の変化を識別するように、トレーニングすることができる。
【0081】
輸送手段600が少なくとも部分的に自律的なロボットである別の実施形態において、輸送手段600を、飛行、水泳、潜水および歩行といった1つまたは複数の機能を実行するように構成された移動型ロボットとすることができる。移動型ロボットを、少なくとも部分的に自律的な芝刈機または少なくとも部分的に自律的な清掃ロボットとすることができる。かかる実施形態において、移動型ロボットが識別された物体との衝突を回避できるよう、移動型ロボットの推進ユニット、ステアリングユニットおよび/またはブレーキユニットを制御できるように、アクチュエータ制御命令510を決定することができる。
【0082】
別の実施形態において、輸送手段600は、ガーデニングロボットの形態の少なくとも部分的に自律的なロボットである。かかる実施形態において、輸送手段600は、センサ506として光学センサを使用して、輸送手段600付近の環境における作物の状態を判定することができる。アクチュエータ504を、化学薬品を噴霧するように構成されたノズルとすることができる。識別された種および/または植物の識別された状態に応じて、アクチュエータ504に指示して適切な量の適切な化学薬品を植物に噴霧させるように、アクチュエータ制御命令510を決定することができる。
【0083】
輸送手段600を、家電製品の形態の少なくとも部分的に自律的なロボットとすることができる。家電製品の非限定的な実施例には、洗濯機、ストーブ、オーブン、電子レンジ、または食器洗い機が含まれる。かかる輸送手段600の場合、センサ506を、家電製品によって処理されている物体の状態を検出するように構成された光学センサとすることができる。たとえば家電製品が洗濯機であるケースでは、センサ506は洗濯機内部の洗濯物の状態を検出することができる。アクチュエータ制御命令510を、洗濯物の検出された状態に基づき決定することができる。
【0084】
図7には、生産ラインの一部のような製造システム702の、パンチカッター、カッタードリルまたはガンドリルといったシステム700(たとえば製造機械)を制御するように構成された制御システム502の概略図が示されている。制御システム502を、アクチュエータ504を制御するように構成することができ、このアクチュエータ504は、システム700(たとえば製造機械)を制御するように構成されている。
【0085】
システム700(たとえば製造機械)のセンサ506を、製造生産品704の1つまたは複数の特性を捕捉するように構成された光学センサとすることができる。分類器514を、捕捉された特性のうちの1つまたは複数から製造生産品704の状態を判定するように、構成することができる。アクチュエータ504を、製造生産品704の後続の製造ステップのために、製造生産品704の判定された状態に応じて、システム700(たとえば製造機械)を制御するように、構成することができる。アクチュエータ504を、製造生産品704の判定された状態に応じて、システム700(たとえば製造機械)の後続の製造生産品706においてシステム700(たとえば製造機械)の機能を制御するように、構成することができる。
【0086】
図8には、少なくとも部分的に自律モードを有する、電動ドリルまたは電動ドライバといった電動工具800を制御するように構成された制御システム502の概略図が示されている。制御システム502を、アクチュエータ504を制御するように構成することができ、このアクチュエータ504は、電動工具800を制御するように構成されている。
【0087】
電動工具800のセンサ506を、作業面802および/または作業面802内に打ち込まれる締め具804の1つまたは複数の特性を捕捉するように構成された光学センサとすることができる。分類器514を、捕捉された特性のうちの1つまたは複数から、作業面802および/または作業面802に対し相対的な締め具804の状態を判定するように、構成することができる。この状態を、締め具804が作業面802と同一平面にあることとすることができる。択一的にこの状態を、作業面802の硬度とすることができる。アクチュエータ504を、作業面802に対し相対的な締め具804の判定された状態、あるいは作業面802の1つまたは複数の捕捉された特性に応じて、電動工具800の駆動機能が調整されるよう、電動工具800を制御するように、構成することができる。たとえば、締め具804の状態が作業面802に対して同一平面にあるならば、アクチュエータ504は駆動機能を停止することができる。別の非限定的な実施例として、アクチュエータ504は、作業面802の硬度に応じて、付加的なトルクまたはいっそう少ないトルクを印加することができる。
【0088】
図9には、自動パーソナルアシスタント900を制御するように構成された制御システム502の概略図が示されている。制御システム502を、アクチュエータ504を制御するように構成することができ、このアクチュエータ504は、自動パーソナルアシスタント900を制御するように構成されている。自動パーソナルアシスタント900を、洗濯機、ストーブ、オーブン、電子レンジまたは食器洗い機といった家電製品を制御するように、構成することができる。
【0089】
センサ506を、光学センサおよび/または音響センサとすることができる。光学センサを、ユーザ902のジェスチャ904のビデオ画像を受信するように構成することができる。音響センサを、ユーザ902の音声命令を受信するように構成することができる。
【0090】
自動パーソナルアシスタント900の制御システム502を、システム502を制御するように構成されたアクチュエータ制御命令510を決定するように、構成することができる。制御システム502を、センサ506のセンサ信号508に従ってアクチュエータ制御命令510を決定するように、構成することができる。自動パーソナルアシスタント900は、センサ信号508を制御システム502に送信するように構成されている。制御システム502の分類器514を、ジェスチャ認識アルゴリズムを実行して、ユーザ902によって行われたジェスチャ904を識別し、アクチュエータ制御命令510を決定し、さらにアクチュエータ制御命令510をアクチュエータ504に送信するように、構成することができる。分類器514を、ジェスチャ904に応答して不揮発性記憶装置から情報を取り出し、取り出された情報をユーザ902による受信に適した形態で出力するように、構成することができる。
【0091】
図10には、監視システム1000を制御するように構成された制御システム502の概略図が示されている。監視システム1000を、ドア1002を通過するアクセスを物理的に制御するように構成することができる。センサ506を、アクセスが許可されているか否かの判定に関係するシーンを検出するように構成することができる。センサ506を、画像データおよび/またはビデオデータを生成および送信するように構成された光学センサとすることができる。人間の顔を検出するために、かかるデータを制御システム502によって使用することができる。
【0092】
監視システム1000の制御システム502の分類器514を、不揮発性記憶装置516に格納されている既知の人のIDをマッチングすることによって画像データおよび/またはビデオデータを解釈し、それによって人のIDを特定するように、構成することができる。分類器514を、画像データおよび/またはビデオデータの解釈に応答してアクチュエータ制御命令510を生成するように、構成することができる。制御システム502は、アクチュエータ制御命令510をアクチュエータ504に送信するように構成されている。この実施形態において、アクチュエータ504を、アクチュエータ制御命令510に応答してドア1002をロックまたはロック解除するように、構成することができる。別の実施形態において、物理的ではなく論理的なアクセス制御も可能である。
【0093】
監視システム1000をサーベイランスシステムとすることもできる。かかる実施形態において、センサ506を、見張られているシーンを検出するように構成された光学センサとすることができ、制御システム502は、ディスプレイ1004を制御するように構成されている。分類器514は、たとえばセンサ506によって検出されたシーンが不審なものであるか否かなど、シーンの分類を決定するように構成されている。制御システム502は、分類に応答してディスプレイ1004にアクチュエータ制御命令510を送信するように構成されている。ディスプレイ1004を、アクチュエータ制御命令510に応答して表示内容を調整するように構成することができる。たとえばディスプレイ1004は、分類器514によって不審であると見なされた物体をハイライト表示することができる。開示されたシステムの実施形態を利用して、サーベイランスシステムは、環境のビデオにおける敵対的摂動またはランダム摂動(たとえば好ましくない影または照明)を識別することができる。
【0094】
図11には、撮像システム1100、たとえばMRI装置、X線撮像装置または超音波装置を制御するように構成された制御システム502の概略図が示されている。センサ506をたとえば撮像センサとすることができる。分類器514を、センシングされた画像のすべてまたは一部の分類を決定するように構成することができる。分類器514を、トレーニング済みニューラルネットワークにより取得された分類に応答して、アクチュエータ制御命令510を決定または選択するように、構成することができる。たとえば分類器514は、センシングされた画像のある1つの領域が異常であるかもしれないと解釈することができる。このケースであれば、アクチュエータ制御命令510を、ディスプレイ302に指示して撮像を表示させ、異常かもしれない領域をハイライト表示させるように、決定または選択することができる。
【0095】
例示的な実施形態についてこれまで説明してきたが、これらの実施形態は、特許請求の範囲に包含されるすべての可能な形態を説明することを意図したものではない。明細書で使用されている用語は、限定ではなく説明の用語であり、自明のとおり本開示の着想および範囲から逸脱することなく様々な変更を行うことができる。先に説明したように、様々な実施形態の特徴を組み合わせて、本発明のさらなる実施形態を形成することができ、それらについては明示的には説明または図示されていない場合がある。様々な実施形態を、1つまたは複数の所望の特性に関して、他の実施形態または従来技術の実装を凌ぐ利点をもたらすか、またはそれらよりも好ましいものとして、説明してきたかもしれないけれども、当業者には自明のとおり、特定の用途および実装に応じた望ましいシステム全体の属性を得るためには、1つまたは複数の特徴または特性を妥協してもよい。それらの属性として、以下に限定されるものではないが、コスト、強度、耐久性、ライフサイクルコスト、市場性、外観、パッケージング、サイズ、保守性、重量、製造可能性、組み立ての容易さなどを挙げることができる。したがって、何らかの実施形態が、他の実施形態または従来技術の実装よりも、1つまたは複数の特徴に関しては望ましくないと説明されるかぎりにおいて、それらの実施形態が本開示の範囲外にあるというわけではなく、特定の用途にとっては望ましい場合もある。
【手続補正書】
【提出日】2023-06-09
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
機械学習ネットワークをトレーニングするための、コンピュータ実装された方法であって、当該方法は以下のステップを含む、すなわち、
画像、レーダ、ソナーまたは音響の情報を表す入力データをセンサから受信するステップと、
前記入力データを使用して、摂動データを含む摂動入力データセットを生成するステップと、
前記摂動入力データセットをノイズ除去して、ノイズ除去済みデータセットを生成するステップと、
前記ノイズ除去済みデータセットを使用して前記機械学習ネットワークをトレーニングするステップであって、該機械学習ネットワークは、分類確率が、前記ノイズ除去済みデータセットの分類に関連づけられている分類閾値を下回ったならば、前記ノイズ除去済みデータセットを拒否するように構成されているステップと、
前記分類確率が前記分類閾値を下回ったことに応答して、前記入力データに関連づけられた、分類にあたり無視される棄却分類を出力するステップと
を含む、機械学習ネットワークをトレーニングするための、コンピュータ実装された方法。
【請求項2】
当該方法は、分類時に前記棄却分類に比べ多数決を有する最終分類を出力するステップを含む、請求項1記載のコンピュータ実装された方法。
【請求項3】
当該方法は、前記入力データに関連づけられた元のクラスに対するバイナリ検出器であるクラスごとのリジェクタを含む分類器を使用するステップを含む、請求項1記載のコンピュータ実装された方法。
【請求項4】
当該方法は、前記入力データを分類するように構成された事前トレーニング済み分類器、および前記ノイズ除去済みデータセットの分類を拒否するように構成されたリジェクタを使用するステップを含む、請求項1記載のコンピュータ実装された方法。
【請求項5】
前記事前トレーニング済み分類器はさらにノイズ除去器を含む、請求項4記載のコンピュータ実装された方法。
【請求項6】
当該方法は、前記ノイズ除去済みデータセットの複数回の反復を使用するステップを含む、請求項1記載のコンピュータ実装された方法。
【請求項7】
当該方法はさらに、前記入力データを分類するように構成された分類器を使用するステップを含む、請求項1記載のコンピュータ実装された方法。
【請求項8】
機械学習ネットワークを含むシステムであって、当該システムは、
カメラ、レーダ、ソナーまたはマイクロフォンを含むセンサから入力データを受信するように構成された入力インタフェースと、
該入力インタフェースと通信するプロセッサと
を含み、該プロセッサは以下のようにプログラミングされている、すなわち、
画像、レーダ、ソナーまたは音響の情報を表す入力データを受信し、
前記入力データを使用して、該入力データの摂動を含む摂動入力データセットを生成し、
ノイズ除去済みデータセットを生成するように構成されたノイズ除去器を使用して、前記摂動入力データセットをノイズ除去し、
前記ノイズ除去済みデータセットを分類するように構成された事前トレーニング済み分類器と、前記ノイズ除去済みデータセットの分類を拒否するように構成されたリジェクタとの双方に、前記ノイズ除去済みデータセットを送信し、
トレーニング済みリジェクタを達成するために、前記ノイズ除去済みデータセットを使用して前記リジェクタをトレーニングし、
前記トレーニング済みリジェクタの取得に応答して、前記入力データに関連づけられた、分類にあたり無視される棄却分類を出力する
ようにプログラミングされている、
機械学習ネットワークを含むシステム。
【請求項9】
前記ノイズ除去器は事前トレーニング済みノイズ除去器である、請求項8記載のシステム。
【請求項10】
前記プロセッサはさらに、前記入力データに関連づけられた最終分類を出力するようにプログラミングされている、請求項8記載のシステム。
【請求項11】
前記リジェクタのトレーニングは、前記入力データに関連づけられたモンテカルロサンプリングを使用することを含む、請求項8記載のシステム。
【請求項12】
前記リジェクタは、パラメータ化されるように構成された1つの共通のバックボーンを含む、請求項8記載のシステム。
【請求項13】
前記ノイズ除去器は、入力に加わるガウスノイズを除去または緩和するように構成されている、請求項8記載のシステム。
【請求項14】
命令を含むコンピュータプログラムであって、前記命令は、コンピュータにより実行されると該コンピュータに以下のことを行わせる、すなわち、
画像、レーダ、ソナーまたは音響の情報を表す入力データをセンサから受信し、
前記入力データを使用して、該入力データの摂動を含む摂動入力データセットを生成し、
ノイズ除去済みデータセットを生成するように構成された事前トレーニング済みノイズ除去器を使用して、前記摂動入力データセットをノイズ除去し、
事前トレーニング済み分類器およびリジェクタを使用して、前記ノイズ除去済みデータセットを分類または拒否し、
前記ノイズ除去済みデータセットを使用して前記リジェクタをトレーニングし、該リジェクタは、分類確率が、前記ノイズ除去済みデータセットの分類に関連づけられている分類閾値を下回ったならば、前記ノイズ除去済みデータセットを拒否するように構成されており、
前記分類確率が前記分類閾値を下回ったことに応答して、前記入力データに関連づけられた、分類を無視する棄却分類を出力する、
命令を含むコンピュータプログラム。
【請求項15】
前記入力データは、前記コンピュータと通信するカメラから受信された画像を含む、請求項14記載のコンピュータプログラム。
【請求項16】
命令はさらに前記コンピュータに指示して前記リジェクタをトレーニングさせ、トレーニングは、モンテカルロサンプリングを使用して定義された上界および下界を含む、請求項14記載のコンピュータプログラム。
【請求項17】
前記命令はさらに前記コンピュータに指示して、複数回の反復にわたり前記事前トレーニング済み分類器を使用して前記ノイズ除去済みデータセットを分類または拒否させる、請求項14記載のコンピュータプログラム。
【請求項18】
前記事前トレーニング済みノイズ除去器は、トレーニングされてガウスノイズを緩和またはガウスノイズを除去するように構成されている、請求項14記載のコンピュータプログラム。
【請求項19】
前記リジェクタのパラメータは、正しい分類と誤分類とを区別するよう、前記リジェクタのトレーニングを介して学習するように構成されている、請求項14記載のコンピュータプログラム。
【請求項20】
前記入力データは、マイクロフォンから取得された音響情報を含む、請求項14記載のコンピュータプログラム。
【外国語明細書】