(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-06-28
(54)【発明の名称】入力信号をノイズ除去するための装置及び方法
(51)【国際特許分類】
G06N 3/094 20230101AFI20240621BHJP
【FI】
G06N3/094
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023577493
(86)(22)【出願日】2022-06-10
(85)【翻訳文提出日】2023-12-14
(86)【国際出願番号】 EP2022065898
(87)【国際公開番号】W WO2022263328
(87)【国際公開日】2022-12-22
(31)【優先権主張番号】102021206110.9
(32)【優先日】2021-06-15
(33)【優先権主張国・地域又は機関】DE
(81)【指定国・地域】
(71)【出願人】
【識別番号】390023711
【氏名又は名称】ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング
【氏名又は名称原語表記】ROBERT BOSCH GMBH
【住所又は居所原語表記】Stuttgart, Germany
(74)【代理人】
【識別番号】100114890
【氏名又は名称】アインゼル・フェリックス=ラインハルト
(74)【代理人】
【識別番号】100098501
【氏名又は名称】森田 拓
(74)【代理人】
【識別番号】100116403
【氏名又は名称】前川 純一
(74)【代理人】
【識別番号】100134315
【氏名又は名称】永島 秀郎
(74)【代理人】
【識別番号】100162880
【氏名又は名称】上島 類
(72)【発明者】
【氏名】アンナ コレヴァ
(72)【発明者】
【氏名】ダン チャン
(57)【要約】
供給された入力信号(S)に基づいて分類及び/又は回帰結果を決定するためのコンピュータ実装された方法であって、当該方法は、●第1の部分(4)を供給するステップであって、第1の部分(4)は、供給された入力信号(S)を、入力信号(S)と、ランダムに抽出された第1の値(2)とに基づいてノイズ除去するように構成されている、ステップと、●複数の第1の値(2)をランダムに抽出するステップと、●第1の部分(4)によって、複数のノイズ除去済み信号(x)を決定するステップであって、複数のノイズ除去済み信号(x)からのノイズ除去済み信号(x)は、供給された入力信号(S)と、複数の第1の値(2)からの1つの第1の値(2)とに基づいてそれぞれ決定される、ステップと、●モデルによって、ノイズ除去された値に基づいて複数の予測値を決定するステップであって、それぞれの予測値は、ノイズ除去済み信号の分類、又は、ノイズ除去済み信号に基づく回帰結果を特徴付ける、ステップと、●複数の予測値の集約を特徴付ける1つの集約信号(y)を供給するステップであって、集約信号(y)は、当該方法によって決定される分類及び/又は回帰結果を特徴付ける、ステップと、を含む、方法に関する。
【特許請求の範囲】
【請求項1】
供給された入力信号(S)に基づいて分類及び/又は回帰結果を決定するためのコンピュータ実装された方法であって、当該方法は、
●第1の部分(4)を供給するステップであって、前記第1の部分(4)は、前記供給された入力信号(S)を、前記入力信号(S)と、ランダムに抽出された第1の値(2)とに基づいてノイズ除去するように構成されている、ステップと、
●複数の第1の値(2)をランダムに抽出するステップと、
●前記第1の部分(4)によって、複数のノイズ除去済み信号(x)を決定するステップであって、前記複数のノイズ除去済み信号(x)からのノイズ除去済み信号(x)は、前記供給された入力信号(S)と、前記複数の第1の値(2)からの1つの第1の値(2)とに基づいてそれぞれ決定される、ステップと、
●モデルによって、ノイズ除去された値に基づいて複数の予測値を決定するステップであって、それぞれの予測値は、ノイズ除去済み信号の分類、又は、ノイズ除去済み信号に基づく回帰結果を特徴付ける、ステップと、
●前記複数の予測値の集約を特徴付ける1つの集約信号(y)を供給するステップであって、前記集約信号(y)は、当該方法によって決定される分類及び/又は回帰結果を特徴付ける、ステップと、
を含む、方法。
【請求項2】
当該方法によって、追加的に第3の値が供給され、
前記第3の値は、前記複数の予測値の分散を特徴付ける、
請求項1に記載の方法。
【請求項3】
供給された入力信号(S)をノイズ除去するように前記第1の部分(4)を訓練することに基づいて、前記第1の部分(4)が供給され、
前記第1の部分(4)を訓練することは、
●前記第1の部分(4)に、第1の入力信号(1)及び第1の値(2)を供給するステップであって、前記第1の入力信号(1)は、ノイズ含有信号を特徴付け、前記第1の値(2)は、ランダムに抽出された値を特徴付ける、ステップと、
●前記第1の部分(4)によって、前記第1の入力信号(1)及び前記第1の値(2)に対する第1の出力信号(9)を決定するステップと、
●第2の部分(5)によって、前記第1の出力信号(9)に基づいて第2の値(6)を決定するステップであって、前記第2の値(6)は、前記第1の出力信号(9)がノイズ含有信号を特徴付ける確率を特徴付ける、ステップと、
●前記第2の部分(5)によって、供給された第2の入力信号(3)に基づいて第3の値(7)を決定するステップであって、前記第2の入力信号(3)は、非ノイズ含有信号を特徴付け、前記第3の値(7)は、前記第2の入力信号(3)が非ノイズ含有信号を特徴付ける確率を特徴付ける、ステップと、
●前記第1の部分(4)及び前記第2の部分(5)を訓練するステップであって、前記訓練は、
○前記第1の部分(4)の複数のパラメータを、前記第1の部分(4)の前記複数のパラメータに関する前記第2の値(6)の勾配に従って適合させることと、
○前記第2の部分(5)の複数のパラメータを、前記第2の部分(5)の前記複数のパラメータに関する前記第2の値(6)と前記第3の値(7)との和の勾配に従って適合させることと、
を含む、ステップと、
を含む、請求項1又は2に記載の方法。
【請求項4】
前記方法は、
●前記第1の部分(4)に、第3の入力信号及び第4の値を供給するステップであって、前記第3の入力信号は、非ノイズ含有信号を特徴付ける、ステップと、
●前記第1の部分(4)によって、前記第3の入力信号及び前記第4の値に対する第2の出力信号を決定するステップと、
●前記第1の部分(4)の複数のパラメータを、前記第3の入力信号に対する前記第2の出力信号の偏差に従って適合させるステップと、
をさらに含む、請求項3に記載の方法。
【請求項5】
前記方法は、
●前記第1の部分(4)によって、前記第1の入力信号(1)及び前記第1の値(2)に基づいて、前記第1の入力信号(1)によって特徴付けられるノイズの種類の分類を特徴付ける第5の値を決定するステップと、
●前記第1の部分(4)の複数のパラメータを、前記第5の値によって特徴付けられるクラスと、前記第1の入力信号(1)に対応するノイズの種類のクラスとの偏差に従って適合させるステップと、
をさらに含む、請求項3又は4に記載の方法。
【請求項6】
前記方法は、
●前記第1の部分(4)によって、前記第3の入力信号及び前記第4の値に基づいて、前記第3の入力信号によって特徴付けられるノイズの種類の分類を特徴付ける第5の値を決定するステップと、
●前記第1の部分の複数のパラメータを、前記第5の値によって特徴付けられるクラスと、ノイズの不在を特徴付けるクラスとの偏差に従って適合させるステップと、
をさらに含む、請求項5に記載の方法。
【請求項7】
前記第3の入力信号に対する前記第2の出力信号の前記偏差は、式
【数1】
によって特徴付けられ、ここで、
【数2】
は、前記第3の入力信号であり、Gは、前記第1の部分である、
請求項4乃至6のいずれか一項に記載の方法。
【請求項8】
入力信号(S)からノイズ除去済み信号(x)を決定するためのコンピュータ実装された方法であって、当該方法は、
●請求項1乃至7のいずれか一項に記載の第1の部分(4)を供給するステップと、
●前記第1の部分(4)によって、前記入力信号(S)と、ランダムに抽出された第1の値(2)とに基づいて入力信号(x)を決定するステップと、
●前記出力信号をノイズ除去済み信号(x)として供給するステップと、
を含む、方法。
【請求項9】
供給された前記第1の部分(4)は、請求項1乃至7のいずれか一項に従って訓練されている、
請求項8に記載の方法。
【請求項10】
前記ノイズ除去済み信号(x)は、制御システム(40)の入力として使用され、
前記制御システム(40)は、前記ノイズ除去済み信号(x)に基づいて、アクチュエータ(10)の制御信号(A)を決定するように構成されている、
請求項8又は9に記載の方法。
【請求項11】
前記ノイズ除去済み信号(x)は、前記入力信号(S)自体によって測定されていない前記入力信号(S)の特性を決定するための仮想センサ(30)への入力として使用される、
請求項8又は9に記載の方法。
【請求項12】
前記第1の入力信号及び/又は前記第2の入力信号及び/又は前記第3の入力信号及び/又は前記入力信号(S)は、センサ信号である、
請求項1乃至11のいずれか一項に記載の方法。
【請求項13】
請求項1乃至7のいずれか一項に記載の訓練方法を実施するように構成されている訓練システム(140)。
【請求項14】
プロセッサ(45,145)によって実行された場合に、請求項1乃至12のいずれか一項に記載の方法の全てのステップをコンピュータに実施させるために構成されているコンピュータプログラム。
【請求項15】
請求項14に記載のコンピュータプログラムが格納されている機械可読記憶媒体(46,146)。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、入力信号をノイズ除去するための機械学習システムを訓練するための方法と、入力信号をノイズ除去するための方法と、訓練装置と、コンピュータプログラムと、機械可読記憶装置とに関する。
【背景技術】
【0002】
従来技術
Kupynら著の「“DeblurGAN-v2: Deblurring (Orders-of-Magnitude) Faster and Better” 2019, https://arxiv.org/abs/1908.03826v1」は、入力画像をブラー除去するためのニューラルネットワークを開示している。
【0003】
発明の背景
信号のノイズ除去は、種々の技術分野において頻繁に発生する問題である。特に、ある信号が、センサによって測定されたものである場合、この信号は、相当量のノイズを示す可能性があり、クリーン信号を取得するためにこのノイズをフィルタリングする必要がある。制御タスクのために、例えば自律的なロボットを操縦するために信号を使用する場合には、センサ信号をノイズ除去することが必須である。
【0004】
例えば、視覚信号、例えばカメラ画像に基づいてロボットを制御する場合には、ロボットが動作する環境の仮想的なコピーを決定するための手段として、視覚信号を使用することができる。環境のこの仮想的なコピーを使用して、ロボットの適当な行動を決定することができ、次いで、この行動を現実世界において実行することができる。この関連においては、環境内の同様の現象が、結果的に同様の視覚信号をもたらすことが必須であり、これによって、ロボットは、一貫して確実にこれらの視覚信号に応答することができる。視覚信号が相当量のノイズによって破壊された場合には、信号の処理は、ロボットによって行われる誤った行動につながる可能性がある。
【0005】
しかしながら、既に示唆したように、信号のノイズ除去の必要性は、視覚信号のみに限定されているわけではなく、例えば、音響信号を記録する際、ピエゾセンサによってエンジンの状態を決定する際、又は、レーダ、超音波若しくはLIDARセンサによって測距を実施する際など、感知装置を活用する種々の使用事例に及んでいる。
【0006】
一般的に、ノイズとは、捕捉中、保存中、伝送中、処理中又は変換中に信号が受ける可能性のある望ましくない(一般的には未知の)変化に対する一般的な用語として理解可能である。ノイズには、例えばその統計的特徴(例えば、ホワイトノイズ、ブラックノイズ、又は、ブラウンノイズ)に基づいて区別することができる種々異なる種類が存在する。本発明の関連においては、ノイズは、信号の記録状況から導出されるものとしても理解可能であり、例えば、画像内に見られる雨粒をノイズとして理解することができ、又は、信号を記録するモーションセンサから結果的に生じるモーションブラーをノイズとして理解することができる。
【先行技術文献】
【非特許文献】
【0007】
【非特許文献1】Kupynら著「“DeblurGAN-v2: Deblurring (Orders-of-Magnitude) Faster and Better” 2019, https://arxiv.org/abs/1908.03826v1」
【発明の概要】
【発明が解決しようとする課題】
【0008】
公知の方法は、入力信号をノイズ除去するために決定論的モデルを使用する。しかしながら、本アプローチによる問題は、画像内のノイズが情報の損失の一因となることである。決定論的アプローチを使用すると、情報のこの損失を十分に補償することができないことが多い。したがって、ノイズに起因する信号中の情報の損失に伴って生じる生来の曖昧性又は不確定性を考慮する方法を発明することが望ましい。
【課題を解決するための手段】
【0009】
発明の開示
第1の態様において、本発明は、供給された入力信号に基づいて分類及び/又は回帰結果を決定するためのコンピュータ実装された方法であって、当該方法は、
●第1の部分を供給するステップであって、第1の部分は、供給された入力信号を、入力信号と、ランダムに抽出された第1の値とに基づいてノイズ除去するように構成されている、ステップと、
●複数の第1の値をランダムに抽出するステップと、
●第1の部分によって、複数のノイズ除去済み信号を決定するステップであって、複数のノイズ除去済み信号からのノイズ除去済み信号は、供給された入力信号と、複数の第1の値からの1つの第1の値とに基づいてそれぞれ決定される、ステップと、
●モデルによって、ノイズ除去された値に基づいて複数の予測値を決定するステップであって、それぞれの予測値は、ノイズ除去済み信号の分類、又は、ノイズ除去済み信号に基づく回帰結果を特徴付ける、ステップと、
●複数の予測値の集約を特徴付ける1つの集約信号を供給するステップであって、集約信号は、当該方法によって決定される分類及び/又は回帰結果を特徴付ける、ステップと
を含む、方法に関する。
【0010】
ノイズという用語は、信号処理の分野から周知の用語として理解可能である。すなわち、ノイズとは、捕捉中、保存中、伝送中、処理中又は変換中に信号が受ける可能性のある望ましくない(一般的には未知の)変化に対する一般的な用語として理解可能である。
【0011】
本発明の関連において、信号とは、所定の形態又は形式で編成することができる少なくとも1つの値、しかしながら好ましくは複数の値を含むものとして理解可能である。例えば、信号は、所定の時間にわたって記録されたスカラー値を特徴付けることができ、すなわち、信号は、時系列を特徴付けることができる。信号の値をベクトル、行列、又は、テンソルの形態で編成することもでき、例えば、信号の値は、画像のピクセル、又は、ボリュームエンティティのボクセルを特徴付けることができる。供給された入力信号は、例えば、画像、音響信号、又は、センサからの記録を特徴付けることができ、このようなセンサには、例えば、ピエゾセンサ、温度センサ、圧力センサ、又は、加速度測定用のセンサなどがある。
【0012】
入力信号は、特にセンサによって決定可能、例えば記録可能である。
【0013】
入力信号がノイズによって破壊されている場合、すなわち、信号がノイズ含有信号である場合、このことは、元の信号における情報の損失として理解可能であり、ノイズは、元の信号の値の一部又は全部に重畳されてノイズ含有信号を形成する。元の信号の値を回復することは困難であり、時として不可能な問題でさえある。しかしながら、元の信号の値を推定することは可能である。信号の元の値、すなわち、ノイズが加えられる前のクリーン信号の値を推定するプロセスを、ノイズ除去として理解することができる。入力信号がノイズを含有していない場合には、ノイズ除去は、好ましくはこの入力信号を、ノイズ除去済み信号であると判定すべきである。
【0014】
第1の部分は、第1の部分に供給された信号をノイズ除去するように構成及び訓練された機械学習モデルとして理解可能である。この意味で、第1の部分によって信号に基づいて出力を決定することは、機械学習モデルへの入力として信号を供給して、出力を決定することとして理解可能である。
【0015】
第1の部分は、供給された入力信号をノイズ除去するために、供給された入力信号と、ランダムに抽出された第1の値とを入力として受信するように構成されている。好ましくは、第1の値は、供給された入力信号とともに入力として供給されるランダムな第1の値のベクトル、行列又はテンソルの一部である。換言すれば、第1の部分には、好ましくは、供給された入力信号に対して複数の第1の値を供給することができる。
【0016】
本方法は、供給された入力信号に対して複数の可能なノイズ除去済み信号を決定することとして理解可能であり、出力信号は、ノイズ除去済み信号を特徴付ける。このことは、確率的な方式で実施され、すなわち、出力信号は、入力信号のノイズ除去されたバージョンである尤度が最も高いと第1の部分がみなしたものとして理解可能である。
【0017】
好ましくは、出力信号は、それぞれの第1の値ごとに決定される。好ましくは、複数の第1の値は、複数のベクトルによって特徴付けられ、それぞれの第1の値は、複数のベクトルからの1つの別個のベクトルの一部である。
【0018】
ノイズ除去済み信号を取得すると、モデルを使用して、供給された入力信号の分類が決定されるか、供給された入力信号に基づいて回帰が実施され、すなわち、入力信号に基づいて回帰の結果、つまり、回帰結果が決定される。換言すれば、モデルは、分類のために構成されており、及び/又は、回帰分析を実施するように構成されている。分類は、入力信号に少なくとも1つの離散値を割り当てることとして理解可能であり、その一方で、回帰分析の実施は、供給された入力信号に少なくとも1つの連続値を割り当てることとして理解可能である。
【0019】
分類の典型的な実施形態は、セマンティックセグメンテーション、オブジェクト検出、マルチラベル分類、又は、マルチクラス分類であるものとしてよい。
【0020】
本方法においては、複数の予測値は、好ましくは、それぞれのノイズ除去済みの信号ごとに1つの予測値がモデルから決定されるように決定される。本質的に、このことは、入力信号に対するノイズ除去済み信号についての複数の仮説に関して、供給された入力信号の尤もらしい分類及び/又は回帰結果を決定することとして理解可能である。
【0021】
次いで、複数の予測値を集約することができ、「集約」という用語は、好ましくは複数の予測値を1つの集約信号へと組み合わせることとして理解され、集約信号は、本方法の出力を特徴付ける。例えば、全ての予測値が、分類を特徴付ける離散値である場合には、複数の異なる分類を組み合わせるための公知の方法、例えば多数決を使用することができる。予測値が、確率又は実数値の回帰結果を特徴付ける場合には、複数の値を平均することによって集約を達成することができる。モデルが、分類を特徴付ける予測値と、回帰結果を特徴付ける予測値との両方を出力する場合には、分類を特徴付ける予測値を集約することができ、及び/又は、回帰結果を特徴付ける予測値を集約することができる。換言すれば、分類を特徴付ける予測値を、回帰結果を特徴付ける予測値と組み合わせないことが好ましい。
【0022】
本提案のアプローチの利点は、本方法の出力を決定するために単一のノイズ除去済み信号を使用する代わりに、入力信号に基づくノイズ除去済みの信号についての複数の仮説が決定されることである。したがって、本方法の出力を決定する際には、単一のノイズ除去済み信号が考慮されるのではなく、ノイズ除去済み信号についての複数の異なる仮説が考慮される。本発明者らは、これにより、本方法によって決定される分類の精度、及び/又は、本方法によって決定される回帰結果の精度が向上することを発見した。
【0023】
本方法の好ましい実施形態においては、本方法によって、追加的に第3の値を供給することが可能であり、第3の値は、複数の予測値の分散を特徴付ける。
【0024】
このことは、分類及び/又は回帰結果とともに本方法の出力に関する不確実性の尺度を提供することとしても理解可能である。有利には、これにより、ガイド付きヒューマンマシンインタラクションを行っている人間は、本方法の出力がどのくらい信頼できるものであるか、すなわち、分類及び/又は回帰結果が正確であることがどのくらい尤らしいかを推論することが可能となる。決定された分散の他の利点は、本方法の結果をさらなる処理のために使用する下流のアプリケーションに、それらのアプリケーションの判定の基礎となるより多くの情報が提供されることである。例えば、下流のアプリケーションは、分散値が所定の閾値を超えた場合には、集約信号によって特徴付けられる分類及び/又は回帰結果を拒否することを選択することができる。
【0025】
好ましい実施形態においては、供給された入力信号をノイズ除去するように第1の部分を訓練することに基づいて、第1の部分を供給することも可能であり、第1の部分を訓練することは、
●第1の部分に、第1の入力信号及び第1の値を供給するステップであって、第1の入力信号は、ノイズ含有信号を特徴付け、第1の値は、ランダムに抽出された値を特徴付ける、ステップと、
●第1の部分によって、第1の入力信号及び第1の値に対する第1の出力信号を決定するステップと、
●第2の部分によって、第1の出力信号に基づいて第2の値を決定するステップであって、第2の値は、第1の出力信号がノイズ含有信号を特徴付ける確率を特徴付ける、ステップと、
●第2の部分によって、供給された第2の入力信号に基づいて第3の値を決定するステップであって、第2の入力信号は、非ノイズ含有信号を特徴付け、第3の値は、第2の入力信号が非ノイズ含有信号を特徴付ける確率を特徴付ける、ステップと、
●第1の部分及び第2の部分を訓練するステップであって、訓練には、
○第1の部分の複数のパラメータを、第1の部分の複数のパラメータに関する第2の値の勾配に従って適合させることと、
○第2の部分の複数のパラメータを、第2の部分の複数のパラメータに関する第2の値と第3の値との和の勾配に従って適合させることと
が含まれる、ステップと
を含む。
【0026】
訓練に基づいて第1の部分を供給することは、上記の実施形態に従って第1の部分を訓練し、次いで、分類及び/又は回帰結果を決定するための方法のためにこの第1の部分を使用することとして理解可能である。訓練に基づいて第1の部分を供給することは、分類及び/又は回帰結果を決定するための方法のために、上記の実施形態に従って訓練されている第1の部分を使用することとしても理解可能である。
【0027】
第1の部分及び第2の部分は、第1の部分を訓練するために使用される機械学習システムのサブコンポーネントとして理解可能である。機械学習システムは、敵対的生成ネットワーク(GAN)として理解可能である。第1の部分は、GANの生成器として理解可能であり、第2の部分は、GANの弁別器として理解可能である。GANの用語の観点から、訓練のための方法は、機械学習システムの第1の部分と第2の部分との間のゼロサムゲームとして理解可能である。第1の部分は、入力信号から、ノイズ除去済みの信号に忠実に類似した出力信号を生成することを探求するものであり、その一方で、第2の部分は、第1の部分から生成された信号と非ノイズ含有信号とを弁別することを探求するものである。したがって、訓練中、第1の部分は、第1の部分からの出力信号がこれ以上非ノイズ含有信号とは区別できなくなるところまで、ますます多くの「ノイズ除去済みのようにみえる」入力信号を生成することを学習する。
【0028】
クリーン信号、すなわち、ノイズを含有していない又は無視できる程度の量のノイズしか含有していない信号の特性に関する情報は、クリーン信号として理解可能である第2の入力信号を介して訓練プロセスに注入される。機械学習システムには、第1の入力信号及び第2の入力信号によってノイズ含有信号及び非ノイズ含有信号のそれぞれに関する情報が供給される。
【0029】
第2の部分は、第1の部分によって生成された出力信号と、第2の入力信号との間の差を学習することを試行するものとして理解可能である。対照的に、第1の部分は、クリーン信号とは見分けることができない出力信号を生成することを探求するものである。要するに、このことにより、ノイズを含有する入力信号に基づいてクリーンな出力信号を生成することを学習する第1の部分がもたらされる。換言すれば、第1の部分は、入力信号をノイズ除去することを学習する。
【0030】
好ましくは、第1の部分及び第2の部分は、ニューラルネットワークとして実現される。好ましくは、ニューラルネットワークは、勾配に基づくアルゴリズムを使用して訓練される。訓練のために、損失関数を定義することができ、この損失関数は、機械学習システムの訓練中に最小化される。好ましくは、第2の値は、ノイズ含有信号として分類されるべき出力信号の負の対数尤度であり、第3の値は、クリーン信号として、すなわち、ノイズを含有していない信号として分類されるべき第2の入力信号の負の対数尤度である。
【0031】
次いで、訓練のために、第2の値及び第3の値に基づいて損失関数を構築することができる。例えば、損失関数を、第2の値と第3の値との和によって特徴付けることができる。次いで、第1の部分を、損失関数に対して勾配上昇アルゴリズムによって訓練することができ、その一方で、第2の部分を、勾配降下アルゴリズムによって訓練することができる。代替的に、第1の部分を、負の損失関数に対して勾配降下法によって訓練することもできる。第1の部分の訓練は、第2の値のみに影響を及ぼすので、第1の部分の訓練を、第2の値のみに基づいて勾配上昇アルゴリズムによって実施することもできる。
【0032】
複数の第1の入力信号を訓練するために、第2の入力信号を、それぞれの勾配に基づくアルゴリズムのそれぞれのステップにおいて使用することも可能である。この場合、損失関数は、個々のサンプルに対する損失関数の平均を特徴付けることができる。
【0033】
本提案のアプローチの利点は、第1の部分に、第1の入力信号に加えて第1の値も供給されることであり、第1の値は、好ましくは、訓練のそれぞれのステップ中に、所定の確率分布からランダムに抽出可能である。以下においては、なぜこのことが本発明の有利な特徴であるかについて説明する。
【0034】
上記のように、ノイズ含有信号の値が与えられると、ノイズの印加によってノイズ含有信号となったクリーン信号の元の値は、多くの場合、回復することができない。さらなる情報がなければ、信号の破壊された値の元の値は、広範囲の値になり得たものである。しかしながら、元の値の確率分布を決定することができる。そのような確率分布が存在する場合には、この確率分布により、元の値を推定する複数の手法、例えば、この分布から値をランダムに抽出して、この値を元の値の推定値として供給することによる手法、又は、確率分布から複数の値を抽出して、これらの抽出された値の期待値を元の値の推定値として供給することによる手法などが可能となる。
【0035】
したがって、第1の部分は、第1の入力信号の元の値を推定するためのモデルとして理解可能である。第1の部分には、ランダムに抽出された第1の値が供給されるので、同じ第1の入力信号が供給されたが異なる第1の値が供給された場合には異なる出力信号を生成することを学習するように、第1の部分が動機付けられる。好ましくは、第1の部分には、第1の入力信号に対する複数の第1の値が供給され、これらの複数の第1の値は、多変量確率分布から抽出可能である。
【0036】
本提案の本発明の他の利点は、第1の部分が、種々異なる種類のノイズの入力信号をノイズ除去することを学習することが可能であることである。例えば、ノイズ除去されるべき入力信号が画像である場合には、ノイズの種類は、ランダムピクセルノイズ、グレア、ブラー、又は、画像の内容に依存するノイズ、例えば雨であり得る。本発明者らは、第1の部分が、複数の異なる種類のノイズを取り除くことを学習することが可能であることを発見した。第1の値は、ノイズを取り除くプロセスをガイドする効果を有する。例えば、第1の部分としてニューラルネットワークが使用される場合には、ニューラルネットワークの任意の層におけるニューラルネットワークへの入力として、ノイズを供給することができ、第1の値が入力として供給される層の位置は、ノイズを取り除くことに対する直接的な影響を有する。例えば、第1の値がニューラルネットワークの第1の層への入力として供給される場合には、第1の値は、入力信号の局所的な部分に、例えば画像内の隣り合うピクセルに、又は、音響信号内の隣り合う点に影響を及ぼす。なぜなら、ニューラルネットワークが、自身のより前にある層において局所的な特徴を処理するからである。対照的に、ニューラルネットワークの最後の層への入力として第1の値を供給することは、入力信号の全体的な部分に、例えば、画像の領域に、又は、音響信号の区分に影響を及ぼす。なぜなら、ニューラルネットワークが、自身のより後ろにある層において大域的な特徴を処理するからである。最初の層と最後の層との間にある層に第1の値が供給される場合には、入力信号の局所的な部分(より前にある層)から入力信号の大域的な部分(より後ろにある層)へと影響を徐々にシフトさせることができる。第1の部分によって取り除かれるノイズの種類を狭めることができる場合、このことが特に有用である。例えば、入力信号において予期されるノイズが局所的な性質のもの、例えばピクセルノイズであることが判明している場合には、第1の値を、より前にある層に供給することができる。対照的に、入力信号において予期されるノイズが大域的な性質のもの、例えば雨のような天候影響に起因するノイズである場合には、第1の値を、より後ろにある層に供給することができる。
【0037】
要約すると、第1の値は、ノイズ除去プロセスを操縦する効果を有し、ノイズ除去済み信号の品質を改善し、すなわち、より良好なノイズ除去性能を達成することを可能にするものである。
【0038】
第1の部分が取り除くことを学習すべきノイズの種類は、1つ又は複数の第1の入力信号によって定義可能である。ある種類のノイズが第1の入力信号内に存在する場合には、第1の部分は、その種類のノイズを取り除くことを学習することが可能である。したがって、第1の入力信号は、訓練データセットとして理解可能であり、第1の入力信号内のノイズの特定の構成は、訓練後に第1の部分を使用して入力信号からどの種類のノイズを取り除くことができるかを定義するものとして理解可能である。
【0039】
複数の種類のノイズを処理するように単一のモデルを訓練する他の利点は、第1の部分が、1種類の破壊のみに基づいて訓練された場合と比較して、推論時に初見のノイズに対してより適当に汎化を行うことも学習することである。換言すれば、第1の部分の訓練中には観測されなかったノイズが、訓練後に第1の部分に提示された場合に、第1の部分は、ノイズ除去済みの出力信号をより正確に予測することが可能となる。
【0040】
要約すると、本提案の訓練アルゴリズムと組み合わせられた機械学習システムの特定の設計により、種々異なる種類のノイズに対して、供給された入力信号のクリーンなバージョンを推定することができる第1の部分がもたらされる。第1の部分は、種々異なる種類のノイズを見分けることが可能であるので、生成された出力信号は、クリーン信号により正確に類似することとなる。換言すれば、入力信号のノイズ除去が改善される。
【0041】
機械学習システムを訓練するための方法は、
●第1の部分に、第3の入力信号及び第4の値を供給するステップであって、第3の入力信号は、ノイズ含有信号を特徴付けるものではない、ステップと、
●第1の部分によって、第3の入力信号及び第4の値に対する第2の出力信号を決定するステップと、
●第1の部分の複数のパラメータを、第3の入力信号に対する第2の出力信号の偏差に従って適合させるステップと、
をさらに含むことも可能である。
【0042】
この特定の実施形態の主な利点は、第1の部分が、そもそもノイズを含有していない入力信号をノイズ除去しないことを学習することである。一般的に、これにより、ノイズを含有する入力信号と、ノイズを示さない入力信号との両方を取り扱う際における第1の部分の性能が改善される。例えば、機械学習システムは、1日の経過にわたって記録されるカメラ画像を処理するように構成可能である。夜明け、夕暮れ及び夜間には、カメラの記録プロセスに起因して画像がノイズを含有する場合があるが、その一方で、十分な光を利用することができる日中に記録される画像は、無視できる量のノイズしか示さない場合がある。ここでは、上記のような追加的な特徴によって訓練された第1の部分を、画像内に存在するノイズの実際の量にかかわらずカメラ画像に適用することが可能であろう。
【0043】
本実施形態の他の利点は、第1の部分が、出力信号を決定する際に入力信号を考慮するように訓練されることである。換言すれば、これにより、第1の部分が出力信号を決定する際に第1の値のみに依存しないようにすることが可能となる。これにより、ノイズ除去がさらに一層改善される。
【0044】
第1の値と同様に第4の値も、好ましくはランダムに抽出可能である。好ましい実施形態においては、複数の第4の値を、第3の入力信号のために、例えば、ベクトル、行列、又は、テンソルの形態で供給することができる。
【0045】
さらなる実施形態においては、第2の入力信号を第3の入力信号として使用することができる。これらの実施形態においては、第1の値を第4の値として使用することができ、又は、別のランダムな値を第4の値として抽出することができる。
【0046】
第3の入力信号に対する第2の出力信号の偏差は、第2の出力信号と第3の出力信号との間の距離、例えばユークリッド距離又はマンハッタン距離を決定する損失関数によって特徴付け可能である。この損失関数は、入力信号内にノイズが存在しない場合に入力信号を出力信号としてコピーすることを学習することを第1の部分に強制するものとしてみなされ得る。したがって、上記で説明した損失関数は、恒等損失関数とみなされ得る。訓練のために、恒等損失関数を上記のGAN訓練からの損失関数に追加して、大域的な損失関数を形成することができる。好ましくは、恒等損失関数を、大域的な損失関数における所定の係数によって重み付けすることができる。
【0047】
好ましい実施形態においては、訓練するための方法は、
●第1の部分によって、第1の入力信号及び第1の値に基づいて、第1の入力信号によって特徴付けられるノイズの種類の分類を特徴付ける第5の値を決定するステップと、
●第1の部分の複数のパラメータを、第5の値によって特徴付けられるクラスと、第1の入力信号に対応するノイズの種類のクラスとの偏差に従って適合させるステップと、
をさらに含むことも可能である。
【0048】
本アプローチは、入力信号内に存在するノイズの種類を分類するというタスクを、機械学習システムの第1の部分に追加的に課すこととして理解可能である。本発明者らは、第1の部分の教師あり訓練のこの形態が、訓練の正則化として作用し、取り除かれるべきノイズに関してさらにより多くの情報が提示されるので、第1の部分の性能をさらに一層向上させることを発見した。
【0049】
本実施形態においては、第1の入力信号には、第1の入力信号が示すノイズの種類を特徴付けるクラスラベルが割り当てられている。このクラスラベルは、専門家によって割り当て可能であり、又は、教師なしラベル付け方法を介して、例えばノイズを含有する第1の入力信号をクラスタリングすることによって決定可能であり、第1の入力信号のクラスタメンバーシップは、第1の部分が予測すべき所望のクラスを決定する。いずれの場合でも、割り当てられたクラス及び/又は割り当てられたクラスラベルは、第1の入力信号に対応するものとしてみなされ得る。
【0050】
この特定の実施形態の他の利点は、下流のアプリケーションに、所与の入力信号に対する出力信号と、機械学習システムの第1の部分の分類とを供給することができることである。このようにして、下流のアプリケーションには、ノイズ除去前の入力信号に関してより多くの情報が供給され、これにより、下流のアプリケーションは、出力信号をさらにより正確に処理することが可能となる。
【0051】
好ましい実施形態においては、訓練するための方法は、
●第1の部分によって、第3の入力信号及び第4の値に基づいて、第3の入力信号によって特徴付けられるノイズ種類の分類を特徴付ける第5の値を決定するステップと、
●第1の部分の複数のパラメータを、第5の値によって特徴付けられるクラスと、ノイズの不在を特徴付けるクラスとの偏差に従って適合させるステップと、
をさらに含むことも可能である。
【0052】
本実施形態の利点は、第1の部分が、ノイズを含有していない入力信号の分類も学習することである。本発明者らは、これにより、第1の部分のノイズ除去性能がさらに一層改善されることを発見した。
【0053】
第3の入力信号を用いて訓練する場合には、第3の入力信号に対する第2の出力信号の偏差が、式
【数1】
によって特徴付けられることが好ましく、ここで、
【数2】
は、第3の入力信号であり、Gは、第1の部分であり、
【数3】
は、関数G、すなわち、第1の部分の引数を示し、
【数4】
及び
【数5】
は、それぞれランダムに抽出された第1の値を示し、すなわち、第1の値の実現を示す。
【0054】
複数の第3の入力信号を、例えば機械学習システムのバッチ毎の訓練の形態で、訓練のために使用することが可能である。訓練のために使用される第3の入力信号のバッチ内のそれぞれの第3の入力信号ごとにそれぞれの第1の値を、それぞれの訓練ステップごとにランダムに抽出することができる。この場合、損失関数は、好ましくは上記の式における期待値
【数6】
によって示されるように、第3の入力信号の各々にわたる予期される損失を特徴付けることができる。
【0055】
本実施形態の利点は、入力信号がノイズを含有していない場合に、第1の部分がこの入力信号を出力信号として出力することを学習するように訓練されることである。このことは、ノイズを含有していない入力信号に遭遇したときには第1の値を考慮しないように第1の部分を訓練することによって達成される。非ノイズ含有信号の場合における第1の値に対するこの非依存的挙動は、第3の入力信号に対する2つのランダムに抽出された第1の値を第1の部分に提供することと、第3の入力信号yに対する出力信号と、2つのランダムに抽出された第1の値との間の距離を最小化するように、機械学習システムの第1の部分を訓練することとによって達成される(損失関数の2番目の被加数を参照のこと)。
【0056】
さらに他の実施形態においては、式
【数7】
によって特徴付けられる損失関数に基づいて第1の部分を追加的に訓練することも可能であり、ここで、
【数8】
及び
【数9】
は、ノイズを含有する入力信号であり、
【数10】
は、
【数11】
よりも多くのノイズを含有する。上記の式によって特徴付けられる損失関数に基づいて第1の部分を訓練することにより、入力信号内のノイズの量が増加した場合に、第1の部分がより多様な出力信号を生成することとなる。換言すれば、供給された入力信号が、他の信号よりも多くのノイズを含有している場合には、供給された入力信号に対する可能な出力信号は、他の信号に対して決定される出力信号よりもより高い多様性を有するべきである。発明者らは、本アプローチがモデルの予測性能の向上につながることを発見した。
【0057】
訓練のために、信号
【数12】
及び
【数13】
を、訓練データセットからランダムにサンプリングすることができる。2つの信号のうちのどちらがより多くのノイズを含有しているかを判定するために、標準的な指標、例えば信号対雑音比を使用することができる。画像内のノイズが意味論的な性質のものである場合(例えば、雨又は降雪)には、それぞれのノイズの強さを特徴付ける入力信号の追加的なメタデータを使用することもできる。
【0058】
このようにして第1の部分を訓練することは、最適化問題のマージンとして、すなわち、
【数14】
及び
【数15】
に対する出力信号の分散の差を特徴付けるものとして理解可能であるハイパーパラメータτを必然的に伴う。
【0059】
【数16】
に対するクリーンな入力信号を使用することも可能である。本著者らは、これにより、ますます多くのノイズを含有する入力信号に対して多様な出力信号を生成するための第1の部分の能力がさらに向上し、ひいてはモデルの性能がさらに向上することを発見した。
【0060】
第1の部分は、クリーン信号に、すなわち、ノイズを含有していない入力信号に如何なる変更も加えるべきではないので、上記の式における項
【数17】
を、
【数18】
がクリーンな入力信号である場合には
【数19】
によって置き換えることも可能であり、又は、
【数20】
がクリーンな入力信号である場合には
【数21】
によって置き換えることも可能である。
【0061】
他の態様において、本発明は、入力信号からノイズ除去済み信号を決定するためのコンピュータ実装された方法であって、当該方法は、
●上記で提示した訓練方法の一実施形態による第1の部分を供給するステップと、
●第1の部分によって、入力信号と、ランダムに抽出された第1の値とに基づいて出力信号を決定するステップと、
●出力信号をノイズ除去済み信号として供給するステップと、
を含む、方法に関する。
【0062】
ノイズ除去のための方法は、訓練のための方法において得られた機械学習システムの第1の部分を適用することとして理解可能である。第1の部分を供給するステップの特徴は、上記で提示した訓練方法の一実施形態に従って第1の部分を訓練し、次いで、訓練された第1の部分を供給することとして理解可能である。代替的に、この特徴は、本発明の一実施形態に従って構成された第1の部分、及び/又は、本発明の一実施形態による方法を用いて訓練された第1の部分を使用することとしても理解可能である。
【0063】
機械学習システムの第1の部分は、入力信号が与えられた場合にノイズ除去済みの信号を決定することを学習しているので、ノイズ除去のために機械学習システムの第1の部分を使用することが可能である。利点は、第1の部分が、ノイズ除去済みの信号を高精度で決定することができることである。本提案のアプローチの他の利点は、ノイズを含有していない入力信号を、ノイズ除去方法のための入力として使用することもできることである。なぜなら、第1の部分は、ノイズを含有していない入力信号を別個に取り扱うこと、すなわち、ノイズを含有してない入力信号の値を可能な限り最良に保存することを学習しているからである。したがって、信号処理パイプラインにおいて、第1の部分を、さらなる処理の前に入力信号に適用することができる。なぜなら、第1の部分は、一般的に、例えば入力信号からのデータの分類(例えば、画像におけるオブジェクト検出、音響信号におけるスピーカ分類、エンジンのインジェクタのバルブが閉成される時点の分類、その場合、センサ信号は、バルブのピエゾセンサからのデータを特徴付ける)などの下流のタスクの性能を向上させるからである。
【0064】
本アプローチの利点は、(ノイズ除去済みの入力信号として理解可能である)出力信号を、下流のタスクのためにより効率的に使用することができることである。なぜなら、ノイズ除去は、例えば入力信号を分類するための代用として出力信号を分類する場合に、下流のタスクにおいてより良好な処理を可能にするからである。これにより、下流のタスクの性能、例えば分類の性能が改善される。
【0065】
例えば、ノイズ除去済み信号は、入力信号自体によって測定されていない入力信号の特性を決定するための仮想センサへの入力として使用可能である。
【0066】
一般的に、ノイズ除去済み信号は、制御システムの入力として使用可能であり、制御システムは、ノイズ除去済み信号に基づいて、アクチュエータの制御信号を決定するように構成されている。
【0067】
制御システムは、例えば、少なくとも半自律的なロボットを制御するように構成可能であり、入力信号は、ロボットの環境の知覚を特徴付けるセンサ信号であり、制御信号は、ロボットの行動の少なくとも一部を制御する。ここでの利点は、入力信号をノイズ除去することによって、制御システムは、環境をより正確に認識することができ、ひいてはアクチュエータのより適当な制御信号によってロボットによるより良好な行動を決定することができることである。
【0068】
本発明の実施形態を、以下の図面を参照しながらより詳細に説明する。
【図面の簡単な説明】
【0069】
【
図2】機械学習システムを訓練するための訓練システムを示す図である。
【
図3】機械学習システムの出力信号に基づいてアクチュエータを制御するための制御システムを示す図である。
【
図4】少なくとも半自律的な車両を制御する制御システムを示す図である。
【
図5】バルブを制御する制御システムを示す図である。
【発明を実施するための形態】
【0070】
実施形態の説明
図1は、機械学習システム(8)の一実施形態を示している。機械学習システムは、生成器と称される第1の部分(4)と、弁別器と称される第2の部分(5)とを含む。機械学習システムは、敵対的生成ネットワークとして理解可能である。本実施形態においては、生成器(4)及び弁別器(5)は、好ましくはそれぞれのニューラルネットワークによって提供可能である。したがって、機械学習システム(8)は、より大きいニューラルネットワークとしても理解可能であり、その場合、生成器(4)及び弁別器(5)は、機械学習システム(8)のサブニューラルネットワークを形成する。さらなる実施形態においては、生成器(4)及び/又は弁別器(5)は、他の機械学習モデル、例えばサポートベクトルマシンによっても提供可能である。
【0071】
図面は、機械学習システムをどのようにして訓練のために構成することができるかを示している。機械学習システムには、第1の入力信号(1)が供給され、この第1の入力信号(1)は、生成器(4)に転送される。第1の入力信号(1)は、ノイズ含有信号を特徴付け、機械学習システム(8)は、ノイズ含有信号をノイズ除去することを学習すべきである。機械学習システム(8)には、ランダムに抽出された第1の値(2)も供給され、この第1の値(2)も、生成器(4)に転送される。本実施形態においては、第1の値(2)は、標準正規分布から抽出される。さらなる実施形態においては、第1の値(2)を抽出するために他の確率分布を使用することもできる。さらに他の実施形態においては、機械学習システムに、第1の値のベクトル(2)を供給することもでき、ベクトル(2)は、多変量確率分布から、好ましくは多変量標準正規分布から抽出される。機械学習システム(8)には、非ノイズ含有信号、すなわち、クリーン信号を特徴付ける第2の入力信号(3)も供給される。第2の入力信号(3)は、弁別器(5)に転送される。
【0072】
第1の入力信号(1)及び第2の入力信号(3)は、特に、光学装置(例えば、カメラ、レーダセンサ、LIDARセンサ、超音波センサ、熱センサ)、ピエゾセンサ、マイクロフォン、又は、電流測定用若しくは電圧測定用のセンサのような感知装置から受信されるセンサ信号であるものとしてよい。
【0073】
生成器(4)は、第1の入力信号(1)及び第1の値(2)を受信し、第1の入力信号(1)及び第1の値(2)に基づいて出力信号(9)を決定する。出力信号(9)は、第1の信号(1)と同じ種類の信号を特徴付けるものとして理解可能である。例えば、第1の入力信号(1)が画像である場合には、出力信号(9)は、第1の入力信号(1)に基づいて得られたノイズ除去済み画像として理解可能である。
【0074】
出力信号(9)は、第2の入力信号(2)とともに弁別器(5)によって受信される。弁別器(5)は、出力信号(9)及び第2の入力信号(3)の両方を分類するように構成されている。このために、弁別器(5)は、出力信号(9)に第2の値(6)を割り当てることができ、第2の値(6)は、出力信号(9)がノイズ含有信号である確率を特徴付ける。また、弁別器(5)は、第2の入力信号(3)に第3の値(7)を割り当てることができ、第3の値(7)は、第2の入力信号(3)がクリーン信号である確率を特徴付ける。例えば、第2の値(6)及び第3の値(7)は、確率、対数尤度又は好ましくは負の対数尤度をそれぞれ特徴付けることができる。
【0075】
図2は、機械学習システム(8)を訓練するための訓練システム(140)の一実施形態を示している。訓練は、訓練データセット(T)に基づいて実施される。訓練データセット(T)は、ノイズ含有信号を特徴付ける複数の第1の入力信号(1)と、クリーン信号を特徴付ける複数の第2の入力信号(3)とを含み得る。代替的に、訓練データセット(T)は、複数の第1の入力信号(1)を含まないものとしてもよい。その場合、訓練のために、複数の第2の入力信号(3)に基づいて、例えば、複数の第2の入力信号(3)から信号を選択して、選択した信号にノイズを加えることにより、複数の第1の入力信号(1)を決定することができる。
【0076】
訓練のために、訓練データユニット(150)は、コンピュータ実装データベース(St2)にアクセスし、データベース(St2)は、訓練データセット(T)を供給する。訓練データユニット(150)は、訓練データセット(T)から少なくとも1つの第1の入力信号(1)及び少なくとも1つの第2の出力信号(2)を好ましくはランダムに決定し、少なくとも1つの第1の入力信号(1)及び少なくとも1つの第2の出力信号(2)を機械学習システム(8)に供給する。追加的に、訓練データユニット(150)は、第1の値(2)、好ましくは第1の値のベクトル(2)をランダムに決定して、それを機械学習システム(8)に供給する。訓練データセット(T)が第1の入力信号(1)を含まない場合には、訓練データユニット(150)は、複数の第2の入力信号(3)から信号をランダムに選択し、選択した信号にノイズを加え、結果として生じたノイズ含有信号を、第1の入力信号(1)として機械学習システム(8)に供給することもできる。他の好ましい実施形態においては、訓練データユニット(150)は、第1の入力信号(1)及び第2の入力信号(3)のバッチをランダムに選択することもでき、その場合、バッチサイズも、第1の入力信号(1)と第2の入力信号(2)との間の比率も、訓練手順のハイパーパラメータである。
【0077】
いずれの場合でも、少なくとも1つの第1の入力信号(1)と、少なくとも1つの第2の入力信号(3)とが機械学習システム(8)に転送され、機械学習システム(8)は、それぞれの第1の入力信号(1)に対して第2の値(6)を決定し、それぞれの第2の入力信号(3)に対して第3の値(7)を決定する。
【0078】
第2の値(6)及び第3の値(7)は、次いで、修正ユニット(180)に転送される。次いで、修正ユニット(180)は、第2の値(6)及び第3の値(7)に基づいて、機械学習システム(8)のための新たなパラメータ(Φ’)を決定する。新たなパラメータ(Φ’)は、機械学習システム(8)の第1の部分(4)及び第2の部分(5)のための新たなパラメータを含む。好ましくは、新たなパラメータ(Φ’)を決定することは、勾配降下法によって達成され、勾配は、損失関数に基づいて決定される。第2の部分(5)の新たなパラメータを決定するために、損失関数は、好ましくは第1の式
【数22】
によって特徴付けられ、ここで、D(・)は、所与の入力信号に対する第2の部分(5)の出力を特徴付け、
【数23】
は、複数の第2の入力信号(3)のうちのi番目の要素を特徴付け、
【数24】
は、複数の第1の入力信号(1)のうちのj番目の要素を特徴付け、
【数25】
は、j番目の第1の入力信号(1)に対応する第1の値(2)を特徴付け、G(・,・)は、所与の第1の入力信号(1)と、対応する第1の値(2)とに対する第1の部分(4)の出力を特徴付ける。第1の部分(4)の新たなパラメータを決定するために、損失関数は、好ましくは第2の式
【数26】
によって特徴付けられる。次いで、勾配が、好ましくは第1の部分(4)に対しては第2の式に従って決定され、第2の部分(5)に対しては第1の式に従って決定される。機械学習システム(8)は、GANの特別な形態として理解可能であるので、公知のGAN訓練技術を、訓練のために使用することができ、例えば、第1の部分又は第2の部分を所定の反復回数にわたって別々に訓練し、その一方で、他方の部分のパラメータ又はスペクトル正規化を固定することができる。本実施形態においては、m及びnは、訓練手順のハイパーパラメータとして理解可能である。
【0079】
さらに、訓練システム(140)は、少なくとも1つのプロセッサ(145)と、少なくとも1つの機械可読記憶媒体(146)とを含み得るものであり、少なくとも1つの機械可読記憶媒体(146)には、プロセッサ(145)によって実行された場合に本発明の態様のうちの1つによる訓練方法を訓練システム(140)に実行させる命令が含まれている。
【0080】
さらなる実施形態においては、もはやノイズを含有していない入力信号をノイズ除去しないように、機械学習システムを訓練することも可能である。このために、第1の部分の新たなパラメータが、第3の式
【数27】
によって特徴付けることができる損失関数に基づいて追加的に決定され、ここで、
【数28】
は、ノイズを含有していない複数の入力信号(第3の入力信号と称される)のうちのk番目の要素を特徴付け、
【数29】
及び
【数30】
は、ランダムに抽出された第1の値(2)を特徴付け、
【数31】
は、p-ノルム、好ましくはL
2-ノルムを特徴付ける。次いで、第1の部分(4)の訓練を、第2の式と第3の式との和に関する勾配の決定に基づいて、好ましくは、所定の係数に従って被加数を重み付けすることによって達成することができる。
【0081】
さらに他の実施形態によれば、第1の部分(4)は、例えば、加法性ノイズ、量子化誤差、乗法性ノイズ、又は、ショットノイズなど、第1の入力信号(1)に供給されるノイズの種類の分類を決定するようにも構成可能である。機械学習システムは、特に、入力信号がノイズを含有していない場合に、「ノイズなし」というラベルを特徴付けるクラスであると判定するように構成可能である。機械学習システムには、第1の入力信号(1)のラベルを供給することもでき、このラベルは、第1の入力信号(1)からのノイズが属しているノイズのクラスを特徴付ける。次いで、第1の部分(4)のための新たなパラメータを、好ましくは第4の式
【数32】
によって特徴付けられる追加的な損失関数に基づいて決定することができ、ここで、G
c(・)は、第1の部分(4)によって決定された分類であり、
【数33】
は、第1の入力信号
【数34】
のクラスのクラスインデックスc
iにおいて評価されるソフトマックス関数であり、sm
C+1は、「ノイズなし」というクラスを特徴付けるクラスインデックスC+1において評価されるソフトマックス関数である。第2の式、第3の式及び第4の式からの損失関数は、重み付けされた和へと共に加算されて、合計損失関数を形成することができ、この合計損失関数を、訓練中に最適化すべきである。換言すれば、第1の部分(4)を訓練するために使用される勾配は、特に、第2の式と、第3の式と、第4の式との重み付けされた和を特徴付ける1つの損失関数に基づいて決定可能である。
【0082】
ラベル付けされていない第1の入力信号(1)をクラスタリングし、1つのクラスタ内の第1の入力信号(1)に同じラベルを割り当てることによって、ラベルを取得することもできる。
【0083】
さらに他の実施形態によれば、第3の入力信号を、第4の式の2番目の被加数によって処理することもできる。
【0084】
図3には、アクチュエータ(10)の環境におけるアクチュエータ(10)を制御するための制御システム(40)の一実施形態が示されている。アクチュエータ(10)とアクチュエータ(10)の環境(20)とを、合わせてアクチュエータシステムと称することとする。好ましくは等間隔の時点に、センサ(30)がアクチュエータシステムの状態を感知する。センサ(30)は、複数のセンサを含み得る。好ましくは、センサ(30)は、環境(20)の画像を撮影する光学センサである。感知された状況を符号化する、センサ(30)の出力信号(S)(又はセンサ(30)が複数のセンサを含む場合には、これらのセンサの各々ごとの出力信号(S))が、制御システム(40)に送信される。
【0085】
それにより、制御システム(40)は、センサ信号(S)のストリームを受信する。次いで、制御システム(40)は、センサ信号(S)のストリームに依存して一連の制御信号(A)を計算し、これらの制御信号(A)は、次いで、アクチュエータ(10)に送信される。
【0086】
制御システム(40)は、センサ(30)のセンサ信号(S)のストリームを、機械学習システム(8)の第1の部分(4)において受信する。追加的に、ランダム生成器ユニット(R)が、それぞれのセンサ信号(S)ごとに複数の第1の値(2)をランダムに決定する。第1の部分(4)は、それぞれの第1の値(2)及びそのセンサ信号(S)ごとに1つの出力信号(x)を決定する。出力信号(x)は、ノイズ除去済み信号(x)として理解可能である。したがって、それぞれのセンサ信号(S)ごとに複数の出力信号(x)が存在する。次いで、1つのセンサ信号(S)に対して、それぞれの出力信号(x)が、第2の機械学習システム(60)によって、好ましくは、分類器によって、又は、回帰分析を実施するように構成された機械学習モデルによって処理される。1つのセンサ信号(S)に対して決定された複数の出力信号(x)の各々に対して、第2の機械学習システムが1つの出力を決定し、次いで、複数の出力信号(x)に対するそれぞれ異なる出力が、1つの集約信号(y)へと集約される。例えば、第2の機械学習システム(60)が分類を実施するように構成されている場合には、第2の機械学習システム(60)から決定された複数の出力を、多数決によって集約して1つの集約信号(y)を決定することができる。第2の機械学習システム(60)が回帰分析を実施するように構成されている場合には、1つの集約信号(y)を決定するために、複数の出力信号(x)に対するそれぞれ異なる出力を合計又は平均することができる。
【0087】
さらなる実施形態においては、集約信号(y)は、第2の機械学習システム(60)から決定された複数の異なる出力の分散、例えば複数の異なる出力の標準偏差を特徴付ける値をさらに含み得る。
【0088】
集約信号(y)は、任意選択肢の変換ユニット(80)に送信され、変換ユニット(80)は、集約信号(y)を制御信号(A)に変換する。次いで、制御信号(A)は、アクチュエータ(10)を相応に制御するためにアクチュエータ(10)に送信される。代替的に、集約信号(y)を直接的に制御信号(A)として取得するものとしてもよい。
【0089】
アクチュエータ(10)は、制御信号(A)を受信し、相応に制御され、制御信号(A)に対応する行動を実施する。アクチュエータ(10)は、制御信号(A)をさらなる制御信号に変換する制御ロジックを含み得るものであり、その場合、このさらなる制御信号を使用してアクチュエータ(10)が制御される。
【0090】
さらなる実施形態においては、制御システム(40)は、センサ(30)を含み得る。さらに他の実施形態においては、制御システム(40)は、代替的又は追加的にアクチュエータ(10)を含み得る。
【0091】
さらに他の実施形態においては、制御システム(40)が、アクチュエータ(10)に代えて又はこれに加えて、ディスプレイ(10a)を制御することを想定することができる。
【0092】
さらに、制御システム(40)は、少なくとも1つのプロセッサ(45)と、少なくとも1つの機械可読記憶媒体(46)とを含み得るものであり、少なくとも1つの機械可読記憶媒体(46)上には、実行された場合に本発明の一態様による方法を制御システム(40)に実行させる命令が格納されている。
【0093】
図4は、少なくとも半自律的なロボット、例えば少なくとも半自律的な車両(100)を制御するために制御システム(40)が使用される実施形態を示している。
【0094】
センサ(30)は、1つ又は複数のビデオセンサ、及び/又は、1つ又は複数のレーダセンサ、及び/又は、1つ又は複数の超音波センサ、及び/又は、1つ又は複数のLiDARセンサを含み得る。これらのセンサの一部又は全部は、必須ではないが、好ましくは車両(100)に搭載されている。したがって、ノイズ除去済み信号(x)は、画像として理解可能であり、第2の機械学習システム(60)は、画像分類器又は画像回帰器(すなわち、画像回帰のために構成されたモデル)として理解可能である。
【0095】
第2の機械学習システム(60)は、供給された出力信号(x)に基づいて、少なくとも半自律的なロボットの近傍にあるオブジェクトを検出するように構成可能である。集約信号(y)は、少なくとも半自律的なロボットの近傍におけるどこにオブジェクトが位置しているかを特徴付ける情報を含み得る。追加的に、集約信号(y)は、オブジェクトの位置及び/又は延在の分散に関する情報を、例えば不確実性値の形態で含み得る。次いで、例えば検出されたオブジェクトとの衝突を回避するために、これらの情報のうちのいずれか1つ又は全部に従って制御信号(A)を決定することができる。
【0096】
集約信号(y)に含まれている分散情報は、ノイズ除去済み信号(x)において検出されたオブジェクトを追跡するために、例えばカルマンフィルタにおいて使用可能であり、その場合、分散情報は、観測ノイズの分散として使用可能である。
【0097】
好ましくは車両(100)に搭載されているアクチュエータ(10)は、車両(100)のブレーキ、推進システム、エンジン、ドライブトレイン又はステアリングによって提供可能である。検出されたオブジェクトとの衝突を車両(100)が回避するように、アクチュエータ(10)が制御されるように、制御信号(A)を決定することができる。検出されたオブジェクトを、画像分類器(60)が最も尤もらしいとみなした、それらのオブジェクトの正体、例えば歩行者や樹木に従って分類し、その分類に依存して、制御信号(A)を決定することもできる。
【0098】
代替的又は追加的に、制御信号(A)は、例えば第2の機械学習システム(60)によって検出されたオブジェクトが表示されるように、ディスプレイ(10a)を制御するためにも使用可能である。車両(100)が、検出されたオブジェクトのうちの少なくとも1つと衝突しそうになった場合に、警告信号が生成されるように、制御信号(A)がディスプレイ(10a)を制御することができるようにすることも可能である。警告信号は、警告音、及び/又は、触覚信号、例えば車両のステアリングホイールの振動であるものとしてよい。
【0099】
さらなる実施形態においては、少なくとも半自律的なロボットは、例えば、飛行、水泳、潜水又は歩行によって移動することができる他の移動型ロボット(図示せず)によって提供可能である。移動型ロボットは、特に、少なくとも半自律的な芝刈り機、又は、少なくとも半自律的な掃除ロボットであるものとしてよい。上記の全ての実施形態において、移動型ロボットが前述の識別されたオブジェクトとの衝突を回避することができるように、移動型ロボットの推進ユニット及び/又はステアリング及び/又はブレーキが制御されるように、制御信号(A)を決定することができる。
【0100】
図4は、バルブ(10)を制御するための一実施形態を示している。本実施形態においては、センサ(30)は、バルブ(10)によって出力することができる流体の圧力を感知する圧力センサである。特に、第2の機械学習システム(60)は、バルブ(10)によって分配される流体の噴射量を、圧力値の時系列(x)に基づいて正確に決定するように構成可能である。
【0101】
特に、バルブ(10)は、内燃機関の燃料インジェクタの一部であるものとしてよく、バルブ(10)は、内燃機関に燃料を噴射するように構成されている。その場合、過多な燃料噴射量又は過少な燃料噴射量が相応に補償されるように、決定された噴射量に基づいて、将来の噴射プロセスにおいてバルブ(10)を制御することができる。
【0102】
代替的に、バルブ(10)を、農業肥料システムの一部とすることも可能であり、その場合、バルブ(10)は、肥料を散布するように構成されている。その場合、過多な肥料散布量又は不十分な肥料散布量が相応に補償されるように、決定された肥料散布量に基づいて、将来の散布動作においてバルブ(10)を制御することができる。
【0103】
「コンピュータ」という用語は、所定の計算規則を処理するための任意の装置を包含するものとして理解可能である。これらの計算規則は、ソフトウェアの形態、ハードウェアの形態、又は、ソフトウェアとハードウェアとの混合形態であるものとしてよい。
【0104】
一般的に、複数形には添え字が付されているものと理解可能であり、すなわち、好ましくは複数形に含まれている複数の要素に連続した整数を割り当てることにより、複数形のそれぞれの要素に一意の添え字が割り当てられる。好ましくは、ある複数形にN個の要素が含まれておりかつNがその複数形における要素の個数である場合、これらの要素には1乃至Nの整数が割り当てられる。複数形に含まれているそれぞれの要素には、これらの要素の添え字を介してアクセス可能であることも理解可能である。
【手続補正書】
【提出日】2023-12-14
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
供給された入力信号(S)に基づいて分類及び/又は回帰結果を決定するためのコンピュータ実装された方法であって、当該方法は、
●第1の部分(4)を供給するステップであって、前記第1の部分(4)は、前記供給された入力信号(S)を、前記入力信号(S)と、ランダムに抽出された第1の値(2)とに基づいてノイズ除去するように構成されている、ステップと、
●複数の第1の値(2)をランダムに抽出するステップと、
●前記第1の部分(4)によって、複数のノイズ除去済み信号(x)を決定するステップであって、前記複数のノイズ除去済み信号(x)からのノイズ除去済み信号(x)は、前記供給された入力信号(S)と、前記複数の第1の値(2)からの1つの第1の値(2)とに基づいてそれぞれ決定される、ステップと、
●モデルによって、ノイズ除去された値に基づいて複数の予測値を決定するステップであって、それぞれの予測値は、ノイズ除去済み信号の分類、又は、ノイズ除去済み信号に基づく回帰結果を特徴付ける、ステップと、
●前記複数の予測値の集約を特徴付ける1つの集約信号(y)を供給するステップであって、前記集約信号(y)は、当該方法によって決定される分類及び/又は回帰結果を特徴付ける、ステップと、
を含む、方法。
【請求項2】
当該方法によって、追加的に第3の値が供給され、
前記第3の値は、前記複数の予測値の分散を特徴付ける、
請求項1に記載の方法。
【請求項3】
供給された入力信号(S)をノイズ除去するように前記第1の部分(4)を訓練することに基づいて、前記第1の部分(4)が供給され、
前記第1の部分(4)を訓練することは、
●前記第1の部分(4)に、第1の入力信号(1)及び第1の値(2)を供給するステップであって、前記第1の入力信号(1)は、ノイズ含有信号を特徴付け、前記第1の値(2)は、ランダムに抽出された値を特徴付ける、ステップと、
●前記第1の部分(4)によって、前記第1の入力信号(1)及び前記第1の値(2)に対する第1の出力信号(9)を決定するステップと、
●第2の部分(5)によって、前記第1の出力信号(9)に基づいて第2の値(6)を決定するステップであって、前記第2の値(6)は、前記第1の出力信号(9)がノイズ含有信号を特徴付ける確率を特徴付ける、ステップと、
●前記第2の部分(5)によって、供給された第2の入力信号(3)に基づいて第3の値(7)を決定するステップであって、前記第2の入力信号(3)は、非ノイズ含有信号を特徴付け、前記第3の値(7)は、前記第2の入力信号(3)が非ノイズ含有信号を特徴付ける確率を特徴付ける、ステップと、
●前記第1の部分(4)及び前記第2の部分(5)を訓練するステップであって、前記訓練は、
○前記第1の部分(4)の複数のパラメータを、前記第1の部分(4)の前記複数のパラメータに関する前記第2の値(6)の勾配に従って適合させることと、
○前記第2の部分(5)の複数のパラメータを、前記第2の部分(5)の前記複数のパラメータに関する前記第2の値(6)と前記第3の値(7)との和の勾配に従って適合させることと、
を含む、ステップと、
を含む、請求項
1に記載の方法。
【請求項4】
前記方法は、
●前記第1の部分(4)に、第3の入力信号及び第4の値を供給するステップであって、前記第3の入力信号は、非ノイズ含有信号を特徴付ける、ステップと、
●前記第1の部分(4)によって、前記第3の入力信号及び前記第4の値に対する第2の出力信号を決定するステップと、
●前記第1の部分(4)の複数のパラメータを、前記第3の入力信号に対する前記第2の出力信号の偏差に従って適合させるステップと、
をさらに含む、請求項3に記載の方法。
【請求項5】
前記方法は、
●前記第1の部分(4)によって、前記第1の入力信号(1)及び前記第1の値(2)に基づいて、前記第1の入力信号(1)によって特徴付けられるノイズの種類の分類を特徴付ける第5の値を決定するステップと、
●前記第1の部分(4)の複数のパラメータを、前記第5の値によって特徴付けられるクラスと、前記第1の入力信号(1)に対応するノイズの種類のクラスとの偏差に従って適合させるステップと、
をさらに含む、請求項
4に記載の方法。
【請求項6】
前記方法は、
●前記第1の部分(4)によって、前記第3の入力信号及び前記第4の値に基づいて、前記第3の入力信号によって特徴付けられるノイズの種類の分類を特徴付ける第5の値を決定するステップと、
●前記第1の部分の複数のパラメータを、前記第5の値によって特徴付けられるクラスと、ノイズの不在を特徴付けるクラスとの偏差に従って適合させるステップと、
をさらに含む、請求項
4に記載の方法。
【請求項7】
前記第3の入力信号に対する前記第2の出力信号の前記偏差は、式
【数1】
によって特徴付けられ、ここで、
【数2】
は、前記第3の入力信号であり、Gは、前記第1の部分である、
請求項
4に記載の方法。
【請求項8】
入力信号(S)からノイズ除去済み信号(x)を決定するためのコンピュータ実装された方法であって、当該方法は、
●請求項
1に記載の
方法における第1の部分(4)を供給するステップと、
●前記第1の部分(4)によって、前記入力信号(S)と、ランダムに抽出された第1の値(2)とに基づいて
出力信号(x)を決定するステップと、
●前記出力信号
(x)をノイズ除去済み信号(x)として供給するステップと、
を含む、方法。
【請求項9】
供給された前記第1の部分(4)は、請求項
1に記載の方法に従って訓練されている、
請求項8に記載の方法。
【請求項10】
前記ノイズ除去済み信号(x)は、制御システム(40)の入力として使用され、
前記制御システム(40)は、前記ノイズ除去済み信号(x)に基づいて、アクチュエータ(10)の制御信号(A)を決定するように構成されている、
請求項
8に記載の方法。
【請求項11】
前記ノイズ除去済み信号(x)は、前記入力信号(S)自体によって測定されていない前記入力信号(S)の特性を決定するための仮想センサ(30)への入力として使用される、
請求項
8に記載の方法。
【請求項12】
前記入力信号(S)は、センサ信号である、
請求項
1に記載の方法。
【請求項13】
前記第1の入力信号及び/又は前記第2の入力信号及び/又は前記入力信号(S)は、センサ信号である、
請求項3に記載の方法。
【請求項14】
前記第3の入力信号は、センサ信号である、
請求項4に記載の方法。
【請求項15】
請求項
1に記載
の方法を実施するように構成されている訓練システム(140)。
【請求項16】
プロセッサ(45,145)によって実行された場合に、請求項
1に記載の方法の全てのステップを
前記プロセッサ(45,145)に実施させるために構成されているコンピュータプログラム。
【請求項17】
請求項
16に記載のコンピュータプログラムが格納されている機械可読記憶媒体(46,146)。
【国際調査報告】