IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツングの特許一覧

特開2024-19093測定データを評価するためのニューラルネットワークのさらなるトレーニング
<>
  • 特開-測定データを評価するためのニューラルネットワークのさらなるトレーニング 図1
  • 特開-測定データを評価するためのニューラルネットワークのさらなるトレーニング 図2
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024019093
(43)【公開日】2024-02-08
(54)【発明の名称】測定データを評価するためのニューラルネットワークのさらなるトレーニング
(51)【国際特許分類】
   G06N 3/09 20230101AFI20240201BHJP
【FI】
G06N3/09
【審査請求】未請求
【請求項の数】15
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023121613
(22)【出願日】2023-07-26
(31)【優先権主張番号】10 2022 207 726.1
(32)【優先日】2022-07-27
(33)【優先権主張国・地域又は機関】DE
(71)【出願人】
【識別番号】390023711
【氏名又は名称】ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング
【氏名又は名称原語表記】ROBERT BOSCH GMBH
【住所又は居所原語表記】Stuttgart, Germany
(74)【代理人】
【識別番号】100114890
【弁理士】
【氏名又は名称】アインゼル・フェリックス=ラインハルト
(74)【代理人】
【識別番号】100098501
【弁理士】
【氏名又は名称】森田 拓
(74)【代理人】
【識別番号】100116403
【弁理士】
【氏名又は名称】前川 純一
(74)【代理人】
【識別番号】100134315
【弁理士】
【氏名又は名称】永島 秀郎
(74)【代理人】
【識別番号】100162880
【弁理士】
【氏名又は名称】上島 類
(72)【発明者】
【氏名】フランク シュミット
(57)【要約】      (修正有)
【課題】測定データを処理するためのニューラルネットワークをさらにトレーニングするための方法100を提供する。
【解決手段】ニューラルネットワーク1は、集合Mからの、ニューラルネットワークの目標アウトプット3aによってラベル付けされているトレーニングサンプル2aによってトレーニングされる。目標アウトプット3a’によってラベル付けされている新たなトレーニングサンプル2a’のバッチB及びこれまでのトレーニングサンプルの部分集合Dを提供し、ニューラルネットワークでアウトプット3’、3に処理し、各目標アウトプットからのアウトプットの偏差を、予め定められたコスト関数4で評価し、コスト関数による評価がバッチBからの新たなトレーニングサンプルに関して改良し、かつ、部分集合Dからのこれまでのトレーニングサンプルに関して改悪しないことを目標にニューラルネットワークの挙動を特徴付けるパラメータを最適化する。
【選択図】図1
【特許請求の範囲】
【請求項1】
測定データ(2)を処理するためのニューラルネットワーク(1)をさらにトレーニングするための方法(100)であって、前記ニューラルネットワークは、集合Mからのトレーニングサンプル(2a)によってトレーニングされており、前記トレーニングサンプル(2a)はそれぞれ、前記ニューラルネットワーク(1)の目標アウトプット(3a)によってラベル付けされており、
同様に前記ニューラルネットワーク(1)の目標アウトプット(3a’)によってラベル付けされている新たなトレーニングサンプル(2a’)のバッチBを提供するステップ(110)、
これまでの前記トレーニングサンプル(2a)の部分集合
【数1】
を提供するステップ(120)、
前記バッチBからの前記新たなトレーニングサンプル(2a’)も、前記部分集合Dからの前記これまでのトレーニングサンプル(2a)も、前記ニューラルネットワーク(1)によってそれぞれ、アウトプット(3’,3)に処理するステップ(130)、
前記各目標アウトプット(3a’,3a)からの前記アウトプット(3’,3)の偏差を、予め定められたコスト関数(4)によって評価するステップ(140)、
前記ニューラルネットワーク(1)の挙動を特徴付けるパラメータ(1a)を、前記これまでのトレーニングサンプルおよび前記新たなトレーニングサンプル(2a,2a’)をさらに処理する際に、前記コスト関数(4)による前記評価(4a)が
前記バッチBからの新たなトレーニングサンプル(2a’)に関して、改良され、かつ
前記部分集合Dからのこれまでのトレーニングサンプル(2a)に関して、改悪されない、
ことを目標に最適化するステップ(150)、
を含む方法(100)。
【請求項2】
前記部分集合Dからの前記これまでのトレーニングサンプル(2a)に対する前記コスト関数(4)の前記期待値の第1の勾配Gを、前記パラメータ(1a)に従って求め(151)、
前記バッチBからの前記新たなトレーニングサンプル(2a’)に対する前記コスト関数(4)の前記期待値の第2の勾配Gを、前記パラメータ(1a)に従って求め(152)、
前記勾配GおよびGから勾配gを求め(153)、前記勾配gに沿って、前記パラメータ(1a)を変更する、請求項1記載の方法(100)。
【請求項3】
前記勾配gを、Gの直交補空間
【数2】
へのGの投影として求める(153a)、請求項2記載の方法(100)。
【請求項4】
前記部分集合Dからのこれまでのトレーニングサンプル(2a)に関する前記コスト関数(4)による前記評価(4a)の改悪が、予め定められた閾値(5)を上回ったこと(154)に応答して、前記さらなるトレーニングを中断する(155)、請求項1から3までのいずれか1項記載の方法(100)。
【請求項5】
前記集合Mからの前記トレーニングサンプル(2a)での前記ニューラルネットワーク(1)の元来のトレーニングのために使用された前記コスト関数(4)を、前記さらなるトレーニングのためにも使用する(141)、請求項1から4までのいずれか1項記載の方法(100)。
【請求項6】
測定データ(2)のための、特に画像のための、予め定められた分類のクラスにおける分類器として構成されているニューラルネットワーク(1)を選択する(105)、請求項1から5までのいずれか1項記載の方法(100)。
【請求項7】
前記ニューラルネットワーク(1)は、
K個の要素を有するベクトルとして表すことが可能な特徴マップに前記ニューラルネットワーク(1)のインプット(2)を移行させる特徴抽出器と、
k×Kの行列Aと、任意選択的にk次元のバイアスベクトルbとを適用することによって、前記特徴マップを、k個の利用可能なクラスに関してk個の分類スコアを有するベクトルにアウトプット(3)としてマッピングする分類ヘッドと
を有する(105a)、請求項6記載の方法(100)。
【請求項8】
少なくとも1つの新たなトレーニングサンプル(2a’)が、前記バッチBにおいて、k個の利用可能なクラスのいずれにも相当しない目標アウトプット(3a’)によってラベル付けされていること(111)に応答して、
前記行列Aを、既存のk個の行の平均によって占有されている、さらなるk+1番目の行ぶんだけ拡張し(112)、かつ
それが存在する場合、前記バイアスベクトルbを、既存のk個の成分の平均によって占有されているk+1番目の成分ぶんだけ拡張する(113)、請求項7記載の方法(100)。
【請求項9】
前記部分集合
【数3】
を、前記予め定められた分類の前記クラスに対して、実質的に同じ数のこれまでのトレーニングサンプル(2a)を含んでいるように選択する、請求項6から8までのいずれか1項記載の方法(100)。
【請求項10】
前記クラスは、交通利用者、車道、車道境界線、交通標識、障害物および/または車両の誘導のための、交通に関連する他の対象物を表す、請求項6から9までのいずれか1項記載の方法(100)。
【請求項11】
測定データ(2)として、画像、オーディオ信号、時系列の測定値、レーダーデータおよび/またはライダーデータを選択する、請求項1から10までのいずれか1項記載の方法(100)。
【請求項12】
さらにトレーニングされた前記ニューラルネットワーク(1*)に測定データ(2)を供給し(160)、これによって、さらにトレーニングされた前記ニューラルネットワーク(1*)がアウトプット(3)を生成し、
前記ニューラルネットワーク(1)の前記アウトプット(3)から駆動制御信号(170a)を形成し(170)、かつ
車両(50)、運転支援システム(60)、品質管理のためのシステム(70)、領域を監視するためのシステム(80)および/または医療用画像形成のためのシステム(90)を、前記駆動制御信号(170a)によって駆動制御する(180)、請求項1から11までのいずれか1項記載の方法(100)。
【請求項13】
機械可読命令を備えたコンピュータプログラムであって、
前記機械可読命令は、1つまたは複数のコンピュータおよび/またはコンピュータインスタンスにおいて実行されるときに、前記1つまたは複数のコンピュータおよび/またはコンピュータインスタンスに、請求項1から12までのいずれか1項記載の方法(100)を実施させる、
コンピュータプログラム。
【請求項14】
請求項13記載のコンピュータプログラムを備えた機械可読データ担体。
【請求項15】
請求項13記載のコンピュータプログラムを備えた、かつ/または請求項14記載の機械可読データ担体を備えた、1つまたは複数のコンピュータおよび/またはコンピュータインスタンス。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、たとえば、特定のタイプの対象物の存在を考慮した画像または他の測定データの分類のために利用可能な、すでにトレーニングされているニューラルネットワークのさらなるトレーニングに関する。
【0002】
背景技術
たとえば、特定の対象物の存在を考慮して、画像または他の測定データを分類するニューラルネットワークは、典型的には、監視下で、目標アウトプットによってラベル付けされている多数のトレーニングサンプルでトレーニングされる。トレーニングの完了後、ニューラルネットワークが、トレーニング中に見られなかった画像もしくは測定データに対しても、具体的な課題を考慮した正しいアウトプットを供給することが期待される。
【0003】
この場合、後から、このトレーニングを拡張する必要性が生じ得る。たとえば、新たな交通標識が立法機関によって導入された後に、交通標識を識別するためのシステムは、この新たな交通標識も確実に識別するために更新を必要とする。
【0004】
発明の開示
本発明の範囲において、測定データを処理するためのニューラルネットワークをさらにトレーニングするための方法が開発された。この方法は、ニューラルネットワークが、集合Mからのトレーニングサンプルによってトレーニングされている状況から出発し、これらのトレーニングサンプルにはそれぞれ、ニューラルネットワークの目標アウトプットがラベル付けされている。
【0005】
この方法の範囲において、同様にニューラルネットワークの目標アウトプットによってラベル付けされている新たなトレーニングサンプルのバッチBが提供される。さらに、これまでのトレーニングサンプルの部分集合
【数1】
が提供される。
【0006】
これに関連して、生成モデル、たとえば敵対的生成ネットワーク(GAN)によって生成されたトレーニングサンプルは、これまでのトレーニングで使用された実際のトレーニングサンプルと等価である。すなわち、これまでのトレーニングサンプル自体の代わりに、このようなトレーニングサンプルを生成することができる生成モデルを格納することが可能である。生成されたトレーニングサンプルは、以前に実際に使用されたトレーニングサンプルと同じドメインに属しており、これは、本明細書で提案される方法における、自身の効果にとって重要である。
【0007】
バッチBからの新たなトレーニングサンプルも、部分集合Dからのこれまでのトレーニングサンプルも、ニューラルネットワークによってそれぞれ、アウトプットに処理される。各目標アウトプットからのこれらのアウトプットの偏差は、予め定められたコスト関数によって評価される。
【0008】
ニューラルネットワークの挙動を特徴付けるパラメータは、これまでのトレーニングサンプルおよび新たなトレーニングサンプルをさらに処理する際に、コスト関数による評価が
・バッチBからの新たなトレーニングサンプルに関して、改良され、かつ
・部分集合Dからのこれまでのトレーニングサンプルに関して、改悪されない、
ことを目標に最適化される。
【0009】
パラメータは、特に、たとえば重みを含んでいてよく、この重みによって、ニューラルネットワークのニューロンまたは別の処理ユニットに供給されるインプットが重み付けされて加算される。
【0010】
さらなるトレーニングはこのようにして、ニューラルネットワークがトレーニングされているドメインを、トレーニングサンプルの元来の集合Mから新たなバッチBを中心にして拡大する。このために、トレーニングサンプルの和集合
【数2】
での完全な新たなトレーニングに対して大きな計算コストが必要となることはない。
【0011】
さらに、元来のトレーニングデータの完全な集合Mにアクセスする必要はなく、理想的には集合Mの代表的な断面であり得る比較的小さな部分集合Dだけが必要になる。この小さな部分集合Dを、たとえば、車両に搭載された制御機器または組み込みシステムの制限されたメモリスペース内に格納することもできる。これに対して、メモリスペースに、たとえば、対象物の識別のためのシステムに対する、数千時間のテスト走行中に記録されたトレーニング画像を格納することは実用的ではないだろう。必要なメモリスペースが何らかの形で提供され得る場合であっても、元来のトレーニングを行ったシステムの製造業者が、トレーニングサンプルの完全な集合Mを、コントロールせずに引き渡すことはないであろう。ラベル付けされたトレーニングサンプルの作成には極めて高い費用がかかるので、トレーニングサンプルの完全な集合Mを手に入れた競合他社は、自社のシステムの開発コストの大部分を節約することができる。
【0012】
これに対して、さらなるトレーニングがたとえば「サービス」として、たとえばクラウドにおいて実行される場合には、メモリスペースに関する制限は存在しない。この場合、トレーニングサンプルを引き渡す必要もない。つまり、すなわちケースでは、トレーニングサンプルの完全な集合Mを部分集合Dとして選択することに何の不都合もない。
【0013】
この場合、コスト関数の評価が、部分集合Dからのこれまでのトレーニングサンプルに関して、さらなるトレーニングによって改悪されるか否かの検査は、ニューラルネットワークを、いわゆる「壊滅的な忘却」から保護する。したがってバッチBから新たに学習された知識は、集合Mからのこれまでの知識に付加的に加えられ、これに置き換わらない。このことは、たとえば、特定の状況におけるニューラルネットワークの適正な挙動を道路交通への認可のために認証しなければならない車両での用途の場合に特に重要である。この場合、変更に対する動作許可は、認可された車両におけるその他の変更と同様に、場合によってはこの変更によって挙動の改良が生じるが、決して改悪は生じないということに結び付けられていてよい。
【0014】
特に有利な構成では、部分集合Dからのこれまでのトレーニングサンプルに対するコスト関数の期待値の第1の勾配Gが、パラメータに従って、たとえば次の式
【数3】
に従って求められる。
【0015】
ここで、Pは最適化されるべきパラメータであり、Eは期待値であり、xはトレーニングサンプルであり、yはトレーニングサンプルxに関する目標アウトプットであり、Lはコスト関数であり、f(x)はトレーニングサンプルxに対するニューラルネットワークのアウトプットである。
【0016】
さらに、バッチBからの新たなトレーニングサンプルに対するコスト関数の期待値の第2の勾配Gも、パラメータに従って、たとえば次の式
【数4】
に従って求められる。
【0017】
これらの2つの勾配GおよびGから勾配gが求められ、この勾配gに沿って、パラメータが次のトレーニングステップにおいて変更される。このようにして、この意図された変更が、一方では次のトレーニングステップにおいて新たな知識の学習に関してどのような作用を有し、他方ではこれまでの知識の、起こり得る「壊滅的な忘却」に関して、どのような作用を有しているのかが正確にコントロールされる。
【0018】
特に有利には、勾配gを、Gの直交補空間
【数5】
へのGの投影として、たとえば次の式
【数6】
に従って求めることができる。
【0019】
この場合、勾配gは、Gに沿った成分を有していない。すなわち、部分集合Dからのこれまでのトレーニングサンプルに関する改悪は生じない。この境界条件を遵守するためには、必要に応じて、バッチBからの新たなトレーニングサンプルに関するトレーニングの進捗も後退させられる。
【0020】
これらの勾配の計算を、全てのパラメータに対して同時に行うことができるが、たとえばニューラルネットワークが編成されている種々の層のパラメータに対して逐次的に行うこともできる。
【0021】
さらなる特に有利な構成では、部分集合Dからのこれまでのトレーニングサンプルに関するコスト関数による評価の改悪が、予め定められた閾値を上回ったことに応答して、さらなるトレーニングが中断される。改悪は、たとえばコスト関数の期待値
【数7】
の形態で、部分集合Dからのこれまでのトレーニングサンプルに関して測定され得る。この指標は、各トレーニングステップにおいて常にわずかな改悪しか生じないことによって「偽装」もされない。このような小さな改悪の収集は、確実に記録される。
【0022】
これは、橋を建設するときに、柱から始まる担体を、撓む前に、特定の距離しか空中に自由にぶら下げることができないという事実と同様に、ニューラルネットワーク1をさらにトレーニングする可能性が「消費される」もしくは「使い尽くされる」可能性があることを意味している。ある程度の量の新たなトレーニングサンプルが利用できる場合、この「消費/使い尽くし」を考慮すると、これらの新たなトレーニングサンプル全てを複数のバッチBに分割するよりも、単一のバッチBで提示する方が好適である。
【0023】
さらなるトレーニングの監視のために、特に有利には、集合Mからのトレーニングサンプルでのニューラルネットワークの元来のトレーニングのために使用されたコスト関数と同じコスト関数を使用することができる。この場合には、さらにトレーニングされたネットワークの挙動が、部分集合Dからのこれまでのトレーニングサンプルに関して、依然として、元来トレーニングされた挙動にどの程度まで対応しているかを極めて正確に測定することができる。しかし、このコスト関数が利用できない場合には、他のあらゆる適切なコスト関数を使用することもできる。
【0024】
さらなる特に有利な構成では、測定データのための、特に画像のための、予め定められた分類のクラスにおける分類器として構成されているニューラルネットワークが選択される。まさにこのような用途ではしばしば、多数のクラスに関するトレーニングの後から、いくつかの少数の他のクラスの識別を追加する必要性が生じる。さらに、種々異なるクラスに関連する特徴を識別する複数のタスクの間には、競合する相互作用はほとんどない。すなわち、あるクラスに関連する識別を改良しても、他のクラスに関連する識別が犠牲になることはない。
【0025】
ここで、ニューラルネットワークは、特に、たとえば、
・K個の要素を有するベクトルとして表すことが可能な特徴マップにニューラルネットワークのインプットを移行させる特徴抽出器と、
・k×Kの行列Aと、任意選択的にk次元のバイアスベクトルbとを適用することによって、特徴マップを、k個の利用可能なクラスに関してk個の分類スコアを有するベクトルにニューラルネットワークのアウトプットとしてマッピングする分類ヘッドと
を含んでいる。このアーキテクチャを有するネットワークは、特に良好にかつ有機的に付加的なクラスに拡張される。
【0026】
特に、たとえば、少なくとも1つの新たなトレーニングサンプルが、バッチBにおいて、k個の利用可能なクラスのいずれにも相当しない目標アウトプットによってラベル付けされていることに応答して、
・行列Aが、既存のk個の行の平均によって占有されている、さらなるk+1番目の行ぶんだけ拡張されてよく、かつ
・それが存在する場合、バイアスベクトルbが、既存のk個の成分の平均によって占有されているk+1番目の成分ぶんだけ拡張されてよい。
【0027】
ここで、この新たなクラスのためのソフトマックススコアは、ジェンセンの不等式に基づいて
【数8】
である。これは、さらなるトレーニングを行わない場合には、新たなクラスが、使用可能な全てのk+1クラスから1つのクラスがランダムに引き出された場合に予想されるのと同じ大きさの最大の分類スコアしか取得できないことを意味している。したがって、k個の既存のクラスに関連した分類器の挙動を変えることなく、k+1番目のクラスの識別を追加することができる。実際には全く存在しない新たな情報がシステムに取り込まれることはない。
【0028】
さらなる特に有利な構成では、部分集合
【数9】
が、予め定められた分類のクラスに対して、実質的に同じ数のこれまでのトレーニングサンプルを含んでいるように選択される。この場合、これは、トレーニングサンプルの元来の集合Mの代表的な断面を表している。すなわち、部分集合D上のニューラルネットワークの挙動は、高い確率で、トレーニングサンプルの元来の集合M上の挙動に対する適切な予測である。
【0029】
これらのクラスは、特に、たとえば交通利用者、車道、車道境界線、交通標識、障害物および/または車両の誘導のための、交通に関連する他の対象物を表すことができる。まさに交通標識および交通利用者の場合には、さらなるトレーニングの対象となり得る改新が存在することが多い。たとえば数年前、小型電気自動車(「eスクータ」)という全く新しいタイプの車両が誕生した。
【0030】
さらなるトレーニングの際に得られた、ニューラルネットワークの挙動を特徴付けるパラメータの新たな値は、たとえば、中央エンティティの場合に収集可能であり、後に公開されるべき、ニューラルネットワークの一般的な更新のための基礎として使用可能である。特に、たとえば、パラメータの値が多数のユーザによって収集されてよい。この場合、これらのパラメータはバッチBにおける新たなトレーニングサンプルに関する推定を可能にしないので、ユーザのプライバシは保護されたままである。
【0031】
測定データとして、特にたとえば画像、オーディオ信号、時系列の測定値、レーダーデータおよび/またはライダーデータを選択することができる。まさにこれらのデータ形式は、可能性のある多数のクラスに関連するステートメントを含むことができるという意味で極めて多岐にわたっている。
【0032】
さらなるトレーニングの別の重要な用途は、たとえば大量生産された構成部材のオプティカルな品質管理である。この場合には、たとえば、新たな構成部材および/または新たな条件に合うようにプロセスを調整するために、さらなるトレーニングを利用することができる。
【0033】
さらなる特に有利な構成では、さらにトレーニングされたニューラルネットワークに測定データが供給され、これによって、さらにトレーニングされたニューラルネットワークがアウトプットを生成する。これらのアウトプットから、駆動制御信号が形成される。車両、運転支援システム、品質管理のためのシステム、領域を監視するためのシステムおよび/または医療用画像形成のためのシステムが、この駆動制御信号によって駆動制御される。バッチBぶんだけ拡張された、トレーニングサンプルのドメインにおいて動作し、そこから一般化する、ニューラルネットワークの能力が向上するため、駆動制御される各システムの反応が、測定データによって検出された状況に合う確率が高くなる。
【0034】
この方法は、特に完全にまたは部分的にコンピュータ実装されていてよい。したがって、本発明は、機械可読命令を備えたコンピュータプログラムにも関し、これらの機械可読命令は、1つまたは複数のコンピュータおよび/またはコンピュータインスタンスにおいて実行されるときに、1つまたは複数のコンピュータおよび/またはコンピュータインスタンスに、上述の方法を実施させる。この意味では、車両用の制御機器ならびに同様に、機械可読命令を実行することが可能である技術的機器用の組み込みシステムもコンピュータとみなすことができる。コンピュータインスタンスの例は、クラウド内で機械可読命令を実行するための仮想機械、コンテナまたはサーバレスの実行環境である。
【0035】
同様に、本発明は、コンピュータプログラムを備えた機械可読データ担体および/またはダウンロード製品にも関する。ダウンロード製品は、データネットワークを介して伝送可能な、すなわち、データネットワークのユーザによってダウンロード可能なデジタル製品であり、これは、たとえば、オンラインショップにおいて即座のダウンロードのために売りに出されてよい。
【0036】
本発明を改良するさらなる措置を以降で、図面に基づいて、本発明の有利な実施例の説明とともに、より詳細に示す。
【図面の簡単な説明】
【0037】
図1】ニューラルネットワーク1をさらにトレーニングするための方法100の実施例を示す図である。
図2】勾配gの形成を示す図であり、この勾配gに沿ってパラメータ1aを、これまでのトレーニングサンプル2aに関する改悪を伴わずに変更することができる。
【0038】
実施例
図1は、測定データ2を処理するためにニューラルネットワーク1をさらにトレーニングするための方法100の実施例の概略的なフローチャートである。このニューラルネットワーク1は、すでに集合Mからのトレーニングサンプル2aを用いてトレーニングされており、これらのトレーニングサンプル2aは、それぞれニューラルネットワーク1の目標アウトプット3aによってラベル付けされている。
【0039】
ステップ105において、ニューラルネットワーク1が選択され、このニューラルネットワーク1は、測定データ2のための、特に画像のための、予め定められた分類のクラスにおける分類器として構成されている。
【0040】
ブロック105aによれば、このようなネットワーク1は特に、
・K個の要素を有するベクトルとして表すことが可能な特徴マップにニューラルネットワーク1のインプット2を移行させる特徴抽出器と、
・k×Kの行列Aと、任意選択的にk次元のバイアスベクトルbとを適用することによって、特徴マップを、k個の利用可能なクラスに関してk個の分類スコアを有するベクトルにアウトプット3としてマッピングする分類ヘッドと
を含んでいる。
【0041】
ステップ110において、同様にニューラルネットワーク1の目標アウトプット3a’によってラベル付けされている、新たなトレーニングサンプル2a’のバッチBが提供される。
【0042】
ブロック111によれば、少なくとも1つの新たなトレーニングサンプル2a’が、バッチBにおいて、k個の利用可能なクラスのいずれにも相当しない目標アウトプット3a’によってラベル付けされていることに応答して(真理値1)、
・行列Aが、ブロック112に従って、既存のk個の行の平均によって占有されている、さらなるk+1番目の行ぶんだけ拡張されてよく、かつ
・それが存在する場合、ブロック113に従って、バイアスベクトルbが、既存のk個の成分の平均によって占有されているk+1番目の成分ぶんだけ拡張されてよい。
【0043】
ステップ120において、これまでのトレーニングサンプル2aの部分集合
【数10】
が提供される。
【0044】
ステップ130において、バッチBからの新たなトレーニングサンプル2a’も部分集合Dからのこれまでのトレーニングサンプル2aもニューラルネットワーク1によって、それぞれアウトプット3’,3に処理される。
【0045】
ステップ140において、各目標アウトプット3a’,3aからのアウトプット3’,3の偏差が、予め定められたコスト関数4によって評価される。結果は、評価4aである。
【0046】
ここでは特に、たとえばブロック141に従って、集合Mからのトレーニングサンプル2aでのニューラルネットワーク1の元来のトレーニングのために使用されたコスト関数4を、さらなるトレーニングのためにも使用することができる。
【0047】
ステップ150において、ニューラルネットワーク1の挙動を特徴付けるパラメータ1aは、これまでのトレーニングサンプル2aおよび新たなトレーニングサンプル2a’をさらに処理する際に、コスト関数4による評価4aが
・バッチBからの新たなトレーニングサンプル2a’に関して、改良され、かつ
・部分集合Dからのこれまでのトレーニングサンプル2aに関して、改悪されない
ことを目標に最適化される。
【0048】
パラメータ1aの最終的に最適化された状態には、参照符号1a*が付けられている。したがって、ニューラルネットワーク1のさらにトレーニングされた状態には、参照符号1*が付けられている。
【0049】
ブロック151によれば、部分集合Dからのこれまでのトレーニングサンプル2aに対するコスト関数4の期待値の第1の勾配Gを、パラメータ1aに従って求めることができる。
【0050】
次いで、ブロック152によれば、バッチBからの新たなトレーニングサンプル2a’に対するコスト関数4の期待値の第2の勾配Gを、パラメータ1aに従って求めることができる。
【0051】
ブロック153によれば、勾配GおよびGから、勾配gを求めることができ、この勾配gに沿ってパラメータ1aが、次のトレーニングステップにおいて変更される。
【0052】
ブロック154によれば、部分集合Dからのこれまでのトレーニングサンプル2aに関するコスト関数4による評価4aの改悪が、予め定められた閾値5を上回っているか否かを検査することができる。そうである場合(真理値1)には、ブロック155に従って、さらなるトレーニングを中断することができる。
【0053】
ステップ160において、さらにトレーニングされたニューラルネットワーク1*に測定データ2が供給され、これによって、さらにトレーニングされたニューラルネットワーク1*がアウトプット3を生成する。
【0054】
ステップ170において、ニューラルネットワーク1のアウトプット3から駆動制御信号170aが形成される。
【0055】
ステップ180において、車両50、運転支援システム60、品質管理のためのシステム70、領域を監視するためのシステム80および/または医療用画像形成のためのシステム90が、駆動制御信号170aによって駆動制御される。
【0056】
図2は、これまでのトレーニングサンプル2aに関する改悪を伴わずに、それに沿ってパラメータ1aが変更可能な勾配gをどのようにして得ることができるかを、簡略化された2次元図で示している。
【0057】
部分集合Dからのこれまでのトレーニングサンプル2aのコスト関数4の期待値の勾配Gは、パラメータ1aに従って、評価4aをコスト関数4によって、部分集合Dからのこれまでのトレーニングサンプル2aに関して変更するために、パラメータ1aをどの方向において変更しなければならないかを示している。このような変更は望ましくないので、Gに対する直交補空間
【数11】
が形成される。この直交補空間
【数12】
に沿って、パラメータ1aを、上述の不所望な変更を伴わずに、変更することができる。すなわち、探索された勾配gは、
【数13】
に沿って延在している。
【0058】
gの絶対値は、パラメータ1aに従ってバッチBからの新たなトレーニングサンプル2a’のためのコスト関数4の期待値の第2の勾配Gから得られる。このために、勾配G
【数14】
に投影される。
図1
図2
【手続補正書】
【提出日】2023-07-31
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
測定データ(2)を処理するためのニューラルネットワーク(1)をさらにトレーニングするための方法(100)であって、前記ニューラルネットワークは、集合Mからのトレーニングサンプル(2a)によってトレーニングされており、前記トレーニングサンプル(2a)はそれぞれ、前記ニューラルネットワーク(1)の目標アウトプット(3a)によってラベル付けされており、
同様に前記ニューラルネットワーク(1)の目標アウトプット(3a’)によってラベル付けされている新たなトレーニングサンプル(2a’)のバッチBを提供するステップ(110)、
これまでの前記トレーニングサンプル(2a)の部分集合
【数1】
を提供するステップ(120)、
前記バッチBからの前記新たなトレーニングサンプル(2a’)も、前記部分集合Dからの前記これまでのトレーニングサンプル(2a)も、前記ニューラルネットワーク(1)によってそれぞれ、アウトプット(3’,3)に処理するステップ(130)、
前記各目標アウトプット(3a’,3a)からの前記アウトプット(3’,3)の偏差を、予め定められたコスト関数(4)によって評価するステップ(140)、
前記ニューラルネットワーク(1)の挙動を特徴付けるパラメータ(1a)を、前記これまでのトレーニングサンプルおよび前記新たなトレーニングサンプル(2a,2a’)をさらに処理する際に、前記コスト関数(4)による前記評価(4a)が
前記バッチBからの新たなトレーニングサンプル(2a’)に関して、改良され、かつ
前記部分集合Dからのこれまでのトレーニングサンプル(2a)に関して、改悪されない、
ことを目標に最適化するステップ(150)、
を含む方法(100)。
【請求項2】
前記部分集合Dからの前記これまでのトレーニングサンプル(2a)に対する前記コスト関数(4)の前記期待値の第1の勾配Gを、前記パラメータ(1a)に従って求め(151)、
前記バッチBからの前記新たなトレーニングサンプル(2a’)に対する前記コスト関数(4)の前記期待値の第2の勾配Gを、前記パラメータ(1a)に従って求め(152)、
前記勾配GおよびGから勾配gを求め(153)、前記勾配gに沿って、前記パラメータ(1a)を変更する、請求項1記載の方法(100)。
【請求項3】
前記勾配gを、Gの直交補空間
【数2】
へのGの投影として求める(153a)、請求項2記載の方法(100)。
【請求項4】
前記部分集合Dからのこれまでのトレーニングサンプル(2a)に関する前記コスト関数(4)による前記評価(4a)の改悪が、予め定められた閾値(5)を上回ったこと(154)に応答して、さらなるトレーニングを中断する(155)、請求項記載の方法(100)。
【請求項5】
前記集合Mからの前記トレーニングサンプル(2a)での前記ニューラルネットワーク(1)の元来のトレーニングのために使用された前記コスト関数(4)を、さらなるトレーニングのためにも使用する(141)、請求項記載の方法(100)。
【請求項6】
測定データ(2)のための、特に画像のための、予め定められた分類のクラスにおける分類器として構成されているニューラルネットワーク(1)を選択する(105)、請求項記載の方法(100)。
【請求項7】
前記ニューラルネットワーク(1)は、
K個の要素を有するベクトルとして表すことが可能な特徴マップに前記ニューラルネットワーク(1)のインプット(2)を移行させる特徴抽出器と、
k×Kの行列Aと、任意選択的にk次元のバイアスベクトルbとを適用することによって、前記特徴マップを、k個の利用可能なクラスに関してk個の分類スコアを有するベクトルにアウトプット(3)としてマッピングする分類ヘッドと
を有する(105a)、請求項6記載の方法(100)。
【請求項8】
少なくとも1つの新たなトレーニングサンプル(2a’)が、前記バッチBにおいて、k個の利用可能なクラスのいずれにも相当しない目標アウトプット(3a’)によってラベル付けされていること(111)に応答して、
前記行列Aを、既存のk個の行の平均によって占有されている、さらなるk+1番目の行ぶんだけ拡張し(112)、かつ
それが存在する場合、前記バイアスベクトルbを、既存のk個の成分の平均によって占有されているk+1番目の成分ぶんだけ拡張する(113)、請求項7記載の方法(100)。
【請求項9】
前記部分集合
【数3】
を、前記予め定められた分類の前記クラスに対して、実質的に同じ数のこれまでのトレーニングサンプル(2a)を含んでいるように選択する、請求項記載の方法(100)。
【請求項10】
前記クラスは、交通利用者、車道、車道境界線、交通標識、障害物および/または車両の誘導のための、交通に関連する他の対象物を表す、請求項記載の方法(100)。
【請求項11】
測定データ(2)として、画像、オーディオ信号、時系列の測定値、レーダーデータおよび/またはライダーデータを選択する、請求項記載の方法(100)。
【請求項12】
さらにトレーニングされた前記ニューラルネットワーク(1*)に測定データ(2)を供給し(160)、これによって、さらにトレーニングされた前記ニューラルネットワーク(1*)がアウトプット(3)を生成し、
前記ニューラルネットワーク(1)の前記アウトプット(3)から駆動制御信号(170a)を形成し(170)、かつ
車両(50)、運転支援システム(60)、品質管理のためのシステム(70)、領域を監視するためのシステム(80)および/または医療用画像形成のためのシステム(90)を、前記駆動制御信号(170a)によって駆動制御する(180)、請求項記載の方法(100)。
【請求項13】
機械可読命令を備えたコンピュータプログラムであって、
前記機械可読命令は、1つまたは複数のコンピュータおよび/またはコンピュータインスタンスにおいて実行されるときに、前記1つまたは複数のコンピュータおよび/またはコンピュータインスタンスに、請求項1から12までのいずれか1項記載の方法(100)を実施させる、
コンピュータプログラム。
【請求項14】
請求項13記載のコンピュータプログラムを備えた機械可読データ担体。
【請求項15】
請求項14記載の機械可読データ担体を備えた、1つまたは複数のコンピュータおよび/またはコンピュータインスタンス。
【外国語明細書】