特開2024-19093 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ ローベルト　ボツシユ　ゲゼルシヤフト　ミツト　ベシユレンクテル　ハフツングの特許一覧

特開2024-19093測定データを評価するためのニューラルネットワークのさらなるトレーニング

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024019093

(43)【公開日】2024-02-08

(54)【発明の名称】測定データを評価するためのニューラルネットワークのさらなるトレーニング

(51)【国際特許分類】

G06N 3/09 20230101AFI20240201BHJP

【ＦＩ】

G06N3/09

【審査請求】未請求

【請求項の数】15

【出願形態】ＯＬ

【外国語出願】

(21)【出願番号】P 2023121613

(22)【出願日】2023-07-26

(31)【優先権主張番号】10 2022 207 726.1

(32)【優先日】2022-07-27

(33)【優先権主張国・地域又は機関】DE

(71)【出願人】

【識別番号】390023711

【氏名又は名称】ローベルトボツシユゲゼルシヤフトミツトベシユレンクテルハフツング

【氏名又は名称原語表記】ＲＯＢＥＲＴＢＯＳＣＨＧＭＢＨ

【住所又は居所原語表記】Ｓｔｕｔｔｇａｒｔ，Ｇｅｒｍａｎｙ

(74)【代理人】

【識別番号】100114890

【弁理士】

【氏名又は名称】アインゼル・フェリックス＝ラインハルト

(74)【代理人】

【識別番号】100098501

【弁理士】

【氏名又は名称】森田拓

(74)【代理人】

【識別番号】100116403

【弁理士】

【氏名又は名称】前川純一

(74)【代理人】

【識別番号】100134315

【弁理士】

【氏名又は名称】永島秀郎

(74)【代理人】

【識別番号】100162880

【弁理士】

【氏名又は名称】上島類

(72)【発明者】

【氏名】フランクシュミット

(57)【要約】（修正有）

【課題】測定データを処理するためのニューラルネットワークをさらにトレーニングするための方法１００を提供する。
【解決手段】ニューラルネットワーク１は、集合Ｍからの、ニューラルネットワークの目標アウトプット３ａによってラベル付けされているトレーニングサンプル２ａによってトレーニングされる。目標アウトプット３ａ’によってラベル付けされている新たなトレーニングサンプル２ａ’のバッチＢ及びこれまでのトレーニングサンプルの部分集合Ｄを提供し、ニューラルネットワークでアウトプット３’、３に処理し、各目標アウトプットからのアウトプットの偏差を、予め定められたコスト関数４で評価し、コスト関数による評価がバッチＢからの新たなトレーニングサンプルに関して改良し、かつ、部分集合Ｄからのこれまでのトレーニングサンプルに関して改悪しないことを目標にニューラルネットワークの挙動を特徴付けるパラメータを最適化する。
【選択図】図１

【特許請求の範囲】

【請求項1】

測定データ（２）を処理するためのニューラルネットワーク（１）をさらにトレーニングするための方法（１００）であって、前記ニューラルネットワークは、集合Ｍからのトレーニングサンプル（２ａ）によってトレーニングされており、前記トレーニングサンプル（２ａ）はそれぞれ、前記ニューラルネットワーク（１）の目標アウトプット（３ａ）によってラベル付けされており、
同様に前記ニューラルネットワーク（１）の目標アウトプット（３ａ’）によってラベル付けされている新たなトレーニングサンプル（２ａ’）のバッチＢを提供するステップ（１１０）、
これまでの前記トレーニングサンプル（２ａ）の部分集合

【数1】

を提供するステップ（１２０）、
前記バッチＢからの前記新たなトレーニングサンプル（２ａ’）も、前記部分集合Ｄからの前記これまでのトレーニングサンプル（２ａ）も、前記ニューラルネットワーク（１）によってそれぞれ、アウトプット（３’，３）に処理するステップ（１３０）、
前記各目標アウトプット（３ａ’，３ａ）からの前記アウトプット（３’，３）の偏差を、予め定められたコスト関数（４）によって評価するステップ（１４０）、
前記ニューラルネットワーク（１）の挙動を特徴付けるパラメータ（１ａ）を、前記これまでのトレーニングサンプルおよび前記新たなトレーニングサンプル（２ａ，２ａ’）をさらに処理する際に、前記コスト関数（４）による前記評価（４ａ）が
前記バッチＢからの新たなトレーニングサンプル（２ａ’）に関して、改良され、かつ
前記部分集合Ｄからのこれまでのトレーニングサンプル（２ａ）に関して、改悪されない、
ことを目標に最適化するステップ（１５０）、
を含む方法（１００）。

【請求項2】

前記部分集合Ｄからの前記これまでのトレーニングサンプル（２ａ）に対する前記コスト関数（４）の前記期待値の第１の勾配Ｇ_０を、前記パラメータ（１ａ）に従って求め（１５１）、
前記バッチＢからの前記新たなトレーニングサンプル（２ａ’）に対する前記コスト関数（４）の前記期待値の第２の勾配Ｇ_１を、前記パラメータ（１ａ）に従って求め（１５２）、
前記勾配Ｇ_０およびＧ_１から勾配ｇを求め（１５３）、前記勾配ｇに沿って、前記パラメータ（１ａ）を変更する、請求項１記載の方法（１００）。

【請求項3】

前記勾配ｇを、Ｇ_０の直交補空間

【数2】

へのＧ_１の投影として求める（１５３ａ）、請求項２記載の方法（１００）。

【請求項4】

前記部分集合Ｄからのこれまでのトレーニングサンプル（２ａ）に関する前記コスト関数（４）による前記評価（４ａ）の改悪が、予め定められた閾値（５）を上回ったこと（１５４）に応答して、前記さらなるトレーニングを中断する（１５５）、請求項１から３までのいずれか１項記載の方法（１００）。

【請求項5】

前記集合Ｍからの前記トレーニングサンプル（２ａ）での前記ニューラルネットワーク（１）の元来のトレーニングのために使用された前記コスト関数（４）を、前記さらなるトレーニングのためにも使用する（１４１）、請求項１から４までのいずれか１項記載の方法（１００）。

【請求項6】

測定データ（２）のための、特に画像のための、予め定められた分類のクラスにおける分類器として構成されているニューラルネットワーク（１）を選択する（１０５）、請求項１から５までのいずれか１項記載の方法（１００）。

【請求項7】

前記ニューラルネットワーク（１）は、
Ｋ個の要素を有するベクトルとして表すことが可能な特徴マップに前記ニューラルネットワーク（１）のインプット（２）を移行させる特徴抽出器と、
ｋ×Ｋの行列Ａと、任意選択的にｋ次元のバイアスベクトルｂとを適用することによって、前記特徴マップを、ｋ個の利用可能なクラスに関してｋ個の分類スコアを有するベクトルにアウトプット（３）としてマッピングする分類ヘッドと
を有する（１０５ａ）、請求項６記載の方法（１００）。

【請求項8】

少なくとも１つの新たなトレーニングサンプル（２ａ’）が、前記バッチＢにおいて、ｋ個の利用可能なクラスのいずれにも相当しない目標アウトプット（３ａ’）によってラベル付けされていること（１１１）に応答して、
前記行列Ａを、既存のｋ個の行の平均によって占有されている、さらなるｋ＋１番目の行ぶんだけ拡張し（１１２）、かつ
それが存在する場合、前記バイアスベクトルｂを、既存のｋ個の成分の平均によって占有されているｋ＋１番目の成分ぶんだけ拡張する（１１３）、請求項７記載の方法（１００）。

【請求項9】

前記部分集合

【数3】

を、前記予め定められた分類の前記クラスに対して、実質的に同じ数のこれまでのトレーニングサンプル（２ａ）を含んでいるように選択する、請求項６から８までのいずれか１項記載の方法（１００）。

【請求項10】

前記クラスは、交通利用者、車道、車道境界線、交通標識、障害物および／または車両の誘導のための、交通に関連する他の対象物を表す、請求項６から９までのいずれか１項記載の方法（１００）。

【請求項11】

測定データ（２）として、画像、オーディオ信号、時系列の測定値、レーダーデータおよび／またはライダーデータを選択する、請求項１から１０までのいずれか１項記載の方法（１００）。

【請求項12】

さらにトレーニングされた前記ニューラルネットワーク（１＊）に測定データ（２）を供給し（１６０）、これによって、さらにトレーニングされた前記ニューラルネットワーク（１＊）がアウトプット（３）を生成し、
前記ニューラルネットワーク（１）の前記アウトプット（３）から駆動制御信号（１７０ａ）を形成し（１７０）、かつ
車両（５０）、運転支援システム（６０）、品質管理のためのシステム（７０）、領域を監視するためのシステム（８０）および／または医療用画像形成のためのシステム（９０）を、前記駆動制御信号（１７０ａ）によって駆動制御する（１８０）、請求項１から１１までのいずれか１項記載の方法（１００）。

【請求項13】

機械可読命令を備えたコンピュータプログラムであって、
前記機械可読命令は、１つまたは複数のコンピュータおよび／またはコンピュータインスタンスにおいて実行されるときに、前記１つまたは複数のコンピュータおよび／またはコンピュータインスタンスに、請求項１から１２までのいずれか１項記載の方法（１００）を実施させる、
コンピュータプログラム。

【請求項14】

請求項１３記載のコンピュータプログラムを備えた機械可読データ担体。

【請求項15】

請求項１３記載のコンピュータプログラムを備えた、かつ／または請求項１４記載の機械可読データ担体を備えた、１つまたは複数のコンピュータおよび／またはコンピュータインスタンス。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、たとえば、特定のタイプの対象物の存在を考慮した画像または他の測定データの分類のために利用可能な、すでにトレーニングされているニューラルネットワークのさらなるトレーニングに関する。

【0002】

背景技術
たとえば、特定の対象物の存在を考慮して、画像または他の測定データを分類するニューラルネットワークは、典型的には、監視下で、目標アウトプットによってラベル付けされている多数のトレーニングサンプルでトレーニングされる。トレーニングの完了後、ニューラルネットワークが、トレーニング中に見られなかった画像もしくは測定データに対しても、具体的な課題を考慮した正しいアウトプットを供給することが期待される。

【0003】

この場合、後から、このトレーニングを拡張する必要性が生じ得る。たとえば、新たな交通標識が立法機関によって導入された後に、交通標識を識別するためのシステムは、この新たな交通標識も確実に識別するために更新を必要とする。

【0004】

発明の開示
本発明の範囲において、測定データを処理するためのニューラルネットワークをさらにトレーニングするための方法が開発された。この方法は、ニューラルネットワークが、集合Ｍからのトレーニングサンプルによってトレーニングされている状況から出発し、これらのトレーニングサンプルにはそれぞれ、ニューラルネットワークの目標アウトプットがラベル付けされている。

【0005】

この方法の範囲において、同様にニューラルネットワークの目標アウトプットによってラベル付けされている新たなトレーニングサンプルのバッチＢが提供される。さらに、これまでのトレーニングサンプルの部分集合

【数1】

が提供される。

【0006】

これに関連して、生成モデル、たとえば敵対的生成ネットワーク（ＧＡＮ）によって生成されたトレーニングサンプルは、これまでのトレーニングで使用された実際のトレーニングサンプルと等価である。すなわち、これまでのトレーニングサンプル自体の代わりに、このようなトレーニングサンプルを生成することができる生成モデルを格納することが可能である。生成されたトレーニングサンプルは、以前に実際に使用されたトレーニングサンプルと同じドメインに属しており、これは、本明細書で提案される方法における、自身の効果にとって重要である。

【0007】

バッチＢからの新たなトレーニングサンプルも、部分集合Ｄからのこれまでのトレーニングサンプルも、ニューラルネットワークによってそれぞれ、アウトプットに処理される。各目標アウトプットからのこれらのアウトプットの偏差は、予め定められたコスト関数によって評価される。

【0008】

ニューラルネットワークの挙動を特徴付けるパラメータは、これまでのトレーニングサンプルおよび新たなトレーニングサンプルをさらに処理する際に、コスト関数による評価が
・バッチＢからの新たなトレーニングサンプルに関して、改良され、かつ
・部分集合Ｄからのこれまでのトレーニングサンプルに関して、改悪されない、
ことを目標に最適化される。

【0009】

パラメータは、特に、たとえば重みを含んでいてよく、この重みによって、ニューラルネットワークのニューロンまたは別の処理ユニットに供給されるインプットが重み付けされて加算される。

【0010】

さらなるトレーニングはこのようにして、ニューラルネットワークがトレーニングされているドメインを、トレーニングサンプルの元来の集合Ｍから新たなバッチＢを中心にして拡大する。このために、トレーニングサンプルの和集合

【数2】

での完全な新たなトレーニングに対して大きな計算コストが必要となることはない。

【0011】

さらに、元来のトレーニングデータの完全な集合Ｍにアクセスする必要はなく、理想的には集合Ｍの代表的な断面であり得る比較的小さな部分集合Ｄだけが必要になる。この小さな部分集合Ｄを、たとえば、車両に搭載された制御機器または組み込みシステムの制限されたメモリスペース内に格納することもできる。これに対して、メモリスペースに、たとえば、対象物の識別のためのシステムに対する、数千時間のテスト走行中に記録されたトレーニング画像を格納することは実用的ではないだろう。必要なメモリスペースが何らかの形で提供され得る場合であっても、元来のトレーニングを行ったシステムの製造業者が、トレーニングサンプルの完全な集合Ｍを、コントロールせずに引き渡すことはないであろう。ラベル付けされたトレーニングサンプルの作成には極めて高い費用がかかるので、トレーニングサンプルの完全な集合Ｍを手に入れた競合他社は、自社のシステムの開発コストの大部分を節約することができる。

【0012】

これに対して、さらなるトレーニングがたとえば「サービス」として、たとえばクラウドにおいて実行される場合には、メモリスペースに関する制限は存在しない。この場合、トレーニングサンプルを引き渡す必要もない。つまり、すなわちケースでは、トレーニングサンプルの完全な集合Ｍを部分集合Ｄとして選択することに何の不都合もない。

【0013】

この場合、コスト関数の評価が、部分集合Ｄからのこれまでのトレーニングサンプルに関して、さらなるトレーニングによって改悪されるか否かの検査は、ニューラルネットワークを、いわゆる「壊滅的な忘却」から保護する。したがってバッチＢから新たに学習された知識は、集合Ｍからのこれまでの知識に付加的に加えられ、これに置き換わらない。このことは、たとえば、特定の状況におけるニューラルネットワークの適正な挙動を道路交通への認可のために認証しなければならない車両での用途の場合に特に重要である。この場合、変更に対する動作許可は、認可された車両におけるその他の変更と同様に、場合によってはこの変更によって挙動の改良が生じるが、決して改悪は生じないということに結び付けられていてよい。

【0014】

特に有利な構成では、部分集合Ｄからのこれまでのトレーニングサンプルに対するコスト関数の期待値の第１の勾配Ｇ_０が、パラメータに従って、たとえば次の式

【数3】

に従って求められる。

【0015】

ここで、Ｐは最適化されるべきパラメータであり、Ｅは期待値であり、ｘはトレーニングサンプルであり、ｙはトレーニングサンプルｘに関する目標アウトプットであり、Ｌはコスト関数であり、ｆ（ｘ）はトレーニングサンプルｘに対するニューラルネットワークのアウトプットである。

【0016】

さらに、バッチＢからの新たなトレーニングサンプルに対するコスト関数の期待値の第２の勾配Ｇ_１も、パラメータに従って、たとえば次の式

【数4】

に従って求められる。

【0017】

これらの２つの勾配Ｇ_０およびＧ_１から勾配ｇが求められ、この勾配ｇに沿って、パラメータが次のトレーニングステップにおいて変更される。このようにして、この意図された変更が、一方では次のトレーニングステップにおいて新たな知識の学習に関してどのような作用を有し、他方ではこれまでの知識の、起こり得る「壊滅的な忘却」に関して、どのような作用を有しているのかが正確にコントロールされる。

【0018】

特に有利には、勾配ｇを、Ｇ_０の直交補空間

【数5】

へのＧ_１の投影として、たとえば次の式

【数6】

に従って求めることができる。

【0019】

この場合、勾配ｇは、Ｇ_０に沿った成分を有していない。すなわち、部分集合Ｄからのこれまでのトレーニングサンプルに関する改悪は生じない。この境界条件を遵守するためには、必要に応じて、バッチＢからの新たなトレーニングサンプルに関するトレーニングの進捗も後退させられる。

【0020】

これらの勾配の計算を、全てのパラメータに対して同時に行うことができるが、たとえばニューラルネットワークが編成されている種々の層のパラメータに対して逐次的に行うこともできる。

【0021】

さらなる特に有利な構成では、部分集合Ｄからのこれまでのトレーニングサンプルに関するコスト関数による評価の改悪が、予め定められた閾値を上回ったことに応答して、さらなるトレーニングが中断される。改悪は、たとえばコスト関数の期待値

【数7】

の形態で、部分集合Ｄからのこれまでのトレーニングサンプルに関して測定され得る。この指標は、各トレーニングステップにおいて常にわずかな改悪しか生じないことによって「偽装」もされない。このような小さな改悪の収集は、確実に記録される。

【0022】

これは、橋を建設するときに、柱から始まる担体を、撓む前に、特定の距離しか空中に自由にぶら下げることができないという事実と同様に、ニューラルネットワーク１をさらにトレーニングする可能性が「消費される」もしくは「使い尽くされる」可能性があることを意味している。ある程度の量の新たなトレーニングサンプルが利用できる場合、この「消費／使い尽くし」を考慮すると、これらの新たなトレーニングサンプル全てを複数のバッチＢに分割するよりも、単一のバッチＢで提示する方が好適である。

【0023】

さらなるトレーニングの監視のために、特に有利には、集合Ｍからのトレーニングサンプルでのニューラルネットワークの元来のトレーニングのために使用されたコスト関数と同じコスト関数を使用することができる。この場合には、さらにトレーニングされたネットワークの挙動が、部分集合Ｄからのこれまでのトレーニングサンプルに関して、依然として、元来トレーニングされた挙動にどの程度まで対応しているかを極めて正確に測定することができる。しかし、このコスト関数が利用できない場合には、他のあらゆる適切なコスト関数を使用することもできる。

【0024】

さらなる特に有利な構成では、測定データのための、特に画像のための、予め定められた分類のクラスにおける分類器として構成されているニューラルネットワークが選択される。まさにこのような用途ではしばしば、多数のクラスに関するトレーニングの後から、いくつかの少数の他のクラスの識別を追加する必要性が生じる。さらに、種々異なるクラスに関連する特徴を識別する複数のタスクの間には、競合する相互作用はほとんどない。すなわち、あるクラスに関連する識別を改良しても、他のクラスに関連する識別が犠牲になることはない。

【0025】

ここで、ニューラルネットワークは、特に、たとえば、
・Ｋ個の要素を有するベクトルとして表すことが可能な特徴マップにニューラルネットワークのインプットを移行させる特徴抽出器と、
・ｋ×Ｋの行列Ａと、任意選択的にｋ次元のバイアスベクトルｂとを適用することによって、特徴マップを、ｋ個の利用可能なクラスに関してｋ個の分類スコアを有するベクトルにニューラルネットワークのアウトプットとしてマッピングする分類ヘッドと
を含んでいる。このアーキテクチャを有するネットワークは、特に良好にかつ有機的に付加的なクラスに拡張される。

【0026】

特に、たとえば、少なくとも１つの新たなトレーニングサンプルが、バッチＢにおいて、ｋ個の利用可能なクラスのいずれにも相当しない目標アウトプットによってラベル付けされていることに応答して、
・行列Ａが、既存のｋ個の行の平均によって占有されている、さらなるｋ＋１番目の行ぶんだけ拡張されてよく、かつ
・それが存在する場合、バイアスベクトルｂが、既存のｋ個の成分の平均によって占有されているｋ＋１番目の成分ぶんだけ拡張されてよい。

【0027】

ここで、この新たなクラスのためのソフトマックススコアは、ジェンセンの不等式に基づいて

【数8】

である。これは、さらなるトレーニングを行わない場合には、新たなクラスが、使用可能な全てのｋ＋１クラスから１つのクラスがランダムに引き出された場合に予想されるのと同じ大きさの最大の分類スコアしか取得できないことを意味している。したがって、ｋ個の既存のクラスに関連した分類器の挙動を変えることなく、ｋ＋１番目のクラスの識別を追加することができる。実際には全く存在しない新たな情報がシステムに取り込まれることはない。

【0028】

さらなる特に有利な構成では、部分集合

【数9】

が、予め定められた分類のクラスに対して、実質的に同じ数のこれまでのトレーニングサンプルを含んでいるように選択される。この場合、これは、トレーニングサンプルの元来の集合Ｍの代表的な断面を表している。すなわち、部分集合Ｄ上のニューラルネットワークの挙動は、高い確率で、トレーニングサンプルの元来の集合Ｍ上の挙動に対する適切な予測である。

【0029】

これらのクラスは、特に、たとえば交通利用者、車道、車道境界線、交通標識、障害物および／または車両の誘導のための、交通に関連する他の対象物を表すことができる。まさに交通標識および交通利用者の場合には、さらなるトレーニングの対象となり得る改新が存在することが多い。たとえば数年前、小型電気自動車（「ｅスクータ」）という全く新しいタイプの車両が誕生した。

【0030】

さらなるトレーニングの際に得られた、ニューラルネットワークの挙動を特徴付けるパラメータの新たな値は、たとえば、中央エンティティの場合に収集可能であり、後に公開されるべき、ニューラルネットワークの一般的な更新のための基礎として使用可能である。特に、たとえば、パラメータの値が多数のユーザによって収集されてよい。この場合、これらのパラメータはバッチＢにおける新たなトレーニングサンプルに関する推定を可能にしないので、ユーザのプライバシは保護されたままである。

【0031】

測定データとして、特にたとえば画像、オーディオ信号、時系列の測定値、レーダーデータおよび／またはライダーデータを選択することができる。まさにこれらのデータ形式は、可能性のある多数のクラスに関連するステートメントを含むことができるという意味で極めて多岐にわたっている。

【0032】

さらなるトレーニングの別の重要な用途は、たとえば大量生産された構成部材のオプティカルな品質管理である。この場合には、たとえば、新たな構成部材および／または新たな条件に合うようにプロセスを調整するために、さらなるトレーニングを利用することができる。

【0033】

さらなる特に有利な構成では、さらにトレーニングされたニューラルネットワークに測定データが供給され、これによって、さらにトレーニングされたニューラルネットワークがアウトプットを生成する。これらのアウトプットから、駆動制御信号が形成される。車両、運転支援システム、品質管理のためのシステム、領域を監視するためのシステムおよび／または医療用画像形成のためのシステムが、この駆動制御信号によって駆動制御される。バッチＢぶんだけ拡張された、トレーニングサンプルのドメインにおいて動作し、そこから一般化する、ニューラルネットワークの能力が向上するため、駆動制御される各システムの反応が、測定データによって検出された状況に合う確率が高くなる。

【0034】

この方法は、特に完全にまたは部分的にコンピュータ実装されていてよい。したがって、本発明は、機械可読命令を備えたコンピュータプログラムにも関し、これらの機械可読命令は、１つまたは複数のコンピュータおよび／またはコンピュータインスタンスにおいて実行されるときに、１つまたは複数のコンピュータおよび／またはコンピュータインスタンスに、上述の方法を実施させる。この意味では、車両用の制御機器ならびに同様に、機械可読命令を実行することが可能である技術的機器用の組み込みシステムもコンピュータとみなすことができる。コンピュータインスタンスの例は、クラウド内で機械可読命令を実行するための仮想機械、コンテナまたはサーバレスの実行環境である。

【0035】

同様に、本発明は、コンピュータプログラムを備えた機械可読データ担体および／またはダウンロード製品にも関する。ダウンロード製品は、データネットワークを介して伝送可能な、すなわち、データネットワークのユーザによってダウンロード可能なデジタル製品であり、これは、たとえば、オンラインショップにおいて即座のダウンロードのために売りに出されてよい。

【0036】

本発明を改良するさらなる措置を以降で、図面に基づいて、本発明の有利な実施例の説明とともに、より詳細に示す。

【図面の簡単な説明】

【0037】

【図1】ニューラルネットワーク１をさらにトレーニングするための方法１００の実施例を示す図である。

【図2】勾配ｇの形成を示す図であり、この勾配ｇに沿ってパラメータ１ａを、これまでのトレーニングサンプル２ａに関する改悪を伴わずに変更することができる。

【0038】

実施例
図１は、測定データ２を処理するためにニューラルネットワーク１をさらにトレーニングするための方法１００の実施例の概略的なフローチャートである。このニューラルネットワーク１は、すでに集合Ｍからのトレーニングサンプル２ａを用いてトレーニングされており、これらのトレーニングサンプル２ａは、それぞれニューラルネットワーク１の目標アウトプット３ａによってラベル付けされている。

【0039】

ステップ１０５において、ニューラルネットワーク１が選択され、このニューラルネットワーク１は、測定データ２のための、特に画像のための、予め定められた分類のクラスにおける分類器として構成されている。

【0040】

ブロック１０５ａによれば、このようなネットワーク１は特に、
・Ｋ個の要素を有するベクトルとして表すことが可能な特徴マップにニューラルネットワーク１のインプット２を移行させる特徴抽出器と、
・ｋ×Ｋの行列Ａと、任意選択的にｋ次元のバイアスベクトルｂとを適用することによって、特徴マップを、ｋ個の利用可能なクラスに関してｋ個の分類スコアを有するベクトルにアウトプット３としてマッピングする分類ヘッドと
を含んでいる。

【0041】

ステップ１１０において、同様にニューラルネットワーク１の目標アウトプット３ａ’によってラベル付けされている、新たなトレーニングサンプル２ａ’のバッチＢが提供される。

【0042】

ブロック１１１によれば、少なくとも１つの新たなトレーニングサンプル２ａ’が、バッチＢにおいて、ｋ個の利用可能なクラスのいずれにも相当しない目標アウトプット３ａ’によってラベル付けされていることに応答して（真理値１）、
・行列Ａが、ブロック１１２に従って、既存のｋ個の行の平均によって占有されている、さらなるｋ＋１番目の行ぶんだけ拡張されてよく、かつ
・それが存在する場合、ブロック１１３に従って、バイアスベクトルｂが、既存のｋ個の成分の平均によって占有されているｋ＋１番目の成分ぶんだけ拡張されてよい。

【0043】

ステップ１２０において、これまでのトレーニングサンプル２ａの部分集合

【数10】

が提供される。

【0044】

ステップ１３０において、バッチＢからの新たなトレーニングサンプル２ａ’も部分集合Ｄからのこれまでのトレーニングサンプル２ａもニューラルネットワーク１によって、それぞれアウトプット３’，３に処理される。

【0045】

ステップ１４０において、各目標アウトプット３ａ’，３ａからのアウトプット３’，３の偏差が、予め定められたコスト関数４によって評価される。結果は、評価４ａである。

【0046】

ここでは特に、たとえばブロック１４１に従って、集合Ｍからのトレーニングサンプル２ａでのニューラルネットワーク１の元来のトレーニングのために使用されたコスト関数４を、さらなるトレーニングのためにも使用することができる。

【0047】

ステップ１５０において、ニューラルネットワーク１の挙動を特徴付けるパラメータ１ａは、これまでのトレーニングサンプル２ａおよび新たなトレーニングサンプル２ａ’をさらに処理する際に、コスト関数４による評価４ａが
・バッチＢからの新たなトレーニングサンプル２ａ’に関して、改良され、かつ
・部分集合Ｄからのこれまでのトレーニングサンプル２ａに関して、改悪されない
ことを目標に最適化される。

【0048】

パラメータ１ａの最終的に最適化された状態には、参照符号１ａ＊が付けられている。したがって、ニューラルネットワーク１のさらにトレーニングされた状態には、参照符号１＊が付けられている。

【0049】

ブロック１５１によれば、部分集合Ｄからのこれまでのトレーニングサンプル２ａに対するコスト関数４の期待値の第１の勾配Ｇ_０を、パラメータ１ａに従って求めることができる。

【0050】

次いで、ブロック１５２によれば、バッチＢからの新たなトレーニングサンプル２ａ’に対するコスト関数４の期待値の第２の勾配Ｇ_１を、パラメータ１ａに従って求めることができる。

【0051】

ブロック１５３によれば、勾配Ｇ_０およびＧ_１から、勾配ｇを求めることができ、この勾配ｇに沿ってパラメータ１ａが、次のトレーニングステップにおいて変更される。

【0052】

ブロック１５４によれば、部分集合Ｄからのこれまでのトレーニングサンプル２ａに関するコスト関数４による評価４ａの改悪が、予め定められた閾値５を上回っているか否かを検査することができる。そうである場合（真理値１）には、ブロック１５５に従って、さらなるトレーニングを中断することができる。

【0053】

ステップ１６０において、さらにトレーニングされたニューラルネットワーク１＊に測定データ２が供給され、これによって、さらにトレーニングされたニューラルネットワーク１＊がアウトプット３を生成する。

【0054】

ステップ１７０において、ニューラルネットワーク１のアウトプット３から駆動制御信号１７０ａが形成される。

【0055】

ステップ１８０において、車両５０、運転支援システム６０、品質管理のためのシステム７０、領域を監視するためのシステム８０および／または医療用画像形成のためのシステム９０が、駆動制御信号１７０ａによって駆動制御される。

【0056】

図２は、これまでのトレーニングサンプル２ａに関する改悪を伴わずに、それに沿ってパラメータ１ａが変更可能な勾配ｇをどのようにして得ることができるかを、簡略化された２次元図で示している。

【0057】

部分集合Ｄからのこれまでのトレーニングサンプル２ａのコスト関数４の期待値の勾配Ｇ_０は、パラメータ１ａに従って、評価４ａをコスト関数４によって、部分集合Ｄからのこれまでのトレーニングサンプル２ａに関して変更するために、パラメータ１ａをどの方向において変更しなければならないかを示している。このような変更は望ましくないので、Ｇ_０に対する直交補空間

【数11】