IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツングの特許一覧

特開2024-127846所与の測定データに関するトレーニングされた機械学習モデルの一般化能力の測定
<>
  • 特開-所与の測定データに関するトレーニングされた機械学習モデルの一般化能力の測定 図1
  • 特開-所与の測定データに関するトレーニングされた機械学習モデルの一般化能力の測定 図2
  • 特開-所与の測定データに関するトレーニングされた機械学習モデルの一般化能力の測定 図3
  • 特開-所与の測定データに関するトレーニングされた機械学習モデルの一般化能力の測定 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024127846
(43)【公開日】2024-09-20
(54)【発明の名称】所与の測定データに関するトレーニングされた機械学習モデルの一般化能力の測定
(51)【国際特許分類】
   G06F 18/2115 20230101AFI20240912BHJP
   G06T 7/00 20170101ALI20240912BHJP
   G06V 10/776 20220101ALI20240912BHJP
【FI】
G06F18/2115
G06T7/00 350B
G06V10/776
【審査請求】未請求
【請求項の数】15
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024034411
(22)【出願日】2024-03-06
(31)【優先権主張番号】23160418
(32)【優先日】2023-03-07
(33)【優先権主張国・地域又は機関】EP
(71)【出願人】
【識別番号】390023711
【氏名又は名称】ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング
【氏名又は名称原語表記】ROBERT BOSCH GMBH
【住所又は居所原語表記】Stuttgart, Germany
(74)【代理人】
【識別番号】100114890
【弁理士】
【氏名又は名称】アインゼル・フェリックス=ラインハルト
(74)【代理人】
【識別番号】100098501
【弁理士】
【氏名又は名称】森田 拓
(74)【代理人】
【識別番号】100116403
【弁理士】
【氏名又は名称】前川 純一
(74)【代理人】
【識別番号】100134315
【弁理士】
【氏名又は名称】永島 秀郎
(74)【代理人】
【識別番号】100162880
【弁理士】
【氏名又は名称】上島 類
(72)【発明者】
【氏名】ユメン リー
(72)【発明者】
【氏名】アンナ コレヴァ
(72)【発明者】
【氏名】ダン チャン
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096BA02
5L096BA03
5L096BA04
5L096BA05
5L096BA06
5L096CA04
5L096FA64
5L096HA11
5L096KA04
(57)【要約】      (修正有)
【課題】所与のタスクに関して、測定データの1つ又は複数の入力レコードが属する目標ドメイン及び/又は分布に一般化するための、測定データの処理用のトレーニングされた機械学習モデルの能力を測定する方法を提供する。
【解決手段】方法100は、測定データの入力レコード2から、目標ドメイン及び/又は分布を特徴付ける目標スタイル2bを決定するステップ110と、目標スタイル2bに少なくとも部分的に基づいて、目標ドメイン及び/又は分布内の検証例4並びに対応する基底真理ラベル4も取得するステップ120と、トレーニングされた機械学習モデル1により、検証例を出力に処理するステップ130と、出力3と各基底真理ラベルとの間の比較に基づいて、トレーニングされた機械学習モデルの精度を、目標ドメインに一般化するための、トレーニングされた機械学習モデル1の求められている能力1aとして決定するステップ140と、を含む。
【選択図】図1
【特許請求の範囲】
【請求項1】
所与のタスクに関して、測定データの1つ又は複数の入力レコード(2)が属する目標ドメイン及び/又は分布に一般化するための、測定データの処理用のトレーニングされた機械学習モデル(1)の能力(1a)を測定するための方法(100)であって、
前記方法(100)は、以下のステップ:
前記測定データの入力レコード(2)から、前記目標ドメイン及び/又は分布を特徴付ける目標スタイル(2b)を決定するステップ(110)と、
前記目標スタイル(2b)に少なくとも部分的に基づいて、前記目標ドメイン及び/又は分布内の検証例(4)を、並びに、対応する基底真理ラベル(4)も取得するステップ(120)と、
前記トレーニングされた機械学習モデル(1)により、前記検証例(4)を出力(3)に処理するステップ(130)と、
前記出力(3)と前記各基底真理ラベル(4)との間の比較に基づいて、前記トレーニングされた機械学習モデル(1)の精度を、前記目標ドメインに一般化するための、前記トレーニングされた機械学習モデル(1)の求められている能力(1a)として決定するステップ(140)と、
を含む、方法(100)。
【請求項2】
前記目標スタイル(2b)を決定するステップ(110)は、以下のステップ:
トレーニングされた特徴抽出器ネットワーク(6)により、前記測定データの入力レコード(2)を目標特徴マップ(2c)に処理するステップ(111)と、
前記目標特徴マップ(2c)から、前記目標ドメインを特徴付ける前記測定データの特徴(2d)を決定するステップ(112)と、
を含む、請求項1に記載の方法(100)。
【請求項3】
前記検証例(4)を取得するステップ(120)は、以下のステップ:
ソースドメイン及び/又は分布内のソース例(5)、並びに、対応する基底真理ラベル(5)を準備するステップ(121)と、
これらのソース例(5)から、前記ソースドメイン及び/又は分布内の前記ソース例(5)のコンテンツを特徴付けるソースコンテンツ(5a)を決定するステップ(122)と、
各ソースコンテンツ(5a)及び前記目標スタイル(2b)を、前記目標ドメイン及び/又は分布内の検証例(4)に結合するステップ(123)であって、それにより、各ソース例(5)の基底真理ラベル(5*=:4*)が、前記検証例(4)に対して有効なままとなる、ステップ(123)と、
を含む、請求項1又は2に記載の方法(100)。
【請求項4】
前記ソースコンテンツ(5a)を決定するステップ(122)は、以下のステップ:
トレーニングされた特徴抽出器ネットワーク(6)により、前記ソース例(5)をソース特徴マップ(5c)に処理するステップ(122a)と、
前記ソース特徴マップ(5c)から、前記ソースドメイン及び/又は分布内のコンテンツを特徴付ける前記ソース例(5)の特徴(5d)を決定するステップ(122b)と、
を含む、請求項3に記載の方法(100)。
【請求項5】
前記ソースコンテンツ(5a)及び前記目標スタイル(2b)を結合するステップ(123)は、前記ソースコンテンツ(5a)及び前記目標スタイル(2b)を、トレーニングされた発生ネットワーク(9)に提供するステップ(123a)を含む、請求項3又は4に記載の方法(100)。
【請求項6】
前記検証例(4)を取得するステップ(120)は、前記目標スタイル(2b)に基づいて、ライブラリから検証例(4)を検索するステップ(124)を含む、請求項1乃至5のいずれか一項に記載の方法(100)。
【請求項7】
測定データのレコードは、少なくとも1つの測定量の測定値を平面内及び/又は空間内の位置に割り当てる画像及び/又は点群を含む、請求項1乃至6のいずれか一項に記載の方法(100)。
【請求項8】
測定データのレコードを、所与の分類の1つ又は複数のクラスに関する分類スコアにマッピングする分類器が、前記トレーニングされた機械学習モデル(1)として選択される、請求項1乃至7のいずれか一項に記載の方法(100)。
【請求項9】
車両(50)又はロボット(51)に搭載された少なくとも1つのセンサによって捕捉された測定データの入力レコード(2)が選択される(105)、請求項1乃至8のいずれか一項に記載の方法(100)。
【請求項10】
前記検証例(4)は、前記車両(50)又は前記ロボット(51)の外部にある外部サーバから取得され(125)、
前記検証例(4)を処理するステップ、及び、一般化するための求められている能力(1a)を決定するステップは、前記車両(50)又は前記ロボット(51)上において実行される(131,141)、請求項9に記載の方法(100)。
【請求項11】
前記トレーニングされた機械学習モデルの前記決定された能力(1a)が、予め定められた基準(150)を満たすことを決定するステップに応じて、以下のステップ:
前記機械学習モデル(1)の出力(3)を使用する下流側技術システム(50,51,60,70,80,90)が、当該技術システム(50,51,60,70,80,90)を、ノイズの多い出力(3)又は適正でない出力(3)をより良好に許容し得る動作状態に移行させるために起動されるステップ(160)をさらに含む、請求項1乃至10のいずれか一項に記載の方法(100)。
【請求項12】
測定データの入力レコード(2)から、請求項1に記載の方法において使用するための検証例を生成するための方法(200)であって、前記方法(200)は、以下のステップ:
ソースドメイン及び/又は分布内のソース例(5)、並びに、対応する基底真理ラベル(5)を準備するステップ(210)と、
前記ソース例5から、前記ソースドメイン及び/又は分布内の前記ソース例(5)のコンテンツを特徴付けるソースコンテンツ(5a)を決定するステップ(220)と、
前記測定データの入力レコード(2)から、前記測定データの1つ又は複数の入力レコード(2)が属する目標ドメイン及び/又は分布を特徴付ける目標スタイル(2b)を決定するステップ(230)と、
各ソースコンテンツ(5a)及び前記目標スタイル(2b)を、前記目標ドメイン及び/又は分布内の検証例(4)に結合するステップ(240)であって、それにより、各ソース例(5)の基底真理ラベル(5=:4)が、前記検証例(4)に対して有効なままとなる、ステップ(240)と、
を含む、方法(200)。
【請求項13】
コンピュータプログラムであって、1つ又は複数のコンピュータ及び/又は計算インスタンス上において実行されるときに、前記1つ又は複数のコンピュータ及び/又は計算インスタンスに、請求項1乃至12のいずれか一項に記載の方法(100,200)を実施させるための機械可読命令を含むコンピュータプログラム。
【請求項14】
請求項13に記載のコンピュータプログラムを備えた非一時的機械可読データ担体及び/又はダウンロード製品。
【請求項15】
請求項13に記載のコンピュータプログラムを備え、及び/又は、請求項14に記載の非一時的機械可読データ担体及び/又はダウンロード製品を備えた1つ又は複数のコンピュータ。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、トレーニングされた機械学習モデルを用いた測定データの評価に関する。
【背景技術】
【0002】
背景
多くの用途、例えば、構内若しくは公共道路交通においても自律車両若しくはロボットの操舵、又は、品質保証検査においては、測定データは、トレーニングされた機械学習モデルを使用して処理される。特に、機械学習モデルは、カメラからの画像データの処理、及び、レーダセンサ又はライダセンサからの点群データの処理に有利である。任意の所与のシーンのそのような測定データの2つのレコードが直ちに連続して捕捉される場合であっても、それらは同一ではない。このことは、トレーニングされた機械学習モデルが処理に使用される場合、機械学習モデルにはトレーニングされたトレーニングデータセットを一般化するための能力があるため、問題となることはない。
【発明の概要】
【発明が解決しようとする課題】
【0003】
ただし、一般化するための能力は、本質的に、トレーニングデータセットが属するドメイン及び/又は分布に限定されている。機械学習モデルが、過度に異なるドメイン及び/又は分布からの測定データのレコードに遭遇した場合、その出力は、精度を欠く可能性がある。
【課題を解決するための手段】
【0004】
発明の開示
本発明は、測定データの1つ又は複数の入力レコードが属する目標ドメイン及び/又は分布に一般化するための、測定データの処理用のトレーニングされた機械学習モデルの能力を測定するための方法を提供する。機械学習モデルは、特定の所与のタスクのためにトレーニングされる。したがって、一般化するための能力は、この所与のタスクに関して測定される。目標ドメイン及び/又は分布は、明示的に知られている必要はない。測定データの入力レコードがこのドメイン及び/又は分布の代表であれば十分である。
【0005】
特に、「機械学習モデル」という用語は、その挙動を特徴付けるパラメータを用いて適合化可能な、一般化するための高い能力を有する任意の機能を含む。例えば、機械学習モデルは、1つ又は複数のニューラルネットワークを含み得る。パラメータは、例えば、ニューロンへの入力が、このニューロンの活性化に合計される重みを含み得る。
【0006】
測定データの入力レコードから、目標ドメイン及び/又は分布を特徴付ける目標スタイルが決定される。この目標スタイルに少なくとも部分的に基づいて、目標ドメイン及び/又は分布における検証例が決定される。そのような各検証例は、対応する基底真理ラベルでラベル付けされる。この基底真理ラベルは、それぞれの検証例が与えられたときに、トレーニングされた機械学習モデルが理想的に生成すべき出力である。以下において説明するように、ラベル付けされた検証例を取得する1つの手法は、新しい検証例を取得し、この新しい検証例のために基底真理ラベルを再利用するために、基底真理ラベルが既に利用可能であるソースドメイン内のコンテンツを、目標スタイルと混合することである。
【0007】
トレーニングされた機械学習モデルは、検証例を出力に処理する。出力と各基底真理ラベルとの間の比較に基づいて、検証例のセット上においてトレーニングされた機械学習モデルの精度が、目標ドメインに一般化するための、トレーニングされた機械学習モデルの求められている能力として決定される。
【0008】
このようにして、目標スタイルに基づく検証例を得るための任意の手法が与えられると、測定データの入力レコードが機械学習モデルのトレーニングによってまだ十分にカバーされているか否か、又は、これらの入力レコードがトレーニングのカバー範囲から外れる危険にさらされているか否かを決定することができる。後者は、機械学習モデルによって生成された出力が適正になることがもはやトレーニングによって保証されなくなることを意味する。
【0009】
比喩的に類推すれば、人間の運転者のトレーニングは、機械学習モデルのトレーニングと非常に似ており、わずか数十時間のトレーニング及び1,000km未満の走行の後でも、運転者は、トレーニング中に遭遇した状況だけでなく、視認できない状況にも安全に対処することが期待される。例えば、夏期にすべての運転講習を受けた運転者でさえも、冬場の条件において同様に運転できることが期待される。運転者のトレーニングは、十分に一般化される。もしそうでなければ、すべての運転者は、冬季に所定量の運転講習を受けなければならないことが法律で義務付けられるであろう。しかしながら、一般化するための能力は無限ではない。乗用車の運転のみを学習した運転者は、必ずしもトラック、バス、オートバイなど運転が異なり、動的挙動も大きく異なるものを運転できるとは限らない。そういう理由から、運転者は、これらの非常に異なる車両の運転を許可される前に、付加的な講習の受講と、アップグレードされたライセンスの取得とを要求される。
【0010】
検証例を得るための1つの例示的な手法は、測定データの入力レコードにおける特性を検出し、次いで、基底真理ラベルが既知である例を、それらの特性も同様に得られるように修正することである。非常に簡素な例においては、冬期に撮影された測定データのレコードとして所与の画像を検出することに応じて、基底真理ラベルが既知である夏期に撮影された画像上に雪が上書きされるものとしてもよい。
【0011】
特に好適な実施形態においては、目標ドメインスタイルを決定するステップは、以下のステップ:
トレーニングされた特徴抽出器ネットワークにより、測定データの入力レコードを目標特徴マップに処理するステップと、
当該目標特徴マップから、目標ドメインを特徴付ける測定データの特徴を決定するステップと、
を含む。
【0012】
例えば、畳み込みニューラルネットワークは、目標特徴マップの生成のために使用されるものとしてよい。次いで、当該目標特徴マップは、一方では、目標ドメイン及び/又は分布をそのように特徴付ける特徴を有する第1の寄与と、他方では目標ドメイン及び/又は分布内のコンテンツを特徴付ける特徴を有する第2の寄与とに分解されるものとしてよい。ここでは、第1の寄与のみが必要である。例えば、Nvidiaによって提案されたStyleGANネットワークと共に使用され得るエンコーダは、畳み込みニューラルネットワークを含み、同様に特徴マップから前記第1のスタイル寄与及び前記第2のコンテンツ寄与を決定するための「map2style」手段と「map2content」手段とを含む。第1のスタイル寄与と第2のコンテンツ寄与は、StyleGAN発生器ネットワークに供給されるものとしてよい。
【0013】
さらに特に好適な実施形態においては、検証例を取得するステップは、以下のステップ:
ソースドメイン及び/又は分布内のソース例と、対応する基底真理ラベルとを準備するステップと、
これらのソース例から、ソースドメイン及び/又は分布内のソース例のコンテンツを特徴付けるソースコンテンツを決定するステップと、
各ソースコンテンツ及び目標スタイルを、目標ドメイン及び/又は分布内の検証例に結合するステップであって、それにより、各ソース例の基底真理ラベルが、検証例に対して有効なままとなる、ステップと、
を含む。
【0014】
特に、マシンネットワークが教師ありの手法でトレーニングされたトレーニング例がソース例として使用されるものとしてよい。これらのトレーニング例については、基底真理ラベルが容易に利用可能である。ソース例に元々割り当てられていたラベルは、このラベルが実際にソース例のコンテンツに関係するという前提条件の下で、新たに生成された検証例に対して有効なままであり、これは変更されないままである。例えば、ソース例としての画像において、画像が昼間から夜間に、又は、夏から冬に変換されたとしても、車は車のままであり、木は木のままである。したがって、ラベルがソース画像の示すオブジェクトに関連するものであれば、それらは検証画像において有効なままとなる。ただし、ラベルが時刻や季節に関係し、それが変更されるスタイルの一部である場合、古いラベルが検証画像についてまだ適当であるという保証はない。
【0015】
さらに特に好適な実施形態においては、ソースコンテンツを決定するステップは、以下のステップ:
トレーニングされた特徴抽出器ネットワークにより、ソース例をソース特徴マップに処理するステップと、
当該ソース特徴マップから、ソースドメイン及び/又は分布内のコンテンツを特徴付けるソース例の特徴を決定するステップと、
を含む。
【0016】
例えば、目標ドメイン及び/又は分布を特徴付ける特徴の決定に類似して、トレーニングされた特徴抽出器ネットワークは、ソース例をソース特徴マップに処理することができる。次いで、当該ソース特徴マップは、一方では、ソースドメイン及び/又は分布をそのように特徴付ける特徴を有する第1の寄与と、他方では、ソースドメイン及び/又は分布内のコンテンツを特徴付ける第2の寄与とに分解されるものとしてよい。ここでは、第2の寄与のみが必要である。特に、StyleGANネットワークのフレームワーク内で提供される前記エンコーダが使用されるものとしてよい。このエンコーダは、StyleGAN発生器と対を形成し、非常に一般化させてトレーニングされもよいため、単一かつ同一のエンコーダが、測定データの入力レコードのスタイルを決定するためにも、測定データのソースレコードのコンテンツを決定するためにも使用可能であるものとしてよい。すなわち、単一かつ同一のトレーニングされた特徴抽出器ネットワークが、目標特徴マップ及びソース特徴マップを生成するために使用され、単一かつ同一の手段が、これらの特徴マップをドメイン及びスタイル寄与に分解するために使用されるものとしてよい。
【0017】
さらに特に好適な実施形態においては、ソースコンテンツ及び目標スタイルを結合するステップは、ソースコンテンツ及び目標スタイルを、トレーニングされた生成ネットワークに提供するステップを含む。例えば、前記StyleGAN発生器は、スタイルを第1の入力として受け入れ、コンテンツを第2の入力として受け入れ、これら2つの入力に基づいて測定データの新しい現実的なレコードを作成する。
【0018】
さらに好適な実施形態においては、検証例を取得するステップは、目標スタイルに基づいて、ライブラリから検証例を検索するステップを含む。すなわち、既に事前計算された目標スタイルの要求のための検証例が再利用されるものとしてよい。これにより、特に、一般化するための能力の測定が、一般化するためのトレーニングされた機械学習モデルの能力を継続的に監視するために規則性に基づいて実行される場合、計算時間が節約されることとなる。
【0019】
特に、測定データのレコードは、少なくとも1つの測定量の測定値を平面内及び/又は空間内の位置に割り当てる画像及び/又は点群を含み得る。例えば、スチルカメラ、ビデオカメラ及びサーマルカメラはすべて、測定データのレコードとしての画像を生成する。レーダ、ライダ及び超音波の測定においては、測定データとして点群が生成されることが頻繁にある。画像と点群との間の主な相違は、点群においては、少なくとも1つの測定量の測定値で注釈が付けられる空間内の位置が規則的なグリッド内にある必要がないことである。特に、点群内の隣接する点の間には、異なるサイズのギャップが存在するものとしてよい。
【0020】
特に、測定データのレコードを、所与の分類の1つ又は複数のクラスに関する分類スコアにマッピングする分類器が、トレーニングされた機械学習モデルとして選択されるものとしてよい。例えば、クラスは、測定データのレコードがその存在を示すオブジェクトのタイプに対応することができる。
【0021】
さらに特に好適な実施形態においては、車両又はロボットに搭載された少なくとも1つのセンサによって捕捉された測定データの入力レコードが選択される。車両やロボットは移動するため、それらは、トレーニングされた機械学習モデルの元のトレーニングではもはやカバーされない状況に遭遇することが特に多い。
【0022】
特に、検証例は、車両又はロボットの外部にある外部サーバから取得されるものとしてよい。次いで、検証例を処理するステップ、及び、一般化するための求められている能力を決定するステップは、車両又はロボット上において実行することができる。このようにして、外部サーバは、各検証例を一度だけ計算する必要があり、次いで、複数の車両又はロボットに搭載された機械学習モデルに何度でも再配信することができる。すなわち、車両及び/又はロボットの大規模な隊列が存在する場合、検証例を生成する計算オーバヘッドが大幅に低減されることとなる。
【0023】
同時に、一般化するための能力を決定するステップの実際の実行を、車両又はロボット上に維持することは有利であり:車両やロボットは大量生産され、当初は同一の機械学習モデルを備える場合が多いが、個々の車両やロボットに搭載された機械学習モデルの学習状態は、後で相互に相違する場合がある。例えば、一方のモデルにはメーカーからの最新アップデートが既にインストールされているが、他方のモデルにはこのアップデートが不足している場合がある。また、モデルは、少なくとも限定的な範囲で継続学習が行われるように構成されるものとしてもよい。したがって、検証レコードをサーバ上のモデルに渡すことは、トレーニングされたモデルの挙動を特徴付ける完全なパラメータセットをサーバに転送する必要がある。このパラメータセットは、数ギガバイト、又は、それ以上のサイズになり得る。
【0024】
さらに特に好適な実施形態においては、トレーニングされた機械学習モデルの決定された能力が、予め定められた基準を満たすことを決定するステップに応じて、機械学習モデルの出力を使用する下流側技術システムが、当該技術システムを、ノイズの多い出力又は適正でない出力をより良好に許容し得る動作状態に移行させるために起動される。このようにして、下流側の技術システムによるノイズの多い出力又は適正でない出力の使用から生じ得る悪影響を低減することができる。これが不可能な場合、例えば、いくつかのコーナーケースにとってモデルが過度に悪い場合、人間の運転者又は下流技術システムの他の操作者が介入することを督促されるものとしてよい。
【0025】
例えば、下流側技術システムが車両である場合、車両の走行速度が制限されるものとしてよい。速度が速いほど、機械学習モデルからの適正でない出力に起因して何らかの問題が発生した場合の対応に利用可能な時間は短くなる。同様の理由により、追い越し操作やリスクを高める操作は抑制されるものとしてよい。より高まる上昇レベルでは、人間の運転者が車両又はロボットの制御引き継ぎを督促される場合もある。最も高い上昇レベルでは、車両又はロボットが予め定められた緊急停止軌道上において停止されるものとしてもよい。
【0026】
製造された製品の画像を良品か否かについて分類する品質保証システムの他の例においては、一般化するための能力の欠乏に対応する考えられる手法の1つは、その時に取得された測定データを一般化するための機械学習モデルの能力向上を目的に用いて測定データの物理的取得プロセスを変更することである。例えば、工場の外に予想外に積もった雪が、工場建屋の窓を通る日光の入射を妨げる場合があり、そのため、照明条件が特定の時刻にあるべきものとは異なることとなる。このケースにおいては、付加的に人工光源をスイッチオンすることにより、既に問題が解消される場合がある。また、機械学習モデルが画像にうまく一般化されていない製品には、手動のラベル付けのためのフラグが立てられるものとしてもよい。
【0027】
前述したように、検証例は、一般化のためのトレーニングされた機械学習モデルの能力を決定するためにそれらに使用するエンティティとは異なるエンティティによって生成されるものとしてよい。特に、検証例は、1つの特定のトレーニングされたモデルを考慮に入れる必要なく生成されるものとしてよい。
【0028】
したがって、本発明は、測定データの入力レコードから、上述の方法において使用するための検証例を生成するための方法にも関する。
【0029】
この方法の過程においては、ソースドメイン及び/又は分布内のソース例が準備される。これらのソース例は、対応する基底真理ラベルでラベル付けされる。
【0030】
これらのソース例からは、ソースドメイン及び/又は分布内のソース例のコンテンツを特徴付けるソースコンテンツが決定される。前述したように、ソース例は、具体的なスタイルを有するコンテンツがレンダリングされることを考慮に入れるものとしてよく、そのため、コンテンツは、この具体的なスタイルを減じたソース例であることを考慮に入れることができる。例えば、コンテンツは、その存在をソース例が示すオブジェクトのタイプを含む場合がある。
【0031】
測定データの入力レコードからは、測定データの1つ又は複数の入力レコードが属する目標ドメイン及び/又は分布を特徴付ける目標スタイルが決定される。このスタイルは、目標ドメイン内の所与のコンテンツがどのようにレンダリングされるかを特徴付ける。
【0032】
各ソースコンテンツ及び目標スタイルは、目標ドメイン及び/又は分布内の検証例に結合される。前述したように、ソース例の基底真理ラベルが、変更されないままのそのコンテンツに関連する限り、この基底真理ラベルは、検証例に対して有効なままとなる。
【0033】
一般化するための能力を測定するための方法に関連して上記で示したすべての開示は、検証例を生成するための方法にも有効である。
【0034】
本方法は、全体的又は部分的にコンピュータに実装され、ソフトウェアにより実施されるものとしてよい。したがって、本発明は、1つ又は複数のコンピュータ及び/又は計算インスタンスによって実行されるときに、1つ又は複数のコンピュータ及び/又は計算インスタンスに方法を実施させるための機械可読命令を有するコンピュータプログラムにも関する。本明細書においては、車両又はロボット用の制御ユニット、及び、機械可読命令を実行可能である他の埋め込みシステムも同様にコンピュータとみなされるべきである。計算インスタンスは、クラウド内において機械可読命令の実行を可能にする仮想マシン、コンテナ又は他の実行環境を含む。
【0035】
非一時的記憶媒体及び/又はダウンロード製品は、コンピュータプログラムを含み得る。ダウンロード製品は、オンラインで販売可能であり得る電子製品であり、迅速な実現のためにネットワークを介して転送可能である。1つ又は複数のコンピュータ及び/又は計算インスタンスは、前述のコンピュータプログラム及び/又は前述の非一時的記憶媒体及び/又はダウンロード製品を備えるものとしてよい。
【0036】
以下においては、本発明を、図面を使用して説明するが、この説明には、本発明の範囲を限定するいかなる意図もない。
【図面の簡単な説明】
【0037】
図1】測定データ2の目標ドメイン及び/又は分布に一般化するための、機械学習モデル1の能力1aを測定するための方法100の例示的な実施形態を示す図である。
図2】検証例4の生成の説明図である。
図3】本方法100を使用して測定された能力1aと、目標ドメインからの実際にラベル付けされた検証例を使用して測定された能力1a(2)との相関を示す図である。
図4】検証例4を生成するための方法200の例示的な実施形態を示す図である。
【発明を実施するための形態】
【0038】
図1は、所与の測定データ2の目標ドメイン及び/又は分布に一般化するための、所与のトレーニングされた機械学習モデル1の能力1aを測定するための方法100の実施形態の概略的なフローチャートである。
【0039】
ステップ110においては、測定データの入力レコード2から、目標ドメイン及び/又は分布を特徴付ける目標スタイル2bが決定される。
【0040】
この目的のために、ブロック111によれば、トレーニングされた特徴抽出器ネットワーク6は、測定データの入力レコード2を目標特徴マップ2cに処理することができる。次いで、ブロック112によれば、目標ドメインを特徴付ける測定データの特徴2dが、これらの特徴マップ2cから決定されるものとしてよい。この目的のために、マップ対スタイルネットワーク7bが使用されるものとしてよい。特徴抽出器ネットワーク6及びマップ対スタイルネットワーク7bは、エンコーダ8の一部であるものとしてよい。
【0041】
ステップ120においては、目標スタイル2bに少なくとも部分的に基づいて、目標ドメイン及び/又は分布における検証例4、並びに、対応する基底真理ラベル4が取得される。
【0042】
ブロック121によれば、ソースドメイン及び/又は分布内のソース例5、並びに、対応する基底真理ラベル5が準備されるものとしてよい。次いで、ブロック122によれば、これらのソース例5から、ソースドメイン及び/又は分布内のソース例5のコンテンツを特徴付けるソースコンテンツ5aが決定されるものとしてよい。次いで、ブロック123によれば、各ソースコンテンツ5a及び目標スタイル2bが、目標ドメイン及び/又は分布において検証例4に結合されるものとしてよい。各ソース例5の基底真理ラベル5が、検証例4に保存されているソースコンテンツ5aに関連していることを条件として、基底真理ラベル5は、生成された検証例4の基底真理ラベル4として有効なままとなる。
【0043】
ブロック122aによれば、ソースコンテンツ2aを決定するために、トレーニングされた特徴抽出器ネットワーク6は、ソース例をソース特徴マップ5cに処理することができる。次いで、ブロック122bによれば、ソースドメイン及び/又は分布内のコンテンツを特徴付けるソース例5の特徴5dが、ソース特徴マップから決定されるものとしてよい。この目的のために、例えば、マップ対コンテンツネットワーク7aが使用されるものとしてよい。特徴抽出器ネットワーク6及びマップ対コンテンツネットワーク7aは、エンコーダ8の一部であるものとしてよい。このエンコーダ8は、マップ対スタイルネットワーク7bを同様に含むこともあり得る。
【0044】
ブロック123aによれば、ソースコンテンツ5a及び目標スタイル2bを結合するステップは、ソースコンテンツ5a及び目標スタイル2bをトレーニングされた生成ネットワーク9に提供するステップを含み得る。
【0045】
ブロック124によれば、検証例4を取得するステップは、目標スタイル2bに基づいて、ライブラリから検証例4を検索するステップを含み得る。
【0046】
ステップ130においては、トレーニングされた機械学習モデル1が、検証例4を出力3に処理する。
【0047】
ステップ140においては、出力3と各基底真理ラベル4との間の比較に基づいて、トレーニングされた機械学習モデル1の精度が、目標ドメインに一般化するためのトレーニングされた機械学習モデル1の求められている能力1aとして決定される。
【0048】
ブロック105によれば、車両50又はロボット51に搭載された少なくとも1つのセンサによって捕捉された測定データの入力レコード2が選択されるものとしてよい。このケースにおいては、ブロック125により、検証例4は、車両50又はロボット51の外部にある外部サーバから取得されるものとしてよい。次いで、ブロック131により、検証例4を処理するステップは、車両50又はロボット51上において実行されるものとしてよい。ブロック141により、一般化するための求められている能力1aを決定するステップも同様に、車両50又はロボット51上において実行されるものとしてよい。
【0049】
図1aに示される例においては、ステップ150において、トレーニングされた機械学習モデルの決定された能力1aが、予め定められた基準150(真理値1)を満たすことを決定するステップに応じて、機械学習モデル1の出力3を使用する下流側技術システム50,51,60,70,80,90が、当該技術システム50,51,60,70,80,90を、ノイズの多い出力3又は適正でない出力3をより良好に許容し得る動作状態に移行させるために起動されるものとしてよい。そのような技術システムの例は、車両50、ロボット51、運転支援システム60、監視システム70、品質検査システム80、及び、医療用撮像システム90である。特に、起動は、起動信号160aを使用して実行されるものとしてよい。
【0050】
検証例4の作成は、図2に示される。この図2に示されている例においては、トレーニングされた機械学習モデル1は、画像を測定データのレコード2として処理し、これらの画像のセマンティックセグメンテーションを出力3として生成する。
【0051】
ソースドメイン及び/又は分布においては、ソース画像5及び対応する基底真理ラベルマップ5が利用可能である。これらのソース画像5から、エンコーダ8を使用してソースコンテンツ5aが抽出される。同一のエンコーダ8を使用することにより、目標ドメイン及び/又は分布に属する目標画像2から目標スタイル2bが抽出される。トレーニングされた発生器ネットワーク9は、ソースコンテンツ5a及び目標スタイル2bを入力として受け取り、検証例4を生成する。コンテンツ5aは変化していないため、ソース画像5の基底真理ラベルマップ5は、目標ドメイン及び/又は分布における検証例4の基底真理ラベルマップ4として有効なままとなる。
【0052】
図2は、エンコーダ8の内部構造も示す。このエンコーダ8は、特徴マップ2c,5cを生成するために目標ドメイン内の目標画像2又はソースドメイン内のソース画像5を処理する特徴抽出器6を含む。マップ対コンテンツネットワーク7aは、ソース画像5の特徴マップ5cからソース画像のコンテンツを特徴付ける特徴5dを抽出し、これによってソースコンテンツ5aを形成する。同様に、目標コンテンツ2aは、目標画像2の特徴マップ2cから形成される。マップ対スタイルネットワーク7bは、目標画像2の特徴マップ2cから目標画像のスタイルを特徴付ける特徴2dを抽出し、これによって目標スタイル2bを形成する。同様に、ソーススタイル5bは、ソース画像5の特徴マップ5cから抽出される。
【0053】
一般化するための機械学習モデル1の能力1aを測定する場合、「ゴールドスタンダード」とは、当然のことながら、目標ドメイン内で実際にラベル付けされた例2を使用することである。スタイル混合検証例4は、ソース例5の基底真理ラベル5が再利用可能であるため、入手することが容易な代替品である。図3は、スタイル混合検証例4を使用して測定された能力1aが、上記の「ゴールドスタンダード」に従って測定された能力1a(2)とどの程度相関しているかを示している。
【0054】
図3に示されている例においては、機械学習モデル1が、画像からセマンティックセグメンテーションを生成する。これは、ソースドメインとしての道路シーンの公的に利用可能な都市景観データセット上においてトレーニングされたものである。図3の上方の行(サブ図3(a)~サブ図3(c))においては、目標ドメインは、不利な視認条件において撮影された道路シーンの公的に利用可能なACDC(Adverse Conditions Dataset with Correspondences)データセットである。図3の下方の行(サブ図3(d)~サブ図3(f))においては、目標ドメインは、異種マルチタスク学習用の公的に利用可能なBDD100Kの多様な運転データセットである。
【0055】
すべてのサブ図3(a)~サブ図3(f)においては、上記の「ゴールドスタンダード」に従って測定された能力1a(2)が、他の指標と比較される。左方の列(サブ図3(a)及びサブ図3(d))において他の指標1a(5)は、ソースドメイン内の元の都市景観検証データセット上において測定された精度である。中央の列(サブ図3(b)及びサブ図3(e))において、他の指標1a(4,5a,5b)は、ソースコンテンツ5a及びソーススタイル5bに基づいて、ソースドメイン内で新しく生成された検証画像4上において測定された精度である。右方の列(サブ図3(c)及びサブ図3(f))において、他の指標1a(4,5a,5b)は、ソースコンテンツ5a及び目標スタイル2bに基づいて、新しく生成された混合スタイル検証画像4上において測定された精度である。サブ図3(a)~サブ図3(f)の各々において、各データポイントは、1つの機械学習モデルに対応する。合計では95のモデルが調査されている。記号としての黒丸は、バックボーンとして畳み込みニューラルネットワークを有する機械学習モデルを表している。記号としての白丸は、バックボーンとして変圧器ネットワークを有する機械学習モデルを表している。
【0056】
各プロットにおけるすべてのデータポイントにわたって、相関の強さを定量的に測定する2つの異なる相関指標、詳細にはスピアマンの順位相関係数ρとケンダルの順位相関係数γとが計算された。どちらの指標も、-1から1までの間隔で変化することができる。-1に近い値は強い負の相関を示し、1に近い値は強い正の相関を示す。0の値は完全な非相関を示す。どちらの指標も非母数的であり、すなわち、データ分布に関する何らかの仮定を必要としない。また、評価はデータの順位付けに基づいている。
【0057】
目標ドメインとしてのACDC及びBDD100Kの両方について、良好な相関関係(それぞれρ=0.893a及びρ=0.928)が観察され、これは、スタイル混合検証例4が、各目標ドメインへの一般化をテストする、目標ドメイン内の実際の検証画像4に対する良好な代替として機能できることを示している。
【0058】
また、ソースコンテンツ5a及びソーススタイル5bから生成された生成検証画像4を使用することによっても、ソース画像をそのまま使用するよりも大幅な改善が提供されることも観察される。考えられる説明は、この「ソース内スタイルの拡張」を適用することによって、データカバレッジが改善され、したがって、指標がスタイルシフト下での一般化能力をより良好に測定できるということである。結局のところ、元の都市景観トレーニングデータセットに関しては、ACDCデータセット及びBDD100Kデータセットの大部分は分布外のデータである。
【0059】
さらに、すべてのサブ図3(a)~サブ図3(f)において、ほぼすべての変換器に基づくモデル(記号として白丸でマークされたデータポイント)が、線形フィットを表す対角線の上にあることが観察される。これは、変換器に基づくモデルが、畳み込みニューラルネットワークに基づくモデルと比較して、自然なシフト下でより良好な一般能力を示すことを示唆している。
【0060】
そこでは、95のモデルに対して取得された指標の値が非常に広い範囲に及ぶことも観察される。これは、これらのモデルの性能の間には大きい相違があり、それらの指標は、所与の使用ケースにおいてどのモデルが最良であるかを決定するためによく適したツールであることを意味する。
【0061】
図4は、上述した方法100において使用するための検証例を生成するための方法200の一実施形態の概略的フローチャートである。本方法200は、測定データの所与の入力レコード2から開始される。
【0062】
ステップ210においては、ソースドメイン及び/又は分布内のソース例5が、対応する基底真理ラベル5とともに準備される。
【0063】
ステップ220においては、各ソース例5から、ソースドメイン及び/又は分布内のソース例5のコンテンツを特徴付けるソースコンテンツ5aが決定される。
【0064】
ステップ230においては、測定データの1つ又は複数の入力レコード2が属する目標ドメイン及び/又は分布を特徴付ける目標スタイル2bが、測定データの入力レコード2から決定される。
【0065】
ステップ240においては、各ソースコンテンツ5a及び目標スタイル2bが、目標ドメイン及び/又は分布内の検証例4に結合される。このようにして、各ソース例5の基底真理ラベル5*=:4*は、検証例4に対して有効なままとなる。
図1
図2
図3
図4
【手続補正書】
【提出日】2024-05-28
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
所与のタスクに関して、測定データの1つ又は複数の入力レコード(2)が属する目標ドメイン及び/又は分布に一般化するための、測定データの処理用のトレーニングされた機械学習モデル(1)の能力(1a)を測定するための方法(100)であって、
前記方法(100)は、以下のステップ:
前記測定データの入力レコード(2)から、前記目標ドメイン及び/又は分布を特徴付ける目標スタイル(2b)を決定するステップ(110)と、
前記目標スタイル(2b)に少なくとも部分的に基づいて、前記目標ドメイン及び/又は分布内の検証例(4)を、並びに、対応する基底真理ラベル(4)も取得するステップ(120)と、
前記トレーニングされた機械学習モデル(1)により、前記検証例(4)を出力(3)に処理するステップ(130)と、
前記出力(3)と前記各基底真理ラベル(4)との間の比較に基づいて、前記トレーニングされた機械学習モデル(1)の精度を、前記目標ドメインに一般化するための、前記トレーニングされた機械学習モデル(1)の求められている能力(1a)として決定するステップ(140)と、
を含む、方法(100)。
【請求項2】
前記目標スタイル(2b)を決定するステップ(110)は、以下のステップ:
トレーニングされた特徴抽出器ネットワーク(6)により、前記測定データの入力レコード(2)を目標特徴マップ(2c)に処理するステップ(111)と、
前記目標特徴マップ(2c)から、前記目標ドメインを特徴付ける前記測定データの特徴(2d)を決定するステップ(112)と、
を含む、請求項1に記載の方法(100)。
【請求項3】
前記検証例(4)を取得するステップ(120)は、以下のステップ:
ソースドメイン及び/又は分布内のソース例(5)、並びに、対応する基底真理ラベル(5)を準備するステップ(121)と、
前記ソース例(5)から、前記ソースドメイン及び/又は分布内の前記ソース例(5)のコンテンツを特徴付けるソースコンテンツ(5a)を決定するステップ(122)と、
各ソースコンテンツ(5a)及び前記目標スタイル(2b)を、前記目標ドメイン及び/又は分布内の検証例(4)に結合するステップ(123)であって、それにより、各ソース例(5)の基底真理ラベル(5*=:4*)が、前記検証例(4)に対して有効なままとなる、ステップ(123)と、
を含む、請求項に記載の方法(100)。
【請求項4】
前記ソースコンテンツ(5a)を決定するステップ(122)は、以下のステップ:
トレーニングされた特徴抽出器ネットワーク(6)により、前記ソース例(5)をソース特徴マップ(5c)に処理するステップ(122a)と、
前記ソース特徴マップ(5c)から、前記ソースドメイン及び/又は分布内のコンテンツを特徴付ける前記ソース例(5)の特徴(5d)を決定するステップ(122b)と、
を含む、請求項3に記載の方法(100)。
【請求項5】
前記ソースコンテンツ(5a)及び前記目標スタイル(2b)を結合するステップ(123)は、前記ソースコンテンツ(5a)及び前記目標スタイル(2b)を、トレーニングされた発生ネットワーク(9)に提供するステップ(123a)を含む、請求項に記載の方法(100)。
【請求項6】
前記検証例(4)を取得するステップ(120)は、前記目標スタイル(2b)に基づいて、ライブラリから検証例(4)を検索するステップ(124)を含む、請求項に記載の方法(100)。
【請求項7】
前記測定データのレコードは、少なくとも1つの測定量の測定値を平面内及び/又は空間内の位置に割り当てる画像及び/又は点群を含む、請求項に記載の方法(100)。
【請求項8】
前記測定データのレコードを、所与の分類の1つ又は複数のクラスに関する分類スコアにマッピングする分類器が、前記トレーニングされた機械学習モデル(1)として選択される、請求項に記載の方法(100)。
【請求項9】
車両(50)又はロボット(51)に搭載された少なくとも1つのセンサによって捕捉された測定データの入力レコード(2)が選択される(105)、請求項に記載の方法(100)。
【請求項10】
前記検証例(4)は、前記車両(50)又は前記ロボット(51)の外部にある外部サーバから取得され(125)、
前記検証例(4)を処理するステップ、及び、一般化するための求められている能力(1a)を決定するステップは、前記車両(50)又は前記ロボット(51)上において実行される(131,141)、請求項9に記載の方法(100)。
【請求項11】
前記トレーニングされた機械学習モデルの前記決定された能力(1a)が、予め定められた基準(150)を満たすことを決定するステップに応じて、以下のステップ:
前記機械学習モデル(1)の出力(3)を使用する下流側技術システム(50,51,60,70,80,90)が、当該下流側技術システム(50,51,60,70,80,90)を、ノイズの多い出力(3)又は適正でない出力(3)をより良好に許容し得る動作状態に移行させるために起動されるステップ(160)をさらに含む、請求項に記載の方法(100)。
【請求項12】
測定データの入力レコード(2)から、請求項1に記載の方法において使用するための検証例を生成するための方法(200)であって、前記方法(200)は、以下のステップ:
ソースドメイン及び/又は分布内のソース例(5)、並びに、対応する基底真理ラベル(5)を準備するステップ(210)と、
前記ソース例5から、前記ソースドメイン及び/又は分布内の前記ソース例(5)のコンテンツを特徴付けるソースコンテンツ(5a)を決定するステップ(220)と、
前記測定データの入力レコード(2)から、前記測定データの1つ又は複数の入力レコード(2)が属する目標ドメイン及び/又は分布を特徴付ける目標スタイル(2b)を決定するステップ(230)と、
各ソースコンテンツ(5a)及び前記目標スタイル(2b)を、前記目標ドメイン及び/又は分布内の検証例(4)に結合するステップ(240)であって、それにより、各ソース例(5)の基底真理ラベル(5=:4)が、前記検証例(4)に対して有効なままとなる、ステップ(240)と、
を含む、方法(200)。
【請求項13】
コンピュータプログラムであって、1つ又は複数のコンピュータにおいて実行されるときに、前記1つ又は複数のコンピュータ、請求項に記載の方法(100を実施させるための機械可読命令を含むコンピュータプログラム。
【請求項14】
請求項13に記載のコンピュータプログラムを備えた非一時的機械可読データ担体
【請求項15】
請求項13に記載のコンピュータプログラムを備え又は、請求項14に記載の非一時的機械可読データ担体備えた1つ又は複数のコンピュータ。
【外国語明細書】