特開2024-86610 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ エスアールアイ　インターナショナルの特許一覧

特開2024-86610半教師あり増分学習のためのモジュール化されたアーキテクチャの最適化

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024086610

(43)【公開日】2024-06-27

(54)【発明の名称】半教師あり増分学習のためのモジュール化されたアーキテクチャの最適化

(51)【国際特許分類】

G06N 20/00 20190101AFI20240620BHJP

G06N 3/0895 20230101ALI20240620BHJP

【ＦＩ】

G06N20/00 130

G06N3/0895

【審査請求】有

【請求項の数】20

【出願形態】ＯＬ

【外国語出願】

(21)【出願番号】P 2023201995

(22)【出願日】2023-11-29

(31)【優先権主張番号】63/385,319

(32)【優先日】2022-11-29

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】63/447,559

(32)【優先日】2023-02-22

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】18/520,800

(32)【優先日】2023-11-28

(33)【優先権主張国・地域又は機関】US

(71)【出願人】

【識別番号】510119843

【氏名又は名称】エスアールアイインターナショナル

(74)【代理人】

【識別番号】100099759

【弁理士】

【氏名又は名称】青木篤

(74)【代理人】

【識別番号】100123582

【弁理士】

【氏名又は名称】三橋真二

(74)【代理人】

【識別番号】100092624

【弁理士】

【氏名又は名称】鶴田準一

(74)【代理人】

【識別番号】100114018

【弁理士】

【氏名又は名称】南山知広

(74)【代理人】

【識別番号】100153729

【弁理士】

【氏名又は名称】森本有一

(72)【発明者】

【氏名】チウハン－パン

(72)【発明者】

【氏名】イーヤオ

(72)【発明者】

【氏名】ザカリーシーモア

(72)【発明者】

【氏名】アレックスクラスナー

(72)【発明者】

【氏名】ブラッドリージェイ．クライマー

(72)【発明者】

【氏名】マイケルエー．コグスウェル

(72)【発明者】

【氏名】セシールエリアーヌジャニーヌマッケイ

(72)【発明者】

【氏名】アレックスシー．トッゾ

(72)【発明者】

【氏名】ティーシアオシャン

(72)【発明者】

【氏名】フィリップミラー

(72)【発明者】

【氏名】チョアンヨンカン

(72)【発明者】

【氏名】グレンエー．マリー

(72)【発明者】

【氏名】リチャードルイスフェランティ

(72)【発明者】

【氏名】ユマラジェンドラン

(72)【発明者】

【氏名】スプンサマラセケラ

(72)【発明者】

【氏名】ラケシュクマール

(72)【発明者】

【氏名】ジェイムズスミス

(57)【要約】（修正有）

【課題】事前学習が十分に行えない状況に対処する機械学習フレームワークを提供する。
【解決手段】コンピューティングシステム１００は、メモリ１０２と、通信を行う処理回路１４３と、を有する。処理回路は、少なくともデータ前処理モジュール１１４、タスク固有ネットワークモジュール１１６及びアーキテクチャ最適化モジュール１２０を有する機械学習システム１０４を実行する。機械学習システムは、一つ以上の機械学習モデル１０６をトレーニングする。データ前処理モジュールは、ストリーミング入力データに基づいて拡張入力データを生成する。タスク固有ネットワークモジュールは、増強された入力データに少なくとも部分的に基づいて特定のタスクを実行する機械学習モデルを有するアーキテクチャ最適化モジュールは、ストリーミング入力データの変化に基づいて一つ以上の機械学習モデルのネットワークアーキテクチャを適応させる。
【選択図】図１

【特許請求の範囲】

【請求項1】

記憶媒体と通信を行う処理回路であって、少なくとも第１のモジュール、第２のモジュール及び第３のモジュールを備える機械学習システムを実行するように構成され、前記機械学習システムは、一つ以上の機械学習モデルをトレーニングするように構成された、処理回路を備え、
前記第１のモジュールは、ストリーミング入力データに基づいて拡張入力データを生成するように構成され、
前記第２のモジュールは、前記拡張入力データに少なくとも部分的に基づいて特定のタスクを実行するように構成された機械学習モデルを備え、
前記第３のモジュールは、前記ストリーミング入力データの変化に基づいて前記一つ以上の機械学習モデルのネットワークアーキテクチャを適応させるように構成された、システム。

【請求項2】

前記ストリーミング入力データは、前記ストリーミング入力データにおいて表現される複数のクラス間のクラス不均衡を有するストリーミング入力データを含む、請求項１に記載のシステム。

【請求項3】

前記拡張入力データは、少数クラスの一つ以上の拡張サンプルを含む、請求項１に記載のシステム。

【請求項4】

前記機械学習システムは、一つ以上の半教師あり増分学習法を使用して前記一つ以上の機械学習モデルをトレーニングするように構成された、請求項１に記載のシステム。

【請求項5】

フォーマット変換操作、メタデータ導出操作又はデータ関連付け操作のうちの少なくとも一つを実行することによって、前記ストリーミング入力データを処理するように構成された一つ以上のモジュールを更に備える、請求項１に記載のシステム。

【請求項6】

前記第１のモジュールは、ダイナミックメモリリポジトリ（ＤＭＲ）と、リプレイ生成人工知能（ＡＩ）アーキテクチャと、識別器／分類器と、を更に備え、
前記ＤＭＲは、一つ以上の代表的なデータサンプルを選択的に記憶するように構成され、
前記生成ＡＩアーキテクチャは、前記ＤＭＲに記憶された前記一つ以上の代表的なデータサンプルに類似する一つ以上の新しいデータサンプルを生成するように構成され、
前記識別器／分類器は、前記生成ＡＩアーキテクチャによって生成された前記一つ以上の新しいデータサンプルにおいて本物のデータと偽物のデータとを区別するように構成された、請求項１に記載のシステム。

【請求項7】

前記識別器／分類器は、前記ＤＭＲに記憶される前記一つ以上の新しいデータサンプルを選択するように更に構成された、請求項６記載のシステム。

【請求項8】

前記第３のモジュールは、トレーニングデータのセットと入力ストリーミングデータとのうちの少なくとも一方を使用して複数の候補タスクについてスーパーモデルをトレーニングするように更に構成され、トレーニングされた前記スーパーモデルに基づいて現在のタスクの最適アーキテクチャを推論するように構成された、請求項１に記載のシステム。

【請求項9】

前記第３のモジュールは、前記トレーニングデータに対する一つ以上のアーキテクチャの重みを最適化するように更に構成された、請求項８記載のシステム。

【請求項10】

第１のモジュールを使用して、ストリーミング入力データに基づいて拡張入力データを生成することと、
機械学習モデルを備える第２のモジュールを使用して、前記拡張入力データに少なくとも部分的に基づいて特定のタスクを実行することと、
第３のモジュールを使用して、前記ストリーミング入力データの変化に基づいて前記一つ以上の機械学習モデルのネットワークアーキテクチャを適応させることと、
を備える方法。

【請求項11】

前記ストリーミング入力データは、前記ストリーミング入力データにおいて表現される複数のクラス間のクラス不均衡を有するストリーミング入力データを含む、請求項１０に記載の方法。

【請求項12】

前記拡張入力データは、少数クラスの一つ以上の拡張サンプルを含む、請求項１０に記載の方法。

【請求項13】

前記機械学習システムは、一つ以上の半教師あり増分学習法を使用して前記一つ以上の機械学習モデルをトレーニングするように構成された、請求項１０に記載の方法。

【請求項14】

一つ以上のモジュールを使用してフォーマット変換操作、メタデータ導出操作又はデータ関連付け操作のうちの少なくとも一つを実行することによって、前記ストリーミング入力データを処理することを更に備える、請求項１０に記載の方法。

【請求項15】

ダイナミックメモリリポジトリ（ＤＭＲ）に一つ以上の代表的なデータサンプルを選択的に記憶させることと、
生成的人工知能（ＡＩ）アーキテクチャを使用して、前記ＤＭＲに記憶された前記一つ以上の代表的なデータサンプルに類似する一つ以上の新しいデータサンプルを生成することと、
識別器／分類器を使用して、前記生成ＡＩアーキテクチャによって生成された前記一つ以上の新しいデータサンプルにおいて本物のデータと偽のデータを区別することと、
を更に備える、請求項１０に記載の方法。

【請求項16】

前記識別器／分類器を使用して、前記ＤＭＲに記憶される一つ以上の新しいデータサンプルを選択することを更に備える、請求項１５に記載の方法。

【請求項17】

前記第３のモジュールを使用して、トレーニングデータのセットと入力ストリーミングデータとのうちの少なくとも一方を使用して複数の候補タスクについてスーパーモデルをトレーニングすることと、
トレーニングされた前記スーパーモデルに基づいて現在のタスクの最適アーキテクチャを推論することと、
を更に備える、請求項１０に記載の方法。

【請求項18】

第３のモジュールを使用して、前記トレーニングデータに対する一つ以上のアーキテクチャの重みを最適化することを更に備える、請求項１７に記載の方法。

【請求項19】

エンコードされた命令を有する非一時的なコンピュータ可読記憶媒体であって、前記命令は、
第１のモジュールを使用して、ストリーミング入力データに基づいて拡張入力データを生成することと、
機械学習モデルを備える第２のモジュールを使用して、前記拡張入力データに少なくとも部分的に基づいて特定のタスクを実行することと、
第３のモジュールを使用して、前記ストリーミング入力データの変化に基づいて前記一つ以上の機械学習モデルのネットワークアーキテクチャを適応させることと、
を処理回路に行わせるように構成された、非一時的なコンピュータ可読記憶媒体。

【請求項20】

前記ストリーミング入力データは、前記ストリーミング入力データにおいて表現される複数のクラス間のクラス不均衡を有するストリーミング入力データを含む、請求項１９に記載の非一時的なコンピュータ可読記憶媒体。

【発明の詳細な説明】

【技術分野】

【0001】

本願は、２０２２年１１月２９日に出願された米国特許出願第６３／３８５,３１９号及び２０２３年２月２２日に出願された米国特許出願第６３／４４７,５５９号の利益を主張するものであり、これらは参照によりその全体が本明細書に組み込まれる。

【0002】

政府の権利
本発明は、米国海軍ＮＩＷＣアトランティックチャールストンから授与された契約番号Ｎ６５２３６-２０－Ｃ－８０２０の下で政府の支援を受けて行われた。政府は、本発明について一定の権利を有する。

【0003】

本開示は、機械学習システムに関する。

【背景技術】

【0004】

機械学習モデルをリアルタイムで学習させるのは計算コストがかかるので、機械学習モデルは、通常、大規模なデータセットに対してオフラインでトレーニングされる。モデルは、通常、トレーニングデータへの過剰適合を防止するために、トレーニングのためにオフラインで凍結される。過剰適合は、モデルがトレーニングデータの特定の詳細を学習しすぎた結果としてモデルが新しいデータに対して良好に汎化しないときに発生する。モデルは、通常、現実世界におけるオンラインデータの特性及び分布がオフラインデータと同一であるという前提で現実世界に展開される。しかしながら、必ずしもそうとは限らない。実世界のデータは、データの分布、ノイズレベル又は異常値の存在のような様々な点でオフラインデータとは異なる可能性がある。実世界のデータがオフラインのデータと異なる場合、モデルは良好に機能しない可能性がある。

【発明の概要】

【発明が解決しようとする課題】

【0005】

実際のアプリケーションでは、事前にトレーニングされたモデルを使用できるとは限らない。海事のような一部の領域では、オフラインでのデータ収集及びラベリングが困難な場合がある。その理由は、これらの領域でデータを収集するにはコスト及び時間を要するとともにデータにラベル付けする専門家を見つけるのが困難な場合があるからである。視覚（カメラ）以外のデータモダリティにも、あまり検討されていないもの及び新しいものがある。例えば、医療分野では、磁気共鳴画像（ＭＲＩ）及びコンピュータ断層撮影（ＣＴ）スキャンのような医療画像モダリティからのデータを使用することへの関心が高まっている。しかしながら、これらのデータモダリティで利用可能な事前にトレーニングされたモデルは多くない。

【課題を解決するための手段】

【0006】

一般に、本開示は、フューショット学習、ハイブリッドリプレイ法及びアーキテクチャ最適化法を含むがそれに限定されないいくつかの新しい機能を有する機械学習フレームワークを使用する技術を説明する。フューショット学習は、機械学習モデルが新しいタスクを学習する又はわずかな例でトレーニングすることを可能にする技術である。フューショット学習は、大量のラベル付きデータを収集することが困難な実際のアプリケーションにおいて有用である。フューショット学習は、モデルを多数の例でトレーニングする従来の機械学習とは対照的である。機械学習モデルのトレーニングに利用可能なデータ量が増加するに従ってフューショット学習の重要性はますます高まっている。

【0007】

ハイブリッドリプレイ方法を、ハイブリッドリプレイモジュールによって実現してもよく、ハイブリッドリプレイモジュールは、限られた利用可能な実例を使用してクラスの拡張サンプルを生成することによってクラスの不均衡の問題に対処してもよい。ハイブリッドリプレイモジュールは、不均衡なクラスに対する機械学習モデルのパフォーマンスを向上させるのを助けるようにしてもよい。ハイブリッドリプレイモジュールは、クラス不均衡の問題に対処する技術である。クラス不均衡は、あるクラスの例が他のクラスより多い場合に発生する。クラス不均衡は、機械学習モデルが少数クラスを正確に分類することをトレーニングすることを困難にする可能性がある。アーキテクチャ最適化方法を、アーキテクチャ最適化モジュールによって実現してもよく、アーキテクチャ最適化モジュールは、推論のために進化したセンサデータに基づいてシステムの複雑性を自動的に適応させてもよい。アーキテクチャ最適化モジュールは、機械学習モデルのパフォーマンスを経時的に向上させるのを助けるようにしてもよい。アーキテクチャ最適化モジュールは、推論のために進化したセンサデータに基づいてシステムの複雑性を自動的に適応させてもよい。

【0008】

技術は、少なくとも一つの実用的応用を実現する一つ以上の技術的利点を提供してもよい。例えば、ハイブリッドリプレイモジュールは、不均衡クラスに対する機械学習モデルのパフォーマンスを向上させるのを助けるようにしてもよい。タスク固有ネットワークは、機械学習モデルを少数の例でトレーニングすることを可能にする場合がある。開示された技術の利点の一部は、大量のラベル付きデータを収集することが困難な実際のアプリケーションにおいて有用である可能性がある。アーキテクチャ最適化モジュールは、推論のために進化したセンサデータに基づいてシステムの複雑さを自動的に適応させてもよい。アーキテクチャ最適化モジュールは、機械学習モデルのパフォーマンスを経時的に向上させるのを助けるようにしてもよい。

【0009】

上述した処理コンポーネントの組合せを、ライブストリーミングデータを使用して、ニューラルネットワークのようなものであるがそれに限定されない（一つ以上の）機械学習モデルをトレーニングするために使用してもよい。ライブストリーミングデータは、実際のアプリケーションにおける機械学習モデルのパフォーマンスを向上させる可能性がある比較的新しい概念である。開示された処理コンポーネントの組合せの追加的な利点は、リアルタイム推論、スケーラビリティ及びロバスト性を含むが、それに限定されない。有利なことに、機械学習モデルを、リアルタイムでトレーニング及び展開してもよく、それは、多くの実際のアプリケーションにとって重要である可能性がある。開示された技術は、大量のデータを扱うために拡張可能である。また、開示された技術は、データ分布の変化に対してロバストである。

【0010】

一例において、システムは、記憶媒体と通信を行う処理回路を有する。処理回路は、少なくとも第１のモジュール、第２のモジュール及び第３のモジュールを有する機械学習システムを実行するように構成される。機械学習システムは、一つ以上の機械学習モデルをトレーニングするように構成される。第１のモジュールは、ストリーミング入力データに基づいて拡張入力データを生成するように構成される。第２のモジュールは、増強された入力データに少なくとも部分的に基づいて特定のタスクを実行するように構成された機械学習モデルを有する。第３のモジュールは、ストリーミング入力データの変化に基づいて一つ以上の機械学習モデルのネットワークアーキテクチャを適応させるように構成される。

【0011】

一例において、方法は、第１のモジュールを使用して、ストリーミング入力データに基づいて拡張入力データを生成することと、機械学習モデルを備える第２のモジュールを使用して、拡張入力データに少なくとも部分的に基づいて特定のタスクを実行することと、第３のモジュールを使用して、ストリーミング入力データの変化に基づいて一つ以上の機械学習モデルのネットワークアーキテクチャを適応させることと、を有する。

【0012】

一例では、エンコードされた命令を有する非一時的なコンピュータ可読記憶媒体であって、命令は、第１のモジュールを使用して、ストリーミング入力データに基づいて拡張入力データを生成することと、機械学習モデルを備える第２のモジュールを使用して、拡張入力データに少なくとも部分的に基づいて特定のタスクを実行することと、第３のモジュールを使用して、ストリーミング入力データの変化に基づいて一つ以上の機械学習モデルのネットワークアーキテクチャを適応させることと、を処理回路に行わせるように構成される。

【0013】

本開示の技術の一つ以上の実施例の詳細は、添付の図面及び以下の説明に記載されている。本技術の他の特徴、目的及び利点は、説明及び図面並びに特許請求の範囲から明らかになる。

【図面の簡単な説明】

【0014】

【図1】図１は、本開示の技術による例示的なシステムを示すブロック図である。

【0015】

【図2】図２は、本開示の技術による半教師あり増分学習の例を示す概念図である。

【0016】

【図3】図３は、本開示の技術による例示的なハイブリッドリプレイ方法を示す概念図である。

【0017】

【図4】図４は、本開示の技術によるアーキテクチャ最適化方法の一例を示す概念図である。

【0018】

【図5】図５は、本開示の技術による増分微分可能アーキテクチャ探索（ＤＡＲＴＳ）最適化方法の例を示す概念図である。

【0019】

【図6】図６は、本開示に記載の技術によるハイブリッドリプレイモジュールの動作モードの一例を示すフローチャートである。

【0020】

【図7】図７は、本開示に記載の技術によるアーキテクチャ最適化モジュールの例示的な動作モードを示すフローチャートである。

【0021】

【図8】図８は、例示的な技術の態様を実現してもよい分散データ処理システムの例示的な図である。

【0022】

同様の参照文字は、図面及び説明全体を通して同様の要素を指す。

【発明を実施するための形態】

【0023】

従来の機械学習アプローチは、一般的に、モデルをトレーニングするために大量のラベル付きデータを必要とする。ラベル付きデータは、オフラインで収集されることがよくあり、その後、モデルが実世界に展開される。

【0024】

しかしながら、従来の機械学習技術は、いくつかの限界がある。海軍領域、宇宙領域、水中領域のような全ての領域において大量のラベル付きデータを収集することは現実的ではない。ＲＦ信号、レーダー、合成開口レーダー（ＳＡＲ）のような利用可能なラベル付きデータが限られている新たに発生したデータモダリティも多い。同一のクラスのデータでも経時的に変化する可能性があり、したがって、オフラインのデータでトレーニングされたモデルは、新しいデータではうまく機能しない可能性がある。各アプリケーションが独自の要件を有するので、全てのアプリケーションに単一の事前学習モデルを使用することが常に実行可能であるとは限らない。

【0025】

本開示は、上述した課題に対処する新しい機械学習フレームワークを説明する。開示されたフレームワークは、ライブストリーミングデータを使用してリアルタイムで機械学習モデルをトレーニング及び展開するように設計されている。

【0026】

一態様において、開示されたフレームワークは、これを達成するために三つの処理モジュールの組合せを使用してもよい。三つの処理モジュールは、ハイブリッドリプレイモジュール、タスク固有モジュール及びアーキテクチャ最適化モジュールを含むが、それに限定されない。

【0027】

ハイブリッドリプレイモジュールは、少数クラスの拡張サンプルを生成することによって、限られたラベル付きデータの問題に対処してもよい。タスク固有ネットワークモジュールは、機械学習モデルを少数の例でトレーニングしてもよい。アーキテクチャ最適化モジュールは、推論のために進化したセンサデータに基づいてシステムの複雑さを自動的に適応させてもよい。有利なことに、上述した三つの処理モジュールの組合せにより、フレームワークは、オフラインの大量のラベル付きデータを必要とすることなく実際のアプリケーションのための機械学習モデルをトレーニングすることができる。開示されたフレームワークを実際のアプリケーションで使用することができる方法のいくつかの例は、以下の通りである。

【0028】

一例として、開示されたフレームワークを、レーダーデータを使用してリアルタイムで船舶を検出及び追跡するモデルをトレーニングするために使用することができる。別の例として、開示されたフレームワークは、衛星画像を使用してリアルタイムで物体を識別及び分類するモデルをトレーニングするために使用することができる。更に別の例として、開示されたフレームワークは、水中ビデオ映像を使用してリアルタイムで魚の種類を分類するモデルをトレーニングするために使用することができる。

【0029】

本開示の技術によれば、本開示は、利用可能なオフライントレーニングデータが限られている又は利用可能なオフライントレーニングデータがないときでもライブストリーミングデータを使用してリアルタイムで機械学習モデルをトレーニングするための新しいアプローチを説明する。開示された技術は、ｉｎ－ｓｉｔｕアルゴリズムトレーニングとして知られている。ｉｎ－ｓｉｔｕアルゴリズムトレーニングは、従来の機械学習技術に対していくつかの利点を有する。

【0030】

ｉｎ－ｓｉｔｕアルゴリズムトレーニングは、モデルが生成されるときにモデルがライブデータでトレーニングされるために更に高速で効率的である可能性がある。ｉｎ－ｓｉｔｕアルゴリズムトレーニングは、モデルが常に新しいデータで更新されるためにデータ分布の変化に対して更にロバストである可能性がある。ｉｎ－ｓｉｔｕアルゴリズムトレーニングを、オフライントレーニングデータが利用できない又はオフライントレーニングデータを収集することが現実的でないアプリケーションのモデルをトレーニングするために使用してもよい。

【0031】

本開示は、ライブストリーミングデータにおけるクラス不均衡の問題に対処するために使用されるハイブリッドリプレイモジュールについても説明する。クラス不均衡は、あるクラスの例が他のクラスよりも多い場合に発生する可能性がある。クラス不均衡は、機械学習モデルが少数クラスを正確に分類することをトレーニングすることを困難にする可能性がある。一態様において、ハイブリッドリプレイモジュールは、少数クラスの拡張サンプルを生成することによって機能してもよい。一態様において、少数クラスのそのような拡張サンプルを、データ拡張又は合成データ生成のようなものであるがそれに限定されない技術を使用して生成してもよい。そして、拡張サンプルをトレーニングデータセットに追加してもよく、それによって、少数クラスに対するモデルの性能を向上させるのを助けるようにしてもよい。

【0032】

本開示は、推論のために進化したセンサデータに基づいてシステムの複雑さを自動的に適応させるために使用してもよいアーキテクチャ最適化モジュールについても説明する。そのような適応は、モデルが所望の精度のレベルを達成するためにモデルが常に最適な量のリソースを使用していることを保証するのを助けるようにしてもよい。全体として、本開示は、ライブストリーミングデータを使用してリアルタイムで機械学習モデルをトレーニングするための有望な新しいアプローチを説明する。開示された技術は、機械学習が多くの異なるアプリケーションで使用される方法に革命をもたらす可能性がある。ｉｎ－ｓｉｔｕアルゴリズムトレーニングを実際のアプリケーションで使用することができる方法のいくつかの例は、以下の通りである。ｉｎ－ｓｉｔｕアルゴリズムトレーニングを、金融機関からのライブデータを使用してリアルタイムで不正取引を検出するモデルをトレーニングするために使用することができる。ｉｎ－ｓｉｔｕアルゴリズムトレーニングを、医療機器からのライブデータを使用してリアルタイムで病気を診断するモデルをトレーニングするために使用することができる。ｉｎ－ｓｉｔｕアルゴリズムトレーニングを、機械のセンサからのライブデータを使用して機械が故障しそうなときを予測するモデルをトレーニングするために使用することもできる。

【0033】

一態様において、データ前処理モジュールは、トレーニング及び評価のためにデータを準備する役割を担う機械学習パイプラインのオプションの構成要素であってもよい。データ前処理モジュールは、フォーマット変換、メタデータ導出及びデータ関連付けの三つの主要機能のインタフェースを提供してもよいフォーマット変換機能は、データを、（一つ以上の）モデルのトレーニングに使用してもよい機械学習アルゴリズムと互換性のあるフォーマットに変換してもよい。

【0034】

図１は、例示的なコンピューティングシステム１００を示すブロック図である。示すように、コンピューティングシステム１００は、データ前処理モジュール１１４、タスク固有ネットワークモジュール１１６、ハイブリッドリプレイモジュール１１８及びアーキテクチャ最適化モジュール１２０を含むがそれに限定されない一つ以上のモジュールを有する機械学習システム１０４を実行するための処理回路１４３及びメモリ１０２を備える。さらに、タスク固有モジュール１１６は、一つ以上の機械学習モデル１０６を有してもよい。ＭＬモデル１０６は、再帰型ニューラルネットワーク（ＲＮＮ）、畳み込みニューラルネットワーク（ＣＮＮ）、ディープニューラルネットワーク（ＤＮＮ）のようなものであるがそれに限定されない様々なタイプのニューラルネットワークを備えてもよい。

【0035】

コンピューティングシステム１００を、本開示の一つ以上の態様に従って説明される動作及び／又は機能を実行することが可能であってもよい一つ以上のサーバコンピュータ、ワークステーション、ラップトップ、メインフレーム、アプライアンス、クラウドコンピューティングシステム、高性能コンピューティング（ＨＰＣ）システム（すなわち、スーパーコンピューティング）及び／又は他のコンピューティングシステムのような任意の適切なコンピューティングシステムとして実現してもよい。いくつかの例では、コンピューティングシステム１００は、クライアントデバイス及び他のデバイス又はシステムにサービスを提供するクラウドコンピューティングシステム、サーバファーム及び／又はサーバクラスタ（又はその一部）を表してもよい。他の例では、コンピューティングシステム１００は、データセンター、クラウドコンピューティングシステム、サーバファーム及び／又はサーバクラスタの一つ以上の仮想化されたコンピュートインスタンス（例えば、仮想マシン、コンテナ等）を表してもよい、又は、それを通じてコンピューティングシステム１００実現してもよい。

【0036】

本開示において説明される技術を、少なくとも部分的に、ハードウェア、ソフトウェア、ファームウェア又はその任意の組合せにおいて実現してもよい。例えば、説明される技術の様々な態様を、コンピューティングシステム１００の処理回路１４３内で実現してもよく、処理回路１４３は、マイクロプロセッサ、コントローラ、デジタルシグナルプロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）又は同等のディスクリート若しくは集積論理回路又は他のタイプの処理回路のうちの一つ以上を有してもよい。コンピューティングシステム１００の処理回路１４３は、コンピューティングシステム１００に関連する機能を実現してもよい、及び／又は、コンピューティングシステム１００に関連する命令を実行してもよい。コンピューティングシステム１００は、コンピューティングシステム１００に存在する及び／又はコンピューティングシステム１００で実行されるソフトウェア、ハードウェア、ファームウェア、又は、ハードウェア、ソフトウェア及びファームウェアの混合物を使用して本開示の一つ以上の態様に従って動作を実行するために処理回路１４３を使用してもよい。「プロセッサ」又は「処理回路」という用語は、一般に、単独で又は他の論理回路と組み合わせて上述した論理回路のいずれか又は他の同等の回路を指すことがある。ハードウェアを備える制御ユニットは、本開示の技術の一つ以上を実行してもよい。

【0037】

別の例では、コンピューティングシステム１００は、デスクトップコンピュータ、ラップトップコンピュータ、ゲーム機、スマートテレビ、ハンドヘルドデバイス、タブレット、携帯電話、スマートフォン等のような一つ以上のコンピューティングデバイスを有する任意の適切なコンピューティングシステムをそなえる。いくつかの例では、システム１００の少なくとも一部は、クラウドコンピューティングシステム、データセンター又はネットワークに分散され、ネットワークは、例えば、コンピューティングシステム、サーバ及びコンピューティングデバイス間でデータを伝送するためのインターネット、別の公衆通信ネットワーク又は専用通信ネットワークであり、これらは、例えば、ブロードバンド、セルラー、Ｗｉ－Ｆｉ（登録商標）、ＺｉｇＢｅｅ（登録商標）、Ｂｌｕｅｔｏｏｔｈ（登録商標）（又は他のパーソナルエリアネットワーク－ＰＡＮ）、近距離無線通信（ＮＦＣ）、ウルトラワイドバンド、衛星、エンタープライズ、サービスプロバイダ及び／又は他のタイプの通信ネットワーク等である。

【0038】

メモリ１０２は、一つ以上の記憶装置を備えてもよい。コンピューティングシステム１００の一つ以上の構成要素（例えば、処理回路１４３、メモリ１０２、データ前処理モジュール１１４、タスク固有ネットワークモジュール１１６、ハイブリッドリプレイモジュール１１８及びアーキテクチャ最適化モジュール１２０）を、構成要素間の通信を（物理的、通信的及び／又は動作的に）可能にするように相互接続してもよい。いくつかの例では、そのような接続を、システムバス、ネットワーク接続、プロセス間通信データ構造、ローカルエリアネットワーク、ワイドエリアネットワーク又はデータの通信を行うための任意の他の方法によって提供してもよい。メモリ１０２の一つ以上の記憶装置を、複数の装置の間に分散してもよい。

【0039】

メモリ１０２は、コンピューティングシステム１００の動作中に処理するための情報を記憶してもよい。いくつかの例では、メモリ１０２は、一時的なメモリを備え、これは、メモリ１０２の一つ以上の記憶装置の主な目的が長期記憶ではないことを意味する。メモリ１０２を、情報の短期記憶のために揮発性メモリとして構成してもよく、したがって、動作を停止させた場合、記憶された内容を保持しない。揮発性メモリの例は、ランダムアクセスメモリ（ＲＡＭ）、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）、スタティックランダムアクセスメモリ（ＳＲＡＭ）及び当該技術分野で知られている他の形態の揮発性メモリを含む。メモリ１０２は、いくつかの例では、一つ以上のコンピュータ可読記憶媒体も含んでもよい。メモリ１０２を、揮発性メモリよりも大容量の情報を記憶するように構成してもよい。メモリ１０２を、情報の長期記憶のために不揮発性メモリ空間として構成するとともに動作／オフサイクル後に情報を保持してもよい。不揮発性メモリの例は、磁気ハードディスク、光ディスク、フラッシュメモリ又は電気的にプログラム可能なメモリ（ＥＰＲＯＭ）若しくは電気的に消去可能かつプログラム可能な（ＥＥＰＲＯＭ）メモリの形態を含む。メモリ１０２は、本開示の一つ以上の態様に従って説明されるモジュールの一つ以上に関連するプログラム命令及び／又はデータを記憶してもよい。

【0040】

処理回路１４３及びメモリ１０２は、一つ以上のモジュール又はユニット（例えば、データ前処理モジュール１１４、タスク固有ネットワークモジュール１１６、ハイブリッドリプレイモジュール１１８及びアーキテクチャ最適化モジュール１２０）のための動作環境又はプラットフォームを提供してもよく、動作環境又はプラットフォームを、ソフトウェアとして実現してもよいが、いくつかの例では、動作環境又はプラットフォームは、ハードウェア、ファームウェア及びソフトウェアの任意の組合せを含む。処理回路１４３は、命令を実行してもよく、一つ以上の記憶装置、例えば、メモリ１０２は、一つ以上のモジュールの命令及び／又はデータを記憶してもよい。処理回路１４３及びメモリ１０２の組合せは、一つ以上のアプリケーション、モジュール又はソフトウェアの命令及び／又はデータの検索、記憶及び／又は実行を行ってもよい。処理回路１４３及び／又はメモリ１０２を、図１に示す構成要素のうちの一つ以上を含むがそれに限定されない一つ以上の他のソフトウェア及び／又はハードウェア構成要素に動作可能に結合してもよい。

【0041】

処理回路１４３は、基礎となるハードウェアで実行される仮想マシン又はコンテナのような仮想化モジュールを使用して機械学習システム１０４を実行してもよい。そのようなモジュールの一つ以上を、オペレーティングシステム又はコンピューティングプラットフォームの一つ以上のサービスとして実行してもよい。機械学習システム１０４の態様を、コンピューティングプラットフォームのアプリケーション層で一つ以上の実行可能プログラムとして実行してもよい。

【0042】

コンピューティングシステム１００の一つ以上の入力装置１４４は、入力を生成、受信又は処理してもよい。そのような入力は、キーボード、ポインティングデバイス、音声応答システム、ビデオカメラ、バイオメトリック検出／応答システム、ボタン、センサ、モバイルデバイス、制御パッド、マイクロフォン、プレゼンスセンシティブスクリーン、ネットワーク又は人間若しくは機械からの入力を検出するための任意の他のタイプのデバイスからの入力を含んでもよい。

【0043】

一つ以上の出力装置１４６は、出力を生成、送信又は処理してもよい。出力の例は、触覚、音声、視覚及び／又はビデオ出力である。出力装置１４６は、ディスプレイ、サウンドカード、ビデオグラフィックスアダプタカード、スピーカ、プレゼンスセンシティブスクリーン、一つ以上のＵＳＢインタフェース、ビデオ及び／又はオーディオ出力インタフェース又は触覚、オーディオ、ビデオ若しくは他の出力を生成することができる任意の他のタイプのデバイスを含んでもよい。出力装置１４６は、液晶ディスプレイ（ＬＣＤ）、量子ドットディスプレイ、ドットマトリクスディスプレイ、発光ダイオード（ＬＥＤ）ディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、陰極線管（ＣＲＴ）ディスプレイ、ｅインク又はモノクロ、カラー又は触覚、音声及び／又は視覚出力を生成することができる任意の他のタイプのディスプレイを含む技術を使用して出力装置として機能してもよい表示装置を含んでもよい。いくつかの例では、コンピューティングシステム１００は、一つ以上の入力装置１４４と一つ以上の出力装置１４６の両方として動作するユーザインタフェースデバイスとして機能してもよいプレゼンスセンシティブディスプレイを含んでもよい。

【0044】

コンピューティングシステム１００の一つ以上の通信装置１４５は、データを送信及び／又は受信することによってコンピューティングシステム１００の外部のデバイスと（又はコンピューティングシステム１００の別々のコンピューティングデバイス間で）通信を行ってもよく、いくつかの点で、入力装置及び出力装置の両方として動作してもよい。いくつかの例では、通信装置１４５は、ネットワークを通じて他のデバイスと通信を行ってもよい。他の例では、通信装置１４５は、セルラー無線ネットワークのような無線ネットワークで無線信号を送信及び／又は受信してもよい。通信装置１４５の例は、（例えば、イーサネット（登録商標）カードのような）ネットワークインターフェースカード、光トランシーバ、無線周波数トランシーバ、ＧＰＳ受信機又は情報を送信及び／又は受信することができる任意の他のタイプのデバイスを含んでもよい。通信装置１４５の他の例は、携帯機器に見られるＢｌｕｅｔｏｏｔｈ（登録商標）、ＧＰＳ、３Ｇ、４Ｇ及びＷｉ－Ｆｉ（登録商標）無線並びにユニバーサルシリアルバス（ＵＳＢ）コントローラ等を含んでもよい。

【0045】

図１の例では、データ前処理モジュール１１４は、入力データセット１１０から入力データを受信するとともに出力データ１１２を生成してもよい。入力データ１１０及び出力データ１１２は、様々なタイプの情報を含んでもよい。例えば、入力データ１１０は、ライブストリーミング取引データ（ストリーミングデータ１２２）を含んでもよい。さらに、データ前処理コンポーネント１１４は、（ハイブリッドリプレイ１１８から出力された）生成データ１２３と統合してタスク固有ネットワークモジュール１１６及びアーキテクチャ最適化モジュール１２０に宛てた拡張データ１２４を生成するためにストリーミングデータ１２２を出力してもよい。タスク固有ネットワークモジュール１１６は、出力データ１１２の一部であってもよい干渉出力（例えば、分類、検出、認識、セグメンテーション又は予測）を出力してもよい。

【0046】

上述したように、ＭＬモデル１０６は、対応する層のセットを備えるＲＮＮ、ＣＮＮ及びＤＮＮのようなものあるがそれに限定されない様々なタイプのニューラルネットワークを備えてもよい。層１０８の各セットは、人工ニューロンのそれぞれのセットを有してもよい。層１０８は、例えば、入力層、フィーチャー層、出力層及び一つ以上の隠れ層を有してもよい。層１０８は、完全連結層、畳み込み層、プーリング層及び／又は他のタイプの層を有してもよい。完全連結層では、前の層の各ニューロンの出力が完全連結層の各ニューロンの入力を形成する。畳み込み層では、畳み込み層の各ニューロンがそのニューロンの受容野に関連するニューロンからの入力を処理する。プーリング層は、ある層のニューロンクラスターの出力を次の層の単一ニューロンに結合する。

【0047】

層のセットの各層の各人工ニューロンの各入力を、重み１２６の対応する重みに関連付けてもよい。様々な活性化関数は、正規化線形ユニット（ＲｅＬＵ）、ＴａｎＨ、シグモイド等のように当技術分野で知られている。

【0048】

ＭＬシステム１０４は、本明細書で説明する技術に従ってＭＬモデル１０６をトレーニングするためにトレーニングデータ１１３を処理してもよい。例えば、機械学習システム１０４は、トレーニングデータ１１３を処理することを含むエンドツーエンドトレーニング方法を適用してもよい。機械学習システム１０４は、以下に説明するように、推論データ（出力データ１１２）を生成するためにストリーミングデータ１２２を含んでもよい入力データ１１０を処理してもよい。

【0049】

一態様において、機械学習システム１０４は、入力データ１１０によって提示される潜在的なクラス不均衡の問題を解消しながら迅速かつ正確な結果を生成してもよい。機械学習システム１０４を、ライブストリーミングデータ１２２が経時的に進化することができる実際のアプリケーションに使用されるように構成してもよい。データ前処理モジュール１１４は、ライブストリーミングデータ１２２を、ＭＬモデル１０６をトレーニングするために使用される機械学習アルゴリズムと互換性のある形式に変換してもよい。データ前処理モジュール１１４は、入力データ１１０からメタデータを抽出してもよい。一態様では、タスク固有ネットワークモジュール１１６は、画像の分類、物体の検出、画像の生成又はテキストの生成のようなものであるがそれに限定されない特定のタスクを実行するように構成された機械学習モデルであってもよい。タスク固有ネットワークモジュール１１６を、フューショット学習技術、半教師あり学習及び自己教師あり学習の組合せを使用してトレーニングしてもよい。そのようなトレーニング技術により、利用可能な学習データ１１３が限られているときでもタスク固有ネットワークモジュール１１６がタスクを正確に実行することを学習できるようにしてもよい。

【0050】

一態様において、ハイブリッドリプレイモジュール１１８を、実際のストリーミングデータ１２２を拡張するために選択的記憶と生成ネットワークとの組合せを使用するように構成してもよい。ハイブリッドリプレイモジュール１１８は、クラス不均衡の問題に対処するのを助けるようにしてもよく、機械学習モデル１０６がトレーニングデータ１１３に過剰適合するのを防止するようにしてもよい。

【0051】

一態様において、アーキテクチャ最適化モジュール１２０を、タスク固有ネットワーク１１６のネットワークアーキテクチャを適応させるとともにストリーミングデータ１２２の増大し続ける複雑さに基づいてリプレイモードを適応させるように構成してもよい。アーキテクチャ最適化モジュール１２０は、ＭＬモデル１０６の出力の精度を向上させるのを助けるようにしてもよい。

【0052】

要約すると、機械学習システム１０４を、最初にライブストリーミングデータ１２２を前処理するように構成してもよい。一態様において、データ前処理モジュール１１４は、入力データ１１０をタスク固有ネットワークモジュール１１６と互換性のあるフォーマットに変換してもよく、入力データ１１０からメタデータを抽出してもよい。タスク固有ネットワークモジュール１１６を、フューショット学習法、半教師あり学習及び自己教師あり学習の組合せを使用して、前処理されたデータにおいてトレーニングしてもよい。ハイブリッドリプレイモジュール１１８を、実際のストリーミングデータ１２２を拡張するために使用してもよく、ハイブリッドリプレイモジュール１１８は、拡張データ１２４を生成してもよい。ハイブリッドリプレイモジュール１１８は、クラス不均衡の問題に対処するのを助けてもよく、ＭＬモデル１０６がトレーニングデータ１１３に過剰適合するのを防止してもよい。最後に、アーキテクチャ最適化モジュール１２０は、タスク固有ネットワークモジュール１１６のネットワークアーキテクチャを適応させてもよく、ストリーミングデータ１２２の増大し続ける複雑さに基づいてリプレイモードを適応させてもよい。アーキテクチャ最適化モジュール１２０は、ＭＬモデル１０６の出力の精度を向上させるのを助けてもよい。

【0053】

説明した機械学習システム１０４は、従来の機械学習技術を超える複数の利点を有することがある。機械学習システム１０４は、利用可能なトレーニングデータ１１３が限られている又は利用可能なトレーニングデータ１１３がないときでも迅速かつ正確な結果を生成してもよい。別の利点として、機械学習システム１０４は、クラス不均衡に対してロバストであってもよく、トレーニングデータ１１３に対する過剰適合を回避してもよい。更に別の利点として、機械学習システム１０４は、経時的なデータ分布の変化に適応できるようにしてもよい。

【0054】

一態様では、開示された技術により、機械学習システム１０４が詐欺検出、医療診断及び予測保守のようなものであるがそれに限定されない実際のアプリケーションに適合する。機械学習システム１０４を、金融機関からのライブ入力データ１１０（例えば、ストリーミングデータ１２２）を使用してリアルタイムで不正取引を検出するためにＭＬモデル１０６をトレーニングするのに使用することができる。機械学習システム１０４を、医療機器からのライブ入力データ１１０を使用してリアルタイムで病気を診断するためにＭＬモデル１０６をトレーニングするのに使用することができる。更に別の非限定的な例として、機械学習システム１０４は、機械のセンサからのライブ入力データ１１０を使用して機械がいつ故障しそうかを予測するためにＭＬモデル１０６をトレーニングするのに使用することができる。

【0055】

有利なことに、ライブストリーミングデータを使用してＭＬモデル１０６をトレーニングするためのハイブリッドリプレイモジュール１１８、タスク固有ネットワークモジュール１１６及びアーキテクチャ最適化モジュール１２０の組合せは、当該技術分野において現在知られていない新規な概念である。従来の機械学習技術は、モデルをトレーニングするために、一般的に、大量のラベル付きデータを必要とする。そのようなラベル付きデータは、オフラインで収集されることがよくあり、その後、モデルが実世界に展開される。

【0056】

しかしながら、従来の機械学習技術にはいくつかの限界がある。例えば、海軍領域、宇宙領域及び水中領域のような全ての領域において、大量のラベル付きデータを収集することは現実的でない場合がある。

【0057】

本開示の技術によれば、機械学習システム１０４は、実際のアプリケーションにおける機械学習モデルのトレーニング及び配備の課題に対処するいくつかの新しい能力を有してもよい。例えば、フューショット学習は、機械学習システム１０４を少数の例でトレーニングすることを可能にする技術である。このタイプのトレーニングは、大量のラベル付きデータを収集することが困難である又はコストがかかる実際のアプリケーションに有用である。別の非限定的な例として、ハイブリッドリプレイモジュール１１８は、クラス不均衡の問題に対処する技術であるハイブリッドリプレイ技術を実現してもよい。クラス不均衡は、あるクラスの例が他のクラスよりも多いときに発生する。

【0058】

有利なことに、本開示が、ライブストリーミングデータ１２２を使用してリアルタイムで機械学習モデルをトレーニング及び展開してもよい新たな機械学習フレームワークについて記載しているので、本開示の技術的態様は、長期学習システム又は新たなデータ領域におけるアプリケーションが予めオフラインで大量のトレーニングデータを収集するための手作業を回避又は最小化することを可能にする。これを達成するために、上述したように、開示されたフレームワークは、上述した三つの技術、すなわち、フューショット学習、ハイブリッドリプレイ及びアーキテクチャ最適化の組合せを使用する。例えば、クラス不均衡により機械学習システム１０４が少数クラスを正確に分類することを学習するのが困難になる場合がある。ハイブリッドリプレイ技術は、少数クラスの拡張サンプルを生成することによって機能する。そのような拡張サンプルは、少数クラスに対するモデルの性能を向上させるのを助けてもよい。アーキテクチャ最適化技術は、データに基づいて機械学習モデルの複雑さを自動的に適応させる。そのような最適化は、経時的にデータ分布が変化する可能性のある実際のアプリケーションに有用である。

【0059】

一態様において、データ前処理モジュール１１４は、（ハイブリッドリプレイモジュール１１８から出力された）生成データ（参照記号＃）と統合してタスク固有ネットワークモジュール１１６及びアーキテクチャ最適化モジュール１２０に宛てた拡張データ１２４を生成するために、ストリーミングデータ１２２を出力してもよい。アーキテクチャ最適化モジュール１２０は、選択したコンポーネントをハイブリッドリプレイモジュール１１８とタスク固有ネットワークモジュール１１６の両方に出力してもよい。タスク固有ネットワークモジュール１１６は、新しいデータを決定するために古いデータからデータ及び／又は特徴を汎化することによる新しい／未知のデータの自動結果生成のための（本明細書では「フューショット技術」とも呼ばれる）フューショット学習を使用してもよい。フューショット学習技術を使用することにより、タスク固有ネットワークモジュール１１６は、例えば、ユーザが少量のライブストリーミングデータ１２２をラベル付けした後、リアルタイムで迅速かつ正確な推論出力を生成することができ、それにより、当該技術分野において従来知られていたオフライン学習技術を回避する。推論データの信頼度スコアを、ハイブリッドリプレイモジュール１１８に出力してもよい。

【0060】

さらに、タスク固有ネットワークモジュール１１６を、クラス不均衡を有するライブストリーミング入力データを使用してトレーニングしてもよい。一態様において、ライブストリーミング入力データにおけるクラス不均衡を解消するために使用してもよい技術は、以下に説明する自己教師あり学習、半教師あり学習及び推論結果の較正を含んでもよいがそれに限定されない。例えば、自己教師あり学習は、機械学習システム１０４がラベル付きデータを必要とすることなく学習することを可能にする技術である。

【0061】

半教師あり学習は、（図２に示すように）教師あり学習モジュール、自己教師あり学習モジュール、オンライン学習モジュール、オンライン予測モジュール及び予測蓄積モジュールを含んでもよい。教師あり学習モジュールを、ラベル付きデータ上でＭＬモデル１０６をトレーニングするために使用されてもよい。ラベル付きデータは、専門家ユーザによってラベルで注釈が付けられたデータであってもよい。教師あり学習モジュールは、入力データ１１０と出力ラベルとの間の関係を学習するためにラベル付きデータを使用してもよい。自己教師あり学習モジュールは、ラベル付けされていないデータでＭＬモデル１０６をトレーニングするために使用される。ラベル付けされていないデータは、専門家ユーザによってラベルで注釈が付けられていないデータであってもよい。

【0062】

ハイブリッドリプレイモジュール１１８は、特に稀ではあるが重要なクラスについて、潜在的なクラス不均衡の問題に対処してもよい。ハイブリッドリプレイモジュール１１８は、１）拡張サンプルを生成する方法、２）現在のトレーニングバッチデータを拡張する方法及び３）サンプルの多様性を最大化する方法を含むがそれに限定されない多くの方法で上述したクラス不均衡の問題に対処してもよい。例えば、ハイブリッドリプレイモジュール１１８は、利用可能な例が限られているクラスの拡張サンプル（例えば、拡張データ１２４）を生成するために様々な技術を使用してもよい。一態様において、変分オートエンコーダ、生成的敵対ネットワーク又は従来のサンプルベースの拡張技術を使用して拡張サンプルを生成してもよい。

【0063】

ＭＬモデル１０６は、データに基づいてトレーニングされる。データが不完全又は不正確な場合、対応するモデルを正確にトレーニングすることができない。機械学習における課題の一つは、データが不完全又は不正確であることがよくあることである。上述した課題は、トレーニングデータの稀な例、破滅的忘却、大量の事前データの記憶、高リスク低確率事象のようなものであるがそれに限定されないの多くの要因による場合がある。例えば、いくつかの例は、トレーニングデータ１１３において稀なことある。そのような稀な例は、ＭＬモデル１０６がこれらの例を正確に分類することを学習することを困難にする可能性がある。

【0064】

一態様において、ハイブリッドリプレイモジュール１１８は、例えば、リプレイメモリ及びリプレイ生成人工知能（ＡＩ）アーキテクチャを使用することによって、上記例を実施するための方法を実現してもよい。リプレイメモリは、代表的なラベル付けサンプルと固定サイズのダイナミックバッファの（関連するメタデータを含む）まだラベル付けされていないトラックとを混合したものを記憶するデータ構造であってもよい。リプレイメモリを、トレーニングデータ１１３から最も有用で代表的な例を記憶するために使用してもよい。リプレイメモリは、新しい例が稀である又は新しい例の分類が困難であるときでもＭＬモデル１０６が正確に分類することを学習するのを助けてもよい。また、リプレイメモリは、クラスラベル付きデータを増加させるとともに将来のバッチを以前のデータで補足するために、将来のクラスラベルを過去にさかのぼって伝播してもよい。そのような伝播は、破滅的忘却を防止するとともに稀で困難な例に対するＭＬモデルの精度１０６を向上させるのを助けてもよい。生成的ＡＩアーキテクチャは、既存のデータに基づいて新しいコンテンツ又はデータを生成するシステムの設計である。このタイプのＡＩシステムは、例の大規模なデータセットでトレーニングされてもよく、トレーニングデータに類似した新しい出力を作成するためにその知識を使用してもよい。一態様では、リプレイ生成ＡＩアーキテクチャを、リプレイ生成逆数ネットワーク（ＧＡＮ）として実現してもよい。

【0065】

例えば、ハイブリッドリプレイモジュール１１８は、リプレイメモリとリプレイＧＡＮの両方をストリーミングデータ１２２と組み合わせて、識別器／分類器にデータを出力する拡張学習セットを生成してもよい。識別器／分類器は、リプレイＧＡＮによって生成された本物のデータと偽物のデータとを区別するようにトレーニングされた機械学習モデルである。識別器／分類器を、データサンプルのクラスを予測するために機械学習システム１０４によって使用してもよい。

【0066】

図２は、本開示の技術による半教師あり増分学習の例を示す概念図である。半教師あり学習は、モデルをトレーニングするためにラベル付きデータとラベル付けされていないデータの両方を使用する機械学習技術である。半教師あり学習は、利用可能なラベル付きデータは限られているが大量のラベルなしデータが存在する場合に使用されることがよくある。半教師あり増分学習（ＳＳＩＬ）は、半教師あり学習の長所と増分学習の長所とを組み合わせた機械学習パラダイムである。ＳＳＩＬでは、少数のラベル付きデータと大量のラベルなしデータでモデルをトレーニングしてもよい。モデルがトレーニングされると、モデルは、新しいクラスを学習するとともに既に学習したことを忘れることなく知識ベースを更新してもよい。図２に示す半教師あり学習システム２００は、教師あり学習モジュール２０２、自己教師あり学習モジュール２０４、オンライン学習モジュール２０６、オンライン予測モジュール２０８、予測蓄積モジュール２１０等のモジュールを含むがそれに限定されない。

【0067】

教師あり学習モジュール２０２を、ラベル付きデータでＭＬモデル１０６をトレーニングするために使用してもよい。

【0068】

自己教師あり学習モジュール２０４を、ラベル付けされていないデータでＭＬモデル１０６をトレーニングするために使用してもよい。。オンライン学習モジュール２０６を、新しいデータが利用可能になるときにＭＬモデル１０６を更新するために使用してもよい。オンライン予測モジュール２０８を、新しいデータに対する予測を生成するために使用してもよい。予測累積モジュール２１０は、推論の精度を向上させるために複数のオブザベーションからの予測を組み合わせてもよい。事前学習データ２１２を、教師あり学習モジュール２０２又は自己教師あり学習モジュール２０４のいずれか又は両方に入力してもよい。事前学習ドメイン２１４からの事前学習データ２１２を、初期ＭＬモデル１０６をトレーニングするために使用してもよい。事前学習データ２１２は、利用可能なラベル付きデータが限られている場合でもターゲットドメイン２１６でのＭＬモデル１０６のパフォーマンスを向上させるのを助けてもよい。限られたターゲットデータ２１８を、オンライントレーニングモジュール２０６に入力してもよい。

【0069】

有利なことに、限られたターゲットデータ２１８は、専門家ユーザによってラベルでまばらに注釈が付けられてもよい。換言すれば、限られたターゲットデータ２１８の小さなサブセットのみにラベル付けすればよい。オンライン学習モジュール２０６は、ＭＬモデル１０６を更新するとともにターゲットドメイン２１６の精度を向上させるためにこの限られたラベル付きターゲットデータ２１８を使用してもよい。ターゲットデータ２２０を、オンライン予測モジュール２０８に入力してもよい。オンライン予測モジュール２０８は、新しいデータに対する予測を生成するためにＭＬモデル１０６を使用してもよい。予測累積モジュール２１０は、推論の精度を向上させるために複数のオブザベーションからの予測を組み合わせてもよい。一態様において、予測累積モジュール２１０は、対応する信頼度により予測に重み付けすることによって予測を組み合わせてもよい。

【0070】

図３は、本開示の技術による例示的なハイブリッドリプレイ方法３００を示す概念図である。ハイブリッドリプレイ方法を実施するハイブリッドリプレイモジュール１１８は、特に稀であるが重要なクラスについての潜在的なクラス不均衡の問題に多くの方法で対処してもよい。

【0071】

ハイブリッドリプレイモジュール１１８は、利用可能な例が限られているクラスの拡張サンプルを生成するために様々な技術を使用してもよい。様々な態様において、ハイブリッドリプレイモジュール１１８は、変分オートエンコーダ、ＧＡＮ又は従来のサンプルベースの拡張技術を使用して拡張サンプルを生成してもよい。例えば、変分オートエンコーダを、トレーニングセットの既存のデータサンプルに類似する新しいデータサンプルを生成するために使用してもよい。ＧＡＮを、実際のデータサンプルと区別できない新しいデータサンプルを生成するためにハイブリッドリプレイモジュール１１８によって使用してもよい。

【0072】

ハイブリッドリプレイモジュール１１８は、既存のデータサンプルにランダム変換を適用することによって新しいデータサンプルを生成するために従来のサンプルベースの拡張技術を使用してもよい。ハイブリッドリプレイモジュール１１８は、現在のトレーニングバッチデータ（例えば、トレーニングデータ１１３）を、アーキテクチャ最適化モジュール１２０から受信した選択されたコンポーネントデータからのような以前のデータからの代表的な例で拡張してもよい。現在のトレーニングバッチデータを拡張することは、ＭＬモデル１０６が希少だが重要なクラスの例を含む多種多様なデータに触れることを確実にするのを助けてもよい。

【0073】

ハイブリッドリプレイモジュール１１８を、特に高リスクで低確率のイベントに対してサンプルの多様性を最大化するとともにクラス均衡を増大させるために使用してもよい。その理由は、ハイブリッドリプレイモジュール１１８が希少だが重要なクラスの拡張サンプルを生成することがあるとともにハイブリッドリプレイモジュール１１８が以前のデータからの代表的な例で現在のトレーニングバッチデータを拡張することがあるからである。不正検出アプリケーションにおけるクラスの不均衡に対処するためにハイブリッドリプレイモジュール１１８を使用することができる方法の非限定的な例は、以下の通りである。

【0074】

不正検出を行うように構成されたＭＬモデル１０６のトレーニングデータ１１３は、多数の不正でないトランザクション及び少数の不正なトランザクションを含むことがある。そのようなクラス不均衡は、ＭＬモデル１０６が不正なトランザクションを正確に検出するのをトレーニングすることを困難にすることがある。このクラス不均衡に対処するために、ハイブリッドリプレイモジュール１１８を、不正取引の拡張サンプル（例えば、拡張データ１２４）を生成するために使用することができる。

【0075】

ハイブリッドリプレイモジュール１１８は、変分オートエンコーダ、ＧＡＮ又は従来のサンプルベースの拡張技法のようなものであるがそれに限定されない様々な技術を使用して不正取引の拡張サンプルを生成してもよい。

【0076】

不正取引の生成された拡張サンプルを、トレーニングデータ１１３に追加してもよい。生成された拡張サンプルは、トレーニングデータ１１３のクラス均衡を向上させるのを助け、ＭＬモデル１０６が不正取引を正確に検出することを学習しやすくなる。拡張サンプルを生成することに加えて、ハイブリッドリプレイモジュール１１８を、現在のトレーニングバッチデータを以前のデータからの代表的な例で拡張するために使用してもよい。そのような拡張は、現在のトレーニングバッチの例に類似する例を以前のデータから選択することによって行うことができる。

【0077】

一態様において、ハイブリッドリプレイモジュール１１８は、ＭＬモデル１０６が不正取引の例を含むがそれに限定されない多種多様なデータに触れることを確実にするのを助けてもよい。その結果、ＭＬモデル１０６は、不正取引を更に正確に検知することを学習できるようになる。

【0078】

ハイブリッドリプレイは、トレーニングデータ１１３の頻度の低い例、破滅的忘却及び大量の事前データを記憶する必要性という課題にも対処する機械学習法である。一態様において、ハイブリッドリプレイモジュール１１８は、有用で代表的な先行例を保持するためのダイナミックメモリリポジトリの使用の使用及びメモリを補完するとともにサンプルの多様性を増加させるためのクラス条件付き生成ネットワークのトレーニングによって、頻度の低い例の課題に対処する。

【0079】

頻度の低い例は、トレーニングデータ１１３に稀に発生する例である。頻度の低い例は、これらの例を正確に分類するためにＭＬモデル１０６が学習することを困難にすることがある。破滅的忘却は、機械学習モデルを新しいデータでトレーニングしたときにトレーニングしたものを忘れる現象である。破滅的忘却は、新しいデータとモデルが元々トレーニングされたデータとが非常に異なる場合に起こることがある。

【0080】

一態様において、ハイブリッドリプレイモジュール１１８は、リプレイメモリ３０２とリプレイＧＡＮ３０４とを組み合わせてもよい。リプレイメモリ３０２は、代表的なラベル付けサンプルと固定サイズのダイナミックバッファの（関連するメタデータを含む）まだラベル付けされていないトラックとを混合したものを記憶してもよい。リプレイメモリ３０２を、トレーニングデータ１１３から最も有用で代表的な例を記憶するために使用してもよい。リプレイメモリ３０２は、新しい例が稀である又は新しい例の分類が困難であるときでもＭＬモデル１０６が正確に分類することを学習するのを助けてもよい。また、リプレイメモリは、クラスラベル付きデータを増加させるとともに将来のバッチを以前のデータで補足するために、将来のクラスラベルを過去にさかのぼって伝播してもよい。そのような伝播は、破滅的忘却を防止するとともに稀で困難な例に対するＭＬモデルの精度１０６を向上させるのを助けてもよい。リプレイメモリ３０２は、ラベル付きデータをクラスタリングするとともに代表的な例を保存することによってバッファサイズを維持してもよい。バッファは、ＭＬモデル１０６が学習するとともに学習データ１１３が変化してもリプレイメモリ３０２が最も有用で代表的な例を含むことを確実にするのを助けてもよい。リプレイＧＡＮ３０４は、リプレイメモリ３０２のデータサンプルに類似する新しいデータサンプルを生成するようにトレーニングしてもよい機械学習モデルである。リプレイＧＡＮ３０４を、少数クラスと多数クラスとの間のクラス均衡を増大させるために使用されてもよく、リプレイＧＡＮ３０４は、優先度の高い例を更に頻繁に生成してもよい。リプレイＧＡＮ３０４は、サンプル生成を安定化させるとともにリプレイメモリ３０２に存在するサンプルに対するサンプルの品質を測定するために補助分類器３０６を活用してもよい。ハイブリッドリプレイモジュール１１８は、機械学習モデル１０６をトレーニングするためにリプレイメモリ３０２とリプレイＧＡＮ３０４を組み合わせてもよい。リプレイメモリ３０２を、トレーニングデータからの最も有用で代表的な例を記憶するために使用してもよい。リプレイＧＡＮ３０４を、リプレイメモリ３０２のデータサンプルに類似する新しいデータサンプルを生成するために使用してもよい。ＭＬモデル１０６を、リプレイＧＡＮ３０４によって生成された新しいデータサンプルと同様に、リプレイメモリ３０２のラベル付きデータでトレーニングしてもよい。ＭＬモデル１０６は、データサンプルが稀である又はデータサンプルの分類が困難であるときでもデータサンプルを正確に分類することを学習してもよい。ハイブリッドリプレイモジュール１１８は、従来の機械学習技術を超える多くの上述した利点を提供してもよい。

【0081】

一態様において、ハイブリッドリプレイモジュール１１８は、リプレイメモリ３０２とリプレイＧＡＮ３０４との両方をストリーミングデータ１２２と組み合わせて、識別器／分類器３０６にデータを出力する拡張トレーニングセット３０８を生成してもよい。識別器／分類器３０６は、拡張トレーニングセット３０８からのデータにラベル付けしてもよく、クラスを本物又は偽物のいずれかとして予測してもよい。さらに、識別器／分類器３０６は、メモリを更新するためにデータを選択的に記憶してもよい（選択及び記憶３１０）。全てのデータを記憶するとは限らない。例えば、本物のデータからの更に代表的なデータサンプルのみを記憶し、全ての偽物のデータを無視してもよい。この更新されたメモリ（選択及び記憶３１０）を、更なる改良のためにリプレイメモリ３０２に入力してもよい。以下、ハイブリッドリプレイモジュール１１８がストリーミングデータ１２２で動作する方法を段階的に説明する。先ず、ハイブリッドリプレイモジュール１１８は、ストリーミングデータ１２２を収集するとともにバッファリングしてもよい。ストリーミングデータ１２２は、ラベル付けであってもよい又はラベル付けされていなくてもよい。次に、ハイブリッドリプレイモジュール１１８は、バッファのデータサンプルに類似する新しいデータサンプルを生成するためにリプレイＧＡＮ３０４を使用してもよい。これらの新しいデータサンプルは、ラベル付けであってもよい又はラベル付けされていなくてもよい。次に、ハイブリッドリプレイモジュール１１８は、バッファのデータサンプル及び生成されたデータサンプルにラベル付けするために識別器／分類器３０６を使用してもよい。識別器／分類器３０６は、リプレイメモリ３０２を更新するためにデータを選択的に記憶してもよい（選択及び記憶３１０）。次に、ハイブリッドリプレイモジュール１１８は、選択されるとともに記憶されたデータ３１０でリプレイメモリ３０２を更新してもよい。全てのデータをハイブリッドリプレイモジュール１１８によって記憶するのではなく、最も有用で代表的なデータのみを記憶してもよい。次に、ＭＬモデル１０６を、リプレイメモリ３０２のラベル付きデータでトレーニングしてもよい。最後に、ＭＬモデル１０６を、新しいデータに対して予測を行うために使用してもよい。上述したステップは、ハイブリッドリプレイモジュール１１８によって連続的に繰り返され、その結果、データが不均衡である又はデータが稀な例若しくは困難な例を含むときでも、ストリーミングデータ１２２から正確に学習するように構成されたＭＬモデル１０６となる。

【0082】

図４は、本開示の技術によるアーキテクチャ最適化方法の一例を示す概念図である。アーキテクチャ最適化は、既定のタスクにおけるパフォーマンスを向上させるために機械学習モデルの複雑さを自動的に調整するプロセスである。ライフロング推論の状況では、アーキテクチャ最適化を、経時的なセンサデータの変化にモデルを適応させるために使用してもよい。モデルを適応させることは重要である。その理由は、センサデータが環境の変化、ハードウェアの変化又はソフトウェアの変化のようなものであるがそれに限定されない複数の要因によって変化する可能性があるからである。センサデータの変化にタスク固有ネットワークモジュール１１６のモデルを適応させることによって、アーキテクチャ最適化モジュール１２０は、タスク固有ネットワークモジュール１１６が破滅的忘却を経験するのを防ぐのを助けてもよい。上述したように、破滅的忘却は、機械学習モデルを新しいデータでトレーニングしたときに機械学習モデル学習したものを忘れる現象である。

【0083】

ライフロング推論の状況では、アーキテクチャ最適化モジュール１２０を、タスク固有ネットワークモジュール１１６を異なる入力要件及びアプリケーションドメインに適応させるために使用してもよい。そのような適応は、オンライン学習と並行してアーキテクチャの選択を効率的に評価するために微分可能重み共有ニューラルアーキテクチャ探索（ＮＡＳ）を活用するとともに高性能モジュールの限られたセットから開始するために事前の経験及びパイロット研究に基づいてＮＡＳ探索空間を制限するセルベースのアプローチを利用することによって実現してもよい。微分可能重み共有ＮＡＳは、最適なアーキテクチャを探索するために勾配降下を使用するタイプのＮＡＳである。有利なことに、重み共有ＮＡＳによって、オンライン学習と並行してアーキテクチャの選択を評価することが可能であり、それは、ライフロング推論に重要である。その理由は、タスク固有ネットワークモジュール１１６がデータの変化に迅速に適応できるようにする必要があるからである。セルベースＮＡＳは、探索空間を予め規定されたセルの集合に限定するタイプのＮＡＳである。セルベースＮＡＳによって、高性能モジュールの限られたセットで探索を開始することが可能であり、それによって、探索プロセスが迅速になる。アーキテクチャ最適化の技術における課題の一つは、ネットワークアーキテクチャの継続的な適応と増大する計算の複雑さ及び新しい選択を評価する時間とのバランスをとることである。別の課題は、オンライン継続学習設定において特定のアーキテクチャ構成要素をニューロンから構築することが困難となることがあることである。アーキテクチャ最適化方法１２０は、オンライン学習と並行してアーキテクチャの選択を効率的に評価するために微分可能重み共有ＮＡＳを活用するとともに高性能モジュールの限られたセットから開始するために事前の経験及びパイロット研究に基づいてＮＡＳ探索空間を制限するセルベースのアプローチを利用することによって、これらの課題を解消してもよい。アーキテクチャ最適化モジュール１２０は、ライフロング推論のために複数の利点を有することがある。例えば、アーキテクチャ最適化モジュール１２０は、タスク固有ネットワークモジュール１１６を経時的なデータの変化に適応させることによって、破滅的忘却を防止するのを助けてもよい。別の非限定的な例として、アーキテクチャ最適化モジュール１２０は、稀だが重要な事象に関するタスク固有ネットワークモジュール１１６のパフォーマンスを向上させてもよい。

【0084】

増分モジュール化アーキテクチャ探索（ｐＮＡＳ）は、事前に選択されたモジュールの限られたセットから開始するとともに新しいモジュールの追加及びグラフのエッジの最適化によってネットワークの複雑さを徐々に増大させるアーキテクチャ最適化のための方法である。図４は、ライフロング推論のためのニューラルネットワークのアーキテクチャを最適化するためにｐＮＡＳを使用する方法の一例を示す概念図である。探索空間を、ＳｈａｐｅｄＭｕｌｔｉＬａｙｅｒＰｅｒｃｅｐｔｉｏｎｓ（ＭＬＰ）、ＳｈａｐｅｄＲｅｓＢｌｏｃｋ及びＧｒａｐｈＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｔｗｏｒｋｓ（ＧＣＮ）のような事前に選択されたモジュールの限られたセットで初期化してもよい。各モジュールは少数のハイパーパラメータを有してもよい。ＮＡＳ空間を、現在のモジュール候補セットの有向非巡回グラフ４０２としてモデル化してもよい。非循環グラフ４０２のノード４０４は、モジュールを表してもよく、グラフ４０２のエッジ４０６は、モジュール間の情報の流れを表してもよい。各メタ最適化ステップにおいて、グラフ４０２（モジュールを混合したもの）のエッジ４０６を最適化してもよい。グラフ４０２のエッジ４０６を、勾配降下又は進化的アルゴリズムのようなものであるがそれに限定されない様々な方法を使用して最適化してもよい。グラフ４０２のパフォーマンスが満足のいくものでない場合、新しいノード４０４をグラフ４０２に追加してもよい。新しいノードがネットワークの複雑さを増大させることがあることに留意すべきである。ＮＡＳ最適化を、パフォーマンス閾値に対する早期停止によって終了してもよい。ＮＡＳ最適化を終了すると、タスク固有ネットワークモジュール１１６を、選択されたアーキテクチャでトレーニングしてもよい。ライフロング推論におけるｐＮＡＳの利点の一部は、以下の通りである。ｐＮＡＳが事前に選択された限られたモジュールのセットから開始するとともにネットワークの複雑さを徐々に増大させるので、ｐＮＡＳは、効率的である。そのような技術によって、高性能アーキテクチャを迅速に見つけることができる。ｐＮＡＳがデータの変化にネットワークのアーキテクチャを適応させることができるので、ｐＮＡＳは、データの変化に対してロバストである。データは時間とともに変化する可能性があるため、そのような適応は、ライフロング推論にとって重要である。

【0085】

アーキテクチャ最適化モジュール１２０によって実施される方法を、図４に示す以下のステップに要約してもよい。先ず、アーキテクチャ最適化モジュール１２０は、ノード４０４のエッジ４０６の最初の未知の演算４１０を確立してもよい。換言すれば、アーキテクチャ最適化モジュール１２０は、予め規定されたノード（モジュール）４０４のセットから開始してもよく、それらをエッジ４０６で接続してもよい。各辺４０６は、最適化される必要がある未知の演算を表してもよい。次に、アーキテクチャ最適化モジュール１２０は、各辺４０６に演算４１８の混合したものを配置することによって連続緩和４１２を行ってもよい。換言すれば、アーキテクチャ最適化モジュール１２０は、未知の演算の各々を全ての可能な演算４１８の混合したものに置換してもよい。そのような置換によって、アーキテクチャ最適化モジュール１２０が連続空間においてネットワークのアーキテクチャを最適化することを可能にするようにしてもよい。次に、アーキテクチャ最適化モジュール１２０は、混合確率及び重みを共同でトレーニングするためにバイレベル最適化４１４を行ってもよい。バイレベル最適化４１４は、最適化の複数の層を有する複雑なモデルをトレーニングするために使用してもよい技術である。この場合、アーキテクチャ最適化モジュール１２０は、混合確率とタスク固有ネットワークモジュール１１６の重み１２６を共同でトレーニングするためにバイレベル最適化４１４を使用してもよい。次に、アーキテクチャ最適化モジュール１２０は、学習された混合及び確率に基づいて、タスク固有ネットワークモジュール１１６を最終化してもよい。タスク固有ネットワークモジュール１１６がトレーニングされると、アーキテクチャ最適化モジュール１２０は、最も高い混合確率を有する演算を選択することによって、モデルの最終化４１６を行ってもよい。アーキテクチャ最適化モジュール１２０によって実行される方法は、効率的である。その理由は、当該方法がタスク固有ネットワークモジュール１１６をトレーニングするために連続緩和４１２及びバイレベル最適化４１４を使用するからである。連続緩和４１２によって、アーキテクチャ最適化モジュール１２０は、高性能アーキテクチャを迅速に見つけることができる。アーキテクチャ最適化モジュール１２０によって実行される方法は、データの変化に対してロバストである。その理由は、当該方法がデータの変化に対してタスク固有ネットワークモジュール１１６のアーキテクチャを最適化することができるからである。この利点はライフロング推論にとって重要である。その理由は、データが経時的に変化することがあるからである。最後に、アーキテクチャ最適化モジュール１２０によって実行される方法は、大規模なデータセット及び複雑なタスクに対してスケーラブルである。その理由は、この方法がタスク固有ネットワークモジュール１１６のアーキテクチャを手元の特定のタスクに最適化する可能性があるからである。

【0086】

図５は、本開示の技術による増分ＤＡＲＴＳ最適化方法の一例を示す概念図である。

【0087】

ＤＡＲＴＳ（微分可能アーキテクチャ探索）は、ニューラルネットワークのアーキテクチャを最適化するために勾配降下を使用するＮＡＳのための方法である。一態様において、アーキテクチャ最適化モジュール１２０は、ＤＡＲＴＳアルゴリズムを実現してもよく、そのような実現の考察は、以下の通りである。ＤＡＲＴＳアルゴリズムを実現するアーキテクチャ最適化モジュール１２０は、先ず、所望のサイズ及び複雑さの全てのあり得るアーキテクチャを含む大規模なニューラルネットワークであるスーパーモデルを定義してもよい。次に、スーパーモデルをトレーニングデータセット１１３でトレーニングしてもよく、勾配降下アルゴリズムを、スーパーモデルのアーキテクチャがトレーニングデータセット１１３でのパフォーマンスに対して最適化されるようにスーパーモデルの重み１２６を調整するために使用してもよい。スーパーモデルがトレーニングされると、アーキテクチャ最適化モジュール１２０は、ニューラルネットワークの最適なアーキテクチャを選択するためにスーパーモデルの重み１２６を使用してもよい。アーキテクチャ最適化モジュール１２０は、スーパーモデルの重み１２６を考察するとともにパフォーマンスにとって最も重要な演算を特定することによって、この選択を行ってもよい。アーキテクチャ最適化モジュール１２０は、これらの演算を含むニューラルネットワークアーキテクチャを選択してもよい。ＤＡＲＴＳアルゴリズムは、他のＮＡＳアルゴリズムと比較して多くの利点を有する。ＤＡＲＴＳは、効率的である。その理由は、ＤＡＲＴＳがニューラルネットワークのアーキテクチャを最適化するために勾配降下を使用するからである。換言すれば、ＤＡＲＴＳは、高性能なアーキテクチャを迅速に見つけてもよい。ＤＡＲＴＳは、トレーニングデータセットの変化に強い。その理由は、ＤＡＲＴＳがトレーニングデータセットのパフォーマンスに対してニューラルネットワークのアーキテクチャを最適化するからである。換言すれば、ＤＡＲＴＳは、様々な異なるデータセットでうまく機能するアーキテクチャを見つけてもよい。ＤＡＲＴＳは、大規模データセット及び複雑なタスクに対してスケーラブルである。その理由は、ＤＡＲＴＳが手元の特定のタスクに対してニューラルネットワークのアーキテクチャを最適化してもよいからである。

【0088】

アーキテクチャ最適化モジュール１２０は、各ノード（すなわち、図４に示すノード４０４）における演算を、そのノードにおける候補演算の混合としてモデル化してもよい。換言すれば、各ノードにおける演算は、候補演算の加重平均であってもよい。重みを、ベクトルα（ｉ；ｊ）によってパラメータ化してもよい。

【0089】

ＤＡＲＴＳアルゴリズムは、ニューラルネットワークのアーキテクチャを最適化するためにバイレベル最適化問題を解いてもよい。バイレベル最適化問題は、トレーニングデータに関する（候補演算をパラメータ化する）アーキテクチャ重みｗの最適化と、ホールドアウトデータに関する（候補演算の重み付けをパラメータ化する）混合重みαの最適化との間で繰り返し適用されてもよい。以下は、２値最適化問題の更に詳しい説明である。先ず、ＤＡＲＴＳアルゴリズムは、トレーニングデータセットに関してアーキテクチャ重みｗを最適化することができる。そのような最適化を、トレーニングデータセットでスーパーモデルをトレーニングすることによって行ってもよい。次に、ＤＡＲＴＳアルゴリズムは、ホールドアウトデータに関して混合重みαを最適化してもよい。そのような最適化を、ホールドアウトデータセットでスーパーモデルをトレーニングするとともに異なる損失関数を使用することによって行ってもよい。混合重みをトレーニングするために使用される損失関数を、ホールドアウトデータでのパフォーマンスに有用な候補演算の混合を学習するようにスーパーモデルを促すように設計してもよい。上述したステップを、アーキテクチャ重みｗ及び混合重みαが収束するまで繰り返してもよい。結果的に得られるアーキテクチャ重み及び混合重みは、ニューラルネットワークの最適アーキテクチャを定義してもよい。バイレベル最適化問題は、解くのが困難な問題であるが、ＤＡＲＴＳアルゴリズムは、更に効率的に解くために複数の技術を使用してもよい。例えば、ＤＡＲＴＳアルゴリズムは、バイレベル最適化のために特別に設計された勾配降下アルゴリズムを使用してもよい。さらに、ＤＡＲＴＳアルゴリズムは、バイレベル最適化問題の探索空間を縮小するために複数のヒューリスティックを使用してもよい。ＤＡＲＴＳは、様々な異なるタスクに対して高性能ニューラルネットワークアーキテクチャを見つけるのに効果的であることを示した。例えば、ＤＡＲＴＳは、画像分類、物体検出及び自然言語処理のためのアーキテクチャを見つけるために使用されている。

【0090】

ＤＡＲＴＳトレーニングの終了時に、アーキテクチャ最適化モジュール１２０は、αのａｒｇｍａｘを使用して離散アーキテクチャを推論してもよい（すなわち、最も高い対応するα（ｉ；ｊ）を有する各（ｉ；ｊ）におけるｏ（ｉ；ｊ）のみが保持される）。換言すれば、アーキテクチャ最適化モジュール１２０は、ニューラルネットワークの各ノードにおいて最も高い重みを有する演算を選択してもよい。

【0091】

一態様において、アーキテクチャ最適化モジュール１２０は、ＤＡＲＴＳアルゴリズムの変形すなわちＩ－ＤＡＲＴＳを実現してもよい。図５は、アーキテクチャ最適化モジュール１２０によるＩ－ＤＡＲＴＳアルゴリズムの実現の方法５００を示す。ＤＡＲＴＳの増分の変形のための直感的技術は、リプレイのための模範データのコアセットを含むＤＡＲＴＳアルゴリズムを単に実行することである可能性がある。しかしながら、この技術は、簡単なリプレイデータを遥かに超える増分学習の数多くの進歩を利用することはできない。Ｉ－ＤＡＲＴＳは、有用で代表的な先行例を保持するためにダイナミックメモリリポジトリ（ＤＭＲ）５０２を活用することによってＤＡＲＴＳの強力な増分学習の変形を提案する。ＤＭＲ５０２は、データを効率的に記憶及び検索することができるデータ構造である。ＤＭＲ５０２は、ＤＭＲ５０２が最も有用で代表的な例を特定するために経時的に学習できるようにしてもよい。一態様において、アーキテクチャ最適化モジュール１２０は、模範データのコアセット及び過去の他の重要な例を記憶するためにＤＭＲ５０２を使用してもよい。

【0092】

クラス増分学習（ＣＩＬ）では、タスク固有ネットワークモジュール１１６を、一連のタスクでトレーニングしてもよく、各タスクには異なるクラスのセットを有する。タスク固有ネットワークモジュール１１６は、既に学習したクラスを忘れることなく新しいクラスを学習できるようにする必要がある。ＣＩＬの課題の一つは、破滅的忘却である。破滅的忘却は、機械学習モデルを新しいデータでトレーニングしたときに機械学習モデルが学習したものを忘れたときに発生する。破滅的忘却は、新しいデータが機械学習モデルを元々トレーニングしたデータと大きく異なる場合に発生することがある。破滅的忘却に対処する一つの方法は、予測空間の正則化を使用することである。予測空間の正則化は、タスク固有ネットワークモジュール１１６が既に学習したクラスの表現を捨て去ることなく新しいクラスを学習することを促してもよい。予測空間の正則化を、タスク固有ネットワークモジュール１１６が古いクラスに対する予測に変更を加えることに罰則を課すことによって行ってもよい。そのような罰則を、新しいデータの古いクラスに対するタスク固有ネットワークモジュール１１６の予測と古いデータ上古いクラスに対するタスク固有ネットワークモジュール１１６の予測とを比較する損失関数を使用することによって実現してもよい。モデル空間の正則化は、破滅的忘却に対処する別の方法である。モデル空間正則化は、重み１２６に変更を加えるタスク固有ネットワークモジュール１１６に罰則を課してもよい。そのような罰則を、新しいデータのタスク固有ネットワークモジュール１１６の重み１２６と古いデータの重み１２６とを比較する損失関数を使用することによって実現してもよい。

【0093】

クラス増加学習（ＣＩＬ）に関連して、知識蒸留（ＫＤ）は、古いモデルから新しいモデルへ知識を転送するために使用してもよい技術である。古いモデルを、以前のタスクからのデータでトレーニングしてもよく、一方、新しいモデルを、現在のタスクからのデータでトレーニングしてもよい。ＫＤを、古いモデルの予測に類似した予測を生成することを新しいモデルに強いることによって行ってもよい。そのような予測を、二つのモデルの予測を比較する損失関数を使用することによって実現してもよい。ＣＩＬでＫＤを使用する一つの方法は、例えば、新しいモデルの損失関数にＫＤ損失項を追加することによって以前のタスクからのデータを含むデータの全てについて、古いモデルから新しいモデルへの知識の蒸留を行うことである。

【0094】

図５を更に参照すると、アーキテクチャ最適化モジュール１２０は、先ず、バイレベルＤＡＲＴＳの最適化を使用して全てのタスクについてスーパーモデル５０４をトレーニングしてもよい。上述したＤＡＲＴＳの最適化プロセスは、損失関数を最小化するためにスーパーモデルをトレーニングすることとスーパーモデル５０４のパフォーマンスを向上させるためにアーキテクチャを更新することとを交互に行うことによってスーパーモデルの最適なアーキテクチャを探索することを含む。スーパーモデル５０４がトレーニングされると、アーキテクチャ最適化モジュール１２０は、スーパーモデル５０４から現在のタスク５０６に最適なアーキテクチャを推論してもよい。一態様において、アーキテクチャ最適化モジュール１２０は、現在のタスクで最高のパフォーマンスを有するアーキテクチャを選択することによって、このステップを実行してもよい。アーキテクチャ最適化モジュール１２０は、タスク固有ネットワークモジュール１１６の最適アーキテクチャ５０８を、コアセットを含む現在のタスクの全てのトレーニングデータに対して再トレーニングしてもよい。再トレーニングステップ５０８は、特定のタスクのアーキテクチャを微調整するのを助けてもよい。さらに、アーキテクチャ最適化モジュール１２０は、分類ヘッドの偏りを除去するためにクラス均衡微調整段階５１０を適用してもよい。一態様において、アーキテクチャ最適化モジュール１２０は、各クラスが予測される確率が等しくなるように分類ヘッドの重みを調整することによって、このステップを実行してもよい。最後に、アーキテクチャ最適化モジュール１２０は、前のタスクトレーニングデータを最もよく表すようにするために、ＤＭＲ５０２に記憶してもよいコアセットを更新してもよい。一態様において、アーキテクチャ最適化モジュール１２０は、事前タスクを最もよく表すトレーニングデータ１１３のサブセットを選択してもよい。一態様において、図５に示すステップを、全てのタスクが訪問されるまで繰り返してもよい。Ｉ－ＤＡＲＴＳは、逐次的に複数のタスクを実行するように単一のニューラルネットワークアーキテクチャをトレーニングするために使用することができる強力な増分学習アルゴリズムである。Ｉ－ＤＡＲＴＳは、様々な増分学習ベンチマークで最先端の結果を実現することを示した。

【0095】

図６は、本開示に記載の技術によるハイブリッドリプレイモジュール１１８の例示的な動作モードを示すフローチャートである。動作モード６００を、ハイブリッドリプレイモジュール１１８を実行する処理回路１４３を有する図１の計算システム１００に関して説明するが、動作モード６００を、本明細書で説明する機械学習システムの他の例に関する計算システムによって実行してもよい。

【0096】

モード動作６００において、処理回路１４３は、ハイブリッドリプレイモジュール１１８を実行する。ハイブリッドリプレイモジュール１１８は、ストリーミングデータの収集及びバッファリングを行ってもよい（６０２）。ストリーミングデータは、ラベル付けであってもラベル付けされていなくてもよい。ハイブリッドリプレイモジュール１１８は、バッファのデータサンプルに類似する新しいデータサンプルを生成するためにリプレイＧＡＮを使用してもよい（６０４）。これらの新しいデータサンプルは、ラベル付けであってもラベル付けされていなくてもよい。ハイブリッドリプレイモジュール１１８は、バッファのデータサンプル及び生成されたデータサンプルにラベル付けするために識別器／分類器を使用してもよい（６０６）。識別器／分類器は、リプレイメモリを更新するためのデータを選択的に記憶してもよい。ハイブリッドリプレイモジュール１１８は、選択及び記憶されたデータでリプレイメモリを更新してもよい（６０８）。全てのデータがハイブリッドリプレイモジュール１１８によって記憶されるわけではなく、最も有用で最もよく表すデータのみを記憶してもよい。次に、機械学習モデル１０６を、リプレイメモリのラベル付きデータでトレーニングしてもよい（６１０）。最後に、新しいデータに対する予測を行うために機械学習モデル１０６を使用してもよい（６１２）。

【0097】

図７は、本開示に記載される技術によるＩ－ＤＡＲＴＳアルゴリズムを実現するアーキテクチャ最適化モジュール１２０の例示的な動作モードを示すフローチャートである。動作モード７００を、アーキテクチャ最適化モジュール１２０を実行する処理回路１４３を有する図１の計算システム１００に関して説明するが、動作モード７００を、本明細書で説明する機械学習システムの他の例に関する計算システムによって実行してもよい。

【0098】

動作モード７００において、処理回路１４３は、アーキテクチャ最適化モジュール１２０を実行する。アーキテクチャ最適化モジュール１２０は、先ず、バイレベルＤＡＲＴＳ最適化（７０２）を使用して複数の候補タスクについてスーパーモデルをトレーニングしてもよい。スーパーモデルがトレーニングされると、アーキテクチャ最適化モジュール１２０は、スーパーモデルから現在のタスクの最適アーキテクチャを推論してもよい（７０４）。アーキテクチャ最適化モジュール１２０は、コアセットを含む現在のタスクの全てのトレーニングデータについてタスク固有ネットワークモジュール１１６の最適アーキテクチャを再トレーニングしてもよい（７０６）。次に、アーキテクチャ最適化モジュール１２０は、分類ヘッドの偏りを除去するためにクラスバランス微調整段階を適用してもよい（７０８）。最後に、アーキテクチャ最適化モジュール１２０は、以前のタスクトレーニングデータを最もよく表すようにするためにＤＭＲに記憶してもよいコアセットを更新してもよい（７１０）。

【0099】

図８は、例示的な技術の態様を実現してもよい分散データ処理システムの例示的な図である。分散データ処理システム８００は、例示的な実施形態の態様を実現してもよいコンピュータのネットワークを有してもよい。分散データ処理システム８００は、分散データ処理システム８００内で共に接続された様々なデバイス及びコンピュータ間の通信リンクを提供するために使用される媒体である少なくとも一つのネットワーク８０２を有してもよい。ネットワーク８０２は、有線通信リンク、無線通信リンク又は光ファイバケーブルのような接続を有してもよい。

【0100】

描かれた例では、サーバ８０４及びサーバ８０６は、記憶装置８０８と共にネットワーク８０２に接続されている。さらに、クライアント８１０，８１２及び８１４もネットワーク８０２に接続されている。これらのクライアント８１０，８１２及び８１４は、例えば、パーソナルコンピュータ、ネットワークコンピュータ等であってもよい。描かれている例では、サーバ８０４は、ライブストリーミング取引データ（ストリーミングデータ１２２）等のデータをクライアント８１０，８１２及び８１４に供給する。クライアント８１０，８１２及び８１４は、描かれている例では、サーバ８０４に対するクライアントである。分散データ処理システム８００は、図示しない追加のサーバ、クライアント及び他のデバイスを有してもよい。

【0101】

描かれた例では、分散データ処理システム８００は、互いに通信を行うためにプロトコルのトランスミッションコントロールプロトコル／インターネットプロトコル（ＴＣＰ／ＩＰ）スイートを使用するネットワーク及びゲートウェイの世界規模のコレクションを表すネットワーク８０２を有するインターネットである。インターネットの中心には、主要なノード又はホストコンピュータ間の高速データ通信回線のバックボーンがあり、それは、データ及びメッセージをルーティングする何千もの商業コンピュータシステム、政府コンピュータシステム、教育コンピュータシステム又は他のコンピュータシステムで構成されている。当然、分散データ処理システム８００は、例えば、イントラネット、ローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）等の多数の異なるタイプのネットワークを含むように実現してもよい。上述したように、図８は、本開示の異なる態様に対するアーキテクチャの限定ではなく、例示として意図されており、したがって、図８に示す特定の要素を、本開示の例示的な態様を実施してもよい環境に関して限定的であると考察すべきでない。

【0102】

図８に示すように、コンピューティングデバイスの一つ以上、例えば、サーバ８０４を、上述した一つ以上の態様に従ってハイブリッドリプレイモジュール１１８及びアーキテクチャ最適化モジュール１２０を実現するように具体的に構成してもよい。一つ以上の例示的な態様において、ハイブリッドリプレイモジュール１１８は、図３に関連して上述したような態様で動作してもよく、アーキテクチャ最適化モジュール１２０は、図５に関連して上述したような態様で動作してもよい。コンピューティングデバイスの構成は、例示的な実施形態に関連して本明細書で説明した動作の実行及び出力の生成を容易にするために、アプリケーション固有のハードウェア、ファームウェア等を提供することを有してもよい。コンピューティングデバイスの構成は、追加的に又は代替的に、例示的な実施形態に関連して本明細書で説明した動作の実行及び出力の生成を行うようにプロセッサを構成するソフトウェアアプリケーションをコンピューティングデバイスの一つ以上のハードウェアプロセッサに実行させるために、一つ以上のストレージデバイスに記憶されるとともにサーバ９０４のようなコンピューティングデバイスのメモリにロードされるソフトウェアアプリケーションを提供することを有してもよい。さらに、アプリケーション固有のハードウェア、ファームウェア、ハードウェアで実行されるソフトウェアアプリケーション等の任意の組合せを、例示的態様の精神及び範囲から逸脱することなく使用してもよい。

【0103】

本開示で説明する技術を、少なくとも部分的に、ハードウェア、ソフトウェア、ファームウェア又はその任意の組合せで実現してもよい。例えば、説明した技術の様々な態様を、一つ以上のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）又は任意の他の等価な集積論理回路若しくはディスクリート論理回路及びそのような構成要素の任意の組合せを含む一つ以上のプロセッサ内で実現してもよい。「プロセッサ」又は「処理回路」という用語は、一般に、単独の上述した論理回路若しくは他の論理回路と組み合わせた上述した論理回路又は他の同等の回路を指してもよい。ハードウェアを備える制御ユニットも、本開示の技術の一つ以上を実行してもよい。

【0104】

そのようなハードウェア、ソフトウェア及びファームウェアを、本開示に記載した様々な動作及び機能をサポートするために同一のデバイス内に又は別のデバイス内に実現してもよい。さらに、説明したユニット、モジュール又は構成要素のいずれかを、離散的ではあるが相互運用可能な論理デバイスとして一緒に又は別々に実現してもよい。異なる特徴をモジュール又はユニットとして描写することは、異なる機能的態様を強調することを意図しており、そのようなモジュール又はユニットを別のハードウェア又はソフトウェアコンポーネントによって実現する必要があることを必ずしも意味するものではない。それどころか、一つ以上のモジュール又はユニットに関連する機能を、別のハードウェア構成要素又はソフトウェア構成要素によって実行してもよい、又は、共通のハードウェア若しくはソフトウェアコンポーネント内に若しくは別個のハードウェア若しくはソフトウェアコンポーネント内に統合してもよい。

【0105】

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

【図8】

【手続補正書】

【提出日】2024-02-14

【手続補正1】

【補正対象書類名】明細書

【補正対象項目名】０１０５

【補正方法】変更

【補正の内容】

【0105】

本開示に記載した技術を、命令を含むコンピュータ可読記憶媒体のようなコンピュータ可読媒体において実現又はコード化してもよい。一つ以上のコンピュータ可読記憶媒体に埋め込まれた又はコード化された命令は、例えば、命令が実行されたときに、方法をプログラマブルプロセッサ又は他のプロセッサに実行させてもよい。コンピュータ可読記憶媒体は、ランダムアクセスメモリ（ＲＡＭ）、リードオンリーメモリ（ＲＯＭ）、プログラマブルリードオンリーメモリ（ＰＲＯＭ）、消去可能プログラマブルリードオンリーメモリ（ＥＰＲＯＭ）、電子消去可能プログラマブルリードオンリーメモリ（ＥＥＰＲＯＭ）、フラッシュメモリ、ハードディスク、ＣＤ－ＲＯＭ、フロッピーディスク、カセット、磁気媒体、光媒体又は他のコンピュータ可読媒体を含んでもよい。
本明細書に開示される発明は以下を含む。
［態様１］
記憶媒体と通信を行う処理回路であって、少なくとも第１のモジュール、第２のモジュール及び第３のモジュールを備える機械学習システムを実行するように構成され、前記機械学習システムは、一つ以上の機械学習モデルをトレーニングするように構成された、処理回路を備え、
前記第１のモジュールは、ストリーミング入力データに基づいて拡張入力データを生成するように構成され、
前記第２のモジュールは、前記拡張入力データに少なくとも部分的に基づいて特定のタスクを実行するように構成された機械学習モデルを備え、
前記第３のモジュールは、前記ストリーミング入力データの変化に基づいて前記一つ以上の機械学習モデルのネットワークアーキテクチャを適応させるように構成された、システム。
［態様２］
前記ストリーミング入力データは、前記ストリーミング入力データにおいて表現される複数のクラス間のクラス不均衡を有するストリーミング入力データを含む、態様１に記載のシステム。
［態様３］
前記拡張入力データは、少数クラスの一つ以上の拡張サンプルを含む、態様１に記載のシステム。
［態様４］
前記機械学習システムは、一つ以上の半教師あり増分学習法を使用して前記一つ以上の機械学習モデルをトレーニングするように構成された、態様１に記載のシステム。
［態様５］
フォーマット変換操作、メタデータ導出操作又はデータ関連付け操作のうちの少なくとも一つを実行することによって、前記ストリーミング入力データを処理するように構成された一つ以上のモジュールを更に備える、態様１に記載のシステム。
［態様６］
前記第１のモジュールは、ダイナミックメモリリポジトリ（ＤＭＲ）と、リプレイ生成人工知能（ＡＩ）アーキテクチャと、識別器／分類器と、を更に備え、
前記ＤＭＲは、一つ以上の代表的なデータサンプルを選択的に記憶するように構成され、
前記生成ＡＩアーキテクチャは、前記ＤＭＲに記憶された前記一つ以上の代表的なデータサンプルに類似する一つ以上の新しいデータサンプルを生成するように構成され、
前記識別器／分類器は、前記生成ＡＩアーキテクチャによって生成された前記一つ以上の新しいデータサンプルにおいて本物のデータと偽物のデータとを区別するように構成された、態様１に記載のシステム。
［態様７］
前記識別器／分類器は、前記ＤＭＲに記憶される前記一つ以上の新しいデータサンプルを選択するように更に構成された、態様６記載のシステム。
［態様８］
前記第３のモジュールは、トレーニングデータのセットと入力ストリーミングデータとのうちの少なくとも一方を使用して複数の候補タスクについてスーパーモデルをトレーニングするように更に構成され、トレーニングされた前記スーパーモデルに基づいて現在のタスクの最適アーキテクチャを推論するように構成された、態様１に記載のシステム。
［態様９］
前記第３のモジュールは、前記トレーニングデータに対する一つ以上のアーキテクチャの重みを最適化するように更に構成された、態様８記載のシステム。
［態様１０］
第１のモジュールを使用して、ストリーミング入力データに基づいて拡張入力データを生成することと、
機械学習モデルを備える第２のモジュールを使用して、前記拡張入力データに少なくとも部分的に基づいて特定のタスクを実行することと、
第３のモジュールを使用して、前記ストリーミング入力データの変化に基づいて一つ以上の機械学習モデルのネットワークアーキテクチャを適応させることと、
を備える方法。
［態様１１］
前記ストリーミング入力データは、前記ストリーミング入力データにおいて表現される複数のクラス間のクラス不均衡を有するストリーミング入力データを含む、態様１０に記載の方法。
［態様１２］
前記拡張入力データは、少数クラスの一つ以上の拡張サンプルを含む、態様１０に記載の方法。
［態様１３］
少なくとも前記第１のモジュール、前記第２のモジュール及び前記第３のモジュールを備える機械学習システムは、一つ以上の半教師あり増分学習法を使用して前記一つ以上の機械学習モデルをトレーニングするように構成された、態様１０に記載の方法。
［態様１４］
一つ以上のモジュールを使用してフォーマット変換操作、メタデータ導出操作又はデータ関連付け操作のうちの少なくとも一つを実行することによって、前記ストリーミング入力データを処理することを更に備える、態様１０に記載の方法。
［態様１５］
ダイナミックメモリリポジトリ（ＤＭＲ）に一つ以上の代表的なデータサンプルを選択的に記憶させることと、
生成的人工知能（ＡＩ）アーキテクチャを使用して、前記ＤＭＲに記憶された前記一つ以上の代表的なデータサンプルに類似する一つ以上の新しいデータサンプルを生成することと、
識別器／分類器を使用して、前記生成ＡＩアーキテクチャによって生成された前記一つ以上の新しいデータサンプルにおいて本物のデータと偽のデータを区別することと、
を更に備える、態様１０に記載の方法。
［態様１６］
前記識別器／分類器を使用して、前記ＤＭＲに記憶される一つ以上の新しいデータサンプルを選択することを更に備える、態様１５に記載の方法。
［態様１７］
前記第３のモジュールを使用して、トレーニングデータのセットと入力ストリーミングデータとのうちの少なくとも一方を使用して複数の候補タスクについてスーパーモデルをトレーニングすることと、
トレーニングされた前記スーパーモデルに基づいて現在のタスクの最適アーキテクチャを推論することと、
を更に備える、態様１０に記載の方法。
［態様１８］
第３のモジュールを使用して、前記トレーニングデータに対する一つ以上のアーキテクチャの重みを最適化することを更に備える、態様１７に記載の方法。
［態様１９］
エンコードされた命令を有する非一時的なコンピュータ可読記憶媒体であって、前記命令は、
第１のモジュールを使用して、ストリーミング入力データに基づいて拡張入力データを生成することと、
機械学習モデルを備える第２のモジュールを使用して、前記拡張入力データに少なくとも部分的に基づいて特定のタスクを実行することと、
第３のモジュールを使用して、前記ストリーミング入力データの変化に基づいて一つ以上の機械学習モデルのネットワークアーキテクチャを適応させることと、
を処理回路に行わせるように構成された、非一時的なコンピュータ可読記憶媒体。
［態様２０］
前記ストリーミング入力データは、前記ストリーミング入力データにおいて表現される複数のクラス間のクラス不均衡を有するストリーミング入力データを含む、態様１９に記載の非一時的なコンピュータ可読記憶媒体。

【手続補正2】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

【請求項2】

【請求項3】

前記拡張入力データは、少数クラスの一つ以上の拡張サンプルを含む、請求項１に記載のシステム。

【請求項4】

【請求項5】

【請求項6】

【請求項7】

【請求項8】

【請求項9】

【請求項10】

第１のモジュールを使用して、ストリーミング入力データに基づいて拡張入力データを生成することと、
機械学習モデルを備える第２のモジュールを使用して、前記拡張入力データに少なくとも部分的に基づいて特定のタスクを実行することと、
第３のモジュールを使用して、前記ストリーミング入力データの変化に基づいて一つ以上の機械学習モデルのネットワークアーキテクチャを適応させることと、
を備える方法。

【請求項11】

【請求項12】

前記拡張入力データは、少数クラスの一つ以上の拡張サンプルを含む、請求項１０に記載の方法。

【請求項13】

少なくとも前記第１のモジュール、前記第２のモジュール及び前記第３のモジュールを備える機械学習システムは、一つ以上の半教師あり増分学習法を使用して前記一つ以上の機械学習モデルをトレーニングするように構成された、請求項１０に記載の方法。

【請求項14】

【請求項15】

【請求項16】

【請求項17】

【請求項18】

【請求項19】

エンコードされた命令を有する非一時的なコンピュータ可読記憶媒体であって、前記命令は、
第１のモジュールを使用して、ストリーミング入力データに基づいて拡張入力データを生成することと、
機械学習モデルを備える第２のモジュールを使用して、前記拡張入力データに少なくとも部分的に基づいて特定のタスクを実行することと、
第３のモジュールを使用して、前記ストリーミング入力データの変化に基づいて一つ以上の機械学習モデルのネットワークアーキテクチャを適応させることと、
を処理回路に行わせるように構成された、非一時的なコンピュータ可読記憶媒体。

【請求項20】

【外国語明細書】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版