IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ペプシコ・インクの特許一覧

特表2024-528413機械学習モデル及び類似度正則化を使用する異常検出
<>
  • 特表-機械学習モデル及び類似度正則化を使用する異常検出 図1
  • 特表-機械学習モデル及び類似度正則化を使用する異常検出 図2
  • 特表-機械学習モデル及び類似度正則化を使用する異常検出 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-07-30
(54)【発明の名称】機械学習モデル及び類似度正則化を使用する異常検出
(51)【国際特許分類】
   G06F 16/903 20190101AFI20240723BHJP
【FI】
G06F16/903
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023577472
(86)(22)【出願日】2022-06-14
(85)【翻訳文提出日】2023-12-14
(86)【国際出願番号】 US2022033403
(87)【国際公開番号】W WO2022266078
(87)【国際公開日】2022-12-22
(31)【優先権主張番号】17/348,294
(32)【優先日】2021-06-15
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.JAVASCRIPT
(71)【出願人】
【識別番号】591235706
【氏名又は名称】ペプシコ・インク
(74)【代理人】
【識別番号】100106518
【弁理士】
【氏名又は名称】松谷 道子
(74)【代理人】
【識別番号】100131808
【弁理士】
【氏名又は名称】柳橋 泰雄
(72)【発明者】
【氏名】イマス,マイケル
(72)【発明者】
【氏名】サックス,ライアン
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA10
5B175HB03
(57)【要約】
機械学習モデル(MLM)及び類似度正則化を使用する異常検出のための実施形態が本明細書で開示される。一実施形態は、第1の製品、第2の製品、及びターゲット製品に関するデータを取得することによって動作する。データは、ターゲット製品の疎データ点集合を含む。次に、ターゲット製品と第1の製品及び第2の製品との間の類似度スコアが計算され得る。本実施形態は更に、正則化ペナルティを使用してターゲット製品に関連付けられたターゲットMLMを生成することによって動作する。正則化ペナルティは、ターゲットMLMのターゲット係数集合と、第1の製品及び第2の製品にそれぞれ関連付けられた第1のMLM及び第2のMLMの係数との間の類似度スコア及び距離に基づく。次いで、本実施形態は、ターゲット製品に関連付けられた特徴ベクトルをターゲットMLMに供給することによって、ターゲット製品に関連付けられた異常を検出し得る。
【特許請求の範囲】
【請求項1】
機械学習モデル及び類似度正則化を使用する異常検出のための方法であって、
少なくとも1つのプロセッサによって、第1の製品、第2の製品、及びターゲット製品を含む複数の製品の複数のデータ点をメモリに記憶することであって、前記複数のデータ点は、前記ターゲット製品の疎なデータ点集合を含む、記憶することと、
前記少なくとも1つのプロセッサによって、前記第1の製品と前記ターゲット製品との間の第1の類似度スコア、及び前記第2の製品と前記ターゲット製品との間の第2の類似度スコアを計算することと、
前記少なくとも1つのプロセッサによって、前記疎なデータ点集合に応答して、正則化ペナルティを使用して前記ターゲット製品に関連付けられたターゲット機械学習(ML)モデルを生成することであって、前記正則化ペナルティは、
前記第1の類似度スコア及び前記第2の類似度スコアと、
前記第1の製品に関連付けられた第1のMLモデルの第1の係数集合と、前記ターゲットMLモデルのターゲット係数集合との間の第1の距離と、
前記第2の製品に関連付けられた第2のMLモデルの第2の係数集合と前記ターゲット係数集合との間の第2の距離と、に基づく、生成することと、
前記ターゲット製品に関連付けられた特徴ベクトルを前記ターゲットMLモデルに供給することによって、前記ターゲット製品の異常を検出することと、を含む、方法。
【請求項2】
前記第1の製品、前記第2の製品、及び前記ターゲット製品は、民生品(CPG)である、請求項1に記載の方法。
【請求項3】
前記第1の製品、前記第2の製品、及び前記ターゲット製品は、医療デバイスであり、前記異常は、前記ターゲット製品の故障である、請求項1に記載の方法。
【請求項4】
前記第1の類似度スコアを計算することは、
前記少なくとも1つのプロセッサによって、前記第1の製品の埋め込みと前記ターゲット製品の埋め込みとの間の第1のコサイン類似度を計算することと、
前記第1のコサイン類似度を類似度閾値と比較することと、
前記第1のコサイン類似度が前記類似度閾値を超えることに応答して、前記第1の製品と前記ターゲット製品とが類似であると判定し、かつ前記第1の類似度スコアを1に設定することと、を含む、請求項1に記載の方法。
【請求項5】
前記第2の類似度スコアを計算することは、
前記少なくとも1つのプロセッサによって、前記第2の製品の埋め込みと前記ターゲット製品の前記埋め込みとの間の第2のコサイン類似度を計算することと、
前記第2のコサイン類似度を前記類似度閾値と比較することと、
前記第2のコサイン類似度が前記類似度閾値を下回ることに応答して、前記第2の製品と前記ターゲット製品とが非類似であると判定し、かつ前記第2の類似度スコアをゼロに設定することと、を含む、請求項4に記載の方法。
【請求項6】
前記正則化ペナルティは、
少なくとも、前記第1の距離に関連付けられた第1の対比損失関数と、前記第2の距離に関連付けられた第2の対比損失関数との和を含む、請求項1に記載の方法。
【請求項7】
前記第1の対比損失関数は、
【数1】
の製品を含み、式中ZT,1は、前記第1の製品と前記ターゲット製品との間の前記第1の類似度スコアであり、式中
【数2】
は、前記第1の距離である、請求項6に記載の方法。
【請求項8】
前記第2の対比損失関数は、
【数3】
の製品を含み、式中ZT,2は、前記第2の製品と前記ターゲット製品との間の前記第2の類似度スコアであり、
【数4】
は、前記第2の距離であり、mは、最小マージンパラメータである、請求項6に記載の方法。
【請求項9】
機械学習モデル及び類似度正則化を使用する異常検出のためのシステムであって、
メモリと、
前記メモリに連結された少なくとも1つのプロセッサと、を備え、前記少なくとも1つのプロセッサが、
第1の製品、第2の製品、及びターゲット製品を含む複数の製品の複数のデータ点を前記メモリに記憶することであって、前記複数のデータ点は、前記ターゲット製品の疎なデータ点集合を含む、記憶することと、
前記第1の製品と前記ターゲット製品との間の第1の類似度スコアと、前記第2の製品と前記ターゲット製品との間の第2の類似度スコアとを計算することと、
前記疎なデータ点集合に応答して、正則化ペナルティを使用して前記ターゲット製品に関連付けられたターゲット機械学習(ML)モデルを生成することであって、前記正則化ペナルティは、
前記第1の類似度スコア及び前記第2の類似度スコアと、
前記第1の製品に関連付けられた第1のMLモデルの第1の係数集合と、前記ターゲットMLモデルのターゲット係数集合との間の第1の距離と、
前記第2の製品に関連付けられた第2のMLモデルの第2の係数集合と前記ターゲット係数集合との間の第2の距離と、に基づく、生成することと、
前記ターゲット製品に関連付けられた特徴ベクトルを前記ターゲットMLモデルに供給することによって、前記ターゲット製品の異常を検出することと、を行うように構成されている、システム。
【請求項10】
前記第1の類似度スコアを計算するために、前記少なくとも1つのプロセッサが、
前記第1の製品の埋め込みと前記ターゲット製品の埋め込みとの間の第1のコサイン類似度を計算することと、
前記第1のコサイン類似度を類似度閾値と比較することと、
前記第1のコサイン類似度が前記類似度閾値を超えることに応答して、前記第1の製品と前記ターゲット製品とが類似であると判定し、かつ前記第1の類似度スコアを1に設定することと、を行うように更に構成されている、請求項9に記載のシステム。
【請求項11】
前記第2の類似度スコアを計算するために、前記少なくとも1つのプロセッサが、
前記第2の製品の埋め込みと前記ターゲット製品の前記埋め込みとの間の第2のコサイン類似度を計算することと、
前記第2のコサイン類似度を前記類似度閾値と比較することと、
前記第2のコサイン類似度が前記類似度閾値を下回ることに応答して、前記第2の製品と前記ターゲット製品とが非類似であると判定し、かつ前記第2の類似度スコアをゼロに設定することと、を行うように更に構成されている、請求項10に記載の方法。
【請求項12】
前記正則化ペナルティは、
少なくとも、前記第1の距離に関連付けられた第1の対比損失関数と、前記第2の距離に関連付けられた第2の対比損失関数との和を含む、請求項9に記載のシステム。
【請求項13】
前記第1の対比損失関数は、
【数5】
の製品を含み、式中ZT,1は、前記第1の製品と前記ターゲット製品との間の前記第1の類似度スコアであり、式中
【数6】
は、前記第1の距離である、請求項12に記載のシステム。
【請求項14】
前記第2の対比損失関数は
【数7】
の製品を含み、式中ZT,2は、前記第2の製品と前記ターゲット製品との間の前記第2の類似度スコアであり、
【数8】
は、前記第2の距離であり、mは、最小マージンパラメータである、請求項12に記載のシステム。
【請求項15】
機械学習モデル及び類似度正則化を使用する異常検出のための命令を記憶した非一時的コンピュータ可読媒体であって、前記命令は、少なくとも1つのコンピューティングデバイスによって実行されると、前記少なくとも1つのコンピューティングデバイスに、
第1の製品、第2の製品、及びターゲット製品を含む複数の製品の複数のデータ点をメモリに記憶することであって、前記複数のデータ点は、前記ターゲット製品の疎なデータ点集合を含む、記憶することと、
前記第1の製品と前記ターゲット製品との間の第1の類似度スコア、及び前記第2の製品と前記ターゲット製品との間の第2の類似度スコアを計算することと、
前記疎なデータ点集合に応答して、正則化ペナルティを使用して前記ターゲット製品に関連付けられたターゲット機械学習(ML)モデルを生成することであって、前記正則化ペナルティは、
前記第1の類似度スコア及び前記第2の類似度スコアと、
前記第1の製品に関連付けられた第1のMLモデルの第1の係数集合と、前記ターゲットMLモデルのターゲット係数集合との間の第1の距離と、
前記第2の製品に関連付けられた第2のMLモデルの第2の係数集合と前記ターゲット係数集合との間の第2の距離と、に基づく、生成することと、
前記ターゲット製品に関連付けられた特徴ベクトルを前記ターゲットMLモデルに供給することによって、前記ターゲット製品の異常を検出することと、を含む動作を行わせる、非一時的コンピュータ可読媒体。
【請求項16】
前記第1の類似度スコアを計算することは、
前記第1の製品の埋め込みと前記ターゲット製品の埋め込みとの間の第1のコサイン類似度を計算することと、
前記第1のコサイン類似度を類似度閾値と比較することと、
前記第1のコサイン類似度が前記類似度閾値を超えることに応答して、前記第1の製品と前記ターゲット製品とが類似であると判定し、かつ前記第1の類似度スコアを1に設定することと、を更に含む、請求項15に記載の非一時的コンピュータ可読媒体。
【請求項17】
前記第2の類似度スコアを計算することは、
前記第2の製品の埋め込みと前記ターゲット製品の前記埋め込みとの間の第2のコサイン類似度を計算することと、
前記第2のコサイン類似度を前記類似度閾値と比較することと、
前記第2のコサイン類似度が前記類似度閾値を下回ることに応答して、前記第2の製品と前記ターゲット製品とが非類似であると判定し、かつ前記第2の類似度スコアをゼロに設定することと、を更に含む、請求項16に記載の非一時的コンピュータ可読媒体。
【請求項18】
前記正則化ペナルティは、
少なくとも、前記第1の距離に関連付けられた第1の対比損失関数と、前記第2の距離に関連付けられた第2の対比損失関数との和を含む、請求項15に記載の非一時的コンピュータ可読媒体。
【請求項19】
前記第1の対比損失関数は、
【数9】
の製品を含み、式中ZT,1は、前記第1の製品と前記ターゲット製品との間の前記第1の類似度スコアであり、式中
【数10】
は、前記第1の距離である、請求項18に記載の非一時的コンピュータ可読媒体。
【請求項20】
前記第2の対比損失関数は、
【数11】
の製品を含み、式中ZT,2は、前記第2の製品と前記ターゲット製品との間の前記第2の類似度スコアであり、
【数12】
は、前記第2の距離であり、mは、最小マージンパラメータである、請求項18に記載の非一時的コンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本出願は、2021年6月15日出願された米国特許出願第17/348,294号の優先権を主張するものであり、当該出願は、参照によりその全体が本明細書に組み込まれる。
【背景技術】
【0002】
機械学習モデルは、産業上及び技術上の問題を解決又は低減するために頻繁に使用される。例えば、機械学習モデルは、異常検出を行い、そのため、データ集合内の予期しない(例えば、疑わしい)アイテム又はイベントを識別するために頻繁に使用される。異常検出及び/又は他の動作のための機械学習モデルを有意義に訓練するために、多くの場合、大きい(例えば、稠密な)訓練データ点集合を有することが必要である。何らかの理由で訓練データ点集合が疎である場合、機械学習モデルの性能が損なわれる場合がある。例えば、異常検出の場合、疎な訓練データ点集合は、機械学習モデルが予期しない(例えば、疑わしい)アイテム/イベント(例えば、偽陰性)を見逃すこと、及び/又は機械学習モデルが予期しないときにルーチンアイテム/イベント(例えば、偽陽性)に不適切にフラグ付けすることをもたらし得る。
【図面の簡単な説明】
【0003】
添付の図面は、本明細書に組み込まれ、本明細書の一部を形成する。
図1】1つ以上の実施形態による、機械学習モデル及び類似度正則化を使用する異常検出のためのシステムのブロック図を示す。
図2】1つ以上の実施形態による、機械学習モデル及び類似度正則化を使用する異常検出のためのフローチャートを示す。
図3】様々な実施形態を実装するために有用な例示的なコンピュータシステムを示す。
【0004】
図面では、同様の参照番号は、概して、同一又は類似の要素を示す。加えて、概して、参照番号の左端の桁は、その参照番号が最初に現れる図面を識別する。
【発明を実施するための形態】
【0005】
本明細書では、機械学習モデル及び類似度正則化を使用する異常検出のためのシステム、装置、デバイス、方法及び/若しくはコンピュータプログラム製品の実施形態、並びに/又はそれらの組み合わせ及び部分組み合わせが提供される。1つ以上の実施形態は、複数のエンティティ(例えば、製品、デバイスなど)のデータ点を記憶することを含み、データ点は、ターゲットエンティティ(例えば、ターゲット製品)の疎なデータ点集合を含む。エンティティに対して1つ以上の機械学習モデルが生成され得る。ターゲットエンティティ(疎なデータ点集合を有する)に関連付けられた機械学習モデルの係数を判定するために、ターゲットエンティティと類似である他のエンティティに関連付けられた他のモデルの係数が活用され得る。これは、類似度正則化と称される場合がある。類似度正則化は、疎なデータ集合を用いて訓練された機械学習モデルを使用する異常検出から生じることがある偽陰性及び偽陽性を排除又は少なくとも軽減し得る。次いで、生成されたモデルは、様々な産業及び技術分野において異常検出を行うために使用され得る。
【0006】
例えば、異常検出は、医療デバイスなどのデバイスにおける潜在的な故障検出に対応してもよい。機械学習モデルへの入力は、デバイスからのセンサ読取り値に基づく特徴ベクトルであってもよく、機械学習モデルの出力は、ある時間ウィンドウ内でデバイスが故障する確率であってもよい。デバイスが新しい場合、機械学習モデルを訓練するために、疎な訓練データ点集合のみが利用可能であり得る。しかしながら、デバイスが、複数年にわたって利用可能であった他のデバイスと類似である(及び、そのため、これらの類似デバイスに対して稠密な訓練データ点が存在する)場合、類似度正則化が、機械学習モデルを訓練するために使用され得る(以下で考察される)。
【0007】
別の実施例として、異常検出は、クレジットカード取引における不正検出に対応してもよい。クレジットカード会社は、実際の取引が不正である可能性を推定する必要があり得る。機械学習モデルへの入力は、取引の1つ以上の属性(例えば、価格、郵便番号、時間、店舗のタイプ、アイテムのタイプ、アイテムの数など)であってもよく、機械学習モデルの出力は、取引が不正である確率であってもよい。取引の消費者が、疎な訓練データ点集合を有する消費者群に属し、この疎な訓練データ点集合のみが機械学習モデルを訓練するために使用される場合、機械学習モデルの性能が損なわれる場合がある(例えば、詐欺の偽陽性)。しかしながら、1つ以上の類似の消費者群が稠密な訓練データ点集合を有する場合、機械学習モデルを訓練するために類似度正則化が使用され(以下で考察される)、偽陽性を低減し得る。
【0008】
民生品(consumer packaged goods、CPG)の文脈では、製造プロセス(例えば、欠陥のある製品ロットの生産)又はビジネス若しくは経済環境(例えば、競争、販売、市場占有率、マーケティングの不利な結果、又は世界的なウイルスパンデミックなどの外的打撃)における異常を検出することが有利であり得る。具体的な実施例として、トルティーヤチップの確立された市場が存在し、次いで、その製品が消費者によって非常に好まれる市場への新規参入者が到着すると仮定する。強力な競合ブランドの導入は、既存のブランド/製品の価格決定力及び市場シェアダイナミクスに異常な方法で影響を及ぼす。これらの影響は、様々な計量経済学モデルによって捕捉され得るが、これらのモデルは、類似度正則化を使用して(例えば、類似製品に関連付けられた稠密な訓練データ点集合を使用して)増強することができる。
【0009】
図1は、1つ以上の実施形態による、機械学習モデル及び類似度正則化を使用する異常検出のためのシステム100を示している。システム100は、データセットリポジトリ110、モデル生成器150、及び訓練された機械学習モデルリポジトリ170を含む複数の構成要素を有し得る。これらの構成要素の各々は、図3を参照して以下で考察されるコンピュータシステム300などのコンピュータシステム上に実装され得る。構成要素のうちの2つ以上(例えば、データセットリポジトリ110及びモデル生成器150)は、通信リンク120によって接続され得る。通信リンク120は、イーサネット接続、セルラー接続、赤外線接続、光ファイバ接続、ブルートゥース(登録商標)接続などに対応し得る。要するに、通信リンク120は、任意のタイプの有線接続及び/又は無線接続に対応し得る。
【0010】
1つ以上の実施形態では、データセットリポジトリ110は、データセットD 115を記憶する。データセットD 115は、複数のエンティティの複数のデータ点を含み得る。各データ点は、エンティティに対応し得る。データセットD 115には、K個のエンティティ(K≧2)が存在し、そのため、K個のデータ点集合が存在し得る。異なるエンティティは、データセットD 115内に異なる数のデータ点を有し得る。例えば、いくつかのエンティティは、多くのデータ点(すなわち、稠密なデータ点集合)を有してもよく、他のエンティティは、より少ないデータ点(すなわち、疎なデータ点集合)を有してもよい。
【0011】
各データ点は、特徴ベクトル
【0012】
【数1】
及び出力yを含み得る。D(X,Y)又は単にDは、エンティティjに対応するデータ点集合(データセットD115内の)を表す。それにより、|D|は、エンティティjに対応するデータ点集合内のデータ点の数を表す。
【0013】
1つ以上の実施形態では、K個のエンティティの各々は、例えば、デバイス(例えば、医療デバイス)又は民生品などの製品であってもよい。そのようなシナリオでは、特徴ベクトルは、製品の属性又は更には製品によって取得されたセンサ読取り値に対応してもよく、出力は、製品が故障する確率であってもよい。追加的又は代替的に、K個のエンティティの各々は、類似の社会的経済的特性又は支出パターンを共有する消費者の群又はクラスタであってもよい。そのようなシナリオでは、特徴ベクトルは、群からの消費者を含むとされるクレジットカード取引などの取引の属性であってもよく、出力は、取引が不正である確率であってもよい。
【0014】
1つ以上の実施形態では、モデル生成器150は、複数のエンティティのための教師あり機械学習モデルを生成するように構成されている。データセットD 115内のデータ点は、モデルを訓練するために使用されてもよく、モデル生成器150は、モデルを生成するためのデータ点の一部又は全部を記憶するためのメモリ152を含み得る。例えば、エンティティjに対して生成されたモデルMは、Mj(X)=Y+εの形式を有し得、式中εは誤差である。
【0015】
1つ以上の実施形態では、教師あり機械学習モデルを生成することは、係数集合
【0016】
【数2】
を機械学習モデルの訓練データに適合させることを含む。1つ以上の実施形態では、モデル生成器150は、エンティティjに関連付けられたモデルの係数集合を、エンティティjと類似である他のエンティティに関連付けられた他のモデルの係数に基づいて判定する(図2を参照して以下で考察される)。
【0017】
1つ以上の実施形態では、訓練された機械学習モデルリポジトリ170は、モデル生成器150によって生成された機械学習モデルを記憶する。図1に示すように、訓練された機械学習モデルリポジトリ170は、機械学習モデル1 172A、機械学習モデルK 172Kなどを記憶し得る。機械学習モデル172の各々は、エンティティのうちの1つに対応し得る。機械学習モデル172の各々は、入力特徴ベクトルに基づいて出力を生成するために係数集合を含み、かつ利用し得る。例えば、機械学習モデル1 172Aは、係数集合1 175Aを含んでもよく、機械学習モデルK 172Kは、係数集合K 175Kを含んでもよい。以下で考察するように、エンティティ及び特徴ベクトル内の特徴に応じて、機械学習モデル172のうちの1つ以上は、対応するエンティティ(例えば、デバイス)の故障を検出すること、不正取引を検出すること、ネットワークセキュリティ違反を検出することなどを含む、異常検出のために使用され得る。
【0018】
図2は、1つ以上の実施形態による、機械学習モデル及び類似度正則化を使用する異常検出のための方法200のフローチャートである。方法200は、ハードウェア(例えば、回路、専用論理、プログラマブル論理、マイクロコードなど)、ソフトウェア(例えば、処理デバイス上で実行する命令)、又はそれらの組み合わせを含むことができる処理論理によって行うことができる。本明細書に提供される開示を実施するために全ての工程が必要とされなくてもよいことが理解されるべきである。更に、当業者に理解されるように、工程のうちのいくつかは、同時に行われもよく、又は図2に示されるものとは異なる順序で行われてもよい。
【0019】
方法200は、図1を参照して記載されることになる。しかしながら、方法200は、その例示的な実施形態に限定されない。
【0020】
205において、モデル生成器150は、データセットD115を取得し、記憶し得る。データセット115の一部又は全部は、通信リンク120を介してデータセットリポジトリ110から取得され得る。データセットD115は、複数のデータ点集合を含み得、各データ点集合はエンティティに対応する。上述したように、データセットDには、K個のエンティティ(K≧2)が存在し、そのため、K個のデータ点集合が存在し得る。各データ点は、特徴ベクトル
【0021】
【数3】
及び出力yを含み得る。D(X,Y)又は単にDは、エンティティjに対応するデータ点集合(データセットD内の)を表す。それにより、|D|は、エンティティjに対応するデータ点集合内のデータ点の数を表す。
【0022】
1つ以上の実施形態では、複数のエンティティのうちの少なくとも1つである、ターゲットエンティティTは、疎なデータ点集合を有する。D(X,Y)又は単にDは、ターゲットエンティティTに属するデータ点集合を表す。D(X,Y)は、D内のデータ点の数(すなわち、|D|)がD内の各データ点の特徴ベクトル内の特徴の数未満であり得るため、疎集合と称される場合がある。1つ以上の実施形態では、この疎なデータ点集合は意図的である。例えば、データセットリポジトリ110は、ターゲットエンティティTの追加のデータ点を有し得るが、これらの追加のデータ点は、通信リンク120上の帯域幅消費を低減するために、モデル生成器150に送信されない。追加的又は代替的に、これらの追加のデータ点は、データ点を記憶するためにモデル生成器150内で必要とされるメモリ空間を低減するために、モデル生成器150に送信されない。
【0023】
1つ以上の実施形態では、ターゲットエンティティTの疎なデータ点集合は、ストレージ破損及び/又はデータ盗難の結果である。例えば、過去のある時点において、データセットリポジトリ110は、ターゲットエンティティTの追加のデータ点を記憶していた可能性があるが、これらのデータ点は、データセットリポジトリが損傷又は破損した(例えば、ファイル破損、ハードドライブ故障など)ために失われたか、又はデータ点が偶発的に又は意図的に削除されたためである。追加的又は代替的に、これらの追加のデータ点は、ハッカーによるデータセットリポジトリ110のセキュリティ侵害中に盗難された可能性がある。
【0024】
1つ以上の実施形態では、ターゲットエンティティTの疎なデータ点集合は、加速サンプリング方式の結果である。そのような方式では、より少ないサンプルデータ点が取られるので、サンプリングを実行するために必要とされる時間はより短くなり得る。これは、サンプルの数とサンプル集合を取得する時間との間のトレードオフである。追加的又は代替的に、疎なデータ点集合は、ターゲットエンティティTが市場の新製品である結果であってもよく、そのため、ターゲットエンティティTのデータ点を取得する時間がほとんどなく、及び/又はターゲットエンティティTに関する顧客フィードバックがほとんどない。
【0025】
210において、モデル生成器150は、ターゲットエンティティTと他のエンティティの各々との間の類似度スコアを計算し得る。1つ以上の実施形態では、2つのエンティティ間の類似度スコアは、各エンティティの埋め込みに基づき、埋め込みは、エンティティを記述する/表現する数のベクトルである。例えば、
【0026】
【数4】
がそれぞれターゲットエンティティT及びエンティティjのための埋め込みである場合、これらの2つの埋め込み間のコサイン類似度は、以下のように計算され得る。
【0027】
【数5】
【0028】
1つ以上の実施形態では、次いで、コサイン類似度が類似度閾値θと比較され得る。コサイン類似度が閾値を超える場合、ターゲットエンティティT及びエンティティjは、類似であると見なされてもよく、ターゲットエンティティ及びエンティティjの類似度スコアZT,jは、1に設定される。コサイン類似度が類似度閾値以下である場合、ターゲットエンティティT及びエンティティjは、非類似であると見なされてもよく、ターゲットエンティティ及びエンティティjの類似度スコアZT,jは、ゼロに設定される。数学的に以下のように表現される。
【0029】
【数6】
【0030】
215において、モデル生成器150は、ターゲットエンティティTを含むK個のエンティティの各々の教師あり機械学習モデルMを生成し得る。エンティティjの機械学習モデルは、Mと称される場合がある。同様に、ターゲットエンティティTの機械学習モデルは、Mと称される場合がある。Dは、Mの訓練データとして使用され得る。同様に、Dは、Mの訓練データとして使用され得る。
【0031】
本開示の利益を有する当業者には、教師あり機械学習モデルを生成することが、係数集合
【0032】
【数7】
を訓練データに適合させることを含むことが理解されよう。
【0033】
【数8】
は、Mの係数集合(例えば、ベクトル)を表す。同様に、
【0034】
【数9】
は、Mの係数集合(例えば、ベクトル)を表す。M及びターゲットエンティティTとの関係により、
【0035】
【数10】
ターゲット係数集合(例えば、ベクトル)と称される場合がある。
【0036】
1つ以上の実施形態では、機械学習モデルの生成中の適合手順は、係数
【0037】
【数11】
の選択を通して、目的損失関数を最小化すること(又は少なくとも最小化しようと試みること)を含む。目的関数は、正則化ペナルティPを含み得る。例えば、Mに対する目的損失関数は、正則化ペナルティPを有し得、以下のように表現され得る。
【0038】
【数12】
【0039】
同様に、Mjの目的損失関数は、正則化ペナルティPを有し得、以下のように表現され得る。
【0040】
【数13】
【0041】
従来の正則化ペナルティは、
【0042】
【数14】
をゼロに向かって絞ることによって、過剰適合を防止しようと試み得る。1つ以上の実施形態では、係数をゼロに向かって絞るのではなく、正則化ペナルティ(例えば、P)は、類似するエンティティの係数を互いに近くなるように絞り得る。これは、類似度正則化と称される場合がある。エンティティj及びターゲットエンティティTが類似している場合にM及びMが同様に挙動することが妥当なプライアである場合、M(例えば
【0043】
【数15】
)の係数にM(例えば
【0044】
【数16】
)の係数によって影響を及ぼすことも妥当である。類似度正則化は、ターゲットエンティティTの疎なデータ点集合に応答して使用され得る。
【0045】
それにより、1つ以上の実施形態では、Mの目的損失関数における正則化ペナルティPは、以下のように表現され得る。
【0046】
【数17】
ここで
【0047】
【数18】
ここで
【0048】
【数19】
は、対比損失関数であり、Zt,iは、エンティティTと210(上記)からのエンティティiとの間の類似度スコアであり、ここで
【0049】
【数20】
は、ベクトル
【0050】
【数21】
との間の距離(例えば
【0051】
【数22】
)であり、mは、非類似エンティティ係数ベクトルが互いに持つべき最小マージンを記述する最小マージンパラメータ(m>0)である。言い換えれば、ターゲットエンティティT及びエンティティiが実際に非類似である場合、
【0052】
【数23】
は、少なくともmの距離だけ分離されるべきである。
【0053】
【数24】
を最小化にするために、Zt,i=1である場合、
【0054】
【数25】
を可能な限りゼロに近づけるべきである。対照的に、Zt,i=0である場合、
【0055】
【数26】
は、
【0056】
【数27】
を最小化するために、m以上であるべきである。これは、M(例えば、
【0057】
【数28】
)、及びM(例えば、
【0058】
【数29】
)の係数を、ターゲットエンティティT及びエンティティiが類似である場合に類似であり、そうでない場合に非類似であるように、数学的に奨励する。
【0059】
それにより、Mの目的損失関数は、次のように表現され得る。
【0060】
【数30】
【0061】
この正則化ペナルティ(対比損失関数の和を含む)を使用することによって、ターゲットエンティティTの疎なデータ点集合のみが存在する場合であっても、高品質の係数集合(例えば、
【0062】
【数31】
)を達成することが依然として可能であり得る。この正則化ペナルティ(対比損失関数の和を含む)は、実質的に、ターゲットエンティティのデータ点の疎さを克服する(又は少なくとも軽減する)ために、類似エンティティ及び非類似エンティティの全体的な稠密なデータ点集合を活用する。上記で考察したように、この正則化ペナルティの使用は、類似度正則化と称される場合がある。
【0063】
それにより、ターゲットエンティティTの疎なデータ点集合が、破損した記憶、削除、セキュリティ侵害中の窃盗、通信帯域幅を低減するためのいくつかのデータ点の意図的な除外、メモリ記憶要件を低減するためのいくつかのデータ点の意図的な除外、加速サンプリング方式の実装などの結果である場合(上記で考察した)、この正則化ペナルティの使用(対比損失関数の和を含む)は、データ点の疎さを克服する(又は少なくとも軽減する)ために使用され得る。それにより、この正則化ペナルティの使用は、実質的に、データ回復、記憶のためのデータ圧縮、通信帯域幅削減、加速サンプリング方式などを含む1つ以上の技術分野への貢献及び/又は改善である。
【0064】
220において、生成された機械学習モデルのうちの1つ以上は、異常検出(例えば、デバイス故障検出、クレジットカード取引における不正検出、CPGの文脈における異常検出など)のために使用され得る。例えば、ターゲットエンティティTに関連付けられた特徴ベクトルは、入力としてMに供給され得る。Mの出力は、特徴ベクトルが異常である確率及び/又はターゲットエンティティTが稀な又は疑わしいイベントを発生している確率を反映する値であり得る。1つ以上の実施形態では、確率がいくらかの閾値(例えば、65%)を超える場合、異常が宣言される。Mを生成するために類似度正則化が使用されたので、Mは誤った確率を生成する可能性が低く、そのため、偽陽性及び/又は偽陰性が生じる可能性が低い。
【0065】
様々な実施形態は、例えば、図3に示されるコンピュータシステム300などの1つ以上の周知のコンピュータシステムを使用して実装され得る。1つ以上のコンピュータシステム300は、例えば、本明細書で説明する実施形態のいずれか、並びにそれらの組み合わせ及び部分的組み合わせを実装するために使用され得る。
【0066】
コンピュータシステム300は、プロセッサ304などの1つ以上のプロセッサ(中央処理ユニット、又はCPUとも呼ばれる)を含み得る。プロセッサ304は、通信基盤又はバス306に接続され得る。
【0067】
コンピュータシステム300はまた、モニタ、キーボード、ポインティングデバイスなどのユーザ入力/出力デバイス303を含み得、これらは、ユーザ入力/出力インターフェース302を介して通信基盤306と通信し得る。
【0068】
プロセッサ304のうちの1つ以上は、グラフィックス処理ユニット(graphics processing unit、GPU)であってもよい。一実施形態では、GPUは、数学的に集中的なアプリケーションを処理するように設計された専用電子回路であるプロセッサであり得る。GPUは、コンピュータグラフィックスアプリケーション、画像、ビデオなどに共通の数学的に集中的なデータなどの、データの大規模ブロックの並列処理に効率的である並列構造を有し得る。
【0069】
コンピュータシステム300はまた、ランダムアクセスメモリ(random access memory、RAM)などの主メモリすなわち一次メモリ308を含み得る。主メモリ308は、1つ以上のキャッシュレベルを含み得る。主メモリ308は、制御論理(すなわち、コンピュータソフトウェア)及び/又はデータを記憶していてもよい。
【0070】
コンピュータシステム300はまた、1つ以上の二次記憶デバイス又はメモリ310を含み得る。二次メモリ310は、例えば、ハードディスクドライブ312及び/又は取り外し可能な記憶デバイス若しくはドライブ314を含み得る。取り外し可能な記憶ドライブ314は、フロッピーディスクドライブ、磁気テープドライブ、コンパクトディスクドライブ、光学記憶デバイス、テープバックアップデバイス、及び/又は任意の他の記憶デバイス/ドライブであってもよい。
【0071】
取り外し可能な記憶デバイス314は、取り外し可能な記憶ユニット318と相互作用し得る。取り外し可能な記憶ユニット318は、コンピュータソフトウェア(制御論理)及び/又はデータを記憶しているコンピュータ使用可能又は可読記憶デバイスを含んでもよい。取り外し可能な記憶ユニット318は、フロッピーディスク、磁気テープ、コンパクトディスク、DVD、光学記憶ディスク、及び/任意の他のコンピュータデータ記憶デバイスであってもよい。取り外し可能な記憶ドライブ314は、取り外し可能な記憶ユニット318から読み取り、及び/又は取り外し可能な記憶ユニット318に書き込み得る。
【0072】
二次メモリ310は、コンピュータプログラム並びに/又は他の命令及び/若しくはデータが、コンピュータシステム300によってアクセスされることを可能にするための他の手段、デバイス、構成要素、道具、又は他のアプローチを含み得る。そのような手段、デバイス、構成要素、道具、又は他のアプローチとしては、例えば、取り外し可能な記憶ユニット322及びインターフェース320が挙げられ得る。取り外し可能な記憶ユニット322及びインターフェース320の例としては、プログラムカートリッジ及びカートリッジインターフェース(ビデオゲームデバイスに見られるものなど)、取り外し可能なメモリチップ(EPROM又はPROMなど)及び関連ソケット、メモリスティック及びUSBポート、メモリカード及び関連メモリカードスロット、並びに/又は任意の他の取り外し可能な記憶ユニット及び関連インターフェースが挙げられ得る。
【0073】
コンピュータシステム300は、通信又はネットワークインターフェース324を更に含み得る。通信インターフェース324は、コンピュータシステム300が、外部デバイス、外部ネットワーク、外部エンティティなど(参照番号328によって個々に、かつ集合的に参照される)の任意の組み合わせと通信及び相互作用することを可能にし得る。例えば、通信インターフェース324は、コンピュータシステム300が、有線及び/又は無線(又はそれらの組み合わせ)であってもよく、LAN、WAN、インターネットなどの任意の組み合わせを含んでもよい、通信経路326を介して外部又は遠隔デバイス328と通信することを可能にしてもよい。制御論理及び/又はデータは、通信経路326を介して、コンピュータシステム300に、及びコンピュータシステム300から送信されてもよい。
【0074】
コンピュータシステム300はまた、いくつかの非限定的な例を挙げると、携帯情報端末(personal digital assistant、PDA)、デスクトップワークステーション、ラップトップ若しくはノートブックコンピュータ、ネットブック、タブレット、スマートフォン、スマートウォッチ若しくは他のウェアラブル機器、アプライアンス、モノのインターネットの一部、及び/若しくは組み込みシステム、又はそれらの任意の組み合わせのうちのいずれかであってもよい。
【0075】
コンピュータシステム300は、遠隔又は分散クラウドコンピューティングソリューションを含むが、これらに限定されない、任意の配信パラダイムを介して任意のアプリケーション及び/又はデータにアクセス又はホストするクライアント又はサーバ、ローカル又はオンプレミスソフトウェア(「オンプレミス」クラウドベースソリューション)、「アズアサービス」モデル(例えば、コンテンツアズアサービス(content as a service、CaaS)、デジタルコンテンツアズアサービス(digital content as a service、DCaaS)、ソフトウェアアズアサービス(software as a service、SaaS)、マネージドソフトウェアアズアサービス(managed software as a service、MSaaS)、プラットフォームアズアサービス(platform as a service、PaaS)、デスクトップアズアサービス(desktop as a service、DaaS)、フレームワークアズアサービス(framework as a service、FaaS)、バックエンドアズアサービス(backend as a service、BaaS)、モバイルバックエンドアズアサービス(mobile backend as a service、MBaaS)、インフラストラクチャアズアサービス(infrastructure as a service、IaaS)など)、及び/又は前述の実施例又は他のサービス若しくは送達パラダイムの任意の組み合わせを含むハイブリッドモデルであってもよい。
【0076】
コンピュータシステム300内の任意の適用可能なデータ構造、ファイルフォーマット、及びスキーマは、JavaScript Object Notation(JSON)、拡張マークアップ言語(Extensible Markup Language、XML)、Yet Another Markup Language(YAML)、拡張ハイパーテキストマークアップ言語(Extensible Hypertext Markup Language、XHTML)、ワイヤレスマークアップ言語(Wireless Markup Language、WML)、MessagePack、XMLユーザインターフェース言語(XML User Interface Language、XUL)、又は任意の他の機能的に同様の表現を単独で、又は組み合わせて含むがこれらに限定されない規格から導出され得る。代替的に、排他的に、又は既知の若しくはオープンな規格と組み合わせてのいずれかで、独自のデータ構造、フォーマット又はスキーマが使用され得る。
【0077】
いくつかの実施形態では、制御論理(ソフトウェア)が記憶された有形の非一時的コンピュータ使用可能又は可読媒体を備える有形の一時的装置又は製造品は、本明細書では、コンピュータプログラム製品又はプログラム記憶デバイスとも称される場合がある。これは、コンピュータシステム300と、主メモリ308と、二次メモリ310と、取り外し可能な記憶ユニット318及び322と、上記の任意の組み合わせを具現化する有形の製造物品とを含むが、それらに限定されない。そのような制御論理は、1つ以上のデータ処理デバイス(コンピュータシステム300など)によって実行されると、そのようなデータ処理デバイスを本明細書に記載のように動作させ得る。
【0078】
本開示に含有される教示に基づいて、図3に示されるもの以外のデータ処理デバイス、コンピュータシステム及び/又はコンピュータアーキテクチャを使用して、本開示の実施形態をどのように作製及び使用するかは、当業者には明らかであろう。具体的には、実施形態は、本明細書に説明されるもの以外のソフトウェア、ハードウェア、及び/又はオペレーティングシステムの実装を用いて動作することができる。
【0079】
「発明を実施するための形態」のセクション、及びいかなる他のセクションも、特許請求の範囲を解釈するために使用されることは意図されていないことを理解されたい。他のセクションは、本発明者によって想定される、1つ以上であるが全てではない例示的な実施形態を記載し得るが、決して本開示及び添付の特許請求の範囲を限定することを意図するものではない。
【0080】
本開示は、例示的な分野及び用途のための例示的な実施形態を説明しているが、本開示はそれらに限定されないことを理解されたい。他の実施形態及びそれらに対する修正が可能であり、それらは、本開示の範囲及び趣旨の範囲内である。例えば、この段落の一般性を限定することなく、実施形態は、図面に例示された、及び/又は本明細書に説明された、ソフトウェア、ハードウェア、ファームウェア、及び/又はエンティティに限定されない。更に、実施形態(本明細書に明示的に説明されているか否かにかかわらず)は、本明細書に説明された例を超える分野及び用途に有意な有用性を有する。
【0081】
実施形態が、特定の機能の実装、及びそれらの関係を例示する機能的ビルディングブロックを用いて説明されてきた。これらの機能的ビルディングブロックの境界は、説明の便宜上、本明細書において任意に定義されている。特定の機能及び関係(又はそれらの等価物)が適切に実施される範囲で、代替の境界が定義され得る。また、代替的な実施形態は、本明細書に説明されるものとは異なる順序を使用して、機能ブロック、工程、動作、方法などを実施し得る。
【0082】
「一実施形態(one embodiment)」、「一実施形態(an embodiment)」、「例示的な実施形態(an exemplary embodiment)」などの言及は、説明された実施形態が特定の特徴、構造、又は特性を含み得るが、全ての実施形態が特定の特徴、構造、又は特性を必ずしも含まなくてもよいことを示す。更に、このような句は、必ずしも同じ実施形態に言及するものではない。更に、一実施形態に関連して特定の性質、構造、又は特性について記載する場合、本明細書で明確に言及されている又は記載されているかどうかに関わりなく、このような特徴、構造、又は特性を他の実施形態に組み込むことは、当業者の知見内である。加えて、いくつかの実施形態は、その派生物とともに「連結された」及び「接続された」表現を使用して説明され得る。これらの用語は、必ずしも互いに同義語として意図されるものではない。例えば、いくつかの実施形態は、2つ以上の要素が互いに直接物理的又は電気的に接触していることを示すために、「接続された」及び/又は「連結された」という用語を使用して説明され得る。しかしながら、「連結された」という用語はまた、2つ以上の要素が互いに直接接触していないが、依然として互いに協働又は相互作用することも意味し得る。
【0083】
本開示の広がり及び範囲は、上記の例示的な実施形態のいずれによっても限定されるべきではないが、以下の特許請求の範囲及びそれらの等価物によってのみ定義されるべきである。
図1
図2
図3
【国際調査報告】