(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-10-18
(54)【発明の名称】公平な異常検出および異常位置特定システム、方法、プログラム
(51)【国際特許分類】
G08G 1/00 20060101AFI20231011BHJP
G07C 5/00 20060101ALI20231011BHJP
【FI】
G08G1/00 D
G07C5/00 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023505733
(86)(22)【出願日】2021-07-16
(85)【翻訳文提出日】2023-01-26
(86)【国際出願番号】 IB2021056436
(87)【国際公開番号】W WO2022023861
(87)【国際公開日】2022-02-03
(32)【優先日】2020-07-28
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】390009531
【氏名又は名称】インターナショナル・ビジネス・マシーンズ・コーポレーション
【氏名又は名称原語表記】INTERNATIONAL BUSINESS MACHINES CORPORATION
【住所又は居所原語表記】New Orchard Road, Armonk, New York 10504, United States of America
(74)【代理人】
【識別番号】100112690
【氏名又は名称】太佐 種一
(74)【代理人】
【識別番号】100120710
【氏名又は名称】片岡 忠彦
(72)【発明者】
【氏名】勝木 孝行
【テーマコード(参考)】
3E138
5H181
【Fターム(参考)】
3E138AA07
3E138MA06
3E138MB02
3E138MB03
3E138MB10
3E138MB13
3E138MD05
5H181AA01
5H181BB04
5H181BB13
5H181DD07
5H181FF04
5H181FF10
5H181FF13
5H181FF27
5H181LL06
5H181LL09
5H181MB02
(57)【要約】
公平な異常検出のためシステムは、過去のデータのガウス分布、ガウス分布の平均ベクトル、およびガウス分布の精度行列に基づいて異常検出モデルを生成し、平均ベクトルおよび精度行列が関数をしきい値未満に減らすことによって生成され、この関数がガウス分布、類似する公平な特徴を有し、不公平な特徴と無関係である入力の類似する異常スコアを生成するように構成された第1の正則化項、および類似する公平な特徴を有し、不公平な特徴と無関係である入力の類似する異常位置特定スコアを生成するように構成された第2の正則化項を含む。当該システムは新しいデータを異常検出モデルに入力することと、ガウス分布、平均ベクトル、および精度行列に基づいて、新しいデータに関連付けられた異常スコアおよび異常位置特定スコアを生成することをさらに含む。
【特許請求の範囲】
【請求項1】
車両、
観測された車両データを収集する複数のセンサ、
前記観測された車両データを集約して格納するように構成されたドライブ・レコーダ、および
前記ドライブ・レコーダに通信可能に結合された異常検出システムを備えているシステムであって、前記異常検出システムが過去の車両データの確率分布を含み、関数をしきい値未満に減らすように前記確率分布のパラメータが調整され、前記関数が、前記過去の車両データに対して条件付けられた前記確率分布と、類似する公平な特徴を有し、不公平な特徴と無関係である入力の前記確率分布の類似する出力を生成するように構成された少なくとも1つの正則化項とに基づき、前記異常検出システムが、前記確率分布、前記パラメータ、および前記観測された車両データに基づく異常スコアおよび異常位置特定スコアをさらに含む、システム。
【請求項2】
前記少なくとも1つの正則化項が、前記類似する公平な特徴を有し、前記不公平な特徴と無関係である前記入力の類似する異常スコアを生成するように構成された第1の正則化項と、前記類似する公平な特徴を有し、前記不公平な特徴と無関係である前記入力の類似する異常位置特定スコアを生成するように構成された第2の正則化項とを含む、請求項1に記載のシステム。
【請求項3】
前記確率分布がガウス分布であり、前記パラメータが平均ベクトルおよび精度行列を含む、請求項1または請求項2に記載のシステム。
【請求項4】
前記関数を前記しきい値未満に減らすことが、確率的勾配降下法(SGD)を使用して実行される、請求項1ないし3のいずれかに記載のシステム。
【請求項5】
前記異常検出システムが、前記異常スコアおよび前記異常位置特定スコアに基づいて緩和処置を実行するように構成される、請求項1ないし4のいずれかに記載のシステム。
【請求項6】
車両データの異常スコアおよび異常位置特定スコアを生成するように構成された異常検出システムをトレーニングすることであって、前記異常検出システムが、第1の正則化項および第2の正則化項を使用して、類似する公平な特徴を有し、不公平な特徴と無関係である過去の車両データの類似する異常スコアおよび異常位置特定スコアを生成するようにトレーニングされる、前記トレーニングすることと、
前記異常検出システムで、車両上の複数のセンサからデータを収集するドライブ・レコーダから新しい車両データを受信することと、
前記新しい車両データに関連付けられた第1の異常スコアおよび第1の異常位置特定スコアを生成することと、
前記第1の異常スコアおよび前記第1の異常位置特定スコアに基づいて緩和処置を実行することであって、前記緩和処置が前記車両を変更する、前記実行することとを含む、コンピュータ実装方法。
【請求項7】
前記異常検出システムをトレーニングすることが、
前記過去の車両データのガウス確率分布を生成することと、
関数をしきい値未満に減らす平均ベクトルおよび精度行列を学習することとをさらに含み、前記関数が、前記過去の車両データ、前記精度行列のL1正則化項、前記第1の正則化項、および前記第2の正則化項を前提として、前記ガウス確率分布の負の対数尤度に基づく、請求項6に記載のコンピュータ実装方法。
【請求項8】
前記第1の異常スコアおよび前記第1の異常位置特定スコアが、前記新しい車両データ、前記ガウス確率分布、前記平均ベクトル、および前記精度行列に基づく、請求項7に記載のコンピュータ実装方法。
【請求項9】
過去のデータのガウス分布、前記ガウス分布の平均ベクトル、および前記ガウス分布の精度行列に基づいて異常検出モデルを生成することであって、前記平均ベクトルおよび前記精度行列が、関数をしきい値未満に減らすことによって生成され、前記関数が、前記ガウス分布、類似する公平な特徴を有し、不公平な特徴と無関係である入力の類似する異常スコアを生成するように構成された第1の正則化項、および前記類似する公平な特徴を有し、前記不公平な特徴と無関係である前記入力の類似する異常位置特定スコアを生成するように構成された第2の正則化項を含む、前記生成することと、
新しいデータを前記異常検出モデルに入力することと、
前記ガウス分布、前記平均ベクトル、および前記精度行列に基づいて、前記新しいデータに関連付けられた異常スコアおよび異常位置特定スコアを生成することとを含む、コンピュータ実装方法。
【請求項10】
前記異常スコアが異常の存在を示し、前記異常位置特定スコアが前記異常の発生源を示す、請求項9に記載のコンピュータ実装方法。
【請求項11】
確率的勾配降下法(SGD)を使用して前記関数が減らされる、請求項9または請求項10に記載のコンピュータ実装方法。
【請求項12】
前記過去のデータの前記ガウス分布、前記平均ベクトル、および前記精度行列に従って、前記異常スコアが前記新しいデータの負の対数尤度である、請求項9ないし11のいずれかに記載のコンピュータ実装方法。
【請求項13】
前記過去のデータの前記ガウス分布、前記平均ベクトル、および前記精度行列に従って、前記異常位置特定スコアが、前記新しいデータの他の特徴に対して条件付けられた前記新しいデータの特徴の負の条件付き対数尤度である、請求項9に記載のコンピュータ実装方法。
【請求項14】
教師なし学習を使用して前記異常検出モデルが生成され、前記過去のデータがラベルなしのトレーニング・データを含む、請求項9に記載のコンピュータ実装方法。
【請求項15】
前記異常スコアおよび前記異常位置特定スコアに基づいて緩和処置を実行することをさらに含む、請求項9に記載のコンピュータ実装方法。
【請求項16】
前記緩和処置が、前記新しいデータに関連付けられたデバイスに対する変更を含む、請求項15に記載のコンピュータ実装方法。
【請求項17】
リモートのデータ処理システムから1つまたは複数のコンピュータにダウンロードされたソフトウェアに従って、前記1つまたは複数のコンピュータによって前記方法が実行される、請求項9に記載のコンピュータ実装方法。
【請求項18】
前記方法が、
前記ソフトウェアの使用を計測することと、
前記使用の計測に基づいてインボイスを生成することとをさらに含む、請求項17に記載のコンピュータ実装方法。
【請求項19】
1つまたは複数のプロセッサと、
プログラム命令を格納している1つまたは複数のコンピュータ可読ストレージ媒体とを備えているシステムであって、前記プログラム命令が、前記1つまたは複数のプロセッサによって実行された場合に、前記1つまたは複数のプロセッサに、
過去のデータのガウス分布、前記ガウス分布の平均ベクトル、および前記ガウス分布の精度行列に基づいて異常検出モデルを生成することであって、前記平均ベクトルおよび前記精度行列が、関数をしきい値未満に減らすことによって生成され、前記関数が、前記ガウス分布、類似する公平な特徴を有し、不公平な特徴と無関係である入力の類似する異常スコアを生成するように構成された第1の正則化項、および前記類似する公平な特徴を有し、前記不公平な特徴と無関係である前記入力の類似する異常位置特定スコアを生成するように構成された第2の正則化項を含む、前記生成することと、
新しいデータを前記異常検出モデルに入力することと、
前記ガウス分布、前記平均ベクトル、および前記精度行列に基づいて、前記新しいデータに関連付けられた異常スコアおよび異常位置特定スコアを生成することとを含んでいる方法を実行させるように構成される、システム。
【請求項20】
確率的勾配降下法(SGD)を使用して前記関数が減らされる、請求項19に記載のシステム。
【請求項21】
前記過去のデータの前記ガウス分布、前記平均ベクトル、および前記精度行列に従って、前記異常スコアが前記新しいデータの負の対数尤度である、請求項19に記載のシステム。
【請求項22】
前記過去のデータの前記ガウス分布、前記平均ベクトル、および前記精度行列に従って、前記異常位置特定スコアが、前記新しいデータの他の特徴に対して条件付けられた前記新しいデータの特徴の負の条件付き対数尤度である、請求項19に記載のシステム。
【請求項23】
1つまたは複数のコンピュータ可読ストレージ媒体と、前記1つまたは複数のコンピュータ可読ストレージ媒体に集合的に格納されたプログラム命令とを備えているコンピュータ・プログラム製品であって、前記プログラム命令が、1つまたは複数のプロセッサに、
過去のデータのガウス分布、前記ガウス分布の平均ベクトル、および前記ガウス分布の精度行列に基づいて異常検出モデルを生成することであって、前記平均ベクトルおよび前記精度行列が、関数をしきい値未満に減らすことによって生成され、前記関数が、前記ガウス分布、類似する公平な特徴を有し、不公平な特徴と無関係である入力の類似する異常スコアを生成するように構成された第1の正則化項、および前記類似する公平な特徴を有し、前記不公平な特徴と無関係である前記入力の類似する異常位置特定スコアを生成するように構成された第2の正則化項を含む、前記生成することと、
新しいデータを前記異常検出モデルに入力することと、
前記ガウス分布、前記平均ベクトル、および前記精度行列に基づいて、前記新しいデータに関連付けられた異常スコアおよび異常位置特定スコアを生成することとを含んでいる方法を実行させるように構成された命令を含む、コンピュータ・プログラム製品。
【請求項24】
前記過去のデータの前記ガウス分布、前記平均ベクトル、および前記精度行列に従って、前記異常スコアが前記新しいデータの負の対数尤度である、請求項23に記載のコンピュータ・プログラム製品。
【請求項25】
前記過去のデータの前記ガウス分布、前記平均ベクトル、および前記精度行列に従って、前記異常位置特定スコアが、前記新しいデータの他の特徴に対して条件付けられた前記新しいデータの特徴の負の条件付き対数尤度である、請求項23に記載のコンピュータ・プログラム製品。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、異常検出に関連しており、より詳細には、公平な異常検出および異常位置特定に関連している。
【背景技術】
【0002】
異常検出および異常位置特定は、データ分析の重要な側面である。異常検出は、異常の発生を識別することができ、異常位置特定は、異常の特徴、原因、または検出された異常の発生源を識別することができる。言い換えると、異常検出は、異常なイベントまたは予期しないイベントが発生したことを示し、一方、異常位置特定は、異常なイベントまたは予期しないイベントが発生した場所または理由あるいはその両方を示す。
【0003】
異常検出および異常位置特定の分野における1つの課題は、公平性に関連している。言い換えると、異常は、データ内の不公平な特徴に基づいて識別されるべきではない。例えば、車両のドライブ・レコーダの場合、運転者の挙動、運転者の疲労、車両の故障などから生じる危険な運転を検出するために、異常検出が使用され得る。一方、異常位置特定は、検出された異常の根本原因を識別することができる。そのようなデータは、車両、道路、および運転者の安全性、信頼性、および効率を改善するために、自動車製造業者、自動車保険会社、自動車部品供給業者、土木技師などによって利用され得る。上記の例を続けると、ドライブ・レコーダにおいて検出された異常の場合、異常位置特定は、運転者によるブレーキのパターンが通常のブレーキのパターンと比較して異常だったことを示すことができる。しかし、異常検出および異常位置特定において使用される一部の特徴は、不公平である可能性がある。ドライブ・レコーダの上記の例を続けると、(例えば、ルートの地形または道路の表面の特性に起因する)垂直方向の加速、温度、荒天の可能性、運転者の年齢、自動車のモデルなどの、運転者の動作と無関係の特徴から異常な(例えば、危険な)運転挙動を推定することは、不公平である。しかし、これらの「不公平な」特徴を完全に無視することは、異常検出および異常位置特定システムの性能を低下させる可能性がある。したがって、異常検出および異常位置特定モデルの許容できる精度を維持しながら、異常検出および異常位置特定モデルに対する不公平な特徴の影響を減らすことができる技術およびシステムに対する必要性が存在する。
【発明の概要】
【0004】
本開示の態様は、車両、観測された車両データを収集する複数のセンサ、観測された車両データを集約して格納するように構成されたドライブ・レコーダ、およびドライブ・レコーダに通信可能に結合された異常検出システムを備えているシステムを対象にする。異常検出システムは、過去の車両データの確率分布を含み、関数をしきい値未満に減らすように確率分布のパラメータが調整される。この関数は、過去の車両データに対して条件付けられた確率分布と、類似する公平な特徴を有し、不公平な特徴と無関係である入力の確率分布の類似する出力を生成するように構成された少なくとも1つの正則化項とに基づく。異常検出システムは、確率分布、パラメータ、および観測された車両データに基づく異常スコアおよび異常位置特定スコアをさらに含む。
【0005】
前述の実施形態は、多数の利点を実現する。第一に、これらの実施形態は、異常スコアおよび異常位置特定スコアが、少なくとも1つの正則化項を使用して修正された(不公平ではなく)公平な特徴に基づく限りにおいて、異常検出において改善された公平性を実現する。第二に、公平性における前述の改善は、性能の損失につながらない。実際に、少なくとも1つの正則化項の使用が、性能を維持または改善しながら、公平性も改善することが示される(
図6に関して説明される実験結果を参照)。第三に、少なくとも1つの正則化項によって導入される追加の計算複雑度は、(例えば、異常スコアに関連する正則化項では)存在しないか、または(例えば、異常位置特定スコアに関連する正則化項では)許容できる程度に小さい。
【0006】
本開示のさらなる態様は、車両データの異常スコアおよび異常位置特定スコアを生成するように構成された異常検出システムをトレーニングすることを含んでいる方法を対象にする。異常検出システムは、第1の正則化項および第2の正則化項を使用して、類似する公平な特徴および類似しない不公平な特徴を含む過去の車両データの類似する異常スコアおよび異常位置特定スコアを生成するようにトレーニングされ得る。この方法は、異常検出システムで、車両上の複数のセンサからデータを収集するドライブ・レコーダから新しい車両データを受信することと、新しい車両データに関連付けられた第1の異常スコアおよび第1の異常位置特定スコアを生成することとをさらに含む。この方法は、第1の異常スコアおよび第1の異常位置特定スコアに基づいて緩和処置を実行することをさらに含み、この緩和処置は車両を変更する。
【0007】
前述の実施形態は、多数の利点を実現する。第一に、これらの実施形態は、異常スコアおよび異常位置特定スコアが、第1の正則化項および第2の正則化項を使用して修正された(不公平ではなく)公平な特徴に基づく限りにおいて、異常検出において改善された公平性を実現する。第二に、公平性における前述の改善は、性能の損失につながらない。実際に、第1および第2の正則化項の使用が、性能を維持または改善しながら、公平性も改善することが示される(
図6に関して説明される実験結果を参照)。第三に、第1の正則化項によって導入される追加の計算複雑度は存在せず、一方、第2の正則化項によって導入される追加の計算複雑度は許容できる程度に小さい。
【0008】
本開示のさらなる態様は、過去のデータのガウス分布、ガウス分布の平均ベクトル、およびガウス分布の精度行列に基づいて異常検出モデルを生成することを含んでいる方法を対象にし、平均ベクトルおよび精度行列は、関数をしきい値未満に減らすことによって生成され、この関数が、ガウス分布、類似する公平な特徴を有し、不公平な特徴と無関係である入力の類似する異常スコアを生成するように構成された第1の正則化項、および類似する公平な特徴を有し、不公平な特徴と無関係である入力の類似する異常位置特定スコアを生成するように構成された第2の正則化項を含む。この方法は、新しいデータを異常検出モデルに入力することをさらに含む。この方法は、ガウス分布、平均ベクトル、および精度行列に基づいて、新しいデータに関連付けられた異常スコアおよび異常位置特定スコアを生成することをさらに含む。
【0009】
前述の実施形態は、多数の利点を実現する。第一に、これらの実施形態は、異常スコアおよび異常位置特定スコアが、第1の正則化項および第2の正則化項を使用して修正された(不公平ではなく)公平な特徴に基づく限りにおいて、異常検出において改善された公平性を実現する。第二に、公平性における前述の改善は、性能の損失につながらない。実際に、第1および第2の正則化項の使用が、性能を維持または改善しながら、公平性も改善することが示される(
図6に関して説明される実験結果を参照)。第三に、第1の正則化項によって導入される追加の計算複雑度は存在せず、一方、第2の正則化項によって導入される追加の計算複雑度は許容できる程度に小さい。
【0010】
前述の方法に従う本開示の別の態様は、確率的勾配降下法(SGD:Stochastic Gradient Descent)またはブロック座標勾配降下法(Block Coordinate Gradient Descent)を使用して関数が減らされることをさらに含む。SGDまたはブロック座標勾配降下法を使用して、有利に、関数をしきい値未満に減らすことに関連する計算負荷を低減する。
【0011】
前述の方法に従う本開示の別の態様は、過去のデータのガウス分布、平均ベクトル、および精度行列に従って、異常スコアが新しいデータの負の対数尤度であることをさらに含む。異常スコアは、有利に、計算負荷の大部分が、精度行列を学習することに関連するトレーニング段階に存在する限りにおいて、ガウス分布および精度行列に基づいて計算する場合に、計算的に安価であることができる。言い換えると、異常スコアは、これらの実施形態に従って、少ない処理オーバーヘッドを伴って素早く計算され得る。
【0012】
前述の方法に従う本開示の別の態様は、過去のデータのガウス分布、平均ベクトル、および精度行列に従って、異常位置特定スコアが新しいデータの他の特徴に対して条件付けられた新しいデータの特徴の負の条件付き対数尤度であることをさらに含む。異常位置特定スコアは、有利に、計算負荷の大部分が、精度行列を学習することに関連するトレーニング段階に存在する限りにおいて、ガウス分布および精度行列に基づいて計算する場合に、計算的に安価であることができる。言い換えると、異常位置特定スコアは、これらの実施形態に従って、少ない処理オーバーヘッドを伴って素早く計算され得る。
【0013】
本開示の追加の態様は、前述の方法を実行するように構成されたシステムおよびコンピュータ・プログラム製品を対象にする。本概要は、本開示のすべての実装またはすべての実施形態あるいはその両方の各態様を説明するよう意図されていない。
【0014】
本出願に含まれている図面は、本明細書に組み込まれ、本明細書の一部を形成する。各図面は、説明と共に本開示の実施形態を示し、本開示の原理を説明するのに役立つ。各図面は、特定の実施形態の単なる例であり、本開示を制限していない。
【図面の簡単な説明】
【0015】
【
図1】本開示の一部の実施形態に従う、異常検出システムに通信可能に結合された例示的な車両を示すブロック図である。
【
図2】本開示の一部の実施形態に従う、異常検出システムに通信可能に結合された例示的なシステムを示すブロック図である。
【
図3】本開示の一部の実施形態に従う、異常検出システムを利用するための例示的な方法のフローチャートを示す図である。
【
図4】本開示の一部の実施形態に従う、異常検出システムまたはモデルを生成またはトレーニングするための例示的な方法のフローチャートを示す図である。
【
図5】本開示の一部の実施形態に従う、実験結果の表を示す図である。
【
図6】本開示の一部の実施形態に従う、例示的なコンピュータを示すブロック図である。
【
図7】本開示の一部の実施形態に従う、クラウド・コンピューティング環境を示す図である。
【
図8】本開示の一部の実施形態に従う、抽象モデル・レイヤを示す図である。
【発明を実施するための形態】
【0016】
本開示は、さまざまな変更および代替の形態を受け入れるが、その詳細が、図面において例として示されており、詳細に説明される。しかし、本開示を説明されている特定の実施形態に限定することが意図されていないということが、理解されるべきである。反対に、本開示の範囲に含まれるすべての変更、同等のもの、および代替手段を対象にすることが意図されている。
【0017】
本開示の態様は、異常検出を対象にしており、より詳細には、公平な異常検出および異常位置特定を対象にしている。そのような応用に限定されないが、本開示の実施形態は、前述の文脈を踏まえてよりよく理解され得る。
【0018】
公平性のためのさまざまな戦略が教師あり学習に存在するが、ラベルなしトレーニング・データと共に教師なし学習を使用して異常検出および異常位置特定において公平性を処理するために既知の戦略は存在しない。公平性が異常検出に関連するとき、公平性にはさまざまな定義がある。第1の定義は、異常の予測がどの不公平な特徴とも無関係であるということである。しかし、この定義は、異常検出および異常位置特定モデルの性能低下につながることがある不公平な特徴を無視する。異常検出における公平性の第2の定義は、不公平な特徴と予測された異常の間に原因と影響の関係が存在しないということである。しかし、因果関係を機械学習モデルから明示的に導き出すことは困難である。したがって、この定義を機械学習アプリケーションにおいて実装することは、非実用的である。異常検出における公平性の第3の定義は、異常の予測が、他の特徴に対して条件付けられた不公平な特徴と無関係であるということを示す。本開示の態様は、異常検出および異常位置特定における公平性の第3の定義を利用する。この第3の定義は、有利に、正則化項を使用して類似する公平な特徴および類似しない不公平な特徴を含んでいるデータの出力を等化しながら(例えば、より類似するようにしながら)、異常検出および異常位置特定モデルの性能を維持するための不公平な特徴の使用を可能にする。
【0019】
本開示の態様は、次の特徴のうちの1つまたは複数を実現する。第一に、本開示の態様は、第1の正則化項を利用して、異常検出および異常位置特定モデルにおける異常検出の公平性を向上させる。第1の正則化項は、類似しない不公平な特徴および類似する公平な特徴を有する2つのサンプルから計算された2つの異常スコア間の差を減らすように構成された項として定義され得る。前述の2つのサンプルの異常スコアをほぼ等しくするということは、異常スコアに対する類似しない不公平な特徴の影響が存在しない(例えば、モデルの出力が不公平な特徴と無関係である)ということを示唆する。上のドライブ・レコーダの例に戻ると、類似しない不公平な特徴は、自動車のモデル(例えば、小型トラック、コンバーチブルなど)、年齢などであってよく、一方、類似する公平な特徴は、速度、加速度、位置、ブレーキのパターンなどに関連してよい。
【0020】
本開示の第2の態様は、第2の正則化項を使用して、異常検出および異常位置特定モデルにおける異常位置特定の公平性を向上させる。第1の正則化項と同様に、異常位置特定に関連する第2の正則化項は、(例えば、モデルの出力が不公平な特徴と無関係になるように)類似しない不公平な特徴および類似する公平な特徴を有する2つのサンプルから計算された2つの異常位置特定スコア間の差を減らすように構成された項として定義され得る。
【0021】
本開示の第3の態様によれば、異常スコアは、正常な(異常でない)データに対してトレーニングされた異常検出および異常位置特定モデルに従うサンプルの負の尤度(または負の対数尤度)であることができる。一部の実施形態では、正常なデータに対してトレーニングされた異常検出および異常位置特定モデルは、ガウス確率分布(例えば、正規確率分布)、または最尤推定(MLE:maximum likelihood estimation)技術を使用すること、あるいはその両方に基づくことができる。
【0022】
本開示の第4の態様によれば、異常位置特定スコアは、正常なデータに対してトレーニングされた異常検出および異常位置特定モデルの負の条件付き尤度(または負の条件付き対数尤度)に基づくことができる。言い換えると、異常位置特定スコアは、異常(例えば、異常スコア)の決定に最も寄与した特徴を示すことができる。
【0023】
ここで本開示の一部の態様をさらに詳細に説明すると、本開示の態様は、特徴ベクトルxに基づくモデルのガウス分布のパラメータを学習することができる。本明細書ではガウス分布が主に説明されるが、任意の数の他の確率分布が本開示の範囲に含まれる。その後、異常スコアは、ガウス分布に従って発生する新たに観測されたデータxの尤度に基づくことができる。ガウス分布(Nx|0,∧-1)の精度行列∧のみがトレーニングにおいて学習される。精度行列∧(濃度行列と呼ばれることもある)は、共分散行列の逆であることができる。精度行列∧内のゼロは、有利に、対応する変数間の条件付き独立性を示すことができる。したがって、精度行列∧は、(例えば、精度行列∧のゼロ以外の要素に基づいて)変数間の(不公平の影響を含む)影響を識別すること、(例えば、精度行列∧のゼロの各要素にどのくらい近いかに基づいて)影響度を定量化すること、および(例えば、不公平な特徴と公平な特徴の間の依存関係を反映する精度行列∧内の要素を減らす正則化項を導入することによって)異常検出および異常位置特定に対する不公平な特徴の影響を減らすことに比類なく適している。
【0024】
方程式1は、ガウス分布の対数尤度、精度行列∧のL1正則化項(例えば、ラッソ(LASSO:Least Absolute Shrinkage and Selection Operator)回帰正則化)、第1の正則化項(例えば、異常スコア正則化項)、および第2の正則化項(例えば、異常位置特定スコア正則化項)の合計の関数を最小化する(例えば、しきい値未満に減らすか、または計算パラメータに従って最小化する)精度行列∧の値を決定する。
【0025】
【0026】
方程式1では、xが入力データを表し、xは、異なるデータ入力、特徴、またはソースdの任意の数Dを表す任意の次元数に関連付けられ得る。言い換えると、
【数2】
は、トレーニング・サンプルNのD次元の入力データを表すことができる。一部の実施形態では、xは、平均ベクトルがゼロになるように標準化される。一部の実施形態では、平均ベクトルがゼロになるようにxを標準化することは、D個の異なるデータ入力のうちの各データ入力の平均値を決定することと、関数が任意の個別のデータ入力に適用された場合に、正値が平均値を超える偏差を表し、負値が平均値を下回る偏差を表すように、関数によって平均値をゼロに変換することとを含む。一部の実施形態では、平均ベクトルは、ガウス分布の平均ベクトルのことを指す。不公平な特徴は、x
uとして分類されることが可能であり、残りの特徴(例えば、公平な特徴)は、x
-u(例えば、不公平な特徴x
uを補完する特徴)として分類され得る。項∧は、Nx|0,∧
-1のガウス分布の精度行列を表す。項ρ(x)は、xの内在する確率分布であり、項Eは、ρ(x)を超える期待値に関連している。項ρおよびαは、異常検出モデルの設計に応じて調整される係数である。項I(x
-u,x’
-u)は、x
-u=x’
-u(例えば、異なる入力間の類似する公平な特徴)である場合に1を返し、そうでない場合に0を返す関数であり、xおよびx’は異なる入力サンプルである。さらに一般的には、方程式1の構成要素は、ガウス分布の負の対数尤度に等しいE
ρ(x)[-lnΝ(x|0,∧
-1)]、L1正則化項を参照する項ρ|∧|、類似する公平な特徴および類似しない不公平な特徴を含む異なる入力データ間での異常検出の等化された確率の程度(例えば、尤度)を反映する項
【数3】
、および類似する公平な特徴および類似しない不公平な特徴を含む入力データ間の異常位置特定の等化された確率の程度(例えば、条件付き尤度)を反映する項
【数4】
として要約され得る。
【0027】
方程式1は方程式2に簡略化されることが可能であり、方程式2は、冗長な項を消し、(例えば、サンプルの平均値を使用して)Eを近似し、経験的共分散行列Sを利用することができる。
【0028】
【0029】
方程式2の項は、方程式2の構成要素をよく理解するために、一緒にグループ化され得る。例えば、-ln det(∧)+tr(S∧)の部分はガウス分布の負の対数尤度を表し、ρ|∧|の部分はL1正則化項のままであり、
【数6】
の部分は類似する公平な特徴および類似しない不公平な特徴を含む入力データ間の異常検出(例えば、尤度)の等化された確率の程度を反映し、
【数7】
の部分は類似する公平な特徴および類似しない不公平な特徴を含む入力データ間の異常位置特定の等化された確率の程度(例えば、条件付き尤度)を反映する。
【0030】
一部の実施形態では、異常検出モデルは、確率的勾配降下法(SGD)を使用して方程式2を最小化する(例えば、しきい値未満に減らすか、または計算パラメータに従って最小化する)精度行列∧を決定することによって、精度行列∧を学習する。他の実施形態では、異常検出モデルは、ブロック座標勾配降下法、または循環ブロック座標降下法、ランダムに並べ替えられた循環ブロック座標降下法(Randomly Permuted Cyclic Block Coordinate Descent)、ランダム化ブロック座標降下法などの、ただしこれらに限定されない別の方法を使用して方程式2を最小化することによって、精度行列∧を学習する。さらに、本開示の態様は、精度行列∧を操作することによって方程式1または2の関数を最小化することについて説明するが、最小化するという用語は、関数における減少の任意の量のことを指し、必ずしも絶対的な最小値のことを指さない。例えば、一部の実施形態では、関数はしきい値の量未満に減らされ、または他の実施形態では、関数は既定の計算の反復回数または近似の回数の間、減らされる。
【0031】
Glasso(例えば、グラフィカルLASSO)をブロック座標勾配降下法と共に利用する一部の実施形態は、(方程式1および2において説明されたような第1の正則化項および第2の正則化項を考慮しても)行列成分ごとの勾配が別々に計算される限りにおいて有利である。さらに、ブロック座標勾配降下法(または任意の他の勾配降下法)を実行する前に、方程式1および2において説明された第1の正則化項および第2の正則化項のトレーニング・サンプルx(N*Nの反復)すべてにわたる総和が計算され得る。これは、精度行列∧d,iの勾配ステップごとに、N個のサンプルまたはD個の特徴すべてにわたる総和が存在しないということを意味する。したがって、第1の正則化項を導入することによって、各勾配ステップでの計算複雑度のオーダーは、これらの項を計算するためのオーダーがO(1)である限りにおいて変化しない。
【0032】
これに対して、前処理ステップの計算複雑度のオーダーは、経験的共分散行列Sを計算するためのコストであるO(D^2*N)から、第2の正則化項の前処理のためのコストであるO(D^2*N^2)に増やされる(N倍大きい)。しかし、この計算は確率的勾配降下法(SGD)の動作の前にのみ必要とされ、SGDステップの数が、トレーニング・サンプルの数Nの数倍以上多くなり得るということに注意するべきである。したがって、第2の正則化項によって導入される追加の計算複雑度は、相対的にあまり大きくない。
【0033】
まとめると、異常スコアがトレーニング・データセットのガウス確率および精度行列の負の対数尤度(例えば、-lnN(x|0,∧-1))に基づくことができ、一方、異常位置特定スコアが、補完する特徴x-dに対して条件付けられた入力特徴xdのトレーニング・データセットのガウス確率および精度行列の負の条件付き対数尤度(例えば、-lnN(xd|x-d,0,∧-1))に基づくことができるように、方程式1および2が簡略化され得る。
【0034】
ここで各図について説明すると、
図1は、本開示の一部の実施形態に従う、ネットワーク130を介して異常検出システム112(異常検出モデルとも呼ばれる)に通信可能に結合されたドライブ・レコーダ102を含んでいる例示的な車両100のブロック図を示している。説明を簡単にするためにネットワーク130が示されているが、他の実施形態では、類似する種類または類似しない種類の1つまたは複数の永続的または断続的ネットワークが、複数の車両100を異常検出システム112に接続するために使用され得る。ネットワーク130の非限定的な例としては、広域ネットワーク(WAN:wide-area network)、ローカル・エリア・ネットワーク(LAN:local area network)、イントラネット、インターネット、セルラー・ネットワーク(例えば、3G、4G、5G)、パーソナル・エリア・ネットワーク(PAN:personal-area network)などが挙げられる。一部の実施形態では、ネットワーク130は、短距離ネットワーク接続(例えば、電気電子技術者協会(IEEE:Institute of Electrical and Electronics Engineers)802.15規格、IEEE1902.1規格、パーソナル・エリア・ネットワーク(PAN)、Bluetooth(TM)ネットワーク、近距離無線通信(NFC:Near Field Communication)ネットワーク、赤外線通信協会(IrDA:Infrared Data Association)ネットワーク、6LoWAPN(Internet Protocol version 6 (IPv6) over Low-Power Wireless Personal-Area Networks)、DASH7アライアンス・プロトコル(D7A:DASH7 Alliance Protocol)ネットワーク、RuBeeネットワーク、超広帯域(UWB:Ultra-wideband)ネットワーク、周波数変調(FM:Frequency Modulation)-UWBネットワーク、ワイヤレス・アドホック・ネットワーク(WANET:Wireless Ad Hoc Networks)、Z波ネットワーク、ZigBee(TM)ネットワーク、およびその他の短距離ネットワークを利用するネットワーク)、また車両100と異常検出システム112の間の通信を可能にする別の接続である。
【0035】
車両100は、任意の非自律車両、半自律車両、または自律車両であることができる。車両100は、車両の性能または車両100の運転者の能力あるいはその両方に関連付けられたデータを集約、格納、および送信することに適しているドライブ・レコーダ102を含んでいることができる。ドライブ・レコーダ102は、(例えば、直線加速度または角加速度データを収集する)加速度計104、(例えば、速度データを収集する)速度計106、(例えば、緯度、経度、国、地域、州、市、またはその他の位置データ、あるいはその組合せを収集する)全地球測位システム(GPS:global positioning system)108、またはその他のセンサ110(例えば、温度センサ、圧力センサ、位置センサなど)、あるいはその組合せなどの、ただしこれらに限定されない、さまざまなセンサからデータを収集することができる。他のセンサ110は、例えば、スロットルの位置、エンジンの温度、エンジンの毎分回転数(RPM:revolutions per minute)、ハンドルの位置、ブレーキの高さ、運転モード(例えば、クルーズ・コントロール、アダプティブ・クルーズ・コントロール、半自律など)、エンジン車両コード(engine vehicle code)、またはその他のデータ、あるいはその組合せなどの、車両100に関連付けられたさまざまな他の種類のデータを収集することができる。
【0036】
ドライブ・レコーダ102は、ドライブ・レコーダ102によって収集されたデータを、ネットワーク130を介して異常検出システム112に送信することができる。さまざまな実施形態では、データは、連続的に、半連続的に、またはバッチで、送信され得る。
【0037】
異常検出システム112は、過去のデータ114(トレーニング・データとも呼ばれる)を使用してトレーニングされ得る。一部の実施形態では、過去のデータ114は、正常な(例えば、異常でない)運転挙動を表す過去のドライブ・レコーダ・データである。異常検出システム112は、(i)(例えば、平均特徴ベクトルをゼロに等しくするために)過去のデータ114を標準化すること、(ii)標準化された過去のデータ114のガウス確率分布120を学習すること、および(iii)異常検出の公平性に関連する第1の正則化項126または異常位置特定の公平性に関連する第2の正則化項128、あるいはその両方を利用しながら、ガウス確率分布120の精度行列∧124を操作すること(例えば、変更すること、調整することなど)によって関数122をしきい値未満に減らすことによって、トレーニングされ得る。前に説明されたように、関数122は、方程式1または方程式2あるいはその両方に示された関数であることができる。さらに、第1の正則化項126は、(方程式1に示されたような)
【数8】
または(方程式2に示されたような)
【数9】
であることができる。一方、第2の正則化項128は、(方程式1に示されたような)
【数10】
または(方程式2に示されたような)
【数11】
であることができる。一部の実施形態では、過去のデータ114は、ラベルなしの過去のデータであり、異常検出システム112のトレーニングは、教師なしトレーニングである。
【0038】
異常検出システム112を(例えば、関数122をしきい値未満に減らす精度行列∧124を学習することによって)トレーニングした後に、異常検出システム112は、ドライブ・レコーダ102からデータを受信し、異常スコア116および異常位置特定スコア118を出力することができる。一部の実施形態では、ドライブ・レコーダ102から受信されたデータは、過去のデータ114の標準化と一致する方法で標準化するように前処理される。一部の実施形態では、異常スコア116は、ガウス確率分布120および学習された精度行列∧124に従って、新しいデータxの負の対数尤度(例えば、-lnN(x|0,∧-1))であることができる。異常スコア116は、異常が発生したかどうかを示すことに役立つことができる。さらに、一部の実施形態では、異常位置特定スコア118は、ガウス確率分布120および学習された精度行列∧124に従う補完的特徴x-dを考慮したxdの条件付き尤度に従って、新しいデータxの負の条件付き対数尤度(例えば、-lnN(xd|x-d,0,∧-1))であることができる。異常位置特定スコア118は、検出された異常の発生源または原因を示すことに役立つことができる。
【0039】
異常スコア116および異常位置特定スコア118は、任意の数の方法で利用され得る。例えば、スコアは、保証を改善するため、車両の安全性を改善するため、または顧客の使用状況を理解するため、あるいはその組合せのために、自動車製造業者によって利用され得る。スコアは、信頼性または安全性あるいはその両方を改善するために、自動車部品供給業者によって利用され得る。スコアは、運転挙動に基づいて保険料率を調整するために、自動車保険会社によって利用され得る。スコアは、道路設計を変更して安全性を改善するために、土木技師および都市計画立案者によって利用され得る。さらに、スコアは、車両100自体によって利用され得る。例えば、車両100は、スコアに基づいて通知または警告を車両の運転者に提示することができる。別の例として、車両100は、スコアに基づいて、通知または警告を、例えば救急サービスに送信することができる。さらに別の例として、車両100は、スコアに基づいて、加速、減速、旋回、ブレーキなどの、ただしこれらに限定されない車両100の機能を修正または変更することができる。
【0040】
図1はネットワーク130を介して異常検出システム112に通信可能に結合された車両100を示しているが、他の実施形態では、車両100は、その内部に格納された異常検出システム112を含むことができる。例えば、異常検出システム112は、車両100内のドライブ・レコーダ102と同じ場所に配置され得る。そのような実施形態では、異常検出システム112は、リモートのデータ処理システム上でトレーニングされ、車両100にダウンロードされ得る。他の実施形態では、部分的にトレーニングされたか、またはトレーニングされていない異常検出システム112が、リモートのデータ処理システムから車両100にダウンロードされることが可能であり、車両に固有のトレーニングまたは運転者に固有のトレーニングあるいはその両方が望ましい実施形態の場合、異常検出システム112は、自分自身をリアルタイムに、または車両100の動作中にトレーニングすることができる。
【0041】
ここで
図2を参照すると、本開示の一部の実施形態に従って、
図1に示された異常検出システム112に送信し、異常検出システム112によって分析するためのデータ202を生成する例示的なシステム200が示されている。
図1は車両100内のドライブ・レコーダ102を説明したが、本開示の態様は、任意の数の産業およびアプリケーションに適用可能である。例えば、システム200は、医療環境で発生するデータ202におけるデバイスまたはアプリケーション(例えば、患者の監視、患者の請求書の送付など)、産業環境におけるデバイスまたはアプリケーション(例えば、製造工場内の部品の品質管理データ、精製所内のプロセス制御データ、陸上または海上の掘削リグのリグ・データなど)、金融アプリケーション(例えば、融資の組成、信用報告書など)、旅行アプリケーション(例えば、フライトの遅延、取り消しに対する洞察など)などであることができる。さらに、ドライブ・レコーダ102がセンサからデータを収集した
図1とは対照的に、
図2に示されているように、データ202は、必ずしもセンサから来る必要はなく、(センサから来ることもできるが)純粋に電子データ(例えば、テキスト・メッセージ、インターネット検索用語、アプリケーション、レジメなど)から来ることもできる。
【0042】
異常検出システム112は、
図1で前に説明されたのと同様に
図2において機能することができるが、
図1のデータがドライブ・レコーダ102から受信されたのに対して、
図2のデータ202がシステム200から受信される点が異なる。データ202は、
図1に関して説明されたデータより多くの特徴、少ない特徴、または同様の特徴を含むことができる。
【0043】
図2はネットワーク130によって異常検出システム112に通信可能に結合されたシステム200を示しているが、他の実施形態では、システム200は、その内部に格納された異常検出システム112を含むことができる。例えば、異常検出システム112は、システム200内のデータ202と同じ場所に配置され得る。そのような実施形態では、異常検出システム112は、リモートのデータ処理システム上でトレーニングされ、システム200にダウンロードされ得る。他の実施形態では、部分的にトレーニングされたか、またはトレーニングされていない異常検出システム112が、リモートのデータ処理システムからシステム200にダウンロードされることが可能であり、システムに固有のトレーニングまたは運転者に固有のトレーニングあるいはその両方が望ましい実施形態の場合、異常検出システム112は、自分自身をリアルタイムに、またはシステム200の動作中にトレーニングすることができる。
【0044】
図3は、本開示の一部の実施形態に従う、
図1および
図2に示された異常検出システム112を利用するための例示的な方法300のフローチャートを示している。方法300は、異常検出システム112、コンピュータ、プロセッサ、あるいは別の構成のハードウェアもしくはソフトウェアまたはその両方によって実装され得る。
【0045】
動作302は、異常スコアの公平性のための第1の正則化項および異常位置特定スコアの公平性のための第2の正則化項を使用して異常検出システム112をトレーニングする(または生成する)ことを含む。一部の実施形態では、異常検出システム112は、関数122をしきい値未満に減らす精度行列∧124を学習することによってトレーニングされ、この関数は、トレーニング・データ114のガウス確率分布120の負の対数尤度、L1正則化項、異常スコアの公平性のための第1の正則化項126、および異常位置特定スコアの公平性のための第2の正則化項128のうちの少なくとも1つを含む。一部の実施形態では、異常スコアの公平性のための第1の正則化項126は、類似する公平な特徴および類似しない不公平な特徴を含む入力に対して、異常スコア116を類似するようにし、それによって、不公平な特徴の影響を減らすか、または除去する。同様に、一部の実施形態では、異常位置特定スコアの公平性のための第2の正則化項128は、類似する公平な特徴および類似しない不公平な特徴を含む入力に対して、異常位置特定スコア118を類似するようにし、それによって、不公平な特徴の影響を減らすか、または除去する。一部の実施形態では、動作302は、異常検出システム112を、リモートのデータ処理システムから、コンピュータ、サーバ、車両100、システム200、または別のデバイスなどのデバイスにダウンロードすることを含む。
【0046】
動作304は、新しいデータ(例えば、ドライブ・レコーダ102からのデータまたはデータ202)を異常検出システム112に入力することを含む。動作306は、新しいデータに基づいて、異常検出システム112によって異常スコア116または異常位置特定スコア118あるいはその両方を生成することを含む。一部の実施形態では、異常スコア116は、新しいデータに関する過去のデータ114のガウス確率分布120、精度行列∧124、または平均ベクトル、あるいはその組合せの負の対数尤度(例えば、-lnN(x|0,∧-1))に基づくことができ、一方、異常位置特定スコア118は、補完する特徴に対して条件付けられた新しいデータの特徴に関する過去のデータ114のガウス確率分布120、精度行列∧124、または平均ベクトル、あるいはその組合せの負の条件付き対数尤度(例えば、-lnN(xd|x-d,0,∧-1))に基づくことができる。
【0047】
動作308は、異常スコア116または異常位置特定スコア118あるいはその両方を別のデバイス、システム、サブシステム、またはコンピュータに送信することを含む。一部の実施形態では、異常スコア116または異常位置特定スコア118あるいはその両方は、ネットワーク130を介してリモートのデータ処理システムに送信される。
【0048】
動作310は、異常スコア116または異常位置特定スコア118あるいはその両方に基づいて緩和処置を実行することを含む。緩和処置は、ユーザに提示される通知、警報、報告、もしくは警告、例えば救急サービスに送信される通知、警報、報告、もしくは警告、または異常スコア116もしくは異常位置特定スコア118またはその両方に関連付けられた1つまたは複数のデバイスもしくはシステムの変更、あるいはその組合せに関連することができる。異常スコア116または異常位置特定スコア118あるいはその両方に関連付けられたデバイスが車両100である実施形態では、緩和処置は加速、減速、旋回、ブレーキなどに関連することができる。
【0049】
図4は、本開示の一部の実施形態に従う、異常検出システム112をトレーニングするための例示的な方法400のフローチャートを示している。方法400は、異常検出システム112、コンピュータ、プロセッサ、あるいは別の構成のハードウェアもしくはソフトウェアまたはその両方によって実装され得る。一部の実施形態では、方法400は、
図3の動作302の下位の方法である。
【0050】
動作402は、過去のデータ114から特徴ベクトルを抽出することを含む。一部の実施形態では、動作402は、平均ベクトルがゼロに等しくなるように、特徴ベクトルを標準化することを含む。
【0051】
動作404は、過去のデータ114の特徴ベクトルのガウス確率分布120を決定することを含む。動作406は、関数122の事前計算可能な部分(例えば、方程式1または2の事前計算可能な部分)を計算することを含む。例えば、方程式2では、動作406は、正則化項の経験的共分散行列Sまたは他の事前計算可能な部分あるいはその両方を計算することを含むことができる。
【0052】
動作408は、精度行列∧124を操作して関数122を減らすか、または最小化することによって、精度行列∧124を学習することを含む。一部の実施形態では、動作406は、確率的勾配降下法(SGD)を使用することを含む。他の実施形態では、異常検出モデルは、ブロック座標勾配降下法、または循環ブロック座標降下法、ランダムに並べ替えられた循環ブロック座標降下法、ランダム化ブロック座標降下法などの、ただしこれらに限定されない別の方法を使用することによって、精度行列∧124を学習する。動作406は、関数122を既定のしきい値未満に減らすこと、連続する反復が既定のしきい値未満の変化をもたらすまで関数122を減らすこと、既定の反復回数の間、関数122を減らすこと、絶対最小値が見つかるまで関数122を減らすこと、または関数122を許容できる量だけ減らすための別の方法を含むことができる。
【0053】
図5は、本開示の一部の態様に関する実験結果の表500を示している。本開示の態様の実験検証が、トレーニングおよびテスト用のN=1000個のデータ点およびD=10の特徴数を含んでいる合成データセットに対して実行された。共分散行列Σは、正半定値の制限付きでランダムに生成された。次に、分布N(x|0,Σ)からD次元データが生成された。不公平な特徴がx
uとして設定され、一方、異常な特徴がx
aとして設定された(x
aはx
uに等しくてはならない)。テスト・データの半分に関して、x
aに関連する分散および共分散が破損していた。
【0054】
結果を評価するために、2種類の曲線下面積(AUC:Area Under the Curve)データが使用された。各入力の異常分類が正しかったかどうかを検出するためにAUC異常検出(AUC AD:AUC-Anomaly Detection)が使用され、検出された異常の根本原因が正しかったかどうかを判定するためにAUC異常位置特定(AUC AL:AUC-Anomaly Localization)が使用された。さらに、類似する公平な特徴および類似しない不公平な特徴を含むデータの異常スコア116および異常位置特定スコア118が実際に類似していたかどうかを判定することによって、公平性が評価された。公平性の異常検出の等化オッズ(EO AD:Equalized Odds for Anomaly Detection)測定が、2つのサンプルから計算された2つの異常スコア116間の二乗差を構成し、一方、公平性の異常位置特定の等化オッズ(EO AL:Equalized Odds for Anomaly Localization)(例えば、
【数12】
)測定が、2つのサンプルから計算されたすべての特徴の2つの異常位置特定スコア118間の二乗差を構成した(例えば、
【数13】
)。表500は、(例えば、異常スコアに関連する)第1の正則化項も(例えば、異常位置特定スコアに関連する)第2の正則化項も含んでいない異常検出モデルの結果を、第1の正則化項を含んでいる異常検出システム112、第2の正則化項を含んでいる異常検出システム112、および第1の正則化項と第2の正則化項の両方を含んでいる異常検出システム112と比較している。
【0055】
表500に示されているように、AUC測定の場合、大きいほどより良く、一方、EO測定の場合、小さいほどより良い。表500に示されているように、3つの実験モデルのAUC ADおよびAUC ALは、ベースライン・モデルのAUC ADおよびAUC AL以上である。同様に、3つの実験モデルの各々のEO ADおよびEO ALは、ベースライン・モデルのEO ADおよびEO AL以下である。まとめると、これらの実験結果は、(i)ベースライン・モデルと比較して性能が改善された(または少なくとも維持された)こと、(ii)ベースライン・モデルと比較して、すべての事例において公平性が改善されたこと、ならびに(iii)正則化項のうちのどちらかが分離して使用された場合、および両方の正則化項が一緒に使用された場合に、性能の改善および公平性の改善が実現されたことを示している。
図5は、本開示の態様が、異常検出システム112が性能の損失を伴わずに公平性を改善することを実現することに成功したということを示している。
【0056】
図6は、本開示の一部の実施形態に従う、例示的なコンピュータ600のブロック図を示している。さまざまな実施形態では、コンピュータ600は、
図3~
図4で説明された方法のいずれかまたはすべてを実行すること、
図1~
図2で説明された機能を実装すること、または
図5で説明された実験結果を実現すること、あるいはその組合せを実行することができる。一部の実施形態では、コンピュータ600は、ネットワーク650を介してリモートのデータ処理システムからプロセッサ実行可能命令をダウンロードすることによって、前述の方法および機能に関連する命令を受信する。他の実施形態では、コンピュータ600は、コンピュータ600によって提供された命令に基づいてクライアント・マシンが方法または方法の一部を実行するように、前述の方法または機能あるいはその両方のための命令をクライアント・マシンに提供する。一部の実施形態では、コンピュータ600は、異常検出システム112、車両100、ドライブ・レコーダ102、システム200、または本開示の他の態様、あるいはその組合せに組み込まれる(またはコンピュータ600に類似する機能が、これらに仮想的にプロビジョニングされる)。
【0057】
コンピュータ600は、メモリ625、ストレージ630、相互接続620(例えば、バス)、1つまたは複数のCPU605(本明細書ではプロセッサとも呼ばれる)、I/Oデバイス・インターフェイス610、I/Oデバイス612、およびネットワーク・インターフェイス615を含んでいる。
【0058】
各CPU605は、メモリ625またはストレージ630に格納されたプログラミング命令を取得して実行する。相互接続620は、プログラミング命令などのデータを、CPU605、I/Oデバイス・インターフェイス610、ストレージ630、ネットワーク・インターフェイス615、およびメモリ625の間で移動するために使用される。相互接続620は、1つまたは複数のバスを使用して実装されることができる。さまざまな実施形態では、CPU605は、単一のCPU、複数のCPU、または複数のプロセッシング・コアを含んでいる単一のCPUであることができる。一部の実施形態では、CPU605は、デジタル信号プロセッサ(DSP:digital signal processor)であることができる。一部の実施形態では、CPU605は、1つまたは複数の3D集積回路(3DIC:3D integrated circuit)(例えば、3Dウエハー・レベル・パッケージング(3DWLP:3D wafer-level packaging)、3Dインターポーザベースの統合、3DスタックIC(3D-SIC:3D stacked IC)、モノリシック3D IC、3D異種統合、3Dシステム・イン・パッケージ(3DSiP:3D system in package)、またはパッケージ・オン・パッケージ(PoP:package on package)CPU構成、あるいはその組合せ)を含む。メモリ625は、一般に、ランダム・アクセス・メモリ(例えば、スタティック・ランダム・アクセス・メモリ(SRAM:static random-access memory)、ダイナミック・ランダム・アクセス・メモリ(DRAM:dynamic random access memory)、またはフラッシュ)を表すために含められている。ストレージ630は、一般に、ハード・ディスク・ドライブ、半導体デバイス(SSD:solid state device)、取り外し可能メモリ・カード、光ストレージ、またはフラッシュ・メモリ・デバイスなどの、不揮発性メモリを表すために含められている。代替の実施形態では、ストレージ630は、I/Oデバイス・インターフェイス610を介してコンピュータ600に接続されたか、またはネットワーク・インターフェイス615を介してネットワーク650に接続された、ストレージ領域ネットワーク(SAN:storage area-network)デバイス、クラウド、またはその他のデバイスに置き換えられることができる。
【0059】
一部の実施形態では、メモリ625は命令660を格納する。しかし、さまざまな実施形態では、命令660は、メモリ625およびストレージ630それぞれに部分的に格納されるか、またはメモリ625もしくはストレージ630に完全に格納されるか、またはネットワーク・インターフェイス615を介してネットワーク650を経由してアクセスされる。
【0060】
命令660は、
図3~
図4の方法の任意の一部またはすべてを実行すること、
図1~
図2の任意の一部で説明された機能を実装すること、または
図5で説明された実験結果を実現すること、あるいはその組合せのためのコンピュータ可読命令およびコンピュータ実行可能命令であることができる。命令660がメモリ625内に示されているが、命令660は、多数のコンピュータ可読ストレージ媒体にわたって集合的に格納された、1つまたは複数のCPU605によって実行可能なプログラム命令を含むことができる。
【0061】
さまざまな実施形態では、I/Oデバイス612は、情報を提示し、入力を受信することができるインターフェイスを含む。例えば、I/Oデバイス612は、情報をコンピュータ600と対話しているユーザに提示し、ユーザから入力を受信することができる。
【0062】
コンピュータ600は、ネットワーク・インターフェイス615を介してネットワーク650に接続される。ネットワーク650は、物理的ネットワーク、無線ネットワーク、セルラー・ネットワーク、または異なるネットワークを含むことができる。
【0063】
本開示にはクラウド・コンピューティングに関する詳細な説明が含まれているが、本明細書において示された内容の実装は、クラウド・コンピューティング環境に限定されないと理解されるべきである。むしろ、本発明の実施形態は、現在既知であるか、または今後開発される任意のその他の種類のコンピューティング環境と組み合わせて実装できる。
【0064】
クラウド・コンピューティングは、構成可能な計算リソース(例えば、ネットワーク、ネットワーク帯域幅、サーバ、処理、メモリ、ストレージ、アプリケーション、仮想マシン、およびサービス)の共有プールへの便利なオンデマンドのネットワーク・アクセスを可能にするためのサービス提供モデルであり、管理上の手間またはサービス・プロバイダとのやりとりを最小限に抑えて、これらのリソースを迅速にプロビジョニングおよび解放することができる。このクラウド・モデルは、少なくとも5つの特徴、少なくとも3つのサービス・モデル、および少なくとも4つのデプロイメント・モデルを含んでよい。
【0065】
特徴は、次のとおりである。
【0066】
オンデマンドのセルフ・サービス:クラウドの利用者は、サーバの時間、ネットワーク・ストレージなどの計算能力を一方的に、サービス・プロバイダとの人間的なやりとりを必要とせず、必要に応じて自動的にプロビジョニングすることができる。
【0067】
幅広いネットワーク・アクセス:能力は、ネットワークを経由して利用可能であり、標準的なメカニズムを使用してアクセスできるため、異種のシン・クライアントまたはシック・クライアント・プラットフォーム(例えば、携帯電話、ラップトップ、およびPDA)による利用を促進する。
【0068】
リソース・プール:プロバイダの計算リソースは、プールされ、マルチテナント・モデルを使用して複数の利用者に提供される。さまざまな物理的および仮想的リソースが、要求に従って動的に割り当ておよび再割り当てされる。場所に依存しないという感覚があり、利用者は通常、提供されるリソースの正確な場所に関して管理することも知ることもないが、さらに高い抽象レベルでは、場所(例えば、国、州、またはデータセンター)を指定できることがある。
【0069】
迅速な順応性:能力は、迅速かつ柔軟に、場合によっては自動的にプロビジョニングされ、素早くスケールアウトし、迅速に解放されて素早くスケールインすることができる。プロビジョニングに使用できる能力は、利用者には、多くの場合、任意の量をいつでも無制限に購入できるように見える。
【0070】
測定されるサービス:クラウド・システムは、計測機能を活用することによって、サービスの種類(例えば、ストレージ、処理、帯域幅、およびアクティブなユーザのアカウント)に適した抽象レベルで、リソースの使用を自動的に制御および最適化する。リソースの使用状況は監視、制御、および報告することができ、利用されるサービスのプロバイダと利用者の両方に透明性が提供される。
【0071】
サービス・モデルは、次のとおりである。
【0072】
SaaS(Software as a Service):利用者に提供される能力は、クラウド・インフラストラクチャ上で稼働しているプロバイダのアプリケーションの利用である。それらのアプリケーションは、Webブラウザ(例えば、Webベースの電子メール)などのシン・クライアント・インターフェイスを介して、さまざまなクライアント・デバイスからアクセスできる。利用者は、ネットワーク、サーバ、オペレーティング・システム、ストレージ、または個々のアプリケーション機能を含む基盤になるクラウド・インフラストラクチャを、限定的なユーザ固有のアプリケーション構成設定を行う可能性を除き、管理することも制御することもない。
【0073】
PaaS(Platform as a Service):利用者に提供される能力は、プロバイダによってサポートされるプログラミング言語およびツールを使用して作成された、利用者が作成または取得したアプリケーションをクラウド・インフラストラクチャにデプロイすることである。利用者は、ネットワーク、サーバ、オペレーティング・システム、またはストレージを含む基盤になるクラウド・インフラストラクチャを管理することも制御することもないが、デプロイされたアプリケーション、および場合によってはアプリケーション・ホスティング環境の構成を制御することができる。
【0074】
IaaS(Infrastructure as a Service):利用者に提供される能力は、処理、ストレージ、ネットワーク、およびその他の基本的な計算リソースのプロビジョニングであり、利用者は、オペレーティング・システムおよびアプリケーションを含むことができる任意のソフトウェアをデプロイして実行できる。利用者は、基盤になるクラウド・インフラストラクチャを管理することも制御することもないが、オペレーティング・システム、ストレージ、およびデプロイされたアプリケーションを制御することができ、場合によっては、選択されたネットワーク・コンポーネント(例えば、ホスト・ファイアウォール)を限定的に制御できる。
【0075】
デプロイメント・モデルは、次のとおりである。
【0076】
プライベート・クラウド:このクラウド・インフラストラクチャは、ある組織のためにのみ運用される。この組織またはサード・パーティによって管理することができ、オンプレミスまたはオフプレミスに存在することができる。
【0077】
コミュニティ・クラウド:このクラウド・インフラストラクチャは、複数の組織によって共有され、関心事(例えば、任務、セキュリティ要件、ポリシー、およびコンプライアンスに関する考慮事項)を共有している特定のコミュニティをサポートする。これらの組織またはサード・パーティによって管理することができ、オンプレミスまたはオフプレミスに存在することができる。
【0078】
パブリック・クラウド:このクラウド・インフラストラクチャは、一般ユーザまたは大規模な業界団体が使用できるようになっており、クラウド・サービスを販売する組織によって所有される。
【0079】
ハイブリッド・クラウド:このクラウド・インフラストラクチャは、データとアプリケーションの移植を可能にする標準化された技術または独自の技術(例えば、クラウド間の負荷バランスを調整するためのクラウド・バースト)によって固有の実体を残したまま互いに結合された2つ以上のクラウド(プライベート、コミュニティ、またはパブリック)の複合である。
【0080】
クラウド・コンピューティング環境は、ステートレス、疎結合、モジュール性、および意味的相互運用性に重点を置いたサービス指向の環境である。クラウド・コンピューティングの中心になるのは、相互接続されたノードのネットワークを含んでいるインフラストラクチャである。
【0081】
ここで
図7を参照すると、例示的なクラウド・コンピューティング環境50が示されている。図示されているように、クラウド・コンピューティング環境50は、クラウドの利用者によって使用されるローカル・コンピューティング・デバイス(例えば、パーソナル・デジタル・アシスタント(PDA:personal digital assistant)または携帯電話54A、デスクトップ・コンピュータ54B、ラップトップ・コンピュータ54C、または自動車コンピュータ・システム54N、あるいはその組合せなど)が通信できる1つまたは複数のクラウド・コンピューティング・ノード10を含んでいる。ノード10は、互いに通信してよい。ノード10は、1つまたは複数のネットワーク内で、本明細書において前述されたプライベート・クラウド、コミュニティ・クラウド、パブリック・クラウド、またはハイブリッド・クラウド、あるいはこれらの組合せなどに、物理的または仮想的にグループ化され得る(図示されていない)。これによって、クラウド・コンピューティング環境50は、クラウドの利用者がローカル・コンピューティング・デバイス上でリソースを維持する必要のないインフラストラクチャ、プラットフォーム、またはSaaS、あるいはその組合せを提供できる。
図7に示されたコンピューティング・デバイス54A~Nの種類は、例示のみが意図されており、コンピューティング・ノード10およびクラウド・コンピューティング環境50は、任意の種類のネットワークまたはネットワーク・アドレス可能な接続(例えば、Webブラウザを使用した接続)あるいはその両方を経由して任意の種類のコンピュータ制御デバイスと通信することができると理解される。
【0082】
ここで
図8を参照すると、クラウド・コンピューティング環境50(
図7)によって提供される機能的抽象レイヤのセットが示されている。
図8に示されたコンポーネント、レイヤ、および機能は、例示のみが意図されており、本発明の実施形態がこれらに限定されないということが、あらかじめ理解されるべきである。図示されているように、次のレイヤおよび対応する機能が提供される。
【0083】
ハードウェアおよびソフトウェア・レイヤ60は、ハードウェア・コンポーネントおよびソフトウェア・コンポーネントを含む。ハードウェア・コンポーネントの例としては、メインフレーム61、RISC(Reduced Instruction Set Computer)アーキテクチャベースのサーバ62、サーバ63、ブレード・サーバ64、ストレージ・デバイス65、ならびにネットワークおよびネットワーク・コンポーネント66が挙げられる。一部の実施形態では、ソフトウェア・コンポーネントは、ネットワーク・アプリケーション・サーバ・ソフトウェア67およびデータベース・ソフトウェア68を含む。
【0084】
仮想化レイヤ70は、仮想サーバ71、仮想ストレージ72、仮想プライベート・ネットワークを含む仮想ネットワーク73、仮想アプリケーションおよびオペレーティング・システム74、ならびに仮想クライアント75などの仮想的実体を提供できる抽象レイヤを備える。
【0085】
一例を挙げると、管理レイヤ80は、以下で説明される機能を提供することができる。リソース・プロビジョニング81は、クラウド・コンピューティング環境内でタスクを実行するために利用される計算リソースおよびその他のリソースの動的調達を行う。計測および価格設定82は、クラウド・コンピューティング環境内でリソースが利用される際のコスト追跡、およびそれらのリソースの利用に対する請求書またはインボイスの送付を行う。一例を挙げると、それらのリソースは、アプリケーション・ソフトウェア・ライセンスを含んでよい。セキュリティは、クラウドの利用者およびタスクのID検証を行うとともに、データおよびその他のリソースの保護を行う。ユーザ・ポータル83は、クラウド・コンピューティング環境へのアクセスを利用者およびシステム管理者に提供する。サービス・レベル管理84は、必要なサービス・レベルを満たすように、クラウドの計算リソースの割り当てと管理を行う。サービス水準合意(SLA:Service Level Agreement)計画および実行85は、今後の要求が予想されるクラウドの計算リソースの事前準備および調達を、SLAに従って行う。
【0086】
ワークロード・レイヤ90は、クラウド・コンピューティング環境で利用できる機能の例を示している。このレイヤから提供されるワークロードおよび機能の例としては、マッピングおよびナビゲーション91、ソフトウェア開発およびライフサイクル管理92、仮想クラスルーム教育の配信93、データ解析処理94、トランザクション処理95、および公平な異常検出および異常位置特定96が挙げられる。
【0087】
本発明の実施形態は、任意の可能な統合の技術的詳細レベルで、システム、方法、またはコンピュータ・プログラム製品、あるいはその組合せであることができる。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令を含んでいるコンピュータ可読ストレージ媒体を含むことができる。
【0088】
コンピュータ可読ストレージ媒体は、命令実行デバイスによって使用するための命令を保持および格納できる有形のデバイスであることができる。コンピュータ可読ストレージ媒体は、例えば、電子ストレージ・デバイス、磁気ストレージ・デバイス、光ストレージ・デバイス、電磁ストレージ・デバイス、半導体ストレージ・デバイス、またはこれらの任意の適切な組合せであることができるが、これらに限定されない。コンピュータ可読ストレージ媒体のさらに具体的な例の非網羅的リストは、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ(RAM:random access memory)、読み取り専用メモリ(ROM:read-only memory)、消去可能プログラマブル読み取り専用メモリ(EPROM:erasable programmable read-only memoryまたはフラッシュ・メモリ)、スタティック・ランダム・アクセス・メモリ(SRAM:static random access memory)、ポータブル・コンパクト・ディスク読み取り専用メモリ(CD-ROM:compact disc read-only memory)、デジタル・バーサタイル・ディスク(DVD:digital versatile disk)、メモリ・スティック、フロッピー(R)・ディスク、命令が記録されているパンチカードまたは溝の中の隆起構造などの機械的にエンコードされるデバイス、およびこれらの任意の適切な組合せを含む。本明細書において使用されるとき、コンピュータ可読ストレージ媒体は、それ自体が、電波またはその他の自由に伝搬する電磁波、導波管またはその他の送信媒体を伝搬する電磁波(例えば、光ファイバ・ケーブルを通過する光パルス)、あるいはワイヤを介して送信される電気信号などの一過性の信号であると解釈されるべきではない。
【0089】
本明細書に記載されたコンピュータ可読プログラム命令は、コンピュータ可読ストレージ媒体から各コンピューティング・デバイス/処理デバイスへ、またはネットワーク(例えば、インターネット、ローカル・エリア・ネットワーク、広域ネットワーク、または無線ネットワーク、あるいはその組合せ)を介して外部コンピュータまたは外部ストレージ・デバイスへダウンロードされることができる。このネットワークは、銅伝送ケーブル、光伝送ファイバ、無線送信、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバ、あるいはその組合せを備えることができる。各コンピューティング・デバイス/処理デバイス内のネットワーク・アダプタ・カードまたはネットワーク・インターフェイスは、コンピュータ可読プログラム命令をネットワークから受信し、それらのコンピュータ可読プログラム命令を各コンピューティング・デバイス/処理デバイス内のコンピュータ可読ストレージ媒体に格納するために転送する。
【0090】
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セット・アーキテクチャ(ISA:instruction-set-architecture)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路用の構成データ、あるいは、Smalltalk(R)、C++などのオブジェクト指向プログラミング言語、および「C」プログラミング言語または同様のプログラミング言語などの手続き型プログラミング言語を含む1つまたは複数のプログラミング言語の任意の組合せで記述されたソース・コードまたはオブジェクト・コードであることができる。コンピュータ可読プログラム命令は、ユーザのコンピュータ上で全体的に実行すること、ユーザのコンピュータ上でスタンドアロン・ソフトウェア・パッケージとして部分的に実行すること、ユーザのコンピュータ上およびリモート・コンピュータ上でそれぞれ部分的に実行すること、あるいはリモート・コンピュータ上またはサーバ上で全体的に実行することができる。後者のシナリオでは、リモート・コンピュータは、ローカル・エリア・ネットワーク(LAN:local area network)または広域ネットワーク(WAN:wide area network)を含む任意の種類のネットワークを介してユーザのコンピュータに接続されることができ、または接続は、(例えば、インターネット・サービス・プロバイダを使用してインターネットを介して)外部コンピュータに対して行われることができる。一部の実施形態では、本発明の態様を実行するために、例えばプログラマブル・ロジック回路、フィールドプログラマブル・ゲート・アレイ(FPGA:field-programmable gate array)、またはプログラマブル・ロジック・アレイ(PLA:programmable logic array)を含む電子回路は、コンピュータ可読プログラム命令の状態情報を利用することによって、電子回路をカスタマイズするためのコンピュータ可読プログラム命令を実行することができる。
【0091】
本発明の態様は、本明細書において、本発明の実施形態に従って、方法、装置(システム)、およびコンピュータ・プログラム製品のフローチャート図またはブロック図あるいはその両方を参照して説明される。フローチャート図またはブロック図あるいはその両方の各ブロック、ならびにフローチャート図またはブロック図あるいはその両方に含まれるブロックの組合せが、コンピュータ可読プログラム命令によって実装されることができるということが理解されるであろう。
【0092】
これらのコンピュータ可読プログラム命令は、コンピュータまたはその他のプログラム可能なデータ処理装置のプロセッサを介して実行される命令が、フローチャートまたはブロック図あるいはその両方のブロックに指定される機能/動作を実施する手段を作り出すべく、汎用コンピュータ、専用コンピュータ、または他のプログラム可能なデータ処理装置のプロセッサに提供されてマシンを作り出すものであることができる。これらのコンピュータ可読プログラム命令は、命令が格納されたコンピュータ可読ストレージ媒体がフローチャートまたはブロック図あるいはその両方のブロックに指定される機能/動作の態様を実施する命令を含んでいる製品を備えるように、コンピュータ可読ストレージ媒体に格納され、コンピュータ、プログラム可能なデータ処理装置、または他のデバイス、あるいはその組合せに特定の方式で機能するように指示できるものであることもできる。
【0093】
コンピュータ可読プログラム命令は、コンピュータ上、その他のプログラム可能な装置上、またはその他のデバイス上で実行される命令が、フローチャートまたはブロック図あるいはその両方のブロックに指定される機能/動作を実施するように、コンピュータ、その他のプログラム可能なデータ処理装置、またはその他のデバイスに読み込まれることもでき、それによって、一連の動作可能なステップを、コンピュータ上、その他のプログラム可能な装置上、またはコンピュータ実装プロセスを生成するその他のデバイス上で実行させる。
【0094】
図内のフローチャートおよびブロック図は、本発明のさまざまな実施形態に従って、システム、方法、およびコンピュータ・プログラム製品の可能な実装のアーキテクチャ、機能、および動作を示す。これに関連して、フローチャートまたはブロック図内の各ブロックは、規定された論理機能を実装するための1つまたは複数の実行可能な命令を含んでいる、命令のモジュール、セグメント、またはサブセットを表すことができる。一部の代替の実装では、ブロックに示された機能は、図に示された順序とは異なる順序で発生することができる。例えば、連続して示された2つのブロックは、実際には、含まれている機能に応じて、実質的に同時に実行されるか、または場合によっては逆の順序で実行され得る。ブロック図またはフローチャート図あるいはその両方の各ブロック、ならびにブロック図またはフローチャート図あるいはその両方に含まれるブロックの組合せは、規定された機能もしくは動作を実行するか、または専用ハードウェアとコンピュータ命令の組合せを実行する専用ハードウェアベースのシステムによって実装されることができるということにも注意する。
【0095】
CD、DVDなどのストレージ媒体を読み込むことを介して、クライアント、サーバ、およびプロキシ・コンピュータに手動で直接読み込むことによって、プロセス・ソフトウェア(例えば、
図3~
図4に関して説明された方法の任意の部分を実行するか、または
図1~
図2で説明された機能の任意の部分を実装するか、あるいはその両方を行うように構成された、
図6の命令660に格納された命令のいずれかまたは任意のソフトウェアあるいはその両方)がデプロイされることができるということが理解されるが、プロセス・ソフトウェアは、プロセス・ソフトウェアを中央サーバまたは中央サーバのグループに送信することによって、コンピュータ・システムに自動的または半自動的にデプロイされることもできる。その後、プロセス・ソフトウェアは、プロセス・ソフトウェアを実行するクライアント・コンピュータにダウンロードされる。代替として、プロセス・ソフトウェアは、電子メールを介してクライアント・システムに直接送信される。その後、プロセス・ソフトウェアは、ディレクトリに分離されるか、またはプロセス・ソフトウェアをディレクトリに分離するプログラム命令のセットを実行することによって、ディレクトリに読み込まれる。別の代替手段は、プロセス・ソフトウェアをクライアント・コンピュータのハード・ドライブ上のディレクトリに直接送信することである。プロキシ・サーバが存在する場合、プロセスは、プロキシ・サーバのコードを選択し、プロキシ・サーバのコードを配置するコンピュータを決定し、プロキシ・サーバのコードを送信し、その後、プロキシ・サーバのコードをプロキシ・コンピュータにインストールする。プロセス・ソフトウェアは、プロキシ・サーバに送信されてから、プロキシ・サーバに格納される。
【0096】
本発明の実施形態は、クライアント企業、非営利組織、政府機関、内部組織構造などとのサービス契約の一部として配信されることもできる。これらの実施形態は、本明細書に記載された方法の一部またはすべてを実装するソフトウェア、ハードウェア、およびWebサービスを実行するようにコンピュータ・システムを構成することと、そのようなソフトウェア、ハードウェア、およびWebサービスをデプロイすることとを含むことができる。これらの実施形態は、クライアントの動作を解析することと、解析に応答して推奨を作成することと、推奨のサブセットを実施するシステムを構築することと、システムを既存のプロセスおよびインフラストラクチャに統合することと、システムの使用を計測することと、費用をシステムのユーザの割り当てることと、請求書を送付するか、インボイスを送付する(例えば、インボイスを生成する)か、またはその他の方法でシステムの使用に対する支払いを受信することとを含むこともできる。
【0097】
本明細書で使用される用語は、特定の実施形態を説明することのみを目的としており、さまざまな実施形態を制限することを意図していない。本明細書において使用されるとき、単数形「a」、「an」、および「the」は、文脈で特に明示的に示されない限り、複数形も含むよう意図されている。「含む」または「含んでいる」あるいはその両方の用語は、本明細書で使用される場合、記載された機能、整数、ステップ、動作、要素、またはコンポーネント、あるいはその組合せの存在を示すが、1つまたは複数のその他の機能、整数、ステップ、動作、要素、コンポーネント、またはこれらのグループ、あるいはその組合せの存在または追加を除外していないということが、さらに理解されるであろう。さまざまな実施形態のうちの例示的な実施形態の前の詳細な説明では、本明細書の一部を形成する(類似する番号が類似する要素を表す)添付の図面への参照が行われ、特定の実施形態例が例として示されており、さまざまな実施形態が実践されることができる。これらの実施形態は、当業者が実施形態を実践できるようにするために十分詳細に説明されたが、他の実施形態が使用されることができ、さまざまな実施形態の範囲から逸脱することなく、論理的変更、機械的変更、電気的変更、およびその他の変更が行われることができる。前の説明では、さまざまな実施形態の完全な理解を可能にするために、多くの特定の詳細が示された。しかし、さまざまな実施形態は、それらの特定の詳細なしで実践されることができる。他の例では、実施形態を不明瞭にしないために、周知の回路、構造、および技術は詳細に示されていない。
【0098】
「実施形態」という用語の異なる事例は、本明細書内で使用されるとき、同じ実施形態を必ずしも参照しないが、同じ実施形態を参照することもできる。本明細書において示されたか、または説明されたすべてのデータおよびデータ構造は単なる例であり、他の実施形態では、異なるデータの量、データの種類、フィールド、フィールドの数および種類、フィールド名、行の数および種類、レコード、エントリ、またはデータの編成が使用されることができる。加えて、分離したデータ構造が必要でなくてよいように、任意のデータが論理と組み合わせられることができる。したがって、前の詳細な説明は、限定する意味で受け取られるべきではない。
【0099】
本開示のさまざまな実施形態の説明は、例示の目的で提示されているが、網羅的であることは意図されておらず、開示された実施形態に限られない。説明された実施形態の範囲から逸脱しない多くの変更および変形が、当業者にとって明らかであろう。本明細書で使用された用語は、実施形態の原理、実際の適用、または市場で見られる技術を超える技術的改良を最も適切に説明するため、または他の当業者が本明細書で開示された実施形態を理解できるようにするために選択されている。
【0100】
本開示は、特定の実施形態に関して説明されたが、実施形態の変更および修正が当業者にとって明らかになるということが予想される。したがって、以下の特許請求の範囲が、そのようなすべての変更および修正を、本開示の真の範囲に含まれるとして、対象にすると解釈されるということが意図される。
【0101】
本開示で説明されたすべての利点は例示的な利点であり、本開示の範囲内にとどまりながら、説明された利点のすべてまたは一部を実現するか、あるいはいずれも実現しない本開示の実施形態が存在することができる。
【0102】
以下では、本開示の一部の態様を示すために、実施例の非限定的リストが提供される。実施例1はシステムである。このシステムは、車両、観測された車両データを収集する複数のセンサ、観測された車両データを集約して格納するように構成されたドライブ・レコーダ、およびドライブ・レコーダに通信可能に結合された異常検出システムを含み、異常検出システムは過去の車両データの確率分布を含み、関数をしきい値未満に減らすように確率分布のパラメータが調整され、この関数は、過去の車両データに対して条件付けられた確率分布と、類似する公平な特徴を有し、不公平な特徴と無関係である入力の確率分布の類似する出力を生成するように構成された少なくとも1つの正則化項とに基づき、異常検出システムは、確率分布、パラメータ、および観測された車両データに基づく異常スコアおよび異常位置特定スコアをさらに含む。
【0103】
実施例2は、任意選択的特徴を含んでいるか、または除外している、実施例1のシステムを含む。この実施例では、少なくとも1つの正則化項が、類似する公平な特徴および類似しない不公平な特徴を含んでいる入力に対して類似する異常スコアを生成するように構成された第1の正則化項と、類似する公平な特徴および類似しない不公平な特徴を含んでいる入力に対して類似する異常位置特定スコアを生成するように構成された第2の正則化項とを含む。
【0104】
実施例3は、任意選択的特徴を含んでいるか、または除外している、実施例1~2のうちのいずれか1つのシステムを含む。この実施例では、確率分布がガウス分布であり、パラメータが平均ベクトルおよび精度行列を含む。
【0105】
実施例4は、任意選択的特徴を含んでいるか、または除外している、実施例1~3のうちのいずれか1つのシステムを含む。この実施例では、関数をしきい値未満に減らすことが、確率的勾配降下法(SGD)を使用して実行される。
【0106】
実施例5は、任意選択的特徴を含んでいるか、または除外している、実施例1~4のうちのいずれか1つのシステムを含む。この実施例では、異常検出システムは、異常スコアおよび異常位置特定スコアに基づいて緩和処置を実行することを含んでいる方法を実行するように構成される。
【0107】
実施例6はコンピュータ実装方法である。この方法は、車両データの異常スコアおよび異常位置特定スコアを生成するように構成された異常検出システムをトレーニングすることであって、異常検出システムが、第1の正則化項および第2の正則化項を使用して、類似する公平な特徴を有し、不公平な特徴と無関係である過去の車両データの類似する異常スコアおよび異常位置特定スコアを生成するようにトレーニングされる、トレーニングすることと、異常検出システムで、車両上の複数のセンサからデータを収集するドライブ・レコーダから新しい車両データを受信することと、新しい車両データに関連付けられた第1の異常スコアおよび第1の異常位置特定スコアを生成することと、第1の異常スコアおよび第1の異常位置特定スコアに基づいて緩和処置を実行することであって、この緩和処置が車両を変更する、実行することとを含む。
【0108】
実施例7は、任意選択的特徴を含んでいるか、または除外している、実施例6の方法を含む。この実施例では、異常検出システムをトレーニングすることが、過去の車両データのガウス確率分布を生成することと、関数をしきい値未満に減らす平均ベクトルおよび精度行列を学習することとをさらに含み、この関数は、過去の車両データ、精度行列のL1正則化項、第1の正則化項、および第2の正則化項を前提として、ガウス確率分布の負の対数尤度に基づく。任意選択的に、第1の異常スコアおよび第1の異常位置特定スコアは、新しい車両データ、ガウス確率分布、平均ベクトル、および精度行列に基づく。
【0109】
実施例8はコンピュータ実装方法である。この方法は、過去のデータのガウス分布、ガウス分布の平均ベクトル、およびガウス分布の精度行列に基づいて異常検出モデルを生成することであって、平均ベクトルおよび精度行列が、関数をしきい値未満に減らすことによって生成され、この関数が、ガウス分布、類似する公平な特徴を有し、不公平な特徴と無関係である入力の類似する異常スコアを生成するように構成された第1の正則化項、および類似する公平な特徴を有し、不公平な特徴と無関係である入力の類似する異常位置特定スコアを生成するように構成された第2の正則化項を含む、生成することと、新しいデータを異常検出モデルに入力することと、ガウス分布、平均ベクトル、および精度行列に基づいて、新しいデータに関連付けられた異常スコアおよび異常位置特定スコアを生成することとを含む。
【0110】
実施例9は、任意選択的特徴を含んでいるか、または除外している、実施例8の方法を含む。この実施例では、異常スコアが異常の存在を示し、異常位置特定スコアが異常の発生源を示す。
【0111】
実施例10は、任意選択的特徴を含んでいるか、または除外している、実施例8~9のうちのいずれか1つの方法を含む。この実施例では、確率的勾配降下法(SGD)を使用して関数が減らされる。
【0112】
実施例11は、任意選択的特徴を含んでいるか、または除外している、実施例8~10のうちのいずれか1つの方法を含む。この実施例では、過去のデータのガウス分布、平均ベクトル、および精度行列に従って、異常スコアが新しいデータの負の対数尤度である。
【0113】
実施例12は、任意選択的特徴を含んでいるか、または除外している、実施例8~11のうちのいずれか1つの方法を含む。この実施例では、過去のデータのガウス分布、平均ベクトル、および精度行列に従って、異常位置特定スコアが、新しいデータの他の特徴に対して条件付けられた新しいデータの特徴の負の条件付き対数尤度である。
【0114】
実施例13は、任意選択的特徴を含んでいるか、または除外している、実施例8~12のうちのいずれか1つの方法を含む。この実施例では、教師なし学習を使用して異常検出モデルが生成され、過去のデータがラベルなしのトレーニング・データである。
【0115】
実施例14は、任意選択的特徴を含んでいるか、または除外している、実施例8~13のうちのいずれか1つの方法を含む。この実施例では、方法が、異常スコアおよび異常位置特定スコアに基づいて緩和処置を実行することを含む。任意選択的に、緩和処置が、新しいデータに関連付けられたデバイスに対する変更を含む。
【0116】
実施例15は、任意選択的特徴を含んでいるか、または除外している、実施例8~14のうちのいずれか1つの方法を含む。この実施例では、リモートのデータ処理システムから1つまたは複数のコンピュータにダウンロードされたソフトウェアに従って、1つまたは複数のコンピュータによって方法が実行される。任意選択的に、この方法は、ソフトウェアの使用を計測することと、使用の計測に基づいてインボイスを生成することとをさらに含む。
【0117】
実施例16はシステムである。このシステムは、1つまたは複数のプロセッサと、プログラム命令を格納している1つまたは複数のコンピュータ可読ストレージ媒体とを含み、プログラム命令が、1つまたは複数のプロセッサによって実行された場合に、1つまたは複数のプロセッサに、実施例6~15のうちのいずれか1つに従って方法を実行させるように構成される。
【0118】
実施例17はコンピュータ・プログラム製品である。コンピュータ・プログラム製品は、1つまたは複数のコンピュータ可読ストレージ媒体と、1つまたは複数のコンピュータ可読ストレージ媒体に集合的に格納されたプログラム命令とを含み、プログラム命令が、1つまたは複数のプロセッサに、実施例6~15のうちのいずれか1つに従って方法を実行させるように構成された命令を含む。
【手続補正書】
【提出日】2023-02-02
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
車両、
観測された車両データを収集する複数のセンサ、
前記観測された車両データを集約して格納するように構成されたドライブ・レコーダ、および
前記ドライブ・レコーダに通信可能に結合された異常検出システムを備えているシステムであって、前記異常検出システムが過去の車両データの確率分布を含み、関数をしきい値未満に減らすように前記確率分布のパラメータが調整され、前記関数が、前記過去の車両データに対して条件付けられた前記確率分布と、類似する公平な特徴を有し、不公平な特徴と無関係である入力の前記確率分布の類似する出力を生成するように構成された少なくとも1つの正則化項とに基づき、前記異常検出システムが、前記確率分布、前記パラメータ、および前記観測された車両データに基づく異常スコアおよび異常位置特定スコアをさらに含む、システム。
【請求項2】
前記少なくとも1つの正則化項が、前記類似する公平な特徴を有し、前記不公平な特徴と無関係である前記入力の類似する異常スコアを生成するように構成された第1の正則化項と、前記類似する公平な特徴を有し、前記不公平な特徴と無関係である前記入力の類似する異常位置特定スコアを生成するように構成された第2の正則化項とを含む、請求項1に記載のシステム。
【請求項3】
前記確率分布がガウス分布であり、前記パラメータが平均ベクトルおよび精度行列を含む、請求項1または請求項2に記載のシステム。
【請求項4】
前記関数を前記しきい値未満に減らすことが、確率的勾配降下法(SGD)を使用して実行される、請求項1ないし3のいずれかに記載のシステム。
【請求項5】
前記異常検出システムが、前記異常スコアおよび前記異常位置特定スコアに基づいて緩和処置を実行するように構成される、請求項1ないし4のいずれかに記載のシステム。
【請求項6】
車両データの異常スコアおよび異常位置特定スコアを生成するように構成された異常検出システムをトレーニングすることであって、前記異常検出システムが、第1の正則化項および第2の正則化項を使用して、類似する公平な特徴を有し、不公平な特徴と無関係である過去の車両データの類似する異常スコアおよび異常位置特定スコアを生成するようにトレーニングされる、前記トレーニングすることと、
前記異常検出システムで、車両上の複数のセンサからデータを収集するドライブ・レコーダから新しい車両データを受信することと、
前記新しい車両データに関連付けられた第1の異常スコアおよび第1の異常位置特定スコアを生成することと、
前記第1の異常スコアおよび前記第1の異常位置特定スコアに基づいて緩和処置を実行することであって、前記緩和処置が前記車両を変更する、前記実行することとを含む、コンピュータ実装方法。
【請求項7】
前記異常検出システムをトレーニングすることが、
前記過去の車両データのガウス確率分布を生成することと、
関数をしきい値未満に減らす平均ベクトルおよび精度行列を学習することとをさらに含み、前記関数が、前記過去の車両データ、前記精度行列のL1正則化項、前記第1の正則化項、および前記第2の正則化項を前提として、前記ガウス確率分布の負の対数尤度に基づく、請求項6に記載のコンピュータ実装方法。
【請求項8】
前記第1の異常スコアおよび前記第1の異常位置特定スコアが、前記新しい車両データ、前記ガウス確率分布、前記平均ベクトル、および前記精度行列に基づく、請求項7に記載のコンピュータ実装方法。
【請求項9】
過去のデータのガウス分布、前記ガウス分布の平均ベクトル、および前記ガウス分布の精度行列に基づいて異常検出モデルを生成することであって、前記平均ベクトルおよび前記精度行列が、関数をしきい値未満に減らすことによって生成され、前記関数が、前記ガウス分布、類似する公平な特徴を有し、不公平な特徴と無関係である入力の類似する異常スコアを生成するように構成された第1の正則化項、および前記類似する公平な特徴を有し、前記不公平な特徴と無関係である前記入力の類似する異常位置特定スコアを生成するように構成された第2の正則化項を含む、前記生成することと、
新しいデータを前記異常検出モデルに入力することと、
前記ガウス分布、前記平均ベクトル、および前記精度行列に基づいて、前記新しいデータに関連付けられた異常スコアおよび異常位置特定スコアを生成することとを含む、コンピュータ実装方法。
【請求項10】
前記異常スコアが異常の存在を示し、前記異常位置特定スコアが前記異常の発生源を示す、請求項9に記載のコンピュータ実装方法。
【請求項11】
確率的勾配降下法(SGD)を使用して前記関数が減らされる、請求項9または請求項10に記載のコンピュータ実装方法。
【請求項12】
前記過去のデータの前記ガウス分布、前記平均ベクトル、および前記精度行列に従って、前記異常スコアが前記新しいデータの負の対数尤度である、請求項9ないし11のいずれかに記載のコンピュータ実装方法。
【請求項13】
前記過去のデータの前記ガウス分布、前記平均ベクトル、および前記精度行列に従って、前記異常位置特定スコアが、前記新しいデータの他の特徴に対して条件付けられた前記新しいデータの特徴の負の条件付き対数尤度である、請求項9に記載のコンピュータ実装方法。
【請求項14】
教師なし学習を使用して前記異常検出モデルが生成され、前記過去のデータがラベルなしのトレーニング・データを含む、請求項9に記載のコンピュータ実装方法。
【請求項15】
前記異常スコアおよび前記異常位置特定スコアに基づいて緩和処置を実行することをさらに含む、請求項9に記載のコンピュータ実装方法。
【請求項16】
前記緩和処置が、前記新しいデータに関連付けられたデバイスに対する変更を含む、請求項15に記載のコンピュータ実装方法。
【請求項17】
リモートのデータ処理システムから1つまたは複数のコンピュータにダウンロードされたソフトウェアに従って、前記1つまたは複数のコンピュータによって前記方法が実行される、請求項9に記載のコンピュータ実装方法。
【請求項18】
前記方法が、
前記ソフトウェアの使用を計測することと、
前記使用の計測に基づいてインボイスを生成することとをさらに含む、請求項17に記載のコンピュータ実装方法。
【請求項19】
1つまたは複数のプロセッサと、
プログラム命令を格納している1つまたは複数のコンピュータ可読ストレージ媒体とを備えているシステムであって、前記プログラム命令が、前記1つまたは複数のプロセッサによって実行された場合に、前記1つまたは複数のプロセッサに、
過去のデータのガウス分布、前記ガウス分布の平均ベクトル、および前記ガウス分布の精度行列に基づいて異常検出モデルを生成することであって、前記平均ベクトルおよび前記精度行列が、関数をしきい値未満に減らすことによって生成され、前記関数が、前記ガウス分布、類似する公平な特徴を有し、不公平な特徴と無関係である入力の類似する異常スコアを生成するように構成された第1の正則化項、および前記類似する公平な特徴を有し、前記不公平な特徴と無関係である前記入力の類似する異常位置特定スコアを生成するように構成された第2の正則化項を含む、前記生成することと、
新しいデータを前記異常検出モデルに入力することと、
前記ガウス分布、前記平均ベクトル、および前記精度行列に基づいて、前記新しいデータに関連付けられた異常スコアおよび異常位置特定スコアを生成することとを含んでいる方法を実行させるように構成される、システム。
【請求項20】
確率的勾配降下法(SGD)を使用して前記関数が減らされる、請求項19に記載のシステム。
【請求項21】
前記過去のデータの前記ガウス分布、前記平均ベクトル、および前記精度行列に従って、前記異常スコアが前記新しいデータの負の対数尤度である、請求項19に記載のシステム。
【請求項22】
前記過去のデータの前記ガウス分布、前記平均ベクトル、および前記精度行列に従って、前記異常位置特定スコアが、前記新しいデータの他の特徴に対して条件付けられた前記新しいデータの特徴の負の条件付き対数尤度である、請求項19に記載のシステム。
【請求項23】
請求項6ないし18のいずれかに記載の方法をコンピュータに実行させる、コンピュータ・プログラム。
【請求項24】
請求項23に記載の前記コンピュータ・プログラムを、コンピュータ可読ストレージ媒体に記憶した、ストレージ媒体。
【国際調査報告】