(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-08-31
(54)【発明の名称】アクチグラフィデータに基づくユーザ認証のためのシステム及び方法
(51)【国際特許分類】
G16H 40/00 20180101AFI20220824BHJP
【FI】
G16H40/00
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2021576280
(86)(22)【出願日】2020-06-16
(85)【翻訳文提出日】2021-12-21
(86)【国際出願番号】 EP2020066564
(87)【国際公開番号】W WO2020254291
(87)【国際公開日】2020-12-24
(32)【優先日】2019-06-21
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】504389991
【氏名又は名称】ノバルティス アーゲー
(74)【代理人】
【識別番号】100092783
【氏名又は名称】小林 浩
(74)【代理人】
【識別番号】100095360
【氏名又は名称】片山 英二
(74)【代理人】
【識別番号】100120134
【氏名又は名称】大森 規雄
(74)【代理人】
【識別番号】100187964
【氏名又は名称】新井 剛
(72)【発明者】
【氏名】ドーン,ジョナス
(72)【発明者】
【氏名】イリアノ,ヴィットリノ パオロ
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA15
(57)【要約】
本発明は、アクチグラフィデータに基づくユーザ固有の活動モデルを提供するための、及びアクチグラフィデータに基づくユーザ固有の活動モデルに基づくユーザ認証のためのシステム及び方法を提供する。
【特許請求の範囲】
【請求項1】
特にユーザ認証のためにユーザ固有の活動モデルを提供する、コンピュータで実施される方法であって、前記方法は、
複数のユーザのアクチグラフィデータを取得するステップと、
前記複数のユーザのうちの第1のユーザの前記ユーザ固有の活動モデルを、前記第1のユーザの前記アクチグラフィデータと、前記複数のユーザのうちの残りのユーザのアクチグラフィデータを含む基準アクチグラフィデータセットとに基づいて決定するステップと
を含む、前記方法。
【請求項2】
ユーザ認証のためにコンピュータで実施される方法であって、
ウェアラブルデバイスを使用してアクチグラフィデータを取得するステップと、
第1の期間中に取得された第1のユーザのアクチグラフィデータに基づく、前記第1のユーザのユーザ固有の活動モデルに基づき、前記第1の期間に続く第2の期間中に取得されたアクチグラフィデータが前記第1のユーザに属するかどうかを検証するステップと、
前記第2の期間中に取得された前記アクチグラフィデータのうちのいずれかが前記第1のユーザに属さないと判断された場合に、前記第1のユーザに属さない前記データを詐称者データとしてマークする及び/又は詐称者データが検出されたことを示すアラームを発生させるステップと
を含む、前記方法。
【請求項3】
請求項1に記載の方法を更に含む、請求項2に記載の方法。
【請求項4】
前記ウェアラブルデバイスによって取得されたアクチグラフィデータがアクチグラフィデータの候補セットに追加され、前記方法は、前記候補セットの前記アクチグラフィデータを構造化及び/又はフィルタリングして、前記活動モデルを構築するために及び/又は前記検証するステップのために使用されるデータセットを取得するステップを更に含む、請求項1又は3に記載の方法。
【請求項5】
前記構造化は、前記候補セットの前記アクチグラフィデータを、連続する有限の時間ウィンドウに、特に隣接する重なり合わないウィンドウに分割することを含む、請求項4に記載の方法。
【請求項6】
前記フィルタリングは、前記候補セットから、無効な非活動データとして分類されるデータを、特に、無効な非活動データとして分類される全てのデータを削除するステップを含む、請求項4又は5に記載の方法。
【請求項7】
前記フィルタリングは、前記候補セット内のデータのサブセットを、前記サブセットから削除されたデータの割合が閾値T
arを超えた場合にのみ、及び/又は前記サブセットが、特定のパターンで繰り返し発生する類似したサブセットのグループの一部である場合にのみ、良いデータとして特性評価することと、前記良いデータのみを最終データセットに追加することとを含み、
前記最終データセットは、特に前記活動モデルを構築するために使用される、請求項4~6のいずれか一項に記載の方法。
【請求項8】
アクチグラフィデータ、特に前記最終データセットからのアクチグラフィデータを処理して、例えばk-partition法に基づく、3次元時系列クラスタリング手法を用いて、活動を一緒にグループ化してクラスタを形成して活動クラスタを形成するステップを更に含む、請求項1~7のいずれか一項に記載の方法。
【請求項9】
前記検証するステップは、
前記第2の期間中に取得されたアクチグラフィデータを、前記デバイスを着用している前記ユーザが前記第1のユーザである確率を前記ユーザ固有の活動モデル及び前記アクチグラフィデータにおける活動に基づいて定める確率モデルに入力するステップと、
前記確率モデルによって決定された前記確率が、高閾値T
hとも称される第1の閾値を超えているかどうかを判断し、及び/又は前記確率モデルによって決定された前記確率が、低閾値T
lとも称される第2の閾値を下回っているかどうかを判断するステップと、
前記確率モデルによって決定された前記確率が前記第1の閾値を超えている場合、前記アクチグラフィデータは前記第1のユーザに属すると判断し、及び/又は前記確率モデルによって決定された前記確率が前記第2の閾値を下回っている場合、前記アクチグラフィデータが前記第1のユーザに属さないと判断し、及び/又は前記第1の閾値を超えておらず、前記第2の閾値を超えている場合、入力された前記データは、前記アクチグラフィデータが前記第1のユーザに属するか又は詐称者に属するかどうかを判断するには不十分であると判断するステップと
を含む、請求項2~8のいずれか一項に記載の方法。
【請求項10】
前記確率モデルは、活動が観察された場合に、特に観察された活動の各々について、前記確率を更新するように構成され、
前記検証するステップは、前記確率モデルによって決定された前記確率が第1の閾値を超えているかどうかを判断すること、及び/又は前記確率モデルによって決定された前記確率が第2の閾値を下回っているかどうかを判断することを、特に、前記確率が前記第1の閾値T
hを超えるまで又は前記第2の閾値T
lを超えなくなるまで、繰り返すことを含む、請求項9に記載の方法。
【請求項11】
前記第1の期間中に取得された前記アクチグラフィデータから複数の予備的活動モデルを決定し、複数の前記予備的活動モデルを使用して前記ユーザ固有の活動モデルを取得するステップであって、特に、前記予備的活動モデルからコンセンサス活動モデルを生成することにより、又は、複数の前記予備的活動モデルを用いて、前記第1の期間中に取得されたアクチグラフィデータの一部、例えば詐称者データの可能性があるデータとして識別された前記アクチグラフィデータ、を削除して、前記ユーザ固有の活動モデルを取得するために使用されるアクチグラフィデータの削減されたセットを取得する、ステップ
を更に含む、請求項1~10のいずれか一項に記載の方法。
【請求項12】
処理手段(6、7)を備える、ユーザ固有の活動モデルを提供するためのシステム(1)であって、前記処理手段(6、7)は、
複数のユーザのアクチグラフィデータを取得するステップと、
前記複数のユーザのうちの第1のユーザの前記ユーザ固有の活動モデルを、前記第1のユーザの前記アクチグラフィデータ及び前記複数のユーザのうちの残りのユーザのアクチグラフィデータを含む基準アクチグラフィデータセットに基づいて決定するステップと、を実行するように構成されている、前記システム(1)。
【請求項13】
アクチグラフィデータを取得するように構成された少なくとも1つのセンサ(3)と、処理手段(6、7)と、を備えるウェアラブルデバイス(2)を備えるユーザ認証用のシステム(1)であって、前記システム(1)は、
第1の期間中に取得された第1のユーザのアクチグラフィデータに基づく、前記第1のユーザのユーザ固有の活動モデルに基づき、前記第1の期間に続く第2の期間中に取得されたアクチグラフィデータが前記第1のユーザに属するかどうかを検証するステップと、
前記第2の期間中に取得された前記アクチグラフィデータのうちのいずれかが前記第1のユーザに属さないと判断された場合に、前記第1のユーザに属さない前記データを詐称者データとしてマークする及び/又は詐称者データが検出されたことを示すアラームを発生させるステップと
を実行するように構成されている、前記システム(1)。
【請求項14】
前記処理手段(6、7)は、請求項1~11のいずれか一項に記載の方法を実行するように構成されている、請求項12又は13に記載のシステム(1)。
【請求項15】
請求項1~11のいずれか一項に記載の方法を実施するための、請求項12又は13に記載のシステム(1)の使用。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、アクチグラフィデータに基づくユーザ固有の活動モデルを提供するための、及びアクチグラフィデータに基づくユーザ固有の活動モデルに基づくユーザ認証のためのシステム及び方法に関する。
【背景技術】
【0002】
アクチグラフィデータはユーザの活動に関連するデータであり、例えば、ユーザが着用しているウェアラブルデバイスを用いて取得できる。アクチグラフィデータは、加速度計センサによって検出された加速度計データを含み得る。
【0003】
アクチグラフィデータを使用して、ウェアラブルデバイスを着用している人の身体的状態、例えば健康状況、の変化を検出できる。したがって、身体的状態、特に身体的状態の経時的変化の遠隔監視及び/又は分析が可能である。
【0004】
これを考慮すると、ユーザは、身体的状態を監視するために、制御又は監督された環境にいる必要はない。例えば、ユーザは自宅でデバイスを着用できる。
【0005】
アクチグラフィデータ監視の用途の1つは、製薬業界における臨床試験での使用であり、この試験では、センサを使用して、病気の症状と患者の行動に関する客観的な測定値を収集する。臨床試験は遠隔にすることで、すなわち上述したように参加者を監督しないことで改善できる。
【0006】
これは多くの理由で有利であるが、監督しないことに起因して、デバイスによって取得されたデータが、それを着用していると主張するユーザに本当に属するか、すなわち、アクチグラフィデータの取得中に、予想されるユーザだけがデバイスを着用しているかどうか、を確認する方法を提供することが望ましいという課題も生じる。このような検証がないと、詐称者がデバイスを着用している可能性があり、したがって、データの評価結果が歪み、予想されるユーザの身体的状態に関して誤った結論につながる可能性がある。
【0007】
詐称者を特定する問題には、様々なユーザ認証方法が提供されている。これらの方法は一般に、追加の非アクチグラフィデータを使用することを含み、この非アクチグラフィデータに基づいてユーザ認証が実施される。そのようなデータは、生体認証データを含み得る。例えば、追加のデータは、虹彩スキャン又は指紋スキャンを含み得る。
【0008】
しかしながら、追加のデータを取得するには追加の感知技術が必要であり、更に、特定の用途にとって必要とされるほどの信頼性を有するとは限らない。なぜなら、特に、一部の方法では、予想されるユーザが検証を実行してから、デバイスを詐称者に渡すことが可能だからである。
【発明の概要】
【発明が解決しようとする課題】
【0009】
したがって、本発明の根底にある問題は、ユーザの身体的状態を監視すること、及びそれに基づいてユーザ認証を実行することにも好適なデータに基づいて、ユーザを識別することを可能にするシステム及び方法を提供することである。
【課題を解決するための手段】
【0010】
本発明は、特にユーザ認証のために、ユーザ固有の活動モデルを提供するためのコンピュータで実施される方法であって、複数のユーザからアクチグラフィデータを取得し、複数のユーザのうちの第1のユーザのユーザ固有の活動モデルを、第1のユーザから取得されたアクチグラフィデータと、複数のユーザのうちの残りのユーザのアクチグラフィデータを含む基準アクチグラフィデータセットとに基づいて決定することを含む、方法を提供する。アクチグラフィデータは、1つ以上のウェアラブルデバイスを使用して取得され得る。
【0011】
ユーザ固有の活動モデルの決定は、第1のユーザのデータと残りのユーザのデータとを別々に処理し、次いで、処理されたデータをマージして活動モデルを取得することを含み得る。代わりに、複数のユーザのデータを最初にマージし、次いで一緒に処理して、活動モデルを取得してもよい。
【0012】
本発明は、ユーザ認証のためにコンピュータで実施される方法であって、ウェアラブルデバイスを用いてアクチグラフィデータを取得し、第1の期間中に取得された第1のユーザのアクチグラフィデータに基づく、第1のユーザのユーザ固有の活動モデルに基づき、第1の期間に続く第2の期間中に取得されたアクチグラフィデータが第1のユーザに属するかどうかを検証し、第2の期間中に取得されたアクチグラフィデータのうちのいずれかが第1のユーザに属さないと判断された場合に、第1のユーザに属さないデータを詐称者データとしてマークする及び/又は詐称者データが検出されたことを示すアラームを発生させる、方法を更に提供する。第1の期間中のアクチグラフィデータの取得は、前述した方法の一部であり得るが、必ずしもそうとは限らない。これは同じウェアラブルデバイスで実行され得るが、必ずしもそうとは限らない。
【0013】
特に、ユーザ認証の方法は、ユーザ固有の活動モデルを提供する方法を含んでもよく、それに応じて取得された活動モデルを、第2の期間中に取得されたアクチグラフィデータが第1のユーザに属するかどうかを検証するステップのために使用してもよい。
【0014】
ユーザ固有の活動モデルは、アクチグラフィデータにおいて検出された活動、特に、ユーザの特徴を示すと判断された活動に基づいてもよい。ユーザ固有の活動モデルは、異なる活動を識別する情報を含んでもよく、特に、その活動がどのように実行されたか、及び/又はその活動がどのパターンで、例えばどのような頻度で、実行されたかを反映してもよい。活動の識別は、その活動を特定のユーザ動作に起因させる必要のない抽象的なレベルでなされてもよい。例えば、特定の活動が、筆記する又は歯磨きする実際の行為に対応することを識別する必要はない。活動モデルは、活動の指紋と見なし得る。活動モデルは、予想されるユーザを他の人から区別する、予想されるユーザの特徴的な活動を捕捉する。ユーザ固有の活動モデルは、例えば、定型及び/又は非定型の動きのパターンを含み得る。
【0015】
第1の期間は、対照期間又は基準期間と見なし得る。第1の期間中、第1の(予想される)ユーザは、任意選択で、予想されるユーザがそのウェアラブルデバイスを実際に着用していることを確実にするために、追加のデバイス及び/又は担当者によって監視され得る。
【0016】
第1の期間は、第1のユーザのみがウェアラブルデバイスを着用している期間であり得る。これは、例えば、第1のユーザが第1の期間中に完全に監視された場合に決定及び/又は保証され得る。
【0017】
代わりに、第1の期間は、第1のユーザがウェアラブルデバイスを着用している時間を含んでもよく、また、別のユーザがそのウェアラブルデバイスを着用している時間を含んでもよい。例えば、これは、第1のユーザがウェアラブルデバイスを別のユーザに一時的に手渡す場合に該当し得る。
【0018】
本方法は、第1の期間中に取得されたアクチグラフィデータから複数の予備的活動モデルを決定し、その複数の予備的活動モデルを用いて、ユーザ固有の活動モデル、すなわち、第2の期間中に取得されたアクチグラフィデータが第1のユーザに属するかどうかを検証する上記ステップで使用される活動モデル、を取得することを含んでもよい。これは特に、第1のユーザが第1の期間中に完全には監視されておらず、第1の期間が、第1のユーザだけがそのウェアラブルデバイスを着用していた時間であることを確実に確認できない場合に役立つ。
【0019】
複数の予備的活動モデルを使用して、コンセンサス活動モデルを生成することにより、例えば、複数の予備的活動モデルを整列させ、全ての予備的活動モデルに共通な定型活動及び/又は非定型活動のみを使用して、前記コンセンサス活動モデルを構築することにより、ユーザ固有の活動モデルを取得してもよい。
【0020】
代わりに、複数の予備的活動モデルを使用して、第1の期間中に取得されたアクチグラフィデータの一部を削除して、アクチグラフィデータの削減されたセットを取得してもよい。
【0021】
次いで、ユーザ固有の活動モデルを取得するために、アクチグラフィデータの削減されたセットを使用してもよい。すなわち、ユーザ固有の活動モデルを取得するために、第1の期間中に取得された全てのデータを使用するのではなく、その一部のみが使用される。
【0022】
本方法は、第1の期間中に取得されたアクチグラフィデータから、詐称者データの可能性があるとして識別されたアクチグラフィデータを削除することにより、アクチグラフィデータの削減されたセットを構築することを含み得る。アクチグラフィデータは、複数の活動モデルにより、詐称者データの可能性があるとして識別され得る。
【0023】
一例として、本方法は、第1の期間を2つ以上の、特に重なり合わない、サブ期間に分割することを含み得る。この場合、本方法は、第1の期間のサブ期間のうちの少なくとも2つの各々について、対応するサブ期間中に取得されたアクチグラフィデータのみを使用して、予備的活動モデルを提供することを含み得る。したがって、複数の予備的活動モデルが提供され得る。
【0024】
例えば、本方法は、第1の期間の第1のサブ期間のデータに基づいて第1の予備的活動モデルを提供することと、第1の期間の第2のサブ期間のデータに基づいて第2の予備的活動モデルを提供することと、を含み得る。予備的活動モデルの各々は、本明細書に記載されている、活動モデルを取得するための方法のいずれかを使用して取得され得る。
【0025】
本方法は、第1の予備的活動モデルを使用して、第2のサブ期間中に取得されたアクチグラフィデータの中から詐称者データである可能性が高いアクチグラフィデータを識別することと、第2の予備的活動モデルを使用して、第1のサブ期間中に取得されたアクチグラフィデータの中から詐称者データである可能性が高いアクチグラフィデータを識別することと、を含み得る。識別は、アクチグラフィデータが第1のユーザに属するかどうかを検証するための、本明細書に記載された方法のいずれかによって実行され得る。
【0026】
サブ期間の各々は、第1の期間中のランダムな時間のセット、例えばランダムな日のセット、であってもよく、任意選択で、サブ期間は、上述したように重なり合わないという制限がある。サブ期間の各々は、任意選択で、連続する期間、例えば複数の連続する日であってもよく、又は連続しない期間、例えば複数の連続しない日であってもよい。
【0027】
上記の例は2つのサブ期間に関するが、アクチグラフィデータの削減されたセットを取得する方法は、3つ以上のサブ期間及び3つ以上の予備的活動モデルを使用して実行され得る。
【0028】
ユーザ固有の活動モデルを決定するために複数の予備的活動モデルを使用することにより、基準データ収集中の詐称者に対する堅牢性が向上し得る。
【0029】
第2の期間は、追加のデバイス及び/又は担当者による監視の実施が少なくてもよい、又は監視が全く実施されなくてもよい。例えば、第2の期間は遠隔医療試験の期間であり得る。もちろん、この期間中に断続的な追加監視を行うことは可能であるが、継続的な追加監視を実施する必要はない。
【0030】
ウェアラブルデバイスは、少なくともユーザが着用したときに、アクチグラフィデータを含むセンサデータを提供するセンサを備える任意のデバイスであり得る。例えば、デバイスは、手首、首、足首の周りに着用すること、又は任意の他の身体部分に取り付けることが意図され得る。手首着用デバイスは、特徴的な活動を捕捉するのに特に好適である。アクチグラフィデータは、ウェアラブルデバイスを着用している間にユーザが実行した活動を反映するデータを含み得る。特に、上述したように、アクチグラフィデータは、加速度計センサによって検出された加速度計データを含み得る。特に、アクチグラフィデータは、加速度値と、それぞれの加速度値が取得された時間を示す値とを含み得る。すなわち、ウェアラブルデバイスは、加速度計データを含むアクチグラフィデータを提供するように構成された加速度計センサを含み得る。
【0031】
本明細書で使用される活動は、ユーザの1つ以上の身体部分の単一の運動、例えば腕を持ち上げること、並びに、運動の重ね合わせ及び/又は連結、例えば歩く、食べる、書く、タイプする、又は歯磨きすること、を指し得る。
【0032】
本方法は、ウェアラブルデバイスがユーザによって着用され、スイッチが入っている間、アクチグラフィデータを継続的に収集することを含み得る。特に、アクチグラフィデータは、第1の期間及び/又は第2の期間の全体にわたって継続的に収集され得る。一例として、連続測定は、アクチグラフィデータが、10-2Hz~103Hz、10-2Hz~300Hz、特に10-1Hz~102Hz、特に1Hz~80Hz、特に10Hz~60Hz、特に20Hz~40Hz、特に25~35Hz、特に30Hzの範囲のサンプリングレートで収集されることを含み得る。好適なサンプリングレートの例は、0.017、0.2、1、20、25、30、32、60、80、100、及び256Hzを含む。
【0033】
電源が入っているときにウェアラブルデバイスを着用している人は誰でもデバイスのユーザと見なされる。第1のユーザは、予想されるユーザと称される。これは、例えば、第2の期間中に、例えば臨床試験中に、監視されるユーザであり得る。以下では、第1のユーザではないユーザはいずれも詐称者と称する。
【0034】
本方法は、ウェアラブルデバイスによって提供されるアクチグラフィデータを使用して、アクチグラフィデータが第1のユーザ、すなわち予想されるユーザに属するか又は詐称者に属するかを動的に判断する。この判断は、ユーザ認証と見なすことができる。
【0035】
本方法は、第2の期間中に取得したデータに基づいて新しい活動モデルを計算することと、第1の期間中に取得したデータに基づくユーザ固有の活動モデルと比較することと、を繰り返す必要はない。本方法はむしろ、第2の期間中に測定されたアクチグラフィデータから、このアクチグラフィデータが、第1の期間中の予想されるユーザの活動モデルに適合するのか、又は詐称者の活動モデルに適合するのかが判断されることを含む。
【0036】
主張する認証方法の利点は、現在のユーザの身体的状態、例えば健康状況、を監視するために使用できるセンサ以外に検証用の追加のセンサを何ら提供することなく、詐称者の検出を確実に可能にすることである。その上、いくつかの既知の方法、例えば虹彩スキャン又は指スキャンと比較して、予想されるユーザが意図的に詐称者を認証させることができないので、より安全である。
【0037】
本方法は、アラートをトリガすることを含み得る。これにより、予想されるユーザに危険をもたらし得る身体的状態の急激な変化に起因して、又はウェアラブルデバイスが予想されるユーザから詐称者に移動したことに起因して、偏差が閾値を超えたかどうかを、アクチグラフィデータ以外の方法で確認することが可能になる。一般に、例えば、薬が意図した効果を示す場合又はユーザが何らかの副作用を示す場合などの身体的状態の変化に起因する、予想される偏差は段階的であると予想される。その上、身体的状態が変化しても、一部の活動は同様のままとなる。したがって、本方法は、変化が詐称者に起因するのか、又はユーザの身体的状態の変化に起因するのかを確実に区別することを可能にする。
【0038】
本方法、特に活動モデルの構築及び/又は検証は、ウェアラブルデバイスによって完全に実行されてもよく、又は少なくとも部分的に、特に完全に、1つ以上のリモートデバイスにおいて評価されてもよい。検証は、特に継続的に、第2の期間中に実行されてもよく、及び/又は、データは後のある時点で検証を受けてもよい。その場合、特に、第2の時間に収集された全てのデータが一括して評価されてもよい。
【0039】
ウェアラブルデバイスは、プッシュ及び/又はプル方式に基づいて、アクチグラフィデータを遠隔デバイスに提供してもよい。すなわち、ウェアラブルデバイスは、それ自体の運動のアクチグラフィデータを遠隔デバイスに連続的又は不連続的に提供してもよい。代わりに又は加えて、ウェアラブルデバイスは、外部デバイス、何らかの他のデバイスから受信した要求に応答して、又は人によって促されて、アクチグラフィデータを遠隔デバイスに提供してもよい。
【0040】
簡潔に要約すると、本方法は、第1の期間(基準期間)からのアクチグラフィデータを使用して、場合により何らかのフィルタリング及び/又はその構造化の後に、アクチグラフィデータを活動クラスタにグループ化(クラスタ化とも称される)することと、クラスタ化されたデータからデータセットを作成することと、活動クラスタを使用して予想されるユーザの特性を抽出することと、予想されるユーザと一般的な詐称者との違いを捕捉する確率モデルを作成することと、を含み得る。第2の期間中に取得されたアクチグラフィデータを使用して、確率モデルに基づいて、例えば各活動の観察に基づいて、ユーザの身元識別情報の信頼度を更新し得る。これらのステップが、以下により詳細に記載される。
【0041】
本方法は、ウェアラブルデバイスによって取得されたアクチグラフィデータをアクチグラフィデータの候補セットに追加することと、候補セットのアクチグラフィデータを構造化及び/又はフィルタリングして、活動モデルを構築するために及び/又は検証ステップのために使用されるデータセットを取得することと、を含み得る。
【0042】
構造化は、候補セットのアクチグラフィデータを、連続する有限の時間ウィンドウに、特に隣接する重なり合わないウィンドウに分割することを含み得る。
【0043】
時間ウィンドウは固定サイズWを有し得る。このような固定サイズの利点は、時間ウィンドウを定めるために活動の開始及び終了のような追加情報が必要ないことである。この場合、以下でより詳細に説明する時系列のクラスタリングステップにおいて、2つの時系列間の相互相関方法が、それらが重なり合わない領域においてゼロパディングを含むことが有利である。
【0044】
代わりに、ウィンドウは可変サイズを有してもよい。可変サイズは、例えば活動セグメンテーションにより、活動の開始及び終了の決定を使用して決定され得る。
【0045】
時間ウィンドウのサイズWは、固有の活動のトリミングを最小限に抑え、異なる活動を一緒に混合するように最適化され得る。ウィンドウサイズは、サンプリングレートの関数として最適化されてもよい。所与のサンプリングレートについて、ウィンドウ内のサンプル数とウィンドウサイズとの間にはトレードオフが存在する。すなわち、ウィンドウが短いほど、ウィンドウ内のサンプルは少ない。所与のサンプリングレートとウィンドウ内のサンプル数について、ウィンドウサイズは、ウィンドウ内のサンプル数をサンプリングレートで割ったものに等しい場合がある。
【0046】
ウィンドウ内のサンプル数は、1~1800、特に3~1650、特に5~1500、特に10~1350、特に20~1200、特に30~1050個であり得る。ウィンドウ内の好適なサンプル数の例は、1、3、5、10、20、30、900、1050、1200、1350、1500、1650、及び1800個のサンプルを含む。例えば、サンプリングレートが毎分1個のサンプルのオーダーである場合、ウィンドウ内のサンプル数は100~101個のオーダーであり得る。別の例として、サンプリングレートが毎秒101個のサンプルのオーダーである場合、例えば30Hz又は50Hzである場合、時間ウィンドウ内のサンプル数は102~103個のオーダーであり得る。一例として、サンプリングレートは30Hzであってもよく、ウィンドウ内のサンプル数は900個であってもよく、その結果、ウィンドウサイズは30秒となる。
【0047】
フィルタリングは、候補セットから、無効な非活動データとして分類されるデータを、特に無効な非活動データとして分類される全てのデータを削除するステップを含み得る。
【0048】
データを無効な非活動データとして分類することは、所与の時間間隔におけるアクチグラフィデータの標準偏差、特に測定データ、例えば加速度計データの大きさを決定することと、標準偏差が活動閾値Taを超えているかどうかを判断することと、を含み得る。
【0049】
所与の時間間隔は、時間ウィンドウに対応し得る。代わりに、時間ウィンドウは、M個の特に隣接する複数のサブウィンドウに分割されてもよく、所与の時間間隔は、サブウィンドウのうちの1つに対応してもよい。
【0050】
所与の時間間隔のデータは、標準偏差が活動閾値Taを超えていないと判断された場合、無条件に無効な非活動データとして分類され得る。
【0051】
代わりに、連続する時間間隔のグループについて、前述の連続する時間間隔のグループのうちの予め定められた数未満のものが活動閾値を超える標準偏差を有すると判断される場合があり、それに応答して、前述のグループの全ての時間間隔が、無効な非活動データとして分類される場合がある。
【0052】
この連続する時間間隔の予め定められた数以上のものが活動閾値を超える標準偏差を有すると判断された場合、活動閾値を超える標準偏差を有するグループの各時間間隔のデータが有効なデータとして分類される場合があり、そのグループの残りの全ての時間間隔のデータが無効なデータとして分類される場合がある。
【0053】
予め定められた数は、例えば、グループ内の時間間隔の数の60%、特に50%、特に40%であり得る。
【0054】
一例として、1つの時間ウィンドウのサブウィンドウの全てが連続する時間間隔のグループを構成し得る。したがって、ウィンドウ全体のデータは、そのサブウィンドウ全体のうちの、予め定められた数より少ないサブウィンドウが、活動閾値を超える標準偏差を有する場合、無効なデータとして分類され得る。すなわち、時間ウィンドウが有効データと無効データとを含む場合、時間ウィンドウの全てのデータが破棄され得る。
【0055】
これにより、例えば非定常信号に起因する、分類エラーの回避が可能になる。
【0056】
標準偏差の分析の代わりに又はそれに加えて、無効な非活動データが非着用検出アルゴリズムによっても識別され得る。例えば、Vincent T Van Heesらによる、“Separating movement and gravity components in an acceleration signal and implications for the assessment of human daily physical activity”(PLOS ONE 8.4(2013),e61691)に記載されている方法が使用され得る。
【0057】
フィルタリングは、候補セット内のデータのサブセットを、サブセットから削除されたデータの割合が閾値Tarを超えた場合にのみ、及び/又はサブセットが、特定のパターンで繰り返し発生する類似したサブセットのグループの一部である場合にのみ、良いデータとして特性評価することと、良いデータのみを最終データセットに追加することと、を含んでもよく、最終データセットは、特に活動モデルを構築するために使用される。
【0058】
換言すれば、例えばプロファイルの構築のために使用される良いデータを決定するように、1つ以上の判定基準がデータに適用される。以下では、削除されたデータの割合と特定のパターンでの繰り返し発生との判定基準を主要判定基準と称する。
【0059】
フィルタリングにより、歪みを回避することが可能になり、使用されるデータセットの有意味性が改善される。
【0060】
特に、第1の期間及び/又は第2の期間の全体がそれぞれ、等しいセクション又は時間スパン、例えば1時間、に分割されてもよく、データのサブセットがセクションのうちの1つのデータとして定義される。各セクションは、良いセクション又は悪いセクションとして特性評価され得る。良いセクションとしての特性評価は、候補セットから以前に削除されたデータ、例えば無効な非活動データと、前述のセクション内の残りのデータとの比率に基づき得る。特性評価ステップは、あるセクションの比率を閾値Tarと比較し、比率が閾値を超えた場合にのみ、そのセクションを良いセクションとして特性評価することを含み得る。比率が閾値を超えない場合、そのセクションは悪いセクションとして特性評価される。良いセクション内の残りのデータ(すなわち、以前に候補セットから削除されていないデータ)は良いデータとして特性評価され、悪いセクション内の残りのデータは悪いデータとして特性評価される。このようなフィルタリングは、データの過度の削除による歪みを特に低減させる。
【0061】
上記で見たように、加えて又は代わりに、データのサブセットは、サブセットが特定のパターンで繰り返し発生する類似したサブセットのグループの一部である場合にのみ、良いデータとして特性評価される。次いで、良いセクションとしての特性評価は、類似した活動分布を有するセクションが特定のパターンで、特に特定の頻度で、例えば24時間ごとに、繰り返し発生するかどうかに基づき得る。
【0062】
このようなフィルタリングにより、特に特徴的なデータのセクション又はサブセットを選択することが可能になる。なぜなら、これらは、デバイスを着用しているユーザの習慣を示すからである。
【0063】
サブセットから削除されたデータの割合に基づいて、及びサブセットが、特定のパターンで繰り返し発生する類似したサブセットのグループの一部であるかどうかに基づいて、特性評価が行われる場合、これは、両方の判定基準が満たされた場合にのみサブセットが良いデータとして特性評価されることを意味する。
【0064】
特に、サブセットから削除されたデータの割合に基づく特性評価は、最初に複数のサブセットに対して実行されてもよく、良いデータとして特性評価されたデータを有するサブセットが識別されてもよい。したがって、複数の事前選択されたサブセットが決定される。次いで、事前選択されたサブセットの一部が、特定のパターンで繰り返し発生する類似したサブセットのグループの一部であるかどうかが判断される。このようなサブセットのデータが、良いデータとして特性評価される。
【0065】
本方法は、残りのユーザのアクチグラフィデータの中から基準アクチグラフィデータセット用のデータを選択するステップを含み得る。すなわち、指紋を構築するために、予想されるユーザと他のユーザからのデータの混合物が入力として使用され得る。一例として、予想されるユーザについては、Neu個のデータサンプルが第1の期間から選択され得る。基準プロファイルを構築するために、他のユーザの数Miu(好ましくはMiu>1)の各々について、対応する期間から同数のサンプルが取得されてもよく、Neu/Miuサンプルは、これらのサンプルから均一な確率で又は不均一な確率でランダムに抽出されてもよい。
【0066】
本方法は、アクチグラフィデータ、特に最終データセットからのアクチグラフィデータを処理して、例えば、kパーティションクラスタリング手法、例えばk-shape法又はk-means法、に基づく3次元時系列クラスタリング手法を用いて、活動を一緒にグループ化してクラスタを形成して、活動クラスタを提供することを含み得る。
【0067】
換言すれば、アクチグラフィデータにおいて活動が検出される。活動モデルは、アクチグラフィデータにおいて検出された活動のいくつかに、特にユーザの特徴を示すと判断された活動に基づいてもよい。
【0068】
一般に、活動の認識は、特に活動のセマンティクスを理解する必要がある場合、複雑な問題である。クラスタリングを使用して、データの断片が同じ活動に関連するかどうかを推測することにより、問題は単純化される。
【0069】
アクチグラフィデータは、複数の時系列に分割され得る。時系列は、測定されたアクチグラフィ、例えば加速度、値、及びそれに対応する時間、を含むデータセットである。時系列クラスタリングは、類似性メトリックに基づいて2つの時系列間の類似性を決定することを含む。類似性がクラスタリングの閾値を超えている場合、時系列は同じクラスタの一部であると判断される。
【0070】
当技術分野で知られている時系列クラスタリング手法の1つが、例えばk-shape法である(例えば、John Paparrizos and Luis Gravanoによる、“k-shape:Efficient and accurate clustering of time series”.In:Proceedings of the 2015 ACM SIGMOD International Conference on Management of Data.ACM.2015,pp.1855-1870を参照)。この場合の類似性メトリックは、最大ピアソン相関である。しかしながら、アクチグラフィデータは一般に、3次元データ、例えば加速度データ、を含み、既知の方法は3次元データには好適ではない。3次元データを1次元データ、例えば加速度の大きさ、に低減すると、その結果、例えば加速度の方向に関する、方向関連情報のような情報が失われる。時系列を各次元で別々にクラスタリングすると、3つの軸間の相関が無視され、これも情報損失と見なされ得る。
【0071】
3次元時系列クラスタリング手法は、最大ピアソン相関に基づくメトリックを使用することを含み得るが、3次元データに対応するように修正されている。特に、類似性メトリックは、3つの軸に沿って平均化され、3つの軸にわたるシフト差を最大にする条件下で全ての可能な時間シフトのうちで最大化された正規化相互相関として定義され得る。
【0072】
主張された特徴により、上述した情報損失を回避することが可能になる。
【0073】
換言すれば、類似性メトリックは、各軸に1つずつの3つの正規化された相互相関間の平均であり得る。時間シフトは、各次元にわたって、3つの時間シフト間の距離を最大にする制約下で平均相互相関を最大化するように選択される。すなわち、3つの軸にわたって異なる時間シフトが許容される。
【0074】
異なる時間シフトにより同期エラーが克服され、運動のタイミングをより一般化することが可能になる。
【0075】
上記のクラスタリング手法により、定型の形態で実行される活動が、それ自体のクラスタにグループ化される。したがって、各クラスタは、定義上、十分な定型性を有する。定型性は、検証ステップにおける証拠のソースとして、活動の品質に関する指標の1つである。
【0076】
品質の更なる指標は、活動が実行される頻度及び一貫性である。これは、他の2つの判定基準の安定性を表し、活動モデルを構築するときに考慮され得る。
【0077】
検証することは、第2の期間中に取得されたアクチグラフィデータを、デバイスを着用しているユーザが第1のユーザである確率をユーザ固有の活動モデル及びアクチグラフィデータにおける活動に基づいて定める確率モデルに入力することと、確率モデルによって決定された確率が、高閾値Thとも称される第1の閾値を超えているかどうかを判断し、及び/又は確率モデルによって決定された確率が、低閾値Tlとも称される第2の閾値を下回っているかどうかを判断することと、確率モデルによって決定された確率が第1の閾値を超えている場合、アクチグラフィデータが第1のユーザに属すると判断し、及び/又は確率モデルによって決定された確率が第2の閾値を下回っている場合、アクチグラフィデータは第1のユーザに属すると判断し、及び/又は第1の閾値を超えておらず、第2の閾値を超えている場合、入力データは、アクチグラフィデータが第1のユーザに属するか又は詐称者に属するかどうかを判断するには不十分であると判断することと、を含み得る。
【0078】
確率は、信頼度とも称される。確率モデルは、現在の時刻tまでに観察されたクラスタの履歴が与えられたときに、予想されるユーザの確率又は信頼度を計算するように構成され得る。確率モデルは、例えば、トラバースされたクラスタの時系列シーケンスを用いてよい。
【0079】
モデルは、例えばデータ選択との関連で上述したように、例えば予想されるユーザのデータから抽出されたいくつかの時系列と他のユーザのデータから抽出された同数の時系列とを使用し、予想されるユーザと他のユーザのそれぞれの各クラスタの発生数を計算してもよい。
【0080】
本方法は、確率モデルを作成し、各クラスタ内の予想されるユーザ及び他のユーザの発生数をカウントすることによりモデルをフィッティングさせることを含み得る。本方法は、モデルの改良を実行することを更に含んでもよく、これは、信頼度を更新する判定基準を定義することと、例えばクラスタが一貫性のない頻度を示す場合にクラスタを除外するための基準を定義することと、を更に含み得る。
【0081】
確率モデルは、活動が観察された場合に、特に観察された活動の各々について、確率を更新するように構成されてもよく、検証することは、確率モデルによって決定された確率が第1の閾値を超えているかどうかを判断すること、及び/又は確率モデルによって決定された確率が第2の閾値を下回っているかどうかを判断することを、特に、確率が第1の閾値Thを超えるまで又は第2の閾値Tlを超えなくなるまで、繰り返すことを含んでもよい。
【0082】
加えて又は代わりに、本方法は、所定数maxEの確率更新の後に確率をリセットすることを含み得る。
【0083】
これにより、古いデータを無視することが可能になる。
【0084】
Tl、Th、maxEは検証性能を向上させる。実際には、検証性能は、詐称者を検出する際の利益と、真のユーザを詐称者として検出するコストとを考慮して最適化され得る。多くの使用事例、例えば遠隔医療調査では、目的は、第1のユーザが詐称者にデバイスを渡した後に、MTTD(検出までの平均時間)を短縮させようと試みながらも、FAR(誤アラーム率)を最小限に抑えることである。
【0085】
本発明はまた、特に1つ以上のウェアラブルデバイスを用いて、複数のユーザのアクチグラフィデータを取得するステップと、複数のユーザのうちの第1のユーザのユーザ固有の活動モデルを、第1のユーザのアクチグラフィデータと、複数のユーザのうちの残りのユーザのアクチグラフィデータを含む基準アクチグラフィデータセットとに基づいて決定するステップと、を実行するように構成された処理手段を含むシステムを提供する。
【0086】
本発明はまた、アクチグラフィデータを取得するように構成された少なくとも1つのセンサを有するウェアラブルデバイスを備えるシステムを提供する。システムは、以下のステップを実施するように構成された処理手段を更に備える:第1の期間中に取得された第1のユーザのアクチグラフィデータに基づく、第1のユーザのユーザ固有の活動モデルに基づき、第1の期間に続く第2の期間中に取得されたアクチグラフィデータが第1のユーザに属するかどうかを検証し、第2の期間中に取得されたアクチグラフィデータのうちのいずれかが第1のユーザに属さないと判断された場合に、第1のユーザに属さないデータを詐称者データとしてマークする及び/又は詐称者データが検出されたことを示すアラームを発生させる。
【0087】
このシステムは、複数の他のユーザのアクチグラフィデータを取得するステップと、第1のユーザのユーザ固有の活動モデルを、第1のユーザのアクチグラフィデータと、複数のユーザのうちの残りのユーザのアクチグラフィデータを含む基準アクチグラフィデータセットとに基づいて決定するステップと、を実行するように構成され得る。
【0088】
これらのシステム、特に処理手段は、上述した方法ステップのいずれかを、上述した組み合わせで又は任意の他の組み合わせで実施するように構成され得る。
【0089】
ウェアラブルデバイスは、処理手段又は処理手段の一部を備え得る。ウェアラブルデバイスは、例えば無線データ接続を介して又は有線接続を介して、外部デバイスと通信するための通信インタフェースを含んでもよく、外部デバイスもまた、任意選択で処理手段の一部を含んでもよい。
【0090】
本発明はまた、上記方法のいずれかを実施するための上記システムの使用を提供する。
【0091】
本方法との関連で上述した機能、機能の組み合わせ、定義、及び利点は、システムとの関連でも同様に適用される。
【0092】
本発明の更なる例が、添付図面を参照して以下に説明される。
【図面の簡単な説明】
【0093】
【
図1】本発明によるシステムの縮尺通りではない概略図を示す。
【
図2】ユーザ認証のために実行される例示的なステップを示すフロー図を示す。
【
図3】検証セット及びテストセットについての対数尤度比の例示的な図を示す。
【
図4】ユーザ認証方法の例示的な結果を検出時間(Time To Detection:TTD)分布の形式で示す。
【発明を実施するための形態】
【0094】
図1は、この例では加速度計であるセンサ3を有するウェアラブルデバイス2、任意選択の(ウェアラブルデバイスの外部にある)外部デバイス4、及び外部デバイスとウェアラブルデバイスとを接続する、特に無線データ接続であってもよいデータ接続5、を含む例示的なシステム1を示す。ウェアラブルデバイスは、ユーザの手首に着用され得る。しかしながら、ウェアラブルデバイスは任意の他の身体部分に着用されることが可能である。上述したように、外部デバイスは任意選択で提供される。特に、ウェアラブルデバイスは、上述した方法の全てのステップを実行するように構成され得る。それに応じて、ウェアラブルデバイスは、本方法を実施するために必要な任意のハードウェア及びソフトウェアを備え得る。
【0095】
本システムは、ウェアラブルデバイスに含まれるプロセッサ7及び/又は外部デバイスに含まれるプロセッサ6を含む処理手段を備える。ウェアラブルデバイスのプロセッサ7は、加速度計によって取得されたデータを処理するように構成され得る。加えて又は代わりに、外部デバイスに含まれるプロセッサ6は、加速度計によって取得されたデータ及び/又はウェアラブルデバイスのプロセッサ7によって既に処理されたデータを処理するように構成され得る。プロセッサはそれぞれ、それ自体で又は一緒に、本発明による方法の方法ステップを実施するように構成された上記の処理手段を構成し得る。これは例示的なシステムであり、本発明はこの特徴の組み合わせに限定されないことを理解すべきである。
【0096】
以下では、本発明の実施形態による、ユーザに関するユーザ固有の活動モデル(又は活動の指紋)を構築し、活動モデルによりユーザを検証する方法が説明される。この方法は、
図1に示すシステム又は任意の他の好適なシステムにより部分的に又は完全に実施され得る。特に、全ての方法ステップが、又はアラーム作動を除く全てのステップが、ウェアラブルデバイスによって完全に実施され得る。アラーム作動は、アラームをトリガする信号が外部デバイスに通信され、それに応じて外部デバイスがアラームを作動させることを伴い得る。本明細書の概要部分から分かるように、本方法はまた、活動モデルの構築又はユーザ検証のみを含んでもよい、すなわち、2つのステージが別々に実行されてもよいことに留意すべきである。
【0097】
実施形態による方法は、ウェアラブルデバイスを用いて、第1の期間中に、第1のユーザ、すなわち予想されるユーザのアクチグラフィデータを取得することを含み得る。この間、上述したように、任意選択で、ユーザは追加のデバイス又は担当者によって監視され得る。
【0098】
得られたデータは、未加工のアクチグラフィデータの候補セットである。次いで、この未加工データのセットは、無効な非活動データが削除され、特徴的な活動を歪みなく表すデータセットが取得されるように、構造化及びフィルタリングされる。したがって、良いデータのセットが取得され、これが後続のステップで使用される。
【0099】
次いで、良いデータのセットにクラスタリング手法が実施される。この方法は、例えば3次元時系列クラスタリングにより、活動をグループ化してクラスタを形成する。したがって、活動クラスタが提供される。上記のステップは、他のユーザに対しても同様に実行されるか、又は他のユーザに対して既に使用可能なクラスタ化されたデータが取り込まれる。
【0100】
次いで、第1のユーザからのデータと他のユーザからのデータのサブセットとが、モデル生成方法の入力として使用される。モデル生成方法は、現在のユーザが予想されるユーザであるか詐称者であるかを、観察された活動に基づいて判断することが可能な確率モデルを提供する。
【0101】
第1の期間後の第2の期間中に、ウェアラブルデバイスを現在着用しているユーザのアクチグラフィデータがウェアラブルデバイスにより取得される。これは、予想されるユーザであり得るか、又は詐称者であり得る。この間、上述したように、ユーザは、追加のデバイス又は担当者によって監視されなくてもよく、又は稀にだけ監視されてもよい。
【0102】
次いで、第2の期間中に取得されたアクチグラフィデータを使用して、確率モデルを用いて、デバイスを着用しているユーザが第1のユーザである確率を決定してもよい。第1の/高閾値を超えた場合、そのユーザが実際に第1のユーザであると判断され得る。第2の/低閾値を超えていない場合、現在のユーザが詐称者であると判断され得る。上記のいずれにも該当しない場合、そのデータは、特性評価のために十分なデータが取得されるまで、予想されるユーザのデータとして又は詐称者データとして特性評価されない場合がある。
【0103】
アクチグラフィデータが詐称者データであると判断された場合、それに応じてマーク付けされてもよく、及び/又はアラームがトリガされてもよい。
【0104】
検証のために実行される例示的なステップを示すフロー図を
図2に示す。フロー図から分かるように、ユーザのアクチグラフィデータの受信されたデータセグメントの各々は、認識スコアSを更新する。観察された活動がどの程度、定型的であるかが判断される。観察された活動が定型的ならSを増加させ、非定型的ならSを減少させ、均衡していればSは同じままである。認識スコアを更新した後、認識スコアは2つの閾値と比較される。認識スコアが閾値T
lを下回った場合、アラームがトリガされる及び/又はデータが詐称者データとしてマークされる。認識スコアが閾値T
hを超えた場合、データはユーザに帰属する。Sは0にリセットされる。それ以外の場合は、より多くのデータが収集され、判定基準のうちの1つが満たされるまでSの現在値が更新される。
【0105】
以下では、本発明による方法をより詳細に説明し、本方法を使用して得られた結果を
図3及び
図4を用いて説明及び視覚化する。
【0106】
以下でより詳細に説明するように、アクチグラフィデータは、クラスタリング手法を用いて、活動クラスタにグループ化される。本方法は、アクチグラフィデータが継続的に収集されている間、有限の長さを有する時系列で機能する。したがって、クラスタリング活動の前に、データは連続する有限の時間ウィンドウに構成されるか、又は換言すれば、データにデータ構造化方法が実施される。
【0107】
この例では、隣接する重なり合わない時間ウィンドウが使用される。このようなウィンドウには、重なり合う時間ウィンドウよりも結果の解釈が容易であるという利点がある。なぜなら、重なり合いにより、活動の同じ部分が複数回考慮され、それにより解釈が困難な結果が生成されるからである。例えば、高周波数サイクルで構成される固定長を有する2つの類似した時系列は、時間シフトに関係なく高い相関関係を有する。結果として、部分的に重なり合うウィンドウの全てのペアは高い相関関係を生む。周期的でない信号については逆のことが生じ、部分的に重なり合うウィンドウが類似部分を含む場合にのみ相関は高くなる。時間ウィンドウサイズに関して、固定パラメータWが使用される。活動がいつ開始したか及びいつ終了したかが分かっている場合は、代わりに、可変時間ウィンドウを使用してもよい。
【0108】
時系列の長さWの値は、値が小さいと固有の活動がトリミングされる可能性が高い一方で、値が大きいと、特に継続時間が短い場合、異なる活動が一緒に混ざり合う可能性があることを考慮して決定され得る。実験では、30秒のウィンドウ(30Hzで900サンプル)が良好な結果をもたらしたが、これは限定するものではなく、様々な要因によって変化し得る。
【0109】
更に、以下でも説明されるように、クラスタリング手法は、特にその類似メトリックがピアソン相関に基づくので、標準偏差の桁が異なる場合には阻害される。したがって、データセット全体に許容できない歪みを生じさせない形態で、そのようなデータの存在を減らすデータフィルタリング方法が適用される。
【0110】
アクチグラフィデータにおいて、センサが殆ど運動を記録していないときにデータを取得すると、大きさが桁で異なる標準偏差が生じ得る。運動が殆ど記録されないことについて、複数の予想される説明があり、これには、安定期間、安眠フェーズ、故障による停止、又は非着用が含まれる。
【0111】
最初の2つは被験者の習慣及び運動特徴を示し得るが、2番目の2つはそうではなく、無効な非活動データとして特性評価されるデータを生成する。
【0112】
この例では、無効な非活動データの検出は、加速度計の大きさの標準偏差を活動閾値Taと比較することにより実行される。上述したように、標準偏差の分析の代わりに又はそれに加えて、無効な非活動データが非着用検出アルゴリズムによっても識別され得る。
【0113】
標準偏差により、W-long時系列の変動の程度を決定することが可能になるが、信号が非定常である場合、変動は時間とともに変化する。例えば、一定の信号と変動する小さな信号が混じっている場合、後者が単独で標準偏差全体に寄与することになる。現在の例では、これはより堅牢な手法、すなわち、次のようにM個の連続するサブウィンドウの標準偏差を計算することによって対処される(「robustStd」アルゴリズム):
アルゴリズム1:robustStd
【数1】
【0114】
アルゴリズム1は、各サブウィンドウについて標準偏差を計算し、これが閾値Taを超えているかどうかをチェックする。一般に、閾値を超える全ての標準偏差にわたる平均が返される。しかしながら、サブウィンドウの半分未満が閾値を超えている場合、堅牢な標準偏差は0に設定される。これは、有効なデータと無効なデータが混じっている場合に、時系列を強制的に破棄するためである。例えば、各サブウィンドウの長さは5秒であり得る。
【0115】
したがって、低活動信号を検出するための評価基準が提供され、評価基準を満足する場合、それらはモデルの作成に使用されるデータには含まれないことになる。しかしながら、削除されたデータの割合が高いほど、選択されたデータの活動分布の歪みが大きくなり、実際の活動分布を表す程度が低下する。これにより、加速度計データの分析結果に偏りが生じ、場合により、ユーザ認証における精度が低下する結果となり得る。
【0116】
データを組み立てる方法は、データの削除によってもたらされる歪みを最小限に抑えながら、nd日間の分析のデータセットを生成するように実行され得る。その目的のため、データ組み立て基準がデータに適用され得る。
【0117】
データを組み立てる方法は、欠測データを他の日のデータで置き換えることを含み得る。他の日のデータは、同じ時刻を含む1日の同様の時間を考慮することで選択され得る。
【0118】
例えばデータを組み立てる方法によって、nd日間の分析のデータセットを生成する例として、以下のステップが適用され得る。データの1時間ごとに、|std(r)>Ta|/|std(r)|>Tarの場合(Tarは活動率の閾値を表す)、データは良い時刻データセットに追加され得る。1日の24時間の1時間ごとに、良い時刻データセットに、対応する時間のデータがあるかどうかがチェックされ、存在する場合は、データが最終データセットに追加される。存在しない場合、その時間は特性評価されていない時間としてマークされ、これらの手順がnd回繰り返される。
【0119】
本方法は、選択する分析の日数、すなわちndと、良い時間を識別するために使用されるパラメータ、すなわちTa及びTarとを入力として受け取る。その出力は、アクチグラフィデータセットだけでなく、特性評価されていない時間のセット、すなわち十分なデータがない時間のセットでもある。このような時間に対処する安全な手法は、ユーザ認証の目的のために、それらを破棄することである。
【0120】
次に、活動クラスタリングについて説明する。活動を定量的に比較すること(例えば、活動強度分布)は、大きな変動を受ける。実際に、活動が特に高い又は低い日があるのは正常である。本発明は、類似した活動を一緒にグループ化した後、活動を定性的に比較することを可能にする。類似した活動に関連するアクチグラフィデータの一部をグループ化するために、時系列クラスタリングが使用される。
【0121】
一般に、類似した活動は、類似性/距離メトリックを介して類似したオブジェクトを識別するクラスタリングを介してグループ化できる。アクチグラフィでは、加速度値に含まれる情報は、加速度値の以前の値と将来の値とに関連付けられた場合に意味がある。この理由から、加速度計データをクラスタ化するのではなく、加速度計の時系列がクラスタ化される。
【0122】
加速度計データは、形状が移動の頻度とその時間的連結に関する情報を提供するので、形状ベースのクラスタリングに特に適している。信号の形状に焦点を当てたクラスタリング手法がk-Shapeである。これは、概念的にはより一般に普及しているk-Meansに類似しているが、2つの時系列間の距離、又はこの場合は類似性、を定義するために、ユークリッド距離ではなく、むしろ相互相関を使用する。しかしながら、k-Shapeは、加速度計データの3Dの性質と互換性がなく、例えば加速度の大きさを計算することにより3D情報を1Dに低減すると、加速度の方向に関する情報が失われる。この理由から、本発明は、k-Shape法に基づき、3次元加速度計データを処理するように構成された時系列クラスタリング手法を提供する。
【0123】
標準のk-Shape法の第2の問題は、類似性メトリックから発生する。これは、系列を時間的にシフトすることにより得られたものの中で、最大ピアソン相関を計算することと等価である。この操作は、次の式で記載される。
【数2】
【0124】
ここで、X及びYは2つの時系列であり、Nはそれらの長さである。それらの上にあるラインはサンプル平均演算子を示し、sは補正されたサンプル標準偏差である。
【0125】
上述したデータフィルタリングを用い、すなわち、特に低い標準偏差を有する信号をフィルタ除去し、同時に、結果として得られるデータセットが依然として元のデータを表すことを確実にするフィルタリングを用い、データフィルタリング技術にk-Shape法をカスケード式に使用することにより、ピアソン相関の別の問題を克服することに留意すべきである。すなわち、前述のピアソン相関では、2つの信号のうちの一方がほぼ一定である場合、分母にある正規化係数は特に小さい場合がある。これにより、ノイズが増強される。すなわち、正規化は、ほぼ一定の信号、例えばXを、係数sy/sxだけ増加させることと等価である。このようなノイズ増強は、上述したデータフィルタリングにより減少し得る。
【0126】
以下では、例えば加速度計データに好適な、3次元k-Shapeベースのクラスタリング手法について説明する。
【0127】
本方法は、データを各次元で別々にクラスタ化して、3つの軸間の強い相関関係を無視する場合、又は、例えば信号の大きさを計算することにより、3Dデータを1Dに減らした後にクラスタ化して、特に方向に関連する、例えば加速方向の情報の損失につながる場合と比較して、情報の損失を減らすアプローチを可能にする。
【0128】
本明細書で説明する方法は、代わりに、3つの軸に沿って平均化され、3つの軸にわたるシフト差を最大にする条件下で全ての可能な時間シフトのうちで最大化された正規化相互相関として、類似性メトリックを定義する。
【0129】
換言すれば、類似性メトリックは、各軸に1つずつの3つの正規化された相互相関間の平均である。時間シフトは、各次元にわたって、3つの時間シフト間の距離を最大にする制約下で平均相互相関を最大化するように選択される。実際、3つの軸にわたって異なる時間シフトを可能にすることにより、同期エラーを克服し、運動タイミングの一般性を高めることが可能になり得るが、時間シフトが、例えば1秒以上、大幅に異なる場合、活動もまた異なる。
【0130】
元々の類似性メトリック(NCC)に関して、3次元加速度計データを処理するように構成されたメトリックを以下に説明する。
【数3】
【0131】
式では、XとYを有する2つの3D時系列が参照される。XiとYiにおける時系列の添え字は3次元のうちの1つに沿った加速度計データを識別し、δiはi番目の次元に沿って適用される時間シフトである。制約|δi-δj|<1は、時間シフトが最大で1秒異なることを要求する。1秒の値は、単なる例示的な制約である。例えば、時間シフトの上限は、0~2秒、特に0.2~1.8秒、特に0.4~1.6秒、特に0.6~1.4秒、特に0.8~1.2秒であり得る。これらの値は、特に30Hzのサンプリングレートと組み合わせてもよい。加えて又は代わりに、時間シフトの上限は、時間ウィンドウサイズの0~20%、特に時間ウィンドウサイズの0~10%、特に時間ウィンドウサイズの5~10%であり得る。この場合、すなわち、所与のサンプリングレートに対して、時間シフトの上限(時間ウィンドウサイズのパーセンテージとして決定される上限)に等しい時間内に取得されたサンプル数については、可能な時間シフトの値はゼロに設定されることになる。
【0132】
上記のステップは、低レベルのデータ損失で、アクチグラフィデータを活動にクラスタ化することを可能にする。
【0133】
モデルを作成し、そのモデルに基づいてユーザ認証を実行する目的で、好適なデータが選択される。クラスタリングによって得られる全ての活動のなかで最も関連性の高い活動は、詐称者の可能性がある人と比較して、予想されるユーザが異なる時間を費やす活動である。
【0134】
上記を考慮すれば、予想されるユーザと、平均的な詐称者のプロファイルを表す他の人の両方からのデータに対してクラスタリングを実行することにより、特徴的な頻度を伴う活動がより確実に識別されると結論付けることができる。予想されるユーザのみ又は他の人のみからのデータでは、低頻度の活動と高頻度の活動をそれぞれ見落とす(すなわち、クラスタに割り当てられない)場合がある。
【0135】
したがって、上述したデータ構造化及びフィルタリングステップを実行した後、予想されるユーザからのデータ及び他の人のデータに対してクラスタリングが実行される。予想されるユーザからNeu個のサンプルが利用できる場合、他の人のためにNeu/Miu個のサンプルが選択される。ここで、Miuは、基準プロファイルの作成に使用される人の数である。
【0136】
予想されるユーザに関しては、Neu個のサンプルが、基準期間とも称される第1の期間から選択される。例えば、臨床試験では、第1の期間はベースライン期間に対応し得る。基準プロファイル用のサンプルは、調査の異なる参加者から取得することができ、この調査は予想されるユーザが属する調査と同じであっても同じでなくてもよい。サンプルのそれぞれについて、Neu個のサンプルが最初に収集され、その後、Neu/Miuは、例えば均一な確率で、ランダムに抽出されたサンプルである。
【0137】
予想されるユーザと他の人からのデータをマージし、次いでクラスタリングを実行することが可能である。代わりに、クラスタリングは、予想されるユーザ及びMiu人の他の人からのアクチグラフィデータに対して別々に実行されてもよく、次いでクラスタリングの結果がマージされてもよい。
【0138】
本方法は、確率モデルを構築、フィッティング、及び改良することを含んでもよく、又はユーザ認証のために既存の確率モデルを使用してもよい。確率モデルを構築し、それをフィッティング及び改良する例について以下に説明する。
【0139】
上述したクラスタリング手順を使用して重心のセットが取得され、これを使用して、類似した活動をグループ化する。ユーザが各クラスタで費やした時間が、各活動の頻度に関連付けられ、これを次に使用して、アクチグラフィデバイスのユーザを検証する。実際、活動の頻度は、人の体力、ライフスタイル、ルーチンに、そして各活動を実行する際のパターンに関連付けられ、これらは全て特有の特徴となる可能性がある。
【0140】
したがって、各活動の頻度によってどれ程の情報が与えられるかが推定され、この推定を使用してアクチグラフィデバイスのユーザを検証する。
【0141】
確率モデルはその目的のために作成されており、その目標は、アクチグラフィデバイスのユーザを表し「予想されるユーザ」又は「詐称者」の値をとり得る確率変数Uを特性評価することである。ユーザが変化すると、Uの値は時間の経過に伴い変化する。したがって、時間の経過に伴う確率変数の漸進的進展が特性評価される。特に、確率変数は、観察された活動(クラスタ)の関数として、したがってWの時間粒度を伴って特性評価される。
【0142】
ユーザがセンサを詐称者に迅速に渡した場合、又はその逆の場合、対応する時間ウィンドウ内の加速度計データには、ユーザデータと詐称者データが混在している場合がある。
【0143】
トラバースされたクラスタの時系列シーケンスは、ランダムプロセス{C1,C2,...,Ct}でモデル化される。ここで、各実現値Ciの値は、クラスタリング手法により出力で与えられたk個のクラスタ、c1,...,ck、うちの1つである。
【0144】
信頼度は、現在の時刻tまでに観察されたクラスタの履歴が与えられた場合に予想されるユーザの確率として定義される。信頼度は次に対応する:Pr(U=uexp|C1,C2,...,Ct)。予想されるユーザはuexpで示される。Pr(U=uexp|C1,C2,...,Ct)<Tl(ここでTlは低閾値)の場合、データは詐称者データとして分類される。すなわち、この式は、詐称者の存在を推測するには信頼度が十分に低い場合を判定する。Tlの値は、性能メトリックを最適化するように自動的に調整され得る。
【0145】
信頼度の分布は、クラスタ履歴の関数として次のように特徴付けられる。
【0146】
最初に、1つだけのクラスタを観察するシナリオについて処置する。表記の便宜上、次の別称が導入される:θj=Pr(U=Uexp|C1=cj)。
【0147】
ジェネリッククラスタjについて、ランダム変数(U|C1=cj)は、唯一のパラメータθjにより特徴付けられるベルヌーイ分布に従う。このようなパラメータの値は、クラスタの発生から推定され得る。予想されるユーザデータのデータから抽出されたN個の時系列と、詐称者のデータから抽出された同じ数の時系列が考慮される。次に、予想されるユーザと詐称者についてのクラスタcjの発生にそれぞれ対応するNj,euとNj,iuが計算される。θjが既知の場合、そのようなクラスタの発生を観察する尤度は次のようになる:Pr(Nj,eu、Nj,iu|θj)=(θj)Nj,eu(1-θj)Nj,iu。
【0148】
この時点で、上記の量を最大化することにより、θ
jを推定できる。(最尤推定として知られる)この手法により、以下が導かれる。
【数4】
【0149】
この手法は、まれなクラスタ、すなわちサンプルが豊富でないクラスタに関連する問題を有し得る。例えば、予想されたユーザに対してクラスタが全く観察されない場合、詐称者に対して同じクラスタが1回だけ観察されたとしても、確率はゼロになる。より堅牢な手法は、θjの事前確率分布を定義し、事後確率、すなわち尤度と事前確率との積を最大化することからなる。最大事後確率(MAP)基準として知られるこの手法の結果は、サンプルが多いほど、観察値により追随し、データサンプルが少ないほど、事前分布により近くなる。
【0150】
尤度がベルヌーイ分布である場合、ベルヌーイ分布とベータ分布の積もまた(ベルヌーイ分布の共役事前分布と呼ばれる)ベータ分布であるため、事前分布に対してベータ分布を想定することが一般的である。
【0151】
ベータ分布は、2つのパラメータ、α及びβ、によって特徴付けられる。これらのパラメータは、基本的に2つの効果を決定する:事前確率効果の強度、及びθjの0又は1へのバイアスである。
【0152】
この例では、ユーザと予想される詐称者の可能性が同じであると想定されている。これは、α=βであることに対応し、これは、何らかの観察以前の確率θjの期待値が0.5であることを意味する。
【0153】
その結果、MAP基準で計算されたベータ事後確率の期待値は以下に等しくなる:
【数5】
【0154】
ユーザに対してクラスタが観察されていない場合、αの役割は特に明白である。この場合、クラスタは以下に等しい非ゼロの確率を想定している。
【数6】
【0155】
事前確率の影響はサンプル数とともに減少することに留意されたい。逆に、αが増加するほど事前確率の影響は大きくなる(例えば、α=30を使用してもよい)。
【0156】
1つの観察されたクラスタでの分析を終了したので、次に2つの連続するクラスタC
1及びC
2でのシナリオを分析する。第2のクラスタを観察した後の信頼度は次の通りである:
【数7】
表記の便宜上、C
1及びC
2がとる値は省略されている。この式では、確率P
r(U=u
exp|C
1)は、1つの観察されたクラスタでのシナリオに対して推定された確率と一致する。すなわち、これは、事前ステップでの信頼度である。残りの項は代わりに、2つの尤度の比率である。すなわち、1つは監視対象がユーザであるという知識を用いて計算された尤度であり、もう1つはそのような知識がない場合に計算された尤度である。上記の式は一般的に成立し、実際、以下のようになる:
【数8】
【0157】
ここでも、分子の右の項は、事前ステップで計算された信頼度である。他の2つの項は、適切な数の観察値を用いて、データから推定する必要がある。しかしながら、活動が低頻度で実行される場合、例えば歯磨きのように一般に1日に2~3回実施される活動の場合、これは困難である。そのような活動がクラスタcbに対応すると想定すると、1に等しいメモリで、すなわちPr(Ci=cb|Ci-1=ca)である全てに対して、尤度を推定することさえ難しい場合がある。データが、クラスタの数に関して、長い時間フレームをカバーしている場合、推定はより信頼性が高くなる。例えば、クラスタ数が50程度であり、データの時間フレームが1週間の場合、平均で1つのサンプルで各尤度Pr(Ci|Ci-1)を推定することが望ましいであろう。
【0158】
上述した理由により、Pr(Ci|C1,...,Ci-1)はPr(Ci)で近似され、Pr(Ci|C1,...,Ci-1,U=uexp)はPr(Ci|U=uexp)で近似される。
【0159】
したがって、以下の式
【数9】
が、クラスタ時系列に関してメモリのないモデルを提供する。しかしながら、信頼度は依存としてメモリを有する。
【0160】
Pr(Ci|U=uexp)/Pr(Ci)の量は、尤度比と称される。
【0161】
これらはベイズの定理を適用して計算される。
【数10】
【0162】
デジタル計算では、積を和に変換してオーバーフロー/アンダーフローのリスクを軽減する対数で操作することがより便利である。結果として得られる対数尤度比は、モデルのために格納する必要がある唯一の量であり、以下のように計算される
llr(cj)=log(Pr(U=uexp|Ci=cj))-log(Pr(U=uexp)) (3)
ここでllrは対数尤度比を意味する。左側の項はθに対応し、これは式(1)のデータにフィッティングされている一方で、右側の項は観察なしの演繹的信頼度である。
【0163】
Pr(U=uexp|Ci=Cj)の期待値は0.5であると想定されているので、全てのクラスタにわたる加重平均であるPr(U=uexp)の期待値も0.5である。
【0164】
確率モデルは、各クラスタ内の予想されるユーザ及び詐称者の発生数をカウントすることによりフィッティングされ得る。しかしながら、詐称者データは不明であるため、他の人から収集したデータで置換される。確率モデルをフィッティングするために使用されるデータは、上記で説明したように、予想されるユーザ(第1の期間)並びに他の人の分析の初期の数日(例えば、臨床試験のベースライン)から抽出される。結果として、この期間中、アクチグラフィデバイスのユーザは、予想されるユーザであると想定できる。
【0165】
いったん確率モデルがフィッティングされると、対数尤度比がメモリに保存され、ユーザを検証するために使用される。ユーザ認証タスクにおけるモデルの良好性は、まだ観察されていないデータをモデルがどの程度表現するかに依存する。これを測定するために、異なる重なり合わない時間に収集された2つのデータセットに対して対数尤度比が計算され得る。
図3には、調査の実際のユーザに対して2つの異なる観察期間中に計算された対数尤度比が示され、検証セットとテストセットが示されている。
図3では、正の棒と負の棒は、それぞれ信頼度を増加及び減少させるクラスタを表す。一貫性の基準を満足しないクラスタは、対数尤度がゼロであるため、このグラフから抹消されている。
【0166】
検証をテストセットと比較することにより、対数尤度の安定性、すなわち、各クラスタで費やされた時間の一貫性の評価が可能になる。各クラスタに関する2つの値が近いほど、実行された活動がユーザのものである予測可能性が高くなる。
【0167】
ユーザ認証の精度に関しては、対数尤度が安定しているだけでなく、ゼロとは明らかに異なることが好ましい。対数尤度比は、クラスタが観察されるたびに使用されて、ユーザの身元識別情報における信頼度が更新される。信頼度更新基準は、式(3)と式(2)を組み合わせることにより得られ、次式になる:
log(Pr(U=uexp|C1,...,Ci))≒log(Pr(U=uexp|C1,...,Ci-1))+llr(Ci)
【0168】
以下に説明するように、モデルは更に改良され得る。メモリレスモデルの問題は、活動が大幅に異なる頻度で実行される場合、すなわち1桁以上異なる場合に生じ得る。例えば、ユーザがクラスタc1を1日当たり20回トラバースするのに対し、平均的な人はそのクラスタを1日当たり200回トラバースすることを想定されたい。ある日に、両方のクラスタが20回トラバースされた場合、次のクラスタがc1である確率は、詐称者がいない限り、c2である確率よりも遥かに低い。それでもやはり、メモリレスモデルは、この情報から抽象化され、したがって観察値に関係なく確率は同じままである。
【0169】
この効果の欠点は、クラスタc2の観察がクラスタc1の観察の10倍であることである。この影響を弱めるために、確率は、その平均発生回数によって調整される。これを行うために、llr値が、そのクラスタに関する平均発生数で除算される。すなわち、llrnorm(cj)=llr(cj)/Ncj,Pである。
【0170】
前の例では、c1とc2のllr値が同じであると仮定すると、llrnorm(c2)の値はllrnorm(c1)の値の10分の1になる。その結果、c2の200個の観察が、c1の20個の観察と同じ程度の影響を及ぼすことになる。
【0171】
各クラスタの頻度が非常に一貫していない場合、別の問題が生じ得る。例えば、予想されるユーザが、ある活動を週末にのみを実行する場合がある一方で、平均的な詐称者がその活動を1週間を通して同じ頻度で実行する場合がある。この場合、llrは負である可能性がある。しかしながら、週末には、ユーザに対してその活動の頻度が高いことが登録され、それにより信頼度が低下する。
【0172】
これらの影響を考慮するために、llrが毎日計算されてもよく、基準期間中の少なくとも75%の日数で値が同じ符号を有することが確認されてもよい。そうでない場合は、信頼度に影響を与えないように、そのクラスタは除外される。これに関しては、休業日などの様々な日に関する代替モデルを作成することにより、更なる改善が得られる場合がある。
【0173】
検証ステップは、以下のように実行され得る。
【0174】
加速度計データを時間制限信号に構成し、それらをクラスタ化して類似した活動を識別し、観察されたユーザが予想されるユーザであるかどうかを推測するために使用される、各活動を観察する確率的影響を計算した後に、予想されるユーザを検証するステップが、例えば第2の期間中に実行できる。実際のユーザ認証ステップを実行するために、ユーザの身元識別情報について推論が行われる。
【0175】
例えば、検証方法において、確率が十分に高い場合、データは正しいものとしてマークされる場合があり、十分に低い場合、データは詐称者データとしてマークされる。そうするために、確率は低閾値Tl及び高閾値Thと比較される。これらの閾値は、決定判断基準として使用され得る。
【0176】
以下では、この例において、未加工の加速度計データから抽出された情報に基づいて、このような決定判定基準がどのように適用されるか、すなわち、最も近いクラスタに割り当て、そのクラスタに対応する対数尤度比を追加して現在のユーザの対数確率を更新し、十分な信頼度がある場合にユーザの身元識別情報を推測すること、が示される。
アルゴリズム2:ImpostorDetection
【数11】
【0177】
この例において、本方法によって返される値は配列lであり、これは、詐称者サンプルに対応する値1、及びそれ以外の場合の値0を含む。ユーザ認証チェックは、Wサンプルが観察されるたびに適用される。ここで、Wはクラスタ重心の長さのサイズに対応する。上述した類似性メトリックを使用して計算された最も近い重心が、現在のウィンドウの活動を決定する。認識された活動に対数尤度比が関連付けられ、現在の信頼度に追加される。更新された信頼度がTlよりも低いか、又はThよりも高い場合に分類が行われる。どちらも該当しない場合、より多くの証拠が収集される。しかしながら、maxE回の信頼度更新後、証拠はリセットされる。実際、特に古い証拠は、ユーザがその間に変化したかも知れないので、重要性が低くなり得る。パラメータmaxE、Tl、及びThは、ユーザ認証アルゴリズム2の性能を向上させるものであり、誤アラームの割合、又は真のアラームを発しない割合、又は詐称者の検出までの時間のような性能メトリックに関して最適化され得る。
【0178】
検証方法の性能を決定するための例と実験結果を以下に説明する。
【0179】
ユーザ認証技術の性能は、詐称者を検出することの利益と、真のユーザを詐称者として検出するコストとの組み合わせである。チューニングパラメータが、上記で特定したパラメータmaxE、Tl、及びThのうちの1つ以上であり得る場合、これら2つの間にトレードオフが存在する。
【0180】
以下の考察では、主目的は、不当なデータに直面したときにアラームを発すること、並びに詐称者がセンサを着用していたときの測定値を特定することであると想定している。アラームは、例えばユーザにデバイスを取り戻すように依頼するのに役立つ一方で、詐称者データを特定することはデータをクレンジングするために使用できる。
【0181】
以下で使用されるパフォーマンスメトリックは、誤アラームを発生させるコストと、真のアラームを発生させない、又は遅延して発生させるコストの組み合わせである。
【0182】
誤アラーム率(FAR)は、一定期間に発生する誤アラームの予想数として定義される。一例として、実際には、FARは1年に1回程度でなければならない。実際、誤アラームにより、真のデータが破棄される、又は関連データの手動チェックが開始される場合があり、これは時間を要する。
【0183】
平均検出時間(MTTD)は、ユーザがデバイスを詐称者に渡してから検出されるまでの予想される遅延として定義される。以下では、FARを上記の値未満に維持しながら、MTTDメトリックを最小化した。
【0184】
一例示的実施形態の実験結果を以下に説明する。実験は、不介入調査からの加速度計データを使用して実施された。参加者(ユーザ)は、手首にActigraph GT9X/Linkデバイスを着用し(左手か右手かを選択することが許容された)、このデバイスは、調査期間を通して、手首に着用している間に加速度計データを30Hzでキャプチャするように構成されている。調査の最後に、USBインタフェースを介して未加工の加速度データを抽出した。
【0185】
参加者ごとに、その参加者と他の参加者の両方に属する、基準期間(第1の期間)に(1対1の比率で)収集されたデータに対してクラスタリングが実行される。予想される詐称者の基準プロファイルを作成するために、他の参加者からのクラスタ化されたデータが使用され、データは様々な調査の参加者の中から選択される。これは、正しい参加者が行った特定の調査の採用判定基準に関連するバイアスを減らすためである。例えば、予想されるユーザが変形性関節症の患者の調査に属する場合、クラスタリングを実行するために、同じ調査からのデータを使用することは、他の疾患に固有のパターンを検出するのに悪影響を及ぼす。
【0186】
様々な調査中に収集された予想されるユーザデータと他の人のデータとを均衡して混合させたものにクラスタリングを実行した。次いで、上述したように確率モデルを作成した。
【0187】
検証方法(特に上記のアルゴリズム2)をテストするために、ユーザごとにFARとMTTDを計算した。FARは、基準期間(第1の期間)に関連する部分を除外したユーザのデータに対してアルゴリズム2を実行することにより計算した。
【0188】
MTTDを計算するために、同じ調査の他の参加者からのデータを使用することにより、詐称者データの存在をシミュレートした。上述したように、同じ調査の参加者は共通の特性を共有する可能性が高いが、詐称者がユーザに類似する特性を共有する場合、検出タスクはより困難になるが、それでも信頼性がある。これは控えめ目な尺度、すなわち実際のパフォーマンスに対するある種の下限として機能する。
【0189】
詐称者データは、2つの加速度計データ、すなわち1つは正しいユーザからのデータ、もう1つは異なる被験者からのデータ、をつなぎ合わせることでシミュレートできる。しかしながら、30秒程度であり得る移行期間から、すなわち1つの証拠だけから、抽象化することが安全である。この過渡的な期間中、「センサを他の誰かに渡す」という活動は恐らくクラスタリング中には決して観察されないので、データは予測できないクラスタに割り当てられることになる。したがって、その影響は最小限であり、詐称者がセンサを取得したときにデータ収集が始まったかのように詐称者データを処理できると想定できる。詐称者が検出されると直ぐに、要した時間が計算され、TTDサンプルが記録される。次いで、以降のデータを用いて同じ手順を繰り返し、信頼度をリセットし、検出がトリガされると、新しいTTDサンプルを追加する。このプロセスの最後に、全てのTTDの平均が決定されて、MTTDメトリックが抽出される。
【0190】
制約としてFARをゼロに設定し、この制約の下でMTTDを最小化すると、
図4に示すように、ユーザと詐称者の全ての可能なペアにわたって平均化されたTTDの分布が得られる。分布プロットは経験的な累積分布関数であり、したがって、それを解釈する正しい方法は、y軸上の詐称者の部分が、x軸上の対応する値よりも短い時間内に検出できることである。
【0191】
図から分かるように、約35%の詐称者が30分未満で検出され、約77%が1時間未満で検出され、約90%が2時間未満で検出され、詐称者の全てが8時間未満で検出されている。
【0192】
本発明の前述した実施形態及び実施例を別々に説明してきたが、上述した特徴のいくつか又は全てを異なる形態で組み合わせることもできることを理解されたい。上述した実施形態は限定を意図するものではなく、本発明の特徴及び利点を説明する実施例としての役割を有する。
【国際調査報告】