IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ グーグル インコーポレイテッドの特許一覧

特表2024-540040パワースペクトルベースの分散を使用した顔認証なりすまし防止
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-10-31
(54)【発明の名称】パワースペクトルベースの分散を使用した顔認証なりすまし防止
(51)【国際特許分類】
   G06V 40/40 20220101AFI20241024BHJP
【FI】
G06V40/40
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024525143
(86)(22)【出願日】2021-10-26
(85)【翻訳文提出日】2024-06-05
(86)【国際出願番号】 US2021056631
(87)【国際公開番号】W WO2023075754
(87)【国際公開日】2023-05-04
(81)【指定国・地域】
(71)【出願人】
【識別番号】502208397
【氏名又は名称】グーグル エルエルシー
【氏名又は名称原語表記】Google LLC
【住所又は居所原語表記】1600 Amphitheatre Parkway 94043 Mountain View, CA U.S.A.
(74)【代理人】
【識別番号】110001195
【氏名又は名称】弁理士法人深見特許事務所
(72)【発明者】
【氏名】ポンセ,マドリガル・オクタビオ
(72)【発明者】
【氏名】ハイザー,アントン
(72)【発明者】
【氏名】アミフッド,パトリック・エム
【テーマコード(参考)】
5B043
【Fターム(参考)】
5B043AA10
5B043BA04
(57)【要約】
超音波を使用して顔認証なりすまし防止を実施する技術および装置が説明される。特に、顔認証システム(202)は、超音波を使用して、リアルの人間の顔と、人間の顔のバージョンを提示する手段を使用するプレゼンテーション攻撃とを区別する。顔認証システム(202)は、超音波センサ(216)を含み、またはそれと通信し、プレゼンテーション攻撃を検出して、顔認証システム(202)に通知できる。概して、超音波センサ(216)は、パワースペクトルを使用して、少なくとも1つの受信チャネル内で経時的に観察された分散量を評価する。このようにして、超音波センサ(216)は、権限のないアクタが、プレゼンテーション攻撃を使用してユーザのアカウントもしくは情報にアクセスすることを防止できる。
【特許請求の範囲】
【請求項1】
超音波センサによって実行される方法であって、
超音波送信信号を送信することと、
前記超音波センサの少なくとも2つのトランスデューサを使用して少なくとも2つの超音波受信信号を受信することとを含み、前記少なくとも2つの超音波受信信号は、物体によって反射された前記超音波送信信号のそれぞれのバージョンを含み、
前記方法は、前記少なくとも2つの超音波受信信号に基づいてパワースペクトルを生成することをさらに含み、前記パワースペクトルは、周波数のセットおよび時間間隔にわたる前記少なくとも2つの超音波受信信号のパワーを表し、
前記方法は、経時的な前記パワースペクトル内の前記パワーの分散を判定することをさらに含み、前記分散は、前記少なくとも2つの超音波受信信号とそれぞれ関連しており、
前記方法は、前記分散に基づいてプレゼンテーション攻撃を検出することをさらに含み、前記プレゼンテーション攻撃は、顔認証システムをだますことを試行しており、前記物体は、前記プレゼンテーション攻撃と関連付けられており、
前記方法は、前記顔認証システムが前記プレゼンテーション攻撃を認証することを防止することをさらに含む、方法。
【請求項2】
前記パワースペクトルを生成することは、
前記少なくとも2つの超音波受信信号に基づいて複素数データを生成することと、
前記パワースペクトルを生成するためにフーリエ変換を実行することと
を含む、請求項1に記載の方法。
【請求項3】
前記複素数データは、
レンジプロファイルデータ、
レンジスロータイムデータ、または
インターフェログラム
を含む、請求項1または請求項2に記載の方法。
【請求項4】
前記プレゼンテーション攻撃を検出することは、
前記分散が値のセット内にあるかどうかを判定することと、
前記分散の少なくとも1つが前記値のセット外にあることに応答して、前記プレゼンテーション攻撃を検出することと
を含む、請求項1~請求項3のいずれか1項に記載の方法。
【請求項5】
前記プレゼンテーション攻撃を検出することは、
他の超音波送信信号を送信することと、
少なくとも2つの他の超音波受信信号を受信することとを含み、前記少なくとも2つの他の超音波受信信号は、人間の顔によって反射された前記他の超音波送信信号のバージョンを含み、
前記少なくとも2つの他の超音波受信信号に基づいて他のパワースペクトルを生成することを含み、前記他のパワースペクトルは、前記周波数のセットおよび他の時間間隔にわたる前記少なくとも2つの他の超音波受信信号のパワーを表し、
経時的な前記他のパワースペクトル内の前記パワーの他の分散を判定することを含み、前記他の分散は、前記少なくとも2つの超音波受信信号とそれぞれ関連しており、
前記他の分散が前記値のセット内にあることに応答して、前記顔認証システムが、前記人間の顔を認証することを可能にすることを含む、
請求項4に記載の方法。
【請求項6】
前記人間の顔は、付属品を装着している、請求項5に記載の方法。
【請求項7】
前記パワースペクトルは、
前記少なくとも2つの超音波受信信号のうちの第1の超音波受信信号と関連する第1のパワースペクトルと、
前記少なくとも2つの超音波受信信号のうちの第2の超音波受信信号と関連する第2のパワースペクトルとを含み、
前記分散を判定することは、
スライディングウィンドウを使用して、前記第1のパワースペクトルのサブフレームの第1のセットを生成することを含み、前記サブフレームの第1のセットのサブフレームは、前記時間間隔の異なる部分と関連しており、
前記サブフレームの第1のセットにわたる第1の標準偏差を計算することと、
前記スライディングウィンドウを使用して、前記第2のパワースペクトルのサブフレームの第2のセットを生成することとを含み、前記サブフレームの第2のセットのサブフレームは、前記時間間隔の前記異なる部分と関連しており、
前記サブフレームの第2のセットにわたる第2の標準偏差を計算することを含む、
請求項1~請求項6のいずれか1項に記載の方法。
【請求項8】
前記プレゼンテーション攻撃は、
権限のないアクタが、権限のあるユーザの写真を提示すること、
前記権限のないアクタが、前記権限のあるユーザのデジタル画像を表示するデバイスを提示すること、または
前記権限のないアクタが、前記権限のあるユーザを表すマスクを装着することを含む、
請求項1~請求項7のいずれか1項に記載の方法。
【請求項9】
請求項1~請求項8に記載の方法のうちのいずれか1つの方法を実行するように構成されている超音波センサを備える装置。
【請求項10】
前記装置は、スマートフォンを含み、
前記超音波センサは、前記スマートフォン内に集積されており、
前記超音波センサの前記少なくとも2つのトランスデューサは、
前記スマートフォンの第1のマイクと、
前記スマートフォンの第2のマイクとを備える、
請求項9に記載の装置。
【請求項11】
前記第1のマイクおよび前記第2のマイクは、前記スマートフォンの反対の端部に位置決めされている、請求項10に記載の装置。
【請求項12】
前記少なくとも2つのトランスデューサ間の距離は、前記超音波送信信号と関連している波長よりも大きい、請求項9~請求項11のいずれか1項に記載の装置。
【請求項13】
プロセッサによって実行されると、超音波センサに、請求項1~請求項8に記載の方法のうちのいずれか1つの方法を実行させる命令を含むコンピュータ可読媒体。
【発明の詳細な説明】
【背景技術】
【0001】
背景
顔認証は、ユーザが、自分のデバイスのロック解除、アカウントにアクセスするためのセキュリティの追加、またはトランザクションの署名のための便利なやり方を提供し、ユーザエクスペリエンスを向上させる。いくつかの顔認証システムは、顔認証のためにカメラに依拠する。しかしながら、カメラが、ユーザの顔と、ユーザの顔の画像を提示するプレゼンテーション攻撃とを区別することは困難な場合がある。そのため、権限のないアクタが、カメラに依拠する顔認証システムをだますことを防止する際に困難が生じる。
【発明の概要】
【発明が解決しようとする課題】
【0002】
概要
パワースペクトルベースの分散を使用して顔認証なりすまし防止を実施する技術および装置が説明される。特に、顔認証システムは、超音波を使用して、リアルの人間の顔と、人間の顔のバージョンを提示する手段を使用するプレゼンテーション攻撃とを区別する。例示的な手段としては、ユーザの写真を有する1枚の紙、ユーザのデジタル画像を表示する画面、またはユーザの顔をある程度まで複製したマスクが挙げられ得る。顔認証システムは、超音波センサを含み、またはそれと通信し、プレゼンテーション攻撃を検出して、顔認証システムに通知できる。概して、超音波センサは、パワースペクトルを使用して、少なくとも1つの受信チャネル内で経時的に観察された分散量を評価する。パワースペクトルベースの分散を使用することによって、超音波センサは、顔認証なりすまし防止のために、プレゼンテーション攻撃手段と人間の顔とを区別できる。これらの技術を使用して、超音波センサは、権限のないアクタが、プレゼンテーション攻撃を使用してユーザのアカウントもしくは情報にアクセスすることを防止できる。
【0003】
以下で説明する態様は、分散を使用する顔認証なりすまし防止のための超音波センサによって実行される方法を含む。本方法は、超音波送信信号を送信することと、超音波センサの少なくとも2つのトランスデューサを使用して、少なくとも2つの超音波受信信号を受信することとを含む。少なくとも2つの超音波受信信号は、物体によって反射された超音波送信信号のそれぞれのバージョンを含む。方法はまた、少なくとも2つの超音波受信信号に基づいてパワースペクトルを生成することを含む。パワースペクトルは、周波数のセットおよび時間間隔にわたる少なくとも2つの超音波受信信号のパワーを表す。方法は、加えて、経時的なパワースペクトル内のパワーの分散を判定することを含む。分散は、少なくとも2つの超音波受信信号とそれぞれ関連している。方法は、分散に基づいてプレゼンテーション攻撃を検出することをさらに含む。プレゼンテーション攻撃は、顔認証システムをだますことを試行しており、物体は、プレゼンテーション攻撃と関連付けられている。方法はまた、顔認証システムがプレゼンテーション攻撃を認証することを防止することを含む。
【0004】
以下で説明する態様は、説明した方法のうちのいずれかを実行するように構成されている超音波センサを備える装置を含む。
【0005】
以下で説明する態様はまた、プロセッサによって実行されると、超音波センサに、説明した方法のうちのいずれかを実行させる命令を備えるコンピュータ可読媒体を含む。
【0006】
以下で説明する態様はまた、パワースペクトルベースの分散を使用した顔認証なりすまし防止のための手段を有するシステムを含む。
【0007】
パワースペクトルベースの分散を使用した顔認証なりすまし防止のための装置および技術が、以下の図面を参照して説明される。同一の番号は、同様の特徴および構成要素を参照するために、図面全体を通して使用される。
【図面の簡単な説明】
【0008】
図1】パワースペクトルベースの分散を使用した顔認証なりすまし防止が実施可能な例示的な環境を示す図である。
図2-1】ユーザデバイスの一部としての顔認証システムの例示的な実施態様を示す図である。
図2-2】顔認証なりすまし防止のための超音波センサの例示的な構成要素を示す図である。
図2-3】顔認証なりすまし防止のための例示的なセンサを示す図である。
図3】超音波を使用して顔認証なりすまし防止を実行する例示的な顔認証システムを示す図である。
図4-1】何らかのプレゼンテーション攻撃手段と人間の顔との超音波反射の差を示す図である。
図4-2】何らかのプレゼンテーション攻撃手段と人間の顔との受信されたパワーの差を示す図である。
図5】ユーザデバイスのスピーカーおよびマイクの例示的な位置を示す図である。
図6】顔認証なりすまし防止のための超音波センサの例示的な実施態様を示す図である。
図7】顔認証なりすまし防止のための超音波センサによって実施される例示的なスキームを示す図である。
図8-1】顔認証なりすまし防止のための単一チャネル特徴を生成するために、超音波センサによって実施される例示的なスキームを示す図である。
図8-2】顔認証なりすまし防止と関連する例示的なレンジプロファイルデータを示す図である。
図9-1】顔認証なりすまし防止のための多重チャネル特徴を生成するために、超音波センサによって実施される例示的なスキームを示す図である。
図9-2】顔認証なりすまし防止と関連する例示的なインターフェログラムを示す図である。
図10-1】位置合わせを実行するために超音波センサによって実施される例示的なスキームを示す図である。
図10-2】位置合わせを実行するために、超音波センサによって実施される別の例示的なスキームを示す図である。
図10-3】位置合わせを実行するために超音波センサによって実施されるさらなる例示的なスキームを示す図である。
図10-4】位置合わせを実行するために超音波センサによって実施されるさらに別の例示的なスキームを示す図である。
図11-1】顔認証なりすまし防止のための別の単一チャネルまたは多重チャネル特徴を生成するために、超音波センサによって実施される例示的なスキームを示す図である。
図11-2】顔認証なりすまし防止と関連する例示的なパワー分布ヒストグラムを示す図である。
図11-3】顔認証なりすまし防止と関連する例示的な定誤アラームレート信号対雑音比ヒストグラムを示す図である。
図12-1】顔認証なりすまし防止のためのさらに別の単一チャネルまたは多重チャネル特徴を生成するために、超音波センサによって実施される例示的なスキームを示す図である。
図12-2】顔認証なりすまし防止と関連する標準偏差グラフの第1のセットを示す図である。
図12-3】顔認証なりすまし防止と関連する標準偏差グラフの第2のセットを示す図である。
図13】超音波を使用して顔認証なりすまし防止を実行するための例示的な方法を示す図である。
図14】干渉法ベースのコヒーレンスを使用して顔認証なりすまし防止を実行するための別の例示的な方法を示す図である。
図15】パワースペクトルベースの分散を使用した顔認証なりすまし防止を実行するためのさらなる例示的な方法を示す図である。
図16】パワースペクトルベースの分散を使用した顔認証なりすまし防止を具体化する、またはその使用を可能にする技術が実施され得る例示的なコンピューティングシステムを示す図である。
【発明を実施するための形態】
【0009】
詳細な説明
概説
顔認証は、ユーザに、自分のデバイスのロック解除、アカウントにアクセスするためのセキュリティの追加、またはトランザクションの署名のための便利なやり方を提供し、ユーザエクスペリエンスを向上させる。いくつかの顔認証システムは、顔認証のためにカメラに依拠する。しかしながら、カメラが、ユーザの顔と、ユーザの顔の画像を提示するプレゼンテーション攻撃とを区別することは困難な場合がある。そのため、権限のないアクタが、カメラに依拠する顔認証システムをだますことを防止する際に困難が生じる。
【0010】
いくつかの技術は、活発性(例えば、瞬きもしくは顔面動作)を検出することによってリアルの顔と顔の画像とを区別する。しかしながら、これらの技術は、追加のキャプチャ時間を必要とし、それによって顔認証を実行することに伴うレイテンシを増加させる。さらに、これらの技術は、それらの動きを含む人間の顔の動画記録を使用して実現され得る。
【0011】
これらの問題に対処するために、本書は、超音波を使用して顔認証なりすまし防止を実施する技術およびデバイスを説明する。特に、顔認証システムは、超音波を使用して、リアルの人間の顔と、人間の顔のバージョンを提示する手段を使用するプレゼンテーション攻撃とを区別する。例示的な手段としては、ユーザの写真を有する1枚の紙、ユーザのデジタル画像を表示する画面、またはユーザの顔をある程度まで複製したマスクが挙げられ得る。顔認証システムは、超音波センサを含み、またはそれと通信し、プレゼンテーション攻撃を検出して、顔認証システムに通知できる。概して、超音波センサは、パワースペクトルを使用して、少なくとも1つの受信チャネル内で経時的に観察された分散量を評価する。パワースペクトルベースの分散を使用することによって、超音波センサは、顔認証なりすまし防止のために、プレゼンテーション攻撃手段と人間の顔とを区別できる。これらの技術を使用して、超音波センサは、権限のないアクタが、プレゼンテーション攻撃を使用してユーザのアカウントもしくは情報にアクセスすることを防止できる。
例示的な環境
図1は、パワースペクトルベースの分散を使用した顔認証なりすまし防止のための技術が具体化され得る例示的な環境100-1~100-5の図である。環境100-1~100-5において、ユーザデバイス102は、顔認証104を実行する。環境100-1および100-2において、ユーザ106は、ユーザデバイス102を制御し、顔認証104を使用して、例えば、アプリケーションにアクセス、またはトランザクションに(電子的に)署名する。顔認証104中に、ユーザデバイス102は、カメラシステムを使用して1つまたは複数の画像108をキャプチャする。この場合、画像108は、ユーザ106の顔を含む。顔認識技術を使用して、ユーザデバイス102は、その画像からユーザの顔を認識し、ユーザ106を認証する。
【0012】
場合によっては、ユーザ106は、付属品110(例えば、帽子、スカーフ、ヘッドバンド、眼鏡、または宝飾品)を装着していることがあり、ユーザデバイス102がユーザ106を認識するのをより困難にし得る。この状況において、ユーザデバイス102は、超音波を使用してプレゼンテーション攻撃の不在を判定し、リアルの人間の顔が存在することを確定することができる。超音波を用いて、ユーザデバイス102は、環境100-1などのユーザ106が付属品110を装着していない状況および環境100-2などのユーザ106が付属品110を装着することを選んだ状況中に、顔認証104の実行を成功させることができる。
【0013】
他の状況では、権限のないアクタ112が、ユーザデバイス102の制御を有する場合がある。この場合、権限のないアクタ112は、様々な技術を使用して、権限のないアクタ112に対してユーザ106のアカウントまたは情報へのアクセスを許可するように、ユーザデバイス102をだます(例えば欺く)ことを試行する。環境100-3、100-4、および100-5は、3つの異なるプレゼンテーション攻撃114-1、114-2、および114-3の例をそれぞれ提供する。
【0014】
環境100-3において、権限のないアクタ112は、顔認証104中に、ユーザ106の写真118を有する媒体116を提示する。媒体116は、木をベースとした媒体(例えば、紙、ボール紙、またはポスターボード)、プラスチックをベースとした媒体(例えば、アクリルシート)、布をベースとした媒体(例えば、綿布またはポリエステル布)、1枚のガラスなどであり得る。場合によっては、媒体116は、写真が媒体116に接着、印刷、または彫られている比較的平坦な表面を有する。他の場合では、媒体116は、曲面を有する物体に彫られている、または接着されている場合がある。顔認証104中に、権限のないアクタ112は、媒体116をユーザデバイス102のカメラに向かって配向して、ユーザデバイス102に、媒体116上に提示された写真118の画像108をキャプチャさせる。
【0015】
環境100-4において、権限のないアクタ112は、顔認証104中にディスプレイ122を有するデバイス120を提示する。デバイス120は、スマートフォン、タブレット、装着可能デバイス、テレビ、曲面モニタ、または仮想もしくは拡張現実ヘッドセットであり得る。ディスプレイ122は、発光ダイオード(LED)ディスプレイまたは液晶ディスプレイ(LCD)であってもよい。ディスプレイ122上で、デバイス120は、ユーザ106のデジタル画像124を提示する。顔認証104中に、権限のないアクタ112は、デバイス120のディスプレイ122をユーザデバイス102のカメラに向かって配向して、ユーザデバイス102に、ディスプレイ122上に提示されたデジタル画像124の画像108をキャプチャさせる。
【0016】
環境100-5において、権限のないアクタ112は、何らかのやり方でユーザ106の顔の1つまたは複数の特徴を複製したマスク126を装着している。例えば、マスク126の色は、ユーザ106の肌の色とほぼ類似している場合があり、マスク126は、ユーザの頬または頬骨構造を表す構造的特徴を含む場合がある。マスク126は、剛性のプラスチックマスクまたはラテックスのマスクである場合がある。顔認証104中に、権限のないアクタ112は、マスク126を装着し、ユーザデバイス102のカメラの方に向いて、ユーザデバイス102に、マスク126の画像108をキャプチャさせる。
【0017】
環境100-3~100-5に示されたプレゼンテーション攻撃114-1~114-3は、一部の認証システムをだますことができ、したがって、権限のないアクタ112にアクセスを許可する場合がある。しかしながら、超音波を使用した顔認証なりすまし防止の技術を使用すると、ユーザデバイス102は、プレゼンテーション攻撃114-1~114-3を検出し、権限のないアクタ112にアクセスを与えない。
【0018】
説明した技術を用いると、ユーザデバイス102は、人間の顔(例えば、ユーザ106の顔)と、プレゼンテーション攻撃114によって提示された顔の表現(例えば、写真118、デジタル画像124、またはマスク126)とを区別できる。特に、ユーザデバイス102は、超音波を使用して、人間の顔と顔の表現との間の超音波反射における差を検出する。例えば人間の顔は、プラスチックなどの他のタイプの材料ほど反射しない人体組織からなる。また、人間の顔は、曲線および角度を有し、反射してユーザデバイス102に直接戻る超音波エネルギーの量を減少させ得る。一方、媒体116、ディスプレイ122、または剛性タイプのマスク126など、比較的平坦な表面または均一な曲面を有するプレゼンテーション攻撃手段は、反射してユーザデバイス102に戻る超音波エネルギーの量を増加させ得る。反射した超音波エネルギーの特性を分析することによって、ユーザデバイス102は、顔認証104のために提示されているのが、人間の顔なのか、プレゼンテーション攻撃114において使用されている手段かを判定できる。ユーザデバイス102は、図2-1に関してさらに説明される。
例示的な顔認証システム
図2-1は、ユーザデバイス102の一部として顔認証システム202を示す。ユーザデバイス102は、デスクトップコンピュータ102-1、タブレット102-2、ラップトップ102-3、テレビ102-4、コンピューティング時計102-5、コンピューティング眼鏡102-6、ゲーミングシステム102-7、マイクロ波102-8、および車両102-9を含む様々な非限定的な例示のデバイスとともに示されている。ホームサービスデバイス、スマートスピーカー、スマートサーモスタット、セキュリティカメラ、ベビーモニタ、Wi-Fi(登録商標)ルータ、ドローン、トラックパッド、ドローイングパッド、ネットブック、電子ブックリーダー、ホームオートメーションおよび制御システム、壁面ディスプレイ、バーチャルリアリティーヘッドセット、および別の家電製品を含む、他のデバイスもまた使用され得る。なお、ユーザデバイス102は、ウェアラブル、非ウェアラブルであるが携帯可能、または相対的に固定(例えば、デスクトップおよび機器)であり得る。
【0019】
ユーザデバイス102は、1つまたは複数のコンピュータプロセッサ204と、メモリ媒体および記憶媒体を含む1つまたは複数のコンピュータ可読媒体206とを含む。コンピュータ可読媒体206上でコンピュータ可読命令として具体化されるアプリケーションおよび/またはオペレーティングシステム(図示せず)は、本明細書に記載の機能のいくつかを提供するために、コンピュータプロセッサ204によって実行され得る。コンピュータ可読媒体206はまた、顔認証システム202がユーザ106を認証したことに応答してアクティブ化するアプリケーション208もしくは設定を含む。例示的なアプリケーション208は、パスワード記憶アプリケーション、バンキングアプリケーション、ウォレットアプリケーション、健康アプリケーション、またはユーザにプライバシーを提供する任意のアプリケーションを含み得る。
【0020】
ユーザデバイス102はまた、有線、無線、もしくは光ネットワークを介してデータを伝送するためのネットワークインターフェース210を含み得る。例えば、ネットワークインターフェース210は、ローカルエリアネットワーク(LAN)、無線ローカルエリアネットワーク(WLAN)、パーソナルエリアネットワーク(PAN)、ワイヤエリアネットワーク(WAN)、イントラネット、インターネット、ピアツーピアネットワーク、二地点間ネットワーク、メッシュネットワークなどを介してデータを通信し得る。ユーザデバイス102はまた、ディスプレイ(図示せず)を含み得る。
【0021】
顔認証システム202は、ユーザ106が、ユーザ106の顔の画像またはユーザ106の顔を含む画像を使用して、ユーザデバイス102のアプリケーション208、設定、または他のリソースにアクセス可能にする。顔認証システム202は、少なくとも1つのカメラシステム212と、少なくとも1つの顔認識器214と、少なくとも1つの超音波センサ216とを含む。顔認証システム202は、任意選択的に、別のセンサ218を含み得る。図2-1で顔認証システム202の一部として示されているが、超音波センサ216および/またはセンサ218は、顔認証なりすまし防止のための顔認証システム202と通信できる(例えば、情報を提供できる)分離した実体と考えられ得る。時には、超音波センサ216および/またはセンサ218は、顔認証なりすまし防止をサポートするのに加えて、ユーザデバイス102の他の特徴をサポートするように動作する。顔認証システム202の様々な実施態様は、システムオンチップ(SoC)、1つまたは複数の集積回路(IC)、プロセッサ命令が組み込まれたプロセッサもしくはメモリに記憶されたプロセッサ命令にアクセスするように構成されたプロセッサ、ファームウェアが組み込まれたハードウェア、様々なハードウェア構成要素を有するプリント回路基板、またはそれらの任意の組合せを含み得る。
【0022】
顔認証システム202は、多種多様な異なる環境条件の下で動作するように設計され得る。例えば、顔認証システム202は、およそ70センチメートル(cm)未満の距離における顔認証をサポートできる。この距離は、ユーザデバイス102とユーザ106との間の距離を表す。別の例として、顔認証システム202は、およそ-40度~40度の角度視野を提供するユーザデバイス102の多種多様なチルト角度およびパン角度における顔認証をサポートできる。これらの角度は、およそ-40度~20度のチルト角度およびおよそ-20度~20度のパン角度を含み得る。この角度視野の範囲を用いて、顔認証システム202は、ユーザ106がユーザデバイス102を保持する状況および/またはユーザデバイス102が表面上にあり、かつユーザ106がユーザデバイス102に接近する状況中に動作可能である。
【0023】
加えて、顔認証システム202は、100ミリ秒~200ミリ秒(ms)などの所定の時間量内に顔認証104に関する決定を行うように設計され得る。この時間フレームは、画像108をキャプチャし、超音波を使用してプレゼンテーション攻撃114が発生しているか否かを判定し、画像108上で顔認識を実行するのに必要な合計時間量を含み得る。
【0024】
カメラシステム212は、顔認証104のために1つまたは複数の画像108をキャプチャする。カメラシステム212は、赤緑青(RGB)カメラなどの少なくとも1つのカメラを含む。カメラシステム212はまた、特に暗い環境において照明を提供するための1つまたは複数の発光体を含み得る。発光体は、LEDなど、RGB光を含み得る。いくつかの実施態様では、カメラシステム212は、自撮りする、アプリケーション208のために画像をキャプチャする、文書をスキャンする、バーコードを読み取る、などの他の用途のために使用され得る。
【0025】
顔認識器214は、画像108に提示されている人間の顔がユーザデバイス102の権限のあるユーザ106に対応することを検証するために、顔認識を実行する。顔認識器214は、ソフトウェア、プログラマブルハードウェア、またはそれらの何らかの組合せにおいて実施可能である。いくつかの実施態様では、顔認識器214は、機械学習済みモジュール(例えば、ニューラルネットワーク)を使用して実施される。
【0026】
超音波センサ216は、超音波を使用して、人間の顔とプレゼンテーション攻撃114とを区別する。超音波センサ216は、図2-2に関してさらに説明される。センサ218は、追加情報を超音波センサ216に提供し、これは、プレゼンテーション攻撃114を検出する超音波センサ216の能力を向上させる。センサ218は、図2-3に関してさらに説明される。
【0027】
図2-2は、超音波センサ216の例示的な構成要素を示す。図示されている構成において、超音波センサ216は、超音波センサデータをリモートデバイスに伝送するための通信インターフェース220を含むが、超音波センサ216がユーザデバイス102内に一体化されている場合、使用される必要はない。概して、通信インターフェース220によって提供される超音波センサデータは、顔認証システム202によって使用可能な形式を有する。
【0028】
超音波センサ216はまた、電気信号を音波に変換できる少なくとも1つのトランスデューサ222を含む。トランスデューサ222はまた、音波を検出して、電気信号に変換できる。これらの電気信号および音波は、超音波レンジにおける周波数を含み得る。
【0029】
トランスデューサ222が超音波信号を生成するために使用する周波数スペクトル(例えば、周波数の範囲)は、およそ20キロヘルツ(kHz)~2MHzの周波数を含む超音波範囲における周波数を含み得る。場合によっては、周波数スペクトルは、類似のまたは異なる帯域幅を有する複数のサブスペクトルに分割され得る。例えば、異なる周波数サブスペクトルは、30~500kHz、30~70kHz、80~500kHz、1~2MHz、20~48kHz、20~24kHz、24~48kHz、26~29kHz、31~34kHz、33~36kHz、または31~38kHzを含み得る。
【0030】
これらの周波数サブスペクトルは、連続していても、分離していてもよく、送信された信号は、位相および/または周波数において変調され得る。コヒーレンスを達成するために、同じ帯域幅を有する複数の周波数サブスペクトル(連続、不連続にかかわらず)は、複数の超音波信号を生成するためにトランスデューサ222によって使用されてもよく、生成されている超音波信号は、時間的に同時にまたは分離して送信される。状況によっては、複数の連続した周波数サブスペクトルが、単一の超音波信号を伝送するために使用されてもよく、それにより、超音波信号は、広帯域幅を有することが可能になる。
【0031】
顔認証なりすまし防止のために、超音波センサ216は、顔認証なりすまし防止のために有益である特定のレンジ分解能を実現する周波数を使用できる。一例として、超音波センサ216は、およそ7cm以下(例えば、およそ5cmまたはおよそ3cm)のレンジ分解能を達成できる帯域幅を使用できる。例示的な帯域幅は、少なくとも7kHzであり得る。この周波数はまた、およそ70cmなど、顔認証のための特定の検出レンジをサポートするように選択され得る。例示的な周波数は、およそ31~38kHzの周波数を含む。
【0032】
時には、超音波センサ216は、顔認証なりすまし防止に加えて、ユーザデバイス102内の他の特徴をサポートする。これらの他の特徴は、存在検出または把持検出を含み得る。この場合、超音波センサ216は、アクティブ特徴のために最適化された異なる動作構成間を動的に切り換えることができる。例えば、超音波センサ216は、存在検出のためにおよそ26~29kHzの周波数、および顔認証なりすまし防止のためにおよそ31~38kHzの周波数を使用できる。
【0033】
例示的な実施態様では、超音波センサ216のトランスデューサ222は、モノスタティックトポロジを有する。このトポロジを用いて、トランスデューサ222は、電気信号を音波に変換し、音波を電気信号に変換できる(例えば、超音波信号を送信または受信できる)。例示的なモノスタティックトランスデューサは、圧電トランスデューサ、容量トランスデューサ、および微小電子機械システム(MEMS)技術を使用した微細加工超音波トランスデューサ(MUT)を含み得る。
【0034】
代替的に、トランスデューサ222は、ユーザデバイス102上の異なる位置に位置する複数のトランスデューサを含むバイスタティックトポロジを用いて実施され得る。この場合、第1のトランスデューサは、電気信号を音波に変換し(例えば、超音波信号を送信し)、第2のトランスデューサは、音波を電気信号に変換する(例えば、超音波信号を受信する)。例示的なバイスタティックトポロジは、ユーザデバイス102の少なくとも1つのスピーカーおよび少なくとも1つのマイクを使用して実施され得る。スピーカーおよびマイクは、超音波センサ216の動作専用であってもよい。あるいは、スピーカーおよびマイクは、ユーザデバイス102および超音波センサ216の両方によって共有され得る。スピーカーおよびマイクの例示的な位置は、図5に関してさらに説明される。
【0035】
超音波センサ216は、アナログ領域において電気信号を調整するための回路および論理を含む少なくとも1つのアナログ回路224を含む。アナログ回路224は、電気信号を生成および修正するための波形生成器、アナログデジタル変換器、増幅器、フィルタ、ミキサ、位相シフタ、およびスイッチを含み得る。いくつかの実施態様では、アナログ回路224は、スピーカーまたはマイクと関連付けられた他のハードウェア回路を含む。
【0036】
超音波センサ216はまた、1つまたは複数のシステムプロセッサ226と、少なくとも1つのシステム媒体228(例えば、1つまたは複数のコンピュータ可読記憶媒体)とを含む。システムプロセッサ226は、デジタル領域において電気信号を処理する。システム媒体228は、なりすまし検出器230を含む。なりすまし検出器230は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの組合せを使用して実施され得る。この例では、システムプロセッサ226が、なりすまし検出器230を実施する。なりすまし検出器230は、トランスデューサ222からの応答(例えば、電気信号)を処理して、プレゼンテーション攻撃114を検出する。なりすまし検出器230は、発見法モジュールまたは機械学習済みモジュール(例えば、ニューラルネットワーク)を使用して、少なくとも部分的に実施され得る。
【0037】
いくつかの実施態様では、超音波センサ216は、センサ218によって提供される情報を使用する。例えば、センサ218は、超音波センサ216に、物体の場所(例えば、ユーザ106の顔またはプレゼンテーション攻撃手段)に関する情報を提供する。この情報は、レンジおよび/または角度計測値を含み得る。このように、超音波センサ216は、プレゼンテーション攻撃114が存在しているか否かを判定する前に、センサ218によって提供された場所情報を使用して、超音波データをカスタマイズ(例えば、フィルタリングまたは正規化)する。いくつかの場合では、超音波センサ216が超音波技術を使用して物体の場所を独立して測定する前に、上記のカスタマイズが実行される。任意選択的に、超音波センサ216は、センサ218によって提供される場所情報を利用して、超音波技術を使用した物体の場所の測定の正確性を高め得る。
【0038】
別の例として、超音波センサ216は、センサ218によって提供される動きデータを利用できる。特に、超音波センサ216は、動きデータによって識別された動きを補償するように超音波データを修正できる。例示的なセンサ218は、図2-3に関してさらに説明される。
【0039】
図2-3は、顔認証なりすまし防止のための例示的なセンサ218を示す。図示された構成では、センサ218は、位相差センサ232、RGBセンサ234、慣性計測ユニット(IMU)236(IMU236)、および/または無線周波数ベースのセンサ238(RFベースのセンサ238)を含み得る。いくつかの実施態様では、位相差センサ232は、カメラシステム212の前方カメラ240の一部である。前方カメラ240はまた、顔認証用の画像108をキャプチャするために使用可能である。位相差センサ232は、検出された位相差に基づいて物体の距離を測定できる。測定した距離を用いて、超音波センサ216は、物体と関連した関心領域を判定し、距離正規化を実行して、異なる顔認証状況において変化し得る物体と超音波センサ216との間の距離を補償できる。特に、超音波センサ216は、測定した距離に基づいて、物体と関連する強度または振幅情報を較正する。これは、超音波センサ216が、多種多様な異なる距離における顔認証なりすまし防止をサポートできるようにする。
【0040】
RGBセンサ234はまた、前方カメラ240の一部であり得る。RGBセンサ234は、物体に対する角度を測定し、この角度を超音波センサ216に提供できる。超音波センサ216は、測定した角度に基づいて、エネルギーまたは強度情報を正規化できる。これは、超音波センサ216が、プレゼンテーション攻撃114で使用される物体または人間の顔の差の後方散乱をより良好に検出し、多種多様な異なる角度における顔認証なりすまし防止をサポートすることを可能にする。
【0041】
慣性計測ユニット236は、ユーザデバイス102の動きを測定できる。この動き情報を使用して、超音波センサ216は、動き補償を実行できる。追加的または代替的に、超音波センサ216は、慣性計測ユニット236が、ユーザデバイス102がほぼ静止していることを示すことに応答してアクティブ化され得る。このように、慣性計測ユニット236は、超音波センサ216によって観察された動きアーチファクトの量を減少させることができる。
【0042】
例示的なRFベースのセンサ238は、超広帯域センサ、レーダーセンサ、またはWiFi(登録商標)センサを含み得る。無線周波数を使用して、RFベースのセンサ238は、顔認証104のために提示された物体までの距離および/または角度を測定できる。これらの測定値を用いて、超音波センサ216は、プレゼンテーション攻撃を検出するための関心領域を判定し、強度または振幅情報を較正できる。カメラシステム212、顔認識器214、超音波センサ216、およびセンサ218の間の相互作用は、図3に関してさらに説明される。
【0043】
図3は、超音波を使用して顔認証なりすまし防止を実行する例示的な顔認証システム202を示す。図示した構成において、顔認証システム202は、カメラシステム212、顔認識器214、および超音波センサ216を含む。顔認証システム202はまた、任意選択的に、センサ218を含み得る。顔認識器214は、カメラシステム212および超音波センサ216に結合されている。センサ218は、超音波センサ216に結合されている。
【0044】
動作中に、顔認証システム202は、顔認証104を実行する要求302を受容する。いくつかの状況では、この要求302は、顔認証104を要求するアプリケーション208または別のサービスによって提供される。他の状況では、要求302は、センサ218がユーザ106との相互作用を検出したことに応答して、センサ218によって提供される。例えば、慣性計測ユニット236は、ユーザ106がユーザデバイス102を持ち上げたことに応答して、要求302を顔認証システム202に送信できる。
【0045】
要求302の受信に応答して、顔認証システム202は、カメラシステム212を起動およびアクティブ化する。カメラシステム212は、顔認証104のために少なくとも1つの画像108をキャプチャする。カメラシステム212は、キャプチャした画像108を顔認識器214に提供する。
【0046】
超音波センサ216は、プレゼンテーション攻撃114を検出するために、超音波感知を実行する。これは、カメラシステム212が画像108をキャプチャする前、カメラシステム212が画像108をキャプチャしている間、またはカメラシステム212が画像108をキャプチャした後に発生してもよい。反射された超音波エネルギーを分析することによって、超音波センサ216は、反射された超音波エネルギーが、プレゼンテーション攻撃114と関連する物体から来たのか、人間の顔から来たのかを判定できる。超音波センサ216は、プレゼンテーション攻撃114が検出されたか否かを示すなりすましインジケータ304を生成する。超音波センサ216は、なりすましインジケータ304を顔認識器214に提供する。
【0047】
顔認識器214は、画像108およびなりすましインジケータ304を受容する。なりすましインジケータ304が、プレゼンテーション攻撃114が検出されていないことを示す場合、顔認識器214は、ユーザ106の顔が画像108内に存在するかどうかを判定するために顔認識を実行する。顔認識器214は、要求302を送信したアプリケーション208またはサービスに提供される報告306を生成する。顔認識器214が、ユーザ106の顔を認識し、かつなりすましインジケータ304がプレゼンテーション攻撃114の不在を示す場合、顔認識器214は、報告306を使用して、顔認証成功を示す。あるいは、顔認識器214が、ユーザ106の顔を認識せず、および/または、なりすましインジケータ304がプレゼンテーション攻撃114の存在を示す場合、顔認識器214は、報告306を使用して、顔認証失敗を示す。この失敗の表示は、アプリケーション208および/またはユーザデバイス102に、アクセスを拒絶させ得る。
【0048】
いくつかの実施態様では、センサ218は、センサデータ308を超音波センサ216に提供する。超音波センサ216は、センサデータ308を使用して、反射された超音波エネルギーに基づいて測定された超音波ベースのデータの処理をカスタマイズする。センサ218によって提供された追加情報を考慮することによって、超音波センサ216は、プレゼンテーション攻撃114を検出するその能力を高め得る。
【0049】
いくつかの態様では、超音波センサ216は、顔認証システム202または顔認証システム202の別の構成要素によって実行されたなりすまし防止技術をサポートするために、この実体に情報をさらに提供する。例えば、超音波センサ216は、物体の測定距離を顔認証システム202に提供できる。この情報を用いて、顔認証システム202は、カメラシステム212によって提供された画像108を分析し、画像108で提示されるような物体のサイズが、超音波センサ216によって提供された測定距離における人間の顔の概略サイズに適合するかどうかを判定できる。特に、顔認証システム202は、測定距離における人間の顔のサイズと関連する上方境界および下方境界を判定できる。画像108における物体のサイズがその境界内である場合、顔認証システム202は、プレゼンテーション攻撃114を検出しない。しかしながら、画像108における物体のサイズがその境界外である場合、顔認証システム202は、プレゼンテーション攻撃114を検出する。このように、超音波センサ216はまた、他の実体によって実行されたなりすまし防止技術をサポートする超音波ベースの情報を提供できる。
顔認証なりすまし防止
図4-1は、何らかのプレゼンテーション攻撃手段と人間の顔との超音波反射の差を示す。402で、環境100-3~100-5に示すように、プレゼンテーション攻撃手段404(例えば、プレゼンテーション攻撃114と関連する物体)は、顔認証104中にユーザデバイス102に対して提示される。406で、環境100-1~100-2に示すように、人間の顔408(例えば、ユーザ106の顔)は、顔認証104中にユーザデバイス102に対して提示される。
【0050】
プレゼンテーション攻撃手段404は、人間の顔408とは異なる物理的構造を有する場合がある。いくつかのプレゼンテーション攻撃手段404は、例えば、媒体116またはデバイス120など、ほぼ平坦または平面状の表面を有する場合がある。マスク126などの他のプレゼンテーション攻撃手段404または曲面を有する他のプレゼンテーション攻撃手段404は、プレゼンテーション攻撃手段404がほぼ平坦な表面からなるほぼ区分別の平面状の表面を有する場合がある。一方、人間の顔408は、プレゼンテーション攻撃手段404と比較して、有意によりはっきりした輪郭および角度を有する場合がある。これらの輪郭は、人間の顔408の額、鼻、眼窩、唇、頬、顎、および耳を形成する。これらの構造上の差に基づいて、プレゼンテーション攻撃手段404の超音波挙動は、点目標と類似する場合がある一方、人間の顔408の超音波挙動は、分布目標と類似する場合がある。
【0051】
また、プレゼンテーション攻撃手段404および人間の顔408は、異なる材質からなる場合がある。これらの異なる材質は、結果として、プレゼンテーション攻撃手段404および人間の顔408が超音波と関連して異なる吸収特性および反射特性を有することをもたらす。例えば、人間の顔408は、人体組織からなる。いくつかのプレゼンテーション攻撃手段404は、人体組織よりも高い反射係数を有する、プラスチックなどの他の材質からなる。
【0052】
402および406の両方の場合、超音波センサ216は、少なくとも1つの超音波送信信号410を送信する。超音波送信信号410は、空間を通って伝搬し、プレゼンテーション攻撃手段404および人間の顔408上に当たる。プレゼンテーション攻撃手段404および人間の顔408の物理的構造および材質の違いに起因して、超音波送信信号410は、プレゼンテーション攻撃手段404と人間の顔408とで異なる相互作用を行う。この相互作用は、プレゼンテーション攻撃手段404および人間の顔408とそれぞれ関連する反射414-1および414-2によって例示されている。
【0053】
プレゼンテーション攻撃手段404の平面状の表面に起因して、図4-1の左に向かって配向されている反射414-1によって示されるように、超音波送信信号410の有意量が反射されて、ユーザデバイス102に戻り得る。一方、人間の顔408の輪郭は、異なる方向において配向されている反射414-2で示されるように、超音波送信信号410を、多くの方向において拡散させる。したがって、プレゼンテーション攻撃手段404と比較して、より少ない超音波エネルギーが、人間の顔408からユーザデバイス102に向かって戻るように方向付けられ得る。また、プレゼンテーション攻撃手段404は、人体組織よりも高い反射係数を有する材質を含み、人間の顔408と比較して、より多くの超音波エネルギーがプレゼンテーション攻撃手段404によって反射され得る。換言すると、プレゼンテーション攻撃手段404と関連する反射414-1は、人間の顔408と関連する反射414-2よりも高い振幅を有し得る。この振幅の差は、反射414-2よりも長い長さを有する反射414-1によって例示されている。
【0054】
402および406の両方の場合、超音波センサ216は、少なくとも1つの超音波受信信号412を受信する。超音波受信信号412の振幅は、反射された超音波エネルギーの量および超音波センサ216に向かって戻るように方向付けられた超音波エネルギーの量に基づく。概して、プレゼンテーション攻撃手段404と人間の顔408との異なる物理的構造および材質によって、超音波受信信号412は、406よりも402において高い振幅を有するようにすることができる。超音波受信信号412の特性に基づいて、超音波センサ216は、顔認証104のために提示されているのが、プレゼンテーション攻撃手段404か、人間の顔408かを判定できる。プレゼンテーション攻撃手段404と人間の顔408との超音波挙動の違いは、図4-2に関してさらに説明される。
【0055】
図4-2は、プレゼンテーション攻撃手段404と人間の顔408との受信されたパワーの差を示す。グラフ416は、受信されたパワーと関連する第1の次元と、レンジ(例えば、距離または斜距離)と関連する第2の次元とを有する。グラフ416で、破線418は、プレゼンテーション攻撃手段404と関連する受信されたパワーを表す。実線420は、人間の顔408と関連する受信されたパワーを表す。この例では、プレゼンテーション攻撃手段404と人間の顔408とは、ユーザデバイス102からほぼ同じ距離に位置決めされている。
【0056】
グラフ416で見られるように、プレゼンテーション攻撃手段404は、人間の顔408よりも高いピークを有する受信されたパワーを生成する。これは、プレゼンテーション攻撃手段404を形成する材質のより高い反射係数に少なくとも部分的に起因し得る。また、プレゼンテーション攻撃手段404と関連する受信されたパワーは、より小さい範囲間隔にわたって集中している一方、人間の顔408と関連する受信されたパワーは、より大きい範囲間隔にわたって分散している。これは、プレゼンテーション攻撃手段404の点状の性質と人間の顔408の分散した性質とに少なくとも部分的に起因し得る。これらの固有の違いを利用することによって、超音波センサ216は、多種多様な技術を用いて、顔認証104のために提示された物体が、プレゼンテーション攻撃114に対応するのか、人間の顔408に対応するのかを識別できる。これらの技術は、図7図15に関してさらに説明される。
【0057】
図5は、ユーザデバイス102のスピーカー502ならびにマイク504-1および504-2の例示的な位置を示す。図5の例示的なユーザデバイス102は、1つのスピーカー502および2つのマイク504-1~504-2を含むように示されているが、超音波センサ216は、所与の時間に1つまたは複数のスピーカーおよび1つまたは複数のマイクとともに動作し得る。超音波センサ216が複数のスピーカーを使用できる状況では、超音波センサ216は、より高い信号対雑音比を提供できるスピーカーを選択できる。この信号対雑音比は、スピーカーの動作特性および/またはユーザ106に対するスピーカーの位置に依存し得る。
【0058】
この実施態様では、スピーカー502ならびにマイク504-1および504-2は、ユーザデバイス102の同じ表面上に位置決めされる。この場合、この表面もまた、ディスプレイ506を含む。マイク504-1は、マイク504-2とは異なるユーザデバイス102の側部上に位置決めされている。ユーザデバイス102を半分に分割する面508を考える。この場合、ユーザデバイス102の第1の半分510-1は、スピーカー502およびマイク504-1を含む。ユーザデバイス102の第2の半分510-2は、マイク504-2を含む。
【0059】
マイク504-1および504-2を離して(例えば、超音波送信信号410の波長よりも大きい距離で)配置することによって、マイク504-1および504-2は、反射414-1または414-2の異なる態様または特徴を観察し得る。例えば多重チャネル技術を使用して、超音波センサ216は、マイク504-1および504-2にて観察された応答における差を評価し得る。プレゼンテーション攻撃手段404の点状の性質に起因して、マイク504-1および504-2で観察された応答は、ほぼ同様であり得る。一方、人間の顔408についてマイク504-1および504-2で観察された応答は、人間の顔408の分散された性質に起因して、有意に異なり得る。したがって、超音波センサ216は、応答における差を評価して、プレゼンテーション攻撃114が発生しているか否かを判定できる。超音波センサ216の動作が、図6に関してさらに説明される。
【0060】
図6は、超音波センサ216の例示的な実施態様を示す。図示した構成において、超音波センサ216は、トランスデューサ222、アナログ回路224、およびシステムプロセッサ226を含む。アナログ回路224は、トランスデューサ222とシステムプロセッサ226との間に結合されている。アナログ回路224は、送信機602および受信機604を含む。送信機602は、システムプロセッサ226に結合されている波形生成器606を含む。図示していないが、送信機602は、1つまたは複数の送信チャネルを含み得る。受信機604は、複数の受信チャネル608-1~608-Mを含み、ここで、Mは正の整数を表す。受信チャネル608-1~608-Mは、システムプロセッサ226に結合されている。
【0061】
トランスデューサ222は、少なくとも1つのスピーカー502および少なくとも1つのマイク504を含むバイスタティックトポロジで実施されている。図示された構成では、トランスデューサ222は、複数のスピーカー502-1~502-Sおよび複数のマイク504-1~504-Mを含み、ここで、Sは正の整数を表す。スピーカー502-1~502-Sは、送信機602に結合されており、マイク504-1~504-Mは、受信機604のそれぞれの受信チャネル608-1~608-Mに結合されている。
【0062】
図6の超音波センサ216は、複数のスピーカー502および複数のマイク504を含むが、超音波センサ216の他の実施態様は、単一のスピーカー502および単一のマイク504、単一のスピーカー502および複数のマイク504、複数のスピーカー502および単一のマイク504、または送信および/もしくは受信が可能な他のタイプのトランスデューサを含み得る。いくつかの実施態様では、スピーカー502-1~502-Sおよびマイク504-1~504-Mはまた、可聴信号で動作可能である。例えば、ユーザデバイス102は、スピーカー502-1~502-Sを介して音楽を再生し、マイク504-1~504-Mを使用してユーザ106の音声を検出できる。
【0063】
送信中に、送信機602は、電気信号をスピーカー502-1~502-Sに渡し、スピーカー502-1~502-Sは、超音波送信信号410-1~410-Sをそれぞれ発信する。特に、波形生成器606は、類似の波形(例えば、類似の振幅、位相、および周波数)または異なる波形(例えば、異なる振幅、位相、および/または周波数)を有し得る電気信号を生成する。いくつかの実施態様では、システムプロセッサ226は、構成信号610を波形生成器606に渡す。この構成信号610は、波形生成の特性(例えば、中心周波数、帯域幅、および/または変調タイプ)を指定できる。構成信号610を使用して、システムプロセッサ226は、顔認証なりすまし防止または存在検出などのアクティブ特徴をサポートするように、超音波送信信号410-1~410-Sをカスタマイズできる。明示していないが、波形生成器606はまた、復調のために、電気信号をシステムプロセッサ226または受信機604に伝送できる。超音波送信信号410-1~410-Sは、物体(例えば、人間の顔408またはプレゼンテーション攻撃手段404)によって反射される場合もあり、反射されない場合もある。
【0064】
受信中に、マイク504-1~504-Mは、それぞれ、超音波受信信号412-1~412-Mを受信する。超音波受信信号412-1~412-Mと超音波送信信号410-1~410-Sとの間の相対位相差、周波数、および振幅は、超音波送信信号410-1~410-Sと近くの物体(例えば、人間の顔408もしくはプレゼンテーション攻撃手段404)との相互作用または外部環境(例えば、伝搬路損失および雑音源)に起因して変化し得る。超音波受信信号412-1~412-Mは、スピーカー502-1~502-Sのうちの1つからマイク504-1~504-Mのうちの1つへ伝搬する超音波送信信号410のバージョンを表す。受信チャネル608-1~608-Mは、超音波受信信号412-1~412-Mを処理し、ベースバンド受信信号612-1~612-Mを生成する。
【0065】
システムプロセッサ226は、なりすまし検出器230を含む。システムプロセッサ226および/またはなりすまし検出器230は、レンジ圧縮、ベースバンド処理、復調、および/またはフィルタリングなどの関数を実行できる。概して、なりすまし検出器230は、受信チャネル608-1および608-Mからベースバンド受信信号612-1~612-Mを受容し、これらの信号を分析して、図7に関してさらに説明するように、なりすましインジケータ304を生成する。
【0066】
図7は、顔認証なりすまし防止のための超音波センサ216によって実施される例示的なスキームを示す図である。図示された構成では、なりすまし検出器230は、プレプロセッサ702と、特徴抽出器704と、なりすまし予測器706とを含む。プレプロセッサ702は、特徴抽出器704によって使用可能な形式でデータを提供するようにベースバンド受信信号612-1~612-Mに対して動作する。プレプロセッサ702は、フィルタリング、フーリエ変換(例えば、高速フーリエ変換)、レンジ圧縮、正規化、および/またはクラッタキャンセルを実行できる。いくつかの実施態様では、フィルタリングおよび/または正規化は、以下でさらに説明するように、センサデータ308に基づく。
【0067】
特徴抽出器704は、プレゼンテーション攻撃手段404と人間の顔408とを区別するための有用な情報を抽出するために、多種多様な関数を実行し得る。いくつかの場合では、特徴抽出器704はまた、物体の場所情報(例えば、レンジおよび/または角度)を利用して、適切な情報を抽出する。この場所情報は、超音波技術を使用して超音波センサ216によって判定されてもよく、センサデータ308を介してセンサ218によって提供されてもよく、またはそれらの何らかの組合せが行われてもよい。特徴抽出器704の動作は、超音波センサ216が動作する入力データのタイプと、入力データが、単一の受信チャネル608または複数の受信チャネル608-1~608-Mと関連しているかどうかに応じて変化し得る。特徴抽出器704の例は、図8-1、図9-1、図11-1、図12-1に関してさらに説明される。
【0068】
なりすまし予測器706は、特徴抽出器704によって提供された情報に基づいてプレゼンテーション攻撃114が発生したか否かを判定する。なりすまし予測器706は、比較器708、ルックアップテーブル710(LUT710)、および/または機械学習済みモジュール712を含み得る。
【0069】
動作中に、プレプロセッサ702は、ベースバンド受信信号612-1~612-Mを受容し、複素数データ714を生成する。複素数データ714は、振幅および位相情報(例えば、実数および虚数)を含む。複素数データ714の例示的なタイプは、レンジプロファイルデータ716(例えば、強度マップを表すデータ)、インターフェログラム718、レンジスロータイムデータ720(例えば、レンジ-ドップラーマップを表すデータ)、および/またはパワースペクトル722を含む。
【0070】
レンジプロファイルデータ716は、レンジ次元および時間次元(例えば、高速時間次元)にわたる振幅(例えば、強度)および位相情報を含む。レンジ次元は、レンジビン(例えば、レンジセル)のセットによって表され得る。時間次元は、時間間隔(例えば、チャープ間隔またはパルス間隔)のセットによって表され得る。インターフェログラム718は、レンジ次元および時間次元にわたるコヒーレンスおよび位相情報を含み得る。レンジスロータイムデータ720は、レンジ次元およびドップラー(またはスロータイム)次元にわたる振幅および位相情報を含む。ドップラー次元は、ドップラービンのセットによって表され得る。パワースペクトル722は、周波数次元および時間次元にわたるパワー情報を含む。
【0071】
いくつかの態様では、プレプロセッサ702は、センサ218によって提供されるセンサデータ308を使用して、関心領域に従って、複素数データ714を較正および/または複素数データ714をフィルタリングできる。一例として、プレプロセッサ702は、センサデータ308によって提供されるような物体の測定された場所に基づいて、レンジプロファイルデータ716、インターフェログラム718、レンジスロータイムデータ720、および/またはパワースペクトル722について、振幅ベースの情報を較正できる。特に、プレプロセッサ702は、顔認証104のために提示された物体に対する測定された距離および/または角度に基づいて振幅情報を正規化できる。
【0072】
追加的または代替的に、プレプロセッサ702は、センサデータ308によって提供された距離および/または角度測定値によって識別された関心領域と関連する複素数データ714のサブセットを提供できる。関心領域は、物体の測定された場所を含み得る。いくつかの場合では、関心領域は、物体の測定された場所の周囲を中心としており、または測定された場所の少なくとも一部分を囲む。関心領域のサイズは、人間の顔408の概略サイズに基づき得る。追加的または代替的に、関心領域は、顔認証と関連した領域に基づき得る(例えば、関心領域は、70cmまでの距離を含み得る)。
【0073】
特徴抽出器704は、1つまたは複数の特徴724を複素数データ714から抽出する。例示的な特徴724は、単一チャネル特徴726および/または多重チャネル特徴728を含み得る。特徴抽出器704は、ベースバンド受信信号612-1~612-Mのうちの1つに基づいて単一チャネル特徴726を判定する。このように、単一チャネル特徴726は、受信チャネル608-1~608-Mのうちの1つと関連している。追加的または代替的に、特徴抽出器704は、ベースバンド受信信号612-1~612-Mのうちの少なくとも2つを使用して多重チャネル特徴728を判定する。多重チャネル特徴728は、受信チャネル608-1~608-Mのうちの2つ以上と関連している。
【0074】
いくつかの場合では、特徴抽出器704は、物体の測定された場所に基づいて、物体と関連している特徴724を判定し得る。例えば、特徴抽出器704は、超音波技術を使用して複素数データ714を分析することによって、またはセンサ218によって提供されたセンサデータ308に基づいて判定され得る物体の測定された場所を包含する領域を識別できる。この領域内で、特徴抽出器704は、複素数データ714を評価して、特徴724を生成する。このように、超音波センサ216は、特徴724が、顔認証のために提示された物体に関係し、環境内に存在する別の物体に関係しないことを確実にできる。
【0075】
なりすまし予測器706は、特徴抽出器704によって抽出された特徴724を分析して、プレゼンテーション攻撃114を検出し、なりすましインジケータ304を生成する。いくつかの例では、なりすまし予測器706は、比較器708を使用して、特徴724を閾値と比較する。この閾値は、超音波センサ216が、プレゼンテーション攻撃手段404と、付属品110を装着している場合または装着していない場合がある人間の顔408とを区別できるように設定される。他の実施態様では、なりすまし予測器706は、ルックアップテーブル710を参照して、特徴724がプレゼンテーション攻撃手段404に対応するか、人間の顔408に対応するかを判定する。さらに他の実施態様では、なりすまし予測器706は、機械学習済みモジュール712を使用して、特徴724を、プレゼンテーション攻撃手段404に関連している、または人間の顔408に関連しているとして分類する。
【0076】
なりすまし検出器230は、顔認証システム202がユーザ106の認証を成功できるかどうかを制御するなりすましインジケータ304を生成する。なりすましインジケータ304は、顔認証104のために提示された物体がプレゼンテーション攻撃手段404と相関しているか、人間の顔408と相関しているかを示す1つまたは複数の要素を含み得る。なりすまし検出器230の例示的な実施態様は、図8-1に関してさらに説明される。
単一チャネルベースの顔認証なりすまし防止
図8-1は、顔認証なりすまし防止のための単一チャネル特徴726を生成するために、超音波センサ216によって実施される例示的なスキームを示す。図示された構成では、特徴抽出器704は、レンジプロファイル特徴抽出器802を含む。任意選択的に、プレプロセッサ702は、正規化器804を含み得る。なりすまし予測器706は、比較器708、ルックアップテーブル710、および/または機械学習済みモジュール712を含む。
【0077】
動作中に、プレプロセッサ702は、レンジプロファイルデータ716を生成する。レンジプロファイルデータ716は、ベースバンド受信信号612-1~612-Mのうちの1つに対してフーリエ変換を実行することによって生成され得る。正規化器804を含む実施態様の場合、プレプロセッサ702は、顔認証104のために提示された物体の測定された場所(例えば、測定された距離および/または角度)を含み得るセンサデータ308に基づいて、レンジプロファイルデータ716内の振幅情報を正規化できる。追加的または代替的に、正規化器804は、直交カップリング係数または定誤アラームレート(CFAR)信号対雑音比(SNR)に基づいてレンジプロファイルデータ716内の振幅情報を調整できる。プレプロセッサ702は、正規化されたレンジプロファイルデータ806を特徴抽出器704に提供する。正規化器804を含まない実施態様の場合、プレプロセッサ702は、代替的に、レンジプロファイルデータ716を特徴抽出器704に提供できる。また、これらの技術は、レンジスロータイムデータ720を使用して同様に適用され得る。
【0078】
レンジプロファイル特徴抽出器802は、レンジプロファイルデータ716または正規化されたレンジプロファイルデータ806に基づいて、単一チャネル特徴726を生成する。例示的な単一チャネル特徴726は、ピーク振幅特徴808、エネルギー分布特徴810、および/または位相特徴812を含み得る。ピーク振幅特徴808は、レンジプロファイルデータ716または正規化されたレンジプロファイルデータ806内のピーク振幅を識別する。エネルギー分布特徴810は、レンジプロファイルデータ716または正規化されたレンジプロファイルデータ806内のレンジ次元上の分布エネルギーのピークエネルギーまたは形状を識別する。位相特徴812は、レンジプロファイルデータ716または正規化されたレンジプロファイルデータ806内の位相情報を識別する。
【0079】
いくつかの態様では、レンジプロファイル抽出器802は、物体の測定された場所に基づいて、物体と関連している単一チャネル特徴726を判定し得る。例えば、レンジプロファイル特徴抽出器802は、物体の測定された場所を包含する領域を識別できる。この領域内で、レンジプロファイル特徴抽出器802は、振幅および/または位相情報を評価して、ピーク振幅特徴808、エネルギー分布特徴810、および/または位相特徴812を生成する。このように、超音波センサ216は、単一チャネル特徴726が、顔認証のために提示された物体に関係し、環境内に存在する別の物体に関係しないことを確実にできる。
【0080】
なりすまし予測器706は、顔認証104中にプレゼンテーション攻撃114が発生したか否かを検出し、この情報を顔認証システム202に伝達するためになりすましインジケータ304を生成する。レンジプロファイル特徴抽出器802がピーク振幅特徴808をなりすまし予測器706に提供する例を考える。この場合、なりすまし予測器706は、比較器708を使用して、ピーク振幅特徴808によって識別されたピーク振幅を閾値816と比較できる。ピーク振幅が閾値816よりも大きい場合、なりすまし予測器706は、プレゼンテーション攻撃114を検出する。あるいは、ピーク振幅が閾値816よりも小さい場合、なりすまし予測器706は、プレゼンテーション攻撃114を検出しない(例えば、人間の顔408を検出する)。この例は、図8-2に関してさらに説明される。
【0081】
図8-2は、顔認証なりすまし防止と関連する例示的なレンジプロファイルデータ716を示す。グラフ818、820、822、および824は、顔認証104中に提示される異なるタイプの物体についてのレンジプロファイルデータ716を示す。特に、グラフ818、820、822、および824は、レンジ次元にわたる超音波受信信号412-1~412-Mのうちの1つについての振幅情報を図示する。
【0082】
グラフ818は、物体が人間の顔408であるときに収集されたレンジプロファイルデータ716を表す。グラフ820および822は、物体が、それぞれ、1枚の紙および1枚のボール紙であるときに収集されたレンジプロファイルデータ716を表す。この1枚の紙と1枚のボール紙は、環境100-3に示すように、ユーザ106の写真118を含み得る。グラフ824は、物体が環境100-4のデバイス120であるときに収集されたレンジプロファイルデータ716を表す。この場合、デバイス120は、ユーザ106のデジタル画像124を表示できる。
【0083】
物体が人間の顔408であるとき、レンジプロファイルデータ716の振幅は、グラフ818に示すように、閾値816を下回る。しかしながら、物体がプレゼンテーション攻撃手段404であるとき、レンジプロファイルデータ716の振幅は、グラフ820、822、および824に示すように、少なくともいくつかの範囲間隔について、閾値816を上回る。このように、超音波センサ216は、人間の顔408とプレゼンテーション攻撃手段404とを区別できる。
【0084】
いくつかの実施態様では、超音波センサ216は、検出された物体に関連するレンジ826を識別できる。超音波センサ216は、超音波検知を通して、センサデータ308に基づいて、またはそれらの何らかの組合せでレンジ826を判定できる。識別されたレンジ826において、超音波センサ216は、プレゼンテーション攻撃114を検出するために、レンジプロファイルデータ716の振幅を閾値816と比較する。
【0085】
同様の検出方法が、他の単一チャネル特徴726に対して適用され得る。例えば、なりすまし予測器706は、比較器708を使用して、抽出されたエネルギー分布特徴810が、人間の顔408を表すか、プレゼンテーション攻撃手段404を表すかを判定できる。特に、レンジ826におけるエネルギー量が閾値816よりも小さい場合、超音波センサ216は、プレゼンテーション攻撃114を検出しない。しかしながら、エネルギー量が閾値816よりも大きい場合、超音波センサ216は、プレゼンテーション攻撃114を検出する。追加的または代替的に、なりすまし予測器706は、ルックアップテーブル710または機械学習済みモジュール712を使用して、そのレンジ次元にわたるエネルギー分布特徴810の形状全体が、人間の顔408に対応するか、プレゼンテーション攻撃手段404に対応するかを判定できる。同様の技術が、ルックアップテーブル710または機械学習済みモジュール712を用いて位相特徴812を分析するために使用可能である。
【0086】
単一チャネルに関して説明したが、図8-1で説明する動作は、利用可能な受信チャネル608-1~608-Mのうちの2つ以上、および任意選択的に、各々に対して、連続して、または並列に実行され得る。いくつかの実施態様では、特徴抽出器704は、ピーク振幅特徴808、エネルギー分布特徴810、および/または位相特徴812の何らかの組合せなど、複数の特徴をなりすまし予測器706に提供する。2つ以上の単一チャネル特徴726を分析することによって、なりすまし予測器706は、プレゼンテーション攻撃114を検出するその能力を改善し得る。別の顔認証なりすまし防止技術は、図9-1に関してさらに説明される。
干渉法ベースのコヒーレンスを使用した多重チャネルベースの顔認証なりすまし防止
図9-1は、顔認証なりすまし防止のための多重チャネル特徴728を生成するために、超音波センサ216によって実施される例示的なスキームを示す。この例では、超音波センサ216は、干渉法を使用して、マイク504-1および504-2などの2つ以上のトランスデューサ222によって観察される反射間の類似量を評価する。プレゼンテーション攻撃手段404の平面状または均一な構造に起因して、プレゼンテーション攻撃手段404によって生成され、マイク504-1~504-Mによって受信される超音波受信信号412-1~412-Mは、相対的に類似した特性を有する場合がある。換言すれば、超音波受信信号412-1~412-Mの振幅および位相は、所与の時間間隔にわたって相対的に類似し得る。しかしながら、人間の顔408の輪郭形成している不均一な構造は、人間の顔408によって生成され、マイク504-1~504-Mによって受信された超音波受信信号412-1~412-Mを、実質的に異ならせ得る。換言すれば、超音波受信信号412-1~412-Mの振幅および位相は、同様の時間間隔にわたって有意に変化し得る。干渉法を使用することによって、超音波センサ216は、顔認証なりすまし防止のために、プレゼンテーション攻撃手段404と人間の顔408とを区別できる。
【0087】
図示された構成において、プレプロセッサ702は、位置合わせモジュール902、フィルタ904、およびインターフェログラム生成器906を含む。図示していないが、プレプロセッサ702はまた、図8-1の正規化器804を含み得る。特徴抽出器704は、インターフェログラム特徴抽出器908を含む。なりすまし予測器706は、比較器708を含む。図示していないが、なりすまし予測器706の他の実施態様は、ルックアップテーブル710または機械学習済みモジュール712を使用可能である。
【0088】
マイク504-1~504-Mの異なる位置に起因して、顔認証104のために提示された物体は、対応する受信チャネル608-1~608-Mと関連するレンジプロファイルデータ716内で異なるレンジにおいて位置決めされ得る。これに対処するために、位置合わせモジュール902は、レンジ次元にわたって、異なる受信チャネル608-1~608-Mと関連するレンジプロファイルデータ716を整列させる。多種多様な異なるタイプの位置合わせモジュール902が、図10-1~図10-4に関してさらに説明される。
【0089】
フィルタ904は、センサデータ308、レンジプロファイルデータ716、またはそれらの何らかの組合せに基づいて識別され得る関心領域に基づいて、位置合わせモジュール902によって提供されるデータをフィルタリングする。この関心領域は、顔認証に関連する空間領域または物体の測定された場所を囲む領域を含み得る。データをフィルタリングすることによって、フィルタ904は、後の処理の計算速度を改善でき、および/または関心物体と関連しないデータを除去できる。
【0090】
インターフェログラム生成器906は、インターフェログラム718を生成する。特に、インターフェログラム生成器906は、受信チャネル608-1~608-Mのうちの2つと関連するレンジプロファイルデータ716(またはレンジスロータイムデータ720)に対して複素コヒーレンスを実行して、インターフェログラム718を生成する。
【0091】
動作中に、位置合わせモジュール902は、異なる受信チャネル608-1~608-Mと関連するレンジプロファイルデータ716に基づいて、位置合わせされたレンジプロファイルデータ910を生成することによって、マイク504-1~504-Mの場所の差を補償する。位置合わせされたレンジプロファイルデータ910内で、物体と関連するレンジは、異なる受信チャネル608-1~608-Mにわたって類似している。フィルタ904は、位置合わせされたレンジプロファイルデータ910をフィルタリングして、フィルタリング済みの位置合わせされたレンジプロファイルデータ912を生成する。
【0092】
インターフェログラム生成器906の前に、レンジプロファイルデータ716、位置合わせされたレンジプロファイルデータ910、およびフィルタリング済みの位置合わせされたレンジプロファイルデータ912は、受信チャネル608-1~608-Mの各々の関連する一意のデータを有する。インターフェログラム生成器906は、受信チャネル608-1~608-Mの対にわたって、フィルタリング済みの位置合わせされたレンジプロファイルデータ912に対して動作して、少なくとも1つのインターフェログラム718を生成する。インターフェログラム718は、コヒーレンス情報および位相情報を含む。コヒーレンス情報は、受信チャネル608-1~608-Mのうちの2つのフィルタリング済みの位置合わせされたレンジプロファイルデータ912間の類似(例えば、コヒーレンスまたは相関)量を表す。
【0093】
インターフェログラム特徴抽出器908は、インターフェログラム718に基づく多重チャネル特徴728を生成する。例示的な多重チャネル特徴728は、コヒーレンス特徴914および位相特徴916を含む。コヒーレンス特徴914は、レンジのサブセットについての経時的なコヒーレンス量を表す。時には、コヒーレンス特徴914は、平均コヒーレンスを表す。
【0094】
0のコヒーレンス値は、フィルタリング済みの位置合わせされたレンジプロファイルデータ912が、受信チャネル608-1~608-Mの対にわたって相関していないことを意味する。一方、1のコヒーレンス値は、フィルタリング済みの位置合わせされたレンジプロファイルデータ912が、受信チャネル608-1~608-Mの対にわたって強相関を有することを意味する。0と1の間のコヒーレンス値は、フィルタリング済みの位置合わせされたレンジプロファイルデータ912が、受信チャネル608-1~608-Mの対にわたって部分的な相関または弱相関を有することを意味する。
【0095】
位相特徴916は、レンジのサブセットについての経時的なインターフェログラム718の位相情報における変化量を表す。例示的な位相特徴916は、インターフェログラム718の領域にわたる平均位相差、インターフェログラム718の領域にわたる最大位相差、および/またはインターフェログラム718の領域にわたる標準偏差を表し得る。
【0096】
いくつかの態様では、インターフェログラム特徴抽出器908は、物体の測定された場所に基づいて、物体と関連しているコヒーレンス特徴914および/または位相特徴916を判定し得る。例えば、インターフェログラム特徴抽出器908は、物体の測定された場所を包含する領域を識別できる。この領域内で、インターフェログラム特徴抽出器908は、フィルタリング済みの位置合わせされたレンジプロファイルデータ912を評価して、コヒーレンス特徴914および/または位相特徴916を抽出する。このように、超音波センサ216は、多重チャネル特徴728が、顔認証のために提示された物体に関係し、環境内に存在する別の物体に関係しないことを確実にできる。追加的または代替的に、フィルタ904は、物体の測定された場所に基づいて、位置合わせされたレンジプロファイルデータ910をフィルタリングして、後で生成される多重チャネル特徴728を関心物体と関連付けさせ得る。
【0097】
なりすまし予測器706は、比較器708を使用して、コヒーレンス特徴914および/または位相特徴916を対応閾値と比較する。例えば、なりすまし予測器706は、コヒーレンス特徴914をコヒーレンス閾値918と比較する。一例では、コヒーレンス閾値918は、0.5にほぼ等しい。コヒーレンス特徴914(例えば、レンジのサブセットについて観察されたコヒーレンス量)がコヒーレンス閾値918よりも小さく、ゼロよりも大きい場合、なりすまし予測器706は、顔認証104のために提示された物体が人間の顔408に対応すると判定する。あるいは、コヒーレンス特徴914がコヒーレンス閾値918よりも大きく、1よりも小さい場合、なりすまし予測器706は、顔認証104のために提示された物体がプレゼンテーション攻撃手段404に対応すると判定する。
【0098】
別の例として、なりすまし予測器706は、位相特徴916を位相閾値920と比較する。位相特徴916が、インターフェログラム718内の位相情報が位相閾値920よりも大きいことを示す場合、なりすまし予測器706は、顔認証104のために提示された物体が人間の顔408に対応すると判定する。あるいは、位相特徴916が位相閾値920よりも小さい場合、なりすまし予測器706は、顔認証104のために提示された物体がプレゼンテーション攻撃手段404に対応すると判定する。
【0099】
なりすまし予測器706のいくつかの実施態様は、コヒーレンス特徴914および位相特徴916の両方を分析して、プレゼンテーション攻撃114が発生したかどうかを判定できる。なりすまし予測器706は、追加的または代替的に、ルックアップテーブル710または機械学習済みモジュール712を用いるなどの他の技術を使用して、インターフェログラム718を分析し、プレゼンテーション攻撃114が発生したかどうかを判定できる。
【0100】
図9-1で説明される動作は、一対の受信チャネル608-1~608-Mによって提供されるレンジプロファイルデータ716について実行され得る。超音波センサ216が3つ以上の受信チャネル608-1~608-Mを使用する場合、これらの動作は、受信チャネル608-1~608-Mの複数の対に対して連続して、または並列で実行され得る。超音波センサ216が4つの受信チャネルを使用する(例えば、Mが4と等しい)例を考える。この場合、プレプロセッサ702は、6つまでのインターフェログラム718を生成することができ、これらのインターフェログラム718は、プレゼンテーション攻撃114を検出するために、特徴抽出器704およびなりすまし予測器706によって処理され得る。複数のインターフェログラム718が利用可能な場合、なりすまし予測器706は、多重チャネル特徴728がプレゼンテーション攻撃手段404の存在を示す複数のインターフェログラム718のうちの1つと関連することに応答して、プレゼンテーション攻撃114を検出できる。超音波センサ216が、顔認証104のために提示された人間の顔408がプレゼンテーション攻撃手段404を表すことを誤って判定する可能性を低減するために、なりすまし予測器706は、所定の量のインターフェログラム718がプレゼンテーション攻撃手段404の存在を示す(例えば、複数のインターフェログラム718のうちの3つ以上)ことに応答して、プレゼンテーション攻撃114を検出できる。インターフェログラム718によって提供される例示的な位相情報およびコヒーレンス情報が、図9-2に関してさらに説明される。
【0101】
図9-2は、顔認証なりすまし防止と関連する例示的なインターフェログラム928~932を示す。インターフェログラム928は、物体が人間の顔408であるときに収集されたデータを表す。インターフェログラム930および932は、物体が、それぞれ、デバイス120および1枚の紙であるときに収集されたデータを表す。この紙は、環境100-3に示すように、ユーザ106の写真118を含み得る。
【0102】
インターフェログラム928~932の各々は、位相情報934およびコヒーレンス情報936を含む。位相情報934の異なる陰影は、異なる位相角度を表す。コヒーレンス情報936の異なる陰影は、異なるコヒーレンス量を表す。陰影が明るくなるほどコヒーレンスの量が大きくなることを表し、陰影が暗くなるほどコヒーレンスの量が小さくなることを表す。関心領域938と関連するインターフェログラム928~932のセルは、図9-2において明確にされている。関心領域938は、顔認証104のために提示された物体と超音波センサ216との間の測定された距離に基づく。
【0103】
インターフェログラム928の関心領域938内で、位相情報934は、有意に異なる位相を含む。コヒーレンス情報936は、0.5未満のコヒーレンス量と弱相関を有する多くのセルを含む。関心領域938内のコヒーレンスは、無作為であるように出現し得る。これらの特性は、少なくとも部分的に、人間の顔408の輪郭形成および分散された性質に起因し得る。
【0104】
インターフェログラム930および932の関心領域938内で、位相情報934は、経時的な類似の位相を図示する。関心領域938内のコヒーレンス情報936は、0.5より大きいコヒーレンス量と強相関を有する多くのセルを含む。これらの特性は、少なくとも部分的に、プレゼンテーション攻撃404の平面状および点状の性質に起因し得る。
【0105】
インターフェログラム928~932間で関心領域938を比較すると、インターフェログラム930および932内の位相情報934は、インターフェログラム928内の位相情報934よりも少ない変化を有する。また、インターフェログラム930および932内のコヒーレンス情報936は、インターフェログラム928内のコヒーレンス情報936よりも大きいコヒーレンス量を有する。加えて、インターフェログラム928内のコヒーレンス情報936と比較した場合、インターフェログラム930および932内のコヒーレンス情報936間にはより小さい変化が存在する。概して、特徴抽出器704によって抽出された多重チャネル特徴728およびなりすまし予測器706によって実行された分析によって、超音波センサ216はそれらの特性を検出し、物体を、人間の顔408またはプレゼンテーション攻撃手段404に対応するとして適切に識別可能になる。
【0106】
干渉法技術はまた、付属品110を装着しているユーザ106とプレゼンテーション攻撃手段404とを区別するために適用され得る。いくつかの例では、付属品110によって、コヒーレンス情報936が、いくつかの強相関セルを有するようになる。しかしながら、これらの強相関セルは、プレゼンテーション攻撃手段404の強相関セルと比較して、レンジにおいてより広い領域にわたって存在し得る。インターフェログラム928内の位相情報934および/またはコヒーレンス情報936を分析することによって、超音波センサ216は、人間の顔408をプレゼンテーション攻撃手段404と区別する特性を認識できる。
【0107】
図10-1は、位置合わせを実行するために超音波センサ216によって実施される例示的なスキームを示す。この場合、位置合わせモジュール902は、低域フィルタリングを使用して、受信チャネル608-1および608-2と関連するレンジプロファイルデータ716を整列させる。位置合わせモジュール902は、2つの低域フィルタ1002-1および1002-2を含む。動作中に、低域フィルタ1002-1および1002-2は、それぞれ、レンジ次元にわたって受信チャネル608-1および608-2のレンジプロファイルデータ716をフィルタリングして、位置合わせされたレンジプロファイルデータ910を生成する。低域フィルタ1002-1および1002-2を使用することによって、隣り合ったレンジビンにわたる振幅および/または位相情報が結合されて、より大きな複合レンジビンを形成する。物体のレンジビンは、受信チャネル608-1および608-2のレンジプロファイルデータ716間で異なり得るが、物体のレンジビンは、位置合わせされたレンジプロファイルデータ910のより大きな複合レンジビン内で同じであり得る。このように、位置合わせモジュール902は、受信チャネル608-1および608-2のレンジプロファイルデータ716をレンジにおいて整列させる。
【0108】
低域フィルタ1002-1および1002-2を用いて位置合わせモジュール902を実施することが比較的容易であるが、結果としてもたらされる位置合わせされたレンジプロファイルデータ910は、レンジプロファイルデータ716と比較してより低いレンジ分解能を有する。低域フィルタリングもまた、局所化された位置合わせを実現する。これは、物体と関連するレンジビンが実質的に整列され、一方、レンジプロファイルデータ716内の他のレンジビンは、整列されない場合があることを意味する。このレンジ分解能の低減に対処するため、位置合わせモジュール902は、代わりとして、図10-2に関して説明される技術を利用する。
【0109】
図10-2は、位置合わせを実行するために超音波センサ216によって実施される別の例示的なスキームを示す。この場合、位置合わせモジュール902は、最大の戻りを評価して、受信チャネル608-1および608-2と関連するレンジプロファイルデータ716を整列させる。位置合わせモジュール902は、2つのピーク検出器1004-1および1004-2、比較器1006、およびシフタ1008を含む。
【0110】
動作中に、ピーク検出器1004-1および1004-2は、それぞれ、受信チャネル608-1および608-2と関連するレンジプロファイルデータ716を評価し、ピーク振幅と関連するレンジビン1010-1および1010-2を識別する。比較器1006は、レンジビン1010-1および1010-2を比較して、レンジビン1010-2がレンジビン1010-1と異なる量を判定する。この差は、受信チャネル608-1のレンジプロファイルデータ716と、受信チャネル608-2のレンジプロファイルデータ716との間のオフセット1012(例えば、レンジオフセット)を表す。シフタ1008は、レンジ次元にわたって、オフセット1012によって識別された量だけ、受信チャネル608-2のレンジプロファイルデータ716をシフトする。これによって、結果として、シフタ1008が、受信チャネル608-2のシフトされたレンジプロファイルデータ1014を生成する。受信チャネル608-1のレンジプロファイルデータ716と受信チャネル608-2のシフトされたレンジプロファイルデータ1014とは、位置合わせされたレンジプロファイルデータ910として提供される。
【0111】
図10-1の位置合わせモジュール902よりも若干複雑ではあるが、図10-2の位置合わせモジュール902は、レンジプロファイルデータ716によって提供されるレンジ分解能を保存する。しかしながら、この技術は、図10-1に関して上述した局所化された位置合わせ問題を依然として有する。この局所化された位置合わせに対処するため、位置合わせモジュール902は、代わりとして、図10-3に関して説明される技術を利用できる。
【0112】
図10-3は、位置合わせを実行するために超音波センサ216によって実施される追加の例示的なスキームを示す。この場合、位置合わせモジュール902は、最大の戻りを評価して、受信チャネル608-1および608-2と関連するレンジプロファイルデータ716を整列させ、補間法を使用して、大域的な位置合わせを実現する。位置合わせモジュール902は、2つのピーク検出器1004-1および1004-2、比較器1006、シフタ1008、サブビンレンジオフセット検出器1016(例えば、サブピクセルレンジオフセット検出器)、および補間器1018を含む。
【0113】
動作中に、ピーク検出器1004-1および1004-2、比較器1006、およびシフタ1008は、図10-2に関して上述したように、受信チャネル608-2のシフトされたレンジプロファイルデータ1014を生成する。サブビンレンジオフセット検出器1016は、受信チャネル608-1のレンジプロファイルデータ716を、受信チャネル608-2のシフトされたレンジプロファイルデータ1014と比較して、レンジビンのサイズよりも小さい別のオフセット1020を識別する。補間器1018は、オフセット1020に基づいて、シフトされたレンジプロファイルデータ1014を補間して、受信チャネル608-2の補間されシフトされたレンジプロファイルデータ1022を生成する。受信チャネル608-1のレンジプロファイルデータ716と受信チャネル608-2の補間されシフトされたレンジプロファイルデータ1022とは、位置合わせされたレンジプロファイルデータ910として提供される。
【0114】
補間法を使用することによって、図10-3の位置合わせモジュール902は、図10-1および図10-2の位置合わせモジュール902と比較して、受信チャネル608-1および608-2のレンジプロファイルデータ716をより正確に整列させ得る。しかしながら、この技術はまた、計算上の負担を増加させる。別の位置合わせのための正確な技術は、図10-4に関してさらに説明される。
【0115】
図10-4は、位置合わせを実行するために超音波センサ216によって実施されるさらに別の例示的なスキームを示す。この場合、位置合わせモジュール902は、レンジプロファイルデータ716を共通グリッドに投影する。位置合わせモジュール902は、共通グリッド投影器1024および補間器1026を含む。
【0116】
動作中に、共通グリッド投影器1024は、オイラー角1028およびジオメトリ情報1030を受容する。オイラー角1028は、ユーザデバイス102の向きを表す。ジオメトリ情報1030は、受信チャネル608-1および608-2と関連するマイク504-1および504-2の相対的位置に関する情報を提供する。ジオメトリ情報1030は、ユーザデバイス102と関連する基準点に基づいてマイク504-1および504-2までの距離および角度を指定し得る。オイラー角1028およびジオメトリ情報1030を分析することによって、共通グリッド投影器1024は、物体とマイク504-1および504-2との間の伝搬路差を判定できる。特に、共通グリッド投影器1024は、ユーザデバイス102内のマイク504-1および504-2の異なる位置に起因して発生する振幅差および/または位相差を判定できる。
【0117】
補間器1026は、共通グリッド投影器1024によって提供される情報を使用して、受信チャネル608-2のレンジプロファイルデータ716を再サンプリングまたは補間する。この再サンプリングは、共通グリッドと対応するようにレンジプロファイルデータ716の特性(例えば、振幅および位相)を調整する。いくつかの実施態様では、共通グリッドは、マイク504-1の位置に基づく。この場合、受信チャネル608-1のレンジプロファイルデータ716は、補間器1026を通過する必要はなく、位置合わせされたレンジプロファイルデータ910の一部として提供され得る。補間器1026は、受信チャネル608-2の投影されたレンジプロファイルデータ1032を生成し、これは、位置合わせされたレンジプロファイルデータ910の別の部分として提供され得る。
ゆがみを使用した顔認証なりすまし防止
図11-1は、顔認証なりすまし防止のための別の単一チャネル特徴または多重チャネル特徴を生成するために、超音波センサ216によって実施される例示的なスキームを示す。この例では、超音波センサ216は、少なくとも1つの受信チャネル608についての強度ベースの確率分布のゆがみ(例えば、非対称または調整されたフィッシャー-ピアソン標準化モーメント係数)を評価する。プレゼンテーション攻撃手段404および人間の顔408の異なる物理的構造によって、それらの物体と関連する強度ベースの確率分布が異なる形状を有するようになる。このようにして、超音波センサ216は、顔認証なりすまし防止のために、プレゼンテーション攻撃手段404と人間の顔408とを区別できる。
【0118】
図示された構成では、プレプロセッサ702は、強度ベースのヒストグラム生成器1102を含む。特徴抽出器704は、ゆがみ特徴抽出器1104を含む。なりすまし予測器706は、比較器708、ルックアップテーブル710、および/または機械学習済みモジュール712を含む。
【0119】
動作中に、強度ベースのヒストグラム生成器1102は、レンジプロファイルデータ716に基づいて、少なくとも1つのヒストグラム1106を生成する。超音波センサ216が複数の受信チャネル608-1~608-Mを利用する場合に、強度ベースのヒストグラム生成器1102は、複数のヒストグラム1106を生成できる。例示的なヒストグラム1106は、パワー分布ヒストグラム1108および定誤アラームレート信号対雑音比ヒストグラム1110を含む。パワー分布ヒストグラム1108は、受け取ったパワーの異なるレベルの統計的な頻度を表す。定誤アラームレート信号対雑音比ヒストグラム1110(CFAR-SNRヒストグラム1110)は、CFARカーネルに基づいて正規化された、超音波受信信号412-1~412-Mのうちの1つの異なる定誤アラームレート信号対雑音比の統計的な頻度を表す。
【0120】
いくつかの態様では、強度ベースのヒストグラム生成器1102は、ヒストグラム1106を生成する前に、物体の測定された場所に基づいて、レンジプロファイルデータ716をフィルタリングできる。このようにして、強度ベースのヒストグラム生成器1102は、後で判定された単一チャネル特徴726または多重チャネル特徴728を関心物体と関連付け得る。
【0121】
ゆがみ特徴抽出器1104は、ヒストグラム1106に基づいてゆがみ特徴1112を生成する。ゆがみ特徴1112は、非対称の量または調整されたフィッシャー-ピアソン標準化モーメント係数を表す。なりすまし予測器706は、ゆがみ特徴1112を分析して、顔認証104のために提示された物体が、人間の顔408に対応するか、またはプレゼンテーション攻撃手段404に対応するかを判定する。特に、ゆがみ特徴1112が、ヒストグラム1106が閾値に対して正のゆがみを有することを示す場合、なりすまし予測器706は、その物体がプレゼンテーション攻撃手段404であると判定できる。
【0122】
複数のヒストグラム1106が利用可能である場合、なりすまし予測器706はまた、複数のヒストグラム1106のゆがみ特徴1112間の差を評価できる。時には、0.1dBよりも大きなゆがみ差は、物体がプレゼンテーション攻撃手段404であることを示す場合がある。追加的または代替的に、なりすまし予測器706は、ルックアップテーブル710または機械学習済みモジュール712を使用して、ヒストグラム1106のうちの1つまたは複数内におけるヘビーテールの存在を識別し得る。「ヘビーテール」という用語は、正規分布と比較して、分布の一端に向かって発生するより高い統計的な頻度を表す。ヘビーテールの存在は、以下でさらに説明するように、プレゼンテーション攻撃手段404の存在を示し得る。例示的なパワー分布ヒストグラム1108および定誤アラームレート信号対雑音比ヒストグラム1110を、図11-2および図11-3に示す。
【0123】
図11-2は、顔認証なりすまし防止と関連する例示的なパワー分布ヒストグラム1114~1118を示す。パワー分布ヒストグラム1114は、物体が人間の顔408であるときに収集されたデータを表す。パワー分布ヒストグラム1116および1118は、それぞれ、物体がラテックスのマスクであるときと、剛性のプラスチックマスクであるときとに収集されたデータを表す。パワー分布ヒストグラム1114~1118の各々は、受信チャネル608-1と関連する(例えば、図5のマイク504-1と関連する)第1のパワー分布1120と、受信チャネル608-2と関連する(例えば、図5のマイク504-2と関連する)第2のパワー分布1122とを含む。
【0124】
パワー分布ヒストグラム1114内のパワー分布1120および1122は、相対的な正規分布を有する。この場合、パワー分布1120のゆがみは、およそ-0.7dBであり得、パワー分布1122のゆがみは、およそ-0.6dBであり得る。また、パワー分布1120および1122のゆがみ間の差は、相対的に小さい(例えば、およそ0.1dB以下)。
【0125】
一方、パワー分布ヒストグラム1114および1118内のパワー分布1120および1122の少なくとも一方は、パワー分布ヒストグラム1114内のパワー分布1120および1122に対して正の方向にゆがみを有する。パワー分布ヒストグラム1116内のパワー分布1120および1122の例示的なゆがみは、それぞれ、およそ-0.2dBおよび-0.9dBである。この場合、パワー分布1120のゆがみは、人間の顔408と比較して、ラテックスのマスクの場合に0.5dBだけ大きい。パワー分布ヒストグラム1114内のパワー分布1122はまた、非ガウスの分布または形状を有する。特に、パワー分布1122は、右側にヘビーテールを有する。
【0126】
パワー分布ヒストグラム1118内のパワー分布1120および1122の例示的なゆがみは、それぞれ、およそ-0.7dBおよび-0.7dBである。この場合、パワー分布1122のゆがみは、人間の顔408と比較して、剛性のプラスチックのマスクの場合に0.1dBだけ大きい。この場合、超音波センサ216は、干渉法(図9-1の)または他の単一チャネル技術(図8-1の)などの他の技術を利用して、人間の顔408と剛性のプラスチックのマスクとを区別し得る。
【0127】
いくつかのタイプのプレゼンテーション攻撃手段404に対して、パワー分布1120および1122のゆがみ間の差は、例えばラテックスのマスクの場合のパワー分布ヒストグラム1116では非常に大きい(例えば、0.3dBより大きい)。これは、人間の顔408とプレゼンテーション攻撃手段404とを区別するためになりすまし予測器706が使用できる別の特性である。
【0128】
この技術はまた、デバイス120および紙ベースの媒体116など、他のタイプのプレゼンテーション攻撃手段404に適用され得る。これらのプレゼンテーション攻撃手段404の両方について、正のゆがみが、より一層明白になり得る。例えば、物体がデバイス120である場合、パワー分布1120および1122のゆがみは、それぞれ、およそ0.4dBおよび0.3dBであり得る。別の例として、物体が紙ベースの媒体116である場合、パワー分布1120および1122のゆがみは、それぞれ、およそ0.1および-0.2であり得る。
【0129】
図11-3は、顔認証なりすまし防止と関連する例示的な定誤アラームレート信号対雑音比ヒストグラム1124および1126を示す。定誤アラームレート信号対雑音比ヒストグラム1124は、物体が人間の顔408であるときに収集されたデータを表す。定誤アラームレート信号対雑音比ヒストグラム1126は、物体がデバイス120であるときに収集されたデータを表す。定誤アラームレート信号対雑音比ヒストグラム1126の各々は、受信チャネル608-1と関連する(例えば、マイク504-1と関連する)第1の分布1128と、受信チャネル608-2と関連する(例えば、マイク504-2と関連する)第2の分布1130とを含む。
【0130】
定誤アラームレート信号対雑音比ヒストグラム1124内の分布1128および1130は、相対的に正規分布(例えば、ガウス分布)を有する。一方、定誤アラームレート信号対雑音比ヒストグラム1126内の両方の分布1128および1130は、右側にテールを有する。定誤アラームレート信号対雑音比ヒストグラム1126におけるテールは、定誤アラームレート信号対雑音比ヒストグラム1124におけるテールと比較してより重い(例えば、より高い統計的な頻度を有する)。
パワースペクトルベースの分散を使用した顔認証なりすまし防止
図12-1は、顔認証なりすまし防止のためのさらに別の単一チャネル特徴または多重チャネル特徴を生成するために、超音波センサ216によって実施される例示的なスキームを示す。この例では、超音波センサ216は、スペクトル分散を使用して、少なくとも1つの受信チャネル608内で経時的に観察された分散量を評価する。いくつかのプレゼンテーション攻撃手段404の平面状の構造に起因して、プレゼンテーション攻撃手段404と関連するスペクトルシグネチャは、人間の顔408など、分散された目標よりも高い分散を有する場合がある。1つまたは複数の受信チャネル608-1~608-Mについてスペクトル分散を分析することによって、超音波センサ216は、顔認証なりすまし防止のために、プレゼンテーション攻撃手段404と人間の顔408とを区別できる。
【0131】
図示された構成では、特徴抽出器704は、スライディングウィンドウ1202および分散特徴抽出器1204を含む。なりすまし予測器706は、比較器708、ルックアップテーブル710、および/または機械学習済みモジュール712を含み得る。動作中に、プレプロセッサ702(図示せず)は、受信チャネル608のうちの1つと関連するパワースペクトル722をスライディングウィンドウ1202に提供する。パワースペクトル722を生成するために、プレプロセッサ702は、レンジ次元にわたるレンジプロファイルデータ716に対して一次元フーリエ変換動作を実行してもよい。あるいは、プレプロセッサ702は、レンジスロータイムデータ720に対して二次元フーリエ変換動作を実行してもよい。パワースペクトル722を生成する前に、プレプロセッサ702は、物体の測定された場所に基づいて、レンジプロファイルデータ716をフィルタリングできる。このようにして、プレプロセッサ702は、後で判定された単一チャネル特徴726または多重チャネル特徴728を関心物体と関連付けさせ得る。
【0132】
スライディングウィンドウ1202は、パワースペクトル722を、時間次元に沿って個々のサブフレーム1206に分割する。これらのサブフレーム1206は、重複している場合があるか、重複していない場合がある異なる時間間隔を有する。分散特徴抽出器1204は、1つまたは複数のサブフレーム内および任意選択的に各サブフレーム内の振幅情報の標準偏差(または分散)を計算して、分散特徴1208を生成する。例示的な分散特徴1208は、図12-2、および12-3に関して以下でさらに説明される。
【0133】
図12-2、および図12-3は、顔認証なりすまし防止と関連する標準偏差グラフ1210~1220を示す。標準偏差グラフ1210および1212は、それぞれ、人間の顔408と、付属品110として帽子を装着している人間の顔408と関連付けられている。標準偏差グラフ1214は、プラスチックのマスクと関連付けられている。標準偏差グラフ1216、1218、および1220は、紙ベースの媒体116、デバイス120、およびラテックスのマスクとそれぞれ関連付けられている。標準偏差グラフ1210~1220の各々は、受信チャネル608-1および608-2と関連付けられている(例えば、図5のマイク504-1および504-2と関連付けられている)分散1222および1224を図示する。
【0134】
人間の顔408(付属品110の有無にかかわらず)と、様々なプレゼンテーション攻撃手段404とを区別するために、なりすまし予測器706は、分散1222および1224が期待値のセット内であるかどうかを判定できる。分散1222および1224が期待値のセット内である場合、なりすまし予測器706は、顔認証104のために提示された物体が人間の顔408に対応することを判定する。あるいは、分散1222または1224が期待値のセット外の値を有する場合、なりすまし予測器706は、提示された物体がプレゼンテーション攻撃手段404に対応することを判定する。期待値のセットは、概して、標準偏差グラフ1210および1212に示す値を含む。
【0135】
紙ベースの媒体116およびデバイス120と関連付けられた標準偏差グラフ1216および1218を考えると、分散1222および1224は、標準偏差グラフ1210および1212の分散1222および1224よりも有意に大きい。ラテックスのマスクと関連付けられている標準偏差グラフ1220の場合、分散1222および1224は、標準偏差グラフ1210および1212の分散1222および1224よりも有意に小さい。
【0136】
標準偏差グラフ1210および1212と、スペクトル分散を使用したプラスチックのマスクと関連付けられている標準偏差グラフ1214とを区別するのが困難な場合がある。この場合、超音波センサ216は、他の説明された技術のうちの1つまたは複数を実行して、人間の顔408とプラスチックのマスクとを区別できる。
例示的な方法
図13図14、および図15は、超音波を使用する顔認証なりすまし防止のための例示的な方法1300、1400、および1500を図示する。各方法1300、1400、および1500は、実行される動作(または行為)のセットとして示されており、動作が本明細書で示されている順序または組合せに必ずしも限定されない。さらに、動作の1つまたは複数のうちのいずれかは、多様な追加および/または代替の方法を提供するために反復、結合、再編成、またはリンクされ得る。以下の説明の一部分において、図1の環境100-1~100-5および図2図4-1に詳細に示されている実体を参照する場合があるが、それらの参照は、例としてなされているにすぎない。上記技術は、1つのユーザデバイス102に対して動作している、1つの実体または複数の実体による性能に限定されない。
【0137】
図13の1302で、超音波送信信号が送信される。例えば、超音波センサ216は、図4-1に示すように、超音波送信信号410を送信する。超音波送信信号410は、例えば図2-2を参照して上述したように、およそ20kHz~2MHzの範囲の周波数を含み、パルス信号または連続信号を表し得る。いくつかの場合、超音波センサ216は、位相および/または周波数を含む超音波送信信号410の特性を調節する。いくつかの実施態様では、超音波センサ216は、顔認証システム202が要求302を受信したことに応答して、またはユーザデバイス102がほぼ静止していることを示すアラート(例えば、慣性計測ユニット236からのアラート)を超音波センサ216がセンサ218から受信したことに応答して、超音波送信信号410-1または410-Sを送信する。
【0138】
超音波センサ216は、専用トランスデューサ222を使用して、超音波送信信号410を送信することができる。他の実施態様では、超音波センサ216は、ユーザデバイス102の共有スピーカー(例えば、スピーカー502)を使用して、超音波送信信号410を送信することができる。
【0139】
1304で、超音波受信信号が受信される。この超音波受信信号は、物体によって反射された超音波送信信号のバージョンを含む。例えば、超音波センサ216は、マイク504-1または504-2のうちの一方を使用して超音波受信信号412を受信する。超音波受信信号412は、超音波送信信号410のバージョン(例えば、超音波送信信号410の遅延されたバージョン)であり、このバージョンは、物体(例えば、プレゼンテーション攻撃手段404または人間の顔408)によって反射される。いくつかの場合、超音波受信信号412は、超音波送信信号410とは異なる振幅を有し、および/または位相および/または周波数においてシフトされる。いくつかの実施態様では、超音波センサ216は、超音波送信信号410が送信された時間の少なくとも一部分中に、超音波受信信号412を受信する。
【0140】
1306で、レンジプロファイルデータが、超音波受信信号に基づいて生成される。このレンジプロファイルデータは、超音波受信信号と関連する振幅および位相情報を含む。例えば、超音波センサ216のなりすまし検出器230は、複素数データ714の1タイプであるレンジプロファイルデータ716を生成する。レンジプロファイルデータ716は、レンジ次元および時間次元にわたる振幅および位相情報を含む。
【0141】
1308で、物体の場所と関連する関心領域内のレンジプロファイルデータの特徴が判定される。例えば、超音波センサ216は、物体の場所と関連する関心領域内の特徴724(例えば、単一チャネル特徴726)を判定する。例示的な単一チャネル特徴726は、図8-1に示すように、ピーク振幅特徴808、エネルギー分布特徴810、および/または位相特徴812を含み得る。概して、関心領域は、物体の場所を包含する全般的な空間領域を明確化している。いくつかの場合では、この明確化された空間領域は、物体の場所を判定する際の誤差の原因となる物体の場所の少なくとも一部分を囲み得る。例示的な空間領域は、図8-2に示される物体のレンジ826を含み得る。いくつかの実施態様では、超音波センサ216は、レンジプロファイルデータ716を分析することによって、物体の場所を直接測定できる。追加的または代替的に、超音波センサ216は、センサ218によって提供されるセンサデータ308を参照して、物体の場所を判定できる。
【0142】
1310で、プレゼンテーション攻撃は、特徴に基づいて検出される。プレゼンテーション攻撃は、顔認証システムをだますことを試行する。物体は、プレゼンテーション攻撃と関連付けられている。例えば、超音波センサ216は、図8-1および図8-2に関して説明するように、特徴724に基づいてプレゼンテーション攻撃114を検出する(または、例えば、プレゼンテーション攻撃手段404の存在を判定する)。
【0143】
プレゼンテーション攻撃114は、顔認証システム202をだますことを試行する。物体は、プレゼンテーション攻撃114と関連付けられており、プレゼンテーション攻撃手段404を表す。例示的なプレゼンテーション攻撃手段404として、ユーザ106の写真118、ユーザ106のデジタル画像124、またはユーザ106の1つまたは複数の特徴を複製したマスク126が挙げられ得る。
【0144】
1312で、顔認証システムは、プレゼンテーション攻撃を認証することが防止される。例えば、超音波センサ216は、顔認証システム202が、プレゼンテーション攻撃114を認証することを防止する。特に、超音波センサ216は、なりすましインジケータ304を顔認識器214に提供し、これは、顔認識器214に、顔認証失敗を報告306させる。
【0145】
方法1300の変形例において、ブロック1310は、代わりとして、プレゼンテーション攻撃114が存在しない(例えば、超音波送信信号410を反射して超音波受信信号412を生成する物体が人間の顔である)特徴724に基づいて判定され得る。この場合、1312で、顔認証システム202は、人間の顔408を認証して、ユーザ106がアクセスするのを可能にする。
【0146】
レンジプロファイルデータを分析することによって、超音波センサ216は、わずか1つの受信チャネル608を使用して顔認証なりすまし防止を実行できる。これは、超音波センサ216が単一の受信チャネル608を用いて実施される空間的に制約されたデバイスにとって有用であり得る。追加の受信チャネル608が利用可能な場合、超音波センサ216は、1つまたは複数の受信チャネルおよび任意選択的に各受信チャネル608と関連する特徴724を評価して、プレゼンテーション攻撃114を正しく検出するその能力を改善し得る。
【0147】
図14の1402で、超音波送信信号が、超音波センサを使用して送信される。例えば、超音波センサ216は、1302に関して図13で説明するように、超音波送信信号410を送信する。
【0148】
1404で、少なくとも2つの超音波受信信号が、超音波センサの少なくとも2つのトランスデューサを使用して受信される。少なくとも2つの超音波受信信号は、物体によって反射された超音波送信信号のそれぞれのバージョンを含む。例えば、超音波センサ216は、マイク504-1~504-Mのうちの少なくとも2つを使用して超音波受信信号412-1~412-Mのうちの少なくとも2つを受信する。超音波受信信号412-1~412-Mは、超音波送信信号410のそれぞれのバージョンであり、このバージョンは、物体(例えば、プレゼンテーション攻撃手段404または人間の顔408)によって反射される。超音波受信信号412-1~412-Mは、超音波送信信号410とは異なる振幅を有し得、ならびに/または位相および/もしくは周波数においてシフトされ得る。いくつかの実施態様では、超音波センサ216は、超音波送信信号410が送信された時間の少なくとも一部分中に、超音波受信信号412-1~412-Mを受信する。
【0149】
1406で、インターフェログラムが、少なくとも2つの超音波受信信号に基づいて生成される。このインターフェログラムは、コヒーレンス情報および位相情報を含む。例えば、超音波センサ216のなりすまし検出器230は、図9-1に示すように、少なくとも2つの超音波受信信号412-1~412-Mに基づいて、インターフェログラム718を生成する。特に、なりすまし検出器230のプレプロセッサ702は、受信チャネル608-1~608-Mのうちの2つと関連するレンジプロファイルデータ716からの情報を結合することによって、インターフェログラム718を生成する。インターフェログラム718は、図9-2に示すように、コヒーレンス情報936および位相情報934を含む。
【0150】
1408で、コヒーレンス特徴が、インターフェログラムのコヒーレンス情報に基づいて識別される。このコヒーレンス特徴は、関心領域内のコヒーレンス量を表す。例えば、超音波センサ216のなりすまし検出器230は、関心領域938内のコヒーレンス量を表すコヒーレンス特徴914を識別(例えば、抽出または生成)する。コヒーレンス特徴914は、物体がプレゼンテーション攻撃手段404と関連している場合、(インターフェログラム930または932で示すように)有意に大きいコヒーレンス量を示し得、物体が人間の顔408と関連している場合、(インターフェログラム928で示すように)非常に小さいコヒーレンス量を示し得る。例示的なコヒーレンス特徴914は、関心領域938内の平均コヒーレンスを表し得る。別の例示的なコヒーレンス特徴914は、関心領域938内のコヒーレンス量分散を表す。
【0151】
1410で、プレゼンテーション攻撃は、コヒーレンス特徴に基づいて検出される。プレゼンテーション攻撃は、顔認証システムをだますことを試行する。物体は、プレゼンテーション攻撃と関連付けられている。例えば、超音波センサ216は、図9-1に示すように、コヒーレンス特徴914に基づいてプレゼンテーション攻撃114を検出する。プレゼンテーション攻撃114は、顔認証システム202をだますことを試行する。この物体は、プレゼンテーション攻撃114と関連している。
【0152】
1412で、顔認証システムは、プレゼンテーション攻撃114を認証することが防止される。例えば、超音波センサ216は、顔認証システム202が、プレゼンテーション攻撃114を認証することを防止する。特に、超音波センサ216は、なりすましインジケータ304を顔認識器214に提供し、これは、顔認識器214に、顔認証失敗を報告306させる。
【0153】
方法1400の変形例において、ブロック1410は、代わりとして、プレゼンテーション攻撃114が存在しない(例えば、超音波送信信号410を反射して超音波受信信号412を生成する物体が人間の顔である)コヒーレンス特徴914に基づいて判定され得る。この場合、1412で、顔認証システム202は、人間の顔408を認証して、ユーザ106がアクセスするのを可能にする。
【0154】
図15の1502で、超音波送信信号が送信される。例えば、超音波センサ216は、1302に関して図13で説明するように、超音波送信信号410を送信する。
【0155】
1504で、少なくとも2つの超音波受信信号が、超音波センサの少なくとも2つのトランスデューサを使用して受信される。少なくとも2つの超音波受信信号は、物体によって反射された超音波送信信号のそれぞれのバージョンを含む。例えば、1404に関して図14で説明したように、超音波センサ216は、マイク504-1~504-Mのうちの少なくとも2つを使用して超音波受信信号412-1~412-Mのうちの少なくとも2つを受信する。
【0156】
1506で、パワースペクトルが、少なくとも2つの超音波受信信号に基づいて生成される。パワースペクトルは、周波数のセットおよび時間間隔にわたる少なくとも2つの超音波受信信号のパワーを表す。例えば、超音波センサ216のなりすまし検出器230は、図12-1に示すように、パワースペクトル722を生成する。パワースペクトル722は、周波数のセットおよび時間間隔にわたる少なくとも2つの超音波受信信号のパワーを表す。
【0157】
1508で、パワースペクトル内のパワーの分散が、経時的に判定される。分散は、少なくとも2つの超音波受信信号とそれぞれ関連している。例えば、なりすまし検出器230は、経時的なパワースペクトル内のパワーの標準偏差を表す分散特徴1208を生成する。例示的な標準偏差グラフは、異なるタイプの物体について図12-2および図12-3に示されている。
【0158】
1510で、プレゼンテーション攻撃は、分散に基づいて検出される。プレゼンテーション攻撃は、顔認証システムをだますことを試行する。物体は、プレゼンテーション攻撃と関連付けられている。例えば、なりすまし検出器230は、図12-1に示すように、分散特徴1208に基づいてプレゼンテーション攻撃114を検出する。プレゼンテーション攻撃114は、顔認証システム202をだますことを試行する。この物体は、プレゼンテーション攻撃114と関連付けられている。
【0159】
1512で、顔認証システムは、プレゼンテーション攻撃を認証することが防止される。例えば、超音波センサ216は、顔認証システム202が、プレゼンテーション攻撃114を認証することを防止する。特に、超音波センサ216は、なりすましインジケータ304を顔認識器214に提供し、これは、顔認識器214に、顔認証失敗を報告306させる。
【0160】
方法1500の変形例において、ブロック1510は、代わりとして、プレゼンテーション攻撃114が存在しない(例えば、超音波送信信号410を反射して超音波受信信号412を生成する物体が人間の顔である)分散特徴1208に基づいて判定され得る。この場合、1512で、顔認証システム202は、人間の顔408を認証して、ユーザ106がアクセスするのを可能にする。
【0161】
図13図15の動作は、様々なやり方で組み合わせられる。概して、超音波センサ216は、単一チャネル特徴726または多重チャネル特徴728の任意の組合せを使用して、顔認証なりすまし防止を実行できる。顔認証なりすまし防止のために追加の技術を用いることは、追加の計算リソースを使用し得るが、人間の顔408とプレゼンテーション攻撃手段404とを正確に区別する超音波センサ216の精度を高め得る。さらに、複数の技術を実行することは、超音波センサ216が、付属品110を装着している人間の顔408とプレゼンテーション攻撃114とを区別することをより良好に可能にし得る。
例示的なコンピューティングシステム
図16は、超音波センサ216を使用して顔認証なりすまし防止を実行するために、上記の図2-1を参照して説明するように、任意のタイプのクライアント、サーバ、および/またはユーザデバイス102として実施され得る例示的なコンピューティングシステム1600の様々な構成要素を示す。
【0162】
コンピューティングシステム1600は、デバイスデータ1604(例えば、受信されたデータ、受信されているデータ、同報がスケジューリングされているデータ、またはデータのデータパケット)の有線および/または無線通信を可能にする通信デバイス1602を含む。通信デバイス1602またはコンピューティングシステム1600は、1つまたは複数の超音波センサ216および1つまたは複数のセンサ218を含み得る。デバイスデータ1604または他のデバイスコンテンツは、デバイスの構成設定、デバイス上に記憶されたメディアコンテンツ、および/またはデバイスのユーザ106と関連付けられている情報を含み得る。コンピューティングシステム1600に記憶されているメディアコンテンツは、任意の種類の音声、動画、および/または画像データを含み得る。コンピューティングシステム1600は、人間の発声、超音波センサ216からの入力、ユーザが選択可能な入力(明示的または暗黙的)、メッセージ、音楽、テレビメディアコンテンツ、録画された動画コンテンツ、および任意のコンテンツおよび/またはデータのソースから受信される任意の他の種類の音声、動画、および/または画像データを含む任意のタイプのデータ、メディアコンテンツ、および/または入力が受信可能な1つまたは複数のデータ入力1606を含む。
【0163】
コンピューティングシステム1600はまた、直列および/または並列インターフェース、無線インターフェース、任意の種類のネットワークインターフェース、モデム、および任意の他の種類の通信インターフェースのうちの任意の1つまたは複数として実施され得る通信インターフェース1608を含む。通信インターフェース1608は、コンピューティングシステム1600と通信ネットワークとの間に接続および/または通信リンクを提供し、それによって他の電子デバイス、コンピューティングデバイス、および通信デバイスがコンピューティングシステム1600とデータ通信する。
【0164】
コンピューティングシステム1600は、1つまたは複数のプロセッサ1610(例えば、マイクロプロセッサ、コントローラなどのいずれか)を含み、コンピューティングシステム1600の動作を制御するため、さらに超音波を使用した顔認証なりすまし防止のための技術またはそれが具体化され得る技術を可能にするための様々なコンピュータ実行可能命令を処理する。代替的または追加的に、コンピューティングシステム1600は、ハードウェア、ファームウェア、または概して1612で明確にされている処理回路および制御回路と接続して実施される固定論理回路のうちの任意の1つまたはそれらの組合せとともに実施され得る。図示していないが、コンピューティングシステム1600は、デバイス内の様々な構成要素を結合するシステムバスまたはデータ転送システムを含み得る。システムバスは、メモリバスもしくはメモリコントローラ、周辺機器バス、ユニバーサルシリアルバス、および/または多種多様なバスアーキテクチャのうちのいずれかを利用するプロセッサもしくはローカルバスを含む、異なるバス構造のうちの任意の1つまたはそれらの組合せを含み得る。
【0165】
コンピューティングシステム1600はまた、持続性および/または非一時的データ記憶(すなわち、単なる信号伝送と対称的)を可能にする1つまたは複数のメモリデバイスを含むコンピュータ可読媒体1614を含み、その例は、ランダムアクセスメモリ(RAM)、不揮発性メモリ(例えば、読み出し専用メモリ(ROM)、フラッシュメモリ、EPROM、EEPROMなどのうちの任意の1つまたは複数)、およびディスク記憶デバイスを含む。ディスク記憶デバイスは、ハードディスクドライブ、記録可能および/または上書き可能なコンパクトディスク(CD)、任意の種類のデジタル多用途ディスク(DVD)などを含む任意のタイプの磁気または光学記憶デバイスとして実施され得る。コンピューティングシステム1600はまた、大容量記憶媒体デバイス(記憶媒体)1616も含み得る。
【0166】
コンピュータ可読媒体1614は、デバイスデータ1604とともに、様々なデバイスアプリケーション1618およびコンピューティングシステム1600の動作的な態様に関連した任意の他の種類の情報および/もしくはデータを記憶するためのデータ記憶機構を提供する。例えば、オペレーティングシステム1620は、コンピュータ可読媒体1614によりコンピュータアプリケーションとして維持され、プロセッサ1610上で実行され得る。デバイスアプリケーション1618は、任意の形態の制御アプリケーション、ソフトウェアアプリケーション、信号処理および制御モジュール、特定のデバイスに固有のコード、特定のデバイスのためのハードウェアアブストラクション層を含む、デバイスマネージャを含み得る。超音波センサ216を使用して、コンピューティングシステム1600は、パワースペクトルベースの分散を使用する顔認証なりすまし防止を実行できる。
結論
パワースペクトルをベースとした分散を使用する顔認証なりすまし防止を実行するために超音波センサを使用する技術およびその超音波センサを含む装置が特徴および/または方法に特化した言語において説明されたが、添付された特許請求の範囲の主題が説明された特定の特徴または方法に必ずしも限定されないことを理解されたい。むしろ、その特定の特徴および方法は、パワースペクトルベースの分散を使用する顔認証なりすまし防止の例示的な実施態様として開示されている。
【0167】
いくつかの例を以下で説明する。
例1:超音波センサによって実行される方法であって、超音波送信信号を送信することと、超音波受信信号を受信することとを含む。超音波受信信号は、物体によって反射された超音波送信信号のバージョンを含む。方法は、超音波受信信号に基づいてレンジプロファイルデータを生成することをさらに含み、レンジプロファイルデータは、超音波受信信号と関連する振幅および位相情報を含む。方法は、物体の場所と関連する関心領域内のレンジプロファイルデータの特徴を判定することと、特徴に基づいてプレゼンテーション攻撃を検出することをさらに含み、プレゼンテーション攻撃は、顔認証システムをだますことを試行しており、物体は、プレゼンテーション攻撃と関連付けられている。方法は、顔認証システムがプレゼンテーション攻撃を認証することを防止することをさらに含む。
【0168】
例2:例1に記載の方法であって、特徴を判定することは、レンジプロファイルデータの関心領域内のピーク振幅を検出することを含み、プレゼンテーション攻撃を検出することは、ピーク振幅を閾値と比較することと、ピーク振幅が閾値を上回っていることに応答して、プレゼンテーション攻撃を検出することとを含む。
【0169】
例3:例2に記載の方法であって、他の超音波送信信号を送信することと、他の超音波受信信号を受信することとを含む。他の超音波受信信号は、人間の顔によって反射された他の超音波送信信号のバージョンを含む。方法は、他の超音波受信信号に基づいて他のレンジプロファイルデータを生成することをさらに含み、他のレンジプロファイルデータは、他の超音波受信信号と関連する振幅および位相情報を含む。方法は、他のレンジプロファイルデータの他の関心領域内の他のピーク振幅を検出することをさらに含み、他の関心領域は、人間の顔の場所と関連している。方法は、他のピーク振幅を閾値と比較することと、他のピーク振幅が閾値よりも小さいことに応答して、顔認証システムが、人間の顔を認証することを可能にすることとをさらに含む。
【0170】
例4:いずれかの先行する例に記載の方法であって、特徴を判定することは、関心領域上のエネルギーの分布を判定することを含み、プレゼンテーション攻撃を検出することは、エネルギーの分布が他の閾値よりも大きいことに応答して、プレゼンテーション攻撃を検出することを含む。
【0171】
例5:いずれかの先行する例に記載の方法であって、物体の場所を判定することをさらに含み、関心領域は、物体のその場所を含む。
【0172】
例6:例5に記載の方法であって、センサからセンサデータを受容することをさらに含み、物体の場所を判定することは、センサデータに基づいて物体の場所を判定することを含む。
【0173】
例7:例6に記載の方法であって、センサは、カメラの位相差センサ、または無線周波数センサを含む。
【0174】
例8:例5~例7のいずれか1例に記載の方法であって、特徴を判定する前に、関心領域と関連する振幅および位相情報を抽出するために、レンジプロファイルデータをフィルタリングすることをさらに含む。
【0175】
例9:いずれかの先行する例に記載の方法であって、超音波送信信号を送信することは、およそ7センチメートル未満であるレンジプロファイルデータのレンジ分解能をもたらす帯域幅を有する超音波送信信号を生成することを含む。
【0176】
例10:いずれかの先行する例に記載の方法であって、物体までの距離を判定することと、プレゼンテーション攻撃を検出する前に、物体までの距離に基づいて、レンジプロファイルデータ内の振幅情報を正規化することとをさらに含む。
【0177】
例11:例1~例9のいずれか1例に記載の方法であって、プレゼンテーション攻撃を検出する前に、直交カップリング係数または定誤アラームレート信号対雑音比に基づいてレンジプロファイルデータ内の振幅情報を正規化することをさらに含む。
【0178】
例12:いずれかの先行する例に記載の方法であって、慣性計測ユニットからの動きデータを受容することをさらに含み、動きデータは、超音波センサの動きを表す。方法は、動きデータに基づいてレンジプロファイルデータを修正することによって、超音波センサの動きを補償することをさらに含む。
【0179】
例13:例1~例11のいずれか1例に記載の方法であって、慣性計測ユニットから動きデータを受容することと、動きデータに基づいて、超音波センサがほぼ静止していることを判定することとをさらに含む。超音波送信信号を送信することは、超音波センサがほぼ静止していることを判定したことに応答して、超音波信号を送信することを含む。
【0180】
例14:装置は、例1~13の方法のうちのいずれか1つの方法を実行するように構成されている超音波センサを備える。
【0181】
例15:コンピュータ可読記憶媒体は、プロセッサによって実行されると、超音波センサに、例1~13の方法のうちのいずれか1つの方法を実行させる命令を含む。
【0182】
例16:超音波センサによって実行される方法であって、超音波送信信号を送信することと、超音波センサの少なくとも2つのトランスデューサを使用して少なくとも2つの超音波受信信号を受信することとを含み、少なくとも2つの超音波受信信号は、物体によって反射された超音波送信信号のそれぞれのバージョンを含む。方法は、少なくとも2つの超音波受信信号に基づいてインターフェログラムをさらに含み、インターフェログラムは、コヒーレンス情報および位相情報を含む。方法は、インターフェログラムのコヒーレンス情報に基づいてコヒーレンス特徴を識別することをさらに含み、コヒーレンス特徴は、関心領域内のコヒーレンス量を表す。方法は、コヒーレンス特徴に基づいてプレゼンテーション攻撃を検出することをさらに含み、プレゼンテーション攻撃は、顔認証システムをだますことを試行しており、物体は、プレゼンテーション攻撃と関連付けられている。方法は、顔認証システムがプレゼンテーション攻撃を認証することを防止することをさらに含む。
【0183】
例17:例16に記載の方法であって、プレゼンテーション攻撃を検出することは、コヒーレンス量がコヒーレンス閾値よりも大きいことに応答して、プレゼンテーション攻撃を検出することを含む。
【0184】
例18:例17に記載の方法であって、プレゼンテーション攻撃を検出することは、他の超音波送信信号を送信することと、少なくとも2つの他の超音波受信信号を受信することとを含み、少なくとも2つの他の超音波受信信号は、人間の顔によって反射された他の超音波送信信号のバージョンを含む。方法は、少なくとも2つの他の超音波受信信号に基づいて他のインターフェログラムをさらに含み、他のインターフェログラムは、コヒーレンスおよび位相情報を含む。方法は、他のインターフェログラムのコヒーレンス情報に基づいて他のコヒーレンス特徴を識別することをさらに含み、他のコヒーレンス特徴は、他の関心領域内の他のコヒーレンス量を表す。他のコヒーレンス量がコヒーレンス閾値よりも小さいことに応答して、顔認証システムが、人間の顔を認証することを可能にすることをさらに含む。
【0185】
例19:例16~例18のうちの1例に記載の方法であって、プレゼンテーション攻撃を検出することは、インターフェログラムの位相情報に基づいて位相特徴を識別することをさらに含み、位相特徴は、関心領域内の位相変化量を表す。プレゼンテーション攻撃を検出することは、位相変化量が位相閾値よりも小さいことに応答して、プレゼンテーション攻撃を検出することをさらに含む。
【0186】
例20:例16~例19のいずれか1例に記載の方法であって、少なくとも2つの超音波受信信号に基づいてレンジプロファイルデータを生成することと、位置合わせされたレンジプロファイルデータを生成するために、レンジプロファイルデータに対して位置合わせを実行することとをさらに含む。インターフェログラムを生成することは、位置合わせされたレンジプロファイルデータに基づいてインターフェログラムを生成することを含む。
【0187】
例21:例20に記載の方法であって、レンジプロファイルデータは、少なくとも2つの超音波受信信号のうちの第1の超音波受信信号と関連する第1のレンジプロファイルデータと、少なくとも2つの超音波受信信号のうちの第2の超音波受信信号と関連する第2のレンジプロファイルデータとを含む。位置合わせを実行することは、第1のレンジプロファイルデータおよび第2のレンジプロファイルデータ内の物体のそれぞれの応答をレンジ次元に沿って整列させる。
【0188】
例22:例21に記載の方法であって、位置合わせを実行することは、第1の低域フィルタを通して第1のレンジプロファイルデータをフィルタリングすることと、第2の低域フィルタを通して第2のレンジプロファイルデータをフィルタリングすることとを含む。
【0189】
例23:例21に記載の方法であって、位置合わせを実行することは、第1のレンジプロファイルデータ内の第1のピーク振幅を検出することと、第1のピーク振幅と関連する第1のレンジビンを判定することと、第2のレンジプロファイルデータ内の第2のピーク振幅を検出することと、第2のピーク振幅と関連する第2のレンジビンを判定することと、第1のレンジビンと第2のレンジビンとの差に基づいてオフセットを判定することと、オフセットに基づいてレンジにおいて第2のレンジプロファイルデータをシフトして、シフトされた第2のレンジプロファイルデータを生成することとを含む。
【0190】
例24:例23に記載の方法であって、位置合わせを実行することは、第1のレンジプロファイルデータとシフトされた第2のレンジプロファイルデータとの間の他のオフセットを判定することと、他のオフセットに基づいて、シフトされた第2のレンジプロファイルデータを補間して、補間およびシフトされた第2のレンジプロファイルデータを生成することとを含む。
【0191】
例25:例21に記載の方法であって、位置合わせを実行することは、第2のレンジプロファイルデータを、第1のレンジプロファイルデータと関連する共通グリッドに投影するために、第2のレンジプロファイルデータを再サンプリングすることを含む。
【0192】
例26:例20~例25のいずれか1例に記載の方法であって、プレゼンテーション攻撃を検出することは、レンジプロファイルデータに基づいてパワー分布ヒストグラムを生成することを含み、パワー分布ヒストグラムは、それぞれ、少なくとも2つの超音波受信信号と関連する。プレゼンテーション攻撃を検出することは、パワー分布ヒストグラムのゆがみに基づいてプレゼンテーション攻撃を検出することをさらに含む。
【0193】
例27:例20~例26のいずれか1例に記載の方法であって、プレゼンテーション攻撃を検出することは、レンジプロファイルデータに基づいて定誤アラームレート信号対雑音比分布ヒストグラムを生成することを含み、定誤アラームレート信号対雑音比分布ヒストグラムは、それぞれ、少なくとも2つの超音波受信信号と関連する。プレゼンテーション攻撃を検出することは、定誤アラームレート信号対雑音比分布ヒストグラムのゆがみに基づいてプレゼンテーション攻撃を検出することをさらに含む。
【0194】
例28:例27に記載の方法であって、定誤アラームレート信号対雑音比分布ヒストグラムの形状は、非ガウス分布、またはテールを有する分布のうちの1つまたは複数を呈する。
【0195】
例29:装置は、例16~28の方法のうちのいずれか1つの方法を実行するように構成されている超音波センサを備える。
【0196】
例30:例29に記載の装置であって、装置は、スマートフォンを含み、超音波センサは、スマートフォン内に集積されており、超音波センサの少なくとも2つのトランスデューサは、スマートフォンの第1のマイクと、スマートフォンの第2のマイクとを備える。
【0197】
例31:例30に記載の装置であって、第1のマイクおよび第2のマイクは、スマートフォンの反対の端部に位置決めされている。
【0198】
例32:例29~例31のいずれか1例に記載の装置であって、少なくとも2つのトランスデューサ間の距離は、超音波送信信号と関連している波長よりも大きい。
【0199】
例33:コンピュータ可読記憶媒体は、プロセッサによって実行されると、超音波センサに、例16~28の方法のうちのいずれか1つの方法を実行させる命令を含む。
【0200】
例34:超音波センサによって実行される方法であって、超音波送信信号を送信することと、超音波センサの少なくとも2つのトランスデューサを使用して少なくとも2つの超音波受信信号を受信することとを含み、少なくとも2つの超音波受信信号は、物体によって反射された超音波送信信号のそれぞれのバージョンを含む。方法は、少なくとも2つの超音波受信信号に基づいてパワースペクトルを生成することをさらに含み、パワースペクトルは、周波数のセットおよび時間間隔にわたる少なくとも2つの超音波受信信号のパワーを表す。方法は、経時的なパワースペクトル内のパワーの分散を判定することをさらに含み、分散は、少なくとも2つの超音波受信信号とそれぞれ関連している。方法は、分散に基づいてプレゼンテーション攻撃を検出することをさらに含み、プレゼンテーション攻撃は、顔認証システムをだますことを試行しており、物体は、プレゼンテーション攻撃と関連付けられている。方法は、顔認証システムがプレゼンテーション攻撃を認証することを防止することをさらに含む。
【0201】
例35:例34に記載の方法であって、パワースペクトルを生成することは、少なくとも2つの超音波受信信号に基づいて複素数データを生成することと、パワースペクトルを生成するためにフーリエ変換を実行することとを含む。
【0202】
例36:例34または例35に記載の方法であって、複素数データは、レンジプロファイルデータ、レンジスロータイムデータ、またはインターフェログラムを含む。
【0203】
例37:例34~例36のいずれか1例に記載の方法であって、プレゼンテーション攻撃を検出することは、分散が値のセット内にあるかどうかを判定することと、分散の少なくとも1つが値のセット外にあることに応答して、プレゼンテーション攻撃を検出することとを含む。
【0204】
例38:例37に記載の方法であって、プレゼンテーション攻撃を検出することは、他の超音波送信信号を送信することと、少なくとも2つの他の超音波受信信号を受信することとを含み、少なくとも2つの他の超音波受信信号は、人間の顔によって反射された他の超音波送信信号のバージョンを含む。プレゼンテーション攻撃を検出することは、少なくとも2つの他の超音波受信信号に基づいて他のパワースペクトルを生成することをさらに含み、他のパワースペクトルは、周波数のセットおよび他の時間間隔にわたる少なくとも2つの他の超音波受信信号のパワーを表す。プレゼンテーション攻撃を検出することは、経時的な他のパワースペクトル内のパワーの他の分散を判定することをさらに含み、他の分散は、少なくとも2つの超音波受信信号とそれぞれ関連している。プレゼンテーション攻撃を検出することは、他の分散が値のセット内にあることに応答して、顔認証システムが、人間の顔を認証することを可能にすることをさらに含む。
【0205】
例39:例38に記載の方法であって、人間の顔は、付属品を装着している。
例40:例34~例39のいずれか1例に記載の方法であって、パワースペクトルは、
少なくとも2つの超音波受信信号のうちの第1の超音波受信信号と関連する第1のパワースペクトルと、少なくとも2つの超音波受信信号のうちの第2の超音波受信信号と関連する第2のパワースペクトルとを含み、分散を判定することは、スライディングウィンドウを使用して、第1のパワースペクトルのサブフレームの第1のセットを生成することを含み、サブフレームの第1のセットのサブフレームは、時間間隔の異なる部分と関連している。分散を判定することは、サブフレームの第1のセットにわたる第1の標準偏差を計算することと、スライディングウィンドウを使用して、第2のパワースペクトルのサブフレームの第2のセットを生成することとをさらに含み、サブフレームの第2のセットのサブフレームは、時間間隔の異なる部分と関連している。分散を判定することは、サブフレームの第2のセットにわたる第2の標準偏差を計算することをさらに含む。
【0206】
例41:例1~例13、例16~例28、または例34~例40のいずれか1例に記載の方法であって、プレゼンテーション攻撃は、権限のないアクタが、権限のあるユーザの写真を提示すること、権限のないアクタが、権限のあるユーザのデジタル画像を表示するデバイスを提示すること、または権限のないアクタが、権限のあるユーザを表すマスクを装着することを含む。
【0207】
例42:装置は、例34~41の方法のうちのいずれか1つの方法を実行するように構成されている超音波センサを備える。
【0208】
例43:例42に記載の装置であって、装置は、スマートフォンを含み、超音波センサは、スマートフォン内に集積されており、超音波センサの少なくとも2つのトランスデューサは、スマートフォンの第1のマイクと、スマートフォンの第2のマイクとを備える。
【0209】
例44:例43に記載の装置であって、第1のマイクおよび第2のマイクは、スマートフォンの反対の端部に位置決めされている。
【0210】
例45:例42~例44のいずれか1例に記載の装置であって、少なくとも2つのトランスデューサ間の距離は、超音波送信信号と関連している波長よりも大きい。
【0211】
例46:コンピュータ可読記憶媒体は、プロセッサによって実行されると、超音波センサに、例34~例41の方法のうちのいずれか1つの方法を実行させる命令を含む。
図1
図2-1】
図2-2】
図2-3】
図3
図4-1】
図4-2】
図5
図6
図7
図8-1】
図8-2】
図9-1】
図9-2】
図10-1】
図10-2】
図10-3】
図10-4】
図11-1】
図11-2】
図11-3】
図12-1】
図12-2】
図12-3】
図13
図14
図15
図16
【手続補正書】
【提出日】2024-07-05
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
超音波センサによって実行される方法であって、
超音波送信信号を送信することと、
前記超音波センサの少なくとも2つのトランスデューサを使用して少なくとも2つの超音波受信信号を受信することとを含み、前記少なくとも2つの超音波受信信号は、物体によって反射された前記超音波送信信号のそれぞれのバージョンを含み、
前記方法は、前記少なくとも2つの超音波受信信号に基づいてパワースペクトルを生成することをさらに含み、前記パワースペクトルは、周波数のセットおよび時間間隔にわたる前記少なくとも2つの超音波受信信号のパワーを表し、
前記方法は、経時的な前記パワースペクトル内の前記パワーの分散を判定することをさらに含み、前記分散は、前記少なくとも2つの超音波受信信号とそれぞれ関連しており、
前記方法は、前記分散に基づいてプレゼンテーション攻撃を検出することをさらに含み、前記プレゼンテーション攻撃は、顔認証システムをだますことを試行しており、前記物体は、前記プレゼンテーション攻撃と関連付けられており、
前記方法は、前記顔認証システムが前記プレゼンテーション攻撃を認証することを防止することをさらに含む、方法。
【請求項2】
前記パワースペクトルを生成することは、
前記少なくとも2つの超音波受信信号に基づいて複素数データを生成することと、
前記パワースペクトルを生成するためにフーリエ変換を実行することとを含む、請求項1に記載の方法。
【請求項3】
前記複素数データは、
レンジプロファイルデータ、
レンジスロータイムデータ、または
インターフェログラムを含む、請求項2に記載の方法。
【請求項4】
前記プレゼンテーション攻撃を検出することは、
前記分散が値のセット内にあるかどうかを判定することと、
前記分散の少なくとも1つが前記値のセット外にあることに応答して、前記プレゼンテーション攻撃を検出することとを含む、請求項1~請求項3のいずれか1項に記載の方法。
【請求項5】
前記プレゼンテーション攻撃を検出することは、
他の超音波送信信号を送信することと、
少なくとも2つの他の超音波受信信号を受信することとを含み、前記少なくとも2つの他の超音波受信信号は、人間の顔によって反射された前記他の超音波送信信号のバージョンを含み、
前記少なくとも2つの他の超音波受信信号に基づいて他のパワースペクトルを生成することを含み、前記他のパワースペクトルは、前記周波数のセットおよび他の時間間隔にわたる前記少なくとも2つの他の超音波受信信号のパワーを表し、
経時的な前記他のパワースペクトル内の前記パワーの他の分散を判定することを含み、前記他の分散は、前記少なくとも2つの超音波受信信号とそれぞれ関連しており、
前記他の分散が前記値のセット内にあることに応答して、前記顔認証システムが、前記人間の顔を認証することを可能にすることを含む、請求項4に記載の方法。
【請求項6】
前記人間の顔は、付属品を装着している、請求項5に記載の方法。
【請求項7】
前記パワースペクトルは、
前記少なくとも2つの超音波受信信号のうちの第1の超音波受信信号と関連する第1のパワースペクトルと、
前記少なくとも2つの超音波受信信号のうちの第2の超音波受信信号と関連する第2のパワースペクトルとを含み、
前記分散を判定することは、
スライディングウィンドウを使用して、前記第1のパワースペクトルのサブフレームの第1のセットを生成することを含み、前記サブフレームの第1のセットのサブフレームは、前記時間間隔の異なる部分と関連しており、
前記サブフレームの第1のセットにわたる第1の標準偏差を計算することと、
前記スライディングウィンドウを使用して、前記第2のパワースペクトルのサブフレームの第2のセットを生成することとを含み、前記サブフレームの第2のセットのサブフレームは、前記時間間隔の前記異なる部分と関連しており、
前記サブフレームの第2のセットにわたる第2の標準偏差を計算することを含む、請求項1~請求項6のいずれか1項に記載の方法。
【請求項8】
前記プレゼンテーション攻撃は、
権限のないアクタが、権限のあるユーザの写真を提示すること、
前記権限のないアクタが、前記権限のあるユーザのデジタル画像を表示するデバイスを提示すること、または
前記権限のないアクタが、前記権限のあるユーザを表すマスクを装着することを含む、請求項1~請求項7のいずれか1項に記載の方法。
【請求項9】
請求項1~請求項8に記載の方法のうちのいずれか1つの方法を実行するように構成されている超音波センサを備える装置。
【請求項10】
前記装置は、スマートフォンを含み、
前記超音波センサは、前記スマートフォン内に集積されており、
前記超音波センサの前記少なくとも2つのトランスデューサは、
前記スマートフォンの第1のマイクと、
前記スマートフォンの第2のマイクとを備える、請求項9に記載の装置。
【請求項11】
前記第1のマイクおよび前記第2のマイクは、前記スマートフォンの反対の端部に位置決めされている、請求項10に記載の装置。
【請求項12】
前記少なくとも2つのトランスデューサ間の距離は、前記超音波送信信号と関連している波長よりも大きい、請求項9~請求項11のいずれか1項に記載の装置。
【請求項13】
プロセッサによって実行されると、超音波センサに、請求項1~請求項8に記載の方法のうちのいずれか1つの方法を実行させる命令を含むプログラム
【国際調査報告】