(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-15
(45)【発行日】2024-02-26
(54)【発明の名称】ヘッドマウント情報処理装置、認証システムおよび認証方法
(51)【国際特許分類】
G06F 21/32 20130101AFI20240216BHJP
A61B 5/1171 20160101ALI20240216BHJP
A61B 5/0536 20210101ALI20240216BHJP
【FI】
G06F21/32
A61B5/1171
A61B5/0536
(21)【出願番号】P 2022550316
(86)(22)【出願日】2020-09-18
(86)【国際出願番号】 JP2020035610
(87)【国際公開番号】W WO2022059200
(87)【国際公開日】2022-03-24
【審査請求日】2023-01-12
(73)【特許権者】
【識別番号】000005810
【氏名又は名称】マクセル株式会社
(74)【代理人】
【識別番号】110002066
【氏名又は名称】弁理士法人筒井国際特許事務所
(72)【発明者】
【氏名】中出 眞弓
(72)【発明者】
【氏名】ウォーカー,ニコラス サイモン
(72)【発明者】
【氏名】ヴァンデンバーグ,ジャンジャスパー
(72)【発明者】
【氏名】橋本 康宣
(72)【発明者】
【氏名】川前 治
【審査官】田名網 忠雄
(56)【参考文献】
【文献】特開2020-135387(JP,A)
【文献】米国特許出願公開第2019/0005216(US,A1)
【文献】特表2008-518316(JP,A)
【文献】特開2016-007411(JP,A)
【文献】米国特許出願公開第2015/0199580(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 21/32
A61B 5/1171
A61B 5/0536
(57)【特許請求の範囲】
【請求項1】
ユーザの頭部に装着された状態で前記ユーザに各種情報を視覚または聴覚を介して提供するヘッドマウント情報処理装置であって、
画像を表示するディスプレイと、
前記ユーザの声を集音し、音声データ信号を出力するマイクと、
前記ユーザの頭部の断層データを取得する生体認証センサと、
前記ヘッドマウント情報処理装置を制御するコントローラと、
を有し、
前記コントローラは、前記ユーザがパスコードを発声している認証期間で前記生体認証センサによって取得された前記断層データに基づいて前記ユーザを認証する、
ヘッドマウント情報処理装置。
【請求項2】
請求項1記載のヘッドマウント情報処理装置において、
前記生体認証センサは、前記頭部内の電気インピーダンスの分布を前記断層データとして取得するための複数の電極を備える、
ヘッドマウント情報処理装置。
【請求項3】
請求項1記載のヘッドマウント情報処理装置において、
前記生体認証センサは、前記頭部内の音響干渉パターンを前記断層データとして取得するための複数の超音波トランスデューサを備える、
ヘッドマウント情報処理装置。
【請求項4】
請求項1記載のヘッドマウント情報処理装置において、
前記コントローラは、前記断層データから特徴量を抽出し、前記特徴量のデータに基づいて前記ユーザを認証する、
ヘッドマウント情報処理装置。
【請求項5】
請求項1記載のヘッドマウント情報処理装置において、
前記コントローラは、前記ディスプレイに前記パスコードを表示させたのち、前記音声データ信号から前記ユーザが発声した前記パスコードを音声認識することで前記認証期間を検出する、
ヘッドマウント情報処理装置。
【請求項6】
請求項1記載のヘッドマウント情報処理装置において、
前記コントローラは、前記認証期間の前記音声データ信号に基づく声紋認証の結果と、前記断層データとに基づいて前記ユーザを認証する、
ヘッドマウント情報処理装置。
【請求項7】
ユーザの頭部に装着された状態で前記ユーザに各種情報を視覚または聴覚を介して提供するヘッドマウント情報処理装置と、
認証サーバと、
を有する認証システムであって、
前記ヘッドマウント情報処理装置は、
画像を表示するディスプレイと、
前記ユーザの声を集音し、音声データ信号を出力するマイクと、
前記ユーザの頭部の断層データを取得する生体認証センサと、
前記ヘッドマウント情報処理装置を制御するコントローラと、
前記認証サーバと無線通信を行う無線通信インタフェースと、
を有し、
前記コントローラは、前記ユーザがパスコードを発声している認証期間で前記生体認証センサによって取得された前記断層データを、前記無線通信インタフェースを介して前記認証サーバへ送信し、
前記認証サーバは、前記断層データと予め記憶した前記ユーザの登録データとを照合し、照合によって得られる認証結果を前記ヘッドマウント情報処理装置へ送信する、
認証システム。
【請求項8】
請求項7記載の認証システムにおいて、
前記生体認証センサは、前記頭部内の電気インピーダンスの分布を前記断層データとして取得するための複数の電極を備える、
認証システム。
【請求項9】
請求項7記載の認証システムにおいて、
前記生体認証センサは、前記頭部内の音響干渉パターンを前記断層データとして取得するための複数の超音波トランスデューサを備える、
認証システム。
【請求項10】
請求項7記載の認証システムにおいて、
前記コントローラは、前記断層データから特徴量を抽出し、前記特徴量のデータを前記無線通信インタフェースを介して前記認証サーバへ送信する、
認証システム。
【請求項11】
請求項7記載の認証システムにおいて、
前記認証サーバは、前記パスコードを前記ヘッドマウント情報処理装置へ送信し、
前記コントローラは、前記認証サーバからの前記パスコードを前記ディスプレイに表示させたのち、前記音声データ信号から前記ユーザが発声した前記パスコードを音声認識することで前記認証期間を検出する、
認証システム。
【請求項12】
請求項11記載の認証システムにおいて、
前記コントローラは、前記認証期間での前記音声データ信号と、前記断層データとを前記無線通信インタフェースを介して前記認証サーバへ送信し、
前記認証サーバは、前記音声データ信号に基づく声紋認証と、前記断層データと前記登録データとの照合とを行う、
認証システム。
【請求項13】
ユーザの頭部に装着された状態で前記ユーザに各種情報を視覚または聴覚を介して提供するヘッドマウント情報処理装置を用いて、前記ユーザを認証する認証方法であって、
前記ヘッドマウント情報処理装置は、画像を表示するディスプレイと、前記ユーザの声を集音し、音声データ信号を出力するマイクと、前記ユーザの頭部の断層データを取得する生体認証センサと、を有し、
前記認証方法は、
前記ユーザがパスコードを発声している認証期間で、前記生体認証センサが前記断層データを取得する第1のステップと、
前記第1のステップで取得された前記断層データに基づいて前記ユーザを認証する第2のステップと、
を有する、
認証方法。
【請求項14】
請求項13記載の認証方法において、
前記生体認証センサは、前記頭部内の電気インピーダンスの分布を前記断層データとして取得するための複数の電極を備える、
認証方法。
【請求項15】
請求項13記載の認証方法において、
前記生体認証センサは、前記頭部内の音響干渉パターンを前記断層データとして取得するための複数の超音波トランスデューサを備える、
認証方法。
【請求項16】
請求項13記載の認証方法において、
前記第2のステップは、前記断層データと予め記憶した前記ユーザの登録データとを照合するステップを含む、
認証方法。
【請求項17】
請求項13記載の認証方法において、
前記第2のステップは、前記断層データから特徴量を抽出するステップを含む、
認証方法。
【請求項18】
請求項13記載の認証方法において、さらに、
前記第1のステップに先立って行われ、前記ディスプレイが前記パスコードを表示する第3のステップと、
前記第3のステップの後に行われ、前記音声データ信号から前記ユーザが発声した前記パスコードを音声認識することで前記認証期間を検出する第4のステップと、
を有する、
認証方法。
【請求項19】
請求項18記載の認証方法において、
さらに、前記認証期間での前記音声データ信号に基づいて声紋認証を行う第5のステップを有する、
認証方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ヘッドマウント情報処理装置、認証システムおよび認証方法に関し、例えば、ヘッドマウント情報処理装置のユーザを認証する技術に関する。
【背景技術】
【0002】
特許文献1には、個人認証の精度を向上させることが可能な個人認証装置が示される。具体的には、当該個人認証装置は、顔認証を行う画像認証部と、声認証を行う音声認証部と、キーワード又はID番号を認証するID認証部と、指紋認証を行う指紋認証部とを有し、各認証部の何れかを2つ以上組み合わせて個人認証を行う。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ヘッドマウント情報処理装置は、HMD(Head Mounted Display)とも呼ばれ、ユーザの頭部に装着された状態でディスプレイに拡張現実(AR)の情報や仮想現実(VR)の情報を表示することができる。例えば、このようなHMDを使用して何らかの業務を行う場合、HMDを介して得られる各種機密情報の漏洩を防止するため、HMDを使用するユーザが正規のユーザであることを認証することが求められる。
【0005】
一方、近年では、AI(Artificial Intelligence)の発展に伴い、ディープフェイクと呼ばれる技術が問題視されている。ディープフェイク技術を用いると、例えば、悪意のあるユーザが、正規のユーザの声になりすますようなことも可能になり得る。その結果、例えば、HMDを装着した悪意のあるユーザが、正規のユーザになりすまして声認証を成功させるようなことも可能となる。
【0006】
そこで、特許文献1に示されるように、種類が異なる複数の認証方式を組み合わせることが考えられる。しかし、認証方式を多く組み合わせるほど、処理の煩雑化や、コストの増大を招く恐れがある。また、特許文献1に示されるような個々の認証方式は、単独ではなりすましを十分に防止できない恐れがあるため、仮に複数の認証方式を組み合わせたとしても、十分なセキュリティを確保できるとは限らない。さらに、例えば、指紋認証等のように、HMDへの適用に際して不向きとなる認証方式も存在する。
【0007】
本発明は、このようなことに鑑みてなされたものであり、その目的の一つは、セキュリティの向上を実現可能なヘッドマウント情報処理装置、認証システムおよび認証方法を提供することにある。
【0008】
本発明の前記ならびにその他の目的と新規な特徴については、本明細書の記述および添付図面から明らかになるであろう。
【課題を解決するための手段】
【0009】
本発明の一実施の態様では、ユーザの頭部に装着された状態でユーザに各種情報を視覚または聴覚を介して提供するヘッドマウント情報処理装置を設け、ヘッドマウント情報処理装置は、画像を表示するディスプレイと、ユーザの声を集音し、音声データ信号を出力するマイクと、ユーザの頭部の断層データを取得する生体認証センサと、ヘッドマウント情報処理装置を制御するコントローラと、を有し、コントローラは、ユーザがパスコードを発声している認証期間で生体認証センサによって取得された断層データに基づいてユーザを認証する、ように構成されればよい。
【発明の効果】
【0010】
本願において開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば、セキュリティの向上が実現可能になる。
【図面の簡単な説明】
【0011】
【
図1】本発明の実施の形態1による認証システムにおいて、主要部の構成例を示す概略図である。
【
図2】(a)および(b)は、
図1における生体認証センサのそれぞれ異なる構成例を示す概略図である。
【
図3】
図1におけるヘッドマウント情報処理装置の詳細な構成例を示すブロック図である。
【
図4】
図1の認証システムおよび
図3のヘッドマウント情報処理装置を用いた認証方法の一例を示すフロー図である。
【
図5】
図4における一部の処理内容を説明する補足図である。
【
図6】
図4における一部の処理内容を説明する補足図である。
【
図7】
図1における認証サーバの主要部の構成例を示すブロック図である。
【
図8】本発明の実施の形態2による認証方法において、
図1の認証システムを会議システムに適用した場合の処理内容の一例を示すシーケンス図である。
【
図9】本発明の実施の形態2による認証システムにおいて、会議システムへ適用した場合の構成例を示す概略図である。
【
図10】
図9の会議システム(認証システム)における処理内容の一例を示すシーケンス図である。
【
図11】本発明の実施の形態3による認証システムにおいて、ショッピングシステムへ適用した場合の主要部の構成例および動作例を示す概略図である。
【発明を実施するための形態】
【0012】
以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一の部材には原則として同一の符号を付し、その繰り返しの説明は省略する。
【0013】
(実施の形態1)
《認証システムの概略》
図1は、本発明の実施の形態1による認証システムにおいて、主要部の構成例を示す概略図である。
図1に示す認証システム10は、ヘッドマウント情報処理装置(明細書ではHMDと略す)1と、無線ルータ11と、通信ネットワーク12と、認証サーバ13と、記憶装置14とを備える。HMD1は、ユーザ5の頭部に装着された状態でユーザ5に各種情報を視覚または聴覚を介して提供する装置である。通信ネットワーク12は、インターネットまたはイーサネット(登録商標)等である。
【0014】
無線ルータ11は、通信ネットワーク12に接続され、HMD1と無線通信を行うことで通信ネットワーク12を介して行われるHMD1の通信を中継する。認証サーバ13は、通信ネットワーク12に接続され、認証に伴う所定の処理を行う。記憶装置14は、認証で必要される各種登録データを記憶する。記憶装置14は、認証サーバ13内に設けられてもよい。
【0015】
ここで、HMD1は、ディスプレイ45と、生体認証センサ30とを備える。ディスプレイ45は、所定の画像を表示する。生体認証センサ30は、詳細は後述するが、ユーザ5の頭部の断層データを取得する。生体認証センサ30は、ユーザ5の頭部と、HMD1とが接触する複数の箇所にそれぞれ設置される。この例では、HMD1は、眼鏡型の形状となっている。この場合、生体認証センサ30は、例えば、耳の裏側に接触するモダン部や、鼻に接触するパッド部等に設置される。ただし、HMD1は、例えば、ゴーグル型等を代表に様々な形状が知られている。生体認証センサ30の設置位置や設置数は、このHMD1の形状に応じて適宜定められればよい。
【0016】
《生体認証センサの概略》
図2(a)および
図2(b)は、
図1における生体認証センサのそれぞれ異なる構成例を示す概略図である。
図2(a)における生体認証センサ30は、電気インピーダンストモグラフィ(EIT:Electrical Impedance Tomography)の技術を利用して、頭部16内の電気インピーダンスの分布を断層データとして取得するための複数の電極17を備える。電気インピーダンストモグラフィは、体内の電気インピーダンス(導電率)を測定することで、体内の断層データ(ここでは頭部16の断層データ)を可視化する技術である。
【0017】
具体的には、
図2(a)に示されるように、それぞれ異なる位置に設置された複数の電極17の中の2個の電極を電極対として、電極対のいずれか一つが信号源であるエミッタに定められ、残りの電極対がレシーバに定められる。エミッタは、数十kHz~数百kHzレベルの微弱(例えばmAレベル)な交流電流i
acを発生し、各レシーバ(この例では1個)は、当該交流電流i
acに応じた電圧(V)を測定する。そして、このような処理をエミッタおよびレシーバの位置関係を順次変えながら行うことで、複数の電極17で囲まれる頭部16内の電気インピーダンスの分布(すなわち断層データ)を可視化することが可能になる。
【0018】
図2(b)における生体認証センサ30は、音響インターフェロメトリーの技術を利用して、頭部16内の音響干渉パターンを断層データとして取得するための複数の超音波トランスデューサ18を備える。音響インターフェロメトリーは、圧電素子である超音波トランスデューサ18を用いて体内の音響干渉パターンを作成することで、体内の断層データ(ここでは頭部16の断層データ)を可視化する技術である。
【0019】
具体的には、
図2(b)に示されるように、それぞれ異なる位置に設置された複数の超音波トランスデューサ18の中の単数または複数(この例では単数)の超音波トランスデューサ18が信号源であるエミッタに定められ、残りの超音波トランスデューサ18がレシーバに定められる。エミッタは、例えば、数十kHz等のパルス信号で駆動されることで頭部16内へ超音波信号を放射し、各レシーバは、当該超音波信号に応じた頭部16内からの音響信号を受信する。そして、このような処理をエミッタおよびレシーバの位置関係を順次変えながら行うことで、複数の超音波トランスデューサ18で囲まれる頭部16内の音響干渉パターン(すなわち断層データ)を可視化することが可能になる。
【0020】
例えば、電気インピーダンストモグラフィ(EIT)による断層データは、通常、医療目的等で用いられる。この場合、例えば、内部の詳細な位置を特定可能な断層データを得るため、多くの電極17を規則的に配置する必要がある。一方、実施の形態では、生体認証センサ30からの断層データは、認証時に個人を特定するために用いられる。このような場合、電極17の配置は、特に規則的である必要はなく、電極17の数も、個人を識別できる程度の数だけ設ければよい。
【0021】
《ヘッドマウント情報処理装置(HMD)の詳細》
図3は、
図1におけるヘッドマウント情報処理装置の詳細な構成例を示すブロック図である。
図3のHMD1は、互いにバスBSで接続された各種ユニットを有する。
図3のHMD1は、制御系の各種ユニットとして、メインプロセッサ(コントローラ)20と、RAM(Random access memory)21と、ROM(Read Only Memory)22と、フラッシュメモリ23とを有する。
【0022】
メインプロセッサ(コントローラ)20は、例えば、単数または複数のCPU(Central Processing Unit)またはGPU(Graphics Processing Unit)等で構成される。ROM22やフラッシュメモリ23は、メインプロセッサ20のプログラムや、各種パラメータデータ等を記憶する。メインプロセッサ20は、当該プログラムを実行することで、HMD1全体をバスBSを介して制御する。RAM21は、例えば、メインプロセッサ20のプログラム処理に伴うワーク用のメモリとして用いられる。
【0023】
HMD1は、センサ系の各種ユニットとして、前述した生体認証センサ30と、GPS(Global Positioning System)受信機31と、地磁気センサ32と、距離センサ33と、加速度センサ34と、ジャイロセンサ35とを備える。GPS受信機31は、GPS衛星からの電波に基づいてHMD1の位置を検知する。地磁気センサ32は、地球の磁力を検知することで、HMD1の向いている方向を検知する。距離センサ33は、例えば、レーザ光等を対象物へ照射し、ToF(Time of Flight)によって対象物との距離を検知する。加速度センサ34は、HMD1の3軸方向の加速度を検知することで、HMD1の動き・振動・衝撃などを検知する。ジャイロセンサ35は、HMD1の3軸周りの角速度を検知することで、HMD1の縦・横・斜めの姿勢を検知する。
【0024】
HMD1は、通信系の各種ユニットとして、無線通信インタフェース40と、電話網通信インタフェース41とを備える。無線通信インタフェース40は、代表的には、IEEE802.11に基づく無線LAN等である。無線通信インタフェース40は、例えば、
図1の無線ルータ11および通信ネットワーク12を介いて認証サーバ13と無線通信を行う。電話網通信インタフェース41は、例えば、4G(4th Generation)や5G(5th Generation)等の規格に基づくインタフェースであり、基地局と無線通信を行う。HMD1は、例えば、無線LANの電波が届かないような場合、電話網通信インタフェース41を介して認証サーバ13と無線通信を行うことも可能である。
【0025】
HMD1は、視覚系の各種ユニットとして、ディスプレイ45と、インカメラ46と、アウトカメラ47とを有する。ディスプレイ45は、例えば、液晶パネル等であり、ARまたはVRの画像等を代表に、所定の画像を表示する。インカメラ46が、HMD1の内部側(例えばユーザ5自身)の画像を撮像する。アウトカメラ47は、HMD1の外部側の画像を撮像する。
【0026】
HMD1は、聴覚系の各種ユニットとして、マイク50と、スピーカ51と、オーディオデコーダ52とを備える。マイク50は、ユーザ5の声を集音し、音声データ信号を出力する。スピーカ51は、HMD1内部で生成した音声データ信号を音声(音波)に変換してユーザ5へ放音する。オーディオデコーダ52は、例えば、符号化された音声データ信号を復号化する処理等を行う。
【0027】
HMD1は、ユーザインタフェースを担う各種ユニットとして、ボタンスイッチ55と、タッチパネル56とを備える。ボタンスイッチ55は、例えば、ディスプレイ45に表示されたVR画面上またはAR画面上で各種操作を行うためのリモコンスイッチ等である。タッチパネル56は、例えば、ディスプレイ45上にVRまたはARによってタッチパネル画面を構築し、アウトカメラ47等で手の動きを検知することでユーザ5に所定の操作を行わせる。
【0028】
ここで、詳細は後述するが、メインプロセッサ(コントローラ)20は、ユーザ5がパスコードを発声している認証期間で生体認証センサ30に断層データを取得させる。そして、メインプロセッサ(コントローラ)20は、当該断層データに基づいてユーザ5を認証する。なお、HMD1は、前述したような各種ユニットの他に、様々なユニットを備えてよい。
【0029】
《認証方法の詳細》
図4は、
図1の認証システムおよび
図3のヘッドマウント情報処理装置を用いた認証方法の一例を示すフロー図である。
図5および
図6は、
図4における一部の処理内容を説明する補足図である。
図4において、まず、HMD1のメインプロセッサ(コントローラ)20は、ディスプレイ45にパスコードを表示させる(ステップS101)。
図5の例では、ディスプレイ45上に、パスコードPCDの一例である“そらまめ”が表示されている。
【0030】
続いて、メインプロセッサ(コントローラ)20は、マイク50を用いた音声データ信号の記録(例えば、RAM21への保存)と、生体認証センサ30を用いた生体データ信号の取得および記録とを開始する(ステップS102)。一方、ステップS102の後、ユーザ5は、ステップS101で表示されたパスコードPCD(“そらまめ”)を発声する。これに伴い、メインプロセッサ(コントローラ)20は、マイク50から出力されRAM21等に記録された音声データ信号から、ユーザ5が発声したパスコードPCDを音声認識する(ステップS103)。
【0031】
図6には、時間的に変化するマイク50からの音声データ信号ADSおよび生体認証センサ30からの生体データ信号BDSと、生体データ信号BDSから得られる断層画像データTIDとが示される。
図6に示される各波形等は、説明に際しての便宜上のものであり、実際のものとは異なる。生体データ信号BDSは、
図2(a)または
図2(b)で述べた各レシーバによって取得される信号である。ここで、生体データ信号BDSは、ユーザ5の頭部構造とユーザ5の発音状態との組み合わせに応じて適宜変化すると考えられる。そこで、メインプロセッサ(コントローラ)20は、まず、ユーザ5が発声したパスコードPCDを音声認識することで、ユーザ5がパスコードPCDを発声している期間を認証期間T1として検出する。
【0032】
また、メインプロセッサ(コントローラ)20は、認証期間T1で生体認証センサ30によって取得された生体データ信号BDSを、所定のアルゴリズムを用いて画像化する。これによって、メインプロセッサ(コントローラ)20は、時間的に変化する断層画像データTIDを作成する。断層画像データTIDは、
図2(a)または
図2(b)で述べたように、例えば、頭部16内の電気インピーダンスの分布や、頭部16内の音響干渉パターンを表す二次元画像データである。明細書では、この断層画像データTID、または、断層画像データTIDの基となる生体データ信号BDSを断層データTDと呼ぶ。
【0033】
図4に戻り、ステップS104において、例えば、認証サーバ13は、HMD1から
図6に示したような認証期間T1での音声データ信号ADS(パスコード音声)を受信する。そして、認証サーバ13は、このパスコード音声に基づいて声紋認証を行う。声紋認証では、一般的に知られているように、音声データ信号ADSのスペクトログラム(時間、周波数、信号成分の強さの関係)が作成される。そして、作成されたスペクトログラムと、予め正規のユーザによって登録されている声紋データとの類似度に基づいて認証の成否が判定される。
【0034】
続いて、ステップS105において、メインプロセッサ(コントローラ)20または認証サーバ13は、
図6に示したように、認証期間T1での生体データ信号BDSに基づいて断層画像データTIDを作成する。認証サーバ13が断画像層データTIDを作成する場合、認証サーバ13は、HMD1から生体データ信号BDSを受信すればよい。
【0035】
その後、ステップS106において、認証サーバ13は、ステップS105で作成された断層画像データTIDに基づいて認証判定を行う。すなわち、認証サーバ13は、断層画像データTID(断層データTD)と予め記憶装置14に記憶したユーザ5の登録データとを照合し、照合によって得られる認証結果をHMD1へ送信する。HMD1は、ステップS106での認証結果(ひいては断層データTD)と、ステップS104での声紋認証の結果とに基づいてユーザ5を認証する。
【0036】
図7は、
図1における認証サーバの主要部の構成例を示すブロック図である。
図7の認証サーバ13は、特徴量抽出器60と、照合器61とを備える。特徴量抽出器60は、断層画像データTIDまたは予め記憶装置14に記憶したユーザ5の登録データRDを入力として、例えば、学習済みのディープラーニングモデル等を用いてそれぞれ特徴量を抽出する。抽出した特徴量は、例えば、ある特徴Aの強さがxx、別の特徴Bの強さがyy、…といった内容を含んだ特徴量ベクトルの形で出力される。
【0037】
照合器61は、断層画像データTIDの特徴量ベクトルと、登録データRDの特徴量ベクトルとを照合することで類似度を算出する。そして、照合器61は、当該算出した類似度に基づいて認証結果を定める。例えば、照合器61は、類似度が予め定めた閾値以上の場合には、認証結果を認証成功に定め、類似度が当該閾値未満の場合には、認証結果を認証失敗に定める。ただし、この照合後の認証成否の判定は、HMD1が行ってもよい。この場合、認証サーバ13は、算出した類似度を認証結果に定めればよい。
【0038】
なお、
図4のステップS104およびステップS106での各処理に関しては、全ての処理をHMD1が実行してもよく、適宜振り分けられた処理をHMD1および認証サーバ13が実行してもよい。例えば、ステップS104では、認証サーバ13の代わりにメインプロセッサ(コントローラ)20が、ROM22またはフラッシュメモリ23に予め登録した正規のユーザの声紋データに基づいて声紋認証を行ってもよい。
【0039】
また、ステップS106では、認証サーバ13の代わりにメインプロセッサ(コントローラ)20が、断層画像データTIDから特徴量を抽出してもよい。すなわち、
図7に示したような特徴量抽出器60(すなわち、学習済みのディープラーニングモデル等)を、メインプロセッサ(コントローラ)20に搭載してもよい。この場合、HMD1は、特徴量抽出器60からの断層画像データTIDの特徴量ベクトルを認証サーバ13へ送信する。そして、認証サーバ13は、記憶装置14に予め登録データRDの特徴量ベクトルを記憶しておき、登録データRDの特徴量ベクトルと、HMD1からの断層画像データTIDの特徴量ベクトルとを照合すればよい。
【0040】
ただし、セキュリティ管理の観点や、HMDを複数のユーザ5で使用する場合の運用上の観点等から、声紋認証で用いられる声紋データや、生体認証センサ30での生体認証で用いられる登録データRDは、認証サーバ13で管理される方が望ましい場合が多い。したがって、このような観点では、認証サーバ13は、少なくとも
図7の照合器61(および声紋認証に対応する同様の照合器)を備えることが望ましい。
【0041】
また、パスコードPCDは、認証ごとに選択、あるいは生成される文字列である。パスコードPCDの生成がHMD1でなされる場合、HMD1は、特徴量ベクトルにパスコードPCDを加えて認証サーバ13へ送信する。
【0042】
《実施の形態1の主要な効果》
以上、実施の形態1の方式を用いることで、代表的にはHMDにおけるセキュリティを向上させることが可能になる。具体的には、ユーザ毎に異なり、かつ、ユーザの発音内容によっても異なり得る断層データTDに基づいて認証を行えるため、ディープフェイク技術によるなりすましを十分に防止できる。加えて、声紋認証を併用することで、なりすましをより強固に防止できる。また、その他の効果として、ユーザの頭部に装着されるHMDの使用形態に好適な認証方式が実現可能になる。すなわち、単に、HMD上の所定の箇所に生体認証センサ30を設置することで、堅牢な認証方式を得ることが可能になる。
【0043】
なお、この例では、認証期間T1における音声データ信号ADSおよび断層データTDに基づいて声紋認証および生体認証を行ったが、声紋認証を行わずに生体認証のみを行ってもよい。また、声紋認証および生体認証に加えて顔認証を行ってもよい。具体的には、HMD1は、インカメラ46でユーザ5の顔画像を撮像し、当該顔画像の撮像データまたは当該撮像データから抽出した特徴量を認証サーバ13へ送信することで、声紋認証および生体認証に加えた更なる認証を行ってもよい。
【0044】
(実施の形態2)
《会議システムへの適用例[1]》
図8は、本発明の実施の形態2による認証方法において、
図1の認証システムを会議システムに適用した場合の処理内容の一例を示すシーケンス図である。ここでは、
図1のユーザ5がヘッドマウント情報処理装置(HMD)1を用いた遠隔会議に参加するような場合を想定する。
【0045】
図8において、まず、HMD1は、会議サーバ13aへ会議参加要求(言い換えれば認証要求)を送信する(ステップS201)。会議参加要求には、ユーザ5の識別子や、会議の識別子等が含まれる。また、会議サーバ13aは、
図1の認証サーバ13の機能も備えている。続いて、会議サーバ13aは、ステップS201での会議参加要求に応じて、予め登録された会議情報に基づいてユーザ5が会議に参加する資格があることを確認する(ステップS202)。その後、会議サーバ13aは、HMD1へ認証開始命令と、パスコードとを送信する(ステップS203)。
【0046】
次いで、HMD1は、ステップS203で受信したパスコードをディスプレイ45に表示する(ステップS204)。続いて、HMD1は、
図4のステップS102,S103の場合と同様に、音声データ信号ADSの記録および生体データ信号BDSの取得を開始し(ステップS205)、音声データ信号ADSからパスコードを音声認識する(ステップS206)。
【0047】
その後、HMD1は、ステップS206での認識結果に基づいて、音声データ信号ADSおよび生体データ信号BDS(断層データTD)の抽出処理を行う(ステップS207)。具体的には、HMD1は、
図6で述べたような認証期間T1を定める。これに加えて、HMD1は、生体データ信号BDSから断層画像データTIDを作成する処理を行ってもよい。その後、HMD1は、ステップS207で抽出した音声データ信号ADS(すなわちパスコード音声データ)と、断層データTD(生体データ信号BDSまたは断層画像データTID)とを会議サーバ13aへ送信する(ステップS208)。
【0048】
続いて、会議サーバ13aは、ステップS208で受信したパスコード音声データに基づいて声紋認証を行う(ステップS209)。会議サーバ13aは、声紋認証の結果が失敗の場合には、ステップS210の処理を経ることなく、認証結果を認証失敗に定める。一方、声紋認証の結果が成功の場合、会議サーバ13aは、ステップS208で受信した断層データTDに基づいて生体認証を行う(ステップS210)。そして、会議サーバ13aは、生体認証の結果が成功の場合には認証結果を認証成功に定め、生体認証の結果が失敗の場合には認証結果を認証失敗に定める。
【0049】
ここで、ステップS210の処理に際し、会議サーバ13aは、ステップS208で受信した断層データTDが生体データ信号BDSである場合には、断層画像データTIDを作成したのち、当該断層画像データTIDの特徴量を抽出し、当該特徴量に基づいて認証成否を判定する。一方、会議サーバ13aは、ステップS208で受信した断層データTDが断層画像データTIDである場合には、当該断層画像データTIDの特徴量を抽出し、当該特徴量に基づいて認証成否を判定する。
【0050】
続いて、ステップS211において、会議サーバ13aは、ステップS209,S210で定めた認証結果をHMD1へ送信する。HMD1は、ステップS211で受信した認証結果が認証成功の場合には、会議に参加する処理を実行し、認証失敗の場合には、会議に参加せずに処理を終了する(ステップS212)。
【0051】
なお、ステップS203でのパスコードは、例えば、チャレンジレスポンス方式の認証を行うためのパスコードである。この場合、会議サーバ13aは、例えば、複数のパスコード毎や一文字毎の声紋データおよび登録データRDを予め記憶装置14に記憶しておく。そして、会議サーバ13aは、ステップS203において、複数のパスコードのいずれかをランダムに選択し、ステップS209,S210において、選択したパスコードに対応する声紋データおよび登録データRDを用いて認証を行えばよい。これにより、セキュリティをより向上させることが可能になる。さらに、ステップS208で送信される断層データTDは、実施の形態1でも述べたように、断層画像データTIDから抽出した特徴量ベクトルであってもよい。
【0052】
《会議システムへの適用例[2]》
図9は、本発明の実施の形態2による認証システムにおいて、会議システムへ適用した場合の構成例を示す概略図である。
図9に示す会議システム(認証システム)10aは、
図1の場合と同様の通信ネットワーク12および会議サーバ(認証サーバ)13aに加えて、複数のヘッドマウント情報処理装置(HMD)1a,1bと、複数の無線ルータ11a,11bとを備える。HMD1a,1bは、それぞれ、複数のユーザ5a,5bによって装着される。無線ルータ11a,11bは、それぞれ、HMD1a,1bと無線通信を行うことで通信ネットワーク12を介して行われるHMD1a,1bの通信を中継する。
【0053】
図10は、
図9の会議システム(認証システム)における処理内容の一例を示すシーケンス図である。ここでは、
図8の場合と異なり、遠隔会議に参加しているユーザ5bが遠隔会議に参加しているユーザ5aの参加資格を再確認したいような場合を想定する。すなわち、例えば、遠隔会議中にユーザ5aが入れ替わったと疑われるような場合を想定する。
【0054】
図10において、まず、HMD1bは、ユーザ5bに対して、再認証を行わせたいユーザ5aを選択させる(ステップS301)。続いて、HMD1bは、会議サーバ13aへ参加者認証要求を送信する(ステップS302)。参加者認証要求には、選択されたユーザ5aの識別子等が含まれる。次いで、会議サーバ13aは、ステップS303での参加者認証要求に応じて、予め登録された会議情報に基づいてユーザ5aが会議に参加する資格があることを確認する(ステップS303)。その後、会議サーバ13aは、HMD1aへ認証開始命令と、パスコードとを送信する(ステップS304)。
【0055】
続いて、HMD1aは、ステップS305~S309において、
図8のステップS204~S208の場合と同様の処理を行う。簡単に説明すると、HMD1aは、受信したパスコードをディスプレイ45に表示したのち(ステップS305)、音声データ信号ADSの記録および生体データ信号BDSの取得を開始する(ステップS306)。また、HMD1aは、音声データ信号ADSからパスコードを音声認識したのち(ステップS307)、音声データ信号ADSおよび生体データ信号BDS(断層データTD)の抽出処理を行う(ステップS308)。そして、HMD1aは、抽出した音声データ信号ADS(すなわちパスコード音声データ)と、断層データTD(生体データ信号BDSまたは断層画像データTID)とを会議サーバ13aへ送信する(ステップS309)。
【0056】
次いで、会議サーバ13aは、ステップS310,S311において、
図8のステップS209,S210の場合と同様の処理を行う。簡単に説明すると、会議サーバ13aは、受信したパスコード音声データに基づいて声紋認証を行い(ステップS310)、声紋認証の結果が成功の場合には、受信した断層データTDに基づいて生体認証を行う(ステップS311)。そして、会議サーバ13aは、声紋認証の結果と生体認証の結果の両方が成功の場合には認証結果を認証成功に定め、いずれか一方の結果が失敗の場合には認証結果を認証失敗に定める。
【0057】
続いて、ステップS312a,S312bにおいて、会議サーバ13aは、ステップS310,S311で定めた認証結果をHMD1a,1bへそれぞれ送信する。HMD1aは、ステップS312aで受信した認証結果が認証成功の場合には、会議への参加を継続する処理を行い、認証失敗の場合には、会議への参加を切断する処理を行う(ステップS313)。一方、HMD1bは、ステップS312bで受信した認証結果をディスプレイ45やスピーカ51等を介してユーザ5bへ通知する処理を行う(ステップS314)。
【0058】
《実施の形態2の主要な効果》
以上、実施の形態2の方式を用いることで、実施の形態1の場合と同様に、代表的にはHMDにおけるセキュリティを向上させることが可能になる。特に、悪意のあるユーザが遠隔会議へ参加することを防止できる。すなわち、悪意のあるユーザは、断層データTDに基づく生体認証が求められるため、ディープフェイク技術を用いたとしても、正規のユーザになりすますことは困難である。これらの結果、会議中にHMDを介して得られる各種機密情報の漏洩を防止することが可能になる。
【0059】
(実施の形態3)
《ショッピングシステムへの適用例》
図11は、本発明の実施の形態3による認証システムにおいて、ショッピングシステムへ適用した場合の主要部の構成例および動作例を示す概略図である。
図11に示すショッピングシステム(認証システム)10bは、HMD1と、決済サーバ(認証サーバ)13bと、通信ネットワーク12と、ショッピングサーバ65と、セルフレジ66とを備える。HMD1は、ユーザ(顧客)5によって装着される。
【0060】
決済サーバ13b、ショッピングサーバ65およびセルフレジ66は、互いに通信ネットワーク12を介して接続される。セルフレジ66は、HMD1と無線通信を行う無線通信機を備える。ショッピングサーバ65は、例えば、ショッピング会社のサーバであり、セルフレジ66の管理を含めてショッピングシステム10b全体を管理する。決済サーバ(認証サーバ)13bは、例えば、クレジットカード会社のサーバである。
【0061】
このような構成において、まず、ユーザ(顧客)5は、所望の買い物を行ったのち、セルフレジ66を用いてクレジット決済を開始する。これに応じて、セルフレジ66は、ショッピングサーバ65へ決済要求を送信する(ステップS401)。決済要求には、例えば、クレジットカードの番号や、パスコード等が含まれる。ショッピングサーバ65は、ステップS401での決済要求に応じて、決済サーバ13bへ、クレジットカードの番号やパスコード等を含んだ顧客認証要求を送信する(ステップS402)。
【0062】
決済サーバ13bは、ステップS402での顧客認証要求に応じて顧客を識別し、セルフレジ66へ、認証開始命令と別途生成したパスコード(この例では“あかさた”)とを送信する(ステップS403)。セルフレジ66は、ステップS403でのパスコードを画面上に表示する。一方、ユーザ5は、画面上に表示されたパスコードを発声する。これにより、HMD1は、
図8のステップS205~S207の場合と同様の処理を行ったのち、ステップS208の場合と同様に、パスコード音声データおよび断層データTDをセルフレジ66へ送信する。また、セルフレジ66は、受信したパスコード音声データおよび断層データTDを決済サーバ13bへ送信する(ステップS404)。
【0063】
次いで、決済サーバ13bは、
図8のステップS209,S210の場合と同様に、パスコード音声データに基づく声紋認証と、断層データTDに基づく生体認証とを行い、ステップS211の場合と同様に、認証結果をショッピングサーバ65へ送信する(ステップS405)。ショッピングサーバ65は、決済結果として、ステップS405で受信した認証結果が認証成功である場合には、セルフレジ66に決済を完了させ、認証失敗である場合には、セルフレジ66に決済を拒否させる(ステップS406)。
【0064】
《実施の形態3の主要な効果》
以上、実施の形態3の方式を用いることで、実施の形態1の場合と同様に、代表的にはHMDにおけるセキュリティを向上させることが可能になる。特に、悪意のあるユーザが他人のクレジットカードを不正に使用してショッピングを行うようなことを防止することが可能になる。すなわち、悪意のあるユーザは、断層データTDに基づく生体認証が求められるため、ディープフェイク技術を用いたとしても、正規のユーザになりすますことは困難である。
【0065】
なお、本発明は上記した実施の形態に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施の形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施の形態の構成の一部を他の実施の形態の構成に置き換えることが可能であり、また、ある実施の形態の構成に他の実施の形態の構成を加えることも可能である。また、各実施の形態の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
【0066】
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード、DVD等の記録媒体に置くことができる。
【0067】
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
【符号の説明】
【0068】
1:ヘッドマウント情報処理装置(HMD)、5,5a,5b:ユーザ、10,10a,10b:認証システム、11,11a,11b:無線ルータ、12:通信ネットワーク、13,13a,13b:認証サーバ、14:記憶装置、16:頭部、17:電極、18:超音波トランスデューサ、20:メインプロセッサ(コントローラ)、21:RAM、22:ROM、23:フラッシュメモリ、30:生体認証センサ、31:GPS受信機、32:地磁気センサ、33:距離センサ、34:加速度センサ、35:ジャイロセンサ、40:無線通信インタフェース、41:電話網通信インタフェース、45:ディスプレイ、46:インカメラ、47:アウトカメラ、50:マイク、51:スピーカ、52:オーディオデコーダ、55:ボタンスイッチ、56:タッチパネル、60:特徴量抽出器、61:照合器、65:ショッピングサーバ、66:セルフレジ、ADS:音声データ信号、BDS:生体データ信号、BS:バス、PCD:パスコード、RD:登録データ、T1:認証期間、TD:断層データ、TID:断層画像データ