IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

<>
  • 特許-認証装置、認証方法、及び、記録媒体 図1
  • 特許-認証装置、認証方法、及び、記録媒体 図2
  • 特許-認証装置、認証方法、及び、記録媒体 図3
  • 特許-認証装置、認証方法、及び、記録媒体 図4
  • 特許-認証装置、認証方法、及び、記録媒体 図5
  • 特許-認証装置、認証方法、及び、記録媒体 図6
  • 特許-認証装置、認証方法、及び、記録媒体 図7
  • 特許-認証装置、認証方法、及び、記録媒体 図8
  • 特許-認証装置、認証方法、及び、記録媒体 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-06-16
(45)【発行日】2025-06-24
(54)【発明の名称】認証装置、認証方法、及び、記録媒体
(51)【国際特許分類】
   G10L 17/00 20130101AFI20250617BHJP
   G10L 17/18 20130101ALI20250617BHJP
【FI】
G10L17/00 200B
G10L17/18
【請求項の数】 6
(21)【出願番号】P 2023546610
(86)(22)【出願日】2021-09-08
(86)【国際出願番号】 JP2021032947
(87)【国際公開番号】W WO2023037429
(87)【国際公開日】2023-03-16
【審査請求日】2024-02-14
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100104765
【弁理士】
【氏名又は名称】江上 達夫
(74)【代理人】
【識別番号】100107331
【弁理士】
【氏名又は名称】中村 聡延
(74)【代理人】
【識別番号】100131015
【弁理士】
【氏名又は名称】三輪 浩誉
(72)【発明者】
【氏名】カク レイ
(72)【発明者】
【氏名】山本 仁
【審査官】山下 剛史
(56)【参考文献】
【文献】米国特許出願公開第2019/0012448(US,A1)
【文献】特開2006-11591(JP,A)
【文献】特開2020-184032(JP,A)
【文献】特開2006-10809(JP,A)
【文献】特開2007-17840(JP,A)
【文献】特開2004-279768(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 15/00-17/26
H04R 1/00
(57)【特許請求の範囲】
【請求項1】
対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記骨伝導音声信号の特徴量である骨伝導特徴量とを算出し、前記空気伝導特徴量に含まれる1以上のベクトル要素のうちの少なくとも一つと、前記骨伝導特徴量に含まれる1以上のベクトル要素のうちの少なくとも一つとを含むように前記空気伝導特徴量及び前記骨伝導特徴量を結合することで、前記対象者の音声の1種類の特徴量である対象特徴量を算出する算出手段と、
登録されている登録特徴量と前記対象特徴量との類似度を算出し、前記類似度に基づいて前記対象者を認証する認証手段と
を備える認証装置。
【請求項2】
前記算出手段は、前記結合された空気伝導特徴量及び骨伝導特徴量が入力された場合に、前記対象特徴量を出力するニューラルネットワークを用いて、前記対象特徴量を算出する
請求項1に記載の認証装置。
【請求項3】
前記算出手段は、前記空気伝導音声信号の周波数スペクトルと前記骨伝導音声信号の周波数スペクトルとの差分の特徴量である差分特徴量を算出し、
前記認証手段は、前記空気伝導特徴量及び前記差分特徴量に基づいて前記対象者を認証する
請求項1又は2に記載の認証装置。
【請求項4】
前記認証手段は、前記空気伝導特徴量に基づいて前記対象者を暫定的に認証する第1処理と、前記差分特徴量に基づいて前記対象者を暫定的に認証する第2処理とを行い、前記第1処理の結果と前記第2処理との結果に基づいて前記対象者を確定的に認証する
請求項に記載の認証装置。
【請求項5】
対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記骨伝導音声信号の特徴量である骨伝導特徴量とを算出し、
前記空気伝導特徴量に含まれる1以上のベクトル要素のうちの少なくとも一つと、前記骨伝導特徴量に含まれる1以上のベクトル要素のうちの少なくとも一つとを含むように前記空気伝導特徴量及び前記骨伝導特徴量を結合することで、前記対象者の音声の1種類の特徴量である対象特徴量を算出し、
登録されている登録特徴量と前記対象特徴量との類似度を算出し、前記類似度に基づいて前記対象者を認証する
認証方法。
【請求項6】
コンピュータに、
対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記骨伝導音声信号の特徴量である骨伝導特徴量とを算出し、
前記空気伝導特徴量に含まれる1以上のベクトル要素のうちの少なくとも一つと、前記骨伝導特徴量に含まれる1以上のベクトル要素のうちの少なくとも一つとを含むように前記空気伝導特徴量及び前記骨伝導特徴量を結合することで、前記対象者の音声の1種類の特徴量である対象特徴量を算出し、
登録されている登録特徴量と前記対象特徴量との類似度を算出し、前記類似度に基づいて前記対象者を認証する
認証方法を実行させるコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
この開示は、例えば、対象者の音声を用いて対象者を認証可能な認証装置、認証方法及び記録媒体の技術分野に関する。
【背景技術】
【0002】
対象者の音声を用いて対象者を認証可能な認証装置の一例が、特許文献1に記載されている。
【0003】
その他、この開示に関連する先行技術文献として、特許文献2から特許文献4があげられる。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2006-011591号公報
【文献】国際公開第2018/034178号パンフレット
【文献】特開2007-017840号公報
【文献】特開2006-010809号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
この開示は、先行技術文献に記載された技術の改良を目的とする認証装置、認証方法、及び、記録媒体を提供することを課題とする。
【課題を解決するための手段】
【0006】
認証装置の第1の態様は、対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記骨伝導音声信号の特徴量である骨伝導特徴量とを算出し、前記空気伝導特徴量及び前記骨伝導特徴量を結合することで、前記対象者の音声の特徴量である対象特徴量を算出する算出手段と、前記対象特徴量に基づいて前記対象者を認証する認証手段とを備える。
【0007】
認証装置の第2の態様は、対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記空気伝導音声信号の周波数スペクトルと前記骨伝導音声信号の周波数スペクトルとの差分の特徴量である差分特徴量とを算出する算出手段と、前記空気伝導特徴量及び前記差分特徴量に基づいて、前記対象者を認証する認証手段とを備える。
【0008】
認証方法の第1の態様は、対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記骨伝導音声信号の特徴量である骨伝導特徴量とを算出し、前記空気伝導特徴量及び前記骨伝導特徴量を結合することで、前記対象者の音声の特徴量である対象特徴量を算出し、前記対象特徴量に基づいて前記対象者を認証する。
【0009】
認証方法の第2の態様は、対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記空気伝導音声信号の周波数スペクトルと前記骨伝導音声信号の周波数スペクトルとの差分の特徴量である差分特徴量とを算出し、前記空気伝導特徴量及び前記差分特徴量に基づいて、前記対象者を認証する。
【0010】
記録媒体の第1の態様は、コンピュータに、対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記骨伝導音声信号の特徴量である骨伝導特徴量とを算出し、前記空気伝導特徴量及び前記骨伝導特徴量を結合することで、前記対象者の音声の特徴量である対象特徴量を算出し、前記対象特徴量に基づいて前記対象者を認証する認証方法を実行させるコンピュータプログラムが記録された記録媒体である。
【0011】
記録媒体の第2の態様は、コンピュータに、対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記空気伝導音声信号の周波数スペクトルと前記骨伝導音声信号の周波数スペクトルとの差分の特徴量である差分特徴量とを算出し、前記空気伝導特徴量及び前記差分特徴量に基づいて、前記対象者を認証する認証方法を実行させるコンピュータプログラムが記録された記録媒体である。
【図面の簡単な説明】
【0012】
図1図1は、第1実施形態における認証装置の構成を示すブロック図である。
図2図2は、第2実施形態における認証システムの構成を示すブロック図である。
図3図3は、第2実施形態における認証装置の構成を示すブロック図である。
図4図4は、第2実施形態における認証装置が行う第1認証動作の流れを示すフローチャートである。
図5図5は、第1認証動作を行う算出部の構成を示すブロック図である。
図6図6は、第2実施形態における認証装置が行う第2認証動作の流れを示すフローチャートである。
図7図7は、第2認証動作を行う算出部及び認証部の構成を示すブロック図である。
図8図8は、第3実施形態における認証システムの構成を示すブロック図である。
図9図9は、骨伝導マイクの位置の違いを考慮して対象者を認証する認証動作の流れを示すフローチャートである。
【発明を実施するための形態】
【0013】
以下、図面を参照しながら、認証装置、認証方法、及び、記録媒体の実施形態について説明する。
【0014】
(1)第1実施形態
はじめに、認証装置、認証方法、及び、記録媒体の第1実施形態について説明する。以下では、認証装置、認証方法、及び、記録媒体の第1実施形態が適用された認証装置1000を用いて、認証装置、認証方法、及び、記録媒体の第1実施形態について説明する。
【0015】
図1は、第1実施形態における認証装置1000の構成を示すブロック図である。図1に示すように、認証装置1000は、算出部1001と、認証部1002とを備えている。
【0016】
第1の例では、算出部1001は、対象者の音声(つまり、対象者が発話した音声、以下同じ)の空気伝導音を示す空気伝導音声信号から、空気伝導音声信号の特徴量である空気伝導特徴量を算出する。更に、算出部1001は、対象者の音声の骨伝導音を示す骨伝導音声信号から、骨伝導音声信号の特徴量である骨伝導特徴量を算出する。更に、算出部1001は、空気伝導音声信号及び骨伝導特徴量を結合することで、対象者の特徴量である対象特徴量を算出する。認証部1002は、算出部1001が算出した対象特徴量に基づいて、対象者を認証する。
【0017】
このように、第1の例では、認証装置1000は、対象者の音声そのものの特徴を示す空気伝導特徴量のみならず、対象者の骨格の影響が重畳された対象者の音声の特徴を示す骨伝導特徴量(つまり、対象者の骨格の特徴をも示す骨伝導特徴量)にも基づいて、対象者を認証する。このため、空気伝導特徴量及び骨伝導特徴量のいずれか一方に基づいて対象者を認証する認証装置と比較して、認証装置1000は、対象者の音声を用いて、対象者をより精度よく認証することができる。特に、認証装置1000は、空気伝導特徴量に基づいて対象者を認証する処理と、空気伝導特徴量とは異なる骨伝導特徴量に基づいて対象者を認証する処理とを別々に行わなくてもよくなる。つまり、認証装置1000は、結合された空気伝導特徴量及び骨伝導特徴量から算出される対象特徴量に基づいて対象者を認証する処理を行えばよい。このため、認証装置1000は、対象者を認証するための処理負荷を低減可能となる。
【0018】
一方で、第2の例では、算出部1001は、対象者の音声の空気伝導音を示す空気伝導音声信号と、対象者の音声の骨伝導音を示す骨伝導音声信号とから、空気伝導音声信号の周波数スペクトルと骨伝導音声信号の周波数スペクトルとの差分の特徴量である差分特徴量を算出する。更に、算出部1001は、空気伝導音声信号から、空気伝導音声信号の特徴量である空気伝導特徴量を算出する。認証部1002は、空気伝導特徴量及び差分特徴量に基づいて、対象者を認証する。
【0019】
ここで、空気伝導特徴量が対象者の音声そのものの特徴を示すことは、上述したとおりである。更に、差分特徴量は、対象者の骨格の影響が重畳した対象者の音声の特徴から、対象者の音声そのものの特徴が実質的に排除された特徴量に相当する。つまり、差分特徴量は、対象者の個人性を示す対象者の骨格(つまり、対象者に固有の骨格)そのものの特徴を示す特徴量に相当する。このため、認証装置1000は、対象者の音声そのものの特徴を示す空気伝導特徴量及び対象者の骨格そのものの特徴を示す差分特徴量に基づいて、対象者を認証する。その結果、空気伝導特徴量及び差分特徴量のいずれか一方に基づいて対象者を認証する認証装置と比較して、認証装置1000は、対象者の音声を用いて、対象者をより精度よく認証することができる。
【0020】
(2)第2実施形態
続いて、認証装置、認証方法、及び、記録媒体の第2実施形態について説明する。以下では、認証装置、認証方法、及び、記録媒体の第2実施形態が適用された認証システムSYSを用いて、認証装置、認証方法、及び、記録媒体の第2実施形態について説明する。
【0021】
(2-1)認証システムSYSの構成
はじめに、図2を参照しながら、第2実施形態における認証システムSYSの構成について説明する。図2は、第2実施形態における認証システムSYSの構成を示すブロック図である。
【0022】
図2に示すように、認証システムSYSは、空気伝導マイク1と、骨伝導マイク2と、認証装置3とを備えている。
【0023】
空気伝導マイク1は、対象者の音声の空気伝導音を検出可能な音声検出装置である。具体的には、対象者の音声に伴って発生する空気の振動を検出することで、対象者の音声の空気伝導音を検出する。空気伝導マイク1は、空気伝導音を検出することで、空気伝導音を示す音声信号を生成する。尚、以下の説明では、空気伝導音を示す音声信号を、“空気伝導音声信号”と称する。空気伝導マイク1は、生成した空気伝導音声信号を、認証装置3に出力する。
【0024】
骨伝導マイク2は、対象者の音声の骨伝導音を検出可能な音声検出装置である。具体的には、対象者の音声に伴って発生する対象者の骨(骨格)の振動を検出することで、対象者の音声の骨伝導音を検出する。骨伝導マイク2は、骨伝導音を検出することで、骨伝導音を示す音声信号を生成する。尚、以下の説明では、骨伝導音を示す音声信号を、“骨伝導音声信号”と称する。骨伝導マイク2は、生成した骨伝導音声信号を、認証装置3に出力する。
【0025】
認証装置3は、対象者の音声を用いて対象者を認証する認証動作を行う。つまり、認証装置3は、声認証を行う。認証動作を行うために、認証装置3は、空気伝導マイク1から空気伝導音声信号を取得する。更に、認証装置3は、骨伝導マイク2から骨伝導音声信号を取得する。その後、認証装置3は、空気伝導音声信号と骨伝導音声信号とを用いて、対象者を認証する。
【0026】
空気伝導マイク1と骨伝導マイク2と認証装置3とを備える装置が、認証システムSYSとして用いられてもよい。例えば、空気伝導マイク1と骨伝導マイク2とを備え且つ認証装置3として機能可能な携帯端末(例えば、スマートフォン)が、認証システムSYSとして用いられてもよい。例えば、空気伝導マイク1と骨伝導マイク2と認証装置3とを備えるウェアラブルデバイスが、認証システムSYSとして用いられてもよい。
【0027】
声認証を行う認証システムSYSが適用される場面の一例として、顔認証及び虹彩認証を精度よく行うことが容易ではない場面があげられる。顔認証及び虹彩認証を精度よく行うことが容易ではない場面の一例として、マスクを装着した対象者を認証する場面があげられる。例えば、建設現場及び工場の少なくとも一方においてマスクを装着した作業員の入場を管理するために、認証システムSYSが用いられてもよい。例えば、医療施設においてマスクを装着した医療従事者の入退室を管理するために、認証システムSYSが用いられてもよい。声認証を行う認証システムSYSが適用される場面の他の一例として、指紋認証を精度よく行うことが容易ではない場面があげられる。指紋認証を精度よく行うことが容易ではない場面の一例として、手袋を装着した対象者を認証する場面があげられる。例えば、医療施設において手袋を装着した医療従事者の入退室を管理するために、認証システムSYSが用いられてもよい。声認証を行う認証システムSYSが適用される場面の他の一例として、電話サービスを介して対象者を認証する場面があげられる。但し、認証システムSYSが適用される場面が、ここで説明した場面に限定されることはない。
【0028】
(2-2)認証装置3の構成
続いて、図3を参照しながら、第2実施形態における認証装置3の構成について説明する。図3は、第2実施形態における認証装置3の構成を示すブロック図である。
【0029】
図3に示すように、認証装置3は、演算装置31と、記憶装置32とを備えている。更に、認証装置3は、通信装置33と、入力装置34と、出力装置35とを備えていてもよい。但し、認証装置3は、通信装置33、入力装置34及び出力装置35のうちの少なくとも一つを備えていなくてもよい。演算装置31と、記憶装置32と、通信装置33と、入力装置34と、出力装置35とは、データバス36を介して接続されていてもよい。
【0030】
演算装置31は、例えば、CPU(Central Processing Unit)、GPU(Graphics Proecssing Unit)及びFPGA(Field Programmable Gate Array)のうちの少なくとも一つを含む。演算装置31は、コンピュータプログラムを読み込む。例えば、演算装置31は、記憶装置32が記憶しているコンピュータプログラムを読み込んでもよい。例えば、演算装置31は、コンピュータで読み取り可能であって且つ一時的でない記録媒体が記憶しているコンピュータプログラムを、認証装置3が備える図示しない記録媒体読み取り装置(例えば、後述する入力装置34)を用いて読み込んでもよい。演算装置31は、通信装置33(或いは、その他の通信装置)を介して、認証装置3の外部に配置される不図示の装置からコンピュータプログラムを取得してもよい(つまり、ダウンロードしてもよい又は読み込んでもよい)。演算装置31は、読み込んだコンピュータプログラムを実行する。その結果、演算装置31内には、認証装置3が行うべき動作(例えば、上述した認証動作)を実行するための論理的な機能ブロックが実現される。つまり、演算装置31は、認証装置3が行うべき動作(言い換えれば、処理)を実行するための論理的な機能ブロックを実現するためのコントローラとして機能可能である。
【0031】
図3には、認証動作を実行するために演算装置31内に実現される論理的な機能ブロックの一例が示されている。図3に示すように、演算装置31内には、「算出手段」の一具体例である算出部311と、「認証手段」の一具体例である認証部312とが実現される。
【0032】
算出部311は、空気伝導音声信号及び骨伝導音声信号から、認証動作に用いられる対象者の特徴量である対象特徴量を算出する。尚、算出部311が算出する対象特徴量については、後に詳述する。
【0033】
認証部312は、算出部311が算出した対象特徴量に基づいて、対象者を認証する。つまり、認証部312は、算出部311が算出した対象特徴量に基づいて、対象者が登録人物と一致するか否かを判定する。具体的には、登録人物の音声に関する特徴量である登録特徴量は、記憶装置32が記憶している照合DB(DataBase)321に予め登録されている。照合DB321には、このような登録特徴量が、登録人物の数だけ登録されている。認証部312は、算出部311が算出した対象特徴量と、照合DB321に登録された登録特徴量とを比較することで、対象者が登録人物に一致するか否かを判定する。
【0034】
記憶装置32は、所望のデータを記憶可能である。例えば、記憶装置32は、演算装置31が実行するコンピュータプログラムを一時的に記憶していてもよい。記憶装置32は、演算装置31がコンピュータプログラムを実行している場合に演算装置31が一時的に使用するデータを一時的に記憶してもよい。記憶装置32は、認証装置3が長期的に保存するデータを記憶してもよい。尚、記憶装置32は、RAM(Random Access Memory)、ROM(Read Only Memory)、ハードディスク装置、光磁気ディスク装置、SSD(Solid State Drive)及びディスクアレイ装置のうちの少なくとも一つを含んでいてもよい。つまり、記憶装置32は、一時的でない記録媒体を含んでいてもよい。
【0035】
通信装置33は、不図示の通信ネットワークを介して、認証装置3の外部の装置と通信可能である。例えば、通信装置33は、空気伝導マイク1及び骨伝導マイク2の少なくとも一方と通信可能であってもよい。この場合、通信装置33は、不図示の通信ネットワークを介して、空気伝導マイク1から空気伝導音声信号を受信(つまり、取得)してもよい。通信装置33は、不図示の通信ネットワークを介して、骨伝導マイク2から骨伝導音声信号を受信(つまり、取得)してもよい。
【0036】
入力装置34は、認証装置3の外部からの認証装置3に対する情報の入力を受け付ける装置である。例えば、入力装置34は、認証装置3のオペレータが操作可能な操作装置(例えば、キーボード、マウス及びタッチパネルのうちの少なくとも一つ)を含んでいてもよい。例えば、入力装置34は、認証装置3に対して外付け可能な記録媒体にデータとして記録されている情報を読み取り可能な読取装置を含んでいてもよい。例えば、入力装置34は、空気伝導マイク1から出力される空気伝導音声信号及び骨伝導マイク2から出力される骨伝導音声信号の少なくとも一方が入力される入力インタフェースを含んでいてもよい。
【0037】
出力装置35は、認証装置3の外部に対して情報を出力する装置である。例えば、出力装置35は、情報を画像として出力してもよい。つまり、出力装置35は、出力したい情報を示す画像を表示可能な表示装置(いわゆる、ディスプレイ)を含んでいてもよい。例えば、出力装置35は、情報を音声として出力してもよい。つまり、出力装置35は、音声を出力可能な音声装置(いわゆる、スピーカ)を含んでいてもよい。例えば、出力装置35は、紙面に情報を出力してもよい。つまり、出力装置35は、紙面に所望の情報を印刷可能な印刷装置(いわゆる、プリンタ)を含んでいてもよい。
【0038】
(2-3)認証装置3の動作(認証動作)
続いて、第2実施形態における認証装置3が行う認証動作の流れについて説明する。第2実施形態では、認証装置3は、第1認証動作と第2認証動作との少なくとも一方を行う。このため、以下では、第1認証動作及び第2認証動作について順に説明する。
【0039】
(2-3-1)第1認証動作
初めに、図4を参照しながら、第2実施形態における認証装置3が行う第1認証動作の流れについて説明する。図4は、第2実施形態における認証装置3が行う第1認証動作の流れを示すフローチャートである。
【0040】
図4に示すように、算出部311は、空気伝導マイク1から、対象者の音声の空気伝導音を示す空気伝導音声信号を取得する(ステップS11)。更に、算出部311は、骨伝導マイク2から、対象者の音声の骨伝導音を示す骨伝導音声信号を取得する(ステップS12)。
【0041】
その後、算出部311は、ステップS11において取得された空気伝導音声信号から、空気伝導音声信号の特徴量である空気伝導特徴量を算出する(ステップS13)。更に、算出部311は、ステップS12において取得された骨伝導音声信号から、骨伝導音声信号の特徴量である骨伝導特徴量を算出する(ステップS13)。
【0042】
算出部311は、空気伝導音声信号の特徴を定性的に及び/又は定量的に示す任意のパラメータを、空気伝導特徴量として算出してもよい。例えば、算出部311は、空気伝導音声信号に対して所望の音声分析処理を施すことで、空気伝導音声信号の特徴を示す任意のパラメータを、空気伝導特徴量として算出してもよい。所望の音声分析処理の一例として、周波数分析処理、ケプストラム分析処理及びピッチ抽出処理のうちの少なくとも一つがあげられる。空気伝導音声信号の特徴を示す任意のパラメータの一例として、空気伝導音声信号に対して行われる周波数分析処理の結果から算出可能なメル周波数ケプストラム係数(MFCC:Mel Frequency Cepstrum Coefficients)があげられる。
【0043】
空気伝導特徴量は、N次元のベクトル(つまり、N個のベクトル要素から構成されるベクトル)である。尚、「N」は、1以上の整数を示す定数である。この場合、ベクトルの次元の数は、認証動作を適切に行うことが可能な適切な数に設定されることが好ましい。一例として、メル周波数ケプストラム係数が空気伝導特徴量として用いられる場合には、空気伝導特徴量は、12次元以上のベクトルであってもよい。
【0044】
同様に、算出部311は、骨伝導音声信号の特徴を定性的に及び/又は定量的に示す任意のパラメータを、骨伝導特徴量として算出してもよい。例えば、算出部311は、骨伝導音声信号に対して所望の音声分析処理を施すことで、骨伝導音声信号の特徴を示す任意のパラメータを、骨伝導特徴量として算出してもよい。骨伝導音声信号の特徴を示す任意のパラメータの一例として、骨伝導音声信号に対して行われる周波数分析処理の結果から算出可能なメル周波数ケプストラム係数があげられる。
【0045】
骨伝導特徴量は、M次元のベクトル(つまり、M個のベクトル要素から構成されるベクトル)である。尚、「M」は、1以上の整数を示す定数である。この場合、ベクトルの次元の数は、認証動作を適切に行うことが可能な適切な数に設定されることが好ましい。一例として、メル周波数ケプストラム係数が空気伝導特徴量として用いられる場合には、骨伝導特徴量は、12次元以上のベクトルであってもよい。
【0046】
その後、算出部311は、ステップS13において算出された空気伝導特徴量と、ステップS13において算出された骨伝導特徴量とを結合(言い換えれば、連結又は合成)する(ステップS14)。その結果、算出部311は、結合された空気伝導特徴量及び骨伝導特徴量から構成される特徴量である結合特徴量を算出する(ステップS14)。
【0047】
上述したように、空気伝導特徴量がN次元のベクトルであり且つ骨伝導特徴量がM次元のベクトルであるため、結合特徴量は、典型的には、N+M次元のベクトルとなる。つまり、結合特徴量の次元の数は、N+Mとなる。逆に言えば、算出部311は、結合特徴量が、空気伝導特徴量に含まれるN個のベクトル要素と、骨伝導特徴量に含まれるM個のベクトル要素とを含むように、結合特徴量を算出してもよい。
【0048】
但し、結合特徴量は、N+M次元未満のベクトルであってもよい。つまり、結合特徴量の次元の数は、N+M未満であってもよい。但し、結合特徴量の次元の数は、Nよりも大きく且つMよりも大きい。つまり、結合特徴量は、N+M次元未満であって、N次元より大きく且つM次元よりも大きいベクトルであってもよい。一例として、算出部311は、結合特徴量が、空気伝導特徴量に含まれるN個のベクトル要素のうちのN’個のベクトル要素(但し、N’は、1以上且つN未満の整数を示す定数)の少なくとも一つと、骨伝導特徴量に含まれるM個のベクトル要素のうちのM’個のベクトル要素(但し、M’は、1以上且つM未満の整数を示す定数)少なくとも一つとを含むように、結合特徴量を算出してもよい。つまり、第2実施形態における「空気伝導特徴量と骨伝導特徴量とを結合することで結合特徴量を算出する」動作は、「結合特徴量が、空気伝導特徴量に含まれるN個のベクトル要素のうちの少なくとも一つと、骨伝導特徴量に含まれるM個のベクトル要素のうちの少なくとも一つとを含むように、結合特徴量を算出する」動作を意味していてもよい。
【0049】
その後、算出部311は、ステップS14において算出された結合特徴量から、認証動作を行うために認証部312が用いる対象特徴量を算出する(ステップS15)。例えば、算出部311は、ステップS14において算出された結合特徴量から、対象者の特徴を示す特徴量を抽出することで、抽出した特徴量に相当する対象特徴量を算出してもよい。
【0050】
算出部311は、結合特徴量が入力された場合に対象特徴量を出力可能であって且つ機械学習によって構築可能なニューラルネットワークを用いて、結合特徴量から対象特徴量を算出してもよい。ニューラルネットワークは、サンプル人物の空気伝導音声信号及びサンプル人物の骨伝導音声信号とサンプル人物の認証結果の正解ラベルとを含む教師データを用いた機械学習によって、予め構築されていてもよい。
【0051】
その後、認証部312は、ステップS15において算出された対象特徴量に基づいて、対象者を認証する(ステップS16)。具体的には、認証部312は、ステップS15において算出された対象特徴量と、照合DB321に登録された登録人物に対応する登録特徴量との類似度を算出する。認証部312は、算出した類似度が所定の認証閾値を上回る(つまり、対象特徴量が登録特徴量に似ている)場合には、対象者が登録人物と一致すると判定してもよい。一方で、認証部312は、算出した類似度が所定の認証閾値を下回る(つまり、対象特徴量が登録特徴量に似ていない)場合には、対象者が登録人物と一致しないと判定してもよい。
【0052】
認証部312は、二つの特徴量の類似度を算出するための任意の方法を用いて、類似度を算出してもよい。二つの特徴量の類似度を算出するための任意の方法として、確率的線形判別分析(PLDA:Probablistic Linera Discriminant Analysis)モデルを用いた方法があげられる。
【0053】
認証部312は、ニューラルネットワークを用いて、対象者を認証してもよい。例えば、認証部312は、確率的線形判別分析モデルが適用されたニューラルネットワークを用いて、対象者を認証してもよい。ニューラルネットワークは、サンプル人物の空気伝導音声信号及びサンプル人物の骨伝導音声信号とサンプル人物の認証結果の正解ラベルとを含む教師データを用いた機械学習によって、予め構築されていてもよい。
【0054】
上述したように算出部311がニューラルネットワークを用いる場合には、算出部311が用いるニューラルネットワークと認証部312が用いるニューラルネットワークとが統合されていてもよい。つまり、算出部311は、ニューラルネットワークの第1ネットワーク部分を用いて対象特徴量を算出し、認証部312は、第1ネットワーク部分の出力が入力されるニューラルネットワークの第2ネットワーク部分を用いて対象者を認証してもよい。この場合、算出部311及び認証部312が用いるニューラルネットワークは、いわゆるx-vectorと称される方式(言い換えれば、深層話者埋込(Deep Speaker Embedding))に準拠したニューラルネットワークであってもよい。
【0055】
照合DB321には、複数の登録人物に夫々対応する複数の登録特徴量が登録されていてもよい。この場合、認証部312は、照合DB321から、一の登録人物に対応する一の登録特徴量と対象特徴量との類似度を算出することで対象者が一の登録人物と一致するか否かを判定する動作を、複数の登録特徴量を用いて繰り返してもよい。
【0056】
第1認証動作が行われる場合には、照合DB321に登録されている登録特徴量は、第1認証動作で用いられる対象特徴量と同様の流れで生成されていてもよい。具体的には、登録特徴量を照合DB321に登録するために、まずは、登録人物の音声の空気伝導音を示す空気伝導音声信号及び登録人物の音声の骨伝導音を示す骨伝導音声信号が取得されてもよい。その後、空気伝導音声信号から空気伝導特徴量が算出され、且つ、骨伝導音声信号から骨伝導特徴量が算出されてもよい。その後、空気伝導特徴量と骨伝導特徴量とを結合することで結合特徴量が算出されてもよい。その後、結合特徴量から登録特徴量が算出されてもよい。
【0057】
このような図4に示す流れで第1認証動作が行われる場合には、算出部311は、図5に示す機能ブロックを備えていてもよい。具体的には、図5に示すように、算出部311は、算出部3111と、算出部3112と、算出部3113と、算出部3114とを備えていてもよい。算出部3111は、空気伝導音声信号から、空気伝導特徴量を算出してもよい。算出部3112は、骨伝導音声信号から、骨伝導特徴量を算出してもよい。算出部3112は、算出部3111が算出した空気伝導特徴量と算出部3112が算出した骨伝導特徴量とを結合することで、結合特徴量を算出してもよい。算出部3114は、算出部3113が算出した結合特徴量から、対象特徴量を算出してもよい。
【0058】
以上説明した第1認証動作によれば、認証装置3は、対象者の音声そのものの特徴を示す空気伝導特徴量のみならず、対象者の骨格の影響が重畳された対象者の音声の特徴を示す骨伝導特徴量(つまり、対象者の骨格の特徴をも示す骨伝導特徴量)にも基づいて、対象者を認証する。つまり、認証装置3は、空気伝導音声信号と骨伝導音声信号との双方を用いて、対象者を認証する。その結果、空気伝導特徴量及び骨伝導特徴量のいずれか一方に基づいて対象者を認証する(つまり、空気伝導音声信号と骨伝導音声信号のいずれか一方に基づいて対象者を認証する)第1比較例の認証装置と比較して、認証装置3は、対象者の音声を用いて、対象者をより精度よく認証することができる。というのも、第1比較例の認証装置が空気伝導特徴量に基づいて対象者を認証する(つまり、対象者を認証するために骨伝導特徴量を用いない)場合には、空気伝導音声信号の取得環境が適切でない場合において、認証精度が悪化する可能性があるという技術的問題が生ずる可能性がある。例えば、空気伝導音声信号の取得環境が、ノイズの多い環境又は対象者が音声を適切に発していない環境である場合において、認証精度が悪化する可能性がある。一方で、第1比較例の認証装置が骨伝導特徴量に基づいて対象者を認証する(つまり、対象者を認証するために空気伝導特徴量を用いない)場合には、骨伝導音声信号の精度がそもそも空気伝導音声信号の精度よりも低いがゆえに、認証精度が悪化する可能性があるという技術的問題が生ずる可能性がある。しかるに、第1認証動作では、認証装置3は、空気伝導特徴量及び骨伝導特徴量の双方に基づいて対象者を認証する。このため、認証装置3は、第1比較例の認証装置において発生する可能性がある技術的問題を適切に解決可能である。
【0059】
更に、第1認証動作によれば、認証装置3は、空気伝導特徴量に基づいて対象者を認証する処理と、空気伝導特徴量とは異なる骨伝導特徴量に基づいて対象者を認証する処理とを別々に行わなくてもよくなる。つまり、認証装置3は、2種類の異なる特徴量に基づいて対象者を夫々認証する2種類の処理を別々に行わなくてもよくなる。言い換えれば、認証装置3は、対象特徴量という1種類の特徴量に基づいて対象者を認証する処理を行えばよい。このため、空気伝導特徴量に基づいて対象者を認証する処理と骨伝導特徴量に基づいて対象者を認証する処理とを別々に行う必要がある第2比較例の認証装置と比較して、認証装置3は、特徴量に基づいて対象者を認証する処理を行う回数(例えば、上述した類似度を算出する回数)を減らすことができる。一例として、認証装置3は、認証装置3が特徴量に基づいて対象者を認証する処理を行う回数を、第2比較例の認証装置が特徴量に基づいて対象者を認証する処理を行う回数の半分程度にまで減らすことができる。その結果、認証装置3は、対象者を認証するための処理負荷を低減することができる。
【0060】
また、認証装置3は、ニューラルネットワークを用いて、結合特徴量から対象特徴量を算出可能である。このため、空気伝導特徴量及び骨伝導特徴量の夫々と比較して要素数が多い結合特徴量が用いられる場合であっても、認証装置3は、対象特徴量を比較的容易に算出することができる。
【0061】
(2-3-2)第2認証動作
続いて、図6を参照しながら、第2実施形態における認証装置3が行う第2認証動作の流れについて説明する。図6は、第2実施形態における認証装置3が行う第2認証動作の流れを示すフローチャートである。
【0062】
図6に示すように、第2認証動作においても、第1認証動作と同様に、算出部311は、空気伝導マイク1から、空気伝導音声信号を取得する(ステップS11)。更に、算出部311は、骨伝導マイク2から、骨伝導音声信号を取得する(ステップS12)。
【0063】
その後、第2認証動作においても、第1認証動作と同様に、算出部311は、ステップS11において取得された空気伝導音声信号から、空気伝導特徴量を算出する(ステップS23)。
【0064】
一方で、第2認証動作においては、算出部311は、ステップS12において取得された骨伝導音声信号から、骨伝導特徴量を算出しなくてもよい。第2認証動作では、算出部311は、骨伝導特徴量に代えて、差分特徴量を算出する(ステップS24)。差分特徴量は、空気伝導音声信号の周波数スペクトルと骨伝導音声信号の周波数スペクトルとの差分を示す特徴量(つまり、差分の特徴を示す特徴量)である。例えば、空気伝導音声信号の周波数スペクトルと骨伝導音声信号の周波数スペクトルとの差分そのものが、差分特徴量として用いられてもよい。例えば、空気伝導音声信号の周波数スペクトルと骨伝導音声信号の周波数スペクトルとの差分から算出されるパラメータが、差分特徴量として用いられてもよい。例えば、空気伝導音声信号の周波数スペクトルと骨伝導音声信号の周波数スペクトルとの差分を定量的に又は定性的に示すパラメータが、差分特徴量として用いられてもよい。
【0065】
その後、認証部312は、ステップS23において算出された空気伝導特徴量に基づいて、対象者を認証する(ステップS25)。更に、認証部312は、ステップS24において算出された差分特徴量に基づいて、対象者を認証する(ステップS26)。このため、第2実施形態では、空気伝導特徴量及び差分特徴量の夫々が、対象者を認証するために実際に用いられる対象特徴量として用いられる。
【0066】
第2認証動作においても、第1認証動作と同様に、認証部312は、対象特徴量と照合DB321に登録された登録特徴量との類似度を算出することで、対象者を認証する。ここで、上述したように、第2実施形態では、空気伝導特徴量及び差分特徴量の夫々が、対象特徴量として用いられる。このため、第2認証動作では、照合DB321には、登録特徴量として、空気伝導特徴量に対応する第1登録特徴量と、差分特徴量に対応する第2登録特徴量とが登録されている。第1登録特徴量は、登録人物の音声の空気伝導音を示す空気伝導音声信号の特徴量である。第2登録特徴量は、登録人物の音声の空気伝導音を示す空気伝導音声信号の周波数スペクトルと、登録人物の音声の骨伝導音を示す骨伝導音声信号の周波数スペクトルとの差分を示す特徴量である。この場合、認証部312は、ステップS25において、ステップS23において差分特徴量として算出された空気伝導特徴量と照合DB321に登録された第1登録特徴量との類似度を算出することで、対象者を認証する。更に、認証部312は、ステップS26において、ステップS24において差分特徴量として算出された差分特徴量と照合DB321に登録された第2登録特徴量との類似度を算出することで、対象者を認証する。
【0067】
その後、認証部312は、ステップS25における対象者の認証結果と、ステップS26における対象者の認証結果とに基づいて、対象者を認証する(ステップS27)。つまり、第2認証動作では、認証部312は、ステップS25及びS26の夫々において、対象者を暫定的に認証し、ステップS27において、対象者の暫定的な認証結果に基づいて、対象者を確定的に(言い換えれば、最終的に)認証する。一例として、認証部312は、ステップS25において対象者が一の登録人物に一致し且つステップS26において対象者が同じ一の登録人物に一致すると判定された場合に、対象者が一の登録人物に一致すると判定してもよい。他方で、認証部312は、ステップS25及びS26の少なくとも一方において対象者が一の登録人物に一致していないと判定された場合に、対象者が一の登録人物に一致していないと判定してもよい。
【0068】
このような図6に示す流れで第2認証動作が行われる場合には、算出部311及び認証部312は、図7に示す機能ブロックを備えていてもよい。具体的には、図7に示すように、算出部311は、図5に示す算出部3111と、算出部3115とを備えていてもよい。認証部312は、認証部3121と、認証部3122と、認証部3123とを備えていてもよい。算出部3111は、上述したように、空気伝導音声信号から、空気伝導特徴量を算出してもよい。算出部3115は、空気伝導音声信号と骨伝導音声信号から、差分特徴量を算出してもよい。認証部3121は、算出部3111が算出した空気伝導特徴量に基づいて、対象者を暫定的に認証してもよい。認証部3122は、算出部3115が算出した差分特徴量に基づいて、対象者を暫定的に認証してもよい。認証部3123は、認証部3121による認証結果と、認証部3122による認証結果とに基づいて、対象者を確定的に認証してもよい。
【0069】
以上説明した第2認証動作によれば、第1認証動作と同様に、認証装置3は、空気伝導音声信号と骨伝導音声信号との双方を用いて、対象者を認証する。その結果、空気伝導音声信号と骨伝導音声信号のいずれか一方に基づいて対象者を認証する第1比較例の認証装置と比較して、認証装置3は、対象者の音声を用いて、対象者をより精度よく認証することができる。
【0070】
更に、第2認証動作によれば、認証装置3は、骨伝導特徴量に代えて差分特徴量に基づいて対象者を認証する。ここで、差分特徴量は、対象者の骨格の影響が重畳した対象者の音声の特徴から、対象者の音声そのものの特徴が実質的に排除された特徴量に相当する。つまり、差分特徴量は、対象者の個人性を示す対象者の骨格(つまり、対象者に固有の骨格)そのものの特徴を示す特徴量に相当する。このため、認証装置3は、対象者の音声そのものの特徴を示す空気伝導特徴量及び対象者の骨格そのものの特徴を示す差分特徴量に基づいて、対象者を認証する。その結果、空気伝導特徴量及び差分特徴量のいずれか一方に基づいて対象者を認証する第3比較例の認証装置と比較して、認証装置3は、対象者の音声を用いて、対象者をより精度よく認証することができる。
【0071】
更に、認証装置3は、空気伝導特徴量及び差分特徴量の夫々に基づく対象者の暫定的な認証結果に基づいて、対象者を確定的に認証する。このため、空気伝導特徴量の基づく対象者の認証結果が対象者の確定的な認証結果としてそのまま用いられる又は差分特徴量の基づく対象者の認証結果が対象者の確定的な認証結果としてそのまま用いられる場合と比較して、認証装置3は、対象者の音声を用いて、対象者をより精度よく認証することができる。
【0072】
(3)第3実施形態
続いて、認証装置、認証方法、及び、記録媒体の第3実施形態について説明する。以下では、認証装置、認証方法、及び、記録媒体の第3実施形態が適用された認証システムSYSを用いて、認証装置、認証方法、及び、記録媒体の第3実施形態について説明する。尚、以下の説明では、第3実施形態における認証システムSYSを、認証システムSYSaと称することで、第2実施形態における認証システムSYSと区別する。
【0073】
以下、図8を参照しながら、第3実施形態における認証システムSYSaについて説明する。図8は、第3実施形態における認証システムSYSaの構成を示すブロック図である。
【0074】
図8に示すように、認証システムSYSaは、認証システムSYSと比較して、複数の骨伝導マイク2を備えているという点で異なる。以下の説明では、図8に示すように、認証システムSYSaが二つの骨伝導マイク2(具体的には、骨伝導マイク2#1及び2#2)を備える例について説明する。認証システムSYSaのその他の特徴は、認証システムSYSのその他の特徴と同一であってもよい。
【0075】
複数の骨伝導マイク2は、対象者に対して異なる複数の位置にそれぞれ配置される。例えば、骨伝導マイク2は、対象者の異なる複数の部位にそれぞれ接触するように配置されてもよい。一例として、骨伝導マイク2#1は、対象者の頭に接触するように配置され、骨伝導マイク2#2は、対象者の耳又はその近傍の部位に接触するように配置されてもよい。対象者の頭に接触する骨伝導マイク2#1の一例として、眼鏡型のウェアラブルデバイス(例えば、眼鏡のつるの部分)に組み込まれた骨伝導マイクがあげられる。対象者の耳又はその近傍の部位に接触する骨伝導マイク2#2の一例として、対象者の耳に装着可能なヘッドセット型のウェアラブルデバイスに組み込まれた骨伝導マイクがあげられる。
【0076】
複数の骨伝導マイク2のうちの一の骨伝導マイク2の用途と、複数の骨伝導マイク2のうちの一の骨伝導マイク2とは異なる他の骨伝導マイク2の用途とが異なっていてもよい。つまり、骨伝導マイク2#1の用途と、骨伝導マイク2#2の用途とが異なっていてもよい。一例として、骨伝導マイク2#1及び2#2pのいずれか一方は、照合DB321に登録されている登録特徴量を算出するために用いられてもよい。この場合、登録特徴量は、骨伝導マイク2#1及び2#2pのいずれか一方が検出した骨伝導音から算出されてもよい。一方で、骨伝導マイク2#1及び2#2pのいずれか他方は、対象者を認証するための対象特徴量を算出するために用いられてもよい。この場合、上述した認証装置3が備える算出部311は、骨伝導マイク2#1及び2#2pのいずれか他方が検出した骨伝導音から、対象特徴量を算出してもよい。
【0077】
ここで、骨伝導マイク2が検出する骨伝導音は、骨伝導音の検出位置によって変わる可能性がある。例えば、一の位置に配置されている骨伝導マイク2が検出した一の対象者の骨伝導音(特に、その特徴量)は、一の位置とは異なる他の位置に配置されている骨伝導マイク2が検出した同じ一の対象者の骨伝導音(特に、その特徴量)と異なる可能性がある。この場合、登録特徴量を算出するための骨伝導マイク2と対象特徴量を算出するための骨伝導マイク2とが異なることに起因して、認証装置3の認証精度が悪化してしまう可能性がある。そこで、上述した認証装置3が備える認証部312は、骨伝導マイク2の位置の違いを考慮して、対象者を認証してもよい。以下、骨伝導マイク2の位置の違いを考慮して対象者を認証する認証動作について、図9を参照しながら説明する。図9は、骨伝導マイク2の位置の違いを考慮して対象者を認証する認証動作の流れを示すフローチャートである。
【0078】
図9に示すように、第3実施形態においても、算出部311が空気伝導音声信号を取得し(ステップS11)、算出部311が骨伝導音声信号を取得し(ステップS12)、算出部311が空気伝導特徴量及び骨伝導特徴量を算出する(ステップS13)。
【0079】
その後、認証部312は、登録特徴量が算出された場合と比較して、対象者に対する骨伝導マイク2の位置が変わっているか否かを判定する(ステップS31a)。つまり、認証部312は、登録特徴量を算出するために用いられた骨伝導マイク2の位置と、対象特徴量を算出するために用いられた骨伝導マイク2の位置(つまり、図9に示す動作が行われている場合の骨伝導マイク2の位置であり、対象者が現在装着している骨伝導マイク2の位置)とが異なるか否かを判定する。この判定を行うために、照合DB312内において、登録特徴量は、登録特徴量を算出するために用いられた骨伝導マイク2の位置に関するマイク位置情報と関連付けられていてもよい。その結果、認証部312は、照合DB312を参照することで、登録特徴量を算出するために用いられた骨伝導マイク2の位置を特定することができる。更に、対象特徴量を算出するために用いられた骨伝導マイク2の位置に関する情報は、例えば、対象者によって認証部312に入力されてもよい。或いは、認証部312は、対象者が現在装着している骨伝導マイク2の機器番号等から、対象者が現在装着している骨伝導マイク2の位置(つまり、対象特徴量を算出するために用いられた骨伝導マイク2の位置)を推定してもよい。
【0080】
ステップS31aにおける判定の結果、骨伝導マイク2の位置が変わった(つまり、登録特徴量を算出するために用いられた骨伝導マイク2の位置と、対象特徴量を算出するために用いられた骨伝導マイク2の位置とが異なる)と判定された場合には(ステップS31a:Yes)、認証部312は、ステップS13で算出した骨伝導特徴量を補正する(ステップS32a)。具体的には、認証部312は、登録特徴量を算出するために用いられた骨伝導マイク2の位置と対象者が現在装着している骨伝導マイク2の位置との違いに起因した骨伝導特徴量の変化が相殺されるように、骨伝導特徴量を補正する。つまり、認証部312は、対象者が現在装着している骨伝導マイク2の位置が、登録特徴量を算出するために用いられた骨伝導マイク2の位置と同じ位置であると仮定した場合に算出される骨伝導特徴量に、補正後の骨伝導特徴量が近づく(好ましくは一致する)ように、骨伝導特徴量を補正する。
【0081】
骨伝導特徴量を補正するために、一の位置に配置されている骨伝導マイク2が実際に検出した骨伝導音の特徴量と一の位置とは異なる他の位置に配置されている骨伝導マイク2が実際に検出した骨伝導音の特徴量との差分から、骨伝導特徴量を補正するための補正パラメータが予め生成されていてもよい。例えば、骨伝導マイク2#1が実際に検出した骨伝導音の特徴量と骨伝導マイク2#2が実際に検出した骨伝導音の特徴量との差分から、骨伝導マイク2#1が検出した骨伝導音の特徴量を骨伝導マイク2#2が検出した骨伝導音の特徴量に補正するための補正パラメータ、及び、骨伝導マイク2#2が検出した骨伝導音の特徴量を骨伝導マイク2#1が検出した骨伝導音の特徴量に補正するための補正パラメータのうちの少なくとも一方が予め生成されていてもよい。この場合、認証部312は、補正パラメータを用いて、骨伝導特徴量を補正してもよい。
【0082】
他方で、ステップS31aにおける判定の結果、骨伝導マイク2の位置が変わっていない(つまり、登録特徴量を算出するために用いられた骨伝導マイク2の位置と、対象特徴量を算出するために用いられた骨伝導マイク2の位置とが同じである)と判定された場合には(ステップS31a:No)、認証部312は、ステップS13で算出した骨伝導特徴量を補正しなくてもよい。
【0083】
その後は、第3実施形態においても、算出部311は、ステップS13において算出された空気伝導特徴量と、ステップS13において算出された又はステップS32aにおいて補正された骨伝導特徴量とを結合し(ステップS14)、算出部311は、結合特徴量から、対象特徴量を算出し(ステップS15)、認証部312は、対象特徴量に基づいて、対象者を認証する(ステップS16)。
【0084】
このような第3実施形態によれば、認証装置3は、登録特徴量を算出するために用いられた骨伝導マイク2の位置と、対象特徴量を算出するために用いられた骨伝導マイク2の位置とが異なる場合であっても、対象者を適切に認証することができる。
【0085】
尚、図9は、図4を用いて説明した第1認証動作において骨伝導マイク2の位置の違いを考慮した認証動作を示している。しかしながら、認証装置3は、図6を用いて説明した第2認証動作を行う場合においても、骨伝導マイク2の位置の違いを考慮してもよい。つまり、認証装置3は、図6を用いて説明した第2認証動作を行う場合においても、骨伝導マイク2の位置の違いを考慮して骨伝導特徴量を補正してもよい。
【0086】
(4)第4実施形態
続いて、認証装置、認証方法、及び、記録媒体の第4実施形態について説明する。以下では、認証装置、認証方法、及び、記録媒体の第4実施形態が適用された認証システムSYSを用いて、認証装置、認証方法、及び、記録媒体の第4実施形態について説明する。尚、以下の説明では、第3実施形態における認証システムSYSを、認証システムSYSbと称することで、第2実施形態における認証システムSYSと区別する。
【0087】
認証システムSYSbは、認証システムSYSと比較して、第2認証動作の一部が異なるという点で異なる。認証システムSYSbのその他の特徴は、認証システムSYSのその他の特徴と同一であってもよい。
【0088】
具体的には、認証装置3は、第2認証動作を行う場合に、空気伝導特徴量に基づいて、対象者を認証し(図6のステップS25)、且つ、差分特徴量に基づいて、対象者を認証する(図6のステップS26)。第4実施形態では、認証装置3は、空気伝導特徴量と第1登録特徴量との類似度が認証閾値を上回る(つまり、対象者が登録人物と一致すると判定された)一方で、差分特徴量と第2登録特徴量との類似度が認証閾値を下回る(つまり、対象者が登録人物と一致しないと判定された)場合に、骨伝導特徴量に何らかの影響が生じたと推定する。この場合、認証装置3は、差分特徴量を補正してもよい。例えば、骨密度に応じて骨伝導特徴量が変動する可能性がある。一例として、正常な骨密度の人物の骨伝導特徴量と骨粗しょう症をわずらっている人物の骨伝導特徴量とは異なる可能性がある。この場合、認証装置3は、対象者が骨粗しょう症であると判定された場合に、正常な骨密度の人物の骨伝導特徴量と骨粗しょう症をわずらっている人物の骨伝導特徴量との差分に関する情報に基づいて、差分特徴量を補正してもよい。その結果、骨伝導特徴量に何らかの影響が生じた場合であっても、認証装置3は、対象者を適切に認証することができる。
【0089】
(5)第5実施形態
続いて、認証装置、認証方法、及び、記録媒体の第5実施形態について説明する。以下では、認証装置、認証方法、及び、記録媒体の第5実施形態が適用された認証システムSYSを用いて、認証装置、認証方法、及び、記録媒体の第5実施形態について説明する。尚、以下の説明では、第5実施形態における認証システムSYSを、認証システムSYScと称することで、第2実施形態における認証システムSYSと区別する。
【0090】
認証システムSYScは、認証システムSYSと比較して、骨伝導特徴量の重みづけ処理を行ってよいという点で異なる。認証システムSYScのその他の特徴は、認証システムSYSのその他の特徴と同一であってもよい。
【0091】
具体的には、空気伝導特徴量は、骨伝導特徴量と比較して、対象者の周囲の環境音の影響を受けやすい。そこで、対象者の周囲の環境音が相対的に大きい(例えば、環境音の大きさが閾値よりも大きい)場合には、そうでない場合と比較して、骨伝導特徴量の重みを大きくしてもよい。具体的には、第1認証動作において、認証装置3は、対象特徴量を算出する場合の骨伝導特徴量の重みを大きくしてもよい。第2認証動作において、認証装置3は、差分特徴量を算出する場合の骨伝導特徴量の重み(この場合、実際には、骨伝導音声信号の重み)を大きくしてもよい。その結果、対象者の周囲の環境音が相対的に大きい場合であっても、認証装置3は、対象者を適切に認証することができる。
【0092】
(6)付記
以上説明した実施形態に関して、更に以下の付記を開示する。
[付記1]
対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記骨伝導音声信号の特徴量である骨伝導特徴量とを算出し、前記空気伝導特徴量及び前記骨伝導特徴量を結合することで、前記対象者の音声の特徴量である対象特徴量を算出する算出手段と、
前記対象特徴量に基づいて前記対象者を認証する認証手段と
を備える認証装置。
[付記2]
前記算出手段は、前記結合された空気伝導特徴量及び骨伝導特徴量が入力された場合に、前記対象特徴量を出力するニューラルネットワークを用いて、前記対象特徴量を算出する
付記1に記載の認証装置。
[付記3]
前記算出手段は、前記空気伝導音声信号の周波数スペクトルと前記骨伝導音声信号の周波数スペクトルとの差分の特徴量である差分特徴量を算出し、
前記認証手段は、前記空気伝導特徴量及び前記差分特徴量に基づいて前記対象者を認証する
付記1又は2に記載の認証装置。
[付記4]
対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記空気伝導音声信号の周波数スペクトルと前記骨伝導音声信号の周波数スペクトルとの差分の特徴量である差分特徴量とを算出する算出手段と、
前記空気伝導特徴量及び前記差分特徴量に基づいて、前記対象者を認証する認証手段と
を備える認証装置。
[付記5]
前記認証手段は、前記空気伝導特徴量に基づいて前記対象者を暫定的に認証する第1処理と、前記差分特徴量に基づいて前記対象者を暫定的に認証する第2処理とを行い、前記第1処理の結果と前記第2処理との結果に基づいて前記対象者を確定的に認証する
付記4に記載の認証装置。
[付記6]
対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記骨伝導音声信号の特徴量である骨伝導特徴量とを算出し、
前記空気伝導特徴量及び前記骨伝導特徴量を結合することで、前記対象者の音声の特徴量である対象特徴量を算出し、
前記対象特徴量に基づいて前記対象者を認証する
認証方法。
[付記7]
対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記空気伝導音声信号の周波数スペクトルと前記骨伝導音声信号の周波数スペクトルとの差分の特徴量である差分特徴量とを算出し、
前記空気伝導特徴量及び前記差分特徴量に基づいて、前記対象者を認証する
認証方法。
[付記8]
コンピュータに、
対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記骨伝導音声信号の特徴量である骨伝導特徴量とを算出し、
前記空気伝導特徴量及び前記骨伝導特徴量を結合することで、前記対象者の音声の特徴量である対象特徴量を算出し、
前記対象特徴量に基づいて前記対象者を認証する
認証方法を実行させるコンピュータプログラムが記録された記録媒体。
[付記9]
コンピュータに、
対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記空気伝導音声信号の周波数スペクトルと前記骨伝導音声信号の周波数スペクトルとの差分の特徴量である差分特徴量とを算出し、
前記空気伝導特徴量及び前記差分特徴量に基づいて、前記対象者を認証する
認証方法を実行させるコンピュータプログラムが記録された記録媒体。
【0093】
上述の各実施形態の構成要件の少なくとも一部は、上述の各実施形態の構成要件の少なくとも他の一部と適宜組み合わせることができる。上述の各実施形態の構成要件のうちの一部が用いられなくてもよい。また、法令で許容される限りにおいて、上述のこの開示で引用した全ての文献(例えば、公開公報)の開示を援用してこの開示の記載の一部とする。
【0094】
この開示は、請求の範囲及び明細書全体から読み取るこのできる技術的思想に反しない範囲で適宜変更可能である。そのような変更を伴う認証装置、認証方法、及び、記録媒体もまた、この開示の技術的思想に含まれる。
【符号の説明】
【0095】
SYS 認証システム
1 空気伝導マイク
2 骨伝導マイク
3、1000 認証装置
31 演算装置
311、1001 算出部
312、1002 認証部
32 記憶装置
321 照合DB
図1
図2
図3
図4
図5
図6
図7
図8
図9