(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-05
(45)【発行日】2024-08-14
(54)【発明の名称】情報処理装置、情報処理方法及び記憶媒体
(51)【国際特許分類】
G06N 20/00 20190101AFI20240806BHJP
【FI】
G06N20/00
(21)【出願番号】P 2022534611
(86)(22)【出願日】2020-07-10
(86)【国際出願番号】 JP2020026973
(87)【国際公開番号】W WO2022009408
(87)【国際公開日】2022-01-13
【審査請求日】2022-12-05
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100094112
【氏名又は名称】岡部 讓
(74)【代理人】
【識別番号】100106183
【氏名又は名称】吉澤 弘司
(72)【発明者】
【氏名】伊藤 良峻
(72)【発明者】
【氏名】越仲 孝文
【審査官】渡辺 順哉
(56)【参考文献】
【文献】特開2003-177785(JP,A)
【文献】SU, Bing ほか,Heteroscedastic Max-Min Distance Analysis for Dimensionality Reduction,IEEE Transactions on Image Processing[online],IEEE,2018年05月21日,Vol.27, No.8,pp.4052-4065,[retrieved on 2020.10.02], Retrieved from the Internet: <URL: https://ieeexplore.ieee.org/document/8361488>,<DOI: 10.1109/TIP.2018.2836312>
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-99/00
(57)【特許請求の範囲】
【請求項1】
各々が複数のクラスのいずれかに分類された複数のデータを取得する取得手段と、
前記複数のデータの統計量を含む目的関数に基づいて、前記複数のデータの次元削減に用いられる射影行列を算出する算出手段と、
を有し、
前記目的関数は、前記複数のクラスのうちの第1クラスと第2クラスの間における、前記複数のデータのクラス間ばらつきを示す第1項を含む第1関数と、前記第1クラスと前記第2クラスの少なくとも1つにおける、前記複数のデータのクラス内ばらつきを示す第2項を含む第2関数と、を含
み、
前記第1関数は、前記複数のクラスにわたる前記複数のデータのクラス間ばらつきの平均を示す第3項を更に含み、
前記第2関数は、前記複数のクラスにわたる前記複数のデータのクラス内ばらつきの平均を示す第4項を更に含む、
情報処理装置。
【請求項2】
前記目的関数は、前記第1関数と前記第2関数の比の、前記複数のクラスにわたる最小値又は最大値を含む、
請求項1に記載の情報処理装置。
【請求項3】
前記第2関数は、前記第1クラスにおける前記複数のデータのクラス内ばらつきと、前記第2クラスにおける前記複数のデータのクラス内ばらつきとの加重平均を含む、
請求項1又は2に記載の情報処理装置。
【請求項4】
各々が複数のクラスのいずれかに分類された複数のデータを取得する取得手段と、
前記複数のデータの統計量を含む目的関数に基づいて、前記複数のデータの次元削減に用いられる射影行列を算出する算出手段と、
を有し、
前記目的関数は、前記複数のデータのクラス間ばらつきを示す第1項と、前記複数のクラスにわたる前記複数のデータのクラス間ばらつきの平均を示す第3項とを含む第1関数の前記複数のクラスにわたる最小値と、前記複数のデータのクラス内ばらつきを示す第2項と、前記複数のクラスにわたる前記複数のデータのクラス内ばらつきの平均を示す第4項とを含む第2関数の前記複数のクラスにわたる最大値との比を含む、
情報処理装置。
【請求項5】
前記算出手段は、所定の制約条件の下で前記目的関数を最大化又は最小化する最適化を行うことにより、前記射影行列の決定を行う、
請求項1乃至
4のいずれか1項に記載の情報処理装置。
【請求項6】
前記データは、生体情報から抽出された特徴量データである、
請求項1乃至
5のいずれか1項に記載の情報処理装置。
【請求項7】
コンピュータに、
各々が複数のクラスのいずれかに分類された複数のデータを取得するステップと、
前記複数のデータの統計量を含む目的関数に基づいて、前記複数のデータの次元削減に用いられる射影行列を算出するステップと、
を有し、
前記目的関数は、前記複数のクラスのうちの第1クラスと第2クラスの間における、前記複数のデータのクラス間ばらつきを示す第1項を含む第1関数と、前記第1クラスと前記第2クラスの少なくとも1つにおける、前記複数のデータのクラス内ばらつきを示す第2項を含む第2関数と、を含
み、
前記第1関数は、前記複数のクラスにわたる前記複数のデータのクラス間ばらつきの平均を示す第3項を更に含み、
前記第2関数は、前記複数のクラスにわたる前記複数のデータのクラス内ばらつきの平均を示す第4項を更に含む、
情報処理方法を実行させる情報処理方法。
【請求項8】
コンピュータに、
各々が複数のクラスのいずれかに分類された複数のデータを取得するステップと、
前記複数のデータの統計量を含む目的関数に基づいて、前記複数のデータの次元削減に用いられる射影行列を算出するステップと、
を有し、
前記目的関数は、前記複数のデータのクラス間ばらつきを示す第1項と、前記複数のクラスにわたる前記複数のデータのクラス間ばらつきの平均を示す第3項とを含む第1関数の前記複数のクラスにわたる最小値と、前記複数のデータのクラス内ばらつきを示す第2項と、前記複数のクラスにわたる前記複数のデータのクラス内ばらつきの平均を示す第4項とを含む第2関数の前記複数のクラスにわたる最大値との比を含む、
情報処理方法を実行させる情報処理方法。
【請求項9】
コンピュータに、
各々が複数のクラスのいずれかに分類された複数のデータを取得するステップと、
前記複数のデータの統計量を含む目的関数に基づいて、前記複数のデータの次元削減に用いられる射影行列を算出するステップと、
を有し、
前記目的関数は、前記複数のクラスのうちの第1クラスと第2クラスの間における、前記複数のデータのクラス間ばらつきを示す第1項を含む第1関数と、前記第1クラスと前記第2クラスの少なくとも1つにおける、前記複数のデータのクラス内ばらつきを示す第2項を含む第2関数と、を含
み、
前記第1関数は、前記複数のクラスにわたる前記複数のデータのクラス間ばらつきの平均を示す第3項を更に含み、
前記第2関数は、前記複数のクラスにわたる前記複数のデータのクラス内ばらつきの平均を示す第4項を更に含む、
情報処理方法を実行させるためのプログラムが記憶された記憶媒体。
【請求項10】
コンピュータに、
各々が複数のクラスのいずれかに分類された複数のデータを取得するステップと、
前記複数のデータの統計量を含む目的関数に基づいて、前記複数のデータの次元削減に用いられる射影行列を算出するステップと、
を有し、
前記目的関数は、前記複数のデータのクラス間ばらつきを示す第1項と、前記複数のクラスにわたる前記複数のデータのクラス間ばらつきの平均を示す第3項とを含む第1関数の前記複数のクラスにわたる最小値と、前記複数のデータのクラス内ばらつきを示す第2項と、前記複数のクラスにわたる前記複数のデータのクラス内ばらつきの平均を示す第4項とを含む第2関数の前記複数のクラスにわたる最大値との比を含む、
情報処理方法を実行させるためのプログラムが記憶された記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
この開示は、情報処理装置、情報処理方法及び記憶媒体に関する。
【背景技術】
【0002】
高次元のデータを扱う機械学習等の処理において、次元削減が行われる場合がある。このような用途においては、次元削減後にデータがクラスに応じて適切に分離されていることが望まれる。特許文献1には、次元削減に用いられる射影行列の生成手法の一例が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載されているような次元削減手法において、より良好にクラスを分離し得る手法が求められる場合がある。
【0005】
この開示は、より良好にクラスが分離され得る次元削減を実現する情報処理装置、情報処理方法及び記憶媒体を提供することを目的とする。
【課題を解決するための手段】
【0006】
この開示の一観点によれば、各々が複数のクラスのいずれかに分類された複数のデータを取得する取得手段と、前記複数のデータの統計量を含む目的関数に基づいて、前記複数のデータの次元削減に用いられる射影行列を算出する算出手段と、を有し、前記目的関数は、前記複数のクラスのうちの第1クラスと第2クラスの間における、前記複数のデータのクラス間ばらつきを示す第1項を含む第1関数と、前記第1クラスと前記第2クラスの少なくとも1つにおける、前記複数のデータのクラス内ばらつきを示す第2項を含む第2関数と、を含み、前記第1関数は、前記複数のクラスにわたる前記複数のデータのクラス間ばらつきの平均を示す第3項を更に含み、前記第2関数は、前記複数のクラスにわたる前記複数のデータのクラス内ばらつきの平均を示す第4項を更に含む、情報処理装置が提供される。
【0007】
この開示の他の一観点によれば、各々が複数のクラスのいずれかに分類された複数のデータを取得する取得手段と、前記複数のデータの統計量を含む目的関数に基づいて、前記複数のデータの次元削減に用いられる射影行列を算出する算出手段と、を有し、前記目的関数は、前記複数のデータのクラス間ばらつきを示す第1項と、前記複数のクラスにわたる前記複数のデータのクラス間ばらつきの平均を示す第3項とを含む第1関数の前記複数のクラスにわたる最小値と、前記複数のデータのクラス内ばらつきを示す第2項と、前記複数のクラスにわたる前記複数のデータのクラス内ばらつきの平均を示す第4項とを含む第2関数の前記複数のクラスにわたる最大値との比を含む、情報処理装置が提供される。
【0008】
この開示の他の一観点によれば、コンピュータに、各々が複数のクラスのいずれかに分類された複数のデータを取得するステップと、前記複数のデータの統計量を含む目的関数に基づいて、前記複数のデータの次元削減に用いられる射影行列を算出するステップと、を有し、前記目的関数は、前記複数のクラスのうちの第1クラスと第2クラスの間における、前記複数のデータのクラス間ばらつきを示す第1項を含む第1関数と、前記第1クラスと前記第2クラスの少なくとも1つにおける、前記複数のデータのクラス内ばらつきを示す第2項を含む第2関数と、を含み、前記第1関数は、前記複数のクラスにわたる前記複数のデータのクラス間ばらつきの平均を示す第3項を更に含み、前記第2関数は、前記複数のクラスにわたる前記複数のデータのクラス内ばらつきの平均を示す第4項を更に含む、情報処理方法を実行させる情報処理方法が提供される。
【0009】
この開示の他の一観点によれば、コンピュータに、各々が複数のクラスのいずれかに分類された複数のデータを取得するステップと、前記複数のデータの統計量を含む目的関数に基づいて、前記複数のデータの次元削減に用いられる射影行列を算出するステップと、を有し、前記目的関数は、前記複数のデータのクラス間ばらつきを示す第1項と、前記複数のクラスにわたる前記複数のデータのクラス間ばらつきの平均を示す第3項とを含む第1関数の前記複数のクラスにわたる最小値と、前記複数のデータのクラス内ばらつきを示す第2項と、前記複数のクラスにわたる前記複数のデータのクラス内ばらつきの平均を示す第4項とを含む第2関数の前記複数のクラスにわたる最大値との比を含む、情報処理方法を実行させる情報処理方法が提供される。
【0010】
この開示の他の一観点によれば、コンピュータに、各々が複数のクラスのいずれかに分類された複数のデータを取得するステップと、前記複数のデータの統計量を含む目的関数に基づいて、前記複数のデータの次元削減に用いられる射影行列を算出するステップと、を有し、前記目的関数は、前記複数のクラスのうちの第1クラスと第2クラスの間における、前記複数のデータのクラス間ばらつきを示す第1項を含む第1関数と、前記第1クラスと前記第2クラスの少なくとも1つにおける、前記複数のデータのクラス内ばらつきを示す第2項を含む第2関数と、を含み、前記第1関数は、前記複数のクラスにわたる前記複数のデータのクラス間ばらつきの平均を示す第3項を更に含み、前記第2関数は、前記複数のクラスにわたる前記複数のデータのクラス内ばらつきの平均を示す第4項を更に含む、情報処理方法を実行させるためのプログラムが記憶された記憶媒体が提供される。
【0011】
この開示の他の一観点によれば、コンピュータに、各々が複数のクラスのいずれかに分類された複数のデータを取得するステップと、前記複数のデータの統計量を含む目的関数に基づいて、前記複数のデータの次元削減に用いられる射影行列を算出するステップと、を有し、前記目的関数は、前記複数のデータのクラス間ばらつきを示す第1項と、前記複数のクラスにわたる前記複数のデータのクラス間ばらつきの平均を示す第3項とを含む第1関数の前記複数のクラスにわたる最小値と、前記複数のデータのクラス内ばらつきを示す第2項と、前記複数のクラスにわたる前記複数のデータのクラス内ばらつきの平均を示す第4項とを含む第2関数の前記複数のクラスにわたる最大値との比を含む、情報処理方法を実行させるためのプログラムが記憶された記憶媒体が提供される。
【図面の簡単な説明】
【0012】
【
図1】第1実施形態に係る情報処理装置のハードウェア構成を示すブロック図である。
【
図2】第1実施形態に係る情報処理装置の機能ブロック図である。
【
図3】第1実施形態に係る情報処理装置において行われる訓練処理の概略を示すフローチャートである。
【
図4】第1実施形態に係る情報処理装置において行われる判定処理の概略を示すフローチャートである。
【
図5】複数のクラスの分散と射影軸の向きの関係を模式的に示す図である。
【
図6】第1実施形態に係る情報処理装置において行われる射影行列算出処理の概略を示すフローチャートである。
【
図7】第4実施形態に係る情報処理システムの全体構成を示す模式図である。
【
図8】第4実施形態に係るイヤホン制御装置のハードウェア構成例を示すブロック図である。
【
図9】第4実施形態に係るイヤホン及び情報処理装置の機能ブロック図である。
【
図10】第4実施形態に係る情報処理装置により行われる生体照合処理の概略を示すフローチャートである。
【
図11】第5実施形態及び第6実施形態に係る情報処理装置の機能ブロック図である。
【発明を実施するための形態】
【0013】
以下、図面を参照して、この開示の例示的な実施形態を説明する。図面において同様の要素又は対応する要素には同一の符号を付し、その説明を省略又は簡略化することがある。
【0014】
[第1実施形態]
本実施形態の情報処理装置は、入力されたデータの次元削減に用いられる射影行列を算出する装置である。また、本実施形態の情報処理装置は、入力されたデータに対して射影行列を用いた特徴選択を行ったデータに対して人物識別等の判定を行う判定機能を備え得る。このデータは、例えば、生体情報から抽出された特徴量データであり得る。この場合、情報処理装置は、生体情報に基づいて人物の本人確認等を行う生体照合装置であり得る。以下、本実施形態の情報処理装置は、射影行列を算出する訓練機能と射影行列に基づく判定機能との両方を備えた生体照合装置であるものとするがこれに限定されるものではない。
【0015】
図1は、情報処理装置1のハードウェア構成例を示すブロック図である。本実施形態の情報処理装置1は、例えば、PC(Personal Computer)、処理サーバ、スマートフォン、マイクロコンピュータ等のコンピュータであり得る。情報処理装置1は、プロセッサ101、メモリ102、通信I/F(Interface)103、入力装置104及び出力装置105を備える。なお、情報処理装置1の各部は、不図示のバス、配線、駆動装置等を介して相互に接続される。
【0016】
プロセッサ101は、例えば、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、FPGA(Field-Programmable Gate Array)、ASIC(Application Specific Integrated Circuit)、TPU(Tensor Processing Unit)等の演算処理回路を1つ又は複数備える処理装置である。プロセッサ101は、メモリ102等に記憶されたプログラムに従って所定の演算を行うとともに、情報処理装置1の各部を制御する機能をも有する。
【0017】
メモリ102は、プロセッサ101の動作に必要な一時的なメモリ領域を提供する揮発性記憶媒体と、処理対象のデータ、情報処理装置1の動作プログラム等の情報を非一時的に記憶する不揮発性記憶媒体とを含み得る。揮発性記憶媒体の例としては、RAM(Random Access Memory)が挙げられる。不揮発性記憶媒体の例としては、ROM(Read Only Memory)、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等が挙げられる。
【0018】
通信I/F103は、イーサネット(登録商標)、Wi-Fi(登録商標)、Bluetooth(登録商標)等の規格に基づく通信インターフェースである。通信I/F103は、データサーバ、センサデバイス等の他の装置との通信を行うためのモジュールである。
【0019】
入力装置104は、キーボード、ポインティングデバイス、ボタン等であって、ユーザが情報処理装置1を操作するために用いられる。ポインティングデバイスの例としては、マウス、トラックボール、タッチパネル、ペンタブレット等が挙げられる。入力装置104は、カメラ、マイクロホン等のセンサデバイスを含んでいてもよい。これらのセンサデバイスは、生体情報の取得に用いられ得る。
【0020】
出力装置105は、例えば、表示装置、スピーカ等のユーザに情報を提示する装置である。入力装置104及び出力装置105は、タッチパネルとして一体に形成されていてもよい。
【0021】
図1においては、情報処理装置1は、1つの装置により構成されているが、情報処理装置1の構成はこれに限定されるものではない。例えば、情報処理装置1は、複数の装置によって構成されるシステムであってもよい。また、情報処理装置1にこれら以外の装置が追加されていてもよく、一部の装置が設けられていなくてもよい。また、一部の装置が同様の機能を有する別の装置に置換されていてもよい。更に、本実施形態の一部の機能がネットワークを介して他の装置により提供されてもよく、本実施形態の機能が複数の装置に分散されて実現されるものであってもよい。例えば、メモリ102が、他の措置に設けられた記憶装置であるクラウドストレージを含んでいてもよい。このように情報処理装置1のハードウェア構成は適宜変更可能である。
【0022】
図2は、本実施形態に係る情報処理装置1の機能ブロック図である。情報処理装置1は、射影行列算出部110、第1特徴抽出部121、第2特徴抽出部131、特徴選択部132、判定部133、出力部134、訓練データ記憶部141、射影行列記憶部142及び対象データ記憶部143を備える。射影行列算出部110は、分離度算出部111、制約設定部112及び射影行列更新部113を備える。
【0023】
プロセッサ101は、メモリ102に記憶されたプログラムを実行することで、所定の演算処理を行う。また、プロセッサ101は、当該プログラムに基づいて、メモリ102、通信I/F103、入力装置104及び出力装置105の各部を制御する。これらにより、プロセッサ101は、射影行列算出部110、第1特徴抽出部121、第2特徴抽出部131、特徴選択部132、判定部133及び出力部134の機能を実現する。また、メモリ102は、訓練データ記憶部141、射影行列記憶部142及び対象データ記憶部143の機能を実現する。第1特徴抽出部121及び射影行列算出部110は、それぞれ、より一般的に取得手段及び算出手段と呼ばれることもある。
【0024】
なお、
図2に記載されている機能ブロックの一部は、情報処理装置1の外部の装置に設けられていてもよく、複数の装置の協働により実現されてもよい。例えば、情報処理装置1は、訓練データを用いた訓練を行う訓練装置と、対象データに対する判定を行う判定装置とに分かれていてもよい。この場合、訓練装置は、射影行列算出部110、第1特徴抽出部121及び訓練データ記憶部141を含み得る。判定装置は、第2特徴抽出部131、特徴選択部132、判定部133、出力部134及び対象データ記憶部143を含み得る。
【0025】
図3は、本実施形態に係る情報処理装置1において行われる訓練処理の概略を示すフローチャートである。本実施形態の訓練処理は、例えば、ユーザ操作等により、情報処理装置1に訓練データを用いた訓練処理の指令が行われた時点で開始される。しかしながら、本実施形態の訓練処理が行われるタイミングは、特に限定されるものではなく、情報処理装置1が訓練データを取得した時点であってもよく、所定の時間間隔で繰り返し実行されるものであってもよい。なお、本実施形態においては、訓練データ記憶部141にあらかじめ複数のクラスのいずれかに分類された訓練データが記憶されているものとするが、訓練処理の実行時にデータサーバ等の他の装置から訓練データを取得してもよい。
【0026】
ステップS11において、第1特徴抽出部121は、訓練データ記憶部141から訓練データを取得する。この訓練データには、ユーザ等によってあらかじめ複数のクラスのいずれに分類されるかを示す情報が対応付けられている。例えば、この訓練データが生体、物体等から取得されたセンサデータである場合には、複数のクラスとは、訓練データを取得した人物、物体等を特定する識別番号等であり得る。
【0027】
ステップS12において、第1特徴抽出部121は、訓練データから特徴量データを抽出する。ステップS13において、射影行列算出部110は、射影行列を算出する。算出された射影行列は、射影行列記憶部142に記憶される。一般的に、特徴量データは多次元データであり、特徴量データに基づく判定を適切に行うためには次元削減を要する場合がある。射影行列算出部110は、訓練データに基づいて、次元削減を行うための射影行列を決定するための訓練を行う。ステップS13における処理の詳細は後述する。
【0028】
なお、訓練データ記憶部141にあらかじめ訓練データから抽出された特徴量データが記憶されていてもよく、その場合、ステップS12の処理は省略され得る。
【0029】
図4は、本実施形態に係る情報処理装置1において行われる判定処理の概略を示すフローチャートである。本実施形態の判定処理は、例えば、ユーザ操作等により、情報処理装置1に対象データを用いた判定処理の指令が行われた時点で開始される。しかしながら、本実施形態の判定処理が行われるタイミングは、特に限定されるものではなく、情報処理装置1が対象データを取得した時点であってもよく、所定の時間間隔で繰り返し実行されるものであってもよい。なお、本実施形態においては、射影行列記憶部142にあらかじめ射影行列が記憶されており、対象データ記憶部143に対象データが記憶されているものとするが、判定処理の実行時にサーバ等の他の装置から対象データを取得してもよい。
【0030】
ステップS21において、第2特徴抽出部131は、対象データ記憶部143から対象データを取得する。この対象データは、本判定処理における判定対象となる未知のデータである。
【0031】
ステップS22において、第2特徴抽出部131は、対象データから特徴量データを抽出する。ステップS23において、特徴選択部132は、対象データに対して射影行列に基づく特徴選択を実行する。この処理は、具体的には、対象データに対して射影行列を作用させることにより、対象データの次元を削減する処理である。この処理をより概念的に言い換えると、特徴選択部132は、対象データの性質をよく反映する特徴を選択することで特徴の個数を削減する処理を行う。
【0032】
ステップS24において、判定部133は、特徴選択後の特徴量データに基づいて、判定を行う。例えば、判定部133における判定がクラス分類であれば、この判定は、入力された特徴量データが属するクラスを判定する処理である。また、例えば、判定部133における判定が生体照合における人物識別であれば、この判定は、対象データを取得した人物が登録されている人物と同一人物であるか否かを判定する処理である。
【0033】
ステップS25において、出力部134は、判定部133による判定結果を出力する。この出力先は、情報処理装置1内のメモリ102であってもよく、他の装置であってもよい。
【0034】
次に、
図3のステップS13における射影行列算出処理の具体的な内容について説明する。本実施形態における射影行列算出処理の説明に先立って、本実施形態の処理と関連するLDA(Linear Discriminant Analysis)と、WLDA(Worst-case Linear Discriminant Analysis)に触れつつ、本実施形態の射影行列算出処理の理論的背景について説明する。
【0035】
訓練データの次元数をd、訓練データの個数をn、i番目の訓練データを示すd次元ベクトルをxi、クラスの数をC、次元削減後の次元数をrとする。射影行列Wは、以下の式(1)のように、d行r列の実行列で表される。射影行列Wを訓練データxiに作用させることで次元をd次元からr次元に削減することができる。
【0036】
【0037】
適切な次元削減を実現するため、射影行列Wを算出する手法がいくつか提案されてきている。その手法の一例として、まず、LDAについての概略を説明する。
【0038】
LDAによる射影行列Wを決定する最適化問題は、以下の式(2)で表現される。
【0039】
【0040】
ここで、行列Sb、Swは、以下の式(3)から式(6)により定義される。argmax(・)は、括弧内の関数の最大値を与える引数を示しており、tr(・)は、正方行列のトレースを示しており、WTは、Wの転置行列を示している。
【0041】
【0042】
【0043】
【0044】
【0045】
式(5)は、k番目のクラスΠkにおけるxiのクラス内平均を示しており、式(6)は、すべての訓練データの標本平均である。したがって、行列Sbは、クラス間分散の平均を示す行列であり、行列Swは、クラス内分散の平均を示す行列である。すなわち、LDAでは、大まかには、訓練データのクラス間ばらつきの平均を示す項を訓練データのクラス内ばらつきの平均を示す項で割った比を最大化するような射影行列Wが決定される。この手法では、最適化時には平均のみに着目するため、異なるクラスの一部のみが重複するようにデータが分布している等の、クリティカルなクラス間における混同のリスクが軽視される。
【0046】
そこで、ワーストケースに着目したWLDAが提案されている。以下ではWLDAについての概略を説明する。WLDAによる射影行列Wを決定する最適化問題は、以下の式(7)及び式(8)で表現される。
【0047】
【0048】
【0049】
なお、行列Irはr行r列の単位行列を示している。また、式(8)のs.t.(subject to)は、制約条件を示している。ここで、行列Sij、Skは、以下の式(9)及び式(10)により定義される。
【0050】
【0051】
【0052】
これらの定義より、行列Sijは、i番目のクラスとj番目のクラスのクラス間分散を示す行列であり、行列Skは、k番目のクラスのクラス内分散を示す行列である。式(8)は、正規直交制約と呼ばれる制約条件である。正規直交制約は、射影行列Wの各列のスケールを制限し、冗長性を排除する機能を有している。
【0053】
しかしながら、式(7)及び式(8)の最適化問題(理想的なWLDA)は、非凸問題であるため、Wについて解くことは容易ではない。したがって、以下のようにして式(7)及び式(8)の最適化問題の制約条件緩和を行う。
【0054】
まず式(11)のように新しいd行d列の行列Σを定義する。
【0055】
【0056】
次に、制約条件緩和前の解空間を示す集合を以下の式(12)のように定義する。式(11)より、明らかにΣはこの解空間に属する。
【0057】
【0058】
式(12)の集合の凸包は以下の式(13)で与えられる。式(13)は、制約条件緩和後の解空間を示す集合である。なお、式(13)の0dは、d行d列の零行列を示しており、Idはd行d列の単位行列を示している。
【0059】
【0060】
また、式(14)は、行列(Me-0d)が半正定値であり、かつ行列(Id-Me)が半正定値であることを示している。式(14)は、半正定値制約と呼ばれる。
【0061】
【0062】
式(11)及び式(13)を用いて、式(7)及び式(8)の最適化問題は、以下の式(15)及び式(16)のように緩和することができる。なお、この式変形において、行列のサイズが適切である場合に行列の積の順序変換に対して行列のトレースが不変であるという性質を用いている。
【0063】
【0064】
【0065】
式(15)及び式(16)の最適化問題(緩和されたWLDA)は、制約条件が緩和されているためΣについて最適化することができる。
【0066】
WLDAの目的関数に含まれる行列Sijは、クラス間分散を示す行列であり、行列Siは、クラス内分散を示す行列である。したがって、WLDAでは、大まかには、訓練データのクラス間ばらつきの最小値を示す項を訓練データのクラス内ばらつきの最大値を示す項で割った比を最大化するような射影行列Wが決定される。この手法では、複数の訓練データのうちのワーストケースの組み合わせが考慮される。そのため、平均のみに着目するLDAとは異なり、クラスの一部のみが重複するようにデータが分布している等の場合においても、そのようなクリティカルな部分のクラス間距離を広げるように最適化された射影行列Wが算出され得る。
【0067】
しかしながら、WLDAにおいては、式(15)等の目的関数の分子のクラス間ばらつきの最小値を与える2つのクラスの組と、分母のクラス内ばらつきの最小値を与えるクラスとが別のクラスになる場合がある。このような場合、分母のクラス内ばらつきの最小値を与えるクラスがクリティカルな箇所とは関連しないものになり、最適化が不十分なものとなるおそれがある。
【0068】
そこで、本実施形態の射影行列算出処理では、式(15)の最適化問題の目的関数が上述のWLDAのものから変形されている。以下、本実施形態の射影行列算出処理について説明する。本実施形態の射影行列算出処理における最適化問題は以下の式(17)から式(19)に示す通りである。なお、式(18)のni、njは、それぞれクラスインデックスi、jのデータ数を示している。
【0069】
【0070】
【0071】
【0072】
本実施形態の目的関数に含まれる行列Sijは、i番目のクラス(第1クラス)とj番目のクラス(第2クラス)のクラス間分散を示す行列(第1項)である。また、行列Si,j(上線省略)は、クラス間分散の算出に用いられた2つのクラスにおけるクラス内分散の加重平均を示す行列(第2項)である。式(17)の分数の分子である、第1クラスと第2クラスの間のクラス間ばらつきを示す第1項を含む関数を第1関数とし、式(17)の分数の分母である、第1クラスと第2クラスの少なくとも1つのクラス内ばらつきを示す第2項を含む関数を第2関数とする。本実施形態では、大まかには、第1関数を第2関数で割った比の、複数のクラスにわたる最小値を最大化するような射影行列Wが決定される。
【0073】
図5を参照して、本実施形態の効果を詳細に説明する。
図5は、複数のクラスの分散と射影軸の向きの関係を模式的に示す図である。
図5では複数のクラスに分類された訓練データの分布が模式的に示されている。
図5の例では、図示の簡略化のため訓練データは2次元であり、2次元のデータを1次元に削減する射影行列の算出が行われているものとする。
図5の第1軸及び第2軸は、訓練データの2つの次元に対応する。楕円状の破線は、クラスCL1、CL2、CL3のクラス内分散を示している。大まかには、クラスCL1、CL2、CL3の破線の中に対応するクラスの訓練データが分布しているものと考えることができる。クラスCL1、CL2、CL3の破線内に配された矩形のドットは、各クラスのクラス内平均を示している。
【0074】
図5の例では、クラスCL1とクラスCL2の分布の一部が重複しているケースを想定する。ここで、クラスCL3は、クラスCL1及びクラスCL2の双方から十分に分離されているものとする。
図5の領域Rは、クラスCL1とクラスCL2の重複部分を示している。本実施形態における最適な射影行列の算出とは、
図5の2次元のデータにおいては、クラスCL1とクラスCL2を最もよく分離する射影軸の向きを決定することに相当する。
【0075】
矢印A1は、WLDAを用いた場合に算出され得る射影軸の向きを示している。
図5より理解されるように、矢印A1の向きは、領域Rの影響を最小にする向き、すなわち、領域Rの最小幅の方向とはやや異なっている。この理由は、クラスCL3のクラス内分散が非常に大きいためである。クラスCL3のクラス内分散の影響を最小にする方向は、
図5におけるクラスCL3の楕円の短軸方向であるため、矢印A1の向きもクラスCL3の楕円の短軸方向に近い向きとなっている。この場合、射影軸は、クラスCL1とクラスCL2の重複部分の影響を最小にするものにはなっていない。
【0076】
矢印A2は、本実施形態の射影行列算出処理を用いた場合に算出され得る射影軸の向きを示している。
図5より理解されるように、矢印A2の向きは、領域Rの影響を最小にする向き、すなわち、領域Rの最小幅の方向に近いものとなっている。本実施形態の射影行列算出処理の式(17)では、クラス間分散の算出に用いたクラスと同じクラスからクラス内分散が算出される。そのため、
図5の例においては、クラスCL3のクラス内分散の影響を受けずに射影軸の向きの最適化が行われるため、領域Rの影響を最小にするように射影軸の向きが決定される。
【0077】
以上のように本実施形態においては、クラス間分散の算出に用いたクラスと同じクラスによりクラス内分散が算出されている。これらの比を目的関数に用いることにより、複数のクラスが重複するようなクリティカルな箇所が重視される。これにより、本実施形態によれば、より良好にクラスが分離され得る次元削減を実現する情報処理装置1が提供される。
【0078】
次に、
図6を参照しつつ、
図3のステップS13における射影行列算出処理の詳細について説明する。
図6は、本実施形態に係る情報処理装置1において行われる射影行列算出処理の概略を示すフローチャートである。
【0079】
ステップS131において、射影行列算出部110は、kの値を0に設定する。ここで、kは、行列Σの最適化のループ処理におけるループカウンタ変数である。ステップS132において、分離度算出部111は、行列Σのk=0に対応する初期値Σ0を適宜設定する。
【0080】
以下のステップS133からステップS137は、行列Σを最適化するためのループ処理である。以下の説明において、ループカウンタの値kに対応する変数、すなわち、k番目の反復における変数には引数kが付されている場合がある。ステップS133において、射影行列算出部110は、kの値をインクリメントする。なお、インクリメントとは、kの値を1だけ増加させる演算処理である。
【0081】
ステップS134において、分離度算出部111は、最適化の分離度αkの値を算出する。分離度αkは、式(17)とk-1番目の反復で得られた行列Σk-1とに基づいて、以下の式(20)のように定められる。なお、証明は省略するが、分離度αkはkの増加に対して非減少であり、かつ上に有界であることから、この最適化アルゴリズムは収束することがわかっている。
【0082】
【0083】
k番目の反復における行列Σkを求める問題は、以下の式(21)から式(23)の半正定値計画問題に帰着される。式(21)は、半正定値計画問題の目的であり、式(22)及び式(23)は半正定値計画問題の制約条件である。また、式(21)及び式(22)のtは、補助変数である。
【0084】
【0085】
【0086】
【0087】
ステップS135において、制約設定部112は、訓練データ及び前回の反復における行列Σk-1に基づいて、上述の式(22)及び式(23)を算出し、半正定値計画問題の制約条件を設定する。
【0088】
ステップS136において、射影行列更新部113は、上述の式(21)から式(23)の半正定値計画問題を解いてk番目の反復における行列Σkを算出する。なお、式(21)から式(23)の半正定値計画問題は、比較的解くことが容易な凸最適化問題であるため、既存のソルバーを用いて解くことができる。
【0089】
ステップS137において、射影行列更新部113は、k番目の反復において行列Σが収束しているか否かを判定する。この判定は、例えば、以下の式(24)を満たしているか否かに基づいて行うことができる。なお、式(24)のεは判定の閾値であり、あらかじめ設定された十分に小さいεに対して式(24)が成り立つ場合に行列Σは収束していると判定される。
【0090】
【0091】
行列Σkが収束していると判定された場合(ステップS137におけるYes)、処理はステップS138に移行し、その時点の行列Σkを最適化後の行列Σとして最適化は終了する。行列Σkが収束していないと判定された場合(ステップS137におけるNo)、処理はステップS133に移行し、最適化が継続される。
【0092】
ステップS138において、射影行列更新部113は、最適化された行列Σに対して固有値分解を行うことにより射影行列Wを算出する。その具体的な手法を説明する。まず、d行d列の行列Σからd個の固有値及びそれぞれに対応する固有ベクトルを算出する。算出されたd個の固有値を対角成分とする対角行列をD、算出されたd個の固有ベクトル(縦ベクトル)を各列に並べた直交行列をVとすると、この固有値分解は以下の式(25)のように表現することができる。
【0093】
【0094】
このようにして算出された直交行列Vから固有値の大きさに基づいてr列を選択した行列を生成することにより、d行r列の射影行列Wを算出することができる。算出された射影行列Wは、射影行列記憶部142に記憶される。
【0095】
以上のように、
図6に示したフローチャートによれば、式(17)から式(19)の最適化問題を解いて行列Σを算出し、更にこれを固有値分解して射影行列Wが算出される。これにより、式(17)から式(19)の解である最適な射影行列Wを得ることができる。
【0096】
しかしながら、最適化手順又は行列Σから射影行列Wを算出する手法はこれに限定されるものではなく、式(17)から式(19)の最適化問題から射影行列Wが得られるものであれば適宜アルゴリズムを変形してもよい。
【0097】
なお、式(17)における目的関数に含まれるminは、目的関数の態様に応じて適宜変更可能であり何らかの基準でiとjの組み合わせを決めるものであればこれに限られるものではない。しかしながら、最も影響が大きいクラスの組み合わせを考慮することができるため、目的変数はmin又はmaxを含むことが望ましい。
【0098】
また、式(18)の行列Si,j(上線省略)は、平均に限定されるものではなく、行列SiとSjの少なくとも1つを用いるものであればよい。しかしながら、2つのクラスを均等に考慮することができるため、行列Si,j(上線省略)は、式(18)のように2つのクラスの加重平均であることが望ましい。
【0099】
[第2実施形態]
以下、第2実施形態について説明する。本実施形態は第1実施形態の変形例であるため、第1実施形態と同様の要素については説明を省略又は簡略化する場合がある。
【0100】
本実施形態は、第1実施形態の式(17)から式(19)に示されている最適化問題において目的関数を変形したものである。この変形に伴う数式の違い等を除き、本実施形態の構成は第1実施形態と同様である。すなわち、本実施形態のハードウェア構成、ブロック図、フローチャート等は第1実施形態の
図1から4及び
図6と概ね同様である。したがって、本実施形態において第1実施形態と重複する部分については説明を省略する。
【0101】
本実施形態の射影行列算出処理における最適化問題は以下の式(26)及び式(27)に示す通りである。ここで、行列Sij及び行列Σは、上述の式(17)と同様である。行列Sb、Swは、上述の式(3)から式(6)により定義されるものと同じものである。行列Si,j(上線省略)は、上述の式(18)により定義されるものと同じものである。係数βは、正の実数である。
【0102】
【0103】
【0104】
本実施形態の最適化問題において、第1実施形態の最適化問題に対する相違点は、上述のβSb及びβSwの正則化項が追加されている点である。βSbは、LDAにおけるクラス間ばらつきの平均を示す正則化項(第3項)であり、βSwは、LDAのクラス内ばらつきの平均を示す正則化項(第4項)である。すなわち、本実施形態においては、第1実施形態の目的関数とLDAの目的関数とが、係数βに応じた比率の重み付け加算により両立されている。
【0105】
第1実施形態においては、複数のクラスが重複するようなクリティカルな部分を重視するために、ワーストケースのクラスの組み合わせに着目した最適化が行われる。このような最適化手法では、訓練データに外れ値がある場合に、その外れ値に極度に依存した最適化が行われる場合がある。本実施形態では、LDAにおけるクラス間分散の平均とクラス内分散の平均を示す正則化項が導入されているため、ワーストケースだけではなく平均もある程度考慮される。したがって、本実施形態においては、第1実施形態と同様の効果が得られることに加えて、LDAに基づく正則化項を導入することにより、訓練データに含まれ得る外れ値に対するロバスト性が向上する効果が得られる。
【0106】
次に、本実施形態の射影行列算出処理の詳細について説明する。処理のフロー自体は
図6と同様であるが、最適化問題の数式が異なることにより、一部のステップで用いられる数式が変更されている。そのため、本実施形態では、
図6のフローチャートを再び参照しつつ、第1実施形態と異なる数式による処理が行われるステップのみを抜き出して説明する。
【0107】
ステップS131からステップS133の処理は第1実施形態と同様であるため説明を省略する。ステップS134において、分離度算出部111は、最適化の分離度αkの値を算出する。分離度αkは、式(26)とk-1番目の反復で得られた行列Σk-1に基づいて、以下の式(28)のように定められる。
【0108】
【0109】
k番目の反復における行列Σkを求める問題は、以下の式(29)から式(31)の半正定値計画問題に帰着される。式(29)は、半正定値計画問題の目的であり、式(30)及び式(31)は半正定値計画問題の制約条件である。また、式(29)及び式(30)のtは、補助変数である。
【0110】
【0111】
【0112】
【0113】
式(29)から式(31)の半正定値計画問題は、第1実施形態の場合と同様に凸最適化問題であるため、第1実施形態と同様にして解くことができる。ステップS135からステップS138の処理は、基にする数式が上述の式(29)から式(31)である点を除いて第1実施形態と同様であるため説明を省略する。したがって、本実施形態の最適化問題に対しても第1実施形態と同様に最適な射影行列Wを算出することができる。
【0114】
[第3実施形態]
以下、第3実施形態について説明する。本実施形態は第1実施形態又は第2実施形態の変形例であるため、第1実施形態又は第2実施形態と同様の要素については説明を省略又は簡略化する場合がある。
【0115】
本実施形態は、第1実施形態の式(17)から式(19)に示されている最適化問題において目的関数を変形したものである。この変形に伴う数式の違い等を除き、本実施形態の構成は第1実施形態と同様である。すなわち、本実施形態のハードウェア構成、ブロック図、フローチャート等は第1実施形態の
図1から4及び
図6と概ね同様である。したがって、本実施形態において第1実施形態と重複する部分については説明を省略する。
【0116】
本実施形態の射影行列算出処理における最適化問題は以下の式(32)及び式(33)に示す通りである。ここで、行列Sij及び行列Σは、上述の式(17)と同様である。行列Sb、Swは、上述の式(3)から式(6)により定義されるものと同じものである。行列Siは、上述の式(10)により定義されるものと同じものである。係数βは、正の実数である。
【0117】
【0118】
【0119】
本実施形態の最適化問題においては、WLDAにおける最適化問題の目的関数に対して、第2実施形態と同様にβSb及びβSwの正則化項が追加されている点である。βSbは、LDAにおけるクラス間ばらつきの平均を示す正則化項(第3項)であり、βSwは、LDAのクラス内ばらつきの平均を示す正則化項(第4項)である。すなわち、本実施形態においては、WLDAの目的関数とLDAの目的関数とが、係数βに応じた比率の重み付け加算により両立されている。
【0120】
WLDAにおいては、複数のクラスが重複するようなクリティカルな箇所を重視するために、ワーストケースのクラスの組み合わせに着目した最適化が行われる。このような最適化手法では、訓練データに外れ値がある場合に、その外れ値に極度に依存した最適化が行われる場合がある。本実施形態では、LDAにおけるクラス間分散の平均とクラス内分散の平均を示す正則化項が導入されているため、ワーストケースだけではなく平均もある程度考慮される。したがって、本実施形態においては、WLDAと同様の効果が得られることに加えて、LDAに基づく正則化項を導入することにより、訓練データに含まれ得る外れ値に対するロバスト性が向上する効果が得られる。これにより、本実施形態によれば、より良好にクラスが分離され得る次元削減を実現する情報処理装置1が提供される。
【0121】
次に、本実施形態の射影行列算出処理の詳細について説明する。処理のフロー自体は
図6と同様であるが、最適化問題の数式が異なることにより、一部のステップで用いられる数式が変更されている。そのため、本実施形態では、
図6のフローチャートを再び参照しつつ、第1実施形態と異なる数式による処理が行われるステップのみを抜き出して説明する。
【0122】
ステップS131からステップS133の処理は第1実施形態と同様であるため説明を省略する。ステップS134において、分離度算出部111は、最適化の分離度αkの値を算出する。分離度αkは、式(32)とk-1番目の反復で得られた行列Σk-1に基づいて、以下の式(34)のように定められる。
【0123】
【0124】
k番目の反復における行列Σkを求める問題は、以下の式(35)から式(38)の半正定値計画問題に帰着される。式(35)は、半正定値計画問題の目的であり、式(36)から式(38)は半正定値計画問題の制約条件である。また、式(35)から式(37)のs、tは、補助変数である。
【0125】
【0126】
【0127】
【0128】
【0129】
式(35)から式(38)の半正定値計画問題は、第1実施形態の場合と同様に凸最適化問題であるため、第1実施形態と同様にして解くことができる。ステップS135からステップS138の処理は、基にする数式が上述の式(35)から式(38)である点を除いて第1実施形態と同様であるため説明を省略する。したがって、本実施形態の最適化問題に対しても第1実施形態と同様に最適な射影行列Wを算出することができる。
【0130】
上述の第1から第3実施形態において、処理対象となるデータの種類は特に限定されるものではない。一例として、処理対象となるデータは、生体情報から抽出された特徴量データであることが望ましい。多くの場合、特徴量データは多次元のデータであり、そのままでは処理が困難なこともある。第1から第3実施形態の処理により、特徴量データの次元削減を行うことにより、特徴量データを用いた判定がより適切なものになり得る。以下の第4実施形態では、第1実施形態乃至第3実施形態の情報処理装置1により算出される射影行列Wを用いた特徴抽出による判定結果を適用し得る装置の具体例を示す。
【0131】
[第4実施形態]
以下、第4実施形態について説明する。第4実施形態では、第1実施形態乃至第3実施形態の情報処理装置1の適用例として、イヤホンにより取得された音響特性に基づいて耳音響照合を行う情報処理システムを例示する。耳音響照合とは、人物の外耳道を含む頭部の音響特性を照合することにより人物の異同を判定する技術である。外耳道の音響特性は人物ごとに異なるため、個人照合に用いる生体情報に適している。そのため、耳音響照合は、イヤホン等のヒアラブルデバイスのユーザ判別に用いられることがある。なお、耳音響照合は、人物の異同の判定だけでなく、ヒアラブルデバイスの装着状態判定に用いられることもある。
【0132】
図7は、本実施形態に係る情報処理システムの全体構成を示す模式図である。情報処理システムは、互いに無線通信接続され得る情報処理装置1とイヤホン2とを備える。
【0133】
イヤホン2は、イヤホン制御装置20、スピーカ26及びマイクロホン27を備える。イヤホン2は、ユーザ3の頭部、特に耳に装着可能な音響機器であり、典型的にはワイヤレスイヤホン、ワイヤレスヘッドセット等である。スピーカ26は、装着時にユーザ3の外耳道に向けて音波を発する音波発生部として機能するものであり、イヤホン2の装着面側に配されている。マイクロホン27は、装着時にユーザ3の外耳道等で反響した音波を受けることができるようにイヤホン2の装着面側に配されている。イヤホン制御装置20は、スピーカ26及びマイクロホン27の制御及び情報処理装置1との通信を行う。
【0134】
なお、本明細書において、音波、音声等の「音」は、周波数又は音圧レベルが可聴範囲外である非可聴音を含むものとする。
【0135】
情報処理装置1は、第1乃至第3実施形態で述べたものと同様の装置である。情報処理装置1は、例えば、イヤホン2と通信可能に接続されるコンピュータであり、音響情報に基づく生体照合を行う。情報処理装置1は、更に、イヤホン2の動作の制御、イヤホン2から発せられる音波の生成用の音声データの送信、イヤホン2が受けた音波から得られた音声データの受信等を行う。具体例としては、ユーザ3がイヤホン2を用いて音楽鑑賞を行う場合には、情報処理装置1は、音楽の圧縮データをイヤホン2に送信する。また、イヤホン2がイベント会場、病院等における業務指令用の電話装置である場合には、情報処理装置1は業務指示の音声データをイヤホン2に送信する。この場合、更に、ユーザ3の発話の音声データをイヤホン2から情報処理装置1に送信してもよい。
【0136】
なお、この全体構成は一例であり、例えば、情報処理装置1とイヤホン2が有線接続されていてもよい。また、情報処理装置1とイヤホン2が一体の装置として構成されていてもよく、情報処理システム内に更に別の装置が含まれていてもよい。
【0137】
図8は、イヤホン制御装置20のハードウェア構成例を示すブロック図である。イヤホン制御装置20は、プロセッサ201、メモリ202、スピーカI/F203、マイクロホンI/F204、通信I/F205及びバッテリ206を備える。なお、イヤホン制御装置20の各部は、不図示のバス、配線、駆動装置等を介して相互に接続される。
【0138】
プロセッサ201、メモリ202及び通信I/F205の説明は第1実施形態と重複するため省略する。
【0139】
スピーカI/F203は、スピーカ26を駆動するためのインターフェースである。スピーカI/F203は、デジタルアナログ変換回路、増幅器等を含む。スピーカI/F203は、音声データをアナログ信号に変換し、スピーカ26に供給する。これによりスピーカ26は、音声データに基づく音波を発する。
【0140】
マイクロホンI/F204は、マイクロホン27から信号を取得するためのインターフェースである。マイクロホンI/F204は、アナログデジタル変換回路、増幅器等を含む。マイクロホンI/F204は、マイクロホン27が受け取った音波により生じたアナログ信号をデジタル信号に変換する。これにより、イヤホン制御装置20は、受け取った音波に基づく音声データを取得する。
【0141】
バッテリ206は、例えば二次電池であり、イヤホン2の動作に必要な電力を供給する。これにより、イヤホン2は、外部の電源に有線接続することなく、ワイヤレスで動作することができる。イヤホン2が有線接続である場合には、バッテリ208は設けられていなくてもよい。
【0142】
なお、
図8に示されているハードウェア構成は例示であり、これら以外の装置が追加されていてもよく、一部の装置が設けられていなくてもよい。また、一部の装置が同様の機能を有する別の装置に置換されていてもよい。例えば、イヤホン2はユーザ3による操作を受け付けることができるようにボタン等の入力装置を更に備えていてもよく、ユーザ3に情報を提供するためのディスプレイ、表示灯等の表示装置を更に備えていてもよい。このように
図8に示されているハードウェア構成は適宜変更可能である。
【0143】
図9は、本実施形態に係るイヤホン2及び情報処理装置1の機能ブロック図である。情報処理装置1は、音響特性取得部151、第2特徴抽出部131、特徴選択部132、判定部133、出力部134、対象データ記憶部143及び射影行列記憶部142を備える。イヤホン2のブロック図の構成は
図7と同様であるため説明を省略する。情報処理装置1の機能ブロックのうち、音響特性取得部151以外の部分の機能は第1実施形態で述べたものと同様である。なお、あらかじめ訓練済みの射影行列Wが射影行列記憶部142に記憶されているものとし、
図9においては訓練用の機能ブロックの図示が省略されている。各機能ブロックにより行われる具体的な処理の内容については後述する。
【0144】
なお、
図9において、情報処理装置1内に記載されている機能ブロックの各機能の一部又は全部は、情報処理装置1ではなくイヤホン制御装置20に設けられていてもよい。すなわち、上述の各機能は、情報処理装置1によって実現されてもよく、イヤホン制御装置20によって実現されてもよく、情報処理装置1とイヤホン制御装置20とが協働することにより実現されてもよい。以下の説明では、特記されている場合を除き、
図9に示されているとおり、音響情報の取得及び判定に関する各機能ブロックは情報処理装置1内に設けられているものとする。
【0145】
図10は、本実施形態に係る情報処理装置1により行われる生体照合処理の概略を示すフローチャートである。
図10を参照して、情報処理装置1の動作を説明する。
【0146】
図10の生体照合処理は、例えば、ユーザ3がイヤホン2を操作することにより使用を開始した場合に実行される。あるいは、
図10の生体照合処理は、イヤホン2の電源がオンである場合に所定の時間が経過するごとに実行されてもよい。
【0147】
ステップS26において、音響特性取得部151は、イヤホン制御装置20に対し、検査音を発するための指示を行う。イヤホン制御装置20は、スピーカ26に検査用信号を送信し、スピーカ26は、検査用信号に基づいて生成された検査音をユーザ3の外耳道に発する。
【0148】
検査用信号には、チャープ信号、M系列(Maximum Length Sequence)信号、白色雑音、インパルス信号等の所定範囲の周波数成分を含む信号が用いられ得る。これにより、所定範囲内の周波数の情報を含む音響信号を取得することができる。なお、検査音は、周波数及び音圧レベルが可聴範囲内である可聴音であり得る。この場合、照合時に音波をユーザ3に知覚させることにより、照合を行っていることをユーザ3に知らせることができる。また、検査音は、周波数又は音圧レベルが可聴範囲外である非可聴音であってもよい。この場合、音波がユーザ3に知覚されにくくすることができ、利用時の快適性が向上する。
【0149】
ステップS27において、マイクロホン27は外耳道等における反響音(耳音響)を受信して時間ドメインの電気信号に変換する。この電気信号は、音響信号と呼ばれることもある。マイクロホン27は、音響信号をイヤホン制御装置20に送信し、イヤホン制御装置20は、音響信号を情報処理装置1に送信する。
【0150】
ステップS28において、音響特性取得部151は、ユーザの頭部を伝搬する音波に基づく周波数ドメインの音響特性を取得する。この音響特性は、例えば、時間ドメインの音響信号を高速フーリエ変換等のアルゴリズムを用いて周波数ドメインに変換することにより得られる周波数スペクトラムであり得る。
【0151】
ステップS29において、対象データ記憶部143は、取得された音響特性を特徴量抽出の対象データとして記憶する。
【0152】
ステップS21からステップS25の処理は
図4と同じ処理であるため重複する説明を省略する。なお、耳音響照合の場合においては、各ステップの処理は以下のように具体化され得るが、これに限られるものではない。
【0153】
ステップS22における対象データから特徴量データを抽出する処理は、例えば、音響特性から対数スペクトラム、メルケプストラム係数、線形予測分析係数等を抽出する処理であり得る。ステップS23における特徴選択の処理は、ステップS22において抽出された特徴量データである多次元ベクトルに対して射影行列を作用させて次元を削減する処理であり得る。ステップS24における判定処理は、特徴量データに対応するユーザ3があらかじめ登録されている1又は2以上の登録者の特徴量データのいずれかと合致するか否かを判定する処理であり得る。ステップS25において出力された判定結果は、例えば、イヤホン2の使用許可又は不許可の制御に用いられる。
【0154】
なお、本実施形態では、耳音響照合の例を説明したが、これ以外の生体情報を用いた生体照合にも同様に適用可能である。適用可能な生体情報の例としては、顔、虹彩、指紋、掌紋、静脈、声、耳介、歩容等が挙げられる。
【0155】
本実施形態によれば、第1実施形態乃至第3実施形態の構成により得られる射影行列を用いることにより、生体情報から抽出された特徴量データに対して好適に次元削減を行うことができる情報処理装置1が提供される。
【0156】
上述の実施形態において説明した装置又はシステムは以下の第5実施形態及び第6実施形態のようにも構成することができる。
【0157】
[第5実施形態]
図11は、第5実施形態に係る情報処理装置4の機能ブロック図である。情報処理装置4は、取得手段401及び算出手段402を備える。取得手段401は、各々が複数のクラスのいずれかに分類された複数のデータを取得する。算出手段402は、複数のデータの統計量を含む目的関数に基づいて、複数のデータの次元削減に用いられる射影行列を算出する。目的関数は、複数のクラスのうちの第1クラスと第2クラスの間における、複数のデータのクラス間ばらつきを示す第1項を含む第1関数と、第1クラスと第2クラスの少なくとも1つにおける、複数のデータのクラス内ばらつきを示す第2項を含む第2関数と、を含む。
【0158】
本実施形態によれば、より良好にクラスが分離され得る次元削減を実現する情報処理装置4が提供される。
【0159】
[第6実施形態]
本実施形態の機能ブロック構成は第5実施形態と同様であるため、
図11を再び参照して第6実施形態を説明する。
図11は、第6実施形態に係る情報処理装置4の機能ブロック図である。情報処理装置4は、取得手段401及び算出手段402を備える。取得手段401は、各々が複数のクラスのいずれかに分類された複数のデータを取得する。算出手段402は、複数のデータの統計量を含む目的関数に基づいて、複数のデータの次元削減に用いられる射影行列を算出する。目的関数は、複数のデータのクラス間ばらつきを示す第1項と、複数のクラスにわたる複数のデータのクラス間ばらつきの平均を示す第3項とを含む第1関数の複数のクラスにわたる最小値と、複数のデータのクラス内ばらつきを示す第2項と、複数のクラスにわたる前記複数のデータのクラス内ばらつきの平均を示す第4項とを含む第2関数の複数のクラスにわたる最大値との比を含む。
【0160】
本実施形態によれば、より良好にクラスが分離され得る次元削減を実現する情報処理装置4が提供される。
【0161】
[変形実施形態]
この開示は、上述の実施形態に限定されることなく、この開示の趣旨を逸脱しない範囲において適宜変更可能である。例えば、いずれかの実施形態の一部の構成を他の実施形態に追加した例や、他の実施形態の一部の構成と置換した例も、この開示の実施形態である。
【0162】
上述の実施形態においては、クラス内ばらつき又はクラス間ばらつきの指標として分散が例示的に用いられているが、ばらつきの指標になり得る統計量であれば分散以外のものを用いてもよい。
【0163】
上述の実施形態の機能を実現するように該実施形態の構成を動作させるプログラムを記憶媒体に記録させ、記憶媒体に記録されたプログラムをコードとして読み出し、コンピュータにおいて実行する処理方法も各実施形態の範疇に含まれる。すなわち、コンピュータ読取可能な記憶媒体も各実施形態の範囲に含まれる。また、上述のプログラムが記録された記憶媒体だけでなく、そのプログラム自体も各実施形態に含まれる。また、上述の実施形態に含まれる1又は2以上の構成要素は、各構成要素の機能を実現するように構成されたASIC、FPGA等の回路であってもよい。
【0164】
該記憶媒体としては例えばフロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD(Compact Disk)-ROM、磁気テープ、不揮発性メモリカード、ROMを用いることができる。また該記憶媒体に記録されたプログラム単体で処理を実行しているものに限らず、他のソフトウェア、拡張ボードの機能と共同して、OS(Operating System)上で動作して処理を実行するものも各実施形態の範疇に含まれる。
【0165】
上述の各実施形態の機能により実現されるサービスは、SaaS(Software as a Service)の形態でユーザに対して提供することもできる。
【0166】
なお、上述の実施形態は、いずれもこの開示を実施するにあたっての具体化の例を示したものに過ぎず、これらによってこの開示の技術的範囲が限定的に解釈されてはならないものである。すなわち、この開示はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
【0167】
上述の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
【0168】
(付記1)
各々が複数のクラスのいずれかに分類された複数のデータを取得する取得手段と、
前記複数のデータの統計量を含む目的関数に基づいて、前記複数のデータの次元削減に用いられる射影行列を算出する算出手段と、
を有し、
前記目的関数は、前記複数のクラスのうちの第1クラスと第2クラスの間における、前記複数のデータのクラス間ばらつきを示す第1項を含む第1関数と、前記第1クラスと前記第2クラスの少なくとも1つにおける、前記複数のデータのクラス内ばらつきを示す第2項を含む第2関数と、を含む、
情報処理装置。
【0169】
(付記2)
前記目的関数は、前記第1関数と前記第2関数の比の、前記複数のクラスにわたる最小値又は最大値を含む、
付記1に記載の情報処理装置。
【0170】
(付記3)
前記第2関数は、前記第1クラスにおける前記複数のデータのクラス内ばらつきと、前記第2クラスにおける前記複数のデータのクラス内ばらつきとの加重平均を含む、
付記1又は2に記載の情報処理装置。
【0171】
(付記4)
前記第1関数は、前記複数のクラスにわたる前記複数のデータのクラス間ばらつきの平均を示す第3項を更に含み、
前記第2関数は、前記複数のクラスにわたる前記複数のデータのクラス内ばらつきの平均を示す第4項を更に含む、
付記1乃至3のいずれか1項に記載の情報処理装置。
【0172】
(付記5)
各々が複数のクラスのいずれかに分類された複数のデータを取得する取得手段と、
前記複数のデータの統計量を含む目的関数に基づいて、前記複数のデータの次元削減に用いられる射影行列を算出する算出手段と、
を有し、
前記目的関数は、前記複数のデータのクラス間ばらつきを示す第1項と、前記複数のクラスにわたる前記複数のデータのクラス間ばらつきの平均を示す第3項とを含む第1関数の前記複数のクラスにわたる最小値と、前記複数のデータのクラス内ばらつきを示す第2項と、前記複数のクラスにわたる前記複数のデータのクラス内ばらつきの平均を示す第4項とを含む第2関数の前記複数のクラスにわたる最大値との比を含む、
情報処理装置。
【0173】
(付記6)
前記算出手段は、所定の制約条件の下で前記目的関数を最大化又は最小化する最適化を行うことにより、前記射影行列の決定を行う、
付記1乃至5のいずれか1項に記載の情報処理装置。
【0174】
(付記7)
前記データは、生体情報から抽出された特徴量データである、
付記1乃至6のいずれか1項に記載の情報処理装置。
【0175】
(付記8)
コンピュータに、
各々が複数のクラスのいずれかに分類された複数のデータを取得するステップと、
前記複数のデータの統計量を含む目的関数に基づいて、前記複数のデータの次元削減に用いられる射影行列を算出するステップと、
を有し、
前記目的関数は、前記複数のクラスのうちの第1クラスと第2クラスの間における、前記複数のデータのクラス間ばらつきを示す第1項を含む第1関数と、前記第1クラスと前記第2クラスの少なくとも1つにおける、前記複数のデータのクラス内ばらつきを示す第2項を含む第2関数と、を含む、
情報処理方法を実行させる情報処理方法。
【0176】
(付記9)
コンピュータに、
各々が複数のクラスのいずれかに分類された複数のデータを取得するステップと、
前記複数のデータの統計量を含む目的関数に基づいて、前記複数のデータの次元削減に用いられる射影行列を算出するステップと、
を有し、
前記目的関数は、前記複数のデータのクラス間ばらつきを示す第1項と、前記複数のクラスにわたる前記複数のデータのクラス間ばらつきの平均を示す第3項とを含む第1関数の前記複数のクラスにわたる最小値と、前記複数のデータのクラス内ばらつきを示す第2項と、前記複数のクラスにわたる前記複数のデータのクラス内ばらつきの平均を示す第4項とを含む第2関数の前記複数のクラスにわたる最大値との比を含む、
情報処理方法を実行させる情報処理方法。
【0177】
(付記10)
コンピュータに、
各々が複数のクラスのいずれかに分類された複数のデータを取得するステップと、
前記複数のデータの統計量を含む目的関数に基づいて、前記複数のデータの次元削減に用いられる射影行列を算出するステップと、
を有し、
前記目的関数は、前記複数のクラスのうちの第1クラスと第2クラスの間における、前記複数のデータのクラス間ばらつきを示す第1項を含む第1関数と、前記第1クラスと前記第2クラスの少なくとも1つにおける、前記複数のデータのクラス内ばらつきを示す第2項を含む第2関数と、を含む、
情報処理方法を実行させるためのプログラムが記憶された記憶媒体。
【0178】
(付記11)
コンピュータに、
各々が複数のクラスのいずれかに分類された複数のデータを取得するステップと、
前記複数のデータの統計量を含む目的関数に基づいて、前記複数のデータの次元削減に用いられる射影行列を算出するステップと、
を有し、
前記目的関数は、前記複数のデータのクラス間ばらつきを示す第1項と、前記複数のクラスにわたる前記複数のデータのクラス間ばらつきの平均を示す第3項とを含む第1関数の前記複数のクラスにわたる最小値と、前記複数のデータのクラス内ばらつきを示す第2項と、前記複数のクラスにわたる前記複数のデータのクラス内ばらつきの平均を示す第4項とを含む第2関数の前記複数のクラスにわたる最大値との比を含む、
情報処理方法を実行させるためのプログラムが記憶された記憶媒体。
【符号の説明】
【0179】
1、4 情報処理装置
2 イヤホン
3 ユーザ
20 イヤホン制御装置
26 スピーカ
27 マイクロホン
101、201 プロセッサ
102、202 メモリ
103、205 通信I/F
104 入力装置
105 出力装置
110 射影行列算出部
111 分離度算出部
112 制約設定部
113 射影行列更新部
121 第1特徴抽出部
131 第2特徴抽出部
132 特徴選択部
133 判定部
134 出力部
141 訓練データ記憶部
142 射影行列記憶部
143 対象データ記憶部
151 音響特性取得部
203 スピーカI/F
204 マイクロホンI/F
206 バッテリ
401 取得手段
402 算出手段