IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ セコム株式会社の特許一覧

特開2023-147845学習方法、判定方法、信頼度推定装置及び認識装置
<>
  • 特開-学習方法、判定方法、信頼度推定装置及び認識装置 図1
  • 特開-学習方法、判定方法、信頼度推定装置及び認識装置 図2
  • 特開-学習方法、判定方法、信頼度推定装置及び認識装置 図3
  • 特開-学習方法、判定方法、信頼度推定装置及び認識装置 図4
  • 特開-学習方法、判定方法、信頼度推定装置及び認識装置 図5
  • 特開-学習方法、判定方法、信頼度推定装置及び認識装置 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023147845
(43)【公開日】2023-10-13
(54)【発明の名称】学習方法、判定方法、信頼度推定装置及び認識装置
(51)【国際特許分類】
   G06V 10/772 20220101AFI20231005BHJP
   G06V 10/82 20220101ALI20231005BHJP
   G06N 20/00 20190101ALI20231005BHJP
【FI】
G06V10/772
G06V10/82
G06N20/00 130
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022055578
(22)【出願日】2022-03-30
(71)【出願人】
【識別番号】000108085
【氏名又は名称】セコム株式会社
(74)【代理人】
【識別番号】100103850
【弁理士】
【氏名又は名称】田中 秀▲てつ▼
(74)【代理人】
【識別番号】100114177
【弁理士】
【氏名又は名称】小林 龍
(74)【代理人】
【識別番号】100066980
【弁理士】
【氏名又は名称】森 哲也
(72)【発明者】
【氏名】佐野 友祐
(72)【発明者】
【氏名】糸賀 健
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096CA02
5L096CA22
5L096DA02
5L096GA30
5L096GA51
5L096HA11
5L096JA13
5L096KA04
5L096KA15
(57)【要約】
【課題】入力データを特徴量抽出部に入力することで得られた特徴量が、入力データのクラスの識別にどの程度適しているかを推定する。
【解決手段】入力データを特徴量抽出部に入力することで得られる入力データのクラスの識別に用いる特徴量の信頼度を推定する信頼度推定装置の学習方法では、正解クラスのデータである正解クラスデータを特徴量抽出部に入力して正解クラスデータの特徴量を抽出し(S1)、抽出された特徴量をクラス識別部に入力してクラス識別部が識別したクラスが正解クラスである確度を表す値である正解信頼度を算出し(S2)、正解クラスデータの特徴量を入力した信頼度推定装置が出力する信頼度が、正解信頼度と一致するように信頼度推定装置を学習する(S3、S4)。
【選択図】図4
【特許請求の範囲】
【請求項1】
入力データを特徴量抽出部に入力することで得られる前記入力データのクラスの識別に用いる特徴量の信頼度を推定する信頼度推定装置の学習方法であって 、
正解クラスのデータである正解クラスデータを前記特徴量抽出部に入力して前記正解クラスデータの前記特徴量を抽出し、
抽出された前記特徴量をクラス識別部に入力して前記クラス識別部が識別したクラスが前記正解クラスである確度を表す値である正解信頼度を算出し、
前記正解クラスデータの前記特徴量を入力した前記信頼度推定装置が出力する前記信頼度が、前記正解信頼度と一致するように前記信頼度推定装置を学習する、
ことを特徴とする学習方法。
【請求項2】
複数の層のニューラルネットワークによって形成された前記特徴量抽出部の中間層から抽出した特徴量及び前記特徴量抽出部が最終的に抽出した特徴量の少なくとも一つを用いて前記信頼度推定装置を学習することを特徴とする請求項1に記載の学習方法。
【請求項3】
前記正解信頼度が高くなるように前記特徴量抽出部と前記クラス識別部とを学習すると同時に、前記信頼度推定装置を学習することを特徴とする請求項1又は2に記載の学習方法。
【請求項4】
前記正解信頼度が高くなるように前記クラス識別部を学習すると同時に前記信頼度推定装置を学習することを特徴とする請求項1又は2に記載の学習方法。
【請求項5】
請求項1~4のいずれか一項に記載の学習方法で学習した信頼度推定装置。
【請求項6】
入力データの特徴量から抽出された特徴量を判定する判定方法であって、
入力データの特徴量を抽出する特徴量抽出部に、識別対象のクラスのデータである識別対象クラスデータを入力して前記識別対象クラスデータの特徴量を抽出し、
請求項1~4のいずれか一項に記載の学習方法で学習した前記信頼度推定装置によって、前記特徴量抽出部が抽出した前記特徴量の前記信頼度を推定し、
前記信頼度推定装置によって推定した前記信頼度に基づいて、前記特徴量抽出部が抽出した前記特徴量を、前記識別対象のクラスを識別するテンプレート特徴量として採用するか否かを判定する、
ことを特徴とする判定方法。
【請求項7】
請求項6に記載の判定方法によって採用された前記テンプレート特徴量と、前記特徴量抽出部と、を備えることを特徴とする認識装置。
【請求項8】
入力データの特徴量を抽出する特徴量抽出部と、前記特徴量抽出部が抽出した特徴量に基づいて前記入力データのクラスを識別するクラス識別部と、を備える認識装置であって、
入力データを前記特徴量抽出部に入力して前記入力データの特徴量を抽出し、
請求項1~4のいずれか一項に記載の学習方法で学習した前記信頼度推定装置によって、前記入力データの特徴量の信頼度を推定し、
前記信頼度に応じて、前記入力データに対する処理を変更する、
ことを特徴とする認識装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習方法、判定方法、信頼度推定装置及び認識装置に関する。
【背景技術】
【0002】
特許文献1には、入力画像の特徴量を抽出する特徴量抽出手段と、特定クラスのテンプレート特徴量を記憶するテンプレート特徴量記憶手段と、特徴量抽出手段が抽出した特徴量とテンプレート特徴量とに基づいて、入力画像のクラスを識別する識別手段と、を備える認識装置が記載されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2021-117565号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記のような認識装置で高い認識精度を実現するために、先行技術では特徴量抽出手段に関する発明が提案されている。
例えば特許文献1では、認識装置の特徴量抽出モデルよりも高精度だが計算量の多い教師特徴量抽出モデルを用意し、特徴量抽出モデルが出力する特徴量を、教師特徴量抽出モデルが出力する特徴量へ一致するように学習を行う。これにより、計算量の少ない高精度な特徴量抽出モデルを獲得し、物体認識を実現している。
しかし、より高い認識精度を実現するためには、高精度な特徴量抽出手段を用意するだけでは不十分である。テンプレート特徴量記憶手段に記憶しておくテンプレート特徴量を、認識すべきクラスにとって最適なテンプレート特徴量とすることが望まれる。
【0005】
しかしながら、上記特許文献1はどのようにテンプレート特徴量を構成するかについて言及しておらず、生成したテンプレート特徴量が、認識すべきクラスにとって最適となるように予め生成されたテンプレート特徴量(以下「最適テンプレート特徴量」と表記することがある)となるとは限らない。この場合には、例えばテンプレート特徴量記憶手段に記憶されているテンプレート特徴量が、クラスの識別にどの程度適しているかが不明となる。
本発明は、上記の問題点を鑑みてなされたものであり、入力データを特徴量抽出部に入力することで得られた特徴量が、入力データのクラスの識別にどの程度適しているかを推定することを目的とする。
【課題を解決するための手段】
【0006】
本発明の一形態によれば、入力データを特徴量抽出部に入力することで得られる入力データのクラスの識別に用いる特徴量の信頼度を推定する信頼度推定装置の学習方法が与えられる。学習方法では、正解クラスのデータである正解クラスデータを特徴量抽出部に入力して正解クラスデータの特徴量を抽出し、抽出された特徴量をクラス識別部に入力してクラス識別部が識別したクラスが正解クラスである確度を表す値である正解信頼度を算出し、正解クラスデータの特徴量を入力した信頼度推定装置が出力する信頼度が、正解信頼度と一致するように信頼度推定装置を学習する。
本発明の他の形態によれば、上記の学習方法で学習した信頼度推定装置が与えられる。クラス識別部が参照となるテンプレート特徴量を用いて正解信頼度を算出するが、信頼度推定装置は、参照となるテンプレート特徴量を用いずに信頼度を出力できる。そのため、学習済みの正解クラス以外の特徴量についても信頼度を出力できる。
【0007】
本発明のさらに他の形態によれば、入力データの特徴量から抽出された特徴量を判定する判定方法が与えられる。判定方法では、入力データの特徴量を抽出する特徴量抽出部に、識別対象のクラスのデータである識別対象クラスデータを入力して識別対象クラスデータの特徴量を抽出し、上記の学習方法で学習した信頼度推定装置によって、特徴量抽出部が抽出した特徴量の信頼度を推定し、信頼度推定装置によって推定した信頼度に基づいて、特徴量抽出部が抽出した特徴量を、識別対象のクラスを識別するテンプレート特徴量として採用するか否かを判定する。
本発明のさらに他の形態によれば、上記の判定方法によって採用されたテンプレート特徴量と、特徴量抽出部と、を備えることを特徴とする認識装置が与えられる。
【0008】
本発明のさらに他の形態によれば、入力データの特徴量を抽出する特徴量抽出部と、特徴量抽出部が抽出した特徴量に基づいて入力データのクラスを識別するクラス識別部と、を備える認識装置が与えられる、認識装置は、入力データを特徴量抽出部に入力して入力データの特徴量を抽出し、上記の学習方法で学習した信頼度推定装置によって、入力データの特徴量の信頼度を推定し、信頼度に応じて入力データに対する処理を変更する。
【発明の効果】
【0009】
本発明によれば、入力データを特徴量抽出部に入力することで得られた特徴量が、入力データのクラスの識別にどの程度適しているかを推定できる。
【図面の簡単な説明】
【0010】
図1】本発明の実施形態に係る認識装置又は学習装置のハードウエア構成例を示す概略図である。
図2】本発明の実施形態に係る学習装置の機能構成例のブロック図である。
図3】本発明の実施形態に係る認識装置の機能構成例のブロック図である。
図4】本発明の実施形態に係る信頼度推定部の学習方法の一例のフローチャートである。
図5】本発明の実施形態に係る認識装置において入力データの特徴量をテンプレート特徴量記憶部に記憶する登録処理の一例のフローチャートである。
図6】本発明の実施形態に係る認識装置において入力データを識別する識別処理の一例のフローチャートである。
【発明を実施するための形態】
【0011】
以下において、図面を参照して本発明の実施形態を説明する。なお、以下に示す本発明の実施形態は、本発明6の技術的思想を具体化するための装置や方法を例示するものであって、本発明の技術的思想は、構成部品の構造、配置等を下記のものに特定するものではない。本発明の技術的思想は、特許請求の範囲に記載された請求項が規定する技術的範囲内において、種々の変更を加えることができる。
なお、本発明の実施形態の一例として、入力データとして画像を受け付け、特定のクラス(例えば人物)の入力画像の特徴量を抽出して、抽出された特徴量に基づいて入力画像のクラスを認識する認識装置の例を説明する。認識装置は、例えば顔認証を行ってもよく、人物同定(Re-Identification:ReID)を行ってもよい。しかし、本発明はこれに限定されず、例えば入力データとして音声信号を受け付けて入力音声のクラスを認識する認識装置に対しても適用できる。
【0012】
図1は、本発明の実施形態に係る認識装置1又は学習装置10のハードウエア構成例を示す概略図である。認識装置1及び学習装置10は、基本的に同様のハードウエア構成で構成してよい。認識装置1及び学習装置10を一体のハードウエア(同一のハードウエア)によって実現してもよく、別個のハードウエアで構成してもよい。
認識装置1及び学習装置10は、撮影部2と、通信部3と、記憶部4と、画像処理部5と、出力部6と、及び操作入力部7を備える。
【0013】
撮影部2は、所定の領域を監視する目的で設置される監視カメラであり、当該領域内に滞在する人物が撮影できる位置に取り付けられる。撮影部2で撮影した画像は通信部3を介して画像処理部5に送信される。
通信部3は、撮影部2、画像処理部5、出力部6及び操作入力部7の間でデータの送受信を行なう。LAN(Local Area Network)や、インターネット等の公衆回線を利用できる。
【0014】
記憶部4は、HDD(Hard Disk Drive)又はSSD(Solid State Drive)等で構成され、オペレーティングシステムを含む各種プログラム、及び各種データを格納する。
画像処理部5は、CPU、MPU、周辺回路、端子、各種メモリ等で構成され、撮影部2が撮影した画像に対して画像処理を施した結果を、通信部3を介して出力部6に送信する。
【0015】
出力部6は、認識装置1により生成された各種情報を出力するディスプレイ、プロジェクタ、プリンタ、リムーバブルドライブ装置、USB(Universal Serial Bus)インターフェース、ネットワークインターフェース等である。
操作入力部7は、ユーザーにより操作され、テンプレートや検索範囲の指定入力を受け付けるためのマウスやキーボード等である。
【0016】
図2は、本発明の実施形態に係る学習装置10の機能構成例のブロック図である。学習装置10は、入力データの特徴量が入力データのクラスの識別にどの程度適しているかを表す指標値(以下「信頼度」と表記する)を推定する信頼度推定部16を学習する用途に用いられる装置である。いいかえれば、信頼度とは、特徴量を用いて入力データのクラスを識別した際に、正しくクラス識別できるかの確度を表す値である。
学習装置10は、学習データ取得部11と、特徴量抽出モデル記憶部12と、特徴量抽出部13と、テンプレート特徴量記憶部14と、クラス識別部15と、信頼度推定部16と、信頼度推定モデル記憶部17と、学習部18を備える。
図1の撮影部2又は記憶部4は、学習データ取得部11として機能し、記憶部4は、特徴量抽出モデル記憶部12、テンプレート特徴量記憶部14及び信頼度推定モデル記憶部17として機能し、画像処理部5は、特徴量抽出部13、クラス識別部15、信頼度推定部16及び学習部18として機能する。
【0017】
学習データ取得部11は、既知のクラス(以下「正解クラス」と表記することがある)のデータを学習用データとして取得する。なお正解クラスは1個であってもよく複数個であってもよい。例えば学習データ取得部11は、予め学習用データとして用意され記憶部4に格納された正解クラスのデータを学習用データとして取得してよい。また、学習データ取得部11は、撮影部2で正解クラスを撮影して得られた画像を学習用データとして取得してもよい。
【0018】
特徴量抽出モデル記憶部12には、特徴量抽出モデルが格納される。例えば、特徴量抽出モデルは、深層学習(Deep Learning)で用いられるような多層のネットワークで構成されたCNNでモデル化してよい。この場合、特徴量抽出モデルは、畳み込み層や活性化関数、プーリング(pooling)層などの複数の層が直列に接続されたネットワーク構造を有し、特徴量抽出モデル記憶部12は、ネットワークを構成するフィルタのフィルタ係数やネットワーク構造などを含めた情報を記憶する。これらフィルタ係数などの各層のパラメータが学習によって更新される。
【0019】
特徴量抽出部13は、特徴量抽出モデルを用いて学習用データの特徴量を抽出する。特徴量抽出部13は、特徴量抽出モデル記憶部12から特徴量抽出モデルを読み出す。また特徴量抽出部13は、学習データ取得部11から学習用データを入力する。特徴量抽出部13は、学習用データを特徴量抽出モデルに入力し、特徴量抽出モデルが出力した特徴量をクラス識別部15と、信頼度推定部16と出力する。なお、特徴量抽出部13の特徴量抽出モデルが複数層のCNNで構成される場合、特徴量抽出部13は、最終段の層のCNNから出力される特徴量を信頼度推定部16に出力してもよく、任意の中間層のCNNから出力される特徴量を信頼度推定部16に出力してもよく、最終段の層のCNNから出力される特徴量と中間層のCNNから出力される特徴量の両方を信頼度推定部16に出力してよい。
【0020】
クラス識別部15は、テンプレート特徴量記憶部14から各々の正解クラスの最適テンプレート特徴量を読み出す。またクラス識別部15は、特徴量抽出部13が学習用データから抽出した特徴量を入力する。クラス識別部15は、特徴量抽出部13から入力したデータと、テンプレート特徴量記憶部14から読み出したテンプレート特徴量とを比較することにより、学習用データのクラスが各々の正解クラスである確率を示す確率分布を出力する。以下の説明において、ある正解クラスの学習用データから抽出された特徴量を入力したときにクラス識別部15から出力される当該正解クラスの確率を、その特徴量の「真値信頼度」と表記する。真値信頼度は、特許請求の範囲に記載の「正解信頼度」の一例である。
クラス識別部15が最適テンプレート特徴量を用いて、高い確率で正解クラスを識別できる特徴量は高い真値信頼度を有し、低い確率で正解クラスを識別する特徴量は低い真値信頼度を有する。すなわち真値信頼度は、特徴量がクラス識別にどの程度適しているかを表す指標値として用いることができる。クラス識別部15は、真値信頼度を学習部18に出力する。
【0021】
例えばクラス識別部15は、特徴量fと、各正解クラスCkの最適テンプレート特徴量を表現する行列W=(w1,w2、…)との積により、ロジット列a=(a1,a2,…)を出力する(a=Wf)。ここでロジットakは、ak=ln(p(x│Ck)p(Ck))を表現している。p(Ck)は識別対象が正解クラスCkに属している確率であり、p(x│Ck)は正解クラスCkに属する対象を計測したとき特徴ベクトルxが観測される確率密度分布である。
または、特徴量fと行列Wとの積により、尤度列p(x│.)=(p(x│C1),p(x│C2),…)を出力し(p=Wf)、予め用意した事前分布p(Ck)を用いて上記ロジットの定義式からロジット列aを算出する。
その後、ロジット列aにソフトマック関数p(Ck│x)=exp(ak)/(Σexp(aj))を適応し、(事後)確率列(すなわち確率分布)p(.│x)=(p(C_1│x),p(C_2│x),…)を得る。
なおクラス識別部15は、正解クラスの確率の代わりに、正解クラスのロジットや尤度を真値信頼度として学習部18に出力してもよい。
例えばクラス識別部15を、深層学習で用いられるような多層のネットワークで構成されたCNNでモデル化することにより、ネットワークのフィルタ係数などの各層のパラメータを学習により変更できるようにしてもよい。
【0022】
テンプレート特徴量記憶部14には、正解クラスの最適テンプレート特徴量が格納される。最適テンプレート特徴量は、例えば通信部3が、外部から受信してテンプレート特徴量記憶部14に記憶してもよい。最適テンプレート特徴量は、学習によって算出してもよい。例えば、正解クラスの学習用データから抽出した特徴量と、正解クラスのテンプレート特徴量とをクラス識別部15に入力し、出力される真値信頼度が高くなるようにテンプレート特徴量を学習してもよい。
【0023】
信頼度推定部16は、特徴量抽出部13から出力される学習用データの特徴量を入力する。特徴量抽出部13の特徴量抽出モデルが複数層のCNNで構成される場合、最終段の層のCNNから出力される特徴量を入力してもよく、任意の中間層のCNNから出力される特徴量を入力してもよく、最終段の層のCNNから出力される特徴量と中間層のCNNから出力される特徴量の両方を入力してもよい。
【0024】
また、信頼度推定部16は、信頼度推定モデル記憶部17に記憶されている信頼度推定モデルを読み出す。信頼度推定モデルは、参照となるテンプレート特徴量を用いることなく、特徴量抽出部13から入力された特徴量に対してクラス識別部15が出力する真値信頼度を推定する推定モデルである。以下の説明において信頼度推定部16によって推定された真値信頼度を「推定信頼度R」と表記する。信頼度推定部16は、特徴量抽出部13から入力した特徴量を信頼度推定モデルに入力して推定信頼度Rを推定し、推定された推定信頼度Rを学習部18に出力する。
【0025】
信頼度推定モデルは、例えば、深層学習で用いられるような多層のネットワークで構成されたCNNでモデル化してよい。この場合、信頼度推定モデルは、畳み込み層や活性化関数、プーリング(pooling)層などの複数の層が直列に接続されたネットワーク構造を有し、信頼度推定モデル記憶部17は、ネットワークを構成するフィルタのフィルタ係数やネットワーク構造などを含めた情報を記憶する。これらフィルタ係数などの各層のパラメータが学習によって更新される。
【0026】
学習部18は、特徴量抽出部13が出力した正解クラスの特徴量を、クラス識別部15と信頼度推定部16のそれぞれへ入力して得られる真値信頼度と推定信頼度Rとが一致するように、信頼度推定部16の信頼度推定モデルを学習する。具体的には、信頼度推定部16が出力する推定信頼度Rの、クラス識別部15が出力する真値信頼度に対する誤差を最小化するように信頼度推定モデルを学習する。
【0027】
例えば、推定信頼度Rと真値信頼度の平均二乗誤差を算出して当該誤差をエネルギー関数とする勾配法や座標降下法によって当該誤差を小さくするための信頼度推定モデルのパラメータ更新量を算出し、当該更新量だけ信頼度推定モデルを更新しては再び推定信頼度Rを算出させて平均二乗誤差を評価するという処理を、反復終了条件を満たすまで反復する。ここで反復終了条件としては、例えば誤差が予め定めた閾値以下となる、または反復回数(信頼度推定モデルの更新回数)が予め定めた上限回数に達することとすればよい。
【0028】
これにより、信頼度推定部16は、最適テンプレート特徴量を介さずに、直接に真値信頼度を推定するように学習される。このように学習した信頼度推定部16を用いることで、特徴量抽出部13に入力される入力データのクラスが学習用データの正解クラスに含まれているか否かに関わらず、特徴量抽出部13から出力される全ての特徴量に対して推定信頼度Rを出力できる。
【0029】
なお、学習部18は、信頼度推定モデルの学習と同時に、特徴量抽出モデル記憶部12に記憶される特徴量抽出モデルと、テンプレート特徴量記憶部14に記憶されるテンプレート特徴量とを学習してもよい。学習部18は、例えば正解クラスの学習用データから特徴量抽出モデルにより抽出した特徴量と、正解クラスのテンプレート特徴量とをクラス識別部15に入力し、出力される真値信頼度が高くなるように特徴量抽出モデルとテンプレート特徴量を学習し、同時に、信頼度推定モデルにより推定した推定信頼度Rが、この真値信頼度に一致するように信頼度推定モデルを学習してもよい。学習部18は、特徴量抽出モデルを固定して(すなわち特徴量抽出モデルを学習しないで)テンプレート特徴量のみを信頼度推定モデルと同時に学習してもよい。
【0030】
図3は、本発明の実施形態に係る認識装置1の機能構成例のブロック図である。認識装置1は、認識対象のクラス(以下「認識対象クラス」と表記する)のデータを入力データとして取得し、入力データの特徴量を抽出し、抽出した特徴量とテンプレート特徴量とに基づいて入力データのクラスを認識する装置である。
認識装置1は、入力データ取得部21と、特徴量抽出モデル記憶部22と、特徴量抽出部23と、テンプレート特徴量記憶部24と、クラス識別部25と、信頼度推定部26と、信頼度推定モデル記憶部27と、特徴量選別部29と、識別結果出力部30を備える。
図1の撮影部2は、入力データ取得部21として機能し、記憶部4は、特徴量抽出モデル記憶部22、テンプレート特徴量記憶部24及び信頼度推定モデル記憶部27として機能し、画像処理部5は、特徴量抽出部23、クラス識別部25、信頼度推定部26、特徴量選別部29として機能し、出力部6は、識別結果出力部30として機能する。
【0031】
特徴量抽出モデル記憶部22と、特徴量抽出部23と、クラス識別部25と、信頼度推定部26と、信頼度推定モデル記憶部27の構成は、図2を参照して説明した学習装置10の特徴量抽出モデル記憶部12と、特徴量抽出部13と、クラス識別部15と、信頼度推定部16と、信頼度推定モデル記憶部17と同様の構成を有していてよい。
例えば認識装置1及び学習装置10を、一体のハードウエア(同一のハードウエア)によって実現する場合には、特徴量抽出モデル記憶部12と、特徴量抽出部13と、クラス識別部15と、信頼度推定部16と、信頼度推定モデル記憶部17を、特徴量抽出モデル記憶部22と、特徴量抽出部23と、クラス識別部25と、信頼度推定部26と、信頼度推定モデル記憶部27として使用してよい。
【0032】
入力データ取得部21は、認識対象クラスのデータを入力データとして取得する。例えば入力データ取得部21は、認識対象クラスを撮影部2で撮影して得られた画像を入力データとして取得してもよい。
【0033】
信頼度推定モデル記憶部27には、学習装置10によって学習した信頼度推定モデルを記憶する。認識装置1と学習装置10とを別個のハードウエアで実現する場合、学習装置10の信頼度推定モデル記憶部17から学習済みの信頼度推定モデルを、出力部6で出力して、認識装置1の信頼度推定モデル記憶部27に記憶してよい。
同様に、学習装置10の特徴量抽出モデル記憶部12から特徴量抽出モデルを出力部6で出力して、特徴量抽出モデル記憶部22に記憶してもよい。特徴量抽出モデル記憶部22には、学習装置10を用いて学習した際の特徴量抽出モデルを記憶する。学習装置10の特徴量抽出モデル記憶部12から特徴量抽出モデルを出力部6で出力して、特徴量抽出モデル記憶部22に記憶してもよい。
【0034】
テンプレート特徴量記憶部24には、クラス識別部25が入力データのクラスの認識に用いるテンプレート特徴量が記憶される。学習用データに含まれていないクラス(以下、「未学習クラス」と表記することがある)については、最適テンプレート特徴量が提供されないことがある。この場合、認識装置1のテンプレート特徴量記憶部24には、未学習クラスの暫定的なテンプレート特徴量が記憶される。
未学習クラスのテンプレート特徴量をテンプレート特徴量記憶部24に記憶する際に、ユーザーは、図1の操作入力部7を操作してテンプレート特徴量をテンプレート特徴量記憶部24に記憶させる登録処理の実行を指示してよい。登録処理の実行時には、入力データ取得部21に未学習クラスのデータを入力する。特徴量抽出部23は、未学習クラスのデータから特徴量を抽出し、抽出された特徴量を未学習クラスのテンプレート特徴量としてテンプレート特徴量記憶部24に記憶する。
【0035】
なお、上記のとおり特徴量抽出部23に入力される未学習クラスのデータが、クラスの識別に適していないことがある。この場合には、テンプレート特徴量に適した特徴量を抽出できない。したがって、後述の信頼度推定部26を用いて特徴量の推定信頼度Rを求め、未学習クラスのデータの特徴量がテンプレート特徴量に適しているか否かを判定してよい。例えば推定信頼度Rが閾値Th1より大きい場合に、未学習クラスのデータから抽出した特徴量をテンプレート特徴量としてテンプレート特徴量記憶部24に記憶し、推定信頼度Rが閾値Th1以下の場合には記憶しなくてよい。
【0036】
このため特徴量選別部29は、テンプレート特徴量の登録処理において未学習クラスの入力データの特徴量を特徴量抽出部23が出力したときに、この特徴量を入力した信頼度推定部26から出力された推定信頼度Rに応じて、特徴量抽出部23が出力した特徴量を選別する。例えば、推定信頼度Rが所定閾値Th1より大きい場合に、特徴量抽出部23から出力された特徴量をテンプレート特徴量としてテンプレート特徴量記憶部24に記憶する。推定信頼度Rが所定閾値Th1以下であるときに、特徴量抽出部23から出力された特徴量をテンプレート特徴量としてテンプレート特徴量記憶部24に記憶しない。
これにより、クラス識別に適していない特徴量を精度よく判断して、テンプレート特徴量として使用するか否かを判定することが可能となるため、誤認証率を抑制することが可能となる。
【0037】
次に、認識装置1によって入力データの識別処理を行う場合には、入力データ取得部21に識別対象のデータを入力する。特徴量抽出部23は入力データの特徴量を抽出する。推定信頼度Rが所定閾値Th2より大きい場合に、特徴量抽出部23から出力された特徴量をクラス識別部25に入力する。推定信頼度Rが所定閾値Th2以下であるときに、特徴量抽出部23から出力された特徴量をクラス識別部25に入力しない。これにより特徴量選別部29は、入力データの特徴量の推定信頼度Rに応じて、この入力データのクラスの識別結果をクラス識別部25から出力するか否かを判定する。
これにより、クラス識別に適していない特徴量を精度よく判断して、クラス識別するか否かを判定することが可能となるため、誤認証率を抑制することが可能となる。
【0038】
識別結果出力部30は、クラス識別部25の識別結果を出力する。すなわち入力データのクラスの認識結果を出力する。特徴量選別部29によって、クラス識別部25への特徴量の入力が禁止された場合に、識別結果出力部30は、入力データのクラスが認識されなかった旨の情報を出力してよい。
【0039】
なお、認識装置1及び学習装置10を、一体のハードウエア(同一のハードウエア)によって実現する場合には、信頼度推定モデル記憶部27に記憶された信頼度推定モデルの学習と同時に、特徴量抽出部23の特徴量抽出モデルとクラス識別部25を学習してもよい。特徴量抽出モデルを固定して(すなわち特徴量抽出モデルを学習しないで)クラス識別部25のみを信頼度推定モデルと同時に学習してもよい。
【0040】
(変形例)
上記の実施形態では、特徴量選別部29は、信頼度推定部26が推定した信頼度に応じて、クラス識別部25への特徴量の入力を停止する(すなわちクラス識別部25による入力データのクラスの識別結果の出力を停止する)例について説明したが、本発明はこれに限定されるものではない。本発明は、認識装置1は、信頼度推定部26が推定した信頼度に応じて入力データに対する処理を変更するものであれば、他の様々な変形例に適用できる。
【0041】
例えば、認識装置1は、信頼度推定部26が推定した信頼度に応じて入力データをクラスの識別処理に利用するか否かを判定する判定部を備えてよい。例えば、判定部は信頼度が所定値より低い場合に入力データをクラス識別に利用しないと判定してよい。例えば、入力データをクラスの識別に利用しないと判定した場合に特徴量抽出部23は、クラス識別部25が入力データのクラスを認識するための特徴量の出力を停止してもよい。また例えば、入力データをクラスの識別処理に利用しないと判定した場合にクラス識別部25は、入力データのクラスを識別した識別結果の出力を停止してもよい。
【0042】
また例えば、入力データをクラスの識別処理に利用しないと判定した場合に、入力データから特徴量抽出部23が抽出した特徴量を、テンプレート特徴量としてテンプレート特徴量記憶部24に記憶することを禁止してよい。
【0043】
(動作)
図4は、本発明の実施形態に係る信頼度推定部26の学習方法の一例のフローチャートである。
ステップS1において特徴量抽出部13は、学習用データに含まれる正解クラスの入力データの特徴量を抽出する。
ステップS2においてクラス識別部15は、特徴量抽出部13が抽出した特徴量と正解クラスの最適テンプレート特徴量とに基づいて入力データのクラスを識別し、入力データのクラスが正解クラスである確率を示す真値信頼度を出力する。
ステップS3において信頼度推定部16は、特徴量抽出部13が抽出した特徴量を入力して、この特徴量に対してクラス識別部15から出力される真値信頼度の推定値である推定信頼度Rを出力する。
【0044】
ステップS4において学習部18は、信頼度推定部16が出力する推定信頼度Rが、クラス識別部15が出力する真値信頼度と一致するように信頼度推定部16の信頼度推定モデルを学習する。
ステップS5において学習部18は、信頼度推定部16の学習が完了したか否かを判定する。信頼度推定部16の学習が完了した場合(ステップS5:Y)に処理は終了する。信頼度推定部16の学習が完了しない場合(ステップS:N)に処理はステップS1へ戻る。
【0045】
図5は、本発明の実施形態に係る認識装置1において入力データの特徴量をテンプレート特徴量記憶部24に記憶する登録処理の一例のフローチャートである。
ステップS10において特徴量抽出部23は、入力データ取得部21が取得した認識対象クラスの入力データの特徴量を抽出する。
ステップS11において信頼度推定部26は、特徴量抽出部23が抽出した特徴量を入力して、この特徴量に対してクラス識別部25から出力される真値信頼度の推定値である推定信頼度Rを出力する。
【0046】
ステップS12において特徴量選別部29は、推定信頼度Rが所定閾値Th1より大きいか否かを判定する。推定信頼度Rが所定閾値Th1より大きい場合(ステップS12:Y)に処理はステップS13へ進む。推定信頼度Rが所定閾値Th1以下である場合(ステップS12:N)に処理は終了する。
ステップS13において特徴量選別部29は、ステップS10で抽出された特徴量をテンプレート特徴量としてテンプレート特徴量記憶部24に記憶する。その後に処理は終了する。
【0047】
図6は、本発明の実施形態に係る認識装置1において入力データを識別する識別処理の一例のフローチャートである。
ステップS20において特徴量抽出部23は、入力データ取得部21が取得した認識対象クラスの入力データの特徴量を抽出する。
ステップS21において信頼度推定部26は、特徴量抽出部23が抽出した特徴量を入力して、この特徴量に対してクラス識別部25から出力される真値信頼度の推定値である推定信頼度Rを出力する。
ステップS22において特徴量選別部29は、推定信頼度Rが所定閾値Th2より大きいか否かを判定する。推定信頼度Rが所定閾値Th2より大きい場合(ステップS22:Y)に処理はステップS23へ進む。推定信頼度Rが所定閾値Th2以下である場合(ステップS23:N)に処理は終了する。
ステップS23において特徴量選別部29は、ステップS10で抽出された特徴量を入力したクラス識別部25に入力する。クラス識別部25は入力された特徴量に基づいて、入力データのクラスを識別する。その後に処理は終了する。
【0048】
(実施形態の効果)
(1)学習装置10は、認識装置1の特徴量抽出部23に入力データを入力することで得られる入力データのクラスの識別に用いる特徴量の信頼度を推定する信頼度推定部26を学習する。信頼度推定部26は、参照となるテンプレート特徴量を用いずに信頼度を算出する点で、正解クラス毎にテンプレート特徴量を用意して信頼度を算出するクラス識別部15と相違する。
学習装置10の特徴量抽出部13は、正解クラスのデータである正解クラスデータを入力して正解クラスデータの特徴量を抽出する。クラス識別部15は、特徴量抽出部13が抽出した特徴量を入力して、クラス識別部15が識別したクラスが正解クラスである確度を表す値である正解信頼度を算出する。学習部18は、正解クラスデータの特徴量を入力した信頼度推定部16が出力する信頼度が、正解信頼度と一致するように信頼度推定部16を学習する。
これにより、入力データを認識装置1の特徴量抽出部23に入力することで得られた特徴量が、入力データのクラスの識別にどの程度適しているか表す信頼度を推定できる。特に、クラス識別部15は正解クラス毎にテンプレートを用意する為、正解クラスに関しては高い信頼度を出力できる反面、正解クラス以外は信頼度を出力できない。これに対して、信頼度推定部26は、参照となるテンプレート特徴量なしで信頼度を出力できるた、学習済みの正解クラス以外のクラスに対しても信頼度を出力できる。
【0049】
(2)複数の層のニューラルネットワークによって形成された特徴量抽出部13の中間層から抽出した特徴量及び特徴量抽出部13が最終的に抽出した特徴量の少なくとも一つを用いて信頼度推定部16を学習してもよい。
これにより、信頼度推定部16をより効率的に学習する特徴量を選択できる。さらに、信頼度推定部16は、特徴量抽出部13の特徴量抽出の過程も参照して、特徴量の信頼度を推定することが可能となる。その結果、より詳細な信頼度推定が可能となる。
【0050】
(3)正解信頼度が高くなるように特徴量抽出部13とクラス識別部15とを学習すると同時に、信頼度推定部16を学習してもよい。または、正解信頼度が高くなるようにクラス識別部15を学習すると同時に信頼度推定部16を学習してもよい。
このように、信頼度推定部16と同時に特徴量抽出部13やクラス識別部15を学習することで、学習効率を向上できる。
【0051】
(4)認識装置1は、学習装置10によって学習した信頼度認識部26を備える。入力データの特徴量から抽出された特徴量を判定する。入力データの特徴量を抽出する特徴量抽出部23は、識別対象のクラスのデータである識別対象クラスデータを入力して識別対象クラスデータの特徴量を抽出する。信頼度認識部26は、特徴量抽出部23が抽出した特徴量の信頼度を推定する。特徴量選別部29は、信頼度推定装置26によって推定した信頼度に基づいて、特徴量抽出部23が抽出した前記特徴量を、識別対象のクラスを識別するテンプレート特徴量として採用するか否かを判定する。
これにより、クラス識別に適している特徴量のみを選別して、テンプレート特徴量として利用することができる。この結果、学習用データに含まれない未学習クラスに対して、最適テンプレート特徴量が提供されない場合であっても未学習クラスの認識精度を向上できる。
【0052】
(5)認識装置1は、入力データの特徴量を抽出する特徴量抽出部23と、特徴量抽出部23が抽出した特徴量に基づいて入力データのクラスを識別するクラス識別部25と、学習装置10によって学習した信頼度推定部26を備える。特徴量抽出部23は、入力データの特徴量を抽出する。信頼度推定部26は、学習対象クラスデータの特徴量の信頼度を推定する。認識装置1は、信頼度推定部26が推定した信頼度に応じて、入力データに対する処理を変更する。
これにより、クラス識別に適していない特徴量を精度よく判断して利用するか判定することが可能となるため、誤認証率を抑制することが可能となる。
【符号の説明】
【0053】
1…認識装置、2…撮影部、3…通信部、4…記憶部、5…画像処理部、6…出力部、7…操作入力部、10…学習装置、11…学習データ取得部、12、22…特徴量抽出モデル記憶部、13、23…特徴量抽出部、14、24…テンプレート特徴量記憶部、15、25…クラス識別部、16、26…信頼度推定部、17、27…信頼度推定モデル記憶部、18…学習部、21…入力データ取得部、29…特徴量選別部、30…識別結果出力部
図1
図2
図3
図4
図5
図6