(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022180959
(43)【公開日】2022-12-07
(54)【発明の名称】情報処理装置、情報処理方法及び情報処理プログラム
(51)【国際特許分類】
G06T 7/00 20170101AFI20221130BHJP
【FI】
G06T7/00 350B
【審査請求】有
【請求項の数】17
【出願形態】OL
(21)【出願番号】P 2021087754
(22)【出願日】2021-05-25
(71)【出願人】
【識別番号】501440684
【氏名又は名称】ソフトバンク株式会社
(71)【出願人】
【識別番号】500132214
【氏名又は名称】学校法人明星学苑
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】堀 隆之
(72)【発明者】
【氏名】金 容範
(72)【発明者】
【氏名】鈴木 裕真
(72)【発明者】
【氏名】植木 一也
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA06
5L096BA08
5L096DA02
5L096FA32
5L096FA33
5L096GA30
5L096GA51
5L096HA09
5L096JA03
5L096JA11
5L096JA18
5L096KA04
(57)【要約】
【課題】画像認識モデルの学習に必要な学習データセットを自動で生成可能とする。
【解決手段】本願に係る情報処理装置は、対象物が撮像された対象物画像に含まれる対象物に関する属性を示す属性ラベルが付与された対象物画像と類似する類似画像に対して属性ラベルを付与する第1付与部と、第1付与部によって属性ラベルを付与された類似画像を画像解析することで、未知の対象物画像に対して属性ラベルを付与するためのラベル付与ルールを生成する生成部と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
対象物が撮像された対象物画像に含まれる前記対象物に関する属性を示す属性ラベルが付与された前記対象物画像と類似する類似画像に対して前記属性ラベルを付与する第1付与部と、
前記第1付与部によって前記属性ラベルを付与された前記類似画像を画像解析することで、未知の前記対象物画像に対して前記属性ラベルを付与するためのラベル付与ルールを生成する生成部と、
を備える情報処理装置。
【請求項2】
前記対象物画像の特徴を示す特徴ベクトルの特徴ベクトル空間における空間分布において特定の偏りを有する第1空間分布における第1特徴ベクトルと処理対象の対象物画像の特徴を示す処理対象特徴ベクトルとの第1類似度、および、前記第1空間分布を除く他の空間分布と前記第1空間分布とを含む前記特徴ベクトル空間における空間分布である第2空間分布における第2特徴ベクトルと前記処理対象特徴ベクトルとの第2類似度を算出する算出部と、
前記算出部によって算出された第1類似度と第2類似度に応じて、前記処理対象の対象物画像に対して前記特定の偏りに対応する属性を示す属性ラベルを付与する付与部と、
をさらに備える請求項1に記載の情報処理装置。
【請求項3】
前記生成部によって生成された前記ラベル付与ルールに基づいて、前記未知の前記対象物画像に対して前記属性ラベルを付与する第2付与部
をさらに備える請求項1または2に記載の情報処理装置。
【請求項4】
前記生成部は、
前記類似画像のうち前記対象物を含む対象物領域の輝度値を画像解析することで、前記対象物領域における前記輝度値の特徴を示す前記ラベル付与ルールを生成する、
請求項1~3のいずれか1つに記載の情報処理装置。
【請求項5】
前記対象物は、人物の顔であり、
前記対象物画像は、前記人物の顔が撮像された顔画像である、
請求項1~4のいずれか1つに記載の情報処理装置。
【請求項6】
対象物が撮像された対象物画像の特徴を示す特徴ベクトルの特徴ベクトル空間における空間分布において特定の偏りを有する第1空間分布における第1特徴ベクトルと処理対象の対象物画像の特徴を示す処理対象特徴ベクトルとの第1類似度、および、前記第1空間分布を除く他の空間分布と前記第1空間分布とを含む前記特徴ベクトル空間における空間分布である第2空間分布における第2特徴ベクトルと前記処理対象特徴ベクトルとの第2類似度を算出する算出部と、
前記算出部によって算出された第1類似度と第2類似度に応じて、前記処理対象の対象物画像に対して前記特定の偏りに対応する属性を示す属性ラベルを付与する付与部と、
を備える情報処理装置。
【請求項7】
前記付与部は、
前記第1類似度と前記第2類似度との比率に応じて、前記処理対象の対象物画像に対して前記属性ラベルと前記対象物が前記属性を有する確率値との組であるソフトな属性ラベルを付与する、
請求項6に記載の情報処理装置。
【請求項8】
前記算出部は、
前記第1空間分布を代表する特徴ベクトルである前記第1特徴ベクトルと前記処理対象特徴ベクトルとの前記第1類似度、および、前記第2空間分布を代表する特徴ベクトルである前記第2特徴ベクトルと前記処理対象特徴ベクトルとの前記第2類似度を算出する、
請求項6または7に記載の情報処理装置。
【請求項9】
前記算出部は、
前記第1空間分布に属する特徴ベクトルの平均値、中央値または最頻値である前記第1特徴ベクトルと前記処理対象特徴ベクトルとの前記第1類似度、および、前記第2空間分布に属する特徴ベクトルの平均値、中央値または最頻値である前記第2特徴ベクトルと前記処理対象特徴ベクトルとの前記第2類似度を算出する、
請求項6~8のいずれか1つに記載の情報処理装置。
【請求項10】
前記特徴ベクトル空間は、前記対象物画像の画素値の特徴を示す画素値ベクトルの画素値ベクトル空間である、
請求項6~9のいずれか1つに記載の情報処理装置。
【請求項11】
前記特徴ベクトル空間は、前記対象物画像が入力された場合に、前記対象物が前記対象物に関する複数の属性それぞれを有する確率値をそれぞれ出力するよう学習された学習済みモデルの中間層から出力される中間ベクトルの中間ベクトル空間である、
請求項6~10のいずれか1つに記載の情報処理装置。
【請求項12】
前記特徴ベクトル空間は、前記対象物画像が入力された場合に、前記対象物が前記対象物に関する複数の属性それぞれを有する確率値をそれぞれ出力するよう学習された学習済みモデルから出力された確率値をベクトル化した確率値ベクトルの確率値ベクトル空間である、
請求項6~11のいずれか1つに記載の情報処理装置。
【請求項13】
前記算出部は、
異なる複数の特徴ベクトル空間それぞれにおける前記第1空間分布の偏りの大きさの比較に基づいて、前記第1空間分布の偏りの大きさが最大である前記第1空間分布における前記第1特徴ベクトルと前記処理対象特徴ベクトルとの前記第1類似度を算出する、
請求項6~12のいずれか1つに記載の情報処理装置。
【請求項14】
情報処理装置が実行するプログラムにより実現される情報処理方法であって、
対象物が撮像された対象物画像に含まれる前記対象物に関する属性を示す属性ラベルが付与された前記対象物画像と類似する類似画像に対して前記属性ラベルを付与する第1付与工程と、
前記第1付与工程によって前記属性ラベルを付与された前記類似画像を画像解析することで、未知の前記対象物画像に対して前記属性ラベルを付与するためのラベル付与ルールを生成する生成工程と、
を含む情報処理方法。
【請求項15】
対象物が撮像された対象物画像に含まれる前記対象物に関する属性を示す属性ラベルが付与された前記対象物画像と類似する類似画像に対して前記属性ラベルを付与する第1付与手順と、
前記第1付与手順によって前記属性ラベルを付与された前記類似画像を画像解析することで、未知の前記対象物画像に対して前記属性ラベルを付与するためのラベル付与ルールを生成する生成手順と、
をコンピュータに実行させる情報処理プログラム。
【請求項16】
情報処理装置が実行するプログラムにより実現される情報処理方法であって、
対象物が撮像された対象物画像の特徴を示す特徴ベクトルの特徴ベクトル空間における空間分布において特定の偏りを有する第1空間分布における第1特徴ベクトルと処理対象の対象物画像の特徴を示す処理対象特徴ベクトルとの第1類似度、および、前記第1空間分布を除く他の空間分布と前記第1空間分布とを含む前記特徴ベクトル空間における空間分布である第2空間分布における第2特徴ベクトルと前記処理対象特徴ベクトルとの第2類似度を算出する算出工程と、
前記算出工程によって算出された第1類似度と第2類似度に応じて、前記処理対象の対象物画像に対して前記特定の偏りに対応する属性を示す属性ラベルを付与する付与工程と、
を含む情報処理方法。
【請求項17】
対象物が撮像された対象物画像の特徴を示す特徴ベクトルの特徴ベクトル空間における空間分布において特定の偏りを有する第1空間分布における第1特徴ベクトルと処理対象の対象物画像の特徴を示す処理対象特徴ベクトルとの第1類似度、および、前記第1空間分布を除く他の空間分布と前記第1空間分布とを含む前記特徴ベクトル空間における空間分布である第2空間分布における第2特徴ベクトルと前記処理対象特徴ベクトルとの第2類似度を算出する算出手順と、
前記算出手順によって算出された第1類似度と第2類似度に応じて、前記処理対象の対象物画像に対して前記特定の偏りに対応する属性を示す属性ラベルを付与する付与手順と、
をコンピュータに実行させる情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。
【背景技術】
【0002】
画像に含まれる対象物を認識する画像認識モデルに対象物の新しい属性を認識させるには、画像認識モデルに対象物の新しい属性を学習させる必要がある。一般的に、精度の高い画像認識モデルを生成するためには、大量の学習データセットが必要である。ここで、学習データデータセットとは、画像に含まれる対象物に関する属性を示す属性ラベルと画像との組のデータである。しかしながら、大量の学習データセットを人手によって作成するのには大変な手間がかかる。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2020-140518号公報
【特許文献2】国際公開第2015/186278号
【発明の概要】
【発明が解決しようとする課題】
【0004】
画像認識モデルの学習に必要な学習データセットを自動で生成可能とする技術が望まれている。
【課題を解決するための手段】
【0005】
本願に係る情報処理装置は、対象物が撮像された対象物画像に含まれる前記対象物に関する属性を示す属性ラベルが付与された前記対象物画像と類似する類似画像に対して前記属性ラベルを付与する第1付与部と、前記第1付与部によって前記属性ラベルを付与された前記類似画像を画像解析することで、未知の前記対象物画像に対して前記属性ラベルを付与するためのラベル付与ルールを生成する生成部と、を備える。
【図面の簡単な説明】
【0006】
【
図1】
図1は、第1の実施形態に係る情報処理装置の構成例を示す図である。
【
図2】
図2は、第1の実施形態に係る情報処理手順を示す図である。
【
図3】
図3は、第2の実施形態に係る情報処理装置の構成例を示す図である。
【
図4】
図4は、第2の実施形態に係る特徴ベクトル空間の一例を示す図である。
【
図5】
図5は、第2の実施形態に係る特徴ベクトル空間の一例を示す図である。
【
図6】
図6は、第2の実施形態に係る特徴ベクトル空間の一例を示す図である。
【
図7】
図7は、第2の実施形態に係る情報処理手順を示す図である。
【
図8】
図8は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0007】
以下に、本願に係る情報処理装置、情報処理方法及び情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法及び情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0008】
〔1.第1の実施形態〕
〔1-1.情報処理装置の構成〕
まず、
図1を用いて、第1の実施形態に係る情報処理装置の構成について説明する。
図1は、第1の実施形態に係る情報処理装置の構成例を示す図である。
図1に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを有する。
【0009】
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)、モデムチップ及びアンテナモジュール等によって実現される。また、通信部110は、ネットワークN(図示略)と有線又は無線で接続される。
【0010】
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ等の半導体メモリ素子、又は、ハードディスク、光ディスク等の記憶装置によって実現される。
【0011】
(制御部130)
制御部130は、コントローラ(Controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等によって、情報処理装置100の内部の記憶装置に記憶されている各種プログラム(情報処理プログラムの一例に相当)がRAM等の記憶領域を作業領域として実行されることにより実現される。
図1に示す例では、制御部130は、取得部131と、第1付与部132と、生成部133と、第2付与部134を有する。
【0012】
(取得部131)
取得部131は、人物の顔に関する新しい属性を示す属性ラベルが付与された少量(例えば、10枚など)の属性ラベル付き顔画像を取得する。ここで、新しい属性を示す属性ラベル(以下、新たな属性ラベルともいう)とは、画像認識モデルに学習させたい新しい属性を示す属性ラベルのことを指すものとする。すなわち、新たな属性ラベルとは、画像に含まれる人物の顔を認識する画像認識モデルがまだ学習していない未知の属性を示す属性ラベルのことを指すものとする。例えば、取得部131は、通信部110を介して、情報処理装置を利用する利用者の端末装置から少量の新たな属性ラベル付き顔画像を取得してよい。
【0013】
また、取得部131は、新たな属性ラベルが付与されていない大量(例えば、1万枚など)の顔画像を取得する。例えば、取得部131は、通信部110を介して、インターネット上をクローリングして、新たな属性ラベルが付与されていない大量の顔画像を取得する。例えば、取得部131は、ラベル付き顔画像の数と比べて、多い数の顔画像を取得する。なお、取得部131は、インターネット上をクローリングする代わりに、顔画像を保存する外部のデータベース等から大量の顔画像を取得してもよい。
【0014】
(第1付与部132)
第1付与部132は、新たな属性ラベルが付与された顔画像と類似する類似画像に対して新たな属性ラベルを付与する。具体例には、第1付与部132は、取得部131が少量の新たな属性ラベル付き顔画像と大量の顔画像を取得すると、少量の新たな属性ラベル付き顔画像と大量の顔画像それぞれとの類似度を算出する。例えば、第1付与部132は、少量の新たな属性ラベル付き顔画像それぞれの特徴点を抽出し、抽出した特徴点に対応する特徴量をクラスタリングする。また、第1付与部132は、大量の顔画像それぞれの特徴点を抽出し、抽出した特徴点に対応する特徴量を、少量の新たな属性ラベル付き顔画像について生成した各クラスターに分類する。続いて、第1付与部132は、少量の新たな属性ラベル付き顔画像の各クラスターの平均と、大量の顔画像それぞれの各クラスターに属する特徴点との類似度を算出する。続いて、第1付与部132は、算出した各特徴点の類似度に基づいて、少量の新たな属性ラベル付き顔画像と大量の顔画像それぞれとの類似度を算出する。続いて、第1付与部132は、大量の顔画像のうち、算出した類似度が所定の閾値を上回る顔画像を類似画像であると判定する。続いて、第1付与部132は、類似画像であると判定した顔画像に対して、新たな属性ラベルを付与する。
【0015】
(生成部133)
生成部133は、第1付与部132によって新たな属性ラベルを付与された類似画像を画像解析することで、未知の顔画像に対して新たな属性ラベルを付与するためのラベル付与ルールを生成する。なお、生成部133は、第1付与部132によって新たな属性ラベルを付与された類似画像に加えて、少量の新たな属性ラベル付き顔画像を画像解析することで、新たな属性ラベルを付与するためのラベル付与ルールを生成してよい。
【0016】
例えば、生成部133は、類似画像のうち人物の顔を含む顔領域を抽出して、抽出した顔領域の輝度値を画像解析することで、顔領域における輝度値の特徴を示すラベル付与ルールを生成する。例えば、生成部133は、類似画像における顔領域の特徴点を抽出し、抽出した特徴点に対応する特徴量をクラスタリングする。続いて、生成部133は、クラスタリングした各特徴点の平均を算出し、算出した各クラスターの平均との類似度に基づいて、新たな属性ラベルを付与するか否かを決定するというラベル付与ルールを生成してよい。例えば、生成部133は、各クラスターの平均との類似度がそれぞれ所定の閾値を超える場合に、新たな属性ラベルを付与するというラベル付与ルールを生成してよい。
【0017】
(第2付与部134)
第2付与部134は、生成部133によって生成されたラベル付与ルールに基づいて、未知の顔画像に対して新たな属性ラベルを付与する。例えば、第2付与部134は、取得部131が取得した大量の顔画像に対して新たな属性ラベルを付与してよい。また、第2付与部134は、取得部131が新たに取得した顔画像に対して新たな属性ラベルを付与してよい。例えば、第2付与部134は、取得部131が新たに取得した顔画像に含まれる顔領域を抽出して、生成部133によって生成されたラベル付与ルールに基づいて、抽出した顔領域の輝度値を画像解析する。例えば、第2付与部134は、顔領域の特徴点を抽出し、抽出した特徴点に対応する特徴量を、生成部133が生成したラベル付与ルールに関する各クラスターに分類する。続いて、第2付与部134は、生成部133が生成したラベル付与ルールにおける各クラスターの平均と、各クラスターに分類された特徴量との類似度をそれぞれ算出し、算出した類似度がそれぞれ所定の閾値を超えるか否かを判定する。例えば、第2付与部134は、ラベル付与ルールに基づいて、各クラスターの平均との類似度がそれぞれ所定の閾値を超える場合に、新たな属性ラベルを付与する。
【0018】
〔1-2.情報処理のフロー〕
次に、
図2を用いて、第1の実施形態に係る情報処理の手順について説明する。
図2は、第1の実施形態に係る情報処理の一例を示すフローチャートである。
図2では、取得部131は、少量の属性ラベル付き顔画像、および、インターネット上等から大量の顔画像を取得する(ステップS101)。
【0019】
第1付与部132は、少量の属性ラベル付き顔画像と大量の顔画像それぞれとの類似度を判定し、大量の顔画像のうち、少量の属性ラベル付き顔画像と類似する類似画像に属性ラベルを付与する(ステップS102)。
【0020】
生成部133は、属性ラベル付き顔画像を画像解析することで、未知の顔画像に属性ラベルを付与するためのラベル付与ルールを生成する(ステップS103)。
【0021】
第2付与部134は、生成部133によって生成されたラベル付与ルールに基づいて、未知の顔画像に対して属性ラベルを付与する(ステップS104)。
【0022】
〔2.第2の実施形態〕
〔2-1.情報処理装置の構成〕
次に、
図3を用いて、第2の実施形態に係る情報処理装置の構成について説明する。
図3は、第2の実施形態に係る情報処理装置の構成例を示す図である。
図3に示すように、情報処理装置200は、通信部210と、記憶部220と、制御部230とを有する。
【0023】
(通信部210)
通信部210は、例えば、NIC、モデムチップ及びアンテナモジュール等によって実現される。また、通信部210は、ネットワークN(図示略)と有線又は無線で接続される。
【0024】
(記憶部220)
記憶部220は、例えば、RAM、フラッシュメモリ等の半導体メモリ素子、又は、ハードディスク、光ディスク等の記憶装置によって実現される。
【0025】
(制御部230)
制御部230は、コントローラであり、例えば、CPU、MPU、ASICやFPGA等によって、情報処理装置200の内部の記憶装置に記憶されている各種プログラム(情報処理プログラムの一例に相当)がRAM等の記憶領域を作業領域として実行されることにより実現される。
図3に示す例では、制御部230は、取得部231と、生成部232と、算出部233と、付与部234を有する。
【0026】
(取得部231)
取得部231は、大量(例えば、1万枚など)の顔画像を取得する。例えば、取得部231は、新たな属性ラベルが付与されていない大量の顔画像を取得する。例えば、取得部231は、通信部210を介して、インターネット上をクローリングして、新たな属性ラベルが付与されていない大量の顔画像を取得する。なお、取得部231は、インターネット上をクローリングする代わりに、顔画像を保存する外部のデータベース等から大量の顔画像を取得してもよい。
【0027】
(生成部232)
生成部232は、顔画像の特徴を示す特徴ベクトルを生成する。具体例には、生成部232は、取得部231が顔画像を取得した場合に、取得部231が取得した顔画像の特徴を示す特徴ベクトルを生成する。例えば、生成部232は、取得部231が取得した大量の顔画像それぞれの特徴を示す特徴ベクトルをそれぞれ生成する。
【0028】
例えば、生成部232は、特徴ベクトルの一例として、顔画像の画素値の特徴を示す画素値ベクトルを生成してよい。例えば、生成部232は、顔画像に含まれる顔領域を抽出して、抽出した顔領域から特徴点を抽出する。続いて、生成部232は、抽出した各特徴点に対応する特徴量を算出する。続いて、生成部232は、算出した各特徴量の値を列の構成要素とする画素値ベクトルを生成する。
【0029】
また、生成部232は、特徴ベクトルの一例として、顔画像が入力された場合に、顔画像に含まれる人物の顔が人物の顔に関する複数の属性それぞれを有する確率値をそれぞれ出力するよう学習された学習済みモデルの中間層から出力される中間ベクトルを生成してよい。例えば、学習済みモデルは、画像に含まれる人物の顔を認識する画像認識モデルであってよい。例えば、生成部232は、通信部210を介して、顔画像に含まれる人物の顔が人物の顔に関するあらゆる属性それぞれを有する確率値をそれぞれ出力するよう学習された学習済みモデルを取得する。例えば、生成部232は、人物の顔に関するあらゆる属性の一例として、年齢、性別、人種、髪型、髪の毛の色、眼の色、眼鏡の着用の有無、マスクの着用の有無などの人物の顔に関する複数の属性それぞれを有する確率値をそれぞれ出力するよう学習された学習済みモデルを取得してよい。例えば、生成部232は、学習モデルに学習させ得る限りの人物の顔に関する全ての属性それぞれを有する確率値をそれぞれ出力するよう学習された学習済みモデルを取得してよい。続いて、生成部232は、学習済みモデルを取得すると、取得した学習済みモデルの入力層に顔画像を入力して、学習済みモデルの中間層から出力された中間ベクトルを取得する。
【0030】
また、生成部232は、特徴ベクトルの一例として、顔画像が入力された場合に、顔画像に含まれる人物の顔が人物の顔に関する複数の属性それぞれを有する確率値をそれぞれ出力するよう学習された学習済みモデルから出力された確率値をベクトル化した確率値ベクトルを生成してよい。例えば、生成部232は、通信部210を介して、顔画像に含まれる人物の顔が人物の顔に関するあらゆる属性それぞれを有する確率値をそれぞれ出力するよう学習された学習済みモデルを取得する。続いて、生成部232は、学習済みモデルを取得すると、取得した学習済みモデルの入力層に顔画像を入力して、学習済みモデルの出力層から出力された確率値ベクトルを取得する。
【0031】
また、生成部232は、大量の顔画像それぞれの特徴ベクトルを生成すると、生成した特徴ベクトルを特徴ベクトル空間にマッピングした特徴ベクトル空間を生成してよい。例えば、生成部232は、特徴ベクトル空間の一例として、生成した画素値ベクトルに基づいて、画素値ベクトルのベクトル空間である画素値ベクトル空間を生成してよい。また、生成部232は、特徴ベクトル空間の一例として、生成した中間ベクトルに基づいて、中間ベクトルのベクトル空間である中間ベクトル空間を生成してよい。また、生成部232は、特徴ベクトル空間の一例として、生成した確率値ベクトルに基づいて、確率値ベクトルのベクトル空間である確率値ベクトル空間を生成してよい。
【0032】
(算出部233)
算出部233は、生成部232によって生成された特徴ベクトルの特徴ベクトル空間における空間分布において特定の偏りを有する第1空間分布を特定する。具体的には、算出部233は、全ての顔画像(あらゆる顔画像ともいう)に対応する全ての特徴ベクトルの空間分布(以下、第2空間分布ともいう)に対応する確率分布Pと、第2空間分布に含まれる一部の特徴ベクトルの空間分布(以下、部分空間分布ともいう)に対応する確率分布Qのカルバック・ライブラー情報量を算出する。ここで、カルバック・ライブラー情報量とは、2つの確率分布の差異を表す指標(言い換えると、2つの確率分布がどの程度似ているかを表す指標)である。カルバック・ライブラー情報量が大きいほど、2つの確率分布の差異が大きい(つまり、2つの確率分布が似ていない)ことを示す。また、カルバック・ライブラー情報量は、2つの確率分布間の距離を表すため、カルバック距離とも呼ばれる。
【0033】
例えば、第2空間分布は、あらゆる顔画像の特徴ベクトルの空間分布であるので、特定の偏りを有しない確率分布(例えば、特徴ベクトル空間の原点に対して球対称な確率分布)であると考えられる。一方、特定の属性を有する顔画像(例えば、眼鏡を着用している顔画像)の特徴ベクトルの空間分布は、第2空間分布と比べると、特定の偏りを有する確率分布(例えば、特徴ベクトル空間の原点とは異なる特定の点の周りに集中した確率分布など)であると考えられる。そこで、算出部233は、空間分布Pに含まれるあらゆる部分空間分布の組合せについて、確率分布Pと確率分布Qのカルバック・ライブラー情報量を算出する。続いて、算出部233は、算出したカルバック・ライブラー情報量が所定の閾値を超える部分空間分布を特定すると、特定した部分空間分布を、第2空間分布において特定の偏りを有する第1空間分布として特定する。ここで、第1空間分布は、特定の偏りを有する確率分布であるので、第1空間分布に属する特徴ベクトルに対応する顔画像は、人物の顔に関する特定の属性(例えば、新たな属性)を有すると考えられる。すなわち、第1空間分布は、人物の顔に関する特定の属性(例えば、新たな属性)に対応する空間分布であると考えることができる。以下では、第1空間分布が、画像に含まれる人物の顔を認識する画像認識モデルが学習していない人物の顔に関する未知の属性(つまり、新たな属性)に対応する空間分布であるものとする。
【0034】
続いて、算出部233は、特定の偏りを有する第1空間分布を特定すると、第1空間分布を代表する特徴ベクトルである第1特徴ベクトルを算出する。例えば、算出部233は、第1特徴ベクトルの一例として、第1空間分布に属する特徴ベクトルの平均(平均値ともいう)を算出する。なお、算出部233は、第1特徴ベクトルの一例として、第1空間分布に属する特徴ベクトルの平均の代わりに、第1空間分布に属する特徴ベクトルの中央値または最頻値を算出してよい。
【0035】
続いて、算出部233は、第1特徴ベクトルを算出すると、新たな属性ラベルが付与されていない未知の顔画像(以下、処理対象の顔画像ともいう)を取得する。続いて、算出部233は、処理対象の顔画像を取得すると、処理対象の顔画像の特徴ベクトル(以下、処理対象特徴ベクトルともいう)を算出する。続いて、算出部233は、第1特徴ベクトルと処理対象特徴ベクトルとの第1類似度を算出する。例えば、算出部233は、第1類似度の一例として、第1特徴ベクトルと処理対象特徴ベクトルとのコサイン類似度を算出してよい。
【0036】
また、算出部233は、第2空間分布を代表する特徴ベクトルである第2特徴ベクトルを算出する。例えば、算出部233は、第2特徴ベクトルの一例として、第2空間分布に属する特徴ベクトルの平均(平均値ともいう)を算出する。なお、算出部233は、第2特徴ベクトルの一例として、第2空間分布に属する特徴ベクトルの平均の代わりに、第2空間分布に属する特徴ベクトルの中央値または最頻値を算出してよい。
【0037】
続いて、算出部233は、第2特徴ベクトルを算出すると、第2特徴ベクトルと処理対象特徴ベクトルとの第2類似度を算出する。例えば、算出部233は、第2類似度の一例として、第2特徴ベクトルと処理対象特徴ベクトルとのコサイン類似度を算出してよい。
【0038】
図4は、第2の実施形態に係る特徴ベクトル空間の一例を示す図である。
図4に示す例では、上述した特徴ベクトル空間が画素値ベクトル空間である例を示す。算出部233は、全ての顔画像に対応する全ての画素値ベクトルの空間分布である第2空間分布に対応する確率分布Pと、空間分布Pに含まれる一部の画素値ベクトルの空間分布に対応する確率分布Qのカルバック・ライブラー情報量を算出する。続いて、算出部233は、算出したカルバック・ライブラー情報量が所定の閾値を超える部分空間分布を特定すると、特定した部分空間分布を、第2空間分布において特定の偏りを有する第1空間分布として特定する。上述したように、算出部233は、画素値ベクトルである第1特徴ベクトル、第2特徴ベクトル、および処理対象特徴ベクトルをそれぞれ算出する。続いて、算出部233は、第1特徴ベクトルと処理対象特徴ベクトルとの第1類似度を算出する。また、算出部233は、第2特徴ベクトルと処理対象特徴ベクトルとの第2類似度を算出する。
【0039】
図5は、第2の実施形態に係る特徴ベクトル空間の一例を示す図である。
図5に示す例では、上述した特徴ベクトル空間が中間ベクトル空間である例を示す。算出部233は、全ての顔画像に対応する全ての中間ベクトルの空間分布である第2空間分布に対応する確率分布Pと、空間分布Pに含まれる一部の中間ベクトルの空間分布に対応する確率分布Qのカルバック・ライブラー情報量を算出する。続いて、算出部233は、算出したカルバック・ライブラー情報量が所定の閾値を超える部分空間分布を特定すると、特定した部分空間分布を、第2空間分布において特定の偏りを有する第1空間分布として特定する。上述したように、算出部233は、中間ベクトルである第1特徴ベクトル、第2特徴ベクトル、および処理対象特徴ベクトルをそれぞれ算出する。続いて、算出部233は、第1特徴ベクトルと処理対象特徴ベクトルとの第1類似度を算出する。また、算出部233は、第2特徴ベクトルと処理対象特徴ベクトルとの第2類似度を算出する。
【0040】
図6は、第2の実施形態に係る特徴ベクトル空間の一例を示す図である。
図6に示す例では、上述した特徴ベクトル空間が確率値ベクトル空間である例を示す。算出部233は、全ての顔画像に対応する全ての確率値ベクトルの空間分布である第2空間分布に対応する確率分布Pと、空間分布Pに含まれる一部の確率値ベクトルの空間分布に対応する確率分布Qのカルバック・ライブラー情報量を算出する。続いて、算出部233は、算出したカルバック・ライブラー情報量が所定の閾値を超える部分空間分布を特定すると、特定した部分空間分布を、第2空間分布において特定の偏りを有する第1空間分布として特定する。上述したように、算出部233は、確率値ベクトルである第1特徴ベクトル、第2特徴ベクトル、および処理対象特徴ベクトルをそれぞれ算出する。続いて、算出部233は、第1特徴ベクトルと処理対象特徴ベクトルとの第1類似度を算出する。また、算出部233は、第2特徴ベクトルと処理対象特徴ベクトルとの第2類似度を算出する。
【0041】
上述した例では、算出部233が、画素値ベクトル空間、中間ベクトル空間、または確率値ベクトル空間である特徴ベクトル空間のいずれかにおいて、第1類似度および第2類似度をそれぞれ算出する場合について説明したが、これに限られない。具体的には、算出部233は、画素値ベクトル空間、中間ベクトル空間、および確率値ベクトル空間それぞれにおける第1空間分布の偏りの大きさを比較する。例えば、算出部233は、第1空間分布の偏りの大きさの一例として、画素値ベクトル空間、中間ベクトル空間、および確率値ベクトル空間それぞれにおいて算出したカルバック・ライブラー情報量の大きさを比較する。
【0042】
ここで、カルバック・ライブラー情報量が大きいことは、その特徴ベクトル空間において、第1空間分布の偏りが大きいことを示す。また、第1空間分布の偏りが大きいことは、顔画像に含まれる人物の顔に関する特定の属性(例えば、新たな属性)の特徴がより大きく現れていると考えることができる。すなわち、カルバック・ライブラー情報量が大きい特徴ベクトル空間ほど、未知の画像に対して、新たな属性ラベルを付与するのに適していると考えることができる。そこで、算出部233は、画素値ベクトル空間、中間ベクトル空間、および確率値ベクトル空間の中から、算出したカルバック・ライブラー情報量の大きさが最大となる第1空間分布を含む特徴ベクトル空間を特定する。このようにして、算出部233は、画素値ベクトル空間、中間ベクトル空間、および確率値ベクトル空間の中から、第1空間分布の偏りの大きさが最大となる第1空間分布を含む特徴ベクトル空間を特定する。続いて、算出部233は、特定した特徴ベクトル空間の第1空間分布における第1特徴ベクトルと処理対象特徴ベクトルとの第1類似度を算出してよい。
【0043】
なお、上述した例では、算出部233が、確率分布Pと確率分布Qの差異を表す指標として、カルバック・ライブラー情報量(カルバック距離)を算出する場合について説明したが、確率分布Pと確率分布Qの差異を表す指標はカルバック距離に限られない。例えば、算出部233は、確率分布Pと確率分布Qの差異を表す指標として、カルバック・ライブラー情報量(カルバック距離)の代わりに、ピアソン距離、相対ピアソン距離、またはL2距離を算出してもよい。また、算出部233は、確率分布Pと確率分布Qを推定せずに、確率分布Pと確率分布Qの密度比を直接推定し、直接推定した密度比に基づいて、カルバック距離、ピアソン距離、相対ピアソン距離、またはL2距離を算出してもよい。
【0044】
(付与部234)
付与部234は、算出部233によって算出された第1類似度と第2類似度に応じて、処理対象の顔画像に対して新たな属性ラベルを付与する。具体的には、付与部234は、第1類似度と第2類似度との比率に応じて、処理対象の顔画像に対して、新たな属性ラベルと処理対象の顔画像に含まれる人物の顔が新たな属性を有する確率値との組であるソフトな属性ラベルを付与する。例えば、付与部234は、第1類似度に対する第2類似度の割合の大きさ(例えば、80%など)を、処理対象の顔画像に含まれる人物の顔が新たな属性を有する確率値として算出する。続いて、付与部234は、新たな属性ラベル(例えば、眼鏡を着用しているという属性を示す属性ラベル)と処理対象の顔画像に含まれる人物の顔が新たな属性を有する確率値(例えば、80%など)とを対応付けた情報(ソフトな属性ラベルともいう)を処理対象の顔画像と対応付けて記憶部120に格納する。
【0045】
なお、上述した例では、付与部234が、処理対象の顔画像に対してソフトな属性ラベルを付与する場合について説明したが、付与部234が付与するラベルはソフトな属性ラベルに限られない。例えば、付与部234は、処理対象の顔画像に含まれる人物の顔が新たな属性を有する確率値が閾値以上であるか否かに基づいて、処理対象の顔画像に含まれる人物の顔が新たな属性を有するか否かを示すハードな属性ラベルを付与してもよい。例えば、付与部234は、処理対象の顔画像に含まれる人物の顔が新たな属性を有する確率値が閾値以上(例えば、80%以上など)である場合は、処理対象の顔画像に対して、新たな属性を有することを示すラベル(例えば、眼鏡の着用の有りを示すラベル)を付してもよい。一方、付与部234は、処理対象の顔画像に含まれる人物の顔が新たな属性を有する確率値が閾値未満(例えば、80%未満など)である場合は、処理対象の顔画像に対して、新たな属性を有しないことを示すラベル(例えば、眼鏡の着用の無しを示すラベル)を付してもよい。
【0046】
〔2-2.情報処理のフロー〕
次に、
図7を用いて、第2の実施形態に係る情報処理の手順について説明する。
図7は、第2の実施形態に係る情報処理の一例を示すフローチャートである。
図7では、算出部233は、顔画像の特徴を示す特徴ベクトルの特徴ベクトル空間における空間分布において特定の偏りを有する第1空間分布における第1特徴ベクトルと処理対象の顔画像の特徴を示す処理対象特徴ベクトルとの第1類似度を算出する(ステップS201)。
【0047】
続いて、算出部233は、特徴ベクトル空間における第1空間分布を除く他の空間分布と第1空間分布とを含む第2空間分布における第2特徴ベクトルと処理対象特徴ベクトルとの第2類似度を算出する(ステップS202)。
【0048】
付与部234は、算出部233によって算出された第1類似度と第2類似度との比率に応じて、処理対象の顔画像に対して属性ラベルと顔画像が属性を有する確率値との組であるソフトな属性ラベルを付与する(ステップS203)。
【0049】
〔3.変形例〕
上述した第1の実施形態および第2の実施形態では、人物の顔が撮像された顔画像に対して、人物の顔に関する新たな属性ラベルを付与する場合について説明したが、画像に含まれる対象物は人物の顔に限られない。例えば、画像に含まれる対象物は、人物の顔以外の人間の身体の部位、人間以外の生物、生物以外の物体であってよい。また、対象物が撮像された画像(以下、対象物画像ともいう)に付与される新たな属性ラベルは、画像に含まれる対象物を認識する画像認識モデルが学習していない対象物に関する未知の属性であれば、どのような属性を示す属性ラベルであってもよい。
【0050】
〔4.効果〕
上述してきたように、第1の実施形態に係る情報処理装置100は、第1付与部132と、生成部133を有する。第1付与部132は、対象物が撮像された対象物画像に含まれる対象物に関する属性を示す属性ラベルが付与された対象物画像と類似する類似画像に対して属性ラベルを付与する。生成部133は、第1付与部132によって属性ラベルを付与された類似画像を画像解析することで、未知の対象物画像に対して属性ラベルを付与するためのラベル付与ルールを生成する。
【0051】
これにより、情報処理装置100は、画像に含まれる対象物を認識する画像認識モデルの学習に必要な学習データセットを自動で生成可能とすることができる。
【0052】
また、情報処理装置100は、第2付与部134をさらに有する。第2付与部134は、生成部133によって生成されたラベル付与ルールに基づいて、未知の対象物画像に対して属性ラベルを付与する。
【0053】
これにより、情報処理装置100は、画像に含まれる対象物を認識する画像認識モデルの学習に必要な学習データセットを自動で生成することができる。
【0054】
また、生成部133は、類似画像のうち対象物を含む対象物領域の輝度値を画像解析することで、対象物領域における輝度値の特徴を示すラベル付与ルールを生成する。
【0055】
これにより、情報処理装置100は、輝度値の特徴を示すラベル付与ルールに基づいて、画像に含まれる対象物を認識する画像認識モデルの学習に必要な学習データセットを自動で生成可能とすることができる。
【0056】
また、対象物は、人物の顔であり、対象物画像は、人物の顔が撮像された顔画像である。
【0057】
これにより、情報処理装置100は、顔画像に含まれる人物の顔を認識する画像認識モデルの学習に必要な学習データセットを自動で生成可能とすることができる。
【0058】
また、第2の実施形態に係る情報処理装置200は、算出部233と、付与部234を有する。算出部233は、対象物が撮像された対象物画像の特徴を示す特徴ベクトルの特徴ベクトル空間における空間分布において特定の偏りを有する第1空間分布における第1特徴ベクトルと処理対象の対象物画像の特徴を示す処理対象特徴ベクトルとの第1類似度、および、第1空間分布を除く他の空間分布と第1空間分布とを含む特徴ベクトル空間における空間分布である第2空間分布における第2特徴ベクトルと処理対象特徴ベクトルとの第2類似度を算出する。付与部234は、算出部233によって算出された第1類似度と第2類似度に応じて、処理対象の対象物画像に対して特定の偏りに対応する属性を示す属性ラベルを付与する。
【0059】
これにより、情報処理装置200は、画像に含まれる対象物を認識する画像認識モデルの学習に必要な学習データセットを自動で生成可能とすることができる。
【0060】
また、付与部234は、第1類似度と第2類似度との比率に応じて、処理対象の対象物画像に対して属性ラベルと対象物が属性を有する確率値との組であるソフトな属性ラベルを付与する。
【0061】
このように、情報処理装置200は、画像に含まれる対象物が属性ラベルに対応する属性を有する確率とともに、処理対象の対象物画像に対して属性ラベルを付与することができる。これにより、情報処理装置200は、より適切な属性ラベルを付与することができるので、画像に含まれる対象物を認識する画像認識モデルの学習に必要な学習データセットをより適切に生成可能とすることができる。
【0062】
また、算出部233は、第1空間分布を代表する特徴ベクトルである第1特徴ベクトルと処理対象特徴ベクトルとの第1類似度、および、第2空間分布を代表する特徴ベクトルである第2特徴ベクトルと処理対象特徴ベクトルとの第2類似度を算出する。例えば、算出部233は、第1空間分布に属する特徴ベクトルの平均値、中央値または最頻値である第1特徴ベクトルと処理対象特徴ベクトルとの第1類似度、および、第2空間分布に属する特徴ベクトルの平均値、中央値または最頻値である第2特徴ベクトルと処理対象特徴ベクトルとの第2類似度を算出する。
【0063】
これにより、情報処理装置200は、新たな属性に対応する第1空間の特徴を代表する第1特徴ベクトルと処理対象特徴ベクトルとの第1類似度を算出するので、適切に第1類似度を算出することができる。また、情報処理装置200は、全ての属性に対応する第2空間の特徴を代表する第2特徴ベクトルと処理対象特徴ベクトルとの第2類似度を算出するので、適切に第2類似度を算出することができる。
【0064】
また、特徴ベクトル空間は、対象物画像の画素値の特徴を示す画素値ベクトルの画素値ベクトル空間である。
【0065】
これにより、情報処理装置200は、画素値ベクトルに基づいて、画像に含まれる対象物が属性ラベルに対応する属性を有する確率とともに、処理対象の対象物画像に対して属性ラベルを付与することができる。
【0066】
また、特徴ベクトル空間は、対象物画像が入力された場合に、対象物が対象物に関する複数の属性それぞれを有する確率値をそれぞれ出力するよう学習された学習済みモデルの中間層から出力される中間ベクトルの中間ベクトル空間である。
【0067】
これにより、情報処理装置200は、中間ベクトルに基づいて、画像に含まれる対象物が属性ラベルに対応する属性を有する確率とともに、処理対象の対象物画像に対して属性ラベルを付与することができる。
【0068】
また、特徴ベクトル空間は、対象物画像が入力された場合に、対象物が対象物に関する複数の属性それぞれを有する確率値をそれぞれ出力するよう学習された学習済みモデルから出力された確率値をベクトル化した確率値ベクトルの確率値ベクトル空間である。
【0069】
これにより、情報処理装置200は、確率値ベクトルに基づいて、画像に含まれる対象物が属性ラベルに対応する属性を有する確率とともに、処理対象の対象物画像に対して属性ラベルを付与することができる。
【0070】
また、算出部233は、異なる複数の特徴ベクトル空間それぞれにおける第1空間分布の偏りの大きさの比較に基づいて、第1空間分布の偏りの大きさが最大である第1空間分布における第1特徴ベクトルと処理対象特徴ベクトルとの第1類似度を算出する。
【0071】
これにより、情報処理装置200は、異なる複数の特徴ベクトル空間の中から、未知の画像に対して、新たな属性ラベルを付与するのに適した特徴ベクトル空間を選択することができる。したがって、情報処理装置200は、より適切な属性ラベルを付与することができるので、画像に含まれる対象物を認識する画像認識モデルの学習に必要な学習データセットをより適切に生成可能とすることができる。
【0072】
〔5.ハードウェア構成〕
また、上述してきた実施形態に係る情報処理装置100または情報処理装置200は、例えば
図8に示すような構成のコンピュータ1000によって実現される。
図8は、情報処理装置100または情報処理装置200の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を備える。
【0073】
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
【0074】
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、所定の通信網を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを所定の通信網を介して他の機器へ送信する。
【0075】
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。なお、CPU1100の代わりに、MPU(Micro Processing Unit)、また多大な計算パワーを必要とすることからGPU(Graphics Processing Unit)を用いてもよい。
【0076】
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0077】
例えば、コンピュータ1000が情報処理装置100または情報処理装置200として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130または制御部230の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定の通信網を介してこれらのプログラムを取得してもよい。
【0078】
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0079】
〔6.その他〕
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0080】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0081】
また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0082】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、付与部は、付与手段や付与回路に読み替えることができる。
【符号の説明】
【0083】
100 情報処理装置
110 通信部
120 記憶部
130 制御部
131 取得部
132 第1付与部
133 生成部
134 第2付与部
200 情報処理装置
210 通信部
220 記憶部
230 制御部
231 取得部
232 生成部
233 算出部
234 付与部