特許第6620304号(P6620304)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人 筑波大学の特許一覧 ▶ 国立大学法人大阪大学の特許一覧 ▶ BIJIN&Co.株式会社の特許一覧

特許6620304プログラム,グループ予測装置,及びグループ予測方法
<>
  • 特許6620304-プログラム,グループ予測装置,及びグループ予測方法 図000002
  • 特許6620304-プログラム,グループ予測装置,及びグループ予測方法 図000003
  • 特許6620304-プログラム,グループ予測装置,及びグループ予測方法 図000004
  • 特許6620304-プログラム,グループ予測装置,及びグループ予測方法 図000005
  • 特許6620304-プログラム,グループ予測装置,及びグループ予測方法 図000006
  • 特許6620304-プログラム,グループ予測装置,及びグループ予測方法 図000007
  • 特許6620304-プログラム,グループ予測装置,及びグループ予測方法 図000008
  • 特許6620304-プログラム,グループ予測装置,及びグループ予測方法 図000009
  • 特許6620304-プログラム,グループ予測装置,及びグループ予測方法 図000010
  • 特許6620304-プログラム,グループ予測装置,及びグループ予測方法 図000011
  • 特許6620304-プログラム,グループ予測装置,及びグループ予測方法 図000012
  • 特許6620304-プログラム,グループ予測装置,及びグループ予測方法 図000013
  • 特許6620304-プログラム,グループ予測装置,及びグループ予測方法 図000014
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6620304
(24)【登録日】2019年11月29日
(45)【発行日】2019年12月18日
(54)【発明の名称】プログラム,グループ予測装置,及びグループ予測方法
(51)【国際特許分類】
   G06F 16/906 20190101AFI20191209BHJP
【FI】
   G06F16/906
【請求項の数】10
【全頁数】19
(21)【出願番号】特願2015-152899(P2015-152899)
(22)【出願日】2015年7月31日
(65)【公開番号】特開2017-33307(P2017-33307A)
(43)【公開日】2017年2月9日
【審査請求日】2018年6月19日
(73)【特許権者】
【識別番号】504171134
【氏名又は名称】国立大学法人 筑波大学
(73)【特許権者】
【識別番号】504176911
【氏名又は名称】国立大学法人大阪大学
(73)【特許権者】
【識別番号】509183888
【氏名又は名称】BIJIN&Co.株式会社
(74)【代理人】
【識別番号】100100549
【弁理士】
【氏名又は名称】川口 嘉之
(74)【代理人】
【識別番号】100113608
【弁理士】
【氏名又は名称】平川 明
(74)【代理人】
【識別番号】100105407
【弁理士】
【氏名又は名称】高田 大輔
(72)【発明者】
【氏名】山際 伸一
(72)【発明者】
【氏名】河原 吉伸
(72)【発明者】
【氏名】田中 慎也
(72)【発明者】
【氏名】西藤 篤史
【審査官】 三橋 竜太郎
(56)【参考文献】
【文献】 特開2011−070408(JP,A)
【文献】 特開2002−222083(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00−16/958
(57)【特許請求の範囲】
【請求項1】
コンピュータに、
複数のサンプルデータについて複数人から得られた二値属性値を用いて前記各サンプルデータが属するグループであって、前記各サンプルデータの二値属性値の統計値に基づき順位付けされるグループを決定するステップと、
前記各サンプルデータと対象データとの類似度を用いて前記対象データが属するグループを予測するステップと
を実行させるプログラム。
【請求項2】
前記サンプルデータ及び対象データが、画像データ,音声データ,文字列データ,センサデータ,時系列データ,動画データの何れかである
請求項1に記載のプログラム。
【請求項3】
前記サンプルデータ及び対象データが人の顔を含む写真画像データである
請求項2に記載のプログラム。
【請求項4】
記対象データが前記対象データとの類似度が最も高いサンプルデータが属するグループに属すると予測される
請求項1から3の何れか1項に記載のプログラム。
【請求項5】
前記コンピュータに、
前記複数のサンプルデータについての二値属性値の更新に応じて前記各サンプルデータが属するグループを再決定するステップ
をさらに実行させる請求項1から4の何れか1項に記載のプログラム。
【請求項6】
前記コンピュータに、
前記対象データが属するグループの予測結果を反映した前記複数のサンプルデータ及び前記対象データのそれぞれに対するグループ分けの結果を作成するステップ
をさらに実行させる請求項1から5の何れか1項に記載のプログラム。
【請求項7】
前記複数のサンプルデータが、サンプルデータの属性情報及び前記二値属性値の入力者の属性情報の少なくとも一方に基づき絞り込まれたデータである
請求項1から6の何れかに記載のプログラム。
【請求項8】
前記複数のサンプルデータが、被写体が撮影された写真画像のデータであり、前記被写体に係る属性情報に基づき抽出されたデータである
請求項1から7の何れか1項に記載のプログラム。
【請求項9】
複数のサンプルデータについて複数人から得られた二値属性値を用いて前記各サンプルデータが属するグループであって、前記各サンプルデータの二値属性値の統計値に基づき順位付けされるグループを決定する決定部と、
前記各サンプルデータと対象データとの類似度を用いて前記対象データが属するグループを予測する予測部と
を含むグループ予測装置。
【請求項10】
コンピュータが、
複数のサンプルデータについて複数人から得られた二値属性値を用いて前記各サンプルデータが属するグループであって、前記各サンプルデータの二値属性値の統計値に基づき順位付けされるグループを決定し、
前記各サンプルデータと対象データとの類似度を用いて前記対象データが属するグループを予測する
ことを含むグループ予測方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、プログラム,グループ予測装置,及びグループ予測方法に関する。
【背景技術】
【0002】
従来、顔の美しさを判定する方法として、例えば、人の顔の写真に対する顔認識技術で顔の部品(目,鼻,口等)の位置を特定し、美しさの基準となる部品の配置バランスとのの比較において評価する方法がある。また、顔の部品のバランスを元に、そのバランスが近い人物を特定する方法もある。また、ランダムに表示される人の顔に得点を与え、得点の平均値を用いてランキングを作成する方法もある。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開平11−053386号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
顔認識を用いて顔の部品のバランスを基準と対比して美人か否かを判断する方法では、基準に対して精度の高い判定結果を得ることができる。しかし、「美人」の基準は、基準が作成された時代や地域(居住地など)など、基準の作成に用いた背景によって異なる。また、基準作成者の主観的評価が基準に強く反映されている場合では、基準作成に用いた背景とも乖離している可能性がある。
【0005】
従って、判定に一つの基準を用いる手法では、「美人」か否かの判定結果が判定対象の顔を持つ人物に係る時代や地域での一般的な評価結果に合致するとは言えない場合があった。換言すれば、基準の作成に用いた背景と、評価結果を享受する一般との背景との相違による「美人」の主観的評価基準の乖離を吸収できない場合があった。
【0006】
このような判定基準に相違や乖離による問題は、「美人」,すなわち人に限られず、人の五感を通じて「好み」が生じる対象(有体物だけでなく、楽曲等の無体物も含まれる)に或る評価を与える場合に共通する問題である。
【0007】
本発明は、上記問題に鑑みなされたものであり、対象が複数人によりどのように評価されるかの傾向を知ることができる技術を提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の第1の態様は、コンピュータに、複数のサンプルデータについて複数人から得られた二値属性値を用いて前記各サンプルデータが属するグループを決定するステップと、
前記各サンプルデータと対象データとの類似度に基づき前記対象データが属するグループを予測するステップとを実行させるプログラムである。
【0009】
第1の態様によれば、対象データが属するグループが予測されることで、対象データが複数人によりどのように評価されるかの傾向を知ることができる。
【0010】
前記サンプルデータ及び対象データは、画像データ,音声データ,文字列データ,センサデータ,時系列データ,動画データの何れかであることができる。このため、人の嗜好が現れる対象データについて、複数人が対象データをどのように評価するかの傾向を知る
ことができる。
【0011】
前記サンプルデータ及び対象データは、人の顔を含む写真画像データである構成を採用しても良い。この場合、写真画像データの被写体人物が複数人によりどのように評価されるかの傾向を知ることができる。
【0012】
第1の態様において、前記グループは、前記各サンプルデータの二値属性値の統計値に基づき順位付けされており、前記対象データが前記対象データとの類似度が最も高いサンプルデータが属するグループに属すると予測される様にしても良い。
【0013】
第1の態様において、前記複数のサンプルデータについての二値属性値の更新に応じて前記各サンプルデータが属するグループを再決定するステップ
をさらに実行させるようにしても良い。
【0014】
第1の態様において、前記対象データが属するグループの予測結果を反映した前記複数のサンプルデータ及び前記対象データのそれぞれに対するグループ分けの結果を作成するステップをさらに実行させる様にしても良い。
【0015】
また、第1の態様では、複数のサンプルデータが、サンプルデータの属性情報及び前記二値属性値の入力者の属性情報の少なくとも一方に基づき絞り込まれたデータである構成が採用されても良い。
【0016】
第1の態様は、被写体が撮影された写真画像のデータであり、前記被写体に係る属性情報に基づき抽出されたデータであるように構成できる。この場合、被写体に係る属性情報に基づきサンプルデータが抽出されるので、その属性情報に基づく傾向の範囲に収まる複数のサンプル画像に対する二値属性値に基づくグループ分けの結果を得ることができる。
【0017】
本発明の第2の態様は、複数のサンプルデータについて複数人から得られた二値属性値を用いて前記各サンプルデータが属するグループを決定する決定部と、前記各サンプルデータと対象データとの類似度を用いて前記対象データが属するグループを予測する予測部とを含むグループ予測装置である。
【0018】
本発明の第3の態様は、コンピュータが、複数のサンプルデータについて複数人から得られた二値属性値を用いて前記各サンプルデータが属するグループを決定し、前記各サンプルデータと対象データとの類似度を用いて前記対象データが属するグループを予測することを含むグループ予測方法である。
【0019】
また、本発明の他の態様としては、第1の態様として示したプログラムを記録したコンピュータ読み取り可能な記録媒体を挙げることができる。
【発明の効果】
【0020】
本発明によれば、対象が複数人による二値評価においてどのように評価されるかの傾向を知ることができる。
【図面の簡単な説明】
【0021】
図1図1は、予測システムの構成を示す図である。
図2図2(A)は、無線端末の構成例を示す図であり、図2(B)は、固定端末の構成例を示す図である。
図3図3は、予測システムを模式的に示す図である。
図4図4は、二値属性値入力画面の例を示す。
図5図5は、二値属性値の記憶部のデータ構造例を示す。
図6図6は、特徴量の記憶部のデータ構造例を示す。
図7図7は、類似度の記憶部のデータ構造例を示す。
図8図8は、ランキングの記憶部のデータ構造例を示す。
図9図9は、ランキング予測結果の表示画面(ランキング画面)の例を示す。
図10図10(A)は、ランキング予測における処理例を示すフローチャートであり、図10(B)は、二値属性値が入力された際における処理例を示すフローチャートである。
図11図11は、類似度の記憶部の更新の一例を示す。
図12図12は、実施形態の変形例を示す。
図13図13は、変形例に係る処理例を示すフローチャートである。
【発明を実施するための形態】
【0022】
以下、本発明の実施形態について、図面を用いて説明する。実施形態の構成は例示であり、本発明は実施形態の構成に限定されない。
【0023】
実施形態では、コンピュータに、複数のサンプルデータについて複数人から得られた二値属性値を用いて前記各サンプルデータが属するグループを決定するステップと、前記各サンプルデータと対象データとの類似度を用いて前記対象データが属するグループを予測するステップとを実行させる。
【0024】
<サンプルデータ及び対象データ>
サンプルデータ及び対象データは、時間及び空間の一方の周波数成分を有するデータである。時間及び空間の一方の周波数成分を有するデータは、画像データ,音声データ,文字列データ,センサデータ,時系列データ,映像(動画)データを含む。
【0025】
(画像データ)
画像データは、イメージスキャナやディジタルカメラのような撮像装置によって得られた画像データであっても良く、コンピュータ上での描画により作成された画像データであっても良い。撮像装置によって得られる画像は、例えば顔を含む女性の写真画像である。もっとも、男性の写真画像であっても良い。人物の写真画像の画像データが適用される場合には、人の顔を含む胸から上の部分が撮影された画像が適用されるのが好ましい。もっとも、腹、腰、膝から上の部分が写っている画像であっても、全身画像であっても良い。
【0026】
また、撮像装置の被写体は、人以外の動植物,絵画,彫刻,骨董などの美術品,自動車(二輪車を含む),自転車,航空機,鉄道車両,特殊車両,船舶などの移動体,装置,機器,道具,玩具,模型,食品などの物品(人工物),岩石,鉱物などの天然物,風景などを含み得る。
【0027】
(音声データ)
音声データは、例えば、PCM(パルス符号変調)を用いて得られた音声データである。但し、音声データのコーデック(CODEC)形式やファイルフォーマットは問わない。また、音声は楽曲であっても、講演や会話などであっても良い。
(文字列データ)
文字列データは、例えば、DNA配列や、テキストによる文章データを含む。
【0028】
(センサデータ)
センサデータは、センサにより検出された時間又は空間の情報を示すデータである。センサデータとしては、例えば、加速度センサによって検出される物体の加速度データ,ジャイロセンサによって検出される物体の角度や角速度データ,地磁気センサにより検出さ
れる方位データなどが考えられる。但し、センサ及びセンサによって検出されるセンサデータの種別は、センサによる検出又は測定の対象に依存する。
【0029】
(時系列データ,統計データ)
時系列データとは、時間的順序を追って一定間隔ごとに観察され,しかも相互に統計的依存関係が認められるようなデータの系列を指す。例えば、株価のデータである。
(映像データ)
映像データは、例えば、映画や動画のデータである。
【0030】
<類似度計算>
本実施形態では、サンプルデータと対象データとの類似度を用いて対象データが属するグループを予測する。このため、サンプルデータ及び対象データの特徴量を用いた類似度計算を行う。
【0031】
(画像データの類似度計算)
画像データについては、例えば、画像の特徴点の計算により得られた特徴量としての特徴点の情報を用いて、画像間の類似度(スコア)を計算する。特徴点の抽出計算に関しては、例えば、Scale-Invariant Feature Transform(SIFT)を用いることができる。
類似度計算については、例えば、文献“Jegou, H.; Perronnin, F.; Douze, M.; Sanchez, J.; Perez, P.; Schmid, C., "Aggregating Local Image Descriptors into Compact Codes", IEEE Transactions on Pattern Analysis and Machine Intelligence, vol.34, no.9, pp.1704-1716, IEEE, Sept 2012.”に記載された周知の方法を適用可能である。
【0032】
また、画像の類似度計算の方法としては、スパースコーディング(Sparse Coding)と
呼ばれる手法を適用し得る。スパースコーディングは、SIFTにて得られた特徴点情報を元に、階層的に疎な辞書(類似すると思われる部分を大まかに纏めたデータ)を生成し、辞書を比較することで対比画像の類似度を数値化する手法である。スパースコーディングは例えば、文献“Jianchao Yang; Kai Yu; Yihong Gong; Huang, T., "Linear spatial
pyramid matching using sparse coding for image classification", In proceedings of IEEE Conference on Computer Vision and Pattern Recognition 2009 (CVPR 2009) ,
pp.1794-1801, IEEE, Jun 2009”に記載された周知の手法である。
【0033】
また、画像の類似度計算としては、画像の画素値のヒストグラムを生成し、ヒストグラムを比較することで類似度を判定することも可能である。類似度計算については、上記した手法以外の手法も適用し得る。
【0034】
(音楽データの類似度計算)
音声データに適用可能な類似度の計算手法として、音響的特徴の類似度を楽曲の類似度として用いる手法を適用できる。例えば、メル周波数ケプスロラム係数(Mel-Frequency Cepstrum Coefficient:MFCC)を用いた特徴量や、スペクトル形状に基づく特徴量を
求め、類似度を計算する方法がある。また、人の主観的な特徴量をさらに加える場合もあり得る。
【0035】
音声データに適用可能な類似度計算方法としては、音声データの特徴量をk平均法でクラスタとして求め、Earth Mover距離を用いて類似度を計算する方法がある。当該方法は
、例えば文献“Logan, Beth; Salomon, A., "A music similarity function based on signal analysis", In proceedings of IEEE International Conference on Multimedia and Expo 2001 (ICME 2001), pp.745-748, IEEE, Aug 2001.”に記載されているような周知の方法である。
【0036】
(文字列データの類似度計算)
文字列データに適用可能な類似度計算方法としては、最小編集距離、例えば、レーベンシュタイン距離を用いた類似度計算を適用することができる。レーベンシュタイン距離を用いた類似度計算方法は、例えば、最低限の編集回数で済むような編集の組み合わせを基準にして類似度を計算する方法である。
【0037】
(センサデータ,時系列データの類似度計算)
センサデータの類似度計算方法としては、例えば、主成分分析によってセンサデータや時系列データの類似度を求めることができる。主成分分析を用いた類似度計算の手法は、例えば、文献“S. Lhermitte, J. Verbesselt, W.W. Verstraeten, P. Coppin, "A comparison of time series similarity measures for classification and change detection
of ecosystem dynamics", Remote Sensing of Environment, Volume 115, Issue 12, Pages 3129-3152, ELSEVIER, Dec 2011.”に記載されたような周知の方法である。
【0038】
時系列データについては、センサデータに適用可能な類似度計算方法を適用することができる。また、時系列データの類似度計算方法として、遺伝アルゴリズム(GA)を用いて類似度を計算することもできる。
【0039】
(映像、動画データの類似度計算)
映像データ,動画データの類似度計算方法としては、k近傍法とコサイン類似度を用いた類似度推定法を適用し得る。
【0040】
以下の実施形態の説明では、一例として、サンプルデータ及び対象データとして、女性の写真画像データが適用された例について説明する。
【0041】
<システム構成>
図1は、実施形態に係るグループ予測システムの全体構成例を示す図である。図1において、予測システムは、サーバ装置1(以下「サーバ1」)と、サーバ1とネットワーク(NW)2を介して接続される端末装置とを含む。図1に示す例では、端末装置として、ネットワーク2と無線接続される無線端末3Aと、ネットワーク2と有線接続される固定端末3Bとが図示されている。以下の説明において、無線端末3Aと固定端末3Bとを区別しない場合には、「端末3」との表記を用いる。
【0042】
実施形態に係るグループ予測システムでは、サーバ1が端末3に対してサンプル画像データを供給し、各端末3のユーザ(複数人に相当)が、端末3を操作して各サンプル画像に対する二値属性値をサーバ1に送信する。サーバ1は、各端末3から受信した二値属性値に基づき、サンプル画像のランキングを作成する(ランクを有する複数のグループのうち各サンプル画像が属するグループを決定する)。端末3から対象画像データ(グループの予測対象のデータ)がサーバ1に入力されると、サーバ1は、各サンプル画像と対象画像との類似度に基づき対象画像の属するグループ(ランク)を予測する。サーバ1は、「グループ予測装置」に相当する。
【0043】
サーバ1は、汎用又は専用のコンピュータ(情報処理装置)である、汎用のコンピュータとして、例えば、パーソナルコンピュータ(PC)やワークステーションを適用できる。専用コンピュータとして、例えばサーバマシンを適用できる。但し、サーバ1は、後述する機能を提供できる限り、上記例示のコンピュータに制限されない。
【0044】
サーバ1は、図1に示すように、例えば、CPU11にバスを介して接続されたメモリ12,入力装置13,出力装置14,及び通信インタフェース(通信IF)15を含む。
【0045】
メモリ12は、主記憶装置と補助記憶装置とを含む。主記憶装置は、は、CPU11の作業領域,プログラムやデータの記憶領域,通信データのバッファ領域として使用される。主記憶装置は、例えば、Random Access Memory(RAM),或いはRAMとRead Only Memory(ROM)との組み合わせで形成される。
【0046】
補助記憶装置は、CPU11によって実行されるプログラム,及びプログラムの実行に際して使用されるデータを記憶する。補助記憶装置は、例えば、ハードディスクドライブ(HDD),Solid State Drive(SSD),フラッシュメモリ,Electrically Erasable
Programmable Read-Only Memory(EEPROM)などである。また、補助記憶装置は、情報処理装置に対して着脱自在な可搬性記憶媒体を含む。可搬性記憶媒体は、例えばUniversal Serial Bus(USB)メモリである。また、補助記憶装置は、CD−ROMやDVD−ROM,DVD−Rなどのディスク記憶媒体及びディスク記憶媒体のドライブ装置を含む。ディスク記憶媒体は可搬性記憶媒体の一つである。
【0047】
入力装置13は、サーバ1に情報やデータを入力するために使用される。入力装置13は、例えば、ボタン、キー、マウスなどのポインティングデバイス,タッチパネルなどを含む。入力装置13は、マイクロフォンのような音声入力装置を含み得る。また、入力装置13は、カメラやイメージスキャナのような撮像装置を含む。
【0048】
出力装置14は、情報やデータを出力する。出力装置は、例えばディスプレイ装置である。通信IF15は、ネットワーク2に接続される。出力装置14は、スピーカのような音声出力装置を含み得る。通信IF15は、例えばLocal Area Network(LAN)カードである。
【0049】
CPU11は、メモリ(主記憶装置及び補助記憶装置)12の少なくとも一方に記憶されたプログラムを主記憶装置にロードして実行する。メモリ12には、オペレーティングシステム及びアプリケーションプログラムがインストールされている。アプリケーションプログラムは、例えばPHP(Hypertext Preprocessor)スクリプトが動作可能なApache,Apache2などのHyperText Transfer Protocol(HTTP)サーバと、MySQLのようなデ
ータベースプログラムを含む。
【0050】
CPU11がプログラムを実行することによって、サーバ1は、HTTPサーバ111と、メモリ12に記憶されたデータベース(DB)121とを含む装置として動作する。なお、図1では、HTTPサーバ111及びDB121を含むサーバ1を例示しているが、サーバ1は、2以上の情報処理装置(コンピュータ)によって構成されても良い。例えば、サーバ1は、HTTPサーバ111として動作するコンピュータと、DB121を備えるコンピュータとから構成されても良い。また、HTTPサーバ111で行われる処理が複数のコンピュータで実行されるようにしても良い。
【0051】
ネットワーク2は、図1に示すように、一部区間が無線のネットワークであっても良く、有線ネットワークであっても良い。ネットワーク2は、例えば、インターネットなどのInternet Protocol(IP)網,LANや無線LAN,セルラー網回線などである。
【0052】
図2(A)は、無線端末3Aの構成例を示す図であり、図2(B)は、固定端末3Bの構成例を示す図である。無線端末3Aは、例えば、スマートフォン,フィーチャーフォン,無線LAN端末,タブレット端末のような無線通信機能を備えた端末装置である。但し、無線端末3Aの種別は、無線端末3Aが後述する二値属性値入力装置及び画像入力装置との少なくとも一方として動作できる限り、上記例示に限定されない。
【0053】
無線端末3Aは、バスを介して相互に接続されたCPU31,メモリ32,入力装置3
3,出力装置34,無線モジュール35を備える。CPU31,メモリ32,入力装置33,出力装置34については、CPU31,メモリ32,入力装置13及び出力装置14と同様のものを適用可能であるので、重ねての説明は省略する。
【0054】
無線モジュール15は、無線通信機能を提供する機器である。無線モジュール35は、例えば、データをディジタルベースバンド信号(BB信号)との間の変換処理を司るベースバンド回路(BB回路)と、ベースバンド信号と無線信号との変換処理を司るRF(Radio Frequency)回路とを含む。RF回路は、無線信号の送受信を行う送受信アンテナ3
6と接続されている。無線モジュール35が適合又は準拠する無線アクセス方式として、適宜の方式が適用される。無線アクセス方式としては、3G(W−CDMAなど),Long
Term Evolution(LTE),無線LAN(IEEE802.11シリーズやWi-Fi),WiMax,Bluetooth(登録商標)のような各種の方式を含む。
【0055】
固定端末3Bは、無線端末3Aが備える無線モジュール15の代わりに通信IF37を備える点で無線端末3Aと相違する。通信IF36は、通信IF15と同様に、LANカードを適用することができる。
【0056】
端末3のメモリ32には、OS及びアプリケーションプログラムが記憶されており、アプリケーションプログラムは、仕分けアプリと画像入力アプリとを含む。仕分けアプリの実行によって、端末3は、二値属性値入力装置311として動作し、画像入力アプリの実行によって、端末3は、画像入力装置312として動作する。
【0057】
なお、CPU11及びCPU31は、「プロセッサ」,「制御装置」の一例であり、通信IF14,通信IF37,無線モジュール35は、「送信部」,「受信部」,「通信部」の一例である。メモリ12,メモリ32のそれぞれは、「記憶部」,「記憶装置」,「コンピュータ読み取り可能な記憶媒体」の一例である。
【0058】
なお、CPU11で実行される処理は、複数のCPU(プロセッサ)によって実行されても良い。CPU11で実行される処理の少なくとも一部は、例えばDigital Signal Processor(DSP)によって実行されても良い。また、CPU11で実行される処理の少なくとも一部は、Field Programmable Gate Array(FPGA)のようなプログラマブルロ
ジックデバイス(PLD)や集積回路(IC,LSI,Application Specific Integrated Circuit(ASIC)など)のような半導体デバイスで実行されても良い。
【0059】
図3は、予測システム(サーバ1及び端末3で実行される機能及び処理)を模式的に示す図である。図3に示すように、サーバ1は、プログラムの実行によって、二値属性値取得部112と、類似度計算部113と、ランキング計算部114と、画像取得部115と、ランキング予測計算部116と、ランキング出力部117とを備えた装置として動作する。例えば、HTTPサーバ111として動作するCPU11は、二値属性値取得部112と、類似度計算部113と、ランキング計算部114と、画像取得部115と、ランキング予測計算部116と、ランキング出力部117として動作することができる。ランキング計算部114は、「決定部」に相当し、ランキング予測計算部116は、「予測部」に相当する。
【0060】
さらに、サーバ1は、サンプル画像の記憶部122と、特徴量の記憶部123と、二値属性値の記憶部124と、類似度の記憶部125と、ランキングの記憶部126とを含む。記憶部122〜126は、メモリ12上に形成されるDB121に含まれる。
【0061】
端末3は、プログラムの実行によって、二値属性値入力装置311,画像入力装置312,ランキング出力装置313の少なくとも一つとして動作することができる。
【0062】
記憶部122には、二値属性値の取得対象の複数の画像データ(複数のサンプルデータに相当する)が、画像データの識別子(ID)と対応づけて所定順序で記憶されている。二値属性値取得部112は、二値属性値を得る対象の画像(サンプル画像)を記憶部122から読み出し、二値属性値入力装置311に送る。端末3が二値属性値入力装置311として動作する場合、端末3は、ネットワーク2を介してサーバ1からサンプル画像を受信する。
【0063】
二値属性値入力装置311は、二値属性値の入力用のユーザインタフェース(UI)を提供する。図4は、UIの一例である二値属性値入力画面の例を示す。二値属性値入力画面は、二値属性値の入力対象の画像と、サンプル画像に対する二値属性値を入力するボタンとを含む。本実施形態の一例では、サンプル画像は、女性の胸から上の部分(顔を含む)を含んだ写真画像である。「胸から上の部分」は、画像(写真)の構図の一例である。サンプル画像及び対象画像の構図を揃えることで、類似度計算の精度を上げることができる。
【0064】
二値属性値は、異なる二つの値であれば良い。例えば、二値属性値は、背反関係にある二つの異なる値である。二つの異なる値は、例えば、対象(サンプル画像)の肯定的に受け取るか否かを示す評価値である。例えば、対象のサンプル画像を好きか嫌い(好きでない)かである。本実施形態では、二値属性値として、二値属性値入力画面におけるサンプル画像の評価者(例えば、端末3のユーザ)がサンプル画像の女性を美人と思うか否かを示す情報が入力される。但し、二値属性値は、異なる二つの値である限り、必ずしも二値が背反関係になくとも良い(例えば、「良い」と「より良い」など)。実施形態では、二値属性値が画像が好きか否かを示す二値評価値である例について説明する。
【0065】
二値属性値の入力ボタンとして、図4の例では、ボタンとして、ユーザが、サンプル画像の女性を美人と思う場合に押す“LIKE”ボタンと、美人と思わない場合に押す“Next”ボタンとを含む。“LIKE”ボタンが押された場合には、二値属性値“LIKE(Yes)”が取
得される。一方、“Next”ボタンが押された場合には、二値属性値“NOT LIKE(No)”が取得される。なお、“Next”ボタンが押された場合には、写真画像の表示領域には、記憶部122にて次に格納されている写真画像が表示される。但し、写真画像の表示順は、固定であってもランダムであっても良い。サンプル画像は、一つずつ二値属性値入力装置311(端末3)に供給されても良く、2以上のサンプル画像が纏めて供給されても良い。
【0066】
二値属性値入力装置311が無線端末3A(例えばスマートフォン)である場合には、図2(A)に示したメモリ12には、サーバ1から写真画像を入手して二値属性値入力画面を表示して二値属性値の入力を促し、入力結果(二値属性値)をサーバ1へ送信するアプリケーション(仕分けアプリ)がインストールされる。そして、CPU31が仕分けアプリを実行することによって、端末3を二値属性値入力装置311として動作させる。CPU31は、二値属性値入力画面を出力装置34に含まれるディスプレイ装置に表示する。
【0067】
これにより、端末3のユーザは、入力装置33を操作して、二値属性値入力画面に表示された“LIKE”ボタンと“Next”ボタンとの一方を押すことで、二値属性値を入力することができる。
【0068】
なお、図1に示したサーバ1の出力装置14に二値属性値入力画面を表示して入力装置13から二値属性値を入力させる構成を採用することもできる。また、記憶部122に記憶された画像は、例えば、サーバ1以外のコンピュータ(通信機器)から二値属性値入力装置311に供給されても良く、可搬性記憶媒体に記憶されて二値属性値入力装置311
に入力されても良い。
【0069】
二値属性値取得部112は、二値属性値入力装置311で入力された二値属性値を取得し、記憶部124に記憶する。図5は、記憶部124のデータ構造例を示す。記憶部124は、例えば、テーブル形式で、サンプル画像(サンプルデータ)の識別子(ID)に対応する二値属性値(“LIKE”及び“NOT LIKE”)の累積数(得票数)の集計結果を記憶する。
【0070】
図3に戻って、記憶部123には、各サンプル画像の特徴量が記憶されている。特徴量は、例えば、SIFTを用いて得られた特徴点の情報である。図6は、記憶部123のデータ構造例を示す。図6に示すように、記憶部123は、例えば、テーブル形式で、サンプル画像のIDに対応する特徴点の情報を記憶する。
【0071】
類似度計算部113は、記憶部123から特徴量の情報を読み出して、サンプル画像間での類似度(スコアと呼ばれる)を計算し、記憶部125に記憶する。図7は、記憶部125のデータ構造例を示す。図7に示すように、記憶部125は、テーブル形式で、サンプル画像のID毎に、各他のサンプル画像との類似度を示す値(スコア)が記憶される。なお、類似度(スコア)は、スコアは対象画像を起点とした値として求められ、値が大きい程、類似度が高いことを示す。スコアは、例えば、一致の場合に“100”(最大値)となり、最低値は0である。
【0072】
ランキング計算部114は、記憶部124に記憶された各サンプル画像の二値属性値に基づくサンプル画像のランキングを生成し、記憶部126に記憶する。例えば、各サンプル画像について入力された二値属性値(“YES”及び“NO”)のうち“YES”が占める割合(以下“YES”占有率という)が大きい順で、サンプル画像を順位付けする。もっとも、
単に“YES”の数の多い順でサンプル画像の順序付けをすることもできる。また、目的に
応じて逆順でランキングする場合もあり得る。
【0073】
ランキングは、グルーピングの一例である。すなわち、ランキングは、“YES”占有率
が一番高いグループ(ランク1位のグループ)、二番目に高いグループ(ランク2位のグループ)、三番目に高いグループ(ランク3位のグループ)・・・の何れかから各サンプル画像(サンプルデータ)が属するグループを決定する処理である。但し、グループ間が順序づけられていることは必ずしも必要ではなく、サンプルデータのグルーピングの目的に依存する。すなわち、グルーピング条件は、ランキング以外の条件を適宜設定可能である。
【0074】
ランキング計算は、例えば、記憶部124に記憶された二値属性値が更新される毎に実行することができる。或いは、記憶部124に記憶された二値属性値の更新を示すフラグを設定し、一定時間経過毎にフラグを参照し、二値属性値の更新を示すフラグがセットされている場合にランキング計算が実行される構成を採用することができる。一定時間は、ハードウェア又はソフトウェアによるタイマの設定により計時することができる。
【0075】
ランキング計算部114の計算結果(ランキングの情報)は、記憶部126に記憶される。図8は、記憶部126のデータ構造例を示す。記憶部126では、例えば、グループの識別情報(例えば名称:ランク1,ランク2,・・・)と、各グループ(ランク)に属するサンプル画像のID(画像ID)とが対応づけて記憶される。同順位の画像IDは、同一のグループ(ランク)に属する。また、図8に示すように、当該IDを有するサンプル画像について得られた“YES”占有率(%)がさらに記憶されるようにしても良い。“YES”占有率は、“YES”の数であっても良い。このような、割合のデータは、後述するラ
ンキング画面におけるグラフ作成用に使用される。
【0076】
画像入力装置312は、ランキングの予測対象の女性画像(「対象画像」と称する。対象データに相当)をサーバ1に入力するために使用される。対象画像は、画像入力装置312として動作する端末3が備えるカメラで撮影された画像であっても良く、端末3のメモリ12に記憶された画像であっても良く、端末3が外部の通信機器や可搬性記憶媒体から入手した画像であっても良い。また、対象画像は、サーバ1の入力装置13に含まれるイメージスキャナにて取り込まれた女性の写真画像であっても良い。
【0077】
画像取得部115は、画像入力装置312から入力された対象画像のデータを類似度計算部113に供給する。類似度計算部113は、画像取得部115から供給された対象画像に対するSIFTを用いた処理を行い、対象画像の特徴点の情報(特徴量)を得る。続いて、類似度計算部113は、記憶部123に記憶された各サンプル画像の特徴点の情報(特徴量)との類似度(スコア)を計算し、対象画像に最も類似する(最高スコアの)サンプル画像のIDを特定する。サンプル画像のIDは、ランキング予測計算部116に供給される。
【0078】
ランキング予測計算部116は、記憶部126に記憶されたランキングの情報を参照して、対象画像に対する二値属性値の入力が行われた場合におけるランキング予測を計算する。当該計算は、対象画像と最も類似するサンプル画像が属するグループを特定することで行う。例えば、最高スコアのサンプル画像のIDに対応づけられたグループのIDを記憶部126から読み出し、グループIDからグループを特定することで、最高スコアのサンプル画像が属するグループ(ランク)を特定することができる。
【0079】
対象画像のランキング予測結果は、ランキング出力部117から出力され、ランキング出力装置313に供給される。ランキング出力装置313は、例えば対象画像を送信した端末3(画像入力装置312として動作する端末3)であり、ランキング予測結果を示す画面は、例えば画像入力アプリによる機能として、端末3の出力装置34(ディスプレイ装置)に表示される。或いは、サーバ1の出力装置14(ディスプレイ装置)に表示することもできる。或いは、ランキング予測結果は、シートに印刷することもできる。
【0080】
図9は、ランキング予測結果の表示画面(「ランキング画面」と称する)例を示す。図9に示す例では、各グループは、“YES”占有率が高い順(ランク順)で、左から右方向
に棒グラフで示される。棒グラフの高さは、“YES”占有率(%)を示す。対象画像が属
するグループは、他のグループと異なる表示態様(例えば色や明度)で表示される。ランキング画面には、対象画像の順位や、偏差値を表示するようにしても良い。
【0081】
図10(A)は、ランキング予測における処理例を示すフローチャートであり、図10(B)は、二値属性値が入力された際における処理例を示すフローチャートである。図10(A)及び図10(B)に示す処理は、例えば、サーバ1のCPU11によって実行される。
【0082】
図10(A)のステップS01において、CPU11は、対象画像のデータを取得する。ステップS02において、CPU11は、対象画像の特徴点の情報を生成する。ステップS03において、CPU11は、スコア計算を行う。
【0083】
すなわち、CPU11は、サンプル画像の特徴点の情報と対象画像の特徴点の情報とを用いて、サンプル画像と対象画像との類似度(スコア)を算出する。CPU11は、スコア計算を、対象画像と、記憶部123に特徴点の情報が記憶された全てのサンプル画像との間で実行する。
【0084】
ステップS04では、CPU11は、ステップS03で得られたスコア値を記憶部125に記憶(保存)する。図11は、記憶部125の更新の一例を示す。図11に示す例では、例えば、ID=1,ID=2,ID=3のサンプル画像の類似度が記憶部125に記憶されていると仮定する。記憶部125には、各ID毎に、比較対象のサンプル画像との類似度がカンマ(,)区切りで格納されている。
【0085】
例えば、ID=1のサンプル画像に関して、ID=1のサンプル画像との類似度“100”(最高値:完全一致),ID=2のサンプル画像との類似度“10”,ID=3のサンプル画像との類似度“20”が記憶されている。また、ID=2のサンプル画像に関して、ID=1のサンプル画像との類似度“10”,ID=2のサンプル画像との類似度“100”,ID=3のサンプル画像との類似度“20”が記憶されている。また、ID=3のサンプル画像に関して、ID=1のサンプル画像との類似度“20”,ID=2のサンプル画像との類似度“20”,ID=3のサンプル画像との類似度“100”が記憶されている。
【0086】
ここで、ID=4を有する新規のサンプル画像の類似度が追加される場合を仮定する。ID=4とID=1との類似度は“15”であり、ID=2との類似度は“25”であり、ID=3との類似度は“35”であると仮定する。
【0087】
この場合、図11に示すように、ID=4に関するレコード(行)が追加され、ID=4と、ID=1〜4(全てのサンプル画像)との類似度が、ID順(記憶部125をなすテーブルへの登録順)で登録される。さらに、ID=1〜3のレコード(行)には、ID=4との類似度が追加される。すなわち、更新前における各レコードに登録された類似度のエントリ数をNとすると、更新によって、N+1個の類似度がカンマ区切りの数字列で登録される。
【0088】
ステップS05では、CPU11は、ステップS04で計算されたスコアのうち最大のスコアを求める。ステップS06では、CPU11は、最大スコアが得られたときのサンプル画像のIDを取得する。
【0089】
ステップS07では、CPU11は、サンプル画像のIDに対応するグループ(サンプル画像が属するランク)を、対象画像のランク(予測順位)として出力する。なお、ステップS08では、CPU11は、対象画像を新規のサンプル画像として記憶部122に記憶する。また、ステップS02で得られた対象画像の特徴点の情報(特徴量)を記憶部123に入力する。
【0090】
また、図示しないが、新規のサンプル画像としての対象画像に対する二値属性値の推定値が記憶部124に記憶される。二値属性値の推定値として、例えば、最大のスコアが得られたときの特徴量を有するサンプル画像に対応する二値属性値の統計情報(“YES”及
び“NO”)の数が推定値として適用される。或いは、任意の値を推定値として適用することもできる。例えば、サンプル画像の特徴量との比較で得られた最大スコアとスコアの最大値“100”との差分に応じた二値属性値の統計値(推定値)を作成することもできる。例えば、差分に応じて“YES”及び“NO”の数の少なくとも一方を増減させることが考
えられる。
【0091】
図10(B)のステップS11では、CPU11は、サンプル画像の少なくとも一つに対する二値属性値の入力を検出する。ステップS12では、CPU11は、二値属性値を記憶部124に記憶する。ステップS13では、CPU11は、二値属性値の更新に伴い、記憶部126に記憶されたランキング(順位)を更新する。
【0092】
実施形態によれば、対象画像データの女性がどのランクとなるのかを予測することができる。すなわち、対象画像の女性が美人として評価される傾向を知ることが可能となる。評価は、複数人による二値属性値に基づいて行われるので、或る者が単独で基準を作成した場合のような、基準作成者の主観による評価基準の偏りをなくすことができる。すなわち、実施形態によれば、サンプル画像についての複数の評価者が対象画像(対象データ)を評価したときの予測結果を得ることができる。
【0093】
図12は、予測システムの変形例を示す図である。図12に示すように、サーバ1が、付加属性の記憶部127を含む。記憶部127は、メモリ12上に作成され、DB121に含まれる。
【0094】
記憶部127は、付加属性として、サンプル画像の被写体に係る属性情報を記憶する。属性情報は、地理情報(例えば、被写体人物の撮影場所,被写体人物の居住地や出身地),撮影時期,被写体人物の年齢,性別,職種,趣味などの「美人」(評価の一例)の主観的判断基準形成の背景となり得る属性情報を記憶する。
【0095】
また、二値属性値の記憶部124には、二値属性値のタイムスタンプ、すなわち、二値属性値が作成された時間(年月日、時間を含める場合もあり得る)が二値属性値の統計値と関連づけて記憶される。各記憶部122から127は、共通のサンプル画像のIDを用いて管理される。
【0096】
図13は、変形例に係る処理例を示すフローチャートである。図13に示す処理は、例えば、サーバ1のCPU11によって実行される。例えば、サーバ1の入力装置13を用いて付加属性が指定される(ステップS21)。すると、CPU11は、記憶部123に記憶されたサンプル画像毎の特徴量のうち、指定された付加属性を有する特徴量を抽出する(ステップS22)。
【0097】
また、サーバ1の入力装置13を用いて期間が指定されると、CPU11は、記憶部124に記憶されたサンプル画像毎の二値属性値のうち、期間内に作成(入力)された二値属性値を抽出し、抽出された二値属性値を用いて、ステップS22で特徴量が抽出されたサンプル画像についてのランキングを生成する。このとき、抽出された特徴量を用いてサンプル画像間の類似度が算出され、記憶部125に記憶されても良い。
【0098】
その後、対象画像データが入力されると、CPU11は、ステップS22で抽出された特徴量と対象画像データの特徴量とを用いた類似度を算出する(ステップS23)。そして、CPU11は、最大の類似度(スコア)を有するサンプル画像が属するグループ(ランク)を、対象画像の属するグループ(ランク)として予測する(ステップS26)。なお、期間指定に係る構成はオプションである。
【0099】
変形例によれば、サンプル画像が付加属性に基づき抽出されるので、被写体の撮影時期や撮影場所に鑑みた評価(二値属性値入力)を端末3のユーザ(二値属性値の入力者)に求めることができ、時代や地域性を考慮した美人のランキングを作成することができる。また、二値属性値が期間により限定されることで、その期間における評価の傾向で時代の変遷に伴うぶれの少ない二値属性値による評価を得ることが可能となる。
【0100】
また、他の変形例としては、ランキングの絞り込みに係る付加機能を持たせることが考えられる。例えば、端末3(画像入力装置312)からの指定により、ランキングの範囲を指定可能とする。例えば、ランキングを二つに分けて、上位ランキング、下位ランキングから選択可能とする。但し、ランキングの分割数は適宜設定可能である。この場合、上位ランキングが選択された場合には、二値属性値の肯定的な属性(“YES”)に対する順
位予測の精度を上げることができる。一方、下位ランキングが選択された場合には、二値属性値の否定的な属性(“NO”)に対する順位予測の精度を上げることができる。
【0101】
また、実施形態では、対象画像と全てのサンプル画像との類似度が計算されているが、対象画像とランキングのN(Nは正の整数)位までのサンプル画像との類似度がされるようにしても良い。これにより、類似度計算に要する時間の短縮化を図ることができる。この場合、例えばN=100であれば、100位内のサンプル画像との類似度計算を元に、対象画像が属するランク(順位)の予測結果を示すことができる。このとき、例えば、サンプル画像との類似度の最大スコアが予め用意された閾値(予めメモリ12に記憶)より低い場合には、「ランク外(N位より下位)」との結果をランキング出力部117から出力するようにしても良い。対象画像が100位までのサンプル画像のいずれにも似ていないからである。
【0102】
また、サーバ1が、端末3のユーザ(二値属性値の入力者)についての付加的な属性情報を収集し、当該属性情報を用いた入力者の絞り込み(抽出)を実行し、抽出された入力者の二値属性値を用いてランキング(グルーピング)が実行されるようにしても良い。
【0103】
この場合、入力者の属性情報としては、以下を適用し得る。
・地理情報(出身地、入力している場所)
・趣味
・嗜好(好きな色や食べ物、動物など、マーケットで良く買うものなどを含む。例えばFacebookの情報から好みを抽出し、それに応じた二値属性値入力情報を選出する、といった使用方法が考えられる)
・年齢、性別、職種、年収、学歴、等の個人情報
・氏名又は名称(例えば、「鈴木」という名前の人の嗜好は、これこれに偏る、のような抽出)
・入力時刻(期間)
・入力時の環境情報(温度、風景、天気など。例えば、晴れの日に選ばれる「美人」はこの人、のような抽出)
【0104】
また、実施形態では、女性の写真画像について説明したが、男性の写真画像であっても良い。また、被写体は、人に制限されず、人以外の動植物,人工物,天然物であっても良い。また、実施形態で説明した構成は、画像データ以外のデータ,すなわち、音声データ,文字列データ,センサデータ,時系列データ,映像(動画)データにも適用が可能である。上述した実施形態の構成は、適宜組み合わせることができる。
【符号の説明】
【0105】
1・・・サーバ
3・・・端末
11・・・CPU
12・・・メモリ
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13