(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0014】
以下、本発明の実施の形態について、図面を用いて説明する。すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。
【0015】
なお、以下の説明における装置等を構成する各部は、論理回路等のハードウェアで構成される。また、各部は、コンピュータの制御部、メモリ、メモリにロードされたプログラム、プログラムを格納するハードディスク等の記憶ユニット、ネットワーク接続用インターフェースなどからなり、ハードウェアとソフトウェアの任意の組合せによって実現されてもよい。そして特に断りのない限り、その実現方法、装置は限定されない。
【0016】
また、実施形態における各部を制御する制御部はCPU(Central Processing Unit)などからなる。そして、制御部はOS(Operating system)を動作させて装置等の全体を制御するとともに、例えばドライブ装置などに装着された記録媒体からメモリにプログラムやデータを読み出し、これに従って各種の処理を実行する。記録媒体は、例えば光ディスク、フレキシブルディスク、磁気光ディスク、外付けハードディスク、半導体メモリ等であって、コンピュータプログラムをコンピュータが読み取り可能に記録する。また、コンピュータプログラムは、通信網に接続されている図示しない外部コンピュータからダウンロードされても良い。
【0017】
<実施形態1>
まず、本発明の第1の実施形態について図面を用いて説明する。
図1には、本実施の形態にかかる情報管理装置1の一例が示されている。
【0018】
情報処理装置1は、記憶部11と、属性抽出部12と、画像抽出部13と、表示部14と、入力部15と、検索部16と、出力部17と、特徴量抽出部18と、照合部19とを備える。情報処理装置1は、例えばカメラ機能を備えるスマートフォンなどの携帯端末であるがそれに限定されない。以下では、情報処理装置1が不図示のカメラ機能を備える例を説明する。
【0019】
記憶部11は、画像と属性とを対応付けて記憶する。画像は、画像自体のみならず画像の特徴量であっても良い。属性とは、画像に紐づけられた情報であり、一般的には画像ないしその被写体の特徴を示す情報である。例えば、画像がコーヒー飲料の画像である場合、その属性は、商品:“飲料”、色:“黒い”、味:“苦い”、販売会社名:“〜株式会社”、などである。
【0020】
図2は記憶部11が記憶する画像と属性との対応づけの一例を示している。ここで、属性1〜6は各々異なる属性を示している。
図2は、例えば、画像Aと属性1〜3とが対応づけられていることを示している。
【0021】
属性抽出部12は、取得した画像に対応する属性を記憶部11から抽出する。ここで、“取得した画像”とは、例えば、情報処理装置1が備えるカメラが撮像した画像である。すなわち、画像は、情報処理装置1の所持者(以下、単にユーザという)がカメラ等で撮像した商品等の画像である。あるいは、情報処理装置1が通信機能を備える場合には、“取得した画像”は、外部装置から取得した画像であっても良い。“取得した画像“は、カメラ等で撮像された画像に類似する画像として記憶部11等から抽出された画像でも良い。この場合、特徴量抽出部18、照合部19によって、カメラ等で撮像された画像の特徴量が記憶部11に格納された画像の特徴量と照合され、類似する画像が検索される。このように検索された画像が”取得した画像”であっても良い。なお、特徴量抽出部18は、画像から特徴量抽出を行う機能を有するが特徴量抽出の方法は様々な方法が知られているため詳述しない。また、照合部19は、記憶部11を検索して、画像の特徴量同士のマッチング処理を行い、特徴量が所定以上一致する類似画像が存在するか否かを判定する機能を有する。このような照合処理についても様々な方法が知られているため詳述しない。
【0022】
属性抽出部12は、画像を取得すると、記憶部11を参照し、取得した画像に対応する属性を抽出する。例えば、取得した画像が画像Aであれば、属性抽出部12は、属性1〜3を抽出する。
【0023】
画像抽出部13は、属性抽出部12により抽出された属性に対応づけられた画像を記憶部11から抽出する。例えば、属性抽出部12が抽出した属性が1〜3であれば、画像抽出部13は、属性1〜3に対応付けられた画像を抽出する。
【0024】
図3には、属性1〜3に対応付けられた画像を抽出する画像抽出部13の動作イメージが示されている。
図2を参照すると、属性1に対応する画像は画像A、画像Cである。属性2に対応する画像は画像A、画像B、画像Cである。属性3に対応する画像は画像A、画像Eである。そのため、画像抽出部13はこれらの画像を抽出する。画像抽出部13はこれらの画像を属性ごとに抽出しても良い。その場合、同一の画像が重複して抽出される場合もある。例えば、
図3では、画像A、Cが重複して抽出されている。
【0025】
表示部14は、抽出された画像を表示する。例えば、表示部14は、属性ごとに抽出された画像を属性と対応付けて表示させても良い。
図4には、表示部14上に、属性ごとに画像が列に並んで表示される例を示している。
図4では、属性1に対応する画像A、Cが左列に並んでおり、属性2に対応する画像A、B、Cが中央列に並んでおり、属性3に対応する画像A、Eが右列に並んでいる。なお、
図4には属性名が表示部14に表示されているが、属性名は必ずしも表示される必要はない。また、属性ごとに抽出された画像を属性と対応付けて表示させる例は
図4の態様に限られない。他の例については後述する。
【0026】
入力部15は表示された画像の選択を受け付ける機能を有する。例えば、
図5に示すように、入力部15は表示部14と一体的に設けられたタッチパネルでも良い。入力部15は画像を選択できるキーボタン等でも良いが、ここでは入力部15が
図5に示すタッチパネルである場合を例に説明する。ユーザは、表示部14に表示された画像を選択するために、画像上をタッチする。タッチされた画像は他の画像と区別可能に表示される。例えば、
図5では選択された画像に丸印がついている。ユーザは入力部15を介して、自分が検索対象としたかった画像に類似する画像を選択することができる。
図5では、ユーザが画像BとEとを選択したことを示している。
【0027】
検索部16は、選択された画像に対応づけられた属性に基づいて、記憶部11から画像の再抽出を行う。例えば、ユーザが画像BとEとを選択した場合、検索部16は、画像BとEにそれぞれ対応する属性に基づいて画像の抽出を行う。
【0028】
図6には、検索部16の動作イメージが示されている。記憶部11を参照すると、画像Bに対応する属性は2と4である。また、画像Eに対応する属性は3、4、6である。ここで、検索部16は、属性の個数が所定数以上の属性を算出する。例えば、本例では、属性2、3、6は1つ、属性4は2つである。そのため、所定数が2であれば、属性4が算出される。本実施形態では所定数を2として説明する。
【0029】
次に、検索部16は算出された属性に対応する画像を記憶部11から抽出する。本例では、所定数を2としているため属性4が算出される。そのため、検索部16は、属性4に対応する画像を記憶部11から抽出する。
図2を参照すると、属性4に対応する画像はB、C、D、Eである。そのため、検索部16はこれらの画像を抽出する。
【0030】
出力部17は、検索結果を出力する。出力とは、表示部14への表示や不図示のマイクによる音声での報知などである。検索結果の出力とは、抽出された画像を表示することが含まれる。また、検索結果の出力とは、抽出された画像に対応する情報検索結果を表示することが含まれる。例えば、記憶部11に各画像に対応付けてURL(Uniform Resource Locator)が記憶されていれば、出力部17は、抽出された画像を表示せずに、直接URL先の情報をユーザに提示しても良い。
【0031】
次に、本実施の形態における情報処理装置1の動作について
図7を用いて説明する。まず、情報処理装置1の不図示のカメラは、商品等の物体を撮像する(ステップS1)。特徴量抽出部18は、画像から特徴量抽出を行う(ステップS2)。照合部19は、記憶部11を検索して、類似画像が存在するか否かを判定する(ステップS3)。
【0032】
類似画像が存在する場合、属性抽出部12は当該画像と関連づけられた属性を記憶部11から抽出する(ステップS4)。次に、画像抽出部13は、抽出された
属性と関連付けられた
画像を記憶部11から抽出する(ステップS5)。次に、表示部14は画像を表示する(ステップS6)。次に、入力部15を介して、ユーザは表示された画像から任意の画像の選択を行う(ステップS7)。検索部16は、選択画像と関連づけられた属性を抽出する(ステップS8)。次に検索部16は、属性の個数が所定数以上の属性を算出する(ステップS9)。なお、検索部16は、属性の個数が所定数以上の属性を算出する代わりに、属性の個数が最も多い属性を選択しても良い。次に検索部16は、算出された属性に関連付けられた画像を記憶部11から抽出する(ステップS10)。最後に、出力部17は検索された画像を出力する(ステップS11)。
【0033】
このような動作により、ユーザは所望の情報検索ができる。その理由は以下の通りである。まずユーザは、情報を欲する対象となる物体を撮影する。この際、画像の特徴量を基に類似画像が検索されるが、類似画像が必ずしもユーザの欲する画像ではない場合がある。そこで本発明では、類似画像に関連付けられた属性を参照し、属性に関連付けられている他の画像を表示する。ユーザは、表示された画像から自己の意図に沿う画像を選択することができる。この際、属性ごとに画像がまとめて表示されれば、ユーザは画像を選択しやすいという効果がある。ユーザに選択された画像はユーザの意図を反映している。そこで、この選択画像の属性を基に再度画像検索を行うことにより、ユーザが欲していた画像ないし画像に関する情報を検索することができる。
【0034】
例えば、上述の例では、ユーザが撮影した画像に最も類似する画像はAであったため画像Aが上述の“取得した画像”である。しかし、画像Aの属性をもとに抽出された画像は、画像Aのほかに、B、C、Eが存在するため、それらの画像が表示される(ステップS6)。表示画像をユーザが閲覧し選択することにより、ユーザが欲する画像ないし画像の情報は、画像Aではなく画像BやEに関するものであると推測される(
図5、ステップS7)。したがって、再検索された後に表示される画像は画像Aではなく、属性が類似である画像B、C、D、Eである(
図6、ステップS11)。
【0035】
ユーザが欲していた画像ないし画像の情報は、画像被写体の外観から得られる特徴量に関する情報のみではなく、被写体となった物体のもつ情報(属性)を反映させる必要がある場合がある。本発明は画像の被写体の属性をも考慮して画像を検索することができるため、ユーザが所望の情報検索を行うことができる。
【0036】
<実施形態1の具体例>
本発明の第1の実施の形態の具体例について図面を用いて補足説明する。
図8は、記憶部11の記憶する画像と属性との対応づけの例を示している。ここで“飲料〜”(〜は数字)は飲料の画像を示している。“飲料1”には属性としてA社、炭酸、飲料、黒色が対応づけられている。このことは、例えば、“飲料1“の画像の被写体となる商品等が、A社製の炭酸飲料であり、色が黒色であることを示している、と理解することができる。
【0037】
本例では、例えば“飲料1”に関する画像が取得されたと仮定する。このことは、ユーザが記憶部11に記憶された“飲料1”の画像を何らかの方法で選択した場合を含む。また、上述のように、“飲料1”に関する画像が取得された、とは、被写体をカメラで撮影することにより得られた画像と記憶部11に記憶された画像とが照合されて“飲料1”の画像が画像照合部等によって取得された場合を含む(ステップS1〜S3)。
【0038】
属性抽出部12は、取得された画像“飲料1”に対応付けられた属性を抽出する(ステップS4)。これにより、
図9に示すように、A社、炭酸、飲料、黒色の属性が抽出される。次に画像抽出部13は、抽出された属性に対応づけられた画像を抽出する(ステップS5)。これにより、
図9に示すように、属性 “A社”に対しては“飲料1”“飲料2”“飲料3”が抽出される。属性“炭酸”に対しては“飲料1”“飲料2”“飲料6”が抽出される。属性“飲料”に対しては“飲料1”“飲料2”“飲料3”“飲料4”“飲料5”“飲料6”が抽出される。属性“黒色”に対しては“飲料1”“飲料5”“飲料6”が抽出される。
【0039】
画像表示部14は抽出された画像を表示する(ステップS6)。
図10は属性ごとにこれらの画像が並べて表示された例を示している。画像の大きさや隙間は適宜変更されて良い。
図10では全画像が一画面に表示されているが、全画像の表示に画面スクロールを要しても良い。また属性ごとに縦方向に画像が並べられているが、横方向に画像が並べられても良いし、他の形状に並べられても良い。例えば、
図13に示すように、属性ごとにまとまりを持ったクラスターとして画像が表示されても良い。
図11、13には属性の名称が表示されているが、属性の名称が表示される必要はない。また、属性の名称が表示される場合には属性の名称の近傍に当該属性に対応する画像が表示されるようにしても良い。
【0040】
ユーザは表示部14に表示された画像に対し、入力部15により画像の選択を行う(ステップS7)。
図11では、属性“炭酸”に対応する画像“飲料2”“飲料6”及び属性“黒色”に対応する“飲料5”が選択された例を示している。
図11では同じ飲料の画像が重複して表示されているが、属性ごとに並んで表示されているため、ユーザは画像の並びを見ることにより、並んだ画像に共通する属性を直感的に把握することができる。従って、たとえ属性の名称が表示部14に表示されていなくとも、ユーザは所望の画像を選択することができる。
【0041】
次に、検索部16は、選択画像と関連づけられた属性を抽出する(ステップS8)。
図12に示されるように、選択された画像“飲料2””飲料6”“飲料5”に関連づけられた属性は、A社、炭酸、飲料、透明、B社、炭酸、飲料、黒色、コーヒー、飲料、黒色である。
【0042】
検索部16は、属性の個数が所定数以上の属性を算出する(ステップS9)。ここでは、所定数は2とする。
図12に示されるように、抽出された属性のうち2つ以上のものは炭酸、飲料、黒色である。
【0043】
検索部16は、算出された属性に対応する画像を検索する(ステップS10)。炭酸、飲料、黒色の全ての属性と対応する画像は“飲料1”、“飲料6”であるから、検索部16はこれらの画像を記憶部11から抽出する。
【0044】
このような一連の動作により、ユーザは所望の画像を得ることができる。その理由は以下の通りである。まず、ユーザは黒色の炭酸飲料に関する情報を取得したいと仮定する。そのため、ユーザは黒色の炭酸飲料商品を見つけた際、当該商品の画像をカメラ等によって取得する。この際、通常の画像照合によれば、当該商品と外観が類似する“飲料1”の画像を得ることができる。一方、ユーザは、黒色の炭酸飲料の商品の情報が欲しいため、“飲料1”以外にも黒色の炭酸飲料の画像を欲する場合がある。その場合、本発明によれば上述の処理により、黒色の炭酸飲料である“飲料6”の画像を得ることができる。そのため、ユーザは商品の外観に関係なく黒色の炭酸飲料に関する情報も得ることができる。
【0045】
このように、本発明は画像(の被写体)の属性をも考慮して画像を検索することができるため、ユーザが所望の情報検索を行うことができる。
【0046】
<実施形態2>
次に、本発明の第2の実施の形態について説明する。本実施の形態では、実施形態1で説明した属性が階層構造を有している点で上述の例と異なる。以下では実施形態1と異なる点を中心に説明する。
【0047】
図14には、属性の階層化を示す一例が示されている。
図14は、例えば、属性1の直下位階層に属性11、12、13が存在することを示している。また、
図14は、例えば、属性1111の上位階層は属性111、属性11、属性1であることを示している。本実施の形態における属性はこのような階層構造を有しており、自属性には上位または下位の属性が存在する。なお、このような属性の階層化を示す情報は記憶部11乃至外部記憶部等に記憶されている。
【0048】
本実施の形態では、属性抽出部12は、上位階層の属性も抽出する。具体例を用いて説明する。
図15には、食べ物のジャンル属性に関する階層例が示されている。ここでは、和食の下位階層には寿司、うなぎ、天ぷらが位置づけられ、寿司の下位階層にはまぐろ、えび、いくらが位置づけられている。これらの対応関係は記憶部11や他の記憶部に記憶されている。
図16には、記憶部11の記憶する画像と属性との対応関係が示されている。ここで、まぐろ寿司の写真1が情報処理装置1に取得されたと仮定する。この場合、上述の実施形態においては、属性“まぐろ”に対応する“まぐろ寿司の写真1”と“まぐろ寿司の写真2”とが属性抽出部12によって抽出される。一方、本実施の形態における属性抽出部12は、属性“まぐろ”に加え、上位階層の属性も抽出する。本例では、属性“寿司”と属性“和食”が属性“まぐろ”の上位階層である。そのため、属性抽出部12は属性について、まぐろ、寿司、和食を抽出する。
【0049】
次に画像抽出部13は、抽出された属性に対応する画像を抽出する。本例では、まぐろ、寿司、和食の各属性に対応する画像が抽出される。
【0050】
次に、表示部14は、抽出された画像を属性ごとにまとめて表示する。
図17は表示例を示した図である。
図17に示されるように、まぐろ、寿司、和食の各々の属性ごとに対応する画像が表示される。ユーザは、入力部15を介して画像を選択する。以降の検索部16、出力部17の動作は実施形態1と同様である。
【0051】
図18は本実施の形態の動作例を示している。ステップS1〜3までは実施形態1と同様である。次にステップS21において、属性抽出部12は、画像と関連付けられた属性および当該属性の上位階層に位置する属性を抽出する。その後の動作は実施形態1のステップS5以降と同様である。
【0052】
本実施の形態の利用例を説明する。例えば、ユーザは、まぐろ寿司を情報処理装置1のカメラで撮影する。その結果、情報処理装置1は、まぐろ寿司と類似度の高い“まぐろ寿司の写真1“を上述のように取得する。その後、上述の動作によって
図17のように表示部14に様々な画像が表示される。当該画像のうち、ユーザが選択した画像が“複数のにぎり寿司が写っている写真”や“巻き寿司の写真”であれば、ユーザはまぐろ寿司だけではなく、寿司の画像に関する情報が欲しいことが分かる。従って、その後の情報検索においては、まぐろ寿司ではなく、寿司一般に関しての情報検索を行うことができる。例えば、記憶部11に各画像に対応付けてURL(Uniform Resource Locator)が記憶されていれば、出力部17は、ステップS11で直接URL先の情報をユーザに提示しても良い。
【0053】
本実施の形態によれば、属性を階層化しておくことにより、ユーザに適切な階層レベルで情報を提示することができる。従って、画像そのものの特徴のみならず、画像の被写体の属性をも考慮してユーザの所望する情報検索を行うことができる。
【0054】
<実施形態3>
次に、本発明の第3の実施の形態について説明する。本実施の形態における情報処理装置1は、記憶部11と、属性抽出部12と、画像抽出部13と、表示部14と、入力部15と、検索部16と、出力部17と、を備える。
【0055】
記憶部11は画像と属性とを対応付けて記憶する。属性抽出部12は、取得した画像に対応する属性を記憶部11から抽出する。なお、属性抽出部12は、画像を分析することによって属性を抽出しても良い。すなわち、取得した画像に対して属性抽出部12は所定の観点から属性を分析する。所定の観点とは、例えば、被写体の色、ロゴ、形などの特徴量である。この場合、属性抽出部12は、取得した画像に対応する属性を記憶部11から抽出せずに、所定の観点から分析した属性を抽出しても良い。このように、属性抽出部12が画像から属性を抽出する方法には、少なくとも、記憶部11を介する場合と介さない場合があり、これらをまとめて「画像から属性を抽出する」と称する。画像抽出部13は、抽出された属性に対応づけられた画像を記憶部11から抽出する。表示部14は、抽出された画像を表示する。入力部15は、表示された画像の選択を受け付ける。検索部16は、選択された画像に対応づけられた属性に基づいて、記憶部11から画像の再抽出を行う。
【0056】
このような構成によれば、画像(の被写体)の属性をも考慮して画像を検索することができるため、ユーザが所望の情報検索を行うことができる。
【0057】
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成は、本願発明のスコープ内で当業者が理解しうる様々な変更をすることができる。例えば、1つの構成体で構成されているように記載されているものを複数の構成体で構成させることもできる。例えば、
図20に示すように、情報処理装置を二つに分け、情報処理装置2には画像取得機能と画像の通信機能(通信部)、画像表示選択機能等(表示部14、入力部15、出力部17)だけを持たせても良い。この場合情報処理装置1は通信により取得した画像に対して上述の検索処理等を行い、検索結果を返す機能を持つ(通信部、特徴量抽出部18、照合部19、属性抽出部12、記憶部11、画像抽出部13、検索部16)。すなわち、2つの情報処理装置によって構成される情報処理システムが実現される。より詳細には、情報処理装置2は、画像を情報処理装置1に送信する送信部(通信部)と、画像を表示する表示部14と、表示された画像の選択を受け付けて情報処理装置1に送信する入力部15と、受信した検索結果を出力する出力部17と、を備える。入力部15が選択画像を送信する通信機能を備える点で上述の実施形態と異なるが、通信は通信部が行っても良い。一方、情報処理装置1は、画像と属性とを対応付けて記憶する記憶部11と、情報処理装置2から受信した画像に対応する属性を記憶部11から抽出する属性抽出部12とを備える。また、情報処理装置1は、抽出された属性に対応づけられた画像を記憶部11から抽出して情報処理装置1に送信する画像抽出部13を備える。画像抽出部13が通信機能を備える点で上述の実施形態とは異なるが、通信は通信部が行っても良い。また、情報処理装置1は、情報処理装置2で選択された画像に対応づけられた属性に基づいて、記憶部11から画像の再抽出を行う検索部16を備える。このような構成によれば、情報処理装置2自体の構成を簡略化しつつ、情報処理装置2で本発明の効果を実現できる。このように、本願発明の構成は、本願発明のスコープ内で当業者が理解しうる様々な変更が可能である。