【文献】
柳井 啓司,“Web画像収集における単語ベクトルの導入と画像特徴の改良”,電子情報通信学会技術研究報告 Vol.102 No.555 IEICE Technical Report,日本,社団法人電子情報通信学会,2003年 1月10日,第102巻,第555号,p.55−60
(58)【調査した分野】(Int.Cl.,DB名)
前記画像の視覚特徴と前記関連画像の視覚特徴との関連性を計算することにより前記キーワードと前記画像との関連性を取得するステップが、前記第1ベクトルと前記第2ベクトルとの関連性を計算することにより前記キーワードと前記画像との関連性を取得することを含む請求項2に記載の方法。
前記テキスト特徴が、対応画像のタイトル、画像説明、サブリンク、コンテキスト情報、及び対応画像に含まれる文字及びエンティティ情報のうち少なくとも1つを含む請求項1から請求項3のいずれかに記載の方法。
前記テキスト特徴が、対応画像のタイトル、画像説明、サブリンク、コンテキスト情報、及び対応画像に含まれる文字及びエンティティ情報のうち少なくとも1つを含む請求項6から請求項8のいずれかに記載の装置。
前記第2取得モジュールが前記画像に基づいて予め構築された前記材料情報バンクから前記現在のキーワードに関連する前記材料情報を取得する前に、前記画像及び該画像に対応する文字情報を取得及び記憶し、前記画像及び該画像に対応する前記文字情報を対応する材料情報に処理し、且つ前記画像及び該画像に対応する前記材料情報を前記材料情報バンクに記憶する取得記憶モジュールを更に有する請求項6記載の装置。
【発明を実施するための形態】
【0018】
以下に、本発明の一実施形態について詳細に説明する。本実施形態の例示が図面において示されるが、一貫して同一または類似する符号は、同一又は類似の部品、又は、同一又は類似の機能を有する部品を表す。以下に、図面を参照しながら説明される本実施形態は一例であり、本発明を解釈するためだけに用いられるものであって、本発明を限定するように理解されてはならない。
【0019】
以下に、附図を参照しながら本発明の一実施形態に係る情報検索方法及び装置を説明する。
【0020】
図1は、本発明の一実施形態に係る情報検索方法のフローチャートであり、当該方法について検索エンジン側から説明を行う。
【0021】
図1に示すように、当該情報検索方法は、ステップS101からステップS103を含む。
【0022】
ステップS101:現在のキーワードを取得する。
【0023】
本実施形態において、ユーザは検索ボックスにクエリー情報を入力することができる。クライアントは当該クエリー情報を取得し、且つ当該クエリー情報から現在のキーワードを取得してから、検索エンジンに現在のキーワードを送信することにより、検索エンジンは現在のキーワードを取得することができる。
【0024】
勿論、クライアントは、他の方式で現在のキーワードを取得することができる。例えば、ユーザがウェブページを閲覧する場合には、クライアントは、ユーザが閲覧するウェブページ内容に基づいて現在のキーワードを抽出し、且つ検索エンジンに現在のキーワード等を送信することができる。本実施形態においては、現在のキーワードの取得方式に対して限定しない。
【0025】
ステップS102:現在のキーワードに関連する、画像セグメント、文字セグメント及び/又は画像エンティティを含む材料情報を取得する。
【0026】
本実施形態において、
図2に示すように、ステップS102の前に、ステップS100aを更に含むことができる。
ステップS100a:キーワードと関連画像集合との対応関係を構築及び記憶する。
【0027】
また、
図2に示すように、ステップS102の前に、下記のステップS100b及びステップS100cを更に含むことができる。
ステップS100b:画像及びそれに対応する文字情報を取得及び記憶する。
ステップS100c:画像及びそれに対応する文字情報を対応する材料情報に処理し、且つ画像及びそれに対応する材料情報を材料情報バンクに記憶する。
【0028】
具体的には、インターネットにおける各ユニフォームリソースロケータ(URL)の画像、文字等の情報を取得及び記憶し、且つ取得された画像、文字等の情報を図像処理技術、文字処理技術によって単独的な画像セグメント、文字セグメント、画像エンティティ等に処理して、材料情報バンクを構築することができる。
【0029】
説明すべきことは、ステップS100aとステップS100b及びステップS100cとの間には絶対的な実行順番はなく、且つ、ステップS100aとステップS100b及びステップS100cは、ステップS101とステップS102との間に位置されてもよい。
【0030】
具体的には、現在のキーワードに関連する材料情報を取得することは、現在のキーワード及び予め記憶されたキーワードと関連画像集合との対応関係に基づいて現在のキーワードに関連する画像を取得し、且つ画像に基づいて予め構築された材料情報バンクから現在のキーワードに関連する材料情報を取得することであってもよい。
【0031】
ステップS103:材料情報を画像に合成し、合成された画像を検索結果ページに表示させる。
【0032】
本実施形態において、画像合成技術によって取得した材料情報を画像に合成することができる。例えば、取得した画像とテキスト、画像と画像、テキストとテキストとを画像に合成することができ、合成例としては、具体的には
図3から
図7を参照することができる。
【0033】
合成後の画像にはより多い情報が含まれるため、合成後の画像の質及び情報量が大幅に向上され、従ってユーザが情報を閲覧する速度を大きく向上させて、ユーザができるだけ早く多数の情報から自分に必要な情報を取得するように便宜することができる。
【0034】
上記の情報検索方法は、現在のキーワードを取得し、且つ現在のキーワードに関連する、画像セグメント、文字セグメント及び/又は画像エンティティを含む材料情報を取得する。そして、材料情報を画像に合成し、合成された画像を検索結果ページに表示させることから、本実施形態において、現在のキーワードに関連する材料情報を取得することにより、取得した材料情報と現在のキーワードとの関連性を高くし、取得した材料情報を合成することにより、画像の質及び情報量を向上させることができる。従ってユーザが情報を閲覧する速度を大きく向上させて、ユーザができるだけ早く多数の情報から自分に必要な情報を取得するように便宜することができる。
【0035】
図8は、本発明の一実施形態におけるキーワードと関連画像集合との対応関係を構築及び記憶するフローチャートである。本実施形態は、取得した多量なサンプルに基づいてキーワードと関連画像集合との対応関係の構築を完成したものである。
【0036】
図8に示すように、当該過程は、下記のステップS801からステップS804を含む。
【0037】
ステップS801:画像を取得し、且つ画像に対応するテキスト特徴及び視覚特徴を取得する。
【0038】
具体的には、異なるユニフォームリソースロケータ(URL)における画像を取得し、且つ対応画像のタイトル、画像説明、サブリンク及びコンテキスト情報のうちの少なくとも1つを取得すると共に、取得した情報を対応するテキスト特徴の一部にすることができる。
【0039】
また、光学文字認識(OCR)技術を適用して対応画像における文字情報及びエンティティ情報等を認識し、且つ認識した情報を対応するテキスト特徴の一部にすることができる。
【0040】
上記のことから、画像のテキスト特徴は、対応画像のタイトル、画像説明、サブリンク、コンテキスト情報及び対応画像に含まれる文字及びエンティティ情報のうちの少なくとも1つを含むことができる。
【0041】
具体的には、捕らえた各画像に対して、それを第1ベクトルに変換し、即ち第1ベクトルで対応する画像を示すことができる。また、第1ベクトルの次元は、N次元でもよい。上記の第1ベクトルは、対応画像の視覚特徴の一部とされてもよい。
【0042】
ステップS802:キーワード及びキーワードの関連画像を取得し、且つ関連画像のテキスト特徴及び視覚特徴を抽出する。
【0043】
本実施形態において、キーワードを取得し、且つ当該キーワードを取得した関連画像を検索してから、関連画像のテキスト特徴及び視覚特徴を抽出することができる。
【0044】
また、テキスト特徴の抽出方式はステップS801と同じであり、具体的な内容も対応画像のタイトル、画像説明、サブリンク、コンテキスト情報及び対応画像に含まれる文字及びエンティティ情報のうちの少なくとも1つである。
【0045】
一方、視覚特徴に対する抽出過程は、当該キーワードの関連画像を対応する第2ベクトルに変換し、即ち第2ベクトルで当該キーワードの関連画像を示してもよい。その中で、第1ベクトルと第2ベクトルとが同じ次元を有しており、例えば、いずれもN次元である。
【0046】
ステップS803:画像の視覚特徴と関連画像の視覚特徴との関連性を計算することによりキーワードと画像との関連性を取得する。
【0047】
本実施形態において、画像の視覚特徴と相関画像の視覚特徴との関連性を計算することによりキーワードと画像との関連性を取得し、即ち第1ベクトルと第2ベクトルとの関連性を計算することによりキーワードと画像との関連性を取得する。
【0048】
ステップS804:キーワードと画像との関連性及びキーワードの関連画像と画像
とのテキスト特
徴の関連性に基づいてキーワードの関連画像集合を取得し、且つキーワードと関連画像集合との対応関係を記憶する。
【0049】
説明すべきことは、キーワードと画像との関連性は、ただキーワードと関連画像集合との対応関係を構築する1つの指標であり、即ちキーワードと画像との関連性に基づくほかに、異なる画像のテキスト特徴間の関連性に基づいて関連画像集合を取得することもできる。このように、記憶したキーワードに関連する画像がより多く、且つ全面的であり、且つ関連性が高いため、検索エンジンが後続的にユーザによりよい検索結果を提供することに有利である。
【0050】
上記のことから、上記のステップS801からステップS804を介してキーワードと関連画像集合との対応関係を構築及び記憶する過程を完成することができることが分かる。
【0051】
上記の実施形態を実現するために、本発明は、情報検索装置を更に提供する。
【0052】
図9は、本発明の一実施形態に係る情報検索装置の構造模式図である。
【0053】
図9に示すように、当該情報検索装置は、第1取得モジュール91と、第2取得モジュール92と、合成モジュール93とを有する。
【0054】
第1取得モジュール91は、現在のキーワードを取得する。第2取得モジュール92は、現在のキーワードに関連する、画像セグメント、文字セグメント及び/又は画像エンティティを含む材料情報を取得する。合成モジュール93は、材料情報を画像に合成し、合成された画像を検索結果ページに表示させる。
【0055】
本実施形態において、ユーザは、検索ボックスにクエリー情報を入力することができ、クライアントは、当該クエリー情報を取得し、且つ当該クエリー情報から現在のキーワードを取得してから、第1取得モジュール91に現在のキーワードを送信する。このように、第1取得モジュール91は、現在のキーワードを取得することができる。
【0056】
勿論、クライアントは、他の方式で現在のキーワードを取得することができ、例えば、ユーザがウェブページを閲覧する時、クライアントは、ユーザが閲覧するウェブページ内容に基づいて現在のキーワードを抽出し、且つ第1取得モジュール91に現在のキーワード等を送信等することができる。本実施形態においては、現在のキーワードの取得方式に対して限定しない。
【0057】
また、
図10に示すように、当該装置は、構築記憶モジュール94を更に有していてもよい。当該構築記憶モジュール94は、第2取得モジュール92が現在のキーワード及び予め記憶されたキーワードと関連画像集合との対応関係に基づいて現在のキーワードに関連する画像を取得する前に、キーワードと関連画像集合との対応関係を構築及び記憶する。
【0058】
具体的には、構築記憶モジュール94は、第1取得ユニット941と、第2取得ユニット942と、計算ユニット943と、記憶ユニット944とを有する。
【0059】
第1取得ユニット941は、画像を取得し、且つ画像に対応するテキスト特徴及び視覚特徴を取得する。第2取得ユニット942は、キーワード及びキーワードの関連画像を取得し、且つ関連画像のテキスト特徴及び視覚特徴を取得する。計算ユニット943は、画像の視覚特徴と関連画像の視覚特徴との関連性を計算することによりキーワードと画像との関連性を取得する。記憶ユニット944は、計算ユニット943が計算したキーワードと画像との関連性及びキーワードの関連画像と画像
とのテキスト特
徴の関連性に基づいてキーワードの関連画像集合を取得し、且つキーワードと関連画像集合との対応関係を記憶する。
【0060】
具体的には、第1取得ユニット941は、異なるユニフォームリソースロケータ(URL)における画像を取得し、且つ対応画像のタイトル、画像説明、サブリンク及びコンテキスト情報のうち少なくとも1つを取得すると同時に、取得した情報を対応するテキスト特徴の一部とすることができる。
【0061】
また、第1取得ユニット941は、光学文字認識(OCR)技術を適用して対応画像における文字情報及びエンティティ情報等を認識し、且つ認識した情報を対応するテキスト特徴の一部にすることができる。
【0062】
上記のことから、画像のテキスト特徴は、対応画像のタイトル、画像説明、サブリンク、コンテキスト情報及び対応画像に含まれる文字及びエンティティ情報のうちの少なくとも1つを含むことができることが分かる。
【0063】
具体的には、第1取得ユニット941は、取得した各画像に対して、それを第1ベクトルに変換し、即ち第1ベクトルで対応する画像を表示することができる。また、第1ベクトルの次元は、N次元でもよい。第1ベクトルは、対応画像の視覚特徴の一部とされてもよい。
【0064】
同じように、第2取得ユニット942は、第1取得ユニット94と同じ抽出方式を適用してキーワード関連画像のテキスト特徴を取得することができる。具体的な内容も対応画像のタイトル、画像説明、サブリンク、コンテキスト情報及び対応画像に含まれる文字及びエンティティ情報のうちの少なくとも1つである。
【0065】
また、第2取得ユニット942は、関連画像を対応する第2ベクトルに変換することができる。また、第1ベクトルと第2ベクトルとは同じ次元を有し、例えば、いずれもN次元である。
【0066】
具体的には、計算ユニット943は、画像の視覚特徴と関連画像の視覚特徴との関連性を計算することによりキーワードと画像との関連性を取得する。即ち第1ベクトルと第2ベクトルとの関連性を計算することによりキーワードと画像との関連性を取得する。
【0067】
説明すべきことは、キーワードと画像との関連性は、ただキーワードと関連画像集合との対応関係を構築する1つの指標であり、即ちキーワードと画像との関連性に基づくほかに、異なる画像のテキスト特徴間の関連性に基づいて関連画像集合を取得することもできる。このように、記憶したキーワードに関連する画像がより多く、全面的であり、且つ関連性が高いため、検索エンジンが後続的にユーザによりよい検索結果を提供することに有利である。
【0068】
更に、
図10に示すように、当該装置は、取得記憶モジュール95を更に有していてもよい。当該取得記憶モジュール95は、第2取得モジュール92が画像に基づいて予め構築された材料情報バンクから現在のキーワードに関連する材料情報を取得する前に、画像及びそれに対応する文字情報を取得及び記憶し、画像及びそれに対応する文字情報を対応する材料情報に処理し、且つ画像及びそれに対応する材料情報を材料情報バンクに記憶する。
【0069】
具体的には、取得記憶モジュール95は、インターネットにおける各ユニフォームリソースロケータ(URL)の画像、文字等の情報を取得及び記憶し、且つ取得した画像、文字等の情報を図像処理技術、文字処理技術によって単独的な画像セグメント、文字セグメント、画像エンティティ等に処理して、材料情報バンクを構築することができる。
【0070】
図9又は
図10に示すように、情報検索装置に基づいて、第2取得モジュール92は、現在のキーワード及び構築記憶モジュール94が構築したキーワードと関連画像集合との対応関係に基づいて現在のキーワードに関連する画像を取得し、且つ画像に基づいて取得記憶モジュール95が記憶した材料情報バンクから現在のキーワードに関連する材料情報を取得することができる。
【0071】
第2取得モジュール92が現在のキーワードに関連する材料情報を取得した後、合成モジュール93は、画像合成技術によって取得した材料情報を画像に合成することができる。例えば、取得した画像とテキスト、画像と画像、テキストとテキストとを画像に合成することができ、合成例としては、具体的には
図3から
図7を参照することができる。
【0072】
合成後の画像にはより多い情報が含まれるため、合成後の画像の質及び情報量が大幅に向上され、従ってユーザが情報を閲覧する速度を大きく向上させて、ユーザができるだけ早く多数の情報から自分に必要な情報を取得するように便宜することができる。
【0073】
上記の情報検索装置は、第1取得モジュールによって現在のキーワードを取得し、第2取得モジュールによって現在のキーワードに関連する、画像セグメント、文字セグメント及び/又は画像エンティティを含む材料情報を取得する。
【0074】
そして、合成モジュールによって材料情報を画像に合成し、合成された画像を検索結果ページに表示させることから、本実施形態において、現在のキーワードに関連する材料情報を取得することにより、取得した材料情報と現在のキーワードとの関連性を高くし、取得した材料情報を合成することにより、画像の質及び情報量を向上させることができる。従ってユーザが情報を閲覧する速度を大きく向上させて、ユーザができるだけ早く多数の情報から自分に必要な情報を取得するように便宜することができる。
【0075】
上記の実施形態を実現するために、本発明は、記憶媒体を更に提供する。当該記憶媒体はアプリケーションプログラムを記憶し、当該アプリケーションプログラムは本発明の実施形態のいずれかに記載の情報検索方法を実行する。
【0076】
上記の実施形態を実現するために、本発明は、検索エンジンを更に提供する。当該検索エンジンは、少なくとも1つのプロセッサと、メモリと、少なくとも1つのモジュールとを有し、少なくとも1つのモジュールはメモリに記憶され、少なくとも1つのプロセッサにより実行されるとき、下記のことを行う。
【0077】
S101’:現在のキーワードを取得する。
【0078】
S102’:現在のキーワードに関連する、画像セグメント、文字セグメント及び/又は画像エンティティを含む材料情報を取得する。
【0079】
S103’:材料情報を画像に合成し、合成された画像を検索結果ページに表示させる。
【0080】
本明細書の説明において、参照用語である「一実施形態」、「他の実施形態」、「一例」、「具体例」、又は「他の一例」等の説明は、実施形態や一例を結合して説明する具体的な特徴、構造、材料、又は特点が本発明の少なくとも1つの実施形態や一例に含まれることを意味する。
【0081】
本明細書において、上記の用語に対する黙示的な記述が必ずしも同じ実施形態や一例に対することではない。また、説明された具体的な特徴、構造、材料、又は特点は、任意の少なくとも1つの実施形態又は一例にて適当な方式で結合されることができる。
また、相互に矛盾しない状況で、当業者は本明細書にて説明される異なる実施形態や一例及び異なる実施形態や一例の特徴に対する結合及び組み合わせを行うことができる。
【0082】
また、用語である「第1」、「第2」は説明のためだけに用いられるものであり、比較的な重要性を指示又は暗示するとか、又は指示された技術特徴の数を含蓄的に指し示すと理解してはいけない。従って、「第1」、「第2」と限定された特徴は、少なくとも1つの当該特徴を明白に又は含蓄的に含むことができる。本発明の説明において、別途の説明がない限り、「複数」の意味は少なくとも2つであり、例えば、2つ、3つ等である。
【0083】
フローチャートまたは他の方式で説明したいかなる過程や方法は、少なくとも1つの、特定ロジック性能または過程のステップを実現するに用いられる実行できるコマンドのコードのモジュール、要素あるいは部分を含むと理解されることができ、且つ本発明の望ましい実施形態の範囲は、他の実現を含み、その中で、表示または討論の順序に従わなくてもよく、述べられた機能に基づいて基本的に同様な方式または逆の順序でその機能を実行することを含む。これは、本発明の実施形態における当業者に理解される。
【0084】
フローチャート中で表され、又はその他の方式で記述された論理及び/又はステップは、例えば、ロジック機能を実現するための命令実行可能な順序リストであると考えられて良い。具体的には、いかなるコンピュータ読取可能媒体にて実現されて、指令実行システム、装置、若しくは設備(例えばコンピュータに基づくシステム、プロセッサを有するシステム又は他の指令実行システム、装置又は設備から指令を取得して指令を実行することができるシステム等)に使用、又はこれらの指令実行システム、装置、若しくは設備を結合して使用されることができる。
【0085】
本明細書において、「コンピュータ読取可能媒体」は、プログラムを含み、保存し、通信し、伝播し又は伝送して、指令実行システム、装置若しくは設備又はこれらの指令実行システム、装置若しくは設備に使用されるいかなる装置、又はこれらの指令実行システム、装置若しくは設備を結合して使用される装置であってもよい。
【0086】
コンピュータ読取可能媒体の更なる具体例(非網羅的リスト)には、少なくとも1つの配線を有する電気接続部(電子装置)、ポータブル型コンピュータディスク(磁気装置)、ランダムアクセスメモリ(RAM)、読出専用メモリ(ROM)、消去可能なプログラマブル読出専用メモリ(EPRCOM又はフラッシュメモリ)、光ファイバ、及びポータブル型コンパクト光ディスク読出専用メモリ(CDROM)が含まれる。
【0087】
また、コンピュータ読取可能媒体は、ひいては、その上に前記プログラムを印刷した紙又はその他の適当な媒体であってもよい。なぜなら、例えば、紙又はその他の媒体に対して光学スキャニングを行い、続いて編集、解釈又は必要の際、その他の適当な方式で処理を行って、電子方式によってプログラムを取得し、その後それをコンピュータメモリ中に保存することができるからである。
【0088】
理解すべきことは、本発明の各部分は、ハードウェア、ソフトウェア、ファームウエアまたはそれらの組み合わせで実現できる。上記の実施形態において、複数のステップまたは方法がメモリに記憶され、且つ適当なコマンド実行システムのソフトウェアまたはファームウエアで実現できる。
【0089】
例えば、ハードウェアで実現する場合、他の実施形態と同じように、本領域周知の下記の任意の1つまたはそれらの組み合わせで実現できる。すなわち、デジタル信号に対してロジック機能を実現するロジックゲート回路を有する離散ロジック回路、ロジックゲート回路を組み合わせた適当な専用IC、プログラマブルゲートアレイ(PGA)、フィールドプログラマブルゲートアレイ(FPGA)などである。
【0090】
実施形態に係る方法における少なくとも一部のステップがプログラムにより関連のハードウェアを実行することで完成されることは、本技術領域の普通の技術者に理解される。プログラムは1つのコンピュータ読取可能媒体に記憶されることができる。当該プログラムを実行するとき、実施形態に係る方法のステップの1つまたはそれらの組み合わせを含む。
【0091】
この他、本発明の各実施形態における各機能ユニットは、1つの処理モジュールに集積され、または、各ユニットの単独的な物理存在であり、あるいは、少なくとも2つのユニットが1つのモジュールに集積されることができる。集積されたモジュールは、ハードウェアの形式、または、ソフトウェア機能モジュールの形式で実現できる。集積されたモジュールが、ソフトウェア機能モジュールの形式で実現され、且つ独立の製品として販売又は使用される場合、コンピュータ読取可能媒体に記憶されることができる。
【0092】
上記の記憶メディアは、読出専用メモリ、ディスク、またはCDなどであって可能である。本発明の実施形態を示して説明したが、当業者にとって理解できるのは、上記の実施形態は一例であり、本発明に対する限定と理解されるものではない。当業者は、本発明の範囲で上記の実施形態に対して変化、補正、置換及び変形を行うことができる。