特許第6334805号(P6334805)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッドの特許一覧

<>
  • 特許6334805-検索方法及び装置 図000002
  • 特許6334805-検索方法及び装置 図000003
  • 特許6334805-検索方法及び装置 図000004
  • 特許6334805-検索方法及び装置 図000005
  • 特許6334805-検索方法及び装置 図000006
  • 特許6334805-検索方法及び装置 図000007
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6334805
(24)【登録日】2018年5月11日
(45)【発行日】2018年5月30日
(54)【発明の名称】検索方法及び装置
(51)【国際特許分類】
   G06F 17/30 20060101AFI20180521BHJP
【FI】
   G06F17/30 170B
   G06F17/30 330C
【請求項の数】7
【全頁数】18
(21)【出願番号】特願2017-502227(P2017-502227)
(86)(22)【出願日】2015年8月18日
(65)【公表番号】特表2017-521794(P2017-521794A)
(43)【公表日】2017年8月3日
(86)【国際出願番号】CN2015087322
(87)【国際公開番号】WO2016107190
(87)【国際公開日】20160707
【審査請求日】2017年1月13日
(31)【優先権主張番号】201410843805.2
(32)【優先日】2014年12月30日
(33)【優先権主張国】CN
(73)【特許権者】
【識別番号】513224353
【氏名又は名称】バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
(74)【代理人】
【識別番号】110000523
【氏名又は名称】アクシス国際特許業務法人
(72)【発明者】
【氏名】ショウコー・チン
(72)【発明者】
【氏名】ヨウ・ハン
(72)【発明者】
【氏名】ツォーミン・チャン
(72)【発明者】
【氏名】チーヤン・チェン
(72)【発明者】
【氏名】シアオホア・チェン
(72)【発明者】
【氏名】ペイチー・シュイ
(72)【発明者】
【氏名】シアオリン・マー
(72)【発明者】
【氏名】ヤン・チアン
(72)【発明者】
【氏名】シーレイ・ウェン
(72)【発明者】
【氏名】シーチア・チェン
(72)【発明者】
【氏名】シュイビン・リー
【審査官】 齊藤 貴孝
(56)【参考文献】
【文献】 特開平10−289242(JP,A)
【文献】 特開2006−285847(JP,A)
【文献】 特開平10−301953(JP,A)
【文献】 特開2008−177642(JP,A)
【文献】 特開2011−048729(JP,A)
【文献】 特開2002−140332(JP,A)
【文献】 特開2008−171243(JP,A)
【文献】 特開平05−120399(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
(57)【特許請求の範囲】
【請求項1】
クライアントが送信した現在の検索語を受信するステップと、
前記現在の検索語に含まれる画像表示可能ワードを取得し、前記画像表示可能ワードに基づいて対応する画像結果を取得するステップと、
前記画像結果を前記クライアントに送信するステップと、を含み、
前記クライアントが送信した現在の検索語を受信する前に、前記方法は、
画像表示可能ワードのワードバンクを構築するステップを更に含み、
前記現在の検索語に含まれる画像表示可能ワードを取得するステップは、
前記画像表示可能ワードのワードバンクから前記現在の検索語に含まれる画像表示可能ワードを取得することを含み、
前記画像表示可能ワードのワードバンクを構築するステップは、
歴史検索語に対する単語分割を行って、複数のセグメントを取得するステップと、
第1の画像列及び第2の画像列を取得し、前記第1の画像列は、前記歴史検索語に対応する画像列であり、前記第2の画像列は、前記セグメントに対応する画像列であるステップと、
前記第2の画像列と前記第1の画像列との類似度を計算し、前記類似度に基づいて前記セグメントから画像表示可能ワードを決定し、画像表示可能ワードにより画像表示可能ワードのワードバンクを構成するステップと、を含み、
以上のステップは、コンピュータが実行する、
ことを特徴とする検索方法。
【請求項2】
前記画像表示可能ワードに基づいて対応する画像結果を取得するステップは、
前記現在の検索語に基づいて検索結果を取得し、前記検索結果から画像を抽出するステップと、
前記抽出した画像に前記画像表示可能ワードに対応する特徴情報が含まれる場合、前記抽出した画像をクライアントに送信する画像結果と決定するステップと、を含み、
以上のステップは、コンピュータが実行する、
ことを特徴とする請求項1に記載の方法。
【請求項3】
コンピュータが現在の検索語を受信するステップと、
コンピュータが前記現在の検索語に基づいて画像結果を取得し、その中で、前記画像結果は、前記現在の検索語に含まれる画像表示可能ワードを取得した後、前記画像表示可能ワードに基づいて取得したものである、ステップと、
コンピュータが前記画像結果を表示するステップと、を含み、
コンピュータが前記現在の検索語に基づいて画像結果を取得するステップは、
コンピュータが前記現在の検索語をサーバーに送信して、前記サーバーが前記現在の検索語から画像表示可能ワードを取得し、前記画像表示可能ワードに基づいて前記画像結果を取得するようにするステップと、
前記サーバーが送信した前記画像結果を受信するステップと、を含み、
前記サーバーが前記現在の検索語から画像表示可能ワードを取得し、前記画像表示可能ワードに基づいて前記画像結果を取得するようにするステップは、
前記サーバーが画像表示可能ワードのワードバンクから前記現在の検索語に含まれる画像表示可能ワードを取得することを含み、
前記サーバーが前記画像表示可能ワードのワードバンクを構築するステップは、
前記サーバーが歴史検索語に対する単語分割を行って、複数のセグメントを取得するステップと、
前記サーバーが第1の画像列及び第2の画像列を取得し、前記第1の画像列は、前記歴史検索語に対応する画像列であり、前記第2の画像列は、前記セグメントに対応する画像列であるステップと、
前記サーバーが前記第2の画像列と前記第1の画像列との類似度を計算し、前記類似度に基づいて前記セグメントから画像表示可能ワードを決定し、画像表示可能ワードにより画像表示可能ワードのワードバンクを構成するステップと、を含む、
ことを特徴とする検索方法。
【請求項4】
クライアントが送信した現在の検索語を受信する受信モジュールと、
前記現在の検索語に含まれる画像表示可能ワードを取得し、前記画像表示可能ワードに基づいて対応する画像結果を取得する取得モジュールと、
前記画像結果を前記クライアントに送信する送信モジュールと、を含み、
画像表示可能ワードのワードバンクを構築する構築モジュールを更に含み、
前記取得モジュールは、具体的には、
前記画像表示可能ワードのワードバンクから前記現在の検索語に含まれる画像表示可能ワードを取得し、
前記構築モジュールは、具体的には、
歴史検索語に対する単語分割を行って、複数のセグメントを取得し、
第1の画像列及び第2の画像列を取得し、前記第1の画像列は、前記歴史検索語に対応する画像列であり、前記第2の画像列は、前記セグメントに対応する画像列であり、
前記第2の画像列と前記第1の画像列との類似度を計算し、前記類似度に基づいて
前記セグメントから画像表示可能ワードを決定し、画像表示可能ワードにより画像表示可能ワードのワードバンクを構成する、
ことを特徴とする検索装置。
【請求項5】
前記取得モジュールは、具体的には、
前記画像表示可能ワードに基づいて予備画像を取得し、
前記予備画像に前記画像表示可能ワードに対応する特徴情報が含まれる場合、前記予備画像をクライアントに送信する画像結果と決定する、
ことを特徴とする請求項4に記載の検索装置。
【請求項6】
一つ又は複数のプロセッサーと、
メモリと、
一つ又は複数のプログラムと、を含み、
前記一つ又は複数のプログラムは、前記メモリに記憶され、前記一つ又は複数のプロセッサーにより実行される時、請求項1又は2に記載の方法を実行する、
ことを特徴とするサーバ。
【請求項7】
一つ又は複数のモジュールが記憶され、
前記一つ又は複数のモジュールが実行される時、請求項1又は2に記載の方法を実行する、
ことを特徴とする不揮発性コンピューター記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、バイドゥオンラインネットワーク技術(北京)リミテッドカンパニーにより2014年12月30日付けで提出された発明の名称が「検索方法及び装置」であり、中国特許出願番号が「201410843805.2」である特許出願の優先権を主張するものである。
【0002】
本発明は、インターネット技術に関し、特に検索方法及び装置に関する。
【背景技術】
【0003】
現在、検索エンジンは、主にネットワークにおける相関キーワードの所在するデータ情報を統合することにより結果を提供し、普通、検索請求命中状況に基づいてデータベースから結果データを抽出し、ウェブページにレンダリングする。
【0004】
但し、このような方式で取得した検索結果は、普通、テキスト形式であり、情報の表現効果が低い。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、相関技術における技術問題のうち一つを少なくともある程度解決しようとする。
【0006】
このため、本発明の一つの目的は、検索方法を提出することであり、当該方法は、検索結果の情報表現効果を向上させることができる。
【0007】
本発明のもう一つの目的は、検索装置を提出することである。
【課題を解決するための手段】
【0008】
上記の目的を達成するために、本発明の第1の方面の実施例が提出する検索方法は、クライアントが送信した現在の検索語を受信するステップと、前記現在の検索語に含まれる画像表示可能ワードを取得し、画像表示可能ワードに基づいて対応する画像結果を取得するステップと、前記画像結果を前記クライアントに送信するステップと、を含む。
【0009】
本発明の第1の方面の実施例が提出する検索方法は、現在の検索語に含まれる画像表示可能ワードを取得し、当該画像表示可能ワードに基づいて画像結果を取得することであり、画像は情報を速くて生き生きと表現でき、含む情報量が更に豊かであるため、検索語に基づいてユーザーの画像に対する需要を発掘し、検索結果として画像を提供するので、検索結果の情報表現効果を向上させることができる。
【0010】
上記の目的を達成するために、本発明の第2の方面の実施例が提出する検索方法は、現在の検索語を受信するステップと、前記現在の検索語に基づいて画像結果を取得し、その中で、前記画像結果は、前記現在の検索語に含まれる画像表示可能ワードを取得した後、前記画像表示可能ワードに基づいて取得したものである、ステップと、前記画像結果を表示するステップと、を含む。
【0011】
本発明の第2の方面の実施例が提供する検索方法は、現在の検索語に基づいて画像結果を取得することであり、画像結果は、現在の検索語に含まれる画像表示可能ワードに基づいて取得したものであり、画像は情報を速くて生き生きと表現でき、含む情報量が更に豊かであるため、検索語に基づいてユーザーの画像に対する需要を発掘し、検索結果として画像を提供するので、検索結果の情報表現効果を向上させることができる。
【0012】
上記の目的を達成するために、本発明の第3の方面の実施例が提出する検索装置は、クライアントが送信した現在の検索語を受信する受信モジュールと、前記現在の検索語に含まれる画像表示可能ワードを取得し、前記画像表示可能ワードに基づいて対応する画像結果を取得する取得モジュールと、前記画像結果を前記クライアントに送信する送信モジュールと、を含む。
【0013】
本発明の第3の方面の実施例が提出する検索装置は、現在の検索語に含まれる画像表示可能ワードを取得し、当該画像表示可能ワードに基づいて画像結果を取得することであり、画像は情報を速くて生き生きと表現でき、含む情報量が更に豊かであるため、検索語に基づいてユーザーの画像に対する需要を発掘し、検索結果として画像を提供するので、検索結果の情報表現効果を向上させることができる。
【0014】
上記の目的を達成するために、本発明の第4の方面の実施例が提出する検索装置は、現在の検索語を受信するための受信モジュールと、前記現在の検索語に基づいて画像結果を取得し、その中で、前記画像結果は、前記現在の検索語に含まれる画像表示可能ワードを取得した後、前記画像表示可能ワードに基づいて取得したものである、取得モジュールと、前記画像結果を表示するための表示モジュールと、を含む。
【0015】
本発明の第4の方面の実施例が提供する検索装置は、現在の検索語に基づいて画像結果を取得することであり、画像結果は、現在の検索語に含まれる画像表示可能ワードに基づいて取得したものであり、画像は情報を速くて生き生きと表現でき、含む情報量が更に豊かであるため、検索語に基づいてユーザーの画像に対する需要を発掘し、検索結果として画像を提供するので、検索結果の情報表現効果を向上させることができる。
【0016】
本発明の実施例はサーバを更に提出し、当該サーバは、一つ又は複数のプロセッサーと、メモリと、一つ又は複数のプログラムと、を含み、前記一つ又は複数のプログラムは、前記メモリに記憶され、前記一つ又は複数のプロセッサーにより実行される時、本発明の第1の方面の実施例のいずれか一項に記載の方法を実行する。
【0017】
本発明の実施例は、ユーザー端末を更に提出し、当該ユーザー端末は、一つ又は複数のプロセッサーと、メモリと、一つ又は複数のプログラムと、を含み、前記一つ又は複数のプログラムは、前記メモリに記憶されており、前記一つ又は複数のプロセッサーにより実行される時、本発明の第2の方面の実施例のいずれかの一項に記載の方法を実行する。
【0018】
本発明の実施例は、不揮発性コンピューター記憶媒体を更に提出し、前記コンピューター記憶媒体に一つ又は複数のモジュールが記憶され、前記一つ又は複数のモジュールが実行される時、本発明の第1の方面の実施例のいずれか一項に記載の方法を実行する。
【0019】
本発明の実施例は、不揮発性コンピューター記憶媒体を更に提出し、前記コンピューター記憶媒体に一つ又は複数のモジュールが記憶され、前記一つ又は複数のモジュールが実行される時、本発明の第2の方面の実施例のいずれかの一項に記載の方法を実行する。
【0020】
本発明の付加方面と利点は、下記の説明にて部分的に示され、一部は下記の説明にて明らかになり、又は本発明の実践により理解される。
【0021】
本発明の上記及び/又は付加方面と利点は、下記の図面を結合して実施例に対する説明をしながら明らかになり、理解しやすくなり、その中で、
【図面の簡単な説明】
【0022】
図1】本発明の一つの実施例が提出する検索方法のフローチャートである。
【0023】
図2】本発明の実施例における画像表示可能ワードのワードバンクを構築するフローチャートである。
【0024】
図3】本発明のもう一つの実施例が提出する検索方法のフローチャートである。
【0025】
図4】本発明のもう一つの実施例が提出する検索装置の構造模式図である。
【0026】
図5】本発明のもう一つの実施例が提出する検索装置の構造模式図である。
【0027】
図6】本発明のもう一つの実施例が提供する検索装置の構造模式図である。
【発明を実施するための形態】
【0028】
以下に、本発明の実施例を詳細に説明する。前記実施例の例示が図面において示されるが、一貫して同一または類似する符号は、同一又は類似の部品、又は、同一又は類似の機能を有する部品を表す。以下に、図面を参照しながら説明される実施例は例示性のものであり、本発明を解釈するためだけに用いられるものであって、本発明を限定するように理解されてはならない。逆に、本発明の実施例は、添付される特許請求の範囲に置かれる原理及び含意における全ての変化、修正及び同等物を含む。
【0029】
図1は、本発明の一つの実施例が提出する検索方法のフローチャートであり、当該方法は、下記のステップS11〜ステップS13を含む。
【0030】
S11:サーバーは、クライアントが送信した現在の検索語を受信する。
【0031】
例えば、ユーザーは、検索エンジンに検索しようとする検索語(query)を入力することができ、その中で、検索語は、捜索語又はクエリー等とも称することができる。検索語は、文字、単語、又は文章等であっても可能である。
【0032】
検索エンジンのクライアントは、ユーザーが入力した現在の検索語を受信すると、現在の検索語をサーバーに送信することができる。
【0033】
S12:サーバーは、前記現在の検索語に含まれる画像表示可能ワードを取得し、前記画像表示可能ワードに基づいて対応する画像結果を取得する。
【0034】
その中で、画像表示可能ワードは、対応する検索結果のうち画像を含むワードである。
【0035】
現在の検索語を受信した時、現在の検索語から画像表示可能ワードのワードバンクに属する画像表示可能ワードを取得するために、画像表示可能ワードのワードバンクを予め構築しても良い。
【0036】
図2を参照すると、画像表示可能ワードのワードバンクを構築するステップは、ステップS21〜ステップS23を含むことができる。
【0037】
S21:歴史検索語に対する単語分割を行って、複数のセグメントを取得する。
【0038】
通常の単語分割アルゴリズムを適用して検索語に対する単語分割を行うことにより、単語分割後の複数のセグメンテーションを取得してセグメントすることができる。
【0039】
例えば、歴史検索語である「北京から瀘沽湖に旅行」は、単語分割后を経て四つのセグメントが取得され、それぞれ北京、に、瀘沽湖、旅行である。
【0040】
S22:第1の画像列及び第2の画像列を取得し、前記第一画像列は、前記歴史検索語に対応する画像列であり、前記第2の画像列は、前記セグメントに対応する画像列である。
【0041】
その中で、歴史検索語及び各セグメントに対応して別々に検索を行って、第1の画像列及び第2の画像列を取得することができる。
【0042】
例えば、「北京から瀘沽湖に旅行」を適用して検索を行った結果、30個の画像を取得することができ、「北京」を適用して検索を行った結果、他の30個の画像を取得することができ、類似的に、それぞれ「に」、「瀘沽湖」、「旅行」に対応しても皆相応する画像列を取得することができる。
【0043】
理解できることは、上記の各列に含まれる画像の数は他の予め設定された数であっても可能であり、また、異なる列に含まれる画像の数も異なっても良い。
【0044】
S23:前記第2の画像列と前記第1の画像列との類似度を計算し、前記類似度に基づいて前記セグメントから画像表示可能ワードを決定し、画像表示可能ワードにより画像表示可能ワードのワードバンクを構成する。
【0045】
例えば、「北京」に対応する画像列と「北京から瀘沽湖に旅行」に対応する画像列との類似度を計算して、第1の数値を取得することができる。「に」対応する画像列と「北京から瀘沽湖に旅行」に対応する画像列との類似度を計算して、第2の数値を取得することができる。「瀘沽湖」に対応する画像列と「北京から瀘沽湖に旅行」に対応する画像列との類似度を計算して、第3の数値を取得することができる。「旅行」に対応する画像列と「北京から瀘沽湖に旅行」に対応する画像列との類似度を計算して、第4の数値を取得することができる。
【0046】
各歴史検索語に対応して一つの画像表示可能ワードを選択すると仮定すると、類似度が一番高いもの、例えば、第3の数値が一番高い場合、「北京から瀘沽湖に旅行」に対応する画像表示可能ワードが「瀘沽湖」だと決定することができる。
【0047】
理解できることは、各検索語に対応する画像表示可能ワードが複数であっても可能であり、この時、画像表示可能ワードとして類似度の高い複数のワードを選択することができる。
【0048】
具体的には、二つの画像列間の類似度を計算する時、下記の方式を適用することができる。
【0049】
各画像列における各画像に対する特徴抽出を行い、例えば、視覚特徴を抽出することは、具体的には、予め設定された数学アルゴリズムを適用して画像におけるピクセルポイントの色変化値等を抽出する。
【0050】
抽出した特徴に基づいて画像列を一つの予め設定された次元のベクトル量にマッピングし、例えば、一つの画像列における各画像が抽出した特徴情報に対する平均値取り運算を行ってから、平均値に基づいて一つの予め設定された次元の空間に投射することにより、各画像列が一つの予め設定された次元に対応するベクトル量を取得する。
【0051】
各画像列を一つの予め設定された次元のベクトル量にマッピングした後、ベクトル量間の距離を計算することにより、例えば、コサイン距離を計算することにより、計算した距離値を類似度数値とすることができる。
【0052】
画像表示可能ワードのワードバンクを構築した後、現在の検索語を受信すると、現在の検索語に含まれる画像表示可能ワードを決定することができる。例えば、現在の検索語は、「北京から雲南瀘沽湖に旅行」であり、瀘沽湖は、画像表示可能ワードのワードバンクに属するため、現在の検索語に含まれる画像表示可能ワードは、瀘沽湖であると決定することができる。
【0053】
現在の検索語に含まれる画像表示可能ワードを決定した後、当該画像表示可能ワードに基づいて検索結果を取得することができる。
【0054】
前記画像表示可能ワードに基づいて対応する画像結果を取得するステップは、
前記現在の検索語に基づいて検索結果を取得し、前記検索結果から画像を抽出するステップと、
前記抽出した画像に前記画像表示可能ワードに対応する特徴情報が含まれる場合、前記抽出した画像をクライアントに送信する画像結果と決定するステップと、を含むことができる。
【0055】
具体的には、通常の検索方式を適用して現在の検索語から相関検索結果を捕らえることができ、当該検索結果は、テキスト及び画像等を含むことができる。検索結果から画像を抽出し、抽出した画像と画像表示可能ワードとを比較し、抽出した画像に画像表示可能ワードに対応する特徴情報が含まれる場合、当該抽出した画像を最終的にクライアントに送信する画像と決定する。例えば、若し捕らえられた一枚の画像に瀘沽湖のテキスト情報が含まれるとか、又は、視覚特徴抽出を経た後、瀘沽湖の視覚の特徴が含まれる場合、当該画像を最終的にクライアントに送信する画像結果と決定することができる。
【0056】
S13:サーバーは、前記画像結果を前記クライアントに送信する。
【0057】
サーバーは、画像結果を取得した後、画像結果を検索結果としてクライアントに送信することができ、クライアントは、画像結果を受信した後、検索結果ページに表示することができる。
【0058】
例えば、現在の検索語が「北京から雲南瀘沽湖に旅行」である場合、クライアントは、瀘沽湖を含む画像等を表示することができる。
【0059】
理解できることは、サーバーは上記の的画像結果を取得する以外に、現在の検索語に関連するテキスト結果等を更に取得することができ、サーバーは当該テキスト結果を画像結果と一緒に検索結果としてクライアントに送信することができ、クライアントは、画像結果を表示するだけでなく、テキスト結果等情報を更に表示することができる。
【0060】
本実施例は、現在の検索語に含まれる画像表示可能ワードを取得し、当該画像表示可能ワードに基づいて画像結果を取得する。画像は情報を速くて生き生きと表現でき、含む情報量が更に豊かであるため、検索語に基づいてユーザーの画像に対する需要を発掘し、検索結果として画像を提供するので、検索結果の情報表現効果を向上させることができる。
【0061】
図3は、本発明のもう一つの実施例が提出する検索方法のフローチャートであり、当該方法は、ステップS31〜ステップS33を含む。
【0062】
S31:クライアントは、現在の検索語を受信する。
【0063】
例えば、検索エンジンは、ユーザーが入力した現在の検索語を受信する。
【0064】
S32:クライアントは、前記現在の検索語に基づいて画像結果を取得し、その中で、前記画像結果は、前記現在の検索語に含まれる画像表示可能ワードを取得した後、前記画像表示可能ワードに基づいて取得したものである。
【0065】
前記現在の検索語に基づいて画像結果を取得するステップは、
前記サーバーが前記現在の検索語から画像表示可能ワードを取得し、前記画像表示可能ワードに基づいて前記画像果を取得するように、前記現在の検索語をサーバーに送信するステップと、
前記サーバーが送信した前記画像結果を受信するステップと、
を含むことであっても可能である。
【0066】
具体的なサーバーが画像結果を取得するプロセスは、上記実施例を参照することができ、ここでは更に詳細に記述しないことにする。
【0067】
S33:クライアントは、前記画像結果を表示する。
【0068】
クライアントは、サーバーが送信した検索結果としての画像結果を受信した後、クライアントは、検索結果ページに画像結果を表示することができる。
【0069】
例えば、現在の検索語が「北京から雲南瀘沽湖に旅行」である場合、クライアントは、瀘沽湖を含む画像等を表示することができる。
【0070】
理解できることは、サーバーは上記の的画像結果を取得する以外に、現在の検索語に関連するテキスト結果等を更に取得することができる。サーバーは更に当該テキスト結果を画像結果と一緒に検索結果としてクライアントに送信することができるため、クライアントは検索結果を表示する時、画像結果を表示するだけでなく、テキスト結果等情報を更に表示することができる。
【0071】
本実施例は、現在の検索語に基づいて画像結果を取得することであり、画像結果は、現在の検索語に含まれる画像表示可能ワードに基づいて取得したものである。画像は情報を速くて生き生きと表現でき、含む情報量が更に豊かであるため、検索語に基づいてユーザーの画像に対する需要を発掘し、検索結果として画像を提供するので、検索結果の情報表現効果を向上させることができる。
【0072】
図4は、本発明のもう一つの実施例が提供する検索装置の構造模式図であり、当該装置は、サーバーに位置されることができ、当該装置40は、受信モジュール41と、取得モジュール42と、送信モジュール43と、を含む。
【0073】
受信モジュール41は、クライアントが送信した現在の検索語を受信する。
【0074】
例えば、ユーザーは、検索エンジンに検索しようとする検索語(query)を入力することができ、その中で、検索語は、捜索語又はクエリー等とも称することができる。検索語は、文字、単語、又は文章等であっても可能である。
【0075】
検索エンジンのクライアントはユーザーが入力した現在の検索語を受信した後、現在の検索語をサーバーに送信することができる。
【0076】
取得モジュール42は、前記現在の検索語に含まれる画像表示可能ワードを取得し、前記画像表示可能ワードに基づいて対応する画像結果を取得する。
【0077】
その中で、画像表示可能ワードは、対応する検索結果のうち画像を含むワードである。
【0078】
現在の検索語を受信した時、現在の検索語から画像表示可能ワードのワードバンクに属する画像表示可能ワードを取得するために、画像表示可能ワードのワードバンクを予め構築しても良い。
【0079】
もう一つの実施例において、図5を参照すると、当該装置40は、
画像表示可能ワードのワードバンクを構築する構築モジュール44を更に含む。
【0080】
それに応じて、前記取得モジュール42は、具体的には、
前記画像表示可能ワードのワードバンクから前記現在の検索語に含まれる画像表示可能ワードを取得する。
【0081】
前記構築モジュール44は、具体的には、
歴史検索語に対する単語分割を行って、複数のセグメントを取得しても良く、
通常の単語分割アルゴリズムを適用して検索語に対する単語分割を行うことにより、単語分割後の複数のセグメンテーションを取得してセグメントすることができる。
【0082】
例えば、歴史検索語である「北京から瀘沽湖に旅行」に対して、単語分割を経た後、それぞれ四つのセグメントである北京、に、瀘沽湖、旅行を取得することができる。
【0083】
第1の画像列及び第2の画像列を取得し、前記第一画像列は、前記歴史検索語に対応する画像列であり、前記第2の画像列は、前記セグメントに対応する画像列である。
【0084】
その中で、歴史検索語及び各セグメントに対応して別々に検索を行って、第1の真列及び第2の画像列を取得することができる。
【0085】
例えば、「北京から瀘沽湖に旅行」を適用して検索を行って結果、30個の画像を取得することができ、「北京」を適用して検索を行った結果、他の30個の画像を取得することができ、類似的に、それぞれ「に」、「瀘沽湖」、「旅行」に対応して相応する画像列を全部取得することができる。
【0086】
理解できることは、上記の各列に含まれる画像の数は他の予め設定された数であっても可能であり、また、異なる列に含まれる画像の数は異なっても良い。
【0087】
前記第2の画像列と前記第1の画像列との類似度を計算し、前記類似度に基づいて前記セグメントから画像表示可能ワードを決定し、画像表示可能ワードにより画像表示可能ワードのワードバンクを構成する。
【0088】
例えば、「北京」に対応する画像列と「北京から瀘沽湖に旅行」に対応する画像列との類似度を計算して、第1の数値を取得することができる。「に」対応する画像列と「北京から瀘沽湖に旅行」に対応する画像列との類似度を計算して、第2の数値を取得することができる。「瀘沽湖」に対応する画像列と「北京から瀘沽湖に旅行」に対応する画像列との類似度を計算して、第3の数値を取得することができる。「旅行」に対応する画像列と「北京から瀘沽湖に旅行」に対応する画像列との類似度を計算して、第4の数値を取得することができる。
【0089】
各歴史検索語に対応して一つの画像表示可能ワードを選択すると仮定すると、類似度が一番高いものを選択することができ、例えば、第3の数値が一番高い場合、「北京から瀘沽湖に旅行」に対応する画像表示可能ワードが「瀘沽湖」であると決定することができる。
【0090】
理解できることは、各検索語に対応する画像表示可能ワードは複数であっても可能であり、この時、画像表示可能ワードとして類似度の高い複数のワードを選択しても良い。
【0091】
具体的には、二つの画像間の類似度を計算する時、下記の方式を適用することができる。
【0092】
各画像列における各画像に対する特徴抽出を行い、例えば、視覚特徴を抽出することは、具体的には、予め設定された数学アルゴリズムを適用して画像におけるピクセルポイントの色変化値等を抽出し、
抽出した特徴に基づいて画像列を一つの予め設定された次元のベクトル量にマッピングし、例えば、一つの画像列における各画像が抽出した特徴情報に対する平均値取り運算を行ってから、平均値に基づいて一つの予め設定された次元の空間に投射することにより、各画像列が一つの予め設定された次元に対応するベクトル量を取得する。
【0093】
各画像列を一つの予め設定された次元のベクトル量にマッピングした後、ベクトル量間の距離を計算することにより、例えば、コサイン距離を計算することにより、計算した距離値を類似度数値とすることができる。
【0094】
画像表示可能ワードのワードバンクを構築した後、現在の検索語を受信すると、現在の検索語に含まれる画像表示可能ワードを決定することができる。例えば、現在の検索語は、「北京から雲南瀘沽湖に旅行」であり、瀘沽湖は、画像表示可能ワードのワードバンクに属するため、現在の検索語に含まれる画像表示可能ワードは、瀘沽湖であると決定することができる。
【0095】
現在の検索語に含まれる画像表示可能ワードを決定した後、当該画像表示可能ワードに基づいて画像結果を取得することができる。
【0096】
前記取得モジュール42は、具体的には、
前記現在の検索語に基づいて検索結果を取得し、前記検索結果から画像を抽出し、
前記抽出した画像に前記画像表示可能ワードに対応する特徴情報が含まれる場合、前記抽出した画像をクライアントに送信する画像結果と決定しても良い。
【0097】
具体的には、通常の検索方式を適用して現在の検索語から相関検索結果を捕らえることができ、当該検索結果はテキスト及び画像等を含むことができる。検索結果から画像を抽出し、抽出した画像と画像表示可能ワードとを比較し、抽出した画像に画像表示可能ワードに対応する特徴情報が含まれる場合、当該抽出した画像を最終的にクライアントに送信する画像と決定する。例えば、若し捕らえられた一枚の画像に瀘沽湖のテキスト情報が含まれるとか、又は、視覚特徴抽出を経た後、瀘沽湖の視覚の特徴が含まれる場合、当該画像を最終的にクライアントに送信する画像結果と決定することができる。
【0098】
送信モジュール43は、前記画像結果を前記クライアントに送信する。
【0099】
サーバーが画像結果を取得した後、画像結果を検索結果としてクライアントに送信することができ、クライアントは、画像結果を受信した後、画像結果ページに表示することができる。
【0100】
例えば、現在の検索語が「北京から雲南瀘沽湖に旅行」である場合、クライアントは、瀘沽湖を含む画像等を表示することができる。
【0101】
理解できることは、サーバーは上記の的画像結果を取得する以外に、現在の検索語に関連するテキスト結果等を更に取得することができ、サーバーは当該テキスト結果を画像結果と一緒に検索結果としてクライアントに送信することができ、クライアントは、画像結果を表示するだけでなく、テキスト結果等情報を更に表示することができる。
【0102】
本実施例は、現在の検索語に含まれる画像表示可能ワードを取得し、当該画像表示可能ワードに基づいて画像結果を取得することであり、画像は情報を速くて生き生きと表現でき、含む情報量が更に豊かであるため、検索語に基づいてユーザーの画像に対する需要を発掘し、検索結果として画像を提供するので、検索結果の情報表現効果を向上させることができる。
【0103】
図6は、本発明のもう一つの実施例が提出する検索装置の構造模式図であり、当該装置は、クライアントに位置されることができ、当該装置60は、受信モジュール61と、取得モジュール62と、表示モジュール63と、を含む。
【0104】
受信モジュール61は、現在の検索語を受信する。
例えば、検索エンジンは、ユーザーが入力した現在の検索語を受信する。
【0105】
取得モジュール62は、前記現在の検索語に基づいて画像結果を取得し、その中で、前記画像結果は、前記現在の検索語に含まれる画像表示可能ワードを取得した後、前記画像表示可能ワードに基づいて取得したものである。
【0106】
前記取得モジュール62は、具体的には、
前記現在の検索語をサーバーに送信して、前記サーバーが前記現在の検索語から画像表示可能ワードを取得し、前記画像表示可能ワードに基づいて前記画像結果を取得し、
前記サーバーが送信した前記画像結果を受信しても良い。
【0107】
具体的なサーバーが画像結果を取得するプロセスは、上記実施例を参照することができ、ここでは更に詳細に記述しないことにする。
【0108】
表示モジュール63は、前記画像結果を表示する。
【0109】
クライアントは、サーバーが送信した画像結果を受信した後、クライアントは、検索結果ページに画像結果を表示することができる。
【0110】
例えば、現在の検索語が「北京から雲南瀘沽湖に旅行」である場合、クライアントは、瀘沽湖を含む画像等を表示することができる。
【0111】
理解できることは、サーバーは、上記の的画像結果を取得する以外に、現在の検索語に関連するテキスト結果等を更に取得することができる。サーバーは、当該テキスト結果を画像結果と一緒に検索結果としてクライアントに送信することができるため、クライアントは、検索結果を表示する時、画像結果を表示するだけでなく、テキスト結果等情報を更に表示することができる。
【0112】
本実施例は、現在の検索語に基づいて画像結果を取得することであり、画像結果は、現在の検索語に含まれる画像表示可能ワードに基づいて取得したものである。画像は情報を速くて生き生きと表現でき、含む情報量が更に豊かであるため、検索語に基づいてユーザーの画像に対する需要を発掘し、検索結果として画像を提供するので、検索結果の情報表現効果を向上させることができる。
【0113】
本発明の実施例は、サーバを更に提出し、当該サーバは、一つ又は複数のプロセッサーと、メモリと、一つ又は複数のプログラムと、を含み、前記一つ又は複数のプログラムは、前記メモリに記憶され、前記一つ又は複数のプロセッサーにより実行される時、本発明の第1の方面の実施例のいずれか一項に記載の方法を実行する。
【0114】
本発明の実施例は、ユーザー端末を更に提出し、当該ユーザー端末は、一つ又は複数のプロセッサーと、メモリと、一つ又は複数のプログラムと、を含み、前記一つ又は複数のプログラムは、前記メモリに記憶され、前記一つ又は複数のプロセッサーにより実行される時、本発明の第2の方面の実施例のいずれかの一項に記載の方法を実行する。
【0115】
本発明の実施例は、不揮発性コンピューター記憶媒体を更に提出し、前記コンピューター記憶媒体に一つ又は複数のモジュールが記憶され、前記一つ又は複数のモジュールが実行される時、本発明の第1の方面の実施例のいずれか一項に記載の方法を実行する。
【0116】
本発明の実施例は、不揮発性コンピューター記憶媒体を更に提出し、前記コンピューター記憶媒体に一つ又は複数のモジュールが記憶され、前記一つ又は複数のモジュールが実行される時、本発明の第2の方面の実施例のいずれかの一項に記載の方法を実行する。
【0117】
説明すべきことは、本発明の説明において、用語である「第一」、「第二」は説明のためだけに用いられるものであり、比較的な重要性を指示又は暗示すると理解してはいけない。また、本発明の説明において、別途の説明がない限り、「複数」の意味は、二つ又は二つ以上である。
【0118】
フローチャートまたは他の方式で説明したいかなる過程や方法は、一つまたは複数の、特定ロジック性能または過程のステップを実現するに用いられる実行できるコマンドのコードのモジュール、セクターあるいは部分を含むと理解されることができ、本発明の望ましい実施形態の範囲は、他の実現を含み、その中で、表示または討論の順序に従わなくても良く、述べられた機能に基づいて基本的に同様な方式または逆の順序でその機能を実行することを含む。これは、本発明の実施例の当業者に理解される。
【0119】
理解すべきことは、本発明の各部分は、ハードウェア、ソフトウェア、ファームウエアまたはそれらの組み合わせで実現できる。上記の実施形態において、複数のステップまたは方法がメモリに保存され、適当なコマンド実行システムのソフトウェアまたはファームウエアで実現できる。例えば、ハードウェアで実現する場合、他の実施形態と同じように、本領域周知の下記の任意一つまたはそれらの組み合わせで実現できる。すなわち、デジタル信号に対してロジック機能を実現するロジックゲート回路を有する離散ロジック回路、ロジックゲート回路を組み合わせた適当な専用IC、プログラマブルゲートアレイ(PGA)、フィールドプログラマブルゲートアレイ(FPGA)などである。
【0120】
実施例の方法における全部または一部のステップがプログラムにより関連のハードウェアを実行することで完成されることは、本技術領域の普通の技術者に理解される。前記プログラムは一つの計算機の読み出し可能な記憶メディアに記憶されることができる。当該プログラムを実行するとき、実施例方法のステップの一つまたはそれらの組み合わせを含む。
【0121】
この他、本発明の各実施例における各機能ユニットは、一つの処理モジュールに集積され、または、各ユニットの単独的な物理存在であり、あるいは、二つまたは二つ以上のユニットが一つのモジュールに集積されることができる。上記の集積されたモジュールは、ハードウェアの形式、または、ソフトウェア機能モジュールの形式で実現できる。前記集積されたモジュールが、ソフトウェア機能モジュールの形式で実現され、独立の製品として販売又は使用される場合、コンピューターの読み出し可能な記憶メディアに記憶されることができる。
【0122】
上記の記憶メディアは、読み出し専用メモリ、ディスク、またはCDなどであって可能である。
【0123】
本明細書の説明において、参照用語である「一つの実施例」、「いくつかの実施例」、「例示」、「具体的な例示」、又は「いくつかの例示」などの説明は、当該実施例や例示を結合して説明する具体的な特徴、構造、材料、又は特点が本発明の少なくとも一つの実施例や例示に含まれることを意味する。本明細書において、上記の用語に対する黙示的な記述が必ずしも同じ実施例や例示に対することではない。また、説明された具体的な特徴、構造、材料、又は特点は、任意の一つの又は複数の実施例又は例示にて適当な方式で結合されることができる。
【0124】
本発明の実施例を示して説明したが、当業者にとって理解できるのは、上記の実施例は例示性のものであり、本発明に対する限定と理解されてはいけない。当業者は、本発明の範囲で上記の実施例に対して変化、補正、切り替え及び変形を行うことができる。
本発明は一側面において以下の発明を包含する。
(発明1)
クライアントが送信した現在の検索語を受信するステップと、
前記現在の検索語に含まれる画像表示可能ワードを取得し、前記画像表示可能ワードに基づいて対応する画像結果を取得するステップと、
前記画像結果を前記クライアントに送信するステップと、を含む、
ことを特徴とする検索方法。
(発明2)
前記クライアントが送信した現在の検索語を受信する前に、前記方法は、
画像表示可能ワードのワードバンクを構築するステップを更に含み、
前記現在の検索語に含まれる画像表示可能ワードを取得するステップは、
前記画像表示可能ワードのワードバンクから前記現在の検索語に含まれる画像表示可能ワードを取得することを含む、
ことを特徴とする発明1に記載の方法。
(発明3)
前記画像表示可能ワードのワードバンクを構築するステップは、
歴史検索語に対する単語分割を行って、複数のセグメントを取得するステップと、
第1の画像列及び第2の画像列を取得し、前記第1の画像列は、前記歴史検索語に対応する画像列であり、前記第2の画像列は、前記セグメントに対応する画像列であるステップと、
前記第2の画像列と前記第1の画像列との類似度を計算し、前記類似度に基づいて前記セグメントから画像表示可能ワードを決定し、画像表示可能ワードにより画像表示可能ワードのワードバンクを構成するステップと、を含む、
ことを特徴とする発明2に記載の方法。
(発明4)
前記画像表示可能ワードに基づいて対応する画像結果を取得するステップは、
前記現在の検索語に基づいて検索結果を取得し、前記検索結果から画像を抽出するステップと、
前記抽出した画像に前記画像表示可能ワードに対応する特徴情報が含まれる場合、前記抽出した画像をクライアントに送信する画像結果と決定するステップと、を含む、
ことを特徴とする発明1乃至3のいずれか一項に記載の方法。
(発明5)
現在の検索語を受信するステップと、
前記現在の検索語に基づいて画像結果を取得し、その中で、前記画像結果は、前記現在の検索語に含まれる画像表示可能ワードを取得した後、前記画像表示可能ワードに基づいて取得したものである、ステップと、
前記画像結果を表示するステップと、を含む、
ことを特徴とする検索方法。
(発明6)
前記現在の検索語に基づいて画像結果を取得するステップは、
前記現在の検索語をサーバーに送信して、前記サーバーが前記現在の検索語から画像表示可能ワードを取得し、前記画像表示可能ワードに基づいて前記画像結果を取得するようにするステップと、
前記サーバーが送信した前記画像結果を受信するステップと、を含む、
ことを特徴とする発明5に記載の方法。
(発明7)
クライアントが送信した現在の検索語を受信する受信モジュールと、
前記現在の検索語に含まれる画像表示可能ワードを取得し、前記画像表示可能ワードに基づいて対応する画像結果を取得する取得モジュールと、
前記画像結果を前記クライアントに送信する送信モジュールと、を含む、
ことを特徴とする検索装置。
(発明8)
画像表示可能ワードのワードバンクを構築する構築モジュールを更に含み、
前記取得モジュールは、具体的には、
前記画像表示可能ワードのワードバンクから前記現在の検索語に含まれる画像表示可能ワードを取得する、
ことを特徴とする発明7に記載の装置。
(発明9)
前記構築モジュールは、具体的には、
歴史検索語に対する単語分割を行って、複数のセグメントを取得し、
第1の画像列及び第2の画像列を取得し、前記第1の画像列は、前記歴史検索語に対応する画像列であり、前記第2の画像列は、前記セグメントに対応する画像列であり、
前記第2の画像列と前記第1の画像列との類似度を計算し、前記類似度に基づいて前記セグメントから画像表示可能ワードを決定し、画像表示可能ワードにより画像表示可能ワードのワードバンクを構成する、
ことを特徴とする発明8に記載の装置。
(発明10)
前記取得モジュールは、具体的には、
前記画像表示可能ワードに基づいて予備画像を取得し、
前記予備画像に前記画像表示可能ワードに対応する特徴情報が含まれる場合、前記予備画像をクライアントに送信する画像結果と決定する、
ことを特徴とする発明7乃至9のいずれか一項に記載の装置。
(発明11)
現在の検索語を受信する受信モジュールと、
前記現在の検索語に基づいて画像結果を取得し、その中で、前記画像結果は、前記現在の検索語に含まれる画像表示可能ワードを取得した後、前記画像表示可能ワードに基づいて取得したものである、取得モジュールと、
前記画像結果を表示する表示モジュールと、を含む、
ことを特徴とする検索装置。
(発明12)
前記取得モジュールは、具体的には、
前記現在の検索語をサーバーに送信して、前記サーバーが前記現在の検索語から画像表示可能ワードを取得し、前記画像表示可能ワードに基づいて前記画像結果を取得するようにし、
前記サーバーが送信した前記画像結果を受信する、
ことを特徴とする発明11に記載の装置。
(発明13)
一つ又は複数のプロセッサーと、
メモリと、
一つ又は複数のプログラムと、を含み、
前記一つ又は複数のプログラムは、前記メモリに記憶され、前記一つ又は複数のプロセッサーにより実行される時、発明1乃至4のいずれか一項に記載の方法を実行する、
ことを特徴とするサーバ。
(発明14)
一つ又は複数のプロセッサーと、
メモリと、
一つ又は複数のプログラムと、を含み、
前記一つ又は複数のプログラムは、前記メモリに記憶され、前記一つ又は複数のプロセッサーにより実行される時、発明5又は6に記載の方法を実行する、
ことを特徴とするユーザー端末。
(発明15)
一つ又は複数のモジュールが記憶され、
前記一つ又は複数のモジュールが実行される時、発明1乃至4のいずれか一項に記載の方法を実行する、
ことを特徴とする不揮発性コンピューター記憶媒体。
(発明16)
一つ又は複数のモジュールが記憶され、
前記一つ又は複数のモジュールが実行される時、発明5又は6に記載の方法を実行する、
ことを特徴とする不揮発性コンピューター記憶媒体。
図1
図2
図3
図4
図5
図6