IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッドの特許一覧

特許7241789データ検索方法、装置、システム、デバイスおよびコンピュータ可読記憶媒体
<>
  • 特許-データ検索方法、装置、システム、デバイスおよびコンピュータ可読記憶媒体 図1
  • 特許-データ検索方法、装置、システム、デバイスおよびコンピュータ可読記憶媒体 図2
  • 特許-データ検索方法、装置、システム、デバイスおよびコンピュータ可読記憶媒体 図3
  • 特許-データ検索方法、装置、システム、デバイスおよびコンピュータ可読記憶媒体 図4
  • 特許-データ検索方法、装置、システム、デバイスおよびコンピュータ可読記憶媒体 図5
  • 特許-データ検索方法、装置、システム、デバイスおよびコンピュータ可読記憶媒体 図6
  • 特許-データ検索方法、装置、システム、デバイスおよびコンピュータ可読記憶媒体 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-03-09
(45)【発行日】2023-03-17
(54)【発明の名称】データ検索方法、装置、システム、デバイスおよびコンピュータ可読記憶媒体
(51)【国際特許分類】
   G06F 16/957 20190101AFI20230310BHJP
【FI】
G06F16/957
【請求項の数】 11
(21)【出願番号】P 2021017218
(22)【出願日】2021-02-05
(65)【公開番号】P2022045313
(43)【公開日】2022-03-18
【審査請求日】2021-02-05
(31)【優先権主張番号】202010937376.0
(32)【優先日】2020-09-08
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】512015127
【氏名又は名称】バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
(74)【代理人】
【識別番号】110003708
【氏名又は名称】弁理士法人鈴榮特許綜合事務所
(74)【代理人】
【識別番号】100108855
【弁理士】
【氏名又は名称】蔵田 昌俊
(74)【代理人】
【識別番号】100103034
【弁理士】
【氏名又は名称】野河 信久
(74)【代理人】
【識別番号】100179062
【弁理士】
【氏名又は名称】井上 正
(74)【代理人】
【識別番号】100199565
【弁理士】
【氏名又は名称】飯野 茂
(74)【代理人】
【識別番号】100219542
【弁理士】
【氏名又は名称】大宅 郁治
(74)【代理人】
【識別番号】100153051
【弁理士】
【氏名又は名称】河野 直樹
(74)【代理人】
【識別番号】100162570
【弁理士】
【氏名又は名称】金子 早苗
(72)【発明者】
【氏名】ダ・シェ
(72)【発明者】
【氏名】バオ・ファン
(72)【発明者】
【氏名】ジシュン・ジェン
(72)【発明者】
【氏名】ジャジェ・チェン
(72)【発明者】
【氏名】シャオヨン・リュ
(72)【発明者】
【氏名】ジェン・ジェン
(72)【発明者】
【氏名】ドゥオ・リ
(72)【発明者】
【氏名】チョン・スン
【審査官】甲斐 哲雄
(56)【参考文献】
【文献】特開2015-060568(JP,A)
【文献】特開2003-015938(JP,A)
【文献】特開2016-212498(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
(57)【特許請求の範囲】
【請求項1】
データ検索装置によって、受信した検索ワードに対する意味理解に基づき、前記検索ワードに対応する意味理解情報を確定するステップと、
前記データ検索装置によって、前記意味理解情報に基づき、分析を行って、前記検索ワードの時効性要請情報を得るステップと、
前記データ検索装置によって、前記検索ワードの時効性要請情報に基づき、前記検索ワードに対応するリソース結果の取得方法を確定するステップと、
前記データ検索装置によって、選択された取得方法に基づき、前記検索ワードに対応するリソース結果を得るステップとを含み、
ここにおいて、前記データ検索装置によって、前記検索ワードの前記時効性要請情報に基づき、前記検索ワードに対応するリソース結果の前記取得方法を確定する前記ステップには、
前記検索ワードに対応するシステム情報を確定するステップと、
前記検索ワードの前記時効性要請情報および前記システム情報に基づき、前記検索ワードの時効性および機械コストを総合的に分析して、前記検索ワードの総合分析結果を得るステップと、
前記検索ワードの前記総合分析結果に基づき、前記検索ワードに対応するリソース結果の前記取得方法を確定するステップとが含まれる、データ検索方法。
【請求項2】
前記データ検索装置によって、前記意味理解情報に基づき、分析を行って、前記検索ワードの時効性要請情報を得る前記ステップには、
前記意味理解情報中の情報アイテムと、所定の前記意味理解情報中の情報アイテムに対応する重み係数とに基づき、前記検索ワードの時効性要請情報を計算して得ることが含まれ、
前記意味理解情報には、字義通りの意味、意味の完成度および突発的なキーワードの確率のうちの少なくとも1つが含まれる、請求項1に記載の方法。
【請求項3】
前記検索ワードの時効性要請情報および前記システム情報に基づき、前記検索ワードの時効性および機械コストを総合的に分析して、前記検索ワードの総合分析結果を得る前記ステップには、
前記意味理解情報中の情報アイテムと、所定の前記意味理解情報中の情報アイテムに対応する重み係数とに基づき、前記検索ワードの時効性要請情報を計算して得ることと、
前記システム情報中の情報アイテムと、事前に確定した前記システム情報中の情報アイテムに対応する重み係数とに基づき、前記検索ワードの機械コスト情報を計算して得ることと、
前記検索ワードの時効性要請情報と、前記検索ワードの機械コスト情報とを組み合わせて、前記検索ワードの総合分析結果を得ることとが含まれる、請求項1に記載の方法。
【請求項4】
前記検索ワードの時効性要請情報を計算して得た後、さらに、
前記検索ワードの検索頻度および前記検索ワードに対応する呼び戻し結果数のうちのいずれか1つを含む、検索関連情報を確定することと、
前記検索関連情報と、事前に確定した前記検索関連情報に対応する重み係数とに基づき、前記検索ワードの時効性関連情報を計算して得ることと、
計算して得られた前記検索ワードの時効性要請情報および前記時効性関連情報を、前記検索ワードの時効性要請情報とすることとを含む、請求項2または3に記載の方法。
【請求項5】
前記検索ワードの時効性要請情報および前記システム情報に基づき、前記検索ワードの時効性および機械コストを総合的に分析する前に、
前記時効性要請情報および前記システム情報の前処理を行うことが含まれ、前記前処理には、データ正規化処理および特徴正規化処理のうちの少なくとも1つが含まれる、請求項1または3に記載の方法。
【請求項6】
前記リソース結果の取得方法には、所定のキャッシュの中から既存のリソース結果を取得し、前記所定のキャッシュをトリガし浸透させることにより、更新されたリソース結果を取得することが含まれ、
前記所定のキャッシュは、所定のバックエンド処理プロセスに対応するキャッシュであり、前記バックエンド処理プロセスには、呼び戻し層の処理、順位付け層の処理、融合層の処理およびアクセス層の処理のうちの少なくとも1つが含まれ、
前記所定のキャッシュには、融合層のキャッシュおよび順位付け層のキャッシュのうちの少なくとも1つが含まれる、請求項1から3のいずれか1項に記載の方法。
【請求項7】
前記検索ワードに対応するシステム情報中の情報アイテムには、システム容量、システム応答時間、システム応答速度、システム負荷およびリソース要求量のうちの少なくとも1つが含まれ、
各バックエンド処理プロセスに対応する意味理解情報中の情報アイテムによって、対応するシステム情報中の情報アイテムが異なり、前記検索ワードの検索時間によって、前記システム情報中の情報アイテムに対応する重み係数が異なる、請求項6に記載の方法。
【請求項8】
受信した検索ワードに対する意味理解に基づき、前記検索ワードに対応する意味理解情報を確定する情報取得モジュールと、
前記意味理解情報に基づき、分析を行って、前記検索ワードの時効性要請情報を得る情報分析モジュールと、
前記検索ワードの時効性要請情報に基づき、前記検索ワードに対応するリソース結果の取得方法を確定する方法確定モジュールと、
選択された取得方法に基づき、前記検索ワードに対応するリソース結果を得る結果取得モジュールとを備え、
ここにおいて、前記情報取得モジュールはさらに、前記検索ワードに対応するシステム情報を確定する、
前記方法確定モジュールはさらに、前記検索ワードの前記時効性要請情報および前記システム情報に基づき、前記検索ワードの時効性および機械コストを総合的に分析して、前記検索ワードの総合分析結果を得る、および、
前記結果取得モジュールはさらに、前記検索ワードの総合分析結果に基づき、前記検索ワードに対応するリソース結果の前記取得方法を確定する、データ検索装置。
【請求項9】
入力された検索ワードを受信する入力モジュールと、
受信した前記検索ワードに基づき、請求項1から7に記載のいずれか1項に記載の方法を実行し、前記検索ワードに対応するリソース結果の取得方法およびリソース結果を得る処理モジュールとを備える、情報サービスシステム。
【請求項10】
1つまたは複数のプロセッサと、
1つまたは複数のプログラムが記憶され、前記1つまたは複数のプログラムが前記1つまたは複数のプロセッサで実行されると、前記1つまたは複数のプロセッサが請求項1から7のいずれか1項に記載のデータ検索方法を実現するメモリと、
前記プロセッサとメモリとの間に接続され、前記プロセッサとメモリとの情報のやりとりを実現するように構成された1つまたは複数のI/Oインターフェースとを備える、電子デバイス。
【請求項11】
コンピュータプログラムが記憶され、前記コンピュータプログラムがプロセッサにより実行されると、請求項1から7に記載のいずれか1項に記載のデータ検索方法が実現される、コンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本願は、コンピュータ技術分野に関し、特に、データ検索方法、装置、システム、デバイス、コンピュータ可読記憶媒体およびプログラム製品に関する。
【背景技術】
【0002】
検索エンジンを用いて検索を行うプロセスでは、通常、検索結果に対応するリソースに一定の失効時間を設け、失効時間に達してはじめてキャッシュ(Cache)をバックエンドまで浸透させて新しいリソースを取得する。一定の失効時間に基づく検索では、検索エンジンの機械コストと検索結果の時効性の両者の間で矛盾が生じてしまう。
【発明の概要】
【0003】
本願実施例は、データ検索方法、装置、システム、デバイス、コンピュータ可読記憶媒体およびプログラム製品を提供する。
【0004】
第1の態様において、本願実施例は、受信した検索ワードに対する意味理解に基づき、前記検索ワードに対応する意味理解情報を確定するステップと、前記意味理解情報に基づき、分析を行って、前記検索ワードの時効性要請情報を得るステップと、前記検索ワードの時効性要請情報に基づき、前記検索ワードに対応するリソース結果の取得方法を確定するステップと、選択された取得方法に基づき、前記検索ワードに対応するリソース結果を得るステップとを含む、データ検索方法を提供する。
【0005】
第2の態様において、本願実施例は、受信した検索ワードに対する意味理解に基づき、前記検索ワードに対応する意味理解情報を確定する情報取得モジュールと、前記意味理解情報に基づき、分析を行って、前記検索ワードの時効性要請情報を得る情報分析モジュールと、前記検索ワードの時効性要請情報に基づき、前記検索ワードに対応するリソース結果の取得方法を確定する方法確定モジュールと、選択された取得方法に基づき、前記検索ワードに対応するリソース結果を得る結果取得モジュールとを備える、データ検索装置を提供する。
【0006】
第3の態様において、本願実施例は、入力された検索ワードを受信する入力モジュールと、受信した検索ワードに基づき、上述したデータ検索方法のいずれか1つを実行し、検索ワードに対応するリソース結果の取得方法およびリソース結果を得る処理モジュールとを備える、情報サービスシステムを提供する。
【0007】
第4の態様において、本願実施例は、1つまたは複数のプロセッサと、1つまたは複数のプログラムが記憶され、1つまたは複数のプログラムが1つまたは複数のプロセッサで実行されると、1つまたは複数のプロセッサが上述したデータ検索方法のいずれか1つを実現するメモリと、プロセッサとメモリとの間に接続され、プロセッサとメモリとの情報のやりとりを実現するように構成された1つまたは複数のI/Oインターフェースとを備える、電子デバイスを提供する。
【0008】
第5の態様において、本願実施例は、コンピュータプログラムが記憶され、コンピュータプログラムがプロセッサにより実行されると、上述したデータ検索方法のいずれか1つが実現される、コンピュータ可読記憶媒体を提供する。
【0009】
第6の態様において、本願実施例は、プロセッサで実行されると、上述したデータ検索方法のいずれか1つが実現されるコンピュータプログラムを含む、プログラム製品を提供する。
【0010】
本願実施例が提供するデータ検索方法、装置、システム、デバイス、コンピュータ可読記憶媒体およびプログラム製品は、検索ワードの意味理解情報に基づき、分析を行って、前記検索ワードの時効性要請情報を得、分析を行って得られた時効性要請情報に基づき、リソース結果の取得方法を確定することにより、当該取得方法に対応するリソース結果を得ている。本願実施例の検索方法では、検索ワードの時効性を分析することにより、検索ワードの時効性の正確性を判定することで、検索ワードの時効性にマッチするリソース結果の取得方法を選択し、検索エンジンの機械コストおよび時効性の効果の両者のバランスをとり、これらを両立させている。
【図面の簡単な説明】
【0011】
図面は本願実施例をさらに理解するために提供するものであって、明細書の一部をなし、本願の実施例とともに本願を説明するのに用いられ、本願を制限するものではない。図面を参照しながら詳しい例示的な実施例について説明することにより、上記の特徴および利点、その他の特徴および利点が当業者にさらに明らかとなろう。
図1】本願実施例が提供するシナリオ模式図である。
図2】本願実施例が提供するデータ検索方法のフローチャートである。
図3】本願実施例の検索システムのアーキテクチャ概略図である。
図4】本願実施例が提供するデータ検索装置の構成ブロック図である。
図5】本願実施例が提供する情報サービスシステムの構成ブロック図である。
図6】本願実施例が提供する電子デバイスの構成ブロック図である。
図7】本願実施例が提供するコンピュータ可読記憶媒体の構成ブロック図である。
【発明を実施するための形態】
【0012】
本願の技術案を当業者がよりよく理解できるように、以下では、本願が提供するデータ検索方法、装置、システム、デバイス、コンピュータ可読記憶媒体およびプログラム製品について、図面を組み合わせて詳細に説明する。
【0013】
下文では、図面を参照しながら例示的な実施例についてより詳しく説明するが、前述の例示的な実施例は、異なる態様により体現することができるものであって、本明細書で述べる実施例を限定するものと解釈してはならない。むしろ、これらの実施例を提供する目的は、本願を完全なものとし、当業者が本願の範囲を十分理解できるようにすることにある。
【0014】
本願の各実施例および実施例における各特徴は、矛盾しない限り、互いに組み合わせることができる。
【0015】
本明細書において「および/または」という用語は、関連して列挙される1つまたは複数の事項の任意の組み合せおよびすべての組み合せを含む。
【0016】
本明細書で用いる用語は特定の実施例を説明するためのものにすぎず、本願を制限することを意図しない。本明細書において、文脈上明らかでない限り、単数形「1つ」および「当該」も複数形を含むことを意図している。また、本明細書において「含む」および/または「・・・からなる」という用語は、前述した特徴、全体、ステップ、操作、素子および/もしくは構成要素が存在することを示すが、1つまたは複数のその他の特徴、全体、ステップ、操作、素子、構成要素および/もしくはそのグループが存在し、またはそれらが追加されることを排除するものではない。
【0017】
特に限定されない限り、本明細書で用いるすべての用語(技術および科学用語を含む)は、当業者によって通常理解されるのと同じ意味を有する。また、常用の辞書で限定されている用語については、関連技術および本願の背景における場合と同じ意味を有すると理解されるべきであり、本明細書で明らかに限定されない限り、理想化された意味または過度に形式的な意味を有すると解釈されるべきではない。
【0018】
図1は、本願実施例のシナリオ模式図である。図1に示すシナリオには、ユーザ10、端末20、情報サービスシステム30およびバックエンドサーバ40が含まれ、端末20で検索エンジンのアプリケーションプログラムを実行できる。
【0019】
ここで、ユーザ10は、端末20を使用してインターネットにアクセスし、端末20で検索エンジンを実行して、検索ワードのウェブ検索を行うことができる。一例として、端末10には、携帯電話、パーソナルコンピュータ、タブレットコンピュータ、インテリジェントウェアラブルデバイス、デスクトップコンピュータおよびノートパソコンなどが含まれるがこれらに限定されない。これらはいずれも検索エンジンのアプリケーションプログラムをインストールし実行することができる。
【0020】
引き続き図1を参照すると、本願実施例の情報サービスシステム30は、検索エンジンを介して入力された検索ワードを受信するとともに、検索ワードに対応する意味理解情報およびシステム情報を分析することができ、分析後に引き続きキャッシュを浸透させることにより更新されたリソース結果を得る必要がある場合、キャッシュ浸透処理をトリガする必要がある。バックエンドサーバ40は、検索ワードの呼び戻し、順位付け、融合およびデータアクセスなどの処理を提供することができる。
【0021】
図1から分かるように、本願実施例における情報サービスシステム30は、フロントエンドである検索エンジンに対応するサーバであるバックエンドサーバ40との間に位置し、検索エンジンで得られた検索ワードの情報処理を行い、処理結果に基づき、バックエンドサーバ40をトリガして最新のリソース結果を得る必要があるか否かを決定するサービスシステムであることが理解される。実施例に関する以下の説明では、情報サービスシステム30を情報ミドルプラットフォームシステムとも呼ぶ。
【0022】
いくつかのシナリオにおいては、検索エンジンを使用して検索を行うとき、検索ワードに基づきクローリングして得られたリソース結果をキャッシュに記憶するとともに、浸透メカニズムの失効時間を設定することができ、浸透失効時間に達しないときには、キャッシュ中のリソース結果に基づき検索ワードの検索結果を得、浸透失効時間に達した後ではじめて浸透処理を行って当該検索ワードの最新リソース結果を取得する。
【0023】
この応用シナリオでは、静的に構成された一定の失効時間を有する浸透メカニズムにおいて、通常、一定の失効時間に基づき差異化せずに浸透が行われ、機械コストと時効性の効果が矛盾しやすく、これらを両立するのは難しい。
【0024】
例えば、検索時にキャッシュをバックエンドまで浸透させて取得する新しいリソースが多いほど、検索エンジンが取得する検索結果の時効性の効果は優れたものとなるが、機械コストが顕著に増加する。一方、検索時に直接キャッシュをヒットさせてリソースを取得する場合、検索エンジンの機械コストは小さいが、検索エンジンが取得する検索結果の時効性の効果に影響する。
【0025】
したがって、検索エンジンの検索の時効性を高めようとすると、通常、機械コストを抑制することを犠牲にする必要があるが、検索エンジンの機械コストを下げるには検索エンジンの検索の時効性を犠牲にする必要がある。
【0026】
そこで、本願は、データ検索方法、装置、システム、デバイス、コンピュータ可読記憶媒体およびプログラム製品を提供し、意味理解情報およびシステム情報の2種類の情報をともに検索システムの浸透メカニズムに作用させて、現在の検索ワードのトラフィックが浸透処理を行うか否かを総合的に判断する。
【0027】
以下の各実施例はいずれも本実施例のシステムアーキテクチャに応用できることが理解される。説明を簡潔にするため、以下の各実施例を相互に参照し引用することができる。
【0028】
図2は、本願実施例のデータ検索方法のフローチャートである。
【0029】
第1の態様において、図2を参照すると、本願実施例はデータ検索方法を提供し、当該データ検索方法は、
受信した検索ワードに対する意味理解に基づき、検索ワードに対応する意味理解情報を確定するステップS110と、
意味理解情報に基づき、分析を行って、検索ワードの時効性要請情報を得るステップS120と、
検索ワードの時効性要請情報に基づき、検索ワードに対応するリソース結果の取得方法を確定するステップS130と、
選択された取得方法に基づき、検索ワードに対応するリソース結果を得るステップS140とを含んでよい。
【0030】
本願実施例のデータ検索方法に基づけば、検索ワードの時効性にマッチするリソース結果の取得方法を選択しやすいように、検索ワードの意味理解情報に基づき、分析を行って、前記検索ワードの時効性要請情報を得ることにより、検索ワードの時効性を分析して、検索ワードの時効性の正確性を判定することで、検索エンジンの機械コストおよび時効性の効果の両者のバランスをとり、これらを両立させている。
【0031】
いくつかの実施例において、ステップS120は、具体的に、前記意味理解情報中の情報アイテムと、所定の前記意味理解情報中の情報アイテムに対応する重み係数とに基づき、前記検索ワードの時効性要請情報を計算して得ることを含んでよい。
【0032】
ここで、前記意味理解情報には、字義通りの意味、意味の完成度および突発的なキーワードの確率のうちの少なくとも1つが含まれてよい。
【0033】
一例として、「張三が離婚」、「某市で地震発生」という検索ワードについて言えば、検索ワードの字義通りの意味により、分析を行って、検索ワードの時効性要請情報を得ることができる。例えば、「張三が離婚」は字義通りの意味において時効性に対する要請が低い可能性が高く、「某市で地震発生」は字義通りの意味において時効性に対する要請が高い可能性が高い。
【0034】
一例として、「某スターの映画上映」という検索ワードについて言えば、その意味の完成度は高く、「某スターの」の意味の完成度は低いため、「某スターの」に比べ、「某スターの映画上映」という検索ワードは時効性に対する要請が高い。
【0035】
一例として、突発的なキーワードは、突発的事件のキーワードまたは突発的話題のキーワードであると理解することができ、第1の検索ワードが突発的なキーワードであり、かつ人為的に検索して得られたキーワードであることが検出され、第2の検索ワードが突発的なキーワードであり、かつ機械検索で得られたキーワードであることが検出された場合、第1の検索ワードが突発的なキーワードである確率は、第2の検索ワードが突発的なキーワードである確率より高く、第1の検索ワードの時効性に対する要請は第2の検索ワードの時効性に対する要請より高い。
【0036】
当該実施例では、字義通りの意味、意味の完成度および突発的なキーワードの確率のうちの1つまたは複数を組み合わせて、検索ワードの時効性要請情報を総合的に判断することができる。
【0037】
一実施例において、ステップS130では、具体的に、計算して得られた前記検索ワードの時効性要請情報の取り得る値が所定の第1のスコア以上である場合、前記検索ワードに対応するリソース結果の取得方法は、所定のキャッシュをトリガし浸透させることにより、更新されたリソース結果を得るというものであると確定し、計算して得られた前記検索ワードの時効性要請情報の取り得る値が所定の第1のスコアより小さい場合、前記検索ワードに対応するリソース結果の取得方法は、所定のキャッシュから既存のリソース結果を得るというものであると確定することを含んでよい。
【0038】
当該実施例では、検索ワードの意味理解情報に基づき、分析を行って、前記検索ワードの時効性要請情報を得ることにより、検索ワードの時効性に対する要請を分析して得られた値によって検索ワードの時効性の正確性を判定することで、検索ワードの時効性にマッチするリソース結果の取得方法を確定する。
【0039】
いくつかの実施例において、上述のステップS130は、具体的に、
前記検索ワードに対応するシステム情報を確定するステップS11と、
前記検索ワードの時効性要請情報および前記システム情報に基づき、前記検索ワードの時効性および機械コストを総合的に分析して、前記検索ワードの総合分析結果を得るステップS12と、
前記検索ワードの総合分析結果に基づき、前記検索ワードに対応するリソース結果の取得方法を確定するステップS13とを含んでよい。
【0040】
当該実施例において、総合分析結果の取り得る値が所定の第2のスコア以上である場合、選択される取得方法は、所定のキャッシュをトリガし浸透させることにより、更新されたリソース結果を得るというものであると確定され、検索ワードの得点が所定の第2のスコアより小さい場合、選択される取得方法は、所定のキャッシュの中から既存のリソース結果を得るというものであると確定される。
【0041】
本願実施例における第1のスコアおよび第2のスコアは、事前に設定された経験値であってよいとともに、第1のスコアおよび第2のスコアは同一であっても、異なってもよく、本願実施例では具体的に限定しない。
【0042】
上述のステップS11~S13により、意味理解情報およびシステム情報を組み合わせて、前記検索ワードの時効性および機械コストを総合的に分析し、意味理解情報およびシステム情報の両方から現在の検索ワードにマッチするリソース結果を得る方法を総合的に確定することにより、検索エンジンの機械コストおよび時効性の効果の両者のバランスをとり、これらを両立させることができる。
【0043】
いくつかの実施例において、ステップS12は、具体的に、
前記意味理解情報中の情報アイテムと、所定の前記意味理解情報中の情報アイテムに対応する重み係数とに基づき、前記検索ワードの時効性要請情報を計算して得るステップS21と、
前記システム情報中の情報アイテムと、事前に確定した前記システム情報中の情報アイテムに対応する重み係数とに基づき、前記検索ワードの機械コスト情報を計算して得るステップS22と、
前記検索ワードの時効性要請情報と、前記検索ワードの機械コスト情報とを組み合わせて、前記検索ワードの総合分析結果を得るステップS23とを含んでよい。
【0044】
上述のステップS21~S23により、意味理解情報およびシステム情報と、対応する情報アイテムの重み係数とを組み合わせて、各検索ワードに対して重み付け加算処理を行い、検索ワードの得点を取得し、検索ワードの得点に基づき、検索ワードに対応するリソース結果の取得方法を決定する。これにより、検索ワードに対応する意味理解情報およびシステム情報をともに検索システムの検索浸透メカニズムに作用させて、意味理解情報およびシステム情報の両方から現在の検索ワードのトラフィックに対しどの処理方法を選択すべきかを総合的に判断して、検索エンジンの機械コストおよび時効性の効果の両者のバランスをとり、これらを両立させている。
【0045】
上述のステップS120または上述のステップS21において、前記検索ワードの時効性要請情報を計算して得た後、さらに、
前記検索ワードの検索頻度および前記検索ワードに対応する呼び戻し結果数のうちのいずれか1つを含む、前記検索ワードの検索関連情報を確定するステップS31と、
前記検索関連情報と、事前に確定した前記検索関連情報に対応する重み係数とに基づき、前記検索ワードの時効性関連情報を計算して得るステップS32と、
計算して得られた前記検索ワードの時効性要請情報および前記時効性関連情報を、前記検索ワードの時効性要請情報とするステップS33とを含んでよい。
【0046】
上述のステップS31~S33により、検索ワードの検索頻度、呼び戻された回数、および検索ワードの意味理解情報に基づき、検索ワードの時効性要請情報をともに確定することができる。
【0047】
いくつかの実施例において、ステップS12の前に、
前記時効性情報および前記システム情報に対し、データ正規化処理および特徴正規化処理のうちの少なくとも1つを含む前処理を行うステップS30をさらに含んでよい。
【0048】
当該実施例では、特徴正規化処理により、時効性情報およびシステム情報を同一の特徴次元に変換することにより、同一の特徴次元において情報処理を行うことができる。また、正規化処理により、意味理解情報およびシステム情報が取り得る値を0~1の間に割り当てることで、対応する重み係数を利用し、前処理をした意味理解情報およびシステム情報の重み付け加算処理を行って、検索ワードの総合分析結果を得ることができる。
【0049】
本願実施例では、ステップS120の前に、前記意味理解情報中の情報アイテムの前処理を行うことをさらに含んでよい。当該前処理は、ステップS30における時効性情報に対する前処理の具体的な内容と一致し、本願実施例では繰り返さない。
【0050】
いくつかの実施例において、検索ワードに対応するリソース結果は所定のバックエンド処理に対応するリソース結果であり、所定のキャッシュは所定のバックエンド処理に対応するキャッシュである。
【0051】
いくつかの実施例において、前記リソース結果の取得方法には、所定のキャッシュの中から既存のリソース結果を取得し、前記所定のキャッシュをトリガし浸透させることにより、更新されたリソース結果を得ることが含まれる。前記所定のキャッシュは、所定のバックエンド処理プロセスに対応するキャッシュであり、前記バックエンド処理プロセスには、呼び戻し層の処理、順位付け層の処理、融合層の処理およびアクセス層の処理のうちの少なくとも1つが含まれる。前記所定のキャッシュには、融合層のキャッシュおよび順位付け層のキャッシュのうちの少なくとも1つが含まれる。
【0052】
当該実施例において、異なるバックエンド処理プロセスに対応する意味理解情報中の情報アイテムは異なってよく、異なるバックエンド処理プロセスに対応するシステム情報中の情報アイテムも異なってよい。異なるバックエンド処理プロセスに対応する意味理解情報アイテムの重みと、対応するシステム情報アイテムの重みとに基づき、検索ワードを採点し、所定のバックエンド処理に対応する検索ワードの得点を得る。
【0053】
いくつかの実施例において、意味理解情報に含まれる情報アイテムに対応する重み係数は、時効性要請情報に対する、意味理解情報中の各情報アイテムの影響の度合いを踏まえて確定される重み係数である。システム情報に含まれる情報アイテムに対応する重み係数は、システム性能に対する、システム情報中の各情報アイテムの影響の度合いを踏まえて確定される重み係数である。
【0054】
一実施例において、前記システム情報中の情報アイテムには、システム容量、システム応答時間、システム応答速度、システム負荷およびリソース要求量のうちの少なくとも1つが含まれる。
【0055】
またここで、各バックエンド処理プロセスに対応するシステム情報は異なり、検索ワードの検索時間によって、システム情報に含まれる情報アイテムに対応する重み係数は異なってよい。
【0056】
いくつかの実施例において、上述した意味理解情報中の各情報アイテムの重み係数およびシステム情報中の各情報アイテムの重み係数は、ユーザが事前に設定した経験値であってもよい。
【0057】
いくつかの実施例において、前記検索ワードに対応するリソース結果の取得方法は、所定のキャッシュの中から既存のリソース結果を得る方法、および所定のキャッシュをトリガし浸透させることにより、更新されたリソース結果を得る方法のいずれかである。
【0058】
本願実施例のデータ検索方法によれば、意味理解情報およびシステム情報の2種類の情報をともに検索システムの浸透メカニズムに作用させて、システムの現在のモジュールの検索ワードに対応するトラフィックを採点し、現在のトラフィックを下流まで引き続き浸透させるか否かを総合的に判断し、これにより結果の時効性およびリソースコストのグローバル最適化を常に保持してよい。
【0059】
本願のデータ検索方法をよりよく理解できるように、以下では、図3を組み合わせて、本願の例示的実施例のデータ検索方法の処理プロセスを説明する。図3は、本願実施例の検索システムのアーキテクチャ概略図である。図3図1において同一または均等な構成要素には同一の符号を使用する。
【0060】
図3に示すように、バックエンドサーバ40は、論理レベルにおいて、呼び戻し層モジュール41、順位付け層モジュール42、融合層モジュール43およびアクセス層モジュール44を少なくとも備えてよい。ここで、バックエンドサーバ40には、例えば、順位付け層のキャッシュ45および融合層のキャッシュ46などのキャッシュモジュールをさらに備えてよい。
【0061】
実用シナリオにおいて、バックエンドサーバ40は、論理レベルのその他の階層のモジュールおよびその他の階層のキャッシュモジュールをさらに備えてよく、本願実施例では具体的に限定しない。
【0062】
いくつかの実施例において、検索エンジンの所定のバックエンド処理プロセスは、呼び戻し層モジュール41に対応する呼び戻し層の処理、順位付け層モジュール42に対応する順位付け層の処理、融合層モジュール43に対応する融合層の処理およびアクセス層モジュール44に対応するアクセス層の処理のうちの少なくとも1つを含んでよい。所定のキャッシュには、融合層のキャッシュ46および順位付け層のキャッシュ45のうちの少なくとも1つが含まれる。
【0063】
一例として、呼び戻し層の処理には、例えば、受信した検索ワードに対し、検索エンジンにより、従来の検索技術に基づき呼び戻し処理を行い、呼び戻した検索結果を得ることを含んでよく、順位付け層の処理には、例えば、検索ワードのバックエンド呼び戻し結果に基づき時効性を識別し、時効性の識別結果に基づき時効性の高い方から低い方へ順位付けをし、検索ワードに対応する順位付け層のリソース結果を得、順位付け層のリソース結果を順位付け層のキャッシュに記憶することを含んでよく、融合層の処理には、例えば、順位付け層のリソース結果に所定の展示内容を融合し、融合層のリソース結果を得、融合層のリソース結果を融合層のキャッシュに記憶することを含んでよく、アクセス層の処理には、例えば、検索ワードの検索に対しロードバランシングおよびディザスタリカバリ処理を行うことを含んでよい。
【0064】
一例としては、アクセス層の処理プロセスにおいて、静的ウェブページのアクセス速度を上げるために、検索要求を複数のサーバに転送してロードバランシングの目的を達してよい。
【0065】
引き続き図3を参照すると、情報サービスシステム(すなわち、情報ミドルプラットフォームシステム)30は、意味理解情報およびシステム情報の2種類の情報をともに検索システムバックエンドサーバの異なる階層の浸透メカニズムに作用させることができる。
【0066】
本願実施例において、バックエンドサーバ40の呼び戻し層モジュール41、順位付け層モジュール42、融合層モジュール43およびアクセス層モジュール44は、異なる浸透メカニズムを有してよい。
【0067】
つまり、当該実施例において、情報ミドルプラットフォームシステム30における意味理解情報およびシステム情報は、いずれも複数の情報アイテムを含んでよい。同様に、呼び戻し層モジュール41、順位付け層モジュール42、融合層モジュール43およびアクセス層モジュール44も、それぞれ異なる意味理解情報アイテムおよび異なるシステム情報アイテムに対応してよく、各モジュールは、対応する意味理解情報アイテムおよびシステム情報アイテムに応じてそれぞれ異なる浸透メカニズムを実現する。
【0068】
本願実施例において、説明を簡単にするために、本明細書で後述する実施例では、図3における順位付け層モジュールに対応するデータ処理を例に、当該バックエンド処理モジュールにおける、情報ミドルプラットフォームの検索浸透メカニズムに基づくデータ処理方法について述べる。ただし、かかる説明は、本技術案の範囲または実施可能性を制限するものと解釈すべきではなく、順位付け層モジュール以外のその他のバックエンド処理モジュールの処理方法は、順位付け層モジュールに対する処理方法と一致する。
【0069】
いくつかの実施例において、順位付け層モジュールに応用する際、情報サービスシステムの検索浸透メカニズムに基づくデータ処理方法には、
構築された情報サービスシステムにおいて、現在の検索ワードのトラフィックについて、事前に設定された意味理解情報およびシステム情報の中から、順位付け層モジュールに対応する意味理解情報アイテムおよびシステム情報アイテムを確定するステップS51と、
各意味理解情報アイテムの重み係数と、各システム情報アイテムの重み係数とを取得するステップS52と、
取得した各意味理解情報アイテムの重み係数と、取得した各システム情報アイテムの重み係数とに基づき、順位付け層モジュールに対応する意味理解サブ情報およびシステム情報アイテムに対して重み付け加算処理を行い、順位付け層モジュールにおける現在の検索ワードの得点を得るステップS53と、
順位付け層モジュールにおける現在の検索ワードの得点が所定の第1のスコアを超えた場合、当該検索ワードのトラフィックに対して浸透処理を行うステップS54とを含んでよい。
【0070】
一例として、得点が所定の第1のスコアを超えた場合、当該検索ワードの時効性は比較的強いと確定することができ、浸透処理により最新の呼び戻し結果を得る必要がある。得点が第1のスコアを超えない場合、時効性に対する要請が比較的低いか、または現在のシステムアーキテクチャが比較的高い性能の保持を必要としていることを意味し、したがって上述した浸透処理を必要としない。
【0071】
上述のステップS51~S54により、我々の意味理解情報集合中の字義通りの意味情報から、このような検索ワードは時効性に対する要請が比較的強い確率が大いにあると判断され、システム情報中の、システムの現在のリアルタイムの容量情報を再度組み合わせることにより、現在の要求が、下流まで浸透して更新されたリソース結果を得ることを必要としているか否かを総合的に判定し、最新の結果が一層迅速にユーザに示される。
【0072】
図4は本願実施例のデータ検索装置の構成ブロック図である。
【0073】
第2の態様において、図4を参照すると、本願実施例は、データ検索装置を提供し、当該データ検索装置は、
受信した検索ワードに対する意味理解に基づき、前記検索ワードに対応する意味理解情報を確定する情報取得モジュール210と、
前記意味理解情報に基づき、分析を行って、前記検索ワードの時効性要請情報を得る情報分析モジュール220と、
前記検索ワードの時効性要請情報に基づき、前記検索ワードに対応するリソース結果の取得方法を確定する方法確定モジュール230と、
選択された取得方法に基づき、前記検索ワードに対応するリソース結果を得る結果取得モジュール240とを備えることができる。
【0074】
本願実施例のデータ検索装置によれば、検索ワードの時効性にマッチするリソース結果の取得方法を確定しやすいように、検索ワードの意味理解情報に基づき、分析を行って、前記検索ワードの時効性要請情報を得ることにより、検索ワードの時効性を分析して、検索ワードの時効性の正確性を判定することで、検索エンジンの機械コストおよび時効性の効果の両者のバランスをとり、これらを両立させている。
【0075】
いくつかの実施例において、情報分析モジュール220は、具体的に、前記意味理解情報中の情報アイテムと、所定の前記意味理解情報中の情報アイテムに対応する重み係数とに基づき、前記検索ワードの時効性要請情報を計算して得る。ここで、前記意味理解情報には、字義通りの意味、意味の完成度および突発的なキーワード確率のうちの少なくとも1つが含まれる。
【0076】
いくつかの実施例において、情報取得モジュール210は、さらに、前記検索ワードに対応するシステム情報を確定し、方法確定モジュール230は、さらに、前記検索ワードの時効性要請情報および前記システム情報に基づき、前記検索ワードの時効性および機械コストを総合的に分析して、前記検索ワードの総合分析結果を得、結果取得モジュール240は、さらに、前記検索ワードの総合分析結果に基づき、前記検索ワードに対応するリソース結果の取得方法を確定する。
【0077】
いくつかの実施例において、情報分析モジュール220は、さらに、前記意味理解情報中の情報アイテムと、所定の前記意味理解情報中の情報アイテムに対応する重み係数とに基づき、前記検索ワードの時効性要請情報を計算して得、前記システム情報中の情報アイテムと、事前に確定した前記システム情報中の情報アイテムに対応する重み係数とに基づき、前記検索ワードの機械コスト情報を計算して得、前記検索ワードの時効性要請情報と、前記検索ワードの機械コスト情報とを組み合わせて、前記検索ワードの総合分析結果を得る。
【0078】
いくつかの実施例において、情報分析モジュール220は、具体的に、前記検索ワードの時効性要請情報を計算して得た後、さらに、前記検索ワードの検索頻度および前記検索ワードに対応する呼び戻し結果数のうちのいずれか1つを含む、前記検索ワードの検索関連情報を確定し、前記検索関連情報と、事前に確定した前記検索関連情報に対応する重み係数とに基づき、前記検索ワードの時効性関連情報を計算して得、計算して得られた前記検索ワードの時効性要請情報および前記時効性関連情報を前記検索ワードの時効性要請情報とする。
【0079】
いくつかの実施例において、データ検索装置は、前記検索ワードの時効性要請情報および前記システム情報に基づき、前記検索ワードの時効性および機械コストを総合的に分析する前に、前記時効性情報および前記システム情報の前処理を行う前処理モジュールをさらに備えてよく、前記前処理には、データ正規化処理および特徴正規化処理のうちの少なくとも1つが含まれる。
【0080】
いくつかの実施例において、前記リソース結果の取得方法には、所定のキャッシュの中から既存のリソース結果を取得し前記所定のキャッシュをトリガし浸透させることによって、更新されたリソース結果を得ることが含まれ、前記所定のキャッシュは、所定のバックエンド処理プロセスに対応するキャッシュであり、前記バックエンド処理プロセスには、呼び戻し層の処理、順位付け層の処理、融合層の処理およびアクセス層の処理のうちの少なくとも1つが含まれ、前記所定のキャッシュには、融合層のキャッシュおよび順位付け層のキャッシュのうちの少なくとも1つが含まれる。
【0081】
いくつかの実施例において、前記システム情報中の情報アイテムには、システム容量、システム応答時間、システム応答速度、システム負荷およびリソース要求量のうちの少なくとも1つが含まれ、各バックエンド処理プロセスに対応する意味理解情報中の情報アイテムによって、対応するシステム情報中の情報アイテムが異なり、前記検索ワードの検索時間によって、前記システム情報中の情報アイテムに対応する重み係数が異なる。
【0082】
本願実施例のデータ検索装置によれば、意味理解情報およびシステム情報を組み合わせて各検索ワードを総合的に分析し、総合的分析の結果を踏まえて、現在の検索要求が、キャッシュをヒットさせて対応するキャッシュ中のリソース結果に直接戻るというものなのか、それとも、浸透処理を行って当該検索ワードに対応する更新されたリソース結果を得るというものなのかを決定することで、検索エンジンの機械コストおよび時効性の効果両者のバランスをとり、これらを両立させている。
【0083】
第3の態様において、図5を参照すると、本願実施例は、入力された検索ワードを受信する入力モジュール310と、受信した検索ワードに基づき、本願実施例のデータ検索方法を実行し、検索ワードに対応するリソース結果の取得方法およびリソース結果を得る処理モジュール320とを備える、情報サービスシステムを提供している。
【0084】
本願実施例で構築された情報サービスシステムにより、意味理解情報およびシステム情報の2種類の情報をともに検索システムの浸透メカニズムに作用させて、システムの現在のモジュールの各トラフィックを総合的に分析して、機械コストおよび時効性の効果両者のバランスをとり、これらを両立させている。
【0085】
実用シナリオでは、入力された検索ワード、例えば、「全国労働組合就業サービスプラットフォーム」について、本願実施例が提供する情報ミドルプラットフォームシステムが投入される前であれば、検索システムが静的に構成された一定の失効時間を用いると、通常、一定の失効時間により差異化せずに浸透が行われ、このとき、当該検索ワードの検索結果は最新のリソース結果ではない。
【0086】
情報ミドルプラットフォームシステムが投入された後では、「全国労働組合就業サービスプラットフォーム」のような冗長な(文字が比較的長く検索量が比較的少ない)検索ワードについて、本願実施例のデータ検索方法により、意味理解情報およびシステム情報を組み合わせて検索ワードを採点し、採点結果に応じて、ある時点で当該検索ワードが時効性の属性を有する突発的検索ワードに変わったことをより迅速に識別することができ、最新のリソース結果が最終的にユーザに示され、検索エンジンの機械コストおよび時効性の効果両者のバランスをとり、これらを両立させている。
【0087】
本願実施例のデータ検索方法、装置、システム、デバイス、コンピュータ可読記憶媒体およびプログラム製品によれば、情報ミドルプラットフォームシステムを構築し、検索ワードに対応する多次元情報を掘り出し、検索ワードに対応するデータトラフィックをインテリジェント化し動的に浸透させる技術案により、大量の機械コストを節約できるとともに、検索ワードの時効性の全体的な突発の効果、主要な突発的要請、二次的な突発要請などの次元でパフォーマンスが突出し、これにより、検索エンジンの機械コストおよび時効性の効果両者のバランスをとり、これらを両立させている。
【0088】
なお、本願は上文の実施例で説明し、図中に示した特定の構成および処理に限定されない。説明しやすく、説明を簡便にするために、データ処理モジュールのデータ検索方法の具体的な作業プロセスについては、前述した方法実施例のデータ検索方法における対応するプロセスを参照することができ、ここでは繰り返さない。
【0089】
第4の態様において、図6を参照すると、本願実施例は、
1つまたは複数のプロセッサ401と、
1つまたは複数のプログラムが記憶され、1つまたは複数のプログラムが1つまたは複数のプロセッサで実行されると、1つまたは複数のプロセッサが上述したデータ検索方法のいずれか1つを実現するメモリ402と、
プロセッサとメモリとの間に接続され、プロセッサとメモリとの情報のやりとりを実現するように構成された1つまたは複数のI/Oインターフェース403とを備える、電子デバイスを提供する。
【0090】
ここで、プロセッサ401は、データ処理能力を有する素子であり、これには、中央処理装置(CPU)などが含まれるがこれに限定されない。メモリ402は、データ記憶能力を有する素子であり、これには、ランダムアクセスメモリ(RAM、より具体的には、SDRAM、DDRなど)、リードオンリーメモリ(ROM)、電気的消去可能プログラマブルリードオンリーメモリ(EEPROM(登録商標))、フラッシュメモリ(FLASH(登録商標))が含まれるがこれらに限定されない。I/Oインターフェース(読み取り/書き込み用インターフェース)403は、プロセッサ401とメモリ402との間に接続され、プロセッサ401とメモリ402との情報のやりとりを可能にし、これには、データバス(Bus)などが含まれるがこれに限定されない。
【0091】
いくつかの実施例において、プロセッサ401、メモリ402およびI/Oインターフェース403は、バスによって相互に接続されたうえで、さらに電子デバイスのその他の構成要素に接続される。
【0092】
第5の態様において、図7を参照すると、本願実施例は、コンピュータプログラムが記憶され、プログラムがプロセッサにより実行されると、上述したデータ検索方法のいずれか1つを実行するコンピュータ可読記憶媒体を提供する。
【0093】
上文で公開した方法におけるすべてまたは一部のステップ、システム、装置中の機能モジュール/ユニットは、ソフトウェア、ファームウェア、ハードウェアおよびその適切な組み合わせとして実施できることが当業者には理解される。ハードウェアの実施形態において、以上の説明で触れた機能モジュール/ユニットの間の区別は必ずしも物理的構成要素の区分に対応しない。例えば、ある物理的構成要素は、複数の機能を有してよく、またはある機能もしくはステップは、いくつかの物理的構成要素が協働して実行されるものであってもよい。いくつかの物理的構成要素またはすべての物理的構成要素は、中央処理装置、デジタル情報処理装置またはマイクロプロセッサなどのプロセッサによって実行されるソフトウェアとして実施されるか、またはハードウェアとして実施されるか、または特定用途向け集積回路などの集積回路として実施されてよい。このようなソフトウェアはコンピュータ可読記憶媒体上に配置することができ、コンピュータ可読記憶媒体には、コンピュータ記憶媒体(または非一時的媒体)および通信媒体(または一時的媒体)を含んでよい。当業者によく知られているように、コンピュータ記憶媒体という用語には、情報(例えば、コンピュータ可読命令、データ構造、プログラムモジュールまたはその他のデータ)を記録するためのあらゆる方法または技術において実施される、揮発性および不揮発性、削除可能および削除不可能な媒体が含まれる。コンピュータ記憶媒体には、RAM、ROM、EEPROM、フラッシュメモリもしくはその他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)もしくはその他の光ディスクストレージ、磁気カセット、磁気テープ、磁気ディスクストレージもしくはその他の磁気ストレージデバイス、または所望の情報を記憶し、コンピュータによりアクセス可能なあらゆるその他の媒体が含まれるがこれらに限定されない。また、当業者に知られているように、通信媒体には、通常、コンピュータ可読命令、データ構造、プログラムモジュール、またはキャリアもしくは他の伝送メカニズムといった変調データ情報のうちのその他のデータが含まれ、あらゆる情報伝達媒体も含んでよい。
【0094】
第6の態様において、本願実施例は、プロセッサで実行されると、上述したデータ検索方法のいずれか1つが実現されるコンピュータプログラムを含む、プログラム製品を提供する。
【0095】
1つまたは複数のプログラミング言語を任意に組み合わせて本願の方法を実施するプログラムコードを記述してよい。プロセッサまたはコントローラによってプログラムコードが実行されるときにフローチャートおよび/またはブロック図に規定された機能/操作が実施されるように、これらのプログラムコードは、汎用コンピュータ、専用コンピュータ、またはその他のプログラム可能なデータ処理装置のプロセッサもしくはコントローラに提供されてよい。プログラムコードは、完全に機器上で実行されるか、または部分的に機器上で実行されるか、または独立したソフトウェアパッケージとして、部分的に機器上で実行され、部分的にリモートマシン上で実行されるか、または完全にリモートマシンもしくはサーバ上で実行されてよい。 本明細書では、例示的な実施例を公開しており、具体的な用語を用いたが、それらは一般的に説明される意味にのみ用いられ、かかる意味にのみ解釈され、限定を目的としたものではない。別途明確に指摘しない限り、いくつかの実施例においては、特定の実施例と組み合わせて説明した特徴、特性および/もしくは素子を単独で使用することも、またはその他の実施例と組み合わせて説明した特徴、特性および/もしくは素子と組み合わせて使用することもできることは当業者にとって自明である。したがって、添付の特許請求の範囲によって示される本願の範囲から逸脱することなく、様々な形態および詳細を変更できることが当業者に理解される。
以下に、出願当初の特許請求の範囲に記載の事項を、そのまま、付記しておく。
[C1]
受信した検索ワードに対する意味理解に基づき、前記検索ワードに対応する意味理解情報を確定するステップと、
前記意味理解情報に基づき、分析を行って、前記検索ワードの時効性要請情報を得るステップと、
前記検索ワードの時効性要請情報に基づき、前記検索ワードに対応するリソース結果の取得方法を確定するステップと、
選択された取得方法に基づき、前記検索ワードに対応するリソース結果を得るステップとを含む、データ検索方法。
[C2]
前記意味理解情報に基づき、分析を行って、前記検索ワードの時効性要請情報を得る前記ステップには、
前記意味理解情報中の情報アイテムと、所定の前記意味理解情報中の情報アイテムに対応する重み係数とに基づき、前記検索ワードの時効性要請情報を計算して得ることが含まれ、
前記意味理解情報には、字義通りの意味、意味の完成度および突発的なキーワードの確率のうちの少なくとも1つが含まれる、C1に記載の方法。
[C3]
前記検索ワードの時効性要請情報に基づき、前記検索ワードに対応するリソース結果の取得方法を確定する前記ステップには、
前記検索ワードに対応するシステム情報を確定するステップと、
前記検索ワードの時効性要請情報および前記システム情報に基づき、前記検索ワードの時効性および機械コストを総合的に分析して、前記検索ワードの総合分析結果を得るステップと、
前記検索ワードの総合分析結果に基づき、前記検索ワードに対応するリソース結果の取得方法を確定するステップとが含まれる、C1に記載の方法。
[C4]
前記検索ワードの時効性要請情報および前記システム情報に基づき、前記検索ワードの時効性および機械コストを総合的に分析して、前記検索ワードの総合分析結果を得る前記ステップには、
前記意味理解情報中の情報アイテムと、所定の前記意味理解情報中の情報アイテムに対応する重み係数とに基づき、前記検索ワードの時効性要請情報を計算して得ることと、 前記システム情報中の情報アイテムと、事前に確定した前記システム情報中の情報アイテムに対応する重み係数とに基づき、前記検索ワードの機械コスト情報を計算して得ることと、
前記検索ワードの時効性要請情報と、前記検索ワードの機械コスト情報とを組み合わせて、前記検索ワードの総合分析結果を得ることとが含まれる、C3に記載の方法。
[C5]
前記検索ワードの時効性要請情報を計算して得た後、さらに、
前記検索ワードの検索頻度および前記検索ワードに対応する呼び戻し結果数のうちのいずれか1つを含む、検索関連情報を確定することと、
前記検索関連情報と、事前に確定した前記検索関連情報に対応する重み係数とに基づき、前記検索ワードの時効性関連情報を計算して得ることと、
計算して得られた前記検索ワードの時効性要請情報および前記時効性関連情報を、前記検索ワードの時効性要請情報とすることとを含む、C2または4に記載の方法。
[C6]
前記検索ワードの時効性要請情報および前記システム情報に基づき、前記検索ワードの時効性および機械コストを総合的に分析する前に、
前記時効性情報および前記システム情報の前処理を行うことが含まれ、前記前処理には、データ正規化処理および特徴正規化処理のうちの少なくとも1つが含まれる、C3または4に記載の方法。
[C7]
前記リソース結果の取得方法には、所定のキャッシュの中から既存のリソース結果を取得し、前記所定のキャッシュをトリガし浸透させることにより、更新されたリソース結果を取得することが含まれ、
前記所定のキャッシュは、所定のバックエンド処理プロセスに対応するキャッシュであり、前記バックエンド処理プロセスには、呼び戻し層の処理、順位付け層の処理、融合層の処理およびアクセス層の処理のうちの少なくとも1つが含まれ、
前記所定のキャッシュには、融合層のキャッシュおよび順位付け層のキャッシュのうちの少なくとも1つが含まれる、C1から4のいずれか1項に記載の方法。
[C8]
前記検索ワードに対応するシステム情報中の情報アイテムには、システム容量、システム応答時間、システム応答速度、システム負荷およびリソース要求量のうちの少なくとも1つが含まれ、
各バックエンド処理プロセスに対応する意味理解情報中の情報アイテムによって、対応するシステム情報中の情報アイテムが異なり、前記検索ワードの検索時間によって、前記システム情報中の情報アイテムに対応する重み係数が異なる、C7に記載の方法。
[C9]
受信した検索ワードに対する意味理解に基づき、前記検索ワードに対応する意味理解情報を確定する情報取得モジュールと、
前記意味理解情報に基づき、分析を行って、前記検索ワードの時効性要請情報を得る情報分析モジュールと、
前記検索ワードの時効性要請情報に基づき、前記検索ワードに対応するリソース結果の取得方法を確定する方法確定モジュールと、
選択された取得方法に基づき、前記検索ワードに対応するリソース結果を得る結果取得モジュールとを備える、データ検索装置。
[C10]
入力された検索ワードを受信する入力モジュールと、
受信した前記検索ワードに基づき、C1から8に記載のいずれか1項に記載の方法を実行し、前記検索ワードに対応するリソース結果の取得方法およびリソース結果を得る処理モジュールとを備える、情報サービスシステム。
[C11]
1つまたは複数のプロセッサと、
1つまたは複数のプログラムが記憶され、前記1つまたは複数のプログラムが前記1つまたは複数のプロセッサで実行されると、前記1つまたは複数のプロセッサがC1から8のいずれか1項に記載のデータ検索方法を実現するメモリと、
前記プロセッサとメモリとの間に接続され、前記プロセッサとメモリとの情報のやりとりを実現するように構成された1つまたは複数のI/Oインターフェースとを備える、電子デバイス。
[C12]
コンピュータプログラムが記憶され、前記プログラムがプロセッサにより実行されると、C1から8に記載のいずれか1項に記載のデータ検索方法が実現される、コンピュータ可読記憶媒体。
[C13]
プロセッサで実行されると、C1から8のいずれか1項に記載のデータ検索方法が実現されるコンピュータプログラムを含む、プログラム製品。
図1
図2
図3
図4
図5
図6
図7