(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-10-18
(45)【発行日】2023-10-26
(54)【発明の名称】検索語の推薦方法と装置、目的モデルの訓練方法と装置、電子デバイス、記憶媒体、及びプログラム
(51)【国際特許分類】
G06F 16/9032 20190101AFI20231019BHJP
【FI】
G06F16/9032
(21)【出願番号】P 2021116392
(22)【出願日】2021-07-14
【審査請求日】2021-07-14
(31)【優先権主張番号】202011563137.X
(32)【優先日】2020-12-25
(33)【優先権主張国・地域又は機関】CN
【前置審査】
(73)【特許権者】
【識別番号】512015127
【氏名又は名称】バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】フーチュン、チアン
【審査官】早川 学
(56)【参考文献】
【文献】特開2012-133520(JP,A)
【文献】特開2011-103020(JP,A)
【文献】米国特許出願公開第2015/0161201(US,A1)
【文献】米国特許出願公開第2019/0384831(US,A1)
【文献】特開2005-302043(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
(57)【特許請求の範囲】
【請求項1】
検索語の推薦装置により実行される検索語の推薦方法であって、
入力された目的検索語を取得することと、
前記目的検索語を現在ノードとし、前記現在ノードの近隣ノード、及び前記現在ノードと前記近隣ノードとの間の関係を決定することと、
前記現在ノードの第1テキスト情報及び前記近隣ノードの第2テキスト情報に対してそれぞれ意味表現処理を行い、前記現在ノードの第1意味表現及び前記近隣ノードの第2意味表現を得ることと、
前記第1意味表現及び前記第2意味表現、ならびに前記現在ノードと前記近隣ノードとの間の関係に基づき、前記現在ノードと前記近隣ノードとのクラスタを生成し、前記クラスタの意味表現を集約して前記目的検索語の意味集約表現として決定することと、
前記意味集約表現と類似することをインデックスとし、前記目的検索語から作成される候補検索語集合から推薦すべき候補検索語をリコールすることと、を含む、
検索語の推薦方法。
【請求項2】
前記候補検索語集合の作成は、
目的検索語の検索頻度、結果ページ提示数及びクリック数の統計的特徴に基づいて、候補検索語を選別することと、
選別された候補検索語に基づいて、候補検索語集合を作成することと、を含む、
請求項1に記載の検索語の推薦方法。
【請求項3】
前記候補検索語集合は、近傍検索サービスANNインデックスライブラリの形式で存在し、前記選別された候補検索語に基づいて、候補検索語集合を作成することは、
選別されたすべての候補検索語に対して、すべての候補検索語の意味集約表現を予測することと、
すべての候補検索語の意味集約表現に基づき、ANNインデックスライブラリを作成することと、を含む、
請求項2に記載の検索語の推薦方法。
【請求項4】
前記意味集約表現と類似することをインデックスとし、前記目的検索語から作成される候補検索語集合から推薦すべき候補検索語をリコールすることは、
前記意味集約表現と類似することをインデックスとし、前記意味集約表現と前記ANNインデックスライブラリにおける意味集約表現の類似度を決定することと、
類似度が上位N位までの意味集約表現を目的意味集約表現として決定することと、
前記目的意味集約表現の対応する候補検索語を、推薦すべき候補検索語としてリコールすることと、を含み、
前記Nの値は正の整数である、
請求項3に記載の検索語の推薦方法。
【請求項5】
入力された目的検索語を取得するための取得モジュールと、
前記目的検索語を現在ノードとし、前記現在ノードの近隣ノード、及び前記現在ノードと前記近隣ノードとの間の関係を決定するための第1決定モジュールと、
前記現在ノードの第1テキスト情報及び前記近隣ノードの第2テキスト情報に対してそれぞれ意味表現処理を行い、前記現在ノードの第1意味表現及び前記近隣ノードの第2意味表現を得るための第2決定モジュールと、
前記第1意味表現及び前記第2意味表現、ならびに前記現在ノードと前記近隣ノードとの間の関係に基づき、前記現在ノードと前記近隣ノードとのクラスタを生成し、前記クラスタの意味表現を集約して前記目的検索語の意味集約表現として決定するための集約表現モジュールと、
前記意味集約表現と類似することをインデックスとし、前記目的検索語から作成される候補検索語集合から推薦すべき候補検索語をリコールするためのリコールモジュールと、を備える、
検索語の推薦装置。
【請求項6】
集合作成モジュールをさらに備え、
前記集合作成モジュールは、
目的検索語の検索頻度、結果ページ提示数及びクリック数の統計的特徴に基づいて、候補検索語を選別することと、
選別された候補検索語に基づいて、候補検索語集合を作成することと、にさらに用いられる、
請求項
5に記載の検索語の推薦装置。
【請求項7】
前記候補検索語集合は、近傍検索サービスANNインデックスライブラリの形式で存在し、前記集合作成モジュールは、
選別されたすべての候補検索語に対して、すべての候補検索語の意味集約表現を予測することと、
すべての候補検索語の意味集約表現に基づき、ANNインデックスライブラリを作成することと、に用いられる
請求項
6に記載の検索語の推薦装置。
【請求項8】
前記リコールモジュールは、
前記意味集約表現と類似することをインデックスとし、前記意味集約表現と前記ANNインデックスライブラリにおける意味集約表現の類似度を決定することと、
類似度が上位N位までの意味集約表現を目的意味集約表現として決定することと、
前記目的意味集約表現の対応する候補検索語を、推薦すべき候補検索語としてリコールすることと、に用いられ、
前記Nの値は、正の整数である、
請求項
7に記載の検索語の推薦装置。
【請求項9】
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信接続されるメモリと、を備え、
前記メモリには、前記少なくとも1つのプロセッサで実行可能な命令が記憶され、前記命令は、前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに、請求項1から請求項
4までのいずれか1項に記載の方法を実行させる、
電子デバイス。
【請求項10】
コンピュータに請求項1から請求項
4までのいずれか1項に記載の方法を実行させる命令を記憶するための非一時的なコンピュータ可読記憶媒体。
【請求項11】
コンピュータにおいて、プロセッサにより実行されると、請求項1から請求項
4までのいずれか1項に記載の方法を実現するためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、コンピュータ技術の分野、特に情報処理の分野に関する。
【背景技術】
【0002】
インターネット技術とスマートモバイル端末技術の急速な発展に伴い、ユーザーはコンピュータや携帯電話などのスマート端末を通して要求情報を検索することができる。情報検索の際、ユーザは検索語(query)を入力することで、価値のある情報を求め、電子デバイスは、検索語に基づきネットワークビッグデータにおいて情報マッチングを行い、検索結果を出力する。通常、同じ検索ニーズに対して、異なるユーザの表現は様々である可能性があり、正確でない表現は、往々にして必要な検索結果を得ることができない。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本開示は、検索語の推薦方法、目的モデルの訓練方法、装置、電子デバイス、記憶媒体、及び製品を提供する。
【課題を解決するための手段】
【0004】
本開示の第1態様は、検索語の推薦方法を提供し、該方法は、
入力された目的検索語を取得することと、
目的検索語を現在ノードとし、現在ノードの近隣ノード、及び現在ノードと近隣ノードとの間の関係を決定することと、
現在ノードの第1テキスト情報及び近隣ノードの第2テキスト情報に対してそれぞれ意味表現処理を行い、現在ノードの第1意味表現及び近隣ノードの第2意味表現を得ることと、
第1意味表現及び第2意味表現、ならびに現在ノードと近隣ノードとの間の関係に基づき、目的検索語の意味集約表現を決定することと、
意味集約表現をインデックスとし、候補検索語集合から推薦すべき候補検索語をリコールすることと、を含む。
【0005】
本開示の第2態様は、目的モデルの訓練方法を提供し、該方法は、
訓練サンプルにおけるサンプル検索語を、プリセットモデルにおけるプリセット第1ネットワークモデルに入力し、前記プリセットモデルにおける前記プリセット第1ネットワークモデルにより出力された、前記サンプル検索語を現在ノードとする近隣ノード、及び前記現在ノードと前記近隣ノードとの間の関係を得ることと、
前記現在ノードの第1テキスト情報及び前記近隣ノードの第2テキスト情報を、前記プリセットモデルにおけるプリセット第2ネットワークモデルに入力し、前記プリセット第2ネットワークモデルにより出力された、前記現在ノードの第1意味表現及び前記近隣ノードの第2意味表現を得ることと、
前記現在ノードにおける前記第1意味表現及び前記近隣ノードにおける前記第2意味表現を、前記プリセットモデルにおけるプリセット第3ネットワークモデルに入力し、前記プリセット第3ネットワークモデルにより出力された、前記サンプル検索語の意味集約表現を得ることと、
前記サンプル検索語を現在ノードとする近隣ノード、及び前記現在ノードと前記近隣ノードとの間の関係、前記サンプル検索語の意味集約表現、前記訓練サンプルにおける各ノードの意味集約表現ラベル、及びノードとノードとの間の関係のラベルに基づき、損失関数を決定することと、
前記損失関数に基づいて前記プリセットモデルを逆伝導して更新し、前記目的モデルを得ることと、を含む。
【0006】
本開示の第3態様は、検索語の推薦装置を提供し、該装置は、
入力された目的検索語を取得するための取得モジュールと、
目的検索語を現在ノードとし、現在ノードの近隣ノード、及び現在ノードと近隣ノードとの間の関係を決定するための第1決定モジュールと、
現在ノードの第1テキスト情報及び近隣ノードの第2テキスト情報に対してそれぞれ意味表現処理を行い、現在ノードの第1意味表現及び近隣ノードの第2意味表現を得るための第2決定モジュールと、
第1意味表現及び第2意味表現、ならびに現在ノードと近隣ノードとの間の関係に基づき、目的検索語の意味集約表現を決定するための集約表現モジュールと、
意味集約表現をインデックスとし、候補検索語集合から推薦すべき候補検索語をリコールするためのリコールモジュールと、を備える。
【0007】
本開示の第4態様は、目的モデルの訓練装置を提供し、該装置は、
訓練サンプルにおけるサンプル検索語を、プリセットモデルにおけるプリセット第1ネットワークモデルに入力し、前記プリセットモデルにおける前記プリセット第1ネットワークモデルにより出力された、前記サンプル検索語を現在ノードとする近隣ノード、及び前記現在ノードと前記近隣ノードとの間の関係を得るための第1情報決定モジュールと、
前記現在ノードの第1テキスト情報及び前記近隣ノードの第2テキスト情報を、前記プリセットモデルにおけるプリセット第2ネットワークモデルに入力し、前記プリセット第2ネットワークモデルにより出力された、前記現在ノードの第1意味表現及び前記近隣ノードの第2意味表現を得るための第2情報決定モジュールと、
前記現在ノードにおける前記第1意味表現及び前記近隣ノードにおける前記第2意味表現を、前記プリセットモデルにおける前記プリセット第1ネットワークモデルに入力し、前記プリセット第1ネットワークモデルにより出力された、前記サンプル検索語の意味集約表現を得るための第3情報決定モジュールと、
前記サンプル検索語を現在ノードとする現在ノードの近隣ノード、及び前記現在ノードと前記近隣ノードとの間の関係、前記サンプル検索語の意味集約表現、前記訓練サンプルにおける各ノードの意味集約表現ラベル、及びノードとノードとの間の関係のラベルに基づき、損失関数を決定し、前記損失関数に基づいて前記プリセットモデルを逆伝導して更新し、前記目的モデルを得るための訓練モジュールと、を備える。
【0008】
本開示の第5態様は、電子デバイスを提供し、該デバイスは、
少なくとも1つのプロセッサと、
少なくとも1つのプロセッサに通信接続されるメモリと、を備え、
メモリには、少なくとも1つのプロセッサにより実行可能な命令が記憶されており、
命令が少なくとも1つのプロセッサにより実行される場合、上記の本開示の実施形態の任意の方法を実行させることを特徴とする。
【0009】
本開示の第6態様は、コンピュータ命令を記憶した非一過性のコンピュータ可読記憶媒体を提供し、該コンピュータ命令を記憶した非一過性のコンピュータ可読記憶媒体は、
上記の本開示の実施形態の任意の方法をコンピュータに実行させる。
【0010】
本開示の第7態様は、プログラムを提供し、該プログラムは、
プロセッサにより実行されると、本開示の実施形態の任意の方法を実現する。
【0011】
本開示の実施形態により、推薦する候補検索語の正確率を高めることができる。
【0012】
本実施形態に記載されている内容は、本開示の実施形態のキー又は重要な特徴を識別することを意図せず、本開示の範囲を制限するものでもないことを理解すべきである。
【0013】
本開示の他の特徴については、下記の明細書を通して説明を促す。
【図面の簡単な説明】
【0014】
【
図1】本開示の1つの実施形態による検索語の推薦方法のフローチャートである。
【
図2】本開示の1つの実施形態による訓練サンプル取得のフローチャートである。
【
図3】本開示の実施形態におけるテキストグラフの例である。
【
図4】本開示の1つの実施形態による目的モデルを訓練するフローチャートである。
【
図5】本開示の実施形態における意味集約表現を取得する概略図である。
【
図6】本開示の1つの実施形態による候補ワード集合を作成するフローチャートである。
【
図7】本開示の実施形態における候補検索語集合を作成する例である。
【
図8】本開示の実施形態における候補検索語集合から推薦すべき候補検索語をリコールする例である。
【
図9】本開示の実施形態における検索語の推薦を実現するためのアーキテクチャ概略図である。
【
図10】本開示の1つの実施形態による検索語の推薦装置の概略図である。
【
図11】本開示の他の実施形態による検索語の推薦装置の概略図である。
【
図12】本開示の1つの実施形態による目的モデルの訓練装置の概略図である。
【
図13】本開示の1つの実施形態による目的モデルの訓練装置の概略図である。
【
図14】本開示の実施形態における検索語の推薦方法を実現するための電子デバイスのブロック図である。
【発明を実施するための形態】
【0015】
以下において、本開示の例示的な実施形態を、理解を容易にするために本開示の実施形態の様々な詳細を含む添付の図面に関連して説明するが、これらは単に例示的なものであると考えるべきである。したがって、当業者は、本開示の範囲及び精神を逸脱することなく、本明細書に記載された実施形態に様々な変更及び修正を加えることができることを認識すべきである。同様に、以下の説明では、周知の機能及び構成については、明確化及び簡明化のために説明を省略する。
【0016】
図1は本開示の1つの実施形態による検索語の推薦方法の概略図であり、該方法は、固定デバイス及び/又はモバイルデバイスを含むがこれらに限定されない電子デバイスに応用できる。例えば、固定デバイスは、クラウドサーバ又は通常のサーバであってもよいサーバを含むがこれらに限定されない。例えば、モバイルデバイスは、携帯電話又はタブレットのうちの1つ又は複数を含むがこれらに限定されない。
図1に示すように、該方法は、以下のステップを含む。
【0017】
ステップS11において、入力された目的検索語を取得する。
【0018】
ステップS12において、目的検索語を現在ノードとし、現在ノードの近隣ノード、及び現在ノードと近隣ノードとの間の関係を決定する。
【0019】
ステップS13において、現在ノードの第1テキスト情報及び近隣ノードの第2テキスト情報に対してそれぞれ意味表現処理を行い、現在ノードの第1意味表現及び近隣ノードの第2意味表現を得る。
【0020】
ステップS14において、第1意味表現及び第2意味表現、ならびに現在ノードと近隣ノードとの間の関係に基づき、目的検索語の意味集約表現を決定する。
【0021】
ステップS15において、意味集約表現をインデックスとし、候補検索語集合から推薦すべき候補検索語をリコールする。
【0022】
ここで、ステップS11における目的検索語(queryと称することもできる)は、ユーザが端末デバイスに入力した情報である。例示的に、目的検索語は、人物名、アイテム名、時間、場所、イベントなどの情報のうちの1つ又は複数を含むことができる。例えば、ユーザが「アンディ・ラウ」を入力した場合、目的検索語は「アンディ・ラウ」である。さらに例えば、ユーザーが「百度発展史」を入力した場合、目的検索語は「百度発展史」である。端末デバイスは、ユーザの入力操作を受信した後、該入力操作に基づいて目的検索語を取得し、目的検索語を電子デバイスに送信する。
【0023】
ここで、候補検索語集合には複数の候補検索語が記憶されており、本開示では推薦すべき候補検索語の個数を限定しない。実際の応用において、推薦すべき候補検索語の個数は設計ニーズやユーザニーズに応じて設定することができる。
【0024】
ここで、異なる目的検索語により検索回数が異なる可能性があるため、近隣ノートの数はノードによって異なる可能性がある。例えば、高頻度の目的検索語Aに対応する近隣ノードはi個あり、低頻度の目的検索語Bに対応する近隣ノードはj個あり、iの値は正の整数であり、jの値は正の整数であり、iはjとイコールではない。
【0025】
ここで、ステップS14における意味集約表現は、現在ノードと近隣ノードとを集約したクラスタの意味表現である。
【0026】
いくつかの実施形態において、ステップS12において、目的検索語を現在ノードとし、現在ノードの近隣ノードを決定することは、
【0027】
ユーザの履歴検索記録を取得し、履歴検索記録における履歴検索語を近隣ノードと決定すること、又は、
【0028】
検索時の提示ウェブページ情報を取得し、提示ウェブページ情報におけるウェブページタイトルを近隣ノードとして決定すること、又は、
【0029】
履歴検索ログにおける履歴検索語の共起情報を取得し、履歴検索語をキーとし、共起情報を値とするキー値対形式の辞典を作成し、単語引きの方法により近隣ノートを取得することの少なくとも1つを通して実現されてもよい。
【0030】
例えば、アンディ・ラウを検索し、履歴検索ログからアンディ・ラウ、ジャッキー・チュン、アーロン・クオックなどに共線関係が存在することを見つけることができた場合、アンディ・ラウをキーとし、ジャッキー・チュン、アーロン・クオックを値とする辞典を構築し、現在の検索語に対する辞典検索を通して、ジャッキー・チュン、アーロン・クオックなどの近隣ノードを取得する。
【0031】
実際の応用において、現在ノードの近隣ノートを具体的にどのように決定するかは、上記の方法のうちの1つ又は複数の方式を用いて実現することができる。言うまでもなく、近隣ノードを決定することができる他の方法を用いて現在ノードの近隣ノードを決定してもよく、本開示ではこれを限定しない。
【0032】
本実施形態において説明される検索語の推薦方法は、目的検索語を現在ノードとし、現在ノードの近隣ノードを決定することと、現在ノードの第1テキスト情報及び近隣ノードの第2テキスト情報に基づき、目的検索語の意味集約表現を決定することと、意味集約表現をインデックスとし、候補検索語集合から推薦すべき候補検索語をリコールすることと、を含む。現在ノードの対応する意味表現のみに基づいて候補検索語を決定することに対して、意味集約表現は、現在ノードと近隣ノートとを有するクラスタを集約した意味表現であるため、目的検索語が不確定又は不正確であるなどの問題により、検索操作に生じた検索効果が悪いという問題を解決し、より正確な推薦すべき候補検索語をリコール、ユーザが推薦された候補検索語に基づいて検索を行うことに役立ち、検索操作のプロセスを簡略化し、検索の難易度を低減し、ユーザの検索効率を向上することで、ユーザの検索体験を向上する。
【0033】
いくつかの実施形態において、ステップS12、S13及びS14は、意味集約特徴を出力するために訓練された目的モデルを通して実現されてもよい。
【0034】
目的モデルを得る具体的な訓練方法は、以下である。
【0035】
現在ノードの第1テキスト情報及びその近隣ノードの第2テキスト情報に基づき意味集約表現を決定し易いよう、まずプリセットモデルに対して訓練を行うことで、意味集約表現を出力することができる目的モデルを得る必要がある。一方、プリセットモデルに対して訓練を行うためには、訓練サンプルが必要であり、本開示の実施形態では、
図2に示すように、上記の任意の方法を実現することを基に、さらに以下のステップを含むことができる。
【0036】
ステップS21において、ユーザによるインタラクション行為に基づき、検索ログから複数のノード及び該複数のノードにおけるノードとノードとの間の関係を発掘し、該複数のノードは、サンプル検索語及びサンプルウェブページタイトルのうちの少なくとも1種類のノードを含む。
【0037】
ステップS22において、該複数のノード及び該複数のノードにおけるノードとノードとの間の関係に基づいて、テキストグラフを構築する。
【0038】
ステップS23において、該テキストグラフに基づき、訓練サンプルを生成する。
【0039】
上記の実施形態により、該複数のノードにおけるノードとノードとの間の関係に基づいて、テキストグラフを構築することは、良好な訓練サンプルを得ることができることで、訓練された目的モデルがより正確な意味集約表現を出力することを可能にする。
【0040】
いくつかの実施形態において、複数のノードにおけるノードとノードとの間の関係を決定する方法は、
【0041】
サンプル検索語とサンプル検索語との間の第1種関係を決定すること、
【0042】
サンプル検索語とサンプルウェブページタイトルとの間の第2種関係を決定すること、
【0043】
サンプルウェブページタイトルとサンプルウェブページタイトルとの間の第3種関係を決定すること、の少なくとも1つを含む。
【0044】
具体的な実施形態は、2つのサンプル検索語が1つの検索時間領域に同時に出現する共起関係、2つのサンプル検索語が共通して同一のサンプルウェブページタイトルを提示する共展関係、及び2つのサンプル検索語が共通して同一のサンプルウェブページタイトルをクリックする共点関係の少なくとも1つを、サンプル検索語とサンプル検索語との間の第1種関係として決定すること、を含んでもよい。
【0045】
具体的な実施形態は、1つの検索語を検索するシーンにおいてサンプルウェブページタイトルに対してリコール提示を有する提示関係、1つのサンプル検索語を検索するシーンにおいてウェブページタイトルをクリックするクリック関係、及びサンプル検索語とウェブページタイトルとがテキスト包含関係を有するテキストマッチング関係の少なくとも1つを、サンプル検索語とサンプルウェブページタイトルとの間の第2種関係を決定すること、を含んでもよい。
【0046】
具体的な実施形態は、同じ検索において同時に提示される2つのサンプルウェブページタイトルの共展関係、及び同じ検索において同時にクリックされる2つのサンプルウェブページタイトルの共点関係の少なくとも1つを、サンプルウェブページタイトルとサンプルウェブページタイトルとの間の第3種関係を決定すること、を含んでもよい。
【0047】
図3は、テキストグラフの一例であり、
図3に示すように、Q1、Q2、Q3はいずれも検索語を表し、T1、T2、T3、T4はいずれもウェブページタイトルを表しており、
図3の各接続線において、太い実線はウェブページタイトルとウェブページタイトルとの間の接続エッジ、即ち第3種関係を表し、細い実線は、検索語とウェブページタイトルとの間の接続エッジ、即ち第2種関係を表し、点線は、検索語と検索語との間の接続エッジ、即ち第1種関係を表す。
図3に示されるテキストグラフは、単に概略的なものであることを理解すべきである。例えば、T1は「天王アンディ・ラウの名曲トップ10、どの曲も飽きずに単ループ」、T2は「歳月留曲、感動年華!あの頃のアンディ・ラウの名曲」、T3は「アンディ・ラウの名曲『来生縁』」、T4は「アンディ・ラウ誕生の日、彼のこの映画を見返すことで、彼の演技に対する再認識が得られるに違いない」、Q1は「アンディ・ラウの曲」、Q2は「アンディ・ラウの名曲」、Q3は「アンディ・ラウの映画・テレビ局」を表す。
【0048】
上記の実施形態によれば、ノードとノードとの間の関係を発掘することを通して1つの意味クラスタの意図を取得することができる。ノードとノードとの間に基づいて構築されたテキストグラフを訓練サンプルとすることで、訓練された目的モデルがノード自身とその周辺ノードの意味情報を捕捉し、各ノードの意味集約表現を取得することができ、このとき、ノードの表現は、ノード自身と近隣ノードとのクラスタを集約した表現であり、より正確な意味集約表現を出力することができる。
【0049】
なお、推薦すべき候補検索語を予測するスタートアップ応用において、テキストグラフを構築する必要はなく、決定された現在ノードの第1テキスト情報及び近隣ノードの第2テキスト情報を該目的モデルに入力するだけで、該目的モデルによりテキスト集約特徴が出力される。
【0050】
本開示の実施形態では、上記のいずれかの方法を実現すると共に、
図4に示すように、目的モデルを訓練する方法は、以下を含むことができる。
【0051】
ステップS31において、訓練サンプルにおけるサンプル検索語を、プリセットモデルにおけるプリセット第1ネットワークモデルに入力し、プリセットモデルにおけるプリセット第1ネットワークモデルにより出力された、サンプル検索語を現在ノードとする現在ノードの近隣ノード、及び現在ノードと近隣ノードとの間の関係を得る。
【0052】
ステップS32において、現在ノードの第1テキスト情報及び近隣ノードの第2テキスト情報を、プリセットモデルにおけるプリセット第2ネットワークモデルに入力し、プリセット第2ネットワークモデルにより出力された、現在ノードの第1意味表現及び近隣ノードの第2意味表現を得る。
【0053】
ステップS33において、現在ノードにおける第1意味表現及び近隣ノードにおける第2意味表現を、プリセットモデルにおけるプリセット第3ネットワークモデルに入力し、プリセット第3ネットワークモデルにより出力された、サンプル検索語の意味集約表現を得る。
【0054】
ステップS34において、サンプル検索語を現在ノードとする現在ノードの近隣ノード、及び現在ノードと近隣ノードとの間の関係、サンプル検索語の意味集約表現、訓練サンプルにおける各ノードの意味集約表現ラベル、及びノードとノードとの間の関係のラベルに基づき、損失関数を決定する。
【0055】
ステップS35において、損失関数に基づいてプリセットモデルを逆伝導して更新し、目的モデルを得る。
【0056】
プリセットモデルを訓練する前に、まず構築されたテキストグラフに基づいて訓練サンプルを構造し、グラフ学習と意味表現を組み合わせた技術を用いて上記のプリセットモデルに対して訓練を行う必要がある。ここで、正負のサンプルはそれぞれ以下となる。
【0057】
正のサンプル:テキストグラフでエッジを持つ2つのノード。
負のサンプル:テキストグラフでエッジを持たない2つのノード。
【0058】
ここで、エッジを持つとは、2つのノード間に関係があることを意味し、エッジを持たないとは、2つのノード間に関係がないことを意味する。
【0059】
図5は、意味集約表現を取得する概略図を示し、テキストグラフの構図関係に基づいて、1つの意味クラスタの意図を取得したことに相当する。各ノードは、自身とその周辺ノードの意味情報とを同時に捕捉し、各ノードの意味表現ベクトルを取得するとき、ノードの意味表現は、ノード自身と近隣ノートとのクラスタを集約した表現、即ち意味集約表現である。訓練された目的モデルを通して予測プロセスを実行し、各ノードの意味表現ベクトルを取得することができ、このときのノードの意味表現は、ノード自身と近隣ノートとのクラスタを集約した意味表現であるため、この集約された意味表現を通してインデックスリコールすることを行うことにより、ユーザの検索意図をより正確に捕捉し、ユーザの検索意図に関連する拡張検索語をリコールすることができる。
【0060】
入力された目的検索語に基づいてより正確な推薦すべき候補検索語を決定するため、候補検索語集合を事前に作成する必要があり、本開示の実施形態では、上記のいずれかの方法を実現することを基に、
図6に示すように、以下のステップをさらに含むことができる。
【0061】
ステップS41において、目的検索語の検索頻度、結果ページ提示数及びクリック数の統計的特徴に基づいて、候補検索語を選別する。
【0062】
ステップS42において、選別された候補検索語に基づいて、候補検索語集合を作成する。
【0063】
ここで、検索頻度とは、ある時間内におけるある検索語又はある検索語らを検索した回数である。例えば、1日の間に「アンディ・ラウ」を検索した回数は100回である場合、検索語「アンディ・ラウ」の検索頻度は100となる。
【0064】
ここで、結果ページ提示数とは、検索語がプリセットウェブサイトにおける結果ページ提示数であり、例えば、公式ウェブサイトや口コミの良い民間のウェブサイトなどの統計的価値のあるプリウェブサイトを含む。例えば、結果ページ提示数は、公式サイトにおける又は、良質な著者の文章における提示回数であってもよい。
【0065】
ここで、クリック数とは、ある時間内にある検索語又はある検索語らがクリックされた回数である。
【0066】
上記の実施形態において、目的検索語の検索頻度、プリセットウェブサイトの結果ページ提示数、及びクリック数の統計的特徴に基づいて、候補検索語を選別することで、候補検索語集合におけるすべての候補検索語が良質な候補検索語となるようにし、また、候補検索語集合は、ユーザの検索意図を上書きする上書き能力がさらに高いため、該検索語集合からユーザの検索意図により合致した推薦すべき候補検索語をリコールすることを容易にし、ユーザにより正確な推薦すべき候補検索語を提供することができる。
【0067】
本開示の実施形態では、上記のいずれかの方法を実現することを基に、
図7に示すように、選別された候補検索語に基づいて、候補検索語集合を作成することは、以下のステップを含む。
【0068】
ステップS421において、選別されたすべての候補検索語に対して、目的モデルを通して、すべての候補検索語の意味集約表現を予測する。
【0069】
ステップS422において、すべての候補検索語の意味集約表現に基づき、ANNインデックスライブラリを作成する。
【0070】
上記の実施形態において、すべての候補検索語の意味集約表現に基づき、ANNインデックスライブラリを作成し、近傍検索サービスに基づき推薦すべき候補検索語をリコールするための支援を提供し、リコール速度を向上することで、ユーザの検索体験を向上する。
【0071】
本開示の実施形態において、上記のいずれかの方法を実現することを基に、いくつかの実施形態において、
図8に示すように、ステップS15において、意味集約表現をインデックスとし、候補検索語集合から推薦すべき候補検索語をリコールすることは、以下のステップを含む。
【0072】
ステップS151において、意味集約表現をインデックスとし、意味集約表現とANNインデックスライブラリにおける意味集約表現の類似度を決定する。
【0073】
ステップS152において、類似度が上位N位までの意味集約表現を目的意味集約表現として決定し、Nの値は正の整数である。
【0074】
ステップS153において、目的意味集約表現の対応する候補検索語を、推薦すべき候補検索語としてリコールする。
【0075】
ここで、Nの値は、ユーザのニーズや設計のニーズ、端末タイプに基づいて設定することができる。
【0076】
上記の実施形態において、テキスト集合特徴の類似度を計算することを通して上位N位までの目的テキス集約特徴を決定し、目的テキスト集約特徴の対応する候補検索語を推薦すべき候補検索語として決定することで、候補検索語集合からユーザの検索意図により合致した候補検索語を呼び出せるようにし、目的検索語の入力が不正確、不精確又は検索語が非高頻度の検索語であるために検索効果がよくない問題の解決に役立つ。
【0077】
図9は、検索語推薦のアーキテクチャ概略図を示し、
図9から分かるように、該アーキテクチャは、意味集約表現学習及びリコールシステムの2つの部分を主に含む。ここで、意味集約表現学習の部分は、主に訓練サンプルに基づいてプリセットモデルを訓練し、訓練された目的モデルを通して検索語の意味集約表現を得ることを担う。リコールシステムの部分は、主に近傍検索サービス(ANN)に基づいて、候補ワード集合から検索語の意味集約表現と類似度の高い候補検索語をリコールし、最終的にユーザ端末に提示することを担う。具体的に、意味集約表現学習も2つの部分に分かれ、1つ目の部分は、サンプル工程部分であり、主にユーザによるインタラクション行為に基づき、検索ログから複数のノード及び複数のノードにおけるノードとノードとの間の関係(エッジ関係と記すことができる)を発掘し、ノード及びノードとノードとの間のエッジ関係に基づいて、テキストグラフを構築することを担う。2つ目の部分は、目的モデル部分であり、主にすべてのノードの意味集約表現を取得することを担う。ここで、目的モデルは、グラフ分析モデルと意味表現モデルとを含み、グラフ分析モデルを通じてノードの多段近隣ノードを獲得する。意味表現モデルを通して、ノード自身及び近隣ノートの意味表現を取得する。さらに、目的モデルは、ノード自身及び近隣ノートに対するテキスト情報に対して集約表現処理を行い、意味集約表現を得る。例示的に、グラフ分析モデルは、グラフ畳み込みニューラルネットワーク(Graph Convolutional Network、 GCN)を用いて、意味表現モデルは、知識強化の意味表現モデル(Enhanced Representation from knowledge Integration 、ERNIE)を用いる。このように、検索シーンにおけるユーザの行動特徴とテキスト特徴を十分に発掘することにより、意味表現とグラフ学習とを組み合わせて、検索語の意味集約表現を集約し、近傍検索サービスに基づき推薦すべき候補検索語をリコールすることにより、ユーザの検索意図をより正確に捉えることができ、既存の他の手法よりもリコール能力が高く、より意図に合った推薦結果をリコールすることができる。
【0078】
図9に示されるアーキテクチャ図は、選択可能な具体的な実施形態であり、当業者は、
図9の例に基づいて様々な自明の変更及び/又は代替を行うことができ、得られる技術方案は、本開示の実施形態の開示範囲として属することを理解すべきである。
【0079】
本開示による検索語の推薦方法は、検索インデックスや検索推薦などの項目に用いることができる。例示的に、方法の実行主体は、検索インデックスサーバのような様々な検索インデックスデバイスである電子デバイスであってもよい。
【0080】
上記の各方法の実現として、本開示は、検索語の推薦装置をさらに提供する。
図10は、検索語の推薦装置の概略図である。
図10に示すように、装置は、以下のモジュールを備える。
【0081】
取得モジュール710において、入力された目的検索語を取得する。
【0082】
第1決定モジュール720において、目的検索語を現在ノードとし、現在ノードの近隣ノード、及び現在ノードと近隣ノードとの間の関係を決定する。
【0083】
第2決定モジュール730において、現在ノードの第1テキスト情報及び近隣ノードの第2テキスト情報に対してそれぞれ意味表現処理を行い、現在ノードの第1意味表現及び近隣ノードの第2意味表現を得る。
【0084】
集約表現モジュール740において、第1意味表現及び第2意味表現、ならびに現在ノードと近隣ノードとの間の関係に基づき、目的検索語の意味集約表現を決定する。
【0085】
リコールモジュール750において、意味集約表現をインデックスとし、候補検索語集合から推薦すべき候補検索語をリコールする。
【0086】
いくつかの実施形態において、
図11に示すように、該装置は、さらに以下のモジュールを備える。
【0087】
集合作成モジュール760において、目的検索語の検索頻度、結果ページ提示数及びクリック数の統計的特徴に基づいて、候補検索語を選別し、選別された候補検索語に基づいて、候補検索語集合を作成する。
【0088】
いくつかの実施形態において、候補検索語集合は、近傍検索サービス(ANN)インデックスライブラリの形式で存在し、集合作成モジュール760は、
選別されたすべての候補検索語に対して、すべての候補検索語の意味集約表現を予測することと、
すべての候補検索語の意味集約表現に基づき、近傍検索サービスANNインデックスライブラリを作成することと、にさらに用いられる。
【0089】
いくつかの実施形態において、リコールモジュール750は、
意味集約表現をインデックスとし、意味集約表現とANNインデックスライブラリにおける意味集約表現の類似度を決定することと、
類似度が上位N位までの意味集約表現を目的意味集約表現として決定することと、
目的意味集約表現の対応する候補検索語を、推薦すべき候補検索語としてリコールすることと、に用いられ、Nの値は正の整数である。
【0090】
本開示の実施形態の装置における各モジュールの機能は、上記の検索語の推薦方法における対応する記述を参照してもよく、ここでは再度言及しない。
【0091】
本開示の検索語の推薦装置は、目的検索語を現在ノードとし、現在ノードの近隣ノードを決定することと、現在ノードの第1テキスト情報及び近隣ノードの第2テキスト情報に基づき、目的検索語の意味集約表現を決定することと、意味集約表現をインデックスとし、候補検索語集合から推薦すべき候補検索語をリコールすることと、を含む。現在ノードの対応する意味表現のみに基づいて候補検索語を決定することに対して、意味集約表現は、現在ノードと近隣ノートとを有するクラスタを集約した意味表現であるため、ユーザが入力した目的検索語が不確定又は不正確であるなどの問題により、検索操作に生じた検索効果が悪いという問題を解決し、より正確な推薦すべき候補検索語をリコール、ユーザが推薦された候補検索語に基づいて検索を行うことに役立ち、検索操作のプロセスを簡略化し、検索の難易度を低減し、ユーザの検索効率を向上することで、ユーザの検索体験を向上する。
【0092】
上記の各方法の実現として、本開示はさらに、目的モデルの訓練装置を提供する。
図12は、目的モデルの訓練装置の概略図である。
図12に示すように、装置は、以下のモジュールを備える。
【0093】
第1情報決定モジュール810において、訓練サンプルにおけるサンプル検索語を、プリセットモデルにおけるプリセット第1ネットワークモデルに入力し、プリセットモデルにおけるプリセット第1ネットワークモデルにより出力された、サンプル検索語を現在ノードとする現在ノードの近隣ノード、及び現在ノードと近隣ノードとの間の関係を得る。
【0094】
第2情報決定モジュール820において、現在ノードの第1テキスト情報及び近隣ノードの第2テキスト情報を、プリセットモデルにおけるプリセット第2ネットワークモデルに入力し、プリセット第2ネットワークモデルにより出力された、現在ノードの第1意味表現及び近隣ノードの第2意味表現を得る。
【0095】
第3情報決定モジュール830において、現在ノードにおける第1意味表現及び近隣ノードにおける第2意味表現を、プリセットモデルにおけるプリセット第1ネットワークモデルに入力し、プリセット第1ネットワークモデルにより出力された、サンプル検索語の意味集約表現を得る。
【0096】
訓練モジュール840において、サンプル検索語を現在ノードとする現在ノードの近隣ノード、及び現在ノードと近隣ノードとの間の関係、サンプル検索語の意味集約表現、訓練サンプルにおける各ノードの意味集約表現ラベル、及びノードとノードとの間の関係のラベルに基づき、損失関数を決定し、損失関数に基づいてプリセットモデルを逆伝導して更新し、目的モデルを得る。
【0097】
いくつかの実施形態において、
図13に示すように、該装置はさらに、以下のモジュールを備える。
【0098】
サンプル収集モジュール850において、ユーザによるインタラクション行為に基づき、検索ログから複数のノード及び複数のノードにおけるノードとノードとの間の関係を発掘し、複数のノード及び複数のノードにおけるノードとノードとの間の関係に基づいて、テキストグラフを構築し、テキストグラフに基づき、訓練サンプルを生成する。ノードは、サンプル検索語及びサンプルウェブページタイトルのうちの少なくとも1種類のノードを含む。
【0099】
いくつかの実施形態において、サンプル収集モジュール850が、複数のノードにおけるノードとノードとの間の関係を決定する方法は、
サンプル検索語とサンプル検索語との間の第1種関係を決定すること、
サンプル検索語とサンプルウェブページタイトルとの間の第2種関係を決定すること、
サンプルウェブページタイトルとサンプルウェブページタイトルとの間の第3種関係を決定することの少なく1つを含む。
【0100】
いくつかの実施形態において、サンプル収集モジュール850としては、具体的に、
複数のノードにおけるノードとノードとの間の関係を決定する方法は、
2つのサンプル検索語が1つの検索時間領域に同時に出現する共起関係、2つのサンプル検索語が共通して同一のサンプルウェブページタイトルを提示する共展関係、及び2つのサンプル検索語が共通して同一のサンプルウェブページタイトルをクリックする共点関係のうちの少なくとも1つを、サンプル検索語とサンプル検索語との間の第1種関係として決定することと、
1つの検索語を検索するシーンにおいてサンプルウェブページタイトルに対してリコール提示を有する提示関係、1つのサンプル検索語を検索するシーンにおいてウェブページタイトルをクリックするクリック関係、及びサンプル検索語とウェブページタイトルとがテキスト包含関係を有するテキストマッチング関係の少なくとも1つを、サンプル検索語とサンプルウェブページタイトルとの間の第2種関係として決定することと、
同じ検索において同時に提示される2つのサンプルウェブページタイトルの共展関係、及び同じ検索において同時にクリックされる2つのサンプルウェブページタイトルの共点関係のうちの少なくとも1つを、サンプルウェブページタイトルとサンプルウェブページタイトルとの間の第3種関係として決定することと、のうちの少なくとも1つを含む。
【0101】
本開示の実施形態による各モジュールの機能は、上記の目的モデルの訓練方法において対応する記述を参照することができ、ここでは再度言及しない。
【0102】
本開示の目的モデルの訓練装置は、目的モデルに意味集約表現を出力させることができる。
【0103】
本開示の実施形態によれば、本開示は、電子デバイス、可読記憶媒体及びコンピュータプログラム製品をさらに提供する。
【0104】
図14に示すよう、本開示の実施形態による検索語の推薦方法を実現するための電子デバイスのブロック図である。電子デバイスは、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータのような様々な形態のデジタルコンピュータを表すことができる。また、電子デバイスは携帯情報端末、携帯電話、スマートフォン、装着可能デバイス、及びその他の類似のコンピューティングデバイスなどの様々な形態のモバイルデバイスを表すことができる。ここで示した構成要素、それらの接続と関係、及びそれらの機能は例示的なものに過ぎず、本開示で説明されたもの及び/又は要求される本開示の実施を制限することは意図されない。
【0105】
図14に示すよう、当該電子デバイスは、1つ又は複数のプロセッサ901と、メモリ902と、高速インターフェースと低速インターフェースとを含む各構成要素を接続するためのインターフェースとを含む。各構成要素は、異なるバスを利用して互いに接続し、共通のマザーボードに取り付けられてもよいし、必要に応じて他の方法で取り付けられてもよい。プロセッサは、電子デバイス内で実行される命令を処理してもよく、また、外部入出力デバイス(例えば、インターフェースに接続された表示デバイス)にグラフィックユーザインターフェース(Graphical User Interface、GUI)を表示するための、メモリ又はメモリ上に記憶されたグラフィカル情報の命令を含む。他の実施形態において、必要に応じて、複数のプロセッサ及び/又は複数のバスを複数のメモリ及び複数のメモリとともに使用することができる。同様に、複数の電子デバイスを接続してもよく、各デバイスは、部分的に必要な動作、例えば、サーバアレイ、ブレードサーバの集合、又はマルチプロセッサシステムとして、提供する。
図14においてプロセッサ901を例とする。
【0106】
メモリ902は、本開示にて提供された非一過性のコンピュータ可読記憶媒体である。メモリは、本開示で提供される検索語の推薦方法を少なくとも1つのプロセッサに実行させるように、少なくとも1つのプロセッサによって実行されることができる命令を記憶する。本開示における非一過性のコンピュータ可読記憶媒体は、本開示で提供された検索語の推薦方法をコンピュータに実行させるためのコンピュータ命令を記憶する。
【0107】
メモリ902は、非一過性のコンピュータ可読記憶媒体として、非一過性のソフトウェアプログラム、非一過性のコンピュータ実行可能なプログラム及びモジュールを記憶するために使用されてもよく、例えば、本開示の実施形態における検索語の推薦方法に対応するプログラム命令/モジュールである。プロセッサ901は、メモリ902に記憶されている非一過性のソフトウェアプログラム、命令及びモジュールを実行することにより、サーバの様々な機能アプリケーション及びデータ処理、即ち上記した方法に関する実施形態に係る検索語の推薦方法を実行する。
【0108】
メモリ902は、オペレーティングシステムや少なくとも1つの機能に必要なアプリケーションを記憶することができるプログラムの記憶領域と、検索語の推薦方法に係る電子デバイスの使用によって生成されたデータなどを記憶することができるデータの記憶領域と、を含むことができる。さらに、メモリ902は、高速ランダムアクセスメモリを含んでもよく、非一過性の固体記憶装置を含んでもよい。例えば、少なくとも1つの磁気ディスク記憶装置、フラッシュメモリ装置、又は他の非一過性の固体記憶装置を含むことができる。いくつかの実施形態において、メモリ902はオプションとして、プロセッサ901に対して遠隔的に設定されたメモリを含み、これらの遠隔メモリは、ネットワークを介して検索語の推薦方法に係る電子デバイスに接続されてもよい。上記のネットワークの例は、インターネット、企業内ネットワーク、ローカルネットワーク、モバイル通信ネットワーク及びその組み合わせを含むが、これらに限定されない。
【0109】
本開示の実施形態の検索語の推薦方法に対応する電子デバイスは、入力装置903と出力装置904とをさらに含むことができる。プロセッサ901、メモリ902、入力装置903、及び出力装置904は、バス又は他の方法で接続されてもよく、
図14ではバスを介して接続されている。
【0110】
入力装置903は、入力された数字又は文字を受信し、検索語の推薦方法に係る電子デバイスのユーザ設定及び機能制御に関するキー信号入力を生成することができ、例えば、タッチパネル、キーパッド、マウス、トラックボード、タッチパッド、指示棒、1つ又は複数のマウスボタン、トラックボール、ジョイスティックなどを含むことができる。出力装置904は、表示装置、補助照明装置(例えばLED)、及び触覚フィードバック装置(例えば、振動モータ)などを含むことができる。この表示装置は、液晶ディスプレイ(Liquid Crystal Display、LCD)、発光ダイオード(Light Emitting Diode、LED)ディスプレイ及びプラズマディスプレイを含むことができるがこれらに限定されない。いくつかの実施形態では、表示装置はタッチパネルであってもよい。
【0111】
本開示の実施形態により、本開示は電子デバイスをさらに提供する。該デバイスは、
1つ又は複数のプロセッサと、
1つ又は複数のプログラムを記憶する記憶装置と、を備え、前記1つ又は複数のプログラムが前記1つ又は複数のプロセッサに実行されるとき、前記1つ又は複数のプロセッサが上記の実施形態における検索語の推薦方法を実現する。
【0112】
ここで、電子デバイスのプロセッサ及び記憶装置の機能及び実現方法は、上記の電子デバイスの実施形態におけるプロセッサ及び記憶装置の説明を参照することができる。
【0113】
本開示におけるシステム及び技術に係る様々な実施形態は、デジタル電子回路システム、集積回路システム、専用集積回路(Application Specific Integrated Circuits、ASIC)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はこれらの組み合わせによって実現されることができる。これらの様々な実施形態は、1つ又は複数のコンピュータプログラムにおいて実装されてもよく、この1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラム可能なシステム上で実行されてもよく、及び/又は解釈されてもよく、このプログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置より、データと命令を受信し、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置に、データと命令を送信する。
【0114】
これらの計算プログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードともいう)は、プログラマブルプロセッサのマシン命令を含み、過程指向及び/又はオブジェクト指向プログラミング言語、及び/又はアセンブリ/マシン言語を用いてこれらの計算プログラムを実施することができる。本開示で使用されるように、「機械可読媒体」及び「コンピュータ可読媒体」という用語は、マシン命令及び/又はデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、デバイス、及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ、編集可能論理デバイス(programmable logic device、PLD)を意味し、機械読み取り可能な信号としてのマシン命令を受信する機械可読媒体を含む。「機械読み取り可能な信号」という用語は、マシン命令及び/又はデータをプログラマブルプロセッサに提供するための任意の信号を意味する。
【0115】
ユーザとのインタラクションを提供するために、本開示で説明されているシステムや技術は、コンピュータ上で実施されてもよく、また、ユーザに情報を表示するための表示装置(例えば、CRT(Cathode Ray Tube、ブラウン管)又はLCD(液晶ディスプレイ)モニタ)と、入力をコンピュータに提供するためのキーボード及びポインティングデバイス(例えば、マウス又はトラックボール)とを備えてもよい。他の種類の装置も、ユーザとのインタラクションを提供するために使用され得る。例えば、ユーザに提供されたフィードバックは、任意の形態のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、ユーザからの入力は、いかなる形式(音響入力、音声入力、又は触覚入力を含む)で受信されてもよい。
【0116】
本開示で説明されているシステム及び技術は、バックグラウンド構成要素を含む計算システム(例えば、データサーバとして)、又は中間部構成要素を含む計算システム(例えば、アプリケーションサーバ)、又は、フロントエンド構成要素を含む計算システム(例えば、グラフィカルユーザインタフェース又はネットワークブラウザを備えたユーザコンピュータであって、ユーザがこのグラフィカルユーザインタフェース又はネットワークブラウザを介して本開示で説明されたシステム及び技術に係る実施形態とインタラクションを行うことができるユーザコンピュータ)に実行されてもよく、又は、このようなバックグラウンド構成要素、中間部構成要素、又はフロントエンド構成要素の任意の組合せを含む計算システムにおいて実行されてもよい。システムの構成要素は、任意の形態又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によって相互に接続されてもよい。通信ネットワークの例えとして、ローカルネットワーク(Local Area Network、LAN)、広域ネットワーク(Wide Area Network、WAN)及びインターネットを含む。
【0117】
コンピュータシステムは、クライアント及びサーバを含むことができる。クライアントとサーバは一般的に相互に離れており、通信ネットワークを介してインタラクションを行う。クライアントとサーバとの関係を持つコンピュータプログラムがそれぞれのコンピュータ上で実行されることによって、クライアントとサーバとの関係は構築される。
【0118】
本実施形態の技術方案により、目的検索語を現在ノードとし、現在ノードの近隣ノードを決定することと、現在ノードの第1テキスト情報及び近隣ノードの第2テキスト情報に基づき、目的検索語の意味集約表現を決定することと、意味集約表現をインデックスとし、候補検索語集合から推薦すべき候補検索語をリコールすることと、を含む。現在ノードの対応する意味表現のみに基づいて候補検索語を決定することに対して、意味集約表現は、現在ノードと近隣ノートとを有するクラスタを集約した意味表現であるため、入力された目的検索語が不確定又は不正確であるなどの問題により、検索操作に生じた検索効果が悪いという問題を解決し、より正確な推薦すべき候補検索語をリコール、ユーザが推薦された候補検索語に基づいて検索を行うことに役立ち、検索操作のプロセスを簡略化し、検索の難易度を低減し、ユーザの検索効率を向上することで、ユーザの検索体験を向上する。
【0119】
上記の様々な態様のフローを使用して、ステップを新たに順序付け、追加、又は削除することが可能であることを理解すべきである。例えば、本開示で記載された各ステップは、並列に実行しても良いし、順次に実行しても良いし、異なる順序で実行しても良い。本開示で開示された技術案が所望する結果を実現することができる限り、本開示ではこれに限定されない。
【0120】
上記の具体的な実施形態は、本開示の保護範囲に対する限定を構成するものではない。当業者は、設計事項やその他の要因によって、様々な修正、組み合わせ、サブ組み合わせ、及び代替が可能であることを理解するべきである。本開示の要旨及び原則内における変更、均等な置換及び改善等は、いずれも本開示の保護範囲に含まれるべきである。