(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-02-10
(45)【発行日】2023-02-20
(54)【発明の名称】情報推薦方法及び装置、電子機器
(51)【国際特許分類】
G06F 16/9536 20190101AFI20230213BHJP
G06F 16/28 20190101ALI20230213BHJP
【FI】
G06F16/9536
G06F16/28
(21)【出願番号】P 2020525901
(86)(22)【出願日】2019-11-22
(86)【国際出願番号】 CN2019120290
(87)【国際公開番号】W WO2021082123
(87)【国際公開日】2021-05-06
【審査請求日】2020-04-23
(31)【優先権主張番号】201911032556.8
(32)【優先日】2019-10-28
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】520145311
【氏名又は名称】蘇州躍盟信息科技有限公司
【氏名又は名称原語表記】SUZHOU DEEPLEAPER INFORMATION AND TECHNOLOGY COMPANY LIMITED
【住所又は居所原語表記】ROOM 605, BLD.B, NANOTECHNOLOGY UNIVERSITY SCIENCE PARK, NO.388, RUOSHUI RD, INDUSTRIAL PARK, SUZHOU, JIANGSU 215123, PEOPLE’S REPUBLIC OF CHINA
(74)【代理人】
【識別番号】110001195
【氏名又は名称】弁理士法人深見特許事務所
(72)【発明者】
【氏名】陳 穎 祥
(72)【発明者】
【氏名】王 風 雷
(72)【発明者】
【氏名】李 東 軍
【審査官】甲斐 哲雄
(56)【参考文献】
【文献】国際公開第2012/160693(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
(57)【特許請求の範囲】
【請求項1】
コンピュータシステムが、異なるキーワードで得られる検索結果に対応する複数のサブ検索関係グラフを含み、各前記サブ検索関係グラフがキーワードで検索されたリンク先ウェブページノードを指す接続有向辺を少なくとも1つを含む検索関係グラフを作成することと、
前記コンピュータシステムが、検索対象となる目的キーワードを受け取ることと、
前記コンピュータシステムが、前記検索関係グラフから、前記目的キーワードに対応する全てのリンク先ウェブページノードと各前記リンク先ウェブページノードの重み値をクエリして、前記重み値により順序付けられた複数の推薦情報を含む目的検索リストを決定することと、
前記コンピュータシステムが、前記目的検索リストを表示することと、を含み、
前記コンピュータシステムが、検索関係グラフを作成するステップは、
前記コンピュータシステムが、履歴過程において各ユーザに対応する検索開始から検索終了までの全てのセッション制御メモが記録された履歴検索情報の全てを取得することと、
前記コンピュータシステムが、前記履歴検索情報中の各セッション制御メモを抽出し、全てのサブ検索関係グラフを決定することと、
前記コンピュータシステムが、全てのサブ検索関係グラフを総合して、サブ検索関係グラフの集合を取得することと、
前記コンピュータシステムが、キーワードの関連関係により、全ての前記サブ検索関係グラフを合併して、前記検索関係グラフを取得することと、を含み、
前記コンピュータシステムが、キーワードの関連関係により、全ての前記サブ検索関係グラフを合併して、前記検索関係グラフを取得するステップは、
前記コンピュータシステムが、各サブ検索関係グラフの各有向辺を決定することと、
前記コンピュータシステムが、有向辺に対して重複削除処理を行うことと、
前記コンピュータシステムが、キーワードの関連関係により、全ての有向辺を合併することと、
前記コンピュータシステムが、全ての有向辺に対して正規化処理を行って、前記検索関係グラフを取得することと、を含む情報推薦方法。
【請求項2】
前記コンピュータシステムが、前記履歴検索情報中の各セッション制御メモを抽出し、全てのサブ検索関係グラフを決定するステップは、
前記コンピュータシステムが、各前記セッション制御メモのうち、検索開始から検索終了までの過程において記録された全ての検索キーワード及びクリックされたウェブページを抽出することと、
前記コンピュータシステムが、時系列を基準として、各前記検索キーワード間の有向辺を確立すると共に、各検索キーワードに対応するクリックされたウェブページのリンク識別子を与えることと、
前記コンピュータシステムが、前記有向辺と前記リンク識別子で各サブ検索関係グラフを作成して、全てのサブ検索関係グラフを取得することとを含む請求項1に記載の方法。
【請求項3】
前記コンピュータシステムが、前記履歴検索情報中の各セッション制御メモを抽出するステップは、
前記コンピュータシステムが、各セッション制御メモの開始時間、終了時間、前記開始時間に対応する検索初期キーワード、及び前記終了時間に対応する検索終了キーワードを決定することと、
前記コンピュータシステムが、前記検索初期キーワードと前記検索終了キーワードに基づいて、前記履歴検索情報中の各セッション制御メモを分割することとを含む請求項1に記載の方法。
【請求項4】
前記コンピュータシステムが、検索関係グラフを作成した後、前記方法は、さらに、
前記コンピュータシステムが
、PageRankアルゴリズ
ムに従って、各検索キーワードの重みを前処理することと、
前記コンピュータシステムが、各検索キーワードの重みとリンク先ウェブページ内容に基づいて、各リンク先ウェブページノードの重み値を決定することとを含む請求項1に記載の方法。
【請求項5】
前記コンピュータシステムが、目的検索リストを決定するステップは、
前記コンピュータシステムが、前記検索関係グラフから、前記目的キーワードに対応する全てのリンク先ウェブページノードを捜すことと、
前記コンピュータシステムが、各前記リンク先ウェブページノードの重み値をクエリすることと、
前記コンピュータシステムが、重み値により全てのリンク先ウェブページノードを順序付けることと、
前記コンピュータシステムが、各リンク先ウェブページノードに対応する推薦キーワード及び/又は推薦センテンスをクエリして、前記推薦情報を得ると共に、前記目的検索リストを決定することとを含む請求項1に記載の方法。
【請求項6】
異なるキーワードで得られる検索結果に対応する複数のサブ検索関係グラフを含み、各前記サブ検索関係グラフがキーワードで検索されたリンク先ウェブページノードを指す接続有向辺を少なくとも1つを含む検索関係グラフを作成するように構成される構築ユニットと、
検索対象となる目的キーワードを受け取るように構成される受け取りユニットと、
前記検索関係グラフから前記目的キーワードに対応する全てのリンク先ウェブページノードと各前記リンク先ウェブページノードの重み値をクエリして、前記重み値により順序付けられた複数の推薦情報を含む目的検索リストを決定するように構成される決定ユニットと、
前記目的検索リストを表示するように構成される表示ユニットと、を含み、
前記構築ユニットは、
履歴過程において各ユーザに対応する検索開始から検索終了までの全てのセッション制御メモが記録された履歴検索情報の全てを取得し、
前記履歴検索情報中の各セッション制御メモを抽出し、全てのサブ検索関係グラフを決定し、
全てのサブ検索関係グラフを総合して、サブ検索関係グラフの集合を取得し、
キーワードの関連関係により、全ての前記サブ検索関係グラフを合併して、前記検索関係グラフを取得するように構成され、
前記構築ユニットは、
各サブ検索関係グラフの各有向辺を決定し、
有向辺に対して重複削除処理を行い、
キーワードの関連関係により、全ての有向辺を合併し、
全ての有向辺に対して正規化処理を行って、前記検索関係グラフを取得するように構成される情報推薦装置。
【請求項7】
プロセッサと、
前記プロセッサの実行可能な命令を記憶するように構成されるメモリとを含む電子機器であって、
前記プロセッサは、前記実行可能な命令を実行することにより、請求項1~5のいずれか一項に記載の情報推薦方法を実行するように構成される電子機器。
【請求項8】
記憶されたプログラムを含み、前記プログラムが実行される場合、所在する装置を制御して請求項1~5のいずれか一項に記載の情報推薦方法を実行する、記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本願は、2019年10月28日に中国国家知識産権局に提出された、出願番号201911032556.8、発明の名称「情報推薦方法及び装置、電子機器」の中国特許出願の優先権を主張し、その全ての内容は、参照により本願に組み込むものとする。
【0002】
本開示は、情報処理の技術分野に関し、具体的には、情報推薦方法及び装置、電子機器に関する。
【背景技術】
【0003】
関連技術では、ネットワークの発展に伴って、ユーザはますます検索エンジンに依存して情報を取得するようになっているが、ユーザの知識レベルが違い、検索対象に対する理解も異なるため、ユーザがより長い経路を通って所望の内容を取得する場合がある。したがって、各大手の検索エンジンは、いずれも関連検索エントリを提供し、ユーザの検索内容に関連する検索query(推薦キーワードと理解してよい)を提供してユーザに選択させる。現在、関連検索の一般的な方法は、ユーザの検索queryから主要単語を抽出し、1つ以上の主要単語を抽出した後、プラットフォームからこれらの主要単語を含む全ての検索queryを関連検索リストの候補集合として抽出し、その後に、候補集合中の各単語の最近検索総頻度、該ユーザの検索queryとの間の関連度に対して重み付け加算を行って各単語のスコアを得て、スコアが高い順に関連検索の推薦内容とすることである。
【0004】
しかしながら、このような関連検索を行う推薦は、ユーザの履歴検索頻度、及びユーザの検索queryとの関連度を考慮するが、ユーザが自分の検索したい内容を上手く表現できない場合に、形容詞、質問応答式のquery、又は検索対象と僅かに関連する単語で検索する状況を無視しており、このようにqueryキーワードを抽出すると、キーワードはユーザの本当の検索意図に合致しない可能性が高く、ユーザの検索意図を正確に把握することができない。
【0005】
上記問題に対して、まだに効果的な解決手段を提供されていない。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本開示の実施例は、情報推薦方法及び装置、電子機器を提供して、関連技術における、情報推薦においてユーザの検索意図を正確に把握せず、推薦誤差が大きくなるという技術的課題を少なくとも解決する。
【課題を解決するための手段】
【0007】
本発明の実施例の一態様によれば、異なるキーワードで得られる検索結果に対応する複数のサブ検索関係グラフを含み、各前記サブ検索関係グラフがキーワードで検索されたリンク先ウェブページノードを指す接続有向辺を少なくとも1つを含む検索関係グラフを作成することと、検索対象となる目的キーワードを受け取ることと、前記検索関係グラフから前記目的キーワードに対応する全てのリンク先ウェブページノードと各前記リンク先ウェブページノードの重み値をクエリして、前記重み値により順序付けられた複数の推薦情報を含む目的検索リストを決定することと、前記目的検索リストを表示することと、を含む情報推薦方法を提供する。
【0008】
好ましくは、検索関係グラフを作成するステップは、履歴過程において各ユーザに対応する検索開始から検索終了までの全てのセッション制御メモが記録された履歴検索情報の全てを取得することと、前記履歴検索情報中の各セッション制御メモを抽出し、全てのサブ検索関係グラフを決定することと、全てのサブ検索関係グラフを総合して、サブ検索関係グラフの集合を取得することと、キーワードの関連関係により、全ての前記サブ検索関係グラフを合併して、前記検索関係グラフを取得することとを含む。
【0009】
好ましくは、前記履歴検索情報中の各セッション制御メモを抽出し、全てのサブ検索関係グラフを決定するステップは、各前記セッション制御メモのうち、検索開始から検索終了までの過程において記録された全ての検索キーワード及びクリックされたウェブページを抽出することと、時系列を基準として、各前記検索キーワード間の有向辺を確立すると共に、各検索キーワードに対応するクリックされたウェブページのリンク識別子を与えることと、前記有向辺と前記リンク識別子で各サブ検索関係グラフを作成して、全てのサブ検索関係グラフを取得することとを含む。
【0010】
好ましくは、前記履歴検索情報中の各セッション制御メモを抽出するステップは、各セッション制御メモの開始時間、終了時間、前記開始時間に対応する検索初期キーワード、及び前記終了時間に対応する検索終了キーワードを決定することと、前記検索初期キーワードと前記検索終了キーワードに基づいて、前記履歴検索情報中の各セッション制御メモを分割することとを含む。
【0011】
好ましくは、キーワードの関連関係により、全ての前記サブ検索関係グラフを合併して、前記検索関係グラフを取得するステップは、各サブ検索関係グラフの各有向辺を決定することと、有向辺に対して重複削除処理を行うことと、キーワードの関連関係により、全ての有向辺を合併することと、全ての有向辺に対して正規化処理を行って、前記検索関係グラフを取得することとを含む。
【0012】
好ましくは、検索関係グラフを作成した後、前記方法は、さらに、少なくともPageRankアルゴリズムを含む、予め設定されたページランクアルゴリズムに従って、各検索キーワードの重みを前処理することと、各検索キーワードの重みとリンク先ウェブページ内容に基づいて、各リンク先ウェブページノードの重み値を決定することとを含む。
【0013】
好ましくは、目的検索リストを決定するステップは、前記検索関係グラフから、前記目的キーワードに対応する全てのリンク先ウェブページノードを捜すことと、各前記リンク先ウェブページノードの重み値をクエリすることと、重み値により全てのリンク先ウェブページノードを順序付けることと、各リンク先ウェブページノードに対応する推薦キーワード及び/又は推薦センテンスをクエリして、前記推薦情報を得ると共に、前記目的検索リストを決定することとを含む。
【0014】
本発明の実施例の別の態様によれば、さらに、異なるキーワードで得られる検索結果に対応する複数のサブ検索関係グラフを含み、各前記キーワードで検索されたリンク先ウェブページノードを指す接続有向辺を少なくとも1つを含む検索関係グラフを作成するように構成される構築ユニットと、検索対象となる目的キーワードを受け取るように構成される受け取りユニットと、前記検索関係グラフから前記目的キーワードに対応する全てのリンク先ウェブページノードと各前記リンク先ウェブページノードの重み値をクエリして、前記重み値により順序付けられた複数の推薦情報を含む目的検索リストを決定するように構成される決定ユニットと、前記目的検索リストを表示するように構成される表示ユニットと、を含む情報推薦装置を提供する。
【0015】
好ましくは、前記構築ユニットは、履歴過程において各ユーザに対応する検索開始から検索終了までの全てのセッション制御メモが記録された全ての履歴検索情報を取得するように構成される第1の取得モジュールと、前記履歴検索情報中の各セッション制御メモを抽出し、全てのサブ検索関係グラフを決定するように構成される第1の抽出モジュールと、全てのサブ検索関係グラフを総合して、サブ検索関係グラフの集合を得るように構成される総合モジュールと、キーワードの関連関係により、全ての前記サブ検索関係グラフを合併して、前記検索関係グラフを得るように構成される第1の合併モジュールとを含む。
【0016】
好ましくは、前記第1の抽出モジュールは、各前記セッション制御メモのうち、検索開始から検索終了までの過程において記録された全ての検索キーワード及びクリックされたウェブページを抽出するように構成される第1の抽出サブモジュールと、時系列を基準として、各前記検索キーワード間の有向辺を確立すると共に、各検索キーワードに対応するクリックされたウェブページのリンク識別子を与えるように構成される第1の確立サブモジュールと、前記有向辺と前記リンク識別子で各サブ検索関係グラフを作成して、全てのサブ検索関係グラフを得るように構成される第2の確立サブモジュールとを含む。
【0017】
好ましくは、前記第1の抽出モジュールは、さらに、各セッション制御メモの開始時間、終了時間、前記開始時間に対応する検索初期キーワード、及び前記終了時間に対応する検索終了キーワードを決定するように構成される第1の決定サブモジュールと、前記検索初期キーワードと前記検索終了キーワードに基づいて、前記履歴検索情報中の各セッション制御メモを分割するように構成される分割サブユニットとを含む。
【0018】
好ましくは、前記第1の合併モジュールは、各サブ検索関係グラフの各有向辺を決定し、有向辺に対して重複削除処理を行うように構成される第2の決定サブモジュールと、キーワードの関連関係により、全ての有向辺を合併するように構成される第1の合併サブモジュールと、全ての有向辺に対して正規化処理を行って、前記検索関係グラフを得るように構成される正規化モジュールとを含む。
【0019】
好ましくは、前記情報推薦装置は、さらに、検索関係グラフを作成した後、少なくともPageRankアルゴリズムを含む、予め設定されたページランクアルゴリズムに従って、各検索キーワードの重みを前処理するように構成される前処理ユニットと、各検索キーワードの重みとリンク先ウェブページ内容に基づいて、各リンク先ウェブページノードの重み値を決定するように構成される第1の決定モジュールとを含む。
【0020】
好ましくは、前記決定ユニットは、前記検索関係グラフから、前記目的キーワードに対応する全てのリンク先ウェブページノードを捜すことと、各前記リンク先ウェブページノードの重み値をクエリすることと、重み値により全てのリンク先ウェブページノードに順序を付けることと、各リンク先ウェブページノードに対応する推薦キーワード及び/又は推薦センテンスをクエリして、前記推薦情報を得ると共に、前記目的検索リストを決定することとを含む。
【0021】
本発明の実施例の別の態様によれば、さらに、プロセッサと、前記プロセッサの実行可能な命令を記憶するように構成されるメモリとを含む電子機器であって、前記プロセッサは、前記実行可能な命令を実行することにより、上記いずれか一項に記載の情報推薦方法を実行するように構成される電子機器をさらに提供する。
【0022】
本発明の実施例の別の態様は、記憶されたプログラムを含み、前記プログラムが実行される場合、所在する装置を制御して上記いずれか一項に記載の情報推薦方法を実行する記憶媒体をさらに提供する。
【発明の効果】
【0023】
本発明の実施例では、まず、異なるキーワードで得られる検索結果に対応する複数のサブ検索関係グラフを含み、各サブ検索関係グラフがキーワードで検索されたリンク先ウェブページノードを指す接続有向辺を少なくとも1つを含む検索関係グラフを作成し、検索対象となる目的キーワードを受け取り、その後に、検索関係グラフから、目的キーワードに対応する全てのリンク先ウェブページノードと各リンク先ウェブページノードの重み値をクエリして、重み値により順序付けられた複数の推薦情報を含む目的検索リストを決定し、最後に、目的検索リストを表示することができる。該実施例では、ユーザがある分野を理解する過程が同じであることを利用することができ、関連検索の推薦において、ユーザ検索の行動系列とユーザ意図との関係を考慮し、履歴の検索行動系列により、履歴ユーザの本当の検索意図を把握すると共に、これらの履歴行動に基づいて新しいユーザがあるqueryを検索するときの本当の検索意図を推定し、ユーザの検索経路を短縮し、ユーザ体験を向上させ、かつ重み値を用いて推薦すべき検索リストを決定し、ユーザに最も所望される情報を見せることができ、関連技術における、情報推薦においてユーザの検索意図を正確に把握せず推薦誤差が大きいという技術的課題を解決する。
【0024】
ここで説明する図面は、本発明を一層理解させるためのもので、本願の一部を構成し、本発明の例示的な実施例及びその説明は、本発明を解釈するもので、本発明を限定するものではない。
【図面の簡単な説明】
【0025】
【
図1】本発明の実施例に係る好ましい情報推薦方法のフローチャートである。
【
図2】本発明の実施例に係る好ましい、各サブ検索関係グラフを決定する概略図である。
【
図3】本発明の実施例に係る別の好ましい、検索関係グラフを決定する概略図である。
【
図4】本発明の実施例に係る好ましい情報推薦装置の概略図である。
【発明を実施するための形態】
【0026】
当業者に本発明の技術手段をうまく理解させるために、以下、本発明の実施例における図面を組み合わせて、本発明の実施例における技術的解決手段を明確かつ完全に説明し、明らかに、説明される実施例は、本発明の一部の実施例に過ぎず、全ての実施例ではない。本発明における実施例に基づいて、当業者が創造的労働を行わずに得られる他の全ての実施例は、いずれも本発明の保護範囲に属すべきである。
【0027】
なお、本発明の明細書、特許請求の範囲及び上記図面に用いられる「第1」、「第2」などの用語は、類似する対象を区別するためのもので、特定の順又は前後順を限定するものではない。ここで説明する本発明の実施例を図面に示すか又は説明した順とは異なる順でも実現できるように、このように使用されるデータは適切な状況で交換可能であることを理解すべきである。また、「含む」、「有する」及びそれらの変形用語は、非排他的に含むことをカバーするものであり、例えば、一連のステップ又はユニットを含むプロセス、方法、システム、製品又は機器は、それらのステップ又はユニットを明確に例示したのに限定されず、明確に例示していない又はこれらのプロセス、方法、製品又は機器固有の他のステップ又はユニットを含んでもよいことを表す。
【0028】
本発明の下記実施例では、様々な検索エンジン、検索推薦ボックス、SEOにおける拡張検索語購入等のシーンに適用され、ユーザが入力ボックスにキーワード/センテンス/ファイルを入力した後、対応する推薦リスト情報をプッシュすることにより、ユーザは自分の所望の内容を迅速に見つけることができ、ユーザの検索意図により合致し、検索効率を向上させる。
【0029】
インターネットにおけるユーザの検索行動及び目的が異なり、かつ所定の分野において、ユーザが該分野を理解し把握する程度も異なるが、ユーザが該分野を理解する過程は同一であるため、ユーザはある問題に当たって検索エンジンにより解決する必要がある場合、その前に、他のユーザも同じ問題に当たって検索エンジンにより解決した確率が大きく、本発明の実施例はこのような分析方式で、所望の推薦情報をクエリして得る。
【0030】
本発明の実施例は、情報推薦方法の実施例を提供する。なお、図面のフローチャートに示されるステップは、一セットのコンピュータ実行可能な命令を含むコンピュータシステムにおいて実行でき、また、フローチャートにおいて論理的な順序が示されるが、幾つかの場合では、こことは異なる順序で、示されるか又は説明されるステップを実行してもよい。
【0031】
図1は、本発明の実施例に係る好ましい情報推薦方法のフローチャートであり、
図1に示すように、該方法は、
異なるキーワードで得られる検索結果に対応する複数のサブ検索関係グラフを含み、各サブ検索関係グラフがキーワードで検索されたリンク先ウェブページノードを指す接続有向辺を少なくとも1つを含む検索関係グラフを作成するステップS102と、
検索対象となる目的キーワードを受け取るステップS104と、
検索関係グラフから、目的キーワードに対応する全てのリンク先ウェブページノードと各リンク先ウェブページノードの重み値をクエリして、重み値により順序付けられた複数の推薦情報を含む目的検索リストを決定するステップS106と、
目的検索リストを表示するステップS108と、を含む。
【0032】
上記ステップにより、まず、異なるキーワードで得られる検索結果に対応する複数のサブ検索関係グラフを含み、各サブ検索関係グラフがキーワードで検索されたリンク先ウェブページノードを指す接続有向辺を少なくとも1つを含む検索関係グラフを作成し、検索対象となる目的キーワードを受け取り、その後に、検索関係グラフから、目的キーワードに対応する全てのリンク先ウェブページノードと各リンク先ウェブページノードの重み値をクエリして、重み値により順序付けられた複数の推薦情報を含む目的検索リストを決定し、最後に、目的検索リストを表示することができる。該実施例では、ユーザがある分野を理解する過程が同じであることを利用することができ、関連検索の推薦において、ユーザ検索の行動系列とユーザ意図との関係を考慮し、履歴の検索行動系列により、履歴ユーザの本当の検索意図を把握すると共に、これらの履歴行動に基づいて新しいユーザがあるqueryを検索するときの本当の検索意図を推定し、ユーザの検索経路を短縮し、ユーザ体験を向上させ、かつ重み値を用いて推薦すべき検索リストを決定し、ユーザに最も所望される情報を見せることができ、関連技術における、情報推薦においてユーザの検索意図を正確に把握せず推薦誤差が大きいという技術的課題を解決する。
【0033】
以下、各ステップを参照しながら本発明の実施例を詳細に説明する。
本発明の実施例では、検索関係グラフをGとして定義する。該検索関係グラフにより、入力された目的キーワードに対応する後続ノードと各ノードの重みを検索することで、推薦すべきキーワード列を決定することができる。
【0034】
ステップS102では、異なるキーワードで得られる検索結果に対応する複数のサブ検索関係グラフを含み、各サブ検索関係グラフがキーワードで検索されたリンク先ウェブページノードを指す接続有向辺を少なくとも1つを含む検索関係グラフを作成する。
【0035】
好ましくは、検索関係グラフを作成するステップは、履歴過程において各ユーザに対応する検索開始から検索終了までの全てのセッション制御メモが記録された全ての履歴検索情報を取得することと、履歴検索情報中の各セッション制御メモを抽出し、全てのサブ検索関係グラフを決定することと、全てのサブ検索関係グラフを総合して、サブ検索関係グラフの集合を取得することと、キーワードの関連関係により、全てのサブ検索関係グラフを合併して、検索関係グラフを取得することとを含む。
【0036】
本発明の実施例では、セッション制御メモをsessionとして定義してよい。一つのSessionを、ユーザが検索エンジンに入って、問題を解決して検索エンジンから退出するまで継続的に検索して閲覧する過程として定義すれば、あるSessionにおいて、ユーザが検索するたびに、ユーザにとって情報が増加し、後の検索行動であるほどユーザの本当の需要に近くなるため、最後のqueryを検索してユーザの情報取得が終了し、検索エンジンから離れるまでユーザに対する情報の増加が多くなる。したがって、一つのSessionにおいて、前に検索されたqueryは、後に検索されたqueryのクッションであり、後に検索されたqueryを見つける手がかりであり、後に検索されたqueryは、ユーザの前の検索行動から得られる意図であるため、関連検索リストの推薦を行う過程において、後に検索されたqueryに、より高い重みが与えられるべきである。
【0037】
本発明の実施例では、履歴検索情報中の各セッション制御メモを抽出し、全てのサブ検索関係グラフを決定するステップは、各セッション制御メモのうち、検索開始から検索終了までの過程において記録された全ての検索キーワード及びクリックされたウェブページを抽出することと、時系列を基準として、各検索キーワード間の有向辺を確立すると共に、各検索キーワードに対応するクリックされたウェブページのリンク識別子を与えることと、有向辺とリンク識別子で各サブ検索関係グラフを作成して、全てのサブ検索関係グラフを取得することとを含む。
【0038】
好ましくは、履歴検索情報中の各セッション制御メモを抽出するステップは、各セッション制御メモの開始時間、終了時間、開始時間に対応する検索初期キーワード、及び終了時間に対応する検索終了キーワードを決定することと、検索初期キーワードと検索終了キーワードに基づいて、履歴検索情報中の各セッション制御メモを分割することとを含む。
【0039】
即ち、全てのユーザの全ての検索行動を抽出した後、ユーザの検索開始と検索終了を識別子として複数のsessionに分割してよい。
【0040】
本発明の実施例では、キーワードの関連関係により、全てのサブ検索関係グラフを合併して、検索関係グラフを取得するステップは、各サブ検索関係グラフの各有向辺を決定することと、有向辺に対して重複削除処理を行うことと、キーワードの関連関係により、全ての有向辺を合併することと、全ての有向辺に対して正規化処理を行って、検索関係グラフを取得することと、を含む。
【0041】
即ち、各sessionに対して、サブ検索関係グラフを抽出して、サブ検索関係グラフの集合を得ると共に、各sessionの関係グラフを合併して、Gを取得することができる。
【0042】
さらに好ましくは、検索関係グラフを作成した後、方法は、さらに、少なくともPageRankアルゴリズムを含む、予め設定されたページランクアルゴリズムに従って、各検索キーワードの重みを前処理することと、各検索キーワードの重みとリンク先ウェブページ内容に基づいて、各リンク先ウェブページノードの重み値を決定することと、を含む。
【0043】
関連検索リストの推薦において、PageRankアルゴリズムにより各検索queryの重みを前処理してよく、例を挙げて説明すると、ユーザによって検索された各Session・S=[q1,q2,…,qn]に対して、i<jを満たす任意のi、jの場合、qiとqjを接続して一つの有向辺とし、辺の重みをv(i,j)とすれば、Sessionに基づいて検索関係グラフを作成することができる。このように、全てのユーザの全てのSessionに対して、各Sessionによって作成されたサブ関係グラフを合併して、query関係グラフG(U,V)を取得することができ、Gは有向グラフであり、Uは該グラフにおける全てのノードの集合であり、各ノードは1つのqueryを示し、ノード数は全てのユーザによって検索された、重複削除後の全てのqueryの数量であり、Vは該グラフにおける全ての辺の集合であり、該グラフにおける辺は各サブ関係グラフの辺の和集合であり、各辺の辺重みは全てのサブグラフのうち、に対応する開始点と終了点の辺の重みの和であり、かつ開始点に基づいて正規化を行って得られた値である。
【0044】
ステップS104では、検索対象となる目的キーワードを受け取る。
ステップS106では、検索関係グラフから、目的キーワードに対応する全てのリンク先ウェブページノードと各リンク先ウェブページノードの重み値をクエリして、重み値により順序付けられた複数の推薦情報を含む目的検索リストを決定する。
【0045】
本発明の好ましい実施例として、目的検索リストを決定するステップは、検索関係グラフから、目的キーワードに対応する全てのリンク先ウェブページノードを捜すことと、各リンク先ウェブページノードの重み値をクエリすることと、重み値により全てのリンク先ウェブページノードに順序を付けることと、各リンク先ウェブページノードに対応する推薦キーワード及び/又は推薦センテンスをクエリして推薦情報を得ると共に、目的検索リストを決定することとを含む。
【0046】
query関係グラフGを作成した後、PageRankアルゴリズムを用いて各queryの重みを求め、重みが高いほど、ユーザが有用な情報を取得する確率が高い。関連検索の推薦リストを生成する場合、このときにユーザの検索queryがqであると仮定すると、Gから全てのqの後続を見つけ、重みの大きい順番に順序を付ければよい。
【0047】
上記重み値は、様々な使用環境に応じて適切な数値を設定するようにユーザによって自分で設定することができる。
【0048】
ステップS108では、目的検索リストを表示する。
【0049】
【0050】
図2に示す4つのサブ検索関係グラフを合併すると共に、正規化処理を行うと、検索関係グラフを取得することができる。
図3は、本発明の実施例に係る、検索関係グラフを決定する別の好ましい概略図である。
【0051】
図3に示す検索関係グラフに対して、PageRankアルゴリズムを用いて、下記表1に示す各queryの重みを取得する。
【0052】
【0053】
【0054】
上記実施例により、関連推薦において、ユーザ検索の行動系列とユーザ意図との関係を考慮し、履歴の検索行動系列により、履歴ユーザの本当の検索意図を把握すると共に、これらの履歴行動に基づいて新しいユーザがあるqueryを検索するときの本当の検索意図を推定し、ユーザの検索経路を短縮し、ユーザ体験を向上させることができる。
【0055】
以下、別の好ましい情報推薦装置により本発明を説明する。
図4は、本発明の実施例に係る好ましい情報推薦装置の概略図であり、
図4に示すように、該情報推薦装置は、構築ユニット41、受け取りユニット43、決定ユニット45、及び表示ユニット47を含み、
構築ユニット41は、異なるキーワードで得られる検索結果に対応する複数のサブ検索関係グラフを含み、各サブ検索関係グラフがキーワードで検索されたリンク先ウェブページノードを指す接続有向辺を少なくとも1つを含む検索関係グラフを作成するように構成され、
受け取りユニット43は、検索対象となる目的キーワードを受け取るように構成され、
決定ユニット45は、検索関係グラフから、目的キーワードに対応する全てのリンク先ウェブページノードと各リンク先ウェブページノードの重み値をクエリして、重み値により順序付けられた複数の推薦情報を含む目的検索リストを決定するように構成され、
表示ユニット47は、目的検索リストを表示するように構成される。
【0056】
上記情報推薦装置は、まず、構築ユニット41により、異なるキーワードで得られる検索結果に対応する複数のサブ検索関係グラフを含み、各サブ検索関係グラフがキーワードで検索されたリンク先ウェブページノードを指す接続有向辺を少なくとも1つを含む検索関係グラフを作成し、受け取りユニット43により、検索対象となる目的キーワードを受け取り、その後に、決定ユニット45により検索関係グラフから、目的キーワードに対応する全てのリンク先ウェブページノードと各リンク先ウェブページノードの重み値をクエリして、重み値により順序付けられた複数の推薦情報を含む目的検索リストを決定し、最後に、表示ユニット47により目的検索リストを表示することができる。該実施例では、ユーザがある分野を理解する過程が同じであることを利用することができ、関連検索の推薦において、ユーザ検索の行動系列とユーザ意図との関係を考慮し、履歴の検索行動系列により、履歴ユーザの本当の検索意図を把握すると共に、これらの履歴行動に基づいて新しいユーザがあるqueryを検索するときの本当の検索意図を推定し、ユーザの検索経路を短縮し、ユーザ体験を向上させ、かつ重み値を用いて推薦すべき検索リストを決定し、ユーザに最も所望される情報を見せることができ、関連技術における、情報推薦においてユーザの検索意図を正確に把握せず推薦誤差が大きいという技術的課題を解決する。
【0057】
好ましくは、構築ユニットは、履歴過程において各ユーザに対応する検索開始から検索終了までの全てのセッション制御メモが記録された全ての履歴検索情報を取得するように構成される第1の取得モジュールと、履歴検索情報中の各セッション制御メモを抽出し、全てのサブ検索関係グラフを決定するように構成される第1の抽出モジュールと、全てのサブ検索関係グラフを総合して、サブ検索関係グラフの集合を得るように構成される総合モジュールと、キーワードの関連関係により、全てのサブ検索関係グラフを合併して、検索関係グラフを得るように構成される第1の合併モジュールとを含む。
【0058】
さらに、好ましくは、第1の抽出モジュールは、各セッション制御メモのうち、検索開始から検索終了までの過程において記録された全ての検索キーワード及びクリックされたウェブページを抽出するように構成される第1の抽出サブモジュールと、時系列を基準として、各検索キーワード間の有向辺を確立すると共に、各検索キーワードに対応するクリックされたウェブページのリンク識別子を与えるように構成される第1の確立サブモジュールと、有向辺とリンク識別子で各サブ検索関係グラフを作成して、全てのサブ検索関係グラフを得るように構成される第2の確立サブモジュールとを含む。
【0059】
好ましくは、第1の抽出モジュールは、さらに、各セッション制御メモの開始時間、終了時間、開始時間に対応する検索初期キーワード、及び終了時間に対応する検索終了キーワードを決定するように構成される第1の決定サブモジュールと、検索初期キーワードと検索終了キーワードに基づいて、履歴検索情報中の各セッション制御メモを分割するように構成される分割サブユニットとを含む。
【0060】
本発明の実施例では、第1の合併モジュールは、各サブ検索関係グラフの各有向辺を決定し、有向辺に対して重複削除処理を行うように構成される第2の決定サブモジュールと、キーワードの関連関係により、全ての有向辺を合併するように構成される第1の合併サブモジュールと、全ての有向辺に対して正規化処理を行って、検索関係グラフを得るように構成される正規化モジュールとを含む。
【0061】
好ましくは、情報推薦装置は、さらに、検索関係グラフを作成した後、少なくともPageRankアルゴリズムを含む、予め設定されたページランクアルゴリズムに従って、各検索キーワードの重みを前処理するように構成される前処理ユニットと、各検索キーワードの重みとリンク先ウェブページ内容に基づいて、各リンク先ウェブページノードの重み値を決定するように構成される第1の決定モジュールと、を含む。
【0062】
好ましくは、決定ユニットは、検索関係グラフから、目的キーワードに対応する全てのリンク先ウェブページノードを捜すことと、各リンク先ウェブページノードの重み値をクエリすることと、重み値により全てのリンク先ウェブページノードに順序を付けることと、各リンク先ウェブページノードに対応する推薦キーワード及び/又は推薦センテンスをクエリして推薦情報を得ると共に、目的検索リストを決定することとを含む。
【0063】
上記情報推薦装置は、さらにプロセッサ及びメモリを含んでよく、上記構築ユニット41、受け取りユニット43、決定ユニット45、表示ユニット47等は、いずれもプログラムユニットとしてメモリに記憶され、プロセッサがメモリに記憶された上記プログラムユニットを実行して、対応する機能を実現する。
【0064】
上記プロセッサは、カーネルを含み、カーネルによりメモリから対応するプログラムユニットを呼び出す。カーネルは、1つ又は1つ以上設置されてよく、カーネルパラメータを調整することによりユーザ検索意図に合致するキーワードを推薦する。
【0065】
上位メモリは、コンピュータ可読媒体中の揮発性メモリ、ランダムアクセスメモリ(RAM)及び/又は不揮発性メモリ等の形態、例えば、リードオンリーメモリ(ROM)又はフラッシュメモリ(flash RAM)を含み、メモリは、少なくとも1つのメモリチップを含む。
【0066】
本発明の実施例の別の態様によれば、さらに、プロセッサと、プロセッサの実行可能な命令を記憶するように構成されるメモリとを含む電子機器であって、プロセッサは、実行可能命令を実行することにより、上記いずれか一項の情報推薦方法を実行するように構成される電子機器をさらに提供する。
【0067】
本発明の実施例の別の態様は、記憶されたプログラムを含み、プログラムが実行される場合、所在する装置を制御して上記いずれか一項に記載の情報推薦方法を実行する記憶媒体をさらに提供する。
【0068】
本願は、データ処理装置上で実行される場合と、初期化中に、異なるキーワードで得られる検索結果に対応する複数のサブ検索関係グラフを含み、各サブ検索関係グラフがキーワードで検索されたリンク先ウェブページノードを指す接続有向辺を少なくとも1つを含む検索関係グラフを作成するステップと、検索対象となる目的キーワードを受け取るステップと、検索関係グラフから、目的キーワードに対応する全てのリンク先ウェブページノードと各リンク先ウェブページノードの重み値をクエリして、重み値により順序付けられた複数の推薦情報を含む目的検索リストを決定するステップと、目的検索リストを表示するステップとを有するプログラムを実行するのに適するコンピュータプログラム製品を提供する。
【0069】
上記本発明の実施例の番号は説明のためのものに過ぎず、実施例の優劣を示すものではない。
【0070】
本発明の上記実施例において、各実施例の説明についてはそれぞれ重点を置き、ある実施例で詳しく説明していない部分については、他の実施例の関連部分の説明を参照することができる。
【0071】
本願で提供する幾つかの実施例において、開示された技術手段は、他の形態で実現することもできると理解すべきである。以上で説明した装置実施例は例示的なものであり、例えば、上記ユニットの区画は、ロジック機能の区画であり、実際に実現する場合、他の区画方式であってもよく、例えば、複数のユニット又は手段を結合したり他のシステムに集積したりすることができ、或いは、一部の特徴を無視し又は実行しないこともできる。また、表示又は検討した相互結合又は直接結合又は通信接続は、幾つかのインタフェース、ユニット又はモジュールを介した間接結合又は通信接続であってもよく、電気的又は他の形態であってもよい。
【0072】
上記分離部品として説明したユニットは、物理的に分離しても物理的に分離しなくてもよく、ユニットとして表す部品は、物理ユニットであっても物理ユニットではなくてもよく、つまり、1つの箇所に位置しても、複数のユニットに分布してもよい。実際の需要に応じて、それらのうちの一部又は全部のユニットを選択して本実施例の技術手段の目的を達成することができる。
【0073】
また、本発明の各実施例中の各機能ユニットは、1つの処理ユニットに集積しても、物理的に独立しても、2つ又はそれ以上のユニットを1つのユニットに集積してもよい。上記集積されたユニットは、ハードウェアの形態で実現されても、ソフトウェア機能ユニットの形態で実現されてもよい。
【0074】
上記集積されたユニットは、ソフトウェア機能ユニットの形態で実現して独立製品として販売したり使用したりする場合、コンピュータが読み取り可能な記録媒体に記憶することができる。したがって、本発明の技術手段は実質的に、あるいは、既存技術に対する貢献のある部分又は該技術手段の全部又は一部は、ソフトウェア製品の形態で実現することができ、このようなコンピュータソフトウェア製品は記憶媒体に記憶され、一つのコンピュータ機器(パーソナルコンピュータ、サーバ又はネットワーク機器などであってよい)に本発明の各実施例に係る方法の全部又は一部のステップを実行させる命令を含むことができる。上記記憶媒体は、USBフラッシュドライブ、リードオンリーメモリ(ROM、Read-Only Memory)、ランダムアクセスメモリ(RAM、Random Access Memory)、モバイルハードディスク、ディスク又はCDなどのプログラムコードを記憶できる各種の媒体を含む。
【0075】
以上の記載は、本発明の好適な実施形態に過ぎず、当業者は本発明の主旨から逸脱せずに若干の改善や修正を行うこともでき、このような改善や修正は本発明の保護範囲に含まれるべきである。
【産業上の利用可能性】
【0076】
本願の実施例が提供する解決手段は、推薦結果の検索に用いられてよく、本願の実施例が提供する技術的解決手段は、インターネットにおける検索エンジンに適用されてよく、ユーザがある分野を理解する過程が同じであることを利用して、関連検索推薦において、ユーザ検索の行動系列とユーザ意図との関係を考慮し、履歴の検索行動系列により、履歴ユーザの本当の検索意図を把握すると共に、これらの履歴行動に基づいて新しいユーザがあるqueryを検索するときの本当の検索意図を推定し、ユーザの検索経路を短縮し、ユーザ体験を向上させ、かつ重み値を用いてすべき検索リストを決定し、ユーザに最も所望される情報を見せることができ、関連技術における、情報推薦においてユーザの検索意図を正確に把握せず推薦誤差が大きいという技術的課題を解決する。本願の実施例は、検索関係グラフから、目的キーワードに対応する全てのリンク先ウェブページノードと各リンク先ウェブページノードの重み値をクエリして、目的検索リストを決定することにより、ユーザに最も正確な検索結果をより迅速に推薦し、検索効率を向上させることができる。