IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッドの特許一覧

特開2025-24169インタラクション情報の特定方法、装置、電子機器、記憶媒体及びコンピュータプログラム
<>
  • 特開-インタラクション情報の特定方法、装置、電子機器、記憶媒体及びコンピュータプログラム 図1
  • 特開-インタラクション情報の特定方法、装置、電子機器、記憶媒体及びコンピュータプログラム 図2
  • 特開-インタラクション情報の特定方法、装置、電子機器、記憶媒体及びコンピュータプログラム 図3A
  • 特開-インタラクション情報の特定方法、装置、電子機器、記憶媒体及びコンピュータプログラム 図3B
  • 特開-インタラクション情報の特定方法、装置、電子機器、記憶媒体及びコンピュータプログラム 図4
  • 特開-インタラクション情報の特定方法、装置、電子機器、記憶媒体及びコンピュータプログラム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025024169
(43)【公開日】2025-02-19
(54)【発明の名称】インタラクション情報の特定方法、装置、電子機器、記憶媒体及びコンピュータプログラム
(51)【国際特許分類】
   G06F 16/90 20190101AFI20250212BHJP
【FI】
G06F16/90 100
【審査請求】有
【請求項の数】17
【出願形態】OL
【公開請求】
(21)【出願番号】P 2024202538
(22)【出願日】2024-11-20
(31)【優先権主張番号】202410468539.3
(32)【優先日】2024-04-18
(33)【優先権主張国・地域又は機関】CN
(71)【出願人】
【識別番号】514322098
【氏名又は名称】ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus, No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】100106518
【弁理士】
【氏名又は名称】松谷 道子
(74)【代理人】
【識別番号】100189555
【弁理士】
【氏名又は名称】徳山 英浩
(72)【発明者】
【氏名】李 曉
(72)【発明者】
【氏名】賈 ▲シン▼
(72)【発明者】
【氏名】辜 斯繆
(72)【発明者】
【氏名】王 俊峰
(72)【発明者】
【氏名】史 海波
(72)【発明者】
【氏名】盧 ▲ユィ▼
(72)【発明者】
【氏名】徐 昇
(72)【発明者】
【氏名】張 亮
(72)【発明者】
【氏名】周 文杰
(72)【発明者】
【氏名】劉 怡君
(72)【発明者】
【氏名】魯 妹
(72)【発明者】
【氏名】巫 子辰
(72)【発明者】
【氏名】楊 敏
(72)【発明者】
【氏名】王 煥捷
(72)【発明者】
【氏名】唐 橋
(72)【発明者】
【氏名】崔 濛濛
(57)【要約】      (修正有)
【課題】思考連鎖の方法により、大規模モデル事前専門知識とユーザ履歴クエリ情報における事後補足とを組み合わせて、クエリ情報に対する質問次元を生成することができるインタラクション情報の特定方法、装置、電子機器、記憶媒体及びコンピュータプログラムを提供する。
【解決手段】方法は、対象のクエリ情報及び履歴クエリ情報に基づいて、複数の質問次元を特定する。各質問次元は、次元名称及び複数の選択肢を含む。方法はまた、複数の質問次元の語義情報とクエリ情報に関連するクエリ結果の語義情報とが一致するか否か及び複数の質問次元の評価値に基づいて、複数の質問次元から目標質問次元を特定し、かつ、目標質問次元における次元名称及び複数の選択肢に基づいて、インタラクション情報を特定する。
【選択図】図2
【特許請求の範囲】
【請求項1】
インタラクション情報を特定する方法であって、
対象のクエリ情報及び履歴クエリ情報に基づいて、複数の質問次元を特定することであって、各質問次元が、次元名称及び複数の選択肢を含むことと、
複数の質問次元の語義情報と、前記クエリ情報に関連するクエリ結果の語義情報とが一致するか否か、及び前記複数の質問次元の評価値に基づいて、前記複数の質問次元から目標質問次元を特定することと、
前記目標質問次元における次元名称と複数の選択肢に基づいて、インタラクション情報を特定することと、を含む
ことを特徴とするインタラクション情報の特定方法。
【請求項2】
候補履歴クエリ情報のうち、候補履歴クエリ情報の意図が前記クエリ情報の意図と一致し、前記候補履歴クエリ情報の検索頻度が所定の頻度条件を満たし、候補履歴クエリ情報に含まれるエンティティが前記クエリ情報に含まれるエンティティと一致するというの条件を満たす候補履歴クエリ情報を前記履歴クエリ情報として特定することをさらに含む
ことを特徴とする請求項1に記載の方法。
【請求項3】
前記対象のクエリ情報及び履歴クエリ情報に基づいて、複数の質問次元を特定することは、
第1提示情報テンプレート、前記クエリ情報、前記履歴クエリ情報、および前記クエリ情報に関連するクエリ結果を第1提示情報として組み合わせることと、
前記第1提示情報を大規模モデルに入力し、前記複数の質問次元を取得することと、を含み、
ここで、前記第1提示情報テンプレートは、第1思考連鎖を含み、前記第1思考連鎖は、大規模モデルが、前記クエリ情報と前記履歴クエリ情報との間の関係タイプを特定し、前記関係タイプに基づいて質問次元が存在するか否かを特定し、候補質問次元の場合、所定の細分化方向に基づいて質問次元と選択肢を生成するという方式によって前記複数の質問次元を取得するように指示する
ことを特徴とする請求項1に記載の方法。
【請求項4】
複数の質問次元の語義情報と、前記クエリ情報に関連するクエリ結果の語義情報とが一致するか否か、及び前記複数の質問次元の評価値に基づいて、前記複数の質問次元から目標質問次元を特定することは、
前記複数の質問次元のそれぞれについて、前記質問次元の語義情報と前記クエリ情報に関連するクエリ結果の語義情報とが一致すると特定した場合、前記複数の質問次元から前記質問次元を削除し、重複排除後の質問次元を取得することと、
前記重複排除後の質問次元それぞれの評価値に基づいて、前記重複排除後の質問次元から前記目標質問次元を特定することと、を含む
ことを特徴とする請求項1に記載の方法。
【請求項5】
前記質問次元の語義情報と前記クエリ情報に関連するクエリ結果の語義情報とが一致すると特定した場合、前記複数の質問次元から前記質問次元を削除し、重複排除後の質問次元を取得することは、
第2提示情報テンプレート、前記クエリ情報、前記クエリ結果および前記複数の質問次元を第2提示情報として組み合わせることと、
前記第2提示情報を大規模モデルに入力し、重複排除後の質問次元を取得することと、を含み、
ここで、前記第2提示情報テンプレートは、第2思考連鎖を含み、前記第2思考連鎖は、大規模モデルが、前記クエリ結果に対する要約情報を生成し、前記要約情報が質問次元と関連するか否かを特定するという方式によって重複排除後の質問次元を取得するように指示する
ことを特徴とする請求項4に記載の方法。
【請求項6】
前記重複排除後の質問次元それぞれの評価値に基づいて、前記重複排除後の質問次元から目標質問次元を特定することは、
第3提示情報テンプレート、前記クエリ情報、前記クエリ結果及び前記重複排除後の質問次元を第3提示情報として組み合わせることと、
前記第3提示情報を大規模モデルに入力し、前記目標質問次元を取得することと、を含み、
ここで、前記第3提示情報テンプレートは、第3思考連鎖を含み、前記第3思考連鎖は、大規模モデルが、所定の評価方式に基づいて質問次元の評価値を特定し、評価値に基づいて前記重複排除後の質問次元から前記目標質問次元を選択するという方式によって前記目標質問次元を取得するように指示する
ことを特徴とする請求項4に記載の方法。
【請求項7】
前記目標質問次元における次元名称と複数の選択肢に基づいて、インタラクション情報を特定することは、
第4提示情報テンプレート、前記クエリ情報及び前記目標質問次元を第4提示情報として組み合わせることと、
前記第4提示情報を大規模モデルに入力し、前記インタラクション情報における質問問題を取得することと、を含み、
ここで、前記第4提示情報テンプレートは、第4思考連鎖を含み、前記第4思考連鎖は、大規模モデルが、前記クエリ情報と前記質問次元に基づいてクエリシーンを特定し、前記クエリシーンに基づいて前記インタラクション情報における質問問題を生成するという方式によって前記インタラクション情報における質問問題を取得するように指示する
ことを特徴とする請求項1に記載の方法。
【請求項8】
インタラクション情報を特定する装置であって、
対象のクエリ情報及び履歴クエリ情報に基づいて、複数の質問次元を特定するものであって、各質問次元が次元名称及び複数の選択肢を含む第1特定モジュールと、
複数の質問次元の語義情報と、前記クエリ情報に関連するクエリ結果の語義情報とが一致するか否か、及び前記複数の質問次元の評価値に基づいて、前記複数の質問次元から目標質問次元を特定する第2特定モジュールと、
前記目標質問次元における次元名称及び複数の選択肢に基づいて、インタラクション情報を特定する第3特定モジュールと、を含む
ことを特徴とするインタラクション情報の特定装置。
【請求項9】
候補履歴クエリ情報のうち、候補履歴クエリ情報の意図が前記クエリ情報の意図と一致し、前記候補履歴クエリ情報の検索頻度が所定の頻度条件を満たし、候補履歴クエリ情報に含まれるエンティティが前記クエリ情報に含まれるエンティティと一致するというの条件を満たす候補履歴クエリ情報を前記履歴クエリ情報として特定する履歴情報特定モジュールをさらに含む
ことを特徴とする請求項8に記載の装置。
【請求項10】
前記第1特定モジュールは、
第1提示情報テンプレート、前記クエリ情報、前記履歴クエリ情報、および前記クエリ情報に関連するクエリ結果を第1提示情報として組み合わせる第1組合せサブモジュールと、
前記第1提示情報を大規模モデルに入力し、前記複数の質問次元を取得する第1入力サブモジュールと、を含み、
ここで、前記第1提示情報テンプレートは、第1思考連鎖を含み、前記第1思考連鎖は、大規模モデルが、前記クエリ情報と前記履歴クエリ情報との間の関係タイプを特定し、前記関係タイプに基づいて質問次元が存在するか否かを特定し、候補質問次元の場合、所定の細分化方向に基づいて質問次元と選択肢を生成するという方式によって前記複数の質問次元を取得するように指示する
ことを特徴とする請求項8に記載の装置。
【請求項11】
前記第2特定モジュールは、
前記複数の質問次元のそれぞれについて、前記質問次元の語義情報と前記クエリ情報に関連するクエリ結果の語義情報とが一致すると特定した場合、前記複数の質問次元から前記質問次元を削除し、重複排除後の質問次元を取得する削除サブモジュールと、
前記重複排除後の質問次元それぞれの評価値に基づいて、前記重複排除後の質問次元から前記目標質問次元を特定する特定サブモジュールと、を含む
ことを特徴とする請求項8~10のいずれか一項に記載の装置。
【請求項12】
前記削除サブモジュールは、
第2提示情報テンプレート、前記クエリ情報、前記クエリ結果および前記複数の質問次元を第2提示情報として組み合わせる第1組合せユニットと、
前記第2提示情報を大規模モデルに入力し、重複排除後の質問次元を取得する第1入力ユニットと、を含み、
ここで、前記第2提示情報テンプレートは、第2思考連鎖を含み、前記第2思考連鎖は、大規模モデルが、前記クエリ結果に対する要約情報を生成し、前記要約情報が質問次元と関連するか否かを特定するという方式によって重複排除後の質問次元を取得するように指示する
ことを特徴とする請求項11に記載の装置。
【請求項13】
前記特定サブモジュールは、
第3提示情報テンプレート、前記クエリ情報、前記クエリ結果及び前記重複排除後の質問次元を第3提示情報として組み合わせる第2組合せユニットと、
前記第3提示情報を大規模モデルに入力し、前記目標質問次元を取得する第2入力ユニットと、を含み、
ここで、前記第3提示情報テンプレートは、第3思考連鎖を含み、前記第3思考連鎖は、大規模モデルが、所定の評価方式に基づいて質問次元の評価値を特定し、評価値に基づいて前記重複排除後の質問次元から前記目標質問次元を選択するという方式によって前記目標質問次元を取得するように指示する
ことを特徴とする請求項11に記載の装置。
【請求項14】
前記第3特定モジュールは、
第4提示情報テンプレート、前記クエリ情報及び前記目標質問次元を第4提示情報として組み合わせる第2組合せサブモジュールと、
前記第4提示情報を大規模モデルに入力し、前記インタラクション情報における質問問題を取得する第2入力サブモジュールと、を含み、
ここで、前記第4提示情報テンプレートは、第4思考連鎖を含み、前記第4思考連鎖は、大規模モデルが、前記クエリ情報と前記質問次元に基づいてクエリシーンを特定し、前記クエリシーンに基づいて前記インタラクション情報における質問問題を生成するという方式によって前記インタラクション情報における質問問題を取得するように指示する
ことを特徴とする請求項8に記載の装置。
【請求項15】
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信接続されたメモリと、を含み、
前記メモリは、前記少なくとも1つのプロセッサによって実行可能な命令を記憶し、前記命令は、前記少なくとも1つのプロセッサが請求項1~7のいずれか一項に記載の方法を実行できるように、前記少なくとも1つのプロセッサによって実行される
電子機器。
【請求項16】
コンピュータ命令が記憶されている非一時的なコンピュータ可読記憶媒体であって、
前記コンピュータ命令は、コンピュータに請求項1~7のいずれか一項に記載の方法を実行させる
非一時的なコンピュータ可読記憶媒体。
【請求項17】
プロセッサによって実行されると、請求項1~7のいずれか一項に記載の方法を実現するコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、人工知能技術分野に関し、特に、大規模モデル、生成モデル、NLP、インテリジェント検索などの分野に関し、より具体的には、本開示は、インタラクション情報の特定方法、装置、電子機器、記憶媒体及びコンピュータプログラムを提供する。
【背景技術】
【0002】
複雑な検索シーンにおいて、ユーザ表現の多様性及び曖昧さにより、検索エンジンが実際の検索意図を正確に捉えることができず、検索結果とユーザの実際のニーズとの間に差が存在する。
【発明の概要】
【0003】
本開示は、インタラクション情報の特定方法、装置、電子機器、記憶媒体及びコンピュータプログラムを提供する。
【0004】
本開示の一態様によれば、インタラクション情報の特定方法を提供し、対象のクエリ情報及び履歴クエリ情報に基づいて、複数の質問次元を特定することであって、各質問次元が、次元名称及び複数の選択肢を含むことと、複数の質問次元の語義情報と、クエリ情報に関連するクエリ結果の語義情報とが一致するか否か、及び複数の質問次元の評価値に基づいて、複数の質問次元から目標質問次元を特定することと、目標質問次元における次元名称と複数の選択肢に基づいて、インタラクション情報を特定することと、を含む。
【0005】
本開示の別の態様によれば、インタラクション情報の特定装置を提供し、第1特定モジュール、第2特定モジュール及び第3特定モジュールを含む。第1特定モジュールは、対象のクエリ情報及び履歴クエリ情報に基づいて、複数の質問次元を特定し、各質問次元が次元名称及び複数の選択肢を含む。第2特定モジュールは、複数の質問次元の語義情報と、クエリ情報に関連するクエリ結果の語義情報とが一致するか否か、及び複数の質問次元の評価値に基づいて、複数の質問次元から目標質問次元を特定する。第3特定モジュールは、目標質問次元における次元名称及び複数の選択肢に基づいて、インタラクション情報を特定する。
【0006】
本開示の別の態様によれば、電子機器を提供し、少なくとも1つのプロセッサと、少なくとも1つのプロセッサと通信接続されたメモリと、を含み、メモリは、少なくとも1つのプロセッサによって実行可能な命令を記憶し、命令は、少なくとも1つのプロセッサが本開示に提供される方法を実行できるように、少なくとも1つのプロセッサによって実行される。
【0007】
本開示の別の態様によれば、コンピュータ命令が記憶されている非一時的なコンピュータ可読記憶媒体を提供し、ここで、コンピュータ命令は、コンピュータに本開示に提供される方法を実行させる。
【0008】
本開示の別の態様によれば、コンピュータプログラムを提供し、コンピュータプログラムがプロセッサによって実行されると、本開示に提供される方法を実現する。
【0009】
理解されるべきこととして、本部分に記載された内容は、本開示の実施例のキーポイント又は重要な特徴を示すことを意図するものではなく、本開示の範囲を限定するものでもない。本開示の他の特徴は、以下の説明により容易に理解される。
【図面の簡単な説明】
【0010】
図面は、本技術案をよりよく理解するために用いられ、本開示を限定するものではない。
【0011】
図1図1は、本開示の実施例によるインタラクション情報の特定方法及び装置の応用シーンの模式図である。
図2図2は、本開示の実施例によるインタラクション情報の特定方法の概略フローチャートである。
図3A図3Aは、本開示の実施例によるインタラクション情報の特定方法の概略原理図である。
図3B図3Bは、本開示の実施例によるインタラクションページの模式図である。
図4図4は、本開示の実施例によるインタラクション情報の特定装置の概略構成ブロック図である。
図5図5は、本開示の実施例によるインタラクション情報の特定方法を実施する電子機器の構造ブロック図である。
【発明を実施するための形態】
【0012】
以下、図面を参照して本開示の例示的な実施例を説明する。ここで、より理解しやすいために本開示の実施例の様々な詳細は含まれ、それらが例示的なものであると考えられるべきである。したがって、当業者であれば、ここで記載される実施例に対して様々な変更・修正を行うことができ、本開示の範囲及び精神から逸脱することはないと分るべきである。同様に、明確かつ簡潔に説明するために、以下の記載において周知の機能や構成に対する説明を省略する。
【0013】
本開示の技術案において、係れたユーザ個人情報の収集、記憶、使用、加工、伝送、提供及び開示等の処理は、いずれも関連法律や法規の規定に合致しており、公序良俗に反していない。
【0014】
本開示の技術案において、ユーザの個人情報を取得するか又は収集する前に、いずれもユーザの許可又は同意を得た。
【0015】
複雑な検索シーンにおいて、ユーザ表現の多様性及び曖昧さにより、検索エンジンが実際の検索意図を正確に捉えることができず、検索結果とユーザの実際のニーズとの間に差が存在する。
【0016】
例えば、「漢方薬で体を調整する」というクエリ情報は、比較的複雑で曖昧なニーズであり、該クエリ情報は、ユーザの個性化の好みに係わるが、検索エンジンは漢方薬、体調整などのキーワードに関連する幅広いクエリ結果を返し、その中にユーザのニーズに合致しない内容が多く含まれ、ユーザの個性化のニーズをよく満たすことができない。いくつかの検索エンジンは、関連検索の方式により、ユーザに対して他の可能なクエリ情報を推薦するが、このような方式は依然としてユーザの真のニーズを発見することは困難であり、ユーザのニーズとは無関係な内容も介在しやすい。
【0017】
本開示の実施例は、インタラクション情報を特定する方法を提供し、当該方法は、思考連鎖の方法により、大規模モデル事前専門知識とユーザ履歴クエリ情報における事後補足とを組み合わせて、クエリ情報に対する質問次元を生成することができる。ユーザに質問する方式により、ユーザがより多くのクエリ目標に関する詳細情報を提供するように誘導し、ユーザのクエリニーズをマイニングする。このように、検索エンジンは、ユーザのニーズにマッチするクエリ結果を提供し、クエリ結果の精度及び関連性を向上させ、ユーザにより個性的且つ満足な検索体験を提供することができる。また、ユーザは、検索エンジンに推奨される内容を受動的に受け取ることなく、クエリプロセスに能動的に参加することができるため、ユーザの能動性及び参加度を向上させ、ユーザの使用体験を向上させることができる。
【0018】
以下、図面及び具体的な実施例を参照しながら本開示に係る技術案を詳細に説明する。
【0019】
図1は、本開示の実施例によるインタラクション情報を特定する方法及び装置の応用シーンの模式図である。
【0020】
なお、図1は、当業者が本開示の技術内容を理解するために、本開示の実施例を適用可能なシステムアーキテクチャの例示であり、本開示の実施例が他の機器、システム、環境又はシーンに用いられることができないことを意味していない。
【0021】
図1に示すように、当該実施例によるシステムアーキテクチャ100は、端末機器101、102、103、ネットワーク104及びサーバ105を含むことができる。ネットワーク104は、端末機器101、102、103とサーバ105との間で通信リンクを提供する媒体である。ネットワーク104は、例えば有線及び/又は無線通信リンクなどの様々な接続タイプを含んでもよい。
【0022】
ユーザは、端末機器101、102、103を使用して、ネットワーク104を介してサーバ105と対話して、メッセージ等を送受信することができる。端末機器101、102、103は、ディスプレイを有しかつウェブページ閲覧をサポートする様々な電子機器であってよく、スマートフォン、タブレットコンピュータ、ラップトップポータブルコンピュータ、デスクトップコンピュータなどを含むが、これらに限定されない。
【0023】
サーバ105は、様々なサービスを提供するサーバ、例えば、ユーザが端末機器101、102、103を用いて閲覧したウェブサイトにサポートを提供するバックグラウンド管理サーバ(単なる例)であってもよい。バックグラウンド管理サーバは、受信したユーザ要求などのデータに対して分析などの処理を行い、処理結果(例えば、ユーザが入力したクエリ情報に基づいて生成したインタラクション情報など)を端末機器にフィードバックすることができる。
【0024】
なお、本開示の実施例に係るインタラクション情報を特定する方法は、一般的に、サーバ105によって実行されてもよい。それに応じて、本開示の実施例に係るインタラクション情報を特定する装置は、一般的に、サーバ105に設置されてもよい。本開示の実施例に係るインタラクション情報を特定する方法は、サーバ105と異なりかつ端末機器101、102、103及び/又はサーバ105と通信可能なサーバ又はサーバクラスタによって実行されてもよい。それに応じて、本開示の実施例に係るインタラクション情報を特定する装置は、サーバ105と異なりかつ端末機器101、102、103及び/又はサーバ105と通信可能なサーバ又はサーバクラスタに設置されてもよい。
【0025】
図1における端末機器、ネットワーク及びサーバの数は、単なる例示であることを理解されたい。必要に応じて、任意の数の端末機器、ネットワーク及びサーバを有してもよい。
【0026】
図2は、本開示の実施例によるインタラクション情報を特定する方法の概略フローチャートである。
【0027】
図2に示すように、インタラクション情報を特定する方法200は、操作S210-操作S230を含んでもよい。
【0028】
操作S210において、対象のクエリ情報及び履歴クエリ情報に基づいて、複数の質問次元を特定し、各質問次元は、次元名称及び複数の選択肢を含む。
【0029】
例えば、対象は、検索エンジンを使用するユーザを含む。
【0030】
例えば、クエリ情報は、ユーザにより入力された、クエリを必要とする内容であってもよく、クエリ情報のデータタイプは、テキストであってもよく、例えば、クエリ情報は、「おもしろい小説推薦」である。
【0031】
例えば、履歴クエリ情報は、過去の所定期間内のクエリ情報を含んでもよく、所定期間は、半月であってもよい。いくつかの実施例において、ユーザが補足して表現した内容を履歴クエリ情報としてもよい。例えば、ユーザが検索エンジンに1つのクエリ情報を入力した後、検索エンジンを終了せず、いくつかの他の内容を入力し続けるか、検索エンジンにおいていくつかのページによって提供されたクエリ内容を選択し、これらの内容を履歴クエリ情報としてもよい。
【0032】
例えば、次元名称は、「小説タイプ」、「小説紙幅」などを含んでもよく、「小説タイプ」に関連する選択肢は、「サスペンス推理」、「空想科学」などを含んでもよく、「小説紙幅」に関連する選択肢は、「長編」、「中編」、「短編」などを含んでもよい。
【0033】
例えば、クエリ情報及び履歴クエリ情報に対してキーワード抽出を行ってもよく、キーワードと質問次元との間のマッピング関係を予め設定してから、マッピング関係に基づいて質問次元を特定してもよい。
【0034】
操作S220において、複数の質問次元の語義情報とクエリ情報に関連するクエリ結果の語義情報とが一致するか否か、及び複数の質問次元の評価値に基づいて、複数の質問次元から目標質問次元を特定する。
【0035】
例えば、クエリ結果は、クエリ情報を検索して得られる内容を表すことができる。クエリ結果のデータタイプは、テキスト、画像、ビデオなどを含んでもよい。例えば、クエリ結果は、「推薦される長編小説が第1小説であり、中編小説が第2小説であり、短編小説が第3小説である」という内容を含み、このクエリ内容は、質問次元における「小説紙幅」の語義と一致する。
【0036】
例えば、評価値は、質問次元によるクエリ内容への影響度を表してもよく、質問次元によるユーザクエリニーズの理解への影響度を表してもよい。評価値は、具体的な数値であってもよいし、評価値の高低を表す評価パラメータであってもよい。質問次元に対応する評価値を予め設定してもよく、大規模モデルを用いて評価してもよい。
【0037】
例えば、クエリ結果語義と一致せず且つ評価値が高い質問次元を目標質問次元として特定してもよい。
【0038】
操作S230において、目標質問次元における次元名称と複数の選択肢に基づいて、インタラクション情報を特定する。
【0039】
例えば、目標質問次元における次元名称と複数の選択肢をインタラクション情報としてもよい。また、例えば、目標質問次元における次元名称を自然言語表現することができ、次元名称「小説タイプ」は、例えば、「あなたが読みたい小説のタイプは何ですか」に変換し、その後、変換された次元情報と選択肢をインタラクション情報として、これにより、インタラクション情報がユーザにより理解されやすくすることができる。
【0040】
本開示の実施例は、ユーザに質問する方式により、ユーザがより多くのクエリ目標に関する詳細情報を提供するように誘導し、ユーザのクエリニーズをマイニングする。このように、検索エンジンは、ユーザのニーズにマッチするクエリ結果を提供し、クエリ結果の精度及び関連性を向上させることができ、ユーザにより個性的且つ満足な検索体験を提供することができる。また、ユーザは、検索エンジンに推奨される内容を受動的に受け取ることなく、能動的にクエリプロセスに参加することができるため、ユーザの能動性及び参加度を向上させ、ユーザの使用体験を向上させることができる。
【0041】
実際の応用において、インタラクション情報を取得した後、複数の方式でインタラクション情報を応用することができる。ある応用シーンにおいて、フロントエンドページを介してインタラクション情報を表示し、これにより、ユーザが質問次元に基づいて選択操作を行い、クエリ内容を補足する。別の応用シーンにおいて、インタラクション情報を利用してトレーニングサンプルを構築し、トレーニングサンプルを利用して他のモデルをトレーニングすることができ、このように、オンラインアプリケーションにおいてトレーニングされた他のモデルを利用してユーザと対話することができる。他のモデルに必要なリソースは、大規模モデルに必要なリソースより小さくてもよく、他のモデルは、SFT(Sparse Fine Tuning)モデルであってもよい。
【0042】
本開示の別の実施例によれば、まず履歴クエリ情報を選別してもよく、選別プロセスは、候補履歴クエリ情報のうち、所定の選別条件を満たす候補履歴クエリ情報を履歴クエリ情報として特定することを含んでもよく、ここで、所定の選別条件は、候補履歴クエリ情報の意図がクエリ情報の意図と一致することと、候補履歴クエリ情報の検索頻度が所定の頻度条件を満たすことと、候補履歴クエリ情報に含まれるエンティティがクエリ情報に含まれるエンティティと一致することとの少なくとも1つを含んでもよい。
【0043】
例えば、まず、過去の所定期間内の履歴クエリ情報を取得し、これらの履歴クエリ情報を候補履歴クエリ情報としてもよい。
【0044】
次に、候補履歴クエリ情報とクエリ情報との意図が一致するか否かを特定することができる。例えば、二項分類方式により意図が一致するか否かを特定することができ、例えば、候補履歴クエリ情報とクエリ情報を予備トレーニングされた分類モデルに入力し、分類モデルにより意図が一致するか否かを特定する。また例えば、候補履歴クエリ情報及びクエリ情報に対してそれぞれ意図認識を行い、その後、両者の意図が一致するか否かを特定してもよい。
【0045】
次に、候補履歴クエリ情報の頻度を統計し、その後、所定の頻度条件に基づいて候補履歴クエリ情報を選別することができ、頻度がユーザの好みを反映できると理解される。所定の頻度条件は、候補履歴クエリ情報の頻度が閾値より大きいことを含んでもよく、閾値は5などの数値であってもよい。所定の頻度条件は、候補履歴クエリ情報の頻度順位が上位所定順位にあり、例えば、頻度がtop10にあることを含んでもよい。
【0046】
次に、選別された候補履歴クエリ情報に含まれるエンティティとクエリ情報に含まれるエンティティとが一致するか否かを特定し、エンティティを特定する方式は、名前付きエンティティ識別を含んでもよく、本実施例はこれを限定しない。
【0047】
例えば、クエリ情報及び候補履歴クエリ情報は、それぞれ、「第1ブランドの携帯電話が故障したらどう修理するか」と「第2ブランドの携帯電話が故障したらどう修理するか」であり、両者の意図は一致するが、エンティティは一致しない。
【0048】
本実施例は、所定の選別条件に基づいて、候補履歴クエリ情報からクエリ情報との関連性が高く且つユーザがより関心のある履歴クエリ情報を選別することができ、それにより、その後の履歴クエリ情報に基づいて特定した質問次元の正確性を確保することができる。
【0049】
図3Aは、本開示の実施例によるインタラクション情報を特定する方法の概略原理図であり、図3Bは、本開示の実施例によるインタラクションページの模式図である。
【0050】
本開示の他の実施例によれば、インタラクション情報を特定する方法は、操作S310-操作S340を含み、ここで、操作S340は、操作S310の前に実行される。
【0051】
操作S340において、質問の要否を特定する。
【0052】
操作S310において、複数の質問次元を特定する。
【0053】
操作S320において、目標質問次元を選別する。
【0054】
操作S330において、インタラクション情報を特定する。
【0055】
上記の操作S340において、質問の要否の特定は、前処理プロセスであり、主に、複雑なニーズがあるか否か、質問の方式によってクエリ情報を補足する必要があるか否かを特定する。前処理提示情報テンプレートによって、質問の要否を特定することができ、例えば、ユーザが入力したクエリ情報と前処理提示情報テンプレートとを組み合わせて、大規模モデルに入力し、大規模モデルによって特定結果を出力してもよい。前処理提示情報テンプレートは、所定の記憶領域に予め配置して記憶され、必要に応じて記憶領域から読み出されてもよい。
【0056】
例えば、前処理提示情報テンプレートは、思考連鎖を含んでもよく、当該思考連鎖は複数のステップを含み、当該思考連鎖は、大規模モデルが思考連鎖におけるステップに従って推理するように指示する。例えば、思考連鎖に含まれる複数のステップは、以下の通りである。分析の核心は、クエリ結果が、異なるコンテキストの区分又はユーザの個性化分析、例えば個性化好み、ユーザ個人画像などを考慮する必要があるか否かを判断することにある。そうであれば、現在のクエリが複雑なニーズに属し、質問する必要があると判定し、そうでなければ、質問する必要がないと判定する。
【0057】
また、例えば、前処理提示情報テンプレートは、例示を含んでもよく、例示として、主に例を挙げることによって、どちらが個性化の状況であるか、どちらが異なるコンテキストの区分であるかを説明する。例えば、前処理提示情報テンプレートにおける例示として、クエリ情報が「おもしろい小説推薦」であることを例として、この問題を回答する場合、ユーザの閲読習慣、好きな文学タイプなどの個性化要素を考慮する必要がある。クエリ情報が「北京家屋価格」であることを例として、異なる地域、異なるタイプの家屋の価格に大きな差があるため、その回答には地域、家屋タイプなどの具体的なコンテキスト要素に係わる。これらの問題は、複雑なニーズに属し、質問の余地がある。逆に、クエリ情報が「一時辰が何時間であるか」を例として、このようなニーズは明確であり、コンテキスト又は個人の具体的な状況によって変化しないため、複雑なニーズに属さず、質問を行う必要がない。
【0058】
本実施例は、質問ニーズの判断により、質問の正確性を確保し、これにより、適切な場合に、質問により多くのユーザ情報を取得し、より正確な個性化回答を提供することができる。
【0059】
上記操作S310において、複数の質問次元を特定するプロセスにおいて、対象のクエリ情報及び履歴クエリ情報に基づいて、複数の質問次元を特定することができる。また、特定プロセスにおいて、事前細分化次元分析及び事後細分化次元マイニングという2つの角度を考慮することができる。例えば、提示情報テンプレートにより大規模モデルに対して提示し、事前と事後の2つの角度から、クエリ情報を回答することに影響を与えるコンテキスト要素と個性化要素を分解し、質問次元集合をまとめることができる。ニーズ次元に合わせて細分化可能な選択肢を生成し、インタラクティブなユーザ選択インターフェースを形成する。
【0060】
例えば、クエリ情報「英語コース推奨」について、まず事前分析を行い、異なる学習者がコースの内容、形式などに対して異なる個性化ニーズを有しているため、コース内容、授業方式という細分化次元がまとめられる。事後には、当該問題に基づいて形成された履歴クエリ情報「北京オンライン英語ティーチング」、「小学生に適した英語コース」に基づいて、補足情報が北京、オンライン、小学生を含むことが分析され、質問次元が学習群集、授業方式、地域を含むことがまとめられる。このようにして、質問次元は、{「次元名称」:「コース内容」、「選択肢」:[「日常」、「ビジネス」、「試験」]}、{「次元名称」:「授業方式」、「選択肢」:[「オンライン」、「オフライン」]}、{「次元名称」:「学習群集」、「選択肢」:[「小学生」、「中学生」、「成人」]}、{「次元名称」:「地域」、「選択肢」:[「北京」、「上海」、「広州」]}を含む。
【0061】
本実施例において、大規模モデルの事前知識を利用して、元のニーズの上で直接分析を行い、ユーザの全面のニーズ方向を洞察及び示唆することができる。一方、ユーザの履歴検索行為の事後に合わせて、ユーザの真の具体的なニーズを抽出し、質問内容の信頼度と質問の適用性を強化する。このようにして、ニーズに応じて質問次元毎に細分化選択肢内容を生成することができる。検索インターフェースにおいて、インタラクティブなユーザ選択領域を形成することができ、ユーザが複雑なニーズを明確にするように誘導することを実現する。
【0062】
上記操作S320において、目標質問次元を選別するプロセスにおいて、複数の質問次元の語義情報と、クエリ情報に関連するクエリ結果の語義情報とが一致するか否か、及び複数の質問次元の評価値に基づいて、複数の質問次元から目標質問次元を特定することができる。
【0063】
上記操作S330において、インタラクション情報を特定するプロセスにおいて、目標質問次元における次元名称と複数の選択肢に基づいてインタラクション情報を特定することができる。
【0064】
本開示の他の実施例によれば、上記複数の質問次元を特定するプロセスは、第1提示情報テンプレート、クエリ情報、履歴クエリ情報及びクエリ情報に関連するクエリ結果を第1提示情報として組み合わせ、第1提示情報を大規模モデルに入力し、複数の質問次元を得ることを含んでもよい。第1提示情報テンプレートは、所定の記憶領域に予め配置して記憶され、必要に応じて記憶領域から読み出されてもよい。
【0065】
一例において、第1提示情報テンプレートは、第1思考連鎖を含み、第1思考連鎖は複数のステップを含み、第1思考連鎖は、大規模モデルが第1思考連鎖におけるステップに従って推理するように指示する。例えば、第1思考連鎖に含まれる複数のステップは、クエリ情報と履歴クエリ情報との間の関係タイプを特定し、関係タイプに基づいて質問次元が存在するか否かを特定し、候補質問次元の場合、所定の細分化方向に基づいて質問次元と選択肢を生成することを含む。別の例示では、第1提示情報テンプレートは、大規模モデルのアイデンティティおよびタスクをさらに示してもよい。第1提示情報テンプレートは、大規模モデルの入力情報及び出力情報のフォーマットをさらに示してもよい。第1提示情報テンプレートは、例示をさらに含んでもよい。本実施例において、第1提示情報テンプレートは第1思考連鎖を含み、第1思考連鎖におけるステップにより大規模モデルをガイドし、大規模モデルに正確に質問次元を出力させることができる。
【0066】
例えば、本実施例において、クエリ情報は、「2人で見る映画」であり、履歴クエリ情報は、2人が運動する前に見る映像、1人で見る映画、2人で見る米国映画推薦、カップルで見る映画がどれであるか、という複数の情報を含む。上記クエリ情報と履歴クエリ情報とに基づいて、{‘次元名称’:‘映画タイプ’、‘選択肢’:[‘コメディ’、‘アクション’、‘愛情’、‘空想科学’]}、{‘次元名称’:‘映画産地’、‘選択肢’:[‘米国’、‘中国’、‘印度’、‘他国’]}、{‘次元名称’:‘具体的な注目要素’、‘選択肢’:[‘内容豊富性’、‘視覚効果’、‘ 口コミ及び評価’]}という質問次元を特定することができる。
【0067】
例えば、本実施例において、クエリ情報は「スマホゲームランキングの前10名」であり、履歴クエリ情報は、スマホゲームランキング、武侠類のスマホゲームランキングの前10名、スマホゲームランキングの前10名、スマホゲームランキングの前10名という複数の情報を含む。上記クエリ情報及び履歴クエリ情報に基づいて、{‘次元名称’:‘ゲームタイプ’、‘選択肢’:[‘武侠類’、‘射撃類’、‘ポリシー類’、‘冒険類’]}、{‘次元名称’:‘ランキング根拠’、‘選択肢’:[‘ダウンロード量’、‘アクティブユーザ量’、‘ユーザ使用評価’]}という質問次元を特定することができる。
【0068】
例えば、本実施例において、第1提示情報テンプレートは以下の通りである。
【0069】
あなたは検索Query分析専門家であり、「現在のquery」と「履歴クエリ情報」に基づいて、「現在のquery」に対して質問し、ユーザの意図を細分化し、ユーザが複数回のインタラクティブ検索をするように誘導する必要がある。「細分化」は、ある具体的な意味と定義される。
【0070】
具体的な分解思考ステップは以下の通りである。
【0071】
ステップ1、問題ニーズ分析:ユーザがこの問題によりどのような情報を取得しようとするか、或いはどのような問題を解決しようとするかを分析する。この問題のニーズが明らかであるか否かを判断する。
【0072】
ステップ2、履歴クエリ情報分析:「履歴クエリ情報」を分析し、それらと「現在のquery」との関係を判断し、ここで、関係は主に4種類であり、第1種類は、「現在のquery」と語義が同じであり、情報ゲインがないことである。第2種類は、「現在のquery」と全く関連しないことである。第3種類は、主体またはニーズ内容が変化したことである。第4種類は、「現在のquery」の上で更なる細分化を行ったことである。上記の分析によれば、ユーザ履歴クエリ情報が有効な細分化次元を提供できるか否かを判断し、そうであるとTrueを出力し、そうでなければFalseを出力する。
【0073】
ステップ3において、問題が細分化する必要があるか否かを判断し、ステップ2がFalseでない場合、分析プロセスにおいて「履歴クエリ情報」の内容を参照することができる。具体的に判断する場合、それぞれ「具体的なコンテキストを補足する細分化」、「ユーザ個人状況に合わせる細分化」及び「ニーズ階層の細分化」の3つの方向から、現在の問題が細分化する必要があるか否かを考慮する。3つの方向のいずれも細分化する必要がなければ、問題が十分に具体的であり、それ以上の細分化は不要であることが分かる。そうでなければ、現在の問題をさらに細分化する必要があると判断することができる。問題ニーズと「履歴クエリ情報内容」を組み合わせて、現在の問題が細分化する必要があるか否かを判断する。
【0074】
ステップ4において、細分化次元をリストアップする:「具体的なコンテキストを補足する細分化」、「ユーザ個人状況に合わせる細分化」及び「ニーズ階層の細分化」の3つの方向から、現在の問題の回答に対して重要な影響を有する細分化次元を列挙する。ここで、「ニーズ階層の細分化」の方向の細分化次元は、選択肢の内容がなく、細分化次元のみを提供すればよい。他の2つの方向の細分化次元は選択肢内容を提供する必要がある。
【0075】
ステップ5において、現在のクエリ結果の既存の細分化次元と重複排除する:現在のクエリ結果が、上記分解された細分化次元を含むかどうかを分析し、含まれている場合、次の分析で語義重複の次元を削除してください。
【0076】
##入力フォーマット:query{}、Answer{}、履歴クエリ情報{}。
【0077】
##出力フォーマット:

“問題ニーズ分析”:“ユーザ「現在のQuery」を分析する”。
“履歴クエリ情報分析”:“履歴クエリ情報行為を分析する”。
“問題の細分化要否判断”:“3つの方向から、細分化をトリガするか否かを判断する”。
“細分化次元をリストアップする”:“3つの方向から細分化次元と対応選択肢を列挙する”。
“現在のクエリ結果の既存の細分化次元と重複排除する”:“”。
【0078】
##例示:AAA。
##要求および[例示]に従って、思考プロセスおよび結果を特定する。
【0079】
以上、第1提示情報テンプレートについて説明したが、第1提示情報テンプレートにおけるqueryはクエリ情報を示し、answerはクエリ結果を示すことが理解される。
【0080】
本開示の別の実施例によれば、目標質問次元を選別するプロセスは、重複排除サブプロセス及び価値評価サブプロセスを含んでもよい。
【0081】
重複排除サブプロセスについて、複数の質問次元のそれぞれについて、質問次元の語義情報とクエリ情報に関連するクエリ結果の語義情報とが一致すると特定した場合、複数の質問次元から質問次元を削除し、重複排除された質問次元を得ることができる。
【0082】
評価サブプロセスについて、重複排除された質問次元それぞれの評価値に基づいて、重複排除された質問次元から目標質問次元を特定することができる。
【0083】
なお、クエリ結果にはいくつかの内容が既にフィードバックされている場合、ユーザに関連問題を繰り返す必要がないため、重複排除サブプロセスによって重複の問い合わせを回避し、質問次元の正確性を向上させることができる。質問次元を評価することにより、目標質問次元の正確性をよりユーザクエリニーズに合致させることができる。
【0084】
本開示の別の実施例によれば、目標質問次元を選別するプロセスにおける重複排除サブプロセスは、第2提示情報テンプレート、クエリ情報、クエリ結果及び複数の質問次元を第2提示情報として組み合わせた後、第2提示情報を大規模モデルに入力し、重複排除された質問次元を得ることを含んでもよい。
【0085】
第2提示情報テンプレートの形式は、第1提示情報テンプレートと類似し、例えば、第2提示情報テンプレートは、所定の記憶領域に予め配置して記憶され、使用が必要な場合に記憶領域から読み出されてもよい。例えば、第2提示情報テンプレートは、第2思考連鎖を含み、第2思考連鎖は複数のステップを含み、第2思考連鎖は、大規模モデルが第2思考連鎖におけるステップに従って推理するように指示する。例えば、第2思考連鎖に含まれる複数のステップは、クエリ結果情報に対する要約情報を生成し、要約情報が質問次元と関連するか否かを特定することを含む。別の例では、第2提示情報テンプレートは、大規模モデルのアイデンティティおよびタスクをさらに示してもよい。第2提示情報テンプレートは、さらに、大規模モデルの入力情報および出力情報のフォーマットを示してもよい。第2提示情報テンプレートは、例示を含んでもよい。本実施例において、第2提示情報テンプレートは第2思考連鎖を含み、第2思考連鎖におけるステップによって大規模モデルをガイドすることにより、大規模モデルが重複排除処理を正確に行うことができ、それにより、クエリ結果の既存の内容に対して重複質問を行うことを回避することができる。
【0086】
例えば、本実施例において、第2提示情報テンプレートは以下の通りである。
【0087】
あなたは、質問次元がクエリ結果answerの語義と一致するか否かを評価するためのロボットである。あなたの役割は、入力された<query>、<answer>及び<質問次元>によって、「現在の質問次元がクエリ結果の語義と重複するか否か」の思考ロジックチェーンを生成することである。
【0088】
具体的な思考ステップ及びロジックは以下の通りである。
【0089】
ステップ1において、現在の<query>、<answer>及び<質問次元>を深く理解し、<質問次元>による現在の<query>の理解に対する価値及び影響を深く考えて理解し、現在のクエリ結果においてすでに回答された主な内容をまとめて要約する。
【0090】
ステップ2において、与えられた質問次元リストから、各質問次元の内容が上記ステップ2で言及されたか否かを判断する。言及された場合、当該質問次元と現在のクエリ結果の語義とが重複していると判断し、そうでなければ重複しない。
【0091】
ステップ3において、対応するJSONデータを出力する。
【0092】
以下では、あなたに例示を提供し、あなたは例示によってどのようにして要求される思考連鎖を生成するかを学習する必要がある。
【0093】
例:BBB。
【0094】
次に、1つの入力を提供し、あなたは上記学習した内容によって、深く考えて理解し、対応する重複排除思考連鎖を生成する。
【0095】
以上、第2提示情報テンプレートについて説明した。
【0096】
本開示の別の実施例によれば、目標質問次元を選別するプロセスにおける価値評価サブプロセスは、第3提示情報テンプレート、クエリ情報、クエリ結果及び重複排除された質問次元を第3提示情報として組み合わせ、その後、第3提示情報を大規模モデルに入力して、目標質問次元を得ることを含んでもよい。
【0097】
第3提示情報テンプレートの形式は、第1提示情報テンプレート、第2提示情報テンプレートと同様であり、例えば、第3提示情報テンプレートは、所定の記憶領域に予め配置して記憶され、使用が必要な場合に記憶領域から読み出されてもよい。例えば、第3提示情報テンプレートは第3思考連鎖を含み、第3思考連鎖は複数のステップを含み、第3思考連鎖は、大規模モデルが第3思考連鎖におけるステップに従って推理するように指示する。例えば、第3思考連鎖に含まれる複数のステップは、所定の評価方式に基づいて質問次元の評価値を特定し、評価値に基づいて重複排除された質問次元から目標質問次元を選択することを含み、所定の評価方式は、質問次元による現在の回答に影響する重要度を評価することを含んでもよく、質問次元がユーザのニーズをさらに理解することに役立つか否かという角度から評価することを含んでも良い。別の例では、第3提示情報テンプレートは、大規模モデルのアイデンティティおよびタスクをさらに示してもよい。第3提示情報テンプレートは、さらに、大規模モデルの入力情報および出力情報のフォーマットを示してもよい。第3提示情報テンプレートは、例示をさらに含んでもよい。本実施例において、第3提示情報テンプレートは第3思考連鎖を含み、第3思考連鎖におけるステップによって大規模モデルをガイドすることにより、大規模モデルがより価値のある質問次元を正確に選別することができ、ユーザの満足度を向上させ、質問次元の価値及び適用性を確保することができる。
【0098】
例えば、本実施例において、第3提示情報テンプレートは以下の通りである。
【0099】
あなたは、質問次元事前価値程度を評価するためのロボットである。あなたの役割は、入力された<query>、<answer>及び<質問次元>によって、「質問次元事前価値を分析する」思考ロジックチェーンを生成することである。
【0100】
具体的な思考ステップ及びロジックは以下の通りである。
【0101】
ステップ1において、現在の<query>、<answer>及び<質問次元>を深く理解し、<質問次元>による現在の<query>に対する価値及び影響を深く考えて理解する。
【0102】
ステップ2において、新たに提出された質問次元の価値程度を評価し、具体的な評価基準は、現在の細分化方向が問題回答に影響する重要な要素であるか否か、及び現在の質問ニーズを深く理解することに有効であるか否かのことである。
【0103】
ステップ3において、最後に、その中から最も価値のある3つの目標質問次元を選択し、各目標質問次元において、最大4つの選択肢の内容を与え、選択肢の内容の間で互いに排他的であるか否かを判断する。
【0104】
例:CCC。
【0105】
以上、第3提示情報テンプレートについて説明した。
【0106】
本開示の他の実施例によれば、複数の目標質問次元を取得した後、複数の目標質問次元をソートしてもよく、目標質問次元がクリックされた頻度に基づいてソートしてもよい。例えば、クエリ情報を入力したユーザが所属するユーザグループを特定し、その後、当該ユーザグループが履歴検索プロセスにおいて目標質問次元をクリックする頻度を特定してもよい。そして、頻度の高低に基づいて目標質問次元をソートする。なお、同一のユーザグループにおける複数のユーザの意図が比較的近い場合があり、本実施例は、ユーザグループの履歴操作によって目標質問次元の順位を特定することにより、より価値のある目標質問次元を優先的に提示することができる。
【0107】
本開示の他の実施例によれば、インタラクション情報を特定するプロセスは、第4提示情報テンプレート、クエリ情報及び目標質問次元を第4提示情報として組み合わせた後、第4提示情報を大規模モデルに入力し、インタラクション情報における質問問題を得ることを含んでもよい。
【0108】
第4提示情報テンプレートの形式は、第1提示情報テンプレート、第2提示情報テンプレート、第3提示情報テンプレートと類似し、例えば、第4提示情報テンプレートは、所定の記憶領域に予め配置して記憶され、使用が必要な場合に記憶領域から読み出されてもよい。例えば、第4提示情報テンプレートは第4思考連鎖を含み、第4思考連鎖は複数のステップを含み、第4思考連鎖は、大規模モデルが第4思考連鎖におけるステップに従って推理するように指示する。例えば、第4思考連鎖に含まれる複数のステップは、クエリ情報及び質問次元に基づいてクエリシーンを特定し、クエリシーンに基づいてインタラクション情報における質問問題を生成することを含む。別の例では、第4提示情報テンプレートは、大規模モデルのアイデンティティおよびタスクをさらに示してもよい。第4提示情報テンプレートは、さらに、大規模モデルの入力情報および出力情報のフォーマットを示してもよい。第4提示情報テンプレートは、例示をさらに含んでもよい。本実施例において、第4提示情報テンプレートは第4思考連鎖を含み、第4思考連鎖におけるステップにより大規模モデルをガイドし、大規模モデルが質問問題を正確に出力することができる。
【0109】
例えば、本実施例において、第4提示情報テンプレートは以下の通りである。
【0110】
あなたのタスクは、元の検索問題、質問問題の情報角度及び質問問題の選択肢に基づいて、この質問問題を再構成する。具体的には、以下のステップに従う必要がある。
【0111】
ステップ1において、現在の検索問題及び質問問題の情報角度を深く理解し、質問のキーファクタとユーザのニーズを分析し、ユーザの質問時の可能な背景又はシーンを推定する。
【0112】
ステップ2において、ユーザの質問背景に基づいて、提供された質問問題の情報角度と選択肢を参考して、簡単で流暢な質問問題を形成する。
【0113】
例示:
入力:「検索問題」:「AA」;「次元名称」:「BB」;「選択肢」:「CC」。
出力:
“ステップ1”:“ユーザ質問DD、この問題のキーファクタはEEであり、ユーザニーズはFFである。ユーザが直面する可能性のある背景またはシーンはGGであるため、HHを特定する必要がある”。
【0114】
“ステップ2”:“質問問題の情報角度がIIであり、現在の質問背景に基づいて、キーワードJJに対して質問問題を提出し、ユーザがKKを補足するように誘導することができる”。
【0115】
“最終的な質問問題”:“LL”。
【0116】
以上、第4提示情報テンプレートについて説明した。
【0117】
なお、本開示のいくつかの実施例は、大規模言語モデルとプロンプトエンジニアリング(Prompt Engineering)を組み合わせ、提示情報テンプレートを用いて、大規模モデルが結果を出力するようにガイドする。大規模モデルは、大規模言語モデル(Large Language Model、LLM)、生成モデルなどであってもよく、本開示は、大規模モデルを限定しない。提示情報テンプレート(例えば、前処理提示情報テンプレート、第1提示情報テンプレート、第2提示情報テンプレート、第3提示情報テンプレート、第4提示情報テンプレート、および第5提示情報テンプレートなど)は、いずれも自然言語で記述されたテキスト情報であってもよい。各提示情報テンプレートは、所定の記憶領域に予め配置して記憶され、使用が必要な場合に記憶領域から読み出されてもよい。
【0118】
本開示の他の実施例によれば、インタラクション情報を取得した後、インタラクション情報を複数の方式で応用することができる。ある応用シーンにおいて、フロントエンドページを介してインタラクション情報を表示し、これにより、ユーザが質問次元に基づいて選択操作を行い、クエリ内容を補足することができる。
【0119】
例えば、ユーザがいくつかの選択肢を選択した後、ユーザがクリックした選択肢に基づいて、新たなクエリ情報を新たに特定し、その後、新しいクエリ情報に基づいてクエリを行うことにより、ユーザに表示するクエリ結果を更新することができる。例えば、クエリ情報が「漢方医学により体を調整する」ことであり、質問次元名称が「性別」であり、ユーザが選択した選択肢が「女性」であれば、新しいクエリ情報は「女性が漢方医学により体を調整する」ことであってもよい。
【0120】
また、ユーザが選択肢を選択した後、ユーザが選択した選択肢を自然言語に変換してもよい。例えば、質問次元名称が「性別」であり、ユーザが選択した選択肢が「女性」であり、変換後のテキスト情報が「私の性別が女性である」であってもよく、ページの入力ボックスに当該変換されたテキスト情報が入力されてもよい。
【0121】
本開示の他の実施例によれば、インタラクション情報を取得した後、インタラクション情報を複数の方式で応用することができる。別の応用シーンでは、インタラクション情報を利用してトレーニングサンプルを構築し、トレーニングサンプルを利用して他のモデルをトレーニングすることができ、このように、リソースが限られている場合、トレーニングされた他のモデルを利用してユーザと対話する。
【0122】
例えば、他のモデルが2つのSFTモデルを含むことを例として、区別を容易にするために、以下、1つのSFTモデルを第1モデルとし、もう1つのSFTモデルを第2モデルとする。
【0123】
第1モデルについて、当該第1モデルが生成モデルであってもよい。トレーニングプロセスにおいて、インタラクション情報に対して精密ラベル付けを行い、その後、精密ラベル付け後のデータをトレーニングサンプルとして、第1モデルをトレーニングしてもよい。トレーニングされた後、第1モデルの入力は、クエリ情報、履歴クエリ情報、クエリ情報に関連するクエリ結果を含んでもよく、第1モデルに適用される提示情報テンプレートをさらに含んでもよい。第1モデルの出力は、質問次元と、質問選択肢と、質問次元を自然言語変換した質問問題とを含んでもよい。
【0124】
例えば、第1モデルの出力例は以下の通りである。{“質問次元”:“名前の意味”、“質問問題”:“子供の名前に対して、ご希望の意味は何ですか”、“選択肢”:[“聡明知恵”、“健康平安”、“品性高尚”]、“選択肢が互いに排他するか否か”:“はい”、{“質問次元”:“名前出典”、“質問問題”:“ご希望のこの名前の出典は何ですか”、“選択肢”:[“唐詩”、“宋詞”、“詩経”、“楚辞”]、“ 選択肢が互いに排他するか否か”:“いいえ”}である。
【0125】
第2モデルについて、当該第2モデルは生成モデルであってもよい。第2モデルは、上記の質問次元、質問選択肢及び質問問題に基づいて、一貫した自然言語テキストを生成して、フロントエンドページの入力ボックスに記入する。例えば、第2モデルの出力は、私の赤ちゃんの性別が男の子であり、勇敢強固、善良友愛という意味を込めることを希望する。
【0126】
例えば、事前に配置された提示情報テンプレートによって第2モデルが自然言語化の質問問題を生成するように誘導してしてもよく、当該提示情報テンプレートは例えば以下の通りである。
【0127】
仮に、あなたが人工知能アシスタントであり、あなたの主要な機能は問題分析と次元補足であり、次元補足をより自然言語化した表現方式でユーザにフィードバックし、ユーザとあなたとの持続的な交流を誘導する。
【0128】
全体分析プロセスは以下の通りである。
【0129】
思考プロセス:第1ステップは、質問に合わせて、各次元について、インタラクションガイドにおける質問者の角度に基づいて、自然言語化されたガイド式記述の修正を行う。第2ステップは、各次元にについて、ランダムに1つの選択肢を選択し、問題に合わせて、インタラクションガイドにおける回答者の角度に基づいて、自然言語化されたニーズ補足説明を与える。
【0130】
次元ガイド変換:思考プロセスにおける第1ステップに基づいて、各次元の自然言語化されたガイド式記述の修正後の結果を与える。
【0131】
ニーズ補足説明:思考プロセスにおける第2ステップに基づいて、ニーズ補足説明ガイドを提供する。
【0132】
例示は以下の通りである。
【0133】
問題:布団と敷き布団の区別。
【0134】
補足次元:[{“次元名称”:“対比の方面”、“次元下選択肢”:[“厚さ”、“材質”、“清潔”]}]。
【0135】
全体分析プロセス:
“思考プロセス”:補足次元には“対比の方面”という1つの次元があり、問題に合わせて、自然言語化された説明を行い、“布団と敷き布団との区別について、より関心のある対比の方面は何ですか”に変換することができる。ユーザが「対比の方面」という次元において「厚さ」を選択したと仮定すると、ユーザ本人のニーズ補足説明を組織することができ、具体的には、「布団と敷き布団について対比の方面が厚さである場合の違いを知りたい」である。
【0136】
“次元ガイド変換”:[“布団と敷き布団との区別について、より関心のある対比の方面が何ですか”]。
【0137】
“ニーズ補足説明”:{“接頭辞”:“布団と敷き布団について”:“次元選択肢の組合せ”:[“対比の方面が厚さである”]、“接尾辞”:“場合の違いを知りたい”}。
【0138】
注意事項は、出力フォーマットが所定の関数を用いて分析されてもよいことである。
【0139】
以上の全体分析プロセス及び例示に基づいて、以下の問題及び補足次元を分析してください。
【0140】
問題:MMM
補足次元:NNN
【0141】
以上、第2モデルをガイドする提示情報テンプレートについて説明した。
【0142】
図4は、本開示の実施例によるインタラクション情報を特定する装置の概略構成ブロック図である。
【0143】
図4に示すように、インタラクション情報を特定する装置400は、第1特定モジュール410と、第2特定モジュール420と、第3特定モジュール430とを含んでもよい。
【0144】
第1特定モジュール410は、対象のクエリ情報及び履歴クエリ情報に基づいて、複数の質問次元を特定し、各質問次元は、次元名称及び複数の選択肢を含む。
【0145】
第2特定モジュール420は、複数の質問次元の語義情報と、クエリ情報に関連するクエリ結果の語義情報とが一致するか否か、及び複数の質問次元の評価値に基づいて、複数の質問次元から目標質問次元を特定する。
【0146】
第3特定モジュール430は、目標質問次元における次元名称及び複数の選択肢に基づいて、インタラクション情報を特定する。
【0147】
本開示の別の実施例において、上記装置は、候補履歴クエリ情報のうち、候補履歴クエリ情報の意図がクエリ情報の意図と一致し、候補履歴クエリ情報の検索頻度が所定の頻度条件を満たし、候補履歴クエリ情報に含まれるエンティティがクエリ情報に含まれるエンティティと一致するという条件を満たす候補履歴クエリ情報を履歴クエリ情報として特定する履歴情報特定モジュールをさらに含む。
【0148】
本開示の別の実施例において、第1特定モジュールは、第1組合せサブモジュールと第1入力サブモジュールとを含む。第1組合せサブモジュールは、第1提示情報テンプレートと、クエリ情報と、履歴クエリ情報と、クエリ情報に関連するクエリ結果とを第1提示情報として組み合わせ、第1入力サブモジュールは、第1提示情報を大規模モデルに入力して、複数の質問次元を取得し、第1提示情報テンプレートは、第1思考連鎖を含み、第1思考連鎖は、大規模モデルが、クエリ情報と履歴クエリ情報との間の関係タイプを特定し、関係タイプに基づいて質問次元が存在するか否かを特定し、候補質問次元の場合、所定の細分化方向に基づいて質問問題と選択肢を生成する、という方式によって複数の質問次元を取得するように指示する。
【0149】
本開示の別の実施例において、第2特定モジュールは、削除サブモジュールと特定サブモジュールとを含む。削除サブモジュールは、複数の質問次元のそれぞれについて、質問次元の語義情報とクエリ情報に関連するクエリ結果の語義情報とが一致すると特定した場合、複数の質問次元から質問次元を削除し、重複排除後の質問次元を取得し、特定サブモジュールは、重複排除後の質問次元それぞれの評価値に基づいて、重複排除後の質問次元から目標質問次元を特定する。
【0150】
本開示の別の実施例において、削除サブモジュールは、第1組合せユニットと第1入力ユニットとを含む。第1組合せユニットは、第2提示情報テンプレート、クエリ情報、クエリ結果及び複数の質問次元を第2提示情報として組合せ、第1入力ユニットは、第2提示情報を大規模モデルに入力し、重複排除後の質問次元を取得し、ここで、第2提示情報テンプレートは、第2思考連鎖を含み、第2思考連鎖は、大規模モデルが、クエリ結果に対する要約情報を生成し、要約情報が質問次元と関連するか否かを特定するという方式によって重複排除後の質問次元を取得するように指示する。
【0151】
本開示の別の実施例において、特定サブモジュールは、第2組み合わせユニットと第2入力ユニットとを含む。第2組合せユニットは、第3提示情報テンプレートと、クエリ情報と、クエリ結果と、重複排除後の質問次元とを第3提示情報として組合せ、第2入力ユニットは、第3提示情報を大規模モデルに入力して、目標質問次元を取得し、ここで、第3提示情報テンプレートは、第3思考連鎖を含み、第3思考連鎖は、大規模モデルが、所定の評価方式に基づいて質問次元の評価値を特定し、評価値に基づいて、重複排除後の質問次元から目標質問次元を選択するという方式によって目標質問次元を取得するように指示する。
【0152】
本開示の別の実施例において、第3特定モジュールは、第2組合せサブモジュール及び第2入力サブモジュールを含む。第2組合せサブモジュールは、第4提示情報テンプレートと、クエリ情報と、目標質問次元とを第4提示情報として組合せ、第2入力サブモジュールは、第4提示情報を大規模モデルに入力し、インタラクション情報における質問問題を取得し、ここで、第4提示情報テンプレートは、第4思考連鎖を含み、第4思考連鎖は、大規模モデルが、クエリ情報と質問次元に基づいてクエリシーンを特定し、クエリシーンに基づいてインタラクション情報における質問問題を生成するという方式によってインタラクション情報における質問問題を取得するように指示する。
【0153】
本開示の実施例によれば、本開示は、少なくとも1つのプロセッサと、少なくとも1つのプロセッサと通信接続されるメモリとを含む電子機器をさらに提供し、メモリは、少なくとも1つのプロセッサによって実行可能な命令を記憶し、命令は、少なくとも1つのプロセッサによって実行されることによって、少なくとも1つのプロセッサが上記インタラクション情報の特定方法を実行することができる。
【0154】
本開示の実施例によれば、本開示は、コンピュータ命令が記憶されている非一時的なコンピュータ可読記憶媒体をさらに提供し、ここで、コンピュータ命令は、コンピュータに上記インタラクション情報の特定方法を実行させる。
【0155】
本開示の実施例によれば、本開示は、プロセッサによって実行されると、上記インタラクション情報の特定方法を実現するコンピュータプログラムをさらに提供する。
【0156】
図5は、本開示の実施例に係るインタラクション情報の特定方法を実施するための電子機器の構造ブロック図である。電子機器は、様々な形式のデジタルコンピュータを示すことを目的とし、例えば、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ及び他の適切なコンピュータである。電子機器は、さらに様々な形式の移動装置を示してもよく、例えば、パーソナルデジタルアシスタント、携帯電話、スマートフォン、ウェアラブル機器及び他の類似の演算装置である。本明細書に示された部材、それらの接続及び関係、並びにそれらの機能は、例示に過ぎず、本明細書に記載された及び/又は要求された本開示の実現を限定しない。
【0157】
図5に示すように、機器500は、計算ユニット501を含み、計算ユニット501は、リードオンリーメモリ(ROM)502に記憶されたコンピュータプログラム又は記憶ユニット508からランダムアクセスメモリ(RAM)503にロードされたコンピュータプログラムに基づいて、様々な適切な動作及び処理を実行してもよい。RAM503には、さらに機器500の操作に必要な様々なプログラム及びデータを記憶してもよい。計算ユニット501、ROM502、及びRAM503は、バス504を介して相互に接続される。入出力(I/O)インターフェース505も、バス504に接続される。
【0158】
機器500における複数の部品は、I/Oインターフェース505に接続され、例えばキーボード、マウス等の入力ユニット506と、例えば様々な種類のディスプレイ、スピーカ等の出力ユニット507と、例えば磁気ディスク、光ディスク等の記憶ユニット508と、例えばネットワークカード、モデム、無線通信トランシーバ等の通信ユニット509とを含む。通信ユニット509は、機器500がインターネット等のコンピュータネットワーク及び/又は各種の電気ネットワークを介して他の機器と情報・データをやり取りすることを可能にする。
【0159】
計算ユニット501は、処理及び演算能力を有する各種の汎用及び/又は専用の処理モジュールであってもよい。計算ユニット501の幾つかの例として、中央処理ユニット(CPU)、GPU(Graphics Processing Unit)、各種専用の人工知能(AI)演算チップ、各種機械学習モデルアルゴリズムをランニングする演算ユニット、DSP(Digital Signal Processor)、並びに任意の適切なプロセッサ、コントローラ、マイクロコントローラ等が挙げられるが、これらに限定されない。計算ユニット501は、前文で記載された各方法及び処理、例えばインタラクション情報の特定方法を実行する。例えば、幾つかの実施例において、インタラクション情報の特定方法は、例えば記憶ユニット508のような機械可読媒体に有形的に含まれるコンピュータソフトウェアプログラムとして実現されてもよい。いくつかの実施例において、コンピュータプログラムの一部又は全部は、ROM 502及び/又は通信ユニット509を介して機器500にロード及び/又はインストールされてもよい。コンピュータプログラムがRAM503にロードされて計算ユニット501により実行される場合、前文に記載のインタラクション情報の特定方法の1つ又は複数のステップを実行してもよい。代替的に、他の実施例において、計算ユニット501は、他の任意の適切な方式(例えば、ファームウェアを介する)によりインタラクション情報の特定方法を実行するように構成されてもよい。
【0160】
本明細書で以上に説明されたシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、特定用途向け標準製品(ASSP)、システムオンチップ(SOC)、コンプレックスプログラマブルロジックデバイス(CPLD)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせにおいて実現されてもよい。これらの様々な実施形態は、1つ又は複数のコンピュータプログラムにおいて実施され、該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステムで実行され及び/又は解釈されることが可能であり、該プログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、かつデータ及び命令を該記憶システム、該少なくとも1つの入力装置、及び該少なくとも1つの出力装置に伝送することができることを含んでもよい。
【0161】
本開示の方法を実施するためのプログラムコードは、1つ又は複数のプログラミング言語の任意の組み合わせで作成されてもよい。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ又は他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供されてもよく、それによって、プログラムコードがプロセッサ又はコントローラにより実行される時に、フローチャート及び/又はブロック図に規定された機能・操作が実施される。プログラムコードは、機器に完全に実行されてもよく、部分的に機器で実行されてもよく、独立したソフトウェアパッケージとして部分的に機器で実行され、かつ部分的に遠隔機器で実行されるか又は完全に遠隔機器又はサーバで実行されてもよい。
【0162】
本開示のコンテキストにおいて、機械可読媒体は、有形の媒体であってもよく、命令実行システム、装置又は電子機器に使用され、又は命令実行システム、装置又は電子機器と組み合わせて使用されるプログラムを含んで又は記憶してもよい。機械可読媒体は、機械可読信号媒体又は機械可読記憶媒体であってもよい。機械可読媒体は、電子の、磁気的、光学的、電磁的、赤外線の、又は半導体システム、装置又は機器、又は上記内容の任意の適切な組み合わせを含んでもよいが、それらに限定されない。機械可読記憶媒体のより具体的な例としては、1つ以上の線による電気的接続、携帯式コンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、消去可能なプログラマブルリードオンリーメモリ(EPROM又はフラッシュメモリ)、光ファイバ、コンパクトディスクリードオンリーメモリ(CD-ROM)、光学記憶装置、磁気記憶装置、又は上記内容の任意の適切な組み合わせを含む。
【0163】
ユーザとの対話を提供するために、コンピュータにここで説明されたシステム及び技術を実施させてもよく、該コンピュータは、ユーザに情報を表示するための表示装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウス又はトラックボール)とを備え、ユーザは、該キーボード及び該ポインティングデバイスを介して入力をコンピュータに提供することができる。他の種類の装置は、さらにユーザとの対話を提供してもよく、例えば、ユーザに提供されたフィードバックは、いかなる形式のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、かついかなる形式(音声入力、語音入力又は、触覚入力を含む)でユーザからの入力を受信してもよい。
【0164】
ここで説明されたシステム及び技術は、バックグラウンド部品を含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェア部品を含むコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンド部品を含むコンピューティングシステム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザが該グラフィカルユーザインタフェース又は該ネットワークブラウザを介してここで説明されたシステム及び技術の実施形態と対話することができる)、又はこのようなバックグラウンド部品、ミドルウェア部品、又はフロントエンド部品のいずれかの組み合わせを含むコンピューティングシステムに実施されることが可能である。任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によりシステムの部品を互いに接続することができる。通信ネットワークの例としては、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)及びインターネットを例示的に含む。
【0165】
コンピュータシステムは、クライアント及びサーバを含んでもよい。クライアントとサーバ同士は、一般的に離れており、通常、通信ネットワークを介して対話する。クライアントとサーバとの関係は、該当するコンピュータ上でランニングし、クライアント-サーバの関係を有するコンピュータプログラムによって生成される。
【0166】
理解されるべきこととして、以上に示された様々な形式のフローを使用してもよく、操作を改めてソーティングしたり、追加したり又は削除してもよい。例えば、本開示に記載の各操作は、並列に実行されたり、順次に実行されたり、又は異なる順序で実行されてもよく、本開示に開示された技術案の所望の結果を実現することができれば、本明細書はここで限定されない。
【0167】
上記具体的な実施形態は、本開示の保護範囲を限定するものではない。当業者であれば、設計要件及び他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション及び代替を行うことが可能であると理解すべきである。本開示の精神と原則内で行われる任意の修正、均等置換及び改良などは、いずれも本開示の保護範囲内に含まれるべきである。
図1
図2
図3A
図3B
図4
図5