IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッドの特許一覧

特開2024-174859データ生成方法及び装置、機器及び媒体
<>
  • 特開-データ生成方法及び装置、機器及び媒体 図1
  • 特開-データ生成方法及び装置、機器及び媒体 図2
  • 特開-データ生成方法及び装置、機器及び媒体 図3
  • 特開-データ生成方法及び装置、機器及び媒体 図4
  • 特開-データ生成方法及び装置、機器及び媒体 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024174859
(43)【公開日】2024-12-17
(54)【発明の名称】データ生成方法及び装置、機器及び媒体
(51)【国際特許分類】
   G06F 16/90 20190101AFI20241210BHJP
【FI】
G06F16/90 100
【審査請求】有
【請求項の数】19
【出願形態】OL
【外国語出願】
【公開請求】
(21)【出願番号】P 2024098716
(22)【出願日】2024-06-19
(31)【優先権主張番号】202310798540.8
(32)【優先日】2023-06-30
(33)【優先権主張国・地域又は機関】CN
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.WINDOWS PHONE
2.ANDROID
(71)【出願人】
【識別番号】514322098
【氏名又は名称】ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus, No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100229448
【弁理士】
【氏名又は名称】中槇 利明
(72)【発明者】
【氏名】ゾーァヤーン レイ
(72)【発明者】
【氏名】スーチイ バオ
(72)【発明者】
【氏名】ホワ ウー
(72)【発明者】
【氏名】ハイフオン ワーン
(57)【要約】      (修正有)
【課題】ユーザのクエリ内容に基づいて回答を生成することで、ユーザと対話することを実現するデータ生成方法、装置、電子機器、コンピュータ可読記憶媒体、およびコンピュータプログラム製品を提供する。
【解決手段】データ生成方法は、ユーザからの第1のクエリデータに基づいて、第1の回答データを生成することと、前記第1の回答データに対する前記ユーザのネガティブフィードバックを受信したことに応答して、前記第1の回答データと前記ネガティブフィードバックに基づいて、前記第1の回答データに対する第1の再考結果を確定し、前記第1の再考結果は、前記第1の回答データに対する前記ユーザのフィードバックがネガティブフィードバックである診断理由を示すことと、前記第1のクエリデータと前記第1の再考結果に基づいて、前記第1のクエリデータに対する第2の回答データを生成することと、を含む。
【選択図】図2
【特許請求の範囲】
【請求項1】
データ生成方法であって、前記方法は、
ユーザからの第1のクエリデータに基づいて、第1の回答データを生成することと、
前記第1の回答データに対する前記ユーザのネガティブフィードバックを受信したことに応答して、前記第1の回答データと前記ネガティブフィードバックに基づいて、前記第1の回答データに対する第1の再考結果を確定し、前記第1の再考結果は、前記第1の回答データに対する前記ユーザのフィードバックがネガティブフィードバックである診断理由を示すことと、
前記第1のクエリデータと前記第1の再考結果に基づいて、前記第1のクエリデータに対する第2の回答データを生成することとを含む、データ生成方法。
【請求項2】
前記の、ユーザからの第1のクエリデータに基づいて第1の回答データを生成することは、
前記第1のクエリデータに基づいて、入力データに基づいて回答データを生成するための深層学習モデルに用いられる第1の入力データを確定することと、
前記第1の入力データを前記深層学習モデルに入力することで、前記第1の回答データを取得することとを含み、
ここでは、前記の、前記第1のクエリデータと前記第1の再考結果に基づいて、前記第1のクエリデータに対する第2の回答データを生成することは、
前記第1のクエリデータと前記第1の再考結果に基づいて、前記深層学習モデルに用いられる第2の入力データを確定することと、
前記第2の入力データを前記深層学習モデルに入力することで、前記第2の回答データを取得することとを含む、請求項1に記載の方法。
【請求項3】
前記の、前記第1のクエリデータと前記第1の再考結果に基づいて、前記深層学習モデルに用いられる第2の入力データを確定することは、
前記第1のクエリデータ、前記第1の再考結果、および前記第2の入力データが前記第1の再考結果を含むことを示すタスク説明情報に基づいて、前記第2の入力データを確定することを含む、請求項2に記載の方法。
【請求項4】
前記の、前記第1の回答データと前記第1のフィードバックに基づいて、前記第1の回答データに対する第1の再考結果を確定することは、
前記第1の回答データと前記第1のフィードバックを再考生成ネットワークに入力することで、前記再考生成ネットワークによって出力される前記第1の再考結果を取得することを含み、ここで、前記再考生成ネットワークはサンプルコーパスを利用してトレーニングして得られ、前記サンプルコーパスは、サンプル回答データ、サンプルフィードバック、および前記サンプル回答データに対するサンプル再考結果を含む、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記の、前記第1の回答データに対する前記ユーザのネガティブフィードバックを受信したことに応答して、前記第1の回答データと前記ネガティブフィードバックに基づいて、前記第1の回答データに対する第1の再考結果を確定することは、
前記第1の回答データに対する前記ユーザの第1のフィードバックを受信したことに応答して、前記第1のフィードバックがネガティブフィードバックであると確定したことに応答して、前記第1の回答データと前記第1のフィードバックに基づいて、前記第1の回答データに対する第1の再考結果を確定することを含む、請求項1~3のいずれか一項に記載の方法。
【請求項6】
ユーザからの第2のクエリデータと前記第1のクエリデータとの類似度が予め設定される閾値よりも大きいと確定したことに応答して、前記第1のクエリデータ、前記第2の回答データ、および前記第2のクエリデータに基づいて、前記第2のクエリデータに対する第3の回答データを生成することをさらに含む、請求項1~3のいずれか一項に記載の方法。
【請求項7】
前記第1のクエリデータと前記第2の回答データをメモリバンクに記憶することをさらに含み、
前記の、ユーザからの第2のクエリデータと前記第1のクエリデータとの類似度が予め設定される閾値よりも大きいと確定したことに応答して、前記第1のクエリデータ、前記第2の回答データ、および前記第2のクエリデータに基づいて、前記第2のクエリデータに対する第3の回答データを生成することは、
ユーザからの第2のクエリデータと前記メモリバンクにおける第1のクエリデータとの類似度が前記予め設定される閾値よりも大きいと確定したことに応答して、前記メモリバンクから前記第2の回答データを取得することと、
前記第1のクエリデータ、前記第2の回答データ、および前記第2のクエリデータに基づいて、前記第3の回答データを生成することとを含む、請求項6に記載の方法。
【請求項8】
前記第1の再考結果は、前記第1の回答データに対する最適化ポリシーをさらに含む、請求項1~3のいずれか一項に記載の方法。
【請求項9】
データ生成装置であって、前記装置は、
ユーザからの第1のクエリデータに基づいて、第1の回答データを生成するように構成される第1の生成ユニットと、
前記第1の回答データに対する前記ユーザのネガティブフィードバックを受信したことに応答して、前記第1の回答データと前記ネガティブフィードバックに基づいて、前記第1の回答データに対する第1の再考結果を確定するように構成される確定ユニットであって、前記第1の再考結果は、前記第1の回答データに対する前記ユーザのフィードバックがネガティブフィードバックである診断理由を示すものと、
前記第1のクエリデータと前記第1の再考結果に基づいて、前記第1のクエリデータに対する第2の回答データを生成する第2の生成ユニットとを含む、データ生成装置。
【請求項10】
前記第1の生成ユニットは、
前記第1のクエリデータに基づいて、入力データに基づいて回答データを生成するための深層学習モデルに用いられる第1の入力データを確定するように構成される第1の確定サブユニットと、
前記第1の入力データを前記深層学習モデルに入力することで、前記第1の回答データを取得するように構成される第1の入力サブユニットとを含み、
前記第2の生成ユニットは、
前記第1のクエリデータと前記第1の再考結果に基づいて、前記深層学習モデルに用いられる第2の入力データを確定するように構成される第2の確定サブユニットと、
前記第2の入力データを前記深層学習モデルに入力することで、前記第2の回答データを取得するように構成される第2の入力サブユニットとを含む、請求項9に記載の装置。
【請求項11】
前記第2の入力サブユニットは、
前記第1のクエリデータ、前記第1の再考結果、および前記第2の入力データが前記第1の再考結果を含むことを示すタスク説明情報に基づいて、前記第2の入力データを確定するように構成される、請求項10に記載の装置。
【請求項12】
前記確定ユニットは、
前記第1の回答データと前記第1のフィードバックを再考生成ネットワークに入力することで、前記再考生成ネットワークによって出力される前記第1の再考結果を取得し、ここで、前記再考生成ネットワークはサンプルコーパスを利用してトレーニングして得られ、前記サンプルコーパスは、サンプル回答データ、サンプルフィードバック、および前記サンプル回答データに対するサンプル再考結果を含むように構成される、請求項9~11のいずれか一項に記載の装置。
【請求項13】
前記確定ユニットは、
前記第1の回答データに対する前記ユーザの第1のフィードバックを受信したことに応答して、前記第1のフィードバックがネガティブフィードバックであると確定したことに応答して、前記第1の回答データと前記第1のフィードバックに基づいて、前記第1の回答データに対する第1の再考結果を確定するように構成される、請求項9~11のいずれか一項に記載の装置。
【請求項14】
ユーザからの第2のクエリデータと前記第1のクエリデータとの類似度が予め設定される閾値よりも大きいと確定したことに応答して、前記第1のクエリデータ、前記第2の回答データ、および前記第2のクエリデータに基づいて、前記第2のクエリデータに対する第3の回答データを生成するように構成される第3の生成ユニットをさらに含む、請求項9~1のいずれか一項に記載の装置。
【請求項15】
前記第1のクエリデータと前記第2の回答データをメモリバンクに記憶するように構成される記憶ユニットをさら含み、
前記第3の生成ユニットは、
ユーザからの第2のクエリデータと前記メモリバンクにおける第1のクエリデータとの類似度が前記予め設定される閾値よりも大きいと確定したことに応答して、前記メモリバンクから前記第2の回答データを取得するように構成される取得サブユニットと、
前記第1のクエリデータ、前記第2の回答データ、および前記第2のクエリデータに基づいて、前記第3の回答データを生成するように構成される生成サブユニットとを含む、請求項14に記載の装置。
【請求項16】
前記第1の再考結果は、前記第1の回答データに対する最適化ポリシーをさらに含む、請求項9~11のいずれか一項に記載の装置。
【請求項17】
電子機器であって、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信接続されたメモリとを含み、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶されており、前記命令は前記少なくとも1つのプロセッサによって実行されることにより、前記少なくとも1つのプロセッサは請求項1に記載の方法を実行させることができる、電子機器。
【請求項18】
コンピュータ命令が記憶された非一時的コンピュータ可読記憶媒体であって、前記コンピュータ命令は、コンピュータに請求項1に記載の方法を実行させるために用いられる、非一時的コンピュータ可読記憶媒体。
【請求項19】
コンピュータプログラムを含むコンピュータプログラム製品であって、前記コンピュータプログラムは、プロセッサによって実行されると、請求項1に記載の方法を実現する、コンピュータプログラム製品。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、人工知能技術分野に関し、特に自然言語処理と深層学習などの分野に関し、具体的には、データ生成方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム製品に関する。
【背景技術】
【0002】
人工インテリジェントは、コンピュータに人間のいくつかの思惟過程及び知的行動(例えば、学習、推理、思考、計画など)を模擬させるように研究する科目であり、ハードウェア面の技術もあれば、ソフトウェア面の技術もある。人工インテリジェントのハードウェア技術は、一般的にセンサ、人工インテリジェント専用チップ、クラウドコンピューティング、分散ストレージ、ビッグデータ処理などの技術を含み、人工知能ソフトウェア技術は、主にコンピュータ視覚技術、音声認識技術、自然言語処理技術及び機械学習/深層学習、ビッグデータ処理技術、ナレッジグラフ技術などのいくつかの大きな方向を含む。
【0003】
生成式言語メガモデルは様々な自然言語処理タスクに応用することができ、特にユーザのクエリ内容に基づいて回答のための自然言語テキストを生成することで、ユーザと対話することを実現することができる。
【0004】
該部分で説明される方法は、必ずしも以前に想定された方法又は採用された方法ではない。特に断りのない限り、該部分に記載されているいずれの方法は、該部分に含まれるだけで従来技術であると考えられるべきではない。同様に、特に断りのない限り、該部分で言及されている課題は、いかなる従来の技術で承認されたものであると考えるべきではない。
【発明の概要】
【0005】
本開示は、データ生成方法、装置、電子機器、コンピュータ可読記憶媒体、およびコンピュータプログラム製品を提供する。
【0006】
本開示の一態様によれば、データ生成方法を提供し、前記方法は、ユーザからの第1のクエリデータに基づいて、第1の回答データを生成することと、前記第1の回答データに対する前記ユーザのネガティブフィードバックを受信したことに応答して、前記第1の回答データと前記ネガティブフィードバックに基づいて、前記第1の回答データに対する第1の再考結果を確定し、前記第1の再考結果は、前記第1の回答データに対する前記ユーザのフィードバックがネガティブフィードバックである診断理由を示すことと、前記第1のクエリデータと前記第1の再考結果に基づいて、前記第1のクエリデータに対する第2の回答データを生成することとを含む。
【0007】
本開示の別の態様によれば、データ生成装置を提供し、前記装置は、ユーザからの第1のクエリデータに基づいて、第1の回答データを生成するように構成される第1の生成ユニットと、前記第1の回答データに対する前記ユーザのネガティブフィードバックを受信したことに応答して、前記第1の回答データと前記ネガティブフィードバックに基づいて、前記第1の回答データに対する第1の再考結果を確定するように構成される確定ユニットであって、前記第1の再考結果は、前記第1の回答データに対する前記ユーザのフィードバックがネガティブフィードバックである診断理由を示すものと、前記第1のクエリデータと前記第1の再考結果に基づいて、前記第1のクエリデータに対する第2の回答データを生成する第2の生成ユニットとを含む。
【0008】
本開示の別の態様によれば、電子機器を提供し、該電子機器は、少なくとも一つのプロセッサと、前記少なくとも一つのプロセッサに通信接続されたメモリとを含み、ここで、前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶されており、前記命令は前記少なくとも1つのプロセッサによって実行されることにより、前記少なくとも1つのプロセッサに上記データ生成方法を実行させることができる。
【0009】
本開示の別の態様によれば、コンピュータ命令が記憶された非一時的コンピュータ可読記憶媒体を提供し、前記コンピュータ命令は、前記コンピュータに上記データ生成方法を実行させるために用いられる。
【0010】
本開示の別の態様によれば、コンピュータプログラムを含むコンピュータプログラム製品を提供し、コンピュータプログラムは、プロセッサによって実行されると、上記データ生成方法を実現することができる。
【0011】
本開示の一又は複数の実施例によれば、回答データの生成の品質を向上させることができる。
【0012】
理解すべきこととして、この部分に説明される内容は、本開示の実施例の肝心又は重要な特徴を識別することを意図しておらず、本開示の範囲を限定するためのものでもない。本開示の他の特徴は、以下の明細書によって容易に理解される。
【図面の簡単な説明】
【0013】
図面は、実施例を例示的に示し、明細書の一部を構成し、明細書の文字による説明とともに、実施例の例示的な実施形態を説明するために用いられる。図示の実施例は例示の目的のみであり、特許請求の範囲を限定するものではない。全ての図面において、同一の符号は、類似しているが、必ずしも同じとは限らない要素を指す。
図1】本開示の例示的な実施例による、本明細書で説明される様々な方法を実施することができる例示的なシステムを示す概略図である。
図2】本開示の例示的な実施例によるデータ生成方法を示すフローチャートである。
図3】本開示の例示的な実施例によるデータ生成プロセスを示す概略図である。
図4】本開示の例示的な実施例によるデータ生成装置を示す構成ブロック図である。
図5】本発明の実施例を実現するために使用できる例示的な電子機器を示す構成ブロック図である。
【発明を実施するための形態】
【0014】
以下、図面に合わせて本開示の例示的な実施例を説明して、それに含まれる本開示の実施例における様々な詳細が理解を助けるためので、それらは単なる例示的なものと考えられるべきである。従って、当業者であれば、本開示の範囲から逸脱することなく、本明細書で説明された実施例に対して様々な変更及び修正を行うことができることを認識すべきである。同様に、明瞭と簡潔のために、以下の説明では公知の機能及び構造についての説明を省略している。
【0015】
本開示では、特に明記しない限り、様々な要素を説明するための「第1」、「第2」などの用語の使用は、これらの要素の位置関係、タイミング関係、又は重要性関係を限定することを意図していない。このような用語は、一要素を別の要素から区別するためにのみ使用される。いくつかの例では、第1の要素と第2の要素は、該要素の同じ例を指してもよく、場合によっては、コンテキストの説明に基づいて、異なる例を指してもよい。
【0016】
本開示の様々な前記例の説明で使用される用語は、特定の例を説明することのみを目的としており、限定することを意図していない。コンテキストで別途に明確に示されていない限り、特に要素の数を限定しないなら、該要素は一つであってもよいし、複数であってもよい。なお、本開示で使用される用語「及び/又は」は、リストされたアイテムのいずれか及び可能な全ての組み合わせ方式をカバーする。
【0017】
関連技術において、生成式言語モデルを応用してユーザの入力データに基づいて回答データを生成する場合、モデルトレーニング段階でコーパスを人手でラベル付けしたり、(例えば、損失関数を最適化したり、強化学習を行ったりする)トレーニング方式を調整したりすることで、モデルの性能を向上させる。なお、モデルの応用段階、すなわちデータ生成プロセスでは、通常、ユーザが入力したクエリデータのみに基づいて回答データを直接生成するが、回答データに対するユーザのフィードバックに従って対応する回答データを調整することを実現できず、それによって、回答データの品質がユーザのニーズを十分に満たすことができない。
【0018】
これに基づいて、本開示は、データ生成方法を提供し、ユーザのクエリデータに対して初期の回答データを生成した後、この回答データに対するユーザのネガティブフィードバックを受信した場合に、このネガティブフィードバックに基づいて、この回答データがネガティブフィードバックを得た理由を自己診断し、さらに、この回答データに対する再考結果を生成することにより、この再考結果に基づいて新たな回答データを生成し、それによって、回答データをユーザのニーズにより合致させ、回答データの生成の品質を向上させる。
【0019】
以下、図面を参照して本開示の実施例について詳細に説明する。
【0020】
図1は、本開示の実施例による、本明細書に記載された様々な方法及び装置を、その中で実施することができる例示的なシステム100の概略図を示す。図1を参照すると、該システム100は、一つ以上のクライアントデバイス101、102、103、104、105と106、サーバ120、及び一つ以上のクライアントデバイスをサーバ120に結合する一つ以上の通信ネットワーク110を含む。クライアントデバイス101、102、103、104、105と106は、一つ以上のアプリケーションを実行するように構成されることが可能である。
【0021】
本開示の実施形態では、サーバ120はデータ生成方法の実行を可能にする一つ以上のサービスまたはソフトウェアアプリケーションを実行することができる。
【0022】
いくつかの実施例では、サーバ120は、非仮想環境と仮想環境を含むことができる他のサービス又はソフトウェアアプリケーションも提供することができる。いくつかの実施例では、これらのサービスは、webベースのサービス又はクラウドサービスとして提供することができ、例えば、ソフトウェアアズアサービス(SaaS)モデルでクライアントデバイス101、102、103、104、105及び/又は106のユーザに提供される。
【0023】
図1に示す配置では、サーバ120は、サーバ120により実行される機能を実現する一つ以上のアセンブリを含んでもよい。これらのアセンブリは、一つ以上のプロセッサで実行できるソフトウェアアセンブリ、ハードウェアアセンブリ、又はそれらの組み合わせを含んでもよい。クライアントデバイス101、102、103、104、105及び/又は106を操作するユーザは、これらのアセンブリが提供するサービスを利用するために、一つ以上のクライアントアプリケーションを順次利用してサーバ120とやり取りをすることができる。様々な異なるシステム配置が可能であり、システム100とは異なってもよいことを理解されたい。したがって、図1は、本明細書に記載された様々な方法を実施するためのシステムの一例であり、制限することを意図していない。
【0024】
ユーザは、クライアントデバイス101、102、103、104、105及び/又は106を用いて、クエリデータとフィードバックを送信することができる。クライアントデバイスは、クライアントデバイスのユーザがクライアントデバイスとやり取りするインターフェースを提供することができる。クライアントデバイスは、該インターフェースを介してユーザに情報を出力することもできる。図1では6つのクライアントデバイスしか図示されていないが、当業者であれば理解できるように、本開示はいかなる数のクライアントデバイスもサポートできる。
【0025】
クライアントデバイス101、102、103、104、105及び/又は106は、携帯型ハンドヘルドデバイス、汎用コンピュータ(例えば、パーソナルコンピュータやノートパソコン)、ワークステーションコンピュータ、ウェアラブルデバイス、スマートスクリーンデバイス、セルフサービス端末デバイス、サービスロボット、ゲームシステム、シンクライアント、各種のメッセージングデバイス、センサ、又はその他の検知デバイスなどの様々なタイプのコンピュータデバイスを含んでもよい。これらのコンピュータデバイスは、MICROSOFT Windows、APPLE iOS、類UNIX(登録商標)オペレーティングシステム、Linux(登録商標)又は類Linux(登録商標)オペレーティングシステム(例えば、GOOGLE Chrome OS)などの様々なタイプ及びバージョンのソフトウェアアプリケーションやオペレーティングシステムを実行したり、MICROSOFT Windows Mobile OS、iOS、Windows Phone、Androidなどの各種のモバイルオペレーティングシステムを含んだりすることができる。携帯用ハンドヘルドデバイスには、携帯電話、インテリジェントフォン、タブレット、パーソナルデジタルアシスタント(PDA)などを含んでもよい。ウェアラブルデバイスは、ヘッドマウント型ディスプレイ(例えば、スマートグラス)と他のデバイスを含んでもよい。ゲームシステムは、様々なハンドヘルド型のゲームデバイス、インターネット対応のゲームデバイスなどを含んでもよい。クライアントデバイスは、例えば、インターネットInternet関連アプリケーション、通信アプリケーション(例えば、電子メールアプリケーション)、ショートメッセージサービス(SMS)アプリケーション、様々なアプリケーションを実行でき、且つ様々な通信プロトコルを使用できる。
【0026】
ネットワーク110は、当業者に知られている任意のタイプのネットワークであってもよく、それは、データ通信をサポートするために、複数の利用可能なプロトコルのいずれか一つ(TCP/IP、SNA、IPXなどを含むがこれらに限定されない)を使用することができる。例として、一つ以上のネットワーク110は、ローカルエリアネットワーク(LAN)、イーサネットベースのネットワーク、トークンループ、ワイドエリアネットワーク(WAN)、インターネット、仮想ネットワーク、仮想プライベートネットワーク(VPN)、イントラネット、エクストラネット、ブロックチェーンネットワーク、公衆交換電話網(PSTN)、赤外線ネットワーク、無線ネットワーク(例えば、ブルートゥース(登録商標)、WIFI)、及び/又はこれら及び/又はその他のネットワークの任意の組み合わせであってもよい。
【0027】
サーバ120は、一つ以上の汎用コンピュータ、専用サーバコンピュータ(例えば、PC(パーソナルコンピュータ)サーバ、UNIX(登録商標)サーバ、ミッドレンジサーバ)、ブレードサーバ、大型コンピュータ、サーバクラスタ、又はその他のいかなる適切な配置及び/又は組み合わせを含んでもよい。サーバ120は、仮想オペレーティングシステムを実行する一つ以上の仮想マシン、又は仮想化に関わる他のコンピューティングアーキテクチャ(例えば、サーバの仮想記憶デバイスを維持するために仮想化された論理記憶デバイスの一つ以上のフレキシブルプール)を含んでもよい。様々な実施例では、サーバ120は、以下に説明する機能を提供する一つ以上のサービス又はソフトウェアアプリケーションを実行することができる。
【0028】
サーバ120における計算ユニットは、上記した任意のオペレーティングシステム及び任意の商用サーバオペレーティングシステムを含む一つ以上のオペレーティングシステムを実行することができる。サーバ120は、HTTPサーバ、FTPサーバ、CGIサーバ、JAVA(登録商標)サーバ、データベースサーバなどを含む様々な追加のサーバアプリケーション及び/又は中間層アプリケーションのいずれか一つを実行することもできる。
【0029】
いくつかの実施例では、サーバ120は、クライアントデバイス101、102、103、104、105及び106のユーザから受信したデータフィード及び/又はイベントの更新を分析及び統合するための一つ又は複数のアプリケーションを含んでもよい。サーバ120は、クライアントデバイス101、102、103、104、105及び106の一つ又は複数のディスプレイデバイスを介してデータフィード及び/又はリアルタイムイベントを表示する一つ又は複数のアプリケーションを含んでもよい。
【0030】
いくつかの実施例では、サーバ120は、分散型システムのサーバであってもよいし、ブロックチェーンを組み込んだサーバであってもよい。サーバ120は、クラウドサーバであってもよいし、人工知能技術を備えたインテリジェントクラウドコンピューティングサーバやインテリジェントクラウドホストであってもよい。クラウドサーバはクラウドコンピューティングサービスシステムにおけるホスト製品であり、従来の物理ホストと仮想専用サーバ(VPS、Virtual Private Server)サービスに存在する管理難度が大きく、業務拡張性が弱いという欠陥を解決する。
【0031】
システム100は、一つ以上のデータベース130を含むこともできる。いくつかの実施例では、これらのデータベースはデータやその他の情報を記憶するために使用できる。例えば、データベース130のうちの一つ以上は、オーディオファイルやビデオファイルのような情報を記憶するために使用できる。データベース130は、さまざまな位置に配置することができる。例えば、サーバ120が使用するデータベースは、サーバ120のローカルにあってもよいし、サーバ120から離れて、ネットワーク又は専用の接続を介してサーバ120と通信してもよい。データベース130は、異なるタイプであってもよい。いくつかの実施例では、サーバ120が使用するデータベースは、例えば、リレーショナルデータベースであってもよい。これらのデータベースのうちの一つ以上は、命令に応じてデータベースとデータベースからのデータを記憶、更新、検索できる。
【0032】
いくつかの実施例では、データベース130のうちの一つ以上は、アプリケーションによって使用され、アプリケーションのデータを記憶することもできる。アプリケーションが使用するデータベースは、異なるタイプのデータベースであってもよく、例えば、キー値リポジトリ、オブジェクトリポジトリ、ファイルシステムによってサポートされる汎用リポジトリなどである。
【0033】
図1のシステム100は、本開示に基づいて説明した様々な方法及び装置を応用することができるように、様々な方法で構成し操作することができる。
【0034】
図2は、本開示の例示的な実施例によるデータ生成方法200のフロー図を示す。図2に示すように、方法200は、
ユーザからの第1のクエリデータに基づいて、第1の回答データを生成するステップS201と、
前記第1の回答データに対する前記ユーザのネガティブフィードバックを受信したことに応答して、前記第1の回答データと前記ネガティブフィードバックに基づいて、前記第1の回答データに対する第1の再考結果を確定し、前記第1の再考結果は、前記第1の回答データに対する前記ユーザのフィードバックがネガティブフィードバックである診断理由を示すステップS202と、
前記第1のクエリデータと前記第1の再考結果に基づいて、前記第1のクエリデータに対する第2の回答データを生成するステップS203とを含む。
【0035】
方法200に記載されたデータ生成方式により、ユーザが入力したクエリデータに対して第1の回答データを生成した後、第1の回答データに対するユーザのネガティブフィードバックを受信した場合、このネガティブフィードバックに基づいて、第1の回答データに対する再考結果を生成することで、自己診断を達成し、さらに、この再考結果に基づいて、新たな第2の回答データを生成することで、新たな第2の回答データをユーザのニーズにより一致し、回答データの生成の品質を向上させることができる。
【0036】
いくつかの例では、第1のクエリデータ、第1の回答データ、第2の回答データおよび第1の再考結果は、自然言語テキストであってもよい。例えば、第1のクエリデータは、「5ワードの自動車のキャッチフレーズを書いてください」であってもよく、このような場合には、生成された第1の回答データが7ワードを含むキャッチフレーズであり、また、ユーザが第1の回答データに対してネガティブフィードバックを与える場合、ネガティブフィードバックを受信した理由を自己診断することで、「ユーザの要求は5ワードのキャッチフレーズであり、生成結果には7ワードが含まれており、ワード数がユーザの要求に合わない」の第1の再考結果を得ることができ、第1の再考結果を利用して第1の回答データがネガティブフィードバックを得る可能性のある原因を示すことにより、それに基づいて、新たな第2の回答データを生成することで、第2の回答データが再びユーザからのネガティブフィードバックを受信することを回避し、それによって、回答データの生成の品質を向上させることができる。
【0037】
いくつかの実施例によれば、前記第1の再考結果は、前記第1の回答データに対する最適化ポリシーをさらに含む。これにより、最適化ポリシーをさらに含む再考結果に基づいてデータを生成することで、再考結果に基づいて、目標性がより強く、内容がより豊富で具体的な第2の回答データを得ることができる。
【0038】
上記の例では、再考結果は、「ユーザの要求は5ワードのキャッチフレーズであり、生成結果には7ワードが含まれており、ワード数がユーザの要求に合わず、再度生成時には結果が5ワードであることを保証する必要がある」であってもよい。「再度生成時には結果が5ワードであることを保証する必要がある」の最適化ポリシーを含む再考結果に基づいて、新たな第2の回答データを生成することで、第2の回答データの生成の品質を向上させて、さらにユーザ体験を向上させることができる。
【0039】
いくつかの実施例によれば、ステップS201において、ユーザからの第1のクエリデータに基づいて、第1の回答データを生成することは、前記第1のクエリデータに基づいて、入力データに基づいて回答データを生成するための深層学習モデルに用いられる第1の入力データを確定することと、前記第1の入力データを前記深層学習モデルに入力して前記第1の回答データを取得することとを含み、かつステップS203において、前記第1のクエリデータと前記第1の再考結果に基づいて、前記第1のクエリデータに対する第2の回答データを生成することは、前記第1のクエリデータと前記第1の再考結果に基づいて、前記深層学習モデルに用いられる第2の入力データを確定することと、前記第2の入力データを前記深層学習モデルに入力することで、前記第2の回答データを取得することとを含む。これにより、深層学習モデルを利用して回答データを生成することができ、異なるニーズを示す第1の入力データと第2の入力データを生成して深層学習モデルに入力することにより、すなわち同一の深層学習モデルを利用して第1の回答データと第2の回答データを生成し、効率と利便性を向上させることができる。
【0040】
いくつかの例では、入力データに基づいて回答データを生成するための深層学習モデルは、エンドツーエンドの特性を持ち、自然言語テキスト形式の入力データに基づいて、自然言語テキスト形式の回答データを直接生成することができる。いくつかの例では、この深層学習モデルは、エンコーダ(Encoder)及びデコーダ(Decoder)を有するN層Transformerネットワーク構造、又は統合プリトレーニング言語モデル(Unified pre-trained Language Model,UniLM)ネットワーク構造を採用することができる。この深層学習モデルは、他のTransformerネットワーク構造に基づくニューラルネットワークモデルでもよく、ここでは限定されないことを理解されたい。
【0041】
いくつかの例では、この深層学習モデルは、サンプルコーパスを利用してトレーニングして得られることができ、この深層学習モデルをトレーニングするためのサンプルコーパスは、例えば、サンプル入力データとこのサンプル入力データに対するサンプル回答データとを含んでもよい。トレーニング過程において、サンプル入力データをこの深層学習モデルに入力することで、予測回答データを得、予測回答データとサンプル回答データに基づいて損失値を計算し、さらに損失値に基づいて、深層学習モデルのパラメータを調整することができる。いくつかの例では、負の対数尤度損失(Negative-Log likelihood Loss、NLL)計算方式に基づいて、深層学習モデルの損失値を確定することができる。
【0042】
いくつかの例では、それぞれ異なるコーパスを利用して、ステップS201に応用する深層学習モデルとステップS203に応用する深層学習モデルもトレーニングし、より指向的なトレーニングコーパスを使用することにより、モデルによって生成された回答内容の正確度を向上させることができる。
【0043】
いくつかの実施例によれば、前記第1のクエリデータと前記第1の再考結果に基づいて、前記深層学習モデルに用いられる第2の入力データを確定することは、前記第1のクエリデータ、前記第1の再考結果、および前記第2の入力データが前記第1の再考結果を含むことを示すタスク説明情報に基づいて、前記第2の入力データを確定することを含む。これにより、入力内容に基づいてタスク説明情報を追加することにより、現在のデータ生成ニーズを明示的に示すことができ、深層学習モデルが第1の再考結果と第1のクエリデータに基づいて第2の入力データを生成し、データ生成の効率を向上させることができる。
【0044】
前述した例を参照して、一例において、第1のクエリデータ、第1の回答データ、第2の回答データと第1の再考結果は、いずれも自然言語テキストであり、深層学習モデルも自然言語テキストを受信して生成するために用いられる。この場合、タスク説明情報は、入力データにおける第1のクエリデータと第1の再考結果の存在を示すための予め設定される自然言語テキストセグメントまたはテンプレートであってもよく、このタスク説明情報は、例えば、第1のクエリデータ__と第1の再考結果__に基づいて、第1のクエリデータに対する回答データを生成してくださいということであってもよい。第1のクエリデータと第1の再考結果の内容をこのテンプレートに充填することで、データ生成のニーズを明確に示すできる入力データを得ることができ、深層学習モデルがこれに基づいて第2の回答データを生成することができる。
【0045】
上記実施形態は、深層学習モデルの入力データの例に過ぎず、入力データは、他の方式に基づいて生成することもでき、例えば、第1のクエリデータと第1の再考結果に基づいて、事前定義された生成パターンのラベルを直接追加して第2の入力データを得、深層学習モデルがこのタグに基づいて第2の入力データに第1の再考結果が含まれていることを確定することを理解されたい。深層学習モデルに入力データにおける再考結果の存在を感知させ、この再考結果に基づいて、回答データを生成することができれば、本開示は入力データの確定方式を限定しない。
【0046】
いくつかの実施例によれば、ステップS202において、前記第1の回答データと前記第1のフィードバックに基づいて、前記第1の回答データに対する第1の再考結果を確定することは、前記第1の回答データと前記第1のフィードバックを再考生成ネットワークに入力することで、前記再考生成ネットワークによって出力される前記第1の再考結果を取得することを含み、ここで、前記再考生成ネットワークはサンプルコーパスを利用してトレーニングして得られ、前記サンプルコーパスは、サンプル回答データ、サンプルフィードバック、および前記サンプル回答データに対するサンプル再考結果を含む。これにより、トレーニングされた再考生成ネットワークを利用して再考結果を得、再考結果の生成の効率と利便性を向上させることができる。
【0047】
いくつかの例では、再考生成ネットワークは、エンコーダ(Encoder)及びデコーダ(Decoder)を有するN層Transformerネットワーク構造、又は統合プリトレーニング言語モデル(Unified pre-trained Language Model,UniLM)ネットワーク構造を採用することができる。前述した深層学習モデルのトレーニング方式に類似し、この再考生成ネットワークは、サンプルコーパスを利用してトレーニングして得られることができ、再考生成ネットワークをトレーニングするためのサンプルコーパスは、例えば、サンプル回答データ、サンプルフィードバック、および前記サンプル回答データに対するサンプル再考結果を含んでもよい。トレーニング過程では、サンプル回答データとサンプルフィードバックをこの深層学習モデルに入力することで、予測再考結果を得、予測再考結果とサンプル再考結果に基づいて損失値を計算し、さらに損失値に基づいて再考生成ネットワークのパラメータを調整することができる。
【0048】
いくつかの実施例によれば、ステップS202において、前記第1の回答データに対する前記ユーザのネガティブフィードバックを受信したことに応答して、前記第1の回答データと前記ネガティブフィードバックに基づいて、前記第1の回答データに対する第1の再考結果を確定することは、前記第1の回答データに対する前記ユーザの第1のフィードバックを受信したことに応答して、前記第1のフィードバックがネガティブフィードバックであると確定したことに応答して、前記第1の回答データと前記第1のフィードバックに基づいて、前記第1の回答データに対する第1の再考結果を確定することを含む。これにより、ユーザのフィードバックデータを取得した後で、さらにこのフィードバックデータがネガティブフィードバックかどうかを確定することができ、それによって、フィードバックデータはこのフィードバックがネガティブフィードバックかどうかを明示的に示さない場合には、さらに、確定ステップによってネガティブフィードバックを識別し、正確度を向上させることができる。
【0049】
いくつかの例では、分類器に基づくユーザフィードバック認識モデルを利用して、この第1のフィードバックがネガティブフィードバックであるかどうかを区別することができる。いくつかの例では、ユーザフィードバック認識モデルは、(ポジティブフィードバックとネガティブフィードバックを含む)実際の属性ラベルが付けられたサンプルフィードバックデータセットを利用してトレーニングして得られることができ、それによって、ユーザからの第1のフィードバックがネガティブフィードバックであるかどうかをより効率的かつ正確に確定することができる。
【0050】
いくつかの例では、他の方式によってユーザからのネガティブフィードバックが受信されたかどうかを確定することもできる。一例において、ユーザインターフェース上でのユーザの操作に基づいて、ネガティブフィードバックを受信すると確定することができ、例えば、ユーザが悪い評価ボタンをクリックしたか、閾値より低いスコアを与えたかと確定したことに応答して、ネガティブフィードバックを受信すると確定することができる。
【0051】
いくつかの実施例によれば、方法200は、ユーザからの第2のクエリデータと前記第1のクエリデータとの類似度が予め設定される閾値よりも大きいと確定したことに応答して、前記第1のクエリデータ、前記第2の回答データ、および前記第2のクエリデータに基づいて、前記第2のクエリデータに対する第3の回答データを生成することをさらに含む。これにより、ユーザが第1のクエリデータに類似する第2のクエリデータを送信する場合、第1のクエリデータと第2の回答データを利用して現在の第3の回答データの生成を強化し、回答データの生成の品質を向上させることができる。
【0052】
いくつかの例では、クエリデータをいずれもテキストベクトルとして表し、ベクトル類似度を計算することにより、第1のクエリデータと第2のクエリデータの間の類似度を確定することができる。
【0053】
いくつかの実施例によれば、方法200は、前記第1のクエリデータと前記第2の回答データをメモリバンクに記憶することをさらに含み、ここで、前記の、ユーザからの第2のクエリデータと前記第1のクエリデータとの類似度が予め設定される閾値よりも大きいと確定したことに応答して、前記第1のクエリデータ、前記第2の回答データ、および前記第2のクエリデータに基づいて、前記第2のクエリデータに対する第3の回答データを生成することは、ユーザからの第2のクエリデータと前記メモリバンクにおける第1のクエリデータとの類似度が前記予め設定される閾値よりも大きいと確定したことに応答して、前記メモリバンクから前記第2の回答データを取得することと、前記第1のクエリデータ、前記第2の回答データ、および前記第2のクエリデータに基づいて、前記第3の回答データを生成することとを含む。これにより、メモリバンクを利用してクエリデータ-回答データペアを保存することができ、メモリバンクを使用することにより、より多くの数、より長い期間内の履歴対話データを保存し、さらに履歴対話を参照して現在の回答データの生成を強化し、回答データの生成の品質を向上させることができる。
【0054】
いくつかの例では、前述した深層学習モデルを利用して回答データを生成する場合、第1のクエリデータ、第2の回答データ、および第2のクエリデータに基づいて、前記深層学習モデルに用いられる第3の入力データを確定し、さらに第3の入力データを深層学習モデルに入力することで、第3の回答データを取得することができる。一例において、この第3の回答データは、例えば、深層学習モデルがこれに基づいて第3の回答データを生成することができるように、第1のクエリデータと第2の回答データの存在を示す説明情報を含んでもよい。
【0055】
図3は、本開示の例示的な実施例によるデータ生成プロセスの概略図を示す。図3に示すように、一例において、インテリジェント対話システム300を利用してユーザと対話することを実現するデータ生成プロセスであってもよい。
【0056】
図3を参照して、インテリジェント対話システム300は、ユーザフィードバック認識モデル301、再考生成ネットワーク302、深層学習モデル303、およびメモリバンク304を含む。
【0057】
一例において、ユーザフィードバック認識モデル301、再考生成ネットワーク302、およびメモリバンク304を含むデータ伝送路はオプションである。ユーザが第1のクエリデータを送信し、メモリバンク304に第1のクエリデータに類似する履歴データが含まれていない場合、深層学習モデル303は、ユーザが入力した第1のクエリデータに基づいて、第1の回答データを直接生成することができる。第1の回答データに対するユーザの第1のフィードバックを受信した後、ユーザフィードバック認識モデル301を利用してこの第1のフィードバックがネガティブフィードバックであるかどうかを確定することができ、この第1のフィードバックがネガティブフィードバックであると確定した場合、再考生成ネットワーク302を利用して、第1の回答データと第1のフィードバックに基づいて、第1の再考結果を得ることができ、さらに、深層学習モデル303に第1のクエリデータと第1の再考結果に基づいて、新たな第2の回答データを確定させ、第1のクエリデータと第2の回答データをメモリバンク304に記憶することができる。
【0058】
第2のクエリデータを受信し、第2のクエリデータ304に類似する第1のクエリデータがすでにメモリバンク304に存在すると確定する場合、深層学習モデル303に第1のクエリデータ、第2の回答データ、および第2のクエリデータに基づいて、第2のクエリデータに対する第3の回答データを確定させることで、第1のクエリデータと第2の回答データを利用して、第3の回答データの現在の生成を強化し、回答データの生成の品質を向上させることができる。
【0059】
本開示の一態様によれば、データ生成装置をさらに提供する。図4は、本開示の例示的な実施例によるデータ生成装置400の構成ブロック図を示す。図4に示すように、装置400は、ユーザからの第1のクエリデータに基づいて、第1の回答データを生成するように構成される第1の生成ユニット401と、前記第1の回答データに対する前記ユーザのネガティブフィードバックを受信したことに応答して、前記第1の回答データと前記ネガティブフィードバックに基づいて、前記第1の回答データに対する第1の再考結果を確定するように構成される確定ユニット402であって、前記第1の再考結果は、前記第1の回答データに対する前記ユーザのフィードバックがネガティブフィードバックである診断理由を示すものと、前記第1のクエリデータと前記第1の再考結果に基づいて、前記第1のクエリデータに対する第2の回答データを生成する第2の生成ユニット403とを含む。
【0060】
いくつかの実施例によれば、第1の生成ユニット401は、前記第1のクエリデータに基づいて、入力データに基づいて回答データを生成するための深層学習モデルに用いられる第1の入力データを確定するように構成される第1の確定サブユニットと、前記第1の入力データを前記深層学習モデルに入力することで、前記第1の回答データを取得するように構成される第1の入力サブユニットとを含み、ここでは、第2の生成ユニット403は、前記第1のクエリデータと前記第1の再考結果に基づいて、前記深層学習モデルに用いられる第2の入力データを確定するように構成される第2の確定サブユニットと、前記第2の入力データを前記深層学習モデルに入力することで、前記第2の回答データを取得するように構成される第2の入力サブユニットとを含む。
【0061】
いくつかの実施例によれば、前記第2の入力サブユニットは、前記第1のクエリデータ、前記第1の再考結果、および前記第2の入力データが前記第1の再考結果を含むことを示すタスク説明情報に基づいて、前記第2の入力データを確定するように構成される。
【0062】
いくつかの実施例によれば、確定ユニット402は、前記第1の回答データと前記第1のフィードバックを再考生成ネットワークに入力することで、前記再考生成ネットワークによって出力される前記第1の再考結果を取得し、ここで、前記再考生成ネットワークはサンプルコーパスを利用してトレーニングして得られ、前記サンプルコーパスは、サンプル回答データ、サンプルフィードバック、および前記サンプル回答データに対するサンプル再考結果を含むように構成される。
【0063】
いくつかの実施例によれば、確定ユニット402は、前記第1の回答データに対する前記ユーザの第1のフィードバックを受信したことに応答して、前記第1のフィードバックがネガティブフィードバックであると確定したことに応答して、前記第1の回答データと前記第1のフィードバックに基づいて、前記第1の回答データに対する第1の再考結果を確定するように構成される。
【0064】
いくつかの実施例によれば、装置400は、ユーザからの第2のクエリデータと前記第1のクエリデータとの類似度が予め設定される閾値よりも大きいと確定したことに応答して、前記第1のクエリデータ、前記第2の回答データ、および前記第2のクエリデータに基づいて、前記第2のクエリデータに対する第3の回答データを生成するように構成される第3の生成ユニットをさらに含む。
【0065】
いくつかの実施例によれば、装置400は、前記第1のクエリデータと前記第2の回答データをメモリバンクに記憶するように構成される記憶ユニットをさら含み、ここで、前記第3の生成ユニットは、ユーザからの第2のクエリデータと前記メモリバンクにおける第1のクエリデータとの類似度が前記予め設定される閾値よりも大きいと確定したことに応答して、前記メモリバンクから前記第2の回答データを取得するように構成される取得サブユニットと、前記第1のクエリデータ、前記第2の回答データ、および前記第2のクエリデータに基づいて、前記第3の回答データを生成するように構成される生成サブユニットとを含む。
【0066】
いくつかの実施例によれば、前記第1の再考結果は、前記第1の回答データに対する最適化ポリシーをさらに含む。
【0067】
本開示の技術案において、関連するユーザ個人情報の収集、記憶、使用、加工、伝送、提供と開示などの処理は、すべて関連法律法規の規定に適合し、かつ公序良俗に反しない。
【0068】
本開示の別の態様によれば、電子機器をさらに提供し、前記電子機器は、少なくとも一つのプロセッサと、前記少なくとも一つのプロセッサに通信接続されたメモリとを含み、前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令が前記少なくとも1つのプロセッサに実行されて、前記少なくとも1つのプロセッサに、上述したデータ生成方法を実行させることができる。
【0069】
本開示の別の態様によれば、コンピュータ命令が記憶された非一時的コンピュータ可読記憶媒体をさらに提供し、前記コンピュータ命令は、前記コンピュータに以上に記載のデータ生成方法を実行させるために用いられる。
【0070】
本開示の別の態様によれば、コンピュータプログラムを含むコンピュータプログラム製品をさらに提供し、前記コンピュータプログラムは、プロセッサによって実行されると、上述したデータ生成方法を実現する。
【0071】
図5を参照して、本開示のサーバ又はクライアントとして機能する電子機器500の構成ブロック図について説明し、それは、本開示の各態様に応用可能なハードウェア装置の一例である。電子機器は、様々な形態のデジタル電子コンピュータデバイス、例えば、ラップトップ型コンピュータ、デスクトップ型コンピュータ、ステージ、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、その他の適切なコンピュータを示す。電子機器は更に、様々な形態の移動装置、例えば、パーソナルデジタル処理、携帯電話、インテリジェントフォン、ウェアラブル機器とその他の類似する計算装置を示してよい。本明細書に示される部品、これらの接続関係及びこれらの機能は例示的なものに過ぎず、本明細書に説明した及び/又は請求した本開示の実現を制限しない。
【0072】
図5に示すように、機器500は、計算ユニット501を含み、それはリードオンリーメモリ(ROM)502に記憶されるコンピュータプログラム又は記憶ユニット508からランダムアクセスメモリ(RAM)503にロードされるコンピュータプログラムによって、種々の適当な動作と処理を実行することができる。RAM503において、機器500を操作するために必要とされる様々なプログラムとデータを記憶してよい。計算ユニット501、ROM502及びRAM503は、バス504を介して互いに接続されている。入力/出力(I/O)インターフェース505もバス504に接続されている。
【0073】
機器500内の複数の部材は、I/Oインタフェース505に接続され、これは、入力ユニット506、出力ユニット507、記憶ユニット508、及び通信ユニット509を備える。入力ユニット506は、機器500に情報を入力することが可能な任意のタイプの装置であってもよく、入力ユニット506は、入力された数字又は文字情報を受信し、電子機器のユーザ設定及び/又は機能制御に関するキー信号入力を生成することができ、マウス、キーボード、タッチスクリーン、トラックボード、トラックボール、操作レバー、マイク及び/又はリモコンを含んでもよいが、これらに限定されない。出力ユニット507は、情報を提示することが可能ないずれかのタイプの装置であってもよく、ディスプレイ、スピーカ、ビデオ/オーディオ出力端末、バイブレータ、及び/又はプリンタを含んでもよいが、これらに限定されない。記憶ユニット508は、磁気ディスク、光ディスクを含んでもよいが、これらに限定されない。通信ユニット509は、機器500が例えば、インターネットであるコンピュータネットワーク及び/又は様々な電気通信ネットワークを介して他の装置と情報/データを交換することを可能にし、モデム、ネットワークカード、赤外線通信装置、無線通信送受信機、及び/又はチップセット、例えば、ブルートゥース(登録商標)装置、802.11装置、WiFi装置、WiMax装置、セルラー通信装置及び/又は類似物を含んでもよいが、これらに限定されない。
【0074】
計算ユニット501は、処理および計算能力を有する様々な汎用および/または専用処理コンポーネントであってよい。計算ユニット501のいくつかの例は、中央処理ユニット(CPU)、グラフィックス処理ユニット(GPU)、様々な専用人工知能(AI)計算チップ、機械学習モデルアルゴリズムを実行する様々な計算ユニット、デジタル信号プロセッサ(DSP)、および任意の適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。計算ユニット501は前文で説明された各方法と処理、例えばデータ生成方法を実行する。例えば、いくつかの実施例では、データ生成方法は、機械可読媒体、例えば記憶ユニット508に有形的に含まれるコンピュータソフトウェアプログラムとして実現されてもよい。いくつかの実施例では、コンピュータプログラムの一部又は全部は、ROM502及び/又は通信ユニット509を介して機器500にロード及び/又はインストールされてもよい。コンピュータプログラムをRAM 503にロードして計算ユニット501で実行する場合、上記のデータ生成方法の1つ以上のステップを実行することができる。代替的に、別の実施例において、計算ユニット501は他のいかなる適切な方式で(例えば、ファームウェアにより)データ生成方法を実行するように構成されてよい。
【0075】
本明細書で上述したシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールド・プログラマブル・ゲート・アレイ(FPGA)、特定用途向け集積回路(ASIC)、特定用途向け標準製品(ASSP)、システムオンチップ(SOC)、複雑なプログラマブル論理デバイス(CPLD)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はこれらの組み合わせにおいて実装することができる。これらの様々な実施形態は、一つ以上のコンピュータプログラムに実施され、該一つ以上のコンピュータプログラムは少なくとも一つのプログラマブルプロセッサを含むプログラマブルシステムで実行し及び/又は解釈してもよく、該プログラマブルプロセッサは専用又は汎用プログラマブルプロセッサであってもよく、記憶システム、少なくとも一つの入力装置、少なくとも一つの出力装置からデータと命令を受信し、データと命令を該記憶システム、該少なくとも一つの入力装置、該少なくとも一つの出力装置に送信してよいこと、を含んでもよい。
【0076】
本開示の方法を実施するためのプログラムコードは、1つ又は複数のプログラミング言語の任意の組み合わせで書かれてよい。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ又は他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供されてよく、プログラムコードがプロセッサ又はコントローラにより実行されると、フローチャート及び/又はブロック図に規定される機能/操作は実施される。プログラムコードは完全に機械で実行してよく、部分的に機械で実行してよく、独立ソフトウェアパッケージとして部分的に機械で実行し且つ部分的に遠隔機械で実行してよく、又は完全に遠隔機械又はサーバで実行してよい。
【0077】
本開示のコンテキストにおいて、機械可読媒体は有形の媒体であってもよく、命令実行システム、装置又は機器に使用される又は命令実行システム、装置又は機器に結合されて使用されるプログラムを具備又は記憶してよい。機械可読媒体は機械可読信号媒体又は機械可読記憶媒体であってもよい。機械可読媒体は、電子、磁気、光学、電磁、赤外線、又は半導体システム、装置又はデバイス、又は上記内容のいかなる適切な組み合わせを含んでもよいが、これらに限定されない。機械可読記憶媒体のより具体的な例は、一つ以上のワイヤによる電気接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、消去可能なプログラマブル読み出し専用メモリ(EPROM又はフラッシュメモリ)、光ファイバー、ポータブルコンパクトディスク読み出し専用メモリ(CD-ROM)、光記憶機器、磁気記憶機器、又は上記内容のいかなる適切な組み合わせを含む。
【0078】
ユーザとのインタラクションを提供するために、コンピュータにはここで説明したシステムと技術を実施してよく、該コンピュータは、ユーザに情報を表示するための表示装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)監視モニタ)、及びキーボードとポインティング装置(例えば、マウスやトラックボール)を備え、ユーザは該キーボードと該ポインティング装置を介してコンピュータに入力してよい。その他のタイプの装置は更に、ユーザとのインタラクションを提供するためのものであってもよく、例えば、ユーザに提供するフィードバックはいかなる形態の感覚フィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、いかなる形態(音入力、音声入力、又は触覚入力を含む)でユーザからの入力を受信してよい。
【0079】
ここで述べたシステムや技術は、バックステージ部材を含む計算システム(例えば、データサーバとして)や、ミドルウェア部材を含む計算システム(例えば、アプリケーションサーバ)や、フロントエンド部材を含む計算システム(例えば、グラフィカルユーザインターフェースやウェブブラウザを有するユーザコンピュータであり、ユーザが、そのグラフィカルユーザインターフェースやこのウェブブラウザを通じて、ここで説明したシステム及び技術の実施形態とのインタラクティブを実現できる)や、このようなバックグラウンド部品、ミドルウェア部品、又はフロントエンド部品の任意の組み合わせを含む計算システムで実施されてよい。システムの部材は、任意の形式や媒体のデジタルデータ通信(例えば、通信ネットワーク)により相互に接続されてもよい。通信ネットワークの一例は、ローカルネットワーク(LAN)、広域ネットワーク(WAN)、インターネットとブロックチェーンネットワークを含む。
【0080】
コンピュータシステムは、クライアント側とサーバを含んでもよい。クライアント側とサーバは、一般的に相互に遠く離れ、通常、通信ネットワークを介してインタラクションを行う。互にクライアント側-サーバという関係を有するコンピュータプログラムを対応するコンピュータで運転することによってクライアント側とサーバとの関係を生成する。サーバは、クラウドサーバであってもよく、分散型システムのサーバでも、又はブロックチェーンと組み合わされたサーバであってもよい。
【0081】
理解すべきこととして、前述した様々な形態のフローを用いて、ステップを改めて順位付け、増加又は削除してよい。例えば、本開示に記載された各ステップは、並列的に実行してもよいし、順次実行してもよいし、異なる順序で実行してもよく、本開示に開示された技術案が所望する結果を実現できれば、本文はこれに限定されないことである。
【0082】
本開示の実施例又は例について、図面を参照しながら説明してきたが、上述した方法、システム、及び機器は、単に例示的な実施例又は例に過ぎず、本発明の範囲は、これらの実施例又は例によって限定されるものではないと理解されたい。実施例又は例の様々な要素は省略されてもよく、又はそれらの均等要素によって代替されてもよい。なお、各ステップは、本開示で説明した順序とは異なる順序で実行されてもよい。更に、実施例又は例の様々な要素は、様々な方法で組み合わせられてもよい。重要なのは、技術の進化に伴い、ここで説明される多くの要素は、本開示の後に現れる同等の要素に置き換えることができるということである。
図1
図2
図3
図4
図5
【手続補正書】
【提出日】2024-09-18
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
データ生成方法であって、前記方法は、
ユーザからの第1のクエリデータに基づいて、第1の回答データを生成することと、
前記第1の回答データに対する前記ユーザのネガティブフィードバックを受信したことに応答して、前記第1の回答データと前記ネガティブフィードバックに基づいて、前記第1の回答データに対する第1の再考結果を確定し、前記第1の再考結果は、前記第1の回答データに対する前記ユーザのフィードバックがネガティブフィードバックである診断理由を示すことと、
前記第1のクエリデータと前記第1の再考結果に基づいて、前記第1のクエリデータに対する第2の回答データを生成することとを含む、データ生成方法。
【請求項2】
前記の、ユーザからの第1のクエリデータに基づいて第1の回答データを生成することは、
前記第1のクエリデータに基づいて、入力データに基づいて回答データを生成するための深層学習モデルに用いられる第1の入力データを確定することと、
前記第1の入力データを前記深層学習モデルに入力することで、前記第1の回答データを取得することとを含み、
ここでは、前記の、前記第1のクエリデータと前記第1の再考結果に基づいて、前記第1のクエリデータに対する第2の回答データを生成することは、
前記第1のクエリデータと前記第1の再考結果に基づいて、前記深層学習モデルに用いられる第2の入力データを確定することと、
前記第2の入力データを前記深層学習モデルに入力することで、前記第2の回答データを取得することとを含む、請求項1に記載の方法。
【請求項3】
前記の、前記第1のクエリデータと前記第1の再考結果に基づいて、前記深層学習モデルに用いられる第2の入力データを確定することは、
前記第1のクエリデータ、前記第1の再考結果、および前記第2の入力データが前記第1の再考結果を含むことを示すタスク説明情報に基づいて、前記第2の入力データを確定することを含む、請求項2に記載の方法。
【請求項4】
前記の、前記第1の回答データと前記ネガティブフィードバックに基づいて、前記第1の回答データに対する第1の再考結果を確定することは、
前記第1の回答データと前記ネガティブフィードバックを再考生成ネットワークに入力することで、前記再考生成ネットワークによって出力される前記第1の再考結果を取得することを含み、ここで、前記再考生成ネットワークはサンプルコーパスを利用してトレーニングして得られ、前記サンプルコーパスは、サンプル回答データ、サンプルフィードバック、および前記サンプル回答データに対するサンプル再考結果を含む、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記の、前記第1の回答データに対する前記ユーザのネガティブフィードバックを受信したことに応答して、前記第1の回答データと前記ネガティブフィードバックに基づいて、前記第1の回答データに対する第1の再考結果を確定することは、
前記第1の回答データに対する前記ユーザの第1のフィードバックを受信したことに応答して、前記第1のフィードバックがネガティブフィードバックであると確定したことに応答して、前記第1の回答データと前記第1のフィードバックに基づいて、前記第1の回答データに対する第1の再考結果を確定することを含む、請求項1~3のいずれか一項に記載の方法。
【請求項6】
ユーザからの第2のクエリデータと前記第1のクエリデータとの類似度が予め設定される閾値よりも大きいと確定したことに応答して、前記第1のクエリデータ、前記第2の回答データ、および前記第2のクエリデータに基づいて、前記第2のクエリデータに対する第3の回答データを生成することをさらに含む、請求項1~3のいずれか一項に記載の方法。
【請求項7】
前記第1のクエリデータと前記第2の回答データをメモリバンクに記憶することをさらに含み、
前記の、ユーザからの第2のクエリデータと前記第1のクエリデータとの類似度が予め設定される閾値よりも大きいと確定したことに応答して、前記第1のクエリデータ、前記第2の回答データ、および前記第2のクエリデータに基づいて、前記第2のクエリデータに対する第3の回答データを生成することは、
ユーザからの第2のクエリデータと前記メモリバンクにおける第1のクエリデータとの類似度が前記予め設定される閾値よりも大きいと確定したことに応答して、前記メモリバンクから前記第2の回答データを取得することと、
前記第1のクエリデータ、前記第2の回答データ、および前記第2のクエリデータに基づいて、前記第3の回答データを生成することとを含む、請求項6に記載の方法。
【請求項8】
前記第1の再考結果は、前記第1の回答データに対する最適化ポリシーをさらに含む、請求項1~3のいずれか一項に記載の方法。
【請求項9】
データ生成装置であって、前記装置は、
ユーザからの第1のクエリデータに基づいて、第1の回答データを生成するように構成される第1の生成ユニットと、
前記第1の回答データに対する前記ユーザのネガティブフィードバックを受信したことに応答して、前記第1の回答データと前記ネガティブフィードバックに基づいて、前記第1の回答データに対する第1の再考結果を確定するように構成される確定ユニットであって、前記第1の再考結果は、前記第1の回答データに対する前記ユーザのフィードバックがネガティブフィードバックである診断理由を示すものと、
前記第1のクエリデータと前記第1の再考結果に基づいて、前記第1のクエリデータに対する第2の回答データを生成する第2の生成ユニットとを含む、データ生成装置。
【請求項10】
前記第1の生成ユニットは、
前記第1のクエリデータに基づいて、入力データに基づいて回答データを生成するための深層学習モデルに用いられる第1の入力データを確定するように構成される第1の確定サブユニットと、
前記第1の入力データを前記深層学習モデルに入力することで、前記第1の回答データを取得するように構成される第1の入力サブユニットとを含み、
前記第2の生成ユニットは、
前記第1のクエリデータと前記第1の再考結果に基づいて、前記深層学習モデルに用いられる第2の入力データを確定するように構成される第2の確定サブユニットと、
前記第2の入力データを前記深層学習モデルに入力することで、前記第2の回答データを取得するように構成される第2の入力サブユニットとを含む、請求項9に記載の装置。
【請求項11】
前記第2の入力サブユニットは、
前記第1のクエリデータ、前記第1の再考結果、および前記第2の入力データが前記第1の再考結果を含むことを示すタスク説明情報に基づいて、前記第2の入力データを確定するように構成される、請求項10に記載の装置。
【請求項12】
前記確定ユニットは、
前記第1の回答データと前記ネガティブフィードバックを再考生成ネットワークに入力することで、前記再考生成ネットワークによって出力される前記第1の再考結果を取得し、ここで、前記再考生成ネットワークはサンプルコーパスを利用してトレーニングして得られ、前記サンプルコーパスは、サンプル回答データ、サンプルフィードバック、および前記サンプル回答データに対するサンプル再考結果を含むように構成される、請求項9~11のいずれか一項に記載の装置。
【請求項13】
前記確定ユニットは、
前記第1の回答データに対する前記ユーザの第1のフィードバックを受信したことに応答して、前記第1のフィードバックがネガティブフィードバックであると確定したことに応答して、前記第1の回答データと前記第1のフィードバックに基づいて、前記第1の回答データに対する第1の再考結果を確定するように構成される、請求項9~11のいずれか一項に記載の装置。
【請求項14】
ユーザからの第2のクエリデータと前記第1のクエリデータとの類似度が予め設定される閾値よりも大きいと確定したことに応答して、前記第1のクエリデータ、前記第2の回答データ、および前記第2のクエリデータに基づいて、前記第2のクエリデータに対する第3の回答データを生成するように構成される第3の生成ユニットをさらに含む、請求項9~11のいずれか一項に記載の装置。
【請求項15】
前記第1のクエリデータと前記第2の回答データをメモリバンクに記憶するように構成される記憶ユニットをさら含み、
前記第3の生成ユニットは、
ユーザからの第2のクエリデータと前記メモリバンクにおける第1のクエリデータとの類似度が前記予め設定される閾値よりも大きいと確定したことに応答して、前記メモリバンクから前記第2の回答データを取得するように構成される取得サブユニットと、
前記第1のクエリデータ、前記第2の回答データ、および前記第2のクエリデータに基づいて、前記第3の回答データを生成するように構成される生成サブユニットとを含む、請求項14に記載の装置。
【請求項16】
前記第1の再考結果は、前記第1の回答データに対する最適化ポリシーをさらに含む、請求項9~11のいずれか一項に記載の装置。
【請求項17】
電子機器であって、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信接続されたメモリとを含み、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶されており、前記命令は前記少なくとも1つのプロセッサによって実行されることにより、前記少なくとも1つのプロセッサは請求項1に記載の方法を実行させることができる、電子機器。
【請求項18】
コンピュータ命令が記憶された非一時的コンピュータ可読記憶媒体であって、前記コンピュータ命令は、コンピュータに請求項1に記載の方法を実行させるために用いられる、非一時的コンピュータ可読記憶媒体。
【請求項19】
コンピュータプログラムであって、前記コンピュータプログラムは、プロセッサによって実行されると、請求項1に記載の方法を実現する、コンピュータプログラム。
【外国語明細書】