特開2024-174859 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン　バイドゥ　ネットコム　サイエンス　アンド　テクノロジー　カンパニー　リミテッドの特許一覧

特開2024-174859データ生成方法及び装置、機器及び媒体

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024174859

(43)【公開日】2024-12-17

(54)【発明の名称】データ生成方法及び装置、機器及び媒体

(51)【国際特許分類】

G06F 16/90 20190101AFI20241210BHJP

【ＦＩ】

G06F16/90 100

【審査請求】有

【請求項の数】19

【出願形態】ＯＬ

【外国語出願】

【公開請求】

(21)【出願番号】P 2024098716

(22)【出願日】2024-06-19

(31)【優先権主張番号】202310798540.8

(32)【優先日】2023-06-30

(33)【優先権主張国・地域又は機関】CN

【公序良俗違反の表示】

（特許庁注：以下のものは登録商標）

１．ＷＩＮＤＯＷＳＰＨＯＮＥ

２．ＡＮＤＲＯＩＤ

(71)【出願人】

【識別番号】514322098

【氏名又は名称】ベイジンバイドゥネットコムサイエンステクノロジーカンパニーリミテッド

【氏名又は名称原語表記】ＢｅｉｊｉｎｇＢａｉｄｕＮｅｔｃｏｍＳｃｉｅｎｃｅＴｅｃｈｎｏｌｏｇｙＣｏ．，Ｌｔｄ．

【住所又は居所原語表記】２／ＦＢａｉｄｕＣａｍｐｕｓ，Ｎｏ．１０，Ｓｈａｎｇｄｉ１０ｔｈＳｔｒｅｅｔ，ＨａｉｄｉａｎＤｉｓｔｒｉｃｔ，Ｂｅｉｊｉｎｇ１０００８５，Ｃｈｉｎａ

(74)【代理人】

【識別番号】100107766

【弁理士】

【氏名又は名称】伊東忠重

(74)【代理人】

【識別番号】100229448

【弁理士】

【氏名又は名称】中槇利明

(72)【発明者】

【氏名】ゾーァヤーンレイ

(72)【発明者】

【氏名】スーチイバオ

(72)【発明者】

【氏名】ホワウー

(72)【発明者】

【氏名】ハイフオンワーン

(57)【要約】（修正有）

【課題】ユーザのクエリ内容に基づいて回答を生成することで、ユーザと対話することを実現するデータ生成方法、装置、電子機器、コンピュータ可読記憶媒体、およびコンピュータプログラム製品を提供する。
【解決手段】データ生成方法は、ユーザからの第１のクエリデータに基づいて、第１の回答データを生成することと、前記第１の回答データに対する前記ユーザのネガティブフィードバックを受信したことに応答して、前記第１の回答データと前記ネガティブフィードバックに基づいて、前記第１の回答データに対する第１の再考結果を確定し、前記第１の再考結果は、前記第１の回答データに対する前記ユーザのフィードバックがネガティブフィードバックである診断理由を示すことと、前記第１のクエリデータと前記第１の再考結果に基づいて、前記第１のクエリデータに対する第２の回答データを生成することと、を含む。
【選択図】図２

【特許請求の範囲】

【請求項1】

データ生成方法であって、前記方法は、
ユーザからの第１のクエリデータに基づいて、第１の回答データを生成することと、
前記第１の回答データに対する前記ユーザのネガティブフィードバックを受信したことに応答して、前記第１の回答データと前記ネガティブフィードバックに基づいて、前記第１の回答データに対する第１の再考結果を確定し、前記第１の再考結果は、前記第１の回答データに対する前記ユーザのフィードバックがネガティブフィードバックである診断理由を示すことと、
前記第１のクエリデータと前記第１の再考結果に基づいて、前記第１のクエリデータに対する第２の回答データを生成することとを含む、データ生成方法。

【請求項2】

前記の、ユーザからの第１のクエリデータに基づいて第１の回答データを生成することは、
前記第１のクエリデータに基づいて、入力データに基づいて回答データを生成するための深層学習モデルに用いられる第１の入力データを確定することと、
前記第１の入力データを前記深層学習モデルに入力することで、前記第１の回答データを取得することとを含み、
ここでは、前記の、前記第１のクエリデータと前記第１の再考結果に基づいて、前記第１のクエリデータに対する第２の回答データを生成することは、
前記第１のクエリデータと前記第１の再考結果に基づいて、前記深層学習モデルに用いられる第２の入力データを確定することと、
前記第２の入力データを前記深層学習モデルに入力することで、前記第２の回答データを取得することとを含む、請求項１に記載の方法。

【請求項3】

前記の、前記第１のクエリデータと前記第１の再考結果に基づいて、前記深層学習モデルに用いられる第２の入力データを確定することは、
前記第１のクエリデータ、前記第１の再考結果、および前記第２の入力データが前記第１の再考結果を含むことを示すタスク説明情報に基づいて、前記第２の入力データを確定することを含む、請求項２に記載の方法。

【請求項4】

前記の、前記第１の回答データと前記第１のフィードバックに基づいて、前記第１の回答データに対する第１の再考結果を確定することは、
前記第１の回答データと前記第１のフィードバックを再考生成ネットワークに入力することで、前記再考生成ネットワークによって出力される前記第１の再考結果を取得することを含み、ここで、前記再考生成ネットワークはサンプルコーパスを利用してトレーニングして得られ、前記サンプルコーパスは、サンプル回答データ、サンプルフィードバック、および前記サンプル回答データに対するサンプル再考結果を含む、請求項１～３のいずれか一項に記載の方法。

【請求項5】

前記の、前記第１の回答データに対する前記ユーザのネガティブフィードバックを受信したことに応答して、前記第１の回答データと前記ネガティブフィードバックに基づいて、前記第１の回答データに対する第１の再考結果を確定することは、
前記第１の回答データに対する前記ユーザの第１のフィードバックを受信したことに応答して、前記第１のフィードバックがネガティブフィードバックであると確定したことに応答して、前記第１の回答データと前記第１のフィードバックに基づいて、前記第１の回答データに対する第１の再考結果を確定することを含む、請求項１～３のいずれか一項に記載の方法。

【請求項6】

ユーザからの第２のクエリデータと前記第１のクエリデータとの類似度が予め設定される閾値よりも大きいと確定したことに応答して、前記第１のクエリデータ、前記第２の回答データ、および前記第２のクエリデータに基づいて、前記第２のクエリデータに対する第３の回答データを生成することをさらに含む、請求項１～３のいずれか一項に記載の方法。

【請求項7】

前記第１のクエリデータと前記第２の回答データをメモリバンクに記憶することをさらに含み、
前記の、ユーザからの第２のクエリデータと前記第１のクエリデータとの類似度が予め設定される閾値よりも大きいと確定したことに応答して、前記第１のクエリデータ、前記第２の回答データ、および前記第２のクエリデータに基づいて、前記第２のクエリデータに対する第３の回答データを生成することは、
ユーザからの第２のクエリデータと前記メモリバンクにおける第１のクエリデータとの類似度が前記予め設定される閾値よりも大きいと確定したことに応答して、前記メモリバンクから前記第２の回答データを取得することと、
前記第１のクエリデータ、前記第２の回答データ、および前記第２のクエリデータに基づいて、前記第３の回答データを生成することとを含む、請求項６に記載の方法。

【請求項8】

前記第１の再考結果は、前記第１の回答データに対する最適化ポリシーをさらに含む、請求項１～３のいずれか一項に記載の方法。

【請求項9】

データ生成装置であって、前記装置は、
ユーザからの第１のクエリデータに基づいて、第１の回答データを生成するように構成される第１の生成ユニットと、
前記第１の回答データに対する前記ユーザのネガティブフィードバックを受信したことに応答して、前記第１の回答データと前記ネガティブフィードバックに基づいて、前記第１の回答データに対する第１の再考結果を確定するように構成される確定ユニットであって、前記第１の再考結果は、前記第１の回答データに対する前記ユーザのフィードバックがネガティブフィードバックである診断理由を示すものと、
前記第１のクエリデータと前記第１の再考結果に基づいて、前記第１のクエリデータに対する第２の回答データを生成する第２の生成ユニットとを含む、データ生成装置。

【請求項10】

前記第１の生成ユニットは、
前記第１のクエリデータに基づいて、入力データに基づいて回答データを生成するための深層学習モデルに用いられる第１の入力データを確定するように構成される第１の確定サブユニットと、
前記第１の入力データを前記深層学習モデルに入力することで、前記第１の回答データを取得するように構成される第１の入力サブユニットとを含み、
前記第２の生成ユニットは、
前記第１のクエリデータと前記第１の再考結果に基づいて、前記深層学習モデルに用いられる第２の入力データを確定するように構成される第２の確定サブユニットと、
前記第２の入力データを前記深層学習モデルに入力することで、前記第２の回答データを取得するように構成される第２の入力サブユニットとを含む、請求項９に記載の装置。

【請求項11】

前記第２の入力サブユニットは、
前記第１のクエリデータ、前記第１の再考結果、および前記第２の入力データが前記第１の再考結果を含むことを示すタスク説明情報に基づいて、前記第２の入力データを確定するように構成される、請求項１０に記載の装置。

【請求項12】

前記確定ユニットは、
前記第１の回答データと前記第１のフィードバックを再考生成ネットワークに入力することで、前記再考生成ネットワークによって出力される前記第１の再考結果を取得し、ここで、前記再考生成ネットワークはサンプルコーパスを利用してトレーニングして得られ、前記サンプルコーパスは、サンプル回答データ、サンプルフィードバック、および前記サンプル回答データに対するサンプル再考結果を含むように構成される、請求項９～１１のいずれか一項に記載の装置。

【請求項13】

前記確定ユニットは、
前記第１の回答データに対する前記ユーザの第１のフィードバックを受信したことに応答して、前記第１のフィードバックがネガティブフィードバックであると確定したことに応答して、前記第１の回答データと前記第１のフィードバックに基づいて、前記第１の回答データに対する第１の再考結果を確定するように構成される、請求項９～１１のいずれか一項に記載の装置。

【請求項14】

ユーザからの第２のクエリデータと前記第１のクエリデータとの類似度が予め設定される閾値よりも大きいと確定したことに応答して、前記第１のクエリデータ、前記第２の回答データ、および前記第２のクエリデータに基づいて、前記第２のクエリデータに対する第３の回答データを生成するように構成される第３の生成ユニットをさらに含む、請求項９～１１のいずれか一項に記載の装置。

【請求項15】

前記第１のクエリデータと前記第２の回答データをメモリバンクに記憶するように構成される記憶ユニットをさら含み、
前記第３の生成ユニットは、
ユーザからの第２のクエリデータと前記メモリバンクにおける第１のクエリデータとの類似度が前記予め設定される閾値よりも大きいと確定したことに応答して、前記メモリバンクから前記第２の回答データを取得するように構成される取得サブユニットと、
前記第１のクエリデータ、前記第２の回答データ、および前記第２のクエリデータに基づいて、前記第３の回答データを生成するように構成される生成サブユニットとを含む、請求項１４に記載の装置。

【請求項16】

前記第１の再考結果は、前記第１の回答データに対する最適化ポリシーをさらに含む、請求項９～１１のいずれか一項に記載の装置。

【請求項17】

電子機器であって、
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサに通信接続されたメモリとを含み、
前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶されており、前記命令は前記少なくとも１つのプロセッサによって実行されることにより、前記少なくとも１つのプロセッサは請求項１に記載の方法を実行させることができる、電子機器。

【請求項18】

コンピュータ命令が記憶された非一時的コンピュータ可読記憶媒体であって、前記コンピュータ命令は、コンピュータに請求項１に記載の方法を実行させるために用いられる、非一時的コンピュータ可読記憶媒体。

【請求項19】

コンピュータプログラムを含むコンピュータプログラム製品であって、前記コンピュータプログラムは、プロセッサによって実行されると、請求項１に記載の方法を実現する、コンピュータプログラム製品。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、人工知能技術分野に関し、特に自然言語処理と深層学習などの分野に関し、具体的には、データ生成方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム製品に関する。

【背景技術】

【0002】

人工インテリジェントは、コンピュータに人間のいくつかの思惟過程及び知的行動（例えば、学習、推理、思考、計画など）を模擬させるように研究する科目であり、ハードウェア面の技術もあれば、ソフトウェア面の技術もある。人工インテリジェントのハードウェア技術は、一般的にセンサ、人工インテリジェント専用チップ、クラウドコンピューティング、分散ストレージ、ビッグデータ処理などの技術を含み、人工知能ソフトウェア技術は、主にコンピュータ視覚技術、音声認識技術、自然言語処理技術及び機械学習／深層学習、ビッグデータ処理技術、ナレッジグラフ技術などのいくつかの大きな方向を含む。

【0003】

生成式言語メガモデルは様々な自然言語処理タスクに応用することができ、特にユーザのクエリ内容に基づいて回答のための自然言語テキストを生成することで、ユーザと対話することを実現することができる。

【0004】

該部分で説明される方法は、必ずしも以前に想定された方法又は採用された方法ではない。特に断りのない限り、該部分に記載されているいずれの方法は、該部分に含まれるだけで従来技術であると考えられるべきではない。同様に、特に断りのない限り、該部分で言及されている課題は、いかなる従来の技術で承認されたものであると考えるべきではない。

【発明の概要】

【0005】

本開示は、データ生成方法、装置、電子機器、コンピュータ可読記憶媒体、およびコンピュータプログラム製品を提供する。

【0006】

本開示の一態様によれば、データ生成方法を提供し、前記方法は、ユーザからの第１のクエリデータに基づいて、第１の回答データを生成することと、前記第１の回答データに対する前記ユーザのネガティブフィードバックを受信したことに応答して、前記第１の回答データと前記ネガティブフィードバックに基づいて、前記第１の回答データに対する第１の再考結果を確定し、前記第１の再考結果は、前記第１の回答データに対する前記ユーザのフィードバックがネガティブフィードバックである診断理由を示すことと、前記第１のクエリデータと前記第１の再考結果に基づいて、前記第１のクエリデータに対する第２の回答データを生成することとを含む。

【0007】

本開示の別の態様によれば、データ生成装置を提供し、前記装置は、ユーザからの第１のクエリデータに基づいて、第１の回答データを生成するように構成される第１の生成ユニットと、前記第１の回答データに対する前記ユーザのネガティブフィードバックを受信したことに応答して、前記第１の回答データと前記ネガティブフィードバックに基づいて、前記第１の回答データに対する第１の再考結果を確定するように構成される確定ユニットであって、前記第１の再考結果は、前記第１の回答データに対する前記ユーザのフィードバックがネガティブフィードバックである診断理由を示すものと、前記第１のクエリデータと前記第１の再考結果に基づいて、前記第１のクエリデータに対する第２の回答データを生成する第２の生成ユニットとを含む。

【0008】

本開示の別の態様によれば、電子機器を提供し、該電子機器は、少なくとも一つのプロセッサと、前記少なくとも一つのプロセッサに通信接続されたメモリとを含み、ここで、前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶されており、前記命令は前記少なくとも１つのプロセッサによって実行されることにより、前記少なくとも１つのプロセッサに上記データ生成方法を実行させることができる。

【0009】

本開示の別の態様によれば、コンピュータ命令が記憶された非一時的コンピュータ可読記憶媒体を提供し、前記コンピュータ命令は、前記コンピュータに上記データ生成方法を実行させるために用いられる。

【0010】

本開示の別の態様によれば、コンピュータプログラムを含むコンピュータプログラム製品を提供し、コンピュータプログラムは、プロセッサによって実行されると、上記データ生成方法を実現することができる。

【0011】

本開示の一又は複数の実施例によれば、回答データの生成の品質を向上させることができる。

【0012】

理解すべきこととして、この部分に説明される内容は、本開示の実施例の肝心又は重要な特徴を識別することを意図しておらず、本開示の範囲を限定するためのものでもない。本開示の他の特徴は、以下の明細書によって容易に理解される。

【図面の簡単な説明】

【0013】

図面は、実施例を例示的に示し、明細書の一部を構成し、明細書の文字による説明とともに、実施例の例示的な実施形態を説明するために用いられる。図示の実施例は例示の目的のみであり、特許請求の範囲を限定するものではない。全ての図面において、同一の符号は、類似しているが、必ずしも同じとは限らない要素を指す。

【図1】本開示の例示的な実施例による、本明細書で説明される様々な方法を実施することができる例示的なシステムを示す概略図である。

【図2】本開示の例示的な実施例によるデータ生成方法を示すフローチャートである。

【図3】本開示の例示的な実施例によるデータ生成プロセスを示す概略図である。

【図4】本開示の例示的な実施例によるデータ生成装置を示す構成ブロック図である。

【図5】本発明の実施例を実現するために使用できる例示的な電子機器を示す構成ブロック図である。

【発明を実施するための形態】

【0014】

以下、図面に合わせて本開示の例示的な実施例を説明して、それに含まれる本開示の実施例における様々な詳細が理解を助けるためので、それらは単なる例示的なものと考えられるべきである。従って、当業者であれば、本開示の範囲から逸脱することなく、本明細書で説明された実施例に対して様々な変更及び修正を行うことができることを認識すべきである。同様に、明瞭と簡潔のために、以下の説明では公知の機能及び構造についての説明を省略している。

【0015】

本開示では、特に明記しない限り、様々な要素を説明するための「第１」、「第２」などの用語の使用は、これらの要素の位置関係、タイミング関係、又は重要性関係を限定することを意図していない。このような用語は、一要素を別の要素から区別するためにのみ使用される。いくつかの例では、第１の要素と第２の要素は、該要素の同じ例を指してもよく、場合によっては、コンテキストの説明に基づいて、異なる例を指してもよい。

【0016】

本開示の様々な前記例の説明で使用される用語は、特定の例を説明することのみを目的としており、限定することを意図していない。コンテキストで別途に明確に示されていない限り、特に要素の数を限定しないなら、該要素は一つであってもよいし、複数であってもよい。なお、本開示で使用される用語「及び／又は」は、リストされたアイテムのいずれか及び可能な全ての組み合わせ方式をカバーする。

【0017】

関連技術において、生成式言語モデルを応用してユーザの入力データに基づいて回答データを生成する場合、モデルトレーニング段階でコーパスを人手でラベル付けしたり、（例えば、損失関数を最適化したり、強化学習を行ったりする）トレーニング方式を調整したりすることで、モデルの性能を向上させる。なお、モデルの応用段階、すなわちデータ生成プロセスでは、通常、ユーザが入力したクエリデータのみに基づいて回答データを直接生成するが、回答データに対するユーザのフィードバックに従って対応する回答データを調整することを実現できず、それによって、回答データの品質がユーザのニーズを十分に満たすことができない。

【0018】

これに基づいて、本開示は、データ生成方法を提供し、ユーザのクエリデータに対して初期の回答データを生成した後、この回答データに対するユーザのネガティブフィードバックを受信した場合に、このネガティブフィードバックに基づいて、この回答データがネガティブフィードバックを得た理由を自己診断し、さらに、この回答データに対する再考結果を生成することにより、この再考結果に基づいて新たな回答データを生成し、それによって、回答データをユーザのニーズにより合致させ、回答データの生成の品質を向上させる。

【0019】

以下、図面を参照して本開示の実施例について詳細に説明する。

【0020】

図１は、本開示の実施例による、本明細書に記載された様々な方法及び装置を、その中で実施することができる例示的なシステム１００の概略図を示す。図１を参照すると、該システム１００は、一つ以上のクライアントデバイス１０１、１０２、１０３、１０４、１０５と１０６、サーバ１２０、及び一つ以上のクライアントデバイスをサーバ１２０に結合する一つ以上の通信ネットワーク１１０を含む。クライアントデバイス１０１、１０２、１０３、１０４、１０５と１０６は、一つ以上のアプリケーションを実行するように構成されることが可能である。

【0021】

本開示の実施形態では、サーバ１２０はデータ生成方法の実行を可能にする一つ以上のサービスまたはソフトウェアアプリケーションを実行することができる。

【0022】

いくつかの実施例では、サーバ１２０は、非仮想環境と仮想環境を含むことができる他のサービス又はソフトウェアアプリケーションも提供することができる。いくつかの実施例では、これらのサービスは、ｗｅｂベースのサービス又はクラウドサービスとして提供することができ、例えば、ソフトウェアアズアサービス（ＳａａＳ）モデルでクライアントデバイス１０１、１０２、１０３、１０４、１０５及び／又は１０６のユーザに提供される。

【0023】

図１に示す配置では、サーバ１２０は、サーバ１２０により実行される機能を実現する一つ以上のアセンブリを含んでもよい。これらのアセンブリは、一つ以上のプロセッサで実行できるソフトウェアアセンブリ、ハードウェアアセンブリ、又はそれらの組み合わせを含んでもよい。クライアントデバイス１０１、１０２、１０３、１０４、１０５及び／又は１０６を操作するユーザは、これらのアセンブリが提供するサービスを利用するために、一つ以上のクライアントアプリケーションを順次利用してサーバ１２０とやり取りをすることができる。様々な異なるシステム配置が可能であり、システム１００とは異なってもよいことを理解されたい。したがって、図１は、本明細書に記載された様々な方法を実施するためのシステムの一例であり、制限することを意図していない。

【0024】

ユーザは、クライアントデバイス１０１、１０２、１０３、１０４、１０５及び／又は１０６を用いて、クエリデータとフィードバックを送信することができる。クライアントデバイスは、クライアントデバイスのユーザがクライアントデバイスとやり取りするインターフェースを提供することができる。クライアントデバイスは、該インターフェースを介してユーザに情報を出力することもできる。図１では６つのクライアントデバイスしか図示されていないが、当業者であれば理解できるように、本開示はいかなる数のクライアントデバイスもサポートできる。

【0025】

クライアントデバイス１０１、１０２、１０３、１０４、１０５及び／又は１０６は、携帯型ハンドヘルドデバイス、汎用コンピュータ（例えば、パーソナルコンピュータやノートパソコン）、ワークステーションコンピュータ、ウェアラブルデバイス、スマートスクリーンデバイス、セルフサービス端末デバイス、サービスロボット、ゲームシステム、シンクライアント、各種のメッセージングデバイス、センサ、又はその他の検知デバイスなどの様々なタイプのコンピュータデバイスを含んでもよい。これらのコンピュータデバイスは、ＭＩＣＲＯＳＯＦＴＷｉｎｄｏｗｓ、ＡＰＰＬＥｉＯＳ、類ＵＮＩＸ（登録商標）オペレーティングシステム、Ｌｉｎｕｘ（登録商標）又は類Ｌｉｎｕｘ（登録商標）オペレーティングシステム（例えば、ＧＯＯＧＬＥＣｈｒｏｍｅＯＳ）などの様々なタイプ及びバージョンのソフトウェアアプリケーションやオペレーティングシステムを実行したり、ＭＩＣＲＯＳＯＦＴＷｉｎｄｏｗｓＭｏｂｉｌｅＯＳ、ｉＯＳ、ＷｉｎｄｏｗｓＰｈｏｎｅ、Ａｎｄｒｏｉｄなどの各種のモバイルオペレーティングシステムを含んだりすることができる。携帯用ハンドヘルドデバイスには、携帯電話、インテリジェントフォン、タブレット、パーソナルデジタルアシスタント（ＰＤＡ）などを含んでもよい。ウェアラブルデバイスは、ヘッドマウント型ディスプレイ（例えば、スマートグラス）と他のデバイスを含んでもよい。ゲームシステムは、様々なハンドヘルド型のゲームデバイス、インターネット対応のゲームデバイスなどを含んでもよい。クライアントデバイスは、例えば、インターネットＩｎｔｅｒｎｅｔ関連アプリケーション、通信アプリケーション（例えば、電子メールアプリケーション）、ショートメッセージサービス（ＳＭＳ）アプリケーション、様々なアプリケーションを実行でき、且つ様々な通信プロトコルを使用できる。

【0026】

ネットワーク１１０は、当業者に知られている任意のタイプのネットワークであってもよく、それは、データ通信をサポートするために、複数の利用可能なプロトコルのいずれか一つ（ＴＣＰ／ＩＰ、ＳＮＡ、ＩＰＸなどを含むがこれらに限定されない）を使用することができる。例として、一つ以上のネットワーク１１０は、ローカルエリアネットワーク（ＬＡＮ）、イーサネットベースのネットワーク、トークンループ、ワイドエリアネットワーク（ＷＡＮ）、インターネット、仮想ネットワーク、仮想プライベートネットワーク（ＶＰＮ）、イントラネット、エクストラネット、ブロックチェーンネットワーク、公衆交換電話網（ＰＳＴＮ）、赤外線ネットワーク、無線ネットワーク（例えば、ブルートゥース（登録商標）、ＷＩＦＩ）、及び／又はこれら及び／又はその他のネットワークの任意の組み合わせであってもよい。

【0027】

サーバ１２０は、一つ以上の汎用コンピュータ、専用サーバコンピュータ（例えば、ＰＣ（パーソナルコンピュータ）サーバ、ＵＮＩＸ（登録商標）サーバ、ミッドレンジサーバ）、ブレードサーバ、大型コンピュータ、サーバクラスタ、又はその他のいかなる適切な配置及び／又は組み合わせを含んでもよい。サーバ１２０は、仮想オペレーティングシステムを実行する一つ以上の仮想マシン、又は仮想化に関わる他のコンピューティングアーキテクチャ（例えば、サーバの仮想記憶デバイスを維持するために仮想化された論理記憶デバイスの一つ以上のフレキシブルプール）を含んでもよい。様々な実施例では、サーバ１２０は、以下に説明する機能を提供する一つ以上のサービス又はソフトウェアアプリケーションを実行することができる。

【0028】

サーバ１２０における計算ユニットは、上記した任意のオペレーティングシステム及び任意の商用サーバオペレーティングシステムを含む一つ以上のオペレーティングシステムを実行することができる。サーバ１２０は、ＨＴＴＰサーバ、ＦＴＰサーバ、ＣＧＩサーバ、ＪＡＶＡ（登録商標）サーバ、データベースサーバなどを含む様々な追加のサーバアプリケーション及び／又は中間層アプリケーションのいずれか一つを実行することもできる。

【0029】

いくつかの実施例では、サーバ１２０は、クライアントデバイス１０１、１０２、１０３、１０４、１０５及び１０６のユーザから受信したデータフィード及び／又はイベントの更新を分析及び統合するための一つ又は複数のアプリケーションを含んでもよい。サーバ１２０は、クライアントデバイス１０１、１０２、１０３、１０４、１０５及び１０６の一つ又は複数のディスプレイデバイスを介してデータフィード及び／又はリアルタイムイベントを表示する一つ又は複数のアプリケーションを含んでもよい。

【0030】

いくつかの実施例では、サーバ１２０は、分散型システムのサーバであってもよいし、ブロックチェーンを組み込んだサーバであってもよい。サーバ１２０は、クラウドサーバであってもよいし、人工知能技術を備えたインテリジェントクラウドコンピューティングサーバやインテリジェントクラウドホストであってもよい。クラウドサーバはクラウドコンピューティングサービスシステムにおけるホスト製品であり、従来の物理ホストと仮想専用サーバ（ＶＰＳ、ＶｉｒｔｕａｌＰｒｉｖａｔｅＳｅｒｖｅｒ）サービスに存在する管理難度が大きく、業務拡張性が弱いという欠陥を解決する。

【0031】

システム１００は、一つ以上のデータベース１３０を含むこともできる。いくつかの実施例では、これらのデータベースはデータやその他の情報を記憶するために使用できる。例えば、データベース１３０のうちの一つ以上は、オーディオファイルやビデオファイルのような情報を記憶するために使用できる。データベース１３０は、さまざまな位置に配置することができる。例えば、サーバ１２０が使用するデータベースは、サーバ１２０のローカルにあってもよいし、サーバ１２０から離れて、ネットワーク又は専用の接続を介してサーバ１２０と通信してもよい。データベース１３０は、異なるタイプであってもよい。いくつかの実施例では、サーバ１２０が使用するデータベースは、例えば、リレーショナルデータベースであってもよい。これらのデータベースのうちの一つ以上は、命令に応じてデータベースとデータベースからのデータを記憶、更新、検索できる。

【0032】

いくつかの実施例では、データベース１３０のうちの一つ以上は、アプリケーションによって使用され、アプリケーションのデータを記憶することもできる。アプリケーションが使用するデータベースは、異なるタイプのデータベースであってもよく、例えば、キー値リポジトリ、オブジェクトリポジトリ、ファイルシステムによってサポートされる汎用リポジトリなどである。

【0033】

図１のシステム１００は、本開示に基づいて説明した様々な方法及び装置を応用することができるように、様々な方法で構成し操作することができる。

【0034】

図２は、本開示の例示的な実施例によるデータ生成方法２００のフロー図を示す。図２に示すように、方法２００は、
ユーザからの第１のクエリデータに基づいて、第１の回答データを生成するステップＳ２０１と、
前記第１の回答データに対する前記ユーザのネガティブフィードバックを受信したことに応答して、前記第１の回答データと前記ネガティブフィードバックに基づいて、前記第１の回答データに対する第１の再考結果を確定し、前記第１の再考結果は、前記第１の回答データに対する前記ユーザのフィードバックがネガティブフィードバックである診断理由を示すステップＳ２０２と、
前記第１のクエリデータと前記第１の再考結果に基づいて、前記第１のクエリデータに対する第２の回答データを生成するステップＳ２０３とを含む。

【0035】

方法２００に記載されたデータ生成方式により、ユーザが入力したクエリデータに対して第１の回答データを生成した後、第１の回答データに対するユーザのネガティブフィードバックを受信した場合、このネガティブフィードバックに基づいて、第１の回答データに対する再考結果を生成することで、自己診断を達成し、さらに、この再考結果に基づいて、新たな第２の回答データを生成することで、新たな第２の回答データをユーザのニーズにより一致し、回答データの生成の品質を向上させることができる。

【0036】

いくつかの例では、第１のクエリデータ、第１の回答データ、第２の回答データおよび第１の再考結果は、自然言語テキストであってもよい。例えば、第１のクエリデータは、「５ワードの自動車のキャッチフレーズを書いてください」であってもよく、このような場合には、生成された第１の回答データが７ワードを含むキャッチフレーズであり、また、ユーザが第１の回答データに対してネガティブフィードバックを与える場合、ネガティブフィードバックを受信した理由を自己診断することで、「ユーザの要求は５ワードのキャッチフレーズであり、生成結果には７ワードが含まれており、ワード数がユーザの要求に合わない」の第１の再考結果を得ることができ、第１の再考結果を利用して第１の回答データがネガティブフィードバックを得る可能性のある原因を示すことにより、それに基づいて、新たな第２の回答データを生成することで、第２の回答データが再びユーザからのネガティブフィードバックを受信することを回避し、それによって、回答データの生成の品質を向上させることができる。

【0037】

いくつかの実施例によれば、前記第１の再考結果は、前記第１の回答データに対する最適化ポリシーをさらに含む。これにより、最適化ポリシーをさらに含む再考結果に基づいてデータを生成することで、再考結果に基づいて、目標性がより強く、内容がより豊富で具体的な第２の回答データを得ることができる。

【0038】

上記の例では、再考結果は、「ユーザの要求は５ワードのキャッチフレーズであり、生成結果には７ワードが含まれており、ワード数がユーザの要求に合わず、再度生成時には結果が５ワードであることを保証する必要がある」であってもよい。「再度生成時には結果が５ワードであることを保証する必要がある」の最適化ポリシーを含む再考結果に基づいて、新たな第２の回答データを生成することで、第２の回答データの生成の品質を向上させて、さらにユーザ体験を向上させることができる。

【0039】

いくつかの実施例によれば、ステップＳ２０１において、ユーザからの第１のクエリデータに基づいて、第１の回答データを生成することは、前記第１のクエリデータに基づいて、入力データに基づいて回答データを生成するための深層学習モデルに用いられる第１の入力データを確定することと、前記第１の入力データを前記深層学習モデルに入力して前記第１の回答データを取得することとを含み、かつステップＳ２０３において、前記第１のクエリデータと前記第１の再考結果に基づいて、前記第１のクエリデータに対する第２の回答データを生成することは、前記第１のクエリデータと前記第１の再考結果に基づいて、前記深層学習モデルに用いられる第２の入力データを確定することと、前記第２の入力データを前記深層学習モデルに入力することで、前記第２の回答データを取得することとを含む。これにより、深層学習モデルを利用して回答データを生成することができ、異なるニーズを示す第１の入力データと第２の入力データを生成して深層学習モデルに入力することにより、すなわち同一の深層学習モデルを利用して第１の回答データと第２の回答データを生成し、効率と利便性を向上させることができる。

【0040】

いくつかの例では、入力データに基づいて回答データを生成するための深層学習モデルは、エンドツーエンドの特性を持ち、自然言語テキスト形式の入力データに基づいて、自然言語テキスト形式の回答データを直接生成することができる。いくつかの例では、この深層学習モデルは、エンコーダ（Ｅｎｃｏｄｅｒ）及びデコーダ（Ｄｅｃｏｄｅｒ）を有するＮ層Ｔｒａｎｓｆｏｒｍｅｒネットワーク構造、又は統合プリトレーニング言語モデル（Ｕｎｉｆｉｅｄｐｒｅ－ｔｒａｉｎｅｄＬａｎｇｕａｇｅＭｏｄｅｌ，ＵｎｉＬＭ）ネットワーク構造を採用することができる。この深層学習モデルは、他のＴｒａｎｓｆｏｒｍｅｒネットワーク構造に基づくニューラルネットワークモデルでもよく、ここでは限定されないことを理解されたい。

【0041】

いくつかの例では、この深層学習モデルは、サンプルコーパスを利用してトレーニングして得られることができ、この深層学習モデルをトレーニングするためのサンプルコーパスは、例えば、サンプル入力データとこのサンプル入力データに対するサンプル回答データとを含んでもよい。トレーニング過程において、サンプル入力データをこの深層学習モデルに入力することで、予測回答データを得、予測回答データとサンプル回答データに基づいて損失値を計算し、さらに損失値に基づいて、深層学習モデルのパラメータを調整することができる。いくつかの例では、負の対数尤度損失（Ｎｅｇａｔｉｖｅ－ＬｏｇｌｉｋｅｌｉｈｏｏｄＬｏｓｓ、ＮＬＬ）計算方式に基づいて、深層学習モデルの損失値を確定することができる。

【0042】

いくつかの例では、それぞれ異なるコーパスを利用して、ステップＳ２０１に応用する深層学習モデルとステップＳ２０３に応用する深層学習モデルもトレーニングし、より指向的なトレーニングコーパスを使用することにより、モデルによって生成された回答内容の正確度を向上させることができる。

【0043】

いくつかの実施例によれば、前記第１のクエリデータと前記第１の再考結果に基づいて、前記深層学習モデルに用いられる第２の入力データを確定することは、前記第１のクエリデータ、前記第１の再考結果、および前記第２の入力データが前記第１の再考結果を含むことを示すタスク説明情報に基づいて、前記第２の入力データを確定することを含む。これにより、入力内容に基づいてタスク説明情報を追加することにより、現在のデータ生成ニーズを明示的に示すことができ、深層学習モデルが第１の再考結果と第１のクエリデータに基づいて第２の入力データを生成し、データ生成の効率を向上させることができる。

【0044】

前述した例を参照して、一例において、第１のクエリデータ、第１の回答データ、第２の回答データと第１の再考結果は、いずれも自然言語テキストであり、深層学習モデルも自然言語テキストを受信して生成するために用いられる。この場合、タスク説明情報は、入力データにおける第１のクエリデータと第１の再考結果の存在を示すための予め設定される自然言語テキストセグメントまたはテンプレートであってもよく、このタスク説明情報は、例えば、第１のクエリデータ＿＿と第１の再考結果＿＿に基づいて、第１のクエリデータに対する回答データを生成してくださいということであってもよい。第１のクエリデータと第１の再考結果の内容をこのテンプレートに充填することで、データ生成のニーズを明確に示すできる入力データを得ることができ、深層学習モデルがこれに基づいて第２の回答データを生成することができる。

【0045】

上記実施形態は、深層学習モデルの入力データの例に過ぎず、入力データは、他の方式に基づいて生成することもでき、例えば、第１のクエリデータと第１の再考結果に基づいて、事前定義された生成パターンのラベルを直接追加して第２の入力データを得、深層学習モデルがこのタグに基づいて第２の入力データに第１の再考結果が含まれていることを確定することを理解されたい。深層学習モデルに入力データにおける再考結果の存在を感知させ、この再考結果に基づいて、回答データを生成することができれば、本開示は入力データの確定方式を限定しない。

【0046】

いくつかの実施例によれば、ステップＳ２０２において、前記第１の回答データと前記第１のフィードバックに基づいて、前記第１の回答データに対する第１の再考結果を確定することは、前記第１の回答データと前記第１のフィードバックを再考生成ネットワークに入力することで、前記再考生成ネットワークによって出力される前記第１の再考結果を取得することを含み、ここで、前記再考生成ネットワークはサンプルコーパスを利用してトレーニングして得られ、前記サンプルコーパスは、サンプル回答データ、サンプルフィードバック、および前記サンプル回答データに対するサンプル再考結果を含む。これにより、トレーニングされた再考生成ネットワークを利用して再考結果を得、再考結果の生成の効率と利便性を向上させることができる。

【0047】

いくつかの例では、再考生成ネットワークは、エンコーダ（Ｅｎｃｏｄｅｒ）及びデコーダ（Ｄｅｃｏｄｅｒ）を有するＮ層Ｔｒａｎｓｆｏｒｍｅｒネットワーク構造、又は統合プリトレーニング言語モデル（Ｕｎｉｆｉｅｄｐｒｅ－ｔｒａｉｎｅｄＬａｎｇｕａｇｅＭｏｄｅｌ，ＵｎｉＬＭ）ネットワーク構造を採用することができる。前述した深層学習モデルのトレーニング方式に類似し、この再考生成ネットワークは、サンプルコーパスを利用してトレーニングして得られることができ、再考生成ネットワークをトレーニングするためのサンプルコーパスは、例えば、サンプル回答データ、サンプルフィードバック、および前記サンプル回答データに対するサンプル再考結果を含んでもよい。トレーニング過程では、サンプル回答データとサンプルフィードバックをこの深層学習モデルに入力することで、予測再考結果を得、予測再考結果とサンプル再考結果に基づいて損失値を計算し、さらに損失値に基づいて再考生成ネットワークのパラメータを調整することができる。

【0048】

いくつかの実施例によれば、ステップＳ２０２において、前記第１の回答データに対する前記ユーザのネガティブフィードバックを受信したことに応答して、前記第１の回答データと前記ネガティブフィードバックに基づいて、前記第１の回答データに対する第１の再考結果を確定することは、前記第１の回答データに対する前記ユーザの第１のフィードバックを受信したことに応答して、前記第１のフィードバックがネガティブフィードバックであると確定したことに応答して、前記第１の回答データと前記第１のフィードバックに基づいて、前記第１の回答データに対する第１の再考結果を確定することを含む。これにより、ユーザのフィードバックデータを取得した後で、さらにこのフィードバックデータがネガティブフィードバックかどうかを確定することができ、それによって、フィードバックデータはこのフィードバックがネガティブフィードバックかどうかを明示的に示さない場合には、さらに、確定ステップによってネガティブフィードバックを識別し、正確度を向上させることができる。

【0049】

いくつかの例では、分類器に基づくユーザフィードバック認識モデルを利用して、この第１のフィードバックがネガティブフィードバックであるかどうかを区別することができる。いくつかの例では、ユーザフィードバック認識モデルは、（ポジティブフィードバックとネガティブフィードバックを含む）実際の属性ラベルが付けられたサンプルフィードバックデータセットを利用してトレーニングして得られることができ、それによって、ユーザからの第１のフィードバックがネガティブフィードバックであるかどうかをより効率的かつ正確に確定することができる。

【0050】

いくつかの例では、他の方式によってユーザからのネガティブフィードバックが受信されたかどうかを確定することもできる。一例において、ユーザインターフェース上でのユーザの操作に基づいて、ネガティブフィードバックを受信すると確定することができ、例えば、ユーザが悪い評価ボタンをクリックしたか、閾値より低いスコアを与えたかと確定したことに応答して、ネガティブフィードバックを受信すると確定することができる。

【0051】

いくつかの実施例によれば、方法２００は、ユーザからの第２のクエリデータと前記第１のクエリデータとの類似度が予め設定される閾値よりも大きいと確定したことに応答して、前記第１のクエリデータ、前記第２の回答データ、および前記第２のクエリデータに基づいて、前記第２のクエリデータに対する第３の回答データを生成することをさらに含む。これにより、ユーザが第１のクエリデータに類似する第２のクエリデータを送信する場合、第１のクエリデータと第２の回答データを利用して現在の第３の回答データの生成を強化し、回答データの生成の品質を向上させることができる。

【0052】

いくつかの例では、クエリデータをいずれもテキストベクトルとして表し、ベクトル類似度を計算することにより、第１のクエリデータと第２のクエリデータの間の類似度を確定することができる。

【0053】

いくつかの実施例によれば、方法２００は、前記第１のクエリデータと前記第２の回答データをメモリバンクに記憶することをさらに含み、ここで、前記の、ユーザからの第２のクエリデータと前記第１のクエリデータとの類似度が予め設定される閾値よりも大きいと確定したことに応答して、前記第１のクエリデータ、前記第２の回答データ、および前記第２のクエリデータに基づいて、前記第２のクエリデータに対する第３の回答データを生成することは、ユーザからの第２のクエリデータと前記メモリバンクにおける第１のクエリデータとの類似度が前記予め設定される閾値よりも大きいと確定したことに応答して、前記メモリバンクから前記第２の回答データを取得することと、前記第１のクエリデータ、前記第２の回答データ、および前記第２のクエリデータに基づいて、前記第３の回答データを生成することとを含む。これにより、メモリバンクを利用してクエリデータ－回答データペアを保存することができ、メモリバンクを使用することにより、より多くの数、より長い期間内の履歴対話データを保存し、さらに履歴対話を参照して現在の回答データの生成を強化し、回答データの生成の品質を向上させることができる。

【0054】

いくつかの例では、前述した深層学習モデルを利用して回答データを生成する場合、第１のクエリデータ、第２の回答データ、および第２のクエリデータに基づいて、前記深層学習モデルに用いられる第３の入力データを確定し、さらに第３の入力データを深層学習モデルに入力することで、第３の回答データを取得することができる。一例において、この第３の回答データは、例えば、深層学習モデルがこれに基づいて第３の回答データを生成することができるように、第１のクエリデータと第２の回答データの存在を示す説明情報を含んでもよい。

【0055】

図３は、本開示の例示的な実施例によるデータ生成プロセスの概略図を示す。図３に示すように、一例において、インテリジェント対話システム３００を利用してユーザと対話することを実現するデータ生成プロセスであってもよい。

【0056】

図３を参照して、インテリジェント対話システム３００は、ユーザフィードバック認識モデル３０１、再考生成ネットワーク３０２、深層学習モデル３０３、およびメモリバンク３０４を含む。

【0057】

一例において、ユーザフィードバック認識モデル３０１、再考生成ネットワーク３０２、およびメモリバンク３０４を含むデータ伝送路はオプションである。ユーザが第１のクエリデータを送信し、メモリバンク３０４に第１のクエリデータに類似する履歴データが含まれていない場合、深層学習モデル３０３は、ユーザが入力した第１のクエリデータに基づいて、第１の回答データを直接生成することができる。第１の回答データに対するユーザの第１のフィードバックを受信した後、ユーザフィードバック認識モデル３０１を利用してこの第１のフィードバックがネガティブフィードバックであるかどうかを確定することができ、この第１のフィードバックがネガティブフィードバックであると確定した場合、再考生成ネットワーク３０２を利用して、第１の回答データと第１のフィードバックに基づいて、第１の再考結果を得ることができ、さらに、深層学習モデル３０３に第１のクエリデータと第１の再考結果に基づいて、新たな第２の回答データを確定させ、第１のクエリデータと第２の回答データをメモリバンク３０４に記憶することができる。

【0058】

第２のクエリデータを受信し、第２のクエリデータ３０４に類似する第１のクエリデータがすでにメモリバンク３０４に存在すると確定する場合、深層学習モデル３０３に第１のクエリデータ、第２の回答データ、および第２のクエリデータに基づいて、第２のクエリデータに対する第３の回答データを確定させることで、第１のクエリデータと第２の回答データを利用して、第３の回答データの現在の生成を強化し、回答データの生成の品質を向上させることができる。

【0059】

本開示の一態様によれば、データ生成装置をさらに提供する。図４は、本開示の例示的な実施例によるデータ生成装置４００の構成ブロック図を示す。図４に示すように、装置４００は、ユーザからの第１のクエリデータに基づいて、第１の回答データを生成するように構成される第１の生成ユニット４０１と、前記第１の回答データに対する前記ユーザのネガティブフィードバックを受信したことに応答して、前記第１の回答データと前記ネガティブフィードバックに基づいて、前記第１の回答データに対する第１の再考結果を確定するように構成される確定ユニット４０２であって、前記第１の再考結果は、前記第１の回答データに対する前記ユーザのフィードバックがネガティブフィードバックである診断理由を示すものと、前記第１のクエリデータと前記第１の再考結果に基づいて、前記第１のクエリデータに対する第２の回答データを生成する第２の生成ユニット４０３とを含む。

【0060】

いくつかの実施例によれば、第１の生成ユニット４０１は、前記第１のクエリデータに基づいて、入力データに基づいて回答データを生成するための深層学習モデルに用いられる第１の入力データを確定するように構成される第１の確定サブユニットと、前記第１の入力データを前記深層学習モデルに入力することで、前記第１の回答データを取得するように構成される第１の入力サブユニットとを含み、ここでは、第２の生成ユニット４０３は、前記第１のクエリデータと前記第１の再考結果に基づいて、前記深層学習モデルに用いられる第２の入力データを確定するように構成される第２の確定サブユニットと、前記第２の入力データを前記深層学習モデルに入力することで、前記第２の回答データを取得するように構成される第２の入力サブユニットとを含む。

【0061】

いくつかの実施例によれば、前記第２の入力サブユニットは、前記第１のクエリデータ、前記第１の再考結果、および前記第２の入力データが前記第１の再考結果を含むことを示すタスク説明情報に基づいて、前記第２の入力データを確定するように構成される。

【0062】

いくつかの実施例によれば、確定ユニット４０２は、前記第１の回答データと前記第１のフィードバックを再考生成ネットワークに入力することで、前記再考生成ネットワークによって出力される前記第１の再考結果を取得し、ここで、前記再考生成ネットワークはサンプルコーパスを利用してトレーニングして得られ、前記サンプルコーパスは、サンプル回答データ、サンプルフィードバック、および前記サンプル回答データに対するサンプル再考結果を含むように構成される。

【0063】

いくつかの実施例によれば、確定ユニット４０２は、前記第１の回答データに対する前記ユーザの第１のフィードバックを受信したことに応答して、前記第１のフィードバックがネガティブフィードバックであると確定したことに応答して、前記第１の回答データと前記第１のフィードバックに基づいて、前記第１の回答データに対する第１の再考結果を確定するように構成される。

【0064】

いくつかの実施例によれば、装置４００は、ユーザからの第２のクエリデータと前記第１のクエリデータとの類似度が予め設定される閾値よりも大きいと確定したことに応答して、前記第１のクエリデータ、前記第２の回答データ、および前記第２のクエリデータに基づいて、前記第２のクエリデータに対する第３の回答データを生成するように構成される第３の生成ユニットをさらに含む。

【0065】

いくつかの実施例によれば、装置４００は、前記第１のクエリデータと前記第２の回答データをメモリバンクに記憶するように構成される記憶ユニットをさら含み、ここで、前記第３の生成ユニットは、ユーザからの第２のクエリデータと前記メモリバンクにおける第１のクエリデータとの類似度が前記予め設定される閾値よりも大きいと確定したことに応答して、前記メモリバンクから前記第２の回答データを取得するように構成される取得サブユニットと、前記第１のクエリデータ、前記第２の回答データ、および前記第２のクエリデータに基づいて、前記第３の回答データを生成するように構成される生成サブユニットとを含む。

【0066】

いくつかの実施例によれば、前記第１の再考結果は、前記第１の回答データに対する最適化ポリシーをさらに含む。

【0067】

本開示の技術案において、関連するユーザ個人情報の収集、記憶、使用、加工、伝送、提供と開示などの処理は、すべて関連法律法規の規定に適合し、かつ公序良俗に反しない。

【0068】

本開示の別の態様によれば、電子機器をさらに提供し、前記電子機器は、少なくとも一つのプロセッサと、前記少なくとも一つのプロセッサに通信接続されたメモリとを含み、前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶され、前記命令が前記少なくとも１つのプロセッサに実行されて、前記少なくとも１つのプロセッサに、上述したデータ生成方法を実行させることができる。

【0069】

本開示の別の態様によれば、コンピュータ命令が記憶された非一時的コンピュータ可読記憶媒体をさらに提供し、前記コンピュータ命令は、前記コンピュータに以上に記載のデータ生成方法を実行させるために用いられる。

【0070】

本開示の別の態様によれば、コンピュータプログラムを含むコンピュータプログラム製品をさらに提供し、前記コンピュータプログラムは、プロセッサによって実行されると、上述したデータ生成方法を実現する。

【0071】

図５を参照して、本開示のサーバ又はクライアントとして機能する電子機器５００の構成ブロック図について説明し、それは、本開示の各態様に応用可能なハードウェア装置の一例である。電子機器は、様々な形態のデジタル電子コンピュータデバイス、例えば、ラップトップ型コンピュータ、デスクトップ型コンピュータ、ステージ、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、その他の適切なコンピュータを示す。電子機器は更に、様々な形態の移動装置、例えば、パーソナルデジタル処理、携帯電話、インテリジェントフォン、ウェアラブル機器とその他の類似する計算装置を示してよい。本明細書に示される部品、これらの接続関係及びこれらの機能は例示的なものに過ぎず、本明細書に説明した及び／又は請求した本開示の実現を制限しない。

【0072】

図５に示すように、機器５００は、計算ユニット５０１を含み、それはリードオンリーメモリ（ＲＯＭ）５０２に記憶されるコンピュータプログラム又は記憶ユニット５０８からランダムアクセスメモリ（ＲＡＭ）５０３にロードされるコンピュータプログラムによって、種々の適当な動作と処理を実行することができる。ＲＡＭ５０３において、機器５００を操作するために必要とされる様々なプログラムとデータを記憶してよい。計算ユニット５０１、ＲＯＭ５０２及びＲＡＭ５０３は、バス５０４を介して互いに接続されている。入力／出力（Ｉ／Ｏ）インターフェース５０５もバス５０４に接続されている。

【0073】

機器５００内の複数の部材は、Ｉ／Ｏインタフェース５０５に接続され、これは、入力ユニット５０６、出力ユニット５０７、記憶ユニット５０８、及び通信ユニット５０９を備える。入力ユニット５０６は、機器５００に情報を入力することが可能な任意のタイプの装置であってもよく、入力ユニット５０６は、入力された数字又は文字情報を受信し、電子機器のユーザ設定及び／又は機能制御に関するキー信号入力を生成することができ、マウス、キーボード、タッチスクリーン、トラックボード、トラックボール、操作レバー、マイク及び／又はリモコンを含んでもよいが、これらに限定されない。出力ユニット５０７は、情報を提示することが可能ないずれかのタイプの装置であってもよく、ディスプレイ、スピーカ、ビデオ／オーディオ出力端末、バイブレータ、及び／又はプリンタを含んでもよいが、これらに限定されない。記憶ユニット５０８は、磁気ディスク、光ディスクを含んでもよいが、これらに限定されない。通信ユニット５０９は、機器５００が例えば、インターネットであるコンピュータネットワーク及び／又は様々な電気通信ネットワークを介して他の装置と情報／データを交換することを可能にし、モデム、ネットワークカード、赤外線通信装置、無線通信送受信機、及び／又はチップセット、例えば、ブルートゥース（登録商標）装置、８０２．１１装置、ＷｉＦｉ装置、ＷｉＭａｘ装置、セルラー通信装置及び／又は類似物を含んでもよいが、これらに限定されない。

【0074】

計算ユニット５０１は、処理および計算能力を有する様々な汎用および／または専用処理コンポーネントであってよい。計算ユニット５０１のいくつかの例は、中央処理ユニット（ＣＰＵ）、グラフィックス処理ユニット（ＧＰＵ）、様々な専用人工知能（ＡＩ）計算チップ、機械学習モデルアルゴリズムを実行する様々な計算ユニット、デジタル信号プロセッサ（ＤＳＰ）、および任意の適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。計算ユニット５０１は前文で説明された各方法と処理、例えばデータ生成方法を実行する。例えば、いくつかの実施例では、データ生成方法は、機械可読媒体、例えば記憶ユニット５０８に有形的に含まれるコンピュータソフトウェアプログラムとして実現されてもよい。いくつかの実施例では、コンピュータプログラムの一部又は全部は、ＲＯＭ５０２及び／又は通信ユニット５０９を介して機器５００にロード及び／又はインストールされてもよい。コンピュータプログラムをＲＡＭ５０３にロードして計算ユニット５０１で実行する場合、上記のデータ生成方法の１つ以上のステップを実行することができる。代替的に、別の実施例において、計算ユニット５０１は他のいかなる適切な方式で（例えば、ファームウェアにより）データ生成方法を実行するように構成されてよい。

【0075】

本明細書で上述したシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、特定用途向け標準製品（ＡＳＳＰ）、システムオンチップ（ＳＯＣ）、複雑なプログラマブル論理デバイス（ＣＰＬＤ）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はこれらの組み合わせにおいて実装することができる。これらの様々な実施形態は、一つ以上のコンピュータプログラムに実施され、該一つ以上のコンピュータプログラムは少なくとも一つのプログラマブルプロセッサを含むプログラマブルシステムで実行し及び／又は解釈してもよく、該プログラマブルプロセッサは専用又は汎用プログラマブルプロセッサであってもよく、記憶システム、少なくとも一つの入力装置、少なくとも一つの出力装置からデータと命令を受信し、データと命令を該記憶システム、該少なくとも一つの入力装置、該少なくとも一つの出力装置に送信してよいこと、を含んでもよい。

【0076】

本開示の方法を実施するためのプログラムコードは、１つ又は複数のプログラミング言語の任意の組み合わせで書かれてよい。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ又は他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供されてよく、プログラムコードがプロセッサ又はコントローラにより実行されると、フローチャート及び／又はブロック図に規定される機能／操作は実施される。プログラムコードは完全に機械で実行してよく、部分的に機械で実行してよく、独立ソフトウェアパッケージとして部分的に機械で実行し且つ部分的に遠隔機械で実行してよく、又は完全に遠隔機械又はサーバで実行してよい。

【0077】

本開示のコンテキストにおいて、機械可読媒体は有形の媒体であってもよく、命令実行システム、装置又は機器に使用される又は命令実行システム、装置又は機器に結合されて使用されるプログラムを具備又は記憶してよい。機械可読媒体は機械可読信号媒体又は機械可読記憶媒体であってもよい。機械可読媒体は、電子、磁気、光学、電磁、赤外線、又は半導体システム、装置又はデバイス、又は上記内容のいかなる適切な組み合わせを含んでもよいが、これらに限定されない。機械可読記憶媒体のより具体的な例は、一つ以上のワイヤによる電気接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、リードオンリーメモリ（ＲＯＭ）、消去可能なプログラマブル読み出し専用メモリ（ＥＰＲＯＭ又はフラッシュメモリ）、光ファイバー、ポータブルコンパクトディスク読み出し専用メモリ（ＣＤ－ＲＯＭ）、光記憶機器、磁気記憶機器、又は上記内容のいかなる適切な組み合わせを含む。

【0078】

ユーザとのインタラクションを提供するために、コンピュータにはここで説明したシステムと技術を実施してよく、該コンピュータは、ユーザに情報を表示するための表示装置（例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）監視モニタ）、及びキーボードとポインティング装置（例えば、マウスやトラックボール）を備え、ユーザは該キーボードと該ポインティング装置を介してコンピュータに入力してよい。その他のタイプの装置は更に、ユーザとのインタラクションを提供するためのものであってもよく、例えば、ユーザに提供するフィードバックはいかなる形態の感覚フィードバック（例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック）であってもよく、いかなる形態（音入力、音声入力、又は触覚入力を含む）でユーザからの入力を受信してよい。

【0079】

ここで述べたシステムや技術は、バックステージ部材を含む計算システム（例えば、データサーバとして）や、ミドルウェア部材を含む計算システム（例えば、アプリケーションサーバ）や、フロントエンド部材を含む計算システム（例えば、グラフィカルユーザインターフェースやウェブブラウザを有するユーザコンピュータであり、ユーザが、そのグラフィカルユーザインターフェースやこのウェブブラウザを通じて、ここで説明したシステム及び技術の実施形態とのインタラクティブを実現できる）や、このようなバックグラウンド部品、ミドルウェア部品、又はフロントエンド部品の任意の組み合わせを含む計算システムで実施されてよい。システムの部材は、任意の形式や媒体のデジタルデータ通信（例えば、通信ネットワーク）により相互に接続されてもよい。通信ネットワークの一例は、ローカルネットワーク（ＬＡＮ）、広域ネットワーク（ＷＡＮ）、インターネットとブロックチェーンネットワークを含む。

【0080】

コンピュータシステムは、クライアント側とサーバを含んでもよい。クライアント側とサーバは、一般的に相互に遠く離れ、通常、通信ネットワークを介してインタラクションを行う。互にクライアント側－サーバという関係を有するコンピュータプログラムを対応するコンピュータで運転することによってクライアント側とサーバとの関係を生成する。サーバは、クラウドサーバであってもよく、分散型システムのサーバでも、又はブロックチェーンと組み合わされたサーバであってもよい。

【0081】

理解すべきこととして、前述した様々な形態のフローを用いて、ステップを改めて順位付け、増加又は削除してよい。例えば、本開示に記載された各ステップは、並列的に実行してもよいし、順次実行してもよいし、異なる順序で実行してもよく、本開示に開示された技術案が所望する結果を実現できれば、本文はこれに限定されないことである。

【0082】

本開示の実施例又は例について、図面を参照しながら説明してきたが、上述した方法、システム、及び機器は、単に例示的な実施例又は例に過ぎず、本発明の範囲は、これらの実施例又は例によって限定されるものではないと理解されたい。実施例又は例の様々な要素は省略されてもよく、又はそれらの均等要素によって代替されてもよい。なお、各ステップは、本開示で説明した順序とは異なる順序で実行されてもよい。更に、実施例又は例の様々な要素は、様々な方法で組み合わせられてもよい。重要なのは、技術の進化に伴い、ここで説明される多くの要素は、本開示の後に現れる同等の要素に置き換えることができるということである。

【図1】

【図2】

【図3】

【図4】

【図5】

【手続補正書】

【提出日】2024-09-18

【手続補正1】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

【請求項2】

【請求項3】

【請求項4】

前記の、前記第１の回答データと前記ネガティブフィードバックに基づいて、前記第１の回答データに対する第１の再考結果を確定することは、
前記第１の回答データと前記ネガティブフィードバックを再考生成ネットワークに入力することで、前記再考生成ネットワークによって出力される前記第１の再考結果を取得することを含み、ここで、前記再考生成ネットワークはサンプルコーパスを利用してトレーニングして得られ、前記サンプルコーパスは、サンプル回答データ、サンプルフィードバック、および前記サンプル回答データに対するサンプル再考結果を含む、請求項１～３のいずれか一項に記載の方法。

【請求項5】

【請求項6】

【請求項7】

【請求項8】

前記第１の再考結果は、前記第１の回答データに対する最適化ポリシーをさらに含む、請求項１～３のいずれか一項に記載の方法。

【請求項9】

【請求項10】

【請求項11】

【請求項12】

前記確定ユニットは、
前記第１の回答データと前記ネガティブフィードバックを再考生成ネットワークに入力することで、前記再考生成ネットワークによって出力される前記第１の再考結果を取得し、ここで、前記再考生成ネットワークはサンプルコーパスを利用してトレーニングして得られ、前記サンプルコーパスは、サンプル回答データ、サンプルフィードバック、および前記サンプル回答データに対するサンプル再考結果を含むように構成される、請求項９～１１のいずれか一項に記載の装置。

【請求項13】

【請求項14】

【請求項15】

【請求項16】

前記第１の再考結果は、前記第１の回答データに対する最適化ポリシーをさらに含む、請求項９～１１のいずれか一項に記載の装置。

【請求項17】

【請求項18】

【請求項19】

コンピュータプログラムであって、前記コンピュータプログラムは、プロセッサによって実行されると、請求項１に記載の方法を実現する、コンピュータプログラム。

【外国語明細書】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版