IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特表2024-516709誘発を含む交渉方法、および実施するためのシステム
<>
  • 特表-誘発を含む交渉方法、および実施するためのシステム 図1
  • 特表-誘発を含む交渉方法、および実施するためのシステム 図2
  • 特表-誘発を含む交渉方法、および実施するためのシステム 図3
  • 特表-誘発を含む交渉方法、および実施するためのシステム 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-04-16
(54)【発明の名称】誘発を含む交渉方法、および実施するためのシステム
(51)【国際特許分類】
   G06Q 50/10 20120101AFI20240409BHJP
【FI】
G06Q50/10
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023568182
(86)(22)【出願日】2022-03-07
(85)【翻訳文提出日】2023-11-06
(86)【国際出願番号】 JP2022009753
(87)【国際公開番号】W WO2022239421
(87)【国際公開日】2022-11-17
(31)【優先権主張番号】63/187,951
(32)【優先日】2021-05-13
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】17/388,004
(32)【優先日】2021-07-28
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100181135
【弁理士】
【氏名又は名称】橋本 隆史
(72)【発明者】
【氏名】モハメド ヤセル ファルコオスマン
(72)【発明者】
【氏名】蜷川 琴音
(57)【要約】
システムは、指示を記憶するように構成された非一時的コンピュータ可読媒体を含む。システムは、非一時的コンピュータ可読媒体に接続されたプロセッサをさらに含む。プロセッサは、不確実性を有するユーザ効用関数(Ufun)についての情報を受信するように構成される。プロセッサは、ユーザUfunに基づく交渉における提案を生成するように構成される。プロセッサは、ユーザに追加情報を要求する必要があるかどうかを決定するように構成される。プロセッサは、追加情報を要求する必要があるという決定に応答して、追加情報を取得するためのクエリを識別するように構成される。プロセッサは、識別されたクエリについての情報の価値(VOI)値を決定するように構成される。プロセッサは、VOI値が中断閾値よりも大きいことに応答して、識別されたクエリをユーザに送信するように構成される。
【特許請求の範囲】
【請求項1】
指示を記憶するように構成された非一時的コンピュータ可読媒体と、
前記非一時的コンピュータ可読媒体に接続されたプロセッサと、を含み、前記プロセッサは、
不確実性を有するユーザ効用関数(Ufun)についての情報を受信し、
前記ユーザUfunに基づく交渉における提案を生成し、
ユーザに追加情報を要求する必要があるかどうかを決定し、
追加情報を要求する必要があるという決定に応答して、前記追加情報を取得するための前記ユーザへのクエリを識別し、
前記識別されたクエリについての情報の価値(VOI)値を決定し、
前記識別されたクエリについての前記VOI値を中断閾値と比較し、
前記VOI値が前記中断閾値よりも大きいことに応答して、前記識別されたクエリを前記ユーザに送信する
ための前記指示を実行するように構成される、システム。
【請求項2】
前記プロセッサは、前記識別されたクエリの前記VOI値が前記中断閾値以下であるという決定に応答して、前記生成された提案を相手に送信するための前記指示を実行するようにさらに構成される、請求項1に記載のシステム。
【請求項3】
前記プロセッサは、前記識別されたクエリに応答した前記ユーザからの入力に基づいて前記ユーザUfunを更新するための前記指示を実行するようにさらに構成される、請求項1に記載のシステム。
【請求項4】
前記プロセッサは、
相手から提案を受信し、
前記相手からの前記受信された提案に基づいて相手Ufunを計算する、
ための前記指示を実行するようにさらに構成され、前記生成された提案は、前記相手Ufunに基づいて生成される、請求項1に記載のシステム。
【請求項5】
前記プロセッサは、前記交渉中に前記中断閾値を変更するための前記指示を実行するようにさらに構成される、請求項1に記載のシステム。
【請求項6】
前記プロセッサは、前記ユーザからの閾値入力の受信に応答して前記中断閾値を変更するための前記指示を実行するようにさらに構成される、請求項5に記載のシステム。
【請求項7】
前記プロセッサは、前記交渉における反復回数に基づいて前記中断閾値を変更するための前記指示を実行するようにさらに構成される、請求項5に記載のシステム。
【請求項8】
前記非一時的コンピュータ可読媒体は、複数のクエリを記憶するように構成され、前記プロセッサは、前記複数のクエリから前記クエリを識別するための前記指示を実行するようにさらに構成される、請求項1に記載のシステム。
【請求項9】
前記プロセッサは、前記ユーザに尋ねることが許容されているクエリの数を決定するための前記指示を実行するようにさらに構成される、請求項1に記載のシステム。
【請求項10】
不確実性を有するユーザ効用関数(Ufun)についての情報を受信することと、
前記ユーザUfunに基づく交渉における提案を生成することと、
ユーザに追加情報を要求する必要があるかどうかを決定することと、
追加情報を要求する必要があるという決定に応答して、前記追加情報を取得するための前記ユーザへのクエリを識別することと、
前記識別されたクエリについての情報の価値(VOI)値を決定することと、
プロセスを使用して、前記識別されたクエリについての前記VOI値を中断閾値と比較することと、
前記VOI値が前記中断閾値よりも大きいことに応答して、前記識別されたクエリを前記ユーザに送信することと
を含む、方法。
【請求項11】
前記識別されたクエリの前記VOI値が前記中断閾値以下であるという決定に応答して、前記生成された提案を相手に送信することをさらに含む、請求項10に記載の方法。
【請求項12】
前記識別されたクエリに応答した前記ユーザからの入力に基づいて前記ユーザUfunを更新することをさらに含む、請求項10に記載の方法。
【請求項13】
相手からの提案を受信することと、
前記相手からの前記受信された提案に基づいて相手Ufunを計算すること、をさらに含み、前記生成された提案は、前記相手Ufunに基づいて生成される、請求項10に記載の方法。
【請求項14】
前記交渉中に前記中断閾値を変更することをさらに含む、請求項10に記載の方法。
【請求項15】
前記中断閾値を変更することは、前記ユーザからの閾値入力の受信に応答して前記中断閾値を変更することを含む、請求項14に記載の方法。
【請求項16】
前記中断閾値を変更することは、前記交渉における反復回数に基づいて前記中断閾値を変更することを含む、請求項14に記載の方法。
【請求項17】
複数のクエリを記憶することをさらに含み、前記クエリを識別することは、前記複数のクエリから前記クエリを識別することを含む、請求項10に記載の方法。
【請求項18】
前記ユーザに尋ねることが許容されているクエリの数を決定することをさらに含む、請求項10に記載の方法。
【請求項19】
指示を記憶するように構成された非一時的コンピュータ可読媒体と、
前記非一時的コンピュータ可読媒体に接続されたプロセッサと、を含み、前記プロセッサは、
不確実性を有するユーザ効用関数(Ufun)についての情報を受信し、
前記ユーザUfunに基づく交渉における提案を生成し、
ユーザに追加情報を要求する必要があるかどうかを決定し、
中断閾値に基づいて前記ユーザに尋ねることが許容されたクエリの数を決定し、
追加情報を要求する必要があるという決定に応答して、前記追加情報を取得するための前記ユーザへのクエリの数を識別し、
前記識別されたクエリの各々についての情報の価値(VOI)値を決定し、
前記識別されたクエリの各々についての前記VOIおよび前記中断閾値に基づいて、前記ユーザに送信されるクエリの集合を決定し、
前記クエリの集合の各々を前記ユーザに送信する、ための前記指示を実行するように構成され、前記クエリの集合におけるクエリの数は、許容された前記クエリの数以下である、システム。
【請求項20】
前記プロセッサは、前記交渉中に前記中断閾値を変更するための前記指示を実行するように構成される、請求項19に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、誘発(elicitation)を含む交渉方法、およびその方法を実施するためのシステムに関する。
【背景技術】
【0002】
インターネットを使用した商取引の増加に伴い、自律交渉も増加している。自律交渉は、当事者間の合意に達することを試みるために、人間の交渉人の代わりに人工知能(AI)を利用する。AIは、相手からの提案を評価し、次いで提案に対する応答を決定するために使用される。場合によっては、応答は、逆提案である。場合によっては、応答は、提案の受諾である。場合によっては、応答は、交渉を終了することである。
【0003】
いくつかのアプローチでは、AI交渉器は、交渉の開始前にユーザの嗜好および優先順位で完全に訓練される。いくつかのアプローチでは、AI交渉器は、交渉の開始時にユーザの嗜好および優先順位に関するいくつかの小さな不確実性を含む。いくつかのアプローチでは、AI交渉器は、ユーザの嗜好および優先順位の不確実性を低減するために、クエリをユーザに提出することができる。しかし、クエリは、選択肢の間のユーザの嗜好を尋ねることなく、特定のパラメータがユーザにとってどれだけ価値があるかを問い合わせるだけである。
【発明の概要】
【0004】
本開示の第1の例示的な態様によれば、指示を記憶するように構成された非一時的コンピュータ可読媒体と、前記非一時的コンピュータ可読媒体に接続されたプロセッサと、を含み、前記プロセッサは、不確実性を有するユーザ効用関数(Ufun)についての情報を受信し、前記ユーザUfunに基づく交渉における提案を生成し、ユーザに追加情報を要求する必要があるかどうかを決定し、追加情報を要求する必要があるという決定に応答して、前記追加情報を取得するための前記ユーザへのクエリを識別し、前記識別されたクエリについての情報の価値(VOI)値を決定し、前記識別されたクエリについての前記VOI値を中断閾値と比較し、前記VOI値が前記中断閾値よりも大きいことに応答して、前記識別されたクエリを前記ユーザに送信するための前記指示を実行するように構成される、システムが提供される。
【0005】
本開示の第2の例示的な態様によれば、不確実性を有するユーザ効用関数(Ufun)についての情報を受信することと、前記ユーザUfunに基づく交渉における提案を生成することと、ユーザに追加情報を要求する必要があるかどうかを決定することと、追加情報を要求する必要があるという決定に応答して、前記追加情報を取得するための前記ユーザへのクエリを識別することと、前記識別されたクエリについての情報の価値(VOI)値を決定することと、プロセスを使用して、前記識別されたクエリについての前記VOI値を中断閾値と比較することと、前記VOI値が前記中断閾値よりも大きいことに応答して、前記識別されたクエリを前記ユーザに送信することとを含む、方法が提供される。
【0006】
本開示の第3の例示的な態様によれば、指示を記憶するように構成された非一時的コンピュータ可読媒体と、前記非一時的コンピュータ可読媒体に接続されたプロセッサと、を含み、前記プロセッサは、不確実性を有するユーザ効用関数(Ufun)についての情報を受信し、前記ユーザUfunに基づく交渉における提案を生成し、ユーザに追加情報を要求する必要があるかどうかを決定し、中断閾値に基づいて前記ユーザに尋ねることが許容されたクエリの数を決定し、追加情報を要求する必要があるという決定に応答して、前記追加情報を取得するための前記ユーザへのクエリの数を識別し、前記識別されたクエリの各々についての情報の価値(VOI)値を決定し、前記識別されたクエリの各々についての前記VOIおよび前記中断閾値に基づいて、前記ユーザに送信されるクエリの集合を決定し、前記クエリの集合の各々を前記ユーザに送信する、ための前記指示を実行するように構成され、前記クエリの集合におけるクエリの数は、許容された前記クエリの数以下である、システム提供される。
【図面の簡単な説明】
【0007】
本開示の態様は、添付の図と併せて読むと、以下の詳細な説明から最もよく理解される。業界の標準的な慣行に従って、様々な特徴は縮尺通りに描かれていないことに留意されたい。実際、様々な特徴の寸法は、説明を明確にするために任意に拡大または縮小されることがある。
図1】いくつかの実施形態による、交渉の概略図である。
図2】いくつかの実施形態による、ユーザから情報を引き出すかどうかを決定するためのシステムの概略図である。
図3】いくつかの実施形態による、交渉方法のフローチャートである。
図4】いくつかの実施形態による、交渉を実施するためのシステムのブロック図である。
【発明を実施するための形態】
【0008】
以下の開示は、提供される主題の異なる特徴を実施するための多くの異なる実施形態または例を提供する。以下、本開示を簡略化するために、構成要素、値、動作、材料、配置などの具体的な例を説明する。もちろん、これらは単なる例であり、限定することを意図するものではない。他の構成要素、値、動作、材料、配置なども考えられる。例えば、以下の説明における第2の特徴の上側または上の第1の特徴の形成は、第1および第2の特徴が直接接触して形成される実施形態を含むことができ、第1および第2の特徴が直接接触しないように、追加の特徴が第1および第2の特徴の間に形成され得る実施形態も含むことができる。加えて、本開示は、様々な例において参照番号および/または文字を繰り返すことができる。この繰り返しは、単純化および明確化のためのものであり、それ自体は、説明した様々な実施形態および/または構成の間の関係を規定するものではない。
【0009】
効用関数(Ufun)は、ユーザの嗜好および優先順位を記述し、時間のかかるプロセスである。交渉におけるパラメータの数が増加するにつれて、提案におけるバリエーションの数は指数関数的に増加する。人工知能(AI)交渉器が完全またはほぼ完全なUfunを有するためには、ユーザは大量のデータを入力するか、または多数の質問に回答することを要求される。本明細書では、完全なUfunは、不確実性がほとんどまたは全くない、すなわち、すべてのユーザの嗜好および優先順位が知られているUfunである。このプロセスは、ユーザの時間を大量に消費し、AI交渉器に対するユーザのフラストレーションを増加させる。
【0010】
あるいは、場合によっては、AI交渉器は、ユーザから受信されたいくつかの初期入力に基づいて完全またはほぼ完全なUfunを生成するために、多数のシミュレートされた交渉を実行する。多数のシミュレートされた交渉を完了することは、かなりの量の計算時間およびリソースを消費する。Ufunを完了するためにフィードバックをAI交渉器に提供するようにいくつかの異なるバリエーションおよびランキング結果を考慮すると、時間に敏感な交渉または以前に考慮されていなかったパラメータを導入する交渉におけるAI交渉器の有用性が低下する。
【0011】
上述のアプローチでは、完全またはほぼ完全なUfunを提供することができないと、交渉結果が悪くなる。発明者らに知られている情報によれば、すべての選択肢を考慮しなかった結果、交渉中に金銭の推定15%の損失が生じる。
【0012】
交渉結果の改善を支援し、同時にUfunの時間のかかる完了を低減するために、本開示は、交渉中にユーザからの初期入力をユーザからの入力を引き出す能力とほとんど組み合わせないAI交渉の方法を含む。少数の初期入力を使用することによって、ユーザは多数のクエリに回答するように要求されず、多数のシミュレートされた交渉が回避される。ユーザへのクエリが低減され、シミュレートされた交渉が減少または回避されると、使用可能なAI交渉器を作成するために使用される時間が最小化される。本開示のいくつかの実施形態では、相手と交渉する前にシミュレートされた交渉は実施されない。低減されたクエリおよびシミュレートされた交渉はまた、AI交渉器を開発するために消費されるリソースの量を低減する。
【0013】
本開示の方法およびシステムを使用することはまた、AI交渉器が以前に考慮されていなかったパラメータを含む交渉を処理するのに役立つ。その結果、AI交渉器の効用が増加している。
【0014】
図1は、いくつかの実施形態による、自律交渉方法を使用する交渉100の概略図である。交渉100は、第1の方針112を含む第1の交渉器110を含む。交渉110は、第2の方針122を含む第2の交渉器120を含む。プロトコル130は、第1の交渉器110と第2の交渉器120との間の交渉のスタイルを決定するために使用される。ドメイン140は、交渉100において解決すべき問題を含む。交渉100は、バイラテラル交渉である。しかし、本開示は、バイラテラルシナリオのみに限定されない。
【0015】
第1の交渉器110は、解決すべき問題についての優先順位を決定するためのAIアルゴリズムを含む。これらの優先順位は、解決すべき問題の各々に関連付けられた効用値に取り込まれる。その第1の交渉器110は、交渉100からの可能な結果を優先するためにこれらの効用値を使用する。第1の交渉器110は、プロトコル130を使用して第2の交渉器120と通信することができる。いくつかの実施形態では、第1の交渉器110は、無線で通信することができる。いくつかの実施形態では、第1の交渉器110は、有線接続を使用して通信することができる。いくつかの実施形態では、第1の交渉器110は、インターネットを介して通信することができる。第1の交渉器110は、提案、逆提案、受諾、または拒否を第2の交渉器120に送信することができる。第1の交渉器110は自律的であり、すなわち、ユーザ入力または制御なしで動作する。
【0016】
第1の方針112は、第1の交渉器110によって使用された効用値およびアルゴリズムに基づいて第1の交渉器110によって決定された行動である。いくつかの実施形態では、第1の方針112は、提案、逆提案、受諾、または拒否を含む。いくつかの実施形態では、第1の方針112は、第2の交渉器120から受信された新しい情報に基づいて交渉100中に変更する。
【0017】
第2の交渉器120は、解決すべき問題について、効用値を使用して取り込まれた優先順位を決定するためのAIアルゴリズムを含む。第2の交渉器120は、プロトコル130を使用して第1の交渉器110と通信することができる。いくつかの実施形態では、第2の交渉器120は、無線で通信することができる。いくつかの実施形態では、第2の交渉器120は、有線接続を使用して通信することができる。いくつかの実施形態では、第2の交渉器120は、インターネットを介して通信することができる。第2の交渉器120は、提案、逆提案、受諾、または拒否を第1の交渉器110に送信することができる。いくつかの実施形態では、第1の交渉器110についてのハードウェアは、第2の交渉器120についてのハードウェアと同じである。いくつかの実施形態では、第1の交渉器110についてのハードウェアは、第2の交渉器120についてのハードウェアとは異なる。いくつかの実施形態では、第1の交渉器110に実装されたアルゴリズムは、第2の交渉器120に実装されたアルゴリズムと同じである。いくつかの実施形態では、第1の交渉器110に実装されたアルゴリズムは、第2の交渉器120に実装されたアルゴリズムとは異なる。いくつかの実施形態では、第2の交渉器120は、自律的である。いくつかの実施形態では、第2の交渉器120は、ユーザ入力に基づいて制御される。
【0018】
第2の方針122は、第2の交渉器120によって使用された効用値およびアルゴリズムに基づいて第2の交渉器120によって決定された行動である。いくつかの実施形態では、第2の方針122は、提案、逆提案、受諾、または拒否を含む。いくつかの実施形態では、第2の方針122は、第1の交渉器110から受信された新しい情報に基づいて交渉100中に変更する。
【0019】
プロトコル130は、交渉100のための規則である。例えば、交互提案プロトコル(alternating offers protocol)では、交渉器、例えば、第1の交渉器110および第2の交渉器120は、交互に提案を交換する。いくつかの実施形態では、プロトコル130は、交互提案プロトコルである。いくつかの実施形態では、プロトコル130は、時間ベースの提案などの異なるプロトコル、または他の適切なプロトコルである。プロトコル130は、交渉100を開始する前に確立され、それにより第1の交渉器110および第2の交渉器120は、提案または返信がいつ送信されるべきか、および送信されるべきかどうかを知る。いくつかの実施形態では、プロトコル130は、ステップの最大数、例えば、提案の最大数を含む。いくつかの実施形態では、プロトコル130は、交渉100のための制限時間を含む。
【0020】
ドメイン140は、解決すべき問題を含む。例えば、解決すべき問題は、いくつかの実施形態では、価格、数量、ブランド名などを含む。いくつかの実施形態では、ドメイン140は、単一の問題を含む。いくつかの実施形態では、ドメイン140は、複数の問題を含む。第1の交渉器110および第2の交渉器120の各々は、ドメイン140を知り、効用値を解決すべき問題の組み合わせに帰属させる。例えば、ドメイン140が価格およびブランド名を含み、価格およびブランド名の各々に対して2つの選択肢がある場合、第1の交渉器110は、4つの異なる効用値、すなわち、可能な組み合わせごとに1つの効用値を有する。いくつかの実施形態では、第1の交渉器110および第2の交渉器120は、すべての可能な組み合わせよりも少ない数の効用値を有する。いくつかの実施形態では、第1の交渉器110によって割り当てられた効用値は、第1および第2の交渉器が異なる優先順位を有するため、第2の交渉器120によって割り当てられた効用値とは異なる。
【0021】
図2は、いくつかの実施形態による、ユーザから情報を引き出すかどうかを決定するためのシステム200の概略図である。システム200は、AI交渉器によって、ユーザ210から追加情報を引き出すかどうかを決定するために使用可能である。システム200はまた、追加情報の値を最大化し、ユーザ210の中断を最小化するために、どの追加情報をユーザ210から引き出すかを決定する。ユーザ210、交渉プロトコル211、および相手212は、システム200の一部ではない。
【0022】
ユーザ210は、システム200が交渉に使用されるエンティティである。いくつかの実施形態では、ユーザ210は、人間である。いくつかの実施形態では、ユーザ210は、自動化されたデバイスである。いくつかの実施形態では、ユーザ210は、交渉100(図1)における第1の交渉器110と同様である。
【0023】
交渉プロトコル211は、ユーザ210および相手212がどのように互いに交渉するかを決定する。本開示の大部分は、交互提案交渉プロトコル211を企図して書かれている。しかし、当業者は、それらシステム200が追加の交渉プロトコルに適用可能であることを認識するであろう。いくつかの実施形態では、交渉プロトコル211は、交渉100(図1)におけるプロトコル130と同様である。
【0024】
相手212は、交渉におけるユーザ210の相手側である。いくつかの実施形態では、相手212は、人間である。いくつかの実施形態では、相手212は、自動化されたデバイスである。いくつかの実施形態では、相手212は、交渉100(図1)における第2の交渉器120と同様である。
【0025】
システム200は、相手212の方針を決定するように構成された相手部分順序学習器(opponent partial order learner)201を含む。相手部分順序学習器201は、相手212から提案を受信するように構成される。相手212からの現在の提案および相手212からの以前の提案に基づいて、相手部分順序学習器201は、相手212の方針を決定するように構成される。相手部分順序学習器201は、どのパラメータの組み合わせが相手212にとって最も高い値を有すると予想されるかを決定するために、相手212についての優先順位および嗜好を決定するように構成される。相手部分順序学習器201はまた、方針生成器205から入力を受信するように構成される。方針生成器205は、ユーザ210および相手212の各々に対するパラメータの異なる組み合わせの値を決定するのを支援するために、情報を相手部分順序学習器201に提供する。この情報に基づいて、システム200は、交渉中にどのパラメータの組み合わせを提案するかを決定することができる。
【0026】
システムは、効用回帰器(utility regressor)202をさらに含む。効用回帰器202は、相手部分順序学習器201および部分結果順序付け(partial outcome ordering)220から情報を受信するように構成される。部分結果順序付け220は、ユーザ210の嗜好および優先順位に関する情報を含む。いくつかの実施形態では、ユーザ210の嗜好および優先順位に関する情報は、ユーザ210からの入力として受信される。いくつかの実施形態では、ユーザ210の嗜好および優先順位に関する情報は、システム200によって実施された以前の交渉の結果に基づく。いくつかの実施形態では、部分結果順序付け220は、システム200の一部として含まれる。いくつかの実施形態では、部分結果順序付け220は、外部デバイスの一部またはユーザ210の一部である。
【0027】
部分結果順序付け220は、現在の交渉に対するユーザ210の最良事例結果およびユーザ210の最悪事例結果を含む。ユーザ210にとっての最良事例結果は、可能な限り最高の値をユーザ210に提供するパラメータの組み合わせである。ユーザ210にとっての最悪事例結果は、可能な限り最低の値をユーザ210に提供するパラメータの組み合わせである。いくつかの実施形態では、部分結果順序付け220は、最良事例結果と最悪事例結果との間にある中間事例結果情報をさらに含む。いくつかの実施形態では、中間事例結果情報は、交渉のための可能なパラメータ組み合わせの50%未満に関連する情報を含む。いくつかの実施形態では、中間事例結果情報は、交渉のための可能なパラメータ組み合わせの20%未満に関連する情報を含む。いくつかの実施形態では、中間事例結果情報は、交渉のための可能なパラメータ組み合わせの10%未満に関連する情報を含む。中間事例情報の量が増加するにつれて、システム200は、ユーザ210に対する各提案または逆提案の値をより正確に決定することができる。中間事例情報の量が増加するにつれて、中間事例情報を生成する際に消費される時間量も増加する。すなわち、ユーザ210の要求したクエリの量またはシステム200によって実施されるシミュレートされた交渉の数が増加する。
【0028】
他のアプローチとは対照的に、システム200は、パラメータの可能な組み合わせをほとんど含まない部分結果順序付け220を使用して交渉を実施することができる。これにより、ユーザ210を中断することなく、かつ多数のシミュレートされた交渉を実行することなく、システム200を迅速に実装することができる。加えて、システム200は、最小限の追加情報でシステム200によって以前に考慮されていない新しいパラメータを含む交渉で使用するのに十分に柔軟である。その結果、システム200の有用性は、交渉を行うために大量の初期情報を利用する他のアプローチよりも良好である。
【0029】
効用回帰器202は、ユーザ210と相手212の両方について異なるパラメータの値の任意の分布を仮定することを回避するように構成される。代わりに、効用回帰器202は、ユーザ210についてのUfunおよび相手212についてのUfunを決定するために、相手部分順序学習器201および部分結果順序付け220の結果を利用する。ユーザ210についてのUfunは、自己効用分布(self utility distribution)203に記憶される。相手212についてのUfunは、相手効用分布(opponent utility distribution)204に記憶される。効用回帰器202は、交渉の各反復中にユーザ210についてのUfunおよび相手212についてのUfunを更新するように構成される。すなわち、ユーザ210および相手212の各々についてのUfunは、交渉の各回の間に提案および逆提案に基づいて更新される。
【0030】
自己効用分布203は、ユーザ210の嗜好および優先順位に関連する情報を記憶するように構成される。いくつかの実施形態では、部分結果順序220は、最初に自己効用分布203に記憶される。
【0031】
相手効用分布204は、相手212の嗜好および優先順位に関連する情報を記憶するように構成される。いくつかの実施形態では、相手効用分布204は、同じ相手212との以前の交渉から相手212に関する情報を検索するように構成される。いくつかの実施形態では、相手効用分布204および自己効用分布203は、同じ記憶デバイスの一部である。いくつかの実施形態では、相手効用分布204および自己効用分布203は、別々の記憶デバイス内にある。
【0032】
システム200は、相手方針学習器205をさらに含む。相手方針学習器205は、交渉において使用されている相手212の方針を決定するように構成される。相手方針学習器205は、相手効用分布204からの相手212についての決定された嗜好および優先順位に関連する情報、ならびに以下で説明する増分効用回帰器(incremental utility regressor)209からの相手提案に関連する情報を受信するように構成される。相手についての嗜好および優先順位ならびに相手提案に基づいて、相手方針学習器205は、交渉の将来の反復中に相手212がどのように実施すると予想されるかを推定するように構成される。いくつかの実施形態では、相手方針学習器205は、交渉100(図1)の第2の方針122を決定しようと試みるように構成される。
【0033】
システム200は、方針生成器206をさらに含む。方針生成器は、自己効用分布203からユーザ210の嗜好および優先順位に関する情報を受信し、相手方針学習器205から相手212の方針に関連する情報を受信するように構成される。方針生成器206は、相手212に行われる提案を決定するために、自己効用分布203を相手方針学習器205からの相手212の推定方針と比較するように構成される。いくつかの実施形態では、方針生成器206は、相手方針学習器205に基づいて、相手212によって受け入れられる閾値を有する自己効用分布203に基づいて、ユーザ210に対して最も高い値を有する提案を決定するように構成される。いくつかの実施形態では、閾値は、ユーザ210によって予め決定される。いくつかの実施形態では、閾値は、交渉全体を通して一定である。いくつかの実施形態では、閾値は、交渉の過程で調整される。例えば、いくつかの実施形態では、閾値は、交渉における所定の反復回数の後に増加される。いくつかの実施形態では、方針生成器206は、相手212による受諾の可能性にかかわらず、提案が少なくともユーザ210にとって最小値を有することを要求するように構成される。いくつかの実施形態では、最小値は、ユーザ210によって予め決定される。いくつかの実施形態では、最小値は、交渉中にユーザ210によって調整可能である。
【0034】
上記の条件を満たす提案の識別に応答して、方針生成器206は、交渉プロトコル211に基づいて相手212に送信および提案する。上記の条件を満たす提案を識別できなかったことに応答して、方針生成器206は、信号を誘発エンジン(elicitation engine)208に送信し、上記の条件を満たす提案を識別するためのより多くの情報を収集しようと試みる。
【0035】
誘発エンジン208は、ユーザ210の嗜好および優先順位に関する追加情報を求める要求を方針生成器206から受信するように構成される。誘発エンジン208は、クエリデータセット207からユーザ210に対する可能なクエリのリストを検索するように構成される。誘発エンジン208は、クエリデータセット207からのクエリがある場合、方針生成器207からの追加情報に対する要求を満たすクエリを決定するように構成される。
【0036】
複数のクエリが追加情報に対する要求を満たすという決定に応答して、誘発エンジン208は、少なくとも1つのクエリのうちのどれが最も高い情報の価値(VOI:value of information)を有するかを決定するように構成される。VOIは、ユーザ210にとってのUfunにおける不確実性を除去する際にクエリに対する回答がどの程度重要であるかの尺度である。VOIが高いほど、ユーザ210にとってのUfunにおける不確実性が大きく低減される。誘発エンジン208が最も高いVOIを有するクエリを識別すると、誘発エンジンは、識別されたクエリのVOIを中断閾値(interruption threshold value)と比較する。単一のクエリが追加情報に対する要求を満たすという決定に応答して、誘発エンジン208は、単一のクエリのVOIを中断閾値と比較する。
【0037】
中断閾値は、交渉中にユーザ210が中断をどの程度許容できるかを測定するために使用されるVOI値である。より低い中断閾値は、ユーザ210が中断をより許容できることを示す。より高い中断閾値は、ユーザ210が中断をあまり許容できないことを示す。いくつかの実施形態では、中断閾値は、ユーザ210によって予め決定される。いくつかの実施形態では、中断閾値は、交渉全体を通して一定のままである。いくつかの実施形態では、中断閾値は、交渉中に変更する。例えば、いくつかの実施形態では、中断閾値は、ユーザ210が現在より多くのまたはより少ない中断を許容できることを示す、交渉中にユーザ210から受信された命令に基づいて、交渉中に変更する。別の例では、いくつかの実施形態では、交渉における反復回数が増加するにつれて、中断閾値が自動的に増加する。ユーザ210がシステムであるいくつかの実施形態では、中断閾値は、クエリが識別された時点でのユーザ210内の利用可能な処理能力に基づいて設定される。
【0038】
クエリが追加情報に対する要求を満たし、VOIが中断閾値よりも大きいという決定に応答して、誘発エンジン208は、クエリをユーザ210に送信する。いくつかの実施形態では、中断閾値は、ユーザ210がクエリを許容できることを示す単一の値を含む。いくつかの実施形態では、中断閾値は、ユーザ210が許容するクエリの数を示す複数の値を含む。例えば、中断閾値の第1の値において、ユーザ210は単一のクエリを許容し、中断閾値の第1の値よりも高い第2の値において、ユーザは2つのクエリを許容する。中断閾値に対して複数の値を提供することによって、システム200は、高VOIを有する複数のクエリを使用するユーザ210にとってのUfunにおける不確実性を減少させることができ、低VOIクエリに対するユーザ210の中断も低減することができる。当業者は、上記の説明は2つの異なる中断閾値を提供するが、3つ以上の中断閾値が本開示の範囲内であることを認識するであろう。
【0039】
クエリが追加情報に対する要求を満たしておらず、中断閾値よりも大きいVOIを有するという決定に応答して、誘発エンジン208は、現在利用可能な追加情報がないことを示す信号を方針生成器206に送信するように構成される。誘発エンジン208からのそのような信号に応答して、方針生成器206は、現在利用可能な情報に基づいて交渉プロトコルを通して提案、受諾、または拒否を相手212に発行するように構成される。
【0040】
クエリデータセット207は、ユーザ210に対するクエリを含む。あるパラメータの値を要求するなどのクエリの代わりに、クエリデータセット207におけるクエリは、パラメータの2つの組み合わせのうちのどれがユーザ210によって好まれるかを問い合わせる。例えば、いくつかの実施形態では、クエリデータセット207におけるクエリは、「時間Xに配送される価格Pで購入される数量Aと、時間Yに配送される価格Rで購入される数量Bとは、どちらが好ましいか」を含む。このタイプの比較ベースの質問を使用すると、ユーザ210は、特定の値を数量Aまたは時間Yに割り当てる必要なく、クエリに迅速に回答することができる。これは、交渉中のユーザ210に対する中断を最小化するのに役立つ。クエリデータセット207は、ユーザ210に対する交渉の結果の価値を最大化するために、誘発エンジン208が任意の可能な比較クエリを検索することができるように交渉についてのパラメータのすべての可能な組み合わせを含む。いくつかの実施形態では、クエリは、交渉の前にクエリデータセット207にプリロードされる。いくつかの実施形態では、クエリデータセット207におけるクエリは、交渉のドメイン、例えば、ドメイン140(図1)に基づいて交渉中に生成および記憶される。中断閾値を満たすユーザ210に対して任意の可能な質問を尋ねる能力を有することは、ユーザ210に対する交渉の結果の価値を最大化するのに役立つ。
【0041】
システム200は、誘発エンジン208からのクエリおよび相手212からの提案に応答してユーザ210からの回答を受け取るように構成された増分効用回帰器209をさらに含む。増分効用回帰器209は、ユーザ210からの任意の回答に基づいて自己効用分布203を更新し、相手212からの提案に基づいて相手効用分布204を更新するように構成される。いくつかの実施形態では、増分効用回帰器209はまた、相手212からの提案に基づいて相手方針学習器205における相手方針を更新するように構成される。効用回帰器202とは異なり、増分効用回帰器209は、ユーザ210と相手212の両方について異なるパラメータに対する値の何らかの分布を仮定するように構成される。
【0042】
システム200を使用して、ユーザ210の嗜好および優先順位が著しく不確実な状態において、交渉を開始し実行することができる。システム200は、交渉中にユーザ210を許容可能な程度以上に中断させることなく、ユーザ210から追加情報を取得することが可能である。他のアプローチと比較して、システム200は、交渉を行うことができるように、柔軟性が増加して訓練時間が短くなる。
【0043】
図3は、いくつかの実施形態による、交渉方法300のフローチャートである。いくつかの実施形態では、方法300は、システム200(図2)を使用して実施される。いくつかの実施形態では、方法300は、システム200以外のシステムを使用して実施している。図3は、方法300の動作ブロックにおけるシステム200のいくつかの構成要素を含む。当業者は、これらの構成要素は単なる例示であり、言及された構成要素のみによって実施されるものとして方法300の動作を限定するものではないことを認識するであろう。
【0044】
方法300は、ユーザUfun分布が計算される動作301を含む。ユーザUfun分布は、ユーザ、例えば、ユーザ210(図2)についての部分結果順序付けに基づいて計算される。いくつかの実施形態では、ユーザUfun分布は、効用回帰器、例えば、効用回帰器202(図2)を使用して計算される。いくつかの実施形態では、計算されたユーザUfun分布は、自己効用分布、例えば、自己効用分布203(図2)に記憶される。
【0045】
方法は、相手Ufun分布が計算される動作302を含む。相手Ufun分布は、相手、例えば、相手212(図2)についての部分結果順序付けに基づいて計算される。いくつかの実施形態では、相手についての部分結果順序付けは、相手部分順序学習器、例えば、相手部分順序学習器201(図2)を使用して決定される。いくつかの実施形態では、相手Ufun分布は、効用回帰器、例えば、効用回帰器202(図2)を使用して計算される。いくつかの実施形態では、動作301で使用される効用回帰器は、動作302で使用されるものと同じ効用回帰器である。いくつかの実施形態では、動作301で使用される効用回帰器は、動作302で使用される効用回帰器とは異なる。いくつかの実施形態では、計算された相手Ufun分布は、相手効用分布、例えば、相手効用分布204(図2)に記憶される。いくつかの実施形態では、動作302は、動作301と同時に実施される。いくつかの実施形態では、動作302は、動作301の前または後に実施される。
【0046】
動作303において、提案方針が評価される。提案方針は、計算されたユーザUfun分布および相手Ufun分布に基づく。提案方針は、相手に行われる提案を決定するために、相手の推定方針の評価に基づく。いくつかの実施形態では、相手Ufun分布に基づいて相手によって受け入れられる閾値を有する、計算されたUfun分布に基づいてユーザに最も高い値を有する提案。いくつかの実施形態では、閾値は、ユーザによって予め決定される。いくつかの実施形態では、閾値は、交渉全体を通して一定である。いくつかの実施形態では、閾値は、交渉の過程で調整される。例えば、いくつかの実施形態では、閾値は、交渉における所定の反復回数の後に増加される。いくつかの実施形態では、提案は、相手による受諾の可能性にかかわらず、少なくともユーザにとって最小値を有する。いくつかの実施形態では、最小値は、ユーザによって予め決定される。いくつかの実施形態では、最小値は、交渉中にユーザによって調整可能である。
【0047】
場合によっては、提案方針評価は、追加情報が提案方針の評価を支援することを示す。追加情報が要求されるべきであると決定したことに応答して、ユーザからの追加情報を要求する信号が生成され、方法300は動作304に進む。追加情報が要求されるべきではないという決定に応答して、方法300は動作310に進む。いくつかの実施形態では、動作303は、方針生成器、例えば、方針生成器206(図2)を使用して実施される。
【0048】
動作304において、提案方針の評価を支援する追加情報を提供する可能性のあるクエリが残っているかどうかに関する決定が行われる。いくつかの実施形態では、そのようなクエリが存在するかどうかの決定は、クエリデータセット、例えば、クエリデータセット207に記憶されたクエリに基づく。いくつかの実施形態では、そのようなクエリが存在するかどうかの決定は、動作303で生成された提案された提案と利用可能なクエリとの間の比較に基づく。上記の基準を満たすクエリが存在するという決定に応答して、方法300は動作305に進む。上記の基準を満たすクエリが存在しないという決定に応答して、方法300は動作306に進む。
【0049】
動作305において、動作304で識別されたクエリが評価されて、クエリのVOIを決定する。VOIは、ユーザにとってのUfunにおける不確実性を除去する際にクエリに対する回答がどの程度重要であるかの尺度である。VOIが高いほど、ユーザにとってのUfunにおける不確実性が大きく低減される。いくつかの実施形態では、VOIは、動作303で生成された提案に基づいて決定される。いくつかの実施形態では、複数のクエリが動作304で識別される。複数のクエリが動作304で識別されたことに応答して、動作305において、各識別されたクエリについてのVOIが決定される。
【0050】
動作306において、最大VOIを有するクエリが選択される。VOI値は、動作305における評価から受信される。クエリが動作304で識別されないいくつかの実施形態では、動作306において、最も高い既知のVOIを有するクエリが選択される。いくつかの実施形態では、動作304で識別されたすべてのクエリは、動作306における対応するVOIに基づいてランク付けされる。いくつかの実施形態では、提案方針を評価するための追加情報を提供するクエリが利用できない場合、方法300は、ユーザにクエリを尋ねることなく動作304から動作310に進む。
【0051】
動作307において、ユーザに尋ねられるクエリのVOIに基づいて、ユーザの中断が正当であるかどうかに関する決定が行われる。識別されたクエリのVOIは、中断閾値と比較される。中断閾値は、交渉中にユーザが中断をどの程度許容できるかを測定するために使用されるVOI値である。いくつかの実施形態では、中断閾値は、ユーザによって予め決定される。いくつかの実施形態では、中断閾値は、交渉全体を通して一定のままである。いくつかの実施形態では、中断閾値は、交渉中に変更する。例えば、いくつかの実施形態では、中断閾値は、ユーザが現在より多くのまたはより少ない中断を許容できることを示す、交渉中にユーザから受信された命令に基づいて、交渉中に変更する。別の例では、いくつかの実施形態では、交渉における反復回数が増加するにつれて、中断閾値が自動的に増加する。ユーザがシステムであるいくつかの実施形態では、中断閾値は、クエリが識別された時点でのユーザ内の利用可能な処理能力に基づいて設定される。いくつかの実施形態では、中断閾値は、単一の値を含む。いくつかの実施形態では、中断閾値は、ユーザが許容するクエリの数を示す複数の値を含む。中断閾値に対して複数の値を提供することによって、方法300は、高VOIを有する複数のクエリを使用するユーザにとってのUfunにおける不確実性を減少させることができ、低VOIクエリに対するユーザの中断も低減することができる。当業者は、上記の説明は2つの異なる中断閾値を提供するが、3つ以上の中断閾値が本開示の範囲内であることを認識するであろう。
【0052】
ユーザへのクエリが正当であるという決定に応答して、方法300は動作308に進む。ユーザへのクエリが正当でないという決定に応答して、方法300は動作310に進む。
【0053】
いくつかの実施形態では、動作304~307は、誘発エンジン、例えば、誘発エンジン208(図2)を使用して実施される。
【0054】
動作308において、クエリがユーザに提出され、回答がユーザから受信される。いくつかの実施形態では、ユーザは、人間である。いくつかの実施形態では、ユーザは、システムである。いくつかの実施形態では、クエリは、無線でユーザに提出される。いくつかの実施形態では、クエリは、有線接続を通してユーザに提出される。いくつかの実施形態では、ユーザにクエリを知らせるために、アラート、例えば、モバイル端末上の視覚または音声アラートが生成される。いくつかの実施形態では、ユーザ応答は、無線で受信される。いくつかの実施形態では、ユーザ応答は、有線接続を通して受信される。
【0055】
動作309において、部分結果順序付けは、ユーザから受信された応答に基づいて更新される。
【0056】
動作310において、提案は、交渉プロトコル、例えば、交渉プロトコル211(図2)を通して相手に送信される。いくつかの実施形態では、提案は、無線で相手に送信される。いくつかの実施形態では、提案は、有線接続を通して相手に送信される。いくつかの実施形態では、相手に提案を知らせるために、アラート、例えば、モバイル端末上の視覚または音声アラートが生成される。
【0057】
動作311において、相手が提案を受諾したかどうかに関する決定が行われる。いくつかの実施形態では、相手の応答は、無線で受信される。いくつかの実施形態では、相手の応答は、有線接続を通して受信される。相手が提案を受諾したという決定に応答して、方法300は動作315に進む。相手が提案を受諾しなかったという決定に応答して、方法300は動作312に進む。
【0058】
動作312において、相手結果順序付けは、相手から受信された逆提案に基づいて更新される。相手の応答が拒否であるか、または交渉プロトコルなどを通して交渉が場合によっては打ち切られるいくつかの実施形態では、方法300は、相手から受信された応答の分析に続いて動作315に進む。
【0059】
動作313において、ユーザUfun分布は、動作309からの更新された結果順序付けに基づいて更新される。更新されたユーザUfun分布は、動作303における交渉のさらなる反復のために利用される。いくつかの実施形態では、更新されたユーザUfun分布は、自己効用分布に保存される。いくつかの実施形態では、ユーザUfun分布は、増分効用回帰器、例えば、増分効用回帰器209(図2)を使用して更新される。
【0060】
動作314において、相手Ufun分布は、動作312からの更新された結果順序付けに基づいて更新される。更新された相手Ufun分布は、動作303における交渉のさらなる反復のために利用される。いくつかの実施形態では、更新された相手Ufun分布は、相手効用分布に保存される。いくつかの実施形態では、相手Ufun分布は、増分効用回帰器、例えば、増分効用回帰器209(図2)を使用して更新される。いくつかの実施形態では、動作313および動作314は、同じ増分効用回帰器を使用して実施される。いくつかの実施形態では、動作313は、動作314とは異なる増分効用回帰器を使用して実施される。
【0061】
動作315において、交渉は終了する。いくつかの実施形態では、交渉の結果は、将来の交渉を改善するためにフィードバックされる。いくつかの実施形態では、交渉の結果は、無線でユーザに報告される。いくつかの実施形態では、交渉の結果は、有線接続を使用してユーザに報告される。いくつかの実施形態では、ユーザに交渉結果を知らせるために、アラート、例えば、モバイル端末上の視覚または音声アラートが生成される。
【0062】
いくつかの実施形態では、方法300の動作の順序が調整される。例えば、いくつかの実施形態では、動作302は、動作301の前に実施される。いくつかの実施形態では、方法300のうちの少なくとも1つの動作は省略される。例えば、いくつかの実施形態では、動作304は省略される。いくつかの実施形態では、少なくとも1つの追加の動作が方法300に追加される。例えば、いくつかの実施形態では、方法300は、交渉の現在の状態を表示するようにディスプレイに命令するための動作を含む。
【0063】
図4は、いくつかの実施形態による、交渉を実施するためのシステム400のブロック図である。システム400は、ハードウェアプロセッサ402と、コンピュータプログラムコード406、すなわち、実行可能命令のセットで符号化された、すなわち、それらを記憶している非一時的コンピュータ可読記憶媒体404とを含む。コンピュータ可読記憶媒体404はまた、モバイル端末などの外部デバイスとインターフェースするための命令407で符号化される。プロセッサ402は、バス408を介してコンピュータ可読記憶媒体404に電気的に結合される。プロセッサ402はまた、バス408によってI/Oインターフェース410に電気的に結合される。ネットワークインターフェース412はまた、バス408を介してプロセッサ402に電気的に接続される。ネットワークインターフェース412は、プロセッサ402およびコンピュータ可読記憶媒体404がネットワーク414を介して外部要素に接続することが可能であるように、ネットワーク414に接続される。プロセッサ402は、方法300(図3)または実装システム200(図2)で説明した動作の一部またはすべてを実施するためにシステム400を使用可能にするために、コンピュータ可読記憶媒体404に符号化されたコンピュータプログラムコード406を実行するように構成される。
【0064】
いくつかの実施形態では、プロセッサ402は、中央処理装置(CPU)、マルチプロセッサ、分散処理システム、特定用途向け集積回路(ASIC)、および/または適切な処理部である。
【0065】
いくつかの実施形態では、コンピュータ可読記憶媒体404は、電子、磁気、光学、電磁、赤外線、および/または半導体システム(または装置もしくはデバイス)である。例えば、コンピュータ可読記憶媒体404は、半導体もしくはソリッドステートメモリ、磁気テープ、リムーバブルコンピュータディスケット、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、剛性磁気ディスク、および/または光ディスクを含む。光ディスクを使用するいくつかの実施形態では、コンピュータ可読記憶媒体404は、コンパクトディスク読み出し専用メモリ(CD-ROM)、コンパクトディスク読み取り/書き込み(CD-R/W)、および/またはデジタルビデオディスク(DVD)を含む。
【0066】
いくつかの実施形態では、記憶媒体404は、システム400に方法300(図3)または実装システム200(図2)を実施させるように構成されたコンピュータプログラムコード406を記憶する。いくつかの実施形態では、記憶媒体404はまた、方法300(図3)もしくは実装システム200(図2)を実施するために必要な情報、ならびに方法300(図3)もしくは実装システム200(図2)を実施する間に生成された情報、例えばクエリパラメータ416、中断閾値パラメータ418、自己Ufunパラメータ420、相手Ufunパラメータ422、結果順序付けパラメータ424、および/または方法300(図3)もしくは実装システム200(図2)の動作を実施するための実行可能命令のセットを記憶する。
【0067】
いくつかの実施形態では、記憶媒体404は、外部構成要素とインターフェースするための命令407を記憶する。命令407は、プロセッサ402が外部構成要素によって読み取り可能な命令を生成し、方法300(図3)またはシステム200(図2)を効果的に実施することを可能にする。
【0068】
システム400は、I/Oインターフェース410を含む。I/Oインターフェース410は、外部回路に結合される。いくつかの実施形態では、I/Oインターフェース410は、情報およびコマンドをプロセッサ402に通信するためのキーボード、キーパッド、マウス、トラックボール、トラックパッド、および/またはカーソル方向キーを含む。
【0069】
システム400はまた、プロセッサ402に結合されたネットワークインターフェース412を含む。ネットワークインターフェース412は、システム400が、1つまたは複数の他のコンピュータシステムが接続されるネットワーク414と通信することを可能にする。ネットワークインターフェース412は、BLUETOOTH(登録商標)、WIFI、WIMAX、GPRS、もしくはWCDMA(登録商標)などの無線ネットワークインターフェース、またはETHERNET、USB、もしくはIEEE-1394などの有線ネットワークインターフェースを含む。いくつかの実施形態では、方法300またはシステム200は、2つ以上のシステム400で実施され、情報は、ネットワーク414を介して異なるシステム400間で交換される。
【0070】
本明細書の一態様は、システムに関する。システムは、指示を記憶するように構成された非一時的コンピュータ可読媒体を含む。システムは、非一時的コンピュータ可読媒体に接続されたプロセッサをさらに含む。プロセッサは、不確実性を有するユーザ効用関数(Ufun)についての情報を受信するための指示を実行するように構成される。プロセッサは、ユーザUfunに基づく交渉における提案を生成するための指示を実行するようにさらに構成される。プロセッサは、ユーザに追加情報を要求する必要があるかどうかを決定するための指示を実行するようにさらに構成される。プロセッサは、追加情報が要求されるべきであるという決定に応答して、追加情報を取得するためのユーザへのクエリを識別するための指示を実行するようにさらに構成される。プロセッサは、識別されたクエリについての情報の価値(VOI)値を決定するための指示を実行するようにさらに構成される。プロセッサは、識別されたクエリについてのVOI値を中断閾値と比較するための指示を実行するようにさらに構成される。プロセッサは、VOI値が中断閾値よりも大きいことに応答して、識別されたクエリをユーザに送信するための指示を実行するようにさらに構成される。いくつかの実施形態では、プロセッサは、識別されたクエリのVOI値が中断閾値以下であるという決定に応答して、生成された提案を相手に送信するための指示を実行するようにさらに構成される。いくつかの実施形態では、プロセッサは、識別されたクエリに応答したユーザからの入力に基づいてユーザUfunを更新するための指示を実行するようにさらに構成される。いくつかの実施形態では、プロセッサは、相手から提案を受信し、相手からの受信された提案に基づいて相手Ufunを計算するための指示を実行するようにさらに構成され、生成された提案は、相手Ufunに基づいて生成される。いくつかの実施形態では、プロセッサは、交渉中に中断閾値を変更するための指示を実行するようにさらに構成される。いくつかの実施形態では、プロセッサは、ユーザからの閾値入力の受信に応答して中断閾値を変更するための指示を実行するようにさらに構成される。いくつかの実施形態では、プロセッサは、交渉における反復回数に基づいて中断閾値を変更するための指示を実行するようにさらに構成される。いくつかの実施形態では、非一時的コンピュータ可読媒体は、複数のクエリを記憶するように構成され、プロセッサは、複数のクエリからクエリを識別するための指示を実行するようにさらに構成される。いくつかの実施形態では、プロセッサは、ユーザに尋ねることが許容されているクエリの数を決定するための指示を実行するようにさらに構成される。
【0071】
本明細書の一態様は、方法に関する。方法は、不確実性を有するユーザ効用関数(Ufun)についての情報を受信することを含む。方法は、ユーザUfunに基づく交渉における提案を生成することをさらに含む。方法は、ユーザに追加情報を要求する必要があるかどうかを決定することをさらに含む。方法は、追加情報が要求されるべきであるという決定に応答して、追加情報を取得するためのユーザへのクエリを識別することをさらに含む。方法は、識別されたクエリについての情報の価値(VOI)値を決定することをさらに含む。方法は、プロセスを使用して、識別されたクエリについてのVOI値を中断閾値と比較することをさらに含む。方法は、VOI値が中断閾値よりも大きいことに応答して、識別されたクエリをユーザに送信することをさらに含む。いくつかの実施形態では、方法は、識別されたクエリのVOI値が中断閾値以下であるという決定に応答して、生成された提案を相手に送信することをさらに含む。いくつかの実施形態では、方法は、識別されたクエリに応答したユーザからの入力に基づいてユーザUfunを更新することをさらに含む。いくつかの実施形態では、方法は、相手からの提案を受信することと、相手からの受信された提案に基づいて相手Ufunを計算することをさらに含み、生成された提案は、相手Ufunに基づいて生成される。いくつかの実施形態では、方法は、交渉中に中断閾値を変更することをさらに含む。いくつかの実施形態では、中断閾値を変更することは、ユーザからの閾値入力の受信に応答して中断閾値を変更することを含む。いくつかの実施形態では、中断閾値を変更することは、交渉における反復回数に基づいて中断閾値を変更することを含む。いくつかの実施形態では、方法は、複数のクエリを記憶することをさらに含み、クエリを識別することは、複数のクエリからクエリを識別することを含む。いくつかの実施形態では、方法は、ユーザに尋ねることが許容されているクエリの数を決定することをさらに含む。
【0072】
本明細書の一態様は、システムに関する。システムは、指示を記憶するように構成された非一時的コンピュータ可読媒体を含む。システムは、非一時的コンピュータ可読媒体に接続されたプロセッサをさらに含む。プロセッサは、不確実性を有するユーザ効用関数(Ufun)についての情報を受信するための指示を実行するように構成される。プロセッサは、ユーザUfunに基づく交渉における提案を生成するための指示を実行するようにさらに構成される。プロセッサは、ユーザに追加情報を要求する必要があるかどうかを決定するための指示を実行するようにさらに構成される。プロセッサは、中断閾値に基づいてユーザに尋ねることが許容されたクエリの数を決定するための指示を実行するようにさらに構成される。プロセッサは、追加情報を要求する必要があるという決定に応答して、追加情報を取得するためのユーザへのクエリの数を識別するための指示を実行するようにさらに構成される。プロセッサは、識別されたクエリの各々についての情報の価値(VOI)値を決定するための指示を実行するようにさらに構成される。プロセッサは、識別されたクエリの各々についてのVOIおよび中断閾値に基づいて、ユーザに送信されるクエリの集合を決定するための指示を実行するようにさらに構成され、クエリの集合におけるクエリの数は、許容されたクエリの数以下である。プロセッサは、クエリのセットの各々をユーザに送信するための指示を実行するようにさらに構成される。いくつかの実施形態では、プロセッサは、交渉中に中断閾値を変更するための指示を実行するように構成される。
【0073】
上記は、当業者が本開示の態様をよりよく理解することができるように、いくつかの実施形態の特徴を概説している。当業者は、本明細書に導入された実施形態と同じ目的を実行し、かつ/または同じ利点を達成するための他のプロセスおよび構造を設計または修正するための基礎として本開示を容易に使用することができることを理解するべきである。当業者はまた、そのような同等の構成が本開示の精神および範囲から逸脱するものではなく、本開示の精神および範囲から逸脱することなく本明細書において様々な変更、置換、および改変を行うことができることを認識するべきである。
【0074】
上述の例示的な実施形態の一部またはすべては、以下の付記のように記載することができるが、これに限定されるものではない。
【0075】
(付記1)
指示を記憶するように構成された非一時的コンピュータ可読媒体と、
前記非一時的コンピュータ可読媒体に接続されたプロセッサと、を含み、前記プロセッサは、
不確実性を有するユーザ効用関数(Ufun)についての情報を受信し、
前記ユーザUfunに基づく交渉における提案を生成し、
ユーザに追加情報を要求する必要があるかどうかを決定し、
追加情報を要求する必要があるという決定に応答して、前記追加情報を取得するための前記ユーザへのクエリを識別し、
前記識別されたクエリについての情報の価値(VOI)値を決定し、
前記識別されたクエリについての前記VOI値を中断閾値と比較し、
前記VOI値が前記中断閾値よりも大きいことに応答して、前記識別されたクエリを前記ユーザに送信する
ための前記指示を実行するように構成される、システム。
【0076】
(付記2)
前記プロセッサは、前記識別されたクエリの前記VOI値が前記中断閾値以下であるという決定に応答して、前記生成された提案を相手に送信するための前記指示を実行するようにさらに構成される、付記1に記載のシステム。
【0077】
(付記3)
前記プロセッサは、前記識別されたクエリに応答した前記ユーザからの入力に基づいて前記ユーザUfunを更新するための前記指示を実行するようにさらに構成される、付記1に記載のシステム。
【0078】
(付記4)
前記プロセッサは、
相手から提案を受信し、
前記相手からの前記受信された提案に基づいて相手Ufunを計算する、
ための前記指示を実行するようにさらに構成され、前記生成された提案は、前記相手Ufunに基づいて生成される、付記1に記載のシステム。
【0079】
(付記5)
前記プロセッサは、前記交渉中に前記中断閾値を変更するための前記指示を実行するようにさらに構成される、付記1に記載のシステム。
【0080】
(付記6)
前記プロセッサは、前記ユーザからの閾値入力の受信に応答して前記中断閾値を変更するための前記指示を実行するようにさらに構成される、付記5に記載のシステム。
【0081】
(付記7)
前記プロセッサは、前記交渉における反復回数に基づいて前記中断閾値を変更するための前記指示を実行するようにさらに構成される、付記5に記載のシステム。
【0082】
(付記8)
前記非一時的コンピュータ可読媒体は、複数のクエリを記憶するように構成され、前記プロセッサは、前記複数のクエリから前記クエリを識別するための前記指示を実行するようにさらに構成される、付記1に記載のシステム。
【0083】
(付記9)
前記プロセッサは、前記ユーザに尋ねることが許容されているクエリの数を決定するための前記指示を実行するようにさらに構成される、付記1に記載のシステム。
【0084】
(付記10)
不確実性を有するユーザ効用関数(Ufun)についての情報を受信することと、
前記ユーザUfunに基づく交渉における提案を生成することと、
ユーザに追加情報を要求する必要があるかどうかを決定することと、
追加情報を要求する必要があるという決定に応答して、前記追加情報を取得するための前記ユーザへのクエリを識別することと、
前記識別されたクエリについての情報の価値(VOI)値を決定することと、
プロセスを使用して、前記識別されたクエリについての前記VOI値を中断閾値と比較することと、
前記VOI値が前記中断閾値よりも大きいことに応答して、前記識別されたクエリを前記ユーザに送信することと
を含む、方法。
【0085】
(付記11)
前記識別されたクエリの前記VOI値が前記中断閾値以下であるという決定に応答して、前記生成された提案を相手に送信することをさらに含む、付記10に記載の方法。
【0086】
(付記12)
前記識別されたクエリに応答した前記ユーザからの入力に基づいて前記ユーザUfunを更新することをさらに含む、付記10に記載の方法。
【0087】
(付記13)
相手からの提案を受信することと、
前記相手からの前記受信された提案に基づいて相手Ufunを計算すること、をさらに含み、前記生成された提案は、前記相手Ufunに基づいて生成される、付記10に記載の方法。
【0088】
(付記14)
前記交渉中に前記中断閾値を変更することをさらに含む、付記10に記載の方法。
【0089】
(付記15)
前記中断閾値を変更することは、前記ユーザからの閾値入力の受信に応答して前記中断閾値を変更することを含む、付記14に記載の方法。
【0090】
(付記16)
前記中断閾値を変更することは、前記交渉における反復回数に基づいて前記中断閾値を変更することを含む、付記14に記載の方法。
【0091】
(付記17)
複数のクエリを記憶することをさらに含み、前記クエリを識別することは、前記複数のクエリから前記クエリを識別することを含む、付記10に記載の方法。
【0092】
(付記18)
前記ユーザに尋ねることが許容されているクエリの数を決定することをさらに含む、付記10に記載の方法。
【0093】
(付記19)
指示を記憶するように構成された非一時的コンピュータ可読媒体と、
前記非一時的コンピュータ可読媒体に接続されたプロセッサと、を含み、前記プロセッサは、
不確実性を有するユーザ効用関数(Ufun)についての情報を受信し、
前記ユーザUfunに基づく交渉における提案を生成し、
ユーザに追加情報を要求する必要があるかどうかを決定し、
中断閾値に基づいて前記ユーザに尋ねられることが許容されたクエリの数を決定し、
追加情報を要求する必要があるという決定に応答して、前記追加情報を取得するための前記ユーザへのクエリの数を識別し、
前記識別されたクエリの各々についての情報の価値(VOI)値を決定し、
前記識別されたクエリの各々についての前記VOIおよび前記中断閾値に基づいて、前記ユーザに送信されるクエリの集合を決定し、
前記クエリの集合の各々を前記ユーザに送信する、ための前記指示を実行するように構成され、前記クエリの集合におけるクエリの数は、許容された前記クエリの数以下である、システム。
【0094】
(付記20)
前記プロセッサは、前記交渉中に前記中断閾値を変更するための前記指示を実行するように構成される、付記19に記載のシステム。
【0095】
本出願は、2021年5月13日に出願された米国仮出願第63/187,951号明細書の優先権を主張し、その全内容は参照によりその全体が本明細書に組み込まれる。さらに、本出願は、2021年7月28日に出願された米国出願第17/388,004号明細書の優先権を主張し、その全内容は参照によりその全体が本明細書に組み込まれる。
図1
図2
図3
図4
【手続補正書】
【提出日】2023-11-06
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
指示を記憶するように構成された非一時的コンピュータ可読媒体と、
前記非一時的コンピュータ可読媒体に接続されたプロセッサと、を含み、前記プロセッサは、
不確実性を有するユーザ効用関数(Ufun)についての情報を受信し、
前記ユーザUfunに基づく交渉における提案を生成し、
ユーザに追加情報を要求する必要があるかどうかを決定し、
追加情報を要求する必要があるという決定に応答して、前記追加情報を取得するための前記ユーザへのクエリを識別し、
前記識別されたクエリについての情報の価値(VOI)値を決定し、
前記識別されたクエリについての前記VOI値を中断閾値と比較し、
前記VOI値が前記中断閾値よりも大きいことに応答して、前記識別されたクエリを前記ユーザに送信する
ための前記指示を実行するように構成される、システム。
【請求項2】
前記プロセッサは、前記識別されたクエリの前記VOI値が前記中断閾値以下であるという決定に応答して、前記生成された提案を相手に送信するための前記指示を実行するようにさらに構成される、請求項1に記載のシステム。
【請求項3】
前記プロセッサは、前記識別されたクエリに応答した前記ユーザからの入力に基づいて前記ユーザUfunを更新するための前記指示を実行するようにさらに構成される、請求項1に記載のシステム。
【請求項4】
前記プロセッサは、
相手から提案を受信し、
前記相手からの前記受信された提案に基づいて相手Ufunを計算する、
ための前記指示を実行するようにさらに構成され、前記生成された提案は、前記相手Ufunに基づいて生成される、請求項1に記載のシステム。
【請求項5】
前記プロセッサは、前記交渉中に前記中断閾値を変更するための前記指示を実行するようにさらに構成される、請求項1に記載のシステム。
【請求項6】
前記プロセッサは、前記ユーザからの閾値入力の受信に応答して前記中断閾値を変更するための前記指示を実行するようにさらに構成される、請求項5に記載のシステム。
【請求項7】
前記プロセッサは、前記交渉における反復回数に基づいて前記中断閾値を変更するための前記指示を実行するようにさらに構成される、請求項5に記載のシステム。
【請求項8】
前記非一時的コンピュータ可読媒体は、複数のクエリを記憶するように構成され、前記プロセッサは、前記複数のクエリから前記クエリを識別するための前記指示を実行するようにさらに構成される、請求項1に記載のシステム。
【請求項9】
不確実性を有するユーザ効用関数(Ufun)についての情報を受信することと、
前記ユーザUfunに基づく交渉における提案を生成することと、
ユーザに追加情報を要求する必要があるかどうかを決定することと、
追加情報を要求する必要があるという決定に応答して、前記追加情報を取得するための前記ユーザへのクエリを識別することと、
前記識別されたクエリについての情報の価値(VOI)値を決定することと、
プロセッサを使用して、前記識別されたクエリについての前記VOI値を中断閾値と比較することと、
前記VOI値が前記中断閾値よりも大きいことに応答して、前記識別されたクエリを前記ユーザに送信することと
を含む、方法。
【請求項10】
指示を記憶するように構成された非一時的コンピュータ可読媒体と、
前記非一時的コンピュータ可読媒体に接続されたプロセッサと、を含み、前記プロセッサは、
不確実性を有するユーザ効用関数(Ufun)についての情報を受信し、
前記ユーザUfunに基づく交渉における提案を生成し、
ユーザに追加情報を要求する必要があるかどうかを決定し、
中断閾値に基づいて前記ユーザに尋ねることが許容されたクエリの数を決定し、
追加情報を要求する必要があるという決定に応答して、前記追加情報を取得するための前記ユーザへのクエリの数を識別し、
前記識別されたクエリの各々についての情報の価値(VOI)値を決定し、
前記識別されたクエリの各々についての前記VOIおよび前記中断閾値に基づいて、前記ユーザに送信されるクエリの集合を決定し、
前記クエリの集合の各々を前記ユーザに送信する、ための前記指示を実行するように構成され、前記クエリの集合におけるクエリの数は、許容された前記クエリの数以下である、システム。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0005
【補正方法】変更
【補正の内容】
【0005】
本開示の第2の例示的な態様によれば、不確実性を有するユーザ効用関数(Ufun)についての情報を受信することと、前記ユーザUfunに基づく交渉における提案を生成することと、ユーザに追加情報を要求する必要があるかどうかを決定することと、追加情報を要求する必要があるという決定に応答して、前記追加情報を取得するための前記ユーザへのクエリを識別することと、前記識別されたクエリについての情報の価値(VOI)値を決定することと、プロセッサを使用して、前記識別されたクエリについての前記VOI値を中断閾値と比較することと、前記VOI値が前記中断閾値よりも大きいことに応答して、前記識別されたクエリを前記ユーザに送信することとを含む、方法が提供される。
【国際調査報告】