IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧 ▶ 独立行政法人産業技術総合研究所の特許一覧

特表2024-545891交渉装置、交渉方法およびプログラム
<>
  • 特表-交渉装置、交渉方法およびプログラム 図1
  • 特表-交渉装置、交渉方法およびプログラム 図2
  • 特表-交渉装置、交渉方法およびプログラム 図3
  • 特表-交渉装置、交渉方法およびプログラム 図4
  • 特表-交渉装置、交渉方法およびプログラム 図5
  • 特表-交渉装置、交渉方法およびプログラム 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-12-13
(54)【発明の名称】交渉装置、交渉方法およびプログラム
(51)【国際特許分類】
   G06N 5/04 20230101AFI20241206BHJP
【FI】
G06N5/04
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024537340
(86)(22)【出願日】2022-12-26
(85)【翻訳文提出日】2024-06-20
(86)【国際出願番号】 JP2022047934
(87)【国際公開番号】W WO2023127801
(87)【国際公開日】2023-07-06
(31)【優先権主張番号】P 2021214132
(32)【優先日】2021-12-28
(33)【優先権主張国・地域又は機関】JP
(81)【指定国・地域】
(71)【出願人】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(71)【出願人】
【識別番号】301021533
【氏名又は名称】国立研究開発法人産業技術総合研究所
(74)【代理人】
【識別番号】100103894
【弁理士】
【氏名又は名称】家入 健
(72)【発明者】
【氏名】郭 凱
(72)【発明者】
【氏名】中台 慎二
(57)【要約】
交渉装置(2000)は、相手エージェント(10)からの現在オファーの提示時間と、交渉において受信したことのある相手エージェント(10)からの各オファーの効用とを示す履歴情報30を取得する。交渉において、交渉期間の最大時間長が予め決められている。交渉装置(2000)は、交渉の残り期間の時間長と、現在オファーの提示時間とに基づいて、将来のオファーの数の確率分布を生成する。交渉装置(2000)は、将来のオファーの数の確率分布と、履歴情報(30)によって示される効用とに基づいて、将来のオファーの期待効用を計算する。交渉装置(2000)は、将来のオファーの期待効用と、現在オファーの効用とに基づいて、現在オファーを受け入れるか否かを判定する。
【選択図】図1
【特許請求の範囲】
【請求項1】
少なくとも1つのプロセッサと、
命令を記憶しているメモリと、を備え、
前記少なくとも1つのプロセッサは、前記命令を実行して、
期間の最大時間長が予め決められている交渉において、相手からの現在のオファーの提示時間と、前記交渉において受信したことのある前記相手からの各オファーの効用とを示す履歴情報を取得し、
前記交渉の残り期間の時間長と、前記現在のオファーの前記提示時間とに基づいて、将来のオファーの数の確率分布を生成し、
前記将来のオファーの数の前記確率分布と、前記履歴情報によって示される前記効用とに基づいて、将来のオファーの期待効用を計算し、
前記将来のオファーの期待効用と、前記現在のオファーの前記効用とに基づいて、前記現在のオファーを受け入れるか否かを判定するように構成される、交渉装置。
【請求項2】
前記将来のオファーの数の前記確率分布の前記生成は、前記交渉の前記残り期間の前記時間長と、前記現在のオファーの前記提示時間とを、前記将来のオファーの数の前記確率分布の予め定義されたモデルのパラメータに適用することを含む、請求項1に記載の交渉装置。
【請求項3】
前記将来のオファーの期待効用の前記計算は、
前記将来のオファーの数を入力とし、前記将来のオファーの数が前記入力によって表されるという条件で前記将来のオファーの期待効用が出力される条件付き期待効用関数を生成することと、
前記条件付き期待効用関数と、前記将来のオファーの数の前記確率分布とに基づいて、前記将来のオファーの期待効用を計算することと、を含む、請求項1または2に記載の交渉装置。
【請求項4】
前記条件付き期待効用関数の前記生成は、
前記履歴情報によって示される時間的に互いに隣接する前記効用の各ペアに対して、前記効用の差分を計算することと、
前記効用の前記計算された差分をガウス過程回帰に適用して、前記将来のオファーにおける効用の差分のガウス分布を取得することと、
前記将来のオファーにおける効用の差分の前記ガウス分布に基づいて、各前記将来のオファーの期待効用を計算することと、を含む、請求項3に記載の交渉装置。
【請求項5】
前記交渉は、複数の前記相手との間で行われ、
前記将来のオファーの期待効用は、前記相手の各々について計算され、
前記現在のオファーを受け入れるか否かの前記判定は、
前記将来のオファーの期待効用の最大値を用いて受け入れ閾値を決定することと、
前記現在のオファーの前記効用が前記受け入れ閾値以上である場合に、前記現在のオファーを受け入れると判定することと、を含む、請求項1から4のいずれか一項に記載の交渉装置。
【請求項6】
少なくとも1つのプロセッサと、
命令を記憶しているメモリと、を備え、
前記少なくとも1つのプロセッサは、前記命令を実行して、
期間の最大時間長が予め決められている交渉において、前記交渉の複数の相手の各々について、前記交渉において受信したことのある前記相手からの各オファーの効用を示す履歴情報を取得し、
前記複数の前記相手の各々について、前記相手の前記履歴情報によって示される前記効用に基づいて、前記相手からの将来のオファーの期待効用を計算し、
前記将来のオファーの期待効用の最大値を用いて受け入れ閾値を決定し、
現在のオファーの前記効用と、前記受け入れ閾値とに基づいて、前記現在のオファーを受け入れるか否かを判定するように構成される、交渉装置。
【請求項7】
期間の最大時間長が予め決められている交渉において、相手からの現在のオファーの提示時間と、前記交渉において受信したことのある前記相手からの各オファーの効用とを示す履歴情報を取得することと、
前記交渉の残り期間の時間長と、前記現在のオファーの前記提示時間とに基づいて、将来のオファーの数の確率分布を生成することと、
前記将来のオファーの数の前記確率分布と、前記履歴情報によって示される前記効用とに基づいて、将来のオファーの期待効用を計算することと、
前記将来のオファーの期待効用と、前記現在のオファーの前記効用とに基づいて、前記現在のオファーを受け入れるか否かを判定することと、を含む、コンピュータによって実行される交渉方法。
【請求項8】
期間の最大時間長が予め決められている交渉において、前記交渉の複数の相手の各々について、前記交渉において受信したことのある前記相手からの各オファーの効用を示す履歴情報を取得することと、
前記複数の前記相手の各々について、前記相手の前記履歴情報によって示される前記効用に基づいて、前記相手からの将来のオファーの期待効用を計算することと、
前記将来のオファーの期待効用の最大値を用いて受け入れ閾値を決定することと、
現在のオファーの前記効用と、前記受け入れ閾値とに基づいて、前記現在のオファーを受け入れるか否かを判定することと、を含む、コンピュータによって実行される交渉方法。
【請求項9】
期間の最大時間長が予め決められている交渉において、相手からの現在のオファーの提示時間と、前記交渉において受信したことのある前記相手からの各オファーの効用とを示す履歴情報を取得することと、
前記交渉の残り期間の時間長と、前記現在のオファーの前記提示時間とに基づいて、将来のオファーの数の確率分布を生成することと、
前記将来のオファーの数の前記確率分布と、前記履歴情報によって示される前記効用とに基づいて、将来のオファーの期待効用を計算することと、
前記将来のオファーの期待効用と、前記現在のオファーの前記効用とに基づいて、前記現在のオファーを受け入れるか否かを判定することと、をコンピュータに実行させるプログラムを記憶している、非一時的コンピュータ可読記憶媒体。
【請求項10】
期間の最大時間長が予め決められている交渉において、前記交渉の複数の相手の各々について、前記交渉において受信したことのある前記相手からの各オファーの効用を示す履歴情報を取得することと、
前記複数の前記相手の各々について、前記相手の前記履歴情報によって示される前記効用に基づいて、前記相手からの将来のオファーの期待効用を計算することと、
前記将来のオファーの期待効用の最大値を用いて受け入れ閾値を決定することと、
現在のオファーの前記効用と、前記受け入れ閾値とに基づいて、前記現在のオファーを受け入れるか否かを判定することと、をコンピュータに実行させるプログラムを記憶している、非一時的コンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、概して、自動交渉に関する。
【背景技術】
【0002】
自動交渉に関する技術が開発されている。自動交渉では、エージェントがその相手にオファーを提供し、相手はそのオファーを受け入れるか、または拒否する。非特許文献1には、オファーを受けるエージェントにとってオファーがどの程度好ましいかを示すオファーの効用に基づいて、オファーを受け入れるか否かを判定する技術が開示されている。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】Tim Baarslag、Koen Hindriks、「Accepting Optimally in Automated Negotiation with Incomplete Information」、Proceedings of the 12th International Conference on Autonomous Agents and Multiagent Systems (AA-MAS 2013)、2013年5月6日
【発明の概要】
【発明が解決しようとする課題】
【0004】
非特許文献1では、交渉のルールとして、オファーの最大数が予め決められていると想定する。本開示は、交渉においてオファーを受け入れるか否かを適切に判定するための新たな技術を提供する。
【課題を解決するための手段】
【0005】
本開示で提供される第一の交渉装置は、少なくとも1つのプロセッサと、命令を記憶しているメモリと、を備える。前記少なくとも1つのプロセッサは、前記命令を実行して、期間の最大時間長が予め決められている交渉において、相手からの現在のオファーの提示時間と、前記交渉において受信したことのある前記相手からの各オファーの効用とを示す履歴情報を取得し、前記交渉の残り期間の時間長と、前記現在のオファーの前記提示時間とに基づいて、将来のオファーの数の確率分布を生成し、前記将来のオファーの数の前記確率分布と、前記履歴情報によって示される前記効用とに基づいて、将来のオファーの期待効用を計算し、前記将来のオファーの期待効用と、前記現在のオファーの前記効用とに基づいて、前記現在のオファーを受け入れるか否かを判定するように構成される。
【0006】
本開示で提供される第二の交渉装置は、少なくとも1つのプロセッサと、命令を記憶しているメモリと、を備える。前記少なくとも1つのプロセッサは、前記命令を実行して、期間の最大時間長が予め決められている交渉において、前記交渉の複数の相手の各々について、前記交渉において受信したことのある前記相手からの各オファーの効用を示す履歴情報を取得し、前記複数の前記相手の各々について、前記相手の前記履歴情報によって示される前記効用に基づいて、前記相手からの将来のオファーの期待効用を計算し、前記将来のオファーの期待効用の最大値を用いて受け入れ閾値を決定し、現在のオファーの前記効用と、前記受け入れ閾値とに基づいて、前記現在のオファーを受け入れるか否かを判定するように構成される。
【0007】
本開示で提供される第一の交渉方法は、コンピュータによって実行される。当該交渉方法は、期間の最大時間長が予め決められている交渉において、相手からの現在のオファーの提示時間と、前記交渉において受信したことのある前記相手からの各オファーの効用とを示す履歴情報を取得することと、前記交渉の残り期間の時間長と、前記現在のオファーの前記提示時間とに基づいて、将来のオファーの数の確率分布を生成することと、前記将来のオファーの数の前記確率分布と、前記履歴情報によって示される前記効用とに基づいて、将来のオファーの期待効用を計算することと、前記将来のオファーの期待効用と、前記現在のオファーの前記効用とに基づいて、前記現在のオファーを受け入れるか否かを判定することと、を含む。
【0008】
本開示で提供される第二の交渉方法は、コンピュータによって実行される。当該交渉方法は、期間の最大時間長が予め決められている交渉において、前記交渉の複数の相手の各々について、前記交渉において受信したことのある前記相手からの各オファーの効用を示す履歴情報を取得することと、前記複数の前記相手の各々について、前記相手の前記履歴情報によって示される前記効用に基づいて、前記相手からの将来のオファーの期待効用を計算することと、前記将来のオファーの期待効用の最大値を用いて受け入れ閾値を決定することと、現在のオファーの前記効用と、前記受け入れ閾値とに基づいて、前記現在のオファーを受け入れるか否かを判定することと、を含む。
【0009】
本開示で提供される第一の非一時的なコンピュータ可読記憶媒体は、前述した本開示の第一の交渉方法をコンピュータに実行させるプログラムを格納する。
【0010】
本開示で提供される第二の非一時的なコンピュータ可読記憶媒体は、前述した本開示の第二の交渉方法をコンピュータに実行させるプログラムを格納する。
【発明の効果】
【0011】
本開示によれば、交渉においてオファーを受け入れるか否かを適切に判定するための新たな技術が提供される。
【図面の簡単な説明】
【0012】
図1図1は、実施形態1の交渉装置の概要を示す。
図2図2は、交渉装置の機能構成の一例を示すブロック図である。
図3図3は、交渉装置を実現するコンピュータのハードウェア構成の一例を示すブロック図である。
図4図4は、実施形態1の交渉装置によって実行される処理の例示的な流れを示す流れ図である。
図5図5は、履歴情報の例示的な構造を示す。
図6図6は、実施形態2の交渉装置によって実行される処理の例示的な流れを示す流れ図である。
【発明を実施するための形態】
【0013】
以下、本開示による例示的な実施の形態について、図面を参照しながら説明する。なお、各図面において同一の要素には同一の符号を付し、必要に応じて重複する説明を省略する。また、記憶ユニットは、1つ以上の記憶装置で構成される。
【0014】
実施形態1
<概要>
図1は、実施形態1の交渉装置2000の概要を示す。なお、図1に示す概要は、交渉装置2000を理解しやすくするために、交渉装置2000の動作の一例を示したものであり、交渉装置2000が取り得る動作の範囲を限定したり、狭めたりするものではない。
【0015】
交渉装置2000は、相手エージェント10と交渉を行う自動エージェントとして動作する。相手エージェント10は、交渉装置2000にオファーを提供するエージェントである。なお、相手エージェント10は、手動で操作されてもよいし、自動で操作されてもよい。
【0016】
本実施形態では、相手エージェント10の数を1つと想定する。後述するように、実施形態2の交渉装置2000は、複数の相手エージェント10を取り扱う。
【0017】
交渉装置2000は、交渉期限までに交渉を終了しなければならないというルールで、相手エージェント10と交渉を行う。換言すれば、交渉の期間長は予め決められている。以下、交渉の期間およびその長さをそれぞれ「交渉期間」および「最大交渉時間」と呼ぶ。
【0018】
交渉装置2000は、相手エージェント10からのオファーを受信し、このオファー(「現在オファー」と呼ぶ)を受け入れるか否かを判定する。交渉装置2000が現在オファーを拒否すると、交渉は継続し、交渉装置2000が現在オファーを受け入れると、交渉は終了する。また、交渉期間が満了すると交渉は終了する。
【0019】
現在オファーを受け入れるか否かは、現在オファーの効用に基づいて判定される。オファーの効用とは、オファーを受ける当事者から見て、そのオファーがどの程度好ましいかを表す指標値である。当事者は交渉装置2000のユーザであり得る。
【0020】
概念的には、交渉装置2000にとって、相手エージェント10が現在オファーよりも好ましいオファーを提示すると予想されるとき、現在オファーを拒否し、将来オファーを待つことが好ましい。他方では、交渉装置2000にとって、相手エージェント10が現在オファーよりも好ましいオファーを提示すると予想されないとき、現在オファーを受け入れることが好ましい。なお、将来オファーは、交渉装置2000が交渉において現在オファーを受信した後に受信する任意のオファーである。
【0021】
したがって、交渉装置2000は、現在オファーの効用と、将来オファーの期待効用とに基づいて、現在オファーを受け入れるか否かを判定する。例えば、交渉装置2000は、現在オファーの効用が、将来オファーの期待効用以上であるとき、現在オファーを受け入れると判定しうる。他方では、交渉装置2000は、現在オファーの効用が、将来オファーの期待効用よりも小さいとき、現在オファーを拒否しうる。
【0022】
将来オファーの期待効用は、履歴情報30を使用して計算される。履歴情報30は、現在オファーの提示時間および交渉装置2000が受信したことのある各オファー(すなわち、現在オファーおよび過去オファー)の効用を示す。具体的には、交渉装置2000は、交渉の残り期間の時間長(すなわち、現在時刻と交渉の期限との間の時間長)と、現在オファーの提示時間とに基づいて、将来オファーの数の確率分布を生成する。そして、交渉装置2000は、将来オファーの数の確率分布と、履歴情報30によって示される効用とに基づいて、将来オファーの期待効用を計算する。以下、交渉の残り期間の時間長を「交渉残時間」と呼ぶ。
【0023】
<作用効果の例>
非特許文献1で想定されている交渉とは異なり、交渉装置2000が行う交渉に対して予め決められているのは、オファーの最大数ではなく、交渉時間の最大時間長である。この種の交渉を取り扱うために、交渉装置2000は、交渉残時間に基づいて将来オファーの数の分布を予測し、予測した将来オファーの数の分布に基づいて将来オファーの期待効用を計算する。それから、現在オファーを受け入れるか否かは、現在オファーの効用と、将来オファーの期待効用とに基づいて判定される。こうすることによって、交渉装置2000は、最大時間長が固定された交渉において、現在オファーが将来オファーよりも好ましいか否かを正確に予測することができ、これにより、現在オファーを受け入れるか否かを適切に判定することができる。
【0024】
以下、実施形態1の交渉装置2000のより詳細な説明を記載する。
【0025】
<機能構成例>
図2は、交渉装置2000の機能構成の一例を示す。交渉装置2000は、取得部2020と、予測部2040と、判定部2060とを備える。取得部2020は、履歴情報30を取得する。予測部2040は、交渉残時間と、現在オファーの提示時間とに基づいて、将来オファーの数の確率分布を生成する。予測部2040は、将来オファーの数の確率分布と、履歴情報30によって示される効用とに基づいて、将来オファーの期待効用を計算する。判定部2060は、現在オファーの効用と、将来オファーの期待効用とに基づいて、現在オファーを受け入れるか否かを判定する。
【0026】
<ハードウエア構成例>
交渉装置2000は、1つ以上のコンピュータで実現されうる。それら1つ以上のコンピュータのそれぞれは、交渉装置2000を実現するために作成された専用のコンピュータであってもよいし、パーソナルコンピュータ(PC: Personal Computer)、サーバマシン又はモバイルデバイスなどの汎用のコンピュータであってもよい。
【0027】
交渉装置2000は、コンピュータにアプリケーションをインストールすることで実現されうる。そのアプリケーションは、コンピュータを交渉装置2000として機能させるプログラムで実現される。言い換えれば、そのプログラムは、交渉装置2000の機能構成部を実装したものである。
【0028】
図3は、交渉装置2000を実現するコンピュータ1000のハードウエア構成の一例を示すブロック図である。図3において、コンピュータ1000は、バス1020、プロセッサ1040、メモリ1060、ストレージデバイス1080、入出力インタフェース1100、及びネットワークインタフェース1120を有する。
【0029】
バス1020は、プロセッサ1040、メモリ1060、ストレージデバイス1080、入出力インタフェース1100、及びネットワークインタフェース1120が相互にデータの送信及び受信をするためのデータ通信路である。プロセッサ1040は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、又は FPGA(Field-Programmable Gate Array)などといったプロセッサである。メモリ1060は、RAM(Random Access Memory)又は ROM(Read Only Memory)などの主記憶要素である。ストレージデバイス1080は、ハードディスク、SSD(Solid State Drive)、又はメモリカードなどの補助記憶要素である。入出力インタフェース1100は、コンピュータ1000と周辺デバイス(キーボード、マウス、又はディスプレイ装置など)との間のインタフェースである。ネットワークインタフェース1120は、コンピュータ1000とネットワークとの間のインタフェースである。ネットワークは、LAN(Local Area Network)でもよいし、WAN(Wide Area Network)でもよい。
【0030】
ストレージデバイス1080は、前述したプログラムを格納しうる。プロセッサ1040は、交渉装置2000の各機能構成部を実現するためにそのプログラムを実行する。
【0031】
コンピュータ1000のハードウエア構成は、図3に示される構成に限定されない。
例えば、前述したように、交渉装置2000は複数のコンピュータで実現されうる。この場合、それらのコンピュータは、ネットワークを介して互いに接続されうる。
【0032】
<処理の流れ>
図4は、実施形態1の交渉装置2000によって実行される処理の例示的な流れを示す流れ図である。なお、交渉装置によって実行される処理の流れは、図4に示すものに限定されない。
【0033】
交渉装置2000は、交渉期間が満了したか否かを判定する(S102)。交渉期間が満了した場合(S102:YES)、交渉装置2000は、図4に示す処理を終了する。一方、交渉期間が満了していない場合(S102:NO)、交渉装置2000は、新規オファーを受信したか否かを判定する(S104)。交渉装置2000が新規オファーを受信していない場合(S104:NO)、処理はステップS202に戻る。ステップS102~S104の繰り返し実行は、交渉期間が満了していない限り、交渉装置2000が新規オファーを待つことを意味する。
【0034】
交渉装置2000が新規オファーを受信した場合(S104:YES)、取得部2020は、履歴情報30を取得する(S106)。なお、新規オファーは、現在オファーとして扱われる。予測部2040は、交渉残時間と、現在オファーの提示時間とに基づいて、将来オファーの数の確率分布を生成する(S108)。交渉残時間は、交渉の期限から現在時刻を減算することによって計算することができる。予測部2040は、将来オファーの数の確率分布と、履歴情報30によって示される効用とに基づいて、将来オファーの期待効用を計算する(S110)。
【0035】
判定部2060は、現在オファーの効用と、将来オファーの期待効用とに基づいて、現在オファーを受け入れるか否かを判定する(S112)。判定部2060が、現在オファーを受け入れないと判定した場合には(S112:NO)、処理はステップS102に戻って、交渉を継続する。一方、判定部2060が、現在オファーを受け入れると判定した場合(S112:YES)、図4に示す処理は終了する。
【0036】
<履歴情報30の取得:S106>
取得部2020は、履歴情報30を取得する(S106)。履歴情報30は、現在オファーの提示時間と、交渉装置2000が受信したことのある各オファー(すなわち、過去オファーおよび現在オファー)の効用とを示す。なお、履歴情報30は、過去オファーの提示時間を追加的に示し得る。
【0037】
図5は、履歴情報30の例示的な構造を示す。履歴情報30は、オファー識別子32、提示時間34、および効用36の3つの列を有する。履歴情報は、オファーごとに行を有する。或る行のオファー識別子32は、その行に対応するオファーの識別子(例えば、シーケンス番号)を示す。或る行の提示時間34は、その行に対応するオファーの提示時間、例えば、交渉装置が対応するオファーを受信した時刻を示す。なお、特に明記していない限り、交渉の開始時刻は0に設定されているため、オファーの提示時間は、交渉の開始時刻からオファーが受信された時刻までの時間長に相当する。或る行の効用36は、その行に対応するオファーの効用を示す。例えば、図5に示す履歴情報30の1行目は、オファー001の提示時間および効用が、それぞれt1およびu1であることを示す。
【0038】
なお、オファーの効用は、オファーの1つ以上の内容に基づいて計算される。オファーの内容は、交渉に依存する。相手エージェント10が、交渉装置2000のユーザに製品を売ろうとしていると仮定する。この場合、オファーは、製品の数、製品の価格、製品の配送時間などを含み得る。
【0039】
いくつかの態様では、オファーの効用は、オファーの内容を表す1つ以上の値を取る効用関数を使用して計算され、オファーの効用を表す実数の値を出力する。効用関数は、オファーの内容の各々をスコアに変換し、スコアの加重和をオファーの効用として計算し得る。
【0040】
履歴情報30は、交渉装置2000が現在オファーを受信したときに更新され得る。具体的には、交渉装置2000は、現在オファーの効用を計算し、履歴情報30の新しい情報(例えば、図5に示す表の新しい行)を現在オファーについて生成し、この新しい情報を履歴情報30に追加しうる。
【0041】
履歴情報30の取得方法は様々である。いくつかの態様では、履歴情報30は、取得部2020がそこから履歴情報30を取得することができる態様で、記憶部に事前に記憶される。この場合、取得部2020は、その記憶部にアクセスし、その記憶部から履歴情報30を取得し得る。他の実装形態では、取得部2020は、別のコンピュータから送信されてきた履歴情報30を受信し得る。
【0042】
<将来オファーの効用:S108、S110>
上述したように、予測部2040は、将来オファーの期待効用を計算する(S110)。将来オファーの期待効用は、将来オファーの数に依存し得る。しかし、交渉装置2000と相手エージェント10との交渉において指定されるのが、オファーの最大数ではなく、交渉の最大の長さであるため、将来オファーの数は指定することができない。
【0043】
したがって、予測部2040は、将来の期待効用を以下のように計算しうる。
【数1】
式中、E は、将来オファーの数の条件を伴わない将来オファーの期待効用を表す。k は将来オファーの数を表す。P(k) は、将来オファーの数の確率分布を表す(すなわち、P(k)は、将来オファーの数が k となる確率を表す)。E(k)は、将来オファーの数が k となるという条件下での、将来オファーの期待効用(換言すれば、将来オファーの数が k に固定されている、将来オファーの期待効用)を表す。なお、kmaxは、理論的には+∞となるが、式(1)の計算を実行可能な時間長で終了するために、任意の整数値を kmax に設定し得る。
【0044】
予測部2040は、P(k) および E(k) を取得し、取得したP(k) および E(k) を式(1)に適用することによって、将来オファーの期待効用 E を計算することができる。以下、P(k) および E(k) の求め方の例を説明する。
【0045】
<<将来オファーの数の確率分布>>
予測部2040は、交渉残時間と、現在オファーの提示時間とに基づいて、将来オファーの数の確率分布、すなわち P(k) を生成する(S108)。いくつかの態様では、将来オファーの数の確率分布は、以下のようにモデル化することができる。
【数2】
式中、k は将来オファーの数を表す。P(k) は、k の確率質量関数を表す(すなわち、P(k)は、将来オファーの数が k となる確率を表す)。T は、交渉残時間を表す。c は、現在オファーのインデックスを表す。t_c は、現在時刻の提示時間を表す。
【0046】
以下、式(2)の導入方法について説明する。交渉装置2000が受信する将来オファーの数は、交渉装置2000が将来オファーを受信する頻度に依存し得る。したがって、将来オファーの数の確率分布は、将来オファーが受信される頻度の確率分布に基づいて計算することができる。
【0047】
将来オファーが受信される頻度の確率分布は、以下のようにモデル化することができる。
【数3】
式中、f(λ) は、λの確率密度関数を表す。λは、将来オファーが受信される頻度を表す。
【0048】
確率分布 f(λ) を用いて、将来オファー数の確率分布は、以下のように定式化することができる。
【数4】
【0049】
<<将来オファーの数が決められている将来オファーの効用>>
交渉装置2000は、条件付き効用関数 E(k) を生成する(すなわち、将来オファーの数が k となるという条件下で、将来オファーの期待効用を計算する)。まず、交渉装置2000は、将来オファーの効用の分布を予測する。これは、履歴情報30によって示されるオファーの効用の履歴に基づいて予測され得る。
【0050】
いくつかの態様では、予測部2040は、ガウス過程回帰を使用して将来オファーの効用の分布を予測する。具体的には、予測部2040は、時間的に隣接する効用の各ペアの差分を以下のように計算することができる。
【数5】
式中、i はオファーのインデックスを表す。u_i は、i 回目のオファーの効用を表す。c は、現在オファーのインデックスを表す。
【0051】
そして、予測部2040は、オファーのインデックスと、隣接するオファーの効用の差分とのペア(すなわち、i=1 から c についての (i,Δu_i))を、入力としてガウス過程回帰に適用し、これにより、隣接する将来オファーの効用の差分のガウス分布を求める。具体的には、予測部2040は、隣接する将来オファーの効用の差分のガウス分布の平均と分散のペアを得ることができる。
【0052】
次いで、予測部2040は、平均および分散を以下のように計算することによって、フィーチャーオファーの効用のガウス分布を生成することができる。
【数6】
式中、m_j および (v_j)^2 は、それぞれ、j 回目のオファーの効用のガウス分布の予測平均および分散を表す。Δm_n および Δ(v_n)^2 は、それぞれ、n 回目のオファーと (n+1) 回目のオファーとの効用の差分のガウス分布の予測平均および分散を表す。
【0053】
なお、予測部2040は、隣接オファー間の効用の差分をガウス過程回帰に適用するため、履歴情報30によって示されるオファーの効用をガウス過程回帰に直接適用する場合よりも、より正確に将来オファーの効用を予測することができる。しかしながら、他の実施形態では、予測部2040は、履歴情報30によって示されるオファーの効用をガウス過程回帰に直接適用して、将来オファーの効用のガウス分布を取得してもよい。より具体的には、オファーのインデックスと効用とのペア(すなわち、i=1 から c についての (i, u_i))が入力としてガウス過程回帰に供給され、これにより将来オファーの効用のガウス分布を取得する。なお、u_i は、i 回目のオファーの効用を表す。
【0054】
上記のように予測された将来オファーの効用の分布を用いて、予測部2040は、将来オファー数がk となるという条件の下で、将来オファーの期待効用、すなわち E(k) を計算する。予測部2040は、以下のように E(k) を計算することができる。
【数7】
式中、E(k)_j は、将来オファーの数が k となるという条件下での j 回目のオファーの期待効用を表す。F(x)_j は、j 回目のオファーの効用のガウス分布の切り捨てられた累積分布関数(CDF: cumulative distribution function)を表す。a および b は、それぞれ効用の範囲の最小値および最大値である。したがって、効用を [0,1] に正規化する場合、a および b は、それぞれ、0 および 1 とする。
【0055】
なお、上式(7)の計算時間を短縮するために、予測部2040は、次式を用いて式(7)を計算してもよい。
【数8】
式中、Φおよびφは、それぞれ、標準正規分布の CDF および確率密度関数(PDF: probability density function)を表す。
【0056】
<受け入れの判定:S108>
判定部2060は、現在オファーの効用と、将来オファーの期待効用とに基づいて、現在オファーを受け入れるか否かを判定する(S108)。こうするために、判定部2060は、現在オファーの効用が、将来オファーの期待効用に基づいて定義された「受け入れ閾値」と呼ばれる閾値 Th 以上であるか否かを判定すればよい。判定部2060は、現在オファーが受け入れ閾値以上であるとき、現在オファーを受け入れると判定する。他方では、判定部2060は、現在オファーが受け入れ閾値よりも小さいとき、現在オファーを拒否する(換言すれば、受け入れない)と判定する。
【0057】
いくつかの態様では、判定部2060は、将来オファーの期待効用を受け入れ閾値に設定することができる。他の実装形態では、判定部2040は、将来オファーの期待効用にマージンを加算したものを受け入れ閾値 Th:Th=E+αに設定することができ、式中、E は将来オファーの期待効用であり、αはマージンである。マージンαは、交渉の早期終了の利益に基づいて定義されてもよい。交渉残時間が長いほど、マージンαを大きく定義することができる。これは、交渉装置2000のユーザにとって、効用の観点から現在オファーよりも少しだけ好ましい将来オファーを待つよりも、早く交渉を終える方が有益であり得るからである。
【0058】
<交渉装置2000の出力>
交渉装置2000は、現在オファーに関する判定の結果に基づく情報を出力し得る。以下、この情報を「出力情報」と呼ぶ。出力情報は、現在オファーに対する応答であり得る。この場合、交渉装置2000は、出力情報を相手エージェント10に送信し得る。応答は、現在オファーの受け入れまたは拒否を示す。さらに、応答はカウンタオファーを示すこともできる。なお、受信したオファーに基づいてカウンタオファーを提示する様々な周知の方法があり、それらの方法のうちの1つが交渉装置2000で採用され得る。
【0059】
また、交渉装置2000は、交渉装置2000のユーザの現在オファーに関する判定の結果を通知するための出力情報を出力し得る。この場合、出力情報は、現在オファーが受け入れられたか否か、および将来オファーの期待効用など、ユーザにとって有用な任意の情報を含み得る。
【0060】
出力情報は、様々な方法で出力され得る。いくつかの態様では、交渉装置2000は、出力情報を記憶部に格納することができる。他の実施形態では、交渉装置2000は、出力情報をディスプレイ装置に出力し、出力情報をディスプレイ装置に表示させ得る。他の実施形態では、交渉装置2000は、相手エージェント10または交渉装置2000のユーザのユーザデバイス(例えば、PC またはスマートフォン)などの別のコンピュータに出力情報を送信することができる。
【0061】
実施形態2
<概要>
実施形態2の交渉装置2000は、2つ以上の相手エージェント10と交渉を行う。したがって、交渉装置2000は、複数の相手エージェント10のうちの1つからのオファーを受け入れ、それらの残りからのオファーを拒否することができる。
【0062】
複数の相手エージェント10を扱うために、交渉装置2000は、それぞれ E1、E2、・・・、EA(A は、相手エージェント10の数を表す)で表される、各相手エージェント10に対する将来オファーの期待効用を計算する。なお、本実施形態において、交渉装置2000は、相手エージェント10ごとに履歴情報30を取得する。相手エージェント10の履歴情報30は、相手エージェント10からの現在オファーの提示時間と、交渉装置2000によって受信された相手エージェント10からの各オファーの効用を示す。
【0063】
実施形態2の交渉装置2000は、実施形態1の交渉装置2000と同様に、現在オファーの効用と受け入れ閾値とを比較することにより、現在オファーを受け入れるか否かを判定する。ただし、実施形態2の交渉装置2000が受け入れ閾値を決定する方法は、実施形態2の交渉装置2000が行う方法とは異なる。具体的には、交渉装置2000は、それぞれの相手エージェント10について計算された将来オファーの期待効用の集合、すなわち{E1, E2, ..., EA}に基づいて、受け入れ閾値を決定する。以下、この集合を「期待効用集合」と呼び、S(すなわち、S={E1, E2,..., EA})と表記する。例えば、期待効用集合 S における最大値を受け入れ閾値とし得る。
【0064】
<作用効果の例>
実施形態2の交渉装置2000によれば、複数の相手が存在し、将来オファーの最大数ではなく、交渉の最大時間長が予め決められている交渉において、現在オファーを受け入れるか否かを適切に判定することができる。
【0065】
以下、実施形態2の交渉装置2000のより詳細な説明を記載する。
【0066】
<機能構成例>
実施形態2の交渉装置2000の機能構成は、実施形態1の交渉装置2000と同様に、図2に示すものであり得る。実施形態2の取得部2020は、相手エージェント10ごとに履歴情報30を取得する。各相手エージェント10について、予測部2040は、相手エージェント10からの将来オファーの期待効用を計算する。判定部2060は、それぞれの相手エージェント10からの将来オファーの期待効用に基づいて受け入れ閾値を決定し、現在オファーの効用と受け入れ閾値とに基づいて、現在オファーを受け入れるか否かを判定する。
【0067】
<ハードウェア構成例>
実施形態2の交渉装置2000は、実施形態1の交渉装置2000を実現するものと同様の1つ以上のコンピュータによって実現されてもよい。したがって、そのハードウェア構成も図3に示すものであり得る。しかし、実施形態2のストレージデバイス1080は、コンピュータ1000を実施形態2の交渉装置2000として機能させるためのプログラムを含み得る。
【0068】
<処理の流れ>
図6は、実施形態2の交渉装置2000によって実行される処理の例示的な流れを示す流れ図である。なお、交渉装置によって実行される処理の流れは、図6に示すものに限定されない。
【0069】
交渉装置2000は、期待効用集合を初期化する(S202)。期待効用集合は、各相手エージェントについて0を示すように初期化することができる。そして、実施形態2の交渉装置2000は、実施形態1の交渉装置2000と同様に、交渉期間が満了していない限り、新規オファーを待つ(S204およびS206)。
【0070】
交渉装置2000が新規オファーを受信したと判定されたとき(S206:YES)、予測部2040は、新規オファー(すなわち、現在オファー)を送信してきた相手エージェント10からの将来オファーの期待効用を算出する(S208)。以下、現在オファーを送信してきた相手エージェント10を「現在の相手エージェント」と呼ぶ。予測部2040は、ステップS208で算出された現在の相手エージェントからの将来オファーの期待効用で期待効用集合を更新する(S210)。判定部2060は、ステップS210で更新された期待効用集合を用いて、受け入れ閾値を決定する(S212)。
【0071】
判定部2060は、現在オファーの効用が受け入れ閾値以上である否かを判定する(S214)。判定部2060は、現在オファーの効用が受け入れ閾値以上である場合(S214:YES)、現在オファーを受け入れると判定する(S218)。したがって、図6に示す処理は終了する。他方では、判定部2060は、現在オファーの効用が受け入れ閾値以上ではない場合(S214:NO)、現在オファーを拒否すると判定する(S216)。したがって、図6に示す処理は、S204に戻り、交渉を継続する。
【0072】
<将来オファーの期待効用の計算:S208>
交渉装置2000が新規オファーを受信したこと応じて、予測部2040は、現在の相手エージェントからの将来オファーの期待効用を計算する(S208)。こうするために、取得部2020は、現在の相手エージェントの履歴情報30を取得する。次いで、予測部2040は、交渉残時間と、現在オファーの提示時間とに基づいて、式(1)における P(k) に対応する、現在の相手エージェントからの将来オファーの数の確率分布を生成する。相手エージェント10からの将来オファーの数の確率分布を生成する具体的な方法は、実施形態1で既に説明されている。
【0073】
予測部2040はまた、現在の相手エージェントの履歴情報30によって示される効用に基づいて、将来オファーの数(式(1)の E(k) に対応)が与えられている場合における、現在の相手エージェントからの将来オファーの期待効用を算出する。将来オファーの数が与えられた場合において、相手エージェントからの将来オファーの期待効用を計算する具体的な方法は、実施形態1で既に説明されている。
【0074】
そして、予測部2040は、将来オファーの数が与えられた場合の現在の相手エージェントからの将来オファーの期待効用と、現在の相手エージェントからの将来オファーの数の確率分布とに基づいて、将来オファーの数(式(1)の E に対応)の条件無しに、現在の相手エージェントからの将来オファーの期待効用を計算する。換言すれば、予測部2040は、式(1)に現在の相手エージェントの P(k) および E(k) を適用して、現在の相手エージェントの期待効用 E を計算する。
【0075】
<期待効用集合の更新:S210>
予測部2040は、現在の相手エージェントからの将来オファーの期待効用で期待効用集合を更新する。期待効用集合 S の要素 S[i] が、識別子 i を有する相手エージェント10からの将来オファーの期待効用を表し、現在の相手エージェントが識別子 j を有すると仮定する。この場合、予測部2040は、ステップS208で算出された現在の相手エージェントからの将来オファーの期待効用で S[j] を更新する。
【0076】
<受け入れ閾値の決定:S212>
判定部2060は、期待効用集合を用いて、受け入れ閾値を決定する。基本的に、期待効用集合が、現在オファーの効用よりも大きい値を含む場合、交渉装置2000にとって、交渉装置2000が現在よりも好ましいオファーを受けることが期待されるため、現在オファーを受け入れない方が好ましい。
【0077】
したがって、いくつかの態様では、交渉装置2000は、期待効用集合 S 内の最大値を受け入れ閾値に設定しうる。この場合、交渉装置2000は、現在オファーの効用が、現在の相手エージェント10からの将来オファーのすべての期待効用以上であるときのみ、現在オファーを受け入れると判定する。
【0078】
他の実施形態では、実施形態1と同様に、実施形態2の交渉装置2000は、受け入れ閾値にマージンを含めることができる。具体的に、判定部2040は、期待効用集合内の最大値にマージンを加算したものを受け入れ閾値 Th:Th=EL+αに設定することができ、式中、EL は期待効用集合内の最大値であり、αはマージンである。
【0079】
<交渉の終了>
交渉装置2000は、現在オファーを受け入れると、複数の相手エージェント10との交渉を終了する。例えば、交渉装置2000は、各相手エージェント10の交渉の終了を通知する。現在の相手エージェントに関しては、交渉装置2000は、現在オファーの受け入れを示す応答を送信することができる。この応答はまた、交渉の終了を意味することもできる。
【0080】
実施の形態を参照して本開示を説明したが、本開示は上述の実施の形態に限定されるものではない。本開示の構成や詳細には、本開示のスコープ内で当業者が理解し得る様々な変更をすることができる。
【0081】
本開示におけるプログラムは、コンピュータに読み込まれた場合に、実施形態で説明された1又はそれ以上の機能をコンピュータに行わせるための命令群(又はソフトウェアコード)を含む。プログラムは、非一時的なコンピュータ可読媒体又は実体のある記憶媒体に格納されてもよい。限定ではなく例として、コンピュータ可読媒体又は実体のある記憶媒体は、random-access memory(RAM)、read-only memory(ROM)、フラッシュメモリ、solid-state drive(SSD)又はその他のメモリ技術、CD-ROM、digital versatile disc(DVD)、Blu-ray(登録商標)ディスク又はその他の光ディスクストレージ、磁気カセット、磁気テープ、磁気ディスクストレージ又はその他の磁気ストレージデバイスを含む。プログラムは、一時的なコンピュータ可読媒体又は通信媒体上で送信されてもよい。限定ではなく例として、一時的なコンピュータ可読媒体又は通信媒体は、電気的、光学的、音響的、またはその他の形式の伝搬信号を含む。
【0082】
本出願は、2021年12月28日に出願された日本出願特願2021-214132号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
【符号の説明】
【0083】
10 相手エージェント
30 履歴情報
32 オファー識別子
34 提示時間
36 効用
1000 コンピュータ
1020 バス
1040 プロセッサ
1060 メモリ
1080 ストレージデバイス
1100 入出力インタフェース
1120 ネットワークインタフェース
2000 交渉装置
2020 取得部
2040 予測部
2060 判定部
図1
図2
図3
図4
図5
図6
【手続補正書】
【提出日】2024-06-20
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
間の最大時間長が予め決められている交渉において、相手からの現在のオファーの提示時間と、前記交渉において受信したことのある前記相手からの各オファーの効用とを示す履歴情報を取得し、
前記交渉の残り期間の時間長と、前記現在のオファーの前記提示時間とに基づいて、将来のオファーの数の確率分布を生成し、
前記将来のオファーの数の前記確率分布と、前記履歴情報によって示される前記効用とに基づいて、将来のオファーの期待効用を計算し、
前記将来のオファーの期待効用と、前記現在のオファーの前記効用とに基づいて、前記現在のオファーを受け入れるか否かを判定する、交渉装置。
【請求項2】
前記将来のオファーの数の前記確率分布の前記生成は、前記交渉の前記残り期間の前記時間長と、前記現在のオファーの前記提示時間とを、前記将来のオファーの数の前記確率分布の予め定義されたモデルのパラメータに適用することを含む、請求項1に記載の交渉装置。
【請求項3】
前記将来のオファーの期待効用の前記計算は、
前記将来のオファーの数を入力とし、前記将来のオファーの数が前記入力によって表されるという条件で前記将来のオファーの期待効用が出力される条件付き期待効用関数を生成することと、
前記条件付き期待効用関数と、前記将来のオファーの数の前記確率分布とに基づいて、前記将来のオファーの期待効用を計算することと、を含む、請求項1または2に記載の交渉装置。
【請求項4】
前記条件付き期待効用関数の前記生成は、
前記履歴情報によって示される時間的に互いに隣接する前記効用の各ペアに対して、前記効用の差分を計算することと、
前記効用の前記計算された差分をガウス過程回帰に適用して、前記将来のオファーにおける効用の差分のガウス分布を取得することと、
前記将来のオファーにおける効用の差分の前記ガウス分布に基づいて、各前記将来のオファーの期待効用を計算することと、を含む、請求項3に記載の交渉装置。
【請求項5】
前記交渉は、複数の前記相手との間で行われ、
前記将来のオファーの期待効用は、前記相手の各々について計算され、
前記現在のオファーを受け入れるか否かの前記判定は、
前記将来のオファーの期待効用の最大値を用いて受け入れ閾値を決定することと、
前記現在のオファーの前記効用が前記受け入れ閾値以上である場合に、前記現在のオファーを受け入れると判定することと、を含む、請求項1から4のいずれか一項に記載の交渉装置。
【請求項6】
間の最大時間長が予め決められている交渉において、前記交渉の複数の相手の各々について、前記交渉において受信したことのある前記相手からの各オファーの効用を示す履歴情報を取得し、
前記複数の前記相手の各々について、前記相手の前記履歴情報によって示される前記効用に基づいて、前記相手からの将来のオファーの期待効用を計算し、
前記将来のオファーの期待効用の最大値を用いて受け入れ閾値を決定し、
現在のオファーの前記効用と、前記受け入れ閾値とに基づいて、前記現在のオファーを受け入れるか否かを判定する、交渉装置。
【請求項7】
期間の最大時間長が予め決められている交渉において、相手からの現在のオファーの提示時間と、前記交渉において受信したことのある前記相手からの各オファーの効用とを示す履歴情報を取得することと、
前記交渉の残り期間の時間長と、前記現在のオファーの前記提示時間とに基づいて、将来のオファーの数の確率分布を生成することと、
前記将来のオファーの数の前記確率分布と、前記履歴情報によって示される前記効用とに基づいて、将来のオファーの期待効用を計算することと、
前記将来のオファーの期待効用と、前記現在のオファーの前記効用とに基づいて、前記現在のオファーを受け入れるか否かを判定することと、を含む、コンピュータによって実行される交渉方法。
【請求項8】
期間の最大時間長が予め決められている交渉において、前記交渉の複数の相手の各々について、前記交渉において受信したことのある前記相手からの各オファーの効用を示す履歴情報を取得することと、
前記複数の前記相手の各々について、前記相手の前記履歴情報によって示される前記効用に基づいて、前記相手からの将来のオファーの期待効用を計算することと、
前記将来のオファーの期待効用の最大値を用いて受け入れ閾値を決定することと、
現在のオファーの前記効用と、前記受け入れ閾値とに基づいて、前記現在のオファーを受け入れるか否かを判定することと、を含む、コンピュータによって実行される交渉方法。
【請求項9】
期間の最大時間長が予め決められている交渉において、相手からの現在のオファーの提示時間と、前記交渉において受信したことのある前記相手からの各オファーの効用とを示す履歴情報を取得することと、
前記交渉の残り期間の時間長と、前記現在のオファーの前記提示時間とに基づいて、将来のオファーの数の確率分布を生成することと、
前記将来のオファーの数の前記確率分布と、前記履歴情報によって示される前記効用とに基づいて、将来のオファーの期待効用を計算することと、
前記将来のオファーの期待効用と、前記現在のオファーの前記効用とに基づいて、前記現在のオファーを受け入れるか否かを判定することと、をコンピュータに実行させるプログラム。
【請求項10】
期間の最大時間長が予め決められている交渉において、前記交渉の複数の相手の各々について、前記交渉において受信したことのある前記相手からの各オファーの効用を示す履歴情報を取得することと、
前記複数の前記相手の各々について、前記相手の前記履歴情報によって示される前記効用に基づいて、前記相手からの将来のオファーの期待効用を計算することと、
前記将来のオファーの期待効用の最大値を用いて受け入れ閾値を決定することと、
現在のオファーの前記効用と、前記受け入れ閾値とに基づいて、前記現在のオファーを受け入れるか否かを判定することと、をコンピュータに実行させるプログラム。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0045
【補正方法】変更
【補正の内容】
【0045】
<<将来オファーの数の確率分布>>
予測部2040は、交渉残時間と、現在オファーの提示時間とに基づいて、将来オファーの数の確率分布、すなわち P(k) を生成する(S108)。いくつかの態様では、将来オファーの数の確率分布は、以下のようにモデル化することができる。
【数2】
式中、k は将来オファーの数を表す。P(k) は、k の確率質量関数を表す(すなわち、P(k)は、将来オファーの数が k となる確率を表す)。T は、交渉残時間を表す。c は、現在オファーのインデックスを表す。t_c は、現在オファーの提示時間を表す。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0057
【補正方法】変更
【補正の内容】
【0057】
いくつかの態様では、判定部2060は、将来オファーの期待効用を受け入れ閾値に設定することができる。他の実装形態では、判定部200は、将来オファーの期待効用にマージンを加算したものを受け入れ閾値 Th:Th=E+αに設定することができ、式中、E は将来オファーの期待効用であり、αはマージンである。マージンαは、交渉の早期終了の利益に基づいて定義されてもよい。交渉残時間が長いほど、マージンαを大きく定義することができる。これは、交渉装置2000のユーザにとって、効用の観点から現在オファーよりも少しだけ好ましい将来オファーを待つよりも、早く交渉を終える方が有益であり得るからである。
【手続補正5】
【補正対象書類名】明細書
【補正対象項目名】0063
【補正方法】変更
【補正の内容】
【0063】
実施形態2の交渉装置2000は、実施形態1の交渉装置2000と同様に、現在オファーの効用と受け入れ閾値とを比較することにより、現在オファーを受け入れるか否かを判定する。ただし、実施形態2の交渉装置2000が受け入れ閾値を決定する方法は、実施形態の交渉装置2000が行う方法とは異なる。具体的には、交渉装置2000は、それぞれの相手エージェント10について計算された将来オファーの期待効用の集合、すなわち{E1, E2, ..., EA}に基づいて、受け入れ閾値を決定する。以下、この集合を「期待効用集合」と呼び、S(すなわち、S={E1, E2,..., EA})と表記する。例えば、期待効用集合 S における最大値を受け入れ閾値とし得る。
【手続補正6】
【補正対象書類名】明細書
【補正対象項目名】0078
【補正方法】変更
【補正の内容】
【0078】
他の実施形態では、実施形態1と同様に、実施形態2の交渉装置2000は、受け入れ閾値にマージンを含めることができる。具体的に、判定部200は、期待効用集合内の最大値にマージンを加算したものを受け入れ閾値 Th:Th=EL+αに設定することができ、式中、EL は期待効用集合内の最大値であり、αはマージンである。
【国際調査報告】