特開2024-128782 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立製作所の特許一覧

特開2024-128782調停システム、調停方法、及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024128782

(43)【公開日】2024-09-24

(54)【発明の名称】調停システム、調停方法、及びプログラム

(51)【国際特許分類】

G06Q 50/04 20120101AFI20240913BHJP

【ＦＩ】

G06Q50/04

【審査請求】未請求

【請求項の数】9

【出願形態】ＯＬ

(21)【出願番号】P 2023037982

(22)【出願日】2023-03-10

(71)【出願人】

【識別番号】000005108

【氏名又は名称】株式会社日立製作所

(74)【代理人】

【識別番号】110002365

【氏名又は名称】弁理士法人サンネクスト国際特許事務所

(72)【発明者】

【氏名】赤塚駿一

(72)【発明者】

【氏名】寺本やえみ

【テーマコード（参考）】

5L049

5L050

【Ｆターム（参考）】

5L049CC04

5L050CC04

(57)【要約】

【課題】
個々が独立して自身の行動を決定する複数の個別システムに対し、各個別システムの行動の変容を考慮した調停案を生成する。
【解決手段】
複数の個別システム２は、個々が独立して個別の重要業績評価指標が高まるように自身の行動を決定し、調停システム１は、各個別システム２の行動を推定する模擬モデル１０２と、模擬モデル１０２の時系列変化に基づいて各個別システム２の行動の変容を推定する学習モデル１０４と、を生成するモデル生成モジュール１０７と、模擬モデル１０２及び学習モデル１０４を用いて、個別システム２の行動の決定に関わる所定要因の個別システム２間での譲渡を提案する調停案を生成して個別システム２に提示する調停案探索モジュール１１０と、を備える。
【選択図】図１

【特許請求の範囲】

【請求項1】

個々が独立して個別の重要業績評価指標が高まるように自身の行動を決定する複数の個別システムに対して前記行動に関連する調停案を提示する調停システムであって、
各前記個別システムの行動を推定する模擬モデルと、前記模擬モデルの時系列変化に基づいて各前記個別システムの行動の変容を推定する学習モデルと、を生成するモデル生成モジュールと、
前記模擬モデル及び前記学習モデルを用いて、前記行動の決定に関わる所定要因の前記個別システム間での譲渡を提案する調停案を生成して前記個別システムに提示する調停案探索モジュールと、
を備えることを特徴とする調停システム。

【請求項2】

前記調停案探索モジュールは、前記調停案の生成において、前記複数の個別システムを包括する全体システムにおいて前記個別の重要業績評価指標とは異なる全体の重要業績評価指標が高まるように前記調停案を算出する
ことを特徴とする請求項１に記載の調停システム。

【請求項3】

前記調停案探索モジュールは、
調停案生成パラメータと、
前記模擬モデル、前記学習モデル、及び前記調停案生成パラメータを用いて、前記調停案を生成する調停案生成部と、
前記調停案生成部が生成した調停案を評価する調停案評価部と、
を有し、
前記調停案評価部は、前記調停案の評価値として、各前記個別システムにおける前記個別の重要業績評価指標と、前記全体システムにおける前記全体の重要業績評価指標と、各前記個別システムにおける前記調停案に対する協力の度合いを評価する協力度合いの評価値と、を算出する
ことを特徴とする請求項２に記載の調停システム。

【請求項4】

現在時点から所定の将来時点までの所定期間について、各前記個別システムが前記行動を決定する所定周期を単位として、前記モデル生成モジュールによる前記模擬モデル及び前記学習モデルの生成と、前記調停案探索モジュールによる前記調停案の生成と、を繰り返し実行し、
前記調停案評価部は、前記繰り返しのなかで算出した前記個別の重要業績評価指標と、前記全体の重要業績評価指標と、前記協力度合いの評価値とに基づいて、前記調停案の前記所定期間に亘る最終的な評価値を算出する
ことを特徴とする請求項３に記載の調停システム。

【請求項5】

前記調停案探索モジュールは、
前記調停案生成パラメータを更新しながら、前記調停案生成部による前記調停案の生成と、前記調停案評価部による前記調停案の評価と、を繰り返し実行し、
前記調停案評価部によって算出された前記調停案の最終的な評価値に含まれる前記協力度合いの評価値が所定の閾値以上となった場合に、当該調停案を前記個別システムに提示する調停案に決定する
ことを特徴とする請求項４に記載の調停システム。

【請求項6】

各前記個別システムの行動が製品の生産である場合に、
前記調停案探索モジュールは、各前記個別システムに提示する前記調停案において、前記個別システム自身が受注した注文を他の個別システムに譲渡する譲渡量を提案する
ことを特徴とする請求項１に記載の調停システム。

【請求項7】

前記調停案探索モジュールは、前記個別システム自身が受注した注文の生産コストよりも、他の個別システムから譲渡された注文の生産コストを高く設定した条件下で、前記調停案を生成する
ことを特徴とする請求項６に記載の調停システム。

【請求項8】

個々が独立して個別の重要業績評価指標が高まるように自身の行動を決定する複数の個別システムに対して前記行動に関連する調停案を提示する調停システムによる調停方法であって、
前記調停システムが、各前記個別システムの行動を推定する模擬モデルと、前記模擬モデルの時系列変化に基づいて各前記個別システムの行動の変容を推定する学習モデルと、を生成するモデル生成ステップと、
前記調停システムが、前記模擬モデル及び前記学習モデルを用いて、前記行動の決定に関わる所定要因の前記個別システム間での譲渡を提案する調停案を生成して前記個別システムに提示する調停案探索ステップと、
を備えることを特徴とする調停方法。

【請求項9】

個々が独立して個別の重要業績評価指標が高まるように自身の行動を決定する複数の個別システムに対して前記行動に関連する調停案を提示する調停システムで実行されるプログラムであって、
各前記個別システムの行動を推定する模擬モデルと、前記模擬モデルの時系列変化に基づいて各前記個別システムの行動の変容を推定する学習モデルと、を生成するモデル生成処理と、
前記模擬モデル及び前記学習モデルを用いて、前記行動の決定に関わる所定要因の前記個別システム間での譲渡を提案する調停案を生成し、前記個別システムに出力する調停案生成処理と、
を実行することを特徴とするプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、調停システム、調停方法、及びプログラムに関し、独立した複数の個別システムに対して調停案を生成する調停システム、調停方法、及びプログラムに適用して好適なものである。

【背景技術】

【0002】

サプライチェーンやモビリティシステムのような巨大な社会システムは、複数の独立したシステムによって構成されており、各システムは自身の目的を達成するために行動を取っている。このとき、各システムが自身の目的を達成しようとした結果、全体として最適とは異なる状態になることがある。この結果、システムの機能が低下したり、各個別システムの収益性が悪化したりする。このような状況では、外部に調停役を置き、情報の共有や行動に対する提案または指示を通じて、全体として最適な全体最適に導くことが求められる。

【0003】

一方で、昨今は人工知能や機械学習技術を取り入れたシステムも多く、これらのシステムは、調停や行動の経験から学習することで、以降の行動が変容する。このような人工知能や機械学習技術を取り入れたシステムにおいて各システムの行動を全体最適に導くためには、個別システムの行動変容を考慮して調停案を生成する必要がある。

【0004】

複数の個別システムを協調させる目的で調停する技術として、例えば特許文献１には、サプライチェーンを構成する第１の企業と、前記第１の企業の前記サプライチェーンを構成する第２の企業の状態に応じた行動ロジックとを対応付けた行動ルール情報の複数のパターンを生成する行動ルールパターン生成ステップと、複数のパターンの前記行動ルール情報のそれぞれにおいて、前記サプライチェーンの全体における重要業績評価指標を算出するシミュレーションステップと、前記重要業績評価指標に基づいて、前記サプライチェーンに適用する前記行動ルール情報を選択する最適行動ルール選択ステップと、を含むことを特徴とする行動ルール生成方法が開示されている。

【先行技術文献】

【特許文献】

【0005】

【特許文献1】特開２０１６－２０７０１７号公報

【発明の概要】

【発明が解決しようとする課題】

【0006】

複数の独立したシステム（個別システム）が個別の重要業績評価指標（ＫＰＩ：Key Performance Indicator）を最大化するために行動をするようなシステムに対し、個別ＫＰＩとは異なる全体ＫＰＩを大きくするように各個別システムの行動を誘導するための方法として、調停案を提示する調停システムを個別システムの外部に配置する方法が考えられる。ここで、調停システムによる調停を受けた結果、個別システムが学習し、その後の行動パターンが変化することが想定される。しかし、上述した特許文献１の行動ルール生成方法を含む既存技術では、調停案の提示によってそれぞれの個別システムが変化し得ることを考慮できておらず、結果として、調停システムが複数の個別システムを適切な協力関係に誘導することができない可能性があった。

【0007】

本発明は以上の点を考慮してなされたもので、個々が独立して自身の行動を決定する複数の個別システムに対し、各個別システムの行動の変容を考慮した調停案を生成することが可能な調停システム、調停方法、及びプログラムを提案しようとするものである。

【課題を解決するための手段】

【0008】

かかる課題を解決するため本発明においては、個々が独立して個別の重要業績評価指標が高まるように自身の行動を決定する複数の個別システムに対して前記行動に関連する調停案を提示する調停システムであって、各前記個別システムの行動を推定する模擬モデルと、前記模擬モデルの時系列変化に基づいて各前記個別システムの行動の変容を推定する学習モデルと、を生成するモデル生成モジュールと、前記模擬モデル及び前記学習モデルを用いて、前記行動の決定に関わる所定要因の前記個別システム間での譲渡を提案する調停案を生成して前記個別システムに提示する調停案探索モジュールと、を備えることを特徴とする調停システムが提供される。

【0009】

また、かかる課題を解決するため本発明においては、個々が独立して個別の重要業績評価指標が高まるように自身の行動を決定する複数の個別システムに対して前記行動に関連する調停案を提示する調停システムによる調停方法であって、前記調停システムが、各前記個別システムの行動を推定する模擬モデルと、前記模擬モデルの時系列変化に基づいて各前記個別システムの行動の変容を推定する学習モデルと、を生成するモデル生成ステップと、前記調停システムが、前記模擬モデル及び前記学習モデルを用いて、前記行動の決定に関わる所定要因の前記個別システム間での譲渡を提案する調停案を生成して前記個別システムに提示する調停案探索ステップと、を備えることを特徴とする調停方法が提供される。

【0010】

また、かかる課題を解決するため本発明においては、個々が独立して個別の重要業績評価指標が高まるように自身の行動を決定する複数の個別システムに対して前記行動に関連する調停案を提示する調停システムで実行されるプログラムであって、各前記個別システムの行動を推定する模擬モデルと、前記模擬モデルの時系列変化に基づいて各前記個別システムの行動の変容を推定する学習モデルと、を生成するモデル生成処理と、前記模擬モデル及び前記学習モデルを用いて、前記行動の決定に関わる所定要因の前記個別システム間での譲渡を提案する調停案を生成し、前記個別システムに出力する調停案生成処理と、を実行することを特徴とするプログラムが提供される。

【発明の効果】

【0011】

本発明によれば、個々が独立して自身の行動を決定する複数の個別システムに対し、各個別システムの行動の変容を考慮した調停案を生成することができる。

【図面の簡単な説明】

【0012】

【図1】本発明の一実施形態に係る調停システム１を含む全体システムの構成例を示すブロック図である。

【図2】調停システム処理の処理手順例を示すフローチャートである。

【図3】個別システム処理の処理手順例を示すフローチャートである。

【図4】模擬モデル用データベース１０１に保存されるデータの一例を示した図である。

【図5】学習モデル用データベース１０３に保存されるデータの一例を示した図である。

【図6】調停案生成処理の処理手順例を示すフローチャートである。

【図7】調停案評価処理の処理手順例を示すフローチャートである。

【図8】個別システム２における生産コストの構造例を示すグラフである。

【図9】模擬モデル用データベース１０１に保存されるデータの具体例を説明するグラフである。

【図10】個別システム２における生産状況に対する調停案の一例を説明するためのグラフである。

【図11】個別システム２における生産状況に対する調停案の別例を説明するためのグラフである。

【発明を実施するための形態】

【0013】

以下、図面を参照して、本発明の実施形態を詳述する。以下の説明において、プログラムはプロセッサに所定の処理を実行させるが、説明の便宜上、プログラムを実行主体として説明する場合がある。

【0014】

なお、以下の記載及び図面は、本発明を説明するための例示であって、説明の明確化のため、適宜、省略及び簡略化がなされている。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。本発明が実施形態に制限されることは無く、本発明の思想に合致するあらゆる応用例が本発明の技術的範囲に含まれる。本発明は、当業者であれば本発明の範囲内で様々な追加や変更等を行うことができる。本発明は、他の種々の形態でも実施する事が可能である。特に限定しない限り、各構成要素は複数でも単数でも構わない。

【0015】

以下の説明では、「テーブル」、「表」、「リスト」、「キュー」等の表現にて各種情報を説明することがあるが、各種情報は、これら以外のデータ構造で表現されていてもよい。データ構造に依存しないことを示すために「ＸＸテーブル」、「ＸＸリスト」等を「ＸＸ情報」と呼ぶことがある。各情報の内容を説明する際に、「識別情報」、「識別子」、「名」、「ＩＤ」、「番号」等の表現を用いるが、これらについてはお互いに置換が可能である。

【0016】

また、以下の説明では、プログラムを実行して行う処理を説明する場合があるが、プログラムは、少なくとも１以上のプロセッサ（例えばＣＰＵ）によって実行されることで、定められた処理を、適宜に記憶資源（例えばメモリ）及び／又はインターフェースデバイス（例えば通信ポート）等を用いながら行うため、処理の主体がプロセッサとされてもよい。同様に、プログラムを実行して行う処理の主体が、プロセッサを有するコントローラ、装置、システム、計算機、ノード、ストレージシステム、ストレージ装置、サーバ、管理計算機、クライアント、又は、ホストであってもよい。また、プログラムを実行して行う処理の主体（例えばプロセッサ）は、処理の一部又は全部を行うハードウェア回路を含んでもよい。例えば、プログラムを実行して行う処理の主体は、暗号化及び復号化、又は圧縮及び伸張を実行するハードウェア回路を含んでもよい。プロセッサは、プログラムに従って動作することによって、所定の機能を実現する機能部として動作する。プロセッサを含む装置及びシステムは、これらの機能部を含む装置及びシステムである。

【0017】

プログラムは、プログラムソースから計算機のような装置にインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバ又は計算機が読み取り可能な非一時的な記憶メディアであってもよい。プログラムソースがプログラム配布サーバの場合、プログラム配布サーバはプロセッサ（例えばＣＰＵ）と非一時的な記憶資源とを含み、記憶資源はさらに配布プログラムと配布対象であるプログラムとを記憶してよい。そして、プログラム配布サーバのプロセッサが配布プログラムを実行することで、プログラム配布サーバのプロセッサは配布対象のプログラムを他の計算機に配布してよい。また、以下の説明において、２以上のプログラムが１つのプログラムとして実現されてもよいし、１つのプログラムが２以上のプログラムとして実現されてもよい。

【0018】

また、以下の説明では、同種の要素を区別せずに説明する場合には、添字や枝番を含む参照符号のうちの共通部分（添字や枝番を除く部分）を使用し、同種の要素を区別して説明する場合には、添字や枝番を含む参照符号を使用することがある。具体的には例えば、「模擬モデル」を特に区別せずに説明する場合には「模擬モデル１０２」と記載するのに対して、個々の模擬モデル１０２を区別して説明する場合には「模擬モデル１０２－１」、「模擬モデル１０２－２」、・・・「模擬モデル１０２－Ｎ」のように記載することがある。また、図示等において同種の要素を区別して記載する他の方法として、「模擬モデル＃１」、「模擬モデル＃２」、・・・、「模擬モデル＃Ｎ」のように表記することもある。

【0019】

（１）システム構成
図１は、本発明の一実施形態に係る調停システム１を含む全体システムの構成例を示すブロック図である。図１に示す全体システムは、独立した複数の個別システム２（個別システム２－１～２－Ｎ）と、これらの個別システム２に対して調停案を提示する機能を有する調停システム１とが、通信システム（ネットワーク）３で接続されて構成される。

【0020】

本実施形態では、それぞれの個別システム２は同様のハードウェア構成と機能を有するものとし、以下では図１に示した個別システム＃１（個別システム２－１）を中心に、個別システム２の構成例を説明する。但し、これは、複数の個別システム２において、それぞれのシステムが異なるハードウェア構成または機能を有することを制限するものではない。

【0021】

各個別システム２（個別には、個別システム２－１～２－Ｎ）を運用する事業者（個別システムごとに異なる事業者と考えてよい）は、それぞれ顧客から注文を受注して製品を製造し、納入する事業者である。各事業者は、所定期間ごとに（例えば週に一度）、それぞれの個別システム２－１～２－Ｎを用いて、自システムにおける生産状況や受注見積もりの情報を集約し、翌週の生産数を決定する。また、各事業者は、受注状況に応じて、自身への注文の少なくとも一部を別の事業者に譲渡することができる。

【0022】

調停システム１は、複数の個別システム２から上記の所定期間ごとに情報を収集し、それぞれの個別システム２に対して、別の個別システム２に譲渡する注文の数を調停案として提案する機能を有する。そして各個別システム２は、調停システム１から提案された調停案に基づいて、実際に注文をいくつ譲渡するかを判断する。調停システム１による処理の流れは図２を参照しながら後述し、個別システム２による処理の流れは図３を参照しながら後述する。

【0023】

以下に、図１に示した調停システム１及び個別システム２の内部構成について詳しく説明する。

【0024】

（１－１）調停システム１
調停システム１は、複数の独立した個別システム２に対する調停案（本説明では譲渡する注文数）を生成し提示する機能を有するシステムである。調停システム１は、ハードウェアとして、記憶装置１０と、入力装置１１と、出力装置１２と、プロセッサ１３と、メモリ１４と、それらを接続するバス１５と、を有する。

【0025】

入力装置１１は、データの入力を受け付ける装置である。入力装置１１は、具体的には例えば、キーボード、マウス、タッチパネル、テンキー、スキャナ、マイク、センサ、または通信インタフェイス等である。出力装置１２は、データを出力する装置である。出力装置１２は、具体的には例えば、ディスプレイ、プリンタ、スピーカ、または通信インタフェイス等である。

【0026】

プロセッサ１３は、調停システム１を制御するプロセッサであって、具体的には例えばＣＰＵ（Central Processing Unit）である。プロセッサ１３は、記憶装置１０に記憶されたプログラムをメモリ１４に読み出して実行する。メモリ１４は、プロセッサ１３の作業エリアとなり、例えば、ＲＡＭ（Random Access Memory）である。

【0027】

記憶装置１０は、調停システム１で実行されるプログラムや、当該プログラムの実行の際に利用されるデータなどを記憶する。記憶装置１０は、例えば、調停システム１の装置に搭載されるＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）等の記憶装置であるが、これに限定されず、記憶装置１０が記憶するデータなどの少なくとも一部が、調停システム１の装置に外部接続された記録媒体や、ネットワーク３を経由して調停システム１に接続されるクラウド環境等に保持される構成であってもよい。

【0028】

図１に示したように、記憶装置１０には、模擬モデル用データベース１０１、模擬モデル１０２、学習モデル用データベース１０３、学習モデル１０４、環境モデル１０５、入出力プログラム１０６、モデル生成モジュール１０７、及び調停案探索モジュール１１０が記憶される。

【0029】

模擬モデル用データベース１０１は、模擬モデル１０２を生成するために必要な情報を保存するためのデータ領域である。詳細は図４を参照しながら後述するが、模擬モデル用データベース１０１は、過去に各個別システム２に送信した情報や、過去に各個別システム２から受信した情報等を保存する。

【0030】

模擬モデル１０２は、各個別システム２が出力する注文譲渡数を予測する機能を有する推論モデルである。模擬モデル１０２は、例えばニューラルネットワークで実装された関数近似プログラムである。

【0031】

学習モデル用データベース１０３は、学習モデル１０４を生成するために必要な情報を保存するためのデータ領域である。詳細は図５を参照しながら後述するが、学習モデル用データベース１０３は、例えば過去時点から現在に至るまでの模擬モデル１０２のパラメータを保存する。

【0032】

学習モデル１０４は、模擬モデル１０２がどのように変化するかを予測する機能を有する推論モデルである。学習モデル１０４は、例えばニューラルネットワークで実装された関数近似プログラムである。より具体的に説明すると、個別システム＃１の事業者＃１（不図示）に対応する学習モデル＃１（学習モデル１０４－１）は、模擬モデル＃１のパラメータと事業者＃１（個別システム＃１と読み替えてもよい）に与える調停案のパラメータとを基に、次の時点での模擬モデルのパラメータを予測するプログラムである。

【0033】

環境モデル１０５は、個別システム２が自システムの外部から取得する情報を予測するモデルである。環境モデル１０５は、例えば、各個別システム２における他の個別システム２からの次回（例えば翌週）の受注数を予測するプログラムである。

【0034】

入出力プログラム１０６は、入力装置１１を用いてデータを受信し、出力装置１２を用いてデータを送信する機能を持つプログラムである。

【0035】

モデル生成モジュール１０７は、模擬モデル１０２及び学習モデル１０４を生成するプログラムを含むモジュールである。モデル生成モジュール１０７は、模擬モデル用データベース１０１に保存されているデータを用いて模擬モデル１０２を生成する模擬モデル生成プログラム１０８と、学習モデル用データベース１０３に保存されているデータを用いて学習モデル１０４を生成する学習モデル生成プログラム１０９と、を有する。

【0036】

調停案探索モジュール１１０は、個別システム２に出力する調停案を決定するプログラムである。調停案探索モジュール１１０は、調停案生成パラメータ１１１と、調停案生成プログラム１１２と、調停案評価プログラム１１３と、を有する。調停案生成パラメータ１１１は、調停案生成プログラム１１２が調停案を生成する際に用いる関数のパラメータである。調停案生成プログラム１１２は、模擬モデル１０２、学習モデル１０４、及び調停案生成パラメータ１１１を用いて調停案を生成する機能を持つプログラムである。調停案生成プログラム１１２が行う調停案生成処理の詳細は、図６を参照しながら後述する。調停案評価プログラム１１３は、調停案生成プログラム１１２が生成した調停案を評価するプログラムである。調停案評価プログラム１１３が行う調停案評価処理の詳細は、図７を参照しながら後述する。

【0037】

（１－２）個別システム２
個別システム２は、ハードウェアとして、記憶装置２０と、入力装置２１と、出力装置２２と、プロセッサ２３と、メモリ２４と、バス２５と、を有する。それぞれのハードウェアの機能及び具体例は、調停システム１のハードウェア構成の説明で上述したものと同様である。本実施形態で示す全体システムにおいては、同様の構成を有するＮ個の個別システム２が、通信システム（ネットワーク）３を介して調停システム１と接続される。

【0038】

記憶装置２０には、個別システム２で実行されるプログラムや当該プログラムの実行の際に利用されるデータ等として、入出力プログラム２０１、行動決定プログラム２０２、行動決定パラメータ２０３、パラメータ更新プログラム２０４、及びデータベース２０５、が記憶される。

【0039】

入出力プログラム２０１は、入力装置２１を用いてデータを受信し、出力装置２２を用いてデータを送信する機能を持つプログラムである。

【0040】

行動決定プログラム２０２は、現在の生産状況、現在の受注状況、及び調停システム１からの調停案情報を取得し、行動決定パラメータ２０３とデータベース２０５に保存されたデータとを用いて、他の個別システム２に譲渡する注文数を決定するプログラムである。行動決定プログラム２０２は、具体的には例えば、生産中の製品数が一定数より大きく、かつ、今週の受注件数が一定数より大きい場合に、調停案で提示された数に対して行動決定パラメータ２０３に指定された割合だけ注文を譲渡する、というプログラムである。

【0041】

行動決定パラメータ２０３は、行動決定プログラム２０２が行動を決定する際に用いる１つ以上の数値からなるパラメータ情報である。行動決定パラメータ２０３は、具体的には例えば、調停案で提示された数に対して、実際に譲渡する割合を定めた数値である。

【0042】

パラメータ更新プログラム２０４は、データベース２０５に保存された情報を用いて行動決定パラメータ２０３を更新する機能を持つプログラムである。パラメータ更新プログラム２０４は、具体的には例えば、過去のデータに基づいて、得られる収益の期待値（個別ＫＰＩ）が最大になるように行動決定パラメータ２０３を調整するプログラムである。

【0043】

データベース２０５は、過去の生産状況、受注状況、及び提示された調停案と、その調停案の合意に関する情報と、を保存する。データベース２０５に保存する情報には、例えば過去における受注件数の見積もり情報や、過去における行動決定パラメータ２０３等が含まれてもよい。

【0044】

（２）処理
以下では、（１）で説明した構成を備える全体システムにおいて、調停システム１及び個別システム２が実行する処理について説明する。

【0045】

図２は、調停システム処理の処理手順例を示すフローチャートである。調停システム処理は、調停システム１が実行する処理であって、複数の個別システム２から収集したデータと自身が保持する各種モデル及びデータ等とを用いて、モデルを学習し、調停案の生成及び評価を繰り返し、最終的に決定した調停案を出力する処理である。

【0046】

図２によればまず、調停システム１は、入出力プログラム１０６を用いて、個々の個別システム２から、現在の生産状況及び受注状況（受注数）に関する情報と、前回の調停案に従って注文の譲渡が行われたかの情報と、を入力装置１１で受け付け、模擬モデル用データベース１０１に保存する（ステップＳ２０）。

【0047】

次に、調停システム１は、モデル生成モジュール１０７を用いて、模擬モデル１０２及び学習モデル１０４を生成するモデル生成処理を行う（ステップＳ２１）。モデル生成処理において、モデル生成モジュール１０７の模擬モデル生成プログラム１０８は、ステップＳ２０で模擬モデル用データベース１０１に保存されたデータを用いて既存の模擬モデル１０２を学習することによって、今回の調停用の模擬モデル１０２を生成する。また、モデル生成処理において、モデル生成モジュール１０７の学習モデル生成プログラム１０９は、ステップＳ２０で学習モデル用データベース１０３に保存されたデータを用いて、過去の模擬モデル１０２の学習過程（時間変化）を学習することによって、今回の調停用の学習モデル１０４を生成する。模擬モデル用データベース１０１に保存されるデータと模擬モデル１０２との関係については、図４を参照しながら後述する。学習モデル用データベース１０３に保存されるデータと学習モデル１０４との関係については、図５を参照しながら後述する。

【0048】

ステップＳ２１でモデル学習を行った後、調停システム１は、ステップＳ２２～Ｓ２７において、調停案探索モジュール１１０を用いて、調停案の生成及び評価を繰り返し実行し、最終的に出力する調停案を生成する。個々のステップの処理を説明する。

【0049】

調停案探索モジュール１１０は、まず、調停案生成パラメータ１１１を設定する（ステップＳ２２）。調停案生成パラメータ１１１は、前回の処理のものを引き継いでもよいし、新たに何らかのルールに従って、例えばランダムに設定し直す（更新する）ようにしてもよい。

【0050】

次に、調停案探索モジュール１１０は、調停案生成プログラム１１２を用いて調停案を生成する調停案生成処理を実行する（ステップＳ２３）。調停案生成処理の詳細は、図６を参照しながら後述する。

【0051】

次に、調停案探索モジュール１１０は、調停案評価プログラム１１３を用いて、ステップＳ２３で生成した調停案を評価し、その評価値を算出する調停案評価処理を実行する（ステップＳ２４）。ステップＳ２４で算出される評価値は、少なくとも１つ以上の数値からなるデータで、それぞれの値が大きいほど望ましい状態を示すような指標である。調停案評価処理の詳細は、図７を参照しながら後述する。

【0052】

次に、調停案探索モジュール１１０は、ステップＳ２３で得た調停案と、ステップＳ２４で得た評価値をメモリ１４等に保存する（ステップＳ２５）。またこの際、調停案探索モジュール１１０は、調停案生成処理（ステップＳ２３）や調停案評価処理（ステップＳ２４）で算出した変数やパラメータも、メモリ１４等に保存するようにしてもよい。

【0053】

次に、調停案探索モジュール１１０（調停案評価プログラム１１３）は、ステップＳ２４で得られた調停案の評価値が探索終了条件を満たしているかを判定する（ステップＳ２６）。

【0054】

探索終了条件は、評価値に含まれる数値のうちの１つ以上を用いて定められる条件である。具体的には例えば、評価値が、全体システムにおける「全体ＫＰＩ」と、各個別システム２に対する「個別ＫＰＩ」と、各個別システム２における一定期間後の協力度合いの「予測値」とで構成される場合、この評価値は、１個の全体ＫＰＩと、Ｎ個の個別ＫＰＩと、Ｎ個の予測値、すなわち合計で２Ｎ＋１個の数値で表される。この場合、評価値を構成する２Ｎ＋１個の数値の重み付け和が、所定の閾値を超えたか否か、を探索終了条件とすることができる。なお、「全体ＫＰＩ」は、Ｎ個の個別システム２を含むシステム全体において最大化したい指標であり、「個別ＫＰＩ」は、個々の個別システム２において最大化したい指標であり、全体ＫＰＩと個別ＫＰＩは異なる指標であってもよい。

【0055】

なお、上記の具体例において、評価値の２Ｎ＋１個の数値に対応する重みパラメータと、終了条件の判定に用いる閾値には、例えば予め固定値を与えてもよいし、調停システム処理を実行するたびに、外部から入力装置１１を用いてユーザ等が設定するようにしてもよいし、前回までの調停結果に基づいて調停案探索モジュール１１０が設定するようにしてもよい。

【0056】

ステップＳ２６の判定において、探索終了条件が満たされなかった場合（ステップＳ２６のＮＯ）、調停案探索モジュール１１０は、ステップＳ２２に戻り、調停案生成パラメータ１１１を別の値に更新した上で処理を繰り返す。なおこのとき、調停案探索モジュール１１０は、予め定めたルールに従って（例えばランダムに）調停案生成パラメータ１１１を更新するようにしてもよいし、直近のステップＳ２３～Ｓ２４で得られた調停案及び評価値に基づいて調停案生成パラメータ１１１を調整し更新するようにしてもよい。

【0057】

ステップＳ２６の判定において、探索終了条件が満たされた場合（ステップＳ２６のＹＥＳ）、調停案探索モジュール１１０は、直近のステップＳ２３～Ｓ２４で生成された調停案及び評価値を、最終的な結果としてメモリ１４等に保存する（ステップＳ２７）。なお、ステップＳ２７において調停案探索モジュール１１０は、調停案及び評価値とともに、調停案生成処理（ステップＳ２３）や調停案評価処理（ステップＳ２４）で算出した数値やパラメータ、例えば将来における個別システム２の行動の予測に関する情報等を保存するようにしてもよい。

【0058】

ステップＳ２７に次いで、調停システム１は、ステップＳ２７でメモリ１４に保存した情報を出力する調停案出力処理を行う（ステップＳ２８）。調停案出力処理は、調停案探索モジュール１１０が入出力プログラム１０６を呼び出して行われ、具体的には例えば、ネットワーク３を経由して各個別システム２に調停案を通知したり、出力装置１２に調停案を表示したりするものである。

【0059】

その後、調停システム１は、今回の調停システム処理を終了し、次回の個別システム２からの入力受付を待つ状態（ステップＳ２０）に戻る。

【0060】

図３は、個別システム処理の処理手順例を示すフローチャートである。個別システム処理は、それぞれの個別システム２が実行する処理であって、自システムにおける生産状況や受注状況に関する情報を調停システム１に送信する他、調停システム１で決定された調停案を踏まえて自システムにおける行動を決定し実施する処理である。

【0061】

図３によればまず、個別システム２は、入出力プログラム２０１を用いて、自システムにおける生産状況及び受注状況（受注数）を入力装置２１から受け入れ、データベース２０５に保存する（ステップＳ３０）。

【0062】

次に、個別システム２は、パラメータ更新プログラム２０４を用いて、行動決定パラメータ更新処理を実行する（ステップＳ３１）。具体的には、パラメータ更新プログラム２０４が、データベース２０５に保存された過去のデータに基づいて、自システムの行動の個別ＫＰＩが最大になるような行動決定パラメータを決定し、決定したパラメータで行動決定パラメータ２０３を更新する。

【0063】

次に、個別システム２は、入出力プログラム２０１を用いて、ステップＳ３０で取得した生産状況及び受注状況に関する情報を、出力装置２２からネットワーク３経由で調停システム１へ送信する（ステップＳ３２）。なお、ステップＳ３２で送信したデータは、図２のステップＳ２０の処理で調停システム１に受信される。調停システム１ではその後、ステップＳ２１～Ｓ２７の処理が実行され、決定された調停案がステップＳ２８で個別システム２に送付される。

【0064】

次に、個別システム２は、図２のステップＳ２８で調停システム１から出力された調停案を、ネットワーク３を経由して入力装置２１で受信し、データベース２０５に保存する（ステップＳ３３）。

【0065】

次に、個別システム２は、行動決定プログラム２０２を用いて、自システムにおける今回の行動を決定する行動決定処理を実行する（ステップＳ３４）。具体的には例えば、行動決定プログラム２０２が、データベース２０５に保存された情報（生産状況、受注状況）、ステップＳ３１で決定された行動決定パラメータ２０３、及びステップＳ３３で調停システム１から受け取った調停案に基づいて、生産数や他の個別システム２に譲渡する注文数を決定する。

【0066】

次に、個別システム２は、ステップＳ３４で決定した行動を実施し（ステップＳ３５）、一連の処理を終了する。ステップＳ３５では、個別システム２は、ステップＳ３４で決定した行動内容に従って、注文の譲渡または受領を行った上で、最終的な注文数に対して生産を開始する。

【0067】

図４は、模擬モデル用データベース１０１に保存されるデータの一例を示した図である。模擬モデル用データベース１０１は、個別システム２－１～２－Ｎの行動を予測する模擬モデル１０２－１～１０２－Ｎを生成するために必要な情報を保持する。

【0068】

具体的には、図４に示したように、模擬モデル用データベース１０１には、過去の調停の実施回（図２の調停システム処理を実行すると１回の実施回）ごとに、１回前の調停時のデータ４０－１、２回前の調停時のデータ４０－２、・・・、Ｔ回前の調停時４０－Ｔが保存される。Ｔは任意の整数であり、予め設定された所定数としてもよいし、ユーザまたはプログラムが変更可能としてもよい。

【0069】

さらに詳しく言うと、各時点でのデータ４０は、個別システム２ごとに、当該個別システム２における生産状況及び受注状況に関するデータ４１と、当該個別システム２における注文の譲渡状況に関するデータ４２と、当該個別システム２に提示した調停案に関するデータ４３と、を含む。データ４１（データ４１－１～４１－Ｎ）及びデータ４２（データ４２－１～４２－Ｎ）は、図２のステップＳ２０で各個別システム２から受信した情報のデータに相当する。また、データ４３（データ４３－１～４３－Ｎ）は、図２のステップＳ２８で各個別システム２に通知した調停案のデータに相当する。

【0070】

また、図４には、調停システム処理内のモデル生成処理（図２のステップＳ２１）において模擬モデル生成プログラム１０８が生成する模擬モデル１０２と、模擬モデル用データベース１０１に保存されたデータとの関係性のイメージが示されている。具体的には、１回前（直近）の調停システム処理で生成された模擬モデル＃１（模擬モデル１０２－１）は、１回前の調停時における個別システム＃１の生産状況及び受注状況に関するデータ４１－１と個別システム＃１に提示した調停案に関するデータ４３－１を入力変数とし、１回目の調停時に個別システム＃１の譲渡状況（他システムに譲渡した受注数、及び他システムから譲渡された受注数）に関するデータ４２－１を目的変数とするモデルであることが示されている。

【0071】

なお、図４に示した模擬モデル用データベース１０１のデータと模擬モデル１０２との関係は、一例に過ぎず、これに限定されるものではない。他にも例えば、模擬モデル１０２は、後述する図９で説明するように、調停案で提示した譲渡数に対する実際の譲渡数の割合を目的関数とするモデル等であってもよい。

【0072】

図５は、学習モデル用データベース１０３に保存されるデータの一例を示した図である。学習モデル用データベース１０３は、模擬モデル１０２－１～１０２－Ｎの学習過程を予測する学習モデル１０４－１～１０４－Ｎを生成するために必要な情報を保持する。

【0073】

具体的には、図５に示したように、学習モデル用データベース１０３には、過去の調停の実施回（図２の調停システム処理を実行すると１回の実施回）ごとに、１回前の調停時のデータ５０－１、２回前の調停時のデータ５０－２、・・・、Ｔ回前の調停時５０－Ｔが保存される。Ｔは任意の整数であり、予め設定された所定数としてもよいし、ユーザまたはプログラムが変更可能としてもよい。

【0074】

さらに詳しく言うと、各時点でのデータ５０は、当該時点での各個別システム２の模擬モデル１０２に関するデータ５１と、当該時点で各個別システム２に提示した調停案に関するデータ５２と、を含む。データ５１（データ５１－１～５１－Ｎ）は、例えば、模擬モデル１０２－１～１０２－Ｎに用いられるパラメータである。また、データ５２（データ５２－１～５２－Ｎ）は、図２のステップＳ２８で各個別システム２に通知した調停案のデータに相当する。

【0075】

また、図５には、調停システム処理内のモデル生成処理（図２のステップＳ２１）において学習モデル生成プログラム１０９が生成する学習モデル１０４と、学習モデル用データベース１０３に保存されたデータとの関係性のイメージが示されている。具体的には、１回前（直近）の調停システム処理で生成された学習モデル＃１（学習モデル１０３－１）は、過去の調停時のデータ５０、すなわち２回前～Ｔ回前の調停時のデータ５０－２～５０－Ｎを入力変数とし、１回目の調停時のデータ５０－１を目的変数とするモデルであることが示されている。

【0076】

図６は、調停案生成処理の処理手順例を示すフローチャートである。図２のステップＳ２３の説明で述べたように、調停案生成処理は、調停案生成プログラム１１２によって実行される。

【0077】

図６によればまず、調停案生成プログラム１１２は、調停案生成パラメータ１１１を初期化し、模擬モデル１０２－１～１０２－Ｎを模擬モデル用データベース１０１から読み出してメモリ１４に保存する（ステップＳ６０）。ステップＳ６０において調停案生成プログラム１１２は、調停案生成パラメータ１１１を予め決められたルールに従って、例えばランダムに初期化してもよいし、その他の方法、例えば１回前の調停案生成時に用いたパラメータを初期値として用いてもよい。

【0078】

次に、調停案生成プログラム１１２は、ステップ変数ｔを０で初期化し、予測最大ステップ数Ｔを設定する（ステップＳ６１）。調停案生成処理で用いるステップ変数ｔは、調停案生成プログラム１１２が現時点（ｔ＝０）から何回後の調停案を生成しているかを示す変数であり、予測最大ステップ数Ｔは、調停案生成プログラム１１２が最大で何回分の調停案の候補を出力するかを定める変数である。予測最大ステップ数Ｔは、予め設定されたルールに従って、例えば固定値が設定される。

【0079】

次に、調停案生成プログラム１１２は、ステップＳ６０で設定した調停案生成パラメータ１１１に基づいて調停案を生成する（ステップＳ６２）。調停案生成プログラム１１２は、例えば、各個別システム２において生産中の製品の数（生産中製品数）と受注した製品の数（受注数）との合計が調停案生成パラメータ１１１で指定される値を超えた場合に、超えた分だけ、自システムへの注文を他の個別システム２に譲渡するように提案する調停案を生成する。

【0080】

次に、調停案生成プログラム１１２は、ステップＳ６２で生成した調停案を個別システム２－１～２－Ｎに提示した場合に、各個別システム２（またはその事業者）がどのような行動を取るかを、個別システム２ごとにそれぞれ、ステップＳ６０でメモリ１４に保存した模擬モデル１０２を用いて予測する（ステップＳ６３）。ステップＳ６３の予測により、個別システム２ごとの行動予測値が算出される。

【0081】

次に、調停案生成プログラム１１２は、ステップＳ６２で生成した調停案を個別システム２－１～２－Ｎに提示した場合に、各個別システム２（またはその事業者）の行動がどのように変化するかを予測するために、学習モデル１０４－１～１０４－Ｎを用いて、メモリ１４に保存した模擬モデル１０２を更新する（ステップＳ６４）。すなわち、ステップＳ６４の処理によって、学習後の模擬モデル１０２が算出される。

【0082】

次に、調停案生成プログラム１１２は、環境モデル１０５を用いて、次の調停時点における各事業者（各個別システム２）の生産状況及び受注状況等を予測する（ステップＳ６５）。ステップＳ６５の処理によって、次回の調停時点での生産状況及び受注状況の予測値が算出される。

【0083】

次に、調停案生成プログラム１１２は、ステップＳ６３で算出した行動予測値と、ステップＳ６４で算出した学習後の模擬モデル１０２と、ステップＳ６５で算出した次回の調停時点における生産状況及び受注状況の予測値と、をメモリ１４に保存する（ステップＳ６６）。以下、ステップＳ６６でメモリ１４に保存したこれらの情報を、ステップｔにおける「調停案および付随情報」と呼ぶ。

【0084】

次に、調停案生成プログラム１１２は、ステップ変数ｔがステップＳ６１で設定した予測最大ステップ数Ｔ以上であるか否かを比較する（ステップＳ６７）。

【0085】

ステップＳ６７においてステップ変数ｔが予測最大ステップ数Ｔ未満である場合（ステップＳ６７のＮＯ）、調停案生成プログラム１１２は、調停案生成パラメータ１１１を更新し、ステップ変数ｔにｔ＋１を代入し（ステップＳ６８）、ステップＳ６２の処理に戻る。ステップＳ６８において調停案生成パラメータ１１１は、予め定めたルールに従って、例えばランダムに更新される。

【0086】

ステップＳ６７においてステップ変数ｔが予測最大ステップ数Ｔ以上である場合（ステップＳ６７のＹＥＳ）、調停案生成プログラム１１２は、ステップ０からステップＴまでの調停案および付随情報を記憶装置１０に保存し（ステップＳ６９）、調停案生成処理を終了する。

【0087】

図７は、調停案評価処理の処理手順例を示すフローチャートである。図２のステップＳ２４の説明で述べたように、調停案評価処理は、調停案評価プログラム１１３によって実行される。

【0088】

図７によればまず、調停案評価プログラム１１３は、ステップ変数ｔを０で初期化し、評価最大ステップ数Ｔを設定する（ステップＳ７０）。調停案評価処理で用いるステップ変数ｔは、調停案評価プログラム１１３が現時点（ｔ＝０）から何回後の調停案を評価しているかを示す変数であり、評価最大ステップ数Ｔは、調停案評価プログラム１１３が最大で何回分の調停案の候補を評価するかを定める変数である。評価最大ステップ数Ｔは、予め設定されたルールに従って、例えば固定値が設定される。なお、調停案生成処理で用いた予測最大ステップ数Ｔと調停案評価処理で用いる評価最大ステップ数Ｔは、同値であってよい。

【0089】

次に、調停案評価プログラム１１３は、ステップｔにおける調停案および付随情報、すなわち、個別システム２に提示する調停案と、個別システム２の行動予測値と、個別システム２の学習後の模擬モデル１０２とを取得し、メモリ１４等に保存する（ステップＳ７１）。

【0090】

次に、調停案評価プログラム１１３は、ステップＳ７１で保存した情報に基づいて、各個別システム２の個別ＫＰＩを算出する（ステップＳ７２）。各個別システム２の個別ＫＰＩ（個別ＫＰＩ）とは、例えば、各個別システム２がステップｔで選択した行動の実施によって得た利益である。

【0091】

次に、調停案評価プログラム１１３は、ステップＳ７１で保存した情報に基づいて、全体ＫＰＩを算出する（ステップＳ７３）。全体ＫＰＩとは、複数の個別システム２－１～２－Ｎを含むシステム全体で最大化したい指標のことで、例えば、ステップＳ７２で算出した各個別システム２の個別ＫＰＩの合計である。

【0092】

次に、調停案評価プログラム１１３は、ステップＳ７１で保存した情報に基づいて、各個別システム２の協力度合いを算出する（ステップＳ７４）。協力度合いとは、例えば、調停システム１が提示する調停案において提示される譲渡数に対して、実際にいくつの譲渡を行ったかを評価した値である。具体的には例えば、調停案評価プログラム１１３は、ステップＳ７１で保存したステップｔにおける学習後の模擬モデル１０２を用いて、様々な状況下で個別システム２が譲渡の提案を承諾するかを調べることによって、協力度合いを算出することができる。

【0093】

次に、調停案評価プログラム１１３は、ステップＳ７２で算出した個別ＫＰＩと、ステップＳ７３で算出した全体ＫＰＩと、ステップＳ７４で算出した各個別システム２の協力度合いの評価値と、をメモリ１４に保存する（ステップＳ７５）。以下、ステップＳ７５でメモリ１４に保存したこれらの数値を、ステップｔにおける「全評価値」と呼ぶ。

【0094】

次に、調停案評価プログラム１１３は、ステップ変数ｔがステップＳ７０で設定した評価最大ステップ数Ｔ以上であるか否かを比較する（ステップＳ７６）。

【0095】

ステップＳ７６においてステップ変数ｔが評価最大ステップ数Ｔ未満である場合（ステップＳ７６のＮＯ）、調停案評価プログラム１１３は、ステップ変数ｔにｔ＋１を代入し（ステップＳ７７）、ステップＳ７１の処理に戻る。

【0096】

ステップＳ７６においてステップ変数ｔが評価最大ステップ数Ｔ以上である場合（ステップＳ７６のＹＥＳ）、調停案評価プログラム１１３は、ステップ０からステップＴまでの全評価値に基づいて、最終的な評価値を算出してメモリ１４に保存し（ステップＳ７８）、調停案評価処理を終了する。なお、「最終的な評価値」とは、現在時点から評価最大ステップ数Ｔに相当する所定の将来時点までの期間について、複数の数値で定義された調停案全体の良さを表す指標であって、具体的には例えば、ステップ０からステップＴまでの、個別ＫＰＩ、全体ＫＰＩ、及び協力度合いの、それぞれの平均値で算出することができる。

【0097】

（３）具体例
以下、図８から図１４を参照しながら、モデル生成処理（図２のステップＳ２１）、調停案生成処理（図２のステップＳ２３）、及び調停案評価処理（図２のステップＳ２４）の具体例と、調停システム１から得られる効果について説明する。

【0098】

以下に説明する具体例では、調停システム１を生産配分問題を調停するシステムとし、最も簡単な例として事業者数Ｎ＝２（すなわち、全体システムにおいて個別システム２が２つ）とする。

【0099】

２つの個別システム＃１，＃２は、全体システムにおいて、同じ会社に属する２つの支社＃１（事業者＃１）及び支社＃２（事業者＃２）が独立して運用するシステムである。各支社は、それぞれ独立に製品を受注し、製品の生産及び納品を行う事業を行う。各支社は、一定の売価で製品を販売しており、売価から生産コストを引いた粗利を最大化することを目的としている（個別ＫＰＩ）。一方、各支社を統括する本社（システム全体）の目標は、支社＃１と支社＃２の粗利の合計を最大化することである（全体ＫＰＩ）。

【0100】

製品の生産コストは、後述する図８に示すように、生産中の製品数（生産中製品数）によって変動し、生産中の製品数が多いと増加する傾向にある。これは、工場の好適な生産能力（キャパシティ）を超えた場合に、残業や外注による追加のコストが発生すること等に起因する。各支社は、毎週に一度、製品の受注をまとめて生産を開始するが、週ごとに、他支社に注文を譲渡することができる。

【0101】

図８は、個別システム２における生産コストの構造例を示すグラフである。図８に示すグラフにおいて、横軸は、受注時点において工場で生産中の製品数（生産中製品数）、縦軸は、追加で製品を１個生産するのにかかる生産コストである。生産コストは、支社＃１と支社＃２で同じとする。

【0102】

図８に実線で示したグラフ８０１は、自支社で受注した注文を自支社の工場で生産する場合の生産コストの時系列変化を表す。グラフ８０１が示すように、自支社で受注した場合は、生産中製品数が工場の通常営業で生産可能なキャパシティである３０個を超えない限りは、一定の生産コスト「５」で製品を生産することができる。一方、生産中製品数がキャパシティである３０個を超えると、生産コストが増加し、生産中製品数が６０個になると、生産コストが売価と等しい「１５」になって利益は「０」となる。

【0103】

図８に一点鎖線で示したグラフ８０２は、他支社から譲渡された注文を自支社の工場で生産する場合の生産コストの時系列変化を表す。このグラフ８０２では、自支社で受注した注文の生産コスト（グラフ８０１）に比べて、支社間の注文の譲渡に伴うコスト「５」が一律に生産コストに追加される。このようなコスト構造では、自支社の生産中製品数が４５個以上で、かつ、他支社の生産中製品数が自支社の生産中製品数に比べて１５個以上少ない場合には、自支社の注文を他支社に譲渡することで、全支社の合計の利益は増加する。すなわち、全体ＫＰＩを高めることができる。

【0104】

一方、自支社を中心に考えると、注文を譲渡した支社単体では利益は減少し（個別ＫＰＩが減少し）、注文が譲渡された支社では利益が増加する（個別ＫＰＩが増加する）ことから、各支社が単純に自支社の利益を最大化するように行動した場合には、生産中製品数が６０個を超えて赤字になる場合を除いて、自支社から他支社への譲渡は発生しない。しかしこの場合、上述した適度な譲渡が支社間で行われる場合に比べて、全支社の合計の利益の増加幅は小さくなる。すなわち、各支社（各個別システム２）がそれぞれの個別ＫＰＩの最大化を追及する行動を実施した場合、全体ＫＰＩが最大化されない状況が発生し得る。

【0105】

図９は、模擬モデル用データベース１０１に保存されるデータの具体例を説明するグラフである。図９は、支社＃１の個別システム２に関して調停システム１が模擬モデル用データベース１０１に保存するデータについて、現在時点の「Ｏ」から遡って１００週分の各種データをグラフ化したものである。

【0106】

図９（Ａ）のグラフ９００は、支社＃１における生産中製品数のデータを、時系列で示したグラフである。横軸は、データを取得した週を示す。例えば「Ｏ－２５」は、現在時点の「Ｏ」よりも２５週前であることを意味する。以降に参照する他図でも同様の横軸を採用しており、説明を省略する。縦軸は、データの取得時点において支社＃１で生産中の製品の個数（生産中製品数）を示す。

【0107】

図９（Ｂ）のグラフ９１０は、支社＃１から他支社（支社＃２）に譲渡した注文数（譲渡数）、及び他支社（支社＃２）から支社＃１に譲渡された注文数（被譲渡数）を、時系列で示したグラフである。横軸は、グラフ９１０と同様にデータを取得した週を示す。縦軸は、データを取得した週に譲渡した、または譲渡された注文の数を示す。

【0108】

図９（Ｃ）のグラフ９２０は、調停案で提示された譲渡数に対する実際の譲渡数の比を時系列で示したグラフである。横軸は、グラフ９１０，９２０と同様にデータを取得した週を示す。縦軸は、データを取得した週の前の週に提示した調停案が示した譲渡数に対して、データを取得した週に実際に他支社に譲渡した注文数の割合（以下「調停案受入割合」と称する）を示す。

【0109】

調停システム１は、調停システム処理内のモデル生成処理（図２のステップＳ２１）において、グラフ９００，９１０，９２０が表すデータを用いて、生産中の製品数と、調停案で提示した譲渡数とを入力とし、調停案受入割合を出力とする模擬モデル１０２を、例えばニューラルネットワークで実装された関数を用いて実装し、教師有り学習を行うことによって生成する。

【0110】

また、調停システム１は、モデル生成処理（図２のステップＳ２１）において、ある期間のデータのみを用いて生成した模擬モデル１０２と、別の期間のデータを用いて生成した模擬モデル１０２との変化を分析することにより、個別システム２の行動の変容を推定する学習モデル１０４を生成する。図９に示した具体例の場合、学習モデル１０４－１は、グラフ９２０のデータから、調停案受入割合が２５週ごとに大きく変化することを、例えばグラフ９２０に対してフーリエ変換を行って周波数を分析することによって算出する。また、学習モデル１０４－１は、一定期間（例えば２５週間）内に譲渡された注文数が所定数よりも多い場合に次の２５週の期間における調停案受入割合が増加することを、例えば、ある異時点での調停案受入割合とそれより前の２５週において譲渡された注文数との相関を分析することによって算出する。

【0111】

図１０は、個別システム２における生産状況に対する調停案の一例を説明するためのグラフである。図１０は、支社＃１と支社＃２の個別システム２に関して調停システム１が模擬モデル用データベース１０１に保存するデータを用いて、現在時点から遡って２０週分（すなわち、「Ｏ」～「Ｏ－２０」）の生産中製品数と、支社＃１と支社＃２との間で譲渡された注文数（譲渡量、被譲渡量）とをグラフ化したものである。

【0112】

図１０において、横軸はデータを取得した週を示し、縦軸はデータの取得時点における各支社の生産中製品数を示す。図１０に実線で示したグラフ１００１は、支社＃１の生産中製品数の変化を表し、一点鎖線で示したグラフ１００２は、支社＃２の生産中製品数の時系列変化を表す。

【0113】

図１０によれば、Ｏ－１９週からＯ－１１週付近において、支社＃１が調停案に従って注文を支社＃２に譲渡している（譲渡量１００３，被譲渡量１００４）。その後、支社＃１の生産中製品数は減少し、支社＃２の生産中製品数は増加しているが、両者の差が大きくないため、支社間で譲渡は発生していない。

【0114】

上述した図１０の状況において、仮に、調停システム１が学習過程を考慮せずに全体ＫＰＩを最大化する調停案を生成する場合、現在時点Ｏにおいて支社＃１と支社＃２の生産中製品数の差は１５個以下であり、図８で示したコスト構造によれば譲渡をしても全体ＫＰＩが増加しないことから、調停システム１は譲渡の提案をしない（譲渡を提案しない調停案を生成する）。

【0115】

図１１は、個別システム２における生産状況に対する調停案の別例を説明するためのグラフである。図１１は、図１０と同様に、支社＃１と支社＃２の個別システム２に関するデータを用いて、各支社における生産中製品数と注文数の譲渡とをグラフ化したものであり、グラフの構成等については説明を省略する。図１０との相違点として、図１１では、調停システム１が、学習過程を考慮して調停案を提案する。

【0116】

図１０で説明した譲渡を提案しない調停案は、調停案評価プログラム１１３による調停案評価処理（図２のステップＳ２４，図７）を行った際に、支社＃１の調停案受入割合が減少することを予測し、図７のステップＳ７４で算出される支社＃１の協力度合いの評価値が低くなる。

【0117】

一方、図１１では、現在時点「Ｏ」において、支社＃２に注文の譲渡（譲渡量１１０１）を提案する調停案が提案される。この調停案は、短期的には全体の利益を減少させるため、図７のステップＳ７３で算出される全体ＫＰＩの評価値が低くなってしまうが、ステップＳ７４で算出される支社＃２の協力度合いの評価値は高くなる。長期的に協力度合いの評価値が高くなれば、調停案が提案する譲渡が受け入れられやすくなり、将来的には全体ＫＰＩを高める効果に期待できる。協力度合いの評価値を高めるためには、調停システム処理の探索終了条件（図２のステップＳ２６）において、例えば、「最終的な評価値」に含まれる協力度合いの評価値が一定以上（所定の閾値以上）であることを要求するようにプログラムを設定すればよい。この結果、調停システム１は、図１１に示すような調停案を生成及び出力することができ、長期的な協力度合い及び将来的な全体ＫＰＩを向上させることができる。

【0118】

以上、調停システム１による調停の具体例として、製品を生産する複数の個別システム２に対する生産配分問題の調停を説明したが、本実施形態に係る調停システム１は、個々が独立して個別の重要業績評価指標（個別ＫＰＩ）が高まるように自身の行動を決定する複数の個別システム２を包括する全体システムに対して広く適用可能であり、調停システム１は、調停案の生成において、このような全体システムにおいて個別の重要業績評価指標とは異なる全体の重要業績指標（全体ＫＰＩ）が高まるように譲渡の数量を算出するものである。また、上述した生産配分問題の具体例では、調停システム１が生成する調停案は、他支社（他の個別システム２）への注文の譲渡数を提案するものであったが、本実施形態に係る調停システム１が生成する調停案の内容は「注文」の譲渡数に限定されるものではなく、個別システム２の行動の決定に関わる「所定要因」について、その譲渡を提案するものであればよい。

【0119】

以上のことから、本実施形態に係る調停システム１は、個々が独立して個別の重要業績評価指標が高まるように自身の行動（例えば製品の生産）を決定する複数の個別システム２に対して前記行動に関連する調停案を提示する調停システムであって、モデル生成モジュール１０７と調停案探索モジュール１１０とを備えるシステムである、と言うことができる。ここで、モデル生成モジュール１０７は、各個別システム２の行動を推定する模擬モデル１０２と、模擬モデル１０２の時系列変化に基づいて各個別システム２の行動の変容を推定する学習モデル１０４と、を生成するモジュール（プログラム）であり、モデル生成モジュール１０７と調停案探索モジュール１１０は、模擬モデル１０２及び学習モデル１０４を用いて、個別システム２の行動の決定に関わる所定要因（例えば注文数）の個別システム間での譲渡を提案する調停案を生成して個別システム２に提示するモジュール（プログラム）である。そして、このような調停システム１によれば、各個別システム２の行動の変容を考慮した調停案を生成することができる。

【符号の説明】

【0120】

１調停システム
２個別システム
３通信システム（ネットワーク）
１０記憶装置
１１，２１入力装置
１２，２２出力装置
１３，２３プロセッサ
１４，２４メモリ
１５，２５バス
１０１模擬モデル用データベース
１０２模擬モデル
１０３学習モデル用データベース
１０４学習モデル
１０５環境モデル
１０６入出力プログラム
１０７モデル生成モジュール
１０８模擬モデル生成プログラム
１０９学習モデル生成プログラム
１１０調停案探索モジュール
１１１調停案生成パラメータ
１１２調停案生成プログラム
１１３調停案評価プログラム
２０１入出力プログラム
２０２行動決定プログラム
２０３行動決定パラメータ
２０４パラメータ更新プログラム
２０５データベース

【図1】