(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024128782
(43)【公開日】2024-09-24
(54)【発明の名称】調停システム、調停方法、及びプログラム
(51)【国際特許分類】
G06Q 50/04 20120101AFI20240913BHJP
【FI】
G06Q50/04
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2023037982
(22)【出願日】2023-03-10
(71)【出願人】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110002365
【氏名又は名称】弁理士法人サンネクスト国際特許事務所
(72)【発明者】
【氏名】赤塚 駿一
(72)【発明者】
【氏名】寺本 やえみ
【テーマコード(参考)】
5L049
5L050
【Fターム(参考)】
5L049CC04
5L050CC04
(57)【要約】
【課題】
個々が独立して自身の行動を決定する複数の個別システムに対し、各個別システムの行動の変容を考慮した調停案を生成する。
【解決手段】
複数の個別システム2は、個々が独立して個別の重要業績評価指標が高まるように自身の行動を決定し、調停システム1は、各個別システム2の行動を推定する模擬モデル102と、模擬モデル102の時系列変化に基づいて各個別システム2の行動の変容を推定する学習モデル104と、を生成するモデル生成モジュール107と、模擬モデル102及び学習モデル104を用いて、個別システム2の行動の決定に関わる所定要因の個別システム2間での譲渡を提案する調停案を生成して個別システム2に提示する調停案探索モジュール110と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
個々が独立して個別の重要業績評価指標が高まるように自身の行動を決定する複数の個別システムに対して前記行動に関連する調停案を提示する調停システムであって、
各前記個別システムの行動を推定する模擬モデルと、前記模擬モデルの時系列変化に基づいて各前記個別システムの行動の変容を推定する学習モデルと、を生成するモデル生成モジュールと、
前記模擬モデル及び前記学習モデルを用いて、前記行動の決定に関わる所定要因の前記個別システム間での譲渡を提案する調停案を生成して前記個別システムに提示する調停案探索モジュールと、
を備えることを特徴とする調停システム。
【請求項2】
前記調停案探索モジュールは、前記調停案の生成において、前記複数の個別システムを包括する全体システムにおいて前記個別の重要業績評価指標とは異なる全体の重要業績評価指標が高まるように前記調停案を算出する
ことを特徴とする請求項1に記載の調停システム。
【請求項3】
前記調停案探索モジュールは、
調停案生成パラメータと、
前記模擬モデル、前記学習モデル、及び前記調停案生成パラメータを用いて、前記調停案を生成する調停案生成部と、
前記調停案生成部が生成した調停案を評価する調停案評価部と、
を有し、
前記調停案評価部は、前記調停案の評価値として、各前記個別システムにおける前記個別の重要業績評価指標と、前記全体システムにおける前記全体の重要業績評価指標と、各前記個別システムにおける前記調停案に対する協力の度合いを評価する協力度合いの評価値と、を算出する
ことを特徴とする請求項2に記載の調停システム。
【請求項4】
現在時点から所定の将来時点までの所定期間について、各前記個別システムが前記行動を決定する所定周期を単位として、前記モデル生成モジュールによる前記模擬モデル及び前記学習モデルの生成と、前記調停案探索モジュールによる前記調停案の生成と、を繰り返し実行し、
前記調停案評価部は、前記繰り返しのなかで算出した前記個別の重要業績評価指標と、前記全体の重要業績評価指標と、前記協力度合いの評価値とに基づいて、前記調停案の前記所定期間に亘る最終的な評価値を算出する
ことを特徴とする請求項3に記載の調停システム。
【請求項5】
前記調停案探索モジュールは、
前記調停案生成パラメータを更新しながら、前記調停案生成部による前記調停案の生成と、前記調停案評価部による前記調停案の評価と、を繰り返し実行し、
前記調停案評価部によって算出された前記調停案の最終的な評価値に含まれる前記協力度合いの評価値が所定の閾値以上となった場合に、当該調停案を前記個別システムに提示する調停案に決定する
ことを特徴とする請求項4に記載の調停システム。
【請求項6】
各前記個別システムの行動が製品の生産である場合に、
前記調停案探索モジュールは、各前記個別システムに提示する前記調停案において、前記個別システム自身が受注した注文を他の個別システムに譲渡する譲渡量を提案する
ことを特徴とする請求項1に記載の調停システム。
【請求項7】
前記調停案探索モジュールは、前記個別システム自身が受注した注文の生産コストよりも、他の個別システムから譲渡された注文の生産コストを高く設定した条件下で、前記調停案を生成する
ことを特徴とする請求項6に記載の調停システム。
【請求項8】
個々が独立して個別の重要業績評価指標が高まるように自身の行動を決定する複数の個別システムに対して前記行動に関連する調停案を提示する調停システムによる調停方法であって、
前記調停システムが、各前記個別システムの行動を推定する模擬モデルと、前記模擬モデルの時系列変化に基づいて各前記個別システムの行動の変容を推定する学習モデルと、を生成するモデル生成ステップと、
前記調停システムが、前記模擬モデル及び前記学習モデルを用いて、前記行動の決定に関わる所定要因の前記個別システム間での譲渡を提案する調停案を生成して前記個別システムに提示する調停案探索ステップと、
を備えることを特徴とする調停方法。
【請求項9】
個々が独立して個別の重要業績評価指標が高まるように自身の行動を決定する複数の個別システムに対して前記行動に関連する調停案を提示する調停システムで実行されるプログラムであって、
各前記個別システムの行動を推定する模擬モデルと、前記模擬モデルの時系列変化に基づいて各前記個別システムの行動の変容を推定する学習モデルと、を生成するモデル生成処理と、
前記模擬モデル及び前記学習モデルを用いて、前記行動の決定に関わる所定要因の前記個別システム間での譲渡を提案する調停案を生成し、前記個別システムに出力する調停案生成処理と、
を実行することを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、調停システム、調停方法、及びプログラムに関し、独立した複数の個別システムに対して調停案を生成する調停システム、調停方法、及びプログラムに適用して好適なものである。
【背景技術】
【0002】
サプライチェーンやモビリティシステムのような巨大な社会システムは、複数の独立したシステムによって構成されており、各システムは自身の目的を達成するために行動を取っている。このとき、各システムが自身の目的を達成しようとした結果、全体として最適とは異なる状態になることがある。この結果、システムの機能が低下したり、各個別システムの収益性が悪化したりする。このような状況では、外部に調停役を置き、情報の共有や行動に対する提案または指示を通じて、全体として最適な全体最適に導くことが求められる。
【0003】
一方で、昨今は人工知能や機械学習技術を取り入れたシステムも多く、これらのシステムは、調停や行動の経験から学習することで、以降の行動が変容する。このような人工知能や機械学習技術を取り入れたシステムにおいて各システムの行動を全体最適に導くためには、個別システムの行動変容を考慮して調停案を生成する必要がある。
【0004】
複数の個別システムを協調させる目的で調停する技術として、例えば特許文献1には、サプライチェーンを構成する第1の企業と、前記第1の企業の前記サプライチェーンを構成する第2の企業の状態に応じた行動ロジックとを対応付けた行動ルール情報の複数のパターンを生成する行動ルールパターン生成ステップと、複数のパターンの前記行動ルール情報のそれぞれにおいて、前記サプライチェーンの全体における重要業績評価指標を算出するシミュレーションステップと、前記重要業績評価指標に基づいて、前記サプライチェーンに適用する前記行動ルール情報を選択する最適行動ルール選択ステップと、を含むことを特徴とする行動ルール生成方法が開示されている。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
複数の独立したシステム(個別システム)が個別の重要業績評価指標(KPI:Key Performance Indicator)を最大化するために行動をするようなシステムに対し、個別KPIとは異なる全体KPIを大きくするように各個別システムの行動を誘導するための方法として、調停案を提示する調停システムを個別システムの外部に配置する方法が考えられる。ここで、調停システムによる調停を受けた結果、個別システムが学習し、その後の行動パターンが変化することが想定される。しかし、上述した特許文献1の行動ルール生成方法を含む既存技術では、調停案の提示によってそれぞれの個別システムが変化し得ることを考慮できておらず、結果として、調停システムが複数の個別システムを適切な協力関係に誘導することができない可能性があった。
【0007】
本発明は以上の点を考慮してなされたもので、個々が独立して自身の行動を決定する複数の個別システムに対し、各個別システムの行動の変容を考慮した調停案を生成することが可能な調停システム、調停方法、及びプログラムを提案しようとするものである。
【課題を解決するための手段】
【0008】
かかる課題を解決するため本発明においては、個々が独立して個別の重要業績評価指標が高まるように自身の行動を決定する複数の個別システムに対して前記行動に関連する調停案を提示する調停システムであって、各前記個別システムの行動を推定する模擬モデルと、前記模擬モデルの時系列変化に基づいて各前記個別システムの行動の変容を推定する学習モデルと、を生成するモデル生成モジュールと、前記模擬モデル及び前記学習モデルを用いて、前記行動の決定に関わる所定要因の前記個別システム間での譲渡を提案する調停案を生成して前記個別システムに提示する調停案探索モジュールと、を備えることを特徴とする調停システムが提供される。
【0009】
また、かかる課題を解決するため本発明においては、個々が独立して個別の重要業績評価指標が高まるように自身の行動を決定する複数の個別システムに対して前記行動に関連する調停案を提示する調停システムによる調停方法であって、前記調停システムが、各前記個別システムの行動を推定する模擬モデルと、前記模擬モデルの時系列変化に基づいて各前記個別システムの行動の変容を推定する学習モデルと、を生成するモデル生成ステップと、前記調停システムが、前記模擬モデル及び前記学習モデルを用いて、前記行動の決定に関わる所定要因の前記個別システム間での譲渡を提案する調停案を生成して前記個別システムに提示する調停案探索ステップと、を備えることを特徴とする調停方法が提供される。
【0010】
また、かかる課題を解決するため本発明においては、個々が独立して個別の重要業績評価指標が高まるように自身の行動を決定する複数の個別システムに対して前記行動に関連する調停案を提示する調停システムで実行されるプログラムであって、各前記個別システムの行動を推定する模擬モデルと、前記模擬モデルの時系列変化に基づいて各前記個別システムの行動の変容を推定する学習モデルと、を生成するモデル生成処理と、前記模擬モデル及び前記学習モデルを用いて、前記行動の決定に関わる所定要因の前記個別システム間での譲渡を提案する調停案を生成し、前記個別システムに出力する調停案生成処理と、を実行することを特徴とするプログラムが提供される。
【発明の効果】
【0011】
本発明によれば、個々が独立して自身の行動を決定する複数の個別システムに対し、各個別システムの行動の変容を考慮した調停案を生成することができる。
【図面の簡単な説明】
【0012】
【
図1】本発明の一実施形態に係る調停システム1を含む全体システムの構成例を示すブロック図である。
【
図2】調停システム処理の処理手順例を示すフローチャートである。
【
図3】個別システム処理の処理手順例を示すフローチャートである。
【
図4】模擬モデル用データベース101に保存されるデータの一例を示した図である。
【
図5】学習モデル用データベース103に保存されるデータの一例を示した図である。
【
図6】調停案生成処理の処理手順例を示すフローチャートである。
【
図7】調停案評価処理の処理手順例を示すフローチャートである。
【
図8】個別システム2における生産コストの構造例を示すグラフである。
【
図9】模擬モデル用データベース101に保存されるデータの具体例を説明するグラフである。
【
図10】個別システム2における生産状況に対する調停案の一例を説明するためのグラフである。
【
図11】個別システム2における生産状況に対する調停案の別例を説明するためのグラフである。
【発明を実施するための形態】
【0013】
以下、図面を参照して、本発明の実施形態を詳述する。以下の説明において、プログラムはプロセッサに所定の処理を実行させるが、説明の便宜上、プログラムを実行主体として説明する場合がある。
【0014】
なお、以下の記載及び図面は、本発明を説明するための例示であって、説明の明確化のため、適宜、省略及び簡略化がなされている。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。本発明が実施形態に制限されることは無く、本発明の思想に合致するあらゆる応用例が本発明の技術的範囲に含まれる。本発明は、当業者であれば本発明の範囲内で様々な追加や変更等を行うことができる。本発明は、他の種々の形態でも実施する事が可能である。特に限定しない限り、各構成要素は複数でも単数でも構わない。
【0015】
以下の説明では、「テーブル」、「表」、「リスト」、「キュー」等の表現にて各種情報を説明することがあるが、各種情報は、これら以外のデータ構造で表現されていてもよい。データ構造に依存しないことを示すために「XXテーブル」、「XXリスト」等を「XX情報」と呼ぶことがある。各情報の内容を説明する際に、「識別情報」、「識別子」、「名」、「ID」、「番号」等の表現を用いるが、これらについてはお互いに置換が可能である。
【0016】
また、以下の説明では、プログラムを実行して行う処理を説明する場合があるが、プログラムは、少なくとも1以上のプロセッサ(例えばCPU)によって実行されることで、定められた処理を、適宜に記憶資源(例えばメモリ)及び/又はインターフェースデバイス(例えば通信ポート)等を用いながら行うため、処理の主体がプロセッサとされてもよい。同様に、プログラムを実行して行う処理の主体が、プロセッサを有するコントローラ、装置、システム、計算機、ノード、ストレージシステム、ストレージ装置、サーバ、管理計算機、クライアント、又は、ホストであってもよい。また、プログラムを実行して行う処理の主体(例えばプロセッサ)は、処理の一部又は全部を行うハードウェア回路を含んでもよい。例えば、プログラムを実行して行う処理の主体は、暗号化及び復号化、又は圧縮及び伸張を実行するハードウェア回路を含んでもよい。プロセッサは、プログラムに従って動作することによって、所定の機能を実現する機能部として動作する。プロセッサを含む装置及びシステムは、これらの機能部を含む装置及びシステムである。
【0017】
プログラムは、プログラムソースから計算機のような装置にインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバ又は計算機が読み取り可能な非一時的な記憶メディアであってもよい。プログラムソースがプログラム配布サーバの場合、プログラム配布サーバはプロセッサ(例えばCPU)と非一時的な記憶資源とを含み、記憶資源はさらに配布プログラムと配布対象であるプログラムとを記憶してよい。そして、プログラム配布サーバのプロセッサが配布プログラムを実行することで、プログラム配布サーバのプロセッサは配布対象のプログラムを他の計算機に配布してよい。また、以下の説明において、2以上のプログラムが1つのプログラムとして実現されてもよいし、1つのプログラムが2以上のプログラムとして実現されてもよい。
【0018】
また、以下の説明では、同種の要素を区別せずに説明する場合には、添字や枝番を含む参照符号のうちの共通部分(添字や枝番を除く部分)を使用し、同種の要素を区別して説明する場合には、添字や枝番を含む参照符号を使用することがある。具体的には例えば、「模擬モデル」を特に区別せずに説明する場合には「模擬モデル102」と記載するのに対して、個々の模擬モデル102を区別して説明する場合には「模擬モデル102-1」、「模擬モデル102-2」、・・・「模擬モデル102-N」のように記載することがある。また、図示等において同種の要素を区別して記載する他の方法として、「模擬モデル#1」、「模擬モデル#2」、・・・、「模擬モデル#N」のように表記することもある。
【0019】
(1)システム構成
図1は、本発明の一実施形態に係る調停システム1を含む全体システムの構成例を示すブロック図である。
図1に示す全体システムは、独立した複数の個別システム2(個別システム2-1~2-N)と、これらの個別システム2に対して調停案を提示する機能を有する調停システム1とが、通信システム(ネットワーク)3で接続されて構成される。
【0020】
本実施形態では、それぞれの個別システム2は同様のハードウェア構成と機能を有するものとし、以下では
図1に示した個別システム#1(個別システム2-1)を中心に、個別システム2の構成例を説明する。但し、これは、複数の個別システム2において、それぞれのシステムが異なるハードウェア構成または機能を有することを制限するものではない。
【0021】
各個別システム2(個別には、個別システム2-1~2-N)を運用する事業者(個別システムごとに異なる事業者と考えてよい)は、それぞれ顧客から注文を受注して製品を製造し、納入する事業者である。各事業者は、所定期間ごとに(例えば週に一度)、それぞれの個別システム2-1~2-Nを用いて、自システムにおける生産状況や受注見積もりの情報を集約し、翌週の生産数を決定する。また、各事業者は、受注状況に応じて、自身への注文の少なくとも一部を別の事業者に譲渡することができる。
【0022】
調停システム1は、複数の個別システム2から上記の所定期間ごとに情報を収集し、それぞれの個別システム2に対して、別の個別システム2に譲渡する注文の数を調停案として提案する機能を有する。そして各個別システム2は、調停システム1から提案された調停案に基づいて、実際に注文をいくつ譲渡するかを判断する。調停システム1による処理の流れは
図2を参照しながら後述し、個別システム2による処理の流れは
図3を参照しながら後述する。
【0023】
以下に、
図1に示した調停システム1及び個別システム2の内部構成について詳しく説明する。
【0024】
(1-1)調停システム1
調停システム1は、複数の独立した個別システム2に対する調停案(本説明では譲渡する注文数)を生成し提示する機能を有するシステムである。調停システム1は、ハードウェアとして、記憶装置10と、入力装置11と、出力装置12と、プロセッサ13と、メモリ14と、それらを接続するバス15と、を有する。
【0025】
入力装置11は、データの入力を受け付ける装置である。入力装置11は、具体的には例えば、キーボード、マウス、タッチパネル、テンキー、スキャナ、マイク、センサ、または通信インタフェイス等である。出力装置12は、データを出力する装置である。出力装置12は、具体的には例えば、ディスプレイ、プリンタ、スピーカ、または通信インタフェイス等である。
【0026】
プロセッサ13は、調停システム1を制御するプロセッサであって、具体的には例えばCPU(Central Processing Unit)である。プロセッサ13は、記憶装置10に記憶されたプログラムをメモリ14に読み出して実行する。メモリ14は、プロセッサ13の作業エリアとなり、例えば、RAM(Random Access Memory)である。
【0027】
記憶装置10は、調停システム1で実行されるプログラムや、当該プログラムの実行の際に利用されるデータなどを記憶する。記憶装置10は、例えば、調停システム1の装置に搭載されるHDD(Hard Disk Drive)やSSD(Solid State Drive)等の記憶装置であるが、これに限定されず、記憶装置10が記憶するデータなどの少なくとも一部が、調停システム1の装置に外部接続された記録媒体や、ネットワーク3を経由して調停システム1に接続されるクラウド環境等に保持される構成であってもよい。
【0028】
図1に示したように、記憶装置10には、模擬モデル用データベース101、模擬モデル102、学習モデル用データベース103、学習モデル104、環境モデル105、入出力プログラム106、モデル生成モジュール107、及び調停案探索モジュール110が記憶される。
【0029】
模擬モデル用データベース101は、模擬モデル102を生成するために必要な情報を保存するためのデータ領域である。詳細は
図4を参照しながら後述するが、模擬モデル用データベース101は、過去に各個別システム2に送信した情報や、過去に各個別システム2から受信した情報等を保存する。
【0030】
模擬モデル102は、各個別システム2が出力する注文譲渡数を予測する機能を有する推論モデルである。模擬モデル102は、例えばニューラルネットワークで実装された関数近似プログラムである。
【0031】
学習モデル用データベース103は、学習モデル104を生成するために必要な情報を保存するためのデータ領域である。詳細は
図5を参照しながら後述するが、学習モデル用データベース103は、例えば過去時点から現在に至るまでの模擬モデル102のパラメータを保存する。
【0032】
学習モデル104は、模擬モデル102がどのように変化するかを予測する機能を有する推論モデルである。学習モデル104は、例えばニューラルネットワークで実装された関数近似プログラムである。より具体的に説明すると、個別システム#1の事業者#1(不図示)に対応する学習モデル#1(学習モデル104-1)は、模擬モデル#1のパラメータと事業者#1(個別システム#1と読み替えてもよい)に与える調停案のパラメータとを基に、次の時点での模擬モデルのパラメータを予測するプログラムである。
【0033】
環境モデル105は、個別システム2が自システムの外部から取得する情報を予測するモデルである。環境モデル105は、例えば、各個別システム2における他の個別システム2からの次回(例えば翌週)の受注数を予測するプログラムである。
【0034】
入出力プログラム106は、入力装置11を用いてデータを受信し、出力装置12を用いてデータを送信する機能を持つプログラムである。
【0035】
モデル生成モジュール107は、模擬モデル102及び学習モデル104を生成するプログラムを含むモジュールである。モデル生成モジュール107は、模擬モデル用データベース101に保存されているデータを用いて模擬モデル102を生成する模擬モデル生成プログラム108と、学習モデル用データベース103に保存されているデータを用いて学習モデル104を生成する学習モデル生成プログラム109と、を有する。
【0036】
調停案探索モジュール110は、個別システム2に出力する調停案を決定するプログラムである。調停案探索モジュール110は、調停案生成パラメータ111と、調停案生成プログラム112と、調停案評価プログラム113と、を有する。調停案生成パラメータ111は、調停案生成プログラム112が調停案を生成する際に用いる関数のパラメータである。調停案生成プログラム112は、模擬モデル102、学習モデル104、及び調停案生成パラメータ111を用いて調停案を生成する機能を持つプログラムである。調停案生成プログラム112が行う調停案生成処理の詳細は、
図6を参照しながら後述する。調停案評価プログラム113は、調停案生成プログラム112が生成した調停案を評価するプログラムである。調停案評価プログラム113が行う調停案評価処理の詳細は、
図7を参照しながら後述する。
【0037】
(1-2)個別システム2
個別システム2は、ハードウェアとして、記憶装置20と、入力装置21と、出力装置22と、プロセッサ23と、メモリ24と、バス25と、を有する。それぞれのハードウェアの機能及び具体例は、調停システム1のハードウェア構成の説明で上述したものと同様である。本実施形態で示す全体システムにおいては、同様の構成を有するN個の個別システム2が、通信システム(ネットワーク)3を介して調停システム1と接続される。
【0038】
記憶装置20には、個別システム2で実行されるプログラムや当該プログラムの実行の際に利用されるデータ等として、入出力プログラム201、行動決定プログラム202、行動決定パラメータ203、パラメータ更新プログラム204、及びデータベース205、が記憶される。
【0039】
入出力プログラム201は、入力装置21を用いてデータを受信し、出力装置22を用いてデータを送信する機能を持つプログラムである。
【0040】
行動決定プログラム202は、現在の生産状況、現在の受注状況、及び調停システム1からの調停案情報を取得し、行動決定パラメータ203とデータベース205に保存されたデータとを用いて、他の個別システム2に譲渡する注文数を決定するプログラムである。行動決定プログラム202は、具体的には例えば、生産中の製品数が一定数より大きく、かつ、今週の受注件数が一定数より大きい場合に、調停案で提示された数に対して行動決定パラメータ203に指定された割合だけ注文を譲渡する、というプログラムである。
【0041】
行動決定パラメータ203は、行動決定プログラム202が行動を決定する際に用いる1つ以上の数値からなるパラメータ情報である。行動決定パラメータ203は、具体的には例えば、調停案で提示された数に対して、実際に譲渡する割合を定めた数値である。
【0042】
パラメータ更新プログラム204は、データベース205に保存された情報を用いて行動決定パラメータ203を更新する機能を持つプログラムである。パラメータ更新プログラム204は、具体的には例えば、過去のデータに基づいて、得られる収益の期待値(個別KPI)が最大になるように行動決定パラメータ203を調整するプログラムである。
【0043】
データベース205は、過去の生産状況、受注状況、及び提示された調停案と、その調停案の合意に関する情報と、を保存する。データベース205に保存する情報には、例えば過去における受注件数の見積もり情報や、過去における行動決定パラメータ203等が含まれてもよい。
【0044】
(2)処理
以下では、(1)で説明した構成を備える全体システムにおいて、調停システム1及び個別システム2が実行する処理について説明する。
【0045】
図2は、調停システム処理の処理手順例を示すフローチャートである。調停システム処理は、調停システム1が実行する処理であって、複数の個別システム2から収集したデータと自身が保持する各種モデル及びデータ等とを用いて、モデルを学習し、調停案の生成及び評価を繰り返し、最終的に決定した調停案を出力する処理である。
【0046】
図2によればまず、調停システム1は、入出力プログラム106を用いて、個々の個別システム2から、現在の生産状況及び受注状況(受注数)に関する情報と、前回の調停案に従って注文の譲渡が行われたかの情報と、を入力装置11で受け付け、模擬モデル用データベース101に保存する(ステップS20)。
【0047】
次に、調停システム1は、モデル生成モジュール107を用いて、模擬モデル102及び学習モデル104を生成するモデル生成処理を行う(ステップS21)。モデル生成処理において、モデル生成モジュール107の模擬モデル生成プログラム108は、ステップS20で模擬モデル用データベース101に保存されたデータを用いて既存の模擬モデル102を学習することによって、今回の調停用の模擬モデル102を生成する。また、モデル生成処理において、モデル生成モジュール107の学習モデル生成プログラム109は、ステップS20で学習モデル用データベース103に保存されたデータを用いて、過去の模擬モデル102の学習過程(時間変化)を学習することによって、今回の調停用の学習モデル104を生成する。模擬モデル用データベース101に保存されるデータと模擬モデル102との関係については、
図4を参照しながら後述する。学習モデル用データベース103に保存されるデータと学習モデル104との関係については、
図5を参照しながら後述する。
【0048】
ステップS21でモデル学習を行った後、調停システム1は、ステップS22~S27において、調停案探索モジュール110を用いて、調停案の生成及び評価を繰り返し実行し、最終的に出力する調停案を生成する。個々のステップの処理を説明する。
【0049】
調停案探索モジュール110は、まず、調停案生成パラメータ111を設定する(ステップS22)。調停案生成パラメータ111は、前回の処理のものを引き継いでもよいし、新たに何らかのルールに従って、例えばランダムに設定し直す(更新する)ようにしてもよい。
【0050】
次に、調停案探索モジュール110は、調停案生成プログラム112を用いて調停案を生成する調停案生成処理を実行する(ステップS23)。調停案生成処理の詳細は、
図6を参照しながら後述する。
【0051】
次に、調停案探索モジュール110は、調停案評価プログラム113を用いて、ステップS23で生成した調停案を評価し、その評価値を算出する調停案評価処理を実行する(ステップS24)。ステップS24で算出される評価値は、少なくとも1つ以上の数値からなるデータで、それぞれの値が大きいほど望ましい状態を示すような指標である。調停案評価処理の詳細は、
図7を参照しながら後述する。
【0052】
次に、調停案探索モジュール110は、ステップS23で得た調停案と、ステップS24で得た評価値をメモリ14等に保存する(ステップS25)。またこの際、調停案探索モジュール110は、調停案生成処理(ステップS23)や調停案評価処理(ステップS24)で算出した変数やパラメータも、メモリ14等に保存するようにしてもよい。
【0053】
次に、調停案探索モジュール110(調停案評価プログラム113)は、ステップS24で得られた調停案の評価値が探索終了条件を満たしているかを判定する(ステップS26)。
【0054】
探索終了条件は、評価値に含まれる数値のうちの1つ以上を用いて定められる条件である。具体的には例えば、評価値が、全体システムにおける「全体KPI」と、各個別システム2に対する「個別KPI」と、各個別システム2における一定期間後の協力度合いの「予測値」とで構成される場合、この評価値は、1個の全体KPIと、N個の個別KPIと、N個の予測値、すなわち合計で2N+1個の数値で表される。この場合、評価値を構成する2N+1個の数値の重み付け和が、所定の閾値を超えたか否か、を探索終了条件とすることができる。なお、「全体KPI」は、N個の個別システム2を含むシステム全体において最大化したい指標であり、「個別KPI」は、個々の個別システム2において最大化したい指標であり、全体KPIと個別KPIは異なる指標であってもよい。
【0055】
なお、上記の具体例において、評価値の2N+1個の数値に対応する重みパラメータと、終了条件の判定に用いる閾値には、例えば予め固定値を与えてもよいし、調停システム処理を実行するたびに、外部から入力装置11を用いてユーザ等が設定するようにしてもよいし、前回までの調停結果に基づいて調停案探索モジュール110が設定するようにしてもよい。
【0056】
ステップS26の判定において、探索終了条件が満たされなかった場合(ステップS26のNO)、調停案探索モジュール110は、ステップS22に戻り、調停案生成パラメータ111を別の値に更新した上で処理を繰り返す。なおこのとき、調停案探索モジュール110は、予め定めたルールに従って(例えばランダムに)調停案生成パラメータ111を更新するようにしてもよいし、直近のステップS23~S24で得られた調停案及び評価値に基づいて調停案生成パラメータ111を調整し更新するようにしてもよい。
【0057】
ステップS26の判定において、探索終了条件が満たされた場合(ステップS26のYES)、調停案探索モジュール110は、直近のステップS23~S24で生成された調停案及び評価値を、最終的な結果としてメモリ14等に保存する(ステップS27)。なお、ステップS27において調停案探索モジュール110は、調停案及び評価値とともに、調停案生成処理(ステップS23)や調停案評価処理(ステップS24)で算出した数値やパラメータ、例えば将来における個別システム2の行動の予測に関する情報等を保存するようにしてもよい。
【0058】
ステップS27に次いで、調停システム1は、ステップS27でメモリ14に保存した情報を出力する調停案出力処理を行う(ステップS28)。調停案出力処理は、調停案探索モジュール110が入出力プログラム106を呼び出して行われ、具体的には例えば、ネットワーク3を経由して各個別システム2に調停案を通知したり、出力装置12に調停案を表示したりするものである。
【0059】
その後、調停システム1は、今回の調停システム処理を終了し、次回の個別システム2からの入力受付を待つ状態(ステップS20)に戻る。
【0060】
図3は、個別システム処理の処理手順例を示すフローチャートである。個別システム処理は、それぞれの個別システム2が実行する処理であって、自システムにおける生産状況や受注状況に関する情報を調停システム1に送信する他、調停システム1で決定された調停案を踏まえて自システムにおける行動を決定し実施する処理である。
【0061】
図3によればまず、個別システム2は、入出力プログラム201を用いて、自システムにおける生産状況及び受注状況(受注数)を入力装置21から受け入れ、データベース205に保存する(ステップS30)。
【0062】
次に、個別システム2は、パラメータ更新プログラム204を用いて、行動決定パラメータ更新処理を実行する(ステップS31)。具体的には、パラメータ更新プログラム204が、データベース205に保存された過去のデータに基づいて、自システムの行動の個別KPIが最大になるような行動決定パラメータを決定し、決定したパラメータで行動決定パラメータ203を更新する。
【0063】
次に、個別システム2は、入出力プログラム201を用いて、ステップS30で取得した生産状況及び受注状況に関する情報を、出力装置22からネットワーク3経由で調停システム1へ送信する(ステップS32)。なお、ステップS32で送信したデータは、
図2のステップS20の処理で調停システム1に受信される。調停システム1ではその後、ステップS21~S27の処理が実行され、決定された調停案がステップS28で個別システム2に送付される。
【0064】
次に、個別システム2は、
図2のステップS28で調停システム1から出力された調停案を、ネットワーク3を経由して入力装置21で受信し、データベース205に保存する(ステップS33)。
【0065】
次に、個別システム2は、行動決定プログラム202を用いて、自システムにおける今回の行動を決定する行動決定処理を実行する(ステップS34)。具体的には例えば、行動決定プログラム202が、データベース205に保存された情報(生産状況、受注状況)、ステップS31で決定された行動決定パラメータ203、及びステップS33で調停システム1から受け取った調停案に基づいて、生産数や他の個別システム2に譲渡する注文数を決定する。
【0066】
次に、個別システム2は、ステップS34で決定した行動を実施し(ステップS35)、一連の処理を終了する。ステップS35では、個別システム2は、ステップS34で決定した行動内容に従って、注文の譲渡または受領を行った上で、最終的な注文数に対して生産を開始する。
【0067】
図4は、模擬モデル用データベース101に保存されるデータの一例を示した図である。模擬モデル用データベース101は、個別システム2-1~2-Nの行動を予測する模擬モデル102-1~102-Nを生成するために必要な情報を保持する。
【0068】
具体的には、
図4に示したように、模擬モデル用データベース101には、過去の調停の実施回(
図2の調停システム処理を実行すると1回の実施回)ごとに、1回前の調停時のデータ40-1、2回前の調停時のデータ40-2、・・・、T回前の調停時40-Tが保存される。Tは任意の整数であり、予め設定された所定数としてもよいし、ユーザまたはプログラムが変更可能としてもよい。
【0069】
さらに詳しく言うと、各時点でのデータ40は、個別システム2ごとに、当該個別システム2における生産状況及び受注状況に関するデータ41と、当該個別システム2における注文の譲渡状況に関するデータ42と、当該個別システム2に提示した調停案に関するデータ43と、を含む。データ41(データ41-1~41-N)及びデータ42(データ42-1~42-N)は、
図2のステップS20で各個別システム2から受信した情報のデータに相当する。また、データ43(データ43-1~43-N)は、
図2のステップS28で各個別システム2に通知した調停案のデータに相当する。
【0070】
また、
図4には、調停システム処理内のモデル生成処理(
図2のステップS21)において模擬モデル生成プログラム108が生成する模擬モデル102と、模擬モデル用データベース101に保存されたデータとの関係性のイメージが示されている。具体的には、1回前(直近)の調停システム処理で生成された模擬モデル#1(模擬モデル102-1)は、1回前の調停時における個別システム#1の生産状況及び受注状況に関するデータ41-1と個別システム#1に提示した調停案に関するデータ43-1を入力変数とし、1回目の調停時に個別システム#1の譲渡状況(他システムに譲渡した受注数、及び他システムから譲渡された受注数)に関するデータ42-1を目的変数とするモデルであることが示されている。
【0071】
なお、
図4に示した模擬モデル用データベース101のデータと模擬モデル102との関係は、一例に過ぎず、これに限定されるものではない。他にも例えば、模擬モデル102は、後述する
図9で説明するように、調停案で提示した譲渡数に対する実際の譲渡数の割合を目的関数とするモデル等であってもよい。
【0072】
図5は、学習モデル用データベース103に保存されるデータの一例を示した図である。学習モデル用データベース103は、模擬モデル102-1~102-Nの学習過程を予測する学習モデル104-1~104-Nを生成するために必要な情報を保持する。
【0073】
具体的には、
図5に示したように、学習モデル用データベース103には、過去の調停の実施回(
図2の調停システム処理を実行すると1回の実施回)ごとに、1回前の調停時のデータ50-1、2回前の調停時のデータ50-2、・・・、T回前の調停時50-Tが保存される。Tは任意の整数であり、予め設定された所定数としてもよいし、ユーザまたはプログラムが変更可能としてもよい。
【0074】
さらに詳しく言うと、各時点でのデータ50は、当該時点での各個別システム2の模擬モデル102に関するデータ51と、当該時点で各個別システム2に提示した調停案に関するデータ52と、を含む。データ51(データ51-1~51-N)は、例えば、模擬モデル102-1~102-Nに用いられるパラメータである。また、データ52(データ52-1~52-N)は、
図2のステップS28で各個別システム2に通知した調停案のデータに相当する。
【0075】
また、
図5には、調停システム処理内のモデル生成処理(
図2のステップS21)において学習モデル生成プログラム109が生成する学習モデル104と、学習モデル用データベース103に保存されたデータとの関係性のイメージが示されている。具体的には、1回前(直近)の調停システム処理で生成された学習モデル#1(学習モデル103-1)は、過去の調停時のデータ50、すなわち2回前~T回前の調停時のデータ50-2~50-Nを入力変数とし、1回目の調停時のデータ50-1を目的変数とするモデルであることが示されている。
【0076】
図6は、調停案生成処理の処理手順例を示すフローチャートである。
図2のステップS23の説明で述べたように、調停案生成処理は、調停案生成プログラム112によって実行される。
【0077】
図6によればまず、調停案生成プログラム112は、調停案生成パラメータ111を初期化し、模擬モデル102-1~102-Nを模擬モデル用データベース101から読み出してメモリ14に保存する(ステップS60)。ステップS60において調停案生成プログラム112は、調停案生成パラメータ111を予め決められたルールに従って、例えばランダムに初期化してもよいし、その他の方法、例えば1回前の調停案生成時に用いたパラメータを初期値として用いてもよい。
【0078】
次に、調停案生成プログラム112は、ステップ変数tを0で初期化し、予測最大ステップ数Tを設定する(ステップS61)。調停案生成処理で用いるステップ変数tは、調停案生成プログラム112が現時点(t=0)から何回後の調停案を生成しているかを示す変数であり、予測最大ステップ数Tは、調停案生成プログラム112が最大で何回分の調停案の候補を出力するかを定める変数である。予測最大ステップ数Tは、予め設定されたルールに従って、例えば固定値が設定される。
【0079】
次に、調停案生成プログラム112は、ステップS60で設定した調停案生成パラメータ111に基づいて調停案を生成する(ステップS62)。調停案生成プログラム112は、例えば、各個別システム2において生産中の製品の数(生産中製品数)と受注した製品の数(受注数)との合計が調停案生成パラメータ111で指定される値を超えた場合に、超えた分だけ、自システムへの注文を他の個別システム2に譲渡するように提案する調停案を生成する。
【0080】
次に、調停案生成プログラム112は、ステップS62で生成した調停案を個別システム2-1~2-Nに提示した場合に、各個別システム2(またはその事業者)がどのような行動を取るかを、個別システム2ごとにそれぞれ、ステップS60でメモリ14に保存した模擬モデル102を用いて予測する(ステップS63)。ステップS63の予測により、個別システム2ごとの行動予測値が算出される。
【0081】
次に、調停案生成プログラム112は、ステップS62で生成した調停案を個別システム2-1~2-Nに提示した場合に、各個別システム2(またはその事業者)の行動がどのように変化するかを予測するために、学習モデル104-1~104-Nを用いて、メモリ14に保存した模擬モデル102を更新する(ステップS64)。すなわち、ステップS64の処理によって、学習後の模擬モデル102が算出される。
【0082】
次に、調停案生成プログラム112は、環境モデル105を用いて、次の調停時点における各事業者(各個別システム2)の生産状況及び受注状況等を予測する(ステップS65)。ステップS65の処理によって、次回の調停時点での生産状況及び受注状況の予測値が算出される。
【0083】
次に、調停案生成プログラム112は、ステップS63で算出した行動予測値と、ステップS64で算出した学習後の模擬モデル102と、ステップS65で算出した次回の調停時点における生産状況及び受注状況の予測値と、をメモリ14に保存する(ステップS66)。以下、ステップS66でメモリ14に保存したこれらの情報を、ステップtにおける「調停案および付随情報」と呼ぶ。
【0084】
次に、調停案生成プログラム112は、ステップ変数tがステップS61で設定した予測最大ステップ数T以上であるか否かを比較する(ステップS67)。
【0085】
ステップS67においてステップ変数tが予測最大ステップ数T未満である場合(ステップS67のNO)、調停案生成プログラム112は、調停案生成パラメータ111を更新し、ステップ変数tにt+1を代入し(ステップS68)、ステップS62の処理に戻る。ステップS68において調停案生成パラメータ111は、予め定めたルールに従って、例えばランダムに更新される。
【0086】
ステップS67においてステップ変数tが予測最大ステップ数T以上である場合(ステップS67のYES)、調停案生成プログラム112は、ステップ0からステップTまでの調停案および付随情報を記憶装置10に保存し(ステップS69)、調停案生成処理を終了する。
【0087】
図7は、調停案評価処理の処理手順例を示すフローチャートである。
図2のステップS24の説明で述べたように、調停案評価処理は、調停案評価プログラム113によって実行される。
【0088】
図7によればまず、調停案評価プログラム113は、ステップ変数tを0で初期化し、評価最大ステップ数Tを設定する(ステップS70)。調停案評価処理で用いるステップ変数tは、調停案評価プログラム113が現時点(t=0)から何回後の調停案を評価しているかを示す変数であり、評価最大ステップ数Tは、調停案評価プログラム113が最大で何回分の調停案の候補を評価するかを定める変数である。評価最大ステップ数Tは、予め設定されたルールに従って、例えば固定値が設定される。なお、調停案生成処理で用いた予測最大ステップ数Tと調停案評価処理で用いる評価最大ステップ数Tは、同値であってよい。
【0089】
次に、調停案評価プログラム113は、ステップtにおける調停案および付随情報、すなわち、個別システム2に提示する調停案と、個別システム2の行動予測値と、個別システム2の学習後の模擬モデル102とを取得し、メモリ14等に保存する(ステップS71)。
【0090】
次に、調停案評価プログラム113は、ステップS71で保存した情報に基づいて、各個別システム2の個別KPIを算出する(ステップS72)。各個別システム2の個別KPI(個別KPI)とは、例えば、各個別システム2がステップtで選択した行動の実施によって得た利益である。
【0091】
次に、調停案評価プログラム113は、ステップS71で保存した情報に基づいて、全体KPIを算出する(ステップS73)。全体KPIとは、複数の個別システム2-1~2-Nを含むシステム全体で最大化したい指標のことで、例えば、ステップS72で算出した各個別システム2の個別KPIの合計である。
【0092】
次に、調停案評価プログラム113は、ステップS71で保存した情報に基づいて、各個別システム2の協力度合いを算出する(ステップS74)。協力度合いとは、例えば、調停システム1が提示する調停案において提示される譲渡数に対して、実際にいくつの譲渡を行ったかを評価した値である。具体的には例えば、調停案評価プログラム113は、ステップS71で保存したステップtにおける学習後の模擬モデル102を用いて、様々な状況下で個別システム2が譲渡の提案を承諾するかを調べることによって、協力度合いを算出することができる。
【0093】
次に、調停案評価プログラム113は、ステップS72で算出した個別KPIと、ステップS73で算出した全体KPIと、ステップS74で算出した各個別システム2の協力度合いの評価値と、をメモリ14に保存する(ステップS75)。以下、ステップS75でメモリ14に保存したこれらの数値を、ステップtにおける「全評価値」と呼ぶ。
【0094】
次に、調停案評価プログラム113は、ステップ変数tがステップS70で設定した評価最大ステップ数T以上であるか否かを比較する(ステップS76)。
【0095】
ステップS76においてステップ変数tが評価最大ステップ数T未満である場合(ステップS76のNO)、調停案評価プログラム113は、ステップ変数tにt+1を代入し(ステップS77)、ステップS71の処理に戻る。
【0096】
ステップS76においてステップ変数tが評価最大ステップ数T以上である場合(ステップS76のYES)、調停案評価プログラム113は、ステップ0からステップTまでの全評価値に基づいて、最終的な評価値を算出してメモリ14に保存し(ステップS78)、調停案評価処理を終了する。なお、「最終的な評価値」とは、現在時点から評価最大ステップ数Tに相当する所定の将来時点までの期間について、複数の数値で定義された調停案全体の良さを表す指標であって、具体的には例えば、ステップ0からステップTまでの、個別KPI、全体KPI、及び協力度合いの、それぞれの平均値で算出することができる。
【0097】
(3)具体例
以下、
図8から
図14を参照しながら、モデル生成処理(
図2のステップS21)、調停案生成処理(
図2のステップS23)、及び調停案評価処理(
図2のステップS24)の具体例と、調停システム1から得られる効果について説明する。
【0098】
以下に説明する具体例では、調停システム1を生産配分問題を調停するシステムとし、最も簡単な例として事業者数N=2(すなわち、全体システムにおいて個別システム2が2つ)とする。
【0099】
2つの個別システム#1,#2は、全体システムにおいて、同じ会社に属する2つの支社#1(事業者#1)及び支社#2(事業者#2)が独立して運用するシステムである。各支社は、それぞれ独立に製品を受注し、製品の生産及び納品を行う事業を行う。各支社は、一定の売価で製品を販売しており、売価から生産コストを引いた粗利を最大化することを目的としている(個別KPI)。一方、各支社を統括する本社(システム全体)の目標は、支社#1と支社#2の粗利の合計を最大化することである(全体KPI)。
【0100】
製品の生産コストは、後述する
図8に示すように、生産中の製品数(生産中製品数)によって変動し、生産中の製品数が多いと増加する傾向にある。これは、工場の好適な生産能力(キャパシティ)を超えた場合に、残業や外注による追加のコストが発生すること等に起因する。各支社は、毎週に一度、製品の受注をまとめて生産を開始するが、週ごとに、他支社に注文を譲渡することができる。
【0101】
図8は、個別システム2における生産コストの構造例を示すグラフである。
図8に示すグラフにおいて、横軸は、受注時点において工場で生産中の製品数(生産中製品数)、縦軸は、追加で製品を1個生産するのにかかる生産コストである。生産コストは、支社#1と支社#2で同じとする。
【0102】
図8に実線で示したグラフ801は、自支社で受注した注文を自支社の工場で生産する場合の生産コストの時系列変化を表す。グラフ801が示すように、自支社で受注した場合は、生産中製品数が工場の通常営業で生産可能なキャパシティである30個を超えない限りは、一定の生産コスト「5」で製品を生産することができる。一方、生産中製品数がキャパシティである30個を超えると、生産コストが増加し、生産中製品数が60個になると、生産コストが売価と等しい「15」になって利益は「0」となる。
【0103】
図8に一点鎖線で示したグラフ802は、他支社から譲渡された注文を自支社の工場で生産する場合の生産コストの時系列変化を表す。このグラフ802では、自支社で受注した注文の生産コスト(グラフ801)に比べて、支社間の注文の譲渡に伴うコスト「5」が一律に生産コストに追加される。このようなコスト構造では、自支社の生産中製品数が45個以上で、かつ、他支社の生産中製品数が自支社の生産中製品数に比べて15個以上少ない場合には、自支社の注文を他支社に譲渡することで、全支社の合計の利益は増加する。すなわち、全体KPIを高めることができる。
【0104】
一方、自支社を中心に考えると、注文を譲渡した支社単体では利益は減少し(個別KPIが減少し)、注文が譲渡された支社では利益が増加する(個別KPIが増加する)ことから、各支社が単純に自支社の利益を最大化するように行動した場合には、生産中製品数が60個を超えて赤字になる場合を除いて、自支社から他支社への譲渡は発生しない。しかしこの場合、上述した適度な譲渡が支社間で行われる場合に比べて、全支社の合計の利益の増加幅は小さくなる。すなわち、各支社(各個別システム2)がそれぞれの個別KPIの最大化を追及する行動を実施した場合、全体KPIが最大化されない状況が発生し得る。
【0105】
図9は、模擬モデル用データベース101に保存されるデータの具体例を説明するグラフである。
図9は、支社#1の個別システム2に関して調停システム1が模擬モデル用データベース101に保存するデータについて、現在時点の「O」から遡って100週分の各種データをグラフ化したものである。
【0106】
図9(A)のグラフ900は、支社#1における生産中製品数のデータを、時系列で示したグラフである。横軸は、データを取得した週を示す。例えば「O-25」は、現在時点の「O」よりも25週前であることを意味する。以降に参照する他図でも同様の横軸を採用しており、説明を省略する。縦軸は、データの取得時点において支社#1で生産中の製品の個数(生産中製品数)を示す。
【0107】
図9(B)のグラフ910は、支社#1から他支社(支社#2)に譲渡した注文数(譲渡数)、及び他支社(支社#2)から支社#1に譲渡された注文数(被譲渡数)を、時系列で示したグラフである。横軸は、グラフ910と同様にデータを取得した週を示す。縦軸は、データを取得した週に譲渡した、または譲渡された注文の数を示す。
【0108】
図9(C)のグラフ920は、調停案で提示された譲渡数に対する実際の譲渡数の比を時系列で示したグラフである。横軸は、グラフ910,920と同様にデータを取得した週を示す。縦軸は、データを取得した週の前の週に提示した調停案が示した譲渡数に対して、データを取得した週に実際に他支社に譲渡した注文数の割合(以下「調停案受入割合」と称する)を示す。
【0109】
調停システム1は、調停システム処理内のモデル生成処理(
図2のステップS21)において、グラフ900,910,920が表すデータを用いて、生産中の製品数と、調停案で提示した譲渡数とを入力とし、調停案受入割合を出力とする模擬モデル102を、例えばニューラルネットワークで実装された関数を用いて実装し、教師有り学習を行うことによって生成する。
【0110】
また、調停システム1は、モデル生成処理(
図2のステップS21)において、ある期間のデータのみを用いて生成した模擬モデル102と、別の期間のデータを用いて生成した模擬モデル102との変化を分析することにより、個別システム2の行動の変容を推定する学習モデル104を生成する。
図9に示した具体例の場合、学習モデル104-1は、グラフ920のデータから、調停案受入割合が25週ごとに大きく変化することを、例えばグラフ920に対してフーリエ変換を行って周波数を分析することによって算出する。また、学習モデル104-1は、一定期間(例えば25週間)内に譲渡された注文数が所定数よりも多い場合に次の25週の期間における調停案受入割合が増加することを、例えば、ある異時点での調停案受入割合とそれより前の25週において譲渡された注文数との相関を分析することによって算出する。
【0111】
図10は、個別システム2における生産状況に対する調停案の一例を説明するためのグラフである。
図10は、支社#1と支社#2の個別システム2に関して調停システム1が模擬モデル用データベース101に保存するデータを用いて、現在時点から遡って20週分(すなわち、「O」~「O-20」)の生産中製品数と、支社#1と支社#2との間で譲渡された注文数(譲渡量、被譲渡量)とをグラフ化したものである。
【0112】
図10において、横軸はデータを取得した週を示し、縦軸はデータの取得時点における各支社の生産中製品数を示す。
図10に実線で示したグラフ1001は、支社#1の生産中製品数の変化を表し、一点鎖線で示したグラフ1002は、支社#2の生産中製品数の時系列変化を表す。
【0113】
図10によれば、O-19週からO-11週付近において、支社#1が調停案に従って注文を支社#2に譲渡している(譲渡量1003,被譲渡量1004)。その後、支社#1の生産中製品数は減少し、支社#2の生産中製品数は増加しているが、両者の差が大きくないため、支社間で譲渡は発生していない。
【0114】
上述した
図10の状況において、仮に、調停システム1が学習過程を考慮せずに全体KPIを最大化する調停案を生成する場合、現在時点Oにおいて支社#1と支社#2の生産中製品数の差は15個以下であり、
図8で示したコスト構造によれば譲渡をしても全体KPIが増加しないことから、調停システム1は譲渡の提案をしない(譲渡を提案しない調停案を生成する)。
【0115】
図11は、個別システム2における生産状況に対する調停案の別例を説明するためのグラフである。
図11は、
図10と同様に、支社#1と支社#2の個別システム2に関するデータを用いて、各支社における生産中製品数と注文数の譲渡とをグラフ化したものであり、グラフの構成等については説明を省略する。
図10との相違点として、
図11では、調停システム1が、学習過程を考慮して調停案を提案する。
【0116】
図10で説明した譲渡を提案しない調停案は、調停案評価プログラム113による調停案評価処理(
図2のステップS24,
図7)を行った際に、支社#1の調停案受入割合が減少することを予測し、
図7のステップS74で算出される支社#1の協力度合いの評価値が低くなる。
【0117】
一方、
図11では、現在時点「O」において、支社#2に注文の譲渡(譲渡量1101)を提案する調停案が提案される。この調停案は、短期的には全体の利益を減少させるため、
図7のステップS73で算出される全体KPIの評価値が低くなってしまうが、ステップS74で算出される支社#2の協力度合いの評価値は高くなる。長期的に協力度合いの評価値が高くなれば、調停案が提案する譲渡が受け入れられやすくなり、将来的には全体KPIを高める効果に期待できる。協力度合いの評価値を高めるためには、調停システム処理の探索終了条件(
図2のステップS26)において、例えば、「最終的な評価値」に含まれる協力度合いの評価値が一定以上(所定の閾値以上)であることを要求するようにプログラムを設定すればよい。この結果、調停システム1は、
図11に示すような調停案を生成及び出力することができ、長期的な協力度合い及び将来的な全体KPIを向上させることができる。
【0118】
以上、調停システム1による調停の具体例として、製品を生産する複数の個別システム2に対する生産配分問題の調停を説明したが、本実施形態に係る調停システム1は、個々が独立して個別の重要業績評価指標(個別KPI)が高まるように自身の行動を決定する複数の個別システム2を包括する全体システムに対して広く適用可能であり、調停システム1は、調停案の生成において、このような全体システムにおいて個別の重要業績評価指標とは異なる全体の重要業績指標(全体KPI)が高まるように譲渡の数量を算出するものである。また、上述した生産配分問題の具体例では、調停システム1が生成する調停案は、他支社(他の個別システム2)への注文の譲渡数を提案するものであったが、本実施形態に係る調停システム1が生成する調停案の内容は「注文」の譲渡数に限定されるものではなく、個別システム2の行動の決定に関わる「所定要因」について、その譲渡を提案するものであればよい。
【0119】
以上のことから、本実施形態に係る調停システム1は、個々が独立して個別の重要業績評価指標が高まるように自身の行動(例えば製品の生産)を決定する複数の個別システム2に対して前記行動に関連する調停案を提示する調停システムであって、モデル生成モジュール107と調停案探索モジュール110とを備えるシステムである、と言うことができる。ここで、モデル生成モジュール107は、各個別システム2の行動を推定する模擬モデル102と、模擬モデル102の時系列変化に基づいて各個別システム2の行動の変容を推定する学習モデル104と、を生成するモジュール(プログラム)であり、モデル生成モジュール107と調停案探索モジュール110は、模擬モデル102及び学習モデル104を用いて、個別システム2の行動の決定に関わる所定要因(例えば注文数)の個別システム間での譲渡を提案する調停案を生成して個別システム2に提示するモジュール(プログラム)である。そして、このような調停システム1によれば、各個別システム2の行動の変容を考慮した調停案を生成することができる。
【符号の説明】
【0120】
1 調停システム
2 個別システム
3 通信システム(ネットワーク)
10 記憶装置
11,21 入力装置
12,22 出力装置
13,23 プロセッサ
14,24 メモリ
15,25 バス
101 模擬モデル用データベース
102 模擬モデル
103 学習モデル用データベース
104 学習モデル
105 環境モデル
106 入出力プログラム
107 モデル生成モジュール
108 模擬モデル生成プログラム
109 学習モデル生成プログラム
110 調停案探索モジュール
111 調停案生成パラメータ
112 調停案生成プログラム
113 調停案評価プログラム
201 入出力プログラム
202 行動決定プログラム
203 行動決定パラメータ
204 パラメータ更新プログラム
205 データベース