(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0008】
本実施形態は、確率的統合補充問題(SJRP)を解決するための新しい方法を提示する。SJRPは、例えば、発注毎の段取り費用、保有費用率、固定ペナルティ費用、及び比例ペナルティ費用率などの費用及び費用率が、需要が確率的である場合に、在庫における各品目種別の水準(又は、量)によって決まる、品目の組で構成される在庫についての最適発注ポリシーを決定することに関する。本教示は、SJRPに対する最適解決法に近く、実際には、最適解決法の有限範囲内にとどまる、新しい組の発見的手法の説明を含む。
【0009】
本明細書に用いられる「ポリシー」という用語は、システムの状態を発注の決定にマッピングする機能を指し、「在庫」という用語は、保管し、発注し、要求することなどが可能なあらゆる製品を含む。本明細書に用いられる「製品」とは、例えば、営業上の信用、発注、研究プロジェクト等の抽象的な品目、並びに、例えば、衣類、株、予備部品、事務用品等の有形の品目を含むことができる。例えば、「研究プロジェクト」の在庫等の抽象的製品を用いる場合、保有費用は、プロジェクトの結果を利用するために知識を維持することに対応することができ、ペナルティ費用は、特定の分野において新しい結果を実証できなかったことに対応することができ、また、研究テーマ間の相乗効果により、発注における規模の経済があり得る。また、本明細書に用いられる「ポリシー」、「在庫ポリシー」、「補充ポリシー」等は交換可能であり、システムの状態を発注の決定にマッピングする機能を指す。
【0010】
図1は、以下に説明される在庫ポリシーを用いることができる例示的な在庫システム100を示す。在庫システム100は、複数の品目110、120、130...、Nの物理的在庫105を含むことができ、この物理的在庫105に、各々の品目110、120、130...、Nの1つ又はそれ以上があり得る。また、在庫システム100は、本教示による在庫ポリシーを用いて、品目110、120、130...、Nの少なくとも1つを、いつ追加発注するかを追跡する在庫管理システム150を含むことができる。在庫管理システム150は、供給業者140、142...、Zの少なくとも1に、補充在庫を発注することができる。各供給業者140、142...、Zは、単一の品目(例えば、110又は120)或いは品目の組み合わせ(例えば、110と120と130)を供給することができる。在庫システム100はまた、顧客160を含むことができる。
図1の矢印で示されるように、顧客160は、品目の組に対する需要とも呼ばれる、品目の組を発注する。この需要を、在庫管理システム150に送ることができ、在庫管理システムは次いで、物理的在庫105を確認し、要求された品目の組があるかどうか、或いは、要求された品目の組の幾つかの組み合わせを発注して物理的在庫105を補充し、顧客の需要を満たす必要があるかどうかを判断する。物理的在庫105に要求された品目の組又はその幾つかの組み合わせがある場合には、示されるように、入手可能な要求された品目を、顧客160に供給することができる。しかしながら、物理的在庫105が、要求された品目の組の全て又は一部を含んでいないか、又は、需要が物理的在庫105を使い尽くしてしまう場合には、在庫管理システム150は、供給業者140、142...、Zに補充品を発注することができる。
【0011】
以下に説明されるポリシーは、少なくとも1つの品目110、120、130、...、Nに対する需要がランダムであるときに、在庫システム100についての平均運転費用(average operating cost rate)率を最小にするために、在庫管理システム150により使用することができる。
図2に示すように、在庫管理システム150は、命令の組を実行することができ、例えば、プロセッサ202と、メモリ204と、他の周辺コンポーネント206と、入力/出力コンポーネント208とを含む一般的なコンピュータ200又は複数のコンピュータ(図示せず)を含むことができる。また、在庫管理システム150は、当業者には周知であるような、付加的なメモリ210と、付加的な入力/出力コンポーネントと、他の周辺コンポーネント230(例えば、受信機、送信機、表示装置、キーボード、記憶装置等)とを含むことができる。
【0012】
以下の教示は、種々の定義、仮定、及び式を含む。
SJRPは、i=1、...、nにより指数化されたn個の品目を有することができる。各々の品目の在庫持ち高(inventory position)x
iは実数であり、多くの場合、整数のような部分集合により制限され得る。これらをコンパイルして、在庫持ち高n−ベクトルxを形成することができる。在庫持ち高は、手持ちの物理的在庫に、注文中の在庫を足し、そこから受注残を引いたものとして定義される。主要な発注段取り費用は、数k>0として定義され、在庫ポリシーは、常時、あらゆる品目の組の在庫持ち高を、費用kに対して、厳密により高い値に設定することができると解釈される。以下の説明では、あらゆる重要でない発注段取り費用(例えば、品目の組を発注する費用に加えて、特定の品目の発注と関連した固定費用)は、僅かなものであると仮定される。品目iについての品目費用率c
i(x
i)は非負であり、凸状であり、強制的である。本明細書において、「強制的(coercive)」という用語は、在庫持ち高が、無限に増減する傾向があるとき、無限に増加する費用を指し、
【数1】
であり、従って、あらゆる合理的ポリシーが非常に大量の発注をしないように、又は、受注残が非常に大きい値まで累積しないように強制する。品目在庫持ち高がx
iであるとき、ポリシーは、常に、単位時間当たり、量
【数2】
を支払わなければならない。
【0013】
時間tにおける、かつ、非負のn−ベクトルxについての需要確率密度(又は分布)関数Pr(t,d)は、以下ように解釈される。時間〔t,t+dt〕において、需要ベクトルdが、確率Pr(t,d)dtにより導かれ、品目iの在庫持ち高は、直ちに、x
i−d
iにジャンプする。本明細書に用いられる需要は、率λ>0及びジャンプ・サイズ分布G(d)を有する複合ポアソン過程であると仮定される。これは、
【数3】
により与えられる連続時間確率過程(continuous−time stochastic process)
【数4】
であり、ここで、
【数5】
は、率λを有するポワソン過程であり、
【数6】
は、分布G(d)を有する独立同一分布ランダム変数であり、同じく、
【数7】
から独立している。
【0014】
SJRPを説明する1つの方法は、ポリシー πの平均運転費用率を最小にする問題である。
【数8】
このポリシーについて、x
i(t)は、時間tにおける品目iの在庫持ち高であり、n
order(T)は、時間Tまでにポリシーによりなされた発注数であり、予測は、時間間隔
【数9】
で、ポリシー及び需要確率密度関数により与えられたx
i(t)の全てのサンプル経路にわたる。初期状態は、x
i(0)=0となるように選択することができる。
【0015】
SJRPについてのポリシーのサイクルは、2つの発注の間の期間である。品目保有費用率及びペナルティ率h
i(x
i)、p
i(x
i)は、h(x
i)+p
i(x
i)=c
i(x
i)を満たす品目費用率を分解したものである。両方の率は、品目在庫持ち高の凸関数であり、h
iはx
iにおいて増加しなければならないが、p
iはx
iにおいて減少しなければならない。卓越する保有費用率、卓越するペナルティ率及び卓越する費用率は、それぞれ
【数10】
により定義される、対応する品目費用率にわたる合計である。
【0016】
しばしば、保有費用及びペナルティ費用は、リードタイム分布及び固定対比例ペナルティに関して説明される。この説明は、費用率を得るのに重要であり得るが、本説明には不要であるc
i(x
i)のような凸関数をもたらすにすぎない。本明細書において、保有費用は、在庫持ち高に伴って減少しない費用であり、ペナルティ費用は、在庫持ち高に伴って増加しない。保有費用及びペナルティ費用は、あらゆる特定の適用において、多様な構成要素を有することができる。例えば、保有費用は、買収又は他のビジネス行為を行なうために手元に資金を有するのとは対照的に、在庫に投資してある資金を有する機会費用に対応することができる。保有費用は、品目を保管するための空間を借りる又は所有する費用を含むこともできる。最後に、保有費用は、例えば、品目が盗難に遭うリスクがある場合、又は危険(例えば、爆薬、有害性化学物質、放射性物質等)と関連している場合、多数の品目を有することに関連したセキュリティ及び安全の費用に対応することもできる。ペナルティ費用は、例えば、店に在庫がないことにより販売ができなかったとき、装置を修理又は保守するための適切な部品をその場に持っていなかったために技術者が顧客のもとに別途訪問しなければならないとき、部品がないために航空機を修理又は保守できないことから航空機の顧客に補償しなければならないとき等、需要を満たすために品目を直ちに配送できない都度の固定費用を含むことができる。需要を満たすことができるまで時間と共に増加する、比例ペナルティ費用もあり得る。比例ペナルティ費用は、例えば、修理されるまで装置を用いることができない顧客に対する機会費用として、将来の顧客資産価値の減少を招く顧客満足の減少として、遅延又は休止時間に対する契約上のペナルティとして、食料が供給されない場合に引き起こされる苦痛として生じる。
【0017】
再帰集合を結合させる定常マルコフ連鎖の状態のある関数の平均値は、再帰状態xからの任意の経路に沿った関数の予測値であり、次にその状態に戻ることは、更新理論の基本的な結果である。換言すれば、発注において常にある状態Sに戻る複合ポワソンSJRPに対するポリシーの平均運転費用率は、そのサイクルについての予測時間で割った、サイクルに発生した予測費用である。
【0018】
最適発注ポリシーを特徴付けるために、以下の定義を用いることができる。マルコフ決定問題(MDP)の状態xにおいてとられる動作の分布が状態xのみに依存する場合には、ポリシーは定常である。タイとは、ポリシーの価値関数を1より多い可能な次の動作によって達成することができる状態である。指数関数状態の継続時間(例えば、複合ポワソン過程により駆動されるMDP)を有するいずれの定常連続時間MDPも、離散時間MDPに対応するように、離散化及び均一化できることは、周知である。ランダム変数{X
1,X
2,...}のシーケンスに関する停止時間は、ランダム変数τであり、(i)各々のtについて、イベントτ=1が発生するか又は発生しないかは、{X
1,X
2,...,X
t}の値にのみ依存する、及び、(ii)Pr(τ<∞)=1である、という特性を有する。
【0019】
停止規則は、2動作MDPに対するポリシーである(換言すれば、ここでは発注する及び発注しないに対応する、停止する及び停止しないという2つの動作があるMDP)。停止規則が決定的である(すなわち、停止規則が所与の状態に対して1つの動作だけを特定する)場合、規則は、停止規則が停止するように言う、状態の停止集合σ、及び、停止規則が停止しないように言う、集合σの補集合である、状態の継続集合
【数11】
に関して定義することができる。規則が停止を要求するいずれかの状態xにおいて、規則が、停止しないことによりxから到達可能ないずれの状態においても停止を要求する場合、停止規則はMDPに対して単調である。
【0020】
ペナルティ率閾値ポリシー(Q
p,S)は、卓越するペナルティ率がさもなければΩ
pと等しいか又はこれを上回るときに、補充点Sまで発注することとして定義される。費用率閾値ポリシー(Ω
c,S)は、卓越する費用率がさもなければΩ
cと等しいか又はこれを上回るときに、Sまで発注することとして定義される。マーチンゲール・スイッチ・ポリシー(Ω
c1,Ω
c2,S)は、状態x
tにおける費用率c(x
t)が、
【数12】
を満たすときに、Sまで発注するものとして定義される。
【0021】
ポリシーの定義を考慮すると、適切な費用率閾値ポリシー及び適切なペナルティ率閾値ポリシーの継続集合
【数13】
は、
【数14】
が、定常である、補充点Sに対する最適ポリシーπ
*の継続集合であり、タイの場合には継続より発注を指向するとき、特性
【数15】
を満たす。ポリシーは、ポリシー費用が決して最適ポリシーの費用のα倍より多くない場合には、α近似である。さらに、任意の補充点S及び複合ポワソン需要について、Sを用いて、最適ポリシーの3近似であるペナルティ率閾値ポリシー(Ω
p,S)を求めることができる。
【0022】
図3は、
図2の在庫管理システムにより実行することができるような、
図1の在庫システムを管理するステップを示すフローチャートである。ステップS300において、在庫品目について在庫持ち高が追跡される。ステップS310において、追跡された在庫持ち高に基づいて、在庫品目についての品目費用率が求められる。次にステップS320において、求められた品目費用率に基づいて、総費用率が求められる。ステップS330において、総費用率は費用率閾値と比較され、最後に、比較された総費用率が費用率閾値より大きいか又はこれと等しい場合、在庫品目について、補充点Sまで発注がなされる。費用率閾値は、ペナルティ率閾値とすることができ、ここで、在庫品目についての卓越するペナルティ費用率がペナルティ率閾値より大きいか又はこれと等しい場合、在庫品目が補充点Sまで発注される。代替的に、費用率閾値は、2つの費用率閾値を含むことができる。第1の費用率閾値は、総費用率が減少しているときに適用され、第2の費用率閾値は、総費用率が増加しているときに適用される。総費用率が第1又は第2の閾値より大きいときに、発注がなされる。
【0023】
図4において、在庫システム(例えば、
図1の100)についての費用率閾値ポリシー(Ω
c,S)を決定するための方法の例示的な実施形態が示される。ステップS400は、最初に、在庫システム100についての保有費用、ペナルティ費用、主要な発注段取り費用、及び需要分布(すなわち、運転費用パラメータ)を特定する。ステップS410において、種々の周知のSJRPポリシー(例えば、QSポリシー、キャンオーダー・ポリシー、定期的見直しポリシー、Q(s,S)ポリシー等)によって最初に特定された費用に基づいて、補充点Sが選択される。
【0024】
次のステップにおいて、ステップS420に従って、需要シナリオがサンプリングされる。需要シナリオζは、構成要素d
i(t)が、時間tにおいて、品目iのうちの幾つが要求されたかを示す、需要ベクトルd(t)のシーケンスとして表される。各々の需要シナリオζについて、在庫持ち高x
i(t)、卓越する費用率c
ζ(t)、及び総費用C
ζ(t)が、以下の再帰式:
【数16】
によりステージtまで追跡される。
【0025】
当業者には明らかであるように、式(6)(要求された品目のみにわたって加算することにより、総費用率を再帰的に更新する)は、全ての品目にわたって加算することと等しいが、多数の品目があり、需要が僅かである場合、典型的には、全ての品目にわたって加算するよりはるかに効率的である。卓越する費用率が、所定のシナリオについての任意の所定の閾値と初めて等しくなる又はこれを上回るのを見つけることは、簡単である。上記を、閾値にわたる検索及び平均運転費用率の決定と結合することにより、閾値の最適な選択を見積もることができる。検索する閾値の範囲は、明らかに、シナリオのいずれかにおいて観察される卓越する費用率の全ての集合に制限することができる。
【0026】
同じく当業者には明らかであるように、常に検索を繰り返し行なって、卓越する費用率が所与の閾値と初めて等しくなる又はこれを上回るときを求めるのを回避し、これによりプロセスを著しく効率的にすることができる。ステップS430に示されるように、少なくとも1つのサンプリングされた需要シナリオ、少なくとも1つの費用率閾値、及び補充点Sの少なくとも1つの組み合わせについて、総費用及び総時間を求めることができる。例えば、各シナリオζについて、卓越する費用率の累積(すなわち、履歴)最大値ω
ζ(k)のシーケンス、及び、初めて卓越する費用率がω
ζ(k)に達するkにより指数化された対応する時間ステップt
ζ(k)を予め求めることができる。所定のシナリオζについて、時間t
ζ(k)までの総費用C
ζ(k)を求めることもできる。対応する履歴シーケンス
【数17】
は、シナリオについての費用を有益に評価できる全ての可能な別個の費用率閾値に対応する。
【0027】
ステップS440において、増大するωの順番に、全ての需要シナリオにわたってシーケンスH
ζを辿ることにより、費用率閾値Ω
cの関数として、平均運転費用率R(Ω
c)が求められる。
【数18】
【0028】
式(3−7)は、時間の関数として総費用を有したが、式(8)は、
【数19】
を定義することにより、卓越する費用率閾値ωの関数として、総費用及び時間を処理し、ここで、kは、次の卓越する費用率ω
ζ(k+1)がその閾値と等しいか又はこれを上回る、履歴シーケンスにおける第1の指数であり、すなわち
【数20】
である。
【0029】
このプロセスの実行時間は、勿論、問題の規模により変化するが、多数の品目、シナリオ及び費用率閾値にわたる密な検索においてさえ実用的なままである。最後のステップS450において、求められた平均運転費用率に基づいて、在庫システムについて、単一の費用率閾値Ω
cが選択される。選択された費用率閾値Ω
cは、在庫システム(例えば、100)についての需要シナリオにわたる平均運転費用率を最小にすることができる。当業者には明らかであるように、在庫システムについての平均運転費用率を最小にするのではなく、例えば、システム要件、顧客要件、在庫の種類等に基づいて、総運転費用率についての適度に低い値を達成する費用率閾値Ω
cを代わりに選択することもできる。
【0030】
以下は、
図5に示すような(Ω
p,S)ポリシーを決定する方法の例示的な実施形態である。これは、卓越する費用率を閾値化するのではなく、卓越するペナルティ率を閾値化する点を除いて、上述の費用率閾値ポリシー(Ω
c,S)を決定する方法と同様に進む。ステップS500は、最初に、在庫システム(例えば、在庫システム100)についての保有費用、ペナルティ費用、主要な発注段取り費用、及び需要分布を特定する。ステップS510において、種々の周知のSJRPポリシー(例えば、QSポリシー、キャンオーダー・ポリシー、定期的見直しポリシー、Q(s,S)ポリシー等)によって最初に特定された費用に基づいて、補充点Sが選択される。
【0031】
次のステップにおいて、ステップS520に従って、需要シナリオがサンプリングされる。各需要シナリオζについて、卓越する費用率c
ζ(t)、卓越するペナルティ率p
ζ(t)、及び総費用C
ζ(t)が、以下の再帰式:
【数21】
によって、ステージtまで追跡される。
【0032】
上記を、ペナルティ率閾値にわたる検索及び平均運転費用率の決定と結合することにより、閾値の最適な選択を見積もることができる。
【0033】
同じく当業者には明らかであるように、総当たりの検索を繰り返し行なって、初めて、卓越するペナルティ率が所与の閾値と初めて等しくなる又はこれを上回るときを求めるのを回避し、これによりプロセスを著しく効率的にすることができる。ステップS530に示されるように、少なくとも1つのサンプリングされた需要シナリオ、少なくとも1つのペナルティ率閾値、及び補充点Sの少なくとも1つの組み合わせについて、総費用及び総時間を求めることができる。例えば、各シナリオζについて、卓越するペナルティ率の累積(すなわち、履歴)最大値ω
ζ(k)のシーケンス、及び、初めて卓越するペナルティ率がω
ζ(k)に達する、kにより指数化された対応する時間ステップt
ζ(k)とを予め求めることができる。所与のシナリオζについて、時間t
ζ(k)までの総費用C
ζ(k)を求めることもできる。対応する履歴シーケンス
【数22】
は、シナリオについての費用を有益に評価できる全ての可能な別個の費用率閾値に対応する。
【0034】
ステップS540において、増大するωの順番に、全ての需要シナリオにわたってシーケンスH
ζを辿ることにより、ペナルティ率閾値Ω
pの関数として、平均運転費用率R(Ω
p)が求められる。
【数23】
【0035】
式(14)は、いずれの卓越するペナルティ率閾値ωについても、自然定義
【数24】
を用い、ここで、kは、次の卓越する費用率ω
ζ(k+1)がその閾値と等しいか又はこれを上回る、履歴シーケンスにおける第1の指数であり、すなわち
【数25】
である。
【0036】
このプロセスの実行時間は、勿論、問題の規模により変化するが、多数の品目、シナリオ及び費用率閾値にわたる密な検索においてさえ実用的なままである。最後のステップS550において、在庫システム(例えば、100)の閾値として、需要シナリオにわたる平均運転費用率を最小にする単一のペナルティ率閾値Ω
pが選択される。明らかに、上述のように、運転総費用率についての適度に低い値を達成するペナルティ率閾値Ω
pを代わりに選択することができる。
【0037】
ここに教示されたように、SJRPに用いられる2つの在庫管理ポリシーが決定された。第1に、費用率閾値ポリシー(Ω
c,S)は、費用率閾値Ω
c及び補充点Sを用い、第2に、ペナルティ率閾値ポリシー(Ω
p,S)は、ペナルティ率閾値Ω
p及び補充点Sを用いる。同様に、式(2)で示されるように、減少する費用率閾値Ω
cl、増大する費用率閾値Ω
c2、及び補充点Sを用いて、マーチンゲール・スイッチ・ポリシー(Ω
cl,Ω
c2,S)を決定することができる。
【0038】
マーチンゲール・スイッチ・ポリシーの決定は、他の2つの種類のポリシーに関するものと類似のシナリオを用いて進めることができる。パラメータにわたる二次元検索が行われるが、この「総当たり」手法の詳細は、前の説明に基づいて当業者には明らかである。しかしながら、対応する二次元検索は、こうしたポリシーの決定の効率を悪くすることがある。
【0039】
費用率閾値ポリシーは、マーチンゲール・スイッチ・ポリシーの部分集合である。従って、最良の費用率閾値ポリシーと少なくとも同じくらい良好なマーチンゲール・スイッチ・ポリシーを見出すことが常に可能である。幾つかの実用的な状況においては、計算速度及び簡単さに対する必要性が、さらに何パーセントか費用を削減する必要性より重要である場合がある。こうした状況においては、費用率閾値ポリシー及びペナルティ率閾値ポリシーを決定し、所与の問題又はデータセットに対して、平均的な全体の費用率によって測定されたときに、最良の性能を達成するものを用いることが好ましい。他の状況においては、さらに何パーセントか費用を削減する必要性は、計算速度及び簡単さに対する要望より重要である。これらの状況においては、マーチンゲール・スイッチ・ポリシー及びペナルティ率閾値ポリシーを決定し、平均的な全体の費用率の観点から測定されたときに、最良の性能を達成するポリシーを選択することが好ましい。どちらの場合も、費用は、最適ポリシーの費用の3倍にすぎず(例えば、典型的には、結果的に最適ポリシーの費用の1%以内になる)、これらのポリシー(費用、ペナルティ、及びマーチンゲール)は、SJRPについての最適ポリシーに近い構造を有することが見出されている。付加的な実施形態において、マルコフ決定問題の当業者には周知の慣習であるように、費用が割引された場合には、式(6、8、12、14)における閾値に達するように累積費用及び時間の決定内に割引係数を含ませることにより、費用率を直接評価することができる。例えば、割引係数(又は、より正確には、総需要当たりの平均割引係数)γにおいて、平均運転費用率を、割引された平均運転費用率
【数26】
と置き換えることができ、ここで、
【数27】
である。
【0040】
さらに付加的な実施形態においては、シナリオを利用して見積もり、これにより費用率を最適化するのではなく、畳み込みを用いることは可能であるが、これは比較的非効率である。サイクルの開始後の任意の所与の時間において、費用率は、品目にわたる費用率の合計である。合計の確率密度は、合計の個々の項の確率密度の畳み込みである。個々の品目についての費用率の確率密度関数は、その個々の品目の在庫持ち高についての確率密度から容易に得られる。現在のサイクルでいかなる発注もなされていなければ、その個々の品目の在庫持ち高についての確率密度関数は、既知の需要分布から求められることが明らかである。例えば、可能な費用率の空間の細かい離散化後に高速フーリエ変換(FFT)を用いて、又は、関連する合計についての可能な値のソートされたリストを維持することによって、畳み込みを求めることができる。キーファー・ウォルフォビッツ法のような確率的近似法を用いる、又は、確率的プログラミングの技術分野において周知のいわゆる分岐シナリオを利用するといった、最適な卓越する費用率閾値パラメータ又はペナルティ率閾値パラメータを求めるためのさらに他の方法が、当業者には明らかであろう。最後に、線形重み付けされたこれらの組み合わせなどの、卓越する保有費用及びペナルティ費用の種々の混合は、本発明の精神から逸脱することなく、閾値の代わりに、卓越する費用率又はペナルティ率に直接利用できることが明らかである。