(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-01-29
(45)【発行日】2024-02-06
(54)【発明の名称】OTNネットワークリソース最適化方法および装置、コンピュータデバイスならびに記憶媒体
(51)【国際特許分類】
H04L 45/76 20220101AFI20240130BHJP
【FI】
H04L45/76
(21)【出願番号】P 2022572468
(86)(22)【出願日】2021-08-09
(86)【国際出願番号】 CN2021111489
(87)【国際公開番号】W WO2022042276
(87)【国際公開日】2022-03-03
【審査請求日】2022-11-24
(31)【優先権主張番号】202010899110.1
(32)【優先日】2020-08-31
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】511151662
【氏名又は名称】中興通訊股▲ふん▼有限公司
【氏名又は名称原語表記】ZTE CORPORATION
【住所又は居所原語表記】ZTE Plaza,Keji Road South,Hi-Tech Industrial Park,Nanshan Shenzhen,Guangdong 518057 China
(74)【代理人】
【識別番号】100112656
【氏名又は名称】宮田 英毅
(74)【代理人】
【識別番号】100089118
【氏名又は名称】酒井 宏明
(72)【発明者】
【氏名】王大江
(72)【発明者】
【氏名】叶友道
(72)【発明者】
【氏名】王振宇
【審査官】宮島 郁美
(56)【参考文献】
【文献】特開2020-127182(JP,A)
【文献】米国特許出願公開第2022/0124003(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04L12/00-12/66,13/00,41/00-49/9057,61/00-65/80,69/00-69/40
(57)【特許請求の範囲】
【請求項1】
カレントサービス作成状態での作成予定サービスを行動方策に基づいて決定し、前記作成予定サービスを作成し、カレントサービス作成状態での即時報酬を計算し、一つのエピソードが終了するまで次のサービス作成状態に入り、各々のサービス作成状態での即時報酬に基づいて各々のサービス作成状態での総合最適化パラメータを計算し、前記各々のサービス作成状態での総合最適化パラメータに基づいて量子化インデックス重みベクトルを計算・更新することであって、前記行動方策は、複数の量子化インデックスに対応する量子化インデックス重みベクトルに関する確率関数であることと、
数量の予め設けられたエピソードを反復して、最適な量子化インデックス重みベクトルを得ることと、
前記最適な量子化インデックス重みベクトルに基づいて前記行動方策を更新することと、
を含む、OTNネットワークリソース最適化方法。
【請求項2】
カレントサービス作成状態での作成予定サービスを行動方策に基づいて決定する前に、複数の量子化インデックスとインデックス重みベクトルとに基づいて総合量子化インデックス採点を計算することと、
前記総合量子化インデックス採点に基づいて欲張り係数を計算することと、
作成予定サービスの選択確率と前記欲張り係数とに基づいて前記行動方策を決定することと、
をさらに含む、請求項1に記載の方法。
【請求項3】
【請求項4】
【請求項5】
【請求項6】
【請求項7】
【請求項8】
【請求項9】
【請求項10】
【請求項11】
【請求項12】
カレントサービス作成状態での作成予定サービスを行動方策に基づいて決定することは、
各作成予定サービスをカレントサービス作成状態で選択する確率を計算することと、
各作成予定サービスを前記カレントサービス作成状態で選択する確率に基づいて一つの作成予定サービスを決定することと、
予め設けられたOTNネットワーク総合インデックス最適化目的関数に基づいて、決定された作成予定サービスの代替経路選択をソートすることと、
前記ソートにおける各代替経路選択の選択確率を計算することと、
前記ソートにおける各代替経路選択の選択確率に基づいて一つの代替経路選択を決定し、カレントサービス作成状態での作成予定サービスのルーティングとすることと、
を含む、請求項3~11のいずれか一項に記載の方法。
【請求項13】
【請求項14】
【請求項15】
各々のサービス作成状態での即時報酬に基づいて各々のサービス作成状態での総合最適化パラメータを計算・更新することは、
次のサービス作成状態の後の各サービス作成状態での即時報酬に基づいてカレントサービス作成状態での期待収益を計算することと、
前記カレントサービス作成状態での期待収益に基づいてカレントサービス作成状態での総合最適化パラメータを計算・更新することと、を含む、請求項3~11のいずれか一項に記載の方法。
【請求項16】
【請求項17】
第一処理モジュール、第二処理モジュールと更新モジュールを含み、
前記第一処理モジュールは、カレントサービス作成状態での作成予定サービスを行動方策に基づいて決定し、前記作成予定サービスを作成し、カレントサービス作成状態での即時報酬を計算し、一つのエピソードが終了するまで次のサービス作成状態に入り、各々のサービス作成状態での即時報酬に基づいて各々のサービス作成状態での総合最適化パラメータを計算し、前記各々のサービス作成状態での総合最適化パラメータに基づいて量子化インデックス重みベクトルを計算・更新し、前記行動方策は、複数の量子化インデックスに対応する量子化インデックス重みベクトルに関する確率関数であるように構成され、
前記第二処理モジュールは、数量の予め設けられたエピソードを反復して、最適な前記量子化インデックス重みベクトルを得るように構成され、
前記更新モジュールは、最適な前記量子化インデックス重みベクトルに基づいて前記行動方策を更新するように構成されたOTNネットワークリソース最適化装置。
【請求項18】
一つまたは複数のプロセッサと、
一つまたは複数のプログラムが記憶された記憶装置とを、含み、
前記一つまたは複数のプログラムが前記一つまたは複数のプロセッサによって実行されると、前記一つまたは複数のプロセッサが請求項1~16のいずれか一項に記載のOTNネットワークリソース最適化方法を実現するようにするコンピュータデバイス。
【請求項19】
コンピュータプログラムが記憶されたコンピュータ可読記憶媒体であって、前記プログラムがプロセッサによって実行されると、請求項1~16のいずれか一項に記載のOTNネットワークリソース最適化方法を実現するコンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本願は2020年8月31日に提出された中国特許出願第202010899110.1号の優先権を主張し、当該中国特許出願の全ての内容を援用によって引用することとする。
【0002】
本開示は自動制御技術分野に関し、具体的には、OTNネットワークリソース最適化方法および装置、コンピュータデバイスならびにコンピュータ可読記憶媒体に関するものである。
【背景技術】
【0003】
人工知能技術の発展に伴い、強化学習技術の応用は様々な分野と業界においてますます広く重視されている。強化学習(Reinforcement Learning)は再奨励学習、評価学習とも呼ばれ、重要な機械学習方法であり、知能制御ロボットおよびネットワーク分析予測などの分野において多く応用されている。コネクショニズム機械学習流派において、学習アルゴリズムは、教師なし学習(unsupervised learning)、教師あり学習(supervised leaning)と強化学習という3種類に分けられている。
【0004】
強化学習は、エージェント(Agent)が「試行錯誤」で学習を行い、環境と対話することで獲得した賞与指導行為であり、エージェントに最大の賞与を獲得させることをターゲットとし、強化学習はコネクショニズム学習における教師あり学習と異なり、その違いは強化信号に主に現われ、強化学習において、環境によって提供された強化信号は、如何に正しい行動を生じさせるかを強化学習システム(Reinforcement Learning System,RLS)に知らせるのではなく、生じた行動の良し悪しを評価するものである(通常、スカラー信号)。外部環境が提供する情報は少ないため、RLSは、自身の経験に依存して学習を行わなくてはならず、このような方式を通じて、行動-評価の環境で知識を獲得し、環境に適応するように行動方式を改善する。
【0005】
近年、強化学習技術の応用と普及に伴い、この技術の強みをOTN(Optical Transport Network、光伝達網)ネットワークインテリジェント化管理・制御と運営・メンテナンス分野に如何に応用するか、特に、強化学習のOTNネットワークリソース最適化での応用は、OTN分野専門家によって広く注目されている。
【発明の概要】
【0006】
一態様では、本開示実施例は、カレントサービス作成状態での作成予定サービスを行動方策に基づいて決定し、前記作成予定サービスを作成し、カレントサービス作成状態での即時報酬を計算し、一つのエピソードが終了するまで次のサービス作成状態に入り、各々のサービス作成状態での即時報酬に基づいて各々のサービス作成状態での総合最適化パラメータを計算し、前記各々のサービス作成状態での総合最適化パラメータに基づいて量子化インデックス重みベクトルを計算・更新することであって、前記行動方策は、複数の量子化インデックスに対応する量子化インデックス重みベクトルに関する確率関数であることと、数量の予め設けられたエピソードを反復して、最適な量子化インデックス重みベクトルを得ることと、前記最適な量子化インデックス重みベクトルに基づいて前記行動方策を更新することと、を含む、OTNネットワークリソース最適化方法を提供する。
【0007】
さらに別の態様では、本開示実施例は、第一処理モジュール、第二処理モジュールと更新モジュールを含み、前記第一処理モジュールは、カレントサービス作成状態での作成予定サービスを行動方策に基づいて決定し、前記作成予定サービスを作成し、カレントサービス作成状態での即時報酬を計算し、一つのエピソードが終了するまで次のサービス作成状態に入り、各々のサービス作成状態での即時報酬に基づいて各々のサービス作成状態での総合最適化パラメータを計算し、前記各々のサービス作成状態での総合最適化パラメータに基づいて量子化インデックス重みベクトルを計算・更新し、前記行動方策は、複数の量子化インデックスに対応する量子化インデックス重みベクトルに関する確率関数であるように構成され、前記第二処理モジュールは、数量の予め設けられたエピソードを反復して、最適な前記量子化インデックス重みベクトルを得るように構成され、前記更新モジュールは、最適な前記量子化インデックス重みベクトルに基づいて前記行動方策を更新するように構成されたOTNネットワークリソース最適化装置をさらに提供する。
【0008】
さらに別の態様では、本開示の実施例は、一つまたは複数のプロセッサと、一つまたは複数のプログラムが記憶された記憶装置とを、含み、前記一つまたは複数のプログラムが前記一つまたは複数のプロセッサによって実行されると、前記一つまたは複数のプロセッサが前出したようなOTNネットワークリソース最適化方法を実現するようにするコンピュータデバイスをさらに提供する。
【0009】
さらに別の態様では、本開示の実施例はコンピュータプログラムが記憶されたコンピュータ可読記憶媒体であって、前記プログラムがプロセッサによって実行されると、前述したようなOTNネットワークリソース最適化方法を実現するコンピュータ可読記憶媒体をさらに提供する。
【図面の簡単な説明】
【0010】
【
図1】
図1は本開示実施例によって提供されるSDONアーキテクチャにおけるOTNネットワークリソース最適化の模式図である。
【
図2】
図2は本開示実施例によって提供されるOTNネットワークリソース最適化のフロー模式図である。
【
図3】
図3は本開示実施例によって提供される、カレントサービス作成状態での作成予定サービスを決定するフロー模式図である。
【
図4】
図4は本開示実施例によって提供される、総合最適化パラメータを計算するフロー模式図である。
【
図5】
図5は本開示実施例によって提供されるOTNネットワークリソース最適化装置の構成模式図である。
【発明を実施するための形態】
【0011】
以下、実施形態について図面を参照してより充分に説明するが、前記実施例は、本開示に記述の実施例に限定されると解釈するべきではなく、異なる形態で体現することができる。むしろ、これら実施例を提供するのは、本開示を徹底して完全なものにするとともに、当業者に本開示の範囲を十分に理解させることを目的とする。
【0012】
本開示で使用される用語「および/または」には、1つ以上の関連する列挙項目の任意またはすべての組み合わせが含まれる。
【0013】
本開示にて使用される用語は特定の実施例について説明するためのものにすぎず、かつ、本開示を制限するものではない。本開示にて使用される、「一つの」と「当該」という単数形は、文脈が別途明らかに説明しない限り、複数形を含む意図がある。本明細書にて「含む」、「…からなる」が使用されるときに、特定の特徴、実体、ステップ、オペレーション、要素、および/またはコンポーネントの存在を指定するが、1つまたは複数の他の特徴、実体、ステップ、オペレーション、要素、コンポーネント、および/またはそれらのグループ、の存在または追加を除外するものでないことが、さらに理解されるであろう。
【0014】
本明細書に記載の実施例は、本開示の理想的な模式図を借りて平面図および/または断面図を参照して説明することができる。したがって、例示は、製造技術および/または許容範囲に応じて修正され得る。本開示の実施例は図示した実施例に限定されず、製造プロセスに基づいて形成された配置の修正を含む。よって、図示したエリアは概略的な属性を有し、かつ、図示したエリアの形状は素子のエリアの具体的な形状を例示するが、限定的であることを意図していない。
【0015】
別段の限定がない限り、本開示にて使用されるすべての用語(技術と科学用語を含む)の意味は当業者が通常理解している意味と同一である。また、常用辞典にて限定されるそれら用語は、関連技術案および本開示の背景での意味と一致する意味を有し、本開示にて明確に定義しない限り、理想化された意味に、または過度に形式的な意味に解釈されないであろうことが、さらに理解されるであろう。
【0016】
SDON(Software Defined Optical Network、ソフトウェア定義オプティカルネットワークネットワーク)アーキテクチャに基づいたOTNネットワークリソース最適化(Global Co-current Optimization,GCO)ソリューションは
図1に示すとおりであり、GCOは、OTNネットワークリソース割当プロセスにおいて、OTNネットワークサービス開通に関して規格またはバッチ作成を行う場合、各サービスルーティング計算とリソース割当妨害を回避する前提で、各サービスの計算によるルーティングとリソース占用総和は、ユーザ(ネットワークサービスオペレータ)のネットワークサービス全体に対する既定のリソース割当最適化目標を最大限満たすことを主な目的とする。OTNネットワークリソース最適化技術を通じて、ユーザの運営・メンテナンスコストCAPEX(資本支出)/OPEX(運営コスト)を最大限削減し、運営・メンテナンス収益を向上させ、伝送性能と品質を最適化することができ、これはユーザネットワーク運営の経済効率に直接関連し、このため、該技術はユーザによって高く重視され、OTNネットワークリソース最適化技術を如何に実現するかは重要である。
【0017】
OTNネットワークサービス配置において、通常、運営の必要に応じて、各サービスにそれぞれ対応するOTNネットワークリソース(例えば、帯域幅、スペクトル、波長、変調フォーマット、ルーティングなど)を割り当てる必要があり、また、指定の最適化方策でのサービス全体のリソース最適化を満たすよう求められ、最適化方策は、サービス全体の時間遅延を最短にし、ルーティングコストを最小にすることなどを含む。これと同時に、運営収益最大化、サービス性能最適化、投入CAPEX/OPEXの最小化などの角度から考慮すれば、OTNサービス運営はさらに、既定の最適化方策を巡って、OTNネットワークサービスのネットワークリソース使用での全体最適化を満たす必要があり、これは、OTNネットワークサービス時間遅延を最小にすること、OTNネットワークルーティングコストを最小にすること、或いはOTNネットワークサービス帯域幅利用率を最高にすることなどを含む。これには、作成プロセスにおいて、OTNネットワークサービスが、それ自体のサービスリソース最適化を満たす必要があると同時に、すべてのサービスの作成手順を編成することでOTNネットワークリソースをサービスが使用するグローバル最適化を満たす必要もある。
【0018】
OTNネットワークサービス作成プロセスは通常、ある時点で複数のサービスを集中してバッチ作成するという並行性作成の方式を採用し、サービス作成プロセスは実際にすべてのサービスの作成手順を決定するものであり、OTNネットワークサービスの作成手順は、OTNネットワークリソースに対する占用形態とOTNネットワークリソース割当の最適化状態を決定する。OTNネットワークサービスを作成する手順を、サービス作成編成方策(即ち、行動方策)と呼び、優れたサービス作成編成方策は、OTNネットワークサービスがネットワークリソースを使用する最適化方策を満たすことができる。
【0019】
しかし、実際のOTNネットワークリソースの割当と使用においては、ネットワークリソース最適化が多次元で考えられており、ある次元のネットワークリソース量子化インデックスの最適化のみを考慮するだけでは、他の量子化インデックスの使用と最適化に影響を及ぼすだろう。よって、ユーザはネットワークリソースの複数の量子化インデックスを総合的に最適化し、複数の量子化インデックスの最適な組み合わせモードを得る必要がある。このプロセスにおいて、単体の量子化インデックスに対しできるだけグローバル最適化を実現するよう保証するとともに、OTNネットワークリソースすべての量子化インデックスの総合グローバル最適化を実現し、こうしてこそOTNネットワークリソースに対する利用の最大化を保証し、また、収益の最大化、伝送性能の最適化を保証できる。
【0020】
【0021】
初期化フェーズでは、OTNネットワークトポロジー(mesh、星型などの構造類型を含む)の環境条件に基づいてn本のOTNサービスを作成し、ネットワーク環境状態、行動空間、行動最適化目標方策、行動方策を初期化する。強化学習アルゴリズムの関連パラメータは以下に定義される。
【0022】
1.OTNネットワーク総合インデックス最適化目的関数を定義する。
【0023】
【0024】
【0025】
【0026】
【0027】
【0028】
【0029】
【0030】
【0031】
3.エピソード(Episode)を定義する。
【0032】
ある行動方策を採用して、OTNネットワークサービスに対する順次作成を完了させることは、一つのEpisodeとして定義される。
【0033】
【0034】
行動は、現在のネットワークトポロジー環境状態で、作成予定サービスにおいて、一つの作成予定サービスを次の作成対象となるサービスとして選択し、当該作成予定サービスの複数本の代替経路選択(ネットワークリソースがすでに割り当てられたルーティング)から1つを当該サービスのリソースルーティングとして選択し、当該サービスの作成を完了するプロセスを指す。作成予定サービスの複数本のリソースの代替経路選択は、KSP(An Efficient Algorithm for K Shortest Simple Paths)+RWA(routing and wave length assignment algorithm、ルーティング波長割当アルゴリズム)+RSA(Asymmetric encryption algorithm、非対称暗号化アルゴリズム)で計算され得、また割り当てられた、対応するネットワークリソースによって得られ、かつ単独の代替経路選択は各量子化インデックスの閾値要求を満たす。
【0035】
【0036】
5.量子化インデックスを定義する。
【0037】
【0038】
【0039】
6.量子化インデックス評価体系を定義する
【0040】
【0041】
【0042】
OTNネットワーク総合量子化インデックス閾値は以下のように定義する。
【0043】
【0044】
各サービスの代替経路選択の量子化インデックス採点は量子化インデックスの種別に従って3種類の状況に分けられる。
【0045】
【0046】
【0047】
【0048】
【0049】
【0050】
【0051】
【0052】
【0053】
【0054】
【0055】
【0056】
OTNネットワーク総合量子化インデックス閾値は以下のように定義する。
【0057】
【0058】
【0059】
【0060】
各サービスのリソースの代替経路選択のインデックス評価は以下のように3種類に分け得る。
【0061】
【0062】
【0063】
【0064】
【0065】
【0066】
【0067】
【0068】
【0069】
【0070】
【0071】
【0072】
【0073】
【0074】
【0075】
各サービスの代替経路選択の量子化インデックス採点は量子化インデックスの種別に従って3種類の状況に分け得る。
【0076】
【0077】
【0078】
【0079】
【0080】
【0081】
【0082】
【0083】
【0084】
【0085】
【0086】
【0087】
【0088】
OTNネットワーク総合量子化インデックス閾値は以下のように定義する。
【0089】
【0090】
各サービスの代替経路選択の量子化インデックス採点は量子化インデックスの種別に従って3種類の状況に分け得る。
【0091】
【0092】
【0093】
【0094】
【0095】
【0096】
【0097】
【0098】
【0099】
【0100】
【0101】
【0102】
本開示実施例は、
図2に示すように、以下のステップS11~S13を含むOTNネットワークリソース最適化方法を提供する。
【0103】
ステップS11:カレントサービス作成状態での作成予定サービスを行動方策に基づいて決定し、前記作成予定サービスを作成し、また、カレントサービス作成状態での即時報酬を計算し、一つのエピソードが終了するまで次のサービス作成状態に入り、各々のサービス作成状態での即時報酬に基づいて各々のサービス作成状態での総合最適化パラメータを計算し、また、前記各々のサービス作成状態での総合最適化パラメータに基づいて量子化インデックス重みベクトルを計算・更新する。
【0104】
前述したように、前記行動方策は、複数の量子化インデックスに対応する量子化インデックス重みベクトルに関する確率関数である。
【0105】
本ステップにおいて、一つのエピソードでは、一つの作成予定サービス(当該作成予定サービスのルーティングの決定を含む)を行動方策に基づいて決定し、当該作成予定サービス作成後に、当該サービス作成状態での即時報酬を計算し、カレントサービス作成状態が終了し、次のサービス作成状態に移る。上記ステップに従って、一つのエピソード中におけるそれぞれのサービス作成状態に対し、作成予定サービスをそれぞれ作成し、相応のサービス作成状態での即時報酬を一つのエピソードが終了するまで計算し、各々のサービス作成状態での即時報酬に基づいて各々のサービス作成状態での総合最適化パラメータを計算・更新する。
【0106】
本ステップにおいて、異なるアルゴリズムで総合最適化パラメータを計算・更新してよく、なお、用いたアルゴリズムが異なると、総合最適化パラメータも異なり、後で各種のアルゴリズムについて詳細に解説する。
【0107】
ステップS12:数量の予め設けられたエピソードを反復して、最適な前記量子化インデックス重みベクトルを得る。
【0108】
本ステップにおいて、ステップS11の実行を繰り返し、数量の予め設けられたエピソードを反復し、各エピソードにおける各サービス作成状態での総合最適化パラメータを計算・更新する。本ステップによって、OTNネットワークのすべての作成予定サービスに対応するすべてのサービス作成状態での最適な総合最適化パラメータを得ることができる。
【0109】
ステップS13:各サービス作成状態での最適な総合最適化パラメータに基づいて前記行動方策を更新する。
【0110】
【0111】
本開示実施例によって提供されるOTNネットワークリソース最適化方法は、カレントサービス作成状態での作成予定サービスを行動方策に基づいて決定し、前記作成予定サービスを作成し、また、カレントサービス作成状態での即時報酬を計算し、一つのエピソードが終了するまで次のサービス作成状態に入り、各々のサービス作成状態での即時報酬に基づいて各々のサービス作成状態での総合最適化パラメータを計算し、また、前記各々のサービス作成状態での総合最適化パラメータに基づいて量子化インデックス重みベクトルを計算・更新し、前記行動方策は、複数の量子化インデックスに対応する量子化インデックス重みベクトルに関する確率関数であり、数量の予め設けられたエピソードを反復して、最適な前記量子化インデックス重みベクトルを得、前記最適な量子化インデックス重みベクトルに基づいて前記行動方策を更新することを含む。本開示実施例では、強化学習アルゴリズムの賞罰メカニズムを用いてOTNネットワークサービス作成のソートを最適化し、得られた行動方策は収束性が良く、厳密性と信頼性が高く、OTNネットワークリソース最適化問題をOTNネットワークサービス作成のソート問題に総括し、かつ、強化学習の行動方策設計にパラメータベクトルを導入し、正しい改善によって最適化した行動方策を獲得し、OTNネットワークリソースに対するグローバル最適化を実現させる。
【0112】
【0113】
【0114】
【0115】
【0116】
【0117】
【0118】
【0119】
幾つかの実施形態では、
図3に示すように、前記カレントサービス作成状態での作成予定サービスを行動方策に基づいて決定することは、以下のステップS21~S25を含む。
【0120】
ステップS21:各作成予定サービスをカレントサービス作成状態で選択する確率を計算する。
【0121】
本ステップにおいて、選択した量子化インデックス評価体系に応じて、相応するアルゴリズムを決定し、各作成予定サービスが選択される確率を計算し、異なる量子化インデックス評価体系での、各作成予定サービスを選択する確率は前述したとおりであり、ここでは省略する。
【0122】
ステップS22:各作成予定サービスを前記カレントサービス作成状態で選択する確率に基づいて一つの作成予定サービスを決定する。
【0123】
なお、強化学習のexploration(探索)の考え方に基づき、作成予定サービスの選択にあたっては、方策のランダム性に従う。
【0124】
ステップS23:予め設けられたOTNネットワーク総合インデックス最適化目的関数に基づいて、決定された作成予定サービスの代替経路選択をソートする。
【0125】
【0126】
ステップS24:前記ソートにおける各代替経路選択の選択確率を計算する。
【0127】
ステップS25:前記ソートにおける各代替経路選択の選択確率に基づいて一つの代替経路選択を決定し、カレントサービス作成状態での作成予定サービスのルーティングとする。
【0128】
【0129】
【0130】
幾つかの実施形態では、
図4に示すように、前記各々のサービス作成状態での即時報酬に基づいて各々のサービス作成状態での総合最適化パラメータを計算・更新することは、以下のステップS31とS32を含む。
【0131】
ステップS31:次のサービス作成状態の後の各サービス作成状態での即時報酬に基づいてカレントサービス作成状態での期待収益を計算する。
【0132】
【0133】
なお、最後のサービス作成状態下の期待収益とは当該サービス作成状態での即時報酬である。
【0134】
ステップS32:前記カレントサービス作成状態での期待収益に基づいてカレントサービス作成状態での総合最適化パラメータを計算・更新する。
【0135】
ステップS31とS32によって、補強アルゴリズムの賞罰メカニズムで総合最適化パラメータの最適化を実現させる。
【0136】
以下、それぞれQ-Based Actor-CriticアルゴリズムとPGアルゴリズムでOTNネットワークリソース最適化を実現するプロセスについて説明する。
【0137】
(1)Q-Based Actor-CriticアルゴリズムでOTNネットワークリソース最適化を実現させる処理プロセスは以下の通りである。
【0138】
【0139】
【0140】
【0141】
【0142】
(2)PGアルゴリズムでOTNネットワークリソース最適化を実現させる処理プロセスは以下の通りである。
【0143】
【0144】
同じ技術思想に基づき、本開示実施例はOTNネットワークリソース最適化装置をさらに提供し、
図5に示すように、前記OTNネットワークリソース最適化装置は、第一処理モジュール101、第二処理モジュール102と更新モジュール103を備える。
【0145】
前記第一処理モジュール101は、カレントサービス作成状態での作成予定サービスを行動方策に基づいて決定し、前記作成予定サービスを作成し、また、カレントサービス作成状態での即時報酬を計算し、一つのエピソードが終了するまで次のサービス作成状態に入り、各々のサービス作成状態での即時報酬に基づいて各々のサービス作成状態での総合最適化パラメータを計算し、また、前記各々のサービス作成状態での総合最適化パラメータに基づいて量子化インデックス重みベクトルを計算・更新し、前記行動方策は、複数の量子化インデックスに対応する量子化インデックス重みベクトルに関する確率関数であるように配置されている。
【0146】
前記第二処理モジュール102は数量の予め設けられたエピソードを反復して、最適な前記量子化インデックス重みベクトルを得るように配置されている。
【0147】
前記更新モジュール103は、前記最適な量子化インデックス重みベクトルに基づいて前記行動方策を更新するように配置されている。
【0148】
幾つかの実施形態では、前記第一処理モジュール101はさらに、複数の量子化インデックスとインデックス重みベクトルとに基づいて総合量子化インデックス採点を計算し、前記総合量子化インデックス採点に基づいて欲張り係数を計算し、作成予定サービスの選択確率と前記欲張り係数とに基づいて前記行動方策を決定するように配置されている。
【0149】
幾つかの実施形態では、前記量子化インデックスは、第1種の量子化インデックス、第2種の量子化インデックスと第3種の量子化インデックスを含み、前記第1種の量子化インデックスの取り得る値は第1種の量子化インデックス採点に反比例し、前記第2種の量子化インデックスの取り得る値は第2種の量子化インデックス採点に反比例し、前記第3種の量子化インデックス採点は、一つのエピソードの最後のサービスが作成された後に得られる。
【0150】
【0151】
幾つかの実施形態では、第一処理モジュール101は更に、以下の式に従って、欲張り係数を計算するように配置されている。
【0152】
【0153】
【0154】
【0155】
【0156】
【0157】
【0158】
【0159】
【0160】
【0161】
【0162】
【0163】
幾つかの実施形態では、第一処理モジュール101は、各作成予定サービスをカレントサービス作成状態で選択する確率を計算し、各作成予定サービスを前記カレントサービス作成状態で選択する確率に基づいて一つの作成予定サービスを決定し、予め設けられたOTNネットワーク総合インデックス最適化目的関数に基づいて、決定された作成予定サービスの代替経路選択をソートし、前記ソートにおける各代替経路選択の選択確率を計算し、前記ソートにおける各代替経路選択の選択確率に基づいて一つの代替経路選択を決定し、カレントサービス作成状態での作成予定サービスのルーティングとするように配置されている。
【0164】
【0165】
幾つかの実施形態では、第一処理モジュール101は、以下のように配置されている。
【0166】
【0167】
幾つかの実施形態では、第一処理モジュール101は次のサービス作成状態の後の各サービス作成状態での即時報酬に基づいてカレントサービス作成状態での期待収益を計算し、前記カレントサービス作成状態での期待収益に基づいてカレントサービス作成状態での総合最適化パラメータを計算・更新するように配置されている。
【0168】
幾つかの実施形態では、第一処理モジュール10は以下のように配置されている。
【0169】
【0170】
本開示実施例は、一つまたは複数のプロセッサと、一つまたは複数のプログラムが記憶された記憶装置とを含み、上記一つまたは複数のプログラムが上記一つまたは複数のプロセッサによって実行されると、上記一つまたは複数のプロセッサに、前記各実施例によって提供されたOTNネットワークリソース最適化方法を実現させるコンピュータデバイスを更に提供する。
【0171】
本開示実施例は、コンピュータプログラムが記憶され、当該コンピュータプログラムがプロセッサによって実行されると、前記各実施例によって提供されたOTNネットワークリソース最適化方法を実現するコンピュータ可読記憶媒体をさらに提供する。
【0172】
当業者は、上文で公開されている方法におけるすべてまたはあるステップ、装置の機能モジュール/ユニットが、ソフトウェア、ファームウェア、ハードウェア、およびそれらの適切な組み合わせとして実施されうることを理解するであろう。ハードウェア実施形態において、上記の説明で言及された機能モジュール/ユニット間の区分は、必ずしも物理的構成要素の区分に対応せず、例えば、1つの物理的構成要素は、複数の機能を有してもよく、または1つの機能またはステップは、幾つかの物理的構成要素によって協働して実行されてもよい。いくつかの物理的構成要素またはすべての物理的構成要素は、中央処理装置、デジタル信号プロセッサ、またはマイクロプロセッサなどのプロセッサによって実行されるソフトウェアとして、またはハードウェアとして、または特定用途向け集積回路などの集積回路として実施され得る。このようなソフトウェアは、コンピュータ記憶媒体(または非一時的媒体)および通信媒体(または一時的媒体)を含み得るコンピュータ可読媒体上に配置され得る。当業者によく知られているように、コンピュータ記憶媒体という用語は、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータなどの情報を記憶するための任意の方法または技術で実施される揮発性および不揮発性、取り外し可能および取り外し不可能な媒体を含む。コンピュータ記憶媒体は、RAM、ROM、EEPROM、フラッシュメモリ若しくは他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)若しくは他の光ディスクストレージ、磁気カセット、磁気テープ、磁気ディスクストレージ若しくは他の磁気ストレージデバイス、または所望の情報を記憶するために使用され得、コンピュータによってアクセスされ得る任意の他の媒体を含むが、これらに限定されない。さらに、通信媒体は、一般に、コンピュータ可読命令、データ構造、プログラムモジュール、または搬送波もしくは他の搬送機構などの変調データ信号における他のデータを含み、任意の情報配信媒体を含み得ることが当業者に知られている。
【0173】
本明細書において実施形態の例が公開されており、また、特定の用語が用いられているが、それらは一般的な説明的な意味としてのみ使用され、解釈されるべきであり、限定を目的としたものではない。いくつかの実例では、特定の実施例と組み合わせて説明される特徴、特性、および/または要素は、別途明確に指摘しない限り、単独で、または他の実施例にて説明される特徴、特性、および/または要素と組み合わせて使用され得ることが当業者に明らかであろう。したがって、添付の請求項によって明らかにされている本開示の範囲から逸脱しない限り、様々な形態および詳細における変更が行われ得ることを当業者は理解するであろう。