特表2024-514611 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ エヌイーシー　ラボラトリーズ　アメリカ　インクの特許一覧

特表2024-514611動的マイクロサービス相互通信構成

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2024-04-02

(54)【発明の名称】動的マイクロサービス相互通信構成

(51)【国際特許分類】

G06F 9/46 20060101AFI20240326BHJP

G06F 9/54 20060101ALI20240326BHJP

G06N 3/092 20230101ALN20240326BHJP

【ＦＩ】

G06F9/46 420A

G06F9/54 Z

G06N3/092

【審査請求】有

【予備審査請求】未請求

(21)【出願番号】P 2023562849

(86)(22)【出願日】2022-04-15

(85)【翻訳文提出日】2023-11-16

(86)【国際出願番号】 US2022024979

(87)【国際公開番号】W WO2022221638

(87)【国際公開日】2022-10-20

(31)【優先権主張番号】63/175,066

(32)【優先日】2021-04-15

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】17/720,776

(32)【優先日】2022-04-14

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

(71)【出願人】

【識別番号】504080663

【氏名又は名称】エヌイーシーラボラトリーズアメリカインク

【氏名又は名称原語表記】ＮＥＣＬａｂｏｒａｔｏｒｉｅｓＡｍｅｒｉｃａ，Ｉｎｃ．

(74)【代理人】

【識別番号】100123788

【弁理士】

【氏名又は名称】宮崎昭夫

(74)【代理人】

【識別番号】100127454

【弁理士】

【氏名又は名称】緒方雅昭

(72)【発明者】

【氏名】コヴィエロ、ジュゼッペ

(72)【発明者】

【氏名】ラオ、クナル

(72)【発明者】

【氏名】シン、ワン－ピン

(72)【発明者】

【氏名】ポ、オリバー

(72)【発明者】

【氏名】チャクラッダー、スリマット

(57)【要約】

通信を管理するための方法およびシステムは、第２のマイクロサービスと通信する第１のマイクロサービスを含む分散演算システムにおけるシステム状態を特定する（４０６）ことを含む。通信方法をシステム状態に関連付ける強化学習モデルを使用して、特定されたシステム状態に応答する通信方法が特定される（４０８）。特定された通信方法は、第１のマイクロサービスと第２のマイクロサービスとの間の通信のために実施され（４１０）、第１のマイクロサービスと第２のマイクロサービスは、特定された通信方法を使用してデータを送信する。
【選択図】図４

【特許請求の範囲】

【請求項1】

通信を管理するための、コンピュータに実装された方法であって、
第２のマイクロサービスと通信する第１のマイクロサービスを含む分散演算システムにおけるシステム状態を特定する（４０６）ことと、
通信方法をシステム状態に関連付ける強化学習モデルを用いて、前記特定されたシステム状態に応答する通信方法を特定する（４０８）ことと、
前記第１のマイクロサービスと前記第２のマイクロサービスとの間の通信において、前記第１のマイクロサービスおよび前記第２のマイクロサービスが前記特定された通信方法を用いてデータを送信するために、前記特定された通信方法を実施する（４１０）こととを含む方法。

【請求項2】

前記特定された通信方法を実施した後、更新されたシステム統計を収集し、前記更新されたシステム統計を用いて、システム状態を特定するステップと、通信方法を特定するステップと、前記特定された通信方法を実施するステップとを繰り返すことをさらに含む、請求項１に記載の方法。

【請求項3】

前記通信方法を特定することは、前記強化学習モデルによって指示される最適な方法とランダムな方法との間で選択することを含む、請求項１に記載の方法。

【請求項4】

前記最適な方法と前記ランダムな方法との間で選択することは、ランダムな値と学習パラメータとを比較することを含む、請求項３に記載の方法。

【請求項5】

前記強化学習モデルの値の閾値の割合が探索された後に、前記最適な方法が選択される可能性を高めるために、前記学習パラメータを更新することをさらに含む、請求項４に記載の方法。

【請求項6】

前記特定された通信方法は、ｍ個サーバ対ｎ個クライアント処理、ブローカベースのプロセス、バス、および共有メモリからなる群から選択される、請求項１に記載の方法。

【請求項7】

前記第１のマイクロサービスおよび前記第２のマイクロサービスは、ビデオ処理ワークロードにおいてそれぞれのタスクを実行する、請求項１に記載の方法。

【請求項8】

前記ビデオ処理ワークロードによって処理されるビデオストリーム中の顔を検出することと、前記顔の検出に応答してセキュリティアクションを実行することとをさらに含む、請求項７に記載の方法。

【請求項9】

前記特定された通信方法を実施した後に収集された性能統計を使用して、前記特定された通信方法に対応する前記強化学習モデルの報酬値を更新することをさらに含む、請求項１に記載の方法。

【請求項10】

前記システム状態を特定することは、データパケット関連統計と、前記第１のマイクロサービスおよび前記第２のマイクロサービスがどのゾーンおよびマシン上で実行されているかに関する情報とのうちの少なくとも１つを含む通信統計を測定することを含む、請求項１に記載の方法。

【請求項11】

顔検出のための、コンピュータに実装された方法であって、
ビデオ処理ワークロードにおいて、第２のマイクロサービスと通信する第１のマイクロサービスを含む分散演算システムにおけるシステム状態を特定する（４０６）ことと、
通信方法をシステム状態に関連付ける強化学習モデルを用いて、前記特定されたシステム状態に応答する通信方法を特定する（４０８）ことと、
前記第１のマイクロサービスと前記第２のマイクロサービスとの間の通信において、前記第１のマイクロサービスおよび前記第２のマイクロサービスが前記特定された通信方法を用いてデータを送信するために、前記特定された通信方法を実施する（４１０）ことと、
前記ビデオ処理ワークロードによって処理されるビデオストリーム内の顔を検出する（３０８）ことと、
前記顔の検出に応答してセキュリティアクションを実行する（３１２）こととを含む方法。

【請求項12】

通信を管理するシステムであって
ハードウェアプロセッサ（６１０）と、
コンピュータプログラムを含むメモリ（６４０）とを有し、
前記コンピュータプログラムは、前記ハードウェアプロセッサによって実行されると、前記ハードウェアプロセッサに、
第２のマイクロサービスと通信する第１のマイクロサービスを含む分散演算システムにおけるシステム状態を特定する（４０６）手順と、
通信方法をシステム状態に関連付ける強化学習モデルを用いて、前記特定されたシステム状態に応答する通信方法を特定する（４０８）手順と、
前記第１のマイクロサービスと前記第２のマイクロサービスとの間の通信において、前記第１のマイクロサービスおよび前記第２のマイクロサービスが前記特定された通信方法を用いてデータを送信するために、前記特定された通信方法を実施する（４１０）手順とを実行させるシステム。

【請求項13】

前記コンピュータプログラムは、前記ハードウェアプロセッサにさらに、前記特定された通信方法を実施した後、更新されたシステム統計を収集し、前記更新されたシステム統計を用いて、システム状態を特定するステップと、通信方法を特定するステップと、前記特定された通信方法を実施するステップとを繰り返す手順を実行させる、請求項１２に記載のシステム。

【請求項14】

前記コンピュータプログラムは、前記ハードウェアプロセッサにさらに、前記強化学習モデルによって指示される最適な方法と、ランダムな方法とのいずれかを選択する手順を実行させる、請求項１２に記載のシステム。

【請求項15】

前記コンピュータプログラムは、前記ハードウェアプロセッサにさらに、どの通信方法を使用するかを決定するために、ランダムな値と学習パラメータとを比較する手順を実行させる、請求項１４に記載のシステム。

【請求項16】

前記コンピュータプログラムは、前記ハードウェアプロセッサにさらに、前記強化学習モデルの値の閾値の割合が探索された後に、前記最適な方法が選択される可能性を高めるために、前記学習パラメータを更新する手順を実行させる、請求項１５に記載のシステム。

【請求項17】

前記特定された通信方法は、ｍ個サーバ対ｎ個クライアント処理、ブローカベースのプロセス、バス、および共有メモリからなる群から選択される、請求項１２に記載のシステム。

【請求項18】

前記第１のマイクロサービスおよび前記第２のマイクロサービスは、ビデオ処理ワークロードにおいてそれぞれのタスクを実行する、請求項１２に記載のシステム。

【請求項19】

前記コンピュータプログラムは、前記ハードウェアプロセッサにさらに、前記特定された通信方法を実施した後に収集された性能統計を使用して、前記特定された通信方法に対応する前記強化学習モデルの報酬値を更新する手順を実行させる、請求項１２に記載のシステム。

【請求項20】

前記コンピュータプログラムは、前記ハードウェアプロセッサにさらに、データパケット関連統計と、前記第１のマイクロサービスおよび前記第２のマイクロサービスがどのゾーンおよびマシン上で実行されているかに関する情報との少なくとも１つを含む通信統計を測定する手順を実行させる、請求項１２に記載のシステム。

【発明の詳細な説明】

【技術分野】

【0001】

関連出願情報
本出願は、２０２１年４月１５日に出願された米国特許出願第６３／１７５，０６６号および２０２２年４月１４日に出願された米国特許出願第１７／７２０，７７６号の優先権を主張し、その全体が参照により本明細書に組み込まれる。

【背景技術】

【0002】

技術分野
本発明は、分散演算に関し、より詳細には、マイクロサービス間の通信に関する。

【0003】

関連技術の説明
マイクロサービスは、自動化されたデプロイメカニズムを持つ、独立してデプロイ可能なサービスであり、大規模なシステム内の各サービスは独立して更新、置換、拡張が可能である。マイクロサービスの相互接続は、様々な通信形態のいずれかを使用することができ、特定の通信形態は他の通信形態よりも特定の条件に適している。

【発明の概要】

【0004】

通信を管理する方法は、第２のマイクロサービスと通信する第１のマイクロサービスを含む分散演算システムにおけるシステム状態を特定することを含む。通信方法をシステム状態に関連付ける強化学習モデルを用いて、特定されたシステム状態に応答する通信方法が特定される。第１のマイクロサービスと第２のマイクロサービスとの間の通信において、第１のマイクロサービスおよび第２のマイクロサービスが特定された通信方法を用いてデータを送信するために、特定された通信方法が実施される。

【0005】

顔検出のための方法は、ビデオ処理ワークロードにおいて、第２のマイクロサービスと通信する第１のマイクロサービスを含む分散演算システムにおけるシステム状態を特定することを含む。通信方法をシステム状態に関連付ける強化学習モデルを用いて、特定されたシステム状態に応答する通信方法が特定される。第１のマイクロサービスと第２のマイクロサービスとの間の通信において、第１のマイクロサービスおよび第２のマイクロサービスが特定された通信方法を用いてデータを送信するために、特定された通信方法が実施される。ビデオ処理ワークロードによって処理されるビデオストリーム内にて顔が検出される。顔の検出に応答してセキュリティアクションが実行される。

【0006】

通信を管理するシステムは、ハードウェアプロセッサと、コンピュータプログラムを含むメモリとを有する。ハードウェアプロセッサによって実行されると、コンピュータプログラムはハードウェアプロセッサに、第２のマイクロサービスと通信する第１のマイクロサービスを含む分散演算システムにおけるシステム状態を特定する手順と、通信方法をシステム状態に関連付ける強化学習モデルを用いて、特定されたシステム状態に応答する通信方法を特定する手順と、第１のマイクロサービスと第２のマイクロサービスとの間の通信において、第１のマイクロサービスおよび第２のマイクロサービスが特定された通信方法を用いてデータを送信するために、特定された通信方法を実施する手順とを実行させる。

【0007】

これらおよび他の特徴および利点は、添付図面と関連して読まれる、その例示的実施形態の以下の詳細な説明から明らかになるであろう。

【図面の簡単な説明】

【0008】

本開示は、以下の図を参照して、好ましい実施形態の以下の説明において詳細を提供する。

【0009】

【図1】本発明の実施形態による、例示的な分散演算システムを示すブロック図である。

【0010】

【図2】本発明の一実施形態による、分散演算システムにおける処理ノードのブロック図である。

【0011】

【図3】本発明の実施形態による、ビデオ処理および顔照合ワークロードにおけるマイクロサービスのセットのブロック／フロー図である。

【0012】

【図4】本発明の一実施形態による、分散演算システムにおけるマイクロサービス間の最適な通信方法を選択する方法のブロック／フロー図である。

【0013】

【図5】本発明の一実施形態による、強化学習モデルに基づいて通信方法を選択する方法のブロック／フロー図である。

【0014】

【図6】本発明の一実施形態による、分散演算システムを管理することができる演算システムであり、特にマイクロサービス間で使用する通信方法を選択する演算システムのブロック図である。

【発明を実施するための形態】

【0015】

アプリケーションは、第1のマイクロサービスの出力が第２のマイクロサービスの入力になるように、複数のマイクロサービスの相互接続によって形成されても良い。このように相互接続された複数のマイクロサービスは、アプリケーションの機能を生成するチェーンを形成することができる。この相互接続はマイクロサービス間のデータ通信を利用し、通信のタイプとしては、ポイントツーポイント通信、ｍ個サーバ対ｎ個クライアント通信、ブローカベース通信、共有メモリベース通信などが例示される。

【0016】

各コミュニケーション方法は、それぞれ異なる条件のセットに最適である。分散演算システムの現状を把握し、実行中のアプリケーションのサービス間通信を動的に設定することができる。分散演算プラットフォームの中には、静的な方法で通信方法を指定できるものもあるが、これらのシステムでは、状況の変化に応じて指定された通信方法を変更する機能が提供されていない場合がある。

【0017】

したがって、通信コントローラは、個々のマイクロサービスから性能と通信関連の統計情報とを収集することができる。これらの統計は、マイクロサービスのペア間で使用される最適な通信方法を特定するために、強化学習を用いて処理されることがある。最適な通信方法は、実行時にアプリケーション全体の効率を向上させるために動的に適用することができる。状態－アクション－報酬－状態－アクション（ＳＡＲＳＡ）強化学習は、特に状況の変化に適応するために使用されても良い。

【0018】

次に図１を参照すると、分散演算システム１００の図が示されている。ユーザ１０２は、分散演算システム１００でワークロードを実行することができる。このため、ユーザ１０２はマネージャシステム１０４と通信する。ユーザ１０２は、ワークロードの実行に必要となる処理ノード１０６の数と種類を含む、ワークロードに関する情報を提供する。

【0019】

マネージャシステム１０４に提供される情報には、例えば、処理ノード１０６の数、プロセッサタイプ、オペレーティングシステム、実行環境、ストレージ容量、ランダムアクセスメモリ容量、ネットワーク帯域幅、およびワークロードに必要となり得るその他の点が含まれる。ユーザ１０２はさらに、レジストリに保存するために、マネージャシステム１０４に画像またはコンテナを提供することができる。

【0020】

分散演算システム１００は、何千もの処理ノード１０６を含むことができ、各ノード１０６は、任意の所与の時間に分散演算システム１００によって実行されているワークロードに従って、アイドルまたはビジーであることができる。単一のマネージャシステム１０４が示されているが、分散演算システム１００に分散された複数のレジストリを持つ、そのようなマネージャシステム１０４が複数存在しても良い。

【0021】

ワークロードの実行前および実行中に、マネージャシステム１０４は、対応するアプリケーションを構成するマイクロサービスを実装する処理ノード１０６を決定する。マネージャシステム１０４は、例えば、プロビジョニング時のノードおよびリソースの利用可能性に基づいて、処理ノード１０６を構成することができる。マイクロサービスは、完全に別々の処理ノード１０６上でホストされてもよいし、任意の数のマイクロサービスが同じ処理ノード１０６に併設されてもよい。マネージャシステム１０４および分散演算システム１００は、複数の異なるユーザ１０２からの複数の異なるワークロードを処理することができ、特定のリソースの可用性は、分散演算システム１００で一般的に何が起こっているかに依存する。

【0022】

本明細書で使用する「プロビジョニング」とは、分散演算システム１００内のリソースがユーザ１０２に割り当てられ、実行の準備が整うプロセスを指す。このように、プロビジョニングには、どの処理要素１０６をワークロードに使用するかというマネージャシステム１０４による決定、ならびに画像の送信、およびワークロードの実行のために処理ノード１０６を準備するために必要なあらゆる構成ステップが含まれる。構成は、例えば、マイクロサービスによって使用される通信方法を特定することを含むことができる。

【0023】

次に図２を参照すると、処理ノード１０８の詳細が示されている。処理ノード１０６は、ハードウェアプロセッサ２０２、メモリ２０４、およびネットワークインタフェース２０６を含む。ネットワークインタフェース２０６は、必要に応じて、任意の適切な通信媒体およびプロトコルを使用して、マネージャシステム１０４と、ユーザ１０２と、および他の処理ノード１０６と通信するように構成することができる。処理ノード１０６はまた、いくつかの実施形態では、メモリ２０４に記憶され、ハードウェアプロセッサ２０２によって実行され得るソフトウェアとして実装され得る１つ以上の機能モジュールを含む。他の実施形態では、１つ以上の機能モジュールは、例えば、特定用途向け集積チップまたはフィールドプログラマブルゲートアレイの形態の１つ以上の離散ハードウェア構成要素として実装され得る。

【0024】

処理ノード１０６は、１つ以上のコンテナ２０８を含むことができる。各コンテナ２０８は、それぞれ異なる動作環境を表すことが特に意図されている。コンテナ２０８はそれぞれ、ソフトウェアアプリケーション、構成ファイル、ワークロードデータセット、および特定のワークロードを実行するために必要なその他の情報またはソフトウェアのセットを含む。これらのコンテナ２０８は、分散アプリケーションのための１つ以上のマイクロサービスを実装することができる。

【0025】

コンテナ２０８はメモリ２０４に格納され、必要に応じてコンテナオーケストレーションエンジン２１０によってインスタンス化およびデコミッショニングされる。一般論として、処理ノード１０６のオペレーティングシステムは、コンテナ２０８の外部に存在することを理解されたい。このように、各コンテナ２０８は同じオペレーティングシステムカーネルとインタフェースを取り、複数のコンテナを同時に実行するのに必要なオーバーヘッドを削減する。一方、コンテナ２０８は、決められた通信方法以外では互いに通信を行わないことができ、セキュリティ上の懸念を軽減することができる。

【0026】

次に図３を参照すると、相互接続されたマイクロサービスのセットを含む、例示的なアプリケーションが示されている。この例では、ビデオ解析アプリケーションは、ビデオストリームのリアルタイム監視を実行することができ、これには、特定の個人がそのエリアに入ったかどうかを判断するために、所定のエリアを監視することが含まれる。ビデオ解析アプリケーションは、このような人物の検出に対して、警告または自動応答を生成することができる。

【0027】

アプリケーションは、ビデオ取込み３０４、顔検出３０６、顔照合３０８、警告マネージャ３１０、および生体認証マネージャ３１２などの例示的なマイクロサービスを含むことができる。カメラ３０２は、ビデオストリームを構成する画像ストリームなどの視覚データを生成する。ビデオ取込み３０４は、この視覚データを処理し、適切なフィルタリングまたはフォーマットを実行して、下流のマイクロサービスによって考慮され得るフレームを生成する。

【0028】

顔検出３０６は、ビデオストリームのフレーム内の顔を識別する。この識別は、画像内の顔の存在を示すためにフレームにラベル付けすることを含み、画像内の顔のバウンディングボックスの座標をさらに含むことができる。その後、顔照合３０８は、顔画像と画像に写っている人物の情報を結びつけることができる。この照合は、生体認証マネージャ３１２からの情報を利用する場合があり、生体認証マネージャ３１２は、関心のある人々のプロファイルを保存していても良い。プロファイルには、顔画像との照合に使用される顔の特徴などの生体認証情報や、その人の名前や役割などの識別情報が含まれても良い。

【0029】

セキュリティシステムの場合、人の役割にはアクセス許可に関する情報が含まれても良い。例えば、人は制限区域に入ることを許可されている場合もあれば、制限区域に入ることを特別に禁止されている場合もある。警告マネージャ３１０は、顔照合３０８による人物の検出に応じて警告を生成することができる。例えば、警告は、許可された人物がその区域にいること、禁止された人物がその区域にいること、または未知の人物がその区域にいることを示しても良い。

【0030】

セキュリティシステム３１２は、警告に自動的に応答しても良い。この応答には、ドアやその他のアクセスポイントを自動的に施錠または解錠する、視覚的および／または可聴アラームを鳴らす、セキュリティ要員を呼び出す、検出された人物にさらなる認証を要求するなどのセキュリティ応答が含まれても良い。

【0031】

分散演算システムでは、複数のビデオストリームを一度に処理することができる。例えば、複数のカメラ３０２がそれぞれのビデオストリームを生成し、ビデオ取込み３０４、顔検出３０６、および顔照合３０８のそれぞれのマイクロサービスインスタンスが存在しても良い。マイクロサービス間の検出された顔の通信は、ｍ個サーバ対ｎ個クライアント処理、ブローカベースのプロセス、または共有メモリなど、さまざまな異なる通信方法のいずれかを使用して処理しても良い。例えば、ポイントツーポイント通信方式は、すべてのカメラ３０２にわたる顔の数が同程度でバランスが取れている場合に最適であるが、ブローカベースの通信方式は、特定のカメラアングル（例えば、スタジアムの入口）で観察される顔が多い場合に最適である。

【0032】

様々なマイクロサービスは、処理ノード２０６内のコンテナ２０８として実装することができる。場合によっては、複数のマイクロサービスは、例えば、異なるそれぞれのコンテナ２０８を使用して、または単一のコンテナ２０８内に複数のマイクロサービスを実装することによって、単一の処理ノード２０６上に実装され得る。場合によっては、マイクロサービスは、複数の異なる処理ノード１０６を使用して実装することができ、異なる処理ノード１０６のコンテナ２０８間の通信は、適切なネットワークを介して処理される。

【0033】

様々なマイクロサービスから性能や通信関連の統計を収集する通信コントローラ。この通信コントローラは、別のソフトウェアモジュールまたはマイクロサービスとして実装されても良いし、マネージャシステム１０２で実装されても良い。収集した統計を用いて、通信コントローラは、ＳＡＲＳＡ強化学習を使用して、マイクロサービス間の通信の特性と、異なる条件に対する最適な通信方法を学習することができる。通信コントローラは、２つのマイクロサービス間で使用される通信方法を動的に変更することができる。

【0034】

次に図４を参照すると、ワークロードの実行中にマイクロサービス通信を動的に適合させる方法が示されている。ブロック４０２は、分散演算システムにマイクロサービスをデプロイし、構成する。この構成は、マイクロサービス間のそれぞれの接続のための通信方法の初期選択を含んでも良い。

【0035】

ブロック４０４は、分散演算システムを使用してワークロードを実行する。ワークロードの実行中、ブロック４０６は、通信統計と、マイクロサービスのその他の性能および運用パラメータを監視する。ブロック４０８は、収集した統計を用いて、現在の運用状況に最適な通信方法を決定する。その後、ブロック４１０は、例えば、現在の通信方法がまだ最適であればそれを維持し、新たな通信方法が最適であると決定された場合には、新たな通信方法を使用するようにマイクロサービスを再構成することによって、最適な通信方法を実施する。その後、処理はブロック４０６に戻り、そこで新たな統計が収集される。この更新プロセスには、設定可能なパラメータに従って遅延を導入することができる。例えば、５分遅らせることで、新たな通信方法がより最適かどうかの判断を改善するために、十分な新たな統計を収集することができる。

【0036】

通信統計の種類には、スライディングウィンドウ内のマイクロサービスのペア間のメッセージの最小サイズ、最大サイズ、平均サイズ、標準偏差、頻度／レートなどのデータパケット関連の統計が含まれる。通信統計はさらに、マイクロサービスの通信ペアのリスト（時間とともに変化する可能性がある）、およびマイクロサービスが実行されているゾーンとマシンとに関する情報を含んでも良い。これらの通信統計は、強化学習モデルの状態を決定する可能性がある。また、強化学習モデルの報酬を決定するために、処理率などの性能統計を収集しても良い。

【0037】

ブロック４０８の判定では、強化学習を利用する。ＳＡＲＳＡ強化学習では、エージェントは現在の状況を観察する（例えば、収集した統計を考慮する）。次に、エージェントはポリシーを使ってアクションを選択する。ポリシーは現在の状況を入力とし、ある報酬を最大化するように計算されたアクションを生成する。アクションが実行され、結果が観察される。例えば、報酬やペナルティーが与えられる。このフィードバックに基づいて、エージェントはより良い結果を提供するためにポリシーを更新する。このプロセスを繰り返すうちに、エージェントは環境を学習し、どのようなアクションが最大の報酬をもたらすかを学ぶ。エージェントは、システムの動作を導くために、新たな入力で学習されたポリシーを使用することができる。

【0038】

マイクロサービス間の通信を最適化するという文脈では、環境は以下の量を含むベクトルとして定義されても良い。

【0039】

スライディングウィンドウ内でマイクロサービスのペア間で交換されるデータパケットの最小サイズ。

【0040】

スライディングウィンドウ内でマイクロサービスのペア間で交換されるデータパケットの最大サイズ。

【0041】

スライディングウィンドウ内でマイクロサービスのペア間で交換されるデータパケットのサイズの標準偏差。

【0042】

スライディングウィンドウ内のマイクロサービス間のデータパケットの頻度。

【0043】

マイクロサービスが実行されているゾーンと処理ノード。

【0044】

エージェントが取ることのできるアクションには、利用可能な通信方法のいずれかが含まれる。例えば、エージェントがとるアクションには次のようなものが含まれる。

【0045】

ポインツーポイント通信を使用する。

【0046】

ｍ個サーバ対ｎ個クライアント通信を使用する。

【0047】

ユーザーブローカーベースの通信を使用する。

【0048】

共有メモリベースの通信を使用する。

【0049】

何もしない（現在の連絡方法を維持する）。

【0050】

報酬は、マイクロサービスの処理速度の変化として決定されても良い。これは、以前の処理速度と、新たな処理速度と以前の処理速度との差の比率として計算することができる。

【数1】

【0051】

エージェントは、アクションに対してすぐに得られる報酬に加えて、現在のアクションによって将来得られるかもしれない報酬も考慮する。したがって、Ｑ値は状態とアクションとのペアごとに定義することができる。例えば、Ｑ（ｓ，ａ）は、状態ｓのときにアクションａをとることの利益の推定値である。Ｑ（ｓ，ａ）の見積もりは、ａというアクションをとることによって発生する可能性のある将来の報酬を考慮に入れている。
Ｑ（ｓ，ａ）←Ｑ（ｓ，ａ）＋α［ｒ＋γ・Ｑ（ｓ’，ａ’）－Ｑ（ｓ，ａ）］
ここで、αは、以前に学習したＱ値と比較して、新たな情報にどれだけの重みを与えるかを制御する学習率であり、γは、将来の報酬の重要性を決定する割引係数である。α＝０は学習を停止し、α＝１は最新の情報のみを使用する。この値は、初期導入時や異なるハードウェアプラットフォームに移行する際に、モデルが新たな環境で行われたアクションの結果を迅速に同化できるように、高い値（例えばα＝０．９）のパラメータとして設定することができる。初期学習フェーズの後、Ｑ行列が実質的に探索されたとき、新たに同化された情報の利用を促進するために、値を下げることができる（例えば、α＝０．１）。

【0052】

γがゼロの場合、エージェントは将来の報酬を無視し、目先の報酬を最適化しようとする。γを１に設定すると、エージェントは長期的な報酬を高く評価する。オペレータが、入力コンテンツの後続フレームに高い変動性があると予想する場合、オペレータは、γに低い値（例えば、γ＝０．１）を割り当てることによってこの情報を符号化しても良く、一方、変動性が低い状況には高い値を使用することができる。

【0053】

次に図５を参照すると、強化学習モデルを使用してアクションを決定する様子が示されている。ブロック５０１は、初期の状態ｓとアクションａとを設定する。アクションを選択するための例示的なプロセスについて、以下により詳細に説明する。ブロック５０２は、選択されたアクションａを実行し、状態をｓから新たな状態ｓ’に変更する。ブロック５０４は、新たな状態ｓ’に基づいて報酬値ｒを決定する。

【0054】

ブロック５０６は、新たな状態ｓ’を観察し、ブロック５０８は、新たなアクションａ’を選択する。新たな状態ｓ’において、エージェントはアクションａ’がＱ（ｓ’，ａ’）のＱ値をもたらすと仮定する。累積報酬Ｑ（ｓ，ａ）は、上述のように推定することができる。ブロック５１０は、前の状態およびアクション（ｓ，ａ）と新たな状態およびアクション（ｓ’，ａ’）とに従って累積報酬を更新する。

【0055】

学習プロセスは、システムの運用を通じて継続される。エージェントが状態を訪問し、再訪することで、Ｑ行列の値を更新し、現在の性能測定を反映させることができる。操作の初期段階で、状態空間のランダムな探索を促すための学習パラメータが設定される。その後、Ｑ行列がほぼ埋まった時点で、学習パラメータを最適な状態の選択を促すように設定しても良いが、その一方で、行列の値を更新するための学習はある程度可能にしておく。

【0056】

このプロセスは、アクションaを選択するための方針を定義するものではない。その代わりに、すべての状態とアクションとのペアがエージェントによって訪問されることを保証するポリシーが存在することが仮定される。これを満たす１つの方法は、学習パラメータεを定義することである。確率εで、ポリシーは状態に最適なアクションを提案し、確率１－εで、エージェントはランダムなアクションを選択する。学習中、状態空間を探索するために、値εに小さな値（例えばε＝０．１）を割り当てることができる。Ｑ値の大部分が正確に推定された場合、例えば所定の閾値よりも大きな値の割合が設定された場合、エージェントが学習したモデルを利用するように、より高いε値を使用することができる。学習中にアクションをランダムに選択することで、性能が悪いことが知られている状態でも、ときどき再訪問されることに注意する。これにより、性能が向上した場合、エージェントは報酬値を更新することができる。

【0057】

これらのＱ値は、与えられた状態にあるときに特定のアクションをとった場合の報酬を決定する一環として、エージェントによって推定される。この決定は、エージェントが行列の各要素の報酬を更新している間に行われることがある。このように、システムがある状態を占めると、その状態に移行するための報酬を決定するために、処理速度などの性能統計を収集することができる。これらの値は、例えば、エージェントが以前に訪問した状態に戻り、性能統計が以前に収集されたものと著しく異なることを発見した場合など、状況の変化を反映するために更新されても良い。

【0058】

Ｑモデルは二次元の行列として実装することができ、１つの次元は離散化された状態を表し、もう１つの次元はアクションを表す。行列の各要素ｉ.ｊには、システムが状態ｊにある間にアクションｉを取った場合の期待報酬が格納される。

【0059】

ブロック５０１または５０８などでアクションを選択する際、０と１の間の乱数が生成され、εと比較されることがある。乱数がεより大きいか等しい場合、環境をさらに探索するためにランダムなアクションが選択されても良い。選択したアクションに対する期待報酬がマイナスの場合、エージェントは選択したアクションを元に戻すことができる。そうでなければ、エージェントは現在の状態で報酬を最大化するために次のアクションを選択する。しかし、選択されたアクションを実行することによって予測される報酬が、以前のアクションによって得られた報酬よりも小さい場合、ポリシーは以前のアクションを再度推奨する。

【0060】

通信方法の選択という文脈では、“アクション”はマイクロサービスのペア間でどの通信方法を使用するかを決定する。エージェントが、以前の通信方法が最良の結果をもたらすと判断した場合、エージェントはその通信方法を使い続ける。しかし、新たな通信方法がより良い期待報酬をもたらすように状態が変化した場合、エージェントは新たな通信方法を実行することができる。

【0061】

さまざまな条件によって、ある通信方法が他の通信方法よりも優先されることがある。マイクロサービスの出力が他の多くのマイクロサービスによって入力として使用される場合、各ソースマイクロサービスインスタンスと各デスティネーションマイクロサービスインスタンスとの間に個別の接続を形成するのを避けるために、メッセージバスが望まれるかもしれない。必要なメッセージング速度が均一でなくなり始めた場合、例えば、宛先Ａが１秒間に５メッセージを処理し、宛先マイクロサービスＢが１秒間に３０メッセージを処理する場合、ポイントツーポイントのメッセージングを使用する方が効率的かもしれない。

【0062】

次に図６を参照すると、本発明の実施形態による、例示的な演算装置５００が示されている。演算装置５００は、分類器の強化を実行するように構成されている。

【0063】

演算装置５００は、限定されないが、コンピュータ、サーバ、ラックベースのサーバ、ブレードサーバ、ワークステーション、デスクトップコンピュータ、ラップトップコンピュータ、ノートブックコンピュータ、タブレットコンピュータ、モバイル演算装置、ウェアラブル演算装置、ネットワーク機器、ウェブ機器、分散演算システム、プロセッサベースのシステム、および／または利用者電子装置など、本書に記載される機能を実行できる任意のタイプの計算またはコンピュータ装置として具現化することができる。さらにまたは代替的に、演算装置５００は、１つまたは複数のコンピュートスレッド、メモリスレッド、または他のラック、スレッド、演算シャーシ、または物理的に分解された演算装置の他の構成要素として具現化されてもよい。

【0064】

図６に示すように、演算装置６００は、例示的に、プロセッサ６１０、入力／出力サブシステム６２０、メモリ６３０、データ記憶装置６４０、および通信サブシステム６５０、および／またはサーバまたは同様の演算装置に一般的に見られる他の構成要素およびデバイスを含んでいる。もちろん、演算装置６００は、他の実施形態において、サーバコンピュータに一般的に見られるような他のまたは追加の構成要素（例えば、様々な入力／出力デバイス）を含んでもよい。さらに、いくつかの実施形態では、例示的な構成要素の１つ以上が、別の構成要素に組み込まれるか、さもなければ、別の構成要素の一部を形成することができる。例えば、メモリ６３０、またはその一部は、いくつかの実施形態において、プロセッサ６１０に組み込まれてもよい。

【0065】

プロセッサ６１０は、本明細書に記載された機能を実行することができる任意のタイプのプロセッサとして具現化することができる。プロセッサ６１０は、シングルプロセッサ、マルチプロセッサ、中央処理ユニット（ＣＰＵ）、グラフィック処理ユニット（ＧＰＵ）、シングルまたはマルチコアプロセッサ、デジタル信号プロセッサ、マイクロコントローラ、またはその他のプロセッサやプロセスシング／制御回路として具現化されてもよい。

【0066】

メモリ６３０は、本明細書に記載された機能を実行することができる任意のタイプの揮発性または不揮発性メモリまたははデータストレージとして具現化され得る。動作中、メモリ６３０は、オペレーティングシステム、アプリケーション、プログラム、ライブラリ、およびドライバなど、演算装置６００の動作中に使用される様々なデータおよびソフトウェアを格納することができる。メモリ６３０は、Ｉ／Ｏサブシステム６２０を介してプロセッサ６１０と通信可能に結合され、プロセッサ６１０、メモリ６３０、および演算装置６００の他の構成要素との入出力動作を容易にするための回路および／または構成要素として具現化され得る。例えば、Ｉ／Ｏサブシステム６２０は、メモリコントローラハブ、入力／出力制御ハブ、プラットフォームコントローラハブ、集積制御回路、ファームウェアデバイス、通信リンク（例えば、ポイントツーポイントリンク、バスリンク、ワイヤ、ケーブル、ライトガイド、プリント回路基板トレースなど）および/または、入力/出力操作を容易にするための他の構成要素およびサブシステムとして具現化されてもよく、さもなければ、これらを含んでいても良い。いくつかの実施形態では、Ｉ／Ｏサブシステム６２０は、システムオンチップ（ＳＯＣ）の一部を形成し、プロセッサ６１０、メモリ６３０、および演算装置６００の他の構成要素と共に、単一の集積回路チップに組み込まれてもよい。

【0067】

データ記憶装置６４０は、例えば、メモリ装置および回路、メモリカード、ハードディスクドライブ、ソリッドステートドライブ、または他のデータ記憶装置など、データの短期または長期記憶用に構成された任意のタイプの装置またはデバイスとして具現化することができる。データ記憶装置６４０は、コンテナオーケストレーションのためのプログラムコード６４０Ａと分散型演算システム内の通信方法を管理するためのプログラムコード６４０Ｂとを格納することができる。演算装置６００の通信サブシステム６５０は、ネットワークを介して演算装置６００と他のリモート装置との間の通信を可能にすることができる、任意のネットワークインタフェースコントローラまたは他の通信回路、装置、またはその集合体として具現されることができる。通信サブシステム６５０は、任意の１つ以上の通信技術（例えば、有線または無線通信）および関連するプロトコル（例えば、イーサネット、ＩｎｆｉｎｉＢａｎｄ（登録商標）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、Ｗｉ－Ｆｉ（登録商標）、ＷｉＭＡＸ（登録商標）など）を使用してそのような通信を実現するように構成され得る。

【0068】

図示のように、演算装置６００は、１つ以上の周辺装置６６０も含むことができる。周辺装置６６０は、任意の数の追加の入出力装置、インタフェース装置、および／または他の周辺装置を含んでもよい。例えば、いくつかの実施形態では、周辺装置６６０は、ディスプレイ、タッチスクリーン、グラフィック回路、キーボード、マウス、スピーカシステム、マイク、ネットワークインタフェース、および／または他の入力／出力装置、インタフェース装置、および／または周辺装置を含むことができる。

【0069】

もちろん、演算装置６００は、当業者が容易に思いつくように、他の要素（図示せず）を含むこともでき、また、特定の要素を省略することもできる。例えば、様々な他のセンサ、入力装置および／または出力装置は、当業者によって容易に理解されるように、同じものの特定の実装に依存して、演算装置６００に含まれることが可能である。例えば、様々なタイプの無線および／または有線の入力および／または出力装置を使用することができる。さらに、プロセッサ、コントローラ、メモリなどを追加して、様々な構成で利用することも可能である。処理システム６００のこれらおよび他の変形例は、本明細書に提供される本発明の教示を考慮すれば、当業者によって容易に企図されるものである。

【0070】

本明細書に記載する実施形態は、完全にハードウェアであってもよく、完全にソフトウェアであってもよく、または、ハードウェア要素とソフトウェア要素との両方を含むものであってもよい。好ましい実施形態では、本発明は、ファームウェア、常駐ソフトウェア、マイクロコードなどを含むがこれらに限定されないソフトウェアで実施される。

【0071】

実施形態は、コンピュータまたは任意の命令実行システムによって、またはそれに関連して使用するためのプログラムコードを提供する、コンピュータ使用可能またはコンピュータ可読媒体からアクセス可能なコンピュータプログラム製品を含むことができる。コンピュータ使用可能媒体またはコンピュータ可読媒体は、命令実行システム、装置、またはデバイスによって、またはそれに関連して使用するためのプログラムを格納、通信、伝搬、またはトランスポートする任意の装置を含むことができる。媒体は、磁気、光学、電子、電磁気、赤外線、または半導体システム（または装置またはデバイス）、または伝搬媒体とすることができる。媒体は、半導体または固体ステートメモリ、磁気テープ、リムーバブルコンピュータディスケット、ランダムアクセスメモリ（ＲＡＭ）、リードオンリーメモリ（ＲＯＭ）、リジッド磁気ディスクおよび光ディスクなどのコンピュータ読み取り可能な記憶媒体を含むことができる。

【0072】

各コンピュータプログラムは、本明細書に記載する手順を実行するために、記憶媒体または装置がコンピュータによって読み取られるときに、コンピュータの操作を構成し制御するために、汎用または特殊目的のプログラム可能コンピュータによって読み取り可能な、機械読み取り可能な記憶媒体または装置（例えば、プログラムメモリまたは磁気ディスク）に実体的に記憶することができる。本発明のシステムはまた、コンピュータプログラムで構成された、コンピュータ読み取り可能な記憶媒体で実施されるものと考えることができ、その場合、構成された記憶媒体は、コンピュータを特定の所定の方法で動作させて、本明細書に記載する機能を実行させる。

【0073】

プログラムコードを記憶および／または実行するのに適したデータ処理システムは、システムバスを介してメモリ要素に直接的または間接的に結合された少なくとも１つのプロセッサを含んでもよい。メモリ要素は、プログラムコードの実際の実行中に採用されるローカルメモリ、バルクストレージ、および実行中にバルクストレージからコードが検索される回数を減らすために少なくとも何らかのプログラムコードの一時記憶を提供するキャッシュメモリを含むことができる。入力／出力またはＩ／Ｏ装置（キーボード、ディスプレイ、ポインティング装置などを含むが、これらに限定されない）は、直接または介在するＩ／Ｏコントローラを介してシステムに結合され得る。

【0074】

ネットワークアダプタは、データ処理システムが、介在するプライベートまたはパブリックネットワークを介して他のデータ処理システムまたはリモートプリンタまたはストレージデバイスに結合されるようになることを可能にするために、システムに結合されることもできる。モデム、ケーブルモデム、イーサネットカードは、現在利用可能なネットワークアダプタの種類のほんの一部に過ぎない。

【0075】

本明細書で採用されるように、「ハードウェアプロセッササブシステム」または「ハードウェアプロセッサ」という用語は、１つ以上の特定のタスクを実行するために協働するプロセッサ、メモリ、ソフトウェアまたはそれらの組み合わせを指すことができる。有用な実施形態では、ハードウェアプロセッササブシステムは、１つまたは複数のデータ処理要素（例えば、論理回路、処理回路、命令実行デバイスなど）を含むことができる。１つまたは複数のデータ処理要素は、中央処理ユニット、画像処理ユニットおよび／または別個のプロセッサまたはコンピューティング要素ベースのコントローラ（たとえば、論理ゲートなど）に含めることができる。ハードウェアプロセッササブシステムは、１つ以上のオンボードメモリ（例えば、キャッシュ、専用メモリアレイ、読み出し専用メモリなど）を含むことができる。いくつかの実施形態では、ハードウェアプロセッササブシステムは、オンボードまたはオフボードにすることができるか、またはハードウェアプロセッササブシステム（例えば、ＲＯＭ、ＲＡＭ、基本入出力システム（ＢＩＯＳ）など）によって使用するために専用にすることができる１つ以上のメモリを含むことができる。

【0076】

ある実施形態では、ハードウェアプロセッササブシステムは、１つ以上のソフトウェア要素を含むことができ、実行することができる。１つ以上のソフトウェア要素は、特定の結果を達成するために、オペレーティングシステムおよび／または１つ以上のアプリケーションおよび／または特定のコードを含むことができる。

【0077】

他の実施形態では、ハードウェアプロセッササブシステムは、指定された結果を達成するために１つまたは複数の電子処理機能を実行する専用の専用回路を含むことができる。そのような回路は、１つまたは複数のアプリケーション専用集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、および／またはプログラマブルロジックアレイ（ＰＬＡ）を含むことができる。

【0078】

ハードウェアプロセッササブシステムのこれらおよび他の変形もまた、本発明の実施形態に従って企図される。

【0079】

明細書において、本発明の「一実施形態」または「一実施形態」、およびその他の変形例への言及は、実施形態に関連して説明した特定の特徴、構造、特性などが、本発明の少なくとも一実施形態に含まれることを意味する。したがって、本明細書中の各所に現れる「一実施形態において」または「一実施形態において」という表現、および他の任意の変形は、必ずしもすべてが同じ実施形態を指すとは限らない。しかしながら、本明細書で提供される本発明の教示を考慮して、１つ以上の実施形態の特徴を組み合わせることができることは理解されるであろう。

【0080】

例えば「Ａ／Ｂ」の場合、「Ａおよび／またはＢ」、「ＡとＢとの少なくとも１つ」のような、以下の「／」、「および／または」、「少なくとも1つ」のいずれかの使用は、第１のリストされた選択肢（Ａ）のみの選択、または第２のリストされた選択肢（Ｂ）のみの選択、または両方の選択肢（ＡおよびＢ）の選択を包含すると意図していると理解されよう。さらなる例として、「Ａ、Ｂ、および／またはＣ」および「Ａ、Ｂ、およびＣの少なくとも１つ」の場合、かかる表現は、第１のリストされた選択肢（Ａ）のみの選択、または第２のリストされた選択肢（Ｂ）のみの選択、または第３のリストされた選択肢（Ｃ）のみの選択、または第１および第２のリストされた選択肢（ＡおよびＢ）のみの選択、第１および第３のリストされた選択肢（ＡおよびＣ）のみの選択、第２および第３のリストされた選択肢（ＢおよびＣ）のみの選択、または３つすべての選択肢（ＡおよびＢおよびＣ）の選択を包含すると意図されている。このことは、記載された項目の数だけ拡張することができる。

【0081】

上記は、あらゆる点で例示的かつ例示的であるが、制限的なものではないと理解され、ここに開示された発明の範囲は、詳細な説明からではなく、特許法によって許される全幅に従って解釈された請求項から決定されるものである。本明細書に示され説明された実施形態は、本発明の例示に過ぎず、当業者は、本発明の範囲及び精神から逸脱することなく、様々な修正を実施することができることを理解されたい。当業者であれば、本発明の範囲と精神から逸脱することなく、様々な他の特徴の組み合わせを実施することができる。このように、特許法が要求する詳細さと特殊性をもって本発明の側面を説明したが、特許状によって請求され、保護されることを望むものは、添付の特許請求の範囲に記載されているとおりである。

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【国際調査報告】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版