特開2024-150304 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社富士通エフサスの特許一覧

特開2024-150304制御プログラム，情報処理システムおよび制御方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024150304

(43)【公開日】2024-10-23

(54)【発明の名称】制御プログラム，情報処理システムおよび制御方法

(51)【国際特許分類】

G06F 11/34 20060101AFI20241016BHJP

G06F 11/07 20060101ALI20241016BHJP

G06N 20/00 20190101ALI20241016BHJP

【ＦＩ】

G06F11/34 133

G06F11/07 190

G06F11/07 140H

G06N20/00

【審査請求】未請求

【請求項の数】5

【出願形態】ＯＬ

(21)【出願番号】P 2023063659

(22)【出願日】2023-04-10

(71)【出願人】

【識別番号】598057291

【氏名又は名称】エフサステクノロジーズ株式会社

(74)【代理人】

【識別番号】110003649

【氏名又は名称】弁理士法人真田特許事務所

(74)【代理人】

【識別番号】100189201

【弁理士】

【氏名又は名称】横田功

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】野津隆弘

(72)【発明者】

【氏名】原靖

(72)【発明者】

【氏名】甲斐雄高

【テーマコード（参考）】

5B042

【Ｆターム（参考）】

5B042KK15

5B042MA08

5B042MA14

5B042MC22

5B042MC29

(57)【要約】

【課題】機械学習モデルの訓練において、よりよい計算機構成を実現できるようにする。
【解決手段】複数の種類の演算リソースを用いた機械学習モデルの訓練の実行中に収集した、複数の種類の演算リソースのうち第１の種類の演算リソースの動作周波数を所定量低下させた時のシステム負荷と、複数の種類の演算リソースのうち第２の種類の演算リソースの動作周波数を所定量低下させた時のシステム負荷とに基づいて、第１の種類の演算リソースの動作周波数を所定量低下させた時の機械学習モデルにおけるループ周期と、第２の種類の演算リソースの動作周波数を所定量低下させた時の機械学習モデルのループ周期とを算出し、算出したループ周期の比較結果に基づいて、第１の種類の演算リソースと第２の種類の演算リソースとのうちから改善対象の演算リソースを判定する。
【選択図】図２

【特許請求の範囲】

【請求項1】

複数の種類の演算リソースを有する計算機システムにおいて、
前記複数の種類の演算リソースを用いた機械学習モデルの訓練の実行中に収集した、前記複数の種類の演算リソースのうち第１の種類の演算リソースの動作周波数を所定量低下させた時のシステム負荷と、前記複数の種類の演算リソースのうち第２の種類の演算リソースの動作周波数を前記所定量低下させた時の前記システム負荷とに基づいて、
前記第１の種類の演算リソースの動作周波数を所定量低下させた時の前記機械学習モデルにおけるループ周期と、前記第２の種類の演算リソースの動作周波数を前記所定量低下させた時の前記機械学習モデルのループ周期とを算出し、
算出した前記ループ周期の比較結果に基づいて、前記第１の種類の演算リソースと前記第２の種類の演算リソースとのうちから改善対象の演算リソースを判定する
処理をプロセッサに実行させることを特徴とする制御プログラム。

【請求項2】

前記改善対象の演算リソースを判定する処理が、
前記第１の種類の演算リソースの動作周波数を所定量低下させた時の前記機械学習モデルにおける前記ループ周期と、前記第２の種類の演算リソースの動作周波数を前記所定量低下させた時の前記機械学習モデルの前記ループ周期とのうち、遅い方のループ周期を求めるために動作周波数を低下させた演算リソースを前記改善対象の演算リソースと判定する処理を含む
ことを特徴とする、請求項１に記載の制御プログラム。

【請求項3】

判定した前記改善対象の演算リソースを提示する
処理を前記プロセッサに実行させることを特徴とする請求項１または２に記載の制御プログラム。

【請求項4】

複数の種類の演算リソースを有する計算機システムであって、
前記複数の種類の演算リソースを用いた機械学習モデルの訓練の実行中に収集した、前記複数の種類の演算リソースのうち第１の種類の演算リソースの動作周波数を所定量低下させた時のシステム負荷と、前記複数の種類の演算リソースのうち第２の種類の演算リソースの動作周波数を前記所定量低下させた時の前記システム負荷とに基づいて、
前記第１の種類の演算リソースの動作周波数を所定量低下させた時の前記機械学習モデルにおけるループ周期と、前記第２の種類の演算リソースの動作周波数を前記所定量低下させた時の前記機械学習モデルのループ周期とを算出し、
算出した前記ループ周期の比較結果に基づいて、前記第１の種類の演算リソースと前記第２の種類の演算リソースとのうちから改善対象の演算リソースを判定する
処理を実行する制御部を備えることを特徴とする情報処理システム。

【請求項5】

複数の種類の演算リソースを有する計算機システムにおいて、
前記複数の種類の演算リソースを用いた機械学習モデルの訓練の実行中に収集した、前記複数の種類の演算リソースのうち第１の種類の演算リソースの動作周波数を所定量低下させた時のシステム負荷と、前記複数の種類の演算リソースのうち第２の種類の演算リソースの動作周波数を前記所定量低下させた時の前記システム負荷とに基づいて、
前記第１の種類の演算リソースの動作周波数を所定量低下させた時の前記機械学習モデルにおけるループ周期と、前記第２の種類の演算リソースの動作周波数を前記所定量低下させた時の前記機械学習モデルのループ周期とを算出し、
算出した前記ループ周期の比較結果に基づいて、前記第１の種類の演算リソースと前記第２の種類の演算リソースとのうちから改善対象の演算リソースを判定する
処理をプロセッサが実行することを特徴とする制御方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、制御プログラム，情報処理システムおよび制御方法に関する。

【背景技術】

【0002】

ＡＩ（Artificial Intelligence）技術は様々な分野で用いられており、今後の発展も期待できる。一方で機械学習モデルの訓練に多大な時間を要しており、この時間の短縮が急務である。

【0003】

機械学習モデルの訓練には巨大な計算資源が要求されるため、クラウドの計算機を一時的に調達して実行することが多い。

【0004】

一般に計算機システムの性能には、ＣＰＵ（Central Processing Unit），ＧＰＵ（Graphics Processing Unit），アクセラレータ，メモリ，ストレージ，ネットワークなどの様々な要素が複雑に影響する。そのため、調達した計算機構成が、必ずしも現在実行しようとしている訓練に適しているとは限らない。

【0005】

また、クラウド事業者の立場から見ると、機械学習モデルの訓練を実行する顧客に対し、より良い計算機構成を提案することで、自社が提供するサービスの付加価値を向上させることができる。

【0006】

例えば、顧客が機械学習モデルの訓練を実行する際に、訓練の実行上のボトルネックとなるリソースを特定し、このように特定したリソースをより高い性能のものにすることを顧客に提案することで、より良い計算機構成を顧客に提案することができる。

【先行技術文献】

【特許文献】

【0007】

【特許文献1】特開２０２１－１８５４６９号公報

【特許文献2】特開２０１２－１６８６６０号公報

【発明の概要】

【発明が解決しようとする課題】

【0008】

機械学習モデルの訓練を行なう訓練プログラムの性能の良し悪しは、訓練の実行時間の長さで評価されるが、一般に機械学習モデルの訓練には時間を要するため、すべての訓練が終わるまで待機することは現実的ではない。

【0009】

一方、訓練プログラムはループを多く含んで構成されているため、１回のループの周期がわかれば訓練プログラムのおおよその性能を見積もることができる。

【0010】

しかしながら、ループの周期を測定するためには一般にはプログラムの修正が必要となる。

【0011】

また、クラウド事業者の立場からすると、ＣＰＵやＧＰＵのクロックを制御することは電力制限やリソース割り当てという観点から許容されているが、顧客が実行するプログラムに手を入れることは許容されていない。従って、ループの周期を測定するためにプログラムの修正を行なうことはできない。

【0012】

そこで、顧客が実行する訓練プログラムを修正することなく、クラウド事業者が観測可能なデータを用いて訓練プログラムのループ周期を観測し、ボトルネックとなるリソースを特定することが求められている。

【0013】

１つの側面では、本発明は、機械学習モデルの訓練において、よりよい計算機構成を実現できるようにすることを目的とする。

【課題を解決するための手段】

【0014】

このため、この制御プログラムは、複数の種類の演算リソースを有する計算機システムにおいて、前記複数の種類の演算リソースを用いた機械学習モデルの訓練の実行中に収集した、前記複数の種類の演算リソースのうち第１の種類の演算リソースの動作周波数を所定量低下させた時のシステム負荷と、前記複数の種類の演算リソースのうち第２の種類の演算リソースの動作周波数を前記所定量低下させた時の前記システム負荷とに基づいて、前記第１の種類の演算リソースの動作周波数を所定量低下させた時の前記機械学習モデルにおけるループ周期と、前記第２の種類の演算リソースの動作周波数を前記所定量低下させた時の前記機械学習モデルのループ周期とを算出し、算出した前記ループ周期の比較結果に基づいて、前記第１の種類の演算リソースと前記第２の種類の演算リソースとのうちから改善対象の演算リソースを判定する処理をプロセッサに実行させる。

【発明の効果】

【0015】

一実施形態によれば、機械学習モデルの訓練において、よりよい計算機構成を実現できる。

【図面の簡単な説明】

【0016】

【図1】一実施形態に係る情報処理システムのシステム構成を模式的に示す図である。

【図2】一実施形態に係る情報処理システムのボトルネック解析部の機能構成を例示する図である。

【図3】一実施形態に係る情報処理システムのボトルネック解析プログラムの構成を示す図である。

【図4】ＡＩ学習モデルの訓練時におけるＣＰＵ使用率を例示する図である。

【図5】ＡＩモデルの訓練時におけるＣＰＵ負荷を例示する図である。

【図6】ＣＰＵクロックダウンによる周期の変化を示す図である。

【図7】一実施形態に係る情報処理システムの提示部が出力する提示情報を例示する図である。

【図8】一実施形態に係る情報処理システムのボトルネック解析部による処理の概要を説明するためのフローチャートである。

【図9】図８のステップＡ１の処理の詳細を説明するためのフローチャートである。

【図10】図８のステップＡ２の処理の詳細を説明するためのフローチャートである。

【図11】一実施形態に係る情報処理システムにおけるループ周期の推定処理を説明するためのフローチャートである。

【発明を実施するための形態】

【0017】

以下、図面を参照して本制御プログラム，情報処理システムおよび制御方法に係る実施の形態を説明する。ただし、以下に示す実施形態はあくまでも例示に過ぎず、実施形態で明示しない種々の変形例や技術の適用を排除する意図はない。すなわち、本実施形態を、その趣旨を逸脱しない範囲で種々変形して実施することができる。また、各図は、図中に示す構成要素のみを備えるという趣旨ではなく、他の機能等を含むことができる。

【0018】

（Ａ）構成
図１は一実施形態に係る情報処理システム１のシステム構成を模式的に示す図である。

【0019】

情報処理システム１は、ハードウェアプラットフォーム１０とソフトウェアプラットフォーム３とを有する。情報処理システム１を計算機システムといってよい。

【0020】

ソフトウェアプラットフォーム３はハードウェアプラットフォーム１０上で実行される。ソフトウェアプラットフォーム３には、例えば、ＯＳ（Operating System），ライブラリ，フレームワークが含まれる。

【0021】

ソフトウェアプラットフォーム３上において、ＡＩ学習モデル訓練プログラム５およびボトルネック解析プログラム４ｓが実行される。ソフトウェアプラットフォーム３は、ＡＩ学習モデルや、ＡＩ学習モデル訓練プログラム５およびボトルネック解析プログラム４ｓを実行するために必要なソフトウェア環境を提供する。

【0022】

ハードウェアプラットフォーム１０は、図１に示すように、ハードウェア構成として、例示的に、ＣＰＵ１１，ＧＰＵ１２，メモリ１３，ストレージ１４および通信インタフェース１５を備えてよい。ハードウェアプラットフォーム１０に含まれるＣＰＵ１１，ＧＰＵ１２，メモリ１３，ストレージ１４および通信インタフェース１５をハードウェアエレメントといってよい。

【0023】

ＣＰＵ１１は、種々の制御や演算を行なう演算処理装置の一例であり、演算リソースの一例でもある。ＣＰＵ１１は、ハードウェアプラットフォーム１０内の各ブロックと図示しないバスで相互に通信可能に接続されてよい。なお、ＣＰＵ１１は、複数のプロセッサを含むマルチプロセッサであってもよいし、複数のプロセッサコアを有するマルチコアプロセッサであってもよく、或いは、マルチコアプロセッサを複数有する構成であってもよい。

【0024】

ＧＰＵ１２は、モニタ等の出力装置に対する画面表示制御に好適な演算処理装置であり、演算リソースの一例である。ＧＰＵ１２は、種々の制御や演算を行なう演算処理装置の一例である。ＧＰＵ１２は、ハードウェアプラットフォーム１０内の各ブロックと図示しないバスで相互に通信可能に接続されてよい。ハードウェアエレメントのうち、演算処理装置（プロセッサ）をプロセッサエレメントといってよい。ＣＰＵ１１およびＧＰＵ１２はプロセッサエレメントである。

【0025】

メモリ１３は、種々のデータやプログラム等の情報を格納するＨＷの一例である。メモリ１３としては、例えばＤＲＡＭ（Dynamic Random Access Memory）等の揮発性メモリ、および、ＰＭ（Persistent Memory）等の不揮発性メモリ、の一方または双方が挙げられる。

【0026】

ストレージ１４は、種々のデータやプログラム等の情報を格納するハードウェアの一例である。ストレージ１４は、ＣＰＵ１１やＧＰＵ１２が実行するプログラムや、プログラムの実行に際して用いられるデータを格納する。プログラムには、ＡＩ学習モデル訓練プログラム５およびボトルネック解析プログラム４ｓが含まれる。

【0027】

ストレージ１４としては、ＨＤＤ（Hard Disk Drive）等の磁気ディスク装置、ＳＳＤ（Solid State Drive）等の半導体ドライブ装置、不揮発性メモリ等の各種記憶装置が挙げられる。不揮発性メモリとしては、例えば、フラッシュメモリ、ＳＣＭ（Storage Class Memory）、ＲＯＭ（Read Only Memory）等が挙げられる。

【0028】

通信インタフェース１５は、ハードウェアプラットフォーム１０と他の情報処理装置との間の接続および通信の制御等を行なう。例えば、通信インタフェース１５は、イーサネット（登録商標）等のＬＡＮ（Local Area Network）、或いは、ＦＣ（Fibre Channel）等の光通信等に準拠したアダプタを含んでよい。当該アダプタは、無線および有線の一方又は双方の通信方式に対応してよい。

【0029】

例えば、ハードウェアプラットフォーム１０は、通信インタフェース１５およびネットワークを介して、図示しない端末装置やデータベース等のそれぞれと相互に通信可能に接続されてよい。なお、上述したプログラムは、当該通信インタフェース１５を介して、ネットワークからダウンロードされ、ストレージ１４に格納されてもよい。

【0030】

ハードウェアプラットフォーム１０の構成は適宜変更することができる。例えば、図１に示す例においては、ＣＰＵ１１，ＧＰＵ１２，メモリ１３，ストレージ１４および通信インタフェース１５をそれぞれ１つずつ備えているが、それぞれ２つ以上備えてもよい。

【0031】

また、これらのハードウェアエレメントを、より性能の高いものなど、異なるハードウェアエレメントに交換してもよい。

【0032】

ハードウェアプラットフォーム１０を構成するハードウェアエレメントの少なくとも一部をクラウド事業者が提供してもよい。ユーザはクラウド事業者が提供するハードウェアエレメントを組み合わせて、所望の性能を実現するハードウェアプラットフォーム１０を構成してよい。例えば、ユーザは、ＡＩ学習モデル訓練プログラム５を実行させるに十分な性能を有するハードウェアプラットフォーム１０を、ハードウェアエレメントを組み合わせることで構成してよい。

【0033】

ＡＩ学習モデル訓練プログラム５は、ＡＩ学習モデル（機械学習モデル）の訓練を行なうプログラムである。ＡＩ学習モデル訓練プログラム５として、既知の種々の訓練プログラムを用いてよく、その説明は省略する。ＡＩ学習モデル訓練プログラム５は、ハードウェアプラットフォーム１０を用いて実行される。

【0034】

例えば、ＣＰＵ１１は、ＡＩ学習モデル訓練プログラム５の実行中に、ＧＰＵ１２に対して演算を実行させるコマンドを投入し、ＧＰＵ１２から応答される演算結果を用いて処理を行なう。

【0035】

ＡＩ学習モデル訓練プログラム５は、複数の種類の演算リソースであるＣＰＵ１１とＧＰＵ１２とを用いて機械学習モデルの訓練を実行する。

【0036】

ボトルネック解析プログラム４ｓは、ハードウェアプラットフォーム１０を用いたＡＩ学習モデル訓練プログラム５の実行中に収集した情報を用いて、ボトルネックとなるリソース（ハードウェアエレメント）がＣＰＵ１１であるかＧＰＵ１２であるかを特定する、ボトルネック解析機能を実現する。ＣＰＵ１１およびＧＰＵ１２は、ＡＩ学習モデル訓練プログラム５の実行性能に影響する演算ユニットに相当する。

【0037】

ＣＰＵ１１がボトルネック解析プログラム４ｓを実行することで、図２に示すボトルネック解析部４としての機能を実現する。

【0038】

図２は一実施形態に係る情報処理システム１のボトルネック解析部４の機能構成を例示する図、図３はそのボトルネック解析プログラム４ｓの構成を示す図である。

【0039】

ボトルネック解析部４は、図２に示すように、ＣＰＵ性能制御部４１，ＧＰＵ性能制御部４２，ＣＰＵ負荷計測部４３，ループ周期推定部４４および提示部４５としての機能を有する。

【0040】

そして、ＣＰＵ１１が、ボトルネック解析プログラム４ｓを実行することにより、これらのＣＰＵ性能制御部４１，ＧＰＵ性能制御部４２，ＣＰＵ負荷計測部４３，ループ周期推定部４４および提示部４５として機能するようになっている。

【0041】

ボトルネック解析プログラム４ｓは、より詳細には、図３に示すように、ＣＰＵ性能制御プログラム４１ｓ，ＧＰＵ性能制御プログラム４２ｓ，ＣＰＵ負荷計測プログラム４３ｓ，ループ周期推定プログラム４４ｓおよび提示プログラム４５ｓを有する。

【0042】

ＣＰＵ性能制御プログラム４１ｓはＣＰＵ性能制御部４１としての機能を実現する。ＧＰＵ性能制御プログラム４２ｓはＧＰＵ性能制御部４２としての機能を実現する。ＣＰＵ負荷計測プログラム４３ｓはＣＰＵ負荷計測部４３としての機能を実現する。ループ周期推定プログラム４４ｓはループ周期推定部４４としての機能を実現する。提示プログラム４５ｓは提示部４５としての機能を実現する。

【0043】

なお、ボトルネック解析プログラム４ｓに、必ずしも、ＣＰＵ性能制御プログラム４１ｓ，ＧＰＵ性能制御プログラム４２ｓ，ＣＰＵ負荷計測プログラム４３ｓ，ループ周期推定プログラム４４ｓおよび提示プログラム４５ｓの全てが備えられる必要はない。例えば、ＣＰＵ性能制御プログラム４１ｓ，ＧＰＵ性能制御プログラム４２ｓ，ＣＰＵ負荷計測プログラム４３ｓ，ループ周期推定プログラム４４ｓおよび提示プログラム４５ｓの少なくとも一部を、ボトルネック解析プログラム４ｓの外部に備え、ボトルネック解析プログラム４ｓから、このような外部に備えらえたプログラムを呼び出して実行してもよい。

【0044】

なお、これらのＣＰＵ性能制御部４１，ＧＰＵ性能制御部４２，ＣＰＵ負荷計測部４３，ループ周期推定部４４および提示部４５としての機能を実現するためのプログラム（ボトルネック解析プログラム４ｓ）は、例えばフレキシブルディスク，ＣＤ（ＣＤ－ＲＯＭ，ＣＤ－Ｒ，ＣＤ－ＲＷ等），ＤＶＤ（ＤＶＤ－ＲＯＭ，ＤＶＤ－ＲＡＭ，ＤＶＤ－Ｒ，ＤＶＤ＋Ｒ，ＤＶＤ－ＲＷ，ＤＶＤ＋ＲＷ，ＨＤＤＶＤ等），ブルーレイディスク，磁気ディスク，光ディスク，光磁気ディスク等の、コンピュータ読取可能な記録媒体に記録された形態で提供される。そして、ＣＰＵ１１はその記録媒体からプログラムを読み取って内部記憶装置（例えば、メモリ１３）または外部記憶装置（例えば、ストレージ１４）に転送し格納して用いる。また、そのプログラムを、例えば磁気ディスク，光ディスク，光磁気ディスク等の記憶装置（記録媒体）に記録しておき、その記憶装置から通信経路を介してコンピュータに提供するようにしてもよい。

【0045】

ＣＰＵ性能制御部４１，ＧＰＵ性能制御部４２，ＣＰＵ負荷計測部４３，ループ周期推定部４４および提示部４５としての機能を実現する際には、内部記憶装置（本実施形態ではメモリ１３）に格納されたプログラムがコンピュータのマイクロプロセッサ（本実施形態ではＣＰＵ１１）によって実行される。このとき、記録媒体に記録されたプログラムをコンピュータが読み取って実行するようにしてもよい。

【0046】

ＣＰＵ性能制御部４１は、ＣＰＵ１１の動作性能を制御する。具体的には、ＣＰＵ性能制御部４１は、ＣＰＵ１１の動作周波数を変更（設定）する機能を実現する。

【0047】

ＣＰＵ性能制御部４１は、例えば、ＣＰＵ１１の動作周波数を設定するコマンドを実行することで、ＣＰＵ１１の動作周波数を変更する。

【0048】

ＣＰＵ性能制御部４１は、例えば、Linux（登録商標）におけるcpupower frequency-setコマンドを用いて、ＣＰＵ１１の動作周波数を設定してよい。

【0049】

例えば、ＣＰＵ性能制御部４１は、以下のコマンドを実行することで、ＣＰＵ１１の動作周波数を２１００ＭＨｚに設定することができる。

【0050】

# cpupower frequency-set -g userspace
# cpupower frequency-set -f 2100MHz

【0051】

ＣＰＵ性能制御部４１は、例えば、ＣＰＵ１１の動作周波数を所定期間（例えば、２０秒間）、所定量（例えば、２０％）低下（クロックダウン）させる制御を行なう。ＣＰＵ性能制御部４１がＣＰＵ１１の動作周波数を低下させた状態をＣＰＵクロックダウン状態もしくはＣＰＵクロックダウン時という場合がある。ＣＰＵ性能制御部４１はＣＰＵクロックダウン状態を発生させる。

【0052】

また、ＣＰＵ性能制御部４１は、同様のコマンドを用いることで、低下させたＣＰＵ１１の動作周波数を変更前の状態に戻すことができる。ＣＰＵ性能制御部４１は、Linux以外のＯＳの場合には、同様の他のコマンドやドライバプログラムを実行することでＣＰＵクロックダウン状態を発生させてよい。

【0053】

ＧＰＵ性能制御部４２は、ＧＰＵ１２の動作性能を制御する。具体的には、ＧＰＵ性能制御部４２は、ＧＰＵ１２の動作周波数を変更（設定）する機能を実現する。

【0054】

ＧＰＵ性能制御部４２は、例えば、ＧＰＵ１２の動作周波数を設定するコマンドを実行することで、ＧＰＵ１２の動作周波数を変更する。

【0055】

ＧＰＵ性能制御部４２は、例えば、ＮＶＩＤＩＡ（登録商標）製のＧＰＵ１２に対してnvidia-smiコマンドを用いて、ＧＰＵ１２の動作周波数を設定してよい。

【0056】

例えば、ＧＰＵ性能制御部４２は、以下のコマンドを実行することで、ＮＶＩＤＩＡ製のＧＰＵ１２の動作周波数を８６６ＭＨｚに設定することができる。

【0057】

# nvidia-smi -ac 1593,866

【0058】

ＧＰＵ性能制御部４２は、例えば、ＧＰＵ１２の動作周波数を所定期間（例えば、２０秒間）、所定量（例えば、２０％）低下（クロックダウン）させる制御を行なう。ＧＰＵ性能制御部４２がＧＰＵ１２の動作周波数を低下させた状態をＧＰＵクロックダウン状態もしくはＧＰＵクロックダウン時という場合がある。ＧＰＵ性能制御部４２はＧＰＵクロックダウン状態を発生させる。

【0059】

ＣＰＵ性能制御部４１とＧＰＵ性能制御部４２とは、ＣＰＵクロックダウンとＧＰＵクロックダウンとで同率（例えば、２０％）の性能低下（クロックダウン）となるように制御することが望ましい。

【0060】

また、ＧＰＵ性能制御部４２は、同様のコマンドを用いることで、低下させたＧＰＵ１２の動作周波数を変更前の状態に戻すことができる。ＧＰＵ性能制御部４２は、ＮＶＩＤＩＡ製以外のＧＰＵ１２の場合には、同様の他のコマンドやドライバプログラムを実行することでＧＰＵクロックダウン状態を発生させてよい。

【0061】

ＣＰＵ負荷計測部４３は、ＣＰＵ１１の負荷状態を計測する。ＣＰＵ負荷計測部４３は、ＣＰＵ１１の負荷状態として、例えば、システム全体（情報処理システム１）のＣＰＵ使用率を測定してよい。

【0062】

ＣＰＵ負荷計測部４３は、ＣＰＵクロックダウン状態でのＣＰＵ使用率と、ＧＰＵクロックダウン状態でのＣＰＵ使用率とを、それぞれ測定する。

【0063】

ＣＰＵ負荷計測部４３は、一定間隔でＣＰＵ使用率（ＣＰＵ負荷）を計測する。例えば、ＣＰＵ負荷計測部４３は、ＣＰＵクロックダウン状態において、２０ｍｓ間隔でＣＰＵ１１のＣＰＵ使用率を２０秒間計測する。これにより、ＣＰＵ負荷計測部４３は、ＣＰＵクロックダウン状態における１０００サンプルのＣＰＵ使用率（ＣＰＵ負荷）を取得する。

【0064】

同様に、ＣＰＵ負荷計測部４３は、ＧＰＵクロックダウン状態において、２０ｍｓ間隔でＣＰＵ１１のＣＰＵ使用率を２０秒間計測する。これにより、ＣＰＵ負荷計測部４３は、ＧＰＵクロックダウン状態における１０００サンプルのＣＰＵ使用率（ＣＰＵ負荷）を取得する。

【0065】

図４はＡＩ学習モデルの訓練時におけるＣＰＵ使用率を例示する図である。

【0066】

この図４においては、ＡＩ学習モデルの訓練に含まれる１つのループにおける、システム全体のＣＰＵ使用率，メインスレッドのＣＰＵ使用率，サブスレッドのＣＰＵ使用率およびアノテーション情報を示す。

【0067】

アノテーション情報は、プログラム上でのループ範囲（ループ開始位置およびループ終了位置）を表す。ＡＩ学習モデルの訓練に含まれる１つのループにおいては、ＧＰＵ１２にコマンドを投げるためにＣＰＵ使用率が高くなることがわかる。また、１ループの終了付近では、ＧＰＵ１２から応答される演算結果の受信（ＧＰＵ間通信）を待つために、ＣＰＵ使用率が低下する。

【0068】

なお、ＣＰＵ使用率は既知の手法で取得することができ、その説明は省略する。

【0069】

ループ周期推定部４４は、ＡＩ学習モデル訓練プログラム５における、ＡＩ学習モデルの訓練で繰り返し実行されるループの周期（ループ周期）を推定する。

【0070】

ループ周期推定部４４は、ＣＰＵ負荷計測部４３によって測定されたＣＰＵクロックダウン状態におけるＣＰＵ使用率（ＣＰＵ負荷）に基づいて、ＣＰＵクロックダウン時のＡＩ学習モデル訓練プログラム５のループ周期を算出する。

【0071】

すなわち、ループ周期推定部４４は、複数の種類の演算リソース（ＣＰＵ１１とＧＰＵ１２）のうちＣＰＵ１１（第１の種類の演算リソース）の動作周波数（ＣＰＵクロック）を所定量低下させた時（ＣＰＵクロックダウン状態）の機械学習モデルにおけるループ周期を算出する。

【0072】

また、ループ周期推定部４４は、ＣＰＵ負荷計測部４３によって測定されたＧＰＵクロックダウン状態におけるＣＰＵ使用率（ＣＰＵ負荷）に基づいて、ＧＰＵクロックダウン時のＡＩ学習モデル訓練プログラム５のループ周期を算出する。

【0073】

すなわち、ループ周期推定部４４は、複数の種類の演算リソース（ＣＰＵ１１とＧＰＵ１２）のうちＧＰＵ１２（第２の種類の演算リソース）の動作周波数（ＧＰＵクロック）を所定量低下させた時（ＧＰＵクロックダウン状態）の機械学習モデルのループ周期を算出する。

【0074】

図５はＡＩモデルの訓練時におけるＣＰＵ負荷を例示する図である。ｒｎｎｔとはＡＩモデルの名称である。

【0075】

この図５において、横軸はサンプル数を示し、縦軸はＣＰＵ負荷（ｒｎｎｔＣＰＵ負荷）を示す。

【0076】

ＡＩモデルの訓練は、一般的には、そのほとんどがループでの実行である。ループの１イテレーションの間隔がわかれば、その性能（所要時間）を推定することができる。そして、ループの周期は、ＣＰＵ負荷の変動周期として現れる。

【0077】

ＣＰＵ負荷計測部４３が一定時間、一定の時間間隔でシステムの負荷をＮ個計測し、得られた測定サンプルをｓ_１，ｓ_２，・・・，ｓ_Ｎと表現する。例えば、ＣＰＵ負荷計測部４３が、２０ｍｓ間隔で２０秒間測定し、１０００サンプルを取得したとする（この場合、Ｎ＝１０００となる）。

【0078】

ループ周期推定部４４は、得られた測定サンプルについてラグｋを１からＮ－１まで変化させながら自己相関係数Ｒ_ｋを取得する。ここで、自己相関係数は以下の式（１）で求められる統計量である。なお、ｓ_１，ｓ_２，・・・，ｓ_Ｎは測定サンプル、Ｎはサンプルの個数、μはサンプルの平均、σ^２はサンプルの分散である。

【0079】

【数1】

【0080】

ラグｋごとに得られた自己相関係数のうち、ｋ＞０の範囲で最も大きな係数になるラグを算出する。これをｋ_１とする。ループ周期推定部４４は、ループ周期（ＣＰＵ負荷変動の周期）を以下の式（２）を用いて推定する。

【0081】

ループ周期＝ｋ_１×（負荷の計測間隔）・・・（２）
負荷の計測間隔は、上述の例においては２０ｍｓである。

【0082】

図６はＣＰＵクロックダウンによる周期の変化を示す図である。

【0083】

この図６においては、ＡＩ学習モデル訓練プログラム５の実行中におけるＣＰＵ負荷の測定結果に基づいて算出した、ラグと自己相関との関係を、ＣＰＵクロックダウン前とＣＰＵクロックダウン後とで比較して示す。

【0084】

この図６においては、ＣＰＵクロックダウン前の動作周波数（３．５ＧＨｚ）についてのラグと自己相関との関係を実線で示し、ＣＰＵクロックダウン後の動作周波数（２．１ＧＨｚ）についてのラグと自己相関との関係を破線で示している。

【0085】

ｋ＝０以外でピークになるところが推定される周期（ループ周期）を表す。この図６においては、波形が右側にずれることで周期が長くなることを示しており、ＣＰＵの動作周波数を２．１ＧＨｚに落とすことで周期が長くなっていることがわかる。ループ周期が長くなることで、ループの実行時間が長くなり、処理性能が低下する。

【0086】

そして、ループ周期推定部４４は、算出したループ周期に基づいて、性能低下の要因（ボトルネック）となるプロセッサエレメント（ハードウェアエレメント）を特定する。

【0087】

ループ周期推定部４４は、ＣＰＵクロックダウン時のループ周期と、ＧＰＵクロックダウン時のループ周期とを比較し、ＣＰＵ１１とＧＰＵ１２とのうち、クロックダウン時のループ周期がより長くなるプロセッサエレメントを、性能低下の要因（ボトルネック）であると判断する。性能低下の要因（ボトルネック）であると判断された演算リソースは、改善対象の演算リソースである。

【0088】

すなわち、ループ周期推定部４４は、算出したループ周期の比較結果に基づいて、ＣＰＵ１１（第１の種類の演算リソース）とＧＰＵ１２（第２の種類の演算リソース）とのうちから改善対象の演算リソースを判定する。この際、ループ周期推定部４４は、ＣＰＵ１１（第１の種類の演算リソース）とＧＰＵ１２（第２の種類の演算リソース）とのうち、遅い方のループ周期を求めるために動作周波数を低下させた演算リソースを改善対象の演算リソースと判定する。

【0089】

提示部４５は、ループ周期推定部４４が性能低下の要因（ボトルネック）であると特定したプロセッサエレメントを提示する。

【0090】

例えば、提示部４５は、ボトルネックであると特定したプロセッサエレメントを表す提示情報をユーザに対して出力する。提示部４５は、ループ周期推定部４４が判定した改善対象の演算リソースを提示情報を用いて提示する。

【0091】

図７は一実施形態に係る情報処理システム１の提示部４５が出力する提示情報を例示する図である。

【0092】

この図７においては、ハードウェアプラットフォーム１０にネットワーク等を介して接続された端末装置（図示略）のモニタに表示される表示画面５０を示す。表示画面５０は、提示部４５が出力する提示情報に相当する。

【0093】

この表示画面５０においては、コマンド“analyze_training_performance”を実行することで、ボトルネック解析プログラム４ｓが実行されたことを示している（符号Ｐ１参照）。

【0094】

また、表示画面５０は、ループ周期推定部４４により算出（推定）された、ＣＰＵクロックダウン時のループ周期とＧＰＵクロックダウン時のループ周期とを示す（符号Ｐ２参照）。

【0095】

この図７に示す例においては、ＣＰＵクロックダウン時のループ周期が６００ｍｓであり、ＧＰＵクロックダウン時のループ周期が５４０ｍｓであることが示されている。

【0096】

さらに、表示画面５０は、ボトルネックであると特定したプロセッサエレメントを表すメッセージを示す（符号Ｐ３参照）。

【0097】

この図７に示す例おいては、ＣＰＵクロックダウン時のループ周期（６００ｍｓ）の方がＧＰＵクロックダウン時のループ周期（５４０ｍｓ）よりも長いので、ＣＰＵ１１がボトルネックであることを表すメッセージ文“CPU performance may limit the total performance”が表示されている。

【0098】

表示画面５０において、符号Ｐ２に示す、ループ周期推定部４４により算出（推定）された、ＣＰＵクロックダウン時のループ周期とＧＰＵクロックダウン時のループ周期とは、ＣＰＵ１１をボトルネックであると判定した根拠を表し、提示情報の信頼性向上に寄与するものである。

【0099】

なお、この図７に示す提示情報はあくまで例に過ぎず、提示部４５が出力する提示情報は適宜変更して実施することができる。例えば、提示情報に、図７に例示したもの以外の情報を含んでもよい。また、ループ周期推定部４４により算出（推定）された、ＣＰＵクロックダウン時のループ周期とＧＰＵクロックダウン時のループ周期を省略してもよい。

【0100】

（Ｂ）動作
上述の如く構成された一実施形態に係る情報処理システム１のボトルネック解析部４による処理の概要を、図８に示すフローチャート（ステップＡ１～Ａ４）に従って説明する。

【0101】

ステップＡ１において、ループ周期推定部４４が、ＣＰＵクロックダウン時のループ周期を計測（算出）する。

【0102】

ステップＡ２において、ループ周期推定部４４が、ＧＰＵクロックダウン時のループ周期を計測（算出）する。

【0103】

ステップＡ３において、ループ周期推定部４４が、ＣＰＵクロックダウン時のループ周期と、ＧＰＵクロックダウン時のループ周期とを比較する。ループ周期推定部４４は、クロックダウン時のループ周期がより長くなるプロセッサエレメントを、ボトルネックであると判断する。

【0104】

ステップＡ４において、提示部４５が、ボトルネックであると特定したプロセッサエレメントを表す提示情報をユーザに対して出力する。その後、処理を終了する。

【0105】

なお、この図８に示すフローチャートにおいて、ステップＡ１とステップＡ２の処理順序はこれに限定されるものではなく、適宜変更することができる。すなわち、ステップＡ２の処理の後にステップＡ１の処理を行なってもよく、また、ステップＡ１の処理とステップＡ２の処理とを並行して実施してもよい。

【0106】

次に、図８に示したフローチャートのステップＡ１の処理の詳細を、図９に示すフローチャート（ステップＢ１～Ｂ５）に従って説明する。

【0107】

ステップＢ１において、ＣＰＵ性能制御部４１がＣＰＵクロックを一定量（例えば２０％）ダウンさせることで、ＣＰＵクロックダウン状態を生成する。

【0108】

ステップＢ２において、ＣＰＵ負荷計測部４３が、ＣＰＵクロックダウン時のＣＰＵ使用率（ＣＰＵ負荷）を計測する。

【0109】

ステップＢ３において、ループ周期推定部４４が、ＣＰＵ負荷計測部４３によって計測されたＣＰＵ負荷（ＣＰＵ使用率）に基づいて、ＡＩ学習モデル訓練プログラム５のループ周期を推定する。

【0110】

ステップＢ４において、ＣＰＵ性能制御部４１が、ＣＰＵ１１のＣＰＵクロックダウン状態を、ＣＰＵクロックダウン前の状態に戻す。

【0111】

ステップＢ５において、ループ周期推定部４４が、推定したループ周期をメモリ１３やストレージ１４の所定の記憶領域に記憶させる。その後、処理を終了し、図８のステップＡ２に移行する。

【0112】

なお、この図９に示すフローチャートにおいて、ステップＢ４の処理順序はステップＢ３の後に限定されるものではなく、適宜変更することができる。例えば、ステップＢ２の処理の後にステップＢ４の処理を行なってもよく、また、ステップＢ５の処理の後にステップＢ４の処理を行なってもよい。

【0113】

次に、図８に示したフローチャートのステップＡ２の処理の詳細を、図１０に示すフローチャート（ステップＣ１～Ｃ５）に従って説明する。

【0114】

ステップＣ１において、ＧＰＵ性能制御部４２がＧＰＵクロックを一定量（例えば２０％）ダウンさせることで、ＧＰＵクロックダウン状態を生成する。

【0115】

ステップＣ２において、ＣＰＵ負荷計測部４３が、ＧＰＵクロックダウン時のＣＰＵ使用率（ＣＰＵ負荷）を計測する。

【0116】

ステップＣ３において、ループ周期推定部４４が、ＣＰＵ負荷計測部４３によって計測されたＣＰＵ負荷（ＣＰＵ使用率）に基づいて、ＡＩ学習モデル訓練プログラム５のループ周期を推定する。

【0117】

ステップＣ４において、ＣＰＵ性能制御部４１が、ＧＰＵ１２のＧＰＵクロックダウン状態を、ＧＰＵクロックダウン前の状態に戻す。

【0118】

ステップＣ５において、ループ周期推定部４４が、推定したループ周期をメモリ１３やストレージ１４の所定の記憶領域に記憶させる。その後、処理を終了し、図８のステップＡ３に移行する。

【0119】

なお、この図１０に示すフローチャートにおいて、ステップＣ４の処理順序はステップＣ３の後に限定されるものではなく、適宜変更することができる。例えば、ステップＣ２の処理の後にステップＣ４の処理を行なってもよく、また、ステップＣ５の処理の後にステップＣ４の処理を行なってもよい。

【0120】

次に、一実施形態に係る情報処理システム１におけるループ周期の推定処理を、図１１に示すフローチャート（ステップＤ１～Ｄ５）に従って説明する。この図１１に示す処理は、図９のステップＢ２およびＢ３、ならびに、図１０のステップＣ２およびＣ３の処理の詳細な一例である。

【0121】

ステップＤ１において、ＣＰＵ負荷計測部４３が、一定時間、一定の時間間隔でシステムの負荷を複数（Ｎ個）計測する。

【0122】

ステップＤ２において、ループ周期推定部４４が、ＣＰＵ負荷計測部４３によって取得された測定サンプルについてラグｋを１からＮ－１まで変化させながら自己相関係数Ｒ_ｋを取得する。

【0123】

ステップＤ３において、ループ周期推定部４４が、ラグｋごとに得られた自己相関係数のうち、ｋ＞０の範囲で最も大きな係数になるラグ（ｋ_１）を算出する。

【0124】

ステップＤ４において、ループ周期推定部４４が、上記の式（２）を用いて、ループ周期を推定（算出）する。

【0125】

ステップＤ５において、ループ周期推定部４４が、推定したループ周期をメモリ１３やストレージ１４等の所定の記憶領域に保存する。その後、処理を終了する。

【0126】

（Ｃ）効果
このように、本発明の一実施形態としての情報処理システム１によれば、ＡＩ学習モデル訓練プログラム５の実行中において、ＣＰＵ負荷計測部４３が、ＣＰＵ性能制御部４１が発生させたＣＰＵクロックダウン状態におけるＣＰＵ使用率を測定する。また、ＣＰＵ負荷計測部４３が、ＧＰＵ性能制御部４２が発生させたＧＰＵクロックダウン状態におけるＣＰＵ使用率を測定する。

【0127】

また、ループ周期推定部４４が、ＣＰＵクロックダウン状態におけるＣＰＵ使用率に基づいて、ＣＰＵクロックダウン時のＡＩ学習モデル訓練プログラム５のループ周期を算出する。さらに、ループ周期推定部４４は、測定されたＧＰＵクロックダウン状態におけるＣＰＵ使用率に基づいて、ＧＰＵクロックダウン時のＡＩ学習モデル訓練プログラム５のループ周期を算出する。

【0128】

そして、ループ周期推定部４４は、ＣＰＵクロックダウン時のループ周期と、ＧＰＵクロックダウン時のループ周期とを比較し、ＣＰＵ１１とＧＰＵ１２とのうち、クロックダウン時のループ周期がより長くなるプロセッサエレメントを、性能低下の要因（ボトルネック）であると判断する。

【0129】

これにより、ＡＩ学習モデル訓練プログラム５の実行に関して、性能低下の要因（ボトルネック）となる演算リソースを容易に特定することができ、ＡＩ学習モデル訓練プログラム５の実行させるための最適な計算機構成を構築することができる。これにより、機械学習モデルの訓練効率を向上させることができる。

【0130】

また、提示部４５が、ループ周期推定部４４がボトルネックであると特定したプロセッサエレメントを表す提示情報をユーザに対して出力する。これにより、ユーザ等がＡＩ学習モデル訓練プログラム５の実行させるための最適な計算機構成を容易に把握することができる。

【0131】

また、クラウド事業者の立場において、クラウド事業者が観測可能なデータ（ＣＰＵ負荷）を用いて性能低下の要因（ボトルネック）となる演算リソースを、顧客のプログラムに手を入れることなく容易に特定することができるので利便性が高い。また、顧客に対して、ボトルネックとなる演算リソースを提示することで、サービスの付加価値を向上させることができるとともに、顧客満足度を向上させることもできる。

【0132】

ループ周期推定部４４が、自己相関係数を用いることで、容易にループ周期を推定することができる。

【0133】

（Ｄ）その他
開示の技術は上述した実施形態に限定されるものではなく、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。本実施形態の各構成および各処理は、必要に応じて取捨選択することができ、あるいは適宜組み合わせてもよい。

【0134】

例えば、上述した実施形態においては、ＣＰＵ１１とＧＰＵ１２との２つのプロセッサエレメント（演算リソース）を備えたハードウェアプラットフォーム１０において、ＣＰＵ１１とＧＰＵ１２とのどちらがボトルネック（改善対象）かを判断しているが、これに限定されるものではない。

【0135】

演算リソースとして、ＭＰＵ（Micro Processing Unit）やＡＰＵ（Accelerated Processing Unit）等のＣＰＵおよびＧＰＵ以外の演算リソースを備えてもよい。また、３つ以上の演算リソースを備え、これらの３つ以上の演算リソースの中からボトルネック（改善対象）となる演算リソースを判断してよい。さらに、例えば、ハードウェアプラットフォーム１０に、種類の異なる複数のＣＰＵ（もしくはＧＰＵ）を備え、これらの複数種類のＣＰＵ（もしくはＧＰＵ）の中からボトルネックかを判断してもよい。

【0136】

さらに、演算エレメント以外のハードウェアエレメントに対して同様の手法を適用することで、ボトルネックとなるハードウェアエレメントを判断してよい。

【0137】

また、上述した実施形態においては、ＡＩ学習モデル訓練プログラム５を実行するＣＰＵ１１がボトルネック解析プログラム４ｓを実行しているが、これに限定されるものではない。ＣＰＵ１１とは別に用意したプロセッサや、ハードウェアプラットフォーム１０とは別に設けたコンピュータに搭載されたプロセッサにボトルネック解析プログラム４ｓを実行させてもよい。

【0138】

また、上述した実施形態においては、ループ周期推定部４４が自己相関係数を用いて、ＡＩ学習モデル訓練プログラム５のループ周期を推定しているが、これに限定されるものではない。例えば、フーリエ級数を用いる等、既知の他の手法を用いてループ周期の推定を行なってもよい。
また、上述した開示により本実施形態を当業者によって実施・製造することが可能である。

【0139】

（Ｅ）付記
以上の実施形態に関し、さらに以下の付記を開示する。

【0140】

（付記１）
複数の種類の演算リソースを有する計算機システムにおいて、
前記複数の種類の演算リソースを用いた機械学習モデルの訓練の実行中に収集した、前記複数の種類の演算リソースのうち第１の種類の演算リソースの動作周波数を所定量低下させた時のシステム負荷と、前記複数の種類の演算リソースのうち第２の種類の演算リソースの動作周波数を前記所定量低下させた時の前記システム負荷とに基づいて、
前記第１の種類の演算リソースの動作周波数を所定量低下させた時の前記機械学習モデルにおけるループ周期と、前記第２の種類の演算リソースの動作周波数を前記所定量低下させた時の前記機械学習モデルのループ周期とを算出し、
算出した前記ループ周期の比較結果に基づいて、前記第１の種類の演算リソースと前記第２の種類の演算リソースとのうちから改善対象の演算リソースを判定する
処理をプロセッサに実行させることを特徴とする制御プログラム。

【0141】

（付記２）
前記改善対象の演算リソースを判定する処理が、
前記第１の種類の演算リソースの動作周波数を所定量低下させた時の前記機械学習モデルにおける前記ループ周期と、前記第２の種類の演算リソースの動作周波数を前記所定量低下させた時の前記機械学習モデルの前記ループ周期とのうち、遅い方のループ周期を求めるために動作周波数を低下させた演算リソースを前記改善対象の演算リソースと判定する処理を含む
ことを特徴とする、付記１に記載の制御プログラム。

【0142】

（付記３）
判定した前記改善対象の演算リソースを提示する
処理を前記プロセッサに実行させることを特徴とする付記１または２に記載の制御プログラム。

【0143】

（付記４）
複数の種類の演算リソースを有する計算機システムであって、
前記複数の種類の演算リソースを用いた機械学習モデルの訓練の実行中に収集した、前記複数の種類の演算リソースのうち第１の種類の演算リソースの動作周波数を所定量低下させた時のシステム負荷と、前記複数の種類の演算リソースのうち第２の種類の演算リソースの動作周波数を前記所定量低下させた時の前記システム負荷とに基づいて、
前記第１の種類の演算リソースの動作周波数を所定量低下させた時の前記機械学習モデルにおけるループ周期と、前記第２の種類の演算リソーの動作周波数を前記所定量低下させた時の前記機械学習モデルのループ周期とを算出し、
算出した前記ループ周期の比較結果に基づいて、前記第１の種類の演算リソースと前記第２の種類の演算リソースとのうちから改善対象の演算リソースを判定する
処理を実行する制御部を備えることを特徴とする情報処理システム。

【0144】

（付記５）
前記改善対象の演算リソースを判定する処理が、
前記第１の種類の演算リソースの動作周波数を所定量低下させた時の前記機械学習モデルにおける前記ループ周期と、前記第２の種類の演算リソースの動作周波数を前記所定量低下させた時の前記機械学習モデルの前記ループ周期とのうち、遅い方のループ周期を求めるために動作周波数を低下させた演算リソースを前記改善対象の演算リソースと判定する処理を含む
ことを特徴とする、付記４に記載の情報処理システム。

【0145】

（付記６）
前記制御部が、
判定した前記改善対象の演算リソースを提示する
処理を実行することを特徴とする付記４または５に記載の情報処理システム。

【0146】

（付記７）
複数の種類の演算リソースを有する計算機システムにおいて、
前記複数の種類の演算リソースを用いた機械学習モデルの訓練の実行中に収集した、前記複数の種類の演算リソースのうち第１の種類の演算リソースの動作周波数を所定量低下させた時のシステム負荷と、前記複数の種類の演算リソースのうち第２の種類の演算リソースの動作周波数を前記所定量低下させた時の前記システム負荷とに基づいて、
前記第１の種類の演算リソースの動作周波数を所定量低下させた時の前記機械学習モデルにおけるループ周期と、前記第２の種類の演算リソースの動作周波数を前記所定量低下させた時の前記機械学習モデルのループ周期とを算出し、
算出した前記ループ周期の比較結果に基づいて、前記第１の種類の演算リソースと前記第２の種類の演算リソースとのうちから改善対象の演算リソースを判定する
処理をプロセッサが実行することを特徴とする制御方法。

【0147】

（付記８）
前記改善対象の演算リソースを判定する処理が、
前記第１の種類の演算リソースの動作周波数を所定量低下させた時の前記機械学習モデルにおける前記ループ周期と、前記第２の種類の演算リソースの動作周波数を前記所定量低下させた時の前記機械学習モデルの前記ループ周期とのうち、遅い方のループ周期を求めるために動作周波数を低下させた演算リソースを前記改善対象の演算リソースと判定する処理を含む
ことを特徴とする、付記７に記載の制御方法。

【0148】

（付記９）
判定した前記改善対象の演算リソースを提示する
処理を前記プロセッサが実行することを特徴とする付記７または８に記載の制御方法。

【符号の説明】

【0149】

１情報処理システム
３ソフトウェアプラットフォーム
４ボトルネック解析部
４ｓボトルネック解析プログラム
５ＡＩ学習モデル訓練プログラム
１０ハードウェアプラットフォーム
１１ＣＰＵ
１２ＧＰＵ
１３メモリ
１４ストレージ
１５通信インタフェース
４１ＣＰＵ性能制御部
４２ＧＰＵ性能制御部
４３ＣＰＵ負荷計測部
４４ループ周期推定部
４５提示部
４１ｓＣＰＵ性能制御プログラム
４２ｓＧＰＵ性能制御プログラム
４３ｓＣＰＵ負荷計測プログラム
４４ｓループ周期推定プログラム
４５ｓ提示プログラム
５０表示画面

【図1】