特開2024-59020 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特開2024-59020性能監視プログラムおよび性能監視方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024059020

(43)【公開日】2024-04-30

(54)【発明の名称】性能監視プログラムおよび性能監視方法

(51)【国際特許分類】

G06F 11/30 20060101AFI20240422BHJP

【ＦＩ】

G06F11/30 155

G06F11/30 140A

【審査請求】未請求

【請求項の数】5

【出願形態】ＯＬ

(21)【出願番号】P 2022166490

(22)【出願日】2022-10-17

(71)【出願人】

【識別番号】000005223

【氏名又は名称】富士通株式会社

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】平井聡

【テーマコード（参考）】

5B042

【Ｆターム（参考）】

5B042GA11

5B042MA05

5B042MA08

5B042MC22

5B042MC40

(57)【要約】

【課題】ＣＰＵ上で動作するプログラムの動作状況に左右されずに、性能情報を収集する。
【解決手段】情報処理装置１は、ＣＰＵ５０のコア６０で動作するアプリケーション２１の実行の際のコア６０の複数の性能情報の収集において、複数の性能情報ごとに、アプリケーション２１の動作特性を対応付けて蓄積し、コア６０が有するＰＭＣ６１０の数が複数の性能情報の総数より少ない場合、アプリケーション２１の動作特性の現在値と最も剥離したアプリケーション２１の動作特性を有する性能情報を複数の性能情報の中から選択して、ＰＭＣ６１０に割り当てる。
【選択図】図１

【特許請求の範囲】

【請求項1】

プロセッサで動作するプログラムの実行の際の前記プロセッサの複数の性能情報の収集において、
前記複数の性能情報ごとに、前記プログラムの動作特性を対応付けて蓄積し、
前記プロセッサが有するＰＭＣ（Performance Monitoring Counter）の数が前記複数の性能情報の総数より少ない場合、前記プログラムの動作特性の現在値と最も剥離した前記プログラムの動作特性を有する性能情報を前記複数の性能情報の中から選択して、前記ＰＭＣに割り当てる
処理をコンピュータに実行させる性能監視プログラム。

【請求項2】

前記蓄積する処理は、前記複数の性能情報に関するイベントの取得回数をさらに対応付けて蓄積し、
前記割り当てる処理は、前記複数の性能情報のそれぞれの前記取得回数が同じ回数となるように次回の収集対象を選択し、前記複数の性能情報のそれぞれの前記取得回数が同じ回数になると、前記プログラムの動作特性の現在値と最も剥離した前記プログラムの動作特性の平均値を有する性能情報を選択し、次回の収集対象とする
ことを特徴とする請求項１に記載の性能監視プログラム。

【請求項3】

前記割り当てる処理は、前記プログラムの動作特性の現在値と、前記複数の性能情報ごとの前記プログラムの動作特性の平均値との類似度に応じて前記性能情報を優先的に前記ＰＭＣに割り当てる
ことを特徴とする請求項２に記載の性能監視プログラム。

【請求項4】

前記プログラムの動作特性は、前記ＰＭＵが有するＣＰＵパイプライン・リソース利用率である
ことを特徴とする請求項１に記載の性能監視プログラム。

【請求項5】

プロセッサで動作するプログラムの実行の際の前記プロセッサの複数の性能情報の収集において、
前記複数の性能情報ごとに、前記プログラムの動作特性を対応付けて蓄積し、
前記プロセッサが有するＰＭＣの数が前記複数の性能情報の総数より少ない場合、前記プログラムの動作特性の現在値と最も剥離した前記プログラムの動作特性を有する性能情報を前記複数の性能情報の中から選択して、前記ＰＭＣに割り当てる
処理をコンピュータが実行する性能監視方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、性能監視プログラムなどに関する。

【背景技術】

【0002】

近年、複数の性能情報のデータを収集して、収集したデータを分析して利用する技術が開示されている（例えば、特許文献１～４参照）。

【0003】

また、ＯＳやアプリケーションを含むシステムの性能分析や詳細な動作分析を行うために、ＣＰＵ（Central Processing Unit）に搭載されたパフォーマンス監視機構（ＰＭＵ：Performance Monitoring Unit）が利用されている。ＰＭＵによって収集される性能情報は、例えば、ＣＰＵサイクル数、実行命令数、キャッシュヒット／ミス数等数百種類以上存在する。情報処理装置は、ＣＰＵ上で動作するプログラムの実行中に、多数の性能情報を収集し、統合的に分析することで、性能のボトルネックを抽出し、プログラムやひいてはシステムの性能の向上に利用する。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開２０１７－４５０９８号公報

【特許文献2】特開２０１４－１４９６４５号公報

【特許文献3】米国特許第１０６７８８０５号明細書

【特許文献4】米国特許出願公開第２０１７／００８５４４７号明細書

【発明の概要】

【発明が解決しようとする課題】

【0005】

しかしながら、パフォーマンス監視機構（ＰＭＵ）を利用する場合、ＣＰＵ上で動作するプログラムの動作状況に左右されずに、性能情報を収集することが難しいという問題がある。

【0006】

かかる問題について説明する。ＰＭＵが収集可能な性能情報は数百種類以上存在するが、同時に収集できる性能情報の数は限定される。すなわち、１つの性能情報は、１本のＰＭＣ（Performance Monitoring Counter）によって収集される。ＰＭＣの本数は、一般的なＣＰＵで２～８本である。したがって、ＰＭＵは、ＰＭＣの本数を超える性能情報を収集する場合には、所定期間ごとにＰＭＣに割当てる性能情報を切り替えて収集を行う。

【0007】

ＣＰＵ上で動作するプログラムが一定の動作状況であれば、ＰＭＣはどのタイミングで特定の性能情報を取得しても、同様のデータを取得できる。ところが、ＣＰＵ上で動作するプログラムが一定の動作状況でない場合には、ＰＭＣは特定の性能情報を取得するタイミングによって得られるデータにバラつきが出てしまう。したがって、ＰＭＵを利用する場合、ＣＰＵ上で動作するプログラムの動作状況に左右されずに、性能情報を収集することが難しい。

【0008】

本発明は、１つの側面では、ＣＰＵ上で動作するプログラムの動作状況に左右されずに、性能情報を収集することを目的とする。

【課題を解決するための手段】

【0009】

１つの態様では、性能監視プログラムは、プロセッサで動作するプログラムの実行の際の前記プロセッサの複数の性能情報の収集において、前記複数の性能情報ごとに、前記プログラムの動作特性を対応付けて蓄積し、前記プロセッサが有するＰＭＣの数が前記複数の性能情報の総数より少ない場合、前記プログラムの動作特性の現在値と最も剥離した前記プログラムの動作特性を有する性能情報を前記複数の性能情報の中から選択して、前記ＰＭＣに割り当てる、処理をコンピュータに実行させる。

【発明の効果】

【0010】

１実施態様によれば、ＣＰＵ上で動作するプログラムの動作状況に左右されずに、性能情報を収集できる。

【図面の簡単な説明】

【0011】

【図1】図１は、実施例に係る情報処理装置のハードウェア構成の一例を示す図である。

【図2】図２は、ＰＭＵのＣＰＵパイプライン・リソース利用率の取得機能を説明する図である。

【図3】図３は、実施例に係る管理テーブルの一例を示す図である。

【図4】図４は、実施例に係る状態情報現在値の一例を示す図である。

【図5】図５は、実施例に係る性能監視処理のフローチャートの一例を示す図である。

【発明を実施するための形態】

【0012】

以下に、本願の開示する性能監視プログラムおよび性能監視方法の実施例を図面に基づいて詳細に説明する。なお、本発明は、実施例により限定されるものではない。

【実施例0013】

［情報処理装置のハードウェア構成］
図１は、実施例に係る情報処理装置のハードウェア構成の一例を示す図である。図１に示すように、情報処理装置１は、システム・メモリ１０と、ＣＰＵ５０とを有する。

【0014】

ＣＰＵ５０は、システム・メモリ１０とバスで接続される。ＣＰＵ５０は、複数のコア６０を有する。なお、図１で示す情報処理装置１は、２つのＣＰＵ５０を備える場合であるが、これに限定しないで、３つのＣＰＵ５０を備える場合であっても、１つのＣＰＵ５０を備える場合であっても構わない。また、図１で示す情報処理装置１は、１つのＣＰＵ５０に２つのコア６０を備える場合であるが、これに限定しないで、３つのコア６０を備える場合であっても、１つのコア６０を備える場合であっても構わない。

【0015】

各コア６０は、それぞれＰＭＵ（Performance Monitoring Unit）６１を有する。ＰＭＵ６１は、パフォーマンス監視機構であり、ＰＭＣ（Performance Monitoring Counter）６１０を用いて性能情報について発生するイベント（以降、性能情報イベントという）の情報を収集する。ＰＭＵ６１によって収集される性能情報は、例えば、ＣＰＵサイクル数、実行命令数、キャッシュヒット／ミス数等数百種類以上存在する。ＰＭＵ６１は、複数のＰＭＣ６１０を有する。ＰＭＣ６１０は、性能モニタリングカウンタのことをいう。ＰＭＣ６１０の本数は、例えば２～８本であるが、ＣＰＵ５０のスペックによって異なる。したがって、ＰＭＵ６１は、ＰＭＣ６１０の本数を超える性能情報を収集する場合には、例えば時分割でＰＭＣ６１０に割当てる性能情報を切り換えて収集する。

【0016】

システム・メモリ１０は、オペレーティング・システム２０と、アプリケーション２１とを有する。オペレーティング・システム２０は、性能監視プログラム３０と、管理テーブル４１と、状態情報現在値４２とを含む。

【0017】

性能監視プログラム３０は、カーネルモジュールの１つである。性能監視プログラム３０は、ＣＰＵ５０のコア６０で動作するアプリケーション２１を実行する際に、ＰＭＵ６１を使って、アプリケーション２１が動作するコア６０の複数の性能を監視する。性能監視プログラム３０は、ＰＭＵ制御部３１を有する。なお、ＰＭＵ制御部３１の処理については、後述する。

【0018】

管理テーブル４１は、性能情報を管理する。例えば、管理テーブル４１は、複数の異なる性能情報ごとに、イベントの発生回数の積算値および取得回数を、収集の際のアプリケーション２１の動作特性を平均化した平均値に対応付けて記憶する。アプリケーション２１の動作特性は、例えば、ＰＭＵ６１が有するＣＰＵパイプライン・リソース利用率の取得機能を用いて取得されれば良い。なお、管理テーブル４１の一例については、後述する。

【0019】

ここで、ＰＭＵ６１が有するＣＰＵパイプライン・リソース利用率の取得機能について、図２を参照して説明する。図２は、ＰＭＵのＣＰＵパイプライン・リソース利用率の取得機能を説明する図である。

【0020】

図２左図には、ＣＰＵ内部フロー概念図が示されている。図２左図に示すように、ＣＰＵパイプライン・リソース利用率の取得機能は、ＣＰＵ内部のフローを４つの状態に分類する。４つの各状態は、Ｆｒｏｎｔｅｎｄ、Ｂａｃｋｅｎｄ、実行確定（Ｒｅｔｉｒｅｄ）、実行廃棄（予測ミス）を示す。Ｆｒｏｎｔｅｎｄは、命令をロード・デコードして、ＥｘｅｃｕｔｉｏｎＵｎｉｔに供給する。Ｂａｃｋｅｎｄは、命令がデータ読出しや書込みである場合に、キャッシュおよびメモリアクセスを行う。そして、各命令は並列に投機的に実行される。実行確定（Ｒｅｔｉｒｅｄ）は、投機的な実行による命令の実行確定を示す。実行廃棄（予測ミス）は、投機的な実行による分岐予測ミスによる実行破棄を示す。

【0021】

図２右図には、ＣＰＵパイプライン・リソース利用率が示されている。ＣＰＵパイプライン・リソース利用率は、ＣＰＵ内部の４つの状態について、リソース利用率を１００分率でカウントする。すなわち、ＣＰＵパイプライン・リソース利用率の取得機能は、ＣＰＵ内部の４つの状態の割合を収集する。ここでは、Ｆｒｏｎｔｅｎｄ、Ｂａｃｋｅｎｄ、実行確定（Ｒｅｔｉｒｅｄ）、実行破棄（予測ミス）の４つの状態の割合は、２０％、６０％、１５％、５％を表わしている。ＣＰＵ内部の４つの状態の割合が、ＣＰＵパイプライン・リソース利用率である。そして、ＣＰＵパイプライン・リソース利用率は、アプリケーション２１の動作特性の判断に使用され、ＰＭＣ６１０の切替えに利用される。

【0022】

図１に戻って、状態情報現在値４２は、ＣＰＵパイプライン・リソース利用率の現在値を保持する。すなわち、状態情報現在値４２は、切替えの直前に計測されたＣＰＵパイプライン・リソース利用率を保持する。なお、状態情報現在値４２の一例については、後述する。

【0023】

ＰＭＵ制御部３１は、ＣＰＵ５０のコア６０で動作するアプリケーション２１の実行の際に、ＰＭＵ６１を用いてコア６０の複数の異なる性能情報を収集する。ＰＭＵ制御部３１は、１つのＰＭＣ６１０に１つの性能情報を収集対象として割り当てて、ＰＭＣ６１０を用いて性能情報について発生するイベントを収集する。

【0024】

また、ＰＭＵ制御部３１は、収集対象の性能情報ごとに、イベントの発生回数の累積値（積算値）および収集対象になった回数（取得回数）を、収集の際のアプリケーション２１の動作特性を平均化した平均値に対応付けて管理テーブル４１に蓄積する。ここでいうアプリケーション２１の動作特性とは、ＣＰＵパイプライン・リソース利用率のことである。すなわち、ＰＭＵ制御部３１は、収集対象の各性能情報について、収集対象として収集した際のＣＰＵパイプライン・リソース利用率をＰＭＵ６１から取得する。そして、ＰＭＵ制御部３１は、取得したＣＰＵパイプライン・リソース利用率と、以前収集対象として収集した際の利用率との平均値を算出して、管理テーブル４１に更新する。

【0025】

また、ＰＭＵ制御部３１は、ＰＭＣ６１０の本数が複数の性能情報の総数より少ない場合には、一定時間ごとに、ＰＭＣ６１０に割当てる性能情報を収集対象として切り替える。

【0026】

例えば、ＰＭＵ制御部３１は、複数の性能情報のそれぞれの取得回数が同じ回数でない場合には、同じ回数となるように、一定時間ごとに、性能情報を切り替えるべく、複数の性能情報から次回の収集対象としての性能情報を選択する。そして、ＰＭＵ制御部３１は、選択した性能情報に切り替えるために、選択した性能情報をＰＭＣ６１０に割当てる。

【0027】

そして、ＰＭＵ制御部３１は、複数の性能情報のそれぞれの取得回数が同じ回数になると、ＣＰＵパイプライン・リソース利用率の現在値と最も剥離したＣＰＵパイプライン・リソース利用率の平均値を有する性能情報を次回の収集対象として選択する。ＣＰＵパイプライン・リソース利用率の現在値は、切り替え直前の計測時のＣＰＵパイプライン・リソース利用率の値ともいえる。一例として、ＰＭＵ制御部３１は、ＣＰＵパイプライン・リソース利用率の現在値と、性能情報ごとに記録されたＣＰＵパイプライン・リソース利用率の平均値を比較する。そして、ＰＭＵ制御部３１は、比較の結果、最も類似度が低いＣＰＵパイプライン・リソース利用率の平均値を有する性能情報を優先的に選択する。最も類似度が低い性能情報を優先的に選択するのは、以下の理由による。全ての性能情報の収集結果（イベント発生回数）は、アプリケーション２１の同一の動作特性（ＣＰＵパイプライン・リソース利用率）のときに取得されることが望ましい。アプリケーション２１の動作特性が異なると、性能にバラつきが出てしまうからである。したがって、ＰＭＵ制御部３１は、ＣＰＵパイプライン・リソース利用率（動作特性）の現在値（切り替え直前の計測時の値）と最も剥離したＣＰＵパイプライン・リソース利用率（動作特性）の平均値を有する性能情報を優先的に選択する。これにより、ＰＭＵ制御部３１は、性能情報の収集時のＣＰＵパイプライン・リソース利用率（動作特性）の平滑化を図ることができる。つまり、ＰＭＵ制御部３１は、どの性能情報もＣＰＵパイプライン・リソース利用率（動作特性）を平滑化した状態で情報を収集することとなり、アプリケーション２１の実行状況に左右されず、性能情報を収集できる。この結果、ＰＭＵ制御部３１は、アプリケーション２１の実行状況に左右されず、性能情報を収集できる。

【0028】

なお、一定時間ごとの切り替えは、時分割を利用すれば良い。一例として、オペレーティング・システム２０がＬｉｎｕｘ（登録商標）である場合には、ＰＭＵ制御部３１は、以下のように処理すれば良い。すなわち、ＰＭＵ制御部３１は、Ｌｉｎｕｘの標準ツールであるｐｅｒｆ（Performance tools for Linux）を用いて、数ミリ秒単位の一定間隔ごとにラウンドロビンでＰＭＣ６１０に割当てる性能情報を切り換えれば良い。

【0029】

［管理テーブルの一例］
ここで、実施例に係る管理テーブル４１の一例を、図３を参照して説明する。図３は、実施例に係る管理テーブルの一例を示す図である。図３に示すように、管理テーブル４１は、性能情報番号、性能情報名、取得回数、イベント発生回数（積算値）およびＣＰＵパイプライン・リソース利用率（平均値）を対応付けて記憶する。

【0030】

性能情報番号は、性能情報を一意に識別できる番号である。性能情報名は、性能情報を一意に識別できる名前であり、イベントの名前でもある。取得回数は、収集対象になった回数を示す。すなわち、取得回数は、収集対象として取得（収集）した回数である。イベント発生回数（積算値）は、収集の際に発生したイベントの発生回数の積算値である。ＣＰＵパイプライン・リソース利用率（平均値）は、Ｆｒｏｎｔｅｎｄ、Ｂａｃｋｅｎｄ、ＲｅｔｉｒｅｄおよびＢａｄＳｐｅｃｕｌａｔｉｏｎのＣＰＵ内部の４つの状態の割合であり、収集の際の割合の平均値を示す。なお、Ｒｉｔｉｒｅｄは、実行確定の割合のことをいい、ＢａｄＳｐｅｃｕｌａｔｉｏｎは、実行廃棄（予測ミス）の割合のことをいう。

【0031】

一例として、性能情報番号が「１」である場合には、性能情報名として「ＣＰＵＣｙｃｌｅｓ」、取得回数として「３」、イベント発生回数（積算値）として「２１，７８６，４０３」が記憶されている。そして、Ｆｒｏｎｔｅｎｄとして「２５（％）」、Ｂａｃｋｎｄとして「５０（％）」、Ｒｅｔｉｒｅｄとして「２０（％）」、ＢａｄＳｐｅｃｕｌａｔｉｏｎとして「５（％）」が記憶されている。また、性能情報番号が「２」である場合には、性能情報名として「Ｉｎｓｔｒｕｃｔｉｏｎｓ」、取得回数として「３」、イベント発生回数（積算値）として「２３，９８９，３４７」が記憶されている。そして、Ｆｒｏｎｔｅｎｄとして「２１（％）」、Ｂａｃｋｎｄとして「５６（％）」、Ｒｅｔｉｒｅｄとして「１９（％）」、ＢａｄＳｐｅｃｕｌａｔｉｏｎとして「４（％）」が記憶されている。

【0032】

［状態情報現在値の一例］
ここで、実施例に係る状態情報現在値４２の一例を、図４を参照して説明する。図４は、実施例に係る状態情報現在値の一例を示す図である。図４に示すように、状態情報現在値４２は、ＣＰＵパイプライン・リソース利用率の現在値を保持する。状態情報現在値４２は、ＣＰＵパイプライン・リソース利用率を対応付けて記憶する。ＣＰＵパイプライン・リソース利用率は、Ｆｒｏｎｔｅｎｄ、Ｂａｃｋｅｎｄ、ＲｅｔｉｒｅｄおよびＢａｄＳｐｅｃｕｌａｔｉｏｎのＣＰＵ内部の４つの状態の割合であり、切替え直前の計測時のＣＰＵパイプライン・リソース利用率である。言い換えれば、ＣＰＵパイプライン・リソース利用率は、ＣＰＵパイプライン・リソース利用率の現在値を示す。

【0033】

なお、ＰＭＵ制御部３１は、複数の性能情報のそれぞれの取得回数が同じ回数でない場合には、同じ回数となるように、一定時間ごとに、性能情報を切り替えるべく、複数の性能情報から次回の収集対象としての性能情報を選択する。そして、ＰＭＵ制御部３１は、複数の性能情報のそれぞれの取得回数が同じ回数になると、ＣＰＵパイプライン・リソース利用率の現在値と最も類似度が低いＣＰＵパイプライン・リソース利用率の平均値を有する性能情報を優先的に選択する。ＣＰＵパイプライン・リソース利用率は、４つの状態の割合を含む。したがって、類似度は、４つの状態の値を４次元ベクトルとした場合の差分の２乗和の平方根を算出すれば良い。

【0034】

例えば、ＣＰＵパイプライン・リソース利用率の現在値を示す（Frontend，Backend，Retired，Bad Speculation）が（ｘ_１，ｘ_２，ｘ_３，ｘ_４）であるとする。ＣＰＵパイプライン・リソース利用率の平均値を示す（Frontend，Backend，Retired，Bad Speculation）が（ｙ_１，ｙ_２，ｙ_３，ｙ_４）であるとする。すると、類似度ｄ（ｘ，ｙ）は、以下の式（１）により算出される。なお、ｄ（ｘ，ｙ）が大きい程、類似度が低い。

【数1】

【0035】

一例として、ＣＰＵパイプライン・リソース利用率の現在値が図４に示すように（３０，４５，２０，５）であるとする。性能情報ごとのＣＰＵパイプライン・リソース利用率（平均値）が図３の管理テーブル４１に示されるものとする。すると、性能情報番号が「１」の場合の「ＣＰＵＣｙｃｌｅｓ」の類似度は、「７．１」と計算される。性能情報番号が「２」の場合の「Ｉｎｓｔｒｕｃｔｉｏｎｓ」の類似度は、「１４．２」と計算される。性能情報番号が「３」の場合の「Ｂｒａｎｃｈｅｓ」の類似度は、「２３．０」と計算される。性能情報番号が「４」の場合の「Ｃａｃｈｅｍｉｓｓｅｓ」の類似度は、「４２．４」と計算される。したがって、ＰＭＵ制御部３１は、性能情報番号「４」，「３」，「２」，「１」の順で、性能情報を優先的に選択する。

【0036】

［性能監視処理のフローチャート］
ここで、実施例に係る性能監視処理のフローチャートの一例を、図５を参照して説明する。図５は、実施例に係る性能監視処理のフローチャートの一例を示す図である。

【0037】

ＰＭＵ制御部３１は、管理テーブル４１を参照して、取得回数が０回の性能情報があるか否かを判定する（ステップＳ１１）。取得回数が０回の性能情報があると判定した場合には（ステップＳ１１；Ｙｅｓ）、ＰＭＵ制御部３１は、取得回数が０回の性能情報について、管理テーブル４１の性能情報番号順に、ＰＭＣ６１０でカウントするように設定（割り当て）する（ステップＳ１２）。そして、ＰＭＵ制御部３１は、ステップＳ１８に移行する。

【0038】

一方、取得回数が０回の性能情報がないと判定した場合には（ステップＳ１１；Ｎｏ）、ＰＭＵ制御部３１は、管理テーブル４１を参照して、他と比べて取得回数が少ない性能情報があるか否かを判定する（ステップＳ１３）。取得回数が少ない性能情報があると判定した場合には（ステップＳ１３；Ｙｅｓ）、ＰＭＵ制御部３１は、取得回数が少ない性能情報の数がＰＭＣ６１０の本数より大きいか否かを判定する（ステップＳ１３Ａ）。

【0039】

取得回数が少ない性能情報の数がＰＭＣ６１０の本数より大きくないと判定した場合には（ステップＳ１３Ａ：Ｎｏ）、ＰＭＵ制御部３１は、管理テーブル４１を参照し、取得回数が少ない性能情報をＰＭＣ６１０でカウントするように設定（割り当て）する（ステップＳ１３Ｂ）。そして、ＰＭＵ制御部３１は、ステップＳ１８に移行する。

【0040】

一方、取得回数が少ない性能情報の数がＰＭＣ６１０の本数より大きいと判定した場合には（ステップＳ１３Ａ：Ｙｅｓ）、ＰＭＵ制御部３１は、管理テーブル４１を参照し、取得回数が少ない性能情報を選択候補とする（ステップＳ１４）。そして、ＰＭＵ制御部３１は、ステップＳ１６に移行する。

【0041】

一方、取得回数が少ない性能情報がないと判定した場合には（ステップＳ１３；Ｎｏ）、ＰＭＵ制御部３１は、取得回数が同一回数であるので、全ての性能情報を選択候補とする（ステップＳ１５）。そして、ＰＭＵ制御部３１は、ステップＳ１６に移行する。

【0042】

ステップＳ１６において、ＰＭＵ制御部３１は、選択候補と直前の計測時とのＣＰＵパイプライン・リソース利用率の類似度を計算する（ステップＳ１６）。例えば、ＰＭＵ制御部３１は、状態情報現在値４２に記憶されたＣＰＵパイプライン・リソース利用率と、管理テーブル４１に記憶された各選択候補の性能情報のＣＰＵパイプライン・リソース利用率の平均値とを比較する。そして、ＰＭＵ制御部３１は、式（１）を用いて、選択候補と直前の計測時とのＣＰＵパイプライン・リソース利用率の類似度を算出する。

【0043】

そして、ＰＭＵ制御部３１は、最も類似度の低い選択候補の性能情報からＰＭＣ６１０でカウントするように設定（割り当て）する（ステップＳ１７）。そして、ＰＭＵ制御部３１は、ステップＳ１８に移行する。

【0044】

ステップＳ１８において、ＰＭＵ制御部３１は、ＰＭＣ６１０のカウントを開始する（ステップＳ１８）。そして、ＰＭＵ制御部３１は、一定時間が経過したか否かを判定する（ステップＳ１９）。一定時間が経過していないと判定した場合には（ステップＳ１９；Ｎｏ）、ＰＭＵ制御部３１は、一定時間が経過するまで、判定処理繰り返す。

【0045】

一方、一定時間が経過したと判定した場合には（ステップＳ１９；Ｙｅｓ）、ＰＭＵ制御部３１は、ＰＭＣ６１０のカウントを停止する（ステップＳ２０）。

【0046】

そして、ＰＭＵ制御部３１は、ＰＭＣ６１０のカウント値およびＣＰＵパイプライン・リソース利用率を取得し、管理テーブル４１を更新する（ステップＳ２１）。例えば、ＰＭＵ制御部３１は、対象の性能情報に割当てたＰＭＣ６１０からカウンタ値を取得し、管理テーブル４１に記憶された対象の性能情報に対するイベント発生回数に積算し、管理テーブル４１を更新する。ＰＭＵ制御部３１は、ＰＭＵ６１から取得されたＣＰＵパイプライン・リソース利用率の現在値を取得し、管理テーブル４１に記憶された対象の性能情報に対するＣＰＵパイプライン・リソース利用率との平均値を算出し、管理テーブル４１を更新する。

【0047】

そして、ＰＭＵ制御部３１は、取得回数を１加算し、管理テーブル４１を更新する（ステップＳ２２）。例えば、ＰＭＵ制御部３１は、管理テーブル４１に記憶された対象の性能情報に対する取得回数を１加算し、加算した値を管理テーブル４１に更新する。

【0048】

そして、ＰＭＵ制御部３１は、終了指示があるか否かを判定する（ステップＳ２３）。終了指示がないと判定した場合には（ステップＳ２３；Ｎｏ）、ＰＭＵ制御部３１は、次回の処理を行うべく、ステップＳ１１に移行する。

【0049】

一方、終了指示があると判定した場合には（ステップＳ２３；Ｙｅｓ）、ＰＭＵ制御部３１は、性能監視処理を終了する。

【0050】

［実施例の効果］
上記実施例では、情報処理装置１は、コア６０で動作するアプリケーション２１の実行の際のコア６０の複数の性能情報の収集において、複数の性能情報ごとに、アプリケーション２１の動作特性を対応付けて蓄積する。情報処理装置１は、コア６０が有するＰＭＣ（Performance Monitoring Counter）６１０の数が複数の性能情報の総数より少ない場合、アプリケーション２１の動作特性の現在値と最も剥離したアプリケーション２１の動作特性を有する性能情報を複数の性能情報の中から選択して、ＰＭＣ６１０に割り当てる。かかる構成によれば、情報処理装置１は、複数の性能情報のいずれもアプリケーション２１の動作特性を平滑化した情報を収集できるようになり、アプリケーション２１の実行状況に左右されず、性能情報を収集できる。

【0051】

上記実施例では、情報処理装置１は、複数の性能情報に関するイベントの取得回数をさらに対応付けて蓄積する。そして、情報処理装置１は、複数の性能情報のそれぞれの取得回数が同じ回数となるように次回の収集対象を選択し、複数の性能情報のそれぞれの取得回数が同じ回数になると、アプリケーション２１の動作特性の現在値と最も剥離したアプリケーション２１の動作特性の平均値を有する性能情報を選択し、次回の収集対象とする。かかる構成によれば、情報処理装置１は、複数の異なる性能情報を収集する際のアプリケーション２１の動作特性の差を平滑化し、アプリケーション２１の動作特性に左右されず、複数の異なる性能情報を収集できる。

【0052】

また、上記実施例では、情報処理装置１は、アプリケーション２１の動作特性の現在値と、複数の性能情報ごとのアプリケーション２１の動作特性の平均値との類似度に応じて性能情報を優先的にＰＭＣ６１０に割り当てる。かかる構成によれば、情報処理装置１は、類似度を用いることで、次にＰＭＣ６１０に割り当てる性能情報を優先的に割り当てることができる。

【0053】

また、上記実施例では、アプリケーション２１の動作特性は、ＰＭＵ６１が有するＣＰＵパイプライン・リソース利用率である。これにより、情報処理装置１は、アプリケーション２１を実行する際のＣＰＵパイプライン・リソース利用率に左右されず、複数の異なる性能情報を収集できる。

【0054】

［その他］
実施例では、オペレーティング・システム２０内に性能監視プログラム３０を備え、性能監視プログラム３０が、ＰＭＵ６１を使って、アプリケーション２１が動作するコア６０の複数の性能を監視すると説明した。しかしながら、性能監視プログラム３０は、オペレーティング・システム２０内に限定されず、オペレーティング・システム２０外でも良く、オペレーティング・システム２０用のプログラムであれば良い。

【0055】

また、実施例では、アプリケーション２１の動作特性の判断に、ＰＭＵ６１のＣＰＵパイプライン・リソース利用率の４つの状態を用いると説明した。しかしながら、アプリケーション２１の動作特性の判断には、ＰＭＵ６１のＣＰＵパイプライン・リソース利用率の別の状態を用いても良い。また、アプリケーション２１の動作特性の判断には、ＰＭＵ６１のＣＰＵパイプライン・リソース利用率を用いることに限定されず、他の方法を用いても良い。

【0056】

また、図示した情報処理装置１に含まれる性能監視プログラム３０の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的態様は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、ＰＭＵ制御部３１を、ＰＭＣ６１０を用いて収集対象の性能情報について情報を収集する機能部と、収集した情報を管理テーブル４１に蓄積する機能部と、一定期間ごとにＰＭＣ６１０に割当てる性能情報を収集対象として切り替える機能と、に分散しても良い。管理テーブル４１および状態情報現在値４２等を記憶する記憶部（図示しない）を情報処理装置１の外部装置としてネットワーク経由で接続するようにしても良い。

【0057】

以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。

【0058】

（付記１）プロセッサで動作するプログラムの実行の際の前記プロセッサの複数の性能情報の収集において、
前記複数の性能情報ごとに、前記プログラムの動作特性を対応付けて蓄積し、
前記プロセッサが有するＰＭＣの数が前記複数の性能情報の総数より少ない場合、前記プログラムの動作特性の現在値と最も剥離した前記プログラムの動作特性を有する性能情報を前記複数の性能情報の中から選択して、前記ＰＭＣに割り当てる
処理をコンピュータに実行させる性能監視プログラム。

【0059】

（付記２）前記蓄積する処理は、前記複数の性能情報に関するイベントの取得回数をさらに対応付けて蓄積し、
前記割り当てる処理は、前記複数の性能情報のそれぞれの前記取得回数が同じ回数となるように次回の収集対象を選択し、前記複数の性能情報のそれぞれの前記取得回数が同じ回数になると、前記プログラムの動作特性の現在値と最も剥離した前記プログラムの動作特性の平均値を有する性能情報を選択し、次回の収集対象とする
ことを特徴とする付記１に記載の性能監視プログラム。

【0060】

（付記３）前記割り当てる処理は、前記プログラムの動作特性の現在値と、前記複数の性能情報ごとの前記プログラムの動作特性の平均値との類似度に応じて前記性能情報を優先的に前記ＰＭＣに割り当てる
ことを特徴とする付記２に記載の性能監視プログラム。

【0061】

（付記４）
前記プログラムの動作特性は、前記ＰＭＵが有するＣＰＵパイプライン・リソース利用率である
ことを特徴とする付記１に記載の性能監視プログラム。

【0062】

（付記５）プロセッサで動作するプログラムの実行の際の前記プロセッサの複数の性能情報の収集において、
前記複数の性能情報ごとに、前記プログラムの動作特性を対応付けて蓄積し、
前記プロセッサが有するＰＭＣの数が前記複数の性能情報の総数より少ない場合、前記プログラムの動作特性の現在値と最も剥離した前記プログラムの動作特性を有する性能情報を前記複数の性能情報の中から選択して、前記ＰＭＣに割り当てる
処理をコンピュータが実行する性能監視方法。

【0063】

（付記６）プロセッサで動作するプログラムの実行の際の前記プロセッサの複数の性能情報を収集する収集部と、
前記複数の性能情報ごとに、前記プログラムの動作特性を対応付けて蓄積する蓄積部と、
前記プロセッサが有するＰＭＣの数が前記複数の性能情報の総数より少ない場合、前記プログラムの動作特性の現在値と最も剥離した前記プログラムの動作特性を有する性能情報を前記複数の性能情報の中から選択して、前記ＰＭＣに割り当てる割当部と、
を有することを特徴とする情報処理装置。

【符号の説明】

【0064】

１情報処理装置
１０システム・メモリ
２０オペレーティング・システム
２１アプリケーション
３０性能監視プログラム
３１ＰＭＵ制御部
４１管理テーブル
４２状態情報現在値
５０ＣＰＵ
６０コア
６１ＰＭＵ
６１０ＰＭＣ

【図1】

【図2】

【図3】

【図4】

【図5】

IP Force 特許公報掲載プロジェクト 2022.1.31 β版