特許6460733 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立システムズの特許一覧

特許6460733情報処理装置、圧縮方法、およびプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6460733

(24)【登録日】2019年1月11日

(45)【発行日】2019年1月30日

(54)【発明の名称】情報処理装置、圧縮方法、およびプログラム

(51)【国際特許分類】

G06F 16/00 20190101AFI20190121BHJP

【ＦＩ】

G06F17/30 220Z

【請求項の数】5

【全頁数】38

(21)【出願番号】特願2014-228707(P2014-228707)

(22)【出願日】2014年11月11日

(65)【公開番号】特開2016-91491(P2016-91491A)

(43)【公開日】2016年5月23日

【審査請求日】2017年9月6日

(73)【特許権者】

【識別番号】000233491

【氏名又は名称】株式会社日立システムズ

(74)【代理人】

【識別番号】110000198

【氏名又は名称】特許業務法人湘洋内外特許事務所

(72)【発明者】

【氏名】小瀬淳一

【審査官】吉田誠

(56)【参考文献】

【文献】特開２０１２−１３３６０８（ＪＰ，Ａ）

【文献】特開２０１１−１８０６８６（ＪＰ，Ａ）

【文献】特開２００９−２７１７５５（ＪＰ，Ａ）

【文献】特開平０８−２６４６１３（ＪＰ，Ａ）

【文献】特開平１０−０５１７７０（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｆ１７／３０

Ｇ０６Ｑ１０／００−９９／００

(57)【特許請求の範囲】

【請求項1】

階級毎の頻度から滑らかな確率密度分布情報を算出できるような平滑対象幅が存在することを予め検証済みな階級に区切って、ウェブシステムの処理時間の階級毎の頻度と階級毎の合計処理時間とを更新する集計部を有し、
前記階級毎の上限値は概ね等比数列で並び、前記階級毎の階級幅の平滑化対象幅毎の移動平均が隣接階級間で概ね同じであり、前記階級の平滑化後の階級の代表値が、秒、分、または時間でみて数桁程度の有効桁数を有する値である、
ことを特徴とする情報処理装置。

【請求項2】

請求項１に記載の情報処理装置であって、
集計部の駆動前に、平滑化によって滑らかな確率密度分布情報を算出できるような階級値を検証または平滑化対象幅を算出する階級値検証部を有する、
ことを特徴とする情報処理装置。

【請求項3】

請求項１に記載の情報処理装置であって、
前記ウェブシステムの処理時間が、ランクのいずれに属するか判定する判定部、をさらに有し、
前記集計部は、前記ウェブシステムの処理時間を、前記判定部によって判定された前記ランクに対応する前記階級幅の倍数に切上げる、
ことを特徴とする情報処理装置。

【請求項4】

情報処理装置の圧縮方法であって、
前記情報処理装置による、ウェブシステムのデータ処理に要した処理時間を、階級毎の頻度から滑らかな確率密度分布情報を復元できるような平滑対象幅が存在することを予め検証済みな階級に区切って、前記ウェブシステムの処理時間の頻度と階級毎の合計処理時間とを更新する更新ステップを含み、
前記階級毎の上限値は概ね等比数列で並び、前記階級毎の階級幅の平滑化対象幅毎の移動平均が隣接階級間で概ね同じであり、前記階級の平滑化後の階級の代表値が、秒、分、または時間でみて数桁程度の有効桁数を有する値である、
ことを特徴とする圧縮方法。

【請求項5】

情報処理装置のプログラムであって、
ウェブシステムのデータ処理に要した処理時間を、階級毎の頻度から滑らかな確率密度分布情報を復元できるような平滑対象幅が存在することを予め検証済みな階級に区切って、前記ウェブシステムの処理時間の頻度と階級毎の合計処理時間とを更新する集計部、として、前記情報処理装置を機能させ、
前記階級毎の上限値は概ね等比数列で並び、前記階級毎の階級幅の平滑化対象幅毎の移動平均が隣接階級間で概ね同じであり、前記階級の平滑化後の階級の代表値が、秒、分、または時間でみて数桁程度の有効桁数を有する値である、
ことを特徴とするプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置、圧縮方法、およびプログラムに関するものである。

【背景技術】

【0002】

特許文献１には、ヒストグラム生成のための対象データに基づいて、該ヒストグラムの各区間を決めるための分割点の候補となる複数の分割候補点を決定する決定手段と、前記各分割候補点における前記対象データの頻度の変化値をそれぞれ計算する変化値計算手段と、前記変化値計算手段で計算された各変化値に基づいて前記複数の分割候補点をサンプリングすることにより、前記決定手段により決定された分割候補点の数よりも少ない数の分割候補点を選択する選択手段と、前記選択手段により選択された分割候補点を用いて前記対象データのヒストグラムを生成するヒストグラム生成手段と、を備えることを特徴とするヒストグラム生成装置が開示されている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０１２−１３３６０８号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

ところで、ウェブシステムのデータ処理に要した処理時間を後で分析できるよう、ウェブシステムの処理時間の頻度（個数）を記憶装置に記憶する情報処理装置がある。

【0005】

しかし、ウェブシステムの処理時間をそのまま記憶装置に記憶すると、大きな記憶容量の記憶装置が必要となるという問題がある。

【0006】

例えば、０秒から４８時間までの処理時間を、「０．００１秒」の等間隔な階級幅の階級に分けて、処理時間「０．００１秒」の頻度は「ａ」、処理時間「０．００２秒」の頻度は「ｂ」・・・処理時間「４７時間５９分５９秒．９９９秒」の頻度は「ｃ」・・・と、すべての処理時間において頻度を記憶装置に記憶すると、処理時間に対する階級の数が「１７２，８００，０００個」となり、大きな記憶容量が必要となる。

【0007】

そこで本発明は、記憶装置の記憶容量を削減できる技術を提供することを目的とする。

【課題を解決するための手段】

【0008】

本願は、上記課題の少なくとも一部を解決する手段を複数含んでいるが、その例を挙げるならば、以下の通りである。上記課題を解決すべく、本発明に係る情報処理装置は、階級毎の頻度から滑らかで歪みの無い確率密度分布情報を算出できるような平滑対象幅が存在することを予め検証済みな階級に区切って、ウェブシステムの処理時間の階級毎の頻度と階級毎の合計処理時間とを更新する集計部を有し、前記階級毎の上限値は概ね等比数列で並び、前記階級毎の階級幅の平滑化対象幅毎の移動平均が隣接階級間で概ね同じであり、前記階級の平滑化後の階級の代表値が、秒、分、または時間でみて数桁程度の有効桁数を有する値である、ことを特徴とする。

【0009】

また、上記の情報処理装置においては、集計部の駆動前に、平滑化によって滑らかで歪みの無い確率密度分布情報を算出できるような階級値を検証または平滑化対象幅を算出する階級値検証部を有する、ことを特徴とするものであってもよい。

【0010】

また、上記の情報処理装置においては、前記ウェブシステムの処理時間が、前記ランクのいずれに属するか判定する判定部、をさらに有し、前記切上げ部は、前記ウェブシステムの処理時間を、前記判定部によって判定された前記ランクに対応する前記階級幅の倍数に切上げる、ことを特徴とする。

【0011】

また、本発明に係る情報処理装置の圧縮方法は、ウェブシステムのデータ処理に要した処理時間を、階級毎の頻度から滑らかで歪みの無い確率密度分布情報を復元できるような平滑対象幅が存在することを予め検証済みな階級に区切って、前記ウェブシステムの処理時間の頻度と階級毎の合計処理時間とを更新し、前記階級毎の上限値は概ね等比数列で並び、前記階級毎の階級幅の平滑化対象幅毎の移動平均が隣接階級間で概ね同じであり、前記階級の平滑化後の階級の代表値が、秒、分、または時間でみて数桁程度の有効桁数を有する値である、ことを特徴とする。

【0012】

本発明に係る情報処理装置のプログラムは、ウェブシステムのデータ処理に要した処理時間を、階級毎の頻度から滑らかで歪みの無い確率密度分布情報を復元できるような平滑対象幅が存在することを予め検証済みな階級に区切って、前記ウェブシステムの処理時間の頻度と階級毎の合計処理時間とを更新する集計部、として、前記情報処理装置を機能させ、前記階級毎の上限値は概ね等比数列で並び、前記階級毎の階級幅の平滑化対象幅毎の移動平均が隣接階級間で概ね同じであり、前記階級の平滑化後の階級の代表値が、秒、分、または時間でみて数桁程度の有効桁数を有する値である、ことを特徴とする。

【発明の効果】

【0013】

本発明では、記憶装置の記憶容量を削減できる。上記した以外の課題、構成、および効果は、以下の実施形態の説明により明らかにされる。

【図面の簡単な説明】

【0014】

【図1】本発明の一実施形態に係る情報処理装置を適用したネットワークシステムの構成例を示した図である。

【図2】情報処理装置のハードウェア構成例を示した図である。

【図3】情報処理装置の機能ブロックの一例を示した図である。

【図4】情報処理装置に関連する機能間のデータフローの一例を示した図である。

【図5】階級値の検証方法を示した図である。

【図6】階級値の要件１の判定条件に関わる式である。

【図7】階級値の要件２の判定条件に関わる式である。

【図8】階級値の要件２の判定条件に関わる別の式である。

【図9】階級値の要件３の判定処理の動作例を示した図である。

【図10】情報処理装置の集計部の動作を説明するフローチャートである。

【図11】統計処理の動作例を説明するフローチャートである。

【図12】検証用の累積確率分布データの例を示した図である。

【図13】生成規則１の概要と要件適合性判定結果を示した図である。

【図14】生成規則１で生成した階級値の検証経過データの例を示した図である。

【図15】生成規則１での階級値の分解能の分析例を説明する図である。

【図16】生成規則１での隣接する階級値の比率の分析例を示した図である。

【図17】生成規則１での平滑化対象の階級幅の移動平均の比率を示した図である。

【図18】生成規則１による階級値から生成した確率密度データの滑らかさの検証例を示した図である。

【図19】生成規則２の概要と要件適合性判定結果を示した図である。

【図20】生成規則２による階級値の情報処理装置への入力データ形式の例を示した図である。

【図21】生成規則２で生成した階級値の検証経過データの例を示した図である。

【図22】生成規則２での階級値の分解能の分析例を説明する図である。

【図23】生成規則２での隣接する階級値の比率の分析例を示した図である。

【図24】生成規則２での平滑化対象の階級幅の移動平均の比率を示した図である。

【図25】生成規則２による階級値から生成した確率密度データの滑らかさの検証例を示した図である。

【図26】生成規則３の概要と要件適合性判定結果を示した図である。

【図27】生成規則３による階級値の情報処理装置への入力データ形式の例を示した図である。

【図28】生成規則３で生成した階級値の検証経過データの例を示した図である。

【図29】生成規則３での階級値の分解能の分析例を説明する図である。

【図30】生成規則３での隣接する階級値の比率の分析例を示した図である。

【図31】生成規則３での平滑化対象の階級幅の移動平均の比率を示した図である。

【図32】生成規則３による階級値から生成した確率密度データの滑らかさの検証例を示した図である。

【図33】生成規則４の概要と要件適合性判定結果を示した図である。

【図34】生成規則４の階級をランク毎の階級幅の倍数に切り上げる式で表現した情報である。

【図35】生成規則４による階級値の情報処理装置への入力データ形式の例を示した図である。

【図36】生成規則４での階級値の分解能の分析例を説明する図である。

【図37】生成規則４での隣接する階級値の比率の分析例を示した図である。

【図38】生成規則４での平滑化対象の階級幅の移動平均の比率を示した図である。

【図39】生成規則４による階級値から生成した確率密度データの滑らかさの検証例を示した図である。

【図40】生成規則４による階級値の情報処理装置への入力データ形式の別の例を示した図である。

【図41】稼働データの例を示した図である。

【図42】圧縮データ記憶部のデータ構成例を示した図である。

【図43】統計処理経過データの例を示した図である。

【図44】累積確率データの例を示した図である。

【図45】確率密度データの例を示した図である。

【図46】確率密度データを多種同時生成した例を示した図である。

【図47】遵守率等を含むレポートの例を示した図である。

【図48】集計部でランク毎の階級幅の倍数に切り上げる処理を実装した例を示した図である。

【発明を実施するための形態】

【0015】

図１は、本発明の一実施形態に係る情報処理装置を適用したネットワークシステムの構成例を示した図である。図１に示すように、ネットワークシステムは、情報処理装置１と、ウェブシステム２と、端末装置３と、ネットワーク４と、を有している。ネットワーク４は、例えば、インターネットである。

【0016】

ウェブシステム２は、ウェブサーバ２ａを有している。図１では、ウェブシステム２は、１台のウェブサーバ２ａを有しているが、２台以上有していてもよい。

【0017】

端末装置３は、ネットワーク４を介して、ウェブシステム２（ウェブサーバ２ａ）に接続されている。端末装置３は、ウェブシステム２に対し、リクエストデータを送信する。図１では、端末装置３は、１台しか示していないが、２台以上であってもよい。

【0018】

端末装置３からウェブシステム２に送信されるリクエストデータには、例えば、ＵＲＬ（Uniform Resource Locator）やリクエストパラメータ等が含まれる。ウェブシステム２は、端末装置３から送信されるリクエストデータに応じて、所定の処理を行い、処理結果を端末装置３に送信する。

【0019】

ウェブシステム２は、端末装置３のリクエストデータに応じて行ったデータ処理に関する稼働データを保存している。稼働データには、ウェブシステム２がリクエストデータをデータ処理した日時、ウェブシステム２がリクエストデータをデータ処理した処理内容を区別するための識別情報、ウェブシステム２がリクエストデータのデータ処理に要した処理時間などが含まれている。

【0020】

情報処理装置１は、ネットワーク４を介して、ウェブシステム２と接続されている。情報処理装置１は、例えば、１日または１週間等、所定の間隔において、ウェブシステム２から、稼働データを受信する。情報処理装置１は、ウェブシステム２から稼働データを受信すると、稼働データに含まれている所定の情報を抽出して圧縮（非可逆圧縮）し、ＨＤＤ（Hard Disk Drive）などの記憶装置に記憶する。

【0021】

図２は、情報処理装置のハードウェア構成例を示した図である。情報処理装置１は、例えば、図２に示すような、ＣＰＵ（Central Processing Unit）等の演算装置６１と、ＲＡＭ（Random Access Memory）などの主記憶装置６２と、ＨＤＤ等の補助記憶装置６３と、有線又は無線により通信ネットワークと接続するための通信インターフェイス（Ｉ／Ｆ）６４と、マウス、キーボード、タッチセンサーやタッチパネルなどの入力装置６５と、液晶ディスプレイなどの表示装置６６と、ＤＶＤ（Digital Versatile Disk）などの持ち運び可能な記憶媒体に対する情報の読み書きを行う読み書き装置６７と、を備えるコンピュータで実現することができる。

【0022】

なお、上記の所定のプログラムは、例えば、読み書き装置６７により読み取られた記憶媒体からインストールされてもよいし、通信Ｉ／Ｆ６４を介してネットワークからインストールされてもよい。

【0023】

上述した情報処理装置１の機能構成は、情報処理装置１の構成を理解容易にするために、主な処理内容に応じて分類したものである。構成要素の分類の仕方や名称によって、本願発明が制限されることはない。情報処理装置１の構成は、処理内容に応じて、さらに多くの構成要素に分類することもできる。また、１つの構成要素がさらに多くの処理を実行するように分類することもできる。また、各構成要素の処理は、１つのハードウェアで実行されてもよいし、複数のハードウェアで実行されてもよい。

【0024】

図３は、情報処理装置１の機能ブロックの一例を示した図である。図３に示すように、情報処理装置１は、受信部１１と、集計部１２と、階級値１３と、圧縮データ記憶部１４と、を有している。集計部１２は、判定部１２ａと、カウント部１２ｂと、合計部１２ｃを有している。稼働データ１１ｄおよび階級値１３は、図示していない記憶装置に記憶される。

【0025】

受信部１１は、ウェブシステム２から稼働データ１１ｄを受信する。受信部１１は、例えば、１日または１週間等、所定の間隔において、ウェブシステム２から、稼働データ１１ｄを受信する。

【0026】

例えば、集計部１２の機能は、補助記憶装置６３などから主記憶装置６２にロードされた所定のプログラムを演算装置６１が実行することで実現される。受信部１１は、例えば、演算装置６１が通信Ｉ／Ｆ６４を利用することで実現される。階級値１３は、補助記憶装置６３などから主記憶装置６２にロードされる集計部１２で参照されるデータ、または、所定のプログラムの一部として主記憶装置６２にロードされるデータであっても良い。圧縮データ記憶部１４は、例えば、演算装置６１が主記憶装置６２または補助記憶装置６３を利用することで実現される。

【0027】

圧縮データ記憶部１４には、集計部１２によって圧縮されたデータが記憶される。なお、情報処理装置１は、圧縮データ記憶部１４を有していなくてもよい。例えば、ネットワーク４に接続された他の装置が、圧縮データ記憶部１４を有していてもよい。

【0028】

図４は、情報処理装置１の集計部１２に入力される階級値１３の検証部７も具備した場合の機能ブロック間のデータフローを示したものである。

【0029】

集計部１２は、受信部１１から供給される稼働データ１１ｄを、階級値１３を用いて圧縮したデータを、圧縮データ記憶部１４に蓄積する。

【0030】

受信部１１は、１日おきにウェブシステム２から稼働データを受信する場合、１日分の稼働データを受信する。また、受信部１１は、１週間おきにウェブシステム２から稼働データを受信する場合、１週間分の稼働データを受信する。

【0031】

後日、稼働データ１１ｄに関するレポートが欲しくなった時、統計処理８は、圧縮データ記憶部１４に蓄積されたデータと階級値１３とから累積確率データ８ａを生成し、さらに平滑対象幅７ａも用いて、確率密度データ８ｂを生成し、レポート部９で、処理時間の平均値や遵守率等を含みうるレポート９ｆを出力または可視化する。

【0032】

階級値の検証部７は、情報処理装置１で集計部１２を起動させるより前に１回だけ、集計部１２で圧縮した情報が、統計処理８で抽出を予定しているデータの精度において情報を損なうことなく圧縮データを生成できるような階級値１３と、稼働データに含まれるノイズを取り除いた確率密度データを生成するための平滑対象幅７ａとを算出する。

【0033】

ここで、階級値の検証部７は、情報処理装置１の集計部１２と同一の情報処理装置１に配備されてもよいし、情報処理装置１の集計部１２の実行に先立って処理される方法であってもよい。

【0034】

図５は、階級値１３の検証方法を構成する一連の手順を示したフローである。また、階級値の検証部７を実装する場合は、図５に示す機能ブロックと等価な処理群によって実現することができる。

【0035】

階級値の検証処理７の中のステップＳ７９では、「情報処理装置１の集計部１２」と等価な処理を「階級値の検証処理７での統計処理１２」として用いる。

【0036】

次に、ステップＳ７９では、統計処理８は、圧縮データ記憶部１４から、累積確率データ８ａを生成し、さらに階級の代表値における累積確率グラフの傾きから確率密度データ８ｂを生成し、確率密度データ８ｂが滑らかなグラフとなることを検証し、検証結果７ｃを出力する。

【0037】

かかる検証方法によって、図４におけるレポート部９で出力する遵守率等のレポート９ｆに、情報の欠落が発生することを防ぐためには、「図４におけるレポート部９の直前の統計処理８」と「図５における検証処理７における統計処理８」とを、等価な処理にすることが合理的である。

【0038】

ここで、階級値の検証方法として、検証用データ生成ステップＳ７８で生成されるデータから確率密度データ８ｂを生成し可視化しただけでは、図３９の様に微妙に歪んだ確率密度グラフとなる場合もあり、生成された確率密度データの滑らかさや歪みについて、客観的な判断ができない。

【0039】

そこで、階級値の検証処理７では、確率密度データが滑らかなグラフとなる為に、何らかの生成規則に従って生成された階級値に対して、下記の要件を満たすような“平滑対象幅”が存在するか否かを判別する。
・要件１：階級値が概ね等比数列であって、階級値で階級幅を割った分解能の全階級の平均より、隣接階級値の比率の標準偏差が小さい。
・要件２：隣接する階級幅が概ね等しく、平滑対象幅の隣接階級幅の合計の隣接階級の比率から１減じた値の絶対値が、階級値で階級幅を割った分解能の平均値より小さい。
・要件３：所定の平滑対象幅で平滑化した階級の代表値が、時・分・秒で観て、より少ない有効数字であること。

【0040】

以下には、何らかの生成規則に従って生成された階級値が、要件１，２，３に適合することを客観的に判断できる為の手順を示す。

【0041】

ステップＳ７１では、（ｋ）個の階級値（ｃ［ｉ］）に対して、図６の式３に従って隣接する階級値の差（ｃ［ｉ］−ｃ［ｉ―１］）として定義される階級幅（ｗ［ｉ］）を、図６の式４に従って、階級値（ｃ［ｉ］）で割った階級毎の分解能（ｄ［ｉ］）の平均値（Ｄ）を算出する。

【0042】

例えば図１９に示す生成規則２の場合、表Ｔ２中のＤの行に示すように、５９．７分の１となる。

【0043】

ステップＳ７２では、仮の平滑対象幅（ｆ）を２に設定し、ステップＳ７３での要件１適合性判定とステップＳ７４での要件２適合性判定に適合するまで、仮の平滑対象幅を増やすことを繰り返す。

【0044】

ステップＳ７３では、図６に示すように、式１に示すように従って隣接階級値の比率（ｃ［ｉ］−ｃ［ｉ―１］）として定義される（ｖ［ｉ］：ｉ＝ｆからｋ）の値の内、式６に従って、最初の（ｆ）個を除く値の標準偏差（Ｓ）が、式５従って算出される平均分解能（Ｄ）未満であることによって、式７に示したように、要件１に適合すると判断する。

【0045】

ステップＳ７４では、平滑対象幅（ｆ個）の階級幅の移動平均が、隣接階級間において、平滑化後に期待される分解能の範囲で、概ね等しいことによって、要件２に適合すると判断する。

【0046】

より具体的な判定方式の例として、図７の式８に示すように、最初の（ｆ）個を除いた階級毎に、（ｆ）個の階級幅の合計の隣接階級間の比率から１を減じた値の絶対値の平均値が、最初の（ｆ）個の階級を除く階級の分解能の平均値に平滑対象幅を掛けた値より小さいことを判定するものであってもよい。

【0047】

また、図８の式９に示すように、最初の（ｆ）個を除いた階級毎に、（ｆ）個前の階級値との差によって、（ｆ）個の階級幅の合計を算出して、等価な判定条件とするものであっても良い。

【0048】

ステップＳ７５は、要件１または要件２の何れかに適合しなかった場合、ステップＳ７６に移行し、仮の平滑対象幅（ｆ）が階級の個数（ｋ）に十分近づいた時には要件１および要件２が成立するので、ステップＳ７７に移行できる。

【0049】

例えば図１３に示す生成規則１で、仮の平滑対象幅を７０階級とした場合、図１３のＤの行に示すように、隣接階級値の比率の標準偏差は０．００２１で、図１３のＤの行に示した平滑化前の分解能（５３５．１分の１）より大きく、要件１に適合しない。

【0050】

また、例えば図１３に示す生成規則１の場合、仮の平滑対象幅を７０階級とした場合、図１４の階級番号９６７の行の「隣接７０階級幅の比率」欄に示したように、０．９３０から０．９９９までの階級幅の合計と、０．９３１から１．０００までの階級の幅の合計の比率から１を減じた値が、図１３のＭの行に示すように１．１２９となり、図１３のＧに示した平滑化後の分解能である０．１３０８より小さいので、要件２には適合する。

【0051】

例えば図１９に示す生成規則２の場合、表Ｔ２中のＦの行に示すように、８個の階級を平滑対象幅とした時、表Ｔ２中のＫの行に示したように要件１に適合し、表Ｔ２中のＮの行に示したように要件１に適合する。

【0052】

図５のステップＳ７７では、ステップＳ７５で算出した仮の平滑対象幅で平滑化した後に期待される分解能に応じて、時・分・秒で観て区切りの良い階級値が、より多く含まれることをもって、要件３に適合すると判断する。

【0053】

図５のステップＳ７７の内部処理を、図９を用いて、より詳細に述べる。ステップＳ７７１では、階級値の数列に、｛１秒，１０秒，６０秒（１分），６００秒（１０分），３６００秒（１時間）、３６０００秒（１０時間）｝、即ち、時・分・秒で観て、有効桁数が１桁である数値が含まれていることを判定し、もし、何れかの数値が含まれていなければ、ステップＳ７７８に移行し、要件３に不適合だと判断する。

【0054】

ステップＳ７７２では、階級値の数列に、｛０．５秒，５秒，３０秒（０．５分），３００秒（５分），１８００秒（０．５時間）、１８０００秒（５時間）｝、即ち、時・分・秒で観て１桁の有効数値の２分の１の数値が含まれていることを判定し、もし、何れかの数値が含まれていなければ、ステップＳ７７８に移行し、要件３に不適合だと判断する。

【0055】

ステップＳ７７３では、平滑化対象後に期待する分解能の値として、平滑化前の平均分解能（Ｄ）に、平滑対象幅（ｆ）を掛けた値を設定する。

【0056】

ここで平滑化対象後に期待する分解能（Ｄ）は、ステップＳ７７１とステップＳ７７２による制約により、１より小さな値で、その逆数は１より大きくなる。

【0057】

例えば図１９に示す生成規則２の場合、平滑化前の分解能は表Ｔ２中のＤの行に示すように５９．７分の１で、それに表Ｔ２中のＤのＦの行に示した平滑対象幅（ｆ）の値８を掛けて、表Ｔ２中のＧの行に示した平滑後に期待する分解能（D）の値として「７．４６分の１」が算出できる。

【0058】

ステップＳ７７４からＳ７７７では、｛１秒，１０秒，６０秒（１分），６００秒（１０分），３６００秒（１時間）、３６０００秒（１０時間）｝に｛D、２×D、・・・（Dの逆数を超えない整数）×D｝を掛けた数値が、階級値の数列に含まれることを判定する。

【0059】

例えば図１９に示す生成規則２の場合、平滑後に期待する分解能（D）の値「７．４６分の１」であるので、｛７．４６分の１，７．４６分の２，７．４６分の３，７．４６分の４，７．４６分の５，７．４６分の６，７．４６分の７｝を｛１秒，１０秒，６０秒（１分），６００秒（１０分），３６００秒（１時間）、３６０００秒（１０時間）｝に掛け、平滑後に期待する有効精度（約１．８桁）に丸めた値に近い数値である｛｛０.１，１，６，６０，３６０，３６００｝，｛０.２，２，１２，１２０，７２０，７２００｝，｛０.４，４，２４，２４０，１４４０，１４４００｝，｛０.５，５，３０，３００，１８００，１８０００｝，｛０.６，６，３６，３６０，２１６０，２１６００｝，｛０.８，８，４８.２５，４８０，２８８０，２８６２０｝，｛０.９，９，５４，５４０，３２４０，３２４００｝｝が、全て図２０の１３ｄ２に示した階級値に含まれるので、要件３に適合していると判定できる。

【0060】

一方、図２６に示す生成規則３の場合、平滑後に期待する分解能の値「２．８分の１」であるので、｛２．８分の１，２．８分の２｝を｛１秒，１０秒，６０秒（１分），６００秒（１０分），３６００秒（１時間）、３６０００秒（１０時間）｝に掛けた値に近い階級値が｛｛０.３０９，２.９９，１８.１，１７９，１０５０，１０７００｝，｛０.７３１，７.０７，４２.８，４３４，２５６０，２６０００｝｝であって、区切りの良い階級値となっていないので、不適合であると判定できる。

【0061】

次に、図５のステップＳ７８では、検証用のデータとして、ワイブル分布や一様分布等、解析的に確率密度データの分布が判っている処理時間のデータを、１種類以上生成する。

【0062】

図５のステップＳ７９では、図４における集計部１２、および統計処理８と同様な処理によって、累積確率データ８ａを生成する。

【0063】

例えば、ワイブル分布の場合、図１２のＧ１７のグラフに示すように、滑らかな曲線になる。

【0064】

さらに、ステップＳ７９では、累積確率データの階級毎の代表点における接線の傾きから確率密度データを生成し、ステップＳ７７までに算定した平滑対象幅で平滑化した確率密度データを算出する。

【0065】

例えば、生成規則１の階級値で、平滑対象幅を７０階級として、ワイブル分布の確率密度データを算出し、グラフとして可視化すると、図１８のＧ１４のグラフのように、Ａ１の近辺で滑らかさが損なわれて歪んだグラフとなる。

【0066】

一方、生成規則２の階級値で、平滑対象幅を８とした場合、図２５に示すように、平滑化後に期待される分解能（０．１３４）を超える処理時間では、滑らかで歪みの無いグラフとなる。

【0067】

以上の検証結果は、図１３に示すような情報を含む検証結果７ｃとして出力しても良い。また、さらに、前記検証結果は、図１３のＴ１，図１９のＴ２，図２６のＴ３，図３３のＴ４の様に、複数種類の生成規則による階級を比較可能にするものであっても良い。

【0068】

また、検証の過程で算出したデータをグラフとして可視化しても良い。
・Ｉ１，Ｉ２，Ｉ３，Ｉ４の“階級値（class value）”の列：
階級「第ｉ」毎の階級値「c[i]」
・Ｉ１，Ｉ２，Ｉ３，Ｉ４の“階級幅（class width）”の列：式３の「w[i]」の計算結果
・Ｉ１，Ｉ２，Ｉ３，Ｉ４の“隣接・階級値の比率”の列：式１の「v[i]」の計算結果
・Ｉ１，Ｉ２，Ｉ３，Ｉ４の“隣接・階級幅の比率”の列：式８，式９の計算経過
・Ｉ１，Ｉ２，Ｉ３，Ｉ４の“隣接・ｎ階級の階級幅の比率”の列：
式８，式９の計算経過で、平滑化対象幅をｎ階級とした計算経過
・Ｉ１，Ｉ２，Ｉ３，Ｉ４の“分解能”の列：式４の「d[i]」計算結果
・Ｇ１１，Ｇ２１，Ｇ３１，Ｇ４１：階級値「c[i]」と階級幅「w[i]」のグラフ
・Ｇ１２，Ｇ２２，Ｇ３２，Ｇ４２：階級値「c[i]」と隣接・階級値の比率「v[i]」グラフ
・Ｇ１３，Ｇ２３，Ｇ３３，Ｇ４３：
式８，式９の計算経過を示す隣接・階級幅の比率のグラフ
・Ｇ１４，Ｇ２４，Ｇ３４，Ｇ４４：図５の確率密度データ８ｂを可視化したグラフ

【0069】

さらに、ステップＳ７９で出力する階級値は、図３５に示すような、数値の列挙として出力しても良い。

【0070】

また、階級値の検証部７が出力する階級値１３は、図３５と同じ生成規則４に対して、図４０の様なＳＱＬ文の形式で、集計部１２の処理を構成するカスタマイズ可能な処理コードの一部が出力されるものであっても良い。

【0071】

図５から図４に戻って、本願の情報処理装置１は、階級値の検証部７と同様な方法で、要件１〜３への適合性を検証済みであるような階級値１３を構成要素とすることを特徴とするが、階級値の検証部７を機械的に行うことは、必ずしも必須としない。

【0072】

次に、本願の中心的な処理である、図４の中の集計部１２の処理内容を、図１０を用いて、より詳しく述べる。

【0073】

図１０の集計部１２が処理する稼働データ１１ｄは、例えば、図４１に示すようなデータである。図４１に示すように、稼働データ１１ｄ中のレコード２１，２２は、ウェブシステム２がリクエストデータをデータ処理した時刻２１ａ，２２ａを有している。また、稼働データ１１ｄ中のレコード２１，２２は、ウェブシステム２がリクエストデータをデータ処理した処理内容を区別するための識別情報２１ｂ，２２ｂを有している。また、稼働データ１１ｄ中の２１，２２は、ウェブシステム２がリクエストデータのデータ処理に要した処理時間２１ｃ，２２ｃを有している。

【0074】

例えば、稼働データ１１ｄの中のレコード２１の例の場合、ウェブシステム２は、時刻２１ａに受け付けた識別情報２１ｂに示すデータ処理内容のデータ処理を行うのに、「０．３７１ｓ」の処理時間を要している。

【0075】

図４１では、稼働データ１１ｄのレコードとして２１，２２しか示していないが、情報処理装置１は、例えば、１日おきにウェブシステム２から稼働データを受信する場合には、一般的に数千から数百万レコードの稼働データ１１ｄを受信する。

【0076】

図１０のステップＳ１では、図４１に例を示したような稼働データ１１ｄ中のレコードをメモリに読み込む。

【0077】

ステップＳ２では、稼働データ１１ｄから図４２中で処理識別情報を構成する｛ＵＲＬ５１、Ｑｕｅｒｙ文字列５２、該当レコードが処理された時期５３｝を抽出する。

【0078】

ここで、時期５３は、ステップＳ１の中では、処理識別情報抽出条件１２ｅとして与えられる条件に従って、稼働データ１１ｄの時刻部分２１ａから、｛繁忙期、平常時｝等の表意的な識別情報に変換しても良い。また、処理識別情報抽出条件に従って、稼働データ２１中の処理時期別情報部分２１ｂ中の一部だけを抽出し、ＵＲＬ情報５１、またはＱｕｅｒｙ文字列５２としても良い。以降では、稼働データ１１ｄ中のレコードに含まれていた処理識別情報から抽出した｛ＵＲＬ５１、Ｑｕｅｒｙ文字列５２、時期５３｝等からなる情報を、ウェブシステム２内部でのデータ処理内容を識別しうる情報として、処理識別子と呼ぶ。

【0079】

ステップＳ３では、図４１に示すような稼働データ１１ｄ中の１レコードの処理時間部分２１ｃを数値化し、図３５に示すような、階級毎の上限値を示す数値の列と比較して、当該の処理時間２１ｃが属する階級を選定する。

【0080】

ステップＳ４では、図４２に示すようなデータ構成において、処理識別子を構成する情報（５１，５２，５３）が前記ステップ２で抽出した処理識別子に一致し、さらに階級値５４の列が前記所属階級の階級値となっているレコードを探し、もし該当レコードが無ければ、頻度欄が０の行を追加し、もし該当レコードが有れば頻度５５の値を１増やす。

【0081】

ステップＳ５では、図４２に示すようなデータ構成において、処理識別子を構成する情報（５１，５２，５３）が前記ステップ２で抽出した処理識別子に一致し、さらに階級値５４の列が前記所属階級の階級値となっているレコードを探し、もし該当行が無ければ、処理時間の合計値欄が０の行を追加し、もし該当レコードがあれば、処理時間２１ｃの値を、処理時間の合計値欄に加算する。

【0082】

ステップＳ６では、稼動データ１１ｄに後続データの有無を判定し、図４１における、稼動データの後続レコード２２があれば、ステップＳ１に遷移して、後続レコード２２について、前記レコード２１と同様な処理によって、図４２に示す圧縮データ記憶部１４のデータを、さらに更新する。

【0083】

ステップＳ６で、稼動データ１１ｄに後続データの有無を判定し、稼動データ１１ｄに後続レコードが無ければ、集計処理を終了する。

【0084】

ここで、稼動データ１１ｄは、ＷＥＢシステム２から受信し、集計処理１２が終わるまでの一時的な期間だけ保持するものであって、集計処理１２の終了後、情報処理装置１から消去しても良い。

【0085】

また、圧縮データ記憶部１４には、翌週以降の稼動データの集計処理に備えて、情報処理装置１の補助記憶装置６３の領域を長期的に占有するものであるが、処理識別子と階級の数の組合せに応じた領域を占めるのみである。

【0086】

図４２に示すように、圧縮データ記憶部１４は、ＵＲＬ（Uniform Resource Locator）５１と、Ｑｕｅｒｙ５２、時期５３等からなる処理識別情報と、階級値５４と、頻度５５と、処理時間の合計値５６と、を有している。圧縮データ記憶部１４には、処理識別子と階級値の種類の組合せに対応する量のデータを保持する。例えば、処理識別子の種類が２００種類で、階級値が生成規則２の例の様に９５３階級の場合、約２０万（１９０,６００＝２００×９５３）レコード相当のデータ量となる。従って、１日分だけでも数百万レコードに及びうる稼働データ１１ｄから、高々２０万レコード相当のデータ量に圧縮して、圧縮データ記憶部１４に情報を蓄積できる。さらに、圧縮データ記憶部１４には、稼働データ１１ｄの中のレコード数に依存しない固定的な容量である。また、さらに、生成規則４のように、より少ない数（２４４階級）の階級値を用いると、より圧縮データ１４のデータ量を削減し、省メモリ化できる。

【0087】

また、生成規則４の階級値は、図３４に示すように、処理時間が属する階級を、処理時間のランクの判別条件と、所属ランク毎の階級幅で切り上げる演算式で算出できる。さらに図３４の階級値算出式を用いると、図４０の１１ｄ５のＳＱＬ文の様に、カスタマイズ可能な実行文の形式で階級値１１ｄを準備し、図４８に示す、集計部１２の別の実装でも、図１０と等価な処理ができる。

【0088】

集計部１２の別の実装を、図４８を用いて、より詳しく述べる。

【0089】

ステップＳ１１で、稼動データ中の１件のレコードを読込、ステップＳ１２で、データベースのレコードとして整形して一時テーブルに書き込む。ステップＳ１１，Ｓ１２を、日々の稼働データの全レコードに適用する。

【0090】

図４０に示したＳＱＬ文の様に、複数のテーブル間の突合せや演算機能を利用すると、ステップＳ１４の処理識別子の判定条件はＷｈｅｒｅ句の条件、ステップＳ１５の所属ランクの判定はＣＡＳＥ＆Ｗｈｅｎ式、ステップＳ１６の階級の上限値への切り上げはＣＥＩＬ関数、ステップＳ１７の頻度の合計とステップＳ１８の処理時間の合計は、ＧｒｏｕｐＢＹ句とＳＵＭ関数を含む１文で実装できることは、当業者であれば明らかである。

【0091】

例えば、図４１における稼働データ中のレコード２１の処理時間２１ｃは、０．３７１秒であるが、図３４または、その実装である図４０の計算式によって、０．２秒から０．４以下に対する階級幅（０．０２秒）の倍数に切り上げ、０．３８秒を上限値とする階級の頻度５５と、処理時間の合計値５６とを更新する。

【0092】

ここで、レポート部９の前処理としての統計処理８に必要となる情報を失わないことを、階級値の検証部７で検証するために、階級値の検証部７の内部処理としての統計処理８とレポート部９の前処理としての統計処理８とは、等価な処理内容とすることが合理的である。集計部１２と組み合わせて用いられる統計処理８は、少なくとも、累積確率データ８ａと、確率密度データ８ｂとを生成することを想定する。

【0093】

そこで、レポート部９の前処理としての統計処理８と、階級値の検証部７の内部処理としての統計処理８に共通して具備されるべき処理の１例について、図１１を用いて述べる。

【0094】

ステップＳ８１では、圧縮データ記憶部１４から図４２に示す内容のデータを主記憶装置６２に読み込み、図４３に示すような構造のデータを構成する。図４３における処理識別情報の構成要素の例としているＵＲＬ５１，Ｑｕｅｒｙ５２，時期５３は、何れも圧縮データ記憶部１４から転記した情報である。さらに、図４３における階級の上限値５４、頻度５５、処理時間の合計値も、１種類以上の処理識別情報｛５１、５２、５３｝と階級値｛５４｝の組み合わせ毎に在った情報を転記したものである。

【0095】

ステップＳ８２は、図４３に示すようなデータ構造の情報を、処理識別子毎に繰り返す。

【0096】

ステップＳ８３は、図４３の示すようなデータ構造の情報の内、同一の処理識別子について、階級毎の頻度５５の合計を算出する。

【0097】

ステップＳ８４は、図４３の示すようなデータ構造の情報の内、同一の処理識別子について、階級値の昇順に繰り返す処理を示す。

【0098】

ステップＳ８５は、当該階級での度数５５を、当該階級までの度数に累計値に加えて、前記ステップ８３で算出した合計頻度で割った値を、当該階級までの累積確率５７として算出する。

【0099】

ステップＳ８６では、再び、図４３の示すようなデータ構造の情報の内、同一の処理識別子について、階級値の昇順に繰り返す処理を示す。

【0100】

ステップＳ８７とステップＳ８８とでは、図４３における、平滑化前の階級毎の代表値と、確率密度との対５８、または、階級値の検証の過程で定めた平滑対象幅を下回らない数の階級に対する階級毎の代表値と、平滑対象幅毎の確率密度の対５９とを、階級毎に算出する。ここで、平滑対象幅毎の確率密度データは、図４４に示されるような累積確率データのグラフの階級の代表値における接線の傾きとして定義されるものである。その確率密度データの平滑化は、階級値毎に昇順に、平滑対象幅（ｆ）個だけ離れた累積確率の差を（ｆ）個の階級の幅の合計値で割った傾きを算出すれば、移動平均値を算出できる。

【0101】

同一処理識別情報の全階級について、ステップＳ８７とＳ８８を繰り替えし終えたとき、ステップＳ８６は、次の処理識別情報について処理し、さらにステップＳ８２で全ての処理識別情報について処理を終えたとき、統計処理を終える。

【0102】

以上に、情報処理装置１を構成する処理、および、その前提として実施されるべき階級値の検証手順、さらに検証の前提として組み合わせて利用されることを想定した統計処理について、述べた。

【0103】

以下には、各処理内容の効果を、適用データの例と共に示す。

【0104】

まず、階級値の検証部７、または、階級値の検証手段が、似て異なる生成規則の階級値の一方だけを要件１〜３に適合すると判別でき、圧縮データ記憶部１４から確立密度データを算出した時、統計処理に必要となる精度の情報を失わないことを示す。

【0105】

例として、図１３のＴ１に示す生成規則１、図１９のＴ２に示す生成規則２の内、要件１〜３に適合するのは、生成規則２であって、生成規則１は要件１，２に不適合である為に、確率密度データに歪みが生じると判別できることを示す。

【0106】

まず、Ｔ１のＢの行に概要を示した生成規則１は、０秒から４８時間までの処理時間について、３桁の有効桁数の数値を網羅する階級値であり、階級の数（ｋ）はＴの（Ｃ）の行に示したように５５１９個の階級である。

【0107】

図５に示した階級値の検証の過程では、例えば図１４のＩ１に示すような、階級値毎のデータを用いる。

【0108】

ステップＳ７１で計算する、階級の分解能とは式４で定義され、式５に従って平均分解能を計算することができる。また別の手段として、図１５のＧ１１のグラフのように、横軸に処理時間、縦軸に階級幅をプロットしたグラフの傾きから、「１００分の１」と「千分の１」との間の値であると、視覚的な手順で「分解能の代表的は５３５分の１前後の値」ということを求めても良い。

【0109】

ステップＳ７３での「要件１適合性判定」の中で用いる隣接階級値の比率（v[i]）は、図１４の“隣接階級値の比率”の列の様に、階級毎に式２に従って算出できる。

【0110】

生成規則１の場合、Ｔ１のＫの行に示すように、図１３のＴ１のＪの行に示した隣接階級値の比率の標準偏差が約０．００２１であって、Ｔ１のＤの行に示した平滑化対象前の平均分解能である「約５３５分の１」、すなわち０．００１８より大きいので、要件１に不適合であることを判別することができる。

【0111】

図１６のＧ１２のグラフのように、横軸に階級値、縦軸に隣接階級値の比率をプロットして、最初の何個かの階級値を除いて、平均分解能を下回る変動幅であることをもって、要件１に適合することを、視覚的な手段で判断することもできる。

【0112】

ステップＳ７４での「要件２適合性判定」の中で用いる平滑対象幅（ｆ）での隣接階級幅の比率は、図１４における“隣接・７０階級幅の比率”の列に示すような、階級幅の移動平均値に対して、式８または式９に従って判別することができる。例えば図１４において、階級の代表値を０．９６７とした７０階級の幅は、１．１３倍の比率となり、前記ステップＳ７１で算出した平均分解能（５３５分の１＝０．００１８）より大きいので、要件２に不適合であると判別できる。このように、要件２に不適合となりそうな階級の代表値は、図１７のＧ１３のように、横軸に階級値、縦軸に隣接階級値の比率をプロットしたグラフから、殆どの階級で「隣接階級値の比率は約１倍」であるのに対して、「階級値が１、１０、１００、１０００、１００００の前後では、１０倍になっている」という様子から、視覚的に不適合であることを推定することもできる。

【0113】

ステップＳ７９では、検証用の分布として、解析的に滑らかな確率密度グラフとなることが既知となっているワイブル分布を用いると、累積確率データは図１２のＧ１７のグラフのように滑らかなデータであるにも関わらず、生成規則１の階級値を用いて確率密度データを生成すると、図１８のＧ１４のグラフに示すように、階級値が１００秒のＡ１の点の前後で、滑らかさが損なわれて歪んだグラフとなることを、視覚的に確認することもできる。

【0114】

ステップＳ７７では、生成規則１が、有効桁数３桁の数値を全て包含することにより、要件３に適合することは明らかである。

【0115】

これら図５に従った一連の手順による「階級値の検証結果」は、図１３のＴ１の各行に示すように、生成規則１は、要件１にも要件２にも適合しないことを、判別できる。

【0116】

ただし、図１３の場合は、平滑対象幅を７０で止めた為に要件１，２に適合しなかったが、平滑対象後に期待できる分解能が荒くなることを許容して、平滑対象幅を階級の個数である５５１９に近づければ、要件１，２には適合する。

【0117】

別の例として、図１９のＴ２に示した生成規則２では、階級の上限値の平均公比を（６０の（２４０分の１））とし、時・分・秒で観て有効桁数が２ケタ、または「｛１秒，１０秒，６０秒，６００秒，３６００秒，３６０００秒｝の（８分の１）の倍数に最寄の値」を階級毎の上限値とした階級を考える。生成規則２は、図２０に階級値１３ｄ２に示すように、規則的な合成ではなく、恣意的な数値の選択を含む。

【0118】

生成規則２についても、生成規則１に対する図１４と同様な階級値の検証経過データとして図２１のＩ２に示す情報を計算する。

【0119】

生成規則２にステップＳ７１を適用すると、図２２のグラフＧ２１に示すように（９０分の１）から（５０分の１）の分解能であって、図１９のＴ２のＤの行に示すように平滑化前の平均分解能は（約５９．７分の１）即ち（約０．０１６７）である。

【0120】

生成規則２にステップＳ７３での「要件１適合性判定」を適用すると、図１９のＴ２の（Ｊ）の行に示すように、隣接する階級値の比率の標準偏差が約０．００９２０で、前記（D行）平均分解能（０．０１６７）より小さいので、要件１に適合していると判別できる。

【0121】

また、この要件１への適合性は、図２３に示す、横軸が階級値で、縦軸が隣接階級値であるようなグラフを描き、平滑化後に期待される分解能に応じた「０．１３９９秒以上」のＧ２２の平坦さから、視覚的に判断することもできる。

【0122】

生成規則２に、平滑対象幅を８階級として、ステップＳ７４での「要件２適合性判定」を適用すると、図２１のＩ２の表中の「隣接８階級の幅の比率」の列の値から、図１９のＴ２の（ｆ）の行に示した平滑滑対象幅「８階級」での隣接階級幅の比率から１を減じた絶対値の最大値として、図１９のＴ２の表中の（Ｍ）の行に示すように約０．１２５を算出でき、平滑化後に期待される分解能であるＧ行「０．１３３９」より小さいので、要件２に適合すると判別できる。また要件２への適合性判定は、図２４において、平滑化後に期待される分解能に応じた「０．１３９９秒以上」のグラフＧ２３の平坦さによって、視覚的に確認することもできる。

【0123】

生成規則２の階級値に、図９の「要件３適合性判定」手順を適用すると、ステップＳ７７１では、｛１，１０，６０，６００，３６００，３６０００｝が図２０の階級値１３ｄ２に包含されるので、ステップＳ７７２に移行する。ステップＳ７７２では、｛０．５，５，３０，３００，１８００，１８０００｝が図２０の階級値１３ｄ２に包含されるので、ステップＳ７７３に移行する。

【0124】

ステップＳ７７３では、平滑化後に期待される分解能として、前記平滑化前の分解能（約５９．７分の１）に、前記平滑対象幅（８）を掛けて、平滑化後に期待される分解能として（約７．４６分の１≒約０．１３３９）という値を算出できる。

【0125】

図９のステップＳ７７４からステップＳ７７７では、｛１，１０，６０，６００，３６００，３６０００｝に前記平滑化後に期待される分解能（約７．４６分１）の分母に近い７以下を掛けた数列に近い数列である｛｛０.１，１，６，６０，３６０，３６００｝，｛０.２，２，１２，１２０，７２０，７２００｝，｛０.４，４，２４，２４０，１４４０，１４４００｝，｛０.５，５，３０，３００，１８００，１８０００｝，｛０.６，６，３６，３６０，２１６０，２１６００｝，｛０.８，８，４８.２５，４８０，２８８０，２８６２０｝，｛０.９，９，５４，５４０，３２４０，３２４００｝｝が、図２０の階級値１３ｄ２に包含されるので、ステップＳ７７９に移行し、要件３に適合していることを判別できる。

【0126】

さらに、生成規則２の階級値と、平滑対象幅８と、検証用データとして図１２のＧ７８の累積確率データとなるようなワイブル分布に、図５のステップＳ７９を適用すると、図２５のＧ２４に示すような、確率密度データを算出することができて、その前記平滑化後に期待される分解能（約０．１３秒）を超える部分のグラフが滑らかになっていることをもって、圧縮データには確率密度データに歪みを生じない精度のデータを格納できていたことを確認することもできる。

【0127】

生成規則２の階級値に対する検証結果も、図１９のＴ２のような情報として出力することができる。

【0128】

ここで、生成規則１と生成規則２とで、ワイブル分布に従うデータの圧縮と、確率密度データとしての復元を行った結果を比較すると、確率密度データに歪みが生じした階級値Ａ１は、要件１または要件２を満たさなかったような階級値の箇所であることも判る。

【0129】

そこで、要件１および要件２は、復元した確率密度データに歪みが生じない為の必要条件であるとしている。

【0130】

また、ここで、生成規則２の９５３個の階級と平滑対象幅（８階級）によって、平滑化後に期待される分解能がＴ２に示したように（約７．４６分の１）であって、それを有効桁数に換算する為に分解能の１０を底とする対数値を算出すると、（約０．８７桁）相当である。同様に生成規則１の５５１９個の階級と平滑対象幅（７０階級）によって、平滑化後に期待される分解能はＴ１に示したように（約７．６分の１）であって、それを有効桁数に換算すると（約０．９）相当である。これら生成規則１と生成規則２とを比べると、平滑化後に期待される有効桁数は同程度であるのに、平滑化前の階級の数が５５１９個となっている生成規則１より、平滑化前の階級の数が９５３階級となっている生成規則２の方が、階級数が少ないので、より省メモリで、同等の有効精度の統計結果を得ることができる。

【0131】

このように、階級値の検証部７または、集計部１２に先立って階級値の検証手段は、図１３のＴ１、図１９のＴ２、図２６のＴ３、図３３のＴ４のように、検証経過で算出した階級数、平滑化前の平均分解能、平滑対象幅、平滑化後に期待できる平均分解能、隣接階級の比率の平均値および標準偏差、平滑対象幅の隣接階級幅の比率から１減じた値の最大値等を出力する場合、圧縮効果の高い階級値、または、平滑化後により細かい分解能となる階級値を選択することもできる。

【0132】

別の例として、図２６のＴ３に示す生成規則３、図３３のＴ４に示す生成規則４の内、要件３に適合するのは、生成規則４であって、生成規則３は不適合な為に正確な遵守率を算出できないことを示す。

【0133】

生成規則３は、１秒、５０秒、６０秒、３６００秒を滑らかに通るよう、０．１秒から５０秒の階級値は１．０８倍（=５０の(５０分の１）乗)、６０秒以上は１．０６倍（＝６０の（６０分の１）乗）の等比級数を、有効数字３桁目で丸めた数値を階級値としている。

【0134】

生成規則３に対して、図２８のＩ３に示すように、階級毎の階級幅と、階級幅を階級値で割った階級毎の分解能の平均を算出すると、約１４．０分の１（約０．０７１４）となる。

【0135】

生成規則３での隣接階級の階級値の比率は、図３０のＧ３２に示すように、６０秒未満と６０秒を超えた処理時間の階級に対して異なるが、図２６のＴ２の（Ｊ）の行に示すように、平滑化後に期待できる分解能未満の処理時間（約０．０７秒未満）に対する階級を除いて、標準偏差（約０．０１４）が平均分解能（約０．０７１４）を下回るので、要件１に適合する。

【0136】

生成規則３の階級値に対して、平滑対象幅を５階級とした場合、図２８のＩ３の“隣接５階級幅の比率”に示すように式８の値を計算すると、図２６のＴ３中の（Ｍ）に示すように「約０．２００」であって、平滑化後の分解能（約２．８分の１≒約０．３５７）を下回るので、要件２に適合する。

【0137】

生成規則３によって生成される階級値は、図２７の１３ｄ３に示す数列である。ところが、時・分・秒で観て有効数字１桁の｛１，１０，６０，６００，３６００，３６００｝に最寄な階級値は、｛１，９．６７，１０．５，６０，５７０，６１１，３６００，３６６００｝であるので、時・分・秒で観て区切りの良い数値を包含しているとは言えない。

【0138】

さらに、図９に示した要件３の検証手順では、平滑化後に期待する分解能（約２．８分の１）に応じて、より多くの時・分・秒で観て区切りの良い数値である｛｛１，１０，６０，６００，３６００，３６００｝，｛０.５，５，３０，３００，１８００，１８０００｝，｛０.３，３，１８，１８０，１０８０，１０８００｝，｛０.７，７，４２，４２０，２５２０，２５２００｝｝を包含することを判別条件としているにも関わらず、それらの数値に最寄の階級値が｛｛１，９．６７，１０.５，６０，５７０，６１１，３４２０，３６００，３４２００，３６６００｝，｛０.４９５，０．５３５，４．７８，５.１７，２８．９，３１.３，２８８，３０９，１７００，１８２０，１００００，１０７００｝，｛０.３０９，２.９９，１８.１，１７９，１０５０，１０７００｝，｛０.７３１，７.０７，４２.８，４３４，２５６０，２６０００｝｝であることからも、要件３に不適合であると判定できる。

【0139】

生成規則４によって生成される階級値は、図３６のＧ４１に示すように、６０秒未満の階級毎の分解能は（１０分の１）から（２０分の１），６０秒を超える階級の分解能は（１０分の１）から（３０分の１）で、図３８のＧ１３のグラフに示すように、隣接する階級幅の比率が殆どの階級で１．５倍未満、最大でも２．５倍を超えないような比率で、図３６のＢ２の拡大図に示すように、所定の分解能の上限を示すグラフに接しそうになった時所定の分解能の下限を示すグラフに近くて、概ね２倍以下の階級幅まで垂直に増やし、再び、階級値が増えても、所定の分解能の下限に接しそうになるまで、階級幅を水平なまま変えないということを繰り返すような、階段状に階級幅を増した階級値であって、時・分・秒で観て区切りの良い数値をより多く含むように恣意的に選んだ、図３５に示す階級値１３ｄ４である。

【0140】

生成規則４の階級値は、図３６のグラフＢ１の階段状の段差となっている階級の上限値を「ランク」と呼ぶ区切りとすれば、図３４に示すように、ランク毎の階級幅の倍数に切り上げた階級毎の上限値として表現することもできる。

【0141】

生成規則４は、図３３のＴ４に示すように、平滑化前の分解能は「約１７分の１」、平滑化前平滑対象幅を６とした場合の平滑化後に期待される平均分解能は「約２．８２分の１≒約０．３５４３」と算出できる。

【0142】

生成規則４での隣接する階級値の比率は、図３７のＧ４２のグラフに示すように６０秒を境に若干異なるが、生成規則３に対するＧ３２のグラフと同様、平均１．０８倍の比率となっており、図３７のＧ４２における平滑化後に期待できる分解能（約０．３５秒）を超える処理時間に対する隣接階級値の比率のグラフＧ４２が平坦になっていること、あるいは図３３の（Ｊ）の行に示す隣接階級値の比率の標準偏差（約０．０２１９）が、平滑化前の分解能（約１７分の１＝約０．０５８）を下回るので，要件１を満たす。

【0143】

生成規則４での隣接階級間の階級幅の比率は、図３８のＧ４３に示すように、ランクの区切りとなった多くの階級を除いて１．０倍であり、ランクの区切りとなった階級では、１．５倍から２．５倍で、概ね２倍である。これも、隣接階級の幅の比率が１未満となる階級も有った生成規則３との差異である。

【0144】

生成規則４で、平滑対象幅を６とした場合、平滑対象幅の移動平均値の隣接階級間の比率から１を減じた値の絶対値の最大値は、図３３の（Ｍ）の行に示したように「約０．２５０」で、平滑化後に期待される分解能「約０．０５８」を下回るので、要件２を満たす。

【0145】

生成規則４は、｛１，１０，６０，６００，３６００，３６００｝の｛１倍，０．５倍，２．８２分の１倍、２．８２分の２倍｝に近い数値として｛｛１，１０，６０，６００，３６００，３６０００｝，｛０．５，５，３０，３００，１８００，１８０００｝，｛０．３，３，１８，１８０，１０８０，１０８００｝，｛０．７，７，４２，４２０，２５２０，２５２００｝｝を包含するので、図９に示した判定条件で、要件３に適合していると判定できる。

【0146】

ここで、生成規則３の階級は、階級数が２３８階級で、平滑後に期待できる分解能は約２．８分の１であり、かたや、生成規則４の階級は、階級数が２４４階級で、平滑化後に期待できる分解能は約２．８２分の１であり、さらに、生成規則３の階級値の検証過程でワイブル分布の確率密度データを復元した図３２のグラフＧ３４も、生成規則４の階級値について同じ検証用のデータを用いて確率密度データを復元した図３９のグラフＧ４４も、平滑化後に期待できる分解能より長い処理時間（約０．３秒）を超える部分は、同程度に滑らかなグラフとなっているので、同程度の精度の情報を保持しつつ、同程度に省メモリ化できるかのように観える。

【0147】

しかしながら、図４におけるレポート部９で、遵守率をレポートに含めることを想定した場合、生成規則３の階級は生成規則４の階級より精度が劣っている。例えば、遵守率の目標値を６００秒とし「処理時間が６００秒以下であった遵守率」の統計値をレポートしようとした場合、生成規則４の階級には「６００秒」という階級値が含まれるので、正確な遵守率を算出できる。一方、生成規則３では、６００秒に最寄りの階級値は｛５７０秒と６１１秒｝であるので、５９９秒の処理が多発した場合も、６００秒以下の処理時間が少なくて６１０秒の処理が多発した場合も、圧縮データ記憶部１４に蓄積される階級毎の頻度も合計処理時間も同一の内容になるので区別がつかない。そこで、図４４に示すような累積確率のデータにおいて、５７０秒以下の処理時間の累積発生確率と６１１秒以下の処理時間の累積発生確率とから、６００秒以下の処理時間の発生確率を内挿して計算せざるを得ないが、遵守率の目標値の前後での片寄を発見できる精度は、圧縮データ記憶部１４に記録する前に失われている。

【0148】

ここで、図１０であろうと図４８であろうと、あるいは、それらと等価な別の実装であろうと、集計部１２で生成した圧縮データ記憶部１４の情報は、図４で想定した統計処理８およびレポート部９に必要となる情報を、平滑対象幅（ｆ）に期待される精度の範囲において損なうことなく保持できることを検証済みな階級値を用いて、稼働データ１１ｄから抽出した情報を、非可逆に圧縮し、圧縮データ記憶部１４に記録していることを示す。

【0149】

非可逆に圧縮している過程について、図４１の稼働データ中のレコード２１と２２と、図１０または図４８の実行後の図４２の圧縮データ１４との対応付けに着目して説明する。

【0150】

前記に示したように、圧縮データ記憶部１４には、図４１に示す稼動データのレコードの例であるレコード２１やレコード２２の発生順序や、処理識別情報として抽出しなかったＱｕｅｒｙ文字列の一部または全部を保持しないことにより、省メモリ化を計っている。

【0151】

例えば、図４１の稼働データ中のレコードの例２１で、ＵＲＬ部には「/context01/svcName1」という処理内容を識別しうる情報が含まれていたが、図４２の圧縮データ記憶部１４に記録するデータとしては「/URL1」の様に、処理識別情報の抽出条件として指定される変換規則に従って、多対１に対応する情報であっても良い。また、図４１の稼働データ中のレコードの例２１で、ＵＲＬに続くＱｕｅｒｙ文字列「p=53&aps=1743606」であったが、図４２の処理識別子を構成するデータとしては「SomeQuery」の様に、処理識別情報の抽出条件として指定される変換規則に従って、多対１に対応する情報であっても良い。

【0152】

また、さらに、稼働データ中の時刻２１ａは、１時間単位の日中変化をレポート予定とする場合は、１時間単位の時刻情報を処理識別子に転記するが、｛繁忙期、平常時｝等の時期のみをレポートする予定である場合は、処理識別子を構成する情報の中での時期５３は、｛繁忙期、平常時｝のような表意的な記号であっても良い。

【0153】

あるいは、レポート予定の内容に処理識別子を含める予定が全くない場合は、処理識別子の抽出も記録も不要としても良い。

【0154】

これらは、圧縮データ記録部から、元の稼働データ１１ｄを完全に復元できるような可逆圧縮を行わないことによって、データ圧縮効果を高めていることを示す。

【0155】

階級値の検証段階で要件１，２，３に適合することを判断済の階級値を用いる集計部１２は、以下の効果をもたらす。

【0156】

即ち、要件１により、例えば、１００分の数秒から、数時間までの広い処理時間の分布に対し、階級毎の有効精度（分解能）を保持しつつ、階級の数を削減することができる。

【0157】

この、概ね対数的に等間隔な数列を階級値とすることにより、全階級を等間隔にした場合に比べて、階級の数を削減し、圧縮データ記憶部１４の記録に用いる補助記憶装置６３も、集計処理を行うための主記憶装置６２も、所要量を削減できる。

【0158】

要件２に適合して、平滑化対象とする幅の隣接階級幅の比率が概ね等しいことにより、統計処理８において圧縮データ記憶部１４から復元できる確率密度データの歪みを、平滑化対象幅に期待される分解能に抑えることができる。

【0159】

なお、確率密度データの生成では、図４５中の平滑化前のグラフに示すように、収取データのノイズが含まれるため、一般的に平滑化処理は必要とされるが、従来技術では、データ収集前に適切な平滑幅を算出しようとしていなかった。一方、要件２への適合性検証の過程で、平滑対象幅の下限と、平滑化後に期待される分解能とを算定しているので、図４５の８ｂ１に示すような凸凹な多峰性の分析に対して、優位の差と見なすべき判別条件の採択にも貢献できる。

【0160】

要件３により、レポート部９で処理時間に対するウェブシステム２の順守率を求める際に、元データ（圧縮する前の処理時間のデータ）を用いないで済むよう、順守率の目標として指定されうる処理時間（例えば、人間が認知できる時間（間隔）であって、キリのよい数字）をより多く網羅することができる。

【0161】

即ち、要件３に適合して、平滑化対象幅に期待される分解能に応じて、より多くの階級値が時・分・秒で観て区切りの良い数値であることにより、より多種類の処理時間を遵守率の目標値として、圧縮前の稼働データと比べて精度を損なうことなく、遵守率をレポートできる。

【0162】

例えば、図４７では、遵守率の目標値として｛０．４秒，４秒，４０秒｝の３種類について、遵守率の補数を表示しているが、これ以外の処理時間を遵守率の目標値として、再度統計処理８を行うことになっても、再び稼働データ１１ｄを読み直すことなく、レポートできる。なお、再び稼働データ１１ｄの読み直しを必要としないことは、稼働データ１１ｄを、レポート出力後まで保存することを不要にするので、稼働データ１１ｄを保存する為の補助記憶装置６３の所要量を削減することにも貢献する。

【0163】

また、さらに、図３５に示した生成規則４の階級値は、図２０に示す生成規則２での要件３判別条件で必要としていた｛｛０.１，１，６，６０，３６０，３６００｝，｛０.２，２，１２，１２０，７２０，７２００｝，｛０.４，４，２４，２４０，１４４０，１４４００｝，｛０.５，５，３０，３００，１８００，１８０００｝，｛０.６，６，３６，３６０，２１６０，２１６００｝，｛０.８，８，４８.２５，４８０，２８８０，２８６２０｝，｛０.９，９，５４，５４０，３２４０，３２４００｝の内の殆どを包含し、一部包含されていない｛４８.２５，２８６２０｝に近い数として｛４５秒，５０秒，２７０００秒（７．５時間），２８８００秒（８時間）｝を包含おり、順守率の目標として指定されうる処理時間を同程度に多種包含しているので、確率密度データの精度より遵守率のレポートを重視するならば、生成規則２による９５３個の階級値より、生成規則４による２４４個の階級値を選択することによって、より省メモリとすることもできる。

【0164】

さらに、圧縮データ記憶部１４に記録した各処理識別子毎の情報から、図４７に示した「平均値９ｆ２」，「６８％カバーする最大値，９５％カバーする最大値，９９．７％カバーする最大値等の複数のpercentile値９ｆ３」，「統計対象期間の合計処理時間や合計頻度９ｆ４」等、多様な統計情報を一つの圧縮データ記憶部１４から抽出する場合であっても、再び稼働データ１１ｄを読み直す必要が無く、レポート部９に必要となる情報を損なうことなく稼動データ１１ｄの情報を圧縮データ記憶部１４に保持できていると言える。

【0165】

以下では、下記の例によって、圧縮効果を示す。
・稼動データ１１として、図４１の２１に示すような１つのレコードが平均１２０バイトで、１日当たり平均１０万レコード、１年当たり約３千６５０万レコード発生しうるものとする。
・稼動データ中に含まれる、データ処理内容を識別しうる情報は、平均６４バイト含まれ、処理識別子として３２バイトの情報を抽出するものとする。即ち、図４２における処理識別子（５１，５２，５３）が３２バイトであるとする。
・処理時間は、０．００１秒から４８時間まで発生しえて、小数点下３桁の数値とする。

【0166】

従来技術による場合、一旦レポートを生成しても、遵守率の目標値などを変えた場合に、再度生の稼動データの読み直しを不要とすることができるような情報を保持することを保証していなかった為、以下のような情報を保持する必要が生じる。
・稼動データとして、１年前に遡るデータを保持するために「（１２０バイト）×（１０万／日）×（３６５日）」＝「４，３８０，０００，０００バイト」
・図４２に示す構造のデータとして、０秒から４８時間までを０．００１秒で等間隔に区切った、「１７２，８００，０００個」の階級夫々について、処理識別子として３２バイト、階級値として４バイト、頻度として８バイト、処理時間の合計として８バイト、１個の階級当たり「５２バイト」、１種類の処理識別子あたり「８，９８５，６００，０００バイト」の記録領域を必要とする。
・稼動データと、中間的な処理で用いるデータとを合わせると「１３，３６５，６００，０００バイト」の記憶領域を必要とする。

【0167】

一方、本発明で、例えば生成規則４に従う階級値を用いた場合、遵守率の目標値などを変えても、再度生の稼動データを読み直す必要が生じないだけの十分な情報を保持していることにより、保持すべき情報量を下記にしめすように削減できる。
・稼動データとして、１日分のデータを保持するために「（１２０バイト）×（１０万／日）×（１日）」＝「１２，０００，０００バイト」
・図４２に示す構造のデータとして、生成規則４の２４４個の階級について、前記と同様１個の階級当たり「５２バイト」占めるとすると、１種類の処理識別子あたり「１２．６８８バイト」の記憶領域を必要とする。
・稼動データと、圧縮データ部に保持するデータとを合わせると、「１２，０１２，６８８バイト」あれば十分な記憶領域となる。
・この例における圧縮効果は、「約１１１２分の１＝（（１２，０１２，６８８）÷（１３，３６５，６００，０００））」である。

【0168】

ここに示した圧縮効果は、より長期の稼働期間に対するレポートを作成することを想定する程、より高い圧縮効果となる。

【0169】

また、図１１の統計処理８におけるステップＳ８１の様に、補助記憶装置６３から主記憶装置６２に、圧縮データ記憶部１４に記録された情報をロードするような処理がレポート部９にも含まれる場合、主記憶装置６２の省メモリ化によって、同時期により多種の処理識別子の確率密度データをメモリ上に保持することも可能になる。

【0170】

例えば、従来技術において、図４３に示すような構造のデータを統計処理経過で用いる場合、前記「１種類の処理識別子あたりの記憶領域量」の例として算出した「９Ｇバイト≒８，９８５，６００，０００バイト」を必要とし、これは、３２ビットＯＳで容易に確保可能な主記憶装置の容量（４Ｇバイト）を超えるので、複数個の処理識別子の統計処理を行うことが困難である。一方、本発明において、図４３に示すような構造のデータを統計処理経過で用いる場合、前記「１種類の処理識別子あたりの記憶領域量」の例として算出した「１３Ｍバイト≒１２．６８８バイト」を必要とするのみであるので、４Ｇバイトのメモリを使用すれば（338,506≒（4*1024*1024*1024÷12,688））個までの処理識別子の統計処理を同時期に行うことができる余地がもたらされ、これによって、例えば図４６に示すように、多種の処理識別子の確率密度グラフを重ねて表示し、他の処理識別子に比べて突出した確率密度の処理時間を発見できるなど、統計処理８で生成する累積確率データらや確率密度データから、さらに２次的な分析ができるという効果も期待できる。

【0171】

要件１，２，３の全ての要件を満たすことにより、図４に示したような、階級値の検証部７で想定したレポート部９に必要となる情報が損なわれることなく、圧縮データ記憶部１４に、必要な情報が保持できることにより、長期間の統計処理を行う場合であっても、稼働データ１１ｄを保持する必要は無く、統計対象期間に応じて増加しうる稼働データの総量に比べて、少量で、統計対象期間に応じない固定的な容量の圧縮データ記憶部１４は、より長期間の統計を容易にするという効果もある。

【0172】

以下、４種類の生成規則に基づいて、ウェブシステムの処理時間が属する階級を求めるための情報（例えば、図３５に示したような情報）を生成する例について説明する。以下では、ウェブシステムの処理時間を丸めるための情報を、階級値と呼ぶことがある

【0173】

［生成規則１］
図１３は、生成規則１の概要と要件適合性判定結果を示した図である。図１３に示す表Ｔ１の（Ｂ）欄には、ウェブシステムの処理時間が属する階級を求めるための階級値を生成する生成規則１を示している。

【0174】

図１４は、生成規則１に基づいて生成した階級値と、階級の検証過程を示した情報である。

【0175】

図１５は、生成規則１による階級値の検証経過における階級の分解能を説明する図である。図１５に示すグラフＧ１１は、図１４に示す情報Ｉ１の階級値と階級幅とを対数グラフにプロットしたものである。グラフＧ１１の横軸は階級値を示し、縦軸は階級幅を示している。

【0176】

グラフＧ１１に示すように、生成規則１に基づいて生成した階級値の階級幅は、各ランクにおいて、水平方向に変化する。従って、階級値は、ランクごとにおいては、等差数列で並んでいる。例えば、「１秒以下」のランクでは、階級値の公差すなわち階級幅は「０．００１」である。「１０秒以下」のランクでは、階級値の公差は「０．０１」である。

【0177】

また、階級幅は、ランク間において等比数列で並んでいる。例えば、グラフＧ１１に示すように、階級幅は、ランクが変わるところにおいて階段状に変化し、階段の各蹴上げは、対数的にみて、概ね等間隔となっている。これにより、生成規則１の場合、図１５に示すように階級幅を階級値で割った分解能は、約１００分の１から１０００分の１の範囲の分解能を持つことができる。

【0178】

図１６は、生成規則１による階級値の隣接する階級値の比率を示した図である。図１６に示すグラフＧ１２は、図１４の情報Ｉ１に示す「隣接・階級値の比率」（階級値の隣接する比率）を、対数グラフにプロットしたものである。グラフＧ１２の横軸は階級値を示し、縦軸は比率を示している。グラフＧ１２に示すように、階級値の隣接する比率は、概ね「１．０１０」となっている。

【0179】

図１７は、生成規則１による階級幅の隣接する移動平均の比率を示した図である。図１７に示すグラフＧ１３の白い四角は、図１４の情報Ｉ１に示す「隣接・７０階級幅の比率」（７０区間による移動平均の隣接する比率）を、対数グラフにプロットしたものである。グラフＧ１３の黒い菱形は、図１４の情報Ｉ１に示す「隣接・階級幅の比率」（移動平均しない階級幅の隣接する比率）を、対数グラフにプロットしたものである。グラフＧ１３の横軸は階級値を示し、縦軸は比率を示している。

【0180】

グラフＧ１３に示すように、階級幅を移動平均（平滑化）した場合の隣接する比率は、白い四角に示すように、概ね「１」である。一方、階級幅を移動平均しない場合の隣接する比率は、黒い菱形に示すように、階段状のランクの変わり目で１０倍異なる場合がある。

【0181】

［生成規則２］
図１９は、生成規則２の概要と要件適合性判定結果を示した図である。図１９に示す表Ｔ２には、ウェブシステムの処理時間が属する階級を求めるための階級値を生成する生成規則２を示している。図１９の表Ｔ２の（Ｂ）の欄にも記しているように、生成規則２の階級値は、平均公比（６０の（２４０分の１）乗）の数列を元に、時・分・秒で観た有効桁数が２桁または時・分の（８分の１）に近い数値を恣意的に選んだ、図２０に列挙した数列である。

【0182】

図２１の情報Ｉ２は、図２０の階級値に対する階級の検証過程を示すデータである。

【0183】

図２２は、生成規則２による階級の検証過程における分解能を説明する図である。図２２に示すグラフＧ２１は、図２１に示す情報Ｉ２の階級値と階級幅とを対数グラフにプロットしたものである。グラフＧ２１の横軸は階級値を示し、縦軸は階級幅を示している。
階級値は、ランクごとにおいては、概ね等差数列で並んでいる。

【0184】

グラフＧ２１に示すように、生成規則２に基づいて生成した階級値の階級幅は、階段状の増加傾向はあるが、水平方向の変化が途切れ、単調な増加では無い箇所もある。
例えば、「０．０９２秒以下」のランクでは、階級値の公差すなわち階級幅は「０．００１」である。「０．１６０秒以下」のランクでは、階級値の公差は「０．００３」である。

【0185】

また、階級値「０．８００秒」から「１．００秒」の階級幅は主として「０．０１５」であるが、その途中の階級値「０．８１０秒」「０．９１０秒」に対する階級幅を「０．０１０」とすることによって、階級値「０．９００秒」と「１．００秒」等、有効数字１ケタの秒単位で観て区切りの良い階級値をより多く含むようにしている。

【0186】

また、階級幅は、ランク間において概ね等比数列で並んでいる。例えば、グラフＧ２１に示すように、階級幅は、ランクが変わるところにおいて階段状に変化し、階段の各蹴上げは、対数的にみて、概ね等間隔となっている。これにより、生成規則２の場合、階級値は、約５０分の１から９０分の１の範囲の分解能を持つことができる。

【0187】

図２３は、生成規則２による階級値の隣接する階級値の比率を示した図である。図２３に示すグラフＧ２２は、図２１の情報Ｉ２に示す「隣接・階級値の比率」（階級値の隣接する比率）を、対数グラフにプロットしたものである。グラフＧ２２の横軸は階級値を示し、縦軸は比率を示している。グラフＧ２２に示すように、階級値の隣接する比率は、概ね「１．０１７２」となっている。

【0188】

図２４は、生成規則２による階級幅の隣接する移動平均の比率を示した図である。図２４に示すグラフＧ２３の白い四角は、図２１の情報Ｉ２に示す「隣接８階級幅の比率」（８区間による移動平均の隣接する比率）を、対数グラフにプロットしたものである。グラフＧ２３の黒い菱形は、図２１の情報Ｉ２に示す「隣接・階級幅の比率」（移動平均しない階級幅の隣接する比率）を、対数グラフにプロットしたものである。グラフＧ２３の横軸は階級値を示し、縦軸は比率を示している。

【0189】

グラフＧ２３に示すように、階級幅を移動平均（平滑化）した場合の隣接する比率は、白い四角に示すように、概ね「１」である。一方、階級幅を移動平均しない場合の隣接する比率は、Ｇ２３の黒い菱形、あるいは図２１での階級値「０．８１０秒」「０．９１０秒」に対する隣接・階級幅の比率に示す最小値「０．６７」から、階級値「０．０９４秒」に対する隣接・階級幅の比率に示す最大値「２．００」までの値となる階級もある。
グラフＧ２３で明らかなように、生成規則２における階級幅は、単純な等比数列として生成できる数列では無く、階級値の大きさに応じて単調に増加するものでもない。
図２５は、図１９の要件適合性判定結果の内の「滑らかさの検証（ワイブル分布の復元能力検証）」欄を視覚的に確認する為のグラフの例である。

【0190】

［生成規則３］
図２６は、生成規則３の概要と要件適合性判定結果を示した図である。図２６に示す表Ｔ３には、ウェブシステムの処理時間を丸めるための階級値を生成する生成規則３を示している。
生成規則３の階級値は、｛１秒，５０秒，６０秒，３６００秒｝を滑らかに通るように、５０秒以下の階級値は、１．０８倍（５０の（５０分の１）乗）、６０秒以上の階級値は１．０６倍（６０の６０分の１）乗）を公比とする等比数列を、有効数字３桁で丸めるという、規則的に合成できる数列の値である。

【0191】

図２７は、生成規則３に基づいて生成した階級値を示した図である。図２７の階級値について、階級値検証用のデータを生成すると、図２８の情報Ｉ３のようになる。

【0192】

図２９は、生成規則３による階級値の階級値の分解能を説明する図である。図２９に示すグラフＧ３１は、図２８に示す情報Ｉ３の階級値と階級幅とを対数グラフにプロットしたものである。グラフＧ３１の横軸は階級値を示し、縦軸は階級幅を示している。

【0193】

グラフＧ３１に示すように、生成規則３の場合、階級値は、約１０分の１から２０分の１の範囲の分解能を持ち、図２６のＴ３の表に示すように、平均分解能は（約１４分の１≒０．０７１４４）であることが判る。

【0194】

図３０は、生成規則３による階級値の隣接する階級値の比率を示した図である。図３０に示すグラフＧ３２は、図２８の情報Ｉ３に示す「隣接・階級値の比率」（階級値の隣接する比率）を、対数グラフにプロットしたものである。グラフＧ３２の横軸は階級値を示し、縦軸は比率を示している。グラフＧ３２に示すように、階級値の隣接する比率は、６０秒以下の階級では「約１．０８倍」と、６０秒を超える階級では「約１．０７」になっている。

【0195】

図３１は、生成規則３による階級の隣接する階級幅の移動平均の比率を示した図である。図３１に示すグラフＧ３３の黒丸は、図２８の情報Ｉ３に示す「隣接・５階級幅の比率」（５区間による移動平均の隣接する比率）を、対数グラフにプロットしたものである。グラフＧ３３の白い菱形は、図２８の情報Ｉ３に示す「隣接・階級幅の比率」（移動平均しない階級幅の隣接する比率）を、対数グラフにプロットしたものである。グラフＧ３３の横軸は階級値を示し、縦軸は比率を示している。

【0196】

［生成規則４］
図３３は、生成規則４の概要と要件適合性判定結果を示した図である。
図３３に示す表Ｔ４には、ウェブシステムの処理時間を丸めるための階級値を生成する生成規則４を示している。生成規則４の詳細は、図３４のように、ランク毎の階級幅として定め、図３５に示す階級値となる。

【0197】

図３６は、図３５の階級値と階級幅の関係を示す分解能を示すグラフである。また、生成規則４による階級値の隣接する階級値の比率は、図３７に示すようになる。また、生成規則４による階級の隣接する階級は場の移動平均の比率は、図３８に示すようになる。

【0198】

次に、上記の階級値でウェブシステムの処理時間を圧縮した場合の確率密度算出について説明する。

【0199】

上記したように、圧縮されたウェブシステムの処理時間は、ユーザによって分析される。例えば、ユーザは、圧縮されたウェブシステムの処理時間を用いて、ウェブシステムの処理時間の確率密度を算出する。

【0200】

以上、本発明について実施形態を用いて説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されない。上記実施形態に多様な変更または改良を加えることが可能であることが当業者には明らかである。また、そのような変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。また、本発明は、処理時間に関する情報を圧縮する圧縮方法、および情報処理装置１で処理時間に関する情報を圧縮するプログラム、および当該プログラムを記憶した記憶媒体として提供することもできる。

【符号の説明】

【0201】

１：情報処理装置
２：ウェブシステム
２ａ：ウェブサーバ
３：端末装置
４：ネットワーク
７：階級値の検証部
７ａ：平滑対象幅
１１：受信部
１１ｄ：稼働データ
１２：集計部
１２ａ：判定部
１２ｂ：カウント部
１２ｃ：合計部
１２ｅ：処理識別情報抽出条件
１３：階級値
１３ｄ２，１３ｄ３，１３ｄ４：生成規則に従って生成された階級値の例
１４：圧縮データ記憶部
８：統計処理
８ａ：累積確率データ
８ａ１：累積確率データの階級毎の代表値における接線
８ｂ：確率密度データ
８ｂ１：多峰性を含む確率密度データ
８ｂ２：多種処理識別情報の中で突出した確率密度データ
９：レポート部
９ｆ：レポート
９ｆ１：処理識別情報
９ｆ２：処理識別情報毎の平均処理時間
９ｆ３：処理識別情報毎の処理時間のpercentile（ｎ％カバーする最大処理時間）
９ｆ４：アクセス回数
９ｆ５：遵守率（遵守目標とした処理時間を超えた処理の発生率）
２１，２２：稼働データ
２１ａ，２２ａ：日時
２１ｂ，２２ｂ：識別情報
２１ｃ，２２ｃ：処理時間
５１：ＵＲＬ
５２：Ｑｕｅｒｙ
５３：時期
５４：階級値
５５：頻度
５６：処理時間の合計値
５７：累積確率
５８：平滑化前の階級の代表値毎の発生確率
５９：平滑化後の階級の代表値毎の発生確率
Ｇ７８：検証用データの累積確率グラフ
Ｇ１１，Ｇ２１，Ｇ３１，Ｇ４１：階級値と階級幅のグラフ
Ｇ１２，Ｇ２２，Ｇ３２，Ｇ４２：隣接・階級値の比率のグラフ
Ｇ１３，Ｇ２３，Ｇ３３，Ｇ４３：隣接・階級幅の比率のグラフ
Ｇ１４，Ｇ２４，Ｇ３４，Ｇ４４：確率密度のグラフ
Ｔ１〜Ｔ４：階級の生成規則と適合性判定結果の表
Ｉ１〜Ｉ３：階級値の検証の処理経過を示す情報

【図1】