【文献】
林 亜紀,伊藤 貴之,システムログの俯瞰と縮約のための可視化の一手法,情報処理学会 第74回(平成24年)全国大会論文集(4) インターフェース コンピュータと人間社会,日本,一般社団法人情報処理学会,2012年 3月 6日,p.4-133〜4-134
(58)【調査した分野】(Int.Cl.,DB名)
互いに対応付けられた複数の属性の属性値の組の集合が与えられ、前記複数の属性のうち1つの属性が指定されたときに、指定されていない属性の属性値を、指定された属性の属性値の区分に従って集計した集計データを、前記指定されていない属性毎に生成する集計データ生成手段と、
前記集計データをクラスタリングするクラスタリング手段と、
前記指定された属性をX軸として、クラスタリングの結果得られたクラスタ毎に、前記集計データをヒートマップとして表示する表示手段と、
集計データの選択を受け付ける選択受付手段と、
選択された集計データに基づいて、表示対象とする集計データを絞り込む絞り込み手段とを備え、
前記絞り込み手段は、
選択された集計データとして表されるベクトルと、他の集計データとして表される各ベクトルとの距離に基づいて、表示対象とする集計データを絞り込む
ことを特徴とする表示システム。
互いに対応付けられた複数の属性の属性値の組の集合が与えられ、前記複数の属性のうち1つの属性が指定されたときに、指定されていない属性の属性値を、指定された属性の属性値の区分に従って集計した集計データを、前記指定されていない属性毎に生成し、
前記集計データをクラスタリングし、
前記指定された属性をX軸として、クラスタリングの結果得られたクラスタ毎に、前記集計データをヒートマップとして表示し、
集計データの選択を受け付け、
選択された集計データに基づいて、表示対象とする集計データを絞り込み、
表示対象とする集計データを絞り込むときに、選択された集計データとして表されるベクトルと、他の集計データとして表される各ベクトルとの距離に基づいて、表示対象とする集計データを絞り込む
ことを特徴とする表示方法。
【背景技術】
【0002】
データの表示方法として、3D Parallel Coordinatesやヒートマップでデータを表示する方法がある。
【0003】
一般に、ある属性をX軸としたヒートマップでは、Y軸は1つの属性のみを表す。身長をX軸とした場合、Y軸には、例えば、体重という1つの属性のみが表される。
【0004】
なお、属性には、連続型変数の属性と、カテゴリ型変数の属性とがある。連続型変数の属性値は、数値である。また、カテゴリ型変数の属性値は、項目である。上記の例における「体重」は、連続型変数の属性である。カテゴリ型変数の属性の例として、例えば、「性別」が挙げられ、その属性値は「男性」または「女性」という項目である。ヒートマップのY軸で表される属性は「性別」等のカテゴリ型変数の属性であってもよい。その場合、Y軸には、「男性」および「女性」という各項目が表される。例えば、身長をX軸とした場合、身長を表すX軸を区切った区分毎に、「男性」という項目、「女性」という項目のカウント値がヒートマップとして表現される。
【0005】
図15は、Y軸が連続型変数の属性を表すヒートマップの例を示す模式図である。
図15に示す例では、「時間」をX軸とし、「客数」をY軸としている。「客数」は、連続型変数の属性である。
【0006】
図16は、Y軸がカテゴリ型変数の属性を表すヒートマップの例を示す模式図である。
図16に示す例では、「時間」をX軸とし、「店舗コード」をY軸としている。「店舗コード」は、カテゴリ型変数の属性であり、その属性値は「店舗A」、「店舗B」、・・・等の項目である。
図16に示す例では、予め、例えば、時間帯と、「店舗A」等の項目とを対応付けたデータの集合が与えられ、個々の時間帯に対応する「店舗A」のカウント値、「店舗B」のカウント値等がヒートマップとして表現される。
図16に示す例においても、Y軸は、「店舗コード」という1つの属性のみを表している。
【0007】
また、特許文献1には、画素データを、K−means法に基づくクラスタリング処理によって、複数のクラスタに分類することが記載されている。
【0008】
また、特許文献2には、外れ値検出可視化ツールとしてヒートマップを用いることが記載されている。
【発明を実施するための形態】
【0017】
以下、図面を参照して本発明の実施形態を説明する。以下、本発明の表示システムを操作する者を操作者と記す。
【0018】
実施形態1.
図1は、本発明の第1の実施形態の表示システムの構成例を示すブロック図である。本実施形態の表示システム1は、指定受付手段2と、集計データ生成手段3と、分解手段4と、クラスタリング手段5と、表示手段6とを備える。
【0019】
表示システム1には、互いに対応付けられた複数の属性の属性値の組の集合が入力データとして入力される。
図2は、入力データの例を示す模式図である。入力データは、
図2に示すように、テーブルとして表現することができる。
図2に示す例では、属性として、「日付」、「降水量」、「気温」、「販売促進キャンペーン」、「客数」、「風速」を例示しているが、属性の例は、
図2に示す例に限定されない。
図2に示す例では、「日付」として年月日を示しているが、「年」、「月」、「日」がそれぞれ独立した属性であってもよい。
図2に示す各行において、「日付」、「降水量」、「気温」、「販売促進キャンペーン」、「客数」、「風速」の属性値が互いに対応付けられている。すなわち、
図2に示す個々の行は、属性値の組を表している。
図2に示す行番号は、属性値の組のIDである。また、「日付」等の各属性は、テーブルの列に対応する。
図2に例示する属性のうち、「販売促進キャンペーン」は、カテゴリ型変数の属性であり、他の属性は、連続型変数の属性である。以下の説明では、「祭り」、「テレビコマーシャル」、「なし」、「おまけ配布」、「クーポン配布」、「雑誌広告」、「新聞広告」の各項目が、「販売促進キャンペーン」の属性値であるものとして説明する。なお、入力データには、連続型変数の属性のみ、あるいは、カテゴリ型変数の属性のみがふくまれていてもよい。
【0020】
指定受付手段2は、入力データに含まれる複数の属性のうち1つの属性の指定を、入力デバイス(
図1において図示略)を介して操作者から受け付ける。操作者によって指定された属性を、指定属性と記す。指定受付手段2は、指定属性を、ヒートマップのX軸に対応する属性として決定する。
【0021】
集計データ生成手段3は、指定受付手段2が操作者から属性の指定を受け付けると、指定属性以外の属性の属性値を指定属性の属性値の区分に従って集計した集計データを生成する。集計データ生成手段3は、集計データを指定属性以外の属性毎に生成する。指定属性として指定されたときの区分は、属性毎に予め定められている。連続型変数の属性の場合、取り得る属性値を所定間隔で区切ることによって個々の区分を定めておけばよい。例えば、「日付」の場合、「2014年6月1日〜2014年6月30日」、「2014年7月1日〜2014年7月31日」等ように1カ月毎に属性値を区切ることによって、区間を予め定めておけばよい。また、例えば、「気温」の場合「0℃〜5℃」、「5℃〜10℃」等のように、一定間隔で属性値を区切ることによって区間を予め定めておけばよい。カテゴリ型変数の場合には、個々の属性値を1つの区分として定めておけばよい。
【0022】
集計データ生成手段3は、連続型変数の属性に関して集計データを生成する場合、指定属性の属性値の区分毎に、区分に対応する属性値の統計値を集計値として算出することによって、集計データを生成する。連続型変数の属性に関しては、区分に対応する属性値の統計値を算出することが、区分に従った属性値の集計に該当する。以下、この統計値が平均値である場合を例にして説明する。
【0023】
例えば、指定属性が「日付」であるとする。集計データ生成手段3は、連続型変数である降水量の集計データを生成する場合、
図2に例示する入力データを参照し、「2014年6月1日〜2014年6月30日」という区分に対応する降水量の平均値を集計値として算出し、「2014年7月1日〜2014年7月31日」等の他の区分に関しても同様に、区分毎に、降水量の平均値を算出する。集計データ生成手段3は、区分毎に得られた降水量の平均値を要素とするベクトルを、降水量の集計データとする。
【0024】
また、例えば、指定属性が「気温」であるとする。集計データ生成手段3は、連続型変数である降水量の集計データを生成する場合、
図2に例示する入力データを参照し、「0℃〜5℃」という区分に対応する降水量の平均値を集計値として算出し、「5℃〜10℃」等の他の区分に関しても同様に、区分毎に、降水量の平均値を算出する。集計データ生成手段3は、区分毎に得られた降水量の平均値を要素とするベクトルを、降水量の集計データとする。
【0025】
上記の例から分かるように、連続型変数の属性の集計データは、区分数の次元のベクトルとして表される。集計データ生成手段3は、平均値を区分の順に並べたベクトルを、集計データとする。
【0026】
上記の2つの例では、降水量の集計データを生成する場合を例にして説明したが、集計データ生成手段3は、降水量以外の他の連続型変数の属性に関しても、同様に集計データを生成する。
【0027】
集計データ生成手段3は、カテゴリ型変数の属性に関して集計データを生成する場合、指定属性の属性値の区分毎に、区分に対応するカテゴリ型変数の属性値である項目の数をカウントし、そのカウント値を集計値として算出することによって、集計データを生成する。カテゴリ型変数の属性に関しては、区分に対応する項目の数を項目別にカウントすることが、区分に従った属性値の集計に該当する。
【0028】
例えば、指定属性が「日付」であるとする。集計データ生成手段3は、カテゴリ型変数である「販売促進キャンペーン」の集計データを生成する場合、
図2に例示する入力データを参照し、「2014年6月1日〜2014年6月30日」という区分に対応する「祭り」という項目(属性値)の数、「テレビコマーシャル」という項目の数等を、項目毎にそれぞれカウントする。集計データ生成手段3は、「2014年7月1日〜2014年7月31日」等の他の区分に関しても同様に、区分毎に、区分に対応する各項目の数をカウントする。この結果、1つの項目について、区分数と同数のカウント値が得られ、そのカウント値を区分の順に並べたベクトルが得られる。このベクトルの次元数は、区分数と同数である。集計データ生成手段3は、項目毎のベクトルの集合を、「販売促進キャンペーン」の集計データとする。
【0029】
また、例えば、指定属性が「気温」であるとする。集計データ生成手段3は、カテゴリ型変数である「販売促進キャンペーン」の集計データを生成する場合、
図2に例示する入力データを参照し、「0℃〜5℃」という区分に対応する「祭り」という項目(属性値)の数、「テレビコマーシャル」という項目の数等を、項目毎にそれぞれカウントする。集計データ生成手段3は、「5℃〜10℃」等の他の区分に関しても同様に、区分毎に、区分に対応する各項目の数をカウントする。上記の例と同様に、1つの項目について、区分数と同数のカウント値が得られ、そのカウント値を区分の順に並べたベクトルが得られる。このベクトルの次元数は、区分数と同数である。集計データ生成手段3は、項目毎のベクトルの集合を、「販売促進キャンペーン」の集計データとする。
【0030】
上記の2つの例では、「販売促進キャンペーン」の集計データを生成する場合を例にして説明したが、集計データ生成手段3は、他のカテゴリ型変数の属性に関しても、同様に集計データを生成する。
【0031】
分解手段4は、属性毎に生成された集計データを、連続型変数の集計データと、カテゴリ型変数の集計データとに分類する。分解手段4は、1つのベクトルとして表されている集計データを、連続型変数の集計データとして分類し、複数のベクトルの集合として表されている集計データを、カテゴリ型変数の集計データとして分類すればよい。分解手段4は、分類した集計データに対して、連続型変数の属性の集計データであるのか、カテゴリ型変数の属性の集計データであるのかを示すラベル情報を付加してもよい。以下、分解手段4が、分類した集計データにこのようなラベル情報を付加するものとして説明する。
【0032】
さらに、分解手段4は、カテゴリ型変数の属性の集計データを項目毎に分解する。前述のように、カテゴリ型変数の属性の集計データは、項目毎のベクトルの集合である。分解手段4は、この集合を、1つ1つのベクトルに分解すればよい。分解手段4は、この分解後の集計データ(項目毎の個々のベクトル)にも、カテゴリ型変数の属性のデータであることを示すラベル情報を引き継がせる。
【0033】
連続型変数の属性の集計データとして得られるベクトルの次元と、カテゴリ型変数の属性の集計データを項目毎に分解した結果得られるベクトルの次元は、共通である。
【0034】
クラスタリング手段5は、連続型変数の属性の集計データとして得られる各ベクトル、および、カテゴリ型変数の属性の集計データを項目毎に分解した結果得られるベクトルをそれぞれ正規化する。正規化の方法は、特に限定されない。例えば、クラスタリング手段5は、ベクトル毎に、ベクトル内の要素が0〜1の範囲の値になるように、ベクトル内の要素を変換してもよい。また、例えば、クラスタリング手段5は、ベクトル毎に、ベクトル内の個々の要素からそれらの要素の平均値を減算し、各減算結果を要素の分散で除算してもよい。
【0035】
そして、クラスタリング手段5は、連続型変数の属性の集計データを正規化したベクトルと、カテゴリ型変数の属性の集計データを項目毎に分解し、さらに正規化して得られたベクトルとを対象にして、クラスタリングを行う。クラスタリングの結果得られるクラスタには、連続型変数の属性のラベル情報が付加されたベクトルと、カテゴリ型変数の属性のラベル情報が付加されたベクトルとが混在していてよい。
【0036】
クラスタリング手段5は、例えば、K−means法によって、各ベクトルをクラスタリングすればよい。なお、クラスタリングの方法はK−means法に限定されず、クラスタリング手段5は、他の方法で各ベクトルをクラスタリングしてもよい。
【0037】
表示手段6は、クラスタリングの結果得られたクラスタ毎に、集計データ(分解や正規化が行われたベクトル)をヒートマップとして表示する。このとき、表示手段6は、指定受付手段2に対して指定された属性をX軸とし、他の属性や項目(カテゴリ型変数の属性の項目)をY軸としてヒートマップを表示する。表示手段6は、ヒートマップとともに属性名あるいは項目名も表示する。データにラベル情報を付加している場合、表示手段6は、ラベル情報も表示する。
【0038】
指定受付手段2、集計データ生成手段3、分解手段4、クラスタリング手段5、表示手段6は、例えば、入力デバイスおよびディスプレイ装置をするコンピュータのCPUによって実現される。この場合、CPUは、例えば、コンピュータのプログラム記憶装置(
図1において図示略)等のプログラム記録媒体から表示プログラムを読み込み、その表示プログラムに従って、指定受付手段2、集計データ生成手段3、分解手段4、クラスタリング手段5、表示手段6として動作すればよい。なお、表示手段6に関しては、ディスプレイ装置に表示を実行させる部分が、CPUによって実現される。また、各手段が、それぞれ別々のハードウェアで実現されていてもよい。
【0039】
図3は、第1の実施形態の表示システム1の処理経過の例を示すフローチャートである。互いに対応付けられた複数の属性の属性値の組の集合(例えば、
図2参照)が入力データとして、予め表示システムに入力されているものとする。
【0040】
最初に、指定受付手段2は、入力データに含まれる複数の属性のうち1つの属性の指定を操作者から受け付ける(ステップS1)。
図4は、第1の実施形態における表示システム1の表示画面の例を示す模式図である。表示画面は、ヒートマップ表示領域21と、属性指定領域22とを有する。
図4では、まだ、ヒートマップが表示されていない状態を示している。属性指定領域22は、ヒートマップのX軸に対応する属性の指定を行うための領域である。例えば、属性指定領域22には、入力データに含まれる各属性がそれぞれラジオボタンとともに表示される。この場合、操作者が指定する属性のラジオボタンをクリック等したときに、指定受付手段2は、その属性が指定されたと判定し、その属性を、ヒートマップのX軸に対応する属性として決定する。なお、例えば、表示手段6が、
図4に例示する表示画面をディスプレイ装置に表示させる。
【0041】
次に、集計データ生成手段3は、指定属性(ステップS1で指定された属性)以外の属性毎に、集計データを作成する(ステップS2)。
【0042】
既に説明したように、連続型変数の属性に関して集計データを生成する場合、集計データ生成手段3は、指定属性の属性値の区分毎に、区分に対応する属性値の統計値を集計値として算出することによって、集計データとなるベクトルを生成する。
【0043】
また、カテゴリ型変数の属性に関して集計データを生成する場合、集計データ生成手段3は、指定属性の属性値の区分毎に、区分に対応するカテゴリ型変数の項目(カテゴリ型変数の属性値)の数をカウントし、カウント値を区分順に並べたベクトルを項目毎に得る。集計データ生成手段3は、このベクトルの集合を、カテゴリ型変数の属性の集計データと定める。
【0044】
図5は、ステップS1で「日付」が指定された場合における他の各属性(
図2に例示する「降水量」等の各属性)の集計データを示す模式図である。集計データは、ベクトル、またはベクトルの集合として得られるが、
図5では、ヒートマップの表示態様で集計データを模式的に示している。
図5に示す個々の段が、1つのベクトルに対応する。これらの点は、後述の、
図6、
図7においても同様である。「降水量」、「気温」、「客数」および「風速」は、連続型変数の属性であるので、その集計データは1つのベクトルで表される。「販売促進キャンペーン」は、カテゴリ型変数の属性であるので、その集計データは複数のベクトルの集合で表される(
図5に示す例では、複数の段で表される)。また、
図5では、「日付」が指定された場合を例にして示しているが、指定属性(X軸に該当する属性)は、「日付」に限定されず、任意の属性でよい。
【0045】
次に、分解手段4は、属性毎に生成された集計データを、連続型変数の集計データと、カテゴリ型変数の集計データとに分類し、カテゴリ型変数の属性の集計データを項目毎に分解する(ステップS3)。このとき、分解手段4は、分類した集計データに、連続型変数の属性の集計データであるのか、カテゴリ型変数の属性の集計データであるのかを示すラベル情報を付加してもよい。分解手段4は、分解後の集計データ(項目毎の個々のベクトル)にも、カテゴリ型変数の属性のデータであることを示すラベル情報を引き継がせる。以下、カテゴリ型変数の属性の集計データを項目毎に分解した結果得られるデータを、項目の集計データと記す場合がある。
【0046】
図5に示す例では、カテゴリ型変数の属性の集計データは、「祭り」、「テレビコマーシャル」、「なし」、・・・等の7つの項目毎に得られたベクトルの集合である。従って、分解手段4は、そのベクトルの集合を、個々の項目に対応する7つのベクトルに分解すればよい。
【0047】
図6は、
図5に模式的に示す集計データに対して、ステップS3の処理を行った後の状態を示す模式図である。
図6に示す「P」は、連続型変数の属性の集計データであることを示すラベル情報である。
図6に示す「Q」は、カテゴリ型変数の属性のデータであることを示すラベル情報である。
【0048】
次に、クラスタリング手段5は、連続型変数の属性の集計データと、各項目の集計データに対して、クラスタリングを行う(ステップS4)。具体的には、クラスタリング手段5は、まず、連続型変数の属性の集計データとして得られる各ベクトル、および、各項目の集計データとして得られる各ベクトルをそれぞれ正規化する。そして、クラスタリング手段5は、連続型変数の属性の集計データを正規化した各ベクトルと、個々の項目の集計データを正規化した各ベクトルとを対象にして、クラスタリングを行う。クラスタリング手段5は、例えば、K−means法によって、各ベクトルをクラスタリングすればよい。
【0049】
図7は、
図6に模式的に示す集計データに対して、ステップS4のクラスタリング処理を実行した結果を示す模式図である。
図7では、連続型変数の属性の集計データ、および、各項目の集計データが、7つのクラスタに分類した場合を例示している。
【0050】
次に、表示手段6は、クラスタ毎に、集計データをヒートマップとして、表示する(ステップS5)。ステップS5において、表示手段6は、ステップS1で指定された属性をX軸(横軸)とし、他の属性や項目をY軸(縦軸)としてヒートマップを表示する。表示手段6は、ディスプレイ装置に表示させる画面(
図4参照)内のヒートマップ表示領域21にヒートマップを表示させる。
図8は、ステップS5で表示されるヒートマップの例を示す模式図である。
【0051】
本実施形態の表示システム1は、連続型変数の属性の集計データや、カテゴリ型変数の属性の各項目の集計データをクラスタリングし、その結果得られるクラスタ毎に集計データをヒートマップとして表示する。従って、表示システム1の操作者(すなわち、ヒートマップの観察者)は、複数の属性において、変化のパターンが類似する属性を容易に把握することができる。また、カテゴリ型変数の属性の集計データは、その属性の個々の項目(属性値)毎の集計データに分解される。従って、連続型変数の属性や、カテゴリ型変数の属性の各項目に関して、変化のパターンが類似している属性および項目を操作者が容易に把握できる。
【0052】
図9は、クラスタ毎に表示された集計データのヒートマップの例を示す図である。
図9に示すヒートマップが表示された場合、操作者は、7月から9月頃に関して、
図9に示す5つの属性の集計値がいずれも高くなると容易に把握することができる。また、操作者は、
図9に示す上段のクラスタのヒートマップから、売上が客数に比例する商品は商品Aのみであり、そのクラスタに含まれていない商品B,C,D・・・等(図示略)に関しては、売上が客数に比例しないと判断することができる。また、例えば、操作者は、
図9に示す下段のクラスタのヒートマップから、湿度と気温が高いと、最高不快指数も高くなる傾向にあるということを把握できる。
【0053】
実施形態2.
図10は、本発明の第2の実施形態の表示システムの構成例を示すブロック図である。第1の実施形態における要素と同様の要素については、
図1と同一の符号を付し、説明を省略する。本実施形態の表示システム1は、第1の実施形態における各要素(
図1参照)に加え、選択受付手段7と、絞り込み手段8とを備える。
【0054】
選択受付手段7は、集計データの選択を、入力デバイス(
図10において図示略)を介して操作者から受け付ける。選択候補となる集計データは、指定属性以外の連続型変数の属性の集計データや、指定属性以外のカテゴリ型変数の属性の各項目の集計データである。
【0055】
図11は、第2の実施形態における表示システム1の表示画面の例を示す模式図である。第2の実施形態における表示画面は、ヒートマップ表示領域21および属性指定領域22に加えて、集計データ選択領域23を含む。例えば、表示手段6が、
図11に例示する表示画面をディスプレイ装置に表示させる。例えば、表示手段6は、指定属性以外の連続型変数の各属性や、指定属性以外のカテゴリ型変数の属性の各項目が、それぞれラジオボタンとともに表示させる。この場合、操作者が、連続型変数の属性のうちの1つ、あるいは、カテゴリ型変数の属性の各項目のうちの1つに対応するラジオボタンをクリックしたときに、集計データ選択領域23は、クリックされたラジオボタンに対応する属性または項目の集計データが選択されたと判定する。
【0056】
絞り込み手段8は、操作者に選択された集計データに基づいて、表示対象とする集計データを絞り込む。第1の実施形態で述べたように、連続型変数の属性の集計データも、カテゴリ型変数の属性の各項目の集計データも、ベクトルとして定められる。絞り込み手段8は、選択された集計データに該当するベクトルと、他の集計データに該当するベクトルとの距離を、選択された集計データ以外の集計データ毎に算出し、その距離に基づいて、表示対象とする集計データを絞り込む。ここで、ベクトル同士の距離を算出する際に用いるベクトルは、クラスタリング手段5によって正規化が行われたベクトルである。
【0057】
絞り込み手段8は、操作者に選択された集計データを表示対象として定める。さらに、絞り込み手段8は、選択された集計データに該当するベクトルと、他の集計データに該当するベクトルとの距離が、閾値以下であることを条件として、当該他の集計データを表示対象として定める。すなわち、選択された集計データに該当するベクトルと、他の集計データに該当するベクトルとの距離が閾値を超えている場合、当該他の集計を表示対象から除外する。この結果、表示対象となる集計データが絞り込まれる。
【0058】
表示手段6は、絞り込み手段8によって絞り込まれた集計データのみ(すなわち、表示対象として定められた集計データのみ)を、ヒートマップとして表示する。
【0059】
図12は、
図8に例示するヒートマップの表示後に、表示対象とする集計データを絞り込んだ場合のヒートマップの表示例を示す模式図である。表示対象とする集計データが絞り込まれることによって、ヒートマップとして表示される属性や項目の数が減少する。なお、
図12に示す例では、
図8に示すクラスタ1,2,5に属する集計データが全て表示される場合を示している。しかし、集計データの絞り込みの結果、絞り込み前のクラスタに属する集計データの一部が表示対象から除外される場合もある。
【0060】
また、前述の閾値は、予め定められた固定値であってもよい。あるいは、操作者が閾値を選択できる構成であってもよい。
図11に示す例では、集計データ選択領域23内に、操作者が閾値を選択するためのGUI(Graphic User Interface)として、スライダ24が表示される場合を示している。選択受付手段7は、集計データの選択とともに、スライダ24を介して閾値の選択も受け付けてよい。なお、閾値を選択するためのGUIは、スライダ24でなくてもよい。また、閾値が固定値である場合、閾値を選択するためのGUIは表示されなくてよい。
【0061】
選択受付手段7および絞り込み手段8は、例えば、表示プログラムに従って動作するCPUによって実現される。また、選択受付手段7および絞り込み手段8を含む各手段が、それぞれ別々のハードウェアで実現されていてもよい。
【0062】
第2の実施形態の表示システム1は、操作者によって選択された集計データと類似する集計データを絞り込んで、ヒートマップとして表示する。従って、操作者は、着目している集計データと類似する集計データと変化のパターンが類似している属性や項目をさらに容易に把握することができる。
【0063】
図13は、本発明の各実施形態に係るコンピュータの構成例を示す概略ブロック図である。コンピュータ1000は、CPU1001と、主記憶装置1002と、補助記憶装置1003と、インタフェース1004と、ディスプレイ装置1005と、入力デバイス1006とを備える。入力デバイス1006は、例えば、ラジオボタンやスライダ24を操作するためのマウス等である。
【0064】
上述の表示システム1は、コンピュータ1000に実装される。表示システム1の動作は、プログラム(表示プログラム)の形式で補助記憶装置1003に記憶されている。CPU1001は、プログラムを補助記憶装置1003から読み出して主記憶装置1002に展開し、そのプログラムに従って上記の処理を実行する。
【0065】
補助記憶装置1003は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例として、インタフェース1004を介して接続される磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ1000に配信される場合、配信を受けたコンピュータ1000がそのプログラムを主記憶装置1002に展開し、上記の処理を実行してもよい。
【0066】
また、プログラムは、前述の処理の一部を実現するためのものであってもよい。さらに、プログラムは、補助記憶装置1003に既に記憶されている他のプログラムとの組み合わせで前述の処理を実現する差分プログラムであってもよい。
【0067】
次に、本発明の最小構成について説明する。
図14は、本発明の表示システムの最小構成の例を示すブロック図である。本発明の表示システムは、集計データ生成手段53と、クラスタリング手段55と、表示手段56とを備える。
【0068】
集計データ生成手段53(例えば、集計データ生成手段3)は、互いに対応付けられた複数の属性の属性値の組の集合が与えられ、複数の属性のうち1つの属性が指定されたときに、指定されていない属性の属性値を、指定された属性の属性値の区分に従って集計した集計データを、指定されていない属性毎に生成する。
【0069】
クラスタリング手段55(例えば、クラスタリング手段5)は、集計データをクラスタリングする。
【0070】
表示手段56(例えば、表示手段6)は、指定された属性をX軸として、クラスタリングの結果得られたクラスタ毎に、集計データをヒートマップとして表示する。
【0071】
そのような構成により、表示システムの操作者(換言すれば、ヒートマップの観察者)は、複数の属性において、変化のパターンが類似する属性を容易に把握できる。
【0072】
また、集計データ生成手段53が、指定されていない属性のうち、連続型変数の属性に関しては、指定された属性の属性値の区分毎に、対応する属性値の統計値を集計値として算出し、指定されていない属性のうち、カテゴリ型変数の属性に関しては、指定された属性の属性値の区分毎に、対応するカテゴリ型変数の属性の属性値である個々の項目のカウント値を、集計値として算出し、カテゴリ型変数の属性の集計データを、項目毎に分解する分解手段(例えば、分解手段4)を備え、クラスタリング手段55が、分解後のカテゴリ型変数の属性の集計データと、連続型変数の属性の集計データとをクラスタリングする構成であってもよい。
【0073】
また、複数の属性のうちの1つの属性の指定を受け付ける指定受付手段(例えば、指定受付手段2)を備える構成であってもよい。
【0074】
また、集計データの選択を受け付ける選択受付手段(例えば、選択受付手段7)と、選択された集計データに基づいて、表示対象とする集計データを絞り込む絞り込み手段(絞り込み手段8)とを備える構成であってもよい。
【0075】
また、絞り込み手段が、選択された集計データとして表されるベクトルと、他の集計データとして表される各ベクトルとの距離に基づいて、表示対象とする集計データを絞り込む構成であってもよい。
【0076】
また、絞り込み手段が、選択された集計データを表示対象として定めるとともに、選択された集計データとして表されるベクトルと、他の集計データとして表されるベクトルとの距離が閾値以下であることを条件に、当該他の集計データを表示対象として定める構成であってもよい。
【0077】
また、選択受付手段が、集計データの選択とともに、閾値の選択も受け付ける構成であってもよい。