(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024160650
(43)【公開日】2024-11-14
(54)【発明の名称】分析装置、分析方法及び分析プログラム
(51)【国際特許分類】
G09C 1/00 20060101AFI20241107BHJP
【FI】
G09C1/00 650Z
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2023075877
(22)【出願日】2023-05-01
(71)【出願人】
【識別番号】399035766
【氏名又は名称】エヌ・ティ・ティ・コミュニケーションズ株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】田中 哲士
(72)【発明者】
【氏名】櫻井 陽一
(72)【発明者】
【氏名】澤田 匡史
(57)【要約】
【課題】回帰式の各項の値が直感的に明確に表現されるノモグラムを得ること。
【解決手段】実施形態の分析装置は、作成部及び出力制御部を有する。作成部は、秘密計算による回帰分析によって得られた回帰モデルの属性値と回帰係数との積である点数を示す線分を、対応する回帰係数の符号に応じた向きで配置し、前記線分上に、対象の点数に応じた位置に点をプロットしたノモグラムを作成する。出力制御部は、作成されたノモグラムを出力する。
【選択図】
図5
【特許請求の範囲】
【請求項1】
秘密計算による回帰分析によって得られた回帰モデルの属性値と回帰係数との積である点数を示す線分を、対応する回帰係数の符号に応じた向きで配置し、前記線分上に、対象の点数に応じた位置に点をプロットしたノモグラムを作成する作成部と、
前記ノモグラムを出力する出力制御部と、
を有することを特徴とする分析装置。
【請求項2】
前記作成部は、前記線分のうち、対応する回帰係数の符号が正である線分を、前記線分に垂直な軸を始点として第1の方向に延びるように配置し、対応する回帰係数の符号が負である線分を、前記線分に垂直な軸を始点として前記第1の方向と反対の方向に延びるように配置することを特徴とする請求項1に記載の分析装置。
【請求項3】
前記作成部は、前記線分のうち、第1の属性値に対応する線分の始点を、第2の属性値に対応する線分上にプロットされた点の位置に合わせて配置することを特徴とする請求項1に記載の分析装置。
【請求項4】
分析装置によって実行される分析方法であって、
秘密計算による回帰分析によって得られた回帰モデルの属性値と回帰係数との積である点数を示す線分を、対応する回帰係数の符号に応じた向きで配置し、前記線分上に、対象の点数に応じた位置に点をプロットしたノモグラムを作成する作成工程と、
前記ノモグラムを出力する出力制御工程と、
を含むことを特徴とする分析方法。
【請求項5】
秘密計算による回帰分析によって得られた回帰モデルの属性値と回帰係数との積である点数を示す線分を、対応する回帰係数の符号に応じた向きで配置し、前記線分上に、対象の点数に応じた位置に点をプロットしたノモグラムを作成する作成ステップと、
前記ノモグラムを出力する出力制御ステップと、
をコンピュータに実行させることを特徴とする分析プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、分析装置、分析方法及び分析プログラムに関する。
【背景技術】
【0002】
従来、データを秘匿したまま統計的な演算を行い、演算の結果得られた統計量をユーザに提供する秘密計算システムが知られている。例えば、秘密計算システムは、重要な個人情報を取り扱う医療分野等におけるデータの分析に利用される場合がある。
【0003】
また、暗号化された状態のデータに対し統計処理を行う秘密計算システムが知られている。例えば、暗号化された状態のデータを使って、ロジスティック回帰分析のパラメータを求める技術が知られている(例えば、特許文献2を参照)。
【0004】
また、回帰分析の予測値をノモグラムによって表す手法が知られている(例えば、非特許文献2を参照)。また、ノモグラムを作成するための関数を備えたパッケージソフトである「rms」が知られている(例えば、非特許文献3を参照)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】国際公開第2019/124260号
【特許文献2】特開2020-042128号公報
【非特許文献】
【0006】
【非特許文献1】日本電信電話株式会社,秘密計算のシステムとその原理, [online],[令和5年1月6日検索]、インターネット<URL:https://www.rd.ntt/sil/project/sc/secure_computation.html>
【非特許文献2】株式会社 社会情報サービス,統計用語集 ノモグラム, [online],[令和5年1月6日検索]、インターネット<URL:https://bellcurve.jp/statistics/glossary/5644.html>
【非特許文献3】Package ‘rms’ February 9, 2023, [online],[令和5年3月27日検索]、インターネット<https://cran.r-project.org/web/packages/rms/rms.pdf#Rfn.nomogram.1>
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、従来のノモグラムには、回帰式の各項の値が直感的に明確に表現されない場合があるという問題がある。
【0008】
ロジスティック回帰の回帰式の各項は、属性の値と回帰係数を掛けた値によって表される。また、回帰係数は正と負の両方の値を取り得る。そのため、回帰式の各項の値についても、正と負の両方の値を取り得る。
【0009】
非特許文献2に示されるように、従来のノモグラムでは、回帰係数が負になると、メモリの大小関係が逆向きになる。このため、回帰係数が負であるか正であるかが、直感的に明確ではない。特に、符号が併記されていなければ、回帰係数が負であるか否かが不明である。
【課題を解決するための手段】
【0010】
上述した課題を解決し、目的を達成するために、本発明の分析装置は、秘密計算による回帰分析によって得られた回帰モデルの属性値と回帰係数との積である点数を示す線分を、対応する回帰係数の符号に応じた向きで配置し、前記線分上に、対象の点数に応じた位置に点をプロットしたノモグラムを作成する作成部と、前記ノモグラムを出力する出力制御部と、を有することを特徴とする。
【発明の効果】
【0011】
本発明によれば、回帰式の各項の値が直感的に明確に表現されるノモグラムを得ることができる。
【図面の簡単な説明】
【0012】
【
図1】
図1は、実施形態に係る分析システムの構成例を示す図である。
【
図2】
図2は、実施形態に係る分析装置の構成例を示す図である。
【
図6】
図6は、実施形態に係る分析装置の処理の流れを示すフローチャートである。
【
図8】
図8は、分析プログラムを実行するコンピュータの一例を示す図である。
【発明を実施するための形態】
【0013】
以下に、本願に係る分析装置、分析方法及び分析プログラムの実施形態を図面に基づいて詳細に説明する。なお、本発明は、以下に説明する実施形態により限定されるものではない。
【0014】
まず、
図1を用いて、分析システムの構成を説明する。分析システムは、秘密計算を利用してデータの分析を行うためのシステムである。
【0015】
図1に示すように、分析システム1は、秘密計算システム10を含む。また、秘密計算システム10は、ネットワークNを介して提供装置20及び提供装置30と接続される。例えば、ネットワークNはインターネットである。また、秘密計算システム10は、端末装置40と接続される。
【0016】
提供装置20及び提供装置30は、データ提供者側の装置である。提供装置20及び提供装置30は、秘密計算システム10にデータを提供(登録)する。
【0017】
提供装置20及び提供装置30によって提供されるデータは、秘匿化されることが望ましい情報(例えば、個人の氏名、住所等の個人情報)を含む。例えば、提供装置20及び提供装置30は、医療機関で利用される診療データ又は健康診断データを提供する。ただし、提供装置20及び提供装置30によって提供されるデータは、医療機関で利用されるデータに限られない。
【0018】
秘密計算システム10は、データ蓄積部11及びデータ処理部12を有する。データ蓄積部11は、秘密分散によりデータを蓄積する複数の蓄積装置(蓄積装置111、蓄積装置112、蓄積装置113)を含む。また、データ処理部12は、秘密計算によりデータを処理する複数の計算装置(計算装置121、計算装置122、計算装置123)を含む。なお、蓄積装置の数及び計算装置の数は、
図1に示す例に限られない。
【0019】
秘密計算システム10は、非特許文献1(掲載URL:https://www.rd.ntt/sil/project/sc/secure_computation.html)に記載された方法に従って、秘密分散及び秘密計算を実行することができる。
【0020】
まず、秘密計算システム10に提供されたデータは、複数のシェアに分割される(断片化)。そして、複数のシェアのそれぞれは、データ蓄積部11に含まれる複数の蓄積装置に分散して蓄積される。
図1の例では、提供されたデータが3つのシェアに分割される。そして、蓄積装置111、蓄積装置112、蓄積装置113が、それぞれ1つずつシェアを蓄積する。
【0021】
データ処理部12は、データ蓄積部11に蓄積されたシェアに対し、秘密計算を実行する。データ処理部12は、複数の計算装置を使ったマルチパーティ計算により秘密計算を実行する。
図1の例では、データ処理部12は、計算装置121、計算装置122、計算装置123により秘密計算を実行する。
【0022】
データ処理部12は、シェアを復元することなく各種の統計演算を行うことができる。例えば、データ処理部12は、ソート、結合等のテーブルの操作、レコード数の集計、総和、平均、最大値、最小値、標本分散等の統計量の計算、t検定等の統計的検定を行うことができる。さらに、データ処理部12は、回帰分析及び主成分分析といった統計的分析を行うことができる。
【0023】
分析装置13は、データ処理部12を利用してデータの分析を行う。分析装置13は、データ処理部12によって実行された秘密計算の結果に基づき、分析結果をデータ利用者側の端末装置40に提供する。利用者は、端末装置40を介してデータの分析結果を得ることができる。
【0024】
例えば、秘密計算システム10には、個人ごとの属性及び身体に関するデータが提供される場合がある。属性及び身体に関するデータは秘匿化されることが望ましい個人情報である。属性及び身体に関するデータには、例えば年齢、性別、身長、体重等が含まれる。データ蓄積部11は、提供されたデータを断片化したシェアを各蓄積装置に格納する。
【0025】
なお、分割された個々のシェアは、単独では意味のないデータである。そのため、1つのシェアから元のデータを復元することはできない。一方、複数のシェアを揃えることで元のデータを復元することが可能になる。
【0026】
データの利用者は、登録されたデータそのものを閲覧することはできないが、分析装置13及び端末装置40を介して、データの分析結果を閲覧することができる。例えば、データに個人の性別及び体重が含まれている場合、利用者は、各個人の性別及び体重を閲覧することはできないが、データの分析結果である「男性の平均体重」を閲覧することができる。
【0027】
一例として、データ蓄積部11は、Shamirの閾値秘密分散法という手法を使って秘密分散を行うことができる。このとき、データ蓄積部11は、元のデータを切片とする多項式を通る3つの座標をシェアとして各サーバに保管する。また、多項式の傾きはランダムに決定されるため、元のデータが同じであってもシェアが毎回同じであるとは限らない。なお、元のデータは、数値であってもよいし、数値に変換済みのデータであってもよい。
【0028】
秘密計算システム10は、複数のシェアから元のデータを復元することができる。多項式が1次式であれば、秘密計算システム10は、2つの座標(シェアに相当)を結ぶ直線と軸との交点から切片(元のデータに相当)を求めることができる。一方で、1つの座標からは直線が定まらないため、元のデータを復元することはできない。
【0029】
また、前述の通り、データ処理部12は、シェアを復元することなく元のデータに対し秘密計算を実行することができる。例えば、座標で表されたシェア同士を加算した結果は、各シェアの元のデータ同士を加算した結果のシェアに相当する。
【0030】
分析装置13は、端末装置40からの要求に応じて、データ処理部12に秘密計算による処理を実行させる。なお、データ処理部12又は端末装置40が、分析装置13と同等の機能を実現してもよい。例えば、分析システム1は、分析装置13を有さない構成であってもよい。その場合、端末装置40がデータ処理部12と接続され、分析装置13と同等の処理を実行する。さらに、シェアに基づく統計演算は、データ処理部12ではなく端末装置40によって実行されてもよい。
【0031】
第1の実施形態では、分析装置13が秘密計算によりロジスティック回帰分析を行う場合の例を説明する。また、分析装置13は、ロジスティック回帰分析によって得られた回帰式を基に、ノモグラムを作成する。
【0032】
図2を用いて、分析装置13の構成を説明する。
図2は、実施形態に係る分析装置の構成例を示す図である。
【0033】
分析装置13の各部について説明する。
図2に示すように、分析装置13は、通信部131、入力部132、出力部133、記憶部134及び制御部135を有する。
【0034】
通信部131は、他の装置の間でデータの通信を行う。例えば、通信部131はNIC(Network Interface Card)である。通信部131は他の装置との間でデータの送受信を行うことができる。
【0035】
入力部132は、データの入力を受け付けるためのインタフェースである。入力部132は、例えばマウス及びキーボード等の入力装置と接続される。
【0036】
出力部133は、データを出力するためのインタフェースである。出力部133は、例えばディスプレイ及びスピーカ等の入力装置と接続される。
【0037】
記憶部134は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、光ディスク等の記憶装置である。なお、記憶部134は、RAM(Random Access Memory)、フラッシュメモリ、NVSRAM(Non Volatile Static Random Access Memory)等のデータを書き換え可能な半導体メモリであってもよい。記憶部134は、分析装置13で実行されるOS(Operating System)及び各種プログラムを記憶する。
【0038】
制御部135は、分析装置13全体を制御する。制御部135は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)等の電子回路や、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)等の集積回路である。また、制御部135は、各種の処理手順を規定したプログラムや制御データを格納するための内部メモリを有し、内部メモリを用いて各処理を実行する。
【0039】
制御部135は、各種のプログラムが動作することにより各種の処理部として機能する。例えば、制御部135は、計算部1351、更新部1352、作成部1353及び出力制御部1354を有する。
【0040】
計算部1351は、秘密計算によりロジスティック回帰の計算を行う。計算部1351は、ロジスティック回帰モデルに説明変数を入力し、目的変数を出力させる。
【0041】
図4に、以降の説明で使用する記号の定義を示す。
図4は、記号の定義を示す図である。
【0042】
図4に示すように、Nはレコード数である。kは属性(説明変数)の数である。教師データXは、N×k行列の各レコードの属性情報を含む。例えば、i番目のレコードは(x
1,…,x
k)である。
【0043】
結果は、あるレコードの生存又は死亡を示す情報である。tは観測時間である。yは0(生存)又は1(死亡)の2値である。
【0044】
偏回帰係数、切片、最大スケールは後に説明する計算で用いられる。最大スケールは定数(例えば100)である。
【0045】
対象データは、予測に用いられるデータであり、教師データには含まれない。
【0046】
(1)式にロジスティック回帰モデルの構造を示す。(1)式の左辺が目的変数である。
【0047】
【0048】
(1)式の両辺をロジット関数に入れることで、指数部分(expの後のかっこの内部)は多項式の形になる。
【0049】
多項式の切片β0及び偏回帰係数βjがロジスティック回帰モデルのパラメータである。また、xjがロジスティック回帰モデルの属性の値(属性値)であり、説明変数に相当する。すなわち、多項式は、切片の項と、偏回帰係数と属性値との積の項とを含む。
【0050】
なお、(1)式で示した属性の数は一例である。属性の数は1つ以上であればよい。
【0051】
更新部1352は、計算部1351によって計算された目的変数が、正解の値に近付くように、秘密計算によりロジスティック回帰モデルのパラメータを更新する。
【0052】
計算部1351と更新部1352の処理が1回又は複数回行われることにより、ロジスティック回帰モデルの学習が行われる。
【0053】
図3は、学習データの例を示す図である。
図3の「年齢」列、「性別」列、「摂取カロリー」列、「体重減少」列の値は、ロジスティック回帰モデルの説明変数である。また、「生存時間」列の値に基づく予測確率が、ロジスティック回帰モデルの目的変数である。
【0054】
計算部1351は、「年齢」列、「性別」列、「摂取カロリー」列、「体重減少」列の値をロジスティック回帰モデルに入力し、出力を得る。更新部1352は、計算部1351によって得られた出力が、「生存時間」列の値に基づく予測確率に近付くように、ロジスティック回帰モデルのパラメータを更新する。
【0055】
作成部1353は、ロジスティック回帰モデルの予測値(目的変数)を計算するためのノモグラムを作成する。ここでは、更新部1352によってロジスティック回帰モデルのパラメータは更新済みであるものとする。
【0056】
作成部1353は、更新済みの偏回帰係数βを取得する。また、ノモグラムを作成する対象(
図4の対象データ)の説明変数xを取得する。ここで作成部1353が取得した説明変数に対応する目的変数は未知であってよい。
【0057】
ここでは、説明変数(属性値)は、x
1、x
2、x
3、x
4の4つ(k=4)であるものとする。x
1、x
2、x
3、x
4は、それぞれ属性「年齢」、「性別」、「摂取カロリー」、「体重減少」の値であり、
図3の同名の列の値に対応する。属性値x
1、x
2、x
3、x
4のそれぞれに対応する偏回帰係数をw
1、w
2、w
3、w
4とする。
【0058】
属性値x1、x2、x3、x4を、それぞれ45、1、270、21とする。x1、x2、x3、x4を区別せずにxと表記する場合がある。また、偏回帰係数w1、w2、w3、w4のうち、w1、w2は正であり、w3、w4は負である。
【0059】
作成部1353が
図5に示すノモグラムを作成する手順を説明する。
図5は、ノモグラムの例を示す図である。
【0060】
まず、作成部1353は、各属性に対して属性の最大値xj
+を秘密計算の最大値で計算する。また、作成部1353は、各属性に対して属性の最小値xj
-を秘密計算の最小値で計算する。ただし、jは属性を区別するための数字である(j=1、2、3、4)。
【0061】
次に、作成部1353は、各属性に対して、(2)式又は(3)式により属性値と偏回帰係数の積であるzj
+及びzj
-を計算する。作成部1353は、偏回帰係数が正の場合は(2)式により計算を行い、偏回帰係数が負の場合は(3)式により計算を行う。
【0062】
【0063】
【0064】
続いて、作成部1353は、各属性に対して属性の幅djを(4)式により計算する。作成部1353は、秘密計算ではなく通常の減算により属性の幅を計算してよい。
【0065】
【0066】
さらに、作成部1353は、最大幅Dを(5)式により計算する。ここでは、属性「年齢」が最大幅Dを取る。
【0067】
【0068】
また、作成部1353は、点数のスケールSを(6)式により計算する。例えば、SCALEは100である。
【0069】
【0070】
ここで、作成部1353は、各属性の点数sjを(7)式により計算する。
【0071】
【0072】
そして、作成部1353は、合計点数POINTを(8)式により計算する。
【0073】
【0074】
また、作成部1353は、合計点数POINTから(9)式により予測確率pを計算する。
【0075】
【0076】
作成部1353は、合計点数の目盛りを軸631にプロットする。そして、作成部1353は、確率からポイントを逆変換し、予測確率の目盛りを計算し、軸641にプロットする。軸631に垂直かつ合計点数の目盛りを通る直線と、軸641との交点が予測確率に相当する。
【0077】
ノモグラムの描画方法について説明する。
図5に示すように、まず、作成部1353は、点数の軸611を配置する。軸611が示す点数の範囲は、-100から100までである。なお、軸は線分である。
【0078】
そして、作成部1353は、軸611に垂直であり、かつ軸611の点数が0である位置に接する軸612を配置する。
【0079】
ここで、作成部1353は、各属性に対応する線分であって、軸611に対して平行(軸612に対して垂直)な線分を配置する。線分621、線分622、線分623、線分624は、それぞれ属性「年齢」、「性別」、「摂取カロリー」、「体重減少」に対応する。
【0080】
作成部1353は、線分の端点が軸612に接するように配置する。そして、作成部1353は、対応する属性の回帰係数が正であれば、線分が、軸611との接点から軸611の正の方向(
図5の右方向)に延びるように配置する。逆に、作成部1353は、対応する属性の回帰係数が負であれば、線分が、軸611との接点から軸611の負の方向(
図5の左方向)に延びるように配置する。また、目盛り(×印)の位置は、回帰係数と属性値を掛けた値によって決まる。
【0081】
言い換えると、各属性に対応する線分は、軸61に対して平行な線分であって、かつ、回帰係数と属性値を掛けた値を軸61にプロットした点を通り、軸61に対して垂直な垂線と、軸61とに接する線分である。回帰係数及び属性値の符号によって、目盛りがプロットされる位置が、軸61の正側であるか負側であるかが決まる。
【0082】
このように、作成部1353は、秘密計算による回帰分析によって得られた回帰モデルの属性値と回帰係数との積である点数を示す線分を、対応する回帰係数の符号に応じた向きで配置し、線分上に、対象の点数に応じた位置に点(目盛りに相当)をプロットしたノモグラムを作成する。
【0083】
具体的には、作成部1353は、線分のうち、対応する回帰係数の符号が正である線分を、線分に垂直な軸を始点として第1の方向に延びるように配置し、対応する回帰係数の符号が負である線分を、線分に垂直な軸を始点として第1の方向と反対の方向に延びるように配置する。第1の方向は、
図5の軸611の正の方向である。
【0084】
出力制御部1354は、作成部1353によって作成されたノモグラムを出力する。すなわち、出力制御部1354は、
図5に示すノモグラムを、出力部133を介してディスプレイ等の表示装置に表示させる。
【0085】
図6は、実施形態に係る分析装置の処理の流れを示すフローチャートである。分析装置13は、秘密計算システム10によって行われた回帰分析の結果として、回帰係数を取得する。また、目的変数が未知の属性の値(説明変数)が与えられているものとする。
【0086】
まず、分析装置13は、属性と回帰係数の積の最大値及び最小値を計算する(ステップS101)。ここで、分析装置13は、最大値と最小値の幅が最大である属性を選択する(ステップS102)。
【0087】
次に、分析装置13は、回帰係数が正である属性について、各属性の値、選択した属性の幅、及び積の最小値を基に各属性の点数を計算する(ステップS103)。
【0088】
また、分析装置13は、回帰係数が負である属性について、各属性の値、選択した属性の幅、及び積の最大値を基に各属性の点数を計算する(ステップS104)。
【0089】
続いて、分析装置13は、全属性の総和と最小値の総和から合計点の目盛りを計算する(ステップS105)。さらに、分析装置13は、確率から点数を逆変換し、予測確率の目盛りを計算する(ステップS106)。
【0090】
[実施形態の効果]
これまで説明してきたように、分析装置13は、作成部1353及び出力制御部1354を有する。作成部1353は、秘密計算による回帰分析によって得られた回帰モデルの属性値と回帰係数との積である点数を示す線分を、対応する回帰係数の符号に応じた向きで配置し、線分上に、対象の点数に応じた位置に点をプロットしたノモグラムを作成する。出力制御部1354は、ノモグラムを出力する。
【0091】
また、作成部1353は、線分のうち、対応する回帰係数の符号が正である線分を、線分に垂直な軸を始点として第1の方向に延びるように配置し、対応する回帰係数の符号が負である線分を、線分に垂直な軸を始点として第1の方向と反対の方向に延びるように配置する。
【0092】
これにより、回帰係数の符号に応じて線分の延びる方向が変わるため、回帰式の各項の値が直感的に明確に表現される。
【0093】
[変形例]
作成部1353は、
図7に示すようなノモグラムを作成してもよい。
図7は、ノモグラムの例を示す図である。
図7のノモグラムにおいては、各属性の線分の端点の位置が
図5のノモグラムと異なる。
【0094】
各属性に対応する線分の、軸612側の端点を始点と呼び、軸612と反対側の端点を終点と呼ぶ。まず、作成部1353は、
図5と同様の方法で、属性「体重減少」に対応する線分624aを配置する。このとき、線分624aの始点は軸612に接する。また、作成部1353は、
図5と同じ方法で属性「体重減少」の目盛り(×印)をプロットする。
【0095】
次に、作成部1353は、属性「摂取カロリー」に対応する線分623aの始点を、属性「体重減少」の目盛りの位置に合わせる。具体的には、属性「体重減少」の目盛りを通る、軸612に垂直な直線上に、線分623aの始点を配置する。そして、
図5と同様に、配置された線分は、回帰係数の符号に応じた方向に延びる。
【0096】
このように、作成部1353は、線分のうち、第1の属性値(例えば、属性「体重減少」の値)に対応する線分の始点を、第2の属性値(例えば、属性「摂取カロリー」の値)に対応する線分上にプロットされた点の位置に合わせて配置する。また、作成部1353は、線分623aと同様に、線分622a、621aの配置及び目盛りのプロットを行う。
【0097】
図7のノモグラムでは、最後に配置される属性「年齢」の目盛りをプロットされた位置の点数が、合計点数を表す。線分621aに垂直かつ合計点数の目盛りを通る直線と、軸641との交点が予測確率に相当する。このように、
図7のノモグラムによれば、合計点数を直感的に把握しやすくなる。
【0098】
[システム構成等]
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散及び統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散又は統合して構成することができる。さらに、各装置にて行われる各処理機能は、その全部又は任意の一部が、CPU(Central Processing Unit)及び当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。なお、プログラムは、CPUだけでなく、GPU等の他のプロセッサによって実行されてもよい。
【0099】
また、本実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
【0100】
[プログラム]
一実施形態として、分析装置13は、パッケージソフトウェアやオンラインソフトウェアとして上記の分析処理を実行する分析プログラムを所望のコンピュータにインストールさせることによって実装できる。例えば、上記の分析プログラムを情報処理装置に実行させることにより、情報処理装置を分析装置13として機能させることができる。ここで言う情報処理装置には、デスクトップ型又はノート型のパーソナルコンピュータが含まれる。また、その他にも、情報処理装置にはスマートフォン、携帯電話機やPHS(Personal Handyphone System)等の移動体通信端末、さらには、PDA(Personal Digital Assistant)等のスレート端末等がその範疇に含まれる。
【0101】
また、分析装置13は、ユーザが使用する端末装置をクライアントとし、当該クライアントに上記の分析処理に関するサービスを提供する分析サーバ装置として実装することもできる。例えば、分析サーバ装置は、回帰係数及び属性値を入力とし、ノモグラムの画像を出力とする分析サービスを提供するサーバ装置として実装される。
【0102】
図8は、分析プログラムを実行するコンピュータの一例を示す図である。コンピュータ1000は、例えば、メモリ1010、CPU1020を有する。また、コンピュータ1000は、ハードディスクドライブインタフェース1030、ディスクドライブインタフェース1040、シリアルポートインタフェース1050、ビデオアダプタ1060、ネットワークインタフェース1070を有する。これらの各部は、バス1080によって接続される。
【0103】
メモリ1010は、ROM(Read Only Memory)1011及びRAM(Random Access Memory)1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、ハードディスクドライブ1090に接続される。ディスクドライブインタフェース1040は、ディスクドライブ1100に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ1100に挿入される。シリアルポートインタフェース1050は、例えばマウス1110、キーボード1120に接続される。ビデオアダプタ1060は、例えばディスプレイ1130に接続される。
【0104】
ハードディスクドライブ1090は、例えば、OS1091、アプリケーションプログラム1092、プログラムモジュール1093、プログラムデータ1094を記憶する。すなわち、分析装置13の各処理を規定するプログラムは、コンピュータにより実行可能なコードが記述されたプログラムモジュール1093として実装される。プログラムモジュール1093は、例えばハードディスクドライブ1090に記憶される。例えば、分析装置13における機能構成と同様の処理を実行するためのプログラムモジュール1093が、ハードディスクドライブ1090に記憶される。なお、ハードディスクドライブ1090は、SSD(Solid State Drive)により代替されてもよい。
【0105】
また、上述した実施形態の処理で用いられる設定データは、プログラムデータ1094として、例えばメモリ1010やハードディスクドライブ1090に記憶される。そして、CPU1020は、メモリ1010やハードディスクドライブ1090に記憶されたプログラムモジュール1093やプログラムデータ1094を必要に応じてRAM1012に読み出して、上述した実施形態の処理を実行する。
【0106】
なお、プログラムモジュール1093やプログラムデータ1094は、ハードディスクドライブ1090に記憶される場合に限らず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ1100等を介してCPU1020によって読み出されてもよい。あるいは、プログラムモジュール1093及びプログラムデータ1094は、ネットワーク(LAN(Local Area Network)、WAN(Wide Area Network)等)を介して接続された他のコンピュータに記憶されてもよい。そして、プログラムモジュール1093及びプログラムデータ1094は、他のコンピュータから、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。
【符号の説明】
【0107】
1 分析システム
10 秘密計算システム
11 データ蓄積部
12 データ処理部
13 分析装置
131 通信部
132 入力部
133 出力部
134 記憶部
135 制御部
1351 計算部
1352 更新部
1353 作成部
1354 出力制御部