【文献】
玉井 祐輔 外1名,他者の評価を考慮した情報の自律的交換およびランキング手法,情報処理学会 シンポジウム グループウェアとネットワークサービスワークショップ 2007 [online],日本,情報処理学会,2007年11月 8日,pp.107−112
(58)【調査した分野】(Int.Cl.,DB名)
前記データの価値を評価する手段は、各主体が所持するデータを、対象ごとにその特徴量のデータが行列配置されるマトリックスで表現できるとき、各主体間で少なくとも一つのデータを所持する行および列において不足するデータ同士を等価と評価することを特徴とする請求項1に記載のデータ交換支援装置。
前記データの価値を評価する手段は、各主体が所持するデータを、対象ごとにその特徴量のデータが行列に配置されるマトリックスで表現できるとき、各主体間で特徴量の異なるデータ同士の等価性を、各特徴量の概念辞書上での距離が近いほど高く評価することを特徴とする請求項1または2に記載のデータ交換支援装置。
【発明を実施するための形態】
【0021】
以下、図面を参照して本発明の実施の形態について詳細に説明する。
図1は、本発明の一実施形態に係るデータ交換支援装置1の主要部の構成を示した機能ブロック図であり、ここでは本発明の説明に不要な構成は図示が省略されている。本発明のデータ交換支援装置1は、データの等価交換を支援される各データ所持の主体(事業者)NとネットワークNW経由で接続されている。
【0022】
データ交換支援装置1において、データ管理部10は、データの等価交換に参加する主体Nが所持するデータ(所持データ)を管理する。所持データ評価部20は、各主体Nの所持データを絶対的または相対的に評価して、その価値を定量化する。
【0023】
データ交換順序決定手段30は、後に詳述するように、各主体Nの所持データの価値に基づいて、データの等価交換を相互に行う主体Nおよび共有主体Mの組み合わせペアならびにその順序を決定し、相互に所持データを等価交換できる主体同士を結合して各所持データを共有できる共有主体とする機能部と、この共有主体と相互に所持データを等価交換できる主体を当該共有主体と結合して各所持データを共有できる共有主体とし、これを繰り返す機能部とを有する。
【0024】
データ交換支援部40は、前記データ交換順序決定手段30による決定結果に基づいて、主体Nおよび共有主体Mの組み合わせペア間でのデータ交換を支援する。
【0025】
次いで、前記所持データ評価部20による所持データの評価方法を、一対の主体ペア(N1,N2)間での直接的なデータ交換を例にして説明する。実施形態では、各主体Nの所持データの配列を行(対象者)列(特徴量)のマトリックス配置で表現できるとき、各主体間で少なくとも一つのデータを所持する行および列において不足するデータ同士が等価と評価される。
【0026】
主体N1は、
図2(a)に示したように、2人の対象者U1,U2の特徴量として、それぞれ身長データD11,D21および体重データD12,D22を所持しているが、年齢データは所持していない。主体N2は、
図2(b)に示したように、2人の対象者U2,U3の特徴量として、それぞれ体重データD22,D32および年齢データD23,D33を所持しているが身長データは所持していない。本実施形態では、このような各主体Nにおけるデータの分散所持の状況がデータ管理部10にとって既知であるものとする。
【0027】
このようなデータの分散所持状況において、主体N2が所持するデータの主体N1にとっての価値を考えると、主体N1は対象者U2の体重データD22を既に所持しているので、主体N1にとって主体N2が所持する対象者U2の体重データD22は価値がない(×印、以下同様)。
【0028】
これに対して、主体N1は対象者U2の年齢データD23を所持しておらず、かつ対象者U2の身長データD21および体重データD22は所持しているので、主体N1にとって主体N2が所持する対象者U2の年齢データD23には特に価値がある(○印、以下同様)。
【0029】
また、主体N1は対象者U3の体重データD32を所持しておらず、かつ対象者U1,U2の体重データD12,D22は所持しているので、主体N1にとって主体N2が所持する対象者U3の体重データD32には特に価値がある。
【0030】
一方、主体N2が所持する対象者U3の年齢データD33は、初期の段階では主体N1にとって価値が無いものの、主体N1が対象者U3の身長データおよび体重データを別途に取得できるか、あるいは対象者U1,U2の年齢データを別途に取得できれば価値が高くなる。すなわち、主体N1にとって主体N2が所持する対象者U3の年齢データD33には潜在価値がある(△印、以下同様)。
【0031】
視点を変えて、主体N1が所持するデータの主体N2にとっての価値を考えると、主体N2は対象者U2の体重データD22を既に所持しているので、主体N2にとって主体N1が所持する対象者U2の体重データD22には価値がない。
【0032】
これに対して、主体N2は対象者U2の身長データD21を所持しておらず、かつ対象者U2の体重データD22および年齢データD23は所持しているので、主体N2にとって主体N1が所持する対象者U2の身長データD21は特に価値がある。
【0033】
また、主体N2は対象者U1の体重データD12を所持しておらず、かつ対象者U2,U3の体重データD22,D32は所持しているので、主体N2にとって主体N1が所持する対象者U1の体重データD12は価値がある。
【0034】
一方、主体N1が有する対象者U1の身長データD11は、初期の段階では主体N2にとって価値が無いものの、主体N2が対象者U1の体重データおよび年齢データを別途に取得できるか、あるいは対象者U2,U3の身長データを別途に取得できれば価値が高くなる。すなわち、主体N2にとって主体N1が所持する対象者U1の身長データD11には潜在価値がある。
【0035】
以上のことから、前記所持データ評価部20は、主体N1の所持するデータD12,D21と主体N2の所持するデータD23,D32とは価値が等価であり、主体N1の所持するデータD11と主体N2の所持するデータD33とは潜在価値が等価であると判断する。
【0036】
なお、上記に加えて、新たに取得するデータの特徴量と、既に所持しているデータの特徴量との関連性の強さを各価値に反映させ、関連性の強さが強いデータほど価値が高いと判断されるようにしても良い。
【0037】
これは、概念辞書を用いることによって実現でき、例えば、
図3に示したような概念辞書があったときに、「性別」と「年齢」とは近い概念[同図(a)]であるが、「福岡」と「桜」は遠い概念[同図(b)]であるとみなすことができる。このときの概念辞書のたどったステップを数えると、前者は「2」,後者は「5」となっているので、このステップ数に反比例するように価値関数を設定すれば、概念の近さを価値に反映させることができる。なお、パスが複数存在する場合には、それらのパスを合計しても良い。
【0038】
また、各主体Nの信頼度を推定することも望ましい。信頼度の推定は、各主体Nによる投票により行えば良い。さらに上記のデータの当価値判定においては、データの欠損割合を用いても良い。
【0039】
さらに、本実施形態ではデータの真正性が担保されていることを前提とするが、データの真正性の推定を同時に行い、その結果を価値に反映させても良い。データの真正性は、同一データが複数の主体のもとにあって各データの値が異なっていた場合には、それらの平均からの乖離によって計算できる。
【0040】
前記データ交換順序決定手段30は、データ交換順序の昇順で主体Nおよび共有主体Mの各組み合わせペアがデータ交換を承諾する前提でデータ交換順序を決定する。前記データ交換支援部40は、データ交換を承諾した主体Nおよび共有主体Mの組み合わせペアを結合した新たな共有主体Mと他の主体Nまたは共有主体Mとのデータ交換支援を前記データ交換順序にしたがって繰り返す。
【0041】
図4は、前記データ交換順序決定手段30がデータ交換の組み合わせペアおよびその交換順序を決定する方法を示した図であり、ここでは、5つの主体N1〜N5に着目し、各主体N1〜N5の所持データの絶対価値が、それぞれ「11」,「6」,「3」,「2」,「2」である場合を例にして説明する。
【0042】
初めに、全ての主体N1〜N5の所持データの総価値が計算される。本実施形態では総価値として「24」が求まる。次いで、前記総価値「24」が同時に結合可能な主体数で分けられる。本実施形態では同時結合主体数が「2」であって、前記総価値が価値「12」の2系統に分岐されたものとして説明する。
【0043】
次いで、全ての主体Nの中から、所持データの価値が当該価値(系統価値)「12」に近い主体Nが選択される。本実施形態では、所持データの価値が「11」の主体N1が選択されて一方の系統に振り分けられる。その後、前記系統価値の「12」と主体N1の所持データの価値「11」との差分「1」が他方の系統に振り分けられて、当該他方の系統価値が「13」に更新される。
【0044】
次いで、前記他方の系統価値が「13」が前記同時結合主体数「2」に基づいて系統価値が「6.5」の2系統に分岐され、残りの主体Nの中から、所持データの価値が当該系統価値「6.5」に近い主体として、ここでは価値が「6」の主体N2が選択されて一方の系統に振り分けられる。以下同様に、各主体の振り分けが繰り返され、最終的に
図4のような系統図が作成される。
【0045】
以上のようにして系統図が得られると、最後に振り分けられた価値「2」の2つの主体N4,N5が、
図5(a)に示したようにデータ交換ペアの候補とされ、各主体N4,N5にデータ交換の許否が問い合わされる。主体N4,N5からデータ交換の許諾が得られると、主体N4,N5がデータ交換ペアとされて自由なデータ交換が可能になり、さらに
図5(b)に示したように、主体N4,N5が共有主体化されて価値「4」の共有主体M45が誕生する。
【0046】
前記共有主体M45の所持データの価値「4」は、主体N3の所持データの価値「3」と略等価となるので、今度は主体N3,M45がデータ交換ペアの候補とされ、各主体N3,M45にデータ交換の許否が問い合わされる。両主体からデータ交換の許諾が得られると、主体N3,M45がデータ交換ペアとされて自由なデータ交換が可能になり、さらに
図5(c)に示したように、主体N3,M45が共有主体化されて価値「7」の共有主体M345が誕生する。
【0047】
前記共有主体M345の所持データの価値「7」は、主体N2の所持データの価値「6」と略等価となるので、今度は主体N2,M345がデータ交換ペアの候補とされ、各主体N2,M345にデータ交換の許否が問い合わされる。両主体からデータ交換の許諾が得られると、主体N2,M345がデータ交換ペアとされて自由なデータ交換が可能になり、さらに
図5(d)に示したように、主体N2,M345が共有主体化されて価値「13」の共有主体M2345が誕生する。
【0048】
前記共有主体N2345の所持データの価値「13」は、主体N1の所持データの価値「11」と略等価となるので、今度は主体N1,M2345がデータ交換ペアの候補とされ、各主体N1,M2345にデータ交換の許否が問い合わされる。両主体からデータ交換の許諾が得られると、主体N1,M2345がデータ交換ペアとされて自由なデータ交換が可能になる
【0049】
本実施形態によれば、所持データの価値が低い主体同士が結合して共有主体を構成することで、各主体の所持データの総価値と等価なデータを有する他の主体とデータを等価交換できるので、所持データの価値が低い主体と高い主体との間でのデータの等価交換が可能になる。
【0050】
なお、上記の実施形態では各主体Nの所持データの価値を絶対的に評価できる場合を例にして説明したが、本発明はこれのみに限定されるものではなく、各主体Nの所持データの価値が、データ交換の相手主体に応じて異なる相対価値である場合にも同様に適用できる。
【0051】
各主体Nの所持データの価値が相対的である場合は、ネットワークなどの物理環境上の制約を考慮して相互にデータ交換可能な全ての主体ペアを網羅する。そして、主体ペアごとに送受し得るデータの相対価値の総和に基づいて各主体をソートし、提供データの総価値が小さい主体から順次に主体共有を行うようにすれば良い。
【0052】
なお、上記のようにデータ交換可能な全ての主体ペアを網羅しようとすれば相応の計算量が必要となってしまうので、各主体Nの中から、他の主体に対して大きなデータを与える主体を特定し、次いで、当該主体と相対的に等価なデータ交換を行える共有主体を探索し、さらに当該共有主体の中で他の主体に対して大きなデータを与える主体を特定し、
次いで、当該主体と相対的に等価なデータ交換を行える共有主体を探索し…を繰り返すことで、各共有主体を構築しても良い。
【0053】
図6に示した3つの主体Na,Nb,Nc間でのデータ交換を例にすれば、主体Nbから他の主体Na,Ncへの提供データの総価値は、主体Naへ提供するデータの相対価値(主体Naにとっての価値)「5」と主体Ncへ提供するデータの相対価値「5」の総和「10」であり、他のいずれの主体の提供データの総価値よりも大きくなる。したがって、この例では
図7に示したように、主体Na,Ncが共有主体Macを構成することにより、主体Na,Nc間のみならず、主体Nbと主体Na,Ncとの間でのデータ交換も可能になる。
【0054】
一方、データの価値には多様性があり、データ同士の相対的な価値は評価尺度に応じて異なり得るが、データを定量的に表現すること自体が困難であるために有効な評価尺度がなく、一の主体が他の一の主体から取得するデータの価値を定量的に評価することは難しい。しかしながら、取得データの価値が所持データとの相対関係に依存する点に着目すれば、各データを幾何図形化することにより、各データの相対関係を定量化できる。
【0055】
ここでは初めに、データを所持する一の主体が当該データに関連して他の一の主体から取得するデータの当該主体自身にとっての価値を、自身の所持データとの相対的な位置関係に基づいて評価する方法について説明する。
【0056】
図8,9は、5つの主体N1-N5がそれぞれ所持するデータ群を、その行要素(ユーザ)および列要素(特徴量)に基づいて二次元配列で表現した図であり、丸印(○)は各主体が該当データを「所持」していることを意味し、空欄は所持していないことを意味している。
【0057】
主体N1は、
図8に示したように、ユーザ「乙」に関して性別以外の特徴量を全て所持しており、この性別データを取得できればユーザ「乙」の特徴量が全て揃うことになる。したがって、
図9(a)に示した主体N2の所持データのように、ユーザ乙の性別データを含むデータ群は、主体N1にとって自身が既に所持しているデータ群の欠落部分を補完できるデータとして価値が高い。
【0058】
同様に、主体N1は特徴量「年齢」に関してユーザ「丁」「戊」以外のデータを全て所持しており、ユーザ「丁」「戊」の年齢データを取得できれば年齢に関する特徴量が全て揃うことになる。したがって、
図9(b)に示した主体N3のデータも、主体N1にとって所持データの欠落部分を補完できるデータとして価値が高い。
【0059】
同様に、主体N1は、特徴量「氏名」に関してユーザ「丙」以外のデータを全て所持しており、ユーザ「丙」の氏名データを取得できれば氏名に関する特徴量が全て揃うことになる。したがって、
図9(c)に示した主体N4のデータも、主体N1にとって所持データの欠落部分を補完できるデータとして価値が高い。
【0060】
これに対して、主体N1は、
図9(d)に示した主体N5が所持するデータを取得しても、これにより行または列方向にデータが一揃いになるような補完を実現できない。したがって、主体N1にとって主体N5のデータ群は価値が高くない。
【0061】
図10(a)は、前記主体N1の所持データ(群)Dsを、各データが所定の単位面積を有する矩形領域であるものとして幾何図形化した図であり、データDsにおけるデータの欠落部分が「欠け」、「凹み」、「抜け」として表現されている。
【0062】
ここで、データ群の幾何図形の形状と当該データ群の価値との関係について考えると、各データをその行列要素に基づいてマトリックス配置で表現できるとき、上述のように、行または列についてより多くのデータが揃うほどデータ(群)の価値が高くなる。これは、データ群の幾何図形中に含まれる長方形の面積が大きいほど多くの情報が得られ、その価値が高くなることを意味している。
【0063】
例えば、複数の特徴量の組み合わせでの共通性を発見する場合を考えたとき、「住所」と「年齢」という特徴量が得られているときに、福岡県では60歳以上の割合が多く、東京では40〜50代の割合が多いという情報を得ることができる。これはデータの件数が増えれば増えるほど、情報の正確性が上がる。また特徴量が増えれば増える程、より多彩な情報を得られることに他ならない。これは、長方形が大きければ大きいほど、より正確で多彩な情報がデータから得られることを意味している。
【0064】
そこで、本実施形態ではデータ補完後の幾何図形内に、少なくとも一辺が行または列方向に全てのデータが揃った長方形状の総面積に基づいてデータの価値を評価するようにしている。
図10(b)の例では、2つの長方形K1,K2に含まれる総面積が当該データの価値と判断される。
【0065】
例えば、主体N1が前記主体N2の所持データD2を取得すると、データ視点では、上記のように主体N1が所持するデータ群の欠落部分が補完され、図形視点では、
図11(a)に示したように、前記凹み部分が補完されることで長方形の総面積が増加する。
【0066】
同様に、主体N1が前記主体N3の所持データD3を取得すると、データ視点では、上記のように主体N1が所持するデータ群の欠落部分が補完され、図形視点でも、
図11(b)に示したように、前記欠け部分が補完されることで長方形の総面積が増加する。
【0067】
同様に、主体N1が前記主体N4の所持データD4を取得すると、データ視点では、上記のように主体N1が所持するデータ群の欠落部分が補完され、図形視点でも、
図11(c)に示したように、前記抜け部分が補完されることで長方形の総面積が増加する。
【0068】
これに対して、主体N1が前記主体N5の所持データD5を取得しても、データ視点では、上記のように欠落部分を補完する機能が無く、図形視点でも、
図11(d)に示したように、長方形の総面積が増加しない。
【0069】
なお、
図11(d)の例では、行または列方向に全てのデータが揃った長方形の面積が増えることはないが、
図11(e)に示したように、所持データD5の取得により、列方向に全てのデータが揃った長方形状に近い略長方形状が完成しつつあり、このような略長方形状も、上記のような多彩な情報を得られる、という観点からは価値が認められる。
【0070】
したがって、行または列方向に全てのデータが揃っていなくても、行列方向のデータ数に対して所定の割合ないしは個数(例えば、1ないし2個)が不足しているだけの場合には、全て揃っている場合と同等の価値を認めるようにしても良い。
【0071】
あるいは、前記長方形状や略長方形状の面積に所定の閾値を設定し、データの取得により初めて当該閾値を超えることになった長方形状等の面積の総和を当該取得データの価値と評価するようにしても良い。
【0072】
例えば、主体N1の所持するデータ群が
図12(a),(b)のようであるときに、その抜け部分が他の主体の所持データD6で補完される場合を考えると、いずれの場合も、5行1列相当の長方形状が1つから2つに増えることになる。
【0073】
しかしながら、長方形状の総面積が同一であっても、離散した複数の小さな長方形状から得られる情報よりも、単一の大きな長方形状から得られる情報の方が価値のある場合が多いので、長方形状の面積閾値を例えば前記5行1列相当よりも大きく、かつ5行2列相当よりも小さくしておけば、同図(b)のように、より大きな長方形状の完成に貢献できるデータのみを評価できるようになる。
【0074】
このように、本発明者等の分析結果によれば、各主体が他の主体から取得するデータの価値と、この取得データで補完された幾何図形に含まれる長方形状の総面積との間には相関が認められ、図形視点で長方形状の総面積を増やせる取得データは、データ視点でも価値が高い傾向にあることが判った。
【0075】
そこで、本発明では取得データの価値を、この取得データで補完された幾何図形に含まれる長方形状の総面積を指標として定量的に評価するようにした。本実施形態では前記長方形状の総面積を、後に詳述するように、各データを模した幾何図形同士が接触する線分長と補完データの面積との総和で代表するようにしている。
【0076】
図13は、本発明の第2実施形態に係るデータ交換支援装置の主要部の構成を示したブロック図であり、前記と同一の符号は同一または同等部分を表している。
【0077】
所持データ評価部20において、幾何図形化部201は、主体Nごとに当該主体Nが所持するデータを、前記
図8,9に示したように、その行要素および列要素に基づいて仮想的に二次元に配列し、さらに前記
図10,11に示したように、各データが矩形の単位領域であるものとして幾何図形に変換する。
【0078】
接触線分長計算部202は、一の主体Niが所持するデータDsの幾何図形と当該一の主体Niが他の一の主体Njから取得したデータDgetの幾何図形とを結合した際に各データDs,Dgetが接触する線分長を計算する。
【0079】
以下、接触線分長の具体的な計算方法について説明する。ここでは説明を判り易くするために、各データを表現する矩形の各辺の長さを全て「1」とすると、前記
図11(a)に示した例では、主体N1の所持データDsと取得データD2とは4辺で接触するので接触線分長は「4」になる。
【0080】
また、
図11(b)に示した例では、主体N1の所持データDsと取得データD3とは3辺で接触するので接触線分長は「3」となる。さらに
図11(c)に示した例では、主体N1の所持データDsと取得データD4とは4辺で接触するので接触線分長は「4」となる。これに対して、
図11(d)に示した例では、主体N1の所持データDsと取得データD5とは線接触しないので接触線分長は「0」となる。
【0081】
このように、本実施形態では各主体が取得するデータの価値が、データを取得する主体が所持しているデータの幾何図形と取得データの幾何図形との接触線分長に基づいて、その長さが長いほど高く評価される。
【0082】
ただし、一般的にデータはそのデータサイズに比例した量的な価値も有する。したがって、
図14に示したように、ある主体にとって接触線分長が同一の取得データ同士であっても、データサイズが大きい取得データDget2[同図(b)]は小さい取得データDget1よりも高く評価する必要がある。
【0083】
そこで、本実施形態ではデータの価値にそのデータ量も反映させるべくデータサイズ検知部203を備え、データ価値計算部204は、各主体が他の主体から取得するデータの価値を、接触線分長依存の価値とサイズ依存の価値との和として求めるようにした。
【0084】
これにより、例えば3つの主体N1,N2,N3間でのデータ交換を考えると、主体N1がN2から取得するデータのデータ量依存の価値が「20」であっても接触線分長依存の価値が「80」であれば、当該取得データの実質の価値は「100」となる。
【0085】
同様に、主体N3がN1から取得するデータのデータ量依存の価値が「50」、接触線分長依存の価値が「50」であれば、当該取得データの実質の価値は「100」となる。さらに、主体N2がN3から取得するデータのデータ量依存の価値が「80」であっても接触線分長依存の価値が「20」であれば、当該取得データの実質の価値は「100」となる。その結果、3つの主体N1,N2,N3間での取得データの価値が等価となるのでデータの等価交換が成立し得る。
【0086】
次いで、データの価値をサイズ依存価値および接触線分長依存価値の和として求める具体的な方法について説明する。
【0087】
データのサイズ(面積)をx、接触線分長をyとすれば、データの価値Vはサイズ依存価値f(x)および接触線分長依存価値g(y)の総和として、それぞれ2つの単調増加関数f、gを用いて次式(1)で表せる。
【0089】
このとき、関数fとしてシグモイド関数を採用すれば、サイズ依存価値f(x)は次式(2)で表せる。
【0091】
また、関数gとして単調増加関数を採用すれば、接触線分長依存価値g(y)は次式(3)で表せる。
【0093】
ここで、主体Nの所持データDsおよび取得データDgetの幾何図形が
図15の通りであって、上式(2),(3)の各係数がk=200,c=0.05,a=3であるとすれば、取得データDgetのデータ量依存価値f(x)はf(100)=100となり、接触線分長依存価値g(y)はg(35)=105となる。
【0094】
また、主体Nの所持データDsおよび取得データDgetの二次元形状が
図16の通りであれば、取得データDgetのデータ量依存価値f(x)はf(150)=100となり、接触線分長依存価値g(y)はg(10)=30となる。
【0095】
ところで、主体Nの所持データDsおよび取得データDgetの各幾何図形の相対的な位置関係が
図17の通りであると、同図(b)では同図(a)に比べて、取得データDgetのサイズは同じでも接触線分長が長くなるので取得データDgetの価値が高く評価されることになる。しかしながら、行要素や列要素の配列順序に時系列などの制限がない場合、すなわち前記
図8,9に関して説明したように、行要素がユーザ、列要素が特徴量であれば、両者は等価と評価されることが望ましい。
【0096】
そこで、本実施形態では価値計算に先だって、所持データDsの配列を適正化することにより、実質的に同一の価値を有する取得データ同士は同等に評価されるようにした。前記適正化は、例えば
図18に示したように、データを行列(ここでは、列)の一方側から昇順ないしは降順で並べ替えることで実現できる。これは、所持データDsの幾何図形の周長を最小化することと同義である。
【0097】
ただし、
図17に示した例では、
図19に示したように、所持データDsの配列(ここでは、行)を並べ替えても周長は同一となってしまう。したがって、このような場合には所持データDsの行列配置を変更しながら取得データDgetとの接触線分長を都度求め、接触線分長の最長化を最適化としても良い。あるいは、取得データDgetと所持データDsとを仮想的に足し合わせ、単一データにした上で周長を最小化しても良い。
【0098】
本実施形態によれば、取得データの価値を所持データとの相対関係に着目して評価するに際して、定量化の困難な各データの相対関係を、各データを図形化することで定量化し、取得データの価値が、各データを模した図形同士での定量的な関係に基づいて評価されるので、データの価値を定量的に評価できるようになる。
【0099】
また、本実施形態によれば、データの価値を、図形化されたデータの接触線分長依存の価値とサイズ依存の価値とに基づいて評価するようにしたので、接触線分長やサイズの異なるデータ同士の交換も可能となり、データ交換の対象、範囲が拡張されて活発なデータ交換が可能になる。
【0100】
なお、上記の実施形態では各データを幾何図形化した際の矩形形状が同一形状、同一サイズであるものとして説明したが、本発明はこれのみに限定されるものではなく、幾何図形化した際の形状やサイズを異ならせることで各データに所望の重み付を行っても良い。
【0101】
例えば、データはその粒度が細かい(概念辞書上で具体性が高い)ほど価値が高くなる。したがって、例えば住所データであれば、「埼玉県」だけのデータよりも「埼玉県ふじみ野市」と記述されているデータの方が価値が高い。したがって、より粒度の細かいデータほど、幾何図形化した際の矩形形状サイズをより大きくするようにしても良い。この際、矩形形状サイズを、概念辞書におけるルートノードからの距離で判断しても良い。