IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ オムロン株式会社の特許一覧

特許7143599メタデータ評価装置、メタデータ評価方法、およびメタデータ評価プログラム
<>
  • 特許-メタデータ評価装置、メタデータ評価方法、およびメタデータ評価プログラム 図1
  • 特許-メタデータ評価装置、メタデータ評価方法、およびメタデータ評価プログラム 図2
  • 特許-メタデータ評価装置、メタデータ評価方法、およびメタデータ評価プログラム 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-09-20
(45)【発行日】2022-09-29
(54)【発明の名称】メタデータ評価装置、メタデータ評価方法、およびメタデータ評価プログラム
(51)【国際特許分類】
   G06F 16/906 20190101AFI20220921BHJP
【FI】
G06F16/906
【請求項の数】 4
(21)【出願番号】P 2018042765
(22)【出願日】2018-03-09
(65)【公開番号】P2019159539
(43)【公開日】2019-09-19
【審査請求日】2020-03-05
(73)【特許権者】
【識別番号】000002945
【氏名又は名称】オムロン株式会社
(74)【代理人】
【識別番号】110000970
【氏名又は名称】弁理士法人 楓国際特許事務所
(72)【発明者】
【氏名】岡本 大和
(72)【発明者】
【氏名】幡山 五郎
(72)【発明者】
【氏名】張 海虹
(72)【発明者】
【氏名】内藤 丈嗣
(72)【発明者】
【氏名】大和 哲二
【審査官】北村 学
(56)【参考文献】
【文献】特開2006-260218(JP,A)
【文献】特開2017-046814(JP,A)
【文献】国際公開第2012/147256(WO,A1)
【文献】特表2009-535698(JP,A)
【文献】米国特許出願公開第2015/0242407(US,A1)
【文献】特開2007-272684(JP,A)
【文献】特開2007-188506(JP,A)
【文献】特開平08-077184(JP,A)
【文献】特開2015-197695(JP,A)
【文献】国際公開第2016/103451(WO,A1)
【文献】米国特許出願公開第2017/0110125(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
IPC G06F 16/00 - 16/958
(57)【特許請求の範囲】
【請求項1】
元データセットに属するデータに付加されているメタデータに含まれる属性の項目についての指定を受け付ける属性受付部と、
前記属性受付部で受け付けた属性の項目で、前記元データセットを分割して複数の分割データセットを生成するデータセット生成部と、
複数の前記分割データセット毎に、その分割データセットに属するデータ群の性質の特徴を抽出する特徴抽出部と、
2つの前記分割データセットの組み合わせ毎に、その組み合わせにおけるデータ群の性質の特徴の類似性に基づいて部分評価を取得し、さらに各組み合わせの部分評価に基づいて、前記元データセットを分割するという観点で、前記属性受付部で受け付けた前記メタデータにかかる属性の項目の有効性を評価する評価部と、を備えたメタデータ評価装置。
【請求項2】
前記特徴抽出部は、前記分割データセットに属するデータ群の性質の特徴として、当該データ群の尤度関数を抽出する、請求項1に記載のメタデータ評価装置。
【請求項3】
元データセットに属するデータに付加されているメタデータに含まれる属性の項目についての指定を受け付ける属性受付ステップと、
前記属性受付ステップにおいて受け付けた属性の項目で、前記元データセットを分割して複数の分割データセットを生成するデータセット生成ステップと、
複数の前記分割データセット毎に、その分割データセットに属するデータ群の性質の特徴を抽出する特徴抽出ステップと、
2つの前記分割データセットの組み合わせ毎に、その組み合わせにおけるデータ群の性質の特徴の類似性に基づいて部分評価を取得し、さらに各組み合わせの部分評価に基づいて、前記元データセットを分割するという観点で、前記属性受付ステップにおいて受け付けた前記メタデータにかかる属性の項目の有効性を評価する評価ステップと、をコンピュータが実行するメタデータ評価方法。
【請求項4】
元データセットに属するデータに付加されているメタデータに含まれる属性の項目についての指定を受け付ける属性受付ステップと、
前記属性受付ステップにおいて受け付けた属性の項目で、前記元データセットを分割して複数の分割データセットを生成するデータセット生成ステップと、
複数の前記分割データセット毎に、その分割データセットに属するデータ群の性質の特徴を抽出する特徴抽出ステップと、
2つの前記分割データセットの組み合わせ毎に、その組み合わせにおけるデータ群の性質の特徴の類似性に基づいて部分評価を取得し、さらに各組み合わせの部分評価に基づいて、前記元データセットを分割するという観点で、前記属性受付ステップにおいて受け付けた前記メタデータにかかる属性の項目の有効性を評価する評価ステップと、をコンピュータに実行させるメタデータ評価プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、データに付加されているメタデータに含まれる属性の項目について有効性を評価する技術に関する。
【背景技術】
【0002】
従来、様々な分野において、収集したデータ(データセット)の利活用についての検討がなされている。データの利活用においては、データ本体に付加されているメタデータが利用されている。メタデータは、データ本体の属性を示すデータである。例えば、センサによりセンシングされたセンシングデータのメタデータが特許文献1に示されている。また、メタデータを利用して、データセットのランク付けを行う技術が、特許文献2に記載されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2015-226102号公報
【文献】特開2016- 58082号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、メタデータに含まれる属性の項目には、データセットを性質の異なるデータセットに分割する項目もあれば、データセットを性質の類似するデータ群に分割する項目もある。ここで言うデータ群の性質とは、事象の種類、事象の発生頻度、事象の発生傾向等である。したがって、データセットを分割するという観点においては、データセットを性質の類似するデータ群に分割する属性の項目は有効性が低いと言われている。
【0005】
また、メタデータに含まれる属性の項目が多くなるにつれて、データの容量が大きくなる。したがって、データセットを分割するという観点においては、データセットを性質の類似するデータ群に分割するメタデータの属性の項目が、データセットのデータ容量を無駄に大きくするものであった。
【0006】
この発明の目的は、メタデータに含まれる属性の項目について、データセットを分割するという観点での有効性を評価する技術を提供することにある。
【課題を解決するための手段】
【0007】
この発明のメタデータ評価装置は、上記目的を達成するため以下に示すように構成している。
【0008】
属性受付部が、元データセットに属するデータに付加されているメタデータに含まれる属性の項目についての指定を受け付ける。データセット生成部が、属性受付部で受け付けた属性の項目で、元データセットを分割して複数の分割データセットを生成する。特徴抽出部が、複数の分割データセット毎に、その分割データセットに属するデータ群の性質の特徴を抽出する。そして、評価部が、2つの分割データセットの組み合わせ毎に、その組み合わせにおけるデータ群の性質の特徴に基づく部分評価を取得し、さらに各組み合わせの部分評価に基づいて、属性受付部で受け付けたメタデータにかかる属性の項目について評価する。
【0009】
この構成では、評価部は、2つの分割データセットの組み合わせ毎に、データ群の性質がどの程度類似しているかを示す部分評価を取得する。データ群の性質とは、事象の種類、事象の発生頻度、事象の発生傾向等である。メタデータに含まれる属性の項目が、元データセットを性質の異なるデータセットに分割する項目である場合、2つの分割データセットの組み合わせにおいて、データ群の性質が類似しない。一方、メタデータに含まれる属性の項目が、元データセットを性質の異なるデータセットに分割する項目でない場合、2つの分割データセットの組み合わせにおいて、データ群の性質が類似する。
【0010】
したがって、評価部は、元データセットを性質の異なるデータセットに分割する観点で、属性受付部で受け付けたメタデータにかかる属性の項目の有効性を評価できる。言い換えれば、評価部は、元データセットを性質の異なるデータセットに分割しない観点においても、属性受付部で受け付けたメタデータにかかる属性の項目の有効性を評価できる。
【0011】
また、評価部は、2つの分割データセットの組み合わせ毎に、その組み合わせにおけるデータ群の性質の特徴の類似性に基づいて部分評価を取得する構成にしてもよい。
【0012】
また、特徴抽出部は、分割データセットに属するデータ群の性質の特徴として、当該データ群の尤度関数を抽出する構成にしてもよい。
【発明の効果】
【0013】
この発明によれば、メタデータに含まれる属性の項目について、データセットを分割するという観点での有効性を評価することができる。
【図面の簡単な説明】
【0014】
図1】この発明にかかるメタデータ評価装置を適用した1例のメタデータ評価システムを示す概略図である。
図2】メタデータ評価装置の主要部の構成を示すブロック図である。
図3】タデータ評価装置の動作を示すフローチャートである。
【発明を実施するための形態】
【0015】
以下、この発明の実施形態について説明する。
【0016】
<1.適用例>
図1は、この発明にかかるメタデータ評価装置を適用した1例のメタデータ評価システムを示す概略図である。この例にかかるメタデータ評価システムは、メタデータ評価装置1と、元データセット記憶データベース2(元データセット記憶DB2)と、分割データセット記憶部3とを備えている。分割データセット記憶部3には、複数のデータベースが設けられている。図1では、分割データセット記憶部3に設けられている、第1データセット記憶データベース3a(第1データセット記憶DB3a)、および第2データセット記憶データベース3b(第2データセット記憶DB3b)のみ示している。
【0017】
元データセット記憶DB4には、元データセットが記憶される。元データセットは、収集したデータ群である。データは、データ本体と、データ本体の属性を示すメタデータによって構成されている。データ本体は、例えばN次元の実数ベクトルにかかるデータ、N次元の実数の時系列ベクトルにかかるデータ等である。具体的に説明すると、データは、例えばデータ本体が顔画像データであり、メタデータが示す属性の項目が性別、年齢、国籍、撮影日時、撮影に使用したカメラ等である(この場合、元データセットは様々な年齢の男女の顔画像データの集まりである。)。また、データは、例えばデータ本体が車両の画像データであり、メタデータが示す属性の項目が車種、撮影場所、撮影日時、撮像に使用したカメラ等である(この場合、元データセットは、2輪車、軽自動車、普通自動車、トラック、バス等の様々な車種の車両の画像データの集まりである。)。また、データは、例えばデータ本体が音声データであり、メタデータが示す属性の項目が性別、年齢、国籍、録音日時、録音に使用したマイク等の項目である(この場合、元データセットは、様々な年齢の男女の発声にかかる音声データの集まりである。)。
【0018】
メタデータ評価装置1は、メタデータの属性の項目についての指定を受け付け、受け付けた属性の項目で、元データセット記憶DB2に記憶している元データセットを分割して複数の分割データセットを生成する。分割データセットは、元データセットの一部のデータ群である。メタデータ評価装置1は、元データセット記憶DB2に記憶している元データセットを分割した分割データセットを、分割データセット記憶部3に区別して記憶する。具体的には、メタデータ評価装置1は、元データセット記憶DB2に記憶している元データセットを2つの分割データセットに分割した場合、一方の分割データセットを第1データセット記憶DB3aに記憶させ、他方の分割データセットを第2データセット記憶DB3bに記憶させる。また、メタデータ評価装置1は、元データセット記憶DB2に記憶している元データセットを3つの分割データセットに分割した場合、一つ目の分割データセットを第1データセット記憶DB3aに記憶させ、2つ目の分割データセットを第2データセット記憶DB3bに記憶させ、さらに3つ目の分割データセットを第3データセット記憶DB(不図示)に記憶させる。
【0019】
メタデータ評価装置1は、元データセット記憶DB2に記憶している元データセットを分割して生成した2つの分割データセットの組み合わせ毎に、2つの分割データセットに属するデータ群の性質の類似性を推定する。具体的には、2つの分割データセットに属するデータ群について性質の特徴を抽出し、抽出した特徴の類似度を取得する。ここで言うデータ群の性質とは、事象の種類、事象の発生頻度、事象の発生傾向等である。
【0020】
したがって、今回元データセット記憶DB2に記憶している元データセットの分割に用いたメタデータの属性の項目について、元データセットを分割するという観点における有効性を、分割された2つの分割データセットに属するデータ群の性質の類似性によって推定できる。すなわち、メタデータに含まれる属性の項目について、元データセットを性質の異なるデータセットに分割する観点で有効性を評価できる。言い換えれば、メタデータに含まれる属性の項目について、元データセットを性質の異なるデータセットに分割しない観点でも、有効性を評価できる。
【0021】
<2.構成例>
図2は、メタデータ評価装置の主要部の構成を示すブロック図である。メタデータ評価装置1は、制御ユニット11と、データベースアクセス部12(DBアクセス部12)と、操作部13と、出力部14とを備えている。
【0022】
制御ユニット11は、メタデータ評価装置1本体各部の動作を制御する。また、制御ユニット11は、データセット生成部21と、特徴抽出部22と、評価部23とを有している。データセット生成部21、特徴抽出部22、および評価部23の詳細については後述する。
【0023】
DBアクセス部12は、元データセット記憶DB2、および分割データセット記憶部3に設けられている各データベース(図では、第1データセット記憶DB3a、および第2データセット記憶DB3bのみ示している。)とのインタフェースである。メタデータ評価装置1は、DBアクセス部12を介して、元データセット記憶DB2、および分割データセット記憶部3に設けられているデータベースに対するデータの読み出し、およびデータの書き込みを行う。
【0024】
操作部13は、キーボードやマウス等の入力デバイスを有し、メタデータ評価装置1本体に対するオペレータの入力操作を受け付ける。この操作部13が、この発明で言う属性受付部に相当する。
【0025】
出力部14は、メタデータの属性の項目について、元データセットを分割するという観点で評価した評価結果を外部装置に出力する。外部装置は、例えばメタデータの属性の項目について、元データセットを分割するという観点で評価した評価結果を表示する表示装置であってもよいし、この評価結果に基づいて、元データセットを分割するという観点でメタデータの属性の項目を分類した集計データを生成し、出力する情報処理装置(コンピュータ)であってもよい。
【0026】
次に、制御ユニット11が有する、データセット生成部21、特徴抽出部22、および評価部23について説明する。
【0027】
データセット生成部21は、操作部13において指定されたメタデータの属性の項目で、元データセット記憶DB4に記憶されている元データセットを分割し、複数の分割データセットを生成する。データセット生成部21は、例えば、元データセット記憶DB2に記憶されている元データセットが、様々な年齢の男女の顔画像データであり、指定されたメタデータの属性の項目が性別であると、元データセットから女性の顔画像データを抽出した第1分割データセットと、元データセットから男性の顔画像データを抽出した第2分割データセットとを生成する。
【0028】
データセット生成部21が元データセットを分割して生成した分割データセットは、分割データセット記憶部3に区別して記憶される。例えば、上記の例では、元データセットから女性の顔画像データを抽出した第1分割データセットが第1データセット記憶DB3aに記憶され、元データセットから男性の顔画像データを抽出した第2分割データセットが第2データセット記憶DB3bに記憶される。
【0029】
特徴抽出部22は、分割データセット記憶部3に分けて記憶されている分割データセット毎に、データ群の性質の特徴を抽出する。データ群の性質とは、上述したように、事象の種類、事象の発生頻度、事象の発生傾向等である。また、データ群の性質の特徴とは、事象の種類、事象の発生頻度、事象の発生傾向等の性質の分布である。特徴抽出部22は、例えばデータ群の性質の確率分布関数、確率密度関数、または尤度関数を特徴として抽出する。
【0030】
評価部23は、分割データセット記憶部3に分けて記憶されている2つの分割データセットの組み合わせ毎に、特徴抽出部22において抽出されたデータ群の性質の特徴を比較する。評価部23は、比較した特徴の類似性によって、今回元データセットの分割に用いたメタデータの属性の項目を、元データセットを分割するという観点で部分評価する。メタデータの属性の項目は、元データセットを分割するという観点においては、分割データセットの性質の特徴が類似するほど(類似性が高いほど)有効性が低い。評価部23は、特徴抽出部22が抽出したデータセットの特徴の類似性を、確率分布間の距離、または確率密度の比で評価する。また、評価部23は、分割データセットの組み合わせ毎に取得した部分評価を用いて、今回元データセットの分割に用いたメタデータの属性の項目について、元データセットを性質の異なるデータセットに分割する観点で有効性を評価する。
【0031】
メタデータ評価装置1の制御ユニット11は、ハードウェアCPU、メモリ、その他の電子回路によって構成されている。ハードウェアCPUが、この発明にかかるメタデータ評価プログラムを実行したときに、データセット生成部21、特徴抽出部22、および評価部23として動作する。また、メモリは、この発明にかかるメタデータ評価プログラムを展開する領域や、このメタデータ評価プログラムの実行時に生じたデータ等を一時記憶する領域を有している。制御ユニット11は、ハードウェアCPU、メモリ等を一体化したLSIであってもよい。また、ハードウェアCPUが、この発明にかかるメタデータ評価方法を実行するコンピュータである。
【0032】
また、元データセット記憶DB2、および分割データセット記憶部3が備える第1データセット記憶DB3a、第2データセット記憶DB3b等は、ハードディスクドライブ、ソリッドステートドライブ等の補助記憶装置であってもよい。また、元データセット記憶DB2、および分割データセット記憶部3が備える第1データセット記憶DB3a、第2データセット記憶DB3b等は、1つの補助記憶装置で構成してもよいし、複数の補助記憶装置で構成してもよい。
【0033】
<3.動作例>
次に、この例にかかるメタデータ評価装置1の動作について説明する。図3は、メタデータ評価装置の動作を示すフローチャートである。メタデータ評価装置1は、メタデータの属性の項目についての評価処理が要求されると、図3に示す処理を実行する。メタデータ評価装置1は、今回評価するメタデータの属性の項目についての指定を受け付ける(s1)。オペレータが、操作部13に設けられている入力デバイスを操作し、今回評価するメタデータの属性の項目をメタデータ評価装置1に入力する。
【0034】
メタデータ評価装置1は、s1で受け付けたメタデータの属性の項目で、元データセット記憶DB2に記憶している元データセットを分割する(s2)。s2では、データセット生成部21が、今回受け付けたメタデータの属性の項目で、元データセットを分割し、複数の分割データセットを生成する。データセット生成部21は、生成した複数の分割データセットを区別して、分割データセット記憶部3に記憶させる。例えば、データセット生成部21は、元データセット記憶DB2に記憶している元データセットを2つの分割データセットに分割した場合、一方の分割データセットを第1データセット記憶DB3aに記憶させ、他方の分割データセットを第2データセット記憶DB3bに記憶させる。また、データセット生成部21は、元データセット記憶DB2に記憶している元データセットを3つの分割データセットに分割した場合、一つ目の分割データセットを第1データセット記憶DB3aに記憶させ、2つ目の分割データセットを第2データセット記憶DB3bに記憶させ、さらに3つ目の分割データセットを第3データセット記憶DB(不図示)に記憶させる。
【0035】
メタデータ評価装置1は、s2で生成した分割データセット毎に特徴を抽出する(s3)。特徴抽出部22が、s3にかかる処理を実行する。特徴抽出部22は、s2で生成した分割データセット毎に、その分割データセットに属するデータ群における、事象の種類、事象の発生頻度、事象の発生傾向等の性質についての確率分布関数、確率密度関数、または尤度関数を特徴として抽出する。
【0036】
メタデータ評価装置1は、分割データセットの組み合わせを選択する(s4)。s4で選択される分割データセットの組み合わせは、2つの分割データセットの組み合わせである。メタデータ評価装置1は、s4で選択した組み合わせの分割データセットについて、s3で抽出した特徴の類似度を取得する(s5)。s5では、s3で抽出した特徴の種別に応じて、確率分布間の距離、または確率密度の比を算出し、算出した値に応じた類似度(この発明で言う、部分評価に相当する。)を取得する。メタデータ評価装置1は、s5にかかる処理を実行していない分割データセットの組み合わせの有無を判定し(s6)、未処理の分割データセットの組み合わせがあれば、s4に戻る。
【0037】
メタデータ評価装置1は、s6で未処理の分割データセットの組み合わせがないと判定すると、s1で受け付けたメタデータの属性の項目を評価する評価処理を行う(s7)。s7は、今回評価するメタデータの属性の項目(s1で受け付けたメタデータの属性の項目)についての評価値を取得する処理である。この評価値は、例えば、分割データセットの組み合わせ毎にs5で取得した類似度の平均値にしてもよいし、分割データセットの組み合わせ毎にs5で取得した類似度の最大値、または最小値にしてもよいし、分割データセットの組み合わせ毎にs5で取得した類似度の二乗平均平方根にしてもよいし、分割データセットの組み合わせ毎にs5で取得した類似度の総和にしてもよい。上述したs4~s7にかかる処理は、評価部23によって実行される。
【0038】
メタデータ評価装置1は、s1で指定されたメタデータの属性の項目と、s7で取得した評価値とを対にして外部装置に出力し(s8)、本処理を終了する。
【0039】
なお、s1で受け付けたメタデータの属性の項目は、s5で特徴が類似しているほど、s7で取得される評価値が大きくなる方式であれば、評価値が大きいほど、元データセットを性質の異なるデータセットに分割するという観点において有効性が低い(評価値が小さいほど、元データセットを性質の異なるデータセットに分割するという観点において有効性が高い。)。逆に、s1で受け付けたメタデータの属性の項目は、s5で特徴が類似しているほど、s7で取得される評価値が小さくなる方式であれば、評価値が小さいほど、元データセットを性質の異なるデータセットに分割するという観点において有効性が低い(評価値が大きいほど、元データセットを性質の異なるデータセットに分割するという観点において有効性が高い。)。
【0040】
このように、この例では、メタデータの属性の項目毎に、元データセットを性質の異なるデータセットに分割するという観点における有効性を判定できる。したがって、元データセットを性質の異なるデータセットに分割するという観点における有効性で、メタデータに含まれる属性の項目を決定することができ、データセットの容量を抑えることができる。
【0041】
なお、この例では、メタデータの属性の項目毎に、元データセットを性質の異なるデータセットに分割しないという観点における有効性も判定できる。
【0042】
<実験例1>
元データセットが顔画像データであり、年齢、性別、国籍、撮影時刻、および撮影に用いたカメラの5つの項目について、元データセットを性質の異なる分割データセットに分割するという観点での有効性をメタデータ評価装置1で評価した。
この評価で、年齢、および性別については有効性が高く、撮影に用いたカメラについては有効性が低いことを確認した。
なお、国籍、撮影時刻については、有効性があるかどうかを明確に判断できなかった。
【0043】
この評価結果から、撮影に用いたカメラにかかる項目を、メタデータに含めないことによって、データセットの容量を抑えられることが確認できた。
さらに、有効性が高いことが確認できた年齢、または性別で元データセットを分割することにより、年齢、または性別による顔画像の特徴の変化を分析することによって、有益な分析結果が得られることも確認できた。
【0044】
<実験例2>
元データセットが車両の画像データであり、車種、撮影場所、撮影時刻、および撮影に用いたカメラの4つの項目について、元データセットを性質の異なる分割データセット分割するという観点での有効性をメタデータ評価装置1で評価した。
この評価で、車種については有効性が高く、撮影時刻、および撮影に用いたカメラについては有効性が低いことを確認した。
なお、撮影場所については、有効性があるかどうかを明確に判断できなかった。
【0045】
この評価結果から、撮影時刻、および撮影に用いたカメラにかかる項目を、メタデータに含めないことによって、データセットの容量を抑えられることが確認できた。
【0046】
<4.変形例>
上記の例では、メタデータ評価装置1は、メタデータの属性の項目の評価値を数値として出力するとしたが、例えば予め定めた5段階や、10段階にランク分けし、そのランクを評価値として出力する構成にしてもよい。
【0047】
また、メタデータ評価装置1は、s7で取得した評価値に加えて、s5で取得した分割データセットの組み合わせ毎の類似度も出力するようにしてもよい。
【0048】
なお、この発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
【0049】
さらに、この発明に係る構成と上述した実施形態に係る構成との対応関係は、以下の付記のように記載できる。
<付記>
元データセットに属するデータに付加されているメタデータに含まれる属性の項目についての指定を受け付ける属性受付部(13)と、
前記属性受付部(13)で受け付けた属性の項目で、前記元データセットを分割して複数の分割データセットを生成するデータセット生成部(21)と、
複数の前記分割データセット毎に、その分割データセットに属するデータ群の性質の特徴を抽出する特徴抽出部(22)と、
2つの前記分割データセットの組み合わせ毎に、その組み合わせにおけるデータ群の性質の特徴に基づく部分評価を取得し、さらに各組み合わせの部分評価に基づいて、前記属性受付部で受け付けた前記メタデータにかかる属性の項目について評価する評価部(23)と、を備えたメタデータ評価装置(1)。
【符号の説明】
【0050】
1…メタデータ評価装置
2…元データセット記憶データベース(元データセット記憶DB)
3…記憶部
3…分割データセット記憶部
3a…第1データセット記憶データベース(第1データセット記憶DB)
3b…第2データセット記憶データベース(第2データセット記憶DB)
11…制御ユニット
12…アクセス部
12…データベースアクセス部(DBアクセス部)
13…操作部
14…出力部
21…データセット生成部
22…特徴抽出部
23…評価部
図1
図2
図3