特許第6061164号(P6061164)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 早坂 壮大の特許一覧

特許6061164情報処理装置、情報処理方法、およびプログラム
<>
  • 特許6061164-情報処理装置、情報処理方法、およびプログラム 図000002
  • 特許6061164-情報処理装置、情報処理方法、およびプログラム 図000003
  • 特許6061164-情報処理装置、情報処理方法、およびプログラム 図000004
  • 特許6061164-情報処理装置、情報処理方法、およびプログラム 図000005
  • 特許6061164-情報処理装置、情報処理方法、およびプログラム 図000006
  • 特許6061164-情報処理装置、情報処理方法、およびプログラム 図000007
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】6061164
(24)【登録日】2016年12月22日
(45)【発行日】2017年1月18日
(54)【発明の名称】情報処理装置、情報処理方法、およびプログラム
(51)【国際特許分類】
   G06F 17/30 20060101AFI20170106BHJP
【FI】
   G06F17/30 210D
【請求項の数】50
【全頁数】20
(21)【出願番号】特願2016-111497(P2016-111497)
(22)【出願日】2016年6月3日
【審査請求日】2016年6月3日
【早期審査対象出願】
(73)【特許権者】
【識別番号】516165446
【氏名又は名称】早坂 壮大
(74)【代理人】
【識別番号】110000752
【氏名又は名称】特許業務法人朝日特許事務所
(72)【発明者】
【氏名】早坂 壮大
【審査官】 川▲崎▼ 博章
(56)【参考文献】
【文献】 特開2003−030223(JP,A)
【文献】 特開2009−065387(JP,A)
【文献】 特開2001−165669(JP,A)
【文献】 特開2016−099659(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
(57)【特許請求の範囲】
【請求項1】
各々が固有の1つ以上の属性値が付与されるデータからなり、前記属性値は1つ以上の固有の基準値を有し、かつ当該属性値と前記基準値との遠近と所定の1つ以上の境界値と前記基準値との遠近とを比較可能であるという特徴を有する一群のデータであって、前記一群のデータを処理対象として指定する指定手段と、
各々が前記一群のデータに含まれるデータのうちいずれか1つ以上が格納される記憶領域からなり、当該記憶領域に固有かつ所定の資源の供給量と、当該記憶領域に格納されたデータに基づく前記資源の需要量に基づき当該資源の過不足を判定可能であるという特徴を有する一群の記憶領域であって、前記一群のデータに含まれるデータを当該データに付与された前記属性値における比較の結果に基づき、前記一群の記憶領域に含まれる記憶領域のうちいずれか1つに格納する設定手段と、
前記一群の記憶領域に含まれる記憶領域における前記資源の過不足を判定する判定手段と、
前記資源が不足すると判定された1つ以上の前記記憶領域に格納されるデータのうち、前記属性値における比較の結果に基づき、当該一つ以上の記憶領域において所定の1つ以上のデータの少なくとも一部分を除くデータからなる排除対象、または前記一群のデータのうち当該排除対象を除く1つ以上のデータからなる保持対象の少なくともいずれか一方を特定する特定手段と、
該特定されたデータ、または当該データを指定する情報を出力する出力手段と
を有し、
前記排除対象のデータのうち少なくともいずれか1つは、当該データに付与された属性値よりも前記基準値から遠い属性値が付与されたデータと前記基準値から近い属性値が付与されたデータを保持対象として有する、
ことを特徴とする情報処理装置。
【請求項2】
前記一群のデータに含まれるデータに付与される前記属性値の少なくとも1つは、当該データに関連付けられた頻度的、または確率的な属性値である、請求項1に記載の情報処理装置。
【請求項3】
前記一群のデータに含まれるデータに付与される前記属性値の少なくとも1つは、当該データに関連付けられた時間的な属性値である、請求項1ないし2のいずれか1つに記載の情報処理装置。
【請求項4】
前記一群のデータに含まれるデータに付与される前記属性値の少なくとも1つは、当該データに対してアクセスがあった時間、または生成された時間に基づく、請求項3に記載の情報処理装置。
【請求項5】
前記一群のデータに含まれるデータに付与される前記属性値の少なくとも1つは、指定された基準データと当該データとの類似度、または当該データと前記基準データの差分である、請求項1ないし4のいずれか1つに記載の情報処理装置。
【請求項6】
前記基準値は、基準データの属性値、または前記一群のデータに含まれるデータに付与される前記属性値の統計量に基づく、請求項1ないし5のいずれか1つに記載の情報処理装置。
【請求項7】
前記一群のデータに含まれるデータは固有の要求量を付与され、前記一群の記憶領域に含まれる記憶領域における前記需要量は、当該記憶領域に含まれるデータに付与された前記要求量に基づく、請求項1ないし6のいずれか1つに記載の情報処理装置。
【請求項8】
前記一群の記憶領域に含まれる記憶領域における前記供給量の和は、指定された通信手段において所定の期間で通信される通信量に基づく、または指定された演算手段において所定の期間で演算される演算量に基づく、請求項1ないし7のいずれか1つに記載の情報処理装置。
【請求項9】
前記一群の記憶領域に含まれる記憶領域における前記供給量の和は、指定された記憶媒体に記憶可能なデータの総量、または総数に基づく、請求項1ないし8のいずれか1つに記載の情報処理装置。
【請求項10】
前記設定手段は、前記一群の記憶領域に含まれる記憶領域の総数を設定するステップ、前記境界値に基づいて前記一群の記憶領域に含まれる記憶領域に対応する前記属性値の範囲を設定するステップ、または前記一群の記憶領域に含まれる記憶領域における前記供給量を設定するステップのうち少なくともいずれか1つを実行する、請求項1ないし9のいずれか1つに記載の情報処理装置。
【請求項11】
前記設定手段は、前記一群のデータに含まれるデータに付与された前記属性値が前記一群の記憶領域に含まれる記憶領域に対応する前記属性値の範囲を満たした場合、当該データの少なくとも一部分を当該記憶領域の1つに格納するステップを実行する請求項10に記載の情報処理装置。
【請求項12】
前記一群のデータに含まれるデータを格納する前記一群の記憶領域に含まれる記憶領域をユーザが設定する第2設定手段を備える、請求項1ないし11のいずれか1つに記載の情報処理装置。
【請求項13】
前記設定手段は、前記一群のデータに含まれるデータに付与された前記属性値のうち前記基準値から最も遠い属性値、または推定される最も遠い属性値に基づいて、前記一群の記憶領域に含まれる記憶領域の総数を設定する、請求項10ないし12のいずれか1つに記載の情報処理装置。
【請求項14】
前記設定手段は、前記一群のデータに含まれるデータに付与された要求値のうち最大値、または推定される最大値に基づいて、前記一群の記憶領域に含まれる記憶領域の総数を設定し、
前記推定が前記一群のデータに含まれるデータの総数未満のデータと前記一群のデータに含まれるデータの総数に基づく、請求項10ないし13のいずれか1つに記載の情報処理装置。
【請求項15】
前記設定手段は、前記一群の記憶領域に含まれる記憶領域における前記供給量の和に基づいて、前記一群の記憶領域に含まれる記憶領域の総数を設定する、請求項10ないし14のいずれか1つに記載の情報処理装置。
【請求項16】
前記設定手段は、前記一群の記憶領域に含まれる記憶領域の総数に基づいて、2つ以上の前記境界値を設定する、請求項10ないし15のいずれか1つに記載の情報処理装置。
【請求項17】
前記設定手段は、前記一群のデータに含まれるデータに付与される前記属性値のうち前記基準値から最も遠い属性値、または最も遠いと推定される属性値に基づいて、2つ以上の前記境界値を設定し、 前記推定が前記一群のデータに含まれるデータの総数未満のデータと前記一群のデータに含まれるデータの総数に基づく、請求項10ないし16のいずれか1つに記載の情報処理装置。
【請求項18】
前記設定手段は、所定の数列に基づいて2つ以上の前記境界値を設定し、当該数列を特徴付ける変数の総数が、前記一群の記憶領域に含まれる記憶領域の総数から1を引いた数未満である、請求項10ないし17のいずれか1つに記載の情報処理装置。
【請求項19】
前記所定の数列は、0より大きい所定の初項をA、前記基準値をB、1より大きく2以下の定数をC、前記一群のデータに含まれるデータに付与される前記属性値のうち前記基準値から最も遠い属性値、または最も遠いと推定される属性値をM、前記一群の記憶領域に含まれる記憶領域の総数をNとする場合、公差が(|M−B|−A)/(N−C)で定義される等差数列、または公比が(|M−B|/A)^(1/(N−C))で定義される等比数列であり、前記推定が前記一群のデータに含まれるデータの総数未満のデータと前記一群のデータに含まれるデータの総数に基づく、請求項18に記載の情報処理装置。
【請求項20】
前記設定手段は、前記一群の記憶領域に含まれる記憶領域の総数に基づいて、前記一群の記憶領域に含まれる記憶領域における前記供給量を設定する、請求項10ないし19のいずれか1つに記載の情報処理装置。
【請求項21】
前記設定手段は、前記一群のデータに含まれるデータに付与された要求値のうち最大値、または推定される最大値に基づいて、前記一群の記憶領域に含まれる記憶領域における前記供給量を設定し、
前記推定が前記一群のデータに含まれるデータの総数未満のデータと前記一群のデータに含まれるデータの総数に基づく、請求項10ないし20のいずれか1つに記載の情報処理装置。
【請求項22】
前記設定手段は、前記一群の記憶領域に含まれる記憶領域に対応する前記属性値の範囲に基づいて、前記一群の記憶領域に含まれる記憶領域における前記供給量を設定する、請求項10ないし21のいずれか1つに記載の情報処理装置。
【請求項23】
前記設定手段は、前記一群の記憶領域に含まれる記憶領域における前記供給量の和に基づいて、前記一群の記憶領域に含まれる記憶領域における前記供給量を設定する、請求項10ないし22のいずれか1つに記載の情報処理装置。
【請求項24】
前記設定手段は、前記一群の記憶領域に含まれる記憶領域における前記供給量の和を前記一群の記憶領域に含まれる記憶領域における固有の分配率で内分することで前記一群の記憶領域に含まれる記憶領域における前記供給量を設定し、前記一群の記憶領域に含まれる記憶領域における前記分配率の比は、前記一群の記憶領域に含まれる記憶領域における前記需要量の比と等しくない、請求項23に記載の情報処理装置。
【請求項25】
前記設定手段は、前記一群の記憶領域に含まれる記憶領域における需要量、または対応する属性値の範囲に基づいて、当該記憶領域に付与する前記分配率を決定する、請求項24に記載の情報処理装置。
【請求項26】
前記特定手段は、所定の乱択アルゴリズムに従って、前記排除対象とするデータ、または前記保持対象とするデータを特定する、請求項1ないし25のいずれか1つに記載の情報処理装置。
【請求項27】
前記特定手段は、前記一群のデータに含まれるデータに付与された前記属性値のうち前記基準値からより遠い属性値が付与されたデータ、またはより遠い属性値が付与されたと推定されるデータを、優先して前記保持対象として特定する、または前記一群のデータに含まれるデータに付与された前記属性値のうち前記基準値からより近い属性値が付与されたデータ、またはより近い属性値が付与されたと推定されるデータを優先して前記排除対象として特定し、
前記推定が前記一群のデータに含まれるデータの総数未満のデータと前記一群のデータに含まれるデータの総数に基づく、請求項1ないし26のいずれか1つに記載の情報処理装置。
【請求項28】
前記特定手段は、前記一群の記憶領域に含まれる記憶領域のうち当該記憶領域における前記需要量が当該記憶領域における前記供給量以下となる記憶領域に関連付けられたデータを前記保持対象として特定する、請求項1ないし27のいずれか1つに記載の情報処理装置。
【請求項29】
前記特定手段は、前記一群の記憶領域に含まれる記憶領域のうち当該記憶領域における前記需要量と当該記憶領域における前記供給量との乖離がより大きい記憶領域、または乖離がより大きいと推定される記憶領域に関連付けられたデータを優先して、前記排除対象として特定し、前記推定が前記一群の記憶領域に含まれる記憶領域の総数未満の記憶領域と前記一群の記憶領域に含まれる記憶領域の総数に基づく、請求項1ないし28のいずれか1つに記載の情報処理装置。
【請求項30】
少なくとも前記一群のデータに含まれるデータを識別する情報と、当該データに付与された属性値とを対応付けてログとして記憶する記憶部を更に有する、請求項1ないし29のいずれか1つに記載の情報処理装置。
【請求項31】
前記一群の記憶領域は第1領域と第2領域を含み、前記第1領域へのアクセス速度と前記第2領域へのアクセス速度とは異なる、請求項1ないし30のいずれか1つに記載の情報処理装置。
【請求項32】
終了判定手段を有し、所定の終了条件を満たしたか判定するステップと、当該終了条件を満たした場合に、前記設定手段、前記指定手段、前記判定手段、前記特定手段、および前記出力手段のうち少なくともいずれか1つにおいて処理を終了するステップとを実行し、
または、
開始判定手段を有し、所定の開始条件を満たしたか判定するステップと、前記条件を満たした場合に、前記設定手段、前記指定手段、前記判定手段、前記特定手段、および前記出力手段のうち少なくともいずれか1つにおいて処理を開始するステップとを実行する、
請求項1ないし31のいずれか1つに記載の情報処理装置。
【請求項33】
前記終了条件は、前記排除対象を除く以前の前記一群の記憶領域に含まれる記憶領域における前記需要量の和と前記排除対象を除いた以後の前記一群の記憶領域に含まれる記憶領域における前記需要量の和との差が指定された目標値以上になった場合である、請求項32に記載の情報処理装置。
【請求項34】
前記開始条件は、所定の時刻が到来した場合である、請求項32ないし33のいずれか1つに記載の情報処理装置。
【請求項35】
前記開始条件は、前記一群のデータに含まれるデータのうち少なくともいずれか1つに関連する指定された関連データに所定の程度以上の変化があった場合である、32ないし34のいずれか1つに記載の情報処理装置。
【請求項36】
前記開始条件は、前記一群の記憶領域に含まれる記憶領域における前記需要量の和、または当該記憶領域における前記供給量の和の少なくともいずれか一方において、所定の程度以上の変化があった場合である、請求項32ないし35のいずれか1つに記載の情報処理装置。
【請求項37】
前記終了条件は、前記一群の記憶領域に含まれる記憶領域における前記需要量の和が指定された第1閾値以下になった場合である、請求項32ないし36のいずれか1つに記載の情報処理装置。
【請求項38】
前記開始条件は、前記一群の記憶領域に含まれる記憶領域における前記需要量の和が指定された第2閾値よりも大きくなった場合である、請求項32ないし37のいずれか1つに記載の情報処理装置。
【請求項39】
前記第1閾値または前記第2閾値の少なくともいずれか一方は、前記一群の記憶領域に含まれる記憶領域における前記供給量の和に基づき、 前記第1閾値よりも前記第2閾値の方が大きい、請求項37または38に記載の情報処理装置。
【請求項40】
前記一群のデータに含まれるデータのうち少なくともいずれか1つに関連する指定された関連データ、または当該関連データに基づいて生成したデータを前記処理対象に指定する第2指定手段を備える、請求項1ないし39のいずれか1つに記載の情報処理装置。
【請求項41】
前記一群のデータに含まれるデータのうち少なくともいずれか1つを生成する生成手段を更に備える、請求項1ないし40のいずれか1つに記載の情報処理装置。
【請求項42】
前記一群のデータに含まれるデータのうち少なくともいずれか1つを入力する入力手段を更に備える、請求項1ないし41のいずれか1つに記載の情報処理装置。
【請求項43】
前記一群のデータに含まれるデータのうち少なくともいずれか1つは、他の主データを特定するための情報を有し、前記主データ、または前記主データを特定するための情報を出力する第2出力手段を備える、請求項1ないし42のいずれか1つに記載の情報処理装置。
【請求項44】
前記出力手段にて出力されたデータに基づく情報を表示する表示手段を備える、請求項1ないし43のいずれか1つに記載の情報処理装置。
【請求項45】
前記出力手段にて出力されたデータ、または出力された情報に基づいて特定されたデータを削除する削除手段を備える、請求項1ないし44のいずれか1つに記載の情報処理装置。
【請求項46】
前記出力手段にて出力されたデータ、または出力された情報に基づいて特定されたデータを保存する保存手段を備える、請求項1ないし45のいずれか1つに記載の情報処理装置。
【請求項47】
前記出力手段にて出力されたデータ、または出力された情報に基づいて特定されたデータから排除対象、または保持対象をユーザが更に特定する第2特定手段を更に備える、請求項1ないし46のいずれか1つに記載の情報処理装置。
【請求項48】
請求項1ないし47のいずれか1つに記載の情報処理装置と、
各々が固有の1つ以上の第2属性値を付与されるデータからなる一群のデータであって、前記一群のデータを第2処理対象として指定する指定手段と、
各々が前記一群のデータに含まれるデータのうちいずれか1つ以上が格納される記憶領域からなり、当該記憶領域に固有かつ所定の資源の供給量と、該記憶領域に格納されたデータに基づく前記資源の需要量に基づき前記資源の過不足を判定可能であるという特徴を有する一群の記憶領域であって、前記一群のデータに含まれるデータを当該データに付与された前記第2属性値に基づき、前記一群の記憶領域に含まれる記憶領域のうちいずれか1つに格納する設定手段と、
前記一群の記憶領域に含まれる記憶領域における前記資源の過不足を判定する判定手段と、
前記資源が不足すると判定された1つ以上の前記記憶領域に格納される1つ以上のデータからなる第2排除対象、または前記一群のデータのうち当該排除対象を除く1つ以上のデータからなる第2保持対象の少なくともいずれか一方を特定する特定手段と、
該特定されたデータを出力する出力手段と
を有する第2情報処理装置とを有し、
前記第2情報処理装置が出力したデータを前記情報処理装置における処理対象として指定する、または前記情報処理装置が出力したデータを前記第2情報処理装置における処理対象として指定する、
ことを特徴とする情報処理システム。
【請求項49】
各々が固有の1つ以上の属性値を付与されるデータからなり、前記属性値は1つ以上の固有の基準値を有し、かつ当該属性値と前記基準値との遠近と所定の1つ以上の境界値と前記基準値との遠近とを比較可能であるという特徴を有する一群のデータであって、前記一群のデータを処理対象として指定するステップと、
各々が前記一群のデータに含まれるデータのうちいずれか1つ以上が格納される記憶領域からなり、当該記憶領域に固有かつ所定の資源の供給量と、当該記憶領域に格納されたデータに基づく前記資源の需要量に基づき当該資源の過不足を判定可能であるという特徴を有する一群の記憶領域であって、前記一群のデータに含まれるデータを当該データに付与された前記属性値における比較の結果に基づき、前記一群の記憶領域に含まれる記憶領域のうちいずれか1つに格納するステップと、
前記一群の記憶領域に含まれる記憶領域における前記資源の過不足を判定するステップと、前記資源が不足すると判定された1つ以上の前記記憶領域に格納されるデータのうち、前記属性値における比較の結果に基づき、当該1つ以上の記憶領域において所定の1つ以上のデータの少なくとも一部分を除くデータからなる排除対象、または前記一群のデータのうち当該排除対象を除く1つ以上のデータからなる保持対象の少なくともいずれか一方を特定するステップと、
該特定されたデータ、または当該データを指定する情報を出力するステップと
を有し、
前記排除対象のデータのうち少なくともいずれか1つは、当該データに付与された属性値よりも前記基準値から遠い属性値が付与されたデータと前記基準値から近い属性値が付与されたデータを保持対象として有する、
ことを特徴とする情報処理方法。
【請求項50】
コンピュータに、
各々が固有の1つ以上の属性値を付与されるデータからなり、前記属性値は1つ以上の固有の基準値を有し、かつ当該属性値と前記基準値との遠近と所定の1つ以上の境界値と前記基準値との遠近とを比較可能であるという特徴を有する一群のデータであって、前記一群のデータを処理対象として指定するステップと、
各々が前記一群のデータに含まれるデータのうちいずれか1つ以上が格納される記憶領域からなり、当該記憶領域に固有かつ所定の資源の供給量と、当該記憶領域に格納されたデータに基づく前記資源の需要量に基づき当該資源の過不足を判定可能であるという特徴を有する一群の記憶領域であって、前記一群のデータに含まれるデータを当該データに付与された前記属性値における前比較の結果に基づき、前記一群の記憶領域に含まれる記憶領域のうちいずれか1つに格納するステップと、
前記一群の記憶領域に含まれる記憶領域における前記資源の過不足を判定するステップと、
前記資源が不足すると判定された1つ以上の前記記憶領域に格納されるデータのうち、前記属性値における比較の結果に基づき、当該1つ以上の記憶領域において所定の1つ以上のデータの少なくとも一部分を除くデータからなる排除対象、または前記一群のデータのうち当該排除対象を除く1つ以上のデータからなる保持対象の少なくともいずれか一方を特定するステップと、
該特定されたデータ、または当該データを指定する情報を出力するステップと を実行させるためのプログラムであって、
前記排除対象のデータのうち少なくともいずれか1つは、当該データに付与された属性値よりも前記基準値から遠い属性値が付与されたデータと前記基準値から近い属性値が付与されたデータを保持対象として有する、
ことを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データ群を更新する技術に関する。
【背景技術】
【0002】
実験・観測データ群や元のデータに修正を加えて得られるバックアップデータ群など、互いに関連性のある複数のデータが記憶された記憶媒体に新たなデータを記憶する際、記憶容量が圧迫されることを回避すべく、一般的に一部のデータを削除する(間引く)ことが行われている。代表的なデータを保存しておけば、差異がわずかであるデータの全てを保存していなくても、実質的に問題とならない場合が多いからである。
例えば、生成時点が古いデータから削除するという技術は、一般的により古いデータほど相対的に有用性が低いとの推定に基づいている。ただし、ある時点以前のデータが失われるため、それ以前のデータを推定することがもはや不可能となるリスクが高まる。
これに対し、特許文献1の技術は、新しいデータも間引きを行うことにより、古いデータにも保持される確率を与える。これは、古いデータにも一定の有用性が存在するとの推定に基づいている。この種の一群のデータを更新する際に重要なことは、一群のデータ全体としての(データ年齢などの)多様性をできるだけ損なわずに記憶容量を低減することであるといえる。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特許第22625538号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ただし、特許文献1の技術は、削除対象の決定が一群のデータ全体の多様性に直接基づいておらず、多様性への寄与が大きい希少なデータを間引く確率があるため、更新後の一群のデータの多様性を損なう場合がある。また、繰り返し更新することで、そうしたデータが削除される確率は増加するため、更新の頻度を制限する必要がある。
本発明は、更新の都度、データに付与された属性値の多様性への寄与の大小を判定し、寄与が小さいデータのみを排除することで、多様性への影響を最小限に抑えつつ一群のデータを更新することを目的とする。
【課題を解決するための手段】
【0005】
本発明は、一の態様において、各々が固有の1つ以上の属性値が付与されるデータからなり、前記属性値は1つ以上の固有の基準値を有し、かつ当該属性値と前記基準値との遠近と所定の1つ以上の境界値と前記基準値との遠近とを比較可能であるという特徴を有する一群のデータであって、前記一群のデータを処理対象として指定する指定手段と、各々が前記一群のデータに含まれるデータのうちいずれか1つ以上が格納される記憶領域からなり、当該記憶領域に固有かつ所定の資源の供給量と、当該記憶領域に格納されたデータに基づく前記資源の需要量に基づき当該資源の過不足を判定可能であるという特徴を有する一群の記憶領域であって、前記一群のデータに含まれるデータを当該データに付与された前記属性値における比較の結果に基づき、前記一群の記憶領域に含まれる記憶領域のうちいずれか1つに格納する設定手段と、前記一群の記憶領域に含まれる記憶領域における前記資源の過不足を判定する判定手段と、前記資源が不足すると判定された1つ以上の前記記憶領域に格納されるデータのうち、前記属性値における比較の結果に基づき、当該一つ以上の記憶領域において所定の1つ以上のデータの少なくとも一部分を除くデータからなる排除対象、または前記一群のデータのうち当該排除対象を除く1つ以上のデータからなる保持対象の少なくともいずれか一方を特定する特定手段と、該特定されたデータ、または当該データを指定する情報を出力する出力手段とを有し、前記排除対象のデータのうち少なくともいずれか1つは、当該データに付与された属性値よりも前記基準値から遠い属性値が付与されたデータと前記基準値から近い属性値が付与されたデータを保持対象として有する、ことを特徴とする情報処理装置を提供する。
【発明の効果】
【0006】
本発明によれば、データに付与された属性値の多様性を維持しつつ一群のデータが更新される。
【図面の簡単な説明】
【0007】
図1】情報処理装置10の機能構成を示す図。
図2】処理対象のデータとその属性値の基準値との距離を概念的に示す図。
図3】各記憶領域における需要量と供給量との関係を概念的に示す図。
図4】記憶領域と属性値との関係を概念的に示す図。
図5】情報処理装置10における動作の一例を示す図。
図6】処理内容の一例を示す図。
【発明を実施するための形態】
【0008】
以下、本発明を一群のデータのバックアップに適用した例を説明する。
図1は、情報処理装置10の機能構成を示す。情報処理装置10は、パーソナルコンピュータ等の汎用の情報処理装置であって、指定手段110、設定手段120、処理手段130、出力手段140、開始判定手段151、終了判定手段152、データ入力手段171、データ生成手段172、削除手段192、保存手段191、表示手段180、通信部210、記憶部200を含む。
【0009】
情報処理装置10における処理対象の一群のデータは、各々が固有の1つ以上の属性値が付与されるデータを含む。属性値は1つ以上の固有の基準値を有し、かつ当該属性値と基準値との遠近と所定の1つ以上の境界値と基準値との遠近とを比較可能であるという特徴を有する。境界値とは、例えば、1つの記憶領域が1つ以上の属性値の範囲に対応する場合に、当該範囲の端部の属性値をいう。
【0010】
一群のデータに含まれる各データは、例えば、テキストデータ、文書データ、表計算(*.doc、*.elsx、*.csv)、映像データ(*.mpeg等)または音声データ(*.wav、*.mp3等)であってもよい。データの種類や形式は問わない。また、一群のデータには異なる種類のデータが混在してもよい。要するに、複数のデータや複数のデータに分割可能なデータから構成されていればよい。各データには、少なくとも1つの属性値が付与される。
また、一群のデータに含まれるデータのうち少なくともいずれか1つは、他の主データを特定するための情報を有していてもよい。すなわち、処理対象のデータとは、データ値で構成される情報に限らず、他のデータを参照する情報(アドレス等)からなるものであってもよい。
【0011】
一の態様において、属性値は、所定のアルゴリズムに従って、当該データに基づいて決定される。あるいは、属性値は、そのデータに関連付けられた頻度的または確率的な値である。一の態様において、属性値の少なくとも1つは、当該データの出現頻度、または出現確率に基づいて決定される。あるいは、属性値の少なくとも1つは、当該データに関連付けられた時間的な属性値である。一の態様において、属性値の少なくとも1つは、当該データに対してアクセスがあった時間、または当該データが生成された時間に基づいて決定される。あるいは、属性値の少なくとも1つは、指定された少なくとも1つの基準データと当該データとの類似度を表す。一の態様において、基準データの少なくとも1つは、所定のアルゴリズムに従って、一群のデータに含まれるデータから1つ選択される。あるデータの類似度は、例えば、そのデータと基準データとの差分に基づいて算出される。
基準値は、基準データの属性値に等しくてもよいし、一群のデータに含まれる1以上のデータに付与された属性値の統計量(平均値や中央値等)に基づいて決定されてもよい。
【0012】
図2は、処理対象のデータとその属性値の一例を概念的に示す。例えば、一群のデータDは、m個のテキストファイルD1〜Dmで構成され、各データ(テキストファイル)は固有の属性値としてそのファイルが最後にアクセスされた時刻T(i)についての情報を内包している。すなわち、一群のデータDは、ある文書に対して、修正を繰り替えして生成された文書群のデータである。同図は、各データを、属性値を表す一次元の時間軸上にプロットしたものである。すなわち、データファイルD1が一番最近にアクセスされた(最も新しい)ファイルであり、データDmが最も古いファイルである。属性値T(i)の分布の疎密は、一群のデータDの最終アクセス時刻の多様性に関係する。例えば、属性値の分布が時間軸上のある領域に集中している場合は、そのデータ群は多様性が乏しく、逆に時間軸上で分散している(つまり新しいものから古いものまで存在する)データ群は多様性が富んでいるということができる。
【0013】
記憶部200は、半導体メモリやハードディスクなどの記憶装置であって、情報処理装置10のOSのほか、OS上で動作して以下に説明する機能を情報処理装置10に実現させるためのプログラムが格納される。加えて、記憶部200には、処理の対象となり得るデータや上記プロラムによって参照される各種パラメータが格納される。より具体的には、記憶部200には、一群のデータを記憶するための複数の記憶領域(W1、W2、W3・・・)が構築される。各記憶領域は、メモリアドレスやセクタ等の記憶媒体の物理的構造と対応していてもよいし、フォルダやディレクトリ等のOS上でソフトウェア的に定義された記憶領域と対応するものであってもよい。
【0014】
一群の記憶領域には、一群のデータに含まれるデータのうちいずれか1つ以上が格納される。
【0015】
一の態様において、一群の記憶領域Wは第1領域と第2領域とを含み、第1領域へのアクセス速度と第2領域へのアクセス速度とは異なっていてもよい。
また、記憶部200は、更に、少なくとも一群のデータに含まれるデータを識別する情報と当該データに付与された属性値とを対応付けて、ログとして記憶してもよい。
【0016】
指定手段110、設定手段120、処理手段130、出力手段140、削除手段192、保存手段191、データ生成手段172、データ入力手段171、開始判定手段151、終了判定手段152は、CPU等のプロセッサあるいはプロセッサ上で実現される機能モジュールとして実装される。
【0017】
指定手段110は、一群のデータを処理対象として指定する。指定手段110は、一群のデータに含まれるデータのうち少なくともいずれか1つに関連する指定された関連データ、または当該関連データに基づいて生成したデータを処理対象に指定する第2指定手段111を有していてもよい。例えば、関連データをバックアップデータ群の元データとした場合、バックアップデータ群および編集中の元データのコピーを処理対象に指定してもよい。
【0018】
設定手段120は、一群のデータに含まれるデータが、当該データに付与された属性値における比較の結果に基づき、一群の記憶領域に含まれる記憶領域のうちいずれか1つに格納されるように、記憶領域を設定する。
また、各記憶領域に固有かつ所定の資源の供給量と、当該記憶領域に格納されたデータに基づく資源の需要量とに基づき当該資源の過不足を判定可能である。資源は演算リソースであってもよいし、通信リソースであってもよいし、記憶リソースであってもよいし、これらとは無関係な概念であってもよい。要するに、データやデータが指す対象を保持する際に利用可能なものであり、データやデータが指す対象を際限なく多く保持しようと想定した際に不足する主だったものである。
【0019】
一の態様において、記憶リソースは一群のデータそれ自体を格納するための記憶容量である。
図3は、各記憶領域における資源の供給量と需要量の関係の一例を模式的に表したものである。同図の例では、記憶領域W1〜W6で構成される一群の記憶領域Wのうち、記憶領域W4においては記憶リソースが不足しており、記憶領域W1、W3、W5、W6においては供給過多な状態(すなわち、データを格納する余裕がまだある状態)である。
【0020】
一の態様において、各データには固有の要求量が付与され、各記憶領域における需要量は、当該記憶領域に含まれるデータに付与された要求量に基づいて決定される。要求量は、例えば、当該データに基づいて特定される通信手段において所定の期間で通信される通信量に基づいて決定される。あるいは、要求量は、当該データに基づいて特定される演算手段において所定の期間で演算される演算量に基づいて決定さてもよい。あるいは、要求量は、当該データの総数または総量に基づいて決定される。あるいは、要求量は、当該データに基づいて特定される主データの総数または総量に基づいて決定されてもよい。あるいは、要求量は、入力手段160を介してユーザによって入力された値に基づいて決定されてもよい。
【0021】
ここで、一群の記憶領域に含まれる記憶領域における供給量の和は、通信部210などの指定された通信手段において所定の期間で通信される通信量に基づいて決定される。あるいは、情報処理装置10が有するプロセッサなどの指定された演算手段において所定の期間で演算される演算量に基づいて決定されてもよい。あるいは、供給量の和は、指定された記憶媒体に記憶可能なデータの総量、または総数に基づいて決定されてもよい。
【0022】
一の態様において、設定手段120は、一群の記憶領域に含まれる記憶領域の総数を設定するステップ、境界値に基づいて一群の記憶領域に含まれる記憶領域に対応する属性値の範囲を設定するステップ、または一群の記憶領域に含まれる記憶領域における供給量を設定するステップのうち少なくともいずれか1つを実行する。
【0023】
また、設定手段120は、一群の記憶領域に含まれる記憶領域の総数、一群の記憶領域に含まれる記憶領域に対応する属性値の範囲、または一群の記憶領域に含まれる記憶領域における供給量の少なくともいずれか1つは、入力手段160を介してユーザによって入力された値に基づいて決定してもよい。
【0024】
設定手段120は、一群のデータに含まれるデータに付与された属性値が一群の記憶領域に含まれる記憶領域に対応する属性値の範囲を満たした場合、当該データの少なくとも一部分を当該記憶領域の1つに格納し(割り当て)てもよい。データの一部分とは、例えばデータが複数のデータ値からなる場合において、データ値を部分的に切り出して再定義される1つのデータである。
【0025】
なお、設定手段120は、第2設定手段121を用いて、入力手段160を介してユーザによって入力された情報のみに基づいて、一群の記憶領域に含まれる記憶領域を設定してもよい。
【0026】
設定手段120は、一の態様において、一群のデータに含まれるデータに付与された属性値のうち基準値から最も遠い属性値、または推定される最も遠い属性値に基づいて、一群の記憶領域に含まれる記憶領域の総数を設定する。例えば、各記憶領域に対応する属性値の範囲を予め等しい大きさに設定する場合、基準値から最も遠い属性値を記憶領域のいずれか1つに格納されるために最低限必要な記憶領域の数を記憶領域の総数に設定してもよい。あるいは、設定手段120は、一群のデータに含まれるデータに付与された要求値のうち最大値、または推定される最大値に基づいて、一群の記憶領域に含まれる記憶領域の総数を設定してもよい。この場合、推定は、一群のデータに含まれるデータの総数未満のデータと一群のデータに含まれるデータの総数に基づいて行われる。例えば、秘書問題の最適ポリシーに則れば、第一にデータの総数をネイピア数で割った値の整数部の数のデータの中で最も基準値から遠い属性を検索し、第二に残りの全データの属性値を検索する過程でより基準値から遠い属性値に当たれば検索を終了し、その値を推定される最も遠い属性値としてもよい。あるいは、設定手段120は、一群の記憶領域に含まれる記憶領域における供給量の和に基づいて、一群の記憶領域に含まれる記憶領域の総数を設定してもよい。例えば、供給量の和を要求値の最大値で割った値の整数部を記憶領域の総数に設定してもよい。
【0027】
一の態様において、設定手段120は、一群の記憶領域に含まれる記憶領域の総数に基づいて、一群の記憶領域に含まれる記憶領域における供給量を設定する。あるいは、設定手段120は、一群のデータに含まれるデータに付与された要求値のうち最大値、または推定される最大値に基づいて、一群の記憶領域に含まれる記憶領域における供給量を設定してもよい。この場合、推定が一群のデータに含まれるデータの総数未満のデータと一群のデータに含まれるデータの総数に基づく。
あるいは、設定手段120は、一群の記憶領域に含まれる記憶領域に対応する属性値の範囲に基づいて、一群の記憶領域に含まれる記憶領域における供給量を設定してもよい。例えば、供給量は記憶領域に対応する属性値の範囲の広さに比例して設定してもよい。あるいは、設定手段120は、一群の記憶領域に含まれる記憶領域における供給量の和に基づいて、一群の記憶領域に含まれる記憶領域における供給量を設定してもよい。例えば、供給量の和を記憶領域の総数で割った値を各記憶領域の供給量に設定してもよい。
あるいは、設定手段120は、一群の記憶領域に含まれる記憶領域における供給量の和を一群の記憶領域に含まれる記憶領域における固有の分配率で内分することで一群の記憶領域に含まれる記憶領域における供給量を設定してもよい。ここで、一群の記憶領域に含まれる記憶領域における分配率の比は、一群の記憶領域に含まれる記憶領域における需要量の比と等しくない。分配率は、例えば、一群の記憶領域に含まれる記憶領域における需要量、または対応する属性値の範囲に基づいて決定される。例えば、分配率は記憶領域に対応する属性値の範囲の広さに比例して設定してもよいし、ある記憶領域における需要量が0であればその記憶領域における分配率を0、需要量が0でなければ1と設定してもよい。
【0028】
一の態様において、設定手段120は、一群の記憶領域に含まれる記憶領域の総数に基づいて、2つ以上の境界値を設定する。あるいは、設定手段120は、一群のデータに含まれるデータに付与される属性値のうち基準値から最も遠い属性値、または最も遠いと推定される属性値に基づいて、2つ以上の境界値を設定してもよい。この場合において、推定は一群のデータに含まれるデータの総数未満のデータと一群のデータに含まれるデータの総数に基づく。
【0029】
設定手段120は、所定の数列に基づいて2つ以上の境界値を設定してもよい。ここで、当該数列を特徴付ける変数の総数は、一群の記憶領域に含まれる記憶領域の総数から1を引いた数未満である。所定の数列は、0より大きい所定の初項をA、基準値をB、1より大きく2以下の定数をC、一群のデータに含まれるデータに付与される属性値のうち基準値から最も遠い属性値または最も遠いと推定される属性値をM、一群の記憶領域に含まれる記憶領域の総数をNとする場合、公差が(|M-B|-A)/(N-C)で定義される等差数列、または公比が(|M-B|/A)^(1/(N-C))で定義される等比数列である。ここで、推定は、一群のデータに含まれるデータの総数未満のデータと一群のデータに含まれるデータの総数に基づく。例えば、Aはドキュメントの有意な編集が行われる時間(1分程度)、Bを最も新しいデータの最終アクセス時刻、Cを1.5と設定し、境界値はその時刻数列を最も新しいデータの最終アクセス時刻から引いた時刻としてもよい。
【0030】
図4は、設定手段120にて設定された一群の記憶領域Wと各記憶領域に対応する属性値Tとの関係の一例を概念的に示す。一群の記憶領域Wは、目標とする属性値の分布に応じて設定される。同図においては、7つの境界値T1〜T7によって、各記憶領域W1〜W6が対応する属性値の境界が定義された例を示す。この場合、例えば、格納対象の一群のデータDのうちT5≦T<T6を満たす属性値が付与されたデータは、境界値T5およびT6で規定される記憶領域W5に格納されることになる。境界値の決定方法やデータとの対応付について特に限定はないが、各記憶領域の供給値が等しい場合において属性値が当該データの生成時間を表すものである場合は、同図にように、基準値に近い属性が付与されたデータほど疎に、基準値から遠い属性値が付与されたデータほど密に記憶されるように設定されるのが好ましい。一般的に、新しいデータのほうが有用である確率が高いからである。
【0031】
処理手段130は、判定手段131および特定手段132を含み、記憶領域ごとに保持対象または排除対象のデータを決定する。
判定手段131は、一群の記憶領域に含まれる記憶領域における資源の過不足を判定する。
【0032】
特定手段132は、資源が不足すると判定された1つ以上の記憶領域に格納されるデータのうち当該記憶領域の各々から所定の1つ以上のデータの少なくとも一部分を除くデータからなる排除対象、または一群のデータのうち当該排除対象を除く1つ以上のデータからなる保持対象のうち、少なくともいずれか一方を特定する。ここで、排除対象のデータのうち少なくともいずれか1つは当該データに付与された属性値よりも基準値から遠い属性値が付与されたデータと、基準値から近い属性値が付与されたデータを保持対象として有する。
【0033】
具体的には、特定手段132は、所定の乱択アルゴリズムに従って、排除対象とするデータ、または保持対象とするデータを特定する。あるいは、特定手段132は、一群のデータに含まれるデータに付与された属性値のうち基準値からより遠い属性値が付与されたデータ、またはより遠い属性値が付与されたと推定されるデータを、優先して保持対象として特定する。または、特定手段132は、一群のデータに含まれるデータに付与された属性値のうち基準値からより近い属性値が付与されたデータ、またはより近い属性値が付与されたと推定されるデータを優先して、排除対象として特定する。この推定は、一群のデータに含まれるデータの総数未満のデータと一群のデータに含まれるデータの総数に基づいて行われる。例えば、資源が不足すると判定された記憶領域に格納されるデータのうち基準値から最も近い属性値が付与された1つのデータを排除対象とし、残りの全データを保持対象としてよい。または、資源が不足すると判定された記憶領域に格納されるデータのうち基準値からの距離に比例する確率で1つのデータを排除対象とし、残りの全データを保持対象としてもよい。または、資源が不足すると判定された記憶領域に格納されるデータのうち無作為に選択した1つのデータを排除対象とし、残りを保持対象としてもよい。
【0034】
特定手段132は、一群の記憶領域に含まれる記憶領域のうち当該記憶領域における需要量が当該記憶領域における供給量以下となる記憶領域に関連付けられたデータを、保持対象として特定してもよい。例えば、排除対象とするデータを1つずつ決定する過程で、排除対象を除くことによってある記憶領域における需要量が供給量を下回ることが確定した場合、その記憶領域に格納された残りのデータは保持対象としてもよい。
あるいは、特定手段132は、一群の記憶領域に含まれる記憶領域のうち当該記憶領域における需要量と当該記憶領域における供給量との乖離がより大きい記憶領域、または乖離がより大きいと推定される記憶領域に関連付けられたデータを優先して、排除対象として特定してもよい。この推定は、一群の記憶領域に含まれる記憶領域の総数未満の記憶領域と一群の記憶領域に含まれる記憶領域の総数に基づく。例えば、各記憶領域における需要量から供給量を割った値、または需要量から供給量を引いた値が最も大きい記憶領域に格納されたデータのうち1つのデータを排除対象とし、残りの全データを保持対象としてもよい。
【0035】
特定手段132は、第2特定手段133を有してもよい。第2特定手段133は、出力手段140または第2出力手段141にて出力されたデータまたは該出力された情報に基づいて特定されたデータのうち、最終的に排除対象または保持対象とすべきデータを、入力手段160を介して受けつけたユーザからの指示に基づいて、確定する。すなわち、特定手段132にて排除対象または保持対象と決定されたデータをそのまま採用するか否かをユーザに判断させる。
【0036】
出力手段140は、処理手段130にて特定されたデータ、または当該データを指定する情報を出力する。出力手段140は、当該データの主データ、または主データを特定するための情報を出力してもよい。
【0037】
開始判定手段151は、所定の開始条件を満たしたか否かを判定し、開始条件を満たした場合に、設定手段120、処理手段130、判定手段131、特定手段132、および出力手段140のうち少なくともいずれか1つにおいて処理が開始されるように、設定手段120、処理手段130、判定手段131、特定手段132、および出力手段140の少なくともいずれかに制御信号を出力する。
【0038】
開始条件とは、例えば、所定の時刻が到来した場合に処理を開始するというものである。これ以外にも、開始条件を、一群のデータに含まれるデータのうち少なくともいずれか1つに関連する指定された関連データに所定の程度以上の変化があった場合に処理を開始すると定めてもよい。例えば、開始条件はバックアップデータ群の元データに変更があった場合、または元データが上書き保存されて最終保存時刻が更新された場合であってもよい。あるいは、一群の記憶領域に含まれる記憶領域における需要量の和、または当該記憶領域における供給量の和の少なくともいずれか一方において、所定の程度以上の変化があった場合に処理を開始してもよい。例えば、開始条件は、指定されたフォルダに記憶されたデータ量や指定された記憶媒体の空き容量に変化があった場合であってもよい。あるいは、一群の記憶領域に含まれる記憶領域における需要量の和が指定された第2閾値よりも大きくなった場合に処理を開始してもよい。
【0039】
終了判定手段152は、所定の終了条件を満たしたか判定し、終了条件を満たした場合に、指定手段110、設定手段120、判定手段131、特定手段132、および出力手段140のうち少なくともいずれか1つにおいて処理が終了するように、設定手段120、判定手段131、特定手段132、出力手段140のうち少なくともいずれかに制御信号を出力する。
終了条件とは、例えば、排除対象を除く以前の一群の記憶領域に含まれる記憶領域における需要量の和と排除対象を除いた以後の一群の記憶領域に含まれる記憶領域における需要量の和との差が指定された目標値以上になった場合である。目標値は、入力手段160を介してユーザによって入力された値に基づいて決定されてもよい。
あるいは、終了条件とは、一群の記憶領域に含まれる記憶領域における需要量の和が指定された第1閾値以下になった場合である。
【0040】
一の態様において、開始判定手段151や終了判定手段152にて用いられる第1閾値、または第2閾値の少なくともいずれか一方は、一群の記憶領域に含まれる記憶領域における供給量の和に基づき、第1閾値よりも第2閾値の方が大きくなるように設定される。なお、第1閾値、または第2閾値のうち少なくともいずれか一方は、入力手段160を介してユーザによって入力された値に基づいて決定されてもよい。例えば、イベントデータレコーダーに記憶可能なデータ量を第1閾値、第1閾値から1日分の録画に必要なデータ量を引いたデータ量を第2閾値としてもよい。
【0041】
データ生成手段172は、一群のデータに含まれるデータのうち少なくともいずれか1つを生成する。
【0042】
入力手段160は、一群のデータに含まれるデータのうち少なくともいずれか1つを入力する。一群のデータに含まれるデータのうち少なくともいずれか1つに付与する属性値、基準値、または境界値の少なくともいずれか1つは、入力手段160を介してユーザによって入力された値に基づいて決定されてもよい。
【0043】
削除手段192は、出力手段140、または第2出力手段141にて出力されたデータ、または出力された情報に基づいて特定されたデータを記憶部200から削除する。
【0044】
通信部210は、LANカード等の他のコンピュータと情報の授受を行うための通信インタフェースやUSBメモリ等のなどの外部記憶装置である。
【0045】
表示手段180は液晶ディスプレイ等の表示装置であって、出力手段140にて出力されたデータに基づく情報を表示する。
【0046】
入力手段160は、キーボード、マウス、タッチパネル等の入力デバイスであって、情報や指示内容の入力を行うためにユーザによって操作される。
【0047】
図5は情報処理装置10における動作の一例を示す。まず、指定手段110において処理対象のデータが指定される(S502)。続いて、開始判定手段151において開始条件が充足されているかの監視が開始され(S504)、開始条件が充足された場合は、設定手段120はデータを記憶領域に割り当てる処理を実行する(S506)。続いて、処理手段130は、判定対象の記憶領域を決定し(S508)、判定対象の記憶領域における過不足を判定する(S510)。特定手段132は、その領域において排除または保持の対象のデータを決定する(S512)。続いて、終了判定手段152は終了条件が充足されているかを判定する(S514)。充足しない場合は、記憶領域を変え、S510およびS512の処理を繰り返す。終了条件が充足された場合、排除/保持の決定に応じて予め定められた処理を行う(S516)。具体的には、出力手段140において排除/保持対象のデータが出力され、保存手段191や削除手段192において保持または削除が実行される。こうして、元の一群のデータから新たな一群のデータ(元のデータと同一の場合もあり得る)が生成される。
【0048】
図6は、図5のS506〜S516に係る処理内容の一例を概念的に説明したものである。
処理対象のデータとして、図2のように生成タイミングを属性値として有するデータから構成され、ある1つの元データをユーザが異なるタイミングで編集して得られた複数のD1〜D7からなる一群のデータが特定されたとする(同図(a))。この一群のデータは、逐次更新されることが想定されているものである。いま、所定のアルゴリズムに従って、この一群のデータを記憶するための領域として図4に示す7つの記憶領域W0〜W6が設定され、全部で7つのデータのみ格納可能であると設定されたとする。また、各記憶領域の供給量はデータ1つとする。このアルゴリズムは、全体として、時系列上でより過去にいくほどより疎な時間間隔でデータが配列されるように記憶領域が設定されている。また、このアルゴリズムにおいては、基準値(一群の記憶領域の境界値の一方)として現時点(処理を開始した時刻)が選択される一方、一群の記憶領域の境界値の他方は不変と設定されるものとする。
また、開始判定手段151が採用する開始条件として、一群のデータとして新たに1つデータが生成されたときに処理を開始するという条件が設定され、終了判定手段152が採用する終了条件として、一群のデータの総数が7つ以下になったときに処理を終了するという条件が設定されたとする。
【0049】
いま、時刻t=t1において、同図(b)のように、この一群のデータに属するデータとしてD8が新たに生成されたとすると、開始条件が満たされ、基準値(現時刻)に近い記憶領域W0から順に過不足判定が実行される。この結果、記憶領域W3においては、D6とD5とが割り当てられ、需要量はデータ2つになるため、供給量が不足と判定される。2つの属性値のうちより近い属性値が付与されたデータであるD6が削除対象と決定され、それ以外のデータは保持対象であると決定される。このデータの削除が実行され、一連の処理が完了したとする。この結果、{D1、D2、D3、D4、D5、D6、D7}からなる一群のデータが{D1、D2、D3、D4、D5、D7、D8}というデータから成る一群のデータに更新される。
【0050】
この後、t=t2においてさらにデータD9が1個追加されたとする(同図(c))。この際、設定手段120は、最も遠い属性値が付与されたデータに対応する記憶領域W6の右端の境界値(換言すると、一群の記憶領域W全体の基準値でない方の境界値)の値が不変となるように記憶領域Wを設定する。そして、図5のS506〜516の処理が実行され、この結果、記憶領域W4においてデータD4が削除対象と決定されることになる。さらにその後、t=t3においてデータD10が追加されると(同図(d))、同様の処理が行われ、記憶領域W6においてD2が削除される。
さらにその後、t=t4において、データD11が追加されると(同図(e))、記憶領域W2においてD9が削除される。このように、4回の処理を経た結果、{D1、D2、D3、D4、D5、D6、D7}という一群のデータが{D1、D2、D3、D4、D5、D7、D8}、{D1、D2、D3、D5、D7、D8、D9}、{D1、D3、D5、D7、D8、D9、D10}、{D1、D3、D5、D7、D8、D10、D11}というデータ群に更新される。
【0051】
このように、本実施例においては、記憶領域の設定に従ったデータ群の多様性が維持される。また、仮にデータサイズが実質的に同じであるとすると、データが追加されても、必要なデータのみ保持(バックアップ)されるから、記憶容量を圧迫しない。
【0052】
さらに鳩の巣原理により、終了条件を満たさない場合は、複数のデータが属す記憶領域の存在は保証されるため、一連の処理が実行可能な任意の頻度で繰り返し更新可能である。これにより、生成タイミングの多様性を維持しつつ、データ数等を制限できる。
【0053】
本実施例のように、作成タイミングが古いデータではなく、新しいデータから削除する点が従来技術にはない本発明の特徴である。従来技術のように、新しいデータの追加に伴い、古い在庫(データ)から削除する場合、新しいデータからなるデータ群へ更新することになり、多様性を損なうためである。
【0054】
<その他の実施例>
情報処理装置10の出力手段140にて出力された情報を、情報処理装置10と同様の機能を有する他の情報処理装置へ送信し、当該他の情報処理装置において、該情報に基づいて削除や保持の処理を行ってもよい。
【0055】
上記実施例における処理の終了や開始の条件は一例であって、任意の組み合わせを採用してもよい。また、記憶領域の設定方法は例示に過ぎない。実現したいデータ群の属性値に関する多様性に応じて設定すればよい。また、本発明の処理対象のデータの種類は任意である。
また、本発明の用途は、データのバックアップに限定されない。上記実施例は、データの多様性を維持する際に資源としての記憶リソースをどのように制御するかを規定したものであると把握できる。記憶リソースは資源の一例であって、記憶リソースを演算リソース(プロセッサの演算能力)や通信リソース(データ転送速度)に置き換えて本発明を適用することができる。すなわち、データ群に対して演算処理や転送処理を行う際に、そのデータ群の多様性ができるだけ維持されるように、限られた演算リソースや通信リソースを振り分けてもよい。より具体的には、演算や転送の実行対象となるデータと演算や転送の実行対象とならないデータが決定されることになる。
【0056】
各々が解の候補となるデータ群と、各々の適用度に基づいて最適解を探索するアルゴリズムの1つである遺伝的アルゴリズムは、汎用性に優れるが、真の最適解とは程遠い近似解に収束する場合がある。この真の最適解を得ることが困難という問題は、例えば、記憶リソースが似通った候補ばかりに占有される初期収束という現象が起きた場合など、データ群から多様性が損なわれた際に起こり易い。本発明は、データに付与された属性値の多様性を維持しつつ、一群のデータを更新するための技術であるから、遺伝的アルゴリズムの初期収束の問題を軽減することができる。
例えば、属性値は、個体(データ)の適用度に基づいて決定してもよい。基準データは、最も適用度が高い個体(データ)といてもよい。データ生成手段172は、個体(データ)を疑似乱数によって生成してもよい。
【0057】
要するに、本発明に係る情報処理装置は、各々が固有の1つ以上の属性値が付与されるデータからなり、属性値は1つ以上の固有の基準値を有し、かつ当該属性値と基準値との遠近と所定の1つ以上の境界値と基準値との遠近とを比較可能であるという特徴を有する一群のデータであって、一群のデータを処理対象として指定する指定手段と、各々が一群のデータに含まれるデータのうちいずれか1つ以上が格納される記憶領域からなり、当該記憶領域に固有かつ所定の資源の供給量と、当該記憶領域に格納されたデータに基づく資源の需要量に基づき当該資源の過不足を判定可能であるという特徴を有する一群の記憶領域であって、一群のデータに含まれるデータを当該データに付与された属性値における比較の結果に基づき、一群の記憶領域に含まれる記憶領域のうちいずれか1つに格納する設定手段と、一群の記憶領域に含まれる記憶領域における資源の過不足を判定する判定手段と、資源が不足すると判定された1つ以上の記憶領域に格納されるデータのうち当該記憶領域の各々から所定の1つ以上のデータの少なくとも一部分を除くデータからなる排除対象、または一群のデータのうち当該排除対象を除く1つ以上のデータからなる保持対象の少なくともいずれか一方を特定する特定手段と、該特定されたデータ、または当該データを指定する情報を出力する出力手段とを有し、排除対象のデータのうち少なくともいずれか1つは当該データに付与された属性値よりも基準値から遠い属性値が付与されたデータと、基準値から近い属性値が付与されたデータを保持対象として有するものであればよい。
【産業上の利用可能性】
【0058】
本発明はファイル自体に組み込むことで上書き保存の都度、そのファイルの自動バックアップとバックアップデータの自動削除を行わせることができる。
【0059】
また、種々のデータを蓄積・管理するためのソフトウェアや情報処理装置であるバージョニングファイルシステムやバージョン管理システム、デジタルカメラやイベントデータレコーダーとして用いることができる。従来は無駄になっていたハードディスクの空き容量をこれらのデータに割り当てても、必要に応じて随時空き容量を確保できるため、記憶リソースを最大限活用することができる。
【0060】
本発明は、記憶リソース以外にも限られた資源で許された群における多様性を最大化する意思決定支援機能を提供する。例えば、生産・在庫管理などの意思決定支援として本方法を取り入れることで、限られた在庫のバラエティを豊かにすることができる。あるいは、遺伝的アルゴリズムなどの初期収束が問題となる最適化アルゴリズムにおいて、淘汰の過程に本プログラムを実装することで、初期収束を防止する効果が期待できる。
【0061】
また、本発明によれば、入力されたパラメータセットを属性値とすることで、多様性を損なわずにパラメータセットを取捨選択することができる。これにより、フレーム問題を防止する効果が期待できる。
【符号の説明】
【0062】
10・・・情報処理装置、110・・・指定手段、111・・・第2指定手段、120・・・設定手段、121・・・第2設定手段、130・・・処理手段、131・・・判定手段、132・・・特定手段、133・・・第2特定手段、140・・・出力手段、141・・・第2出力手段、151・・・開始判定手段、152・・・終了判定手段、160・・・入力手段、171・・・データ入力手段、172・・・データ生成手段、180・・・表示手段、191・・・保存手段、192・・・削除手段、200・・・記憶部、210・・・通信部
【要約】
【課題】データに付与された属性値の多様性を維持しつつ一群のデータを更新すること。
【解決手段】情報処理装置は、各々が固有の1つ以上の属性値が付与された前記一群のデータを処理対象として指定する指定手段と、属性値の比較結果に基づき、一群の記憶領域に含まれる記憶領域のうちいずれか1つに格納する設定手段と、前記一群の記憶領域に含まれる記憶領域における前記資源の過不足を判定する判定手段と、資源が不足すると判定された1つ以上の前記記憶領域に格納されるデータのうち当該記憶領域の各々から所定の1つ以上のデータを除くデータからなる排除対象、当該排除対象を除くデータからなる保持対象を特定する特定手段と、該特定されたデータまたは当該データを指定する情報を出力する出力手段とを有する。排除対象のデータは、基準値から遠い属性値が付与されたデータと前記基準値から近い属性値が付与されたデータを保持対象とする。
【選択図】図1
図1
図2
図3
図4
図5
図6