【課題を解決するための手段】
【0006】
本発明は、上記の課題を解決するために、以下の事項を提案している。なお、理解を容易にするために、本発明の実施形態に対応する符号を付して説明するが、これに限定されるものではない。
【0007】
(1)本発明は、ユーザが送受信するデータの重要度を判定する重要度判定装置であって、データを送受信する自己のクライアントモジュールとデータを送受信する他のクライアントモジュールからデータ重要度を判定するためのデータを受信する受信手段(例えば、
図2のデータ読込処理部202に相当)と、該受信したデータに対して、圧縮処理を行う圧縮処理手段(例えば、
図2のデータ圧縮処理部205に相当)と、該圧縮処理後のデータをサービスごとに分類する分類手段と、該分類したデータについて、その重要度を判定できるように加工する加工手段と、該加工したデータを保存する保存手段(例えば、
図2のデータ特徴量抽出処理部210に相当)と、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する判定手段と、を備えたことを特徴とする重要度判定装置を提案している。
【0008】
この発明によれば、受信手段は、データを送受信する自己のクライアントモジュールとデータを送受信する他のクライアントモジュールからデータの重要度を判定するためのデータを受信する。圧縮処理手段は、受信したデータに対して、圧縮処理を行う。分類手段は、圧縮処理後のデータをサービスごとに分類する。加工手段は、分類したデータについて、その重要度を判定できるように加工する。保存手段は、加工したデータを保存する。判定手段は、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する。したがって、ネットワーク上を流れる他のユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。また、受信したデータを圧縮することにより、処理速度を高速化することができる。
【0009】
(2)本発明は、(1)の重要度判定装置について、前記加工手段が一方向性関数を用いて、データの加工を行うことを特徴とする重要度判定装置を提案している。
【0010】
この発明によれば、加工手段が一方向性関数を用いて、データの加工を行う。したがって、一方向性関数を用いることにより、情報の漏えいを防止することができる。
【0011】
(3)本発明は、(1)の重要度判定装置について、前記判定手段が、匿名性を評価することによりデータの重要度を判定することを特徴とする重要度判定装置を提案している。
【0012】
この発明によれば、判定手段が、匿名性を評価することによりデータの重要度を判定する。したがって、たとえば、k−匿名性やl−多様性を評価することにより、情報の重要度を自動的に判別することができる。
【0013】
(4)本発明は、(1)の重要度判定装置について、前記判定手段が、データ内の属性の種類に関する評価値によりデータの重要度を判定することを特徴とする重要度判定装置を提案している。
【0014】
この発明によれば、判定手段が、データ内の属性の種類に関する評価値によりデータの重要度を判定する。したがって、評価値を、評価値={(重み付け値)×(自己のデータを含む属性値の数−自己のデータを含まない属性値の数)}の数式で算出することにより、属性値の変化を定量化して、データの重要度を自動的に判別することができる。
【0015】
(5)本発明は、(1)の重要度判定装置について、前記判定手段が、データ量の差分に関する評価値によりデータの重要度を判定することを特徴とする重要度判定装置を提案している。
【0016】
この発明によれば、判定手段が、データ量の差分に関する評価値によりデータの重要度を判定する。したがって、評価値を、評価値={(重み付け値)×(データの総数)/(自己のデータを含む同じ属性を持つデータの数)}の数式で算出することにより、データの重要度を自動的に判別することができる。
【0017】
(6)本発明は、ユーザが送受信するデータの重要度を判定する重要度判定装置であって、前記ユーザから送られてくるネットワークを流れるデータを受信する受信手段(例えば、
図11のデータ読込処理部202に相当)と、該受信したデータに対して、圧縮処理を行う圧縮処理手段(例えば、
図11のデータ圧縮処理部205に相当)と、該圧縮処理後のデータを各利用者ごとに分類する分類手段と、該分類したデータについて、その重要度を判定できるように加工する加工手段と、該加工したデータを保存する保存手段と、該保存したデータから利用者ごとに特徴ベクトルを作成する特徴ベクトル作成手段(例えば、
図11の特徴ベクトル作成処理部611に相当)と、新たに送られてくるデータと前記作成した特徴ベクトルとの類似度を評価してデータの重要度を判定する判定手段(例えば、
図11のデータ特徴量抽出処理部610に相当)と、を備えたことを特徴とする重要度判定装置を提案している。
【0018】
この発明によれば、受信手段は、ユーザから送られてくるネットワークを流れるデータを受信する。圧縮処理手段は、受信したデータに対して、圧縮処理を行う。分類手段は、圧縮処理後のデータを各利用者ごとに分類する。加工手段は、分類したデータについて、その重要度を判定できるように加工する。保存手段は、加工したデータを保存する。特徴ベクトル作成手段は、保存したデータから利用者ごとに特徴ベクトルを作成する。判定手段は、新たに送られてくるデータと作成した特徴ベクトルとの類似度を評価してデータの重要度を判定する。したがって、ネットワーク上を流れるユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。
【0019】
(7)本発明は、(6)の重要度判定装置について、前記加工手段が一方向性関数を用いて、データの加工を行うことを特徴とする重要度判定装置を提案している。
【0020】
この発明によれば、加工手段が一方向性関数を用いて、データの加工を行う。したがって、一方向性関数を用いることにより、情報の漏えいを防止することができる。
【0021】
(8)本発明は、(6)の重要度判定装置について、前記判定手段が、データの類似度を前記特徴ベクトル間の相関性により評価することを特徴とする重要度判定装置を提案している。
【0022】
この発明によれば、判定手段が、データの類似度を前記特徴ベクトル間の相関性により評価する。したがって、保存されている特徴ベクトルと受信データとの類似度を数値化して相関性を評価することによって、情報の重要度を自動的に判別することができる。
【0023】
(9)本発明は、(6)の重要度判定装置について、前記特徴ベクトルには、個々に重み係数が設定されていることを特徴とする重要度判定装置を提案している。
【0024】
この発明によれば、特徴ベクトルには、個々に重み係数が設定されている。したがって、重要度が高い特徴ベクトルについては、重み係数を大きくすることにより、的確に、情報の重要度を自動的に判別することができる。
【0025】
(10)本発明は、(1)から(9)の重要度判定装置について、前記圧縮処理手段が、前記受信手段が受信したデータから特定のワードを抽出するデータ解析手段(例えば、
図3のデータ解析処理部2051に相当)と、該抽出されたワードから該受信したデータが属するカテゴリーを特定し、同一のカテゴリーに属するデータについて、その類似度を判定する類似度判定手段(例えば、
図3の類似性判定部2052に相当)と、該判定した類似度から最大の類似度を示すデータの組を選択し、少なくとも、これらのデータを統合することにより、データ量を圧縮するデータ圧縮手段(例えば、
図3のデータ圧縮部2053に相当)と、を備えることを特徴とする重要度判定装置を提案している。
【0026】
この発明によれば、データ解析手段は、受信したデータから特定のワードを抽出する。類似度判定手段は、抽出されたワードから受信したデータが属するカテゴリーを特定し、同一のカテゴリーに属するデータについて、その類似度を判定する。データ圧縮手段は、判定した類似度から最大の類似度を示すデータの組を選択し、少なくとも、これらのデータを統合することにより、データ量を圧縮する。したがって、特定のワードに基づいて、カテゴリーを特定し、同一のカテゴリーに属するデータについて、最大の類似度を示すデータの組を選択し、少なくとも、これらのデータを統合することにより、データ量を圧縮するため、判定精度を低下させることなく、処理速度を向上させることができる。
【0027】
(11)本発明は、(10)の重要度判定装置について、前記類似度判定手段が、データXとデータYに対して、数1に示す演算式の値を求めて、類似度を判定することを特徴とする重要度判定装置を提案している。
【0028】
この発明によれば、類似度判定手段が、データXとデータYに対して、数1に示す演算式の値を求めて、類似度を判定する。ここで、数1に示すJaccard係数は二つの集合の共起の度合い、つまりどのくらい似ているかを表す指標であるため、これを用いることにより、2つのデータの類似度を簡易に数値化することができる。
【0029】
(12)本発明は、(10)の重要度判定装置について、前記データ圧縮手段は、データの単語数が所定数よりも大きい場合に、数2により、各単語の重要度を算出し、重要度の低いものから単語を削除することを特徴とする重要度判定装置を提案している。
【0030】
この発明によれば、データ圧縮手段は、データの単語数が所定数よりも大きい場合に、数2により、各単語の重要度を算出し、重要度の低いものから単語を削除する。したがって、重要度の低い単語から削除を行い、データを圧縮することから、判定精度を低下させることなく、処理速度を向上させることができる。
【0031】
(13)本発明は、ユーザが送受信するデータの重要度を判定する重要度判定方法であって、通信路を流れるデータを取得する第1のステップ(例えば、
図7のステップS101に相当)と、該取得したデータに対して、圧縮処理を行う第2のステップ(例えば、
図7のステップS102に相当)と、該圧縮処理後のデータを前処理により重要度の判定ができるように変換する第3のステップ(例えば、
図7のステップS103に相当)と、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する第4のステップ(例えば、
図7のステップS104に相当)と、該判定結果をユーザに送信する第5のステップ(例えば、
図7のステップS105に相当)と、を備えたことを特徴とする重要度判定方法を提案している。
【0032】
この発明によれば、通信路を流れるデータを取得し、取得したデータに対して、圧縮処理を行う。次いで、圧縮処理後のデータを前処理により重要度の判定ができるように変換し、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する。そして、判定結果をユーザに送信する。したがって、ネットワーク上を流れる他のユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。また、受信したデータを圧縮することにより、処理速度を高速化することができる。
【0033】
(14)本発明は、ユーザが送受信するデータの重要度を判定する重要度判定方法であって、通信路を流れるデータを取得する第1のステップ(例えば、
図9のステップS201に相当)と、該取得したデータに対して、圧縮処理を行う第2のステップ(例えば、
図9のステップS202に相当)と、該圧縮処理後のデータを前処理により特徴量抽出可能な形式に変換する第3のステップ(例えば、
図9のステップS203に相当)と、各利用者のデータ特徴量を抽出して特徴ベクトルを生成する第4のステップ(例えば、
図9のステップS204に相当)と、新たに送られてくるデータと前記生成した特徴ベクトルとの類似度を評価してデータの重要度を判定する第5のステップ(例えば、
図9のステップS205に相当)と、該判定結果をユーザに送信する第6のステップ(例えば、
図9のステップS206に相当)と、を備えたことを特徴とする重要度判定方法を提案している。
【0034】
この発明によれば、通信路を流れるデータを取得し、取得したデータに対して、圧縮処理を行う。次いで、圧縮処理後のデータを前処理により特徴量抽出可能な形式に変換し、各利用者のデータ特徴量を抽出して特徴ベクトルを生成して、新たに送られてくるデータと前記生成した特徴ベクトルとの類似度を評価してデータの重要度を判定する。そして、判定結果をユーザに送信する。したがって、ネットワーク上を流れるユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。
【0035】
(15)本発明は、ユーザが送受信するデータの重要度を判定する重要度判定方法をコンピュータに実行させるためのプログラムであって、通信路を流れるデータを取得する第1のステップ(例えば、
図7のステップS101に相当)と、該取得したデータに対して、圧縮処理を行う第2のステップ(例えば、
図7のステップS102に相当)と、該圧縮処理後のデータを前処理により重要度の判定ができるように変換する第3のステップ(例えば、
図7のステップS103に相当)と、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する第4のステップ(例えば、
図7のステップS104に相当)と、該判定結果をユーザに送信する第5のステップ(例えば、
図7のステップS105に相当)と、をコンピュータに実行させるためのプログラムを提案している。
【0036】
この発明によれば、通信路を流れるデータを取得し、取得したデータに対して、圧縮処理を行う。次いで、圧縮処理後のデータを前処理により重要度の判定ができるように変換し、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する。そして、判定結果をユーザに送信する。したがって、ネットワーク上を流れる他のユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。また、受信したデータを圧縮することにより、処理速度を高速化することができる。
【0037】
(16)本発明は、ユーザが送受信するデータの重要度を判定する重要度判定方法をコンピュータに実行させるためのプログラムであって、
通信路を流れるデータを取得する第1のステップ(例えば、
図9のステップS201に相当)と、該取得したデータに対して、圧縮処理を行う第2のステップ(例えば、
図9のステップS202に相当)と、該圧縮処理後のデータを前処理により特徴量抽出可能な形式に変換する第3のステップ(例えば、
図9のステップS203に相当)と、各利用者のデータ特徴量を抽出して特徴ベクトルを生成する第4のステップ(例えば、
図9のステップS204に相当)と、新たに送られてくるデータと前記生成した特徴ベクトルとの類似度を評価してデータの重要度を判定する第5のステップ(例えば、
図9のステップS205に相当)と、該判定結果をユーザに送信する第6のステップ(例えば、
図9のステップS206に相当)と、をコンピュータに実行させるためのプログラムを提案している。
【0038】
この発明によれば、通信路を流れるデータを取得し、取得したデータに対して、圧縮処理を行う。次いで、圧縮処理後のデータを前処理により特徴量抽出可能な形式に変換し、各利用者のデータ特徴量を抽出して特徴ベクトルを生成して、新たに送られてくるデータと前記生成した特徴ベクトルとの類似度を評価してデータの重要度を判定する。そして、判定結果をユーザに送信する。したがって、ネットワーク上を流れるユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。また、受信したデータを圧縮することにより、処理速度を高速化することができる。