(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-01-09
(45)【発行日】2024-01-17
(54)【発明の名称】識別補助データ生成技術及び識別情報抽出技術
(51)【国際特許分類】
G06N 20/00 20190101AFI20240110BHJP
H03M 7/30 20060101ALI20240110BHJP
【FI】
G06N20/00 160
H03M7/30 B
(21)【出願番号】P 2019190852
(22)【出願日】2019-10-18
【審査請求日】2022-06-28
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成30年度、国立研究開発法人新エネルギー・産業技術総合開発機構「高効率・高速処理を可能とするAIチップ・次世代コンピューティングの技術開発/革新的AIエッジコンピューティング技術の開発/AIエッジデバイスの横断的なセキュリティ評価に必要な基盤技術の研究開発」委託研究、産業技術力強化法第17条の適用を受ける特許出願
【前置審査】
(73)【特許権者】
【識別番号】301021533
【氏名又は名称】国立研究開発法人産業技術総合研究所
(74)【代理人】
【識別番号】100103528
【氏名又は名称】原田 一男
(72)【発明者】
【氏名】古原 和邦
【審査官】北川 純次
(56)【参考文献】
【文献】国際公開第2010/101187(WO,A1)
【文献】特開2017-117180(JP,A)
【文献】国際公開第2014/118980(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
H03M 7/30
G06T 1/00
G06N 3/02
G06F 18/00
(57)【特許請求の範囲】
【請求項1】
複数の対象の各々を表す入力ベクトルを取得するステップと、
前記入力ベクトルを包含する空間を前記複数の対象の各々を表す入力ベクトルが異なる部分空間に含まれるように分割し、且つ前記複数の対象の各々を識別するユニークなベクトルを生成するのに用いられる複数の超曲面を生成するステップと、
前記ユニークなベクトルの誤り訂正のためのデータを生成するステップと、
を、コンピュータに実行させ
、
前記誤り訂正のためのデータを生成するステップが、
前記複数の対象の各々を表す入力ベクトルを、生成された前記複数の超曲面を用いて評価することで、前記複数の対象の各々を識別するユニークなベクトルを生成するステップと、
前記ユニークなベクトルの各々に対して、誤り訂正符号による冗長データを生成するステップと、
前記複数の対象の各々を表す入力ベクトルを入力とし、当該対象についての前記ユニークなベクトルに対する冗長データを出力とするモデルに対して機械学習を実行し、学習済みモデルを生成するステップと、
を含むプログラム。
【請求項2】
複数の対象の各々を表す入力ベクトルを取得するステップと、
前記入力ベクトルを包含する空間を前記複数の対象の各々を表す入力ベクトルが異なる部分空間に含まれるように分割し、且つ前記複数の対象の各々を識別するユニークなベクトルを生成するのに用いられる複数の超曲面を生成するステップと、
前記ユニークなベクトルの誤り訂正のためのデータを生成するステップと、
を、コンピュータに実行させ
、
前記誤り訂正のためのデータを生成するステップが、
前記複数の対象の各々を表す入力ベクトルを、生成された前記複数の超曲面を用いて評価することで、前記複数の対象の各々を識別するユニークなベクトルを生成するステップと、
前記複数の対象の各々を識別する前記ユニークなベクトルにおける一部の要素を出力とし、当該ユニークなベクトルにおける前記一部の要素以外の要素を入力とするモデルに対して機械学習を実行し、前記ユニークなベクトルの全ての要素を推測できるように複数の学習済みモデルを生成するステップと、
を含むプログラム。
【請求項3】
複数の対象の各々を表す入力ベクトルを取得するステップと、
前記入力ベクトルを包含する空間を前記複数の対象の各々を表す入力ベクトルが異なる部分空間に含まれるように分割し、且つ前記複数の対象の各々を識別するユニークなベクトルを生成するのに用いられる複数の超曲面を生成するステップと、
前記ユニークなベクトルの誤り訂正のためのデータを生成するステップと、
を、コンピュータに実行させ
、
前記誤り訂正のためのデータを生成するステップが、
前記複数の対象の各々を表す入力ベクトルを、生成された前記複数の超曲面を用いて評価することで、前記複数の対象の各々を識別するユニークなベクトルを生成するステップ
を含むプログラム。
【請求項4】
複数の対象に含まれる特定の対象を表すベクトルを取得するステップと、
前記特定の対象を表すベクトルを、前記ベクトルを包含する空間を前記複数の対象の各々が異なる部分空間に含まれるように分割し且つ予め保持している複数の超曲面を用いて評価することで、前記特定の対象を識別するベクトルを生成する生成ステップと、
を、コンピュータに実行させるためのプログラム。
【請求項5】
予め保持している、誤り訂正のためのデータを用いて、生成された前記ベクトルに対する誤り訂正処理を行うステップ
を前記コンピュータにさらに実行させる請求項
4記載のプログラム。
【請求項6】
前記誤り訂正のためのデータが、ある対象を表す入力ベクトルを入力とし、当該ある対象についての、誤り訂正符号による冗長データを出力とする機械学習の学習済みモデルである場合、
前記誤り訂正処理が、
前記特定の対象を表す入力ベクトルから、前記学習済みモデルにより、前記誤り訂正符号による冗長データを生成するステップと、
前記誤り訂正符号に基づき、前記特定の対象を識別するベクトルと生成された前記冗長データとから、前記特定の対象を識別する訂正後のベクトルを生成するステップと、
を含む請求項
5記載のプログラム。
【請求項7】
前記誤り訂正のためのデータが、前記複数の対象の各々を識別するユニークなベクトルである場合、
前記誤り訂正処理が、
前記複数の対象の各々を識別するユニークなベクトルのうち、前記特定の対象を識別するベクトルと最も近いユニークなベクトルを特定するステップ
を含む請求項
5記載のプログラム。
【請求項8】
誤り訂正のためのデータが、
ある対象のためのベクトルにおける一部の要素を出力とし、当該ある対象のためのベクトルにおける前記一部の要素以外の要素を入力とし、前記ある対象のためのベクトルの全ての要素を推測できるように複数生成された学習済みモデルである場合、
前記生成ステップが、
前記複数の超曲面により前記入力ベクトルを変換することで得られる第1ベクトルから、前記学習済みモデルにより、第2ベクトルを生成する第1ステップと、
前記第1ベクトルと前記第2ベクトルとの要素毎の比較に基づき、候補となるベクトルを生成する第2ステップと、
前記候補となるベクトルの各要素が、要素毎の離散化処理における閾値との差が所定値以上となるか判定する第3ステップと、
前記候補となるベクトルの各要素が、要素毎の離散化処理における閾値との差が所定値以上となる場合には、前記候補となるベクトルの各要素に対して前記離散化処理を実行するステップと、
前記候補となるベクトルの各要素が、要素毎の離散化処理における閾値との差が所定値未満である場合には、前記候補となるベクトルを前記第1ベクトルとして、前記第1ステップ乃至第3ステップを実行するステップと、
を含む請求項
4記載のプログラム。
【請求項9】
複数の対象に含まれる特定の対象を表すベクトルを取得する手段と、
前記特定の対象を表すベクトルを、前記ベクトルを包含する空間を前記複数の対象の各々が異なる部分空間に含まれるように分割し且つ予め保持している複数の超曲面を用いて評価することで、前記特定の対象を識別するベクトルを生成する手段と、
を有する情報処理システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数の対象からユニークな識別情報を抽出するための技術に関する。
【背景技術】
【0002】
個体その他の対象から、対象毎に固有の固定されたディジタル値(0又は1といった離散値。なお、複数のディジタル値の系列を含めベクトルと呼ぶ。なお、その特性から固定値とも呼ぶ)を抽出するために、一般的には、対象特有の何らかのアナログ値を読み出して、当該アナログ値に対して設定されている閾値との比較によって、0又は1を決定する。
【0003】
例えば、0以上1以下のアナログ値に対して閾値0.5が設定されていると仮定する。この場合、閾値0.5付近のアナログ値が測定される特定の対象について、ノイズがプラスである場合には閾値0.5以上のアナログ値が測定されて「1」が抽出されるが、ノイズがマイナスである場合には閾値0.5未満のアナログ値が測定されて「0」が抽出されるようになってしまう。このような場合には、固有の固定されたディジタル値が得られない。同様に、複数の対象について、「0」又は「1」の一方のみに偏った変換がなされても、「固有の」固定されたディジタル値を得られないので、避けるべきである。
【0004】
このような状況において固有の固定されたディジタル値を得るための技術としては、以下のようなものがある。
(1)何度も読み取りを行い、多数決などの方法により固定値を決定する技術(例えば、特許文献1及び2など)
(2)固定値を抽出する対象の読取りパターン毎に個別の補助データ(ヘルパーデータ)を事前に計算、保持しておき、誤り訂正時にその情報を使う技術。ヘルパーデータとしては、抽出パターンにランダムな符号語を排他的論理和したものや、抽出パターンを誤り訂正時に使用するシンドロームに変換したものなどがあり、これらの方法はファジー抽出器(Fuzzy Extractor)とも呼ばれる。(例えば非特許文献1)
(3)ノイズの多い軸や値、対象全体を通して読み取った値が偏っている軸や値を使わないようにする技術(例えば特許文献3)
【0005】
(1)の技術は、読取り時に一時的に生じるノイズを訂正するには有効であるが、パターンの変形、傷、劣化などにより恒久的に加わったノイズは訂正できない。また、読取り時に一時的に生じるノイズに対しても、読み取り値の平均がノイズの分散以上にしきい値から離れていなければ有効な対策とはならない。
【0006】
(2)の技術は、ヘルパーデータによる補正を行うが、この補正値は読み取り対象毎に異なるため、読み取り対象のIDが事前に分かっている場合など、読み取り対象が事前に特定できており、その対象が本物であるか否かを検証する際には有効な方法となる。しかし、対象に対応する補助データが分からない状態から、そのIDや暗号鍵などの固定値を抽出する場合には使えない。なお、全ての補助データを試すという方法も可能であるが、識別に要する時間が、対象の候補数に比例して長くなるという問題がある。
【0007】
(3)の技術は、読取り対象毎に使わない軸を決める場合、対象にIDを付けるか、固定値抽出時に全数探索等を行わなければならない問題がある。読取り対象毎ではなく、全ての対象で使わない軸を決める場合、対象の数が増えると全ての対象でエラーとなる軸、または、全ての対象でエラーが小さくなる軸の割合が小さくなるため、いくつかの対象に対してはエラーが小さくなっているにも関わらずその軸を使わなかったり、いくつかの対象に対してはエラーが大きくなっているにも関わらずその軸を残すことになりエラーを取り切れなくなるという問題がある。
【0008】
その他、テンプレートとのマッチングを行う方法や、電子透かしを用いる方法など様々な技術が存在しているが、それらは、多数の対象にID等が付いていない状況や電子透かしを埋め込むために対象を変更したり加工したりできない状況において、対象そのものから固定値を確実に抽出するのには、必ずしも有効ではない。
【先行技術文献】
【特許文献】
【0009】
【文献】特開2018-175762号公報
【文献】特開平11-288465号公報
【文献】日本特許第6305579号公報
【非特許文献】
【0010】
【文献】Y. Dodis, R. Ostrovsky, L. Reyzin, A. Smith. Fuzzy Extractors: How to Generate Strong Keys from Biometrics and Other Noisy Data. SIAM J. Comput. 38(1): 97-139 (2008)
【発明の概要】
【発明が解決しようとする課題】
【0011】
従って、本発明の目的は、一側面として、対象から固有のデータを確実に抽出できるようにするための新規な技術を提供することである。
【課題を解決するための手段】
【0012】
本発明の第1の態様に係る情報処理方法は、(A)複数の対象の各々を表す入力ベクトルを取得するステップと、(B)入力ベクトルを包含する空間を複数の対象の各々を表す入力ベクトルが異なる部分空間に含まれるように分割し、且つ複数の対象の各々を識別するユニークなベクトルを生成するのに用いられる複数の超曲面を生成するステップとを含む。
【0013】
本発明の第2の態様に係る情報処理方法は、(C)複数の対象に含まれる特定の対象を表すベクトルを取得するステップと、(D)上記ベクトルを包含する空間を複数の対象の各々が異なる部分空間に含まれるように分割し且つ予め保持している複数の超曲面を用いて、特定の対象を表すベクトルを評価することで、特定の対象を識別するベクトルを生成するステップとを含む。
【発明の効果】
【0014】
一側面によれば、対象から固有のデータを確実に抽出できるようになる。
【図面の簡単な説明】
【0015】
【
図1】
図1は、第1の実施の形態におけるシステムの概要を示す図である。
【
図2】
図2は、第1の実施の形態に係る情報処理装置の処理フローを示す図である。
【
図5】
図5は、超曲面生成処理の処理フローを示す図である。
【
図7】
図7は、度数偏り調整処理の処理フローを示す図である。
【
図9】
図9は、類似性調整処理の処理フローを示す図である。
【
図11】
図11は、距離調整処理の処理フローを示す図である。
【
図12】
図12は、超曲面生成処理の処理フローを示す図である。
【
図13】
図13は、適応的距離調整処理の処理フローを示す図である。
【
図14】
図14は、目標値の設定について説明するための図である。
【
図15】
図15は、類似性再判定処理の処理フローを示す図である。
【
図16】
図16は、適切な超曲面を用いて評価された対象の位置を示す図である。
【
図17】
図17は、第1の実施の形態に係る検出装置の処理フローを示す図である。
【
図18】
図18は、第2乃至4の実施の形態におけるシステムの概要を示す図である。
【
図19】
図19は、第2の実施の形態における誤り訂正データ生成処理の処理フローを示す図である。
【
図20】
図20は、第2の実施の形態に係る検出装置の処理フローを示す図である。
【
図21】
図21は、第3の実施の形態における誤り訂正データ生成処理の処理フローを示す図である。
【
図22】
図22は、第3の実施の形態に係る検出装置の処理フローを示す図である。
【
図23】
図23は、第4の実施の形態における誤り訂正データ生成処理の処理フローを示す図である。
【
図24】
図24は、第4の実施の形態に係る検出装置の処理フローを示す図である。
【
図25】
図25は、コンピュータ装置のブロック構成図である。
【発明を実施するための形態】
【0016】
[実施の形態1]
図1に、第1の実施の形態に係るシステム概要を示す。例えば生産場所、採取場所、登録場所などに設置される情報処理装置100と、例えば流通経路上に設置される複数の検出装置200とが、例えばインターネットなどのネットワークを介して接続するようになっている。
【0017】
図1で示すように、複数の対象(
図1ではA乃至Dなど)を生産、採取、登録などする場面において、情報処理装置100では、当該複数の対象に対して測定などを行った上で、複数の対象の各々を識別するユニークなデータ(以下では、固定値ベクトルと呼ぶ)を生成するための変換関数として、測定データなどを表す空間を複数の対象の各々を異なる部分空間に含まれるように分割する超曲面を生成し、当該超曲面のパラメータを検出装置200に配信する。
【0018】
検出装置200は、例えば対象の流通経路上で、特定の対象について測定などを行った上で、情報処理装置100から配信された超曲面のパラメータを用いて測定データなどに対して評価を行うことで、特定の対象を識別するユニークな固定値ベクトルを生成する。固定値ベクトルが得られれば、当該固定値ベクトルをIDとして用いることで例えば生産等に関するデータなど属性データを別途抽出できるようになる。
【0019】
情報処理装置100は、測定部110と、第1データ格納部120と、パラメータ生成部130と、第2データ格納部140と、登録部150と、配信部160と、対象DB170とを有する。
【0020】
測定部110は、対象に対する所定の測定を行い、測定データを第1データ格納部120に格納する。なお、測定部110は、測定だけではなく、測定データに対する特徴抽出などの追加的な処理を行って、その処理結果を第1データ格納部120に格納するようにしてもよい。パラメータ生成部130は、第1データ格納部120に格納されているデータを用いて、要件を満たす超曲面を生成し、当該超曲面のパラメータを第2データ格納部140に格納する。
【0021】
登録部150は、第2データ格納部140に格納されている超曲面のパラメータを用いて、第1データ格納部120に格納されている測定データなどを評価して、各対象について固定値ベクトルを生成すると共に、各対象の属性データ(例えば生産場所、生産時刻その他)を対応付けて、対象DB170に格納する。なお、パラメータ生成部130によって各対象の固定値ベクトルが生成されて第2データ格納部140に格納されている場合には、第2データ格納部140に格納されている各対象の固定値ベクトルを読み出す場合もある。配信部160は、第2データ格納部140に格納されている超曲面のパラメータを、検出装置200に配信する。
【0022】
検出装置200は、測定部210と、測定データ格納部220と、抽出部230と、後処理部240と、設定部250と、パラメータ格納部260とを有する。
【0023】
設定部250は、情報処理装置100から配信された超曲面のパラメータを、パラメータ格納部260に格納する。オフラインで超曲面のパラメータを受け取った場合にも同様にパラメータ格納部260に格納する。
【0024】
測定部210は、情報処理装置100における測定部110と同じ処理を行って、処理結果を測定データ格納部220に格納する。抽出部230は、測定データ格納部220に格納された測定データなどを、パラメータ格納部260に格納されている超曲面のパラメータを用いて評価し、特定の対象を識別するユニークな固定値ベクトルを生成する。後処理部240は、固定値ベクトルをIDとして用いて、当該IDに対応付けられている属性データを取得するなどの処理を行う。
【0025】
次に、情報処理装置100の処理の内容を
図2乃至
図16を用いて詳細に説明する。
【0026】
まず、測定部110は、各対象iに対して所定の測定を行って、測定結果に基づき、L1次元のベクトルXiを生成し、第1データ格納部120に格納する(
図2:ステップS1)。
【0027】
ここで、対象は全部でL3個あるものとする。また、測定部110は、単なる測定ではなく、測定データに対して所定の特徴抽出などの処理を行うようにしてもよい。そして、L3個ある対象のうちi番目の対象に対して、L1次元のベクトルXi=(x1,x2,...,xL1)が生成される。
【0028】
説明を分かりやすくするため、L3=4且つL1=2の例を
図3に示しておく。L1=2なので、
図3に示すようにベクトルXiは2次元の空間、すなわち平面上で表される。ここでは、対象1のベクトルX
1=(x
1,x
2)=(0.5,1)、対象2のベクトルX
2=(x
1,x
2=(1,0.5)、対象3のベクトルX
3=(x
1,x
2)=(0,0.5)、対象4のベクトルX
4=(x
1,x
2)=(0.5,0)であるものとする。
【0029】
この例では、
図3の平面において、いずれの軸についても、0.5を閾値として、それ以上であれば「1」、それ未満であれば「0」を割り当てるものとする(以下、これを実現する関数をround()と表すものとする)。
図3の平面において、このような閾値のラインを二点鎖線で表しているが、対象1乃至4はそれぞれ閾値のライン上に載っている。このため、少しでも測定結果にノイズがあると、「0」と「1」とが入れ替わってしまい、検出誤りが生ずることになる。
【0030】
本実施の形態では、L1次元の空間をn個の部分空間に分割するための超曲面を生成する。各軸の値を0又は1の2種類に分類する場合、nとユニークな超曲面の数L2との関係は、n=2L2で表される。L2=log2L3以上であり、n≧L3である。L2が大きいほど、ノイズ耐性が高い。
【0031】
図3の例では、例えば
図4のような超曲面y
1及びy
2(平面の場合には直線)を生成することを目指す。
図4の例では、L2=2、n=4であり、2本の点線で表される超曲面y
1及びy
2を生成する。そして、各対象は、これらの超曲面で分割された4つの部分空間A乃至Dのうち互いに異なるものに含まれるようになっている。
【0032】
以下、このような超曲面に対応する関数をf()と表し、f()の出力範囲を0以上1以下とする。また、二値化、量子化又は離散化の閾値を0.5、すなわちf()の出力の小数点第一位を四捨五入する関数round()をf()に適用し、round(f())を行うものとして説明するが、当然それ以外の場合にも拡張可能である。
【0033】
図2の処理の説明に戻って、次に、パラメータ生成部130は、対象の個数L3に応じて空間を分割する超曲面数L2等を設定する(ステップS3)。上で述べたとおりの関係があるので、これに従ってL2等が決定される。また、パラメータ生成部130は、超曲面についてのカウンタjを1に初期化する(ステップS5)。
【0034】
そして、パラメータ生成部130は、超曲面生成処理を実行する(ステップS7)。この超曲面生成処理については、後に詳細に説明する。生成された超曲面のパラメータは、第2データ格納部140に格納される。
【0035】
その後、パラメータ生成部130は、カウンタjを1インクリメントして、jがL2以下であるか否かを判断する(ステップS11)。この条件を満たす場合には、まだ超曲面を生成するので、処理はステップS7に戻る。
【0036】
一方、jがL2を超えるようになると、登録部150は、生成されたパラメータに係る超曲面で、各ベクトルXiを評価して、対象iの固定値ベクトルZiを生成し、属性データと共に対象DB170 に登録する(ステップS13)。なお、固定値ベクトルZiについては、j番目の超曲面が決まるたびにZiのj番目の値を求め、または、j番目の超曲面が決まる際に同時に定まったZiのj番目の値を、対象DB170 において対応する場所に登録してもよい。後に固定値ベクトルZiから属性データを抽出するためである。
【0037】
ここでは、L2個の超曲面を表す関数f1乃至fL2の集合F()=(f1(),f2(),...,fL2())を用いて、ベクトルYi=(yi,1,yi,2,...,yi,L2)=F(Xi)=(f1(Xi),f2(Xi),...,fL2(Xi))を算出し、さらに各要素yi,jについてround()を適用することで離散化し、固定値ベクトルZiを生成する。
【0038】
さらに、配信部160は、生成された超曲面のパラメータを、第2データ格納部140から読み出して、所定の検出装置200に配信する(ステップS15)。なお、配信ではなく、オフラインで配布するようにしてもよいし、検出装置200の製造部門に送信して、検出装置200の製造段階でパラメータ格納部260に記録するようにしてもよい。
【0039】
このような処理を行うことで、対象にはID等を付すことなく、検出装置200において固定値ベクトルを確実に抽出することができるようになる。
【0040】
次に、
図5乃至
図16を用いて、超曲面生成処理について詳細を説明する。
【0041】
まず、パラメータ生成部130は、全ベクトルXiを写像するj番目の超曲面を表す関数fj()をランダムに生成する(
図5:ステップS21)。
【0042】
そして、パラメータ生成部130は、f
j()に対して度数偏り調整処理を実行する(ステップS23)。この度数偏り調整処理については、
図6及び
図7を用いて説明する。
【0043】
図2に対して
図3とは異なり
図6に示すような超曲面を表す点線y
1=0.5及びy
2=0.5が生成されたものとする。ここで、超曲面を表す点線y
j=0.5 は、y
j=f
j(x
1,x
2)=0.5を満たす(x
1,x
2)であり、f
1(x
1,x
2)は、点線y
1=0.5より右上にある点を、「1」に分類される、0.5以上の値に写像し、点線y
1=0.5より左下にある点を、「0」に分類される、0.5未満の値に写像する。同様に、f
2(x
1,x
2)は、点線y
2=0.5より左上にある点を「0」に分類される、0.5未満の値に写像し、点線y
2=0.5より右下にある点を、「1」に分類される、0.5以上の値に写像する。
【0044】
このような場合、点線y1=0.5の左右で対象の数は2個ずつだが、点線y2=0.5については、その左上の領域(round(y2)=0の領域)に4つの対象が含まれるのに対して、右下の領域(round(y2)=1の領域)には0個となってしまう。すなわち、超曲面で分割される部分空間において対象の分布に偏りがある。
【0045】
このような場合、例えば、超曲面のパラメータ(直線y
2=f
2(Xi)=f
2(x
1,x
2)=ax
1+b
2=cのパラメータa、b及びc)をそれぞれ+又は-方向に変化させて、例えば
図6の例では、点線y
2=0.5を平行に左上方向に移動させれば、分布の偏りを是正できる。
【0046】
より具体的には、点線y2=0.5に近い対象2及び4が点線y2=0.5の右下に属し、対象1及び3が点線y2=0.5の左上に属するように点線y2=0.5を移動させれば、分布が均等化される。
【0047】
対象2及び4は、X2=(1,0.5)、X4=(0.5,0)であるから、y2,2=f2(X2)=a+0.5b+cとなるので、round(y2,2)が0から1に変わるように、bよりa及びbに重みをつけてa、b及びcをいずれも増加する方向に変更する。同様に、y2,4=f2(X4)=0.5a+cとなるので、round(y2,4)が0から1に変わるように、aよりcに重みをつけてa及びcを増加させる方向に変更する。
【0048】
このような例を念頭にして、
図7に示す度数偏り調整処理を実行する。
【0049】
まず、パラメータ生成部130は、ローカルなカウンタcounterを0に初期化する(ステップS51)。
【0050】
また、パラメータ生成部130は、fj()を各ベクトルXiに適用して、YT
jベクトルを生成する(ステップS53)。以下に示すYT
jベクトルは、Yの転置行列のj行目のベクトルを表し、Yはyi,j=fj(Xi)をi行j列目の要素とするL3行L2列の2次元行列である。
YT
j=(y1,j,y2,j,...,yL3,j)=(fj(X1),fj(X2),...,fj(XL3))
【0051】
その後、パラメータ生成部130は、YT
jベクトルの各要素を閾値に応じて0と1とのいずれかに分けて、0と1の度数を計数し、度数差biasを算出する(ステップS55)。
【0052】
図6の例では、Y
T
2ベクトルは(0,0,0,0)となるので、bias=|4-0|=4となる。ここでスカラー値wに対して、|w|は、wの絶対値を表す。
【0053】
そして、パラメータ生成部130は、度数差biasが、予め定められた閾値bias_threshold2より小さいか否かを判断する(ステップS57)。完全に均一の分布にするのであれば度数差bias=0であるから、bias_threshold2=1となる。この要件を満たす場合には、呼び出し元の処理に戻る。
【0054】
一方、度数差biasが、予め定められた閾値bias_threshold2以上であれば、パラメータ生成部130は、度数差biasが、予め定められたもう一つの閾値bias_threshold1より大きいか否かを判断する(ステップS59)。あまりに度数差biasが大きい場合には、今回の超曲面は許容できないので、ステップS59の要件を満たす場合には、パラメータ生成部130は、今回の超曲面を破棄して(ステップS67)、呼び出し元の処理に戻る。
【0055】
一方、度数差biasが、予め定められた閾値bias_threshold1未満であれば、パラメータ生成部130は、ローカルなカウンタcounterを1インクリメントして(ステップS61)、counterの値が、予め定められた閾値bias_threshold3を超えたか否かを判断する(ステップS63)。bias_threshold3回、パラメータの変更を行ってもステップS57の要件を満たすことができない場合には、今回の超曲面は適切ではない。従って、ステップS63の要件を満たす場合には、処理はステップS67に移行する。
【0056】
一方、counterの値が、予め定められた閾値bias_threshold3以下であれば、パラメータ生成部130は、fj()を表す各パラメータを度数差biasが小さくなる方向に変化させる(ステップS65)。その後、処理はステップS53に戻る。
【0057】
このようにすれば、追加した超曲面で空間を区切った場合における度数偏りを適切に是正できる。
【0058】
図5の処理の説明に戻って、ステップS23の後に、パラメータ生成部130は、今回の超曲面が破棄されたか否かを判断する(ステップS25)。破棄された場合には、処理はステップS21に戻って、超曲面の生成から再開する。一方、破棄されなかった場合、パラメータ生成部130は、類似性調整処理を実行する(ステップS27)。この類似性調整処理については、
図8及び
図9を用いて説明する。
【0059】
図2に対して
図3とは異なり
図8に示すような超曲面を表す点線y
1=0.5及びy
2=0.5が生成されたものとする。ここで、超曲面を表す点線y
j=0.5 は、y
j=f
j(x
1,x
2)=0.5を満たす(x
1,x
2)であり、f
1(x
1,x
2)は、点線y
1=0.5より右上にある点を、「1」に分類される、0.5以上の値に写像し、点線y
1=0.5より左下にある点を、「0」に分類される、0.5未満の値に写像する。同様に、f
2(x
1,x
2)は、点線y
2=0.5より左にある点を「0」に分類される、0.5未満の値に写像し、点線y
2=0.5より右にある点を、「1」に分類される、0.5以上の値に写像する。
【0060】
この場合、y1とy2とを単独で判断すると、y1で分けられる2つの領域で対象の数は2個ずつであり、同様に、y2で分けられる2つの領域で対象の数は2個ずつであるから、度数差biasで判断すれば問題は無い。しかし、2つの超曲面により空間全体を分割することにより得られる部分空間のそれぞれに対象が含まれるのではなく、対象1及び2が同じ部分空間に含まれ、対象3及び4が同じ部分空間に含まれるようになってしまっている。すなわち、偏った分布が形成されている。
【0061】
この問題を解消するには、超曲面間の類似度を考慮すればよい。ここでは、今回の超曲面について計算されたYT
jベクトルと、既にj2番目として設定されている他の超曲面についてのYT
j2ベクトルとの類似度Similarityを、超曲面間の類似度として以下のように定義する。
Similarity(YT
j,YT
j2)=2・max(HD(YT
j,YT
j2),L3-HD(YT
j,YT
j2))/L3-1
【0062】
max(A,B)は、AとBとのうち大きい方の値を出力する関数である。HD(Y
T
j,Y
T
j2)は、Y
T
jベクトルと、Y
T
j2ベクトルのうち、round()を適用した場合に値が一致しない要素数である。
図8の例では、y
1が既設定の超曲面とするとY
T
j2ベクトルはround()を適用すると(1,1,0,0)となり、y
2が今回の超曲面とするとY
T
jベクトルもround()を適用すると(1,1,0,0)となるので、HD(Y
T
j,Y
T
j2)=0となる。よって、Similarityは、2・max(0,4-0)/4-1=1となる。
【0063】
なお、類似度Similarityについては、各ベクトルの要素値が0又は1については上で述べたような関数を用いても良く、実数である場合には、コサイン類似度を採用するようにしてもよい。コサイン類似度は、ベクトルV1とV2について、V1・V2/(|V1||V2|)の絶対値である。なお、V1・V2はV1とV2の内積を表しており、|V|は、ベクトルの各要素の値の自乗和の平方根を表す。
【0064】
このような類似度を用いた類似性調整処理について、
図9を用いて説明する。
【0065】
まず、パラメータ生成部130は、既設定の各超曲面fj2()を各ベクトルXiに適用して、j2それぞれについてYT
j2ベクトルを生成する(ステップS71)。また、パラメータ生成部130は、ローカルなカウンタcounterを0に初期化する(ステップS73)。
【0066】
そして、パラメータ生成部130は、全てのj2(<j)について、YT
jベクトルとYT
j2ベクトルとの類似度Similarityを算出して、当該類似度Similarityが、予め定められた閾値sim_threshold1未満であるか否かを判断する(ステップS75)。ステップS75の要件を満たしている場合には問題が無いので、処理は呼び出し元の処理に戻る。
【0067】
一方、ステップS75の要件を満たしていない、すなわち既設定の超曲面の一つでもその類似度Similarityが閾値sim_threshold1を超えている場合には、パラメータ生成部130は、全てのj2(<j)について算出された、YT
jベクトルとYT
j2ベクトルとの類似度Similarityが、予め定められた閾値sim_threshold2を超えている否かを判断する(ステップS77)。これは、どの既設定の超曲面とも類似度があまりに高い場合には、超曲面の調整を行わずに破棄するためである。
【0068】
よって、ステップS77の条件を満たす場合には、パラメータ生成部130は、今回の超曲面を破棄する(ステップS87)。そして、処理は呼び出し元の処理に戻る。
【0069】
一方、ステップS77の条件を満たしていない場合には、パラメータ生成部130は、ローカルなカウンタcounterを1インクリメントして、このcounterの値が、予め定められた閾値sim_threshold3を超えているか否かを判断する(ステップS81)。sim_threshold3回、パラメータの変更を行ってもステップS75の要件を満たすことができない場合には、今回の超曲面は適切ではない。従って、ステップS81の要件を満たす場合には、処理はステップS87に移行する。
【0070】
一方、ステップS81の要件を満たしていない場合には、パラメータ生成部130は、fj()を表すパラメータを、類似度Similarityが小さくなる方向に変化させる(ステップS83)。
【0071】
より具体的には、YT
jベクトルとYT
j2ベクトルの要素(対象)のうちround()を適用した場合に一致する要素(対象)であって閾値(=0.5)に近い要素(対象)から順番に、例えばその要素値にround()を適用した場合に値が反転することで類似度Similarityが閾値sim_threshold1より小さくなる数だけ、要素i(対象i)を選択する。そして、選択した要素iについて、fj()及びround()を適用した場合に、値が反転するように超曲面のパラメータを調整する。
【0072】
図8の例で、今回の超曲面がy
2であるとすると、対象1及び4がy
2に近いので選択され、X
1=(0.5,1)、X
4=(0.5,0)でround(y
1,2)=round(f
2(X
1))=1であり、round(y
4,2)=round(f
2(X
4))=0であるので、それぞれ0と1に反転するように超曲面のパラメータを調整する。そうすると、round(Y
T
2ベクトル)は(0,1,0,1)となる。round(Y
T
j2ベクトル)は(1,1,0,0)であるから、HD(Y
T
j,Y
T
j2)=2であり、類似度Similarityは、2・max(2,4-2)/4-1=0となるので、類似度Similarityは下がる。
【0073】
なお、対象1のX1をf2(x1,x2)で写像すると、y1,2=f2(x1,x2)=ax1+bx2+c=0.5a+b+cであるので、aよりb及びcに重みをつけてa、b及びcいずれも減少させる方向で変化させる。また、対象4のX2をf2(x1,x2)で写像すると、y4,2=f2(x1,x2)=ax1+bx2+c=0.5a+cであるので、aよりcに重みをつけてa及びcを増加させる方向で変化させる。
【0074】
そして、パラメータ生成部130は、変更後のパラメータに係る関数fj()を各Xiに適用して、新たなYT
jベクトルを生成する(ステップS85)。そして、処理はステップS75に戻る。
【0075】
以上のような処理を行うことで、個々の対象がいずれか1つの異なる部分空間に含まれるように超曲面が調整されるようになる。
【0076】
図5の処理の説明に戻って、ステップS27の後に、パラメータ生成部130は、今回の超曲面が破棄されたか否かを判断する(ステップS29)。破棄された場合には、処理はステップS21に戻る。一方、破棄されなかった場合には、パラメータ生成部130は、距離調整処理を実行する(ステップS31)。距離調整処理については、
図10及び
図11を用いて説明する。
【0077】
距離調整処理では、閾値として取り扱われる超曲面付近に当該超曲面による対象の写像先が存在しているとノイズによってround()の結果が変わってしまう可能性があるので、閾値(超曲面)と対象の写像先との距離を広げるように超曲面のパラメータを変更するものである。
【0078】
例えば、
図2に対して
図3とは異なり
図10に示すような超曲面を表す点線y
1=0.5及びy
2=0.5が生成されたものとする。このような超曲面で空間を分割することで得られる部分空間のいずれかにいずれかの1つの対象が含まれているが、対象1及び4が点線y
2=0.5にとても近い。このような場合には、矢印で示すように点線y
2=0.5を回転させれば、対象1及び4が点線y
2=0.5から離れるので好ましい。
【0079】
【0080】
まず、パラメータ生成部130は、ローカルなカウンタcounterを0に初期化する(ステップS91)。そして、パラメータ生成部130は、超曲面の関数fj()を表すパラメータを、YT
jベクトルの各要素と閾値との差が大きくなるように変化させる(ステップS93)。
【0081】
図10の例では、対象1についてはy
1,2が0.5より小さいため、y
1,2がより小さくなる方向にパラメータを修正し、対象4についてはy
4,2が0.5より大きいため、y
4,2がより大きくなる方向にパラメータを修正する。
【0082】
より具体的には、対象1のX1をf2()で写像すると、y1,2=f2(X1)=ax1+bx2+c=0.5a+b+cであるので、aよりb及びcに重みをつけてa、b及びcいずれも減少させる方向で変化させる。また、対象4のX4をf2()で写像すると、y4,2=f2(X4)=ax1+bx2+c=0.5a+cであるので、aよりcに重みをつけてa及びcを増加させる方向で変化させる。
【0083】
なお、パラメータの修正を行うと、他の対象の写像先が閾値(超曲面)に近づくこともあるので、そのような場合には、他の対象の写像先についても閾値(超曲面)から離れるようにパラメータを変更する。
【0084】
そして、パラメータ生成部130は、変更後の関数fj()を各Xiに適用して、新たなYT
jベクトルを生成する(ステップS95)。
【0085】
そうすると、パラメータ生成部130は、YT
jベクトルにおいて全ての又は一定数以上の要素と閾値との差が所定値以上離れているか否かを判断する(ステップS97)。|yi,j-0.5|が所定値以上であるか否かを判断するものである。全ての要素なのか、一定数以上の要素なのかについては、予め設定しておくものとする。
【0086】
ステップS97の要件を満たしている場合には、好ましい超曲面が生成できたことになるので、パラメータ生成部130は、今回の超曲面の関数fj()を要件充足と設定する(ステップS101)。そして処理は、呼び出し元の処理に戻る。
【0087】
一方、ステップS97の要件を満たしていない場合には、パラメータ生成部130は、ローカルなカウンタcounterを1インクリメントし(ステップS99)、counterの値が閾値dis_thresholdを超えたか否かを判断する(ステップS103)。counterの値が閾値dis_threshold以下である場合には、処理はステップS93に戻る。一方、counterの値が閾値dis_thresholdを超えた場合には、呼び出し元の処理に戻る。
【0088】
このような処理を行うことで、全ての対象又は一定数以上の対象の写像先が閾値(超曲面)から十分離れるように調整できる。なお、この要件を満たすことができない場合でも、これ以降の処理を行うことで、今回の超曲面を活用できる場合もある。
【0089】
図5の処理の説明に戻って、ステップS31の後に、パラメータ生成部130は、今回の超曲面に対して要件充足が設定されたか否かを判断する(ステップS33)。要件充足が設定されていれば、次の超曲面を生成するために、端子Cを介して呼び出し元の処理(
図2)に戻る。一方、要件充足が設定されていなければ、端子Aを介して、
図12の処理に移行する。
【0090】
図12の処理の説明に移行して、パラメータ生成部130は、適応的距離調整処理を実行する(ステップS35)。この適応的距離調整処理については、
図13及び
図14を用いて説明する。
【0091】
適応的距離調整処理は、超曲面からなかなか離れない対象の集合がある場合に、round()を適用した後の度数分布が大幅に変わらない範囲で、当該集合に含まれる対象のround()後の値が反転するように超曲面のパラメータを変更するものである。例えば、m個程度の対象のround()後の値を0から1に反転させ、m個程度の対象のround()後の値を1から0個に変えるものである。0から1に反転させる個数と1から0に反転させる個数は厳密に同じでなくても良い。
【0092】
【0093】
まず、パラメータ生成部130は、ローカルなカウンタcounterを0に初期化する(ステップS111)。また、パラメータ生成部130は、|fj(Xi)-0.5|が一定値以下となる対象iの集合Sを特定する(ステップS113)。これによって今回の超曲面からなかなか離れない対象iの集合を特定する。
【0094】
そして、パラメータ生成部130は、集合Sに含まれる対象iに対して目標値Ci,jを算出する(ステップS115)。
【0095】
目標値は、1-round(f
j(X
i))に設定する。これは、
図14に模式的に示すように、f
j(X
i)が0.5より小さい場合には、round(f
j(X
i))=0であるから、目標値C
i,jは1になる。すなわち、f
j(X
i)が0.5以上となるようにパラメータを変更させる。
【0096】
一方、fj(Xi)が0.5より大きい場合には、round(fj(Xi))=1であるから、目標値Ci,jは0になる。すなわち、fj(Xi)が0.5を下回るようにパラメータを変更させる。
【0097】
ここまでの処理は、適応的距離調整処理の前提処理であり、ステップS117以降の処理を行っても集合S及び目標値Ci,jを変更しない。
【0098】
そして、パラメータ生成部130は、超曲面の関数fj()を表すパラメータを、YT
jベクトルにおいて、集合Sに含まれる対象iについての要素値と目標値Ci,jとの差が小さくなるように、且つ、それ以外の対象の要素値と閾値との差が大きくなるように変化させる(ステップS117)。この処理は、基本的にステップS93と同様であるが、一部の対象に係る要素については、目標値との差を小さくするという方向が異なっている。
【0099】
そして、パラメータ生成部130は、新たな超曲面の関数fj()を各Xiに適用して、新たなYT
jベクトルを生成する(ステップS119)。
【0100】
そうすると、パラメータ生成部130は、YT
jベクトルにおいて全ての又は一定数以上の要素と閾値との差が所定値以上離れているか否かを判断する(ステップS121)。本ステップはステップS97と同様である。
【0101】
ステップS121の要件を満たしている場合には、次の処理を行うべく、呼び出し元の処理に戻る。
【0102】
一方、ステップS121の要件を満たしていない場合には、パラメータ生成部130は、ローカルなカウンタcounterを1インクリメントし(ステップS123)、counterの値が閾値dis_thresholdを超えたか否かを判断する(ステップS125)。counterの値が閾値dis_threshold以下である場合には、処理はステップS117に戻る。一方、counterの値が閾値dis_thresholdを超えた場合には、パラメータ生成部130は、今回の超曲面を破棄する(ステップS127)。そして、呼び出し元の処理に戻る。
【0103】
このようにすれば、度数分布をほぼ維持した上で、距離についての要件を満たすことができるようになる。但し、適応的距離調整処理を行うと、類似性調整処理で得られた状態がもはや崩れている可能性がある。
【0104】
図12の処理の説明に戻って、ステップS35の後に、パラメータ生成部130は、今回の超曲面が破棄されたか否かを判断する(ステップS37)。今回の超曲面が破棄されている場合には、端子Bを介して
図5のステップS21に戻る。
【0105】
一方、今回の超曲面が破棄されていない場合には、パラメータ生成部130は、類似性再判定処理を実行する(ステップS39)。類似性再判定処理については、
図15を用いて説明する。
【0106】
パラメータ生成部130は、全てのj2(<j)について、YT
jベクトルとYT
j2ベクトルとの類似度Similarityを算出して、当該類似度Similarityが、予め定められた閾値sim_threshold1未満であるか否かを判断する(ステップS131)。これはステップS75と同様である。この要件を満たしている場合には問題が無いので、処理は呼び出し元の処理に戻る。
【0107】
一方、ステップS131の要件を満たしていない、すなわち既設定の超曲面の一つでもその類似度Similarityが閾値sim_threshold1を超えている場合には、パラメータ生成部130は、今回の超曲面を破棄する(ステップS133)そして、呼び出し元の処理に戻る。
【0108】
図12の処理の説明に戻って、ステップS39の後に、パラメータ生成部130は、今回の超曲面は破棄されたか否かを判断する(ステップS41)。破棄された場合には、端子Bを介して
図5のステップS21に戻る。
【0109】
一方、今回の超曲面が破棄されていない場合には、今回の超曲面を採用するので、呼び出し元の処理に戻る。
【0110】
以上のような超曲面生成処理を実行することで、L2個の超曲面を適切に生成できる。
【0111】
なお、上で述べた超曲面生成処理は一例であって、様々な変形が可能である。特に、超曲面を一つずつ追加する処理例を示したが、複数の超曲面を一度に生成して、それらについて類似性調整処理などを行っても良い。度数偏り調整処理、類似性再判定処理、距離調整処理などを直列的に実行してその都度パラメータを変更しているが、これらの処理の要件を満たしているか否かをまとめて判定して、その結果に基づきパラメータの変更を一度に行うようにしてもよい。
【0112】
なお、上で述べた超曲面生成処理において、j=1の場合には、類似性調整処理及び類似性再判定処理は行われない。
【0113】
図4に好ましい超曲面y
1及びy
2の例を示したが、より具体的には、これらの超曲面は閾値=0.5であるから、y
1=0.5=x
2+x
1-0.5であり、y
2=0.5=x
2-x
1+0.5となる。y
1のパラメータは、a=1、b=1、c=-0.5である。y
2のパラメータは、a=-1、b=1、c=0.5である。
【0114】
そして、このようなy
1及びy
2を用いて、対象1乃至4の入力ベクトルX
1乃至X
4を評価すれば、
図16に示すようになる。すなわち、対象1には固定値ベクトルZ
1=(1,1)が算出され、対象2には固定値ベクトルZ
2=(1,0)が算出され、対象3には固定値ベクトルZ
3=(0,1)が算出され、対象4には固定値ベクトルZ
4=(0,0)が算出される。これによって、対象1乃至4の測定結果などから得られる入力ベクトルX
1乃至X
4のみから、対象の各々を識別するユニークなベクトルが得られるようになる。
【0115】
次に、検出装置200の処理内容について、
図17を用いて説明する。
【0116】
まず、測定部210は、特定の対象に対して所定の測定を行って、測定結果に基づき、L1次元のベクトルXを生成し、測定データ格納部220に格納する(
図17:ステップS201)。測定部210は、情報処理装置100の測定部110と同じ処理を行う。
【0117】
抽出部230は、情報処理装置100から配信され且つパラメータ格納部260に格納されているパラメータに係る超曲面で、ベクトルXを評価して、対象の固定値ベクトルを生成する(ステップS203)。
【0118】
パラメータ格納部260には、fj()(1≦j≦L2)のパラメータが格納されているので、Y’=(y1,y2,...,yL2)=(f1(X),f2(X),...,fL2(X))を算出し、yjのそれぞれについてround()を適用することで、固定値ベクトルZが得られる。
【0119】
抽出部230は、この固定値ベクトルを後処理部240に出力し、後処理部240は、例えばネットワーク300を介して情報処理装置100における対象DB170などから、固定値ベクトルに対応する属性データを抽出し、属性データなどに関連する処理を実行する(ステップS205)。
【0120】
このように、本実施の形態では、パラメータ格納部260に格納されているパラメータに係る超曲面は、どの対象についても同一の超曲面であり、個々の対象に対してID等を付することなく、固定値ベクトルを得ることができるようになる。
【0121】
[実施の形態2]
第1の実施の形態でも十分なノイズ耐性を有しているが、誤り訂正機能を追加するようにしてもよい。
【0122】
本実施の形態では、例えば
図18に示すように、情報処理装置100bは、誤り訂正データ生成部180及び第3データ格納部190をさらに有し、配信部160の代わりに超曲面のパラメータと誤り訂正データとを配信する配信部160bを有する。
【0123】
また、各検出装置200bは、誤り訂正データ格納部270をさらに有し、設定部250及び抽出部230の代わりに、パラメータ格納部260に超曲面のパラメータを格納すると共に誤り訂正データ格納部270に誤り訂正データを格納する設定部250bと、誤り訂正機能を有する抽出部230bとを有する。
【0124】
次に、情報処理装置100bの誤り訂正データ生成部180の処理内容について、
図19を用いて説明する。この処理は、例えば、
図2のステップS15の前又は後に実行する。
【0125】
まず、誤り訂正データ生成部180は、生成された超曲面に基づき、各対象iの固定値ベクトルZiを生成する(ステップS301)。このステップは、
図2のステップS13における処理の一部と同じである。
【0126】
すなわち、超曲面を表す関数f1乃至fL2の集合F()=(f1(),f2(),...,fL2())を用いて、ベクトルYi=(yi,1,yi,2,...,yi,L2)=F(Xi)=(f1(Xi),f2(Xi),...,fL2(Xi))を算出する。さらに、このベクトルYiの各要素yi,jについてround()を適用することで離散化し、固定値ベクトルZiを生成する。
【0127】
そして、誤り訂正データ生成部180は、各固定値ベクトルZiに対して、誤り訂正のための冗長データを生成する(ステップS303)。具体的には、BCH符号、RS符号、LDPC符号、ターボ符号などの既存の誤り訂正符号に従い、Ziを情報シンボルとする組織符号の冗長データを生成する。
【0128】
例えば、Xi=(0.5,0.5)に対して固定値ベクトルZi=(1,1)が得られた場合には、Ziに対して所定の誤り訂正符号に従って、冗長データZr,i=(0,0,1,0,1,0,0)を生成する。
【0129】
そして、誤り訂正データ生成部180は、入力ベクトルXiを入力とし、その冗長データZr,iを教師データとする機械学習を実施し、学習済みモデルを生成する(ステップS305)。例えばニューラルネットワークに基づく所定のモデルを用意して既存のアルゴリズムによって学習を行うことで学習済みモデルを生成する。誤り訂正データ生成部180は、学習済みモデルのパラメータを、第3データ格納部190に格納する。
【0130】
配信部160bは、第3データ格納部190に格納されている学習済みモデルのパラメータを、各検出装置200bに配信する(ステップS307)。このデータについても、オフラインで配布するようにしてもよい。
【0131】
これに対して、検出装置200bでは、
図20に示すような処理を実行する。
【0132】
まず、測定部210は、特定の対象に対して所定の測定を行って、測定結果に基づき、L1次元のベクトルXを生成し、測定データ格納部220に格納する(ステップS311)。このステップは、
図17のステップS201と同じである。
【0133】
抽出部230bは、情報処理装置100bから配信され且つパラメータ格納部260に格納されているパラメータに係る超曲面で、ベクトルXを評価して、対象の固定値ベクトルを生成する(ステップS313)。このステップは、
図17のステップS203と同じである。
【0134】
さらに、抽出部230bは、誤り訂正データ格納部270に格納されている学習済みモデルのパラメータから学習済みモデルを構築して、ベクトルXに対する冗長データを生成する(ステップS315)。
【0135】
そして、抽出部230bは、固定値ベクトル及び冗長データで誤り訂正処理を行って、最終的な固定値ベクトルを生成する(ステップS317)。
【0136】
例えば、上で述べた例と同じ対象についてステップS313でX=(0.4,0.6)が得られて、固定値ベクトルZ=(1,0)が得られたとしても、ステップS315で冗長データ(1,0,1,0,1,0,0)又はそれに近いデータが得られれば、誤り訂正処理にて、Z=(1,1)に訂正できるようになる。
【0137】
なお、ステップS317の後に、
図17におけるステップS205のような処理を行うようにしてもよい。
【0138】
以上のような誤り訂正データを検出装置200bに配布しておくことにより、検出装置200bにおける測定に対するノイズ耐性が高くなる。
【0139】
[実施の形態3]
第2の実施の形態とは異なる態様で誤り訂正データを生成し、それを用いた誤り訂正処理を行ってもよい。
【0140】
本実施の形態に係る誤り訂正データ生成部180の処理内容について、
図21を用いて説明する。この処理は、例えば、
図2のステップS15の前又は後に実行する。但し、L2は冗長性を持たせ長めに設定する。
【0141】
まず、誤り訂正データ生成部180は、生成された超曲面に基づき、各対象iの固定値ベクトルZiを生成する(ステップS321)。このステップは、
図2のステップS13における処理の一部と同じである。
【0142】
そして、誤り訂正データ生成部180は、固定値ベクトルの各要素iについて、当該要素i以外の要素の値を入力とし、当該要素iの値を教師データとする機械学習を実施し、学習済みモデルを生成する(ステップS323)。例えばニューラルネットワークに基づく所定のモデルを用意して既存のアルゴリズムによって学習を行うことで学習済みモデルを生成する。誤り訂正データ生成部180は、学習済みモデルのパラメータを、第3データ格納部190に格納する。
【0143】
ここで、固定値ベクトルZi=(a,b,c,d,e,f,g,h,k)(a乃至kは全て1又は0)が得られたとすると、第1の要素「a」を教師データとして、残りの要素「b,c,d,e,f,g,h,k」を入力とする機械学習を行って、学習済みモデルg1を生成する。また、第2の要素「b」を教師データとして、残りの要素「a,c,d,e,f,g,h,k」を入力とする機械学習を行って、学習済みモデルg2を生成する。同様にして、L2=9番目の要素「k]を教師データとし、残りの要素「a,b,c,d,e,f,g,h」を入力とする機械学習を行って、学習済みモデルg9を生成する。
【0144】
なお、これは一例であって、複数の要素を教師データとし、当該複数の要素の残りの要素を入力とするようにしてもよい。例えば、「a,b,c」を教師データとして、残りの要素「d,e,f,g,k」を入力とする機械学習を行い、「d,e,f」を教師データとして、残りの要素「a,b,c,g,h,k」を入力とする機械学習を行い、「g,h,k」を教師データとし、残りの「a,b,c,d,e,f」を入力とする機械学習を行う、といったように変形することも可能である。要するに、複数の学習済みモデルを生成して、それらを用いて全ての要素を相補的に推測できるようにする。
【0145】
そして、配信部160bは、第3データ格納部190に格納されている学習済みモデルのパラメータを、各検出装置200bに配信する(ステップS325)。このデータについても、オフラインで配布するようにしてもよい。
【0146】
これに対して、検出装置200bにおける処理を
図22に示す。
【0147】
まず、測定部210は、特定の対象に対して所定の測定を行って、測定結果に基づき、L1次元のベクトルXを生成し、測定データ格納部220に格納する(ステップS3
31 )。このステップは、
図17のステップS201と同じである。
【0148】
また、抽出部230bは、パラメータ格納部260に格納されているパラメータに係る超曲面に基づき、ベクトルXから、対象の第1評価ベクトルを生成する(ステップS333)。
【0149】
本実施の形態では、パラメータ格納部260には、fj()(1≦j≦L2)のパラメータが格納されているので、Y’=(y1,y2,...,yL2)=(f1(X),f2(X),...,fL2(X))を算出し、これを初期的な第1評価ベクトルとして用いる。
【0150】
さらに、抽出部230bは、誤り訂正データ格納部270に格納されている複数の学習済みモデルのパラメータから複数の学習済みモデルを構築し、第1評価ベクトルに対して当該複数の学習済みモデルを適用して、第2評価ベクトルを生成する(ステップS335)。
【0151】
例えば、第1評価ベクトルがY’=[0.9,0.1,0.5,0.3,0.8,0.5,0.7,0.1,0.6]が得られたとすると、上の例では、g1(0.1,0.5,0.3,0.8,0.5,0.7,0.1,0.6)、g2(0.9,0.5,0.3,0.8,0.5,0.7,0.1,0.6)、...g9(0.9,0.1,0.5,0.3,0.8,0.5,0.7,0.1)を計算する。そうすると、例えば、第2評価ベクトルY”=(0.8,0.1,0.5,0.3,0.8,0.5,0.7,0.1,0.6)が得られる。
【0152】
そして、抽出部230bは、第1評価ベクトルと第2評価ベクトルとから、候補ベクトルを生成する(ステップS337)。ここでは、第1評価ベクトルと第2評価ベクトルの同一要素について閾値との差が大きい方を採用するか、同一要素の間の任意の値(予め定められたルールに従って決定される値。例えば実験的に定める。)を採用する関数G2(Y’,Y”)を適用する。
【0153】
例えば、Y’=[0.9,0.1,0.5,0.3,0.8,0.5,0.7,0.1,0.6]で、Y”=(0.8,0.1,0.5,0.3,0.8,0.5,0.7,0.1,0.6)が得られた場合、異なる値は第1要素だけである。ここでは、0.9と0.8のうち、例えば閾値0.5との差が大きい方である「0.9」を採用する。そうすると、Y'''=(0.9,0.1,0.5,0.3,0.8,0.5,0.7,0.1,0.6)が得られる。
【0154】
そうすると、抽出部230bは、候補ベクトルY'''の全要素が閾値から所定値以上離れているか否かを判断する(ステップS339)。例えば、各要素について、|要素値-閾値|≧所定値であるか否かを判断する。
【0155】
この要件を満たしていない場合には、抽出部230bは、候補ベクトルを新たな第1評価ベクトルに設定する(ステップS341)。そして、処理はステップS335に戻って、新たな第1評価ベクトルから新たな第2評価ベクトルを生成する。
【0156】
一方、ステップS339の要件を満たす場合には、抽出部230bは、候補ベクトルに対して離散化処理(round())を行い、最終的な固定値ベクトルを生成する(ステップS343)。
【0157】
なお、ステップS343の後に、
図17におけるステップS205のような処理を行うようにしてもよい。
【0158】
以上のような誤り訂正データを検出装置200bに配布する場合でも、検出装置200bにおける測定に対するノイズ耐性が高くなる。
【0159】
なお、ステップS339の要件を複数回チェックしても要件を満たさない場合には、エラーを出力するなどしても良い。
【0160】
[実施の形態4]
第2及び3の実施の形態とは異なる態様で誤り訂正データを生成し、それを用いた誤り訂正処理を行ってもよい。
【0161】
本実施の形態に係る誤り訂正データ生成部180の処理内容について、
図23を用いて説明する。この処理は、例えば、
図2のステップS15の前又は後に実行する。
【0162】
まず、誤り訂正データ生成部180は、生成された超曲面に基づき、各対象iの固定値ベクトルZiを生成する(ステップS351)。このステップは、
図2のステップS13における処理の一部と同じである。
【0163】
すなわち、超曲面を表す関数f1乃至fL2の集合F()=(f1(),f2(),...,fL2())を用いて、ベクトルYi=(yi,1,yi,2,...,yi,L2)=F(Xi)=(f1(Xi),f2(Xi),...,fL2(Xi))を算出する。さらに、このベクトルYiの各要素yi,jについてround()を適用することで離散化し、固定値ベクトルZiを生成する。
【0164】
配信部160bは、この固定値ベクトルZiそのものを誤り訂正データとして、各検出装置200bに配信する(ステップS353)。Ziについては全ての対象i(1≦i≦L3)について各検出装置200bに送信してもよいし、本実施の形態以外の実施の態様において誤り訂正能力が低い対象のみに限定して各検出装置200bに配信し、他の実施の形態の誤り訂正方式と組み合わせても良い。
【0165】
このデータについても、オフラインで配布するようにしてもよい。
【0166】
これに対して、検出装置200bでは、
図24に示すような処理を実行する。
【0167】
まず、測定部210は、特定の対象に対して所定の測定を行って、測定結果に基づき、L1次元のベクトルXを生成し、測定データ格納部220に格納する(ステップS361)。このステップは、
図17のステップS201と同じである。
【0168】
そして、抽出部230bは、情報処理装置100bから配信され且つパラメータ格納部260に格納されているパラメータに係る超曲面で、ベクトルXを評価して、対象の候補ベクトルを生成する(ステップS363)。このステップは、
図17のステップS203と同じであるが、以下で誤り訂正のための処理を行うので候補ベクトルとして示している。
【0169】
その後、抽出部230bは、誤り訂正データ格納部270に格納されている固定値ベクトルと候補ベクトルとを比較して、候補ベクトルに最も近い固定値ベクトルを特定して、出力する(ステップS365)。
【0170】
このような処理を行うようにしても、確実に対象の固定値ベクトルを得ることができるようになる。また、Xi自体を保存するよりデータサイズを削減でき、Xiに特徴が無いようなランダムなデータに対してもデータサイズを削減できる。
【0171】
以上本発明の実施の形態を説明したが、本発明はこれに限定されるものではない。例えば、処理フローは一例であって、処理結果が変わらない限り、ステップの順番入れ替えや複数ステップの並列実行を行うようにしてもよい。
【0172】
なお、上で述べた情報処理装置100及び100b並びに検出装置200及び200bの少なくとも一部は、コンピュータ装置であって、
図25に示すように、メモリ2501とCPU(Central Processing Unit)2503とハードディスク・ドライブ(HDD:Hard Disk Drive)2505と表示装置2509に接続される表示制御部2507とリムーバブル・ディスク2511用のドライブ装置2513と入力装置2515とネットワークに接続するための通信制御部2517とがバス2519で接続されている。なお、HDDはソリッドステート・ドライブ(SSD:Solid State Drive)などの記憶装置でもよい。オペレーティング・システム(OS:Operating System)及び本発明の実施の形態における処理を実施するためのアプリケーション・プログラムは、HDD2505に格納されており、CPU2503により実行される際にはHDD2505からメモリ2501に読み出される。CPU2503は、アプリケーション・プログラムの処理内容に応じて表示制御部2507、通信制御部2517、ドライブ装置2513を制御して、所定の動作を行わせる。また、処理途中のデータについては、主としてメモリ2501に格納されるが、HDD2505に格納されるようにしてもよい。本技術の実施例では、上で述べた処理を実施するためのアプリケーション・プログラムはコンピュータ読み取り可能なリムーバブル・ディスク2511に格納されて頒布され、ドライブ装置2513からHDD2505にインストールされる。インターネットなどのネットワーク及び通信制御部2517を経由して、HDD2505にインストールされる場合もある。このようなコンピュータ装置は、上で述べたCPU2503、メモリ2501などのハードウエアとOS及びアプリケーション・プログラムなどのプログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。
【0173】
なお、上で述べたような処理を実行することで用いられるデータは、処理途中のものであるか、処理結果であるかを問わず、メモリ2501又はHDD2505等の記憶装置に格納される。
【0174】
以上述べた実施の形態をまとめると以下のようになる。
【0175】
本実施の形態の第1の態様に係る情報処理方法は、(A)複数の対象の各々を表す入力ベクトルを取得するステップと、(B)入力ベクトルを包含する空間を複数の対象の各々を表す入力ベクトルが異なる部分空間に含まれるように分割し、且つ複数の対象の各々を識別するユニークなベクトルを生成するのに用いられる複数の超曲面を生成するステップとを含む。
【0176】
このような性質を有する超曲面を生成して保持しておくことにより、対象にID等が付されていない状況や対象を変更したり加工したりできない状況においても、後の抽出フェーズ(又は検出フェーズ)において、対象から固有のデータを確実に抽出できるようになる。
【0177】
なお、上記情報処理方法は、(C)生成された複数の超曲面のパラメータを、複数の対象の少なくともいずれかに対して当該対象を識別するユニークなベクトルを生成する装置に出力するステップをさらに含むようにしてもよい。このような装置に超曲面のパラメータを出力しておけば、当該装置で対象を識別するユニークなベクトルを生成できるようになり、当該ユニークなベクトルを基に属性データの抽出その他の後処理を容易にできるようになる。
【0178】
さらに、上記情報処理方法は、(D)上記ユニークなベクトルの誤り訂正のためのデータを生成し、上記装置に出力するステップをさらに含むようにしてもよい。上記装置における測定におけるノイズにより適切に対処できるようになる。
【0179】
なお、上で述べた複数の超曲面を生成するステップにおいて、複数の超曲面又は複数の超曲面のうち一定数以上の超曲面が、複数の対象の各々を表す入力ベクトルを当該超曲面で写像した点と閾値との距離が所定値以上離れるように生成されるようにしてもよい。ノイズ耐性が高まる。
【0180】
さらに、上で述べた複数の超曲面を生成するステップにおいて、複数の超曲面が、互いの類似度が閾値未満であるように生成されるようにしてもよい。分布の偏りを是正できるようになる。
【0181】
さらに、上で述べた誤り訂正のためのデータを生成する処理が、(d1)複数の対象の各々を表す入力ベクトルを、生成された前記複数の超曲面を用いて評価することで、複数の対象の各々を識別するユニークなベクトルを生成するステップと、(d2)上記ユニークなベクトルの各々に対して、誤り訂正符号による冗長データを生成するステップと、(d3)複数の対象の各々を表す入力ベクトルを入力とし、当該対象についてのユニークなベクトルに対する冗長データを出力とするモデルに対して機械学習を実行し、学習済みモデルを生成するステップとを含むようにしてもよい。既によく知られている誤り訂正符号を活用するものである。
【0182】
また、上で述べた誤り訂正のためのデータを生成する処理が、(d4)複数の対象の各々を表す入力ベクトルを、生成された複数の超曲面を用いて評価することで、複数の対象の各々を識別するユニークなベクトルを生成するステップと、(d5)複数の対象の各々を識別するユニークなベクトルにおける一部の要素を出力とし、当該ユニークなベクトルにおける上記一部の要素以外の要素を入力とするモデルに対して機械学習を実行し、上記ユニークなベクトルの全ての要素を推測できるように複数の学習済みモデルを生成するステップとを含むようにしてもよい。このようにすれば、対象を識別するユニークなベクトルを相補的に復元するための学習済みモデルが得られるようになる。
【0183】
さらに、上で述べた誤り訂正のためのデータを生成する処理が、(d6)複数の対象の各々を表す入力ベクトルを、生成された複数の超曲面を用いて評価することで、複数の対象の各々を識別するユニークなベクトルを生成するステップを含むようにしてもよい。対象の個数分のユニークなベクトルが誤り訂正データとして生成されるためデータサイズは大きくなる場合があるが、誤り訂正データ生成のための処理負荷は低い。
【0184】
本実施の形態の第2の態様に係る情報処理方法は、(A)複数の対象に含まれる特定の対象を表すベクトルを取得するステップと、(B)上記ベクトルを包含する空間を複数の対象の各々が異なる部分空間に含まれるように分割し且つ予め保持している複数の超曲面を用いて、特定の対象を表すベクトルを評価することで、特定の対象を識別するベクトルを生成する生成ステップとを含む。
【0185】
このように、上記のような性質を有する超曲面のデータを予め得ておけば、対象にID等が付されていない状況においても、対象から固有のデータを確実に抽出できる。そして、生成されたベクトルを用いれば、例えば、対応付けられた属性データなどを取得して、様々な処理を行うことができるようになる。
【0186】
なお、上記情報処理方法は、(C)予め保持している、誤り訂正のためのデータを用いて、生成された上記ベクトルに対する誤り訂正処理を行うステップをさらに含むようにしてもよい。
【0187】
例えば、誤り訂正のためのデータが、ある対象を表す入力ベクトルを入力とし、当該ある対象についての、誤り訂正符号による冗長データを出力とする機械学習の学習済みモデルである場合、上で述べた誤り訂正処理が、(c1)特定の対象を表す入力ベクトルから、学習済みモデルにより、誤り訂正符号による冗長データを生成するステップと、(c2)誤り訂正符号に基づき、特定の対象を識別するベクトルと生成された冗長データとから、特定の対象を識別する訂正後のベクトルを生成するステップとを含むようにしてもよい。このような学習済みモデルを用いることで誤り訂正のための冗長データを復元でき、既によく知られている誤り訂正符号を活用して対象を識別するベクトルの誤りを訂正できるようになる。
【0188】
また、誤り訂正のためのデータが、複数の対象の各々を識別するユニークなベクトルである場合、上で述べた誤り訂正処理が、(c3)複数の対象の各々を識別するユニークなベクトルのうち、特定の対象を識別するベクトルと最も近いユニークなベクトルを特定するステップを含むようにしてもよい。
【0189】
さらに、誤り訂正のためのデータが、ある対象のためのベクトルにおける一部の要素を出力とし、当該ある対象のためのベクトルにおける上記一部の要素以外の要素を入力とし、ある対象のためのベクトルの全ての要素を推測できるように複数生成された学習済みモデルである場合、上で述べた生成ステップが、(b1)複数の超曲面により入力ベクトルを変換することで得られる第1ベクトルから、上記学習済みモデルにより、第2ベクトルを生成する第1ステップと、(b2)第1ベクトルと第2ベクトルとの要素毎の比較に基づき、候補となるベクトルを生成する第2ステップと、(b3)候補となるベクトルの各要素が、要素毎の離散化処理における閾値との差が所定値以上となるか判定する第3ステップと、(b4)候補となるベクトルの各要素が、要素毎の離散化処理における閾値との差が所定値以上となる場合には、候補となるベクトルの各要素に対して離散化処理を実行するステップと、(b5)候補となるベクトルの各要素が、要素毎の離散化処理における閾値との差が所定値未満である場合には、候補となるベクトルを第1ベクトルとして、第1ステップ乃至第3ステップを実行するステップとを含むようにしてもよい。
【0190】
以上述べた情報処理方法をコンピュータに実行させるためのプログラムを作成することができて、そのプログラムは、様々な記憶媒体に記憶される。
【0191】
また、上で述べたような情報処理方法を実行する情報処理装置は、1台のコンピュータで実現される場合もあれば、複数台のコンピュータで実現される場合もあり、それらを合わせて情報処理システム又は単にシステムと呼ぶものとする。
【符号の説明】
【0192】
100,100b 情報処理装置
110 測定部
120 第1データ格納部
130 パラメータ生成部
140 第2データ格納部
150 登録部
160,160b 配信部
170 対象DB
180 誤り訂正データ生成部
190 第3データ格納部
200,200b 検出装置
210 測定部
220 測定データ格納部
230,230b 抽出部
240 後処理部
250 設定部
260 パラメータ格納部
270 誤り訂正データ格納部