(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-09-28
(45)【発行日】2023-10-06
(54)【発明の名称】事象予測装置
(51)【国際特許分類】
G06Q 10/04 20230101AFI20230929BHJP
G06F 17/10 20060101ALI20230929BHJP
【FI】
G06Q10/04
G06F17/10 Z
(21)【出願番号】P 2019518001
(86)(22)【出願日】2019-03-27
(86)【国際出願番号】 JP2019013483
(87)【国際公開番号】W WO2020194642
(87)【国際公開日】2020-10-01
【審査請求日】2022-03-26
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成30年度、国立研究開発法人情報通信研究機構「高度通信・放送研究開発委託研究 /データ連携・利活用による地域課題解決のための実証型研究開発」、産業技術力強化法第19条の適用を受ける特許出願
(73)【特許権者】
【識別番号】519112520
【氏名又は名称】株式会社Singular Perturbations
(74)【代理人】
【識別番号】100174643
【氏名又は名称】豊永 健
(72)【発明者】
【氏名】梶田 真実
(72)【発明者】
【氏名】梶田 晴司
【審査官】北村 学
(56)【参考文献】
【文献】国際公開第2017/222030(WO,A1)
【文献】米国特許第08949164(US,B1)
【文献】特開2011-192040(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/04
G06F 17/10
(57)【特許請求の範囲】
【請求項1】
時刻tにおける
特定事象の特徴量ベクトルρ(t)を過去に発生した
特定事象の履歴データに基づいて予測する事象予測装置において、
行列c(t)を
【数1】
と定義して
【数2】
を求め、Φ(t)のラプラス変換Φ(z)を求め、定数γを用いてグリーン関数G(z)を
、所定の微小時間Δtを用いて
【数3】
として求め、このG(z)を
逆ラプラス変換してG(t)を求める予測式構築部と、
前記予測式構築部で求めたG(t)を用いて、
【数4】
に将来の時刻tを入力して前記特定事象の特徴量ベクトルρ(t)を求める予測部と、
を有することを特徴とする事象予測装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、事象予測装置および事象予測方法に関する。
【背景技術】
【0002】
米国カリフォルニア州で犯罪発生の可能性が高い要注意エリアを警察官が重点的に見回ることにより、その後の犯罪発生が抑制されたという事例がある。また、地震の余震予測のために提案されたアルゴリズムを用いて犯罪の発生密度の予測精度を向上させた例がある。
【0003】
犯罪発生の予測は、たとえばSelf-Exciting Point Process(SEPP)モデルを用いて行われる。SEPPモデルでは、特定の位置、将来の特定の時刻における犯罪の発生密度を、過去の犯罪発生事象による影響の総和で示す。より具体的には、ある過去の犯罪発生事象の犯罪の特定の位置および特定の時刻における発生密度に対する影響は、予測する位置と過去の犯罪の発生位置との距離と、予測する時刻と過去の犯罪の発生時刻との間の時間との関数で表されるとする。さらに、過去に発生した犯罪のそれぞれについて求めた発生密度に対する影響を足し合わせることによって求める。
【0004】
過去の犯罪発生事象の犯罪発生密度に対する影響を、現在着目する位置・時刻と過去の事象の位置・時刻との間の距離Δxおよび時間Δt(それぞれ適切な長さ、時間を単位にスケールする)を用いてg(Δt,Δx)と書くことにすると、g(Δt,Δx)=1/((1+Δt)(1+Δx))と表現する方法がある(Prospective Hotspot Method)。期待値最大化法(Expectation Maximization Algorithm)を用いて、過去の犯罪発生事象の履歴データから過去の犯罪発生事象の犯罪の位置xおよび時刻tにおける発生密度に対する影響g(Δt,Δx)を構築する方法もある。
【0005】
過去に発生した事象の履歴データに基づいてその事象の将来の発生密度を予測する精度を高めるため、予測式構築部と予測部とを備える手法がある。予測式構築部は、特定事象の発生時刻tおよび特定事象の発生領域を特定する領域特定変数xの関数ρ(t,x)で前記特定事象の発生密度が与えられ、かつ、関数ρ(t,x)は外部因子{f}と関数ρ(t,x)の写像F[ρ(t,x)+{f}]で与えられるとして、写像F[ρ(t,x)+{f}]を過去に発生した特定事象の履歴データから求めて、関数ρ(t,x)を発生時刻tおよび領域特定変数xの関数として表現する。予測部は、関数ρに将来の時刻および領域を特定する値を入力して、特定事象の発生密度を予測する予測部と、を有する。
【先行技術文献】
【特許文献】
【0006】
【文献】米国特許第8949164号
【文献】米国特許第9129219号
【文献】WO2017/222030
【発明の概要】
【発明が解決しようとする課題】
【0007】
過去の発生事象である犯罪との距離差Δxおよび時間差Δtにおける発生密度に対する影響g(Δt,Δx)を特定の関数で表現した場合、現実とは異なり、精度が上がらない場合がある。また、期待値最大化法を用いて影響g(Δt,Δx)を構築する場合、機械学習による予測においては、データ数が少ない場合に精度が高く出ない場合がある。
【0008】
そこで、本発明は、過去に発生した特定事象の履歴データに基づいて特定事象の将来の発生密度を予測する事象発生予測装置において、データ数が少ない場合も予測精度を上げることを目的とする。
【課題を解決するための手段】
【0009】
上述の目的を達成するため、本発明は、時刻tにおける
特定事象の特徴量ベクトルρ(t)を過去に発生した
特定事象の履歴データに基づいて予測する事象予測装置において、行列c(t)を
【数1】
と定義して
【数2】
を求め、Φ(t)のラプラス変換Φ(z)を求め、定数γを用いてグリーン関数G(z)を
、所定の微小時間Δtを用いて
【数3】
として求め、このG(z)を
逆ラプラス変換してG(t)を求める予測式構築部と、前記予測式構築部で求めたG(t)を用いて、
【数4】
に将来の時刻tを入力して前記特定事象の特徴量ベクトルρ(t)を求める予測部と、を有することを特徴とする。
【発明の効果】
【0012】
本発明によれば、過去に発生した特定事象の履歴データに基づいて特定事象の将来の発生密度を予測する事象発生予測装置において、データ数が少ない場合も予測精度を上げることができる。
【図面の簡単な説明】
【0013】
【
図1】本発明に係る事象発生予測装置の一実施の形態におけるブロック図である。
【
図2】本発明に係る事象発生予測装置の一実施の形態を用いた事象発生予測方法のフローチャートである。
【
図3】本発明に係る事象発生予測装置の一実施の形態を用いた犯罪発生率予測におけるカーネル関数gの時刻t依存性の評価例を示す図である。
【
図4】本発明に係る事象発生予測装置の一実施の形態を用いた犯罪発生率予測結果を示す等高線である。
【発明を実施するための形態】
【0014】
本発明に係る事象発生予測装置の一実施の形態を、図面を参照して説明する。なお、この実施の形態は単なる例示であり、本発明はこれに限定されない。同一または類似の構成には同一の符号を付し、重複する説明は省略する。
【0015】
図1は、本発明に係る事象発生予測装置の一実施の形態におけるブロック図である。
【0016】
本実施の形態では、特定の時刻および領域における住居侵入などの犯罪(特定事象)の発生密度を予測する。ここで、領域とは、犯罪が発生する地図上の位置を示すものである。発生密度を予測する特定事象が、たとえばインターネット上での詐欺などの犯罪や迷惑電話の場合、領域はURLなどのインターネット上の位置や電話番号を示すものとなる。
【0017】
事象発生予測装置は、予測式構築部10と、予測部30とを有している。
【0018】
予測式構築部10は、特定事象の発生時刻tおよび特定事象の発生領域を特定する領域特定変数xの関数ρ(t,x)で特定事象の発生密度が与えられ、かつ、関数ρ(t,x)は外部因子{f}と関数ρ(t,x)の写像F[ρ(t,x)+{f}]で与えられるとして、写像F[ρ(t,x)+{f}]を過去に発生した特定事象の履歴データから求めて、関数ρ(t,x)を発生時刻tおよび領域特定変数xの関数として表現する。外部因子{f}とは、天候条件、地理構造などの環境要因や、パトロール状況などの特定事象の履歴データ以外の特定事象の発生密度に影響を与える因子である。予測式構築部10は、たとえば履歴データ群記憶部12とカーネル関数構築部14とカーネル関数記憶部16と予測式構築部18と予測式記憶部20と履歴データ受信部22を有している。
【0019】
予測部30は、予測式構築部10が構築した予測式、すなわち、関数g(t,x)とデータを使って、特定事象の発生密度を日時t、場所xの関数として算出する。
【0020】
事象発生予測装置は、表示部40を備えていてもよい。表示部40は、予測部30が算出した特定事象の発生密度を認識可能な状態に表示する。表示部40は、たとえば地図上に、特定事象の発生密度の等高線を表示する。
【0021】
次に、本実施の形態における、特定事象の発生密度の算出方法について説明する。時刻t、領域xにおける特定事象の発生密度ρ(t,x)を考える。この発生密度ρ(t,x)は、それ自身の写像Fで表されると仮定する。つまり、
ρ(t,x)=F[ρ(t,x)+{f}] …(1)
であるとする。ここで{f}は季節、環境要因、パトロール状況などの外部因子が考えられる。
【0022】
予測式構築部10は、過去の特定事象の発生履歴データ群を用いて、写像Fを構築するという問題を解く。ここで、特定事象の発生履歴データ群とは、複数の履歴データの集合である。履歴データとは、特定事象が発生した時刻tおよび発生した領域を特定する領域特定変数xの組である。履歴データに特定事象の種類を示すインデックスを含めてもよい。
【0023】
写像F[ρ(t,x)+{f}]は、たとえば、偏微分方程式の解と仮定することができる。
【0024】
また、偏微分方程式の解は、たとえばカーネル関数(グリーン関数、応答関数、積分核と呼ばれることもある)を使って書くことができる。
【0025】
発生密度ρ(t,x)は、たとえば、1変数の場合、以下の方程式を満たすと仮定することができる。
【0026】
【数13】
ここで、γは記述したい現象に合わせ決めることができる。
【0027】
なお、右辺第一項のカーネル関数にかかるρ(t,x)に関する関数形や外部因子依存性と、第二項の形式には、幾つかのバリエーションが可能である。ここでは、最も単純な一例を挙げて議論を進めることにする。
【0028】
また、カーネル関数g(t,t’,x,x’)は過去の事象と現在の時空間との時間差、距離差の関数で書けると仮定できる場合がある。たとえば、発展方程式の形は、
【数14】
などが考えられる。たとえばγは、毎日1件の犯罪が発生する状況(定常解)において、SEPPモデルのλ(t,x)の定常解とρ(t,x)の定常解が等しくなるとの要請を加えるとγ=log2と求まる。一般的には、係数γは何らかの(たとえば定常状態などの)理想状態においてρ(t)がSEPPモデルのconditional intensity λ(t)と一致するといった制約を課すことで一意に定めることができる。
【0029】
この発展方程式を領域xについてフーリエ変換し、時刻tについてラプラス変換すると、以下の式が得られる。
【0030】
【数15】
Φ(t,k)=<ρ(t+t
0,k)/ρ(t
0,k)>
t0 …(5)
【0031】
過去の犯罪履歴データ、すなわち、ある時刻t、領域kにおける発生密度ρ(t,k)を用いて、Φ(t,k)が求められる。ここで、過去の時刻t、領域xにおける発生密度ρ(t,x)は、正の整数値をとる。i番目に発生した特定事象について、発生時刻をti、発生領域xiとすると、同時刻、同領域に他の事象が発生しなかった場合、ρ(ti,xi)=1となる。Φ(t,k)が得られたら、そのΦを用いてg(z,k)が得られる。g(t,x)が求められたら、予測犯罪密度λ(t,x)は、Self-Exciting Point Process(SEPP)モデルの時空間カーネル項に代入することで与えられる。
【0032】
λ(t,x)の計算方法の一例を以下に挙げる。
λ(t,x)=Σti<tg(t-ti,x-xi) …(6)
ここで、(6)の和は時刻tより前に発生した特定事象についてのすべての和である。
【0033】
図2は、本実施の形態の事象発生予測装置を用いた事象発生予測方法のフローチャートである。
【0034】
この事象発生予測方法は、予測式構築フェーズと、予測フェーズに分けられる。予測式構築フェーズでは、特定事象の発生時刻tおよび特定事象の発生領域を特定する領域特定変数xの関数ρ(t,x)で特定事象の発生密度が与えられ、かつ、関数ρ(t,x)は前記外部因子{f}と前記関数ρ(t,x)の写像F[ρ(t,x)+{f}]で与えられるとして、前記写像F[ρ(t,x)+{f}]を過去に発生した前記特定事象の履歴データから求めて、関数ρ(t,x)を前記発生時刻tおよび前記領域特定変数xの関数として表現する。予測フェーズでは、写像F[ρ(t,x)+{f}]と過去データを使って、前記特定事象の発生密度を予測する。より、具体的には次のとおりである。
【0035】
予測式構築フェーズでは、まず、過去の履歴データを履歴データ群記憶部12に蓄積する(S11)。過去の履歴データは、複数であってもよい。
【0036】
次に、カーネル関数構築部14は、履歴データ群記憶部12に蓄積された過去の履歴データ群を用いて、式(3)および式(4)からカーネル関数g(z,k)を求める(S12)。カーネル関数構築部14が導出したカーネル関数g(z,k)は、カーネル関数記憶部16に記憶される。このカーネル関数は、離散化した時刻z、および、離散化した領域を特定する領域特定変数kにおける値の表として記憶される。
【0037】
カーネル関数g(z,k)が得られたら、ラプラス逆変換、フーリエ逆変換を適用すると、予測式構築部18は、式(5)および式(6)から、特定事象の発生密度を予測する予測犯罪密度λ(t,x)を与える関数を構築する(S13)。予測式構築部18が構築した予測犯罪密度λ(t,x)は、予測式記憶部20に記憶される。この予測犯罪密度λは、離散化した時刻t、および、離散化した領域を特定する領域特定変数における値の表として記憶される。
【0038】
予測犯罪密度λの関数が構築されたら、履歴データ受信部22は、新たな履歴データが入力されるのを監視する(S14)。たとえば一般ユーザがスマートフォンなどの携帯端末24を通じて犯罪が発生したという事実を入力すると、その履歴データが履歴データ受信部22に受信される。携帯端末24には、一般ユーザが、犯罪を目撃した際などに、新たな履歴データを入力し、その履歴データを履歴データ受信部22に対して送信するアプリケーションがインストールされているものとする。あるいは、警察などの情報提供機関が有する警察システム26から履歴データ受信部22に履歴データが伝達されてもよい。
【0039】
履歴データ受信部22は、新たな履歴データが入力されるたびに繰り返し、監視を続ける。履歴データ受信部22に新たな履歴データが入力されたら、その履歴データは履歴データ群記憶部12に記憶され、工程S11に戻る。その結果、再び、工程S11~工程S13が行われ、新たな予測犯罪密度λの関数が構築されて、予測式記憶部20に記憶される。
【0040】
予測フェーズでは、まず、予測犯罪密度を予測する時刻および領域を設定する(S21)。予測する時刻は、特定の時刻でもよいし、幅をもっていてもよい。予測時間として、たとえば現在から所定の期間とする。予測する領域としては、特定の位置でもよいし、広がりをもっていてもよい。予測する領域として、たとえば予測式の構築のために履歴データを収集している領域全体とする。予測する時刻および領域の設定は、予測部30が行う。
【0041】
次に、工程S21で設定した時刻および領域において、予測部30は予測式記憶部20から予測式を受信して、予測犯罪密度λを計算する(S22)。予測する時刻および領域が幅あるいは広がりを持っている場合には、離散化された時刻および領域について、それぞれ予測犯罪密度λの計算を繰り返す。
【0042】
計算された予測犯罪密度λは、表示部40において表示される(S23)。人間が認識可能なように表示された予測犯罪密度λは、警察官などによって参照され、パトロール活動の参考とされる。あるいは、携帯端末24に表示された予測犯罪密度λは、携帯端末24のユーザが犯罪を避ける行動に用いられる。
【0043】
過去に発生した犯罪は、時間的・空間的に離れた位置において、次の犯罪を誘発する。時間差および距離が大きくなるほど、誘発する影響度は小さくなる傾向にある。たとえば、カリフォルニア州ロサンゼルスにおける不法侵入事件では、犯罪が発生すると、その1~2日後と7日後に、1m圏内での再発生密度が高くなる。過去の犯罪の履歴データそれぞれが、将来のある時刻・ある位置における犯罪を誘発すると考えると、将来の犯罪の発生密度ρは、過去の犯罪の発生密度ρの写像Fとして与えられることになる。そこで、本実施の形態では、ρ(t,x)=F[ρ(t,x)+{f}]と仮定し、犯罪の発生密度の密度場に対するカーネル関数を履歴データから構築している。
【0044】
図3は、本実施の形態の事象発生予測装置を用いた犯罪発生率予測におけるカーネル関数gの時刻t依存性の評価例を示す図である。
図3の横軸は時刻tの間の時間、縦軸はカーネル関数gの値である。
【0045】
図3に示すように、カーネル関数gは時間が大きくなるにしたがって、減少する傾向にある。しかし、
図3に示すように、カーネル関数gは時間に対して単調減少ではない。
【0046】
図4は、本実施の形態の事象発生予測装置を用いた犯罪発生予測結果を示す等高線である。
【0047】
図4は、ある都市の738件の犯罪の履歴データを用いて計算した予測犯罪密度の等高線である。予測犯罪密度の計算には予測したい日の前日までのデータを使った。予測したい日のデータは含まれていない。また、
図4には、予測した期間(1日)において、実際に発生した犯罪イベントをマーカーで併せて示した。
【0048】
図4に示す通り、予測犯罪密度が高い位置において、実際に犯罪が発生している場合が多いことがわかる。
【0049】
図5は、本実施の形態の事象発生予測装置を用いた犯罪発生予測結果を他の予測手法と比較して示した表である。
【0050】
本実施の形態の事象発生予測装置を用いた犯罪発生予測結果の精度は、過去の犯罪発生事象の犯罪の距離Δx(例えば空間分解能の半分の長さでスケールする)および時間Δt(例えば7日間でスケールする)における発生密度に対する影響g(Δt,Δx)をg(t,Δx)=1/((1+Δt)(1+Δx))と表現する方法(Prospective Hotspot Method)による予測結果の精度とEM法による予測結果の精度と比較して、たとえばシカゴの10罪種(theft, battery, criminal damage, narcotics, other offense, assault, burglary, motor-vehicle theft, deceptive practice and robbery)に対して、最高精度を達成した。精度は、実際の犯罪のうち予測できた犯罪の件数を実際の犯罪件数で除したもので比較し、予測においては、予測対象領域を250m1四方のセルに分割し、そのうちのある面積割合を犯罪危険地域に指定する。
【0051】
このように本実施の形態によれば、予測精度は、Prospective Hotspot Method、EM法よりも向上していることがわかる。
【0052】
なお、上述の実施の形態は、特定事象として犯罪を例として説明したが、ある1件の事象が新たに続く次の事象を誘発してカスケードする現象一般に適用可能である。特に、この誘発する割合が時間tおよび空間xの関数として見たときに時空間相関があり、かつその法則性にある程度の定常性があると予測される場合に、より高い精度を示すと期待される。このような事象として、たとえば地震の余震現象や空爆の被害状況などについては、過去にカスケード現象との関連が議論されている。さらには、自殺、疫病のパンデミック、ソーシャルネットワーキングサービス(SNS)上での勧誘・宗教・ねずみ講などの拡散、迷惑電話、服装などの流行、株価・金融商品の動向、選挙における投票、免疫系の異常事象、消費者の購買行動、ウェブサイト上の広告のクリック、ネットワーク上でのショッピングなどの需要予測、お見合いなどのマッチングにおける適合、薬物や金などの密輸、サイバークライム、サイバーテロを含むテロの予測、インフラの劣化予測、ソフトウェア・ハードウェアの故障や異常検知などについても、このようなカーネル関数を考えられると期待される。
【0053】
上述の実施の形態は、一つの特定事象を対象としてその将来の発生密度を予測するものであるが、多変数が影響しあうカスケード現象の予測にも応用できる。たとえば金融データに着目すると、それぞれの国における不動産の売買、国債・社債などの債権や株式の取引、現実の物の生産・販売、あるいはサービスの提供などによる現金の収受などが互いに影響しあい、外国為替取引におけるレート(為替レート)が変化する。この変化は、取引の瞬間における各国の不動産の状態に影響を受けるというよりも、過去の取引状態などにカスケード的に影響を受けている。
【0054】
n種の特定事象についてそれぞれの状態を予測する方法について考える。nは自然数である。ここで、特定事象の状態とは、発生密度でもよいし、為替レートなどの値であってもよい。i番目の特定事象の状態変数が関数ρ_i(t)で与えられるとする。
【0055】
n種の要素を持つ状態変数を与える関数ベクトルΡ(t)={ρ_1(t),…,ρ_i(t),…,ρ_n(t)}を考える。カスケード現象であれば、この状態変数ベクトルΡ(t)は、この関数ベクトルΡ(t)および外部因子ベクトル{f}の写像F[Ρ(t)+{f}]で与えられる。
【0056】
上述の実施の形態と同様にして、予測式構築部は、写像F[Ρ(t)+{f}]を過去に発生した特定事象の状態値と外部因子の履歴データから求めることができる。関数ベクトルΡ(t)が得られたら、予測部は、この関数ベクトルΡ(t)に将来の時刻を特定する値を入力して、特定事象の状態値を予測する。
【0057】
上述の実施の形態は、関数ベクトルΡ(t)が時刻tおよび特定事象の発生領域を特定する領域特定変数xの関数ρ(t,x)であると限定した場合である。xを離散化した場合には、xが示す各領域の発生密度ρ(t,x)の全体を関数ベクトルΡ(t)とみなすことができる。
【0058】
たとえば2つの特定事象の状態値を予測する場合は、以下の通りである。2つの特定事象の状態値を与える状態関数をそれぞれρa(t)、ρb(t)とする。また、それぞれの過去の状態がそれ自身および他の特定事象に与える影響を表現したグリーン関数としてgaa(t)、gab(t)、gba(t)、gbb(t)を導入する。このとき、発展方程式は、以下のように書ける。
【0059】
【数16】
ただし、外部因子の影響はないとした。また、簡単のため位置を示す変数xを無視した。γは1変量の場合と同様に、定常解の条件を考えるとγ=log2となる。以下、簡単のためγ,Δtを省略する。t
【0060】
特定事象の状態値を与える状態関数のベクトルを特徴量ベクトルρ(t)と呼ぶこととし、この式を一般化すると、以下の行列式のように書ける。
【数17】
【0061】
この(8)式をラプラス変換すると以下の行列式のようになる。
【数18】
【数19】
【0062】
ここで、以下の定義を導入する。
【数20】
すると、式(9)の逆ラプラス変換は以下のように表せる。
【数21】
【0063】
過去のデータ(履歴データ)からΦ(t)を求めるため、まず、式(11)の要素ρ
iをρ
jの初期状態で除する。次に初期状態を変えて複数のサンプルを生成し、その統計平均をとる。それぞれの初期状態の時刻をt
0と記述すると、
【数22】
【0064】
【0065】
この行列cを用いると、以下の式が得られる。
【数24】
【0066】
つまり、
【数25】
となる。このラプラス変換Φ(z)を用いて(11)式を変形すると、最終的なグリーン関数は、以下のようになる。
【数26】
ここで、γとΔt依存性を明示した。
【0067】
これを逆ラプラス変換することにより、G(t)が得られる。このようにして得られたG(t)を用いれば、過去の発生密度ρ(t=0)を(8)式に代入して、時刻tの発生密度ρ(t)が得られる。
【0068】
図6は、本実施の形態による為替レートの予測の正答率を他の予測手法と比較したグラフである。
【0069】
ddgfは、本実施の形態を用いた結果である。varは、他の予測手法であるVector autoregression(ベクトル自己回帰モデル)による結果を示す。rnnは、RNN(Recurrent Neural Network)の拡張であるLSTM Multimodal Long Short‐Term Memoryによる結果を示す。ここで、正答率とは、高値+安値+終値の平均値であるpivot point rate (PP rate)の前日比の正負に関して予測し、正答した割合である。
【0070】
図6から、本実施の形態は、VARおよびLSTMと同等以上の精度を示している。
【0071】
図7は、本実施の形態による為替レートの正答率の年次変化を示すグラフである。
【0072】
ここで、指標1は日本円の対米ドルレート、指標3はオーストラリアドルの対米ドルレートについての、終値/始値の前日比をそれぞれ示す。指標1および指標3ともに、いずれの年でも正答率は50%を上回っている。さらに、過去の履歴データが増加していくにつれ、すなわち、年が進むにつれて、正答率が向上していることがわかる。
【0073】
図8は、本実施の形態によるアメリカでのテロ発生の予測精度を他の予測手法と比較したグラフである。
【0074】
DDGFは、本実施の形態を用いた結果である。VARは、他の予測手法であるVector autoregression(ベクトル自己回帰モデル)による結果を示す。ここで、予測精度とは、発生と予測した数を実際に発生した数で除した値である。
【0075】
図8は、たとえば、北米、イラク、アフガニスタンの3カ国で2001年から2015年までの間に毎日何件テロが発生したかの時系列データを選び、本実施の形態のDDGF法を用いてアメリカにおけるテロ発生の予測精度を測定した結果である。たとえば対象とする期間のデータのうち、前半の2/3をトレーニングデータ、後半の1/3をテストデータとして選択する。
【0076】
図8に示すように、本実施の形態によれば、既存の手法よりも高い予測精度が得られることがわかる。
【0077】
このように、本実施の形態では、複数の事象の過去の状態が影響しあうカスケード現象の予測にも用いることができる。
【0078】
図9は、本実施の形態における多変量DDGF法の概念を模式的に示す図である。
【0079】
さらに、多変量DDGF法において、G行列はそれぞれ異なる変数の間での影響の伝搬の仕方を解釈することができる。たとえば、変数が円、ドル、ユーロの3変数だったとき、
図9のようなG行列の構成が考えられる。1行1列目は過去の円から未来の円への影響の伝搬を、1行2列目は過去の円から未来のドルへの影響の伝搬を、記述する。つまり、G行列のそれぞれの要素を見ることで異なる変数間でどのような時間スケールで影響が伝搬していくかを見ることができる。
【0080】
図10は、本実施の形態による事象の分析結果を示すグラフ群である。
【0081】
データからG行列を決めることは、現象の分析のツールにもなる。その一例として、イラク、アメリカ、アフガニスタンの1日毎のテロ発生数のデータを9.11事件の前後に分割してG行列を計算する。9.11前後で特にアフガニスタンからイラク、アフガニスタンからアフガニスタンへの影響の伝搬が大きく変化したことがわかる。
【0082】
図11は、本実施の形態を用いてイラクの各州およびアメリカの全土におけるテロの発生事象を分析した結果を示す図である。
【0083】
変数をイラクの各州、アメリカ全土で選択すると、イラクのどの州の影響がUSAにもっとも大きく影響を与えるかを分析することもできる。
【符号の説明】
【0084】
10…予測式構築部、12…履歴データ群記憶部、14…カーネル関数構築部、16…カーネル関数記憶部、18…予測式構築部、20…予測式記憶部、22…履歴データ受信部、24…携帯端末、26…警察システム、30…予測部、40…表示部