(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-10-28
(45)【発行日】2024-11-06
(54)【発明の名称】確率算出装置、確率算出方法、及び確率算出プログラム
(51)【国際特許分類】
G06Q 10/04 20230101AFI20241029BHJP
【FI】
G06Q10/04
(21)【出願番号】P 2023529331
(86)(22)【出願日】2021-06-23
(86)【国際出願番号】 JP2021023834
(87)【国際公開番号】W WO2022269818
(87)【国際公開日】2022-12-29
【審査請求日】2023-10-16
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】前田 篤彦
(72)【発明者】
【氏名】尾花 和昭
(72)【発明者】
【氏名】菊谷 幸雄
(72)【発明者】
【氏名】福田 健一
【審査官】加内 慎也
(56)【参考文献】
【文献】特開2016-042369(JP,A)
【文献】特開2019-108798(JP,A)
【文献】特開2005-284991(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
複数の対象の各々における過去の事象発生データから求められた発生確率である基本発生確率と、前記事象発生データの特定の説明変数を条件とした発生確率である条件付き発生確率とに基づいて、前記対象毎に、前記特定の説明変数に応じた変動を表すベクトルとして第1変動ベクトルを算出する第1変動算出部と、
前記対象の各々の
前記第1変動ベクトルをクラスタリングすることにより、前記対象をクラスタに分類するクラスタリング部と、
前記クラスタ毎に、当該クラスタに属する前記対象に対応付けられた前記事象発生データを集約し、当該クラスタの前記特定の説明変数に応じた変動を表すベクトルとして第2変動ベクトルを算出する第2変動算出部と、
前記対象毎に、当該対象が属する前記クラスタの前記第2変動ベクトルを用いて、前記特定の説明変数を条件とした場合における当該対象の事象発生確率を算出する統合算出部と、
を含む確率算出装置。
【請求項2】
前記統合算出部は、前記対象毎に、当該対象の前記基本発生確率と、当該対象が属する前記クラスタの前記第2変動ベクトルにおける変動値とに基づいて、前記事象発生確率を算出する請求項1に記載の確率算出装置。
【請求項3】
前記第2変動算出部は、前記クラスタ毎に、当該クラスタについて集約した前記事象発生データを用いて、当該クラスタの前記基本発生確率を求め、かつ、前記特定の説明変数を条件とした当該クラスタの前記条件付き発生確率を求めて、当該クラスタの前記基本発生確率と、当該クラスタの前記条件付き発生確率とに基づいて、前記第2変動ベクトルを算出する請求項1又は請求項2に記載の確率算出装置。
【請求項4】
複数の対象の各々における過去の事象発生データから求められた発生確率である基本発生確率と、前記事象発生データの特定の説明変数を条件とした発生確率である条件付き発生確率とに基づいて、前記対象毎に、前記特定の説明変数に応じた変動を表すベクトルとして第1変動ベクトルを算出し、
前記対象の各々の
前記第1変動ベクトルをクラスタリングすることにより、前記対象をクラスタに分類し、
前記クラスタ毎に、当該クラスタに属する前記対象に対応付けられた前記事象発生データを集約し、当該クラスタの前記特定の説明変数に応じた変動を表すベクトルとして第2変動ベクトルを算出し、
前記対象毎に、当該対象が属する前記クラスタの前記第2変動ベクトルを用いて、前記特定の説明変数を条件とした場合における当該対象の事象発生確率を算出する、
処理をコンピュータに実行させる確率算出方法。
【請求項5】
複数の対象の各々における過去の事象発生データから求められた発生確率である基本発生確率と、前記事象発生データの特定の説明変数を条件とした発生確率である条件付き発生確率とに基づいて、前記対象毎に、前記特定の説明変数に応じた変動を表すベクトルとして第1変動ベクトルを算出し、
前記対象の各々の
前記第1変動ベクトルをクラスタリングすることにより、前記対象をクラスタに分類し、
前記クラスタ毎に、当該クラスタに属する前記対象に対応付けられた前記事象発生データを集約し、当該クラスタの前記特定の説明変数に応じた変動を表すベクトルとして第2変動ベクトルを算出し、
前記対象毎に、当該対象が属する前記クラスタの前記第2変動ベクトルを用いて、前記特定の説明変数を条件とした場合における当該対象の事象発生確率を算出する、
処理をコンピュータに実行させる確率算出プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
開示の技術は、確率算出装置、確率算出方法、及び確率算出プログラムに関する。
【背景技術】
【0002】
事故の発生又は傷病者の発生などの何らかの事象発生確率を、過去の事象発生データに基づき、細分化された地域毎に、曜日又は時間帯などいくつかの条件により変動することも踏まえて予測したい場合がある。すなわち条件付きの事象発生確率を求めたい場合がある。例えば、求めた事象発生確率をもとに、パトカー又は救急車などの緊急車両を適切な場所に予め配備したい場合などである。非特許文献1には、リアルタイムな救急需要予測を行い、救急車の配備を最適化することが記載されている。
【先行技術文献】
【非特許文献】
【0003】
【文献】"救急ビッグデータを用いた救急自動車最適運用システムの有効性を確認"URL:https://www.ntt.co.jp/news2018/1811/181126a.html
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記のような用途では、地域全体の事象発生確率を求めるのではなく、地域全体の中から対象となる地域をある程度の小地域に細分化し、小地域毎の事象発生確率を求めることが必要となる。しかし、地域全体を細分化すると、個々の小地域における事象発生確率は小さくなってしまう。
【0005】
開示の技術は、上記の点に鑑みてなされたものであり、対象について観測されたデータが少ない場合でも、誤差を抑えて適切に対象の事象発生確率を算出できる確率算出装置、確率算出方法、及び確率算出プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本開示の第1態様は、確率算出装置であって、複数の対象の各々における過去の事象発生データから求められた発生確率である基本発生確率と、前記事象発生データの特定の説明変数を条件とした発生確率である条件付き発生確率とに基づいて、前記対象毎に、前記特定の説明変数に応じた変動を表すベクトルとして第1変動ベクトルを算出する第1変動算出部と、前記対象の各々の変動ベクトルをクラスタリングすることにより、前記対象をクラスタに分類するクラスタリング部と、前記クラスタ毎に、当該クラスタに属する前記対象に対応付けられた前記事象発生データを集約し、当該クラスタの前記特定の説明変数に応じた変動を表すベクトルとして第2変動ベクトルを算出する第2変動算出部と、前記対象毎に、当該対象が属する前記クラスタの前記第2変動ベクトルを用いて、前記特定の説明変数を条件とした場合における当該対象の事象発生確率を算出する統合算出部と、を含む。
【0007】
本開示の第2態様は、確率算出方法であって、複数の対象の各々における過去の事象発生データから求められた発生確率である基本発生確率と、前記事象発生データの特定の説明変数を条件とした発生確率である条件付き発生確率とに基づいて、前記対象毎に、前記特定の説明変数に応じた変動を表すベクトルとして第1変動ベクトルを算出し、前記対象の各々の変動ベクトルをクラスタリングすることにより、前記対象をクラスタに分類し、前記クラスタ毎に、当該クラスタに属する前記対象に対応付けられた前記事象発生データを集約し、当該クラスタの前記特定の説明変数に応じた変動を表すベクトルとして第2変動ベクトルを算出し、前記対象毎に、当該対象が属する前記クラスタの前記第2変動ベクトルを用いて、前記特定の説明変数を条件とした場合における当該対象の事象発生確率を算出する、処理をコンピュータに実行させる。
【0008】
本開示の第3態様は、確率算出プログラムであって、複数の対象の各々における過去の事象発生データから求められた発生確率である基本発生確率と、前記事象発生データの特定の説明変数を条件とした発生確率である条件付き発生確率とに基づいて、前記対象毎に、前記特定の説明変数に応じた変動を表すベクトルとして第1変動ベクトルを算出し、前記対象の各々の変動ベクトルをクラスタリングすることにより、前記対象をクラスタに分類し、前記クラスタ毎に、当該クラスタに属する前記対象に対応付けられた前記事象発生データを集約し、当該クラスタの前記特定の説明変数に応じた変動を表すベクトルとして第2変動ベクトルを算出し、前記対象毎に、当該対象が属する前記クラスタの前記第2変動ベクトルを用いて、前記特定の説明変数を条件とした場合における当該対象の事象発生確率を算出する、処理をコンピュータに実行させる。
【発明の効果】
【0009】
開示の技術によれば、対象について観測されたデータが少ない場合でも、誤差を抑えて適切に対象の事象発生確率を算出できる。
【図面の簡単な説明】
【0010】
【
図1】小地域に細分化した想定で生成したデータ列の一例を示す図である。
【
図2】本開示の実施形態の確率算出装置のハードウェア構成を示すブロック図である。
【
図3】本開示の実施形態の確率算出装置の機能的な構成を示すブロック図である。
【
図4】複数の小地域の第1変動ベクトルを求めた結果のグラフの一例を示す図である。
【
図5】小地域毎の第1変動ベクトルをk-meansで2つにクラスタリングし、クラスタ毎の第2変動ベクトルを求めた結果を示す図である。
【
図6】本開示の実施形態の確率算出装置による確率算出処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0011】
以下、開示の技術の実施形態の一例を、図面を参照しつつ説明する。なお、各図面において同一又は等価な構成要素及び部分には同一の参照符号を付与している。また、図面の寸法比率は、説明の都合上誇張されており、実際の比率とは異なる場合がある。
【0012】
まず、本開示の概要について説明する。上記課題において述べたように、地域全体を細分化すると個々の小地域における事象発生確率は小さくなってしまう。なお、以下では説明の便宜のため、本実施形態で最終的に求めたい事象の発生確率を事象発生確率と表記し、そのほかの事象の発生確率は単に発生確率と表記する。
【0013】
発生確率が小さい場合はより多くの事象発生データ(観測データ)が必要である一方で、データ数が不足に陥るケースが想定される。例えば、地域全体での傷病者発生に関する真の発生確率が0.1である場合に、この発生確率に従ってコンピュータで毎回2値の乱数を生成し、0であれば発生せず、1であれば発生したことにする、という計算を繰り返す観測を行ったとする。その観測結果(0と1からなるデータ列)から元の発生確率を安定的に求めようとすると、乱数生成のアルゴリズムでは通常はおおよそ100回ほどの観測が必要となる。ここで、地域全体を細分化して小地域に分けた結果、ある小地域における真の発生確率が0.01となる場合が想定される。その場合、1000回ほどの事象発生データが必要となる。
図1は、小地域に細分化した想定で生成したデータ列の一例を示す図である。観測を1000回行ったとして、データ列のA1だけ観測すると発生確率は0/10=0、A2だけ観測すると発生確率は1/10=0.1となり、データ列1000個の中に1が10回ほど出現することになる。実際の観測においては、そこまで多くの事象発生データが手に入らないことが想定されるため、少ない観測回数の事象発生データから小地域の発生確率を求める必要が生じる。しかし、少ない観測回数の事象発生データから小地域の発生確率を求めてしまうと、多くの場合、発生確率が0となるか、又は真の発生確率よりも大きな確率を誤って算出してしまう可能性がある。
【0014】
更に条件付きの事象発生確率を求めようとすると、ますます事象発生データが不足することが想定される。例えば、曜日による傷病者の発生確率の変動を求めたいとすると、事象発生データのデータ列を7分割しなければならなくなる。特に、曜日などの条件による影響が、ベースとなる発生確率を仮に20~30%程度変動させるだけであったと仮定すると、発生確率0.01が0.012又は0.013などに変動するということであるから、データ不足はより顕著になる。
【0015】
上記の事例であれば、細分化された小地域の中には、いわゆる住宅街又は歓楽街と呼ばれる小地域など、小地域同士で類似した都市機能を有している可能性がある。例えば、歓楽街であれば、どの歓楽街でも同じように特定の曜日及び時間帯に急性アルコール中毒者が増加し、傷病者の発生確率が上昇する可能性がある。また、住宅街では多くの人々が自宅で過ごしている日時などで傷病者の発生確率が上昇する可能性がある。
【0016】
このように類似した都市機能をもつ小地域では、たとえ隣接していなかったとしても、特定の説明変数の条件から同じように影響を受けて発生確率が変動していると仮定できる。よって、小地域の過去の事象発生データをまとめて集計することにより、一旦、発生確率の規模を大きくしてから特定の説明変数による変動を算出し、そのあと個々の小地域の変動を求める際に利用することが考えられる。これにより、比較的少ない事象発生データからでも、複数の小地域の各々に対する真の発生確率に近い確率が求まりやすくなるはずである。
【0017】
類似した都市機能を持つ小地域同士を集約する方法については、個々の小地域で、特定の説明変数を条件とした条件付き発生確率から複数の地域の変動を表すベクトル(第1変動ベクトル)として算出し、クラスタリングする。小地域毎の変動を表すベクトルをもとに地域同士をクラスタリングすることにより、細分化された小地域における個々の変動に関しては観測データ数が少ないため正確には算出できなかったとしても、多少の観測誤差を打ち消すことができる。
【0018】
変動を表すベクトルを用いてクラスタリングする理由は、小地域毎の絶対的な発生量(確率)が異なるためである。上記の方法によってクラスタリングを行えば、例えば、人口密度が特に多い都心部の歓楽街と、都心部に隣接した小地域の歓楽街を同じクラスタに分類できる。
【0019】
なお、上記の説明は、想定される小地域の当てはめを簡単に説明するため、歓楽街又は住宅街という典型的な街のイメージを小地域に当てはめて説明したが、実際には多くの小地域では住居及び飲食店が分散して存在しており、複雑な属性を持っているはずである。よって、ある小地域とある小地域が同じ変動を示すとは容易には判別できないため、小地域毎の変動を表すベクトルを算出した上でクラスタリングすることが重要となる。
【0020】
また、上記以外にも、海抜高低差がある複数の小地域の各々を対象として、気温を特定の説明変数にする場合が想定される。この場合、近い海抜の小地域同士をクラスタリングできれば、熱中症等の発生数の変動を、限られた事象発生データから予測しやすくする。以上のような複数の小地域の各々が、本開示の技術の複数の対象の各々の一例である。
【0021】
なお、本実施形態では、事象発生確率を求める対象を小地域とする場合を例に説明するが、本実施形態の適用範囲は、現実空間で事象発生データが集計可能な小地域に限られない。事象発生データを集計できれば、例えば、インターネット空間、ネットワーク環境などの対象を問わず本実施形態の手法を適用可能である。
【0022】
以上を踏まえて、本開示の実施形態に係る確率算出装置として以下のように構成することにより、上記の考え方を実現する。
【0023】
以下、本実施形態の構成について説明する。
【0024】
図2は、本開示の実施形態の確率算出装置100のハードウェア構成を示すブロック図である。
【0025】
図2に示すように、確率算出装置100は、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、ストレージ14、入力部15、表示部16及び通信インタフェース(I/F)17を有する。各構成は、バス19を介して相互に通信可能に接続されている。
【0026】
CPU11は、中央演算処理ユニットであり、各種プログラムを実行したり、各部を制御したりする。すなわち、CPU11は、ROM12又はストレージ14からプログラムを読み出し、RAM13を作業領域としてプログラムを実行する。CPU11は、ROM12又はストレージ14に記憶されているプログラムに従って、上記各構成の制御及び各種の演算処理を行う。本実施形態では、ROM12又はストレージ14には、発生確率算出プログラムが格納されている。
【0027】
ROM12は、各種プログラム及び各種データを格納する。RAM13は、作業領域として一時的にプログラム又はデータを記憶する。ストレージ14は、HDD(Hard Disk Drive)又はSSD(Solid State Drive)等の記憶装置により構成され、オペレーティングシステムを含む各種プログラム、及び各種データを格納する。
【0028】
入力部15は、マウス等のポインティングデバイス、及びキーボードを含み、各種の入力を行うために使用される。
【0029】
表示部16は、例えば、液晶ディスプレイであり、各種の情報を表示する。表示部16は、タッチパネル方式を採用して、入力部15として機能してもよい。
【0030】
通信インタフェース17は、端末等の他の機器と通信するためのインタフェースである。当該通信には、例えば、イーサネット(登録商標)若しくはFDDI等の有線通信の規格、又は、4G、5G、若しくはWi-Fi(登録商標)等の無線通信の規格が用いられる。
【0031】
次に、確率算出装置100の各機能構成について説明する。
図3は、本開示の実施形態の確率算出装置100の機能的な構成を示すブロック図である。各機能構成は、CPU11がROM12又はストレージ14に記憶された発生確率算出プログラムを読み出し、RAM13に展開して実行することにより実現される。
【0032】
図3に示すように、確率算出装置100は、事象記憶部102と、基本確率算出部110と、条件確率算出部112と、第1変動算出部114と、クラスタリング部116と、第2変動算出部118と、統合算出部120とを含んで構成されている。
【0033】
確率算出装置100は、入力として、事象発生データを受け付け、事象記憶部102に格納する。事象発生データには、複数の対象の各々における過去の一定期間における事象の発生日時、曜日、事象が発生した小地域、などが記録されている。
【0034】
説明を簡単にするため、以下の説明では、発生時間帯、曜日、小地域が同一条件の場合には過去から将来にわたって事象発生確率は一定であるとする。すなわち、同一条件の事象発生データを十分蓄積さえすれば、未来の同一条件の事象発生確率も算出できることとする。ただし、求めたい事象発生確率の規模に対して十分な事象発生データが蓄積されていない想定とする。
【0035】
基本確率算出部110は、事象記憶部102に格納されている事象発生データに基づいて、小地域毎に、時間帯別の発生確率(基本発生確率)を算出する。基本発生確率は、事象発生データの過去の一定期間における特定の小地域、及び特定の時間帯の事象をカウントし、その一定期間の日数で割れば算出できる。例えば、期間が350日で、その中である小地域の10時台の事象が合計35件発生していたとすれば、35/350で基本発生確率は0.1となる。
【0036】
条件確率算出部112は、事象記憶部102に格納されている事象発生データに基づいて、小地域毎に、曜日別かつ時間帯別の発生確率(条件付き発生確率)を算出する。条件付き発生確率は、事象発生データの過去の一定期間における特定の小地域、及び特定の時間帯の事象をカウントし、その一定期間の日数で割れば算出できる。例えば、期間が350日で、その中である小地域の10時台の事象が合計35件発生していたとすれば、35/350で条件付き発生確率は0.1となる。曜日を条件とすることが、本開示の技術の特定の説明変数を条件とすることの一例である。なお、予め別装置等で算出しておいた基本発生確率と、条件付き発生確率とを確率算出装置100で受け付けるようにしてもよく、その場合には、基本確率算出部110及び条件確率算出部112は構成上なくてもよい。
【0037】
第1変動算出部114は、基本確率算出部110から基本発生確率、条件確率算出部112から条件付き発生確率の入力を受け付ける。第1変動算出部114は、基本発生確率と、条件付き発生確率とに基づいて、小地域毎に、第1変動ベクトルを算出する。第1変動ベクトルは、特定の説明変数、ここでは曜日に応じた変動を表すベクトルである。ここでの第1変動ベクトルは、小地域毎に、曜日毎の条件付き発生確率が、曜日を無視した基本発生確率の何倍になっているかを計算することで求める。上記の例では、10時台の日曜日の変動は0.06/0.1=0.6倍となり、全時間帯と全曜日の組み合わせ分求めて、これを第1変動ベクトルとする。
図4は、複数の小地域の第1変動ベクトルを求めた結果のグラフの一例を示す図である。
図4の例では、第1変動ベクトルとして、小地域A、小地域B、小地域C、及び小地域Dのそれぞれ曜日別かつ時間帯別の変動量が求められている。
【0038】
クラスタリング部116は、第1変動算出部114から小地域の各々の変動ベクトルの入力を受け付ける。クラスタリング部116は、小地域の各々の第1変動ベクトルをクラスタリングすることにより、小地域をクラスタに分類する。クラスタリングの手法はk-meansなどの代表的な手法を用いればよい。例えば、クラスタ数は手動で調整するパラメータとし、いくつかのクラスタ数を試して、最終的に未来の予測結果が最も適合するように調整すればよい。
【0039】
第2変動算出部118は、クラスタリング部116からクラスタリング結果として各クラスタに小地域の各々が分類された結果を受け付ける。第2変動算出部118は、クラスタ毎に、当該クラスタに属する小地域に対応付けられた事象発生データを集約し、第2変動ベクトルを算出する。具体的には、第2変動算出部118は、第2変動ベクトルの算出にあたって、クラスタ毎に、事象記憶部102から当該クラスタに含まれる小地域の事象発生データを取得して集約する。第2変動算出部118は、当該クラスタについて集約した事象発生データを用いて、時間帯の当該クラスタの基本発生確率を求め、かつ、曜日別かつ時間帯別の発生確率を条件とした当該クラスタの条件付き発生確率を求める。そして、当該クラスタの基本発生確率と、当該クラスタの条件付き発生確率とに基づいて、第2変動ベクトルを算出する。これにより、クラスタの特定の説明変数に応じた変動を表すベクトルとして第2変動ベクトルを算出できる。
【0040】
図5は、小地域毎の第1変動ベクトルをk-meansで2つにクラスタリングし、クラスタ毎の第2変動ベクトルを求めた結果を示す図である。グラフ化した場合、基本的には、元となっている小地域毎の第1変動ベクトルよりも滑らかなグラフとなる。また、小地域毎の変動ベクトルから直接平均ベクトルを求めるのではなく、クラスタリングされた小地域の事象発生データを集約してから第2変動ベクトルを再計算しているため、基本発生確率が大きい元の小地域の影響をより強く受ける。これは実質、観測誤差が大きい小地域の影響を弱めていることになる。元の小地域で時間帯幅を広くとると近い結果となる場合もあるが、真の発生確率の変動が1時間毎に増減している箇所がある場合には、本開示の手法が適切である。
【0041】
統合算出部120は、第2変動算出部118からクラスタ毎の第2変動ベクトルの入力を受け付ける。統合算出部120は、小地域毎に、当該小地域の時間帯別の基本発生確率と、当該小地域が属するクラスタの第2変動ベクトルにおける変動値とに基づいて、事象発生確率を算出する。事象発生確率は、小地域毎に条件付き発生確率として求められる。例えば、日曜日かつ10時台における小地域毎の事象発生確率を求めるのであれば、小地域毎に曜日によらない10時台の基本発生確率を求める。その後、小地域が該当するクラスタの第2変動ベクトルから日曜日かつ10時台の変動値を取り出し、掛け合わせて、小地域毎の日曜日かつ10時台の条件付き発生確率を事象発生確率として算出する。
【0042】
次に、確率算出装置100の作用について説明する。
【0043】
図6は、本開示の実施形態の確率算出装置100による確率算出処理の流れを示すフローチャートである。CPU11がROM12又はストレージ14から確率算出プログラムを読み出して、RAM13に展開して実行することにより、確率算出処理が行なわれる。CPU11が確率算出装置100の各部として以下の処理を実行する。
【0044】
ステップS100において、CPU11は、基本確率算出部110として、事象記憶部102に格納されている事象発生データに基づいて、小地域毎に、時間帯別の発生確率(基本発生確率)を算出する。
【0045】
ステップS102において、CPU11は、条件確率算出部112として、事象記憶部102に格納されている事象発生データに基づいて、小地域毎に、曜日別かつ時間帯別の発生確率(条件付き発生確率)を算出する。
【0046】
ステップS104において、CPU11は、第1変動算出部114として、基本発生確率と、条件付き発生確率とに基づいて、小地域毎に、第1変動ベクトルを算出する。第1変動ベクトルは、特定の説明変数、ここでは曜日に応じた変動を表すベクトルである。
【0047】
ステップS106において、CPU11は、クラスタリング部116として、小地域の各々の第1変動ベクトルをクラスタリングすることにより、小地域をクラスタに分類する。
【0048】
ステップS108において、CPU11は、第2変動算出部118として、クラスタ毎に、当該クラスタに属する小地域に対応付けられた事象発生データを集約し、第2変動ベクトルを算出する。
【0049】
ステップS110において、CPU11は、統合算出部120として、小地域毎に、当該小地域の時間帯別の基本発生確率と、当該小地域が属するクラスタの第2変動ベクトルにおける変動値とに基づいて、事象発生確率を算出する。
【0050】
以上説明したように本実施形態の確率算出装置100によれば、細分化された小地域について観測されたデータが少ない場合でも、誤差を抑えて適切に小地域の事象発生確率を算出できる。
【0051】
なお、上記実施形態でCPUがソフトウェア(プログラム)を読み込んで実行した確率算出処理を、CPU以外の各種のプロセッサが実行してもよい。この場合のプロセッサとしては、FPGA(Field-Programmable Gate Array)等の製造後に回路構成を変更可能なPLD(Programmable Logic Device)、及びASIC(Application Specific Integrated Circuit)等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が例示される。また、確率算出処理を、これらの各種のプロセッサのうちの1つで実行してもよいし、同種又は異種の2つ以上のプロセッサの組み合わせ(例えば、複数のFPGA、及びCPUとFPGAとの組み合わせ等)で実行してもよい。また、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子等の回路素子を組み合わせた電気回路である。
【0052】
また、上記実施形態では、確率算出プログラムがストレージ14に予め記憶(インストール)されている態様を説明したが、これに限定されない。プログラムは、CD-ROM(Compact Disk Read Only Memory)、DVD-ROM(Digital Versatile Disk Read Only Memory)、及びUSB(Universal Serial Bus)メモリ等の非一時的(non-transitory)記憶媒体に記憶された形態で提供されてもよい。また、プログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
【0053】
以上の実施形態に関し、更に以下の付記を開示する。
【0054】
(付記項1)
メモリと、
前記メモリに接続された少なくとも1つのプロセッサと、
を含み、
前記プロセッサは、
複数の対象の各々における過去の事象発生データから求められた発生確率である基本発生確率と、前記事象発生データの特定の説明変数を条件とした発生確率である条件付き発生確率とに基づいて、前記対象毎に、前記特定の説明変数に応じた変動を表すベクトルとして第1変動ベクトルを算出し、
前記対象の各々の変動ベクトルをクラスタリングすることにより、前記対象をクラスタに分類し、
前記クラスタ毎に、当該クラスタに属する前記対象に対応付けられた前記事象発生データを集約し、当該クラスタの前記特定の説明変数に応じた変動を表すベクトルとして第2変動ベクトルを算出し、
前記対象毎に、当該対象が属する前記クラスタの前記第2変動ベクトルを用いて、前記特定の説明変数を条件とした場合における当該対象の事象発生確率を算出する、
ように構成されている確率算出装置。
【0055】
(付記項2)
確率算出処理を実行するようにコンピュータによって実行可能なプログラムを記憶した非一時的記憶媒体であって、
複数の対象の各々における過去の事象発生データから求められた発生確率である基本発生確率と、前記事象発生データの特定の説明変数を条件とした発生確率である条件付き発生確率とに基づいて、前記対象毎に、前記特定の説明変数に応じた変動を表すベクトルとして第1変動ベクトルを算出し、
前記対象の各々の変動ベクトルをクラスタリングすることにより、前記対象をクラスタに分類し、
前記クラスタ毎に、当該クラスタに属する前記対象に対応付けられた前記事象発生データを集約し、当該クラスタの前記特定の説明変数に応じた変動を表すベクトルとして第2変動ベクトルを算出し、
前記対象毎に、当該対象が属する前記クラスタの前記第2変動ベクトルを用いて、前記特定の説明変数を条件とした場合における当該対象の事象発生確率を算出する、
非一時的記憶媒体。
【符号の説明】
【0056】
100 確率算出装置
102 事象記憶部
110 基本確率算出部
112 条件確率算出部
114 第1変動算出部
116 クラスタリング部
118 第2変動算出部
120 統合算出部