(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024060235
(43)【公開日】2024-05-02
(54)【発明の名称】特徴量間の交互作用を考慮した対象数推定プログラム、装置、システム及び方法
(51)【国際特許分類】
G06Q 50/10 20120101AFI20240424BHJP
G06N 3/02 20060101ALI20240424BHJP
G01S 5/02 20100101ALI20240424BHJP
H04W 4/029 20180101ALI20240424BHJP
【FI】
G06Q50/10
G06N3/02
G01S5/02 A
G01S5/02 Z
H04W4/029
【審査請求】未請求
【請求項の数】16
【出願形態】OL
(21)【出願番号】P 2022167481
(22)【出願日】2022-10-19
(71)【出願人】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100135068
【弁理士】
【氏名又は名称】早原 茂樹
(74)【代理人】
【識別番号】100141313
【弁理士】
【氏名又は名称】辰巳 富彦
(72)【発明者】
【氏名】小林 亮博
(72)【発明者】
【氏名】山崎 悠大
(72)【発明者】
【氏名】上坂 大輔
【テーマコード(参考)】
5J062
5K067
5L049
【Fターム(参考)】
5J062AA09
5J062BB01
5J062BB05
5J062CC07
5J062CC11
5J062FF01
5J062HH00
5K067AA21
5K067DD19
5K067DD20
5K067EE02
5K067EE10
5K067EE16
5K067JJ53
5K067JJ57
5L049AA04
(57)【要約】
【課題】測位手段による観測に係る誤差の影響を抑制した対象数の推定を行う対象数推定プログラムを提供する。
【解決手段】第1測位手段の測位単位であるエリアに含まれる複数の区域における、区域内に位置する対象の数を推定する本プログラムは、区域における対象の滞在又は移動に関係する事象又は事物に係る特徴量である区域特徴量を、単位特徴量として含む偏在特徴量を生成する偏在特徴量生成手段と、この偏在特徴量から、学習済みのニューラルネットワークアルゴリズムを用いて単位特徴量間の関係性が反映された交互作用特徴量を生成し、この交互作用特徴量を用いて、単位特徴量の各々に係る事象の組合せが発現する頻度に係る頻度情報を生成する頻度情報生成手段と、この頻度情報から、対象が区域内に位置する確率を算出し、この確率と対象の数の観測値とから区域内に位置する対象の数に係る情報を決定する対象数決定手段としてコンピュータを機能させる。
【選択図】
図1
【特許請求の範囲】
【請求項1】
第1の測位手段によって特定される対象の位置の単位であるエリアに含まれる複数の区域における、当該区域内に位置する当該対象の数を推定する対象数推定プログラムであって、
当該区域における当該対象の滞在又は移動に関係する事象又は事物に係る特徴量である区域特徴量と、当該エリア若しくは第1の測位手段の識別子としての第1識別特徴量、及び/又は、当該区域の識別子としての第2識別特徴量とを、単位特徴量として含む偏在特徴量を生成する偏在特徴量生成手段と、
当該偏在特徴量から、当該単位特徴量間の交互作用を取り入れた学習済みのニューラルネットワーク(neural network)アルゴリズムを用いて、当該単位特徴量間の関係性が反映された交互作用特徴量を生成し、当該交互作用特徴量を用いて、当該単位特徴量の各々に係る事象の組合せが発現する頻度に係る頻度情報を生成する頻度情報生成手段と、
当該頻度情報から、当該対象が当該区域内に位置する確率を算出し、当該確率と当該対象の数の観測値とから、当該区域内に位置する当該対象の数に係る情報を決定する対象数決定手段と
してコンピュータを機能させることを特徴とする対象数推定プログラム。
【請求項2】
前記偏在特徴量生成手段は、当該対象の属性に係る特徴量である属性特徴量を、単位特徴量として更に含む当該偏在特徴量を生成し、
前記対象数決定手段は、当該頻度情報から、当該エリア内に位置していて当該属性を有する当該対象が、当該区域内に位置する確率である区域内存在確率を算出し、当該区域内存在確率と、当該エリア内に位置していて当該属性を有する当該対象の数の観測値とから、当該区域内に位置する当該対象の数に係る情報を決定する
ことを特徴とする請求項1に記載の対象数推定プログラム。
【請求項3】
前記偏在特徴量生成手段は、時間区間に係る特徴量である時間特徴量を、単位特徴量として更に含む当該偏在特徴量を生成し、
前記対象数決定手段は、当該頻度情報から、当該時間区間において当該エリア内に位置している当該対象が、当該区域内に位置する確率である区域内存在確率を算出し、当該区域内存在確率と、当該時間区間において当該エリア内に位置している当該対象の数の観測値とから、当該区域内に位置する当該対象の数に係る情報を決定する
ことを特徴とする請求項1に記載の対象数推定プログラム。
【請求項4】
前記偏在特徴量生成手段は、当該対象の属性に係る特徴量である属性特徴量と、時間区間に係る特徴量である時間特徴量とを、単位特徴量として更に含む当該偏在特徴量を生成し、
前記対象数決定手段は、当該頻度情報から、当該時間区間において当該エリア内に位置していて当該属性を有する当該対象が、当該区域内に位置する確率である区域内存在確率を算出し、当該区域内存在確率と、当該時間区間において当該エリア内に位置していて当該属性を有する当該対象の数の観測値とから、当該区域内に位置する当該対象の数に係る情報を決定する
ことを特徴とする請求項1に記載の対象数推定プログラム。
【請求項5】
前記偏在特徴量生成手段は、ある時間区間についての当該エリア若しくは第1の測位手段の識別子としての第1識別特徴量と、当該ある時間区間よりも前の時間区間についての当該エリア若しくは第1の測位手段の識別子としての以前第1識別特徴量、及び/又は、当該ある時間区間よりも後の時間区間についての当該エリア若しくは第1の測位手段の識別子としての以後第1識別特徴量とを、単位特徴量として更に含む当該偏在特徴量を生成することを特徴とする請求項1に記載の対象数推定プログラム。
【請求項6】
第1の測位手段によって特定される対象の位置の単位であるエリアに含まれる複数の区域における、当該区域内に位置する当該対象の数を推定する対象数推定プログラムであって、
当該区域における当該対象の滞在又は移動に関係する事象又は事物に係る特徴量である区域特徴量と、当該対象の属性に係る特徴量である属性特徴量を、単位特徴量として含む偏在特徴量を生成する偏在特徴量生成手段と、
当該偏在特徴量から、当該単位特徴量間の交互作用を取り入れた学習済みのニューラルネットワークアルゴリズムを用いて、当該単位特徴量間の関係性が反映された交互作用特徴量を生成し、当該交互作用特徴量を用いて、当該単位特徴量の各々に係る事象の組合せが発現する頻度に係る頻度情報を生成する頻度情報生成手段と、
当該頻度情報から、当該エリア内に位置していて当該属性を有する当該対象が、当該区域内に位置する確率である区域内存在確率を算出し、当該区域内存在確率と、当該エリア内に位置していて当該属性を有する当該対象の数の観測値とから、当該区域内に位置する当該対象の数に係る情報を決定する対象数決定手段と
してコンピュータを機能させることを特徴とする対象数推定プログラム。
【請求項7】
第1の測位手段によって特定される対象の位置の単位であるエリアに含まれる複数の区域における、当該区域内に位置する当該対象の数を推定する対象数推定プログラムであって、
当該区域における当該対象の滞在又は移動に関係する事象又は事物に係る特徴量である区域特徴量と、時間区間に係る特徴量である時間特徴量とを、単位特徴量として含む偏在特徴量を生成する偏在特徴量生成手段と、
当該偏在特徴量から、当該単位特徴量間の交互作用を取り入れた学習済みのニューラルネットワークアルゴリズムを用いて、当該単位特徴量間の関係性が反映された交互作用特徴量を生成し、当該交互作用特徴量を用いて、当該単位特徴量の各々に係る事象の組合せが発現する頻度に係る頻度情報を生成する頻度情報生成手段と、
当該頻度情報から、当該時間区間において当該エリア内に位置している当該対象が、当該区域内に位置する確率である区域内存在確率を算出し、当該区域内存在確率と、当該時間区間において当該エリア内に位置している当該対象の数の観測値とから、当該区域内に位置する当該対象の数に係る情報を決定する対象数決定手段と
してコンピュータを機能させることを特徴とする対象数推定プログラム。
【請求項8】
前記偏在特徴量生成手段は、第1の測位手段の設置環境、仕様又は性能に係る特徴量である第1測位特徴量を、単位特徴量として更に含む当該偏在特徴量を生成することを特徴とする請求項1から7のいずれか1項に記載の対象数推定プログラム。
【請求項9】
前記偏在特徴量生成手段は、当該区域と第1の測位手段に係る地点との位置関係に係る特徴量である位置関係特徴量を、単位特徴量として更に含む当該偏在特徴量を生成することを特徴とする請求項1から7のいずれか1項に記載の対象数推定プログラム。
【請求項10】
当該ニューラルネットワークアルゴリズムは、
埋め込み処理の施された当該偏在特徴量に含まれる複数の当該単位特徴量から第1の特徴行列を生成し、
第nの特徴行列と第1の特徴行列とから第nの特徴テンソルを生成して、第nの特徴テンソルに対し、フィルタ処理を、当該単位特徴量の次元に相当する次元軸に沿ってスライドさせながら施して、複数の特徴マップを生成し、当該複数の特徴マップから第(n+1)の特徴行列を生成する処理を、nの値が1から1ずつ増分して所定の整数値になるまで繰り返し、
各nの値において生成された当該複数の特徴マップの各々に対し、プーリング処理を施して当該交互作用特徴量を生成する
ようにコンピュータを機能させるCIN(Compressed Interaction Network)アルゴリズムであることを特徴とする請求項1から7のいずれか1項に記載の対象数推定プログラム。
【請求項11】
前記頻度情報生成手段は、埋め込み処理の施された当該偏在特徴量を入力とした全結合型ニューラルネットワークアルゴリズムからの出力、及び/又は、当該偏在特徴量に対し線形回帰分析処理を施した結果も用いて、当該頻度情報を生成することを特徴とする請求項10に記載の対象数推定プログラム。
【請求項12】
当該ニューラルネットワークアルゴリズムは、第2の測位手段によって特定された当該区域における当該区域特徴量を単位特徴量として含む当該偏在特徴量と、該偏在特徴量に含まれる単位特徴量の各々に係る事象の組合せが発現する頻度に係る正解データとしての当該頻度情報とを含む学習データによって、訓練されることを特徴とする請求項1から7のいずれか1項に記載の対象数推定プログラム。
【請求項13】
当該対象は人間であって、端末のユーザを含み、
第1の測位手段は基地局であって、当該対象の数の観測値は、当該基地局と通信接続された当該端末の数の観測値であり、
第2の測位手段は、当該端末に搭載されたGPS(Global Positioning System)測位手段である
ことを特徴とする請求項12に記載の対象数推定プログラム。
【請求項14】
第1の測位手段によって特定される対象の位置の単位であるエリアに含まれる複数の区域における、当該区域内に位置する当該対象の数を推定する対象数推定装置であって、
当該区域における当該対象の滞在又は移動に関係する事象又は事物に係る特徴量である区域特徴量と、当該エリア若しくは第1の測位手段の識別子としての第1識別特徴量、及び/又は、当該区域の識別子としての第2識別特徴量とを、単位特徴量として含む偏在特徴量を生成する偏在特徴量生成手段と、
当該偏在特徴量から、当該単位特徴量間の交互作用を取り入れた学習済みのニューラルネットワークアルゴリズムを用いて、当該単位特徴量間の関係性が反映された交互作用特徴量を生成し、当該交互作用特徴量を用いて、当該単位特徴量の各々に係る事象の組合せが発現する頻度に係る頻度情報を生成する頻度情報生成手段と、
当該頻度情報から、当該対象が当該区域内に位置する確率を算出し、当該確率と当該対象の数の観測値とから、当該区域内に位置する当該対象の数に係る情報を決定する対象数決定手段と
を有することを特徴とする対象数推定装置。
【請求項15】
第1の測位手段によって特定される対象の位置の単位であるエリアに含まれる複数の区域における、当該区域内に位置する当該対象の数を推定する対象数推定システムであって、
当該区域における当該対象の滞在又は移動に関係する事象又は事物に係る特徴量である区域特徴量と、当該エリア若しくは第1の測位手段の識別子としての第1識別特徴量、及び/又は、当該区域の識別子としての第2識別特徴量とを、単位特徴量として含む偏在特徴量を生成する偏在特徴量生成手段と、
当該偏在特徴量から、当該単位特徴量間の交互作用を取り入れた学習済みのニューラルネットワークアルゴリズムを用いて、当該単位特徴量間の関係性が反映された交互作用特徴量を生成し、当該交互作用特徴量を用いて、当該単位特徴量の各々に係る事象の組合せが発現する頻度に係る頻度情報を生成する頻度情報生成手段と、
当該頻度情報から、当該対象が当該区域内に位置する確率を算出し、当該確率と当該対象の数の観測値とから、当該区域内に位置する当該対象の数に係る情報を決定する対象数決定手段と
を有することを特徴とする対象数推定システム。
【請求項16】
第1の測位手段によって特定される対象の位置の単位であるエリアに含まれる複数の区域における、当該区域内に位置する当該対象の数を推定する対象数推定方法であって、
当該区域における当該対象の滞在又は移動に関係する事象又は事物に係る特徴量である区域特徴量と、当該エリア若しくは第1の測位手段の識別子としての第1識別特徴量、及び/又は、当該区域の識別子としての第2識別特徴量とを、単位特徴量として含む偏在特徴量を生成するステップと、
当該偏在特徴量から、当該単位特徴量間の交互作用を取り入れた学習済みのニューラルネットワーク(neural network)アルゴリズムを用いて、当該単位特徴量間の関係性が反映された交互作用特徴量を生成し、当該交互作用特徴量を用いて、当該単位特徴量の各々に係る事象の組合せが発現する頻度に係る頻度情報を生成するステップと、
当該頻度情報から、当該対象が当該区域内に位置する確率を算出し、当該確率と当該対象の数の観測値とから、当該区域内に位置する当該対象の数に係る情報を決定するステップと
を有することを特徴とする、コンピュータによって実施される対象数推定方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、所定の地域における対象の分布、例えば人口分布を推定する技術に関する。
【背景技術】
【0002】
所定の地域における人口分布、又は時間変化する分布を含む意味での人流、を把握することは、マーケティング、交通網の効率的運用(渋滞回避等)や、公共施設等の整備を含む都市計画、さらには感染症対策等にとって非常に重要となる。
【0003】
従来、人流データ提供サービスでは、基地局のカバーするエリアを構成する各区域(以下、メッシュとも称する)において、GPS(Global Positioning System)により観測された端末数(ユーザ数)を用いて人流を推定している。実際には、このエリア内の全ての人間が端末を所有しているわけではなく、またGPS測位情報を基地局に提供するユーザも限定されるので、各区域で観測された端末数(ユーザ数)に対し拡大推計を行って、各区域に何人存在するかを推定するのである。
【0004】
一方、基地局が端末との通信接続結果として記録する位置登録情報(接続セクタ情報)、すなわちカバーするエリア内に存在する端末(ユーザ)についての情報も当然、このエリア内に存在する端末数(ユーザ数)の情報を含む。ここで、この位置登録情報を用いた端末(ユーザ)の観測は一般にその規模が大きく、その点で人流推定に向いている。しかしながら、基地局の間隔は例えば数km(キロメートル)に及ぶ場合もあり、一般に、基地局による観測結果の位置解像度は低くなってしまう。
【0005】
このような位置登録情報の問題に対処すべく、例えば特許文献1に開示されたユーザ数推定処理では、取得されたGPSログと位置登録情報とをユーザ識別子(ID)で紐づけたデータを用いてユーザ数を推定している。具体的にはこのようなデータを用いて、基地局Bにおいて観測された(基地局Bに登録された)ユーザがメッシュM内に存在する確率からなる確率マップP(M|B)を訓練により構築し、この確率マップP(M|B)を用いて各メッシュのユーザ数を推定するのである。
【0006】
例えば、基地局B1を100回観測した際にユーザがメッシュM1に30回観測された場合、確率P(M1|B1)は0.3(=30/100)と設定される。ここで、ある時刻に基地局B1でユーザを500人観測したならば、そのうち150(=500×0.3)人はメッシュM1内に存在したと推定することが可能となる。
【先行技術文献】
【特許文献】
【0007】
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら上述した特許文献1に開示された技術を含め、従来技術では依然として、GPSによる観測の誤差が大きな問題となっていた。
【0009】
実際、GPSでは位置解像度の高い観測結果が得られるが、観測可能な端末(ユーザ)の規模は通常、相当に小さい。したがって、各区域で端末が1台観測されたり、又は全く観測されなかったりすることも少なくない。この場合、端末が偶然観測されるかされないかによって、拡大推計後の人数が大きく変動してしまう。このようにGPSによる観測は、サンプリング数の小さいことによる誤差(以下、サンプリング誤差とも称する)が大きいものとなっている。
【0010】
例えば、特許文献1のユーザ数推定処理では、確率マップP(M|B)の訓練にあたり、基地局毎の観測数やメッシュ毎の観測数が、訓練用のデータとして使用される。その結果、確率マップP(M|B)は、基地局とメッシュとの組毎に独立して構築されることになる。さらに、時間帯に応じた人口の偏り・変動を把握することも考えると、確率マップP(M|B)は、時間帯毎にも独立して構築せざるを得ない。
【0011】
この点、GPS測位情報を基地局に提供するユーザがある程度確保される都市部では、相当の頻度で各時間帯における基地局とメッシュとの組に係る観測データを得ることができる。しかしながら、ユーザ規模が小さい地方では、メッシュに係る観測データにサンプリング誤差が乗りやすく、その結果、構築される確率マップP(M|B)の確率値に大きな誤差が生じてしまう。すなわち推定対象の人口規模が小さくなるほど、ユーザ数の推定値における誤差が大きくなってしまうのである。
【0012】
そこで、本発明は、測位手段による観測に係る誤差の影響を抑制した対象数の推定を行うことができる対象数推定プログラム、装置、システム及び方法を提供することを目的とする。
【課題を解決するための手段】
【0013】
本発明によれば、第1の測位手段によって特定される対象の位置の単位であるエリアに含まれる複数の区域における、当該区域内に位置する当該対象の数を推定する対象数推定プログラムであって、
当該区域における当該対象の滞在又は移動に関係する事象又は事物に係る特徴量である区域特徴量と、当該エリア若しくは第1の測位手段の識別子としての第1識別特徴量、及び/又は、当該区域の識別子としての第2識別特徴量とを、単位特徴量として含む偏在特徴量を生成する偏在特徴量生成手段と、
当該偏在特徴量から、当該単位特徴量間の交互作用を取り入れた学習済みのニューラルネットワーク(neural network)アルゴリズムを用いて、当該単位特徴量間の関係性が反映された交互作用特徴量を生成し、当該交互作用特徴量を用いて、当該単位特徴量の各々に係る事象の組合せが発現する頻度に係る頻度情報を生成する頻度情報生成手段と、
当該頻度情報から、当該対象が当該区域内に位置する確率を算出し、当該確率と当該対象の数の観測値とから、当該区域内に位置する当該対象の数に係る情報を決定する対象数決定手段と
してコンピュータを機能させる対象数推定プログラムが提供される。
【0014】
この本発明による対象数推定プログラムの一実施形態として、偏在特徴量生成手段は、当該対象の属性に係る特徴量である属性特徴量を、単位特徴量として更に含む当該偏在特徴量を生成し、
対象数決定手段は、当該頻度情報から、当該エリア内に位置していて当該属性を有する当該対象が、当該区域内に位置する確率である区域内存在確率を算出し、当該区域内存在確率と、当該エリア内に位置していて当該属性を有する当該対象の数の観測値とから、当該区域内に位置する当該対象の数に係る情報を決定することも好ましい。
【0015】
また、本発明による対象数推定プログラムにおける他の実施形態として、偏在特徴量生成手段は、時間区間に係る特徴量である時間特徴量を、単位特徴量として更に含む当該偏在特徴量を生成し、
対象数決定手段は、当該頻度情報から、当該時間区間において当該エリア内に位置している当該対象が、当該区域内に位置する確率である区域内存在確率を算出し、当該区域内存在確率と、当該時間区間において当該エリア内に位置している当該対象の数の観測値とから、当該区域内に位置する当該対象の数に係る情報を決定することも好ましい。
【0016】
さらに、本発明による対象数推定プログラムにおける更なる他の実施形態として、偏在特徴量生成手段は、当該対象の属性に係る特徴量である属性特徴量と、時間区間に係る特徴量である時間特徴量とを、単位特徴量として更に含む当該偏在特徴量を生成し、
対象数決定手段は、当該頻度情報から、当該時間区間において当該エリア内に位置していて当該属性を有する当該対象が、当該区域内に位置する確率である区域内存在確率を算出し、当該区域内存在確率と、当該時間区間において当該エリア内に位置していて当該属性を有する当該対象の数の観測値とから、当該区域内に位置する当該対象の数に係る情報を決定することも好ましい。
【0017】
また、本発明による対象数推定プログラムにおける更なる他の実施形態として、偏在特徴量生成手段は、ある時間区間についての当該エリア若しくは第1の測位手段の識別子としての第1識別特徴量と、当該ある時間区間よりも前の時間区間についての当該エリア若しくは第1の測位手段の識別子としての以前第1識別特徴量、及び/又は、当該ある時間区間よりも後の時間区間についての当該エリア若しくは第1の測位手段の識別子としての以後第1識別特徴量とを、単位特徴量として更に含む当該偏在特徴量を生成することも好ましい。
【0018】
本発明によれば、また、第1の測位手段によって特定される対象の位置の単位であるエリアに含まれる複数の区域における、当該区域内に位置する当該対象の数を推定する対象数推定プログラムであって、
当該区域における当該対象の滞在又は移動に関係する事象又は事物に係る特徴量である区域特徴量と、当該対象の属性に係る特徴量である属性特徴量を、単位特徴量として含む偏在特徴量を生成する偏在特徴量生成手段と、
当該偏在特徴量から、当該単位特徴量間の交互作用を取り入れた学習済みのニューラルネットワークアルゴリズムを用いて、当該単位特徴量間の関係性が反映された交互作用特徴量を生成し、当該交互作用特徴量を用いて、当該単位特徴量の各々に係る事象の組合せが発現する頻度に係る頻度情報を生成する頻度情報生成手段と、
当該頻度情報から、当該エリア内に位置していて当該属性を有する当該対象が、当該区域内に位置する確率である区域内存在確率を算出し、当該区域内存在確率と、当該エリア内に位置していて当該属性を有する当該対象の数の観測値とから、当該区域内に位置する当該対象の数に係る情報を決定する対象数決定手段と
してコンピュータを機能させる対象数推定プログラムが提供される。
【0019】
本発明によれば、さらに、第1の測位手段によって特定される対象の位置の単位であるエリアに含まれる複数の区域における、当該区域内に位置する当該対象の数を推定する対象数推定プログラムであって、
当該区域における当該対象の滞在又は移動に関係する事象又は事物に係る特徴量である区域特徴量と、時間区間に係る特徴量である時間特徴量とを、単位特徴量として含む偏在特徴量を生成する偏在特徴量生成手段と、
当該偏在特徴量から、当該単位特徴量間の交互作用を取り入れた学習済みのニューラルネットワークアルゴリズムを用いて、当該単位特徴量間の関係性が反映された交互作用特徴量を生成し、当該交互作用特徴量を用いて、当該単位特徴量の各々に係る事象の組合せが発現する頻度に係る頻度情報を生成する頻度情報生成手段と、
当該頻度情報から、当該時間区間において当該エリア内に位置している当該対象が、当該区域内に位置する確率である区域内存在確率を算出し、当該区域内存在確率と、当該時間区間において当該エリア内に位置している当該対象の数の観測値とから、当該区域内に位置する当該対象の数に係る情報を決定する対象数決定手段と
してコンピュータを機能させる対象数推定プログラムが提供される。
【0020】
また、以上に述べた本発明による対象数推定プログラムにおいて、偏在特徴量生成手段は、第1の測位手段の設置環境、仕様又は性能に係る特徴量である第1測位特徴量を、単位特徴量として更に含む当該偏在特徴量を生成することも好ましい。また、偏在特徴量生成手段は、当該区域と第1の測位手段に係る地点との位置関係に係る特徴量である位置関係特徴量を、単位特徴量として更に含む当該偏在特徴量を生成することも好ましい。
【0021】
さらに、以上に述べた本発明による対象数推定プログラムにおいて、当該ニューラルネットワークアルゴリズムは、
埋め込み処理の施された当該偏在特徴量に含まれる複数の当該単位特徴量から第1の特徴行列を生成し、
第nの特徴行列と第1の特徴行列とから第nの特徴テンソルを生成して、第nの特徴テンソルに対し、フィルタ処理を、当該単位特徴量の次元に相当する次元軸に沿ってスライドさせながら施して、複数の特徴マップを生成し、当該複数の特徴マップから第(n+1)の特徴行列を生成する処理を、nの値が1から1ずつ増分して所定の整数値になるまで繰り返し、
各nの値において生成された当該複数の特徴マップの各々に対し、プーリング処理を施して当該交互作用特徴量を生成する
ようにコンピュータを機能させるCIN(Compressed Interaction Network)アルゴリズムであることも好ましい。
【0022】
また、上記のCINを用いる実施形態において、頻度情報生成手段は、埋め込み処理の施された当該偏在特徴量を入力とした全結合型ニューラルネットワークアルゴリズムからの出力、及び/又は、当該偏在特徴量に対し線形回帰分析処理を施した結果も用いて、当該頻度情報を生成することも好ましい。
【0023】
さらに、以上に述べた本発明による対象数推定プログラムにおいて、当該ニューラルネットワークアルゴリズムは、第2の測位手段によって特定された当該区域における当該区域特徴量を単位特徴量として含む当該偏在特徴量と、この偏在特徴量に含まれる単位特徴量の各々に係る事象の組合せが発現する頻度に係る正解データとしての当該頻度情報とを含む学習データによって、訓練されることも好ましい。
【0024】
またここで、当該対象は人間であって、端末のユーザを含み、第1の測位手段は基地局であって、当該対象の数の観測値は、当該基地局と通信接続された当該端末の数の観測値であり、第2の測位手段は、当該端末に搭載されたGPS(Global Positioning System)測位手段であることも好ましい。
【0025】
本発明によれば、また、第1の測位手段によって特定される対象の位置の単位であるエリアに含まれる複数の区域における、当該区域内に位置する当該対象の数を推定する対象数推定装置であって、
当該区域における当該対象の滞在又は移動に関係する事象又は事物に係る特徴量である区域特徴量と、当該エリア若しくは第1の測位手段の識別子としての第1識別特徴量、及び/又は、当該区域の識別子としての第2識別特徴量とを、単位特徴量として含む偏在特徴量を生成する偏在特徴量生成手段と、
当該偏在特徴量から、当該単位特徴量間の交互作用を取り入れた学習済みのニューラルネットワークアルゴリズムを用いて、当該単位特徴量間の関係性が反映された交互作用特徴量を生成し、当該交互作用特徴量を用いて、当該単位特徴量の各々に係る事象の組合せが発現する頻度に係る頻度情報を生成する頻度情報生成手段と、
当該頻度情報から、当該対象が当該区域内に位置する確率を算出し、当該確率と当該対象の数の観測値とから、当該区域内に位置する当該対象の数に係る情報を決定する対象数決定手段と
を有する対象数推定装置が提供される。
【0026】
本発明によれば、さらに、第1の測位手段によって特定される対象の位置の単位であるエリアに含まれる複数の区域における、当該区域内に位置する当該対象の数を推定する対象数推定システムであって、
当該区域における当該対象の滞在又は移動に関係する事象又は事物に係る特徴量である区域特徴量と、当該エリア若しくは第1の測位手段の識別子としての第1識別特徴量、及び/又は、当該区域の識別子としての第2識別特徴量とを、単位特徴量として含む偏在特徴量を生成する偏在特徴量生成手段と、
当該偏在特徴量から、当該単位特徴量間の交互作用を取り入れた学習済みのニューラルネットワークアルゴリズムを用いて、当該単位特徴量間の関係性が反映された交互作用特徴量を生成し、当該交互作用特徴量を用いて、当該単位特徴量の各々に係る事象の組合せが発現する頻度に係る頻度情報を生成する頻度情報生成手段と、
当該頻度情報から、当該対象が当該区域内に位置する確率を算出し、当該確率と当該対象の数の観測値とから、当該区域内に位置する当該対象の数に係る情報を決定する対象数決定手段と
を有する対象数推定システムが提供される。
【0027】
本発明によれば、さらにまた、第1の測位手段によって特定される対象の位置の単位であるエリアに含まれる複数の区域における、当該区域内に位置する当該対象の数を推定する対象数推定方法であって、
当該区域における当該対象の滞在又は移動に関係する事象又は事物に係る特徴量である区域特徴量と、当該エリア若しくは第1の測位手段の識別子としての第1識別特徴量、及び/又は、当該区域の識別子としての第2識別特徴量とを、単位特徴量として含む偏在特徴量を生成するステップと、
当該偏在特徴量から、当該単位特徴量間の交互作用を取り入れた学習済みのニューラルネットワーク(neural network)アルゴリズムを用いて、当該単位特徴量間の関係性が反映された交互作用特徴量を生成し、当該交互作用特徴量を用いて、当該単位特徴量の各々に係る事象の組合せが発現する頻度に係る頻度情報を生成するステップと、
当該頻度情報から、当該対象が当該区域内に位置する確率を算出し、当該確率と当該対象の数の観測値とから、当該区域内に位置する当該対象の数に係る情報を決定するステップと
を有することを特徴とする、コンピュータによって実施される対象数推定方法が提供される。
【発明の効果】
【0028】
本発明の対象数推定プログラム、装置、システム及び方法によれば、測位手段による観測に係る誤差の影響を抑制した対象数の推定を行うことが可能となる。
【図面の簡単な説明】
【0029】
【
図1】本発明による対象数推定装置の一実施形態における機能構成を示す機能ブロック図である。
【
図2】偏在特徴量を含む学習データを生成するためのユニークユーザ数の統計処理における一実施形態を示した、テーブルを含む模式図である。
【
図3】本発明に係る偏在特徴量についての他の実施形態を説明するための模式図である。
【
図4】本発明に係る交互作用特徴量生成処理の一実施形態を説明するための模式図である。
【
図5】本発明に係る交互作用特徴量(及び頻度情報)生成処理における更なる他の実施形態を説明するための模式図である。
【発明を実施するための形態】
【0030】
以下、本発明の実施形態について、図面を用いて詳細に説明する。
【0031】
[対象数推定装置・システム]
図1は、本発明による対象数推定装置の一実施形態における機能構成を示す機能ブロック図である。なお同機能ブロック図では、対象数推定処理に関係しない機能構成部は省略されている。
【0032】
図1に示した通信設備装置1は勿論、通信設備としての機能(例えば中継機能)を果たす装置であるが、本発明による対象数推定装置の一実施形態にもなっている。すなわち、通信設備装置1は本実施形態において、所定地域(例えば47都道府県全体)を構成する複数の区域(例えば250m(メートル)四方の多数のメッシュ)の各々における対象の数、本実施形態では人間の数、を拡大推計により決定して、所定地域(全国)における人口分布を推定し、推定結果としての人口分布データ(例えば人口分布グラフや人口ヒートマップ)を出力可能な装置となっている。
【0033】
ここで、通信設備装置1は本実施形態において、第1の測位手段としての基地局3を利用して、1つの基地局3と通信接続された(位置登録された)端末2の数、すなわち端末2のユーザの数、を位置登録情報(接続セクタ情報)として観測する。そしてこのユーザ数の観測値を、この基地局3のカバーする基地局エリア内に位置している人間(対象)の数の観測値とするのである。
【0034】
この基地局エリア内に位置していて位置登録された端末2(のユーザ)の数は、通常ユーザ規模が相当に大きい条件下での数となっている。しかしながら、基地局3の間隔は例えば数kmに及ぶ場合もあって基地局エリアは一般に相当に広く、その結果、基地局3による端末2(のユーザ)の観測結果の位置解像度は通常、非常に低いものとなる。
【0035】
このような事情の下、通信設備装置1は本実施形態において、端末2に搭載された第2の測位手段としてのGPS(Global Positioning System)測位手段を更に利用して、各メッシュ内に位置する人間(対象)を観測する。具体的には、位置情報提供を許諾しているユーザの端末2から基地局3へ送信される、この端末2のGPS測位情報を取得して、各メッシュ内の観測を行うのである。
【0036】
ここで、このGPS測位情報は通常、位置解像度の高い情報となっている。しかしながら一般に、観測可能なGPS許諾ユーザの規模は相当に小さい。したがって、各メッシュで端末2が1台観測されたり、又は全く観測されなかったりすることも少なくない。その結果、GPS測位情報は通常、サンプリング誤差が大きい情報となり、これにより拡大推計後の人口の推定値の誤差も大きくなってしまい易い。
【0037】
以上説明したような位置登録情報及びGPS測位情報の問題を解消して、メッシュ(区域)内の人間(対象)の数をより好適に推定すべく、通信設備装置1は本実施形態において、
(A)あるメッシュ(区域)における人間(対象)の滞在又は移動に関係する事象又は事物に係る特徴量である「区域特徴量」と、ある基地局エリア若しくはある基地局3(第1の測位手段)の識別子(ID)としての「第1識別特徴量」、及び/又は、当該あるメッシュ(区域)のIDとしての「第2識別特徴量」とを、単位特徴量として含む「偏在特徴量」を生成する偏在特徴量生成部111と、
(B)生成された「偏在特徴量」から、単位特徴量間の交互作用を取り入れた学習済みの「ニューラルネットワーク(neural network)アルゴリズム」を用いて、単位特徴量間の関係性が反映された「交互作用特徴量」を生成し、この「交互作用特徴量」を用いて、単位特徴量の各々に係る事象の組合せが発現する頻度に係る「頻度情報」を生成する頻度情報生成部112と、
(C)生成された「頻度情報」から、当該ある基地局エリア内に位置(存在)している人間(対象)が当該あるメッシュ(区域)内に位置(存在)する確率である「区域内存在確率」を算出し、この「区域内存在確率」と、当該ある基地局エリア内に位置している人間(対象)の数の(基地局3によって取得された)観測値とから、当該あるメッシュ(区域)内に位置する人間(対象)の数に係る情報を決定する対象数決定部113と
を有している。
【0038】
ここで従来、メッシュ内の人口を推定する技術は、例えば特許文献1に開示された技術もそうであるが、基地局ID等の情報を説明変数にして、目的変数としてのメッシュに係る情報、例えばメッシュIDを求めているものがほとんどである。この場合、確率マップや推定モデルの訓練に用いる学習データは、正解データとしてGPSユーザの位置(存在)するメッシュID情報を含むことになる。その結果、このメッシュID情報の抱えるサンプリング誤差が、メッシュ内の人口の推定誤差を増大させてしまう問題が生じていた。
【0039】
これに対し通信設備装置1は、従来とは異なり、メッシュ(区域)に係る特徴量(区域特徴量や第2識別特徴量)を説明変数にして、単位特徴量間の交互作用を取り入れた「ニューラルネットワークアルゴリズム」から、メッシュ(区域)内の人口(対象数)を推定するための目的変数としての「頻度情報」を導出している。
【0040】
このように通信設備装置1は、メッシュ(区域)内の人口(対象数)を推定するに際し、いわば従来の「(ユーザの位置する)メッシュを求める問題」を、「メッシュ情報を用いて(ユーザの位置する)メッシュの出現頻度を導出する問題」に置き換えているのである。その結果、サンプリング誤差の大きい(GPSユーザの位置する)メッシュID情報を正解データに含めずに済み、メッシュ内の人口(対象数)の推定誤差を抑制することができる。すなわち、通信設備装置1によれば、測位手段による観測に係る誤差の影響を抑制した人口(対象数)の推定を行うことができるのである。例えば、ユーザ規模が小さく、それ故許諾ユーザの数も非常に小さい地方における人口(対象数)推定精度の向上を図ることも可能となる。
【0041】
また、上記(A)のメッシュ情報を含む説明変数としての「偏在特徴量」は、本実施形態においてこの後説明するように、D次元の埋め込み表現ベクトルに変換される。また「ニューラルネットワークアルゴリズム」によってさらに、単位特徴量間の関係性が反映された「交互作用特徴量」に変換される。これらの特徴量(表現ベクトル)は、まさにメッシュ(区域)の表現学習の結果となっており、対象とする全てのメッシュ間で移転可能且つ翻訳可能な共有知見とすることができる。例えば「鉄道駅に隣接する商業施設での人口が多い」や、(後述する時間特徴量や属性特徴量も採用した場合ではあるが)「夕方、商業施設では主婦が多く存在する」といったような情報も内包し得るのである。
【0042】
なお本実施形態において、その数を求める対象は「人間」となっており、以下の説明でも対象を「人間」として人口分布(人流)を推定するものとするが、本発明に係る対象は勿論、「人間」に限定されるものではない。すなわち、第1の測位手段のエリア内の区域に位置(存在)するか否かを第2の測位手段で観測可能なものならば、種々様々なものが本発明に係る対象に該当し得るのである。例えば、第1の測位手段を基地局とし第2の測位手段を車載GPSとして、通信端末の搭載された「自動車」を本発明に係る対象とすることも可能である。
【0043】
ちなみに、上記(A)の偏在特徴量生成部111、上記(B)の頻度情報生成部112、及び上記(C)の対象数決定部113のうちの少なくとも1つは、別の装置の機能構成部となっていて、複数の装置(例えば複数のサーバ)全体で対象数推定機能を果たすものとすることもできる。この場合、これら複数の装置全体が、本発明による対象数推定システムを構成することになる。以下、本実施形態の対象数推定装置(通信設備装置1)について、より詳細に説明を行う。
【0044】
[装置機能構成,対象数推定プログラム・方法]
同じく
図1の機能ブロック図によれば、本発明による対象数推定装置の一実施形態としての通信設備装置1は、通信インタフェース部101と、メッシュ情報保存部102と、ユーザ情報保存部103と、GPS測位情報保存部104と、基地局情報保存部105と、ユニークユーザ(UU)統計保存部106と、ユーザインタフェース(UI)部107と、プロセッサ・メモリ(メモリ機能を備えた演算処理系)とを有する。
【0045】
ここで、このプロセッサ・メモリは、本発明による対象数推定プログラムの一実施形態を保存しており、またコンピュータ機能を有していて、この対象数推定プログラムを実行することによって、対象数推定処理を実施する。またこのことから、通信設備装置1は、通信設備ではない対象数推定処理専用の装置であってもよく、さらに、本発明による対象数推定プログラムを搭載した、クラウドサーバ、非クラウドサーバ、パーソナル・コンピュータ(PC)、ノート型若しくはタブレット型コンピュータや、スマートフォン等の携帯端末とすることもできる。
【0046】
さらに、上記のプロセッサ・メモリは、偏在特徴量生成部111と、交互作用特徴量生成部112aを含む頻度情報生成部112と、メッシュ内存在確率算出部113aを含む対象数決定部113と、通信制御部121と、入出力制御部122とを有する。ここで以上に述べた機能構成部は、プロセッサ・メモリに保存された対象数推定プログラムの実行によって具現する機能と捉えることができる。また、
図1における通信設備装置1の機能構成部間を矢印で接続して示した処理の流れは、本発明による対象数推定方法の一実施形態としても理解される。
【0047】
<偏在特徴量生成手段>
以下、通信設備装置1における通信制御機能(例えば中継機能)の説明を省略し、本発明に係る対象数推定処理機能のみの説明を行う。同じく
図1の機能ブロック図に示したように、偏在特徴量生成部111は本実施形態において、
(ア)時間区間に係る特徴量である時間特徴量、
(イ)基地局エリア若しくは基地局3の識別子(ID)としての第1識別特徴量、
(ウ)メッシュの識別子(ID)としての第2識別特徴量、
(エ)人間の属性に係る特徴量である属性特徴量、
(オ)メッシュにおける人間の滞在又は移動に関係する事象又は事物に係る特徴量である区域特徴量、
(カ)基地局3の設置環境、仕様又は性能に係る特徴量である第1測位特徴量、及び
(キ)メッシュと基地局に係る地点との位置関係に係る特徴量である位置関係特徴量
を単位特徴量として含む偏在特徴量を生成する。
【0048】
最初に、上記(ア)の時間特徴量は、推定に係る(又は学習データにおける)時間区間を表す特徴量であり、例えば“平日15時台”や“休日16時台”といったような日時の特徴を表す48(=2×24)次元ベクトルとすることができる。また、“月曜日7時台”や“土曜日12時台”といったような日時の特徴を表す148(=7×24)次元ベクトルとすることも可能である。
【0049】
次に、上記(イ)の第1識別特徴量は、推定に係る(又は学習データにおける)基地局エリア若しくは基地局3を識別する識別子としての特徴量であり、例えば、対象となる(例えば47都道府県全体の)基地局3の全台数だけの次元を有するワンホット(one-hot)ベクトルとすることができる。また、上記(ウ)の第2識別特徴量は、推定に係る(又は学習データにおける)メッシュを識別する識別子としての特徴量であり、例えば、対象となる(例えば47都道府県全体の)メッシュの総数だけの次元を有するワンホット(one-hot)ベクトルであってもよい。
【0050】
さらに、上記(エ)の属性特徴量は、推定に係る(又は学習データにおける)人間の有する属性を表す特徴量であり、例えば、(端末2のユーザの登録情報として取得可能な)“性別”“年代”や“居住都道府県”といったような(ユーザ)属性の特徴を表すワンホットベクトルとしてもよい。例えば“居住都道府県”を表すベクトル部分は、47次元のワンホット表現部分とすることができる。
【0051】
ここで、この属性特徴量を生成するための属性情報は、例えば、端末2に係る通信事業者が管理する契約情報管理サーバやアンケート結果管理サーバから(通信インタフェース部101及び通信制御部121を介して)受信され、ユーザ情報保存部103に保存された(ユーザIDが紐づけられた)属性情報とすることができる。また端末2の通信ログから公知の技術によって推定された、端末2のユーザの属性情報であってもよい。
【0052】
また、上記(オ)の区域特徴量は、推定に係る(又は学習データにおける)メッシュにおけるPOI(Point Of Interest)、構造物、建築物や、鉄道等の移動手段に係る特徴量、さらには、道路地図情報、国勢調査等の(過去の)人口に係る調査結果や、ハザードマップ等から得られる当該メッシュに関する情報に係る特徴量とすることができる。例えば区域特徴量として、
(a)当該メッシュに含まれる幅員**メートル以上の道路の本数、
(b)当該メッシュに含まれる家屋、集合住宅、事業所及び商業施設の各数、
(c)当該メッシュに含まれるバス停の数、
(d)当該メッシュに含まれる鉄道駅の数、
(e)当該メッシュにおける夜間人口、及び
(f)洪水ハザードマップに示された当該メッシュにおける浸水危険度
を表すワンホットベクトルが生成可能である。例えば、道路の本数や夜間人口等の数値は、取り得る数値範囲を、例えば[0-1][1-5][5-10]・・・や[0-10][10-100][100-500]・・・といったように区分分けした上で、区分数だけの次元を有するワンホット表現にしてもよい。
【0053】
ここで、このような区域特徴量を生成するための各種情報は、(道路・鉄道地図を含む)各種地図情報の管理サーバ、国勢調査結果管理サーバや、ハザードマップ管理サーバ等から受信され、メッシュ情報保存部102に保存された各種情報とすることができる。
【0054】
また、上記(カ)の第1測位特徴量は、推定に係る(又は学習データにおける)基地局3の設置環境、仕様又は性能に係る特徴量である。例えば第1測位特徴量として、
(a)当該基地局3の設置場所の種別、例えば屋外(1)/屋内(0)の別、
(b)当該基地局3の電波出力(例えばキロワット(kW)数)、及び
(c)当該基地局3のアンテナの向き(方位角)及び高度(例えば標高)
を表すワンホットベクトルが生成可能である。なおこのワンホットベクトルも、該当する数値の属する区分を表すワンホット表現のベクトルとすることができる。
【0055】
ここで、このような第1測位特徴量を生成するための情報は、通信設備装置1が基地局情報保存部105に予め保存・管理している基地局3に係る情報とすることができる。また、適宜、各基地局3から取り寄せた各基地局3に係る情報であってもよい。
【0056】
さらに、上記(キ)の位置関係特徴量は、推定に係る(又は学習データにおける)メッシュの位置と基地局3の設置位置との関係に係る特徴量である。例えば位置関係特徴量として、
(a)当該メッシュの中心の位置と当該基地局3の設置位置との距離、及び
(b)当該メッシュの中心の位置からみた当該基地局3の設置位置の向き(方位角)
を表すワンホットベクトルを生成してもよい。なおこのワンホットベクトルも、該当する数値の属する区分を表すワンホット表現のベクトルとすることができる。また、この位置関係特徴量も、例えばメッシュ情報保存部102や基地局情報保存部105に保存・管理された情報を用いて生成することが可能である。
【0057】
ここで、「ある時間帯(時間区間)」において「ある基地局エリア」の「あるメッシュ」内に存在する、「ある属性」を有する人間の数(人口)を推定する際、「ニューラルネットワークアルゴリズム」へ入力される偏在特徴量は、これらの「ある時間帯(時間区間)」、「ある基地局エリア」、「あるメッシュ」及び「ある属性」に相当する上記(ア)~(キ)の特徴量の集合とするのである。
【0058】
以上まとめると、偏在特徴量Xは本実施形態において、次式
(1) X={T, B, M, A, fm, fb, fmb}
で表される量となる。ここで、Tは上記(ア)の時間特徴量であり、Bは上記(イ)の第1識別特徴量であり、Mは上記(ウ)の第2識別特徴量であり、Aは上記(エ)の属性特徴量であり、fmは上記(オ)の区域特徴量であり、fbは上記(カ)の第1測位特徴量であり、fmbは上記(キ)の位置関係特徴量である。
【0059】
なお、偏在特徴量Xは勿論、上記(ア)~(キ)の全てを含むものに限定されない。例えば、上記(オ)の区域特徴量fmと、上記(イ)の第1識別特徴量B及び上記(ウ)の第2識別特徴量Mのうちの一方又は両方とを少なくとも含むものであってもよい。また、上記(オ)の区域特徴量fmと、上記(ア)の時間特徴量Tとを少なくとも含むものとすることもできる。さらに偏在特徴量Xは、上記(オ)の区域特徴量fmと、上記(エ)の属性特徴量Aとを少なくとも含むものとすることもできる。例えば上記(オ)の区域特徴量fmと、上記(ア)の時間特徴量Tと、上記(エ)の属性特徴量Aとを少なくとも含むものであってもよいのである。またさらに言えば、これらの偏在特徴量は、上記(カ)の第1測位特徴量fbを更に含むものであってもよく、また、上記(キ)の位置関係特徴量fmbを更に含むものとすることも可能である。
【0060】
次に、「ニューラルネットワークアルゴリズム」を構築するための、偏在特徴量Xを含む学習データの生成処理について、
図2を用いて詳細に説明する。
図2は、偏在特徴量Xを含む学習データを生成するためのユニークユーザ(UU)数の統計処理における一実施形態を示した、テーブルを含む模式図である。
【0061】
図2に示したように、偏在特徴量生成部111は、本実施形態において、
(a)各基地局3から、位置登録情報(接続セクタ情報)を取得し、集計処理を行って「位置登録情報集計結果」を生成し、
(b)端末2に係る通信事業者が管理する契約情報管理サーバやアンケート結果管理サーバから受信され、ユーザ情報保存部103に保存された「ユーザ属性情報」を取得し、
(c)所定期間(例えば3か月)に収集されたユーザの位置登録情報やGPS測位結果から、夜間(例えば18時~3時)に最も連続して長く滞在していた都道府県を特定して、この都道府県を居住都道府県に決定し、また、昼間(例えば7時~19時)に最も連続して長く滞在していた都道府県を特定して、この都道府県を職場都道府県に決定し、ユーザ毎にこれらの決定事項を取りまとめた「自宅職場判定結果」を生成する。
【0062】
次いで偏在特徴量生成部111は、上記(a)~(c)の情報を、ユーザIDを用いて互いに紐づけ、「位置登録ユーザ属性紐づけ結果」を生成する。最後にこの「位置登録ユーザ属性紐づけ結果」を用いて、同じ基地局ID、同じ日付・時間帯(時間区間)、同じ年代・性別・居住都道府県に該当するユーザ(ユニークユーザ,UU)の数をカウントし、このカウント結果を取りまとめて「時間帯・基地局・ユーザ属性別UUカウント結果」を生成する。
【0063】
ここで、この「時間帯・基地局・ユーザ属性別UUカウント結果」は、一先ずUU統計保存部106で保存されて更新され、学習データ生成の際、適宜読み出されて使用される。具体的には、読み出された「時間帯・基地局・ユーザ属性別UUカウント結果」における日付・時間帯から時間特徴量Tが生成され、年代・性別・居住都道府県から属性特徴量Aが生成され、基地局IDから第1識別特徴量B及び第1測位特徴量fbが生成される。すなわち、多数の{T, A, B, fb}の組合せが、各々該当するUU数だけ生成されるのである。
【0064】
次いで、
(a)上記の多数の{T, A, B, fb}の組合せの各々と、
(b)学習データ用として準備された(基地局3から送信されGPS測位情報保存部104で保存・管理された)多数のGPS測位情報に含まれる(測位地点を含む)メッシュに係る情報から生成される第2識別特徴量M及び区域特徴量fmと
の組合せを、ユーザIDをもって紐づける形で生成し、さらに当該組合せにおいて位置関係特徴量fmbを追加して、学習データ用の偏在特徴量Xを生成することができる。また正解データは、該当するUU数から算出される、{T, B, M, A, fm, fb, fmb}の組合せの出現頻度とすることができる。
【0065】
(偏在特徴量に係る他の実施形態)
図3は、本発明に係る偏在特徴量Xについての他の実施形態を説明するための模式図である。
【0066】
図3(A)に示したように、ある時間帯において基地局B2の基地局エリア内に存在している端末2は、この基地局エリアを通る幹線道路を使って、隣接する基地局エリアからこの基地局エリア内に移動してきた可能性も少なくない。またこの後、この幹線道路を使って、この基地局エリアから隣接する基地局エリアに移動していくことも十分に考えられる。このように、ある時間帯(時間区間)における基地局(現時点基地局)は、ひいては該当するメッシュは、その前の時間帯における基地局(直前基地局)及びその後の時間帯における基地局(直後基地局)によってもより良く特定され得るのである。
【0067】
そこで本実施形態においては、
図3(B)に示すように、現時点基地局の基地局IDだけでなく、直前基地局の基地局ID及び直後基地局の基地局IDもテーブル項目に加えて「UU数カウント結果」を生成し、これにより、次式
(2) X={T, B
pre, B, B
post, M, A, ・・・}
で表される偏在特徴量Xを生成し採用する。ここでB
preは、ある時間区間(ここではTに相当する時間帯)よりも前の時間区間(例えば直前の時間帯)についての基地局エリア若しくは基地局のIDとしての以前第1識別特徴量である。またB
postは、このある時間区間(Tに相当する時間帯)よりも後の時間区間(例えば直後の時間帯)についての基地局エリア若しくは基地局のIDとしての以後第1識別特徴量となっている。
【0068】
このような偏在特徴量Xを用いて「ニューラルネットワークアルゴリズム」を訓練し、さらに人口推定を行うことによって、より精度の高い推定結果の得られる可能性が高まるのである。ちなみに、以前第1識別特徴量Bpre及び以後第1識別特徴量Bpostのうちのいずれか一方のみを含む偏在特徴量Xを採用することも可能である。
【0069】
<頻度情報生成手段>
図1の機能ブロック図に戻って、頻度情報生成部112の交互作用特徴量生成部112aは本実施形態において、偏在特徴量X(={T, B, M, A, fm, fb, fmb})から、単位特徴量(T, B, M, A, fm, fb, fmb)間の交互作用を取り入れた学習済みのニューラルネットワークアルゴリズム、本実施形態ではCIN(Compressed Interaction Network)アルゴリズムを用いて、単位特徴量(T, B, M, A, fm, fb, fmb)間の関係性が反映された交互作用特徴量p+を生成する。
【0070】
以下
図4を用いて、上記のCINアルゴリズムを用いた交互作用特徴量p+の生成処理の説明を行う。ちなみに、CIN及びこの後説明するxDeepFMについては、非特許文献1:Jianxun Lian, Xiaohuan Zhou, Fuzheng Zhang, Zhongxia Chen, Xing Xie, Guangzhong Sun, “xDeepFM: Combining Explicit and Implicit Feature Interactions for Recommender Systems”, Proceedings of the 24th ACM SIGKDD international conference on knowledge discovery & data mining, <https://doi.org/10.48550/arXiv.1803.05170>, 2018年において詳細に解説されている。
【0071】
図4は、本発明に係る交互作用特徴量生成処理の一実施形態を説明するための模式図である。
【0072】
図4によれば、(頻度情報生成部112の)交互作用特徴量生成部112aは最初に、
(a)入力された偏在特徴量Xの各単位特徴量(T, B, M, A, fm, fb, fmb)に対し埋め込み処理(例えば変換行列演算子を作用させて次元を圧縮する処理)を施し、各単位特徴量に対応したD次元の埋め込みベクトルe
i(i=1,2,・・・, m,mは単位特徴量の数)を生成する。
【0073】
次いで同じく
図4に示したように、作用特徴量生成部112aは、
(b)生成した各埋め込みベクトルe
iを(1つの行(又は列)として)合わせて、m(=H0)×D次元の第1の特徴行列x0を生成し、
(c)H(n-1)×D次元の第nの特徴行列x(n-1)と、m×D次元の第1の特徴行列x0とから、H(n-1)×m×D次元の第nの特徴テンソルznを生成して、この第nの特徴テンソルznに対し、フィルタ処理を、単位特徴量の次元に相当する次元軸(D軸)に沿ってスライドさせながら施して、複数の(Hn個の)特徴マップを生成し、これら複数の(Hn個の)特徴マップから、Hn×D次元の第(n+1)の特徴行列xnを生成する処理を、nの値が1から1ずつ増分して所定の整数値Tになるまで繰り返し、
(d)各nの値において生成された複数の(Hn個の)特徴マップの各々に対し、プーリング処理を施した結果(={p1, p2,・・・, pT})を合算して、交互作用特徴量p+(=Σ
n=1
Tpn)を生成する。
ここで、上記(b)~(d)の処理がCINアルゴリズムによる処理となる。
【0074】
このように、CINアルゴリズムは、特徴マップという形で単位特徴量(T, B, M, A, fm, fb, fmb)間の交互作用を取り入れたアルゴリズムとなっており、その結果、単位特徴量(T, B, M, A, fm, fb, fmb)間の関係性が反映された交互作用特徴量p+を生成することが可能となる。
【0075】
最後に頻度情報生成部112は、以上説明したように生成された交互作用特徴量p+を用いて、単位特徴量(T, B, M, A, fm, fb, fmb)の各々に係る事象の組合せが発現する頻度を示す頻度情報y^を、次式
(3) y^=σ(W
CIN'(p+))
によって決定する。ここでσはシグモイド(sigmoid)関数であり、W
CIN'は変換行列演算子である。なお、以上に述べたCINアルゴリズム及び変換行列演算子W
CIN'の訓練は本実施形態において、
図2を用いて説明した学習データをもって実施されるのである。
【0076】
以上、CINを用いた交互作用特徴量(頻度情報)生成処理を説明したが、他の実施形態として、CINアルゴリズムの代わりに、全結合型(fully-connected)深層ニューラルネットワーク(DNN, Deep neural Network)アルゴリズムを用いても、交互作用特徴量、ひいては頻度情報を生成することが可能である。
【0077】
具体的には、偏在特徴量Xの各単位特徴量(T, B, M, A, fm, fb, fmb)から生成されたD次元の埋め込みベクトルei(i=1,2,・・・, m)の集合{e1, e2,・・・, em}から、入力層のノードを構成し、次いでこれらのノード間の重み付け和をとって第1の隠れ層のノードとし、・・・といったようなノード重み付け処理を所定数の隠れ層まで繰り返し、最後の隠れ層のノード間の重み付け和をとって出力層のノードを構成して、これらのノードから、単位特徴量間の関係性が反映された交互作用特徴量xDNNを生成することができる。
【0078】
またこの場合、頻度情報生成部112は、生成した交互作用特徴量x
DNNを用いて、単位特徴量(T, B, M, A, fm, fb, fmb)の各々に係る事象の組合せが発現する頻度を示す頻度情報y^を、次式
(4) y^=σ(W
DNN'(x
DNN))
によって決定する。ここでW
DNN'も変換行列演算子である。なお、以上に述べた全結合型DNN(FC-DNN)アルゴリズム及び変換行列演算子W
DNN'の訓練も本実施形態において、
図2を用いて説明した学習データをもって実施可能となっている。
【0079】
さらに、交互作用特徴量(頻度情報)生成処理の更なる他の実施形態として、CINアルゴリズムや全結合型深層DNNアルゴリズムの代わりに、商品・サービスのレコメンド技術分野で公知となっているDNNアルゴリズムを用いて、交互作用特徴量、ひいては頻度情報を生成することもできる。このレコメンド用のDNNアルゴリズムとしては、例えば非特許文献1”Matrix Factorization”,[online],[令和4年9月18日検索],インターネット<https://developers.google.com/machine-learning/recommendation/collaborative/matrix>に開示されたMatrix Factorization用のアルゴリズムが挙げられる。
【0080】
このMatrix Factorizationでは、ユーザ群の特徴を表現する埋め込み行列Uと、商品・サービスの特徴を表す埋め込み行列Vとの積UVTがフィードバック(feedback)行列Aに近づくように訓練を行い、好適なレコメンド情報を生成可能な各ユーザ及び各商品・サービスの埋め込み表現を獲得することが可能となっている。ここで積UVTはまさに、ユーザと商品・サービスとの関係性を反映した量となっているのである。
【0081】
また、交互作用特徴量(及び頻度情報)生成処理の更なる他の実施形態として、CINの説明の際に挙げた上記の非特許文献1に開示されたxDeepFMを用いることも可能である。以下、
図5を用いてこの実施形態の説明を行う。
【0082】
図5は、本発明に係る交互作用特徴量(及び頻度情報)生成処理における更なる他の実施形態を説明するための模式図である。
【0083】
図5に示した実施形態によれば、(頻度情報生成部112の)交互作用特徴量生成部112aは、
(a)偏在特徴量Xから生成された、各単位特徴量(T, B, M, A, fm, fb, fmb)に対応したD次元の埋め込みベクトルe
i(i=1,2,・・・, m)を用いて、学習済みのCINアルゴリズムにより、交互作用特徴量(CIN交互作用特徴量)p+を生成し、
(b)同じく上記のD次元の埋め込みベクトルe
i(i=1,2,・・・, m)を用いて、学習済みのFC-DNNアルゴリズムによって、交互作用特徴量(DNN交互作用特徴量)x
DNNを生成し、
(c)偏在特徴量Xの各単位特徴量(T, B, M, A, fm, fb, fmb)を説明変数とし、「(この後述べる)変換行列演算子W
LINEARを作用させることによって頻度情報相当の情報となる線形回帰特徴量」を目的変数とした学習済みの線形回帰分析処理を、偏在特徴量Xに施して、線形回帰特徴量aを生成する。
【0084】
次いで、頻度情報生成部112は、
(d)生成した上記(a)~(c)の特徴量を用いて、単位特徴量(T, B, M, A, fm, fb, fmb)の各々に係る事象の組合せが発現する頻度を示す頻度情報y^を、次式
(5) y^=σ(WCIN(p+)+WDNN(xDNN)+WLINEAR(a))
WCIN,WDNN,WLINEAR:変換行列演算子
によって決定する。
ここで、上記(a)~(d)の処理が、xDeepFMによる処理となる。
【0085】
このように本実施形態では、単位特徴量(T, B, M, A, fm, fb, fmb)の関係性をより多面的に取り入れた結果としての頻度情報を生成することが可能となる。なお、上記のCINアルゴリズム、FC-DNNアルゴリズム、線形回帰分析処理(線形回帰式)、並びに変換行列演算子W
CIN、W
DNN及びW
LINEARの訓練も、
図2を用いて説明した学習データをもって実施することができる。
【0086】
<対象数決定手段>
図1の機能ブロック図に戻って、対象数決定部113のメッシュ内存在確率算出部113aは本実施形態において、
(a)頻度情報生成部112で生成された単位特徴量(T, B, M, A, fm, fb, fmb)の各々に係る事象の組合せが発現する頻度を示す頻度情報y^
T,B,M,Aを取得し、
(b)頻度情報y^
T,B,M,Aから、Tに係る時間帯において、Bに係る基地局エリア内に位置(存在)している端末2(のユーザ)が、Mに係るメッシュ(区域)内に位置(存在)する確率である区域内存在確率P(M|T, B)を、次式
(6)P(M|T, B)=Σ
A'(y^
T,B,M,A')/Σ
M'Σ
A'(y^
T,B,M',A')
によって算出する。ここで、Σ
A'(y^
T,B,M,A')は、設定された全ての属性(A')について算出された頻度情報(y^
T,B,M,A')におけるA'についての総和である。また、Σ
M'Σ
A'(y^
T,B,M',A')は、設定された全てのメッシュ(M')及び設定された全ての属性(A')について算出された頻度情報(y^
T,B,M',A')におけるM'及びA'についての総和である。ちなみに、上式(6)によって算出されるP(M|T, B)は、いわゆる確率マップとなっている。
【0087】
次いで対象数決定部113は、算出した区域内存在確率P(M|T, B)と、Tに係る時間帯においてBに係る基地局エリア内に位置している端末2の数(ユニークユーザ数)の観測値UUT
Bとから、Tに係る時間帯においてMに係るメッシュ内に位置する人の数(対象の数に係る情報)n^T
Mを、次式
(7) n^T
M=(αT)-1×ΣB'P(M|T, B')×UUT
B'
によって算出する。
【0088】
ここで、上式(7)におけるαTは、(Tに係る時間帯における)所定地域(例えば47都道府県全体)の人口に対する、GPS測位情報の提供を許諾しているユーザ(許諾ユーザ)の数の割合であり、言い換えると、所定地域内に位置している人が許諾ユーザである確率となっている。このαTは、予め設定された値や、アンケート結果等による推定値であってもよく、また通信事業者ならば実際の値が取得可能である。いずれにしても(αT)-1は、いわゆる拡大係数となる。また、ΣB'P(M|T, B')×UUT
B'は、設定された全ての(例えば全国の)基地局(エリア)ID(B')について算出されたP(M|T, B')×UUT
B'におけるB'についての総和である。
【0089】
また変更態様として、次式
(8) P(M|T, B, A)=y^T,B,M,A/ΣM'(y^T,B,M',A)
により算出された区域内存在確率P(M|T, B, A)を用い、次式
(9) n^T
M,A=(αT)-1×ΣB'P(M|T, B',A)×UUT
B',A
によって、Tに係る時間帯においてMに係るメッシュ内に位置していてAに係る属性を有する人の数(対象の数に係る情報)n^T
M,Aを算出することもできる。
【0090】
ここで、上式(8)により算出される区域内存在確率P(M|T, B, A)は、Bに係るエリア内に位置(存在)していてAに係る属性を有する端末2(のユーザ)が、Mに係るメッシュ(区域)内に位置(存在)する確率となっている。また、上式(9)におけるUUT
B',Aは、Tに係る時間帯においてB'に係る基地局エリア内に位置していてAに係る属性を有する端末2の数(ユニークユーザ数)の観測値である。
【0091】
このように、属性特徴量Aを単位特徴量として含む偏在特徴量Xを用いれば、ある基地局エリア内に位置していてAに係る属性を有する端末2(のユーザ)が、あるメッシュ内に位置する確率である区域内存在確率(確率マップ)が算出され、ひいては、特定のメッシュ内に位置していてAに係る属性を有する人の数(対象の数に係る情報)が算出可能となる。また、時間特徴量Tを単位特徴量として含む偏在特徴量Xを用いれば、Tに係る時間帯(時間区間)においてある基地局エリア内に位置している端末2(のユーザ)が、あるメッシュ内に位置する確率である区域内存在確率(確率マップ)が算出され、ひいては、Tに係る時間帯(時間区間)において特定のメッシュ内に位置している人の数(対象の数に係る情報)が算出可能となるのである。なお当然ながら、属性特徴量A及び時間特徴量Tを含まない偏在特徴量Xを用いても、特定のメッシュ内の人口(対象の数に係る情報)を算出することができる。
【0092】
同じく
図1の機能ブロック図において、対象数決定部113は本実施形態において、以上に説明したような、特定のメッシュ内に位置している人の数(人口)の算出結果を用いて、所定地域(例えば47都道府県全体)における各メッシュ(例えば250m四方のメッシュ)の人口を表現した高解像度人口分布グラフや、高解像度人口ヒートマップを生成する。また、時間帯(時間区間)や属性を特定した人口分布グラフや人口ヒートマップを生成することも可能となっている。例えば「平日夕方における独身男性の人口ヒートマップ」を生成することもできるのである。
【0093】
なお、メッシュ内人口の算出結果、人口分布グラフや、人口ヒートマップ等の成果は、入出力制御部122を介してディスプレイを備えたUI部107へ出力され、表示されてもよい。また、通信制御部121及び通信インタフェース部101を介して、外部の情報処理装置へ送信され、当該装置において利用されてもよい。
【0094】
以上詳細に説明したように、本発明においては、区域に係る特徴量を説明変数にして、単位特徴量間の交互作用を取り入れたニューラルネットワークアルゴリズムから、区域内の対象数を推定するための頻度情報を導出する。これにより、測位手段による観測に係る誤差の影響を抑制した対象数の推定を行うことができる。
【0095】
また、本発明による対象数推定方法を適用して、都市部における的確且つ詳細な人流予測やさらには交通行動予測を実施し、レジリエントな交通・輸送インフラを整備したり、都市化がもたらす課題を解決する効率的な都市計画を実施したりすることもできる。また、予測した人流情報に基づき、各地域や各区域に応じた有効な感染症対策を図ることも可能となる。すなわち本発明によれば、国連が主導する持続可能な開発目標(SDGs)の目標9「レジリエントなインフラを整備し、持続可能な産業化を推進するとともに、イノベーションの拡大を図る」や、目標11「都市を包摂的、安全、レジリエントかつ持続可能にする」、さらには目標3「あらゆる年齢のすべての人々の健康的な生活を確保し、福祉を推進する」の達成に貢献することも可能となるのである。
【0096】
以上に述べた本発明の種々の実施形態について、本発明の技術思想及び見地の範囲での種々の変更、修正及び省略は、当業者によれば容易に行うことができる。以上に述べた説明はあくまで実施形態の例示であって、不要な制約を行うものではない。本発明は、特許請求の範囲及びその均等物として限定されるものにのみ制約される。
【符号の説明】
【0097】
1 通信設備装置(対象数推定装置)
101 通信インタフェース部
102 メッシュ情報保存部
103 ユーザ情報保存部
104 GPS測位情報保存部
105 基地局情報保存部
106 ユニークユーザ(UU)統計保存部
107 ユーザインタフェース(UI)部
111 偏在特徴量生成部
112 頻度情報生成部
112a 交互作用特徴量生成部
113 対象数決定部
113a メッシュ内存在確率算出部
121 通信制御部
122 入出力制御部
2 端末
3,B1,B2,B3 基地局