IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ KDDI株式会社の特許一覧

特開2023-148599実数計測に基づく拡大推計を行う対象分布推定プログラム、装置、システム及び方法
<>
  • 特開-実数計測に基づく拡大推計を行う対象分布推定プログラム、装置、システム及び方法 図1
  • 特開-実数計測に基づく拡大推計を行う対象分布推定プログラム、装置、システム及び方法 図2
  • 特開-実数計測に基づく拡大推計を行う対象分布推定プログラム、装置、システム及び方法 図3
  • 特開-実数計測に基づく拡大推計を行う対象分布推定プログラム、装置、システム及び方法 図4
  • 特開-実数計測に基づく拡大推計を行う対象分布推定プログラム、装置、システム及び方法 図5
  • 特開-実数計測に基づく拡大推計を行う対象分布推定プログラム、装置、システム及び方法 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023148599
(43)【公開日】2023-10-13
(54)【発明の名称】実数計測に基づく拡大推計を行う対象分布推定プログラム、装置、システム及び方法
(51)【国際特許分類】
   G06Q 50/10 20120101AFI20231005BHJP
【FI】
G06Q50/10
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2022056721
(22)【出願日】2022-03-30
(71)【出願人】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100135068
【弁理士】
【氏名又は名称】早原 茂樹
(74)【代理人】
【識別番号】100141313
【弁理士】
【氏名又は名称】辰巳 富彦
(72)【発明者】
【氏名】上坂 大輔
(72)【発明者】
【氏名】武田 直人
(72)【発明者】
【氏名】小林 亮博
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049CC20
(57)【要約】      (修正有)
【課題】実分布の正解データに頼ることなく、高解像度の分布を、より高精度で推定する対象分布推定プログラム、対象分布推定装置、対象分布推定システム及び対象分布推定方法を提供する。
【解決手段】プログラムは、対象に付された端末についての所定期間に取得された測位結果から、対象の存在数分布を決定する手段と、複数の計測地点における対象の数を実測可能な複数の実数計測手段から取得された計測結果と、存在数分布とから、計測地点に係る正解の拡大係数を決定する手段と、所定地域内の複数の地点における地点毎に、当該地点を特徴づける特徴量を生成する手段と、正解の拡大係数を用いて構築された拡大係数推定モデルに対し、特徴量を入力し、このモデルの出力から当該地点の拡大係数を推定する手段と、存在数分布と推定された拡大係数とに基づき、所定地域内の複数の地点の各々における対象の存在する数を決定する手段としてコンピュータを機能させる。
【選択図】図1
【特許請求の範囲】
【請求項1】
所定地域における複数の対象の分布を推定するコンピュータを機能させる対象分布推定プログラムであって、
当該対象に付された端末についての所定期間に取得された測位結果から、当該所定地域における当該対象の存在する数の分布としての存在数分布を決定する存在数分布決定手段と、
当該所定地域内の複数の計測地点における当該対象の数を実測可能な複数の実数計測手段から取得された計測結果と、当該存在数分布とから、当該計測地点に係る正解の拡大係数を決定する正解拡大係数決定手段と、
当該所定地域内の複数の地点における当該地点毎に、当該地点又は当該地点を含む区域を特徴づける特徴量を生成する特徴量生成手段と、
当該正解の拡大係数を用いて構築された拡大係数推定モデルに対し、当該特徴量を入力し、該拡大係数推定モデルの出力から当該地点の拡大係数を推定する拡大係数推定手段と、
当該存在数分布と推定された拡大係数とに基づき、当該所定地域内の複数の地点の各々における当該対象の存在する数を決定する対象存在分布決定手段と
してコンピュータを機能させることを特徴とする対象分布推定プログラム。
【請求項2】
前記特徴量生成手段は、
取得された当該所定地域の地図情報に基づき、当該地点又は当該地点を含む区域に係る特定の事物又は現象に係る情報から、当該地点又は当該地点を含む区域の特徴量を生成する処理、
当該地点又は当該地点を含む区域に位置する端末が付された対象の属性情報であって、当該測位結果の履歴情報から推定された、又は当該対象の登録された情報から取得された属性情報から、当該地点又は当該地点を含む区域の特徴量を生成する処理、及び
当該地点を含む区域を表すコードを単語とみなして、対象の移動履歴を表す当該コードの時系列データを文とみなし、単語間の類似性を学習した自然言語処理モデルを用いて、当該区域の特徴量を生成する処理
のうちの少なくとも1つを実施して当該特徴量を生成することを特徴とする請求項1に記載の対象分布推定プログラム。
【請求項3】
前記存在数分布決定手段は、第1の所定期間に蓄積された当該測位結果から、通常の存在する数の分布としての通常存在数分布を決定し、また、第1の所定期間よりも短い第2の所定期間であって当該分布の推定時点の直前となる第2の所定期間で取得された当該測位結果、及び第1の所定期間に蓄積された当該測位結果から、当該分布の推定時点での又は当該推定時点の直前での存在する数の分布としての推定時存在数分布を決定し、
前記正解拡大係数決定手段は、当該計測結果と当該通常存在数分布とから、当該計測地点に係る正解の拡大係数を決定し、
前記対象存在分布決定手段は、当該推定時存在数分布と推定された拡大係数とに基づき、当該所定地域内の複数の地点の各々における当該対象の存在する数を決定する
ことを特徴とする請求項1又は2に記載の対象分布推定プログラム。
【請求項4】
前記存在数分布決定手段は、第1の所定期間として、予め設定された月、日、曜日、平日・休日、及び/又は時間帯に係る期間種別であって、当該分布の推定時点が属する期間種別に該当する期間を設定することを特徴とする請求項3に記載の対象分布推定プログラム。
【請求項5】
前記存在数分布決定手段は、第1の所定期間に蓄積された当該測位結果である端末の位置及び時点を含む情報を用い、カーネル密度推定(Kernel Density Estimation)を行って、位置と第1の所定期間内又は設定された期間種別の期間内における時点との関数である当該通常存在数分布を決定することを特徴とする請求項3又は4に記載の対象分布推定プログラム。
【請求項6】
前記存在数分布決定手段は、
当該測位結果に係る測位時点が第1の所定期間内においてより新しい時点であるほどより大きい重みを当該測位結果に付与して、当該通常存在数分布を決定する処理、及び
当該測位結果に係る測位時点が第1の所定期間及び第2の所定期間内においてより新しい時点であるほどより大きい重みを当該測位結果に付与して、当該推定時存在数分布を決定する処理
のうちの一方又は両方を実施することを特徴とする請求項3から5のいずれか1項に記載の対象分布推定プログラム。
【請求項7】
前記存在数分布決定手段は、
第1の所定期間に蓄積された測位結果毎に、当該測位結果に含まれる又は当該測位結果から決定される測位誤差の単調増加関数となる広さを有する領域内に、当該測位結果に相当する少なくとも1つ存在点であってその合計が1となる重みの付与された少なくとも1つの存在点を設定し、当該存在点から当該通常存在数分布を決定する処理、及び
第1の所定期間及び第2の所定期間で取得された測位結果毎に、当該測位結果に含まれる又は当該測位結果から決定される測位誤差の単調増加関数となる広さを有する領域内に、当該測位結果に相当する少なくとも1つの存在点であってその合計が1となる重みの付与された少なくとも1つの存在点を設定し、当該存在点から当該推定時存在数分布を決定する処理
のうちの一方又は両方を実施することを特徴とする請求項3から6のいずれか1項に記載の対象分布推定プログラム。
【請求項8】
前記存在数分布決定手段は、
第1の所定期間及び第2の所定期間に含まれる複数のサブ期間におけるサブ期間毎に、当該サブ期間で取得された当該測位結果から、当該サブ期間の代表時点での存在する数の分布としてのサブ期間存在数分布を決定し、
当該代表時点での当該サブ期間存在数分布を推定時点での存在数分布へ外挿し、外挿して得られた存在数分布を当該推定時存在数分布に決定する
ことを特徴とする請求項3から7のいずれか1項に記載の対象分布推定プログラム。
【請求項9】
所定地域における複数の対象の分布を推定する対象分布推定装置であって、
当該対象に付された端末についての所定期間に取得された測位結果から、当該所定地域における当該対象の存在する数の分布としての存在数分布を決定する存在数分布決定手段と、
当該所定地域内の複数の計測地点における当該対象の数を実測可能な複数の実数計測手段から取得された計測結果と、当該存在数分布とから、当該計測地点に係る正解の拡大係数を決定する正解拡大係数決定手段と、
当該所定地域内の複数の地点における当該地点毎に、当該地点又は当該地点を含む区域を特徴づける特徴量を生成する特徴量生成手段と、
当該正解の拡大係数を用いて構築された拡大係数推定モデルに対し、当該特徴量を入力し、該拡大係数推定モデルの出力から当該地点の拡大係数を推定する拡大係数推定手段と、
当該存在数分布と推定された拡大係数とに基づき、当該所定地域内の複数の地点の各々における当該対象の存在する数を決定する対象存在分布決定手段と
を有することを特徴とする対象分布推定装置。
【請求項10】
所定地域における複数の対象の分布を推定する対象分布推定システムであって、
当該対象に付された端末についての所定期間に取得された測位結果から、当該所定地域における当該対象の存在する数の分布としての存在数分布を決定する存在数分布決定手段と、
当該所定地域内の複数の計測地点における当該対象の数を実測可能な複数の実数計測手段から取得された計測結果と、当該存在数分布とから、当該計測地点に係る正解の拡大係数を決定する正解拡大係数決定手段と、
当該所定地域内の複数の地点における当該地点毎に、当該地点又は当該地点を含む区域を特徴づける特徴量を生成する特徴量生成手段と、
当該正解の拡大係数を用いて構築された拡大係数推定モデルに対し、当該特徴量を入力し、該拡大係数推定モデルの出力から当該地点の拡大係数を推定する拡大係数推定手段と、
当該存在数分布と推定された拡大係数とに基づき、当該所定地域内の複数の地点の各々における当該対象の存在する数を決定する対象存在分布決定手段と
を有することを特徴とする対象分布推定システム。
【請求項11】
所定地域における複数の対象の分布を推定するコンピュータによって実施される対象分布推定方法であって、
当該対象に付された端末についての所定期間に取得された測位結果から、当該所定地域における当該対象の存在する数の分布としての存在数分布を決定するステップと、
当該所定地域内の複数の計測地点における当該対象の数を実測可能な複数の実数計測手段から取得された計測結果と、当該存在数分布とから、当該計測地点に係る正解の拡大係数を決定し、また、当該所定地域内の複数の地点における当該地点毎に、当該地点又は当該地点を含む区域を特徴づける特徴量を生成するステップと、
当該正解の拡大係数を用いて構築された拡大係数推定モデルに対し、当該特徴量を入力し、該拡大係数推定モデルの出力から当該地点の拡大係数を推定するステップと、
当該存在数分布と推定された拡大係数とに基づき、当該所定地域内の複数の地点の各々における当該対象の存在する数を決定するステップと
を有することを特徴とする対象分布推定方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、所定の地域における対象の分布、例えば人口分布を推定する技術に関する。
【背景技術】
【0002】
所定の地域における人口分布(又は時間変化する分布を含む意味での人流)を、高解像度化したデータとして把握することは、マーケティング、交通網の効率的運用(渋滞回避等)や、公共施設等の整備を含む都市計画、さらには感染症対策等にとって非常に重要となる。
【0003】
ここで人口分布(人流)データを高解像度化するとは、人口(人流)の集計を行う単位である地域メッシュ(以下、メッシュと略称)のサイズをより小さくすることである。この点、従来人口分布の元データとして利用されてきた(ユーザの所持する)携帯端末の測位データ群は、例えば緯度経度座標における点に係るデータ群であって、その意味では解像度は最大となっている。しかし当然ながら、このような測位データ群だけでは対象地域における全での人間の位置情報を得ることはできない。
【0004】
したがって、実際には携帯端末の測位データ群から全人口への拡大推計を行って人口分布データを生成しなければならない。ただし携帯端末の測位データ群だけから単純に拡大推計を行うとすると、例えば測位データの存在しないメッシュについては(0人を何倍しても0人であることから)拡大推計による推定値の誤差が大きくなってしまう。また特に都市部では、密集する建造物等の影響によりGPS(Global Positioning System)測位データは元々、大きな誤差を有している可能性が少なくない。
【0005】
その結果、全人間の分布の全体的な傾向を正しく反映した人口分布(人流)データを生成するためには、メッシュのサイズを大きく、すなわち解像度を低く設定して、各メッシュが測位データを含まない事態や、本来有するべき(有すべきでない)測位データを有していない(有している)事態を極力回避するようにせざるを得なかったのである。ここで図6に、まばらな端末位置情報(測位データ)から、より小さなメッシュ(高解像度メッシュ)を用いて人口分布ヒートマップを生成した場合、かえってその精度(正確度)が大幅に低下する様子を模式的に示している。
【0006】
このように困難であった人口分布(人流)の高解像度化を図る技術として、例えば非特許文献1には、人流の空間相関や天候等の外部要因の影響をモデル化し、人口の総和を制約条件としつつ、高解像度な人流マップをAI(Artificial Intelligence)によって推定する技術が開示されている。
【0007】
また、非特許文献2には、空間方向の超解像化を図るAIモデルと時間方向の超解像化を図るAIモデルとを組み合わせることによって、高解像度の人流データを生成する技術が開示されている。
【0008】
さらに、非特許文献3は、(a)スマートフォン位置情報と(b)ビーコンによる位置情報とを組み合わせて詳細な人流データを生成する技術が開示されている。この技術では、(a)のスマートフォン位置情報を「解像度は低いが、ある広域エリアの人流のボリューム(人口)が分かるデータ」と位置づけ、また、(b)のビーコンによる位置情報を「一部のユーザのみのデータであるが、詳細な位置情報が得られるデータ」と位置付けて、トータルの人口が(a)のスマートフォン位置情報の数となるように、(b)のビーコンによる位置情報のデータを拡大推計している。
【先行技術文献】
【非特許文献】
【0009】
【非特許文献1】Fan Zhou, Liang Li, Ting Zhong, Goce Trajcevski, Kunpeng Zhang, Jiahao Wang, “Enhancing Urban Flow Maps via Neural ODEs”, Proceedings of the Twenty-Ninth International Joint Conference on Artificial Intelligence (IJCAI2020) Main track. Pages 1295-1302, 2020年
【非特許文献2】Zong, Z., Feng, J., Liu, K., Shi, H., & Li, Y., “DeepDPM: Dynamic Population Mapping via Deep Neural Network”, Proceedings of the AAAI Conference on Artificial Intelligence, 33(01), pp.1294-1301. 2019年
【非特許文献3】「明日の混雑予報ポータル」,[online],[2022年3月10日検索]、インターネット<URL: https://prtimes.jp/main/html/rd/p/000000004.000090522.html>
【発明の概要】
【発明が解決しようとする課題】
【0010】
しかしながら、上述した非特許文献1~3に開示されたような従来技術は、人口分布(人流)データの高解像度化について依然、問題を抱えているのである。
【0011】
例えば、非特許文献1及び2に開示された技術はいずれも、推定対象エリアにおける高解像度の人流の正解データが取得されることを前提としている。すなわち、AIモデルの訓練に高解像度の正解データを必要とする。しかしながら実際には、そのような正解データの取得されるケースは相当に少なく、したがってこの前提は多くの場合に、非現実的なものとなっている。例えばスマートフォンのGPS測位データ群は、正解とすべき全人口の位置情報のうちで「対象となる通信事業者と契約をしており、GPS搭載機種を保有し、且つGPS測位データの提供に同意しているユーザ」の位置情報だけを提供するのであり、人流(人口分布)の正解データとすることは明らかにできないのである。
【0012】
また、非特許文献3に開示された技術は、スポット的にしか収集されない(b)のビーコンによる位置情報(位置データ)の間を補間処理によって補っており、推定される位置における精度の低下が懸念される。さらに、(a)のスマートフォン位置情報を「人流のボリューム(人口)が分かるデータ」と捉えていて、例えばこの情報に対し単純な一律の拡大推計を施しているにすぎない。その結果、推定される人数における精度の低下が懸念されるのである。
【0013】
そこで、本発明は、対象の実分布に係る正解データに頼ることなく、高い解像度の対象の分布を、より高い精度(正確度)で推定することができる対象分布推定プログラム、装置、システム及び方法を提供することを目的とする。
【課題を解決するための手段】
【0014】
本発明によれば、所定地域における複数の対象の分布を推定するコンピュータを機能させる対象分布推定プログラムであって、
当該対象に付された端末についての所定期間に取得された測位結果から、当該所定地域における当該対象の存在する数の分布としての存在数分布を決定する存在数分布決定手段と、
当該所定地域内の複数の計測地点における当該対象の数を実測可能な複数の実数計測手段から取得された計測結果と、当該存在数分布とから、当該計測地点に係る正解の拡大係数を決定する正解拡大係数決定手段と、
当該所定地域内の複数の地点における当該地点毎に、当該地点又は当該地点を含む区域を特徴づける特徴量を生成する特徴量生成手段と、
当該正解の拡大係数を用いて構築された拡大係数推定モデルに対し、当該特徴量を入力し、該拡大係数推定モデルの出力から当該地点の拡大係数を推定する拡大係数推定手段と、
当該存在数分布と推定された拡大係数とに基づき、当該所定地域内の複数の地点の各々における当該対象の存在する数を決定する対象存在分布決定手段と
してコンピュータを機能させる対象分布推定プログラムが提供される。
【0015】
この本発明による対象分布推定プログラムにおいて、特徴量生成手段は、
取得された当該所定地域の地図情報に基づき、当該地点又は当該地点を含む区域に係る特定の事物又は現象に係る情報から、当該地点又は当該地点を含む区域の特徴量を生成する処理、
当該地点又は当該地点を含む区域に位置する端末が付された対象の属性情報であって、当該測位結果の履歴情報から推定された、又は当該対象の登録された情報から取得された属性情報から、当該地点又は当該地点を含む区域の特徴量を生成する処理、及び
当該地点を含む区域を表すコードを単語とみなして、対象の移動履歴を表す当該コードの時系列データを文とみなし、単語間の類似性を学習した自然言語処理モデルを用いて、当該区域の特徴量を生成する処理
のうちの少なくとも1つを実施して当該特徴量を生成することも好ましい。
【0016】
また、本発明による対象分布推定プログラムの一実施形態として、
存在数分布決定手段は、第1の所定期間に蓄積された当該測位結果から、通常の存在する数の分布としての通常存在数分布を決定し、また、第1の所定期間よりも短い第2の所定期間であって当該分布の推定時点の直前となる第2の所定期間で取得された当該測位結果、及び第1の所定期間に蓄積された当該測位結果から、当該分布の推定時点での又は当該推定時点の直前での存在する数の分布としての推定時存在数分布を決定し、
正解拡大係数決定手段は、当該計測結果と当該通常存在数分布とから、当該計測地点に係る正解の拡大係数を決定し、
対象存在分布決定手段は、当該推定時存在数分布と推定された拡大係数とに基づき、当該所定地域内の複数の地点の各々における当該対象の存在する数を決定する
ことも好ましい。
【0017】
さらに上記の実施形態において、存在数分布決定手段は、第1の所定期間として、予め設定された月、日、曜日、平日・休日、及び/又は時間帯に係る期間種別であって、当該分布の推定時点が属する期間種別に該当する期間を設定することも好ましい。
【0018】
また上記の実施形態において、存在数分布決定手段は、第1の所定期間に蓄積された当該測位結果である端末の位置及び時点を含む情報を用い、カーネル密度推定(Kernel Density Estimation)を行って、位置と第1の所定期間内又は設定された期間種別の期間内における時点との関数である通常存在数分布を決定することも好ましい。
【0019】
さらに上記の実施形態において、存在数分布決定手段は、
当該測位結果に係る測位時点が第1の所定期間内においてより新しい時点であるほどより大きい重みを当該測位結果に付与して、当該通常存在数分布を決定する処理、及び
当該測位結果に係る測位時点が第1の所定期間及び第2の所定期間内においてより新しい時点であるほどより大きい重みを当該測位結果に付与して、当該推定時存在数分布を決定する処理
のうちの一方又は両方を実施することも好ましい。
【0020】
また上記の実施形態において、存在数分布決定手段は、
第1の所定期間に蓄積された測位結果毎に、当該測位結果に含まれる又は当該測位結果から決定される測位誤差の単調増加関数となる広さを有する領域内に、当該測位結果に相当する少なくとも1つ存在点であってその合計が1となる重みの付与された少なくとも1つの存在点を設定し、当該存在点から当該通常存在数分布を決定する処理、及び
第1の所定期間及び第2の所定期間で取得された測位結果毎に、当該測位結果に含まれる又は当該測位結果から決定される測位誤差の単調増加関数となる広さを有する領域内に、当該測位結果に相当する少なくとも1つの存在点であってその合計が1となる重みの付与された少なくとも1つの存在点を設定し、当該存在点から当該推定時存在数分布を決定する処理
のうちの一方又は両方を実施することも好ましい。
【0021】
さらに上記の実施形態において、存在数分布決定手段は、
第1の所定期間及び第2の所定期間に含まれる複数のサブ期間におけるサブ期間毎に、当該サブ期間で取得された当該測位結果から、当該サブ期間の代表時点での存在する数の分布としてのサブ期間存在数分布を決定し、
当該代表時点での当該サブ期間存在数分布を推定時点での存在数分布へ外挿し、外挿して得られた存在数分布を当該推定時存在数分布に決定する
ことも好ましい。
【0022】
本発明によれば、また、所定地域における複数の対象の分布を推定する対象分布推定装置であって、
当該対象に付された端末についての所定期間に取得された測位結果から、当該所定地域における当該対象の存在する数の分布としての存在数分布を決定する存在数分布決定手段と、
当該所定地域内の複数の計測地点における当該対象の数を実測可能な複数の実数計測手段から取得された計測結果と、当該存在数分布とから、当該計測地点に係る正解の拡大係数を決定する正解拡大係数決定手段と、
当該所定地域内の複数の地点における当該地点毎に、当該地点又は当該地点を含む区域を特徴づける特徴量を生成する特徴量生成手段と、
当該正解の拡大係数を用いて構築された拡大係数推定モデルに対し、当該特徴量を入力し、該拡大係数推定モデルの出力から当該地点の拡大係数を推定する拡大係数推定手段と、
当該存在数分布と推定された拡大係数とに基づき、当該所定地域内の複数の地点の各々における当該対象の存在する数を決定する対象存在分布決定手段と
を有する対象分布推定装置が提供される。
【0023】
本発明によれば、さらに、所定地域における複数の対象の分布を推定する対象分布推定システムであって、
当該対象に付された端末についての所定期間に取得された測位結果から、当該所定地域における当該対象の存在する数の分布としての存在数分布を決定する存在数分布決定手段と、
当該所定地域内の複数の計測地点における当該対象の数を実測可能な複数の実数計測手段から取得された計測結果と、当該存在数分布とから、当該計測地点に係る正解の拡大係数を決定する正解拡大係数決定手段と、
当該所定地域内の複数の地点における当該地点毎に、当該地点又は当該地点を含む区域を特徴づける特徴量を生成する特徴量生成手段と、
当該正解の拡大係数を用いて構築された拡大係数推定モデルに対し、当該特徴量を入力し、該拡大係数推定モデルの出力から当該地点の拡大係数を推定する拡大係数推定手段と、
当該存在数分布と推定された拡大係数とに基づき、当該所定地域内の複数の地点の各々における当該対象の存在する数を決定する対象存在分布決定手段と
を有する対象分布推定システムが提供される。
【0024】
本発明によれば、さらにまた、所定地域における複数の対象の分布を推定するコンピュータによって実施される対象分布推定方法であって、
当該対象に付された端末についての所定期間に取得された測位結果から、当該所定地域における当該対象の存在する数の分布としての存在数分布を決定するステップと、
当該所定地域内の複数の計測地点における当該対象の数を実測可能な複数の実数計測手段から取得された計測結果と、当該存在数分布とから、当該計測地点に係る正解の拡大係数を決定し、また、当該所定地域内の複数の地点における当該地点毎に、当該地点又は当該地点を含む区域を特徴づける特徴量を生成するステップと、
当該正解の拡大係数を用いて構築された拡大係数推定モデルに対し、当該特徴量を入力し、該拡大係数推定モデルの出力から当該地点の拡大係数を推定するステップと、
当該存在数分布と推定された拡大係数とに基づき、当該所定地域内の複数の地点の各々における当該対象の存在する数を決定するステップと
を有する対象分布推定方法が提供される。
【発明の効果】
【0025】
本発明の対象分布推定プログラム、装置、システム及び方法によれば、対象の実分布に係る正解データに頼ることなく、高い解像度の対象の分布を、より高い精度(正確度)で推定することができる。
【図面の簡単な説明】
【0026】
図1】本発明による対象分布推定装置の一実施形態における機能構成を示す機能ブロック図である。
図2】本発明に係る通常存在分布決定処理の他の実施形態を説明するための模式図である。
図3】本発明に係る通常存在分布決定処理の更なる他の実施形態を説明するための模式図である。
図4】本発明に係る推定時存在分布決定処理の他の実施形態を説明するための模式図である。
図5】本発明による対象分布推定方法における一実施形態の概略を示す模式図である。
図6】高解像度メッシュを用いた人口分布ヒートマップの生成における従来の問題点を説明するための模式図である。
【発明を実施するための形態】
【0027】
以下、本発明の実施形態について、図面を用いて詳細に説明する。
【0028】
[対象分布推定装置]
図1は、本発明による対象分布推定装置の一実施形態における機能構成を示す機能ブロック図である。
【0029】
図1に示した通信設備装置1は勿論、通信設備としての機能(例えば中継機能)を果たす装置であるが、本発明による対象分布推定装置の一実施形態にもなっている。すなわち通信設備装置1は、所定地域(例えば47都道府県の全国)における複数の対象の分布、本実施形態では多数の人間の分布(すなわち人口分布)を推定し、推定結果としての人口分布データ(例えば人口分布グラフや人口ヒートマップ)を出力する装置となっている。
【0030】
具体的に、通信設備装置1は、
(a)人間(対象)に付された端末2(例えば携帯されたスマートフォン)についての測位結果である「端末測位結果」、例えば(a1)端末2に搭載されているGPS(Global Positioning System)機能からのGPS測位データ、(a2)基地局3や基地局機能を備えたスマートポール4を用いた基地局測位方式による基地局測位データ、及び、(a3)端末2がWi-Fi(登録商標)等の無線LAN(Local Area Network)通信機能を備えている場合における無線LANのアクセスポイントによる測位データのうちの少なくとも1つ、並びに、
(b)所定地域(例えば全国)内の複数の計測地点における人間(対象)の数を実測可能な複数の実数計測手段から取得された「実数計測結果」、本実施形態ではスマートポール4から取得された人数(カウント数)データ
を取得し、これらのデータに基づいて所定地域(全国)における人口分布を推定する。
【0031】
このような推定を実施するため、通信設備装置1は、
(A)所定期間に取得された「端末測位結果」から、所定地域(例えば全国)における対象の存在する数の分布としての「存在数分布」を決定する存在数分布決定部111と、
(B)これら複数の計測地点における「実数計測結果」と「存在数分布」とから、当該計測地点に係る正解の拡大係数である「正解拡大係数」を決定する正解拡大係数決定部112と、
(C)所定地域(全国)内の複数の地点における当該地点毎に、当該地点又は当該地点を含む区域を特徴づける「特徴量」を生成する特徴量生成部113と、
(D)「正解拡大係数」を用いて構築された「拡大係数推定モデル」に対し、「特徴量」を入力し、「拡大係数推定モデル」の出力から当該地点の「拡大係数」を推定する拡大係数推定部115と、
(E)「存在数分布」と推定された「拡大係数」とに基づき、所定地域(全国)内の複数の地点の各々における対象(人間)の存在する数(存在人数)を決定する対象存在分布決定部116と
を有することを特徴とする。ここで上記(E)の対象存在分布決定部116は本実施形態において、決定した各地点における存在人数から、推定結果としての人口分布データ(例えば人口分布グラフや人口ヒートマップ)を生成し出力するのである。
【0032】
このように通信設備装置1は、実数計測手段(スマートポール4)から取得された「実数計測結果」を用いて「正解拡大係数」を決定し、この「正解拡大係数」によって構築された「拡大係数推定モデル」を用いて「拡大係数」を推定し、これにより各地点の対象存在数(存在人数)を決定する。
【0033】
ここで、計測地点の数が限定されている状況であっても、所定地域(全国)内の複数の地点を、予め十分な数だけ設定することによって、高い解像度の対象分布データ(人口分布データ)を得ることができる。また、「正解拡大係数」は「実数計測結果」と「存在数分布」とから決定されているので、適切な「特徴量」を設定することによって、「拡大係数推定モデル」の出力に係る「拡大係数」の精度(正確度)を、より高いものにすることも可能となる。またさらに言えば、この「拡大係数」は、例えば(人口)/(位置情報提供許諾ユーザ数)といったような従来の単純且つ一律なものとは異なり、その地点における(実人数に影響を及ぼす)特徴を反映したより好適なものとなっているのである。
【0034】
以上、通信設備装置1によれば、対象(人間)の実分布に係る正解データに頼ることなく、高い解像度の対象(人間)の分布を、より高い精度(正確度)で推定することが可能となるのである。
【0035】
ここで、本実施形態における実数計測手段であるスマートポール4は、例えば歩道沿いに設置されていて、人流解析用のカメラ及び画像認識機能を備えており、その設置地点周辺に存在している(例えば設置地点を通過する)人間(対象)の数をカウントし、例えば計測時間区間毎の人数(カウント数,実数計測結果)を出力可能となっている。また、スマートポール4は、携帯電話通信網の基地局機能や、Wi-Fi(登録商標)等の無線LANのアクセスポイント機能、さらにはデジタルサイネージ機能を備えたものであってもよい。ちなみに、例えば計測地点毎に設置された人感センサやカメラ等、スマートポール以外の実数計測手段を用いて「実数計測結果」を得ることも可能である。
【0036】
また、本実施形態においてその分布を求める対象は「人間」となっており、以下の説明でも対象を「人間」として人口分布(人流)を推定するものとするが、本発明に係る対象は勿論、「人間」に限定されるものではない。すなわち、「端末測位結果」の得られる端末2が付された対象であって、何らかの実数計測手段でその数が計測可能であれば、種々様々なものが本発明に係る対象に採用可能である。例えば、少なくとも一部の自動車に端末2が搭載されていて、且つ所定地域内の複数地点に(カメラ及び画像認識機能を備えた)トラフィックカウンタ、(道路沿いに設置された)車体感知センサや、さらには監視カメラ等が設置されているならば、これらのうちの少なくとも1つを実数計測手段として、「自動車」を本発明に係る対象とすることもできる。
【0037】
[装置機能構成,対象分布推定システム・プログラム・方法]
同じく図1の機能ブロック図によれば、本発明による対象分布推定装置の一実施形態としての通信設備装置1は、通信インタフェース部101と、測位結果保存部102と、実数計測結果保存部103と、地図情報保存部104と、属性情報保存部105と、ユーザインタフェース部106と、プロセッサ・メモリ(メモリ機能を備えた演算処理系)とを有する。
【0038】
ここで、このプロセッサ・メモリは、本発明による対象分布推定プログラムの一実施形態を保存しており、またコンピュータ機能を有していて、この対象分布推定プログラムを実行することによって、対象分布推定処理を実施する。このことから、通信設備装置1は、通信設備ではない対象分布推定処理専用の装置であってもよく、さらに、本発明による対象分布推定プログラムを搭載した、クラウドサーバ、非クラウドサーバ、パーソナル・コンピュータ(PC)、ノート型若しくはタブレット型コンピュータや、さらにはスマートフォン等の携帯端末とすることもできる。
【0039】
さらに、上記のプロセッサ・メモリは、通常存在分布決定部111a及び推定時存在分布決定部111bを含む存在数分布決定部111と、正解拡大係数決定部112と、特徴量生成部113と、モデル構築部114と、拡大係数推定部115と、対象存在分布決定部116と、通信制御部121とを有する。ここで以上に述べた機能構成部は、プロセッサ・メモリに保存された対象分布推定プログラムの実行によって具現する機能と捉えることができる。また、図1における通信設備装置1の機能構成部間を矢印で接続して示した処理の流れは、本発明による対象分布推定方法の一実施形態としても理解される。
【0040】
ちなみに、存在数分布決定部111、正解拡大係数決定部112、特徴量生成部113、モデル構築部114、拡大係数推定部115、及び対象存在分布決定部116のうちの少なくとも1つは、別の装置の機能構成部となっていて、複数の装置(例えば複数のサーバ)全体で本対象分布推定機能を果たすものとすることもできる。この場合、これら複数の装置全体が、本発明による対象分布推定システムを構成する。また、このうちモデル構築部114は、本対象分布推定装置・システムとは別の装置で担われていて、本対象分布推定装置・システムは、この別の装置から学習済みの拡大係数推定モデルを取得するものであってもよい。
【0041】
以下、通信設備装置1における通信制御機能(例えば中継機能)の説明を省略し、本発明に係る対象分布推定処理機能のみの説明を行う。同じく図1において、測位結果保存部102は、上述した端末2の端末測位結果(GPS測位データ等)を、端末2から通信インタフェース部101及び通信制御部121を介して取得し、保存・管理する。ここで、この端末測位結果は、通信事業者と契約しており且つ端末位置情報の提供を許諾したユーザのみについての測位データであり、推定する分布の対象とすべき全人口に対し、その一部の人間(ユーザ)だけのデータとなっている。
【0042】
また、実数計測結果保存部103は、上述した実数計測結果、本実施形態ではスマートポール4から出力された人数(カウント数)データを、スマートポール4から通信インタフェース部101及び通信制御部121を介して取得し、保存・管理する。ここで、この実数計測結果は、スマートポール4の設置された計測地点周辺に存在する(例えば計測地点を通過する)全ての人間の数を精度よく計測した結果であるが、その数(計測地点の数)は限定されたものとなっている(任意の地点について取得されるものではない)。
【0043】
<存在数分布決定手段:通常存在分布決定部>
同じく図1の機能ブロック図において、存在数分布決定部111の通常存在分布決定部111aは、第1所定期間(例えば1か月間)に蓄積された端末測位結果(測位データ)を測位結果保存部102から取得し、取得した端末測位結果から、通常の(すなわち平時の定常的な)存在する数の分布としての「通常存在数分布」を決定する。
【0044】
ここで、長期の第1所定期間(例えば1か月間)に蓄積された端末測位結果を用いるのは、端末測位結果が、上述したように全人口ではなく一部のユーザのみの測位データとなっており、特に人口の少ない郊外・地方においては、多くの地点において測位データが得られず、その結果、当該地点では人口が0人となってしまうことによる。すなわち、長期の第1所定期間(例えば1か月間)を設定することで、例えば1か月に1人でも計測することができれば、1日あたりの人数を例えば約0.03(≒1/30)人といったように0を超える有限値にすることができる。その結果、地点毎の例えば人間の多さの濃淡をより正確に把握することが可能となるのである。ちなみにこれは、暗闇でカメラ撮影を行う際、露光時間(光の蓄積時間)を長くしてより多くの光をカメラセンサに取り込み、より正確な濃淡を有するカメラ画像を得ようとすることと同様のやり方と言える。
【0045】
通常存在分布決定部111aは、取得した(蓄積された)測位データ群を存在分布空間内の点群とみなし、本実施形態において、有限の標本点から全体の分布を推定する公知の手法であるカーネル密度推定(KDE,Kernel Density Estimation)を用いて、所定地域(全国)における地点(例えば緯度・経度)xの関数である通常存在数分布CEA(x)を決定する。具体的に通常存在数分布CEA(x)は、次式
(1) CEA(x)=PA(x)×VA(x)
ここで、PA(x)=(nh)-1Σi=1 n K((x-xi)/h)
によって決定される。
【0046】
ここで、x1, x2, ・・・, xnは、標本点としてのn個の測位データであり、例えばxi(i=1,2,・・,n)はxi=(緯度,経度)とすることができる。hはバンド幅(平滑化パラメータ)である。また、PA(x)は、第1所定期間における人間(対象)の存在確率密度分布となっている。さらに、Kはカーネル関数であり、例えば次式(2)の標準的な(平均がゼロであって分散が1である)ガウス関数とすることができる。
(2) K(x')=(2π)-0.5exp(-x'2/2)
【0047】
さらにまた上式(1)において、VA(x)は、第1所定期間に蓄積された測位データ群の数を用いて決定されたボリュームであって、確率密度値(PA(x)の値)を人数(対象の数)に変換する際のいわば"変換率"となっている。すなわち通常存在数分布CEA(x)は、存在確率密度分布PA(x)にこのボリュームVA(x)を掛けたものであって、まさに測位データに係る人数(対象数)の分布とみなすことができる。また、地点xでの通常存在数分布CEA(x)の値(通常存在数)は、地点xにおける(測位データに係る)人数の期待値となっているのである。
【0048】
このように通常存在数分布CEA(x)を決定することによって、所定地域(全国)における任意の地点xの人数を得ることが可能となる。ちなみにKDEは、当該分野のエンジニアや研究開発者の多くに利用されている、MATLAB(登録商標)等の数値解析・プログラミングプラットフォームの多くに、標準的な関数モデルとして実装されている。また勿論、有限の標本点から全体の分布を推定可能とする関数ならば、当該関数をKDEの代わりに使用して、通常存在数分布を決定してもよい。
【0049】
また、通常存在分布決定部111aは、第1所定期間として、予め設定された月、日、曜日、平日・休日、及び時間帯のうちの少なくとも1つに係る期間種別であって、人口分布の推定時点が属する期間種別に該当する期間を設定することも好ましい。例えば人口分布の推定時点が「水曜日の8時台」の時点ならば、第1所定期間を「過去M(Mは正の整数)か月の水曜日の8時台」に設定してもよい。これにより、あるエリアでは「水曜日の8時台」には通勤・通学者が週のうちで最大となるといったような期間種別特有の事情を通常存在数分布に反映させ、より精度(正確度)の高い人口分布推定を行うことも可能となる。なお、必要となる期間種別毎に予め、当該期間種別に係る通常存在数分布を準備しておいてもよい。
【0050】
さらに、通常存在分布決定部111aは、測位データxi(i=1,2,・・,n)として、
(3) xi=(緯度, 経度, 時刻(時点))
を採用し、3次元の存在分布空間における通常存在数分布CEA(x)を決定してもよい。ここで、「時刻(時点)」の範囲(定義域)を第1所定期間全体とすることもでき、予め設定された期間種別の期間としてもよい。これにより、位置(緯度,経度)と、第1の所定期間内又は設定された期間種別の期間内における時刻(時点)との関数である通常存在数分布CEA(x)を得ることができる。
【0051】
例えば、「時刻(時点)」の範囲(定義域)を第1の所定期間(例えば8月)における「水曜日の8時台」の期間として、この期間内については、時刻(時点)の違いによる対象数の違いを連続的に表現可能な通常存在数分布を得ることも可能となる。この場合、人口分布の推定時点の期間種別に合わせて、予め多数の通常存在数分布を準備しておく必要がなく、例えば、想定される期間種別の期間を範囲(定義域)に含む通常存在数分布を1つ準備しておくだけで済むことも少なくないのである。
【0052】
また、通常存在分布決定部111aは、測位データxi(i=1,2,・・,n)の測位時点が第1所定期間内においてより新しい時点であるほど、より大きい重みをこの測位データxiに付与して、通常存在数分布CEA(x)を決定することも好ましい。以下、図2(通常存在分布決定処理の他の実施形態を説明するための模式図)を用いて、この実施形態の説明を行う。
【0053】
図2に示したように、通常存在分布決定部111aは、第1所定期間M(時刻(時点)t0から時刻(時点)t1までの期間)に蓄積された測位データxi(i=1,2,・・,n)から通常存在数分布CEA(x)を決定する際、測位データxiの測位時刻(測位時点)tmが新しい時点であるほど、より大きい重みをこの測位データxiに付与する。具体的には、測位データを(標本点として)KDEモデルに入力して上式(1)の通常存在数分布CEA(x)を生成・決定する際、測位データxi(i=1,2,・・,n)に、次式
(4) WT=(tm-t0)/(t1-t0)
をもって算出される重みWTをかけたデータWT×xiを入力してもよい。これにより、より現状に近い通常存在数分布を求めることができ、最終的な人口分布推定の精度を向上させることも可能となる。なお、重みは勿論、上式(4)のものに限定されず、測位時刻(測位時点)tmの単調増加関数となるものならば他の様々な形の重みを採用することができる。
【0054】
またさらに、通常存在分布決定部111aは、第1所定期間に蓄積された測位データxi(i=1,2,・・,n)(端末測位結果)毎に、当該測位データに含まれる又は当該測位データから決定される測位誤差の単調増加関数となる広さを有する領域(例えば測位誤差を半径とする円領域)内に、当該測位データに相当するW(Wは正の整数)個の存在点であってその合計が1となる「重み」の付与されたW個の存在点(標本点)を設定し、当該存在点(標本点)から通常存在数分布を決定することも好ましい。
【0055】
ここで測位誤差は、取得される測位データに通常付与されているものを用いることができる。または、取得した測位データがGPS測位データか、基地局測位データか、又はWi-Fi(登録商標)測位データかによって、予め適切な測位誤差を決めておいてもよい。以下、図3(通常存在分布決定処理の更なる他の実施形態を説明するための模式図)を用いて、この実施形態の説明を行う。
【0056】
図3に示したように、通常存在分布決定部111aは本実施形態において、1つの測位データについて、当該データの位置(緯度,経度)を中心とし、その測位誤差を半径とする円領域を設定し、この円領域の中に、各々重み1/Wの付与されたW個の存在点(標本点)を生成して配置する(例えば重み0.01の存在点を100個生成して配置する)。ここで、設定したW個の存在点(標本点)を、円領域の中心に近いほどより高い密度となるように配置することも好ましい。さらに、各重みの値を均一にせず、円領域の中心に近い存在点ほどより大きな重みが付与されるように(合計が1となる)重みを割り当てることも好ましい。
【0057】
いずれにしても、測位データ群をこの後、KDEモデルへ入力して通常存在数分布を決定することを考えると、信頼性の高い標本点の数を増やすことによって、決定される通常存在数分布の精度(正確度)を高めることも可能となる。ここで正しい標本点は、測位誤差が小さいほど、より小さい円領域内(におけるさらに中心近傍)に分布していると考えられるので、以上に述べた手法に従い標本点の数を増やすことによって、通常存在数分布の精度(正確度)がより向上することが期待されるのである。なお、円領域の中の存在点(標本点)の設定は、上記以外の公知のサンプリング手法によって行うことが可能である。
【0058】
<存在数分布決定手段:推定時存在分布決定部>
図1の機能ブロック図に戻って、存在数分布決定部111の推定時存在分布決定部111bは、
(a)上述した第1所定期間に蓄積された当該測位結果(測位データ)、及び
(b)第1所定期間よりも短い第2所定期間であって分布推定時点の直前となる第2所定期間(例えば現時点が分布推定時点として直近の過去1時間)で取得された端末測位結果(測位データ)
を測位結果保存部102から取得し、取得した端末測位結果から、分布推定時点での又は分布推定時点の直前での存在する数の分布としての「推定時存在数分布」を決定する。
【0059】
この推定時存在数分布は、上述したように全人口ではなく一部のユーザのみの測位データから生成・決定されるものであるが、分布推定時点(例えば現時点)における存在数分布に近いものとなっており、この後、拡大係数を掛けるべき存在数分布として好適なものとなっている。ここで、分布推定時点(現時点)付近の測位データだけでは標本点として少なすぎるため、測位間隔やデータ量に応じてある程度の期間(例えば直近1時間)を第2所定期間として設定して、この期間(さらには第1所定期間)の測位データを用いるのである。
【0060】
推定時存在分布決定部111bは本実施形態において、このように第1所定期間に蓄積された測位データ群、及び第2所定期間で取得された測位データ群を存在分布空間内の点群とみなし、上述した通常存在数分布CEA(x)の決定手順と同様、KDEを用いて、所定地域(全国)における地点(例えば緯度・経度)xの関数である推定時存在数分布CEB(x)を決定する。
【0061】
より具体的に、推定時存在分布決定部111bは、WA及びWBを予め適切に設定された「WA+WB=1」との条件を満たす重み分とし、また、TA及びTBをそれぞれ、第1所定期間の長さ(例えば、720時間(=24時間/日×30日))及び第2所定期間の長さ(例えば、1時間)として、
(a)第1所定期間に蓄積された測位データ群(点群)の個々の点(測位データ)に対し重みWA/TAを掛け、
(b)第2所定期間で取得された測位データ群(点群)の個々の点(測位データ)に対し重みWB/TBを掛け、
これらの重みの掛けられた測位データ群(x1, x2, ・・・, xn')を用いて、上式(1)と同様の次式
(5) CEB(x)=PB(x)×VB(x)
ここで、PB(x)=(n'h)-1Σi=1 n' K((x-xi)/h)
により推定時存在数分布CEB(x)を算出する。
【0062】
上式(5)において、PB(x)は、第1所定期間及び第2所定期間における人間(対象)の存在確率密度分布となっている。また、VB(x)は、第2所定期間で取得された測位データ群の数を用いて決定されたボリュームであって、確率密度値(PB(x)の値)を人数(対象数)に変換する際のいわば"変換率"となっている。すなわち推定時存在数分布CEB(x)は、存在確率密度分布PB(x)にこのボリュームVB(x)を掛けたものであって、まさに人数(対象の数)の分布とみなすことができる。また、地点xでの推定時存在数分布CEB(x)の値は、地点xにおける人数の期待値となっているのである。ちなみに、推定時存在数分布CEB(x)は、この後、分布推定時の人数(対象数)を推定するために用いられるものであるので、本実施形態においては(分布推定時に近いボリュームとしての)VB(x)を掛けることにより算出されている。
【0063】
また、推定時存在分布決定部111bは、
(a)第2所定期間(例えば直近3時間)に含まれる複数のサブ期間(例えば直近3時間における1時間毎の3つの期間)におけるサブ期間毎に、当該サブ期間で取得された測位データ(端末測位結果)から、当該サブ期間の代表時点(例えばサブ期間の中点となる時点)での存在数分布としての「サブ期間存在数分布」を決定し、
(b)当該代表時点での「サブ期間存在数分布」を分布推定時点での存在数分布へ外挿し、外挿して得られた存在数分布を推定時存在数分布に決定する
ことも好ましい。なお、上記(a)において、複数のサブ期間を、第1所定期間(例えば1か月間)及び第2所定期間の中から設定することも可能である。以下、図4(推定時存在分布決定処理の他の実施形態を説明するための模式図)を用いて、この実施形態の説明を行う。
【0064】
図4に示した例では、分布推定時点t(0)を含んでおり代表時点(図4ではサブ期間の中点)がt(-1)(<t(0))である第1サブ期間と、代表時点がt(-2)(<t(-1))である第2サブ期間とが設定されている。ここで、第2サブ期間における(KDEを用いて生成された)存在数分布CE-2(x)は概ね時点t(-2)でのデータであって、一方、第1サブ期間の(KDEを用いて生成された)存在数分布CE-1(x)は概ね時点t(-1)でのデータであると捉えられる。そこで、これら2つの時点の存在数分布から外挿処理を用いて近似的に分布推定時点t(0)での存在数分布を算出し、これを推定時存在数分布CEB(x)とするのである。
【0065】
具体的には、例えば次式
(6) CEB(x)=CE-1(x)+(t(0)-t(-1))×((CE-1(x)-CE-2(x))/(t(-1)-t(-2)))
を用いて推定時存在数分布CEB(x)を生成することができる。勿論サブ期間が3つ以上ある場合でも、公知の外挿処理により同様にして、推定時存在数分布CEB(x)が生成される。また線形の外挿処理ではなく、(例えばスプライン外挿等の)より高次の外挿処理を用いることも可能である。いずれにしてもこのような外挿処理によって、より分布推定時点t(0)に近い推定時存在数分布CEB(x)を求めることができ、これにより最終的な人口分布推定の精度を向上させることも可能となる。
【0066】
さらに、推定時存在分布決定部111bは、図2を用い通常存在数分布CEA(x)について説明したのと同様にして、第1所定期間及び第2所定期間の測位データから推定時存在数分布CEB(x)を決定する際、測位データの測位時刻(測位時点)が新しい時点であるほど(分布推定時点に近いほど)、より大きい重みをこの測位データに付与することも好ましい。具体的には、第1所定期間の(重みWA/TAを掛けられた)測位データ及び第2所定期間の(重みWB/TBを掛けられた)測位データをKDEモデルへ入力して推定時存在数分布CEB(x)を生成・決定する際、これらの測位データに上式(4)と同様の重みWT'をさらに掛けたかけたデータを入力してもよい。これにより、より分布推定時に近い推定時存在数分布を求めることができ、最終的な人口分布推定の精度を向上させることも可能となる。
【0067】
またさらに、推定時存在分布決定部111bは、図3を用い通常存在数分布CEA(x)について説明したのと同様にして、第1所定期間及び第2所定期間の測位データ毎に、当該測位データに含まれる又は当該測位データから決定される測位誤差の単調増加関数となる広さを有する領域(例えば測位誤差を半径とする円領域)内に、当該測位データに相当するW'(W'は正の整数)個の存在点であってその合計が1となる「重み」の付与されたW'個の存在点(標本点)を設定し、当該存在点(標本点)から推定時存在数分布を決定することも好ましい。このように信頼性の高い標本点の数を増やすことによって、決定される推定時存在数分布の精度(正確度)を高めることも可能となる。
【0068】
なお、推定時存在数分布CEB(x)の決定方法は上記のものに限定されるものではない。例えば、第2所定期間の測位データのみを用い、上述したのと同様にして推定時存在数分布CEB(x)を決定することも可能である。しかしながら、上述したように第1所定期間の測位データも合わせて用いることにより、分布推定時点における分布傾向及び通常の分布傾向を反映した存在数分布として、より相応しい存在数分布CEA(x)を導出することができるのである。
【0069】
ここで、以上説明した本実施形態の存在数分布決定部111における存在数分布決定処理のまとめを行う。図5は、本発明による対象分布推定方法における一実施形態の概略を示す模式図である。
【0070】
図5に示したように本実施形態において、存在数分布決定部111は、
(a)より長期の第1所定期間における測位データ(端末位置情報)から、KDEを用いて通常存在数分布CEA(x)を決定し、
(b)第1所定期間及びより短期の(分布推定時点を含む)第2所定期間における測位データ(端末位置情報)から、KDEを用いて推定時存在数分布CEB(x)を決定する。
【0071】
ここで本実施形態において、通常存在数分布CEA(x)はこの後、正解拡大係数決定部112において正解拡大係数を決定するのに用いられ、一方、推定時存在数分布CEB(x)はこの後、対象存在分布決定部116において、対象存在分布データ(例えば高解像度人口分布グラフや高解像度人口ヒートマップ)を生成するのに用いられるのである。
【0072】
<正解拡大係数決定手段>
図1の機能ブロック図に戻って、正解拡大係数決定部112は、
(a)所定地域(例えば全国)内の複数の計測地点xに設置されたスマートポール4(実数計測手段)から取得された所定の計測期間における実測カウントデータc(x)(実数計測結果)と、
(b)存在数分布決定部111で決定された存在数分布、本実施形態では通常存在数分布CEA(x)と
から、当該計測地点に係る正解拡大係数RC(x)を決定する。
【0073】
具体的に、正解拡大係数決定部112は本実施形態において、地点xでの正解拡大係数RC(x)を、次式
(7) RC(x)=c(x)/CEA(x)
を用いて決定する。ここで、CEA(x)は通常存在数分布である。すなわち正解拡大係数決定部112は、「正解」の拡大係数を、(計測地点xにおける正解の人数(全人数)といえる)カウント数と(一部のユーザのみに係る)存在数との比率と定義し、この定義に従い正解拡大係数を求めているのである。またこれにより、複数(多数)の計測地点x毎に正解拡大係数RC(x)を得ることができ、これらの(多数の)正解拡大係数RC(x)を学習データとして用いることによって、この後、拡大係数推定モデルを構築(訓練)することが可能となる。
【0074】
なお、実測カウントデータc(x)は上述したように、地点xにおける正解の人数(全人数)を示しているとみなされなければならない。したがって、例えば地下道や地上の歩道が上下方向で複数重畳していたり、地下(の高速)道路や地上(の高速)道路が上下方向で重畳していたりする計測地点における実測カウントデータは、例えばそのデータを排除したり上下関係にあるデータを加算したりして、取り扱いに注意する必要がある。
【0075】
ここで、実測カウントデータc(x)の計測期間と通常存在数分布CEA(x)に係る第1所定期間とは、同じ長さの期間に設定されることも好ましい。または、第1所定期間(KDEへの入力に係る期間)は任意に設定しつつ、上式(1)のボリュームVA(x)の値を、この第1所定期間とc(x)の計測期間とに合わせて調整してもよい。例えば、c(x)の計測期間が10日間であった場合,
(a)第1所定期間を10日間とすることができ、または、
(b)第1所定期間が30日間であるときにKDEへの入力は30日分そのままとしつつ、ボリュームVA(x)の値を、30日のうちの10日分の値としてもよく、若しくは30日分のボリューム値に1/3を掛けてVA(x)としてもよい。
【0076】
<特徴量生成手段>
同じく図1の機能ブロック図において、特徴量生成部113は、所定地域(例えば全国)内の複数の地点xにおける当該地点毎に、当該地点又は当該地点を含む区域を特徴づける特徴量F(x)を生成する。なお、後に説明する拡大係数推定モデルの構築(訓練)においては、正解拡大係数RC(x)の存在する計測地点xでの特徴量F(x)が学習データとして生成される。
【0077】
ここで、この拡大係数推定モデルによって導出される「拡大係数」は、上述したように全人口に対する「通信事業者と契約しており且つ端末位置情報の提供を許諾したユーザ」の割合を反映した量となっている。この「通信事業者と契約」するか否かや「端末位置情報の提供を許諾」するか否かは、個々人(個々の対象)の考え方・判断次第であり、すなわち個人(対象)の属性情報に大きく依存するものとなっている。したがって、「拡大係数」を導くにあたっての説明変数となる特徴量F(x)は、地点x(の周辺)に存在する個々人の属性情報を表現した量又は当該属性情報と相互作用して個々人がそこに存在する程度に影響を与える量とすることがよいと考えられる。
【0078】
以下、特徴量生成部113で生成するこのような特徴量として、(a)地図情報に基づいた特徴量、(b)対象属性情報に基づいた特徴量、及び(c)移動の文脈を考慮した特徴量の説明を行う。なお勿論、本発明に係る特徴量は、これらに限定されるものではなく、個々人の属性情報を表現した量又は当該属性情報と相互作用して個々人がそこに存在する程度に影響を与える量ならば、様々なものが特徴量として採用可能である。
【0079】
(地図情報に基づいた特徴量)
特徴量生成部113は、所定地域(例えば全国)の地図情報に基づき、地点x又は地点xを含む区域(例えば地点xを中心とする所定半径の円領域)に係る特定の事物又は現象に係る情報から、地点x又は地点xを含む区域(地点xを中心とする円領域)の特徴量F(x)を生成することも好ましい。ここで地図情報として、例えば地図情報管理サーバ5から配信されて地図情報保存部104に保存されたものを使用してもよい。
【0080】
具体的には、地点xを含む区域(円領域)に含まれる(予め設定された)各カテゴリにおけるPOI(Point Of Interest)の数(件数)を要素とする多次元ベクトル、例えば次式
(8) F(x)=(オフィス物件の数, 商業物件の数, 交通関連物件の数,
住宅物件の数, 公共設備物件の数, ・・・)
を特徴量F(x)とすることができる。
【0081】
例えば、空間的に互いに近接した場所であっても、オフィスと保育園とでは、そこに存在する人間の属性は大きく異なり、その結果、拡大係数も大きく異なると考えられる。したがって上式(8)のように、地点x又は地点xを含む区域(円領域)がPOIの観点から如何なる場所であるかを特徴量とすることによって、地点xの拡大係数をより適切に導出しやすくなるのである。また上式(8)のような特徴量以外にも、地点x又は地点xを含む区域(円領域)に存在する若しくは発生する事物や事象に係る量であって、個々人の属性情報と相互作用して個々人がそこに存在する程度に影響を与える量であれば、様々な地図情報に基づいた特徴量を採用することが可能である。
【0082】
(対象属性情報に基づいた特徴量)
特徴量生成部113は、地点x又は地点xを含む区域(例えば地点xを中心とする所定半径の円領域)に位置する端末2を所持するユーザ(端末2の付された対象)の属性情報であって、
(a)測位データ(端末測位結果)の履歴情報から推定された属性情報、又は
(b)当該ユーザ(対象)の登録された情報(例えば通信事業者の保持する契約者情報)から取得された属性情報
から、地点x又は地点xを含む区域(円領域)の特徴量F(x)を生成することも好ましい。いわば、地点x又は地点xを含む区域(円領域)にどのような人間が存在(滞在)しているかを特徴量化するのである。
【0083】
ここで上記(a)の属性情報としては、例えば、測位データの履歴情報から公知の移動・滞在判定手法(*)を用いて、ユーザの移動・滞在の時系列データを生成し、設定された「夜間」(例えば1:00から5:00までの時間区間)において最も滞在時間が長い(最も滞在確率が高い)地域メッシュ(所定地域(全国)を多数の単位区域に分割したその単位区域。以下メッシュと略称)を、当該ユーザの属性情報としての居住地エリアとすることもできる。
(*)例えば非特許文献:小林直, 石塚宏紀, 南川敦宣, 村松茂樹, 小野智弘, 「携帯電話通信履歴に適した移動滞在状態推定方法の提案」, 情報処理学会論文誌 データベース, vol. 10, no. 1, pp.13-23, 2017年に開示された手法が利用可能である。
【0084】
この場合具体的に、特徴量生成部113は、通信事業者の選択や位置情報許諾の有無は滞在者(ユーザ)の居住地(住所,自宅のある場所)の地域性と関係があると仮定した上で、地点xを含む区域(円領域)に滞在しているユーザ群についての居住地(自宅)エリアの内訳を要素とした特徴量(ベクトル)を生成してもよい。例えば、次式
(9) F(x)=(・・・, 居住地が東京都内であるユーザの割合, ・・・,
居住地が神奈川県内であるユーザの割合, ・・・)
を特徴量F(x)とすることができる。
【0085】
また、上記(b)の属性情報としては、(例えば通信事業者の管理する)属性情報管理サーバ5から受信されて属性情報保存部105に保存されたものを使用してもよい。ちなみに、上式(9)の居住地情報も属性情報保存部105(属性情報管理サーバ5)から取得することが可能である。
【0086】
具体的に特徴量生成部113は、上記のような公知の技術によって測位データの履歴情報から移動・滞在を推定した後、地点xを含む区域(円領域)に滞在しているユーザ群についての(予め設定された)各属性カテゴリのユーザ属性の割合を要素とした特徴量(ベクトル)を生成してもよい。例えば、属性カテゴリとして性別・年代を採用し、次式
(10) F(x)=(男性10歳代の割合, 男性20歳代の割合, ・・・,
女性10歳代の割合, ・・・, 女性70歳代の割合, ・・・)
を特徴量F(x)とすることができる。
【0087】
(移動の文脈を考慮した特徴量)
特徴量生成部113は、メッシュ(所定地域(全国)を多数の単位区域に分割したその単位区域)を表すコードであるメッシュコードを単語とみなして、ユーザ(対象)の移動履歴を表すメッシュコードの時系列データを文とみなし、単語間の類似性を学習しており単語列から次の単語を予測する自然言語処理モデルであって、一部のマスクされた測位結果の履歴によって訓練された自然言語処理モデルを用いて、地点xを含むメッシュの埋め込み表現(分散表現)を獲得し、これを特徴量F(x)としてもよい。
【0088】
例えば、非特許文献:小林 亮博, 上坂 大輔, 武田 直人, 南川 敦宣, “位置情報ビッグデータを用いた交通需要予測のための表現学習技術”, 土木計画学研究講演集, Vol.64, CD:全8p,2021年 に開示された技術によれば、自然言語処理モデルとして公知のBERT(Bidirectional Encoder Representations from Transformers)を採用し、ユーザの移動履歴を表すメッシュコードの時系列データを大量に用意して、時系列データ(文)の一部のメッシュコードをマスクし、これを予測するようにBERTを訓練することによって、教師無し(自己教師有り)学習で各メッシュ(単語)の埋め込み表現(分散表現)を獲得している。
【0089】
このメッシュ埋め込み表現は、特徴のより似ているメッシュ同士ほど互いにより近い値をとるような多次元ベクトルとすることができ、したがって、本発明に係る特徴量F(x)とすることが可能となっている。例えば512次元に設定した場合、F(x)=(f1, f2, ・・・, f512)といった形の特徴量F(x)を生成することができる。
【0090】
以上、(a)地図情報に基づいた特徴量、(b)対象属性情報に基づいた特徴量、及び(c)移動の文脈を考慮した特徴量の説明を行ったが、これらのうちの2つ又は全部を組み合わせて(例えば結合して)地点xの特徴量F(x)を生成してもよい。
【0091】
<モデル構築手段>
同じく図1の機能ブロック図において、モデル構築部114は、特徴量生成部113で生成された特徴量F(x)を説明変数とし、目的変数である拡大係数R(x)^を推定する拡大係数推定モデル(回帰モデル)、すなわち次式
(11) R(x)^=f(F(x))
で表される拡大係数推定モデルf(・)を構築(訓練)する。この拡大係数推定モデルf(・)を構成するアルゴリズムとしては、公知の重回帰モデルや、LightGBM(Light Gradient Boosting Machine)、さらには多層パーセプトロン(MLP, Multi-Layer Perceptron)等、種々の機械学習アルゴリズムが採用可能である。
【0092】
また、拡大係数推定モデルf(・)の訓練の際には、(スマートポール4の)計測地点x毎の特徴量F(x)と(正解拡大係数決定部112で決定された)正解拡大係数RC(x)とのペアを含む多数の学習データを用意し、推定された拡大係数R(x)^における正解拡大係数RC(x)からの誤差(損失関数)を極力小さくするように訓練を実施する。ちなみに、上記(c)のBERTを用いて導出される(移動の文脈を考慮した)特徴量を採用した場合、事前学習の施されたBERTモデルに対し、ここでファインチューニング(fine tuning)を行い、拡大係数R(x)^の推定精度を向上させることも好ましい。
【0093】
<拡大係数推定手段>
同じく図1の機能ブロック図において、拡大係数推定部115は、構築(訓練)された拡大係数推定モデルに対し、特徴量生成部113で生成された特徴量を入力し、この拡大係数推定モデルの出力から拡大係数を推定する。ここで上述したように、訓練された拡大係数推定モデルf(・)は、(スマートポール4の)計測地点に限定されず、任意の地点xの特徴量F(x)を入力して当該任意の地点xの拡大係数R(x)^を出力(推定)することが可能となっている。ちなみに、上記(c)のBERTを用いて導出される(移動の文脈を考慮した)特徴量F(x)の場合においても、十分に小さなメッシュ(例えば20m×20mの矩形)を設定することができ、概ね任意の地点xでの特徴量F(x)を得ることができるのである。
【0094】
そこで、拡大係数推定部115は本実施形態において、所定地域(例えば全国)における高解像化したい全地点X=(x1, x2, ・・・, xm) について網羅的に拡大係数(拡大係数マップ)R(X)^を推定する。これにより、この後説明するように高精度の人口分布データ、例えば高解像度人口ヒートマップが生成可能となるのである。なお全地点X=(x1, x2, ・・・, xm)は例えば、高解像度人口ヒートマップにおける各メッシュの代表地点(例えば中心地点)の集合とすることもできる。
【0095】
<対象存在分布決定手段>
同じく図1の機能ブロック図において、対象存在分布決定部116は、存在数分布決定部111で決定された推定時存在数分布CEB(x)と、拡大係数推定部115で推定された拡大係数R(x)^とに基づき、所定地域(例えば全国)内の複数の地点の各々における人間(対象)の存在する数、すなわち人数(人口)を決定する。
【0096】
具体的に、対象存在分布決定部116は本実施形態において、設定された複数の地点の地点毎に、当該地点xにおける人数(カウント数)C(x)を、次式
(12) C(x)=CEB(x)×R(x)^
によって算出する。このように対象存在分布決定部116は、一部のユーザの測位データから決定される人数(カウント数)ではあるが任意の地点xでの人数(カウント数)を算出可能な推定時存在数分布CEB(x)に対し、全人数と測位データが取得されるユーザ数との比率を表している当該任意の地点xでの拡大係数R(x)^を掛け合わせることによって、当該任意の地点xにおける人数(カウント数)C(x)を決定することができるのである。
【0097】
ここで、算出・決定される人数C(x)はいわば、(本来スマートポール4の設置されていない)地点xにスマートポール4(実数計測手段)が設置されていたならばその計測値として得られると推定されるカウント数となっている。すなわち、まさに地点xにおける実人数の推定値(実数計測推定値)となっているのである。
【0098】
対象存在分布決定部116は、所定地域(例えば全国)における任意の(多数の)地点xについて人数(カウント数)C(x)を算出・決定し、例えば高解像度人口分布グラフを生成することもできる。また、高解像化したい全地点、例えば各メッシュの代表地点(例えば中心地点)X=(x1, x2, ・・・, xn) について人数(カウント数)C(X)を算出・決定し、例えば高解像度人口ヒートマップを生成することも可能となる。
【0099】
なお、対象存在分布決定部116で生成された人口分布データ(人数(カウント数)C(X))、高解像度人口分布グラフや、高解像度人口ヒートマップは、表示部を有するユーザインタフェース部106に表示され、装置1の操作・管理者に提示されてもよい。また、通信制御部121及び通信インタフェース部101を介して外部の情報処理装置へ送信され、そこで利用されてもよい。
【0100】
ここで、以上に説明した本実施形態のモデル構築部114、拡大係数推定部115、及び対象存在分布決定部116における処理の簡単なまとめを行う。図5に示したように、モデル構築部114は、正解拡大係数決定部で決定された正解拡大係数RC(x)と推定された拡大係数R(x)^との誤差を損失(loss)とした訓練処理を実施することによって、拡大係数推定モデル(回帰モデル)を構築する。
【0101】
次いで同じく図5に示したように、拡大係数推定部115は、構築された拡大係数推定モデルに対し所定地域(例えば全国)における任意の(多数の)地点xにおける特徴量F(x)を入力して、拡大係数推定モデルの出力から拡大係数R(x)^を決定する。最後に、対象存在分布決定部116は、拡大係数R(x)^と存在数分布決定部111で決定された推定時存在数分布CEB(x)とを用い、任意の(多数の)地点xにおける人数(カウント数)C(x)を算出・決定し、さらにこれから、高解像度人口分布グラフや、高解像度人口ヒートマップを生成するのである。
【0102】
以上詳細に説明したように、本発明によれば、実数計測手段から取得された実数計測結果を用いて正解拡大係数を決定し、この正解拡大係数によって構築された拡大係数推定モデルを用いて、各地点の対象存在数を決定する。ここで、計測地点の数が限定されている状況であっても、所定地域内の複数の地点を十分な数だけ設定することによって、高い解像度の対象分布データを得ることができる。
【0103】
また、正解拡大係数は実数計測結果と存在数分布とから決定されているので、適切な特徴量を設定することによって、拡大係数推定モデルの出力に係る拡大係数の精度(正確度)をより高いものにすることも可能となる。その結果、本発明によれば、対象の実分布に係る正解データに頼ることなく、高い解像度の対象の分布を、より高い精度(正確度)で推定することが可能となるのである。
【0104】
さらに、例えば本発明による対象分布推定方法を適用して、都市部における的確且つ詳細な人流予測やさらには交通行動予測を実施し、レジリエントな交通・輸送インフラを整備したり、都市化がもたらす課題を解決する効率的な都市計画を実施したりすることもできる。すなわち本発明によれば、国連が主導する持続可能な開発目標(SDGs)の目標9「レジリエントなインフラを整備し、持続可能な産業化を推進するとともに、イノベーションの拡大を図る」や、目標11「都市を包摂的、安全、レジリエントかつ持続可能にする」に貢献することも可能となるのである。
【0105】
以上に述べた本発明の種々の実施形態について、本発明の技術思想及び見地の範囲での種々の変更、修正及び省略は、当業者によれば容易に行うことができる。以上に述べた説明はあくまで実施形態の例示であって、不要な制約を行うものではない。本発明は、特許請求の範囲及びその均等物として限定されるものにのみ制約される。
【符号の説明】
【0106】
1 通信設備装置(対象分布推定装置)
101 通信インタフェース部
102 測位結果保存部
103 実数計測結果保存部
104 地図情報保存部
105 属性情報保存部
106 ユーザインタフェース部
111 存在数分布決定部
111a 通常存在分布決定部
111b 推定時存在分布決定部
112 正解拡大係数決定部
113 特徴量生成部
114 モデル構築部
115 拡大係数推定部
116 対象存在分布決定部
121 通信制御部
2 端末
3 基地局
4 スマートポール(実数計測手段)
5 地図情報管理サーバ
6 属性情報管理サーバ
図1
図2
図3
図4
図5
図6