IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エヌ・ティ・ティ・コムウェア株式会社の特許一覧

特開2022-38482学習装置、予測装置、予測システム、予測方法、およびプログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022038482
(43)【公開日】2022-03-10
(54)【発明の名称】学習装置、予測装置、予測システム、予測方法、およびプログラム
(51)【国際特許分類】
   G06Q 10/04 20120101AFI20220303BHJP
【FI】
G06Q10/04
【審査請求】未請求
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2020143015
(22)【出願日】2020-08-26
(71)【出願人】
【識別番号】397065480
【氏名又は名称】エヌ・ティ・ティ・コムウェア株式会社
(74)【代理人】
【識別番号】100161207
【弁理士】
【氏名又は名称】西澤 和純
(74)【代理人】
【識別番号】100126664
【弁理士】
【氏名又は名称】鈴木 慎吾
(74)【代理人】
【識別番号】100181124
【弁理士】
【氏名又は名称】沖田 壮男
(72)【発明者】
【氏名】山本 寛悟
(72)【発明者】
【氏名】三澤 祐一
(72)【発明者】
【氏名】河本 倫志
(72)【発明者】
【氏名】西村 恒人
(72)【発明者】
【氏名】畠山 大輝
(72)【発明者】
【氏名】岡村 健志
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049AA04
(57)【要約】      (修正有)
【課題】予測対象地点における未来の特定時刻の人数等の情報を高い精度で予測する予測システムを提供する。
【解決手段】予測システムの一種である人流予測システム1において、学習装置300は、複数の予測対象地点のうち一部の予測対象地点を含むグループを生成するとともに、生成されたグループに対応し、グループに含まれる予測対象地点の人流情報を教師データとして機械学習させた予測モデルを作成する。予測装置200は、作成された予測モデルに、グループに含まれる予測対象地点以外の新たな予測対象地点から取得したデータを入力し、予測モデルの出力に基づいて未来の人流を予測する。
【選択図】図2
【特許請求の範囲】
【請求項1】
複数の予測対象地点のうち一部の予測対象地点を含むグループを生成するグループ生成部と、
前記グループ生成部により生成されたグループに対応した予測モデルであって、前記グループに含まれる予測対象地点の人流情報を教師データとして機械学習させた予測モデルを作成する予測モデル作成部と、
を備える、学習装置。
【請求項2】
前記グループ生成部は、前記複数の予測対象地点における人流情報に基づく特徴量ベクトルを各予測対象地点について抽出し、複数の前記特徴量ベクトルに基づくグループを生成する、請求項1に記載の学習装置。
【請求項3】
前記特徴量ベクトルは、前記予測対象地点における人流情報に含まれる時系列データのパターンを表す情報、前記時系列データの変動を表す情報、前記時系列データの季節性を表す情報、前記時系列データの周期性を表す情報の少なくとも一つを含む、請求項2に記載の学習装置。
【請求項4】
前記予測対象地点における時系列データは、特異日を除外したデータであって、時系列データ間のスケールを標準化したデータである、請求項3に記載の学習装置。
【請求項5】
前記予測モデル作成部は、機械学習アルゴリズムの選定および前記機械学習アルゴリズムのパラメータのチューニングを行い、当該機械学習アルゴリズムを機械学習させて予測モデルを作成する、
請求項1から4のうち何れか1項に記載の学習装置。
【請求項6】
前記予測モデル作成部は、前記グループに含まれる予測対象地点に対応した予測モデルの予測精度と、前記グループに対応した予測モデルの予測精度との比較に基づいて、前記グループを決定する、
請求項1から5のうち何れか1項に記載の学習装置。
【請求項7】
前記グループ生成部は、前記グループに含まれる予測対象地点の属性情報に基づいて前記グループの属性を表すグループ情報を生成し、
前記予測モデル作成部は、新たな予測対象地点の属性情報と前記グループ情報とに基づいて、前記新たな予測対象地点を前記グループに分類し、前記新たな予測対象地点における人流の時系列データに基づいて、分類されたグループの予測モデルを機械学習させる、
請求項1から6のうち何れか1項に記載の学習装置。
【請求項8】
複数の予測対象地点のうち一部の予測対象地点を含むグループに対応した予測モデルであって、前記グループに含まれる予測対象地点の人流情報を教師データとして機械学習させた予測モデルに、前記グループに含まれる予測対象地点以外の新たな予測対象地点から取得したデータを入力し、前記予測モデルの出力に基づいて未来の人流を予測する予測部を備える、予測装置。
【請求項9】
前記予測部は、前記新たな予測対象地点から取得したデータを用いた学習量が所定値を超えていない場合、前記新たな予測対象地点から取得したデータにより機械学習をしていない予測モデルを用いた予測を行い、前記新たな予測対象地点から取得したデータを用いた学習量が所定値を超えている場合、前記新たな予測対象地点から取得したデータにより機械学習をしていない予測モデルを用いた予測を行う、請求項8に記載の予測装置。
【請求項10】
複数の予測対象地点のうち一部の予測対象地点を含むグループを生成するグループ生成部と、前記グループ生成部により生成されたグループに対応した予測モデルであって、前記グループに含まれる予測対象地点の人流情報を教師データとして機械学習させた予測モデルを作成する予測モデル作成部と、を備える、学習装置と、
前記学習装置により作成された前記予測モデルに、前記グループに含まれる予測対象地点以外の新たな予測対象地点から取得したデータを入力し、前記予測モデルの出力に基づいて未来の人流を予測する予測装置と、
を備える、予測システム。
【請求項11】
複数の予測対象地点のうち一部の予測対象地点を含むグループを生成するステップと、
前記グループに対応した予測モデルであって、前記グループに含まれる予測対象地点の人流情報を教師データとして機械学習させた予測モデルを作成するステップと、
前記予測モデルに、前記グループに含まれる予測対象地点以外の新たな予測対象地点から取得したデータを入力し、前記予測モデルの出力に基づいて未来の人流を予測するステップと、
を含む、予測方法。
【請求項12】
個別の予測対象地点に対応した予測モデルであって、前記個別の予測対象地点の人流情報を教師データとして機械学習させた予測モデルを作成するステップと、
前記個別の予測対象地点に対応した予測モデルが複数作成された段階において、複数の予測対象地点のうち一部の予測対象地点を含むグループに対応した予測モデルであって、前記グループに含まれる予測対象地点の人流情報を教師データとして機械学習させた予測モデルを作成するステップと、
前記予測モデルに、前記グループに含まれる予測対象地点以外の新たな予測対象地点から取得したデータを入力し、前記予測モデルの出力に基づいて未来の人流を予測するステップと、
を含む、予測方法。
【請求項13】
コンピュータに、
複数の予測対象地点のうち一部の予測対象地点を含むグループを生成させ、
前記グループに対応した予測モデルであって、前記グループに含まれる予測対象地点の人流情報を教師データとして機械学習させた予測モデルを作成させる、
処理を実行させる、プログラム。
【請求項14】
コンピュータに、
複数の予測対象地点のうち一部の予測対象地点を含むグループに対応した予測モデルであって、前記グループに含まれる予測対象地点の人流情報を教師データとして機械学習させた予測モデルに、前記グループに含まれる予測対象地点以外の新たな予測対象地点から取得したデータを入力し、前記予測モデルの出力に基づいて未来の人流を予測させる、処理を実行させる、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習装置、予測装置、予測システム、予測方法、およびプログラムに関する。
【背景技術】
【0002】
従来より、過去の情報に基づいて未来の情報を予測する技術が知られている。例えば、予測対象地点における未来の人数を予測する技術があり、人数の時系列データを用いて機械学習手法による機械学習アルゴリズムによって学習させた予測モデルを生成し、予測モデルにより予測対象地点における未来の人数を予測することが知られている。
【0003】
特許文献1には改札出場人数予測装置が記載されている。改札出場人数予測装置は、いずれの鉄道路線であっても対象駅の改札出場人数を予測している。具体的に、改札出場人数予測装置は、サーバにより、目的変数として、対象駅の未来の改札出場人数を使用し、説明変数として、改札出場人数の予測に影響を及ぼし得る所定の鉄道路線の各駅の改札入場人数を使用し、重回帰式を作成し、重回帰式の目的変数と説明変数に過去の実測値を入れて、当該重回帰式の偏回帰係数を求め、予測式を作成し、予測式の説明変数に予測対象の値を代入し、改札出場人数の予測値を算出している。
【0004】
特許文献2には、鉄道情報提供システムが記載されている。鉄道情報提供システムは、列車の運行が乱れた際に、駅に流入する旅客数を推定している。具体的に、鉄道情報提供システムは、運行管理システムと、鉄道情報提供装置とを備える。運行管理システムは、列車の運行状況を鉄道情報提供装置に送信し、鉄道情報提供装置は、列車のダイヤの乱れを検知する検知部と、ダイヤの乱れに対応する列車の運行状態情報を記憶する記憶部と、列車の運行状態情報からダイヤの乱れの影響を受ける駅を運行管理システムから取得する影響範囲取得部と、駅に設置された改札機から入場した人数情報を、改札入場管理システムから取得する改札情報取得部と、駅に設置された改札機から入場した人数情報に基づいて駅に流入する人数を予測する構内人数予測部と、予測された人数を端末に配信する配信部と、を備える。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2019-211881号公報
【特許文献2】特開2016-150664号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上述した特許文献1および特許文献2に記載された技術は、どの駅であっても同じ予測手法を利用しているので、予測精度を高くするためには、駅に最適な機械学習アルゴリズムのチューニングを行い、予測モデル(予測式)を作成する必要がある。さらに、各駅における予測精度を高くするためには、各駅について大量の学習データを用意し、各駅の予測モデルに学習させる必要がある。
【0007】
本発明は、上記の課題に鑑みてなされたものであって、予測対象地点における未来の特定時刻の人数等の情報を高い精度で予測することができる学習装置、予測装置、予測システム、予測方法、およびプログラムを提供することを目的としている。
【課題を解決するための手段】
【0008】
(1)本発明の一態様は、複数の予測対象地点のうち一部の予測対象地点を含むグループを生成するグループ生成部と、前記グループ生成部により生成されたグループに対応した予測モデルであって、前記グループに含まれる予測対象地点の人流情報を教師データとして機械学習させた予測モデルを作成する予測モデル作成部と、を備える、学習装置である。
【0009】
(2)本発明の一態様は、上記の学習装置であって、前記グループ生成部は、前記複数の予測対象地点における人流情報に基づく特徴量ベクトルを各予測対象地点について抽出し、複数の前記特徴量ベクトルに基づくグループを生成してよい。
【0010】
(3)本発明の一態様は、上記の学習装置であって、前記特徴量ベクトルは、前記予測対象地点における人流情報に含まれる時系列データのパターンを表す情報、前記時系列データの変動を表す情報、前記時系列データの季節性を表す情報、前記時系列データの周期性を表す情報の少なくとも一つを含んでよい。
【0011】
(4)本発明の一態様は、上記の学習装置であって、前記予測対象地点における時系列データは、特異日を除外したデータであって、時系列データ間のスケールを標準化したデータであってよい。
【0012】
(5)本発明の一態様は、上記の学習装置であって、前記予測モデル作成部は、前記機械学習アルゴリズムの選定および前記機械学習アルゴリズムのパラメータのチューニングを行い、当該機械学習アルゴリズムを機械学習させて予測モデルを作成してよい。
【0013】
(6)本発明の一態様は、上記の学習装置であって、前記予測モデル作成部は、前記グループに含まれる予測対象地点に対応した予測モデルの予測精度と、前記グループに対応した予測モデルの予測精度との比較に基づいて、前記グループを決定してよい。
【0014】
(7)本発明の一態様は、上記の学習装置であって、前記グループ生成部は、前記グループに含まれる予測対象地点の属性情報に基づいて前記グループの属性を表すグループ情報を生成し、前記予測モデル作成部は、新たな予測対象地点の属性情報と前記グループ情報とに基づいて、前記新たな予測対象地点を前記グループに分類し、前記新たな予測対象地点における人流の時系列データに基づいて、分類されたグループの予測モデルを機械学習させてよい。
【0015】
(8)本発明の一態様は、複数の予測対象地点のうち一部の予測対象地点を含むグループに対応した予測モデルであって、前記グループに含まれる予測対象地点の人流情報を教師データとして機械学習させた予測モデルに、前記グループに含まれる予測対象地点以外の新たな予測対象地点から取得したデータを入力し、前記予測モデルの出力に基づいて未来の人流を予測する予測部を備える、予測装置である。
【0016】
(9)本発明の一態様は、上記の予測装置であって、前記予測部は、前記新たな予測対象地点から取得したデータを用いた学習量が所定値を超えていない場合、前記新たな予測対象地点から取得したデータにより機械学習をしていない予測モデルを用いた予測を行い、前記新たな予測対象地点から取得したデータを用いた学習量が所定値を超えている場合、前記新たな予測対象地点から取得したデータにより機械学習をしていない予測モデルを用いた予測を行ってよい。
【0017】
(10)本発明の一態様は、複数の予測対象地点のうち一部の予測対象地点を含むグループを生成するグループ生成部と、前記グループ生成部により生成されたグループに対応した予測モデルであって、前記グループに含まれる予測対象地点の人流情報を教師データとして機械学習させた予測モデルを作成する予測モデル作成部と、を備える、学習装置と、前記学習装置により作成された前記予測モデルに、前記グループに含まれる予測対象地点以外の新たな予測対象地点から取得したデータを入力し、前記予測モデルの出力に基づいて未来の人流を予測する予測装置と、を備える、予測システムである。
【0018】
(11)本発明の一態様は、複数の予測対象地点のうち一部の予測対象地点を含むグループを生成するステップと、前記グループに対応した予測モデルであって、前記グループに含まれる予測対象地点の人流情報を教師データとして機械学習させた予測モデルを作成するステップと、前記予測モデルに、前記グループに含まれる予測対象地点以外の新たな予測対象地点から取得したデータを入力し、前記予測モデルの出力に基づいて未来の人流を予測するステップと、を含む、予測方法である。
【0019】
(12)本発明の一態様は、個別の予測対象地点に対応した予測モデルであって、前記個別の予測対象地点の人流情報を教師データとして機械学習させた予測モデルを作成するステップと、前記個別の予測対象地点に対応した予測モデルが複数作成された段階において、複数の予測対象地点のうち一部の予測対象地点を含むグループに対応した予測モデルであって、前記グループに含まれる予測対象地点の人流情報を教師データとして機械学習させた予測モデルを作成するステップと、前記予測モデルに、前記グループに含まれる予測対象地点以外の新たな予測対象地点から取得したデータを入力し、前記予測モデルの出力に基づいて未来の人流を予測するステップと、を含む、予測方法である。
【0020】
(13)本発明の一態様は、コンピュータに、複数の予測対象地点のうち一部の予測対象地点を含むグループを生成させ、前記グループに対応した予測モデルであって、前記グループに含まれる予測対象地点の人流情報を教師データとして機械学習させた予測モデルを作成させる、処理を実行させる、プログラムである。
【0021】
(14)本発明の一態様は、コンピュータに、複数の予測対象地点のうち一部の予測対象地点を含むグループに対応した予測モデルであって、前記グループに含まれる予測対象地点の人流情報を教師データとして機械学習させた予測モデルに、前記グループに含まれる予測対象地点以外の新たな予測対象地点から取得したデータを入力し、前記予測モデルの出力に基づいて未来の人流を予測させる、処理を実行させる、プログラムである。
【発明の効果】
【0022】
本発明の一態様によれば、予測対象地点における未来の特定時刻の人数等の情報を高い精度で予測することができる。
【図面の簡単な説明】
【0023】
図1】実施形態における人流予測システム1の一例を示すブロック図である。
図2】実施形態の人流予測システム1の一構成例を示すブロック図である。
図3】予測モデル生成部における処理の一例を説明するためのブロック図である。
図4】予測モデル生成部における処理の一例を説明するためのブロック図である。実施形態の情報処理システム1においてオブジェクトを設定および表示する他の処理を説明するための図である。
図5】実施形態の人流予測システムにおける導入段階に応じた処理手順の一例を示すフローチャートである。
図6】グループ化処理の一例を示すフローチャートである。
図7】人流が変動する要因(人流要因)とエリア特性との関係の一例を示す図である。
図8】属性のカテゴリおよび属性情報の項目の一例を示す図である。
図9】人数時系列データの項目の一例を示す図である。
図10】1日の人数時系列データの一例を示す図である。
図11】人流情報に関する項目の一例を示す図である。
図12】人数時系列データの一例を示す図であり、(A)は平時の人数時系列データであり、(B)は特異日の人数時系列データであり、(C)は平時の人数時系列データの他の例である。
図13】グループの属性の一例を示す図である。
図14】予測対象地点ごとの、平日時間帯単位の人数の母標準偏差、および休日時間帯単位の人数の母標準偏差を示す図である。
図15】予測対象地点ごとの人数時系列データの変動の振れ幅の一例を示す図である。
図16】予測対象地点ごとの、平日における時間帯別平均値および休日における時間帯別平均値の一例を示す図である。
図17】予測対象地点ごとの、曜日毎の1日における平均値の変化の一例を示す図である。
図18】月ごとに1日における人数時系列データの一例を示す図である。
図19】(A)は予測対象地点Aにおける偏自己相関を示すコレログラムを示す図であり、(B)は予測対象地点Bにおける偏自己相関を示すコレログラムを示す図である。
図20】階層型クラスタリングの一例を説明するための図である。
図21】クラスタ数がG1~G4の4である場合の予測対象地点ごとのスコアの一例を表す図である。
図22】クラスタ数がG1~G5の5である場合の予測対象地点ごとのスコアの一例を表す図である。
図23】人数時系列データを加工しない場合の予測対象地点とクラスタリング結果との関係を示す図である。
図24】人数時系列データを標準化した場合の予測対象地点とクラスタリング結果との関係を示す図である。
図25】グループと、予測対象地点に個別に導入された予測モデルの予測誤差率と、グループの予測モデルの予測誤差率と、悪化率との対応を示す図である。
図26】1分単位の人数時系列データ(実測値)と、平滑化した人数時系列データを示す図である。
図27】予測モデルの学習処理の一例を示す図である。
図28】(A)は、同じ機械学習アルゴリズムを複数の地点A~Fに導入した場合の予測の誤差率の一例を示す図であり、(B)は、任意地点の予測モデルを他の地点に導入した場合の予測精度の悪化率の一例を示す図である。
【発明を実施するための形態】
【0024】
以下、本発明を適用した学習装置、予測装置、予測システム、予測方法、およびプログラムを、図面を参照して説明する。
【0025】
<実施形態の概要>
図1は、実施形態における人流予測システム1の一例を示すブロック図である。人流予測システム1は、予測対象地点における人流を予測する。予測対象地点は、例えば、地図上の任意の地点、所定の面積を持つエリア、都道府県、市区町村や、駅、店舗等の施設、施設内位置などである。人流は、予測対象地点に含まれる滞在人数、流入人数、流出人数等の人数などである。
【0026】
人流予測システム1は、例えば予測モデル生成部10を備える。予測モデル生成部10は、例えば、予測対象地点Aおよび予測対象地点Bに共通する、予測対象地点Aおよび予測対象地点Bに汎用の汎用予測モデル20Aおよび20B(図中の予測モデル(AB))を生成する。なお、予測対象地点Aおよび予測対象地点Bは、後述するグループ化処理により同じグループに分類された地点群である。
【0027】
予測モデル生成部10は、一方の汎用予測モデル20Aに対して予測対象地点Aにおける人流の時系列データである学習データ(A)を入力し、汎用予測モデル20Aの処理パラメータを学習させる。また、予測モデル生成部10は、他方の汎用予測モデル20Bに対して予測対象地点Bにおける人流の時系列データである学習データ(B)を入力し、汎用予測モデル20Bの処理パラメータを学習させる。
【0028】
人流予測システム1は、予測対象地点Aにおける時点tの人流時系列データ(A,t)を汎用予測モデル20Aに入力し、汎用予測モデル20Aによって予測対象地点Aにおける未来の時点t+xの人流予測結果(A,t+x)を取得することができる。同様に、人流予測システム1は、予測対象地点Bにおける時点tの人流時系列データ(B,t)を汎用予測モデル20Bに入力し、汎用予測モデル20Bによって予測対象地点Bにおける未来の時点t+xの人流予測結果(B,t+x)を取得することができる。
【0029】
人流予測システム1は、新たに人流を予測したい地点Cが発生し、予測対象地点Cが予測対象地点AおよびBと同じグループに属することを判定したとする。この場合、人流予測システム1は、予測モデル(AB)と同じ汎用予測モデル20Cを用意し、予測対象地点Cにおける時点tの人流時系列データ(C,t)を汎用予測モデル20Cに入力し、汎用予測モデル20Cによって予測対象地点Cにおける未来の時点t+xの人流予測結果(C,t+x)を取得することができる。
【0030】
このように、人流予測システム1は、グループ化により汎用の予測モデルを作成し、当該汎用の予測モデルを用いて複数の予測対象地点における人流を予測することができる。以下、詳細に説明する。
【0031】
<人流予測システム1の構成>
図2は、実施形態の人流予測システム1の一構成例を示すブロック図である。人流予測システム1は、例えば、予測モデル生成部10と、サービス提供装置100と、予測装置200と、予測モデル20と、学習装置300と、学習データ蓄積装置400と、データ収集装置500と、人流計測用のセンサ600とを備える。サービス提供装置100、予測装置200、学習装置300、データベース装置400、およびデータ収集装置500は、例えば、通信ネットワークに接続される。通信ネットワークに接続される各装置は、NIC(Network Interface Card)や無線通信モジュールなどの通信インターフェースを備えている(図2では不図示)。通信ネットワークは、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)、セルラー網などを含む。
【0032】
サービス提供装置100は、例えば、端末装置から地点および予測時刻を受け付け、予測装置200から予測時刻における人流の予測結果を取得し、端末装置に情報を提供するサーバ装置等である。予測装置200は、予測モデル生成部10により生成された予測モデル20が導入され、予測モデル20に従った情報処理を行うことで予測結果を生成する。学習装置300は、データベース装置400に蓄積された学習データを用いて予測モデル20の処理パラメータを更新することで、予測モデル20を学習させる。データベース装置400は、データ収集装置500から提供された人流時系列データ等の人流情報や、予測対象地点の属性情報等を蓄積するデータベースサーバである。データベース装置400は、予測モデル20の学習時に、当該予測モデル20の学習のための人流時系列データが読み出される。また、データベース装置400は、予測モデル20の生成時に、予測モデル生成部10により人流情報や属性情報が読み出される。データ収集装置500は、予測対象地点等に配置された人流に関する情報を検出するセンサ600や人流のオープンデータ等を提供するデータサーバ等から人流情報を収集し、データベース装置400に登録させる。
【0033】
図3および図4は、予測モデル生成部における処理の一例を説明するためのブロック図である。予測モデル生成部10は、例えば、特徴ベクトル抽出部12と、クラスタリング部14と、グループ生成部16と、機械学習アルゴリズムチューニング部18と、を備える。特徴ベクトル抽出部12、クラスタリング部14、グループ生成部16、および機械学習アルゴリズムチューニング部18といった機能部は、例えばCPU(Central Processing Unit)等のプロセッサがプログラムメモリに格納されたプログラムを実行することにより実現される。また、これらの機能部のうち一部または全部は、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、またはFPGA(Field-Programmable Gate Array)等のハードウェアにより実現されてもよいし、ソフトウェアとハードウェアが協働することで実現されてもよい。
【0034】
図3に示すように、特徴ベクトル抽出部12は、データベース装置400から属性情報および人流情報を読み出す。人流情報には、例えば人数時系列データおよびオープンデータが含まれる。特徴ベクトル抽出部12は、予測対象地点ごとに、属性情報および/または人数時系列データを用いて特徴量ベクトルを抽出する。属性情報は、予測対象地点の属性を表す情報である。人数時系列データは、予測対象地点における人数情報を時系列軸に配置したデータである。クラスタリング部14は、特徴量ベクトルを用いて複数の予測対象地点を複数のグループにクラスタリングすることで、グループ属性情報を生成する。グループ属性情報は、予測対象地点と、所属グループとの対応関係を表す情報である。グループ生成部16は、グループ化された複数の予測対象地点のそれぞれに対応付けられた属性情報を用いてグループ情報を生成する。グループ情報は、グループのそれぞれと、当該グループに属する地点に共通する属性とを対応付けた情報である。
【0035】
図4に示すように、機械学習アルゴリズムチューニング部18は、グループ情報、および当該グループ情報のグループに含まれる予測対象地点の人数時系列データを用いて、機械学習アルゴリズムをチューニングする。機械学習アルゴリズムチューニング部18は、例えば、機械学習アルゴリズムa~xといった機械学習手法から一つの機械学習アルゴリズムを選択する処理、当該選択した機械学習アルゴリズムにおけるハイパーパラメータ等の機械学習アルゴリズムの主となる要素の変更、学習に使用する特徴量ベクトルの追加、削除および変更等を行う。機械学習手法には、例えば、深層学習、ランダムフォレスト、SVM(support vector machine)等が含まれ、機械学習アルゴリズムチューニング部18は、グループに適したいずれかの機械学習手法を選定する。また、人流予測システム1は、例えばニューラルネットワークを選定した場合、CNNやVAEなどどのような構造のネットワークを利用するか、機械学習アルゴリズムが決まった後にネットワークの層数やニューロン数といったパラメータを決めるといったチューニングを行う。これにより、機械学習アルゴリズムチューニング部18は、グループ1に適した機械学習アルゴリズム(G1)を生成する。
【0036】
機械学習アルゴリズム(G1)は、例えば、新たにグループ1に属する予測対象地点Dにおける人数時系列データ(D)が学習装置300から供給されることで処理パラメータが学習されることで、予測対象地点Dにおける予測モデル(D)として構築される。予測モデル(D)は、予測対象地点Dにおける予測装置200に導入され、予測装置200は、予測対象地点Dにおける時刻tの人数時系列データを入力した場合、予測対象地点Dにおける未来の時刻t+xの人数の予測結果を出力することができる。
【0037】
図5は、実施形態の人流予測システムにおける導入段階に応じた処理手順の一例を示すフローチャートである。
人流予測システム1は、予測モデルの導入状況に応じて第1段階、第2段階、および第3段階のそれぞれにおいて異なる処理を行う。第1段階は、予測対象地点毎に予測モデルを導入する段階である。第2段階は、第1段階の処理により導入された複数の予測対象地点における予測モデルの予測精度が十分である状況において、グループごとの予測モデルを構築する段階である。第3段階は、第2段階で構築されたグループごとの予測モデルを新たな予測対象地点に導入する段階である。人流予測システム1は、導入段階の開始を判定し(ステップS10)、第1段階の処理、第2段階の処理、および第3段階の処理を並行して行う。
【0038】
まず第1段階の処理を説明する。人流予測システム1は、例えば、管理者の操作に基づいて予測対象地点および第1段階を指定する命令を受け付けることによって、第1段階の開始を判断する(ステップS10)。まず、人流予測システム1は、処理対象の一つの予測対象地点について人数時系列データを収集する(ステップS100)。次に人流予測システム1は、収集した人数時系列データのデータ量が十分であるか否かを判定する(ステップS102)。人流予測システム1は、例えば、予測モデルの予測精度が十分な精度を得ることができるデータ量を予め設定しておき、当該データ量を超えた場合に収集した人数時系列データのデータ量が十分であると判定する。人流予測システム1は、収集した人数時系列データのデータ量が十分ではない場合(ステップS102:NO)、ステップS100の処理を繰り返し、収集した人数時系列データのデータ量が十分である場合(ステップS102:YES)、機械学習アルゴリズムを作成する(ステップS104)。人流予測システム1は、上述したように、機械学習アルゴリズムの選定や、機械学習アルゴリズムにおけるパラメータの設定などのチューニングを行う。
【0039】
次に人流予測システム1は、作成した機械学習アルゴリズムに予測対象地点の人流時系列データを入力することで処理パラメータを学習させることで、当該予測対象地点の予測モデル20を作成する(ステップS106)。人流予測システム1は、作成した予測モデル20の予測精度が十分であるか否かを判定する(ステップS108)。人流予測システム1は、予測精度が十分ではない場合(ステップS108:NO)、予測精度を向上させるように、機械学習アルゴリズムの作成(ステップS104)および学習(ステップS106)を繰り返す。人流予測システム1は、予測精度が十分である場合(ステップS108:YES)、当該予測モデル20を予測装置200に導入し、予測対象地点で得た人数を予測装置200に入力し、予測装置200により未来の人数を予測し(ステップS110)、予測対象地点の予測結果を提供する(ステップS112)。これにより、人流予測システム1は、各予測対象地点に個別の予測モデル20を構築することができる。
【0040】
つぎに第2段階の処理を説明する。人流予測システム1は、例えば、第1段階の処理により予測モデル20が導入された地点が所定数を超えたことに基づいて第2段階の開始を判定する(ステップS10)。まず、人流予測システム1は、複数の予測対象地点について属性情報および人流情報を収集する(ステップS200)。次に人流予測システム1は、グループ化処理を行う(ステップS202)。なお、属性情報および人流情報の収集処理およびグループ化処理は、図6を参照して詳細に説明する。次に人流予測システム1は、グループごとに機械学習アルゴリズムを作成し(ステップS204)、作成した機械学習アルゴリズムを学習させることでグループごとに予測モデル20を作成する(ステップS205)。人流予測システム1は、グループごとの予測モデル20に関する情報を記憶する(ステップS206)。
【0041】
つぎに第3段階の処理を説明する。人流予測システム1は、例えば、管理者の操作に基づいて予測対象地点および第3段階を指定する命令を受け付けることによって、第3段階の開始を判断する(ステップS10)。まず、人流予測システム1は、予測対象地点について属性情報および人流情報を収集する(ステップS300)。次に人流予測システム1は、属性情報および/または人流情報に基づいて予測対象地点をいずれかのグループに分類する(ステップS302)。次に人流予測システム1は、予測対象地点について人数時系列データを収集する(ステップS304)。次に人流予測システム1は、収集した人数時系列データのデータ量が十分であるか否かを判定する(ステップS306)。人流予測システム1は、例えば、収集した人数時系列データのデータ量が所定値を超えた場合、データ量が十分であると判定する。人流予測システム1は、収集した人数時系列データのデータ量が十分ではない場合(ステップS306:NO)、分類されたグループの予測モデル20で予測を行い(ステップS312)、予測結果を提供する(ステップS314)。人流予測システム1は、収集した人数時系列データのデータ量が十分である場合(ステップS306:YES)、分類されたグループの機械学習アルゴリズムを、当該収集した人数時系列データに入力することで学習させて予測モデル20を作成し、作成した予測モデル20で予測を行い(ステップS310)、予測結果を提供する(ステップS314)。
【0042】
図6は、グループ化処理の一例を示すフローチャートである。
まず、人流予測システム1は、第1段階で予測モデル20が構築された全予測対象地点について属性情報を収集する(ステップS400)。次に人流予測システム1は、第1段階で予測モデル20が構築された全予測対象地点について人流情報を収集する(ステップS402)。次に人流予測システム1は、予測対象地点ごとに特徴量ベクトルを抽出する(ステップS404)。次に人流予測システム1は、クラスタリングを行う(ステップS406)。次に人流予測システム1は、クラスタリングにより得たグループについて予測精度を評価する(ステップS408)。次に人流予測システム1は、予測精度が十分ではない場合(ステップS410:NO)、クラスタリングおよび予測精度の評価を繰り返し、予測精度が十分である場合(ステップS410:YES)、グループ情報、およびグループ属性情報を登録する(ステップS412)。
【0043】
[属性情報の収集(ステップS400)]
図7は、人流が変動する要因(人流要因)とエリア特性との関係の一例を示す図である。図8は、属性のカテゴリおよび属性情報の項目の一例を示す図である。
例えば、イベント系エリア、ビジネス系エリア、およびベッドタウン系エリアといったエリア特性に分類した場合、それぞれのエリアについての人流が変動する要因は異なる。例えば、イベント系エリアは、ショッピングセンター、テーマパーク、イベントホールまたはスタジアムといったイベント系施設により開催されるイベントにより人流に与える影響は多い。このような観点より、属性情報は、図8に示したようなカテゴリおよび項目として設定される。人流予測システム1は、グループ化の対象の予測対象地点について、人口統計、予測対象地点から所定の範囲に存在する周辺施設、地域特性、交通機関に関する属性情報を収集し、データベース装置400に登録する。なお、人流予測システム1は、属性情報の項目ごとに、異なる情報提供装置から情報を収集してもよく、オープンデータやセンサ検出信号から情報を収集してもよい。
【0044】
[人流情報の収集(ステップS402)]
図9は、人数時系列データの項目の一例を示す図である。図10は、1日の人数時系列データの一例を示す図である。図11は、人流情報に関する項目の一例を示す図である。人流予測システム1は、予測対象地点ごとに日時と人数とが対応した情報である人数時系列データを収集する。人数時系列データは、予測対象地点ごとに時間分解能が同じであってもよく異なっていてもよく、人数は、予測対象地点の滞在人数、流入人数、流出人数などであるが、予測対象地点ごとに同じであってもよく異なっていてもよい。さらに、人流予測システム1は、モバイル空間統計や流動人口データなどの有料のオープンデータを取得してもよい。
【0045】
[特徴量ベクトルの抽出(ステップS404)]
特徴ベクトルの抽出処理は、グループ化処理に含まれる処理である。
(特異データの除外)
人流予測システム1は、特徴量ベクトルの抽出処理の前処理として、予測対象地点ごとに、特異な人数時系列データを除外する。特異な人数時系列データは、例えば、予測対象地点における平時の人数時系列データの傾向が大きく異なる日の人数時系列データであって、外れ値である。
【0046】
人流予測システム1は、外れ値を除外するため、まず、祝日や年末年始などの休日といった人流情報に付随する情報を日曜日に変更する。次に人流予測システム1は、予測対象地点ごとに、曜日ごとの人流時系列データの平均値、および時間帯ごとの人流時系列データの平均値を作成する。次に人流予測システム1は、予測対象地点ごとに、各日の人数時系列データについて平均絶対パーセント誤差(MAPE(Mean absolute percentage error))を計算する。なお、人流予測システム1は、標準化処理により人数時系列データのスケールを予測対象地点間で揃える処理を行った後に乗平均平方根誤差(RMSE(root mean squared error))または平均絶対誤差(MAE(mean absolute error))を計算してもよい。人流予測システム1は、例えばMAPEから日ごとのヒストグラムまたは箱ひげ図を作成し、日ごとのMAPEの分布に基づいて外れ値とみなすための閾値を設定する。人流予測システム1は、人流時系列データの値が閾値を超えた日の人数時系列データを特異データとして除外する。これにより、人流予測システム1は、1日の人流時系列データのパターン(傾向)が平時の人数時系列データのパターンから大きく外れている日の人数時系列データを除外することができる。
【0047】
図12は、人数時系列データの一例を示す図であり、(A)は平時の人数時系列データであり、(B)は特異日の人数時系列データであり、(C)は平時の人数時系列データの他の例である。人流予測システム1は、図12(A)の1日の人数時系列データA1や、一時的にイベントが発生した人数時系列データA3ように、1日全体で平時の人数時系列データBのパターンと近いパターンの人数時系列データを除外せず、図12(B)のように1日の全体で平時の人数時系列データBと異なる人数時系列データA2を除外することができる。人数時系列データA2は、例えば、台風が発生した日のデータである。
【0048】
(グループの分類)
図13は、グループの属性の一例を示す図である。予測対象地点のグループは、例えば、1日の人流時系列データのパターンによって分類される。人流時系列データのパターンは、例えば、イベント系エリア、ビジネス系エリア、商業系エリア、ベッドタウン系エリア等のいずれかのエリアに対応すると想定される。人流時系列データのパターンに与える要素として、平日と休日、曜日、日々の変動、日中と夜間、季節性、周期性などがある。人流予測システム1は、これらの人流時系列データのパターンに与える要素を変数とした特徴量ベクトルを生成する。
【0049】
(標準化処理)
人流予測システム1は、人数時系列データのパターンを適切に抽出するために、予測対象地点間でスケールを合わせる標準化処理を行う。なお、スケールを合わせるための数値変換処理としては、標準化およびMin-Maxスケーリングがあげられるが、人流予測システム1は、予測対象地点ごとに数値変換処理を行うことになり、予測対象地点ごと最小値および最大値が異なることによって偏りが生まれるため、標準化処理を行うことが望ましい。
【0050】
(人数時系列データの変動)
図14は、予測対象地点ごとの、平日時間帯単位の人数の母標準偏差、および休日時間帯単位の人数の母標準偏差を示す図である。人流予測システム1は、人数時系列データのパターンとは別に、予測対象地点ごとに、分散、標準偏差などの、ばらつきや人数変動を表すデータを作成する。人流予測システム1は、特徴量ベクトルの変数の一つとして、ばらつきや人数変動を表すデータを含めることができる。これにより、人流予測システム1は、例えば、図14に示す地点ID=7における休日の12時帯および21時帯のような、イベント系エリアなどで発生する突発的な混雑等がある地点を分類することができる。なお、人流予測システム1は、母標準偏差に限らず、分散または変動係数を表す数値を、人数の変動やバラツキを表す値として計算してもよい。
【0051】
図15は、予測対象地点ごとの人数時系列データの変動の振れ幅の一例を示す図である。人流予測システム1は、例えば、予測対象地点ごとに、1週間分の1時間単位の平均値における振れ幅を計算してもよい。人流予測システム1は、複数の予測対象地点のそれぞれについて1週間の平均値の振れ幅Da~Dfをそれぞれ計算する。人流予測システム1は、極端な値を除外するために、95%タイル~5%タイルに含まれる平均値を、有効な振れ幅として計算することが望ましい。なお、図14において地点ID=1と地点ID=35の地点間で平均値は同程度であれるが、図15に示すように、地点ID=1と地点ID=35の地点間で変動の振れ幅が大きく異なることが分かる。これにより、人流予測システム1は、特徴量ベクトルの変数の一つとして、1週間における変動の振れ幅を含めることができる。
【0052】
(人数時系列データのパターン)
図16は、予測対象地点ごとの、平日における時間帯別平均値および休日における時間帯別平均値の一例を示す図である。人流予測システム1は、1日中における人数時系列データのパターンをモデル化するために、予測対象地点ごとに、平日および休日それぞれについて3つの時点における平均値を抽出する。3つの時点の平均値は、例えば、所定幅を持つ時間帯の移動平均等の代表値であってよい。また、時間帯間の増減であってもよい。これにより、人流予測システム1は、平日における3つの時間帯に亘る平均値の変化をモデル化する。人流予測システム1は、予測対象地点ごとに、例えば、3つの時間帯で12時の時間帯に平均値が増加するモデル、3つの時間帯で6時の時間帯に平均値が増加するモデル、3つの時間帯で21時の時間帯に平均値が増加するモデル、1日中に亘り平均値が変化しないモデルなどのモデルに分類することができる。人流予測システム1は、特徴量ベクトルの変数の一つとして、人数時系列データのパターンのモデルを示す情報を含めることができる。なお、1日の人数時系列データのパターンをモデル化できれば、3つの時点ではなく、任意の時点のデータを用いてよい。
【0053】
図17は、予測対象地点ごとの、曜日毎の1日における平均値の変化の一例を示す図である。人流予測システム1は、平日の人数時系列データのパターンと、休日の人数時系列データのパターンの相違を抽出して良い。人流予測システム1は、例えば、平日の人数時系列データのパターンと休日の人数時系列データのパターンとが相違しない地点ID=1,6,11の予測対象地点と、平日の人数時系列データのパターンと休日の人数時系列データのパターンとが相違する地点ID=21,26,35の予測対象地点とで分類することができる。また、人流予測システム1は、平日・休日別だけではなく、曜日別に人数時系列データのパターンを分類してもよい。人流予測システム1は、特徴量ベクトルの変数の一つとして、平日と休日との人数時系列データのパターンの相違を示す情報や、曜日別を人数時系列データのパターンの相違を示す情報を含めることができる。
【0054】
(人数時系列データの季節性)
図18は、月ごとに1日における人数時系列データの一例を示す図である。図18において、予測対象地点A~Fにおいて月ごとの人数時系列データの変化がない、すなわち季節性がないことを表している。季節性とは、特定の季節に特有の人数時系列データのパターンが存在するか否かを表す。人流予測システム1は、例えば、12ヶ月のうち7月だけ特有な人数時系列データのパターンがある場合に季節性があると判断する。したがって、人流予測システム1は、予測対象地点A~Fの特徴量ベクトルの変数の一つとして、季節性がないことを示す情報を含めることができる。また、人流予測システム1は、人数時系列データのパターンを把握するため、季節性がある人数時系列データを除去してよい。さらに、人流予測システム1は、複数の予測対象地点において季節性が同じ数時系列データが存在する場合、当該複数の予測対象地点の特徴量ベクトルの変数の一つとして、季節性があることを示す情報を含めることができる。
【0055】
(人数時系列データの周期性)
図19の(A)は予測対象地点Aにおける偏自己相関を示すコレログラムを示す図であり、(B)は予測対象地点Bにおける偏自己相関を示すコレログラムを示す図である。図19(A)によれば、予測対象地点Aにおいては、約24時間周期において偏自己相関(PACF(partial autocorrelation function))が1に近く周期性が強いことが分かり、日々の人数変動が少ないことが分かる。図19(B)よれば、予測対象地点Bにおいては、約24時間周期において偏自己相関が小さいため周期性が弱いことが分かり、日々の人数変動が多いことが分かる。したがって、予測対象地点AおよびBに異なる周期性があるものとしてグループを分類することができる。人流予測システム1は、予測対象地点の特徴量ベクトルの変数の一つとして、周期性(有無および周期)を示す情報を含めることができる。なお、実施形態はPACFを用いたが、自己相関(ACF(autocorrelation function))などの周期性を表す他の指標を用いてよい。
【0056】
[クラスタリング(ステップS406)]
図20は、階層型クラスタリングの一例を説明するための図である。人流予測システム1は、上述したように抽出した予測対象地点の特徴量ベクトルを用いてクラスタリングを行う。人流予測システム1は、例えば、クラスタリング手法としてk-meansを用いて予測対象地点の特徴量ベクトルをクラスタリングする。人流予測システム1は、例えば、特徴量ベクトル同士の距離が近い2つの予測対象地点をクラスタリングする階層型クラスタリングを行い、所定の閾値(図20中の点線)を用いて最終的なグループの個数(クラスタ数)を決定してよい。
【0057】
また、人流予測システム1は、階層型クラスタリングに代えて、1つの予測対象地点(要素)を複数のグループに所属させることができるソフトクラスタリングでクラスタ数を増やしてよい。人流予測システム1は、意味のあるクラスタ分割が行われない場合に、クラスタ数の増加を停止する。図21は、クラスタ数がG1~G4の4である場合の予測対象地点ごとのスコアの一例を表す図であり、図22は、クラスタ数がG1~G5の5である場合の予測対象地点ごとのスコアの一例を表す図である。図21および図22に示すスコアは、特徴量ベクトルに基づいて算出された、予測対象地点が属するグループの確からしさを表す値であり、例えばG1~G4の合計値が約1になるように算出される。図21図22とを比較すると、図22のG4およびG5のスコアが、図21におけるG4のスコアを略等分したスコアになっているため、クラスタ数は4が適切であることが分かる。
【0058】
図23は、人数時系列データを加工しない場合の予測対象地点とクラスタリング結果との関係を示す図であり、図24は、人数時系列データを標準化した場合の予測対象地点とクラスタリング結果との関係を示す図である。人流予測システム1は、クラスタリング手法としてk-meansを用いて予測対象地点の特徴量ベクトルをクラスタリングする。図23によれば、イベント系エリアと想定した予測対象地点(地点ID=1~7)とベッドタウン系エリアと想定した予測対象地点(地点ID=22~28)とが共にベッドタウン系エリアに対応するグループID=4に属している。これに対し、図24によれば、一つのグループにクラスタリング結果が偏ることなく、予測対象地点を各グループに分類することができていることが分かる。
【0059】
[グループの予測精度評価(ステップS408)]
図25は、グループと、予測対象地点に個別に導入された予測モデルの予測誤差率と、グループの予測モデルの予測誤差率と、悪化率との対応を示す図である。予測対象地点に個別に導入された予測モデルの予測誤差率は、例えば、4つの予測対象地点a~dがグループ1に属する場合に、予測対象地点それぞれで取得した人数時系列データを、予測対象地点それぞれの個別の予測モデルに入力し、当該予測モデルの予測結果の誤差率を平均した値である。グループの予測モデルの予測誤差率は、例えば、グループ1を代表する一つの予測モデルに、予測対象地点a~dそれぞれで取得した人数時系列データを、代表の予測モデルに入力し、当該代表の予測モデルの予測結果の誤差率である。個別の予測モデルは、例えば予測対象地点aの人数時系列データのみを用いて学習した予測モデルであり、グループ1を代表する一つの予測モデルは、例えば、予測対象地点a~dで取得した人数時系列データで学習された一つの予測モデルである。悪化率は、予測対象地点に個別に導入された予測モデルの予測誤差率とグループの予測モデルの予測誤差率との差分である。グループ1の悪化率合計値とグループ2の悪化率合計値とを比較した場合、グループ2よりもグループ1の悪化率が低いことが分かる。なお、人流予測システム1は、グループに含まれる予測対象地点を追加または削除することによる予測精度の変化に基づいてグループの分類やクラスタ数を変更してよい。
【0060】
具体的にグループに対応した機械学習アルゴリズムの決定処理を説明する。例えば図24に示した地点ID=1~28のそれぞれに個別の予測モデルが構築されているとする。人流予測システム1は、データベース装置400から読み出した地点ID=1~28のそれぞれの人流情報を用いて地点ID=1~28のそれぞれの特徴量ベクトルを抽出し、特徴量ベクトルを用いてクラスタリングを行う。そして、人流予測システム1は、想定したグループにクラスタリングされた地点のうち何れか一つの予測モデルと同じ機械学習アルゴリズムを、グループで一つの機械学習アルゴリズム(汎用の機械学習アルゴリズム)として決定する。例えば、人流予測システム1は、属性がベッドタウン系に該当すると想定された地点であってクラスタリングによりベッドタウン系に該当する地点ID=23,24,25,26の複数の機械学習アルゴリズムうち、一つの機械学習アルゴリズムを決定する。人流予測システム1は、例えば、地点ID=23、24,25,26のそれぞれの予測モデルを用いて、当該予測モデルの地点以外の地点の人数を予測する。そして、人流予測システム1は、予測結果の悪化率が最も低い予測モデルに対応した機械学習アルゴリズムを、ベッドタウン系を代表する機械学習アルゴリズムとして決定する。
【0061】
また、各地点の予測モデルを選択して決定する(上記の決定処理)のではなく、各地点の予想モデルに対応した機械学習アルゴリズムの、それぞれの部分を組み合わせた機械学習アルゴリズムを作成することで、グループを代表する機会学習アルゴリズムを決定してもよい。人流予測システム1は、予め複数の組み合わせパターンを用意しておく。人流予測システム1は、組み合わせパターンを網羅するように部分同士を組み合わせることで、複数の機械学習アルゴリズムを作成し、複数の予測モデルを生成する。人流予測システム1は、当該予測モデルを用いて、当該グループにクラスタリングされた各地点の人数を予測し、予測結果の悪化率が最も低い機械学習アルゴリズムを、グループを代表するアルゴリズムとして決定する。各地点の予測モデルに対応した機械学習アルゴリズムの部分とは、機械学習アルゴリズムの主となる要素であり、例えば、機械学習手法、ハイパーパラメーター、学習データの項目、評価関数・損失関数などの機械学習アルゴリズムの種類、性能または処理内容等を決定する要素である。機械学習アルゴリズムの組み合わせパターンとは、一つの機械学習アルゴリズムを作成するための機械学習アルゴリズムの主となる要素の組み合わせである。人流予測システム1は、例えば、機械学習手法として地点ID=23のもの(例えば、SVM)を用い、学習データの項目として地点ID=24、25のものを用いて、一つの機械学習アルゴリズムを決定する。
【0062】
[グループごとの予測モデルの作成(ステップS204およびS206)]
図26は、1分単位の人数時系列データ(実測値)と、平滑化した人数時系列データを示す図である。人流予測システム1は、グループごとに、当該グループを代表する一つの予測モデルを作成する。人流予測システム1は、突発的な混雑に対する予測精度の低下を抑制するために、予測モデルの学習のために曜日別や時間帯の過去平均データを入力せず、移動平均を行った平滑化した人数時系列データを使用することが望ましい。
【0063】
図27は、予測モデルの学習処理の一例を示す図である。人流予測システム1は、グループ1の予測モデル(G1)を学習させる場合、実測人数と予測値との誤差を用いて予測モデル(G1)を学習させ、学習後の予測モデル(G1)を用いて5分後の人数を予測させ、5分後の実測人数と予測値との誤差を用いて予測モデル(G1)を更に学習させる。このように、人流予測システム1は、スタッキングと呼ばれる予測モデルの学習を行う。
【0064】
<実施形態の効果>
以上説明したように、第1実施形態の人流予測システム1によれば、複数の予測対象地点のうち一部の予測対象地点を含むグループを生成する予測モデル生成部(12,14,16)と、グループ生成部により生成されたグループに対応した予測モデルであって、グループに含まれる予測対象地点の人流情報を教師データとして機械学習させた予測モデルを作成する予測モデル作成部(18,300)と、を備える、学習装置を実現することができる。この人流予測システム1によれば、予測対象地点における未来の特定時刻の人数等の情報を高い精度で予測することができる。すなわち、人数時系列データが未知の予測対象地点における特定時刻(未来)の人数を高い精度で予測したい場合、予測対象地点に最適な機械学習アルゴリズムのチューニングを行って予測モデルを作成する必要がある。これに対し、人流予測システム1によれば、未知の予測対象地点が属するグループの予測モデルを用いて予測することができる。また、人数時系列データが未知の予測対象地点における予測精度を高くするためには大量の学習データを用意して予測モデルに学習させる必要がある。これに対し、人流予測システム1によれば、グループに含まれる予測対象地点の人流情報を教師データとして機械学習させた予測モデルを用いて未知の予測対象地点における予測することができる。
【0065】
図28(A)は、同じ機械学習アルゴリズムを複数の地点A~Fに導入した場合の予測の誤差率の一例を示す図である。このように異なる地点に同じ機械学習アルゴリズムを導入しても、地点間の人流時系列データのバラツキによって予測精度を高くすることができない。図28(B)は、任意地点の予測モデルを他の地点に導入した場合の予測精度の悪化率の一例を示す図である。このように、図中のA→Bのように、ある地点Aでの予測精度が高くても、他の地点Bに同じ予測モデルを導入した場合、悪化率が大きくなってしまう。これに対し、人流予測システム1は、複数の予測対象地点のうち一部の予測対象地点を含むグループに対応した予測モデルであって、グループに含まれる予測対象地点の人流情報を教師データとして機械学習させた予測モデルを作成することにより、あるグループに適した未知の地点に、当該グループの予測モデルを導入することができる。この結果、人流予測システム1によれば、未知の地点の属するグループの予測モデルを導入するので、予測精度の誤差率や悪化率を抑制することができる。
【0066】
人流予測システム1によれば、複数の予測対象地点における人流情報に基づく特徴量ベクトルを各予測対象地点について抽出し、複数の特徴量ベクトルに基づくグループを生成する。これにより、人流予測システム1によれば、人流に基づいてグループを作成することができる。この結果、人流予測システム1によれば、グループに含まれる予測対象地点の人流に類似する人流を持つ新たな予測対象地点の予測精度を高くすることができる。
【0067】
人流予測システム1によれば、予測対象地点における人流情報に含まれる時系列データのパターンを表す情報、時系列データの変動を表す情報、時系列データの季節性を表す情報、時系列データの周期性を表す情報の少なくとも一つを含む特徴量ベクトルを用いてグループを作成するので、例えば、類似した時系列データのパターン、変動、季節性、周期性を持つ複数の予測対象地点を一つのグループに含めることができる。
【0068】
人流予測システム1によれば、予測対象地点における時系列データとして、特異日を除外したデータであって時系列データ間のスケールを標準化したデータを用いて特徴量ベクトルを作成するので、他の予測対象地点と大きく異なる時系列データが計測された予測対象地点が同じグループに含まれることを抑制することができる。
【0069】
人流予測システム1によれば、機械学習アルゴリズムの選定および前記機械学習アルゴリズムのパラメータのチューニングを行い、当該機械学習アルゴリズムを機械学習させて予測モデルを作成するので、グループに適した機械学習アルゴリズムを用いることができ、グループに属する予測対象地点における予測精度を向上させることができる。また、人流予測システム1によれば、予測対象地点ごとに機械学習アルゴリズムをチューニングする手間を省くことができる。
【0070】
人流予測システム1によれば、グループに含まれる予測対象地点に対応した予測モデルの予測精度(誤差率)とグループに対応した予測モデルの予測精度(誤差率)との比較(悪化率)に基づいてグループを決定するので、グループの予測モデルの予測精度が低下することを抑制することができる。
【0071】
人流予測システム1によれば、グループに含まれる予測対象地点の属性情報に基づいてグループの属性を表すグループ情報を生成し、新たな予測対象地点の属性情報とグループ情報とに基づいて、新たな予測対象地点をグループに分類し、新たな予測対象地点における人流の時系列データに基づいて、分類されたグループの予測モデルを機械学習させる。これにより、人流予測システム1によれば、グループに適した新たな予測対象地点について、当該グループの予測モデルを導入することができる。この結果、人流予測システム1によれば、新たな予測対象地点についての機械学習アルゴリズムをチューニングの手間を省き、さらに、新たな予測対象地点における予測精度の低下を抑制することができる。
【0072】
人流予測システム1によれば、複数の予測対象地点のうち一部の予測対象地点を含むグループに対応した予測モデルであって、グループに含まれる予測対象地点の人流情報を教師データとして機械学習させた予測モデルに、グループに含まれる予測対象地点以外の新たな予測対象地点から取得したデータを入力し、予測モデルの出力に基づいて未来の人流を予測する予測部を備える、予測装置(200)を実現することができる。人流予測システム1によれば、予測対象地点における未来の特定時刻の人数等の情報を高い精度で予測することができる。
【0073】
人流予測システム1によれば、新たな予測対象地点から取得したデータを用いた学習量が所定値を超えていない場合、新たな予測対象地点から取得したデータにより機械学習をしていない予測モデルを用いた予測を行い、新たな予測対象地点から取得したデータを用いた学習量が所定値を超えている場合、新たな予測対象地点から取得したデータにより機械学習をしていない予測モデルを用いた予測を行う。これにより、人流予測システム1によれば、新たな予測対象地点に予測モデルを導入した初期の予測精度の低下を抑制し、導入後に更に予測精度を向上させることができる。
【0074】
なお、各実施形態および変形例について説明したが、一例であってこれらに限られず、例えば、各実施形態や各変形例のうちのいずれかや、各実施形態の一部や各変形例の一部を、他の1または複数の実施形態や他の1または複数の変形例と組み合わせて本発明の一態様を実現させてもよい。
【0075】
なお、本実施形態における人流予測システム1の各処理を実行するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、当該記録媒体に記録されたプログラムを、コンピュータシステムに読み込ませ、実行することにより、人流予測システム1に係る上述した種々の処理を行ってもよい。
【0076】
なお、ここでいう「コンピュータシステム」とは、OSや周辺機器などのハードウェアを含むものであってもよい。また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリなどの書き込み可能な不揮発性メモリ、CD-ROMなどの可搬媒体、コンピュータシステムに内蔵されるハードディスクなどの記憶装置のことをいう。
【0077】
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネットなどのネットワークや電話回線などの通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic
Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、このプログラムを記憶装置などに格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。
【0078】
ここで、プログラムを伝送する「伝送媒体」は、インターネットなどのネットワーク(通信網)や電話回線などの通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
【0079】
以上、本発明の実施形態について図面を参照して詳述したが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計なども含まれる。
【符号の説明】
【0080】
1 人流予測システム
10 予測モデル生成部
12 特徴ベクトル抽出部
14 クラスタリング部
16 グループ生成部
18 機械学習アルゴリズムチューニング部
20 予測モデル
100 サービス提供装置
200 予測装置
300 学習装置
400 データベース装置
500 データ収集装置
600 センサ
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27
図28