(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2023-11-30
(45)【発行日】2023-12-08
(54)【発明の名称】情報処理装置、情報処理方法、およびプログラム
(51)【国際特許分類】
G01C 21/26 20060101AFI20231201BHJP
G08G 1/005 20060101ALI20231201BHJP
G16Y 10/40 20200101ALI20231201BHJP
G16Y 20/20 20200101ALI20231201BHJP
G16Y 40/20 20200101ALI20231201BHJP
【FI】
G01C21/26 P
G08G1/005
G16Y10/40
G16Y20/20
G16Y40/20
(21)【出願番号】P 2023521589
(86)(22)【出願日】2022-04-28
(86)【国際出願番号】 JP2022019258
【審査請求日】2023-04-07
【早期審査対象出願】
(73)【特許権者】
【識別番号】399037405
【氏名又は名称】楽天グループ株式会社
(74)【代理人】
【識別番号】100109380
【氏名又は名称】小西 恵
(74)【代理人】
【識別番号】100109036
【氏名又は名称】永岡 重幸
(72)【発明者】
【氏名】ポリヤプラム ヴィネーラジュ
(72)【発明者】
【氏名】ミード カイル アーロン
【審査官】上野 博史
(56)【参考文献】
【文献】特開2012-003494(JP,A)
【文献】国際公開第2013/179359(WO,A1)
【文献】特表2020-520520(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G01C 21/00-21/36
23/00-25/00
G08G 1/00-99/00
G16Y 10/40
G16Y 20/20
G16Y 40/20
(57)【特許請求の範囲】
【請求項1】
ユーザの移動軌跡を取得する取得部と、
前記移動軌跡から当該移動に関する特徴を示す移動情報を導出する導出部と、
前記移動軌跡と前記移動情報に、前記ユーザの交通手段を示すラベルを対応付けた、学習データを生成する生成部と、
を有し、
前記生成部は、前記移動軌跡を、地図情報にマッピングし、前記移動軌跡に整合する前記地図情報におけるエリアや経路に対応する交通情報を示すソフトラベルを、前記移動軌跡に付与し、
前記ソフトラベルと前記移動情報を所定の関数に入力することにより、前記移動軌跡と前記移動情報に対応付けた、前記ラベルを出力し、
前記地図情報は、鉄道ネットワークおよびバス経路ネットワークの情報を含み、
前記ソフトラベルは、前記地図情報に対応する、前記ラベルに対する潜在的なラベルである、ことを特徴とする情報処理装置。
【請求項2】
前記移動軌跡は、タイムスタンプを有する、前記ユーザの位置の緯度と経度を含むことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記移動情報は、前記移動軌跡における2地点間の速度を含むことを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記移動情報は、前記移動軌跡における2地点間の速度、加速度、加加速度、方位、方位差、および、複数の2地点間の速度差、加速度差、平均速度、平均速度差、平均加速度のうちの1つ以上を含むことを特徴とする請求項1に記載の情報処理装置。
【請求項5】
前記交通手段は、車、電車、バス、自転車、徒歩、ボートまたは船、のうち1つ以上を含むことを特徴とする請求項1に記載の情報処理装置。
【請求項6】
前記ソフトラベルは、道路、鉄道、バス、ボートまたは船、のうち1つ以上を含むことを特徴とする請求項
1に記載の情報処理装置。
【請求項7】
前記学習データを用いて、前記移動軌跡および前記移動情報と、前記ラベルとの関係を機械学習のための学習モデルに学習させる学習部を更に有することを特徴とする請求項1に記載の情報処理装置。
【請求項8】
情報処理装置により実行される情報処理方法であって、
ユーザの移動軌跡を取得する取得工程と、
前記移動軌跡から当該移動に関する特徴を示す移動情報を導出する導出工程と、
前記移動軌跡と前記移動情報に、前記ユーザの交通手段を示すラベルを対応付けた、学習データを生成する生成工程と、
を有し、
前記生成工程では、前記移動軌跡を、地図情報にマッピングし、前記移動軌跡に整合する前記地図情報におけるエリアや経路に対応する交通情報を示すソフトラベルを、前記移動軌跡に付与し、
前記ソフトラベルと前記移動情報を所定の関数に入力することにより、前記移動軌跡と前記移動情報に対応付けた、前記ラベルを出力し、
前記地図情報は、鉄道ネットワークおよびバス経路ネットワークの情報を含み、
前記ソフトラベルは、前記地図情報に対応する、前記ラベルに対する潜在的なラベルである、ことを特徴とする情報処理方法。
【請求項9】
情報処理をコンピュータに実行させるための情報処理プログラムであって、該プログラムは、前記コンピュータに、
ユーザの移動軌跡を取得する取得処理と、
前記移動軌跡から当該移動に関する特徴を示す移動情報を導出する導出処理と、
前記移動軌跡と前記移動情報に、前記ユーザの交通手段を示すラベルを対応付けた、学習データを生成する生成処理と、を含む処理を実行させるためのものであり、
前記生成処理は、前記移動軌跡を、地図情報にマッピングし、前記移動軌跡に整合する前記地図情報におけるエリアや経路に対応する交通情報を示すソフトラベルを、前記移動軌跡に付与し、
前記ソフトラベルと前記移動情報を所定の関数に入力することにより、前記移動軌跡と前記移動情報に対応付けた、前記ラベルを出力し、
前記地図情報は、鉄道ネットワークおよびバス経路ネットワークの情報を含み、
前記ソフトラベルは、前記地図情報に対応する、前記ラベルに対する潜在的なラベルである、
情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、およびプログラムに関し、特に、学習データを生成する技術に関する。
【背景技術】
【0002】
ユーザが携帯するスマートフォンから取得したセンサデータから、当該ユーザの交通手段(徒歩、車、バス、電車等)を機械学習により予測する技術が開発されている(非特許文献1)。
【先行技術文献】
【非特許文献】
【0003】
【文献】Ifigenia Drosouli, et al., “Transportation Mode Detection Using an Optimized Long Short-Term Memory Model on Multimodal Sensor Data”, Entropy, vol. 23, issue 11, p. 1457, November 2021
【発明の概要】
【発明が解決しようとする課題】
【0004】
当該文献に開示された技術では、スマートフォンに搭載された6つのセンサ(加速度センサ、ジャイロスコープ、地磁気センサ、圧力センサ、GPS(高度計測)、温度)と、ユーザの交通手段とを関連付けることにより生成したデータを、学習データ(教師データ)として用いている。しかしながら、当該手法では、学習データを生成するために、スマートフォンに6つのセンサを搭載しなければならず、交通手段を予測するための学習データを生成するため処理が煩雑であり、より効率的な手法が望まれる。
【0005】
本発明は上記課題を解決するためになされたものであり、交通手段を予測する機械学習のための学習データを効率的に生成することを目的とする。
ことを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明に係る情報処理装置の一態様は、ユーザの移動軌跡を取得する取得部と、前記移動軌跡から当該移動に関する特徴を示す移動情報を導出する導出部と、前記移動軌跡と前記移動情報に、前記ユーザの交通手段を示すラベルを対応付けた、学習データを生成する生成部と、を有し、前記ラベルは、前記移動情報を所定の関数に入力することにより出力される。
【0007】
前記移動軌跡は、タイムスタンプを有する、前記ユーザの位置の緯度と経度を含みうる。
【0008】
前記移動情報は、前記移動軌跡における2地点間の速度を含みうる。
前記移動情報は、前記移動軌跡における2地点間の速度、加速度、加加速度、方位、方位差、および、複数の2地点間の速度差、加速度差、平均速度、平均速度差、平均加速度のうちの1つ以上を含みうる。
【0009】
前記交通手段は、車、電車、バス、自転車、徒歩、ボートまたは船、のうち1つ以上を含みうる。
【0010】
前記生成部は、前記移動軌跡を、地図情報にマッピングし、前記移動軌跡に整合する前記地図情報におけるエリアや経路に対応する交通情報を示すソフトラベルを、前記移動軌跡に付与し、前記ソフトラベルと前記移動情報を所定の関数に適用することにより、前記移動軌跡と前記移動情報に、前記ラベルを対応付けうる。
【0011】
前記ソフトラベルは、道路、鉄道、バス、ボートまたは船、のうち1つ以上を含みうる。
【0012】
前記地図情報は、道路ネットワーク、鉄道ネットワーク、バス経路ネットワーク、地域領域の境界に関する情報を含みうる。
【0013】
前記情報処理装置は、前記学習データを用いて、前記移動軌跡および前記移動情報と、前記ラベルとの関係を前記機械学習のための学習モデルに学習させる学習部を更に有しうる。
【0014】
上記課題を解決するために、本発明に係る情報処理方法の一態様は、ユーザの移動軌跡を取得する取得工程と、前記移動軌跡から当該移動に関する特徴を示す移動情報を導出する導出工程と、前記移動軌跡と前記移動情報に、前記ユーザの交通手段を示すラベルを対応付けた、学習データを生成する生成工程と、を有し、前記ラベルは、前記移動情報を所定の関数に入力することにより出力される。
【0015】
上記課題を解決するために、本発明に係るプログラムの一態様は、情報処理をコンピュータに実行させるための情報処理プログラムであって、該プログラムは、前記コンピュータに、ユーザの移動軌跡を取得する取得処理と、前記移動軌跡から当該移動に関する特徴を示す移動情報を導出する導出処理と、前記移動軌跡と前記移動情報に、前記ユーザの交通手段を示すラベルを対応付けた、学習データを生成する生成処理と、を含む処理を実行させるためのものであり、前記ラベルは、前記移動情報を所定の関数に入力することにより出力される。
【発明の効果】
【0016】
本発明によれば、交通手段を予測する機械学習のための学習データを効率的に生成することが可能となる。
上記した本発明の目的、態様及び効果並びに上記されなかった本発明の目的、態様及び効果は、当業者であれば添付図面及び請求の範囲の記載を参照することにより下記の発明を実施するための形態から理解できるであろう。
【図面の簡単な説明】
【0017】
【
図2】
図2は、情報処理装置の機能構成の一例を示す。
【
図3】
図3は、情報処理装置のハードウェア構成の一例を示す。
【
図4】
図4は、学習データの生成処理のフローチャートを示す。
【
図5】
図5は、ソフトラベルの付与の処理を説明するための概念図を示す。
【
図6】
図6は、ラベル付け関数の入力と出力の概念図を示す。
【
図7】
図7は、交通手段予測モデルのアーキテクチャの一例を示す。
【
図8】
図8は、交通手段推定処理のフローチャートを示す。
【発明を実施するための形態】
【0018】
以下、添付図面を参照して、本発明を実施するための実施形態について詳細に説明する。以下に開示される構成要素のうち、同一機能を有するものには同一の符号を付し、その説明を省略する。なお、以下に開示される実施形態は、本発明の実現手段としての一例であり、本発明が適用される装置の構成や各種条件によって適宜修正または変更されるべきものであり、本発明は以下の実施形態に限定されるものではない。また、本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。
【0019】
[情報処理システムの構成例]
図1に、本実施形態による情報処理システムの構成例を示す。本情報処理システムは、その一例として、
図1に示すように、情報処理装置10と、任意の複数のユーザ1~Nにより使用される複数のユーザ装置11-1~11-N(N>1)を含んで構成される。なお、以下の説明において、特に説明がない限り、ユーザ装置11-1~11-Nをユーザ装置11と総称しうる。また、以下の説明において、ユーザ装置とユーザという語は同義に使用されうる。
【0020】
ユーザ装置11は、例えば、スマートフォンやタブレットといったデバイスであり、LTE(Long Term Evolution)等の公衆網や、無線LAN(Local Area Network)等の無線通信網を介して、情報処理装置10と通信可能に構成されている。ユーザ装置11は、液晶ディスプレイ等の表示部(表示面)を有し、各ユーザは、当該液晶ディスプレイに装備されたGUI(Graphic User Interface)により各種操作を行うことができる。当該操作は、指やスタイラス等によりタップ操作、スライド操作、スクロール操作等、画面に表示された画像等のコンテンツに対する各種の操作を含む。
なお、ユーザ装置11は、
図1に示すような形態のデバイスに限らず、タブレット端末やノート型のPCといったデバイスであってもよい。また、ユーザ装置11は、表示面を別に備えてもよい。
【0021】
ユーザ装置11は、情報処理装置10から、または、不図示の他の装置から情報処理装置10を介して提供されるウェブサービス(インターネット関連サービス)にログインして、サービスを利用することができる。当該ウェブサービスは、インターネットを介して提供される、オンラインモールやネットスーパー、あるいは、通信、金融、不動産、スポーツ、旅行に関するサービスを含むことができる。ユーザ装置11は、このようなウェブサービスを利用することにより、ユーザ装置11のユーザに関する情報を情報処理装置10に伝達することができる。
【0022】
例えば、ユーザ装置11は、ユーザ装置11のIP(Internet Protocol)アドレスや、ユーザの住所やユーザの氏名といった、ユーザ装置やユーザに関する属性情報(以下、ユーザの属性情報)を、情報処理装置10へ伝達することができる。
また、ユーザ装置11は、GPS(Global Positioning System)衛星(不図示)から受信される信号等に基づいて測位計算を行い、当該計算により得られた緯度、経度、高度といった情報を、ユーザ装置11の位置情報として生成し、情報処理装置10へ伝達することができる。
情報処理装置10は、ユーザ装置11から各種情報を取得し、当該情報に基づいて、ユーザの交通手段を予測する機械学習のための学習データの生成、および、当該交通手段の予測の処理を行う。
【0023】
[情報処理装置10の機能構成]
本実施形態による情報処理装置10は、まず、ユーザ装置11-1~11-Nから各種情報を取得し、ユーザの交通手段を予測するための機械学習モデルである交通手段予測モデル111を学習させるための学習データ(教師データ)を生成する。続いて、情報処理装置10は、生成した学習データを用いて交通手段予測モデル111を学習させる。さらに、情報処理装置10は、学習済みの交通手段予測モデル111を用いて、任意のユーザの交通手段を予測する。
【0024】
図2は、本実施形態による情報処理装置10の機能構成の一例を示すブロック図である。
図2に示す情報処理装置10は、ユーザ情報取得部101、地図情報取得部102、移動情報導出部103、学習データ生成部104、学習部105、推定部106、出力部107、学習モデル記憶部110、およびデータ記憶部120を備える。学習モデル記憶部110は、交通手段予測モデル111を記憶可能に構成される。また、データ記憶部120は、ユーザ軌跡121、地図情報122、移動情報123、ラベル付け関数124、および学習データ125を記憶可能に構成される。
【0025】
ユーザ情報取得部101は、ユーザ装置11-1~11-Nのそれぞれから、ユーザの動きの情報を取得する。具体的には、ユーザ情報取得部101は、移動軌跡を示す、一定時間内で連続した複数の位置情報(以下、ユーザ軌跡)を取得する。当該一定時間は任意に設定されうる。例えば、当該一定時間は、ユーザの移動が連続的である(長時間停止しない)時間でありうる。各位置情報は、少なくともタイムスタンプ(日時情報や時間情報)が付された(タイムスタンプを有する)、緯度と経度を含む。また、ユーザ情報取得部101は、ユーザ装置11-1~11-Nのそれぞれから、ユーザの属性情報を取得してもよい。ユーザ情報取得部101は、取得したユーザ軌跡を、データ記憶部120に、ユーザ軌跡121として格納する。
【0026】
地図情報取得部102は、地図情報を、任意のサービス(ウェブサイトやデータベース等)により取得する。当該地図情報は、後述するように、例えば、道路ネットワーク、鉄道ネットワーク、バス経路ネットワーク、地域領域(例えば、県や州)の境界に関する情報(以下、地域領域情報)を含む。地図情報取得部102は、取得した地図情報をデータ記憶部120に、地図情報122として格納する。
【0027】
移動情報導出部103は、データ記憶部120に格納されている一定時間におけるユーザ軌跡121から、ユーザ軌跡121における移動に関する特徴(以下、移動情報)を導出する。具体的には、移動情報導出部103は、タイプスタンプが付された2地点それぞれの位置情報を用いて、移動情報を導出する。本実施形態では、移動情報は、2地点間(第1位置(移動前)と第2位置(移動後)との間)の速度、加速度、加加速度(時間に対する加速度の変化率)、方位、方位差を含みうる。
【0028】
2地点間の距離xは、(1)式のように導出することができる。
ここで、θ
1とθ
2はそれぞれ、第1位置の緯度と第2位置の緯度(ラジアン)を表し、λ
1とλ
2はそれぞれ、第1位置の経度と第2位置の経度(ラジアン)を表す。また、rは地球(Sphere)の半径(メートル)を表す。
【0029】
(1)式により導出された距離xを用いて、2地点間におけるユーザの速度vは、(2)式のように導出することができる。
【0030】
また、(1)式により導出された距離xと(2)式により導出された速度vを用いて、2地点間におけるユーザの加速度aは、(3)式のように導出することができる。
【0031】
また、加加速度(jerk)jは、(1)式により導出された距離x、(2)式により導出された速度v、または、(3)式により導出された加速度aを用いて、(4)式のように導出することができる。
【0032】
2地点間における方位(bearing)は、(5)式のように導出することができる。
ここで、XとYは、それぞれ(6)式と(7)式のように表される。
また、複数地点間における方位差は、(5)式により導出された複数の2地点間における方位を用いて、(8)式のように導出することができる。
【0033】
さらに、移動情報導出部103は、複数の2地点間の速度v、加速度a、から、速度差(Speed_diff)、加速度差(Acceleration_diff)、平均速度(Avg_speed)、平均速度差(Avg_speed_diff)、および平均加速度(Avg_acceleration)を、移動情報として導出することができる。よって、本実施形態では、移動情報は、2地点間の速度、加速度、加加速度、方位、方位差、および、複数の2地点間の速度差、加速度差、平均速度、平均速度差、平均加速度のうちの1つ以上を含みうる。
移動情報導出部103は、導出した移動情報を、移動情報123としてデータ/関数記憶部120に格納する。
【0034】
学習データ生成部104は、ラベル付け関数124を生成して、データ/関数記憶部120に格納する。ラベル付け関数124については後述する。また、学習データ生成部104は、交通手段予測モデル111を学習させるための学習データ(教師データ)を、ラベル付け関数124を用いて生成する。学習データ生成部104は、生成した学習データを、学習データ125としてデータ/関数記憶部120に格納する。当該学習データの生成の手順については後述する。
【0035】
学習部105は、学習データ生成部104により生成された学習データ125を用いて、交通手段予測モデル111を学習させる。交通手段予測モデル111の学習の手順については後述する。
【0036】
推定部106は、任意のユーザから取得したユーザ軌跡から、交通手段予測モデル111を用いて当該ユーザ軌跡に対応するユーザの交通手段を推定する。
出力部107は、推定部106により推定されたユーザの交通手段の結果(推定結果)を出力する。出力部107は、推定結果に基づく情報(例えば、広告)を生成して出力してもよい。当該出力は、あらゆる出力処理であり得、通信I/F(
図3の通信I/F37)を介した外部装置への出力であってもよいし、表示部(
図3の表示部36)への表示であってもよい。
【0037】
[情報処理装置10のハードウェア構成]
図3は、本実施形態による情報処理装置10のハードウェア構成の一例を示すブロック図である。
本実施形態による情報処理装置10は、単一または複数の、あらゆるコンピュータ、モバイルデバイス、または他のいかなる処理プラットフォーム上にも実装することができる。
図3を参照して、情報処理装置10は、単一のコンピュータに実装される例が示されているが、本実施形態による情報処理装置10は、複数のコンピュータを含むコンピュータシステムに実装されてよい。複数のコンピュータは、有線または無線のネットワークにより相互通信可能に接続されてよい。
【0038】
図3に示すように、情報処理装置10は、CPU31と、ROM32と、RAM33と、HDD34と、入力部35と、表示部36と、通信I/F37と、システムバス38とを備えてよい。情報処理装置10はまた、外部メモリを備えてよい。
CPU(Central Processing Unit)31は、情報処理装置10における動作を統括的に制御するものであり、データ伝送路であるシステムバス38を介して、各構成部(32~37)を制御する。
【0039】
ROM(Read Only Memory)32は、CPU31が処理を実行するために必要な制御プログラム等を記憶する不揮発性メモリである。なお、当該プログラムは、HDD(Hard Disk Drive)34、SSD(Solid State Drive)等の不揮発性メモリや着脱可能な記憶媒体(不図示)等の外部メモリに記憶されていてもよい。
RAM(Random Access Memory)33は、揮発性メモリであり、CPU31の主メモリ、ワークエリア等として機能する。すなわち、CPU31は、処理の実行に際してROM32から必要なプログラム等をRAM33にロードし、当該プログラム等を実行することで各種の機能動作を実現する。
図2に示す学習モデル記憶部110とデータ/関数記憶部120は、RAM33で構成されうる。
【0040】
HDD34は、例えば、CPU31がプログラムを用いた処理を行う際に必要な各種データや各種情報等を記憶している。また、HDD34には、例えば、CPU31がプログラム等を用いた処理を行うことにより得られた各種データや各種情報等が記憶される。
入力部35は、キーボードやマウス等のポインティングデバイスにより構成される。
表示部36は、液晶ディスプレイ(LCD)等のモニターにより構成される。表示部36は、入力部35と組み合わせて構成されることにより、GUI(Graphical User Interface)として機能してもよい。
【0041】
通信I/F37は、情報処理装置10と外部装置との通信を制御するインタフェースである。
通信I/F37は、ネットワークとのインタフェースを提供し、ネットワークを介して、外部装置との通信を実行する。通信I/F37を介して、外部装置との間で各種データや各種パラメータ等が送受信される。本実施形態では、通信I/F37は、イーサネット(登録商標)等の通信規格に準拠する有線LAN(Local Area Network)や専用線を介した通信を実行してよい。ただし、本実施形態で利用可能なネットワークはこれに限定されず、無線ネットワークで構成されてもよい。この無線ネットワークは、Bluetooth(登録商標)、ZigBee(登録商標)、UWB(Ultra Wide Band)等の無線PAN(Personal Area Network)を含む。また、Wi-Fi(Wireless Fidelity)(登録商標)等の無線LAN(Local Area Network)や、WiMAX(登録商標)等の無線MAN(Metropolitan Area Network)を含む。さらに、LTE/3G、4G、5G等の無線WAN(Wide Area Network)を含む。なお、ネットワークは、各機器を相互に通信可能に接続し、通信が可能であればよく、通信の規格、規模、構成は上記に限定されない。
【0042】
図2に示す情報処理装置10の各要素のうち少なくとも一部の機能は、CPU31がプログラムを実行することで実現することができる。ただし、
図2に示す情報処理装置10の各要素のうち少なくとも一部の機能が専用のハードウェアとして動作するようにしてもよい。この場合、専用のハードウェアは、CPU31の制御に基づいて動作する。
【0043】
[ユーザ装置11のハードウェア構成]
図1に示すユーザ装置11のハードウェア構成は、
図3に示すハードウェア構成と同様でありうる。すなわち、ユーザ装置11は、CPU31と、ROM32と、RAM33と、HDD34と、入力部35と、表示部36と、通信I/F37と、システムバス38とを備えうる。ユーザ装置11は、情報処理装置10により提供された各種情報を、表示部36に表示し、GUI(入力部35と表示部36による構成)を介してユーザから受け付ける入力操作に対応する処理を行うことができる。
【0044】
[学習データの生成手順]
次に、本実施形態による学習データの生成手順について説明する。
図4に、学習データ生成部104により実施される学習データの生成処理のフローチャートを示す。なお、本例において、ユーザ軌跡121、地図情報122、移動情報123、ラベル付け関数124は、データ/関数記憶部120に格納されているものとする。説明のために、
図1に示した情報処理システムを参照する。
【0045】
まず、S41において、学習データ生成部104は、地図情報取得部102により取得された地図情報122を、データ/関数記憶部120から取得する。
S42において、学習データ生成部104は、ユーザ情報取得部101により取得された、ユーザ1~Nのユーザ軌跡121を、データ/関数記憶部120から取得する。
S43において、学習データ生成部104は、地図情報122とユーザ軌跡121を空間結合(Spatial join operation)し、ユーザ軌跡121にソフトラベルを付与する(ソフトラベリングする)。
【0046】
図5に、S43の処理(ソフトラベルの付与)を説明するための概念図を示す。本実施形態では、地図情報122は、道路ネットワーク51、鉄道ネットワーク52、バス経路ネットワーク53、および地域領域情報54を含む。なお、
図5に示す地図情報122は一例に過ぎず、地図情報122は、他の地図に関する情報を含んでもよい。
【0047】
道路ネットワーク51は、道路(ある場所と他の場所とを結ぶあらゆる地上の道路)を表す道路情報である。鉄道ネットワーク52は、鉄道路線図の情報である。バス経路ネットワーク53は、路線バスの経路図の情報である。バス経路ネットワーク53は、臨時に運行するバスの路線図の情報を含んでもよい。地域領域情報54は、地域領域(例えば、県や州)の境界に関する情報であり、池、湖、または海の境界の情報も含む。
道路ネットワーク51、鉄道ネットワーク52、およびバス経路ネットワーク53はそれぞれ、道路、鉄道、バス経路を表す線(ライン)により表され、地域領域情報54は、あらゆる境界(線)で囲まれる領域により表されうる。
【0048】
また、学習データ生成部104は、地図情報122に対応するソフトラベル55を準備する。ソフトラベル55は、ユーザ軌跡121を地図情報122に空間結合(マッピング)した場合に、ユーザ軌跡121に整合する(整合する可能性が高い)地図情報122におけるエリア(領域)や経路(線)に対応する交通情報を示すラベルである。また、ソフトラベル55は、後述するラベル61に対する潜在的なラベルである。ソフトラベル55は、「道路」、「鉄道」、「バス」、または「ボート/船」である。なお、これは一例であり、他のソフトラベルが準備されてもよい。例えば、ソフトラベル55は、「その他」を含めもよい。ユーザ軌跡121が、「道路」、「鉄道」、「バス」、または「ボート/船」を示す線または領域を通らない場合、「その他」が使用されうる。
【0049】
学習データ生成部104は、地図情報122とユーザ軌跡121を空間結合し、ユーザ軌跡121にソフトラベル55を付与する。具体的には、学習データ生成部104は、ユーザ軌跡121を、道路ネットワーク51、鉄道ネットワーク52、バス経路ネットワーク53、および地域領域情報54にマッピングし、ユーザ軌跡121に対応するソフトラベル55を付与する。例えば、ユーザ軌跡121が、バス経路ネットワーク53で示されるライン(経路)を通る軌跡の場合、学習データ生成部104は、ユーザ軌跡121に、「バス」のソフトラベル55を付与する。また、ユーザ軌跡121が、地域領域情報54により示される湖の領域内で移動した軌跡の場合、学習データ生成部104は、ユーザ軌跡121に、「ボート/船」のソフトラベル55を付与する。また、ユーザ軌跡121が、道路ネットワーク51、鉄道ネットワーク52、バス経路ネットワーク53、および地域領域情報54のいずれにも整合しない場合、学習データ生成部104は、ユーザ軌跡121に「その他」のソフトラベル55を付与してもよい。
【0050】
次に、S44において、学習データ生成部104は、移動情報導出部103により導出された移動情報123を、データ/関数記憶部120から取得する。移動情報123は、前述したように、2地点間の速度、加速度、加加速度、方位、方位差、および、複数の2地点間の速度差、加速度差、平均速度、平均速度差、平均加速度のうちの1つ以上を含みうる。
【0051】
S45において、学習データ生成部104は、データ/関数記憶部120から、ラベル付け関数124を取得する。ラベル付け関数124は、それぞれが、移動情報123および/またはソフトラベル55からラベルを出力するように構成された複数の関数を含む。ラベル付け関数124は、学習データ生成部104により生成され、データ/関数記憶部120に格納されている。なお、ラベル付け関数124は、予め情報処理システムにおいて生成され、データ/関数記憶部120に格納されていてもよい。
【0052】
図6にラベル付け関数124の入力と出力の概念図を示す。ラベル関数124は、ソフトラベル55と移動情報123を入力として、ラベル61を出力する関数である。本実施形態では、ラベル61は、ユーザの(ユーザが用いる)交通手段に対応し、「車」、「電車」、「バス」、「自転車」、「徒歩」、または「ボート/船」であるとする。なお、これは一例であり、ラベル61は、他のラベルを含んでもよい。
【0053】
ラベル付け関数124の一例を[1]~[3]に示す。
[1]移動情報123に含まれる速度が15m/s以上で33m/s以下、かつ、ソフトラベル55が「電車」でない場合、「車」のラベル61を出力
[2]移動情報123に含まれる速度が2.5m/s以上で10m/s以下、かつ、ソフトラベル55が「バス」の場合、「バス」のラベル61を出力
[3]移動情報123に含まれる速度が1.4m/s以下、かつ、移動情報123に含まれる加速度が1.5m/s2未満の場合、「徒歩」のラベル61を出力
なお、当該関数は一例であり、ラベル付け関数124は、移動情報123および/またはソフトラベル55からラベル61を出力するように構成された複数の関数を含むように構成されればよい。
【0054】
S46において、学習データ生成部104は、S43で付与されたソフトラベル55と、S44で取得された移動情報123とを、ラベル付け関数124に適用し、ソフトラベル55と移動情報123に対してラベル61を付与する。すなわち、学習データ生成部104は、ソフトラベル55が付与されたユーザ軌跡121と、移動情報123との組み合わせに対して、ラベル61を付与する。
【0055】
なお、S45とS46の処理は、Snorkelプラットフォームにより実装されてもよい。Snorkelプラットフォームは、ラベル付けを自動化させたプラットフォームである。
また、学習データ生成部104は、推定部106による推定結果により、ラベル付け関数124を修正することができる。例えば、学習データ生成部104は、当該推定結果に基づき、上記[1]式の速度の値を変更することができる。
【0056】
学習データ生成部104は、ソフトラベル55が付されたユーザ軌跡121と移動情報123に対してラベル61を付したデータセットを生成する。すなわち、学習データ生成部104は、ユーザ軌跡121と移動情報123の組み合わせに、交通手段を示すラベル61(正解データ)が対応付けられたデータセットを生成する。学習データ生成部104は、データセットの生成処理を複数回に渡って行い、複数のデータセットを生成する。学習データ生成部104は、当該複数のデータセットを、データ/関数記憶部120に学習データ125として格納する。
【0057】
このように、学習データ生成部104は、ユーザ軌跡121に基づいて、学習データ125を生成する。具体的には、学習データ生成部104は、ユーザ軌跡121と、ユーザ軌跡121から導出された移動情報123を用いて学習データ125を生成する。これにより、ユーザ軌跡121、すなわち、ユーザの連続する位置情報から、学習データを生成することが可能となり、ユーザ端末に特別なセンサを搭載するなど、ユーザ端末の機能を複雑化させることなく、効率的に学習データを生成することが可能となる。
【0058】
また、ラベル付け関数124の設定により、ユーザ軌跡121と移動情報123に基づき、同じ道路を通る車と自転車とを区別して、適切にラベル付けを行うことが可能となる。例えば、同じ道路を通る2つのユーザ軌跡の速度や加速度が異なる場合、異なる速度および/または加速度を条件としたラベル付け関数124を設定することにより。当該2つのユーザ軌跡を区別した上で適切なラベルを付すことが可能となる。
【0059】
[交通手段予測モデル111の学習手順]
次に、交通手段予測モデル111の学習手順について説明する。
図7に、機械学習のための学習モデルである、交通手段予測モデル111のアーキテクチャの一例を示す。
図7に示す交通手段予測モデル111は、ニューラルネットワークを用いた深層学習モデルである。
【0060】
図7に示すように、本実施形態による交通手段予測モデル111は、第1ブランチ711と第2ブランチ712からなる第1ネットワーク71と、第1ネットワーク71に続く第2ネットワーク72から構成される。第1ネットワーク71と第2ネットワーク72はそれぞれ、白ボックスで表した入力層と網掛けボックスで表した複数の全結合層(Dense)を含む。また、第2ネットワーク72は、グレーボックスで表した出力層を含む。各層に示した数字は、ノード数(ユニット数)を表す。なお、層の数は、
図7に示す数に限定されない。
【0061】
学習部105は、学習データ生成部104により生成された学習データ125を用いて、交通手段予測モデル111を学習させる。前述のように、学習データ125は、複数のデータセットを含み、各データセットは、ユーザ軌跡121と移動情報123の組み合わせに対してラベル61が対応付けられている。よって、学習部105は、ユーザ軌跡121および移動情報123と、ラベル61との関係を交通手段予測モデル111に学習させる。
【0062】
学習部105は、ユーザ軌跡121(ユーザ軌跡121を示すデータ)を第1ブランチ711へ入力し、移動情報123(移動情報123を示すデータ)を第2ブランチ712へ入力する。
【0063】
第1ブランチ711では、ユーザ軌跡121から、ユーザ軌跡の特徴量(特徴ベクトル)が生成(抽出)される。また、複数の全結合層を介して、圧縮された(エンコードされた)ユーザ軌跡の特徴量が生成される。
【0064】
第2ブランチ712では、移動情報123から、移動情報の特徴量(特徴ベクトル)が生成(抽出)される。また、複数の全結合層を介して、圧縮された(エンコードされた)移動情報の特徴量が生成される。
前述のように、移動情報123は、2地点間の速度、加速度、加加速度、方位、方位差、および、複数の2地点間の速度差、加速度差、平均速度、平均速度差、平均加速度のうちの複数の値を含みうるためデータサイズが大きくなりうる。そのため、
図7に示すアーキテクチャでは、第2ブランチ712では、第1ブランチ711より層が多く、圧縮された移動情報の特徴量が生成されうる。
【0065】
第2ネットワーク72では、まず、第1ブランチ711で生成されたユーザ軌跡の特徴量と、と第2ブランチ712で生成された移動情報の特徴量を結合し、結合特徴量(結合特徴ベクトル)を生成する。さらに、第2ネットワーク72では、複数の全結合層を介して、当該結合特徴量を圧縮し(エンコードし)、ラベル61の数に対応する6つの特徴量を生成する。
【0066】
出力層は、当該6つの特徴量から、交通手段予測モデル111に入力されたユーザ軌跡121と移動情報123に対応付けられたラベル61を表すデータ(交通手段を示すデータ)を生成して出力するように構成される。出力層では活性化関数(ソフトマックス関数等)が使用される。本実施形態では、出力層は、学習データ125に含まれる6種類(車、電車、バス、自転車、徒歩、ボート/船、)のラベルそれぞれについて、正解データである確率(0~1)を、出力データとして出力するように構成されうる。あるいは、出力層は、当該6種類のラベルのうち正解データである確率が最も高いラベルに1、それ以外のラベルに0を、出力データとして出力するように構成されうる。
【0067】
学習部105は、出力層の出力データと正解データを適用した損失関数を用いて、交通手段予測モデル111におけるパラメータを算出および/または調整し、交通手段予測モデル111を学習させる。学習部105は、学習データ125に含まれる複数のデータセットを用いて、交通手段予測モデル111を学習させる。学習部105は、学習済みの交通手段予測モデル111を、学習モデル記憶部110に格納する。
【0068】
このように、本実施形態による交通手段予測モデル111は、ユーザから取得したユーザ軌跡(生データ)と、当該ユーザ軌跡から導出した移動情報(導出データ)とを、異なるブランチへ入力する。そして、当該モデルは、当該生データの特徴量と当該導出データの特徴量とを結合して生成した結合特徴量から、ユーザの交通手段を推定する。生データと、当該生データの特徴を表す導出データの2種類のデータを用いることにより、より精度高い交通手段の推定が可能となる。
【0069】
なお、学習処理は、都市エリアと田舎エリアで分けて行ってもよい。都市エリアでは、人の移動が多く、多数のデータセットから成る学習セット125での学習が可能である一方、田舎エリアでは人の動きが少なく、学習のためのデータセットが少ない。よって、都市エリアでは学習精度が高くなりうる。
【0070】
[交通手段推定手順]
次に、本実施形態による交通手段推定手順について説明する。
図8に、本実施形態による交通手段推定処理のフローチャートを示す。なお、本例において、上述のように学習された、学習済みの交通手段予測モデル111は、学習モデル記憶部110に格納されているものとする。説明のために、
図1に示した情報処理システムを参照する。
【0071】
まず、S81において、ユーザ情報取得部101は、任意のユーザ(以下、対象ユーザ)の、一定時間におけるユーザ軌跡を取得する。対象ユーザは、ユーザ1~Nのいずれかのユーザでありうる。また、当該一定時間は任意に設定されうる。例えば、当該一定時間は、当該ユーザの移動が連続的である(長時間停止しない)時間でありうる。
【0072】
S82において、移動情報導出部103は、S81で取得された対象ユーザのユーザ軌跡から、当該ユーザ軌跡における移動に関する特徴である移動情報を導出する。前述のように、当該移動情報は、2地点間の速度、加速度、加加速度、方位、方位差、および、複数の2地点間の速度差、加速度差、平均速度、平均速度差、平均加速度のうちの1つ以上を含みうる。
【0073】
S83において、推定部106は、S81で取得したユーザ軌跡とS82で導出した移動情報に基づいて、学習済みの交通手段予測モデル111を用いて、対象ユーザの交通手段を推定する。具体的には、推定部106は、
図7に示した交通手段予測モデル111の、第1ネットワーク71の第1ブランチ711に、対象ユーザのユーザ軌跡を示すデータを入力し、第2ブランチ722に対象ユーザの移動情報を示すデータを入力する。交通手段予測モデル111は、当該入力されたデータから、上記のように、6種類のラベル(車、電車、バス、自転車、徒歩、ボート/船)のそれぞれについて、正解データ(実際の交通手段)である確率(0~1)を出力する。あるいは、交通手段予測モデル111は、当該6種類のラベルのうち正解データである確率が最も高いラベルに1、それ以外のラベルに0を出力する。
推定部106は、正解データである確率が最も高いラベルに対応する交通手段を、対象ユーザの交通手段として推定する。
【0074】
最後に、S84において、出力部107は、S83により推定された対象ユーザの交通手段の情報(推定結果)を出力する。例えば、出力部107は、対象ユーザと推定結果とを対応付けた情報を、外部装置に出力する。また、出力部107は、推定結果に基づく情報を生成して出力してもよい。例えば、出力部107は、ユーザ軌跡に対して推定された交通手段に関する広告を生成して出力することができる。対象ユーザの進行中のユーザ軌跡から推定された交通手段が車である場合、出力部107は、当該対象ユーザの現在位置に基づいて、当該現在位置に近い観光スポットやサービス情報の広告を生成して、当該対象ユーザに提供することができる。また、対象ユーザの進行中のユーザ軌跡から推定された交通手段が徒歩である場合、出力部107は、健康向上に関する広告を生成して、当該対象ユーザに提供することができる。
【0075】
図8では、対象ユーザの交通手段について説明したが、同様な処理により多数のユーザの交通手段を推定することで、任意のエリアの任意の時間帯における交通手段毎の交通量を推定することができる。当該推定は、適切な交通計画やトラフィック管理に役立ちうる。
【0076】
なお、上記において特定の実施形態が説明されているが、当該実施形態は単なる例示であり、本発明の範囲を限定する意図はない。本明細書に記載された装置及び方法は上記した以外の形態において具現化することができる。また、本発明の範囲から離れることなく、上記した実施形態に対して適宜、省略、置換及び変更をなすこともできる。かかる省略、置換及び変更をなした形態は、請求の範囲に記載されたもの及びこれらの均等物の範疇に含まれ、本発明の技術的範囲に属する。
【0077】
本実施形態の開示は以下の構成を含む。
[1]ユーザの移動軌跡を取得する取得部と、
前記移動軌跡から当該移動に関する特徴を示す移動情報を導出する導出部と、
前記移動軌跡と前記移動情報に、前記ユーザの交通手段を示すラベルを対応付けた、学習データを生成する生成部と、を有することを特徴とする情報処理装置。
【0078】
[2]前記移動軌跡は、タイムスタンプを有する、前記ユーザの位置の緯度と経度を含むことを特徴とする[1]に記載の情報処理装置。
【0079】
[3]前記移動情報は、前記移動軌跡における2地点間の速度、加速度、加加速度、方位、方位差、および、複数の2地点間の速度差、加速度差、平均速度、平均速度差、平均加速度のうちの1つ以上を含むことを特徴とする[1]または[2]に記載の情報処理装置。
【0080】
[4]前記交通手段は、車、電車、バス、自転車、徒歩、ボートまたは船、のうち1つ以上を含むことを特徴とする[1]から[3]のいずれかに記載の情報処理装置。
【0081】
[5]前記生成部は、前記移動軌跡を、地図情報にマッピングし、前記移動軌跡に整合する前記地図情報におけるエリアや経路に対応する交通情報を示すソフトラベルを、前記移動軌跡に付与し、前記ソフトラベルと前記移動情報を所定の関数に適用することにより、前記移動軌跡と前記移動情報に、前記ラベルを対応付けることを特徴とする[1]から[4]のいずれかに記載の情報処理装置。
【0082】
[6]前記ソフトラベルは、道路、鉄道、バス、ボートまたは船、のうち1つ以上を含むことを特徴とする[5]に記載の情報処理装置。
【0083】
[7]前記地図情報は、道路ネットワーク、鉄道ネットワーク、バス経路ネットワーク、地域領域の境界に関する情報を含むことを特徴とする[5]または[6]に記載の情報処理装置。
【0084】
[8]前記学習データを用いて、前記移動軌跡および前記移動情報と、前記ラベルとの関係を機械学習のための学習モデルに学習させる学習部を更に有することを特徴とする[1]から[7]のいずれか1項に記載の情報処理装置。
【0085】
[9]ユーザの移動軌跡を取得する取得工程と、前記移動軌跡から当該移動に関する特徴を示す移動情報を導出する導出工程と、前記移動軌跡と前記移動情報に、前記ユーザの交通手段を示すラベルを対応付けた、学習データを生成する生成工程と、を有することを特徴とする情報処理方法。
【0086】
[10]情報処理をコンピュータに実行させるための情報処理プログラムであって、該プログラムは、前記コンピュータに、ユーザの移動軌跡を取得する取得処理と、前記移動軌跡から当該移動に関する特徴を示す移動情報を導出する導出処理と、前記移動軌跡と前記移動情報に、前記ユーザの交通手段を示すラベルを対応付けた、学習データを生成する生成処理と、を含む処理を実行させるためのものである、情報処理プログラム。
【符号の説明】
【0087】
1~N:ユーザ、10:情報処理装置、11-1~11-N:ユーザ装置、101:ユーザ情報取得部、102:地図情報取得部、103:移動情報導出部、104:学習データ生成部、105:学習部、106:推定部、107:出力部、110:学習モデル記憶部、111:交通手段予測モデル、120:データ/関数記憶部、121:ユーザ軌跡、122:地図情報、123:移動情報、124:ラベル付け関数、125:学習データ
【要約】
情報処理装置は、ユーザの移動軌跡を取得し、該移動軌跡から該移動に関する特徴を示す移動情報を導出し、該移動軌跡と該移動情報に、該ユーザの交通手段を示すラベルを対応付けた、学習データを生成する。