(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022167128
(43)【公開日】2022-11-04
(54)【発明の名称】情報処理方法、プログラム、コンピュータ記憶媒体及び情報処理装置
(51)【国際特許分類】
G06Q 50/10 20120101AFI20221027BHJP
【FI】
G06Q50/10
【審査請求】未請求
【請求項の数】22
【出願形態】OL
(21)【出願番号】P 2021072703
(22)【出願日】2021-04-22
(71)【出願人】
【識別番号】000196587
【氏名又は名称】西日本旅客鉄道株式会社
(71)【出願人】
【識別番号】513186383
【氏名又は名称】株式会社ギックス
(74)【代理人】
【識別番号】100096389
【弁理士】
【氏名又は名称】金本 哲男
(74)【代理人】
【識別番号】100101557
【弁理士】
【氏名又は名称】萩原 康司
(74)【代理人】
【識別番号】100167634
【弁理士】
【氏名又は名称】扇田 尚紀
(74)【代理人】
【識別番号】100187849
【弁理士】
【氏名又は名称】齊藤 隆史
(74)【代理人】
【識別番号】100212059
【弁理士】
【氏名又は名称】三根 卓也
(72)【発明者】
【氏名】宮崎 祐丞
(72)【発明者】
【氏名】岩木 麻子
(72)【発明者】
【氏名】山田 洋
(72)【発明者】
【氏名】花谷 慎太郎
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049CC11
(57)【要約】
【課題】人の行動履歴を適切に分析する。
【解決手段】情報処理装置を用いた情報処理方法であって、人の行動を含むデータから、個人を識別する識別子毎に行動履歴を抽出する抽出工程(S12)と、行動履歴をマッピングするマッピング工程(S13)と、時間的に連続する2つの行動の近さと、当該2つの行動間の時間の一方又は両方を算出する算出工程(S14)と、近さと時間の一方又は両方に基づいて、2つの行動間を滞在と移動に分類する分類工程(S15)と、を有する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
情報処理装置を用いた情報処理方法であって、
人の行動を含むデータから、個人を識別する識別子毎に行動履歴を抽出する抽出工程と、
前記行動履歴をマッピングするマッピング工程と、
時間的に連続する2つの前記行動の近さと、当該2つの行動間の時間の一方又は両方を算出する算出工程と、
前記近さと前記時間の一方又は両方に基づいて、前記2つの行動間を滞在と移動に分類する分類工程と、を有することを特徴とする、情報処理方法。
【請求項2】
前記滞在を可視化する可視化工程をさらに有することを特徴とする、請求項1に記載の情報処理方法。
【請求項3】
前記マッピング工程において、前記行動履歴をベクトル化して、ベクトル空間にマッピングすることを特徴とする、請求項1又は2に記載の情報処理方法。
【請求項4】
前記マッピング工程において、前記行動履歴を地理空間にマッピングすることを特徴とする、請求項1又は2に記載の情報処理方法。
【請求項5】
前記算出工程において、前記2つの行動が行われた位置の物理的な距離を前記近さとして算出することを特徴とする、請求項1~4のいずれか一項に記載の情報処理方法。
【請求項6】
前記算出工程において、前記2つの行動の類似度を前記近さとして算出することを特徴とする、請求項1~4のいずれか一項に記載の情報処理方法。
【請求項7】
前記分類工程において、前記近さと前記時間の一方又は両方と、所定の閾値とを比較して、前記滞在と前記移動に分類することを特徴とする、請求項1~6のいずれか一項に記載の情報処理方法。
【請求項8】
前記算出工程において、前記近さと前記時間の両方を算出し、
前記分類工程において、前記近さの時間微分を導出し、当該近さの時間微分と所定の閾値とを比較して、前記滞在と前記移動に分類することを特徴とする、請求項1~6のいずれか一項に記載の情報処理方法。
【請求項9】
前記データは、前記行動を行った人の識別情報を含むことを特徴とする、請求項1~8のいずれか一項に記載の情報処理方法。
【請求項10】
前記データは、交通系ICカード又は携帯端末から取得されたデータを含むことを特徴とする、請求項1~9のいずれか一項に記載の情報処理方法。
【請求項11】
請求項1~10のいずれか一項に記載の情報処理方法を情報処理装置によって実行させるように、当該情報処理装置を制御する、コンピュータ上で動作するプログラム。
【請求項12】
請求項11に記載のプログラムを格納した読み取り可能なコンピュータ記憶媒体。
【請求項13】
情報処理装置であって、
人の行動を含むデータから、個人を識別する識別子毎に行動履歴を抽出する抽出部と、
前記行動履歴をマッピングするマッピング部と、
時間的に連続する2つの前記行動の近さと、当該2つの行動間の時間の一方又は両方を算出する算出部と、
前記近さと前記時間の一方又は両方に基づいて、前記2つの行動間を滞在と移動に分類する分類部と、を有することを特徴とする、情報処理装置。
【請求項14】
前記滞在を可視化する可視化部をさらに有することを特徴とする、請求項13に記載の情報処理装置。
【請求項15】
前記マッピング部は、前記行動履歴をベクトル化して、ベクトル空間にマッピングすることを特徴とする、請求項13又は14に記載の情報処理装置。
【請求項16】
前記マッピング部は、前記行動履歴を地理空間にマッピングすることを特徴とする、請求項13又は14に記載の情報処理装置。
【請求項17】
前記算出部は、前記2つの行動が行われた位置の物理的な距離を前記近さとして算出することを特徴とする、請求項13~16のいずれか一項に記載の情報処理装置。
【請求項18】
前記算出部は、前記2つの行動の類似度を前記近さとして算出することを特徴とする、請求項13~16のいずれか一項に記載の情報処理装置。
【請求項19】
前記分類部は、前記近さと前記時間の一方又は両方と、所定の閾値とを比較して、前記滞在と前記移動に分類することを特徴とする、請求項13~18のいずれか一項に記載の情報処理装置。
【請求項20】
前記算出部は、前記近さと前記時間の両方を算出し、
前記分類部は、前記近さの時間微分を導出し、当該近さの時間微分と所定の閾値とを比較して、前記滞在と前記移動に分類することを特徴とする、請求項13~18のいずれか一項に記載の情報処理装置。
【請求項21】
前記データは、前記行動を行った人の識別情報を含むことを特徴とする、請求項13~20のいずれか一項に記載の情報処理装置。
【請求項22】
前記データは、交通系ICカード又は携帯端末から取得されたデータを含むことを特徴とする、請求項13~21のいずれか一項に記載の情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理方法、プログラム、コンピュータ記憶媒体及び情報処理装置に関する。
【背景技術】
【0002】
従来、人の行動を含むデータから行動履歴を抽出して、当該行動履歴を分析することが行われている。行動履歴の分析結果は、例えば商品やサービスのマーケティングやレコメンデーション、イベント計画、交通計画など、多様な目的のために用いられる。
【0003】
上述した行動履歴の分析方法の一例として、例えば特許文献1には、非接触型交通系ICカードあるいは同等の機能を持つ携帯端末の利用履歴に基づいて、利用者の行動傾向を分析する方法が開示されている。具体的には、上記利用履歴に基づき、駅の利用頻度、駅の滞在時間、駅構内や駅周辺で利用した店舗が娯楽性のある店舗か利便性のある店舗かという利用傾向を算出し、その指標値により駅の利用者を特徴付けて分類する。そして、利用者の分類結果に基づいて、駅構内や駅周辺における購買行動を対象としたリコメンデーションなどの情報提供を行う。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
ここで、本発明者らが鋭意検討した結果、行動履歴の分析には、時間的に連続する2つの行動間を滞在と移動に分類することが、上述した多様な目的を達成するために有用であることを見出した。しかしながら、例えば従来文献1に開示された方法のような従来の行動分析方法は、かかる分類については考慮されておらず、改善の余地がある。
【0006】
本発明は、かかる点に鑑みてなされたものであり、人の行動履歴を適切に分析することを目的とする。
【課題を解決するための手段】
【0007】
前記の目的を達成するため、本発明は、情報処理装置を用いた情報処理方法であって、人の行動を含むデータから、個人を識別する識別子毎に行動履歴を抽出する抽出工程と、前記行動履歴をマッピングするマッピング工程と、時間的に連続する2つの前記行動の近さと、当該2つの行動間の時間の一方又は両方を算出する算出工程と、前記近さと前記時間の一方又は両方に基づいて、前記2つの行動間を滞在と移動に分類する分類工程と、を有することを特徴としている。
【0008】
前記情報処理方法は、前記滞在を可視化する可視化工程をさらに有していてもよい。
【0009】
前記情報処理方法では、前記マッピング工程において、前記行動履歴をベクトル化して、ベクトル空間にマッピングしてもよい。あるいは、前記マッピング工程において、前記行動履歴を地理空間にマッピングしてもよい。
【0010】
前記情報処理方法では、前記算出工程において、前記2つの行動が行われた位置の物理的な距離を前記近さとして算出してもよい。あるいは、前記算出工程において、前記2つの行動の類似度を前記近さとして算出してもよい。
【0011】
前記情報処理方法では、前記分類工程において、前記近さと前記時間の一方又は両方と、所定の閾値とを比較して、前記滞在と前記移動に分類してもよい。あるいは、前記算出工程において、前記近さと前記時間の両方を算出し、前記分類工程において、前記近さの時間微分を導出し、当該近さの時間微分と所定の閾値とを比較して、前記滞在と前記移動に分類してもよい。
【0012】
前記情報処理方法において、前記データは、前記行動を行った人の識別情報を含んでいてもよい。
【0013】
前記情報処理方法において、前記データは、交通系ICカード又は携帯端末から取得されたデータを含んでいてもよい。
【0014】
また別な観点による本発明によれば、前記情報処理方法を情報処理装置によって実行させるように、当該情報処理装置を制御する、コンピュータ上で動作するプログラムが提供される。
【0015】
さらに別な観点による本発明によれば、前記プログラムを格納した読み取り可能なコンピュータ記憶媒体が提供される。
【0016】
また別な観点による本発明は、情報処理装置であって、人の行動を含むデータから、個人を識別する識別子毎に行動履歴を抽出する抽出部と、前記行動履歴をマッピングするマッピング部と、時間的に連続する2つの前記行動の近さと、当該2つの行動間の時間の一方又は両方を算出する算出部と、前記近さと前記時間の一方又は両方に基づいて、前記2つの行動間を滞在と移動に分類する分類部と、を有することを特徴としている。
【0017】
前記情報処理装置は、前記滞在を可視化する可視化部をさらに有していてもよい。
【0018】
前記情報処理装置において、前記マッピング部は、前記行動履歴をベクトル化して、ベクトル空間にマッピングしてもよい。あるいは、前記マッピング部は、前記行動履歴を地理空間にマッピングしてもよい。
【0019】
前記情報処理装置において、前記算出部は、前記2つの行動が行われた位置の物理的な距離を前記近さとして算出してもよい。あるいは、前記算出部は、前記2つの行動の類似度を前記近さとして算出してもよい。
【0020】
前記情報処理装置において、前記分類部は、前記近さと前記時間の一方又は両方と、所定の閾値とを比較して、前記滞在と前記移動に分類してもよい。あるいは、前記算出部は、前記近さと前記時間の両方を算出し、前記分類部は、前記近さの時間微分を導出し、当該近さの時間微分と所定の閾値とを比較して、前記滞在と前記移動に分類してもよい。
【0021】
前記情報処理装置において、前記データは、前記行動を行った人の識別情報を含んでいてもよい。
【0022】
前記情報処理装置において、前記データは、交通系ICカード又は携帯端末から取得されたデータを含んでいてもよい。
【発明の効果】
【0023】
本発明によれば、時間的に連続する2つの行動間を滞在と移動に分類するので、人の行動履歴を適切に分析することができる。その結果、例えば商品やサービスのマーケティングやレコメンデーション、イベント計画、交通計画など、多様な目的に分析結果を用いることができる。
【図面の簡単な説明】
【0024】
【
図1】本実施形態にかかる情報処理システムの構成の概略を示す説明図である。
【
図2】第1の実施形態にかかる情報処理方法の主な工程を示すフロー図である。
【
図3】第1の実施形態において行動履歴データの一例を示す表である。
【
図4】第1の実施形態において駅のマスタデータを示す表である。
【
図5】第1の実施形態において行動履歴データから行動履歴を抽出した結果を示す表である。
【
図6】第1の実施形態において行動履歴をマッピングした結果を示す表である。
【
図7】第1の実施形態において2つの行動の近さを算出した結果を示す表である。
【
図8】第1の実施形態において2つの行動を滞在と移動に分類した結果を示す表である。
【
図9】第1の実施形態において滞在と移動を可視化したグラフである。
【
図10】第2の実施形態にかかる情報処理方法の主な工程を示すフロー図である。
【
図11】第2の実施形態において2つの行動の近さと2つの行動間の時間を算出した結果を示す表である。
【
図12】第2の実施形態において2つの行動を滞在と移動に分類した結果を示す表である。
【
図13】第2の実施形態において滞在と移動を可視化したグラフである。
【
図14】第3の実施形態にかかる情報処理方法の主な工程を示すフロー図である。
【
図15】第3の実施形態において行動履歴データの一例を示す表である。
【
図16】第3の実施形態において店舗のマスタデータを示す表である。
【
図17】第3の実施形態において品目のマスタデータを示す表である。
【
図18】第3の実施形態において行動履歴データから行動履歴を抽出した結果を示す表である。
【
図19】第3の実施形態において行動履歴をベクトル化した結果を示す表である。
【
図20】第3の実施形態において2つの行動の近さと2つの行動間の時間を算出した結果を示す表である。
【
図21】第3の実施形態において2つの行動を滞在と移動に分類した結果を示す表である。
【発明を実施するための形態】
【0025】
以下、本発明の実施形態について図面を参照して説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0026】
<情報処理システム1の構成>
図1は、本実施形態にかかる情報処理システム1の構成の概略を示す説明図である。
【0027】
情報処理システム1は、データベース装置10と情報処理装置20を有している。データベース装置10と情報処理装置20は、ネットワーク30を介して接続可能に構成されている。ネットワーク30は、通信を行うことができるものであれば特に限定されるものではないが、例えばインターネットや有線LAN、無線LANなどが用いられる。なお、本実施形態においては説明を簡略化するためにデータベース装置10を一台のみ図示しているが、情報処理システム1には複数のデータベース装置10が含まれる。
【0028】
(データベース装置10の構成)
データベース装置10は、演算部11、記憶部12、及び通信部13を有している。
【0029】
演算部11は、回路(ハードウェア)又はCPUなどの中央演算処理部である。演算部11は、記憶部12に格納されたプログラム(ソフトウェア)に従って、データベース装置10の制御を行う。
【0030】
記憶部12は、情報処理装置20に出力するデータのデータベースを格納する。このデータには、人の行動を含むデータ(以下、「行動履歴データ」という場合がある。)が含まれる。行動履歴データには、人の行動に加えて、当該人の識別情報も含まれる。
【0031】
人の識別情報は、個人と個人を識別できる識別子であって、例えばユーザIDを含む。識別子は、ユーザIDに加えて、他の因子、例えば日時や場所を組み合わせたものであってもよい。例えば1月1日の甲と1月2日の甲を、別の個人として扱って別の識別子を付与してもよい。また、人の識別情報は、個人に紐づけられた属性情報(例えば年齢、性別など)を含んでいてもよい。
【0032】
行動履歴データは、換言すれば、個人が意志を持って行った行動を含むデータ(トランザクションデータ)であり、当該個人に紐づけられている。また、行動履歴データは時間軸上の点で表される行動を含み、これら時間的に連続する一連の行動が行動履歴を構成する。なお、行動履歴データの種別は、特に限定されるものではなく、種々のデータを含む。
【0033】
行動履歴データには、例えば交通系ICカード又は同等の機能を持つ携帯端末(以下、「交通系ICカード」と総称する。)から取得される情報が含まれる。例えば鉄道の駅の改札機やバスなどの交通機関で交通系ICカードを利用すると、その利用履歴がデータベース装置10に送信され、記憶部12に記憶される。また、交通機関以外の例えば駅構内や駅周辺の店舗に設置されているカード読み取り端末、POSレジ端末、自動販売機などで交通系ICカードを利用した場合も同様に、その利用履歴がデータベース装置10に送信され、記憶部12に記憶される。このように利用履歴が記憶される際、交通系ICカードを識別するユーザIDや、交通系ICカードを利用した場所の位置情報も、利用履歴に紐づけられて記憶される。
【0034】
また、行動履歴データには、例えばウェブサイトの操作履歴が含まれる。ウェブサイトの操作履歴には、例えばEC(電子商取引)サイトにおける商品の購買履歴やサービスの利用履歴、ウェブサイトの閲覧履歴などが含まれる。これらウェブサイトの操作履歴が記憶部12に記憶される際、ウェブサイトにおけるユーザIDも操作履歴に紐づけられて記憶される。
【0035】
さらに、行動履歴データには、例えば小売店などにおける購買データ(POSデータ)、クレジットカードや電子マネーの使用データ、金融機関におけるトランザクションデータ(例えば預け入れや引き出し、決済など)、飲食店における飲食データ、宿泊施設における宿泊データ、音楽・動画サービスやゲームの再生・プレイデータ、ポイントサイトにおけるポイント使用データなどが含まれていてもよい。
【0036】
また、記憶部12には、データベース装置10の制御を行うための各種プログラムが格納される。
【0037】
通信部13は、ネットワーク30との間の通信を媒介する通信インタフェースであり、情報処理装置20とデータ通信を行う。
【0038】
(情報処理装置20の構成)
情報処理装置20は、演算部21、記憶部22、抽出部23、マッピング部24、算出部25、分類部26、可視化部27、及び通信部28を有している。
【0039】
演算部21は、回路(ハードウェア)又はCPUなどの中央演算処理部である。演算部21は、記憶部22に格納されたプログラム(ソフトウェア)に従って、情報処理装置20の制御を行う。
【0040】
記憶部22は、情報処理装置20で処理される各種データを記憶する。例えば記憶部22には、データベース装置10から情報処理装置20に入力された入力データ、抽出部23における抽出結果のデータ、マッピング部24におけるマッピング結果のデータ、算出部25における算出結果のデータ、分類部26における分類結果のデータ、可視化部27において可視化されたデータが記憶される。また、記憶部22には、情報処理装置20の制御を行うための各種プログラムが格納される。
【0041】
抽出部23は、データベース装置10から情報処理装置20に入力された行動履歴データから、行動履歴を抽出する。上述したように行動履歴は個人に紐づけられており、抽出部23は、個人を識別する識別子毎に行動履歴を抽出する。また、データベース装置10から入力される生データには不要な情報が含まれている場合があり、抽出部23では、このような不要な情報を除くなどのクレンジング処理も行う。
【0042】
マッピング部24は、抽出部23で抽出された行動履歴をマッピングする。具体的にマッピング部24では、行動履歴をベクトル化して、ベクトル空間にマッピングする。行動履歴のベクトル化では、各行動に含まれる複数のパラメータのうち、処理に必要なパラメータを選択して各行動をベクトル化する。パラメータの選択方法は任意であるが、例えばオペレータによってパラメータが選択されてもよいし、あるいは機械学習によってパラメータが選択されてもよい。ベクトル空間は、物理的に存在する現実空間をベクトルで表現したものであってもよいし、物理的に存在しない仮想空間をベクトルで表現したものであってもよい。例えば、処理対象の行動履歴が交通機関や実店舗などにおける行動である場合、ベクトル空間は現実空間をベクトルで表現したものとなる。一方、例えば処理対象の行動履歴がウェブサイトなどにおける行動である場合、ベクトル空間は仮想空間をベクトルで表現したものとなる。
【0043】
なお、各行動においてベクトル化するパラメータは、単一のパラメータであってもよいし、複数のパラメータを次元削減(次元圧縮)したパラメータであってもよい。複数のパラメータを次元削減する場合、複数のパラメータを行列に入力し、例えば主成分分析を行うことで主成分を抽出して、次元を落としたパラメータを生成する。
【0044】
また、行動履歴データが地理情報と紐づけ可能な場合、マッピング部24は、行動履歴を地理空間にマッピングしてもよい。
【0045】
算出部25は、時間的に連続する2つの行動(以下、単に「2つの行動」という場合がある。)の近さと、当該2つの行動間の時間の一方又は両方を算出する。
【0046】
2つの行動の近さを算出する場合において、例えば処理対象の行動履歴が交通機関や実店舗などにおける行動であって、地理情報と紐づけ可能な場合、算出部25は、2つの行動が行われた位置の物理的な距離を近さとして算出する。物理的な距離は、例えば地理的な直線距離であってもよいし、地理的な経路に沿った距離であってもよい。また、算出部25は、ある位置から見たときの2つの行動が行われた位置の方位角の差を近さとして算出してもよい。
【0047】
また、2つの行動の近さを算出する場合において、例えば処理対象の行動履歴がウェブサイトなどにおける行動であって、行動履歴のベクトル化が可能な場合、算出部25は、2つの行動の類似度を近さとして算出する。類似度は任意であるが、例えばコサイン類似度、ユークリッド距離、マンハッタン距離などが例示される。
【0048】
分類部26は、算出部25で算出された2つの行動の近さと2つの行動間の時間の一方又は両方に基づいて、2つの行動間を滞在と移動に分類する。2つの行動間は、時間的に連続する2つの行動の間における人の状態を含む。滞在は、ベクトル空間において2つの行動間で人が留まっている状態を示す。一方、移動は、ベクトル空間において2つの行動間で人が移動している状態を示す。
【0049】
算出部25において2つの行動の近さを算出する場合、分類部26は、算出された近さと、予め設定された閾値とを比較して、2つの行動間を滞在と移動に分類する。例えば算出された近さが閾値未満の場合、2つの行動間は滞在と分類され、算出された近さが閾値以上場合、2つの行動間は移動と分類される。
【0050】
算出部25において2つの行動間の時間を算出する場合、分類部26は、算出された時間と、予め設定された閾値とを比較して、2つの行動間を滞在と移動に分類する。例えば算出された時間が閾値未満の場合、2つの行動間は滞在と分類され、算出された時間が閾値以上の場合、2つの行動間は移動と分類される。
【0051】
算出部25において2つの行動の近さと時間を両方算出する場合、分類部26は、先ず、算出された近さと時間から近さの時間微分を導出する。近さが距離の場合、近さの時間微分は速度となり、近さが角度の場合、近さの時間微分は角速度となる。また、近さが類似度の場合、近さの時間微分は類似度の変化の時間当たりの変化率となる。そして分類部26は、導出された近さの時間微分と、予め設定された閾値とを比較して、2つの行動間を滞在と移動に分類する。例えば導出された近さの時間微分が閾値未満の場合、2つの行動間は滞在と分類され、導出された近さの時間微分が閾値以上の場合、2つの行動間は移動と分類される。
【0052】
可視化部27は、分類部26において分類した滞在を可視化する。
【0053】
通信部28は、ネットワーク30との間の通信を媒介し、データベース装置10とデータ通信を行う。
【0054】
なお、本実施形態の情報処理装置20では、上記プログラムは記憶部22に格納されたが、例えばコンピュータ読み取り可能なハードディスクドライブ(HDD)、ソリッドステートドライブ(SSD)、フレキシブルディスク(FD)、コンパクトディスク(CD)、マグネットオプティカルデスク(MO)、各種メモリなどのコンピュータに読み取り可能な記憶媒体に格納されてもよい。また、上記プログラムは、インターネットなどの通信回線網を介してダウンロードすることにより、上記記憶媒体などに格納することができる。
【0055】
<情報処理方法>
次に、以上のように構成された情報処理システム1を用いて行われる情報処理方法について説明する。以下においては、3つの具体的な事例を含む実施形態を用いて、本発明の情報処理方法について説明する。
【0056】
(第1の実施形態)
第1の実施形態にかかる情報処理方法について説明する。
図2は、第1の実施形態にかかる情報処理方法の主な工程を示すフロー図である。第1の実施形態では、処理対象の行動履歴データが、駅の改札機で交通系ICカードが利用された際の利用履歴を含むデータである場合について説明する。
【0057】
[S11:記憶工程]
先ず、駅の改札機で交通系ICカードが利用されると、その利用履歴がデータベース装置10に送信され、記憶部12に記憶される。記憶部12に記憶された行動履歴データは、ネットワーク30を介して情報処理装置20に入力され、記憶部22に記憶される。
【0058】
図3は、行動履歴データの一例を示す表である。行動履歴データは、例えばユーザID、日時、駅、入出場を含み、これらが時系列に並べられている。また、記憶部22には、
図4に示す駅のマスタデータも記憶される。駅のマスタデータは、駅の地理情報、すなわち緯度及び経度を含む。
【0059】
[S12:抽出工程]
次に、抽出部23において、工程S11で記憶部12に記憶された行動履歴データから行動履歴を抽出する。工程S12では、
図5に示すように識別子であるユーザID毎に行動履歴を抽出する。
【0060】
[S13:マッピング工程]
次に、マッピング部24において、工程S12で抽出された行動履歴を地理空間にマッピングする。工程S13では、
図6に示すように、
図5の行動履歴の駅に対して、
図4の駅マスタデータの駅の地理情報(緯度及び経度)が紐づけられる。かかる場合、行動履歴に地理情報が紐づけられるので、行動履歴が地理空間にマッピングされる。
【0061】
なお、工程S12における識別子が、ユーザIDに加えて、他の因子、例えば日時や場所を組み合わせたものである場合、行動履歴には当該識別子が付与される。かかる場合、工程S12と工程S13は、順序が逆であってもよい。すなわち、行動履歴に地理情報を紐づけて、当該行動履歴を地理空間にマッピングした後、識別子を付与してもよい。
【0062】
[S14:算出工程]
次に、算出部25において、工程S13でマッピングされた行動履歴を用いて、時間的に連続する2つの行動の近さを算出する。工程S14では、先ず、
図7に示すようにユーザID及び日付毎に、連続する2つの行動を要素とするベクトルを生成する。以下、連続する2つの行動において、前の行動を「前行動」といい、後の行動を「後行動」という。そして、前行動と後行動の要素には、時刻、駅、入出場、駅の地理情報が含まれる。次に、2つの行動の近さとして、前行動の駅の地理情報(緯度及び経度)と後行動の駅の地理情報を用いて、これら前後行動の駅間距離を算出する。なお、第1の実施形態においては前後行動の駅の直線距離を算出したが、地理的な経路に沿った距離を算出してもよい。
【0063】
[S15:分類工程]
次に、分類部26において、工程S14で算出された2つの行動の近さ(駅間距離)に基づいて、2つの行動間を滞在と移動に分類する。工程S15では、滞在と移動に分類するための駅間距離の閾値を例えば3000mとする。そして
図8に示すように、前後行動の駅間距離が3000m未満であれば「滞在」と分類し、3000m以上であれば「移動」と分類する。
【0064】
[S16:可視化工程]
次に、可視化部27において、工程S15で分類された滞在と移動を可視化する。工程S16では、
図9に示すように日付毎に滞在と移動を集計し、グラフに表して可視化する。なお、第1の実施形態においては、日付毎に滞在と移動を集計したが、集計単位はこれに限定されない。例えば駅毎に滞在と移動を集計してもよい。
【0065】
以上の第1の実施形態によれば、工程S15において連続する2つの行動間を滞在と移動に分類するので、各駅の利用実態及び人の流動を適切に把握することができる。また、工程S16において滞在と移動を可視化するので、これら各駅の利用実態及び人の流動の把握がさらに容易になる。例えば、滞在場所毎の人数を集計することでヒートマップを作成すれば、滞在場所を判定することができ、また居住エリアを推定することができる。また例えば、滞在と購買履歴を紐づけることで、購買傾向を推定することができる。さらに例えば、滞在とイベント等を紐づけることで、滞在目的を推定することができる。そして、このように人の行動履歴を適切に分析することができるので、例えば商品やサービスのマーケティングやレコメンデーション、イベント計画、交通計画など、多様な目的に分析結果を用いることができる。
【0066】
ここで従来、OD(Origin:出発地、Destination:目的地)データを用いて人の流動を分析することが行われている。しかしながら、第1の実施形態のように駅に入場してから出場するまでのデータ(上記ODデータ)に加えて、駅を出場してから入場するまでのデータも用いて分析することは、従来行われていない。そして、第1の実施形態によればこのように連続する2つの行動間を滞在と分類することで、従来よりも人の行動履歴を適切に分析することが可能になる。
【0067】
また従来、例えば特許文献1に記載されているように、交通系ICカードの利用履歴に基づいて、駅構内や駅周辺における利用傾向を分析することは行われている。一方、第1の実施形態では、駅を出場してから入場するまでのデータも用いて、2つの行動間の滞在と移動を分析することで、駅間のエリアを含み、駅周辺より広いエリアにおける滞在と移動を把握することができる。かかる観点からも、第1の実施形態によれば、従来よりも人の行動履歴を適切に分析することができる。
【0068】
また、第1の実施形態では、個人が意志を持って行った行動を含む行動履歴データを分析するので、人の行動として、連続する2つの行動間を滞在と移動に分類する意味がある。例えばGPSを用いて取得されるログデータのように自動で取得されるデータを分析して人の滞在と移動を分類しても、人の行動を適切に分析することはできない。
【0069】
(第2の実施形態)
第2の実施形態にかかる情報処理方法について説明する。
図10は、第2の実施形態にかかる情報処理方法の主な工程を示すフロー図である。第2の実施形態では、第1の実施形態と同様に、処理対象の行動履歴データが、駅の改札機で交通系ICカードが利用された際の利用履歴を含むデータである場合について説明する。また、第2の実施形態では、第1の実施形態と同じ行動履歴データを用いる。
【0070】
[S21:記憶工程、S22:抽出工程、S23:マッピング工程]
第2の実施形態にける工程S21~S23はそれぞれ、第1の実施形態の工程S11~S13と同様である。すなわち先ず、工程S21において、
図3に示した行動履歴データと
図4に示した駅のマスタデータが、情報処理装置20の記憶部22に記憶される。次に、工程S22において、
図5に示したように行動履歴データから、ユーザID毎に行動履歴を抽出する。次に、工程S23において、
図6に示したように、
図5の行動履歴の駅に対して、
図4の駅マスタデータの駅の地理情報が紐づけられ、行動履歴が地理空間にマッピングされる。
【0071】
[S24:算出工程]
次に、算出部25において、工程S23でマッピングされた行動履歴を用いて、時間的に連続する2つの行動の近さと、当該2つの行動間の時間を算出する。工程S24では、先ず、第1の実施形態の工程S14と同様に、
図11に示すようにユーザID及び日付毎に、連続する2つの行動を要素とするベクトルを生成する。次に、2つの行動の近さとして、前行動の駅の地理情報と後行動の駅の地理情報を用いて、これら前後行動の駅間距離を算出する。この2つの行動の近さの算出は、第1の実施形態と同様である。第2の実施形態では、さらに前行動の時間と後行動の時間を用いて、これら前後行動間の時間を算出する。
【0072】
[S25:分類工程]
次に、分類部26において、工程S24で算出された2つの行動の近さ(駅間距離)と2つの行動間の時間に基づいて、2つの行動間を滞在と移動に分類する。工程S25では、滞在と移動に分類するための駅間距離の閾値を例えば3000mとし、時間の閾値を30分とする。そして
図12に示すように、前後行動の駅間距離が3000m未満かつ前後行動間の時間が30分未満であれば「滞在」と分類し、前後行動の駅間距離が3000m以上又は前後行動間の時間が30分以上であれば「移動」と分類する。なお、工程S25では、駅間距離を時間で割って速度を導出し、当該導出された速度と所定の閾値とを比較して、2つの行動間を滞在と移動に分類してもよい。
【0073】
[S26:可視化工程]
次に、可視化部27において、工程S25で分類された滞在と移動を可視化する。工程S26では、
図12に示した表において、前行動が出場である場合の、前行動の駅毎に滞在と移動を集計する。そして
図13に示すように、滞在と移動の集計結果をグラフに表して可視化する。
【0074】
以上の第2の実施形態においても、上述した第1の実施形態と同様の効果を享受することができる。しかも、工程S25において2つの行動の近さに加え、2つの行動間の時間に基づいて、2つの行動間を滞在と移動に分類するので、当該分類をより精緻に行うことができる。その結果、各駅の利用実態及び人の流動をより正確に把握することができる。
【0075】
また、鉄道を利用して駅で出場した後の行動の分析は、交通系ICカードの利用履歴データからは通常は困難であるが、第2の実施形態の情報処理方法を用いることで駅を出場した後の行動を分析することができる。特に、駅別に集計することで、駅の利用のされ方を把握することができる。
【0076】
(第3の実施形態)
第3の実施形態にかかる情報処理方法について説明する。
図14は、第3の実施形態にかかる情報処理方法の主な工程を示すフロー図である。第3の実施形態では、処理対象の行動履歴データが、ECサイトにおける商品の購買履歴を含むデータである場合について説明する。
【0077】
[S31:記憶工程]
先ず、ECサイトにおいて商品が購入されると、その購買履歴がデータベース装置10に送信され、記憶部12に記憶される。記憶部12に記憶された行動履歴データは、ネットワーク30を介して情報処理装置20に入力され、記憶部22に記憶される。
【0078】
図15は、行動履歴データの一例を示す表である。行動履歴データは、例えばユーザID、購買日時、購買店舗、購買品目を含み、これらが時系列に並べられている。また、記憶部22には、
図16に示す店舗のマスタデータと、
図17に示す品目のマスタデータも記憶される。店舗のマスタデータにおける店舗トピックは、トピックモデルにより行動履歴データからトピックを抽出して作成される。同様に、品目のマスタデータにおける品目トピックも、トピックモデルにより行動履歴データからトピックを抽出して作成される。
【0079】
[S32:抽出工程]
次に、抽出部23において、工程S31で記憶部12に記憶された行動履歴データから行動履歴を抽出する。工程S32では、
図18に示すようにユーザID毎に行動履歴を抽出する。
【0080】
[S33:マッピング工程]
次に、マッピング部24において、工程S32で抽出された行動履歴をベクトル化して、ベクトル空間にマッピングする。工程S33では、
図19に示すように行動履歴データに店舗及び品目のマスタを紐づけることにより、購入を行った店舗及び品目を要素とするベクトルを生成する。
【0081】
[S34:算出工程]
次に、算出部25において、工程S33でベクトル化された行動履歴を用いて、時間的に連続する2つの行動の近さと、当該2つの行動間の時間を算出する。工程S34では、
図20に示すように2つの行動の近さとして、前行動の店舗トピック及び品目トピックからなるベクトルと、後行動の店舗トピック及び品目トピックからなるベクトルを用いて、これら前後行動のベクトルのコサイン類似度を算出する。なお、第3の実施形態においてはコサイン類似度を算出したが、ユークリッド距離やマンハッタン距離を算出してもよい。また、工程S34では、前行動の購買時間と後行動の購買時間を用いて、これら前後行動間の時間を算出する。
【0082】
[S35:分類工程]
次に、分類部26において、工程S34で算出された2つの行動の近さ(コサイン類似度)と2つの行動間の時間に基づいて、2つの行動間を滞在と移動に分類する。工程S35では、滞在と移動に分類するためのコサイン類似度の閾値を例えば0.707とし、時間の閾値を60分とする。そして
図21に示すように、コサイン類似度が0.707より大きく又は時間が60分より大きければ「滞在」と分類し、コサイン類似度が0.707以下かつ時間が60分以下であれば「移動」と分類する。
【0083】
以上の第3の実施形態においても、上述した第1及び第2の実施形態と同様の効果を享受することができる。すなわち、工程S35において連続する2つの行動間を滞在と移動に分類するので、ウェブサイトの利用実態を適切に把握することができ、その結果、例えば商品やサービスのマーケティング、レコメンデーションなど、多様な目的に分析結果を用いることができる。
【0084】
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明はかかる例に限定されない。当業者であれば、特許請求の範囲に記載された思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【産業上の利用可能性】
【0085】
本発明は、人の行動履歴を分析する際に有用である。
【符号の説明】
【0086】
1 情報処理システム
10 データベース装置
11 演算部
12 記憶部
13 通信部
20 情報処理装置
21 演算部
22 記憶部
23 抽出部
24 マッピング部
25 算出部
26 分類部
27 可視化部
28 通信部
30 ネットワーク