特許第6982404号(P6982404)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特許6982404情報処理装置、情報処理方法及び情報処理プログラム
<>
  • 特許6982404-情報処理装置、情報処理方法及び情報処理プログラム 図000003
  • 特許6982404-情報処理装置、情報処理方法及び情報処理プログラム 図000004
  • 特許6982404-情報処理装置、情報処理方法及び情報処理プログラム 図000005
  • 特許6982404-情報処理装置、情報処理方法及び情報処理プログラム 図000006
  • 特許6982404-情報処理装置、情報処理方法及び情報処理プログラム 図000007
  • 特許6982404-情報処理装置、情報処理方法及び情報処理プログラム 図000008
  • 特許6982404-情報処理装置、情報処理方法及び情報処理プログラム 図000009
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6982404
(24)【登録日】2021年11月24日
(45)【発行日】2021年12月17日
(54)【発明の名称】情報処理装置、情報処理方法及び情報処理プログラム
(51)【国際特許分類】
   G06F 16/20 20190101AFI20211206BHJP
   G06Q 10/04 20120101ALI20211206BHJP
【FI】
   G06F16/20
   G06Q10/04
【請求項の数】7
【全頁数】14
(21)【出願番号】特願2017-100271(P2017-100271)
(22)【出願日】2017年5月19日
(65)【公開番号】特開2018-195204(P2018-195204A)
(43)【公開日】2018年12月6日
【審査請求日】2020年3月2日
(73)【特許権者】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】110000637
【氏名又は名称】特許業務法人樹之下知的財産事務所
(72)【発明者】
【氏名】真田 勉
【審査官】 齊藤 貴孝
(56)【参考文献】
【文献】 特開2008−225814(JP,A)
【文献】 特開2015−001822(JP,A)
【文献】 特開2009−187293(JP,A)
【文献】 国際公開第2015/079647(WO,A1)
【文献】 特開2013−065244(JP,A)
【文献】 特開2010−216912(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00−16/958
G06Q 10/00−99/00
(57)【特許請求の範囲】
【請求項1】
複数項目の処理履歴を含むレコードが複数記録された履歴情報から、所定の分析テーマに関係する関係項目を、所定期間毎に抽出する項目抽出部を備え、
前記項目抽出部は、
第1期間の前記履歴情報から関係項目候補を抽出し、前記関係項目候補と、前記第1期間よりも前の期間である第2期間の前記関係項目とから、前記第1期間における前記関係項目を抽出する
ことを特徴とする情報処理装置。
【請求項2】
請求項1に記載の情報処理装置において、
前記第1期間の前記関係項目が抽出された場合、前記履歴情報から前記第1期間の前記履歴情報を削除する記録制御部を備える
ことを特徴とする情報処理装置。
【請求項3】
請求項1又は請求項2に記載の情報処理装置において、
前記項目抽出部は、前記関係項目候補及び前記関係項目を抽出する際、予め設定された個数の項目を抽出する
ことを特徴とする情報処理装置。
【請求項4】
請求項1又は請求項2に記載の情報処理装置において、
前記項目抽出部は、前記関係項目候補及び前記関係項目を抽出する際、項目毎の前記分析テーマに対する関係度を算出し、算出した前記関係度が所定閾値以上である項目を抽出する
ことを特徴とする情報処理装置。
【請求項5】
請求項1から請求項のいずれか1項に記載の情報処理装置において、
前記処理履歴はユーザの行動履歴であり、
前記処理履歴は、ユーザに関連付けられたデバイスから取得され、前記デバイスの種類毎に項目が分けられている
ことを特徴とする情報処理装置。
【請求項6】
コンピュータにより情報を処理させる情報処理方法であって、
前記コンピュータは、
複数項目の処理履歴を含むレコードが複数記録された履歴情報から、所定の分析テーマに関係する関係項目を、所定期間毎に抽出するステップを備え、
前記ステップでは、
第1期間の前記履歴情報から関係項目候補を抽出し、
前記関係項目候補と、前記第1期間よりも前の期間である第2期間の前記関係項目とから、前記第1期間における前記関係項目を抽出する
ことを特徴とする情報処理方法。
【請求項7】
コンピュータに読み込まれ実行される情報処理プログラムであって、
前記コンピュータを、請求項1から請求項のいずれか1項に記載の情報処理装置として機能させる
ことを特徴とする情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。
【背景技術】
【0002】
従来、各ユーザのユーザ端末から行動履歴(処理履歴)を取得して記録部に蓄積し、蓄積した行動履歴を分析することで、例えば、ユーザの次の行動を予測する情報処理装置が知られている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2016−38822号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、蓄積された行動履歴を分析する際には最初に、当該行動履歴から所定の分析テーマ(例えば自動車の販売など)と関係する項目(以下、「関係項目」と呼ぶ)を抽出する必要がある。
行動履歴は、例えば、行動の種類や、送信元のデバイスの種類毎に項目分けされているが、近年、IoT(Internet of Things)の普及などにより、インターネットに接続されているデバイスの種類が増加しているため、行動履歴の項目数が増大し、分析対象の行動履歴のデータサイズも増大している。このため、関係項目の抽出処理に多くの時間を要するようになった。
抽出処理の時間を短縮するためには、例えば、蓄積された行動履歴のうち所定期間(例えば直近の1か月間)の行動履歴から、関係項目を抽出する方法もあるが、この方法では、前記所定期間以外の行動履歴は完全に無視されるため、関係項目を精度よく抽出できないという問題がある。
【0005】
本発明の目的は、関係項目の抽出に要する処理時間を短縮し、かつ、関係項目を精度よく抽出できる情報処理装置、情報処理方法及び情報処理プログラムを提供することにある。
【課題を解決するための手段】
【0006】
本発明の情報処理装置は、複数項目の処理履歴を含むレコードが複数記録された履歴情報から、所定の分析テーマに関係する関係項目を抽出する項目抽出部を備え、前記項目抽出部は、第1期間の前記履歴情報から関係項目候補を抽出し、前記関係項目候補と第2期間の前記関係項目とから、前記第1期間における前記関係項目を抽出することを特徴とする。
【発明の効果】
【0007】
本発明における、第1期間の関係項目候補を抽出する処理は、第1期間における履歴情報から、分析テーマに関係する項目の候補を抽出すればよいので時間がかからない。また、抽出した関係項目候補と、第2期間の関係項目とから、第1期間の関係項目を抽出する処理は、抽出対象の項目数が絞られているため時間がかからない。このため、上記2つの抽出処理にかかる時間を合わせた時間は、例えば第1と第2期間を含んだ全期間の履歴情報から第1期間の関係項目を抽出する時間と比べて短い。
また、第1期間の履歴情報から抽出した関係項目候補と、すでに抽出されている第2期間の関係項目とから、第1期間の関係項目を抽出するため、第1期間以外の期間において関係項目として抽出されていた項目を加味して、第1期間の関係項目を抽出できる。
以上のように、本発明によれば、関係項目を迅速かつ精度よく抽出できる。
【図面の簡単な説明】
【0008】
図1】本発明の実施形態における情報処理システムの概略構成を示す図。
図2】実施形態におけるサーバ装置の概略構成を示す図。
図3】実施形態における履歴情報の一例を示す図。
図4】実施形態における目的変数記録部のデータ構造の一例を示す図。
図5】実施形態における関係項目抽出処理を示すフローチャート。
図6】実施形態における関係項目候補抽出処理を示すフローチャート。
図7】実施形態における目的変数が対応付けられた履歴情報を説明する図。
【発明を実施するための形態】
【0009】
[実施形態]
以下、本発明の実施形態を図面に基づいて説明する。
[情報処理システムの構成]
図1は、情報処理システム1の概略構成を示す図である。
情報処理システム1では、複数のユーザ端末2と、サーバ装置3とがインターネットなどのネットワークを介して通信可能となるように接続されている。
近年、IoTの普及により、ネットワークに接続されるユーザ端末2の数が多くなっており、ユーザ端末2から送信される行動履歴は、膨大なデータ量となっている。サーバ装置3は、ユーザ端末2から送信される膨大なデータ量の行動履歴を分析する。
具体的に、サーバ装置3は、ユーザ端末2から送信されたユーザの行動履歴を、ネットワークを介して取得し、蓄積する。そして、蓄積した行動履歴を分析して、当該行動履歴の各項目のうち、所定の分析テーマ(例えば、自動車の販売など)に関係する関係項目を抽出する。すなわち、分析テーマに対して重要な項目を抽出する。
所定の分析テーマに関係する関係項目を抽出できれば、所定の処理を実行できる。所定の処理としては、例えば、広告効果を向上させるために、当該関係項目の実行頻度が高いユーザを、当該分析テーマとの関連度が高いユーザとして予想・抽出し、当該分析テーマに関する広告を、抽出したユーザに提供する処理があげられる。
以下、情報処理システム1の各構成について詳細に説明する。
【0010】
[ユーザ端末の構成]
ユーザ端末2は、ユーザに関連付けられたコンピュータや家庭用電気製品や車載装置などのデバイスである。コンピュータとしては、例えばスマートフォンやタブレット等の携帯型端末や、パーソナルコンピュータ(PC)等の固定型端末等を例示できる。家庭用電気製品としては、テレビジョンや冷蔵庫などを例示できる。
【0011】
例えば、ユーザ端末2がコンピュータである場合、ユーザ端末2は、ユーザが閲覧したウェブページや動画などのコンテンツを示す情報や、検索したキーワード等を、行動履歴として取得する。
ユーザ端末2がテレビジョンである場合、ユーザ端末2は、ユーザが試聴したテレビ番組、視聴した時刻、視聴したチャンネル等を、行動履歴として取得する。
ユーザ端末2が冷蔵庫である場合、ユーザ端末2は、扉の開閉回数や開閉時間、庫内に出し入れされた商品を示す情報等を、行動履歴として取得する。
ユーザ端末2が車載装置である場合、ユーザ端末2は、自動車の走行していた時刻、位置情報、スピードと加速度、自動車に備えられた装置の動作状況等を、行動履歴として取得する。
そして、ユーザ端末2は、取得した行動履歴を、例えば所定時間間隔で、ネットワークを介してサーバ装置3に送信する。
【0012】
[サーバ装置の構成]
図2は、サーバ装置3の概略構成を示すブロック図である。
サーバ装置3は、コンピュータにより構成され、本発明の情報処理装置として機能する。このサーバ装置3は、ネットワークに接続され、ユーザ端末2との通信を可能とするサーバ通信部31と、サーバ記録部32と、サーバ制御部33などを含んで構成されている。
【0013】
[サーバ記録部の構成]
サーバ記録部32は、例えばメモリ、ハードディスクなどにより構成されたデータ記録装置である。
サーバ記録部32には、サーバ装置3を制御するための各種プログラムが記録される。さらに、このサーバ記録部32は、履歴情報記録部321と、項目テーブル記録部322と、目的変数記録部323とを備えている。
【0014】
図3は、履歴情報記録部321に記録された履歴情報321Aのデータ構造の一例を示す図である。
履歴情報321Aには、ユーザ端末2から送信された複数項目の行動履歴(処理履歴)が1行に並んだレコード(1行のデータ)が、複数行記録される。レコードは、ユーザID毎及び期間(例えば日や月や年)毎に生成される。本実施形態では、レコードは月毎に生成される場合を想定する。
図3に示す履歴情報321Aには、ユーザID「0001」、「0002」、「0003」…に関係付けられた第A期間(例えば8月)のレコード「A0001」、「A0002」、「A0003」…と、第B期間(例えば9月)のレコード「B0001」、「B0002」、「B0003」…とが記録されている。
本実施形態では、詳しくは後述するが、月が更新される毎に、直前の月における関係項目が抽出される。そして、関係項目が抽出された月の行動履歴は、履歴情報321Aから削除される。図3に示す履歴情報321Aは、9月になった際に、これから8月の関係項目を抽出する段階の状態を示している。
【0015】
行動履歴の項目は、行動の種類、及び、行動履歴の送信元のユーザ端末2の種類などによって分けられている。
例えば、項目としては、「PCによる自動車関連ページの閲覧」、「PCによる不動産関連ページの検索」、「スマートフォン(SP)による自動車関連ページの閲覧」、「SPによる不動産関連ページの検索」、「テレビジョンによるドラマの閲覧」、「冷蔵庫内への牛乳の新規投入」、「自動車の利用」などが例示できる。
そして、各レコードには、行動履歴として、項目毎の実行回数が記録される。
【0016】
項目テーブル記録部322には、分析テーマ毎及び分析期間毎に生成された関係項目テーブルが記録されている。
分析テーマとしては、「自動車の販売」や「男性未婚者」などを例示できる。分析期間は、本実施形態では1ヶ月である。
関係項目テーブルは、後述する項目抽出部332によって生成される。関係項目テーブルは、履歴情報321Aの項目のうち、該当する分析期間において該当する分析テーマと関係する項目(関係項目)を示すテーブルである。関係項目テーブルの生成方法の詳細については後述する。
【0017】
目的変数記録部323には、図4に示すように、履歴情報321Aの各レコードに対する、分析テーマ毎の既知の目的変数が記録される。
目的変数は、分析テーマに対して、レコードの各項目を入力条件(説明変数)とした場合に、当該レコードが分析テーマにマッチする度合いを示す値(出力)である。目的変数は、例えば、0以上1以下の値で示され、レコードが分析テーマに完全にマッチする場合は、「1」とされ、分析テーマに完全にマッチしない場合は、「0」とされる。
分析テーマに対してレコードがマッチしているか否かが、例えば、行動履歴やアンケートやユーザ登録情報などによって既に得られている場合は、当該レコードに対応した目的変数の正解が得られる。すなわち、当該目的変数が既知となる。本実施形態では、既知の目的変数が、該当するレコード及び分析テーマに関連付けられて目的変数記録部323に記録される。
例えば、分析テーマが「自動車の販売」である場合、レコードに対応するユーザが、当該レコードに対応する期間に実際に自動車を購入した場合は、当該レコードの既知の目的変数として「1」が記録される。また、自動車を購入しなかった場合は、当該レコードの既知の目的変数として「0」が記録される。自動車を購入したか否かが不明な場合は、既知の目的変数は記録されず、空白のままである。
また、例えば、分析テーマが「男性未婚者」であれば、レコードに対応するユーザが男性未婚者と判明している場合は、当該レコードの既知の目的変数として「1」が記録され、女性又は男性既婚者と判明している場合は、当該レコードの既知の目的変数として「0」が記録される。男性未婚者か否かが不明な場合は、既知の目的変数は記録されず、空白のままである。
【0018】
[サーバ制御部の構成]
図2に戻り、サーバ制御部33は、CPU(Central Processing Unit)などの演算回路、RAM(Random Access Memory)などの記録回路により構成され、サーバ記録部32などに記録されている情報処理プログラム(ソフトウェア)を実行することで、行動履歴取得部331、項目抽出部332、記録制御部333として機能する。
行動履歴取得部331は、各ユーザ端末2から送信された行動履歴を取得する。
項目抽出部332は、履歴情報321Aから、分析テーマに関係する項目を抽出し、関係項目テーブルを生成する。
記録制御部333は、行動履歴取得部331が取得した行動履歴を、履歴情報記録部321に記録させたり、履歴情報記録部321に記録されている行動履歴を削除したりする。また、項目抽出部332が生成した関係項目テーブルを、項目テーブル記録部322に記録させる。
【0019】
[関係項目抽出処理]
次に、サーバ装置3が実行する関係項目抽出処理について説明する。
本実施形態では、サーバ装置3は、月が更新される毎に、直前の月を分析期間(第1期間)に設定して関係項目抽出処理を実行する。
図5は、関係項目抽出処理を示すフローチャートである。
関係項目抽出処理が実行されると、項目抽出部332は、予め設定された分析テーマから1つの分析テーマを取得する(ステップS11)。分析テーマは、例えば「自動車の販売」や「男性未婚者」などである。
【0020】
次に、項目抽出部332は、分析期間に対応する履歴情報321Aから、分析テーマに関係する関係項目候補を抽出する関係項目候補抽出処理S20を実行する。
図6は、関係項目候補抽出処理S20を示すフローチャートである。
図6に示すように、関係項目候補抽出処理S20が実行されると、項目抽出部332は、履歴情報321Aから、分析期間に対応する履歴情報(第1期間の履歴情報)を読み出す(ステップS21)。
例えば、項目抽出部332は、分析期間が「8月」の場合、図3に示す履歴情報321Aのうち、8月のレコードであるレコード「A0001」、「A0002」、「A0003」…を読み出す。
【0021】
次に、項目抽出部332は、図7に示すように、読み出した各レコードに対して、目的変数記録部323から、該当するレコード及び分析テーマに関係付けられた既知の目的変数を読み出して対応付ける(ステップS22)。
【0022】
図6に戻り、次に、分析テーマに対する履歴情報321Aの各項目の関係の深さ(関係度)を求めるため、項目抽出部332は、各項目(説明変数)に基づいて分析テーマの目的変数を算出する目的変数算出モデルを生成する。
目的変数算出モデルには、線形回帰モデル又はロジスティック回帰モデルを用いることができる。本実施形態では、目的変数算出モデルとして、例えば、次式(1)で表される線形回帰モデルが用いられる。式(1)において、S(x)は分析テーマxの目的変数である。nは項目を区別する番号であり、Vnはn番目の説明変数であり、項目毎の実行回数を示し、Wn(x)は、VnがS(x)に貢献する貢献度を決める重み係数を示す。
【0023】
【数1】
【0024】
すなわち、S(x)は、項目毎の実行回数のそれぞれに、対応する重み係数を掛けた値の総和である。
つまり、式(1)のWn(x)は、項目nのS(x)に対する貢献度、すなわち、項目nと分析テーマxの目的変数との関係度を示す。このため、Wn(x)を求めることで、各項目nと分析テーマxとの関係度を求めることができる。
【0025】
Wn(x)を求めるには、ステップS22で既知の目的変数を対応付けたレコード毎に、各項目の値を式(1)右辺のVnに代入し、(1)により求めたS(x)と既知の値との誤差が最小となるように、Wn(x)の値を求めることができる。
これにより、履歴情報321Aの各項目に対して、分析テーマに対する関係度を算出できる(ステップS23)。
そして、項目抽出部332は、履歴情報321Aに含まれる項目のうち、関係度が高い方から所定数の項目を、関係項目候補として抽出する(ステップS24)。所定数は、本実施形態では例えば10個に設定されている。なお、当該所定数は、固定値ではなく、分析期間や分析テーマに応じて変化させてもよい。こうして、項目抽出部332は、関係項目候補抽出処理S20を終了する。
【0026】
図5に戻り、関係項目候補抽出処理S20が実行された後、項目抽出部332は、既に当該分析テーマに対する分析が終了している既分析期間(第2期間)に対応した関係項目テーブルを、項目テーブル記録部322から読み出す(ステップS12)。本実施形態では、既分析期間は、分析期間の1つ前の月に相当する。例えば、分析期間が8月であれば、ステップS12では、前月7月の関係項目テーブルを読み出す。
【0027】
次に、項目抽出部332は、ステップS24で抽出した関係項目候補、及び、ステップS12で抽出した既分析期間の関係項目テーブルに含まれる関係項目を合わせたものの中から、分析テーマに対する関係が深い所定数の関係項目を抽出する(ステップS13)。当該所定数は、本実施形態では、例えば関係項目候補の数と同じ10個に設定されている。なお、当該所定数は、固定値ではなく、分析期間や分析テーマに応じて異なる値を採用してもよい。
【0028】
具体的に、ステップS13では、図7に示した既知の目的変数が対応付けられた分析期間のレコード毎に、上記式(1)に対して、抽出した関係項目候補及び既分析期間の関係項目の実行回数をVnに代入し、右辺の値を求める。そして既知の目的変数との誤差が最小となるような、Wn(x)の値を求めることができる。そして、項目抽出部332は、関係項目候補及び既分析期間の関係項目のうち、関係度が高い方から所定数の項目を、分析期間における関係項目として抽出する。
この場合、履歴情報321Aに含まれる項目のうち、関係項目候補及び既分析期間の関係項目以外の項目が除外された状態で、Wn(x)の値が求められる。このため、当該Wn(x)の値は、関係項目候補抽出処理S20で算出した値とは異なるものとなる。この結果、関係項目候補としては見落とされているが、既分析期間の関係項目として抽出されていた項目が、分析期間における関係項目として抽出される場合もある。又は、偶発的に関係項目候補として抽出された項目が、分析期間における関係項目として抽出されない場合もある。このようにして、分析期間における関係項目を、既分析期間の関係項目を加味して抽出できる。
【0029】
そして、項目抽出部332は、抽出した関係項目が含まれた関係項目テーブルを生成する。そして、記録制御部333は、分析テーマ、分析期間、生成された関係項目テーブルを、互いに関係付けて項目テーブル記録部322に記録させる(ステップS14)。
【0030】
次に、記録制御部333は、分析期間において、予め設定されたすべての分析テーマに対して、関係項目テーブルが生成されたか否かを判定する(ステップS15)。
ステップS15でNOと判定された場合、サーバ制御部33は、処理をステップS11に戻す。これにより、すべての分析テーマに対して関係項目テーブルが生成されるまで、ステップS11,S20,S12〜S15の処理が繰り返し実行される。
そして、すべての分析テーマに対して関係項目テーブルが生成され、ステップS15でYESと判定された場合、当該分析期間の履歴情報は不要となり、記録制御部333が、履歴情報321Aから、分析期間に対応する履歴情報を削除する(ステップS16)。例えば、分析期間が8月の場合、図3に示す履歴情報321Aから、8月に対応するレコード「A0001」、「A0002」、「A0003」…を削除する。これにより、履歴情報321Aのデータサイズを縮小できる。そして、サーバ制御部33は、関係項目抽出処理を終了する。
【0031】
[実施形態の作用効果]
本実施形態では、関係項目抽出処理において、項目抽出部332は、分析期間の履歴情報から、分析テーマに関係する関係項目候補を抽出する。そして、抽出した関係項目候補と、既分析期間の関係項目とから、分析期間の関係項目を抽出する。
ここで、分析期間の関係項目候補を抽出する処理は、分析期間(例えば1か月)だけの履歴情報から分析テーマに関係する項目を抽出すればよいので時間がかからない。また、抽出した関係項目候補(例えば10個)と、既分析期間の関係項目(例えば10個)を合わせたものから、分析期間の関係項目を抽出する処理は、抽出対象の項目数が絞られているため時間がかからない。このため、上記2つの抽出処理にかかる時間を合わせた時間は、例えば全期間の履歴情報(行動履歴の蓄積を開始してから蓄積された全ての行動履歴が記録された履歴情報)から分析期間の関係項目を抽出する時間と比べて短い。
また、分析期間の履歴情報から抽出した関係項目候補と、既分析期間の関係項目とから、分析期間の関係項目を抽出するため、分析期間以外の期間において関係項目として抽出された項目を加味して、分析期間の関係項目を抽出できる。
以上のように、上記構成によれば、関係項目を迅速かつ精度よく抽出できる。
【0032】
また、本実施形態では、例えば、月が更新される毎に、直前の月を分析期間とし、分析期間よりも前の月を既分析期間として、関係項目抽出処理が行われる。この場合、一度関係項目として抽出されたが、時間の経過とともに関係度が低下した項目や、ある時期だけ偶発的に関係項目として抽出された項目は、月毎の分析を繰り返すことで、関係項目から外れていく。この結果、関係項目は月毎の作業により改良されていく。また、実施形態のように分析期間よりも1つ前の月、すなわち前々月を既分析期間とする場合は、分析期間よりも1つ前の月の関係項目テーブルがあれば分析期間の関係項目を抽出できるため、記録制御部333は、分析期間よりも2つ以上前の月の関係項目テーブルを、項目テーブル記録部322から削除してもよい。この場合、項目テーブル記録部322の記録容量を小さくできる。
【0033】
本実施形態では、関係項目抽出処理において、記録制御部333は、分析期間において、すべての分析テーマに対して関係項目テーブルを生成した場合、履歴情報321Aから、当該分析期間の履歴情報を削除する。
この構成によれば、履歴情報321Aのデータサイズを小さくすることができ、履歴情報記録部321の記録容量を小さくできる。
【0034】
本実施形態では、関係項目抽出処理において、項目抽出部332は、関係項目候補及び関係項目を抽出する際、予め設定された個数(例えば10個)の項目を抽出する。
この構成によれば、例えば、抽出された関係項目候補及び既分析期間の関係項目の項目数は予め設定された個数の高々2倍であり、膨大な数になることがないため、分析期間の関係項目を抽出する処理にかかる時間が長くなることを防止できる。
【0035】
[変形例]
なお、本発明は、上述した実施形態に限定されるものではなく、本発明の目的を達成できる範囲で、以下に示される変形をも含むものである。
【0036】
[変形例1]
前記実施形態では、関係項目抽出処理において、項目抽出部332は、関係項目候補及び関係項目を抽出する際、予め設定された個数の項目を抽出しているが、これに限定されない。
例えば、項目抽出部332は、関係項目候補及び関係項目を抽出する際、分析テーマに対する関係度が所定閾値以上の項目をすべて抽出してもよい。
この構成によれば、例えば、関係度が高い方から予め設定された個数の項目を抽出する場合と比べて、分析テーマに深く関係する項目を漏れなく抽出できる。
【0037】
[変形例2]
前記実施形態では、履歴情報の各項目の関係度を算出し、算出した関係度に基づいて、関係項目候補及び関係項目を抽出しているが、これに限定されない。
例えば、次のようにして、関係項目を抽出してもよい。
すなわち、まず、図7に示した既知の目的変数が対応付けられた履歴情報のすべてを用いて、目的変数を予測する決定木モデル又はニューラルネットワークモデルなどの予測モデル(基準予測モデル)を生成する。
次に、前記履歴情報からどれか1つの項目の行動履歴を削除した履歴情報を生成し、当該履歴情報を用いて、同様に目的変数を予測する予測モデル(比較予測モデル)を生成する。
この比較予測モデルを生成する処理は、履歴情報から行動履歴を削除する項目を順に変えて繰り返し行う。これにより、履歴情報の項目数と同じ数の比較予測モデルが生成される。
次に、各比較予測モデルの予測値を、基準予測モデルの予測値と比較する。ここで、基準予測モデルの予測値と比較予測モデルの予測値の差が大きいほど、当該比較予測モデルの作成において削除されていた項目と分析テーマとの関係度は高いと判断できる。このため、当該差が大きい方から所定数の比較予測モデルを抽出し、それぞれの比較予測モデルの作成において削除されていた項目を、関係項目候補又は関係項目として抽出する。
【0038】
[変形例3]
前記実施形態では、分析期間において、すべての分析テーマに対して関係項目が抽出されたとき、記録制御部333は、履歴情報321Aから当該分析期間の行動履歴を削除しているが、これに限定されない。
例えば、履歴情報321Aから当該分析期間の行動履歴を削除せずに残しておいてもよい。この場合は、例えば、後で分析テーマが追加された場合でも、当該分析テーマに関係する関係項目を抽出できる。なお、当該分析期間の行動履歴は、分析が行われてから1年間等の一定期間経過後、記録制御部333によって履歴情報321Aから削除するようにしてもよい。例えば、所定の月の関係項目を抽出した場合、1年前の同じ月の履歴情報を履歴情報321Aから削除する。これにより常時、1年分の履歴情報が蓄積されている状態を維持できる。
【0039】
[変形例4]
前記実施形態では、項目抽出部332は、月毎に関係項目を抽出しているが、これに限定されない。すなわち、月だけではなく、日や年等の所定期間毎に関係項目を抽出してもよい。なお、当該所定期間は、前記実施形態のように毎回同じ長さでもよいし、途中で変えてもよい。
【0040】
[変形例5]
前記実施形態及び前記変形例4では、項目抽出部332は、月などの所定期間が更新される毎に、直前の期間を分析期間に設定して関係項目を抽出しているが、これに限定されない。例えば、任意のタイミングで、任意の期間を分析期間に設定して関係項目を抽出してもよい。
また、前記実施形態では、分析期間の1つ前の期間を、既分析期間として設定しているが、これに限定されない。例えば、月毎に関係項目を抽出する場合、分析期間の1年前の同じ月を既分析期間として設定してもよい。又は、日毎に関係項目を抽出する場合、分析期間の1か月前の同じ日を既分析期間として設定してもよい。また、分析期間よりも後の期間において既に分析が行われている期間がある場合は、当該後の期間を既分析期間として設定してもよい。このようにさまざまな期間を既分析期間に設定してもよい。
【0041】
[変形例6]
また、既分析期間として、2つ以上の期間を設定し、分析期間の関係項目候補と、当該2つ以上の期間における関係項目とに基づいて、分析期間の関係項目を抽出してもよい。例えば、分析期間の関係項目を、関係項目候補と、1つ前の期間及び2つ前の期間の関係項目とに基づいて抽出してもよい。
【0042】
[変形例7]
また、項目抽出部332は、関係項目候補を抽出した後、項目テーブル記録部322から、当該関係項目候補と項目が類似している関係項目テーブルを抽出し、当該関係項目候補と、抽出した関係項目テーブルの関係項目とに基づいて、分析期間の関係項目を抽出してもよい。
具体的には、項目抽出部332は、関係項目候補を抽出した後、項目テーブル記録部322から、分析テーマが同じ関係項目テーブルをすべて抽出する。そして、抽出した各関係項目テーブルに対して、関係項目候補との類似度を算出する。類似度は、例えば、関係項目テーブルに含まれる関係項目と関係項目候補との相関係数でもよい。そして、算出した類似度を予め設定された閾値と比較し、類似度が閾値以上の関係項目テーブルを抽出する。
そして、項目抽出部332は、関係項目候補と、類似度が閾値以上の関係項目テーブルに含まれる関係項目とに基づいて、分析期間の関係項目を抽出する。
分析期間において抽出された関係項目候補と類似した関係項目テーブルに含まれる各項目は、分析期間においても分析テーマとの関係度が高いと予想される。上記構成によれば、重要な項目が漏れることを抑制できるため、関係項目をより高い精度で抽出できる。
なお、変形例5−7の場合、変形例3のように履歴情報321Aに過去の行動履歴を削除せず残しておき、項目テーブル記録部322に過去に生成した関係項目テーブルを削除せずに残しておく。そして、項目抽出部332は、分析期間に該当する行動履歴、及び、既分析期間に該当する関係項目テーブルを用いて、関係項目を抽出する。
【0043】
[変形例8]
前記実施形態では、関係項目抽出処理において、項目抽出部332は、予め設定されたすべての分析テーマに対して、関係項目を抽出しているが、これに限定されない。
例えば、ユーザが設定した任意の分析テーマに対してのみ、関係項目を抽出してもよい。
【0044】
[変形例9]
前記実施形態において、分析期間の関係項目を抽出する場合、関係項目候補及び既分析期間の関係項目に加えて、予め設定された必須項目も、分析期間の関係項目として抽出してもよい。又は、関係項目候補及び既分析期間の関係項目から、予め設定された削除項目を最初に削除して、残りの項目から、分析期間の関係項目を抽出してもよい。必須項目や削除項目は、例えば分析テーマや分析期間に応じて設定される。例えば、分析テーマや分析期間との関係度が高いことが予め判明している項目を、必須項目として設定したり、また、分析テーマや分析期間との関係度が低いことが予め判明している項目を、削除項目として設定したりしてもよい。
又は、既分析期間の関係項目は用いずに、関係項目候補及び必須項目だけに基づいて、分析期間の関係項目を抽出してもよい。つまり、本発明では、関係項目候補に加えて、既分析期間の関係項目や必須項目など、分析期間又は分析テーマなどに応じて設定される設定項目にも基づいて、分析期間の関係項目を抽出してもよい。
【0045】
[変形例10]
前記実施形態では、行動履歴取得部331は、ユーザ端末2から送信された行動履歴を取得しているが、これに限定されない。
例えば、行動履歴取得部331は、サーバ装置3とは別にネットワークに接続された、行動履歴を記録した記録装置から、通信により当該行動履歴を取得してもよい。
【0046】
[変形例11]
前記実施形態では、ユーザ端末2から取得される処理履歴(行動履歴)から、分析テーマに関係する関係項目を抽出する例をあげているが、本発明はこれに限定されない。
例えば、工場の製造ラインに設置されている各製造装置に設けられたセンサーなどのデバイスから取得される処理履歴から、分析テーマに関係する関係項目を抽出する場合にも、本発明を適用できる。この場合、履歴情報の各レコードは、例えば、製品のロット毎に生成される。
【符号の説明】
【0047】
1…情報処理システム、2…ユーザ端末(デバイス)、3…サーバ装置(情報処理装置)、31…サーバ通信部、32…サーバ記録部、33…サーバ制御部、321…履歴情報記録部、321A…履歴情報、322…項目テーブル記録部、323…目的変数記録部、331…行動履歴取得部、332…項目抽出部、333…記録制御部。
図1
図2
図3
図4
図5
図6
図7