IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

<>
  • 特許-特定装置、特定方法及び特定プログラム 図1
  • 特許-特定装置、特定方法及び特定プログラム 図2
  • 特許-特定装置、特定方法及び特定プログラム 図3
  • 特許-特定装置、特定方法及び特定プログラム 図4
  • 特許-特定装置、特定方法及び特定プログラム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-08-22
(45)【発行日】2022-08-30
(54)【発明の名称】特定装置、特定方法及び特定プログラム
(51)【国際特許分類】
   G06Q 50/10 20120101AFI20220823BHJP
【FI】
G06Q50/10
【請求項の数】 12
(21)【出願番号】P 2020125551
(22)【出願日】2020-07-22
(65)【公開番号】P2022021763
(43)【公開日】2022-02-03
【審査請求日】2021-08-19
(73)【特許権者】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】坪内 孝太
(72)【発明者】
【氏名】日暮 立
(72)【発明者】
【氏名】田口 拓明
【審査官】後藤 昂彦
(56)【参考文献】
【文献】特開2016-045543(JP,A)
【文献】特開2013-239065(JP,A)
【文献】特開2019-049765(JP,A)
【文献】特許第6182683(JP,B1)
【文献】特開2018-147407(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
G06F 16/00-16/958
(57)【特許請求の範囲】
【請求項1】
所定の事象に関連付けられた利用者群の行動履歴であって、当該利用者群に含まれる各利用者が当該所定の事象に関連付けられるまでの行動履歴を取得する取得部と、
前記取得部により取得された行動履歴に含まれる行動のうち、前記利用者群に含まれる利用者が当該行動を行ってから前記所定の事象に関連付けられた時点までの時間の分布の態様が所定の条件を満たす行動を、前記所定の事象と関連性を有する関連行動として特定する特定部と
を有することを特徴とする特定装置。
【請求項2】
前記特定部は、
前記行動履歴に含まれる行動のうち、前記時間の確率分布が所定の条件を満たす行動を前記所定の事象と関連性を有する関連行動として特定する
ことを特徴とする請求項1に記載の特定装置。
【請求項3】
前記特定部は、
前記行動履歴に含まれる行動のうち、前記時間の分布の態様が正規分布となる行動を前記関連行動として特定する
ことを特徴とする請求項1または2に記載の特定装置。
【請求項4】
前記特定部は、
前記行動履歴に含まれる行動のうち、前記時間の分布の態様がポアソン分布となる行動を前記関連行動として特定する
ことを特徴とする請求項1または2に記載の特定装置。
【請求項5】
前記特定部は、
前記行動履歴に含まれる行動のうち、前記時間の標準偏差が所定の閾値以下である行動を前記関連行動として特定する
ことを特徴とする請求項3または4に記載の特定装置。
【請求項6】
前記関連行動を行った利用者に対し、前記所定の事象に関する情報を提供する第1提供部
をさらに有することを特徴とする請求項1から5のうちいずれか1つに記載の特定装置。
【請求項7】
前記第1提供部は、
前記利用者群に含まれる利用者が前記関連行動を行ってから前記所定の事象に関連付けられた時点までの時間に基づいて、前記関連行動を行った利用者に対し前記所定の事象に関する情報を提供する
ことを特徴とする請求項6に記載の特定装置。
【請求項8】
前記関連行動を行った利用者の位置情報に基づいて、前記所定の事象に関連する位置を示す情報を利用者に提供する第2提供部
をさらに有することを特徴とする請求項1から7のうちいずれか1つに記載の特定装置。
【請求項9】
前記特定部は、
前記行動履歴に含まれる複数の行動の組み合わせのうち、前記利用者群に含まれる利用者が当該組み合わせの各行動を行ってから前記所定の事象に関連付けられた時点までの時間の分布の態様が所定の条件を満たす行動の組み合わせを、前記関連行動として特定する
ことを特徴とする請求項1から8のうちいずれか1つに記載の特定装置。
【請求項10】
前記取得部は、
所定の検索クエリを入力した利用者群により入力された検索クエリであって、当該利用者群に含まれる各利用者が当該所定の検索クエリを入力するまでに入力された検索クエリを取得し、
前記特定部は、
前記利用者群により入力された検索クエリのうち、前記利用者群に含まれる利用者が当該検索クエリを入力してから前記所定の検索クエリを入力する時点までの時間の分布の態様が所定の条件を満たす検索クエリを、前記所定の検索クエリと関連性を有する関連検索クエリとして特定する
ことを特徴とする請求項1から9のうちいずれか1つに記載の特定装置。
【請求項11】
コンピュータが実行する特定方法であって、
所定の事象に関連付けられた利用者群の行動履歴であって、当該利用者群に含まれる各利用者が当該所定の事象に関連付けられるまでの行動履歴を取得する取得工程と、
前記取得工程により取得された行動履歴に含まれる行動のうち、前記利用者群に含まれる利用者が当該行動を行ってから前記所定の事象に関連付けられた時点までの時間の分布の態様が所定の条件を満たす行動を、前記所定の事象と関連性を有する関連行動として特定する特定工程と
を含むことを特徴とする特定方法。
【請求項12】
所定の事象に関連付けられた利用者群の行動履歴であって、当該利用者群に含まれる各利用者が当該所定の事象に関連付けられるまでの行動履歴を取得する取得手順と、
前記取得手順により取得された行動履歴に含まれる行動のうち、前記利用者群に含まれる利用者が当該行動を行ってから前記所定の事象に関連付けられた時点までの時間の分布の態様が所定の条件を満たす行動を、前記所定の事象と関連性を有する関連行動として特定する特定手順と
をコンピュータに実行させるための特定プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、特定装置、特定方法及び特定プログラムに関する。
【背景技術】
【0002】
従来、インターネット上の種々の情報を用いた分析に関する技術が提供されている。このような技術の一例として、購買履歴データ等を用いて時期のトレンドを考慮して顧客を分析する技術が提供されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2015-146145号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上述した技術では、所定の事象と関連性を有する利用者の行動を正確に特定できるとは言えない場合がある。
【0005】
例えば、上述した技術では、所定の類似関係を有する全ての顧客グループを含む統合顧客グループと、分析対象の店の購買履歴データに基づいて生成された顧客グループとの比較結果を出力しているに過ぎず、所定の事象と関連性を有する利用者の行動を正確に特定できるとは言えない場合がある。
【0006】
本願は、上記に鑑みてなされたものであって、所定の事象と関連性を有する利用者の行動を正確に特定することを目的とする。
【課題を解決するための手段】
【0007】
本願に係る特定装置は、所定の事象に関連付けられた利用者群の行動履歴であって、当該利用者群に含まれる各利用者が当該所定の事象に関連付けられるまでの行動履歴を取得する取得部と、前記取得部により取得された行動履歴に含まれる行動のうち、前記利用者群に含まれる利用者が当該行動を行ってから前記所定の事象に関連付けられた時点までの時間の分布の態様が所定の条件を満たす行動を、前記所定の事象と関連性を有する関連行動として特定する特定部とを有することを特徴とする。
【発明の効果】
【0008】
実施形態の一態様によれば、所定の事象と関連性を有する利用者の行動を正確に特定することができるという効果を奏する。
【図面の簡単な説明】
【0009】
図1図1は、実施形態に係る特定処理の一例を示す図である。
図2図2は、実施形態に係る情報処理装置の構成例を示す図である。
図3図3は、実施形態に係る対象情報データベースの一例を示す図である。
図4図4は、実施形態に係る特定処理の手順の一例を示すフローチャートである。
図5図5は、情報提供装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0010】
以下に、本願に係る特定装置、特定方法及び特定プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ説明する。なお、この実施形態により本願に係る特定装置、特定方法及び特定プログラムが限定されるものではない。また、以下の実施形態において、同一の部位には同一の符号を付し、重複する説明は省略される。
【0011】
〔1.実施形態〕
図1を用いて、本実施形態の特定装置等により実現される特定処理を説明する。図1は、実施形態に係る特定処理の一例を示す図である。なお、図1では、本願に係る特定装置の一例である情報処理装置10によって、実施形態に係る特定処理などが実現されるものとする。
【0012】
図1に示すように、実施形態に係る特定システム1は、情報処理装置10と、端末装置100とを含む。情報処理装置10及び端末装置100は、ネットワークN(例えば、図2参照)を介して有線または無線により相互に通信可能に接続される。ネットワークNは、例えば、インターネットなどのWAN(Wide Area Network)である。なお、図1に示した特定システム1には、複数台の情報処理装置10及び複数台の端末装置100が含まれていてもよい。
【0013】
図1に示す情報処理装置10は、特定処理を行う情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。例えば、情報処理装置10は、端末装置100からの要求に応じて所定の検索サービス(例えば、アプリケーション(以下、アプリと記載する場合がある)に表示されるアプリ向けのコンテンツや、端末装置100に実装されるブラウザ等に実装されるウェブページ)を提供し、端末装置100から取得した検索クエリに応じた検索結果を端末装置100に提供する。
【0014】
なお、情報処理装置10は、端末装置100に制御情報を配信する配信装置として機能してもよい。ここで、制御情報は、例えば、JavaScript(登録商標)等のスクリプト言語やCSS(Cascading Style Sheets)等のスタイルシート言語により記述される。なお、情報処理装置10から配信される所定のアプリケーションそのものを制御情報とみなしてもよい。
【0015】
図1に示す端末装置100は、利用者によって利用される情報処理装置である。端末装置100は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、携帯電話機や、PDA(Personal Digital Assistant)等により実現される。なお、図1に示す例において、端末装置100は、利用者によって利用されるスマートフォンである場合を示す。
【0016】
また、端末装置100は、情報処理装置10によって提供される情報を、ウェブブラウザやアプリケーションにより表示する。なお、端末装置100は、情報の表示処理を実現する制御情報を情報処理装置10から受け取った場合には、制御情報に従って表示処理を実現する。
【0017】
ここで、従来、ある行動を行った利用者についての情報を推定する技術が提案されている。例えば、ある検索クエリを入力した際や、あるキーワードを含む投稿を行った際に、その利用者が所定の疾患に罹患しているか、その利用者が所定の商品を購入したかといった利用者の情報を推定する技術が提案されている。すなわち、利用者が行った行動から、その利用者と関連付けられる事象(例えば、その利用者が過去に行った行動やその利用者の状態)を推定する技術が提案されている。
【0018】
しかしながら、単純に事象と、事象から想起される検索クエリ等の行動とを紐づけた場合、適切な推定が行えない恐れがある。例えば、ニュース等で事象と行動との対応が一般に広く周知された場合、実際には事象と関連付けられない利用者が、対応する行動を行う場合がある。より詳細な例を挙げると、所定の疾患の罹患と、症状を示す検索クエリとを紐づけた場合において、ニュース等で所定の疾患と症状との関連性が周知された後は、所定の疾患に罹患していない利用者による当該検索クエリの入力が増加し、当該検索クエリを用いて所定の疾患に罹患した利用者を特定できない事態が想定される。
【0019】
一方で、ある日時において所定の事象に関連付けられた各利用者が過去に所定の行動を行った日時をプロットした場合、正規分布曲線を描くことを出願人は、発見した。このため、例えば、所定の事象に関連付けられた各利用者が過去に行った行動のうち、正規分布を示す行動については、適切にその事象と対応する行動であると推定される。
【0020】
そこで、情報処理装置10は、以下の特定処理を実行する。例えば、情報処理装置10は、所定の事象に関連付けられた利用者群の行動履歴であって、当該利用者群に含まれる各利用者が当該所定の事象に関連付けられるまでの行動履歴を取得する。そして、取得された行動履歴に含まれる行動のうち、利用者群に含まれる利用者が当該行動を行ってから所定の事象に関連付けられた時点までの時間の分布の態様が所定の条件を満たす行動を、所定の事象と関連性を有する関連行動として特定する。
【0021】
以下、図1を用いて、情報処理装置10が行う特定処理の一例について説明する。なお、以下の説明において、端末装置100を利用する利用者に応じて、端末装置100を端末装置100-1~100-N(Nは任意の自然数)として説明する。例えば、端末装置100-1は、利用者ID「U1」により識別される利用者(利用者U1)により使用される端末装置100である。また、以下では、端末装置100-1~100-Nについて、特に区別なく説明する場合には、端末装置100と記載する。
【0022】
まず、情報処理装置10は、利用者が入力した検索クエリの履歴を取得する(ステップS1)。例えば、情報処理装置10は、端末装置100に配信した検索サービスにおいて各利用者が入力した検索クエリの履歴と、検索クエリの入力日時とを示す情報(以下、「検索履歴」と記載する場合がある)を端末装置100から取得する。
【0023】
続いて、情報処理装置10は、所定の検索クエリを入力した利用者群を抽出する(ステップS2)。例えば、情報処理装置10は、所定の事象に関連付けられた際(例えば、特定の感染性疾患の症状を発症した際)に利用者が入力すると推定される検索クエリの指定を、情報処理装置10の管理者等から受け付ける。そして、情報処理装置10は、各利用者の検索履歴に基づいて、指定された検索クエリを入力した利用者群を抽出する。なお、図1の例において、情報処理装置10は、「検索クエリ#1」を入力した利用者群G1を抽出したものとする。
【0024】
続いて、情報処理装置10は、利用者群G1に含まれる各利用者が、所定の検索クエリを入力するまでに入力した各検索クエリと、入力日時とを抽出する(ステップS3)。例えば、情報処理装置10は、利用者群G1に含まれる利用者GU1、GU2、・・・が、検索クエリ#1を入力するまでに入力した各検索クエリと、各検索クエリの入力日時とを検索履歴から抽出する。
【0025】
続いて、情報処理装置10は、抽出された検索クエリが入力された時点から、所定の検索クエリが入力された時点までの時間の分布を出力する(ステップS4)。例えば、検索クエリ#11を例に挙げて説明すると、情報処理装置10は、利用者群G1に含まれる利用者のうち、検索クエリ#11を入力した利用者が検索クエリ#11を入力した時点から検索クエリ#1を入力する時点までの時間(以下、「入力時間」と記載する場合がある)を確率変数とし、各入力時間において利用者が検索クエリ#11を入力する確率をプロットした確率分布(例えば、ヒストグラムや、カーネル密度分布)を出力する。このようにして、情報処理装置10は、ステップS3において抽出した各検索クエリについて、確率分布D1、D2、・・・を出力する。
【0026】
続いて、情報処理装置10は、時間の分布の態様が所定の条件を満たす検索クエリを、所定の事象と関連性を有する関連検索クエリとして特定する(ステップS5)。例えば、情報処理装置10は、ステップS3において抽出した各検索クエリのうち、確率分布が正規分布となっており、且つ、入力時間の標準偏差が所定の閾値以下である検索クエリを特定する。具体的な例を挙げると、情報処理装置10は、正規分布となっていない確率分布D2に対応する検索クエリ#12を除外する。また、図1の例において、正規分布となっている確率分布D1及びD3にそれぞれ対応する検索クエリ#11及び#13のうち、検索クエリ#11の入力時間の標準偏差#1が所定の閾値以下であり、検索クエリ#13の入力時間の標準偏差#2が所定の閾値より大きいものとする。この場合、情報処理装置10は、検索クエリ#13を除外し、検索クエリ#11を関連検索クエリとして特定する。
【0027】
なお、確率分布D1、D2、・・・が正規分布に従うか否かの判断(正規性の検定)には、種々の既知の手法が用いられてもよい。例えば、情報処理装置10は、Shapiro-Wilk検定や、Anderson-Darling検定などを用いて確率分布の正規性を検定してもよい。
【0028】
続いて、情報処理装置10は、利用者が入力した検索クエリを取得する(ステップS6)。例えば、情報処理装置10は、端末装置100に配信した検索サービスにおいて利用者が入力した検索クエリを取得する。
【0029】
続いて、情報処理装置10は、入力した検索クエリに応じた情報を提供する(ステップS7)。ここで、図1の例において、所定の事象が、特定の感染性疾患の症状の発症に関するものであり、利用者群G1が、当該症状を発症した利用者群であるものとする。この場合、情報処理装置10は、検索クエリ#11を入力した利用者に対し、確率分布D1において確率が平均値(最頻値)となる確率変数「時間#1」が経過した後に感染性疾患の症状を発症する危険性がある旨の情報を提供する。
【0030】
以上のように、実施形態に係る情報処理装置10は、所定の事象に関連付けられた利用者群が入力した検索クエリのうち、所定の事象に関連付けられた時点までの時間の分布の態様に基づいて、当該所定の事象と関連性を有する検索クエリを特定する。これにより、実施形態に係る情報処理装置10は、所定の事象に関連付けられた利用者群の行動を網羅的に分析し、いずれの行動が所定の事象と関連性を有するかを特定できるため、関連性を有する行動の取りこぼしを防ぎ、所定の事象との隠れた関連性を把握できる。すなわち、実施形態に係る情報処理装置10は、所定の事象と関連性を有する利用者の行動を正確に特定することができる。
【0031】
〔2.情報処理装置の構成〕
次に、図2を用いて、情報処理装置10の構成について説明する。図2は、実施形態に係る情報処理装置の構成例を示す図である。図2に示すように、情報処理装置10は、通信部20と、記憶部30と、制御部40とを有する。
【0032】
(通信部20について)
通信部20は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部20は、ネットワークNと有線または無線で接続され、端末装置100等との間で情報の送受信を行う。
【0033】
(記憶部30について)
記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図2に示すように、記憶部30は、利用者情報データベース31を有する。
【0034】
(利用者情報データベース31について)
利用者情報データベース31は、利用者に関する各種の情報を記憶する。ここで、図3を用いて、利用者情報データベース31が記憶する情報の一例を説明する。図3は、実施形態に係る対象情報データベースの一例を示す図である。図3の例において、利用者情報データベース31は、「利用者ID」、「検索履歴」、「利用履歴」、「位置履歴」、「検知履歴」といった項目を有する。
【0035】
「利用者ID」は、利用者を識別するための識別情報を示す。「検索履歴」は、利用者が入力した検索クエリの履歴を示し、例えば、検索クエリや、検索クエリを入力した日時などといった情報が格納される。「利用履歴」は、情報処理装置10や、他の外部サーバが提供する各種のサービスにおける利用者の利用履歴を示し、例えば、サービスの利用内容や、サービスを利用した日時などといった情報が格納される。
【0036】
「位置履歴」は、情報処理装置10や、端末装置100のGPS(Global Positioning System)、ビーコン等の各種測位システムを用いて測位した利用者の位置や、各種サービスの利用履歴に基づいて推定される利用者の位置の履歴を示し、例えば、利用者の位置や、利用者が所在した日時などといった情報が格納される。「検知履歴」は、情報処理装置10や、端末装置100が有する各種のセンサ(例えば、音センサ(マイク)、画像センサ(カメラ)、加速度センサ、ジャイロセンサ)や、利用者が身に着けるウェアラブルデバイスなどが検知した情報(例えば、心拍数や、体温、発汗量、利用者の動作など)の履歴を示し、例えば、検知した情報や、情報を検知した日時などといった情報が格納される。
【0037】
すなわち、図3では、利用者ID「UID#1」により識別される利用者の検索履歴が「検索履歴#1」、利用履歴が「利用履歴#1」、位置履歴が「位置履歴#1」、検知履歴が「検知履歴#1」である例を示す。
【0038】
(制御部40について)
制御部40は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置10内部の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部40は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。実施形態に係る制御部40は、図2に示すように、取得部41と、抽出部42と、特定部43と、提供部44とを有し、以下に説明する情報処理の機能や作用を実現または実行する。
【0039】
(取得部41について)
取得部41は、利用者の行動に関する各種の情報を取得する。例えば、取得部41は、利用者の検索履歴や、各種サービスの利用履歴、位置履歴、各種のセンサが利用者に関して検知した情報の履歴(検知履歴)などといった情報(すなわち、行動履歴)を、端末装置100や、利用者に各種サービスを提供する外部サーバ、利用者が身に着けるウェアラブルデバイスなどから取得し、利用者情報データベース31に格納する。
【0040】
また、取得部41は、所定の事象に関連付けられた利用者群の行動履歴であって、当該利用者群に含まれる各利用者が当該所定の事象に関連付けられるまでの行動履歴を取得してもよい。例えば、取得部41は、過去に所定の行動を行った利用者群の行動履歴であって、当該利用者群に含まれる各利用者が当該所定の行動を行うまでの行動履歴を取得する。また、取得部41は、過去に所定の状態となった利用者群の行動履歴であって、当該利用者群に含まれる各利用者が当該所定の状態となるまでの行動履歴を取得する。
【0041】
また、取得部41は、所定の検索クエリを入力した利用者群により入力された検索クエリであって、当該利用者群に含まれる各利用者が当該所定の検索クエリを入力するまでに入力された検索クエリを取得してもよい。例えば、取得部41は、所定の事象に関連付けられた際に利用者が入力すると推定される検索クエリを入力した利用者群により入力された検索クエリであって、当該利用者群に含まれる各利用者が当該所定の検索クエリを入力するまでに入力された検索クエリを取得する。
【0042】
(抽出部42について)
抽出部42は、所定の事象に関連付けられた利用者群の行動履歴から、利用者の行動と、行動を行った日時とを抽出する。例えば、図1の例において、抽出部42は、利用者群G1に含まれる利用者GU1、GU2、・・・が、検索クエリ#1を入力するまでに入力した各検索クエリと、各検索クエリの入力日時とを検索履歴から抽出する。
【0043】
なお、抽出部42は、取得部41により取得された行動履歴に基づいて、所定の事象に関連付けられた利用者群を抽出してもよい。例えば、図1の例において、抽出部42は、「検索クエリ#1」を入力した利用者群G1を抽出する。
【0044】
(特定部43について)
特定部43は、取得部41により取得された行動履歴に含まれる行動のうち、利用者群に含まれる利用者が当該行動を行ってから所定の事象に関連付けられた時点までの時間の分布の態様が所定の条件を満たす行動を、所定の事象と関連性を有する関連行動として特定する。例えば、特定部43は、時間の分布の態様が一様分布とならない行動を関連行動として特定する。
【0045】
また、特定部43は、行動履歴に含まれる行動のうち、時間の確率分布が所定の条件を満たす行動を所定の事象と関連性を有する関連行動として特定してもよい。例えば、特定部43は、時間の確率分布が最頻値を特定可能な態様である行動を関連行動として特定する。具体的な例を挙げると、特定部43は、時間の確率分布が単峰性或いは多峰性の分布となる関連行動を特定する。
【0046】
また、特定部43は、行動履歴に含まれる行動のうち、時間の分布の態様が正規分布となる行動を関連行動として特定してもよい。例えば、図1の例において、特定部43は、確率分布D1、D2、・・・のうち、正規分布に従う確率分布D1に対応する検索クエリ#11を、関連検索クエリとして特定する。
【0047】
また、特定部43は、行動履歴に含まれる行動のうち、時間の標準偏差が所定の閾値以下である行動を関連行動として特定してもよい。例えば、図1の例において、特定部43は、正規分布となっている確率分布D1及びD3にそれぞれ対応する検索クエリ#11及び#13のうち、入力時間の標準偏差が所定の閾値以下となっている検索クエリ#11を関連検索クエリとして特定する。
【0048】
また、特定部43は、利用者群により入力された検索クエリのうち、利用者群に含まれる利用者が当該検索クエリを入力してから所定の検索クエリを入力する時点までの時間の分布の態様が所定の条件を満たす検索クエリを、所定の検索クエリと関連性を有する関連検索クエリとして特定してもよい。例えば、図1の例において、特定部43は、検索クエリ#1を入力した利用者群G1により入力された検索クエリのうち、利用者群に含まれる利用者が当該検索クエリを入力してから検索クエリ#1を入力する時点までの時間の分布の態様が所定の条件を満たす検索クエリ#11を、検索クエリ#1と関連性を有する関連検索クエリとして特定する。
【0049】
ここで、所定の事象と関連性を有する一の行動だけでなく、所定の事象と関連性を有する複数の行動の組み合わせを特定したいといった要望が考えられる。したがって、特定部43は、行動履歴に含まれる複数の行動の組み合わせのうち、利用者群に含まれる利用者が当該組み合わせの各行動を行ってから所定の事象に関連付けられた時点までの時間の分布の態様が所定の条件を満たす行動の組み合わせを、関連行動として特定してもよい。例えば、特定部43は、利用者群に含まれる利用者の行動履歴から、2つの行動の組み合わせ(以下、「第1行動及び第2行動」と記載する)を抽出する。そして、利用者群に含まれる利用者が、第1行動及び第2行動の双方を行ってから所定の事象に関連付けられた時点までの時間の分布の態様が所定の条件を満たす場合、特定部43は、第1行動及び第2行動を関連行動として特定する。
【0050】
なお、第1行動及び第2行動は、任意の順番で行われるものであってもよい。また、第1行動及び第2行動は、それぞれ異なるカテゴリに属する行動であってもよい。例えば、第1行動が所定の検索クエリの入力であり、第2行動が所定のエリアへの移動であってもよい。また、後述する提供部44は、第1行動または第2行動を行った利用者に対し、行動に応じた情報を提供してもよい。例えば、提供部44は、第1行動を行った利用者に対して第2行動に関する情報し、第2行動を行った利用者に対して第1行動に関する情報を提供してもよい。
【0051】
(提供部44について)
提供部44は、関連行動を行った利用者に対し、所定の事象に関する情報を提供する。例えば、図1の例において、提供部44は、検索クエリ#11を入力した利用者に対し、所定の事象に関する情報を提供する。
【0052】
また、提供部44は、利用者群に含まれる利用者が関連行動を行ってから所定の事象に関連付けられた時点までの時間に基づいて、関連行動を行った利用者に対し所定の事象に関する情報を提供してもよい。例えば、図1の例において、提供部44は、検索クエリ#11を入力した利用者に対し、確率分布D1において最頻値となる確率変数「時間#1」が経過した後に感染性疾患の症状を発症する危険性がある旨の情報を提供する。
【0053】
なお、提供部44は、関連行動を行った利用者に対し、所定の事象に応じた各種の情報を提供してもよい。例えば、提供部44は、関連行動を行った利用者に対し、所定の事象に関連する広告コンテンツを提供する。具体的な例を挙げると、所定の事象が出産である場合、提供部44は、関連行動を行った利用者に対し、ベビー用品に関する広告コンテンツを提供する。
【0054】
また、提供部44は、関連行動を行った利用者に対し、当該利用者が所定の事象に関連付けられるまでの時間(言い換えると、関連行動の確率分布において最頻値を示す確率変数)に応じてコンテンツを提供してもよい。また、提供部44は、関連行動を行った利用者に対し、当該利用者が所定の事象に関連付けられるまでの複数の時点において、各時点に応じたコンテンツを提供してもよい。
【0055】
ここで、関連行動を行った利用者の行動を分析することで、所定の事象の発生に関する情報を利用者に提供したいといった要望が考えられる。したがって、提供部44は、関連行動を行った利用者の位置情報に基づいて、所定の事象に関連する位置を示す情報を利用者に提供してもよい。例えば、所定の事象が、感染性疾患の症状の発症である場合、提供部44は、関連行動を行った利用者が所定の数以上所在したエリアを、感染性疾患のクラスターとなる可能性があるエリアとして利用者に提供する。
【0056】
なお、提供部44は、関連行動を行った利用者の行動情報を、コンテンツの提供主に提供してもよい。例えば、提供部44は、所定の事象と、関連行動を行った利用者の行動情報(例えば、利用するサービスや、訪問するエリア、検索クエリなど)とに基づいて、コンテンツ(例えば、広告コンテンツ)の提供主に対し、当該利用者に対するコンテンツの配信に関する提案を提供してもよい。
【0057】
〔3.特定処理のフロー〕
図4を用いて、実施形態に係る情報処理装置10の特定処理の手順について説明する。図4は、実施形態に係る特定処理の手順の一例を示すフローチャートである。
【0058】
図4に示すように、情報処理装置10は、所定の事象に関連付けられた利用者群の行動履歴を取得する(ステップS101)。続いて、情報処理装置10は、利用者群に含まれる各利用者が、所定の事象に関連付けられるまでの行動を抽出する(ステップS102)。続いて、情報処理装置10は、所定の事象に関連付けられた時点までの時間の分布の態様が所定の条件を満たす行動を特定する(ステップS103)。続いて、情報処理装置10は、特定した行動に基づいて利用者に情報を提供し(ステップS104)、処理を終了する。
【0059】
〔4.変形例〕
上述の実施形態は一例を示したものであり、種々の変更及び応用が可能である。
【0060】
〔4-1.時間の分布について〕
上述の実施形態において、特定部43が、利用者群に含まれる利用者が行った行動のうち、時間の分布の態様が正規分布となる行動を特定する例を示したが、特定部43の機能はこのような例に限定されない。例えば、特定部43は、時間の分布が正規分布以外の各種の分布(例えば、フラクタル性を考慮した分布(ベキ分布))に従うか否かに応じて、関連行動を特定してもよい。
【0061】
具体的な例を挙げると、利用者群の行動履歴に含まれる行動の中には、利用者群に含まれる利用者が当該行動を行ってから所定の事象に関連付けられた時点までの時間が非常に短く、0に近くなるものが含まれることが想定される。このような行動について、特定部43は、時間の分布がポアソン分布に従う場合に、当該行動を関連行動として特定する。
【0062】
また、分布の標準偏差は、時間の分布がいずれの分布に従うかに応じて、任意の手法により算出されてもよい。
【0063】
〔4-2.所定の事象及び関連行動について〕
上述の実施形態において、特定部43が、所定の事象と関連性を有する関連行動を特定する処理として、所定の検索クエリと関連性を有する関連検索クエリを特定する例を示したが、所定の事象と関連行動との関係性はこのような例に限定されず、どのようなものであってもよい。例えば、特定部43は、所定の行動を行った利用者群或いは所定の状態に遷移した利用者群の検索履歴や、各種サービスの利用履歴、所在した位置の履歴、各種センサが検知した情報の履歴のうち、所定の行動或いは所定の状態と関連性を有する検索クエリや、サービスの利用内容、所在したエリア、センサの検知内容などを特定してもよい。ここで、所定の行動とは、例えば、所定のイベントへの参加や、所定の取引対象の購入、所定のエリアへの移動或いは旅行などであってもよい。また、所定の状態とは、例えば、所定の疾患に罹患した状態や、ライフステージ、趣味嗜好、利用者が置かれた環境などであってもよい。
【0064】
〔4-3.処理態様について〕
上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、逆に、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0065】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0066】
また、上記してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0067】
〔5.効果〕
上述してきたように、実施形態に係る情報処理装置10は、取得部41と、抽出部42と、特定部43と、提供部44とを有する。取得部41は、利用者の行動に関する各種の情報を取得する。また、取得部41は、所定の事象に関連付けられた利用者群の行動履歴であって、当該利用者群に含まれる各利用者が当該所定の事象に関連付けられるまでの行動履歴を取得する。また、取得部41は、所定の検索クエリを入力した利用者群により入力された検索クエリであって、当該利用者群に含まれる各利用者が当該所定の検索クエリを入力するまでに入力された検索クエリを取得する。抽出部42は、所定の事象に関連付けられた利用者群の行動履歴から、利用者の行動と、行動を行った日時とを抽出する。特定部43は、取得部41により取得された行動履歴に含まれる行動のうち、利用者群に含まれる利用者が当該行動を行ってから所定の事象に関連付けられた時点までの時間の分布の態様が所定の条件を満たす行動を、所定の事象と関連性を有する関連行動として特定する。また、特定部43は、行動履歴に含まれる複数の行動の組み合わせのうち、利用者群に含まれる利用者が当該組み合わせの各行動を行ってから所定の事象に関連付けられた時点までの時間の分布の態様が所定の条件を満たす行動の組み合わせを、関連行動として特定する。また、特定部43は、利用者群により入力された検索クエリのうち、利用者群に含まれる利用者が当該検索クエリを入力してから所定の検索クエリを入力する時点までの時間の分布の態様が所定の条件を満たす検索クエリを、所定の検索クエリと関連性を有する関連検索クエリとして特定する。提供部44は、関連行動を行った利用者に対し、所定の事象に関する情報を提供する。
【0068】
これにより、実施形態に係る情報処理装置10は、所定の事象に関連付けられた利用者群の行動を網羅的に分析し、いずれの行動が所定の事象と関連性を有するかを特定することができるため、関連性を有する行動の取りこぼしを防ぎ、所定の事象との隠れた関連性を把握できる。
【0069】
また、実施形態に係る情報処理装置10において、例えば、特定部43は、行動履歴に含まれる行動のうち、時間の確率分布が所定の条件を満たす行動を所定の事象と関連性を有する関連行動として特定する。また、特定部43は、行動履歴に含まれる行動のうち、時間の分布の態様が正規分布となる行動を関連行動として特定する。また、特定部43は、行動履歴に含まれる行動のうち、時間の分布の態様がポアソン分布となる行動を関連行動として特定する。また、特定部43は、行動履歴に含まれる行動のうち、時間の標準偏差が所定の閾値以下である行動を関連行動として特定する。
【0070】
これにより、実施形態に係る情報処理装置10は、所定の事象に関連付けられた各利用者が過去に所定の行動を行った日時をプロットした場合に正規分布曲線を描くことを利用して特定処理を行うため、所定の事象と関連性を有する利用者の行動を正確に特定することができる。
【0071】
また、実施形態に係る情報処理装置10において、例えば、提供部44は、利用者群に含まれる利用者が関連行動を行ってから所定の事象に関連付けられた時点までの時間に基づいて、関連行動を行った利用者に対し所定の事象に関する情報を提供する。また、提供部44は、関連行動を行った利用者の位置情報に基づいて、所定の事象に関連する位置を示す情報を利用者に提供する。
【0072】
これにより、実施形態に係る情報処理装置10は、所定の事象と関連性を有する行動に基づいて情報を提供するため、提供する情報の訴求効果を向上させることができる。
【0073】
〔6.ハードウェア構成〕
また、上述してきた各実施形態に係る情報処理装置10は、例えば、図5に示すような構成のコンピュータ1000によって実現される。以下、情報処理装置10を例に挙げて説明する。図5は、情報提供装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
【0074】
CPU1100は、ROM1300又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
【0075】
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を記憶する。通信インターフェイス1500は、通信網500(実施形態のネットワークNに対応する)を介して他の機器からデータを受信してCPU1100へ送り、また、通信網500を介してCPU1100が生成したデータを他の機器へ送信する。
【0076】
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。
【0077】
メディアインターフェイス1700は、記録媒体1800に格納されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0078】
例えば、コンピュータ1000が情報処理装置10として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部40の機能を実現する。また、HDD1400には、情報処理装置10の記憶装置内の各データが格納される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定の通信網を介してこれらのプログラムを取得してもよい。
【0079】
〔7.その他〕
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0080】
また、上述した情報処理装置10は、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。
【0081】
また、特許請求の範囲に記載した「部」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。
【符号の説明】
【0082】
10 情報処理装置
20 通信部
30 記憶部
31 利用者情報データベース
40 制御部
41 取得部
42 抽出部
43 特定部
44 提供部
100 端末装置
図1
図2
図3
図4
図5