(58)【調査した分野】(Int.Cl.,DB名)
前記判定部は、複数の前記関連度に基づいて、複数の前記第1ユーザ及び複数の前記第2ユーザの組み合わせのそれぞれに対して類似度を算出し、前記類似度が予め定められた閾値以上となる前記第1ユーザ及び前記第2ユーザの組み合わせを抽出する、
請求項1または2に記載の情報処理装置。
前記判定部は、前記第1ユーザの1以上の行動履歴と前記第2ユーザの1以上の発信履歴との組み合わせごとに、前記第1ユーザと前記第2ユーザが別ユーザである度合を示す相違度を算出し、前記関連度及び前記相違度に基づいて、前記第1ユーザ及び前記第2ユーザの同一性を判定する、
請求項3に記載の情報処理装置。
前記第1ユーザ及び第2ユーザの前記組み合わせに対する類似度、及び、当該組み合わせに含まれる第2ユーザの情報の発信における影響度に基づいて、前記組み合わせに対応する前記第1ユーザ及び前記第2ユーザにより特定されるユーザの重要度を算出する重要度算出部を更に備える請求項3または4に記載の情報処理装置。
前記発信履歴取得部は、前記第2ユーザによる情報の発信履歴として、前記第2ユーザが前記第2ユーザ識別情報により情報の投稿を受け付けるウェブサイトにログインして、前記ウェブサイトに対して情報を投稿した投稿履歴を取得する、
請求項1から6のいずれか1項に記載の情報処理装置。
【発明を実施するための形態】
【0007】
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0008】
図1は、本実施形態の情報処理装置10の構成を示す。情報処理装置10は、外部サーバ20から商品購買履歴等の行動履歴を取得し、外部サーバ30からSNSの投稿等の発信履歴を取得する。ここで、外部サーバ20のサービス、及び、外部サーバ30のサービスは別個に提供されるものであってよく、そのために同一人物が外部サーバ20のサービスと外部サーバ30のサービスに別個に登録し、別箇のログインID等の提供を受ける。情報処理装置10は、このように別箇に登録されている各サービスのID同士が同一人物によるものであるか否かを検出する。情報処理装置10は、行動履歴取得部102、発信履歴取得部104、判定部110、重要度算出部120、及び、配信部130を備える。
【0009】
行動履歴取得部102は、第1ユーザ識別情報により特定される第1ユーザの行動履歴を取得する。例えば、行動履歴取得部102は、外部サーバ20が提供するインターネット通販サービス等におけるログインID等の第1ユーザ識別情報により特定される複数の第1ユーザについて、外部サーバ20から商品購買履歴等の行動履歴を取得する。行動履歴取得部102は、取得した行動履歴を判定部110に供給する。
【0010】
発信履歴取得部104は、第2ユーザ識別情報により特定される第2ユーザによる情報の発信履歴を取得する。例えば、発信履歴取得部104は、外部サーバ30が提供するSNS等のサービスにおけるログインID等の第2ユーザ識別情報により特定される複数の第2ユーザについて、外部サーバ30からメッセージ投稿等の発信履歴を取得する。発信履歴取得部104は、取得した発信履歴を判定部110に供給する。
【0011】
判定部110は、行動履歴に含まれる行動内容と、発信履歴に含まれる発信内容に基づいて、第1ユーザ及び第2ユーザの同一性を判定する。例えば、判定部110は、判定部は、行動履歴に含まれる行動内容及び行動タイミングと、発信履歴に含まれる発信内容及び発信タイミングとに更に基づき、第1ユーザの行動履歴及び第2ユーザの発信履歴の組み合わせの関連度を算出し、複数の組み合わせに対する複数の関連度に基づいて第1ユーザ及び第2ユーザの同一性を判定する。判定部110は、関連度算出部112、類似度算出部114、及び、同一ユーザ抽出部116を有する。
【0012】
関連度算出部112は、第1ユーザの複数の行動履歴と第2ユーザの複数の発信履歴との組み合わせごとに関連度を算出する。更に、関連度算出部112は、第1ユーザの複数の行動履歴と第2ユーザの複数の発信履歴との組み合わせごとに、第1ユーザと第2ユーザが別ユーザである度合を示す相違度を算出してもよい。関連度算出部は、算出した関連度及び相違度を類似度算出部114に供給する。
【0013】
類似度算出部114は、複数の関連度等に基づいて、複数の第1ユーザ及び複数の第2ユーザの組み合わせのそれぞれに対して類似度を算出する。類似度算出部114は、算出した類似度を同一ユーザ抽出部116に供給する。
【0014】
同一ユーザ抽出部116は、複数の第1ユーザ及び複数の第2ユーザの組み合わせのうち、類似度が予め定められた閾値以上となる第1ユーザ及び第2ユーザの組み合わせを抽出する。同一ユーザ抽出部116は、抽出した第1ユーザ及び第2ユーザの組み合わせを重要度算出部120に供給する。
【0015】
重要度算出部120は、第1ユーザ及び第2ユーザの組み合わせに対する類似度、及び、当該組み合わせに含まれる第2ユーザの情報の発信における影響度に基づいて、組み合わせに対応する第1ユーザ及び第2ユーザにより特定されるユーザの重要度を算出する。例えば、重要度算出部120は、類似度が高くかつ発信の影響度が大きい第1ユーザ及び第2ユーザの組み合わせにより特定されるユーザの重要度をより大きく算出する。重要度算出部120は、算出したユーザの重要度を配信部130に供給する。
【0016】
配信部130は、重要度が予め定められた条件を満たすユーザに対して、情報を配信する。例えば、配信部130は、重要度が閾値以上となる第1ユーザに対して商品等に関するダイレクトメールを配信してよい。
【0017】
このように、情報処理装置10は、行動履歴に含まれる第1ユーザ及び発信履歴に含まれる第2ユーザをその行動内容及び発信内容から関連付けることにより、同一ユーザの可能性が高い第1ユーザ及び第2ユーザの組み合わせを抽出することができる。また、情報処理装置10は、影響度が高い可能性が高い第1ユーザに対して効果的に情報を発信することができる。
【0018】
図2は、本実施形態の情報処理装置10による処理フローを示す。情報処理装置10は、S110からS180までの処理により、本実施形態に係る情報処理方法を実行する。
【0019】
まず、S110において、行動履歴取得部102は、外部サーバ20から、第1ユーザ識別情報により特定される第1ユーザの行動履歴を取得する。例えば、行動履歴取得部102は、第1ユーザの行動履歴として、インターネットを介した商品又はサービスの購買履歴を取得してよい。一例として、行動履歴取得部102は、外部のECサイトの購買履歴データベースサーバ等から、複数の第1ユーザについて、ユーザID等の第1識別情報、購入商品名、購入商品価格、購入商品のカテゴリ、購入商品の配達先住所、及び、購入日時等を含む商品購買履歴の組を取得してよい。なお、行動履歴取得部102は、複数の同一/異なるサービスに係る複数の外部サーバ20から、行動履歴を取得してもよい。
【0020】
更に行動履歴取得部102は、ECサイト等から第1ユーザの第1プロフィール情報を取得してよい。例えば、行動履歴取得部102は、第1プロフィール情報として、第1ユーザの第1識別情報、名前、メールアドレス、住所、及び/又は、嗜好等の情報を含む自己紹介等を取得してよい。行動履歴取得部102は、取得した行動履歴等を判定部110に供給する。
【0021】
次に、S120において、発信履歴取得部104は、外部サーバ30から、第2ユーザ識別情報により特定される第2ユーザによる情報の発信履歴を取得する。例えば、発信履歴取得部104は、第2ユーザが第2ユーザ識別情報により情報の投稿を受け付けるウェブサイトにログインして、ウェブサイトに対して情報を投稿した投稿履歴を、第2ユーザによる情報の発信履歴として取得してよい。なお、発信履歴取得部104は、複数の同一/異なるサービスに係る複数の外部サーバ30から、発信履歴を取得してもよい。
【0022】
一例として、発信履歴取得部104は、複数の第2ユーザについて、ユーザID等の第2ユーザ識別情報、インターネット上で送信されるテキスト、ウェブサイトに対して投稿されたテキスト、音声、画像、及び/又は、動画の投稿履歴を発信履歴として取得してよい。ここで、発信履歴取得部104は、投稿されたテキスト本文、投稿された音声から抽出したテキスト、及び/又は、投稿された画像又は動画から解析された画像中のテキストを第2ユーザによる情報の発信履歴として取得してよい。
【0023】
ここで、発信履歴取得部104は、元となる発信履歴を外部の別のサーバに検索させて得られた検索後の発信履歴を取得してもよい。例えば、発信履歴取得部104は、ウエブ検索エンジンの検索サーバに、インターネット上で外部サーバ30により公開されている発信履歴を検索させて抽出した発信履歴を取得してよい。
【0024】
一例として、発信履歴取得部104は、複数の発信履歴から行動履歴の行動内容に関連する情報、又は、行動履歴に関連する商品又はサービスに関する情報、例えば、行動履歴に関連する商品又はサービスを購入した旨のキーワードが含まれるものを検索して抽出してよい。
【0025】
具体的には、行動履歴取得部102がインターネット上の商品購買履歴を取得する場合、発信履歴取得部104は、検索エンジンにより、インターネット上の商品購買に関連する「購買」、「購入」、「販売」、「予約」、「配送」、「配達」、「及び」、及び/又は、「外部サーバ20が提供するサービスの名称(例えば、ECサイトの提供するサービスの名称)」等のキーワードで発信履歴を検索し、当該キーワードを含む発信履歴を検索してもよい。
【0026】
更に、発信履歴取得部104は、投稿先となるウェブサイトから第2ユーザの第2プロフィール情報を取得してよい。例えば、発信履歴取得部104は、第2プロフィール情報として、第2ユーザの第2識別情報、メールアドレス、名前、住所、所属コミュニティ、及び/又は、嗜好等の情報を含む自己紹介を取得してよい。
【0027】
また、発信履歴取得部104は、当該ウェブサイトから第2ユーザの影響度の情報(例えば、当該ウェブサイトにおける第2ユーザのフォロワー及び/又は友人の数等)を取得してよい。発信履歴取得部104は、複数の第2ユーザの発信履歴及びプロフィール情報を判定部110に供給し、複数の第2ユーザの影響度の情報を重要度算出部120に供給してよい。
【0028】
次に、S130において、関連度算出部112は、第1ユーザの複数の行動履歴と第2ユーザの複数の発信履歴との組み合わせごとに関連度を算出する。例えば、まず、関連度算出部112は、第1識別情報idを有する第1ユーザidの行動履歴の行動内容x(id,n)、及び、抽出された第2識別情報IDを有する第2ユーザIDの発信履歴の発信内容y(ID,N)が一致する度合が大きいほど大きい値をとるように、一致度q(x(id,n),y(ID,N))を算出する。
【0029】
一例として、行動履歴の行動内容が「第1ユーザが特定のECサイト(例えば、インターネットショップABC)で特定の商品(例えば、商品XXX)を購入したこと」であるのに対し、発信履歴の発信内容が「当該特定のECサイト(例えば、インターネットショップABC)のウェブサイトで、第2ユーザが当該特定の商品(例えば、商品XXX)を購入した旨の発言をSNS上で投稿するボタン(たとえば、つぶやくボタン、及び、いいねボタン等)をクリックして投稿されるテキスト」である場合に、関連度算出部112は、一致度を1としてよい。
【0030】
また、一例として、行動履歴の行動内容が「第1ユーザが特定のECサイト(例えば、インターネットショップABC)で特定の商品(例えば、商品XXX)を購入したこと」であるのに対し、発信履歴の発信内容が「当該特定のECサイト(例えば、インターネットショップABC)の当該特定の商品(例えば、商品XXX)のURLと、『購入』、『買う』、『買った』、『配送』又は『配達』等の購入に密接に関連する単語とを含むテキスト」である場合に、関連度算出部112は、一致度を0.8としてよい。
【0031】
また、一例として、行動履歴の行動内容が「第1ユーザが特定のECサイト(例えば、インターネットショップABC)で特定の商品(例えば、商品XXX)を購入したこと」であるのに対し、発信履歴の発信内容が「当該特定の商品(例えば、商品XXX)の名称の部分文字列と、『購入』、『買う』、『買った』、『届いた』、『配送』又は『配達』等の購買に関連する単語とを含むテキスト」である場合に、関連度算出部112は一致度を0.6としてよい。
【0032】
また、一例として、行動履歴の行動内容が「第1ユーザが特定のECサイト(例えば、インターネットショップABC)で特定の商品(例えば、商品XXX)を購入したこと」であるのに対し、発信履歴の発信内容が「当該特定の商品(例えば、商品XXX)の名称の部分文字列を含むテキスト」である場合に、関連度算出部112は一致度を0.5としてよい。
【0033】
また、一例として、行動履歴の行動内容が「第1ユーザが特定のECサイト(例えば、インターネットショップABC)で特定の商品(例えば、商品XXX)を購入したこと」であるのに対し、発信履歴の発信内容が「当該特定のECサイト(例えば、インターネットショップABC)上の当該特定の商品(例えば、商品XXX)のカテゴリ名(例えば、「書籍」、「ミュージック」及び/又は「生活用品」等)を含むテキスト」である場合に、関連度算出部112は一致度を0.2としてよい。
【0034】
関連度算出部112は、行動履歴における行動の日時と発信履歴における発信の日時との順番及び時間差を考慮して一致度を割り当ててもよい。例えば、関連度算出部112は、発信日時が行動日時の後である場合に、発信日時が行動日時の前である場合に比べて高い一致度を付与してよい。例えば、関連度算出部112は、行動履歴における行動日時と発信履歴における発信日時との差が1日以内であれば一致度に1を乗じ、差が2日以内であれば一致度に0.8を乗じ、差が3日以内であれば一致度に0.5を乗じ、差が1週間以内であれば、一致度に0.2を乗じ、差が1週間超であれば0を乗じてよい。ここで、関連度算出部112は、行動履歴において購買された商品の価格が高い場合、商品価格が低い場合と比較して、行動日時と発信日時との差の基準を長く設定してよい。
【0035】
これらに代えて、関連度算出部112は、行動履歴の行動内容及び発信履歴の発信内容の組み合わせのそれぞれに対してロジスティック回帰を用いて一致度を算出してもよい。例えば、関連度算出部112は、(i)発信履歴の発信内容が購買がされた販売店の名称の部分文字列を含むか否か、(ii)発信履歴の発信内容が購買された商品のURLを含むか否か、(iii)発信履歴の発信内容が購買された商品名の部分文字列を含むか、(iv)発信履歴の発信内容が「購入」及び「届いた」等の購買に関連する単語を含むか、及び、(v)行動日時と発信日時との時間差を考慮して一致度を割り当ててもよい。一例として、関連度算出部112は、(i)〜(v)等の条件を特徴量として、行動内容と行動内容が一致するほど大きくなり0〜1の範囲となるように一致度を算出してもよい。
【0036】
次に、関連度算出部112は、算出した一致度q(x(id,n),y(ID,N))に基づいて、行動履歴の行動内容x(id,n)と発信履歴の発信内容y(ID,N)との関連度λ(x(id,n),y(ID,N))を算出する。
【0037】
関連度算出部112は、関連度λ(x,y)を数式(1)に基づいて算出してよい。
【数1】
【0038】
ここで、rは、行動履歴及び発信履歴全体に対して付与される1を超える係数であり、一致度qが関連度λに寄与する重みを示す。例えば、関連度算出部112は、rを予め定められた実数としてよく、又は、行動履歴及び発信履歴の一部若しくはテストデータを用いた交差検定により決定した実数としてもよい。
【0039】
次に、S140において、関連度算出部112は、複数の第1ユーザidの行動履歴nと複数の第2ユーザIDの発信履歴Nとの組み合わせごとに、第1ユーザidと第2ユーザIDが別ユーザである度合を示す相違度κ(x(id,n),y(ID,N))を算出する。
【0040】
例えば、まず、関連度算出部112は、行動履歴の行動内容及び発信履歴の発信内容の組み合わせごとに、第1ユーザの行動履歴に係る行動内容x(id,n)と、第2ユーザの発信履歴に係る発信内容y(ID,N)とが一致しない度合を示す不一致度q'(x(id,n),y(ID,N))を算出する。
【0041】
一例として、関連度算出部112は、発信履歴の発言内容に地名についての記載が含まれ、発信履歴の発信日時と行動履歴の行動日時が予め定められた差以内である場合、行動履歴に含まれる商品の配達先住所と発信内容に含まれる地名との距離が離れるほど値が大きくなるように、0〜1の範囲の値となる不一致度を算出してよい。
【0042】
また、一例として、関連度算出部112は、発信履歴の発信内容に商品名の少なくとも一部、及び、「欲しい」又は「羨ましい」等の購入を否定する発言の少なくとも一部が含まれる場合、発信内容と商品名の一致する割合及び発信内容と購入を否定する発言の一致する割合が大きくなるほど値が大きくなるように、0〜1の範囲の値となる不一致度を算出してよい。
【0043】
次に、関連度算出部112は、算出した不一致度q'(x(id,n),y(ID,N))に基づいて、行動履歴nと発信履歴Nとの相違度κ(x(id,n),y(ID,N))を算出する。
【0044】
関連度算出部112は、相違度κ(x,y)を数式(2)に基づいて算出してよい。
【数2】
【0045】
ここで、r'は、行動履歴及び発信履歴全体に対して付与される1未満の係数であり、不一致度q'が相違度κに寄与する重みを示す。例えば、関連度算出部112は、r'を予め定められた実数としてもよく、又は、行動履歴及び発信履歴の一部若しくはテストデータを用いた交差検定により算出した実数としてもよい。
【0046】
次に、S150において、類似度算出部114が、S130で算出した関連度λ及びS140で算出した相違度κを累積させた結果に基づいて、複数の第1ユーザid及び複数の第2ユーザIDの組み合わせのそれぞれに対して類似度を算出する。類似度算出部114は、更に第1ユーザのプロフィール情報並びに第2ユーザのプロフィール情報に基づいて、類似度を算出してよい。例えば、類似度算出部114は、数式(3)により、第1ユーザidと第2ユーザIDの類似度S(id,ID)を算出してよい。
【数3】
ここで、p(id,ID)は、第1ユーザidの第1プロフィール情報及び第2ユーザIDの第2プロフィール情報が互いに類似する程度を表すプロフィール類似度である。
【0047】
例えば、類似度算出部114は、第1ユーザidの第1プロフィール情報における住所の都道府県と、第2ユーザIDの第2プロフィール情報に含まれる住所の都道府県とが一致する場合にプロフィール類似度p(id,ID)を高く設定してよい。また、例えば、類似度算出部114は、第1プロフィール情報に含まれるメールアドレスと第2ユーザIDのアカウント文字列とに共通して含まれる文字列がある場合にプロフィール類似度p(id,ID)を高く設定してよい。
【0048】
また、例えば、類似度算出部114は、第1ユーザidのプロフィール情報、及び、第2ユーザIDのプロフィール情報において、(i)在住都道府県が共通するか否か、(ii)第1ユーザidの第1識別情報又はメールアドレスと第2ユーザIDの第2識別情報又はメールアドレスとに共通する文字列が含まれるか否か、及び/又は、(iii)共通する文字列が含まれるか否か等に基づき、ロジスティック回帰を用いてプロフィール類似度p(id,ID)を設定してよい。
【0049】
類似度算出部114は、第1プロフィール情報以外の第1ユーザidの情報(例えば、第1ユーザidのログイン状況及び/又はログイン頻度等)、及び、第2プロフィール情報以外の第2ユーザIDの情報(例えば、第2ユーザIDのログイン状況及び/又はログイン頻度等)の類似度に更に基づいて、プロフィール類似度p(id,ID)を算出してもよい。また、類似度算出部114は、第1プロフィール及び第2プロフィールの少なくとも一方から予め定められた情報量以上の情報が得られない場合などプロフィール情報から十分な情報が得られない場合、プロフィール類似度p(id,ID)=1としてよい。
【0050】
次に、S160において、同一ユーザ抽出部116は、同一ユーザとなる可能性が高い第1ユーザid及び第2ユーザIDの組み合わせを特定する。例えば、同一ユーザ抽出部116は、複数の第1ユーザid及び複数の第2ユーザIDの組み合わせのうち、類似度が予め定められた閾値以上となる第1ユーザid及び第2ユーザIDの組み合わせを抽出する。同一ユーザ抽出部116は、抽出した第1ユーザid及び第2ユーザIDの組み合わせを重要度算出部120に供給する。
【0051】
次に、S170において、重要度算出部120は、同一ユーザと特定された組み合わせに係るユーザの重要度を算出する。例えば、重要度算出部120は、第2ユーザIDの影響度の情報(例えば、第2ユーザIDのフォロワー及び/又は友人の数等)に応じた第2ユーザIDの影響度Eを算出する。
【0052】
一例として、重要度算出部120は、第2ユーザIDのフォロワーの数に応じて、影響度Eを1(フォロワー1000人以上)、0.8(フォロワー100人以上1000人未満)、0.5(フォロワー20人以上100人未満)、0.2(フォロワー10人以上20人未満)、0(フォロワー10人未満)と設定してよい。
【0053】
次に、重要度算出部120は、第1ユーザid及び第2ユーザIDの組み合わせに対する類似度S(id,ID)に対して、第2ユーザIDの影響度E(ID)を乗じることにより、第1ユーザid及び第2ユーザIDの重要度I(id,ID)を算出する。重要度算出部120は、算出した重要度I(id,ID)を配信部130に供給する。
【0054】
次に、S180において、配信部130は、重要と判断した第1ユーザidに対して情報を配信する。例えば、配信部130は、重要度I(id,ID)が予め定められた閾値以上となる第1ユーザidに対して、第1ユーザid対応する第2ユーザIDが購入した商品等に関連する商品等のダイレクトメール、広告、及び/又は、試供品等を送信してよい。
【0055】
このように、情報処理装置10は、複数の行動履歴及び複数の発信履歴の組み合わせの各々に対して関連度q及び相違度q'を算出し、第1ユーザidと第2ユーザIDの組み合わせに対して当該関連度及び相違度を累積した結果に基づいて両ユーザの類似度S(id,ID)を算出し、類似度S(id,ID)が大きい組み合わせの第1ユーザid及び第2ユーザIDを同一ユーザである可能性が高い組み合わせと特定する。このように、情報処理装置10によれば、行動履歴中のユーザと発信履歴中のユーザの名寄せを実現することができる。
【0056】
また、情報処理装置10は、同一と特定したユーザのうち影響度が大きい第1ユーザidを重要度が高いユーザとし、当該重要度が高いユーザに対して選択的に情報を発信することにより効果的に商品等の広告を実行することができる。
【0057】
なお、本実施形態の第1変形例において、関連度算出部112は、S140の処理を省略してもよい。この場合、S150において、類似度算出部114は、数式(3)の右辺からΠΠκ(x,y)の部分を除いて類似度S(id,ID)を算出してよい。
【0058】
また、本実施形態の第2変形例において、S140において、関連度算出部112は、第1ユーザidの行動内容x(id,n)及び第2ユーザIDの発信内容y(ID,N)の組み合わせごとに不一致度q'(x(id,n),y(ID,N))を算出する代わりに、第1ユーザid及び発信履歴の発信内容y(ID,N)の組み合わせごとに不一致度q"(X(id),y(ID,N))を算出してよい。
【0059】
例えば、第2ユーザIDの発信内容で購買した商品等について言及しているが、第1ユーザidの購買履歴に対応する商品等が存在しない場合、関連度算出部112は、第1ユーザidと第2ユーザIDの発言Nとの組み合わせに大きな不一致度q"(X(id),y(ID,N))を割り当ててよい。
【0060】
また、本実施形態の第3変形例において、情報処理装置10は、行動履歴として商品等の購買履歴の代わりに、交通履歴を用いてもよい。例えば、S110において、行動履歴取得部102は、行動履歴として交通機関の利用履歴を取得する。一例として、行動履歴取得部102は、外部の交通機関の利用履歴データベースサーバから、複数のユーザに係る乗車駅、及び、下車駅等を含む利用履歴を取得してよい。
【0061】
S130において、関連度算出部112は、第1ユーザidの交通機関の利用内容x(id,n)及び第2ユーザIDの発信内容y(N,ID)の組み合わせのそれぞれに対して一致度q(x(id,n),y(ID,N))を割り当ててよい。例えば、関連度算出部112は、交通機関の利用履歴における乗車駅又は下車駅の単語又はその一部を含む場合、乗車駅の地名又は下車駅の地名の単語又はその一部を含む場合、又は、利用したと考えられる路線名の単語又はその一部を含む場合、この場合順で高くなるように一致度を設定してよい。
【0062】
また、本実施形態の第4変形例において、情報処理装置10は、取得済みの行動履歴及び発信履歴に基づいて予め行動履歴及び発信履歴の関連度を算出し第1ユーザ及び第2ユーザの組み合わせを特定してよい。
【0063】
そして、本変形例の情報処理装置10は、取得済みの行動履歴及び発信履歴に加えて新しい行動履歴及び発信履歴を随時取得し、新しい行動履歴及び発信履歴と取得済みの行動履歴及び発信履歴について関連度(及び相違度)を計算し、これにより、第1ユーザ及び第2ユーザの類似度を更新し、第1ユーザと第2ユーザの組み合わせを更新してよい。
【0064】
この場合、S130において、関連度算出部112は、数式(1)の係数rを数式(4)に基づいて算出してよい。
【数4】
【0065】
ここで、数式(4)のidは、取得済みの行動履歴及び発信履歴により、同一ユーザと判定された第1ユーザ及び第2ユーザの組み合わせに付与される識別情報であってよく、例えば、第1の第1ユーザid及び第2ユーザIDの組み合わせに対して同一ユーザ1のidが付与され、第2の第1ユーザid及び第2ユーザIDの組み合わせに対して同一ユーザ2のidが付与される。
【0066】
n(id)は同一ユーザidに係る行動履歴の数(例えば、購買数)を示し、Σn(id)は、全ての同一ユーザの行動履歴の合計を示す。N(id)は、同一ユーザidに係る発信履歴の数(例えば、SNS上の投稿数)を示し、ΣN(id)は、全ての同一ユーザの発信履歴の合計を示す。
【0067】
m(id)は、同一ユーザidに係る発信履歴の発信内容のうち自己の行動履歴の行動内容のいずれかと関連付けられるもの(例えば、算出されている関連度が予め定められた閾値以上となるもの)の数を示し、Σm(id)は全ての同一ユーザのm(id)の合計を示す。
【0068】
また、M(id)は、同一ユーザidに係る発信履歴の発信内容のうち、全ての同一ユーザの行動履歴のいずれかと関連付けられるもの(例えば、算出されている関連度が予め定められた閾値以上となるもの)の数を示し、ΣM(id)は、全ての同一ユーザのM(id)の合計を示す。また、Σn(id)N(id)は、全ての同一ユーザidについてのn(id)×N(id)の合計を示す。
【0069】
また、本変形例に係る関連度算出部112は、S140において、数式(5)に基づいてr'を算出してよい。
【数5】
【0070】
ここで、数式(5)のid、n'(id)、及び、N'(id)は、数式(4)のid、n(id)、及び、N(id)と同様であってよい。
【0071】
m'(id)は、同一ユーザidに係る発信履歴の発信内容のうち自己の行動履歴の行動内容のいずれかと矛盾すると判断されるもの(例えば、算出されている相違度が予め定められた閾値以上となるもの)の数を示し、Σm'(id)は全ての同一ユーザのm'(id)の合計を示す。また、M'(id)は、同一ユーザidに係る発信履歴の発言内容のうち全ての同一ユーザの行動内容のいずれかと矛盾すると判断されるもの(例えば、相違度が予め定められた閾値以上となるもの)の数を示し、ΣM'(id)は、全ての同一ユーザのM'(id)の合計を示す。
【0072】
図3は、本実施形態に係る発信履歴の一例を示す。発信履歴取得部104は、短文投稿サイト等のSNSへの投稿履歴を取得してよい。例えば、図示するように、発信履歴取得部104が取得する発信履歴には、第2ユーザに係る第2識別情報(「yamadataro」等)、投稿内容、投稿日時等の情報が含まれる。投稿内容には、第2ユーザが購買した店舗(「ネットショップABC」及び「ABC」)、及び、購買した商品情報(「CD」、「バンドXXX」、及び「XXX限定盤」)等の情報が含まれる。
【0073】
図4は、本実施形態の行動履歴の一例を示す。行動履歴取得部102は、ECサイトにおける購買履歴を取得してよく、例えば、図示するように、第1ユーザに係る第1識別情報(「山田太郎」等)、第1ユーザが購買した商品(「書籍AAA」等)、住所(「AA県AA」等)、購入日、及び、配達日等の情報を取得する。
【0074】
図5は、本実施形態において類似度算出部114が算出する類似度の一例を示す。図示するように、類似度算出部114は、複数の第1ユーザA〜D及び複数の第2ユーザA〜Dの組み合わせのそれぞれに対して類似度を算出する。例えば、類似度算出部114は、第1ユーザAと第2ユーザAとの組み合わせに対して類似度AAを算出し、第1ユーザAと第2ユーザBとの組み合わせに対して類似度ABを算出し、第1ユーザAと第3ユーザCとの組み合わせに対して類似度ACを算出し、第1ユーザAと第2ユーザDとの組み合わせに対して類似度ADを算出する。このように、類似度算出部114は、全ての第1ユーザと全ての第2ユーザとの組み合わせに対して類似度を算出する。
【0075】
図6は、本実施形態において関連度算出部112が算出する関連度の一例を示す。図示するように、関連度算出部112は、一の第1ユーザAの複数の発信履歴A〜D及び一の第2ユーザAの複数の行動履歴A〜Dの組み合わせのそれぞれに対して関連度を算出する。例えば、関連度算出部112は、第1ユーザAの発信履歴A及び第2ユーザAの行動履歴Aの組み合わせに対して関連度AAを算出し、第1ユーザAの発信履歴B及び第2ユーザAの行動履歴Aの組み合わせに対して関連度BAを算出し、第1ユーザAの発信履歴C及び第2ユーザAの行動履歴Aの組み合わせに対して関連度CAを算出し、第1ユーザAの発信履歴D及び第2ユーザAの行動履歴Aの組み合わせに対して関連度DAを算出する。このように、関連度算出部112は、一の第1ユーザの全ての行動履歴と一の第2ユーザの全ての発信履歴との組み合わせに対して関連度を算出する。
【0076】
図7は、情報処理装置10として機能するコンピュータ1900のハードウェア構成の一例を示す。本実施形態に係るコンピュータ1900は、ホスト・コントローラ2082により相互に接続されるCPU2000、RAM2020、グラフィック・コントローラ2075、及び表示装置2080を有するCPU周辺部と、入出力コントローラ2084によりホスト・コントローラ2082に接続される通信インターフェイス2030、ハードディスクドライブ2040、及びCD−ROMドライブ2060を有する入出力部と、入出力コントローラ2084に接続されるROM2010、フレキシブルディスク・ドライブ2050、及び入出力チップ2070を有するレガシー入出力部を備える。
【0077】
ホスト・コントローラ2082は、RAM2020と、高い転送レートでRAM2020をアクセスするCPU2000及びグラフィック・コントローラ2075とを接続する。CPU2000は、ROM2010及びRAM2020に格納されたプログラムに基づいて動作し、各部の制御を行う。
【0078】
グラフィック・コントローラ2075は、CPU2000等がRAM2020内に設けたフレーム・バッファ上に生成する画像データを取得し、表示装置2080上に表示させる。これに代えて、グラフィック・コントローラ2075は、CPU2000等が生成する画像データを格納するフレーム・バッファを、内部に含んでもよい。
【0079】
入出力コントローラ2084は、ホスト・コントローラ2082と、比較的高速な入出力装置である通信インターフェイス2030、ハードディスクドライブ2040、CD−ROMドライブ2060を接続する。通信インターフェイス2030は、有線又は無線によりネットワークを介して他の装置と通信する。
【0080】
また、通信インターフェイスは、情報処理装置10における通信を行うハードウェアとして機能する。ハードディスクドライブ2040は、コンピュータ1900内のCPU2000が使用するプログラム及びデータを格納する。CD−ROMドライブ2060は、CD−ROM2095からプログラム又はデータを読み取り、RAM2020を介してハードディスクドライブ2040に提供する。
【0081】
また、入出力コントローラ2084には、ROM2010と、フレキシブルディスク・ドライブ2050、及び入出力チップ2070の比較的低速な入出力装置とが接続される。ROM2010は、コンピュータ1900が起動時に実行するブート・プログラム、及び/又は、コンピュータ1900のハードウェアに依存するプログラム等を格納する。
【0082】
フレキシブルディスク・ドライブ2050は、フレキシブルディスク2090からプログラム又はデータを読み取り、RAM2020を介してハードディスクドライブ2040に提供する。入出力チップ2070は、フレキシブルディスク・ドライブ2050を入出力コントローラ2084へと接続するとともに、例えばパラレル・ポート、シリアル・ポート、キーボード・ポート、マウス・ポート等を介して各種の入出力装置を入出力コントローラ2084へと接続する。
【0083】
RAM2020を介してハードディスクドライブ2040に提供されるプログラムは、フレキシブルディスク2090、CD−ROM2095、又はICカード等の記録媒体に格納されて利用者によって提供される。プログラムは、記録媒体から読み出され、RAM2020を介してコンピュータ1900内のハードディスクドライブ2040にインストールされ、CPU2000において実行される。
【0084】
コンピュータ1900にインストールされ、コンピュータ1900を情報処理装置10として機能させるプログラムは、行動履歴取得モジュールと、発信履歴取得モジュールと、判定モジュールと、関連度算出モジュールと、類似度算出モジュールと、同一ユーザ抽出モジュールと、重要度算出モジュールと、配信モジュールとを備える。これらのプログラム又はモジュールは、CPU2000等に働きかけて、コンピュータ1900を、行動履歴取得部102、発信履歴取得部104、判定部110、関連度算出部112、類似度算出部114、同一ユーザ抽出部116、重要度算出部120、及び、配信部130としてそれぞれ機能させてよい。
【0085】
これらのプログラムに記述された情報処理は、コンピュータ1900に読込まれることにより、ソフトウェアと上述した各種のハードウェア資源とが協働した具体的手段である行動履歴取得部102、発信履歴取得部104、判定部110、関連度算出部112、類似度算出部114、同一ユーザ抽出部116、重要度算出部120、及び、配信部130として機能する。そして、これらの具体的手段によって、本実施形態におけるコンピュータ1900の使用目的に応じた情報の演算又は加工を実現することにより、使用目的に応じた特有の情報処理装置10が構築される。
【0086】
一例として、コンピュータ1900と外部の装置等との間で通信を行う場合には、CPU2000は、RAM2020上にロードされた通信プログラムを実行し、通信プログラムに記述された処理内容に基づいて、通信インターフェイス2030に対して通信処理を指示する。
【0087】
通信インターフェイス2030は、CPU2000の制御を受けて、RAM2020、ハードディスクドライブ2040、フレキシブルディスク2090、又はCD−ROM2095等の記憶装置上に設けた送信バッファ領域等に記憶された送信データを読み出してネットワークへと送信し、もしくは、ネットワークから受信した受信データを記憶装置上に設けた受信バッファ領域等へと書き込む。
【0088】
このように、通信インターフェイス2030は、DMA(ダイレクト・メモリ・アクセス)方式により記憶装置との間で送受信データを転送してもよく、これに代えて、CPU2000が転送元の記憶装置又は通信インターフェイス2030からデータを読み出し、転送先の通信インターフェイス2030又は記憶装置へとデータを書き込むことにより送受信データを転送してもよい。
【0089】
また、CPU2000は、ハードディスクドライブ2040、CD−ROMドライブ2060(CD−ROM2095)、フレキシブルディスク・ドライブ2050(フレキシブルディスク2090)等の外部記憶装置に格納されたファイルまたはデータベース等の中から、全部または必要な部分をDMA転送等によりRAM2020へと読み込ませ、RAM2020上のデータに対して各種の処理を行う。
【0090】
そして、CPU2000は、処理を終えたデータを、DMA転送等により外部記憶装置へと書き戻す。このような処理において、RAM2020は、外部記憶装置の内容を一時的に保持するものとみなせるから、本実施形態においてはRAM2020及び外部記憶装置等をメモリ、記憶部、または記憶装置等と総称する。
【0091】
本実施形態における各種のプログラム、データ、テーブル、データベース等の各種の情報は、このような記憶装置上に格納されて、情報処理の対象となる。なお、CPU2000は、RAM2020の一部をキャッシュメモリに保持し、キャッシュメモリ上で読み書きを行うこともできる。このような形態においても、キャッシュメモリはRAM2020の機能の一部を担うから、本実施形態においては、区別して示す場合を除き、キャッシュメモリもRAM2020、メモリ、及び/又は記憶装置に含まれるものとする。
【0092】
また、CPU2000は、RAM2020から読み出したデータに対して、プログラムの命令列により指定された、本実施形態中に記載した各種の演算、情報の加工、条件判断、情報の検索・置換等を含む各種の処理を行い、RAM2020へと書き戻す。例えば、CPU2000は、条件判断を行う場合においては、本実施形態において示した各種の変数が、他の変数または定数と比較して、大きい、小さい、以上、以下、等しい等の条件を満たすか否かを判断し、条件が成立した場合(又は不成立であった場合)に、異なる命令列へと分岐し、またはサブルーチンを呼び出す。
【0093】
また、CPU2000は、記憶装置内のファイルまたはデータベース等に格納された情報を検索することができる。例えば、第1属性の属性値に対し第2属性の属性値がそれぞれ対応付けられた複数のエントリが記憶装置に格納されている場合において、CPU2000は、記憶装置に格納されている複数のエントリの中から第1属性の属性値が指定された条件と一致するエントリを検索し、そのエントリに格納されている第2属性の属性値を読み出すことにより、所定の条件を満たす第1属性に対応付けられた第2属性の属性値を得ることができる。
【0094】
以上に示したプログラム又はモジュールは、外部の記録媒体に格納されてもよい。記録媒体としては、フレキシブルディスク2090、CD−ROM2095の他に、DVD又はCD等の光学記録媒体、MO等の光磁気記録媒体、テープ媒体、ICカード等の半導体メモリ等を用いることができる。また、専用通信ネットワーク又はインターネットに接続されたサーバシステムに設けたハードディスク又はRAM等の記憶装置を記録媒体として使用し、ネットワークを介してプログラムをコンピュータ1900に提供してもよい。
【0095】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
【0096】
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。