(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-11-10
(45)【発行日】2022-11-18
(54)【発明の名称】情報処理装置および情報処理方法
(51)【国際特許分類】
H04L 67/00 20220101AFI20221111BHJP
G06Q 30/02 20120101ALI20221111BHJP
【FI】
H04L67/00
G06Q30/02 398
(21)【出願番号】P 2019184162
(22)【出願日】2019-10-04
【審査請求日】2022-07-04
【早期審査対象出願】
(73)【特許権者】
【識別番号】519360453
【氏名又は名称】株式会社FLUX
(74)【代理人】
【識別番号】230116816
【氏名又は名称】成川 弘樹
(74)【代理人】
【識別番号】230123490
【氏名又は名称】藪木 健吾
(74)【代理人】
【識別番号】100174850
【氏名又は名称】大崎 絵美
(74)【代理人】
【識別番号】100159248
【氏名又は名称】齋藤 修
(74)【代理人】
【識別番号】100105784
【氏名又は名称】橘 和之
(72)【発明者】
【氏名】李 然
【審査官】木村 雅也
(56)【参考文献】
【文献】国際公開第2007/110951(WO,A1)
【文献】特開2018-106759(JP,A)
【文献】特開2017-016544(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04L 67/00
G06Q 30/02
(57)【特許請求の範囲】
【請求項1】
ネットワークに接続可能な端末に関する情報であり、時間の経過に応じて値が変化しない固定パラメータにより構成される固定パラメータ群と、時間の経過に応じて値が変化し得る可変パラメータにより構成される可変パラメータ群とを含む端末情報を処理する情報処理装置であって、
第1の時点で取得された第1の端末の第1の
前記端末情報と、第1の時点より後の第2の時点で取得された第2の端末の第2の
前記端末情報とに基づいて、前記第1の端末と前記第2の端末とが同一である可能性である同一可能性を判断する同一可能性判断部を備え、
前記同一可能性判断部は、
前記第1の時点で取得された第1の端末の第1の前記端末情報に含まれる固定パラメータである前記第1の端末に係る固定パラメータと
前記第2の時点で取得された第2の端末の第2の前記端末情報に含まれる固定パラメータである前記第2の端末に係る固定パラメータとの一致性に加え、前記第1の時点から前記第2の時点への変化を示す時間変化と、
前記第1の時点で取得された第1の端末の第1の前記端末情報に含まれる可変パラメータである前記第1の端末に係る可変パラメータから
前記第2の時点で取得された第2の端末の第2の前記端末情報に含まれる可変パラメータである前記第2の端末に係る可変パラメータへの変化を示す可変パラメータ変化とを反映して前記同一可能性を判断する
ことを特徴とする情報処理装置。
【請求項2】
前記同一可能性判断部は、
複数の時点を示す第1複数時点で取得された前記第1の端末の前記第1の
前記端末情報のそれぞれと、前記第2の時点で取得された前記第2の端末の前記第2の
前記端末情報とに基づいて前記同一可能性を判断し、
前記同一可能性を判断する際に、前記第1の端末に係る固定パラメータと前記第2の端末に係る固定パラメータとの一致性に加え、前記第1複数時点および前記第2の時点とに基づく前記時間変化と、前記第1複数時点における前記第1の端末に係る可変パラメータのそれぞれおよび前記第2の時点における前記第2の端末に係る可変パラメータに基づく前記可変パラメータ変化とを反映して前記同一可能性を判断する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記同一可能性判断部は、
前記第1の端末に係る固定パラメータ群と、前記第2の端末に係る固定パラメータ群とが一致しない場合は、前記時間変化および前記可変パラメータ変化にかかわらず、前記第1の端末と前記第2の端末とが同一ではないと判断する
ことを特徴とする請求項1または2に記載の情報処理装置。
【請求項4】
前記同一可能性判断部は、
前記第1の端末に係る固定パラメータ群と、前記第2の端末に係る固定パラメータ群とが一致する場合、
可変パラメータの種類ごとに、前記時間変化と前記可変パラメータ変化とを反映して前記同一可能性を評価し、可変パラメータの種類ごとの評価を反映して最終的な前記同一可能性を判断する
ことを特徴とする請求項1から3の何れか1項に記載の情報処理装置。
【請求項5】
前記同一可能性判断部は、
一の種類の可変パラメータについての前記同一可能性を評価する際、前記時間変化および前記可変パラメータ変化に加え、1つ以上の固定パラメータの値を反映して同一可能性を評価する
ことを特徴とする請求項4に記載の情報処理装置。
【請求項6】
前記同一可能性判断部は、
可変パラメータの種類ごとの評価を反映して最終的な前記同一可能性を判断する際、前記時間変化を反映して、各種類の可変パラメータについての評価が最終的な前記同一可能性の判断に与える影響度を調整する
ことを特徴とする請求項4または5に記載の情報処理装置。
【請求項7】
前記同一可能性判断部は、
可変パラメータの種類ごとの評価を反映して最終的な前記同一可能性を判断する際、前記時間変化と1つ以上の固定パラメータの値とを反映して、各種類の可変パラメータについての評価が、最終的な前記同一可能性の判断に与える影響度を調整する
ことを特徴とする請求項6に記載の情報処理装置。
【請求項8】
前記同一可能性判断部は、
前記第1の端末に係る固定パラメータ群と、前記第2の端末に係る固定パラメータ群とが一致する場合、
固定パラメータ群が相互に一致する一の端末情報および他の端末情報に基づくデータであって、当該一の端末に係る可変パラメータ群と、当該他の端末情報に係る可変パラメータ群と、当該一の端末情報が取得された一の時点を示す情報と、当該他の端末情報が取得された他の時点を示す情報と、当該一の端末情報に係る端末と当該他の端末情報に係る端末とが同一か否かを示すラベルとを含むデータを教師データとして用いて学習されたモデルを用いて、
前記第1の端末に係る可変パラメータ群、前記第2の
前記端末情報に係る可変パラメータ群、前記第1の時点を示す情報、および、前記第2の時点を示す情報から、前記同一可能性を示す評価値を出力する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項9】
前記モデルは、
当該一の端末情報に係る可変パラメータ群と、当該他の端末情報に係る可変パラメータ群とを、可変パラメータの種類ごとに当該一の端末情報に係る可変パラメータから当該他の端末情報に係る可変パラメータへの変化を示す可変パラメータ変化値に変換して、これを入力とし、更に、
当該一の端末情報が取得された当該一の時点を示す情報と、当該他の端末情報が取得された当該他の時点を示す情報とを、当該一の時点から当該他の時点への変化を示す時間変化値に変換して、これを入力とする
ことを特徴とする請求項8に記載の情報処理装置。
【請求項10】
前記同一可能性判断部は、
前記第1の
前記端末情報に係る固定パラメータ群と、前記第2の
前記端末情報に係る固定パラメータ群とが一致する場合、
固定パラメータ群が相互に一致する一の端末情報および他の端末情報に基づくデータであって、当該一の端末情報に係る可変パラメータ群と、当該他の端末情報に係る可変パラメータ群と、当該一の端末情報が取得された一の時点を示す情報と、当該他の端末情報が取得された他の時点を示す情報と、1つ以上の固定パラメータの値と、当該一の端末情報に係る端末と当該他の端末情報に係る端末とが同一か否かを示すラベルとを含むデータを教師データとして用いて学習されたモデルを用いて、
前記第1の
前記端末情報に係る可変パラメータ群、前記第2の
前記端末情報に係る可変パラメータ群、前記第1の時点を示す情報、前記第2の時点を示す情報、および、1つ以上の固定パラメータの値から、前記同一可能性を示す評価値を出力する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項11】
前記モデルは、
当該一の端末情報に係る可変パラメータ群と、当該他の端末情報に係る可変パラメータ群とを、可変パラメータの種類ごとに当該一の端末情報に係る可変パラメータから当該他の端末情報に係る可変パラメータへの変化を示す可変パラメータ変化値に変換して、これを入力とし、更に、
当該一の端末情報が取得された当該一の時点を示す情報と、当該他の端末情報が取得された当該他の時点を示す情報とを、当該一の時点から当該他の時点への変化を示す時間変化値に変換して、これを入力とする
ことを特徴とする請求項10に記載の情報処理装置。
【請求項12】
前記同一可能性判断部は、
前記第1の端末に係る固定パラメータ群と、前記第2の端末に係る固定パラメータ群とが一致する場合、
固定パラメータ群が相互に一致する一の端末情報および他の端末情報に基づくデータであって、複数の時点で取得された複数の当該一の端末情報に係る可変パラメータ群と、当該他の端末情報に係る可変パラメータ群と、当該一の端末情報が取得された複数の時点のそれぞれを示す情報と、当該他の端末情報が取得された他の時点を示す情報と、1つ以上の固定パラメータの値と、当該一の端末情報に係る端末と当該他の端末情報に係る端末とが同一か否かを示すラベルとを含むデータを教師データとして用いて学習されたモデルを用いて、
前記第1複数時点で取得された複数の前記第1の端末に係る可変パラメータ群のそれぞれ、前記第2の端末に係る可変パラメータ群、前記第1の時点を示す情報、および、前記第2の時点を示す情報から、前記同一可能性を示す評価値を出力する
ことを特徴とする請求項2に記載の情報処理装置。
【請求項13】
ネットワークに接続可能な端末に関する情報であり、時間の経過に応じて値が変化しない固定パラメータにより構成される固定パラメータ群と、時間の経過に応じて値が変化し得る可変パラメータにより構成される可変パラメータ群とを含む端末情報を処理する情報処理装置による情報処理方法であって、
前記情報処理装置の同一性判断部が、第1の時点で取得された第1の端末の第1の
前記端末情報に含まれる固定パラメータと、第1の時点より後の第2の時点で取得された第2の端末の第2の
前記端末情報に含まれる固定パラメータとの一致性を判断する第1ステップと、
前記情報処理装置の前記同一性判断部が、第1ステップで一致性を有すると判断した場合に、前記第1の時点から前記第2の時点への変化を示す時間変化と、前記第1の
前記端末情報に含まれる可変パラメータから前記第2の
前記端末情報に含まれる可変パラメータへの変化を示す可変パラメータ変化とを反映して前記第1の端末と前記第2の端末とが同一である可能性を判断する第2ステップと、
を含むことを特徴とする情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、端末から取得した端末情報に基づいて端末を識別する情報処理装置および情報処理方法に関する。
【背景技術】
【0002】
従来、ネットワークに接続された端末について、端末を識別する(いわゆるトラッキング)方法として、クッキーを利用した方法が広く知られているが、クッキーの使用ができないケース、クッキーの使用が望まれないケース等が存在することを踏まえ、クッキーを使用せずに端末を識別する種々の技術が提案されている。例えば特許文献1には、ユーザのログイン情報(例えば、SNSで付与されるアカウント)を利用して端末を識別する技術が記載されている。この他、IPアドレス、画面の解像度、CPUコア数等の端末から取得可能な要素(パラメータ)の組み合わせから識別情報を生成し、生成した識別情報を利用して端末を識別する技術(いわゆるデバイスフィンガープリンティング技術)が広く普及している。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に記載の技術では、何らかのサービスについてログインしたユーザのみが識別の対象(トラッキングの対象)となるため、識別可能なユーザが限定的になってしまうという問題がある。一方、従来のデバイスフィンガープリンティング技術は、一般に、IPアドレス等の時間の経過に応じて値が変わる要素を含む要素群に基づいて識別情報が生成されるため、特許文献1の段落0039にも記述されているように、非常に短い期間しか信頼性が担保できないという問題がある。
【0005】
本発明は、このような問題を解決するために成されたものであり、クッキーを使用せずに、識別可能な端末を限定することなく、できるだけ長い期間、高い信頼性で端末を識別できるようにすることを目的とする。
【課題を解決するための手段】
【0006】
上記した課題を解決するために、本発明では、第1の時点で取得された第1の端末の第1の端末情報と、第1の時点より後の第2の時点で取得された第2の端末の第2の端末情報とに基づいて、第1端末と第2端末とが同一である可能性を判断する際に、第1の端末情報に含まれる固定パラメータと第2の端末情報に含まれる固定パラメータとの一致性に加え、第1の時点から第2の時点への変化を示す時間変化と、第1の端末情報に含まれる可変パラメータから第2の端末情報に含まれる可変パラメータへの変化を示す可変パラメータ変化とを反映して同一可能性を判断するようにしている。
【発明の効果】
【0007】
端末より取得可能な端末情報には、時間の経過に応じて値が変化しない固定パラメータにより構成される固定パラメータ群と、時間の経過に応じて値が変化し得る可変パラメータにより構成される可変パラメータ群とが存在する。固定パラメータは時間の経過に応じて値が変化しないため、一の固定パラメータ群と他の固定パラメータ群とにおいて、共通する種類の固定パラメータの値が異なれば、当該一の固定パラメータ群に係る端末と当該他の固定パラメータ群に係る端末とは同一ではないと判断できる、という特徴がある。また、可変パラメータについては、可変パラメータの種類ごとに、時間の変化に対する可変パラメータの変化の態様に傾向があるという特徴がある。
【0008】
このことを踏まえ、上記のように構成した本発明によれば、第1の端末と第2の端末とが同一である可能性の判断に際し、第1の端末に係る固定パラメータ群と第2の端末に係る固定パラメータ群との一致性が反映される。このため、上述した固定パラメータについての特徴を好適に利用して、固定パラメータの特徴を鑑みたときに確実に相違しているということが言える2つの端末について、同一と判断される可能性を低減でき、判断結果の信頼性を向上できる。
【0009】
更に本発明によれば、第1の端末と第2の端末が同一である可能性の判断に際し、第1の時点から第2の時点への変化を示す時間変化、および、第1の端末情報に含まれる可変パラメータから第2の端末情報に含まれる可変パラメータへの変化が反映される。このため、時間の変化に対する可変パラメータの変化の態様の傾向を考慮して同一可能性を判断することが可能となり、時間の経過に伴う可変パラメータの値の変化がない期間だけでなく、時間の経過に伴って可変パラメータが変化した場合であっても、このような傾向を考慮しない場合と比較して高い信頼性で同一可能性を判断できる。
【0010】
以上の通り、本発明によれば、クッキーを使用せずに、識別可能な端末を限定することなく、できるだけ長い期間、高い信頼性で端末を識別できるようにすることができる。なお、第1の端末情報に係る端末と第2の端末情報に係る端末とが同一か否かを判定するということは、一方の端末を、他方の端末と同一か否かという観点で識別するということである。
【図面の簡単な説明】
【0011】
【
図1】本発明の第1実施形態に係る情報処理システムの機能構成例を示すブロック図である。
【
図4】ユーザ管理データベースのレコードの内容を示す図である。
【
図5】専用モデルM1の入力と出力との関係を示す図である。
【
図7】個別可変パラ評価値出力モデルのニューラルネットワークを示す図である。
【
図8】時間の経過に対するOSverの値の推移の一例を示す図である。
【
図9】OSverについて時間変化値に対する可変パラメータ変化値の推移の一例を示す図である。
【
図10】重み出力モデルのニューラルネットワークを示す図である。
【
図12】ログイン時端末情報、および、正ラベルを有する教師データの内容を示す図である。
【
図13】本発明の第1実施形態に係る情報処理装置の同一可能性判断部の動作を示すフローチャートである。
【
図14】本発明の第2実施形態に係る情報処理システムの機能構成例を示すブロック図である。
【
図15】変形例2に係る専用モデルM1の入力と出力との関係、および、教師データの内容を示す図である。
【
図16】変形例3、4に係る個別可変パラ評価値出力モデルのニューラルネットワークを示す図である。
【
図17】変形例6に係る重み出力モデルのニューラルネットワークを示す図である。
【
図18】変形例7に係る個別可変パラ評価値出力モデルのニューラルネットワークを示す図である。
【
図19】変形例7に係る専用モデルM1の入力と出力との関係、および、教師データの内容を示す図である。
【発明を実施するための形態】
【0012】
<第1実施形態>
以下、本発明の第1実施形態を図面に基づいて説明する。
図1は、本実施形態に係る情報処理システム1の機能構成例を示すブロック図である。
図1で示すように、本実施形態に係る情報処理システム1は、情報処理サーバ2(特許請求の範囲の「情報処理装置」に相当)を備えている。この情報処理サーバ2は、インターネット、電話網、その他の通信網を含んで構成されたネットワークNに接続されており、このネットワークNには、ユーザ端末3およびサイト提供サーバ4が接続されている。
【0013】
ユーザ端末3は、任意の個人が所有する端末である。ユーザ端末3は、ウェブブラウザがインストールされている装置であればく、一例として、ユーザ端末3は、デスクトップ型のコンピュータ、ノート型のコンピュータ、タブレット型のコンピュータ、携帯電話(いわゆるスマートフォンおよびスマートフォン以外の携帯電話を含む)等である。
図1では、無数に存在するユーザ端末3のうちの1つを例示的に図示している。
【0014】
サイト提供サーバ4は、ウェブブラウザからアクセス可能な所定のWebサイトが開設されたウェブサーバである。本実施形態では、サイト提供サーバ4がユーザ端末3からのアクセスに応じて提供するウェブページには、後述する方法で情報処理サーバ2が提供する広告の情報(以下「広告情報」という)が表示される欄が含まれている。
図1では、無数に存在するサイト提供サーバ4の1つを例示的に図示している。
【0015】
情報処理サーバ2は、後に詳述するように、ユーザ端末3がサイト提供サーバ4のサイトにアクセスした際に、ユーザ端末3を識別し、ユーザ端末3に係るユーザの嗜好を踏まえた広告の広告情報を提供する。情報処理サーバ2が提供する広告情報は、サイト提供サーバ4が提供するウェブページの所定の欄に表示される。情報処理サーバ2は、所定の事業者(以下「サービス提供事業者」という)により運営される。なお、
図1では、情報処理サーバ2を1つのブロックにより表しているが、これは情報処理サーバ2が単一のサーバ装置により構成されることを意味するものではない。情報処理サーバ2は、複数の装置により構成されてもよく、所定のシステムの一部であってもよい。
【0016】
図1で示すように、情報処理サーバ2は、機能構成として、サーバ側通信部6、広告提供部7および同一可能性判断部8を備えている。また、ユーザ端末3は、機能構成として、ユーザ端末側通信部9およびウェブブラウザ実行部10を備えており、このウェブブラウザ実行部10は、統括制御部11および端末情報取得部12を備えている。上記各機能ブロック6~12は、ハードウェア、DSP(Digital SigNal Processor)、ソフトウェアの何れによっても構成することが可能である。例えばソフトウェアによって構成する場合、上記各機能ブロック6~12は、実際にはコンピュータのCPU、RAM、ROMなどを備えて構成され、RAMやROM、ハードディスクまたは半導体メモリ等の記録媒体に記憶されたプログラムが動作することによって実現される。このことは第2実施形態で説明する各機能ブロックについても同様である。
【0017】
情報処理サーバ2は、記憶媒体としてサーバ側記憶部13を備えている。サーバ側記憶部13は、後述するユーザ管理データベース14を記憶している。なお、サーバ側記憶部13が記憶するデータの一部または全部を情報処理サーバ2と通信可能な外部装置が記憶する構成でもよい。
【0018】
ユーザ端末3のウェブブラウザ実行部10は、ウェブブラウザや、ウェブブラウザに付随するプログラム(OSの一部のプログラム、API等)を、CPU等のハードウェアが読み出して実行することにより各種処理を実行する。ユーザ端末3のユーザ端末側通信部9、および、情報処理サーバ2のサーバ側通信部6は、所定の通信規格に従ってネットワークNにアクセスし、ネットワークNと接続する装置と通信する。
【0019】
以下、ユーザ端末3のウェブブラウザがサイト提供サーバ4のサイトにアクセスする際およびアクセスした後のユーザ端末3、サイト提供サーバ4および情報処理サーバ2の処理について説明する。
【0020】
ユーザ端末3を所有するユーザは、ユーザ端末3のウェブブラウザを起動し、サイト提供サーバ4のサイトに対応するURLへのアクセスを指示し、ウェブブラウザに当該URLにアクセスさせる。以下、説明の便宜のため、サイト提供サーバ4にアクセスしたユーザ端末3を「処理対象ユーザ端末」といい、他のユーザ端末3と区別する。これに応じて、処理対象ユーザ端末のウェブブラウザ実行部10の統括制御部11は、HTTPリクエストをサイト提供サーバ4に送信する。サイト提供サーバ4は、当該URLへのアクセス(HTTPリクエスト)に応じて、HTTPレスポンスを応答する。HTTPレスポンスに含まれるHTMLファイルには、所定のスクリプト言語で記述された所定のスクリプト(以下「専用スクリプト」という)が組み込まれている。この専用スクリプトは、サービス提供事業者により開発され、提供されたものである。
【0021】
処理対象ユーザ端末のウェブブラウザ実行部10の統括制御部11は、HTTPレスポンスを受信する。ウェブブラウザ実行部10の端末情報取得部12は、HTTPレスポンスに組み込まれた専用スクリプト(付随するプログラムを含む)の機能により、以下の処理を実行する。
【0022】
すなわち、端末情報取得部12は、処理対象ユーザ端末のハードウェアの構成/設定に関する情報、ソフトウェアの構成/設定、ネットワークの構成/設定に関する情報、その他の処理対象ユーザ端末に関する情報であって、予め定められたものを取得する。以下、端末情報取得部12が取得する情報の集合を「端末情報」といい、種類ごとに分かれた個々の情報を「パラメータ」という。端末情報取得部12が取得するパラメータは、固定パラメータと可変パラメータとに分類される。以下では、全ての固定パラメータの集合を「固定パラメータ群」といい、全ての可変パラメータの集合を「可変パラメータ群」という。つまり、端末情報は固定パラメータ群および可変パラメータ群により構成され、固定パラメータ群は固定パラメータにより構成され、可変パラメータ群は可変パラメータにより構成される。
【0023】
固定パラメータとは、時間の経過に応じて値が変化しないパラメータである。
図2では、固定パラメータの一例を一覧表で示している。時間の経過に応じてパラメータの値が変化しないとは、どれだけ時間が経過しても全く値が変わらないことのみを意味するのではなく、時間が経過しても値が変わりにくい性質をパラメータが持っており(例えば、非常に特殊なケースでのみ値が変わる等)、ほとんどの場合において時間の経過に応じて値が変わらないことを意味する。例えば、
図2の一覧表の1行目を参照し、モバイル/デスクトップ等のデバイスの分類は、時間の経過によって変化するものではないため、パラメータとしてのデバイス種類は固定パラメータとされている。また例えば、
図2の一覧表の3行目を参照し、ユーザシステムのタイムゾーンは、基本的には元の場所から国や地域を超えて異なる場所に移動した場合に初めて変更されるものであるため、パラメータとしてのタイムゾーンは、固定パラメータである。
【0024】
可変パラメータとは、時間の経過に応じて値が変化し得るパラメータである。
図3では、可変パラメータの一例を一覧表で示している。例えば、
図3の一覧表の1行目を参照し、グローバルIPアドレスは、現状、ほとんど全ての場合においてユーザ端末3ごとに固有のものではなく、都度、変更されるため、パラメータとしてのグローバルIPアドレスは、可変パラメータである。また例えば、
図3の一覧表の2行目を参照し、オペレーティングシステムのバージョンは、都度行われるアップデートに従って随時変化するため、パラメータとしてのOSverは、可変パラメータである。
【0025】
端末情報取得部12により端末情報が取得された後、統括制御部11は、広告情報を要求するHTTPリクエストを情報処理サーバ2に送信する。その際、統括制御部11は、端末情報取得部12により取得された端末情報と、端末情報取得部12により端末情報が取得された日時を示す端末情報取得日時情報と、ウェブブラウザがアクセスしたサイト提供サーバ4のURL(以下「サイトURL」という)をHTTPリクエストに含める。情報処理サーバ2の広告提供部7は、HTTPリクエストを受信し、HTTPリクエストに含まれる端末情報、端末情報取得日時情報およびサイトURLを同一可能性判断部8に出力し、ユニークID(後述)の応答を要求する。
【0026】
同一可能性判断部8は、広告提供部7から端末情報、端末情報取得日時情報およびサイトURLを入力すると共に、ユニークIDの応答要求に応じて以下の処理を実行する。すなわち、同一可能性判断部8は、端末情報に含まれる固定パラメータ群を取得する。次いで、同一可能性判断部8は、固定パラメータのそれぞれをルールに従って並べることによってハッシュ前固定パラメータ由来IDを生成する。なお、ハッシュ前固定パラメータ由来IDの生成方法は、固定パラメータ群の値が共通する場合に必ず共通する値のハッシュ前固定パラメータ由来IDが生成されるような方法であれば、どのような方法であってもよい。次いで、同一可能性判断部8は、予め用意されたハッシュ関数を用いてハッシュ前固定パラメータ由来IDのハッシュ値を生成し、これを固定パラメータ由来ID(以下「固定パラID」と略す)とする。次いで、同一可能性判断部8は、サーバ側記憶部13に記憶されたユーザ管理データベース14を参照する。
【0027】
図4は、ユーザ管理データベース14の1件のレコードの内容を模式的に示す図である。後に明らかとなる通り、あるユーザ端末3からサイト提供サーバ4(正確には、複数存在するサイト提供サーバ4の何れか)へのアクセスがあったときに、ユーザ管理データベース14にそのユーザ端末3に対応するレコードが登録されていないと同一可能性判断部8が判定した場合には、ユーザ管理データベース14に1件のレコード(そのユーザ端末3に対応するレコード)が新たに登録される。一方、ユーザ管理データベース14にそのユーザ端末3に対応するレコードが既に登録されていると同一可能性判断部8が判定した場合には、ユーザ管理データベース14のそのユーザ端末3に対応するレコードが更新される。従って、理想的には、ユーザ管理データベース14には、過去にサイト提供サーバ4にアクセスしたことのあるユーザ端末3のそれぞれについて、1件ずつレコードが登録されている。
【0028】
図4で示すように、ユーザ管理データベース14の1件のレコードは、ユニークID、固定パラID、端末情報取得日時情報、固定パラメータ群、可変パラメータ群および履歴情報のそれぞれが格納されるフィールドを有する。ユニークIDは、レコードごとに一意な値であり、ユーザ端末3を識別する識別情報として機能する。履歴情報は、ユーザ端末3が過去にアクセスしたサイトのURLが蓄積された情報である。
【0029】
同一可能性判断部8は、サーバ側記憶部13に記憶されたユーザ管理データベース14を参照し、生成した固定パラID(=処理対象ユーザ端末の固定パラID)の値と同一の値の固定パラIDを有するレコードが(1)存在しないか、(2)1件存在するか、(3)2件以上存在するかを判定する。以下、生成した固定パラID(=処理対象ユーザ端末の固定パラID)の値と同一の値の固定パラIDを有するレコードのことを適宜、「候補レコード」という。
【0030】
候補レコードが存在しない場合、以下の状態である。すなわち、上述したように、固定パラメータは、時間の経過に応じて値が変化しない。従って、一の固定パラメータ群と他の固定パラメータ群とにおいて、値が相違する固定パラメータが1つでも存在すれば、当該一の固定パラメータ群に係るユーザ端末3と当該他の固定パラメータ群に係るユーザ端末3とは同一ではないと判断できる。そして、当該一の固定パラメータ群と当該他の固定パラメータ群とにおいて、値が相違する固定パラメータが1つでも存在する場合、当該一の固定パラメータ群がハッシュ化されて生成された固定パラIDと、当該他の固定パラメータ群がハッシュ化されて生成された可変パラIDとの値は相違する。これを踏まえ、処理対象ユーザ端末の固定パラIDの値と同一の値の固定パラIDを有するレコードが存在しない場合、処理対象ユーザ端末に対応するレコードがユーザ管理データベース14に登録されていないという状態である。
【0031】
以上を踏まえ、処理対象ユーザ端末の固定パラIDの値と同一の値の固定パラIDを有するレコードが存在しないと判定した場合、同一可能性判断部8は、処理対象ユーザ端末と、各レコードに対応するユーザ端末3とは異なる端末であり、処理対象ユーザ端末に対応するレコードはユーザ管理データベース14に登録されていないと判断する。このように判断することにより、固定パラメータの特徴を鑑みたときに確実に処理対象ユーザ端末と相違しているユーザ端末3が、同一であると判断される可能性を排除でき、判断結果の信頼性を向上できる。そして、同一可能性判断部8は、以下の方法でユーザ管理データベース14に処理対象ユーザ端末に対応する1件のレコードを新たに登録する。
【0032】
すなわち、まず、同一可能性判断部8は、ユニークIDを生成する。例えば、同一可能性判断部8は、固定パラメータ群に含まれる全ての固定パラメータと可変パラメータ群に含まれる全ての可変パラメータとをルールに従って配列することによってデータを生成し、ハッシュ関数を用いてこのデータのハッシュ値を生成し、これをユニークIDとする。本実施形態では、端末情報に十分に多くの個数の固定パラメータおよび可変パラメータが含まれており、このような方法でレコードごとに一意なユニークIDを生成できる。ただし、値の一意性が確保できるのであれば、ユニークIDの生成方法はどのような方法であってもよい。
【0033】
次いで、同一可能性判断部8は、生成したユニークID、生成した固定パラID、入力した端末情報日時情報、入力した端末情報に含まれる固定パラメータ群、入力した端末情報に含まれる可変パラメータ群、および、入力したサイトURLのそれぞれが対応するフィールドに格納された1件のレコードをユーザ管理データベース14に登録する。次いで、同一可能性判断部8は、生成したユニークIDを広告提供部7に応答する。
【0034】
一方、候補レコードが1件だけ存在する場合、以下の状態である。すなわち、処理対象ユーザ端末と、候補レコードに対応するユーザ端末3とについて、少なくとも固定パラメータ群の値が一致しており、処理対象ユーザ端末と候補レコードに対応するユーザ端末3とが同一である可能性があるという状態である。これを踏まえ、同一可能性判断部8は、候補レコードが1件だけ存在する場合、以下の処理を実行する。
【0035】
すなわち、同一可能性判断部8は、機械学習された専用モデルM1(特許請求の範囲の「モデル」に相当)を利用して以下の処理を実行する。専用モデルM1とは、後述する入力に基づいて、一の時点で端末情報が取得された一の端末と、当該一の時点よりも後の他の時点で端末情報が取得された他の端末とが同一である可能性を示す最終評価値を出力するモデルである。ただし、当該一の端末に係る端末情報に含まれる固定パラメータ群の値と、当該他の端末に係る端末情報に含まれる固定パラメータ群との値は一致する。なお、固定パラメータ群の値が一致するとは、全ての種類の固定パラメータの値が一致していることを意味する。以下、専用モデルM1の説明に際し、同一か否か判断される対象となる2つの端末をそれぞれ「一方端末」および「他方端末」といい、一方端末に係る端末情報が取得された時点の方が、他方端末に係る端末情報が取得された時点よりも古い(=時間的に前)ものとする。また、一方端末に係る端末情報を「一方端末情報」といい、他方端末に係る端末情報を「他方端末情報」という。上述の通り、一方端末情報と他方端末情報とは、固定パラメータ群の値が一致する。
【0036】
図5は、専用モデルM1の入力と出力との関係を概念的に示す図である。
図5で示すように、専用モデルM1は、1.一方端末に係る可変パラメータ群(以下「一方可変パラメータ群」という)、2.他方端末に係る可変パラメータ群(以下「他方可変パラメータ群」という)、3.一方端末情報を取得した時点(日時)を示す取得日時情報(以下「一方端末情報取得日時情報」という)、4.他方端末情報を取得した時点(日時)を示す取得日時情報(以下「他方端末情報取得日時情報」)、および、5.一方端末情報と他方端末情報とで共通する固定パラメータ群(以下「共通固定パラメータ群」という)を入力とする。また、専用モデルM1は、最終評価値(一方端末と他方端末とが同一である可能性を示す評価値)を出力とする。本実施形態では、説明の単純化のため、最終評価値は、「0」~「100」の間で値をとり、値が大きいほど同一である可能性が高いものとする。
【0037】
さて、候補レコードが1件だけ存在する場合、同一可能性判断部8は、候補レコードに含まれる可変パラメータ群(一方可変パラメータ群に相当)、処理対象ユーザ端末に係る可変パラメータ群(他方可変パラメータ群に相当)、候補レコードに含まれる端末情報取得日時情報(一方端末情報取得日時情報に相当)、広告提供部7から入力した端末情報取得日時情報(他方端末情報取得日時情報に相当)、および、処理対象ユーザ端末(または候補レコード)に係る固定パラメータ群(共通固定パラメータ群に相当)を専用モデルM1に入力し、専用モデルM1が出力する最終評価値を得る。モデルM1を利用して最終評価値を取得する処理は、特許請求の範囲の同一可能性を判断する処理に相当する。
【0038】
次いで、同一可能性判断部8は、最終評価値が予め定められた閾値T1以上か否かを判定する。閾値T1は、一方端末と他方端末とが同一であるとみなすことができるか否かを判定する基準値であり、事前にテストやシミュレーションに基づいて定められる。最終評価値が閾値T1を下回る場合、同一可能性判断部8は、処理対象ユーザ端末と候補レコードに対応するユーザ端末3とが同一でないと判断し、上述した方法で処理対象ユーザ端末に対応するレコードをユーザ管理データベース14に登録し、そのユニークIDを広告提供部7に通知する。
【0039】
一方、最終評価値が閾値T1以上の場合、同一可能性判断部8は、処理対象ユーザ端末と候補レコードに対応するユーザ端末3とが同一であると判断し(=処理対象ユーザ端末を識別し)、以下の処理を実行する。すなわち、同一可能性判断部8は、候補レコードの端末情報取得日時情報、固定パラメータ群および可変パラメータ群をそれぞれ、広告提供部7から入力した情報により更新する。更に、同一可能性判断部8は、履歴情報のフィールドに、広告提供部7から入力したサイトURLを追加的に格納する。以上により、候補レコードが、処理対象ユーザ端末から受信した最新の情報に基づいて更新される。次いで、同一可能性判断部8は、候補レコードのユニークIDを広告提供部7に通知する。
【0040】
なお、本実施形態では、同一可能性判断部8は、候補レコードが1件だけしか存在しない場合であっても、最終評価値が閾値T1を下回る場合、候補レコードに対応するユーザ端末3と処理対象ユーザ端末とが同一でないと判断する。これは以下の理由による。すなわち、固定パラメータ群は、固定パラメータのみにより構成され、可変パラメータを含まないため、その分、固定パラメータ群に含まれるパラメータの個数は少ない。例えば、従来のデバイスフィンガープリンティング技術における一般的なフィンガープリント情報は、固定パラメータおよび可変パラメータの双方を含むため、本実施形態の固定パラメータ群と比して、含まれるパラメータの個数は多い。従って、異なるユーザ端末3について偶然、固定パラメータ群が一致する可能性は、固定パラメータおよび可変パラメータの双方を含む群が一致する可能性と比較して高い。これを踏まえ、本実施形態では、異なる端末について、固定パラメータ群が偶然一致した場合に、同一と判断される可能性が低減するよう、上記処理を実行する。ただし、固定パラメータ群を構成する固定パラメータの個数が十分に多く、異なるユーザ端末3について固定パラメータ群の値が一致することが稀である場合には、候補レコードが1件の場合には、その1件の候補レコードに対応するユーザ端末3と処理対象ユーザ端末とが同一であると判断する構成でもよい。
【0041】
また、候補レコードが2件以上存在する場合、以下の状態である。すなわち、複数の候補レコードに対応するユーザ端末3のそれぞれについて、処理対象ユーザ端末と同一である可能性があるという状態である。これを踏まえ、候補レコードが2件以上存在する場合、同一可能性判断部8は、以下の処理を実行する。
【0042】
すなわち、同一可能性判断部8は、専用モデルM1を用いて、候補レコードのそれぞれについて、処理対象ユーザ端末との同一可能性を示す最終評価値を取得する。取得した最終評価値の全てが閾値T1を下回る場合、同一可能性判断部8は、全ての候補レコードに対応するユーザ端末3について処理対象ユーザ端末と同一でないと判断する。この場合、同一可能性判断部8は、上述した方法で処理対象ユーザ端末に対応するレコードをユーザ管理データベース14に登録し、更にユニークIDを広告提供部7に通知する。
【0043】
取得した最終評価値のうち1つの最終評価値だけが閾値T1以上であり、他の最終評価値が閾値T1を下回る場合、同一可能性判断部8は、閾値T1以上の最終評価値に係る候補レコードに対応するユーザ端末3と処理対象ユーザ端末とが同一であると判断する。この場合、同一可能性判断部8は、上述した方法で処理対象ユーザ端末から受信した最新の情報により候補レコードを更新し、更に候補レコードのユニークIDを広告提供部7に通知する。
【0044】
取得した最終評価値のうち2つ以上の最終評価値が閾値T1以上の場合、同一可能性判断部8は、閾値T1以上の最終評価値のうち、最も値が大きい最終評価値に係る候補レコードに対応するユーザ端末3と処理対象ユーザ端末とが同一であると判断する。この場合、同一可能性判断部8は、上述した方法で処理対象ユーザ端末から受信した最新の情報により候補レコードを更新し、更に候補レコードのユニークIDを広告提供部7に通知する。なお、後述するように、専用モデルM1は機械学習によって、一方端末と他方端末とが同一である場合にはできるだけ最終評価値が大きくなり、同一でない場合には最終評価値が小さくなるよう最適化される。従って、理想的には、処理対象ユーザ端末と同一のユーザ端末3に対応する1件のレコードがユーザ管理データベース14に登録されている場合には、そのレコードについてのみ、最終評価値が閾値T1以上となる。
【0045】
広告提供部7は、同一可能性判断部8からユニークIDの通知を受けると、サーバ側記憶部13に記憶されたユーザ管理データベース14を参照し、通知されたユニークIDに対応するレコードを特定する。次いで、広告提供部7は、特定したレコードの履歴情報(1つ以上のサイトURL)を認識する。広告提供部7は、認識した1つ以上のサイトURLに基づいて、ユーザの嗜好を推定し、ユーザの嗜好を踏まえた広告情報を表示するための描画データを生成する。ユーザの嗜好を推定する処理は既存の技術に基づいて適切に基づいて行われ、また、描画データの生成に必要なデータは予め用意されている。広告提供部7は、HTTPレスポンスによって描画データを処理対象ユーザ端末に応答する。
【0046】
処理対象ユーザ端末の統括制御部11は、描画データを受信し、当該描画データおよびサイト提供サーバ4から受信したHTMLファイルに基づいて、広告情報が付加されたウェブサイトを表示装置に表示する。
【0047】
次に、専用モデルM1について説明する。
図6は、最終評価値の算出式を示す図である。
図6の算出式は、最終評価値の考え方の理解に供することを主な目的とするものであり、内容は説明に適した態様で単純化されている。
図6で示すように、最終評価値は、個別可変パラメータ評価値(以下「個別可変パラ評価値」と略す)のそれぞれに個別重みを乗じたものの総和である。
図6の単純化した例では、全ての重みの総和は「1」であり、個々の個別可変パラ評価値は「0」~「100」の間で値をとる。従って、本例における最終評価値は、可変パラメータ個別評価値の加重平均値ということもできる。
【0048】
個別可変パラ評価値は、可変パラメータの種類ごとに存在する。一の種類の可変パラメータの個別可変パラ評価値は、当該一の種類の可変パラメータに着目したときに、一方端末と他方端末とが同一である可能性を示す評価値(評価)である。個別重みは、各種類の可変パラメータについての評価(個別可変パラ評価値)が最終的な同一可能性の判断(最終評価値)に与える影響度を調整するための重みである。個別可変パラ評価値および個別重みについては後に詳述する。
図6で示すように、専用モデルM1には、可変パラメータの種類ごとに、個別可変パラ評価値を出力する個別可変パラ評価値出力モデルが含まれている。また、専用モデルM1には、個別重みのそれぞれを出力する重み出力モデルが含まれている。
【0049】
まず、個別可変パラ評価値出力モデルについて説明する。以下では、個別可変パラ評価値出力モデルがニューラルネットワークであるものとして個別可変パラ評価値出力モデルについて説明する。
図7は、個別可変パラ評価値出力モデルのニューラルネットワークを説明に適した態様で単純化して示す図である。
図7で示すように、個別可変パラ評価値出力モデルの第0層(入力層)の入力には、時間変化値が含まれる。時間変化値とは、一方端末情報取得日時情報が示す日時(以下「一方日時」という)と、他方端末情報取得日時情報が示す日時(以下「他方日時」という)との変化を示す値であり、可変パラメータの種類によって異なる表し方で表されている。時間変化値は、時間変化値出力アルゴリズAR1に対して、一方端末情報取得日時情報および他方端末情報取得日時情報が入力されることによって算出される。
【0050】
例えば、可変パラメータの種類がOSverの場合、時間変化値は、一方日時から他方日時までの経過時間を「日」単位で表す値とされる(あくまで一例であり、このように表すことが適切ということではない)。この場合、OSverに係る時間変化値出力アルゴリズAR1は、入力された一方端末情報取得日時情報および他方端末情報取得日時情報に基づいて、一方日時から他方日時までの経過時間を日単位で算出し、算出した秒単位の経過時間を示す時間変化値を、ニューラルネットワークの第0層(入力層)のニューロンに出力する。この他、時間変化値は、例えば、一方日時から他方日時までの経過時間を秒単位で表す値や、また例えば、一方日時から他方日時までの経過時間が、予め定められた時間を超えているか否かを示す値とすることが考えられる。
【0051】
また、
図7で示すように、個別可変パラ評価値出力モデルの入力には、可変パラメータ変化値(以下「可変パラ変化値」と略す)が含まれる。一の種類の可変パラメータに係る可変パラ変化値とは、一方端末情報の当該一の種類の可変パラメータと、他方端末情報の当該一の種類に係る可変パラメータとの変化を示す値である。可変パラ変化値は、可変パラメータの種類によって異なる表し方で表される。可変パラ変化値は、可変パラ変化値出力アルゴリズムAR2に対して、一方端末情報に係る可変パラメータ(以下「一方可変パラメータ」という)と他方端末情報に係る可変パラメータ(以下「他方可変パラメータ」という)とが入力されることによって算出される。
【0052】
例えば、可変パラメータの種類がOSverの場合、OSverに係る可変パラ変化値出力アルゴリズムAR2は、以下の処理を実行する。例えば、OSverが大項目、中項目、小項目の順に「○.×.□」(○、×、□は任意の整数)のように記述されているとする。この場合、可変パラ変化値出力アルゴリズムAR2は、所定のルールに従って大項目の一致/不一致、大項目および中項目の一致/不一致を適切に考慮した上で、比較するOSのバージョンの全体としての変化量を示す可変パラ変化値を算出する。OSのバージョンがマイナス側に変化している場合は、可変パラ変化値は、OSのバージョンがマイナス側に変化したことが分かるような値とされる(あくまで一例であり、このように表すことが適切ということではない)。
【0053】
また例えば、可変パラメータの種類がグローバルIPアドレス(IPv4とする)の場合、グローバルIPアドレスに係る可変パラ変化値出力アルゴリズムAR2は、IPアドレスのクラスを認識し、クラスが異なれば所定のルールに従って可変パラ変化値の値を大きくし、逆にクラスが同じであれば所定のルールに従って可変パラ変化値の値を小さくする(可変パラ変化値の値が大きいほど、IPアドレスの変化量が大きいものとする)。また、可変パラ変化値出力アルゴリズムAR2は、クラスが同じ場合にはネットワーク部とホスト部とを区別し、ネットワーク部の値が一致すれば所定のルールに従って可変パラ変化値を小さくし、ネットワーク部の値が異なれば所定のルールに従って可変パラ変化値を大きくし、また、ネットワーク部の値が一致する場合は、所定のルールに従ってホスト部の値の相違の大小を可変パラ変化値に反映させる(あくまで一例であり、このように表すことが適切ということではない)。
【0054】
また、
図7で示すように、個別可変パラ評価値出力モデルの入力には、固定パラメータ群に含まれる固定パラメータのそれぞれが含まれている。詳細は省略するが、固定パラメータのそれぞれは、ニューラルネットワークの入力として適切な値となるよう、必要なデータ変換や、データ成形、正規化、ベクトル化等が適切に行われる。例えば、デバイス種類に関し、モバイルを示す値については「1」とされ、デスクトップを示す値については「-1」とされたり、また、モバイルを示す値については「100」とされ、デスクトップを示す値については「0」とされたり、また、デバイス種類の値を2次元のベクトルで表すものとし、モバイルを示す値については[0、1]とされ、デスクトップを示す値については[1、0]とされたりする(これらの例はあくまで一例であり、このようにすることが適切というわけではない)。
【0055】
個別可変パラ評価値出力モデルは、機械学習されることによって、以下の態様で個別可変パラ評価値を出力することが期待される。
【0056】
ここで、発明者らは、可変パラメータの種類ごとに、時間の変化に対する可変パラメータの変化の態様に傾向があり、しかも、可変パラメータの変化の態様は、特定の固定パラメータの値に影響を受けることを見出した。
【0057】
図8(A)は、OS種類<固定パラメータ>の値がある特定の種類(種類SXとする)を示す値であるときの時間の経過に対するOSver<可変パラメータ>の値(=OSのバージョンの値)の推移の一例を、横軸が時間、縦軸がOSのバージョンの座標上のグラフによって示す図である。
図8(A)の例からは、OSver<可変パラメータ>について、OS種類<固定パラメータ>が種類SXである場合、時間の経過にほぼ比例して少しずつ値が上昇するという傾向(時間の変化に対する可変パラメータの変化の態様の傾向)があることが読み取れる。なお、
図9は、
図8(A)のグラフを時間変化値と可変パラ変化値との関係を示すグラフに変換したものを示している。
図9では、上記傾向に従って、時間変化値が大きくなるのにほぼ比例して、可変パラ変化値が徐々に大きくなっている。
【0058】
図8(B)は、OS種類<固定パラメータ>の値が種類SXとは異なる種類SYを示す値であるときのOSのバージョンの値の推移の一例を
図8(A)と同様の座標上のグラフによって示す図である。
図8(B)の例からは、OSver<可変パラメータ>について、OS種類<固定パラメータ>が種類SYである場合、時間の経過に応じて少しずつ値が上昇していく一方、略一定の間隔をあけてOSのバージョンが大幅に上昇するという傾向(時間の変化に対する可変パラメータの変化の態様の傾向)があることが読み取れる。このような傾向があるとした場合、OS種類が種類SYであるときのOSver<可変パラメータ>に係る可変パラ変化値は、時間変化値の変化に対して当該傾向に準じて(当該傾向に影響を受けて)変化すると考えられる。
【0059】
また、
図8の各図の比較によって、OSver<可変パラメータ>の時間の変化に対する変化の態様の傾向は、OS種類<固定パラメータ>の値によって異なることが読み取れる。
【0060】
この他、例えば、グローバルIPアドレス<可変パラメータ>に関しては、デバイス種類がモバイルの場合、ある基準時点から数十秒程度の非常に短い期間は値(アドレス値)が変化しない(変化しにくい)ものの、その短い期間を超えると、値(アドレス値)が基準時点の値から無秩序に変化するという傾向を想定できる。また、グローバルIPアドレス<可変パラメータ>に関して、デバイス種類がデスクトップの場合、時間の経過に対してある範囲内で値(アドレス値)が推移していくという傾向を想定できる。これらの想定からは、グローバルIPアドレス<可変パラメータ>については、時間の変化に対する変化の態様に傾向があり、しかも、当該変化の態様はデバイス種類<固定パラメータ>の値によって影響を受けることが想定できる。
【0061】
さて、
図7を参照し、個別可変パラ評価値出力モデルでは、時間変化値、可変パラ変化値、および、固定パラメータ群に含まれる固定パラメータのそれぞれがニューラルネットワークの入力とされている。このため、ある一の種類の個別可変パラ評価値出力モデルについて、ニューラルネットワークにおけるニューロンをつなぐリンクの重みが機械学習によって調整されることにより、以下の内容の個別可変パラ評価値が出力されることが期待される。すなわち、時間変化値と可変パラ変化値との関係が、所定の固定パラメータの値を反映した時間の変化に対する当該一の種類の可変パラメータの値の変化の態様の傾向に準じていればいるほど、出力される個別可変パラ評価値が大きくなり、当該関係が当該傾向から外れていればいるほど、出力される個別可変パラ評価値が小さくなることが期待される。
【0062】
例えば、
図9を参照し、OS種類が種類SXのとき、
図9のグラフで示す通りに、時間変化値に対してOSver<可変パラメータ>に係る可変パラ変化値が推移する傾向があるものとする。また、OSver<可変パラメータ>に係る個別可変パラ評価値出力モデルに入力される時間変化値の値がQ1(
図9参照)であり、当該モデルに入力されるOS種類<固定パラメータ>の値が種類SXを示す値であったものとする。この場合において、可変パラ変化値の値がP1(
図9参照)である場合、時間変化値と可変パラ変化値との関係が、OS種類が種類SXのときのOSver<可変パラメータ>の変化の態様の傾向に準じているということができる。従って、この場合、機械学習後の個別可変パラ評価値出力モデルが出力する可変パラ評価値は大きくなることが期待される。一方、可変パラ変化値の値がP2やP3である場合、当該関係が当該傾向に準じていないと言うことができる。ため、このような場合、機械学習後の個別可変パラ評価値出力モデルが出力する可変パラ評価値は小さくなることが期待される。
【0063】
なお、本実施形態では、可変パラメータに係る個別可変パラ評価値出力モデルに、固定パラメータ群に含まれる全ての固定パラメータが入力されているが、機械学習の結果、可変パラメータの値の変化に影響を与える種類の固定パラメータについては可変パラ評価値への影響度が大きくなり、当該変化に影響を与えない種類の固定パラメータについては当該影響度が小さくなる(理想的には影響度がなくなる)ように、ニューラルネットワークの各リンクの重みが収束していくものと想定される。
【0064】
また、本実施形態では、個別可変パラ評価値出力モデルに入力する固定パラメータの種類を人間が取捨選択せず、固定パラメータ群に含まれる全ての固定パラメータを入力としている。例えば、OSver<可変パラメータ>に係る個別可変パラ評価値出力モデルについて、OS種類<固定パラメータ>のみがOSver<可変パラメータ>の値の変化に影響を与えるものとして、OS種類<固定パラメータ>だけを入力とする、ということは行われていない。これにより、本来、可変パラメータの変化に影響があるものの、そのことに人間が気付きにくいような固定パラメータについても、個別可変パラ評価値に影響させることができる。
【0065】
以上のように、本実施形態では、時間の変化に対する可変パラメータの値の変化の態様に傾向があることに着目し、個別可変パラ評価値出力モデルのニューラルネットワークに時間変化値と可変パラ変化値とを入力している点に従来にない特徴がある。そして、この特徴により、専用モデルM1が機械学習されることによって、一の種類の可変パラメータに係る個別可変パラ評価値出力モデルについては、時間の変化に対する当該一の種類の可変パラメータの変化の態様の傾向が学習されていき、当該傾向が反映された信頼性の高い評価値が出力されることになる。
【0066】
次に、重み出力モデルについて説明する。以下では、重み出力モデルがニューラルネットワークであるものとして重み出力モデルについて説明する。
図10は、重み出力モデルのニューラルネットワークを説明に適した態様で単純化して示す図である。
図10で示すように、重み出力モデルの入力には、時間変化値と、固定パラメータを含んでいる。このため、機械学習が行われることにより、重み出力モデルにより以下の内容の個別重みが出力されることが期待される。すなわち、時間変化値および各固定パラメータの値を考慮して信頼性があると判断できる個別可変パラ評価値に対応する個別重みについては値が大きくなり、一方、信頼性がないと判断できる個別可変パラ評価値に対応する個別重みについては値が小さくなることが期待される。
【0067】
例えば、グローバルIPアドレス<可変パラメータ>に係る個別可変パラ評価値について、デバイス種類がモバイルのときは、時間変化値が一定値(例えば、数十秒程度の期間を示す値)よりも小さい場合は、ある程度の信頼性があるものの、時間変化値が一定値を超えると、ほとんど信頼性がなくなるものとする。この場合、重み出力モデルに入力されたデバイス種類<固定パラメータ>の値がモバイルを示す値であり、時間変化値が一定値を超えている場合、機械学習後の重み出力モデルが出力する「グローバルIPアドレス<可変パラメータ>に対応する個別重み」は、非常に小さくなることが期待される。
【0068】
また例えば、OSver<可変パラメータ>に係る個別可変パラ評価値について、OS種類が所定の種類である場合、時間変化値が一定値(例えば、1年程度の期間を示す値)を超えていると、OSver<可変パラメータ>に係る個別可変パラ評価値は、他の可変パラメータに係る個別可変パラ評価値と比較して、相対的に信頼性が高くなるものとする。この場合、重み出力モデルに入力されたOS種類<固定パラメータ>の値が当該所定の種類を示す値であり、時間変化値が一定値を超えている場合、機械学習後の重み出力モデルが出力する、OSver<可変パラメータ>に対応する個別重みは、他の個別重みと比して相対的に大きくなることが期待される。
【0069】
以上のように、本実施形態では、時間の変化に応じて個別可変パラ評価値の信頼性が変化することに着目し、重み出力モデルのニューラルネットワークに時間変化値を入力している点に従来にない特徴がある。そして、この特徴により、専用モデルM1が機械学習されることによって、時間の変化に対する信頼性の変化が学習されていき、当該傾向が反映された信頼性の高い個別重みが出力されることになる。
【0070】
以上のようにして個別可変パラ評価値のそれぞれが算出されると共に、個別重みのそれぞれが算出される。このため、
図6の算出式で導き出される最終評価値は、時間の変化に対する可変パラメータの値の変化の態様には傾向があるという特徴、および、時間の変化によって個別可変パラ評価値の信頼性が変化するという特性が考慮された値となり、このような特性を考慮しない場合と比較して飛躍的に信頼性を高くすることができる。
【0071】
なお、本実施形態では、専用モデルM1が個別可変パラ評価値出力モデルと、これとは独立した重み出力モデルとの2つから構成されるものとしたが、これは説明の便宜を考慮したものであり、単一のニューラルネットワークにより個別可変パラ評価値および個別重みを出力する構成でもよい。また、個別可変パラ評価値出力モデルおよび重み出力モデルについて、第0層(入力層)のニューロンに入力するとした値を、隠れ層(中間層)のニューロンに入力する構成としてもよい。また、専用モデルM1は、ニューラルネットワークである必要はなく、機械学習が可能であり、入力に応じて最終評価値を出力可能なモデルであればよい。
【0072】
次に、専用モデルM1の学習、特に、教師データの準備について説明する。
図11は、教師データの内容を示す図である。
図11で示すように、専用モデルM1の学習には、一方可変パラメータ群と、他方可変パラメータ群と、一方端末情報取得日時情報と、一方端末情報取得日時情報と、共通固定パラメータ群と、一方端末と他方端末とが同一か否かを示すラベルとを含む教師データが用いられる。そして、専用モデルM1の精度を高めるためには、一方端末と他方端末とが同一であることを示すラベル(以下「正ラベル」という)の教師データを大量に用意することが重要となる。
【0073】
教師データは、例えば、以下のようにして用意される。すなわち、ログインが必要なオンライン上のサービス(サービス提供事業者が提供するサービスであってもよく、他の事業者が提供するサービスであってもよい)について、ログインがある度に、ユーザ端末3から端末情報取得日時情報と、固定パラメータ群と、可変パラメータ群とが採取され、ログインIDと対応付けて蓄積される。その際、ログインIDごとに固定パラメータ群が一致するものでグループ分けされる。なお、ユーザは、異なるユーザ端末3でログインを行う可能性があるが、ユーザがサービスにログインしたときに採取された固定パラメータ群の値が、過去のあるタイミングでログインしたときに採取された固定パラメータ群の値と一致する場合、ログインの際に使用されたユーザ端末3は同一と考えることができる。
【0074】
以上により、ログインIDと端末情報取得日時情報と固定パラメータ群と可変パラメータ群との組み合わせ(以下、「ログイン時端末情報」という)が蓄積されたグループが形成されていく。各グループにおいて、各ログイン時端末情報のログインIDの値、および、固定パラメータ群の値は一致する。
図12(A)は、あるグループに属する複数のログイン時端末情報の内容を示している。
【0075】
そして、ログイン時端末情報が十分に蓄積されたグループに基づいて正ラベルを有する教師データが生成される。より詳細には、グループに属する全てのログイン時端末情報は、同一のユーザ端末3に基づくものである。従って、
図12(B)で示すように、1つのグループに属する任意の2つのログイン時端末情報に基づいて、正ラベル(
図12(B)では「1」と表している)を有する1件の教師データを生成可能である。従って1つのグループに属するログイン時端末情報を様々に組み合わせて、複数の正ラベルの教師データを生成可能である。複数のグループのそれぞれについて以上の手順で教師データが生成されることによって、教師データが準備される。なお、教師データの生成方法は、例示した方法に限られず、例えば、テスト用に用意された複数の端末について、随時、可変パラメータ群を採取し、端末情報取得日時情報および固定パラメータ群と対応付けて記憶し、これに基づいて教師データを生成するようにしてもよい。
【0076】
上述したように、教師データに基づいて専用モデルM1が機械学習されることにより、時間の変化に対する当該一の種類の可変パラメータの変化の態様の傾向、および、時間の変化に応じた個別可変パラ評価値の信頼性の変化を反映した最終評価値が出力されるよう、各ニューロンを結ぶリンクの重みが調整されていき、信頼性の高い最終評価値を出力することが可能となる。
【0077】
次に、フローチャートを用いて情報処理サーバ2の動作、特に同一可能性判断部8の動作について説明する。
図13は、同一可能性判断部8の動作を示すフローチャートである。
【0078】
図13で示すように、同一可能性判断部8は、広告提供部7から端末情報、端末情報取得日時情報およびサイトURLを入力する(ステップSA1)。次いで、同一可能性判断部8は、端末情報に含まれる固定パラメータ群を取得する(ステップSA2)。次いで、同一可能性判断部8は、ハッシュ前固定パラメータ由来IDを生成する(ステップSA3)。次いで、同一可能性判断部8は、固定パラIDを生成する(ステップSA4)次いで、同一可能性判断部8は、ユーザ管理データベース14を参照し、候補レコード(ステップSA4で生成した固定パラIDの値と同一の値の固定パラIDを有するレコード)が存在するか否かを判定する(ステップSA5)。
【0079】
存在しない場合(ステップSA5:NO)、同一可能性判断部8は、ユニークIDを生成する(ステップSA6)。次いで、同一可能性判断部8は、ステップSA6で生成したユニークID、固定パラID、端末情報日時情報、固定パラメータ群、可変パラメータ群、および、サイトURLのそれぞれが対応するフィールドに格納された1件のレコードを登録する(ステップSA7)。次いで、同一可能性判断部8は、生成したユニークIDを広告提供部7に応答する(ステップSA8)。ステップSA8の処理後、
図13のフローチャートは終了する。
【0080】
一方、候補レコードが存在する場合(ステップSA5:YES)、同一可能性判断部8は、候補レコードが1件か否かを判定する(ステップSA9)。1件の場合(ステッSA9:YES)、同一可能性判断部8は、候補レコードに含まれる可変パラメータ群、処理対象ユーザ端末に係る可変パラメータ群、候補レコードに含まれる端末情報取得日時情報、広告提供部7から入力した端末情報取得日時情報、および、処理対象ユーザ端末(または候補レコード)に係る固定パラメータ群を専用モデルM1に入力し、専用モデルM1が出力する最終評価値を得る(ステップSA10)。次いで、同一可能性判断部8は、最終評価値が閾値T1以上か否かを判定する(ステップSA11)。閾値T1以上ではない場合(ステップSA11:NO)、処理手順はステップSA6へ移行する。
【0081】
閾値T1以上の場合(ステップSA11:YES)、同一可能性判断部8は、処理対象ユーザ端末から受信した最新の情報に基づいて候補レコードを更新する(ステップSA12)。次いで、同一可能性判断部8は、候補レコードのユニークIDを広告提供部7に通知する(ステップSA13)。ステップSA13の処理後、
図13のフローチャートは終了する。
【0082】
ステップSA9において候補レコードが1件ではない場合(=2件以上の場合)(ステップSA9:NO)、同一可能性判断部8は、専用モデルM1を用いて、候補レコードのそれぞれについて最終評価値を取得する(ステップSA14)。次いで、同一可能性判断部8は、取得した最終評価値の全てが閾値T1を下回るか否かを判定する(ステップSA15)。下回る場合(ステップSA15:YES)、処理手順はステップSA6へ移行する。下回らない場合(ステップSA15:NO)、同一可能性判断部8は、1つの最終評価値だけが閾値T1以上であるか否かを判定する(ステップSA16)。1つだけの場合(ステップSA16:YES)、同一可能性判断部8は、閾値T1以上の最終評価値に係る候補レコードを更新し(ステップSA17)、ユニークIDを通知する(ステップSA18)。ステップSA18の処理後、
図13のフローチャートは終了する。一方、1つだけではない場合(=2つ以上の場合)(ステップSA16:NO)、同一可能性判断部8は、閾値T1以上の最終評価値のうち、最も値が大きい最終評価値に係る候補レコードを更新し(ステップSA19)、ユニークIDを通知する(ステップSA20)。ステップSA20の処理後、
図13のフローチャートは終了する。
【0083】
以上説明したように、本実施形態によれば、異なる2つの端末(第1の端末および第2の端末とする)とが同一である可能性の判断に際し、第1の端末に係る固定パラメータ群と第2の端末に係る固定パラメータ群との一致性が反映される。このため、固定パラメータの特徴を鑑みたときに確実に相違しているということが言える2つの端末について、同一と判断される可能性を低減でき、判断結果の信頼性を向上できる。更に本実施形態によれば、第1の端末と第2の端末が同一である可能性の判断に際し、第1の時点から第2の時点への変化を示す時間変化、および、第1の端末情報に含まれる可変パラメータから第2の端末情報に含まれる可変パラメータへの変化が反映される。このため、時間の変化に対する可変パラメータの変化の態様の傾向を考慮して同一可能性を判断することが可能となり、時間の経過に伴う可変パラメータの値の変化がない期間だけでなく、時間の経過に伴って可変パラメータが変化した場合であっても、このような傾向を考慮しない場合と比較して高い信頼性で同一可能性を判断できる。以上の通り、本実施形態によれば、クッキーを使用せずに、識別可能な端末を限定することなく、できるだけ長い期間、高い信頼性で端末を識別できるようにすることができる。
【0084】
<第2実施形態>
次いで、第2実施形態について説明する。以下の第2実施形態の説明において、第1実施形態と同一の要素については同一の符号を付し、その説明を省略する。
図14は、第2実施形態に係る情報処理システム1Aの機能構成例を示すブロック図である。
図14で示すように、本実施形態に係る情報処理システム1Aは、ネットワークNにアクセス可能なユーザ端末3Aを備え、このネットワークNにサイト提供サーバ4Aおよび情報処理サーバ2Aが接続されている。ユーザ端末3Aは、特許請求の範囲の「情報処理装置」として機能する。本実施形態に係る情報処理システム1Aと、第1実施形態に係る情報処理システム1とでは、専用モデルM1を実行する主体がユーザ端末3Aである点で大きく異なっている。
【0085】
図14で示すように、ユーザ端末3Aは、第1実施形態に係るウェブブラウザ実行部10に代えてウェブブラウザ実行部10Aを備えおり、このウェブブラウザ実行部10Aは統括制御部11Aと、端末情報取得部12Aと、同一可能性判断部8Aとを備えている。また、情報処理サーバ2Aは、広告提供部7に代えて広告提供部7Aを備え、同一可能性判断部8に代えて応答部20を備えている。
【0086】
以下、ある1つのユーザ端末3A(処理対象ユーザ端末)のウェブブラウザがサイト提供サーバ4Aのサイトにアクセスした後の処理対象ユーザ端末、サイト提供サーバ4Aおよび情報処理サーバ2Aの処理について説明する。
【0087】
ユーザによる指示に応じて、処理対象ユーザ端末のウェブブラウザ実行部10Aの統括制御部11Aは、HTTPリクエストをサイト提供サーバ4Aに送信し、その応答としてHTTPレスポンスを得る。HTTPレスポンスには、ウェブページを表示するためのHTMLファイルのほか、専用スクリプトが組み込まれている。専用スクリプトには、端末情報を取得する機能を有するスクリプトのほか、専用モデルM1がスクリプトとして実装されている。
【0088】
ウェブブラウザ実行部10Aの端末情報取得部12Aは、端末情報(固定パラメータ群および可変パラメータ群)を取得する。同一可能性判断部8Aは、端末情報取得部12Aにより取得された端末情報に基づいて、固定パラIDを生成し、生成した固定パラIDの値と同一の値の固定パラIDを有するレコード(候補レコード)がユーザ管理データベース14に登録されているか否かを情報処理サーバ2Aの応答部20に問い合わせる。
【0089】
情報処理サーバ2Aの応答部20は、同一可能性判断部8Aからの問い合わせに応じてユーザ管理データベース14を参照し、候補レコードが存在しない場合は、その旨を通知する。また、応答部20は、1件以上の候補レコードが存在する場合は、全ての候補レコードを同一可能性判断部8Aに応答する。
【0090】
同一可能性判断部8Aは、候補レコードが存在しない旨の通知を受けた場合、
端末情報に基づいてユニークIDを生成し、生成したユニークID、端末情報、端末情報取得日時情報およびサイトURLを応答部20に送信し、新たなレコードの登録を指示する。応答部20は、当該指示に応じて、新たなレコード(処理対象ユーザ端末に対応するレコード)をユーザ管理データベース14に登録する。更に同一可能性判断部8Aは、広告提供部7AにユニークIDを通知する。
【0091】
また、同一可能性判断部8Aは、1件以上の候補レコードの応答があった場合、第1実施形態と同様の方法で、専用モデルM1を利用して処理対象ユーザ端末と同一のユーザ端末3Aに対応する1件の候補レコードを特定するか、このような候補レコードが存在しないと判断する。処理対象ユーザ端末と同一のユーザ端末3Aに対応する1件の候補レコードを特定した場合、同一可能性判断部8Aは、端末情報、端末情報取得日時情報およびサイトURLを応答部20に送信し、その1件の候補レコードの更新を指示する。応答部20は、当該指示に応じて、候補レコードの内容を更新する。更に同一可能性判断部8Aは、広告提供部7AにユニークIDを通知する。
【0092】
処理対象ユーザ端末と同一のユーザ端末3Aに対応する候補レコードが存在しないと判断した場合、同一可能性判断部8Aは、端末情報に基づいてユニークIDを生成し、生成したユニークID、端末情報、端末情報取得日時情報およびサイトURLを応答部20に送信し、新たなレコード(=処理対象ユーザ端末に対応するレコード)の登録を指示する。応答部20は、当該指示に応じて、新たなレコードをユーザ管理データベース14に登録する。更に同一可能性判断部8Aは、広告提供部7AにユニークIDを通知する。
【0093】
広告提供部7Aは、処理対象ユーザ端末の同一可能性判断部8AからユニークIDの通知を受けると、ユーザ管理データベース14を参照し、第1実施形態と同様の方法で広告情報の描画データを生成し、処理対象ユーザ端末のウェブブラウザ実行部10Aの統括制御部11Aに送信する。統括制御部11Aは、描画データを受信し、当該描画データおよびサイト提供サーバ4Aから受信したHTMLファイルに基づいて、広告情報が付加されたウェブサイトを表示装置に表示する。
【0094】
以上のように、ユーザ端末3Aが、専用モデルM1を利用して、自機と、ユーザ管理データベース14に登録されたレコードに対応するユーザ端末3Aとの同一可能性を判断する構成でもよい。なお、第2実施形態について、以下の構成としてもよい。すなわち、同一可能性判断部8Aが、情報処理サーバ2Aの応答部20に対してユーザ管理データベース14の送信を要求する。同一可能性判断部8Aは、応答部20からユーザ管理データベース14を受信し、所定の記憶領域に記憶する。同一可能性判断部8Aは、当該所定の記憶領域に記憶したユーザ管理データベース14を用いて処理を実行する。
【0095】
以上、本発明の第1、第2実施形態について説明したが、上記各実施形態は、何れも本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその要旨、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。
【0096】
<変形例1>
例えば、上述した各実施形態では、専用モデルM1の個別可変パラ評価値出力モデルおよび重み出力モデルに対して、固定パラメータ群に含まれる全ての固定パラメータを入力していた。しかしながら、ある一の可変パラメータに係る個別可変パラ評価値出力モデルについて、当該一の可変パラメータに係る個別可変パラ評価値に影響しない固定パラメータについては入力しないと構成としてもよい。また、個別重みに影響しない固定パラメータについては重み出力モデルに入力しない構成としてもよい。
【0097】
<変形例2>
また、専用モデルM1(従って、個別可変パラ評価値出力モデルのそれぞれ、および、重み出力モデル)に一切、固定パラメータを入力しない構成としてもよい。これは、固定パラメータの値にかかわらず、可変パラメータには、その種類ごとに、時間の変化に対する値の変化の態様に傾向があるからである。例えば、OSver<可変パラメータ>に関しては、OS種類<固定パラメータ>にかかわらず、時間の経過に応じて値が上昇するという傾向がある。また、個別可変パラメータ評価値の信頼性は、固定パラメータの値によらず、時間変化値に応じて変化するからである。
【0098】
なお、時間の変化に対する変化の態様が、特定の固定パラメータの値に強く影響を受ける可変パラメータが存在することも想定される。例えば、グローバルIPアドレス<可変パラメータ>の値の変化の態様は、デバイス種類<固定パラメータ>の値(モバイル/デスクトップ)によって大きく変化すると考えられる。このように、固定パラメータの値に影響を受ける種類の可変パラメータについては、個別可変パラ評価値出力モデルの入力に固定パラメータを入力しないと、個別可変パラ評価値の信頼性が小さくなると想定されるが、機械学習が適切に行われることにより、このような個別可変パラ評価値についての個別重みは小さくなり、最終評価値に対する影響が低く抑えられることが期待される。
【0099】
図15(A)は、専用モデルM1に共通固定パラメータ群を入力しない構成とした場合の専用モデルM1の入力と出力との関係を示す図である。
図15(B)は、当該場合に、専用モデルM1の学習に用いる教師データの内容を示す図である。
図15(B)で示すように、当該場合、教師データは、一方可変パラメータ群と、他方可変パラメータ群と、一方端末情報取得日時情報と、他方端末情報取得日時情報と、ラベルとを含んで構成される。
【0100】
<変形例3>
また、個別可変パラ評価値出力モデル(本例では、ニューラルネットワーク。ただし、上述の通りニューラルネットワークでなくてもよい)に対して、時間変化値に代えて、一方端末情報取得日時情報および他方端末情報取得日時情報を入力する構成としてもよい。また、個別可変パラ評価値出力モデルに対して、時間変化値と共に一方端末情報取得日時情報および他方端末情報取得日時情報を入力する構成としてもよい。これらの場合であっても、機械学習された専用モデルM1により、一方端末情報が取得された時点から他方端末情報が取得された時点への変化を反映して最終評価値を出力できる。これらの場合、前処理において、一方端末情報取得日時情報および他方端末情報取得日時情報について、データ成形や正規化を通してニューラルネットワークで処理可能な値の変換が適切に行われる。
【0101】
<変形例4>
また、個別可変パラ評価値出力モデルに対して、可変パラ変化値に代えて、一方可変パラメータおよび他方可変パラメータを入力する構成としてもよい。また、個別可変パラ評価値出力モデルに対して、可変パラ変化値と共に一方可変パラメータおよび他方可変パラメータを入力する構成としてもよい。これらの場合であっても、機械学習された専用モデルM1により、一方可変パラメータから他方可変パラメータへの変化を反映して最終評価値を出力できる。これらの場合、前処理において、一方可変パラメータおよび他方可変パラメータについて、データ成形や正規化を通してニューラルネットワークで処理可能な値の変換が適切に行われる。
図16は、変形例3、4に関し、時間変化値に代えて一方端末情報取得日時情報および他方端末情報取得日時情報を入力し、かつ、可変パラ変化値に代えて一方可変パラメータおよび他方可変パラメータを入力する構成とした場合の個別可変パラ評価値出力モデルのニューラルネットワークを単純化して示す図である。
【0102】
<変形例5>
また、重み出力モデルに対して、時間変化値に代えて一方端末取得日時情報および他方端末情報取得日時情報を入力する構成としてもよい。また、重み出力モデルに対して、時間変化値と共に一方端末取得日時情報および他方端末情報取得日時情報を入力する構成としてもよい。これらの場合であっても、学習された重み出力モデル用により、時間の変化を反映した個別重みを出力できる。
【0103】
<変形例6>
また、重み出力モデルに対して、1つ以上の個別可変パラ評価値を更に入力する構成でもよい。
図17は、変形例6に係る重み出力モデルのニューラルネットワークを単純化して示す図である。変形例6の構成によれば、時間変化値と各固定パラメータの値と1つ以上の個別可変パラ評価値とを考慮して信頼性があると判断できる個別可変パラ評価値に対応する個別重みについては値が大きくなり、一方、信頼性がないと判断できる個別可変パラ評価値に対応する個別重みについては値が小さくなることが期待される。
【0104】
例えば、OSver<可変パラメータ>に係る可変パラ変化値が、OSのバージョンがマイナス側へ変移していることを示す値であるものとする。上述したように、OSのバージョンは、時間の経過と共に、徐々に大きくなっていくという特徴があるため、この場合、OSver<可変パラメータ>に係る個別可変パラ評価値は相当に小さい値(一方端末と他方端末とが同一である可能性が非常に低いことを示す値)となるはずである。そして、この場合、OSver<可変パラメータ>に係る個別可変パラ評価値は、かなり信頼性が高い。OSのバージョンの時間の経過に対する変化の態様の傾向を考慮すると、同一端末であれば、OSのバージョンが低くなるはずはなく(低くなる可能性は極めて小さく)、「各端末が同一である可能性が非常に低い」という評価が正しい蓋然性は非常に高いからである。従って、このような場合には、最終評価値に対して、OSver<可変パラメータ>に係る個別可変パラ評価値ができるだけ影響するよう、OSver<可変パラメータ>に係る個別重みは相対的に大きくなることが期待される。
【0105】
<変形例7>
また、
図18(A)で示すように、一方端末について、異なる複数の時点で取得された複数の一方可変パラメータ(可変パラメータの種類は共通)のそれぞれを対応する端末情報取得日時情報のそれぞれと共に、個別可変パラ評価値出力モデルに入力する構成でもよい。また、
図18(B)で示すように、以下の構成としてもよい。すなわち、端末情報取得日時情報と一方可変パラメータとの組み合わせのそれぞれが、可変パラメータ分布値出力アルゴリズムAR3に入力される。可変パラメータ分布値出力アルゴリズムAR3は、入力に基づいて可変パラメータ分布値を出力する。可変パラメータ分布値とは、時間の変化に対する複数の可変パラメータの変化を示す値であり、例えば、所定の時点(例えば、複数の端末情報取得日時情報が示す日時のそれぞれのうち、最も早い時点)を基準として、時間の経過に対して可変パラメータの値がどのように変化したかを表す波形を示す情報とされる。そしてこの可変パラメータ分布値を個別可変パラ評価値出力モデルに入力する構成としてもよい。なお、一方可変パラメータと端末情報取得日時情報との組み合わせのそれぞれと、可変パラメータ分布値とを個別可変パラ評価値出力モデルに入力する構成でもよい。また、可変パラメータ分布値出力アルゴリズムAR3に対して、端末情報取得日時情報と一方可変パラメータとの組み合わせのそれぞれと、他方可変パラメータと他方端末情報取得日時情報との組み合わせとを入力し、可変パラメータ分布値出力アルゴリズムから可変パラメータ分布値が出力される構成としてもよい。
【0106】
図19(A)は、変形例7に係る専用モデルM1の入力と出力との関係を示す図である。
図19(B)は、変形例7に係る教師データの内容を示す図である。
図19(A)で示すように、本変形例に係る専用モデルM1は、一方端末に係る情報として、「一方可変パラメータ群と一方端末情報取得日時情報との組み合わせ」が複数入力される点が、第1実施形態に係る専用モデルM1と相違する。また、
図19(B)で示すように、本変形例では、教師データは、一方可変パラメータ群と一方端末情報取得日時との組み合わせを複数有し、更に、他方可変パラメータ群と他方端末情報取得日時との組み合わせ、共通固定パラメータ群、および、ラベルを有する。
【0107】
本変形例の場合、第1実施形態に係る同一可能性判断部8は以下の処理を実行する。すなわち、同一可能性判断部8は、処理対象ユーザ端末と、ユーザ管理データベース14の1つの候補レコードに対応するユーザ端末3とが同一であると判定した場合、処理対象ユーザ端末から入力した最新の情報に基づいて候補レコードを更新するのではなく、今回取得した端末情報取得日時情報と可変パラメータ群との組み合わせを端末情報取得日時情報のフィールドと可変パラメータ群のフィールドとの組み合わせに追加する。この結果、あるユーザ端末3がサイト提供サーバ4にアクセスし、そのユーザ端末3が認識される度に、ユーザ管理データベース14のそのユーザ端末3のレコードの可変パラメータ群のフィールドに、可変パラメータ群が追加されていく。このため、ユーザ管理データベース14では、1つのユニークIDについて、異なる複数の「端末情報取得日時情報と可変パラメータ群との組み合わせ」とが関連付けられる場合がある。
【0108】
一方、同一可能性判断部8は、処理対象ユーザ端末とある候補レコードに対応するユーザ端末3とが同一か否かを判断する際に、処理対象ユーザ端末に係る端末情報取得日時情報と可変パラメータ群との組み合わせを他方端末に係る情報として専用モデルM1に入力する。更に、同一可能性判断部8は、候補レコードに含まれる「端末情報取得日時情報と可変パラメータ群との組み合わせ」のそれぞれ(従って、このような組み合わせが複数ある場合は、複数の組み合わせのそれぞれ)を一方端末に係る情報として専用モデルM1に入力する。また、同一可能性判断部8は共通固定パラメータ群も専用モデルM1に入力する。そして、同一可能性判断部8は、専用モデルM1が出力する最終評価値を取得し、これを利用して処理対象ユーザ端末とある候補レコードに対応するユーザ端末3との同一可能性を判断する。第2実施形態について以上の処理を実行してもよい。
【0109】
以上のように、本変形例に係る同一可能性判断部8は、異なる2つの端末(第1の端末および第2の端末とする)との同一可能性の判断に際し、以下の処理を実行する。すなわち、同一可能性判断部8は、第1の端末に係る固定パラメータと第2の端末に係る固定パラメータとの一致性に加え、第1の端末に係る端末情報が取得された複数の時点および第2の端末に係る端末情報が取得された第2の時点とに基づく時間変化と、複数の時点における第1の端末に係る可変パラメータのそれぞれおよび第2の時点における第2の端末に係る可変パラメータに基づく可変パラメータ変化とを反映して同一可能性を判断する。
【0110】
<その他の変形例>
以上、複数の変形例を説明したが、1つまたは複数の変形例を組み合わせて第1実施形態または第2実施形態に適用してもよいことは当然である。
【0111】
また、端末情報取得部12が固定パラメータ群および可変パラメータ群を取得する方法は、例示した方法に限られない。例えば、HTTPリクエストのヘッダ部分に記述されている要素を固定パラメータまたは可変パラメータとして利用する場合には、端末情報取得部12が当該ヘッダ部分を分析し、固定パラメータまたは可変パラメータを取得する構成としてもよい。
【0112】
また、同一可能性の判断結果(最終評価値)の利用方法は、上記各実施形態で例示したものに限られない。例えば、第1実施形態について以下の構成としてもよい。すなわち、情報処理サーバ2とは異なるサーバ装置が広告情報を提供する機能を有し、当該サーバ装置が、ユニークIDと履歴情報(上述したように、履歴情報はサイトURLに限られない)とを管理する。そして、情報処理サーバ2の同一可能性判断部8は、ユーザ端末3によるサイト提供サーバ4へのアクセスに応じてユニークIDを特定した場合、そのユニークIDを当該サーバ装置に送信する。当該サーバ装置は、ユニークIDに対応する履歴情報を特定し、履歴情報を反映した広告画像をユーザ端末3に提供する。第2実施形態についても同様の構成としてもよい。
【0113】
また、同一可能性の判断結果(最終評価値)はデジタル・フォレンジクスや、リスクベース認証にも利用できる。リスクベース認証では、例えば、オンライン上のサービスにユーザがログインする度に、専用モデルM1が利用されて過去にログインしたときの端末と今回のログインの端末とが同一か否かが判断され、同一でない場合には、より強い認証が求められる。
【符号の説明】
【0114】
2 情報処理サーバ(情報処理装置)
3A ユーザ端末(情報処理装置)
8、8A 同一可能性判断部