(58)【調査した分野】(Int.Cl.,DB名)
ネットワークのアクセスに用いられた端末のモデル名と、アクセスの際に前記端末に割り当てられていたIPアドレスとを含むアクセス情報を格納するデータベースから、複数のアクセス情報を取得する情報取得部と、
通信端末のモデル名のリストであって、当該通信端末の使用者がMVNOの利用者とみなすリストであるMVNO推定リストを取得する推定リスト取得部と、
前記複数のアクセス情報に含まれるモデル名のうち、前記MVNO推定リストに含まれるモデル名に対応するIPアドレスをMVNO利用者のIPアドレスリストとして取得するアドレスリスト取得部と、
前記アドレスリスト取得部が取得したIPアドレスリストを出力するアドレス出力部と、
を備える情報処理装置。
前記アクセス情報に含まれる端末のモデル名が前記MVNO推定リストに含まれる端末のモデル名である割合を示すMVNO割合を一つの軸、前記アクセス情報に含まれる端末がPCである割合を示すPC割合を別の軸とする空間に、前記アクセス情報に含まれるIPアドレスをマッピングして複数のクラスタにクラスタリングするクラスタリング部をさらに備え、
前記アドレスリスト取得部は、前記クラスタリング部がクラスタリングしたクラスタのうち、クラスタに含まれるIPアドレスのMVNO割合が相対的に高いクラスタのIPアドレスを、前記IPアドレスリストとして取得する、
請求項1から3のいずれか一項に記載の情報処理装置。
前記アドレス修正部は、MVNO割合が相対的に高いクラスタではない他のクラスタに含まれるIPアドレスの中で、当該他のクラスタに含まれるIPアドレスとの類似度よりも、MVNO利用者のクラスタに含まれるIPアドレスとの類似度の方が高いアドレスを、前記IPアドレスリストに追加する、
請求項5に記載の情報処理装置。
【発明の概要】
【発明が解決しようとする課題】
【0005】
近年、MVNO(Mobile Virtual Network Operator)の普及が進んできており、利用者が増加している。MVNOの利用者は、MNO(Mobile Network Operator)のデータ通信回線を利用してウェブサイト等のネットワーク上のアクセス先にアクセスする。
【0006】
ここで、ユーザエージェント情報には、MVNO、MNOのいずれの利用者であるかの情報は現状では含まれていない。また、IPアドレスはMVNO、MNOのいずれの利用者にも共通に用いられる。このため、管理者はアクセス情報を解析しただけでは、MVNOの利用者のアクセスかMNOの利用者のアクセスかを切り分けることはできない。一方で、MVNOの利用者からのアクセスかMNOの利用者からのアクセスかの情報は、例えば広告等の分野等において利用価値があり、両者の切り分けが望まれている。
【0007】
本発明はこれらの点に鑑みてなされたものであり、MVNOの利用者が使用しているIPアドレスであるか否かを推定する技術を提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の第1の態様は、情報処理装置である。この装置は、ネットワークのアクセスに用いられた端末のモデル名と、アクセスの際に前記端末に割り当てられていたIPアドレスとを含むアクセス情報を格納するデータベースから、複数のアクセス情報を取得する情報取得部と、通信端末のモデル名のリストであって、当該通信端末の使用者がMVNOの利用者とみなすリストであるMVNO推定リストを取得する推定リスト取得部と、前記複数のアクセス情報に含まれるモデル名のうち、前記MVNO推定リストに含まれるモデル名に対応するIPアドレスをMVNO利用者のIPアドレスリストとして取得するアドレスリスト取得部と、前記アドレスリスト取得部が取得したIPアドレスリストを出力するアドレス出力部と、を備える。
【0009】
前記情報取得部は、あらかじめ定められた所定のタイミングで前記アクセス情報を繰り返し取得してもよい。
【0010】
前記情報処理装置は、ネットワークを介してウェブサーバから当該ウェブサーバにアクセスしている利用者の端末に割り当てられているIPアドレスを取得する利用者アドレス取得部と、前記利用者アドレス取得部が取得したIPアドレスが、前記IPアドレスリストに含まれる場合に前記ウェブサーバに送信して前記利用者の端末に表示させる広告コンテンツと、前記IPアドレスリストに含まれない場合に前記ウェブサーバに送信して前記利用者の端末に表示させる広告コンテンツとを変更する広告提示部と、をさらに備えてもよい。
【0011】
前記情報処理装置は、前記アクセス情報に含まれる端末のモデル名が前記MVNO推定リストに含まれる端末のモデル名である割合を示すMVNO割合を一つの軸、前記アクセス情報に含まれる端末がPC(Personal Computer)である割合を示すPC割合を別の軸とする空間に、前記アクセス情報に含まれるIPアドレスをマッピングして複数のクラスタにクラスタリングするクラスタリング部をさらに備えてもよく、前記アドレスリスト取得部は、前記クラスタリング部がクラスタリングしたクラスタのうち、クラスタに含まれるIPアドレスのMVNO割合が相対的に高いクラスタのIPアドレスを、前記IPアドレスリストとして取得してもよい。
【0012】
前記情報処理装置は、異なるIPアドレス同士の類似度を算出する類似度算出部と、MVNO割合が相対的に高いクラスタに含まれるIPアドレスの中で当該クラスタに含まれるIPアドレスとの類似度よりも、他のクラスタに含まれるIPアドレスとの類似度の方が高いIPアドレスを、前記IPアドレスリストから除外するアドレス修正部と、をさらに備えてもよい。
【0013】
前記アドレス修正部は、MVNO割合が相対的に高いクラスタではない他のクラスタに含まれるIPアドレスの中で、当該他のクラスタに含まれるIPアドレスとの類似度よりも、MVNO利用者のクラスタに含まれるIPアドレスとの類似度の方が高いアドレスを、前記IPアドレスリストに追加してもよい。
【0014】
本発明の第2の態様は、情報処理方法である。この方法において、プロセッサが、ネットワークのアクセスに用いられた端末のモデル名と、アクセスの際に前記端末に割り当てられていたIPアドレスとを含むアクセス情報を格納するデータベースから、複数のアクセス情報を取得するステップと、通信端末のモデル名のリストであって、当該通信端末の使用者がMVNOの利用者とみなすリストであるMVNO推定リストを取得するステップと、前記複数のアクセス情報に含まれるモデル名のうち、前記MVNO推定リストに含まれるモデル名に対応するIPアドレスをMVNO利用者のIPアドレスリストとして取得するステップと、取得したIPアドレスリストを出力するステップと、を実行する。
【0015】
本発明の第3の態様は、プログラムである。このプログラムは、コンピュータに、ネットワークのアクセスに用いられた端末のモデル名と、アクセスの際に前記端末に割り当てられていたIPアドレスとを含むアクセス情報を格納するデータベースから、複数のアクセス情報を取得する機能と、通信端末のモデル名のリストであって、当該通信端末の使用者がMVNOの利用者とみなすリストであるMVNO推定リストを取得する機能と、前記複数のアクセス情報に含まれるモデル名のうち、前記MVNO推定リストに含まれるモデル名に対応するIPアドレスをMVNO利用者のIPアドレスリストとして取得する機能と、取得したIPアドレスリストを出力する機能と、を実現させる。
【発明の効果】
【0016】
本発明によれば、MVNOの利用者が使用しているIPアドレスであるか否かを推定する技術を提供することができる。
【発明を実施するための形態】
【0018】
<実施の形態に概要>
図1は、実施の形態に係る情報処理システムSの概要を模式的に示す図である。実施の形態に係る情報処理システムSにおいては、情報処理装置1、ウェブサーバ2、データベース3、及び通信端末TがネットワークNを介して通信可能な態様で接続している。ウェブサーバ2は、いわゆるウェブサーバであり、通信端末Tの要求に応じて種々のウェブサイトを提供する。また、情報処理装置1は、ウェブサーバ2が提供するウェブサイトに掲載するための広告を選択するアドサーバとしての機能を有する。
【0019】
以下、
図1を参照して、実施の形態の概要を(1)から(7)の順に説明するが、その番号は
図1における(1)から(7)に対応する。
【0020】
(1)ユーザUは、通信端末Tを用いてネットワークNを介することにより、ウェブサーバ2にアクセスする。
(2)ウェブサーバ2は、通信端末Tのアクセス情報を情報処理装置1に送信する。
【0021】
ここで、「アクセス情報」とは、ユーザUが通信端末Tを介してウェブサーバ2に接続したときに、通信端末Tに割り当てられたIPアドレスと、ユーザエージェント情報とを少なくとも含む情報である。また、ユーザエージェント情報には、通信端末Tのモデル名、通信端末Tに搭載されているOS(Operating System)の種類、ウェブサーバ2のアクセスに用いられたウェブブラウザの情報等を少なくとも含んでいる。アクセス情報には、ユーザUが通信端末Tを介してウェブサーバ2に接続したときのISP(Internet Service Provider)の情報も含まれる。
【0022】
(3)情報処理装置1は、ウェブサーバ2から日々継続的に送られてくるアクセス情報をデータベース3に蓄積する。
(4)情報処理装置1は、データベース3に蓄積されているアクセス情報と、データベース3に格納されているMVNO推定リストとを読み出す。
【0023】
ここで「MVNO推定リスト」とは、ユーザUが用いる通信端末Tのモデル名の一覧が掲載されているリストである。通信端末Tは、主にMVNOによる通信に用いられるもの、主にMNOの通信で用いられるもの、及びMVNOとMNOとの両方の通信に用いられるもの、及びPC(スマートフォン等のように携帯電話網による通話機能を持たない端末)の4種類に大別される。MVNO推定リストに掲載されている通信端末Tは、MVNOによる通信に用いられる蓋然性が高い通信端末Tとして、情報処理装置1の管理者があらかじめ選別した通信端末Tである。
【0024】
(5)情報処理装置1は、データベース3から読み出したアクセス情報に含まれる通信端末Tのうち、MVNO推定リストに掲載されている通信端末Tに割り当てられたIPアドレスをMVNO利用者のIPアドレスとみなしてリスト化する。これは、MVNO推定リストに掲載されている通信端末Tに割り当てられたIPアドレスは、MVNOに割り当てられたIPアドレスの蓋然性が高いという仮定に基づく。
【0025】
(6)情報処理装置1は、ウェブサーバ2から取得した通信端末Tのアクセス情報に含まれるIPアドレスがIPアドレスリストに含まれるか否かに基づいて選択した広告をウェブサーバ2に出力する。
(7)ウェブサーバ2は、情報処理装置1から出力された広告を、ユーザUから要求されたウェブサイトとともに通信端末Tに提供する。
【0026】
このように、実施の形態に係る情報処理装置1には継続的にアクセス情報が送られてくる。一例としては、情報処理装置1は1日に数十億から100億というオーダーのアクセス情報を取得する。このため、情報処理装置1に送られてくるアクセス情報はビッグデータを構成する。情報処理装置1は、MVNO推定リストに基づいてアクセス情報のビッグデータを解析することにより、MVNOに割り当てられた蓋然性の高いIPアドレスのリストを取得することができる。
【0027】
以上より、情報処理装置1は、ウェブサーバ2から取得したアクセス情報に含まれるIPアドレスが、MVNOの利用者が使用しているIPアドレスであるか否かを推定することができる。なお、ひとたびMVNOに割り当てられた蓋然性の高いIPアドレスのリストを取得した後は、そのリストにあるIPアドレスはMVNOの利用者が使用しているIPアドレスであるとみなす。したがって、MVNOとMNOとの両方の通信に用いられる端末に対してリストにあるIPアドレスが割り当てられたとしても、その端末の利用者はMVNOの利用者とみなすことができる。
【0028】
<情報処理装置1の機能構成>
図2は、実施の形態に係る情報処理装置1の機能構成を模式的に示す図である。実施の形態に係る情報処理装置1は、記憶部10と制御部11とを備える。
【0029】
記憶部10は、情報処理装置1を実現するコンピュータのBIOS(Basic Input Output System)等を格納するROM(Read Only Memory)や情報処理装置1の作業領域となるRAM(Random Access Memory)、OS(Operating System)やアプリケーションプログラム、当該アプリケーションプログラムの実行時に参照されるアクセス情報のビッグデータ、MVNOリスト、IPアドレスリスト等の種々の情報を格納するHDD(Hard Disk Drive)やSSD(Solid State Drive)等の大容量記憶装置である。
【0030】
制御部11は、情報処理装置1のCPU(Central Processing Unit)やGPU(Graphics Processing Unit)等のプロセッサであり、記憶部10に記憶されたプログラムを実行することによって情報取得部110、推定リスト取得部111、アドレスリスト取得部112、アドレス出力部113、利用者アドレス取得部114、広告提示部115、クラスタリング部116、類似度算出部117、及びアドレス修正部118として機能する。
【0031】
なお、
図2は、情報処理装置1が単一の装置で構成されている場合の例を示している。しかしながら、情報処理装置1は、例えばクラウドコンピューティングシステムのように複数のプロセッサやメモリ等の計算リソースによって実現されてもよい。この場合、制御部11を構成する各部は、複数の異なるプロセッサの中の少なくともいずれかのプロセッサがプログラムを実行することによって実現される。
【0032】
情報取得部110は、ネットワークのアクセスに用いられた通信端末Tのモデル名と、アクセスの際に通信端末Tに割り当てられていたIPアドレスとを含むアクセス情報を格納するデータベース3から、複数のアクセス情報を取得する。
【0033】
推定リスト取得部111は、MVNO推定リストを取得する。上述したように、MVNO推定リストは通信端末Tのモデル名のリストであり、その通信端末TのユーザUがMVNOの利用者とみなすリストである。情報処理装置1の管理者は、例えば各MVNOのウェブサイトに掲載されている通信端末Tを調査することにより、あらかじめMVNO推定リストを作成する。
【0034】
図3は、実施の形態に係る推定リスト取得部111が取得するMVNO推定リストの一例を模式的に示す図である。
図3に示すMVNO推定リストにおいて、ABC01、ABC−D02、XY−03Z等は、MVNOの利用者が所有すると推定される通信端末Tのモデル名である。情報処理装置1の管理者は、ユーザエージェント情報に含まれるモデル名と一致するように、MVNO推定リストを作成する。なお、MVNOの利用者が所有すると推定される通信端末Tは、MNOが自社通信網向け端末として販売した端末以外の端末である。
【0035】
なお、MVNOによる通信に用いられる蓋然性が高い通信端末Tのモデル名は日々変化する。情報処理装置1の管理者は、所定のタイミング(例えば1月等)毎にMVNO推定リストを追加又は更新してもよい。これにより、MVNO推定リストの精度を維持することができる。
【0036】
アドレスリスト取得部112は、複数のアクセス情報に含まれるモデル名のうち、MVNO推定リストに含まれるモデル名に対応するIPアドレスを、MVNO利用者のIPアドレスリストとして取得する。
【0037】
図4は、実施の形態に係るアドレスリスト取得部112が取得するIPアドレスリストの一例を模式的に示す図である。
図4に示すIPアドレスリストにおいて、アドレスリスト取得部112が取得したIPアドレスは昇順に並べて格納されている。
【0038】
MVNOが取得するIPアドレスは連番となることもある。このため、MVNOがユーザUに割り当るIPアドレスも、しばしば連番となる。
図4に示すIPアドレスリストの例では、はじめの24ビット(12.34.56)が共通で、最後の8ビットのみが異なるIPアドレスが含まれている。
【0039】
アドレス出力部113は、アドレス出力部113が取得したIPアドレスリストを出力する。アドレス出力部113は、IPアドレスリストを、例えばデータベース3に出力して保存したり、記憶部10の作業メモリに出力したりする。このアドレスリストを参照することにより、情報処理装置1は、ウェブサーバ2から取得したアクセス情報に含まれるIPアドレスが、MVNOのユーザUが使用しているIPアドレスであるか否かを推定することができる。
【0040】
MVNOのユーザUが使用しているIPアドレスは、MVNOが保有しているIPアドレスの中から割り当てられたものでる。ここで、MVNOは、IPアドレスを常に固定して保有しているとは限らない。MVNOが保有するIPアドレスが時間とともに変動し得るため、MVNOのユーザUに割り当てるIPアドレスも、時間とともに変動することが起こり得る。そこで、情報取得部110は、あらかじめ定められた所定のタイミングでアクセス情報を繰り返し取得する。
【0041】
ここで「所定のタイミング」とは、情報取得部110がアクセス情報のビッグデータをデータベース3から取得する日時としてあらかじめ定められたタイミングである。取得の日時は、情報処理装置1が日々取得するアクセス情報の量や、MVNOに割り当てるIPアドレスの変動の大きさ等を考慮して実験により定めればよいが、例えば月初めや月末等に設定すればよい。
【0042】
情報取得部110が所定のタイミングでアクセス情報を取得することにより、推定リスト取得部111は、MVNO利用者のIPアドレスリストを更新することができる。これにより、情報処理装置1は、IPアドレスの変動に対応することができる。
【0043】
利用者アドレス取得部114は、ネットワークNを介してウェブサーバ2から、ウェブサーバ2にアクセスしているユーザUの通信端末Tに割り当てられているIPアドレスを取得する。広告提示部115は、ウェブサーバ2に送信してユーザUの通信端末Tに表示させる広告コンテンツ選択する。
【0044】
ここで、広告提示部115は、利用者アドレス取得部114が取得したIPアドレスがIPアドレスリストに含まれる場合に選択する広告コンテンツと、IPアドレスリストに含まれない場合に選択する広告コンテンツとを変更する。すなわち、広告提示部115は、ユーザUがMVNO利用者か否かによって、通信端末Tに表示させる広告コンテンツを変更する。具体例としては、広告提示部115は、MVNOユーザと推定される利用者の通信端末Tには、MNO以外から販売されているスマートフォンの広告や、MVNOのキャンペーン広告等を表示させる。これにより、例えば広告提示部115は、MVNOのユーザUに対して、MNOへの変更を促す広告を提示することができる。
【0045】
ここで、アドレスリスト取得部112が取得したIPアドレスリストに含まれるIPアドレスが割り当てられた通信端末Tが、必ずしもいつもMVNO推定リストに含まれる通信端末Tとなるとは限らない。
【0046】
例えば、MVNOの利用者が、MVNOとMNOとの両方の通信に用いられる通信端末Tを利用した場合には、MVNO推定リストに含まれない通信端末Tに、MVNOのIPアドレスが割り当てられることになる。あるいは、MVNOの利用者が通信端末TでテザリングをしてPC(Personal Computer)をネットワークNに接続した場合には、PCにMVNOのIPアドレスが割り当てられることになる。
【0047】
そこで、クラスタリング部116は、アクセス情報に含まれる通信端末Tのモデル名MVNO推定リストに含まれる端末のモデル名である割合を示すMVNO割合を一つの軸、アクセス情報に含まれる通信端末TがPCである割合を示すPC割合を別の軸とする空間に、アクセス情報に含まれるIPアドレスをマッピングする。続いて、クラスタリング部116は、空間にマッピングしたIPアドレス群を、既知のクラスタリング手法を用いて複数のクラスタにクラスタリングする。
【0048】
より具体的には、まず、クラスタリング部116は、ある期間における集計対象のアクセス情報の総数Naを取得する。続いて、クラスタリング部116は、集計対象のアクセス情報の中から、PCで用いられるOS名が記載されているアクセス数であるNpを取得する。続いて、集計対象のアクセス情報のうちPCで用いられるOS名が記載されていないアクセス情報のユーザエージェントを解析し、MVNO推定リストに含まれる端末のモデル名が記載されているアクセス数Nmを取得する。最後に、クラスタリング部116は、NpをNaで除算した値を「PC割合」とし、NmをNaで乗算した値を「MVNO割合」として取得する。
【0049】
図5は、実施の形態に係るクラスタリング部116によるクラスタリングの結果を模式的に示す図である。
図5は、横軸がMVNO割合、縦軸がPC割合である両対数グラフである。本願の発明者が実験をしたところ、
図5に示すように、MVNO割合を一つの軸、PC割合を別の軸とする空間にIPアドレスをマッピングすると、4つのクラスタにクラスタリングされた。
【0050】
具体的には、(a)MVNOの利用者が多いIPアドレスのクラスタ(
図5における黒塗りで示すクラスタ)、(b)カフェ等の飲食店等で用いられるIPアドレスのクラスタ(
図5における縦縞で示すクラスタ)、(c)企業や教育機関等で用いられるIPアドレスのクラスタ(
図5における斜線で示すクラスタ)、及び(d)MNOの利用者が多いIPアドレスのクラスタ(
図5における白塗りで示すクラスタ)、の4つのクラスタである。
【0051】
(a)のクラスタに分類されるIPアドレスは、MVNO割合が比較的高く、かつPC割合は0.1未満と比較的低い。このため、(a)のクラスタはMVNOクラスタと考えられる。なお、
図5に図示はしないが、(a)のクラスタに分類されるIPアドレスに紐づけられるISP情報には、MVNO業者の名前が多く含まれる。
【0052】
(b)のクラスタに分類されるIPアドレスは、PCの割合が比較的高く、かつMVNO割合もMVNOクラスタに次いで高い。このため、(b)のクラスタはパブリックWi−Fi(登録商標)のような公衆無線通信クラスタと考えられる。
【0053】
(c)のクラスタに分類されるIPアドレスは、PC割合が高く、MVNO割合は低い。(c)のクラスタに分類されるIPアドレスに紐づけられるISP情報には、企業名や学校法人の名前が多く含まれる。このため、(c)のクラスタは、企業・教育機関クラスタと考えられる。
【0054】
(d)のクラスタに分類されるIPアドレスに紐づけられるISP情報は、MNO業者の名前である。(d)のクラスタに分類されるIPアドレスは、PC割合、MVNO割合がともに低い。このため、(d)のクラスタはMNOクラスタと考えられる。
【0055】
アドレスリスト取得部112は、クラスタリング部116がクラスタリングしたクラスタのうち、クラスタに含まれるIPアドレスのMVNO割合が相対的に高いクラスタ(上述のMVNOクラスタ)のIPアドレスを、IPアドレスリストとして取得してもよい。MVNO推定リストに含まれる通信端末Tに対応付けられたIPアドレスのみを考慮する場合、すなわち
図5におけるMVNO割合のみを考慮する場合と比較して、PC割合も考慮することにより、アドレスリスト取得部112はIPアドレスリストの精度を向上することができる。
【0056】
図5において、実線の楕円で示す領域は、公衆無線通信クラスタとMVNOクラスタとの境界領域Bである。境界領域Bに存在するIPアドレスを、クラスタリング部116が公衆無線通信クラスタ又はMVNOクラスタに正しくクラスタリングできるという保証は必ずしも存在しない。クラスタリング部116が採用するクラスタリングのアルゴリズムによっては、本来公衆無線通信クラスタにクラスタリングすべきIPアドレスをMVNOクラスタにクラスタリングすることもあり得るし、その逆もあり得る。
【0057】
上述したように、MVNOに割り当てられるIPアドレスはしばしば連番となる。すなわち、MVNOクラスタにクラスタリングされたIPアドレス同士は、基本的に他のIPアドレスと似たアドレスとなるはずである。IPアドレス同士の類似度は、あるクラスタにクラスタリングされたIPアドレスが、本来別のクラスタにクラスタリングされるべきか否かを判定するための指標となり得る。この仮定の下、類似度算出部117は、異なるIPアドレス同士の類似度を算出する。
【0058】
図6(a)−(b)は、IPアドレスの類似度を説明するための図である。具体的には、
図6(a)は、3つのIPアドレス(アドレスA、アドレスB、及びアドレスC)について、それぞれ10進数表現と2進数表現とを示す図である。また、
図6(b)は、
図6(a)に示すIPアドレス同士の類似度を、コサイン類似度とユークリッド距離との二つの指標で示す図である。
【0059】
図6(a)に示すように、現在主流のIPv4(Internet Protocol Version 4)のIPアドレスは32ビットである。各ビットを一つの軸とすると、IPアドレスは、32次元空間上の1点として表すこともできる。類似度算出部117は、32次元空間における幾何学量を計算することにより、IPアドレス同士の類似度を算出する。
【0060】
具体的には、類似度算出部117は、32次元空間におけるIPアドレス同士のユークリッド距離を類似度として算出する。例えば、
図6(a)におけるアドレスAとアドレスBとは、2進数表現において2ビット異なる。したがって、アドレスAとアドレスBとのユークリッド距離は2の平方根(1.14142)となる。類似度算出部117は、アドレスAとアドレスBとの類似度を1.4142と算出する。
【0061】
一方、アドレスBとアドレスCとは、32ビットのうち17ビットも異なる。したがって、類似度算出部117は、アドレスAとアドレスBとの類似度を17の平方根(4.1231)と算出する。このように、類似度算出部117が、32次元空間におけるIPアドレス同士のユークリッド距離を類似度として算出する場合、IPアドレスが類似するほど小さな値となる。
【0062】
類似度算出部117は、32次元空間におけるIPアドレス同士のコサイン類似度を、類似度として算出してもよい。これは、類似度算出部117が、32次元空間における原点と各IPアドレスとを結ぶ線分同士がなす角のコサインを類似度とすることに相当する。類似度算出部117がIPアドレスの類似度としてコサイン類似度を採用する場合、類似度の取りうる範囲は−1以上1以下であり、類似するほど大きな値となる。例えば、
図6(a)におけるアドレスAとアドレスBとのコサイン類似度は0.90909であり、アドレスBとアドレスCとのコサイン類似度は0.26112となる。したがって、アドレスBは、アドレスCよりもアドレスAと類似するといえる。
【0063】
アドレス修正部118は、MVNO割合が相対的に高いクラスタであるMVNOクラスタに含まれるIPアドレスの中で、MVNOクラスタに含まれるIPアドレスとの類似度よりも、他のクラスタに含まれるIPアドレスとの類似度の方が高いIPアドレスを、IPアドレスリストから除外する。これにより、例えば
図5に示す境界領域Bに存在するIPアドレスのように、本来公衆無線通信クラスタにクラスタリングされるべきIPアドレスが誤ってMVNOクラスタにクラスタリングされたとしても、アドレス修正部118はそのIPアドレスをMVNOアドレスから除外することができる。結果として、アドレス修正部118は、IPアドレスリストの精度を高めることができる。
【0064】
また、アドレス修正部118は、MVNO割合が相対的に高いクラスタではない他のクラスタに含まれるIPアドレスの中で、そのクラスタに含まれるIPアドレスとの類似度よりも、MVNOクラスタに含まれるIPアドレスとの類似度の方が高いアドレスを、IPアドレスリストに追加してもよい。これにより、例えば
図5に示す境界領域Bに存在するIPアドレスのように、本来MVNOクラスタにクラスタリングされるべきIPアドレスが誤って公衆無線通信クラスタに分類されたとしても、アドレス修正部118はそのIPアドレスをMVNOアドレスに追加することができる。結果として、アドレス修正部118は、IPアドレスリストの精度を高めることができる。
【0065】
<情報処理装置1が実行する情報処理の処理フロー>
図7は、実施の形態に係る情報処理装置1が実行する情報処理の流れを説明するためのフローチャートである。本フローチャートにおける処理は、例えば情報処理装置1が起動したときに開始する。
【0066】
情報取得部110は、ネットワークのアクセスに用いられた通信端末Tのモデル名と、アクセスの際に通信端末Tに割り当てられていたIPアドレスとを含むアクセス情報を格納するデータベース3から、複数のアクセス情報を取得する(S2)。推定リスト取得部111は、通信端末Tのモデル名のリストであって、通信端末TのユーザUがMVNOの利用者とみなすリストであるMVNO推定リストをデータベース3から読み出して取得する(S4)。
【0067】
アドレスリスト取得部112は、複数のアクセス情報に含まれるモデル名を、MVNO推定リストに含まれるモデル名と比較する(S6)。アクセス情報に含まれるモデル名がMVNO推定リストに含まれる場合(S8のYes)、アドレスリスト取得部112は、アクセス情報に含まれるIPアドレスをMVNO利用者のIPアドレスリストに登録する(S10)。反対に、アクセス情報に含まれるモデル名がMVNO推定リストに含まれない場合(S8のNo)、アドレスリスト取得部112は、アクセス情報に含まれるIPアドレスをMVNO利用者のIPアドレスリストに登録しない。
【0068】
アドレスリスト取得部112は、複数のアクセス情報に含まれるモデル名の全てをMVNO推定リストに含まれるモデル名と比較し終えるまでの間(S12のNo)、ステップS6に戻って上記処理を継続する。アドレスリスト取得部112が複数のアクセス情報に含まれるモデル名の全てをMVNO推定リストに含まれるモデル名と比較し終えると(S12のYes)、アドレス出力部113は、IPアドレスリストを出力する(S14)。
【0069】
<実施の形態に係る情報処理装置1が奏する効果>
以上説明したように、実施の形態に係る情報処理装置1によれば、ウェブサーバ2のアクセスに用いられた通信端末Tに割り当てられているIPアドレスが、MVNOの利用者が使用しているIPアドレスであるか否かを推定することができる。
【0070】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の分散・統合の具体的な実施の形態は、以上の実施の形態に限られず、その全部又は一部について、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を合わせ持つ。
【0071】
<変形例>
上記では、アドレス修正部118が、MVNO割合が相対的に高いクラスタではない他のクラスタに含まれるIPアドレスの中で、そのクラスタに含まれるIPアドレスとの類似度よりも、MVNOクラスタに含まれるIPアドレスとの類似度の方が高いアドレスを、IPアドレスリストに追加する場合について説明した。これに加えて、アドレス修正部118は、MVNOクラスタに含まれるIPアドレス群の中で、欠番となっているIPアドレスを、MVNOクラスタに追加してもよい。
【0072】
上述したように、MVNOに割り当てられるIPアドレスは、しばしば連番となる。この仮定を置くと、例えば
図4に示すIPアドレスリストにおいて、はじめの24ビット(12.34.56)を共通とするIPアドレスがMVNOに割り当てられていると推定できる。そうすると、IPアドレス「12.34.56.80」は、IPアドレスリストには存在しないが、その前後の「12.34.56.79」及び「12.34.56.81」はIPアドレスリストに存在するため、アドレス修正部118は「12.34.56.80」をIPアドレスリストに追加する。これにより、アドレス修正部118は、IPアドレスリストの精度をより向上させることができる。