特許第6618971号(P6618971)IP Force 特許公報掲載プロジェクト 2015.5.11 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧
<>
  • 特許6618971-推定装置、推定方法及びプログラム 図000002
  • 特許6618971-推定装置、推定方法及びプログラム 図000003
  • 特許6618971-推定装置、推定方法及びプログラム 図000004
  • 特許6618971-推定装置、推定方法及びプログラム 図000005
  • 特許6618971-推定装置、推定方法及びプログラム 図000006
  • 特許6618971-推定装置、推定方法及びプログラム 図000007
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6618971
(24)【登録日】2019年11月22日
(45)【発行日】2019年12月11日
(54)【発明の名称】推定装置、推定方法及びプログラム
(51)【国際特許分類】
   G06F 11/34 20060101AFI20191202BHJP
   G06N 20/00 20190101ALI20191202BHJP
【FI】
   G06F11/34 147
   G06N20/00 130
【請求項の数】7
【全頁数】15
(21)【出願番号】特願2017-202490(P2017-202490)
(22)【出願日】2017年10月19日
(65)【公開番号】特開2019-75030(P2019-75030A)
(43)【公開日】2019年5月16日
【審査請求日】2019年1月29日
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100124844
【弁理士】
【氏名又は名称】石原 隆治
(72)【発明者】
【氏名】川口 銀河
【審査官】 多賀 実
(56)【参考文献】
【文献】 特開2017−092661(JP,A)
【文献】 特開2015−012361(JP,A)
【文献】 特開2015−106220(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 11/34
G06N 20/00
H04W 24/08
(57)【特許請求の範囲】
【請求項1】
地域及び時間帯の少なくともいずれか一方が異なる複数回の試行ごとに、webページの表示待ち時間の計測データに基づいて、前記表示待ち時間の品質を示す指標の代表値を算出する算出部と、
前記試行ごとに、当該試行に係る前記代表値について、閾値との比較結果を示す論理値を出力する比較部と、
前記試行ごとに、当該試行に係る地域及び時間帯のそれぞれにおける通信トラフィックの状況を示すパラメータを取得する取得部と、
前記各試行の前記論理値を目的変数とし、前記各試行の前記パラメータを説明変数として推定器を学習させる学習部と、
或る地域及び時間帯における前記パラメータを前記推定器に入力して、前記地域及び時間帯におけるwebページの表示待ち時間の品質を推定する推定部と、
を有することを特徴とする推定装置。
【請求項2】
前記算出部は、前記試行ごとに、複数のwebページのそれぞれの表示待ち時間の計測データに基づいて、前記webページの表示待ち時間の品質を示す指標の代表値を算出する、
ことを特徴とする請求項1記載の推定装置。
【請求項3】
前記比較部は、前記試行ごとに、当該試行に係る前記代表値について、複数の閾値との比較結果を示す論理値群を出力し、
前記学習部は、前記各試行の前記論理値群を目的変数とし、前記各試行の前記パラメータを説明変数として、前記複数の閾値のそれぞれに対応する複数の推定器を学習させ、
前記推定部は、或る地域及び時間帯における前記パラメータを前記複数の閾値のそれぞれに対応する前記推定器に入力して、前記地域及び時間帯におけるwebページの表示待ち時間の品質を推定する、
ことを特徴とする請求項1又は2記載の推定装置。
【請求項4】
前記取得部は、前記時間帯を分割する複数の単位時間ごとに前記パラメータを取得し、単位時間ごとに取得されたパラメータの代表値を算出し、
前記学習部は、前記各試行の前記論理値を目的変数とし、前記各試行の前記パラメータの代表値を説明変数として推定器を学習させる、
ことを特徴とする請求項1乃至3いずれか一項記載の推定装置。
【請求項5】
前記算出部は、前記試行ごとに、前記webページの表示待ち時間の複数の計測データに基づいて、前記webページの表示待ち時間の品質を示す指標の代表値を算出する、
ことを特徴とする請求項1乃至4いずれか一項記載の推定装置。
【請求項6】
地域及び時間帯の少なくともいずれか一方が異なる複数回の試行ごとに、webページの表示待ち時間の計測データに基づいて、前記表示待ち時間の品質を示す指標の代表値を算出する算出手順と、
前記試行ごとに、当該試行に係る前記代表値について、閾値との比較結果を示す論理値を出力する比較手順と、
前記試行ごとに、当該試行に係る地域及び時間帯のそれぞれにおける通信トラフィックの状況を示すパラメータを取得する取得手順と、
前記各試行の前記論理値を目的変数とし、前記各試行の前記パラメータを説明変数として推定器を学習させる学習手順と、
或る地域及び時間帯における前記パラメータを前記推定器に入力して、前記地域及び時間帯におけるwebページの表示待ち時間の品質を推定する推定手順と、
をコンピュータが実行することを特徴とする推定方法。
【請求項7】
請求項1乃至5いずれか一項記載の各部としてコンピュータを機能させることを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、推定装置、推定方法及びプログラムに関する。
【背景技術】
【0002】
インターネットの利用が普及している中で、webブラウザを快適に利用できるかどうかが、ユーザが「インターネットを快適に利用できるか」について大きな位置を占めている。
【0003】
そのため、ユーザがwebページを閲覧する際の表示待ち時間を対象に品質管理することが重要である。
【0004】
また、一般にLTE(Long Term Evolution)に代表されるようなモバイルネットワークでは、混雑状況が、エリア・時間帯で異なるため、エリアごとに利用品質が異なり、また時間帯によっても品質が異なる。
【0005】
エリア・時間帯ごとの品質を把握する方法としては、個別端末から実際にコンテンツアクセスを行い計測する方法(アクティブ計測)がある(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2017−92661号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、各エリア・時間帯でアクティブ計測を行うのは経済的ではない。また、webページ・サーバは千差万別であり、個別のwebページごとに同じネットワークの品質劣化の影響下でも、表示待ち時間への影響に差異等があるため、webページの表示待ち時間の品質(劣化程度)の判断が困難である。
【0008】
本発明は、上記の点に鑑みてなされたものであって、個別のwebページの影響が除去された表示待ち時間の品質の推定を可能とすることを目的とする。
【課題を解決するための手段】
【0009】
そこで上記課題を解決するため、推定装置は、地域及び時間帯の少なくともいずれか一方が異なる複数回の試行ごとに、webページの表示待ち時間の計測データに基づいて、前記表示待ち時間の品質を示す指標の代表値を算出する算出部と、前記試行ごとに、当該試行に係る前記代表値について、閾値との比較結果を示す論理値を出力する比較部と、前記試行ごとに、当該試行に係る地域及び時間帯のそれぞれにおける通信トラフィックの状況を示すパラメータを抽出する抽出部と、前記各試行の前記論理値を目的変数とし、前記各試行の前記パラメータを説明変数として推定器を学習させる学習部と、或る地域及び時間帯における前記パラメータを前記推定器に入力して、前記地域及び時間帯におけるwebページの表示待ち時間の品質を推定する推定部と、を有する。
【発明の効果】
【0010】
個別のwebページの影響が除去された表示待ち時間の品質の推定を可能とすることができる。
【図面の簡単な説明】
【0011】
図1】本発明の実施の形態における推定装置10のハードウェア構成例を示す図である。
図2】本発明の実施の形態における推定装置10の機能構成例を示す図である。
図3】web劣化分析部11が実行する処理手順の一例を説明するためのフローチャートである。
図4】トラフィック情報抽出部12が実行する処理手順の一例を説明するためのフローチャートである。
図5】学習段階において品質推定部13が実行する処理手順の一例を説明するためのフローチャートである。
図6】推定段階において推定装置10が実行する処理手順の一例を説明するためのフローチャートである。
【発明を実施するための形態】
【0012】
以下、図面に基づいて本発明の実施の形態を説明する。図1は、本発明の実施の形態における推定装置10のハードウェア構成例を示す図である。図1の推定装置10は、それぞれバスBで相互に接続されているドライブ装置100、補助記憶装置102、メモリ装置103、CPU104、及びインタ段階装置105等を有するコンピュータである。
【0013】
推定装置10での処理を実現するプログラムは、CD−ROM等の記録媒体101によって提供される。プログラムを記憶した記録媒体101がドライブ装置100にセットされると、プログラムが記録媒体101からドライブ装置100を介して補助記憶装置102にインストールされる。但し、プログラムのインストールは必ずしも記録媒体101より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置102は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。
【0014】
メモリ装置103は、プログラムの起動指示があった場合に、補助記憶装置102からプログラムを読み出して格納する。CPU104は、メモリ装置103に格納されたプログラムに従って推定装置10に係る機能を実行する。インタ段階装置105は、ネットワークに接続するためのインタ段階として用いられる。
【0015】
図2は、本発明の実施の形態における推定装置10の機能構成例を示す図である。図2において、推定装置10は、web劣化分析部11、トラフィック情報抽出部12及び品質推定部13等を有する。これら各部は、推定装置10にインストールされた1以上のプログラムが、CPU104に実行させる処理により実現される。
【0016】
web劣化分析部11は、エリア(地域)及び時間帯の組み合わせによって区別されるZ回の試行のそれぞれごとに、1種類以上(K種類)のwebページ(webコンテンツ)についての端末における表示待ち時間の計測結果の集合である端末計測データD1を分析する。web劣化分析部11は、分析の結果として、表示待ち時間の品質を示す指標の一例である劣化度等を出力する。
【0017】
トラフィック情報抽出部12は、上記各試行のエリア及び時間帯におけるネットワークのトラフィック計測データD2から、通信トラフィックの状況を示すパラメータ等を抽出(取得)する。
【0018】
品質推定部13は、学習段階において、web劣化分析部11のから出力される情報とトラフィック情報抽出部12によって抽出される情報とを1以上推定器に学習させる。品質推定部13は、また、推定段階において、任意のエリア及び時間帯におけるトラフィック計測データD2が入力されると、当該エリア及び時間帯におけるwebページの表示待ち時間の劣化の程度を、1以上の推定器を用いて推定する。
【0019】
推定器は、例えば、SVM(Support Vector Machine)である。但し、数値ベクトルから1つの論理値を推定可能であれば他の推定器が用いられてもよい。
【0020】
端末計測データD1の収集方法の一例について説明する。ここでは、計測対象のwebページのURLとして、URL_1,URL_2...URL_K:(K個の計測対象URL;Kは1以上の任意の自然数(すなわち、1つのURLでもよい。))が設定されているとする。URLは、特定のものに限定されないが、よく利用されるようなwebページを多様な種類を含むのが望ましい。
【0021】
試行ごとに以下が行われる。なお、試行とは、上記したように、計測対象のエリア及び時間帯(期間)の組み合わせによって区別される概念である。したがって、エリア及び時間帯の少なくともいずれか一方が異なると、試行は異なる。
【0022】
(1)1つの試行に対応するエリア・時間帯について、K個の計測対象URLについて、表示待ち時間を、webページを表示可能な端末を用いてP回計測する。すなわち、1回の試行についてP×K回の計測が行われる。但し、全てのURLについて、Pの値は共通でなくてもよい。また、P=1であってもよい。すなわち、各URLについて、必ずしも複数回の計測が行われなくてもよい。当該エリア及び時間帯の代表値を取得するため、同一エリア及び同一時間帯の範囲内で、ある程度異なる場所及び時刻で計測が行われるのが望ましいが、計測パターン(例えば、同一エリア及び同一時間帯で、場所及び時刻をどのように選択するか)は任意でよく、計測手法は、特定のものに限定されない。また、表示待ち時間を取得する方法も特定のものに限定されないが、navigation timing APIを用いてnavigationStartとloadEventEndとの時間差を用いる方法が利用されてもよい。なお、各試行におけるP回の計測は、集計時間幅W内に終了するとする。
【0023】
(2)(1)をZ通りの試行について実行する。
【0024】
(1)及び(2)の実行の結果として取得される端末計測データD1は、以下において、「L(z,y,x)」として表記される計測値(表示待ち時間)の集合である。ここで、L(z,y,x)は、z回目(z:1〜Z)試行のy番目URL(y:1〜K)のx回目(x:1〜P)計測での表示待ち時間を示す。
【0025】
次に、トラフィック計測データD2の収集方法について説明する。こここでは、上記各試行に対応するエリア及び時間帯ごとの通信トラフィックの品質情報を、個別アクティブ計測なしに評価するため、例えば、当該エリア内の全て、又は(サンプリングしている場合は)一部の通信トラフィックを処理するルータ等の装置のモニタ用ポートにDPI(Deep Packet Inspection)装置を接続し、DPI装置を用いてトラフィックを監視することで、トラフィック計測データD2を収集する。したがって、トラフィック計測データD2は、DPI装置によって監視されるトラフィックの履歴情報(ログ)であってもよい。監視対象は、Z回の試行のそれぞれに対応するエリア及び時間帯(時間幅W)のトラフィックとする(但し、表示待ち時間の計測に関するトラフィックに限定されない)。表示待ち時間の計測がモバイル・LTEであれば特定の基地局(eNB)又は特定のセクタ(ECI)におけるトラフィックが監視対象とされ、固定網であれば特定の収容ルータ等におけるトラフィックが監視対象とされるが、これらの基地局、セクタ、又は収容ルータ等の特定方法は、所定のものに限定されない。網上流でモニタ出来る権限を持つものは当然に把握できているものとする。
【0026】
以下、推定装置10が実行する処理手順について説明する。図3は、web劣化分析部11が実行する処理手順の一例を説明するためのフローチャートである。
【0027】
ステップS101において、web劣化分析部11は、K個のURLのそれぞれについて、表示待ち時間に関する基準値を算出する。例えば、或るURLに対する基準値であれば、当該URLに係るZ×P個の計測値の中央値、10%値、最小値等が、基準値とされてもよい。又は、基準値は、推定装置10のユーザによって事前に設定されてもよい。以下、URL_1,URL_2...URL_Kに対する基準値を、Wb_1,Wb_2,..Wb_Kとする。この場合、中央値を基準値とするのであれば、Wb_1の基準値は以下の通りである。
Wb_1=(L(z,1,x)の表示待ち時間の集合の中央値)
続いて、web劣化分析部11は、Z回の試行ごとに、K個の各URLに対する「劣化度(Dw(z,y,x)」を以下のように算出する(S102)。
Dw(z,y,x)=L(z,y,x)/Wb_y
すなわち、劣化度Dw(z,y,x)は、基準値に対する計測値の割合であり、本実施の形態において、webページの表示待ち時間の品質(劣化の程度)を示す指標の一例である。なお、webページの表示待ち時間の品質を把握可能な方法であれば、他の方法によって劣化度Dw(z,y,x)が算出されてもよい。
【0028】
続いて、web劣化分析部11は、Z回の試行ごとに、「劣化度代表値(D_z)」を算出する(S103)。
【0029】
具体的には、web劣化分析部11は、D_z=(Dw(i,j,l)のうち,iがzに固定され、j及びlは、それぞれが取りうる全ての値である集合(すなわち、P×K個の要素を含む集合)を、全てのzについて取り出し、各集合のそれぞれのd_th分位点(quantile)の値)を算出する。d_thは、分位点で与える劣化閾値であり、予め設定される。例えば、d_thが、0.8(すなわち、80パーセンタイル)であれば、Dw(z,j,l)の集合の80%値(80パーセンタイル)が算出される。なお、K=1であり、かつ、P=1である場合、劣化度代表値(D_z)=劣化度(Dw(z,1,1)とされてもよい。
【0030】
続いて、web劣化分析部11は、Z回の試行ごとに「劣化度論理値(Db_(z,s))」を算出する(S104)。ここで、sは、D_zに対する劣化判定閾値劣化判定閾値に対する変数であり、本実施の形態では、予め、(−m,−(m−1),...,−1,0,1,2,...n−1,n)のm+n+1個だけ、多段階のTsh_sが設定される。すなわち、m及びnは、劣化判定閾値Tsh_sの数(段階数)を規定するパラメータであり、予め設定される。なお、n=mでもよいし、n≠mでもよい。また、推定器を1つのみ用いる場合には、m=n=0でよい(すなわち、Tsh_sは1つでよい)。
【0031】
したがって、1回の試行に関して以下のように算出されるDb_(z,s)の個数は、m+n+1個である。
Db_(z,s)=bool(D_z>Tsh_s)
すなわち、各試行について、劣化判定閾値Tsh_sごとに、D_zと当該劣化判定閾値Tsh_sとが比較され、比較結果を示す論理値が、Db_(z,s)に代入される。
【0032】
Db_(z,s)は、真であれば「劣化」、偽であれば「非劣化」を表す論理値群であり、閾値の違い(sごと)で、異なる強度の劣化を表している。なお、劣化度代表値D_zは、s(閾値の種類)に非依存であり、劣化判定閾値Tsh_sは試行(z)に非依存)である。
【0033】
続いて、トラフィック情報抽出部12が実行する処理手順について説明する。図4は、トラフィック情報抽出部12が実行する処理手順の一例を説明するためのフローチャートである。
【0034】
ステップS201において、トラフィック情報抽出部12は、変数iに1を代入する。変数iは、図4の説明において、各試行を識別するための変数である。以下、i番目の試行を「試行i」という。
【0035】
続いて、トラフィック情報抽出部12は、トラフィック計測データD2から、試行iに対応するログデータを取得する(S202)。具体的には、試行iに対応するエリア及び時間帯(集計時間幅W)に対応するログデータが取得される。以下、取得されたログデータに係る通信トラフィックを「対象トラフィック」という。試行iに対応するエリアは、エリアが基地局単位又はセクタ単位であり、ログデータにeNBのIPアドレス又はCIDが付与されている場合には、試行iに対応するエリアのeNBのIPアドレスに基づいて、又は当該エリアのセクタのCIDに基づいて、対象トラフィックのログデータを絞り込むことができる。一方、eNBのIPアドレス又はCIDがログデータに付与されていない場合、試行iに対応するエリアのモニタ用ポートで観測できる範囲が、試行iに対応するエリアに関するログデータとなる。
【0036】
続くステップS203〜S207において、トラフィック情報抽出部12は、対象トラフィックに係るログデータから、試行iに係る通信トラフィックの状況を示すパラメータを抽出する。
【0037】
ステップS203において、トラフィック情報抽出部12は、対象トラフィックの特定のポート番号に係る時間内スループット及び総転送量に基づいて、以下のステップS203−1〜S203−3を実行することにより、試行iに関する低スループットの代表値を算出する。
【0038】
ステップS203−1において、トラフィック情報抽出部12は、対象トラフィックから、以下の(1)及び(2)の条件を満たすTCPフローを抽出する。
(1)TCPポートがthpt_portであること。ここで、thpt_portは、事前設定されるパラメータの一つであり、集計対象のTCPスループットのポート番号を示す。本実施の形態において、thpt_portの値は「80」である。
(2)更に、事前設定パラメータとして、th_thpt_L及びth_thpt_Uが設定されていれば、(1)に該当するTCPフローのうち、総転送量がth_thpt_L以上かつth_thpt_U以下のTCPフローであること。ここで、th_thpt_Lは、抽出対象の下限フローサイズであり、th_thpt_Uは、抽出対象の上限フローサイズを示す。なお、th_thpt_L及びth_thpt_Uのいずれについても、0が設定された場合には、(2)の条件は無効とされる。
【0039】
ステップS203−2において、トラフィック情報抽出部12は、試行iの時間帯(集計時間幅W)を分割(細分化)する集計単位時間τごとに、抽出されたTCPフローごとのスループット値(時間内転送量/τ)を集計し、当該スループット値の集合のthpt_p1分位点の値を算出する。
【0040】
ここで、thpt_p1及び以下のthpt_p2は、事前設定パラメータの一つであり、分位点(パーセンタイル)によって指定される、スループット値の抽出閾値である。したがって、例えば、thpt_p1が0.2の場合、集計されたスループット値の集合の20パーセンタイルが算出される。また、τも、事前設定パラメータの一つであり、W=τ*κとする(κは整数)。したがって、ステップS203−2は、κ回繰り返され、κ個のthpt_p1分位点の値の組が得られる。
【0041】
ステップS203−3において、トラフィック情報抽出部12は、κ個の値の組におけるthpt_p2(例えば、0.2等)分位点の値を算出する。ステップS203−3にて算出されたthpt_p2分位点の値が、スループットの代表値(以下、「Th1_z」という(zは1..Z)。)である。
【0042】
ステップS203に続いて、トラフィック情報抽出部12は、対象トラフィック内のTCPフローのack応答等から計算したRTTサンプルに基づいて、以下のステップS204−1〜S204−3を実行することにより、試行iに関する高RTTの代表値を算出する(S204)。なお、TCPのパケット列からRTT(Round Trip Time)を算出する方法は、所定のものに限定されない。既存の方法の一例として、パケット分析ツールwiresharkにおいてtcp.analysis.ack_rttで読み取る方法が挙げられる。
【0043】
ステップS204−1において、トラフィック情報抽出部12は、試行iの集計単位時間τごとに、対象トラフィックに対するRTTデータ群を抽出する。
【0044】
ステップS204−2において、トラフィック情報抽出部12は、試行iの集計単位時間τごとに、抽出されたRTTデータ群のrtt_p1分位点の値を算出する。なお、ステップS204−1では、κ個のRTTデータ群が抽出されている。したがって、ステップS204−2では、κ個のrtt_p1分位点の値の組が算出される。なお、rtt_p1及び以下のthpt_p2は、事前設定パラメータの一つであり、スループット抽出閾値を分位点(例えば、0.1,0.2等)で指定する値である。
【0045】
ステップS204−3において、トラフィック情報抽出部12は、κ個のrtt_p1分位点の値のrtt_p2分位点の値を算出する。ステップS204−3で算出されたrtt_p2分位点の値が、高RTTの代表値(以下、「Rtt1_z」という(zは1..Z)。)である。
【0046】
ステップS204に続いて、トラフィック情報抽出部12は、対象トラフィック内のTCPフローの解析から計算したτごとのTCP再送発生比率(TCPパケット中の再送パケットの比率)に基づいて、以下のステップS205−1〜S205−2を実行することにより、試行iに関する再送率の代表値を算出する(S205)。なお、TCPのパケット列から再送を検出する方法は、所定のものに限定されない。既存の方法の一例として、パケット分析ツールwiresharkにおいてtcp.analysis.retransmission等のパラメータから評価する方法が挙げられる。
【0047】
ステップS205−1において、トラフィック情報抽出部12は、集計単位時間τごとに、対象トラフィックに対しての再送率を抽出する。したがって、κ個の再送率の値の組が得られる。
【0048】
ステップS205−2において、トラフィック情報抽出部12は、κ個の再送率のret_p分位点の値を算出する。なお、ret_pは、事前設定パラメータの一つであり、再送率抽出閾値を分位点(例えば、0.9,0.8等)で指定する値である。このret_p分位点の値が再送率の代表値(以下、「Ret1_z」という(zは1..Z)。)である。
【0049】
ステップS205に続いて、トラフィック情報抽出部12は、以下のステップS206−1〜S206−3を実行することにより、DNS応答時間の代表値を算出する(S206)。DNS応答時間とは、対象トラフィック内のDNS検索の解析から計算したDNS検索からDNS応答までの時間である。
【0050】
ステップS206−1において、トラフィック情報抽出部12は、試行iの集計単位時間τごとに、対象トラフィックに対してのDNS−RTTデータ集合を抽出する。
【0051】
ステップS206−2において、トラフィック情報抽出部12は、試行iの集計単位時間τごとに、抽出されたDNS−RTTデータ集合について、dnst_p1分位点の値を算出する。なお、ステップS206−1では、κ個のDNS−RTTデータ集合が抽出されている。したがって、ステップS206−2では、κ個のdnst_p1分位点の値の組が算出される。なお、dnst_p1及び以下のdnst_p2は、事前設定パラメータの一つであり、DNS応答時間抽出閾値を分位点(例えば、0.9,0.8等)で指定する値である。
【0052】
ステップS206−3において、トラフィック情報抽出部12は、κ個のdnst_p1分位点の値のdnst_p2分位点の値を算出する。このdnst_p2分位点の値が、DNS応答時間(DNS−RTT)の代表値(以下、「Drt1_z」という(zは1..Z)。)である。
【0053】
ステップS206に続いて、トラフィック情報抽出部12は、以下のステップS207−1〜S207−3を実行することにより、DNS応答率の代表値を算出する(S207)。DNS応答率とは、モニタ対象トラフィック内のDNS検索の解析から計算したDNS検索に対し応答が有った比率である。
【0054】
ステップS207−1において、トラフィック情報抽出部12は、試行iの集計単位時間τごとに、対象トラフィックに対してのDNS検索数と当該検索に対するDNS応答の数とを抽出する。なお、応答は、τより後の時間になる場合もあるため、dns_timeout経過時までを集計対象とする。dns_timeoutは、事前設定パラメータの一つであり、DNS応答率算出時のタイムアウト時間である。
【0055】
ステップS207−2において、トラフィック情報抽出部12は、試行iの集計単位時間τごとに、応答率(DNS応答数/DNS検索数)を算出する。検索数が0のτについては値なしとする。なお、ステップS207−2では、κ個の応答率が算出される。したがって、κ個の応答率の組が得られる。
【0056】
ステップS207−3において、トラフィック情報抽出部12は、κ個の応答率の組から「値なし」のものがあれば除外し、κ個(除外してκ未満のこともある)の値のdnsr_p分位点の値を算出する。dnsr_pは、事前設定パラメータの一つであり、DNS応答率抽出閾値を分位点(例えば、0.2等)で指定する値である。このdnsr_p分位点の値が、DNS応答率の代表値(以下、「Drp1_z」という(zは1..Z)。)である。
【0057】
ステップS202〜S207は、Z回の全ての試行について実行される(S208、S209)。その結果、スループット代表値Th1として、以下のようなベクトルが得られる。
Th1=(Th_1,Th1_2,Th1_3…Th1_z)
なお、thpt_p1,thpt_p2の組が、複数設定されてもよい。その場合、当該組毎に、Th2_z,Th3_z等のベクトルが得られる。
【0058】
また、高RTT代表値Rtt1として、以下のようなベクトルが得られる。
Rtt1=(Rtt1_1,Rtt1_2,…Rtt1_z)
なお、rtt_p1,rtt_p2の組が、複数設定されてもよい。その場合、当該組ごとに、Rtt2_z,Rtt3_z等のベクトルが得られる。
【0059】
また、再送率代表値Ret1として、以下のようなベクトルが得られる。
Ret1=(Ret1_1,Ret1_2,…Ret1_z)
なお、ret_pについて、複数の値が設定されてもよい。その場合、当該値ごとに、Ret2_z,Ret3_z等のベクトルが得られる。
【0060】
また、DNS応答時間代表値Drt1として、以下のようなベクトルが得られる。
Drt1=(Drt1_1,Drt1_2,…Drt1_z)
なお、dnst_p1、dnst_p2の組が複数設定されてもよい。その場合、当該組ごとに、Drt2_z,Drt3_z等のベクトルが得られる。
【0061】
更に、DNS応答率Drp1として、以下のようなベクトルが得られる。
Drp1=(Drp1_1,Drp1_2,…Drp1_z)
なお、dnsr_pについて、複数の値が設定されてもよい。その場合、当該値ごとに、Drp2_z、Drp3_z等のベクトルが得られる。
【0062】
続いて、トラフィック情報抽出部12は、それぞれが長さZの上記各代表値のベクトルを組(行列)として、以下のDPIvecを出力する(S210)。
DPIvec=(Th1(,Th2,Th3..),Rtt1(,Rtt2,Rtt3..),Ret1(,Ret2,Ret3..),Drt1(,Drt2,Drt3),Drp1(,Drp2,Drp3..))
なお、(,Th2,Th3..)、(,Rtt2,Rtt3..)、(,Ret2,Ret3..)、(,Drt2,Drt3)及び(,Drp2,Drp3..)は、事前設定パラメータとしての閾値(分位点)の組の数によって、構成するベクトルの数が変化することを示す。
【0063】
続いて、学習段階において品質推定部13が実行する処理手順について説明する。図5は、学習段階において品質推定部13が実行する処理手順の一例を説明するためのフローチャートである。
【0064】
ステップS301において、品質推定部13は、web劣化分析部11によって算出された、m+n+1個の長さZの以下の論理値ベクトルである劣化度論理値Db_(z,s)を入力する。
Db_(z,s)=(Db_(z,−m),Db_(z,−m+1),…Db_(z,n−1),Db_(z,n))
なお、Db_(z,s)は、sを固定すると要素数Z個のベクトルである。sはm+n+1個の値を取るので、Db_(z,s)は、m+n+1個のZ個のベクトルを要素とするベクトルとなる。
【0065】
続いて、品質推定部13は、トラフィック情報抽出部12によって出力された、以下の代表値のベクトルの組(行列)を入力する(S302)。
DPIvec=(Th1(,Th2,Th3..),Rtt1(,Rtt2,Rtt3..),Ret1(,Ret2,Ret3..),Drt1(,Drt2,Drt3),Drp1(,Drp2,Drp3..))
続いて、品質推定部13は、m+n+1個(すなわち、1以上)の推定器のインスタンスを生成する(S303)。すなわち、劣化判定閾値Tsh_sの数と同数の(劣化判定閾値Tsh_sごとの)推定器が用意される。各推定器を「S_s」と表記する。ここで、sは、m+n+1種類のTsh_sに対応する。
【0066】
続いて、品質推定部13は、Db_(z,s)を目的変数とし、DPIvecを説明変数として、各S_sを学習させる(S304)。なお、各S_sは、sが共通するDb_(z,s)について学習を行う。これでS_sは学習済みとなり、webページの表示待ち時間の品質の推定に用いることが可能な状態となる。
【0067】
続いて、推定段階において推定装置10が実行する処理手順について説明する。図6は、推定段階において推定装置10が実行する処理手順の一例を説明するためのフローチャートである。
【0068】
図6の処理手順の前提として、推定対象のエリア及び時間帯に対応するトラフィック計測データD2(例えば、DPIのログデータ)が収集されているとする。当該トラフィック計測データD2を、以下「推定対象計測データ」という。なお、webページの表示待ち時間の計測は不要である。当該表示待ち時間の劣化の度合いが目的変数(推定対象)だからである。
【0069】
ステップS401において、トラフィック情報抽出部12は、推定対象計測データを入力する。続くステップS402〜S406において、トラフィック情報抽出部12は、図4のステップS203〜S207と同様の処理を実行して、推定対象計測データから各代表値を算出(抽出)する。但し、推定対象のエリア及び時間帯は1つであるため、Z=1である。
【0070】
その結果、トラフィック情報抽出部12は、図5のステップS210と同様に、長さZ=1である、DPIvecと同じ形式の行列を得る。以下、当該行列を「DPIvec_new」という。
【0071】
続いて、品質推定部13は、以下のように、各S_s(各推定器)に対してDPIvec_newを入力することで、各劣化判定閾値Tsh_sに応じた、劣化か否かの論理値の組(ベクトル)であるEst_sを得る(S407)
(複数のsに対し)Est_s=S_s(DPIvec_new)
なお、Est_sは、m+n+1の長さの論理値の組(ベクトル)となる。
【0072】
典型的には、Tsh_sの値が最大のsについて真(劣化)であり、Tsh_sが順に小さくなるようsを変えていくと、或るsがθであるときに偽(非劣化)となり、それ以下のTsh_sでは全部偽(非劣化)というパターンとなる(但し、全部偽、全部真、又は順番が壊れていることも起こりうる。)。
【0073】
品質推定部13は、Est_sからこのようなθを探索し、探索されたθに対応したTsh_θを「推定された劣化度」(推定対象のエリア及び時間帯に対する劣化度の推定値)として出力する(S409)。具体的には、例えば、全部偽(非劣化)であれば、品質推定部13は、「非劣化」と出力する。この場合、(最少の)Tsh_s未満の劣化となる。また、全部真(劣化)であれば、品質推定部13は、「(最大の)Tsh_s以上」を出力する。また、全部偽でなく、かつ、全部真でない場合、偽と真とが、或るTsh_sを境に区分されていない場合でも、品質推定部13は、Tsh_sが大きい側から順に値を確認し、最初に偽となったTsh_θを使い「Tsh_θ以上」を出力する。このTsh_θは(個別のwebページのみには依存しない)webページの表示待ち時間の劣化発生の度合の推定結果である。
【0074】
なお、本実施の形態では、通信トラフィックの状況を示すパラメータを抽出するパラメータの一例として、低スループット代表値、高RTT代表値、再送率代表値、DNS応答時間代表値、及びDNS応答率代表値を用いる例を説明したが、必ずしもこれら全部が用いられなくてもよく、これらの一部(例えば、いずれか一つ)が用いられてもよい。また、通信トラフィックの状況を把握可能なパラメータであれば、これら以外のパラメータが用いられてもよい。
【0075】
上述したように、本実施の形態によれば、webページの表示待ち時間の計測値と、当該表示待ち時間の計測のエリア及び時間帯に対応する通信トラフィックに関する情報との関係を推定器に学習させ、推定したい未知データの通信トラフィックに関する情報を当該推定器に入力することで(個別ページのみには依存しない)webページの待ち時間の劣化の程度を推定することができる。したがって、本実施の形態によれば、個別のwebページの影響が除去された表示待ち時間の品質の推定を可能とすることができる。
【0076】
また、本実施の形態では、複数のwebページ・サーバを学習に用い、また「webページの表示待ち時間の劣化」という一般的特性を(ネットワーク起因でなくwebページ側の理由等で)一部だけ劣化するものの影響を除外して抽出するために、webページごとの基準で正規化した「劣化度」の考え方、及び複数の計測データの分位点によりデータを抽出する手法を用いることで、個別webページ毎の待ち時間の差を吸収してwebページの待ち時間の劣化を捉える。したがって、webページ・サーバが千差万別であり、同じ時間・場所で利用していても個々のページにより待ち時間は異なるといった問題を解消することができる。
【0077】
また、本実施の形態では、パッシブ計測データ(ユーザ・通信相手・目的もバラバラの通信データ解析ログ(DPIのログ))の内容の不安定性に対し、(表示待ち時間の劣化時に対応するログも劣化しているなど)劣化情報と対応性が良く、極端な異常値に左右されにくいトラフィックデータの分位点を抽出することで、平均値等を抽出する場合と比較して、斯かる不安定性に適切に対応することができる。
【0078】
また、同じNW劣化影響下でも個別webページごとに表示待ち時間の劣化への影響の出方が異なるが、本実施の形態では、複数の対象webページを一括して扱い、その統計量で評価することで「典型的な劣化影響の出方」として定量化することが出来る。また、一般に劣化判定は二値(論理値)で行う。本実施の形態でも論理値の推定器を用いるが、本実施の形態では「劣化度」として定量的な値を用いるため、学習時の論理値ベクトルに変換する際に(複数の劣化レベルに対応した)複数用意し、それぞれ異なるレベルの推定器を用意することで、劣化度合いの判定も併せて実現することができる
なお、本実施の形態において、web劣化分析部11は、算出部及び比較部の一例である。トラフィック情報抽出部12は、取得部の一例である。品質推定部13は、学習部及び推定部の一例である。
【0079】
以上、本発明の実施の形態について詳述したが、本発明は斯かる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
【符号の説明】
【0080】
10 推定装置
11 web劣化分析部
12 トラフィック情報抽出部
13 品質推定部
100 ドライブ装置
101 記録媒体
102 補助記憶装置
103 メモリ装置
104 CPU
105 インタ段階装置
B バス
図1
図2
図3
図4
図5
図6