IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ KDDI株式会社の特許一覧

特許7014696端末における起動中アプリケーションを推定する装置、方法及びシステム
<>
  • 特許-端末における起動中アプリケーションを推定する装置、方法及びシステム 図1
  • 特許-端末における起動中アプリケーションを推定する装置、方法及びシステム 図2
  • 特許-端末における起動中アプリケーションを推定する装置、方法及びシステム 図3
  • 特許-端末における起動中アプリケーションを推定する装置、方法及びシステム 図4
  • 特許-端末における起動中アプリケーションを推定する装置、方法及びシステム 図5
  • 特許-端末における起動中アプリケーションを推定する装置、方法及びシステム 図6
  • 特許-端末における起動中アプリケーションを推定する装置、方法及びシステム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-01-24
(45)【発行日】2022-02-01
(54)【発明の名称】端末における起動中アプリケーションを推定する装置、方法及びシステム
(51)【国際特許分類】
   G06F 16/906 20190101AFI20220125BHJP
   H04M 11/00 20060101ALI20220125BHJP
   H04W 48/04 20090101ALI20220125BHJP
【FI】
G06F16/906
H04M11/00 302
H04W48/04
【請求項の数】 7
(21)【出願番号】P 2018210642
(22)【出願日】2018-11-08
(65)【公開番号】P2020077244
(43)【公開日】2020-05-21
【審査請求日】2020-11-18
【早期審査対象出願】
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100135068
【弁理士】
【氏名又は名称】早原 茂樹
(72)【発明者】
【氏名】石塚 宏紀
【審査官】原 秀人
(56)【参考文献】
【文献】国際公開第2016/017086(WO,A1)
【文献】特表2018-504050(JP,A)
【文献】特開2015-065601(JP,A)
【文献】特開2016-224566(JP,A)
【文献】特開2012-217061(JP,A)
【文献】米国特許出願公開第2015/0333986(US,A1)
【文献】特開2016-127359(JP,A)
【文献】沢辺 亜南 外2名,暗号化トラヒック分析を用いたスマートフォンの利用アプリケーション判定,電子情報通信学会技術研究報告,Vol.117 No.351,日本,一般社団法人 電子情報通信学会,2017年12月07日,pp. 1--6
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
H04W 48/02-48/06
H04M 11/00
(57)【特許請求の範囲】
【請求項1】
基地局と無線通信している端末について、起動中アプリケーションを推定する推定装置であって、
学習段階として、無線データリンクの通信ログを説明変数とし、起動中アプリケーション識別子を目的変数とした教師データによって、学習モデルを構築した機械学習エンジンを有し、
推定段階として、
前記端末における無線データリンクのデータパケットが分断された通信ログを連結する通信ログ連結手段を有し、
前記機械学習エンジンは、前記通信ログ連結手段によって連結された通信ログを入力し、前記端末における起動中アプリケーション識別子を出力する
ことを特徴とする推定装置。
【請求項2】
前記無線データリンクの通信ログは、基地局に対する無線トラヒック量及び/又は接続時間である
ことを特徴とする請求項1に記載の推定装置。
【請求項3】
前記無線トラヒック量は、上りトラヒック量及び下りトラヒック量の両方を含む
ことを特徴とする請求項2に記載の推定装置。
【請求項4】
前記通信ログ連結手段は、無線データリンクの通信中断によるデータパケットの分断(MRCS:Multi Records Combined into a Session)について、隣接する通信ログを連結する
ことを特徴とする請求項1から3のいずれか1項に記載の推定装置。
【請求項5】
前記通信ログ連結手段は、端末が捕捉する基地局が変更されたハンドオーバに基づくデータパケットの分断(SSMR:Session Split into Multiple Records)について、隣接する通信ログを連結する
ことを特徴とする請求項1から4のいずれか1項に記載の推定装置。
【請求項6】
基地局と無線通信している端末について、起動中アプリケーションを推定する装置に搭載されたコンピュータを機能させるプログラムであって、
学習段階として、無線データリンクの通信ログを説明変数とし、起動中アプリケーション識別子を目的変数とした教師データによって、学習モデルを構築した機械学習エンジンとして機能させ、
推定段階として、
前記端末における無線データリンクのデータパケットが分断された通信ログを連結する通信ログ連結手段として機能させ、
前記機械学習エンジンは、前記通信ログ連結手段によって連結された通信ログを入力し、前記端末における起動中アプリケーション識別子を出力する
ようにコンピュータを機能させることを特徴とするプログラム。
【請求項7】
基地局と無線通信している端末における、無線データリンクの通信ログを取得した装置における起動中アプリケーション推定方法であって、
前記装置は、
学習段階として、無線データリンクの通信ログを説明変数とし、起動中アプリケーション識別子を目的変数とした教師データによって、学習モデルを構築した機械学習エンジンを有し、
推定段階として、
前記端末における無線データリンクのデータパケットが分断された通信ログを連結する第1のステップと、
前記機械学習エンジンが、第1のステップによって連結された通信ログを入力し、前記端末における起動中アプリケーション識別子を出力する第2のステップと
を実行することを特徴とする装置の起動中アプリケーション推定方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、端末における起動中アプリケーションを推定する技術に関する。
【背景技術】
【0002】
近年、ユーザは、様々なアプリケーションプログラム(AP(Application Program))を、自らのスマートフォンにインストールして利用することができる。
また、高速かつ大容量の通信が可能な無線通信インフラの普及によって、端末におけるデータ通信を伴うアプリケーションの利用も急増している。そのようなアプリケーションとしては、動画・チャット、通話、画像、ゲーム、地図などがある。
データ通信を伴うアプリケーションの利用の増加は、無線通信インフラに対する過負荷や輻輳の要因となる。そのために、無線通信事業者は、多数のユーザのアプリケーションの利用状況を正確に把握し、無線通信インフラへの柔軟な投資が必要となる。
【0003】
このような状況下、多数のユーザが、どのようなアプリケーションをスマートフォンで日常的に利用しているかを計測することは、通信事業者の観点のみならず、マーケティングの観点からも重要な問題となってきている。
【0004】
従来、起動中アプリケーションの推定方式としては、「端末データ活用方式」と、「ネットワークデータ活用方式」とがある。
「端末データ活用方式」は、端末のメモリやCPUなどの制御ログや、各種センサ情報によるコンテキスト抽出結果を用いて、起動中のアプリケーションを推定するものである。
例えば、端末によって取得された位置情報と任意アプリケーションの起動履歴とを保存し、将来的なアプリケーションの起動を推定する技術がある(例えば特許文献1参照)。
また、端末内のシステム情報(CPU、メモリ、Bluetooth(登録商標)、WiFi情報、OS設定、バッテリー情報)やGPS、加速度センサ、通話情報、SMS情報など、あらゆる端末情報を用いて、起動中アプリケーションを推定する技術もある(例えば非特許文献2参照)。この場合、79%~87%程度の推定精度を達成している。
【0005】
「ネットワーク活用方式」は、端末から送信される通信トラフィック量によって推定するものである。具体的には、OSI参照モデルにおけるトランスポート層及びネットワーク層における通信トラフィックを用いて、起動中アプリケーションを推定する。通信インフラ側で収集可能な各端末の通信トラフィックから起動中アプリケーションを推定するため、ユーザ側の端末に負担を欠けることがない。また、通信インフラ事業者は、自通信網と通信する端末における起動中アプリケーションを、網羅的に分析することができる。
例えば、各アプリケーションにおける通信時の宛先IPアドレスと送信パケットのペイロードとを特徴フィンガープリントとして学習し、起動中アプリケーションを推定する技術もある(例えば非特許文献3参照)。
また、起動中アプリケーションの通信時におけるDNS情報と通信トラフィックとを特徴フィンガープリントとして学習し、起動中アプリケーションを推定する技術もある(例えば特許文献2参照)。例えばネットワーク層のデータパケットを対象として、起動中アプリケーションを推定することもできる。
更に、アプリケーション起動時におけるTCPヘッダ情報のみを学習して、アプリケーションを識別する技術もある(例えば非特許文献4参照)。この技術によれば、頻繁に起動されるアプリケーションであれば、推定精度88%を達成し、学習データが数日程度経過した後であっても精度低下がないことが確かめられている。
【先行技術文献】
【特許文献】
【0006】
【文献】特開2005-198345号公報
【文献】特開2015-149695号公報
【非特許文献】
【0007】
【文献】Q. Wang, A. Yahyavi, B. Kemme, and W. He, “I know what you did on your smartphone: Inferring app usage over encrypted data traffic,” 2015 IEEE Conf. Commun. Network Security, CNS 2015, pp. 433?441, 2015.
【文献】Shin, C., Hong, J.-H., and Dey, A. K. Understanding and prediction of mobile application usage for smart phones. In Proc. of UbiComp’12, ACM (2012), 173?182
【文献】S. Dai, A. Tongaonkar, X. Wang, A. Nucci, and D. Song, “NetworkProfiler: Towards automatic fingerprinting of Android apps,” Proc. - IEEE INFOCOM, pp. 809?817, 2013.
【文献】H. F. Alan and J. Kaur, “Can Android Applications Be Identified Using Only TCP/IP Headers of Their Launch Time Traffic?” In Proc. 9th ACM Conf. Secur. Priv. Wirel. Mob. Networks - WiSec ’16, New York, NewYork, USA: ACM Press, 2016, pp. 61-66..
【発明の概要】
【発明が解決しようとする課題】
【0008】
前述した端末データ活用方式によれば、ユーザが所持する端末のデータを収集する必要があるため、ユーザの協力が必要不可欠となる。特に、プライバシ保護や作業負荷の観点から、網羅的な無線通信インフラ上で、起動中アプリケーションを推定することは難しい。
また、前述したネットワークデータ活用方式によれば、自通信網に入出力する日々増加する全てのTCPパケットやIPパケット内をキャプチャして分析する必要があり、膨大な設備投資による導入コストが高いという課題がある。
更に、非特許文献1のように、暗号化されたパケットであっても盗聴可能な技術が登場しているため、同層におけるネットワークデータ活用方式は、プライバシ侵害の危険性を帯びている。
【0009】
そこで、本発明は、無線通信事業者によるデータパケットの分析が低コストで、且つ、プライバシ侵害のリスクを低減した、端末における起動中アプリケーションを推定する装置、プログラム及び方法を提供することを目的とする。
【課題を解決するための手段】
【0010】
本発明によれば、基地局と無線通信している端末について、起動中アプリケーションを推定する推定装置であって、
学習段階として、無線データリンクの通信ログを説明変数とし、起動中アプリケーション識別子を目的変数とした教師データによって、学習モデルを構築した機械学習エンジンを有し、
推定段階として、
端末における無線データリンクのデータパケットが分断された通信ログを連結する通信ログ連結手段を有し、
機械学習エンジンは、通信ログ連結手段によって連結された通信ログを入力し、端末における起動中アプリケーション識別子を出力する
ことを特徴とする。
【0011】
本発明の推定装置における他の実施形態によれば、
無線データリンクの通信ログは、基地局に対する無線トラヒック量及び/又は接続時間であることも好ましい。
【0012】
本発明の推定装置における他の実施形態によれば、
無線トラヒック量は、上りトラヒック量及び下りトラヒック量の両方を含む
ことも好ましい。
【0014】
本発明の推定装置における他の実施形態によれば、
通信ログ連結手段は、無線データリンクの通信中断によるデータパケットの分断(MRCS:Multi Records Combined into a Session)について、隣接する通信ログを連結する
ことも好ましい。
【0015】
本発明の推定装置における他の実施形態によれば、
通信ログ連結手段は、端末が捕捉する基地局が変更されたハンドオーバに基づくデータパケットの分断(SSMR:Session Split into Multiple Records)について、隣接する通信ログを連結する
ことも好ましい。
【0016】
本発明によれば、基地局と無線通信している端末について、起動中アプリケーションを推定する装置に搭載されたコンピュータを機能させるプログラムであって、
学習段階として、無線データリンクの通信ログを説明変数とし、起動中アプリケーション識別子を目的変数とした教師データによって、学習モデルを構築した機械学習エンジンとして機能させ、
推定段階として、
端末における無線データリンクのデータパケットが分断された通信ログを連結する通信ログ連結手段として機能させ、
機械学習エンジンは、通信ログ連結手段によって連結された通信ログを入力し、端末における起動中アプリケーション識別子を出力する
ようにコンピュータを機能させることを特徴とする。
【0017】
本発明によれば、基地局と無線通信している端末における、無線データリンクの通信ログを取得した装置における起動中アプリケーション推定方法であって、
装置は、
学習段階として、無線データリンクの通信ログを説明変数とし、起動中アプリケーション識別子を目的変数とした教師データによって、学習モデルを構築した機械学習エンジンを有し、
推定段階として、
端末における無線データリンクのデータパケットが分断された通信ログを連結する第1のステップと、
機械学習エンジンが、第1のステップによって連結された通信ログを入力し、端末における起動中アプリケーション識別子を出力する第2のステップと
を実行することを特徴とする。
【発明の効果】
【0018】
本発明の推定装置、プログラム及び方法によれば、無線通信事業者によるデータパケットの分析が低コストで、且つ、プライバシ侵害のリスクを低減した、端末における起動中アプリケーションを推定することができる。
【図面の簡単な説明】
【0019】
図1】本発明におけるシステム構成図である。
図2】本発明における機械学習エンジンの学習段階を表す説明図である。
図3】アプリケーション毎の通信ログの特性を表す説明図である。
図4】本発明における機械学習エンジンの推定段階を表す説明図である。
図5】通信ログ連結部の処理を表すフローチャートである。
図6】ドーマントによって分断された無線データリンクのデータパケットの連結を表す説明図である。
図7】ハンドオーバによって分断された無線データリンクのデータパケットの連結を表す説明図である。
【発明を実施するための形態】
【0020】
以下では、本発明の実施の形態について、図面を用いて詳細に説明する。
【0021】
図1は、本発明におけるシステム構成図である。
【0022】
図1のシステムによれば、端末2は、例えばスマートフォンであって、ユーザ所望のアプリケーションをインストールして起動させることができる。また、端末2は、基地局3との間で無線データリンクを確立し、そのアプリケーションの挙動に応じて、基地局3を介してアプリケーションサーバ4と通信する。その際、端末2と基地局3との間では、無線データリンクのデータパケットが送受信される。
【0023】
ここで、端末2は、起動中のアプリケーションに応じて、基地局3との間で送受信する無線データリンクのデータパケットの挙動が異なる。例えばチャットサービスのアプリケーションの場合、少ないトラヒック量のデータパケットが、間欠的に送受信される。一方で、動画サービスのアプリケーションの場合、大きいトラヒック量のデータパケットが、連続的に送受信される。このような無線データリンクの通信ログ(CDRs:Call Detail
Records)は、通信事業者が運用する基地局3によって取得することができる。
【0024】
本発明の推定装置1は、通信事業設備として設置されるものであって、端末2と基地局3との間の無線データリンクの通信ログを、基地局3から受信する。無線データリンクの通信ログを取得するために、端末2に別途のアプリケーションを起動させたり、端末2が自ら、通信ログを推定装置1へ送信する必要もない。
本発明の推定装置1は、端末2と基地局3との間で送受信された無線データリンクの通信ログに基づいて、当該端末2における起動中アプリケーションを推定することができる。特に、無線データリンクの通信ログを用いることによって、無線通信事業者によるデータパケットの分析が低コストで、且つ、プライバシ侵害のリスクを低減することができる。
【0025】
図1によれば、推定装置1は、機械学習エンジン10と、通信ログ連結部11と、端末管理データベース12とを有する。これら機能構成部は、推定装置1に搭載されたコンピュータを機能させるプログラムを実行することによって実現できる。また、これら機能構成部の処理の流れは、端末における起動中アプリケーションの推定方法としても理解できる。
【0026】
[機械学習エンジン10]
機械学習エンジン10は、教師データによって学習モデルを構築したものである。機械学習エンジン10は、起動中アプリケーションの挙動によって発生した無線データリンクの通信ログを特徴量として、機械学習によってその起動中アプリケーションを推定することができる。
【0027】
図2は、本発明における機械学習エンジンの学習段階を表す説明図である。
【0028】
図2によれば、教師データは、以下のようなものである。
説明変数:無線データリンクの通信ログ
目的変数:起動中アプリケーションID
通信ログは、無線データリンクの複数のデータパケットの集合である。具体的には、無線データリンクのデータパケットの「上り無線トラヒック量」「下り無線トラヒック量」「接続時間」(接続開始時刻-接続切断時刻)である。
【0029】
起動中アプリケーションとしては、例えば以下のような種類がある。
動画サービスアプリケーション
チャットサービスアプリケーション
通話サービスアプリケーション
画像サービスアプリケーション
ゲームサービスアプリケーション
地図サービスアプリケーション
【0030】
機械学習エンジン10は、具体的に以下のような分類器である。
サポートベクタマシン:教師あり学習を用いるパターン認識モデルであり、分類や回帰に適用可能な学習アルゴリズムである。
KNN(K Nearest Neighbor):学習データをベクトル空間上にプロットし、未知のデータに対して距離が近い順に任意のK個を取得し、多数決でデータが属するクラスを推定する学習アルゴリズムである。
決定木:ある事項に対する観察結果から、その事項の目標値に関する結論を導く予測モデルである。内部節点は変数に対応し、子節点への枝はその変数の取り得る値を示す。 葉(端点)は、根(root)からの経路によって表される変数値に対して、目的変数の予測値を表す。
ランダムフォレスト(Random Forest):決定木を弱学習器とする集団学習アルゴリズムである。
Naive Bayes:ベイズの定理に基づく教師あり学習アルゴリズムである。
ニューラルネットワーク(neural network):人間の脳神経系のニューロンを数理モデル化した学習アルゴリズムである。
【0031】
図3は、アプリケーション毎の通信ログの特性を表す説明図である。
【0032】
図3によれば、起動中アプリケーションの挙動によって発生した無線データリンクの通信ログを特徴量(上り無線トラヒック量、下り無線トラヒック量、接続時間)を表す。例えばチャットサービスのアプリケーションの場合、上り無線トラヒック量及び下り無線トラヒック量が少なく、接続時間も短い。一方で、例えば動画サービスのアプリケーションの場合、上り無線トラヒック量及び下り無線トラヒック量が多く、接続時間も長い。
【0033】
図4は、本発明における機械学習エンジンの推定段階を表す説明図である。
【0034】
機械学習エンジン10は、端末2における起動中アプリケーションによって発生した無線データリンクにおける連続的な所定数n個の通信ログ(説明変数)を入力する。
そして、機械学習エンジン10は、予め構築した学習モデルを用いて、当該端末2における起動中アプリケーション識別子(目的変数)を出力する。
図4によれば、例えば上り無線トラヒック量及び下り無線トラヒック量が多く、接続時間も長い、無線データリンクの通信ログに対して、動画サービスのアプリケーションIDを出力している。
【0035】
尚、前述した図1によれば、推定装置1は、基地局3から無線データリンクの通信ログを受信するように表しているが、推定装置1内に、端末における起動中アプリケーションによって発生した無線データリンクにおける通信ログを保存したデータベースを、予め蓄積したものであってもよい。
【0036】
[端末管理データベース12]
端末管理データベース12は、機械学習エンジン10によって推定された起動中アプリケーション識別子と、端末とを対応付けて記憶する。
【0037】
[通信ログ連結部11]
通信ログ連結部11は、無線データリンクのデータパケットが分断された通信ログを連結し、連結した通信ログを機械学習エンジン10へ出力する。
【0038】
無線データリンクでは、データパケットについて、以下の2つの分断現象が生じる場合がある。
(1)無線データリンクの通信中断(ドーマント)によるデータパケットの分断(MRCS:Multi Records Combined into a Session)
(2)端末が捕捉する基地局が変更されたハンドオーバによるデータパケットの分断(SSMR:Session Split into Multiple Records)
【0039】
起動中アプリケーションの挙動によって無線データリンクのデータパケットが発生しても、そのデータパケットが無線データリンクの影響によって分断された場合、通信ログから起動中アプリケーションを推定することは難しい。即ち、無線データリンクの通信ログの分断は、正しいアプリケーション単位の通信ログを取得できないために、判定精度の著しい低下を招く。
【0040】
ここで、通信ログ連結部11は、無線データリンクにおける分断現象によって生じた通信ログ同士を連結しながら、機械学習エンジン10へ出力する。これによって、機械学習エンジン10は、通信ログの分断を考慮することなく、起動中アプリケーション識別子を推定することができる。
【0041】
図5は、通信ログ連結部の処理を表すフローチャートである。
【0042】
通信ログ連結部11は、端末2における起動中アプリケーションによって発生した無線データリンクにおける連続的な通信ログ(説明変数)を入力する。
データパケットの分断は、データパケットの通信ログに記録されるRIT(Record Interval Time)の有無によって確認される。RITの発生が認められた場合、MRCS(Multi Records Combined into a Session)で、通信ログを連結する。
【0043】
(S111)通信ログ連結部11は、ドーマントによって分断された無線データリンクのデータパケットの通信ログを連結する。
ここで、通信ログの連結とは、隣接する通信ログ同士における無線トラヒック量や接続時間を加算して、1つの通信ログにマージすることをいう。
【0044】
図6は、ドーマントによって分断された無線データリンクのデータパケットの連結を表す説明図である。
【0045】
図6によれば、最初には、端末2の起動中アプリケーションによって無線データリンクから送信しようとするデータパケットは、そのまま、基地局3へ送信されている。基地局3は、その無線データリンクのデータパケットによって通信ログを生成し、その通信ログを推定装置1へ送信する。
その後、端末2と基地局3との間で発生したドーマントによって、無線データリンクのデータパケットは分断され、分断されたまま、基地局3へ送信されている。基地局3は、分断された無線データリンクのデータパケットによって通信ログを生成し、その通信ログを推定装置1へ送信する。推定装置1は、通信ログからドーマントによるデータパケットの分断を検知し、通信ログを連結する。
【0046】
(S112)通信ログ連結部11は、ハンドオーバによって分断された無線データリンクのデータパケットの通信ログを連結する。
ハンドオーバとは、端末2が捕捉する基地局3が変更されることをいう。
【0047】
図7は、ハンドオーバによって分断された無線データリンクのデータパケットの連結を表す説明図である。
【0048】
図7によれば、最初には、端末2の起動中アプリケーションによって無線データリンクから送信しようとするデータパケットは、そのまま、基地局3へ送信されている。基地局3は、その無線データリンクのデータパケットによって通信ログを生成し、その通信ログを推定装置1へ送信する。
その後、端末2と複数の基地局3との間で発生したハンドオーバによって、無線データリンクのデータパケットは分断され、分断されたまま、各基地局3へ送信されている。各基地局3は、分断された無線データリンクのデータパケットによって通信ログを生成し、その通信ログを推定装置1へ送信する。推定装置1は、通信ログからハンドオーバによるデータパケットの分断を検知し、通信ログを連結する。
【0049】
以上、詳細に説明したように、本発明の推定装置、プログラム及び方法によれば、無線通信事業者によるデータパケットの分析が低コストで、且つ、プライバシ侵害のリスクを低減した、端末における起動中アプリケーションを推定することができる。
【0050】
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
【符号の説明】
【0051】
1 推定装置
10 機械学習エンジン
11 通信ログ連結部
12 端末管理データベース
2 端末
3 基地局
4 アプリケーションサーバ
図1
図2
図3
図4
図5
図6
図7