IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許7501611SNS分析システム、SNS分析方法、及び、SNS分析プログラム
<>
  • 特許-SNS分析システム、SNS分析方法、及び、SNS分析プログラム 図1
  • 特許-SNS分析システム、SNS分析方法、及び、SNS分析プログラム 図2
  • 特許-SNS分析システム、SNS分析方法、及び、SNS分析プログラム 図3
  • 特許-SNS分析システム、SNS分析方法、及び、SNS分析プログラム 図4
  • 特許-SNS分析システム、SNS分析方法、及び、SNS分析プログラム 図5
  • 特許-SNS分析システム、SNS分析方法、及び、SNS分析プログラム 図6
  • 特許-SNS分析システム、SNS分析方法、及び、SNS分析プログラム 図7
  • 特許-SNS分析システム、SNS分析方法、及び、SNS分析プログラム 図8
  • 特許-SNS分析システム、SNS分析方法、及び、SNS分析プログラム 図9
  • 特許-SNS分析システム、SNS分析方法、及び、SNS分析プログラム 図10
  • 特許-SNS分析システム、SNS分析方法、及び、SNS分析プログラム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-10
(45)【発行日】2024-06-18
(54)【発明の名称】SNS分析システム、SNS分析方法、及び、SNS分析プログラム
(51)【国際特許分類】
   H04M 11/00 20060101AFI20240611BHJP
【FI】
H04M11/00 301
【請求項の数】 10
(21)【出願番号】P 2022510337
(86)(22)【出願日】2020-03-27
(86)【国際出願番号】 JP2020014061
(87)【国際公開番号】W WO2021192235
(87)【国際公開日】2021-09-30
【審査請求日】2023-02-15
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100109313
【弁理士】
【氏名又は名称】机 昌彦
(74)【代理人】
【識別番号】100149618
【弁理士】
【氏名又は名称】北嶋 啓至
(72)【発明者】
【氏名】外川 遼介
【審査官】山中 実
(56)【参考文献】
【文献】特開2018-61215(JP,A)
【文献】特開2018-60481(JP,A)
【文献】特開2018-61216(JP,A)
【文献】特開2010-165097(JP,A)
【文献】特表2017-510007(JP,A)
【文献】特開2019-164699(JP,A)
【文献】米国特許出願公開第2014/0149583(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04M 11/00
(57)【特許請求の範囲】
【請求項1】
第1の複数の人物に関する通信履歴情報及び属性情報と前記第1の複数の人物の間に存在する関係の有無との関係を表す推定モデルと、第2の複数の人物に関する前記通信履歴情報及び前記属性情報と、に基づいて、前記第2の複数の人物の間における未知の関係の存在を推定する推定手段を備え、
前記通信履歴情報は、前記第1あるいは第2の複数の人物の間におけるSNSを介した情報の授受、及び、前記第1あるいは第2の複数の人物によるSNSを介した互いに関連する情報の発信の、少なくともいずれかの時系列変化を表し、
前記属性情報は、前記第1あるいは第2の複数の人物の属性の時系列変化を表す、
SNS分析システム。
【請求項2】
前記第2の複数の人物の間における未知の関係の存在の推定理由を表示するよう表示装置を制御する表示制御手段をさらに備える、
請求項1に記載のSNS分析システム。
【請求項3】
前記通信履歴情報を表すグラフを生成するグラフ生成手段をさらに備える、
請求項2に記載のSNS分析システム。
【請求項4】
前記グラフは、前記第1あるいは第2の複数の人物を表すノードと、前記第1あるいは第2の複数の人物の間におけるSNSを介した関係を表すエッジとを含む、
請求項に記載のSNS分析システム。
【請求項5】
所定の期間における前記第1の複数の人物に関する通信履歴情報及び属性情報と、前記所定の期間の後に判明した、前記所定の期間においては未知であった前記第1の複数の人物の間に存在する関係の有無とに基づいて、前記推定モデルを生成するモデル生成手段をさらに備える、
請求項に記載のSNS分析システム。
【請求項6】
前記モデル生成手段は、前記所定の期間においては未知であった前記第1の複数の人物の間に存在する関係の有無がラベルとして付与された前記グラフから、所定のアルゴリズムを用いて、前記第1の複数の人物の間におけるSNSを介した関係の時系列変化の特徴を抽出したのち、その抽出結果に基づいて、前記第1の複数の人物の間における未知の関係の存在の説明変数を決定することによって、前記説明変数を含む前記推定モデルを生成する、
請求項に記載のSNS分析システム。
【請求項7】
前記モデル生成手段は、複数の前記説明変数の個々に対して、前記未知の関係の存在の推定における重要度を決定し、
前記推定手段は、前記重要度に基づいて、前記未知の関係の存在を推定する、
請求項6に記載のSNS分析システム。
【請求項8】
前記表示制御手段は、前記重要度の順に前記説明変数の名称を並べて表示するとともに、前記説明変数の値を表示する態様で前記推定理由を表示するように、前記表示装置を制御する、
請求項7に記載のSNS分析システム。
【請求項9】
情報処理システムによって、
第1の複数の人物に関する通信履歴情報及び属性情報と前記第1の複数の人物の間に存在する関係の有無との関係を表す推定モデルと、第2の複数の人物に関する前記通信履歴情報及び前記属性情報と、に基づいて、前記第2の複数の人物の間における未知の関係の存在を推定する方法であって、
前記通信履歴情報は、前記第1あるいは第2の複数の人物の間におけるSNSを介した情報の授受、及び、前記第1あるいは第2の複数の人物によるSNSを介した互いに関連する情報の発信の、少なくともいずれかの時系列変化を表し、
前記属性情報は、前記第1あるいは第2の複数の人物の属性の時系列変化を表す、
SNS分析方法。
【請求項10】
第1の複数の人物に関する通信履歴情報及び属性情報と前記第1の複数の人物の間に存在する関係の有無との関係を表す推定モデルと、第2の複数の人物に関する前記通信履歴情報及び前記属性情報と、に基づいて、前記第2の複数の人物の間における未知の関係の存在を推定する推定処理をコンピュータに実行させるためのプログラムであって、
前記通信履歴情報は、前記第1あるいは第2の複数の人物の間におけるSNSを介した情報の授受、及び、前記第1あるいは第2の複数の人物によるSNSを介した互いに関連する情報の発信の、少なくともいずれかの時系列変化を表し、
前記属性情報は、前記第1あるいは第2の複数の人物の属性の時系列変化を表す、
SNS分析プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、SNS分析システム、SNS分析装置、SNS分析方法、及び、SNS分析プログラムが格納された記録媒体に関する。
【背景技術】
【0002】
テロなどの犯罪の発生を事前に予測し、その発生を未然に防止することは、安全な社会を構築する上で非常に重要である。したがって、犯罪の発生を事前に予測するための技術が期待されている。
【0003】
このような技術に関連する技術として、特許文献1には、事件に関する犯罪関連情報を収集する犯罪予測サーバと、犯罪関連情報を表示する表示部を有するセンター装置とが接続されたシステムが開示されている。このシステムにおける犯罪予測サーバは、SNS(Social Networking Service)サーバにアクセスし、一般市民の投稿情報の中から犯罪関連語を含む投稿情報を犯罪関連情報として収集する。犯罪予測サーバは、犯罪関連情報について、犯罪の発生地点、発生時刻、犯罪種別を含む属性毎に統計データを算出し、センター装置からの要求に応じて、犯罪関連情報の統計データから抽出した犯罪データと地図データとを送信する。そして、このシステムにおけるセンター装置は、表示部において、属性毎の犯罪データを地図データに重畳して、地図上の犯罪発生地点に対応する位置に犯罪データをプロットして表示する。
【0004】
また、特許文献2には、犯罪データ及び気象データを格納し、予測された気象条件と犯罪データとの間の相互関係に基づいて、過去の犯罪率を調整することによって、犯罪予測を決定するシステムが開示されている。このシステムは、更に、イベントデータを格納し、未来のイベントと犯罪データとの間の相互関係に基づいて、過去の犯罪率を更に調整することによって、犯罪予測を決定する。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2018-061216号公報
【文献】特表2018-505474号公報
【非特許文献】
【0006】
【文献】Lu Wang, Wenchao Yu, Wei Wang, Wei Cheng, Wei Zhang, Hongyuan Zha, Xiaofeng He, Haifeng Chen, ”Learning Robust Representations with Graph Denoising Policy Network ”, arXiv:1910.01784, October 4, 2019
【文献】Dongkuan Xu, Wei Cheng, Dongsheng Luo, Xiao Liu, Xiang Zhang, ”Spatio-Temporal Attentive RNN for Node Classification in Temporal Attributed Graphs”, Twenty-Eighth International Joint Conference on Artificial Intelligence Main track, Pages 3947-3953, August 11-12, 2019
【文献】Wenchao Yu, Wei Cheng, Charu Aggarwal, Kai Zhang, Haifeng Chen, Wei Wang, ” NetWalk: A Flexible Deep Embedding Approach for Anomaly Detection in Dynamic Networks”, KDD 2018, August 19-23, 2018, London, United Kingdom
【発明の概要】
【発明が解決しようとする課題】
【0007】
犯罪の発生を事前に予測する方法の一つとして、SNS上でのアクティビティなどに関する通信内容やSNSアカウントの分析結果から、犯罪を行う可能性が高い要注意人物を特定することが行われている。特に危険性が高い犯罪は、組織的に行われる場合が多いので、SNS上でのアクティビティやアカウントの分析結果から、要注意人物間の未知の関係を推定することによって、組織的な犯罪に関わる要注意人物を早い段階で特定することが、犯罪を未然に防止するために重要である。未知の関係とは、例えば、SNS上ではフォローフォロワー関係にないが、現実世界では知人関係にあるような関係などである。
【0008】
SNSにおける人物(ユーザ)間の未知の関係を高い精度で推定するためには、互いに複雑に影響し合う、様々な因子をふまえて推定する必要がある。そのような因子は、例えば人物がSNSにおいて行った通信の内容の時系列変化(推移)の特徴や、その人物の属性の時系列変化の特徴などを含む。したがって、SNSにおける人物間の未知の関係を高い精度で推定するには、このようなSNS上でのアクティビティなどに関する時系列変化の特徴を、高い精度で把握した上で分析を行うことが必要である。
【0009】
しかしながら、SNSにおいて行われる通信を解析する一般的なシステムでは、このようなSNSにおける通信の内容に関する時系列変化の特徴を十分に把握できていない。したがって、一般的なシステムでは、特にその時系列変化の特徴が、人物間の未知の関係の推定において重要な因子となる場合では、その推定精度が大きく低下する。上述した特許文献1乃至2が示す技術は、この問題を解決するのに十分であるとは言えない。
【0010】
本発明の主たる目的は、SNSにおいて、複数の人物の間における未知の関係の存在を推定する精度を高めることができるSNS分析システム等を提供することにある。
【課題を解決するための手段】
【0011】
本発明の一態様に係るSNS分析システムは、第1の複数の人物に関する通信履歴情報及び属性情報と前記第1の複数の人物の間に存在する関係の有無との関係を表す推定モデルと、第2の複数の人物に関する前記通信履歴情報及び前記属性情報と、に基づいて、前記第2の複数の人物の間における未知の関係の存在を推定する推定手段を備え、前記通信履歴情報は、前記第1あるいは第2の複数の人物の間におけるSNSを介した情報の授受、及び、前記第1あるいは第2の複数の人物によるSNSを介した互いに関連する情報の発信の、少なくともいずれかの時系列変化を表し、前記属性情報は、前記第1あるいは第2の複数の人物の属性の時系列変化を表す。
【0012】
上記目的を達成する他の見地において、本発明の一態様に係るSNS分析方法は、情報処理システムによって、第1の複数の人物に関する通信履歴情報及び属性情報と前記第1の複数の人物の間に存在する関係の有無との関係を表す推定モデルと、第2の複数の人物に関する前記通信履歴情報及び前記属性情報と、に基づいて、前記第2の複数の人物の間における未知の関係の存在を推定する方法であって、前記通信履歴情報は、前記第1あるいは第2の複数の人物の間におけるSNSを介した情報の授受、及び、前記第1あるいは第2の複数の人物によるSNSを介した互いに関連する情報の発信の、少なくともいずれかの時系列変化を表し、前記属性情報は、前記第1あるいは第2の複数の人物の属性の時系列変化を表す。
【0013】
また、上記目的を達成する更なる見地において、本発明の一態様に係るSNS分析プログラムは、第1の複数の人物に関する通信履歴情報及び属性情報と前記第1の複数の人物の間に存在する関係の有無との関係を表す推定モデルと、第2の複数の人物に関する前記通信履歴情報及び前記属性情報と、に基づいて、前記第2の複数の人物の間における未知の関係の存在を推定する推定処理をコンピュータに実行させるためのプログラムであって、前記通信履歴情報は、前記第1あるいは第2の複数の人物の間におけるSNSを介した情報の授受、及び、前記第1あるいは第2の複数の人物によるSNSを介した互いに関連する情報の発信の、少なくともいずれかの時系列変化を表し、前記属性情報は、前記第1あるいは第2の複数の人物の属性の時系列変化を表す。
【0014】
更に、本発明は、係るSNS分析プログラム(コンピュータプログラム)が格納された、コンピュータ読み取り可能な、不揮発性の記録媒体によっても実現可能である。
【発明の効果】
【0015】
本発明によれば、SNSにおいて、複数の人物の間における未知の関係の存在を推定する精度を高めることができるSNS分析システム等が得られる。
【図面の簡単な説明】
【0016】
図1】本発明の第1の実施形態に係るSNS分析システム10の構成を示すブロック図である。
図2】本発明の第1の実施形態に係るフォロー実績情報101の内容を例示する図である。
図3】本発明の第1の実施形態に係る投稿情報102の内容を例示する図である。
図4】本発明の第1の実施形態に係る属性情報103の内容を例示する図である。
図5】本発明の第1の実施形態に係るグラフ120の構成を例示する図である。
図6】本発明の第1の実施形態に係るグラフ生成部12が、モデル生成部13が推定モデル130を生成する際に教師データとして使用するグラフ120を生成する手順を例示する図である。
図7】本発明の第1の実施形態に係るSNS分析システム10が推定モデル130を生成する(機械学習を行う)動作(処理)を示すフローチャートである。
図8】本発明の第1の実施形態に係る表示制御部15が推定結果を表示画面200に表示する態様を例示する図である。
図9】本発明の第1の実施形態に係るSNS分析システム10が複数の人物の間における未知の関係の存在を推定する動作を示すフローチャートである。
図10】本発明の第2の実施形態に係るSNS分析システム30の構成を示すブロック図である。
図11】本発明の第1の実施形態に係るSNS分析システム10あるいは第2の実施形態に係るSNS分析システム30を実現可能な情報処理システム900の構成を示すブロック図である。
【発明を実施するための形態】
【0017】
後述する実施形態を一例とするシステムは、ある入力情報から目的の事象を推定する場合において、機械学習(例えば、深層学習)によって生成した学習済モデル(推定モデルとも称する)を用いる。そして、当該システムは、当該入力情報を表す、例えばノードとエッジ(枝とも称する)とによって構成されるグラフを用いる。グラフは、時間の経過とともに構造が変化する。当該システムは、そのようなグラフの特徴を分析可能なアルゴリズムを適用することに着想を得たものである。このアルゴリズムとしては、例えば下記のアルゴリズムが知られている。
(1)TGFN(Temporal Graph Factorization Network)
時間の経過とともに構造が変化するグラフから、時刻にかかわらず不変である静的な特徴と、各時刻に固有の動的な特徴とを抽出し、抽出した特徴を分析するアルゴリズムである。本アルゴリズムは、非特許文献1に示されているので、後述する実施形態ではその詳細な説明を省略する。
(2)STAR(Spatio-Temporal Attentive RNN)
時間の経過とともに構造が変化するグラフから、当該グラフを構成するノードのうち、時間軸及び空間軸の各軸において、例えばある事象の推定において重要な(即ち、推定に対する影響度が高い)ノードを特定して分析するアルゴリズムである。本アルゴリズムは、非特許文献2に示されているので、後述する実施形態ではその詳細な説明を省略する。
(3)Netwalk
時間の経過とともに構造が変化するグラフから、当該グラフを構成するノードの特徴量を抽出するアルゴリズムである。本アルゴリズムは、非特許文献3に示されているので、後述する実施形態ではその詳細な説明を省略する。
【0018】
後述する実施形態を一例とする開示は、学習済モデルを生成するとき、及び、その学習済モデルを用いてある入力情報から目的の事象を推定するときに、上述したアルゴリズムを適用することによって、目的の事象を推定する精度を高めることを実現する。
【0019】
以下、本発明の実施の形態について図面を参照して詳細に説明する。
【0020】
<第1の実施形態>
図1は、本発明の第1の実施の形態に係るSNS分析システム10の構成を示すブロック図である。本実施形態に係るSNS分析システム10は、人物(以下、「SNSを利用するユーザ」又は「SNSユーザ」とも称する)がSNSにおいて行った通信の内容や、その人物の属性等に関する情報に基づいて、SNSにおいて、人物の間における未知の関係の存在を推定するシステムである。SNS分析システム10は、複数の人物について、過去のある時点までは未知であり、その後に認知された関係の存在がラベルとして付与された通信履歴に関する情報及び人物の属性等に関する情報を用いて学習済モデル(推定モデルとも称する)を生成する。そしてSNS分析システム10は、当該学習済モデルを用いて、未知の関係の存在を推定する。SNS分析システム10は、少なくとも1つ以上の情報処理装置によって構成される。
【0021】
SNS分析システム10には、管理端末装置20(表示装置とも称する)が通信可能に接続されている。管理端末装置20は、SNS分析システム10を使用するユーザ(以下、「管理者」とも称する)が、SNS分析システム10に対して情報を入力したり、SNS分析システム10から出力された情報を確認したりする際に使用する、例えばパーソナルコンピュータ、その他の情報処理装置である。管理端末装置20は、SNS分析システム10から出力された情報を表示する表示画面200を備えている。
【0022】
SNS分析システム10は、取得部11、グラフ生成部12、モデル生成部13、推定部14、及び表示制御部15を備えている。グラフ生成部12、モデル生成部13、推定部14、及び表示制御部15は、順に、グラフ生成手段、モデル生成手段、推定手段、及び表示制御手段の一例である。
【0023】
次に、本実施形態に係るSNS分析システム10が、複数の人物間における未知の関係の存在を推定するための推定モデル130を生成あるいは更新する動作と、その推定モデル130を用いて当該未知の関係を推定する動作とのそれぞれについて説明する。
【0024】
<推定モデル130を生成(更新)する動作>
まず、本実施形態に係るSNS分析システム10が、SNSにおいて、複数の人物間における未知の関係の存在を推定するための推定モデル130を生成あるいは更新する動作について説明する。
【0025】
取得部11は、所定の期間における、学習対象とする複数の人物(第1の複数の人物とも称する)に関する、通信履歴情報100、及び、属性情報103を、ネットワークを経由してコンピュータ装置(図示せず)あるいはデータベースから取得する。取得部11は、例えば定期的に、通信履歴情報100、及び、属性情報103を取得してもよい。取得部11は、あるいは例えば、ユーザが管理端末装置20を介して入力した指示に応じて、通信履歴情報100、及び、属性情報103を取得してもよい。
【0026】
取得部11は、例えば、通信履歴情報100、及び、属性情報103を送信する1つまたは複数のコンピュータ装置あるいはデータベースに接続する通信回路と、当該通信回路によって取得された情報を格納する記憶デバイスとを備える。記憶デバイスは、後述される図11に示す情報処理システム900のハードディスク904あるいはRAM903でもよい。
【0027】
通信履歴情報100は、複数の人物によってSNSを介して行われた通信の時系列変化(推移)を表す情報である。通信履歴情報100は、フォロー実績情報101、及び、投稿情報102を含んでいる。
【0028】
また、通信履歴情報100は、複数のSNSユーザのSNSアカウント情報とSNSアクティビティ情報とを含む。
【0029】
SNSアカウント情報は、SNSユーザのアカウントに関する情報である。例えば、SNSアカウント情報は、SNSユーザの識別情報(氏名、ニックネーム、IDなど)、居住地情報(住所など)、勤務先情報(企業名、勤務地の住所など)、電話番号、メールアドレスなどを含む。SNSアカウント情報は、これらに限定されず、SNSユーザがアカウント作成時に登録した様々な情報を含んでもよい。
【0030】
SNSアクティビティ情報は、SNSユーザがSNSアカウントを介して行うSNS上でのアクティビティに関する情報である。SNSアクティビティ情報は、例えば下記の情報を含む。
・フォローされている他のSNSユーザのアカウントに関するフォロワー情報、
・フォローしている他のSNSユーザのアカウントに関するフォロー情報、
・SNSユーザが広告を見た回数を示すインプレッション数、
・SNSユーザが見た広告に対して反応した回数を示すエンゲージメント数、
・エンゲージメント率(インプレッション数をエンゲージメント数で割った値)、
・他ユーザが投稿した動画の再生数、
・他ユーザの投稿内容に含まれるリンクのクリック数、
・他のSNSユーザが投稿した画像または動画のクリック数、
・他SNSユーザの投稿に対するいいねの数、
・他SNSユーザの投稿のリツイート数(又はシェア数)、
・他ユーザの投稿に対する返信数、
・他SNSユーザの投稿の詳細を開いた回数、
・他SNSユーザのプロフィールのクリック数、
・他ユーザとやり取りするメッセージ内容(例えば、ダイレクトメッセージの内容)、
・他SNSユーザとメッセージをやり取りする回数(例えば、ダイレクトメッセージのやり取りの回数)、
・検索内容、
・検索した結果閲覧した投稿内容、
・SNSユーザが投降を行った位置情報。
【0031】
SNSアクティビティ情報は、これらに限定されず、SNS上でのアクティビティや他のユーザとのインタラクションに関する様々な情報を含んでもよい。
【0032】
尚、フォロー実績情報101、及び、投稿情報102は、SNSアカウント情報及びSNSアクティビティ情報をそれぞれ含んでもよい。
【0033】
図2は、本実施形態に係るフォロー実績情報101のデータの内容を例示する図である。フォロー実績情報101は、SNSにおいて、ある人物が別のある人物をフォローした実績を表している。フォロー実績情報101は、フォローが行われた日時、フォロワー(フォロー元)の人物、フォロー先の人物、及び、フォロワーがフォローを行った場所を含んでいる。但し、フォロー実績情報101は、例えば、フォロワーがフォローを行った際に投稿したコメントなど、図2に例示する項目以外の項目を含んでもよい。
【0034】
図2に例示するフォロー実績情報101において、フォロワー及びフォロー先の人物は、当該人物を識別可能なID(Identification)によって表されていることとする。また、フォローを行った場所も、当該場所を識別可能なIDによって表されていることとする。尚、フォローを行った場所は、フォロワーが例えば端末装置を操作することによって、フォロー(通信)を行った位置を表す。フォローを行った場所は、フォローを表す通信に含まれる、送信元を示す例えばIP(Internet Protocol)アドレス等の情報から特定可能である。フォロー(通信)を行った位置に関する情報は、GNSS(Global Navigation Satellite System)座標、地域、国など、様々な粒度の情報を含んでもよい。
【0035】
フォロー実績情報101は、ある人物によるフォローが行われると、そのフォロー実績が追加される、時系列に変化する情報である。
【0036】
図3は、本実施形態に係る投稿情報102のデータの内容を例示する図である。投稿情報102は、SNSに対してある人物が投稿した情報を表している。投稿情報102は、投稿した人物、投稿が行われた日時、当該人物が投稿を行った場所、及び、投稿内容を含んでいる。但し、投稿情報102は、図3に例示する項目以外の項目を含んでもよい。
【0037】
図3に例示する投稿情報102は、テキストにより表される投稿内容を含んでいるが、投稿情報102は、例えば音声あるいは画像(静止画像あるいは動画像)等により表される投稿内容を含んでもよい。
【0038】
投稿情報102は、ある人物によるSNSに対する投稿が行われると、その投稿実績が追加される、時系列に変化する情報である。
【0039】
図4は、本実施形態に係る属性情報103のデータの内容を例示する図である。図4に示す属性情報103は、人物ごとに、当該人物の属性として、所属組織(例えば犯罪組織)、組織における地位、及び、犯罪歴(犯行日及び犯行内容)を表している。属性情報103は、例えば、警察等によって作成された情報である。尚、属性情報103は、図4に例示する項目とは異なる、人物の属性を表す項目を含んでもよいし、図4に例示する項目の少なくとも一つ以上を含んでもよい。尚、この属性情報103はSNSアカウント情報に含まれてもよいし、属性情報103はSNSアカウント情報を含んでもよい。
【0040】
属性情報103における所属組織及び組織における地位は、人物の組織への所属状況が変わると変更され、犯罪歴は人物が犯罪を新たに行うと追加されるので、属性情報103は時系列に変化する情報である。
【0041】
取得部11は、上述の通りに取得した、フォロー実績情報101、投稿情報102、及び、属性情報103を、図示しない記憶デバイス(例えばメモリやハードディスク等)に格納する。
【0042】
図1に示すグラフ生成部12は、取得部11により取得された、所定の期間における、フォロー実績情報101、投稿情報102、及び、属性情報103を表すグラフ120を生成する。具体的に、グラフ生成部12は、記憶デバイスからフォロー実績情報101、投稿情報102、及び、属性情報103を読み出し、グラフ生成アルゴリズムに基づいてグラフ120を生成する。この場合、グラフ120は、複数の人物によってSNSを介して行われた通信、及び、当該複数の人物の属性に関する、所定の期間における時系列変化(推移)を表す。
【0043】
図5は、本実施形態に係るグラフ120の構成を例示する図である。図5に例示する通り、グラフ120は、複数の人物(人物A、人物B等)を表すノードを含んでいる。そしてグラフ120は、複数の人物の間におけるSNSを介した関係を表す、ノード同士を接続するエッジを含んでいる。図5の例示では、ノードは、人物名を囲む円で示され、エッジは、矢印で示されているが、これに限定されない。例えばエッジは矢印ではなく、方向を示さない線で表されてもよい。
【0044】
グラフ120における各ノードは、人物の属性情報を含んでいる。より具体的には、グラフ120におけるノードは、属性情報103を含んでいる。したがって、各ノードは、時間tを変数とし、属性情報103に含まれる項目(例えば、所属組織、組織における地位、犯罪歴等)を要素として含む多次元の関数によって表される。ノードを表す多次元の関数は、ノードが示す情報と関連付けて、図示しない記憶デバイス(例えば、ハードディスク904あるいはRAM903)に記憶される。
【0045】
グラフ120における各エッジは、より具体的には、フォロー実績情報101、及び、投稿情報102と関連付けされている。例えば、人物Aを示すノードと人物Bを表すノードとを結ぶエッジは、フォロー実績情報101が示す人物Bが人物Aをフォローした実績を表し、図5に示す関数fAB(t)で表される。
【0046】
投稿情報102が示す、人物Aによる投稿内容と人物Bによる投稿内容との関連性もまた、図5に示す関数fAB(t)で表される。関連性とは、例えば類似性である。グラフ生成部12は、投稿情報102が示す、人物Aによる投稿内容を示すテキストと人物Bによる投稿内容とを表すテキストとを、例えば既存の文章解析技術を用いて当該テキストから抽出したキーワード等に基づいて、それらのテキストの類似性を求めることができる。
【0047】
投稿情報102に含まれる投稿内容が音声により表される場合、グラフ生成部12は、例えば既存の音声認識技術を用いて投稿内容をテキストに変換し、そのテキストに対して、上述した類似性を求める処理を行えばよい。また、投稿情報102に含まれる投稿内容が画像により表される場合、グラフ生成部12は、例えば既存の画像認識技術を用いて投稿内容をテキストに変換し、そのテキストに対して、上述した類似性を求める処理を行えばよい。
【0048】
このように、各エッジを表す関数fAB(t)等の関数は、時間tを変数とし、フォロー実績情報101に含まれる項目(例えば、フォロー関係)と投稿情報102に含まれる項目(例えば、投稿内容の関連性)とを要素として含む多次元の関数である。エッジを表す多次元の関数は、エッジと関連付けて図示しない記憶デバイス(例えば、ハードディスク904あるいはRAM903)に記憶される。
【0049】
グラフ生成部12は、さらに、所定の期間に関して生成した、後述するモデル生成部13が機械学習を行う際に使用する教師データ用のグラフ120に対して、ラベルを付与する。グラフ生成部12は、当該所定の期間ののちに判明した、当該所定の期間においては未知であった複数の人物の間に存在する関係の有無を、当該ラベルとする。
【0050】
図6は、グラフ生成部12が、後述するモデル生成部13が推定モデル130を生成する際に教師データとして使用するグラフ120を生成する手順を例示する図である。図6に例示する通信履歴情報100は、所定の期間において、複数の人物によるSNSを介して行われた通信に関して、下記のイベントが時系列の順番に発生したことを示している。
(1)人物A(犯罪組織のリーダー)がテロ実行を促す声明を投稿した。
(2)人物Eが人物Aのテロ実行の声明をフォローした。
(3)人物Fがテロ実行に関連する内容を投稿した。
(4)人物Iが人物Fの投稿内容と関連する内容を投稿した(但し、人物Iから人物Fに対する直接的なフォローは無し)。
【0051】
グラフ生成部12は、上述した複数の人物によるSNSを介して行われた通信の時系列変化を表す通信履歴情報100に基づいて、その通信の時系列変化を表す、教師データとして使用されるグラフ120を生成する。図6に例示するグラフ120-t及びグラフ120-tは、当該所定の期間における時間t及びt(nは2以上の任意の整数)におけるグラフ120のスナップショットである。但し、時間tは当該所定の期間の始まりを表し、時間tは当該所定の期間の終わりを表すこととする。図6に例示する通り、グラフ120-tは、グラフ120-tには存在しないエッジ(即ち、人物の間におけるSNSを介した関係)を含んでいる。このグラフ120-tには存在しないエッジは、当該所定の期間において、複数の人物によるSNSを介して行われた通信から新たに存在が判明した、人物間の関係を表している。
【0052】
尚、グラフ生成部12は、上述したようなグラフ構造データではなく、関数のグラフを生成(描画)してもよい。 この場合、グラフ生成部12は、例えば、横軸が時間(日時)、縦軸がSNSアクティビティを示す指標、のグラフ(関数)を生成してもよい。
【0053】
図6に示す例において、当該所定の期間の終わり(即ち時間t)の時点では、人物Fと人物Iとの間の関係の存在は未知であることとする。そして、当該所定の期間の後に、人物H、人物I、人物Jが参加したテロ事件が発生したこととする。この場合、グラフ生成部12は、教師データとして使用されるグラフ120に対して、人物Iと人物Fとの間に、未知の関係が存在することを、ラベルとして付与する。
【0054】
このようなラベル付けは、例えば、通信履歴情報100が示すSNSを介して行われた通信の時系列変化の内容と、人物Iが参加したテロ事件が発生したという事実に基づいて、ユーザが未知の関係の存在を判断することによって行われてもよい。あるいは、通信履歴情報100が示すSNSを介して行われた通信の時系列変化の内容と、人物Iが参加したテロ事件が発生したという事実を表す情報に基づいて、グラフ生成部12が所定のラベル付与基準にしたがって、このようなラベル付けを行ってもよい。グラフ生成部12は、上述の通りにラベルを付与したグラフ120の構成を記憶デバイスに格納する。グラフ生成部12は、ラベルを付与したグラフ120を、教師データとしてモデル生成部13に出力する。
【0055】
モデル生成部13は、グラフ生成部12から入力された、ラベルが付与されたグラフ120を教師データとして、後述する推定部14が人物の間における未知の関係の存在を推定する際に用いる推定モデル130(学習済モデル)を生成する。モデル生成部13は、プロセッサによって、上述した教師データを用いる推定モデル130(学習済モデル)を生成する機械学習を行う。
【0056】
具体的に、モデル生成部13は、入力されたグラフ120から、所定のアルゴリズムを用いて、複数の人物の間におけるSNSを介した通信、及び、当該複数の人物の属性に関する、時系列変化の特徴を抽出する。モデル生成部13は、当該所定のアルゴリズムとして、例えば上述した、TGFN、STAR、Netwalk等を使用可能である。
【0057】
モデル生成部13は、例えばTGFNを用いることによって、グラフ120から、複数の人物の間におけるSNSを介した通信、及び、当該複数の人物の属性に関する、静的な特徴と時間とともに変化する動的な特徴とを抽出する。あるいはモデル生成部13は、例えばSTARを用いることによって、時間軸(ある期間に亘る観点)及び空間軸(個々の時刻に着目した観点)の各軸において、人物間における未知の関係の存在の推定において重要な(即ち、推定に対する影響度が高い)ノードを抽出する。あるいはモデル生成部13は、例えばNetwalkを用いることによって、グラフ120からノードの特徴量を抽出する。モデル生成部13は、Netwalkを用いる場合、例えば、Gradient Boosting等の既存の予測アルゴリズムと組み合わせてもよい。
【0058】
次に、モデル生成部13は、上述した教師データを用いて機械学習を行う過程において、上述の通りにグラフ120から特徴を抽出した結果から、人物の間における未知の関係の存在に関する説明変数を決定する。説明変数の具体例については後述する。グラフ120から特徴を抽出した結果とは、具体的には、複数の人物の間におけるSNSを介した通信、及び、当該複数の人物の属性に関する静的な特徴と動的な特徴、またはノードの特徴量である。そして、モデル生成部13は、その説明変数の値に基づいて人物の間における未知の関係の存在を推定するための基準を含む推定モデル130を生成する。モデル生成部13は、教師データにおける説明変数の値とラベルの値との関係について機械学習を行うことによって、当該基準を決定する。
【0059】
モデル生成部13は、例えば、通信履歴情報100によって示される、SNSを介した通信活動の時系列変化に関する説明変数を決定する。当該説明変数は、例えば、フォロワーとフォロー先との関係、通信内容、及び、通信を行った場所などを表すが、これらに限定されない。モデル生成部13は、例えば、属性情報103によって示される人物の属性の時系列変化に関する説明変数を決定する。当該説明変数は、例えば、人物の所属組織、及び、当該所属組織における地位などを表すが、これらに限定されない。
【0060】
モデル生成部13は、また、上述の通りに説明変数を決定する際に、複数の説明変数の個々に対して、人物の間における未知の関係の存在の推定における重要度(推定結果に対する寄与度)を決定する。モデル生成部13は、上述した人物の間における未知の関係の存在を推定するための基準において、各説明変数の値を、当該説明変数の重要度によって重み付けしてもよい。モデル生成部13は、この際、同一の前記説明変数に対して、対象人物間における通信履歴情報100、及び、属性情報103に関する特徴の違いから、対象人物間ごとに異なる重要度を決定してもよい。即ち、モデル生成部13は、例えば、ある説明変数に関して、人物Aと人物Bとの間における未知の関係の存在の推定に関してその重要性を高く設定し、人物Cと人物Dとの間における未知の関係の存在の推定に関してその重要性を低く設定してもよい。
【0061】
モデル生成部13は、上述の通りに生成あるいは更新した推定モデル130を、図示しない不揮発性の記憶デバイスに格納する。モデル生成部13は、例えば所定時間ごとに、推定モデル130を更新(再学習ともいう)することにより、推定精度を漸次向上することができる。
【0062】
次に図7のフローチャートを参照して、本実施形態に係るSNS分析システム10が推定モデル130を生成する(機械学習を行う)動作(処理)について詳細に説明する。
【0063】
取得部11は、教師データとして用いる、ある複数の人物に関する通信履歴情報100と属性情報103とを、外部から取得する(ステップS101)。グラフ生成部12は、取得部11によって取得された通信履歴情報100と属性情報103とを用いて、グラフ120を生成(更新)するとともに、人物間の未知の関係の有無をラベルとしてグラフ120に付与する(ステップS102)。
【0064】
モデル生成部13は、グラフ生成部12によって生成されたグラフ120から、所定のアルゴリズムを用いて、人物間におけるSNSでのフォローや関連する情報の発信の時系列変化の特徴、及び、属性の特徴を抽出する(ステップS103)。モデル生成部13は、その抽出結果に基づいて、人物間における未知の関係の存在に関する説明変数を決定する(ステップS104)。
【0065】
モデル生成部13は、個々の説明変数に対して、所定のアルゴリズムを用いて人物間における未知の関係の存在の推定における重要度を決定し、当該説明変数を含む推定モデル130を生成(更新)し(ステップS105)、全体の処理は終了する。
【0066】
<複数の人物の間における未知の関係の存在を推定する動作>
次に、本実施形態に係るSNS分析システム10が、生成あるいは更新した推定モデル130を用いて、複数の人物の間における未知の関係の存在を推定する動作について説明する。
【0067】
取得部11は、SNS分析システム10が推定モデル130を生成するときと同様に、通信履歴情報100、及び、属性情報103を外部の装置(図示せず)から取得する。但し、取得部11は、これらの情報を、上述した教師データとして取得するのではなく、人物の間における未知の関係の存在に関する推定対象のデータとして取得する。
【0068】
例えば上述の通り、ある犯罪に関与した複数の人物(第1の複数の人物とも称する)に関する通信履歴情報100、及び、属性情報103に基づいて推定モデル130が生成されていることとする。この場合、取得部11は、例えばユーザが管理端末装置20を介して入力した指示に応じて、犯罪を実行する危険性がある別のある複数の人物(第2の複数の人物とも称する)に関する通信履歴情報100、及び、属性情報103を取得する。推定対象の複数の人物に関する通信履歴情報100、及び、属性情報103の態様は、図2乃至図4に示す、推定モデル130の生成に用いた通信履歴情報100、及び、属性情報103と同様である。
【0069】
グラフ生成部12は、推定対象の複数の人物に関する、通信履歴情報100、及び、属性情報103を表すグラフ120を生成する。尚、グラフ120の構成は、図5を参照して上述した通りである。
【0070】
図1に示す推定部14は、複数の人物の間における未知の関係の存在の推定対象のグラフ120と、推定モデル130とに基づいて、複数の人物の間における未知の関係の存在を推定する。
【0071】
推定部14は、モデル生成部13が推定モデル130を生成あるいは更新するときと同様に、グラフ生成部12から入力されたグラフ120から、複数の人物の間におけるSNSを介した通信、及び、当該複数の人物の属性に関する、時系列変化の特徴を抽出する。推定部14は、この際、例えば上述した、TGFN、STAR、Netwalk等の所定のアルゴリズムを使用すればよい。
【0072】
推定部14は、グラフ120から抽出した特徴に基づいて、グラフ120における、推定モデル130によって識別された説明変数の値を求める。推定部14は、求めた説明変数の値を、推定モデル130に含まれる、複数の人物の間における未知の関係の存在を推定するための基準と照合することによって、その未知の関係の存在を推定する。グラフ120から抽出される特徴には、例えば、属性情報103における人物の類似度、フォロー実績情報101における互いのフォロー実績の類似度、SNSアクティビティの時系列変化に関する時系列特徴などがある。当該時系列特徴は、例えば、同一内容の投稿内容の投稿タイミングが類似、あるSNSユーザを同期にフォローし、同時期にフォロー解除した、などである。尚、グラフ120から抽出される特徴は、これらに限定されない。
【0073】
推定部14は、複数の人物の間における未知の関係の存在を推定した結果と、その推定理由を示す情報を表示制御部15へ出力する。推定理由を示す情報は、例えば、未知の関係の存在の推定対象であるグラフ120における説明変数の値、及び、説明変数の重要度等である。
【0074】
表示制御部15は、推定部14から入力された、複数の人物の間における未知の関係の存在を推定した結果と、その推定理由を示す情報を、管理端末装置20における表示画面200に表示する。すなわち、表示制御部15は、管理端末装置20の表示画面200に、推定部14による推定結果及び推定理由を表示するよう、管理端末装置20を制御する。
【0075】
図8は、本実施形態に係る表示制御部15が、複数の人物の間における未知の関係の存在を推定した結果とその推定理由を示す情報とを、表示画面200に表示する態様を例示する図である。
【0076】
図8に例示する表示画面200は、人物Kと人物Lとの間に未知の関係が存在すること表示している。そして、表示画面200は、人物Kと人物Lとの間に未知の関係が存在する理由を、説明変数の重要度(寄与度)が高い方から、下記の通り表している。
1.人物A(組織Pのリーダー)によるテロを示唆する投稿に対してフォローした人物Kの投稿内容と関係性が高い内容の投稿が、人物Lによって投稿されたこと。
(この場合の推定理由は、「要注意人物をフォローした投稿と投稿内容が類似」である。つまり、この場合は、要注意人物をフォローした投稿との投稿内容の類似性と未知の関係が存在することとの関係が推定理由となっている。)
2.上記1において、人物Kによる投稿と人物Lによる投稿は、ほぼ同時期に行われていること。
(この場合の推定理由は、「投稿時期が類似」である。つまり、この場合は、投稿時期の類似性と未知の関係が存在することとの関係が推定理由となっている。)
3.上記1において、人物Kによる投稿と人物Lによる投稿は、いずれも地域Zから投稿されていること。
(この場合の推定理由は、「投稿場所が類似」である。つまり、この場合は、投稿場所の類似性と未知の関係が存在することとの関係が推定理由となっている。)
SNS分析システム10は、管理者に対して、説明変数を推定理由として視認可能に提示することにより、説明性を向上することができるという効果を奏する。SNS分析システム10は、また、未知の関係の存在の推定理由として、推定に寄与した説明変数間の関係を視認可能に提示することができる。SNS分析システム10は、その際、推定理由を視認可能であれば自然言語文ではない態様により、推定理由を視認可能に提示してもよい。
【0077】
また、表示制御部15は、図8には図示していないが、例えば、表示画面200に「同一内容の投稿内容の投稿タイミングが類似、あるSNSユーザを同時期にフォローし、同時期にフォロー解除した」という推定理由を表示してもよい。この推定理由は、「同一内容の投稿タイミング及びフォローフォロワーの変化タイミングが類似」である。つまり、この場合、SNS分析システム10は、フォロー実績情報101及び投稿情報102の時系列変化の仕方の特徴(時系列特徴)を推定理由として提示する。SNS分析システム10は、このように説明変数の時系列変化(変化のタイミングなど)を提示することにより、推定結果の説明性をさらに向上することができる。
【0078】
また、図8に例示する表示画面200は、人物Kによる投稿内容と、人物Lによる投稿内容とを表示している。
【0079】
図8に示す例の場合、SNS分析システム10は、複数の人物によるSNSを介した通信に関して、投稿内容の関係性の高さ、投稿時期の近さ、及び、投稿場所の近さを説明変数としている。
【0080】
次に図9のフローチャートを参照して、本実施形態に係るSNS分析システム10が複数の人物の間における未知の関係の存在を推定する動作(処理)について詳細に説明する。
【0081】
取得部11は、推定対象である通信履歴情報100と属性情報103とを、外部から取得する(ステップS201)。グラフ生成部12は、取得した通信履歴情報100と属性情報103とを用いて、グラフ120を生成(更新)する(ステップS202)。
【0082】
推定部14は、グラフ生成部12によって生成されたグラフ120から、所定のアルゴリズムを用いて、人物の間におけるSNSでのフォローや関連する情報の発信の時系列変化の特徴、及び、属性の特徴を抽出する(ステップS203)。
【0083】
推定部14は、グラフ120からの特徴の抽出結果と推定モデル130とに基づいて、人物の間における未知の関係の存在を推定するとともに、その推定理由を特定する(ステップS204)。表示制御部15は、推定部14による複数の人物の間における未知の関係の存在の推定結果とその推定理由を、管理端末装置20の表示画面200に表示し(ステップS205)、全体の処理は終了する。
【0084】
本実施形態に係るSNS分析システム10は、SNSにおいて、複数の人物の間における未知の関係の存在を推定する精度を高めることができる。その理由は、SNS分析システム10は、複数の人物の間におけるSNSを介した通信に関する情報から、時系列変化の特徴を抽出した結果を用いて生成された推定モデル130に基づいて、人物の間における未知の関係の存在を推定するからである。
【0085】
以下に、本実施形態に係るSNS分析システム10によって実現される効果について、詳細に説明する。
【0086】
犯罪の発生を事前に予測するために、SNSにおける人物間の未知の関係を高い精度で推定するためには、互いに複雑に影響し合う、様々な因子をふまえて推定する必要がある。そのような因子は、例えば人物がSNSにおいて行った通信の内容の時系列変化の特徴や、その人物の属性の時系列変化の特徴などを含む。したがって、SNSにおける人物間の未知の関係を高い精度で推定するには、このようなSNSにおける通信に関する時系列変化の特徴を、高い精度で把握した上で分析を行うことが必要である。しかしながら、SNSにおいて行われる通信を解析する一般的なシステムでは、このようなSNSにおける通信に関する時系列変化の特徴を十分に把握できていないので、高い推定精度が得られないという問題がある。
【0087】
このような問題に対して、本実施形態に係るSNS分析システム10は、推定モデル130と推定部14とを備え、例えば図1乃至図9を参照して上述した通り動作する。即ち、推定モデル130は、第1の複数の人物に関する通信履歴情報100及び属性情報103と、第1の複数の人物の間に存在する関係の有無と、の関係を表す学習済モデルである。推定部14は、第2の複数の人物に関する通信履歴情報100及び属性情報103と、推定モデル130と、に基づいて、第2の複数の人物の間における未知の関係の存在を推定する。但し、通信履歴情報100及び属性情報103は、複数の人物の間におけるSNSを介した通信に関する時系列変化を表す情報である。
【0088】
本実施形態に係るSNS分析システム10は、通信履歴情報100と属性情報103とを表す、ノードとエッジとによって構成される、時系列に構造が変化するグラフ120を生成する。そしてSNS分析システム10は、生成したグラフ120の特徴を抽出及び分析可能な、上述したTGFN、STAR、Netwalk等のアルゴリズムを用いることによって、SNSにおける通信に関する時系列変化の特徴を高い精度で把握することを実現する。これによりSNS分析システム10は、SNSにおける人物間の未知の関係を推定する精度を高めることができる。
【0089】
また、本実施形態に係るSNS分析システム10は、推定モデル130を生成する過程において、人物間の未知の関係の推定に関する説明変数を決定し、さらに、個々の説明変数に対して、人物間の未知の関係の推定における重要度(寄与度)を決定する。そして、SNS分析システム10は、説明変数をその重要度により重み付けして人物間の未知の関係を推定する。これにより、SNS分析システム10は、例えば当該重要度を算出することなく推定を行う場合と比較して、SNSにおける通信の特徴をより正確に捉えた推定を行うので、SNSにおける人物間の未知の関係を推定する精度を高めることができる。
【0090】
また、モデル生成部13は、推定モデル130を生成する際に、複数の人物に関する通信履歴情報100及び属性情報103と、その複数の人物の間に存在する関係の有無と、の関係に対して与える影響が基準よりも小さいノード(人物)を排除するようにしてもよい。すなわち、モデル生成部13は、ある複数の人物の間に存在する関係を推定する際に、その推定に影響を及ぼさない、当該複数の人物とは明らかに無関係な人物を、ノイズであるノードとして無視してもよい。モデル生成部13は、このようなノイズであるノードを排除する既存のアルゴリズムとして、例えばGDPNet(Graph Denoising Policy Network)を用いることができる。そして、SNS分析システム10は、ノイズであるノードを排除することによって、処理の負荷を軽減することができる。
【0091】
また、学習済モデルを用いて事象の推定を行う一般的なシステムでは、推定プロセスがブラックボックス化され、推定理由を提示せずに推定結果のみを提示するので、ユーザは、システムが出力した推定結果の根拠を把握することが困難である。これに対して、本実施形態に係るSNS分析システム10は、説明変数の値に基づくSNSにおける人物間の未知の関係の推定理由を、例えば図8に例示する通り、管理端末装置20の表示画面200に表示する。これにより、SNS分析システム10は、SNSにおける人物間の未知の関係の推定理由に関する説明性を向上させることができる。
【0092】
また、SNS分析システム10が分析対象とするSNSを介した通信は、犯罪を行う可能性がある要注意人物の間における通信に限定されない。SNS分析システム10は、例えば、犯罪捜査において、犯罪被害者とある人物との間に存在する未知の関係を推定してもよい。
【0093】
<第2の実施形態>
図10は、本発明の第2の実施形態に係るSNS分析システム30の構成を示すブロック図である。SNS分析システム30は、推定モデル31を使用する推定部32を備えている。但し、推定部32は、推定手段の一例である。
【0094】
推定モデル31は、第1の複数の人物(機械学習の対象とする人物)に関する通信履歴情報310及び属性情報313と、第1の複数の人物の間に存在する関係の有無314と、の関係を表す。推定モデル31は、例えば、第1の実施形態に係る推定モデル130と同様に、通信履歴情報310と属性情報313と、第1の複数の人物の間に存在する関係の有無314との関係について機械学習を行った結果を表す学習済モデルである。
【0095】
通信履歴情報310は、第1の複数の人物の間におけるSNSを介した情報の授受、及び、第1の複数の人物によるSNSを介した互いに関連する情報の発信の、少なくともいずれかの時系列変化を表す。通信履歴情報310は、例えば、第1の実施形態に関して図2乃至図4を参照して説明した通信履歴情報100と同様な情報であればよい。
【0096】
属性情報313は、第1の複数の人物の属性の時系列変化を表し、例えば、第1の実施形態に関して図4を参照して説明した属性情報103と同様な情報であればよい。
【0097】
推定部32は、第2の複数の人物(人物間の未知の関係の推定対象とする人物)に関する通信履歴情報300と属性情報303と、推定モデル31と、に基づいて、第2の複数の人物の間における未知の関係の存在を推定する。
【0098】
推定部32は、人物の間における未知の関係の存在を推定する際に、第1の実施形態に係る推定部14と同様に、通信履歴情報300、及び、属性情報303から、SNSにおける通信及び人物の属性に関する時系列変化の特徴を抽出する。推定部32は、この際、第1の実施形態において示した所定のアルゴリズム(TGFN、STAR、Netwalk等)を使用可能である。
【0099】
本実施形態に係るSNS分析システム30は、SNSにおいて、複数の人物の間における未知の関係の存在を推定する精度を高めることができる。その理由は、SNS分析システム30は、複数の人物の間におけるSNSを介した通信に関する情報から、時系列変化の特徴を抽出した結果を用いて生成された推定モデル31に基づいて、人物の間における未知の関係の存在を推定するからである。
【0100】
<ハードウェア構成例>
上述した各実施形態において図1に示したSNS分析システム10、あるいは、図10に示したSNS分析システム30における各部は、専用のHW(HardWare)(電子回路)によって実現することができる。また、図1及び図10において、少なくとも、下記構成は、ソフトウェアプログラムの機能(処理)単位(ソフトウェアモジュール)と捉えることができる。
・取得部11、
・グラフ生成部12、
・モデル生成部13、
・推定部14及び32、
・表示制御部15。
【0101】
但し、これらの図面に示した各部の区分けは、説明の便宜上の構成であり、実装に際しては、様々な構成が想定され得る。この場合のハードウェア環境の一例を、図11を参照して説明する。
【0102】
図11は、本発明の第1の実施形態に係るSNS分析システム10あるいは第2の実施形態に係るSNS分析システム30を実現可能な情報処理システム900(コンピュータシステム)の構成を例示的に説明する図である。即ち、図11は、図1及び図10に示したSNS分析システム10及び30を実現可能な少なくとも1つのコンピュータ(情報処理装置)の構成であって、上述した実施形態における各機能を実現可能なハードウェア環境を表す。
【0103】
図11に示した情報処理システム900は、構成要素として下記を備えているが、下記のうちの一部の構成要素を備えない場合もある。
・CPU(Central_Processing_Unit)901、
・ROM(Read_Only_Memory)902、
・RAM(Random_Access_Memory)903、
・ハードディスク(記憶装置)904、
・外部装置との通信インタフェース905、
・バス906(通信線)、
・CD-ROM(Compact_Disc_Read_Only_Memory)等の記録媒体907に格納されたデータを読み書き可能なリーダライタ908、
・モニターやスピーカ、キーボード等の入出力インタフェース909。
【0104】
即ち、上記構成要素を備える情報処理システム900は、これらの構成がバス906を介して接続された一般的なコンピュータである。情報処理システム900は、CPU901を複数備える場合もあれば、マルチコアにより構成されたCPU901を備える場合もある。情報処理システム900は、CPU901に加えてGPU(Graphical_Processing_Unit)(不図示)を備えてもよい。
【0105】
そして、上述した実施形態を例に説明した本発明は、図11に示した情報処理システム900に対して、次の機能を実現可能なコンピュータプログラムを供給する。その機能とは、その実施形態の説明において参照したブロック構成図(図1及び図10)における上述した構成、或いはフローチャート(図7及び図9)の機能である。本発明は、その後、そのコンピュータプログラムを、当該ハードウェアのCPU901に読み出して解釈し実行することによって達成される。また、当該装置内に供給されたコンピュータプログラムは、読み書き可能な揮発性のメモリ(RAM903)、または、ROM902やハードディスク904等の不揮発性の記憶デバイスに格納すれば良い。
【0106】
また、前記の場合において、当該ハードウェア内へのコンピュータプログラムの供給方法は、現在では一般的な手順を採用することができる。その手順としては、例えば、CD-ROM等の各種記録媒体907を介して当該装置内にインストールする方法や、インターネット等の通信回線を介して外部よりダウンロードする方法等がある。そして、このような場合において、本発明は、係るコンピュータプログラムを構成するコード或いは、そのコードが格納された記録媒体907によって構成されると捉えることができる。
【0107】
以上、上述した実施形態を模範的な例として本発明を説明した。しかしながら、本発明は、上述した実施形態には限定されない。即ち、本発明は、本発明のスコープ内において、当業者が理解し得る様々な態様を適用することができる。
【0108】
尚、上述した各実施形態の一部又は全部は、以下の付記のようにも記載されうる。しかしながら、上述した各実施形態により例示的に説明した本発明は、以下には限られない。
【0109】
(付記1)
第1の複数の人物に関する通信履歴情報及び属性情報と前記第1の複数の人物の間に存在する関係の有無との関係を表す推定モデルと、第2の複数の人物に関する前記通信履歴情報及び前記属性情報と、に基づいて、前記第2の複数の人物の間における未知の関係の存在を推定する推定手段を備え、
前記通信履歴情報は、前記第1あるいは第2の複数の人物の間におけるSNSを介した情報の授受、及び、前記第1あるいは第2の複数の人物によるSNSを介した互いに関連する情報の発信の、少なくともいずれかの時系列変化を表し、
前記属性情報は、前記第1あるいは第2の複数の人物の属性の時系列変化を表す、
SNS分析システム。
【0110】
(付記2)
前記第2の複数の人物の間における未知の関係の存在の推定理由を表示するよう表示装置を制御する表示制御手段をさらに備える、
付記1に記載のSNS分析システム。
【0111】
(付記3)
前記通信履歴情報は、前記第1あるいは第2の複数の人物の間におけるSNSのフォロー実績を表す、
付記2に記載のSNS分析システム。
【0112】
(付記4)
前記通信履歴情報は、前記第1あるいは第2の複数の人物によるSNSへの投稿情報を含む、
付記2または付記3に記載のSNS分析システム。
【0113】
(付記5)
前記投稿情報は、テキスト、音声、及び、画像の少なくともいずれかを含む、
付記4に記載のSNS分析システム。
【0114】
(付記6)
前記通信履歴情報は、前記第1あるいは第2の複数の人物が端末装置を操作することによって通信を行った位置を表す、
付記2乃至付記5のいずれか一項に記載のSNS分析システム。
【0115】
(付記7)
前記属性情報は、前記第1あるいは第2の複数の人物の犯罪歴及び組織への所属状況の少なくともいずれかを表す、
付記2乃至付記6のいずれか一項に記載のSNS分析システム。
【0116】
(付記8)
前記通信履歴情報を表すグラフを生成するグラフ生成手段をさらに備える、
付記2乃至付記7のいずれか一項に記載のSNS分析システム。
【0117】
(付記9)
前記グラフは、前記第1あるいは第2の複数の人物を表すノードと、前記第1あるいは第2の複数の人物の間におけるSNSを介した関係を表すエッジとを含む、
付記8に記載のSNS分析システム。
【0118】
(付記10)
所定の期間における前記第1の複数の人物に関する通信履歴情報及び属性情報と、前記所定の期間の後に判明した、前記所定の期間においては未知であった前記第1の複数の人物の間に存在する関係の有無とに基づいて、前記推定モデルを生成するモデル生成手段をさらに備える、
付記9に記載のSNS分析システム。
【0119】
(付記11)
前記モデル生成手段は、前記所定の期間においては未知であった前記第1の複数の人物の間に存在する関係の有無がラベルとして付与された前記グラフから、所定のアルゴリズムを用いて、前記第1の複数の人物の間におけるSNSを介した関係の時系列変化の特徴を抽出したのち、その抽出結果に基づいて、前記第1の複数の人物の間における未知の関係の存在の説明変数を決定することによって、前記説明変数を含む前記推定モデルを生成する、
付記10に記載のSNS分析システム。
【0120】
(付記12)
前記モデル生成手段は、前記第1の複数の人物に関する前記通信履歴情報及び属性情報と、前記第1の複数の人物の間に存在する関係の有無と、の関係に対して与える影響が基準よりも小さいノードを排除した前記推定モデルを生成する、
付記11に記載のSNS分析システム。
【0121】
(付記13)
前記グラフ生成手段は、前記属性情報を含む前記グラフを生成し、
前記モデル生成手段は、前記グラフから、前記第1の複数の人物の属性に関する前記説明変数を決定する、
付記11または12に記載のSNS分析システム。
【0122】
(付記14)
前記モデル生成手段は、複数の前記説明変数の個々に対して、前記未知の関係の存在の推定における重要度を決定し、
前記推定手段は、前記重要度に基づいて、前記未知の関係の存在を推定する、
付記11乃至付記13のいずれか一項に記載のSNS分析システム。
【0123】
(付記15)
前記モデル生成手段は、同一の前記説明変数に対して、前記第1の複数の人物ごとに異なる前記重要度を決定する、
付記14に記載のSNS分析システム。
【0124】
(付記16)
前記表示制御手段は、前記重要度の順に前記説明変数の名称を並べて表示するとともに、前記説明変数の値を表示する態様で前記推定理由を表示するように、前記表示装置を制御する、
付記14または付記15に記載のSNS分析システム。
【0125】
(付記17)
第1の複数の人物に関する通信履歴情報及び属性情報と前記第1の複数の人物の間に存在する関係の有無との関係を表す推定モデルと、第2の複数の人物に関する前記通信履歴情報及び前記属性情報と、に基づいて、前記第2の複数の人物の間における未知の関係の存在を推定する推定手段を備え、
前記通信履歴情報は、前記第1あるいは第2の複数の人物の間におけるSNSを介した情報の授受、及び、前記第1あるいは第2の複数の人物によるSNSを介した互いに関連する情報の発信の、少なくともいずれかの時系列変化を表し、
前記属性情報は、前記第1あるいは第2の複数の人物の属性の時系列変化を表す、
SNS分析装置。
【0126】
(付記18)
情報処理システムによって、
第1の複数の人物に関する通信履歴情報及び属性情報と、前記第1の複数の人物の間に存在する関係の有無と、の関係を表す推定モデルと、第2の複数の人物に関する前記通信履歴情報及び前記属性情報と、に基づいて、前記第2の複数の人物の間における未知の関係の存在を推定する方法であって、
前記通信履歴情報は、前記第1あるいは第2の複数の人物の間におけるSNSを介した情報の授受、及び、前記第1あるいは第2の複数の人物によるSNSを介した互いに関連する情報の発信の、少なくともいずれかの時系列変化を表し、
前記属性情報は、前記第1あるいは第2の複数の人物の属性の時系列変化を表す、
SNS分析方法。
【0127】
(付記19)
第1の複数の人物に関する通信履歴情報及び属性情報と、前記第1の複数の人物の間に存在する関係の有無と、の関係を表す推定モデルと、第2の複数の人物に関する前記通信履歴情報及び前記属性情報と、に基づいて、前記第2の複数の人物の間における未知の関係の存在を推定する推定処理をコンピュータに実行させるためのプログラムであって、
前記通信履歴情報は、前記第1あるいは第2の複数の人物の間におけるSNSを介した情報の授受、及び、前記第1あるいは第2の複数の人物によるSNSを介した互いに関連する情報の発信の、少なくともいずれかの時系列変化を表し、
前記属性情報は、前記第1あるいは第2の複数の人物の属性の時系列変化を表す、
SNS分析プログラムが格納された記録媒体。
【産業上の利用可能性】
【0128】
本発明は、例えば、特殊詐欺グループの推定、誘拐事件の加害者又は被害者の推定、テロリストや犯罪予告者、自殺志願者などの要注意人物の推定、違法薬物の取引など、SNSを通して起こり得るあらゆる事件事象の推定に対して利用可能である。
【符号の説明】
【0129】
10 SNS分析システム
100 通信履歴情報
101 フォロー実績情報
102 投稿情報
103 属性情報
11 取得部
12 グラフ生成部
120 グラフ
13 モデル生成部
130 推定モデル
14 推定部
15 表示制御部
20 管理端末装置
200 表示画面
30 SNS分析システム
300 通信履歴情報
303 属性情報
31 推定モデル
310 通信履歴情報
313 属性情報
314 関係の有無
32 推定部
900 情報処理システム
901 CPU
902 ROM
903 RAM
904 ハードディスク(記憶装置)
905 通信インタフェース
906 バス
907 記録媒体
908 リーダライタ
909 入出力インタフェース
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11