(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0018】
[実施の形態]
図1は、本実施の形態に係る相関関係表示システムの機能構成ブロックの一例を示す。また、
図2は、本実施の形態に係る相関関係表示システムの表示部の表示態様の一例を示す。
【0019】
(相関関係表示システム1の概要)
本実施の形態に係る相関関係表示システム1は、ユーザー端末若しくはサーバー等の情報処理装置2に格納されている複数の通信データから予め定められた事案に関連性のある通信データを分析することで、複数の人物の間の関係性を自動的に表示するシステムである。ここで、予め定められた事案は、例えば、訴訟に関連することを示す情報である。そして、本実施の形態に係る相関関係表示システム1は、一例として、不正アクセスや機密情報漏洩等のコンピュータに関する犯罪や法的紛争が生じた場合に、犯罪や紛争の原因究明や捜査に要する電子的記録であるデジタル情報を収集及び分析し、その法的な証拠性を明らかにする技術であるフォレンジックに適用できる。
【0020】
本実施の形態に係る相関関係表示システム1は、まず、複数の端末としての複数の情報処理装置2の間で送受信された複数の通信データの内容を分析する。ここで各通信データには、一の人物から他の人物に当該通信データが送信されたことを示す情報が含まれている。また、通信データには、一の人物が所属する組織の単位(例えば、係、課、部、会社等)を識別する情報、及び他の人物が所属する組織の単位(例えば、係、課、部、会社等)を識別する情報が含まれていてもよい。また、通信データは、複数の情報処理装置2、又は複数の情報処理装置2と通信可能に接続されるサーバーに格納されている。
【0021】
そして、相関関係表示システム1は、分析結果に基づいて、一の人物と他の人物との間で予め定められた事案に関する情報のやり取りがどの程度実行されたか、若しくは予め定められた事案に関する情報についてどの程度重要な情報のやり取りが実行されたか等についてユーザーに視認可能に表示する。
【0022】
具体的に、相関関係表示システム1は、一の人物に属する情報処理装置2と他の人物に属する情報処理装置2との間で送受信される通信データ(例えば、電子メール)の内容を分析する。そして、相関関係表示システム1は、通信データの内容に予め定められた事案に関する情報が含まれているか否か分析する。相関関係表示システム1は、当該事案に関する情報が通信データに含まれていることを示す分析結果が得られた場合、当該通信データと当該事案との関連性を評価する。例えば、相関関係表示システム1は、当該通信データの内容の当該事案に対する関連性の高低を評価する。そして、相関関係表示システム1は、当該通信データと当該事案とに関連性があることを示す評価結果、若しくは関連性の高低を示す評価結果が得られた場合、一の人物と他の人物との間の関係性をモニタ等に表示する。
【0023】
例えば、相関関係表示システム1は、各人物をノードに対応づけて複数のノードをモニタに表示すると共に、一のノードと他のノードとを評価結果に基づいて表示する。一例として、相関関係表示システム1は、一の人物に対応づけられる一のノードと他の人物に対応づけられる他のノードとの間を通信データの流れを示す矢印で結合して表示する。また、相関関係表示システム1は、一のノードと他のノードとを表示する場合、当該一のノードから当該他のノードに予め定められた事案に関する情報のやり取りが実行された回数若しくは頻度、又はやり取りされた情報の重要度等に応じ、ノードの形態を変化させて表示する。
【0024】
一例として、相関関係表示システム1は、ノードの大きさ、色、及び/又は形状を変化させて表示する。また、相関関係表示システム1は、各ノードを結合する矢印の太さ、色、及び/又は長さを変化させて表示することもできる。
【0025】
なお、本実施の形態においてサーバーは、1つ以上のサーバーであって、複数のサーバーを含んで構成することもできる。例えば、サーバーは、メールサーバー、ファイルサーバー、又は文書管理サーバー等のデジタル情報を格納可能なサーバーを含む。また、端末としての情報処理装置2は、1つ以上の端末であって、複数の情報処理装置2を含んで構成することもできる。例えば、情報処理装置2は、パーソナルコンピュータ、ノートパソコン、タブレットPC、又は携帯電話等の携帯通信端末等を含む。
【0026】
(相関関係表示システム1の詳細)
本実施の形態に係る相関関係表示システム1は、複数の情報処理装置2の間で送受信された通信データを取得する通信データ取得部10と、通信データ取得部10が取得した通信データの内容を分析する分析部12と、分析部12の分析結果を用い、通信データの内容と予め定められた事案との関係性を評価する評価部16と、評価部16の評価結果に基づいて、複数の人物の間の関係性を表示する表示部18とを備える。また、相関関係表示システム1は、通信データ取得部10が取得した通信データの一部に対し、予め定められた事案との関係性を対応づける情報を取得する入力部11と、複数の端末により構築される通信ネットワークにおける複数の主要端末を決定するネットワーク分析部14とを更に備える。
【0027】
なお、相関関係表示システム1と情報処理装置2とは、インターネット等の通信ネットワーク、又はLAN等の有線若しくは無線のネットワーク等により相互に通信可能に接続される。また、相関関係表示システム1は、情報処理装置2が有する機能及び構成の一部又は全部を備えることもできる。更に、
図1において1つの情報処理装置2を示しているが、複数の情報処理装置2が相関関係表示システム1と通信可能に接続されることもできる。
【0028】
(通信データ取得部10)
通信データ取得部10は、複数の端末としての複数の情報処理装置2の間で送受信され、複数の人物のそれぞれに対応づけられる通信データを取得する。通信データは、電子メール、電話の通話記録、及びソーシャルネットワークサービスへのアクセス記録、個々のコンピュータまたはサーバの識別を表す情報(例えば、ドメイン等)等のうち少なくとも1つを含む。また、通信データは、通信データに添付されたドキュメントファイルデータを含むこともできる。なお、通信データは、情報処理装置2若しくはデータサーバーに格納されている。通信データ取得部10は、複数の情報処理装置2若しくはデータサーバーに格納されている複数の通信データを取得する。通信データ取得部10は、取得した通信データを分析部12及びネットワーク分析部14に供給する。
【0029】
(分析部12)
分析部12は、通信データ取得部10から受け取った通信データの内容を分析する。具体的に分析部12は、テキストマイニング手法、画像認識手法または音声認識手法を用い、通信データの内容に含まれるテキストデータを分析する。そして、分析部12は、通信データの内容に予め定められた事案と関係を有するテキスト、画像または音声が含まれているか否かを分析する。ここで、予め定められた事案は、例えば、訴訟に関係することを示す情報である。または、訴訟に関係するもののみならず、不正調査の人間関係、M&A・知的財産における人物、会計、技術情報の相関性に関するものであってもよい。
【0030】
例えば、分析部12は、予め定められた事案に関係する単語を示すテキストデータ(上述の画像認識手法、音声認識手法によりテキスト化されたものを含む)を格納する辞書部を有する。分析部12は、通信データの内容に含まれるテキストデータを辞書部に格納されているテキストデータを用いて分析することで、通信データの内容に当該事案に関係するテキストが含まれているか否か分析する。分析部12は、分析結果を評価部16に供給する。
【0031】
(ネットワーク分析部14)
ネットワーク分析部14は、通信データを用い、複数の端末により構築される通信ネットワークを解析することで複数の端末から通信ネットワークにおける複数の主要端末を決定する。例えば、ネットワーク分析部14は、複数の端末が通信ネットワークの各端末間の最短経路上に出現する頻度に基づいて複数の主要端末を決定する。例えば、ネットワーク分析部14は、分析アルゴリズムとしてVertex betweenness centrality等を用いて複数の主要端末を決定する。ネットワーク分析部14は、分析結果を示す情報を評価部16に供給する。
【0032】
(評価部16)
評価部16は、分析部12の分析結果を用い、通信データの内容と予め定められた事案との関係性を評価する。また、評価部16は、複数の主要端末間で送受信される通信データと分析部12の分析結果とを用いて通信データの内容と予め定められた事案との関係性を評価することもできる。評価部16が主要端末間で送受信される通信データを用いて当該関係性を評価することで、膨大な通信データの中から予め定められた事案との関係性が高い情報処理装置2間で送受信された通信データを絞り込むことができる。
【0033】
例えば、評価部16は、自動コード付処理を実行することで通信データの内容と予め定められた事案との関係性を評価する。一例として、評価部16は、通信データ取得部10が取得した通信データから一部の通信データを抽出する。なお、評価部16は、複数の通信データから一部の通信データをランダムに抽出する。次に、評価部16は、当該一部の通信データに、入力部11が外部から取得した予め定められた事案との関係性を対応づける情報をコード付けする。予め定められた事案との関係性とは、通信データが予め定められた事案と関係性を有することを示す情報、及び通信データと予め定められた事案との関係性の高低を示す情報等である。
【0034】
そして、評価部16は、分析部12が分析したすべての通信データ若しくは分析部12が予め定められた事案に関連するテキストデータが含まれていると分析したすべての通信データに対して、予め定められた事案との関係性を対応づける情報がコード付けられた通信データを用い、自動コード付処理を実行する。これにより、評価部16は、一の人物の情報処理装置から他の人物の情報処理装置に向けて送信された通信データが、予め定められた事案に関連するか否か、及び当該通信データの予め定められた事案との関連性の高低について評価する。または、評価部16は、一のドメインの情報処理装置から他のドメイン情報の情報処理装置に向けて送信された通信データが、予め定められた事案に関連するか否か、及び当該通信データの予め定められた事案との関連性の高低について評価してもよい。ドメイン情報は、個々のコンピュータの識別を表すものであったり、Eメールの@以下の識別子であってもよい。
【0035】
一例として、評価部16は、第1の人物の情報処理装置から第2の人物の情報処理装置に送信される電子メールが、予め定められた事案と関連しているか否かを評価する。そして、評価部16は、当該電子メールが当該事案に関連している場合、当該電子メールにスコアを対応づける。評価部16は、第1の人物の情報処理装置から第2の人物の情報処理装置に送信される電子メールの全てについて同様にスコアを対応づけ、対応づけたスコアを合計することにより、第1の人物と第2の人物との間の関係性のスコアを算出する。評価部16は、一の人物の情報処理装置から他の複数の人物それぞれの情報処理装置に送信される電子メールのそれぞれについて同様に評価する。そして、評価部16は、一の人物と他の複数の人物との間の関係性それぞれについて、スコアを算出して評価する。
【0036】
また、評価部16は、第1のドメインの情報処理装置から第2のドメインの情報処理装置に送信される電子メールが、予め定められた事案と関連しているか否かを評価する。そして、評価部16は、当該電子メールが当該事案に関連している場合、当該電子メールにスコアを対応づける。評価部16は、第1のドメインの情報処理装置から第2のドメインの情報処理装置に送信される電子メールの全てについて同様にスコアを対応づけ、対応づけたスコアを合計することにより、第1のドメインと第2のドメインとの間の関係性のスコアを算出する。評価部16は、一のドメインの情報処理装置から他の複数のドメインそれぞれの情報処理装置に送信される電子メールのそれぞれについて同様に評価する。そして、評価部16は、一のドメインと他の複数のドメインとの間の関係性それぞれについて、スコアを算出して評価する。
【0037】
なお、評価部16が通信データの解析結果に基づいて関係性を評価する場合、例えば、以下のように評価を実行する。まず、評価部16は、予め定められた事案に関連する複数の単語の組合せに、予め定められた事案との関連性の高低を示すスコアを対応づけて格納する辞書を有することができる。そして、評価部16は、形態素解析に基づいて通信データ内のテキストデータを解析し、当該辞書に格納されている複数の単語の組合せが、選択された通信データ内に含まれているか否かを判断する。
【0038】
評価部16は、当該辞書に格納されている単語の組合せが、選択された通信データに含まれていると判断した場合、辞書に格納されているスコアに基づいて、予め定められた事案に対する当該ファイルの関連性の高低を評価する。そして、評価部16は、評価結果を示す情報(すなわち、予め定められた事案に対する関連性の高低を示す情報)を選択された通信データに対応づける。これにより、評価部16は、通信データと予め定められた事案との関係性の高低を評価できる。
【0039】
更に、評価部16は、通信データに含まれる送受信時刻を示すデータを読み取ることで、通信データの送受信時刻ごとに予め定められた事案に関する通信データの関連性の高低を評価することもできる。また、評価部16は、評価が実行された実行時刻ごとに予め定められた事案に関する通信データの関連性の高低を評価することもできる。評価部16は、評価結果を示す情報を表示部18に供給する。
【0040】
(表示部18)
表示部18は、評価部16の評価結果に基づいて、予め定められた事案に関連する複数の人物の関係性を表示する。表示部18は、評価部16が一の人物と他の人物との間の関係性に対して算出したスコアに応じて、表示形態を変化させることができる。
【0041】
例えば、表示部18は、評価部16から受け取った評価結果を解析し、予め定められた事案に関連する複数の人物それぞれを把握する。そして、
図2に示すように表示部18は、各人物を円形のノードに対応づけてそれぞれ表示すると共に、一の人物と他の人物との間に関係性がある場合、当該一の人物に対応するノードと当該他の人物に対応するノードとの間を矢印で結合して表示する。各ノードの大きさは、一のノード30との関係性の高低を示す。すなわち、ノードの大きさが大きいほど、ノード30との関係性が高いことを示す。
図2の例においては、ノード31、ノード36、ノード35、ノード32、ノード33、ノード34の順にノードの大きさが小さくなっている。したがって、
図2の例においては、ノード31、ノード36、ノード35、ノード32、ノード33、ノード34の順にノード30に対応する人物との関係性が高いことを示す。なお、表示部18は、ノード内に評価部16が算出したスコアを表示することもできる。
【0042】
また、表示部18は、ノード間を結合する矢印若しくは線分の太さや色等を変化させて表示することもできる。例えば、表示部18は、一のノードに対応づけられている人物と他のノードに対応づけられている人物との関係性に応じ、矢印若しくは線分の太さ、色、線の種類、線の長さを変更することもできる。一例として、表示部18は、一のノードに対応づけられている人物と他のノードに対応づけられている人物との関係性が高いほど、太い線分若しくは強調された色を有する線分で一のノードと他のノードとを結合した状態を表示する(例えば、通常時は黒色の線であり、強調時は赤や黄色の線で表示する)。
【0043】
更に、表示部18は、一のノードに一の人物(すなわち、個人)を対応づけるだけではなく、一のノードに予め定められた組織単位(例えば、係、課、部、会社等)を対応づけることもできる。この場合、分析部12は、通信データの内容を分析して、複数の通信データを予め定められた組織単位にグルーピングする。そして、分析部12は、グルーピングした結果を示す情報を表示部18に供給する。
【0044】
また、表示部18は、分析部12の分析結果に基づいて複数の人物の第1の関係性を表示した後、評価部16の評価結果を第1の関係性に反映させた複数の人物の第2の関係性を表示することもできる。すなわち、表示部18は、テキストマイニングを用いた分析部12の分析結果だけに基づいてまず第1の関係性を表示する。続いて、表示部18は、自動コード付処理を用いた評価部16の評価結果が生成された段階で、当該評価結果を用いて第1の関係性を第2の関係性に変化させ、第2の関係性を表示することができる。
【0045】
また、表示部18は、送受信時刻ごと、若しくは実行時刻ごとにおける評価部16の評価結果に基づいて、複数の人物の関係性の表示を動的に変化させることもできる。例えば、表示部18は、所定の時間間隔ごとに各ノード間の通信データ(例えば、電子メール)の送受信量をユーザーに視認可能に表示する。例えば、表示部18は、各ノード間でやり取りされる通信データ量を時系列に沿ってノードの大きさや線の太さを変化させて表示する。これにより、表示部18は、ある特定の時刻以降に送受信量が急増している人物間の関係性を強調表示できる。したがって、相関関係表示システム1によれば、ある特定の事件が発生した後に急に送受信される通信データ量が多くなる人物を特定することができる。
【0046】
また、表示部18は、評価部16における評価が実行された時刻ごとに、複数の人物の関係性を表示できる。すなわち、表示部18は、評価部16における評価が実行され、評価結果が変更されるたびに、リアルタイムに複数の人物の関係性を動的に変化させて表示することもできる。表示部18は、上述したノードを含む表示を人物ではなく、ドメイン情報で表示するものであってもよい。分析部18は、ドメイン情報の場合、ノード31の中に上述した人物を表すノードを含むように解析し、表示部18は、その解析結果に基づき、ドメイン情報のノード内に人物を表すノードを表すものであってもよい。または、表示部18は、評価部16の評価結果に基づいて、予め定められた事案に関連する複数のドメイン情報の関係性を表示してもよい。
【0047】
(相関関係表示方法の概要)
図3は、本発明の実施の形態に係る相関関係表示システムの処理の流れの一例を示す。
【0048】
まず、通信データ取得部10は、情報処理装置2若しくは複数の情報処理装置2間で送受信される通信データを格納しているサーバーから通信データを取得する(ステップ10。以下、「ステップ」を「S」と表す。)。通信データ取得部10は、分析部12、ネットワーク分析部14、及び評価部16からの働きかけに応じ、分析部12、ネットワーク分析部14、及び/又は評価部16に取得した通信データを供給する。
【0049】
分析部12は、通信データ取得部10から取得した通信データの内容を分析する(S15)。例えば、分析部12は、テキストマイニング手法を用い、通信データに含まれるテキストデータの内容を分析する。一例として、分析部12は、予め定められた事案に関連する単語が通信データに含まれるか否かを分析する。分析部12は、分析結果を評価部16及び表示部18に供給する。
【0050】
評価部16は、通信データの内容と予め定められた事案との関係性を評価する(S20)。評価部16は、例えば、自動コード付処理の手法を用いて当該関係性を評価する。評価部16は、評価結果を表示部18に供給する。表示部18は、評価部16から受け取った評価結果に基づいて、複数の人物の関係性を、ユーザーに視認可能にモニタ等の出力装置に表示する(S25)。
【0051】
図4は、本発明の実施の形態に係る相関関係表示システムのハードウェア構成の一例を示す。
【0052】
本実施の形態に係る相関関係表示システム1は、CPU1500と、グラフィックコントローラ1520と、RandomAccessMemory(RAM)、Read−OnlyMemory(ROM)及び/又はフラッシュROM等のメモリ1530と、データを記憶する記憶装置1540と、記録媒体からデータを読み込み及び/又は記録媒体にデータを書き込む読込/書込み装置1545と、データを入力する入力装置1560と、外部の通信機器とデータを送受信する通信インターフェース1550と、CPU1500とグラフィックコントローラ1520とメモリ1530と記憶装置1540と読込/書込み装置1545と入力装置1560と通信インターフェース1550とを互いに通信可能に接続するチップセット1510とを備える。
【0053】
チップセット1510は、メモリ1530と、メモリ1530にアクセスして所定の処理を実行するCPU1500と、外部の表示装置の表示を制御するグラフィックコントローラ1520とを相互に接続することにより、各構成要素間のデータの受渡しを実行する。CPU1500は、メモリ1530に格納されたプログラムに基づいて動作して、各構成要素を制御する。グラフィックコントローラ1520は、メモリ1530内に設けられたバッファ上に一時的に蓄えられた画像データに基づいて、画像を所定の表示装置に表示させる。
【0054】
また、チップセット1510は、記憶装置1540と、読込/書込み装置1545と、通信インターフェース1550とを接続する。記憶装置1540は、相関関係表示システム1のCPU1500が使用するプログラムとデータとを格納する。記憶装置1540は、例えば、フラッシュメモリである。読込/書込み装置1545は、プログラム及び/又はデータを記憶している記憶媒体からプログラム及び/又はデータを読み取って、読み取ったプログラム及び/又はデータを記憶装置1540に格納する。読込/書込み装置1545は、例えば、通信インターフェース1550を介し、インターネット上のサーバーから所定のプログラムを取得して、取得したプログラムを記憶装置1540に格納する。
【0055】
通信インターフェース1550は、通信ネットワークを介して外部の装置とデータの送受信を実行する。また、通信インターフェース1550は、通信ネットワークが不通の場合、通信ネットワークを介さずに外部の装置とデータの送受信を実行することもできる。そして、キーボード、タブレット、マウス等の入力装置1560は、所定のインターフェースを介してチップセット1510と接続する。
【0056】
記憶装置1540に格納される相関関係表示システム1用の相関関係表示プログラムは、インターネット等の通信ネットワーク、又は磁気記録媒体、光学記録媒体等の記録媒体を介して記憶装置1540に提供される。そして、記憶装置1540に格納された相関関係表示システム1用のプログラムは、CPU1500により実行される。
【0057】
本実施の形態に係る相関関係表示システム1により実行される相関関係表示プログラムは、CPU1500に働きかけて、相関関係表示システム1を、
図1から
図3にかけて説明した通信データ取得部10、入力部11、分析部12、ネットワーク分析部14、評価部16、及び表示部18として機能させる。
【0058】
(実施の形態の効果)
一の人物が使用する情報処理装置から他の人物が使用する情報処理装置に送信される通信データ量が多いことが一の人物と他の人物との関係性が高いことを示すとは限らない。しかし、本実施の形態に係る相関関係表示システム1においては、一の人物の情報処理装置から他の人物の情報処理装置へ送信される通信データが予め定められた事案に関連するか否か、及び当該通信データが予め定められた事案に関連する場合、当該通信データの予め定められた事案との関連性の高低を評価した上で各人物の関係性を表示できる。これにより、相関関係表示システム1によれば、予め定められた事案に関連する可能性の高い情報のやり取りをしている人物間の関係性を適切に表示することができる。したがって、相関関係表示システム1によれば、例えば、ディスカバリー等の作業を実行する場合、予め定められた事案に対して関連性が高い人物が送受信する通信データを優先的に参照することができるので、効率よくディスカバリーを実行できる。また、本実施の形態に係る相関関係表示システム1によれば、予め定められた事案に対して関連性が高い人物間の関係性を把握できるので、ディスカバリー等の作業における重要な通信データの見落としを抑制することができる。
【0059】
また、本発明の実施の形態のシステム、方法、プログラムは、人物の関係性のみならず、ドメイン情報の関係性、組織の役職情報、性別情報、国籍、電話通信情報、チャット情報等を表示するものであってもよい。
【0060】
以上、本発明の実施の形態を説明したが、上記に記載した実施の形態は特許請求の範囲に係る発明を限定するものではない。また、実施の形態の中で説明した特徴の組合せのすべてが発明の課題を解決するための手段に必須であるとは限らない点に留意すべきである。更に、上記した実施形態の技術的要素は、単独で適用されてもよいし、プログラム部品とハードウェア部品とのような複数の部分に分割されて適用されるようにすることもできる。