(58)【調査した分野】(Int.Cl.,DB名)
【背景技術】
【0002】
従来、不正アクセスや機密情報漏洩などコンピュータに関する犯罪や法的紛争が生じた際に、原因究明や捜査に必要な機器やデータ、電子的記録を収集・分析し、その法的な証拠性を明らかにする手段や技術が提案されている。
【0003】
また、米国民事訴訟では、eDiscovery(電子証拠開示)等が求められており、当該訴訟の原告および被告のいずれもが、関連するデジタル情報をすべて証拠として提出する責任を負う。そのため、コンピュータやサーバに記録されたデジタル情報を証拠として、提出しなければならない。
【0004】
一方、ITの急速な発達と普及に伴い、今日のビジネスの世界ではほとんどの情報がコンピュータで作成されているため、同一企業内であっても多くのデジタル情報が氾濫している。
【0005】
そのため、法廷への証拠資料提出のための準備作業を行う過程において、当該訴訟に必ずしも関連しない機密なデジタル情報までも証拠資料として含めてしまうミスが生じやすい。また、当該訴訟に関連しない機密な文書データを提出してしまうことが問題になっていた。
【0006】
近年、フォレンジックシステムにおける文書データに関する技術が、特許文献1乃至特許文献3に提案されている。特許文献1には、文書提出命令の対象者情報に含まれる少なくとも1人以上の対象者から、特定の者を指定し、指定された特定の者に関するアクセス履歴情報に基づいて、特定の者がアクセスしたデジタル文書データのみを抽出し、抽出されたデジタル文書データの文書ファイルそれぞれが、訴訟に関連するものであるか否かを示す付帯情報を設定し、付帯情報に基づき、訴訟に関連する文書ファイルを出力するフォレンジックシステムについて開示されている。
【0007】
また、特許文献2には、記録されたデジタル情報を表示し、複数の文書ファイル毎に、対象者情報に含まれる対象者のうちいずれの対象者に関連するものであるかを示す対象者特定情報を設定し、該設定された対象者特定情報を記憶部に記録するように設定し、少なくとも一人以上の対象者を指定し、指定された対象者に対応する対象者特定情報が設定された文書ファイルを検索し、表示部を介して、検索された文書ファイルが、訴訟に関連するものであるか否かを示す付帯情報を設定し、付帯情報に基づき、訴訟に関連する文書ファイルを出力するフォレンジックシステムについて開示されている。
【0008】
さらに、特許文献3には、デジタル文書データに含まれる少なくとも1以上の文書ファイルの指定を受け付け、指定された文書ファイルをいずれの言語に翻訳するかの指定を受け付け、指定を受け付けた文書ファイルを、指定を受け付けた言語に翻訳し、記録部に記録されたデジタル文書データから、指定された文書ファイルと同一の内容を示す共通文書ファイルを抽出し、抽出された共通文書ファイルが、翻訳された文書ファイルの翻訳内容を援用することにより翻訳されたことを示す翻訳関連情報を生成し、翻訳関連情報に基づいて、訴訟に関連する文書ファイルを出力するフォレンジックシステムについて開示されている。
【発明を実施するための形態】
【0045】
[第1の実施形態]
以下、本発明の第1の実施形態を
図1乃至
図5を用いて説明する。
【0046】
本発明の第1の実施形態に係るフォレンジックシステムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックシステムにおいて、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得する判断取得部111と、判断取得部111が取得した、実績情報を記録する記録部112と、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成する予測情報生成部113と、実績情報および予測情報を比較する情報比較部114と、情報比較部114の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成するアイコン生成部115とを備える。
【0047】
フォレンジックシステムは、コンピュータまたはサーバを備え、各種入力に基づきCPUがROMに記録されたプログラムを実行することで、各種機能部として動作する。該プログラムは、CD−ROM等の記憶媒体に記憶され、もしくはインターネット等のネットワークを介して配布され、コンピュータにインストールされるものであってもよい。
【0048】
本実施形態においては、レビュワーと呼ばれる利用者が、文書データの中から、訴訟に提出が必要な文書を抽出するために、訴訟との関連性の判断を行う。関連性判断は、関連性の度合いに応じて分別符号を付与するものとしてもよい。この、システム又は利用者が訴訟に関連するか否かを判断する行為をレビューという。レビューでは、レビューの対象となる文書データを、訴訟の関連の度合いや、訴訟との関連の仕方に基づいて、複数の種類に分類を行う。
【0049】
文書データは、1つ以上の単語を含む情報をいう。文書データの一例として、電子メール、プレゼンテーション資料、表計算資料、打ち合わせ資料、契約書、組織図、事業計画書等が挙げられる。また、スキャンデータを文書データとして扱うことも可能である。この場合、スキャンデータをテキストデータへと変換できるように、フォレンジックシステム内にOCR(Optical Character Reader)装置を備えてもよい。
【0050】
図1は、第1の実施形態におけるフォレンジックシステムのブロック図を示している。本実施形態において、フォレンジックシステムは、サーバ装置100と、クライアント端末200とを備えている。
【0051】
サーバ装置100とクライアント端末200とは通信ネットワークを介して接続されている。通信ネットワークは、有線あるいは無線の通信回線をいう。例えば、電話回線、インターネット回線等である。
【0052】
サーバ装置100は、判断取得部111と、記録部112と、予測情報生成部113と、情報比較部114と、アイコン生成部115とを備えている。
【0053】
本実施形態において、各構成はサーバ装置100上に搭載されているが、それぞれ別筐体に搭載されるものであってもよい。
【0054】
クライアント端末200は、コンピュータであり、
図2に示すレビュー画面I1を表示する画面表示部211および指示部290(
図1では図示を省略)を有している。
【0055】
画面表示部211は、表示用のディスプレイ(液晶ディスプレイ、CRTモニター、有機ELディスプレイ等)をいう。また、指示部290はマウスまたはキーボードをいう。
【0056】
利用者は、クライアント端末200を介して、サーバ装置100と接続し、画面表示部211が表示するレビュー画面I1上でレビューを行う。
【0057】
図1を用いて各構成要素の機能について説明する。
【0058】
判断取得部111は、利用者が文書データに行った関連性判断の実績情報を取得する。実績情報は、結果情報および進捗情報のうち少なくともいずれかを含んでいる。
【0059】
結果情報は、利用者が文書データに対して行った、訴訟との関連性判断の結果、つまり関連性の有無を示すものをいう。利用者が文書データに付与した、訴訟との関連性の度合いを表す分別符号を指してもよい。
【0060】
進捗情報は、利用者の関連性判断の速度に関するものをいう。具体的には、単位時間当たりに利用者が関連性判断を行った文書データ数を指す。なお、関連性判断が必要な全文書データに対する、単位時間当たりの関連性判断を行った文書データ数としてもよい。本実施形態では、判断情報取得部は、ある利用者がある文書データの関連性判断にかかった時間および、該文書データのデータ容量を取得し、時間で容量を割った値から、進捗情報を取得する。
【0061】
記録部112は、判断取得部111が取得した実績情報を記録する。本実施形態においては、サーバ装置100内のハードディスク上に記録するが、サーバ装置100外に設置されたデータベースとしてもよい。
【0062】
予測情報生成部113は、予測情報を生成する。予測情報は、利用者の関連性判断を予測したものをいう。結果情報および進捗情報のうち少なくともいずれか1つを含んでいる。また予測情報生成部113は、取得した結果情報から利用者の関連性判断の特徴を解析し、該解析の結果に基づいて、結果情報に関する予測情報を生成するものとしてもよい。また、予測情報生成部113は、更に、他の利用者の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成するものとしてもよい。また、予測情報生成部113は、更に、利用者の過去の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成するものとしてもよい。
【0063】
本実施形態において、予測情報生成部113は、利用者が関連性の判断を行った文書データの類似の文書データに対して、結果情報に関する予測情報を生成する。後述する実施例2の方法を用いて結果情報に関する予測情報を生成するものとしてもよい。また、予測情報生成部113は、判断取得部111が取得したこれまでの進捗情報から、次の単位時間あたりに利用者がレビューする文書データ数およびデータ容量を予測することも可能である。
【0064】
情報比較部114は、実績情報と予測情報とを比較する。なお、予測情報と実績情報が同じ情報を含む場合に比較する。具体的には、それぞれが結果情報を含む予測情報と実績情報とを比較するものとしてもよいし、それぞれが進捗情報を含む予測情報と実績情報とを比較するものとしてもよい。また、それぞれが結果情報および進捗情報の双方を含む予測情報と実績情報とを比較するものとしてもよい。
【0065】
情報比較部114は、比較した結果をアイコン生成部115に通知する。
【0066】
アイコン生成部115は、比較結果に基づいてアイコンを生成する。また、アイコン生成部115は、比較結果に基づいて、アイコンの動作、セリフ、表情の少なくともいずれか1つの表示形式を変更するものとしてもよい。
【0067】
アイコンは、利用者に対して評価を呈示するものをいう。キャラクターのような親しみを感じやすいものとしてもよい。
図3は、本実施形態におけるアイコン生成部115がアイコンを呈示した状態のレビュー画面I1の模式図である。
図3のa1は、アイコン生成部115が生成したアイコンを、
図3のb1はその評価内容をセリフとして表している。
【0068】
評価は、利用者が行った関連性判断に対するフィードバックをいう。比較結果に基づくものとしてもよい。具体的には、例えば、予測情報として予測した進捗情報よりも実績情報として取得した進捗情報が有意に遅い場合に、判断速度の向上を促すコメントを評価として呈示するものとしてもよい。また、予測した結果情報と実績として取得した結果情報が異なる場合に、注意喚起する評価を呈示してもよい。
【0069】
アイコン生成部115の処理を、情報比較部114が、進捗情報に関する実績情報と予測情報とを比較した場合を例にして具体的に説明する。
図4はアイコン生成部115が生成するアイコンの例である。これまでの実績情報から、予測情報生成部113の予測した予測情報が単位時間当たり文書データ50件とする。
【0070】
図4の(A1)は、困った表情で、首をかしげるという動作をしながら、「今日はどうしたの?」というセリフを言うアイコンを示している。これは、判断情報取得部が取得した実績情報が、50件より有意に少なかった場合に、生成される。これによって、利用者にレビュー速度の向上を促すことが可能となる。
【0071】
図4の(A2)は、笑った表情で、応援しながら、「その調子で頑張って」というセリフを言うアイコンを示している。このアイコンは、予測情報と実績情報のどちらも同じ進捗情報であった場合に生成される。これにより、利用者に現状のペースでレビューを行っていれば問題ない、と自信を持たせることが可能となる。
【0072】
図4の(A3)は、苦しそうな表情で、走りながら、「しっかり注意も必要だよ」というセリフを言うアイコンを示している。このアイコンは、実績情報が予測情報のペースを上回っている場合に、利用者の注意を喚起するために生成される。これにより、利用者が文書データを注意深く読まずに関連性判断を行うことを抑止することが可能となる。
【0073】
次に、
図5を用いて、本実施形態に係るフォレンジックシステムの処理フローについて説明する。
【0074】
利用者がある文書データ(文書1)について関連性ありと判断を行うと(STEP101)、判断情報取得部が文書1についての実績情報を取得する(STEP102)。具体的には、文書1が訴訟と関連性がある、という結果情報と、文書1について判断するのにかかった時間で文書1のデータサイズを割った値から求められる進捗情報を実績情報として取得する。取得された実績情報は、記録部112によってサーバ装置100のハードディスクに記録される(STEP103)。
【0075】
次に、予測情報生成部113が、過去の実績情報や他の利用者の実績情報から予測情報を生成する(STEP104)。情報比較部114が、実績情報と予測情報を比較する(STEP105)。アイコン生成部115が、比較結果をもとにアイコンを生成し、利用者に対して関連性判断の評価を随時呈示する(STEP106)。
【0076】
[第2の実施形態]
以下、本発明の第2の実施形態を
図6乃至
図8を用いて説明する。
【0077】
本発明の第2の実施形態に係るフォレンジックシステムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックシステムにおいて、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得する判断取得部111と、判断取得部111が取得した、実績情報を記録する記録部112と、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成する予測情報生成部113と、実績情報および予測情報を比較する情報比較部114と、情報比較部114の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成するアイコン生成部115とを備える。
【0078】
また、本実施形態に係るフォレンジックシステムは、更に、デジタル情報から所定数の文書データを抽出する抽出部121と、抽出された文書データを画面上に表示する表示部122と、表示された文書データに対して、利用者が行った関連性の判断結果を受け付ける結果受付部123と、判断結果に基づいて、抽出された文書データを判断結果ごとに分別し、該分別された文書データにおいて、共通して出現するキーワードを解析し、選定する選定部124と、選定したキーワードを記録するキーワード記録部125と、キーワード記録部125に記録されたキーワードを文書データから探索する探索部126と、探索部126の探索結果と選定部124の解析結果を用いて、判断結果と文書データとの関連性を示すスコアを算出するスコア算出部127とを備え、予測情報生成部113は、スコアを用いて結果情報に関する予測情報を生成するものである。
【0079】
図6は、本実施形態に係るフォレンジックシステムのブロック図を示している。
【0080】
サーバ装置100は、判断取得部111と、記録部112と、予測情報生成部113と、情報比較部114と、アイコン生成部115と、抽出部121と、表示部122と、結果受付部123と、選定部124と、キーワード記録部125と、探索部126と、スコア算出部127とを備えている。
【0081】
本実施形態において、各構成はサーバ装置100上に搭載されているが、それぞれ別筐体に搭載されるものであってもよい。
【0082】
クライアント端末200は、
図2に示すレビュー画面I1を表示する画面表示部211を有している。レビュワーと呼ばれる利用者は、クライアント端末200を介して、サーバ装置100と接続し、レビュー画面I1上でレビューを行う。
【0083】
図6を用いて各構成要素の機能について説明する。
【0084】
抽出部121は、デジタル情報から文書データを抽出する。抽出する際には、デジタル情報からランダムにサンプリングする。また、文書データの更新日時等の属性に基づいて抽出するものとしてもよい。
【0085】
表示部122は、抽出した文書データを表示する。具体的には、抽出した文書データを利用者が利用するクライアント端末200上に表示するよう指示を出す。
【0086】
結果受付部123は、利用者の関連性判断の結果を受け付ける。
【0087】
選定部124は、キーワードを選定する。同一の判断結果がなされた文書データに共通して出現するキーワードを解析し、選定するものとしてもよい。
【0088】
図7は、関連性ありと判断された文書データに共通して頻出するキーワードを選定部124が解析した結果のグラフである。
図7において、縦軸R_hotは、ユーザによって関連性がありと判断された全文書データのうち、関連性がありと判断される文書データに紐づくキーワードとして選定されたキーワードを含み、かつ関連性がありと判断された文書データの割合を示している。横軸R_allは、利用者がレビューを実施した全文書データのうち、後述する探索部126によって探索されたキーワードを含む文書データの割合を示している。本実施形態において、選定部124では、直線R_hot=R_allよりも上部にプロットされるキーワードを、関連性ありと判断される文書データに共通のキーワードとして選定する。
【0089】
キーワードは、ある言語において、一定の意味を持つ文字列のまとまりをいう。例えば、「文書を分別する」という文章のキーワードは、「文書」「分別」「する」としてもよい。
【0090】
キーワード記録部125は、キーワードを記録するものをいう。データベースとしてもよい。
【0091】
探索部126は、キーワードを文書データから探索するものをいう。
【0092】
スコア算出部127は、文書データのスコアを算出するものをいう。文書データに含まれるキーワードの評価値に基づいてスコアを算出するものとしてもよい。評価値は、文書データ中のキーワードの出現頻度や伝達情報量に基づいて算出され、各キーワードがある文書データ中で発揮する情報量をいってもよい。
【0093】
スコアは、ある文書データにおいて、訴訟との関連度合を示すものをいう。スコアは文書データに含まれるキーワードに基づいて算出される。例えば、訴訟時に提出する必要が高いキーワードが含まれる文書データほど、高いスコアを有するとしてもよい。文書データは、一定の要件に基づいてスコアの初期値を与えられるものとしてもよい。例えば、文書データに出現するキーワードと、各キーワードの持つ評価値とにより初期スコアを算出するものとしてもよい。
【0094】
スコア算出部127は、文書群中に出現するキーワードと、各キーワードの持つ重みづけにより、以下の式からスコアを算出することが可能である。
【0095】
【数1】
各キーワードがもつ重みづけは、該キーワードが持つ伝達情報量をもとに決定する。該重みづけは以下の式により、学習することが可能である。
【0097】
予測情報生成部113は、スコア算出部127が算出したスコアに基づいて、結果情報に関する予測情報を生成する。具体的には、所定の閾値をスコアが超過した文書データについては、関連性ありと予測し、閾値を超過しない文書データに対しては関連性なしと予測して予測情報を生成する。
【0098】
図8を用いて、本実施形態における予測情報生成処理のフローについて説明する。まず、抽出部121が、デジタル情報から所定数の文書データを抽出する(STEP201)。抽出された文書データを、表示部122がクライアント端末200の画面上に表示させる(STEP202)。結果受付部123が利用者の関連性判断の結果を受け付け(STEP203)、選定部124が利用者の関連性判断の結果から文書データを解析し、キーワードを選定する(STEP204)。選定されたキーワードはキーワード記録部125によって記録される(STEP205)。次に、各文書データから記録されたキーワードを探索部126が探索し(STEP206)、スコア算出部127が式(1)を用いて各文書データのスコアを算出する(STEP207)。算出されたスコアに基づいて、予測情報生成部113が、結果情報に関する予測情報を生成する(STEP208)。
【0099】
その他の構成、機能については第1の実施形態と同様である。
【0100】
[その他の実施形態]
アイコン生成部115は、第1の実施形態および第2の実施形態で示した以外にも、利用者が現在レビューを行っている文書データの内容に基づいても評価を呈示することが可能である。
【0101】
例えば、文書データの作成日時、作成者、セキュリティレベルに基づいて呈示するものとしてもよい。具体的には、訴訟と関連性の高い人物が作成した文書データに対して、利用者がレビューを行う際に、特に注意喚起を促すようなアイコンを生成し、評価を呈示するものとしてもよい。
【0102】
その他の構成、機能については第1の実施形態と同様である。
【0103】
フォレンジックシステムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックシステムにおいて、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得する判断取得部111と、判断取得部111が取得した、実績情報を記録する記録部112と、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成する予測情報生成部113と、実績情報および予測情報を比較する情報比較部114と、情報比較部114の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成するアイコン生成部115とを備える際には、アイコンがレビューの進捗状況または、レビュー中の文書データの訴訟との関連度合に応じて、利用者に適宜フィードバックを実施することにより、利用者のモチベーションを維持し、レビューの効率化を図ることを可能となる。
【0104】
また、予測情報生成部113が、取得した結果情報から利用者の関連性判断の特徴を解析し、解析の結果に基づいて、結果情報に関する予測情報を生成する際においては、ある文書データに対して、利用者の関連性判断の結果をシステムが予測し、該予測結果と実際の利用者の判断結果が異なる場合に、利用者に対して注意喚起を行うことが可能となる。
【0105】
また、予測情報生成部113が、更に、他の利用者の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成する際においては、他の利用者の関連性判断の結果から、ある文書データに対しての特定の利用者の判断結果をシステムが予測し、該予測結果と実際の利用者の判断結果が異なる場合に、特定の利用者に対して注意喚起を行うことが可能となる。
【0106】
また、予測情報生成部113が、更に、利用者の過去の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成する際においては、ある利用者の過去の進捗速度からレビューの進捗速度を予測し、予測した進捗速度と実際の利用者の進捗速度が異なる場合に、利用者に対して注意喚起を行うことが可能となる。
【0107】
また、アイコン生成部115が、比較結果に基づいて、アイコンの動作、セリフ、表情の少なくともいずれか1つの表示形式を変更する際においては、利用者の状況に応じて適切な評価を呈示することが可能となる。
以上説明したように、本願発明に係るフォレンジック分析システムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジック分析システムにおいて、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得する判断取得部と、判断取得部が取得した、実績情報を記録する記録部と、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成する予測情報生成部と、実績情報および予測情報を比較する情報比較部と、情報比較部の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成するアイコン生成部とを備える。
「文書データ」は、1つ以上の単語を含む情報をいう。文書データの一例として、電子メール、プレゼンテーション資料、表計算資料、打ち合わせ資料、契約書、組織図、事業計画書等が挙げられる。
「関連性判断」は、文書データに対して、訴訟への提出の必要の有無を判断するものをいう。関連性判断は、関連性の度合いに応じて分別符号を付与するものとしてもよい。
「結果情報」は、利用者が文書データに対して行った、訴訟との関連性判断の結果を示すものをいう。結果情報は、利用者が文書データに付与した、訴訟との関連性の度合いを表す分別符号を指してもよい。
「進捗情報」は、利用者の関連性判断の速度に関するものをいう。進捗情報は、単位時間当たりに利用者が関連性判断を行った文書データ数を指してもよい。また、進捗情報は、関連性判断が必要な全文書データに対する、単位時間当たりの関連性判断を行った文書データ数としてもよい。
「実績情報」は、結果情報または進捗情報のうち少なくともいずれか1つに関するものをいう。実績情報は、結果情報および進捗情報の双方を含むものとしてもよい。
「判断取得部」は、利用者が文書データに対して行った判断結果に関する情報を取得するものをいう。
「記録部」は、実績情報を記録するものをいう。
「予測情報」は、利用者の関連性判断を予測したものをいう。予測情報は、結果情報または進捗情報のうち少なくともいずれか1つに関するものとしてもよい。
「予測情報生成部」は、予測情報を生成するものをいう。予測情報生成部は、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成するものとしてもよい。また予測情報生成部は、取得した結果情報から利用者の関連性判断の特徴を解析し、該解析の結果に基づいて、結果情報に関する予測情報を生成するものとしてもよい。また、予測情報生成部は、更に、他の利用者の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成するものとしてもよい。また、予測情報生成部は、更に、利用者の過去の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成するものとしてもよい。
「情報比較部」は、複数の情報を比較するものをいう。情報比較部は、予測情報と実績情報が同じ情報を含む場合に比較するものとしてもよい。具体的には、情報比較部は、それぞれが結果情報を含む予測情報と実績情報とを比較するものとしてもよいし、それぞれが進捗情報を含む予測情報と実績情報とを比較するものとしてもよい。また、情報比較部は、それぞれが結果情報および進捗情報の双方を含む予測情報と実績情報とを比較するものとしてもよい。
「評価」は、利用者が行った関連性判断に対するフィードバックをいう。評価は、比較結果に基づくものとしてもよい。具体的には、例えば、予測情報として予測した進捗情報よりも実績情報として取得した進捗情報が有意に遅い場合に、判断速度の向上を促すコメントを評価として呈示するものとしてもよい。また、予測した結果情報と実績として取得した結果情報が異なる場合に、注意喚起する評価を呈示してもよい。
「アイコン」は、利用者に対して評価を呈示する簡単な絵柄で表現されたものをいう。例えば、アイコンは、キャラクターのような親しみを感じやすいものとしてもよい。
「アイコン生成部」は、比較結果に基づいてアイコンを生成するものをいう。また、アイコン生成部は、比較結果に基づいて、アイコンの動作、セリフ、表情の少なくともいずれか1つの表示形式を変更するものとしてもよい。また、アイコン生成部は、利用者が関連性判断を行っている文書データの内容に応じても評価を呈示するものとしてもよい。例えば、特定の年代に作成された文書データに対して利用者が関連性判断を行っている場合に、注意を喚起するような評価を呈示するものとしてもよい。
また、本発明に係るフォレンジック分析システムは、更に、デジタル情報から所定数の文書データを抽出する抽出部と、抽出された文書データを画面上に表示する表示部と、表示された文書データに対して、利用者が行った関連性の判断結果を受け付ける結果受付部と、判断結果に基づいて、抽出された文書データを判断結果ごとに分別し、該分別された文書データにおいて、共通して出現するキーワードを解析し、選定する選定部と、選定したキーワードを記録するキーワード記録部と、キーワード記録部に記録されたキーワードを文書データから探索する探索部と、探索部の探索結果と選定部の解析結果を用いて、判断結果と文書データとの関連性を示すスコアを算出するスコア算出部とを備え、予測情報生成部は、スコアを用いて結果情報に関する予測情報を生成するものとしてもよい。
「抽出部」は、デジタル情報から文書データを抽出するものをいう。抽出部は、ランダムにサンプリングし抽出するものとしてもよい。また、文書データの更新日時等の属性に基づいて抽出するものとしてもよい。
「表示部」は、抽出した文書データを表示する。表示部は、利用者が利用するクライアント端末上に表示するものとしてもよい。
「結果受付部」は、利用者の関連性判断の結果を受け付けるものをいう。
「選定部」は、キーワードを選定するものをいう。選定部は、同一の判断結果がなされた文書データに共通して出現するキーワードを解析し、選定するものとしてもよい。
「キーワード」は、ある言語において、一定の意味を持つ文字列のまとまりをいう。例えば、「文書を分別する」という文章のキーワードは、「文書」「分別」「する」としてもよい。
「キーワード記録部」は、キーワードを記録するものをいう。キーワード記録部は、データベースとしてもよい。
「探索部」は、キーワードを文書データから探索するものをいう。
「スコア算出部」は、文書データのスコアを算出するものをいう。スコア算出部は、文書データに含まれるキーワードの評価値に基づいてスコアを算出するものとしてもよい。スコア算出部は、評価値は各キーワードが、ある文書データ中で発揮する情報量をいってもよい。評価値は、文書データ中のキーワードの出現頻度や伝達情報量に基づいて算出するとしてもよい。
「スコア」は、ある文書データにおいて、訴訟との関連度合を示すものをいう。スコアは文書データに含まれるキーワードに基づいて算出される。例えば、訴訟時に提出する必要が高いキーワードが含まれる文書データほど、高いスコアを有するとしてもよい。文書データは、一定の要件に基づいてスコアの初期値を与えられるものとしてもよい。例えば、文書データに出現するキーワードと、各キーワードの持つ評価値とにより初期スコアを算出するものとしてもよい。
また、本発明に係るフォレンジック分析方法は、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジック分析方法において、コンピュータが、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得するステップと、取得した、実績情報を記録するステップと、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成するステップと、実績情報および予測情報を比較するステップと、情報比較部の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成するステップとを実行する。
また、本発明に係るフォレンジック分析プログラムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジック分析プログラムにおいて、コンピュータに、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得させる機能と、取得した、実績情報を記録させる機能と、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成させる機能と、実績情報および予測情報を比較させる機能と、情報比較部の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成させる機能とを実現する。
本発明のフォレンジック分析システムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジック分析システムにおいて、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得する判断取得部と、判断取得部が取得した、実績情報を記録する記録部と、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成する予測情報生成部と、実績情報および予測情報を比較する情報比較部と、情報比較部の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成するアイコン生成部とを備える際には、アイコンがレビューの進捗状況または、レビュー中の文書データの訴訟との関連度合に応じて、利用者に適宜フィードバックを実施することにより、利用者のモチベーションを維持し、レビューの効率化を図ることを可能となる。
また、本発明に係る予測情報生成部が、取得した結果情報から利用者の関連性判断の特徴を解析し、解析の結果に基づいて、結果情報に関する予測情報を生成する際においては、ある文書データに対して、利用者の関連性判断の結果をシステムが予測し、該予測結果と実際の利用者の判断結果が異なる場合に、利用者に対して注意喚起を行うことが可能となる。
また、本発明に係る予測情報生成部が、更に、他の利用者の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成する際においては、他の利用者の関連性判断の結果から、ある文書データに対しての特定の利用者の判断結果をシステムが予測し、該予測結果と実際の利用者の判断結果が異なる場合に、特定の利用者に対して注意喚起を行うことが可能となる。
また、本発明に係る予測情報生成部が、更に、利用者の過去の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成する際においては、ある利用者の過去の進捗速度からレビューの進捗速度を予測し、予測した進捗速度と実際の利用者の進捗速度が異なる場合に、利用者に対して注意喚起を行うことが可能となる。
また、本発明に係るアイコン生成部は、比較結果に基づいて、アイコンの動作、セリフ、表情の少なくともいずれか1つの表示形式を変更する際においては、利用者の状況に応じて適切な評価を呈示することが可能となる。