特許第6404294号(P6404294)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社UBICの特許一覧

特許6404294フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム
<>
  • 特許6404294-フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム 図000004
  • 特許6404294-フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム 図000005
  • 特許6404294-フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム 図000006
  • 特許6404294-フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム 図000007
  • 特許6404294-フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム 図000008
  • 特許6404294-フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム 図000009
  • 特許6404294-フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム 図000010
  • 特許6404294-フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム 図000011
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6404294
(24)【登録日】2018年9月21日
(45)【発行日】2018年10月10日
(54)【発明の名称】フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム
(51)【国際特許分類】
   G06Q 50/18 20120101AFI20181001BHJP
【FI】
   G06Q50/18
【請求項の数】10
【全頁数】18
(21)【出願番号】特願2016-200476(P2016-200476)
(22)【出願日】2016年10月11日
(62)【分割の表示】特願2012-224584(P2012-224584)の分割
【原出願日】2012年10月9日
(65)【公開番号】特開2017-4571(P2017-4571A)
(43)【公開日】2017年1月5日
【審査請求日】2016年11月9日
(73)【特許権者】
【識別番号】304063864
【氏名又は名称】株式会社UBIC
(74)【代理人】
【識別番号】100093861
【弁理士】
【氏名又は名称】大賀 眞司
(74)【代理人】
【識別番号】100129218
【弁理士】
【氏名又は名称】百本 宏之
(72)【発明者】
【氏名】守本 正宏
(72)【発明者】
【氏名】白井 喜勝
(72)【発明者】
【氏名】武田 秀樹
(72)【発明者】
【氏名】蓮子 和巳
【審査官】 岸 健司
(56)【参考文献】
【文献】 特開2010−092099(JP,A)
【文献】 特開2011−209930(JP,A)
【文献】 米国特許出願公開第2012/0233115(US,A1)
【文献】 特開2011−107836(JP,A)
【文献】 特開2009−047804(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00−99/00
(57)【特許請求の範囲】
【請求項1】
デジタル情報を記録するメモリと、
前記デジタル情報を分析するコントローラと、
を備えるフォレンジックシステムであって、
前記コントローラは、
前記デジタル情報から複数の文書データを抽出し、
前記複数の文書データに対して、訴訟との関連性に関する入力を利用者に実行させ、
前記入力に基づいて、前記関連性を複数の種類のうち何れかの種類に分別する第1の情報と、前記入力の速度に関する第2の情報と、のうち少なくとも1つを、前記利用者の実績情報として前記入力に係る文書データに設定し、
前記設定された実績情報に基づいて、前記利用者にレビューされる文書データについて前記関連性の入力に関する予測情報を生成し、
前記文書データに実績情報が設定された場合、当該実績情報と前記予測情報とを比較し、
前記実績情報と、前記予測情報と、が異なる場合、前記利用者に注意を喚起するデータを生成して出力する
フォレンジックシステム。
【請求項2】
前記コントローラは、
前記第2の情報に関する実績情報と、前記第2の情報に関する予測情報と、が同じ場合、前記入力の速度に問題がないことを前記利用者に知らせるデータを生成して出力する、
請求項1記載のフォレンジックシステム。
【請求項3】
前記コントローラは、
前記第2の情報に関する実績情報が、前記第2の情報に関する予測情報より早い場合、前記利用者にレビューを注意して行うことを促すデータを生成して出力する、
請求項1または2記載のフォレンジックシステム。
【請求項4】
前記コントローラは、
前記第2の情報に関する実績情報が、前記第2の情報に関する予測情報より遅い場合、前記利用者に前記入力を早めるように促すデータを生成して出力する、
請求項1から3いずれか1項記載のフォレンジックシステム。
【請求項5】
前記コントローラは、
前記複数の文書データに対して、前記訴訟との関連性が高い人物が当該文書データを作成したか否かをそれぞれ判定し、
前記作成したと判定された場合、前記利用者が前記入力を実行する際に、前記利用者に注意を喚起するデータを生成して出力する、
請求項1から4いずれか1項記載のフォレンジックシステム。
【請求項6】
前記コントローラは、
前記入力を複数の利用者に実行させ、
第1の利用者に対応する前記第2の情報に関する予測情報を、第2の利用者に対応する前記第2の情報に関する実績情報に基づいて生成する、
請求項1から5いずれか1項記載のフォレンジックシステム。
【請求項7】
前記データは、アイコンを示すデータまたはメッセージを示すデータを含み、
前記コントローラは、
前記比較した結果に基づいて、前記アイコンの動作、前記アイコンの態様、前記メッセージの少なくともいずれか1つの表示形式を変更する、
請求項1から6いずれか1項記載のフォレンジックシステム。
【請求項8】
前記コントローラは、
前記文書データに含まれるキーワードに基づいて前記訴訟との関連性を示すスコアを算出することにより、前記文書データを評価し、
前記スコアを用いて、前記文書データに対応する前記第1の情報に関する予測情報を生成する
請求項1から7いずれか1項記載のフォレンジックシステム。
【請求項9】
メモリに記録されたデジタル情報を、コントローラが、フォレンジックプログラムに基づいて分析するフォレンジック方法であって、
前記コントローラは、
前記デジタル情報から複数の文書データを抽出するステップと、
前記複数の文書データに対して、訴訟との関連性に関する入力を利用者に実行させるステップと、
前記入力に基づいて、前記関連性を複数の種類のうち何れかの種類に分別する第1の情報と、前記入力の速度に関する第2の情報と、のうち少なくとも1つを、前記利用者の実績情報として前記入力に係る文書データに設定するステップと、
前記設定された実績情報に基づいて、前記利用者にレビューされる文書データについて前記関連性の入力に関する予測情報を生成するステップと、
前記文書データに実績情報が設定された場合、当該実績情報と前記予測情報とを比較するステップと、
前記実績情報と、前記予測情報と、が異なる場合、前記利用者に注意を喚起するデータを生成して出力するステップと、
を備えるフォレンジック方法。
【請求項10】
メモリに記録されたデジタル情報をコンピュータに分析させるためのフォレンジックプログラムであって、
前記デジタル情報から複数の文書データを抽出する機能と、
前記複数の文書データに対して、訴訟との関連性に関する入力を利用者に実行させる機能と、
前記入力に基づいて、前記関連性を複数の種類のうち何れかの種類に分別する第1の情報と、前記入力の速度に関する第2の情報と、のうち少なくとも1つを、前記利用者の実績情報として前記入力に係る文書データに設定する機能と、
前記設定された実績情報に基づいて、前記利用者にレビューされる文書データについて前記関連性の入力に関する予測情報を生成する機能と、
前記文書データに実績情報が設定された場合、当該実績情報と前記予測情報とを比較する機能と、
前記実績情報と、前記予測情報と、が異なる場合、前記利用者に注意を喚起するデータを生成して出力する機能と、
をコンピュータに実現させるためのフォレンジックプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラムに関するものであって、特に、訴訟に関連する文書データを収集するためのフォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラムに関する。
【背景技術】
【0002】
従来、不正アクセスや機密情報漏洩などコンピュータに関する犯罪や法的紛争が生じた際に、原因究明や捜査に必要な機器やデータ、電子的記録を収集・分析し、その法的な証拠性を明らかにする手段や技術が提案されている。
【0003】
また、米国民事訴訟では、eDiscovery(電子証拠開示)等が求められており、当該訴訟の原告および被告のいずれもが、関連するデジタル情報をすべて証拠として提出する責任を負う。そのため、コンピュータやサーバに記録されたデジタル情報を証拠として、提出しなければならない。
【0004】
一方、ITの急速な発達と普及に伴い、今日のビジネスの世界ではほとんどの情報がコンピュータで作成されているため、同一企業内であっても多くのデジタル情報が氾濫している。
【0005】
そのため、法廷への証拠資料提出のための準備作業を行う過程において、当該訴訟に必ずしも関連しない機密なデジタル情報までも証拠資料として含めてしまうミスが生じやすい。また、当該訴訟に関連しない機密な文書データを提出してしまうことが問題になっていた。
【0006】
近年、フォレンジックシステムにおける文書データに関する技術が、特許文献1乃至特許文献3に提案されている。特許文献1には、文書提出命令の対象者情報に含まれる少なくとも1人以上の対象者から、特定の者を指定し、指定された特定の者に関するアクセス履歴情報に基づいて、特定の者がアクセスしたデジタル文書データのみを抽出し、抽出されたデジタル文書データの文書ファイルそれぞれが、訴訟に関連するものであるか否かを示す付帯情報を設定し、付帯情報に基づき、訴訟に関連する文書ファイルを出力するフォレンジックシステムについて開示されている。
【0007】
また、特許文献2には、記録されたデジタル情報を表示し、複数の文書ファイル毎に、対象者情報に含まれる対象者のうちいずれの対象者に関連するものであるかを示す対象者特定情報を設定し、該設定された対象者特定情報を記憶部に記録するように設定し、少なくとも一人以上の対象者を指定し、指定された対象者に対応する対象者特定情報が設定された文書ファイルを検索し、表示部を介して、検索された文書ファイルが、訴訟に関連するものであるか否かを示す付帯情報を設定し、付帯情報に基づき、訴訟に関連する文書ファイルを出力するフォレンジックシステムについて開示されている。
【0008】
さらに、特許文献3には、デジタル文書データに含まれる少なくとも1以上の文書ファイルの指定を受け付け、指定された文書ファイルをいずれの言語に翻訳するかの指定を受け付け、指定を受け付けた文書ファイルを、指定を受け付けた言語に翻訳し、記録部に記録されたデジタル文書データから、指定された文書ファイルと同一の内容を示す共通文書ファイルを抽出し、抽出された共通文書ファイルが、翻訳された文書ファイルの翻訳内容を援用することにより翻訳されたことを示す翻訳関連情報を生成し、翻訳関連情報に基づいて、訴訟に関連する文書ファイルを出力するフォレンジックシステムについて開示されている。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】特開2011−209930号公報
【特許文献2】特開2011−209931号公報
【特許文献3】特開2012−32859号公報
【発明の概要】
【発明が解決しようとする課題】
【0010】
しかしながら、例えば、特許文献1乃至特許文献3のようなフォレンジックシステムおいては、複数のコンピュータおよびサーバを利用した対象者の膨大な文書データを収集することになる。
【0011】
このようなデジタル化された膨大な文書データを訴訟の証拠資料として妥当であるか否かの分別を行う、「レビュー」と言われる作業は、「レビュワー」と呼ばれる利用者が目視により確認し、当該文書データをひとつひとつ分別していく必要があり、レビュワーの能力や体調に応じて、分別作業の精度や効率が左右されるという問題があった。
【0012】
そこで、本発明は、上記事情に鑑み、実績情報と予測情報とが異なる場合、利用者に注意を喚起するデータを生成して出力することにより、利用者のモチベーションを維持し、レビューの効率化を図ることを可能とするフォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラムを提供することを目的とするものである。
【課題を解決するための手段】
【0013】
本発明は、デジタル情報を記録するメモリと、前記デジタル情報を分析するコントローラと、を備えるフォレンジックシステムであって、前記コントローラは、前記デジタル情報から複数の文書データを抽出し、前記複数の文書データに対して、訴訟との関連性に関する入力を利用者に実行させ、前記入力に基づいて、前記関連性を複数の種類のうち何れかの種類に分別する第1の情報と、前記入力の速度に関する第2の情報と、のうち少なくとも1つを、前記利用者の実績情報として前記入力に係る文書データに設定し、前記設定された実績情報に基づいて、前記利用者にレビューされる文書データについて前記関連性の入力に関する予測情報を生成し、前記文書データに実績情報が設定された場合、当該実績情報と前記予測情報とを比較し、前記実績情報と、前記予測情報と、が異なる場合、前記利用者に注意を喚起するデータを生成して出力する、ことを特徴とする。本発明はさらにフォレンジック方法、及び、フォレンジックプログラムである。
【発明の効果】
【0039】
本発明のフォレンジックシステムによれば、実績情報と予測情報とが異なる場合、利用者に注意を喚起するデータを生成して出力することにより、利用者のモチベーションを維持し、レビューの効率化を図ることが可能になる。
【図面の簡単な説明】
【0044】
図1】本発明の第1の実施形態におけるフォレンジックシステムのブロック図
図2】本発明の第1の実施形態におけるレビュー画面を模式的に示した図
図3】本発明の第1の実施形態におけるレビュー画面を模式的に示した図
図4】本発明の第1の実施形態におけるアイコン生成部が生成するアイコンを例示した図
図5】本発明の第1の実施形態の処理を表すフローチャート
図6】本発明の第2の実施形態におけるフォレンジックシステムのブロック図
図7】本発明の第2の実施形態における選定部での解析結果を示したグラフ
図8】本発明の第2の実施形態の予測情報生成処理を表すフローチャート
【発明を実施するための形態】
【0045】
[第1の実施形態]
以下、本発明の第1の実施形態を図1乃至図5を用いて説明する。
【0046】
本発明の第1の実施形態に係るフォレンジックシステムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックシステムにおいて、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得する判断取得部111と、判断取得部111が取得した、実績情報を記録する記録部112と、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成する予測情報生成部113と、実績情報および予測情報を比較する情報比較部114と、情報比較部114の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成するアイコン生成部115とを備える。
【0047】
フォレンジックシステムは、コンピュータまたはサーバを備え、各種入力に基づきCPUがROMに記録されたプログラムを実行することで、各種機能部として動作する。該プログラムは、CD−ROM等の記憶媒体に記憶され、もしくはインターネット等のネットワークを介して配布され、コンピュータにインストールされるものであってもよい。
【0048】
本実施形態においては、レビュワーと呼ばれる利用者が、文書データの中から、訴訟に提出が必要な文書を抽出するために、訴訟との関連性の判断を行う。関連性判断は、関連性の度合いに応じて分別符号を付与するものとしてもよい。この、システム又は利用者が訴訟に関連するか否かを判断する行為をレビューという。レビューでは、レビューの対象となる文書データを、訴訟の関連の度合いや、訴訟との関連の仕方に基づいて、複数の種類に分類を行う。
【0049】
文書データは、1つ以上の単語を含む情報をいう。文書データの一例として、電子メール、プレゼンテーション資料、表計算資料、打ち合わせ資料、契約書、組織図、事業計画書等が挙げられる。また、スキャンデータを文書データとして扱うことも可能である。この場合、スキャンデータをテキストデータへと変換できるように、フォレンジックシステム内にOCR(Optical Character Reader)装置を備えてもよい。
【0050】
図1は、第1の実施形態におけるフォレンジックシステムのブロック図を示している。本実施形態において、フォレンジックシステムは、サーバ装置100と、クライアント端末200とを備えている。
【0051】
サーバ装置100とクライアント端末200とは通信ネットワークを介して接続されている。通信ネットワークは、有線あるいは無線の通信回線をいう。例えば、電話回線、インターネット回線等である。
【0052】
サーバ装置100は、判断取得部111と、記録部112と、予測情報生成部113と、情報比較部114と、アイコン生成部115とを備えている。
【0053】
本実施形態において、各構成はサーバ装置100上に搭載されているが、それぞれ別筐体に搭載されるものであってもよい。
【0054】
クライアント端末200は、コンピュータであり、図2に示すレビュー画面I1を表示する画面表示部211および指示部290(図1では図示を省略)を有している。
【0055】
画面表示部211は、表示用のディスプレイ(液晶ディスプレイ、CRTモニター、有機ELディスプレイ等)をいう。また、指示部290はマウスまたはキーボードをいう。
【0056】
利用者は、クライアント端末200を介して、サーバ装置100と接続し、画面表示部211が表示するレビュー画面I1上でレビューを行う。
【0057】
図1を用いて各構成要素の機能について説明する。
【0058】
判断取得部111は、利用者が文書データに行った関連性判断の実績情報を取得する。実績情報は、結果情報および進捗情報のうち少なくともいずれかを含んでいる。
【0059】
結果情報は、利用者が文書データに対して行った、訴訟との関連性判断の結果、つまり関連性の有無を示すものをいう。利用者が文書データに付与した、訴訟との関連性の度合いを表す分別符号を指してもよい。
【0060】
進捗情報は、利用者の関連性判断の速度に関するものをいう。具体的には、単位時間当たりに利用者が関連性判断を行った文書データ数を指す。なお、関連性判断が必要な全文書データに対する、単位時間当たりの関連性判断を行った文書データ数としてもよい。本実施形態では、判断情報取得部は、ある利用者がある文書データの関連性判断にかかった時間および、該文書データのデータ容量を取得し、時間で容量を割った値から、進捗情報を取得する。
【0061】
記録部112は、判断取得部111が取得した実績情報を記録する。本実施形態においては、サーバ装置100内のハードディスク上に記録するが、サーバ装置100外に設置されたデータベースとしてもよい。
【0062】
予測情報生成部113は、予測情報を生成する。予測情報は、利用者の関連性判断を予測したものをいう。結果情報および進捗情報のうち少なくともいずれか1つを含んでいる。また予測情報生成部113は、取得した結果情報から利用者の関連性判断の特徴を解析し、該解析の結果に基づいて、結果情報に関する予測情報を生成するものとしてもよい。また、予測情報生成部113は、更に、他の利用者の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成するものとしてもよい。また、予測情報生成部113は、更に、利用者の過去の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成するものとしてもよい。
【0063】
本実施形態において、予測情報生成部113は、利用者が関連性の判断を行った文書データの類似の文書データに対して、結果情報に関する予測情報を生成する。後述する実施例2の方法を用いて結果情報に関する予測情報を生成するものとしてもよい。また、予測情報生成部113は、判断取得部111が取得したこれまでの進捗情報から、次の単位時間あたりに利用者がレビューする文書データ数およびデータ容量を予測することも可能である。
【0064】
情報比較部114は、実績情報と予測情報とを比較する。なお、予測情報と実績情報が同じ情報を含む場合に比較する。具体的には、それぞれが結果情報を含む予測情報と実績情報とを比較するものとしてもよいし、それぞれが進捗情報を含む予測情報と実績情報とを比較するものとしてもよい。また、それぞれが結果情報および進捗情報の双方を含む予測情報と実績情報とを比較するものとしてもよい。
【0065】
情報比較部114は、比較した結果をアイコン生成部115に通知する。
【0066】
アイコン生成部115は、比較結果に基づいてアイコンを生成する。また、アイコン生成部115は、比較結果に基づいて、アイコンの動作、セリフ、表情の少なくともいずれか1つの表示形式を変更するものとしてもよい。
【0067】
アイコンは、利用者に対して評価を呈示するものをいう。キャラクターのような親しみを感じやすいものとしてもよい。図3は、本実施形態におけるアイコン生成部115がアイコンを呈示した状態のレビュー画面I1の模式図である。図3のa1は、アイコン生成部115が生成したアイコンを、図3のb1はその評価内容をセリフとして表している。
【0068】
評価は、利用者が行った関連性判断に対するフィードバックをいう。比較結果に基づくものとしてもよい。具体的には、例えば、予測情報として予測した進捗情報よりも実績情報として取得した進捗情報が有意に遅い場合に、判断速度の向上を促すコメントを評価として呈示するものとしてもよい。また、予測した結果情報と実績として取得した結果情報が異なる場合に、注意喚起する評価を呈示してもよい。
【0069】
アイコン生成部115の処理を、情報比較部114が、進捗情報に関する実績情報と予測情報とを比較した場合を例にして具体的に説明する。図4はアイコン生成部115が生成するアイコンの例である。これまでの実績情報から、予測情報生成部113の予測した予測情報が単位時間当たり文書データ50件とする。
【0070】
図4の(A1)は、困った表情で、首をかしげるという動作をしながら、「今日はどうしたの?」というセリフを言うアイコンを示している。これは、判断情報取得部が取得した実績情報が、50件より有意に少なかった場合に、生成される。これによって、利用者にレビュー速度の向上を促すことが可能となる。
【0071】
図4の(A2)は、笑った表情で、応援しながら、「その調子で頑張って」というセリフを言うアイコンを示している。このアイコンは、予測情報と実績情報のどちらも同じ進捗情報であった場合に生成される。これにより、利用者に現状のペースでレビューを行っていれば問題ない、と自信を持たせることが可能となる。
【0072】
図4の(A3)は、苦しそうな表情で、走りながら、「しっかり注意も必要だよ」というセリフを言うアイコンを示している。このアイコンは、実績情報が予測情報のペースを上回っている場合に、利用者の注意を喚起するために生成される。これにより、利用者が文書データを注意深く読まずに関連性判断を行うことを抑止することが可能となる。
【0073】
次に、図5を用いて、本実施形態に係るフォレンジックシステムの処理フローについて説明する。
【0074】
利用者がある文書データ(文書1)について関連性ありと判断を行うと(STEP101)、判断情報取得部が文書1についての実績情報を取得する(STEP102)。具体的には、文書1が訴訟と関連性がある、という結果情報と、文書1について判断するのにかかった時間で文書1のデータサイズを割った値から求められる進捗情報を実績情報として取得する。取得された実績情報は、記録部112によってサーバ装置100のハードディスクに記録される(STEP103)。
【0075】
次に、予測情報生成部113が、過去の実績情報や他の利用者の実績情報から予測情報を生成する(STEP104)。情報比較部114が、実績情報と予測情報を比較する(STEP105)。アイコン生成部115が、比較結果をもとにアイコンを生成し、利用者に対して関連性判断の評価を随時呈示する(STEP106)。
【0076】
[第2の実施形態]
以下、本発明の第2の実施形態を図6乃至図8を用いて説明する。
【0077】
本発明の第2の実施形態に係るフォレンジックシステムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックシステムにおいて、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得する判断取得部111と、判断取得部111が取得した、実績情報を記録する記録部112と、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成する予測情報生成部113と、実績情報および予測情報を比較する情報比較部114と、情報比較部114の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成するアイコン生成部115とを備える。
【0078】
また、本実施形態に係るフォレンジックシステムは、更に、デジタル情報から所定数の文書データを抽出する抽出部121と、抽出された文書データを画面上に表示する表示部122と、表示された文書データに対して、利用者が行った関連性の判断結果を受け付ける結果受付部123と、判断結果に基づいて、抽出された文書データを判断結果ごとに分別し、該分別された文書データにおいて、共通して出現するキーワードを解析し、選定する選定部124と、選定したキーワードを記録するキーワード記録部125と、キーワード記録部125に記録されたキーワードを文書データから探索する探索部126と、探索部126の探索結果と選定部124の解析結果を用いて、判断結果と文書データとの関連性を示すスコアを算出するスコア算出部127とを備え、予測情報生成部113は、スコアを用いて結果情報に関する予測情報を生成するものである。
【0079】
図6は、本実施形態に係るフォレンジックシステムのブロック図を示している。
【0080】
サーバ装置100は、判断取得部111と、記録部112と、予測情報生成部113と、情報比較部114と、アイコン生成部115と、抽出部121と、表示部122と、結果受付部123と、選定部124と、キーワード記録部125と、探索部126と、スコア算出部127とを備えている。
【0081】
本実施形態において、各構成はサーバ装置100上に搭載されているが、それぞれ別筐体に搭載されるものであってもよい。
【0082】
クライアント端末200は、図2に示すレビュー画面I1を表示する画面表示部211を有している。レビュワーと呼ばれる利用者は、クライアント端末200を介して、サーバ装置100と接続し、レビュー画面I1上でレビューを行う。
【0083】
図6を用いて各構成要素の機能について説明する。
【0084】
抽出部121は、デジタル情報から文書データを抽出する。抽出する際には、デジタル情報からランダムにサンプリングする。また、文書データの更新日時等の属性に基づいて抽出するものとしてもよい。
【0085】
表示部122は、抽出した文書データを表示する。具体的には、抽出した文書データを利用者が利用するクライアント端末200上に表示するよう指示を出す。
【0086】
結果受付部123は、利用者の関連性判断の結果を受け付ける。
【0087】
選定部124は、キーワードを選定する。同一の判断結果がなされた文書データに共通して出現するキーワードを解析し、選定するものとしてもよい。
【0088】
図7は、関連性ありと判断された文書データに共通して頻出するキーワードを選定部124が解析した結果のグラフである。図7において、縦軸R_hotは、ユーザによって関連性がありと判断された全文書データのうち、関連性がありと判断される文書データに紐づくキーワードとして選定されたキーワードを含み、かつ関連性がありと判断された文書データの割合を示している。横軸R_allは、利用者がレビューを実施した全文書データのうち、後述する探索部126によって探索されたキーワードを含む文書データの割合を示している。本実施形態において、選定部124では、直線R_hot=R_allよりも上部にプロットされるキーワードを、関連性ありと判断される文書データに共通のキーワードとして選定する。
【0089】
キーワードは、ある言語において、一定の意味を持つ文字列のまとまりをいう。例えば、「文書を分別する」という文章のキーワードは、「文書」「分別」「する」としてもよい。
【0090】
キーワード記録部125は、キーワードを記録するものをいう。データベースとしてもよい。
【0091】
探索部126は、キーワードを文書データから探索するものをいう。
【0092】
スコア算出部127は、文書データのスコアを算出するものをいう。文書データに含まれるキーワードの評価値に基づいてスコアを算出するものとしてもよい。評価値は、文書データ中のキーワードの出現頻度や伝達情報量に基づいて算出され、各キーワードがある文書データ中で発揮する情報量をいってもよい。
【0093】
スコアは、ある文書データにおいて、訴訟との関連度合を示すものをいう。スコアは文書データに含まれるキーワードに基づいて算出される。例えば、訴訟時に提出する必要が高いキーワードが含まれる文書データほど、高いスコアを有するとしてもよい。文書データは、一定の要件に基づいてスコアの初期値を与えられるものとしてもよい。例えば、文書データに出現するキーワードと、各キーワードの持つ評価値とにより初期スコアを算出するものとしてもよい。
【0094】
スコア算出部127は、文書群中に出現するキーワードと、各キーワードの持つ重みづけにより、以下の式からスコアを算出することが可能である。
【0095】
【数1】
各キーワードがもつ重みづけは、該キーワードが持つ伝達情報量をもとに決定する。該重みづけは以下の式により、学習することが可能である。
【0096】
【数2】
【0097】
予測情報生成部113は、スコア算出部127が算出したスコアに基づいて、結果情報に関する予測情報を生成する。具体的には、所定の閾値をスコアが超過した文書データについては、関連性ありと予測し、閾値を超過しない文書データに対しては関連性なしと予測して予測情報を生成する。
【0098】
図8を用いて、本実施形態における予測情報生成処理のフローについて説明する。まず、抽出部121が、デジタル情報から所定数の文書データを抽出する(STEP201)。抽出された文書データを、表示部122がクライアント端末200の画面上に表示させる(STEP202)。結果受付部123が利用者の関連性判断の結果を受け付け(STEP203)、選定部124が利用者の関連性判断の結果から文書データを解析し、キーワードを選定する(STEP204)。選定されたキーワードはキーワード記録部125によって記録される(STEP205)。次に、各文書データから記録されたキーワードを探索部126が探索し(STEP206)、スコア算出部127が式(1)を用いて各文書データのスコアを算出する(STEP207)。算出されたスコアに基づいて、予測情報生成部113が、結果情報に関する予測情報を生成する(STEP208)。
【0099】
その他の構成、機能については第1の実施形態と同様である。
【0100】
[その他の実施形態]
アイコン生成部115は、第1の実施形態および第2の実施形態で示した以外にも、利用者が現在レビューを行っている文書データの内容に基づいても評価を呈示することが可能である。
【0101】
例えば、文書データの作成日時、作成者、セキュリティレベルに基づいて呈示するものとしてもよい。具体的には、訴訟と関連性の高い人物が作成した文書データに対して、利用者がレビューを行う際に、特に注意喚起を促すようなアイコンを生成し、評価を呈示するものとしてもよい。
【0102】
その他の構成、機能については第1の実施形態と同様である。
【0103】
フォレンジックシステムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックシステムにおいて、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得する判断取得部111と、判断取得部111が取得した、実績情報を記録する記録部112と、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成する予測情報生成部113と、実績情報および予測情報を比較する情報比較部114と、情報比較部114の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成するアイコン生成部115とを備える際には、アイコンがレビューの進捗状況または、レビュー中の文書データの訴訟との関連度合に応じて、利用者に適宜フィードバックを実施することにより、利用者のモチベーションを維持し、レビューの効率化を図ることを可能となる。
【0104】
また、予測情報生成部113が、取得した結果情報から利用者の関連性判断の特徴を解析し、解析の結果に基づいて、結果情報に関する予測情報を生成する際においては、ある文書データに対して、利用者の関連性判断の結果をシステムが予測し、該予測結果と実際の利用者の判断結果が異なる場合に、利用者に対して注意喚起を行うことが可能となる。
【0105】
また、予測情報生成部113が、更に、他の利用者の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成する際においては、他の利用者の関連性判断の結果から、ある文書データに対しての特定の利用者の判断結果をシステムが予測し、該予測結果と実際の利用者の判断結果が異なる場合に、特定の利用者に対して注意喚起を行うことが可能となる。
【0106】
また、予測情報生成部113が、更に、利用者の過去の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成する際においては、ある利用者の過去の進捗速度からレビューの進捗速度を予測し、予測した進捗速度と実際の利用者の進捗速度が異なる場合に、利用者に対して注意喚起を行うことが可能となる。
【0107】
また、アイコン生成部115が、比較結果に基づいて、アイコンの動作、セリフ、表情の少なくともいずれか1つの表示形式を変更する際においては、利用者の状況に応じて適切な評価を呈示することが可能となる。
以上説明したように、本願発明に係るフォレンジック分析システムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジック分析システムにおいて、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得する判断取得部と、判断取得部が取得した、実績情報を記録する記録部と、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成する予測情報生成部と、実績情報および予測情報を比較する情報比較部と、情報比較部の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成するアイコン生成部とを備える。
「文書データ」は、1つ以上の単語を含む情報をいう。文書データの一例として、電子メール、プレゼンテーション資料、表計算資料、打ち合わせ資料、契約書、組織図、事業計画書等が挙げられる。
「関連性判断」は、文書データに対して、訴訟への提出の必要の有無を判断するものをいう。関連性判断は、関連性の度合いに応じて分別符号を付与するものとしてもよい。
「結果情報」は、利用者が文書データに対して行った、訴訟との関連性判断の結果を示すものをいう。結果情報は、利用者が文書データに付与した、訴訟との関連性の度合いを表す分別符号を指してもよい。
「進捗情報」は、利用者の関連性判断の速度に関するものをいう。進捗情報は、単位時間当たりに利用者が関連性判断を行った文書データ数を指してもよい。また、進捗情報は、関連性判断が必要な全文書データに対する、単位時間当たりの関連性判断を行った文書データ数としてもよい。
「実績情報」は、結果情報または進捗情報のうち少なくともいずれか1つに関するものをいう。実績情報は、結果情報および進捗情報の双方を含むものとしてもよい。
「判断取得部」は、利用者が文書データに対して行った判断結果に関する情報を取得するものをいう。
「記録部」は、実績情報を記録するものをいう。
「予測情報」は、利用者の関連性判断を予測したものをいう。予測情報は、結果情報または進捗情報のうち少なくともいずれか1つに関するものとしてもよい。
「予測情報生成部」は、予測情報を生成するものをいう。予測情報生成部は、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成するものとしてもよい。また予測情報生成部は、取得した結果情報から利用者の関連性判断の特徴を解析し、該解析の結果に基づいて、結果情報に関する予測情報を生成するものとしてもよい。また、予測情報生成部は、更に、他の利用者の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成するものとしてもよい。また、予測情報生成部は、更に、利用者の過去の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成するものとしてもよい。
「情報比較部」は、複数の情報を比較するものをいう。情報比較部は、予測情報と実績情報が同じ情報を含む場合に比較するものとしてもよい。具体的には、情報比較部は、それぞれが結果情報を含む予測情報と実績情報とを比較するものとしてもよいし、それぞれが進捗情報を含む予測情報と実績情報とを比較するものとしてもよい。また、情報比較部は、それぞれが結果情報および進捗情報の双方を含む予測情報と実績情報とを比較するものとしてもよい。
「評価」は、利用者が行った関連性判断に対するフィードバックをいう。評価は、比較結果に基づくものとしてもよい。具体的には、例えば、予測情報として予測した進捗情報よりも実績情報として取得した進捗情報が有意に遅い場合に、判断速度の向上を促すコメントを評価として呈示するものとしてもよい。また、予測した結果情報と実績として取得した結果情報が異なる場合に、注意喚起する評価を呈示してもよい。
「アイコン」は、利用者に対して評価を呈示する簡単な絵柄で表現されたものをいう。例えば、アイコンは、キャラクターのような親しみを感じやすいものとしてもよい。
「アイコン生成部」は、比較結果に基づいてアイコンを生成するものをいう。また、アイコン生成部は、比較結果に基づいて、アイコンの動作、セリフ、表情の少なくともいずれか1つの表示形式を変更するものとしてもよい。また、アイコン生成部は、利用者が関連性判断を行っている文書データの内容に応じても評価を呈示するものとしてもよい。例えば、特定の年代に作成された文書データに対して利用者が関連性判断を行っている場合に、注意を喚起するような評価を呈示するものとしてもよい。
また、本発明に係るフォレンジック分析システムは、更に、デジタル情報から所定数の文書データを抽出する抽出部と、抽出された文書データを画面上に表示する表示部と、表示された文書データに対して、利用者が行った関連性の判断結果を受け付ける結果受付部と、判断結果に基づいて、抽出された文書データを判断結果ごとに分別し、該分別された文書データにおいて、共通して出現するキーワードを解析し、選定する選定部と、選定したキーワードを記録するキーワード記録部と、キーワード記録部に記録されたキーワードを文書データから探索する探索部と、探索部の探索結果と選定部の解析結果を用いて、判断結果と文書データとの関連性を示すスコアを算出するスコア算出部とを備え、予測情報生成部は、スコアを用いて結果情報に関する予測情報を生成するものとしてもよい。
「抽出部」は、デジタル情報から文書データを抽出するものをいう。抽出部は、ランダムにサンプリングし抽出するものとしてもよい。また、文書データの更新日時等の属性に基づいて抽出するものとしてもよい。
「表示部」は、抽出した文書データを表示する。表示部は、利用者が利用するクライアント端末上に表示するものとしてもよい。
「結果受付部」は、利用者の関連性判断の結果を受け付けるものをいう。
「選定部」は、キーワードを選定するものをいう。選定部は、同一の判断結果がなされた文書データに共通して出現するキーワードを解析し、選定するものとしてもよい。
「キーワード」は、ある言語において、一定の意味を持つ文字列のまとまりをいう。例えば、「文書を分別する」という文章のキーワードは、「文書」「分別」「する」としてもよい。
「キーワード記録部」は、キーワードを記録するものをいう。キーワード記録部は、データベースとしてもよい。
「探索部」は、キーワードを文書データから探索するものをいう。
「スコア算出部」は、文書データのスコアを算出するものをいう。スコア算出部は、文書データに含まれるキーワードの評価値に基づいてスコアを算出するものとしてもよい。スコア算出部は、評価値は各キーワードが、ある文書データ中で発揮する情報量をいってもよい。評価値は、文書データ中のキーワードの出現頻度や伝達情報量に基づいて算出するとしてもよい。
「スコア」は、ある文書データにおいて、訴訟との関連度合を示すものをいう。スコアは文書データに含まれるキーワードに基づいて算出される。例えば、訴訟時に提出する必要が高いキーワードが含まれる文書データほど、高いスコアを有するとしてもよい。文書データは、一定の要件に基づいてスコアの初期値を与えられるものとしてもよい。例えば、文書データに出現するキーワードと、各キーワードの持つ評価値とにより初期スコアを算出するものとしてもよい。
また、本発明に係るフォレンジック分析方法は、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジック分析方法において、コンピュータが、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得するステップと、取得した、実績情報を記録するステップと、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成するステップと、実績情報および予測情報を比較するステップと、情報比較部の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成するステップとを実行する。
また、本発明に係るフォレンジック分析プログラムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジック分析プログラムにおいて、コンピュータに、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得させる機能と、取得した、実績情報を記録させる機能と、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成させる機能と、実績情報および予測情報を比較させる機能と、情報比較部の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成させる機能とを実現する。
本発明のフォレンジック分析システムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジック分析システムにおいて、デジタル情報に含まれる複数の文書データに対して、利用者が行った訴訟との関連性判断の結果を示す結果情報または、利用者の関連性判断の進捗速度に関する情報を示す進捗情報のうち少なくともいずれか1つを実績情報として取得する判断取得部と、判断取得部が取得した、実績情報を記録する記録部と、結果情報または進捗情報のうち少なくともいずれか1つに関する予測情報を生成する予測情報生成部と、実績情報および予測情報を比較する情報比較部と、情報比較部の比較結果に基づいて、利用者の関連性判断に対する評価を呈示するアイコンを生成するアイコン生成部とを備える際には、アイコンがレビューの進捗状況または、レビュー中の文書データの訴訟との関連度合に応じて、利用者に適宜フィードバックを実施することにより、利用者のモチベーションを維持し、レビューの効率化を図ることを可能となる。
また、本発明に係る予測情報生成部が、取得した結果情報から利用者の関連性判断の特徴を解析し、解析の結果に基づいて、結果情報に関する予測情報を生成する際においては、ある文書データに対して、利用者の関連性判断の結果をシステムが予測し、該予測結果と実際の利用者の判断結果が異なる場合に、利用者に対して注意喚起を行うことが可能となる。
また、本発明に係る予測情報生成部が、更に、他の利用者の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成する際においては、他の利用者の関連性判断の結果から、ある文書データに対しての特定の利用者の判断結果をシステムが予測し、該予測結果と実際の利用者の判断結果が異なる場合に、特定の利用者に対して注意喚起を行うことが可能となる。
また、本発明に係る予測情報生成部が、更に、利用者の過去の関連性判断の進捗状況を解析し、該解析の結果に基づいて関連性判断の進捗速度に関する予測情報を生成する際においては、ある利用者の過去の進捗速度からレビューの進捗速度を予測し、予測した進捗速度と実際の利用者の進捗速度が異なる場合に、利用者に対して注意喚起を行うことが可能となる。
また、本発明に係るアイコン生成部は、比較結果に基づいて、アイコンの動作、セリフ、表情の少なくともいずれか1つの表示形式を変更する際においては、利用者の状況に応じて適切な評価を呈示することが可能となる。
【符号の説明】
【0108】
100 サーバ装置
111 判断取得部
112 記録部
113 予測情報生成部
114 情報比較部
115 アイコン生成部
121 抽出部
122 表示部
123 結果受付部
124 選定部
125 キーワード記録部
126 探索部
127 スコア算出部
200 クライアント端末
211 画面表示部
290 指示部
I1 レビュー画面
図1
図2
図3
図4
図5
図6
図7
図8