特許第5827467号(P5827467)IP Force 特許公報掲載プロジェクト 2015.5.11 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ インターナショナル・ビジネス・マシーンズ・コーポレーションの特許一覧
特許5827467電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム
<>
  • 特許5827467-電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム 図000002
  • 特許5827467-電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム 図000003
  • 特許5827467-電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム 図000004
  • 特許5827467-電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム 図000005
  • 特許5827467-電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム 図000006
  • 特許5827467-電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム 図000007
  • 特許5827467-電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム 図000008
  • 特許5827467-電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム 図000009
  • 特許5827467-電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム 図000010
  • 特許5827467-電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム 図000011
  • 特許5827467-電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム 図000012
  • 特許5827467-電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム 図000013
  • 特許5827467-電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム 図000014
  • 特許5827467-電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム 図000015
  • 特許5827467-電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム 図000016
  • 特許5827467-電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム 図000017
  • 特許5827467-電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム 図000018
  • 特許5827467-電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム 図000019
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5827467
(24)【登録日】2015年10月23日
(45)【発行日】2015年12月2日
(54)【発明の名称】電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム
(51)【国際特許分類】
   G09B 7/02 20060101AFI20151112BHJP
   G09B 5/02 20060101ALI20151112BHJP
【FI】
   G09B7/02
   G09B5/02
【請求項の数】13
【全頁数】23
(21)【出願番号】特願2010-253817(P2010-253817)
(22)【出願日】2010年11月12日
(65)【公開番号】特開2012-103593(P2012-103593A)
(43)【公開日】2012年5月31日
【審査請求日】2013年8月2日
【前置審査】
(73)【特許権者】
【識別番号】390009531
【氏名又は名称】インターナショナル・ビジネス・マシーンズ・コーポレーション
【氏名又は名称原語表記】INTERNATIONAL BUSINESS MACHINES CORPORATION
(74)【代理人】
【識別番号】100108501
【弁理士】
【氏名又は名称】上野 剛史
(74)【代理人】
【識別番号】100112690
【弁理士】
【氏名又は名称】太佐 種一
(72)【発明者】
【氏名】神崎 英介
(72)【発明者】
【氏名】中山 恭与
【審査官】 彦田 克文
(56)【参考文献】
【文献】 特開2003−029612(JP,A)
【文献】 特開平06−095583(JP,A)
【文献】 特開平11−085742(JP,A)
【文献】 特開2007−172404(JP,A)
【文献】 特開2009−086203(JP,A)
【文献】 特開2006−331329(JP,A)
【文献】 特開平08−329053(JP,A)
【文献】 特開2002−007420(JP,A)
【文献】 特開2002−041012(JP,A)
【文献】 米国特許出願公開第2008/0239365(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
A63F 9/24
13/00 − 13/98
G06F 5/00
5/06 − 5/16
17/20 − 17/26
G09B 1/00 − 9/56
17/00 − 19/26
G09C 1/00 − 5/00
H04K 1/00 − 3/00
H04L 9/00 − 9/38
(57)【特許請求の範囲】
【請求項1】
電子文書データに含まれる部分テキストデータを、読解することができないマスクデータに置換して表示する方法において、
電子文書データを取得する工程と、
取得した電子文書データの中から、前記マスクデータに置換する対象となる部分テキストデータの指定を受け付ける工程と、
指定を受け付けた部分テキストデータを固有の識別情報と対応付けて記憶する工程と、
取得した電子文書データ中の部分テキストデータを、対応する識別情報に置換した置換文書データを生成する工程と、
前記識別情報を置換する規則に関する規則情報ごとに、生成した置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換するか否かに関する置換情報を記憶する工程と、
前記規則情報の選択を受け付ける工程と、
選択を受け付けた規則情報をキー情報として抽出した置換情報に基づいて、前記置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換する工程とを含み、
前記マスクデータは、複数のマスクパターンを有し、
前記置換情報に基づいて、前記部分テキストデータに対応する前記識別情報ごとに必要な前記マスクパターンを対応付けてある方法。
【請求項2】
複数の前記規則情報の選択を受け付ける請求項1記載の方法。
【請求項3】
前記規則情報に対する適用解除要求を受け付ける工程と、
前記適用解除要求を受け付けた場合、受け付けた適用解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出した置換情報に基づいて、前記置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換する工程と
を含む請求項1又は2記載の方法。
【請求項4】
電子文書データに含まれる部分テキストデータを、読解することができないマスクデータに置換して表示する装置において、
電子文書データを取得するデータ取得部と、
取得した電子文書データの中から、前記マスクデータに置換する対象となる部分テキストデータの指定を受け付ける指定受付部と、
指定を受け付けた部分テキストデータを固有の識別情報と対応付けて記憶する識別情報記憶部と、
取得した電子文書データ中の部分テキストデータを、対応する識別情報に置換した置換文書データを生成する置換文書データ生成部と、
前記識別情報を置換する規則に関する規則情報ごとに、生成した置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換するか否かに関する置換情報を記憶する置換情報記憶部と、
前記規則情報の選択を受け付ける選択受付部と、
選択を受け付けた規則情報をキー情報として抽出した置換情報に基づいて、前記置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換する置換部と
を備え、
前記マスクデータは、複数のマスクパターンを有し、
前記置換情報に基づいて、前記部分テキストデータに対応する前記識別情報ごとに必要な前記マスクパターンを対応付けてある装置。
【請求項5】
複数の前記規則情報の選択を受け付けるようにしてある請求項4記載の装置。
【請求項6】
前記規則情報に対する適用解除要求を受け付ける解除要求受付部と、
前記適用解除要求を受け付けた場合、受け付けた適用解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出した置換情報に基づいて、前記置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換する再置換部と
を備える請求項4又は5記載の装置。
【請求項7】
電子文書データに含まれる部分テキストデータを、読解することができないマスクデータに置換して表示するクライアントとデータ通信することが可能に接続されたサーバにおいて、
取得した電子文書データの中から、前記マスクデータに置換する対象として指定を受け付けた部分テキストデータを受信する部分テキストデータ受信部と、
受信した部分テキストデータを固有の識別情報と対応付けて記憶する識別情報記憶部と、
取得した電子文書データ中の部分テキストデータを、対応する識別情報に置換した置換文書データを生成する置換文書データ生成部と、
前記識別情報を置換する規則に関する規則情報ごとに、生成した置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換するか否かに関する置換情報を受信して記憶する置換情報記憶部と、
選択を受け付けた規則情報を受信する規則情報受信部と、
受信した規則情報をキー情報として抽出した置換情報及び前記置換文書データをクライアントへ送信する置換情報送信部と
を備え、
前記マスクデータは、複数のマスクパターンを有し、
前記置換情報に基づいて、前記部分テキストデータに対応する前記識別情報ごとに必要な前記マスクパターンを対応付けてあるサーバ。
【請求項8】
複数選択を受け付けた前記規則情報を受信するようにしてある請求項7記載のサーバ。
【請求項9】
前記規則情報に対する適用解除要求を受信する解除要求受信部を備え、
前記置換情報送信部は、前記適用解除要求を受信した場合、受信した適用解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出した置換情報及び前記置換文書データをクライアントへ送信するようにしてある請求項7又は8記載のサーバ。
【請求項10】
電子文書データに含まれる部分テキストデータを、読解することができないマスクデータに置換するサーバで実行することが可能なコンピュータプログラムにおいて、
前記サーバを、
取得した電子文書データの中から、前記マスクデータに置換する対象として指定を受け付けた部分テキストデータを受信する部分テキストデータ受信手段、
受信した部分テキストデータを固有の識別情報と対応付けて記憶する識別情報記憶手段、
取得した電子文書データ中の部分テキストデータを、対応する識別情報に置換した置換文書データを生成する置換文書データ生成手段、
前記識別情報を置換する規則に関する規則情報ごとに、生成した置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換するか否かに関する置換情報を受信して記憶する置換情報記憶手段、
選択を受け付けた規則情報を受信する規則情報受信手段、及び
受信した規則情報をキー情報として抽出した置換情報及び前記置換文書データをクライアントへ送信する置換情報送信手段
として機能させ、
前記マスクデータは、複数のマスクパターンを有し、
前記置換情報に基づいて、前記部分テキストデータに対応する前記識別情報ごとに必要な前記マスクパターンを対応付けてあるコンピュータプログラム。
【請求項11】
前記規則情報受信手段を、複数選択を受け付けた前記規則情報を受信する手段として機能させる請求項10記載のコンピュータプログラム。
【請求項12】
前記サーバを、前記規則情報に対する適用解除要求を受信する解除要求受信手段として機能させ、
前記置換情報送信手段を、前記適用解除要求を受信した場合、受信した適用解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出した置換情報及び前記置換文書データをクライアントへ送信する手段として機能させる請求項10又は11記載のコンピュータプログラム。
【請求項13】
電子文書データに含まれる部分テキストデータを、読解することができないマスクデータに置換するサーバとデータ通信することが可能に接続されているクライアントで実行することが可能なコンピュータプログラムにおいて、
前記クライアントを、
電子文書データの入力を受け付けるデータ入力受付手段、
入力を受け付けた電子文書データの中から、前記マスクデータに置換する対象となる部分テキストデータの指定を受け付け、前記サーバへ送信する指定受付手段、
指定を受け付けた部分テキストデータに対応付けた固有の識別情報を置換する規則に関する規則情報の選択を受け付け、前記サーバへ送信する選択受付手段、
選択を受け付けた規則情報ごとに、電子文書データ中の部分テキストデータを、対応する識別情報に置換した置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換するか否かに関する置換情報及び部分テキストデータを識別情報に置換した置換文書データを受信する置換情報受信手段、及び
受信した置換情報及び置換文書データに基づいて、前記置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換する置換手段
として機能させ、
前記マスクデータは、複数のマスクパターンを有し、
前記置換情報に基づいて、前記部分テキストデータに対応する前記識別情報ごとに必要な前記マスクパターンを対応付けてあるコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、電子文書中の所望の部分テキストデータをマスクし、あるいはマスクする部分テキストデータを容易に変更することができる方法、装置、サーバ及びコンピュータプログラムに関する。
【背景技術】
【0002】
近年、電子文書データをパソコンのディスプレイ、ビューワ等で表示する電子書籍が普及し始めている。最近の電子書籍では、表示されている電子文書データの中から所望の部分テキストデータだけマスクデータに置換したり、タグを付与したりすることができるようになっている。
【0003】
一方、電子化されていない従来の書籍では、書籍中の暗記するべき語句をラインマーカ等でなぞり、なぞったページを透明なカラーシートでフィルタリングすることにより、ラインマーカでなぞった語句を読むことができないようにすることで暗記効果を高める勉強方法が普及している。例えば暗記したい語句を赤、緑等のラインマーカでなぞり、そのページに赤、緑等の透明シートでフィルタリングすることにより、ラインマーカでなぞった語句を読むことができなくなる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2003−173129号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
電子書籍では、暗記したい部分テキストデータをマスクデータに置換するよう操作する必要がある。しかし、一度マスクデータに置換した場合、元の部分テキストデータに戻すことができないという問題点があった。また、電子書籍では電子文書データ自体を容易に交換することができるので、電子文書データ自体を交換した場合には、マスクデータは消去される。
【0006】
電子文書データ自体を交換した場合であってもマスクデータを残すためには、これらのデータを原電子文書データに書き込んでおく必要がある。しかし、原電子文書データに直接書き込んだ場合、マスクデータに置換する位置の変更、色の変更等を行うことができず、従来の書籍のように色の異なるマスクを重ねて記載したり、既に記載されているマスクの長さを伸ばしたり、容易にマスクされている範囲を変えることができないという問題点もあった。
【0007】
本発明は斯かる事情に鑑みてなされたものであり、電子文書データであっても所望の部分テキストデータを容易にマスクデータに置換することができ、マスクデータに置換する部分テキストデータの位置を動的に容易に変更することができる方法、装置、サーバ及びコンピュータプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
上記目的を達成するために第1発明に係る方法は、電子文書データに含まれる部分テキストデータを、読解することができないマスクデータに置換して表示する方法において、電子文書データを取得する工程と、取得した電子文書データの中から、前記マスクデータに置換する対象となる部分テキストデータの指定を受け付ける工程と、指定を受け付けた部分テキストデータを固有の識別情報と対応付けて記憶する工程と、取得した電子文書データ中の部分テキストデータを、対応する識別情報に置換した置換文書データを生成する工程と、前記識別情報を置換する規則に関する規則情報ごとに、生成した置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換するか否かに関する置換情報を記憶する工程と、前記規則情報の選択を受け付ける工程と、選択を受け付けた規則情報をキー情報として抽出した置換情報に基づいて、前記置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換する工程とを含み、前記マスクデータは、一又は複数のマスクパターンを有し、前記置換情報に基づいて、前記部分テキストデータに対応する前記識別情報ごとに必要な前記マスクパターンを対応付けてある
【0009】
また、第2発明に係る方法は、第1発明において、複数の前記規則情報の選択を受け付ける。
【0010】
また、第3発明に係る方法は、第1又は第2発明において、前記規則情報に対する適用解除要求を受け付ける工程と、前記適用解除要求を受け付けた場合、受け付けた適用解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出した置換情報に基づいて、前記置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換する工程とを含む。
【0011】
次に、上記目的を達成するために第4発明に係る装置は、電子文書データに含まれる部分テキストデータを、読解することができないマスクデータに置換して表示する装置において、電子文書データを取得するデータ取得部と、取得した電子文書データの中から、前記マスクデータに置換する対象となる部分テキストデータの指定を受け付ける指定受付部と、指定を受け付けた部分テキストデータを固有の識別情報と対応付けて記憶する識別情報記憶部と、取得した電子文書データ中の部分テキストデータを、対応する識別情報に置換した置換文書データを生成する置換文書データ生成部と、前記識別情報を置換する規則に関する規則情報ごとに、生成した置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換するか否かに関する置換情報を記憶する置換情報記憶部と、前記規則情報の選択を受け付ける選択受付部と、選択を受け付けた規則情報をキー情報として抽出した置換情報に基づいて、前記置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換する置換部とを備え、前記マスクデータは、一又は複数のマスクパターンを有し、前記置換情報に基づいて、前記部分テキストデータに対応する前記識別情報ごとに必要な前記マスクパターンを対応付けてある
【0012】
また、第5発明に係る装置は、第4発明において、複数の前記規則情報の選択を受け付けるようにしてある。
【0013】
また、第6発明に係る装置は、第4又は第5発明において、前記規則情報に対する適用解除要求を受け付ける解除要求受付部と、前記適用解除要求を受け付けた場合、受け付けた適用解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出した置換情報に基づいて、前記置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換する再置換部とを備える。
【0014】
次に、上記目的を達成するために第7発明に係るサーバは、電子文書データに含まれる部分テキストデータを、読解することができないマスクデータに置換して表示するクライアントとデータ通信することが可能に接続されたサーバにおいて、取得した電子文書データの中から、前記マスクデータに置換する対象として指定を受け付けた部分テキストデータを受信する部分テキストデータ受信部と、受信した部分テキストデータを固有の識別情報と対応付けて記憶する識別情報記憶部と、取得した電子文書データ中の部分テキストデータを、対応する識別情報に置換した置換文書データを生成する置換文書データ生成部と、前記識別情報を置換する規則に関する規則情報ごとに、生成した置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換するか否かに関する置換情報を受信して記憶する置換情報記憶部と、選択を受け付けた規則情報を受信する規則情報受信部と、受信した規則情報をキー情報として抽出した置換情報及び前記置換文書データをクライアントへ送信する置換情報送信部とを備え、前記マスクデータは、一又は複数のマスクパターンを有し、前記置換情報に基づいて、前記部分テキストデータに対応する前記識別情報ごとに必要な前記マスクパターンを対応付けてある。
【0015】
また、第8発明に係るサーバは、第7発明において、複数選択を受け付けた前記規則情報を受信するようにしてある。
【0016】
また、第9発明に係るサーバは、第7又は第8発明において、前記規則情報に対する適用解除要求を受信する解除要求受信部を備え、前記置換情報送信部は、前記適用解除要求を受信した場合、受信した適用解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出した置換情報及び前記置換文書データをクライアントへ送信するようにしてある。
【0017】
次に、上記目的を達成するために第10発明に係るコンピュータプログラムは、電子文書データに含まれる部分テキストデータを、読解することができないマスクデータに置換するサーバで実行することが可能なコンピュータプログラムにおいて、前記サーバを、取得した電子文書データの中から、前記マスクデータに置換する対象として指定を受け付けた部分テキストデータを受信する部分テキストデータ受信手段、受信した部分テキストデータを固有の識別情報と対応付けて記憶する識別情報記憶手段、取得した電子文書データ中の部分テキストデータを、対応する識別情報に置換した置換文書データを生成する置換文書データ生成手段、前記識別情報を置換する規則に関する規則情報ごとに、生成した置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換するか否かに関する置換情報を受信して記憶する置換情報記憶手段、選択を受け付けた規則情報を受信する規則情報受信手段、及び受信した規則情報をキー情報として抽出した置換情報及び前記置換文書データをクライアントへ送信する置換情報送信手段として機能させ、前記マスクデータは、一又は複数のマスクパターンを有し、前記置換情報に基づいて、前記部分テキストデータに対応する前記識別情報ごとに必要な前記マスクパターンを対応付けてある。
【0018】
また、第11発明に係るコンピュータプログラムは、第10発明において、前記規則情報受信手段を、複数選択を受け付けた前記規則情報を受信する手段として機能させる。
【0019】
また、第12発明に係るコンピュータプログラムは、第10又は第11発明において、前記サーバを、前記規則情報に対する適用解除要求を受信する解除要求受信手段として機能させ、前記置換情報送信手段を、前記適用解除要求を受信した場合、受信した適用解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出した置換情報及び前記置換文書データをクライアントへ送信する手段として機能させる。
【0020】
次に、上記目的を達成するために第13発明に係るコンピュータプログラムは、 電子文書データに含まれる部分テキストデータを、読解することができないマスクデータに置換するサーバとデータ通信することが可能に接続されているクライアントで実行することが可能なコンピュータプログラムにおいて、前記クライアントを、電子文書データの入力を受け付けるデータ入力受付手段、入力を受け付けた電子文書データの中から、前記マスクデータに置換する対象となる部分テキストデータの指定を受け付け、前記サーバへ送信する指定受付手段、指定を受け付けた部分テキストデータに対応付けた固有の識別情報を置換する規則に関する規則情報の選択を受け付け、前記サーバへ送信する選択受付手段、選択を受け付けた規則情報ごとに、電子文書データ中の部分テキストデータを、対応する識別情報に置換した置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換するか否かに関する置換情報及び部分テキストデータを識別情報に置換した置換文書データを受信する置換情報受信手段、及び受信した置換情報及び置換文書データに基づいて、前記置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換する置換手段として機能させ、前記マスクデータは、一又は複数のマスクパターンを有し、前記置換情報に基づいて、前記部分テキストデータに対応する前記識別情報ごとに必要な前記マスクパターンを対応付けてある。
【発明の効果】
【0021】
本発明によれば、電子文書データに含まれる所望の部分テキストデータを、選択を受け付けた規則情報に基づいてマスクデータに置換する、あるいは元の部分テキストデータに戻すことができ、適用する規則情報を選択することによりマスクデータに置換する位置をどこにするかを制御することができる。また、マスクデータに置換する部分テキストデータの長さ、位置に特段の制約が生じることがなく、部分テキストデータの長さとマスクデータの長さとが相違している場合であっても不自然な空白部等が生じることがない。
【図面の簡単な説明】
【0022】
図1】本発明の実施の形態1に係る電子文書マスキング装置の構成を模式的に示すブロック図である。
図2】本発明の実施の形態1に係る電子文書マスキング装置の機能ブロック図である。
図3】本発明の実施の形態1に係る電子文書マスキング装置のCPUの処理手順を示すフローチャートである。
図4】本発明の実施の形態1に係る電子文書マスキング装置が取得する電子文書データのレイアウトの例示図である。
図5】本発明の実施の形態1に係る電子文書マスキング装置が取得する電子文書データの領域ごとの表示内容の例示図である。
図6】本発明の実施の形態1に係る電子文書マスキング装置の部分テキストデータに対する識別情報の割り当ての例示図である。
図7】本発明の実施の形態1に係る電子文書マスキング装置の置換文書データの例示図である。
図8】本発明の実施の形態1に係る電子文書マスキング装置の置換情報記憶部に記憶されている、一の規則情報に対応する置換情報の例示図である。
図9】本発明の実施の形態1に係る電子文書マスキング装置のマスクデータ置換後の表示を示す例示図である。
図10】本発明の実施の形態1に係る電子文書マスキング装置のマスクパターン記憶部に記憶してあるマスクパターンの対応付けの例示図である。
図11】本発明の実施の形態1に係る電子文書マスキング装置のマスクデータ置換後の表示を示す例示図である。
図12】本発明の実施の形態1に係る電子文書マスキング装置のCPUの処理手順を示すフローチャートである。
図13】本発明の実施の形態1に係る電子文書マスキング装置の置換情報記憶部に記憶されている、一の規則情報に対応する置換情報の例示図である。
図14】本発明の実施の形態1に係る電子文書マスキング装置のマスクデータ置換後の表示を示す例示図である。
図15】本発明の実施の形態2に係る電子文書マスキングシステムの構成を模式的に示すブロック図である。
図16】本発明の実施の形態2に係る電子文書マスキングシステムの機能ブロック図である。
図17】本発明の実施の形態2に係る電子文書マスキングシステムのサーバのCPUの処理手順を示すフローチャートである。
図18】本発明の実施の形態2に係る電子文書マスキングシステムのクライアントのCPUの処理手順を示すフローチャートである。
【発明を実施するための形態】
【0023】
以下、本発明の実施の形態に係る、電子文書中の所望の部分テキストデータをマスクする装置について、図面に基づいて具体的に説明する。以下の実施の形態は、特許請求の範囲に記載された発明を限定するものではなく、実施の形態の中で説明されている特徴的事項の組み合わせの全てが解決手段の必須事項であるとは限らないことは言うまでもない。
【0024】
また、本発明は多くの異なる態様にて実施することが可能であり、実施の形態の記載内容に限定して解釈されるべきものではない。実施の形態を通じて同じ要素には同一の符号を付している。
【0025】
以下の実施の形態では、コンピュータシステムにコンピュータプログラムを導入した装置について説明するが、当業者であれば明らかな通り、本発明はその一部をコンピュータで実行することが可能なコンピュータプログラムとして実施することができる。したがって、本発明は、電子文書中の所望の部分テキストデータをマスクする装置というハードウェアとしての実施の形態、ソフトウェアとしての実施の形態、又はソトウェアとハードウェアとの組み合わせの実施の形態をとることができる。コンピュータプログラムは、ハードディスク、DVD、CD、光記憶装置、磁気記憶装置等の任意のコンピュータで読み取ることが可能な記録媒体に記録することができる。
【0026】
本発明の実施の形態によれば、電子文書データに含まれる所望の部分テキストデータを、選択を受け付けた規則情報に基づいてマスクデータに置換する、あるいは元の部分テキストデータに戻すことができ、適用する規則情報を選択することによりマスクデータに置換する位置をどこにするかを制御することができる。また、マスクデータに置換する部分テキストデータの長さ、位置に特段の制約が生じることがなく、部分テキストデータの長さとマスクデータの長さとが相違している場合であっても不自然な空白部等が生じることがない。
【0027】
(実施の形態1)
図1は、本発明の実施の形態1に係る電子文書マスキング装置の構成を模式的に示すブロック図である。本発明の実施の形態1に係る電子文書マスキング装置1は、少なくともCPU(中央演算装置)11、メモリ12、記憶装置13、I/Oインタフェース14、ビデオインタフェース15、可搬型ディスクドライブ16、通信インタフェース17及び上述したハードウェアを接続する内部バス18で構成されている。
【0028】
CPU11は、内部バス18を介して電子文書マスキング装置1の上述したようなハードウェア各部と接続されており、上述したハードウェア各部の動作を制御するとともに、記憶装置13に記憶されたコンピュータプログラム100に従って、種々のソフトウェア的機能を実行する。メモリ12は、SRAM、SDRAM等の揮発性メモリで構成され、コンピュータプログラム100の実行時にロードモジュールが展開され、コンピュータプログラム100の実行時に発生する一時的なデータ等を記憶する。
【0029】
記憶装置13は、内蔵される固定型記憶装置(ハードディスク)、ROM等で構成されている。記憶装置13に記憶されたコンピュータプログラム100は、プログラム及びデータ等の情報を記録したDVD、CD−ROM等の可搬型記録媒体90から、可搬型ディスクドライブ16によりダウンロードされ、実行時には記憶装置13からメモリ12へ展開して実行される。もちろん、通信インタフェース17を介して接続されている外部コンピュータからダウンロードされたコンピュータプログラムであっても良い。
【0030】
記憶装置13は、識別情報記憶部131、置換情報記憶部132、置換文書データ記憶部133及びマスクデータ記憶部134を備えている。識別情報記憶部131は、指定を受け付けた部分テキストデータ及び対応付けられた識別情報を記憶する。
【0031】
置換情報記憶部132は、部分テキストデータをマスクデータに置換する規則を識別するための規則情報ごとに、識別情報をマスクデータ又は部分テキストデータに置換するか否かに関する置換情報を記憶する。規則情報とは、マスクする部分テキストデータを選択するルール全般に関する情報を意味しており、例えば年号のみをマスクする、電話番号のみをマスクする等のルールを意味する。
【0032】
置換文書データ記憶部133は、取得した電子文書データ中の、指定を受け付けた部分テキストデータを対応する識別情報に置換した置換文書データを記憶する。例えば記憶してある置換文書データを外部へ送信することで、識別情報をマスクデータ又は部分テキストデータに置換する処理は外部のコンピュータで実行することができる。また、置換文書データと置換情報とを組み合わせることにより、任意のマスキングを施した電子文書データを容易に生成することができる。
【0033】
マスクデータ記憶部134は、置換文書データに含まれる識別情報を置換するマスクデータのパターン情報(マスクパターン)を記憶する。パターン情報としては、置換した部分テキストデータを読み取りすることが不可能なパターンであれば特に限定されるものではなく、各色の矩形の塗りつぶしパターン、斜線パターン等何でも良い。
【0034】
通信インタフェース17は内部バス18に接続されており、インターネット、LAN、WAN等の外部のネットワークに接続されることにより、外部コンピュータ等とデータ送受信を行うことが可能となっている。
【0035】
I/Oインタフェース14は、キーボード21、マウス22等のデータ入力媒体と接続され、データの入力を受け付ける。また、ビデオインタフェース15は、CRTモニタ、LCD等の表示装置23と接続され、所定の電子文書データを表示する。
【0036】
以下、上述した構成の電子文書マスキング装置1の動作について説明する。図2は、本発明の実施の形態1に係る電子文書マスキング装置1の機能ブロック図である。
【0037】
図2において、電子文書マスキング装置1の電子文書データ取得部101は、マスキングの対象となる電子文書データを取得する。電子文書データの取得方法は特に限定されるものではなく、テキストデータとして取得しても良いし、イメージデータとして取得してテキストデータを抽出しても良い。
【0038】
部分テキストデータ指定受付部(指定受付手段)102は、取得した電子文書データの中から、マスクデータに置換する対象となる部分テキストデータの指定を受け付ける。部分テキストデータは、テキストデータ化された電子文書データに対して形態素解析等を実行して抽出した、品詞単位の語句又は連続した品詞を組み合わせた語句となる。
【0039】
識別情報割当部(識別情報記憶手段)103は、指定を受け付けた部分テキストデータに対して固有の識別情報、例えば識別IDを割り当て、記憶装置13の識別情報記憶部131に記憶する。識別情報の割当は、CPU11により自動的に行っても良いし、ユーザによる指定を受け付けても良い。
【0040】
置換文書データ生成部(置換文書データ生成手段)104は、取得した電子文書データ中の指定を受け付けた部分テキストデータを、割り当てられた識別情報に置換した置換文書データを生成する。生成した置換文書データは、記憶装置13の置換文書データ記憶部133に記憶する。
【0041】
置換情報設定受付部(置換情報記憶手段)105は、指定を受け付けた部分テキストデータをマスクデータに置換する規則を識別するための規則情報ごとに、識別情報をマスクデータ又は部分テキストデータに置換するか否かに関する置換情報の設定を受け付けて記憶する。規則情報とは、マスクする部分テキストデータを選択するルール全般に関する情報を意味しており、例えば年号のみをマスクする、電話番号のみをマスクする等のルールを意味する。規則情報は、キーボード21、マウス22等を介してユーザが事前に設定し、記憶装置13に記憶しておく。
【0042】
置換情報は、マスクデータに置換する部分テキストデータの項目名として記憶する。すなわち、キーボード21、マウス22等を介して、置換対象となる部分テキストデータの項目名を設定する。設定されていない項目名は、マスクデータに置換されない。設定した項目名は、置換情報として記憶装置13の置換情報記憶部132に記憶する。
【0043】
規則情報選択受付部(選択受付手段)106は、規則情報の選択を受け付ける。置換部(置換手段)107は、選択を受け付けた規則情報をキー情報として置換情報記憶部132から抽出した置換情報、識別情報、置換文書データ、マスクデータに基づいて、置換文書データに含まれる識別情報を、マスクデータ又は部分テキストデータに置換する。置換するマスクデータのパターン情報として、マスクデータ記憶部134に記憶されているマスクパターンを用いる。表示部111は、置換された電子文書データを表示装置23に表示する。もちろん、記憶装置13に記憶しても良い。
【0044】
規則情報選択受付部106では、一の規則情報の選択を受け付けることに限定されるものではなく、複数の規則情報の選択を受け付けても良い。複数の規則情報の選択を受け付けた場合、複数の規則情報それぞれに基づいて、置換部107は、置換文書データに含まれる識別情報をマスクデータ又は部分テキストデータに置換する。各部分テキストデータについて、選択を受け付けた規則情報のうち1つでもマスクデータに置換するルールが存在する場合には、該部分テキストデータはマスクデータに置換する。したがって、規則情報の選択に応じて、マスクされる部分テキストデータを自由に選択することができる。
【0045】
図3は、本発明の実施の形態1に係る電子文書マスキング装置1のCPU11の処理手順を示すフローチャートである。図3において、電子文書マスキング装置1のCPU11は、マスキングの対象となる電子文書データを取得する(ステップS301)。電子文書データの取得方法は特に限定されるものではなく、テキストデータとして取得しても良いし、イメージデータとして取得してテキストデータを抽出しても良い。
【0046】
CPU11は、取得した電子文書データの中から、マスクデータに置換する対象となる部分テキストデータの指定を受け付ける(ステップS302)。部分テキストデータは、テキストデータ化された電子文書データに対して形態素解析等を実行して抽出した、品詞単位の語句又は連続した品詞を組み合わせた語句となる。
【0047】
CPU11は、指定を受け付けた部分テキストデータに対して固有の識別情報、例えば識別IDを割り当て(ステップS303)、記憶装置13の識別情報記憶部131に記憶する。識別情報の割当は、CPU11により自動的に行っても良いし、ユーザによる指定を受け付けても良い。
【0048】
CPU11は、取得した電子文書データ中の部分テキストデータを、割り当てられた識別情報に置換した置換文書データを生成する(ステップS304)。生成した置換文書データは、記憶装置13の置換文書データ記憶部133に記憶する。
【0049】
CPU11は、指定を受け付けた部分テキストデータをマスクデータに置換する規則を識別するための規則情報ごとに、識別情報をマスクデータ又は部分テキストデータに置換するか否かに関する置換情報を設定して記憶する(ステップS305)。規則情報は、キーボード21、マウス22等を介してユーザが事前に設定し、記憶装置13に記憶しておく。
【0050】
CPU11は、規則情報の選択を受け付け(ステップS306)、選択を受け付けた規則情報をキー情報として置換情報記憶部132から置換情報を抽出し(ステップS307)、抽出した置換情報、識別情報、置換文書データ、マスクデータに基づいて、置換文書データに含まれる識別情報を、マスクデータ又は部分テキストデータに置換する(ステップS308)。置換するマスクデータのパターンとして、マスクデータ記憶部134に記憶されているマスクパターンを用いる。CPU11は、識別情報をマスクデータ又は部分テキストデータに置換した電子文書データを表示装置23に表示する(ステップS309)。
【0051】
なお、規則情報の選択については、ユーザによる解除要求を受け付けることが好ましい。マスクする部分テキストデータを段階的に調整することができるからである。例えば図2の解除要求受付部108は、規則情報に対する適用を解除する要求である解除要求を受け付ける。具体的には、キーボード21、マウス22等を介して、選択された規則情報の中から適用を解除するべき規則情報の選択を受け付ける。
【0052】
図4は、本発明の実施の形態1に係る電子文書マスキング装置1が取得する電子文書データのレイアウトの例示図である。図4に示す、取得した電子文書データのレイアウトの例では、領域(A)、領域(B)、領域(C)の3つの領域に分割されている。
【0053】
図5は、本発明の実施の形態1に係る電子文書マスキング装置1が取得する電子文書データの領域ごとの表示内容の例示図である。図5に示すように、領域(A)には項目名「名前」に対して「山田太郎」と表示されている。領域(B)には項目名「日時」に対して「2000.1.1」と表示されている。領域(C)には項目名「カード番号」に対して「123.123.123」、「345.345.345」、「567.567.567」と、それぞれ表示されている。
【0054】
図6は、本発明の実施の形態1に係る電子文書マスキング装置1の部分テキストデータに対する識別情報の割り当ての例示図である。図6に示すように、領域(A)の「山田太郎」には、識別ID(識別情報)として「T0001」を、領域(B)の「2000.1.1」には、識別IDとして「T0002」を、領域(C)の「123.123.123」、「345.345.345」、「567.567.567」には、それぞれ識別IDとして「T0003」、「T0004」、「T0005」が、それぞれ割り当てられている。
【0055】
図7は、本発明の実施の形態1に係る電子文書マスキング装置1の置換文書データの例示図である。図7に示すように、領域(A)の「山田太郎」は、識別ID「T0001」に置換され、領域(B)の「2000.1.1」は、識別ID「T0002」に置換され、領域(C)の「123.123.123」、「345.345.345」、「567.567.567」は、それぞれ識別ID「T0003」、「T0004」、「T0005」に置換されている。置換情報として、各識別IDがマスクデータに置換されるのか、部分テキストデータに置換されるのかを指定することにより、マスクする部分テキストデータの位置を動的に容易に変更することができる。
【0056】
すなわち置換情報としては、規則情報ごとにマスクデータに置換する項目名を記憶しておけば足りる。図8は、本発明の実施の形態1に係る電子文書マスキング装置1の置換情報記憶部132に記憶されている、一の規則情報に対応する置換情報の例示図である。図8に示すように、領域ごとに、マスクデータに置換する項目名を記憶しておく。もちろん、項目名でなく領域だけを指定して記憶しても良い。領域を記憶する場合、領域内に含まれるすべての部分テキストデータを置換対象とすることも可能である。
【0057】
マスクデータは、事前にマスクパターンを指定しておき、置換情報として置換情報記憶部132に記憶されている項目名に対して、識別IDをマスクデータに置換する。置換情報として置換情報記憶部132に記憶されていない項目名に対しては、識別IDを部分テキストデータに置換する。図9は、本発明の実施の形態1に係る電子文書マスキング装置1のマスクデータ置換後の表示を示す例示図である。
【0058】
図9の例では、マスクパターンは4文字分の「□」列としてある。したがって、図8に示す置換情報として記憶されている項目名については、識別IDがマスクデータ、すなわち4文字分の「□」列に置換されて表示されている。
【0059】
もちろん、マスクデータのマスクパターンは、項目ごとに変えても良い。この場合、識別IDに対応付けて、置換するマスクパターンを記憶装置13のマスクデータ記憶部134に記憶しておく。図10は、本発明の実施の形態1に係る電子文書マスキング装置1のマスクデータ記憶部134に記憶してあるマスクパターンの対応付けの例示図である。
【0060】
図10に示すように、識別ID「T0001」にはマスクパターンとして4文字分の「□」列を対応付けているが、識別ID「T0002」にはマスクパターンとして2文字分の「□」列を、識別ID「T0003」、「T0004」、「T0005」にはマスクパターンとして3文字分の「□」列を対応付けている。
【0061】
このように識別IDに対応付けてマスクパターンを記憶しておくことにより、置換情報として記憶されている項目名に対して、識別IDを所望のマスクデータに置換することができる。図11は、本発明の実施の形態1に係る電子文書マスキング装置1のマスクデータ置換後の表示を示す例示図である。
【0062】
図11の例では、図8に示す置換情報として記憶されている項目名について、識別IDが図10に示すマスクパターンにそれぞれ置換されて表示されている。
【0063】
なお、規則情報ごとに置換情報を記憶することができるので、複数の規則情報が記憶されている場合、どの規則情報を適用するか選択することにより、所望の項目についてのみマスクデータに置換して表示することができる。
【0064】
図2の再置換部109は、解除要求受付部108にて解除要求を受け付けた場合、解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出された置換情報、識別情報、置換文書データ、マスクデータに基づいて、置換文書データに含まれる識別IDをマスクデータ又は部分テキストデータに置換する。表示部111は、再置換部109で置換された電子文書データを表示装置23に表示する。もちろん、記憶装置13に記憶しても良い。
【0065】
図12は、本発明の実施の形態1に係る電子文書マスキング装置1のCPU11の処理手順を示すフローチャートである。図12において、電子文書マスキング装置1のCPU11は、規則情報に対する適用を解除する要求である解除要求を受け付ける(ステップS1201)。具体的には、キーボード21、マウス22等を介して、選択された規則情報の中から適用を解除するべき規則情報の選択を受け付ける。
【0066】
CPU11は、受け付けた解除要求に対応する規則情報を除外した他の規則情報をキー情報として置換情報を抽出する(ステップS1202)。CPU11は、抽出した置換情報、識別情報、置換文書データ、マスクデータに基づいて、置換文書データに含まれる識別情報を、マスクデータ又は部分テキストデータに置換する(ステップS1203)。規則情報ごとに適用するか否かを決定することにより、マスクデータに置換する位置をどこにするかを容易に制御することができる。なお、ステップS1202を、最初の置換情報の抽出時に事前に実行しておき、解除要求の受付時に抽出してある置換情報を選択することで、全体の処理パフォーマンスを向上させることも可能である。
【0067】
図13は、本発明の実施の形態1に係る電子文書マスキング装置1の置換情報記憶部132に記憶されている、一の規則情報に対応する置換情報の例示図である。図13の例では、図13(a)、(b)、(c)の3つの置換情報が記憶されている。
【0068】
図14は、本発明の実施の形態1に係る電子文書マスキング装置1のマスクデータ置換後の表示を示す例示図である。図14の例では、マスクパターンは4文字分の「□」列としてある。
【0069】
例えば複数の規則情報に対応する置換情報として、図13(a)、(b)、(c)が抽出された場合、図9に示すように識別IDがマスクデータ、すなわち4文字分の「□」列に置換されて表示される。それに対して図13(a)に示す置換情報に対応する規則情報の適用を解除する解除要求を受け付けた場合、領域(A)の識別ID「T0001」は、部分テキストデータ「山田太郎」に置換され、図14(a)のように表示される。
【0070】
また、図13(b)に示す置換情報に対応する規則情報の適用を解除する解除要求を受け付けた場合、領域(B)の識別ID「T0002」は、部分テキストデータ「2000.1.1」に置換され、図14(b)のように表示される。このように規則情報の選択に応じて、マスクされる部分テキストデータを自由に選択することができる。
【0071】
以上のように本実施の形態1によれば、電子文書データに含まれる所望の部分テキストデータを、選択を受け付けた規則情報に基づいてマスクデータに置換する、あるいは元の部分テキストデータに戻すことができ、適用する規則情報を選択することによりマスクデータに置換する位置をどこにするかを制御することができる。また、マスクデータでマスクする部分テキストデータの長さ、位置に特段の制約が生じることがなく、部分テキストデータの長さとマスクデータの長さとが相違している場合であっても不自然な空白部等が生じることがない。
【0072】
(実施の形態2)
図15は、本発明の実施の形態2に係る電子文書マスキングシステムの構成を模式的に示すブロック図である。本発明の実施の形態2に係る電子文書マスキングシステムは、データの入出力を実行するクライアント4と、クライアント4とネットワーク5を介してデータ通信することが可能に接続してあるサーバ3とで構成されている。本発明の実施の形態2に係る電子文書マスキングシステムのサーバ3は、少なくともCPU(中央演算装置)31、メモリ32、記憶装置33、I/Oインタフェース34、ビデオインタフェース35、可搬型ディスクドライブ36、通信インタフェース37及び上述したハードウェアを接続する内部バス38で構成されている。
【0073】
CPU31は、内部バス38を介してサーバ3の上述したようなハードウェア各部と接続されており、上述したハードウェア各部の動作を制御するとともに、記憶装置33に記憶されたコンピュータプログラム120に従って、種々のソフトウェア的機能を実行する。メモリ32は、SRAM、SDRAM等の揮発性メモリで構成され、コンピュータプログラム120の実行時にロードモジュールが展開され、コンピュータプログラム120の実行時に発生する一時的なデータ等を記憶する。
【0074】
記憶装置33は、内蔵される固定型記憶装置(ハードディスク)、ROM等で構成されている。記憶装置33に記憶されたコンピュータプログラム120は、プログラム及びデータ等の情報を記録したDVD、CD−ROM等の可搬型記録媒体92から、可搬型ディスクドライブ36によりダウンロードされ、実行時には記憶装置33からメモリ32へ展開して実行される。もちろん、通信インタフェース37を介して接続されている外部コンピュータからダウンロードされたコンピュータプログラムであっても良い。
【0075】
記憶装置33は、識別情報記憶部331、置換情報記憶部332、置換文書データ記憶部333及びマスクデータ記憶部334を備えている。識別情報記憶部331は、クライアント4で指定を受け付けた部分テキストデータ及び対応付けられた識別情報を受信して記憶する。
【0076】
置換情報記憶部332は、指定を受け付けた部分テキストデータをマスクデータに置換する規則を識別するための規則情報ごとに、識別情報をマスクデータ又は部分テキストデータに置換するか否かに関する置換情報を記憶する。規則情報とは、マスクする部分テキストデータを選択するルール全般に関する情報を意味しており、例えば年号のみをマスクする、電話番号のみをマスクする等のルールを意味する。
【0077】
置換文書データ記憶部333は、取得した電子文書データ中の、指定を受け付けた部分テキストデータを対応する識別情報に置換した置換文書データを記憶する。記憶してある置換文書データをクライアント4へ送信することで、識別情報をマスクデータ又は部分テキストデータに置換する処理はクライアント4で実行することができる。また、置換文書データと置換情報とを組み合わせることにより、任意のマスキングを施した電子文書データを容易に生成することができる。
【0078】
マスクデータ記憶部334は、置換文書データに含まれる識別情報を置換するマスクデータのパターン情報を記憶する。パターン情報としては、置換された部分テキストデータを読み取りすることが不可能なパターンであれば特に限定されるものではなく、各色の矩形の塗りつぶしパターン、斜線パターン等何でも良い。
【0079】
通信インタフェース37は内部バス38に接続されており、インターネット、LAN、WAN等の外部のネットワーク5に接続されることにより、クライアント4、外部コンピュータ等とデータ送受信を行うことが可能となっている。
【0080】
I/Oインタフェース34は、キーボード51、マウス52等のデータ入力媒体と接続され、データの入力を受け付ける。また、ビデオインタフェース35は、CRTモニタ、LCD等の表示装置53と接続され、所定の電子文書データを表示する。
【0081】
本発明の実施の形態2に係る電子文書マスキングシステムのクライアント4は、少なくともCPU(中央演算装置)41、メモリ42、記憶装置43、I/Oインタフェース44、ビデオインタフェース45、可搬型ディスクドライブ46、通信インタフェース47及び上述したハードウェアを接続する内部バス48で構成されている。
【0082】
CPU41は、内部バス48を介してクライアント4の上述したようなハードウェア各部と接続されており、上述したハードウェア各部の動作を制御するとともに、記憶装置43に記憶されたコンピュータプログラム110に従って、種々のソフトウェア的機能を実行する。メモリ42は、SRAM、SDRAM等の揮発性メモリで構成され、コンピュータプログラム110の実行時にロードモジュールが展開され、コンピュータプログラム110の実行時に発生する一時的なデータ等を記憶する。
【0083】
記憶装置43は、内蔵される固定型記憶装置(ハードディスク)、ROM等で構成されている。記憶装置43に記憶されたコンピュータプログラム110は、プログラム及びデータ等の情報を記録したDVD、CD−ROM等の可搬型記録媒体91から、可搬型ディスクドライブ46によりダウンロードされ、実行時には記憶装置43からメモリ42へ展開して実行される。もちろん、通信インタフェース47を介して接続されている外部コンピュータからダウンロードされたコンピュータプログラムであっても良い。
【0084】
通信インタフェース47は内部バス48に接続されており、インターネット、LAN、WAN等の外部のネットワーク5に接続されることにより、外部コンピュータ等とデータ送受信を行うことが可能となっている。
【0085】
I/Oインタフェース44は、キーボード54、マウス55等のデータ入力媒体と接続され、データの入力を受け付ける。また、ビデオインタフェース45は、CRTモニタ、LCD等の表示装置56と接続され、所定の電子文書データを表示する。
【0086】
以下、上述した構成の電子文書マスキングシステムの動作について説明する。図16は、本発明の実施の形態2に係る電子文書マスキングシステムの機能ブロック図である。
【0087】
図16において、電子文書マスキングシステムのクライアント4の電子文書データ入力受付部(データ入力受付手段)401は、マスキングの対象となる電子文書データの入力を受け付け、サーバ3へ送信する。電子文書データの入力の受付方法は特に限定されるものではなく、テキストデータとして直接入力を受け付けても良いし、イメージデータとして入力を受け付けてテキストデータを抽出しても良い。
【0088】
部分テキストデータ指定受付部(指定受付手段)402は、入力を受け付けた電子文書データの中から、マスクデータに置換する対象となる部分テキストデータの指定を受け付け、サーバ3へ送信する。部分テキストデータは、テキストデータ化された電子文書データに対して形態素解析等を実行して抽出した、品詞単位の語句又は連続した品詞を組み合わせた語句となる。
【0089】
サーバ3の部分テキストデータ受信部301は、クライアント4で指定を受け付けた部分テキストデータを受信し、識別情報割当部(識別情報記憶手段)302は、受信した部分テキストデータに対して固有の識別情報、例えば識別IDを割り当て、記憶装置33の識別情報記憶部331に記憶する。識別情報の割当は、CPU31により自動的に行っても良いし、ユーザによる指定を受け付けても良い。
【0090】
サーバ3の置換文書データ生成部303は、受信した電子文書データ中の部分テキストデータを、割り当てられた識別情報に置換した置換文書データを生成する。生成した置換文書データは、記憶装置33の置換文書データ記憶部333に記憶する。
【0091】
クライアント4の置換情報設定受付部403は、指定を受け付けた部分テキストデータをマスクデータに置換する規則を識別するための規則情報ごとに、識別情報をマスクデータ又は部分テキストデータに置換するか否かに関する置換情報の設定を受け付けてサーバ3へ送信する。規則情報は、マスクする部分テキストデータを選択するルール全般に関する情報を意味しており、例えば年号のみをマスクする、電話番号のみをマスクする等のルールを意味する。規則情報は、キーボード54、マウス55等を介してユーザが事前に設定し、サーバ3へ送信して記憶装置33に記憶しておく。
【0092】
置換情報は、マスクデータに置換する部分テキストデータの項目名として記憶する。すなわち、キーボード54、マウス55等を介して、置換対象となる部分テキストデータの項目名を設定する。設定した項目名はサーバ3へ送信され、サーバ3の置換情報受信部304は、クライアント4で設定を受け付けた置換情報を受信し、置換情報として記憶装置33の置換情報記憶部332に記憶する。
【0093】
クライアント4の規則情報選択受付部(選択受付手段)404は、規則情報の選択を受け付け、サーバ3へ送信する。サーバ3の規則情報受信部305は、クライアント4から選択を受け付けた規則情報を受信し、置換情報送信部306は、受信した規則情報をキー情報として置換情報記憶部332から抽出した置換情報、識別情報、置換文書データ、マスクデータをクライアント4へ送信する。
【0094】
クライアント4の置換情報受信部405は、サーバ3から置換情報、識別情報、置換文書データ、マスクデータを受信し、置換部406は、受信した置換情報、識別情報、置換文書データ、マスクデータに基づいて、置換文書データに含まれる識別情報を、マスクデータ又は部分テキストデータに置換する。置換するマスクデータのパターンとして、マスクデータ記憶部334に記憶されているマスクパターンを用いる。もちろん、マスクデータ記憶部334をクライアント4に設けていても良い。
【0095】
規則情報選択受付部404では、一の規則情報の選択を受け付けることに限定されるものではなく、複数の規則情報の選択を受け付けても良い。複数の規則情報の選択を受け付けた場合、複数の規則情報それぞれに基づいて、置換部406は、置換文書データに含まれる識別情報をマスクデータ又は部分テキストデータに置換する。部分テキストデータについて、規則情報のうち1つでもマスクデータに置換する場合には、該部分テキストデータはマスクデータに置換する。したがって、規則情報の選択に応じて、マスクされる部分テキストデータを自由に選択することができる。
【0096】
クライアント4の解除要求受付部407は、規則情報に対する適用を解除する要求である解除要求を受け付け、サーバ3へ送信する。サーバ3の解除要求受信部308は、解除要求を受信し、置換情報送信部306は、受信した解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出された置換情報、識別情報、置換文書データ、マスクデータをクライアント4へ送信する。これにより、クライアント4の再置換部409は、新たに受信した置換情報、識別情報、置換文書データ、マスクデータに基づいて、置換文書データに含まれる識別情報をマスクデータ又は部分テキストデータに置換する。
【0097】
もちろん、事前に規則情報、置換情報、識別情報、置換文書データ、マスクデータをクライアント4にて受信して記憶しておき、クライアント4の解除要求受付部407が解除要求を受け付けた場合、クライアント4の再置換部409において、事前に記憶してある置換情報、識別情報、置換文書データ、マスクデータに基づいて、置換文書データに含まれる識別情報をマスクデータ又は部分テキストデータに置換しても良い。これにより、通信負荷を軽減することができ、全体として表示レスポンスの向上を図ることができる。
【0098】
図17は、本発明の実施の形態2に係る電子文書マスキングシステムのサーバ3のCPU31の処理手順を示すフローチャートである。図17において、サーバ3のCPU31は、マスキングの対象となる電子文書データをテキストデータとして受信し(ステップS1701)、指定を受け付けた部分テキストデータを受信する(ステップS1702)。
【0099】
CPU31は、受信した部分テキストデータに対して固有の識別情報、例えば識別IDを割り当て(ステップS1703)、記憶装置33の識別情報記憶部331に記憶する。識別情報の割当は、CPU31により自動的に行っても良いし、ユーザによる指定を受け付けても良い。
【0100】
CPU31は、受信した電子文書データ中の部分テキストデータを、割り当てられた識別情報に置換した置換文書データを生成し(ステップS1704)、記憶装置33の置換文書データ記憶部333に記憶する。CPU31は、設定を受け付けた置換情報を受信して記憶する(ステップS1705)。CPU31は、選択を受け付けた規則情報を受信し(ステップS1706)、受信した規則情報をキー情報として置換情報を抽出し(ステップS1707)、抽出した置換情報、識別情報、置換文書データ、マスクデータをクライアント4へ送信する(ステップS1708)。
【0101】
CPU31は、規則情報に対する適用を解除する要求である解除要求を受信したか否かを判断し(ステップS1709)、CPU31が、解除要求を受信していないと判断した場合(ステップS1709:NO)、CPU31は、処理を終了するか否かを判断する(ステップS1710)。CPU31が、処理を終了しないと判断した場合(ステップS1710:NO)、CPU31は、処理をステップS1709へ戻し、解除要求の受信待ち状態となる。CPU31が、処理を終了すると判断した場合には(ステップS1710:YES)、処理を終了する。
【0102】
CPU31が、解除要求を受信したと判断した場合(ステップS1709:YES)、CPU31は、受信した解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出された置換情報、識別情報、置換文書データ、マスクデータをクライアント4へ送信する(ステップS1711)。これにより、クライアント4の再置換部409は、新たに受信した置換情報、識別情報、置換文書データ、マスクデータに基づいて、置換文書データに含まれる識別情報をマスクデータ又は部分テキストデータに置換する。
【0103】
図18は、本発明の実施の形態2に係る電子文書マスキングシステムのクライアント4のCPU41の処理手順を示すフローチャートである。図18において、クライアント4のCPU41は、マスキングの対象となる電子文書データの入力を受け付け、サーバ3へ送信する(ステップS1801)。電子文書データの入力の受付方法は特に限定されるものではなく、テキストデータとして直接入力を受け付けても良いし、イメージデータとして入力を受け付けてテキストデータを抽出しても良い。
【0104】
CPU41は、入力を受け付けた電子文書データの中から、マスクデータに置換する対象となる部分テキストデータの指定を受け付け、サーバ3へ送信する(ステップS1802)。部分テキストデータは、テキストデータ化された電子文書データに対して形態素解析等を実行して抽出した、品詞単位の語句又は連続した品詞を組み合わせた語句となる。
【0105】
CPU41は、指定を受け付けた部分テキストデータをマスクデータに置換する規則を識別するための規則情報ごとに、識別情報をマスクデータ又は部分テキストデータに置換するか否かに関する置換情報の設定を受け付け、サーバ3へ送信する(ステップS1803)。規則情報は、マスクする部分テキストデータを選択するルール全般に関する情報を意味しており、例えば年号のみをマスクする、電話番号のみをマスクする等のルールを意味する。規則情報は、キーボード54、マウス55等を介してユーザが事前に設定し、サーバ3へ送信して記憶装置33に記憶しておく。
【0106】
CPU41は、規則情報の選択を受け付け、サーバ3へ送信する(ステップS1804)。CPU41は、送信した規則情報をキー情報として置換情報記憶部332から抽出された置換情報、識別情報、置換文書データ、マスクデータを受信する(ステップS1805)。
【0107】
CPU41は、受信した置換情報、識別情報、置換文書データ、マスクデータに基づいて、置換文書データに含まれる識別情報を、マスクデータ又は部分テキストデータに置換し(ステップS1806)、置換後の電子文書データを表示装置56に表示する(ステップS1807)。
【0108】
CPU41は、規則情報に対する適用を解除する要求である解除要求を受け付けたか否かを判断する(ステップS1808)。CPU41が、解除要求を受け付けていないと判断した場合(ステップS1808:NO)、CPU41は、処理を終了するか否かを判断する(ステップS1809)。
【0109】
CPU41が、処理を終了しないと判断した場合(ステップS1809:NO)、CPU41は、処理をステップS1808へ戻し、解除要求の受付待ち状態となる。CPU41が、処理を終了すると判断した場合には(ステップS1809:YES)、処理を終了する。
【0110】
CPU41が、解除要求を受け付けたと判断した場合(ステップS1808:YES)、CPU41は、受け付けた解除要求をサーバ3へ送信し、送信した解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出された置換情報、識別情報、置換文書データ、マスクデータを受信し(ステップS1810)、処理をステップS1806へ戻して上述した処理を繰り返す。
【0111】
以上のように本実施の形態2によれば、電子文書データに含まれる所望の部分テキストデータを、選択を受け付けた規則情報に基づいてマスクデータに置換する、あるいは元の部分テキストデータに戻すことができ、適用する規則情報を選択することによりマスクデータに置換する位置をどこにするかを制御することができる。また、マスクデータでマスクする語句の長さ、位置に特段の制約が生じることがなく、語句の長さとマスクデータの長さとが相違している場合であっても不自然な空白部等が生じることがない。
【0112】
なお、本発明は上記実施例に限定されるものではなく、本発明の趣旨の範囲内であれば多種の変更、改良等が可能である。例えば置換情報、規則情報等は、クライアント4にて入力を受け付けても良いし、サーバ3にて直接、入力を受け付けても良い。また、置換部107、406と再置換部109、409とは、同一のハードウェアであっても良いし、別個のハードウェアであっても良い。
【符号の説明】
【0113】
1 電子文書マスキング装置
3 サーバ
4 クライアント
11、31、41 CPU
12、32、42 メモリ
13、33、43 記憶装置
14、34、44 I/Oインタフェース
15、35、45 ビデオインタフェース
16、36、46 可搬型ディスクドライブ
17、37、47 通信インタフェース
18、38、48 内部バス
90、91、92 可搬型記録媒体
100、110、120 コンピュータプログラム
131、331 識別情報記憶部
132、332 置換情報記憶部
133、333 置換文書データ記憶部
134、334 マスクデータ記憶部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18