IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特許7522356画像データ編集プログラム、画像データ編集方法及び画像データ編集装置
<>
  • 特許-画像データ編集プログラム、画像データ編集方法及び画像データ編集装置 図1
  • 特許-画像データ編集プログラム、画像データ編集方法及び画像データ編集装置 図2
  • 特許-画像データ編集プログラム、画像データ編集方法及び画像データ編集装置 図3
  • 特許-画像データ編集プログラム、画像データ編集方法及び画像データ編集装置 図4
  • 特許-画像データ編集プログラム、画像データ編集方法及び画像データ編集装置 図5
  • 特許-画像データ編集プログラム、画像データ編集方法及び画像データ編集装置 図6
  • 特許-画像データ編集プログラム、画像データ編集方法及び画像データ編集装置 図7
  • 特許-画像データ編集プログラム、画像データ編集方法及び画像データ編集装置 図8
  • 特許-画像データ編集プログラム、画像データ編集方法及び画像データ編集装置 図9
  • 特許-画像データ編集プログラム、画像データ編集方法及び画像データ編集装置 図10
  • 特許-画像データ編集プログラム、画像データ編集方法及び画像データ編集装置 図11
  • 特許-画像データ編集プログラム、画像データ編集方法及び画像データ編集装置 図12
  • 特許-画像データ編集プログラム、画像データ編集方法及び画像データ編集装置 図13
  • 特許-画像データ編集プログラム、画像データ編集方法及び画像データ編集装置 図14
  • 特許-画像データ編集プログラム、画像データ編集方法及び画像データ編集装置 図15
  • 特許-画像データ編集プログラム、画像データ編集方法及び画像データ編集装置 図16
  • 特許-画像データ編集プログラム、画像データ編集方法及び画像データ編集装置 図17
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-17
(45)【発行日】2024-07-25
(54)【発明の名称】画像データ編集プログラム、画像データ編集方法及び画像データ編集装置
(51)【国際特許分類】
   G06F 21/62 20130101AFI20240718BHJP
   G06T 1/00 20060101ALI20240718BHJP
【FI】
G06F21/62 345
G06T1/00 200C
【請求項の数】 6
(21)【出願番号】P 2021054791
(22)【出願日】2021-03-29
(65)【公開番号】P2022152134
(43)【公開日】2022-10-12
【審査請求日】2023-12-07
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100087480
【弁理士】
【氏名又は名称】片山 修平
(72)【発明者】
【氏名】原田 義之
(72)【発明者】
【氏名】豆田 成示
(72)【発明者】
【氏名】和田 浩二
(72)【発明者】
【氏名】浅野 貴美子
(72)【発明者】
【氏名】郡司 靖
(72)【発明者】
【氏名】時津 裕史
【審査官】青木 重徳
(56)【参考文献】
【文献】特開2007-207181(JP,A)
【文献】特開2019-185139(JP,A)
【文献】特開2013-42227(JP,A)
【文献】中国特許出願公開第111259207(CN,A)
【文献】米国特許出願公開第2015/0112753(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 21/62
G06T 1/00
(57)【特許請求の範囲】
【請求項1】
画像データに含まれる文字列を取得し、
マスク対象の項目名と、該項目名に対応する文字列の特徴とを関連付けて記憶する記憶部を参照して、取得した前記文字列の中から前記マスク対象の項目名を抽出し、
前記記憶部を参照して、前記画像データに含まれる文字列の中から、抽出した前記マスク対象の項目名に対応する文字列の特徴を満たす第1文字列を特定し、
特定した前記第1文字列を基準として、縦方向及び横方向に並ぶ、抽出した前記マスク対象の項目名に対応する文字列の特徴を満たす第2文字列を特定し、
前記画像データの、前記第1文字列と前記第2文字列をマスクする、
処理をコンピュータに実行させるための画像データ編集プログラム。
【請求項2】
前記第1文字列を特定する処理では、抽出した前記マスク対象の項目名の左上側を除く範囲に存在する文字列の中から、前記第1文字列を1つ特定する、ことを特徴とする請求項1に記載の画像データ編集プログラム。
【請求項3】
前記第1文字列を特定する処理では、抽出した前記マスク対象の項目名に最も近い位置に存在する前記第1文字列を特定する、ことを特徴とする請求項1又は2に記載の画像データ編集プログラム。
【請求項4】
前記記憶部は、マスク対象の領域を示す画像と、前記マスク対象の領域に対応する文字列の特徴とを関連付けて記憶しており、
前記マスクする処理では、前記画像データのうち、前記記憶部に記憶されている前記マスク対象の領域に存在し、かつ前記マスク対象の領域に対応する文字列の特徴を有する文字列をマスクする、ことを特徴とする請求項1~3のいずれか一項に記載の画像データ編集プログラム。
【請求項5】
画像データに含まれる文字列を取得し、
マスク対象の項目名と、該項目名に対応する文字列の特徴とを関連付けて記憶する記憶部を参照して、取得した前記文字列の中から前記マスク対象の項目名を抽出し、
前記記憶部を参照して、前記画像データに含まれる文字列の中から、抽出した前記マスク対象の項目名に対応する文字列の特徴を満たす第1文字列を特定し、
特定した前記第1文字列を基準として、縦方向及び横方向に並ぶ、抽出した前記マスク対象の項目名に対応する文字列の特徴を満たす第2文字列を特定し、
前記画像データの、前記第1文字列と前記第2文字列をマスクする、
処理をコンピュータが実行することを特徴とする画像データ編集方法。
【請求項6】
画像データに含まれる文字列を取得する文字列取得部と、
マスク対象の項目名と、該項目名に対応する文字列の特徴とを関連付けて記憶する記憶部と、
前記記憶部を参照して、取得した前記文字列の中から前記マスク対象の項目名を抽出する抽出部と、
前記記憶部を参照して、前記画像データに含まれる文字列の中から、抽出した前記マスク対象の項目名に対応する文字列の特徴を満たす第1文字列を特定する第1特定部と、
特定した前記第1文字列を基準として、縦方向及び横方向に並ぶ、抽出した前記マスク対象の項目名に対応する文字列の特徴を満たす第2文字列を特定する第2特定部と、
前記画像データの、前記第1文字列と前記第2文字列をマスクするマスク処理部と、
を備える画像データ編集装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像データ編集プログラム、画像データ編集方法及び画像データ編集装置に関する。
【背景技術】
【0002】
例えば、銀行等において、利用するシステムのマニュアルを作成する場合、実際の入力画面等をスクリーンショットして得られる画像を利用することがある。このような画像には、顧客情報などの秘匿すべき情報が含まれるため、従来においては、人手で秘匿すべき情報にマスクをかける必要があった。
【0003】
また、画像の秘匿すべき部分を隠蔽する技術として、例えば特許文献1、2等が知られている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2005-18220号公報
【文献】特開2008-204226号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、人手で秘匿すべき情報にマスクをかける場合、手間がかかるとともに、見落としが生じるおそれがある。
【0006】
また、例えば特許文献2では、表において特定の項目の所定方向(例えば下側)に並ぶ文字列を非表示にすることはできるものの、特定の項目に対応する文字列が当該項目の所定方向に並んでいない場合には非表示にすることはできない。
【0007】
1つの側面では、本発明は、画像データに含まれる特定の項目に対応する文字列を精度よくマスクすることが可能な画像データ編集プログラム、画像データ編集方法及び画像データ編集装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
一つの態様では、画像データ編集プログラムは、画像データに含まれる文字列を取得し、マスク対象の項目名と、該項目名に対応する文字列の特徴とを関連付けて記憶する記憶部を参照して、取得した前記文字列の中から前記マスク対象の項目名を抽出し、前記記憶部を参照して、前記画像データに含まれる文字列の中から、抽出した前記マスク対象の項目名に対応する文字列の特徴を満たす第1文字列を特定し、特定した前記第1文字列を基準として、縦方向及び横方向に並ぶ、抽出した前記マスク対象の項目名に対応する文字列の特徴を満たす第2文字列を特定し、前記画像データの、前記第1文字列と前記第2文字列をマスクする、処理をコンピュータに実行させるための画像データ編集プログラムである。
【発明の効果】
【0009】
画像データに含まれる特定の項目に対応する文字列を精度よくマスクすることができる。
【図面の簡単な説明】
【0010】
図1】一実施形態に係る情報処理システムの構成を概略的に示す図である。
図2図2(a)は、サーバのハードウェア構成を示す図であり、図2(b)は、管理者端末及び利用者端末のハードウェア構成を示す図である。
図3】サーバの機能ブロック図である。
図4】管理者端末、サーバ、利用者端末の処理の概要を示す図である。
図5図5(a)は、文字列パターンDBを示す図であり、図5(b)、図5(c)は、文字列パターンDBのチェックルールのフィールドに格納される画像の一例を示す図である。
図6】登録部の処理を示すフローチャートである。
図7】サーバによる画像データのマスク処理を示すフローチャートである。
図8】キャプチャされた画像データの一例を示す図である。
図9図8の画像データに含まれる全ての文字列の情報を示す図である。
図10図10(a)、図10(b)は、図7の処理で得られるリストを示す図(その1)である。
図11図11(a)、図11(b)は、図7の処理で得られるリストを示す図(その2)である。
図12図12(a)、図12(b)は、図7の処理で得られるリストを示す図(その3)である。
図13】項目名の原点を基準とした第1象限~第4象限を示す図である。
図14図7のステップS42を説明するための図である。
図15図15(a)~図15(e)は、マスク対象の情報を示す図である。
図16】マスク処理された画像データの一例を示す図である。
図17図17(a)、図17(b)は、画像データに含まれる表の別例について説明するための図である。
【発明を実施するための形態】
【0011】
以下、情報処理システムの一実施形態について、図1図17に基づいて詳細に説明する。
【0012】
図1には、一実施形態に係る情報処理システム100の構成が概略的に示されている。図1に示すように、情報処理システム100は、画像データ編集装置としてのサーバ10と、管理者端末60と、複数の利用者端末70と、備えており、各装置は、インターネットなどのネットワーク80に接続されている。
【0013】
サーバ10は、利用者端末70から送信されてくる画像データを取得して、取得した画像データの中から、マスク(秘匿)すべき文字列を特定する。また、サーバ10は、特定した文字列を自動的にマスク処理し、マスク処理後の画像データを利用者端末70に戻す処理を実行する。
【0014】
図2(a)には、サーバ10のハードウェア構成が示されている。図2(a)に示すように、サーバ10は、CPU(Central Processing Unit)90、ROM(Read Only Memory)92、RAM(Random Access Memory)94、記憶部(例えば、SSD(Solid State Drive)やHDD(Hard Disk Drive))96、ネットワークインタフェース97、及び可搬型記憶媒体用ドライブ99等を備えている。これらサーバ10の構成各部は、バス98に接続されている。サーバ10では、ROM92あるいはHDD96に格納されているプログラム(画像データ編集プログラムを含む)、或いは可搬型記憶媒体用ドライブ99が可搬型記憶媒体91から読み取ったプログラム(画像データ編集プログラムを含む)をCPU90が実行することにより、図3に示す、各部の機能が実現される。なお、図3には、サーバ10の記憶部96等に格納されている画像データ記憶部42や、記憶部としての文字列パターンDB40も図示されている。なお、図3の各部の機能は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。なお、図3の各部の詳細については後述する。
【0015】
管理者端末60は、管理者が利用するPC(Personal Computer)等の端末であり、図2(b)に示すようなハードウェア構成を有する。具体的には、図2(b)に示すように、管理者端末60は、CPU190、ROM192、RAM194、記憶部196、ネットワークインタフェース197、表示部193、入力部195、及び可搬型記憶媒体用ドライブ199等を備えている。これら管理者端末60の構成各部は、バス198に接続されている。また、可搬型記憶媒体用ドライブ199は、可搬型記憶媒体191に記憶されているプログラムやデータを読み取る装置である。表示部193は、液晶ディスプレイ等を含み、入力部195は、キーボードやマウス、タッチパネル等を含む。
【0016】
管理者端末60を利用する管理者は、入力部195を介して、画像データにおいてマスク処理を施すべき文字列の情報を入力する。サーバ10では、管理者が入力した情報を取得すると、当該情報を管理し、マスク処理に利用する。
【0017】
利用者端末70は、利用者(例えば銀行で利用されるシステムのマニュアルを作成するユーザ)が利用するPC(Personal Computer)等の端末であり、管理者端末60と同様、図2(b)に示すようなハードウェア構成を有する。
【0018】
利用者端末70を利用する利用者は、入力部195を介して、表示部193上に表示されている画面をキャプチャするための指示を入力する(例えば、キーボードの「print screen」キーを押下する)。利用者端末70は、当該指示が入力されると、表示部193上に表示されている画面をキャプチャし、生成された画像データをサーバ10に送信する。また、利用者端末70は、サーバ10からマスク処理後の画像データが送信されてきたときに、当該画像データを取得する。
【0019】
図4には、本実施形態における、管理者端末60、サーバ10、利用者端末70の処理の概要が示されている。本実施形態においては、管理者が、管理者端末60に、マスク処理を施すべき文字列の情報を入力すると、管理者端末60は、(1)マスク処理すべき文字列の情報をサーバ10に送信する。この情報を受信したサーバ10は、(2)管理者端末60から受信したマスク処理すべき文字列の情報を登録する。この(1)、(2)の処理は、管理者がマスク処理すべき文字列の情報を入力するたびに実行される。一方、利用者端末70において、利用者が画面をキャプチャする指示を入力すると、利用者端末70は、(3)画面をキャプチャし、キャプチャした画像データをサーバ10に送信する。これに対し、画像データを受信したサーバ10は、(4)受信した画像データに対しマスク処理を実行する。そして、サーバ10は、(5)マスク処理後の画像データを利用者端末70に送信する。本実施形態では、例えば、利用者端末70において図8に示すような画像データがキャプチャされた場合、サーバ10では、図16に示すようにマスク処理し、マスク処理後の画像データが利用者端末70に送信されるようになっている。
【0020】
次に、サーバ10の機能について、図3に基づいて説明する。サーバ10は、CPU90がプログラムを実行することにより、登録部20、画像データ受信部24、文字列取得部としてのOCR処理部26、秘密情報解析部28、マスク処理部30、マスク画像送信部32、として機能する。
【0021】
登録部20は、管理者端末60において管理者が入力したマスク処理すべき文字列の情報を取得し、文字列パターンDB40に格納する。ここで、文字列パターンDB40は、画像データの中からマスク処理をすべき文字列を特定するために必要な情報が格納されている。具体的には、文字列パターンDB40は、図5(a)に示すように、「項目名」、「属性」、「値」、「チェックルール」の各フィールドを有する。「項目名」のフィールドには、マスク処理をすべき文字列の項目名(例えば「マイナンバー」や「性別」など)が格納されている。「属性」及び「値」のフィールドには、「項目名」に対応する文字列の特徴が格納されている。例えば、項目名が「マイナンバー」の場合、属性として「%n12」が格納されている。「%n12」は、12桁の数値を意味する。また、例えば、項目名が「性別」の場合、値として具体的な文字列「男」、「女」「男性」、「女性」が格納されている。
【0022】
「チェックルール」には、属性や値では表現できない条件がある場合に、詳細なチェックルールが格納される。例えば、項目名が「マイナンバー」の場合、12桁の数値がマイナンバーであるかをチェックする「マイナンバーチェック」が格納される。マイナンバーチェックとしては、総務省で定められた、文字列の12桁目でチェックデジットを行う方法を用いることができる(平成二十六年総務省令第八十五号「行政手続における特定の個人を識別するための番号の利用等に関する法律の規定による通知カード及び個人番号カード並びに情報提供ネットワークシステムによる特定個人情報の提供等に関する省令」第五条)。また、例えば項目名が「免許証番号」の場合、「チェックルール」には、「免許証番号チェック」が格納される。この免許証番号チェックの場合、警察庁で定められた、文字列の11桁目でチェックデジットを行う方法を用いることができる(昭和56年9月10日「丁運発第105号 運転免許証の番号の形式及び内容について」参照)。
【0023】
上記のように、本実施形態では、図5(a)の文字列パターンDB40において、マスク対象の項目名と、項目名に対応する文字列の特徴とが関連付けて(紐付けて)記憶されている。
【0024】
また、例外処理として、ある領域をマスク領域として追加したり、ある領域をマスク領域から除外する場合には、「チェックルール」のフィールドに、領域を特定するための画像が格納される。なお、領域を特定するための画像の具体例については、後述する。
【0025】
画像データ受信部24は、利用者端末70においてキャプチャされた画像データを取得し、画像データ記憶部42に記憶する。なお、画像データ記憶部42には、サーバ10においてマスク処理される画像データが一時記憶される。
【0026】
OCR処理部26は、画像データ記憶部42に記憶された画像データを取得し、OCR(Optical Character Recognition)処理により、画像データに含まれる文字列を取得する。
【0027】
秘密情報解析部28は、文字列パターンDB40(図5(a))を参照して、OCR処理部26が取得した文字列の中から、文字列パターンDB40に格納されている項目名と一致する文字列を特定する。また、秘密情報解析部28は、特定した文字列を基準として、項目名に対応する特徴を有する文字列(マスクすべき、又はマスクするのが好ましい文字列)を抽出する。
【0028】
マスク処理部30は、画像データ記憶部42から画像データを読み出し、秘密情報解析部28が抽出したマスクすべき文字列をマスクする処理を実行する。
【0029】
マスク画像送信部32は、マスク処理部30がマスク処理した画像データを利用者端末70に対して送信する処理を実行する。
【0030】
(サーバ10の処理について)
次に、サーバ10の処理について、図6図7のフローチャートに沿って、その他図面を適宜参照しつつ詳細に説明する。
【0031】
(登録部20の処理)
図6は、登録部20の処理を示すフローチャートである。この図6の処理は、図4の(1)、(2)の処理に対応している。
【0032】
図6の処理が開始されると、登録部20は、まず、ステップS10において、マスク対象の項目名と文字列パターンの情報(属性、値、チェックルール)を受信するまで待機する。管理者端末60に管理者がマスク対象の項目名と文字列パターンの情報を入力すると、ステップS12に移行する。
【0033】
ステップS12に移行すると、登録部20は、項目名と文字列パターンとを紐づけて、文字列パターンDB40に格納する。例えば、管理者が項目名「マイナンバー」と「性別」に関する文字列パターンの情報(特徴の情報)を入力した場合には、図5(a)に示すように情報を格納する。登録部20は、その後はステップS10に戻り、上記処理を繰り返し実行する。
【0034】
(画像データのマスク処理)
図7は、サーバ10による画像データのマスク処理を示すフローチャートである。この図7の処理は、図4の(3)~(5)の処理に対応している。図7の処理は、利用者端末70からキャプチャされた画像データが送信されてきた段階(画像データ受信部24が画像データを取得した段階)で開始される。なお、ここでは、画像データ受信部24は、図8に示すような画像データを取得し、画像データ記憶部42に記憶したとする。図8においては、画像データの左上を原点とした座標系を示しているが、実際の画像データには座標系の表示は含まれないものとする。
【0035】
図7の処理が開始されると、まず、ステップS30において、OCR処理部26が、画像データに対してOCR処理を実行し、各文字列と、文字列の位置やサイズ情報を取得する。ここで、文字列の位置やサイズの情報には、文字列の左上位置を原点として、原点の横方向の座標、原点の縦方向の座標、文字列全体を矩形とみなしたときの矩形サイズ横、矩形サイズ縦の情報が含まれる。図9には、図8の画像データに含まれる全ての文字列の情報が示されている。例えば、「マイナンバー」という文字列であれば、文字列の情報は、文字列=「マイナンバー」、原点の横方向の座標=「150」、原点の縦方向の座標=「50」、文字列全体を矩形とみなしたときの矩形サイズ横=「75」、矩形サイズ縦=「25」である。図9のように取得された情報は、図10(a)に示すようにリスト化され、秘密情報解析部28に送信される。
【0036】
次いで、ステップS32では、秘密情報解析部28が、文字列パターンDB40(図5(a))を参照して、文字列パターンDB40に格納されている項目名と一致する文字列を特定する。ここでは、図10(a)のリストから、図10(b)に示すように、文字列「マイナンバー」と「性別」が特定される。
【0037】
次いで、ステップS34では、秘密情報解析部28が、文字列パターンDB40を参照し、特定した項目名に対応する特徴を有する文字列を抽出する。
【0038】
ここで、秘密情報解析部28は、まず、項目名「マイナンバー」についての処理を行うものとする。このとき、秘密情報解析部28は、図10(a)のリストの中から、12桁の数値であり、かつマイナンバーチェックの条件をクリアする文字列を特定する。例えば、図10(a)のリスト中から、12桁の数値として、図11(a)に示す(A)~(G)の7つの文字列が特定されたとする。また、特定された7つの文字列のうち、マイナンバーチェックの条件をクリアする文字列は、(A)文字列「123456789012」と、(C)「234567890123」、(G)「345678901234」となったものとする。
【0039】
また、秘密情報解析部28は、上記マイナンバーチェックの条件を満たす文字列であっても、マスク領域から除外する領域に存在する文字列は除外する。図5(a)の例では、マスク領域から除外する領域が、従業員番号欄画像.PNGで特定されている。従業員番号欄画像.PNGは、図5(b)に示すような画像である。この場合、秘密情報解析部28は、項目名「従業員番号」の下側の欄の領域に存在する12桁の文字列は、マスクしないこととする。図8の例では、当該領域に文字列「999999999999」や「8888888888888」が存在しているので、これらの文字列については、仮にマイナンバーチェックの条件を満たす場合でも除外される。この結果、項目名「マイナンバー」に対応する特徴を有する文字列のリストとして、図11(b)に示すようなリストが得られる。
【0040】
本実施形態では、上述したように、マスク領域から除外する領域を定義するために「従業員番号欄画像.PNG」のような画像(図5(b))を用いることとしている。これにより、利用者が表をどのような大きさ(拡大率)でキャプチャしても、マスク領域から除外する箇所を精度よく特定することができる。
【0041】
また、秘密情報解析部28は、項目名「性別」についての処理も行う。この場合、秘密情報解析部28は、図10(a)のリストから、「男」、「女」、「男性」、「女性」のいずれかである文字列(図12(a)の(H)、(I)参照)を、特定する。この結果、項目名「性別」に対応する特徴を有する文字列のリストとして、図12(b)に示すようなリストが得られる。
【0042】
次いで、ステップS36では、秘密情報解析部28が、項目名に対応する特徴を有する文字列が抽出できたか否かを判断する。このステップS36の判断が否定された場合、すなわちステップS34において文字列を特定できなかった場合には、ステップS50に移行し、秘密情報解析部28はマスク処理を行う箇所が無かった旨を利用者端末70に通知する。利用者は、この通知を参照することで、キャプチャした画像に秘匿すべき情報がないことを確認できるので、安心して、キャプチャした画像をマニュアル等の作成に利用することができる。その後は、図7の全処理を終了する。
【0043】
一方、ステップS36の判断が肯定された場合、すなわち、図11(b)、図12(b)に示すようにステップS34において文字列を特定できた場合には、ステップS38に移行する。ステップS38に移行すると、秘密情報解析部28は、ステップS34において抽出できた文字列に対応する項目名を1つ選択する。ここでは、項目名「マイナンバー」が選択されるものとする。
【0044】
次いで、ステップS40では、秘密情報解析部28が、選択した項目名の左上側の領域を除く領域において、抽出した文字列の中から、選択した項目名の位置に最も近い文字列を特定する。この場合、秘密情報解析部28は、図10(b)の項目名「マイナンバー」の座標と、図11(b)のリストに含まれる文字列の座標を参照する。そして、秘密情報解析部28は、図13に示すように項目名「マイナンバー」の原点から見て、第2象限を除く領域(第1、第3、第4象限)に存在し、項目名「マイナンバー」の原点から最も原点が近い文字列(第1文字列)を特定する。このように第2象限を除外するのは、第2象限には、選択している項目名「マイナンバー」に対応する文字列が存在する可能性が低いからであり、第2象限を除外することで、処理を簡素化することができる。ここでは、図11(b)のリストのうち、文字列「123456789012」が特定されたものとする。
【0045】
次いで、ステップS42では、秘密情報解析部28が、抽出した文字列(図11(b))の中から、特定した文字列(第1文字列)を基準として、縦横に並ぶ文字列(第2文字列)を特定する。具体的には、秘密情報解析部28は、図14に示すように、文字列「123456789012」から縦方向に探索することで、文字列「234567890123」を特定する。また、秘密情報解析部28は、文字列「123456789012」から横方向に探索したり、文字列「234567890123」から横方向に探索するが(図14の破線矢印参照)、この場合には、新たな文字列は特定されない。したがって、本実施形態では、秘密情報解析部28は、図15(a)、図15(b)に示すようなマスク対象領域の情報(マスク処理をすべき文字列を示す情報)を生成し、マスク処理部30に送信する。なお、例えば、文字列「123456789012」や「234567890123」から横方向に探索した結果、新たな文字列が特定された場合には、秘密情報解析部28は、新たに特定された文字列を起点として縦方向や横方向に文字列の探索を行うものとする。
【0046】
次いで、ステップS44では、秘密情報解析部28が、マスク領域追加処理を実行し、追加対象の文字列を特定する。この場合、秘密情報解析部28は、図5(a)の文字列パターンDB40を参照して、選択している項目名に対応するチェックルールとして「マスク領域追加」が存在しているかを判断する。そして、存在している場合には、秘密情報解析部28は、当該マスク領域追加に対応付けられている画像(ここでは「備考欄画像.PNG」)を参照する。ここで、「備考欄画像.PNG」は、図5(c)に示すような画像であるとする。秘密情報解析部28は、この「備考欄画像.PNG」と同一の部分が、図8の画像データ中に存在するかを判断する。図8の場合、図5(c)と同一の部分が存在しているので、その部分の下側の欄に存在する12桁の数値で、マイナンバーチェックの条件を満たす文字列をマスク対象とする。図8の例では、「345678901234」がマスク対象領域となる。したがって、秘密情報解析部28は、図15(c)に示すようなマスク対象領域の情報を生成し、マスク処理部30に送信する。
【0047】
なお、本実施形態では、上述したように、マスク領域に追加する領域を定義するために図5(c)に示す「備考欄画像.PNG」のような画像を用いることとしている。これにより、利用者が表をどのような大きさ(拡大率)でキャプチャしても、マスク領域を精度よく特定することができる。
【0048】
次いで、ステップS46では、秘密情報解析部28が、項目名を全て選択したか否かを判断する。ここでの判断が否定されると、秘密情報解析部28は、ステップS38に戻る。
【0049】
ステップS38に戻ると、秘密情報解析部28は、ステップS34において抽出できた文字列に対応する項目名を1つ選択する。ここでは、項目名「性別」が選択されるものとする。
【0050】
次いで、ステップS40では、秘密情報解析部28が、選択した項目名「性別」の原点を基準とした左上の領域を除く領域において、抽出した文字列(図12(b))の中から、選択した項目名の位置に最も近い文字列を特定する。この場合、図12(b)のリストに含まれる文字列の中から、図8において上側に位置する「男性」の文字列が特定される。
【0051】
次いで、ステップS42では、秘密情報解析部28が、抽出した文字列(図12(b))の中から、ステップS40で特定した文字列を基準として、縦横に並ぶ文字列を特定する。これにより、図8において下側に位置する「男性」の文字列が特定される。本実施形態では、秘密情報解析部28は、図15(d)、図15(e)に示すようなマスク対象領域の情報を生成し、マスク処理部30に送信する。
【0052】
次いで、ステップS44では、秘密情報解析部28が、マスク領域追加処理を実行し、追加対象の文字列を特定する。なお、図5(a)に示すように、選択中の項目名「性別」には「マスク領域追加」のチェックルールが存在していないので、ここでの処理は行われず、ステップS46に移行する。
【0053】
ステップS46に移行すると、秘密情報解析部28は、項目名を全て選択したか否かを判断する。ここでの判断が肯定されると、秘密情報解析部28は、ステップS48に移行する。
【0054】
ステップS48では、マスク処理部30が、画像データのうち、特定された文字列の位置をマスク処理する。具体的には、マスク処理部30は、秘密情報解析部28から送信されてきた図15(a)~図15(e)に示すマスク対象領域の情報に基づいて、図8の画像データを図16に示すようにマスク処理する。そして、マスク画像送信部32は、マスク処理後の画像データ(図16)を利用者端末70に送信する。これにより、利用者は、人手で画像データにマスク処理を行う必要がなくなる。また、本実施形態では、精度よく画像データがマスク処理されるため、秘匿すべき情報が漏洩するのを防止することができる。以上により、図7の全処理が終了する。
【0055】
なお、本実施形態では、図17(a)に示すような表(3列目以降の項目名が省略されている表)がキャプチャされた場合でも、マスク処理すべき文字列を精度よく特定することができる。この場合、項目名「マイナンバー」が特定され((1)参照)、項目名に対応する特徴を有する文字列のうち最も近い文字列(第1文字列)が特定される((2)参照)。そして、(2)で特定された最も近い文字列から縦横方向に探索されることで、同様の特徴を有する文字列(第2文字列)が特定される((3)~(5)参照)。なお、本処理においては、(2)の文字列を起点として、縦方向に探索をし、縦方向の文字列の探索が完了したら、(2)の文字列と、縦方向の探索で見つかった(3)の文字列を起点として横方向への探索を行う。また、横方向の探索で新たに見つかった(4)、(5)の文字列からも縦方向及び横方向に探索を行う。なお、既に見つかっている文字列が再度見つかった場合には、その文字列からは再度探索は行わないこととする。
【0056】
また、図17(b)に示すような表(項目名「マイナンバー」よりも上側にマイナンバーの文字列が表示された表)がキャプチャされた場合でも、マスク処理すべき文字列を精度よく特定することができる。この場合、(1)項目名「マイナンバー」が特定され、(2)項目名に対応する特徴を有する文字列のうち最も近い文字列(第1文字列)が特定される。そして、(3)~(5)最も近い文字列から縦横方向に探索して同様の特徴を有する文字列(第2文字列)が特定される。このように、様々な形式の表がキャプチャされた画像データであっても、図8の画像データと同様に、マスク処理を精度よく行うことができる。
【0057】
これまでの説明から明らかなように、本実施形態では、秘密情報解析部28により、画像データから所定の項目名を抽出する抽出部、画像データから項目名に対応する文字列の特徴を満たす文字列を特定する第1、第2特定部としての機能が実現されている。
【0058】
以上、詳細に説明したように、本実施形態によると、OCR処理部26は、画像データに含まれる文字列を取得する(S30)。また、秘密情報解析部28は、文字列パターンDB40を参照して、取得した文字列の中からマスク対象の項目名を特定する(S32)。また、秘密情報解析部28は、文字列パターンDB40を参照して、画像データに含まれる文字列の中から、特定した項目名に対応する文字列の特徴を満たす文字列を特定する(S34、S40)。また、秘密情報解析部28は、特定した文字列を基準として、縦方向及び横方向に並ぶ、項目名に対応する文字列の特徴を満たす文字列を特定する(S42)。そして、マスク処理部30は、秘密情報解析部28の処理結果に基づいて、画像データをマスク処理する(S48)。すなわち、秘密情報解析部28は、マスクするのが好ましい文字列の特徴を有する文字列(第1文字列)を基準として、同様の特徴を有する文字列が配置されている可能性の高い位置を探索し、同様の特徴を有する文字列(第2文字列)を特定する。これにより、精度よくマスク対象の文字列を特定することができる。したがって、サーバ10によれば、マスク対象の文字列が精度よくマスク処理された画像データを自動的に生成し、利用者端末70に提供することができる。また、サーバ10において画像データが自動的にマスク処理されることから、利用者は、画像データを手動でマスク処理しなくてもよくなる。例えば、マスク処理の方法としては、項目名の所定方向(右方向や下方向)に存在する所定文字数の文字列をマスクする方法がある。しかしながら、このような方法では、図17(a)や図17(b)のような表を含む画像データを適切にマスクすることは難しい。一方、本実施形態では、図17(a)や図17(b)のような表を含む画像データであっても、適切にマスク処理を行うことができる。
【0059】
また、本実施形態では、ステップS40において、秘密情報解析部28は、選択している項目名の左上側(第2象限)を除く範囲において、項目名に対応する特徴を有する文字列を1つ特定する。このように、処理において、第2象限を除外することで、処理の簡素化を図ることができる。
【0060】
また、本実施形態では、図5(a)の「チェックルール」のフィールドに、マスク領域を追加するために用いる画像(例えば、備考欄画像.PNG)を格納しておくことができる。このように、マスク領域を特定する画像を格納しておくことで、表がどのような大きさ(拡大率)でキャプチャされたとしても、マスク領域に追加する領域を精度よく特定することができる。
【0061】
なお、上記実施形態では、秘密情報解析部28は、ステップS40において、項目名に対応する特徴を有する文字列のうち、項目名の最も近くに存在する文字列を特定しているが、これに限られるものではない。例えば、秘密情報解析部28は、項目名に対応する特徴を有する文字列の中からランダムに1つの文字列を特定してもよい。
【0062】
なお、上記実施形態では、秘密情報解析部28は、ステップS40において、項目名の原点を基準として第2象限以外の範囲で、項目名の位置に最も近い文字列を特定する場合について説明したが、これに限られるものではない。例えば、ステップS34において、秘密情報解析部28が文字列を抽出する範囲から、第2象限を除外してもよい。また、ステップS42において、秘密情報解析部28が縦横に探索する際に、第2象限を除外することとしてもよい。あるいは、ステップS40やステップS34、S42において、第2象限を除外せずに各処理を行うこととしてもよい。
【0063】
なお、上記実施形態では、マスク処理部30は、文字列を黒塗りの矩形形状でマスクする場合について説明したが、これに限られるものではない。例えば、文字列の文字数がわかるように、1文字ずつマスクすることとしてもよい。また、モザイク処理を行ったり、任意の文字(例えばアルファベットや×など)で置き換える処理を行うこととしてもよい。
【0064】
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、処理装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記憶媒体(ただし、搬送波は除く)に記録しておくことができる。
【0065】
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD(Digital Versatile Disc)、CD-ROM(Compact Disc Read Only Memory)などの可搬型記憶媒体の形態で販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
【0066】
プログラムを実行するコンピュータは、例えば、可搬型記憶媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記憶媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
【0067】
上述した実施形態は本発明の好適な実施の例である。但し、これに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施可能である。
【0068】
なお、以上の実施形態の説明に関して、更に以下の付記を開示する。
(付記1) 画像データに含まれる文字列を取得し、
マスク対象の項目名と、該項目名に対応する文字列の特徴とを関連付けて記憶する記憶部を参照して、取得した前記文字列の中から前記マスク対象の項目名を抽出し、
前記記憶部を参照して、前記画像データに含まれる文字列の中から、抽出した前記マスク対象の項目名に対応する文字列の特徴を満たす第1文字列を特定し、
特定した前記第1文字列を基準として、縦方向及び横方向に並ぶ、抽出した前記マスク対象の項目名に対応する文字列の特徴を満たす第2文字列を特定し、
前記画像データの、前記第1文字列と前記第2文字列をマスクする、
処理をコンピュータに実行させるための画像データ編集プログラム。
(付記2) 前記第1文字列を特定する処理では、抽出した前記マスク対象の項目名の左上側を除く範囲に存在する文字列の中から、前記第1文字列を1つ特定する、ことを特徴とする付記1に記載の画像データ編集プログラム。
(付記3) 前記第1文字列を特定する処理では、抽出した前記マスク対象の項目名に最も近い位置に存在する前記第1文字列を特定する、ことを特徴とする付記1又は2に記載の画像データ編集プログラム。
(付記4) 前記記憶部は、マスク対象の領域を示す画像と、前記マスク対象の領域に対応する文字列の特徴とを関連付けて記憶しており、
前記マスクする処理では、前記画像データのうち、前記記憶部に記憶されている前記マスク対象の領域に存在し、かつ前記マスク対象の領域に対応する文字列の特徴を有する文字列をマスクする、ことを特徴とする付記1~3のいずれかに記載の画像データ編集プログラム。
(付記5) 画像データに含まれる文字列を取得し、
マスク対象の項目名と、該項目名に対応する文字列の特徴とを関連付けて記憶する記憶部を参照して、取得した前記文字列の中から前記マスク対象の項目名を抽出し、
前記記憶部を参照して、前記画像データに含まれる文字列の中から、抽出した前記マスク対象の項目名に対応する文字列の特徴を満たす第1文字列を特定し、
特定した前記第1文字列を基準として、縦方向及び横方向に並ぶ、抽出した前記マスク対象の項目名に対応する文字列の特徴を満たす第2文字列を特定し、
前記画像データの、前記第1文字列と前記第2文字列をマスクする、
処理をコンピュータが実行することを特徴とする画像データ編集方法。
(付記6) 画像データに含まれる文字列を取得する文字列取得部と、
マスク対象の項目名と、該項目名に対応する文字列の特徴とを関連付けて記憶する記憶部と、
前記記憶部を参照して、取得した前記文字列の中から前記マスク対象の項目名を抽出する抽出部と、
前記記憶部を参照して、前記画像データに含まれる文字列の中から、抽出した前記マスク対象の項目名に対応する文字列の特徴を満たす第1文字列を特定する第1特定部と、
特定した前記第1文字列を基準として、縦方向及び横方向に並ぶ、抽出した前記マスク対象の項目名に対応する文字列の特徴を満たす第2文字列を特定する第2特定部と、
前記画像データの、前記第1文字列と前記第2文字列をマスクするマスク処理部と、
を備える画像データ編集装置。
(付記7) 前記第1特定部は、抽出した前記マスク対象の項目名の左上側を除く範囲に存在する文字列の中から、前記第1文字列を1つ特定する、ことを特徴とする付記6に記載の画像データ編集装置。
(付記8) 前記第1特定部は、抽出した前記マスク対象の項目名に最も近い位置に存在する前記第1文字列を特定する、ことを特徴とする付記6又は7に記載の画像データ編集装置。
(付記9) 前記記憶部は、マスク対象の領域を示す画像と、前記マスク対象の領域に対応する文字列の特徴とを関連付けて記憶しており、
前記マスク処理部は、前記画像データのうち、前記記憶部に記憶されている前記マスク対象の領域に存在し、かつ前記マスク対象の領域に対応する文字列の特徴を有する文字列をマスクする、ことを特徴とする付記6~8のいずれかに記載の画像データ編集装置。
【符号の説明】
【0069】
10 サーバ(画像データ編集装置)
26 OCR処理部(文字列取得部)
28 秘密情報解析部(抽出部、第1特定部、第2特定部)
30 マスク処理部
40 文字列パターンDB(記憶部)
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17