(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023008507
(43)【公開日】2023-01-19
(54)【発明の名称】個人情報マスキング方法、及び個人情報マスキング装置
(51)【国際特許分類】
H04N 7/18 20060101AFI20230112BHJP
H04N 23/60 20230101ALI20230112BHJP
H04N 23/611 20230101ALI20230112BHJP
【FI】
H04N7/18 K
H04N5/232 290
H04N5/232 190
【審査請求】有
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2021112125
(22)【出願日】2021-07-06
(11)【特許番号】
(45)【特許公報発行日】2022-10-19
(71)【出願人】
【識別番号】505350400
【氏名又は名称】株式会社ビッツ
(74)【代理人】
【識別番号】110003018
【氏名又は名称】弁理士法人プロテクトスタンス
(72)【発明者】
【氏名】大橋 久美生
(72)【発明者】
【氏名】山田 義樹
【テーマコード(参考)】
5C054
5C122
【Fターム(参考)】
5C054CA04
5C054CC02
5C054EA01
5C054EA05
5C054EA07
5C054FC03
5C054FC07
5C054FC12
5C054FC14
5C054FE12
5C054FE16
5C054FE18
5C054FF03
5C054GB01
5C054GB05
5C054GB15
5C122EA07
5C122FH09
5C122FH14
5C122FH21
5C122HA29
5C122HA46
5C122HB01
5C122HB05
(57)【要約】
【課題】 カラー画像から文字もしくは数字の個人情報を消去する個人情報マスキング方法を提供する。
【解決手段】 個人情報マスキング方法は、カラー画像を取得する工程(S21)と、取得したカラー画像を所定サイズの第1カラー画像に変換するサイズ変換工程(S22)と、第1カラー画像を二値画像に変換する工程(S28)と、二値画像に対して個人情報が存在する可能性がある領域を検出する領域検出工程(S30)と、個人情報が存在しそうな領域に対して個人情報の有無を判定する判定工程(S33)と、個人情報の周辺画素を第1カラー画像の個人情報に描き入れ個人情報を消去する消去工程(S34)と、を備える。
【選択図】
図2
【特許請求の範囲】
【請求項1】
カラー画像を取得する工程と、
取得した前記カラー画像を所定サイズの第1カラー画像に変換するサイズ変換工程と、
前記第1カラー画像を二値画像に変換する工程と、
前記二値画像に対して、個人情報が存在する可能性がある領域を検出する領域検出工程と、
前記個人情報が存在しそうな領域に対して個人情報の有無を判定する判定工程と、
前記判定工程で判定された個人情報と前記第1カラー画像とに基づいて、前記個人情報の周辺画素を前記第1カラー画像の前記個人情報に描き入れ前記個人情報を消去する消去工程と、
前記消去工程後のカラー画像を出力する工程と、
を備える、個人情報マスキング方法。
【請求項2】
前記サイズ変換工程は、取得した前記カラー画像を前記所定サイズの第1グレースケール画像に変換し、
前記領域検出工程は、前記第1グレースケール画像に対して個人情報が存在する可能性のある領域を検出する、
請求項1に記載の個人情報マスキング方法。
【請求項3】
カラー画像を取得する工程と、
取得した前記カラー画像を所定サイズの第1カラー画像及び第1グレースケール画像に変換するサイズ変換工程と、
前記第1グレースケール画像に対して個人情報が存在する可能性のある領域を検出する領域検出工程と、
前記個人情報が存在しそうな領域に対して個人情報の有無を判定する判定工程と、
前記判定工程で判定された個人情報と前記第1カラー画像とに基づいて、前記個人情報の周辺画素を前記第1カラー画像の前記個人情報に描き入れ前記個人情報を消去する消去工程と、
前記消去工程後のカラー画像を出力する工程と、
を備える、個人情報マスキング方法。
【請求項4】
前記第1カラー画像に対して人物の保護領域を検出する工程と、
前記保護領域を検出した場合に前記保護領域を保存する工程と、
前記消去工程後の前記第1カラー画像に、前記保護領域を上書きする上書き工程と、
を備える請求項1から請求項3のいずれか一項に記載の個人情報マスキング方法。
【請求項5】
前記第1カラー画像に対してノイズ除去する工程と、
前記第1カラー画像に対して色空間変換を処理する工程と、
前記ノイズ除去する工程及び色空間変換を処理する工程の後に、前記第1カラー画像を第2グレースケール画像に変換する変換工程と、
を備える請求項1から請求項4のいずれか一項に記載の個人情報マスキング方法。
【請求項6】
前記第2グレースケール画像に対して局所的ヒストグラム平坦化を処理し、第3グレースケール画像に変換する工程、を備え、
前記領域検出工程は、前記前記第2グレースケール画像又は前記第3グレースケール画像に対して個人情報が存在する可能性のある領域を検出する、請求項5に記載の個人情報マスキング方法。
【請求項7】
前記判定工程は、
(a) 前記個人情報が存在しそうな領域とかかる領域を所定角度回転させた領域との論理積が第1閾値より大きいかに基づいて、個人情報の有無を判定するフィルター、
(b) 前記個人情報が存在しそうな領域の骨組みとなる細線から前記領域の境界線までの距離の標準偏差が第2閾値より大きいかに基づいて、個人情報の有無を判定するフィルター、
(c) 前記個人情報が存在しそうな領域の面積と前記個人情報が存在しそうな領域を取り囲む面積との面積比が第3閾値より大きいかに基づいて、個人情報の有無を判定するフィルター、
(d) 前記個人情報が存在しそうな領域の縦長さ又は横長さが前記所定サイズに対する第4閾値より大きいかに基づいて、個人情報の有無を判定するフィルター、
(e) 前記個人情報が存在しそうな領域の骨組みとなる細線の面積と前記個人情報が存在しそうな領域の面積との比が第5閾値より大きいかに基づいて、個人情報の有無を判定するフィルター、
の少なくとも1つのフィリター処理を適用する、請求項1から請求項6のいずれか一項に記載の個人情報マスキング方法。
【請求項8】
前記第1カラー画像に対して個人情報を検出する個人情報検出工程を、備える、請求項1から請求項7のいずれか一項に記載の個人情報マスキング方法。
【請求項9】
前記上書き工程後に、エッジ保存フィルターにより仕上げ処理する仕上げ工程、
を備える請求項4に記載の個人情報マスキング方法。
【請求項10】
所定サイズの第1カラー画像を取得する取得部と、
前記第1カラー画像を二値画像に変換する二値変換部と、
前記二値画像に対して、個人情報が存在する可能性がある領域を検出する領域検出工程と、
前記個人情報が存在しそうな領域に対して個人情報の有無を判定する判定部と、
前記判定部で判定された個人情報と前記第1カラー画像とに基づいて、前記個人情報の周辺画素を前記第1カラー画像の前記個人情報に描き入れ前記個人情報を消去する消去部と、
前記消去後のカラー画像を出力する出力部と、
を備える、個人情報マスキング装置。
【請求項11】
前記判定部は、
(a) 前記個人情報が存在しそうな領域とかかる領域を所定角度回転させた領域との論理積が第1閾値より大きいかに基づいて、個人情報の有無を判定するフィルター、
(b) 前記個人情報が存在しそうな領域の骨組みとなる細線から前記領域の境界線までの距離の標準偏差が第2閾値より大きいかに基づいて、個人情報の有無を判定するフィルター、
(c) 前記個人情報が存在しそうな領域の面積と前記個人情報が存在しそうな領域を取り囲む面積との面積比が第3閾値より大きいかに基づいて、個人情報の有無を判定するフィルター、
(d) 前記個人情報が存在しそうな領域の縦長さ又は横長さが前記所定サイズに対する第4閾値より大きいかに基づいて、個人情報の有無を判定するフィルター、
(e) 前記個人情報が存在しそうな領域の骨組みとなる細線の面積と前記個人情報が存在しそうな領域の面積との比が第5閾値より大きいかに基づいて、個人情報の有無を判定するフィルター、
の少なくとも1つのフィリターを適用する、請求項9に記載の個人情報マスキング装置。
【請求項12】
前記第1カラー画像に対して人物の保護領域を検出する保護領域検出部をさらに備え、該保護領域検出部は、
i)ディープラーニングを使用した顔領域の検出する機能、
ii)ディープラーニングを使用した特定物体の検出する機能、
iii)前記第1カラー画像にある皮膚の色による皮膚領域の検出する機能、
iv)前記第1カラー画像に保護すべき保護枠を設定させて、その保護枠内の領域を検出する機能、
の少なくとも1つの機能を適用する、請求項10又は請求項11に記載の個人情報マスキング装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像に写し込まれた個人を特定する個人情報の箇所にマスキングを付す個人情報マスキング方法、及び個人情報マスキング装置に係る。
【背景技術】
【0002】
近年、ユーザが、企業もしくは学校等での活動報告をクラウド上のSNS(ソーシャルネットワークサービス)に報告したり、人物を含む風景をSNSに投稿したりすることが多い。その活動報告や投稿には、テキストデータの文章だけでなく、静止画もしくは動画の画像情報もSNSにアップロードされることも多い。
【0003】
しかしながら、その画像(静止画・動画)の中に、個人情報(名前、住所、生年月日、性別、自動車登録番号等の文字及び数字からなる情報、以下、本明細書では文字及び数字からなる情報を個人情報という。)が写し込まれることも多い。このような個人情報は、個人のプライバシーを侵害する恐れがあり、また犯罪に利用されてしまう問題を生じている。
【0004】
このような問題を生じないようにするために、特許文献1には、ディスプレイに画像が表示された後、個人情報の保護の観点から画像に共有したくない個人情報が存在するか否かをユーザの判定結果を受け付け、その判定結果に基づいて、個人情報を認知できないように、画像の一部領域をマスキングするように構成する技術思想が開示されている。また文字もしくは数字からなる個人情報を画像から検出する手法は、特許文献2に開示されるように、パターンマッチング技術を用いたOCR(Optical Character Recognition)が使用されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2020-156033号公報
【特許文献2】特開2015-028735号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1の個人情報等が存在するか否かをユーザの判断に委ねられており、個人情報等が多く含まれる場合には、ユーザに著しい負担が生じる。またユーザが精査しないと気が付かない個人情報等もある可能性があり、気が付かない場合には個人情報等についてはマスキングされず、個人情報等が保護されないという問題点があった。また、特許文献2に記載されているOCRでは解像度、縦横の配列、手書き文字、くずし文字などは文字もしくは数字を認識することが困難であり、特に画像背景に含まれている小さな文字もしくは数字は、ほとんど認識できなかった。
【0007】
また欧州では、個人情報やプライバシーの保護に関して、GDPR(General Data Protection Regulation)が施行され、欧州以外でも個人情報のさらなる保護規制が進められているため、個人情報を保護する要望が高くなっている。
【0008】
本発明は、上記の問題点を踏まえ、カラー画像から文字もしくは数字と思われる個人情報を消去するとともに、個人情報を消去してもカラー画像として違和感がない画像を出力する個人情報マスキング装置及び方法を提供する。
【課題を解決するための手段】
【0009】
本実施形態に係る個人情報マスキング方法は、カラー画像を取得する工程と、取得したカラー画像を所定サイズの第1カラー画像に変換するサイズ変換工程と、第1カラー画像を二値画像に変換する工程とを備える。さらにマスキング方法は、二値画像に対して個人情報が存在する可能性がある領域を検出する領域検出工程と、個人情報が存在しそうな領域に対して個人情報の有無を判定する判定工程と、判定工程で判定された個人情報と第1カラー画像とに基づいて、個人情報の周辺画素を第1カラー画像の個人情報に描き入れ個人情報を消去する消去工程と、消去工程後のカラー画像を出力する工程と、を備える。
このサイズ変換工程は、取得したカラー画像を所定サイズの第1グレースケール画像に変換し、領域検出工程は、第1グレースケール画像に対して個人情報が存在する可能性のある領域を検出してもよい。
【0010】
別の実施形態に係る個人情報マスキング方法は、カラー画像を取得する工程と、取得したカラー画像を所定サイズの第1カラー画像及び第1グレースケール画像に変換するサイズ変換工程と、第1グレースケール画像に対して個人情報が存在する可能性のある領域を検出する領域検出工程と、を備える。さらにマスキング方法は、個人情報が存在しそうな領域に対して個人情報の有無を判定する判定工程と、判定工程で判定された個人情報と第1カラー画像とに基づいて個人情報の周辺画素を第1カラー画像の個人情報に描き入れ個人情報を消去する消去工程と、消去工程後のカラー画像を出力する工程と、を備える。
【0011】
さらにマスキング方法は、第1カラー画像に対して人物の保護領域を検出する工程と、保護領域を検出した場合に保護領域を保存する工程と、消去工程後の第1カラー画像に、保護領域を上書きする上書き工程と、を備えてもよい。
さらにマスキング方法は、第1カラー画像に対してノイズ除去する工程と、第1カラー画像に対して色空間変換を処理する工程と、ノイズ除去する工程及び色空間変換を処理する工程の後に第1カラー画像を第2グレースケール画像に変換する変換工程と、を備えても良い。
さらにマスキング方法は、第2グレースケール画像に対して局所的ヒストグラム平坦化を処理し、第3グレースケール画像に変換する工程、を備え、領域検出工程は、第2グレースケール画像又は第3グレースケール画像に対して個人情報が存在する可能性のある領域を検出しても良い。
【0012】
判定工程は、
(a) 個人情報が存在しそうな領域とかかる領域を所定角度回転させた領域との論理積が第1閾値より大きいかに基づいて、個人情報の有無を判定するフィルター、
(b) 個人情報が存在しそうな領域の骨組みとなる細線から領域の境界線までの距離の標準偏差が第2閾値より大きいかに基づいて、個人情報の有無を判定するフィルター、
(c) 個人情報が存在しそうな領域の縦長さ又は横長さが所定サイズに対する第3閾値より大きいかに基づいて、個人情報の有無を判定するフィルター、
(d) 個人情報が存在しそうな領域の骨組みとなる細線の面積と個人情報が存在しそうな領域の面積との比が第4閾値より大きいかに基づいて、個人情報の有無を判定するフィルター、
の少なくとも1つのフィリター処理を適用することが好ましい。
【0013】
第1カラー画像に対して個人情報を検出する個人情報検出工程を、備えても良い。
上書き工程後に、エッジ保存フィルターにより仕上げ処理する仕上げ工程、を備えても良い。
【0014】
本実施形態に係る個人情報マスキング装置は、所定サイズの第1カラー画像を取得する取得部と、第1カラー画像を二値画像に変換する二値変換部と、二値画像に対して、個人情報が存在する可能性がある領域を検出する領域検出工程と、個人情報が存在しそうな領域に対して個人情報の有無を判定する判定部と、判定部で判定された個人情報と第1カラー画像とに基づいて、個人情報の周辺画素を第1カラー画像の個人情報に描き入れ個人情報を消去する消去部と、消去後のカラー画像を出力する出力部と、を備える。
【0015】
また個人情報マスキング装置は、第1カラー画像に対して人物の保護領域を検出する保護領域検出部をさらに備え、該保護領域検出部は、
i)ディープラーニングを使用した顔領域の検出する機能、
ii)ディープラーニングを使用した特定物体の検出する機能、
iii)第1カラー画像にある皮膚の色による皮膚領域の検出する機能、
iv)第1カラー画像に保護すべき保護枠を設定させて、その保護枠内の領域を検出する機能、
の少なくとも1つを有していることが好ましい。
【0016】
本明細書において、個人情報とは、画像(静止画・動画)に撮影された文字(多言語の文字及び数字を含め、以下、“文字”という。)を意味する。
【発明の効果】
【0017】
本発明の個人情報マスキング装置及び個人情報マスキング方法によれば、個人情報の周辺画素をカラー画像の個人情報に描き入れて個人情報を消去するので、個人情報が保護される。
【図面の簡単な説明】
【0018】
【
図1】個人情報マスキング装置の一実施形態のブロック図である。
【
図2】個人情報マスキング装置を使ったフローチャートである。
【
図3】(A)は色空間変換部による色空間変換について説明した図である。(B)は領域検出部による輪郭の検出、外枠の検出のイメージ図である。(C)は個人情報を消去する仕組みを説明した図である。
【
図4】保護領域の検出の機能を示したフローチャートである。
【
図5】パーソナルコンピュータ23又は携帯情報端末25で保護領域をユーザが設定する際の概念図である。
【
図6】個人情報(文字であるか否か)の判定の手法を示したフローチャートである。
【
図7】(A)は文字又は図形を回転させて、元の文字又は図形に重ね合わせた状態を示した図である。(B)は文字又は図形を一定の距離をシフトさせて且つ回転させて、元の文字又は図形に重ね合わせた状態を示した図である。
【
図8】(A)は文字又は図形の中心線から境界線までの距離について説明した図である。(B)は文字又は図形の中心線と中心線領域検出部による輪郭の検出、外枠の検出のイメージ図である。
【
図9】個人情報マスキング装置100に取得されるカラー画像の一例である。
【
図10】出力したカラー画像の一例(実施例1)である。
【
図11】出力したカラー画像の一例(実施例2)である。
【
図12】出力したカラー画像の一例(実施例3)である。
【
図13】出力したカラー画像の一例(実施例4)である。
【発明を実施するための形態】
【0019】
以下、実施形態の個人情報マスキング装置について図を参照しながら詳しく説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0020】
<<個人情報マスキング装置の概要>>
本実施形態に係る個人情報マスキング装置は、カメラ・ビデオカメラで撮影された日常風景などのカラー画像から、個人情報である文字を検出する。画像から文字を認識する方法としてOCR(Optical Character Recognition)が広く使用されている。しかし本実施形態に係る個人情報マスキング装置は、OCRを使用しないため、予め認識したい文字をすべて登録しておく必要がなく、多言語の個人情報を削除することができる。また、個人情報マスキング装置は、OCR(光学式文字読み取り装置)では検出できない微細な文字もしくは崩れた文字、例えば背景に含まれる微細な個人情報を削除することができる。
【0021】
図1は、ユーザHが例えば学校で撮影した画像(静止画、動画)を個人情報マスキング装置100にアップロードし、個人情報マスキング装置100から個人情報が消去された画像をダウンロードもしくは受信するシステム概要を示した図である。ユーザHは、この個人状況が消去された画像をSNS等にアップロードしても、その画像に含まれる学校内の個人情報が消去されているため、個人情報の漏洩にならない。
【0022】
ユーザHは例えばデジタルカメラ21で学校の所定の場所の静止画を撮像する。そしてカメラ21で撮影された静止画は、パーソナルコンピュータ23に記録される。ユーザHはそのパーソナルコンピュータ23を使って、インターネット等の通信ネットワークNETを介して、個人情報マスキング装置100に静止画をアップロードすることができる。またユーザHは、タブレット型PC又はスマートフォン等のカメラ機能付き携帯情報端末25を使って動画を撮影し、通信ネットワークNETを介して、個人情報マスキング装置100に動画をアップロードすることができる。特に説明しないが、個人情報マスキング装置100にアクセスするためには、ユーザHはユーザ名、パスワード、クレジットカード番号等を事前に登録するようにしてもよい。
【0023】
<<個人情報マスキング装置100の構成の概要>>
図1に描かれた個人情報マスキング装置100は、一実施形態のブロック構成が示されている。個人情報マスキング装置100は、ハードウェア構成としては、クラウドサーバー等が適しており、具体的には1以上のプロセッサ、1以上のメモリー及び通信インターフェースなどを有している。以下に説明するカラー画像取得部、画像サイズ変換部等はプロセッサ、メモリー及び通信インターフェース並びにプロセッサで実行されるプログラム等で構成される。
【0024】
個人情報マスキング装置100は、パーソナルコンピュータ23又は携帯情報端末25などの外部からカラー画像(静止画もしくは動画)を取得するカラー画像取得部101と、取得した画像のサイズを所定サイズに変換する画像サイズ変換部102と、所定サイズに変換されたカラー画像中に人物の顔や時計等(保護領域)があるか検出する保護領域検出部103と、カラー画像に含まれるノイズを除去するノイズ除去部(カラー)104と、背景色に埋もれて見え難くなった個人情報を見やすくする色空間変換部105とを有している。なお画像サイズ変換部102は、カラーノイズを除去する前のカラー画像をグレースケールに変換する機能も有している。
【0025】
さらに個人情報マスキング装置100は、ノイズ除去されたカラー画像をグレースケール画像に変換するグレースケール変換部106と、グレースケール画像の明度を平坦化する局所的ヒストグラム平坦化部107と、明度が平坦化されたグレースケール画像を二値画像に変換する二値変換部108と、二値画像に含まれる白黒ノイズを除去するノイズ除去部(二値)109と、二値画像もしくはグレースケール画像から個人情報が存在しそうな領域を検出する領域検出部110とを備える。領域検出部110は、二値画像もしくはグレースケール画像に存在する線画、物の影もしくはノイズなどによる境界や外郭を個人情報が存在しそうな領域として検出する。このため、領域検出部110は、人間の目では気づきにくい微細な文字も検出することができ、また、特定の言語に限らず、あらゆる言語の文字に適用できるようになっている。その一方で、領域検出部110は、文字ではない物の影もしくはノイズなども個人情報が存在しそうな領域として検出する。
【0026】
さらに個人情報マスキング装置100は、個人情報が存在しそうな領域に個人情報が存在するかを判定する個人情報判定部111と,所定サイズに変換されたカラー画像から判定された個人情報を消去する個人情報消去部112と、保護領域検出部103で人物の顔、皮膚又は時計などを検出した場合に保存しておいた保護領域を、個人情報が消去されたカラー画像に中に上書きする保護領域上書き部113と、カラー画像を仕上げする仕上げ部114と、カラー画像をパーソナルコンピュータ23又は携帯情報端末25などの外部に出力するカラー画像出力部115とを備える。また、個人情報マスキング装置100は、ニューラルネットワークを利用した情景内文字検出プログラム(EAST:An Efficient and Accurate Scene Text Detector)等の個人情報の検出部116を有しても良い。
【0027】
個人情報マスキング装置100は、上記複数の構成要素を物理的に同一の場所に有するだけでなく、複数のサーバの集合体であってもよい。また上記複数の構成の一部を、アプリケーションソフトをダウンロードしたパーソナルコンピュータ23もしくは携帯情報端末25に担わせても良い。
【0028】
<<個人情報マスキング方法のフローチャート>>
次に、本実施形態の個人情報マスキング方法の動作を説明する。
図2は個人情報マスキング方法のカラー画像の取得から、個人情報を消去したカラー画像を出力するまでのフローチャートである。
【0029】
まず、カラー画像取得部101が、パーソナルコンピュータ23もしくは携帯情報端末25からカラー画像を取得する(ステップS21)。このカラー画像には、例えば、静止画であればHD(1280*720)、FHD(1920*1088)、6Mワイド(3264*1836)等、動画であればHD(1280*720)、FHD(1920*1088)、4K(3840*2160)等の画像を取得する。
【0030】
次に、画像サイズ変換部102が種々のサイズのカラー画像を所定のサイズの画像に変換する(S22)。例えば、本実施形態では画像サイズ変換部102はFHDサイズのカラー画像に変換する。この所定サイズに変換されたカラー画像は、不図示のメモリー等に保存される。画像サイズ変換部102は、カラー画像をグレースケールに変換する機能も有している。
【0031】
次に、保護領域検出部103が所定サイズのカラー画像に含まれる保護領域を検出する(S23)。また保護領域が検出されなかった場合にはそのカラー画像には保護領域が無いことを示すフラグが追加されることが好ましい。保護領域の検出の機能については、後述する。
【0032】
次に、色彩に埋もれてしまっている個人情報を見やすくするように、色空間変換部105が色空間変換する(S24)。カラー画像の表現方式には、光の三原色でカラー画像を表すRGB方式、色相(hue)、彩度(Saturation)及び明度(Value)でカラー画像を表すHSV方式がある。色空間変換部105は、所定サイズのカラー画像(RGB)をカラー画像(HSV)に変換するとともに、濃い背景色を消去することで個人情報を浮き立たせる。
図3(A)は、赤色の帽子に黒字で名前が書いてあるカラー写真(A-1)と、そのカラー写真のグレースケール画像(A-2)と、彩度(S)をゼロにした画像(A-3)とを示した図である。濃い背景色(特に赤色、青色、灰色等)に黒色で個人情報が描かれているカラー写真(A-1)が、グレースケールもしくは二値に変換されると、黒色の個人情報は濃い背景色に埋もれて逆に検出しにくくなる(A-2を参照)。一方、彩度(S)をゼロにした画像(A-3)では、個人情報が浮き出て目立っている。
【0033】
次に、カラー画像に対して、ノイズ除去部(カラー)104によりノイズを除去する(S25)。領域検出部110が、線画、物の影もしくはノイズなどを個人情報が存在しそうな領域として検出し計算量が増えるため、カラー画像に含まれるノイズをできるだけ除去することが好ましい。ここで、カラー画像に含まれるノイズとは、たとえば被写体が革表面等であると、領域検出部110が革表面等の質感(テクスチャー)も物の影等として検出するため、カラー画像に写った物体表面のざらつきもカラー画像に含まれるノイズとして処理される。
【0034】
カラー画像に含まれるノイズを除去する方法としてガウシアンぼかし (Gaussian Blur)処理と呼ばれるガウス関数を用いてカラー画像全体をぼかす処理がある。しかし、ガウシアンぼかし処理は、カラー画像内に含まれる個人情報のエッジ部分まで平滑化されるため、個人情報を検出できなくなる可能性もある。このため本実施形態のノイズ除去部(カラー)104は、エッジ保持平滑化フィルター処理(バイラテラルフィルター、ミーンシフトフィルター、アダプティブバイラテラルフィルター)を適用することが好ましい。
【0035】
次にグレースケール変換部106が、色空間変換された画像をグレースケール画像に変換する(S26)。
引き続き、グレースケール画像の暗部・明部に埋もれた個人情報を検出しやすいように、局所的ヒストグラム平坦化部107がグレースケール画像を平坦化する(S27)。例えば、全体的に暗い背景に明るい対象物がグレースケール画像に存在する場合に、全体的にコントラストを平坦化すると、明るい対象物が真っ白になってしまい、明るい対象物に存在する個人情報が消えてしまうことがある。このため、局所的ヒストグラム平坦化の処理をグレースケール画像に適用することにより、暗部・明部に埋もれた個人情報を検出しやすいようにする。局所的ヒストグラム平坦化は、具体的には、適応ヒストグラム平坦化(adaptive histogram equalization)、コントラスト制限適応ヒストグラム平坦化(CLAHE)、マルチピークヒストグラム平坦化(MPHE)、および多目的ベータ最適化バイヒストグラム平坦化(MBOBHE)処理等がある。
【0036】
次に二値変換部108が、明度が平坦化されたグレースケール画像を二値画像に変換する(S28)。二値画像の背景が暗い場合に個人情報が黒色で描かれていると、特定の閾値で二値変換してしまうと背景と個人情報とが同値になってしまい、領域検出部110が個人情報の領域を検出できなくなる。そこで、二値化変換部108は、グレースケール画像の全体の平均値を利用して2値化する(大津の二値化処理(Discriminant Analysis method))、もしくはグレースケール画像の一部毎(比較的狭い領域内)の平均値を利用して2値化する(Adaptive Gaussian ThresholdingまたはAdaptive Mean Thresholding)適応的閾値処理で、暗部の黒文字を浮き立たせることが好ましい。
【0037】
次にノイズ除去部(二値)109が、二値画像に残っているノイズを除去する。具体的には、ノイズ除去部(二値)109は、二値画像内の対象物の境界のピクセルを除去する収縮(Erosion)とその境界にピクセルを加える膨張(Dilation)とを繰り返すモルフォロジー変換して、二値ノイズを除去する。
【0038】
次に、領域検出部110は二値画像から個人情報が存在しそうな輪郭を検出する(S30)。個人情報が存在しそうな輪郭は、二値画像に線などがある輪郭を検出することである。概略的には、領域検出部110は、二値画像をスキャンして対象物のピクセルを見つけ、それが外側の境界か孔の境界かを決定していく。その決定をスキャンして繰り返していくことで最も外側の境界すなわち輪郭を検出していく。例えば。
図3(B-1)は、二値画像中に含まれる線画に一点鎖線の輪郭50が検出されたイメージ図である。より詳細は、論文Topological structural analysis of digitized binary images by border following;Satoshi Suzuki著(Computer Vision, Graphics, and Image Processing Volume 30, Issue 1, April 1985, Pages 32-46)に開示されている。
【0039】
また、ステップS30と同時に、領域検出部110はグレースケール画像から個人情報が存在しそうな外枠を検出する(S31)。グレースケール画像は、ステップS22、S26もしくはS27で生成されたグレースケール画像のいずれを使用してもよい。概略的には、領域検出部110は、グレースケール画像中の輝度値が近い所を1つの領域にまとめていく,グレースケール画像の領域分割に使用する。輝度値が近い所をまとめていくという発想から,安定した分布のある外枠として解釈して、その代表点を特徴量として導出している。例えば。
図3(B-2)は、グレースケール画像中に含まれる線画に二点鎖線の外枠51が検出されたイメージ図である。
図3(B-2)が
図3(B-1)と特に違う点は、“0”の内側も外枠として検出する点である。より詳細は、論文Efficient Maximally Stable Extremal Region (MSER) Tracking;M. Donoser et al著(2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'06))に開示されている。
【0040】
個人情報の検出部116でカラー画像から個人情報を検出する(S32)。個人情報の検出部116は、ステップS22で生成された所定サイズのカラー画像に情景内文字検出プログラム(EAST:An Efficient and Accurate Scene Text Detector)等を適用して個人情報(文字)を検出する。個人情報の検出部116は、カラー画面に含まれる比較的大きな文字等を検出することができるが、背景などに含まれる小さな文字等は検出しにくい。
【0041】
次に、ステップS30、S31で検出された個人情報が存在しそうな輪郭又は外枠領域に対して、個人情報判定部111で個人情報、つまり文字・数字があるか否かを判定する(S33)。また個人情報の検出部116で検出された文字に対しても。同様に個人情報判定部111で個人情報、つまり文字があるか否かを判定してもよい(S33)。個人情報の判定の手法に関しては、
図6で後述する。
【0042】
なお、本実施形態では、二値画像から個人情報が存在するかを判定するルート(S29、S30、S33)、グレースケール画像から個人情報が存在するか判定するルート(S22(又はS26、S27),S31、S33)、カラー画像から個人情報が存在するかを判定するルート(S22,S32,S33)があり、それぞれのルートで個人情報(文字)を不図示のメモリーに記憶している。そしてそれぞれのル-トで記憶された個人情報(文字)を統合して、カラー画像に含まれている個人情報としている。しかし、これに限らず、これら3ルートの少なくとも1ルートだけを適用してもよく、3ルート中の2ルートを選択して統合してもよい。
【0043】
ステップS33で個人情報が特定されると、個人情報消去部112は所定サイズのカラー画像から判定された個人情報を、その周辺画像で違和感なく消去する(S34)。
図3(C)は、所定サイズのカラー画像に個人情報(
図3(C)では線状のキズ)が描かれているカラー写真(C-1)と。黒色背景にステップS33で判定された個人情報を白抜きしたデータ(C-2)と、個人情報にその周囲の画素で描き入れていて(inpainting)したカラー画像(C-3)とを示した図である。別の言い方をすると、個人情報消去部112は、所定サイズのカラー画像(C-1)と同じサイズの黒色背景に個人情報を白抜きした画像(C-2)とを用意し、個人情報の境界から内側に向かって徐々に個人情報に周囲の画素で描き入れていていくことで(Inpainting)、個人情報が消去される(C-3)。
【0044】
個人情報にその周囲の画素で描き入れていていく(inpainting)処理は、計算量が多く、プロセッサに負担がかかる又は時間がかかるため。ステップS34では、計算量を削減する工夫をすることが好ましい。具体的には、個人情報消去部112は所定サイズ(例えばFHD)から縮小サイズ画像(例えばHD)に変換する。この縮小サイズでカラー写真(C-1)と白抜きデータと(C-2)とに基づいて、個人情報の周囲の画素で描き入れる(inpainting)。そして個人情報消去部112は、縮小サイズの個人情報が消去された画像(C-3)を作成する。そして縮小サイズの個人情報が消去された画像(C-3)を所定サイズに戻し、所定サイズのカラー画像(C-1)に、所定サイズに戻された画像(C-3)で白抜きした位置(C-2)の画像を上書きすればよい。このような処理により計算量を格段に減らすことができる。
【0045】
より詳しく説明すると、個人情報の境界から内側に向かって徐々に個人情報に周囲の画素で描き入れていく(Inpainting)手法には2つある。1つは、消去する近傍領域上のある一画素の値を、その周囲の画素の中で画素値が既に分かっている画素の画素値の重み付き和で置換し、ある画素を描き入れたら、FMM(Fast Marching Method)を使って次の最近傍点に移動し、個人情報がないもしくは消去済みの画素に近い画素から順番に描き入れていく。より詳細は、論文An image inpainting technique based on the fast marching method; Alexandru Telea著(January 2004 Journal of Graphics Tools)に開示されている。もう一つは、個人情報の周囲の既知の領域の画素値から個人情報の領域へエッジに沿って探索し画素を描き入れていく手法もある。より詳細は、論文Navier-stokes, fluid dynamics, and image and video inpainting;Marcelo Bertalmio et al著(Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition.)に開示されている。
【0046】
次に、保護領域検出部103で保護領域を検出した場合、保護領域上書き部113は、保存しておいた保護領域を、個人情報が消去されたカラー画像中に上書きする(S35)。領域検出部110は個人情報が存在しそうな領域には、例えば眼鏡のテンプルや鼻の影等が含まれることがあり、個人情報消去部112でテンプルや鼻の影を消去してしまうと保護領域が乱れてしまう。このため、保存しておいた保護領域を個人情報が消去されたカラー画像に上書きすることで保護領域を保護する。ステップS23で保護領域が検出されなかった場合には、フラグに基づいてステップS35をスキップしても良い。
【0047】
そして、保護領域を上書きしたカラー写真に対して、仕上げ部114が仕上げ処理することが好ましい(S36)。具体的には、境界をまたいでの輝度値の平滑を抑制するパターン保存フィルター(ノンローカルミーンフィルター)又はガウシアンぼかし処理をカラー画像に対して使用する。上書きした保護領域との境界を目立たなくするとともに、消去できなかった微小な個人情報(文字)を判読不可能にすることができる。仕上げ処理がなくても問題はない。
【0048】
最後に、カラー画像出力部115が、仕上げ処理されたカラー画像を、パーソナルコンピュータ23もしくは携帯情報端末25に出力する(S37)。
【0049】
<保護領域の検出>
ここで、保護領域検出部103が保護領域を検出する機能(S23)について、
図3及び
図4を使って説明する。
【0050】
まず、ステップS231では、保護領域検出部103は、ディープラーニングを行えるAI等を使用し、所定サイズに変更されたカラー画像に基づいて、目や鼻、口の位置といった人間の顔が持つ特徴から、顔領域を検出したりする。顔領域は、個人情報(文字)を含まない保護領域であり、ステップS235で顔領域が保存され、S35で説明したように、個人情報が消去されたカラー画像中に上書きされる。
【0051】
次に、ステップS232において、保護領域検出部103は、AI等を使用し、カラー画像に含まれる物体をラベル化する。このため、カラー画像に時計があったり、カレンダーがあったり、又はテーブルがあったりすると、保護領域検出部103は、“clock”、“wall calendar”又は“table”等のラベルを出力する。例えば、時計やカレンダーには、時計やカレンダーに時間や日付の数字(文字)が描かれているが、文字が含む物体であるが個人情報を含むものではない物体、時計等を予め登録しておく。時計等は保護領域として検出され、ステップS235で時計等の保護領域が保存される。
【0052】
次に、ステップS233において、保護領域検出部103は、所定サイズに変更されたカラー画像に皮膚の色があるかを検出する。例えば指と指との間の空間(影)が一本の線の文字(例えばアルファベットの“I”)と認識されることを防ぐ。皮膚領域は、個人情報を含まない保護領域であり、ステップS235で皮膚領域が保存される。
【0053】
保護領域検出部103は、所定サイズのカラー画像(RGB)に例えば、カラー画像の表示方式RGB、HSV及びYCbCrを使って皮膚の色を検出しても良い。より詳細は、論文Human Skin Detection Using RGB, HSV and YCbCr Color Models;S. Kolkur et al著(ICCASP/ICMMD-2016. Published by Atlantic Press)に開示されている。本実施形態では、カラー画像(RGB)をカラー画像(HSV)に変換するとともに、色相(hue)、彩度(Saturation)及び明度(Value)を調整して皮膚の色の領域を検出する。例えば8ビット(0-255)で調整するならば、H=16~40(赤っぽい~黄色っぽい)S=20~200、V=128~255を範囲としておけば、カラー画像中の皮膚の色が存在する領域を検出できる。
【0054】
次に、ステップS234において、保護領域検出部103は、ユーザHにパーソナルコンピュータ23又は携帯情報端末25の画面上で保護領域を設定できるように、保護枠を表示させる。
図5は、アップロードされたカラー画像51が携帯情報端末25の画面に表示された一例であり、カラー画像51は学校の教室の一部である。教室内には、2つの机と、1つの棚があり、机には文字情報が映った状態のパーソナルコンピュータがあり、棚には複数の本やファイルがある。教室の壁には、時計とプラカードと窓とがある。時計には文字盤があり、プラカードには「優勝おめでとう」の文字がある。
【0055】
保護領域検出部103は、
図5の携帯情報端末25に「画像中で残したい文字を枠で囲ってください。」の表示53をさせる。ユーザHが枠57をクリックすると、枠57が画面上に表示される。ユーザHは、その枠57の大きさと位置を変えて、例えばプラカードの周囲に枠57aを設定し、棚の一番下段に枠57bを設定する。ユーザHは枠57の設定が終了すると完了ボタン54をクリックする。このように枠57a又は57bで設定された領域が保護領域として検出され、ステップS235で保護領域が保存される。S35で説明したように、個人情報が消去されたカラー画像中に保護領域が上書きされる。なお、
図5の教室の壁の時計は、ステップS234で保護領域として囲われなくても、ステップ232が実行されれば時計は保護領域とされる。
図5では静止画を前提に説明したが動画でも保護領域の設定は可能である。例えば、ユーザHが指定した枠領域をテンプレート画像として保持し、テンプレートマッチング処理により、動画内にテンプレート画像とマッチする領域をチェックすることで対応できる。
【0056】
すべての保護領域をステップS231からステップS234の順番が入れ替わっても良く、また例えば顔領域のみを検出する等、いずれか一つのステップのみを実行してもよい。また、ステップS32等において、個人情報の領域検出部110で個人情報の領域を検出するとともに、その個人情報検出部111で検出された検出領域に対して、顔領域もしくは皮膚領域等の保護領域が存在するかを検出しても良い。
【0057】
<個人情報(文字・数字)の判定>
ここで、個人情報が存在しそうな領域に対して、個人情報判定部111が個人情報であるか否かを判定する手法(S33)について、
図6から
図8を使って説明する。なお、個人情報の判定手法では、個人情報が文字(数字)である場合について説明する。そのため、個人情報が存在しそうな領域にある個人情報を推定文字(Estimated letter)と呼ぶ。
【0058】
まず、個人情報判定部111は、推定文字を回転させて元の推定文字に重ね合わせた面積と元の推定文字の面積との面積比が、ある閾値k1よりも大きいか否かを判定する(S331)。閾値k1より面積比が大きい場合には図形等(文字以外)であると判定してステップS336に進み、閾値k1より面積比が小さい場合には文字であると判定してステップS332に進む。
【0059】
図7(A)に、推定文字を回転させた例を示す。
図7(A)では、アルファベットの“C”、“O”及び“Z”並びに真円、正方形及び正三角形の図形を推定文字の例とする。また
図7(A)に示した表では、左から0°(回転せず)、90°回転、0°の推定文字と90°回転した推定文字との重ね合わせ、180°回転、0°の推定文字と180°回転した推定文字との重ね合わせ、270°回転、0°の推定文字と270°回転した推定文字との重ね合わせが示されている。なお回転は、文字領域または図形領域の重心位置を中心に回転させている。
【0060】
まず、0°と90°との重ね合わせでは、“C”、“O”及び“Z”は、重なり領域が50%以下である。一方、真円、正方形及び正三角形は、重なり領域が50%以上である。これらの文字及び図形は、0°と270°との重ね合わせにおいても同様である。
【0061】
次に0°と180°との重ね合わせでは、“O”及び“Z”は、それらの重なり領域が100%であり、“C”の重なり領域は約80%である。真円及び正方形は、重なり領域が100%であり、正三角形の重なり領域は約50%である。
【0062】
本実施形態では、個人情報判定部111は、アルファベットだけでなく多言語に対応するため、0°と90°との重ね合わせの閾値k11、0°と180°との重ね合わせの閾値k12、0°と270°との重ね合わせの閾値k13をそれぞれ有しており、その3つ回転角度の重ね合わせを組み合わせて、推定文字が文字であるかを判定する。個人情報判定部111が、ある特定言語の推定文字を文字判定するのであれば、例えば0°と90°との重ね合わせの閾値k11だけを使用してもよい。また、閾値k1は可変できるようにすることが好ましく、言語ごとに閾値k1値を可変できるようにすることが好ましい。
【0063】
上述したように、0°と180°との重ね合わせでは、“C”の重なり領域は約80%であり、正三角形の重なり領域は約50%であり、文字より図形の方が重なり領域が小さくなっている。これでは推定文字が文字であるかを判定し難いため、
図7(B)に示すように、推定文字を回転させてもよい。
図7(B)では、アルファベットの“C”、真円及び正三角形の図形を推定文字の例とする。また
図7(B)に示した表では、左から0°(回転せず)、距離Sだけシフト、シフトした状態で180°回転、0°の推定文字とシフトして180°回転した推定文字との重ね合わせが示されている。なお回転は、文字領域または図形領域の重心位置を中心に回転させている。“C”の重なり領域は約10%であり、新円の重なり領域は約70%であり、正三角形の重なり領域は約50%である。0度の推定文字と距離Sのシフト且つ180°回転した推定文字との重なり領域で、閾値k12より大きいか否かで推定文字が文字であるかを判定できる。シフトして180°回転させる手法と、90°回転と、270°回転とを組み合わせてもよい。なお、
図7ではアルファベットについて説明したが、算用数字や漢字でも同様である。
【0064】
ステップS332では、個人情報判定部111は、推定文字の中心線から推定文字の境界線までの距離の標準偏差を算出し、標準偏差と閾値k2とを比較して文字と判定する。閾値k2より標準偏差が大きい場合には図形などであると判定してステップS336に進み、閾値k2より標準偏差が小さい場合には文字であると判定してステップS333に進む。既にステップS331で文字であると判定しているが、ステップS332では別の手法により推定文字が文字であるかを判定してもよい。
【0065】
文字は、文字の中心線(骨組み)から文字の境界線までの距離(複数個所)に大きな変化が少ないという特性を有している。このため、推定文字の中心線から推定文字の境界線までの距離の標準偏差を算出する。ただし、文字の大きさに比例して標準偏差も大きくなるため、中心線から境界線までの平均距離で割る、つまり閾値k2=距離の標準偏差/平均距離を計算することが好ましい。平均距離で割ることで閾値k2は、文字の大きさに影響を受けにくくなる。また中心線から境界線までの平均距離で割る代わりに、(距離/平均距離)の標準偏差で閾値k2を設定しても良い。また図形等と文字との判定基準を調整するため、閾値k2値を可変できるようにすることが好ましい。
【0066】
図8(A)は、アルファベットの“J”とJに似た台形の図形を示した例である。“J”の中心線(骨組み)61からは境界線63までの距離L1は、ほとんど一定でありその標準偏差は小さい。
図8(A)ではJはゴジック体(Gothic)であるが他の書体例えばニューセンチュリー(New Century )であっても標準偏差は小さい。台形の図形の中心線(骨組み)61からは境界線63までの距離L2は大きく変化しており、その標準偏差は大きくなる。例えば閾値k2=0.6と設定してもよい。
【0067】
ステップS333では、個人情報判定部111は、推定文字の文字自体の面積と推定文字を囲む領域全体の面積との面積比を算出し、閾値k3より小さければ文字と判定する。閾値k3より大きい場合には図形などであると判定してステップS336に進み、閾値k3より小さい場合には文字であると判定してステップS334に進む。既にステップS331及びS332で文字であると判定しているが、ステップS333では別の手法により推定文字が文字であるかを判定してもよい。
【0068】
図8(B)は、ステップS333の具体例であり、アルファベットの“J”とJに似たスプーン形状の図形を示した例である。
図8(B)ではJ文字自体の面積66とJを囲む領域全体の面積65との面積比は約60%であり、スプーン形状の図形の面積66とスプー形状の図形を囲む領域全体の面積65との面積比は約80%である。例えば閾値k3=70%と設定してもよい。
【0069】
ステップS331からステップS333の順番が入れ替わっても良く、またいずれか一つのステップのみで推定文字が文字であると判定してもよい。ステップS334及びS335では、ステップS331、S332又はS333で文字であることが判定されたので、その文字が個人情報であるか否かを判定する。
【0070】
再び
図6に戻り、ステップS334では、推定文字が所定サイズの画像に対してある閾値k4よりも大きいか否かを判定する。閾値k4より大きい場合には大きな文字であると判定してステップS338に進み、閾値k4より小さい場合には小さな文字であると判定してステップS336に進む。より具体的には、画像サイズがFHD(1920*1088)である場合、推定文字の少なくとも一方の縦方向のピクセル数もしくは横方向のピクセル数が、画像サイズの例えば5パーセント(96*54)以上であるか否を判定する。大きい場合にはステップS339に進む。画像サイズの何パーセント(閾値k4)であるかは可変できることが好ましい。ユーザが残したい大きさ文字を決定できるように、カラー画像をアップロードするweb画面等に、閾値k4を可変できる機能を表示されても良い。
【0071】
ステップS335では、文字がある閾値k5よりも大きな太い線幅で描かれているか否かを判定する。閾値k5より大きい場合には個人情報でないと判定してステップS338に進み、閾値k5より小さい場合には細い線幅の文字であると判定してステップS337に進む。閾値k5も可変できることが好ましい。ユーザが残したい太い線幅の文字を決定できるように、カラー画像をアップロードするweb画面等に、閾値k5を可変できる機能を表示されても良い。
【0072】
図8(C)は、ステップS335の具体例であり、アルファベットの太い線幅の“I”と細い線幅の“I”を示した例である。“I”文字自体68を構成する面積と“I”の3本の中心線(骨組み)67の面積とを計算し、その面積比が閾値k5より、例えば10よりも大きいかを判定する。
【0073】
図6のステップS336において、ステップS331、S332又はS333で、文字ではないとして判定された推定文字は図形等と考えられるため、カラー画像の一部として残される。
【0074】
ステップS337において、ステップS331又はS332で推定文字は文字と判定され、且つステップS334又はS335で大きな文字でもなく太い線幅の文字でもないと判定されたため、これらの文字は個人情報としてカラー画像から消去される対象となる。
【0075】
ステップS338において、ステップS332又はS333で推定文字は文字と判定され、且つステップS334又はS335で大きな文字又は太い線幅の文字と判断されたため、これらの文字は個人情報ではなく、例えばカラー画面に大きく写った学校の入り口に吊るされた「卒業式」の看板や、太い線幅でTシャツに描かれた文字は、カラー画像に残される。なお、大きな文字又は太い線幅の文字であれば、名前、住所、生年月日、性別、ナンバープレートの数字等であっても、本実施形態では個人情報として扱わない。
【実施例0076】
図9は、パーソナルコンピュータ23から個人情報マスキング装置100に取得されるカラー画像である。また、
図10、
図11、
図12及び
図13は、個人情報マスキング装置100がパーソナルコンピュータ23に出力したカラー画像である。
【0077】
図9に示されたカラー画像には、10台以上の自動車のナンバープレート、自動車に描かれた8種類(英語、タイ語、アラビア語、キリル語、日本語、グルジア語、ハングル語、ミャンマー語)の言語の文字、ニュースタイトル等の英語の文字、レポータの顔などが含まれている。