IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ハイパーダイン株式会社の特許一覧

特許7498534コンピュータプログラム、画像処理方法及び画像処理装置
<>
  • 特許-コンピュータプログラム、画像処理方法及び画像処理装置 図1
  • 特許-コンピュータプログラム、画像処理方法及び画像処理装置 図2
  • 特許-コンピュータプログラム、画像処理方法及び画像処理装置 図3
  • 特許-コンピュータプログラム、画像処理方法及び画像処理装置 図4
  • 特許-コンピュータプログラム、画像処理方法及び画像処理装置 図5
  • 特許-コンピュータプログラム、画像処理方法及び画像処理装置 図6
  • 特許-コンピュータプログラム、画像処理方法及び画像処理装置 図7
  • 特許-コンピュータプログラム、画像処理方法及び画像処理装置 図8
  • 特許-コンピュータプログラム、画像処理方法及び画像処理装置 図9
  • 特許-コンピュータプログラム、画像処理方法及び画像処理装置 図10
  • 特許-コンピュータプログラム、画像処理方法及び画像処理装置 図11
  • 特許-コンピュータプログラム、画像処理方法及び画像処理装置 図12
  • 特許-コンピュータプログラム、画像処理方法及び画像処理装置 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-06-04
(45)【発行日】2024-06-12
(54)【発明の名称】コンピュータプログラム、画像処理方法及び画像処理装置
(51)【国際特許分類】
   H04N 5/262 20060101AFI20240605BHJP
   H04N 7/18 20060101ALI20240605BHJP
   G06T 11/80 20060101ALI20240605BHJP
   G06T 7/00 20170101ALI20240605BHJP
   G06V 40/16 20220101ALI20240605BHJP
   G06T 1/40 20060101ALI20240605BHJP
【FI】
H04N5/262
H04N7/18 G
H04N7/18 K
G06T11/80 A
G06T7/00 660A
G06V40/16 B
G06T1/40
【請求項の数】 16
(21)【出願番号】P 2023199394
(22)【出願日】2023-11-24
【審査請求日】2023-11-24
【早期審査対象出願】
(73)【特許権者】
【識別番号】520299625
【氏名又は名称】ハイパーダイン株式会社
(74)【代理人】
【識別番号】100114557
【弁理士】
【氏名又は名称】河野 英仁
(74)【代理人】
【識別番号】100078868
【弁理士】
【氏名又は名称】河野 登夫
(72)【発明者】
【氏名】五十嵐 一浩
(72)【発明者】
【氏名】山下 真吾
(72)【発明者】
【氏名】宮島 靖
(72)【発明者】
【氏名】アブドスサブル ムハマッド
(72)【発明者】
【氏名】ホッサイン シャカウト
【審査官】鈴木 明
(56)【参考文献】
【文献】特開2014-085796(JP,A)
【文献】特開2020-091770(JP,A)
【文献】特開2014-067131(JP,A)
【文献】特開2008-257425(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 5/262-5/278
H04N 7/18
G06T 11/80
G06T 7/00
G06V 40/16
G06T 1/40
(57)【特許請求の範囲】
【請求項1】
人物を含む動画の実写画像を取得し、
取得した前記実写画像に含まれる前記人物の属性を特定し、
前記人物の顔画像を、特定した前記属性に応じて生成された写実的な生成顔画像に置換する
処理をコンピュータに実行させるコンピュータプログラムであって、
前記動画に含まれる前記人物の顔画像を継続的に同じ生成顔画像に置換するために必要なデータとして、前記動画に含まれる人物の全身又は顔の特徴量及び移動情報を含む追跡情報と、該人物の属性に応じた生成顔画像とを紐付けて記録することにより、前記動画に含まれる前記人物を追跡し、
追跡中の前記人物の顔画像を継続的に同じ前記生成顔画像に置換する
処理を前記コンピュータに実行させるコンピュータプログラム。
【請求項2】
人物を含む実写画像を取得し、
取得した前記実写画像に含まれる前記人物の属性を特定し、
前記人物の顔画像を、特定した前記属性に応じて生成された写実的な生成顔画像に置換する
処理をコンピュータに実行させるコンピュータプログラムであって、
前記実写画像には複数の人物が含まれており、
前記属性毎に設けられた前記生成顔画像の生成上限枚数の範囲内で前記生成顔画像を生成し、一部の前記人物の顔画像を同一の前記生成顔画像に置換する
処理を前記コンピュータに実行させるコンピュータプログラム。
【請求項3】
前記属性は、
前記人物の年齢、性別、人種のうち少なくとも1つを含む
請求項1又は請求項2に記載のコンピュータプログラム。
【請求項4】
前記属性は、
前記人物の顔の特徴量、前記人物に対する環境属性、又は前記人物の人体の特徴量を含む
請求項1又は請求項2に記載のコンピュータプログラム。
【請求項5】
属性を含む情報が入力された場合に該属性に応じた写実的な生成顔画像を出力する学習済モデルに、特定した前記属性を含む情報を入力することによって、前記属性に応じた写実的な前記生成顔画像を生成する
処理を前記コンピュータに実行させる請求項1又は請求項2に記載のコンピュータプログラム。
【請求項6】
前記実写画像には複数の人物が含まれており、
前記複数の人物の顔画像それぞれを、前記複数の人物毎に特定した前記属性に応じて生成された前記生成顔画像に置換する
処理を前記コンピュータに実行させる請求項1又は請求項2に記載のコンピュータプログラム。
【請求項7】
前記実写画像には複数の人物が含まれており、
特定の対象人物を除く前記複数の人物の顔画像を前記生成顔画像に置換し、
前記対象人物の顔画像は置換しない
処理を前記コンピュータに実行させる請求項1又は請求項2に記載のコンピュータプログラム。
【請求項8】
前記人物の顔の向き又は表情に応じた前記生成顔画像に置換する
処理を前記コンピュータに実行させる請求項1又は請求項2に記載のコンピュータプログラム。
【請求項9】
置換後の前記生成顔画像を、顔認識学習済モデルにより顔画像として検出できるか否かを判定し、
置換後の前記生成顔画像が顔画像として検出されなかった場合、前記人物の顔画像に対してマスキング処理を実行する
処理を前記コンピュータに実行させる請求項1又は請求項2に記載のコンピュータプログラム。
【請求項10】
前記人物の顔画像を前記生成顔画像に置換する処理の失敗可能性の有無を判定し、
失敗可能性がある場合、前記人物の顔画像に対してマスキング処理を実行する
処理を前記コンピュータに実行させる請求項1又は請求項2に記載のコンピュータプログラム。
【請求項11】
前記人物の顔画像を置換した後、
前記実写画像の縁側を切り取り又はマスキングする
処理を前記コンピュータに実行させる請求項1又は請求項2に記載のコンピュータプログラム。
【請求項12】
前記動画に含まれる前記人物を追跡する際、前記動画を順方向再生して前記人物を追跡すると共に、前記動画を逆方向再生して該人物を追跡する
処理を前記コンピュータに実行させる請求項1に記載のコンピュータプログラム。
【請求項13】
人物を含む動画の実写画像を取得し、
取得した前記実写画像に含まれる前記人物の属性を特定し、
前記人物の顔画像を、特定した前記属性に応じて生成された写実的な生成顔画像に置換する
画像処理方法であって、
前記動画に含まれる前記人物の顔画像を継続的に同じ生成顔画像に置換するために必要なデータとして、前記動画に含まれる人物の全身又は顔の特徴量及び移動情報を含む追跡情報と、該人物の属性に応じた生成顔画像とを紐付けて記録することにより、前記動画に含まれる前記人物を追跡し、
追跡中の前記人物の顔画像を継続的に同じ前記生成顔画像に置換する
画像処理方法。
【請求項14】
人物を含む実写画像を取得し、
取得した前記実写画像に含まれる前記人物の属性を特定し、
前記人物の顔画像を、特定した前記属性に応じて生成された写実的な生成顔画像に置換する
画像処理方法であって、
前記実写画像には複数の人物が含まれており、
前記属性毎に設けられた前記生成顔画像の生成上限枚数の範囲内で前記生成顔画像を生成し、一部の前記人物の顔画像を同一の前記生成顔画像に置換する
画像処理方法。
【請求項15】
人物を含む動画の実写画像を取得して画像処理を実行する処理部を備えた画像処理装置であって、
前記処理部は、
取得した前記実写画像に含まれる前記人物の属性を特定し、
前記人物の顔画像を、特定した前記属性に応じて生成された写実的な生成顔画像に置換し、
前記動画に含まれる前記人物の顔画像を継続的に同じ生成顔画像に置換するために必要なデータとして、前記動画に含まれる人物の全身又は顔の特徴量及び移動情報を含む追跡情報と、該人物の属性に応じた生成顔画像とを紐付けて記録することにより、前記動画に含まれる前記人物を追跡し、
追跡中の前記人物の顔画像を継続的に同じ前記生成顔画像に置換する
画像処理装置。
【請求項16】
人物を含む実写画像を取得して画像処理を実行する処理部を備えた画像処理装置であって、
前記処理部は、
取得した前記実写画像に含まれる前記人物の属性を特定し、
前記人物の顔画像を、特定した前記属性に応じて生成された写実的な生成顔画像に置換する
画像処理装置であって、
前記実写画像には複数の人物が含まれており、
前記属性毎に設けられた前記生成顔画像の生成上限枚数の範囲内で前記生成顔画像を生成し、一部の前記人物の顔画像を同一の前記生成顔画像に置換する
画像処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンピュータプログラム、画像処理方法及び画像処理装置に関する。
【背景技術】
【0002】
特許文献1には、顔画像を取得して顔認識を行い、顔認証の正確性が確保されるように本人の特徴を維持しつつ、年齢を変化させた年齢隠し画像を出力する技術が開示されている。顔認識精度を確保するとともに、ユーザの年齢プライバシー情報を保護することができ、それにより顔認識技術の信頼性を向上させることができる。
【0003】
特許文献2には、入力画像に含まれる人物の顔認識を行い、感情推定に用いられる特徴点が含まれる線を用いて描画し、入力画像に含まれる人物の顔画像を描画された顔画像に置き換える技術が開示されている。このような顔画像の置き換えにより、プライバシー保護と感情推定を行うことができる。
【先行技術文献】
【特許文献】
【0004】
【文献】特許第6651038号公報
【文献】特開2020-086921号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1及び2には、実写画像の光景を維持しつつ、実写画像に写った人物のプライバシーを保護する技術は開示されていない。
【0006】
本開示の目的は、実写画像の光景を維持しつつ、実写画像に含まれる人物のプライバシーを保護することができるコンピュータプログラム、画像処理方法及び画像処理装置を提供することにある。
【課題を解決するための手段】
【0007】
本開示の一態様に係るコンピュータプログラムは、人物を含む実写画像を取得し、取得した前記実写画像に含まれる前記人物の属性を特定し、前記人物の顔画像を、特定した前記属性に応じて生成された写実的な生成顔画像に置換する処理をコンピュータに実行させる。
【0008】
本開示の一態様に係る画像処理方法は、人物を含む実写画像を取得し、取得した前記実写画像に含まれる前記人物の属性を特定し、前記人物の顔画像を、特定した前記属性に応じて生成された写実的な生成顔画像に置換する。
【0009】
本開示の一態様に係る画像処理装置は、人物を含む実写画像を取得して画像処理を実行する処理部を備えた画像処理装置であって、前記処理部は、取得した前記実写画像に含まれる前記人物の属性を特定し、前記人物の顔画像を、特定した前記属性に応じて生成された写実的な生成顔画像に置換する。
【発明の効果】
【0010】
本開示によれば、実写画像の光景を維持しつつ、実写画像に含まれる人物のプライバシーを保護することができる。
【図面の簡単な説明】
【0011】
図1】実施形態1に係る画像処理装置の構成例を示すブロック図である。
図2】実施形態1に係る画像処理方法のデータフロー図である。
図3】実施形態1に係る画像処理方法の処理手順を示すフローチャートである。
図4】プライバシー保護に係る顔画像の置換方法を示す概念図である。
図5】追跡テーブルを示す概念図である。
図6】プライバシー保護に係る画像処理前後の動画像を示す模式図である。
図7】動画に写る置換対象人物の追跡及び顔画像の置換方法を示す概念図である。
図8】実施形態2に係る画像処理方法の処理手順を示すフローチャートである。
図9】生成顔画像による置換処理と、マスキング処理とを併用したプライバシー保護に係る画像処理方法を示す概念図である。
図10】実施形態3に係る画像処理方法の処理手順を示すフローチャートである。
図11】実施形態4に係る画像処理方法の処理手順を示すフローチャートである。
図12】実施形態4に係る画像処理方法によって顔画像が置換された動画像のフレーム画像を示す模式図である。
図13】生成顔画像の重複利用が行われたときの追跡テーブルを示す概念図である。
【発明を実施するための形態】
【0012】
本開示の実施形態に係る画像処理装置1を、以下に図面を参照しつつ説明する。なお、本開示はこれらの例示に限定されるものではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。また、以下に記載する実施形態の少なくとも一部を任意に組み合わせてもよい。
【0013】
図1は、実施形態1に係る画像処理装置1の構成例を示すブロック図である。画像処理装置1は、コンピュータであり、処理部11、表示部12、操作部13、通信部14及び記憶部15を備える。各部は、バスにより接続されている。
【0014】
本実施形態に係る画像処理装置1は、実写の動画に含まれる一又は複数の人物を同定及び追跡し、当該人物の顔画像を、その人物の属性情報に基づいて生成される写実的な生成顔画像Pに置換することによってプライバシー保護を実現するものである。特に、実施形態1に係る画像処理装置1は、プライバシー保護を要しない特定の人物(以下、非置換対象人物と呼ぶ)の顔画像に対してはプライバシー保護の画像処理を行わず、その他の人物(以下、置換対象人物と呼ぶ)の顔画像を生成顔画像P(図4参照)に置換するものである。例えば、非置換対象人物は動画に写るタレント、置換対象人物は一般聴衆である。
【0015】
より具体的には、画像処理装置1は、動画に映っている各人物の属性情報(年齢、性別、人種等)を推定し、その結果に基づいて同一人物を追跡した上で、当人の顔を別の顔画像に置き換える。それら置換用の顔画像は、当人の属性に応じてAIが生成したものであり、見た目は人間であるが、当人のオリジナルの画像とは異なっている。これにより、キャラクタやモザイクに差し替えるよりも自然な光景を維持したまま、プライバシーを保護し、肖像権の問題を気にすることなく動画を利用することができる。
【0016】
なお、画像処理装置1は、スタンドアロンのコンピュータであってもよいし、ネットワークに接続されたサーバ装置であっても良い。また、画像処理装置1は、オンプレミス環境にあるコンピュータであってもよいし、クラウド環境にあるサーバ等のコンピュータであってもよい。画像処理装置1は、複数台のコンピュータで構成し分散処理する構成でもよいし、1台のサーバ内に設けられた複数の仮想マシンによって実現されていてもよいし、クラウドサーバを用いて実現されていてもよい。
【0017】
処理部11は、CPU(Central Processing Unit)、マルチコアCPU、GPU(Graphics Processing Unit)、GPGPU(General-purpose computing on graphics processing units)、TPU(Tensor Processing Unit)、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、NPU(Neural Processing Unit)等の演算回路、ROM(Read Only Memory)、RAM(Random Access Memory)等の内部記憶装置、I/O端子、計時部等を有するプロセッサである。処理部11は、後述の記憶部15が記憶するコンピュータプログラム(プログラム製品)15aを実行することにより、本実施形態1に係る画像処理方法を実施する。
【0018】
他の観点によれば、処理部11は、コンピュータプログラム15aを実行することにより、人体・顔検出部11a、属性抽出部11b、人物同定部11c、置換対象人物選択部11d、顔画像生成部11e、顔画像置換部11f等の機能部として動作する(図2参照)。なお、画像処理装置1の各機能部は、ソフトウェア的に実現してもよいし、一部又は全部をハードウェア的に実現してもよい。
【0019】
表示部12は、例えば、液晶パネル又は有機EL(Electro Luminescence)ディスプレイ等の表示装置である。
【0020】
操作部13は、例えば、ハードウェアキーボード、マウス、タッチパネル等の入力装置である。ユーザは、操作部13を用いて画像処理装置1を操作し、動画データの取り込み、再生等の処理を実行させることができる。
【0021】
通信部14は、外部装置との間で通信処理を行うための通信回路を含む。本実施形態1の通信部14は、図示しないビデオカメラ、外部サーバストレージ等にアクセスして動画データを取得する。動画は、時系列の複数のフレーム画像によって構成される。実写の動画を構成するフレーム画像は、本実施形態1に係る画像処理対象である実写画像の一例である。
【0022】
記憶部15は、例えば主記憶部及び補助記憶部を有する。主記憶部は、SRAM(Static Random Access Memory)、DRAM(Dynamic Random Access Memory)、フラッシュメモリ等の一時記憶領域であり、処理部11が演算処理を実行するために必要なデータを一時的に記憶する。補助記憶部は、ハードディスク、EEPROM(Electrically Erasable Programmable ROM)等の記憶装置である。記憶部15は、処理部11が実行するコンピュータプログラム15a、顔認識学習済モデル15b、顔画像生成学習済モデル15c及び顔画像置換学習済モデル15dを記憶する。コンピュータプログラム15aに基づく処理の詳細は後述する。
【0023】
顔認識学習済モデル15bは、例えば深層学習による学習済みの畳み込みニューラルネットワーク(CNN:Convolutional neural network)、ビジョントランスフォーマ(Vision Transformer)などのモデルを含む。それらを組み合わせた構成にしてもよい。顔認識学習済モデル15bは、動画のフレーム画像が入力される入力層と、フレーム画像の特徴量を抽出する中間層と、検出されたオブジェクトに係る推論結果を出力する出力層とを有する。
【0024】
推論結果は、顔画像を囲むバウンディングボックスの中心座標位置及び縦横サイズ、顔の画像的特徴量(ランドマーク、キーポイント、等)、「属性」等の情報を含む。
「属性」は、少なくとも当該人物の顔属性を含む。顔属性は、例えば、当該人物の年齢、性別、人種、顔の向き、眼鏡の有無、マスクの有無、感情等の情報が含まれる。
また、「属性」は、顔画像及びフレーム画像の光景に影響を及ぼす環境属性を含むようにしてもよい。環境属性には、例えば、人物の顔に対する照明状態、日照状態等の情報が含まれる。照明状態は、顔を照らす照明光源の有無、照明箇所、光源の色を示す情報である。日照状態は、顔に表れる陰影(日陰及び日なたの影響)を示す情報である。また、環境属性には、顔の濡れ具合(天候の影響)、汗ばみ具合(気温の影響)等を示す情報が含まれてもよい。
【0025】
また、顔認識学習済モデル15bは、動画のフレーム画像に含まれる人物の顔に加え、人体を推論するように構成するとよい。この場合、推論結果は、人体の画像を囲むバウンディングボックス(中心座標位置及び縦横サイズ)、人体の画像的特徴量等の情報を含む。
【0026】
顔画像生成学習済モデル15c、顔画像置換学習済モデル15dは、例えば深層学習による学習済みの敵対的生成ネットワーク(GAN:Generative Adversarial Networks)、Diffusion、オートエンコーダー(Auto Encoder)などのモデルを含む。それらを組み合わせた構成にしてもよい。もちろん、深層学習モデル以外の手法により同等の機能を実現してもよい。
【0027】
顔画像生成学習済モデル15cは、生成したい画像の特徴を入力、及び/又は、特徴をテキストで表現したプロンプトを入力することにより、当該プロンプトで表現された特徴を有する画像を出力する学習済モデルである。本実施形態1で用いる顔画像生成学習済モデル15cは、顔画像生成学習済モデル15cに、生成したい画像の特徴を直接入力、及び/又は、特徴をテキストで表現したプロンプト入力を与えることによって、当該属性に応じた写実的な生成顔画像Pを出力する機能を有する。具体的には、顔画像生成学習済モデル15cは、プロンプトで年齢、性別、人種が指定された場合、指定された年齢、性別及び人種に応じた生成顔画像Pを出力する機能を有する。
【0028】
また、顔画像生成学習済モデル15cは、顔の向き又は表情が指定された場合、指定された向き又は表情に応じた生成顔画像Pを出力する機能を有するように構成してもよい。もちろん、顔画像生成学習済モデル15cは、顔の向き及び表情が指定された場合、指定された向き及び表情に応じた生成顔画像Pを出力する機能を有するように構成してもよい。眼鏡の有無、マスクの有無、環境属性が指定された場合、指定に従って、眼鏡を装着した生成顔画像P、マスクを装着した生成顔画像P、環境属性に応じた照明具合が反映された生成顔画像P等を出力する機能を有するように構成してもよい。
【0029】
顔画像置換学習済モデル15dが、顔画像生成学習済モデル15cで生成した顔画像中の顔の画像的特徴量(ランドマーク、キーポイント、等)を部分的に調整し、新たな顔画像を再生成するように構成してもよい。顔画像置換学習済モデル15dは、置換対象人物の顔の画像的特徴量(ランドマーク、キーポイント、等)の情報と生成顔画像の顔の画像的特徴量(ランドマーク、キーポイント、等)の情報を顔置換学習済モデルに入力することによって、置換対象人物の顔画像中の顔の画像的特徴量(ランドマーク、キーポイント、等)の位置や向きに合わせて、入力された生成顔画像中の顔の画像的特徴量(ランドマーク、キーポイント、等)の位置や向きを調整することにより、置換対象人物の顔の向き又は表情に応じた生成顔画像Pを再生成するように構成してもよい。
また、いうまでもなく、顔画像置換学習済モデル15dは、置換対象人物の顔の向き及び表情に応じた生成顔画像Pを再生成するように構成してもよい。
【0030】
なお、本実施形態1では、画像処理装置1の記憶部15が、顔認識学習済モデル15b、顔画像生成学習済モデル15c及び顔画像置換学習済モデル15dを記憶する例を説明したが、顔画像の認識及び顔画像の生成を行う外部API(Application Programming Interface)を利用するように構成してもよい。
【0031】
また、記憶部15は、プライバシー保護を要しない特定の人物を識別するための非置換対象人物特徴量を記憶する。例えば、ユーザは、プライバシー保護を要しない特定の人物の顔画像を選択し、処理部11は、選択された顔画像から、当該人物を識別するための特徴量を抽出し、抽出された特徴量を非置換対象人物特徴量として記憶すればよい。
【0032】
なお、補助記憶部は、画像処理装置1に接続された外部記憶装置であってもよい。コンピュータプログラム15a、顔認識学習済モデル15b及び顔画像生成学習済モデル15cは、画像処理装置1の製造段階において記憶部15に書き込まれてもよいし、外部の画像処理装置1が配信するものを画像処理装置1が通信にて取得して記憶部15に記憶させてもよい。コンピュータプログラム15a、顔認識学習済モデル15b及び顔画像生成学習済モデル15cは、磁気ディスク、光ディスク、半導体メモリ等の記録媒体1aに読み出し可能に記録された態様であってもよく、読取装置が記録媒体1aから読み出して記憶部15に記憶させてもよい。
【0033】
図2は、実施形態1に係る画像処理方法のデータフロー図、図3は、実施形態1に係る画像処理方法の処理手順を示すフローチャート、図4は、プライバシー保護に係る顔画像の置換方法を示す概念図である。
【0034】
画像処理装置1の処理部11は、実写画像(動画又は静止画)を取得する(ステップS111)。例えば、処理部11は動画データを取得する。処理部11は、通信部14を介して外部から動画データを取得してもよいし、記憶部15が記憶する動画データを読み出して取得してもよい。ここでは動画に複数の人物が含まれており、複数の人物には一人の非置換対象人物が含まれているものとする。
【0035】
次いで、人体・顔検出部11a及び属性抽出部11bとして機能する処理部11は、顔認識学習済モデル15bを用いて動画のフレーム画像に含まれる複数の人物の人体及び顔部分の領域を検出すると共に当該人物の属性を抽出する(ステップS112)。処理部11は、フレーム画像を顔認識学習済モデル15bに入力することによって、当該フレーム画像に含まれる複数の人物それぞれの人体及び顔画像の位置及びサイズ、人体及び顔の特徴を示した属性情報が得られる。なお、機械学習された学習済モデルを用いて、フレーム画像に含まれる人物の人体及び顔画像の領域を検出し、属性を抽出する例を説明したが、パターンマッチング等のルールベースの処理で、かかる検出及び属性抽出処理を実行してもよい。
【0036】
そして、人物同定部11cとして機能する処理部11は、当該複数の人物それぞれを同定及び追跡する(ステップS113)。ここで、処理部11は、同定された複数の人物それぞれを追跡し、同定された各人物の顔画像を継続的に同じ生成顔画像Pに置換するために必要なデータを追跡テーブルに記録する。追跡テーブルは記憶部15が記憶している。なお、追跡テーブルは同定された人物の追跡管理に必要なデータの保持方法の一例であり、特にテーブル形式に限定されるものではない。
なお、言うまでも無く、ステップS113の処理は実写画像が動画である場合に実行される処理である。実写画像が静止画である場合、ステップS112に次いでステップS114の処理が実行される。他の実施形態でも同様である。
【0037】
図5は、追跡テーブルを示す概念図である。追跡テーブルは、例えば、フレーム画像から検出された複数の顔画像それぞれを識別するための人物番号(No.)と、当該顔画像を追跡するための追跡情報と、当該顔画像が置換画像であるか否かを示すための情報と、当該顔画像を置換する生成顔画像Pを示す情報とを対応付けて格納している。
【0038】
追跡情報としては、例えば、当該人物の全身の特徴量と、顔の特徴量、全身の移動量、顔の移動量等が含まれる。顔画像を追跡するための全身の特徴量は、例えば、全身の画像的特徴量(ランドマーク、キーポイント、等)を含む。顔画像を追跡するための顔の特徴量は、例えば、顔の画像的特徴量(ランドマーク、キーポイント、等)を含む。追跡情報は、顔画像の位置及び範囲を示す情報を含んでもよい。
【0039】
動画入力の場合、オフライン処理として、動画を逆方向再生した上で人物の追跡情報を同様に収集し、順方向再生(通常の再生)の追跡情報を補完してもよい。この補完により、順方向再生におけるフレームイン/フェードイン/シーン切替後の追跡情報の精度は、逆方向再生におけるフレームアウト/フェードアウト/シーン切替前の追跡情報の精度と同等になる。
【0040】
置換画像であるか否かを示すための情報は後述のステップS114で特定される情報であり、生成顔画像Pを示す情報は、後述のステップS115で生成された生成顔画像Pを識別して、継続的に特定の人物の顔画像と、生成顔画像Pとを紐付けるための情報である。
【0041】
図3に戻り、ステップS113の処理に次いで、置換対象人物選択部11dとして機能する処理部11は、検出された複数の人物それぞれの顔画像の特徴量と、記憶部15が記憶している非置換対象人物特徴量とに基づいて、顔画像の置換を行う置換対象人物の顔画像と、顔画像の置換を行わない非置換対象人物の顔画像とを特定し、置換対象人物を選択する(ステップS114)。ここで、処理部11は、特定結果を追跡テーブルに記憶する。非置換対象人物特徴量と同一又は類似の特徴量を有する人物は、非置換対象人物として特定される。非置換対象物として特定されなったその他の人物は、置換対象人物として特定される。図4に示す例では、フレーム画像に6人の人物が含まれており、中央の人物が非置換対象人物であり、他の5人の人物が置換対象人物である。
【0042】
なお、非置換対象人物が指定又は設定されていない場合、フレーム画像に含まれる全ての人物の顔画像が置換対象顔画像として特定される。
【0043】
次いで、顔画像生成部11eとして機能する処理部11は、フレーム画像に含まれる複数の置換対象人物の属性情報に基づいて、それぞれ顔画像を生成する(ステップS115)。具体的には、処理部11は、図4に示すように、置換対象人物の属性を含む入力(直接入力及び/又はプロンプト入力)を作成し、作成したプロンプトを顔画像生成学習済モデル15cに入力することによって、当該置換対象人物のプライバシー保護のための写実的な顔画像を生成する。プロンプトは、例えば「20代男性、日本人、顔の全部、リアルな画像、1名」のようなテキストである。処理部11は、同定及び追跡している人物の顔画像と、生成顔画像Pとを関連付けるため、人物番号に当該生成顔画像Pを示す情報を対応付けて追跡テーブルに記憶する。
【0044】
次いで、処理部11は、顔画像生成学習済モデル15cが生成した顔画像に対し、下記に例示する方法により修正を施し、生成顔画像を再生成してもよい(ステップS116)。例えば、(1)各置換対象人物の顔の向き又は表情に応じて、生成顔画像Pの向き又は表情を変換する。ステップS115で正面を向いた生成顔画像Pを生成している場合、生成顔画像Pの向きを変換する加工を行えばよい。その際、ステップS115で、予め正面、右向き、左向きの生成顔画像Pを生成しておき、置換対象人物の顔の向きに応じて、顔画像の置換に使用する生成顔画像Pを選択するように構成してもよい。
表情についても同様であり、ステップS115で無表情な生成顔画像Pを生成している場合、生成顔画像Pの目元、口元等、表情に関わる部分を変化させる加工を行えばよい。その際、ステップS115で、予め複数種類の表情の生成顔画像Pを生成しておき、置換対象人物の顔の表情に応じて、顔画像の置換に使用する生成顔画像Pを選択するように構成してもよい。
また、いうまでもなく、処理部11は、各置換対象人物の顔の向き及び表情の双方に応じて、生成顔画像Pの向き及び表情を変換するように構成してもよい。
(2)置換対象人物の顔画像中の顔の画像的特徴量(ランドマーク、キーポイント、等)の情報と生成顔画像中の顔の画像的特徴量(ランドマーク、キーポイント、等)の情報を顔置換学習済モデルに入力することによって、置換対象人物の顔の向き又は表情、あるいは顔の向き及び表情の双方に応じた顔画像を再生成する。その際、置換対象人物の顔の画像的特徴量(ランドマーク、キーポイント、等)の位置や向きに合わせて、入力された生成顔画像の顔の画像的特徴量(ランドマーク、キーポイント、等)の位置や向きを調整する。
【0045】
そして、顔画像置換部11fとして機能する処理部11は、フレーム画像に含まれる複数の置換対象人物の顔画像それぞれを、ステップS115及びステップS116で生成した生成顔画像Pに置換し(ステップS117)、顔画像が生成顔画像Pに置換されたフレーム画像を出力する(ステップS118)。例えば、処理部11は、顔画像を置換したフレーム画像を表示部12に表示する。また、処理部11は、通信部14を介して、顔画像を置換したフレーム画像を外部へ送信してもよい。画像処理装置1が動画配信サーバである場合、記憶部15が記憶する動画を構成する複数のフレーム画像に対してプライバシー保護の画像処理を順次実行し、外部へ送信する。
【0046】
また、フレーム画像に含まれる人物の顔画像を顔認識技術により同定及び追跡しているため、他のオブジェクトによる顔画像の遮蔽又はフレームアウトが生じても、顔画像のどの部分が遮蔽又はフレームアウトしたかを推定することができる。例えば、顔画像が左側へ移動しており、顔画像の中心位置が左端付近となって、顔画像の横寸法が短くなれば、処理部11は、顔画像の左側が短くなった寸法分、フレームアウトしたと認識することができる。顔画像の遮蔽又はフレームアウトが発生しても、処理部11は、人物の属性情報に基づいて、生成顔画像Pを生成することができる。処理部11は、遮蔽又はフレームアウトによって置換前の顔画像の欠けに合わせて、生成顔画像Pを切り取り、当該顔画像に置換すればよい。
【0047】
置換対象人物の顔画像を置換した後、フレームの縁側(上下左右の四辺)の一定幅を切り取る又は黒色等で覆い隠す処理を施してもよい。
【0048】
図6は、プライバシー保護に係る画像処理前後の動画像を示す模式図である。図6上図は、元の動画データを構成する一のフレーム画像を示している。フレーム画像には、6人の人物が含まれている。6人の人物のうち、中央の人物は非置換対象人物、他の人物は置換対象人物である。この場合、図6下図に示すように、中央の人物を除く他の人物の顔画像は、当該人物の性別、年齢、人種等の属性を加味して作成された生成顔画像P1,P2,P3,P4に置換される。プライバシー保護を要する置換対象人物の顔画像を置換し、プライバシー保護を要しない非置換対象人物の顔画像を元画像のままとしたフレーム画像を生成することができる。
【0049】
ステップS111~ステップS118の処理により1枚のフレーム画像について、顔画像を生成顔画像Pに置換するプライバシー保護の画像処理を説明したが、上記処理を繰り返し実行し、動画を構成する各フレーム画像に対して同様にして画像処理を施すことによって、動画に写る置換対象人物の顔画像を常時、生成顔画像Pに置換することができる。
【0050】
図7は、動画に写る置換対象人物の追跡及び顔画像の置換方法を示す概念図である。動画に含まれる人物は継続的に同定及び追跡され、各人物に生成顔画像Pが紐付けられているため、図7に示すように動画において置換対象人物の位置が変化した場合であっても、各人物の顔画像は継続的に同じ生成顔画像Pによって置換される。つまり、同一人物であるにも関わらず、人物が移動している途中で異なる生成顔画像Pに置換されるといった不自然な状態が発生することを防ぐことができる。
【0051】
図7上図及び図7下図は、異なるフレーム画像を示しているが、各フレーム画像に含まれる人物は同定及び追跡されているため、継続的に同じ生成顔画像Pに置換されていることが分かる。具体的には、図7の上図において生成顔画像P2に置換されている人物が、下図に示すように右上から左下へ移動しているが、当該人物の顔画像は同一の生成顔画像P2によって置換されている。
【0052】
上記のように構成された実施形態1に係る画像処理装置1によれば、動画のフレーム画像に含まれる人物の顔画像を、当該人物の属性に応じた生成顔画像Pに置換することによって、実写動画の光景を維持しつつ、当該人物のプライバシーを保護することができる。
【0053】
また、プライバシー保護を要する置換対象人物の顔画像を生成顔画像Pで置換し、プライバシー保護を要しない非置換対象人物をそのままとして動画を生成することができる。
【0054】
更に、動画に含まれる人物を継続的に同定及び追跡し、同じ生成顔画像Pに置換することによって、動画の途中で顔が変化するといった不自然な状態を避け、プライバシー保護された自然な動画を得ることができる。
例えば、動画内でシーンが切り替わっても、同一人物を特定できるので、同一人物の顔画像を、常に同じ生成顔画像Pで置換する。従って、プライバシー保護された自然な動画を得ることができる。
【0055】
更に、人物の顔画像を、当該人物の年齢、性別、人種等の属性に応じた生成顔画像Pに置換する構成であるため、元の動画に含まれる人物と、画像処理後の動画に含まれる人物の雰囲気(年齢層、性別、人種)を変化させることなく、つまり実写動画の光景を維持しつつ、当該人物のプライバシーを保護することができる。
【0056】
更にまた、人物の顔画像を、当該人物の顔画像に影響を与える環境属性に応じた生成顔画像Pに置換する構成であるため、元の動画の雰囲気(照明の具合)と、画像処理後の動画の雰囲気(照明の具合)を変化させることなく、当該人物のプライバシーを保護することができる。
【0057】
更にまた、顔画像生成学習済モデル15cを用いた写実的な顔画像を生成して置換する構成であるため、実写動画が光景を維持しつつ、動画に含まれる人物のプライバシーを保護することができる。
【0058】
更にまた、動画に含まれる人物の顔の向き又は表情と同じ向き又は表情を向いた生成顔画像Pに置換することによって、人物の顔の向き又は表情を変化させることなく当該人物のプライバシーを保護することができる。
生成AI技術により、一人の人物に対して数枚の生成顔画像Pを生成するだけで、動画に映っている顔の向き又は表情が変化しようとも、スムーズに置換できる。
【0059】
生成AI技術により、顔の遮蔽又はフレームアウトが生じても、可視部分のみをシームレスに置換できる。人物同定技術の要素技術である人物追跡技術により、遮蔽又はフレームアウトが生じても顔の位置を予測できるので、精度よく置換できる。
【0060】
なお、本実施形態1では動画に含まれる人物の顔画像を生成顔画像Pに置換してプライバシー保護を実現する例を説明したが、静止画についても本実施形態に係る技術を適用することができる。他の実施形態でも同様である。
【0061】
また、動画のフレーム画像を処理する際に、処理部11が人物の属性に基づいて顔画像を生成する例を説明したが、典型的な属性の組み合わせについて、予め生成顔画像Pを作成して記憶部15に記憶しておいてもよい。処理部11は、フレーム画像に含まれる人物の属性に対応する作成済みの生成顔画像Pがある場合、人物の顔画像を記憶部15が記憶する生成顔画像Pに置換し、当該属性に対応する作成済みの生成顔画像Pがない場合、顔画像生成学習済モデル15cを用いて顔画像を生成し、置換するように構成してもよい。
【0062】
(実施形態2)
実施形態2に係る画像処理装置1は、顔画像の置換に失敗した場合に、当該顔画像に従来のマスキング処理を施すことによってプライバシーを保護する点が実施形態1と異なる。画像処理装置1のその他の構成は、実施形態1に係る画像処理装置1と同様であるため、同様の箇所には同じ符号を付し、詳細な説明を省略する。
【0063】
図8は、実施形態2に係る画像処理方法の処理手順を示すフローチャートである。画像処理装置1の処理部11は、実施形態1のステップS111~ステップS117と同様の処理を実行する(ステップS211~ステップS217)。
【0064】
ところで、重度の遮蔽又はフレームアウトによって欠けた顔画像、急峻な顔の向きの変化、遠方のため低画質の顔画像、俊敏な動作による低画質の顔画像、低照度の顔画像がある場合、人物の顔画像が不自然に置換されることがある。そこで、置換後の画像を顔認識学習済モデル15bで検証し、顔画像を検出できなかった場合、置換に失敗したと自動的に判断する。そのとき、従来技術のモザイク処理で元の顔画像を置換してプライバシーを保護する。具体的には、画像処理装置1は、以下の処理を実行する。
【0065】
処理部11は、顔画像が置換された画像処理後のフレーム画像に対し、顔認識学習済モデル15bを用いた顔認識処理を実行し、置換対象人物の置換された顔画像が、顔画像として認識されるか否かを検証し(ステップS218)、顔認識に失敗した顔画像があるか否かを判定する(ステップS219)。
【0066】
顔認識に失敗した顔画像があると判定した場合(ステップS219:YES)、処理部11は、認識に失敗した人物の顔画像を元の顔画像に戻し、モザイク処理、ぼかし加工処理、所定画像を重畳させる等のマスキング処理を実行する(ステップS220)。なお、処理部11は、顔画像を元の顔画像に戻さずにマスキング処理を実行するように構成してもよい。
【0067】
次いで、顔画像として認識されなかった置換顔画像がないと判定した場合(ステップS219:NO)、又はステップS220の処理を終えた場合、処理部11は、顔画像が生成顔画像Pに置換され、又はマスキング処理されたフレーム画像を出力する(ステップS221)。
【0068】
図9は、生成顔画像Pによる置換処理と、マスキング処理とを併用したプライバシー保護に係る画像処理方法を示す概念図である。図9上図は、顔画像が生成顔画像Pに置換されたフレーム画像であるが、左端に写っている人物はフレームアウトしており、顔画像の置換処理に失敗している。この場合、図9下図に示すように、置換処理に失敗した人物の顔画像は、モザイク処理、ぼかし加工等のマスキング処理が実行される。他の置換対象人物の顔画像は、生成顔画像P3,P4に置換され、プライバシー保護がなされている。
【0069】
上記のように構成された実施形態2に係る画像処理装置1によれば、各種事情により人物の顔画像が不自然に置換された場合、置換に失敗した顔画像に対して従来のマスキング処理を実行することによってプライバシー保護を実現する。よって、重度の遮蔽又はフレームアウト等が生じても、可能な限り光景を維持したまま、プライバシーを保護することができる。
【0070】
(実施形態3)
実施形態3に係る画像処理装置1は、顔画像の置換の失敗可能性がある場合に、顔画像の置換を行わずに従来のマスキング処理によってプライバシーを保護する点が実施形態1と異なる。画像処理装置1のその他の構成は、実施形態1に係る画像処理装置1と同様であるため、同様の箇所には同じ符号を付し、詳細な説明を省略する。
【0071】
図10は、実施形態3に係る画像処理方法の処理手順を示すフローチャートである。画像処理装置1の処理部11は、実施形態1のステップS111~ステップS114と同様の処理を実行する(ステップS311~ステップS314)。
【0072】
次いで、処理部11は、ステップS312で検出された人物の顔画像を生成顔画像Pに置換する処理の失敗可能性の有無を判定する(ステップS315)。例えば、処理部11は、重度の遮蔽又はフレームアウトによる顔画像が欠けている場合、置換処理に失敗する可能性があると判定する。また、処理部11は、急峻な顔の向きの変化がある場合、置換処理に失敗する可能性があると判定する。更に、処理部11は、遠方のため顔画像が所定画質以下の低画質である場合、俊敏な動作によって顔画像が低画質である場合、置換処理に失敗する可能性があると判定する。更にまた、処理部11は、低照度の顔画像がある場合、置換処理に失敗する可能性があると判定する。
【0073】
失敗可能性があると判定した場合(ステップS315:YES)、顔画像の置換に失敗する可能性がある当該顔画像に対して、モザイク処理、ぼかし加工処理、所定画像を重畳させる等のマスキング処理を実行する(ステップS316)。失敗可能性がないと判定した場合(ステップS315:NO)、その他の人物の顔画像については、実施形態1と同様、フレーム画像に含まれる一又は複数の置換対象人物の属性情報に基づいて、それぞれ顔画像を生成する(ステップS317)。
【0074】
以下、実施形態1のステップS116~ステップS118と同様の処理を実行して、顔画像を生成顔画像Pに置換し、プライバシー保護されたフレーム画像を出力する(ステップS318~ステップS320)。
【0075】
上記のように構成された実施形態3に係る画像処理装置1によれば、各種事情により人物の顔画像の置換に失敗する可能性がある場合、置換失敗の可能性がある顔画像に対して従来のマスキング処理を実行することによってプライバシー保護を実現する。よって、重度の遮蔽又はフレームアウト等が生じても、可能な限り光景を維持したまま、プライバシーを保護することができる。
【0076】
(実施形態4)
実施形態4に係る画像処理装置1は、画像に多数の人物が含まれている場合に生成顔画像Pの作成枚数を制限し、同一の生成顔画像Pを用いて同じ属性の複数の人物の顔画像を置換する点が実施形態1と異なる。画像処理装置1のその他の構成は、実施形態1に係る画像処理装置1と同様であるため、同様の箇所には同じ符号を付し、詳細な説明を省略する。
【0077】
図11は、実施形態4に係る画像処理方法の処理手順を示すフローチャートである。画像処理装置1の処理部11は、実施形態1のステップS111~ステップS114と同様の処理を実行する(ステップS411~ステップS414)。次いで、処理部11は、属性毎に設けられた生成顔画像Pの生成上限枚数の範囲内で、フレーム画像に含まれる複数の置換対象人物の属性情報に基づいて、それぞれ顔画像を生成する(ステップS415)。
【0078】
生成上限枚数は、例えば、男性の生成顔画像Pの上限枚数が10枚、女性の生成顔画像Pの上限が10枚である。なお、10枚は一例であり、上限枚数は画像処理能力によって適宜決定すればよい。
また、人物の年齢毎に生成顔画像Pの上限枚数を設けてもよい。例えば、20代男性の生成顔画像Pの上限枚数を5枚、30代男性の上限枚数を5枚、40代男性の上限枚数を5枚、50代以上の男性の上限枚数を5枚としてもよい。女性についても同様に上限枚数を設定すればよい。
もちろん、性別、年齢及び人種の組合せ毎に生成顔画像Pの上限枚数を設けてもよい。
また、人物の属性にかかわらず、生成顔画像Pの総数に上限を設けてもよい。
【0079】
次いで、処理部11は、生成上限枚数の上限に達し、顔画像が生成されなかった置換対象人物に対して、生成済みの生成顔画像Pを割り当てる(ステップS416)。つまり、同一の生成顔画像Pを重複して複数の人物に割り当てる。
【0080】
以下、実施形態1のステップS116~ステップS118と同様の処理を実行して、顔画像を生成顔画像Pに置換し、プライバシー保護されたフレーム画像を出力する(ステップS417~ステップS419)。
【0081】
図12は、実施形態4に係る画像処理方法によって顔画像が置換された動画像のフレーム画像を示す模式図、図13は、生成顔画像Pの重複利用が行われたときの追跡テーブルを示す概念図である。図12に示すフレーム画像には14人の置換対象人物が含まれている。全て女性であり、生成上限枚数である10枚を超えている。このため、図13に示すように、人物番号1~10までは、それぞれ個別に生成顔画像P1~P10が割り当てられるが、人物番号11~14までの置換対象人物に対して、作成済みの生成顔画像P7~P10が重複して割り当てられる。このようにすると、図12に示すように、生成上限枚数である10枚の範囲内で生成された生成顔画像Pを重複して用いて、14人の置換対象人物の顔画像が置換される。図12では、重複して置換された生成顔画像P7~P10のみに符号が付され、他の生成顔画像Pの符号は省略されている。
【0082】
上記のように構成された実施形態4に係る画像処理装置1によれば、画像処理の負荷を抑えつつ、動画に含まれる多数の人物を生成顔画像Pに置換してプライバシーを保護することができる。よって、動画に多数の人物が含まれる場合であっても、可能な限り光景を維持したまま、プライバシーを保護することができる。
【0083】
本開示の課題を解決するための手段を付記する。
(付記1)
人物を含む実写画像を取得し、
取得した前記実写画像に含まれる前記人物の属性を特定し、
前記人物の顔画像を、特定した前記属性に応じて生成された写実的な生成顔画像に置換する
処理をコンピュータに実行させるコンピュータプログラム。
なお、実写画像には動画又は静止画が含まれる。
(付記2)
前記実写画像は静止画を含む
付記1に記載のコンピュータプログラム。
(付記3)
前記実写画像は動画であり、
前記動画に含まれる前記人物を追跡し、
追跡中の前記人物の顔画像を継続して前記生成顔画像に置換する
処理を前記コンピュータに実行させる付記1又は付記2に記載のコンピュータプログラム。
なお、前記動画に含まれる前記人物を追跡する際、前記動画を順方向再生して前記人物を追跡すると共に、前記動画を逆方向再生して該人物を追跡するようにするとよい。
(付記4)
前記属性は、
前記人物の年齢、性別、人種のうち少なくとも1つを含む
付記1から付記3のいずれか一つに記載のコンピュータプログラム。
(付記5)
前記属性は、
前記人物の顔の特徴量、前記人物に対する環境属性、又は前記人物の人体の特徴量を含む
付記1から付記4のいずれか1つに記載のコンピュータプログラム。
なお、人物の顔の特徴量は、前記人物の顔の画像的特徴量、例えば、ランドマーク、キーポイントを含む。また、人物の顔の特徴量は、前記人物の眼鏡の有無、前記人物のマスクの有無を含む。
前記人物に対する環境属性は、照明条件等を含む。
前記人物の人体の特徴量は、前記人物の人体の画像を囲むバウンディングボックス(中心座標位置及び縦横サイズ)、前記人物の人体の画像的特徴量等を含む。
(付記6)
属性を含む情報が入力された場合に該属性に応じた写実的な生成顔画像を出力する学習済モデルに、特定した前記属性を含む情報を入力することによって、前記属性に応じた写実的な前記生成顔画像を生成する
処理を前記コンピュータに実行させる付記1から付記5のいずれか1つに記載のコンピュータプログラム。
なお、学習済モデルには、属性が直接入力された場合に該属性に応じた写実的な生成顔画像を出力するモデルが含まれる。また、学習済モデルには、属性を含み、生成したい画像の特徴をテキストで記載したプロンプトが入力された場合に該属性に応じた写実的な生成顔画像を出力するモデルが含まれる。
(付記7)
前記実写画像には複数の人物が含まれており、
前記複数の人物の顔画像それぞれを、前記複数の人物毎に特定した前記属性に応じて生成された前記生成顔画像に置換する
処理を前記コンピュータに実行させる付記1から付記6のいずれか1つに記載のコンピュータプログラム。
(付記8)
前記実写画像には複数の人物が含まれており、
特定の対象人物を除く前記複数の人物の顔画像を前記生成顔画像に置換し、
前記対象人物の顔画像は置換しない
処理を前記コンピュータに実行させる付記1から付記7のいずれか1つに記載のコンピュータプログラム。
(付記9)
前記人物の顔の向き又は表情に応じた前記生成顔画像に置換する
処理を前記コンピュータに実行させる付記1から付記8のいずれか1つに記載のコンピュータプログラム。
前記人物の顔の向き及び表情に応じた前記生成顔画像に置換する
処理を前記コンピュータに実行させる付記1から付記8のいずれか1つに記載のコンピュータプログラム。
前記人物の顔の向き又は表情に応じた前記生成顔画像の生成方法には主に2つの方法がある。
第1の方法は、特定した前記人物の属性に基づいて、複数の向き又は表情に応じた生成顔画像を予め生成しておき、処理対象の実写画像に含まれる前記人物の顔の向き又は表情に応じた前記生成顔画像を選択して置換する方法である。
第2の方法は、所定方向を向いた生成顔画像の特徴量を、処理対象の実写画像に含まれる前記人物の特徴量に合わせて修正又は再生成し、修正又は再生成された生成顔画像に置換する方法である。より具体的には、置換対象人物の顔の画像的特徴量(ランドマーク、キーポイント、等)の情報と、生成顔画像中の顔の画像的特徴量(ランドマーク、キーポイント、等)の情報に基づき、置換対象人物の顔の画像的特徴量(ランドマーク、キーポイント、等)の位置や向きに合わせて、生成顔画像中の顔の画像的特徴量(ランドマーク、キーポイント、等)の位置や向きを調整することにより、置換対象人物の顔の向き又は表情に応じた生成顔画像を再生成する。
(付記10)
置換後の前記生成顔画像を、顔認識学習済モデルにより顔画像として検出できるか否かを判定し、
置換後の前記生成顔画像が顔画像として検出されなかった場合、前記人物の顔画像に対してマスキング処理を実行する
処理を前記コンピュータに実行させる付記1から付記9のいずれか1つに記載のコンピュータプログラム。
(付記11)
前記人物の顔画像を前記生成顔画像に置換する処理の失敗可能性の有無を判定し、
失敗可能性がある場合、前記人物の顔画像に対してマスキング処理を実行する
処理を前記コンピュータに実行させる付記1から付記10のいずれか1つに記載のコンピュータプログラム。
(付記12)
前記実写画像には複数の人物が含まれており、
前記属性毎に設けられた前記生成顔画像の生成上限枚数の範囲内で前記生成顔画像を生成し、一部の前記人物の顔画像を同一の前記生成顔画像に置換する
処理を前記コンピュータに実行させる付記1から付記11のいずれか1つに記載のコンピュータプログラム。
(付記13)
前記人物の顔画像を置換した後、
前記実写画像の縁側を切り取り又はマスキングする
処理を前記コンピュータに実行させる付記1から付記12のいずれか1つに記載のコンピュータプログラム。
具体的には、上記処理は、前記実写画像の縁側、例えば動画のフレームの縁側、上下左右の四辺の一定幅を切り取り、又は黒色等で覆い隠す処理である。
(付記14)
人物を含む実写画像を取得し、
取得した前記実写画像に含まれる前記人物の属性を特定し、
前記人物の顔画像を、特定した前記属性に応じて生成された写実的な生成顔画像に置換する
画像処理方法。
(付記15)
人物を含む実写画像を取得して画像処理を実行する処理部を備えた画像処理装置であって、
前記処理部は、
取得した前記実写画像に含まれる前記人物の属性を特定し、
前記人物の顔画像を、特定した前記属性に応じて生成された写実的な生成顔画像に置換する
画像処理装置。
【符号の説明】
【0084】
1 :画像処理装置
1a :記録媒体
11 :処理部
11a :人体・顔検出部
11b :属性抽出部
11c :人物同定部
11d :置換対象人物選択部
11e :顔画像生成部
11f :顔画像置換部
12 :表示部
13 :操作部
14 :通信部
15 :記憶部
15a :コンピュータプログラム
15b :顔認識学習済モデル
15c :顔画像生成学習済モデル
15d :顔画像置換学習済モデル
P :生成顔画像
【要約】      (修正有)
【課題】実写画像の光景を維持しつつ、実写画像に含まれる人物のプライバシーを保護するコンピュータプログラム、画像処理方法及び画像処理装置を提供する。
【解決手段】方法は、人物を含む実写画像を取得することと、取得した実写画像に含まれる人物の属性を特定することと、人物の顔画像を、特定した属性に応じて生成された写実的な生成顔画像に置換することと、を含む。
【選択図】図1
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13