(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024006072
(43)【公開日】2024-01-17
(54)【発明の名称】画像処理装置、画像処理方法、画像処理システム、およびプログラム
(51)【国際特許分類】
G06T 7/00 20170101AFI20240110BHJP
G06V 10/774 20220101ALI20240110BHJP
【FI】
G06T7/00 660A
G06V10/774
【審査請求】未請求
【請求項の数】15
【出願形態】OL
(21)【出願番号】P 2022106626
(22)【出願日】2022-06-30
(71)【出願人】
【識別番号】000005326
【氏名又は名称】本田技研工業株式会社
(74)【代理人】
【識別番号】100165179
【弁理士】
【氏名又は名称】田▲崎▼ 聡
(74)【代理人】
【識別番号】100126664
【弁理士】
【氏名又は名称】鈴木 慎吾
(74)【代理人】
【識別番号】100154852
【弁理士】
【氏名又は名称】酒井 太一
(74)【代理人】
【識別番号】100194087
【弁理士】
【氏名又は名称】渡辺 伸一
(72)【発明者】
【氏名】有吉 斗紀知
(72)【発明者】
【氏名】安井 裕司
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096BA04
5L096CA04
5L096DA01
5L096DA02
5L096FA66
5L096FA67
5L096KA04
(57)【要約】
【課題】顔画像に写される人物のプライバシーを保護しつつ、機械学習モデルの学習に有効な学習データを生成すること。
【解決手段】入力画像に対して匿名化処理を行う画像変換部と、前記匿名化処理が施された前記入力画像が所定要件を満たすか否かを判定する画像判定部と、を備え、前記画像判定部は、前記匿名化処理が施された前記入力画像が前記所定要件を満たすと判定した場合、前記匿名化処理が施された前記入力画像に所定処理を施し、前記匿名化処理は、前記入力画像に写される人物の顔を別人物の顔に変更する処理を含み、前記所定要件は、前記入力画像における人物の顔の方向情報と、前記匿名化処理が施された前記入力画像における前記別人物の顔の方向情報とが一致することである、画像処理装置。
【選択図】
図1
【特許請求の範囲】
【請求項1】
入力画像に対して匿名化処理を行う画像変換部と、
前記匿名化処理が施された前記入力画像が所定要件を満たすか否かを判定する画像判定部と、を備え、
前記画像判定部は、前記匿名化処理が施された前記入力画像が前記所定要件を満たすと判定した場合、前記匿名化処理が施された前記入力画像に所定処理を施し、
前記匿名化処理は、前記入力画像に写される人物の顔を別人物の顔に変更する処理を含み、
前記所定要件は、前記入力画像における人物の顔の方向情報と、前記匿名化処理が施された前記入力画像における前記別人物の顔の方向情報とが一致することである、
画像処理装置。
【請求項2】
前記所定処理は、前記匿名化処理が施された前記入力画像をアノテーション作業の対象画像として保存する処理である、
請求項1に記載の画像処理装置。
【請求項3】
前記所定処理は、前記匿名化処理が施された前記入力画像を、入力画像に写される人物の行動を予測する行動予測モデルを生成するための学習用情報として保存する処理である、
請求項1に記載の画像処理装置。
【請求項4】
前記所定処理は、前記匿名化処理が施された前記入力画像を、通信手段を通じて画像サーバに送信する処理である、
請求項1に記載の画像処理装置。
【請求項5】
前記方向情報は、視線方向である、
請求項1に記載の画像処理装置。
【請求項6】
前記方向情報は、顔向き方向である、
請求項1に記載の画像処理装置。
【請求項7】
前記方向情報は、顔の視線方向およびの顔向き方向である、
請求項1に記載の画像処理装置。
【請求項8】
前記方向情報は、画像が入力されると、前記画像に写される顔の方向情報を出力するように学習された学習済みモデルに対して、前記入力画像を入力することによって取得されるものである、
請求項1に記載の画像処理装置。
【請求項9】
前記画像判定部は、前記匿名化処理が施された前記入力画像に複数の人物の顔が存在する場合、前記複数の人物のうち、前記入力画像を撮像したカメラが搭載される車両の進行方向前方に向かっている人の顔について、前記所定要件が満たされるか否かを判定する、
請求項1に記載の画像処理装置。
【請求項10】
前記画像判定部は、前記匿名化処理が施された前記入力画像に複数の人物の顔が存在する場合、前記複数の人物のうち、前記入力画像に写される顔が所定基準を満たす人物の顔について、前記所定要件が満たされるか否かを判定する、
請求項1に記載の画像処理装置。
【請求項11】
前記画像変換部は、前記画像判定部によって、前記匿名化処理が施された前記入力画像が前記所定要件を満たさないと判定した場合、前記入力画像に前記匿名化処理を再度、施す、
請求項1に記載の画像処理装置。
【請求項12】
前記画像変換部は、前記画像判定部によって、前記匿名化処理が施された前記入力画像が前記所定要件を満たさないと判定した場合、前記匿名化処理が施された前記入力画像に前記所定処理を施さない、
請求項1に記載の画像処理装置。
【請求項13】
入力画像に対して匿名化処理を行う画像変換部と、
前記匿名化処理が施された前記入力画像が所定要件を満たすか否かを判定する画像判定部と、を備え、
前記画像判定部は、前記匿名化処理が施された前記入力画像が前記所定要件を満たすと判定した場合、前記匿名化処理が施された前記入力画像に所定処理を施し、
前記匿名化処理は、前記入力画像に写される人物の顔を別人物の顔に変更する処理を含み、
前記所定要件は、前記入力画像における人物の顔の方向情報と、前記匿名化処理が施された前記入力画像における前記別人物の顔の方向情報とが一致することである、
画像処理システム。
【請求項14】
コンピュータが、
入力画像に対して匿名化処理を行い、
前記匿名化処理が施された前記入力画像が所定要件を満たすか否かを判定し、
前記匿名化処理が施された前記入力画像が前記所定要件を満たすと判定した場合、前記匿名化処理が施された前記入力画像に所定処理を施し、
前記匿名化処理は、前記入力画像に写される人物の顔を別人物の顔に変更する処理を含み、
前記所定要件は、前記入力画像における人物の顔の方向情報と、前記匿名化処理が施された前記入力画像における前記別人物の顔の方向情報とが一致することである、
画像処理方法。
【請求項15】
コンピュータに、
入力画像に対して匿名化処理を行わせ、
前記匿名化処理が施された前記入力画像が所定要件を満たすか否かを判定させ、
前記匿名化処理が施された前記入力画像が前記所定要件を満たすと判定した場合、前記匿名化処理が施された前記入力画像に所定処理を施させ、
前記匿名化処理は、前記入力画像に写される人物の顔を別人物の顔に変更する処理を含み、
前記所定要件は、前記入力画像における人物の顔の方向情報と、前記匿名化処理が施された前記入力画像における前記別人物の顔の方向情報とが一致することである、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置、画像処理方法、画像処理システム、およびプログラムに関する。
【背景技術】
【0002】
近年、交通参加者の中でも脆弱な立場にある人々にも配慮した持続可能な輸送システムへのアクセスを提供する取り組みが活発化している。この実現に向けて自動運転技術に関する研究開発を通して交通の安全性や利便性をより一層改善する研究開発に注力している。例えば、従来、機械学習モデルの学習に用いる学習データを生成するために、個人の顔画像にアノテーションを付与する技術が知られている。特許文献1には、顔画像データベースに保存された複数人の顔画像を参照して合成顔画像を生成し、生成した合成顔画像に対してアノテーション操作を実施可能とする技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載の技術は、複数人の顔画像から合成した合成顔画像に対してアノテーターがアノテーション操作を実行することによって、これら複数人のプライバシーを保護するものである。しかしながら、従来技術では、プライバシーを保護するために元画像を変換することに起因して、元画像の特徴情報が欠落する場合があった。その結果、顔画像に写される人物のプライバシーを保護しつつ、機械学習モデルの学習に有効な学習データを生成することができない場合があった。
【0005】
本発明は、このような事情を考慮してなされたものであり、顔画像に写される人物のプライバシーを保護しつつ、機械学習モデルの学習に有効な学習データを生成することができる画像処理装置、画像処理方法、およびプログラムを提供することを目的の一つとする。そして、延いては持続可能な輸送システムの発展に寄与するものである。
【課題を解決するための手段】
【0006】
この発明に係る画像処理装置、画像処理方法、画像処理システム、およびプログラムは、以下の構成を採用した。
(1):この発明の一態様に係る画像処理装置は、入力画像に対して匿名化処理を行う画像変換部と、前記匿名化処理が施された前記入力画像が所定要件を満たすか否かを判定する画像判定部と、を備え、前記画像判定部は、前記匿名化処理が施された前記入力画像が前記所定要件を満たすと判定した場合、前記匿名化処理が施された前記入力画像に所定処理を施し、前記匿名化処理は、前記入力画像に写される人物の顔を別人物の顔に変更する処理を含み、前記所定要件は、前記入力画像における人物の顔の方向情報と、前記匿名化処理が施された前記入力画像における前記別人物の顔の方向情報とが一致することであるものである。
【0007】
(2):上記(1)の態様において、前記所定処理は、前記匿名化処理が施された前記入力画像をアノテーション作業の対象画像として保存する処理であるものである。
【0008】
(3):上記(1)の態様において、前記所定処理は、前記匿名化処理が施された前記入力画像を、入力画像に写される人物の行動を予測する行動予測モデルを生成するための学習用情報として保存する処理であるものである。
【0009】
(4):上記(1)の態様において、前記所定処理は、前記匿名化処理が施された前記入力画像を、通信手段を通じて画像サーバに送信する処理である。
【0010】
(5):上記(1)の態様において、前記方向情報は、視線方向であるものである。
【0011】
(6):上記(1)の態様において、前記方向情報は、顔向き方向であるものである。
【0012】
(7):上記(1)の態様において、前記方向情報は、顔の視線方向およびの顔向き方向であるものである。
【0013】
(8):上記(1)の態様において、前記方向情報は、画像が入力されると、前記画像に写される顔の方向情報を出力するように学習された学習済みモデルに対して、前記入力画像を入力することによって取得されるものである。
【0014】
(9):上記(1)の態様において、前記画像判定部は、前記匿名化処理が施された前記入力画像に複数の人物の顔が存在する場合、前記複数の人物のうち、前記入力画像を撮像したカメラが搭載される車両の進行方向前方に向かっている人の顔について、前記所定要件が満たされるか否かを判定するものである。
【0015】
(10):上記(1)の態様において、前記画像判定部は、前記匿名化処理が施された前記入力画像に複数の人物の顔が存在する場合、前記複数の人物のうち、前記入力画像に写される顔が所定基準を満たす人物の顔について、前記所定要件が満たされるか否かを判定するものである。
【0016】
(11):上記(1)の態様において、前記画像変換部は、前記画像判定部によって、前記匿名化処理が施された前記入力画像が前記所定要件を満たさないと判定した場合、前記入力画像に前記匿名化処理を再度、施すものである。
【0017】
(12):上記(1)の態様において、前記画像変換部は、前記画像判定部によって、前記匿名化処理が施された前記入力画像が前記所定要件を満たさないと判定した場合、前記匿名化処理が施された前記入力画像に前記所定処理を施さないものである。
【0018】
(13):この発明の別の態様に係る画像処理システムは、入力画像に対して匿名化処理を行う画像変換部と、前記匿名化処理が施された前記入力画像が所定要件を満たすか否かを判定する画像判定部と、を備え、前記画像判定部は、前記匿名化処理が施された前記入力画像が前記所定要件を満たすと判定した場合、前記匿名化処理が施された前記入力画像に所定処理を施し、前記匿名化処理は、前記入力画像に写される人物の顔を別人物の顔に変更する処理を含み、前記所定要件は、前記入力画像における人物の顔の方向情報と、前記匿名化処理が施された前記入力画像における前記別人物の顔の方向情報とが一致することであるものである。
【0019】
(14):この発明の別の態様に係る画像処理方法は、コンピュータが、入力画像に対して匿名化処理を行い、前記匿名化処理が施された前記入力画像が所定要件を満たすか否かを判定し、前記匿名化処理が施された前記入力画像が前記所定要件を満たすと判定した場合、前記匿名化処理が施された前記入力画像に所定処理を施し、前記匿名化処理は、前記入力画像に写される人物の顔を別人物の顔に変更する処理を含み、前記所定要件は、前記入力画像における人物の顔の方向情報と、前記匿名化処理が施された前記入力画像における前記別人物の顔の方向情報とが一致することであるものである。
【0020】
(15):この発明の別の態様に係るプログラムは、コンピュータに、入力画像に対して匿名化処理を行わせ、前記匿名化処理が施された前記入力画像が所定要件を満たすか否かを判定させ、前記匿名化処理が施された前記入力画像が前記所定要件を満たすと判定した場合、前記匿名化処理が施された前記入力画像に所定処理を施させ、前記匿名化処理は、前記入力画像に写される人物の顔を別人物の顔に変更する処理を含み、前記所定要件は、前記入力画像における人物の顔の方向情報と、前記匿名化処理が施された前記入力画像における前記別人物の顔の方向情報とが一致することであるものである。
【発明の効果】
【0021】
(1)~(15)によれば、顔画像に写される人物のプライバシーを保護しつつ、機械学習モデルの学習に有効な学習データを生成することができる。
【図面の簡単な説明】
【0022】
【
図1】本実施形態に係る画像処理装置100を含むシステム1の概要を示す図である。
【
図2】本実施形態に係る画像処理装置100の機能構成の一例を示す図である。
【
図3】車両M1から取得した車内画像と車外画像の一例を示す図である。
【
図4】画像処理部130によって実行される処理を説明するための図である。
【
図5】画像変換部140によって実行される処理を説明するための図である。
【
図6】画像変換部140によって変換された時系列の車内画像の一例を示す図である。
【
図7】画像判定部150によって実行される処理を説明するための図である。
【
図8】アノテーターによって実行されるアノテーション作業の一例を示す図である。
【
図9】学習済みモデル180を用いた運転支援の一例を示す図である。
【
図10】画像変換部140によって実行される処理の流れの一例を示す図である。
【
図11】画像判定部150によって実行される処理の流れの一例を示す図である。
【発明を実施するための形態】
【0023】
以下、図面を参照し、本発明の画像処理装置、画像処理方法、画像処理システム、およびプログラムの実施形態について説明する。
【0024】
[概要]
図1は、本実施形態に係る画像処理装置100を含むシステム1の概要を示す図である。
図1に示す通り、システム1は、それぞれが少なくとも一台以上の車両M1および車両M2と、画像処理装置100と、端末装置200とを含む。説明の便宜上、車両M1および車両M2とを異なる車両として図示しているが、これらの車両は同一であっても良い。
【0025】
車両M1は、例えば、ハイブリッド自動車や電気自動車などの四輪駆動車であり、少なくとも、車両M1の内部を撮像するカメラと、車両M1の外部を撮像するカメラとを含む。車両M1は、走行中、これらのカメラによって撮像された車内画像と車外画像とを、セルラー網やWi-Fi網、インターネットなどのネットワークNWを介して画像処理装置100に送信する。
【0026】
画像処理装置100は、車両M1から車内画像と車外画像とを含む撮像画像データを受信すると、受信した撮像画像データに対して、後述する画像変換を施すサーバ装置である。この画像変換は、車内画像と車外画像に写される人物のプライバシーを保護するための処理である。画像処理装置100は、得られた変換画像データを、ネットワークNWを介して端末装置200に送信する。
【0027】
端末装置200は、デスクトップパソコンやスマートフォンなどの端末装置である。端末装置200のユーザは、画像処理装置100から変換画像データを取得すると、取得した変換画像データに対して後述するアノテーションの付与作業を行う。アノテーションの付与作業が完了すると、端末装置200のユーザは、変換画像データにアノテーションが付与されたアノテーション付画像データを画像処理装置100に送信する。
【0028】
画像処理装置100は、アノテーション付画像データを端末装置200から受信すると、受信したアノテーション付画像データを学習データとして、任意の機械学習モデルを用いて、後述する学習済みモデルを生成する。この学習済みモデルは、例えば、車外画像の入力に対して、当該車外画像に写される人物の予測行動(軌道)を出力したり、車内画像および車外画像の入力に対して、当該車内画像に写される運転者の視線を考慮して、当該車外画像に写される歩行者への注意喚起を促す行動予測モデルである。
【0029】
なお、このとき学習データとして用いられる画像データは、変換画像データにアノテーションが付与されたアノテーション付画像データであってもよいし、アノテーションはそのままに、変換画像データを撮像画像データに再変換したアノテーション付画像データ(すなわち、撮像画像データにアノテーションが付与されたアノテーション付画像データ)であってもよい。撮像画像データにアノテーションが付与されたアノテーション付画像データを学習データとして用いることにより、画像変換による影響が除去された、より現実に即した学習データを用いることができる。
【0030】
画像処理装置100は、学習済みモデルを生成すると、生成した学習済みモデルを、ネットワークNWを介して車両M2に配布する。車両M1と同様、車両M2は、例えば、ハイブリッド自動車や電気自動車などの四輪駆動車であり、車両M2は、走行中、カメラによって撮像された車内画像と車外画像とのうちの少なくとも一方を学習済みモデルに入力することによって、車両M2の周辺に存在する人物の行動予測データを得る。車両M2の運転者は、得られた行動予測データを参照し、車両M2の運転に活用することができる。以下、各処理のより詳細な内容について説明する。
【0031】
[画像処理装置の機能構成]
図2は、本実施形態に係る画像処理装置100の機能構成の一例を示す図である。画像処理装置100は、例えば、通信部110と、送受信制御部120と、画像処理部130と、画像変換部140と、画像判定部150と、学習済みモデル生成部160と、記憶部170と、を備える。これらの構成要素は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDD(Hard Disk Drive)やフラッシュメモリなどの記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD-ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。記憶部170は、例えば、HDDやフラッシュメモリ、RAM(Random Access Memory)等である。記憶部170は、例えば、撮像画像データ172と、変換画像データ174と、アノテーション用画像データ176と、アノテーション付画像データ178と、学習済みモデル180とを記憶する。なお、説明の便宜上、画像処理装置100は、学習済みモデル生成部160と、学習済みモデル180を記憶する記憶部170とを備えているが、学習済みモデルを生成する機能と、生成した学習済みモデルとは、画像処理装置100とは異なるサーバ装置が保有してもよい。
【0032】
通信部110は、ネットワークNWを介して自車両Mの通信装置10と通信するインターフェースである。例えば、通信部110は、NIC(Network Interface Card)や、無線通信用のアンテナなどを備える。
【0033】
送受信制御部120は、通信部110を用いて、車両M1およびM2と、端末装置200とデータの送受信を行う。より具体的には、まず、送受信制御部120は、車両M1から、車両M1に搭載されたカメラによって時系列に撮像された複数の車内画像と車外画像とを取得する。この場合の時系列とは、例えば、車両M1の発進から停止までの一走行サイクルにおいて所定間隔(例えば、1秒ごと)で撮像されるものである。
【0034】
図3は、車両M1から取得した車内画像と車外画像の一例を示す図である。
図3の左部は、車両M1から取得した車内画像を表し、
図3の右部は、車両M1から取得した車外画像を表す。
図3の左部に示す通り、車内画像は、少なくとも車両M1の運転者の顔領域を撮像するようにカメラが設置された状態で撮像され、
図3の右部に示す通り、車外画像は、少なくとも車両M1の進行方向前方を撮像するようにカメラが設置された状態で撮像される。送受信制御部120は、車両M1から取得した車内画像と車外画像とを画像IDに紐づけて撮像画像データ172として記憶部170に格納する。
【0035】
図4は、画像処理部130によって実行される処理を説明するための図である。画像処理部130は、撮像画像データ172に対して画像処理を施し、撮像画像データ172に含まれる各画像の画像属性、顔属性、方向などの情報を取得する。より具体的には、画像処理部130は、画像を入力すると、当該画像が車内画像か車外画像かを示す分類結果を出力する学習済みモデルを用いて、撮像画像データ172に含まれる各画像が車内画像か車外画像かを示す画像属性を取得する。
【0036】
さらに、画像処理部130は、画像を入力すると、当該画像に含まれる全ての顔について、顔領域と、顔の大きさ(顔領域の面積)と、画像の撮影位置から顔までの距離とを出力する学習済みモデルを用いて、撮像画像データ172に含まれる各画像の顔属性を取得する。
図3では、一例として、車内画像からは人物P1の顔領域FA1が取得され、車外画像からは人物P2の顔領域FA2、人物P3の顔領域FA3、人物P4の顔領域FA4が取得されている。便宜上、顔領域FA1、FA2、FA3、FA4は矩形領域として取得されているが、本発明はそのような構成に限定されず、例えば、人物の顔の輪郭に沿って顔領域を取得する学習済みモデルを用いてもよい。
【0037】
さらに、画像処理部130は、画像を入力すると、当該画像に含まれる全ての顔について顔方向と視線方向のうちの少なくとも一方を例えばベクトルとして出力する学習済みモデルを用いて、撮像画像データ172に含まれる各画像に写される顔の方向情報を取得する。より具体的には、画像処理部130は、車内画像の属性を有する撮像画像データ172の画像については、画像を入力すると、当該画像に含まれる全ての顔について顔方向と視線方向とを出力する学習済みモデルを用いて、方向情報を取得する。一方、画像処理部130は、車外画像の属性を有する撮像画像データ172の画像については、画像を入力すると、当該画像に含まれる全ての顔について顔方向を出力する学習済みモデルを用いて、方向情報を取得する。これは、一般的に、車外画像に比して、車内画像に写される顔の方が撮影位置からの距離が近く、視線方向が抽出可能な程度に大きく顔が写されている傾向が高いからである。
図3では、一例として、車内画像からは人物P1の顔方向FD1と視線方向ED1とが取得され、車外画像からは、人物P2の顔方向FD2、人物P3の顔方向FD3、人物P4の顔方向FD4が取得されている。
【0038】
画像処理部130は、撮像画像データ172の各画像について画像属性、顔属性、および方向情報を取得すると、当該画像に紐づけて、これら画像属性、顔属性、および方向情報を記録する。なお、上記では、一例として、画像処理部130は、学習済みモデルを用いて画像属性、顔属性、および方向情報を取得しているが、本発明はそのような構成に限定されず、画像処理部130は、任意の公知の手法を用いてこれら画像属性、顔属性、および方向情報を取得してもよい。
【0039】
画像変換部140は、画像処理部130によって処理された撮像画像データ172に対して、各画像に写される人物の方向情報を変更することなく、当該人物の顔を別人の顔に差し替える処理を、そのような機能が実装された任意のソフトウェアを用いて、実行する。
図5は、画像変換部140によって実行される処理を説明するための図である。
図5に示す通り、画像変換部140は、
図4に示す人物P1、P2、およびP3の顔を、視線方向ED1および顔方向FD1、FD2、FD3を変更することなく別人物の顔に差し替えている。一方、人物P4の顔は、画像変換部140によりモザイク処理が施された結果、モザイクMSによって覆われている。
【0040】
すなわち、画像変換部140は、撮像画像データ172の各画像に写される各顔の顔属性に基づいて、当該顔を別人物の顔に差し替えるか、又はモザイク処理を施すかを決定する。より具体的には、画像変換部140は、撮像画像データ172の各画像に写される各顔について、当該顔の大きさが第1閾値Th1以上であるか否かを判定し、顔の大きさが第1閾値Th1以上であると判定された場合、当該顔を別人物の顔に差し替えると決定する。一方、顔の大きさが第1閾値Th1未満であると判定された場合、画像変換部140は、当該顔にモザイク処理を施すことを決定する。撮像画像に写される人物の顔を別人物の顔に差し替えるか、又はモザイク処理を施すことは、「匿名化処理」の一例である。
【0041】
また、画像変換部140は、撮像画像データ172の各画像に写される各顔について、当該顔の距離が第2閾値Th2以下であるか否かを判定し、顔の距離が第2閾値Th2以下であると判定された場合、当該顔を別人物の顔に差し替えると決定する。一方、顔の距離が第2閾値Th2より大きいと判定された場合、画像変換部140は、当該顔にモザイク処理を施すことを決定する。画像変換部140は、これらの判定処理を、画像に写される顔の数だけ繰り返し実行し、判定結果に従って各顔を別人物の顔に差し替えるか、又はモザイク処理を施す。画像変換部140は、撮像画像データ172にこのような処理を施して得られる画像データを変換画像データ174として記憶部170に格納する。これにより、行動予測モデルを生成するための学習データとして有用なデータを選別するとともに、後述するアノテーターがアノテーション作業を実施する際に、各画像に写される人物のプライバシーを保護することができる。
【0042】
なお、顔の大きさが第1閾値Th1以上であるか否かを判定する処理と、顔の距離が第2閾値Th2以下であるか否かを判定する処理は、少なくともいずれか一方が実施されればよい。両方の処理が実施される場合には、画像変換部140は、顔の大きさが第1閾値Th1以上であり、かつ顔の距離が第2閾値Th2以下である場合に、当該顔を別人物の顔に差し替えると決定してもよいし、顔の大きさが第1閾値Th1以上であるか、又は顔の距離が第2閾値Th2以下である場合に、当該顔を別人物の顔に差し替えると決定してもよい。
【0043】
さらに、画像変換部140は、撮像画像データ172の各画像に写される顔のうち、方向情報の取得に失敗した顔についてはモザイク処理を施すことによって、学習データとして活用する顔を選別してもよい。
【0044】
図6は、画像変換部140によって変換された時系列の車内画像の一例を示す図である。
図6は、一例として、時点t、t+1、t+2の3つの時点における時系列の車内画像を変換した例を表している。これら時系列の車内画像は、同一人物を撮像および顔変換したものであるが、
図6に示す通り、顔変換ソフトウェアの動作によっては、同一人物の顔が複数の異なる人物の顔に変換されることがあり得る。同一人物の顔が複数の異なる人物の顔に変換されたにも関わらず、そのような変換画像データをそのまま学習データとして用いることは、行動予測モデルの精度を悪化させる要因となり、好ましくない。そのため、画像判定部150は、以下で説明する処理を実行することによって、時系列の車内画像および車外画像の連続性を判定する。
【0045】
図7は、画像判定部150によって実行される処理を説明するための図である。
図7に示す通り、画像判定部150は、まず、変換画像に写される人物の顔から、当該顔を表す特徴点を抽出する。例えば、画像判定部150は、変換画像に写される人物の顔から、当該顔の右目REP、左目LEP、鼻NP、右口角RMP、左口角LMP、耳EPを表す特徴点を抽出する。画像判定部150は、時系列の変換画像の各々から、同一人物として追跡された人物の顔の特徴点を抽出し、これら特徴点を照合する。なお、「同一人物として追跡された」か否かは、例えば、画像を変換する前の段階において、撮像画像に写される同一人物を対応付けておけばよい。
【0046】
図7の場合、画像判定部150は、時点tの変換画像に写される人物の特徴点と、時点t+1の変換画像に写される人物の特徴点とを抽出している。画像判定部150は、抽出したこれら2組の特徴点を並進や回転によって略一致するか否かを判定することによって照合を行う。
【0047】
照合の結果、抽出された特徴点が略一致すると判定された場合、画像判定部150は、同一人物として追跡された人物の顔が、変換後も同一人物の顔である(すなわち、顔に連続性あり)と判定する。一方、照合の結果、抽出された特徴点が略一致しないと判定された場合、画像判定部150は、同一人物として追跡された人物の顔が、変換後は同一人物の顔ではない(すなわち、顔に連続性なし)と判定する。その場合、画像変換部140は、連続性なしと判定された顔について、再度、変換処理を行う。このとき、画像変換部140は、連続性なしと判定された顔についてのみ再度、変換処理を行ってもよいし、時系列の変換画像に写される全ての人物の顔について、再度、変換処理を行ってもよい。また、例えば、画像変換部140は、連続性なしと判定された顔については、再度、変換処理を行うことなく、モザイク処理を施して、学習データとして活用する対象から除外してもよい。また、例えば、画像判定部150での判定の結果、同一人物として追跡された人物の顔が、変換後は同一人物の顔ではない(すなわち、顔に連続性なし)と判定された場合には、画像判定部150は、時系列の変換画像に対して所定処理を施すことを制限する、すなわち時系列の変換画像を学習データとして活用する対象から除外することとしてもよい。これにより、顔変換ソフトウェアの意図しない動作に起因する非連続性の発生を防止することができる。
【0048】
画像判定部150は、さらに、変換画像を、顔方向と視線方向のうちの少なくとも一方を出力する上記の学習済みモデルに再度入力し、変換画像における顔方向FD又は視線方向EDを取得する。画像判定部150は、変換画像に写される人物の顔に対して、当該顔の顔方向FD又は視線方向EDが、変換前の撮像画像に写される顔の顔方向FD又は視線方向EDと略一致するか否かを判定する。上述した通り、車内画像については顔方向FDおよび視線方向EDの双方が取得され、車外画像については顔方向FDが取得されている。そのため、画像判定部150は、車内画像については、変換前の撮像画像と変換画像との間で、顔方向FDおよび視線方向EDが略一致するか否かを判定し、車外画像については、変換前の撮像画像と変換画像との間で、顔方向FDが略一致するか否かを判定する。より具体的には、例えば、画像判定部150は、変換前の撮像画像における顔方向FDを表すベクトルと、変換画像における顔方向FDを表すベクトルとの間の角度差を算出し、算出した角度差が閾値以内である場合に、顔方向FDが略一致すると判定する。視線方向EDについても同様である。顔の連続性又は方向情報の一致性が満たされることは、「所定要件」の一例である。
【0049】
変換前の撮像画像と変換画像との間で、顔方向FD又は視線方向EDが略一致しないと判定された場合、画像変換部140は、顔方向FD又は視線方向EDが略一致しないと判定された顔について、再度、撮影画像に対して変換処理を行う。このとき、画像変換部140は、略一致しないと判定された顔についてのみ再度、変換処理を行ってもよいし、略一致しないと判定された顔を含む変換画像に含まれる全ての顔について、再度、変換処理を行ってもよい。また、例えば、画像変換部140は、略一致しないと判定された顔については、再度、変換処理を行うことなく、モザイク処理を施して、学習データとして活用する対象から除外してもよい。また、例えば、画像判定部150での判定の結果、略一致しないと判定された場合には、画像判定部150は、時系列の変換画像に対して所定処理を施すことを制限する、すなわち時系列の変換画像を学習データとして活用する対象から除外することとしてもよい。これにより、顔変換ソフトウェアの意図しない動作に起因する情報の劣化を防止することができる。
【0050】
なお、変換画像に写される顔が複数存在する場合(または、変換画像に写される顔の数が所定値以上である場合)、上述した画像判定部150によって実行される変換画像の連続性に関する判定処理と、方向情報の一致性に関する判定処理とは、変換画像に写される全ての顔についてではなく、より重要度が高いと想定される顔についてのみ実行してもよい。より重要度が高いと想定される顔の例として、画像判定部150は、変換前の撮像画像において、顔の大きさが第1閾値Th1よりも大きい第3閾値Th3以上の顔についてのみ、これらの判定処理を実行してもよいし、顔の距離が第2閾値Th2よりも小さい第4閾値Th4以下の顔についてのみ、これらの判定処理を実行してもよい。また、例えば、画像判定部150は、変換前の撮像画像において、車両M1の進行方向前方に存在する人の顔や、顔方向が車両M1の進行方向前方に向かっている人の顔をより重要度が高いと想定し、これらの判定処理を実行してもよい。また、例えば、変換画像に写されるある一つの顔について連続性又は一致性が否定された場合、当該顔と、重要度が高いと想定される顔について再変換処理を実行してもよい。
【0051】
画像判定部150は、時系列の変換画像について連続性と一致性とが確認されると、連続性と一致性とが確認された変換画像データ174をアノテーション用画像データ176として記憶部170に格納する。このとき、変換画像データ174を、利用目的を示す情報とともに、例えば入力画像に写される人物の行動を予測する行動予測モデルを生成するためのアノテーション用画像データであることを示す情報とともに、変換画像データ174をアノテーション用画像データ176として記憶部170に格納してもよい。送受信制御部120は、アノテーション用画像データ176を端末装置200に送信する。端末装置200のユーザであるアノテーターは、受信したアノテーション用画像データ176に含まれるアノテーション用画像にアノテーション作業を実施することでアノテーション付画像データを生成し、画像処理装置100に送信する。画像処理装置100は、受信したアノテーション付画像データを記憶部170にアノテーション付画像データ178として格納する。
【0052】
なお、上述した画像判定部150によって実行される変換画像の連続性に関する判定処理と、顔方向情報の一致性に関する判定処理とは、少なくとも一方が実行されればよく、連続性と一致性の少なくとも一方が成立した場合に、変換画像データ174がアノテーション用画像データ176として記憶部170に格納されてもよい。
【0053】
さらに、画像判定部150は、例えば、一走行サイクルにおいて所定間隔(例えば、1秒ごと)で得られた時系列の撮像画像(又は、その変換画像)について、カメラの不具合等に起因して欠落したものが存在する場合、これら時系列の画像の全てをアノテーション用画像データ176として記憶部170に格納しなくてもよい。
【0054】
図8は、アノテーターによって実行されるアノテーション作業の一例を示す図である。
図8の左部は車内画像の変換画像へのアノテーションを表し、
図8の右部は車外画像の変換画像へのアノテーションを表す。アノテーターは、車内画像の変換画像に対して、例えば、当該変換画像に写される運転者の視線方向ED1が、同一時点の車外画像の変換画像に示される状況において、適切であるか否かを示す情報(例えば、適切であれば1、不適切であれば0)を付与する。例えば、
図8の場合、車外画像の変換画像は、車両進行方向の左手に歩行者が存在することを示している一方、車内画像の変換画像は、運転者が左方向に視線を向けていることを示している。換言すると、運転者は歩行者に対して適切な注意を払っていることが想定されるため、アノテーターは、運転者の視線方向ED1が適切であることを示す情報(すなわち、1)を付与する。
【0055】
さらに、アノテーターは、車外画像の変換画像に対して、例えば、モザイク処理を施された人物を除く、当該変換画像に写される人物が進行すると予測されるリスクエリアRAを指定する。画像変換部140および画像判定部150による処理により、元画像に写される人物の顔は別人物の顔に変換されているため、当該人物のプライバシーは保護されている。同時に、変換後も、人物の顔方向および視線方向は維持されているため、アノテーターは、変換画像に写される別人物の顔方向および視線方向を参照しつつ、リスクエリアRAを正確に指定することができる。これにより、顔画像に写される人物のプライバシーを保護しつつ、機械学習モデルの学習に有効な学習データを生成することができる。
【0056】
アノテーション付画像データ178が記憶部170に格納されると、学習済みモデル生成部160は、アノテーション付画像データ178を学習データとして、任意の機械学習モデルを用いて、学習済みモデルを生成する。この学習済みモデルは、上述した通り、例えば、車外画像の入力に対して、当該車外画像に写される人物の予測行動(軌道)を出力したり、車内画像および車外画像の入力に対して、当該車内画像に写される運転者の視線を考慮して、当該車外画像に写される歩行者への注意喚起を促す行動予測モデルである。学習済みモデル生成部160は、生成した学習済みモデルを学習済みモデル180として記憶部170に格納する。
【0057】
送受信制御部120は、学習済みモデル180が生成されると、生成された学習済みモデル180を、ネットアークNWを介して車両M2に配布する。車両M2は、学習済みモデル180を受信すると、当該学習済みモデル180(より正確には、学習済みモデル180を活用したアプリケーションプログラム)を用いて車両M2の運転者に対する運転支援を行う。
【0058】
図9は、学習済みモデル180を用いた運転支援の一例を示す図である。
図9は、車両M2が、走行中、搭載するカメラによって撮像された車内画像および車外画像を学習済みモデル180に入力し、学習済みモデル180が、当該車内画像に写される運転者の視線を考慮して、当該車外画像に写される歩行者への注意喚起を促す情報をHMI(human machine interface)に出力することによって運転支援を行う例を表している。
図9に示す通り、例えば、HMIは、車外画像に写される歩行者P5に対応するリスク領域RA2を表示すると共に、車内画像に写される運転者の視線が当該歩行者P5に向いていない場合、警告メッセージ(「脇見運転に注意して下さい」)を文字情報や音声情報として出力する。これにより、運転者の状態を考慮した運転支援を実現することができる。
【0059】
次に、
図10および
図11を参照して、画像処理装置100によって実行される処理の流れについて説明する。
図10は、画像変換部140によって実行される処理の流れの一例を示す図である。
図10に示す処理は、例えば、車両M1に搭載されるカメラによって車内画像または車外画像が撮像され、画像処理部130による処理が施されたタイミングで実行されるものである。
【0060】
まず、画像変換部140は、画像処理部130による処理が施された撮像画像データ172に含まれる撮像画像を取得する(ステップS100)。次に、画像変換部140は、取得した撮像画像に写される顔を一つ選択する(ステップS102)。
【0061】
次に、画像変換部140は、選択した顔の大きさが第1閾値Th1以上であるか否かを判定する(ステップS104)。選択した顔の大きさが第1閾値Th1以上であると判定された場合、画像変換部140は、当該顔を別人物の顔に変換する(ステップS106)。一方、選択した顔の大きさが第1閾値Th1未満であると判定された場合、画像変換部140は、次に、選択した顔の距離が第2閾値Th2以下であるか否かを判定する(ステップS108)。
【0062】
選択した顔の距離が第2閾値Th2以下であると判定された場合、画像変換部140は、ステップS106に進み、当該顔を別人物の顔に変換する。一方、選択した顔の距離が第2閾値Th2より大きいと判定された場合、画像変換部140は、当該顔にモザイク処理を施す(ステップS110)。次に、画像変換部140は、取得した撮像画像に写される全ての顔に対して処理を実行したか否かを判定する(ステップS112)。
【0063】
取得した撮像画像に写される全ての顔に対して処理を実行したと判定された場合、画像変換部140は、全ての顔に対して処理が実行したことによって得られる画像を変換画像として取得し、変換画像データ174として記憶部170に格納する(ステップS114)。一方、取得した撮像画像に写される全ての顔に対して処理を実行していないと判定された場合、画像変換部140は、処理をステップS102に戻す。これにより、本フローチャートの処理が終了する。
【0064】
図11は、画像判定部150によって実行される処理の流れの一例を示す図である。
図11に示す処理は、例えば、車両M1の発進から停止までの一走行サイクルにおいて撮像された時系列の撮像画像に対して上記の変換処理を施すことによって時系列の変換画像が得られたタイミングで実行されるものである。
【0065】
まず、画像判定部150は、時系列の変換画像を取得する(ステップS200)。次に、画像判定部150は、取得した時系列の変換画像において、変換前に同一人物として追跡された人物の顔を選択する(ステップS202)。
【0066】
次に、画像判定部150は、時系列の変換画像の各々から、変換前に同一人物として追跡された人物の顔から特徴点を抽出し、照合を行うことによって、これらの顔は変換後も同一であるか否かを判定する(ステップS204)。変換後も顔が同一であると判定された場合、次に、画像判定部150は、取得した時系列の変換画像が車内画像であるか否かを判定する(ステップS206)。一方、顔が同一ではないと判定された場合、画像判定部150は、画像変換部140に、時系列の撮像画像において変換前に同一人物として追跡された人物の顔を再度、変換させる(ステップS208)。その後、画像判定部150は、再度、変換された顔に対して再度ステップS204の処理を実行する。
【0067】
ステップS206において、取得した時系列の変換画像が車内画像であると判定された場合、画像判定部150は、これらの顔の視線方向と顔方向が変換前の画像と一致しているか否かを判定する(ステップS210)。一方、取得した時系列の変換画像が車内画像ではない、すなわち、車外画像であると判定された場合、画像判定部150は、これらの顔の顔方向が変換前の画像と一致しているか否かを判定する(ステップS212)。ステップS210又はステップS212の処理において一致しないと判定された場合、画像判定部150は、処理をステップS208に進める。
【0068】
ステップS210又はステップS212の処理において一致すると判定された場合、画像判定部150は、これらの顔が正常に変換されたものであると判定し、時系列の変換画像に写される全ての顔について処理を実行したか否かを判定する(ステップS214)。時系列の変換画像に写される全ての顔に対して処理を実行したと判定された場合、画像判定部150は、これら時系列の変換画像をアノテーション用画像として取得し、送受信制御部120に取得したアノテーション用画像を端末装置200に送信させる(ステップS216)。一方、時系列の変換画像に写される全ての顔に対して処理を実行していないと判定された場合、画像判定部150は、処理をステップS202に戻す。これにより、本フローチャートの処理が終了する。
【0069】
以上の通り説明した本実施形態によれば、匿名化処理が施された複数の入力画像が所定要件を満たすと判定した場合、匿名化処理が施された複数の入力画像に所定処理を施し、当該匿名化処理は、複数の入力画像に写される人物の顔を別人物の顔に変更する処理を含み、当該所定要件は、匿名化処理が施された複数の入力画像に写された、複数の入力画像において同一人物として追跡された人物の顔が、匿名化処理後においても同一人物の顔であることを含む。すなわち、本実施形態では、匿名化処理前に同一人物のものであった顔は、匿名化処理においても同一人物の顔であることが保証され、学習データとして活用される。これにより、顔画像に写される人物のプライバシーを保護しつつ、機械学習モデルの学習に有効な学習データを生成することができる。
【0070】
また、本実施形態によれば、所定要件は、複数の入力画像において同一人物として追跡された人物の顔の方向情報と、前記匿名化処理が施された前記複数の入力画像における前記同一人物の顔の方向情報とが一致することを含む。すなわち、本実施形態では、匿名化処理を施しても同一人物の顔の方向情報は不変であることが保証される。これにより、顔画像に写される人物のプライバシーを保護しつつ、機械学習モデルの学習に有効な学習データを生成することができる。
【0071】
また、本実施形態によれば、所定要件は、複数の入力画像の撮影態様である画像属性に応じて定められるものである。すなわち、本実施形態では、複数の入力画像の各々の撮影態様を考慮して、例えば、行動予測モデルを生成するための学習用情報として保存する処理である所定処理が実行される。これにより、顔画像に写される人物のプライバシーを保護しつつ、機械学習モデルの学習に有効な学習データを生成することができる。
【0072】
また、本実施形態によれば、複数の入力画像の各々に写される顔の大きさ又は撮影地点から顔への距離に基づいて、第1方法により匿名化処理を施すか、第1方法とは異なる第2方法により匿名化処理を施すかを決定する。すなわち、本実施形態では、機械学習モデルの学習に有用か否かに応じて、顔に対して施す匿名化処理の方法を変更する。これにより、顔画像に写される人物のプライバシーを保護しつつ、機械学習モデルの学習に有効な学習データを生成することができる。
【0073】
[変形例]
上述した通り、本実施形態では、画像判定部150によって、変換画像に写される顔が所定要件を満たさないと判定された場合、当該変換画像を再変換したり、モザイク処理を施す例について説明した。しかし、画像判定部150によって所定要件が満たされていないと判定された場合には、画像判定部150は変換画像に対して所定処理を施さない、すなわち、所定処理を施すことを制限する(画像保管、サーバへの送信等をしない)といった処理を行ってもよい。
【0074】
さらに、本実施形態では、画像処理装置100が、車両M1とは別体のサーバ装置として実装されている例について説明した。しかし、本実施形態の変形例として、画像処理装置100、より具体的には、少なくとも画像処理部130、画像変換部140、画像判定部150の機能を有する装置が車載装置として車両M1に搭載されてもよい。その場合、車載装置は、車載カメラが撮像した画像に、上述した画像処理部130による処理を施し、画像変換部140による匿名化を行い、画像判定部150による判定を行う。その後、車載装置は、画像判定部150によって顔の連続性と方向情報の一致性とが確認された匿名化画像を外部の画像サーバに送信する。
【0075】
画像サーバは、車両M1から匿名化画像を受信すると、受信した匿名化画像をアノテーション用画像データとして記憶部に蓄積するとともに、アノテーション用画像データをアノテーターの端末装置200に送信するか、又は端末装置200によるアノテーション用画像データへのアクセスを許可する。画像サーバは、端末装置200からアノテーション付画像データを受信すると、当該アノテーション付画像データに基づいて学習済みモデル180を生成し、生成された学習済みモデル180を車両M2に配布する。このようにしても、本実施形態と同様に、顔画像に写される人物のプライバシーを保護しつつ、機械学習モデルの学習に有効な学習データを生成することができる。さらに、本変形例によれば、車載装置が画像に匿名化処理を施した上で匿名化画像を画像サーバに送信するため、顔画像に写される人物のプライバシーをさらに確実に保護することができる。
【0076】
さらに、別の態様として、車載装置は、画像処理部130、画像変換部140、画像判定部150のうちの一部の機能のみを備え、画像サーバが残りの機能を有してもよい。例えば、車載装置は画像処理部130と画像変換部140の機能を備え、画像サーバは画像判定部150の機能を備えてもよいし、車載装置は画像処理部130の機能を備え、画像サーバは画像変換部140と画像判定部150の機能を備えてもよい。
【0077】
上記説明した実施形態は、以下のように表現することができる。
コンピュータによって読み込み可能な命令(computer-readable instructions)を格納する記憶媒体(storage medium)と、
前記記憶媒体に接続されたプロセッサと、を備え、
前記プロセッサは、前記コンピュータによって読み込み可能な命令を実行することにより(the processor executing the computer-readable instructions to:)、
入力画像に対して匿名化処理を行い、
前記匿名化処理が施された前記入力画像が所定要件を満たすか否かを判定し、
前記匿名化処理が施された前記入力画像が前記所定要件を満たすと判定した場合、前記匿名化処理が施された前記入力画像に所定処理を施し、
前記匿名化処理は、前記入力画像に写される人物の顔を別人物の顔に変更する処理を含み、
前記所定要件は、前記入力画像における人物の顔の方向情報と、前記匿名化処理が施された前記入力画像における前記別人物の顔の方向情報とが一致することである、
ように構成されている、画像処理装置。
【0078】
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
【符号の説明】
【0079】
100 画像処理装置
110 通信部
120 送受信制御部
130 画像処理部
140 画像変換部
150 画像判定部
160 学習済みモデル生成部
170 記憶部
172 撮像画像データ
174 変換画像データ
176 アノテーション用画像データ
178 アノテーション付画像データ
180 学習済みモデル