(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022073495
(43)【公開日】2022-05-17
(54)【発明の名称】情報処理方法、プログラム及び情報処理装置
(51)【国際特許分類】
G06T 7/00 20170101AFI20220510BHJP
G06T 1/00 20060101ALI20220510BHJP
G08G 1/16 20060101ALI20220510BHJP
【FI】
G06T7/00 350B
G06T7/00 650Z
G06T1/00 330Z
G08G1/16 A
【審査請求】有
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2020183520
(22)【出願日】2020-11-02
(71)【出願人】
【識別番号】520040304
【氏名又は名称】窪田 望
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】窪田 望
【テーマコード(参考)】
5B057
5H181
5L096
【Fターム(参考)】
5B057AA16
5B057BA02
5B057CA01
5B057CA08
5B057CA12
5B057CA16
5B057CB01
5B057CB12
5B057CB16
5B057CE18
5B057DA12
5B057DB02
5B057DB06
5B057DB09
5B057DC40
5H181AA01
5H181AA26
5H181BB20
5H181CC04
5H181LL01
5H181LL02
5H181LL09
5L096AA02
5L096AA06
5L096BA04
5L096CA02
5L096HA09
5L096HA11
5L096KA04
(57)【要約】
【課題】例えば攻撃を受けた画像が画像認識されるような場合でも、画像内の対象物を適切に認識又は分類すること。
【解決手段】情報処理方法は、情報処理装置に備えられるプロセッサが、対象画像に対し、偽画像を生成させる第1アルゴリズムを用いて第1画像を生成すること、及び、対象画像又は第1画像に対し、画像を編集する第2アルゴリズムを用いて第2画像を生成することのうち、少なくとも第1画像の生成を行うこと、第1画像、又は、第1画像及び第2画像を用いて、対象画像に含まれる対象物に分類するよう学習して学習モデルを生成すること、を実行する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
情報処理装置に備えられるプロセッサが、
対象画像に対し、偽画像を生成させる第1アルゴリズムを用いて第1画像を生成すること、及び、前記対象画像又は前記第1画像に対し、画像を編集する第2アルゴリズムを用いて第2画像を生成することのうち、少なくとも前記第1画像の生成を行うこと、
前記第1画像、又は、前記第1画像及び前記第2画像を用いて、前記対象画像に含まれる対象物に分類するよう学習して学習モデルを生成すること、
を実行する、情報処理方法。
【請求項2】
前記第1アルゴリズムは、所定の敵対的サンプル生成アルゴリズムを含み、
前記第2アルゴリズムは、画像の少なくとも一部に変更を加える所定のアルゴリズムを含む、請求項1に記載の情報処理方法。
【請求項3】
前記対象画像は、自動運転可能な車両における認識対象を含む画像である、請求項1又は2に記載の情報処理方法。
【請求項4】
前記車両は、撮像装置と、前記情報処理装置を搭載し、
前記プロセッサが、
前記撮像装置により撮像された撮像画像を前記学習モデルに入力し、前記撮像画像の認識結果を取得すること、をさらに実行する請求項3に記載の情報処理方法。
【請求項5】
前記第1アルゴリズムは、顔を含む前記対象画像に対する所定の敵対的生成ネットワークを含み、
前記学習モデルを生成することは、
前記所定の敵対的生成ネットワークを用いて生成される第1画像を用いて、前記学習モデルを生成することを含む、請求項1に記載の情報処理方法。
【請求項6】
前記第1画像は、前記顔の一部が所定物に覆われた画像を含み、
前記情報処理装置は、自動運転可能な車両に搭載され、
前記プロセッサが、
前記車両に搭載される撮像装置により撮像され、顔を含む撮像画像を前記学習モデルに入力し、前記撮像画像の認識結果を取得すること、をさらに実行する請求項5に記載の情報処理方法。
【請求項7】
前記生成を行うことは、
前記第1画像及び前記第2画像を生成し、
前記学習モデルを生成することは、
前記第1画像及び前記第2画像を用いて学習し、前記学習モデルを生成する、請求項1から6のいずれか一項に記載の情報処理方法。
【請求項8】
情報処理装置に備えられるプロセッサに、
対象画像に対し、偽画像を生成させる第1アルゴリズムを用いて第1画像を生成すること、及び、前記対象画像又は前記第1画像に対し、画像を編集する第2アルゴリズムを用いて第2画像を生成することのうち、少なくとも前記第1画像の生成を行うこと、
前記第1画像、又は、前記第1画像及び前記第2画像を用いて、前記対象画像に含まれる対象物に分類するよう学習して学習モデルを生成すること、
を実行させる、プログラム。
【請求項9】
プロセッサを備える情報処理装置であって、
前記プロセッサが、
対象画像に対し、偽画像を生成させる第1アルゴリズムを用いて第1画像を生成すること、及び、前記対象画像又は前記第1画像に対し、画像を編集する第2アルゴリズムを用いて第2画像を生成することのうち、少なくとも前記第1画像の生成を行うこと、
前記第1画像、又は、前記第1画像及び前記第2画像を用いて、前記対象画像に含まれる対象物に分類するよう学習して学習モデルを生成すること、
を実行する、情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理方法、プログラム及び情報処理装置に関する。
【背景技術】
【0002】
近年、自動運転車両による事故を回避する技術が盛んに研究されている。例えば、プロセッサによる運転能力レベルと、人間による運転能力レベルとを比較し、相対的にレベルの高い方に運転させる技術が知られている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、自動運転システムは、撮像装置により撮像された画像に基づき認識された対象物(標識、信号等)を用いて、自動運転を制御する。従って、従来技術のように、画像認識される対象物が真であるとの仮定の下で自動運転が制御される場合、画像認識される対象物が誤認識されてしまうと、重大な事故につながる可能性がある。例えば、近年指摘されている1ピクセルアタック(Jiawei Su, Danilo Vasconcellos Vargas, Sakurai Kouichi, "One pixel attack for fooling deep neural networks," IEEE Transactions on Evolutionary Computation], Vol.23 , Issue.5 , pp. 828--841. Publisher: IEEE. 2019)と呼ばれる攻撃は、わずか1ピクセルを変更するだけで、ニューラルネットワークに誤った画像を認識させ、特定の結果を返すように誘導することが可能になる。現在、このような攻撃に対する対策が急務となっている。
【0005】
そこで、本発明は、例えば攻撃を受けた画像が画像認識されるような場合でも、画像内の対象物を適切に認識又は分類することを可能にする情報処理方法、プログラム及び情報処理装置を提供する。
【課題を解決するための手段】
【0006】
本発明の一態様に係る情報処理方法は、情報処理装置に備えられるプロセッサが、対象画像に対し、偽画像を生成させる第1アルゴリズムを用いて第1画像を生成すること、及び、前記対象画像又は前記第1画像に対し、画像を編集する第2アルゴリズムを用いて第2画像を生成することのうち、少なくとも前記第1画像の生成を行うこと、前記第1画像、又は、前記第1画像及び前記第2画像を用いて、前記対象画像に含まれる対象物に分類するよう学習して学習モデルを生成すること、を実行する。
【発明の効果】
【0007】
本発明によれば、例えば攻撃を受けた画像が画像認識されるような場合でも、画像内の対象物を適切に認識又は分類することを可能にする情報処理方法、プログラム及び情報処理装置を提供することができる。
【図面の簡単な説明】
【0008】
【
図1】本発明の一実施形態に係る情報処理システムの一例を示す図である。
【
図2】実施例1に係る情報処理装置の処理ブロックの一例を示す図である。
【
図3】実施例1に係るデータ拡張処理の一例を示す図である。
【
図4】実施例1に係る情報処理装置の物理的構成の一例を示す図である。
【
図5】実施例1に係る情報処理システム1の判定処理の一例を示すシーケンス図である。
【発明を実施するための形態】
【0009】
添付図面を参照して、本発明の実施形態について説明する。なお、各図において、同一の符号を付したものは、同一又は同様の構成を有する。
【0010】
<システム概要>
図1は、本発明の一実施形態に係る情報処理システム1の一例を示す図である。
図1に示す情報処理システム1は、情報処理装置10、撮像装置が搭載された車両20を含み、ネットワークNを介して相互にデータ通信可能である。
図1に示す情報処理システム1の例では、車両20に搭載される撮像装置が撮像する画像に対して適切に対象物を認識又は分類(以下、単に「認識」ともいう。)することを想定するが、この例に限られるわけではない。
【0011】
図1に示す情報処理装置10は、例えばサーバであり、ネットワークを介してあらゆる人やモノに接続される。例えば、情報処理装置10は、自動運転レベル3以上の自動運転可能な各車両20に接続され、各車両20に搭載のカメラなどの撮像装置により撮像された画像を取得する。
【0012】
情報処理装置10は、取得される画像に対して、画像認識モデル、例えばCNN(Convolutional Neural Network)を用いて画像内の対象物が何であるかを認識する。なお、CNNは、AlexNet,ZFNet,GooLeNet,VGGNet,ResNet,SENet,WideResNet,PyramidNet,ResNeXt,Xception,RoR,FractalNet,DenseNet,Stochastic Depth,Shake-Shake Regularization,ShakeDrop,Cutout/Random Erasing,mixup,SqueezeNet,MobileNet,NasNet,DARTS,などの画像認識に適用可能ないずれかの方法であってもよい。また、CNNの改良については、Residualモジュールの改良、独自モジュールの利用、独自マクロアーキテクチャの利用、正則化、高速化を意識したアーキテクチャ、アーキテクチャの自動設計などが工夫されてもよい。
【0013】
例えば、道路標識IM1や人の顔IM2などを認識対象物とする場合、この認識対象物を撮像した画像に対して、ネットワーク上などで上述した1ピクセルアタックなどの攻撃が行われた場合、画像認識モデルにおいて誤認識させられる可能性がある。
【0014】
そこで、この認識対象物を正しく認識させるよう学習させる際に、事前に学習データを拡張しておくことで、1ピクセルアタックを受けた画像に対しても、対象物を適切に認識させることができるようになる。拡張される学習データは、例えば、認識対象物の画像に対して1ピクセルアタックを攻撃した画像や、さらに画像編集した画像や、1ピクセルアタックが繰り返された画像について、正しい認識対象物の正解ラベルが付与された学習データである。
【0015】
これにより、認識対象物を含む画像に対して、想定されうる攻撃や画像編集を行った画像について、正しく認識できるように事前に学習させることができる。例えば拡張された学習データに対して教師あり学習を行うことで、認識精度を高めることができる。その結果、拡張された学習データを用いて学習された学習モデル(推論アルゴリズム、推論関数)が使用されることで、攻撃を受けた画像であっても認識対象物を適切に認識することが可能になる。
【0016】
<実施例1>
以下、本発明に係る一実施例について説明する。実施例1では、認識対象物として、自動運転システムで認識される道路標識、信号機、区画線などの地物を例にする。情報処理装置10は、任意の地物が撮像された撮像画像に対してデータ拡張処理を実行する。例えば、情報処理装置10は、所定のデータベース等から取得した撮像画像に対して、偽画像を生成させる第1アルゴリズムを用いて第1画像を生成する。さらに任意で、情報処理装置10は、第1画像に対して、画像を編集する第2アルゴリズムを用いて第2画像を生成する。
【0017】
情報処理装置10は、データ拡張処理で生成された画像を学習データとして、例えば教師あり学習を実行する。これにより、地物を含む撮像画像に攻撃や編集が行われても、その地物を適切に認識することが可能になる。以下、実施例1における認識対象物の学習処理、認識処理について具体的に説明する。
【0018】
図2は、本実施例1に係る情報処理装置10の処理ブロックの一例を示す図である。情報処理装置10は、処理制御部11、取得部12、生成部13、第1生成部14、第1アルゴリズム14a、第2生成部15、第2アルゴリズム15a、学習部16、認識部17、記憶部18を備える。処理制御部11は、以下に説明する画像認識による対象物の認識を制御する。
【0019】
取得部12は、例えば所定の地物が撮像された撮像画像(対象画像)を、所定の装置(車両20、又は所定のデータベースなど)から取得する。例えば、所定のデータベースは、所定の地物が撮像された1又は複数の撮像画像を有するデータベースであり、ネットワークを介して情報処理装置10に接続される。所定の地物は、例えば存在する地物のうち、少なくとも1つが撮像された画像である。
【0020】
例えば、学習フェーズにおいては、取得部12は、所定のデータベースから1又は複数の対象画像を取得し、記憶部18に記憶する。また、認識フェーズにおいては、取得部12は、車両20から対象画像を順次取得し、記憶部18に記憶する。
【0021】
生成部13は、対象画像に対し、偽画像を生成させる第1アルゴリズム14aを用いて第1画像を生成すること、及び、対象画像又は第1画像に対し、画像を編集する第2アルゴリズム15bを用いて第2画像を生成することのうち、少なくとも第1画像の生成を行う。例えば、生成部13は、第1アルゴリズム14aを用いて第1画像を生成する第1生成部14と、第2アルゴリズム15aを用いて第2画像を生成する第2生成部15とを有する。
【0022】
第1生成部14は、例えば、対象画像から、第1アルゴリズム14aの一例としての、所定の偽画像生成アルゴリズムを用いて第1画像(偽画像)を生成する。また、第2生成部15は、必要に応じて、第2アルゴリズム15aの一例としての、公知の画像編集ソフトウェアを用いて、対象画像又は第1画像を編集して第2画像を生成する。なお、第1画像は、繰り返し第1アルゴリズムが用いられて生成された画像でもよい。また、第2アルゴリズム15aが適用された画像に対して、第1アルゴリズム14aが適用されてもよい。
【0023】
学習部16は、第1画像、又は、第1画像及び第2画像を含む拡張された学習データを用いて、対象画像に含まれる対象物(例えば地物)に分類するよう学習して学習モデルを生成する。例えば、学習部16は、拡張された学習データに対して、正しい地物に分類されるよう誤差逆伝搬法を用いて学習モデルに修正を加える。これにより、データ拡張された学習データにより事前に学習を行って適切に分類可能な学習済みの学習モデルを生成することができる。
【0024】
認識部17は、学習部16により学習された学習モデルを用いて、画像に含まれる対象物を認識する。なお、認識された対象物は、自動運転システムの運転制御に用いられたり、外部の装置に出力されたりしてもよい。なお、認識部17は、学習部16に統合されて1つのモジュールとして構成されてもよい。
【0025】
また、第1アルゴリズム14aは、所定の敵対的サンプル生成アルゴリズムを含む。具体例としては、第1アルゴリズム14aは、公知のFGSM(Fast Gradient Sign Method)、DeepFool、IGSM(Iterative Gradient Sign Method)、C&W(Carlini & Wagner)、JSMA(Jacobian-Based Saliency Map Approach)のいずれか1つ、又は任意の組み合わせによるアルゴリズムでもよい。また、第1アルゴリズム14aは、上述した1ピクセルアタックを行うアルゴリズムでもよく、上述した4つの方法で生成された画像にさらに、1ピクセルアタックを行ってもよい。また、第1アルゴリズム14aは、その他、GANs(Generative adversarial networks)などの敵対的生成ネットワークを用いて敵対的な画像を生成するアルゴリズムでもよい。なお、上述した例を含む公知の敵対的サンプル生成アルゴリズムは、将来的に公知になる敵対的サンプル生成アルゴリズムを含んでもよい。
【0026】
また、第2アルゴリズム15aは、画像の少なくとも一部に変更を加える所定のアルゴリズムを含む。具体例としては、第2アルゴリズム15aは、以下の少なくとも1つの公知の編集方法を含む。第2生成部15は、いずれの編集方法について、所定量だけ編集が加えられるように設定されていればよい。
・水平及び/又は垂直に画像をシフトする
・水平方向及び/又は垂直方向に画像を反転させる
・回転させる (回転角度はランダム)
・明度を変える
・ズームイン又はズームアウトする
・画像の一部をくり抜く、削除する
・背景色を変える
・背景を置き換える
・Mixup又はCutMix
・色空間モデルを変更する
【0027】
これにより、敵対的サンプル生成アルゴリズムや画像編集アルゴリズムを用いて事前に学習データを効率よく拡張することが可能になる。また、上述したアルゴリズムを用いれば自動的に学習データを拡張することができ、学習データの拡張処理を容易にすることが可能である。
【0028】
また、対象画像は、上述したとおり、自動運転可能な車両20における認識対象を含む画像である。例えば、対象画像は、道路標識、信号機、区画線などの自動運転の認識に用いられる地物である。
【0029】
これにより、自動運転システムにおいて認識される対象物に攻撃が仕掛けられても、適切に対象物を認識することが可能になる。その結果、自動運転システムにおいて、対象物の誤認識による事故の可能性を減らすことができ、自動運転システムの安全性の維持又は向上に寄与することができる。
【0030】
また、車両20は、撮像装置と、情報処理装置10を搭載してもよい。この場合、情報処理装置10の認識部17は、撮像装置により撮像された撮像画像を、拡張された学習データを用いて学習された学習モデルに入力し、撮像画像の認識結果を取得してもよい。
【0031】
撮像画像の認識結果は、例えば、自動運転システムの運転制御を行う処理制御部11により処理されてもよい。これにより、車両20自身で自動運転制御を行う場合にも、本開示の技術を適用することが可能になる。
【0032】
<データ拡張>
図3は、本実施例1に係るデータ拡張処理の一例を示す図である。
図3に示す例では、オリジナル画像IM10に対して、所定のノイズ除去処理が実行され、ノイズ除去後の画像IM12が生成される。画像IM12には、止まれの標識が含まれるとする。
【0033】
第2生成部15は、例えば、RGBの画像IM12に対して、色空間モデルを変換し、LABフォーマットの画像、YUVフォーマットの画像、HSVフォーマットの画像を生成する。
【0034】
学習部16は、各色空間フォーマットの画像を、例えばDenseNetのモデルを用いて学習を行う。また、第1生成部14は、学習部16による学習データを、第1アルゴリズム14aを用いてデータ拡張を行う。また、第2生成部15は、学習部16による学習データを、第2アルゴリズム15aを用いてデータ拡張を行う。
【0035】
学習部16は、データ拡張された学習データを用いて学習、例えば教師あり学習を行い、誤差逆伝搬法を適用して、正しい対象物(止まれの道路標識)に認識されるように、又は分類スコアが高くなるように学習モデルを修正する。
【0036】
図4は、本実施例1に係る情報処理装置10の物理的構成の一例を示す図である。情報処理装置10は、演算部に相当するCPU(Central Processing Unit)10aと、記憶部に相当するRAM(Random Access Memory)10bと、記憶部に相当するROM(Read only Memory)10cと、通信部10dと、入力部10eと、表示部10fと、を有する。
【0037】
図4に示す各構成は、バスを介して相互にデータ送受信可能に接続される。なお、本例では情報処理装置10が一台のコンピュータで構成される場合について説明するが、情報処理装置10は、複数のコンピュータ又は複数の演算部が組み合わされて実現されてもよい。また、
図4で示す構成は一例であり、情報処理装置10はこれら以外の構成を有してもよいし、これらの構成のうち一部を有さなくてもよい。
【0038】
CPU10aは、RAM10b又はROM10cに記憶されたプログラムの実行に関する制御やデータの演算、加工を行う制御部である。CPU10aは、例えば
図2に示す処理制御部11の各処理を実行する演算部である。CPU10aは、入力部10eや通信部10dから種々のデータを受け取り、データの演算結果を表示部10fに表示したり、RAM10bに格納したりする。
【0039】
RAM10bは、記憶部のうちデータの書き換えが可能なものであり、例えば半導体記憶素子で構成されてもよい。RAM10bは、CPU10aが実行するプログラム、
図2を用いて説明した学習モデルの性能を含む学習データといったデータを記憶してもよい。なお、これらは例示であって、RAM10bには、これら以外のデータが記憶されていてもよいし、これらの一部が記憶されていなくてもよい。
【0040】
ROM10cは、記憶部のうちデータの読み出しが可能なものであり、例えば半導体記憶素子で構成されてよい。ROM10cは、例えば所定のプログラムや、書き換えが行われないデータを記憶してよい。なお、
図2に示す記憶部18は、RAM10b及び/又はROM10cにより実現されうる。
【0041】
通信部10dは、情報処理装置10を他の機器に接続するインターフェースである。通信部10dは、インターネット等の通信ネットワークに接続されてよい。
【0042】
入力部10eは、ユーザからデータの入力を受け付けるものであり、例えば、キーボード及びタッチパネルを含んでよい。
【0043】
表示部10fは、CPU10aによる演算結果を視覚的に表示するものであり、例えば、LCD(Liquid Crystal Display)により構成されてよい。表示部10fは、例えば、画像認識結果などを表示してよい。
【0044】
処理制御部11の各処理を実行する制御プログラムは、RAM10bやROM10c等のコンピュータによって読み取り可能な非一時的な記憶媒体に記憶されて提供されてもよいし、通信部10dにより接続される通信ネットワークを介して提供されてもよい。情報処理装置10では、CPU10aが制御プログラムを実行することにより、
図2を用いて説明した様々な動作が実現される。なお、これらの物理的な構成は例示であって、必ずしも独立した構成でなくてもよい。例えば、情報処理装置10は、CPU10aとRAM10bやROM10cが一体化したLSI(Large-Scale Integration)を備えていてもよい。また、情報処理装置10は、GPU(Graphical Processing Unit)やASIC(Application Specific Integrated Circuit)を備えていてもよい。
【0045】
<処理例>
図5は、本実施例1に係る情報処理システム1の処理の一例を示すシーケンス図である。
図5に示す処理では、学習フェーズの処理S102~S108と、認識フェーズの処理S202~S206とを含み、両フェーズの処理はそれぞれ独立して実行されうる。
【0046】
ステップS102において、情報処理装置10の取得部12は、例えば所定のデータベースから、認識対象物(例えば様々な地物)を含む各撮像画像を取得する。
【0047】
ステップS104において、情報処理装置10の第1生成部14は、取得された撮像画像に対し、第1アルゴリズム14aを用いて第1画像を生成する。なお、上述したとおり、第1アルゴリズム14aが実行された第1画像は、この第1画像に対してさらに第1アルゴリズム14aが繰り返し実行されて生成された第1画像でもよい。
【0048】
ステップS106において、情報処理装置10の第2生成部15は、対象画像又は第1画像に対し、第2アルゴリズム15aを用いて第2画像を生成する。なお、第2画像の生成はされなくてもよい。また、第2アルゴリズム15aの適用は、第1アルゴリズム14aの適用より前でもよく、画像編集された画像に対して、敵対的サンプルが生成されてもよい。
【0049】
ステップS108において、情報処理装置10の学習部16は、生成された画像に対し、上述した所定の学習モデルを用いて、画像内の対象物を適切に認識できるよう学習する。生成された画像に対して学習が実行されることで、データ拡張された学習データに対して学習が実行されることになる。
【0050】
以上、本実施例1の学習フェーズの処理によれば、所定の攻撃に対して、想定されうる画像を効率よく生成し、これらの画像を学習データに含めて学習データを拡張することで、偽画像に対する耐性を向上させた学習モデルを生成することができる。
【0051】
次に、認識フェーズの処理について説明する。ステップS202において、車両20の撮像装置は、車両20の外部を撮像し、所定のタイミングで撮像画像を情報処理装置10に送信する。
【0052】
ステップS204において、情報処理装置10の取得部12は、車両20から送信される撮像画像を順次取得し、記憶部18に記憶する。情報処理装置10の認識部17は、取得される撮像画像を、学習部16において生成された学習モデルに入力し、認識結果を取得する。認識結果は、画像内の対象物に対する分類結果と分類スコアとを含んでもよい。
【0053】
ステップS206において、情報処理装置10の認識部17は、取得された認識結果を出力する。出力先としては、例えば、表示装置や、他の装置、自動運転システムなどの少なくとも1つである。
【0054】
以上、本実施例1の認識フェーズの処理によれば、所定の攻撃を受けた画像に対しても、データ拡張された学習データに基づいて学習された学習モデルを用いることで、画像内の対象物を適切に認識できるようになる。また、認識結果が自動運転システムに利用される場合、対象物が誤認識されることによる事故リスクを低減することが可能になる。
【0055】
<実施例2>
次に、本発明に係る実施例2について説明する。本実施例2は、顔を認識対象物とする例である。近年、顔認識を用いる顔認証が実用化され、携帯でのロック解除等にも使用されている。また、顔認証が自動運転システム等にも利用されると、顔画像が悪意ある攻撃を受けたときに、この顔画像により他人に認識され、車両20が盗難されてしまう可能性や、使用不可能になってしまう可能性がある。
【0056】
さらに、近年、顔の一部が覆われた状態(例えばサングラス、又はマスク着用のままの状態)で顔認識するケースが増えてきている。また、サングラスは、通常使用で、顔の目の部分を覆ったり、頭部にかけたりする場合もあり、装着の仕方によって覆う部分が異なる。同様に、マスクの場合も、通常は鼻と口を覆うが、口だけを覆ったり、時には顎の位置にずらして、鼻と口が露出したりするような装着の仕方もある。
【0057】
上述したように、顔認証が実用化されることで、顔認識の精度が重要となる。そこで、顔画像が攻撃された場合や、顔の一部が様々な形態で所定物に覆われる場合であっても、その人物の顔を適切に認識できるようにすることが求められている。
【0058】
本実施例2における情報処理システム1の構成は、
図1に示す構成と同様であり、情報処理装置10の構成は、
図2に示す構成と同様であり、情報処理システム1の処理の手順は、
図5に示す処理の手順と同様である。以下、実施例2における説明では、実施例1と同様の符号を用いる。なお、実施例2では、実施例1における認識対象物が顔になる。
【0059】
実施例2における第1アルゴリズム14aは、顔を含む対象画像に対する所定の敵対的生成ネットワークを含んで敵対的画像を生成するアルゴリズムである。例えば、第1生成部14は、上述したGANsを用いて、サングラスやマスクの位置がずれたような顔画像を生成する。なお、実施例2において、第2生成部15による第2画像の生成は、必ずしも実行されなくてもよい。
【0060】
また、第1生成部14は、GANsによって、マスクをつけた様々なパターンの顔画像を生成する。このデータ拡張により、第1生成部14は、動的に人がマスクをつけている状態の動画を生成することが可能になる。
【0061】
また、学習部16は、生成部13により、所定の敵対的生成ネットワークを用いて生成される第1画像を用いて、学習モデルを生成することを含んでもよい。例えば、GANsを用いて敵対的な画像が生成されると、学習部16は、これらを学習データとして学習データを拡張することができる。このとき、敵対的生成ネットワークが利用されるので、自動的に敵対的な画像が生成されうる。
【0062】
これにより、顔画像に対しても、所定の攻撃を受けたり、一部が覆われている顔画像を認識したりする場合であっても、データ拡張された学習モデルを利用することで、顔を適切に認識することが可能になる。
【0063】
また、第1画像は、顔の一部が所定物に覆われた画像を含む場合であり、かつ、情報処理装置10は、自動運転可能な車両20に搭載される場合があるとする。このとき、認識部17は、車両20に搭載される撮像装置により撮像され、顔を含む撮像画像を学習モデルに入力し、撮像画像の認識結果を取得してもよい。
【0064】
撮像画像の認識結果は、例えば、自動運転システムの運転制御を行う処理制御部11により処理されてもよい。これにより、車両20が運転者の顔画像を用いて認証を行う場合に、本開示の技術を適用することが可能になる。また、自動運転システムにおける人物認識、又は顔認識の認識精度の向上に寄与することができる。
【0065】
以上、実施例2によれば、顔を認識する場合に、所定の攻撃を受けたり、顔の一部が所定物に覆われたりする場合でも、顔を適切に認識することが可能になる。
【0066】
以上、実施例1及び2を含む実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。実施形態が備える各要素並びにその配置、材料、条件、形状及びサイズ等は、例示したものに限定されるわけではなく適宜変更することができる。また、異なる実施形態で示した構成同士を部分的に置換し又は組み合わせることが可能である。
【0067】
上記実施形態では、撮像装置は自動運転可能な車両20に搭載されるが、撮像装置は、自律走行可能な飛行体にも搭載可能であり、また、移動ができない物体又は装置に搭載されてもよい。
【符号の説明】
【0068】
1…情報処理システム、10…情報処理装置、10a…CPU、10b…RAM、10c…ROM、10d…通信部、10e…入力部、10f…表示部、11…処理制御部、12…取得部、13…生成部、14…第1生成部、14a…第1アルゴリズム、15…第2生成部、15a…第2アルゴリズム、16…学習部、17…認識部、18…記憶部