(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-13
(45)【発行日】2024-08-21
(54)【発明の名称】画像処理装置及び画像処理方法
(51)【国際特許分類】
G08G 1/16 20060101AFI20240814BHJP
G06T 7/00 20170101ALI20240814BHJP
G06V 20/59 20220101ALI20240814BHJP
G06V 10/24 20220101ALI20240814BHJP
【FI】
G08G1/16 F
G06T7/00 660A
G06V20/59
G06V10/24
(21)【出願番号】P 2023529444
(86)(22)【出願日】2021-12-02
(86)【国際出願番号】 JP2021044346
(87)【国際公開番号】W WO2022264453
(87)【国際公開日】2022-12-22
【審査請求日】2023-12-25
(31)【優先権主張番号】PCT/JP2021/022695
(32)【優先日】2021-06-15
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000003997
【氏名又は名称】日産自動車株式会社
(74)【代理人】
【識別番号】100083806
【氏名又は名称】三好 秀和
(74)【代理人】
【識別番号】100111235
【氏名又は名称】原 裕子
(74)【代理人】
【識別番号】100170575
【氏名又は名称】森 太士
(72)【発明者】
【氏名】梶山 直登
【審査官】上野 博史
(56)【参考文献】
【文献】特開2019-212156(JP,A)
【文献】特開2009-113621(JP,A)
【文献】特開2010-006362(JP,A)
【文献】国際公開第2015/194135(WO,A1)
【文献】特開2019-134397(JP,A)
【文献】特開2015-090662(JP,A)
【文献】特開2019-083015(JP,A)
【文献】特開2008-015800(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G08G 1/16
G06V 10/24
G06T 7/00
G06V 20/59
(57)【特許請求の範囲】
【請求項1】
ユーザを撮像するカメラと、
前記カメラによって撮像された画像を用いて前記ユーザの顔データを登録または認証するコントローラと、
動画を表示するディスプレイと、を備え、
前記コントローラは、
前記カメラによって撮像された顔の向きが、前記ユーザが前記カメラに対して正面を向いている状態を基準とした第1角度内であって、且つそれぞれ異なる複数の顔画像を用いて前記ユーザの顔データを登録または認証し、
前記登録または前記認証が完了するまで人間の顔を模した画像が顔の向きを変える動画を前記ディスプレイに表示し、
前記カメラによって撮像された画像に基づいて、前記ユーザの視線方向が前記カメラに向かっているか、または前記ディスプレイに向かっているかを判定し、
前記ユーザの視線方向が前記ディスプレイに向かっていると判定した場合に、前記人間の顔を模した画像が右方向または左方向に首を振る角度のうちどちらか一方の角度を、前記ユーザの着座位置から前記カメラに向かう方向と、前記ユーザの着座位置から前記ディスプレイに向かう方向とが成す第2角度
より大きくすることを特徴とする画像処理装置。
【請求項2】
前記カメラは車内の着座シートの前方に設置され、
前記顔の向きを変える方向には、上下左右方向のいずれか、または上下左右方向の組合せが含まれ、
前記カメラ及び前記ディスプレイは、車幅方向または車両の高さ方向に並ぶように設置される
ことを特徴とする請求項1
に記載の画像処理装置。
【請求項3】
前記コントローラは、前記動画を前記ディスプレイに表示しているとき、前記人間の顔を模した画像が顔の向きを変える速度と同じ速度で顔の向きを変えることを前記ユーザに通知する
ことを特徴とする請求項1
または2に記載の画像処理装置。
【請求項4】
前記コントローラは、前記動画を前記ディスプレイに表示しているとき、前記登録または前記認証が完了するまで前記動画と同じように顔の向きを変えることを前記ユーザに通知する
ことを特徴とする請求項1~
3のいずれか1項に記載の画像処理装置。
【請求項5】
前記コントローラは、前記動画を前記ディスプレイに表示しているとき、前記登録または前記認証が完了するまで、前記カメラの方向を向いて、前記動画と同じように上下左右方向に顔の向きを変えることを前記ユーザに通知する
ことを特徴とする請求項1~
4のいずれか1項に記載の画像処理装置。
【請求項6】
前記コントローラは、前記カメラによって撮像された顔の向きがそれぞれ異なる顔画像のうち、不足している向きを前記ユーザに通知する
ことを特徴とする請求項1~
5のいずれか1項に記載の画像処理装置。
【請求項7】
前記カメラは車内の着座シートの前方に設置され、
前記カメラ及び前記ディスプレイは、車両の前後方向に並ぶように設置される
ことを特徴とする請求項1
に記載の画像処理装置。
【請求項8】
前記ユーザの座高を検出するセンサをさらに備え、
前記コントローラは、前記センサによって検出された前記座高に応じて、前記ディスプレイに表示する
前記動画を変更する
ことを特徴とする請求項1~
7のいずれか1項に記載の画像処理装置。
【請求項9】
前記人間の顔を模した画像が右方向または左方向に首を振る角度のうちどちらか一方の角度は、前記第2角度より大きい
ことを特徴とする請求項1~
8のいずれか1項に記載の画像処理装置。
【請求項10】
前記コントローラは、
前記ユーザの視線方向が前記ディスプレイに向かっていると判定した場合に、前記人間の顔を模した画像が右方向または左方向に首を振る角度のうちどちらか一方とは逆方向の角度を前記第2角度より小さくする
ことを特徴とする請求項1
~9のいずれか1項に記載の画像処理装置。
【請求項11】
前記人間の顔を模した画像が顔の向きを変える
前記動画において、首から上の領域が動く一方で、首から下の領域は動かない
ことを特徴とする請求項1~1
0のいずれか1項に記載の画像処理装置。
【請求項12】
ユーザを撮像するカメラと、前記カメラによって撮像された画像を用いて前記ユーザの顔データを登録または認証するコントローラと、動画を表示するディスプレイとを備える画像処理装置の画像処理方法であって、
前記コントローラは、
前記カメラによって撮像された顔の向きが、前記ユーザが前記カメラに対して正面を向いている状態を基準とした第1角度内であって、且つそれぞれ異なる複数の顔画像を用いて前記ユーザの顔データを登録または認証し、
前記登録または前記認証が完了するまで人間の顔を模した画像が顔の向きを変える動画を前記ディスプレイに表示し、
前記カメラによって撮像された画像に基づいて、前記ユーザの視線方向が前記カメラに向かっているか、または前記ディスプレイに向かっているかを判定し、
前記ユーザの視線方向が前記ディスプレイに向かっていると判定した場合に、前記人間の顔を模した画像が右方向または左方向に首を振る角度のうちどちらか一方の角度を、前記ユーザの着座位置から前記カメラに向かう方向と、前記ユーザの着座位置から前記ディスプレイに向かう方向とが成す第2角度
より大きくする
ことを特徴とする画像処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置及び画像処理方法に関する。
【背景技術】
【0002】
従来より、自動車に乗車するユーザの顔を認識する技術が知られている(特許文献1)。特許文献1に記載された発明は、自動車に取り付けられたカメラでユーザを撮影し、撮影した顔画像の顔特徴情報と、予め登録された顔特徴情報とを用いて、ユーザの顔を認識する。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、カメラがユーザを撮像するとき、ユーザは必ずしも適切な方向を向いていない場合がある。この場合、ユーザの顔データの登録または認証に時間がかかるおそれがある。
【0005】
本発明は、上記問題に鑑みて成されたものであり、その目的は、ユーザの顔データの登録または認証に要する時間を短縮可能な画像処理装置及び画像処理方法を提供することである。
【課題を解決するための手段】
【0006】
本発明の一態様に係る画像処理装置は、カメラによって撮像された顔の向きが、ユーザがカメラに対して正面を向いている状態を基準とした第1角度内であって、且つそれぞれ異なる複数の顔画像を用いてユーザの顔データを登録または認証し、登録または認証が完了するまで人間の顔を模した画像が顔の向きを変える動画をディスプレイに表示し、カメラによって撮像された画像に基づいて、ユーザの視線方向がカメラに向かっているか、またはディスプレイに向かっているかを判定し、ユーザの視線方向がディスプレイに向かっていると判定した場合に、人間の顔を模した画像が右方向または左方向に首を振る角度のうちどちらか一方の角度を、ユーザの着座位置からカメラに向かう方向と、ユーザの着座位置からディスプレイに向かう方向とが成す第2角度より大きくする。
【発明の効果】
【0007】
本発明によれば、ユーザの顔データの登録または認証に要する時間が短縮される。
【図面の簡単な説明】
【0008】
【
図1】
図1は、本発明の実施形態に係る画像処理装置1の構成図である。
【
図2】
図2は、カメラ11とディスプレイ12が設置される位置を説明する図である。
【
図3】
図3は、人間の顔を模したCG画像が顔の向きを変える動画を説明する図である。
【
図4】
図4は、顔の向きに関する角度の一例を説明する図である。
【
図5】
図5は、人間の顔を模したCG画像を説明する図である。
【
図6】
図6は、カメラ11とディスプレイ12の位置関係の一例を説明する図である。
【
図7】
図7は、カメラ11とディスプレイ12の位置関係の一例を説明する図である。
【
図8】
図8は、カメラ11とディスプレイ12の位置関係の一例を説明する図である。
【
図9】
図9は、カメラ11とディスプレイ12の位置関係の一例を説明する図である。
【
図10】
図10は、本発明の実施形態に係る画像処理装置1の一動作例を説明するフローチャートである。
【
図11】
図11は、本発明の実施形態に係る画像処理装置1の一動作例を説明するフローチャートである。
【
図12】
図12は、顔IDの利用方法の一例を説明する図である。
【発明を実施するための形態】
【0009】
以下、本発明の実施形態について、図面を参照して説明する。図面の記載において同一部分には同一符号を付して説明を省略する。
【0010】
図1~2を参照して画像処理装置1の構成例を説明する。
図1に示すように、画像処理装置1は、入力I/F10と、カメラ11と、コントローラ20と、ディスプレイ12と、スピーカ13と、記憶装置14とを備える。
【0011】
本実施形態における画像処理装置1は、ユーザ(主にドライバ)の顔認証に関する処理を実行する装置である。顔認証には2つのフェーズが含まれる。1つは、新規にユーザの顔データを登録するフェーズである。もう1つは、登録された顔データを活用するフェーズである。登録された顔データを活用するフェーズとは、例えばカメラ画像と登録された顔データを突き合わせて、顔データを認証するフェーズである。
【0012】
入力I/F10は、ディスプレイ12に表示される仮想的なボタン、またはディスプレイ12の近傍に設置された機械スイッチである。入力I/F10は、ユーザが新規に顔データを登録する際に用いられる。
【0013】
カメラ11はCCD(charge-coupled device)、CMOS(complementary metal oxide semiconductor)などの撮像素子を有する。カメラ11は車内に設置される。例えば
図2に示すようにカメラ11はステアリングホイールの中央部分に設置される。カメラ11は主に運転席に座っているユーザの顔を撮像する。カメラ11によって撮像された画像はコントローラ20に出力される。
図2に示す符号30は、人間の顔を模したCG画像である(CG:Computer Graphics)。以下では符号30を顔画像30とよぶ。
【0014】
図2に示すようにディスプレイ12はインストルメントパネルの中央部分に設置される。後述する動画再生部23はディスプレイ12上で動画を再生する。本実施形態における動画は、顔画像30が顔の向きを変える映像である。換言すれば動画は、顔画像30が首を振る映像である。
図2に示すようにカメラ11とディスプレイ12は車幅方向に並んで設置される。
【0015】
コントローラ20は、CPU(中央処理装置)、メモリ、及び入出力部を備える汎用のマイクロコンピュータである。マイクロコンピュータには、画像処理装置1として機能させるためのコンピュータプログラムがインストールされている。コンピュータプログラムを実行することにより、マイクロコンピュータは、画像処理装置1が備える複数の情報処理回路として機能する。なお、ここでは、ソフトウェアによって画像処理装置1が備える複数の情報処理回路を実現する例を示すが、もちろん、以下に示す各情報処理を実行するための専用のハードウェアを用意して、情報処理回路を構成することも可能である。また、複数の情報処理回路を個別のハードウェアにより構成してもよい。コントローラ20は、複数の情報処理回路として、入力受付部21と、状態判定部22と、動画再生部23と、特徴量抽出部24と、ID登録部25と、特徴量比較部26と、ID認証部27と、通知部28とを備える。
【0016】
次に
図3を参照して、新規にユーザの顔データを登録するフェーズについて説明する。前提条件としてユーザは車両の運転席に座っている。ユーザが顔データを登録するとき、ユーザは登録ボタン(入力I/F10)を押す。この登録ボタンはディスプレイ12に表示される仮想的なボタンでもよく、ディスプレイ12の近傍に設置された機械スイッチでもよい。ユーザの入力は入力受付部21に送信される。入力受付部21はユーザからの入力を受信したとき、受信したことを示す信号を状態判定部22に送信する。状態判定部22は入力受付部21から信号を受信したとき、車両の状態を判定する。具体的には状態判定部22は、車両の電源状態が「IGN-ON」か否かを判定する。車両の電源状態が「IGN-ON」とは、車内に設置された電源スイッチがオンであり、メータとブロアモータを含む全ての電装品が作動する状態と定義される。また、状態判定部22はシフトポジションが「P」か否か判定する。本実施形態において、顔IDを登録する際の条件として、車両の電源状態が「IGN-ON」であること、かつ、シフトポジションが「P」であることが求められる。なお、「IGN-ON」に代えて、電源スイッチがオンであることが条件として採用されてもよい。つまり、顔IDを登録する際の条件として、車両の電源スイッチがオンであること、かつ、シフトポジションが「P」であること、という条件が採用されてもよい。
【0017】
状態判定部22は、顔IDを登録する際の条件を満たすと判定した場合、判定結果を示す信号を動画再生部23に送信する。「顔IDを登録する際の条件を満たす」とは、車両の電源状態が「IGN-ON」であり、かつ、シフトポジションが「P」であることを意味する。動画再生部23は状態判定部22から信号を受信したとき、ディスプレイ12上で動画を再生する。
図3を参照して動画再生部23によって再生される動画について説明する。動画は記憶装置14に記憶されている。記憶装置14はHDD(Hard Disk Drive)、SSD(Solid State Drive)などから構成される。動画再生部23は記憶装置14に記憶された動画を再生する。
図3に示すように、動画では顔画像が顔の向きを変える。換言すれば顔画像が首を動かしたり首を振ったりする。顔画像31は右方向を向く。顔画像32は左方向を向く。顔画像33は上方向を向く。顔画像34は下方向を向く。なお、動画は必ずしも記憶装置14に記憶されている必要はない。例えば、動画はクラウド型のサーバ(いわゆるクラウドサーバ)に保存されていてもよい。動画がクラウドサーバに保存されている場合、コントローラ20はクラウドサーバにアクセスし、動画を再生することができる。これにより、常に最新の動画が利用可能となる。
【0018】
顔の向きに関する角度(首の角度)の一例について
図4を参照して説明する。
図4に示すように、上下方向における首の角度は+20度~-20度である。左右方向における首の角度は+30度~-30度である。ユーザがカメラ11に対して正面を向いている場合(符号37)、上下方向及び左右方向は0度と定義される。この状態が角度の基準となる。上述の角度の数値は、この基準からの変化を示す。角度の正負は、上方向及び左方向が正、下方向及び右方向が負である。本実施形態ではこのように人間の顔を模したCG画像が顔の向きを変える動画が繰り返し再生される。人間の顔を模したCG画像の首の角度は、顔IDの登録または認証に必要な顔の向きの画像を撮像するための角度である。
【0019】
ユーザは、自身の顔の向きが動画の顔の向きと同じ向きになるように、顔(首)を動かす。カメラ11はユーザが顔を動かしているときに、顔の向きがそれぞれ異なる複数の顔画像を撮像する。「顔の向きがそれぞれ異なる複数の顔画像」の一例は、
図4に示す顔画像35~39である。顔画像35の向きは上方向に20度、右方向に30度である。顔画像36の向きは下方向に20度、右方向に20度である。顔画像37の向きは正面である(上下方向及び左右方向に0度)。顔画像38の向きは上方向に20度、左方向に20度である。顔画像39の向きは下方向に20度、左方向に30度である。カメラ11は、顔の向きがそれぞれ異なる顔画像を5枚(顔画像35~39)撮像する。ただし、5枚は一例であり、複数であれば3枚でも4枚でもよい。なお、顔の向きがそれぞれ異なっていれば十分であり、顔画像37のような正面画像は必須ではない。
【0020】
カメラ11によって撮像された複数の顔画像35~39は、特徴量抽出部24に送信される。特徴量抽出部24はカメラ11から取得した複数の顔画像35~39を用いて顔データの特徴を抽出する。一例として特徴量抽出部24は畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)を用いて顔データの特徴を抽出する。ただしこれに限定されず、他の機械学習アルゴリズムが用いられてもよい。なお、機械学習アルゴリズムを用いた特徴抽出方法は周知技術であるため、詳細な説明は省略する。本実施形態において顔の向きがそれぞれ異なる複数の顔画像を撮像する理由は、顔データの特徴を精度よく抽出するためである。
【0021】
特徴量抽出部24は、抽出された顔データの特徴をID登録部25に送信する。ID登録部25は、特徴量抽出部24から取得した顔データの特徴を用いて顔IDを登録する。登録された顔IDは記憶装置14に保存される。これにより、顔IDの登録が完了する。ID登録部25は顔IDの登録が完了したことを示す信号を動画再生部23及び通知部28に送信する。動画再生部23はこの信号を受信したとき、動画を停止し、通知部28はユーザへ登録が完了したことを通知する。通知方法として、通知部28はディスプレイ12に「顔IDの登録が完了しました」と表示してもよく、音声を用いてもよい。換言すれば、動画再生部23は顔IDの登録が完了するまで動画を再生する。ユーザは顔IDの登録が完了するまで動画と同じように顔を動かす。これにより、顔の向きがそれぞれ異なる複数の顔画像を短時間で撮像することが可能となり、顔データの登録に要する時間が短縮される。
【0022】
動画において、顔画像は顔の向きを変える(首を振る)が、動く部位と動かない部位が存在する。
図5に示すように、ディスプレイ12に表示される顔画像31において、首から上の領域40が動き、首から下の領域41は動かない。領域40には顔と首そのものが含まれる。領域41には胸から首までの上半身部分が含まれる。
【0023】
図6に示すように、ディスプレイ12が設置される位置と、カメラ11が設置される位置はずれている(位置関係は
図2参照)。
図6の符号50はユーザを示し、符号51はユーザの鼻(ユーザの顔の向き)を示す。
図6の上側の図は、ユーザがカメラ11に対して正面を向いている状態を示す。符号52は所定角度を示す。所定角度は、ユーザ50がカメラ11に対して正面を向いている状態を基準とし、カメラ11によって撮像された顔画像に多くの顔データが含まれるための角度と定義される。すなわち、所定角度52は、顔IDの登録または認証に必要な画像の顔の向きの角度の範囲である。ディスプレイ12に表示される動画において、人間の顔を模した画像は、所定角度52と同じ角度の範囲で顔の向きを変化させる(首を振る)。ユーザ50の顔の向きは所定角度52の範囲に含まれることが好ましい。なお所定角度52は実験、シミュレーションによって求められる。所定角度52は、ユーザ50がカメラ11に対して正面を向いている状態を基準として左右方向の第1角度61及び62とから成る。第1角度61、62の一例は、ユーザがカメラ11に対して正面を向いている状態(上下方向及び左右方向に0度)を基準として、左方向に30度、右方向に30度である。この場合、所定角度52の範囲は60度となる。
【0024】
本実施形態においてユーザ50はディスプレイ12の表示される動画を注視しながら顔を動かす。そうすると必然的にユーザ50の視線はディスプレイ12に向けられる(
図6の下側の図)。
図6の符号63aは、ユーザ50の着座位置からカメラ11に向かう方向と、ユーザ50の着座位置からディスプレイ12に向かう方向とが成す第2角度を示す。「ユーザ50の着座位置からカメラ11に向かう方向」は、「ユーザ50がカメラ11を見たときのユーザ50の視線方向」と表現されてもよい。同様に、「ユーザ50の着座位置からディスプレイ12に向かう方向」は、「ユーザ50がディスプレイ12を見たときのユーザ50の視線方向」と表現されてもよい。
図6の符号64aは、ユーザ50が動画を注視しながら左右方向に顔を動かした角度の範囲を示す。ユーザ50が、自身の顔の向きが動画の顔の向きと同じ向きになるように顔を動かすと、範囲64aの大きさは所定角度52の大きさと同じになる。
【0025】
図6の下図に示すように、第2角度63aが所定角度52より大きくなるような位置にディスプレイ12が設置される場合、範囲64aは所定角度52の範囲と重複しない。この場合、ユーザ50が動画を注視しながら左右方向の顔を動かしたときにカメラ11によって撮像された顔画像の顔の向きは、所定角度52の範囲に含まれない。すなわち、ユーザ50が動画を注視しながら動画と同じように顔を動かしても、顔IDの登録または認証に必要な顔の向きの画像を取得することが難しい場合がある。
【0026】
顔IDの登録または認証に必要な顔の向きの画像を速やかに取得するためには、ユーザが動画を注視しながら左右方向に顔を動かした角度の範囲が、所定角度52の範囲と重複することが好ましい。そこで、本実施形態では、カメラ11とディスプレイ12は、ユーザ50が動画を注視しながら左右方向に顔を動かした角度の範囲が所定角度52の範囲と重複するような位置に設置される。カメラ11とディスプレイ12を近づけて設置すれば、第2角度63aの角度は小さくなり、ユーザ50が動画を注視しながら左右方向に顔を動かした角度の範囲64aが所定角度52の範囲に近づく。
【0027】
本実施形態では、例えば
図7に示すように、カメラ11とディスプレイ12は、第2角度63bが第1角度61、62から成る所定角度52より小さくなるような位置に設置される。範囲64bは、範囲64aが時計回りにオフセットされたものである。範囲64bは、所定角度52の範囲と一部が重複するため所定角度52の範囲内でユーザ50の一方の顔の向きが撮像できる。
【0028】
図8に示すように、カメラ11とディスプレイ12は、第2角度63bが第1角度61、62より小さくなるような位置に設置されてもよい。範囲64cは、範囲64bがさらに時計回りにオフセットされたものであり、
図8の第2角度63cは
図7の第2角度63bよりも小さい。この場合、範囲64cは範囲64bと比較して所定角度52の範囲と重複する部分が大きくなり、所定角度52の範囲内でユーザ50の左右の顔の向きを撮像できる。このようにカメラ11とディスプレイ12の距離は短いことが好ましい。カメラ11とディスプレイ12の位置関係を調節する代わりに、所定角度52の範囲が第2角度より大きくなるように、所定角度52の範囲を調節してもよい。
【0029】
また、カメラ11とディスプレイ12の位置関係または所定角度52の範囲を調節する代わりに、人間の顔を模した画像が首を振る角度を調節して、ユーザ50が動画を注視しながら左右方向に顔を動かした角度の範囲が所定角度52の範囲と重複するようにしてもよい。例えば
図9に示すように、ユーザ50がディスプレイ12に対して正面を向いている状態を基準として、動画を注視しながら右方向に顔を動かす範囲65が第2角度63dより大きくなるように、人間の顔を模した画像が首を振る角度を調節してもよい。具体的には、動画再生部23は、人間の顔を模した画像が左方向に首を振る角度(ユーザが右方向に顔を動かす範囲65に対応)が、第2角度63dより大きくなるような動画を再生する。これにより、たとえ第2角度63dの範囲が所定角度52の範囲より大きくとも、ユーザ50が動画を注視しながら右方向に顔を動かす範囲65の一部が所定角度52に重複するため、所定角度52の範囲内でユーザ50の左右の顔の向きが撮像できる。
【0030】
次に
図10のフローチャートを参照して、画像処理装置1の一動作例を説明する。
【0031】
ステップS101において入力受付部21はユーザからの入力を受け付ける。入力受付部21はユーザからの入力を受信したとき、受信したことを示す信号を状態判定部22に送信する。処理はステップS103に進み、状態判定部22は入力受付部21から信号を受信したとき、車両の状態を判定する。状態判定部22は、顔IDを登録する際の条件を満たすと判定した場合、判定結果を示す信号を動画再生部23に送信する。処理はステップS105に進み、動画再生部23は状態判定部22から信号を受信したとき、ディスプレイ12上で動画を再生する(
図3参照)。通知部28は、動画をディスプレイ12に表示しているとき、顔IDの登録または認証が完了するまで、カメラ11の方向を向いて、動画と同じように上下左右方向に顔の向きを変えることをユーザに通知する。通知方法として文字情報による通知、または音声による通知がある。文字情報による通知として、通知部28はディスプレイ12に「カメラの方向を向いて、動画と同じように上下左右方向に顔の向きを変えてください」と文字を表示すればよい。音声による通知として、通知部28はスピーカ13を介して「カメラの方向を向いて、動画と同じように上下左右方向に顔の向きを変えてください」と音声で通知すればよい。
【0032】
処理はステップS107に進み、ユーザが動画を注視しながら顔を動かしているとき、カメラ11は顔の向きが、ユーザがカメラ11に対して正面を向いている状態を基準とした第1角度61、62内であって、且つそれぞれ異なる顔画像を複数撮像する。
【0033】
処理はステップS109に進み、特徴量抽出部24は顔データの特徴が抽出可能か否かを判定する。判定方法は特に限定されないが、例えばユーザがマスクをしていることが検出された場合、特徴量抽出部24は顔データの特徴が抽出不可能と判定する(ステップS109でNO)。一方、ユーザがマスクをしていることが検出されない場合、特徴量抽出部24は顔データの特徴が抽出可能と判定する(ステップS109でYES)。ステップS109でNOの場合、処理は中断される。このとき、通知部28は、「マスクを取ってもう一度撮像してください」と通知してもよく、「顔を隠すものを着用していませんか」と通知してもよい。
【0034】
ステップS109でYESの場合、処理はステップS111に進み、特徴量抽出部24は、所定の時間内に複数の画像を取得できたか否かを判定する。所定の時間を経過してもカメラ11が複数の画像を取得できない場合(ステップS111でNO)、処理はステップS113に進み、通知部28は、撮像のリトライをユーザに促し、動画をディスプレイ12に表示しているとき、顔IDの登録または認証が完了するまで、カメラ11の方向を向いて、動画と同じように顔の向きを変えることをユーザに通知する。通知方法は、ステップS105と同様である。通知によりユーザに注意喚起を行った後、処理はステップS101に戻る。ステップS111でYESの場合、処理はステップS115に進み、特徴量抽出部24はカメラ11から取得した複数の顔画像を用いて顔データの特徴を抽出する。特徴量抽出部24は、抽出された顔データの特徴をID登録部25に送信する。処理はステップS117に進み、ID登録部25は、特徴量抽出部24から取得した顔データの特徴を用いて顔IDを登録する。ID登録部25は顔IDの登録が完了したことを示す信号を動画再生部23及び通知部28に送信する。処理はステップS119に進み、動画再生部23はこの信号を受信したとき、動画を停止し、通知部28はユーザへ登録が完了したことを通知する。
【0035】
次に
図11のフローチャートを参照して、顔データを認証するフェーズについて説明する。ステップS201において、入力受付部21は、認証するためのトリガがオンか否かを判定する。「認証するためのトリガがオン」とは、「アクセサリーがオン」、「ユーザが認証ボタン(入力I/F10)を押す」、「車両ドアが開いた後に閉じたことを示す信号の受信」のいずれかである。本実施形態において「アクセサリーがオン」とは、車内に設置された電源スイッチがオンであり、メータとブロアモータを除く全ての電装品が作動する状態と定義される。ただし、「アクセサリーがオン」の定義はこれに限定されない。ユーザが車両に乗り込む前に所持するインテリジェンスキーの解錠スイッチを押したとき、所定信号がコントローラ20に送信される。この所定信号を受信したコントローラ20は電源ポジションを電源オフから所定状態に遷移させる。この状態を「アクセサリーがオン」と定義してもよい。インテリジェンスキーは、ドアの解錠及び施錠を遠隔で操作するために用いられる。インテリジェンスキーは、スマートキーまたはリモートキーと表現される場合もある。また、「車両ドアが開いた後に閉じたことを示す信号の受信」に代えて、「車両ドアが開いたことを示す信号の受信」または「車両ドアが閉じたことを示す信号の受信」がトリガとして採用されてもよい。認証するためのトリガがオンである場合(ステップS201でYES)、処理はステップS203に進み、状態判定部22は車両の状態を判定する。状態判定部22は、顔IDを認証する際の条件を満たすと判定した場合、判定結果を示す信号を動画再生部23に送信する。「顔IDを認証する際の条件を満たす」とは、車両の電源状態が「IGN-ON」であり、かつ、シフトポジションが「P」であることを意味する。なお「顔IDを認証する際の条件を満たす」とは、「アクセサリーがオン」、かつ、シフトポジションが「P」であってもよい。
【0036】
ステップS205~215の処理は、
図10に示すステップS105~115の処理と同様であるため、説明を省略する。ステップS217において、特徴量比較部26はステップS215で抽出された顔データの特徴と、記憶装置14に記憶されている顔データの特徴とを比較する。特徴量比較部26は類似度の最も高い顔IDを認識結果としてID認証部27に出力する。処理はステップS219に進み、ID認証部27は顔IDを認証する。なお、ステップS215において抽出された顔データの特徴が記憶装置14に記載している顔データの特徴と一致しない場合、すなわちステップS215で抽出された顔データと一致する顔IDが存在しない場合、ID認証部27は、ユーザを「GUEST」として認証してもよい。本実施形態において「GUEST」とは、顔IDが登録されている固有のユーザではないことを意味し、ユーザを「GUEST」として認証した場合、各種の設定には初期値が反映される。ID認証部27は顔IDの認証が完了したことを示す信号を動画再生部23及び通知部28に送信する。処理はステップS221に進み、動画再生部23はこの信号を受信したとき、動画を停止し、通知部28はユーザへ認証が完了したことを通知する。
【0037】
(作用効果)
以上説明したように、本実施形態に係る画像処理装置1によれば、以下の作用効果が得られる。
【0038】
画像処理装置1は、ユーザを撮像するカメラ11と、カメラ11によって撮像された画像を用いてユーザの顔データを登録または認証するコントローラ20と、動画を表示するディスプレイと、を備える。コントローラ20は、カメラ11によって撮像された顔の向きが、ユーザがカメラ11に対して正面を向いている状態を基準とした第1角度61、62内であって、且つそれぞれ異なる複数の顔画像を用いてユーザの顔データを登録または認証する。コントローラ20は登録または認証が完了するまで人間の顔を模した画像が顔の向きを変える動画をディスプレイ12に表示する。ユーザの着座位置からカメラ11に向かう方向と、ユーザの着座位置からディスプレイ12に向かう方向とが成す第2角度は、第1角度61、62より小さい。
【0039】
ユーザがディスプレイ12を注視しながら顔を動かしたとしても、顔を動かした角度の範囲は所定角度52の範囲と一部重複する。これにより、顔IDの登録または認証のために必要な画像が速やかに取得される。動画によってユーザに顔を動かすことを働きかけることにより、顔の向きがそれぞれ異なる複数の顔画像を短時間で撮像することが可能となり、顔データの登録に要する時間が短縮される。なお顔の向きがそれぞれ異なる複数の顔画像において、顔の向きはすべて異なる。
【0040】
カメラ11は車内の着座シートの前方に設置される。顔の向きを変える方向には、上下左右方向のいずれか、または上下左右方向の組合せが含まれる(
図4参照)。カメラ11及びディスプレイ12は、車幅方向または車両の高さ方向に並ぶように設置される(
図2参照)。ユーザが運転席に座っているとき、カメラ11は正面からユーザを撮像することが可能となる。
【0041】
コントローラ20は、動画をディスプレイ12に表示しているとき、人間の顔を模した画像が顔の向きを変える速度と同じ速度で顔の向きを変えることをユーザに通知してもよい。通知方法として文字情報による通知、または音声による通知がある。文字情報による通知として、コントローラ20はディスプレイ12に「動画と同じ速度で顔の向きを変えてください」と文字を表示すればよい。音声による通知として、コントローラ20はスピーカ13を介して「動画と同じ速度で顔の向きを変えてください」と音声で通知すればよい。これによりユーザの動きが早すぎる、または遅すぎるといった事態が防止される。
【0042】
コントローラ20は、動画をディスプレイ12に表示しているとき、登録または認証が完了するまで動画と同じように顔の向きを変えることをユーザに通知してもよい。また、コントローラ20は、動画をディスプレイ12に表示しているとき、登録または認証が完了するまで、カメラ11の方向を向いて、動画と同じように上下左右方向に顔の向きを変えることをユーザに通知してもよい。通知方法の一例は上述のS105で説明した。登録または認証が完了する前にユーザが動きを止めることが防止される。ユーザが、カメラ11に対して正面を向いた状態を基準として顔の向きを変えることを促進でき、ユーザが顔を動かした角度の範囲が所定角度52の範囲と重複しやすくなる。顔IDの登録または認証のために必要な画像がより速やかに取得される。
【0043】
本実施形態において、カメラ11によって撮像される顔画像は、向きが異なっていれば方向は問わない。しかし、例えば、上下左右の4方向を向いた顔画像が少なくとも1枚必要という条件が追加されてもよい。この条件において、上方向、下方向、右方向を向いた顔画像は取得されたが、左方向を向いた顔画像は取得されていない場合、コントローラ20は不足している向き(左方向)をユーザに通知してもよい。通知方法としてCG画像が左を向いた場合に色を変えればよい。
【0044】
カメラ11は車内の着座シートの前方に設置される。カメラ11及びディスプレイ12は、車両の前後方向に並ぶように設置されてもよい。ユーザがディスプレイ12を注視するとカメラ11に対しても正面を向くことになる。これにより特徴のある顔画像を撮像しやすくなる。
【0045】
画像処理装置1は、ユーザの座高を検出するセンサをさらに備えてもよい。コントローラ20は、センサによって検出された座高に応じてディスプレイ12に表示する動画を変更してもよい。座高が低いユーザと高いユーザでカメラ11に対する高さが異なる。コントローラ20は、カメラ11からユーザが見える角度に合わせた動画を再生することが可能となる。座高に対応するため、複数の動画が記憶装置14に記憶されている。
【0046】
人間の顔を模した画像が右方向または左方向に首を振る角度のうちどちらか一方の角度は、第2角度より大きくてもよい。ディスプレイ12から見てカメラ11側の方向に首を振る角度を、第2角度より大きくすることにより、第2角度の範囲が所定角度52の範囲より大きくても、ユーザが動画を注視しながら顔を動かす範囲65の一部が所定角度52に重複するため、所定角度52の範囲内でユーザ50の左右の顔の向きが撮像できる。
【0047】
コントローラ20は、カメラ11によって撮像された画像に基づいて、ユーザの視線方向がカメラ11に向かっているか、またはディスプレイ12に向かっているかを判定してもよい。コントローラ20は判定結果に基づいてディスプレイ12に表示する動画を変更してもよい。これによりコントローラ20はユーザの視線方向に対応した動画を再生することが可能となる。ユーザの視線方向に対応するため、複数の動画が記憶装置14に記憶されている。
【0048】
コントローラ20は、ユーザ50の視線方向がディスプレイ12に向かっていると判定した場合に、人間の顔を模した画像が右方向または左方向に首を振る角度のうちどちらか一方の角度を第2角度より大きくしてもよい。これにより、コントローラ20はユーザ50の視線方向がディスプレイ12に向かっている場合に、ディスプレイ12から見てカメラ11側の方向に首を振る角度が、第2角度より大きい動画を再生することが可能となる。ユーザが動画を注視しながら顔を動かす範囲65の一部が所定角度52に重複するため、所定角度52の範囲内でユーザ50の左右の顔の向きが撮像できる。
【0049】
コントローラ20は、ユーザの視線方向がディスプレイ12に向かっていると判定した場合に、人間の顔を模した画像が右方向または左方向に首を振る角度のうちどちらか一方とは逆方向の角度を第2角度より小さくしてもよい。ディスプレイ12から見てカメラ11側と逆方向に首を振る角度を、第2角度より小さくすることで、ユーザが動画を注視しながら顔を動かす範囲66が小さくなり、所定角度52外の顔の向きの画像が撮像されることを抑制できる。顔IDの登録又は認証に不要な画像処理を抑制でき、コントローラ20の処理の負荷を軽減できる。
【0050】
人間の顔を模した画像が顔の向きを変える動画において、首から上の領域40が動く一方で、首から下の領域41は動かない。これによりユーザは動画に合わせて顔を動かしやすくなる。
【0051】
上述の実施形態に記載される各機能は、1または複数の処理回路により実装され得る。処理回路は、電気回路を含む処理装置等のプログラムされた処理装置を含む。処理回路は、また、記載された機能を実行するようにアレンジされた特定用途向け集積回路(ASIC)や回路部品等の装置を含む。
【0052】
上記のように、本発明の実施形態を記載したが、この開示の一部をなす論述及び図面はこの発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施の形態、実施例及び運用技術が明らかとなろう。
【0053】
例えば、画像処理装置1は車両に搭載される装置として説明したが、これに限定されない。画像処理装置1は端末装置(例えばスマートフォン)であってもよい。画像処理装置1が端末装置である場合、端末装置はディスプレイに動画を再生しながらカメラでユーザを撮像すればよい。顔IDの登録または認証に係る処理は、端末装置に内蔵されたコントローラによって実現される。
【0054】
図12を参照して顔IDの利用方法の一例について説明する。
図12に示すように車両のキーID(キー70から送信されるID)と車載機器とを紐付けて、キーIDに応じて車載機器及び機能を制御する技術が知られている。キーIDと紐付けられる車載機器としてメータ74、HUD75、ミラー78、シート80、ステアリングホイール81などが挙げられる。また、キーIDと紐付けられる機能として、空調76、ドライブモード77などが挙げられる。ここで1台の車両を複数の人間が共有して利用する場合がある。例えば、家族による共有である。1台の車両を共有する場合、通常キーは一つである。したがって、キーIDだけでは複数の人間の好みに応じた車載機器及び機能の設定はできない。
【0055】
そこで顔IDを利用する。顔IDを使ってIVI72(in-vehicle infotainment)にログインすることにより、顔IDと紐付けられたユーザIDが利用可能となる。このユーザIDに車載機器及び機能の設定を紐付ければよい。キーIDとユーザID(顔ID)の2つのIDを利用することにより、1台の車両を共有する場合であっても、それぞれのユーザの好みに応じた車載機器及び機能の設定が可能となる。
【符号の説明】
【0056】
1 画像処理装置、11 カメラ、12 ディスプレイ、13 スピーカ、14 記憶装置、20 コントローラ、21 入力受付部、22 状態判定部、23 動画再生部、24 特徴量抽出部、25 ID登録部、26 特徴量比較部、27 ID認証部、28 通知部