(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-12-05
(54)【発明の名称】情報処理装置、情報処理方法および記憶媒体
(51)【国際特許分類】
G07C 9/37 20200101AFI20221128BHJP
【FI】
G07C9/37
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022520400
(86)(22)【出願日】2020-10-02
(85)【翻訳文提出日】2022-04-01
(86)【国際出願番号】 JP2020037555
(87)【国際公開番号】W WO2021066148
(87)【国際公開日】2021-04-08
(32)【優先日】2019-10-04
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100106909
【氏名又は名称】棚井 澄雄
(74)【代理人】
【識別番号】100134544
【氏名又は名称】森 隆一郎
(74)【代理人】
【識別番号】100149548
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100162868
【氏名又は名称】伊藤 英輔
(72)【発明者】
【氏名】ランガナス クリス
(72)【発明者】
【氏名】ガンジー カナン ヴェーラナン
(72)【発明者】
【氏名】チャンドラセカラン アルーン
(72)【発明者】
【氏名】バグテス ロディ
【テーマコード(参考)】
3E138
【Fターム(参考)】
3E138AA01
3E138CA03
3E138DA10
3E138DB01
3E138JA01
3E138JB03
3E138JB08
3E138JB16
3E138JC01
3E138JD01
3E138JD05
(57)【要約】
装置は、1つまたは複数の命令を記憶するメモリと、前記1つまたは複数の命令を実行して、各々が1人または複数の人物のうちの1人の人物に対応する、1つまたは複数のカメラによって第1の時刻に撮像された1つまたは複数の顔を含む第1の画像を取得し、前記カメラから取得された前記画像内の前記1つまたは複数の顔に対して顔認識動作を行うことによって、前記1人または複数の人物の中から第1の人物を検出し、前記第1の人物の顔領域に対応する身体領域を検出し、前記第1の時刻の後の第2の時刻に前記1つまたは複数のカメラによって撮像された第2の画像内の前記身体領域を追跡し、前記身体領域が障壁に接近しているとの判定に基づいて、前記障壁を開放するように制御するための情報を出力するように構成されたプロセッサとを備える。
【特許請求の範囲】
【請求項1】
1つまたは複数の命令を記憶するメモリと、
前記1つまたは複数の命令を実行して、
各々が1人または複数の人物のうちの1人の人物に対応する、1つまたは複数のカメラによって第1の時刻に撮像された1つまたは複数の顔を含む第1の画像を取得し、
前記カメラから取得された前記画像内の前記1つまたは複数の顔に対して顔認識動作を行うことによって、前記1人または複数の人物の中から第1の人物を検出し、
前記第1の人物の顔領域に対応する身体領域を検出し、
前記第1の時刻の後の第2の時刻に前記1つまたは複数のカメラによって撮像された第2の画像内の前記身体領域を追跡し、
前記身体領域が障壁に接近しているとの判定に基づいて、前記障壁を開放するように制御するための情報を出力する
ように構成されたプロセッサと
を備える、装置。
【請求項2】
前記顔認識動作を行うことが、
前記1つまたは複数の顔に対応する顔特徴を前記第1の画像から抽出することと、
前記顔特徴が、複数の登録された顔特徴のうち、1つの登録された顔特徴と一致するかどうかを検出することと
を含む、請求項1に記載の装置。
【請求項3】
前記第2画像内の前記身体領域を追跡することが、
前記第1の画像内の前記顔領域を前記第1の画像内の身体領域と関連付けることと、
前記第2の画像内の前記身体領域を前記第1の画像内の前記身体領域と一致させることと
を含む、請求項1に記載の装置。
【請求項4】
前記障壁を制御するための情報を出力することが、
前記第2の画像内の前記身体領域の特徴と、ストレージに記憶された複数の身体領域のうちの1つの身体領域の特徴との一致に基づいて、前記ゲートを開放するための制御信号を出力することを含む、請求項1に記載の装置。
【請求項5】
前記複数の身体領域の各々が、以前に撮像された1つまたは複数の画像からのそれぞれの顔領域にあらかじめ関連付けられている、請求項4に記載の装置。
【請求項6】
前記1つまたは複数の顔が、前記1つまたは複数のカメラによって前記第1の時刻に撮像された複数の顔を含み、前記複数の顔が、複数の人物にそれぞれ対応する、請求項1に記載の装置。
【請求項7】
前記身体領域が、前記第1の人物が顔認識によって検出された後に検出される、請求項1に記載の装置。
【請求項8】
前記身体領域が、前記第1の人物が顔認識によって検出される前に検出される、請求項1に記載の装置。
【請求項9】
前記身体領域が、前記第1の人物が顔認識によって検出されると同時に検出される、請求項1に記載の装置。
【請求項10】
1つまたは複数の命令を記憶するメモリと、
前記1つまたは複数の命令を実行して、
障壁に接近している複数の人物にそれぞれ対応し、各々が特徴を含む複数の顔を含む、カメラによって撮像された画像を取得し、
第1の人物についての前記特徴のサイズに基づいて、前記複数の人物のうち前記カメラに最も近い人物として第1の人物を検出し、
前記取得した画像からの前記第1の人物の前記顔の情報と各々が前記画像を取得する前に登録された人物に対応する複数の登録された情報との比較の結果に基づいて、前記障壁を制御するための情報を出力するように構成されたプロセッサと
を備える、装置。
【請求項11】
前記特徴の前記サイズが顔領域の面積に対応する、請求項10に記載の装置。
【請求項12】
前記特徴の前記サイズが目の距離に対応する、請求項10に記載の装置。
【請求項13】
各々が1人または複数の人物のうちの1人の人物に対応する、1つまたは複数のカメラによって第1の時刻に撮像された1つまたは複数の顔を含む第1の画像を取得することと、
前記カメラから取得された前記画像内の前記1つまたは複数の顔に対して顔認識動作を行うことによって、前記1人または複数の人物の中から第1の人物を検出することと、
前記第1の人物の顔領域に対応する身体領域を検出することと、
前記第1の時刻の後の第2の時刻に前記1つまたは複数のカメラによって撮像された第2の画像内の前記身体領域を追跡することと、
前記身体領域が障壁に接近しているとの判定に基づいて、前記障壁を開放するように制御するための情報を出力することと
を含む、方法。
【請求項14】
コンピュータに、
各々が1人または複数の人物のうちの1人の人物に対応する、1つまたは複数のカメラによって第1の時刻に撮像された1つまたは複数の顔を含む第1の画像を取得することと、
前記カメラから取得された前記画像内の前記1つまたは複数の顔に対して顔認識動作を行うことによって、前記1人または複数の人物の中から第1の人物を検出することと、
前記第1の人物の顔領域に対応する身体領域を検出することと、
前記第1の時刻の後の第2の時刻に前記1つまたは複数のカメラによって撮像された第2の画像内の前記身体領域を追跡することと、
前記身体領域が障壁に接近しているとの判定に基づいて、前記障壁を開放するように制御するための情報を出力することと
を実行させる、プログラム。
【請求項15】
障壁に接近している複数の人物にそれぞれ対応し、各々が特徴を含む複数の顔を含む、カメラによって撮像された画像を取得することと、
第1の人物についての前記特徴のサイズに基づいて、前記複数の人物のうち前記カメラに最も近い人物として第1の人物を検出することと、
前記取得した画像からの前記第1の人物の前記顔と各々が前記画像を取得する前に登録された人物に対応する複数の登録された情報との比較情報の結果に基づいて、前記障壁を制御するための情報を出力することと
を含む、方法。
【請求項16】
コンピュータに、
障壁に接近している複数の人物にそれぞれ対応し、各々が特徴を含む複数の顔を含む、カメラによって撮像された画像を取得することと、
第1の人物についての前記特徴のサイズに基づいて、前記複数の人物のうち前記カメラに最も近い人物として第1の人物を検出することと、
前記取得した画像からの前記第1の人物の前記顔の情報と各々が前記画像を取得する前に登録された人物に対応する複数の登録された情報との比較の結果に基づいて、前記障壁を制御するための情報を出力することと
を実行させる、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理装置、情報処理方法および記憶媒体に関する。具体的には、本開示は、カメラによって撮像された画像を使用して人物の認証を行う情報処理装置、情報処理方法および記憶媒体に関する。
【背景技術】
【0002】
近年、空港等の施設では、セキュリティ検査エリアなどの利用者が通過してもよい通路を制御するゲート装置が設けられている。従来のゲート装置では、カメラから取得した顔画像と、パスポートなどの登録画像から取得した顔画像とを比較することによって、顔認証動作が行われてもよい。しかし、従来のゲート装置では、顔認証動作を行うために、施設のスタッフがカメラを操作して乗客または来訪者の顔画像を撮像する必要がある。顔認証を行うこの方法は、各乗客または来訪者が1人ずつカメラの所で停止する必要があるため、遅延をもたらす。したがって、乗客または来訪者がゲート装置を素早く通過することが困難である。
【発明の概要】
【発明が解決しようとする課題】
【0003】
上述の問題に鑑みて、本開示の1つまたは複数の態様は、乗客または訪問者などのユーザがカメラの前で停止する必要なくゲート装置を通過することを可能にし、したがってユーザの遅延を低減するためのゲート装置、ゲート装置の制御方法、および記憶媒体を提供する。
【課題を解決するための手段】
【0004】
本開示の一態様によれば、1つまたは複数の命令を記憶するメモリと、前記1つまたは複数の命令を実行して、各々が1人または複数の人物のうちの1人の人物に対応する、1つまたは複数のカメラによって第1の時刻に撮像された1つまたは複数の顔を含む第1の画像を取得し、前記カメラから取得された前記画像内の前記1つまたは複数の顔に対して顔認識動作を行うことによって、前記1人または複数の人物の中から第1の人物を検出し、前記第1の人物の顔領域に対応する身体領域を検出し、前記第1の時刻の後の第2の時刻に前記1つまたは複数のカメラによって撮像された第2の画像内の前記身体領域を追跡し、前記身体領域が障壁に接近しているとの判定に基づいて、前記障壁を開放するように制御するための情報を出力するように構成されたプロセッサとを備える装置が提供される。
【0005】
本開示の別の態様によれば、1つまたは複数の命令を記憶するメモリと、前記1つまたは複数の命令を実行して、それぞれ複数の人物に対応する、1つまたは複数のカメラによって第1の時刻に撮像された複数の顔を含む第1の画像を取得し、前記第1の画像内の前記複数の顔に対して顔認識動作を行うことによって、前記複数の人物の中から第1の人物を検出し、前記第1の人物の顔領域に対応する身体領域を検出し、前記第1の時刻の後の第2の時刻に前記1つまたは複数のカメラによって撮像された第2の画像内の前記身体領域を追跡し、前記身体領域が障壁に接近しているとの判定に基づいて、前記障壁を開放するように制御するための情報を出力するように構成されたプロセッサとを備える装置が提供される。
【0006】
本開示の別の態様によれば、1つまたは複数の命令を記憶するメモリと、前記1つまたは複数の命令を実行して、障壁に接近している複数の人物にそれぞれ対応し、各々が特徴を含む複数の顔を含む、カメラによって撮像された画像を取得し、第1の人物についての前記特徴のサイズに基づいて、前記複数の人物のうち前記カメラに最も近い人物として第1の人物を検出し、前記取得した画像からの前記第1の人物の前記顔の情報と各々が前記画像を取得する前に登録された人物に対応する複数の登録された情報との比較の結果に基づいて、前記障壁を制御するための情報を出力するように構成されたプロセッサとを備える装置が提供される。
【図面の簡単な説明】
【0007】
【
図1A】一実施形態によるゲート装置の一例を示す図である。
【
図1B】一実施形態によるゲート装置の一例を示す図である。
【
図2】本実施形態による情報処理装置10の機能ブロック図である。
【
図3】本実施形態による情報処理装置によって行われる処理の概要を示すフローチャートである。
【
図4A】
図3の実施形態による情報処理装置によって行われる処理の一例を示す図である。
【
図4B】
図3の実施形態による情報処理装置によって行われる処理の一例を示す図である。
【
図4C】
図3の実施形態による情報処理装置によって行われる処理の一例を示す図である。
【
図4D】
図3の実施形態による情報処理装置によって行われる処理の一例を示す図である。
【
図5】別の実施形態によるデータ構造の一例である。
【
図6】さらに別の実施形態による情報処理装置によって行われる処理を示すフローチャートである。
【
図7A】
図6の実施形態による情報処理装置によって行われる処理の一例を示す図である。
【
図7B】
図6の実施形態による情報処理装置によって行われる処理の一例を示す図である。
【
図8】さらに別の実施形態による情報処理装置によって行われる処理の概要を示すフローチャートである。
【
図9】例示的な実施形態によるゲート制御装置1のハードウェア構成の一例を示すブロック図である。
【発明を実施するための形態】
【0008】
本開示の1つまたは複数の例示的な実施形態を、図面を参照して以下に説明する。図面全体を通して、同一の構成要素または対応する構成要素には同一の参照符号を付し、その説明を省略するかまたは簡略化する場合がある。
【0009】
図1Aおよび
図1Bは、非限定的で例示的な実施形態によるゲート装置1の一例を示す。
図1Aに示すように、ゲート装置1は、通路3を通る交通を制御するために通路3に設けられたゲート2を含んでもよい。ゲート装置1は、通路3を歩行するユーザの顔認識を行うためのカメラ4および情報処理装置5をさらに含んでもよい。一実施形態によれば、情報処理装置5は、人物がゲート2に接近している間に、第1の位置P1において人物またはユーザ(U)の第1の画像を取得してもよい。第1の画像は、カメラ4によって第1の時刻(t1)に撮像されてもよい。第1の画像は、ゲート装置付近の人物の1つまたは複数の顔を含んでもよく、1つまたは複数の顔の各々は、複数のユーザのうち1人のユーザに対応する。
【0010】
一実施形態によれば、情報処理デバイス5は、第1の画像内の顔に対して顔認識動作を行うことによって、複数のユーザの中から第1のユーザを検出するように構成されてもよい。例えば顔認識動作は、被認証ユーザ(U)と呼ばれる、ゲートを通過することを許可された人物としてのユーザの顔を認証するように構成された情報処理デバイス5によって全体的または部分的に行われる認証動作の一部であってもよい。
【0011】
一実施形態によれば、情報処理デバイス5は、被認証ユーザ(U)の領域を身体領域として検出してもよい。この身体領域は、被認証ユーザ(U)の顔領域と関連付けることができる。被認証ユーザ(U)の身体領域を対応する顔領域と関連付けることにより、被認証ユーザ(U)を、当該身体領域を追跡することによって追跡することができる。ユーザが通路の第2の位置P2にいる場合、第2の画像をカメラ4によって取得することができる。第2の画像は、第1の時刻(t1)に続く第2の時刻(t2)に撮像されてもよく、同じカメラ4で撮像されてもよいし、第1の画像を撮像したカメラ4とは異なる撮像デバイスで撮像されてもよい。第2の画像は、身体領域を含んでもよいが、被認証ユーザ(U)の顔領域を含まなくてもよい。これは、時間t1と時間t2との間の被認証ユーザ(U)の動きが原因である可能性もあり、または、被認証ユーザ(U)の顔が時間t2ではカメラ4に十分に正対していないか、顔が第2の画像において不明瞭であるか、または時間t2の第2の画像に存在しないことが原因である可能性もある。身体部分領域は被認証ユーザ(U)に関連付けられているので、顔領域が第2の画像に存在しない場合であっても、被認証ユーザ(U)を第2の画像において追跡することができる。情報処理デバイス5は、追跡される身体領域が障壁に接近しているという判定に基づいて、ゲート2を開放するように制御するための情報を出力してもよい。このように、情報処理デバイス5は、ユーザが許可された人物として認証された後、ユーザを繰り返し認証する必要がない。例えば、被認証ユーザの身体領域が追跡されているので、人物が位置P2においてカメラ4に正対していない場合であっても、ゲート2は開放されてもよい。
【0012】
図1Bでは、情報処理デバイス5が、位置P2の第2の画像において追跡された身体領域が第1の画像において認証されたユーザの顔領域と関連付けられていないと判定した場合に、ゲート1が開くのを防ぐように情報処理デバイス5を構成することができる。例えば、情報処理デバイス5が、カメラ4から取得した第1の画像内の顔に対して顔認識動作を行うことができない場合、情報処理デバイス5は第1の画像内の顔に対応する身体領域を追跡しなくてもよい。したがって、情報処理デバイス5は、ユーザに対する追加の顔認識動作が行われ、かつユーザが認証されない限り、ゲート1を開放しない。
【0013】
図2は、例示的な実施形態による情報処理装置10の機能ブロック図である。情報処理装置10は自動ゲート装置1の一部であってもよい。一実施形態によれば、情報処理装置は、1つまたは複数のプロセッサ(
図9のCPU102または他のプロセッサなど)およびメモリ(
図9のRAM104または他のメモリなど)を含んでもよい。情報処理装置10は、画像取得ユニット121と、検出ユニット122と、抽出ユニット123と、関連付けユニット125と、コントローラ126と、表示画像生成ユニット127と、記憶ユニット129とを有してもよい。一実施形態によれば、CPU102は、メモリに記憶された1つまたは複数の命令を実行して、様々なユニットを実装してもよい。ユニットおよびユニットによって行われる動作は例示のために提供されているが、本開示は、ユニットまたはユニットによって行われる動作に限定されない。他の実施形態によれば、本開示の新規の特徴は、上述のユニットおよび他のユニットを含むユニットの様々な組合せによって行われてもよい。
【0014】
一実施形態によれば、画像取得ユニット121は画像をカメラ4から取得してもよく、検出ユニット122はカメラ4から取得された画像内の人物を検出してもよく、抽出ユニット123は画像内の顔特徴および身体特徴などの特徴を抽出してもよく、関連付けユニット125は抽出された顔特徴および身体特徴を互いに関連付けてもよく、コントローラ126はゲート2を開閉するように制御してもよく、表示画像生成ユニット127はディスプレイ110(
図9に示す)に表示される情報を生成してもよく、記憶ユニット129は情報を記憶してもよい。
【0015】
図3は、例示的な実施形態による情報処理装置10によって行われる処理の概要を示すフローチャートである。
図1および
図2を参照して、
図3のフローチャートに沿って、情報処理装置10によって行われる処理の概要について説明する。
【0016】
図3のS310では、情報処理装置10はカメラ4から第1の画像を取得してもよい。一実施形態によれば、第1の画像を取得する方法は、画像取得ユニット121によって行われる以下の動作を含んでもよい。例えば、画像取得ユニット121はカメラ4から第1の画像を取得する。この処理は、
図4Aの図に対応してもよい。
図4Aは、第1の時刻に撮像され、かつ記憶ユニット129に記憶された第1の画像を示す。一実施形態によれば、取得された第1の画像は認識対象の顔を含んでもよい。対象は(
図1Aおよび
図1Bに示す)ゲート1に接近していてもよい。他の実施形態によれば、取得された第1の画像は、複数の認識対象のうち、複数の顔の各々が対象に対応する複数の顔を含んでもよい。一実施形態によれば、認識対象は人物であってもよい。
【0017】
図3のS320では、情報処理装置10は第1の画像内の人物を検出する。この処理は、
図4Bの図に対応する。一実施形態によれば、情報処理装置10は、第1の画像に対する顔認識を行うことによって人物を検出してもよい。
【0018】
顔認識を行う方法は、検出ユニット122および抽出ユニット123によって行われる以下の動作を含んでもよい。例えば抽出ユニット123は、画像取得ユニット121によって取得された第1の画像から顔特徴を抽出し、検出ユニット122は、抽出ユニット123によって抽出された顔特徴を取得し、顔特徴が、複数の登録された顔特徴のうち、1つの登録された顔特徴と一致するかどうかを検出する。複数の登録された顔特徴の各々は、以前に登録された複数の人物の中の人物の顔に対応してもよい。登録された顔特徴は記憶ユニット129に記憶されてもよい。
【0019】
S330では、情報処理装置10は、第2の時刻に撮像された第2の画像内の身体領域を追跡する。この処理は、
図4Cの図に対応する。一実施形態によれば、情報処理装置10は、第1の画像内の顔領域を第1の画像内の身体領域と関連付け、かつ第2の画像内の身体領域を第1の画像内の身体領域と一致させることによって、第2の画像内の身体領域を追跡してもよい。
【0020】
一実施形態によれば、身体追跡を行う方法は、画像取得ユニット121、検出ユニット122、抽出ユニット123および関連付けユニット125によって行われる以下の動作を含んでもよい。例えば、抽出ユニット123は第1の画像内の対象の身体領域を抽出してもよい。身体領域を抽出する動作は、検出ユニットが第1の画像内の顔特徴と登録された顔特徴との一致を検出した後に行われてもよい。別の実施形態によれば、身体領域を抽出する動作は、検出ユニットが第1の画像内の顔特徴と登録された顔特徴との一致を検出する前に、または検出ユニットが第1の画像内の顔特徴と登録された顔特徴との一致を検出しながら同時に行われてもよい。
【0021】
一実施形態によれば、関連付けユニット125は、抽出された身体領域と第1の画像内の顔領域とを関連付ける。例えば関連付けユニット125は、顔領域および身体領域の1つまたは複数の特性を分析することによって、身体領域が顔領域に対応すると判定する。例えば、関連付けユニット125が、顔領域の1つまたは複数の特性が身体領域の1つまたは複数の特徴と類似すると判定した場合、関連付けユニット125は顔領域と身体領域とを関連付けてもよい。別の実施形態によれば、関連付けユニット125は、顔領域と身体領域との近さに基づいて、身体領域が顔領域に対応すると判定してもよい。
【0022】
一実施形態によれば、関連付けユニット125は、関連付けられた顔領域および身体領域を記憶ユニット129に記憶してもよい。例えば
図5に示すように、記憶ユニット129は、検出された人物の識別情報に関連付けて、顔領域および身体領域を記憶してもよい。関連付けられた顔領域および身体領域は、記憶ユニット129に一時的に記憶されてもよい。
【0023】
一実施形態によれば、画像取得ユニット121は、第2の時刻にカメラ4によって撮像された第2の画像を取得してもよい。第2の時刻は第1の時刻とは異なる。一実施形態によれば、第2の時刻は第1の時刻の後である。一実施形態によれば、第2の画像は、第1の画像を撮像するカメラとは異なるカメラなどの画像取得デバイスによって撮像されてもよい。
【0024】
一実施形態によれば、抽出ユニット123は第2の画像内の身体領域の特徴を抽出してもよく、検出ユニット122は抽出ユニット123から第2の画像内の身体領域の特徴を取得し、かつ第2の画像内の身体領域の特徴が記憶ユニット129に記憶された身体領域の特徴と一致するかどうかを検出してもよい。したがって、第2の画像内の身体領域と、記憶ユニット129から取得した身体領域とが一致する場合、検出ユニット122は、第1の画像において以前に検出された対象の識別を取得してもよい。したがって、情報処理装置10は、第1の画像および第2の画像において抽出された身体領域を使用して対象を追跡してもよい。
【0025】
他の実施形態によれば、情報処理装置10は、第2の画像内の顔特徴が検出不可能である場合に身体追跡動作を行ってもよい。この処理は、
図4Dの図に対応してもよい。例えば抽出ユニット123は、第2の画像内の顔特徴を抽出してもよく、検出ユニット122は、抽出ユニット123から第2の画像内の顔特徴を取得し、かつ顔特徴が顔認識を行うのに十分な情報を有していないと判定してもよい。例えばカメラに接近している人物がカメラに正対していない場合、検出ユニット122は、人物の顔から十分な顔特徴を抽出することができなかったと判定してもよい。一実施形態によれば、検出ユニット122は、人物の顔がカメラから45度を超えて逸れた場合、情報が顔検出に不十分であると判定してもよい。
【0026】
S340では、情報処理装置10は、身体領域の追跡された動きに基づいて、ゲート2を制御するための情報を出力してもよい。この処理は、
図1Aおよび
図1Bの図に対応してもよい。一実施形態によれば、ゲートを制御する方法はコントローラ126によって行われてもよい。例えばコントローラ126は、第2の画像内の身体領域の特徴と、記憶ユニット129から取得した身体領域の特徴とが一致するかどうかを示す情報を検出ユニット122から取得してもよい。一致する場合、コントローラ126は、
図1Aに示すようにゲート2を開放するための制御信号を出力してもよい。その一方で、一致しない場合、コントローラ126は
図1Bに示すようにゲート2を閉鎖状態に維持してもよい。
【0027】
図4A~
図4Dは、本実施形態による情報処理装置によって行われる処理の一例を示す。
図4Aでは、情報処理デバイス1は画像401を取得する。一実施形態によれば、取得された画像はディスプレイ402に表示されてもよい。
【0028】
図4Bでは、情報処理装置10は第1の画像内の人物を検出してもよい。一実施形態によれば、情報処理装置10は、第1の画像に対する顔認識を行うことによって人物を検出してもよい。例えば情報処理装置は、第1の画像内の顔領域403の顔特徴を抽出し、顔特徴が、複数の登録された顔特徴のうち、1つの登録された顔特徴と一致するかどうかを検出してもよい。
【0029】
図4Cでは、情報処理装置10は顔領域403を第1の画像内の身体領域404と関連付けてもよい。一実施形態によれば、情報処理装置10は、関連付けられた顔領域403および身体領域404を記憶ユニット129に記憶してもよい。
【0030】
図4Dでは、情報処理装置10は、第2の画像内の身体領域405の特徴を、記憶ユニット29に記憶された第1の画像内の身体領域の特徴と一致させることによって、第2の画像内の身体領域405を追跡してもよい。このように、第2の画像内の顔特徴406が不可能である場合であっても、情報処理装置10は身体追跡動作を行ってもよい。
【0031】
図5は、顔特徴情報501と身体特徴情報502とを互いに関連付けるデータ構造を示す。例えば顔特徴情報501および身体特徴情報502は、識別情報503によって互いに関連付けられ、かつ記憶ユニット129に記憶されてもよい。識別情報503は、関連付けられた顔特徴情報501および身体特徴情報502が認証された人物に対応するかどうかをさらに識別するために使用されてもよい。
【0032】
図6は、別の例示的な実施形態による情報処理装置10によって行われる処理の概要を示すフローチャートである。
図1および
図2を参照して、
図6のフローチャートに沿って、情報処理装置10によって行われる処理の概要について説明する。
【0033】
図6のS610では、(
図1Aおよび
図1Bに示すように)情報処理装置10はカメラ4から第1の画像を取得してもよい。一実施形態によれば、第1の画像を取得する方法は、画像取得ユニット121によって行われる以下の動作を含んでもよい。例えば、画像取得ユニット121はカメラ4から第1の画像を取得してもよい。取得される第1の画像は、複数の認識対象のうち、顔の各々が対象に対応する複数の顔を含んでもよい。一実施形態によれば、認識対象は人物であってもよい。
【0034】
図6のS620では、情報処理装置10は、第1の画像内の前方人物、すなわち、複数の人物のうち、撮像デバイスに最も近い人物を識別してもよい。この処理は、
図7Aおよび
図7Bの図に対応してもよい。
【0035】
一実施形態によれば、前方人物を識別する方法は、検出ユニット122および抽出ユニット123によって行われる以下の動作を含んでもよい。例えば抽出ユニット123は、各々が画像取得ユニット121によって取得された第1の画像内の複数の顔のうちの1つに対応する複数の顔特徴を抽出してもよい。一実施形態によれば、検出ユニット122は、抽出ユニット123によって抽出された複数の顔特徴を取得し、かつカメラに最も近い人物に対応する顔特徴を識別してもよい。カメラに接近している複数の人物のうち、カメラに最も近いこの人物を前方人物として識別してもよい。一実施形態によれば、検出ユニット122は、複数の顔特徴の各々に対応するサイズを比較することによって、前方人物を識別してもよい。例えば検出ユニット122は、複数の顔特徴の各々が占める面積を比較し、かつ、複数の特徴のうち、最大面積を有する顔特徴をカメラに最も近い顔特徴として判定してもよい。別の実施形態によれば、検出ユニット122は、複数の顔特徴の各々における2つの特徴点間の距離を比較し、かつ、複数の特徴のうち、最大の距離を有する顔特徴をカメラに最も近い顔特徴として判定してもよい。例えば、距離は顔特徴における2つの目の間の距離であってもよい。
【0036】
S630では、情報処理装置10は、前方人物の顔特徴の情報と、複数の登録された情報とを比較することによって、前方人物に対する顔認識を行ってもよい。一実施形態によれば、顔認識を行う方法は、検出ユニット122によって行われる以下の動作を含んでもよい。例えば検出ユニット122は、抽出ユニット123によって抽出された前方人物の顔特徴を取得し、顔特徴が複数の登録された顔特徴のうち、1つの登録された顔特徴と一致するかどうかを検出してもよい。複数の登録された顔特徴の各々は、以前に登録された複数の人物の中の人物の顔に対応してもよい。登録された顔特徴は記憶デバイス106に記憶されてもよい。
【0037】
S640では、情報処理装置10は、顔認識の結果に基づいてゲート114を制御するための情報を出力してもよい。この処理は、
図1Aおよび
図1Bの図に対応してもよい。一実施形態によれば、ゲートを制御する方法はコントローラ126によって行われてもよい。例えばコントローラ126は、前方人物の顔特徴と、以前に登録された複数の顔特徴とが一致するかどうかを示す情報を検出ユニット122から取得してもよい。一致する場合、コントローラ126は、
図1Aに示すようにゲート2を開放するための制御信号を出力してもよい。その一方で、一致しない場合、コントローラ126は
図1Bに示すようにゲート2を閉鎖状態に維持してもよい。
【0038】
図7A~
図7Bは、本実施形態による前方人物を識別するために情報処理装置によって行われる処理の一例を示す。
【0039】
図7Aでは、情報処理装置10は画像701を取得し、かつ、各々が画像701内の複数の顔のうちの1つに対応する複数の顔特徴(702a、702bおよび702c)を抽出してもよい。情報処理装置10は、複数の顔特徴(702a、702bおよび702c)の各々に対応する特徴のサイズを比較することによって、前方人物を識別してもよい。例えば
図7Bに示すように、情報処理装置10は、複数の顔特徴の各々が占める面積を比較し、かつ、複数の特徴のうち、最大面積を有する顔特徴702bをカメラに最も近い顔特徴として判定してもよい。
【0040】
図8は、別の実施形態による情報処理装置10によって行われる処理の概要を示すフローチャートである。
図1および
図2を参照して、
図8のフローチャートに沿って、情報処理装置10によって行われる処理の概要について説明する。
【0041】
図8のS810では、情報処理装置10はカメラ4から第1の画像を取得してもよい。一実施形態によれば、画像取得ユニット121はカメラ4から第1の画像を取得してもよい。取得された第1の画像は、第1の時刻に撮像され、かつ記憶ユニット129に記憶されてもよい。一実施形態によれば、取得された第1の画像は認識対象の顔を含んでもよい。対象はゲート2に接近していてもよい。他の実施形態によれば、取得された第1の画像は、複数の認識対象のうち、顔の各々が対象に対応する複数の顔を含んでもよい。一実施形態によれば、認識対象は人物であってもよい。
【0042】
図8のS820では、情報処理装置10は第1の画像内の前方人物を識別してもよい。一実施形態によれば、検出ユニット122は、各々が画像取得ユニット121によって取得された第1の画像内の複数の顔のうちの1つに対応する複数の顔領域を抽出してもよい。一実施形態によれば、検出ユニット122は、抽出ユニット123によって抽出された複数の顔領域を取得し、かつカメラに最も近い人物に対応する顔領域を識別してもよい。カメラに接近している複数の人物のうち、カメラに最も近いこの人物を前方人物として識別してもよい。一実施形態によれば、検出ユニット122は、複数の顔領域の各々に対応するサイズを比較することによって、前方人物を識別してもよい。例えば検出ユニット122は、複数の顔領域の各々が占める面積を比較し、かつ、複数の特徴のうち、最大面積を有する顔領域をカメラに最も近い顔領域として判定してもよい。別の実施形態によれば、検出ユニット122は、複数の顔領域の各々における2つの特徴点間の距離を比較し、かつ、複数の領域のうち、最大の距離を有する顔領域をカメラに最も近い顔領域として判定してもよい。例えば、距離は顔領域における2つの目の間の距離であってもよい。
【0043】
図8のS830では、情報処理装置10は、第1の画像内の前方人物の顔特徴および身体特徴を抽出してもよい。他の実施形態によれば、情報処理装置10は、第1の画像から複数各々の顔特徴および身体特徴を抽出してもよい。
【0044】
図8のS840では、情報処理装置10は、前方人物の顔特徴に対して顔認識を行ってもよい。例えば抽出ユニット123は、取得された第1の画像内の前方人物の顔特徴を抽出してもよく、検出ユニット122は、抽出ユニット123によって抽出された顔特徴を取得し、かつ顔特徴が、複数の登録された顔特徴のうち、1つの登録された顔特徴と一致するかどうかを検出してもよい。複数の登録された顔特徴の各々は、以前に登録された複数の人物の中の人物の顔に対応してもよい。登録された顔特徴は記憶デバイス106に記憶されてもよい。
【0045】
図8のS850では、情報処理装置10は、第1の画像内の前方人物の身体特徴を抽出し、顔特徴と身体特徴とを関連付けてもよい。一実施形態によれば、身体特徴を抽出する動作はS840における顔認識動作の後に行われてもよい。別の実施形態によれば、身体特徴を抽出する動作は、検出ユニットが第1の画像内の顔特徴と登録された顔特徴との一致を検出する前に、または検出ユニットが第1の画像内の顔特徴と登録された顔特徴との一致を検出しながら同時に行われてもよい。
【0046】
一実施形態によれば、関連付けユニット125は、抽出された身体特徴と第1の画像内の顔特徴とを関連付けてもよい。例えば関連付けユニット125は、顔特徴および身体特徴の1つまたは複数の特性を分析することによって、身体特徴が顔特徴に対応すると判定する。例えば、関連付けユニット125が、顔特徴の1つまたは複数の特性が身体特徴の1つまたは複数の特徴と類似すると判定した場合、関連付けユニット125は顔特徴と身体特徴とを関連付けてもよい。別の実施形態によれば、関連付けユニット125は、顔特徴と身体特徴との近さに基づいて、身体特徴が顔特徴に対応すると判定してもよい。
【0047】
一実施形態によれば、関連付けユニットは、関連付けられた顔特徴および身体特徴を記憶ユニット129に記憶してもよい。例えば
図5に示すように、記憶ユニット129は、検出された人物の識別情報と共に顔特徴および身体特徴を記憶してもよい。一実施形態によれば、関連付けられた顔特徴および身体特徴は、記憶ユニット129に一時的に記憶されてもよい。
【0048】
図8のS860では、情報処理装置10は第2の画像を取得してもよい。一実施形態によれば、画像取得ユニット121は、第2の時刻にカメラ4によって撮像された第2の画像を取得してもよい。第2の時刻は第1の時刻とは異なる。一実施形態によれば、第2の時刻は第1の時刻の後である。一実施形態によれば、第2の画像は、第1の画像を撮像するカメラとは異なるカメラによって撮像されてもよい。他の実施形態によれば、取得された第1の画像は、複数の認識対象のうち、顔の各々が対象に対応する複数の顔を含んでもよい。一実施形態によれば、認識対象は人物であってもよい。
【0049】
図8のS870では、情報処理装置10は第2の画像から身体特徴を抽出してもよい。一実施形態によれば、抽出ユニット123は第2の画像内の身体特徴を抽出してもよく、検出ユニット122は第2の画像内の身体特徴を抽出ユニット123から取得してもよい。
【0050】
図8のS880では、情報処理装置10は、第2の画像から抽出された身体特徴を、記憶ユニット129に記憶された身体特徴と比較してもよい。一実施形態によれば、検出ユニット122は、第2の画像内の身体特徴を記憶ユニット129に記憶された身体特徴と比較してもよい。
【0051】
図8のS890では、情報処理装置10は、S880における比較の結果に基づいて、以前に認識された顔特徴を識別してもよい。一実施形態によれば、第2の画像内の身体特徴と、記憶ユニット129から取得した身体特徴とが一致する場合、検出ユニット122は、第1の画像において以前に認識された対象の識別を取得してもよい。したがって、情報処理装置10は、以前に認識された顔特徴を識別してもよい。その一方で、第2の画像内の身体特徴と、記憶ユニット129から取得した身体特徴のいずれもとが一致しない場合、検出ユニット122は、第2の画像内の身体特徴が第1の画像において以前に認識された顔特徴に対応しないと判定してもよい。
【0052】
図8のS891では、情報処理装置10は、S890において以前に認識された顔特徴が識別された場合に、ゲート114を開放するように制御してもよい。一実施形態によれば、コントローラ126は、第2の画像内の身体特徴と、記憶ユニット129から取得した身体特徴とが一致するかどうかを示す情報を検出ユニット122から取得してもよい。一致する場合、コントローラ126は、ゲート2を開放するための制御信号を出力してもよい。
【0053】
図8のS892では、情報処理装置10は、S890において以前に認識された顔特徴が識別されなかった場合に、ゲート2を閉鎖することを可能にしてもよい。一実施形態によれば、コントローラ126は、第2の画像内の身体特徴と、記憶ユニット129から取得した身体特徴のいずれもとが一致しない場合、ゲート2を閉鎖状態に維持してもよい。
【0054】
図9は、自動ゲート装置1のハードウェア構成の一例を示すブロック図である。自動ゲート装置1は、ゲートに接近している人物に対する顔認識を自動的に行うことができ、ゲートに接近している間に人物が常にはカメラに正対していない場合であっても、認証のために停止するよう人物に要求することなく、人物を通過させることができる装置である。
【0055】
図9に示すように、自動ゲート装置1は、CPU102と、RAM104と、記憶デバイス106と、入力デバイス108と、ディスプレイ110と、カメラ112と、ゲート114と、通信ユニット116とを有する。CPU102、RAM104、記憶デバイス106、入力デバイス108、ディスプレイ110、カメラ112、ゲート114および通信ユニット116は、バスライン118に接続されている。
【0056】
CPU102は、記憶デバイス106に記憶されたプログラムを実行することによって動作し、かつ自動ゲート装置1全体の動作を制御する制御ユニットとして機能してもよい。さらに、CPU102は、記憶デバイス106に記憶されたアプリケーションプログラムを実行して、自動ゲート装置1としての各種処理を行ってもよい。RAM104は、CPU102の動作に必要なメモリフィールドを提供してもよい。
【0057】
記憶デバイス106は、不揮発性メモリやハード・ディスク・ドライブなどの記憶媒体で構成され、記憶ユニットとして機能してもよい。記憶デバイス106は、CPU102によって実行されるプログラムや、プログラムが実行される場合にCPU102によって参照されるデータなどを記憶してもよい。
【0058】
入力デバイス108は、例えばディスプレイ110に内蔵されたタッチパネルであってもよい。入力デバイス108は、ユーザからの入力を受け付ける入力ユニットとして機能してもよい。
【0059】
ディスプレイ110は、自動ゲート装置を使用するユーザに各種ウィンドウを表示する表示ユニットとして機能してもよい。例えばディスプレイ110は、自動ゲート装置1の使い方を示す案内ウィンドウや、ユーザへの通知ウィンドウなどを表示してもよい。
【0060】
カメラ112は、1人の人物を撮像してもよいし、複数の人物を撮像してもよい。画像は、1人または複数の人の顔領域および身体領域を含んでもよい。例えばカメラ112は、自動ゲート装置1の前方領域を撮像し、連続的または定期的に撮像された画像において自動ゲート装置1の前方に立つユーザの顔を検出した場合に、ユーザ1の顔を撮像し、その顔画像を取得するデジタルカメラであってもよい。
【0061】
一実施形態によれば、自動ゲート装置1において人物の個人認証に成功した場合、ゲート114は、人物の通過を阻止する待機モード用の閉鎖状態から、人物の通過を許可する開放状態に変化する。ゲート114の方式は特に限定されず、例えば通路の片側または両側に設けられた1つまたは複数のフラッパが開閉するフラッパゲートや、三本のバーが旋回するターンスタイルゲートなどであってもよい。
【0062】
通信ユニット116は、ネットワークに接続されてもよく、ネットワークを介してデータの送受信を行ってもよい。通信ユニット116は、CPU102の制御下でサーバなどと通信する。
【0063】
本開示は、上述の例示的な実施形態に限定されるものではなく、本開示の精神から逸脱しない範囲において適宜変更可能である。
【0064】
上述の例示的な実施形態の各々では、ゲート制御のための顔認識に使用される情報処理装置およびシステムを例として説明したが、本開示は、ゲート制御以外の顔認識や身体追跡の分野にも、1つまたは複数の例示的な実施形態の構成を適宜変更して適用可能である。
【0065】
1つまたは複数の例示的な実施形態の範囲はまた、上述の例示的な実施形態の機能を実現するように例示的な実施形態の構成を動作させるためのプログラムを記憶媒体に記憶し、記憶媒体に記憶されたプログラムをコードとして読み出してコンピュータにおいて実行する処理方法を含む。すなわち、コンピュータ可読記憶媒体もまた、例示的な各実施形態の範囲に含まれる。さらに、上述したプログラムが記憶された記憶媒体だけでなく、プログラム自体もまた、例示的な各実施形態に含まれる。さらに、上述の例示的な実施形態に含まれる1つまたは複数の構成要素は、各構成要素の機能を実現するように構成された特定用途向け集積回路(ASIC)、フィールド・プログラマブル・ゲート・アレイ(FPGA)などの回路であってもよい。
【0066】
記憶媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、コンパクトディスク(CD)-ROM、磁気テープ、不揮発性のメモリカード、ROMなどを使用することができる。さらに、例示的な実施形態の各々の範囲は、記憶媒体に記憶された個別のプログラムによって処理を行う例に限定することなく、オペレーティングシステム(OS)上で動作して、他のソフトウェアやアドインボードの機能と連携して処理を行う例を含む。
【0067】
上述した1つまたは複数の例示的な実施形態の機能によって実施されるサービスは、サービス型ソフトウェア(SaaS)の形態でユーザに提供することができる。
【0068】
なお、上述した例示的な実施形態はいずれも、本開示を実施する際の実施形態を例示するものに過ぎず、これらの例示的な実施形態によって本開示の技術的範囲を限定的に解釈するべきではない。すなわち、本開示は、その技術思想またはその主要な特徴から逸脱することなく、様々な形で実施することができる。
【0069】
また、以下の付記によって、これらに限定することなく上述の例示的な実施形態を完全に、または部分的に説明してもよい。
【0070】
(付記1)
1つまたは複数の命令を記憶するメモリと、
前記1つまたは複数の命令を実行して、
各々が1人または複数の人物のうちの1人の人物に対応する、1つまたは複数のカメラによって第1の時刻に撮像された1つまたは複数の顔を含む第1の画像を取得し、
前記カメラから取得された前記画像内の前記1つまたは複数の顔に対して顔認識動作を行うことによって、前記1人または複数の人物の中から第1の人物を検出し、
前記第1の人物の顔領域に対応する身体領域を検出し、
前記第1の時刻の後の第2の時刻に前記1つまたは複数のカメラによって撮像された第2の画像内の前記身体領域を追跡し、
前記身体領域が障壁に接近しているとの判定に基づいて、前記障壁を開放するように制御するための情報を出力する
ように構成されたプロセッサと
を備える、装置。
【0071】
(付記2)
前記顔認識動作を行うことが、
前記1つまたは複数の顔に対応する顔特徴を前記第1の画像から抽出することと、
前記顔特徴が、複数の登録された顔特徴のうち、1つの登録された顔特徴と一致するかどうかを検出することと
を含む、付記1に記載の装置。
【0072】
(付記3)
前記第2画像内の前記身体領域を追跡することが、
前記第1の画像内の前記顔領域を前記第1の画像内の身体領域と関連付けることと、
前記第2の画像内の前記身体領域を前記第1の画像内の前記身体領域と一致させることと
を含む、付記1に記載の装置。
【0073】
(付記4)
前記障壁を制御するための情報を出力することが、
前記第2の画像内の前記身体領域の特徴と、ストレージに記憶された複数の身体領域のうちの1つの身体領域の特徴との一致に基づいて、前記ゲートを開放するための制御信号を出力することを含む、付記1に記載の装置。
【0074】
(付記5)
前記複数の身体領域の各々が、以前に撮像された1つまたは複数の画像からのそれぞれの顔領域にあらかじめ関連付けられている、付記4に記載の装置。
【0075】
(付記6)
前記1つまたは複数の顔が、前記1つまたは複数のカメラによって前記第1の時刻に撮像された複数の顔を含み、前記複数の顔が、複数の人物にそれぞれ対応する、付記1に記載の装置。
【0076】
(付記7)
前記身体領域が、前記第1の人物が顔認識によって検出された後に検出される、付記1に記載の装置。
【0077】
(付記8)
前記身体領域が、前記第1の人物が顔認識によって検出される前に検出される、付記1に記載の装置。
【0078】
(付記9)
前記身体領域が、前記第1の人物が顔認識によって検出されると同時に検出される、付記1に記載の装置。
【0079】
(付記10)
1つまたは複数の命令を記憶するメモリと、
前記1つまたは複数の命令を実行して、
障壁に接近している複数の人物にそれぞれ対応し、各々が特徴を含む複数の顔を含む、カメラによって撮像された画像を取得し、
第1の人物についての前記特徴のサイズに基づいて、前記複数の人物のうち前記カメラに最も近い人物として第1の人物を検出し、
前記取得した画像からの前記第1の人物の前記顔の情報と各々が前記画像を取得する前に登録された人物に対応する複数の登録された情報との比較の結果に基づいて、前記障壁を制御するための情報を出力するように構成されたプロセッサと
を備える、装置。
【0080】
(付記11)
前記特徴の前記サイズが顔領域の面積に対応する、付記10に記載の装置。
【0081】
(付記12)
前記特徴の前記サイズが目の距離に対応する、付記10に記載の装置。
【0082】
(付記13)
各々が1人または複数の人物のうちの1人の人物に対応する、1つまたは複数のカメラによって第1の時刻に撮像された1つまたは複数の顔を含む第1の画像を取得することと、
前記カメラから取得された前記画像内の前記1つまたは複数の顔に対して顔認識動作を行うことによって、前記1人または複数の人物の中から第1の人物を検出することと、
前記第1の人物の顔領域に対応する身体領域を検出することと、
前記第1の時刻の後の第2の時刻に前記1つまたは複数のカメラによって撮像された第2の画像内の前記身体領域を追跡することと、
前記身体領域が障壁に接近しているとの判定に基づいて、前記障壁を開放するように制御するための情報を出力することと
を含む、方法。
【0083】
(付記14)
コンピュータに、
各々が1人または複数の人物のうちの1人の人物に対応する、1つまたは複数のカメラによって第1の時刻に撮像された1つまたは複数の顔を含む第1の画像を取得することと、
前記カメラから取得された前記画像内の前記1つまたは複数の顔に対して顔認識動作を行うことによって、前記1人または複数の人物の中から第1の人物を検出することと、
前記第1の人物の顔領域に対応する身体領域を検出することと、
前記第1の時刻の後の第2の時刻に前記1つまたは複数のカメラによって撮像された第2の画像内の前記身体領域を追跡することと、
前記身体領域が障壁に接近しているとの判定に基づいて、前記障壁を開放するように制御するための情報を出力することと
を実行させる、プログラム。
【0084】
(付記15)
障壁に接近している複数の人物にそれぞれ対応し、各々が特徴を含む複数の顔を含む、カメラによって撮像された画像を取得することと、
第1の人物についての前記特徴のサイズに基づいて、前記複数の人物のうち前記カメラに最も近い人物として第1の人物を検出することと、
前記取得した画像からの前記第1の人物の前記顔と各々が前記画像を取得する前に登録された人物に対応する複数の登録された情報との比較情報の結果に基づいて、前記障壁を制御するための情報を出力することと
を含む、方法。
【0085】
(付記16)
コンピュータに、
障壁に接近している複数の人物にそれぞれ対応し、各々が特徴を含む複数の顔を含む、カメラによって撮像された画像を取得することと、
第1の人物についての前記特徴のサイズに基づいて、前記複数の人物のうち前記カメラに最も近い人物として第1の人物を検出することと、
前記取得した画像からの前記第1の人物の前記顔の情報と各々が前記画像を取得する前に登録された人物に対応する複数の登録された情報との比較の結果に基づいて、前記障壁を制御するための情報を出力することと
を実行させる、プログラム。
【0086】
本出願は、2019年10月4日に出願された米国仮特許出願第62/910751号に基づく優先権の利益を主張し、その開示の全体は本明細書に組み込まれる。
【国際調査報告】