【文献】
中島 雄平,日本語発話訓練のための顔画像処理,電子情報通信学会技術研究報告,2004年12月 3日,Vol.104,No.494,pp.73-78
【文献】
佐用 敦,発話に伴う特徴を用いたマルチモーダル生体認証手法に関する検討,電子情報通信学会技術研究報告,2012年 3月 1日,Vol.111,No.467,pp.287-292
【文献】
齊藤 剛史,トラジェクトリ特徴量に基づく単語読唇,電子情報通信学会論文誌 D,2007年 4月 1日,Vol.J90-D,No.4,pp.1105-1114
(58)【調査した分野】(Int.Cl.,DB名)
前記領域算出部は、前記右の鼻孔と前記左の鼻孔とを結ぶ軸を第1の座標軸とし、前記右の鼻孔と前記左の鼻孔との中点を通り、前記右の瞳孔と前記左の瞳孔とを結ぶ線に対する垂線を第2の座標軸とした座標系を決定する、
請求項6に記載の口領域検出装置。
前記口画像生成部は、前記口領域をグリッド分けした複数の位置を前記顔画像上の複数の座標に変換し、変換した前記複数の座標のそれぞれにおける前記顔画像の画素値を割り当てることにより前記正規化口画像を生成する、
請求項6又は8のいずれか1項に記載の口領域検出装置。
前記領域算出部は、前記顔画像上の前記右の瞳孔と前記左の瞳孔との距離を算出し、当該距離から、前記右の瞳孔及び前記左の瞳孔を基準とした前記口領域の位置及び前記口領域のサイズを算出する、
請求項15記載の口領域検出装置。
前記領域算出部は、前記右の鼻孔と前記左の鼻孔とを結ぶ軸を第1の座標軸とし、前記右の鼻孔と前記左の鼻孔との中点を通り、前記右の瞳孔と前記左の瞳孔とを結ぶ線に対する垂線を第2の座標軸とした座標系を決定する、
請求項19記載の口領域検出装置。
前記口画像生成部は、前記口領域をグリッド分けした複数の位置を前記顔画像上の複数の座標に変換し、変換した前記複数の座標のそれぞれにおける前記顔画像の画素値を割り当てることにより前記正規化口画像を生成する、
請求項18記載の口領域検出装置。
【発明を実施するための形態】
【0014】
以下、図面を参照しつつ本発明に係る口領域検出装置及び口領域検出方法の好適な実施形態について詳細に説明する。なお、図面の説明においては、同一又は相当部分には同一符号を付し、重複する説明を省略する。
【0015】
[第1実施形態]
口領域検出装置の第1実施形態にかかる自閉症診断支援用装置は、母親等の付添者(対象者)の顔を撮影して顔画像をディスプレイ(被験者が相対して見る対象)に表示しながら乳幼児(被験者)の注視点検出を行うことにより乳幼児の自閉症を診断する装置である。
【0016】
図1には、本実施形態にかかる自閉症乳幼児診断装置1の概略構成を示している。同図に示すように、自閉症乳幼児診断装置1は、乳幼児Aの注視点を実時間で計測できる注視点検出部2と、母親Mの顔の画像を撮影するカラーカメラ(画像取得部)3と、母親Mの瞳孔の空間座標を実時間計測するための瞳孔位置検出部4と、母親Mの顔を映す表示用ディスプレイ5と、光源発光回路6と、データ解析部7とを備える。注視点検出部2の構成としては、本願発明者による特許公報US 7,533,989に記載の三次元視点計測装置の構成を採用できる。具体的には、注視点検出部2は、注視点検出光学系2aと注視点検出演算部2bとによって構成される。また、瞳孔位置検出部4としては、本願発明者による国際公開公報WO 2007/023798に記載の瞳孔検出装置及び瞳孔検出方法を採用できる。
【0017】
このような構成によって、表示用ディスプレイ5上の母親の目の位置からの乳幼児の注視点のずれが即座に容易に定量化できる。また、表示の対象として、必ずしも検診に同伴している母親ではなく予め撮影した人の顔画像を用いる場合においても、顔画像の撮影時に顔画像上における目の位置が正確に検出できる。
【0018】
図2には、カラーカメラ3及び瞳孔位置検出部4の光学系の配置を示している。カラーカメラ3は、母親Mの顔を撮像することで顔画像をカラー画像として取得する。このカラーカメラ3と、瞳孔位置検出部4を構成する瞳孔座標計測用の瞳孔位置検出用光学系8とは、同図に示すように母親Mと相対するように配置されている。この瞳孔位置検出用光学系8は、赤外線光に感度を持つカメラ(瞳孔検出用カメラ)9と近赤外光源10とを組み合わせた構成を2組有する。また、瞳孔位置検出部4として瞳孔位置算出部11(
図1参照)も含まれており、瞳孔位置算出部11は、ステレオ較正された瞳孔位置検出用光学系8からの出力画像(顔画像)を基に、母親Mの右の瞳孔及び左の瞳孔のそれぞれの3次元座標(位置)を算出する。また、母親Mの顔を撮影するためのカラーカメラ3は、2組の瞳孔位置検出用光学系8によって挟まれた位置に配置される。
【0019】
なお、カラーカメラ3、及び2つの瞳孔検出用カメラ9は、それらの位置関係が、それぞれが得た画像上に母親Mの顔のほぼ同じ範囲が映るように、最初に設定される。これらの瞳孔検出用カメラ9とカラーカメラ3とは、本実施形態における顔画像を取得する画像取得部として機能する。
【0020】
瞳孔検出用カメラ9及びカラーカメラ3は、それぞれ予めカメラ較正が行われている。カメラ較正では、カメラの位置を表す3自由度、カメラの方向を表す3自由度、および、カメラの画素数、開口比値(レンズF値)、ひずみなどが同時に計測される。カメラ較正においては、世界座標系における座標(X
W,Y
W,Z
W)と各カメラのカメラ座標系における座標(X
C,Y
C,Z
C)との間には(式1)の関係があると仮定され、
【数1】
(式2)で示す回転行列Rと並進ベクトルTの要素が、各カメラ毎に決定される。
【数2】
【0021】
瞳孔位置算出部11は、カメラ較正の結果を利用して、2台の瞳孔検出用カメラ9を含む瞳孔位置検出用光学系8で瞳孔の世界座標系における3次元座標(位置)を算出した後に、3次元座標をカラーカメラ3に関する(式1)に相当する式に代入することで、カラーカメラ3のカメラ座標系における瞳孔の座標(位置)を算出する。瞳孔位置算出部11は、それをさらに画像中の座標に変換する(実単位系から画像のピクセル単位系に変換する)ことで母親Mのカラー画像中の瞳孔位置を定める。もしくは、カラーカメラ3のカメラ座標系を上述の世界座標系に置き換えて、そのカメラ座標系における他の瞳孔検出用カメラ9のカメラ較正値を求めるカメラ較正法を用いてもよい。その場合、2台の瞳孔検出用カメラ9によって求まる瞳孔の3次元座標は、カラーカメラ3のカメラ座標系における座標として求まる。それをカラーカメラ3のカラー画像中の座標に変換することで母親Mの瞳孔位置が定められる。このとき、瞳孔位置算出部11は、上述した処理を繰り返すことによりカラー画像中における右の瞳孔及び左の瞳孔の座標(位置)を算出する。
【0022】
また、データ解析部7は、注視点検出部2から乳幼児の注視点座標の入力を受け、その注視点座標をカラーカメラ3によって撮影されたカラー画像中の座標に変換する。さらに、データ解析部7は、瞳孔位置検出部4から母親の右の瞳孔及び左の瞳孔の座標を得て、注視点座標と右の瞳孔の位置と左の瞳孔の位置とカラー画像とを利用して各種演算を行って、演算結果を外部のデータ表示ディスプレイ12に表示させる。ここでの演算は、例えば、注視点座標と瞳孔の位置とから両者の距離を演算したり、注視点座標と口領域との関係をカラー画像を用いて演算したり、母親Mのカラー画像上に注視点軌跡を表示させたり、2次元瞳孔座標系上に注視点の2次元分布を表示させることが考えられる。そのため、データ解析部7は、カラー画像中から規定の縦横の画素数の母親の口を含む正規化口画像を生成し、その正規化口画像を利用して口の動きのタイミング又は口の中心位置を解析する。
【0023】
上記の瞳孔位置算出部11、注視点検出演算部2b、及びデータ解析部7は、画像データを演算処理する演算回路及びメモリを内蔵するパーソナルコンピュータ等の画像処理装置であり、1つの画像処理装置内で実現されてもよいし、複数の画像処理装置上に分散されて実現されてもよい。
【0024】
次に、瞳孔位置算出部11及びデータ解析部7における正規化口画像の生成に係る機能について詳細に説明する。
【0025】
瞳孔位置算出部11は、2台の瞳孔検出用カメラ9のそれぞれで撮影された母親Mの顔画像を対象に、顔画像上の母親Mの口を含む領域である口領域の位置及びサイズを算出する領域算出部としても機能する。詳細には、瞳孔位置算出部11は、顔画像上で母親Mの右の瞳孔の位置と左の瞳孔の位置とを算出し、それらの位置を基に口領域の境界を示す口領域ウィンドウの位置及びサイズを算出する。
【0026】
図3は、瞳孔位置算出部11によって算出された顔画像上の口領域ウィンドウのイメージを示す図である。同図に示すように、瞳孔位置算出部11は、顔画像G
1上で検出した右瞳孔の位置P
1及び左瞳孔の位置P
2の間の距離W
Pを算出する。また、瞳孔位置算出部11は、顔画像G
1上の右瞳孔の位置P
1及び左瞳孔の位置P
2の間の中点の位置P
Mを算出し、右瞳孔の位置P
1及び左瞳孔の位置P
2を結ぶ直線に垂直な位置P
Mを通る直線上において、位置P
Mから下記(式3)で計算される距離D
PMほど離れた点の位置M
Cを算出し、その位置M
Cを口元の中心の位置とする(a
1は予め設定された定数)。
D
PM=a
1×W
P …(式3)
【0027】
さらに、瞳孔位置算出部11は、算出した口元の中心位置M
Cを基準とした位置において、縦横のサイズが距離W
Pを基に下記(式4)及び下記(式5)で計算されたサイズを有する長方形の口領域ウィンドウWD
1を設定する。すなわち、瞳孔位置算出部11は、口領域ウィンドウWD
1の水平方向のサイズH
Mを下記(式4);
H
M=a
2×W
P …(式4)
により算出し(a
2は予め設定された定数)、口領域ウィンドウWD
1の垂直方向のサイズV
Mを下記(式5);
V
M=a
3×W
P …(式5)
により算出する(a
3は予め設定された定数)。
【0028】
従って、瞳孔位置算出部11は、
図4(a)に示すように、母親Mと瞳孔検出用カメラ9との距離が離れた際には、その距離に対応して中点の位置P
Mからの距離D
PM及び縦横のサイズが調整された口領域ウィンドウWD
1を設定する。これにより、母親Mと瞳孔検出用カメラ9との距離が変わっても口を正確に含む口領域ウィンドウWD
1を設定することが可能である。また、瞳孔位置算出部11は、
図4(b)に示すように、母親Mの顔の向きが傾いて右瞳孔の位置P
1及び左瞳孔の位置P
2を結ぶ直線が角度θだけ水平線L
Hから傾いた場合には、口領域ウィンドウWD
1も角度θだけ水平線L
Hから傾くように設定する。これにより、母親Mの顔の向きが瞳孔検出用カメラ9の光軸に垂直な面に沿って傾いても、口を正確に含む口領域ウィンドウWD
1を設定することが可能である。なお、瞳孔位置算出部11は、必ずしも口領域ウィンドウWD
1の中心が口元の中心位置に一致するように設定する必要は無い。口領域ウィンドウWD
1の中心が口元の中心位置に一致するように設定された場合、口の動きが小さいときは比較的口領域ウィンドウWD
1のサイズが小さくても口がその口領域ウィンドウWD
1内に収まる(
図5(a))。これに対して、同様の場合に、口の動きが大きいときは下唇が大きく上下するので、口領域ウィンドウWD
1のサイズを大きくしないと口がその口領域ウィンドウWD
1内に収まらない(
図5(b))。そこで、瞳孔位置算出部11は、口領域ウィンドウWD
1の中心が口元の中心位置から下にずれるように設定することが好ましい。
【0029】
そして、瞳孔位置算出部11は、2台の瞳孔検出用カメラ9から得られた顔画像それぞれについて、口元の中心位置M
C及び口領域ウィンドウWD
1の位置範囲を算出する。さらに、瞳孔位置算出部11は、上述した瞳孔の座標の算出と同様にして、カメラ較正の結果を利用して、2つの顔画像それぞれから得られた口元の中心位置M
C及び口領域ウィンドウWD
1の位置範囲を、カラーカメラ3のカラー画像中の座標に変換する。そして、瞳孔位置算出部11は、変換した口元の中心位置M
Cの座標と、変換した口領域ウィンドウWD
1の位置範囲とをデータ解析部7に引き渡す。
【0030】
データ解析部7は、瞳孔位置算出部11から引き渡されたカラー画像上の口領域ウィンドウWD
1の位置範囲を参照することにより、口領域ウィンドウWD
1に相当する範囲のカラー画像を抽出する。そして、データ解析部7は、抽出したカラー画像を画像変換して母親Mの口を含む正規化口画像を生成する。すなわち、データ解析部7は、本実施形態における口画像生成部として機能する。そして、データ解析部7は、時系列で連続的に取得された顔画像を対象に時系列で連続的に生成された複数の正規化口画像を画像解析することにより、母親Mの口の動きのタイミングを計算する。さらに、データ解析部7は、そのタイミング、及びカラー画像中の口元の中心位置M
Cを利用することにより、自閉症の診断結果を生成する。
【0031】
具体的には、データ解析部7は、口領域ウィンドウWD
1の範囲内のカラー画像を対象に、平行移動処理、拡大処理、縮小処理、及び回転処理を含むアフィン変換を施すことにより、縦横が既定の画素数の正規化口画像を生成する。その際、データ解析部7は、既定の画素数の画像を得るために、必要に応じて、バイリニア補間等の画像補間処理も併せて実行する。さらに、データ解析部7は、時系列で得られた複数フレームの正規化口画像を対象にして、前後のフレーム間で画像差分および絶対値演算を実行することで絶対値差分画像を生成し、その差分画像を2値化を行うことによりフレーム間で唇が動いた部分を抽出することができる。また、データ解析部7は、時系列で得られた差分画像の絶対値を求め、所定回数分(例えば120回分)の加算平均等を行った後に2値化を行い、その結果得られた2値化画像の重心を求めれば正確な口元の中心を検出することができる。なお、上述の口領域の重心を求める場合は、瞳孔検出カメラから得られた画像において重心を求め、それをカラー画像中に変換しても用いてもよいし、カラー画像において直接、重心を求めてもよい。さらに、最初は、前者の方法で求め、その後、後者の方法を利用するなどしてもよい。
【0032】
ここで、瞳孔位置算出部11は、時系列で瞳孔検出用カメラ9によって取得された複数フレームの顔画像を利用して、顔画像上の口領域ウィンドウWD
1の位置を補正してもよい。すなわち、瞳孔位置算出部11は、複数フレームの顔画像G
1上で設定した口領域ウィンドウWD
1の範囲内の顔画像G
1を対象に、データ解析部7の処理と同様にして正規化口画像を生成する。さらに、瞳孔位置算出部11は、データ解析部7の上記処理と同様にして、顔画像G
1上の口元の中心位置を算出し、その位置を口元の中心位置M
Cの座標とする。そして、瞳孔位置算出部11は、中点の位置P
Mと口元の中心位置M
Cとの距離D
PMを算出し、距離D
PMを用いて上記(式3)を逆算することにより、定数a
1を補正する。その後、瞳孔位置算出部11は、後続するフレームの顔画像G
1の処理においては、上記の補正後のa
1を利用して口領域ウィンドウWD
1の位置を算出することにより、その位置を補正する。このような複数フレームの顔画像G
1を対象とした処理においては、瞳孔位置算出部11は、最初に設定する口領域ウィンドウWD
1のサイズを大きめに設定してもよい。
【0033】
また、データ解析部7は、瞳孔位置算出部11が顔画像G
1上で口元の中心位置M
C及び口領域ウィンドウWD
1の位置範囲を算出する代わりに、カラー画像上の座標に変換された左右の瞳孔の位置を用いて、カラー画像上で口元の中心位置M
C及び口領域ウィンドウWD
1の位置範囲の両方を算出してもよい。また、データ解析部7は、カラー画像上の座標に変換された左右の瞳孔の位置及び口元の中心位置M
Cを用いて、カラー画像上で口領域ウィンドウWD
1の位置範囲のみを算出してもよい。
【0034】
次に、上述した自閉症乳幼児診断装置1における瞳孔位置算出部11及びデータ解析部7を利用した口領域検出方法の手順について説明する。
【0035】
まず、自閉症乳幼児診断装置1による診断処理が開始されると、時間的に連続してカラーカメラ3及び瞳孔検出用カメラ9による母親Mの顔画像が取得される。それに合わせて、注視点検出部2による乳幼児Aの注視点の計測と、瞳孔位置検出部4による母親Mの右瞳孔と左瞳孔の3次元空間内での座標の計測が開始される。その後、瞳孔位置検出部4を構成する瞳孔位置算出部11により、カラーカメラ3によって取得されるカラー画像上での口元の中心位置M
C、及びカラー画像上で口領域ウィンドウWD
1の位置範囲が算出される。さら、データ解析部7によって、口領域ウィンドウWD
1の位置範囲に相当する範囲のカラー画像を用いて正規化口画像が生成される。このような正規化口画像の生成は、カラーカメラ3及び瞳孔検出用カメラ9による顔画像の連続的な取得に応じて、連続して繰り返される。
【0036】
以上説明した自閉症乳幼児診断装置1による口領域検出方法によれば、母親Mの顔を撮像することで顔画像が取得され、その顔画像から右の瞳孔の位置と左の瞳孔の位置とが算出され、それらの位置を基に顔画像における母親Mの口領域の位置及びサイズが算出され、算出された口領域に相当する顔画像から正規化口画像が生成される。これにより、顔画像を撮像する画像取得部と母親Mの顔との距離が変化したり、母親Mが様々入れ替わった場合であっても、正確に母親Mの口を含む口領域の画像を得ることができる。なおかつ、正規化された画像を生成することで、その画像に対する自閉症診断のための解析処理も安定して実行させることができる。特に、カラー画像から正規化口画像を生成することで、口の動きの検出等の解析処理の検出精度を向上させることができる。正規化口画像を解析することで母親Mの口が動いたタイミングが分かるので、乳幼児Aの口の動きに対する反応の傾向(口の動きに対する視線方向の傾向)が分析でき、自閉症診断の精度も向上させることができる。一般に、母親Mが乳幼児Aに話しかけたりあやすときには、母親Mの口が発声により動くだけでなく、母親の顔が前後及び上下に動いたりするが、そのような状況下でも、自閉症乳幼児診断装置1によれば母親の口領域の画像を実時間で正確に捉えることができる。
【0037】
ここで、瞳孔位置算出部11は、複数の顔画像に対応して生成された複数の正規化口画像を用いて特定された口の位置を用いて口領域の位置を補正する。これにより、母親Mが様々入れ替わった場合であっても、より正確に口領域の画像を得ることができる。
【0038】
また、瞳孔位置算出部11は、瞳孔検出用カメラ9によって撮像された顔画像上の母親Mの右の瞳孔の位置と左の瞳孔の位置とを算出し、その顔画像上の口領域の位置及びサイズを算出し、データ解析部7は、口領域内のカラー画像を画像変換することにより正規化口画像を生成する。これにより、顔画像上で口領域の計算が行われるので、計算が簡素化され、安定して口領域の画像を得ることができる。
【0039】
また、瞳孔位置算出部11は、顔画像上の右の瞳孔と左の瞳孔との距離を算出し、当該距離から、右の瞳孔及び左の瞳孔を基準とした口領域の位置及び口領域のサイズを算出する。この場合には、画像取得部と母親Mの顔との距離が変化した場合に顔画像中の口領域をその距離に応じて正確に切り出すことができる。加えて、顔の大きさが異なる母親Mに入れ替わっても顔画像中の口領域をその顔の大きさに応じて正確に切り出すことができる。さらには、母親の画像取得部に対する顔の傾きが変わっても正確に口領域の画像を切り出すことができる。
【0040】
[第2実施形態]
次に、本発明の第2実施形態にかかる自閉症乳幼児診断装置の構成について説明する。本実施形態にかかる自閉症乳幼児診断装置の構成は、第1実施形態にかかる自閉症乳幼児診断装置1の構成と下記の点で異なっている。
【0041】
すなわち、第2実施形態にかかる瞳孔位置算出部11は、以下のようにして、瞳孔検出用カメラ9によって取得された顔画像上で口領域ウィンドウの位置及びサイズを算出する。上述した第1実施形態では、口元の中心位置が不明な初期のタイミングでは、対象者によってパラメータa
1の値が異なるため、口を確実に含む正規化口画像を生成するためには口領域ウィンドウのサイズを大きめに設定する必要がある。また、口の下唇付近の動きが大きくなりがちなので、口を確実に含む正規化口画像を生成するための口領域ウィンドウの位置を、様々な顔形状の対象者に対応して設定するのは難しい。また、対象者の顔の方向が変わった場合にその顔の方向に対応して口ウィンドウの位置を設定することも難しい。特に、顔の左右の傾きだけでなく顔の縦方向及び横方向の回転に対して口ウィンドウの位置を設定することも難しい。正しい位置に口ウィンドウを設定できない場合、特に顔の背景や鼻孔を口ウィンドウ内に含むことが多くなり、誤検出につながりやすくなるか、複雑な画像処理をしなければならなくなる。そこで、本実施形態では、顔画像上で右の鼻孔の位置と左の鼻孔の位置をさらに算出して、それらの位置を利用して口領域ウィンドウの位置及びサイズを算出する。
【0042】
図6は、瞳孔位置算出部11によって算出された顔画像上の口領域ウィンドウのイメージを示す図である。同図に示すように、瞳孔位置算出部11は、顔画像G
1上で、右瞳孔の位置P
1及び左瞳孔の位置P
2に加えて、右の鼻孔の位置N
1及び左の鼻孔の位置N
2を算出する。また、瞳孔位置算出部11は、顔画像G
1上において、右瞳孔の位置P
1及び左瞳孔の位置P
2の間の中点の位置P
Mに加えて、右の鼻孔の位置N
1及び左の鼻孔の位置N
2の間の中点の位置N
Mを算出し、中点の位置P
Mと中点の位置N
Mとの間の距離D
PNを算出する。そして、瞳孔位置算出部11は、右瞳孔の位置P
1及び左瞳孔の位置P
2を結ぶ直線に垂直な位置P
Mを通る直線上において、位置P
Mから下記(式6)で計算される距離D
PMほど離れた点の位置M
Cを算出し、その位置M
Cを口元の中心の位置とする(a
1は予め設定された定数)。この際、瞳孔位置算出部11は、顔画像から鼻孔位置を検出する手法としては、本願発明者らによる文献「“Face Pose Estimation Based on 3D Detection of Pupils and Nostrils”, Proceedings of the VECIMS 2005 - 2005 IEEE International Conference on Virtual Environments, Human-Computer Interfaces, and Measurement Systems,pp.92-97(2005)」に記載の手法を用いる。
D
PM=a
1×D
PN …(式6)
【0043】
さらに、瞳孔位置算出部11は、算出した口元の中心位置M
Cを基準とした位置において、縦横のサイズが左右の瞳孔間の距離W
P、及び中点間の距離D
PNを基に下記(式7)及び下記(式8)で計算されたサイズを有する長方形の口領域ウィンドウWD
2を設定する。すなわち、瞳孔位置算出部11は、口領域ウィンドウWD
2の水平方向のサイズH
Mを下記(式7);
H
M=a
2×W
P …(式7)
により算出し(a
2は予め設定された定数)、口領域ウィンドウWD
2の垂直方向のサイズV
MU,V
MBを下記(式8);
V
MU=a
3×D
PN, V
MB=a
4×D
PN …(式8)
により算出する(a
3,a
4は予め設定された定数)。このとき、瞳孔位置算出部11は、口領域ウィンドウWD
2の基準位置である口元の中心位置M
Cから上限までのサイズV
MUと、口元の中心位置M
Cから下限までのサイズV
MBとを別に算出する。このように、サイズH
Mを瞳孔間距離と比例関係にあるとすることで、母親Mの頭部の横方向の回転を許容でき、サイズV
MU,V
MBを中点間の距離D
PNと比例関係にあるとすることで、母親Mの頭部の縦方向の回転を許容できるようになる。
【0044】
本実施形態によれば、瞳孔位置算出部11が顔画像G
1上の母親Mの右の鼻孔の位置と左の鼻孔の位置とをさらに算出し、右の瞳孔及び左の瞳孔と、右の鼻孔及び左の鼻孔との位置関係を算出し、当該位置関係から、口領域の位置及び口領域のサイズを算出する。この場合には、母親Mの画像取得部に対する姿勢が変わっても、4点の位置関係を用いて口領域を算出することで、顔画像中の口領域を正確に切り出すことができる。特に、母親Mの頭部の左右の傾きだけでなく縦方向及び横方向の回転に対しても対応して正規化口画像を生成することができる。
【0045】
[第3実施形態]
次に、本発明の第3実施形態にかかる自閉症乳幼児診断装置の構成について説明する。本実施形態にかかる自閉症乳幼児診断装置の構成は、第1実施形態にかかる自閉症乳幼児診断装置1の構成と下記の点で異なっている。
【0046】
すなわち、第3実施形態にかかる瞳孔位置算出部11は、以下のようにして、瞳孔検出用カメラ9によって取得された顔画像上で口領域ウィンドウの位置及びサイズを算出する。上述した第1実施形態及び第2実施形態では、母親Mの頭部が瞳孔検出用カメラ9に対して正面を向いているのが前提であった。本実施形態では、母親Mの頭部の正面に対して斜め方向を向くようにカメラを設置した場合(例えば、正面方向に対して30度傾いた方向から見上げるようにカメラを設置した場合)において、口領域ウィンドウを口の範囲に応じて適切に設定することができる。
【0047】
図7は、瞳孔位置算出部11によって算出された顔画像上の口領域ウィンドウのイメージを示す図である。同図に示すように、正面方向に対して斜め方向から見上げるように瞳孔検出用カメラ9を設置した場合、顔画像上では母親Mが水平方向を向いていたとしても2個の瞳孔の位置P
1,P
2を結ぶ直線に傾きが現れる。同時に、顔画像上では瞳孔の位置P
1,P
2を結ぶ直線と、瞳孔間中点と鼻孔間中点N
Mとを結ぶ直線とは必ずしも垂直にはならない。そこで、瞳孔位置算出部11は、顔画像G
1上において、右瞳孔の位置P
1、左瞳孔の位置P
2、及び鼻孔間の中点の位置N
Mから、それらの重心を顔中心の位置F
Cとして算出し、その顔中心の位置F
Cから真下の位置であって、線分P
1,P
2上から下記(式9)で計算される距離D´
PMの位置を口元の中心の位置M
Cと算出する(a
1は予め設定された定数、D´
PNは、線分P
1P
2と線分N
1N
2との垂直方向の距離)。
D´
PM=a
1×D´
PN …(式9)
【0048】
さらに、瞳孔位置算出部11は、算出した口元の中心位置M
Cを基準とした位置において、縦横のサイズが左右の瞳孔間の水平方向の距離W´
P、及び垂直方向の距離D´
PNを基に下記(式10)及び下記(式11)で計算されたサイズを有する平行四辺形ABCDの口領域ウィンドウWD
3を設定する。ここで、平行四辺形ABCDは、辺AD,BCが線分P
1P
2と平行になり、辺AB,CDが垂直方向となるように設定される。具体的には、瞳孔位置算出部11は、口領域ウィンドウWD
3の口元の中心位置M
Cから辺AB及び辺CDまでの水平方向のサイズH´
M/2を下記(式10);
H
M=a
2×W´
P …(式10)
により算出し(a
2は予め設定された定数、W´
Pは、左右の瞳孔間の水平方向の距離)、口領域ウィンドウWD
3の口元の中心位置M
Cからの垂直方向のサイズV´
MU,V´
MBを下記(式11);
V´
MU=a
3×D´
PN, V´
MB=a
4×D´
PN …(式11)
により算出する(a
3,a
4は予め設定された定数)。このとき、瞳孔位置算出部11は、口元の中心位置M
Cから上限までの垂直方向のサイズV´
MUと、口元の中心位置M
Cから下限までの垂直方向のサイズV´
MBとを別に算出する。
【0049】
これに対して、データ解析部7は、カラー画像上の口領域ウィンドウWD
3の位置範囲を基に正規化口画像を生成する際には、口領域ウィンドウWD
3に相当する範囲のカラー画像を抽出して、抽出したカラー画像を対象に拡大・縮小処理、及びスキュー(せん断)処理を含むアフィン変換を施すことにより、長方形の正規化口画像を生成する。
【0050】
このような第3実施形態によれば、母親Mの頭部の正面に対して斜め方向を向くようにカメラを設置した場合であっても(例えば、正面方向に対して30度傾いた方向から見上げるようにカメラを設置した場合)、口領域ウィンドウを母親Mの口の範囲を含むように適切に設定することができる。
【0051】
[第4実施形態]
次に、本発明の第4実施形態にかかる自閉症乳幼児診断装置の構成について説明する。本実施形態にかかる自閉症乳幼児診断装置の構成は、第1実施形態にかかる自閉症乳幼児診断装置1の構成と下記の点で異なっている。
【0052】
すなわち、第4実施形態にかかる瞳孔位置算出部11は、以下のようにして、2つの瞳孔検出用カメラ9によって取得された顔画像を用いて3次元空間内で口領域ウィンドウの位置及びサイズを算出する。上述した第3実施形態では、母親Mの頭部が瞳孔検出用カメラ9に対して斜めを向いている場合にも対応していたが、頭部のカメラに対する傾きに対応して口領域ウィンドウを設定していなかった。本実施形態では、母親Mの頭部の正面に対して斜め方向を向くようにカメラを設置した場合(例えば、正面方向に対して30度傾いた方向から見上げるようにカメラを設置した場合)において、頭部の傾きに対応して口領域ウィンドウを適切に設定することができる。
【0053】
図8は、瞳孔位置算出部11によって3次元空間内で算出された口領域ウィンドウを顔の横方向から見たイメージを示す図、
図9は、瞳孔位置算出部11によって3次元空間内で算出された口領域ウィンドウを顔のほぼ正面方向から見たイメージを示す図である。瞳孔位置算出部11は、2台の瞳孔検出用カメラ9によって得られた顔画像を利用して、右の瞳孔および左の瞳孔の世界座標系における3次元空間内での座標を算出するとともに、同様にして、右の鼻孔および左の鼻孔の世界座標系における3次元空間内での3次元座標を算出する。そして、これらの図に示すように、世界座標系の座標を3次元空間内での顔座標系(基準座標系)X
F−Y
F−Z
Fの座標に変換することにより、顔座標系X
F−Y
F−Z
Fにおける右の瞳孔の位置P
1、左の瞳孔の位置P
2、右の鼻孔の位置N
1、および左の鼻孔の位置N
2を算出する。この顔座標系X
F−Y
F−Z
Fは、その原点を左右の鼻孔間の中点の位置N
Mとし、X
F軸を左右の鼻孔を結ぶ直線(軸)N
1N
2に一致するようにし、Y
F軸を中点の位置N
Mを通り左右の瞳孔間を結ぶ線分P
1P
2に垂直とするように設定される。このような顔座標系X
F−Y
F−Z
Fにおいては、口の領域が固定されているため、頭部が回転または移動しても口領域の座標は変化しない。
【0054】
そこで、瞳孔位置算出部11は、顔座標系X
F−Y
F−Z
Fを基準にして口領域ウィンドウWD
4の位置を算出する。具体的には、X
FY
F平面に対して角度δだけ傾斜した原点を通る平面を想定し、その平面から顔の後方に距離D
gapだけ離れた平面上の所定位置に口領域ウィンドウWD
4の位置を設定する。このとき、瞳孔位置算出部11は、口領域ウィンドウWD
4の位置を、顔座標系X
F−Y
F−Z
F上の原点から距離Vgapだけ顔の下方向に離れ、口領域ウィンドウWD
4の縦横方向のサイズH
M,V
MU,V
MBが上記(式7)及び上記(式8)で算出した値になるように設定する。また、瞳孔位置算出部11は、瞳孔間を結ぶ線分P
1P
2と、鼻孔間を結ぶ線分N
1N
2と、口領域ウィンドウWD
4の辺AD及び辺BCとは平行になるように設定する。ただし、眼球回転(視線移動)が発生すると瞳孔位置P
1,P
2は上下左右に移動する。さらに、瞳孔位置算出部11は、口領域ウィンドウWD
4の顔座標系X
F−Y
F−Z
Fでの座標を、世界座標系を経由してカラー画像上での座標に変換する。
【0055】
これに対して、データ解析部7は、3次元空間内の座標からカラー画像上の座標に変換された口領域ウィンドウWD
4の位置範囲を基に、その位置範囲に相当する箇所のカラー画像を用いて正規化口画像を生成する。すなわち、データ解析部7は、カラー座標上の座標に変換された口領域ウィンドウWD
4の4つの頂点A,B,C,Dの座標を取得し、それらの頂点に囲まれた四角形領域内の画像を画像変換することにより正規化口画像を生成する。その際には、カラー座標上の座標に変換された口領域ウィンドウWD
4は形状が歪んでいるので、所定の縦横の画素サイズの長方形の正規化口画像を生成するために射影変換を実行する。射影変換の手法は、文献「“認識で欠かせない!実用画像補正テクニック”、Interface 2014年1月号、p153−157」に記載の手法が採用される。
【0056】
また、データ解析部7は、次のようにして正規化口画像を生成してもよい。
図10に示すように、データ解析部7は、3次元空間内での口領域ウィンドウWD
4の長方形の範囲を、辺AD間を(m−1)等分、辺AB間を(n−1)等分(m、nは所定の整数)するように区切ることにより、2次元状のグリッドで分けられたm×n個の3次元空間内での座標を算出する。さらに、データ解析部7は、グリッドで区切られた3次元空間内のm×n個の座標を順次カラー画像上の座標に変換し、変換された座標に相当する位置のカラー画像の画素値を求め、それらの画素値を順次m×nの2次元配列の画像データに割り当てることで正規化口画像G
2を生成する。このとき、データ解析部7は、変換したカラー画像上の座標は必ずしもカラー画像の画素の位置に一致しないため、必要に応じて、バイリニア補間などの補間処理を行うことによりその座標に相当する位置の画素値を求める。
【0057】
なお、ここでは、左右の瞳孔と左右の鼻孔の3次元座標を検出して、瞳孔検出用カメラ9で取得された白黒画像の顔画像G
1を利用して正規化口画像を生成してもよい。
【0058】
このような第4実施形態によれば、母親Mの頭部の正面に対して斜め方向を向くようにカメラを設置した場合において、頭部の傾きに対応して口領域ウィンドウを適切に設定することができる。また、顔座標系X
F−Y
F−Z
Fで口領域ウィンドウWD
4の位置範囲を設定する際に、Y
F軸を鼻孔間の中点位置N
Mから瞳孔間を結ぶ線分P
1P
2上の点P
Pに下した垂線と一致するように設定することにより、視線が動いても顔姿勢に対する顔座標系X
F−Y
F−Z
Fが安定して設定される。これは、鼻孔間の中心は頭部に対して固定されているのに対し、2つの瞳孔はそれらを結ぶ線の平行性は保ちながら上下左右に移動すると考えられるためである。そのため、頭部がどのように回転あるいは移動しても、鼻孔中心を原点とした顔座標系X
F−Y
F−Z
Fを用いて口領域が正確に設定される。
【0059】
[第5実施形態]
次に、本発明の第5実施形態にかかる自閉症乳幼児診断装置の構成について説明する。本実施形態にかかる自閉症乳幼児診断装置の構成は、第4実施形態にかかる自閉症乳幼児診断装置1の構成と下記の点で異なっている。
【0060】
すなわち、第5実施形態にかかる瞳孔位置算出部11は、2つの瞳孔検出用カメラ9によって取得された顔画像を用いて3次元空間内で曲面によって形成される口領域ウィンドウの位置及びサイズを算出する。
図11(a)は、本実施形態にかかる瞳孔位置算出部11によって3次元空間内で算出された口領域ウィンドウを顔の横方向から見た図であり、
図11(b)は、本実施形態にかかる瞳孔位置算出部11によって3次元空間内で算出された口領域ウィンドウを顔の上方向から見た図である。これらの図に示すように、瞳孔位置算出部11は、第4実施形態のように長方形の口領域ウィンドウを算出する代わりに、円柱の側面形状を有する口領域ウィンドウを算出する。
【0061】
詳細には、瞳孔位置算出部11は、Y
F軸に対してY
FZ
F平面に沿って角度δだけ傾斜した線に沿った中心軸を有する所定半径R
1の円柱曲面上に、口領域ウィンドウWD
5の位置を設定する。このとき、瞳孔位置算出部11は、口領域ウィンドウWD
5の位置範囲を、鼻孔間中点N
Mから顔の下方に距離V
gapだけ離れ、顔の上下方向(中心軸方向)に所定のサイズV
Mを有し、円柱側面の顔の水平方向の所定の中心角θ
1に対応する範囲に設定する。
【0062】
また、データ解析部7は、3次元空間内での口領域ウィンドウWD
5の円柱面上の範囲を、横方向に沿って(m−1)等分、上下方向に(n−1)等分(m、nは所定の整数)するように区切ることにより、2次元状のグリッドで分けられたm×n個の3次元空間内での座標を算出する。このとき、口領域ウィンドウWD
5を横方向に沿って区切る際には、中心角を等角度で区切ることができる。その後、第4実施形態と同様にして、データ解析部7は、カラー画像の画素値を用いて正規化口画像G
2を生成する。
【0063】
このような構成の第5実施形態によれば、平面の口領域ウィンドウを用いる場合に比べて、より高精度に正規化口画像を生成することができる。つまり、口領域ウィンドウを円柱側面上に張り付いていると仮定することで、実際の顔形状により一致して口の領域を正確に定めることができる。
【0064】
[第6実施形態]
次に、本発明の第6実施形態にかかる装置の構成について説明する。本実施形態では、第1〜第5実施形態の構成の装置を口の動きを検出することにより読唇、すなわち会話内容の認識を実行する認識装置に応用する。本実施形態にかかる認識装置の構成は、第1〜第5実施形態にかかる自閉症乳幼児診断装置1の構成と下記の点で異なっている。
【0065】
すなわち、本実施形態の認識装置は、
図1に示す構成のうち、認識対象者Sを撮影するカラーカメラ3と、認識対象者Sの瞳孔の空間座標を検出するための瞳孔位置検出部4と、光源発光回路6と、データ解析部7とを備える。データ解析部7は、上述した第1〜第5実施形態の手法によって得られた複数の時系列の正規化口画像の画像差分を用いて、認識対象者Sの唇の動きを検出する。
【0066】
詳細には、データ解析部7は、画像差分により得られた差分画像を対象に、差分値の絶対値をPタイル法等により予め設定された適切な閾値で二値化することにより、二値化画像を生成する。そして、データ解析部7は、取得した二値化画像中のエッジを検出することにより、上唇の下の境界ライン(上唇のエッジ)と、下唇の上の境界ライン(下唇のエッジ)を検出する。さらに、データ解析部7は、上唇のエッジと下唇のエッジとの距離を計測することにより、口の開き具合を数値化して検出する。このとき、データ解析部7は、正規化画像における口の横方向に沿った複数個所でエッジ間の距離を数値化する。例えば、
図12(a)及び
図12(b)には、データ解析部7によるエッジ計測の対象となる正規化口画像の一例を示している。
図12(a)に示すように、認識対象者Sが「あ」、「い」を発音した際には口が横に広がった状態となり、
図12(b)に示すように、認識対象者Sが「お」を発音した際には小さく丸まった状態となる。データ解析部7は、検出した上唇のエッジE
U及び下唇のエッジE
Lの距離を二値化画像において予め規定された横方向座標の5か所(
図12(a)及び
図12(b)の矢印の箇所)で算出することにより、口の開き方の形状を認識する。そして、データ解析部7は、時系列の正規化画像に対して順次得られた複数の二値化画像に対して口形状の認識を繰り返すことにより、口の開き方の形状の時系列変化を認識する。その結果、データ解析部7は、認識対象者Sの会話内容を認識することができる。ここで、データ解析部7は、正規化画像を対象に認識処理を実行することで、
図12(c)に示すように、カラーカメラ3で得られた画像において認識対象者Sの顔が回転していたような場合であっても、画像上で検出された認識対象者Sの瞳孔の位置P
1,P
2を基準に切り出された正規化口画像を基に、口の2つのエッジE
U、E
L間の距離を測る方向及び位置を適切に定めることができる。
【0067】
このような第6実施形態によれば、認識対象者Sの口の開き方の形状を時系列に認識することができる。例えば、「お」と発音したときの口が小さく丸まった状態と、「あ」、「い」と発音したときの口が横に広がった状態を正確に区別して認識することができる。また、「わ」と発音したときに最初に口を尖らせてその後に口を開く状態も認識することができる。その結果、発声により唇が動作する場合においても、口の位置が安定して切り出された正規化口画像を用いることにより、正確に認識対象者Sの唇の動きを検出することができる。ただし、認識対象者Sの照明状態が悪ければ、必ずしも、上唇の下の境界ライン(上唇のエッジ)と、下唇の上の境界ライン(下唇のエッジ)は検出できない場合も考えられる。例えば、下唇に関しては、下唇の下の境界ラインと上の境界ラインのほぼ中間位置などが検出される場合である。その場合でも、下唇の動きが検出できるだけでなく、前述のような形状もおよそ検出できる。さらに、本手法によれば、いつも同じ位置およびサイズの正規化口画像が得られるので、特にカラー画像からは、画像処理範囲を狭めながら、効率的な画像処理、または、色を考慮した画像処理が容易であり、唇のエッジが容易に検出できる。
【0068】
本発明は、上述した実施形態に限定されるものではない。
【0069】
上記第1〜第6実施形態においては、2台の瞳孔位置検出用光学系8を用いて瞳孔或いは鼻孔の3次元空間内の3次元座標を検出していたが、1台のカメラを含む光学系で瞳孔或いは鼻孔の3次元座標を検出してもよい。このような構成としては、本発明者による特許第4431749号に記載の構成を採用できる。この構成の場合は、2台の瞳孔位置検出用光学系8を左右に離して配置して、これらの検出結果を統合することにより、母親Mあるいは認識対象者Sの顔姿勢の広い範囲で正規化口画像を生成することができる。その結果、母親Mあるいは認識対象者Sの顔の左右の大きな回転にも対応できる。母親Mあるいは認識対象者Sの顔の正面から大きく外れた方向から顔画像を撮影しその顔画像から正規化された口画像を生成すると、口角のあたりにおいては正規化された画像が正確ではない。しかし、その場合でも、第5実施形態のように曲面の口領域ウィンドウを設定することで精度を改善できる。
【0070】
このように瞳孔位置検出用光学系を1台とした場合には、1つの光学系のみで白黒画像の正規化口画像を得ることができる。また、1台の瞳孔位置検出用光学系と1台のカラーカメラを用いることで、カラー画像の正規化口画像を得ることもできる。また、1台のカメラとして分割された画素ごとにカラー画像と白黒画像を得ることができるカメラを用いれば、1台のカメラでカラー画像の正規化口画像を得ることができる。このようにカラー画像の正規化口画像を得ることで、より正確に口の動きを検出できる。
【0071】
第1実施形態に係るデータ解析部7は、カラー画像を用いて正規化口画像を生成する代わりに、瞳孔位置算出部11によって設定された口領域ウィンドウWD
1の位置範囲内の顔画像G
1を用いて、白黒画像から正規化口画像を生成してもよい。
【0072】
また、上記第4および第5実施形態においては、口領域ウィンドウとして平面状又は円柱の側面形状のウィンドウを算出していたが、このような形状には限定されず、様々な曲面、平面、あるいはそれらの組み合わせで構成されるウィンドウを算出してもよい。
【0073】
ここで、上記実施形態において、画像取得部は、複数の顔画像を連続して取得し、領域算出部は、複数の顔画像に対応して生成された複数の正規化口画像を用いて、複数の正規化口画像における対象者の口の位置を特定し、特定した口の位置を用いて口領域の位置を補正することとしてもよい。この場合、対象者が様々入れ替わった場合であっても、より正確に口領域の画像を得ることができる。
【0074】
また、瞳孔位置算出部は、顔画像上の対象者の右の瞳孔の位置と左の瞳孔の位置とを算出し、領域算出部は、顔画像上の口領域の位置及びサイズを算出し、口画像生成部は、口領域内の顔画像を画像変換することにより正規化口画像を生成することとしてもよい。この場合には、顔画像上で口領域の計算が行われるので、計算が簡素化され、安定して口領域の画像を得ることができる。
【0075】
また、領域算出部は、顔画像上の右の瞳孔と左の瞳孔との距離を算出し、当該距離から、右の瞳孔及び左の瞳孔を基準とした口領域の位置及び口領域のサイズを算出することとしてもよい。この場合には、画像取得部と対象者の顔との距離が変化した場合に顔画像中の口領域をその距離に応じて正確に切り出すことができる。加えて、顔の大きさが異なる対象者に入れ替わっても顔画像中の口領域をその顔の大きさに応じて正確に切り出すことができる。
【0076】
また、瞳孔位置算出部は、顔画像上の対象者の右の鼻孔の位置と左の鼻孔の位置とをさらに算出し、領域算出部は、右の瞳孔及び左の瞳孔と、右の鼻孔及び左の鼻孔との位置関係を算出し、当該位置関係から、口領域の位置及び口領域のサイズを算出することとしてもよい。この場合には、対象者の画像取得部に対する姿勢が変わっても、4点の位置関係を用いて口領域を算出することで、顔画像中の口領域を正確に切り出すことができる。
【0077】
また、瞳孔位置算出部は、3次元空間内での対象者の右の瞳孔の位置と左の瞳孔の位置とを算出し、領域算出部は、3次元空間内での口領域の位置及びサイズを算出し、口画像生成部は、口領域に相当する箇所の顔画像を用いることにより正規化口画像を生成することとしてもよい。この場合、対象者の画像取得部に対する姿勢が変わっても、3次元空間内で口領域を算出することで、顔画像中の口領域をより正確に切り出すことができる。
【0078】
また、瞳孔位置算出部は、3次元空間内での対象者の右の鼻孔の位置と左の鼻孔の位置とをさらに算出し、領域算出部は、右の瞳孔、左の瞳孔、右の鼻孔、及び左の鼻孔の位置関係から基準座標系を決定し、当該基準座標系を基準にして口領域の位置を算出することとしてもよい。この場合は、対象者の画像取得部に対する姿勢が変わっても、4点の3次元の位置関係を用いて口領域を算出することで、顔画像中の口領域をより正確に切り出すことができる。
【0079】
さらに、領域算出部は、右の鼻孔と左の鼻孔とを結ぶ軸を第1の座標軸とし、右の鼻孔と左の鼻孔との中点を通り、右の瞳孔と左の瞳孔とを結ぶ線に対する垂線を第2の座標軸とした座標系を決定することでもよい。こうすれば、対象者の視線変化により目が動いた場合であっても安定して対象者の顔姿勢が特定でき、その結果、視線変化にかかわらず顔画像中の口領域を正確に切り出すことができる。
【0080】
また、口画像生成部は、口領域に相当する箇所の顔画像を射影変換することにより正規化口画像を生成することでもよい。こうすれば、画像取得部に対する対象者の顔姿勢が変化しても、顔画像から正規化された口画像を生成することができる。
【0081】
また、口画像生成部は、口領域をグリッド分けした複数の位置を顔画像上の複数の座標に変換し、変換した複数の座標のそれぞれにおける顔画像の画素値を割り当てることにより正規化口画像を生成することでもよい。こうすれば、画像取得部に対する対象者の顔姿勢が変化しても、顔画像から正規化された口画像を生成することができる。
【0082】
さらに、領域算出部は、円柱の側面形状の口領域の位置及びサイズを算出することでもよい。こうすれば、対象者の顔形状により一致した口画像を生成することができる。
【0083】
また、上記形態の口領域検出方法は、正規化口画像を利用することによって対象者以外の被験者の注視点と口領域との関係を演算する自閉症診断のためのステップをさらに備えていてもよい。また、正規化口画像を利用することによって対象者の上唇と下唇との間の距離を基に対象者の口形状の認識を行う読唇のためのステップをさらに備えていてもよい。