【文献】
嶌田聡,顔面像からの注視方向の実時間識別法,テレビジョン学会技術報告,日本,社団法人テレビジョン学会,1991年10月18日,第15巻,第55号,第17-23頁
(58)【調査した分野】(Int.Cl.,DB名)
【背景技術】
【0002】
近年、小型の携帯端末等でインターネットを介してWebサイトの大容量コンテンツへアクセスすることが容易にできるようになってきている。そのため、携帯端末の表示部等で表示サイズの大きな画像や映像を視聴する機会が増えてきている。また、携帯端末等に搭載されるカメラも高画素化が進み、大きなサイズの画像を扱う機会が増えてきている。さらに、総務省より携帯電話機へのGPSの搭載が義務化されることもあり、大きな地図画像を画面に表示させる機会が増加してきている。
【0003】
一方で携帯端末は小型・薄型化が進められており、それに伴って表示部の液晶表示装置のサイズにも大きさの限界が見えてきており、長いテキスト文章や大きな画像を表示するためには、一部分だけの表示とせざるを得ないことがあり、表示画面の拡大、縮小の処理を行う必要が多くなっている。
【0004】
表示画像に対するこのような処理を行うため、スクロールやズームなどの操作を携帯端末に備えるキーなどで実現することが可能であるが、キーなどの操作ではデジタル的になったり操作が煩わしく、微妙な調整が難しいなどの点で問題がある。また、液晶表示装置の高精細化が進んでいるとはいえ、文字や画像が細かくなることは、中高年のユーザにとっては受け入れにくいという点で問題がある。
【0005】
ところで、ユーザによる表示制御を簡易化する関連技術として、特許文献1には加速度センサを設けることにより表示画面の表示サイズの変更及びスクロールを実現する電子機器が記載されており、特許文献2には、表示画面の表示映像の拡大、スクロールを、アイカメラを用いた視線検出手段により制御する画像表示装置が記載されている。また、特許文献3には、携帯型ビューワに関し、装置の裏面にボールを備えるとともに、顔までの距離を計測する視点位置検出手段を備え、使用者が机上等に置いて携帯型ビューワを移動させることにより表示画面のスクロール動作を可能とし、さらに携帯型ビューワに顔を近づける、遠ざけるといった一般的な動作で拡大及び縮小操作を行えるように構成したものが記載されている。更に、特許文献4には、操作者の口(顔)を上下左右に動かすことによりディスプレイ9上のアイコンを動かしたり、マルチウィンドウのウィンドウの移動や、その他のポインティングを行う指示入力装置が記載されている。
【発明を実施するための形態】
【0016】
[第1の実施形態]
(構成の説明)
本発明の電子機器の画面表示制御方法、画面表示制御方式、電子機器及びプログラムの一実施形態として、カメラ付き携帯端末に適用した構成例について以下説明する。
【0017】
図1は、本発明の第1の実施形態のカメラ付き携帯端末の外観を示す図である。本実施形態のカメラ付き携帯端末(端末)101は、キー入力部104と、ユーザのキー入力部の操作等によりビューア等を起動し、画像、文字等を表示可能な液晶表示装置(Liquid Crystal Display:LCD)102と、LCD102側に設けられたカメラ103と、音声入力用のマイク105等を備える。本実施形態では、同図に示すようにビューアの起動時にカメラ103で取得したユーザの画像を取得し、その特徴点の情報(特徴点情報)の変化により、LCD102の表示画面のスクロール、拡大、縮小等の制御が行われる機能を有する。
【0018】
図2は、本発明の第1の実施形態の携帯端末内の構成と機能ブロックを示す図である。端末内構成としては、端末の入力部としてキー104、マイク105、カメラ103に加え、カメラ103を動作されるカメラドライバ108を備え、端末の出力部としてLCD102とLCDドライバ111を備える。また、データ処理部として、コンピュータを構成する中央処理装置からなる制御部(Central Processing Unit:CPU)109とROM(Read Only Memory)、RAM(Random Access Memory)、VRAM(Video RAM)等のメモリ110を備える。
【0019】
機能ブロック構成としては、端末内の各部構成の入力部及び出力部を制御するデータ処理部であるメモリ110を備えるCPU109の機能として、ビューア検知部201、トリガー検知部202、画像取得部203、顔検出部204、特徴点抽出部205、変化量計算部206、方向判定部207、表示修正部208及び表示制御部209の各機能部を構成する。各機能部の機能は以下のとおりである。
【0020】
ビューア検知部201は、ユーザのキー104の操作等によるビューアの起動及び停止(ON/OFF)を検知する検知部である。トリガー検知部202は、ユーザが画面上の表示部分のスクロールやズーム等の制御を行う場合にユーザが端末に対して起こすアクションを検知する検知部である。つまり、ユーザによるキー104の操作入力又はマイク105からの特定キーワードの音声入力により、表示画面のスクロールやズーム等の制御機能を開始又は停止(ON/OFF)を検知する。例えば、端末101に備えられた特定のキー104の押下を顔画像によるスクロール、ズーム等の制御の開始のトリガーとし、再度の同キー104の押下を同制御の停止のトリガーとしてもよいし、特定のキー104の押下状態を同制御の制御状態とし、同キー104の開放状態を同制御の非制御状態としてもよい。また、マイク105から入力する特定キーワードの音声を音声認識して同制御への開始のトリガーとし、他のキーワードの音声を音声認識して同制御の停止のトリガーとしてもよい。以下、特定のキー104の押下、再押下により開始及び停止を制御する例で説明する。
【0021】
画像取得部203は、トリガー検知部202がトリガーを検知するとCPU109がカメラドライバ108を介してカメラ103を起動し、カメラ103は起動後から映像のキャプチャを続け、メモリ110に例えばフレーム単位又は所定周期のフレーム単位でLCD102に対向するユーザの顔画像等をカメラ103で取得し、取得したフレーム画像データを顔検出部204等に転送する。画像取得部203は本発明の画像取得手段を構成する。
【0022】
顔検出部204は、メモリ110内部のフレーム画像データからユーザの顔領域を検出する。検出方法としては、人間の肌の色の色相成分の特徴を元にした顔領域抽出や、顔輪郭に対する楕円近似手法などが利用される。特徴点抽出部205は、顔検出部204により検出された顔領域内部から顔の特徴となる顔の輪郭線(顔輪郭線)や、目、鼻、口を抽出し、その大きさ、位置等とともに特徴点として検出する。変化量計算部206は、前フレームと現フレームのフレーム画像における特徴点の位置や大きさを比較し、その変化量を計算する。
図1にはカメラ103で取得した画像例106を示しており、左右の目と口のなす三角形の重心、顔の輪郭を特徴点とし、次第に前記重心が左下に移動し、顔輪郭線が広がっており、この重心の移動及び顔輪郭の広がりを変化量として計算する。以上の顔検出部204、特徴点抽出部205及び変化量計算部206は、本発明の変化量計算手段を構成する。
【0023】
方向判定部207は、各種の特徴点の変化量を元に、顔もしくは端末がどちらに傾き、ユーザがどの方向に画面表示を変更したいかを判定する。表示修正部208は、方向判定部207の結果を元に、現在画面に表示している文字や画像を修正し、修正したフレーム画像データをメモリ110中のVRAM等のフレームバッファに用意する。表示制御部209は、LCDドライバ111へ指示し、表示修正部208で修正されたフレームバッファの内容をLCD102に表示させる制御を行う。
図1に示す例では、ユーザの顔画像から、LCD102に表示された地図の文字や画像の画面に対し、中央から左下側に顔の方向を移動させ、更に顔を表示画面に近づけており、この顔の方向の変化に応じて、各フレーム画像毎に、表示修正部208が文字や画像を修正し、修正したフレーム画像データをフレームバッファに用意し、表示制御部209が当該フレームバッファのフレーム画像データをLCD102に表示させる制御を繰り返し、ユーザの顔の方向の地図を中央に拡大表示する様子を示している。以上の方向判定部207、表示修正部208及び表示制御部209は、本発明の表示制御手段を構成する。
【0024】
以上の動作を実現する実施形態としては以下のようにして実現することができる。つまり、データ処理部のメモリ110中のROMに、以下にも説明する各部の機能又は各手段を実現する制御プログラムを予め格納し、CPU109は当該ROMの制御プログラムを読み込み、読み込んだ制御プログラムにより制御される。これによりCPU109は制御プログラムの制御に従い端末内構成を制御し、メモリ110に転送された映像の各フレーム画像もしくは、数フレーム画像単位で画像のデータ処理を行うことで、各部(201〜209)又は各手段の機能を実現する。また、携帯端末101は図示しない発着信等の通信制御、通話機能、Web接続、閲覧、Webサイトからのプログラムのダウンロード機能等、端末の各種アプリケーションの機能を有しており、前記制御プログラムは所望サイトからダウンロードする等により端末に本発明の機能の追加を可能に構成してもよい。
【0025】
(動作の説明)
図3は、全体のシステムのシーケンス図を示す図である。以下、本実施形態の動作の概要について詳細に説明する。
【0026】
ユーザが端末101に対しビューアを起動するように操作すると、端末101はLCD102にテキストデータや画像を表示する制御を開始するとともに、ユーザからのスクロール、ズーム等の制御動作の開始トリガーを監視するトリガー監視(待ち状態)となる。次に、ユーザがLCD102の表示をみて特定のキー押下(又は特定キーワードの音声入力)のアクションを行うと、端末101はこれを開始トリガーとして検知(トリガー検知)して本発明による処理を開始する。
【0027】
まず、端末101のデータ処理部はカメラ103の動作を起動し、ユーザの顔画像の取得の動作を開始する。一般的にはカメラの起動には多少の待ち時間が生じるため、LCD102の画面上にカメラ撮影の準備ができたことをアイコン等で表示してユーザに知らせる(スタンバイOKピクト表示)。次に、データ処理部は撮影しているユーザの顔向き変化や端末の傾斜等により、顔画像から抽出される特徴点の変化量を計算し、移動方向の判定を行う。この判定結果により画面に表示している文字や画像を修正し、スクロール、ズーム等により画面表示を順次更新する。
【0028】
次に、本実施形態の動作について処理フローチャートにより詳細に説明する。
【0029】
図4は、トリガー検知からビューア終了までのメイン処理の処理フローチャートを示す図であり、
図5は、メイン処理における変化量計算(ステップ307)の処理フローチャートを示す図であり、
図6は、メイン処理における方向判定(ステップ308)の処理フローチャートを示す図である。
図4〜6に示す処理フローチャートにより、LCD102の画面上への文字や画像の表示の開始からビューアを終了するまでの処理の流れを以下説明する。
【0030】
図4に示す処理フローチャートは、ユーザが端末101のビューアを起動した時点、つまり、端末101のデータ処理部が表示用のLCD102に文字や画像等を表示した、ユーザのトリガー監視(待ち状態)以降の処理動作を示している。
【0031】
ステップ301では、画面表示のスクロール、ズーム等を顔画像により指示する動作を開始するユーザのトリガー(特定のキー押下)が検知されたか否かを判断する。トリガーが検知されない場合は、ステップ312でビューアが終了か否かを判断し、ビューア終了の操作が無ければ、トリガー監視を維持し、画面表示はそのままとする。また、ステップ312でビューア終了のユーザ操作があれば処理を終了する。
【0032】
ステップ301でトリガーが検知された場合、ステップ302へ進む。ステップ302では、画像取得部202の処理に従い、カメラ103を起動し、画像のキャプチャを行い、一画像(フレーム画像)を出力する。続いて、ステップ303では、顔検出部203の処理に従い、当該フレーム画像から顔領域の検出を行う。ステップ304では、特徴点抽出部205により顔領域内部から顔輪郭線や、目、鼻、口を抽出して特徴点とする。
【0033】
次のステップ305では、処理しているフレーム画像が初期フレーム、つまり最初のフレーム画像か否かを判断する。初期フレームの場合は、ステップ306においてそのフレーム画像から抽出した各特徴点の位置や大きさの情報をメモリ110内に退避してステップ301へ戻る(この時のステップ301〜305、312の処理は、トリガー検知時の状態のままであれば、2番目のフレーム画像について前述と同様の処理が行われる)。ステップ306で退避した情報はステップ307の処理に用いる。
【0034】
また、ステップ305で、処理しているフレーム画像が初期フレームでない場合は、ステップ307へ進む。ステップ307では、
図5に示す処理フローチャートによりメモリ110内に退避された前フレームの特徴点情報と現フレームで抽出された特徴点情報を比較し、その変化量を計算する。
【0035】
図7は、ステップ307の内部処理の各ステップの処理例の概要を示す図である。
図7ではそれぞれのステップに対する入力フレーム画像は異なった例を示している。ステップ307の処理を
図5に示す処理フローチャートにより詳細に説明する。
【0036】
ステップ307の変化量計算の処理は2回目以降の各フレーム画像の特徴点の検出時に行われ、前後のフレームでそれぞれ異なる顔の特徴点座標等の移動量を計算し、変化量とする。
図5に示す最初のステップ401では、
図7に示す処理例のように、左右の目と口がなす三角形の重心の前フレームと後フレームの間の移動量(変化量)として算出する。次のステップ402では、
図7に示す処理例のように前後のフレームでの顔輪郭線の近似楕円中心位置の移動量を算出し、変化量とする。更にステップ403では、
図7に示す処理例のように前後のフレームでの顔輪郭線の近似楕円の半径の変化量を算出する。以上の処理を終了すると
図4に示すメイン処理のステップ308へ進む。ステップ308では、ステップ307で計算された各種変化量を元に、ユーザが画面表示をどのように変化させたいのかを判定する。
【0037】
図8は、ステップ308の内部処理の各ステップの処理例の概要を示す図である。ステップ308の内部処理を
図6に示す処理フローチャートにより詳細に説明する。
【0038】
ステップ308の方向判定の処理は、
図6に示す最初のステップ501で前後のフレームでの左右方向の移動を判定する。ここで、ユーザが自分の顔を動かしているか、端末を動かしているかを判定することも可能である。これは顔輪郭線の近似楕円の中心(重心)の位置(顔輪郭線中心位置)の変化量と顔の特徴点の重心(例えば左右の目と口がなす三角形の重心)の移動量の差により判定できる。例えば、
図8を参照すると、顔移動(端末固定)の場合、左右方向の移動では、前後フレームにおいて、顔輪郭線中心位置の移動はなく、顔の特徴点の重心のみが移動するが、端末移動(顔固定)の場合は、顔輪郭線中心位置の移動にあわせて、顔の特徴点の重心も移動するため、顔固定、端末固定に関わらず左右方向の移動を判定できる。次のステップ502では、ステップ501と同様の考え方で、前後のフレームでの上下方向の移動を判定する。次のステップ503では、前後のフレームでの奥行き方向の移動を判定する。奥行きの移動は、顔移動又は端末移動のどちらの場合でも顔輪郭線の近似楕円が大きくなれば、端末と顔との距離が縮まり、顔輪郭線の近似楕円が小さくなれば、端末と顔との距離が広がっているとして判定できる。更にステップ504では、前後のフレームでの移動量が大きくなりカメラが取得する顔画像が撮影範囲外になるような場合の判定であり、例外処理である。以上の処理を終了するとメイン処理のステップ309に進む。
【0039】
ステップ309では、ステップ308での判定結果を元に、LCD102の表示画面に表示されたテキストや画像を変形(変化)させる。例えば、顔の左右方向又は上下方向の移動の判定結果に基づいて、それぞれユーザが表示されているテキストや画像の左右方向又は上下方向へのスクロールを希望するものとして、その移動量に応じて表示されているテキストや画像の左右方向又は上下方向へのスクロールの処理を行う。なお、端末固定の場合は、画像見えでは、ユーザの意図と上下左右が反対になるため、その点を考慮して変形処理を行う。また、奥行き方向の変化の判定結果に基づいて、例えば端末と顔の距離が縮まった時、ユーザは表示されているテキストや画像を拡大したいものとして、その移動量に応じた変形処理を行う。また、逆に端末と顔の距離が広がった時、ユーザは表示されているテキストや画像を縮小したいものとして、その移動量に応じた変形処理を行う。更に、移動量が大きくなりカメラが取得する顔画像の特徴点等が撮影範囲外になるような場合は、例外処理として直前のスクロール、ズーム等と等速度で移動しているものとして画面表示をスクロールさせ続け、顔もしくは端末を撮影範囲内に戻したときに、例外処理を終了する。以上の画面表示の制御は個々の顔画像による移動の判定結果の何れか又は任意の組み合わせに基づいて行うことが可能である。
【0040】
ステップ310では、ステップ309で変形処理により作成したテキストや画像をフレームバッファに送り、画面に表示するようにLCD102の表示の制御を行う。
【0041】
ステップ311では、ビューアの終了のユーザ操作の有無を判断し、ユーザが画面上のテキストや画像の表示を終了する操作をした場合、処理を終了させる。ユーザがビューア終了を操作しない場合は、ステップ306へ分岐し、現フレームで抽出された各特徴点情報をメモリに退避させて、ステップ301の処理に戻る。
【0042】
ステップ301では、トリガー検知時の状態のままであった場合は(再度のキーの押下がなければ)、ステップ302以降の処理を繰り返す。
【0043】
以上の処理により、ビューア起動後のトリガー検知により、ユーザの顔の方向の動きに応じたLCD102のテキストや画像のスクロールの表示制御と、顔の大きさに応じた画像の拡大、縮小等の表示制御とをビューア終了を判定されるまで、フレーム単位又は数フレーム単位で繰り返し行われ、トリガー検知の終了時は、LCD102のテキストや画像の最後の表示制御後の表示状態がビューア終了を判定されるまで維持される。
【0044】
これにより携帯端末など小型の電子機器のスクリーンでテキストや画像などを表示する際に、表示部分の移動(スクロール)や任意部分の拡大(ズーム)等、表示画面への表示対象の表示範囲の制御を特別な装置を必要とすることなく、また、ユーザの煩雑なキー操作等を必要とすることなく、人の感覚に近い動作で簡単に実現でき、さらに微妙な調整をすばやく行うことが可能である。
【0045】
つまり、本実施形態によれば、携帯端末101は、文章や画像を表示する表示部102と該表示部の近辺に取り付けられたカメラ103を有し、画面上に映し出されたテキストや画像をスクロールまたはズーム等を行う場合、特定のキー104を押下し(又は押下しながら)、ユーザの顔又は携帯端末を上下左右に回転させたり、顔を携帯端末に近づけたりする。このユーザの動作は、見たい方向に顔を向ける、拡大したいときに顔を近づけるという人の感覚に近い動作である。この動作を携帯端末が識別することで感覚的なスクロール、ズーム等の動作による表示の制御が実現される。端末内部の処理としては、カメラの撮影映像を元に利用者の顔の位置、大きさの時間的な変化から、ユーザの顔の方向、端末との距離を認識し、画面上の表示を変化させる。具体的には、ユーザのキー押下と共に、カメラ103が起動し、顔の検出および顔の特徴点(目/鼻/口/輪郭など)を抽出する。抽出された特徴点の位置や大きさの時間的な変化量を元に、文章や画像の表示を修正し再描画の制御が行われる。
【0046】
以上のように、画面表示における任意部分のズームや表示部分のスクロール等を、ユーザの顔の方向や大きさの変化の人の感覚に近い動作で簡単に実現することが可能である。また、顔の方向や大きさの変化などアナログなデータを扱っているため、従来のキー入力ではデジタル的にしかできなかったスクロールやズームの微妙な調整を、すばやく、アナログ的に行うことが可能である。
【0047】
また、キー入力の必要がないため、細かい操作を苦手とする身体障害者の方にとっても、音声入力や自分の顔の移動によって、ズームやスクロール等の操作を行うことが可能である。更に、携帯電話など表示画面側にカメラがついている装置であれば、スイッチ等の操作手段の指定又は追加で実現できるため、特別なハードウエアを追加する必要がなく、安価に実現することが可能である。
【0048】
[第2の実施形態]
本発明の第2の実施形態として、機密文書などを携帯端末のビューアにより読むことを考慮し、顔認証によるセキュリティ性を向上させた実施形態を以下説明する。
【0049】
図9は、本発明の第2の実施形態の携帯端末内の構成と機能ブロックを示す図である。本実施形態では、
図2に示す第1の実施形態の構成にデータ処理部の機能ブロックとして、ユーザの顔認証を行う認証手段としての顔認証部210を追加したものであり、その他の第1の実施形態と同一符号を付した機能ブロックは第1の実施形態の機能と同様である。ただし、第2の実施形態では、顔認証部210の処理のためにメモリ110等にユーザの顔認証用の顔画像の情報等が予め登録され、顔認証部210ではビューア起動後に顔画像取得部203で取得される画像内の顔画像の情報とメモリ110内等に登録された顔画像の情報の照合を行い、認証が成立した場合に、その後のデータ処理部の処理を継続し、認証が不成立の場合はビューアによる表示を禁止(終了)する機能を有する。プログラム制御の場合にはメモリ110内の認証手段のプログラム機能を追加する。認証用の顔画像の情報としては以下説明するように顔の特徴点情報を利用することが可能である。
【0050】
図10は、第2の実施形態の処理フローチャートを示す図である。
図2に示す第1の実施形態のフローチャートに、顔認証部210による本人確認ができない場合の強制終了の処理ステップを追加している。本実施形態は、顔認証の処理ステップ(901)、認証の成否の判断ステップ(903)及びビューア強制終了の処理ステップ(905)を追加している点を除けば
図4に示す第1の実施形態の処理フローチャートの処理と同様であるから、以下追加ステップに関連する処理動作についてのみ説明する。
【0051】
本実施形態では、
図10に示すように、ステップ901の特徴点検出後に、ステップ902で抽出された特徴点を用いて顔認証処理を行う。例えば予め登録されている本人の顔画像の特徴点と照合して顔認証を行い、ステップ903で認証結果により本人か否かを判断し、本人として認証された場合のみ初期フレームか否かを判断する分岐ステップ904の処理へ進み、本人でないとされた場合は、ステップ905で強制的にビューアを終了する。
【0052】
[他の実施形態]
第1、2の実施形態では、表示画面への表示対象の表示範囲の制御例として、撮影画像内の利用者の顔の方向による表示部分の移動(スクロール)の表示制御と、同画像内の利用者の顔の大きさによる表示部分の拡大、縮小の表示制御とを組み合わせた構成例を説明したが、本発明の他の実施形態として、前述の対応する特徴点の選定により顔の方向による表示部分の移動(スクロール)の表示制御を行う実施形態、又は、顔の大きさによる表示部分の拡大、縮小の表示制御を行う実施形態を構成できることは明らかである。
【0053】
また、以上の実施形態における顔の方向識別に用いる特徴点数は多ければ多いほど精度が増すため、以上説明した特徴点以外の箇所を特徴点として利用ことが可能である。更に顔の方向等の判定のアルゴリズムとして、簡単な顔認識の手法を使用した例を説明したが、顔画像の認識技術には様々な方法があり、より高精度な認識を追求する上では、特徴点数に応じて他の高度な画像認識アルゴリズムへの代替も可能である。
【0054】
また、他の実施形態として、携帯端末への適用においては、既に備えられているような標準のカメラに代えてステレオカメラを搭載することで奥行き方向の移動量をより高精度に測定することが可能であり、このようなカメラを利用することも可能である。
【0055】
更に、以上の実施形態では、携帯電話機等の携帯端末を例とし、その表示画面の制御に特化して説明しているが、本発明はパーソナルコンピュータ(PC)のディスプレイや、駅の券売機、ATMなどの入力インタフェースとしても適用可能であることは明らかである。