(58)【調査した分野】(Int.Cl.,DB名)
前記記録画像処理部は、前記モニター画像の一部から所定の注目オブジェクトに対応するオブジェクト画像を認識しないときに前記記録画像を破棄する請求項1に記載の電子機器。
前記記録画像処理部は、前記モニター画像の一部から前記オブジェクト画像を認識したときに、前記オブジェクト画像に欠損が生じないでかつ焦点が当たるように前記モニター画像の一部を加工して所定の記録様式の前記記録画像を生成する請求項2に記載の電子機器。
前記デジタル・カメラが前記撮影者の顔と前記撮影者の周囲の被写体を同時に撮影できる広角レンズまたは超広角レンズを含む請求項1から請求項7のいずれかに記載の電子機器。
前記オブジェクト画像を含むと判断したときに前記モニター画像の一部に対して拡大または縮小する処理をしてから所定の記録様式の前記記録画像を生成するステップを有する請求項11に記載の方法。
【発明を実施するための形態】
【0017】
[画像記録再生システムの概要]
図1〜
図3は、本実施の形態にかかる画像記録再生システム200(
図5参照)の概要を説明するための図である。
図1は、画像記録再生システム200を実装した電子機器10の近辺に存在する撮影者102が周辺の風景(モニター被写体100)のある一部の領域を注視している様子を示している。電子機器10は、撮影者102が身体に装着して使用するペンダント式コンピュータ、ヘッド・マウント・ディスプレイ、またはそれらを総称するウェアラブル・コンピュータであってもよい。電子機器10は、デジタル撮影が可能な超広角レンズを搭載したカメラ・モジュール53(
図4参照)を搭載しており、
図2に示すような半球状のモニター被写体100を撮影することができる。モニター被写体100は、撮影者102の顔と撮影者102がみている風景を含む。
【0018】
カメラ・モジュール53は、モニター被写体100を撮影して複数のフレームが連続するモニター画像101(
図3参照)を生成することができる。画像記録再生システム200は、撮影者102の視線103をモニター画像101上の座標として同定することができる。撮影者102は、モニター被写体100をみているときに常に視線103を動かしているが、興味のある対象者や印象の深い被写体に目を向けたときは、視線103が当該被写体の付近に集中する。
【0019】
視線103がモニター被写体100の所定の領域に所定の時間以上留まっているときに本実施の形態で定義する注視条件が成立する。注視条件が成立したときの視線103の方向にあるモニター被写体100の領域には、撮影者102にとって記録する価値が高いという蓋然性があるとみなすことができる。本実施の形態では注視条件が成立したときに画定したモニター被写体100に対する視線の移動範囲から特定したモニター画像101の領域を注視領域105a、105b(
図3参照)として定義する。
【0020】
図2は、モニター被写体100の任意の位置に複数の注視領域が存在する様子を概念的に示している。各注視領域のサイズは注視条件によって異なる。
図3は、モニター画像101が背景画像107と、雲、飛行機、樹木、川、建物、自動車および花などの複数のオブジェクト画像109と、撮影者102の顔画像102aを含んでいる様子を示している。ここにオブジェクト画像109は、撮影者102またはシステムがあらかじめ登録した興味のあるテーマ(注目オブジェクト)の画像を意味し、背景画像107はオブジェクト画像109と顔画像102aを除いたモニター画像101を意味する。
【0021】
一例として画像記録再生システム200は、モニター画像101から注視領域105aが画定する画角(被写体の撮影範囲)の選択画像120を抽出する。選択画像120は、登録された注目オブジェクトに対応する樹木と飛行機のオブジェクト画像109を含んでいるが、樹木の一部は画角から外れている。画像記録再生システム200は、あらかじめ登録したいずれかの注目オブジェクトに対応するオブジェクト画像109を選択画像120が含むか否かを判断する。
【0022】
樹木と飛行機のように複数のオブジェクト画像が登録されている場合は、画像記録再生システム200は各オブジェクト画像に欠損が生じないように選択画像120の画角を調整した記録画像130を生成する。他の例では、画像記録再生システム200は選択画像120が含む複数の注目オブジェクトに対応する樹木と飛行機のオブジェクト画像109のそれぞれに焦点が当たるように画角を調整した複数の記録画像131、132を生成する。
【0023】
さらに他の例では、画像記録再生システム200は、モニター画像101の注視領域105aで囲まれた領域が、登録された1個の注目オブジェクトに対応するオブジェクト画像109を含むときは、当該オブジェクト画像109を中心に配置するように画角を調整した記録画像140を生成する。さらに他の例では、画像記録再生システム200は、注視条件が成立したときに画定した注視領域105bが登録されたいずれの注目オブジェクトに対応するオブジェクト画像109を含まない場合でも、モニター画像101から注視領域105bが画定する画角で選択画像121を抽出し、保存に都合のよい記録様式に変換した記録画像150を生成する。
【0024】
[画像記録再生システムのハードウェア構成]
図4は、画像記録再生システム200を実装した電子機器10のハードウェアの構成を説明するための機能ブロック図である。画像記録再生システム200は、日常の生活に関するライフ・ログ・データの記録や、会議や面会などのビジネスに関するビジネス・ログ・データの記録を撮影者102が移動中にまたは特定の場所で行う。
図4は、移動中に記録するのに都合のよい携帯式の電子機器10を例示している。
【0025】
電子機器10は、本体ユニット11と装着ユニット51で構成している。電子機器10は、画像記録再生システム200の専用装置であってもよいし、通常のコンピュータに画像記録再生システム200の機能を組み込んだものでもよい。装着ユニット51は、人間の頭部、耳、または腕などに帽子、眼鏡、アームバンドの形態で装着してもよいし、撮影時に手にもつようにしてもよい。
【0026】
ここでは本体ユニット11を、装着ユニット51を装着した撮影者102が移動中に携帯する例を示すが、本体ユニット11を遠方に配置してネットワークを通じて装着ユニット51に接続するようにしてもよい。本体ユニット11と装着ユニット51は相互に近距離無線通信を行う無線モジュール24、62を搭載している。ただし、本体ユニット11を撮影者102が携帯する場合は、本体ユニット11と装着ユニット51を有線で接続してもよい。本体ユニット11は、CPU13、システム・メモリ15、I/Oインターフェース17、SSD19、タッチスクリーン21、およびネットワークと通信する無線モジュール23などの周知の要素を含む。SSD19は、画像記録再生システム200の主要な部分を構成するソフトウェアを格納する。
【0027】
装着ユニット51は、カメラ・モジュール53、マイクロフォン55、操作ボタン57、加速度センサー59およびGPSモジュール61などの周知の要素を含む。カメラ・モジュール53は、CMOSまたはCCDなどのイメージ・センサ、イメージ・シグナル・プロセッサ、およびUSBインターフェースなどで構成している。カメラ・モジュール53は、一例として超広角レンズを搭載しており、水平方向が360度で垂直方向が約180度の半球状のモニター被写体100の風景を撮影することができる。カメラ・モジュール53は、モニター被写体100の画像を光学処理、画像処理、および撮像素子の配列またはそれらの組み合わせによって歪みを補正した平面状のモニター画像101として撮影することができる。
【0028】
カメラ・モジュール53はVGA(640×480)、QVGA(320×240)、WVGA(800×480)またはWQVGA(400×240)などのモニター画像101の画像データを一例として30fpsのフレーム・レートで本体ユニット11に転送する。画像記録再生システム200は、顔画像102aの目の瞳孔の向きから視線103の位置をモニター画像101上の座標として同定する。超広角レンズは人間の目よりも広い視野をもち、撮影者102の目と注視領域105a、105bが囲んだ領域の被写体を同時に撮影することができるため、画像記録再生システム200は複数のカメラを使用して視線を同定する場合に必要になる各カメラの光軸を関連付けるための処理が不要になる。
【0029】
超広角レンズを使用することで、撮影者102と注視領域105a、105bの被写体を1つのカメラ・モジュール53で撮影することができるが、前提として装着ユニット51は、視線103と視線方向の被写体の同時撮影に支障のない位置に装着する必要がある。装着ユニット51の身体に対する装着のしかたによっては、超広角レンズより画角が狭い広角レンズやより画角が広い魚眼レンズを採用することもできる。
【0030】
たとえば装着ユニット51を眼鏡のように装着する場合は、画角が超広角レンズより狭い人間の視野程度の広角レンズを採用することができるし、ペンダントのように首からつり下げるときは、画角が超広角レンズより広い魚眼レンズを採用することもできる。魚眼レンズを採用するときは、ソフトウェアで画像の歪みを補正してから記録することができる。また、カメラ・モジュール53は、2台の超広角レンズ・カメラを装着ユニット51の筐体に背中合わせに配置することで、球状の全方位に近いモニター被写体を撮影するようにしてもよい。
【0031】
多くのハードウェアの要素は周知であるが、以下においてはこれらが本実施の形態に関係する主要な機能について説明する。本実施の形態においては、マイクロフォン55、操作ボタン57、加速度センサー59、およびGPSモジュール61は、注視領域105a、105bを画定するための注視条件の調整に利用することができる。さらにマイクロフォン55は、特定の人物やオブジェクトの音声を認識するための音声データの収録に利用することができる。さらにマイクロフォン55は、記録画像130〜150とともに記録する音声データの収録に利用することができる。
【0032】
操作ボタン57は、撮影者102の操作で注視領域105a、105bを画定するための入力デバイスとして利用する。加速度センサー59は、装着ユニット51に生じた3軸方向の加速度データを生成する。画像記録再生システム200は加速度データによって装着ユニット51の揺動の程度を判断し、カメラ・モジュール53の撮影条件の成立を判断することができる。このときカメラ・モジュール53は、加速度センサー59からの信号でスリープ状態からウェイクすることができる。さらに画像記録再生システム200は、加速度センサー59が生成した重力加速度のデータから装着ユニット51の姿勢の変化を検出して、姿勢の変化量が少ないときに記録画像の生成頻度を下げたり停止したりすることができる。
【0033】
GPSモジュール61は、装着ユニット51の現在位置を検出してGPSデータを生成する。画像記録再生システム200は、GPSデータを利用して、装着ユニット51が現在撮影者102にとって興味のあると考えられる場所に存在するか、そうでないと考えられる場所に存在するかを判断して記録画像の生成頻度を調整することができる。SSD19は、記録画像130〜150およびそれらの撮影時間帯に収録した音声データなどを記録する。
【0034】
画像記録再生システム200は、本体ユニット11および装着ユニット51をスマートフォン、タブレット端末、または携帯電話などのように人間が保持しながら使用できる携帯式の電子機器に搭載することができる。さらに他の例として画像記録再生システム200は、特にビジネス・ログをする場合において、停止した位置で使用するノートブック型パーソナル・コンピュータ、デスクトップ型パーソナル・コンピュータまたは専用の画像記録装置に搭載することができる。
【0035】
[画像記録再生システムのソフトウェア構成]
図5は、画像記録再生システム200の構成を説明するための機能ブロック図である。画像記録再生システム200は、
図4で説明したハードウェア要素とSSD19に格納したソフトウェア要素で構成している。画像記録再生システム200は、モニター画像処理部201、記録画像処理部203、記録再生処理部207、注視領域画定部209、注視条件調整部211、および機能設定部213の主要な機能を形成するソフトウェアを含んでいる。
【0036】
これらのソフトウェアは本体ユニット11のSSD19に格納されておりCPU13が実行する。モニター画像処理部201、記録画像処理部203、記録再生処理部207、注視領域画定部209、注視条件調整部211、および機能設定部213は、すべて本体ユニット11に搭載する必要はなく、一部を装着ユニットに搭載したり、一部またはすべてをネットワークで接続するサーバに搭載したりしてもよい。
【0037】
モニター画像処理部201、記録画像処理部203、記録再生処理部207、注視領域画定部209、注視条件調整部211、および機能設定部213は、CPU13、システム・メモリ15、およびI/Oインターフェース17などと協働して画像記録再生システム200のハードウェア要素としても機能する。
図5に示したソフトウェアを含んで構成した要素は一例であり、当業者が予測できる範囲で各要素を分割したり統合したりする場合も本発明の範囲に含む。また、
図5に示したソフトウェアを含んで構成した要素の一部をハードウェアで構成するようにしてもよい。
【0038】
最初に機能設定部213の機能を説明する。機能設定部213は、撮影者102が入力するインターフェースと本体ユニット11のシステムから情報を取得するインターフェースを備えている。
図6は、機能設定部213がユーザ・インターフェースとして提供する入力画面250の一例を示す図である。画像記録再生装置200は、入力画面250をタッチスクリーン21に表示する。撮影者102は入力画面250に対して動作モードと記録モードを設定することができる。
【0039】
一例として動作モードは、ライフ・ログとビジネス・ログに関する複数の記録目的を含んでいる。ライフ・ログには、記録目的として「日常生活」、「買い物」、「旅行」、「散歩」を例示している。ビジネス・ログには、記録目的として「会議」、「面会」、「文章」、および「点検作業」を例示している。撮影者102はタッチスクリーン21が表示する入力画面250のチェック・ボックス251に記録目的を設定する。各記録目的には、注目オブジェクトを入力するオブジェクト・ウィンドウ253、記録画像とともに行う音声の記録を設定するチェック・ボックス255、注視条件を調整する調整情報を入力する調整ウィンドウ257、259、261を設けている。
【0040】
注目オブジェクトは、撮影者102が特に興味があるテーマ、画像として残しておきたいテーマまたは有益な情報になり得るテーマなどを普通名称またはアイコンなどで抽象化した情報に相当する。さらに注目オブジェクトは、特定の人物を顔認識するための特徴情報を含んでいてもよい。たとえば撮影者102は、日常生活の記録目的に対応するオブジェクト・ウィンドウ253に、料理、人物、および動物などの日常生活で残しておきたい対象の普通名称を注目オブジェクトとして入力することができる。こうすることで、画像記録再生システム200は、撮影者102の家族、来訪者、食事内容、およびペットなどを記録画像130〜132として記録することができる。
【0041】
さらに撮影者102は会議の記録目的に対応するオブジェクト・ウィンドウ253に、プロジェクタ、および人物を入力することができる。こうすることで画像記録再生システム200は、会議で使用したプロジェクタの画面や参加者の顔画像を記録画像130〜140として記録することができる。注目オブジェクトとして特定の人物の顔を認識するための特徴情報を入力すれば、画像記録再生システム200は当該人物だけを記録画像131、132、140として記録することもできる。
【0042】
さらに機能設定部213はシステムに対するインターフェースを利用して、画像記録再生システム200が保存しているカレンダー、GPSデータ、電子メール、および閲覧したWebサイトなどから抽出した撮影者102の行動履歴や取得した情報から想定した注目オブジェクトを、関連する記録目的のオブジェクト・ウィンドウ253に自動的に追加することができる。
【0043】
チェック・ボックス255を設定すると、画像記録再生システム200は、記録画像130〜150を生成したモニター画像101のフレームの撮影時刻の近辺の時間にマイクロフォン55が収録した音声を記録画像130〜150の附帯情報として記録することができる。調整ウィンドウ257、259、261には、注視条件を調整するための緩和情報、強化情報、および画定情報を調整情報として肯定形式または否定形式で入力することができる。
【0044】
緩和情報は注視条件の成立を容易にする調整情報で、強化情報は注視条件の成立を困難にする調整情報で、画定情報は注視条件をただちに成立させる調整情報に相当する。調整情報には、注目オブジェクトの一般名称、装着ユニット51の地理的な位置を評価するためのGPSデータ、装着ユニット51の姿勢の変化量を評価するための加速度データ、人物を認識するための音声の特徴情報、またはオブジェクトを認識するための画像の特徴情報などを入力することができる。音声の特徴情報には白熱した議論の様子を識別する特徴情報を含めることができる。画像の特徴情報には、特定の人物の顔を識別する特徴情報、または人間の特定の動作を識別する特徴情報を含めることができる。
【0045】
一例では、緩和情報としてGPSデータまたは、音声または画像を認識するための特徴情報を入力することができる。強化情報として加速度データまたはGPSデータを入力することができる。画定情報として注目オブジェクトの名称または人間の動作を認識するための特徴情報を入力することができる。機能設定部213は、入力されたチェック・ボックス251、255、オブジェクト・ウィンドウ253、調整ウィンドウ257、259、261の内容を記録画像処理部203、記録再生処理部207、および注視条件調整部211に設定する。
【0046】
記録モードの設定は、SSD19に記録する画像の種類をチェック・ボックス263に設定することで行う。記録モードは、複数の注目オブジェクトに対応する複数のオブジェクト画像を含む1つの記録画像130、それぞれ単独の注目オブジェクトに対応するオブジェクト画像を含む複数の記録画像131&132、単独の注目オブジェクトに対応するオブジェクト画像を含む1つの記録画像140、およびオブジェクト画像の存否を判断しないで画定領域105bで囲まれた領域を記録する記録画像150のいずれかを選択することができる。チェック・ボックス263は複数を設定してもよい。機能設定部213はチェック・ボックス263の内容を記録画像処理部203および記録再生処理部207に設定する。
【0047】
モニター画像処理部201は、カメラ・モジュール53が転送する画像データを受け取る。モニター画像処理部201は一例として動画再生の可能な30fpsのフレーム・レートで受け取った画像データを、所定の時間の間SSD19に設けたバッファに記録する。画像データのフレーム・レートは、視線103のトラッキングに支障がでない程度まで下げることができる。バッファはSSD19以外の不揮発性メモリに設けてもよい。
【0048】
カメラ・モジュール53は、モニター画像の転送を開始するときは、最初にローリング・シャッタの露光時間(露光量)、ホワイト・バランス、およびAGC回路のゲインなどのキャリブレーションを行い、その時点での撮影環境に最適なパラメータ値を取得して設定する。しかし実際には撮影条件が撮影当初から変化して、モニター画像処理部201は望ましい画質のモニター画像を取得できなくなることがある。これに対応するために、モニター画像処理部201は、モニター画像を評価した結果に基づいてカメラ・モジュール53にキャリブレーションを再実行するようにリクエストすることができる。
【0049】
モニター画像処理部201は、バッファに記録する画像データにシステムが生成する基準時刻のタイム・スタンプを付加する。画像記録再生システム200は、CPU13がアイドル状態または使用率が低い状態のときにバッファに記録した画像データを利用して記録画像の生成および記録をすることができる。バッファの容量は、画像記録再生システム200が、モニター画像101を処理するまでの想定時間に応じて小さくすることができる。
【0050】
バッファに記録した画像データは、記録画像130〜150を生成するためのモニター画像101の処理(記録画像を生成しない場合も含む。)が終わると消去することができるため、SSD19には有益な記録画像130〜150だけを記録することができる。なお、モニター画像処理部201は、記録画像を生成したフレームの前後の所定数のフレームをSSD19に保存して、後に記録画像の前後のフレームの画像を閲覧できるようにしてもよい。
【0051】
記録画像処理部203は、注視領域画定部209から注視領域105a、105bの座標を受け取ったときに、モニター画像101の中の注視領域105a、105bで囲まれた領域の画像を選択画像120、121としてモニター画像処理部201から取得する。取得する選択画像120、121は、注視領域105a、105bを画定するために設定した所定の時間(注視時間)にモニター画像処理部201が取得した連続する複数のフレームの中から選択することができる。たとえば、注視領域105a、105bを画定する際に、30フレームのモニター画像101を使用した場合は、15フレーム目の画像を選択画像120、121とすることができる。
【0052】
記録画像処理部203は、周知のオブジェクト認識機能を備えており、選択画像130〜132、140のいずれかを記録する記録モードが設定されたときは、選択画像120、121が含むオブジェクト画像を認識して、オブジェクト・ウィンドウ253に入力された注目オブジェクトと比較することができる。記録画像処理部203は、記録モードとして複数のオブジェクト画像を含む記録画像130が設定されたときに、選択画像120、121のなかに複数の注目オブジェクトに対応するいずれかのオブジェクト画像109が存在するか否かを判断する。記録画像処理部203はいずれの注目オブジェクトに対応するオブジェクト画像109も存在しないと判断した場合は当該選択画像121、121を破棄して記録画像130〜150を生成しないようにすることができる。
【0053】
記録画像処理部203は選択画像120にいずれかの注目オブジェクトに対応するオブジェクト画像109が存在すると判断した場合は、それらがすべて記録様式の画角に収まっているか否かを判断する。記録様式に収まっていないと判断したときは、記録画像処理部203は、注視領域105aの中心座標をずらし、かつ、注目オブジェクトに対応するオブジェクト画像が中心に配置されるように拡大または縮小したモニター画像101の領域を抽出して記録様式に変換し記録画像130を生成する。記録画像処理部203は必要に応じて、記録画像130が含むオブジェクト画像109の天地が記録様式の画角のなかで正しく整合するように回転処理をする。
【0054】
記録画像処理部203は、記録モードとしてそれぞれオブジェクト画像109を含む複数の記録画像131&132が設定されたときに、選択画像120のなかに当該注目オブジェクトに対応するいずれかのオブジェクト画像109が存在するか否かを判断し記録様式の画角に天地が整合して収まるように調整した記録画像131、132を生成する。このとき背景画像107からオブジェクト画像109だけをトリミングする画像処理をしてもよい。
【0055】
記録画像処理部203は、記録モードとして1つのオブジェクト画像109を含む1つの記録画像140が設定されたときに、モニター画像101の注視領域105aで囲まれた領域に注目オブジェクトに対応するオブジェクト画像109が存在する場合だけ、記録様式に加工した記録画像140を生成する。記録画像処理部203は、記録モードとしてオブジェクト画像の存否を判断しない記録画像150が設定されたときに、注視条件が成立したときの注視領域105bで切り取った選択画像121の画角を調整した記録画像150を生成する。
【0056】
このとき、記録画像処理部203はオブジェクト・ウィンドウ253に注目オブジェクトが入力されていても選択画像121について注目オブジェクトに対応するオブジェクト画像109の存否を判断しないが、記録画像140がオブジェクト・ウィンドウ253に入力された注目オブジェクトに対応するオブジェクト画像109を偶然含むことはあってもよい。記録画像処理部203は望ましい画質の記録画像130〜150を生成できないときにモニター画像処理部201を通じてカメラ・モジュール53にキャリブレーションの再実行を要求することができる。記録画像処理部203は、生成した記録画像130〜150を記録再生処理部207に送る。
【0057】
記録画像処理部203は、周知の画像分析機能を備えており、前回生成した選択画像120、121と今回生成した選択画像120、121との輝度、明度、彩度、または色相などの分布を分析して差が少ない場合は、選択画像120、121は類似していると判断して今回生成した選択画像120、121を破棄することができる。記録画像処理部203は、注目オブジェクトを設定しないときに抽出した選択画像121において、空や地面などのあらかじめ設定した一般的に意味のないと考えられる画像が大部分を占める場合は、当該選択画像121を破棄することができる。
【0058】
記録再生処理部207は、機能設定部213が設定した動作モードの記録目的ごとに分類したフォルダーに日付、時刻、撮影位置の情報などのメタ情報を付加して記録画像130〜150をSSD19に記録する。記録再生処理部207は、チェック・ボックス255に音声記録が設定されているときは、注視条件調整部211から受け取ったマイクロフォン55の収録データも記録画像130〜150の附帯情報として記録する。記録再生処理部207は、SSD19に保存した記録画像130〜150を撮影者102が再生する際のインターフェース画面を提供する。インターフェース画面には、保存した記録画像のサムネールを含んでもよい。
【0059】
注視領域画定部209は、周知の顔認識機能を備えており、あらかじめ登録した撮影者102を認識して、モニター画像101が含む他の人物から撮影者102の顔を識別することができる。注視領域画定部209は周知の視線同定機能を備えており、モニター画像処理部201から受け取ったモニター画像101が含む顔画像102aの目の動きから、アイ・トラッキング技術を使ってモニター画像101の座標における視線103の位置を同定する。
図7は同定した視線103の座標から注視領域105a、105bを画定する方法の一例を説明する図である。注視領域画定部209は、たとえば0.1秒といった単位時間ごとに取得したモニター画像101のフレームから視線103の座標を計算する。
【0060】
たとえば、モニター画像101のフレーム・レートが30fpsのときは、連続するフレームについて3フレームごとのモニター画像101から視線103の座標104を計算する。注視領域画定部209は、たとえば1秒といった注視領域105a、105bを画定するための注視時間を設定し、注視時間に計算した10個の座標104のうち、
図7(A)に示すように最も外側の座標を通過する矩形領域106aを特定する。注視領域画定部209は矩形領域106aの面積が所定の上限の閾値以下または所定の上下限の閾値の範囲内と判断したときは、注視条件が成立したとみなすことができる。矩形領域106aの面積は注視時間の間の座標104の離散量に相当する。離散量が所定の閾値より小さい場合は、撮影者102が記録に値する特定の被写体をみている可能性が高いとみなすことができる。
【0061】
注視領域画定部209は、注視条件が成立したときの矩形領域106aを注視領域105a、105bとして画定する。なお、注視領域105a、105bは矩形以外の形状で画定してもよい。また、新聞のような段組みの文章を読むと判断した場合には、視線103はほぼ直線状に動くことを前提にすると、注視領域画定部209にオブジェクト認識機能をもたせて新聞を読んでいると判断したときは、読んだ範囲を記録画像に含めるために、最も外側の座標を越えた範囲に矩形領域106aを定めるようにしてもよい。
【0062】
注視領域画定部209は、
図7(B)に示すように所定の注視時間のなかで同定した10個の座標104が形成する矩形領域106bの面積が、所定の閾値より大きい場合は注視条件が成立しないとみなして注視領域105a、105bを画定しないようにすることができる。この場合は、撮影者102の視線103の動きが大きいため特に興味をもった被写体をみていないと想定する。
【0063】
注視領域画定部209は、
図7(C)に示すように所定の注視時間のなかで同定した10個の座標104が形成する矩形領域106cの面積が、所定値より小さい場合は、見かけ上は特定の方向を注視しているが、撮影者102が意識して風景をみているのではなく考えごとをしたり瞑想したりしているとみなして注視領域105a、105bを画定しないようにすることができる。なお、離散量の下限の閾値は設定しないようにしてもよい。
【0064】
図8は注視条件の成立を判定する他の方法を説明する図である。
図8は、横軸が経過時間で縦軸が視線103の座標104の離散距離を示している。離散距離は、座標104の離散量に相当する。時間軸上には、注視領域105a、105bの判断を開始する開始時刻t0、t1、t2・・・をたとえば1秒といった注視時間ごとに設定する。離散距離は各開始時刻における座標104を基準(離散距離0)として、それ以後の各座標104についての開始時刻の座標に対する距離を示している。離散距離には、上限と下限の閾値Th1、Th2を設定する。
【0065】
注視領域画定部209は、たとえば隣接する開始時刻t0、t1の間の注視時間に取得した10個の座標104の中で、離散距離が閾値Th1と閾値Th2の間に入る座標104の数が所定値以上のときは注視条件が成立したと判断し、それ以外のときは不成立と判断することができる。そして注視条件が成立したときは、10個の座標104または、閾値Th1、Th2の範囲に入る座標104に対して
図7と同様に矩形領域106aを設定し注視領域105a、105bを画定することができる。注視領域画定部209は、アイ・トラッキング技術に代えて顔の向きと目の間に設定した顔の法線から視線103を推定して、擬似的に視線103を同定することもできる。
【0066】
注視領域画定部209は、注視条件調整部211から注視条件を調整するための緩和指示、強化指示、または画定指示を受け取ることができる。注視領域画定部209は緩和指示を受け取ったときに、注視時間を短くしたり離散量の閾値を緩めたりして注視条件を緩和することができる。注視領域画定部209は強化指示を受け取ったときに、注視時間を長くしたり離散量の閾値を厳しくしたりして注視条件を強化することができる。注視領域画定部209は画定指示を受け取ったときに、受け取ったタイミングの前後の所定数のフレームから
図7または
図8を参照して説明した方法で視線103の座標を同定し注視領域105a、105bを画定することができる。
【0067】
注視条件調整部211は、周知の音声認識機能、顔認識機能、オブジェクト認識機能、および動作認識機能を備えている。注視条件調整部211は、マイクロフォン55、操作ボタン57、加速度センサー59、またはGPSモジュール61の入力を、システムの基準時刻から生成したタイム・スタンプを付加してSSD19のバッファに格納する。注視条件調整部211は、マイクロフォン55が収録した音声データ、操作ボタン57の入力、加速度センサー59が検出した加速度データ、GPSモジュール61が生成したGPSデータまたはモニター画像処理部201から取得したモニター画像101と、入力画面250の調整ウィンドウ257、259、261に入力された調整情報に従って、注視領域画定部209に注視条件を調整するための指示をする。
【0068】
注視条件調整部211は、たとえば調整ウィンドウ257に特定の人物または特定のオブジェクトの音声を認識するための特徴情報が入力されていれば、マイクロフォン55が検出した音声データから当該人物または当該オブジェクトを認識したときに注視領域画定部209に緩和指示をすることができる。音声としては、会議での議論が白熱したときの参加者の音声の高揚を示す特徴情報を入力することもできる。注視条件調整部211は、たとえば調整ウィンドウ257に特定の人物の顔を認識するための特徴情報が入力されていれば、モニター画像101に当該人物の存在を認識したときに注視領域画定部209に緩和指示をすることができる。このときの人物としては、ビジネス上の重要人物や注目している人物とすることができる。
【0069】
注視条件調整部211は、たとえば調整ウィンドウ257にGPSデータが入力されていれば、GPSモジュール61が検出したGPSデータから装着ユニット51が所定の場所に存在すると認識したときに、注視領域画定部209に緩和指示をすることができる。このとき調整ウィンドウ257に入力するGPSデータは、否定論理で入力した記録したくない日常的な移動範囲または肯定論理で入力した撮影者102が特に関心のある場所とすることができる。
【0070】
注視条件調整部211は、たとえば調整ウィンドウ259に装着ユニット51の姿勢の変化量を示す加速度データが入力されていれば、選択画像120、121を前回生成してから今回生成するまでの間に加速度センサー59が検出した加速度データから装着ユニット51の姿勢の変化が少ないと判断したときに、注視領域画定部209に注視条件を強化するための強化指示をすることができる。装着ユニット51の姿勢の変化が小さいときは、撮影者が同じ被写体をみている可能性が高いため冗長性の高い記録画像の生成を回避することができる。
【0071】
注視条件調整部211は、操作ボタン57の入力を受け取ったときは、注視領域画定部209にただちに注視領域105a、105bを画定するように注視条件の画定指示をすることができる。注視条件調整部211は、たとえば調整ウィンドウ261に人物の特定の動作を示す特徴情報が入力されていれば、モニター画像101から当該動作の存在を認識したときに注視領域画定部209に注視条件の画定指示をすることができる。
【0072】
この場合に入力しておく動作は、会議に参加している撮影者102がメモをとったり、プロジェクタを使って説明したりする会議の重要な場面で行われる自然な行為とすることができる。注視条件調整部211は、たとえば調整ウィンドウ261に特定の注目オブジェクトが入力されていれば、モニター画像101が当該注目オブジェクトに対応するオブジェクト画像109を含むときに、注視領域画定部209に注視条件の画定指示をすることができる。注視条件調整部211は、記録再生処理部207の要求に応じて、音声データを記録再生処理部207に送る。
【0073】
上述のように記録画像処理部203は、記録画像130〜150の画質が低下したときにカメラ・モジュール53に対してキャリブレーションを再実行するように要求することがある。このとき、カメラ・モジュール53とモニター画像処理部201と間の通信を無線モジュール24、62で行うと、通信条件によってはモニター画像の転送が遅れて注視領域105a、105bを画定するタイミングが、撮影者102の視線103の動きより遅れて撮影機会を逃す場合がある。
【0074】
これに対処するために、画像記録再生システム200は、モニター画像処理部201、記録画像処理部203、注視領域画定部209、注視条件調整部211、および機能設定部213を装着ユニット51に実装することもできる。この場合装着ユニット51には、各機能を実現するプログラムと、CPU、システム・メモリ、I/Oコントローラなどのハードウェアとを実装する。
【0075】
[画像記録再生システムの動作]
つぎに、
図9のフローチャートを参照して、画像記録再生システム200の動作を説明する。ブロック301で電子機器10が通常の動作を開始する。ブロック303で撮影者102は入力画面250を通じて動作モードおよび記録モードを設定する。ここでは記録目的のチェック・ボックス251に散歩を設定し、音声記録のチェック・ボックス255を設定し、オブジェクト・ウィンドウ253に注目オブジェクトとして樹木と飛行機を入力し、調整ウィンドウ257、259に緩和情報と強化情報としてそれぞれ異なるGPSデータを入力しているものとする。記録モードは、選択画像131&132を設定しているものとする。
【0076】
ブロック305で加速度センサー59が検出した振動または揺動を示す加速度データが所定値以下のときに、撮影条件が成立して画像記録再生システム200が動作を開始する。ブロック307で、カメラ・モジュール53がモニター被写体100の撮影を開始して、モニター画像101を出力する。モニター画像処理部201は受け取ったモニター画像101にタイム・スタンプを付加してSSD19のバッファに記憶する。
【0077】
入力画面250で音声記録のチェック・ボックス255が設定されているため、ブロック309で注視条件調整部211は、モニター画像処理部201がモニター画像101を受け取っている時間帯を含むマイクロフォン55が収録した音声データをバッファに記憶するために、タイム・スタンプを付加して記録再生処理部207に送る。なお、注視条件調整部211はいずれかの調整ウィンドウ257、259、261に音声の特徴情報が入力されているときも音声データをバッファに記憶するために、タイム・スタンプを付加して記録再生処理部207に送る。さらに、注視条件調整部211は、操作ボタン57、加速度センサー59およびGPSモジュール61の入力データをバッファに記憶するために、タイム・スタンプを付加して記録再生処理部207に送る。
【0078】
画像記録再生システム200は、ブロック301からブロック309までの手順を撮影条件が成立している間は継続して行う。画像記録再生システム200は所定量の画像データがバッファに記憶された段階で記録画像の生成処理を開始してもよいが、好ましくはCPU13の使用率が低下したときに記録処理を開始する。バッファに記憶している画像データ、音声データ、操作ボタンの入力データ、加速度データ、およびGPSデータにはすべて基準時刻のタイム・スタンプを付加しているため画像記録再生システム200は、各データをモニター画像101のフレームを撮影したタイミングに同期させて処理することができる。
【0079】
ブロック311で、注視条件調整部211は、調整ウィンドウ257、259に緩和情報および強化情報として入力されているGPSデータと、GPSモジュール61から取得した装着ユニット51の現在の位置を示すGPSデータとを比較する。注視条件調整部211はブロック313で、緩和情報または強化情報としてのGPSデータと現在位置を示すGPSデータが一致したときは、注視領域画定部209に注視条件の緩和指示または強化指示のいずれかをする。注視条件調整部211は、調整ウィンドウ261に動作を認識するための特徴情報または注目オブジェクトの普通名称が画定情報として入力されているときは、モニター画像101が当該画定情報を含むと判断したときに、注視領域画定部209に注視条件の画定指示をする。
【0080】
ブロック314で注視領域画定部209は、ディフォルトの注視条件または注視条件調整部211から指示された注視条件にしたがって、モニター画像101が含む顔画像102aから撮影者の視線103を同定して注視領域105a、105bを画定しその座標を記録画像処理部203に送る。ブロック315で記録画像処理部203は、モニター画像101から注視領域105aまたは注視領域105bで囲まれた領域の選択画像120または選択画像121を抽出する。
【0081】
ここでは、オブジェクト・ウィンドウ253に樹木および飛行機の注目オブジェクトが入力されているため、ブロック317で記録画像処理部203は、選択画像120、121が、樹木または飛行機のいずれかの注目オブジェクトに対応するオブジェクト画像109を含むか否かを判断する。オブジェクト画像109を含むと判断したときは、それらが選択画像120の中に欠損がない状態で含まれているか否かを判断する。
【0082】
樹木または飛行機のオブジェクト画像109に欠損がある場合は、それらを完全に含む選択画像をモニター画像処理部201から取得する。選択画像におけるオブジェクト画像109のサイズが小さいときはオブジェクト画像109が中心になるようにしてさらに拡大した選択画像をモニター画像処理部201から取得する。記録画像処理部203は、選択画像から樹木と飛行機のオブジェクト画像だけを抽出する。
【0083】
記録画像処理部203は、選択画像に対して拡大、縮小、回転の処理をして画角およびオブジェクト画像109の天地を調整した記録画像131、132を生成し記録再生処理部207に転送する。記録画像処理部203は、注視領域105bを画定したときは、樹木および飛行機のいずれのオブジェクト画像も含まないため抽出した選択画像121を破棄する。ブロック319で記録再生処理部207は、記録画像131、132をフォルダーに階層化してSSD19に格納する。このとき記録再生処理部207は再生時の検索を容易にするために、格納する複数の選択画像のサムネールを生成し、さらに、注目オブジェクト、撮影日時、撮影場所などのメタ情報を合わせて格納することができる。
【0084】
ここでは音声記録のチェック・ボックス255が設定されているためブロック321で記録再生処理部207は、選択画像120を抽出するために注視領域105aを画定した時刻の近辺で収録した音声データも合わせてSSD19に記録する。記録再生処理部207は、処理が終了したフレームの時刻以前のモニター画像101、音声データ、GPSデータ、操作ボタン・データ、加速度データなどを破棄することができる。したがってSSD19には、撮影者102が後に閲覧したい可能性が高い記録画像131、132だけを検索や閲覧が容易な様式で記録することができる。
【0085】
つぎに、他の記録目的のチェック・ボックス251を設定したときの画像記録再生システム200の特徴的な動作について説明する。記録目的のチェック・ボックス251に会議を設定したときに、たとえば、オブジェクト・ウィンドウ253にプロジェクタと人物を注目オブジェクトとして入力し、音声記録のチェック・ボックス255を設定すると想定する。また、調整ウィンドウ257に重要人物Aを音声認識するための特徴情報と撮影者102の特有の動作を画像認識するための特徴情報を緩和情報として入力し、調整ウィンドウ261に重要人物Bを音声認識するための特徴情報と特有の動作を認識するための特徴情報を画定情報として入力すると想定する。
【0086】
このとき、ブロック311で注視条件調整部211は、緩和情報に対応する重要人物Aの発言があったと判断したとき、または参加者の特定の動作があったと判断したときに注視領域画定部209に注視条件の緩和指示をすることができる。また注視条件調整部211は、撮影者102がメモをとったり、参加者がプロジェクタを参照して説明しているような、会議における特徴的な行為とみなせる動作があったりしたとき、または重要人物Bが発言したときに注視領域画定部209に注視条件の画定指示をすることができる。このとき、メモを書いた紙やプロジェクタを撮影者102がみていいれば、注視時間や離散量で注視条件が画定しなくてもそのコンテンツを記録画像として記録することができる。さらにその際の発言者の音声データも記録するため、記録画像と音声を後に再生することで会議の重要な場面を振り返ることができる。
【0087】
また、記録目的のチェック・ボックス251に面会を設定し、記録モードのチェック・ボックス263に記録画像131&132を設定して、オブジェクト・ウィンドウ253に人物を認識するための特徴情報および名刺という名称を入力すれば、面会者の顔と名刺を記録画像として記録することができる。このとき音声記録のチェック・ボックス255を設定していれば、面会者と挨拶したときの音声も記録することができる。記録目的のチェック・ボックス251に文章を設定し、記録モードのチェック・ボックス261に記録画像131&132を設定して、注目オブジェクトに文字、写真を認識するための特徴情報を入力すれば、掲示物の文章や写真の中で撮影者102が見ている範囲のコンテンツを記録画像131、132として記録することができる。
【0088】
記録目的のチェック・ボックス251に旅行を設定し、調整ウィンドウ261に寺院という普通名称を入力すれば、旅行をする間寺院を含む記録画像130〜132、140を記録することができる。記録目的のチェック・ボックス251に点検作業を設定し、オブジェクト・ウィンドウ253に注目オブジェクトとしてボルト、クラック、および錆を入力しておけば、橋梁やトンネルなどの構造物の重要な箇所の目視点検を確実に行って記録に残すことができる。
【0089】
これまで、記録画像としてスチール画像を例にして説明したが、本発明は動画像に適用することもできる。たとば、撮影者102が行った腕や指のジェスチャまたは操作ボタン57の操作から動画像を撮影する開始と終了のイベントを生成し、その間に撮影者102の視線103を同定して画定した所定の範囲の被写体の動画像を記録することができる。たとえば、遠方の景色をみている視線103がゆっくりと動く場合は、横長の注視領域を画定してパノラマの記録画像を記録することが可能になる。このとき注視領域画定部209は、注視領域の面積の変化、移動方向の変化などを検知してカメラ・モジュール53のズームイン/アウト、パンライト/レフト、およびパンアップ/パンダウンなどの制御を自動的に行うようにすることができる。
【0090】
また、撮影者102の目と視線方向の画像を同時に撮影できる超広角レンズ・カメラを使用する画像記録再生システム200を例にして説明したが、スマートフォンやタブレット端末のように筐体の正面と背面にそれぞれ標準レンズを搭載するデジタル・カメラを配置し、正面のデジタル・カメラで視線を撮影し背面のデジタル・カメラで風景を撮影して、注視領域の被写体を撮影してもよい。ただし、この場合は、視線を風景画像の座標上で同定するためには、2つのカメラの光軸を一致させる処理が必要になる。
【0091】
これまで本発明について図面に示した特定の実施の形態をもって説明してきたが、本発明は図面に示した実施の形態に限定されるものではなく、本発明の効果を奏する限り、これまで知られたいかなる構成であっても採用することができることはいうまでもないことである。