IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ キヤノン株式会社の特許一覧

特許7471827撮像装置及びその制御方法、プログラム、記憶媒体
<>
  • 特許-撮像装置及びその制御方法、プログラム、記憶媒体 図1
  • 特許-撮像装置及びその制御方法、プログラム、記憶媒体 図2
  • 特許-撮像装置及びその制御方法、プログラム、記憶媒体 図3
  • 特許-撮像装置及びその制御方法、プログラム、記憶媒体 図4
  • 特許-撮像装置及びその制御方法、プログラム、記憶媒体 図5
  • 特許-撮像装置及びその制御方法、プログラム、記憶媒体 図6
  • 特許-撮像装置及びその制御方法、プログラム、記憶媒体 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-12
(45)【発行日】2024-04-22
(54)【発明の名称】撮像装置及びその制御方法、プログラム、記憶媒体
(51)【国際特許分類】
   H04N 23/60 20230101AFI20240415BHJP
   G03B 5/00 20210101ALI20240415BHJP
   H04N 23/68 20230101ALI20240415BHJP
【FI】
H04N23/60 500
G03B5/00 J
G03B5/00 K
H04N23/68
H04N23/60 300
H04N23/60 100
【請求項の数】 18
(21)【出願番号】P 2020002432
(22)【出願日】2020-01-09
(65)【公開番号】P2021111868
(43)【公開日】2021-08-02
【審査請求日】2023-01-05
(73)【特許権者】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】110003281
【氏名又は名称】弁理士法人大塚国際特許事務所
(72)【発明者】
【氏名】深堀 謙哉
(72)【発明者】
【氏名】若松 伸茂
【審査官】門田 宏
(56)【参考文献】
【文献】特開2009-055081(JP,A)
【文献】特開2014-207507(JP,A)
【文献】国際公開第2019/004532(WO,A1)
【文献】特開2019-106694(JP,A)
【文献】特開2009-088843(JP,A)
【文献】特開2013-017033(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 5/222-5/257
H04N 23/00
H04N 23/40-23/76
h04N 23/90-23/959
G03B 5/00
(57)【特許請求の範囲】
【請求項1】
撮像装置であって、
被写体像を撮像する撮像手段と、
前記撮像装置の振れを検出する検出手段と、
前記撮像装置の振れに起因する前記撮像手段の撮像面上での像ブレを補正する像ブレ補正手段と、
前記撮像装置の状態に基づいて、前記撮像手段に自動的に撮影を行わせる自動撮影手段と、
前記撮像手段により自動的に撮影された映像データと、該映像データに対する前記像ブレ補正手段による像ブレ補正状態のデータとを記録する記録手段と、
前記記録手段により記録された前記像ブレ補正状態のデータに基づいて、前記映像データを自動編集する自動編集手段と、
を備え
前記像ブレ補正手段は、前記自動撮影手段による撮影の前に、前記検出手段により検出された前記撮像装置の振れの状態に基づいて、像ブレ補正範囲を決定することを特徴とする撮像装置。
【請求項2】
前記自動編集手段は、前記撮像手段で撮像された映像データの各フレームの像ブレ補正状態が前記像ブレ補正範囲を超えた場合は、該像ブレ補正範囲を超えたフレームを前記映像データから削除することを特徴とする請求項に記載の撮像装置。
【請求項3】
前記記録手段は、前記撮像手段で撮像された映像データの撮像時の音データをさらに記録し、前記自動編集手段は、前記像ブレ補正状態のデータに加えて、前記音データに基づいて、前記映像データを自動編集することを特徴とする請求項に記載の撮像装置。
【請求項4】
前記自動編集手段は、前記像ブレ補正状態のデータに基づいて決定した削除するフレームの位置を、前記音データに基づいて変更することを特徴とする請求項に記載の撮像装置。
【請求項5】
前記撮像手段により撮像された映像データから被写体を検出する被写体検出手段をさらに備え、前記自動編集手段は、前記像ブレ補正状態のデータに加えて、前記被写体検出手段の被写体検出状態に基づいて、前記映像データを自動編集することを特徴とする請求項に記載の撮像装置。
【請求項6】
前記自動編集手段は、前記像ブレ補正状態のデータに基づいて決定した削除するフレームの位置を、前記被写体検出状態に基づいて変更することを特徴とする請求項に記載の撮像装置。
【請求項7】
さらに、前記撮像装置の振れに起因する前記撮像手段の撮像面上でのロール傾きを補正する傾き補正手段を備え
前記記録手段は、前記撮像手段により自動的に撮影された映像データと、該映像データに対する前記像ブレ補正手段による像ブレ補正状態のデータと、前記映像データに対する前記傾き補正手段による傾き補正状態のデータとを記録
前記自動編集手段は、前記記録手段により記録された前記像ブレ補正状態のデータと、前記傾き補正状態のデータとに基づいて、前記映像データを自動編集することを特徴とする請求項1乃至6のいずれか1項に記載の撮像装置。
【請求項8】
撮像装置であって、
被写体像を撮像する撮像手段と、
前記撮像装置の振れを検出する検出手段と、
前記撮像手段により撮像された映像データから被写体を検出する被写体検出手段と、
前記撮像装置の振れに起因する前記撮像手段の撮像面上でのロール傾きを補正する傾き補正手段と、
前記撮像装置の状態に基づいて、前記撮像手段に自動的に撮影を行わせる自動撮影手段と、
前記撮像手段により自動的に撮影された映像データと、該映像データに対する前記傾き補正手段による傾き補正状態のデータとを記録する記録手段と、
前記記録手段により記録された前記傾き補正状態のデータおよび前記被写体検出手段の被写体検出状態に基づいて、前記映像データを自動編集する自動編集手段と、
を備えることを特徴とする撮像装置。
【請求項9】
前記傾き補正手段は、前記自動撮影手段による撮影の前に、前記検出手段により検出された前記撮像装置の振れの状態に基づいて、傾き補正範囲を決定することを特徴とする請求項8に記載の撮像装置。
【請求項10】
前記自動編集手段は、前記撮像手段で撮像された映像データの各フレームの傾き補正状態が前記傾き補正範囲を超えた場合は、該傾き補正範囲を超えたフレームを前記映像データから削除することを特徴とする請求項9に記載の撮像装置。
【請求項11】
前記記録手段は、前記撮像手段で撮像された映像データの撮像時の音データをさらに記録し、前記自動編集手段は、前記傾き補正状態のデータに加えて、前記音データに基づいて、前記映像データを自動編集することを特徴とする請求項10に記載の撮像装置。
【請求項12】
前記自動編集手段は、前記傾き補正状態のデータに基づいて決定した削除するフレームの位置を、前記音データに基づいて変更することを特徴とする請求項11に記載の撮像装置。
【請求項13】
前記自動編集手段は、前記傾き補正状態のデータに基づいて決定した削除するフレームの位置を、前記被写体検出状態に基づいて変更することを特徴とする請求項10に記載の撮像装置。
【請求項14】
被写体像を撮像する撮像手段を備える撮像装置を制御する方法であって、
前記撮像装置の振れを検出する検出工程と、
前記撮像装置の振れに起因する前記撮像手段の撮像面上での像ブレを補正する像ブレ補正工程と、
前記撮像装置の状態に基づいて、前記撮像手段に自動的に撮影を行わせる自動撮影工程と、
前記撮像手段により自動的に撮影された映像データと、該映像データに対する前記像ブレ補正工程による像ブレ補正状態のデータとを記録する記録工程と、
前記記録工程において記録された前記像ブレ補正状態のデータに基づいて、前記映像データを自動編集する自動編集工程と、を有し、
前記像ブレ補正工程では、前記自動撮影工程における撮影の前に、前記検出工程において検出された前記撮像装置の振れの状態に基づいて、像ブレ補正範囲を決定することを特徴とする撮像装置の制御方法。
【請求項15】
さらに、前記撮像装置の振れに起因する前記撮像手段の撮像面上でのロール傾きを補正する傾き補正工程を有し
前記記録工程では、前記撮像手段により自動的に撮影された映像データと、該映像データに対する前記像ブレ補正工程による像ブレ補正状態のデータと、前記映像データに対する前記傾き補正工程による傾き補正状態のデータとを記録
前記自動編集工程では、前記記録工程において記録された前記像ブレ補正状態のデータと、前記傾き補正状態のデータとに基づいて、前記映像データを自動編集することを特徴とする請求項14に記載の撮像装置の制御方法。
【請求項16】
被写体像を撮像する撮像手段を備える撮像装置を制御する方法であって、
前記撮像装置の振れを検出する検出工程と、
前記撮像手段により撮像された映像データから被写体を検出する被写体検出工程と、
前記撮像装置の振れに起因する前記撮像手段の撮像面上でのロール傾きを補正する傾き補正工程と、
前記撮像装置の状態に基づいて、前記撮像手段に自動的に撮影を行わせる自動撮影工程と、
前記撮像手段により自動的に撮影された映像データと、該映像データに対する前記傾き補正工程による傾き補正状態のデータとを記録する記録工程と、
前記記録工程において記録された前記傾き補正状態のデータおよび前記被写体検出工程における被写体検出状態に基づいて、前記映像データを自動編集する自動編集工程と、
を有することを特徴とする撮像装置の制御方法。
【請求項17】
請求項14乃至16のいずれか1項に記載の制御方法の各工程をコンピュータに実行させるためのプログラム。
【請求項18】
請求項14乃至16のいずれか1項に記載の制御方法の各工程をコンピュータに実行させるためのプログラムを記憶したコンピュータが読み取り可能な記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、撮像装置およびその制御方法に関する。
【背景技術】
【0002】
ユーザーがシャッターを切るなどの意図したタイミングで撮影するのではなく、カメラが自動的に状況判断を行って、継続的に撮影を行う自動撮影カメラが知られている(特許文献1)。 自動撮影カメラは、ストラップ等でユーザーの身体に装着された状態で用いられ、ユーザーが日常生活で目にする光景を自動で映像として記録して、ユーザーの好みの映像を残すことができる。
【0003】
しかし、このようなカメラは自動で撮影を行うため、ユーザーが装着した状態で用いられるような場合では、ユーザーが撮影中であることを気に掛けずに行動すると、自身の動作により大きな像ブレが発生する場合があった。そこで、特許文献2には、撮影した映像に対して、撮影中の像ブレ量に応じて、切り出し位置と切り出しサイズを変更することにより、像ブレ補正を行う方法が提案されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2019-106694号公報
【文献】特開2014-207507号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上述の特許文献1及び特許文献2に開示された従来技術では、カメラで可能な像ブレ補正の範囲を超えた像ブレが発生した際には、撮影された映像に像ブレが残り、ユーザーにとって好ましい映像が得られない場合があった。その場合には、映像の像ブレが残った部分のフレームを、ユーザーが撮影後に手動で編集して削除する必要があった。
【0006】
また、カメラがユーザーに装着された状態で撮影が行われるため、ユーザーが撮影中に移動すればカメラも移動してシーンや被写体が変化してしまう。そのため、一つの映像の中に複数のシーンや被写体が含まれることがあった。その場合は、それぞれのシーンや被写体ごとの映像とするためには、ユーザーが撮影後に手動で編集する必要があった。
【0007】
本発明は上述した課題に鑑みてなされたものであり、その目的は、ユーザーが特別な操作を行うことなく、ユーザーの好みの映像を取得することが可能な撮像装置を提供することである。
【課題を解決するための手段】
【0008】
本発明に係わる撮像装置は、撮像装置であって、被写体像を撮像する撮像手段と、前記撮像装置の振れを検出する検出手段と、前記撮像装置の振れに起因する前記撮像手段の撮像面上での像ブレを補正する像ブレ補正手段と、前記撮像装置の状態に基づいて、前記撮像手段に自動的に撮影を行わせる自動撮影手段と、前記撮像手段により自動的に撮影された映像データと、該映像データに対する前記像ブレ補正手段による像ブレ補正状態のデータとを記録する記録手段と、前記記録手段により記録された前記像ブレ補正状態のデータに基づいて、前記映像データを自動編集する自動編集手段と、を備え、前記像ブレ補正手段は、前記自動撮影手段による撮影の前に、前記検出手段により検出された前記撮像装置の振れの状態に基づいて、像ブレ補正範囲を決定することを特徴とする。
【0009】
また、本発明に係わる撮像装置は、撮像装置であって、被写体像を撮像する撮像手段と、前記撮像装置の振れを検出する検出手段と、前記撮像手段により撮像された映像データから被写体を検出する被写体検出手段と、前記撮像装置の振れに起因する前記撮像手段の撮像面上でのロール傾きを補正する傾き補正手段と、前記撮像装置の状態に基づいて、前記撮像手段に自動的に撮影を行わせる自動撮影手段と、前記撮像手段により自動的に撮影された映像データと、該映像データに対する前記傾き補正手段による傾き補正状態のデータとを記録する記録手段と、前記記録手段により記録された前記傾き補正状態のデータおよび前記被写体検出手段の被写体検出状態に基づいて、前記映像データを自動編集する自動編集手段と、を備えることを特徴とする。
【発明の効果】
【0011】
本発明によれば、ユーザーが特別な操作を行うことなく、ユーザーの好みの映像を取得することが可能な撮像装置を提供することが可能となる。
【図面の簡単な説明】
【0012】
図1】本発明の撮像装置の第1の実施形態であるカメラの外観を模式的に示す図。
図2】第1の実施形態のカメラの構成を示すブロック図。
図3】電子式ブレ補正を説明する図。
図4】第1制御部の動作を説明するフローチャート。
図5】自動編集処理を説明するフローチャート。
図6】自動編集におけるブレ補正範囲外のフレームの削除動作を説明する図。
図7】自動編集における傾き補正範囲外のフレームの削除動作を説明する図。
【発明を実施するための形態】
【0013】
以下、添付図面を参照して実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
【0014】
(第1の実施形態)
<カメラの構成>
図1は、本発明の撮像装置の第1の実施形態であるカメラの外観を模式的に示す図である。図1(a)に示すカメラ101には、電源スイッチ、カメラ操作を行うことができる操作部材などが設けられている。被写体像の撮像を行う撮像光学系としての撮影レンズ群や撮像素子を一体的に含む鏡筒102は、カメラ101の固定部103に対して移動可能に取り付けられている。具体的には、鏡筒102は、固定部103に対して回転駆動できる機構であるチルト回転ユニット104とパン回転ユニット105とを介して固定部103に取り付けられている。
【0015】
チルト回転ユニット104は、鏡筒102を図1(b)に示すピッチ方向に回転駆動することができるモーター駆動機構を備え、パン回転ユニット105は、鏡筒102を図1(b)に示すヨー方向に回転駆動することができるモーター駆動機構を備える。すなわちカメラ101は、鏡筒102を2軸方向に回転駆動する機構を有する。図1(b)に示す各軸は、固定部103の位置に対してそれぞれ定義されている。角速度計106及び加速度計107は、カメラ101の固定部103に配置されている。そして、角速度計106や加速度計107の出力信号に基づいて、カメラ101の振動を検出し、チルト回転ユニット104とパン回転ユニット105を回転駆動することにより、鏡筒102の振れを補正したり、傾きを補正したりすることができる。
【0016】
図2は本実施形態のカメラ101の全体構成を示すブロック図である。図2において、第1制御部224は、例えばCPU(MPU)、メモリ(DRAM、SRAM)などを備える。そして、不揮発性メモリ(EEPROM)217に記憶されたプログラムに従って、各種処理を実行してカメラ101の各ブロックを制御したり、各ブロック間でのデータ転送を制御したりする。不揮発性メモリ217は、電気的に消去・記録可能なメモリであり、上記のように第1制御部224の動作用の定数、プログラム等が記憶される。
【0017】
図2において、ズームユニット201は、変倍(結像された被写体像の拡大・縮小)を行うズームレンズを含む。ズーム駆動制御部202は、ズームユニット201を駆動制御するとともに、そのときの焦点距離を検出する。フォーカスユニット203は、ピント調整(焦点調節)を行うフォーカスレンズを含む。フォーカス駆動制御部204は、フォーカスユニット203を駆動制御する。
【0018】
撮像部206は撮像素子を備え、各レンズ群を通して入射する光を受け、その光量に応じた電荷の情報をアナログ画像信号として映像処理部207に出力する。なお、ズームユニット201、フォーカスユニット203、撮像部206は、鏡筒102内に配置されている。
【0019】
鏡筒回転駆動部205は、チルト回転ユニット104、パン回転ユニット105を駆動し、鏡筒102をチルト方向とパン方向に回動させる。
【0020】
映像処理部207はアナログ画像信号をA/D変換して得られたデジタル画像データに対して、歪曲補正、ホワイトバランス調整、色補間処理等の画像処理を適用し、適用後のデジタル映像データを出力する。映像処理部207から出力されたデジタル映像データは、映像記録部208で動画記録用フォーマットに変換され、メモリ216に記憶されたり後述する映像出力部218に送信されたりする。
【0021】
装置傾き検出部209と装置揺れ検出部210は、例えばカメラ101の3軸方向の角速度を検出する角速度計(ジャイロセンサ)106や、装置の3軸方向の加速度を検出する加速度計(加速度センサ)107を備える。装置傾き検出部209と装置揺れ検出部210は、それらのセンサにより検出された信号に基づいて、カメラ101の回転角度やカメラ101のブレ量などを演算する。第1制御部224は、演算結果に基づいて鏡筒回転駆動部205を制御し、チルト回転ユニット104とパン回転ユニット105を駆動させて光学的にカメラ101の振れに起因する撮像面上の像ブレや傾きを補正する。また、第1制御部224は、演算結果に基づいて画像切り出し範囲を移動させることにより、像ブレ補正を行う電子式像ブレ補正も行う。演算結果に合わせてフレームごとに補正量を算出し、補正量に合わせて画像の一部を切り出す設定を行う。
【0022】
ここで、図3を用いて、フレームごとに補正量に合わせて画像の一部を切り出すことで補正を行う電子式像ブレ補正制御について説明する。
【0023】
図3(a)は、第1制御部224で行われる電子式像ブレ補正で補正された画像を説明するための図である。傾き補正角度の演算結果からロール方向の回転補正を行うためのロール傾き補正量を算出する。画像301aは、映像処理部207に入力される撮影画像を示す。画像302aは、撮影画像301aに対し、ロール傾き補正量に基づいて回転処理を行った後の回転画像を示す。さらに電子式像ブレ補正では、回転画像302aから、撮影画像301aと同じアスペクト比の内接部分を出力画像303aとして切り出す処理が行われる。この切り出し処理を映像の毎フレームについて行うことにより、傾き方向の電子式像ブレ補正が実現される。
【0024】
また、図3(b)は、第1制御部224で行われる、画像の縦横方向(並進方向)の像ブレ補正を説明するための図である。並進方向の補正では、振れ角度とズーム位置情報に基づく焦点距離情報とから、ピッチ方向/ヨー方向の角度振れを補正するための画像シフト量が算出され、画像シフト量に合わせて画像の切り出し処理が行われる。画像301bは、映像処理部207に入力される撮影画像を示す。画像302bは、撮影画像301bから縦横の画像シフト量に合わせて切り出した画角に対応する画像である。この切り出し処理を映像の毎フレームについて行うことにより、並進方向の電子式像ブレ補正が実現される。
【0025】
これらの光学的な補正と電子式の補正を組み合わせることにより、像ブレ補正と傾き補正を行う。
【0026】
音声入力部214は、カメラ101に設けられたマイクによりカメラ101の周辺の音声信号を取得し、デジタル音声信号に変換して音声処理部215に送信する。音声処理部215は、入力されたデジタル音声信号の適正化処理等の音声に関する処理を行う。そして、音声処理部215で処理された音声信号は、第1制御部224によりメモリ216に送信される。メモリ216は、映像処理部207、音声処理部215により得られた画像信号及び音声信号を一時的に記憶する。
【0027】
自動編集処理部220は、一時的にメモリ216に記憶された映像信号及び音声信号、カメラ101の回転角度や振れ量を読み出して、映像の切り出し、分割、削除等を行い、再度メモリ216に記憶させる。
【0028】
映像処理部207及び音声処理部215は、メモリ216に一時的に記憶された画像信号や音声信号を読み出して画像信号の符号化、音声信号の符号化などを行い、圧縮画像信号、圧縮音声信号を生成する。第1制御部224は、これらの圧縮画像信号、圧縮音声信号を、記録再生部221に送信する。
【0029】
記録再生部221は、記録媒体222に対して映像処理部207及び音声処理部215で生成された圧縮画像信号、圧縮音声信号、その他撮影に関する制御データ等を記録する。また、音声信号を圧縮符号化しない場合には、第1制御部224は、音声処理部215により生成された音声信号と映像処理部207により生成された圧縮画像信号とを、記録再生部221に送信し記録媒体222に記録させる。
【0030】
記録媒体222は、カメラ101に内蔵された記録媒体でも、取外し可能な記録媒体でもよく、カメラ101で生成した圧縮画像信号、圧縮音声信号、音声信号などの各種データを記録することができる。一般的には、記録媒体222には不揮発性メモリ217よりも大容量な媒体が使用される。例えば、記録媒体222は、ハードディスク、光ディスク、光磁気ディスク、CD-R、DVD-R、磁気テープ、不揮発性の半導体メモリ、フラッシュメモリ、などのあらゆる方式の記録媒体を含む。
【0031】
記録再生部221は、記録媒体222に記録された圧縮画像信号、圧縮音声信号、音声信号、各種データ、プログラムを読み出す(再生する)。そして、第1制御部224は、読み出された圧縮画像信号、圧縮音声信号を、映像処理部207及び音声処理部215に送信する。映像処理部207及び音声処理部215は、圧縮画像信号、圧縮音声信号を一時的にメモリ216に記憶させ、所定の手順で復号し、復号した信号を映像出力部218、音声出力部219に送信する。
【0032】
音声入力部214には複数のマイクが配置されており、音声処理部215は複数のマイクが設置された平面に対する音の方向を検出することができ、後述する被写体の探索や自動撮影に用いられる。さらに、音声処理部215では、特定の音声コマンドを検出する。音声コマンドは事前に登録されたいくつかのコマンドの他、ユーザが特定音声をカメラに登録できる構成にしてもよい。また、撮像時の音シーン認識も行う。音シーン認識では、予め大量の音声データに基づいて機械学習により学習させたネットワークにより音シーンの判定を行う。例えば、「歓声が上がっている」、「拍手している」、「声を発している」などの特定シーンを検出するためのネットワークが音声処理部215に設定されており、特定音シーンや特定音声コマンドを検出する。音声処理部215が特定音シーンや特定音声コマンドを検出すると、第1制御部224や第2制御部212に、検出トリガー信号を出力する。
【0033】
カメラ101のメインシステム全体を制御する第1制御部224とは別に、この第1制御部224の供給電源を制御する第2制御部212が設けられている。第1電源部211と第2電源部213は、第1制御部224と第2制御部212を動作させるための電力をそれぞれ供給する。カメラ101に設けられた電源ボタンの押下により、まず第1制御部224と第2制御部212の両方に電源が供給されるが、後述するように、第1制御部224は、第1電源部211へ自らの電源供給をOFFする制御も行う。第1制御部224が動作していない間も、第2制御部212は動作しており、装置傾き検出部209や装置揺れ検出部210や音声処理部215からの情報が入力される。第2制御部212は、各種入力情報に基づいて、第1制御部224を起動するか否かの判定を行い、起動することが判定されると、第1電源部211に第1制御部224へ電力を供給するように指示する。
【0034】
音声出力部219は、例えば撮影時などにカメラ101に内蔵されたスピーカーから予め設定された音声パターンを出力する。LED制御部225は、例えば撮影時などに、カメラ101に設けられたLEDを、予め設定された点灯パターンや点滅パターンに基づいて点灯させる。映像出力部218は、例えば映像出力端子からなり、接続された外部ディスプレイ等に映像を表示させるために画像信号を出力する。また、音声出力部219、映像出力部218は、結合された1つの端子、例えばHDMI(登録商標:High-Definition Multimedia Interface)端子のような端子であってもよい。
【0035】
通信部223は、カメラ101と外部装置との間で通信を行う部分であり、例えば、音声信号、画像信号、圧縮音声信号、圧縮画像信号などのデータを送信したり受信したりする。また、撮影開始や終了のコマンド、パン・チルト、ズーム駆動等の撮影にかかわる制御信号を受信して、外部装置の指示に基づいてカメラ101を駆動する。また、カメラ101と外部装置との間で、各種パラメータなどの情報を送信したり受信したりする。通信部223は、例えば、赤外線通信モジュール、Bluetooth(登録商標)通信モジュール、無線LAN通信モジュール、WirelessUSB(登録商標)、GPS受信機等の無線通信モジュールを備える。
【0036】
図4は、本実施形態におけるカメラ101の第1制御部224が受け持つ動作の例を説明するフローチャートである。
【0037】
S401では、映像処理部207に撮像部206で撮像された映像信号を映像処理させ、被写体認識用の画像を生成する。生成された画像に対して、人物や物体などの特定の被写体の認識が行われる。人物を認識する場合は、被写体の顔や人体を検出する。
【0038】
顔検出処理では、人物の顔を判断するためのパターンが予め定められており、撮像された画像内に含まれる、このパターンに一致する箇所を人物の顔画像として検出することができる。また、被写体の顔としての確からしさを示す信頼度も同時に算出される。信頼度は、例えば画像内における顔領域の大きさや、顔パターンとの一致度等から算出される。
【0039】
さらに、物体認識についても同様に、撮像された画像内に含まれる物体として犬のような動物の場合、予め登録された動物のパターンに一致するか否かを判断することで物体を認識することができる。特定物体認識の方法については、Convolutional Neural Networks(以下CNNと略記する)などを用いて予め検出したい被写体を学習しておき、顔認識や物体認識に対してCNNを適用してもよい。
【0040】
また、撮像された画像内の色相や彩度等のヒストグラムを使用する方法により、特徴被写体を抽出する方法などもある。この場合、撮影画角内に捉えられている被写体の画像を、その色相や彩度等のヒストグラムの分布に基づいて複数の区間に分け、区間ごとに撮像された画像を分類する処理が実行される。例えば、撮像された画像について複数の色成分のヒストグラムが作成され、その山型の分布範囲で区分けする。そして、同一の区間の組み合わせに属する領域により撮像された画像が分類され、被写体の画像領域が認識される。認識された被写体の画像領域ごとに評価値を算出することで、その評価値が最も高い被写体の画像領域を主被写体領域として判定することができる。
【0041】
以上の方法で、撮像情報から各被写体情報を得ることができ、被写体の情報や撮影されるシーン情報などを判定することができる。
【0042】
S402では、傾き補正量と像ブレ補正量の算出を行う、具体的には、まず、装置傾き検出部209と装置揺れ検出部210において取得した角速度および加速度情報に基づいてカメラ101の絶対角度の算出を行う。そして絶対角度を打ち消す角度方向に、チルト回転ユニット104およびパン回転ユニット105を動かす像ブレ補正角度を求め、傾き補正量と像ブレ補正量とする。
【0043】
S403では、パン・チルト駆動を行う。S401で認識した被写体を追尾するためのパン・チルト駆動量と、S402で算出された像ブレ補正量に基づくパン・チルト駆動量を算出し、鏡筒回転駆動部205によってチルト回転ユニット104、パン回転ユニット105をそれぞれ駆動制御する。
【0044】
S404では、ズームユニット201を制御してズーム駆動を行う。S401で認識した被写体の状態に応じてズームを駆動させる。例えば、被写体が人の顔である場合、画像上の顔が小さすぎて検出可能な最小サイズを下回ると、検出ができず、見失ってしまう恐れがある。そのような場合は、望遠側にズームすることにより、画像上の顔のサイズが大きくなるように制御する。一方で、画像上の顔が大きすぎる場合、カメラ自体の動きによって被写体が画角から外れやすくなってしまう。そのような場合は、広角側にズームすることにより、画面上の顔のサイズが小さくなるように制御する。このようにズーム制御を行うことにより、被写体を追跡するのに適した状態を保つことができる。
【0045】
S405では、自動撮影を開始するか否かを判定する。ここでは、S401で行われた画像認識処理の被写体情報やシーン判定結果、音声コマンドや音シーンを用いて、撮影を行うか否かを判定する。例えば、S401のシーン判定結果で風景であった状態のところに、重要被写体認識により予め登録されたパターンの人物や動物が検出された際には、重要な被写体が画面内に存在するとして撮影を行う判定をする。また、人物が複数検出されているような状態のところで、歓声が上がっているような音シーンの判定が行われた場合には、何かしらの重要な出来事が発生したとして撮影を行う判定をする。この撮影を行う判断は、画像認識処理の重要被写体の出現率や、ユーザーの好みを学習して変更できるようにしてもよい。また、ユーザーが手動で重要な被写体を登録することにより、撮影を行う判断として用いてもよい。
【0046】
S405で撮影を開始すると判定された場合には、S406に進み、これから撮影を行う際の傾き補正範囲と像ブレ補正範囲を決定する。傾き補正範囲と像ブレ補正範囲は、傾き補正や、像ブレ補正を行える最大範囲を、現在の装置の回転角度や、装置の振れ量、また撮影するモードによって変更することにより決定する。
【0047】
例えば、風景のような傾きが気になるシーンの場合は、傾き補正と像ブレ補正の制御のための可動範囲やプロセッサの処理能力の配分を傾き補正に多く配分することにより、傾き補正に重点を置き、像ブレ補正範囲を狭く設定する。また、人物を撮影していてブレが気になるような場合は、像ブレ補正に補正範囲を多く分配し、傾き補正範囲を狭く設定する。
【0048】
傾き補正範囲と像ブレ補正範囲が決定されたら、S407において自動撮影を開始する。その際に、フォーカス駆動制御部204によるオートフォーカス制御を行う。また、不図示の絞り制御部及び撮像素子ゲイン制御部、シャッター制御部を用いて、被写体が適切な明るさになるように露出制御を行う。さらに、撮影中はS406で決定した傾き補正範囲と像ブレ補正範囲に対する補正状態もメモリ216に記録する。撮影後には映像処理部207において、オートホワイトバランス処理、ノイズリダクション処理、ガンマ補正処理等、種々の映像処理を行い、映像を生成する。
【0049】
S408では、S407で生成した映像と補正状態を使用して自動編集処理部220において自動編集処理を行う。自動編集処理では、映像中でブレ補正範囲や傾き補正範囲を超えたフレームのカットを行う。フレームのカットを行う際には、映像処理部207において処理された被写体情報やシーン判定情報、音声処理部215において処理された音データを使用して、フレームカットの位置を変更する。自動編集処理については、図5図6を用いて詳細に説明する。
【0050】
図5は、本実施形態におけるカメラ101の自動編集処理部220が受け持つ動作の例を説明するフローチャートである。
【0051】
<像ブレ補正範囲外の場合の処理の説明>
S501では、映像処理部207によって生成された映像と、その映像の撮影時にメモリ216に記録された像ブレや傾きの補正状態(像ブレ補正状態、傾き補正状態)を確認し、S406で決定した補正範囲を超えたブレ補正範囲外の映像のフレームの範囲を検出する。ただし、ブレ補正範囲外を検出するときに、ブレ補正範囲外と補正範囲内を短時間で繰り返すような場合は、その期間をすべて補正範囲外として取り扱うような処理としてもよい。また、ブレ補正範囲外がごく短時間である場合には補正範囲内として取り扱うように、補正範囲の閾値を一時的に変更する処理としてもよい。
【0052】
S502では、映像中の重要被写体情報を検出する。例えば、シーン判定情報で同一シーンが続く期間や、同一の犬が重要被写体として検出されている期間などの、同一の重要被写体検出が続く期間を検出する。
【0053】
S503では、映像中の音データを検出する。例えば、音シーン判定結果を用いて、歓声が上がっている期間、拍手されている期間、声が発せられている期間などの同一音シーンが続く期間を検出する。
【0054】
S504では、S502の同一の重要被写体が続く期間と、S503の同一音シーンが続く期間を用いて、それぞれの期間がS501で検出された削除される対象フレームと重なるか否かを判定する。削除の対称となっているフレームと同一の期間が存在する場合は、そのフレームを削除の対象から除く。削除の対象から除く方法は図6を用いて説明する。
【0055】
図6は映像A600とブレ量601と被写体検出期間602とS401で算出する顔検出信頼度604とを、時間経過を横軸として表した図である。
【0056】
映像A600は、人の顔を撮影していて、カメラが動かされて大きくブレたシーンを想定している。ブレ量601を参照すると、S406で決定した補正範囲閾値603を超えて削除対象となる大きいブレが発生している期間は、削除対象開始位置606から映像の最後の削除対象終了位置607までである。しかしながら、S502で検出した被写体検出期間602において、重要被写体としての顔検出が顔検出終了位置609まで検出されている(被写体検出状態)。また、顔検出信頼度604は顔認識閾値605より高ければ顔として認識できるが、顔検出信頼度低下位置608で信頼度が低下するため、以降は顔として検出は出来るがブレにより信頼度は低下して映像としては好ましくない状態となる。そのため、削除対象開始位置606から顔検出信頼度低下位置608まではブレが大きくとも顔として認識できる期間であるため、その期間は有用な映像であるとして、削除対象開始位置606から顔検出信頼度低下位置608までを削除対象から除く処理を行う。そのため、実際に削除対象となるのは顔検出信頼度低下位置608から映像の最後の削除対象終了位置607までの期間となる。
【0057】
この様な判定処理を行った後、S505では、S504および図6で判定した期間のフレームを削除して映像を再度保存する。
【0058】
上記のように、第1の実施形態においては、撮影された映像のブレ補正範囲を超えた部分を削除することにより、ユーザーの好みに合った映像を提供することが可能となる。
【0059】
(第2の実施形態)
この第2実施形態では、カメラの構成及び全体動作は、第1の実施形態で説明した図1図2図4と同様であるため、説明を省略する。以下、第2の実施形態について、図5図7を用いて、第1の実施形態と異なる部分について説明する。
【0060】
<傾き補正範囲外の場合の処理の説明>
本実施形態では、図5のS501において、映像処理部207によって生成された映像と、その映像の撮影時にメモリ216に記録されたブレや傾きの補正状態を確認し、S406で決定した傾き補正の補正範囲を超えた映像のフレームを検出する。第1の実施形態でのブレ補正と同じように、傾き補正の補正範囲外と補正範囲内を短時間で繰り返すような場合は、その期間をすべて補正範囲外として取り扱うような処理としてもよい。また、補正範囲外がごく短時間である場合には、補正範囲内として取り扱うように補正範囲の閾値を一時的に変更する処理としてもよい。
【0061】
S502では、映像中の重要被写体情報を検出する。例えば、シーン判定情報で同一シーンが続く期間や、同一の犬が重要被写体として検出されている期間などの、同一の重要被写体検出が続く期間を検出する。
【0062】
S503では、映像中の音データを検出する。例えば、音シーン判定結果を用いて、歓声が上がっている期間、拍手されている期間、声が発せられている期間などの同一音シーンが続く期間を検出する。
【0063】
S504では、S502の同一の重要被写体が続く期間と、S503の同一音シーンが続く期間を用いて、それぞれの期間がS501で検出された削除される対象フレームと重なるか否かを判定する。削除の対称となっているフレームと同一の期間が存在する場合は、そのフレームを削除の対象から除く。削除の対象から除く方法は図7を用いて説明する。
【0064】
図7は、映像B700と傾き量701と音シーン検出期間702と被写体検出期間703と重要被写体として検出した顔のサイズ710とを、時間経過を横軸として表した図である。映像B700は、人物を撮影していたが、その人物が遠くに離れていき、別の被写体の人物を撮影しようとカメラが動かされ大きく傾き、その後、人物が声を出しながら近づいてきたシーンを撮影した場合を想定している。
【0065】
傾き量701において、S406で決定した補正範囲閾値704を超えて削除対象となる大きい傾きが発生している期間は、削除開始位置705から削除終了位置706までである。しかしながら、S502で検出した被写体検出期間703において、被写体として検出された第1の顔の検出が顔検出終了位置707まで存在する。また、検出された第1の顔のサイズは、顔検出サイズ閾値710を下回ると、顔として認識はできるが、小さくて撮影に適さないサイズとなる。そのため、削除開始位置705から第1の顔の検出サイズ閾値位置713までは、傾きは大きいものの顔として認識出来ており、撮影に適したサイズである。そのため、削除開始位置705から第1の顔の検出サイズ閾値位置713までの間は、傾きが大きくとも有用な映像であるとして、削除開始位置を位置705から第1の顔の検出サイズ閾値位置713に変更する。
【0066】
また、被写体検出期間703において、第2の顔の検出が顔検出開始位置708で開始される。さらに声が発生された状態が音シーン検出期間702でも音シーン検出開始位置709として検出される。ただし、第2の顔の検出サイズはだんだんと大きくなっていくため、第2の顔の検出サイズ閾値位置714より後にならないと撮影に適した顔のサイズにならない。そのため、第2の顔の検出サイズ閾値位置714以降は撮影に適した顔のサイズで、かつ、声が発生された状態が検出された状態となり、有用な音シーンやシーンが含まれている映像であると判定される。そのため、削除終了位置を位置706から第2の顔の検出サイズ閾値位置714に変更する。
【0067】
この様な判定処理を行った後、S505では、S504および図7で判定した期間のフレームを削除して、一つの映像をシーンごとに分けた複数の映像として再度保存する。
【0068】
上記のように、第2の実施形態においては、撮影された映像の傾き補正範囲を超えた部分を削除することにより、ユーザーの好みに合った映像を提供することが可能となる。
【0069】
なお、本実施形態では、傾き補正の範囲を超えた場合について説明しているが、第1の実施形態で説明したブレ補正の範囲を超えた場合と傾き補正の範囲を超えた場合の両方を使用して判定してもよい。
【0070】
以上説明したように、上記の第1及び第2の実施形態によれば、撮影した映像に補正しきれないブレや傾きが発生している場合でも、ユーザーが記録された映像を手動で編集する手間を軽減できる。また、補正しきれない像ブレや傾きが発生した前後でシーンや被写体が変わった際に、同一被写体や同一シーンのみを含む映像に分割することができる。
【0071】
(他の実施形態)
また本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読み出し実行する処理でも実現できる。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現できる。
【0072】
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
【符号の説明】
【0073】
101:カメラ、104:チルト回転ユニット、105:パン回転ユニット、206:撮像部、207:映像処理部、209:装置傾き検出部、210:装置揺れ検出部、212:第2制御部、224:第1制御部
図1
図2
図3
図4
図5
図6
図7