特許第6907274号(P6907274)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エスゼット ディージェイアイ テクノロジー カンパニー リミテッドの特許一覧

<>
  • 特許6907274-撮像装置及び撮像方法 図000002
  • 特許6907274-撮像装置及び撮像方法 図000003
  • 特許6907274-撮像装置及び撮像方法 図000004
  • 特許6907274-撮像装置及び撮像方法 図000005
  • 特許6907274-撮像装置及び撮像方法 図000006
  • 特許6907274-撮像装置及び撮像方法 図000007
  • 特許6907274-撮像装置及び撮像方法 図000008
  • 特許6907274-撮像装置及び撮像方法 図000009
  • 特許6907274-撮像装置及び撮像方法 図000010
  • 特許6907274-撮像装置及び撮像方法 図000011
  • 特許6907274-撮像装置及び撮像方法 図000012
  • 特許6907274-撮像装置及び撮像方法 図000013
  • 特許6907274-撮像装置及び撮像方法 図000014
  • 特許6907274-撮像装置及び撮像方法 図000015
  • 特許6907274-撮像装置及び撮像方法 図000016
  • 特許6907274-撮像装置及び撮像方法 図000017
  • 特許6907274-撮像装置及び撮像方法 図000018
  • 特許6907274-撮像装置及び撮像方法 図000019
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6907274
(24)【登録日】2021年7月2日
(45)【発行日】2021年7月21日
(54)【発明の名称】撮像装置及び撮像方法
(51)【国際特許分類】
   H04N 5/232 20060101AFI20210708BHJP
   G03B 15/00 20210101ALI20210708BHJP
   G03B 7/091 20210101ALI20210708BHJP
【FI】
   H04N5/232 220
   G03B15/00 Q
   G03B15/00 R
   G03B7/091
   H04N5/232 290
   H04N5/232 190
   H04N5/232 930
【請求項の数】27
【全頁数】33
(21)【出願番号】特願2019-142458(P2019-142458)
(22)【出願日】2019年8月1日
(65)【公開番号】特開2020-188448(P2020-188448A)
(43)【公開日】2020年11月19日
【審査請求日】2019年8月1日
(31)【優先権主張番号】PCT/CN2019/086914
(32)【優先日】2019年5月14日
(33)【優先権主張国】CN
(73)【特許権者】
【識別番号】513068816
【氏名又は名称】エスゼット ディージェイアイ テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】SZ DJI TECHNOLOGY CO.,LTD
(74)【代理人】
【識別番号】110002262
【氏名又は名称】TRY国際特許業務法人
(72)【発明者】
【氏名】胡 攀
(72)【発明者】
【氏名】鄒 文
(72)【発明者】
【氏名】曹 子晟
【審査官】 ▲徳▼田 賢二
(56)【参考文献】
【文献】 国際公開第2017/208991(WO,A1)
【文献】 国際公開第2010/047336(WO,A1)
【文献】 特開2014−042250(JP,A)
【文献】 特開2014−164288(JP,A)
【文献】 特開2010−109941(JP,A)
【文献】 特開2006−279116(JP,A)
【文献】 特開2010−061465(JP,A)
【文献】 特開2010−041255(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 5/232
G03B 7/091
G03B 15/00
(57)【特許請求の範囲】
【請求項1】
所定の条件が満たされたときに画像撮影装置の撮像動作をトリガする撮影選択部と、
前記画像撮影装置によって得られた撮影画像を合成して補正画像を生成する画像合成部と、
前記補正画像を出力する画像出力部と、
を備え、
前記撮影選択部は、少なくとも、特定の意味を有する、人、動物、顔、または笑顔のうちの少なくとも1つを含むオブジェクトが検出されたとき、及び現在のシーンの奥行きまたは焦点に変化が生じたときに前記撮像動作をトリガし、
前記画像出力部は、審美的規則に従って決定される前記補正画像のスコアに従って、前記補正画像を現在のアルバムのキューに挿入し、現在のアルバムのキューを表示する撮像装置。
【請求項2】
前記撮影選択部は、音声コマンドが受信されたときに前記撮像動作をトリガする請求項1に記載の撮像装置。
【請求項3】
前記撮影選択部は、タイマー撮影またはタイムラプス撮影を含む制御処理が実行されたときに前記撮像動作をトリガする請求項1または2に記載の撮像装置。
【請求項4】
前記撮影選択部は、審美的規則に基づいてライブビュー画像をリアルタイムで採点することによって得られたスコアが閾値以上である場合に、前記撮像動作をトリガする請求項1から3のいずれか一項に記載の撮像装置。
【請求項5】
前記審美的規則は、信号対雑音比(SNR)、コントラスト、ヒストグラム分布、画像飽和度、情報エントロピー、自動露出値、オートフォーカス値、オートホワイトバランス値、またはライブビュー画像の高得点オブジェクトのうちの少なくとも1つに従って定められる請求項1からのいずれか一項に記載の撮像装置。
【請求項6】
前記画像合成部は、前記撮影画像内の特徴的なオブジェクトを検出し、前記特徴的なオブジェクトの位置およびサイズ情報を取得し、合成規則と、前記特徴的なオブジェクトの位置およびサイズ情報とに従って合成画像を取得し、前記合成画像を拡大縮小して補正画像を取得する請求項1からのいずれか一項に記載の撮像装置。
【請求項7】
前記合成規則は、中央合成規則、トライアド合成規則、水平線合成規則、対称合成規則、または対角合成規則のうちの少なくとも1つを含む、請求項に記載の撮像装置。
【請求項8】
前記画像合成部は、ネットワークモデルまたはツリー構造を取得し、前記ネットワークモデルまたは前記ツリー構造に従って前記撮影画像を処理して、クロッピング座標および倍率を取得し、前記クロッピング座標に従って取り込まれた画像をトリミングして合成画像を取得し、前記倍率に従って前記合成画像をスケーリングして補正画像を得る請求項1から7のいずれか一項に記載の撮像装置。
【請求項9】
所定の条件が満たされたときに画像撮影装置の撮像動作をトリガする撮影選択部と、
前記画像撮影装置によって得られた撮影画像を合成して補正画像を生成する画像合成部と、
前記補正画像を出力する画像出力部と、
を備え、
前記撮影選択部は、少なくとも、特定の意味を有する、人、動物、顔、または笑顔のうちの少なくとも1つを含むオブジェクトが検出されたとき、及び現在のシーンの奥行きまたは焦点に変化が生じたときに前記撮像動作をトリガし、
前記画像合成部は、ネットワークモデルまたはツリー構造を取得し、前記ネットワークモデルまたは前記ツリー構造に従って前記撮影画像を処理して、クロッピング座標および倍率を取得し、前記クロッピング座標に従って取り込まれた画像をトリミングして合成画像を取得し、前記倍率に従って前記合成画像をスケーリングして補正画像を得る撮像装置。
【請求項10】
前記ネットワークモデルは、複数のサンプルに基づいて訓練することによって得られる請求項8または9に記載の撮像装置。
【請求項11】
前記画像合成部は、前記撮影画像を合成する前に前記撮影画像を回転させる、請求項1から10のいずれか一項に記載の撮像装置。
【請求項12】
記画像合成部は、ヨー軸情報、ピッチ軸情報、またはロール軸情報のうちの少なくとも1つを含む、前記画像撮影装置の姿勢情報に従って撮影画像を回転させる、請求項11に記載の撮像装置。
【請求項13】
記画像合成部は、前記撮影画像内の水平線を検出して、ロール方向の傾斜角を取得し、前記傾斜角が閾値よりも小さい場合に、前記傾斜角に従って前記撮影画像をロール方向に回転させる、請求項12に記載の撮像装置。
【請求項14】
記画像合成部は、前記撮影画像を回転させる前または後に、前記撮影画像に対して歪み補正を実行する請求項13に記載の撮像装置。
【請求項15】
得られた前記撮影画像または前記補正画像である候補画像に対して選択処理を行う画像選択部をさらに備える、請求項1から14のいずれか一項に記載の撮像装置。
【請求項16】
前記画像選択部は、審美的規則に従って前記候補画像のスコアを決定する、請求項15に記載の撮像装置。
【請求項17】
前記画像選択部は、前記スコアが予め設定された閾値より低い場合、前記候補画像を破棄し、前記スコアが予め設定された閾値以上である場合、候補画像を保存する請求項16に記載の撮像装置。
【請求項18】
前記画像選択部は、少なくとも1つの画像特徴に従って、前記候補画像に類似する現在のアルバム内の1つ以上の類似画像を決定し、
前記候補画像のスコアが1つまたは複数の類似画像の最低スコアよりも低い場合、前記候補画像を破棄し、
候補画像のスコアが1つまたは複数の類似画像の最低スコア以上である場合、前記候補画像を記憶する請求項16または17に記載の撮像装置。
【請求項19】
所定の条件が満たされたときに画像撮影装置の撮像動作をトリガする撮影選択部と、
前記画像撮影装置によって得られた撮影画像を合成して補正画像を生成する画像合成部と、
前記補正画像を出力する画像出力部と、
を備え、
前記撮影選択部は、少なくとも、特定の意味を有する、人、動物、顔、または笑顔のうちの少なくとも1つを含むオブジェクトが検出されたとき、及び現在のシーンの奥行きまたは焦点に変化が生じたときに前記撮像動作をトリガし、
得られた前記撮影画像または前記補正画像である候補画像に対して選択処理を行う画像選択部をさらに備え
前記画像選択部は、審美的規則に従って前記候補画像のスコアを決定し、
少なくとも1つの画像特徴に従って、前記候補画像に類似する現在のアルバム内の1つ以上の類似画像を決定し、
前記候補画像のスコアが1つまたは複数の類似画像の最低スコアよりも低い場合、前記候補画像を破棄し、
候補画像のスコアが1つまたは複数の類似画像の最低スコア以上である場合、前記候補画像を記憶する撮像装置。
【請求項20】
前記画像選択部は、少なくとも1つの画像特徴に従って、前記候補画像に類似する現在のアルバム内の1つ以上の類似画像を決定し、
前記候補画像のスコアが1つ以上の類似画像の最高スコアよりも低い場合、前記候補画像を破棄し、
前記候補画像のスコアが1つまたは複数の類似画像の最高スコア以上である場合、前記候補画像を記憶する請求項16から19のいずれか一項に記載の撮像装置。
【請求項21】
所定の条件が満たされたときに画像撮影装置の撮像動作をトリガする撮影選択部と、
前記画像撮影装置によって得られた撮影画像を合成して補正画像を生成する画像合成部と、
前記補正画像を出力する画像出力部と、
を備え、
前記撮影選択部は、少なくとも、特定の意味を有する、人、動物、顔、または笑顔のうちの少なくとも1つを含むオブジェクトが検出されたとき、及び現在のシーンの奥行きまたは焦点に変化が生じたときに前記撮像動作をトリガし、
得られた前記撮影画像または前記補正画像である候補画像に対して選択処理を行う画像選択部をさらに備え
前記画像選択部は、審美的規則に従って前記候補画像のスコアを決定し、
少なくとも1つの画像特徴に従って、前記候補画像に類似する現在のアルバム内の1つ以上の類似画像を決定し、
前記候補画像のスコアが1つ以上の類似画像の最高スコアよりも低い場合、前記候補画像を破棄し、
前記候補画像のスコアが1つまたは複数の類似画像の最高スコア以上である場合、前記候補画像を記憶する撮像装置。
【請求項22】
前記少なくとも1つの画像特徴は、ヒストグラム、シフト特徴、画像モーメント、または画像の指紋のうちの少なくとも1つを含む、請求項18から21のいずれか一項に記載の撮像装置。
【請求項23】
前記審美的規則は、信号対雑音比(SNR)、コントラスト、ヒストグラム分布、画像飽和度、情報エントロピー、自動露出値、オートフォーカス値、オートホワイトバランス値、または候補画像の高得点オブジェクトのうちの少なくとも1つに従って決定される、請求項16から22のいずれか一項に記載の撮像装置。
【請求項24】
前記候補画像の前記スコアは、事前評価済みスコアのデータセットに基づくトレーニング済みモデルに従って決定される請求項16から23のいずれか一項に記載の撮像装置。
【請求項25】
前記画像出力部は、審美的規則に従って決定される前記補正画像のスコアに従って、前記補正画像を現在のアルバムのキューに挿入し、現在のアルバムのキューを表示する請求項1を引用しない請求項9から24のいずれか一項に記載の撮像装置。
【請求項26】
前記画像出力部は、9つの正方グリッドに前記現在のアルバムのキューを表示する、請求項1から8及び25のいずれか一項に記載の撮像装置。
【請求項27】
請求項1から26のいずれか一項に記載の撮像装置による撮像方法であって、
所定の条件が満たされたときに画像撮影装置の撮像動作をトリガするステップと、
前記画像撮影装置によって得られた撮影画像を合成して補正画像を生成するステップと、
前記補正画像を出力するステップと、
を備える撮像方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、撮影技術に関し、特に、撮像装置及び撮像方法に関する。
【背景技術】
【0002】
アクションカメラは、一般に、コンパクトさ、携帯性、および校正に関して高い要求を有する。アクションカメラの携帯性の要件のために、アクションカメラは一般に、小さい画面と、ユーザが対話するためのいくつかのボタンとを有する。このように、ユーザは、プロのカメラまたは携帯電話のように画像のフレーミングおよび合成を完成させるためにアクションカメラで一連の操作を容易かつ手軽に行うことができず、したがってユーザはアクションカメラを用いて手動で画像を撮影することがあまりない。
【0003】
しかしながら、市場に出回っているカメラは一般に、高度な自動トリガおよび自動合成(自動フレーミングとも呼ばれる)機能を欠いている。オートトリガ機能は、タイム撮影またはタイムラプス撮影に限られる。カメラには、センサやプロセッサなどの高度な検出および識別コンポーネントは含まれていない。ライブビュービデオ画面上の3点線や横線、あるいは顔の位置枠や色ヒストグラム、シーン、焦点などの下位の画像情報に従って、構図や撮影を実現するためには、ユーザはより多くの操作を行う必要がある。そのため、自動合成の効果が得られない。
【0004】
そのため、ユーザによる操作を必要とせずに、より高画質の画像を取得するためには、オートトリガ、オートコンポジションなどを有するモーションカメラが必要となる。
【発明の概要】
【0005】
本発明のある態様は、撮像装置である。当該撮像装置は、所定の条件が満たされたときに画像撮影装置の撮像動作をトリガする撮影選択部と、前記画像撮影装によって得られた撮影画像を合成して補正画像を生成する画像合成部と、前記補正画像を出力する画像出力部と、を備える。なお、本明細書において、「撮像動作」とは、メモリなど記録媒体に格納される画像データを取得するために画像撮影装置を動作させることを意味し、「撮像動作」をトリガする前に画像撮影装置を用いて、現在のシーンの画像を一時的または仮に取得してもよい。
本発明の他の態様は、撮像方法である。当該撮像方法は、所定の条件が満たされたときに画像撮影装置の撮像動作をトリガするステップと、前記画像撮影装置によって得られた撮影画像を合成して補正画像を生成するステップと、前記補正画像を出力するステップと、を備える。
【図面の簡単な説明】
【0006】
図1A-1C】図1A−1Cは、本開示の実施形態による撮影装置の適用シナリオを概略的に示す図である。
図2図2は、本開示の実施形態に係る撮影装置の概略図である。
図3図3は、図2の撮影装置によって実行される回転補正処理のフローチャートである。
図4図4は、図2の撮影装置によって実行される画像処理のフローチャートである。
図5A-5D】図5A−5Dは、図2の撮影装置によって実行される処理のフローチャートを示す。
図6図6は、本開示の実施形態による別の撮影装置の概略図である。
図7図7は、本開示の実施形態による別の撮影装置の概略図である。
図8図8は、本開示の実施形態による別の撮影装置の概略図である。
図9図9は、本開示の実施形態に係る撮影方法のフローチャートである。
図10図10は、本開示の実施形態による別の撮影方法のフローチャートである。
図11図11は、本開示の実施形態による別の撮影方法のフローチャートである。
図12図12は、本開示の実施形態による別の撮影方法のフローチャートである。
図13図13は、本開示の実施形態による別の撮影方法のフローチャートである。
【発明を実施するための形態】
【0007】
以下、本開示と一致する実施形態を図面を参照しながら説明するが、これらの図面は例示目的のための単なる例であり、本開示の範囲を限定することを意図するものではない。可能な限り、同じまたは類似の部分を指すために図面全体を通して同じ参照番号が使用される。
【0008】
本開示は、自動トリガ、自動回転補正、自動構図、および/または自動画像選択機能を有する撮影装置を提供することにより、少ないユーザ操作で自動撮影を実現する。図1A図1Cは、本開示と整合性のある撮影装置の例示的な適用シナリオを概略的に示す図である。図1Aに示すように、ユーザは自分の体または腕に直接またはリストバンドなどの他の付属品を介して間接的に自分の体または腕に撮影装置を装着することができる。例えば、ユーザが外出して撮影装置を装着している場合、旅行中に撮影装置が自動的に美的に楽しい画像を撮影することができる。ツアー終了後、ユーザは、撮影装置によって自動的に撮影された画像を見て、美的に楽しい画像を得ることができる。いくつかの実施形態では、撮影装置は、自動撮影のために移動可能な物体(図1Bに示す自転車または自動車など)に取り付けることができ、それによってシーンの広範囲の変化または特別な撮影のニーズを満たすことができる。いくつかの他の実施形態では、図1Cに示すように、撮影装置は、壁、テーブルなどの静止物に配置されるか、または固定的に取り付けられることができる。このシナリオでは、撮影装置は動いていないが、撮影装置はシーン内で変化する内容の画像を撮影し、人生の瞬間を捉えることができる。
【0009】
図2は、本開示と整合性のある例示的な撮像装置200の概略図である。図2に示すように、撮像装置200は、画像撮影装置(カメラ)201と、画像撮影装置201に接続された撮影選択回路202と、画像撮影装置201に接続された画像回転補正回路203と、画像回転補正回路203に接続された画像合成回路204と、画像合成回路204と画像撮影装置201とを接続する画像選択回路205と、画像合成回路204と画像撮影装置201とを接続する画像表示回路206とを含む。
【0010】
画像撮影装置201は、カメラ、カムコーダ、光センサなどとすることができる。画像撮影装置201は、カメラレンズ、画像センサ、画像処理チップ、メモリ、スクリーン、インターフェースなどを含むことができる。いくつかの実施形態では、カメラレンズは、例えば120度を超える視野(FOV)を有する広角レンズを含むことができる。いくつかの他の実施形態では、カメラレンズは複数のレンズを含むことができる。画像センサは、例えば、電荷結合素子(CCD)センサまたは相補型金属酸化膜半導体(CMOS)センサを含むことができる。画像処理チップは画像センサに結合することができる。画像撮影装置201は、カメラレンズと撮像素子を介して撮像し、撮像素子を介して撮像画像を画像処理チップに入力することができる。画像処理チップは、例えば、画像に対してノイズ低減、色補正、フォーマット変換(例えば、RGBからYUVへ)、スケーリングなどを実行することによって画像を処理することができる。画像処理チップは、カメラレンズおよび/または画像センサを制御する、例えば3Aパラメータ、すなわち自動露出(AE)、自動ホワイトバランス(AWB)、オートフォーカス(AF)を調整するように構成することもできる。画像処理チップは、例えば、デジタル信号処理(DSP)チップとすることができる。メモリは、取り込まれた画像データを一時的または恒久的に格納するように構成することができる。インターフェースは、画像伝送用のユニバーサルシリアルバス(USB)インターフェース、米国電気電子技術者協会1394(IEEE 1394)インターフェースなどのような任意の種類の電気的インターフェースを含むことができる。
【0011】
撮影選択回路202は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、特定用途向け集積回路(ASIC)、またはASICの一部を含むことができ、画像撮影装置201の撮像動作を自動的にトリガし、ソフトウェアとハードウェアの組み合わせを使用して現在のシーンの画像を撮影するように構成することができる。いくつかの実施形態では、撮影選択回路202は、現在のシーンにおいて特定の意味を有するオブジェクトが検出されると、撮像動作をトリガすることができる。特定の意味は、例えば、人々、動物、顔、または笑顔を含み得るが、これらに限定されない。例えば、現在のシーンにおいて顔が検出されると、撮影選択回路202は自動的に画像撮影装置201の撮像動作をトリガすることができる。現在のシーン内のオブジェクトを検出するために任意のオブジェクト認識アルゴリズム、例えば、本明細書で限定されない顔認識アルゴリズムを使用することができる。
【0012】
いくつかの実施形態では、撮影選択回路202は、現在のシーンの奥行き(depth)の変化に応答して撮像動作をトリガすることができる。現在のシーンの奥行きは、例えば、画像撮影装置201が現在のシーンに面しているときのカメラ201の焦点距離を指すことができる。これは、例えば、画像撮影装置201から現在のシーン内のオブジェクトまでの距離とすることができる。いくつかの実施形態では、現在のシーンの奥行きは、奥行きセンサ、例えば飛行時間(ToF)センサを介して取得することができる。現在のシーンの奥行きの変化は、現在のシーンの奥行きが前のシーンの奥行きと異なることを指すことができる。
【0013】
いくつかの実施形態では、撮影選択回路202は、現在のシーンの焦点の変化に応答して撮像動作をトリガすることができる。現在のシーンの焦点は、画像撮影装置201が現在のシーン内のオブジェクトに焦点を合わせるときの、画像撮影装置201の焦点位置を指すことができる。いくつかの実施形態では、現在のシーンの焦点は焦点センサを介して得ることができる。現在のシーンの焦点の変化は、現在のシーンの焦点が前のシーンの焦点とは異なることを指すことができる。
【0014】
いくつかの実施形態では、撮影選択回路202は音声コマンドを介して撮像動作をトリガすることができる。例えば、撮影選択回路202は音声-ユーザインタフェース(VUI)を含むことができる。ユーザは音声コマンドを話すことができ、VUIは音声コマンドを撮影するためにユーザの音声を検出することができ、例えば、音声選択アルゴリズムを使用して音声コマンドをテキストに変換し、撮影選択回路202が変換されたテキストに従って撮像操作をトリガすることができる。VUIは、例えば、ユーザの音声を検出するように構成されたマイクロフォン、および音声コマンドを変換するように構成されたプロセッサ(マイクロプロセッサまたは特定用途向け集積回路(ASIC)など)を含むことができる。
【0015】
いくつかの実施形態では、撮影選択回路202は、制御プロセスを通して撮像動作をトリガすることができる。制御処理としては、タイマー撮影、タイムラプス撮影等が挙げられる。例えば、撮影選択回路202は、タイマー撮影を用いて予め設定された時間に撮像動作をトリガすることができる。他の例として、撮影選択回路202は、タイムラプス撮影を用いて、予め設定された時間間隔、例えば5秒ごとに撮像動作をトリガすることができる。
【0016】
いくつかの実施形態では、撮影選択回路202は、上記の異なる基準の任意の組み合わせに従って撮像動作をトリガすることができる。例えば、撮影選択回路202は、特定の意味を有するオブジェクトがプリセット時間に検出された場合、タイマー撮影を使用してプリセット時間に撮像動作をトリガすることができる。別の例として、撮影選択回路202は、特定の意味を有するオブジェクトが事前設定された期間に検出された場合、タイムラプス撮影を使用して事前設定された期間に撮像動作をトリガすることができる。
【0017】
画像回転補正回路203は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、画像撮影装置201から撮影画像を受信して自動的に実行するように構成することができる。撮影画像の回転補正いくつかの実施形態では、画像回転補正回路203は、慣性測定ユニット(IMU)などの、画像撮影装置201に取り付けられた、またはそれに結合された1つまたは複数の姿勢センサを通して画像撮影装置201の姿勢情報を得ることができる。姿勢情報は、画像撮影装置201のヨー軸情報、ピッチ軸情報、および/またはロール軸情報を含むことができる。例えば、1つ以上の姿勢センサ、例えばIMUは、画像撮影装置201の画像センサの裏側に配置され、画像撮影装置201の姿勢情報を取得することができる。画像撮影装置201が目標姿勢にあるときに画像が取り込まれたかのように、画像撮影装置201の姿勢情報と目標姿勢との差(このような差を「姿勢差」ともいう)に応じて撮像画像を回転させることで、回転画像の姿勢を調整することができる。画像撮影装置201の姿勢情報と目標姿勢との差を算出するのに適した任意の方法を採用することができる。
【0018】
図3は、例えば撮像装置200により実現可能な回転補正処理の一例を示すフローチャートである。例えば、図10に示す回転補正処理は、CPU101により実行される。撮像装置200の画像回転補正回路203により、図3に示すような画像回転補正回路203を実現することができる。図3に示すように、画像撮影装置201のイメージセンサ等のイメージセンサ312により、ベイヤー形式の撮像画像の生データ310と、各撮像画像に同期したVSYNC(垂直同期)信号311とが出力される。IMU314のジャイロデータ313およびVSYNC信号311は、IMU314のドライバ回路によって取得することができる。IMU314の各ジャイロデータ313は、各撮影画像に対応するVSYNC信号311のシーケンス番号でラベル付けされている。メッシュ計算器316によって画像撮影装置201のパラメータ(図3においてカメラ情報315として示される)およびジャイロデータ313が得られた後、ジャイロデータ313と目標姿勢(例えば、0度ヨー角、0度ロール角、および0度ピッチ角を有する姿勢)との差に従って、メッシュ計算器316によってメッシュテーブル317を計算することができる。メッシュテーブル317は、デワープ(Dewarp)エンジン318によって目標姿勢を有する回転画像を生成するために取り込まれた画像をそれに従って回転させることができる回転行列を含むことができる。メッシュ計算器316は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができる。いくつかの実施形態では、生データ310は、デワープエンジン318に送信する前に処理することができる。処理された画像データは、Src_imgデータ319として示され、これは、取り込まれた画像の生データ310とは異なる。理解されるように、デワープエンジン318に送信される画像データ(例えば、Src_imgデータ319)に対応するVSYNC信号311のシーケンス番号は、メッシュテーブル内のVSYNC信号311のシーケンス番号と一致する。目標姿勢を有する回転画像を生成するために画像を回転させることができる。回転された画像の画像データは、図3の修正Src_imgデータ320によって示される。すなわち、Src_imgデータ319がデワープエンジンに送られる時点t2は、撮像画像を正しく回転させて目標姿勢の回転画像を生成できるようにメッシュテーブルを生成する時点t1よりも早い。いくつかの実施形態では、回転範囲は、回転された画像の視野(FOV)をFOV閾値より小さくないように設定することができる。回転範囲とは、画像を回転させることができる最大角度のことである。FOV閾値は実際の要求に従って決定することができる。回転範囲は、ヨー方向の回転範囲、ピッチ方向の回転範囲、および/またはロール方向の回転範囲を含むことができる。画像撮影装置201の姿勢情報と目標姿勢との差が回転範囲より大きければ、回転範囲に応じて撮像画像を回転させたり、回転させずに撮像画像を維持したりすることができる。例えば、画像撮影装置201の姿勢情報と目標姿勢との差が、撮像画像をロール方向に20°回転させても、ロール方向の回転範囲が15°しかない場合には、撮像画像を撮像する。画像はロール方向に15°回転させることも、回転させないこともできる。
【0019】
いくつかの他の実施形態では、水平方向の線または垂直方向の線などの既知の傾斜角を有する線をロール方向の傾斜角を得るために撮影画像内で検出し、傾斜角に応じて、撮影画像をロール方向に回転させることができる。水平線または垂直線を検出するのに適した任意の方法を使用することができる。例えば、撮像画像における空と地面との色やコントラストなどの差を満たす複数の直線を得ることができる。撮影画像内の水平線を得るために、これらの直線のそれぞれに対して曲線当てはめを実行することができる。いくつかの実施形態では、傾斜角は、撮像画像内で検出された水平線と画像撮影装置201の幅方向に平行な直線との間の角度を計算することによって得ることができる。いくつかの他の実施形態では、傾斜角は、撮像画像内で検出された垂直線と画像撮影装置201の長さ方向に平行な直線との間の角度を計算することによって得ることができる。場合によっては、ロールの方向への撮影された画像の傾斜は、ユーザの意図的な振る舞いから生じる可能性があり、したがって、ロールの方向への撮影された画像の回転は必要とされない。いくつかの実施形態では、ロール方向の傾斜閾値が設定されてもよく、ロール方向の傾斜閾値以上であるロール方向の傾斜角は、ユーザが意図的に画像撮影装置201を傾けて画像を撮影したことを示し得る。従って、取り込まれた画像は回転することなく維持され得る。
【0020】
いくつかの実施形態では、ピッチ方向の傾斜角は、角度センサなどの、画像撮影装置201に取り付けられたまたはそれに結合された1つまたは複数のセンサを介して取得することができる。例えば、1つ以上のセンサ、例えば角度センサは、画像撮影装置201の画像センサの裏側に配置され、ピッチ方向における画像撮影装置201の傾斜角を得ることができる。時々、ピッチ方向への撮影された画像の傾斜は、ユーザの意図的な行動に起因し得、したがって、撮影された画像をピッチ方向に回転させることは必要とされない。いくつかの実施形態では、ピッチ方向の傾斜閾値が設定されてもよく、ピッチ方向の傾斜閾値以上であるピッチ方向の傾斜角は、ユーザが意図的に画像撮影装置201を傾斜させて画像を撮像したことを示してもよい。アクションカメラは一般にユーザによって装着されているか、または移動装置に配置されているため、撮影プロセス中にユーザが構図に積極的に参加していない場合、カメラの姿勢の傾きは変化する。例えば、カメラは、撮影画像がヨー方向、ピッチ方向、ロール方向に投影変形している場合に発生する。そのため、撮影画像に対して回転補正を行い、姿勢の傾きを補正する必要がある。しかしながら、現在市販されているほとんどのカメラは、撮影プロセス中の姿勢の修正を実現するためにジンバルなどの補助装置を使用する必要があり、そのためユーザは撮影を完了するために追加の装置を携帯しなければならず、アクションカメラの携帯性の利点が奪われる。したがって、自動回転補正機能を有する撮像装置200は、補助装置を必要とせずに撮影中の姿勢補正を実現することができ、携帯性の利点を実現することができる。
【0021】
いくつかの実施形態では、撮像装置200は、画像回転補正回路203および/または画像撮影装置201に結合された画像歪み補正回路(図2には図示せず)をさらに含み得る。画像歪み補正回路は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、撮影画像を回転させる前または後に歪み補正を実行するように構成することができる。歪み補正の方法は、歪みの種類に応じて選択することができ、任意の適切な方法が採用され得る。例えば、広いFOVを有する画像には樽型の歪みが存在する可能性がある。樽型歪みの補正方法としては、偶数次多項式モデル、多項式モデル、無パラメータモデル、除算モデルなどを用いることができる。
【0022】
実施形態によっては、撮像装置200は、画像歪み補正回路および画像回転補正回路203の代わりに画像補正回路を備えていてもよい。画像補正回路は、撮像画像に対して歪み補正と回転補正の両方を行うように構成することができる。
【0023】
アクションカメラで使用されている超広角レンズは、動いているシーンで広いFOVを有する画像を撮影することを可能にする。しかし、超広角レンズによる光学歪みのために、撮影画像の端部にはひずみと圧縮が激しい。歪み補正を使用することによって、ある範囲の歪みを補正することができるが、歪み補正後の画像の視覚効果は依然として受け入れられない。そのため、歪み補正機能を有する撮像装置200は、より視覚効果の高い画像を得ることができる。画像合成回路204は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができる。そして、回転画像を画像回転補正回路203から受け取り、回転画像を自動的に合成して補正画像を生成するように構成することができる。いくつかの実施形態では、画像合成回路204は、顕著性検出および合成規則に基づいて回転画像を合成するように構成することができる。合成規則は、中央合成規則、トライアド合成規則、水平線合成規則、対称合成規則、および対角線合成規則などを含むことができる。
【0024】
例えば、画像合成回路204は、回転画像内の顕著な物体を検出することができる。回転画像における顕著な物体の位置およびサイズ情報を得ることができる。回転された画像は、合成規則および顕著なオブジェクトの位置およびサイズの情報に従って、合成画像を得るために切り取ることができる。例えば、合成規則が中心合成規則である場合、回転オブジェクトを切り取って、顕著オブジェクトの位置およびサイズ情報に従って、顕著オブジェクトを合成画像の中心または中心付近に配置することができる。いくつかの実施形態では、合成画像を補正画像として出力することができる。いくつかの他の実施形態では、合成画像は、例えば、画像撮影装置201のスクリーンまたは画像撮影装置201の外部のディスプレイのアスペクト比に従って、補正画像を得るためにスケーリングまたはさらにトリミングすることができる。補正画像のアスペクト比は、画像撮影装置201の画面またはディスプレイのアスペクト比と一致し得る。顕著オブジェクトを検出するのに適した任意の方法、例えば、ディープラーニングに基づく方法(例えば、階層的ディープネットワーク、マルチスケール、マルチコンテキストディープラーニングフレームワーク、対称ネットワークなど)、周波数領域分析、スパース表現、セルオートマトン、ランダムウォーク、低ランク回復、ベイズ理論などが実行されうる。
【0025】
いくつかの実施形態では、回転画像において複数の顕著な物体を得ることができる。画像内の顕著なオブジェクトの分布を示す顕著性マップは、複数の顕著なオブジェクトの位置およびサイズ情報に従って計算することができる。顕著な物体の分布は、画像内の顕著な物体の空間分布を指すことがある。画像合成回路204は、顕著性マップおよび合成規則に基づいて回転画像を合成することができる。例えば、合成規則が対称的合成規則である場合、回転された画像を切り取って、顕著なオブジェクトの分布を合成画像内で対称またはほぼ対称にすることができる。
【0026】
いくつかの他の実施形態では、画像合成回路204は、ネットワークモデルまたは木構造を介して回転画像を構成するように構成することができる。いくつかの実施形態において、ネットワークモデルは、最小モデル誤差に収束するために損失関数を必要とする最適化プロセスを使用して複数のサンプルに基づいてトレーニングすることによって得ることができる。損失関数は、例えば、クロスエントロピー、二乗平均誤差などを含み得るが、これらに限定されない。ネットワークモデルを訓練するのに適した任意の方法を採用することができる。複数のサンプルは複数の画像サンプルを含むことができる。画像サンプルは、例えば、画像撮影装置201によって取得される、インターネットからダウンロードされる、画像ライブラリから取得される、および/または同様のものとすることができる。回転された画像は、ネットワークモデルまたはツリー構造に入力され、クロッピング座標および/または倍率を得るためにネットワークモデルまたはツリー構造に従って処理されることができる。すなわち、ネットワークモデルまたはツリー構造の入力は回転画像であり、ネットワークモデルまたはツリー構造の出力は回転画像のクロッピング座標および/または倍率である。回転された画像は、クロッピング座標に従って合成画像を得るためにクロッピングすることができ、補正画像は、スケーリングファクタに従って合成画像をスケーリングすることによって得ることができる。
【0027】
図4は、例えば撮像装置200により実現可能な画像処理の一例を示すフローチャートである。図4に示すように、411において、ソフトウェアおよびハードウェアの組み合わせを使用して現在のシーンの画像4102を取り込むために、画像撮影装置201の撮像動作を取り込み選択回路202によってトリガすることができる。例えば、撮影画像4102は、(W_src、H_src)、例えば(4000,3000)の解像度を有するNV16フォーマットの画像であり得る。NV16フォーマットは、YUV 422とも呼ばれる。
【0028】
413で、IMUによって取得されたジャイロデータ4100に従って、画像回転補正回路203によって回転補正を撮影画像4102に対して実行して、回転画像4104を生成することができる。図4において、画像4152は回転画像4104の一例である。回転画像4104のフォーマットおよび解像度は、撮影画像4102のフォーマットおよび解像度と同じである。撮影画像4102を取得するために撮像動作がトリガされたときに同期してジャイロデータ4100を取得することができる。回転補正処理は、図10の処理と同様である。その詳細な説明は省略する。
【0029】
415で、回転画像4104が画像合成回路204によって合成される。いくつかの実施形態では、重心補間(UV補間とも呼ばれる)を実施して、NV16フォーマットの回転画像4104をYUV444フォーマットの回転画像4106に変換することができる。フォーマットYUV444は一般に画像データの4つのYサンプルごとに4つのU値および4つのV値を有し、フォーマットNV16は一般に4つのYサンプルごとに2つのU値および2つのV値を有する。したがって、4つのYサンプルごとに2つの値のUおよびVにUおよびVを補間することによって、4つのYサンプルごとに2つの値のUおよびVを4つのYサンプルごとに4つの値に変換することができる。いくつかの実施形態では、回転画像4104は補間される前に拡大縮小することができる。例えば、回転画像4104は、顕著性の処理効率を向上させるために、解像度を(W_src、H_src)から(W1、H1)へ、例えば(4000,3000)から(480,360)へ変換するようにスケーリングすることができる。回転画像の検出そのため、YUV444フォーマットの回転画像4106の解像度は、NV16フォーマットの回転画像4104の解像度よりも小さい。
【0030】
いくつかの実施形態において、YUV色空間における回転画像4106は、CIE L * a * b色空間における回転画像4108にさらに変換され得る。例えば、回転画像4106の色空間は、任意の適切な変換式に従って、YUV色空間からRGB(赤-緑-青)色空間に変換することができる。いくつかの実施形態では、回転画像4106の全体の明るさを制御するために、RGB色空間において回転画像4106に対してガンマ補正を実行することができる。ガンマ補正のガンマ値は実際の要求に従って決定することができる。ガンマ補正後の回転画像4106の色空間は、任意の適切な変換式に従って、RGB色空間からCIE L * a * b色空間に変換することができる。変換式は、例えば、画像撮影装置201の撮像素子の仕様等に応じて決定することができる。いくつかの実施形態では、色温度調整は、ガンマ補正後の回転画像4106または回転画像4108に対しても実行することができる。
【0031】
4151において、回転画像4108に対して顕著性検出が行われ、回転画像4108の顕著性マップ4110が得られる。顕著性マップ4110を取得するために、任意の適切な顕著性検出方法を使用することができる。例えば、回転画像4108の特徴を抽出することができる。特徴は、色、強度、および/または向きを含むことができるが、それらに限定されない。回転画像4108の各画素の色は、例えば、CIE L * a * b色空間において得ることができる。回転画像4108の各画素の強度は、例えば回転画像4108をグレースケールに変換することによって得ることができる。回転画像4108の各画素の向きは、例えば、4つの角度に関してガボールフィルタを使用して得ることができる。上述したこれらの処理された画像の全ては、特徴マップを生成するためにガウスピラミッドを作成するために使用することができる。特徴マップは3つの特徴のそれぞれに関して生成することができ、顕著性マップ4110は3つの特徴マップの平均である。図4において、画像4156は顕著性マップ4110の一例である。回転画像4108内の顕著なオブジェクト(例えば、画像4152内の家)の位置およびサイズ情報は、顕著性マップ4110に従って取得することができる。
【0032】
4153で、回転画像4104を顕著性マップ4110に従って合成して、合成画像4112を得ることができる。例えば、回転画像4104内の顕著オブジェクト(例えば、画像4152内の家)の位置及びサイズ情報は、回転画像4108内の顕著オブジェクトの位置及びサイズ情報に従って得ることができる。中心構図規則を選択することができ、したがって回転された画像4180を切り取って、顕著なオブジェクト(例えば、画像4152内の家)を合成画像4112の中心に配置することができる。そのため、合成画像4112の解像度は、回転画像4104の解像度よりも小さい。図4において、画像の中央に家がある画像4154が合成画像4112の一例である。
【0033】
人間の目の最大可視範囲は約170度であるが、人間の目の鮮明な撮像範囲は約60度に過ぎず、そのため、超広視野角を有する画像は人間の目の視覚的快適性要件を満たさない。人間の目は一般に画像の中心に焦点を合わせているので、画像の端のシーンは冗長である。したがって、合成画像を得るために回転画像を切り取ることは、人間の目の視覚的快適さの要求に対してより適している。
【0034】
417では、画像選択回路205により合成画像4112に対して選択処理が行われ、詳細な説明は後述する。
【0035】
419および421では、選択処理の判定結果に応じて合成画像4112を画像表示回路206に格納して表示させることができる。詳細は後述する。
【0036】
いくつかの実施形態では、画像撮影装置201は、画像回転補正回路203を迂回して、撮影した画像を直接合成のために画像合成回路204に送ることができる。いくつかの他の実施形態では、画像回転補正回路203を全く省略することができる。これらの実施形態(画像回転補正回路203を迂回するかまたは全く省略するかのいずれか)では、画像合成回路204を画像撮影装置201に結合することができ、補正画像を得るために自動的に撮影画像を合成することができる。
【0037】
いくつかの実施形態では、画像回転補正回路203は、画像合成回路204を迂回して回転画像を画像選択回路205に直接送ることができる。いくつかの他の実施形態では、画像合成回路204は全く省略することができる。これらの実施形態(画像合成回路204を迂回するかまたは全く省略するかのいずれか)では、回転画像を補正画像と見なすことができ、画像選択回路205を画像回転補正回路203に結合することができる。
【0038】
いくつかの実施形態では、画像撮影装置201は、画像回転補正回路203および画像合成回路204を迂回して、撮影した画像を画像選択回路205に直接送ることができる。他の実施形態では、画像回転補正回路203と画像合成回路204の両方を全く省略することができる。これらの実施形態(画像回転補正回路203および画像合成回路204のいずれかがバイパスされるかまたは全く省略される)において、画像選択回路205は画像撮影装置201に結合することができる。
【0039】
画像選択回路205は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、画像合成回路204または画像回転補正から補正画像を受け取るように構成することができる。そして、補正後の画像に対して選択処理を行う。例えば、画像選択回路205は、補正画像に対して選択処理を行って、補正画像を画像撮影装置201のメモリに格納するか、画像撮影装置201の画面に表示するか、あるいは、画像撮影装置201のディスプレイの外部に表示するかを決定することができる。
【0040】
いくつかの実施形態では、画像選択回路205は審美的規則に従って補正画像のスコアを決定することができる。得点は審美的得点とも呼ぶことができる。いくつかの実施形態では、審美的規則は、信号対雑音比(SNR)、コントラスト、ヒストグラム分布、画像飽和度、情報エントロピー、AE値、AF値、AWB値、または人物、笑顔、日の出、ペットなどの候補画像の高得点オブジェクトのうちの少なくとも1つに従って決定できる。いくつかの他の実施形態では、審美的規則は訓練されたモデルに従って決定することができる。訓練されたモデルは、事前評価されたスコアのデータセットを使用して訓練することによって取得できる。例えば、事前評価スコアは、異なる人によって事前評価された画像の審美的な満足スコアであり得る。訓練されたモデルは、任意の適切な機械学習アルゴリズムを使用して訓練することによって得ることができる。
【0041】
いくつかの実施形態では、スコアが事前設定された閾値より低い場合、画像選択回路205は補正画像を破棄または削除すると決定することができる。スコアが予め設定された閾値以上である場合、画像選択回路205は、補正された画像を現在のアルバムに格納すること、および/または補正された画像を画像表示回路206に送信することを決定することができる。例えば、現在のアルバムを画像撮影装置201のメモリに設定することができる。
【0042】
いくつかの他の実施形態では、画像選択回路205はまた、補正画像と現在のアルバム内の画像との間の類似性を判定するために、補正画像から少なくとも1つの画像特徴を抽出することができる。少なくとも1つの画像特徴は、ヒストグラム、シフト特徴、画像モーメント、または画像の指紋のうちの少なくとも1つを含むことができる。画像の指紋は、知覚的特徴または画像の簡単な要約、例えば知覚過酷(pHash)などである。いくつかの実施形態では、画像選択回路205は、抽出された少なくとも1つの画像特徴に従って、修正画像に類似する現在のアルバム内の1つまたは複数の類似画像を決定することができる。補正画像のスコアが1つまたは複数の類似画像の最低スコアよりも低い場合、画像選択回路205は補正画像を破棄することを決定することができる。補正画像のスコアが1つまたは複数の類似画像の最低スコア以上である場合、画像選択回路205は、補正画像を現在のアルバムに格納すると決定することができる。いくつかの実施形態では、補正された画像のスコアよりも低いスコアを有する1つまたは複数の類似の画像を現在のアルバムから削除することができる。
【0043】
いくつかの他の実施形態では、補正画像のスコアが1つまたは複数の類似画像の最高スコアより低い場合、画像選択回路205は補正画像を破棄することを決定することができる。補正画像のスコアが1つまたは複数の類似画像の最高スコア以上である場合、画像選択回路205は、補正画像を現在のアルバムに格納することを決定することができ、1つまたは複数の類似画像を現在のアルバムから削除することができる。
【0044】
画像表示回路206は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、補正画像を出力するように構成することができる。いくつかの実施形態では、現在のアルバム内の画像は、それらの画像のスコアに従ってキュー内に配置することができる。画像表示回路206は、画像選択回路205から補正画像を受け取り、補正画像のスコアに応じて現在のアルバムのキューに挿入することができる。ここでは、補正後の画像を現在のアルバムの候補画像とも呼ぶことができる。
【0045】
画像表示回路206は、現在のアルバムのキューを画像撮影装置201の画面に表示するように構成することができる。いくつかの実施形態では、現在のアルバムのキューを順番に表示することができ、その結果、ユーザは、より優れた美的満足感スコアを有する画像を最初に見ることができる。いくつかの他の実施形態では、現在のアルバムの待ち行列は、ユーザが画像をバッチとして見ることができるように、9つの正方グリッドに表示することができる。
【0046】
図5A図5Dは、例えば撮像装置200によって実現され得る処理の一例のフローチャートを示す。図5Aを参照すると、510において、自動モードがオンにされる。例えば、撮像装置200は、ユーザインタフェース(UI)から自動モードオンの指示を受けた場合に、自動モードをオンにすることができる。511で、初期化プロセスが開始される。撮像装置200は、オートモードをオンにした後に初期化を開始することができる。図5Cを参照すると、512において、撮像装置200に格納されているフィンガープリントデータベースが初期化される。513において、撮像装置200に格納されている審美性データベースが初期化される。514において、撮像装置200に格納されている画像名データベースを初期化する。画像指紋データベース、審美性データベース、および画像名データベースは、例えば、画像撮影装置201のメモリに格納することができる。図5Dを参照すると、515で、初期化プロセスが終了する。いくつかの実施形態では、516において、新しい画像アルバムを画像撮影装置201のメモリ内に作成することができる。新しいイメージアルバムを現在のアルバムとして使用できる。
【0047】
図5Aに戻り、517において、ソフトウェアおよびハードウェアの組み合わせを使用して現在のシーンの画像を取り込むために、画像撮影装置201の撮像動作が撮影選択回路202によって自動的にトリガされる。518では、画像回転補正回路203により、撮像画像に対して回転補正が自動的に行われる。519において、画像選択回路205による回転画像に対する選択処理が実行される。
【0048】
図5Bを参照すると、520で、回転された画像が現在のアルバムの最初の画像であるかどうかが判定される。回転画像が第1の画像である場合(520:Yes)、521において、画像合成回路204によって回転画像に対して顕著性の検出を実行することができる。回転された画像が最初の画像ではない場合(520:No)、522において、現在のアルバム内に回転された画像に類似する1つまたは複数の類似の画像があるかどうかを判定することができる。522において、1つまたは複数の類似画像の数が所定の閾値以上であるかどうかを判定することができる。1つ以上の類似画像の数が所定の閾値以上である場合(522:Yes)、523において、回転画像の審美性スコアと1つ以上の類似画像の審美性スコアとが比較される。さらに、524で、取り込まれた画像(すなわち、最も新しい取り込まれた画像)を削除(または破棄)するかどうかが決定される。回転画像の審美性スコアが1つ以上の類似画像の最高審美性スコアまたは最低審美性よりも高い場合、画像選択回路205は、取り込まれた画像を削除しないと決定することができ(524:No)、その後521で例えば、画像合成回路204により回転画像に対して顕著性検出を行うことができる。回転画像の審美性スコアが1つ以上の類似画像の最高審美性スコアまたは最低審美性よりも小さい場合、画像選択回路205は、取り込まれた画像を削除すると決定することができる(524:Yes)。
【0049】
1つ以上の類似画像の数が所定の閾値未満である場合(522:No)、次に525で、現在のアルバム内の画像の数が最大数以上であるかどうかが判定される。現在のアルバム内の画像の数が最大数以上である場合(525:No)、521で、画像合成回路204によって回転画像に対して顕著性検出を実行することができる。現在のアルバム内の画像の数が最大数を超える場合(525:Yes)、次に526で、回転された画像の審美性スコアと現在のアルバム内のすべての画像の審美性スコアとが比較され、比較が行われる。524で結果を使用して、取り込まれた画像を削除するかどうかを決定することができる。例えば、回転画像の審美性スコアが現在のアルバム内の画像の最低審美性よりも小さい場合、画像選択回路205は、取り込まれた画像を削除すると決定することができる(524:Yes)。回転画像の審美性スコアが現在のアルバム内の画像の最低審美性以上である場合、画像選択回路205は、取り込まれた画像を削除しないと決定することができ(524:No)、次に521で、顕著性検出は可能である。画像合成回路204によって回転された画像に対して実行される。
【0050】
527で、回転画像を合成することができるかどうかが判定される。いくつかの実施形態では、回転画像を合成することができるかどうかは、顕著性マップに従って決定することができる。例えば、顕著性マップの分布が散在しすぎる場合、画像合成回路204は、回転画像を合成することができないと決定することができる。別の例として、回転画像内に顕著オブジェクトが検出されない場合、画像合成回路204は回転画像を合成することができないと決定することができる。回転画像が合成可能であると判断された場合(527:Yes)、528(図5Cに示す)において、回転画像は補正画像を得るために画像合成回路204によって合成される。
【0051】
図5Cを参照すると、529で、補正された画像の指紋がフィンガープリントデータベースに入れられる。補正画像の指紋を補正画像から抽出することができ、補正画像の指紋をフィンガープリントデータベースの待ち行列に追加することができる。530において、補正された画像の審美性スコアが審美性データベースに入れられる。補正画像の審美性スコアは、審美性データベースの待ち行列に追加することができる。例えば、審美性データベースの待ち行列は、審美性スコアの順序に従って配置することができる。531において、補正された画像の画像名が画像名データベースのキューに入れられる。補正画像の画像名は、数字、文字、単語などを含むことができるが、これらに限定されない。いくつかの実施形態では、フィンガープリントデータベースのキューおよび画像名データベースのキューは、審美的なキューと同じ順序で配置することができ、これはデータ検索に便利である。
【0052】
取り込まれた画像が最初の画像である場合(520:Yes)、または1つまたは複数の類似画像の数が所定の閾値未満であり(522:No)、現在のアルバム内の画像の数が最大数を超えない。番号(525:No)の場合、次に532(図5Dに示す)で補正画像を出力し、補正画像を一時記憶するためのメモリ内のバッファを切り取ることができる。いくつかの実施形態では、図5Dを参照すると、533において、出力された補正画像は、画像撮影装置201のメモリ、例えば、セキュアデジタル(SD)カードに格納される。いくつかの実施形態では、533において、補正された画像も格納の前後に符号化される。
【0053】
撮影画像が最初の画像ではない場合(520:No)、1以上の類似画像の数が所定の閾値以上である場合(522:Yes)または1以上の類似画像の数が所定の閾値(522:No)であるが現在のアルバム内の画像の数が最大数以上である場合(525:Yes)、次に534で(図5Dに示すように)補正された画像が画像撮影装置201のメモリに記憶される。いくつかの実施形態では、534において、補正画像が出力され、補正画像のスコアよりも低いスコアを有する1つまたは複数の類似画像の名前が出力され、補正画像を一時記憶するためのメモリ内のバッファが切り取られうる。図5Dを参照すると、いくつかの実施形態では、535で、出力された補正画像が画像撮影装置201のメモリ、例えばセキュアデジタル(SD)カードに格納される。いくつかの実施形態では、535において、補正画像は格納の前後に符号化される。いくつかの実施形態では、535において、補正画像のスコアより低いスコアを有する1つまたは複数の類似の画像が、画像撮影装置201のメモリから削除される。
【0054】
撮影画像が削除可能であると判断された場合(524:Yes)または作成できないと判断された場合(527:No)、撮影画像を削除する(536)。図5Dを参照すると、537でプロセスは終了する。
【0055】
図5Aを参照すると、538で、自動モードがオフにされる。例えば、撮像装置200は、UIから自動モード解除の指示を受けた場合に、自動モードを解除することができる。脱初期化プロセスが開始される(539)。例えば、フィンガープリントデータベース、審美性データベース、および画像名データベースに対して脱初期化プロセスを実行することができる。初期化解除プロセスは、初期化プロセスの逆のプロセスである。図5Dを参照すると、540で、脱初期化プロセスが終了する。
【0056】
本開示によれば、ユーザは、撮像装置200を着用したり、撮像装置200を固定した場所に配置したりすることができ、ユーザの参加を必要とせずに撮像装置200の作業時間中に自動的に画像を撮影できる。取り込まれた画像は、画像の任意の角度でゼロチルトを確実にするために自動的に回転させることができ、回転された画像は、シーンの内容に従って自動的に合成され、より良いFOVおよび妥当なレイアウトを有する画像を得ることができる。さらに、歪み補正を自動的に行うことで歪みの影響を弱めることができる。また、心地よい美観を有する画像を得ることができる。さらに、画像を自動的に選択することによって、多くの重複または類似の画像および無意味なショットを削除することができ、その結果、ユーザは、より良い品質を有する特定の数の画像だけを得て、見やすい方法で画像を見ることができる。
【0057】
図6は、本開示と一致する他の例示的な撮像装置300の概略図である。図6に示すように、撮像装置300は、画像撮影装置301と、画像撮影装置301に接続された撮影選択回路302と、画像撮影装置301と撮影選択回路302とに接続された画像選択回路303と、画像回転補正回路304とを備える。304は画像撮影装置301に接続され、画像合成回路305は画像回転補正回路304および画像撮影装置301に接続され、画像表示回路306は画像合成回路305および画像撮影装置301に接続されている。画像撮影装置301は、画像撮影装置201と同様であり、詳細な説明は省略する。
【0058】
画像選択回路303は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、ライブビュー画像内のライブビュー画像に対して選択処理を実行するように構成することができる。画像撮影装置301はリアルタイムで動作する。例えば、画像選択回路303は、ライブビュー中のライブビュー画像に対して選択処理を行い、ライブビュー画像を撮像するか否かを判定することができる。ライブビュー画像とは、画像撮影装置301のライブビューにおける現在のシーンの画像をいう。ここで、ライブビュー画像と現在のシーンは互換的に使用することができる。
【0059】
いくつかの実施形態では、画像選択回路303は、審美的規則に基づいてライブビュー内のライブビュー画像をリアルタイムでスコア付けして、ライブビュー画像のスコアを決定することができる。審美的規則を決定する方法は、画像選択回路205が使用する方法と同様であり、その詳細な説明はここでは省略する。いくつかの実施形態では、スコアが事前設定された閾値より低い場合、画像選択回路303は、画像撮影装置301のライブビュー内のライブビュー画像を撮影しないと決定することができる。スコアが予め設定された閾値以上である場合、画像選択回路303は、画像撮影装置301のライブビュー内のライブビュー画像を撮影すると決定することができる。
【0060】
いくつかの他の実施形態では、画像選択回路303はまた、ライブビュー画像と画像撮影装置301の現在のアルバム内の画像との間の類似性を判定するために、ライブビュー画像から少なくとも1つの画像特徴を抽出することができる。少なくとも1つの画像特徴は、ヒストグラム、シフト特徴、画像モーメント、または画像の指紋のうちの少なくとも1つを含むことができる。ライブビュー画像のスコアが、ライブビュー画像に類似する1つまたは複数の類似画像の最低スコアより低い場合、画像選択回路303は、ライブビュー画像を撮影しないと決定することができる。ライブビュー画像のスコアが1つまたは複数の類似画像の最低スコア以上である場合、画像選択回路303はライブビュー画像を撮影すると決定することができる。いくつかの実施形態では、ライブビュー画像のスコアよりも低いスコアを有する1つまたは複数の類似の画像を現在のアルバムから削除することができる。
【0061】
いくつかの他の実施形態では、ライブビュー画像のスコアが1つまたは複数の類似の画像の最高スコアよりも低い場合、画像選択回路303はライブビュー画像を撮影しないと決定することができる。ライブビュー画像のスコアが1つまたは複数の類似画像の最高スコア以上である場合、画像選択回路303は、ライブビュー内のライブビュー画像を取り込むと決定することができ、1つまたは複数の類似画像は、現在のアルバムから削除される。
【0062】
いくつかの実施形態では、画像選択回路303は、ライブビュー画像のスコアが閾値以上であるかどうかを示す判定結果を撮影選択回路302に送信することができ、撮影選択回路302は自動的にカメラの撮像動作をトリガすることができる。画像選択回路303の判定結果に応じて、画像撮影装置301を制御する。いくつかの実施形態では、画像選択回路303は撮影選択回路302を迂回することができる。いくつかの他の実施形態では、撮影選択回路302は全く省略することができる。これらの実施形態(撮影選択回路302がバイパスされるか省略されるかのいずれか)では、画像選択回路303は、画像撮影装置301に結合され、画像選択回路303の判断結果に従って画像撮影装置301の撮像動作を直接トリガすることができる。
【0063】
撮影選択回路302は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含み、画像撮影装置301の撮像動作を自動的にトリガしてライブビューのライブ画像を撮影するように構成することができる。いくつかの実施形態では、撮影選択回路302は、ライブビュー画像のスコアと1つまたは複数の他の基準との組み合わせに従って撮像動作をトリガすることができる。いくつかの実施形態では、撮影選択回路302は、特定の意味を有するオブジェクトが現在のシーンで検出され、ライブビュー画像のスコアが閾値以上であるときに撮像動作をトリガすることができる。特定の意味は、例えば、人々、動物、顔、または笑顔を含み得るが、これらに限定されない。いくつかの実施形態では、撮影選択回路302は、現在のシーンの奥行きの変化が検出され、ライブビュー画像のスコアが閾値以上であるときに撮像動作をトリガすることができる。いくつかの実施形態では、撮影選択回路302は、現在のシーンの焦点の変化が検出され、ライブビュー画像のスコアが閾値以上であるときに撮像動作をトリガすることができる。いくつかの実施形態では、撮影選択回路302は、音声コマンドが受信され、ライブビュー画像のスコアが閾値以上であるときに撮像動作をトリガすることができる。いくつかの実施形態では、撮影選択回路302は、制御プロセスとライブビュー画像のスコアとの組み合わせに基づいて撮像動作をトリガすることができる。制御処理としては、タイマー撮影、タイムラプス撮影等が挙げられる。例えば、撮影選択回路302は、プリセット時間におけるライブビュー画像のスコアが閾値以上である場合、タイマー撮影を使用してプリセット時間に撮像動作をトリガすることができる。別の例として、撮影選択回路202は、設定された期間におけるライブビュー画像のスコアが閾値以上である場合、タイムラプス撮影を使用して設定された期間で撮像動作をトリガすることができる。
【0064】
画像回転補正回路304は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、画像撮影装置301から撮影画像を受信して自動的に実行するように構成することができる。撮影画像の回転補正画像回転補正回路304は、画像回転補正回路203と同様であるため、詳細な説明は省略する。
【0065】
画像合成回路305は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、画像回転補正回路203から回転された画像を受け取り、自動的に回転画像を合成し、補正画像を生成することができる。回転画像の合成方法は、画像合成回路204の方法と同様であるため、詳細な説明は省略する。
【0066】
いくつかの実施形態では、画像合成回路305は、回転画像を構成する前に回転画像に対して選択プロセスを実行するように構成することもできる。いくつかの実施形態では、画像合成回路305は、顕著性検出に基づいて選択プロセスを実行することができる。例えば、回転画像において顕著な物体が検出されない場合、画像合成回路305は回転画像を破棄することができる。回転画像において少なくとも1つの顕著なオブジェクトが検出された場合、画像合成回路305は、回転画像における少なくとも1つの顕著なオブジェクトの位置およびサイズ情報に基づいて回転画像を構成することができる。別の例として、回転画像内で複数の顕著な物体が検出されたが画像内の顕著な物体の分布が好ましいものではない場合、画像合成回路305は回転画像を破棄することができる。回転画像は、回転画像内の複数の顕著な対象の分布に基づいている。例えば、画像内の顕著なオブジェクトの分布が好ましいかどうかは、分布が集中または分散する傾向に従って決定することができ、これは本明細書では限定されない。
【0067】
いくつかの実施形態では、画像撮影装置301は、画像回転補正回路304および画像合成回路305を迂回することができる。他の実施形態では、画像回転補正回路304および画像合成回路305を全く省略することができる。これらの実施形態(画像回転補正回路304および画像合成回路305を迂回するか省略することができる)において、画像表示回路306は画像撮影装置301に結合することができ、撮影した画像を画像撮影装置301の現在のアルバムに直接記憶するように構成できる。
【0068】
いくつかの実施形態では、画像撮影装置301は、画像回転補正回路304を迂回して、撮影した画像を画像合成回路305に直接送ることができる。いくつかの他の実施形態では、画像回転補正回路304を省略することができる。これらの実施形態(画像回転補正回路304をバイパスするか省略するかのいずれか)では、画像合成回路305を画像撮影装置301に結合することができ、補正画像を得るために取込画像を自動的に構成することができる。
【0069】
いくつかの実施形態において、画像回転補正回路304は、画像合成回路305を迂回し、回転された画像を画像表示回路306に直接送ることができる。いくつかの他の実施形態では、画像合成回路305を全く省略することができる。これらの実施形態(画像合成回路305をバイパスするか省略するかのいずれか)では、回転画像を補正画像と見なすことができ、画像表示回路306は回転画像を直接、画像撮影装置301の現在のアルバムに格納することができる。
【0070】
いくつかの実施形態では、撮像装置300は、画像回転補正回路304および/または画像撮影装置301に結合された画像歪み補正回路(図6には図示せず)をさらに含み得る。画像歪み補正回路は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、撮影画像を回転させる前または後に歪み補正を実行するように構成することができる。歪みの補正方法は、歪みの種類に応じて選択することができ、任意の適切な方法が採用され得る。
【0071】
撮像装置300は、画像歪み補正回路および画像回転補正回路304の代わりに画像補正回路を備えてもよい。画像補正回路は、撮像画像に対して歪み補正と回転補正の両方を行うように構成することができる。
【0072】
画像表示回路306は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、補正画像を出力するように構成することができる。例えば、画像表示回路306は、画像選択回路305から補正画像を受け取り、補正画像のスコアに応じて補正画像を現在のアルバムのキューに挿入し、現在のアルバムのキューを9つの正方グリッド中に表示することができる。画像表示回路306は、画像表示回路206と同様であるため、詳細な説明は省略する。
【0073】
本開示と一致して、ユーザの参加を必要とせずに、撮像装置200の作業時間中に心地よい美観を有する画像を自動的に撮影するようにトリガすることができる。撮影された画像は、より良いFOVと妥当なレイアウトを有する画像が得られるように自動的に回転され合成されることができる。さらに、画像を自動的に選択することによって、多くの重複または類似の画像および無意味なショットを削除することができ、その結果、ユーザは、より良い品質を有する特定の数の画像のみを得て、見やすい方法で画像を見ることができる。
【0074】
図7は、本開示と一貫した他の例示的な撮像装置400の概略図である。図7に示すように、撮像装置400は、画像撮影装置401と、画像撮影装置401に接続された撮影選択回路402と、画像撮影装置401に接続された画像回転補正回路403と、画像回転補正回路403に接続された画像選択回路404と、画像選択回路404および画像撮影装置401に接続された画像合成回路405、ならびに画像合成回路405および画像撮影装置401に接続された画像表示回路406とを含む。
【0075】
画像撮影装置401は、画像撮影装置201と同様であり、詳細な説明は省略する。撮影選択回路402は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、画像撮影装置401の撮像動作を自動的にトリガして、ソフトウェアとハードウェアの組み合わせを使用して現在のシーンの画像を撮影するように構成することができる。撮影選択回路402は、撮影選択回路202と同様であり、詳細な説明は省略する。画像回転補正回路403は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、画像撮影装置401から撮影画像を受信して自動的に実行するように構成することができる。撮影画像の回転補正画像回転補正回路403は、画像回転補正回路203と同様であるため、詳細な説明は省略する。
【0076】
画像選択回路404は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、画像回転補正回路203から回転画像を受け取り、回転画像に選択処理を実行するように構成することができる。いくつかの実施形態では、画像選択回路404は審美的規則に従って回転画像のスコアを決定することができる。審美的規則を決定する方法は、画像選択回路205が使用する方法と同様であり、その詳細な説明はここでは省略する。いくつかの実施形態では、スコアが予め設定された閾値より低い場合、画像選択回路404は回転された画像を破棄することを決定することができる。スコアが予め設定された閾値以上である場合、画像選択回路404は、合成のために回転画像を画像合成回路405に送ることを決定することができる。
【0077】
いくつかの他の実施形態では、画像選択回路404はまた、回転画像と画像撮影装置401の現在のアルバム内の画像との間の類似性を判断するために、回転画像から少なくとも1つの画像特徴を抽出することができる。少なくとも1つの画像特徴は、ヒストグラム、シフト特徴、画像モーメント、または画像の指紋のうちの少なくとも1つを含むことができる。回転画像のスコアが、回転画像に類似する1つまたは複数の類似画像の最低スコアよりも低い場合、画像選択回路404は、回転画像を破棄することを決定することができる。回転画像のスコアが1つまたは複数の類似画像の最低スコア以上である場合、画像選択回路404は、合成のために回転画像を画像合成回路405に送ることを決定することができる。いくつかの実施形態では、回転された画像のスコアより低いスコアを有する1つまたは複数の類似の画像を現在のアルバムから削除することができる。
【0078】
いくつかの他の実施形態では、回転画像のスコアが1つまたは複数の類似画像の最高スコアより低い場合、画像選択回路404は回転画像を破棄することを決定することができる。ライブビュー画像のスコアが1つまたは複数の類似画像の最高スコア以上である場合、画像選択回路404は、回転画像を合成のために画像合成回路405に送ることを決定することができ、1つまたは複数の類似画像が現在のアルバムから削除されうる。
【0079】
画像合成回路405は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、回転画像を自動的に構成して正しい画像を生成するように構成することができる。回転画像の合成方法は、画像合成回路204の方法と同様であるため、詳細な説明は省略する。
【0080】
いくつかの実施形態では、回転画像は現在のアルバム内に類似画像を有さず、回転画像を合成した後の補正画像は現在アルバム内に1つまたは複数の類似画像を有することができることを考慮し、合成回路405によって類似性判定が実施される。例えば、画像合成回路405は、補正画像と画像撮影装置401の現在のアルバム内の画像との間の類似性を判定するために、補正画像から少なくとも1つの画像特徴を抽出するように構成することができる。類似判定による選択処理は、画像選択回路205による選択処理と同様であるため、詳細な説明は省略する。
【0081】
いくつかの実施形態では、画像撮影装置401は、画像回転補正回路403を迂回して、撮影した画像を画像選択回路404に直接送ることができる。いくつかの他の実施形態では、画像回転補正回路403を全く省略することができる。これらの実施形態では(画像回転補正回路403をバイパスするかまたは全く省くかのいずれかである)、画像選択回路404を画像撮影装置401に結合することができる。
【0082】
いくつかの実施形態では、画像選択回路404は、画像合成回路405を迂回して回転画像を画像表示回路406に送ることができる。いくつかの他の実施形態では、画像合成回路405はまったく省略することができる。これらの実施形態(画像合成回路405がバイパスされるかまたは全く省略される)において、画像選択回路404は画像表示回路406に結合され得る。
【0083】
いくつかの実施形態では、撮像装置400は、画像回転補正回路403および/または画像撮影装置401に結合された画像歪み補正回路(図7には図示せず)をさらに含み得る。画像歪み補正回路は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、撮影画像を回転させる前または後に歪み補正を実行するように構成することができる。歪みの補正方法は、歪みの種類に応じて選択することができ、任意の適切な方法が採用され得る。
【0084】
撮像装置400は、画像歪み補正回路および画像回転補正回路403の代わりに画像補正回路を備えてもよい。画像補正回路は、撮像画像に対して歪み補正と回転補正の両方を行うように構成することができる。
【0085】
画像表示回路406は、補正画像を出力するように構成することができる。例えば、画像表示回路406は、画像合成回路405または画像選択回路404から補正画像を受け取り、補正画像のスコアに応じて現在のアルバムのキューに補正画像を挿入し、9つの正方グリッド内に現在のアルバムのキューを表示することができる。画像表示回路406は、画像表示回路206と同様であるため、詳細な説明は省略する。
【0086】
そのため、図2図4に示すように、撮影装置は、カメラのアルバムが存在しないことが保証されていれば、画像保存前、ライブビュー画像の撮影前、または回転画像の合成前に、画像選択回路による選択処理を実行できる。画像を複製し、アルバムに格納された画像は、ユーザの興味を満たすために高い審美的価値を有することができる。
【0087】
図8は、本開示と一致する他の例示的な画像撮影装置500の概略図である。図8に示すように、撮像装置500は、画像撮影装置501と、画像撮影装置501に接続されたプロセッサ502と、プロセッサ502に接続されたメモリ503とを備える。画像撮影装置501は、画像撮影装置201と同様であり、詳細な説明は省略する。プロセッサ502およびメモリ503は一緒に、本開示と整合性のある画像処理装置を形成することができる。
【0088】
プロセッサ502は、画像プロセッサ、画像処理エンジン、画像処理チップ、グラフィックプロセッサ(GPU)、マイクロプロセッサ、マイクロコントローラ、中央処理装置(CPU)、ネットワークプロセッサ(NP)、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、または他のプログラマブルロジックデバイス、ディスクリートゲートまたはトランジスタロジックデバイス、ディスクリートハードウェア成分などの任意の適切なハードウェアプロセッサであり得る。メモリ503は、ランダムアクセスメモリ(RAM)、読み取り専用メモリ、フラッシュメモリ、揮発性メモリ、ハードディスク記憶装置、または光媒体などの非一時的コンピュータ可読記憶媒体を含むことができる。メモリ503は、コンピュータプログラム命令、画像撮影装置501によって撮影された画像、プロセッサ502によって処理された画像などを記憶することができる。
【0089】
いくつかの実施形態では、プロセッサ502は、メモリ503に格納されたコンピュータプログラム命令を実行して、撮影選択回路202、画像回転補正回路203、画像合成回路204、画像選択回路205の機能を実現するように構成できる。また、撮影選択回路302、画像選択回路303、画像回転補正回路304、画像合成回路305、および/または撮像装置200の画像表示回路206の機能を実現する。撮像装置300の画像表示回路306、または撮影選択回路402、画像回転補正回路403、画像選択回路404、画像合成回路405、および/または撮像装置400の画像表示回路406の機能を実現する。
【0090】
いくつかの実施形態では、プロセッサ502は、メモリ503に格納されたコンピュータプログラム命令を実行して、後述の例示的な写真撮影方法のうちの1つなどの本開示と一致する写真撮影方法を実行するように構成できる。
【0091】
例えば、プロセッサ502は、ソフトウェアおよびハードウェアの組み合わせを使用して画像を撮影するために画像撮影装置501の撮像動作をトリガし、撮影された画像を修正して修正画像を生成し、修正された画像を出力するためのコンピュータプログラム命令を実行するように構成され得る。
【0092】
別の例として、プロセッサ502は、ソフトウェアおよびハードウェアの組み合わせを使用して現在のシーンの画像を撮影するために画像撮影装置501の撮像動作をトリガし、撮影された画像に対して回転補正を実行し、回転画像を合成して補正画像を生成し、補正画像に対して選択処理を行い、補正画像を出力するためのコンピュータプログラム命令を実行するように構成され得る。
【0093】
別の例として、プロセッサ502は、ソフトウェアおよびハードウェアの組み合わせを使用して現在のシーンの画像を撮影し、撮影されたオブジェクトに対して選択プロセスを実行し、撮影した画像を出力するためにコンピュータプログラム命令を実行して画像撮影装置501の撮像動作をトリガするように構成され得る。
【0094】
別の例として、プロセッサ502は、ソフトウェアおよびハードウェアの組み合わせを使用して現在のシーンの画像を撮影し、回転画像に対して選択処理を行い、回転画像を出力するために画像撮影装置501の撮像動作をトリガし、撮影された画像に対して回転補正を実行するためのコンピュータプログラム命令を実行するように構成され得る。
【0095】
別の例として、プロセッサ502は、ソフトウェアおよびハードウェアの組み合わせを使用して現在のシーンの画像を撮影し、補正画像に対して選択処理を行い、補正画像を出力するために画像撮影装置501の撮像動作をトリガし、撮影された画像を合成して画像を生成するようにコンピュータプログラム命令を実行するように構成され得る。
【0096】
別の例として、プロセッサ502は、リアルタイムで画像撮影装置501のライブビュー内のライブビュー画像に対して選択処理を実行し、画像の撮像動作をトリガしてライブビュー画像のスコアに従ってライブビュー内のライブビュー画像を撮像し、撮像画像に対して回転補正を行い、回転画像を合成して補正画像を生成し、補正画像を出力するようにコンピュータプログラム命令を実行するように構成することができる。
【0097】
別の例として、プロセッサ502は、コンピュータプログラム命令を実行して、リアルタイムで画像撮影装置501のライブビュー内のライブビュー画像に対して選択処理を実行し、画像の撮像動作をトリガして、ライブビュー画像のスコアに従ってライブビュー内のライブビュー画像を撮影し、撮影された画像を合成して補正画像を生成し、補正画像を出力するように構成することができる。
【0098】
別の例として、プロセッサ502は、リアルタイムで画像撮影装置501のライブビュー内のライブビュー画像に対して選択処理を実行し、画像の撮像動作をトリガしてライブビュー画像のスコアに従ってライブビュー画像内のライブビュー画像を撮影し、撮影された画像に対して回転補正を実行し、回転された画像を出力するようにコンピュータプログラム命令を実行するように構成することができる。
【0099】
例えば、プロセッサ502は、リアルタイムで画像撮影装置501のライブビュー内のライブビュー画像に対して選択プロセスを実行し、撮像の撮像動作をトリガしてライブビュー画像のスコアに従ってライブビュー画像内のライブビュー画像を撮影し、撮影した画像を出力するようにコンピュータプログラム命令を実行するように構成することができる。
【0100】
別の例として、プロセッサ502は、ソフトウェアおよびハードウェアの組み合わせを使用して現在のシーンの画像を撮影するために画像撮影装置501の撮像動作をトリガし、撮影された画像に対して回転補正を実行するためのコンピュータプログラム命令を実行するように構成され得る。そして、回転画像に対して選択処理を行い、回転画像を合成して補正画像を生成し、出力する。
【0101】
いくつかの実施形態において、プロセッサ502およびメモリ503は、画像撮影装置501に統合することができる。すなわち、プロセッサ502を画像撮影装置501の画像処理チップとし、メモリ503を画像撮影装置501のメモリとすることができる。
【0102】
本開示と一致する例示的な撮影方法を、以下でさらに詳細に説明する。本開示に係る撮影方法は、上述した撮像装置200、撮像装置300、撮像装置400、または撮像装置500などの本開示に係る撮影装置において実施することができる。
【0103】
図9は、本開示と整合性のある例示的な撮影方法600のフローチャートである。撮影方法600は、上述した撮像装置200または撮像装置500において実施することができる。
【0104】
図9を参照すると、601で、ソフトウェアとハードウェアの組み合わせを使用してカメラの撮像動作が自動的にトリガされて画像を取り込む。いくつかの実施形態では、カメラの撮像動作は、特定の意味を有するオブジェクトが現在のシーンで検出されたときにトリガすることができる。特定の意味は、例えば、人々、動物、顔、または笑顔を含み得るが、これらに限定されない。いくつかの実施形態では、現在のシーンの奥行きの変化に応答してカメラの撮像動作をトリガすることができる。いくつかの実施形態では、カメラの撮像動作は、現在のシーンの焦点の変化に応答してトリガされ得る。いくつかの実施形態では、カメラの撮像動作は音声コマンドを介してトリガすることができる。いくつかの実施形態では、カメラの撮像動作は制御プロセスを介してトリガすることができる。制御処理としては、タイマー撮影、タイムラプス撮影等が挙げられる。いくつかの実施形態では、カメラの撮像動作は、上述した異なる基準の任意の組み合わせに従って起動することができる。
【0105】
601の処理は、上述した撮像装置200の撮影選択回路202または撮像装置500のプロセッサ502において実現可能であるため、詳細な説明は省略する。
【0106】
602において、取り込まれた画像は自動的に回転される。いくつかの実施形態では、カメラの姿勢情報は、例えば、IMUなどの、カメラに取り付けられたまたはカメラに結合された1つまたは複数の姿勢センサを介して取得することができる。姿勢情報は、カメラのヨー軸情報、ピッチ軸情報、またはロール軸情報のうちの少なくとも1つを含み得る。カメラの姿勢情報に応じて、撮影画像を回転させることができる。例えば、カメラの姿勢情報と目標姿勢との差に応じて撮影画像を回転させることができる。いくつかの他の実施形態では、取り込まれた画像内の水平線または垂直線を検出して、ロール方向の傾斜角を得ることができる。傾斜角が閾値より小さいとき、撮影画像は傾斜角に従ってロール方向に回転することができる。
【0107】
いくつかの実施形態では、歪み補正は、取り込まれた画像を回転させる前または後に実行することができる。
【0108】
602の処理は、上述した撮像装置200の画像回転補正回路203または撮像装置500のプロセッサ502において実現可能であるため、ここでの詳細な説明は省略する。
【0109】
603で、回転画像は自動的に合成されて補正画像が生成される。いくつかの実施形態では、回転された画像は、顕著性検出および合成規則に基づいて合成することができる。1つまたは複数の顕著な物体は、取り込まれた画像内で検出することができる。回転された画像における1つ以上の顕著な物体の位置およびサイズ情報、または1つ以上の顕著な物体の分布が得られ得る。回転された画像は、回転された画像内の1つまたは複数の顕著なオブジェクトの位置およびサイズ情報または分布規則および合成規則に従って、切り取られて合成画像を得ることができる。合成規則は、中央合成規則、トライアド合成規則、水平線合成規則、対称合成規則、対角線合成規則などを含むことができるが、これらに限定されない。合成画像は、例えば、カメラの画面またはカメラの外部のディスプレイのアスペクト比に従って、補正された画像を得るために拡大縮小またはさらにトリミングすることができる。
【0110】
いくつかの他の実施形態では、回転画像はネットワークモデルまたはツリー構造を介して合成することができる。ネットワークモデルは、複数のサンプルに基づくトレーニングによって得ることができる。回転画像は、ネットワークモデルまたは木構造に入力することができる。回転された画像は、クロッピング座標および倍率を得るために、ネットワークモデルまたは木構造に従って処理することができる。回転された画像は、クロッピング座標に従って合成画像を得るためにクロッピングすることができ、スケーリング係数に従って補正画像を得るために合成画像をスケーリングすることができる。
【0111】
603の処理は、上述した撮像装置200の画像合成回路204または撮像装置500のプロセッサ502において実現可能であるため、詳細な説明は省略する。
【0112】
604において、選択プロセスは補正画像に対して実行され得る。選択プロセスは、補正された画像を記憶するか表示するかを決定するように構成することができる。いくつかの実施形態では、補正画像のスコアは審美的規則に従って決定することができる。スコアが予め設定された閾値より低い場合、補正された画像は破棄されることができ、そしてスコアが予め設定された閾値以上である場合、補正された画像は記憶されることができる。いくつかの実施形態では、審美的規則は、信号対雑音比(SNR)、コントラスト、ヒストグラム分布、画像飽和度、情報エントロピー、AE値、AF値、AWB値、または人物、笑顔、日の出、ペットなどの候補画像の高得点オブジェクトのうちの少なくとも1つに従って決定できる。いくつかの他の実施形態では、審美的規則は訓練されたモデルに従って決定することができる。訓練されたモデルは、事前評価されたスコアのデータセットを使用して訓練することによって取得できる。
【0113】
いくつかの実施形態では、少なくとも1つの画像特徴に従って、補正された画像に類似する1つまたは複数の類似の画像を現在のアルバム内で決定することができる。いくつかの実施形態では、補正画像のスコアが1つまたは複数の類似画像の最低スコアよりも低い場合、補正画像を破棄することができる。補正画像のスコアが1つ以上の類似画像の最低スコア以上である場合、補正画像を記憶することができる。いくつかの実施形態では、補正された画像のスコアよりも低いスコアを有する1つまたは複数の類似の画像を現在のアルバムから削除することができる。いくつかの他の実施形態では、補正画像のスコアが1つまたは複数の類似画像の最高スコアよりも低い場合、補正画像を破棄することができる。補正画像のスコアが1つ以上の類似画像の最高スコア以上である場合、補正画像を記憶することができる。いくつかの実施形態では、1つまたは複数の類似の画像を現在のアルバムから削除することができる。
【0114】
604の処理は、上述した撮像装置200の画像選択回路205または撮像装置500のプロセッサ502において実現可能であるため、詳細な説明は省略する。
【0115】
605において、補正画像が出力される。いくつかの実施形態では、補正画像のスコアに従って、補正画像を現在のアルバムのキューに挿入することができる。現在のアルバムのキューは、順番に表示することも、9つの正方グリッドに表示することもできる。
【0116】
605の処理は、上述した撮像装置200の画像表示回路206または撮像装置500のプロセッサ502において実現可能であるため、ここでの詳細な説明は省略する。
【0117】
いくつかの実施形態では、602および/または603のプロセスは省略することができる。例えば、602の処理を省略した場合は、撮像画像を直接合成することができる。他の例として、603の処理を省略した場合は、回転画像に対して直接選択処理を行うことができる。他の例として、602、603の処理を省略した場合は、撮像画像に対して直接選択処理を行うことができる。
【0118】
図10は、本開示と一貫した他の例示的な撮影方法700のフローチャートである。撮影方法700は、上述した撮像装置300または撮像装置500において実施することができる。
【0119】
図10を参照すると、701で、審美的規則に基づいてライブビュー内のライブビュー画像に対して選択プロセスがリアルタイムで実行され、ライブビュー画像のスコアが決定される。審美的規則は、信号対雑音比(SNR)、コントラスト、ヒストグラム分布、画像飽和度、情報エントロピー、自動露出値、オートフォーカス値、オートホワイトバランス値、オートホワイトバランス値またはライブビュー画像の高得点オブジェクトの少なくとも1つに従って決定することができる。
【0120】
702で、ライブビュー画像のスコアが閾値以上である場合、撮像動作が自動的にトリガされる。例えば、スコアが予め設定された閾値より低い場合、ライブビュー画像を撮影するための撮像動作はトリガされない。スコアが予め設定された閾値以上である場合、ライブビュー画像を撮影するために撮像動作が自動的にトリガされ得る。いくつかの実施形態では、ライブビュー画像とカメラの現在のアルバム内の画像との間の類似性を判定するために、少なくとも1つの画像特徴をライブビュー画像からさらに抽出することができる。ライブビュー画像のスコアが、現在のアルバム内のライブビュー画像に類似する1つまたは複数の類似の画像の最低スコアまたは最高スコア以上である場合、撮像動作は自動的にトリガされ得る。
【0121】
701および702の処理は、上述した撮像装置300の画像選択回路303または撮像装置500のプロセッサ502において実現可能であるため、詳細な説明は省略する。
【0122】
703で、取り込まれた画像は自動的に回転される。いくつかの実施形態では、カメラの姿勢情報は、例えば、IMUなどの、カメラに取り付けられたまたはカメラに結合された1つまたは複数の姿勢センサを介して取得することができる。姿勢情報は、カメラのヨー軸情報、ピッチ軸情報、またはロール軸情報のうちの少なくとも1つを含み得る。カメラの姿勢情報に応じて、撮影画像を回転させることができる。例えば、カメラの姿勢情報と目標姿勢との差に応じて撮影画像を回転させることで、回転画像の姿勢を目標姿勢に合わせることができる。いくつかの他の実施形態では、取り込まれた画像内の水平線または垂直線を検出して、ロール方向の傾斜角を得ることができる。傾斜角が閾値より小さいとき、撮影画像は傾斜角に従ってロール方向に回転することができる。
【0123】
いくつかの実施形態では、歪み補正は、取り込まれた画像を回転させる前または後に実行することができる。
【0124】
703の処理は、上述した撮像装置300の画像回転補正回路304または撮像装置500のプロセッサ502において実現可能であるため、詳細な説明は省略する。
【0125】
704で、回転画像は自動的に合成されて補正画像が生成される。いくつかの実施形態では、回転された画像は、顕著性検出および合成規則に基づいて合成することができる。1つまたは複数の顕著な物体は、取り込まれた画像内で検出することができる。回転された画像における1つ以上の顕著な物体の位置およびサイズ情報、または1つ以上の顕著な物体の分布が得られ得る。回転された画像は、回転された画像内の1つまたは複数の顕著なオブジェクトの位置およびサイズ情報または分布規則および合成規則に従って、切り取られて合成画像を得ることができる。合成規則は、中央合成規則、トライアド合成規則、水平線合成規則、対称合成規則、対角線合成規則などを含むことができるが、これらに限定されない。合成画像は、例えば、カメラの画面またはカメラの外部のディスプレイのアスペクト比に従って、補正された画像を得るために拡大縮小またはさらにトリミングすることができる。
【0126】
いくつかの他の実施形態では、回転画像はネットワークモデルまたはツリー構造を介して合成することができる。ネットワークモデルは、複数のサンプルに基づくトレーニングによって得ることができる。回転画像は、ネットワークモデルまたは木構造に入力することができる。回転された画像は、クロッピング座標および倍率を得るために、ネットワークモデルまたは木構造に従って処理することができる。回転された画像は、クロッピング座標に従って合成画像を得るためにクロッピングすることができ、スケーリング係数に従って補正画像を得るために合成画像をスケーリングすることができる。
【0127】
704の処理は、上述した撮像装置300の画像合成回路305または撮像装置500のプロセッサ502において実現可能であるため、詳細な説明は省略する。
【0128】
705において、補正画像が出力される。いくつかの実施形態では、補正画像のスコアに従って、補正画像を現在のアルバムのキューに挿入することができる。現在のアルバムのキューは、順番に表示することも、9つの正方グリッドに表示に表示することもできる。
【0129】
705の処理は、上述した撮像装置300の画像表示回路306または撮像装置500のプロセッサ502において実現可能であるため、ここでの詳細な説明は省略する。
【0130】
いくつかの実施形態では、703および/または704のプロセスは省略することができる。例えば、703の処理を省略した場合は、撮像画像を直接合成することができる。他の例として、704の処理を省略した場合は、回転画像をそのまま出力することができる。他の例として、703、704の処理を省略した場合は、撮像画像を直接出力することができる。
【0131】
図11は、本開示と一貫した他の例示的な撮影方法800のフローチャートである。撮影方法800は、上述した撮像装置300または撮像装置500において実施することができる。
【0132】
図11を参照すると、801で、審美的規則に基づいて、ライブビュー内のライブビュー画像に対して選択プロセスがリアルタイムで実行され、ライブビュー画像のスコアが決定される。801の処理は、上述した撮像装置300の画像選択回路303または撮像装置500のプロセッサ502において実現可能であるため、詳細な説明は省略する。
【0133】
802で、ライブビュー画像のスコアと1つまたは複数の他の基準との組み合わせに従って、撮像動作が自動的にトリガされる。いくつかの実施形態では、特定の意味を有するオブジェクトが現在のシーンで検出され、ライブビュー画像のスコアが閾値以上であるときに、撮像動作を自動的にトリガすることができる。特定の意味は、例えば、人々、動物、顔、または笑顔を含み得るが、これらに限定されない。いくつかの実施形態では、現在のシーンの奥行きの変化が検出され、ライブビュー画像のスコアが閾値以上であるときに、撮像動作を自動的にトリガすることができる。いくつかの実施形態では、現在のシーンの焦点の変化が検出され、ライブビュー画像のスコアが閾値以上であるときに、撮像動作を自動的にトリガすることができる。いくつかの実施形態では、音声コマンドが受信され、ライブビュー画像のスコアが閾値以上であるときに、撮像動作を自動的にトリガすることができる。いくつかの実施形態では、制御プロセスとライブビュー画像のスコアとの組み合わせに基づいて、撮像動作を自動的にトリガすることができる。制御処理としては、タイマー撮影、タイムラプス撮影等が挙げられる。
【0134】
802の処理は、上述した撮像装置300の撮影選択回路302または撮像装置500のプロセッサ502において実現可能であるため、詳細な説明は省略する。
【0135】
803で、取り込まれた画像は自動的に回転される。803の処理は703の処理と同様であるため、詳細な説明は省略する。803の処理は、上述した撮像装置300の画像回転補正回路304または撮像装置500のプロセッサ502において実現することができる。
【0136】
804で、回転画像は自動的に合成されて補正画像が生成される。804の処理は704の処理と同様であるため、詳細な説明は省略する。804の処理は、上述した撮像装置300の画像合成回路305または撮像装置500のプロセッサ502において実現可能であるため、詳細な説明は省略する。
【0137】
805において、補正画像が出力される。805の処理は705の処理と同様であるため、詳細な説明は省略する。805の処理は、上述した撮像装置300の画像表示回路306または撮像装置500のプロセッサ502において実現可能であるため、詳細な説明は省略する。
【0138】
いくつかの実施形態では、803および/または804のプロセスは省略することができる。例えば、803の処理を省略した場合は、撮像画像を直接合成することができる。他の例として、804の処理を省略した場合は、回転画像をそのまま出力することができる。他の例として、803、804の処理を省略した場合は、撮像画像を直接出力することができる。
【0139】
図12は、本開示と一貫した他の例示的な撮影方法900のフローチャートである。撮影方法900は、上述した撮像装置400または撮像装置500において実施することができる。
【0140】
図12に示すように、901で、ソフトウェアとハードウェアの組み合わせを使用してカメラの撮像動作が自動的にトリガされて画像を取り込む。901の処理は、601の処理と同様であり、詳細な説明は省略する。901の処理は、上述した撮像装置400の撮影選択回路402または撮像装置500のプロセッサ502において実現することができる。
【0141】
902において、取り込まれた画像は自動的に回転される。902の処理は、602の処理と同様であり、詳細な説明は省略する。902の処理は、上述した撮像装置400の画像回転補正回路403または撮像装置500のプロセッサ502において実現することができる。
【0142】
903で、回転処理された画像に対して選択プロセスが実行される。いくつかの実施形態では、回転された画像のスコアは審美的規則に従って決定することができる。スコアが事前設定されたしきい値より低い場合、回転した画像は破棄される可能性がある。スコアが予め設定された閾値以上である場合、回転された画像はさらなる処理のために保持され得る。いくつかの他の実施形態では、回転画像とカメラの現在のアルバム内の画像との間の類似性を判断するために、回転画像から少なくとも1つの画像特徴を抽出することができる。回転画像のスコアが、回転画像に類似する1つまたは複数の類似画像の最低スコアまたは最高スコアよりも低い場合、回転画像は破棄することができる。回転画像のスコアが1つ以上の類似画像の最低スコアまたは最高スコア以上である場合、回転画像はさらなる処理のために保持され得る。いくつかの実施形態では、回転された画像のスコアより低いスコアを有する1つまたは複数の類似の画像を現在のアルバムから削除することができる。
【0143】
903の処理は、上述した撮像装置400の画像選択回路404または撮像装置500のプロセッサ502において実現可能であるため、ここでの詳細な説明は省略する。
【0144】
904で、回転画像は自動的に合成されて補正画像が生成される。904の処理は、603の処理と同様であり、詳細な説明は省略する。904の処理は、上述した撮像装置400の画像合成回路405または撮像装置500のプロセッサ502において実現することができる。
【0145】
905において、補正画像が出力される。905の処理は、605の処理と同様であるため、詳細な説明は省略する。905の処理は、上述した撮像装置400の画像表示回路406または撮像装置500のプロセッサ502において実現可能であるため、詳細な説明は省略する。
【0146】
図13は、本開示と整合する別の例示的な撮影方法1000のフローチャートである。撮影方法1000は、例えば上述した撮像装置500において実施することができる。
【0147】
図13を参照すると、1001において、ソフトウェアとハードウェアの組み合わせを使用してカメラの撮像動作が自動的にトリガされて画像を取り込む。1001の処理は、601の処理と同様であるため、詳細な説明は省略する。1001の処理は、上述した撮像装置500のプロセッサ502内で実施することができる。
【0148】
1002で、撮影画像を補正して補正画像を生成する。いくつかの実施形態では、選択プロセスは撮影画像に対して実行することができ、選択後の撮影画像は補正画像とすることができる。選択処理は、604の処理で説明した選択処理と同様であり、詳細な説明は省略する。いくつかの実施形態では、撮影画像を回転させて補正画像(すなわち回転画像)を生成することができる。回転補正方法は、602の処理で説明した回転補正方法と同様であり、詳細な説明は省略する。いくつかの実施形態では、取り込まれた画像を回転させて回転画像を生成することができ、回転画像を合成して補正画像を生成することができる。合成方法は、603の処理で説明した合成方法と同様であり、詳細な説明は省略する。いくつかの実施形態では、取り込まれた画像は、補正画像を生成するように構成することができる。いくつかの他の実施形態では、歪み補正は、取り込まれた画像または回転された画像に対して実行することができる。
【0149】
1003において、補正画像が出力される。1003の処理は605の処理と同様であるため、詳細な説明は省略する。1003の処理は、上述した撮像装置500のプロセッサ502内で実施することができるので、詳細な説明は省略する。
【0150】
簡略化の目的で、例示的な方法のプロセスの詳細な説明は省略されることがあり、例示的な装置の説明を参照することができる。
【0151】
開示された装置および方法は、本明細書に記載されていない他の方法で実施されてもよい。例えば、上述の装置は単なる例示である。例えば、ユニットの分割は論理的な機能分割のみであり得、ユニットを分割する他の方法があり得る。例えば、複数のユニットまたは構成要素を組み合わせてもよく、または別のシステムに統合してもよく、あるいはいくつかの特徴を無視してもよく、または実行しなくてもよい。
【0152】
別々の構成要素として説明されているユニットは、物理的に分離されていてもいなくてもよく、ユニットとして示されている構成要素は物理的ユニットであってもなくてもよい。すなわち、ユニットは一箇所に配置されていてもよいし、複数のネットワーク要素にわたって分散されていてもよい。本開示の目的を達成するために実際の必要性に応じて構成要素のいくつかまたはすべてを選択することができる。
【0153】
さらに、本開示の様々な実施形態における機能ユニットは、1つの処理ユニットに統合されてもよく、または各ユニットは個々の物理的ユニットであってもよく、あるいは2つ以上のユニットが1つのユニットに統合されてもよい。
【0154】
本開示の他の実施形態は、本明細書の考察および本明細書に開示された実施形態の実施から当業者には明らかであろう。明細書および実施例は例示としてのみ考慮されるべきであり、本開示の範囲を限定するものではなく、本発明の真の範囲および精神は特許請求の範囲によって示されることが意図される。
図1A
図1B
図1C
図2
図3
図4
図5A
図5B
図5C
図5D
図6
図7
図8
図9
図10
図11
図12
図13