IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ キヤノン株式会社の特許一覧

特許7549453画像処理装置及びその制御方法、撮像装置、プログラム、記憶媒体
<>
  • 特許-画像処理装置及びその制御方法、撮像装置、プログラム、記憶媒体 図1
  • 特許-画像処理装置及びその制御方法、撮像装置、プログラム、記憶媒体 図2
  • 特許-画像処理装置及びその制御方法、撮像装置、プログラム、記憶媒体 図3
  • 特許-画像処理装置及びその制御方法、撮像装置、プログラム、記憶媒体 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-03
(45)【発行日】2024-09-11
(54)【発明の名称】画像処理装置及びその制御方法、撮像装置、プログラム、記憶媒体
(51)【国際特許分類】
   H04N 23/60 20230101AFI20240904BHJP
   H04N 25/443 20230101ALI20240904BHJP
   H04N 23/67 20230101ALI20240904BHJP
   H04N 23/70 20230101ALI20240904BHJP
   H04N 23/63 20230101ALI20240904BHJP
   G03B 15/00 20210101ALI20240904BHJP
   G02B 7/28 20210101ALI20240904BHJP
   G03B 7/091 20210101ALI20240904BHJP
【FI】
H04N23/60
H04N25/443
H04N23/67
H04N23/70
H04N23/63
G03B15/00 Q
G02B7/28 N
G03B7/091
【請求項の数】 17
(21)【出願番号】P 2020037159
(22)【出願日】2020-03-04
(65)【公開番号】P2021141421
(43)【公開日】2021-09-16
【審査請求日】2023-02-21
(73)【特許権者】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】110003281
【氏名又は名称】弁理士法人大塚国際特許事務所
(72)【発明者】
【氏名】緑川 慶祐
【審査官】越河 勉
(56)【参考文献】
【文献】特開2019-020716(JP,A)
【文献】特開2016-197181(JP,A)
【文献】特開2019-205172(JP,A)
【文献】特開2018-037893(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 23/60
H04N 25/443
H04N 23/67
H04N 23/70
H04N 23/63
G03B 15/00
G02B 7/28
G03B 7/091
(57)【特許請求の範囲】
【請求項1】
撮像手段により撮像された画像から被写体を検出する検出手段と、
前記画像における前記検出手段により被写体を検出する候補の領域である候補領域を設定する第1の設定手段と、
前記候補領域に対して、目的とする被写体を検出するための切り出し領域を設定する第2の設定手段と、
撮像装置の動作を、検出された現在の主被写体に追従させ続けるか、他の被写体に切り替えるかの程度を決める乗り移り度合いを設定する第3の設定手段と、を備え、
前記候補領域は、前記切り出し領域と前記現在の主被写体の領域を含むように設定され、前記第2の設定手段は、前記乗り移り度合いに基づいて、前記候補領域に対する前記切り出し領域の位置を設定することを特徴とする画像処理装置。
【請求項2】
前記第1の設定手段は、ユーザからの指示により、前記候補領域を設定することを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記第3の設定手段は、ユーザからの指示により、前記乗り移り度合いを設定することを特徴とする請求項1または2に記載の画像処理装置。
【請求項4】
前記切り出し領域は、前記候補領域において、前記目的とする被写体を検出しやすくするための領域であることを特徴とする請求項1乃至3のいずれか1項に記載の画像処理装置。
【請求項5】
前記撮像装置の動作とは、焦点調節動作であることを特徴とする請求項1乃至4のいずれか1項に記載の画像処理装置。
【請求項6】
前記撮像装置の動作とは、露出調節動作であることを特徴とする請求項1乃至5のいずれか1項に記載の画像処理装置。
【請求項7】
前記第2の設定手段は、前記切り出し領域の中心の位置を、前記現在の主被写体の領域の中心と、前記候補領域の中心とに基づいて設定することを特徴とする請求項1乃至6のいずれか1項に記載の画像処理装置。
【請求項8】
前記第2の設定手段は、前記切り出し領域の中心の位置を、前記乗り移り度合いが大きいほど、前記候補領域の中心に近い位置に設定することを特徴とする請求項7に記載の画像処理装置。
【請求項9】
前記第2の設定手段は、前記切り出し領域の中心の位置を、前記乗り移り度合いが小さいほど、前記現在の主被写体の領域の中心に近い位置に設定することを特徴とする請求項7または8に記載の画像処理装置。
【請求項10】
前記第2の設定手段は、前記切り出し領域のサイズを、前記現在の主被写体のサイズに応じて設定することを特徴とする請求項1乃至9のいずれか1項に記載の画像処理装置。
【請求項11】
前記第2の設定手段は、前記乗り移り度合いが大きいほど、前記切り出し領域のサイズを大きく設定することを特徴とする請求項10に記載の画像処理装置。
【請求項12】
前記乗り移り度合いが既定の設定であった場合、前記候補領域の中心から既定の距離以上にある被写体を乗り移る被写体としないことを特徴とする請求項1乃至11のいずれか1項に記載の画像処理装置。
【請求項13】
前記画像と被写体の領域を表示する表示手段をさらに備え、該表示手段は、被写体が複数検出された場合に、前記現在の主被写体以外の少なくとも一つの被写体の領域を表示することを特徴とする請求項1乃至12のいずれか1項に記載の画像処理装置。
【請求項14】
請求項1乃至13のいずれか1項に記載の画像処理装置と、
前記撮像手段と、
被写体に焦点を合わせる焦点調節手段と、
を備えることを特徴とする撮像装置。
【請求項15】
撮像手段により撮像された画像から被写体を検出する検出工程と、
前記画像における前記検出工程により被写体を検出する候補の領域である候補領域を設定する第1の設定工程と、
前記候補領域に対して、目的とする被写体を検出するための切り出し領域を設定する第2の設定工程と、
撮像装置の動作を、検出された現在の主被写体に追従させ続けるか、他の被写体に切り替えるかの程度を決める乗り移り度合いを設定する第3の設定工程と、を有し、
前記候補領域は、前記切り出し領域と前記現在の主被写体の領域を含むように設定され、前記第2の設定工程では、前記乗り移り度合いに基づいて、前記候補領域に対する前記切り出し領域の位置を設定することを特徴とする画像処理装置の制御方法。
【請求項16】
請求項15に記載の制御方法の各工程をコンピュータに実行させるためのプログラム。
【請求項17】
請求項15に記載の制御方法の各工程をコンピュータに実行させるためのプログラムを記憶したコンピュータが読み取り可能な記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像から被写体を検出する技術に関する。
【背景技術】
【0002】
従来より、撮像した画像から被写体を検出する技術が知られている。
【0003】
例えば、特許文献1には、撮像画像から被写体領域を抽出する場合に、撮像画像の指定された領域をクロップするかしないかの選択を前回の撮像画像の検出結果に応じて切り替える技術が開示されている。画像全体ではなくクロップされた範囲のみを被写体検出のための入力画像とすることにより、小さな被写体の検出性能を向上させることが可能となる。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2008-172368号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1では、前回検出された被写体のうちの少なくとも一つのサイズや位置に基づいてクロップの範囲を決定している。しかしながら、この方法では、ユーザが現在の主被写体以外の被写体に興味が無い場合でも、主被写体以外の被写体も検出しようとして、クロップ範囲を広げてしまうことがある。この場合、主被写体の検出率が相対的に犠牲になってしまうこともある。
【0006】
逆に、現在の主被写体以外の被写体を検出し、新たな主被写体として好ましい被写体に切り替えたい場合でも、狭い領域でクロップを行ってしまって、主被写体以外の被写体が検出されないことがある。
【0007】
本発明は上述した課題に鑑みてなされたものであり、その目的は、よりユーザの意図に合致した被写体検出を行うことが可能な画像処理装置を提供することである。
【課題を解決するための手段】
【0008】
本発明に係わる画像処理装置は、撮像手段により撮像された画像から被写体を検出する検出手段と、前記画像における前記検出手段により被写体を検出する候補の領域である候補領域を設定する第1の設定手段と、前記候補領域に対して、目的とする被写体を検出するための切り出し領域を設定する第2の設定手段と、撮像装置の動作を、検出された現在の主被写体に追従させ続けるか、他の被写体に切り替えるかの程度を決める乗り移り度合いを設定する第3の設定手段と、を備え、前記候補領域は、前記切り出し領域と前記現在の主被写体の領域を含むように設定され、前記第2の設定手段は、前記乗り移り度合いに基づいて、前記候補領域に対する前記切り出し領域の位置を設定することを特徴とする。
【発明の効果】
【0009】
本発明によれば、よりユーザの意図に合致した被写体検出を行うことが可能な画像処理装置を提供することが可能となる。
【図面の簡単な説明】
【0010】
図1】本発明の一実施形態に係わる撮像装置の構成を示すブロック図。
図2】被写体検出部の入力画像を説明する図。
図3】一実施形態における全体処理手順を示すフローチャート。
図4】一実施形態におけるクロップ領域を示す模式図。
【発明を実施するための形態】
【0011】
以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
【0012】
(撮像装置の構成)
図1は、本発明の一実施形態に係わる撮像装置100の構成を示すブロック図である。図1を参照して、撮像装置100の構成について説明する。
【0013】
撮像装置100は、被写体を撮影して、動画や静止画のデータをテープや固体メモリ、光ディスクや磁気ディスクなどの各種メディアに記録可能なデジタルスチルカメラやビデオカメラなどであるが、これらに限定されるものではない。撮像装置100内の各ユニットは、バス160を介して接続されている。また各ユニットは、CPU151(中央演算処理装置)により制御される。
【0014】
レンズユニット101は、固定1群レンズ102、ズームレンズ(2群レンズ)111、絞り103、固定3群レンズ121、および、フォーカスレンズ131を備えて構成される。フォーカスレンズ131は、焦点調節用レンズであり、図1には単レンズで簡略的に示されているが、通常複数のレンズで構成される。
【0015】
絞り制御部105は、CPU151の指令に従い、絞りモータ104(AM)を介して絞り103を駆動することにより、絞り103の開口径を調整して撮影時の光量調節を行う。ズーム制御部113は、ズームモータ112(ZM)を介してズームレンズ111を駆動することにより、焦点距離を変更する。フォーカス制御部133は、レンズユニット101のピント方向のずれ量(デフォーカス量)に基づいてフォーカスモータ132(FM)を駆動する駆動量を決定する。加えてフォーカス制御部133は、フォーカスモータ132(FM)を介してフォーカスレンズ131を駆動することにより、焦点調節状態を制御する。フォーカス制御部133およびフォーカスモータ132によるフォーカスレンズ131の移動制御により、AF(オートフォーカス)制御が実現される。
【0016】
レンズユニット101を介して撮像素子141上に結像した被写体像は、撮像素子141により電気信号に変換される。撮像素子141は、被写体像(光学像)を電気信号に変換する光電変換素子である。撮像素子141は、横方向にm画素、縦方向にn画素の受光素子が配置されて構成されている。撮像素子141上に結像されて光電変換された画像信号は、撮像信号処理部142により画像データとして整えられ、撮像面の画像を取得することができる。
【0017】
撮像信号処理部142から出力される画像データは、撮像制御部143に送られ、一時的にRAM154(ランダム・アクセス・メモリ)に蓄積される。RAM154に蓄積された画像データは、画像圧縮解凍部153において圧縮された後、画像記録媒体157に記録される。これと並行して、RAM154に蓄積された画像データは、画像処理部152に送られる。画像処理部152は、画像信号を処理し、画像データに対して最適なサイズへの縮小・拡大処理や画像データ同士の類似度算出等を行う。最適なサイズに処理された画像データを、適宜モニタディスプレイ150に送って表示することによりプレビュー画像表示やスルー画像表示を行うことができる他、被写体検出部162の被写体検出結果を画像データに重畳表示することもできる。またRAM154をリングバッファとして用いることにより、所定期間内に撮像された複数の画像データや、画像データ毎に対応した被写体検出部162の検出結果、位置姿勢変化取得部161が取得した撮像装置の位置姿勢変化等をバッファリングできる。
【0018】
操作スイッチ156は、タッチパネルやボタンなどを含む入力インターフェイスであり、モニタディスプレイ150に表示される種々の機能アイコンを選択操作することなどにより、様々な操作を行うことができる。
【0019】
CPU151は、操作スイッチ156から入力されたユーザからの指示、あるいは、一時的にRAM154に蓄積された画像データの画素信号の大きさに基づき、撮像素子141の蓄積時間、撮像素子141から撮像信号処理部142へ出力を行う際のゲインの設定値を決定する。撮像制御部143は、CPU151から蓄積時間、ゲインの設定値の指示を受け取り、撮像素子141を制御する。
【0020】
被写体検出部162では、画像信号を用いて所定の被写体が存在する領域(主被写体領域)を決定する。被写体検出部162は、パターンマッチングなどの公知の方法で被写体を検出する。フォーカス制御部133では、特定の被写体領域に対するAF制御(自動焦点調節動作)を行うことができる。絞り制御部105では、特定の被写体領域の輝度値を用いた露出制御(露出調節動作)を行う。画像処理部152では、被写体領域に基づいたガンマ補正、ホワイトバランス処理などを行う。
【0021】
モニタディスプレイ(表示部)150では、画像や被写体検出結果を矩形などで表示する。バッテリ159は、電源管理部158により適切に管理され、撮像装置100の全体に安定した電源供給を行う。
【0022】
フラッシュメモリ155には、撮像装置100の動作に必要な制御プログラムや、各部の動作に用いるパラメータ等が記録されている。ユーザの操作により撮像装置100が起動されると(電源OFF状態から電源ON状態へ移行すると)、フラッシュメモリ155に格納された制御プログラム及びパラメータがRAM154の一部に読み込まれる。CPU151は、RAM154にロードされた制御プログラム及び定数に従って撮像装置100の動作を制御する。
【0023】
位置姿勢変化取得部161は、例えばジャイロセンサや加速度センサ、電子コンパス等の位置姿勢センサにより構成され、撮像装置100の撮影シーンに対する位置姿勢変化を計測する。取得した位置姿勢変化はRAM154に保存される。
【0024】
深度算出部163では、画像中の任意の被写体について撮像装置からの距離を算出する。生成された距離情報はRAM154に保存され、画像処理部152により参照される。
【0025】
なお、上記で説明した構成は、撮像装置の構成の一例に過ぎない。
【0026】
(被写体検出の前提)
次に、被写体検出部162の入力画像を生成する際の本実施形態における前提と、本実施形態の方法を適用しなかった場合の課題について、図2を用いて説明する。ここでは被写体検出部162は例えば犬を検出できるものとする。
【0027】
図2(a)は、撮像信号処理部142で生成される高解像度の第1の画像を示している。以下、これを画像aとする。画像aに対して低解像度、例えば縦横それぞれ半分の画素数の第2の画像を生成し、それを被写体検出部162の入力とする。図2(b)は、単純に画像aの全体を縮小して第2の画像を生成した結果を示している。これを画像bとする。被写体検出部162の検出性能(検出率や領域の一致度)は被写体の入力画像上のサイズに依存することがあり、画像bを被写体検出部162の入力とすると、縮小に伴って小さくなった被写体の検出性能は低くなる。
【0028】
図2(c)は、主被写体が存在する場合、その周辺をクロップ(全画角のうちの一部の画像を切り出す処理)して第2の画像を生成した結果を示している。これを画像cとする。画像bと違い、縮小処理を行っていないため、主被写体の解像度は画像aの解像度と同じであり、縮小に伴う検出性能の低下を抑制できる。結果として主被写体を安定的に検出し、追尾し続けることができる。その一方で、主被写体の近傍に存在しない他の被写体は検出されないという課題がある。
【0029】
すなわち、画像bを被写体検出部162の入力とすることにより、多くの被写体を被写体検出部162の検出範囲に含めるか、画像cを被写体検出部162の入力とすることにより、小さい主被写体でも高精度で検出できる様にするかはトレードオフの関係にある。
【0030】
(合焦候補領域と乗り移り度合いについて)
本実施形態において、ユーザは合焦候補領域を設定する。ここで合焦候補領域とは、その領域に存在する目的の被写体を優先的に主被写体として選択し、AF(オートフォーカス)により焦点を合わせる領域のことを指す。
【0031】
また、ユーザは撮影前に被写体の乗り移り度合いを設定する。乗り移り度合いとは、撮影時、主被写体を追尾中(追従中)に他の被写体が存在した場合に、現在の主被写体の追尾を継続しやすいか、他の被写体を新たな主被写体として選択しやすいかの度合いを示す値である。乗り移り度合いは、例えば乗り移り度合い大と小の2値に設定したり、あるいは多段階に設定したりすることができる。なお、乗り移り度合いの値が大きいほど、他の被写体を新たな主被写体として選択しやすい(乗り移りやすい)ことを意味するものとする。
【0032】
ここで、「現在の主被写体よりも合焦候補領域の中心に近い被写体が存在する」という条件が所定の時間続いた場合、その被写体を新たな主被写体として選択する処理があるとする。このとき、この所定の時間を乗り移り度合いに応じて変更することができる。例えば乗り移り度合いが、設定できるなかで最大のものであれば、上記の所定の時間を短くして即座に乗り移りを行う。乗り移り度合いが、設定できるなかで最小のものであれば、主被写体を見失わない限り乗り移りを行わない。それ以外であれば、この所定の時間を乗り移り度合いに比例したものに設定する、という設計を行うことができる。
【0033】
乗り移りを行う条件として被写体の位置関係の例を示したが、これに限る必要はなく、例えば主被写体よりも大きい別の被写体が存在した場合に、乗り移り度合いが閾値以上である場合に限り乗り移る、といった設計を行うことも可能である。
【0034】
(全体処理フロー)
本実施形態における全体処理の流れを、図3図4を用いて説明する。本実施形態においては、被写体の乗り移り度合いを大、中、小の3段階で設定することができ、ユーザは撮影にあたって事前にこれを設定しているものとする。
【0035】
まず、ステップS200において、CPU151は、撮像制御部143から各部へ入力画像を供給する。
【0036】
次にステップS201において、CPU151は、主被写体の追尾中か否か(主被写体が存在するか否か)を判定する。追尾中であれば、ステップS202に進み、追尾中で無ければステップS208に進む。
【0037】
次にステップS202において、CPU151は、事前にユーザが設定した乗り移り度合いを参照する。乗り移り度合いが小、すなわち現在の主被写体に対する追尾をなるべく長く継続したいという設定であった場合、ステップS203に進む。乗り移り度合いが中であった場合は、ステップS204に、大であった場合はステップS205に進む。ステップS203、ステップS204、ステップS205ではクロップする領域の中心を決定する。
【0038】
ステップS203においては、CPU151は、図4(a)の様に、主被写体領域の中心を中心としてクロップを行う。ここで主被写体領域は前フレームの検出結果をそのまま用いても良いし、前フレームの検出結果に対して簡易的なテンプレートマッチングを行い、現フレームにおける主被写体領域を概算してもよい。こうして求めた領域の中心でクロップを行うことにより、現フレームにおける前フレームと同じ被写体領域の検出精度を高めることができる。一方、その近傍に存在しない被写体を検出することは出来なくなる。しかしこれは、乗り移り度合い小、すなわち現在の主被写体をなるべく安定的に検出することを重視したユーザの設定に整合したものであるといえる。
【0039】
ステップS204においては、CPU151は、図4(b)の様に、主被写体領域の中心と合焦候補領域の中心の中点をクロップの中心とする。これは、現在の主被写体をなるべく検出範囲に含めつつも、合焦候補領域に存在する他の被写体も検出し、場合によっては、焦点を合わせる対象をその被写体に切り替える(乗り移る)ことを可能とするためである。
【0040】
ステップS205においては、CPU151は、図4(c)の様に、合焦候補領域の中心をクロップの中心とする。これは、現在の主被写体の検出率は重要視せず、合焦候補領域に存在する他の被写体の検出を優先するためである。
【0041】
ステップS206においては、CPU151は、主被写体のサイズに応じてクロップ領域のサイズを決定する。詳細は後述する。その後、ステップS207に進む。
【0042】
ステップS207においては、CPU151は、クロップ領域を被写体検出部162の入力画像サイズに合わせて拡縮し、被写体検出部162に入力する。
【0043】
ステップS208においては、CPU151は、全画角範囲をそのまま被写体検出部162の入力画像サイズに合わせて拡縮し、被写体検出部162に入力する。
【0044】
(クロップ領域のサイズ)
本実施形態では、画像a(図2(a)に示す画像)においてクロップする領域のサイズ(縦、横それぞれの画素数)は主被写体のサイズに依存し、事前に調整された、被写体検出部162が最も得意とするサイズに拡縮されるように決定する。
【0045】
例えば被写体検出部162の入力画像上の主被写体の幅が画角の20%以上である場合に所望の検出率が満足されるとわかっている場合を考える。画像aにおける主被写体の幅が画角に対して20%であった場合、図2の(b)のように画像a全体をそのまま縮小して被写体検出部162の入力画像とする。画像aにおける主被写体の幅が画角に対して16%であった場合には、画像aの縦横80%の領域をクロップし、それを縮小して被写体検出部162の入力画像とする。これにより、被写体検出部162の入力画像上では主被写体のサイズを画角のおよそ20%にすることができる。
【0046】
上記の方法に従ってクロップサイズを決定した結果、クロップサイズが被写体検出部162の入力画像サイズを下回った場合、画像の拡大が必要となるが、これを避けるためにクロップサイズに下限を設けてもよい。
【0047】
なお、上述の実施形態ではクロップ領域のサイズを主被写体のサイズによって決定したが、これを乗り移り度合いに基づいて決定することもできる。
【0048】
具体的には、クロップサイズの下限を設け、その下限を乗り移り度合いが高いほど大きく(広範囲がクロップ領域に含まれるように)設定する。すなわち、乗り移り度合いが小さい場合、主被写体が検出されやすいクロップサイズに決定する一方で、乗り移り度合いが大きい場合、たとえ主被写体が小さい場合でも一定以上の範囲をクロップ領域に含める。これにより、他の被写体が被写体検出部162の対象に含まれやすいようにする。
【0049】
また、乗り移り度合いが中間程度の既定の設定であった場合、現在の主被写体の位置から大きくかけ離れた位置の被写体に乗り移らないように、合焦候補領域の中心から既定の距離以上にある被写体領域を乗り移る被写体領域として選択しないようにしてもよい。
【0050】
また、モニタディスプレイ150は、被写体が複数検出された場合、主被写体以外の少なくとも一つの被写体の領域を表示するようにしてもよい。
【0051】
以上説明したように、本実施形態によれば、主被写体の検出に特化したクロップ領域と主被写体以外の被写体の検出も行えるクロップ領域とを、ユーザの設定に基づいて決定することが可能となる。
【0052】
(他の実施形態)
また本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現できる。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現できる。
【0053】
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
【符号の説明】
【0054】
100:撮像装置、101:レンズユニット、133:フォーカス制御部、141:撮像素子、142:撮像信号処理部、143:撮像制御部、151:CPU、152:画像処理部、162:被写体検出部
図1
図2
図3
図4