IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ キヤノン株式会社の特許一覧

特許7511352情報処理システム、撮像装置及びその制御方法、プログラム
<>
  • 特許-情報処理システム、撮像装置及びその制御方法、プログラム 図1
  • 特許-情報処理システム、撮像装置及びその制御方法、プログラム 図2
  • 特許-情報処理システム、撮像装置及びその制御方法、プログラム 図3
  • 特許-情報処理システム、撮像装置及びその制御方法、プログラム 図4
  • 特許-情報処理システム、撮像装置及びその制御方法、プログラム 図5
  • 特許-情報処理システム、撮像装置及びその制御方法、プログラム 図6
  • 特許-情報処理システム、撮像装置及びその制御方法、プログラム 図7
  • 特許-情報処理システム、撮像装置及びその制御方法、プログラム 図8
  • 特許-情報処理システム、撮像装置及びその制御方法、プログラム 図9
  • 特許-情報処理システム、撮像装置及びその制御方法、プログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-27
(45)【発行日】2024-07-05
(54)【発明の名称】情報処理システム、撮像装置及びその制御方法、プログラム
(51)【国際特許分類】
   H04N 23/60 20230101AFI20240628BHJP
   G06T 7/00 20170101ALI20240628BHJP
   H04N 5/77 20060101ALI20240628BHJP
   H04N 5/92 20060101ALI20240628BHJP
【FI】
H04N23/60 300
G06T7/00 Q
G06T7/00 350C
H04N5/77
H04N5/92
【請求項の数】 21
(21)【出願番号】P 2020016493
(22)【出願日】2020-02-03
(65)【公開番号】P2021125750
(43)【公開日】2021-08-30
【審査請求日】2023-01-27
(73)【特許権者】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】110003281
【氏名又は名称】弁理士法人大塚国際特許事務所
(72)【発明者】
【氏名】▲高▼橋 亮
【審査官】越河 勉
(56)【参考文献】
【文献】特開2010-035177(JP,A)
【文献】特開2013-143661(JP,A)
【文献】特開2018-045350(JP,A)
【文献】特開2005-165662(JP,A)
【文献】特開2005-045600(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 23/60
G06T 7/00
H04N 5/77
H04N 5/92
(57)【特許請求の範囲】
【請求項1】
撮像装置と情報処理装置とが通信可能に構成された情報処理システムであって、
前記撮像装置は、
被写体像を撮像する撮像手段と、
前記撮像手段で撮像された撮像画像に対して、第1の評価を行う第1の評価手段と、
前記撮像画像に対応するよりサイズの小さい画像を前記情報処理装置に送信する第1の送信手段と、を備え、
前記情報処理装置は、
前記第1の送信手段により送信された前記画像を受信する受信手段と、
前記画像に対して、第2の評価を行う第2の評価手段と、
前記第2の評価の評価結果を前記撮像装置に送信する第2の送信手段と、を備え、
前記撮像装置は、前記第2の評価の評価結果を受信し、前記撮像画像に対する前記第1の評価の評価結果と前記画像に対する前記第2の評価の評価結果とを用いて、前記撮像画像の仕分けを行う仕分け手段をさらに備え
前記第1の評価は、少なくともピントの良し悪しに関する評価であることを特徴とする情報処理システム。
【請求項2】
前記仕分け手段は、前記撮像画像を残すか残さないかを決定することを特徴とする請求項1に記載の情報処理システム。
【請求項3】
前記第2の評価手段で行う評価は、少なくとも構図または表情の良し悪しに関する評価であることを特徴とする請求項1または2に記載の情報処理システム。
【請求項4】
前記撮像装置は、ユーザが前記撮像画像の評価において重視する観点を選択する選択手段をさらに備え、前記仕分け手段は、前記選択手段の選択内容に応じて前記撮像画像の仕分けを行うことを特徴とする請求項1乃至のいずれか1項に記載の情報処理システム。
【請求項5】
前記選択手段によって、ユーザが構図または表情を重視する選択を行った場合は、前記仕分け手段は、前記第2の評価の評価結果を重視して前記撮像画像の仕分けを行うことを特徴とする請求項に記載の情報処理システム。
【請求項6】
前記選択手段によって、ユーザがピントを重視する選択を行った場合は、前記仕分け手段は、前記第1の評価の評価結果を重視して前記撮像画像の仕分けを行うことを特徴とする請求項に記載の情報処理システム。
【請求項7】
前記仕分け手段は、前記第1の評価の評価結果と前記第2の評価の評価結果がともに所定の値以上である前記撮像画像を、残す画像として仕分けることを特徴とする請求項2に記載の情報処理システム。
【請求項8】
前記仕分け手段は、残す画像として仕分けられた前記撮像画像に、送信予約タグを付加することを特徴とする請求項2またはに記載の情報処理システム。
【請求項9】
前記第2の評価手段における評価は、少なくとも表情の判定に特化した学習モデルを用いて行われることを特徴とする請求項1乃至のいずれか1項に記載の情報処理システム。
【請求項10】
前記第1の送信手段は、前記第1の評価手段での評価結果が所定の閾値以上だった前記撮像画像を、前記情報処理装置に送信することを特徴とする請求項1乃至のいずれか1項に記載の情報処理システム。
【請求項11】
情報処理装置と通信可能な撮像装置であって、
被写体像を撮像する撮像手段と、
前記撮像手段で撮像された撮像画像に対して、第1の評価を行う評価手段と、
前記撮像画像に対応するよりサイズの小さい画像を前記情報処理装置に送信する送信手段と、
前記情報処理装置により、前記画像に対して行われる第2の評価の評価結果を受信する受信手段と、
前記撮像画像に対する前記第1の評価の評価結果と、受信した前記画像に対する前記第2の評価の評価結果とを用いて、前記撮像画像の仕分けを行う仕分け手段と、
を備え
前記第1の評価は、少なくともピントの良し悪しに関する評価であることを特徴とする撮像装置。
【請求項12】
前記仕分け手段は、前記撮像画像を残すか残さないかを決定することを特徴とする請求項11に記載の撮像装置。
【請求項13】
前記第2の評価は、少なくとも構図または表情の良し悪しに関する評価であることを特徴とする請求項11または12に記載の撮像装置。
【請求項14】
ユーザが前記撮像画像の評価において重視する観点を選択する選択手段をさらに備え、前記仕分け手段は、前記選択手段の選択内容に応じて前記撮像画像の仕分けを行うことを特徴とする請求項11乃至13のいずれか1項に記載の撮像装置。
【請求項15】
前記選択手段によって、ユーザが構図または表情を重視する選択を行った場合は、前記仕分け手段は、前記第2の評価の評価結果を重視して前記撮像画像の仕分けを行うことを特徴とする請求項14に記載の撮像装置。
【請求項16】
前記選択手段によって、ユーザがピントを重視する選択を行った場合は、前記仕分け手段は、前記第1の評価の評価結果を重視して前記撮像画像の仕分けを行うことを特徴とする請求項14に記載の撮像装置。
【請求項17】
前記仕分け手段は、前記第1の評価の評価結果と前記第2の評価の評価結果がともに所定の値以上である前記撮像画像を、残す画像として仕分けることを特徴とする請求項12に記載の撮像装置。
【請求項18】
前記仕分け手段は、残す画像として仕分けられた前記撮像画像に、送信予約タグを付加することを特徴とする請求項12または17に記載の撮像装置。
【請求項19】
前記送信手段は、前記第1の評価の評価結果が所定の閾値以上だった前記撮像画像を、前記情報処理装置に送信することを特徴とする請求項11乃至18のいずれか1項に記載の撮像装置。
【請求項20】
被写体像を撮像する撮像手段を備え、情報処理装置と通信可能な撮像装置を制御する方法であって、
前記撮像手段で撮像された撮像画像に対して、第1の評価を行う評価工程と、
前記撮像画像をに対応するよりサイズの小さい画像前記情報処理装置に送信する送信工程と、
前記情報処理装置により、前記画像に対して行われる第2の評価の評価結果を受信する受信工程と、
前記撮像画像に対する前記第1の評価の評価結果と、受信した前記画像に対する前記第2の評価の評価結果とを用いて、前記撮像画像の仕分けを行う仕分け工程と、
を有し、
前記第1の評価は、少なくともピントの良し悪しに関する評価であることを特徴とする撮像装置の制御方法。
【請求項21】
コンピュータを、請求項11乃至19のいずれか1項に記載の撮像装置の各手段として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、大量の画像からユーザにとって望ましい画像を抽出する情報処理システムに関する。
【背景技術】
【0002】
近年、画像のバックアップ用として、それらの画像をクラウドなどのネットワーク上のサーバー(以下サーバー、またはクラウド)に保管する方法が知られている。サーバーの容量は増加傾向であるため、ユーザは撮影した大量の画像をそのままサーバーに保管することが可能である。しかし、サーバー側のサービスによっては、所定容量以上保管する場合には有料となる場合があるため、無料範囲内で必要な画像のみをバックアップできることが望ましい。そのため、不要な画像を簡単な方法で除外する仕組みや、撮影した直後にも簡単な方法でベストショット画像であるか否かの判定ができること、が求められている。ここで、ユーザが不要と考える画像は、一般的に、ピントの合っていない画像や人物の表情が優れない画像などである。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2010-35177号公報
【文献】特開2018-45350号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1には、デジタルカメラなどの撮影装置内部で撮影した画像を自動的に評価することが記載されており、その評価は露出やボケやブレの状態に基づいて行われる。つまり、少なくともカメラ内部でピンボケ画像を除外することが可能である。しかしこの方法では、ユーザにとって好ましい画像かどうか、つまり構図や表情の良し悪しまでを評価することはできない。
【0005】
また、特許文献2には、表情識別の学習モデルに対して、識別対象である人間の属性に応じて表情算出のスコア方法を変更する方法が記載されている。特許文献2によれば、少なくとも良い表情の画像を、クラウド等の機械学習(AI)の学習モデルに推定処理させることで判定可能である。しかしこの方法では、表情に関しては信頼性の高いベストショット画像を判定することが可能であるが、ピントの状態も合わせて判定することはできない。
【0006】
ピント判定と表情判定を撮影直後に同時に実現させるには、カメラ内部で全て判定することは難しく、ピントの良し悪しの判定も、表情判定と同様にクラウド上での学習モデルを活用した結果と組み合わせて行うことが考えられる。しかし、撮影直後にカメラ外でベストショット判定処理をするためには、通信環境にもよるが、画像サイズを小さくして送信する必要がある。画像サイズが小さいとシャープネスが甘くなり、正しいピンボケ判定ができない可能性や、主被写体ではない部分に対してピント判定がなされてしまう可能性がある。また、主被写体以外の領域の意図したボケを好ましくないボケと誤判定するなど、カメラ外部でのピント判定はカメラ内部で行うよりも難しい場合がある。以上のことから、撮影直後にピント判定と構図・表情のなどのピント以外の判定を組み合わせて画像の仕分けをするのは難しいといった課題がある。
【0007】
本発明は上述した課題に鑑みてなされたものであり、その目的は、撮影直後にユーザの望む画像だけを残し、サーバーなどへのバックアップデータ容量を増やさない情報処理システムを提供することである。
【課題を解決するための手段】
【0008】
本発明に係わる情報処理システムは、撮像装置と情報処理装置とが通信可能に構成された情報処理システムであって、前記撮像装置は、被写体像を撮像する撮像手段と、前記撮像手段で撮像された撮像画像に対して、第1の評価を行う第1の評価手段と、前記撮像画像に対応するよりサイズの小さい画像を前記情報処理装置に送信する第1の送信手段と、を備え、前記情報処理装置は、前記第1の送信手段により送信された前記画像を受信する受信手段と、前記画像に対して、第2の評価を行う第2の評価手段と、前記第2の評価の評価結果を前記撮像装置に送信する第2の送信手段と、を備え、前記撮像装置は、前記第2の評価の評価結果を受信し、前記撮像画像に対する前記第1の評価の評価結果と前記画像に対する前記第2の評価の評価結果とを用いて、前記撮像画像の仕分けを行う仕分け手段をさらに備え、前記第1の評価は、少なくともピントの良し悪しに関する評価であることを特徴とする。
【発明の効果】
【0009】
本発明によれば、撮影直後にユーザの望む画像だけを残し、サーバーなどへのバックアップデータ容量を増やさない情報処理システムを提供することが可能となる。
【図面の簡単な説明】
【0010】
図1】本発明の一実施形態に係わる情報処理システムの構成を示す図。
図2】情報処理システムを構成する各装置のハードウェア構成を示す図。
図3図2のハードウェア構成の各ブロックとプログラムを利用することで実現されるソフトウェア構成を示す図。
図4】学習モデルの概念図。
図5】情報処理システムの動作の流れを示す図。
図6】カメラ側の処理の流れを示すフローチャート。
図7】情報処理装置側の処理の流れを示すフローチャート。
図8】カメラ内部における仕分け処理の流れを示すフローチャート。
図9】仕分けの対象となる画像の一例を示す図。
図10】仕分け処理に関連する画像抽出条件の設定画面を示す図。
【発明を実施するための形態】
【0011】
以下、添付図面を参照して実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
【0012】
図1は、本発明の一実施形態に係わる情報処理システムの構成を示す図である。
【0013】
図1において、カメラ100は、ネットワーク104を経由して画像管理サーバー105へ画像を送信する。画像管理サーバー105は、ネットワーク104を経由して、逐一ベストショット(以下、BSと表現することもある)推定サーバー106に画像を送信する。ベストショット推定サーバー106は、入力画像に対するベストショットスコア値を算出し、その結果を、ネットワーク104を経由して、画像管理サーバー105へ返信する。そして、画像管理サーバー105は、カメラ100へその情報を通知する。なお、画像管理サーバー105とベストショット推定サーバー106は同一の機器内に存在するように構成してもよい。本実施形態では、情報処理装置200内に、画像管理サーバー105とベストショット推定サーバー106が存在し、カメラ100と情報処理装置200はネットワーク104等を経由して通信可能であるものとする。
【0014】
図2は、図1に示す情報処理システムを構成する各装置のハードウェア構成を示す図である。
【0015】
図2において、撮影レンズ103は、ズームレンズ、フォーカスレンズを含むレンズ群を有する。シャッター101は、絞り機能を備えるシャッターである。撮像部22は、光学像(被写体像)を電気信号に変換するCCDやCMOS素子等で構成される撮像素子を備える。A/D変換器23は、撮像部22から出力されるアナログ信号をデジタル信号に変換する。バリア102は、デジタルカメラ100の、撮影レンズ103を含む撮像系を覆うことにより、撮影レンズ103、シャッター101、撮像部22を含む撮像系の汚れや破損を防止する。
【0016】
画像処理部24は、A/D変換器23からのデータ、又は、メモリ制御部15からのデータに対し所定の画素補間処理、縮小といったリサイズ処理、色変換処理等を行う。また、画像処理部24では、撮像した画像データを用いて所定の演算処理が行われ、得られた演算結果に基づいてシステム制御部50が露光制御、焦点検出制御を行う。これにより、TTL(スルー・ザ・レンズ)方式のAF(オートフォーカス)処理、AE(自動露出)処理、EF(フラッシュプリ発光)処理が行われる。画像処理部24では更に、撮像した画像データを用いて所定の演算処理を行い、得られた演算結果に基づいてTTL方式のAWB(オートホワイトバランス)処理も行っている。
【0017】
A/D変換器23からの出力データは、画像処理部24及びメモリ制御部15を介して、或いは、メモリ制御部15を介してメモリ32に直接書き込まれる。メモリ32は、撮像部22によって得られ、A/D変換器23によりデジタルデータに変換された画像データや、表示部28に表示するための画像データを格納する。メモリ32は、所定枚数の静止画像や所定時間の動画像および音声を格納するのに十分な記憶容量を備えている。
【0018】
また、メモリ32は、画像表示用のメモリ(ビデオメモリ)を兼ねている。D/A変換器13は、メモリ32に格納されている画像表示用のデータをアナログ信号に変換して、表示部28に供給する。こうして、メモリ32に書き込まれた表示用の画像データはD/A変換器13を介して表示部28により表示される。表示部28は、LCD等の表示器上に、D/A変換器13からのアナログ信号に応じた表示を行う。A/D変換器23によって一度A/D変換されメモリ32に蓄積されたデジタル信号を、D/A変換器13においてアナログ変換し、表示部28に逐次転送して表示することで、電子ビューファインダが実現される。これにより、スルー画像表示(ライブビュー表示)を行うことができる。
【0019】
不揮発性メモリ56は、電気的に消去・記録可能な記録媒体としてのメモリであり、例えばEEPROM等が用いられる。不揮発性メモリ56には、システム制御部50の動作用の定数、プログラム等が記憶される。ここでいう、プログラムとは、本実施形態において後述する各種フローチャートの動作を実行するためのコンピュータプログラムのことである。
【0020】
システム制御部50は、少なくとも1つのプロセッサーを有する制御部であり、デジタルカメラ100全体を制御する。前述した不揮発性メモリ56に記録されたプログラムを実行することにより、後述する本実施形態の各処理を実現する。システムメモリ52には、RAMが用いられる。システムメモリ52には、システム制御部50の動作用の定数、変数、不揮発性メモリ56から読み出したプログラム等を展開する。また、システム制御部50はメモリ32、D/A変換器13、表示部28等を制御することにより表示制御も行う。
【0021】
システムタイマー53は各種制御に用いる時間や、内蔵された時計の時間を計測する計時部である。
【0022】
モード切替スイッチ60、シャッターボタン63、操作部70はシステム制御部50に各種の動作指示を入力するための操作手段である。
【0023】
モード切替スイッチ60は、システム制御部50の動作モードを静止画記録モード、動画撮影モード、再生モード等のいずれかに切り替える。静止画記録モードに含まれるモードとして、オート撮影モード、オートシーン判別モード、マニュアルモード、絞り優先モード(Avモード)、シャッター速度優先モード(Tvモード)がある。また、撮影シーン別の撮影設定となる各種シーンモード、プログラムAEモード、カスタムモード等がある。モード切替スイッチ60で、これらのモードのいずれかに直接切り替えられる。あるいは、モード切替スイッチ60で撮影モードの一覧画面に一旦切り換えた後に、表示された複数のモードのいずれかを選択し、他の操作部材を用いて切り替えるようにしてもよい。同様に、動画撮影モードにも複数のモードが含まれていてもよい。
【0024】
第1シャッタースイッチ61は、デジタルカメラ100に設けられたシャッターボタン63の操作途中、いわゆる半押し(撮影準備指示)でONとなり、第1シャッタースイッチ信号SW1を発生する。第1シャッタースイッチ信号SW1により、AF(オートフォーカス)処理、AE(自動露出)処理、AWB(オートホワイトバランス)処理、EF(フラッシュプリ発光)処理等の動作を開始する。
【0025】
第2シャッタースイッチ62は、シャッターボタン63の操作完了、いわゆる全押し(撮影指示)でONとなり、第2シャッタースイッチ信号SW2を発生する。システム制御部50は、第2シャッタースイッチ信号SW2により、撮像部22からの信号読み出しから記録媒体150に画像データを書き込むまでの一連の撮影処理の動作を開始する。
【0026】
操作部70の各操作部材は、表示部28に表示される種々の機能アイコンを選択操作することなどにより、場面ごとに適宜機能が割り当てられ、各種機能ボタンとして動作する。機能ボタンとしては、例えば終了ボタン、戻るボタン、画像送りボタン、ジャンプボタン、絞込みボタン、属性変更ボタン等がある。例えば、メニューボタンが押されると各種の設定可能なメニュー画面が表示部28に表示される。利用者は、表示部28に表示されたメニュー画面と、上下左右の4方向ボタンやSETボタンを用いて直感的に各種設定を行うことができる。4方向ボタンは上ボタン、下ボタン、左ボタン、右ボタン、中央のSETボタンを有する。
【0027】
コントローラホイールは、操作部70に含まれる回転操作可能な操作部材であり、方向ボタンと共に選択項目を指示する際などに使用される。コントローラホイールを回転操作すると、操作量に応じて電気的なパルス信号が発生し、このパルス信号に基づいてシステム制御部50はデジタルカメラ100の各部を制御する。このパルス信号によって、コントローラホイールが回転操作された角度や、何回転したかなどを判定することができる。なお、コントローラホイールは回転操作が検出できる操作部材であればどのようなものでもよい。例えば、ユーザの回転操作に応じてコントローラホイール自体が回転してパルス信号を発生するダイヤル操作部材であってもよい。また、タッチセンサよりなる操作部材で、コントローラホイール自体は回転せず、コントローラホイール上でのユーザの指の回転動作などを検出するものであってもよい(いわゆる、タッチホイール)。
【0028】
電源制御部80は、電池検出回路、DC-DCコンバータ、通電するブロックを切り替えるスイッチ回路等により構成され、電池の装着の有無、電池の種類、電池残量の検出を行う。また、電源制御部80は、その検出結果及びシステム制御部50の指示に基づいてDC-DCコンバータを制御し、必要な電圧を必要な期間、記録媒体150を含む各部へ供給する。
【0029】
電源部30は、アルカリ電池やリチウム電池等の一次電池、NiCd電池やNiMH電池やLiイオン電池等の二次電池、ACアダプター等からなる。記録媒体I/F18は、メモリカードやハードディスク等の記録媒体150とのインターフェースである。記録媒体150は、撮影された画像を記録するためのメモリカード等の記録媒体であり、半導体メモリや光ディスク、磁気ディスク等から構成される。
【0030】
通信部54は、無線または有線ケーブルによって外部機器と接続され、映像信号や音声信号等の送受信を行う。通信部54は無線LAN(Local Area Network)やインターネットとも接続可能である。通信部54は撮像部22で撮像した画像(スルー画像を含む)や、記録媒体150に記録された画像を送信可能であり、また、外部機器から画像データやその他の各種情報を受信することができる。
【0031】
姿勢検知部55は、重力方向に対するデジタルカメラ100の姿勢を検知する。姿勢検知部55で検知された姿勢に基づいて、撮像部22で撮影された画像が、デジタルカメラ100を横に構えて撮影された画像であるか、縦に構えて撮影された画像であるかを判別可能である。システム制御部50は、姿勢検知部55で検知された姿勢に応じた向き情報を撮像部22で撮像された画像の画像ファイルに付加したり、画像を回転して記録することが可能である。姿勢検知部55としては、加速度センサーやジャイロセンサーなどを用いることができる。
【0032】
また、図2において、情報処理装置200は、画像管理サーバー105、ベストショット推定サーバー106を構成するハードウェアである、なお、画像管理サーバー105、ベストショット推定サーバー106は、それぞれ単一の情報処理装置で実現してもよいし、必要に応じて複数の情報処理装置に各機能を分散して実現するようにしてもよい。複数の情報処理装置で構成される場合は、互いに通信できるようにLocal Area Network(LAN)などで接続される。
【0033】
図2において、システムバス201は、202~209の各デバイスを通信できるように接続する。制御部202は、情報処理装置200全体を制御し、例えばCentral Processing Unit(CPU)から構成される。ROM203は、変更を必要としないプログラムやパラメータを格納するRead Only Memoryである。RAM204は、外部記憶装置またはネットワーク104などから供給されるプログラムやデータを一時記憶するRandom Access Memoryである。HDD205は、情報処理装置200に固定して設置されたハードディスクやメモリカード、あるいは情報処理装置200から着脱可能な光ディスク、磁気や光カード、ICカードなどを含む外部記憶装置である。NC206は、ネットワーク104などの回線に接続するためのネットワークインターフェースである。入力部207は、ユーザの操作を受け、各種データを入力する、ポインティングデバイスやキーボードなどの入力デバイスとのインターフェースである。表示部208は、情報処理装置200の保持するデータや供給されたデータを表示するためのディスプレイなどの表示装置とのインターフェースである。GPU209は、データをより多く並列処理することで効率的な演算を行うことができる制御部であり、ディープラーニングのような学習モデルを用いて複数回に渡り学習を行う場合にはGPU209で処理を行うことが有効である。
【0034】
なお、以降の情報処理装置200の処理は、CPU202が外部記憶装置205またはネットワーク104などから供給されるプログラムを読み出して起動し、これらにしたがって各種デバイスを制御することにより実行される。
【0035】
図3は、図2のハードウェア構成図で示した各ブロックとプログラムを利用することで実現されるソフトウェア構成を示す図である。データ送信部301は、カメラ100で撮影した画像データや画像IDなどの付帯情報をカメラ100外に送信する。UI表示部302は、カメラ100で撮影した画像や付帯情報を表示する。撮像部303は、カメラ100において撮影処理を行う。画像処理部304は、撮像部303で撮影した後の画像処理や画像の仕分け処理などを行う。
【0036】
画像管理サーバー105内のデータ記憶部351は、カメラ100側から送信されてきた画像や画像IDなどの付帯情報をROM203に保存する。画像データ管理部352は、ベストショット推定サーバー106でベストショットを判定する画像の管理を行う。データ送受信部353は、カメラ100側へ画像データや画像の付帯情報を送信する。ベストショット推定サーバー106内のデータ記憶部361は、ベストショット画像の推定のために学習部362で用いるデータの記憶をGPU209の指示により行う。推定部363は、ベストショット推定サーバー106でのベストショット判定を行う箇所であり、その処理はGPU209が行う。
【0037】
学習部362による処理には、CPU202に加えてGPU209を用いる。具体的には、学習モデルを含む学習プログラムを実行する場合に、CPU202とGPU209が協働して演算を行うことで学習を行う。なお、学習部362の処理は、CPU202またはGPU209のみにより行われてもよい。また、推定部363も学習部362と同様にGPU209を用いてもよい。
【0038】
図4は、本実施形態における学習モデル(表情や構図に特化した学習モデル)を用いた入出力の構造を示す概念図であり、入力データ401は、画像データである。出力データ402は、例えば表情のベストショットスコア値4021または構図のベストショットスコア値4022である。
【0039】
スコア値については、数値0~1の中で確率として出力され、表情判定の場合、良い表情と推定されれば1に近い数値となって出力される。なお、学習フェーズにおける学習の詳細は、前述の特許文献1~2に記載したように公知であるため、詳細な説明は省略する。
【0040】
ベストショット判定で行う表情判定に関する学習では、例えば表情の良い画像に対してはハイスコア(表情が良いという評価)のタグを付けたものを教師データとして学習させる。また、表情の悪い画像に対してはロースコアタグをつけた教師データとして学習させる。これを、学習部362でGPU209を用いて数万枚の画像について学習させ、その後、例えば数千枚のテスト画像を用意して評価し、正解率が所定以上になるまで繰り返し学習を行う。構図に関するベストショット判定の学習、および推定フェーズにおける出力についても同様である。
【0041】
図5は、図4に示した学習モデルの構造を利用したシステムの動作を説明する図である。まず、カメラ100が、画像管理サーバー105へ評価対象の画像データ(サムネイルまたは縮小画像)とそのデータに関連する画像IDを送信する(矢印501)。画像管理サーバー105は、画像IDをデータ記憶部351に一時保持すると同時にベストショット推定サーバー106に画像データを送信する(矢印502)。続いて、ベストショット推定サーバー106において、表情や構図などに関するベストショットスコア値を、学習モデルを用いることで算出する(矢印503)。そして、その結果を画像管理サーバー105に返信する(矢印504)。画像管理サーバー105は、その結果を画像IDと関連付けてカメラ100へ送信する(矢印505)。図5に示す動作が行われることにより、カメラ100内では実現できない表情や構図などのベストショット画像スコア値を導き出すことが可能となる。
【0042】
図6は、カメラ100側の処理のフローチャートであり、各処理はシステム制御部50が不揮発性メモリ56に格納されたプログラムをシステムメモリ52に展開して実行することにより実現される。
【0043】
ステップS601では、システム制御部50は、撮像部22で撮像した画像データ(撮像画像データ)を表示部28に表示する。つまり撮影時のライブビュー画面を表示する。
【0044】
ステップS602では、システム制御部50は、シャッターボタン63が押下されて、第2シャッタースイッチ62がONされたか否か、つまり撮影指示がなされたか否かを判定する。システム制御部50は、押下されたと判断した場合は、処理をステップS603へ進め、押下されていないと判断した場合は、処理をステップS610へ進める。
【0045】
ステップS603では、システム制御部50は、シャッターボタン63が押されたタイミングでの撮影処理を行う。
【0046】
ステップS604では、システム制御部50は、ステップS603で撮影された画像データから画像ファイルを生成する。画像そのものは本画像として保存し、さらに表示用画像として同ファイル内にサムネイル画像(本画像よりも小さいサイズ)を残す。
【0047】
ステップS605では、システム制御部50は、通信部54(データ送受信部301)により画像管理サーバー105に画像データを送信する。その際、送信するデータとして、ステップS604で生成した画像ファイル内のサムネイル画像を送信する。また、サムネイル画像のデータだけでなく、画像IDも併せて送信する。
【0048】
ステップS606では、システム制御部50は、ステップS604で生成した画像ファイル内の本画像から被写体を検出する。ここでの検出処理は、撮影時に主被写体位置を記憶しておきその値を抽出する。
【0049】
ステップS607では、システム制御部50は、ステップS606において検出した主被写体のAF評価値から、デフォーカス(ぼけ)量を算出する。
【0050】
ステップS608では、システム制御部50は、ステップS607で算出したデフォーカス量(ぼけ量)をカメラ判定スコアに正規化する。ここで、正規化では、たとえば0~100の数字(例えば100点満点に正規化)を、カメラ内のベストショット判定スコア(評価結果)とし、0点が大ぼけ画像、100点がぼけていない画像とする。つまり、主被写体のぼけ量を導き出せたことになる。
【0051】
ステップS609では、システム制御部50は、ステップS608のカメラ100内のベストショット判定スコアを、ステップS604で生成した画像ファイルにタグ付けする。
【0052】
ステップS610では、システム制御部50は、画像管理サーバー105からのベストショット判定結果が受信されたか否かを判定する。システム制御回路50は、受信されたと判断した場合は、処理をステップS611へ進め、受信されていないと判断した場合は、処理をステップS613へ進める。
【0053】
ステップS611では、システム制御部50は、画像管理サーバー105から送られたベストショット判定スコアを、同時に配信された画像IDに関連する画像のファイルにタグ付けする。ここで、ステップS605でサムネイルデータと同時に送った画像IDがベストショット判定スコアに関連付けられた形で画像管理サーバー105から受信される。なお、画像管理サーバー105から受信した時点で、その画像IDに関連する画像がカメラ100内に存在しない場合も考えられる。しかし、サムネイル画像を用いてデータのやりとり(送受信)や情報処理装置200側の解析を行っているため、その処理の時間は短く、存在しない可能性は低いと考えられる。
【0054】
ステップS612では、システム制御部50は、画像の仕分け処理を行う。画像の仕分け処理の詳細に関しては、図8のフローチャートを用いて後述する。
【0055】
ステップS613では、システム制御部50は、カメラ100の処理を終了させるか否かを判定する。システム制御部50は、カメラ処理を終了すると判断した場合は、カメラモードを終了させて電源をOFFさせ、カメラ処理を終了しないと判断した場合は、処理をステップS602へ戻す。
【0056】
なお、本実施形態では、システム制御部50は、図3のデータ送受信部301にステップS605の処理を行わせ、撮像部303にステップS601とステップS603の処理を行わせ、それ以外の処理を画像処理部他304に行わせる。
【0057】
図7は、情報処理装置200側の処理(学習モデル活用における推定フェーズにおける詳細な流れ)を示すフローチャートであり、各処理はCPU202がROM203に格納されたプログラムをRAM204に展開して実行することにより実現される。
【0058】
ステップS701では、情報処理装置200のCPU202(以下、CPU202)は、カメラ100から送信されたサムネイル画像と画像IDを受信したか否かを判定する。。CPU202は、受信したと判断した場合は、処理をステップS702に進め、受信していないと判断した場合は、処理をステップS705に進める。
【0059】
ステップS702では、CPU202は、ステップS701で受信したサムネイル画像を推定部363に入力する。また、同時に受信した画像IDをデータ記憶部361に保持する。
【0060】
ステップS703では、CPU202は、GPU209を用い、推定部363の機能により、ベストショット判定処理を行う。そして、推定部363からの出力である、表情のベストショットスコア4021と構図のベストショットスコア4022(評価結果)をデータ記憶部361に保持する。
【0061】
ステップS704では、CPU202は、データ記憶部361に保持されている画像IDと、ステップS703でのベストショットスコア4021,4022とを関連付けて、データ送受信部353により、カメラ100へ送信する。
【0062】
ステップS705では、CPU202は、処理を終了するか否かを判定する。CPU202は、処理を終了する指示、つまり情報処理装置200のシャットダウン指示があったと判断した場合は、情報処理装置200をシャットダウンさせ、終了する指示がないと判断した場合は、処理をステップS701へ戻す。そして、カメラ100側からのデータ送信を受けるまで待機する。
【0063】
図8は、カメラ100側の画像の仕分け処理に関するフローチャートであり、図9図10も参照して動作について説明する。なお、各処理はシステム制御部50が、不揮発性メモリ56に格納されたプログラムをシステムメモリ52に展開して実行することにより実現される。
【0064】
ステップS801では、システム制御部50は、ある一つの画像に対し、画像ファイルのタグ情報からカメラ100内のベストショットスコア値と情報処理装置200でのベストショットスコア値を取得し、それぞれのスコアがともに第1の閾値未満か否かを判定する。システム制御部50は、ともに第1の閾値未満であると判断した場合は、処理をステップS802へ進め、そうではないと判断した場合は、処理をステップS803へ進める。
【0065】
ステップS802では、システム制御部50は、ステップS801で判断の対象とした画像を、「残さない画像」として仕分ける。ここで、残さない画像と判定されると、システム制御部50は、例えばカメラ100においてゴミ箱フォルダに移動する、または強制的に消去するといった処理を別途行う。そして、仕分け処理を終了する。
【0066】
ここで、ステップS801とステップS802において具体的に何が行われたかを図9を用いて説明する。図9は、5枚の画像(画像Aから画像E)に対して、カメラ100内のベストショット判定と情報処理装置200側のベストショット判定の結果を表す表を示し、さらにそれぞれの画像がどのように仕分け判定されるかを示している。
【0067】
例えば、画像Eは、カメラ100内のスコアは30点で、情報処理装置200側でのスコアは20点である。ステップS801の判定において第1の閾値が40点である場合、判定に用いられた画像が画像Eの場合は、ステップS802へ進むことになる。逆に、画像Aから画像Dの場合は、ステップS803へ進むことになる。
【0068】
画像Eはカメラ100内でのスコアも情報処理装置200側でのスコアも低スコアであるため、この画像は失敗画像である可能性が高い。画像一枚一枚を目で確認したときに有用な画像であるかもしれないが、大量の画像から有用な画像を抽出するためには、スコアが低い画像Eは除外していくほうが効率的である。そのため、画像EはステップS802で残さない画像と判定(例えばゴミ箱フォルダに移動)される。
【0069】
ステップS803では、システム制御部50は、ある一つの画像に対し、画像ファイルのタグ情報からカメラ100内のベストショットスコア値と情報処理装置200でのベストショットスコア値を取得し、それぞれのスコアがともに第2の閾値以上か否かを判定する。システム制御部50は、ともに第2の閾値以上であると判断した場合は、処理をステップS804へ進め、そうではないと判断した場合は、処理をステップS805へ進める。
【0070】
ステップS804では、システム制御部50は、ステップS803で判断の対象とした画像を、「残す画像」として仕分ける(決定する)。ここで、残す画像と判定されると、システム制御部50は、例えば送信予約タグをつけておくなど、自動バックアップ予約する画像扱いにしておく。そして、仕分け処理を終了する。
【0071】
ここで、ステップS803とステップS804において具体的に何が行われたかについても、図9を用いて補足説明する。例えば、第2の閾値を70点とすると、ステップS803からステップS804に進む画像は画像Cとなる。このような画像はカメラ100内におけるピント(ぼけていない)判定もハイスコアでかつ、情報処理装置200側で行う、表情や構図のベストショット判定もハイスコアであるため、有用な画像である可能性が高い。そのため、仕分けにおいて残す画像としておくことが効率的である。
【0072】
ステップS805では、システム制御部50は、ある一つの画像に対し、画像ファイルのタグ情報からカメラ100内のベストショットスコア値と情報処理装置200でのベストショットスコア値を取得し、カメラ100側のスコアが第2の閾値以上で、かつ情報処理装置200側のスコアが第1の閾値未満であるか否かを判定する。システム制御部50は、カメラ100側のスコアが第2の閾値以上で、かつ情報処理装置200側のスコアが第1の閾値未満であると判断した場合は、処理をステップS806へ進め、そうではないと判断した場合は、処理をステップS809へ進める。
【0073】
ステップS806では、システム制御部50は、ベストショット抽出条件がピント重視(ピント重視の観点)であるか否かを判定する。システム制御部50は、ピント重視であると判断した場合は、処理をステップS807へ進め、そうではないと判断した場合は、処理をステップS808へ進める。
【0074】
図9の場合、このステップS806の判定処理に流れてくる画像は画像Aである。ここで、ベストショット抽出条件に関して図10を用いて説明する。ベストショット抽出条件とは、カメラ100内の設定画面でユーザが自由に選択できるものとする。例えば、主被写体のピントが合っていることを第1優先に考えるユーザは、構図や表情がそれほど良くなくても画像の仕分けとしては残してほしいと考えることがある(選択内容)。その場合、ユーザはあらかじめカメラの設定画面でピントを重視する選択をしておくことで、所望の仕分け結果を得られるようにすることが可能である。一方、ピント精度はあまりよくなくても、よい表情を(たとえば笑顔や雰囲気のある表情)を残してほしいと考えるユーザもいるため、そのようなユーザは表情を重視する選択をしておくことで、所望の仕分け結果を得られるようにすることが可能となる。続くステップS807以降の処理でそのことを示している。
【0075】
ステップS807では、システム制御部50は、ステップS804と同様に、ステップS806で判断の対象とした画像を、「残す画像」として仕分ける。そして、例えば送信予約タグをつけておくなど、自動バックアップ予約する画像扱いにしておく。
【0076】
ステップS808では、システム制御部50は、ステップS802と同様に、ステップS806で判断の対象とした画像を、「残さない画像」として仕分ける。そして、例えばカメラ100においてゴミ箱フォルダに移動する、または強制的に消去するといった処理を別途行う。
【0077】
ステップS809では、システム制御部50は、ステップS806と同様の処理を行う。図9の場合、このステップS809の判定処理に流れてくる画像は、画像Bと画像Dである。システム制御部50は、ピント重視であると判断した場合は、処理をステップS810へ進め、そうではないと判断した場合は、処理をステップS811へ進める。
【0078】
ステップS810では、システム制御部50は、ステップS802と同様に、ステップS809で判断の対象とした画像を、「残さない画像」として仕分ける。そして、例えばカメラ100においてゴミ箱フォルダに移動する、または強制的に消去するといった処理を別途行う。
【0079】
ステップS811では、システム制御部50は、ステップS804と同様に、ステップS809で判断の対象とした画像を、「残す画像」として仕分ける。そして、例えば送信予約タグをつけておくなど、自動バックアップ予約する画像扱いにしておく。
【0080】
ステップS805以降についてまとめると、画像Aは、ピントを重視するユーザは残してほしいと考えるが、表情を重視するユーザは残さないでほしいと考える可能性がある。そのため、ステップS807、ステップS808の処理を行うことが効率的である。なお、画像B、画像Dの場合も同様である。
【0081】
このように仕分け処理を行うことにより、不要な画像を除外しつつ、意図した画像を残すことが可能となり、バックアップデータ容量を増やさないで済むといった効果を得ることが可能となる。
【0082】
なお、前述のステップS605とステップS606~ステップS609の処理の順番を逆にし、ステップS609で行って算出したスコアが所定閾値以上の場合に、ステップS605の処理を行うようにしてもよい。画像を送るのが先か、カメラ100内でのベストショット判定が先かについては、撮影した画像をいち早く解析したい場合は、ステップS605を先に行うほうがよい。一方、即時性よりも必要なものだけを解析したい(情報処理装置200で処理する場合は通信料が発生する可能性があり費用を抑えたい)場合はステップS605の処理を後回しにするのが効果的である。その場合は、先にカメラ100内のスコアを判定し、所定閾値以上のスコア値の画像を情報処理装置200に送信し、その後の情報処理装置200側のスコアと組み合わせて残す残さないを導きだすようにすればよい。
【0083】
このようにすることで、撮影直後に不要な画像を除外しつつ、意図した画像を残すことが可能となり、バックアップデータ容量を増やさないで済むといった効果を得ることが可能となる。
【0084】
(他の実施形態)
また本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読み出し実行する処理でも実現できる。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現できる。
【0085】
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
【符号の説明】
【0086】
100:カメラ、104:ネットワーク、105:画像管理サーバー、106:ベストショット推定サーバー
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10