(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-08-22
(45)【発行日】2022-08-30
(54)【発明の名称】画像処理装置、画像処理方法及びプログラム、撮影装置
(51)【国際特許分類】
H04N 5/232 20060101AFI20220823BHJP
G03B 17/18 20210101ALI20220823BHJP
【FI】
H04N5/232 930
H04N5/232 220
G03B17/18 Z
(21)【出願番号】P 2021509378
(86)(22)【出願日】2020-03-23
(86)【国際出願番号】 JP2020012668
(87)【国際公開番号】W WO2020196384
(87)【国際公開日】2020-10-01
【審査請求日】2021-10-20
(31)【優先権主張番号】P 2019056587
(32)【優先日】2019-03-25
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】306037311
【氏名又は名称】富士フイルム株式会社
(74)【代理人】
【識別番号】100083116
【氏名又は名称】松浦 憲三
(74)【代理人】
【識別番号】100170069
【氏名又は名称】大原 一樹
(74)【代理人】
【識別番号】100128635
【氏名又は名称】松村 潔
(74)【代理人】
【識別番号】100140992
【氏名又は名称】松浦 憲政
(72)【発明者】
【氏名】板垣 和幸
(72)【発明者】
【氏名】狩野 喬俊
【審査官】大濱 宏之
(56)【参考文献】
【文献】特開2010-103651(JP,A)
【文献】特開2007-266793(JP,A)
【文献】特開2009-89077(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 5/232
G03B 17/18
(57)【特許請求の範囲】
【請求項1】
撮影部によって撮影された時系列の画像群を取得する画像取得部と、
前記画像群のうちの少なくとも1つの画像から文字又は文字列を選択する文字選択部と、
前記画像群から前記文字又は文字列を配置する対象画像を選択する画像選択部と、
前記文字又は文字列の意味に応じて前記対象画像の画像内における前記文字又は文字列のレイアウトを決定するレイアウト決定部と、
前記撮影部による撮影の際の構図決めをアシストする撮影アシスト情報を生成するアシスト情報生成部と、
前記決定したレイアウトに基づいて前記対象画像に前記撮影アシスト情報を合成する合成部と、
前記合成した画像を表示部に表示させる表示制御部と、
を備える画像処理装置。
【請求項2】
前記画像選択部は、前記画像群を対象画像として選択し、
前記表示制御部は、前記撮影アシスト情報が合成された前記画像群の各画像をライブビュー画像として順次表示させる請求項1に記載の画像処理装置。
【請求項3】
前記画像選択部は、前記画像群のうちの1つの画像を対象画像として選択し、
前記表示制御部は、前記画像群の各画像をライブビュー画像として順次表示させ、さらに前記撮影アシスト情報が合成された対象画像を表示させる請求項1に記載の画像処理装置。
【請求項4】
前記撮影アシスト情報は、前記選択された文字又は文字列を含む請求項1から3のいずれか1項に記載の画像処理装置。
【請求項5】
前記撮影アシスト情報は、前記文字又は文字列の配置位置を示す領域表示を含む請求項1から4のいずれか1項に記載の画像処理装置。
【請求項6】
前記レイアウト決定部は、文字又は文字列毎に画像内で配置すべき位置が特定されたテーブルを備える請求項1から5のいずれか1項に記載の画像処理装置。
【請求項7】
前記画像群のうちの少なくとも1つの画像に含まれるオブジェクトを認識する認識部を備え、
前記文字選択部は、前記認識したオブジェクトに応じた前記文字又は文字列を選択する請求項1から6のいずれか1項に記載の画像処理装置。
【請求項8】
前記画像群のうちの少なくとも1つの画像に含まれるオブジェクト毎のスコアを算出するスコア算出部を備え、
前記認識部は、前記スコアからオブジェクトを認識する請求項7に記載の画像処理装置。
【請求項9】
オブジェクト毎に文字又は文字列の複数の候補を記憶する記憶部を備え、
前記文字選択部は、前記認識したオブジェクトに対応する前記複数の候補から前記文字又は文字列を選択する請求項7又は8に記載の画像処理装置。
【請求項10】
前記文字選択部は、1文字の漢字を選択する請求項1から9のいずれか1項に記載の画像処理装置。
【請求項11】
前記時系列の画像群は、一定時間内に撮影された画像群である、請求項1から10のいずれか1項に記載の画像処理装置。
【請求項12】
請求項1から11のいずれか1項に記載の画像処理装置と、
時系列の画像群を撮影する撮影部と、
画像を表示する表示部と、
を備える撮影装置。
【請求項13】
撮影部によって撮影された時系列の画像群を取得する画像取得工程と、
前記画像群のうちの少なくとも1つの画像から文字又は文字列を選択する文字選択工程と、
前記画像群から前記文字又は文字列を配置する対象画像を選択する画像選択工程と、
前記文字又は文字列の意味に応じて前記対象画像の画像内における前記文字又は文字列のレイアウトを決定するレイアウト決定工程と、
前記撮影部による撮影の際の構図決めをアシストする撮影アシスト情報を生成するアシスト情報生成工程と、
前記決定したレイアウトに基づいて前記対象画像に前記撮影アシスト情報を合成する合成工程と、
前記合成した画像を表示部に表示させる表示制御工程と、
を備える画像処理方法。
【請求項14】
請求項13に記載の画像処理方法をコンピュータに実行させるためのプログラム。
【請求項15】
請求項14に記載のプログラムが記録された非一時的かつコンピュータ読取可能な記録媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は画像処理装置、画像処理方法及びプログラム、撮影装置に係り、特に画像に文字又は文字列を合成する技術に関する。
【背景技術】
【0002】
画像の撮影シーンや被写体に整合する文字等を画像に合成して、ユーザの感性に合った創造的なデザインの画像を得ることが要望されている。
【0003】
特許文献1には、画像データを見た際に人間が生じる感性に対して良好な整合性を有するテキストを画像データから生成し、画像データとテキストとを合成した新たな画像データを生成する装置が開示されている。例えば、対象となる画像データが人物写真であると判断されると、被写体像である人物の笑顔レベルに応じたテキストが生成される。特許文献1に記載の画像データは画像に相当し、テキストは、文字又は文字列に相当する。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に記載の装置は、メモリカード等に記憶されている画像に対して文字又は文字列を合成している。しかしながら、一般的な写真撮影では、関心のある被写体を画角の中央に配置して撮影する場合が多い。このように被写体が中央に配置されて撮影された画像に文字又は文字列を合成しようとすると、レイアウト的なバランスの制約を受けてしまい、文字又は文字列を合成する領域がなかったり、あるいは構図的に満足する文字又は文字列の合成に至らなかったりする場合がある。
【0006】
また、特許文献1に記載の装置では、画像に合成する文字又は文字列の配置位置について考慮されていない。このため、文字又は文字列が適切な位置に配置されない場合がある。例えば、人物写真の人物の笑顔レベルに応じたテキストの配置位置が、人物とは離れた位置や人物の目の位置に配置されると、ユーザにとって好ましい画像とはならない。
【0007】
本発明はこのような事情に鑑みてなされたもので、文字又は文字列を適切な位置にレイアウトした画像の撮影をアシストする画像処理装置、画像処理方法及びプログラム、撮影装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
上記目的を達成するための画像処理装置の一の態様は、撮影部によって撮影された時系列の画像群を取得する画像取得部と、画像群のうちの少なくとも1つの画像から文字又は文字列を選択する文字選択部と、画像群から文字又は文字列を配置する対象画像を選択する画像選択部と、文字又は文字列の意味に応じて対象画像の画像内における文字又は文字列のレイアウトを決定するレイアウト決定部と、撮影部による撮影の際の構図決めをアシストする撮影アシスト情報を生成するアシスト情報生成部と、決定したレイアウトに基づいて対象画像に撮影アシスト情報を合成する合成部と、合成した画像を表示部に表示させる表示制御部と、を備える画像処理装置である。
【0009】
本態様によれば、文字又は文字列の意味に応じて対象画像の画像内における文字又は文字列のレイアウトを決定し、撮影部による撮影の際の構図決めをアシストする撮影アシスト情報を生成し、決定したレイアウトに基づいて対象画像に撮影アシスト情報を合成し、合成した画像を表示部に表示させるようにしたので、文字又は文字列を適切な位置にレイアウトした画像の撮影をアシストすることができる。
【0010】
画像選択部は、画像群を対象画像として選択し、表示制御部は、撮影アシスト情報が合成された画像群の各画像をライブビュー画像として順次表示させることが好ましい。これにより、文字又は文字列が合成されたライブビュー画像によって撮影をアシストすることができる。
【0011】
画像選択部は、画像群のうちの1つの画像を対象画像として選択し、表示制御部は、画像群の各画像をライブビュー画像として順次表示させ、さらに撮影アシスト情報が合成された対象画像を表示させることが好ましい。これにより、ライブビュー画像と共に表示される画像によって撮影をアシストすることができる。
【0012】
撮影アシスト情報は、選択された文字又は文字列を含むことが好ましい。これにより、撮影を適切にアシストすることができる。
【0013】
撮影アシスト情報は、文字又は文字列の配置位置を示す領域表示を含むことが好ましい。これにより、撮影を適切にアシストすることができる。
【0014】
レイアウト決定部は、文字又は文字列毎に画像内で配置すべき位置が特定されたテーブルを備えることが好ましい。これにより、レイアウトを適切に決定することができる。
【0015】
画像群のうちの少なくとも1つの画像に含まれるオブジェクトを認識する認識部を備え、文字選択部は、認識したオブジェクトに応じた文字又は文字列を選択することが好ましい。これにより、画像に含まれるオブジェクトに応じた文字又は文字列を合成することができる。
【0016】
画像群のうちの少なくとも1つの画像に含まれるオブジェクト毎のスコアを算出するスコア算出部を備え、認識部は、スコアからオブジェクトを認識することが好ましい。これにより、オブジェクトを適切に認識することができる。
【0017】
オブジェクト毎に文字又は文字列の複数の候補を記憶する記憶部を備え、文字選択部は、認識したオブジェクトに対応する複数の候補から文字又は文字列を選択することが好ましい。これにより、文字又は文字列を適切に選択することができる。
【0018】
文字選択部は、1文字の漢字を選択することが好ましい。これにより、1文字の漢字を画像に合成することができる。
【0019】
時系列の画像群は、一定時間内に撮影された画像群であってもよい。
【0020】
上記目的を達成するための撮影装置の一の態様は、上記に記載の画像処理装置と、時系列の画像群を撮影する撮影部と、画像を表示する表示部と、を備える撮影装置である。
【0021】
本態様によれば、文字又は文字列の意味に応じて対象画像の画像内における文字又は文字列のレイアウトを決定し、撮影部による撮影の際の構図決めをアシストする撮影アシスト情報を生成し、決定したレイアウトに基づいて対象画像に撮影アシスト情報を合成し、合成した画像を表示部に表示させるようにしたので、文字又は文字列を適切な位置にレイアウトした画像の撮影をアシストすることができる。
【0022】
上記目的を達成するための画像処理方法の一の態様は、撮影部によって撮影された時系列の画像群を取得する画像取得工程と、画像群のうちの少なくとも1つの画像から文字又は文字列を選択する文字選択工程と、画像群から文字又は文字列を配置する対象画像を選択する画像選択工程と、文字又は文字列の意味に応じて対象画像の画像内における文字又は文字列のレイアウトを決定するレイアウト決定工程と、撮影部による撮影の際の構図決めをアシストする撮影アシスト情報を生成するアシスト情報生成工程と、決定したレイアウトに基づいて対象画像に撮影アシスト情報を合成する合成工程と、合成した画像を表示部に表示させる表示制御工程と、を備える画像処理方法である。
【0023】
本態様によれば、文字又は文字列の意味に応じて対象画像の画像内における文字又は文字列のレイアウトを決定し、撮影部による撮影の際の構図決めをアシストする撮影アシスト情報を生成し、決定したレイアウトに基づいて対象画像に撮影アシスト情報を合成し、合成した画像を表示部に表示させるようにしたので、文字又は文字列を適切な位置にレイアウトした画像の撮影をアシストすることができる。上記の画像処理方法をコンピュータに実行させるためのプログラムも本態様に含まれる。
【発明の効果】
【0024】
本発明によれば、文字又は文字列を適切な位置にレイアウトした画像の撮影をアシストすることができる。
【図面の簡単な説明】
【0025】
【
図1】
図1は、スマートフォン10の正面斜視図である。
【
図2】
図2は、スマートフォン10の背面斜視図である。
【
図3】
図3は、スマートフォン10の電気的構成を示すブロック図である。
【
図4】
図4は、カメラ20の内部構成を示すブロック図である。
【
図5】
図5は、画像処理装置100の機能構成の一例を示すブロック図である。
【
図6】
図6は、画像処理方法の各処理を示すフローチャートである。
【
図7】
図7は、スコア算出部106によるスコアの算出の一例を説明するための図である。
【
図8】
図8は、スコア算出部106によるスコアの算出の一例を説明するための図である。
【
図9】
図9は、候補記憶部110に記憶された認識ラベルに対応する漢字候補の対応表の一例を示す図である。
【
図11】
図11は、合成画像GS1がタッチパネルディスプレイ14に表示されたスマートフォン10の一例を示す図である。
【
図12】
図12は、合成画像GS2がタッチパネルディスプレイ14に表示されたスマートフォン10の一例を示す図である。
【
図13】
図13は、合成画像GS3及び合成画像GS4の一例を示す図である。
【
図14】
図14は、デジタルカメラ130の正面斜視図である。
【
図15】
図15は、デジタルカメラ130の背面斜視図である。
【発明を実施するための形態】
【0026】
以下、添付図面に従って本発明の好ましい実施形態について詳説する。
【0027】
<携帯端末装置>
本実施形態に係る画像処理装置は、例えば撮影装置に搭載される。撮影装置の一実施形態である携帯端末装置は、例えば携帯電話機、PHS(Personal Handyphone System)、スマートフォン、PDA(Personal Digital Assistant)、タブレット型コンピュータ端末、ノート型パーソナルコンピュータ端末、及び携帯型ゲーム機である。以下、スマートフォンを例に挙げ、図面を参照しつつ、詳細に説明する。
【0028】
〔スマートフォンの外観〕
図1は、本実施形態に係るスマートフォン10の正面斜視図である。
図1に示すように、スマートフォン10は、平板状の筐体12を有する。スマートフォン10は、筐体12の正面にタッチパネルディスプレイ14、スピーカ16、マイクロフォン18、及びカメラ20を備えている。
【0029】
タッチパネルディスプレイ14は、画像等を表示するカラーLCD(Liquid Crystal Display)パネル等のディスプレイ部(表示部の一例)、及びディスプレイ部の前面に配置され、タッチ入力を受け付ける透明電極等のタッチパネル部を備える。
【0030】
タッチパネル部は、光透過性を有する基板本体、基板本体の上に面状に設けられ、光透過性を有する位置検出用電極、及び位置検出用電極上に設けられた絶縁層を有する静電容量式タッチパネルである。タッチパネル部は、ユーザのタッチ操作に対応した2次元の位置座標情報を生成して出力する。
【0031】
スピーカ16は、音声を出力する音声出力部である。マイクロフォン18は、音声が入力される音声入力部である。カメラ20は、動画及び静止画を撮影する撮影部である。
【0032】
図2は、スマートフォン10の背面斜視図である。
図2に示すように、スマートフォン10は、筐体12の背面にカメラ22を備えている。カメラ22は、動画及び静止画を撮影する撮影部である。
【0033】
さらに、
図1及び
図2に示すように、スマートフォン10は、筐体12の正面及び側面に、それぞれスイッチ26を備えている。スイッチ26は、ユーザからの指示を受け付ける入力部である。スイッチ26は、指等で押下されるとオンとなり、指を離すとバネ等の復元力によってオフ状態となる押しボタン式のスイッチである。
【0034】
なお、筐体12の構成はこれに限定されず、折り畳み構造又はスライド機構を有する構成を採用してもよい。
【0035】
〔スマートフォンの電気的構成〕
図3は、スマートフォン10の電気的構成を示すブロック図である。
図3に示すように、スマートフォン10は、前述のタッチパネルディスプレイ14、スピーカ16、マイクロフォン18、カメラ20、カメラ22、及びスイッチ26の他、CPU(Central Processing Unit)28、無線通信部30、通話部32、記憶部34、外部入出力部40、GPS(Global Positioning System)受信部42、及び電源部44を備える。また、スマートフォン10の主たる機能として、基地局装置と移動通信網とを介した移動無線通信を行う無線通信機能を備える。
【0036】
CPU28は、記憶部34が記憶する制御プログラム及び制御データに従って動作し、スマートフォン10の各部を統括して制御する。CPU28は、無線通信部30を通じて音声通信及びデータ通信を行うために、通信系の各部を制御する移動通信制御機能と、アプリケーション処理機能を備える。
【0037】
また、CPU28は、動画、静止画、及び文字等をタッチパネルディスプレイ14に表示する画像処理機能を備える。この画像処理機能により、静止画、動画、及び文字等の情報が視覚的にユーザに伝達される。また、CPU28は、タッチパネルディスプレイ14のタッチパネル部からユーザのタッチ操作に対応した2次元の位置座標情報を取得する。さらに、CPU28は、スイッチ26からの入力信号を取得する。
【0038】
CPU28のハードウェア的な構造は、次に示すような各種のプロセッサ(processor)である。各種のプロセッサには、ソフトウェア(プログラム)を実行して各種の機能部として作用する汎用的なプロセッサであるCPU(Central Processing Unit)、画像処理に特化したプロセッサであるGPU(Graphics Processing Unit)、FPGA(Field Programmable Gate Array)等の製造後に回路構成を変更可能なプロセッサであるPLD(Programmable Logic Device)、ASIC(Application Specific Integrated Circuit)等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が含まれる。
【0039】
1つの処理部は、これら各種のプロセッサのうちの1つで構成されていてもよいし、同種又は異種の2つ以上のプロセッサ(例えば、複数のFPGA、又はCPUとFPGAの組み合わせ、あるいはCPUとGPUの組み合わせ)で構成されてもよい。また、複数の機能部を1つのプロセッサで構成してもよい。複数の機能部を1つのプロセッサで構成する例としては、第1に、クライアント又はサーバ等のコンピュータに代表されるように、1つ以上のCPUとソフトウェアの組合せで1つのプロセッサを構成し、このプロセッサが複数の機能部として作用させる形態がある。第2に、SoC(System On Chip)等に代表されるように、複数の機能部を含むシステム全体の機能を1つのIC(Integrated Circuit)チップで実現するプロセッサを使用する形態がある。このように、各種の機能部は、ハードウェア的な構造として、上記各種のプロセッサを1つ以上用いて構成される。
【0040】
さらに、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子等の回路素子を組み合わせた電気回路(circuitry)である。
【0041】
カメラ20及びカメラ22は、CPU28の指示に従って、動画及び静止画を撮影する。
図4は、カメラ20の内部構成を示すブロック図である。なお、カメラ22の内部構成は、カメラ20と共通している。
図4に示すように、カメラ20は、撮影レンズ50、絞り52、撮像素子54、AFE(Analog Front End)56、A/D(Analog to Digital)変換器58、及びレンズ駆動部60を備える。
【0042】
撮影レンズ50は、ズームレンズ50Z及びフォーカスレンズ50Fから構成される。レンズ駆動部60は、CPU28からの指令に応じて、ズームレンズ50Z及びフォーカスレンズ50Fを進退駆動してズーム(光学ズーム)調整及びフォーカス調整を行う。また、レンズ駆動部60は、CPU28からの指令に応じて絞り52を制御し、露出を調整する。ズームレンズ50Z及びフォーカスレンズ50Fの位置、絞り52の開放度等の情報は、CPU28に入力される。
【0043】
撮像素子54は、多数の受光素子がマトリクス状に配列された受光面を備える。ズームレンズ50Z、フォーカスレンズ50F、及び絞り52を透過した被写体光は、撮像素子54の受光面上に結像される。撮像素子54の受光面上には、R(赤)、G(緑)、又はB(青)のカラーフィルタが設けられている。撮像素子54の各受光素子は、受光面上に結像された被写体光をR、G、及びBの各色の信号に基づいて電気信号に変換する。これにより、撮像素子54は被写体のカラー画像を取得する。撮像素子54としては、CMOS(Complementary Metal-Oxide Semiconductor)、CCD(Charge-Coupled Device)等の光電変換素子を用いることができる。
【0044】
AFE56は、撮像素子54から出力されるアナログ画像信号のノイズ除去、及び増幅等を行う。A/D変換器58は、AFE56から入力されるアナログ画像信号を階調幅があるデジタル画像信号に変換する。なお、撮像素子54への入射光の露光時間を制御するシャッターは、電子シャッターが用いられる。電子シャッターの場合、CPU28によって撮像素子54の電荷蓄積期間を制御することで、露光時間(シャッタースピード)を調節することができる。
【0045】
カメラ20は、撮影した動画及び静止画の画像データをMPEG(Moving Picture Experts Group)又はJPEG(Joint Photographic Experts Group)等の圧縮した画像データに変換してもよい。
【0046】
図3の説明に戻り、CPU28は、カメラ20及びカメラ22が撮影した動画及び静止画を記憶部34に記憶させる。また、CPU28は、カメラ20及びカメラ22が撮影した動画及び静止画を無線通信部30又は外部入出力部40を通じてスマートフォン10の外部に出力してもよい。
【0047】
さらに、CPU28は、カメラ20及びカメラ22が撮影した動画及び静止画をタッチパネルディスプレイ14に表示する。CPU28は、カメラ20及びカメラ22が撮影した動画及び静止画をアプリケーションソフトウェア内で利用してもよい。
【0048】
無線通信部30は、CPU28の指示に従って、移動通信網に収容された基地局装置に対し無線通信を行う。スマートフォン10は、この無線通信を使用して、音声データ及び画像データ等の各種ファイルデータ、電子メールデータ等の送受信、Web(World Wide Webの略称)データ及びストリーミングデータ等の受信を行う。
【0049】
通話部32は、スピーカ16及びマイクロフォン18が接続される。通話部32は、無線通信部30により受信された音声データを復号してスピーカ16から出力する。通話部32は、マイクロフォン18を通じて入力されたユーザの音声をCPU28が処理可能な音声データに変換してCPU28に出力する。
【0050】
記憶部34は、スマートフォン10に内蔵される内部記憶部36、及びスマートフォン10に着脱自在な外部記憶部38により構成される。内部記憶部36及び外部記憶部38は、公知の格納媒体を用いて実現される。
【0051】
記憶部34は、CPU28の制御プログラム、制御データ、アプリケーションソフトウェア、通信相手の名称及び電話番号等が対応付けられたアドレスデータ、送受信した電子メールのデータ、WebブラウジングによりダウンロードしたWebデータ、及びダウンロードしたコンテンツデータ等を記憶する。また、記憶部34は、ストリーミングデータ等を一時的に記憶してもよい。
【0052】
外部入出力部40は、スマートフォン10に連結される外部機器とのインターフェースの役割を果たす。スマートフォン10は、外部入出力部40を介して通信等により直接的又は間接的に他の外部機器に接続される。外部入出力部40は、外部機器から受信したデータをスマートフォン10の内部の各構成要素に伝達し、かつスマートフォン10の内部のデータを外部機器に送信する。
【0053】
通信等の手段は、例えばユニバーサルシリアルバス(USB:Universal Serial Bus)、IEEE(Institute of Electrical and Electronics Engineers)1394、インターネット、無線LAN(Local Area Network)、Bluetooth(登録商標)、RFID(Radio Frequency Identification)、及び赤外線通信である。また、外部機器は、例えばヘッドセット、外部充電器、データポート、オーディオ機器、ビデオ機器、スマートフォン、PDA、パーソナルコンピュータ、及びイヤホンである。
【0054】
GPS受信部42は、GPS衛星ST1,ST2,…,STnからの測位情報に基づいて、スマートフォン10の位置を検出する。
【0055】
電源部44は、不図示の電源回路を介してスマートフォン10の各部に電力を供給する電力供給源である。電源部44は、リチウムイオン二次電池を含む。電源部44は、外部のAC電源からDC電圧を生成するA/D変換部を含んでもよい。
【0056】
このように構成されたスマートフォン10は、タッチパネルディスプレイ14等を用いたユーザからの指示入力により撮影モードに設定され、カメラ20及びカメラ22によって動画及び静止画を撮影することができる。
【0057】
スマートフォン10が撮影モードに設定されると、撮影スタンバイ状態となり、カメラ20又はカメラ22によって動画が撮影され、撮影された動画がライブビュー画像としてタッチパネルディスプレイ14に表示される。
【0058】
ユーザは、タッチパネルディスプレイ14に表示されるライブビュー画像を視認して、構図を決定したり、撮影したい被写体を確認したり、撮影条件を設定したりすることができる。
【0059】
スマートフォン10は、撮影スタンバイ状態においてタッチパネルディスプレイ14等を用いたユーザからの指示入力により撮影が指示されると、AF(Autofocus)及びAE(Auto Exposure)制御を行い、動画又は静止画の撮影及び記憶を行う。
【0060】
<画像処理装置>
本実施形態に係る画像処理装置は、文字又は文字列を適切な位置にレイアウトした画像の撮影をアシストする。
図5は、画像処理装置100の機能構成の一例を示すブロック図である。画像処理装置100は、画像取得部102、認識部104、文字選択部108、画像選択部112、レイアウト決定部114、合成部118、表示制御部120、記憶制御部122、及びアシスト情報生成部124を備える。画像処理装置100は、スマートフォン10に搭載される。画像処理装置100は、例えばCPU28によって実現される。
【0061】
画像取得部102は、時系列の画像群を取得する。例えば、画像取得部102は、カメラ20から出力される一定のフレームレートで撮影された画像群(動画)を取得する。画像取得部102は、記憶部34に記憶された画像群を読み出すことで、時系列の画像群を取得してもよいし、無線通信部30又は外部入出力部40を介して時系列の画像群を取得してもよい。
【0062】
認識部104は、画像取得部102が取得した画像群に含まれるオブジェクトを認識する。オブジェクトの例としては、生物(人、魚、犬等)、飲食物(鮨、肉、麺等)、建造物(塔、寺、ビル等)、自然(空、山、木等)があるが、これらに限定されず、スマートフォン10で撮影可能なオブジェクトであれば何でもよい。
【0063】
認識部104は、スコア算出部106を備えている。スコア算出部106は、画像群に含まれるオブジェクト毎のスコアを算出する。スコア算出部106は、画像群の各画像の特徴量を算出し、画像内のオブジェクトの認識処理を行う畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)を含む。CNNは、オブジェクト毎にオブジェクトが含まれる確率が高いほど相対的に高い値となるスコアを算出する。認識部104は、スコア算出部106が算出したスコアが最も高いオブジェクトを、画像群に含まれるオブジェクトとして認識する。
【0064】
なお、認識部104は、画像群の各画像のオブジェクトの輪郭情報及び色情報等の特徴量を算出し、算出された特徴量を用いて画像内のオブジェクトを認識してもよい。また、オブジェクト毎に予め優先順位を付与しておき、認識部104は、認識された複数のオブジェクトのうち最も優先順位の高いオブジェクトを画像群に含まれるオブジェクトとして認識してもよい。
【0065】
文字選択部108は、画像取得部102が取得した画像群のうち少なくとも1つの画像から文字又は文字列を選択する。文字選択部108は、認識部104が認識したオブジェクトに対応する漢字を含む文字又は文字列を選択してもよい。漢字とは、日本語、中国語、及び朝鮮語の記述に使用される表語文字である。
【0066】
文字選択部108は、候補記憶部110を備える。候補記憶部110は、オブジェクト毎にオブジェクトに対応する文字又は文字列の複数の候補が記憶されている。文字選択部108は、候補記憶部110に記憶された候補のうち、認識部104が認識したオブジェクトに対応する複数の候補から1つの文字又は文字列を選択する。なお、候補記憶部110は、記憶部34(
図3参照)が備えていてもよい。
【0067】
なお、文字選択部108として、入力された画像又は画像群の各画像の特徴量を算出し、入力された画像又は画像群を象徴する文字又は文字列の選択処理を行うCNNを用いてもよい。
【0068】
画像選択部112は、画像取得部102が取得した画像群から文字又は文字列を配置する対象画像を選択する。画像選択部112は、認識部104が認識したオブジェクトのスコアが相対的に高い画像を対象画像として選択してもよい。
【0069】
レイアウト決定部114は、画像選択部112が選択した対象画像の画像内における文字又は文字列のレイアウトを決定する。レイアウト決定部114は、文字又は文字列の意味に応じてレイアウトを決定する。意味に応じたレイアウトとは、例えば画像内のオブジェクトを象徴する文字又は文字列であれば、そのオブジェクトの近傍の位置、又はそのオブジェクトに重畳する位置に配置するレイアウトである。
【0070】
レイアウト決定部114は、テーブル記憶部116を備える。テーブル記憶部116には、文字又は文字列毎に画像内で配置すべき位置が特定されたテーブルが記憶されている。即ち、テーブル記憶部116に記憶されたテーブルには、文字又は文字列毎に、文字又は文字列の意味に応じた配置位置が対応付けられている。レイアウト決定部114は、テーブル記憶部116から、文字選択部108が選択した文字又は文字列に対応する配置位置をテーブル記憶部116から読み出し、対象画像における読み出した配置位置に文字又は文字列を配置するレイアウトに決定する。なお、テーブル記憶部116は、記憶部34(
図3参照)が備えていてもよい。
【0071】
合成部118は、レイアウト決定部114が決定したレイアウトに基づいて対象画像に文字又は文字列を合成した合成画像を生成する。
【0072】
表示制御部120は、合成部118が合成した合成画像をタッチパネルディスプレイ14に表示させる。また、記憶制御部122は、合成部118が合成した合成画像を記憶部34に記憶させる。記憶制御部122は、合成画像に代えて、又は合成画像と共に、画像選択部112が選択した対象画像、文字選択部108が選択した文字又は文字列、及びレイアウト決定部114が決定したレイアウトの情報を関連付けて記憶部34に記憶させてもよい。
【0073】
アシスト情報生成部124は、撮影アシスト情報を生成する。撮影アシスト情報は、ユーザが文字又は文字列を合成する画像を撮影する際の構図決めをアシスト(補助)するための情報である。
【0074】
撮影アシスト情報は、例えば、文字選択部108によって選択された文字又は文字列を含む情報である。また、撮影アシスト情報は、文字選択部108によって選択された文字又は文字列の配置位置を示す領域表示を含む情報であってもよい。
【0075】
合成部118は、レイアウト決定部114が決定したレイアウトに基づいて、画像選択部112が選択した対象画像にアシスト情報生成部124が生成したアシスト情報を合成する。表示制御部120は、対象画像にアシスト情報が合成された合成画像をタッチパネルディスプレイ14に表示させる。
【0076】
〔画像処理方法〕
画像処理装置100を用いた画像処理方法について説明する。スマートフォン10は、タッチパネルディスプレイ14等を用いたユーザからの指示入力により、CPU28が記憶部34に記憶されている画像処理プログラムを読み出し、画像処理プログラムを実行する。これにより、画像処理方法が実施される。本実施形態に係る画像処理方法は、文字又は文字列を適切な位置にレイアウトした画像の撮影をアシストする。
【0077】
図6は、本実施形態に係る画像処理方法の各処理を示すフローチャートである。画像処理方法は、画像取得工程(ステップS1)、文字選択工程(ステップS2)、画像選択工程(ステップS3)、レイアウト決定工程(ステップS4)、アシスト情報生成工程(ステップS5)、合成工程(ステップS6)、撮影アシスト工程(ステップS7)、及び静止画撮影工程(ステップS8)を含む。
【0078】
ステップS1では、画像取得部102は、時系列の画像群を取得する。ここでは、ユーザがカメラ22の撮影スタンバイ状態においてライブビュー画像を撮影しているものとする。したがって、タッチパネルディスプレイ14には、ユーザが撮影したライブビュー画像が表示されている。画像取得部102は、カメラ22から出力される一定のフレームレートで撮影されたライブビュー画像用の動画を取得する。
【0079】
なお、画像取得部102は、時系列の画像群として、ライブビュー画像用の動画を構成する全ての画像からなる画像群を取得するのではなく、最新の一定時間内に撮影された画像群を取得してもよいし、ライブビュー画像のフレームレートよりも粗くサンプリングした画像群を取得してもよい。また、画像取得部102は、一定時間内に撮影された画像群を時系列の画像群として取得してもよい。一定時間内に撮影された画像群とは、例えば、画像に付された日付データが一定時間内に含まれる複数の画像からなる画像群や、画像に付された日付データが連続する複数の画像からなる画像群であってもよい。更に、画像取得部102は、記憶部34から読み出した時系列の画像群を取得してもよいし、外部のサーバから無線通信部30又は外部入出力部40を介して時系列の画像群を取得してもよい。
【0080】
ステップS2では、文字選択部108は、ステップS1で取得した画像群から文字又は文字列を選択する。ここでは、文字選択部108は、認識部104が認識したオブジェクトに応じた漢字であって、日本語で使用される1文字の(単一の)漢字を選択する。
【0081】
このために、スコア算出部106は、ステップS1で取得した画像群に含まれるオブジェクト毎のスコアを算出する。スコア算出部106が算出するスコアは、確信度又は信頼度ともいい、オブジェクトが含まれる可能性が高いほど大きい値となる。
【0082】
図7は、スコア算出部106によるスコアの算出の一例を説明するための図である。
図7に示すF7Aは、ライブビュー画像の撮影のうちのあるタイミングの被写体Sとカメラ22の画角Aとを示している。被写体Sは、神社の鳥居、鳥居の奥の本殿、及び4人の人物である。画角Aは、破線の矩形の内側の領域である。
【0083】
図7に示すF7Bは、F7Aのタイミングで撮影された画像がタッチパネルディスプレイ14に表示されたスマートフォン10を示している。また、
図7に示すF7Cは、F7Aのタイミングで撮影された画像の認識結果の認識ラベルと、認識結果のスコアとのペアを示している。
【0084】
F7A及びF7Bに示すように、F7Aのタイミングで撮影された画像には、被写体Sのうち鳥居の上部が画角Aに含まれていない。また、奥の本殿は隠れずに画角Aに含まれている。したがって、このタイミングで撮影される画像は、鳥居が含まれないことにより、神社を示す認識ラベル「shrine」のスコアが相対的に小さい値となる。また、鳥居のない神社仏閣の建造物が含まれることにより、寺を示す認識ラベル「temple」のスコアが相対的に大きい値となる。
【0085】
ここでは、スコア算出部106は、F7Cに示すように、認識ラベル「temple」のスコアを「0.7」、認識ラベル「shrine」のスコアを「0.3」と算出している。なお、スコア算出部106が算出する各オブジェクトのスコアは、合計で1となる。
【0086】
図8は、スコア算出部106によるスコアの算出の他の例を説明するための図である。
図8に示すF8Aは、ライブビュー画像の撮影のうちの
図7とは異なるタイミングの被写体Sとカメラ22の画角Aとを示している。被写体Sは、神社の鳥居、鳥居の奥の本殿、及び4人の人物であるが、
図7Aに示すタイミングとは人物の配置が異なっている。
【0087】
図8に示すF8Bは、F8Aのタイミングで撮影された画像がタッチパネルディスプレイ14に表示されたスマートフォン10を示している。また、
図8に示すF8Cは、F8Aのタイミングで撮影された画像の認識結果の認識ラベルと、認識結果のスコアとのペアを示している。
【0088】
F8A及びF8Bに示すように、F8Aのタイミングで撮影された画像には、被写体Sの鳥居の大部分が含まれている。また、被写体Sのうち奥の本殿が人物によって隠れているために含まれていない。したがって、このタイミングで撮影される画像は、鳥居が含まれることにより、神社を示す認識ラベル「shrine」のスコアが相対的に大きい値となる。また、神社仏閣の建造物が含まれないことにより、寺を示す認識ラベル「temple」のスコアが相対的に小さい値となる。
【0089】
ここでは、スコア算出部106は、F8Cに示すように、認識ラベル「temple」のスコアを「0.1」、認識ラベル「shrine」のスコアを「0.8」と算出している。
【0090】
認識部104は、ステップS1で取得した画像群の各画像に対してスコア算出部106がそれぞれ算出したオブジェクト毎のスコアから、画像群のオブジェクトに対する最終的な認識ラベルを導き出す。スコア算出部106は、画像群の各画像のオブジェクト毎のスコアを算出し、認識部104は、オブジェクト毎のスコアの各画像の平均又は総和から画像群に含まれるオブジェクトを認識してもよい。ここでは、認識部104は、スコアの各画像の平均が最も大きい認識ラベル「shrine」がオブジェクトとして最もふさわしいと判断したものとする。
【0091】
次に、文字選択部108は、候補記憶部110に記憶された候補のうち、認識部104が認識したオブジェクトに対応する複数の候補から1つの文字又は文字列を選択する。即ち、認識ラベル「shrine」に対応する複数の候補から1つの漢字を選択する。
【0092】
図9は、候補記憶部110に記憶された認識ラベルに対応する漢字候補の対応表の一例を示す図である。候補記憶部110には、認識結果ラベル毎に漢字候補が推奨順位の高い順に記憶されている。
図9に示すように、認識ラベル「temple」の漢字候補として、「寺」、「仏」、「院」、「堂」、「聖」、…等の漢字が対応して記憶されている。また、認識ラベル「shrine」の漢字候補として、「神」、「社」、「宮」、「聖」、「祠」、…等の漢字が対応して記憶されている。
【0093】
ここでは、認識ラベルが「shrine」であるので、文字選択部108は、「神」、「社」、「宮」、「聖」、「祠」、…等の候補から1つの漢字を選択する。ここでは、文字選択部108は、推奨順位が最も高い先頭の「神」を選択したものとする。なお、文字選択部108は、画数の多い漢字を選択する態様、画数の少ない漢字を選択する態様、漢字の左右対称性を優先して選択する態様を採用してもよい。
【0094】
ここでは、文字選択部108が時系列の画像群から文字又は文字列を選択する例を説明したが、1つの画像から文字又は文字列を選択してもよい。この場合、例えば撮影されたライブビュー画像用の動画のうち最も新しいフレームの画像から判断してもよい。
【0095】
また、認識部104は、ステップS1で取得した画像群から複数の認識ラベルがオブジェクトとしてふさわしいと判断してもよい。例えば、スコアの各画像の平均が最も大きい認識ラベルのスコアの平均に対して、2番目に大きい認識ラベルのスコアの平均が近い場合に、双方の認識ラベルをオブジェクトとして最もふさわしいと判断してもよい。認識部104は、スコアの各画像の平均の差分が所定の閾値以内である場合に、平均が近いと判断することができる。スコアの各画像の平均の差分が所定の閾値以内であれば、スコアの平均が3番目以降に大きい認識ラベルを含めてもよい。ここではスコアの平均が互いに近い場合について説明したが、スコアの総和を用いる場合も同様である。
【0096】
また、文字選択部108は、認識部104によって複数の認識ラベルがオブジェクトとしてふさわしいと判断された場合であっても、1つの漢字を選択する。複数の認識ラベルから1つの漢字を選択する場合、文字選択部108は、複数の認識ラベルについて候補記憶部110にそれぞれ記憶されている漢字のうち、それぞれの認識ラベルが共通に持つ漢字を選択してもよい。
【0097】
例えば、スコア算出部106が算出したスコアの各画像の平均が、最も大きい認識ラベル「shrine」では0.52であり、2番目に大きい認識ラベル「temple」では0.48であり、平均が互いに近いと判断する閾値が0.05であったとする。この場合、認識部104は、認識ラベル「shrine」のスコアの平均と認識ラベル「temple」のスコアの平均とが近いと判断し、「shrine」と「temple」との2つをオブジェクトとしてふさわしい認識ラベルと認識する。
【0098】
これに応じて、文字選択部108は、「shrine」について候補記憶部110が記憶している漢字と「temple」について候補記憶部110が記憶している漢字のうち、2つの認識ラベルが共通に持つ漢字である「聖」を選択する。
【0099】
このように、認識部104が認識したオブジェクトが複数の場合であっても、文字選択部108は、画像群に応じた適切な1文字の漢字を選択することができる。
【0100】
図6の説明に戻り、ステップS3では、画像選択部112は、ステップS1で取得した画像群からステップS2で選択した文字又は文字列を配置する対象画像を選択する。ここでは、画像選択部112は、認識部104が認識したオブジェクトのスコアが最も高い画像(スコアが相対的に高い画像の一例)を対象画像として選択する。この例では、認識部104が認識した最終的な認識ラベルは、「shrine」であった。したがって、画像選択部112は、ステップS1で取得した画像群のうち認識ラベル「shrine」のスコアが最も高い画像を対象画像として選択する。
【0101】
なお、画像選択部112は、人物が多く写っている画像、人物の正面顔が多い画像、手振れが発生していない画像、又は文字を配置しやすい領域(例えば、空等)がある画像を対象画像としてもよい。
【0102】
ステップS4では、レイアウト決定部114は、画像選択部112が選択した対象画像の画像内における文字又は文字列のレイアウトを決定する。ここでは、テーブル記憶部116に記憶されたテーブルに基づいてレイアウトを決定する。レイアウト決定部114は、テーブル記憶部116から、文字選択部108が選択した1文字の漢字「神」に対応する配置すべき位置をテーブル記憶部116から読み出す。「神」を配置すべき位置は、鳥居の笠木の中央部であるとする。
【0103】
配置すべき位置としては、例えば、認識部104が認識したオブジェクトに応じて、人物等のオブジェクトを避ける位置、あるいは、オブジェクトに重ねる位置等であってもよい。
【0104】
また、レイアウト決定部114は、文字又は文字列の配置だけでなく、文字又は文字列の色を決定してもよい。レイアウト決定部114は、対象画像の配置位置上の周辺画素から背景色を調べたり、対象画像全体から代表色を調べたりしてベースとなる基準色を選択し、文字又は文字列を基準色の補色(反対色)として目立たせてもよい。また、レイアウト決定部114は、文字又は文字列を基準色と類似色にして画像になじませてもよいし、文字又は文字列を白として透過度を調整するだけでもよい。
【0105】
レイアウト決定部114は、文字又は文字列のフォントを決定してもよい。フォントとしては、漢字であれば明朝体又は教科書体が好ましい。また、レイアウト決定部114は、影付きにして文字又は文字列を強調させてもよい。
【0106】
レイアウト決定部114は、文字又は文字列、又は文字列を構成する文字の変形を決定してもよい。変形は、大きさ、太さ、傾き、及び縦横比のうち少なくとも1つを含む。また、レイアウト決定部114は、文字の数を決定してもよい。
【0107】
レイアウト決定部114は、色、フォント、変形、及び数を、認識部104が認識したオブジェクトに応じて決定してもよい。また、レイアウト決定部114は、色、フォント、変形、及び数を、文字又は文字列の意味に応じて決定してもよい。この場合、文字又は文字列毎に、文字又は文字列の意味に応じた色、フォント、変形、及び数を対応付けたテーブルをテーブル記憶部116に記憶させてもよい。また、色、フォント、変形、及び数を、撮影前にユーザが選択可能に構成してもよい。
【0108】
ステップS5では、アシスト情報生成部124は、カメラ22による撮影の際の構図決めをアシストする撮影アシスト情報を生成する。ここでは、アシスト情報生成部124は、ステップS2において選択された1文字の漢字である「神」を撮影アシスト情報として生成する。
【0109】
ステップS6では、合成部118は、ステップS4で決定したレイアウトに基づいてステップS3で選択した対象画像にステップS2で選択した文字又は文字列を合成して合成画像を生成する。
図10は、合成部118によって生成された合成画像GS1の一例を示す図である。
図10に示すように、合成画像GS1には、被写体の鳥居の笠木の中央部に重ねて1文字の漢字「神」である撮影アシスト情報C1が配置されている。この1文字の漢字「神」は、境界をぼかした縁取り付き文字に加工されている。
【0110】
ステップS7(表示制御工程の一例)では、表示制御部120は、合成画像をタッチパネルディスプレイ14に表示させる。ここでは、表示制御部120は、ステップS1で取得した画像群の各画像をタッチパネルディスプレイ14の全面にライブビュー画像GLとして順次表示させ、かつ合成画像GS1をライブビュー画像GLの左下部にピクチャーインピクチャーによって表示する。
図11は、合成画像GS1がタッチパネルディスプレイ14に表示されたスマートフォン10の一例を示す図である。
【0111】
スマートフォン10は、撮影アシスト情報C1を含む合成画像GS1をユーザに視認させることで、画像のオブジェクトに整合する文字又は文字列のレイアウトを撮影時に提案し、文字又は文字列を合成した際の仕上がりを撮影前にユーザに確認させ、さらにユーザによる撮影をアシストすることができる。ユーザは、合成画像GS1を視認しながらライブビュー画像GLの構図を調整することができる。
【0112】
その後、ユーザによる静止画撮影指示が入力されると、ステップS8へ移行する。
【0113】
ステップS8では、画像取得部102は、カメラ22によって静止画を取得する。画像選択部112は、取得した静止画を対象画像として選択する。また、合成部118は、この対象画像にステップS4で決定したレイアウトに基づいてステップS2で選択した文字又は文字列を合成して合成画像を生成する。さらに、記憶制御部122は、合成画像を記憶部34に記憶させる。記憶制御部122は、合成画像に代えて、又は合成画像と共に、ステップS8で取得した対象画像、ステップS4で決定したレイアウトの情報、及びステップS2で選択した文字又は文字列を関連付けて記憶部34に記憶させてもよい。
【0114】
表示制御部120は、この合成画像をタッチパネルディスプレイ14に表示させてもよい。
【0115】
ここでは、撮影アシスト情報が合成された合成画像がピクチャーインピクチャーによってライブビュー画像と共に表示される例を説明したが、ライブビュー画像が合成画像であってもよい。
【0116】
この場合、画像取得部102は、ライブビュー画像用の動画を構成する全ての画像からなる画像群を取得する。画像選択部112は、画像取得部102が取得した画像群の各画像を対象画像として選択する。合成部118は、対象画像である画像群の各画像に文字又は文字列を合成して複数の合成画像を生成する。表示制御部120は、複数の合成画像である画像群の各画像をライブビュー画像としてタッチパネルディスプレイ14に順次表示させる。
図12は、撮影アシスト情報C1が合成された合成画像GS2がライブビュー画像としてタッチパネルディスプレイ14に表示されたスマートフォン10の一例を示す図である。ユーザは、合成画像GS2であるライブビュー画像GLの構図を調整することができる。
【0117】
撮影アシスト情報は、文字又は文字列の配置位置を示す領域表示を含む情報でもよい。
図13は、ライブビュー画像である合成画像GS3及び合成画像GS4の一例を示す図である。
【0118】
図13に示す例では、侍姿の男性が被写体である。これに対し、認識部104は、認識ラベル「samurai」がオブジェクトとして最もふさわしいと判断する。文字選択部108は、1文字の漢字である「侍」を選択する。また、レイアウト決定部114は、「侍」の意味に応じて、「侍」の漢字を刀の左側に配置するレイアウトに決定する。
【0119】
図13に示すF13Aでは、合成画像GS3に撮影アシスト情報C2が合成されている。撮影アシスト情報C2は、破線の円であり、破線の円の内側が「侍」の配置位置を示す領域を示している。F13Aでは、破線の円の左側が欠けている。したがって、ユーザは、「侍」を画像内に配置するためにはカメラ22の光軸をさらに左側に向ける必要があることがわかる。
【0120】
図13に示すF13Bでは、合成画像GS4に撮影アシスト情報C3が合成されている。撮影アシスト情報C3は、破線の円及び「侍」の文字である。合成画像GS4の対象画像には「侍」の配置位置の領域の全体が画像に含まれているため、アシスト情報生成部124は、撮影アシスト情報C3として破線の円だけでなく破線の円の内側に「侍」の文字を含ませている。ユーザは、この構図の位置で静止画撮影指示を入力することで、侍姿の男性の画像に「侍」の漢字が合成された合成画像を取得することができる。なお、合成画像には「侍」の配置位置を示す破線の円は合成されない。
【0121】
このように、撮影アシスト情報に文字又は文字列の配置位置を示す領域表示を含めることで、スマートフォン10はカメラ22による撮影の際の構図決めをアシストすることができる。
【0122】
<デジタルカメラ>
本実施形態に係る画像処理装置が搭載される撮影装置は、デジタルカメラであってもよい。デジタルカメラは、レンズを通った光を撮像素子で受け、デジタル信号に変換して動画又は静止画の画像データとして記憶メディアに記憶する撮影装置である。
【0123】
図14は、デジタルカメラ130の正面斜視図である。また、
図15は、デジタルカメラ130の背面斜視図である。
図14に示すように、デジタルカメラ130は、正面に撮影レンズ132、ストロボ134が配設され、上面にはシャッタボタン136、電源/モードスイッチ138、及びモードダイヤル140が配設される。また、
図15に示すように、デジタルカメラ130は、背面にモニタ(LCD)142、ズームボタン144、十字ボタン146、MENU/OKボタン148、再生ボタン150、及びBACKボタン152が配設される。
【0124】
撮影レンズ132は、沈胴式のズームレンズで構成されている。撮影レンズ132は、電源/モードスイッチ138によってカメラの動作モードが撮影モードに設定されると、カメラ本体から繰り出される。ストロボ134は、主要被写体にストロボ光を照射する照明部である。
【0125】
シャッタボタン136は、いわゆる「半押し」と「全押し」とからなる2段ストローク式のスイッチで構成される。シャッタボタン136は、撮影準備指示部、及び画像の撮影指示部として機能する。
【0126】
デジタルカメラ130は、撮影モードとして静止画撮影モード又は動画撮影モードが選択されると、撮影スタンバイ状態になる。撮影スタンバイ状態では動画が撮影され、撮影された動画がライブビュー画像としてモニタ142に表示される。
【0127】
ユーザは、モニタ142に表示されるライブビュー画像を視認して、構図を決定したり、撮影したい被写体を確認したり、撮影条件を設定したりすることができる。
【0128】
デジタルカメラ130は、静止画撮影モードの撮影スタンバイ状態においてシャッタボタン136が「半押し」されると、AF及びAE制御を行う撮影準備動作を行う。また、デジタルカメラ130は、シャッタボタン136が「全押し」されると、静止画の撮影及び記憶を行う。
【0129】
一方、デジタルカメラ130は、動画撮影モードの撮影スタンバイ状態においてシャッタボタン136が「全押し」されると、動画の本撮影(録画)を開始する。また、デジタルカメラ130は、シャッタボタン136が再度「全押し」されると、録画を停止して待機状態になる。
【0130】
電源/モードスイッチ138は、「OFF位置」、「再生位置」、及び「撮影位置」の間をスライド自在に配設されている。デジタルカメラ130は、電源/モードスイッチ138が「OFF位置」に操作されると、電源をOFFにする。また、デジタルカメラ130は、電源/モードスイッチ138が「再生位置」に操作されると、「再生モード」に設定する。さらに、デジタルカメラ130は、電源/モードスイッチ138が「撮影位置」に操作されると、「撮影モード」に設定する。
【0131】
モードダイヤル140は、デジタルカメラ130の撮影モードを設定するモード切替部である。デジタルカメラ130は、モードダイヤル140の設定位置に応じて様々な撮影モードに設定される。例えば、デジタルカメラ130は、モードダイヤル140によって、静止画撮影を行う「静止画撮影モード」、及び動画撮影を行う「動画撮影モード」に設定可能である。
【0132】
モニタ142は、撮影モード時のライブビュー画像の表示、再生モード時の動画及び静止画の表示を行う表示部である。また、モニタ142は、メニュー画面の表示等を行うことでグラフィカルユーザーインターフェースの一部として機能する。
【0133】
ズームボタン144は、ズーム指示部である。ズームボタン144は、望遠側へのズームを指示するテレボタン144T、及び広角側へのズームを指示するワイドボタン144Wを備える。デジタルカメラ130は、撮影モード時にテレボタン144T及びワイドボタン144Wが操作されることにより、撮影レンズ132の焦点距離を望遠側及び広角側に変更する。また、デジタルカメラ130は、再生モード時にテレボタン144T及びワイドボタン144Wが操作されることにより、再生中の画像を拡大及び縮小する。
【0134】
十字ボタン146は、ユーザが上下左右の4方向の指示を入力する操作部である。十字ボタン146は、ユーザがメニュー画面から項目を選択したり、各メニューから各種設定項目の選択を指示したりするカーソル移動操作部として機能する。また、十字ボタン146の左キー及び右キーは、再生モード時にユーザがそれぞれ順方向及び逆方向のコマ送りを行うコマ送り操作部として機能する。
【0135】
MENU/OKボタン148は、モニタ142の画面上にメニューを表示させる指令を行うためのメニューボタンとしての機能と、選択内容の確定及び実行などを指令するOKボタンとしての機能とを兼備した操作部である。
【0136】
再生ボタン150は、記憶された動画又は静止画をモニタ142に表示させる再生モードに切り替えるための操作部である。
【0137】
BACKボタン152は、入力操作のキャンセル又は一つ前の操作状態に戻すことを指示する操作部である。
【0138】
なお、デジタルカメラ130において、ボタン及びスイッチに対して固有の部材を設けるのではなく、タッチパネルを設け、タッチパネルを操作することでボタン/スイッチの機能を実現してもよい。
【0139】
このように構成されたデジタルカメラ130において、内部構成を示すブロック図は、撮影レンズ50に代えて撮影レンズ132とした
図4と同様である。デジタルカメラ130は、
図5に示す画像処理装置を搭載することができる。また、デジタルカメラ130は、画像処理プログラムを実行し、
図6に示す画像処理方法を実施することができる。
【0140】
<その他>
本実施形態に係る画像処理装置は、撮影装置に搭載される態様に限定されず、
図5に示した機能構成を備えていればよい。例えば、撮影機能を有さないパーソナルコンピュータ端末に搭載されてもよい。
【0141】
画像処理方法をコンピュータに実行させる画像処理プログラムは、コンピュータの読取可能な非一時的な記憶媒体に記憶させて提供されてもよい。また、画像処理プログラムは、外部のサーバから無線通信部30又は外部入出力部40を介してダウンロード可能なアプリケーションとして提供されてもよい。この場合、スマートフォン10は、ダウンロードした画像処理プログラムを記憶部34に記憶させる。候補記憶部110及びテーブル記憶部116の内容を、画像処理プログラムに含めてもよい。
【0142】
また、候補記憶部110及びテーブル記憶部116は、外部のサーバに備えられていてもよい。画像処理プログラムの一部の処理をスマートフォン10又はデジタルカメラ130で行い、その他の処理を外部のサーバで行ってもよい。
【0143】
本発明の技術的範囲は、上記の実施形態に記載の範囲には限定されない。各実施形態における構成等は、本発明の趣旨を逸脱しない範囲で、各実施形態間で適宜組み合わせることができる。
【符号の説明】
【0144】
10…スマートフォン
12…筐体
14…タッチパネルディスプレイ
16…スピーカ
18…マイクロフォン
20…カメラ
22…カメラ
26…スイッチ
30…無線通信部
32…通話部
34…記憶部
36…内部記憶部
38…外部記憶部
40…外部入出力部
42…GPS受信部
44…電源部
50…撮影レンズ
50F…フォーカスレンズ
50Z…ズームレンズ
54…撮像素子
58…A/D変換器
60…レンズ駆動部
100…画像処理装置
102…画像取得部
104…認識部
106…スコア算出部
108…文字選択部
110…候補記憶部
112…画像選択部
114…レイアウト決定部
116…テーブル記憶部
118…合成部
120…表示制御部
122…記憶制御部
124…アシスト情報生成部
130…デジタルカメラ
132…撮影レンズ
134…ストロボ
136…シャッタボタン
138…モードスイッチ
140…モードダイヤル
142…モニタ
144…ズームボタン
144T…テレボタン
144W…ワイドボタン
148…MENU/OKボタン
150…再生ボタン
152…BACKボタン
A…画角
C1…撮影アシスト情報
C2…撮影アシスト情報
C3…撮影アシスト情報
GL…ライブビュー画像
GS1…合成画像
GS2…合成画像
GS3…合成画像
GS4…合成画像
S…被写体
S1~S8…画像処理方法の各ステップ