特許6024719 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ カシオ計算機株式会社の特許一覧

特許6024719検出装置、検出方法、及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6024719

(24)【登録日】2016年10月21日

(45)【発行日】2016年11月16日

(54)【発明の名称】検出装置、検出方法、及びプログラム

(51)【国際特許分類】

G06F 3/16 20060101AFI20161107BHJP

H04N 5/232 20060101ALI20161107BHJP

H04N 9/04 20060101ALI20161107BHJP

G10L 15/00 20130101ALI20161107BHJP

G03B 15/00 20060101ALI20161107BHJP

G02B 7/28 20060101ALI20161107BHJP

G03B 13/36 20060101ALI20161107BHJP

G03B 7/091 20060101ALI20161107BHJP

G06T 7/00 20060101ALI20161107BHJP

【ＦＩ】

G06F3/16 630

H04N5/232 Z

H04N9/04 B

G10L15/00 200G

G03B15/00 Q

G02B7/28 N

G03B13/36

G03B7/091

G06T7/00 C

【請求項の数】16

【全頁数】31

(21)【出願番号】特願2014-183717(P2014-183717)

(22)【出願日】2014年9月9日

(65)【公開番号】特開2016-58888(P2016-58888A)

(43)【公開日】2016年4月21日

【審査請求日】2015年9月11日

【早期審査対象出願】

(73)【特許権者】

【識別番号】000001443

【氏名又は名称】カシオ計算機株式会社

(74)【代理人】

【識別番号】100095407

【弁理士】

【氏名又は名称】木村満

(72)【発明者】

【氏名】中野加奈子

(72)【発明者】

【氏名】村木淳

(72)【発明者】

【氏名】坂本昇平

(72)【発明者】

【氏名】松田英明

【審査官】原秀人

(56)【参考文献】

【文献】特開２００８−２７７９０３（ＪＰ，Ａ）

【文献】特開平１１−３２７０３０（ＪＰ，Ａ）

【文献】特開２００９−２１９１４４（ＪＰ，Ａ）

【文献】特開２０１４−１２２９７８（ＪＰ，Ａ）

【文献】特開２０００−２３１１５１（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｆ３／１６

Ｇ０２Ｂ７／２８

Ｇ０３Ｂ７／０９１

Ｇ０３Ｂ１３／３６

Ｇ０３Ｂ１５／００

Ｇ０６Ｔ７／００

Ｇ１０Ｌ１５／００

Ｈ０４Ｎ５／２３２

Ｈ０４Ｎ９／０４

(57)【特許請求の範囲】

【請求項1】

画像から検出対象を検出する検出装置であって、
前記検出対象を指定する言葉を任意に入力する入力手段と、
前記入力手段により任意に入力された言葉から、前記検出対象の指定に係る属性であって、一の検出対象の指定に係る異なる属性のうちのいずれであるかを判別する判別手段と、
前記判別手段により判別された属性に応じて、前記検出対象の検出方法を選択する選択手段と、
前記選択手段により選択された検出方法により、前記画像から前記検出対象を検出する検出手段と、を備え、
前記選択手段は、前記判別手段により判別された属性が、画像内に含まれる複数の対象物の相対的な関係を指定することで、当該複数の対象物のうちのいずれかを検出対象として指定する属性である場合に、当該指定された相対的な関係に基づく検出方法を選択し、
前記検出手段は、前記選択手段により選択された検出方法により、前記画像から前記複数の対象物同士を比較することで検出対象を検出する、
ことを特徴とする検出装置。

【請求項2】

前記判別手段は、前記入力手段により任意に入力された言葉が有する属性に係る特徴から、前記検出対象の指定に係る属性に係る特徴を、更に、判別する、
ことを特徴とする請求項１に記載の検出装置。

【請求項3】

前記検出手段は、前記選択手段により選択された検出方法により、前記画像から前記判別手段により判別された属性に係る特徴が一致する検出対象を検出する、
ことを特徴とする請求項２に記載の検出装置。

【請求項4】

前記画像に含まれる不特定の対象物を、属性に係る特徴に基づいて認識する認識手段を備え、
前記検出手段は、前記認識手段により認識された対象物の中から、前記判別手段により判別された属性に係る特徴が一致する検出対象を検出する、
ことを特徴とする請求項２又は３に記載の検出装置。

【請求項5】

前記選択手段は、前記判別手段により判別された属性が、画像内に含まれる複数の対象物の相対的な位置関係を指定することで、当該複数の対象物のうちのいずれかを検出対象として指定する属性である場合に、当該指定された相対的な位置関係に基づく検出方法を選択し、
前記検出手段は、前記選択手段により選択された検出方法により、前記画像から前記複数の対象物の位置を比較することで検出対象を検出する、
ことを特徴とする請求項４に記載の検出装置。

【請求項6】

前記判別手段は、前記入力手段により任意に入力された言葉から、前記検出対象の指定に係る属性の一として、広がり方向の位置関係を判別し、
前記選択手段は、前記判別手段により前記検出対象の指定に係る属性が広がり方向の位置関係であると判別された場合に、広がり方向の位置関係に基づく検出方法を選択し、
前記検出手段は、前記認識手段により認識された対象物の前記画像内における位置を比較して検出対象を検出する、
ことを特徴とする請求項５に記載の検出装置。

【請求項7】

前記認識手段により認識された対象物までの距離を測定する距離測定手段を更に備え、
前記判別手段は、前記入力手段により任意に入力された言葉から、前記検出対象の指定に係る属性の一として、奥行き方向の位置関係を判別し、
前記選択手段は、前記判別手段により前記検出対象の指定に係る属性が奥行き方向の位置関係であると判別された場合に、奥行き方向の位置関係に基づく検出方法を選択し、
前記検出手段は、前記距離測定手段により測定された距離を比較して検出対象を検出する、
ことを特徴とする請求項５又は６に記載の検出装置。

【請求項8】

画像から検出対象を検出する検出装置であって、
前記検出対象を指定する言葉を任意に入力する入力手段と、
前記入力手段により任意に入力された言葉から、前記検出対象の指定に係る属性であって、一の検出対象の指定に係る異なる属性のうちのいずれであるかを判別する判別手段と、
前記判別手段により判別された属性に応じて、前記検出対象の検出方法を選択する選択手段と、
前記選択手段により選択された検出方法により、前記画像から前記検出対象を検出する検出手段と、を備え、
前記判別手段は、前記入力手段により入力された言葉が同一であっても、前記画像に含まれる不特定の対象物を、属性に係る特徴に基づいて認識することで取得される情報に応じて、前記検出対象の指定に係る属性を異なるように判別する、
ことを特徴とする検出装置。

【請求項9】

前記入力手段は、
音声を入力する音声入力手段と、
前記音声入力手段により任意に入力された音声を言葉に変換することにより、前記検出対象を指定する言葉を取得する変換手段と、
を備える、
ことを特徴とする請求項１乃至８の何れか１項に記載の検出装置。

【請求項10】

前記検出手段により検出された前記検出対象に対して、所定の処理を実行する実行手段を、更に備える、
ことを特徴とする請求項１乃至９の何れか１項に記載の検出装置。

【請求項11】

撮影手段を更に備え、
前記実行手段は、前記所定の処理として、前記撮影手段による撮影のためのオートフォーカス、オートエクスポージャ、又はオートホワイトバランスのいずれかの処理を実行する、
ことを特徴とする請求項１０に記載の検出装置。

【請求項12】

前記画像を表示する表示手段を更に備え、
前記入力手段は、前記表示手段に前記検出対象を指定するための案内表示がない状態で、前記検出対象を指定する言葉を入力する、
ことを特徴とする請求項１乃至１１の何れか１項に記載の検出装置。

【請求項13】

画像から検出対象を検出する検出方法であって、
前記検出対象を指定する言葉を任意に入力する入力処理と、
前記入力処理により任意に入力された言葉から、前記検出対象の指定に係る属性であって、一の検出対象の指定に係る異なる属性のうちのいずれであるかを判別する判別処理と、
前記判別処理により判別された属性に応じて、前記検出対象の検出方法を選択する選択処理と、
前記選択処理により選択された検出方法により、前記画像から前記検出対象を検出する検出処理と、を含み、
前記選択処理は、前記判別処理により判別された属性が、画像内に含まれる複数の対象物の相対的な関係を指定することで、当該複数の対象物のうちのいずれかを検出対象として指定する属性である場合に、当該指定された相対的な関係に基づく検出方法を選択し、
前記検出処理は、前記選択処理により選択された検出方法により、前記画像から前記複数の対象物同士を比較することで検出対象を検出する、
ことを特徴とする検出方法。

【請求項14】

画像から検出対象を検出する検出方法であって、
前記検出対象を指定する言葉を任意に入力する入力処理と、
前記入力処理により任意に入力された言葉から、前記検出対象の指定に係る属性であって、一の検出対象の指定に係る異なる属性のうちのいずれであるかを判別する判別処理と、
前記判別処理により判別された属性に応じて、前記検出対象の検出方法を選択する選択処理と、
前記選択処理により選択された検出方法により、前記画像から前記検出対象を検出する検出処理と、を含み、
前記判別処理は、前記入力処理により入力された言葉が同一であっても、前記画像に含まれる不特定の対象物を、属性に係る特徴に基づいて認識することで取得される情報に応じて、前記検出対象の指定に係る属性を異なるように判別する、
ことを特徴とする検出方法。

【請求項15】

コンピュータを、画像から検出対象を検出する検出装置として機能させるプログラムであって、
前記検出対象を指定する言葉を任意に入力する入力機能と、
前記入力機能により任意に入力された言葉から前記検出対象の指定に係る属性であって、一の検出対象の指定に係る異なる属性のうちのいずれであるかを判別する判別機能と、
前記判別機能により判別された属性に応じて、前記検出対象の検出方法を選択する選択機能と、
前記選択機能により選択された検出方法により、前記画像から前記検出対象を検出する検出機能と、をコンピュータに実現させ、
前記選択機能は、前記判別機能により判別された属性が、画像内に含まれる複数の対象物の相対的な関係を指定することで、当該複数の対象物のうちのいずれかを検出対象として指定する属性である場合に、当該指定された相対的な関係に基づく検出方法を選択し、
前記検出機能は、前記選択機能により選択された検出方法により、前記画像から前記複数の対象物同士を比較することで検出対象を検出する、
ことを特徴とするプログラム。

【請求項16】

コンピュータを、画像から検出対象を検出する検出装置として機能させるプログラムであって、
前記検出対象を指定する言葉を任意に入力する入力機能と、
前記入力機能により任意に入力された言葉から前記検出対象の指定に係る属性であって、一の検出対象の指定に係る異なる属性のうちのいずれであるかを判別する判別機能と、
前記判別機能により判別された属性に応じて、前記検出対象の検出方法を選択する選択機能と、
前記選択機能により選択された検出方法により、前記画像から前記検出対象を検出する検出機能と、をコンピュータに実現させ、
前記判別機能は、前記入力機能により入力された言葉が同一であっても、前記画像に含まれる不特定の対象物を、属性に係る特徴に基づいて認識することで取得される情報に応じて、前記検出対象の指定に係る属性を異なるように判別する、
ことを特徴とするプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、検出装置、検出方法、及びプログラムに関する。

【背景技術】

【0002】

ＡＦ（ＡｕｔｏＦｏｕｃｕｓ、オートフォーカス）技術の一種であって、撮像画像を解析することにより操作者が撮影を所望する被写体（注目被写体）を推定し、この推定した注目被写体へ自動的にフォーカス（焦点）を合わせる、インテリジェントＡＦと呼ばれる技術が従来知られている。インテリジェントＡＦによれば、簡易な操作によって注目被写体を撮影することができる。

【0003】

しかし、インテリジェントＡＦでは、操作者が撮影を所望する被写体（注目被写体）と注目被写体であると推定された被写体とが不一致だった場合、操作者は、正しい注目被写体へフォーカスを変更する操作を行う必要があった。

【0004】

また、インテリジェントＡＦでは、撮像画像に含まれる複数の被写体の何れかにフォーカスを合わせて撮影した後、他の被写体へフォーカスを合わせて撮影したいと思っても、フォーカスを変更することが難しかった。

【0005】

また、インテリジェントＡＦでは、セルフタイマーを用いて撮影を行う際、セルフタイマー起動後にフォーカスを変更することが難しかった。

【0006】

このような課題を解決するため、特許文献１に開示された撮像装置は、画像から認識された複数の被写体をそれぞれ表す音声を出力し、この音声出力に基づいて操作者が注目被写体を選択することができるよう構成されている。

【先行技術文献】

【特許文献】

【0007】

【特許文献1】特開２０１１−３５７７１号公報

【発明の概要】

【発明が解決しようとする課題】

【0008】

しかしながら、特許文献１の撮像装置には、画像から認識された被写体を表す音声を出力するのに時間がかかる、互いに類似する複数の被写体を認識した場合にその内の何れかを選択するのが困難である、といった課題がある。そのため、撮像画像から操作者が撮影を所望する被写体を簡単且つ的確に検出することが求められていた。また、撮像画像から撮影対象の被写体を検出することに限らず、一般的な画像においても、画像から所望の検出対象を簡単且つ的確に検出することが求められていた。

【0009】

本発明は、上記の課題に鑑みてなされたものであり、画像から所望の検出対象を簡単且つ的確に検出できる検出装置、検出方法、及びプログラムを提供することを目的とする。

【課題を解決するための手段】

【0010】

上記目的を達成するため、本発明に係る検出装置は、
画像から検出対象を検出する検出装置であって、
前記検出対象を指定する言葉を任意に入力する入力手段と、
前記入力手段により任意に入力された言葉から、前記検出対象の指定に係る属性であって、一の検出対象の指定に係る異なる属性のうちのいずれであるかを判別する判別手段と、
前記判別手段により判別された属性に応じて、前記検出対象の検出方法を選択する選択手段と、
前記選択手段により選択された検出方法により、前記画像から前記検出対象を検出する検出手段と、を備え、
前記選択手段は、前記判別手段により判別された属性が、画像内に含まれる複数の対象物の相対的な関係を指定することで、当該複数の対象物のうちのいずれかを検出対象として指定する属性である場合に、当該指定された相対的な関係に基づく検出方法を選択し、
前記検出手段は、前記選択手段により選択された検出方法により、前記画像から前記複数の対象物同士を比較することで検出対象を検出する、
ことを特徴とする。

【発明の効果】

【0011】

本発明によれば、画像から所望の検出対象を簡単且つ的確に検出できる検出装置、検出方法、及びプログラムを提供することができる。

【図面の簡単な説明】

【0012】

【図1】実施形態に係る検出装置のハードウェア構成を例示するブロック図である。

【図2】実施形態に係る検出装置の機能構成を例示するブロック図である。

【図3】（ａ）は、単語「メロン」の属性判別情報を説明するための図である。（ｂ）は、単語「アカ」の属性判別情報を説明するための図である。（ｃ）は、単語「ミドリ」の属性判別情報を説明するための図である。

【図4】（ａ）は、特徴情報テーブルの構造を例示する図である。（ｂ）は、検出優先度テーブルの構造を例示する図である。

【図5】実施形態に係る検出装置が実行する撮像処理を説明するためのフローチャートである。

【図6】実施形態に係る検出装置が実行するオブジェクト検出処理を説明するためのフローチャートである。

【図7】実施形態に係る検出装置が実行する名称検出処理を説明するためのフローチャートである。

【図8】ターゲット画像の一例を示す図である。

【図9】ターゲット画像の他の例を示す図である。

【図10】ターゲット画像の他の例を示す図である。

【図11】ターゲット画像の他の例を示す図である。

【図12】ターゲット画像の他の例を示す図である。

【発明を実施するための形態】

【0013】

以下、本発明の実施形態に係る検出装置及び検出方法を、図面を参照しながら詳細に説明する。尚、図中同一又は同等の部分には同じ符号を付す。

【0014】

本実施形態に係る検出装置は、図１に示すように構成される。検出装置１は、撮像部１０と、処理部２０と、インタフェース３０と、を備える。

【0015】

撮像部１０は、後述する操作部３２が受け付けた操作者による操作に従って被写体を撮像することによって、被写体を撮像した撮像画像（ライブビュー画像、スルー画像）を生成する。

【0016】

撮像部１０は、光学レンズ１１と、イメージセンサ１２と、を含む。

【0017】

光学レンズ１１は、被写体から射出された光を集光するレンズと、焦点、露出、ホワイトバランス等の撮像設定パラメータを調整するための周辺回路と、を備える。

【0018】

イメージセンサ１２は、例えば、ＣＣＤ（ＣｈａｒｇｅＣｏｕｐｌｅｄＤｅｖｉｃｅ）やＣＭＯＳ（ＣｏｍｐｌｅｍｅｎｔａｒｙＭｅｔａｌＯｘｉｄｅＳｅｍｉｃｏｎｄｕｃｔｏｒ）等を備える。イメージセンサ１２は、光学レンズ１１が光を集光することによって結像した被写体の光学像を取得して、取得した光学像の電圧情報をアナログ／デジタル変換器（図示せず）によりデジタル画像データに変換する。そして、得られたデジタル画像データを、画像出力部２４へ出力する。

【0019】

処理部２０は、撮像部１０が生成した撮像画像に対して、後述する検出処理を施す。また、処理部２０は、種々のプログラムを実行することにより、検出装置１の各種機能を実現する。

【0020】

処理部２０は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）２１と、一時記憶部２２と、主記憶部２３と、画像出力部２４と、を含む。

【0021】

ＣＰＵ２１は、主記憶部２３に記憶された制御プログラムを実行することにより検出装置１全体を制御する。また、ＣＰＵ２１は、主記憶部２３に記憶された、輪郭検出プログラムや形態素解析プログラムを含む各種プログラムを実行することにより、検出装置１の各種機能を実現する。

【0022】

一時記憶部２２は、例えばＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）等を備える。一時記憶部２２は、ＣＰＵ２１のワークメモリとして機能し、撮像部１０によって生成されたライブビュー画像を含む種々の画像データや、音声処理部３４から供給された音声データ、及びプログラム等を一時的に記憶する。

【0023】

主記憶部２３は、不揮発性メモリ（例えば、フラッシュメモリやハードディスク）を備え、検出装置１全体の制御に必要な制御プログラムや形態素解析プログラムを含む種々のプログラム、及び、照合画像データを含む種々の固定データ等を固定的に記憶する。主記憶部２３は、記憶しているプログラムやデータを、ＣＰＵ２１や画像出力部２４へ供給する。

【0024】

画像出力部２４は、撮像部１０が撮像した画像データに所定の処理（例えば、解像度を低下させる処理）を施すことによりライブビュー画像を生成する。画像出力部２４は、撮像部１０よる撮像画像を一時記憶部２２へ供給し記憶させると共に、生成したライブビュー画像を後述する表示部３１へ供給し表示させる。

【0025】

また、画像出力部２４は、一時記憶部２１や主記憶部２３に記憶された画像データを読み出し、この画像データに対応するＲＧＢ（Ｒ（Ｒｅｄ、赤）、Ｇ（Ｇｒｅｅｎ、緑）、Ｂ（Ｂｌｕｅ、青））信号を生成して、後述する表示部３１へ出力する。

【0026】

インタフェース３０は、外部からの操作入力や画像及び音声データ入力を受け付けると共に、音声データや画像データを外部へ出力する。

【0027】

インタフェース３０は、表示部３１と、操作部３２と、音声入力部３３と、音声処理部３４と、音声出力部３５と、外部インタフェース３６と、を含む。

【0028】

表示部３１は、例えばＬＣＤ（ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ）やＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ）、有機ＥＬ（ＥｌｅｃｔｒｏＬｕｍｉｎｅｓｃｅｎｃｅ）ディスプレイ等を備え、画像出力部２４から供給された画像データに基づいて、ライブビュー画像を含む種々の画像を表示する。

【0029】

操作部３２は、操作者による操作入力を受け付ける。操作部３２は、キーボードと共に、シャッターボタン、キャンセルボタン、検出装置１の動作モードを選択するためのモード選択ボタン等を含む種々の操作ボタンを備える。操作部３２は、受け付けた操作入力を、撮像部１０やＣＰＵ２１等へ供給する。

【0030】

なお、表示部３１と操作部３２とは、互いに重畳して配置されたいわゆるタッチパネルによって構成されてもよい。

【0031】

音声入力部３３は、マイクを備え、操作者の声を含むアナログ音声信号の入力を外部から受け付ける。入力されたアナログ音声信号は、音声処理部３４へ送出される。

【0032】

音声処理部３４は、音声入力部３３から供給されたアナログ音声信号をデジタル音声信号へ変換し、一時記憶部２２へ供給する。また、音声処理部３４は、一時記憶部２２や主記憶部２３に記憶されていたデジタル音声信号を読み出し、アナログ音声信号に変換して音声出力部３５へ送出する。

【0033】

音声出力部３５は、スピーカやヘッドフォン等を備え、音声処理部３４から供給されたアナログ音声信号を外部へ出力する。

【0034】

外部インタフェース３６は、検出装置１の外部の機器とデータをやり取りするためのインタフェースである。外部インタフェース３６は、例えば、撮影画像を、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）規格のデータに変換して、ＵＳＢケーブルを介して外部の機器との間でデータを送受信する。

【0035】

検出装置１は、機能的には、図２に示すように構成される。検出装置１は、認識部１０１と、距離測定部１０２と、入力部１０３と、抽出部１０４と、判別部１０５と、選択部１０６と、特徴情報記憶部１０７と、検出部１０８と、実行部１０９と、撮影部１１０と、を備える。

【0036】

尚、検出装置１は、通常のカメラと同様に、目つぶり検出機能や人物検出機能等を有するものの、以下では、本実施形態に特徴的な、撮像画像から、操作者によって音声入力された言葉によって指定される検出対象を検出する機能を中心に説明する。

【0037】

認識部１０１は、撮像部１０が生成した撮像画像をターゲット画像として、ターゲット画像に対してオブジェクト・色・顔認識処理を施して、ターゲット画像に含まれる対象物ＯＢを認識する。ターゲット画像とは、検出装置１が実行する検出処理の対象となる画像である。

【0038】

ターゲット画像は、例えば、後述する図８〜図１２に示すターゲット画像ＴＧａ〜ＴＧｅ（以下、ターゲット画像ＴＧと総称する。）のように、撮像部１０が撮像した様々な対象物ＯＢ１ａ〜ＯＢ４ａ，ＯＢ１ｂ〜ＯＢ３ｂ，ＯＢ１ｃ〜ＯＢ３ｃ，ＯＢ１ｄ〜ＯＢ９ｄ，ＯＢ１ｅ（以下、対象物ＯＢと総称する。）を含む画像である。

【0039】

認識部１０１は、ターゲット画像ＴＧに含まれる不特定の対象物ＯＢを、色や形状等の複数の属性に係る特徴に基づいて認識する。

【0040】

具体的には、認識部１０１は、任意の公知技術を用い、ターゲット画像ＴＧの色の分布、形状（例えば、輪郭や模様）等を解析して、ターゲット画像ＴＧに含まれる対象物ＯＢを認識する。そして、認識部１０１は、認識した対象物ＯＢの面積、ターゲット画像ＴＧ内における広がり方向の位置を示す情報を取得して、認識した対象物ＯＢの大きさや位置を取得する。更に、認識部１０１は、顔検出に係る任意の公知技術を用い、ターゲット画像ＴＧから顔画像領域（被写体人物の顔を表す画像領域）を認識する。

【0041】

このように、認識部１０１は、ターゲット画像ＴＧ内のどの位置（広がり方向と奥行き方向とを含む）にどのような色、形状、大きさの対象物ＯＢがあるか、そしてその対象物ＯＢが人の顔であるか否か、についての情報を取得する。

【0042】

認識部１０１は、ＣＰＵ２１によって実現される。

【0043】

距離測定部１０２は、認識部１０１によって認識された対象物ＯＢまでの距離を測定し、測定した距離を示す情報を生成する。そして、認識部１０１は、この生成された距離を示す情報に基づき、認識した対象物ＯＢのターゲット画像ＴＧ内における奥行き方向の位置を示す情報を取得する。

【0044】

距離測定部１０２は、上述のＣＰＵ２１と撮像部１０との協働によって実現される。具体的には、撮像部１０が、ＣＰＵ２１の制御に従って、撮像部１０のフォーカス位置を変化させて、対象物ＯＢにフォーカスが合った時のフォーカス位置に基づいて、対象物ＯＢまでの距離を取得する。

【0045】

入力部１０３は、検出対象を指定する言葉の入力を受け付ける。より具体的には、入力部１０３は、音声（音声信号）の入力を受け付ける音声入力部３３と、音声入力部３３により入力された音声を言葉に変換することにより、検出対象を指定する言葉を取得する変換部１０３ａと、を含む。

【0046】

ここで、検出対象を指定する言葉（キーワード、キーフレーズ、指示語）とは、操作者が検出を所望している検出対象（操作者が撮影を所望する被写体、注目被写体）を指定する情報である。例えば、操作者は、「メロン」や「赤い」等、１つ以上の単語を含んだ言葉を音声で入力することにより、検出対象を指定する。

【0047】

変換部１０３ａは、音声処理部３４によって実現される。

【0048】

抽出部１０４は、変換部１０３ａにより変換された検出対象を指定する言葉から、検出対象を検出するための特徴を抽出する。例えば、抽出部１０４は、音声入力部３３が音声入力を受け付けた言葉の中から、任意の公知技術（例えば、形態素解析）により、「メロン」や「アカ」等の単語を抽出することにより、言葉が有する属性に係る特徴を抽出する。

【0049】

抽出部１０４は、ＣＰＵ２１によって実現される。

【0050】

判別部１０５は、入力部１０３により入力された言葉から検出対象の指定に係る属性を判別する。具体的には、判別部１０５は、抽出部１０４が抽出した各単語を、予め記憶している属性判別情報と照合して、抽出した各単語の検出対象の指定に係る属性を判別する。

【0051】

属性判別情報は、図３（ａ）〜（ｃ）に示すように、入力された言葉から抽出される可能性がある単語と、各単語の属性「名称」「色」「形状」「大きさ」「広がり方向の位置関係」及び「奥行き方向の位置関係」に係る評価値と、をそれぞれ対応付けて格納している。ここで、各単語の各属性値に係る評価値は、各単語が当該属性に係る特徴である可能性（各単語が当該属性の有する属性値の一である可能性）を示す。

【0052】

例えば、単語「メロン」は、図３（ａ）に示すように、属性「名称」に係る評価値が最も高い。これは、単語「メロン」が属性「名称」に係る特徴である可能性が高いことを意味している。属性「名称」に係る評価値が所定の閾値（例えば、５０％）以上であれば、判別部１０５は、単語「メロン」の検出対象の指定に係る属性が「名称」であると判別する。
また、単語「アカ」は、図３（ｂ）に示すように、属性「色」に係る評価値が最も高い。これは、単語「アカ」が属性「色」に係る特徴である可能性が高いことを意味している。属性「色」に係る評価値が所定の閾値以上であれば、判別部１０５は、単語「アカ」の検出対象の指定に係る属性が「色」であると判別する。
また、単語「ミドリ」は、図３（ｃ）に示すように、属性「名称」に係る評価値と属性「色」に係る評価値とが共に高い。これは、単語「ミドリ」が、属性「名称」に係る特徴である可能性と属性「色」に係る特徴である可能性とが共に高いことを意味している。属性「名称」に係る評価値と属性「色」に係る評価値と共に所定の閾値以上であれば、判別部１０５は、単語「ミドリ」の検出対象の指定に係る属性が「名称」及び「色」であると判別する。

【0053】

尚、属性判別情報は、予め任意の方法で適宜作成し、判別部１０５に記憶させておけばよい。例えば、テキストマイニング等により各単語がどのような意味で用いられているかを統計的に解析することにより属性判別情報を作成することができる。

【0054】

判別部１０５は、検出対象の指定に係る属性を判別する際に、認識部１０１が行ったオブジェクト・色・顔認識処理の結果を参酌してもよい。

【0055】

例えば、単語「ミドリ」は、「緑」という「色」を指す場合と、「緑」或いは「みどり」という人名（名称）を指す場合と、がある。認識部１０１が行ったオブジェクト・色・顔認識処理の結果として、ターゲット画像ＴＧから顔画像領域が認識されなかったとき、ターゲット画像ＴＧは人物を被写体として含まない可能性が高く、従って、単語「ミドリ」が名称（人名）を指している可能性は低い。すなわち、単語「ミドリ」の検出対象の指定に係る属性が「名称」である可能性は低い。このような場合、判別部１０５は、単語「ミドリ」の属性「名称」に係る評価値を低下させる等の操作を行い、検出対象の指定に係る属性が「名称」であると判別される可能性を低下させることにより、単語の属性をより正確に判別することができる。また、他の例として、単語「マルイ」は、「丸い」という形状を示す場合と「丸井」という人名（名称）を指す場合と、がある。

【0056】

また、判別部１０５は、任意の公知技術を用いて、入力された言葉から取得した単語の間に係り受けがあるか否かを判別することにより、検出対象の指定に係る属性が複数の属性の組み合わせであるか否かを判別する。

【0057】

判別部１０５は、ＣＰＵ２１と主記憶部２３との協働によって実現される。

【0058】

選択部１０６は、判別部１０５によって判別された、検出対象の指定に係る属性に応じて検出対象の検出方法を選択する。

【0059】

具体的には、検出対象の指定に係る属性が「名称」であると判別部１０５によって判別された場合、選択部１０６は、検出対象の検出方法として「オブジェクト検出」による検出方法を選択する。
検出対象の指定に係る属性が「色」であると判別部１０５によって判別された場合、選択部１０６は、検出対象の検出方法として「色検出」による検出方法を選択する。
検出対象の指定に係る属性が「形状」であると判別部１０５によって判別された場合、選択部１０６は、検出対象の検出方法として「形状検出」による検出方法を選択する。
検出対象の指定に係る属性が「大きさ」であると判別部１０５によって判別された場合、選択部１０６は、検出対象の検出方法として「大きさ検出」による検出方法を選択する。
検出対象の指定に係る属性が「広がり方向の位置関係」であると判別部１０５によって判別された場合、選択部１０６は、検出対象の検出方法として「広がり方向の位置関係検出」による検出方法を選択する。
検出対象の指定に係る属性が「奥行き方向の位置関係」であると判別部１０５によって判別された場合、選択部１０６は、検出対象の検出方法として「奥行き方向の位置関係検出」による検出方法を選択する。
検出対象の指定に係る属性が複数の属性の組み合わせであると判別部１０５によって判別された場合（入力された言葉から取得された単語間に係り受け構造が存在すると判別部１０５によって判別された場合）、選択部１０６は、検出対象の検出方法として「組み合わせ検出」による検出方法を選択する。

【0060】

選択部１０６は、ＣＰＵ２１によって実現される。

【0061】

特徴情報記憶部１０７は、特徴情報を記憶する。特徴情報は、検出対象を指定する言葉として入力される可能性がある単語の特徴を示す情報である。

【0062】

具体的に説明すると、特徴情報は、特徴情報テーブルと、検出優先度テーブルと、を含む。

【0063】

図４（ａ）に、フルーツに分類される単語の特徴情報テーブルの例を示す。特徴情報テーブルＦＥは、属性「名称」に係る単語のそれぞれについて、分類と、「画像」、「色」、「形状」、「同類物」、及び「関連用語」の各属性に係る特徴と、を互いに対応付けて格納している。

【0064】

「画像」とは、ターゲット画像ＴＧ内の認識された対象物ＯＢと画像照合を行うための画像データを示す。例えば「スイカ」に対応付けられた「照合画像＃１」は、予め撮影されたスイカの画像データである。
「色」及び「形状」とは、各単語が示す物の典型的な色及び形状である。例えば「スイカ」の色として「緑、黒」が、「スイカ」の形状として「丸い」が予め設定される。
「同類物」とは、各単語が示す物に類似した別の物である。例えば「スイカ」の同類物として「メロン」が予め設定される。
「関連用語」とは、各単語と関連する用語である。例えば「スイカ」の関連用語として「縞々、種、夏」の用語が予め設定される。
特徴情報テーブルＦＥは、このような特徴情報を、「スイカ」、「バナナ」等の各単語に対応付けて、予め格納しておく。

【0065】

図４（ｂ）に、検出優先度テーブルの例を示す。検出優先度テーブルＰＲは、後述する検出方法の一である名称検出方法により検出を行う際に使用されるテーブルである。検出優先度テーブルＰＲは、「フルーツ」、「建物」、「乗り物」等の分類毎に、どの属性の検出方法を用いて検出対象を検出するかを示す優先順位を格納している。例えば、例えば「メロン」や「スイカ」等、「フルーツ」に分類される名称を示す言葉が操作者から入力された場合、選択部１０６は、「画像」、「色」、「形状」、「同類物」、及び「関連用語」の順で検出方法を選択する。一方、「建物」に分類される名称を示す言葉が操作者から入力された場合、選択部１０６は、「画像」、「形状」、「色」、「同類物」、及び「関連用語」の順で検出方法を選択する。検出部１０８は、選択部１０６が選択した順序で、各検出方法により、検出対象の検出を試みる。また、各優先順位には、優先順位が高いほど高くなるように、基準値が設定されている。

【0066】

特徴情報記憶部１０７は、主記憶部２３によって実現される。

【0067】

検出部１０８は、選択部１０６によって選択された検出方法により検出対象を検出する。具体的には、検出部１０８は、名称検出部１０８ａと、色検出部１０８ｂと、形状検出部１０８ｃと、位置・大きさ検出部１０８ｄと、同類物検出部１０８ｅと、関連用語検出部１０８ｆと、を含む。検出部１０８は、これらの検出エンジンの中から選択部１０６によって選択された検出エンジンを用いた検出方法により、検出対象を検出する。各検出エンジンの詳細については、後述する。

【0068】

検出部１０８は、ＣＰＵ２１によって実現される。

【0069】

実行部１０９は、検出部１０８によって検出された検出対象に対して、撮影部１１０による撮影のためのＡＦ（ＡｕｔｏＦｏｕｃｕｓ、オートフォーカス）処理を実行する。すなわち、実行部１０９は、検出部１０８によって検出された検出対象を囲むフォーカス枠を表示し、撮影部１１０を制御して、該検出対象にフォーカス（焦点）を合わせて撮影させる。

【0070】

実行部１０９は、ＣＰＵ２１、及び表示部３１の協働によって実現される。

【0071】

撮影部１１０は、実行部１０９が実行したＡＦ処理に従い、撮像部１０を制御して、検出対象にフォーカス（焦点）が合わされた状態で被写体を撮影する。

【0072】

撮影部１１０は、撮像部１０及びＣＰＵ２１の協働によって実現される。

【0073】

次に、上述のハードウェア構成及び機能構成を有する検出装置１が行う撮像処理について、図５のフローチャートを参照しながら説明する。

【0074】

検出対象を指定する言葉を音声入力し、検出装置１に検出対象を検出させて撮影することを所望する場合、操作者は、操作部３２が備えるモード選択ボタンを操作し、検出装置１が備える手ブレ防止撮像モードや赤目防止撮像モード等の複数の動作モードの１つである「音声入力モード」を選択する。

【0075】

上述の操作に応答して、撮像部１０は、対象物ＯＢの撮像を開始し、撮像した画像データを画像出力部２４へ供給する。

【0076】

画像出力部２４は、供給された画像データに基づいてライブビュー画像を生成する。画像出力部２４は、供給された撮像画像を定期的に一時記憶部２２に格納すると共に、生成したライブビュー画像を表示部３１へ供給する。表示部３１は、供給されたライブビュー画像を表示する。

【0077】

このようにライブビュー画像の取得を開始すると、ＣＰＵ２１は、図５のフローチャートに示す撮像処理を開始する。

【0078】

まず、認識部１０１が、１フレーム分の撮像画像を一時記憶部２２からターゲット画像ＴＧとして取得し、オブジェクト・色・顔認識処理を施す（ステップＳ１）。

【0079】

オブジェクト・色・顔認識処理において、認識部１０１は、任意の公知技術を用いて、ターゲット画像ＴＧの色の分布、形状（例えば、輪郭や模様）等を解析して、ターゲット画像ＴＧに含まれる対象物ＯＢを認識する。また、認識部１０１は、顔検出に係る任意の公知技術を用い、ターゲット画像ＴＧから顔画像領域を認識する。

【0080】

オブジェクト・色・顔認識処理を実行した後、撮影部１１０は、フォーカス対象をデフォルトに設定する（ステップＳ２）。具体的には、ステップＳ１のオブジェクト・色・顔認識処理において顔画像領域が認識された場合は当該顔画像領域をフォーカス対象に設定し、顔画像領域がされなかった場合はステップＳ２で取得したターゲット画像ＴＧの中心をフォーカス対象に設定する。

【0081】

次に、入力部１０３は、言葉の入力を入力部１０３が受け付けたか否かを判別する（ステップＳ３）。言葉の入力を受け付けていないと判別した場合（ステップＳ３；Ｎｏ）、処理はステップＳ５へ移行する。

【0082】

言葉の入力を受け付けたと判別した場合（ステップＳ３；Ｙｅｓ）、ＣＰＵ２１は、オブジェクト検出処理を実行することにより検出対象を検出する（ステップＳ４）。
ここで、ステップＳ４のオブジェクト検出処理の詳細を、図６のフローチャートを参照しながら説明する。

【0083】

図６のオブジェクト検出処理を開始すると、まず、抽出部１０４が、ステップＳ３において入力を受け付けた言葉から、検出対象を検出するための特徴を抽出し（ステップＳ４１）、判別部１０５が、抽出された特徴から、検出対象の指定に係る属性を判別する（ステップＳ４２）。

【0084】

具体的には、抽出部１０４は、まず、任意の公知技術（例えば、形態素解析）を用いて、ステップＳ３において入力を受け付けた言葉から、「メロン」や「アカイ」等の単語を抽出する。抽出部１０４は、入力を受け付けた言葉が「アカイリンゴ」等のような複数の特徴を含む場合には、入力を受け付けた言葉に含まれる複数の特徴を全て抽出する。

【0085】

判別部１０５は、ステップＳ１におけるオブジェクト・色・顔認識処理の結果と、予め記憶していた属性判別情報と、に基づいて、抽出した各単語から、属性を判別する。より具体的には、判別部１０５は、属性判別情報において評価値が所定の閾値（例えば、５０％）以上である全ての属性を、各単語の検出対象の指定に係る属性として判別する。

【0086】

ステップＳ３で入力された言葉から取得した全ての単語の属性を判別した後、判別部１０５は、任意の公知技術を用いて、単語間に係り受けがあるか否かを判別することにより、検出対象の指定に係る属性が複数の属性の組み合わせであるか否かを判別し、ステップＳ４２の処理を終了する。

【0087】

次に、選択部１０６が、ステップＳ４２で判別された検出対象の指定に係る属性に応じて、検出対象の検出方法を選択する（ステップＳ４３）。具体的には、選択部１０６は、判別部１０５が判別した検出対象の指定に係る属性に応じて、「名称検出」、「色検出」、「形状検出」、「大きさ検出」、「広がり方向の位置関係検出」、「奥行き方向の位置関係検出」、又は「組み合わせ検出」のいずれかによる検出方法を選択する。

【0088】

次に、検出部１０８が、ステップＳ４３において選択部１０６が選択した検出方法により検出対象を検出する。

【0089】

ステップＳ４３において「名称検出」による検出方法が選択された場合、検出部１０８が備える名称検出部１０８ａが、「名称検出処理」を実行する（ステップＳ４４）。具体的には、検出部１０８は、図５のフローチャートのステップＳ１のオブジェクト・色・顔認識処理において認識された対象物ＯＢの特徴と、入力された言葉からステップＳ４２において抽出部１０４が抽出した特徴と、を照合することにより検出対象を検出する。
ここで、ステップＳ４４の「名称検出処理」の詳細について、図７のフローチャートを参照しながら説明する。

【0090】

名称検出処理を開始すると、まず、名称検出部１０８ａは、特徴情報記憶部１０７が記憶している「名称」に係る特徴情報に含まれる検出優先度テーブルＰＲから、属性「画像」、「色」、「形状」、「同類物」、及び「関連用語」の優先順位及び基準値を取得する（ステップＳ４４１）。

【0091】

具体的には、名称検出部１０８ａは、図６のフローチャートのステップＳ４２において検出対象の指定に係る属性が「名称」であると判別された単語の一を選択し、「名称」に係る特徴情報に含まれる特徴情報テーブルＦＥを参照することにより、当該単語に対応付けて格納されている「分類」を取得し、次に、検出優先度テーブルＰＲを参照し、取得した「分類」に対応付けて格納されている属性の優先順位及び基準値を取得する。

【0092】

次に、名称検出部１０８ａは、特徴情報テーブルＦＥを参照することにより、ステップＳ４４１において選択した単語に対応付けて格納されている、当該単語の、「画像」、「色」、「形状」、「同類物」、及び「関連用語」の各属性に係る特徴を取得する（ステップＳ４４２）。

【0093】

次に、選択部１０６は、ステップＳ４４１において取得した属性の優先順位に基づいて、検出対象の検出方法を選択する（ステップＳ４４３）。具体的には、まず、優先順位が１番目に設定されている属性に対応する検出方法を選択する。

【0094】

検出部１０８は、ステップＳ４４３において選択した検出方法にて検出を実行することにより（ステップＳ４４４）、図５のフローチャートのステップＳ１において認識された対象物ＯＢそれぞれについて、ステップＳ１のオブジェクト・色・顔認識処理において取得された各対象物ＯＢの特徴と、図６のフローチャートのステップＳ４１において言葉から抽出された特徴と、の間の合致度を取得する。

【0095】

ステップＳ４４４において検出を実行した後、名称検出部１０８ａは、評価値を算出する（ステップＳ４４５）。具体的には、名称検出部１０８ａは、ステップＳ４４１で取得した、各優先順位に対応付けて格納されていた基準値と、ステップＳ４４４において取得した合致度と、を乗算することにより、対象物ＯＢごとに評価値を算出する。

【0096】

評価値を算出すると、名称検出部１０８ａは、評価値が第２閾値以上である対象物ＯＢが存在するか否かを判別する（ステップＳ４４６）。この第２閾値は、算出した評価値がステップＳ４２において言葉から抽出された特徴に合致すると判別するのに使用するか否かの基準となり、評価値が低い場合は、合致の誤判別を防止するために使用しないと判別する。

【0097】

算出した評価値が第２閾値以上である対象物ＯＢが存在する場合（ステップＳ４４６；Ｙｅｓ）、名称検出部１０８ａは、第２閾値以上である評価値の累計値を算出する（ステップＳ４４７）。具体的には、名称検出部１０８ａは、対象物ＯＢごとに、算出した評価値を、それ以前に取得した評価値に加算することにより、評価値の累計値を算出する。ここでは、優先順位が１番目に設定されている属性による検出が行われたので、それ以前に取得した評価値は存在しないため、ステップＳ４４５で算出された評価値と同じ値となる。

【0098】

算出した評価値が第２閾値以上である対象物ＯＢが存在しない場合（ステップＳ４４６；Ｎｏ）、名称検出部１０８ａは、名称検出部１０８ａは、「名称」に係る特徴情報に格納されている、優先順位及び基準値が設定されている属性の全てについて、対応する検出方法による検出を実行済みか否か判別する（ステップＳ４５２）。

【0099】

ここでは、優先順位が１番目に設定されている属性による検出が行われたので、「名称」に係る特徴情報に格納されている属性のうち、対応する検出方法による検出を未だ実行していないものがあると判別し（ステップＳ４５２；Ｎｏ）、ステップＳ４４３へ戻る。

【0100】

ステップＳ４４７で累計値を算出した後、名称検出部１０８ａは、算出した累計値が第１閾値以上である対象物ＯＢが存在するか否かを判別する（ステップＳ４４８）。この第１閾値は、ステップＳ４２において言葉から抽出された特徴に合致すると判別できるか否かの基準となる。累計値が高い場合に、抽出された特徴に合致すると判別する。累計値が第１閾値以上である対象物ＯＢが１つも無い場合（ステップＳ４４８；Ｎｏ）、処理はステップＳ４５２へ移行する。

【0101】

累計値が第１閾値以上である対象物ＯＢがあると判別された場合（ステップＳ４４８；Ｙｅｓ）、名称検出部１０８ａは、累計値が第１閾値以上である対象物ＯＢは複数であるか否かを判別する（ステップＳ４４９）。累計値が第１閾値以上である対象物ＯＢは複数ではないと判別された場合（ステップＳ４４９；Ｎｏ）、当該唯一の対象物ＯＢを検出対象として検出し（ステップＳ４５０）、名称検出処理を終了する。

【0102】

評価値の累計値が第１閾値以上である対象物ＯＢが複数であると判別された場合（ステップＳ４４９；Ｙｅｓ）、複数の対象物ＯＢのうち、評価値の累計値が最大の対象物ＯＢを検出対象として検出し（ステップＳ４５１）、名称検出処理を終了する。

【0103】

ステップＳ４４８において、評価値の累計値が第１閾値以上である対象物ＯＢが１つも無いと判別された場合（ステップＳ４４８；Ｎｏ）、名称検出部１０８ａは、「名称」に係る特徴情報に格納されている、優先順位及び基準値が設定されている属性の全てについて、対応する検出方法による検出を実行済みか否か判別する（ステップＳ４５２）。

【0104】

「名称」に係る特徴情報に格納されている全ての属性について、対応する検出方法による検出を実行済みであると判別した場合（ステップＳ４５２；Ｙｅｓ）、検出対象を検出しなかった旨の情報を生成し（ステップＳ４５３）、名称検出処理を終了する。

【0105】

「名称」に係る特徴情報に格納されている属性のうち、対応する検出方法による検出を未だ実行していないものがあると判別した場合（ステップＳ４５２；Ｎｏ）、処理はステップＳ４４３へ戻る。そして、選択部１０６が、「名称」に係る特徴情報に格納されている属性のうち、優先順位が２番目の属性に対応する検出方法を選択する。
そして、評価値の累計値が第１閾値以上である対象物ＯＢが存在すると判別されるか、「名称」に係る特徴情報に格納されている全ての属性について、対応する検出方法による検出を実行済みであると判別されるまで、上述の処理を繰り返す。

【0106】

ここで、「名称検出処理」を、図８のターゲット画像ＴＧａを例に、検出対象を指定する言葉として単語「メロン」が図５のフローチャートのステップＳ３において入力されたと仮定して具体的に説明する。

【0107】

ここで、ターゲット画像ＴＧａは、図８に示すように、対象物ＯＢ１ａ〜ＯＢ４ａを含む。対象物ＯＢ１ａは橙色のミカン、対象物ＯＢ２ａは緑色のリンゴ、対象物ＯＢ３ａはメロン、対象物ＯＢ４ａは赤いリンゴである。

【0108】

ステップＳ４４の「名称検出処理」を開始すると、名称検出部１０８ａは、「名称」に係る特徴情報が含む特徴情報テーブルＦＥを参照して、名称に係る単語「メロン」に対応付けて格納されている分類「フルーツ」を取得する。

【0109】

次に、名称検出部１０８ａは、「名称」に係る特徴情報が含む検出優先度テーブルＰＲを参照して、分類「フルーツ」に対応付けて記憶されている、「画像」、「色」、「形状」、「同類物」、「関連用語」の各属性の優先順位及び基準値を取得する。

【0110】

そして、名称検出部１０８ａは、より高い優先順位の属性から順番に合致度を判別して（ステップＳ４４４）、合致度と基準値とから評価値を算出し（ステップＳ４４５）、以下の計算式を満たした時点で、その計算式を満たした対象物ＯＢを検出された対象物と判別する（ステップＳ４４６−Ｓ４４８）。
＜計算式＞
（優先順位1番の属性の合致度×基準値）＋（優先順位２番の属性の合致度×基準値）＋（優先順位３番の属性の合致度×基準値）＋（優先順位４番の属性の合致度×基準値）＋（優先順位５番の属性の合致度×基準値）≧第１閾値
（但し、（合致度×基準値）＜第２閾値の場合は累計の対象から除外する（ステップＳ４４６）。）

【0111】

具体的に、入力単語「メロン」（分類「フルーツ」）の場合であって、第１閾値が８０、第２閾値が２０である場合について説明する。図４（ｂ）に示すように、検出優先度テーブルＰＲにおいて、優先順位が１番目に設定された属性は「画像」である。そこで、名称検出部１０８ａは、優先順位１番の属性「画像」に対応する検出方法である「画像照合処理」で、図４（ａ）の特徴情報テーブルＦＥにおいて単語「メロン」に対応付けて格納されている、属性「画像」に係る特徴である照合画像＃４との合致度を取得することで検出を試みる。
（１）属性「画像」による検出の結果、照合画像＃４と対象物ＯＢ３ａとの合致度が８５％の場合、評価値は、「基準値１００×合致度８５％＝８５」と計算される。この評価値「８５」は、第1閾値「８０」よりも大きいため、名称検出部１０８ａは、対象物ＯＢ３ａが該当する対象物として検出されたと判別する。
（２）属性「画像」による検出の結果、照合画像＃４と対象物ＯＢ３ａとの合致度が６０％の場合、評価値は、「基準値１００×合致度６０％＝６０」と計算される。この評価値「６０」は、第1閾値「８０」よりも小さい。この場合、名称検出部１０８ａは、評価値「６０」を累計値として一時記憶する。
次に、名称検出部１０８ａは、優先順位２番の属性「色」に対応する検出方法である「色検出処理」で、図４（ａ）の特徴情報テーブルＦＥにおいて単語「メロン」に対応付けて格納されている、属性「色」に係る特徴である「緑」で検出を試みる。その結果、特徴「緑」と対象物ＯＢ３ａのとの合致度が９０％の場合、評価値は、
「基準値８０×合致度９０％＝７２」と計算される。この評価値が一時記憶された累計値「６０」に加算されることにより、累計値は、「６０＋７２＝１３２」と更新される。この累計値「１３２」は、第1閾値「８０」よりも大きいため、名称検出部１０８ａは、対象物ＯＢ３ａが該当する対象物として検出されたと判別する。
（３）属性「画像」による検出の結果、照合画像＃４と対象物ＯＢ３ａとの合致度が４０％の場合、評価値は、「基準値１００×合致度４０％＝４０」と計算される。この評価値「４０」は第1閾値「８０」より小さいので、名称検出部１０８ａは、評価値「４０」を累計値として一時記憶する。
次に、名称検出部１０８ａは、優先順位２番の属性「色」に係る特徴「緑」で検出を試みる。その結果、特徴「緑」と対象物ＯＢ３ａのとの合致度が４５％の場合、評価値は、「基準値８０×合致度４５％＝３６」と計算され、累計値は、「累計値４０＋３６＝７６」と更新される。この累計値「７６」は、第1閾値「８０」よりも小さいため、名称検出部１０８ａは、累計値「７６」をさらに一時記憶する。
次に、名称検出部１０８ａは、優先順位３番の属性「形状」に対応する検出方法である「形状検出処理」で、図４（ａ）の特徴情報テーブルＦＥにおいて単語「メロン」に対応付けて格納されている、属性「形状」に係る特徴である「丸い」で検出を試みる。その結果、特徴「丸い」と対象物ＯＢ３ａのとの合致度が８０％の場合、評価値は、「基準値６０×合致度８０％＝４８」と計算され、累計値は、「７６＋４８＝１２４」と更新される。この累計値「１２４」は、第1閾値「８０」よりも大きいため、名称検出部１０８ａは、対象物ＯＢ３ａが該当する対象物として検出されたと判別する。
（４）「画像」による検出の結果、照合画像＃４と対象物ＯＢ３ａとの合致度が１５％の場合、評価値は、「基準値１００×合致度１５％＝１５」と計算される。この評価値「１５」は、第２閾値「２０」よりも小さいため、名称検出部１０８ａは、この評価値を使用すべきないと判別して、累計値に加算しない。続けて、名称検出部１０８ａは、次の優先順位の属性で検出を行う。名称検出部１０８ａは、他の優先順位の属性の場合も、同様に、第２閾値以上でない評価値を累計値に加算しない。

【0112】

以下、同様にして、名称検出部１０８ａは、評価値の累計値が第１閾値以上である対象物ＯＢが存在すると判別されるか、「名称」に係る特徴情報に格納されている全ての属性について、対応する検出方法による検出を実行済みであると判別されるまで、優先順位４番の属性「同類物」に対応する検出方法である「同類物検出処理」で、図４（ａ）の特徴情報テーブルＦＥにおいて単語「メロン」に対応付けて格納されている、属性「同類物」に係る特徴である特徴「スイカ」で検出を試み、更に、優先順位５番の属性「関連用語」に対応する検出方法である「関連用語検出処理」で、図４（ａ）の特徴情報テーブルＦＥにおいて単語「メロン」に対応付けて格納されている、属性「関連用語」に係る特徴である特徴「種」「網」「高価」で検出を試みる。その結果、「名称」に係る特徴情報に格納されている全ての属性について、対応する検出方法による検出を実行しても、上記計算式「（優先順位1番の属性の合致度×基準値）＋（優先順位２番の属性の合致度×基準値）＋（優先順位３番の属性の合致度×基準値）＋（優先順位４番の属性の合致度×基準値）＋（優先順位５番の属性の合致度×基準値）≧第１閾値」を満たす対象物ＯＢが存在しなかった場合は、名称検出部１０８ａは、検出対象を検出できなかったと判別する。

【0113】

以下、「名称検出処理」の一部として実行される、属性ごとの検出方法を詳述する。属性「色」に対応する検出方法である「色検出処理」、及び属性「形状」に対応する検出方法である「形状検出処理」については、詳細に後述する。ここでは、属性「同類物」に対応する検出方法である「同類物検出処理」、及び属性「関連用語」に対応する検出方法である「関連用語検出処理」について説明する。

【0114】

「同類物検出処理」は、検出部１０８が備える同類物検出部１０８ｅによって実行される。

【0115】

図５のフローチャートのステップＳ３において検出対象の指定に係る言葉として「メロン」が入力され、図８のターゲット画像ＴＧａに対して「同類物検出処理」を実行する場合、同類物検出部１０８ｅは、まず、図４（ａ）の特徴情報テーブルＦＥを参照し、単語「メロン」に対応付けて格納されている、属性「同類物」に係る特徴である単語「スイカ」を取得する。

【0116】

次に、同類物検出部１０８ｅは、図４（ａ）の特徴情報テーブルＦＥを参照し、取得された単語「スイカ」に対応付けて格納されている、属性「画像」に係る特徴である照合画像＃１を取得する。

【0117】

同類物検出部１０８ｅは、図５のフローチャートのステップＳ１におけるオブジェクト・色・顔認識処理において認識された各対象物ＯＢを表す画像データと、照合画像＃１と、を照合することにより検出対象を検出する。

【0118】

このように、「同類物検出処理」において、同類物検出部１０８ｅは、特徴情報テーブルＦＥにおいて各単語に対応付けて格納されている、属性「同類物」に係る特徴として、他の単語を取得する。そして、特徴情報テーブルＦＥにおいて当該他の単語に対応付けて格納されている、属性「画像」に係る特徴として照合画像を取得し、該照合画像と、図５のフローチャートのステップＳ１におけるオブジェクト・色・顔認識処理によって認識された各対象物ＯＢを表す画像データと、を照合することにより検出対象を検出する。

【0119】

「関連用語検出処理」は、検出部１０８が備える関連用語検出部１０８ｆによって実行される。

【0120】

図５のフローチャートのステップＳ３において検出対象の指定に係る言葉として「メロン」が入力され、図８のターゲット画像ＴＧａに対して「関連用語検出処理」を実行する場合、関連用語検出部１０８ｆは、まず、図４（ａ）の特徴情報テーブルＦＥを参照し、単語「メロン」に対応付けて格納されている、属性「関連用語」に係る特徴である単語「種」「網」「高価」を取得する。

【0121】

次に、関連用語検出部１０８ｆは、特徴情報テーブルＦＥを参照し、単語「種」「網」「高価」に対応付けて格納されている単語であって、単語「メロン」とは異なる単語である「スイカ」「リンゴ」「ブドウ」を取得する。

【0122】

次に、関連用語検出部１０８ｆは、特徴情報テーブルＦＥを参照し、取得した単語「スイカ」「リンゴ」「ブドウ」に対応付けて格納されている、属性「画像」に係る特徴である照合画像＃１、照合画像＃５、照合画像＃６を取得する。関連用語検出部１０８ｆは、図５のフローチャートのステップＳ１におけるオブジェクト・色・顔認識処理によって認識された対象物ＯＢを表す画像データと、照合画像＃１、照合画像＃５、照合画像＃６と、を照合することにより検出対象の検出を試みる。

【0123】

このように、「関連用語検出処理」において、関連用語検出部１０８ｆは、特徴情報テーブルＦＥにおいて各単語に対応付けて格納されている、属性「関連用語」に係る特徴を取得する。そして、当該取得された単語に対応付けて格納されている他の単語を取得する。そして、当該他の単語に対応付けて特徴情報テーブルＦＥに属性「画像」に係る特徴として格納されている照合画像を取得し、該照合画像と、図５のフローチャートのステップＳ１におけるオブジェクト・色・顔認識処理によって認識された各対象物ＯＢを表す画像データと、を照合することにより検出対象を検出する。

【0124】

図６のフローチャートに戻り、ステップＳ４４の「名称検出処理」が終了した後、処理はステップＳ５１へ移行する。

【0125】

ステップＳ４３において「色検出」が検出方法として選択された場合、検出部１０８が備える色検出部１０８ｂは、「色検出処理」を実行する（ステップＳ４５）。

【0126】

色検出部１０８ｂが実行する「色検出処理」を、図９のターゲット画像ＴＧｂを例に、検出対象を指定する言葉として単語「アカイ」が図５のフローチャートのステップＳ３において入力されたと仮定して具体的に説明する。ターゲット画像ＴＧｂは、互いに色が異なる複数の対象物ＯＢ１ｂ〜ＯＢ３ｂを含んでいる。対象物ＯＢ１ｂは緑色、対象物ＯＢ２ｂは赤色、対象物ＯＢ３ｂは青色である。

【0127】

ステップＳ４５の「色検出処理」において、色検出部１０８ｂは、ステップＳ１において認識部１０１が認識した各対象物ＯＢの色の分布を示す情報に基づいて、抽出部１０４がステップＳ４１において抽出し、ステップＳ４２において属性を判別した属性が色である「赤い」という特徴に類似する特徴を有する対象物ＯＢを検出する。具体的には、色検出部１０８ｂは、ターゲット画像ＴＧｂ内の各対象物ＯＢの領域内の画素値を解析して、「赤い」に対応する所定範囲の画素値を有する対象物ＯＢを検出する。ターゲット画像ＴＧｂに対する色検出の例では、検出部１０８は、ターゲット画像ＴＧｂ内の３つの対象物ＯＢ１ｂ〜ＯＢ３ｂのうち、赤色の対象物ＯＢ２ｂを、検出対象として検出する。

【0128】

ステップＳ４５の「色検出処理」が終了した後、処理はステップＳ５１へ移行する。

【0129】

ステップＳ４３において「形状検出」が検出方法として選択された場合、検出部１０８が備える形状検出部１０８ｃは、「形状検出処理」を実行する（ステップＳ４６）。

【0130】

形状検出部１０８ｃが実行する「形状検出処理」を、図１０のターゲット画像ＴＧｃを例に、検出対象を指定する言葉として単語「マルイ」が図５のフローチャートのステップＳ３において入力されたと仮定して具体的に説明する。ターゲット画像ＴＧｃは、互いに形状が異なる複数の対象物ＯＢ１ｃ〜ＯＢ３ｃを含んでいる。対象物ＯＢ１ｃは丸い形状、対象物ＯＢ２ｃは円筒形状、対象物ＯＢ３ｃは直方体である。

【0131】

ステップＳ４５の「形状検出処理」において、形状検出部１０８ｃは、ステップＳ１において認識部１０１が認識した各対象物ＯＢの形状を示す情報に基づいて、抽出部１０４がステップＳ４１において抽出し、ステップＳ４２において属性を判別した属性が形状である「丸い」という特徴に類似する特徴を有する対象物ＯＢを検出する。具体的には、形状検出部１０８ｃは、ターゲット画像ＴＧｃ内の各対象物ＯＢの輪郭から形状を解析して、「丸い」に対応する形状を有する対象物ＯＢを検出する。ターゲット画像ＴＧｃに対する形状検出の例では、検出部１０８は、ターゲット画像ＴＧｃ内の３つの対象物ＯＢ１ｃ〜ＯＢ３ｃのうち、丸い形状の対象物ＯＢ１ｃを、検出対象として検出する。

【0132】

ステップＳ４５の「形状検出処理」が終了した後、処理はステップＳ５１へ移行する。

【0133】

ステップＳ４３において「大きさ検出」が検出方法として選択された場合、検出部１０８が備える位置・大きさ検出部１０８ｄは、「大きさ検出処理」を実行する（ステップＳ４７）。

【0134】

位置・大きさ検出部１０８ｄが実行する「大きさ検出処理」を、図１１のターゲット画像ＴＧｄを例に、検出対象を指定する言葉として単語「オオキイ」が図５のフローチャートのステップＳ３において入力されたと仮定して具体的に説明する。ターゲット画像ＴＧｄは、大きさが異なる複数の対象物ＯＢ１ｄ〜ＯＢ９ｄを含んでいる。具体的には、対象物ＯＢ１ｄ〜ＯＢ３ｄの大きさは最も大きく、対象物ＯＢ４ｄ〜ＯＢ６ｄの大きさは中程度であって、対象物ＯＢ７ｄ〜ＯＢ９ｄの大きさは最も小さい。

【0135】

ステップＳ４７の「大きさ検出処理」において、位置・大きさ検出部１０８ｄは、ステップＳ１において認識部１０１が認識した対象物の中から、抽出部１０４がステップＳ４１において抽出し、ステップＳ４２において属性を判別した属性が大きさである「大きい」という特徴に類似する特徴を有する対象物ＯＢを検出する。具体的には、位置・大きさ検出部１０８ｄは、ターゲット画像ＴＧｄ内の各対象物ＯＢの領域の面積を比較して、相対的に大きい対象物ＯＢを検出する。ターゲット画像ＴＢｄに対する大きさ検出の例では、検出部１０８は、ターゲット画像ＴＢｄ内の９つの対象物ＯＢ１ｄ〜ＯＢ９ｄのうち、最も大きい対象物ＯＢ１ｄ〜ＯＢ３ｄを、検出対象として検出する。

【0136】

ステップＳ４７の「大きさ検出処理」が終了した後、処理はステップＳ５１へ移行する。

【0137】

ステップＳ４３において「広がり方向位置検出」が検出方法として選択された場合、検出部１０８が備える位置・大きさ検出部１０８ｄは、「広がり方向位置検出処理」を実行する（ステップＳ４８）。

【0138】

位置・大きさ検出部１０８ｄが実行する「広がり方向位置検出処理」を、図１１のターゲット画像ＴＧｄを例に、検出対象を指定する言葉として単語「ミギガワ」が図５のフローチャートのステップＳ３において入力されたと仮定して具体的に説明する。ターゲット画像ＴＧｂは、互いにターゲット画像ＴＧｄ内における位置が異なる複数の対象物ＯＢ１ｄ〜ＯＢ９ｄを含んでいる。

【0139】

ステップＳ４８の「広がり方向位置検出処理」において、検出部１０７は、ステップＳ１において認識部１０１が認識した対象物ＯＢの中から、抽出部１０４がステップＳ４１において抽出し、ステップＳ４２において属性を判別した属性が広がり方向の位置関係である「右側」という特徴に類似する特徴を有する対象物ＯＢを検出する。具体的には、位置・大きさ検出部１０８ｄは、ターゲット画像ＴＧｄ内の各対象物ＯＢの領域の位置を比較して、相対的に右側に位置している対象物ＯＢを検出する。ターゲット画像ＴＢｄに対する広がり方向位置検出の例では、検出部１０８は、ターゲット画像ＴＢｄ内の９つの対象物ＯＢ１ｄ〜ＯＢ９ｄのうち、最も右側に位置している対象物ＯＢ９ｄを、検出対象として検出する。

【0140】

ステップＳ４８の「広がり方向位置検出処理」が終了した後、処理はステップＳ５１へ移行する。

【0141】

ステップＳ４３において「奥行き方向位置検出」が検出方法として選択された場合、検出部１０８が備える位置・大きさ検出部１０８ｄは、「奥行き方向位置検出処理」を実行する（ステップＳ４９）。

【0142】

位置・大きさ方向検出部１０８ｄが実行する「奥行き方向位置検出処理」を、図１１のターゲット画像ＴＧｄを例に、検出対象を指定する言葉として単語「オク」が図５のフローチャートのステップＳ３において入力されたと仮定して具体的に説明する。ターゲット画像ＴＧｄは、距離の異なる複数の対象物ＯＢ１ｄ〜ＯＢ９ｄを含んでいる。

【0143】

ステップＳ４９の「奥行き方向位置検出処理」において、位置・大きさ検出部１０８ｄは、ステップＳ１において認識部１０１が認識した対象物ＯＢの中から、抽出部１０４がステップＳ４１において抽出し、ステップＳ４２において属性を判別した属性が奥行き方向の位置関係である「奥」という特徴に類似する特徴を有する対象物ＯＢを検出する。具体的には、位置・大きさ検出部１０８ｄは、距離測定部１０２によって測定された各対象物ＯＢまでの距離を比較して、相対的に奥に位置している、すなわち距離測定部１０２によって測定された距離が相対的に大きい対象物ＯＢを検出する。ターゲット画像ＴＢｄに対する奥行き方向位置検出の例では、検出部１０８は、ターゲット画像ＴＢｄ内の９つの対象物ＯＢ１ｄ〜ＯＢ９ｄのうち、最も奥に位置している対象物ＯＢ７ｄ〜ＯＢ９ｄを、検出対象として検出する。

【0144】

ステップＳ４９の「奥行き方向位置検出処理」が終了した後、処理はステップＳ５１へ移行する。

【0145】

ステップＳ４３において「組み合わせ検出」が検出方法として選択された場合、検出部１０８は、「組み合わせ検出処理」を実行する（ステップＳ５０）。具体的には、検出部１０８は、検出対象の指定に係る属性を構成する複数の属性ごとの検出方法を組み合わせて検出対象を検出する。

【0146】

具体的には、検出部１０８は、図６のフローチャートのステップＳ４１において抽出された係り受けを構成する単語のうち、被修飾語である単語の検出対象の指定に係る属性に対応する検出方法によって検出を実行する。次いで、検出部１０８は、該検出によって検出された対象物ＯＢを対象として、ステップＳ４１において抽出された係り受けを構成する単語のうち、修飾語である単語それぞれの検出対象の指定に係る属性に対応する検出方法を用いて順次、検出を実行する。

【0147】

ここで、検出部１０８が実行する「組み合わせ検出処理」を、図１２のターゲット画像ＴＧｅを例に、検出対象を指定する言葉として「テマエノハナビラ」が図５のフローチャートのステップＳ３において入力されたと仮定して具体的に説明する。

【0148】

ここで、ターゲット画像ＴＧｅは、図１２に示すように、対象物ＯＢ１ｅを含んでいる。対象物ＯＢ１ｅは、花びらを含む花である。

【0149】

図６のフローチャートのステップＳ４１において、抽出部１０４は、係り受けを構成する単語として、修飾語である「テマエノ」と、被修飾語である「ハナビラ」と、を抽出する。次にステップＳ４２において属性を判別し、属性が奥行き方向の位置関係である「手前の」と属性が名称である「花びら」により、ステップＳ５０の「組み合わせ検出」を開始すると、検出部１０８は、被修飾語である「花びら」の検出対象の指定に係る属性「名称」に対応する検出方法である「名称検出」を実行することによって、ターゲット画像ＴＧに含まれる対象物ＯＢ１ｅの花びら部分を検出する。

【0150】

次に、検出部１０８は、係り受けを構成する単語のうち修飾語である「手前の」の検出対象の指定に係る属性「奥行き方向の位置関係」に対応する検出方法「奥行き方向の位置検出」を実行する。この際に、検出部１０８は、先の「名称検出」によって検出した、対象物ＯＢ１ｅの複数の花びらのうち、手前に位置する花びら（図１２において矢印で示した花びら）を検出対象として検出する。

【0151】

ステップＳ５０の「組み合わせ検出処理」が終了した後、処理はステップＳ５１へ移行する。

【0152】

図６のフローチャートのステップＳ５１の処理において、検出部１０８は、検出対象の指定に係る属性としてステップＳ４２で判別された全ての属性について、対応する検出方法による検出を実行したか否かを判別する（ステップＳ５１）。

【0153】

検出対象の指定に係る属性としてステップＳ４２において判別された属性のうち、対応する検出方法による検出を未だ実行していない属性があると判別した場合（ステップＳ５１；Ｎｏ）、処理はステップＳ４３へ戻る。そして、選択部１０６は、未だ対応する検出方法による検出を実行していない属性について、対応する検出方法を選択する。

【0154】

最終的に、検出部１０８が全ての属性に対応する検出方法で検出を実行済みであると判別すると（ステップＳ５１；Ｙｅｓ）、オブジェクト検出処理を終了する。

【0155】

図５のフローチャートに戻って、ステップＳ４のオブジェクト検出処理を終了した後、オブジェクト検出処理において検出対象が検出されたか否かを判別する（ステップＳ５）。

【0156】

ステップＳ４のオブジェクト検出処理において検出対象が検出されなかったと判別された場合（ステップＳ５；Ｎｏ）、実行部１０９は、デフォルトのフォーカス対象を囲むフォーカス枠を表示し（ステップＳ６）、処理はステップＳ７へ移る。具体的には、実行部１０９は、ステップＳ６において、図５のフローチャートのステップＳ１におけるオブジェクト・色・顔認識処理において顔画像領域が認識されていた場合は当該顔画像領域を囲むフォーカス枠を表示し、認識していなかった場合は、ステップＳ１で取得したターゲット画像ＴＧの中心を囲むフォーカス枠を表示する。

【0157】

ステップＳ４のオブジェクト検出処理において検出対象が検出されたと判別された場合（ステップＳ５；Ｙｅｓ）、実行部１０９は、検出された検出対象をフォーカス対象に設定し（ステップＳ８）、当該検出対象を囲むフォーカス枠を表示して（ステップＳ９）、処理はステップＳ７へ移る。なお、オブジェクト検出処理において検出対象が複数検出された場合は、ライブビュー画像のより中心に位置する対象物ＯＢを検出対象とする。

【0158】

ステップＳ７では、ＣＰＵ２１は、シャッターボタンが押下されたか否かを判別する（ステップＳ７）。シャッターボタンが押下されていないと判別した場合（ステップＳ７；Ｎｏ）、ＣＰＵ２１は、その後キャンセルボタンが押下されるまで、ステップＳ３〜Ｓ９を繰り返す。すなわち、ＣＰＵ２１は、引き続き、検出対象を指定する言葉の入力を受け付け、入力された言葉から検出対象を検出する処理を実行する。

【0159】

シャッターボタンが押下されたと判別した場合（ステップＳ７；Ｙｅｓ）、実行部１０９は、設定されたフォーカス対象へフォーカス（焦点）を合わせるＡＦ（オートフォーカス）処理を実行する（ステップＳ１０）。そして、撮影部１１０は、フォーカス対象を撮影して（ステップＳ１１）、生成した撮影画像を表示部３１に表示させると共に主記憶部２３に格納し、撮影処理を終了する。

【0160】

以上説明したように、本実施形態に係る検出装置１は、操作者によって音声入力された言葉によって指定されるフォーカス対象をターゲット画像ＴＧから検出して、検出したフォーカス対象にオートフォーカスする。一度撮影した後やセルフタイマーを起動させた後でもフォーカス対象を簡単に変更でき、また自由に音声を入力してフォーカス対象を指定することができるので、指定に時間がかからず、類似する複数の被写体がある場合にも的確にフォーカス対象を指定することができる。

【0161】

（変形例）
本実施形態において、検出装置１は、指定対象を指定する言葉の音声による入力を受け付けた。しかし、言葉は、音声入力に限らず、キーボードを用いた入力等の任意の方法により入力することができる。

【0162】

本実施形態において、検出装置１は、撮像した画像をターゲット画像ＴＧとして取得した。しかし、ターゲット画像ＴＧは、検出装置１が撮像した画像に限らず、検出装置１が予め撮像し記憶していた画像でもよいし、検出装置１の外部の装置から取得した画像でもよい。

【0163】

本実施形態において、検出装置１は、検出した検出対象を囲むフォーカス枠を表示し、当該検出対象にフォーカスを合わせるＡＦ（オートフォーカス）処理を実行した。しかし、本発明に係る検出装置は、ＡＦ処理以外の任意の処理を検出対象に施すことができる。例えば、検出装置１は、自動的に露出を調節するＡＥ（自動露出、オートエクスポージャ）処理や、自動的にホワイトバランスを調節するＡＷＢ（オートホワイトバランス）処理等を検出対象に施してもよい。

【0164】

上述の実施形態では、本発明に係る検出装置及び検出方法を、撮影機能を備えた装置を例に用いて説明した。しかし、本発明に係る検出装置及び検出方法は、カメラ等の撮影機能を備えた装置に限らず、コンピュータ、携帯電話機、デジタルカメラ、ＰＤＡ（ＰｅｒｓｏｎａｌＤｉｇｉｔａｌＡｓｓｉｓｔａｎｃｅ）等の任意の電子機器によって実現することができる。そして、実行部１０９は、検出部１０８により検出された検出対象に対して、撮影部１１０による撮影のためのＡＦ、ＡＥ、ＡＷＢ等の処理以外の所定の処理を実行してもよい。例えば、複数の検出対象を含む画像を表示画面に表示する電子機器において、実行部１０９は、検出部１０８により検出された検出対象が表示画面の中心に位置するように、位置を変えて画像を表示するようにしてもよい。このように、検出部１０８により検出された検出対象に対して実行部１０９が様々な処理を実行することで、操作者の操作性を向上させることができる。

【0165】

具体的には、コンピュータ、携帯電話機、デジタルカメラ、ＰＤＡ等を本発明に係る検出装置として機能させるためのプログラムを、これらの電子機器が読み取り可能な記録媒体（例えば、メモリカードやＣＤ−ＲＯＭ（ＣｏｍｐａｃｔＤｉｓｃＲｅａｄ−ＯｎｌｙＭｅｍｏｒｙ）、ＤＶＤ−ＲＯＭ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃＲｅａｄ−ＯｎｌｙＭｅｍｏｒｙ）等）に格納して配布し、インストールすることにより本発明に係る検出装置を実現することができる。

【0166】

或いは、上記プログラムを、インターネット等の通信ネットワーク上のサーバ装置が有する記憶装置（例えば、ディスク装置等）に格納しておき、コンピュータ、携帯電話機、デジタルカメラ、ＰＤＡ等がこのプログラムをダウンロードすることによって本発明に係る検出装置を実現してもよい。

【0167】

また、本発明に係る検出装置の機能を、オペレーティングシステム（ＯＳ）とアプリケーションプログラムとの協働又は分担により実現する場合には、アプリケーションプログラム部分のみを記録媒体や記憶装置に格納してもよい。

【0168】

また、アプリケーションプログラムを搬送波に重畳し、通信ネットワークを介して配信してもよい。例えば、通信ネットワーク上の掲示板（ＢＢＳ：ＢｕｌｌｅｔｉｎＢｏａｒｄＳｙｓｔｅｍ）にアプリケーションプログラムを掲示し、ネットワークを介してアプリケーションプログラムを配信してもよい。そして、このアプリケーションプログラムをコンピュータにインストールして起動し、ＯＳの制御下で、他のアプリケーションプログラムと同様に実行することにより、本発明に係る検出装置を実現してもよい。

【0169】

以上、本発明の好ましい実施形態について説明したが、本発明は係る特定の実施形態に限定されるものではなく、本発明には、特許請求の範囲に記載された発明とその均等の範囲が含まれる。以下に、本願出願当初の特許請求の範囲に記載された発明を付記する。

【0170】

（付記１）
画像から検出対象を検出する検出装置であって、
前記検出対象を指定する言葉を入力する入力手段と、
前記入力手段により入力された言葉から前記検出対象の指定に係る属性を判別する判別手段と、
前記判別手段により判別された属性に応じて、前記検出対象の検出方法を選択する選択手段と、
前記選択手段により選択された検出方法により、前記画像から前記検出対象を検出する検出手段と、を備える、
ことを特徴とする検出装置。

【0171】

（付記２）
前記判別手段は、前記入力手段により入力された言葉が有する属性に係る特徴から、前記検出対象の指定に係る属性に係る特徴を、更に、判別する、
ことを特徴とする付記１に記載の検出装置。

【0172】

（付記３）
前記検出手段は、前記選択手段により選択された検出方法により、前記画像から前記判別手段により判別された属性に係る特徴が一致する検出対象を検出する、
ことを特徴とする付記２に記載の検出装置。

【0173】

（付記４）
前記画像に含まれる不特定の対象物を、属性に係る特徴に基づいて認識する認識手段を備え、
前記検出手段は、前記認識手段により認識された対象物の中から、前記判別手段により判別された属性に係る特徴が一致する検出対象を検出する、
ことを特徴とする付記２又は３に記載の検出装置。

【0174】

（付記５）
対象物の名称と検出のための特徴情報とを対応づけて記憶する特徴情報記憶手段を、更に備え、
前記判別手段は、前記入力手段により入力された言葉から、前記検出対象の指定に係る属性の一として、名称を判別し、
前記選択手段は、前記判別手段により前記検出対象の指定に係る属性が名称であると判別された場合に、前記特徴情報記憶手段により名称に対応づけて記憶されている前記特徴情報に基づく検出方法を選択し、
前記検出手段は、前記認識手段により認識された対象物から、前記選択手段により選択された前記特徴情報に基づく検出方法により前記検出対象を検出する、
ことを特徴とする付記４に記載の検出装置。

【0175】

（付記６）
前記特徴情報記憶手段は、前記特徴情報として優先順位の付けられた複数の属性に係る特徴を、前記対象物の名称に対応づけて記憶し、
前記選択手段は、前記判別手段により前記検出対象の指定に係る属性が名称であると判別された場合に、前記特徴情報記憶手段により名称に対応づけて記憶されている前記特徴情報における前記複数の属性に基づく検出方法を、前記優先順位の順に選択し、
前記検出手段は、前記選択手段により前記優先順位の順に選択された検出方法により、前記認識手段により認識された対象物から、前記検出対象を検出する、
ことを特徴とする付記５に記載の検出装置。

【0176】

（付記７）
前記判別手段は、前記入力手段により入力された言葉から、前記検出対象の指定に係る属性の一として、色を判別し、
前記選択手段は、前記判別手段により前記検出対象の指定に係る属性が色であると判別された場合に、色に基づく検出方法を選択し、
前記検出手段は、前記選択手段により選択された検出方法として、前記認識手段により認識された対象物の色の分布を解析して前記検出対象を検出する、
ことを特徴とする付記４乃至６の何れか１つに記載の検出装置。

【0177】

（付記８）
前記判別手段は、前記入力手段により入力された言葉から、前記検出対象の指定に係る属性の一として、形状を判別し、
前記選択手段は、前記判別手段により前記検出対象の指定に係る属性が形状であると判別された場合に、形状に基づく検出方法を選択し、
前記検出手段は、前記選択手段により選択された検出方法として、前記認識手段により認識された対象物の輪郭から形状を解析して前記検出対象を検出する、
ことを特徴とする付記４乃至７の何れか１つに記載の検出装置。

【0178】

（付記９）
前記判別手段は、前記入力手段により入力された言葉から、前記検出対象の指定に係る属性の一として、大きさを判別し、
前記選択手段は、前記判別手段により前記検出対象の指定に係る属性が大きさであると判別された場合に、大きさに基づく検出方法を選択し、
前記検出手段は、前記選択手段により選択された検出方法として、前記認識手段により認識された対象物の面積を比較して前記検出対象を検出する、
ことを特徴とする付記４乃至８の何れか１つに記載の検出装置。

【0179】

（付記１０）
前記判別手段は、前記入力手段により入力された言葉から、前記検出対象の指定に係る属性の一として、広がり方向の位置関係を判別し、
前記選択手段は、前記判別手段により前記検出対象の指定に係る属性が広がり方向の位置関係であると判別された場合に、広がり方向の位置関係に基づく検出方法を選択し、
前記検出手段は、前記認識手段により認識された対象物の前記画像内における位置を比較して検出対象を検出する、
ことを特徴とする付記４乃至９の何れか１つに記載の検出装置。

【0180】

（付記１１）
前記認識手段により認識された対象物までの距離を測定する距離測定手段を更に備え、
前記判別手段は、前記入力手段により入力された言葉から、前記検出対象の指定に係る属性の一として、奥行き方向の位置関係を判別し、
前記選択手段は、前記判別手段により前記検出対象の指定に係る属性が奥行き方向の位置関係であると判別された場合に、奥行き方向の位置関係に基づく検出方法を選択し、
前記検出手段は、前記距離測定手段により測定された距離を比較して検出対象を検出する、
ことを特徴とする付記４乃至１０の何れか１つに記載の検出装置。

【0181】

（付記１２）
前記判別手段は、前記入力手段により入力された言葉から、前記検出対象の指定に係る属性が複数の属性の組み合わせであると判別し、
前記選択手段は、前記判別手段により判別された組み合わせを構成する複数の属性ごとの検出方法を選択し、
前記検出手段は、前記選択手段により選択された複数の検出方法を組み合わせて、前記画像から前記検出対象を検出する、
ことを特徴とする付記１乃至１１の何れか１つに記載の検出装置。

【0182】

（付記１３）
前記入力手段は、
音声を入力する音声入力手段と、
前記音声入力手段により入力された音声を言葉に変換することにより、前記検出対象を指定する言葉を取得する変換手段と、
を備える、
ことを特徴とする付記１乃至１２の何れか１つに記載の検出装置。

【0183】

（付記１４）
前記検出手段により検出された前記検出対象に対して、所定の処理を実行する実行手段を、更に備える、
ことを特徴とする付記１乃至１３の何れか１つに記載の検出装置。

【0184】

（付記１５）
撮影手段を更に備え、
前記実行手段は、前記所定の処理として、前記撮影手段による撮影のためのオートフォーカス、オートエクスポージャ、又はオートホワイトバランスのいずれかの処理を実行する、
ことを特徴とする付記１４に記載の検出装置。

【0185】

（付記１６）
画像から検出対象を検出する検出装置であって、
音声を入力する音声入力手段により入力された音声を言葉に変換する変換手段と、
前記変換手段により変換された言葉から特徴を抽出する抽出手段と、
前記抽出手段により抽出された特徴に類似する特徴を有する前記検出対象を、前記画像から検出する検出手段と、を備える、
ことを特徴とする検出装置。

【0186】

（付記１７）
前記抽出手段は、前記変換手段により変換された言葉から、名称、色、形状、大きさ或いは位置関係の内の少なくとも一である属性に係る特徴を抽出し、
前記検出手段は、前記抽出手段により抽出された属性に係る特徴に類似する特徴を有する前記検出対象を、前記画像から検出する、
ことを特徴とする付記１６に記載の検出装置。

【0187】

（付記１８）
画像から検出対象を検出する検出方法であって、
前記検出対象を指定する言葉を入力する入力処理と、
前記入力処理により入力された言葉から前記検出対象の指定に係る属性を判別する判別処理と、
前記判別処理により判別された属性に応じて、前記検出対象の検出方法を選択する選択処理と、
前記選択処理により選択された検出方法により、前記画像から前記検出対象を検出する検出処理と、を含む、
ことを特徴とする検出方法。

【0188】

（付記１９）
コンピュータを、画像から検出対象を検出する検出装置として機能させるプログラムであって、
前記検出対象を指定する言葉を入力する入力機能と、
前記入力機能により入力された言葉から前記検出対象の指定に係る属性を判別する判別機能と、
前記判別機能により判別された属性に応じて、前記検出対象の検出方法を選択する選択機能と、
前記選択機能により選択された検出方法により、前記画像から前記検出対象を検出する検出機能と、をコンピュータに実現させる、
ことを特徴とするプログラム。

【0189】

（付記２０）
画像から検出対象を検出する検出方法であって、
音声を入力する音声入力処理により入力された音声を言葉に変換する変換処理と、
前記変換処理により変換された言葉から特徴を抽出する抽出処理と、
前記抽出処理により抽出された特徴に類似する特徴を有する前記検出対象を、前記画像から検出する検出処理と、を含む、
ことを特徴とする検出方法。

【0190】

（付記２１）
コンピュータを、画像から検出対象を検出する検出装置として機能させるプログラムであって、
音声を入力する音声入力機能により入力された音声を言葉に変換する変換機能と、
前記変換機能により変換された言葉から特徴を抽出する抽出機能と、
前記抽出機能により抽出された特徴に類似する特徴を有する前記検出対象を、前記画像から検出する検出機能と、をコンピュータに実現させる、
ことを特徴とするプログラム。

【符号の説明】

【0191】

１…検出装置、１０…撮像部、１１…光学レンズ、１２…イメージセンサ、２０…処理部、２１…ＣＰＵ、２２…一時記憶部、２３…主記憶部、２４…画像出力部、３０…インタフェース、３１…表示部、３２…操作部、３３…音声入力部、３４…音声処理部、３５…音声出力部、３６…外部インタフェース、１０１…認識部、１０２…距離測定部、１０３…入力部、１０３ａ…変換部、１０４…抽出部、１０５…判別部、１０６…選択部、１０７…特徴情報記憶部、１０８…検出部、１０８ａ…名称検出部、１０８ｂ…色検出部、１０８ｃ…形状検出部、１０８ｄ…位置・大きさ検出部、１０８ｅ…同類物検出部、１０８ｆ…関連用語検出部、１０９…実行部、１１０…撮影部、ＴＧ…ターゲット画像、ＯＢ…対象物、ＦＥ…特徴情報テーブル、ＰＲ…検出優先度テーブル

【図1】