(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022190520
(43)【公開日】2022-12-26
(54)【発明の名称】撮像装置およびその制御方法、プログラム
(51)【国際特許分類】
H04N 5/232 20060101AFI20221219BHJP
G03B 17/18 20210101ALI20221219BHJP
G03B 17/40 20210101ALI20221219BHJP
G10L 15/28 20130101ALI20221219BHJP
【FI】
H04N5/232
G03B17/18 Z
G03B17/40 Z
G10L15/28 230K
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2021098886
(22)【出願日】2021-06-14
(71)【出願人】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】100125254
【弁理士】
【氏名又は名称】別役 重尚
(72)【発明者】
【氏名】松野 太郎
【テーマコード(参考)】
2H102
5C122
【Fターム(参考)】
2H102AA33
2H102BB32
5C122DA04
5C122EA06
5C122FD01
5C122FJ01
5C122FJ03
5C122FJ04
5C122FJ11
5C122FK12
5C122FK24
5C122FL06
5C122HA86
5C122HB01
5C122HB02
(57)【要約】
【課題】状況に応じて音声認識の実施・非実施を切り替える。
【解決手段】音声認識部114は、集音部113から入力された音声を認識する。制御部102は、音声認識部114を音声認識状態と非音声認識状態とに切り替える。制御部102は、合焦音の発音による報知が実施されたことに応じて音声認識部114を音声認識状態へ移行させ、報知が実施されてから第1の所定時間T1が経過したタイミングで音声認識部114を非音声認識状態へ移行させる。
【選択図】
図2
【特許請求の範囲】
【請求項1】
音声を取得する取得手段と、
前記取得手段により取得された音声を認識する認識手段と、
所定の報知を実施する報知手段と、
前記認識手段を、前記取得された音声の認識を実施する認識状態と前記取得された音声の認識を実施しない非認識状態とに切り替える制御手段と、を有し、
前記制御手段は、前記報知手段により前記所定の報知が実施されたことに応じて前記認識手段を前記認識状態へ移行させ、所定のタイミングで前記認識手段を前記非認識状態へ移行させることを特徴とする撮像装置。
【請求項2】
前記所定の報知は、合焦したことを報知することであることを特徴とする請求項1に記載の撮像装置。
【請求項3】
前記所定の報知は、合焦音の発音によってなされることを特徴とする請求項2に記載の撮像装置。
【請求項4】
前記所定のタイミングは、前記所定の報知が実施されてから第1の所定時間が経過したタイミングであることを特徴とする請求項1乃至3のいずれか1項に記載の撮像装置。
【請求項5】
前記制御手段は、前記所定の報知が実施されてから前記第1の所定時間が経過する前に単写撮影の開始指示があった場合に単写撮影を実行すると共に、単写撮影の終了後にプレビュー表示を開始し、さらに、前記所定のタイミングを、前記単写撮影の終了後の前記プレビュー表示を終了させてから第2の所定時間が経過したタイミングに変更することを特徴とする請求項4に記載の撮像装置。
【請求項6】
前記制御手段は、前記所定の報知が実施されてから前記第1の所定時間が経過する前に連写撮影の開始指示があった場合は、前記認識手段を前記非認識状態へ移行させると共に連写撮影を実行することを特徴とする請求項4に記載の撮像装置。
【請求項7】
前記制御手段は、前記連写撮影の終了後にプレビュー表示を開始すると共に、前記連写撮影の終了後の前記プレビュー表示を開始したタイミングで前記認識手段を再び前記認識状態へ移行させることを特徴とする請求項6に記載の撮像装置。
【請求項8】
前記制御手段は、前記連写撮影の終了後の前記プレビュー表示を終了させてから第3の所定時間が経過したタイミングで、前記認識手段を前記非認識状態へ移行させることを特徴とする請求項7に記載の撮像装置。
【請求項9】
前記所定の報知は、連写撮影の終了後にプレビュー表示することであることを特徴とする請求項1に記載の撮像装置。
【請求項10】
前記所定のタイミングは、前記連写撮影の終了後の前記プレビュー表示を終了させてから第3の所定時間が経過したタイミングであることを特徴とする請求項9に記載の撮像装置。
【請求項11】
音声を取得する取得部と、前記取得部により取得された音声を認識する認識部と、を有する撮像装置の制御方法であって、
所定の報知を実施する報知ステップと、
前記認識部を、前記取得された音声の認識を実施する認識状態と前記取得された音声の認識を実施しない非認識状態とに切り替える制御ステップと、を有し、
前記制御ステップは、前記報知ステップにより前記所定の報知が実施されたことに応じて前記認識部を前記認識状態へ移行させ、所定のタイミングで前記認識部を前記非認識状態へ移行させることを特徴とする撮像装置の制御方法。
【請求項12】
コンピュータを、請求項1乃至10のいずれか1項に記載の撮像装置の各手段として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声認識機能を備える撮像装置およびその制御方法、プログラムに関する。
【背景技術】
【0002】
撮像装置には、マイクで集音した音声を認識する音声認識機能を備え、その認識結果に基づいて動作を制御するものが存在する。特許文献1では、撮像装置に備えられたバリアングル表示部(液晶画面)の角度に応じて、音声認識状態か非音声認識状態かを切り替えるものが提案されている。例えば、特許文献1の撮像装置では、ローアングル撮影、ハイアングル撮影、自分撮り、等のためにバリアングル表示部の角度を変えると、音声認識状態へ移行する。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1では、バリアングル表示部の角度により音声認識状態となるか否かが切り替わるため、音声認識状態が長時間維持されるケースがある。このようなケースにおいては、ユーザが必ずしも音声認識の発動を望んでいるとは限らない。特に、意図していない状況で音声認識が実施されるとストレスの原因になるだけでなく、音声が誤認識されて不適切な動作につながるおそれもある。
【0005】
本発明は、状況に応じて音声認識の実施・非実施を切り替えることを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するために本発明は、音声を取得する取得手段と、前記取得手段により取得された音声を認識する認識手段と、所定の報知を実施する報知手段と、前記認識手段を、前記取得された音声の認識を実施する認識状態と前記取得された音声の認識を実施しない非認識状態とに切り替える制御手段と、を有し、前記制御手段は、前記報知手段により前記所定の報知が実施されたことに応じて前記認識手段を前記認識状態へ移行させ、所定のタイミングで前記認識手段を前記非認識状態へ移行させることを特徴とする。
【発明の効果】
【0007】
本発明によれば、状況に応じて音声認識の実施・非実施を切り替えることができる。
【図面の簡単な説明】
【0008】
【
図3】音声認識部の状態遷移の類型を示す図である。
【発明を実施するための形態】
【0009】
以下、図面を参照して本発明の実施の形態を説明する。
【0010】
(第1の実施の形態)
図1は、本発明の第1の実施の形態に係る撮像装置のブロック図である。この撮像装置100は、一例としてデジタルカメラとして構成される。
【0011】
撮像装置100において、操作部101は、撮像装置100に対して操作指示を行うためにユーザによって操作される。操作部101には、いずれも不図示の電源スイッチ、シャッタボタン、選択ボタン、レバー等のデバイスが含まれる。これらのデバイスをユーザが操作した結果は制御部102へ供給される。
【0012】
シャッタボタンの操作状態には、押下無し(非押下)、半押し、全押し、の3つの状態があり、それぞれの状態を制御部102は判別することができる。撮像装置100は、操作部101のシャッタボタンが半押し状態の間、被写体に追従して合焦し続ける合焦機能を有する。また、撮像装置100は、シャッタボタンが全押し状態の間、被写体への合焦と撮影を自動的に繰り返す連写を可能にする連写機能も有する。
【0013】
すなわち、撮像モードには、シャッタボタンの全押しにより1枚の静止画を撮影する単写モードと、シャッタボタンの全押しの継続により複数枚の静止画を連続して撮影する連写モードとがある。この撮影モードは、操作部101によってユーザが設定可能である。
【0014】
制御部102は例えばMPUであり、撮像装置100の動作を制御する。制御部102は、制御部102に接続された各構成部の動作を制御する。制御部102は、不図示のレジスタおよびRAMを備えており、各構成部の制御に必要なステータス、演算結果、撮像装置100の設定、などを記憶することができる。また、制御部102は、撮像部105から送信される撮像データに対して画像処理を施すことができる。また、制御部102は、測光部110から送信される被写体周辺の明るさ情報を基に、絞り部112を駆動する絞り駆動量を算出し、絞り部112を駆動制御することができる。また、制御部102は、焦点検出部111から送信される焦点位置情報を基に、レンズ部104を駆動するレンズ駆動量を算出し、レンズ部104を駆動制御することができる。
【0015】
メモリ103は、いわゆるRAMチップであり、制御部102が画像処理を施した撮像データなどの各種データを記憶することができる。レンズ部104は、少なくとも1枚以上の光学レンズから成るレンズ群と、それらを駆動するための駆動部からなるレンズユニットである。被写体からの入射光がレンズ部104を通して撮像部105で結像する。
【0016】
撮像部105は、いわゆる撮像センサユニットである。撮像部105は、レンズ部104から入射した光から得られた電気信号をA/D変換し、それを撮像データとして制御部102へ送信する。撮像部105は、レンズ部104から光を取り込む際の、シャッタ動作機構も備えている。
【0017】
ファインダ部106は、いわゆるファインダである。ユーザがファインダ部106に接眼して覗き込むことにより被写体を見ることができる。また、ファインダ部106は、不図示の接眼センサを備えており、ユーザの接眼を検出した際は、後述の表示部107と同等の内容を表示することもできる。
【0018】
表示部107は、ユーザに情報を報知するためのデバイスであり、例えば表示パネルである。表示部107は、制御部102で画像処理が施された画像データを表示することができる。また、表示部107は、撮像装置100に様々な設定をセットするためのメニュー画面を表示することもできる。なお、表示部107は、いわゆるタッチパネルのように、操作部101の機能の一部を含んでいてもよい。
【0019】
発音部108は、ユーザに情報を報知するためのデバイスであり、例えばスピーカである。発音部108は、「所定の報知」を実施する報知手段の一例である。発音部108は、合照音や操作音など、撮像装置100の操作や状況報知に必要な様々な音を発音することができる。
【0020】
記録部109は、いわゆる記録メディアである。撮影された画像データは、記録部109に保存される。測光部110は、例えば測光センサであり、被写体周辺の明るさを測定する。測定された被写体周辺の明るさの情報は制御部102へ送信される。焦点検出部111は、被写体の焦点位置を検出する。検出した焦点位置の情報は制御部102へ送信される。
【0021】
絞り部112は、不図示の絞り駆動部を備える絞り機構であり、制御部102からの制御信号を受けて、レンズ部104から入射する光の量を調整する。集音部113は、音声を取得する取得手段(取得部)の一例であり、例えばマイクである。集音部113は、撮像装置100の周辺の音声を集めて、音声信号として音声認識部114へ送信する。
【0022】
音声認識部114は、集音部113で取得された音声を認識する認識手段(認識部)の一例である。音声認識部114は、様々な音声認識アルゴリズムが実行可能となるライブラリ、通信機能、演算機能を有しており、それらを用いた音声認識アルゴリズムを利用して、集音部113から送信された音声信号の中からユーザの意図した設定や命令を認識する。音声認識部114は、認識結果を制御部102へ送信する。
【0023】
次に、
図2、
図3を用いて、撮像処理と、撮像処理における音声の認識処理について説明する。なお、音声認識部114の状態には、音声認識部114が音声の認識を実施する音声認識状態(認識状態)と、音声の認識を実施しない非音声認識状態(非認識状態)がある。これらの状態は、
図2に示す撮像処理において条件によって切り替わる。
【0024】
図2は、撮像処理を示すフローチャートである。この処理は、制御部102が備えるROMに格納されたプログラムを制御部102が備えるCPUが、制御部102が備えるRAMに展開して実行することにより実現される。この処理は、操作部101のシャッタボタンが半押し状態になると開始される。この処理において、制御部102は、本発明における制御手段の一例である。
【0025】
図3は、音声認識部114の状態遷移の類型を示す図である。
図3に示すケース1は、本実施の形態で生じ得るケースである。なお、ケース2、3は、後述する第2の実施の形態または第3の実施の形態に対応するので、これらについては後述する。
【0026】
本実施の形態では、撮影モードとして単写モードが設定されている場合を例にとる。
図2の説明では、制御部102に接続されている各構成部が動作する際、特に明記していない場合は、各構成部は制御部102からの制御信号を受けて動作するものとする。
【0027】
まず、ステップS201では、制御部102は、測光部110に測光を実施させる。測光で得られた明るさの情報は制御部102へ送信される。なお、詳細は省略するが、測光および明るさ情報の送信は、これ以外のタイミングでも適宜行われる場合がある。
【0028】
ステップS202では、制御部102は、焦点検出部111に、被写体への焦点距離の検出を行わせ、それにより得られた焦点距離情報に基づいてレンズ駆動量を算出する。ステップS203では、制御部102は、算出したレンズ駆動量を基にレンズ部104を駆動する合焦動作を開始する。ステップS204では、制御部102は、合焦動作が完了したと判別するまで待機し、合焦動作が完了したと判別した場合は、ステップS205へ移行する。ステップS205では、制御部102は、発音部108に合焦音を発音させる。これにより合焦したことが報知される。ここでいう合焦音の発音は、「所定の報知」の実施に該当する。
【0029】
ステップS206では、制御部102は、音声認識部114を音声認識状態へ移行させる。なお、
図2に示す処理の開始時点では、音声認識部114は非音声認識状態である。具体的には、制御部102は、集音部113を音声入力が可能な状態へ移行させると共に、音声認識部114を音声認識が可能な状態へと移行させる。ステップS206ではさらに、制御部102は、合焦音を発音した時点(撮像装置100が音声認識状態へ移行した時点と同じ)からの経過時間である第1の所定時間T1のカウントを開始する。
【0030】
ステップS207では、制御部102は、操作部101におけるシャッタボタンが全押しされたか否かを判別する。そして制御部102は、シャッタボタンが全押しされていないと判別した場合は、ステップS211で、第1の所定時間T1が経過したか否かを判別する。そして制御部102は、第1の所定時間T1が経過していないと判別した場合は、ステップS207に戻る。制御部102は、第1の所定時間T1が経過したと判別した場合はステップS212に移行する。
【0031】
ステップS212では、制御部102は、音声認識部114を非音声認識状態へ移行させる。具体的には、制御部102は、集音部113を音声入力が可能でない状態へ移行させると共に、音声認識部114を音声認識が可能でない状態へと移行させる。ステップS212ではさらに、制御部102は、ステップS206で開始した第1の所定時間T1のカウントをクリアする。従って、第1の所定時間T1が経過するまでは音声認識部114の音声認識状態が継続するが、半押し状態のまま第1の所定時間T1が経過すると音声認識状態は終了する。
【0032】
ステップS207で、制御部102は、シャッタボタンが全押しされたと判別した場合はステップS208へ移行する。ステップS208では、制御部102は、絞り込み動作を開始する。すなわち、制御部102は、ステップS201で得られた明るさ情報に基づいて絞り駆動量を算出し、絞り部112を駆動する。ステップS209では、制御部102は、算出した絞り駆動量分の絞り込みが完了したか否かを判別し、絞り込みが完了したと判別するまで待機する。そして、制御部102は、絞り込みが完了したと判別するとステップS210へ移行する。
【0033】
ステップS210では、制御部102は、撮像動作を実施する。この動作は公知であるため詳細説明を省略する。主な動作として、制御部102は、撮像部105のシャッタを動作させ、レンズ部104から入射した光を取り込み、得られた電気信号をA/D変換して撮像データを得る。そして制御部102は、取り込まれた撮像データを順次、画像処理を施した後、写真データとして記録部109に記録する。
【0034】
ステップS214では、制御部102は、第1の所定時間T1が経過している否かを判別し、第1の所定時間T1が経過していると判別するまで待機する。そして制御部102は、第1の所定時間T1が経過していると判別した場合は、ステップS212に移行する。従って、第1の所定時間T1の経過前にシャッタボタンの全押しにより撮像動作が実施された場合でも、第1の所定時間T1が経過するまでは音声認識部114の音声認識状態が継続するが、第1の所定時間T1が経過すると音声認識状態は終了する。
【0035】
ステップS212の後、制御部102は、ステップS213で、その他の処理を実行して、
図2に示す処理を終了する。ここでいう「その他の処理」では、例えば、シャッタボタンの半押し状態から全押し状態への移行があれば、ステップS208~S210と同様の撮像等の処理が実行される。
【0036】
なお、
図2に示す処理において、シャッタボタンの半押し状態から押下無し状態への移行があれば、制御部102は、
図2に示す終了を終了させる。その際、第1の所定時間T1のカウントが未クリアであればクリアし、音声認識部114が音声認識状態であれば非音声認識状態へ移行させてから
図2に示す終了を終了させる。
【0037】
図3を参照し、音声認識部114の状態遷移の一例を説明する。ケース1に示すように、ステップS205で合焦音が発音されることにより所定の報知が実施されると、撮像装置100(音声認識部114)の音声認識状態が開始される(S205→S206)。そして、シャッタボタンが半押しのまま第1の所定時間T1が経過したタイミングで音声認識部114は非音声認識状態へ移行する(S211→S212)。また、音声認識状態の継続中にシャッタボタンの全押し状態があった場合は、撮像動作の完了後であって第1の所定時間T1が経過したタイミングで非音声認識状態へ移行する(S214→S212)。従って、音声認識状態の継続中にシャッタボタンの全押し状態があったか否かにかかわらず、合焦音が発音されてから第1の所定時間T1が経過するまでは音声認識状態が維持される。
【0038】
本実施の形態によれば、制御部102は、所定の報知(合焦音発音)が実施されたことに応じて音声認識部114を音声認識状態へ移行させ、所定のタイミングで非音声認識状態へ移行させる。本実施の形態においては、非音声認識状態へ移行する所定のタイミングは、所定の報知が実施されてから第1の所定時間T1が経過したタイミングである。よって、状況に応じて音声認識の実施・非実施を切り替えることができる。
【0039】
特に、合焦音発音の直後から撮像装置100が音声認識状態へ移行することにより、ユーザは、合焦結果を踏まえた操作を音声入力によりストレス無く行うことができる。例えば、ユーザは合焦結果を確認した後、ピント位置の調整などを音声入力により行うことができる。また、音声認識状態の継続中に第1の所定時間T1が経過すると、自動的に非音声認識状態へ戻るので、望まない音声認識や、音声の誤認識の可能性を低減することができる。
【0040】
(第2の実施の形態)
本発明の第2の実施の形態では、第1の実施の形態に対し、撮像処理が異なり、その他の構成は同様である。
【0041】
図4は、撮像処理を示すフローチャートである。この処理の実行主体、開始条件は
図2に示す撮像処理と同様である。なお、
図4において、
図2と同じ処理ステップについては同じステップ番号を用い、説明を適宜省略する。本実施の形態では、撮影モードとして単写モードが設定され、且つ撮影後のプレビュー表示が実施されるように設定されている場合を例にとる。
【0042】
ステップS201~S213は、
図2で説明した通りである。ステップS210の後、ステップS401では、制御部102は、表示部107への撮影画像のプレビュー表示を開始する。この時点で音声認識部114は音声認識状態である。ステップS402では、制御部102は、プレビュー表示の終了条件が成立したか否かを判別する。プレビュー表示の終了条件は、例えば、ユーザによりプレビューの非表示が指示された場合や、プレビュー表示された状態でユーザの操作が無いまま閾値時間が経過した場合等に成立する。制御部102は、プレビュー表示の終了条件が成立したと判別するまで待機し、プレビュー表示の終了条件が成立したと判別すると、ステップS403に進む。
【0043】
ステップS403では、制御部102は、表示部107での撮影画像のプレビュー表示を終了する(非表示にする)。それと共に、制御部102は、プレビュー表示を終了した時点からの経過時間である第2の所定時間T2のカウントを開始する。
【0044】
ステップS404では、制御部102は、第2の所定時間T2が経過した否かを判別し、第2の所定時間T2が経過したと判別するまで待機する。そして制御部102は、第2の所定時間T2が経過したと判別した場合は、ステップS212に移行する。従って、単写撮影の終了後のプレビュー表示を終了させてから第2の所定時間T2が経過するまで、音声認識部114の音声認識状態が維持される。
【0045】
図3を参照し、音声認識部114の状態遷移の一例を説明する。ケース1に示すように、ステップS205で合焦音が発音されることにより音声認識部114の音声認識状態が開始される(S205→S206)。そして、シャッタボタンが半押しのまま第1の所定時間T1が経過した場合は、そのタイミングで非音声認識状態へ移行する(S211→S212)。この点は第1の実施の形態と同様である。
【0046】
一方、音声認識状態の継続中にシャッタボタンの全押し状態があった場合は、ケース2のように遷移する。この場合、単写撮影の開始指示があった場合であるので、制御部102は、単写撮影を実行すると共に、単写撮影の終了後にプレビュー表示を開始する(S208~S210→S401)。少なくともプレビュー表示の間、音声認識状態は継続する。さらに、制御部102は、プレビュー表示の終了時点からカウントを開始した第2の所定時間T2が経過したタイミングで、音声認識部114を非音声認識状態に移行させる。従って、実質的には、所定の報知(合焦音発音)が実施されてから第1の所定時間T1が経過する前に単写撮影の開始指示があった場合には、非音声認識状態へ移行する所定のタイミングが延長される。すなわち、所定のタイミングは、単写撮影の終了後のプレビュー表示を終了させてから第2の所定時間T2が経過したタイミングに変更される。
【0047】
よって、状況に応じて音声認識の実施・非実施を切り替えることができる。
【0048】
また、少なくともプレビュー表示期間中は音声認識状態が維持されるので、ユーザは、プレビュー表示の結果を踏まえた操作を、音声入力によりストレス無く行うことができる。例えば、ユーザは、プレビュー表示を確認した後、ホワイトバランスや露出の調整などを音声入力により行うことができる。
【0049】
また、単写撮影の終了後のプレビュー表示を終了させてから第2の所定時間T2が経過すると、自動的に非音声認識状態へ戻るので、望まない音声認識や、音声の誤認識の可能性を低減することができる。
【0050】
なお、ステップS401におけるプレビュー表示は、ユーザがファインダ部106に接眼している場合は、ファインダ部106に表示させてもよい。
【0051】
なお、本実施の形態におけるその他の処理(ステップS213)では、例えば、シャッタボタンの半押し状態から全押し状態への移行があれば、ステップS208へ移行してもよい。
【0052】
(第3の実施の形態)
本発明の第3の実施の形態では、第1の実施の形態に対し、撮像処理が異なり、その他の構成は同様である。
【0053】
図5は、撮像処理を示すフローチャートである。この処理の実行主体、開始条件は
図2に示す撮像処理と同様である。なお、
図5において、
図2と同じ処理ステップについては同じステップ番号を用い、説明を適宜省略する。本実施の形態では、撮影モードとして連写モードが設定され、且つ撮影後のプレビュー表示が実施されるように設定されている場合を例にとる。
【0054】
ステップS201~S213は、
図2で説明した通りである。ステップS210の後、ステップS501では、制御部102は、操作部101におけるシャッタボタンの全押し状態が維持されているか否かを判別する。シャッタボタンの全押し状態が維持されていることは、連写撮影の開始指示があったことを意味する。そして制御部102は、シャッタボタンの全押し状態が維持されていないと判別した場合は、連写を行うことなくステップS504に進む。しかし制御部102は、シャッタボタンの全押し状態が維持されていると判別した場合は、連写撮影を実施するためにステップS502へ進む。
【0055】
ステップS502では、制御部102は、ステップS212と同様の処理を実行する。従って、音声認識状態の継続中にシャッタボタンの全押し状態の継続があった場合は、音声認識部114は一旦、非音声認識状態へ移行する。このように連写撮影の開始直後に非音声認識状態へ移行するのは、連写撮影中には設定変更やその他の操作をしたい場面が少ないからである。
【0056】
ステップS503では、制御部102は、連写2コマ目以降の制御を実行する。ここでは、全押し状態の期間に応じた枚数の連写が実行される。この動作は公知であるため詳細説明は省略する。概略としては、ステップS201~S205での測光や合焦動作、ステップS208~S210での絞り込み動作や撮像動作が、シャッタボタンの全押し状態が維持されている期間、繰り返される。
【0057】
ステップS503の後、制御部102は、ステップS504に進む。ステップS504では、制御部102は、表示部107への撮影画像のプレビュー表示を開始する。ステップS505では、制御部102は、音声認識部114を音声認識状態へ移行させる。なお、ここで、ステップS502、S503を経由した場合は、音声認識部114は非音声認識状態となっているので、再び音声認識状態へ移行する。一方、ステップS502、S503を経由しなかった場合は、音声認識状態が継続される。
【0058】
ステップS506では、制御部102は、
図4のステップS402と同様の処理を実行する。ステップS506で、制御部102は、プレビュー表示の終了条件が成立したと判別すると、ステップS507に進む。ステップS507では、制御部102は、表示部107での撮影画像のプレビュー表示を終了する(非表示にする)。それと共に、制御部102は、プレビュー表示を終了した時点からの経過時間である第3の所定時間T3のカウントを開始する。従って、少なくともプレビュー表示期間中は音声認識状態が継続する。
【0059】
ステップS508では、制御部102は、第3の所定時間T3が経過した否かを判別し、第3の所定時間T3が経過したと判別するまで待機する。そして制御部102は、第3の所定時間T3が経過したと判別した場合は、ステップS212に移行する。従って、単写撮影または連写撮影の終了後のプレビュー表示を終了させてから第3の所定時間T3が経過するまで、音声認識部114の音声認識状態が維持される。
【0060】
図3を参照し、音声認識部114の状態遷移の一例を説明する。ケース1に示すように、シャッタボタンが半押しのまま第1の所定時間T1が経過した場合の処理は、第1、第2の実施の形態と同様である(S211→S212)。また、単写撮影の開始指示があった場合、制御部102は、プレビュー表示の終了時点からカウントを開始した第3の所定時間T3が経過したタイミングで、音声認識部114を非音声認識状態に移行させる(S501→S504~S508→S212)。この処理は、ケース2で第2の所定時間T2を第3の所定時間T3に置き換えたものに相当し、実質的に第2の実施の形態と同様となる。
【0061】
また、音声認識部114が音声認識状態のまま第1の所定時間T1が経過する前に連写撮影の開始指示があった場合は、ケース3のように遷移する。まず、制御部102は、非音声認識状態へ移行させると共に連写撮影を実行する(S501→S502→S503)。このように、撮像装置100が連写撮影動作を開始する場合に、一旦、自動的に非音声認識状態へ戻ることにより、音声の誤認識の可能性を低減することができる。
【0062】
そして、連写撮影の終了後に、制御部102はプレビュー表示を開始すると共に、連写撮影の終了後のプレビュー表示を開始したタイミングで音声認識部114を再び音声認識状態へ移行させる(S504→S505)。
【0063】
さらに制御部102は、連写撮影の終了後のプレビュー表示を終了させてから第3の所定時間T3が経過したタイミングで、音声認識部114を再び非音声認識状態へ移行させる(S507→S508→S212)。
【0064】
よって、状況に応じて音声認識の実施・非実施を切り替えることができる。
【0065】
また、少なくともプレビュー表示期間中は音声認識状態が維持されるので、ユーザは、プレビュー表示の結果を踏まえた操作を、音声入力によりストレス無く行うことができる。例えば、ユーザは、プレビュー表示を確認した後、ホワイトバランスや露出の調整などを音声入力により行うことができる。
【0066】
本実施の形態では、合焦音の発音を「所定の報知」と把握すれば、非音声認識状態へ移行する「所定のタイミング」は、所定の報知が実施されてから第1の所定時間T1が経過したタイミングである。また、連写撮影の終了後にプレビュー表示することを「所定の報知」と把握すれば、「所定のタイミング」は、連写撮影後のプレビュー表示を終了させてから第3の所定時間T3が経過したタイミングである。
【0067】
なお、本実施の形態におけるその他の処理(ステップS213)では、例えば、シャッタボタンの半押し状態から全押し状態への移行があれば、ステップS208へ移行してもよい。
【0068】
なお、第3の所定時間T3は、第2の所定時間T2または第1の所定時間T1と同じ値であってもよい。また、第2の所定時間T2は第1の所定時間T1と同じ値であってもよい。また、所定時間T1、T2、T3の値のデフォルト値は、制御部102が備えるROMに予め格納されるが、ユーザによって設定されるようにしてもよい。
【0069】
なお、上記各実施の形態において、「所定の報知」の一例として、合焦したことを報知することを挙げたが、合焦音の発音に限らず、表示による報知であってもよい。また、所定の報知は、合焦を知らせる報知や連写撮影の終了後のプレビュー表示に限定されない。
【0070】
なお、音声を取得する取得手段として集音部113を例示したが、ライン接続経由で音声情報を取得する手段であってもよい。
【0071】
以上、本発明をその好適な実施形態に基づいて詳述してきたが、本発明はこれら特定の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の様々な形態も本発明に含まれる。上述の実施形態の一部を適宜組み合わせてもよい。
【0072】
なお、制御部102が行うものとして説明した上述の各種制御処理は、1つのハードウェアが行ってもよいし、複数のハードウェアが処理を分担することで、装置全体の制御を行ってもよい。
【0073】
また、上述した実施形態においては、本発明をデジタルカメラに適用した場合を例にして説明したが、これに限定されず、本発明が適用される装置は撮像機能を備えればよく、カメラと呼称されない装置であってもよい。
【0074】
(その他の実施例)
本発明は、上記した実施形態の1以上の機能を実現するプログラムをネットワークや非一過性の記憶媒体を介してシステムや装置に供給し、そのシステム又は装置のコンピュータの1以上のプロセッサがプログラムを読み出して実行する処理でも実現可能である。以上のプログラムおよび以上のプログラムを記憶する記憶媒体は、本発明を構成する。また、本発明は、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
【符号の説明】
【0075】
100 撮像装置
102 制御部
108 発音部
113 集音部
114 音声認識部