2022-190520 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

2022-190520撮像装置およびその制御方法、プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2022190520

(43)【公開日】2022-12-26

(54)【発明の名称】撮像装置およびその制御方法、プログラム

(51)【国際特許分類】

H04N 5/232 20060101AFI20221219BHJP

G03B 17/18 20210101ALI20221219BHJP

G03B 17/40 20210101ALI20221219BHJP

G10L 15/28 20130101ALI20221219BHJP

【ＦＩ】

H04N5/232

G03B17/18 Z

G03B17/40 Z

G10L15/28 230K

【審査請求】未請求

【請求項の数】12

【出願形態】ＯＬ

(21)【出願番号】P 2021098886

(22)【出願日】2021-06-14

(71)【出願人】

【識別番号】000001007

【氏名又は名称】キヤノン株式会社

(74)【代理人】

【識別番号】100125254

【弁理士】

【氏名又は名称】別役重尚

(72)【発明者】

【氏名】松野太郎

【テーマコード（参考）】

2H102

5C122

【Ｆターム（参考）】

2H102AA33

2H102BB32

5C122DA04

5C122EA06

5C122FD01

5C122FJ01

5C122FJ03

5C122FJ04

5C122FJ11

5C122FK12

5C122FK24

5C122FL06

5C122HA86

5C122HB01

5C122HB02

(57)【要約】

【課題】状況に応じて音声認識の実施・非実施を切り替える。
【解決手段】音声認識部１１４は、集音部１１３から入力された音声を認識する。制御部１０２は、音声認識部１１４を音声認識状態と非音声認識状態とに切り替える。制御部１０２は、合焦音の発音による報知が実施されたことに応じて音声認識部１１４を音声認識状態へ移行させ、報知が実施されてから第１の所定時間Ｔ１が経過したタイミングで音声認識部１１４を非音声認識状態へ移行させる。
【選択図】図２

【特許請求の範囲】

【請求項1】

音声を取得する取得手段と、
前記取得手段により取得された音声を認識する認識手段と、
所定の報知を実施する報知手段と、
前記認識手段を、前記取得された音声の認識を実施する認識状態と前記取得された音声の認識を実施しない非認識状態とに切り替える制御手段と、を有し、
前記制御手段は、前記報知手段により前記所定の報知が実施されたことに応じて前記認識手段を前記認識状態へ移行させ、所定のタイミングで前記認識手段を前記非認識状態へ移行させることを特徴とする撮像装置。

【請求項2】

前記所定の報知は、合焦したことを報知することであることを特徴とする請求項１に記載の撮像装置。

【請求項3】

前記所定の報知は、合焦音の発音によってなされることを特徴とする請求項２に記載の撮像装置。

【請求項4】

前記所定のタイミングは、前記所定の報知が実施されてから第１の所定時間が経過したタイミングであることを特徴とする請求項１乃至３のいずれか１項に記載の撮像装置。

【請求項5】

前記制御手段は、前記所定の報知が実施されてから前記第１の所定時間が経過する前に単写撮影の開始指示があった場合に単写撮影を実行すると共に、単写撮影の終了後にプレビュー表示を開始し、さらに、前記所定のタイミングを、前記単写撮影の終了後の前記プレビュー表示を終了させてから第２の所定時間が経過したタイミングに変更することを特徴とする請求項４に記載の撮像装置。

【請求項6】

前記制御手段は、前記所定の報知が実施されてから前記第１の所定時間が経過する前に連写撮影の開始指示があった場合は、前記認識手段を前記非認識状態へ移行させると共に連写撮影を実行することを特徴とする請求項４に記載の撮像装置。

【請求項7】

前記制御手段は、前記連写撮影の終了後にプレビュー表示を開始すると共に、前記連写撮影の終了後の前記プレビュー表示を開始したタイミングで前記認識手段を再び前記認識状態へ移行させることを特徴とする請求項６に記載の撮像装置。

【請求項8】

前記制御手段は、前記連写撮影の終了後の前記プレビュー表示を終了させてから第３の所定時間が経過したタイミングで、前記認識手段を前記非認識状態へ移行させることを特徴とする請求項７に記載の撮像装置。

【請求項9】

前記所定の報知は、連写撮影の終了後にプレビュー表示することであることを特徴とする請求項１に記載の撮像装置。

【請求項10】

前記所定のタイミングは、前記連写撮影の終了後の前記プレビュー表示を終了させてから第３の所定時間が経過したタイミングであることを特徴とする請求項９に記載の撮像装置。

【請求項11】

音声を取得する取得部と、前記取得部により取得された音声を認識する認識部と、を有する撮像装置の制御方法であって、
所定の報知を実施する報知ステップと、
前記認識部を、前記取得された音声の認識を実施する認識状態と前記取得された音声の認識を実施しない非認識状態とに切り替える制御ステップと、を有し、
前記制御ステップは、前記報知ステップにより前記所定の報知が実施されたことに応じて前記認識部を前記認識状態へ移行させ、所定のタイミングで前記認識部を前記非認識状態へ移行させることを特徴とする撮像装置の制御方法。

【請求項12】

コンピュータを、請求項１乃至１０のいずれか１項に記載の撮像装置の各手段として機能させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、音声認識機能を備える撮像装置およびその制御方法、プログラムに関する。

【背景技術】

【0002】

撮像装置には、マイクで集音した音声を認識する音声認識機能を備え、その認識結果に基づいて動作を制御するものが存在する。特許文献１では、撮像装置に備えられたバリアングル表示部（液晶画面）の角度に応じて、音声認識状態か非音声認識状態かを切り替えるものが提案されている。例えば、特許文献１の撮像装置では、ローアングル撮影、ハイアングル撮影、自分撮り、等のためにバリアングル表示部の角度を変えると、音声認識状態へ移行する。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０１６－０５８９８２号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、特許文献１では、バリアングル表示部の角度により音声認識状態となるか否かが切り替わるため、音声認識状態が長時間維持されるケースがある。このようなケースにおいては、ユーザが必ずしも音声認識の発動を望んでいるとは限らない。特に、意図していない状況で音声認識が実施されるとストレスの原因になるだけでなく、音声が誤認識されて不適切な動作につながるおそれもある。

【0005】

本発明は、状況に応じて音声認識の実施・非実施を切り替えることを目的とする。

【課題を解決するための手段】

【0006】

上記目的を達成するために本発明は、音声を取得する取得手段と、前記取得手段により取得された音声を認識する認識手段と、所定の報知を実施する報知手段と、前記認識手段を、前記取得された音声の認識を実施する認識状態と前記取得された音声の認識を実施しない非認識状態とに切り替える制御手段と、を有し、前記制御手段は、前記報知手段により前記所定の報知が実施されたことに応じて前記認識手段を前記認識状態へ移行させ、所定のタイミングで前記認識手段を前記非認識状態へ移行させることを特徴とする。

【発明の効果】

【0007】

本発明によれば、状況に応じて音声認識の実施・非実施を切り替えることができる。

【図面の簡単な説明】

【0008】

【図1】撮像装置のブロック図である。

【図2】撮像処理を示すフローチャートである。

【図3】音声認識部の状態遷移の類型を示す図である。

【図4】撮像処理を示すフローチャートである。

【図5】撮像処理を示すフローチャートである。

【発明を実施するための形態】

【0009】

以下、図面を参照して本発明の実施の形態を説明する。

【0010】

（第１の実施の形態）
図１は、本発明の第１の実施の形態に係る撮像装置のブロック図である。この撮像装置１００は、一例としてデジタルカメラとして構成される。

【0011】

撮像装置１００において、操作部１０１は、撮像装置１００に対して操作指示を行うためにユーザによって操作される。操作部１０１には、いずれも不図示の電源スイッチ、シャッタボタン、選択ボタン、レバー等のデバイスが含まれる。これらのデバイスをユーザが操作した結果は制御部１０２へ供給される。

【0012】

シャッタボタンの操作状態には、押下無し（非押下）、半押し、全押し、の３つの状態があり、それぞれの状態を制御部１０２は判別することができる。撮像装置１００は、操作部１０１のシャッタボタンが半押し状態の間、被写体に追従して合焦し続ける合焦機能を有する。また、撮像装置１００は、シャッタボタンが全押し状態の間、被写体への合焦と撮影を自動的に繰り返す連写を可能にする連写機能も有する。

【0013】

すなわち、撮像モードには、シャッタボタンの全押しにより１枚の静止画を撮影する単写モードと、シャッタボタンの全押しの継続により複数枚の静止画を連続して撮影する連写モードとがある。この撮影モードは、操作部１０１によってユーザが設定可能である。

【0014】

制御部１０２は例えばＭＰＵであり、撮像装置１００の動作を制御する。制御部１０２は、制御部１０２に接続された各構成部の動作を制御する。制御部１０２は、不図示のレジスタおよびＲＡＭを備えており、各構成部の制御に必要なステータス、演算結果、撮像装置１００の設定、などを記憶することができる。また、制御部１０２は、撮像部１０５から送信される撮像データに対して画像処理を施すことができる。また、制御部１０２は、測光部１１０から送信される被写体周辺の明るさ情報を基に、絞り部１１２を駆動する絞り駆動量を算出し、絞り部１１２を駆動制御することができる。また、制御部１０２は、焦点検出部１１１から送信される焦点位置情報を基に、レンズ部１０４を駆動するレンズ駆動量を算出し、レンズ部１０４を駆動制御することができる。

【0015】

メモリ１０３は、いわゆるＲＡＭチップであり、制御部１０２が画像処理を施した撮像データなどの各種データを記憶することができる。レンズ部１０４は、少なくとも１枚以上の光学レンズから成るレンズ群と、それらを駆動するための駆動部からなるレンズユニットである。被写体からの入射光がレンズ部１０４を通して撮像部１０５で結像する。

【0016】

撮像部１０５は、いわゆる撮像センサユニットである。撮像部１０５は、レンズ部１０４から入射した光から得られた電気信号をＡ／Ｄ変換し、それを撮像データとして制御部１０２へ送信する。撮像部１０５は、レンズ部１０４から光を取り込む際の、シャッタ動作機構も備えている。

【0017】

ファインダ部１０６は、いわゆるファインダである。ユーザがファインダ部１０６に接眼して覗き込むことにより被写体を見ることができる。また、ファインダ部１０６は、不図示の接眼センサを備えており、ユーザの接眼を検出した際は、後述の表示部１０７と同等の内容を表示することもできる。

【0018】

表示部１０７は、ユーザに情報を報知するためのデバイスであり、例えば表示パネルである。表示部１０７は、制御部１０２で画像処理が施された画像データを表示することができる。また、表示部１０７は、撮像装置１００に様々な設定をセットするためのメニュー画面を表示することもできる。なお、表示部１０７は、いわゆるタッチパネルのように、操作部１０１の機能の一部を含んでいてもよい。

【0019】

発音部１０８は、ユーザに情報を報知するためのデバイスであり、例えばスピーカである。発音部１０８は、「所定の報知」を実施する報知手段の一例である。発音部１０８は、合照音や操作音など、撮像装置１００の操作や状況報知に必要な様々な音を発音することができる。

【0020】

記録部１０９は、いわゆる記録メディアである。撮影された画像データは、記録部１０９に保存される。測光部１１０は、例えば測光センサであり、被写体周辺の明るさを測定する。測定された被写体周辺の明るさの情報は制御部１０２へ送信される。焦点検出部１１１は、被写体の焦点位置を検出する。検出した焦点位置の情報は制御部１０２へ送信される。

【0021】

絞り部１１２は、不図示の絞り駆動部を備える絞り機構であり、制御部１０２からの制御信号を受けて、レンズ部１０４から入射する光の量を調整する。集音部１１３は、音声を取得する取得手段（取得部）の一例であり、例えばマイクである。集音部１１３は、撮像装置１００の周辺の音声を集めて、音声信号として音声認識部１１４へ送信する。

【0022】

音声認識部１１４は、集音部１１３で取得された音声を認識する認識手段（認識部）の一例である。音声認識部１１４は、様々な音声認識アルゴリズムが実行可能となるライブラリ、通信機能、演算機能を有しており、それらを用いた音声認識アルゴリズムを利用して、集音部１１３から送信された音声信号の中からユーザの意図した設定や命令を認識する。音声認識部１１４は、認識結果を制御部１０２へ送信する。

【0023】

次に、図２、図３を用いて、撮像処理と、撮像処理における音声の認識処理について説明する。なお、音声認識部１１４の状態には、音声認識部１１４が音声の認識を実施する音声認識状態（認識状態）と、音声の認識を実施しない非音声認識状態（非認識状態）がある。これらの状態は、図２に示す撮像処理において条件によって切り替わる。

【0024】

図２は、撮像処理を示すフローチャートである。この処理は、制御部１０２が備えるＲＯＭに格納されたプログラムを制御部１０２が備えるＣＰＵが、制御部１０２が備えるＲＡＭに展開して実行することにより実現される。この処理は、操作部１０１のシャッタボタンが半押し状態になると開始される。この処理において、制御部１０２は、本発明における制御手段の一例である。

【0025】

図３は、音声認識部１１４の状態遷移の類型を示す図である。図３に示すケース１は、本実施の形態で生じ得るケースである。なお、ケース２、３は、後述する第２の実施の形態または第３の実施の形態に対応するので、これらについては後述する。

【0026】

本実施の形態では、撮影モードとして単写モードが設定されている場合を例にとる。図２の説明では、制御部１０２に接続されている各構成部が動作する際、特に明記していない場合は、各構成部は制御部１０２からの制御信号を受けて動作するものとする。

【0027】

まず、ステップＳ２０１では、制御部１０２は、測光部１１０に測光を実施させる。測光で得られた明るさの情報は制御部１０２へ送信される。なお、詳細は省略するが、測光および明るさ情報の送信は、これ以外のタイミングでも適宜行われる場合がある。

【0028】

ステップＳ２０２では、制御部１０２は、焦点検出部１１１に、被写体への焦点距離の検出を行わせ、それにより得られた焦点距離情報に基づいてレンズ駆動量を算出する。ステップＳ２０３では、制御部１０２は、算出したレンズ駆動量を基にレンズ部１０４を駆動する合焦動作を開始する。ステップＳ２０４では、制御部１０２は、合焦動作が完了したと判別するまで待機し、合焦動作が完了したと判別した場合は、ステップＳ２０５へ移行する。ステップＳ２０５では、制御部１０２は、発音部１０８に合焦音を発音させる。これにより合焦したことが報知される。ここでいう合焦音の発音は、「所定の報知」の実施に該当する。

【0029】

ステップＳ２０６では、制御部１０２は、音声認識部１１４を音声認識状態へ移行させる。なお、図２に示す処理の開始時点では、音声認識部１１４は非音声認識状態である。具体的には、制御部１０２は、集音部１１３を音声入力が可能な状態へ移行させると共に、音声認識部１１４を音声認識が可能な状態へと移行させる。ステップＳ２０６ではさらに、制御部１０２は、合焦音を発音した時点（撮像装置１００が音声認識状態へ移行した時点と同じ）からの経過時間である第１の所定時間Ｔ１のカウントを開始する。

【0030】

ステップＳ２０７では、制御部１０２は、操作部１０１におけるシャッタボタンが全押しされたか否かを判別する。そして制御部１０２は、シャッタボタンが全押しされていないと判別した場合は、ステップＳ２１１で、第１の所定時間Ｔ１が経過したか否かを判別する。そして制御部１０２は、第１の所定時間Ｔ１が経過していないと判別した場合は、ステップＳ２０７に戻る。制御部１０２は、第１の所定時間Ｔ１が経過したと判別した場合はステップＳ２１２に移行する。

【0031】

ステップＳ２１２では、制御部１０２は、音声認識部１１４を非音声認識状態へ移行させる。具体的には、制御部１０２は、集音部１１３を音声入力が可能でない状態へ移行させると共に、音声認識部１１４を音声認識が可能でない状態へと移行させる。ステップＳ２１２ではさらに、制御部１０２は、ステップＳ２０６で開始した第１の所定時間Ｔ１のカウントをクリアする。従って、第１の所定時間Ｔ１が経過するまでは音声認識部１１４の音声認識状態が継続するが、半押し状態のまま第１の所定時間Ｔ１が経過すると音声認識状態は終了する。

【0032】

ステップＳ２０７で、制御部１０２は、シャッタボタンが全押しされたと判別した場合はステップＳ２０８へ移行する。ステップＳ２０８では、制御部１０２は、絞り込み動作を開始する。すなわち、制御部１０２は、ステップＳ２０１で得られた明るさ情報に基づいて絞り駆動量を算出し、絞り部１１２を駆動する。ステップＳ２０９では、制御部１０２は、算出した絞り駆動量分の絞り込みが完了したか否かを判別し、絞り込みが完了したと判別するまで待機する。そして、制御部１０２は、絞り込みが完了したと判別するとステップＳ２１０へ移行する。

【0033】

ステップＳ２１０では、制御部１０２は、撮像動作を実施する。この動作は公知であるため詳細説明を省略する。主な動作として、制御部１０２は、撮像部１０５のシャッタを動作させ、レンズ部１０４から入射した光を取り込み、得られた電気信号をＡ／Ｄ変換して撮像データを得る。そして制御部１０２は、取り込まれた撮像データを順次、画像処理を施した後、写真データとして記録部１０９に記録する。

【0034】

ステップＳ２１４では、制御部１０２は、第１の所定時間Ｔ１が経過している否かを判別し、第１の所定時間Ｔ１が経過していると判別するまで待機する。そして制御部１０２は、第１の所定時間Ｔ１が経過していると判別した場合は、ステップＳ２１２に移行する。従って、第１の所定時間Ｔ１の経過前にシャッタボタンの全押しにより撮像動作が実施された場合でも、第１の所定時間Ｔ１が経過するまでは音声認識部１１４の音声認識状態が継続するが、第１の所定時間Ｔ１が経過すると音声認識状態は終了する。

【0035】

ステップＳ２１２の後、制御部１０２は、ステップＳ２１３で、その他の処理を実行して、図２に示す処理を終了する。ここでいう「その他の処理」では、例えば、シャッタボタンの半押し状態から全押し状態への移行があれば、ステップＳ２０８～Ｓ２１０と同様の撮像等の処理が実行される。

【0036】

なお、図２に示す処理において、シャッタボタンの半押し状態から押下無し状態への移行があれば、制御部１０２は、図２に示す終了を終了させる。その際、第１の所定時間Ｔ１のカウントが未クリアであればクリアし、音声認識部１１４が音声認識状態であれば非音声認識状態へ移行させてから図２に示す終了を終了させる。

【0037】

図３を参照し、音声認識部１１４の状態遷移の一例を説明する。ケース１に示すように、ステップＳ２０５で合焦音が発音されることにより所定の報知が実施されると、撮像装置１００（音声認識部１１４）の音声認識状態が開始される（Ｓ２０５→Ｓ２０６）。そして、シャッタボタンが半押しのまま第１の所定時間Ｔ１が経過したタイミングで音声認識部１１４は非音声認識状態へ移行する（Ｓ２１１→Ｓ２１２）。また、音声認識状態の継続中にシャッタボタンの全押し状態があった場合は、撮像動作の完了後であって第１の所定時間Ｔ１が経過したタイミングで非音声認識状態へ移行する（Ｓ２１４→Ｓ２１２）。従って、音声認識状態の継続中にシャッタボタンの全押し状態があったか否かにかかわらず、合焦音が発音されてから第１の所定時間Ｔ１が経過するまでは音声認識状態が維持される。

【0038】

本実施の形態によれば、制御部１０２は、所定の報知（合焦音発音）が実施されたことに応じて音声認識部１１４を音声認識状態へ移行させ、所定のタイミングで非音声認識状態へ移行させる。本実施の形態においては、非音声認識状態へ移行する所定のタイミングは、所定の報知が実施されてから第１の所定時間Ｔ１が経過したタイミングである。よって、状況に応じて音声認識の実施・非実施を切り替えることができる。

【0039】

特に、合焦音発音の直後から撮像装置１００が音声認識状態へ移行することにより、ユーザは、合焦結果を踏まえた操作を音声入力によりストレス無く行うことができる。例えば、ユーザは合焦結果を確認した後、ピント位置の調整などを音声入力により行うことができる。また、音声認識状態の継続中に第１の所定時間Ｔ１が経過すると、自動的に非音声認識状態へ戻るので、望まない音声認識や、音声の誤認識の可能性を低減することができる。

【0040】

（第２の実施の形態）
本発明の第２の実施の形態では、第１の実施の形態に対し、撮像処理が異なり、その他の構成は同様である。

【0041】

図４は、撮像処理を示すフローチャートである。この処理の実行主体、開始条件は図２に示す撮像処理と同様である。なお、図４において、図２と同じ処理ステップについては同じステップ番号を用い、説明を適宜省略する。本実施の形態では、撮影モードとして単写モードが設定され、且つ撮影後のプレビュー表示が実施されるように設定されている場合を例にとる。

【0042】

ステップＳ２０１～Ｓ２１３は、図２で説明した通りである。ステップＳ２１０の後、ステップＳ４０１では、制御部１０２は、表示部１０７への撮影画像のプレビュー表示を開始する。この時点で音声認識部１１４は音声認識状態である。ステップＳ４０２では、制御部１０２は、プレビュー表示の終了条件が成立したか否かを判別する。プレビュー表示の終了条件は、例えば、ユーザによりプレビューの非表示が指示された場合や、プレビュー表示された状態でユーザの操作が無いまま閾値時間が経過した場合等に成立する。制御部１０２は、プレビュー表示の終了条件が成立したと判別するまで待機し、プレビュー表示の終了条件が成立したと判別すると、ステップＳ４０３に進む。

【0043】

ステップＳ４０３では、制御部１０２は、表示部１０７での撮影画像のプレビュー表示を終了する（非表示にする）。それと共に、制御部１０２は、プレビュー表示を終了した時点からの経過時間である第２の所定時間Ｔ２のカウントを開始する。

【0044】

ステップＳ４０４では、制御部１０２は、第２の所定時間Ｔ２が経過した否かを判別し、第２の所定時間Ｔ２が経過したと判別するまで待機する。そして制御部１０２は、第２の所定時間Ｔ２が経過したと判別した場合は、ステップＳ２１２に移行する。従って、単写撮影の終了後のプレビュー表示を終了させてから第２の所定時間Ｔ２が経過するまで、音声認識部１１４の音声認識状態が維持される。

【0045】

図３を参照し、音声認識部１１４の状態遷移の一例を説明する。ケース１に示すように、ステップＳ２０５で合焦音が発音されることにより音声認識部１１４の音声認識状態が開始される（Ｓ２０５→Ｓ２０６）。そして、シャッタボタンが半押しのまま第１の所定時間Ｔ１が経過した場合は、そのタイミングで非音声認識状態へ移行する（Ｓ２１１→Ｓ２１２）。この点は第１の実施の形態と同様である。

【0046】

一方、音声認識状態の継続中にシャッタボタンの全押し状態があった場合は、ケース２のように遷移する。この場合、単写撮影の開始指示があった場合であるので、制御部１０２は、単写撮影を実行すると共に、単写撮影の終了後にプレビュー表示を開始する（Ｓ２０８～Ｓ２１０→Ｓ４０１）。少なくともプレビュー表示の間、音声認識状態は継続する。さらに、制御部１０２は、プレビュー表示の終了時点からカウントを開始した第２の所定時間Ｔ２が経過したタイミングで、音声認識部１１４を非音声認識状態に移行させる。従って、実質的には、所定の報知（合焦音発音）が実施されてから第１の所定時間Ｔ１が経過する前に単写撮影の開始指示があった場合には、非音声認識状態へ移行する所定のタイミングが延長される。すなわち、所定のタイミングは、単写撮影の終了後のプレビュー表示を終了させてから第２の所定時間Ｔ２が経過したタイミングに変更される。

【0047】

よって、状況に応じて音声認識の実施・非実施を切り替えることができる。

【0048】

また、少なくともプレビュー表示期間中は音声認識状態が維持されるので、ユーザは、プレビュー表示の結果を踏まえた操作を、音声入力によりストレス無く行うことができる。例えば、ユーザは、プレビュー表示を確認した後、ホワイトバランスや露出の調整などを音声入力により行うことができる。

【0049】

また、単写撮影の終了後のプレビュー表示を終了させてから第２の所定時間Ｔ２が経過すると、自動的に非音声認識状態へ戻るので、望まない音声認識や、音声の誤認識の可能性を低減することができる。

【0050】

なお、ステップＳ４０１におけるプレビュー表示は、ユーザがファインダ部１０６に接眼している場合は、ファインダ部１０６に表示させてもよい。

【0051】

なお、本実施の形態におけるその他の処理（ステップＳ２１３）では、例えば、シャッタボタンの半押し状態から全押し状態への移行があれば、ステップＳ２０８へ移行してもよい。

【0052】

（第３の実施の形態）
本発明の第３の実施の形態では、第１の実施の形態に対し、撮像処理が異なり、その他の構成は同様である。

【0053】

図５は、撮像処理を示すフローチャートである。この処理の実行主体、開始条件は図２に示す撮像処理と同様である。なお、図５において、図２と同じ処理ステップについては同じステップ番号を用い、説明を適宜省略する。本実施の形態では、撮影モードとして連写モードが設定され、且つ撮影後のプレビュー表示が実施されるように設定されている場合を例にとる。

【0054】

ステップＳ２０１～Ｓ２１３は、図２で説明した通りである。ステップＳ２１０の後、ステップＳ５０１では、制御部１０２は、操作部１０１におけるシャッタボタンの全押し状態が維持されているか否かを判別する。シャッタボタンの全押し状態が維持されていることは、連写撮影の開始指示があったことを意味する。そして制御部１０２は、シャッタボタンの全押し状態が維持されていないと判別した場合は、連写を行うことなくステップＳ５０４に進む。しかし制御部１０２は、シャッタボタンの全押し状態が維持されていると判別した場合は、連写撮影を実施するためにステップＳ５０２へ進む。

【0055】

ステップＳ５０２では、制御部１０２は、ステップＳ２１２と同様の処理を実行する。従って、音声認識状態の継続中にシャッタボタンの全押し状態の継続があった場合は、音声認識部１１４は一旦、非音声認識状態へ移行する。このように連写撮影の開始直後に非音声認識状態へ移行するのは、連写撮影中には設定変更やその他の操作をしたい場面が少ないからである。

【0056】

ステップＳ５０３では、制御部１０２は、連写２コマ目以降の制御を実行する。ここでは、全押し状態の期間に応じた枚数の連写が実行される。この動作は公知であるため詳細説明は省略する。概略としては、ステップＳ２０１～Ｓ２０５での測光や合焦動作、ステップＳ２０８～Ｓ２１０での絞り込み動作や撮像動作が、シャッタボタンの全押し状態が維持されている期間、繰り返される。

【0057】

ステップＳ５０３の後、制御部１０２は、ステップＳ５０４に進む。ステップＳ５０４では、制御部１０２は、表示部１０７への撮影画像のプレビュー表示を開始する。ステップＳ５０５では、制御部１０２は、音声認識部１１４を音声認識状態へ移行させる。なお、ここで、ステップＳ５０２、Ｓ５０３を経由した場合は、音声認識部１１４は非音声認識状態となっているので、再び音声認識状態へ移行する。一方、ステップＳ５０２、Ｓ５０３を経由しなかった場合は、音声認識状態が継続される。

【0058】

ステップＳ５０６では、制御部１０２は、図４のステップＳ４０２と同様の処理を実行する。ステップＳ５０６で、制御部１０２は、プレビュー表示の終了条件が成立したと判別すると、ステップＳ５０７に進む。ステップＳ５０７では、制御部１０２は、表示部１０７での撮影画像のプレビュー表示を終了する（非表示にする）。それと共に、制御部１０２は、プレビュー表示を終了した時点からの経過時間である第３の所定時間Ｔ３のカウントを開始する。従って、少なくともプレビュー表示期間中は音声認識状態が継続する。

【0059】

ステップＳ５０８では、制御部１０２は、第３の所定時間Ｔ３が経過した否かを判別し、第３の所定時間Ｔ３が経過したと判別するまで待機する。そして制御部１０２は、第３の所定時間Ｔ３が経過したと判別した場合は、ステップＳ２１２に移行する。従って、単写撮影または連写撮影の終了後のプレビュー表示を終了させてから第３の所定時間Ｔ３が経過するまで、音声認識部１１４の音声認識状態が維持される。

【0060】

図３を参照し、音声認識部１１４の状態遷移の一例を説明する。ケース１に示すように、シャッタボタンが半押しのまま第１の所定時間Ｔ１が経過した場合の処理は、第１、第２の実施の形態と同様である（Ｓ２１１→Ｓ２１２）。また、単写撮影の開始指示があった場合、制御部１０２は、プレビュー表示の終了時点からカウントを開始した第３の所定時間Ｔ３が経過したタイミングで、音声認識部１１４を非音声認識状態に移行させる（Ｓ５０１→Ｓ５０４～Ｓ５０８→Ｓ２１２）。この処理は、ケース２で第２の所定時間Ｔ２を第３の所定時間Ｔ３に置き換えたものに相当し、実質的に第２の実施の形態と同様となる。

【0061】

また、音声認識部１１４が音声認識状態のまま第１の所定時間Ｔ１が経過する前に連写撮影の開始指示があった場合は、ケース３のように遷移する。まず、制御部１０２は、非音声認識状態へ移行させると共に連写撮影を実行する（Ｓ５０１→Ｓ５０２→Ｓ５０３）。このように、撮像装置１００が連写撮影動作を開始する場合に、一旦、自動的に非音声認識状態へ戻ることにより、音声の誤認識の可能性を低減することができる。

【0062】

そして、連写撮影の終了後に、制御部１０２はプレビュー表示を開始すると共に、連写撮影の終了後のプレビュー表示を開始したタイミングで音声認識部１１４を再び音声認識状態へ移行させる（Ｓ５０４→Ｓ５０５）。

【0063】

さらに制御部１０２は、連写撮影の終了後のプレビュー表示を終了させてから第３の所定時間Ｔ３が経過したタイミングで、音声認識部１１４を再び非音声認識状態へ移行させる（Ｓ５０７→Ｓ５０８→Ｓ２１２）。

【0064】

よって、状況に応じて音声認識の実施・非実施を切り替えることができる。

【0065】

【0066】

本実施の形態では、合焦音の発音を「所定の報知」と把握すれば、非音声認識状態へ移行する「所定のタイミング」は、所定の報知が実施されてから第１の所定時間Ｔ１が経過したタイミングである。また、連写撮影の終了後にプレビュー表示することを「所定の報知」と把握すれば、「所定のタイミング」は、連写撮影後のプレビュー表示を終了させてから第３の所定時間Ｔ３が経過したタイミングである。

【0067】

【0068】

なお、第３の所定時間Ｔ３は、第２の所定時間Ｔ２または第１の所定時間Ｔ１と同じ値であってもよい。また、第２の所定時間Ｔ２は第１の所定時間Ｔ１と同じ値であってもよい。また、所定時間Ｔ１、Ｔ２、Ｔ３の値のデフォルト値は、制御部１０２が備えるＲＯＭに予め格納されるが、ユーザによって設定されるようにしてもよい。

【0069】

なお、上記各実施の形態において、「所定の報知」の一例として、合焦したことを報知することを挙げたが、合焦音の発音に限らず、表示による報知であってもよい。また、所定の報知は、合焦を知らせる報知や連写撮影の終了後のプレビュー表示に限定されない。

【0070】

なお、音声を取得する取得手段として集音部１１３を例示したが、ライン接続経由で音声情報を取得する手段であってもよい。

【0071】

以上、本発明をその好適な実施形態に基づいて詳述してきたが、本発明はこれら特定の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の様々な形態も本発明に含まれる。上述の実施形態の一部を適宜組み合わせてもよい。

【0072】

なお、制御部１０２が行うものとして説明した上述の各種制御処理は、１つのハードウェアが行ってもよいし、複数のハードウェアが処理を分担することで、装置全体の制御を行ってもよい。

【0073】

また、上述した実施形態においては、本発明をデジタルカメラに適用した場合を例にして説明したが、これに限定されず、本発明が適用される装置は撮像機能を備えればよく、カメラと呼称されない装置であってもよい。

【0074】

（その他の実施例）
本発明は、上記した実施形態の１以上の機能を実現するプログラムをネットワークや非一過性の記憶媒体を介してシステムや装置に供給し、そのシステム又は装置のコンピュータの１以上のプロセッサがプログラムを読み出して実行する処理でも実現可能である。以上のプログラムおよび以上のプログラムを記憶する記憶媒体は、本発明を構成する。また、本発明は、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。

【符号の説明】

【0075】

１００撮像装置
１０２制御部
１０８発音部
１１３集音部
１１４音声認識部

【図1】

【図2】

【図3】

【図4】

【図5】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版