(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-05-11
(54)【発明の名称】音声コマンドを使用してカメラインタフェースを制御するための技術
(51)【国際特許分類】
H04N 5/232 20060101AFI20220428BHJP
G10L 15/28 20130101ALI20220428BHJP
G10L 15/10 20060101ALI20220428BHJP
G10L 15/00 20130101ALI20220428BHJP
G03B 7/091 20210101ALI20220428BHJP
G03B 7/093 20210101ALI20220428BHJP
G03B 7/095 20210101ALI20220428BHJP
G03B 7/097 20210101ALI20220428BHJP
G03B 17/38 20210101ALI20220428BHJP
G03B 17/18 20210101ALI20220428BHJP
【FI】
H04N5/232
H04N5/232 030
H04N5/232 450
H04N5/232 060
H04N5/232 300
G10L15/28 230K
G10L15/10 200W
G10L15/00 200T
G10L15/00 200G
G03B7/091
G03B7/093
G03B7/095
G03B7/097
G03B17/38 B
G03B17/18 Z
H04N5/232 250
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2021555326
(86)(22)【出願日】2020-04-20
(85)【翻訳文提出日】2021-09-13
(86)【国際出願番号】 IB2020053735
(87)【国際公開番号】W WO2020222073
(87)【国際公開日】2020-11-05
(32)【優先日】2019-04-29
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】000002185
【氏名又は名称】ソニーグループ株式会社
(74)【代理人】
【識別番号】100092093
【氏名又は名称】辻居 幸一
(74)【代理人】
【識別番号】100109070
【氏名又は名称】須田 洋之
(74)【代理人】
【識別番号】100067013
【氏名又は名称】大塚 文昭
(74)【代理人】
【識別番号】100109335
【氏名又は名称】上杉 浩
(74)【代理人】
【識別番号】100120525
【氏名又は名称】近藤 直樹
(72)【発明者】
【氏名】ミルン ジェームズ アール
【テーマコード(参考)】
2H002
2H020
2H102
5C122
【Fターム(参考)】
2H002AB02
2H002AB03
2H002CC01
2H002CC21
2H002CC31
2H002DB02
2H002FB56
2H002FB73
2H002FB81
2H002GA09
2H002GA61
2H002GA62
2H002HA11
2H020FB01
2H020FB05
2H102AA71
2H102BB08
5C122EA42
5C122EA63
5C122FA07
5C122FF01
5C122FF02
5C122FF21
5C122FJ04
5C122GC52
5C122HA87
5C122HB01
(57)【要約】
音声コマンドを使用してカメラ機能を制御して、面倒なメニュー操作の必要をなくすことができる。特定のカメラモード、例えば、P、A及びSモードのみで、音声コマンドを有効にすることができるが、オートモードではできない。
【選択図】
図2
【特許請求の範囲】
【請求項1】
システムであって、
一時的信号ではなく、かつ命令を含む少なくとも1つのコンピュータ媒体を含み、前記命令は、
音声トランスデューサを使用して、少なくとも1つの音声コマンドを受け取り、
前記少なくとも1つの音声コマンドに従って、少なくとも1つのカメラの少なくとも1つの機能を確立する、
ように少なくとも1つのプロセッサによって実行可能である、
ことを特徴とするシステム。
【請求項2】
前記少なくとも1つの機能はバルブモードに入ることを含み、前記バルブモードでは、写真キーが押下される限り、前記カメラが写真を撮影し続けることを特徴とする、請求項1に記載のシステム。
【請求項3】
前記命令は、
キーワード又はフレーズを受け取ることに応答して、前記カメラの音声制御を有効にする、
ように実行可能である、
ことを特徴とする、請求項1に記載のシステム。
【請求項4】
前記命令は、
前記カメラ又は前記カメラと通信するリモートコントロールのキーから信号を受け取ることに応答して、前記カメラの音声制御を有効にする、
ように実行可能である、
ことを特徴とする、請求項1に記載のシステム。
【請求項5】
前記命令は、
前記音声コマンドをキーワードセットと比較し、
前記キーワードセット内の要素に一致する前記音声コマンドに応答して、前記キーワードセット内の前記要素に相関する情報に従って、前記音声コマンドを実行し、
前記キーワードセット内の要素に一致しない前記音声コマンドに応答して、前記音声コマンドを無視する、
ように実行可能である、
ことを特徴とする、請求項1に記載のシステム。
【請求項6】
前記命令は、
ファームウェアの更新を使用して、前記キーワードの検索を拡張する、
ように実行可能である、
ことを特徴とする、請求項5に記載のシステム。
【請求項7】
前記少なくとも1つの機能は、前記少なくとも1つの音声コマンドに応答して、情報の検索を実行することを含み、前記命令は、
前記情報の検索の結果をディスプレイ上に提示する、
ように実行可能である、
ことを特徴とする、請求項1に記載のシステム。
【請求項8】
前記カメラに実装される前記少なくとも1つのプロセッサを含むことを特徴とする、請求項1に記載のシステム。
【請求項9】
前記カメラと無線通信するリモートコントロール装置に実装される前記少なくとも1つのプロセッサを含むことを特徴とする、請求項1に記載のシステム。
【請求項10】
システムであって、
一時的信号ではなく、かつ命令を含む少なくとも1つのコンピュータ媒体を含み、前記命令は、
音声トランスデューサを使用して、少なくとも1つの音声コマンドを受け取り、
カメラが第1のモードであることに応答して、前記少なくとも1つの音声コマンドに従って、前記カメラの少なくとも1つの機能を確立し、
前記カメラが第2のモードであることに応答して、前記少なくとも1つの音声コマンドを無視する、
ように少なくとも1つのプロセッサによって実行可能である、
ことを特徴とするシステム。
【請求項11】
前記第1のモードは、プログラムモード、絞り優先モード、シャッター優先モード、手動モードのうちの少なくとも1つを含み、前記第2のモードは、オートモードを含むことを特徴とする、請求項10に記載のシステム。
【請求項12】
前記第1のモードは、プログラムモードを含むことを特徴とする、請求項10に記載のシステム。
【請求項13】
前記第1のモードは、絞り優先モードを含むことを特徴とする、請求項10に記載のシステム。
【請求項14】
前記第1のモードは、シャッター優先モードを含むことを特徴とする、請求項10に記載のシステム。
【請求項15】
前記第1のモードは、手動モードを含むことを特徴とする、請求項10に記載のシステム。
【請求項16】
前記命令は、
ユーザ入力に従って、前記モードのうちの少なくとも1つを定義する、
ように実行可能である、
ことを特徴とする、請求項10に記載のシステム。
【請求項17】
前記カメラに実装される前記少なくとも1つのプロセッサを含むことを特徴とする、請求項10に記載のシステム。
【請求項18】
前記カメラと無線通信するリモートコントロール装置に実装される前記少なくとも1つのプロセッサを含むことを特徴とする、請求項10に記載のシステム。
【請求項19】
方法であって、
カメラとリモートコントロール装置との間でファイル転送を実行すべきことを識別することに応答して、前記カメラと前記リモートコントロール装置との間のWi-Fiリンクを確立して、前記ファイルを転送するようにするステップと、
前記カメラと前記リモートコントロール装置との間でコマンドを転送すべきことを識別することに応答して、前記カメラと前記リモートコントロール装置との間のBluetoothリンクを確立して、前記コマンドを転送するようにするステップと、
を含むことを特徴とする方法。
【請求項20】
前記コマンドは、音声コマンドであることを特徴とする、請求項19に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、一般に、音声コマンドを使用してカメラインタフェースを制御するための技術に関する。
【背景技術】
【0002】
本原理によって認識される問題は、カメラセットアップメニュー又は設定に迅速かつ容易に到達できることである。カメラは、特定のカメラ設定を見つける又は検索することを困難にする複雑なメニューシステムを有する傾向がある。
【発明の概要】
【発明が解決しようとする課題】
【0003】
所望の調整を見つけようとしてデジタルカメラのメニューシステムを探しまわるのではなく、ずっと容易な音声制御を実装して、様々なカメラ設定に変更を加えることができる。例えば、ユーザは、バルブモードに最終的に達するまでシャッター速度を調整し続けるのではなく、音声コマンドを介して、バルブモードに入るようにカメラに命じることができる。キーワードを認識するためのプロセッサが、カメラ又はカメラと無線通信するリモートコントロールの内部に存在することができる。キーワードを介して又はボタンを押すこと(例えば、シャッターボタンの半押し又はリモートコントロールのボタン)によって、音声制御を作動させることができる。
【0004】
音声制御は、特定のモードのみ(例えば、P、A、S又はMのうちの1又は2以上のみ)で実装することができ、オートモードではできない。或いは、音声制御は、オートモードのみで実装することができるか、又は全てのモードで実装することができる。
【0005】
まず、音声コマンドをキーワードセットに限定することができ、次のファームウェアの更新は、更なる機能が利用可能になるとそれを追加する。音声コマンドを使用して、メモリリコール(MR)設定を変更して、カメラが2又は3よりも多い設定(例えば、ボタン又は機械的制限)を有することができるようにすることもできる。音声コマンドを使用して、スマートフォン、ラップトップ、又は他のスマートデバイスにファイルを転送することができる。
【0006】
また、「オートフォーカスを検索する」などの音声コマンドに応答して、カメラ機能の検索を実行することができる。検索の結果をカメラのディスプレイ上に提示することができ、ディスプレイは、タッチ検知型とすることができる液晶ディスプレイ(LCD)として、ユーザが特定の検索項目を選択することによって適切なメニューを提示させるようにすることができる。
【0007】
更に、カメラの生体測定機能として音声認識を実装して、カメラ機能を確実にロック及びアンロックすることができる。カメラのシャッターボタン又は他の表面に、指紋センサを設けて、更なる生体測定ロック/アンロック機能を提供することができる。メニュー又は音声コマンドを使用して、生体測定機能を作動させる及び作動しないようにすることができる。
【0008】
リモートコントロールを使用してカメラを制御する場合、Wi-Fiを使用してリモートコントロールとカメラとの間の通信を実装して、ファイル転送を可能にすることができる。一方、ファイル転送ほどの帯域幅を必要としないコマンドには、Bluetoothなどの他のプロトコルを使用することができる。
【課題を解決するための手段】
【0009】
したがって、一態様では、システムは、一時的信号ではなく、かつ命令を含む少なくとも1つのコンピュータ媒体を含み、前記命令は、音声トランスデューサを使用して、少なくとも1つの音声コマンドを受け取り、前記少なくとも1つの音声コマンドに従って、少なくとも1つのカメラの少なくとも1つの機能を確立する、ように少なくとも1つのプロセッサによって実行可能である。
【0010】
実施例では、前記機能はバルブモードに入ることを含むことができ、前記バルブモードでは、写真キーが押下される限り、前記カメラが写真を撮影し続ける。
【0011】
非限定的な実施形態では、前記命令は、キーワード又はフレーズを受け取ることに応答して、前記カメラの音声制御を有効にする、ように実行可能とすることができる。いくつかの実施形態では、前記命令は、前記カメラ又は前記カメラと通信するリモートコントロールのキーから信号を受け取ることに応答して、前記カメラの音声制御を有効にする、ように実行可能とすることができる。
【0012】
いくつかの実施形態では、前記命令は、前記音声コマンドをキーワードセットと比較し、前記キーワードセット内の要素に一致する前記音声コマンドに応答して、前記キーワードセット内の前記要素に相関する情報に従って、前記音声コマンドを実行する、ように実行可能とすることができる。前記命令は、前記キーワードセット内の要素に一致しない前記音声コマンドに応答して、前記音声コマンドを無視する、ように実行可能とすることができる。前記命令は、更に、ファームウェアの更新を使用して、前記キーワードの検索を拡張する、ように実行可能とすることができる。
【0013】
1つの実装では、前記機能は、前記音声コマンドに応答して、情報の検索を実行することを含み、前記命令は、前記情報の検索の結果をディスプレイ上に提示する、ように実行可能とすることができる。
【0014】
前記システムは、前記カメラ又は前記カメラと無線通信するリモートコントロール装置に実装することができる前記プロセッサを含むことができる。
【0015】
別の態様では、システムは、一時的信号ではなく、かつ命令を含む少なくとも1つのコンピュータ媒体を含み、前記命令は、音声トランスデューサを使用して、少なくとも1つの音声コマンドを受け取る、ように少なくとも1つのプロセッサによって実行可能である。前記命令は、カメラが第1のモードであることに応答して、前記音声コマンドに従って、前記カメラの少なくとも1つの機能を確立する、ように実行可能である。前記命令は、また、前記カメラが第2のモードであることに応答して、前記音声コマンドを無視する、ように実行可能である。
【0016】
別の態様では、方法は、カメラとリモートコントロール装置との間でファイル転送を実行すべきことを識別することに応答して、前記カメラと前記リモートコントロール装置との間のWi-Fiリンクを確立して、前記ファイルを転送するようにするステップ、を含む。前記方法は、また、前記カメラと前記リモートコントロール装置との間でコマンドを転送すべきことを識別することに応答して、前記カメラと前記リモートコントロール装置との間のBluetoothリンクを確立して、前記コマンドを転送するようにするステップ、を含む。
【0017】
本出願の詳細は、その構造及び作動の両方に関して、同様の参照番号が同様の部分を指す添付図面を参照して最も良く理解することができる。
【図面の簡単な説明】
【0018】
【
図2】カメラのバルブモードに入るために音声コマンドを使用するための本原理による例示的なロジックのフローチャートである。
【
図3】特定のカメラモードのみで音声コマンドを有効にするための本原理による例示的なロジックのフローチャートである。
【
図4】
図3のロジックに付随してカメラ又はリモートコントロール上に提示することができる例示的なユーザインタフェース(UI)のスクリーンショットである。
【
図5】音声コマンドの実装において限定されたキーワードセットを使用するための本原理による例示的なロジックのフローチャートである。
【
図6】音声検索照会のための本原理による例示的なロジックのフローチャートである。
【
図7】
図6のロジックに付随してカメラ又はリモートコントロール上に提示することができるUIのスクリーンショットである。
【
図8】カメラのための生体測定ロック/アンロック機構として音声信号を使用するための本原理による例示的なロジックのフローチャートである。
【
図9】
図8のロジックに付随してカメラ又はリモートコントロール上に提示することができるUIのスクリーンショットである。
【
図10】カメラとリモートコントロールとの間の通信にどの無線プロトコルを使用するかを決定するための本原理による例示的なロジックのフローチャートである。
【発明を実施するための形態】
【0019】
本開示は、一般に、カメラ及び他の撮像エコシステムの態様を含むコンピュータエコシステムに関する。本明細書のシステムは、互いにデータを交換できるようにネットワークを介して接続されたサーバコンポーネント及びクライアントコンポーネントを含むことができる。クライアントコンポーネントは、ポータブルテレビ(例えば、スマートTV、インターネット対応TV)、ラップトップコンピュータ及びタブレットコンピュータなどのポータブルコンピュータ、並びにスマートフォン及び後述する更なる例を含むその他のモバイルデバイスなどの1又は2以上のコンピュータデバイスを含むことができる。これらのクライアントデバイスは、様々な動作環境で動作することができる。例えば、クライアントコンピュータの一部は、一例として、Microsoft社製のオペレーティングシステム、又はUnixオペレーティングシステム、又はApple社又はGoogle社製のオペレーティングシステムを使用することができる。これらの動作環境を用いて、Microsoft社又はGoogle社又はMozilla又はその他のブラウザプログラムによって作製された、後述するインターネットサーバによってホストされるウェブアプリケーションにアクセスできるブラウザなどの1又は2以上のブラウジングプログラムを実行することができる。
【0020】
サーバは、インターネットなどのネットワークを介してデータを送受信するようにサーバを構成する命令を実行する1又は2以上のプロセッサを含むことができる。或いは、ローカルイントラネット又は仮想プライベートネットワークを介してクライアントとサーバを接続することができる。
【0021】
クライアントとサーバとの間では、ネットワークを介して情報を交換することができる。この目的及びセキュリティのために、サーバ及び/又はクライアントは、ファイヤウォール、ロードバランサ、一時的ストレージ、及びプロキシ、並びに信頼性及びセキュリティを高めるその他のネットワークインフラを含むことができる。1又は2以上のサーバは、オンラインソーシャルウェブサイトなどのセキュアなコミュニティをネットワークメンバに提供する方法を実装する装置を形成することができる。
【0022】
本明細書で使用する命令は、システム内で情報を処理するためのコンピュータ実行ステップを意味する。命令は、ソフトウェア、ファームウェア、又はハードウェアに実装することができ、システムのコンポーネントが行うあらゆるタイプのプログラムステップを含むことができる。
【0023】
プロセッサは、アドレス回線、データ回線及び制御回線などの様々な回線、並びにレジスタ及びシフトレジスタによってロジックを実行できるいずれかの従来の汎用シングルチップ又はマルチチッププロセッサとすることができる。プロセッサは、例えば、デジタル信号プロセッサ(DSP)によって実装することができる。
【0024】
フローチャートによって説明するソフトウェアモジュール、及び本明細書におけるユーザインタフェースは、様々なサブルーチン、手順などを含むことができる。本開示を限定することなく、特定のモジュールによって実行されるものとして言及するロジックは、他のソフトウェアモジュールに再分配すること、及び/又は単一のモジュールに組み合わせること、及び/又は共有可能なライブラリ内で利用可能にすることができる。
【0025】
本明細書で説明する本原理は、ハードウェア、ソフトウェア、ファームウェア、又はこれらの組み合わせとして実装することができ、したがって、例示的なコンポーネント、ブロック、モジュール、回路及びステップについては、これらの機能面から説明する。
【0026】
上記で示唆したものに加え、以下で説明する論理ブロック、モジュール及び回路は、汎用プロセッサ、デジタルシグナルプロセッサ(DSP)、フィールドプログラマブルゲートアレイ(FPGA)、又は特定用途向け集積回路(ASIC)などの他のプログラマブル論理デバイス、離散ゲート又はトランジスタロジック、離散ハードウェアコンポーネント、又は本明細書で説明する機能を実行するように設計されたこれらのいずれかの組み合わせで実装又は実行することができる。プロセッサは、コントローラ、状態機械、又はコンピュータデバイスの組み合わせによって実装することができる。
【0027】
以下で説明する機能及び方法は、ソフトウェアで実装した場合、限定するわけではないが、C#又はC++などの適切な言語で書くことができ、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)、コンパクトディスクリードオンリメモリ(CD-ROM)、又はデジタル多用途ディスク(DVD)などの他の光ディスクストレージ、磁気ディスクストレージ、又は取り外し可能なサムドライブなどを含む他の磁気ストレージデバイスなどのコンピュータ可読記憶媒体に記憶するか、又はこれらを通じて伝送することができる。接続は、コンピュータ可読媒体を確立することができる。このような接続は、一例として、光ファイバ、同軸線、デジタル加入者回線(DSL)及びツイストペア線を含む配線ケーブルを含むことができる。
【0028】
1つの実施形態に含まれる構成要素を、他の実施形態においていずれかの適当な組み合わせで使用することもできる。例えば、本明細書で説明する及び/又は図に示す様々な構成要素のいずれも、組み合わせ、置き換え、又は他の実施形態から除外することができる。
【0029】
「A、B及びCのうちの少なくとも1つを有するシステム(同様に、「A、B又はCのうちの少なくとも1つを有するシステム」、及び「A、B、Cのうちの少なくとも1つを有するシステム」)」は、Aのみ、Bのみ、Cのみ、AとBの両方、AとCの両方、BとCの両方、及び/又はAとBとC全てなどを有するシステムを含む。
【0030】
まず、
図1を参照すると、デジタルカメラ10は、限定するわけではないが、電荷結合素子(CCD)などのカメラセンサ14を保持するポータブルで軽量のハンドヘルドハウジング12を含む。センサ14は、レンズ16を通して検出される画像を生成して、図示の例示的な非限定的な実施形態では、画像を処理回路に送る。
【0031】
次に、処理回路18は、コンピュータ可読媒体22のデータにアクセスして記憶することができる、ハウジング12内のカメラプロセッサ20と通信することができる。媒体22は、以下に限定するわけではないが、ディスク型ストレージ及び/又は固体ストレージとすることでき、1つの実装では、ランダムアクセスメモリ(RAM)によって実装される。カメラ10を作動させるために、ハウジング12に電源ボタン24を設けることができる。ユーザは、電源ボタン24を操作して、1又は2以上のカメラバッテリ26に、カメラ10のコンポーネント(プロセッサ20と、限定するわけではないが、液晶ディスプレイ(LCD)などの視覚ディスプレイ28とを含む)に通電させることができる。また、ハウジング12には、通常、写真キー30が設けられていて、ユーザはこのキーを操作して、写真としてフレーム(もしくは、ビデオカメラの場合は、複数のフレーム)を取り込みたいという希望を伝えることができる。なお、この「写真キー」という用語は、カメラに1又は複数の画像を取り込ませる、ユーザ操作可能な任意のハード又はソフト要素を意味するものと理解されたい。
【0032】
また、限定するわけではないが、WiFiインタフェース又はBluetooth又は他のインタフェースなどの1又は2以上の無線ネットワーク通信インタフェース32を設けて、カメラプロセッサ20が1又は2以上のサーバ34及び/又は後述する1又は2以上のリモートコントロール(RC)装置36とインターネット又はその他のネットワークを介して又は直接ポイントツーポイントで通信できるようにすることができる。他の実施形態では、有線通信インタフェースを使用することができる。いずれの場合でも、カメラ10は、撮像センサ及びストレージを含む電子デバイス、例えば、デジタルカメラそのもの、カメラ付き携帯電話、携帯情報端末(PDA)、及びカメラ内臓ノート型コンピュータとして実装することができると理解されたい。RC36は、処理回路、無線トランシーバ回路、制御キーなどを含み、RC36がカメラ10を制御できるようにすると理解されたい。間もなく開示される目的のために、マイクロフォンなどの1又は2以上の音声-電気トランスデューサ38をカメラに設けることができる。所望する場合、例えば、図示のように、写真キー30に指紋読取機40を設けることができる。
【0033】
以下にロジックを開示する前に、本明細書のロジックは、カメラプロセッサ20、リモートコントロール装置36が設けられてカメラと通信する場合はリモートコントロール装置36のプロセッサ、又はこれらの組み合わせによって実行することができると理解されたい。
【0034】
ここで
図2を参照すると、ブロック200において、音声制御を有効にすることができる。音声制御では、マイクロフォン38によって受け取られてデジタル化された音声コマンドを認識して、キーワードと比較して、その意味を確認する。ブロック200において、ユーザがキーワード又はフレーズ(例えば「音声を作動させる」)を話すことによって、及び/又はカメラ又はRC36のキーを操作することによって、例えば、写真キー30の半押し又はRC36のキーの押下を実施することによって、有効化を実現することができる。
【0035】
ブロック201に進んで、ユーザは、バルブモードに最終的に達するまでシャッター速度を調整し続けるのではなく、音声コマンドを介してカメラをバルブモードに入らせることができる。バルブモードでは、写真キー30が押下される限り、カメラが写真を撮影し続ける。ブロック202において、このコマンドを実行して、ブロック204において、更なるユーザ音声又は手動入力なしで、カメラが自動的にバルブモードに入るようにする。
【0036】
カメラの音声制御は、カメラの特定のモードのみで実装することができる。
図3に示す。ブロック300から開始して、上記のように音声制御を行うことを有効にして、デフォルトのカメラモードの組のみで音声コマンドを実行することができる(音声制御を実装することができる)。したがって、音声制御は、特定のモードのみ(例えば、プログラム、絞り優先、シャッター優先又は手動のうちの1又は2以上のみ)で実装することができ、オートモードではできない。或いは、音声制御は、オートモードのみで実装することができるか、又は全てのモードで実装することができる。本目的のために、プログラムモードでは、プロセッサが最適のシャッター速度及び絞りを選択することに留意されたい。絞り優先モードでは、ユーザは、所望する場合、音声コマンド(例えば「絞りを広く設定する」)を使用して、かつプロセッサがシャッター速度を確立することに基づいて、絞り設定を確立する。シャッター優先モードでは、ユーザは、所望する場合、音声コマンド(例えば「高速に設定する」)を使用して、かつプロセッサが最適の露出のための絞り設定を確立することに基づいて、シャッター速度を確立する。手動モードでは、ユーザは、所望する場合、音声コマンドを使用して、絞り及びシャッター速度の両方を含むカメラ設定を確立する。オートモードでは、プロセッサが、シャッター速度、フォーカス及び絞りを含むカメラ設定を確立する。
【0037】
所望する場合、ブロック302において、音声制御を作動させるデフォルトのモードの組に対するユーザ変更を受け取ることができ、ブロック304において、変更毎に音声制御を実装することができる。
図4に例示する。
【0038】
カメラのディスプレイ28上に(又は上記の目的のために、カメラプロセッサに加えて又はそれの代わりに、RC36が使用される時には、RCのディスプレイ上に)、UI400を提示することができ、UI400では、1又は2以上のセレクタ402が、ユーザによって選択されて、音声制御を実装すべきモードを指定することができる。このように、404で示すように、ユーザは、プログラムモードで音声制御を実装するように選択することができる。406で示すように、ユーザは、絞り優先モードで音声制御を実装するように選択することができる。408で示すように、ユーザは、シャッター優先モードで音声制御を実装するように選択することができる。410で示すように、ユーザは、手動モードで音声制御を実装するように選択することができる。412で示すように、ユーザは、オートモードで音声制御を実装するように選択することができる。
【0039】
ここで
図5を参照すると、ブロック500において、まず、音声コマンドをキーワードセット(例えば、
図2のロジックを実行するためには「バルブ」、後述する
図6のロジックを実行するためには「検索する」、及び
図2のブロック200において音声制御を有効にするためには「音声を作動させる」)に限定することができる。したがって、音声コマンドがマイクロフォンによって受け取られた時、音声認識を実行して、コマンドがキーワードセット内のコマンドに一致するかどうかを判定し、一致しない場合、ブロック504において、コマンドを無視する。一方で、受け取られたコマンドがキーワードセット内のコマンドに一致する場合、ブロック506において、コマンドを適切に実装する。
【0040】
ブロック508は、次のファームウェアの更新は、更なる機能が利用可能になるとそれを追加することができることを示す。音声コマンドを使用して、メモリリコール(MR)設定を変更して、カメラが2又は3よりも多い設定(例えば、ボタン又は機械的制限)を有することができるようにすることもできる。音声コマンドを使用して、スマートフォン、ラップトップ、又は他のスマートデバイスにファイルを転送することができる。
【0041】
更に、ここで
図6を参照すると、ブロック600において、「オートフォーカスを検索する」などの音声コマンドに応答して、カメラ機能の検索を実行することができる。ブロック602において、検索の結果をカメラのディスプレイ上に提示することができ、ディスプレイは、タッチ検知型とすることができる液晶ディスプレイ(LCD)として、ブロック604において、ユーザが特定の検索項目を選択することによって、ブロック606において、適切なメニューを提示させるようにすることができる。
【0042】
図7に示す。ディスプレイ28上に(及び/又はリモートコントロール36上に)、UI700を提示することができ、UI700では、ブロック600における音声コマンドが「オートフォーカスを検索する」であったと仮定する。図示の例では、例えばインターネット検索又は内部データベース検索からの検索の2つの結果702を提示する。ユーザは、
図7の矢印で示すように結果のうちの1つを選択して、704において選択された情報を提示させた。
【0043】
更に、ここで
図8を参照すると、カメラの生体測定機能として音声認識を実装して、カメラ機能を確実にロック及びアンロックすることができる。ブロック800から開始して、許可音声テンプレートを受け取り、ブロック802において記憶する。次に、適切なコマンドが受け取られて、(1)コマンドがロック又はアンロックキーワードに一致すると認識されて、(2)ユーザ音声が、ブロック800において受け取られた音声テンプレートに一致する時、ブロック804において、カメラの使用をロック及びアンロックすることができる。
【0044】
図9に更に示す。カメラ(及び/又はRC)上に、UI900を提示することができ、UI900は、902で示すように、カメラの作動を許可する又は許可しないようにするために生体測定キーとして音声を使用することを選択するように、ユーザを促す。1又は2以上のセレクタ904を提示することができ、これらを選択して生体測定ロック/アンロック機能として音声を有効にすることができる。音声が選択された場合、プロンプト906を提示して、ユーザが、
図8のブロック800の許可テンプレートを話すことによって確立するようにすることができる。
【0045】
更に、
図9の908で示すように、ユーザは、生体測定ロック/アンロック機能として音声を有効にすることに加えて又はその代わりに、
図1のセンサ40からの指紋信号を生体測定ロック/アンロック機能として使用できるようにすることができる。セレクタ910を提示して、ユーザが指紋ロック/アンロック作動を有効にして、更なる生体測定ロック/アンロック機能を提供できるようにすることができる。メニュー又は音声コマンドを使用して、生体測定機能を作動させる及び作動しないようにすることができる。
【0046】
図10に、RC36を使用してカメラを制御する時、判定区画1000において、カメラとRCとの間でファイル転送(例えば写真)を実装すべきであると判定された場合、ブロック1002において、Wi-Fiを使用して、リモートコントロールとカメラとの間の通信を実装することができることを示す。一方、ブロック1004において(ファイルよりもずっと小さいデータ様式である)転送すべきコマンドについては、ブロック1006において、ファイル転送ほどの帯域幅を必要としないコマンドには、Bluetoothなどの他のプロトコルを使用することができる。
【0047】
本明細書に特定の実施形態を示し、詳細に説明しているが、本発明によって包含される主題は、特許請求の範囲によってのみ限定されると理解されたい。
【符号の説明】
【0048】
10 デジタルカメラ
12 ハウジング
14 センサ
16 レンズ
18 処理回路
20 プロセッサ
22 コンピュータ可読媒体
24 電源ボタン
26 バッテリ
28 ディスプレイ
30 写真キー
32 通信インタフェース
34 サーバ
36 リモートコントロール(RC)装置
38 トランスデューサ/マイクロフォン
40 指紋読取機/センサ
200 音声制御を有効にする
201 「バルブモードに入る」を受け取る
202 音声認識を実行
204 更なる入力なしでバルブモードに入る
300 音声が有効にされた時、デフォルトモードで実装
302 ユーザ変更を受け取る
304 変更毎に音声を実装
400 UI
402 セレクタ
404 プログラムモード
406 絞り優先モード
408 シャッター優先モード
410 手動モード
412 オートモード
500 限定されたキーワードセット(例えば「検索」、「バルブ」、「音声を作動」)を確立
502 音声コマンドが一致するか?
504 無視
506 コマンドを実装
508 更新を用いてセットを拡張
600 要素について音声検索コマンドを受け取る
602 結果を提示
604 選択を受け取る
606 選択された情報を提示
700 UI
702 検索の結果
800 ユーザ音声テンプレートを受け取る
802 記憶
804 次のユーザ音声がテンプレートに一致する時、カメラをロック/アンロック
900 UI
902 ロック/アンロックのために生体測定として音声を使用しますか?
904 セレクタ
906 プロンプト
908 指紋を実装しますか?
910 セレクタ
1000 リモコンにファイル転送するか?
1002 Wi-Fiを使用
1004 コマンドのみ
1006 Bluetoothを使用
【国際調査報告】