IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤマハ株式会社の特許一覧

<>
  • 特開-収音設定方法および収音装置 図1
  • 特開-収音設定方法および収音装置 図2
  • 特開-収音設定方法および収音装置 図3
  • 特開-収音設定方法および収音装置 図4
  • 特開-収音設定方法および収音装置 図5
  • 特開-収音設定方法および収音装置 図6
  • 特開-収音設定方法および収音装置 図7
  • 特開-収音設定方法および収音装置 図8
  • 特開-収音設定方法および収音装置 図9
  • 特開-収音設定方法および収音装置 図10
  • 特開-収音設定方法および収音装置 図11
  • 特開-収音設定方法および収音装置 図12
  • 特開-収音設定方法および収音装置 図13
  • 特開-収音設定方法および収音装置 図14
  • 特開-収音設定方法および収音装置 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024031240
(43)【公開日】2024-03-07
(54)【発明の名称】収音設定方法および収音装置
(51)【国際特許分類】
   H04R 3/00 20060101AFI20240229BHJP
【FI】
H04R3/00 320
【審査請求】未請求
【請求項の数】18
【出願形態】OL
(21)【出願番号】P 2022134669
(22)【出願日】2022-08-26
(71)【出願人】
【識別番号】000004075
【氏名又は名称】ヤマハ株式会社
(74)【代理人】
【識別番号】110000970
【氏名又は名称】弁理士法人 楓国際特許事務所
(72)【発明者】
【氏名】佐藤 航一郎
【テーマコード(参考)】
5D220
【Fターム(参考)】
5D220BA06
5D220BC05
(57)【要約】
【課題】利用者が簡単に収音対象範囲を設定でき、利用者が収音対象範囲を認識することができる収音設定方法を提供する。
【解決手段】音収音設定方法は、カメラで撮影した画像から特定のオブジェクトを検出し、特定した前記特定のオブジェクトの、前記画像内の位置情報を取得し、取得した前記位置情報に基づいて指向性変更可能なマイクの収音対象範囲を設定する。
【選択図】 図4
【特許請求の範囲】
【請求項1】
カメラで撮影した画像から特定のオブジェクトを検出し、
検出した前記特定のオブジェクトの、前記画像内の位置情報を取得し、
取得した前記位置情報に基づいて指向性変更可能なマイクの収音対象範囲を設定する、
収音設定方法。
【請求項2】
前記特定のオブジェクトは、特定の画像を含むオブジェクトであり、
前記特定の画像を検出することで、前記特定のオブジェクトを検出する、
請求項1に記載の収音設定方法。
【請求項3】
前記特定のオブジェクトと前記カメラの画像との関係を訓練した第1訓練済モデルに基づいて前記画像から前記特定のオブジェクトを検出する、
請求項1または請求項2に記載の収音設定方法。
【請求項4】
前記特定のオブジェクトと該特定のオブジェクトの位置との関係を訓練した第2訓練済モデルに基づいて前記位置情報を取得する、
請求項1または請求項2に記載の収音設定方法。
【請求項5】
前記特定のオブジェクトの大きさを事前に設定し、
事前に設定した前記特定のオブジェクトの大きさと、前記画像に含まれる前記特定のオブジェクトの大きさと、を比較して、前記位置情報として前記特定のオブジェクトの距離を取得する、
請求項1または請求項2に記載の収音設定方法。
【請求項6】
前記収音対象範囲は、円錐形状、または、平面視して扇形もしくは三角形である、
請求項1または請求項2に記載の収音設定方法。
【請求項7】
前記収音対象範囲のうち一部に非収音対象範囲を設定する、
請求項1または請求項2に記載の収音設定方法。
【請求項8】
前記収音対象範囲と、該収音対象範囲以外の範囲と、を区別して表示器に表示する、
請求項1または請求項2に記載の収音設定方法。
【請求項9】
利用者から前記収音対象範囲の設定指示を受け付けた場合に、前記収音対象範囲を設定する、
請求項1または請求項2に記載の収音設定方法。
【請求項10】
カメラと、
指向性変更可能なマイクと、
前記カメラで撮影した画像から特定のオブジェクトを検出し、
検出した前記特定のオブジェクトの、前記画像内の位置情報を取得し、
取得した前記位置情報に基づいて前記マイクの収音対象範囲を設定する、
制御部と、
を備えた収音装置。
【請求項11】
前記特定のオブジェクトは、特定の画像を含むオブジェクトであり、
前記制御部は、前記特定の画像を検出することで、前記特定のオブジェクトを検出する、
請求項10に記載の収音装置。
【請求項12】
前記制御部は、前記特定のオブジェクトと前記カメラの画像との関係を訓練した第1訓練済モデルに基づいて前記画像から前記特定のオブジェクトを検出する、
請求項10または請求項11に記載の収音装置。
【請求項13】
前記制御部は、前記特定のオブジェクトと該特定のオブジェクトの位置との関係を訓練した第2訓練済モデルに基づいて前記位置情報を取得する、
請求項10または請求項11に記載の収音装置。
【請求項14】
前記制御部は、
前記特定のオブジェクトの大きさを事前に設定し、
事前に設定した前記特定のオブジェクトの大きさと、前記画像に含まれる前記特定のオブジェクトの大きさと、を比較して、前記位置情報として前記特定のオブジェクトの距離を取得する、
請求項10または請求項11に記載の収音装置。
【請求項15】
前記収音対象範囲は、円錐形状、または、平面視して扇形もしくは三角形である、
請求項10または請求項11に記載の収音装置。
【請求項16】
前記制御部は、前記収音対象範囲のうち一部に非収音対象範囲を設定する、
請求項10または請求項11に記載の収音装置。
【請求項17】
前記制御部は、前記収音対象範囲と、該収音対象範囲以外の範囲と、を区別して表示器に表示する、
請求項10または請求項11に記載の収音装置。
【請求項18】
前記制御部は、利用者から前記収音対象範囲の設定指示を受け付けた場合に、前記収音対象範囲を設定する、
請求項10または請求項11に記載の収音装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の一実施形態は、収音設定方法および収音装置に関する。
【背景技術】
【0002】
特許文献1には、発話者のビデオ画像を撮影する撮像部と、前記発話者の発話を集音し、前記発話の到来方向を検出する集音部と、前記集音部が集音する集音範囲を、前記到来方向を含む所定の範囲に設定する集音範囲設定部と、前記集音範囲設定部によって設定される前記集音範囲に合わせて、前記ビデオ画像を撮影する画角を設定する画角設定部とを含む、ビデオ会議端末機が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2017-28608号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1の発明は、収音範囲とカメラ画像の範囲を一致させる。特許文献1の構成では、発話によりカメラ画像の範囲が設定されるものであり、参加者以外の発話者がいるとその発話者も参加者として認識される。つまり、特許文献1の構成では、利用者が任意に収音対象範囲を設定できるものではなく、利用者が収音対象範囲を認識することもできない。
【0005】
本発明の一実施形態は、利用者が簡単に収音対象範囲を設定でき、利用者が収音対象範囲を認識することができる収音設定方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の一実施形態に係る音収音設定方法は、カメラで撮影した画像から特定のオブジェクトを検出し、特定した前記特定のオブジェクトの、前記画像内の位置情報を取得し、取得した前記位置情報に基づいて指向性変更可能なマイクの収音対象範囲を設定する。
【発明の効果】
【0007】
本発明の一実施形態によれば、利用者が簡単に収音対象範囲を設定でき、利用者が収音対象範囲を認識することができる。
【図面の簡単な説明】
【0008】
図1】収音装置1および表示器3の外観斜視図である。
図2】収音装置1の構成を示すブロック図である。
図3】カメラ11で撮影した画像の一例を示す図である。
図4】制御部15の動作を示すフローチャートである。
図5図3に示した画像に対応する室内を平面視した図である。
図6】変形例1に係る、カメラ11で撮影した画像の一例を示す図である。
図7】変形例2に係る、カメラ11で撮影した画像の一例を示す図である。
図8】変形例3に係る、室内を平面視した図である。
図9】変形例4に係る、カメラ11で撮影した画像の一例を示す図である。
図10】変形例4に係る、室内を平面視した図である。
図11】変形例5に係る、カメラ11で撮影した画像の一例を示す図である。
図12】変形例5に係る、室内を平面視した図である。
図13】変形例6に係る、収音装置1の構成を示すブロック図である。
図14】平面視して三角形の収音対象範囲の例を示す図である。
図15】天井に設置される収音装置1を示す外観斜視図である。
【発明を実施するための形態】
【0009】
図1は、収音装置1および表示器3の外観斜視図である。収音装置1は、幅方向に長い直方体形状の筐体を備える。収音装置1の筐体は、一例として、表示器3の上面に乗せられる。収音装置1は、該筐体の正面においてカメラ11と、複数のスピーカ12と、複数のマイク14と、を備えている。カメラ11、複数のスピーカ12、および複数のマイク14は、筐体の正面に幅方向に並んで配置されている。この例では、カメラ11は、筐体の正面の中央に配置されている。複数のスピーカ12は、筐体の正面の左側に配置されている。複数のマイク14は、筐体の正面の右側に配置されている。
【0010】
なお、この例においては、複数のスピーカ12の数は2つであるが、1つであってもよいし、さらに複数であってもよい。また、スピーカ12を備えることは本発明において必須ではない。また、この例においては、マイクの数は6個である。複数のマイク14は、後述のビームフォーミングにより指向性変更可能なマイクとして機能する。複数のマイク14は、少なくとも2個以上であればビームフォーミングにより指向性変更可能である。また、1つのマイクであっても、物理的に方向を変更することで指向性変更可能なマイクとして機能してもよい。
【0011】
図2は、収音装置1の構成を示すブロック図である。収音装置1は、カメラ11、複数のスピーカ12、複数のマイク14、制御部15、メモリ17、およびインタフェース(I/F)19を備えている。
【0012】
メモリ17は、制御部15の動作用プログラムを記憶した記憶媒体である。制御部15は、メモリ17から動作用プログラムを読み出して種々の動作を行う。なお、プログラムは、メモリ17に記憶されている必要はない。例えば、プログラムは、サーバ等の外部装置の記憶媒体に記憶されていてもよい。この場合、制御部15は、該サーバから都度プログラムを読み出して実行すればよい。
【0013】
制御部15は、複数のマイク14で取得した音信号を受信する。制御部15は、複数のマイク14で取得した音信号にビームフォーミングを施す。ビームフォーミングは、複数のマイク14で取得した音信号に遅延を付加して合成することで、所定の方向に向けて指向性を有する収音ビームを形成する処理である。収音ビームは、所定の位置に焦点を結ぶ様な指向性を形成することもできる。制御部15は、例えば話者の位置に焦点を結ぶ収音ビームを形成する。収音ビームは、同時に複数形成することもできる。
【0014】
制御部15は、収音ビームに係る音信号をI/F19に出力する。I/F19は、例えば通信I/Fであり、該収音ビームに係る信号を、PC等の情報処理装置に送信する。情報処理装置は、該音信号を外部の装置(遠隔地)に送信する。
【0015】
PC等の情報処理装置は、外部の装置から音信号を受信する。制御部15は、I/F19から受信した音信号を複数のスピーカ12に出力する。複数のスピーカ12は、制御部15から受信した音信号を放音する。
【0016】
これにより、収音装置1の利用者は、遠隔地の利用者と音声会議を行うことができる。また、制御部15は、カメラ11で撮影した画像を、PC等の情報処理装置を介して外部の装置(遠隔地)に送信してもよい。PC等の情報処理装置は、外部の装置から画像を受信する。PC等の情報処理装置は、当該画像を表示器3に表示する。これにより、収音装置1の利用者は、遠隔地の利用者とビデオ会議を行うこともできる。
【0017】
制御部15は、カメラ11で撮影した画像からオブジェクトを検出する処理を行う。図3は、カメラ11で撮影した画像の一例を示す図である。カメラ11で撮影した画像は、例えば表示器3上にOSD(On-Screen Display)で表示してもよい。
【0018】
オブジェクトとは、画像から認識可能な実体物であり、例えば人物を含む。制御部15は、例えば顔認識処理を行なうことにより、人物を検出する。顔認識処理は、例えばニューラルネットワーク等を用いた所定のモデルに、人物の顔とカメラの画像との関係を訓練した訓練済モデルを用いて、人物を検出する処理である。
【0019】
本実施形態において、モデルを訓練させるためのアルゴリズムは限定されず、CNN(Convolutional Neural Network)やRNN(Recurrent Neural Network)等の任意の機械訓練アルゴリズムを用いることができる。機械訓練アルゴリズムは、教師あり訓練、教師なし訓練、半教師訓練、強化訓練、逆強化訓練、能動訓練、あるいは転移訓練等であってもよい。また、モデルは、HMM(Hidden Markov Model:隠れマルコフモデル)やSVM(Support Vector Machine)等の機械訓練モデルで訓練されてもよい。
【0020】
図3の例では、制御部15は、4人の人物(O1~O4)を検出している。制御部15は、検出した各人物にO1~O4等のラベル情報を付与し、各人物の画像内の位置情報を取得する。位置情報は、2次元の位置情報を含む。2次元の位置情報は、カメラ11で撮影した画像の所定位置(例えば左下)を原点としたX,Y座標(直交座標)である。
【0021】
また、制御部15は、検出した人物の位置に図中の四角で示す様な境界ボックス(Bounding Box)を設定する。制御部15は、境界ボックスの大きさに基づいて人物との距離を求める。
【0022】
例えば、メモリ17には、予め、人物のオブジェクト(人物の境界ボックス)の大きさと距離との関係を示したテーブルまたは関数等が記憶されている。制御部15は、事前に設定した人物の大きさと、画像に含まれる人物のオブジェクトの大きさ(設定した境界ボックスの大きさ)とを比較して、人物との距離を求める。
【0023】
なお、制御部15は、OSDで表示器3にカメラ11の画像を表示する場合に、画像内に図3に示す様な境界ボックスの画像を重畳することで、人物のオブジェクトを目立つような画像処理を行ってもよい。
【0024】
制御部15は、位置情報に基づいて、人物のオブジェクトO1~O4の位置に焦点を結ぶ収音ビームを形成する。これにより、制御部15は、人物のオブジェクトO1~O4の発話音声を高いSN比で取得することができる。
【0025】
一方、制御部15は、カメラ11で撮影した画像から特定のオブジェクトを検出する処理を行う。特定のオブジェクトは、人物以外のオブジェクトである。この例では、特定のオブジェクトとは、図3に示す様なポールのオブジェクトSO1である。なお、特定のオブジェクトは、図3に示したポールのオブジェクトに限らない。特定のオブジェクトは、例えばネームバッジ、リモートコントローラ、人形、またはレーザポインタなど、種々のオブジェクトを適用することができる。また、特定のオブジェクトは、予めメモリ17に登録した特定の画像(例えばキャラクタの画像や、二次元バーコードなど)を含むオブジェクトであってもよい。この場合、制御部15は、当該特定の画像を検出することで特定のオブジェクトを検出する。
【0026】
図4は、制御部15の動作を示すフローチャートである。制御部15は、例えばニューラルネットワーク等を用いた所定のモデルに、特定のオブジェクトとカメラの画像との関係を訓練した訓練済モデル(本発明の第1訓練済モデル)を用いて、当該特定のオブジェクトを検出する(S11)。図3の例では、制御部15は、特定オブジェクトとして検出したポールのオブジェクトにSO1のラベル情報を付与している。
【0027】
次に、制御部15は、検出した特定のオブジェクト(図3の例ではポールのオブジェクトSO1)の、画像内の位置情報を取得する(S12)。位置情報は、上述の様に、2次元の位置情報と、距離の情報と、を含む。制御部15は、検出した特定のオブジェクトの位置に図中の四角で示す様な境界ボックスを設定する。制御部15は、境界ボックスの大きさに基づいて特定のオブジェクトとの距離を求める。例えば、メモリ17には、予め、特定のオブジェクトの大きさ(境界ボックスの大きさ)と距離との関係を示したテーブルまたは関数等が記憶されている。制御部15は、事前に設定した特定のオブジェクトの大きさと、画像に含まれる特定のオブジェクトの大きさ(設定した境界ボックスの大きさ)と、メモリ17に記憶されているテーブルを比較し、特定のオブジェクトとの距離を求める。
【0028】
なお、制御部15は、例えばニューラルネットワーク等を用いた所定のモデルに、特定のオブジェクトと該特定のオブジェクトの位置との関係を訓練した訓練済モデル(本発明の第2訓練済モデル)を用いて、当該特定のオブジェクトの位置を取得してもよい。
【0029】
制御部15は、取得した、特定のオブジェクトの位置情報に基づいて指向性変更可能なマイクの収音対象範囲を設定する(S13)。
【0030】
図5は、図3に示した画像に対応する室内を平面視した図である。この例では、制御部15は、平面視して扇形の収音対象範囲A1を設定する。扇形の半径は、特定のオブジェクトSO1までの距離d1に対応する。また、扇形の内角は、特定のオブジェクトSO1の方向に対応する。例えば、制御部15は、図5に示す様に、自装置(収音装置1)の正面方向に対する特定のオブジェクトSO1の方向(角度θ1)と対称となる方向(角度θ’1)に対応しての扇形の内角を設定する。
【0031】
図5の例では、人物のオブジェクトO2およびO3は、収音対象範囲A1に含まれる。人物のオブジェクトO1およびO4は、収音対象範囲A1に含まれていない。
【0032】
したがって、制御部15は、人物のオブジェクトO1~O4のうち、収音対象範囲A1に含まれる人物のオブジェクトO2およびO3の位置に焦点を結ぶ収音ビームを形成する。制御部15は、人物のオブジェクトO1~O4のうち、収音対象範囲A1に含まれていない人物のオブジェクトO1およびO4の位置には収音ビームを形成しない。そのため、制御部15は、人物のオブジェクトO1~O4のうち、収音対象範囲A1に含まれる人物のオブジェクトO2およびO3の音声を取得し、収音対象範囲A1に含まれていない人物のオブジェクトO1およびO4の音声を取得しない。
【0033】
これにより、収音装置1の利用者は、特定のオブジェクトSO1を任意の位置に設置することで、簡単に収音対象範囲を設定することができ、かつ収音対象範囲を視覚的に認識することができる。例えば、収音装置1の利用者は、収音対象範囲を左右に広げたい場合には特定のオブジェクトSO1を収音装置1の正面から左右に離れた位置に移動させる。収音装置1の利用者は、収音対象範囲を左右に狭めたい場合には特定のオブジェクトSO1を収音装置1の正面に近づける。また、収音装置1の利用者は、収音対象範囲を奥行き方向に広げたい場合には特定のオブジェクトSO1を収音装置1から遠くに移動させる。収音装置1の利用者は、収音対象範囲を奥行き方向に狭めたい場合には特定のオブジェクトSO1を収音装置1の近くに移動させる。
【0034】
従来は、例えば壁やパーティションを用いて会議参加者の居る範囲を区切っていた。しかし、収音装置1の利用者は、ポール等の特定のオブジェクトを設置するだけで、オープンスペースや広い会議室でも仮想的に会議参加者の居る範囲を区切って、その範囲を視覚的に簡単に認識できる、という顧客体験を得ることができる。
【0035】
次に、図6は、変形例1に係る、カメラ11で撮影した画像の一例を示す図である。上述したように、制御部15は、カメラ11で撮影した画像を、例えば表示器3上にOSD(On-Screen Display)で表示してもよい。変形例1に係る制御部15は、収音対象範囲と、該収音対象範囲以外の範囲と、を区別して表示器3に表示する。
【0036】
図5で示した様に、人物のオブジェクトO2およびO3は、収音対象範囲A1に含まれる。人物のオブジェクトO1およびO4は、収音対象範囲A1に含まれていない。そこで、制御部15は、人物のオブジェクトO2およびO3の境界ボックスと、人物のオブジェクトO1およびO4の境界ボックスと、を区別して表示する。図6の例では、制御部15は、人物のオブジェクトO1およびO4の境界ボックスを破線で表示する。また、制御部15は、収音対象範囲と、該収音対象範囲以外の範囲と、を境界ボックスの有無で表示してもよい。例えば、制御部15は、収音対象範囲の人物に境界ボックスを表示し、収音対象範囲以外の人物には境界ボックスを表示しないこととしてもよい。あるいは、制御部15は、収音対象範囲と、該収音対象範囲以外の範囲と、の色を変更して表示してもよい。例えば、制御部15は、収音対象範囲の人物の境界ボックスを緑で表示し、収音対象範囲以外の人物の境界ボックスを赤で表示してもよい。また、制御部15は、収音対象範囲および収音対象範囲以外の境界付近に居る人物の境界ボックスをさらに異なる色で表示してもよい。例えば、制御部15は、境界付近に居る人物の境界ボックスを橙で表示する。
【0037】
これにより、収音装置1の利用者は、どの人物が収音対象範囲に居るのか、視覚的に簡単に認識できる、という顧客体験を得ることができる。
【0038】
図7は、変形例2に係る、カメラ11で撮影した画像の一例を示す図である。変形例2に係る制御部15も、収音対象範囲と、該収音対象範囲以外の範囲と、を区別して表示器3に表示する。図7の例では、制御部15は、収音対象範囲以外のうち左右の範囲をグレーで表示する。
【0039】
これにより、収音装置1の利用者は、収音対象範囲のうち左右の範囲を視覚的に簡単に認識できる、という顧客体験を得ることができる。
【0040】
図8は、変形例3に係る、室内を平面視した図である。この例では、制御部15は、左右方向の全範囲に収音対象範囲A1を設定する。すなわち、制御部15は、平面視して半円状の収音対象範囲A1を設定する。半円の半径は、特定のオブジェクトSO1までの距離d1に対応する。
【0041】
収音装置1の利用者は、特定のオブジェクトSO1を収音装置1に近づけたり遠ざけたりすることで、収音対象範囲A1を奥行き方向に変更する。この場合も、収音装置1の利用者は、ポール等の特定のオブジェクトを設置するだけで、オープンスペースや広い会議室でも仮想的に会議参加者の居る範囲を区切って、その範囲を視覚的に簡単に認識できる、という顧客体験を得ることができる。
【0042】
図9は、変形例4に係る、カメラ11で撮影した画像の一例を示す図である。図10は、変形例4に係る、室内を平面視した図である。
【0043】
変形例4では、制御部15は、画像内に2つの特定のオブジェクトSO1および特定のオブジェクトSO2を検出する。特定のオブジェクトSO1は、人物のオブジェクトO2の右側に位置し、特定のオブジェクトSO2は、人物のオブジェクトO3の右側に位置する。収音装置1および特定のオブジェクトSO1の距離と、収音装置1および特定のオブジェクトSO2の距離は、同じd1である。
【0044】
制御部15は、図10に示す様に、平面視して、自装置(収音装置1)の正面方向に対する特定のオブジェクトSO1の方向の角度θ1から、特定のオブジェクトSO2の方向の角度θ2までの扇形を収音対象範囲A1として設定する。
【0045】
図10の例では、人物のオブジェクトO2のみ、収音対象範囲A1に含まれる。人物のオブジェクトO1、O3およびO4は、収音対象範囲A1に含まれていない。したがって、制御部15は、人物のオブジェクトO1~O4のうち、収音対象範囲A1に含まれる人物のオブジェクトO2の位置に焦点を結ぶ収音ビームを形成する。制御部15は、人物のオブジェクトO1~O4のうち、収音対象範囲A1に含まれていない人物のオブジェクトO1、O3、およびO4の位置には収音ビームを形成しない。また、図10の例では、制御部15は、人物のオブジェクトO1、O3、およびO4の境界ボックスを破線で表示する。
【0046】
変形例4において、収音装置1の利用者は、2つのポールを設置することで、左右方向の収音対象範囲を、より柔軟に設定することができる、という顧客体験を得ることができる。なお、特定のオブジェクトSO1および特定のオブジェクトSO2の収音装置1までの距離は、同じである必要はない。制御部15は、特定のオブジェクトSO1および特定のオブジェクトSO2の収音装置1までの距離が異なる場合、一方の特定のオブジェクトから他方の特定のオブジェクトの位置まで、徐々に扇形の半径を変更すればよい。
【0047】
図11は、変形例5に係る、カメラ11で撮影した画像の一例を示す図である。図12は、変形例5に係る、室内を平面視した図である。変形例5では、制御部15は、さらに特定のオブジェクトSO3および特定のオブジェクトSO4を検出する。特定のオブジェクトSO3は、人物のオブジェクトO2の左側に位置し、特定のオブジェクトSO4は、人物のオブジェクトO4の右側に位置する。収音装置1および特定のオブジェクトSO3の距離と、収音装置1および特定のオブジェクトSO4の距離は、同じd1である。
【0048】
この例では、特定のオブジェクトSO3および特定のオブジェクトSO4は、特定のオブジェクトSO1および特定のオブジェクトSO2とは異なる色である。制御部15は、特定のオブジェクトSO3および特定のオブジェクトSO4に基づいて、非収音対象範囲M1を設定する。
【0049】
例えば、制御部15は、図12に示す様に、平面視して、自装置(収音装置1)の正面方向に対する特定のオブジェクトSO3の方向から特定のオブジェクトSO4の方向までの角度θ3に、扇形の非収音対象範囲M1を設定する。この様に、変形例5に係る制御部15は、収音対象範囲A1の一部に、非収音対象範囲M1を設定する。
【0050】
変形例4において、収音装置1の利用者は、特定のオブジェクトSO3、SO4(例えば色の異なる2つのポール)を設置することで、収音対象範囲の一部に非収音対象範囲を簡単に設定することができる、という顧客体験を得ることができる。なお、非収音対象範囲を設定するための特定のオブジェクトは、色の異なるオブジェクトに限らない。制御部15は、予め非収音対象範囲を設定するための特定のオブジェクトの外観をメモリ17に登録しておけばよい。
【0051】
図13は、変形例6に係る、収音装置1の構成を示すブロック図である。変形例6に係る収音装置1は、さらにリモートコントローラ(以下、リモコンと称する。)50を備えている。リモコン50は、利用者の操作を受け付けるための端末である。リモコン50は、USBあるいはBluetooth(登録商標)等の通信手段でI/F19に接続される。リモコン50は、例えば複数のキーを有する。複数のキーは、電源オンオフキー、音量変更キー、方向キー、あるいはトリガーキーなどを有する。利用者は、例えば方向キーを操作して、カメラ11の撮影方向を変更する操作を行う。リモコン50は、受け付けた操作に係る操作信号を、I/F19を介して制御部15に送信する。
【0052】
トリガーキーは、利用者から収音対象範囲の設定指示を受け付けるための操作子である。利用者がトリガーキーを操作すると、リモコン50は、トリガーキーの操作に係る操作信号を、I/F19を介して制御部15に送信する。制御部15は、トリガーキーの操作信号を受け付けた場合に、収音対象範囲を設定する。
【0053】
これにより、収音装置1の利用者は、任意のタイミングで、収音対象範囲を設定することができる。
【0054】
なお、収音対象範囲は、平面視して半円や扇形に限らない。例えば、図14に示す様に、収音対象範囲は、平面視して三角形であってもよい。三角形は、扇形に比べて奥行き方向に対する収音対象範囲が狭くなる。例えば、奥行き方向に壁面があった場合でも、制御部15は、当該壁面からの反射音を取得し難くなる。そのため、制御部15は、奥行き方向に居る人物の発話音声を高いSN比で取得することができる。
【0055】
なお、図15に示す様に、収音装置1は、例えば天井に設置されていてもよい。この場合、収音対象範囲は、図15に示す様な円錐形状であってもよい。
【0056】
また、本発明においてスピーカを用いて遠隔地と音声会議を行うことは必須ではない。例えば、収音装置1は、ビデオカメラであってもよい。この場合も、収音装置1の利用者は、音声を取得したい範囲を簡単に設定して、該範囲を認識することができる。
【0057】
本実施形態の説明は、すべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上述の実施形態ではなく、特許請求の範囲によって示される。さらに、本発明の範囲は、特許請求の範囲と均等の範囲を含む。
【符号の説明】
【0058】
1 :収音装置
3 :表示器
11 :カメラ
12 :スピーカ
14 :マイク
15 :制御部
17 :メモリ
19 :I/F
50 :リモコン
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15