(58)【調査した分野】(Int.Cl.,DB名)
【背景技術】
【0002】
テレビ会議において、発言者の音声をマイクで認識し、発言者の方向にカメラを向け、発言者周辺の狭い領域を撮影するズームインを自動で行うテレビ会議装置が知られている(例えば、特許文献1)。
【0003】
この特許文献1に記載された技術は、指向性の高い複数のマイクを備え、1つのマイクから音を認識した場合、マイクの方向を撮影するようにカメラのアングル/ズームを自動的に制御してズームインし、複数のマイクから同時に音を認識した場合、全体を写すようにズームアウトを行うものである。
【0004】
しかしながら、特許文献1に記載された技術は、指向性の高いマイクを多数使用すると共に、高度な信号処理が必要なため、システム構築に要するコストが高価となる。また、複数のマイク位置とカメラのアングル/ズームの設定の相関を取るため、システムとしての処理が複雑になる。更に、複数のマイク位置とカメラのアングル/ズーム設定の相関に係わる設定をユーザが行う必要があり、マイクレイアウトが変更された場合の設定作業が煩雑であると共に、ドアを閉める音や机の上の物音、くしゃみ、咳等により不適切なアングル/ズームとなる可能性もある。
【発明を実施するための形態】
【0010】
以下、本発明の実施形態について、図面を用いて説明する。
図1は、本発明による撮影領域自動制御機能を有するテレビ会議制御装置(以下、本装置と略す)の内部ブロック構成を含む全体図である。
【0011】
まず、本装置1を含むシステムの全体構成を説明する。本装置1は、ネットワーク7に接続され、ネットワーク7を介してテレビ会議機能を有する相手装置8とテレビ会議に係わる通信を実行すると共に、本装置1と接続された映像カメラ2,スピーカ3,マイク4,操作部5,映像表示装置6とのインターフェースに係る制御を実行する。
【0012】
映像カメラ2は、本装置1に接続されている映像カメラであって、会議出席者の映像を映像信号に変えて本装置1へ送信する。また、本装置1からの制御信号に応じて、アングル/ズームを電気的に制御する。
【0013】
スピーカ3は本装置1に接続されているスピーカであって、相手装置8から受信した音声信号を拡声出力する。マイク4は本装置1に接続されているマイクであって、本装置1側の会議出席者が発した音声の音声信号を本装置1へ出力する。
【0014】
操作部5は本装置1を制御する者が操作する手段であって、映像カメラ2のアングル/ズームに係わる操作データ、および、会議音声の音量調整やミュート等の操作データを本装置1へ出力する。操作部5は本装置1に内蔵されていてもよい。映像表示装置6は相手装置8から受信した相手装置8側の会議映像や映像カメラ2が撮影している本装置1側のモニタ映像を表示する。
【0015】
以下、本装置1の内部ブロック構成について詳細に説明する。本装置1は、テレビ会議システム制御部11、通信制御部12、映像信号入出力部13、アングル/ズームデータ記憶部14、アングル/ズーム制御部15、音声信号入出力部16から構成される。
【0016】
TV会議システム制御部11は、操作部5からの操作内容に従って、本装置1の全体を制御し、通信制御部12,映像信号入出力部13、アングル/ズーム制御部15,アングル/ズームデータ記憶部14,音声信号入出力部16とデータを入出力する。
【0017】
通信制御部12は、ネットワーク7を経由して、相手装置8とのテレビ会議全般に係わる通信および通信制御を実行する。
【0018】
映像信号入出力部13は、映像カメラ2から入力する会議出席者を撮影した映像信号を符号化して、通信制御部12およびネットワーク7を介して、相手装置8へ送信すると共に、その映像信号を映像表示装置6へも出力し、本装置1が送信している映像のモニタを可能とする。
【0019】
また、映像信号入出力部13は、相手装置8よりネットワーク7、通信制御部12経由で送信されてくる映像信号を受信し、符号化された映像信号を復号して映像表示装置6へ出力する。
【0020】
アングル/ズームデータ記憶部14は、映像カメラ2のアングル/ズ−ムに係る制御データであるアングル/ズ−ムデータを記憶する手段である。TV会議システム制御部11からの指示により、入力されたアングル/ズ−ムデータを記憶する。また、TV会議システム制御部11からの指示により、指定されたアングル/ズ−ムデータを出力する。
【0021】
このアングル/ズームデータ記憶部14が記憶するアングル/ズ−ムデータは、所定の領域よりも広い撮影領域を映像カメラ2が撮影するズームアウトの状態に対応するズームアウト設定データと、所定の領域よりも狭い撮影領域を映像カメラ2が撮影しているズームインの状態に対応するズームイン設定データの少なくとも2つある。なお、映像カメラ2が現在撮影している領域が所定の領域よりも広いか否かは、例えば、映像カメラ2のズーム調整が10段階であるとすれば、現在のズーム状態のレベル値がズームレベルの最小値と最大値の中間値であるレベル5より大であるか否かで判定すればよい。
【0022】
アングル/ズーム制御部15は、TV会議システム制御部11から入力されるアングル/ズ−ムデータに従って、映像カメラ2のアングル/ズ−ムを制御する手段である。
【0023】
音声信号入出力部16は、TV会議システム制御部11からの制御に応じて、スピーカ3,マイク4,通信制御部12との間で音声信号の入出力に係わる制御を実行する。また、音声信号入出力部16は、マイク4から入力してくる音声信号のレベルを検出し、検出した音声レベルに係わる情報をTV会議システム制御部11へ出力する。
【0024】
図2は、操作部5の外観図である。操作部5は上ボタン51、下ボタン52、左ボタン53、右ボタン54、ズームアウトボタン55、ズームインボタン56、定位置ボタン57、ミュートボタン58を有する。本装置1の操作者は、テレビ会議の状況に応じて、これらの各ボタンを操作する。例えば、発言者が本装置1側の出席者であれば、その出席者にアングルを合わせてズームインした映像を相手装置8側へ送信し、発言者が相手装置8側の出席者であれば、その発言を聞いている本装置1側の出席者の全体が映るようにズームアウトした映像を相手装置8側へ送信する。
【0025】
上ボタン51、下ボタン52、左ボタン53、右ボタン54は、映像カメラ2の撮影方向であるアングルを手動で調整するボタンである。なお、上ボタン51、下ボタン52、左ボタン53、右ボタン54は、一体構成された所謂方向キーであってもよい。
【0026】
ズームアウトボタン55およびズームインボタン56は、映像カメラ2のズームアウト/ズームインを手動で調整するボタンであり、ズームアウトボタン55を押下し続けると、撮影領域を拡大して、多数の会議出席者を撮影するズームアウトの方向に映像カメラ2は動作する。また、ズームインボタン56を押下し続けると、発言者等の特定の会議出席者を拡大(撮影領域は縮小)して撮影するズームインの方向に映像カメラ2は動作する。
【0027】
定位置ボタン57は、アングル/ズームデータ記憶部14が記憶するアングル/ズ−ムデータの記憶、および読出しに係わるボタンである。上ボタン51、下ボタン52、左ボタン53、右ボタン54,ズームアウトボタン55,ズームインボタン56を操作して、映像カメラ2のアングルおよびまたはズームを操作者が手動で制御した後、一定時間内(例えば、10秒)に、定位置ボタン57が押下された場合、TV会議システム制御部11は、その時の映像カメラ2のアングル/ズ−ムデータをアングル/ズームデータ記憶部14に書き込む。
【0028】
ここで、その時の映像カメラ2のズ−ム状態が所定の領域よりも広い撮影領域を撮影しているズームアウトの状態であれば、そのアングル/ズ−ムデータをズームアウト設定データとして書き込み、所定の領域よりも狭い撮影領域を撮影しているズームインの状態であれば、ズームイン設定データとして書き込む。これにより、操作者は、そのアングル/ズ−ムデータをズームアウトまたはズームインのどちらの状態に対応した定位置であるかを識別して登録する必要が無く、操作がシンプルで誤操作の恐れが少ない。
【0029】
上ボタン51、下ボタン52、左ボタン53、右ボタン54,ズームアウトボタン55,ズームインボタン56のいずれの操作も伴わずに、定位置ボタン57が押下された場合、TV会議システム制御部11は、アングル/ズームデータ記憶部14からズームアウト設定データまたはズームイン設定データを読取り、アングル/ズーム制御部15を介して、読取ったアングル/ズームデータのアングル/ズ−ムとなるように映像カメラ2を制御する。
【0030】
ここで、その時の映像カメラ2のズ−ム状態が所定の領域よりも広いズームアウトの状態であれば、TV会議システム制御部11は、ズームイン設定データをアングル/ズームデータ記憶部14から読取り、所定の領域よりも狭いズームインの状態であれば、TV会議システム制御部11は、ズームアウト設定データをアングル/ズームデータ記憶部14から読取る。これにより、操作者は、アングル/ズ−ムデータをズームアウトまたはズームインのどちらの状態に対応した定位置であるかを識別して読み出す必要が無く、操作がシンプルで誤操作の恐れが少ない。
【0031】
ミュートボタン58は、本装置1側から相手装置8へ送信する音声信号を停止するボタンであり、例えば、相手装置8側の会議出席者が発言している場合、本装置1側の雑音の抑制やハウリングの防止やするためにミュートボタン58を押下する。なお、本装置1は、このミュートボタン58の押下と連動して、映像カメラ2のズームイン/ズームアウトを制御する(後述)。
【0032】
図3は本装置1の動作フローチャートである。以下、
図1、
図2を併用して、本装置1の動作フローを説明する。本フローは本装置1の電源が投入された状態からスタートする(S300)。
【0033】
本フローのスタート後、待機状態において、操作部5の上ボタン51、下ボタン52、左ボタン53、右ボタン54、ズームアウトボタン55、ズームインボタン56を操作する撮影領域に係る操作の有無(S310)、定位置ボタン57押下の有無(S320)、相手装置8へ送信する送話音声を一定時間以上検知しない状態の検知(S321)を繰り返す。
【0034】
S310において、撮影領域の操作が為されると(S310,YES)、TV会議システム制御部11は、操作部5から入力してくる操作データをアングル/ズームデータとしてアングル/ズーム制御部15へ出力し、アングル/ズーム制御部15はそのアングル/ズームデータに従って、映像カメラ2のアングル/ズームを制御すると共に、操作タイマを起動または動作中の操作タイマを再起動し(S311)、S320へ進む。これにより、本装置1の操作者は手動で映像カメラ2のアングル/ズームを制御することが出来る。なお、S311において、その都度操作タイマを起動/再起動するのは、一連の操作が停止してからの時間経過を測定するためである。S310において、撮影領域の操作が無ければ(S310,NO)、S311をスキップして、S320へ進む。
【0035】
S320において、定位置ボタン57が押下された場合(S320,YES)、S330へ進み、定位置ボタン57が押下されなければ(S320,NO)、S321へ進む。
【0036】
S330において、操作タイマが満了(例えば、10秒)であれば(S330,YES)、撮影領域の操作が終了して一定時間以上が経過しているので、撮影領域の操作を伴わない定位置ボタン57の押下、即ち、映像カメラ2のアングル/ズームを切り替える操作であると判定し、S350へ進む。操作タイマが満了でなければ(S330,NO)、撮影領域の操作をして間の無い定位置ボタン57の押下、即ち、現在の映像カメラ2のアングル/ズームを定位置として登録する操作であると判定し、S340へ進む。
【0037】
S340において、現在の映像カメラ2のズーム状態がズームアウトの状態であれば(S340,YES)、TV会議システム制御部11は現在の映像カメラ2のアングル/ズームをズームアウト設定データとしてアングル/ズームデータ記憶部14に記憶する(S341)。これによりこのズームアウトの状態がズームアウトにおける定位置として登録される。
【0038】
S340において、現在の映像カメラ2のズーム状態がズームインの状態であれば(S340,NO)、TV会議システム制御部11は映像カメラ2の現在のアングル/ズームをズームイン設定データとしてアングル/ズームデータ記憶部14に記憶する(S342)。これによりこのズームインの状態がズームインにおける定位置として登録される。
【0039】
S350において、現在の映像カメラ2のズーム状態がズームアウトの状態であれば(S350,YES)、TV会議システム制御部11はズームイン設定データをアングル/ズームデータ記憶部14から読み出してアングル/ズーム制御部15へ出力し、映像カメラ2のアングル/ズームを登録されているズームイン設定データに一致するように制御し(S351)、S310へ戻る。S350において、現在の映像カメラ2のズーム状態がズームアウトの状態でなければ(S350,NO)、TV会議システム制御部11はズームアウト設定データをアングル/ズームデータ記憶部14から読み出してアングル/ズーム制御部15へ出力し、映像カメラ2のアングル/ズームを登録されているズームアウト設定データに一致するように制御し(S352)、S310へ戻る。これにより、操作者は現在のズーム状態を意識することなく、定位置ボタン57を押下するだけで、ズームイン/ズームアウトを切り替えることができる。
【0040】
ところで、定位置ボタン57の押下が無く(S320,NO)、音声信号入出力部16が一定時間(例えば、5分)以上、相手装置8への送話音声を検知しない場合(S321,NO)、TV会議システム制御部11は映像カメラ2のアングル/ズームを登録されているズームアウト設定データに一致するように制御する(S352)。これにより、本装置1側の出席者の発言が終了し、相手装置8側の出席者が発言している状況において、定位置ボタン57の押下を忘れ、映像カメラ2がズームインの状態になったままの状態を防止できる。なお、S321で相手装置8への送話音声の有無は、マイク4のスイッチが切られた状態(図示せず)またはミュートボタン58が押下された状態か否かで判定してもよいし、音声信号入出力部16における相手装置8への送話音声の信号レベルで判定してもよい。
【0041】
以上、本発明の実施形態について説明した。本発明によれば、高度な信号処理が不要であり、テレビ会議中のカメラのアングル/ズームの制御を経済的に自動化できると共に、ズームインとズームアウトを自動的に識別するので操作性がシンプルで、誤操作の恐れが少ないという利点がある。
【0042】
なお、本発明の実施形態において、映像カメラの撮影領域をアングル/ズームで制御するとして説明したが、アングルは固定的であってもよい。