IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社JVCケンウッドの特許一覧

<>
  • 特開-遠隔制御装置及び遠隔制御方法 図1
  • 特開-遠隔制御装置及び遠隔制御方法 図2
  • 特開-遠隔制御装置及び遠隔制御方法 図3
  • 特開-遠隔制御装置及び遠隔制御方法 図4
  • 特開-遠隔制御装置及び遠隔制御方法 図5
  • 特開-遠隔制御装置及び遠隔制御方法 図6
  • 特開-遠隔制御装置及び遠隔制御方法 図7
  • 特開-遠隔制御装置及び遠隔制御方法 図8
  • 特開-遠隔制御装置及び遠隔制御方法 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024091246
(43)【公開日】2024-07-04
(54)【発明の名称】遠隔制御装置及び遠隔制御方法
(51)【国際特許分類】
   G06F 3/01 20060101AFI20240627BHJP
   H04Q 9/00 20060101ALI20240627BHJP
   G06F 3/0346 20130101ALI20240627BHJP
   G06T 7/70 20170101ALI20240627BHJP
   G06V 10/40 20220101ALI20240627BHJP
   G10L 25/51 20130101ALI20240627BHJP
   G10L 17/00 20130101ALI20240627BHJP
   G10L 15/00 20130101ALI20240627BHJP
【FI】
G06F3/01 510
H04Q9/00 301E
H04Q9/00 331A
G06F3/0346 423
G06T7/70 Z
G06V10/40
G10L25/51 400
G10L17/00 200D
G10L15/00 200F
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2023116692
(22)【出願日】2023-07-18
(31)【優先権主張番号】P 2022205542
(32)【優先日】2022-12-22
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】308036402
【氏名又は名称】株式会社JVCケンウッド
(74)【代理人】
【識別番号】100083806
【弁理士】
【氏名又は名称】三好 秀和
(74)【代理人】
【識別番号】100111235
【弁理士】
【氏名又は名称】原 裕子
(74)【代理人】
【識別番号】100170575
【弁理士】
【氏名又は名称】森 太士
(72)【発明者】
【氏名】天花寺 秀紀
【テーマコード(参考)】
5B087
5E555
5K048
5L096
【Fターム(参考)】
5B087AA09
5B087BC11
5E555AA46
5E555AA53
5E555AA64
5E555AA71
5E555BA16
5E555BA19
5E555BB16
5E555BC04
5E555BC16
5E555CA42
5E555CA47
5E555CB64
5E555CB65
5E555CC01
5E555DA21
5E555DA31
5E555EA09
5E555EA22
5E555EA23
5E555FA00
5K048AA04
5K048BA03
5K048DA02
5K048EB02
5K048HA01
5K048HA02
5L096CA02
5L096FA67
5L096FA69
5L096JA11
(57)【要約】
【課題】複数のユーザが存在しても適切に操作対象機器を特定することができる遠隔制御装置を提供する。
【解決手段】ユーザ特定部(登録顔画像認識部2及び顔画像登録部3)はユーザを特定する。操作対象機器登録部6には、複数の操作対象機器の位置情報が登録されている。視線検出部4は、ユーザ特定部が特定したユーザの視線を検出する。操作対象機器特定部7は、操作対象機器登録部6に登録されている複数の操作対象機器のうち、視線検出部4が検出した視線の方向に位置する操作対象機器を制御される対象の操作対象機器であると特定する。音声応答制御部8は、マイクロホン10が収音した音声に従って、特定された操作対象機器を制御する。
【選択図】図2
【特許請求の範囲】
【請求項1】
ユーザを特定するユーザ特定部と、
複数の操作対象機器の位置情報が登録されている操作対象機器登録部と、
前記ユーザ特定部が特定したユーザの視線を検出する視線検出部と、
前記操作対象機器登録部に登録されている前記複数の操作対象機器のうち、前記視線検出部が検出した視線の方向に位置する操作対象機器を制御される対象の操作対象機器であると特定する操作対象機器特定部と、
マイクロホンが収音した音声に従って、前記操作対象機器特定部によって特定された操作対象機器を制御する音声応答制御部と、
を備える遠隔制御装置。
【請求項2】
前記ユーザ特定部は、
操作対象機器を操作するユーザの顔画像が登録されている顔画像登録部と、
前記顔画像登録部に登録されている顔画像に基づいて、カメラによって撮影された人が前記顔画像登録部に登録されているユーザであるか否かを認識する登録顔画像認識部と、
前記登録顔画像認識部が前記顔画像登録部に登録されているユーザであると認識した人をユーザとして特定する
請求項1に記載の遠隔制御装置。
【請求項3】
音声の発声方向を推定する音声検出部をさらに備え、
前記ユーザ特定部は、前記音声検出部が推定した音声の発声方向に基づいてユーザを特定する
請求項1に記載の遠隔制御装置。
【請求項4】
前記顔画像登録部に登録されているユーザの顔画像に関連付けて、ユーザの声を登録する音声登録部と、
前記音声登録部に登録されている声に基づいて、前記マイクロホンが収音した声を発したユーザを特定する登録音声認識部と、
をさらに備え、
前記登録顔画像認識部は、前記登録音声認識部で特定したユーザの顔画像を特定し、
前記視線検出部は、前記特定したユーザの視線を検出する
請求項2に記載の遠隔制御装置。
【請求項5】
前記各操作対象機器が位置する方向を登録する登録モード時に、前記ユーザが、前記複数の操作対象機器のうちのいずれかの操作対象機器を見ている状態で、前記視線検出部が検出した視線に基づいて、前記操作対象機器の位置を算出する操作対象機器位置算出部をさらに備え、
前記操作対象機器登録部は、前記操作対象機器位置算出部が算出した前記操作対象機器の位置情報を登録する
請求項1~3のいずれか1項に記載の遠隔制御装置。
【請求項6】
ユーザ特定部がユーザを特定し、
視線検出部が、前記ユーザ特定部が特定したユーザの視線の方向を検出し、
操作対象機器特定部が、操作対象機器登録部に登録されている複数の操作対象機器のうち、前記視線検出部が検出した視線の方向に位置する操作対象機器を制御される対象の操作対象機器であると特定し、
音声応答制御部が、マイクロホンが収音した音声に従って、前記操作対象機器特定部によって特定された操作対象機器を制御する
遠隔制御方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、遠隔制御装置及び遠隔制御方法に関する。
【背景技術】
【0002】
音声を認識し、音声によって各種の機器を操作することができるスマートスピーカと称される遠隔制御装置が普及している。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】国際公開第2019/142295号
【特許文献2】特開2017-102687号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
例えば、遠隔制御装置によって操作対象機器として2台のテレビを操作することがある。このとき、2台のテレビそれぞれに固有の名前を付けて遠隔制御装置に登録しておき、名前を発して操作しようとするテレビを特定した上で制御内容を音声で指示する必要がある。このような音声による指示は煩雑であり、音声による指示を簡略化することが求められる。特許文献1には、撮像装置で撮像した画像情報から、ユーザの視線を検出することで操作対象機器を特定する技術が記載されている。しかしながら、撮像装置の撮像範囲に複数のユーザが存在した場合、操作対象機器を操作したいユーザ以外のユーザの視線を検出してしまい、適切に操作対象機器を特定できない可能性がある。そこで、より確実に操作対象機器を特定する遠隔制御装置及び遠隔制御方法の登場が望まれる。
【0005】
本発明は、複数のユーザが存在しても適切に操作対象機器を特定することができる遠隔制御装置及び遠隔制御方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明は、ユーザを特定するユーザ特定部と、複数の操作対象機器の位置情報が登録されている操作対象機器登録部と、前記ユーザ特定部が特定したユーザの視線を検出する視線検出部と、前記操作対象機器登録部に登録されている前記複数の操作対象機器のうち、前記視線検出部が検出した視線の方向に位置する操作対象機器を制御される対象の操作対象機器であると特定する操作対象機器特定部と、マイクロホンが収音した音声に従って、前記操作対象機器特定部によって特定された操作対象機器を制御する音声応答制御部とを備える遠隔制御装置を提供する。
【0007】
本発明は、ユーザ特定部がユーザを特定し、視線検出部が、前記ユーザ特定部が特定したユーザの視線の方向を検出し、操作対象機器特定部が、操作対象機器登録部に登録されている複数の操作対象機器のうち、前記視線検出部が検出した視線の方向に位置する操作対象機器を制御される対象の操作対象機器であると特定し、音声応答制御部が、マイクロホンが収音した音声に従って、前記操作対象機器特定部によって特定された操作対象機器を制御する遠隔制御方法を提供する。
【発明の効果】
【0008】
本発明の遠隔制御装置及び遠隔制御方法によれば、複数のユーザが存在しても適切に操作対象機器を特定することができる。
【図面の簡単な説明】
【0009】
図1図1は、第1または第2実施形態に係る遠隔制御装置と、操作対象機器としての2台のテレビが存在する状況の例を示す図である。
図2図2は、第1実施形態に係る遠隔制御装置を示すブロック図である。
図3図3は、第1または第2実施形態に係る遠隔制御装置を示す外観斜視図である。
図4図4は、第1または第2実施形態に係る遠隔制御装置における操作対象機器登録部に登録されているマップ情報の例を示す図である。
図5図5は、第1または第2実施形態に係る遠隔制御装置における操作対象機器登録部に登録されているマップ情報の例を示す概念図である。
図6図6は、第1または第2実施形態に係る遠隔制御装置における顔画像登録部に登録されているユーザの顔画像を示す概念図である。
図7図7は、第2実施形態に係る遠隔制御装置を示すブロック図である。
図8図8は、第2実施形態に係る遠隔制御装置における音声登録部に登録されているユーザの音声を示す概念図である。
図9図9は、第3実施形態に係る遠隔制御装置を示すブロック図である。
【発明を実施するための形態】
【0010】
図1において、テレビTv1はリビングルームに置かれており、テレビTv2はダイニングルームに置かれているとする。テレビTv1及びTv2は操作対象機器の例である。ユーザ60が、第1実施形態に係る遠隔制御装置100、第2実施形態に係る遠隔制御装置200、または第3実施形態に係る遠隔制御装置300によってテレビTv1またはTv2を操作する。以下、第1実施形態に係る遠隔制御装置100、第2実施形態に係る遠隔制御装置200、第3実施形態に係る遠隔制御装置300の構成、動作、遠隔制御装置100、200、300で実行される遠隔制御方法について、添付図面を参照して説明する。
【0011】
<第1実施形態>
図2において、第1実施形態に係る遠隔制御装置100は、カメラ1、登録顔画像認識部2、顔画像登録部3、視線検出部4、操作対象機器位置算出部5、操作対象機器登録部6、操作対象機器特定部7、音声応答制御部8、遠隔制御信号発生部9を備える。また、第1実施形態に係る遠隔制御装置100は、マイクロホン10、音声認識部11、音声合成制御部12、音声合成部13、スピーカ14、操作部15、登録制御部16を備える。
【0012】
図3に示すように、遠隔制御装置100は、筐体50の上部にカメラ1が取り付けられた構成を有する。筐体50内には、カメラ1以外の図2に示す各構成が収納されている。カメラ1は撮像範囲が広い広角カメラが望ましく、例えば360度カメラである。
【0013】
登録顔画像認識部2、操作対象機器位置算出部5、操作対象機器特定部7、音声認識部11、音声応答制御部8、音声合成制御部12、音声合成部13、登録制御部16は、マイクロコンピュータの中央処理装置(CPU)で構成することができる。顔画像登録部3及び操作対象機器登録部6は、マイクロコンピュータのメモリで構成することができる。視線検出部4は、特許文献2に記載されている技術を応用することによって構成することができる。
【0014】
遠隔制御信号発生部9は、赤外線のコードを発生する発光ダイオードを含む発生回路によって構成することができる。音声認識部11及び音声合成部13は、CPUとは別の集積回路で構成されていてもよい。操作部15は、筐体50に設けられている操作ボタンであってもよいし、タッチパッドであってもよい。
【0015】
(操作対象機器の登録)
ユーザ60(または他のユーザ)が操作部15を操作することによって、登録制御部16は、操作対象機器登録部6にテレビTv1及びTv2の名称を登録する。図4に示すように、テレビTv1はリビングルームのテレビ、テレビTv2はダイニングルームのテレビと名称が登録されたとする。
【0016】
ユーザ60が操作部15を操作することによって、テレビTv1及びTv2の位置情報を登録する登録モードに設定すると、登録制御部16は、音声合成部13を制御して、スピーカ14より、テレビTv1及びTv2を順に見るよう指示する音声を発生させる。ユーザ60に対する指示の仕方は音声には限定されない。ユーザ60がテレビTv1を見ると、視線検出部4はユーザ60の視線の方向を検出する。操作対象機器位置算出部5は、視線検出部4が検出した視線の方向に基づいて、遠隔制御装置100から見たテレビTv1の少なくとも方向を算出する。
【0017】
操作対象機器位置算出部5は、視線検出部4が検出した左右の視線の交点を算出することにより、遠隔制御装置100からテレビTv1までのおおよその距離を算出してもよい。テレビTv1等の操作対象機器の位置とは、少なくとも遠隔制御装置100から見た操作対象機器の方向であり、好ましくは、遠隔制御装置100から見た操作対象機器の方向と遠隔制御装置100から操作対象機器までの距離である。
【0018】
登録制御部16は、操作対象機器位置算出部5が算出したテレビTv1の位置情報を操作対象機器登録部6に登録する。続けて、ユーザ60がテレビTv2を見ると、同様に、操作対象機器位置算出部5はTv2の位置を算出し、登録制御部16は、操作対象機器登録部6にTv2の位置情報を登録する。
【0019】
図5に示すように、テレビTv1は遠隔制御装置100から見て方向Dr1に距離Ds1に位置し、Tv2は遠隔制御装置100から見て方向Dr2に距離Ds2に位置しているとする。図4に示すように、操作対象機器登録部6には、リビングルームのテレビであるテレビTv1の位置情報として方向Dr1及び距離Ds1が登録され、ダイニングルームのテレビであるテレビTv2の位置情報として方向Dr2及び距離Ds2が登録される。このように、登録制御部16は、操作対象機器登録部6に各操作対象機器をマップ情報として登録する。
【0020】
操作対象機器の登録方法は上記に限定されず、ユーザが各操作対象機器の位置情報を手入力で入力する方法でもよい。
【0021】
(ユーザの顔画像の登録)
図2おいて、ユーザ60(または他のユーザ)が操作部15を操作することによって、顔画像を登録する登録モードに設定すると、登録制御部16は、カメラ1が撮影したユーザ60の顔画像を顔画像登録部3に登録する。図6に示すように、顔画像登録部3には、ユーザIDに対応させて、遠隔制御装置100を操作するユーザの顔画像が登録される。顔画像登録部3に登録される顔画像は、カメラ1が各ユーザを撮影した顔画像であってもよいし、別のカメラが各ユーザを撮影した顔画像であってもよい。
【0022】
(機器の操作)
図1に示すユーザ60は、ユーザIDが0001であるユーザである。登録顔画像認識部2は、顔画像登録部3に登録されている顔画像に基づいて、カメラ1によって撮影された人が顔画像登録部3に登録されているユーザであるか否かを認識する。視線検出部4は、登録顔画像認識部2が顔画像登録部3に登録されているユーザであると認識した人の視線の方向を検出する。視線検出部4が顔画像登録部3に登録されているユーザであると認識した人の視線の方向を検出することにより、登録されたユーザ以外の人の視線を誤って検出することを回避することができる。登録顔画像認識部2及び顔画像登録部3は、遠隔制御装置100を操作するユーザを特定するユーザ特定部として機能する。
【0023】
操作対象機器特定部7は、操作対象機器登録部6に登録されている複数の操作対象機器のうち、視線検出部4が検出した視線の方向に位置する操作対象機器を音声によって操作される対象の操作対象機器であると特定する。図1に示すように、ユーザ60がテレビTv1を見ていると、操作対象機器特定部7は、テレビTv1を音声によって操作される対象の操作対象機器であると特定する。
【0024】
操作対象機器特定部7がテレビTv1を対象の操作対象機器であると特定している状態で、ユーザ60が例えば「電源をオンしてください」と声を発したとする。音声認識部11は、音声を認識して、音声応答制御部8に電源のオンを指示する。音声応答制御部8は、操作対象機器特定部7よりテレビTv1が対象の操作対象機器であると特定されているという情報を取得する。音声応答制御部8は、遠隔制御信号発生部9にテレビTv1の電源をオンする遠隔制御信号の発生を指示する。
【0025】
遠隔制御信号発生部9は、音声応答制御部8による指示を受けて、テレビTv1の電源をオンする遠隔制御信号を発生させる。これにより、テレビTv1は電源がオンされる。
【0026】
同様に、操作対象機器特定部7がテレビTv1を対象の操作対象機器であると特定している状態で、ユーザ60が例えば「ボリュームを上げてください」と声を発したとすると、テレビTv1のボリュームを上げることができる。
【0027】
このように、複数の操作対象機器としてテレビTv1及びTv2が存在しても、ユーザ60は「リビングルームのテレビの電源をオンしてください」とか「リビングルームのテレビのボリュームを上げてください」のような長い文章で遠隔制御装置100に指示する必要はない。遠隔制御装置100によれば、音声による指示を簡略化することができる。
【0028】
ところで、操作対象機器特定部7が音声によって操作される対象の操作対象機器を特定していない状態で、ユーザ60が「電源をオンしてください」と声を発したとする。この場合、音声合成制御部12は、「リビングルームのテレビの電源をオンしますか、ダイニングルームのテレビの電源をオンしますか」のような問い合わせの文章を音声合成して、スピーカ14より発生させるよう、音声合成部13を制御する。
【0029】
その問い合わせの文章を聞いたユーザ60は、「リビングルームのテレビの電源をオンしてください」と声を発する。音声認識部11は、ユーザ60が発した音声を認識して、音声応答制御部8にリビングルームのテレビであるテレビTv1の電源のオンを指示する。音声応答制御部8は、遠隔制御信号発生部9にテレビTv1の電源をオンする遠隔制御信号の発生を指示する。
【0030】
このように、操作対象機器特定部7が対象の操作対象機器を特定しないと、音声応答制御部8が対象の操作対象機器を特定するまでに、スピーカ14からの音声の発生、マイクロホン10による音声の収音、音声認識部11による音声の認識が必要となることがある。操作対象機器特定部7が対象の操作対象機器を特定することにより、極めて簡単な文の音声で操作対象機器を操作することが可能となる。
【0031】
また、カメラ1の撮像範囲内に登録ユーザ以外のユーザを含めて複数のユーザが存在した場合でも、登録ユーザの視線を検出して操作対象機器を特定することで、適切に操作対象機器を特定することができる。
【0032】
上記の説明では、登録ユーザの視線に基づいて操作対象機器を特定した状態で音声を検出した場合に、検出した音声に基づく機器操作を行う例を説明したが、常時登録ユーザの視線を検出する必要はなく、音声を検出した場合に登録ユーザの視線を検出して操作対象機器を特定する構成としてもよい。
【0033】
遠隔制御装置100によれば、顔画像登録部3に登録されている特定のユーザの視線に基づいて操作対象機器を特定するので、複数のユーザが存在する場合でも、特定のユーザが操作したい機器を的確に特定することができる。
【0034】
<第2実施形態>
図7は、第2実施形態に係る遠隔制御装置200を示す。遠隔制御装置200において、遠隔制御装置100と同一部分には同一符号を付し、その説明を省略する。遠隔制御装置200は、遠隔制御装置100が備えていない構成として、音声登録部17及び登録音声認識部18を備える。操作対象機器の登録に関しては第1実施形態と同様であり、その説明を省略する。
【0035】
(ユーザの音声の登録)
図7おいて、ユーザ60(または他のユーザ)が操作部15を操作することによって、ユーザ60を登録するユーザ登録モードに設定すると、登録制御部16は、音声登録部17にユーザ60の音声を登録する。登録モードに設定している状態で、マイクロホン10は、ユーザ60が発する所定の文を収音する。登録制御部16は、マイクロホンが収音した音声を音声登録部17に登録する。
【0036】
図8に示すように、登録制御部16は、ユーザIDに対応させて、ユーザの音声を音声登録部17に登録する。音声登録部17に登録されるユーザIDは、顔画像登録部3に登録されるユーザIDと1対1で対応している。つまり、顔画像登録部3に登録されているユーザと音声登録部17に登録されているユーザは、ユーザIDが同じであれば、同一ユーザである。よって、音声登録部17は、顔画像登録部3に登録されているユーザの顔画像に関連付けて、ユーザの声を登録している。
【0037】
遠隔制御装置200の通常の動作時に、ユーザ60が例えば「電源をオンしてください」と声を発したとする。登録音声認識部18は、マイクロホン10が収音した音声が音声登録部17に登録されているユーザの音声であるか否かを認識する。登録音声認識部18は、音声の声紋に基づいて登録されているユーザの音声であるか否かを認識することができる。
【0038】
登録音声認識部18は、マイクロホン10が収音した音声が音声登録部17に登録されているユーザ60の音声であると認識すると、ユーザIDを特定し、顔画像登録部3に登録されているユーザ顔画像データに基づいて、特定したユーザIDに対応するユーザ顔画像を特定する。登録顔画像認識部2は、特定したユーザの顔画像を認識する。視線検出部4は登録顔画像認識部2が認識したユーザの視線の方向を検出する。操作対象機器特定部7は、操作対象機器登録部6に登録されている複数の操作対象機器のうち、視線検出部4が検出した視線の方向に位置する操作対象機器を制御される対象の操作対象機器であると特定する。
【0039】
登録音声認識部18は、マイクロホン10が収音した音声が音声登録部17に登録されているユーザ60の音声であると認識すると、音声応答制御部8に、音声登録部17に登録されているユーザの音声を認識した旨を通知する。音声応答制御部8は、登録されているユーザの音声を認識した旨が通知されれば、音声認識部11からの電源をオンする指示に従って、操作対象機器特定部7が特定した操作対象機器の電源をオンする遠隔制御信号の発生を遠隔制御信号発生部9に指示する。
【0040】
図7において、顔画像登録部3と音声登録部17とを別々に示しているが、顔画像登録部3と音声登録部17とを1つのユーザ登録部として構成してもよい。登録顔画像認識部2、顔画像登録部3、音声登録部17、登録音声認識部18は、遠隔制御装置200を操作するユーザを特定するユーザ特定部として機能する。
【0041】
遠隔制御装置200によれば、例えば、登録ユーザが複数存在して、それぞれの登録ユーザが音声による指示を発声した場合でも、検出した音声ごとにユーザを特定して、特定したユーザの視線方向に基づいて操作対象機器を特定するので、遠隔制御装置100と比較して、より適切に操作対象機器を特定することができる。
【0042】
遠隔制御装置200によれば、遠隔制御装置100の構成に対し、操作指示音声に基づいてユーザを特定する登録音声認識部18を備えるので、登録ユーザが複数存在する場合でも操作指示音声を発したユーザを特定して、特定したユーザの視線に基づいて操作対象機器を特定することができる。よって、遠隔制御装置200によれば、複数のユーザが存在する場合でも、特定のユーザが操作したい機器をより的確に特定することができる。
【0043】
<第3実施形態>
図9は、第3実施形態に係る遠隔制御装置300を示す。遠隔制御装置300において、遠隔制御装置100と同一部分には同一符号を付し、その説明を省略する。遠隔制御装置100においては、登録顔画像認識部2が顔画像登録部3に登録されている顔を認識することで遠隔制御装置100を操作するユーザを特定する。これに対して、遠隔制御装置300は音声発生方向を推定する音声検出部30を備え、音声検出部30が推定した音声発生方向に基づいて遠隔制御装置300を操作するユーザを特定する。
【0044】
図9において、音声検出部30は、音声を検出し、検出した音声の発声方向を推定する。音声検出部30は、検出した音声を音声認識部11に送信し、推定した音声発生方向を示す情報をユーザ特定部31に送信する。音声検出部30は、既存の技術を使用して音声発生方向を推定することができる。例えば、音声検出部30は複数のマイクロホンを備え、複数のマイクロホンで検出した音声の位相差に基づいて音声発生方向を推定する。
【0045】
音声検出部30は、複数のマイクロホンを一体的に備える構成である必要はなく、複数のマイクロホンが部屋の異なる場所に設置されていてもよい。音声検出部30は、部屋の異なる場所に設置された複数のマイクロホンの各マイクロホンが検出する音声の大きさまたは位相差に基づいて音声発生方向を推定してもよい。音声発生方向の推定方法は複数のマイクロホンを用いる方法に限定されず、他の方法を用いてもよい。
【0046】
ユーザ特定部31は、音声検出部30より供給される音声発生方向を示す情報とカメラ1での撮像結果とに基づいて、遠隔制御装置300を操作するユーザを特定する。具体的には、ユーザ特定部31は、音声検出部30で推定した音声発生方向に存在する人物を、遠隔制御装置300を操作するユーザとして特定する。ユーザ特定部31は、CPUで構成することができる。
【0047】
視線検出部4は、ユーザ特定部31が特定したユーザの視線を検出する。操作対象機器特定部7は、操作対象機器登録部6に登録されている複数の操作対象機器のうち、視線検出部4が検出した視線の方向に位置する操作対象機器を音声によって操作される対象の操作対象機器であると特定する。操作対象機器特定部7が操作対象機器を特定した以降の動作は、遠隔制御装置100と同様である。
【0048】
音声検出部30が推定した音声発生方向に存在する人物を、遠隔制御装置300を操作するユーザとして特定する代わりに、第3実施形態の変形例として次のように構成されていてもよい。ユーザ特定部31は、カメラ1が撮像している人物の中から、音声検出部30が音声を検出したタイミングで口が動いた人物を、遠隔制御装置300を操作するユーザとして特定する。この場合、音声検出部30は音声発生方向を推定する機能を有する必要はない。
【0049】
本発明は以上説明した第1~第3実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々変更可能である。
【符号の説明】
【0050】
1 カメラ
2 登録顔画像認識部(ユーザ特定部)
3 顔画像登録部(ユーザ特定部)
4 視線検出部
5 操作対象機器位置算出部
6 操作対象機器登録部
7 操作対象機器特定部
8 音声応答制御部
9 遠隔制御信号発生部
10 マイクロホン
11 音声認識部
12 音声合成制御部
13 音声合成部
14 スピーカ
15 操作部
16 登録制御部
17 音声登録部(ユーザ特定部)
18 登録音声認識部(ユーザ特定部)
30 音声検出部
31 ユーザ特定部
60 ユーザ
100,200,300 遠隔制御装置
Tv1,Tv2 テレビ
図1
図2
図3
図4
図5
図6
図7
図8
図9