【解決手段】一つ以上の機器と該機器を操作する携帯端末10とから成る操作システムであって、携帯端末10は、機器を撮影するカメラ11と、カメラ11で撮影した機器画像を取得し、該機器画像の基準点に位置する機器を指定する機器指定部12と、指定した機器を操作する操作信号を生成する操作信号生成部13とを備える。
【発明を実施するための形態】
【0011】
以下、本発明の実施形態について図面を用いて説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。
【0012】
図1は、本発明の実施形態に係る操作システムの構成例を示す構成図である。
図1に示す操作システム100は、一つ以上の機器20a,20b,20cと、携帯端末10とで構成される。
【0013】
図1に示す例は、人の背丈よりも高い棚30の上に機器20a,20b,20cが置かれ、操作者Uが携帯端末10でそれらの機器20a,20b,20cを操作する様子を示している。携帯端末10は、操作者Uが手で持つ例を示すがこの例に限られない。携帯端末10は、操作者Uの腕、肩、胸、及び足等の何れの部分で携帯しても構わない。
【0014】
また、機器20a,20b,20cは、操作者Uよりも低い位置の例えばテーブル(図示せず)上に置いてあってもよい。
図1は、操作者Uが比較的操作し難い位置の例を示す。
【0015】
機器20aは、例えば遠隔操作で照度が調整できる照明である。機器20bは、例えば遠隔操作が可能なラジオである。機器20cは、例えば遠隔操作で加湿量が調整できる加湿器である。機器はこの例に限られない。例えば、床の上に配置される自走式掃除機等であっても構わない。なお、以降の説明において、機器20a,20b,20cの何れかを指定する必要がない場合、単に機器20と表記する。
【0016】
図2は、携帯端末10の機能構成例を示すブロックである。
図2に示すように、携帯端末10は、カメラ11、機器指定部12、及び操作信号生成部13を備える。
【0017】
カメラ11は、携帯端末10の先端部分に取付けられる。操作者Uは、その先端を機器20に向けてそれらの機器画像を撮影する。カメラ11は、一般的なディジタルカメラである。
【0018】
機器指定部12は、カメラ11で撮影した機器画像を取得し、機器画像の基準点に位置する機器20を指定する。機器画像の基準点とは、カメラ11で撮影する機器画像の例えば中心座標である。
【0019】
中心座標の画素を中心に、所定の画素数の画像枠(フレーム)を設定し、画像枠内の画像を認識して機器20を指定する。例えば、画像枠に含まれる外形が球体であれば機器20a、外形が立方体であれば機器20b、外形が円柱であれば機器20cと指定する。また、画像枠内の文字列(機器の型式等)を認識して機器20を指定するようにしてもよい。
【0020】
機器指定部12は、外形と機器名、文字列と機器名等の情報を備えており、機器画像から操作対象の機器を指定する。外形と機器名、及び文字列と機器名等は図示を省略しているメモリに予め記憶させておく。
【0021】
操作信号生成部13は、指定した機器20を操作する操作信号を生成する。操作信号は、携帯端末10に設けられたスイッチから得られるスイッチ信号と、メモリ(図示せず)に記憶された機器の操作仕様とを対応付けて生成する。機器指定部12が機器20bを指定した場合、操作信号生成部13は所定のスイッチのスイッチ信号に対応させて、例えば機器20b(ラジオ)の音量を高くする操作信号を生成する。
【0022】
操作信号は、赤外線(IrDA)又は電磁波(WiFi,Bluetooth)に変換されて指定した機器20に送信される。このように、携帯端末10で指し示した機器20を指定して操作することができる。
【0023】
以上説明したように、本実施形態に係る操作システム100は、一つ以上の機器20と該機器20を操作する携帯端末10とから成る操作システムであって、携帯端末10は、機器20を撮影するカメラ11と、カメラ11で撮影した機器画像を取得し、該機器画像の基準点に位置する機器20を指定する機器指定部12と、指定した機器20を操作する操作信号を生成する操作信号生成部13とを備える。これにより、一つの携帯端末10で指定した機器20を操作することができる。また、操作システム100を構成する構成要素が少ないのでコストを安くすることができる。
【0024】
(機器画像)
図3は、機器画像の例を模式的に示す図である。
図3に示す機器画像OGは、携帯端末10のカメラ11で撮影した画像である。
【0025】
機器画像OGは、例えば500万画素の画像であると仮定する。その場合、機器画像OGの横方向(x)は2560画素、縦方向(y)は1920画素で表される。
【0026】
図3に示す基準点αは、例えば機器画像OGの中心(x=1280,y=960)である。
図3では、説明の都合上、基準点αを表記しているが、基準点αは表示する必要はない。また、
図3では基準点αを画素数1の点よりも大きく表記している。
【0027】
機器指定部12は、基準点αを中心に所定の画素数の画像枠(フレーム)を設定し、その画像枠に含まれる物体を画像認識する。したがって、操作者Uがどの機器20を指しているか、基準点αと画像枠(図示せず)から検出することができる。つまり、操作者Uが操作したい機器20を指定することができる。画像枠の大きさは、物体(機器20)を含むように自動で調整してもよい。
【0028】
次に、カメラ11を360度カメラで構成した例について説明する。
【0029】
(360度カメラを用いた携帯端末)
図4は、携帯端末10のカメラ11を、360度カメラ21で構成した場合の側面を示す図である。
【0030】
図4に示すように、360度カメラ21は、例えば棒状の柄15の先端部分に取付けられる。柄15は操作者Uが手で握る部分である。柄15の表面には、操作者Uが操作するスイッチ131,132が設けられている。また、柄15の内部には、360度カメラ21の天頂方向を検出する3軸加速度センサ14が設けられている。3軸加速度センサ14は、360度カメラ21で撮影した全天球画像の天地を調整する。なお、3軸加速度センサ14を用いて天地を調整する方法は周知である。
【0031】
360度カメラ21は、2つの魚眼レンズ211,212で撮影した2枚の半球画像をつなぎ合わせた1つの360度全天球画像を撮影する。魚眼レンズ211,212の直径の中心部分には、撮像素子(図示せず)が設けられる。
【0032】
全天球画像は、縦方向(z)、横方向(x)のそれぞれを360度撮影した画像である。奥行方向(y)は、z方向とx方向の全天球画像に含まれる。
【0033】
魚眼レンズ211は機器画像OG(半球画像)を撮影する。魚眼レンズ212は、携帯端末10を携帯する操作者Uの操作者画像SG(半球画像)を撮影する。
【0034】
図5は、機器画像OGと操作者画像SGを模式的に示す図である。機器画像OGは、棚30と、その上に置かれた機器20a,20b,20cの画像を含む。操作者画像SGは、携帯端末10を左手で持つ操作者Uの上半身の画像を含む。
【0035】
図6は、360度カメラ21で撮影した全天球画像を正距円筒図に変換した図を模式的に示す図である。正距円筒図は、全天球画像の緯度・経度を、x−y座標に変換した図である。その変換方法は周知である。
【0036】
図6に示す縦・横方向の0は、緯度(φ)の0度と経度(θ)の0度を表す。λ=0度、φ=0度は360度カメラ21の中心位置である(
図6に示すA)。緯度0〜90度は、360度カメラ21から見た仰角であり、0〜-90度は360度カメラ21から見た俯角である。経度0〜180度は360度カメラ21からx方向、経度0〜-180度は360度カメラ21から-x方向を表す。
【0037】
魚眼レンズ211の−x側の頂点を、機器20bに向けた場合(
図1)は、機器20bは横軸-90度上の第二象限に位置する(
図6に示すC)。一方、その姿勢の魚眼レンズ212で撮影した操作者Uは、魚眼レンズ212の正面なので横軸90度上に位置する。
【0038】
360度カメラ21を基準とする操作者Uの視点位置(V
θ[deg],V
φ[deg])は、特徴点の検出と特徴点同士の関係を検出する技術であるOpenPoseを用いることで取得できる。OpenPose(姿勢推定ライブラリ)は周知である。
【0039】
次に、視点位置(V
θ[deg],V
φ[deg])を基準とする視線方向(G
θ[deg],G
φ[deg])を取得する。視線方向(G
θ[deg],G
φ[deg])は、視線を検出するOpenGazeを用いることで取得できる。OpenGazeは周知である。
【0040】
次に、操作対象の機器20の位置(L[20]
θ[deg],L[20]
φ[deg])を取得する。機器20の位置(L[20]
θ[deg],L[20]
φ[deg])は、物体検出手法であるYOLOを用いることで取得できる。YOLO(You Look Only Onse)は周知である。
【0041】
操作者Uの視点位置(V
θ[deg],V
φ[deg])と視線方向(G
θ[deg],G
φ[deg])から操作者Uが注視する注視点(T
θ[deg],T
φ[deg])を計算することができる。
【0042】
図7は、操作者Uの注視点(T
θ[deg],T
φ[deg])の計算方法の一例を模式的に示す図である。
図7に示す「A」は、360度カメラ21の位置、「B」は操作者Uの視点位置(V
θ[deg])、「C」は操作対象の機器20である。計算方法は仰角方向で説明する。
【0043】
図7において、360度カメラ21の位置「A」を中心として視点位置(V
θ[deg])の「B」と機器20「C」を通る円を想定する。この場合、360度カメラ21から機器20までの距離と、360度カメラ21から操作者Uの視点位置(V
θ[deg])までの距離は等しい。
【0044】
ここで、360度カメラ21の位置「A」を原点とするx軸と平行な視点位置「B」を通る直線x′を想定する。そうすると、視点位置「B」から機器20を見る角度は視線方向(G
θ[deg])である。また、線分ABと直線x′とが成す角度は、視点位置(V
θ[deg])と同じである。
【0045】
視線方向(G
θ[deg])と視点位置(V
θ[deg])は既知であるので、操作者Uの注視点(T
φ[deg])は次式で計算することができる。
【0047】
経度方向の操作者Uの注視点(T
θ[deg])も同様に計算することができる。なお、注視点(T
φ[deg])は、T
φ[deg]+ V
φ[deg]で表わしても構わない。
【0048】
求めた注視点(T
θ[deg],T
φ[deg])から操作者Uが操作したい機器20を指定する。つまり、
図7に示す線分ABと線分ACが成す角度、又はx軸と線分ACが成す角度にある(近い)機器20を操作対象として指定する。
【0049】
以上説明したように、機器指定部12は、操作者画像SGから該操作者Uの視線方向を検出し、該視線方向に基づいて例えば機器20bを指定する。また、機器画像OG及び操作者画像SGは、360度カメラ21で撮影した全天球画像情報から取得するようにしてもよい。これにより、一つの携帯端末10で指定した機器20を操作することができる。
【0050】
つまり、操作者Uが操作したい機器20を指定することができれば、操作信号生成部13はその機器20の仕様に合わせた操作信号を容易に生成することができる。
【0051】
なお、携帯端末10の操作スイッチ131,132から得られるスイッチ信号に基づいて操作信号を生成する例を説明したが、操作スイッチ131,132を用いずに操作信号を生成する方法も考えられる。その場合、操作者画像SGに含まれる操作者Uの所作を認識し、該所作に対応する操作信号を生成させる。所作は、例えば瞬きの回数及び指の本数等が考えられる。これにより、携帯端末10の操作スイッチ131,132を無くすことができる。操作スイッチ131,132を無くすことで、携帯端末10の外装ケースのコストを安くすることができる。
【0052】
また、操作信号に、操作者Uを識別する識別情報を含めてもよい。操作者Uの識別は、携帯端末10を持つ人の顔を認識することで行える。つまり、機器指定部12は、携帯端末10を携帯する操作者Uの操作者画像も取得し、該操作者画像を認識して操作者Uを指定し、操作信号生成部13は、操作者Uを識別する識別情報を操作信号に含める。これにより、該操作信号を受信した機器20は操作者Uに対応させたサービスを提供することができる。操作者Uに対応させたサービスは、例えば機器20がテレビであれば、操作者Uが過去に視聴したジャンルの最新のビデオプログラムを表示する等のことである。
【0053】
なお、カメラは360度カメラ21に限られない。1つの一般的なディジタルカメラ(カメラ11)で機器画像OGと操作者画像SGを撮影するようにしてもよい。
【0054】
図8は、1つのカメラ11で機器画像OGと操作者画像SGを撮影する変形例の構成を示す図である。カメラ11に対向して2枚の鏡40a,40bが配置されている。鏡40aの−x方向には機器20は配置され、鏡40bのx方向には操作者Uが位置している。
【0055】
図8に示すように構成したカメラ11で機器画像OGと操作者画像SGを撮影するようにしても構わない。360度カメラ21を用いた場合と同じ作用効果が得られる。
【0056】
また、機器指定部12は、2つの機器画像OGと操作者画像SGから三次元座標情報を生成するようにしてもよい。
【0057】
図9は、2つの機器画像OGと操作者画像SGから三次元座標情報を生成する原理を説明する模式図である。
図9は、
図6で説明した状態から操作者Uが携帯端末10を機器20側に突き出し、その突き出した距離と同じ距離、操作者Uが顔を携帯端末10から遠ざけた(のけぞる)場合を仮定した正距円筒図である。
【0058】
この場合、360度カメラ21の位置「A」を中心とする2つの二等辺三角形ABCとAB′C′とが得られる。この2つの視点位置(V
θ[deg],V
φ[deg])と視線方向(G
θ[deg],G
φ[deg])も用いステレオカメラの原理で三次元座標情報を取得することができる。
【0059】
このように、機器指定部12は、2つの機器画像OGと操作者画像SGから三次元座標情報を生成し、該三次元座標で機器20を指定することができる。これにより、例えば、床に置かれた複数の自走式掃除機に対して選択的に操作信号を送信することができる。
【0060】
(操作方法)
図10は、本実施形態に係る操作システム100が実行する操作方法の処理手順を示すフローチャートである。
【0061】
操作システム100が動作を開始すると、カメラ11は、一つ以上の機器20を撮影して機器画像OGを取得する(ステップS1)。カメラ11が360度カメラ21の場合は、操作者画像SGも同時に取得する。
【0062】
機器指定部12は、機器画像OGの基準点αに位置する機器20を指定する(ステップS2)。基準点αは、例えばカメラ11で撮影する画像の中心座標である。中心座標の画素を中心に、所定の画素数の画像枠(フレーム)を設定し、画像枠内の画像を認識して機器20を指定する。
【0063】
操作信号生成部13は、機器指定部12が指定した機器を操作する操作信号を生成する(ステップS3)。操作信号は、物理的なスイッチを操作して得られるスイッチ信号に基づいて生成してもよいし、操作者Uの所作を認識して所作に対応させた操作信号にしてもよい。
【0064】
このように、本実施形態に係る操作方法は、操作システム100が行う操作方法であって、一つ以上の機器20を撮影して機器画像OGを取得する撮影ステップS1と、機器画像OGの基準点αに位置する機器20を指定する機器指定ステップS2と、指定した機器20を操作する操作信号を生成する操作信号生成ステップS3とを行う。一つの携帯端末10で指定した機器を操作することができる。
【0065】
操作システム100及び操作方法は、
図11に示す汎用的なコンピュータシステムで実現することができる、例えば、CPU90、メモリ91、ストレージ92、通信部93、入力部94、及び出力部95を備える汎用的なコンピュータシテムにおいて、CPU90がメモリ91上にロードされた所定のプログラムを実行することにより、操作システム100のカメラ11を除く各機能が実現される。所定のプログラムは、HDD、SSD、USBメモリ、CD-ROM、DVD-ROM、MOなどのコンピュータ読取り可能な記録媒体に記録することも、ネットワークを介して配信することも可能である。
【0066】
本実施形態に係る操作システム100及び操作方法によれば、操作者Uの手の届かない機器20を操作することができる。また、操作が他者の妨げになることもない。また、少ない例えば手の動きで機器20を操作することができる。また、ヘッドアップディスプレイ等の装着に違和感を伴うものが不要である。また、複数人の間で操作権の譲渡が容易に行える。
【0067】
本発明は、上記の実施形態に限定されるものではなく、その要旨の範囲内で変形が可能である。例えば、全天球画像の天地の修正は3軸加速度センサ14を用いる例を説明したが、本発明はこの例に限定されない。例えば、操作システム100を配置する環境に事前にマーカーを配置し、そのマーカーを画像認識することで全天球画像の天地を修正することができる。
【0068】
また、操作者Uを特定するのに操作者画像を認識する例を説明したが、この例に限定されない。上記のOpenPoseで検出されるボーン情報を元に携帯端末10を保持している操作者Uを特定し、操作したい機器20を指定するようにしてもよい。
【0069】
また、操作する対象の機器20は棚30の上に配置される例(
図1)を示したが、操作者Uの視点よりも低い例えばテーブルの上に置かれた機器20に対しても同様に操作信号を送信することができる。
【0070】
このように、本発明はここでは記載していない様々な実施形態等を含むことは勿論である。したがって、本発明の技術的範囲は上記の説明から妥当な特許請求の範囲に係る発明指定事項によってのみ定められるものである。