(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025002555
(43)【公開日】2025-01-09
(54)【発明の名称】制御方法
(51)【国際特許分類】
G06T 5/50 20060101AFI20241226BHJP
H04N 23/60 20230101ALI20241226BHJP
G10G 1/02 20060101ALI20241226BHJP
G10H 1/00 20060101ALI20241226BHJP
G09B 15/00 20060101ALI20241226BHJP
【FI】
G06T5/50
H04N23/60 300
H04N23/60 500
G10G1/02
G10H1/00 Z
G09B15/00 Z
【審査請求】未請求
【請求項の数】1
【出願形態】OL
(21)【出願番号】P 2023102806
(22)【出願日】2023-06-22
(71)【出願人】
【識別番号】000003207
【氏名又は名称】トヨタ自動車株式会社
(74)【代理人】
【識別番号】100147485
【弁理士】
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【弁護士】
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100139491
【弁理士】
【氏名又は名称】河合 隆慶
(74)【代理人】
【識別番号】100220674
【弁理士】
【氏名又は名称】小山 祐
(72)【発明者】
【氏名】仲 恵輔
(72)【発明者】
【氏名】諏訪 允俊
【テーマコード(参考)】
5B057
5C122
5D182
5D478
【Fターム(参考)】
5B057AA20
5B057CA08
5B057CA12
5B057CA16
5B057CB08
5B057CB12
5B057CB16
5B057CE08
5B057CE09
5B057DA07
5B057DA16
5B057DB02
5B057DB09
5B057DC30
5C122FA18
5C122FH18
5C122GC53
5C122HA85
5C122HB01
5D182AA01
5D478FF22
(57)【要約】 (修正有)
【課題】遠隔地にいる相手方と作業を共有する際の相手方とユーザ自身との一体感を増大させる制御方法を提供する。
【解決手段】撮像部と投影部とを有する端末装置が実行する制御方法であって、撮像部により作業領域におけるユーザの手作業を撮像して得られる、当該作業領域の第1の位置におけるユーザの手の画像を含む第1の画像と、他のユーザによる他の作業領域における手作業を当該他のユーザが使用する他の端末装置により撮像して得られる、当該他の領域における第1の位置とは異なる第2の位置に当該他のユーザの手の画像を含む第2の画像とに基づいて、ユーザの手の画像と、当該ユーザの手の画像以外の領域であって他のユーザの手の画像とを所定の輝度とした合成画像を、投影部によって、作業領域上に投影させることを含む。
【選択図】
図2
【特許請求の範囲】
【請求項1】
撮像部と投影部とを有する端末装置が実行する制御方法であって、
前記撮像部により作業領域におけるユーザの手作業を撮像して得られる、当該作業領域の第1の位置における前記ユーザの手の画像を含む第1の画像と、他のユーザによる他の作業領域における手作業を当該他のユーザが使用する他の端末装置により撮像して得られる、当該他の領域における前記第1の位置とは異なる第2の位置に当該他のユーザの手の画像を含む第2の画像とに基づいて、前記ユーザの手の画像と、当該ユーザの手の画像以外の領域であって前記他のユーザの手の画像とを所定の輝度とした合成画像を、前記投影部に、前記作業領域上に投影させることを含む、
制御方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、制御方法に関する。
【背景技術】
【0002】
遠隔によるピアノの演奏教習において、ユーザに鍵盤操作を指導するために、ユーザの相手方である講師の演奏の様子を表す画像をユーザ自身の使用する楽器に投影する技術が知られている。例えば、特許文献1には、小型鍵盤で生成された鍵盤操作情報を画像情報に変換し、画像情報に基づいて画像をピアノの鍵盤に投影するピアノ教習補助装置が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
離れたところにいる相手方の演奏の様子を再現する端末装置において、ユーザ自身の演奏との一体感を増大させる技術には改善の余地があった。
【0005】
かかる事情に鑑みてなされた本開示の目的は、遠隔地にいる相手方と作業を共有する際の相手方とユーザ自身との一体感を増大させる技術を改善することにある。
【課題を解決するための手段】
【0006】
本開示の一実施形態に係る制御方法は、撮像部と投影部とを有する端末装置が実行する制御方法であって、前記撮像部により作業領域におけるユーザの手作業を撮像して得られる、当該作業領域の第1の位置における前記ユーザの手の画像を含む第1の画像と、他のユーザによる他の作業領域における手作業を当該他のユーザが使用する他の端末装置により撮像して得られる、当該他の領域における前記第1の位置とは異なる第2の位置に当該他のユーザの手の画像を含む第2の画像とに基づいて、前記ユーザの手の画像と、当該ユーザの手の画像以外の領域であって前記他のユーザの手の画像とを所定の輝度とした合成画像を、前記投影部に、前記作業領域上に投影させることを含む。
【発明の効果】
【0007】
本開示の一実施形態によれば、遠隔地にいる相手方と作業を共有する際の相手方とユーザ自身との一体感を増大させる技術を改善することが可能となる。
【図面の簡単な説明】
【0008】
【
図1】遠隔作業連携補助システムの概略構成を示す図である。
【
図2】端末装置の動作を示すフローチャートである。
【発明を実施するための形態】
【0009】
図1を参照して本実施形態に係る遠隔作業連携補助システム1の概要について説明する。遠隔作業連携補助システム1は、ネットワーク20を介して互いに通信可能に接続される、少なくとも一対の端末装置10(以下、それぞれの動作に言及するときは端末装置10A、10Bという)を有する。
【0010】
ネットワーク20は、インターネット、少なくとも1つのWAN(Wide Area Network)、少なくとも1つのMAN(Metropolitan Area Network)、又はこれらの組み合わせを含む。ネットワーク20は、少なくとも1つの無線ネットワーク、少なくとも1つの光ネットワーク、又はこれらの組み合わせを含んでもよい。無線ネットワークは、例えば、アドホックネットワーク、セルラーネットワーク、無線LAN(Local Area Network)、衛星通信ネットワーク、又は地上マイクロ波ネットワークである。
【0011】
端末装置10Aと端末装置10Bとはそれぞれ、制御部11と撮像部14と投影部15とを有する。制御部11は、撮像部14により作業領域におけるユーザの手作業を撮像して得られる、当該作業領域の第1の位置におけるユーザの手の画像を含む第1の画像と、他のユーザによる他の作業領域における手作業を当該他のユーザが使用する他の端末装置10Bにより撮像して得られる、当該他の領域における第1の位置とは異なる第2の位置に当該他のユーザの手の画像を含む第2の画像とに基づいて、ユーザの手の画像と、当該ユーザの手の画像以外の領域であって他のユーザの手の画像とを所定の輝度とした合成画像を、投影部15に、作業領域上に投影させる。ユーザと相手方との手作業はそれぞれ、楽器P1と楽器P2との演奏を含む。手作業はパーソナルコンピュータのキーボード、作業台、机等の上での作業であってもよい。
【0012】
本実施形態において、端末装置10と楽器とは別個に設けられるが、一体的に設けられてもよい。楽器P1と楽器P2とはそれぞれ、ユーザ及び相手方が手で操作する。作業領域は操作の対象となる任意の寸法の領域である。本実施形態に係る楽器はピアノ、オルガン等の鍵盤楽器であり、操作部は鍵盤である。楽器は、バイオリン、ギター、琴等の弦楽器、ドラム等の打楽器等であってもよい。弦楽器の場合、操作部は指板、弦等を含み、打楽器の場合、操作部は打面等を含む。第1の位置及び第2の位置とは具体的には、共有すると決めた作業領域全体の中での相対的な楽器上の位置である。
【0013】
端末装置10Aは、端末装置10Bから第2の画像を受信して取得する。端末装置10Aは、第1の画像と第2の画像とに基づいて合成画像を生成し、ユーザが弾いている楽器上に投影する。相手方の端末装置10Bにおいても同様に投影が行われる。合成画像では、ユーザの手の画像と、それ以外の領域であって相手方の手の画像以外の領域とがマスキングされるような輝度に設定される。かかる輝度は、例えば、0であるが、投影された画像の色が視認できない程度に低い任意の輝度であってもよい。画像中のこの輝度の領域は、画像が投影された場合に例えば黒色に相当する。輝度は理想的には0であるが、投影された場合に黒色が反映される色に相当する色であれば0に近い数値でもよい。
【0014】
端末装置10Aにおいて、合成画像のマスキングされた領域は楽器に投影されてもユーザに視認されず、該領域より高い輝度である相手方の手の領域のみが、映像として視認される。ユーザの手が置かれた第1の位置と、相手方の手が置かれた第2の位置とが重なる領域については合成画像でマスキングされて楽器上に投影される。これにより、端末装置10Aで撮像された、ユーザの手の領域の一部の上に相手方の手の映像が映りこんだ状態、すなわちユーザの手の一部の輝度が明るい状態の画像が相手方の端末装置10Bに送信されてしまう事態を避けることができる。よって端末装置10Bの投影部15によって該画像がそのまま相手方の楽器上に投影されたときに、ユーザの手を示す領域が明るくなりすぎた、いわゆる白飛びが発生してしまうことを防ぐことが可能となる。よって、遠隔地にいる相手方と作業を共有する際の相手方とユーザ自身との一体感を増大させる技術を改善することが可能となる。
【0015】
次に、端末装置10の構成について詳細に説明する。
図1に示すように、端末装置10は、制御部11と、記憶部12と、通信部13と、撮像部14と、投影部15とを備える。
【0016】
制御部11には、少なくとも1つのプロセッサ、少なくとも1つの専用回路又はこれらの組み合わせが含まれる。プロセッサはCPU(Central Processing Unit)若しくはGPU(Graphics Processing Unit)等の汎用プロセッサ又は特定の処理に特化した専用プロセッサである。専用回路は例えば、FPGA(Field-Programmable Gate Array)又はASIC(Application Specific Integrated Circuit)である。制御部11は端末装置10の各部を制御しながら、端末装置10の動作に関わる処理を実行する。
【0017】
記憶部12には、少なくとも1つの半導体メモリ、少なくとも1つの磁気メモリ、少なくとも1つの光メモリ又はこれらのうち少なくとも2種類の組み合わせが含まれる。半導体メモリは例えばRAM(Random Access Memory)又はROM(Read Only Memory)である。RAMは例えばSRAM(Static Random Access Memory)又はDRAM(Dynamic Random Access Memory)である。の略語である。ROMは例えばEEPROM(Electrically Erasable Programmable Read Only Memory)である。記憶部12は例えば主記憶装置、補助記憶装置又はキャッシュメモリとして機能する。記憶部12には端末装置10の動作に用いられる任意の情報、制御・処理プログラム等と、端末装置10の動作によって得られた情報とが記憶される。
【0018】
通信部13には、少なくとも1つの通信用インタフェースが含まれる。通信用インタフェースは、例えば、LTE(Long Term Evolution)、4G(4th Generation)規格、若しくは5G(5th Generation)規格等の移動通信規格に対応したインタフェース、Bluetooth(登録商標)等の近距離無線通信に対応したインタフェース、又はLANインタフェースである。通信部13は、端末装置10の動作に用いられる情報を受信し、また端末装置10の動作によって得られる情報を送信する。
【0019】
撮像部14は、楽器を撮像可能な1つ以上のカメラを含む。撮像部14は、レンズおよび撮像素子を含んでよい。撮像素子は、例えば、CCDイメージセンサ(Charge-Coupled Device Image Sensor)、CMOSイメージセンサ(Complementary MOS Image Sensor)等である。撮像部14は所定のフレームレートで被写体を撮像し、生成した画像データを制御部11に送る。撮像部14は、楽器の鍵盤の面に対し垂直方向に所定距離離れた位置に配置されてよい。本実施形態において、撮像部14は楽器の鉛直方向上方に配置される。
【0020】
投影部15は、楽器の鍵盤上に画像を投影可能な1つ以上の投影レンズを含む。投影部15は、光学素子及び光源を含んでよい。光学素子は例えばDMD(Digital Mirror Device)等である。投影部15は、楽器の鍵盤に対し垂直方向に所定距離離れた位置に配置されてよい。本実施形態において、投影部15は楽器の鉛直方向上方に配置される。
【0021】
端末装置10はさらに、撮像部14が撮影する被写体までの距離及び被写体の水平方向の位置を測定可能な、1つ以上の測距センサを含んでもよい。測距センサは撮像部14が備える構成であってもよい。測距センサは例えばLiDAR(Light Detection and Ranging)等である。測距センサが測定した値を示す情報は撮像部14によって生成された画像に含まれてよい。測距センサにより、制御部11が画像中のユーザの手を示す領域をより精度よく検出することが可能となる。
【0022】
端末装置10の機能は、本実施形態に係るプログラムを制御部11に相当するプロセッサで実行することにより実現される。プログラムはコンピュータを端末装置10として機能させるためのプログラムである。
【0023】
プログラムは、非一時的なコンピュータ読取り可能な媒体に記憶しておくことができる。非一時的なコンピュータ読取り可能な媒体は、例えば、磁気記録装置、光ディスク、光磁気記録媒体、又はROMである。プログラムの流通は、例えば、プログラムを記憶したDVD(Digital Versatile Disc)又はCD-ROM(Compact Disc Read Only Memory)などの可搬型媒体を販売、譲渡、又は貸与することによって行う。プログラムをサーバのストレージに格納しておき、サーバから他のコンピュータにプログラムを転送することにより、プログラムを流通させてもよい。プログラムをプログラムプロダクトとして提供してもよい。
【0024】
コンピュータは、例えば、可搬型媒体に記憶されたプログラム又はサーバから転送されたプログラムを、一旦、主記憶装置に格納する。そして、コンピュータは、主記憶装置に格納されたプログラムをプロセッサで読み取り、読み取ったプログラムに従った処理をプロセッサで実行する。コンピュータは、可搬型媒体から直接プログラムを読み取り、プログラムに従った処理を実行してもよい。コンピュータは、コンピュータにサーバからプログラムが転送される度に、逐次、受け取ったプログラムに従った処理を実行してもよい。サーバからコンピュータへのプログラムの転送は行わず、実行指示及び結果取得のみによって機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって処理を実行してもよい。プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるものが含まれる。例えば、コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータは、「プログラムに準ずるもの」に該当する。
【0025】
図2は、本実施形態に係る端末装置10Aの動作手順例を示すフローチャート図である。
図2の手順は端末装置10の制御部11が実行する処理に係る手順である。
【0026】
ステップS1において、制御部11は撮像部14を制御して、楽器P1上を撮影させる。撮像部14は所定のフレームレートで撮影し、逐次生成した画像を制御部11に送る。
【0027】
図3には第1の画像Aが示される。第1の画像Aは、楽器P1のユーザの作業領域としての鍵盤上の第1の位置におけるユーザの手を示す画像H1を含む。制御部11はまた、第1の画像Aを相手方の端末装置10に送信する。
【0028】
ステップS2において、制御部11は、相手方の端末装置10Bから、端末装置10Bにより、相手方が使用する楽器P2上を撮像した画像を受信し、第2の画像として取得する。
【0029】
図3には第2の画像Bが示される。第2の画像Bは、楽器P2の第2の位置における相手方の手の画像H2を含む。
【0030】
制御部11は、ステップS1とステップS2との処理を同時並行して行ってよい。
【0031】
ステップS3において、制御部11は、ステップS1で取得した第1の画像において、ユーザの手の画像H1を所定の輝度に設定する。所定の輝度とは、画像の各ピクセルの輝度が所定値未満であることであってもいいし、各ピクセルの輝度の平均値が所定値未満であることであってもよい。所定値は予め設定されて記憶部12に格納されていてよい。本例において、所定の輝度とは第1の画像の画像H1の各ピクセルの輝度が0であることをいう。本例では制御部11は、該画像H1以外を画像が生成されない領域(以下、透明領域という)として加工する。
【0032】
ユーザの手の画像H1の検出には任意の手法が採用されてよい。例えば端末装置10が測距センサを備える場合、制御部11は、該測距センサが測定した距離を示す情報に基づいてユーザの手の画像H1を検出しもてよい。制御部11は、撮像部14が取得した画像からユーザの手の画像H1を検出することができる。この場合には、例えば骨格推定技術を用いて手の画像H1を検出する。
【0033】
図3には、第1の画像Aを制御部11が加工した第1の画像Cが示される。加工された第1の画像Cにおいて、ユーザの手の画像H1は輝度が0であり、その他の領域は画像が生成されていない。
【0034】
ステップS4において、制御部11は、ステップS2で取得した第2の画像において、相手方の手の画像H2及び画像H2以外の範囲をそれぞれ所定の輝度に設定して加工する。本例において、相手方の手の画像H2の輝度は画像H2以外の範囲の輝度よりも高い値である。本例では相手方の手の画像H2以外の範囲の輝度は、輝度が0である。相手方の手の画像H2及び相手方の手の画像H2以外の範囲のそれぞれ輝度の値は予め設定されて記憶部12に格納されていてよい。
【0035】
図4に、第2の画像Bを制御部11が加工した第2の画像Dが示される。加工された第2の画像Dにおいて、相手方の手の画像H2以外の範囲は輝度が0である。
【0036】
ステップS5において、制御部11は、加工した第1の画像と第2の画像とを重ね合わせて合成画像を生成する。
図4には、加工された第1の画像Cと第2の画像Dとを合成した合成画像Eが示される。合成画像Eにおいては、ユーザの手の第1の位置と、相手方の手の第2の位置とが重なった領域は、ユーザの手の画像H1により輝度が0である。合成画像Eは、加工された第2の画像Dの上に加工された第1の画像Cを重ねることで生成される。
【0037】
合成画像の生成の手法はこれに限られず、例えばステップS3で、制御部11は、ユーザの手の画像H1をクロップ処理して所定の値未満の輝度に設定し、加工した第2の画像Dに重ねることで合成画像を生成してもよい。
【0038】
ステップS6において、制御部11は、投影部15に、ステップS5で生成した合成画像を楽器上に投影させる。その後、制御部11の動作はステップS1に戻る。
図4には、合成画像Eがユーザの楽器P1上に投影されている状況Fが示される。状況Fにおいて、斜線は実体としてのユーザの手を示す。ユーザの肉眼から見て、合成画像E中の黒塗りで示す、輝度が低い領域は、楽器上又はユーザの手の上に投影されても映像が映りこまずに、相手方の手の画像H2のみがユーザの楽器P1上の作業領域で見える。
【0039】
ステップS7において、制御部11は、ユーザが手作業を終了したかどうかを判断する。本例では制御部11は、楽器の演奏を終了したかどうかを判断する。楽器の演奏を終了したと判断した場合、端末装置10の動作は終了する。終了していないと判断した場合、端末装置10の動作はステップS1に戻る。
【0040】
作業を終了したかどうかの判断には任意の手法が採用されてよい。制御部11は例えば、任意の画像解析技術を用いて、第1画像からユーザの手が検出されないことを判断した場合に、処理を終了してよい。
【0041】
以下の実施形態に関し更に以下の付記を開示する。
【0042】
(付記1)
制御部と撮像部と投影部とを有する端末装置であって、
前記制御部は、前記撮像部により作業領域におけるユーザの手作業を撮像して得られる、当該作業領域の第1の位置における前記ユーザの手の画像を含む第1の画像と、他のユーザによる他の作業領域における手作業を当該他のユーザが使用する他の端末装置により撮像して得られる、当該他の領域における前記第1の位置とは異なる第2の位置に当該他のユーザの手の画像を含む第2の画像とに基づいて、前記ユーザの手の画像と、当該ユーザの手の画像以外の領域であって前記他のユーザの手の画像とを所定の輝度とした合成画像を、前記投影部に、前記作業領域上に投影させる、
端末装置。
【0043】
上述において、実施形態を諸図面及び実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形及び修正を行うことが容易であることに注意されたい。従って、これらの変形及び修正は本開示の範囲に含まれることに留意されたい。例えば、各手段、各ステップ等に含まれる機能等は論理的に矛盾しないように再配置可能であり、複数の手段、ステップ等を1つに組み合わせたり、或いは分割したりすることが可能である。
【0044】
制御部11は、ユーザの手が置かれた第1の位置と、相手方の手が置かれた第2の位置とが重なる領域について、例えばそれぞれの画像のオプティカルフローにより動的予測を行って重なるかどうかについて判定してもよい。このように事前に判定をすることで、ユーザが不快感なく合成画像を視認することができる。また、制御部11の処理負荷も減らすことができる。
【符号の説明】
【0045】
1 遠隔作業連携補助システム
10 端末装置
11 制御部
12 記憶部
13 通信部
14 撮像部
15 投影部
20 ネットワーク