IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 沖電気工業株式会社の特許一覧

特開2024-7951遠隔作業支援システム、遠隔作業支援方法およびプログラム
<>
  • 特開-遠隔作業支援システム、遠隔作業支援方法およびプログラム 図1
  • 特開-遠隔作業支援システム、遠隔作業支援方法およびプログラム 図2
  • 特開-遠隔作業支援システム、遠隔作業支援方法およびプログラム 図3
  • 特開-遠隔作業支援システム、遠隔作業支援方法およびプログラム 図4
  • 特開-遠隔作業支援システム、遠隔作業支援方法およびプログラム 図5
  • 特開-遠隔作業支援システム、遠隔作業支援方法およびプログラム 図6
  • 特開-遠隔作業支援システム、遠隔作業支援方法およびプログラム 図7
  • 特開-遠隔作業支援システム、遠隔作業支援方法およびプログラム 図8
  • 特開-遠隔作業支援システム、遠隔作業支援方法およびプログラム 図9
  • 特開-遠隔作業支援システム、遠隔作業支援方法およびプログラム 図10
  • 特開-遠隔作業支援システム、遠隔作業支援方法およびプログラム 図11
  • 特開-遠隔作業支援システム、遠隔作業支援方法およびプログラム 図12
  • 特開-遠隔作業支援システム、遠隔作業支援方法およびプログラム 図13
  • 特開-遠隔作業支援システム、遠隔作業支援方法およびプログラム 図14
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024007951
(43)【公開日】2024-01-19
(54)【発明の名称】遠隔作業支援システム、遠隔作業支援方法およびプログラム
(51)【国際特許分類】
   H04N 21/2662 20110101AFI20240112BHJP
   G06T 19/00 20110101ALI20240112BHJP
   H04N 21/24 20110101ALI20240112BHJP
【FI】
H04N21/2662
G06T19/00 600
H04N21/24
【審査請求】未請求
【請求項の数】15
【出願形態】OL
(21)【出願番号】P 2022109404
(22)【出願日】2022-07-07
(71)【出願人】
【識別番号】000000295
【氏名又は名称】沖電気工業株式会社
(74)【代理人】
【識別番号】100140958
【弁理士】
【氏名又は名称】伊藤 学
(74)【代理人】
【識別番号】100137888
【弁理士】
【氏名又は名称】大山 夏子
(74)【代理人】
【識別番号】100190942
【弁理士】
【氏名又は名称】風間 竜司
(72)【発明者】
【氏名】畠中 貴明
【テーマコード(参考)】
5B050
5C164
【Fターム(参考)】
5B050CA07
5B050CA08
5B050DA04
5B050EA07
5B050EA19
5B050FA02
5C164FA07
5C164GA03
5C164SA32S
5C164SB21S
5C164SB41P
5C164SC03P
5C164YA12
(57)【要約】
【課題】作業空間を撮像して得られた撮像画像がネットワークに与える通信負荷を軽減しつつ、撮像画像における重要領域の品質の低下を抑制することを可能とする。
【解決手段】作業に係る部位を通過する三次元座標に対応する、作業者側画面における二次元座標を算出する算出部と、二次元座標に応じた作業者側画面における領域を重要領域として推定して重要領域を示す情報を得る推定部と、重要領域を示す情報に基づいて、作業空間が撮像された撮像画像に対する符号化を行って符号化後の撮像画像を得る符号化処理部と、符号化後の撮像画像の送信を制御する送信制御部と、符号化後の撮像画像を取得する取得部と、符号化後の撮像画像を復号して復号後の撮像画像を得る復号部と、復号後の撮像画像を、作業者に指示を出す指示者によって視認される指示者側の画面に表示させる指示者側表示制御部と、を備える、遠隔作業支援システムが提供される。
【選択図】図1
【特許請求の範囲】
【請求項1】
作業に係る物体からセンサによって得られたセンサデータに基づいて、前記作業に係る物体が通過する複数の三次元座標を検知する検知部と、
前記複数の三次元座標に基づいて、前記作業に係る物体における前記作業に係る部位を特定する特定部と、
前記作業に係る部位を通過する三次元座標に対応する、作業者によって視認される作業者側の画面における二次元座標を算出する算出部と、
前記二次元座標に応じた前記作業者側の画面における領域を重要領域として推定して前記重要領域を示す情報を得る推定部と、
前記重要領域を示す情報に基づいて、前記作業が行われる作業空間が撮像された撮像画像に対する符号化を行って符号化後の撮像画像を得る符号化処理部と、
前記符号化後の撮像画像の送信を制御する送信制御部と、
前記符号化後の撮像画像を取得する取得部と、
前記符号化後の撮像画像を復号して復号後の撮像画像を得る復号部と、
前記復号後の撮像画像を、前記作業者に指示を出す指示者によって視認される指示者側の画面に表示させる指示者側表示制御部と、
を備える、遠隔作業支援システム。
【請求項2】
前記符号化処理部は、前記作業空間が撮像された撮像画像のうち、前記重要領域以外の領域である非重要領域に対する符号化による圧縮率を、前記重要領域に対する符号化による圧縮率よりも高くする、
請求項1に記載の遠隔作業支援システム。
【請求項3】
前記推定部は、前記作業に係る部位が通過する三次元座標に対応する、前記作業者側の画面における二次元座標が示す位置を中央位置とした前記作業者側の画面における領域を前記重要領域として推定する、
請求項1に記載の遠隔作業支援システム。
【請求項4】
前記算出部は、前記作業に係る部位が通過する複数の三次元座標に基づいて、前記作業に係る部位の三次元方向に対応する前記作業者側の画面における二次元方向を算出し、
前記推定部は、前記二次元座標および前記二次元方向に応じた前記作業者側の画面における領域を前記重要領域として推定する、
請求項1に記載の遠隔作業支援システム。
【請求項5】
前記特定部は、前記複数の三次元座標に基づいて、前記作業に係る物体を構成する複数の部位それぞれの曲がり度合いを推定し、前記複数の部位それぞれの曲がり度合いに基づいて、前記作業に係る部位を特定する、
請求項1に記載の遠隔作業支援システム。
【請求項6】
前記特定部は、前記複数の部位のうち前記曲がり度合いが閾値以下である部位を、前記作業に係る部位として特定する、
請求項5に記載の遠隔作業支援システム。
【請求項7】
前記特定部は、前記複数の三次元座標と、所定の機械学習アルゴリズムによる学習によって得られた学習済みのモデルとに基づいて、前記作業に係る部位を特定する、
請求項1に記載の遠隔作業支援システム。
【請求項8】
前記遠隔作業支援システムは、
前記作業者によって用いられる作業者側システムと、前記指示者によって用いられる指示者側システムと、を備え、
前記作業者側システムは、
前記符号化処理部と、前記送信制御部と、を備え、
前記指示者側システムは、
前記取得部と、前記復号部と、前記指示者側表示制御部と、を備える、
請求項1に記載の遠隔作業支援システム。
【請求項9】
前記指示者側表示制御部は、前記復号後の撮像画像に重畳された前記作業に係る物体に対応する画像を前記指示者側の画面に表示させる、
請求項1に記載の遠隔作業支援システム。
【請求項10】
前記遠隔作業支援システムは、
前記作業空間が撮像された撮像画像に重畳された前記作業に係る物体に対応する画像を前記作業者側の画面に表示させる作業者側表示制御部を備える、
請求項1に記載の遠隔作業支援システム。
【請求項11】
前記作業に係る物体は、前記作業者または前記指示者の手指であり、
前記作業に係る部位は、前記手指を構成する1または複数の指である、
請求項1~10のいずれか一項に記載の遠隔作業支援システム。
【請求項12】
前記作業に係る物体は、前記作業者によって用いられる第1の物体を含む、
請求項1~10のいずれか一項に記載の遠隔作業支援システム。
【請求項13】
前記作業に係る物体は、前記指示者によって用いられる第2の物体を含む、
請求項1~10のいずれか一項に記載の遠隔作業支援システム。
【請求項14】
作業に係る物体からセンサによって得られたセンサデータに基づいて、前記作業に係る物体が通過する複数の三次元座標を検知することと、
前記複数の三次元座標に基づいて、前記作業に係る物体における前記作業に係る部位を特定することと、
前記作業に係る部位を通過する三次元座標に対応する、作業者によって視認される作業者側の画面における二次元座標を算出することと、
前記二次元座標に応じた前記作業者側の画面における領域を重要領域として推定して前記重要領域を示す情報を得ることと、
前記重要領域を示す情報に基づいて、前記作業が行われる作業空間が撮像された撮像画像に対する符号化を行って符号化後の撮像画像を得ることと、
前記符号化後の撮像画像の送信を制御することと、
前記符号化後の撮像画像を取得することと、
前記符号化後の撮像画像を復号して復号後の撮像画像を得ることと、
前記復号後の撮像画像を、前記作業者に指示を出す指示者によって視認される指示者側の画面に表示させることと、
を備える、遠隔作業支援方法。
【請求項15】
コンピュータを、
作業に係る物体からセンサによって得られたセンサデータに基づいて、前記作業に係る物体が通過する複数の三次元座標を検知する検知部と、
前記複数の三次元座標に基づいて、前記作業に係る物体における前記作業に係る部位を特定する特定部と、
前記作業に係る部位を通過する三次元座標に対応する、作業者によって視認される作業者側の画面における二次元座標を算出する算出部と、
前記二次元座標に応じた前記作業者側の画面における領域を重要領域として推定して前記重要領域を示す情報を得る推定部と、
前記重要領域を示す情報に基づいて、前記作業が行われる作業空間が撮像された撮像画像に対する符号化を行って符号化後の撮像画像を得る符号化処理部と、
前記符号化後の撮像画像の送信を制御する送信制御部と、
前記符号化後の撮像画像を取得する取得部と、
前記符号化後の撮像画像を復号して復号後の撮像画像を得る復号部と、
前記復号後の撮像画像を、前記作業者に指示を出す指示者によって視認される指示者側の画面に表示させる指示者側表示制御部と、
を備える遠隔作業支援システムとして機能させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、遠隔作業支援システム、遠隔作業支援方法およびプログラムに関する。
【背景技術】
【0002】
近年、熟練技術者の不足から、熟練技術者が必ずしも作業現場に配置されるとは限らず、作業現場とは異なる場所に存在する熟練技術者が指示者となり、熟練技術者が遠隔から作業現場で作業を行う作業者に対して指示を行う遠隔作業支援の重要性が高まっている。遠隔作業支援に係る技術の例として、各種の遠隔作業支援システムが知られている(例えば、特許文献1参照)。
【0003】
例えば、作業者端末が、作業者によって作業が行われる空間(以下、「作業空間」とも言う。)が撮像された映像と作業者から収音された音声とを指示者端末に送信し、指示者端末が、映像および音声を指示者に提示し、指示者が、映像および音声を視聴しながら作業者に対して指示を出す遠隔作業支援システムが知られている(例えば、非特許文献1参照)。
【0004】
より詳細に、かかる遠隔作業支援システムにおいて、作業者側システムは、作業空間を撮像して得られた撮像画像に指示者の手指形状を示す手指映像を重畳し、手指映像が重畳された撮像画像を表示する。さらに、作業者側システムは、撮像画像を指示者側システムに送信し、指示者側システムは、作業者側システムから受信した撮像画像に手指映像を重畳し、手指映像が重畳された撮像画像を表示する。
【0005】
これによって、作業者に対してどのように指示者の手指形状が伝わっているかが指示者によって把握され得る。なお、指示者の手指形状を検知する技術として各種技術が知られている(例えば、非特許文献2参照)。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特許第6568130号公報
【非特許文献】
【0007】
【非特許文献1】市原 俊介、鈴木 雄介、“ハンドジェスチャと描線機能を用いた遠隔作業支援システムの現場評価実験”、[online]、2017年3月2日、情報処理学会インタラクション2017、[令和4年6月21日検索]、インターネット<URL:http://www.interaction-ipsj.org/proceedings/2017/data/pdf/1-502-13.pdf>
【非特許文献2】Ultraleap社ホームページ、[online]、[令和4年6月21日検索]、インターネット<URL:https://www.ultraleap.com>
【発明の概要】
【発明が解決しようとする課題】
【0008】
一般に、作業空間を撮像して得られた撮像画像が高品質になるほど、撮像画像の送信によってネットワークに掛かる通信負荷が大きくなってしまう。一方、撮像画像が低品質になるほど、撮像画像の全体の視認性が低くなってしまう。
【0009】
そこで、作業空間を撮像して得られた撮像画像がネットワークに与える通信負荷を軽減しつつ、撮像画像における重要領域の品質の低下を抑制することを可能とする技術が提供されることが望まれる。
【課題を解決するための手段】
【0010】
上記問題を解決するために、本発明のある観点によれば、作業に係る物体からセンサによって得られたセンサデータに基づいて、前記作業に係る物体が通過する複数の三次元座標を検知する検知部と、前記複数の三次元座標に基づいて、前記作業に係る物体における前記作業に係る部位を特定する特定部と、前記作業に係る部位を通過する三次元座標に対応する、作業者によって視認される作業者側の画面における二次元座標を算出する算出部と、前記二次元座標に応じた前記作業者側の画面における領域を重要領域として推定して前記重要領域を示す情報を得る推定部と、前記重要領域を示す情報に基づいて、前記作業が行われる作業空間が撮像された撮像画像に対する符号化を行って符号化後の撮像画像を得る符号化処理部と、前記符号化後の撮像画像の送信を制御する送信制御部と、前記符号化後の撮像画像を取得する取得部と、前記符号化後の撮像画像を復号して復号後の撮像画像を得る復号部と、前記復号後の撮像画像を、前記作業者に指示を出す指示者によって視認される指示者側の画面に表示させる指示者側表示制御部と、を備える、遠隔作業支援システムが提供される。
【0011】
前記符号化処理部は、前記作業空間が撮像された撮像画像のうち、前記重要領域以外の領域である非重要領域に対する符号化による圧縮率を、前記重要領域に対する符号化による圧縮率よりも高くしてもよい。
【0012】
前記推定部は、前記作業に係る部位が通過する三次元座標に対応する、前記作業者側の画面における二次元座標が示す位置を中央位置とした前記作業者側の画面における領域を前記重要領域として推定してもよい。
【0013】
前記算出部は、前記作業に係る部位が通過する複数の三次元座標に基づいて、前記作業に係る部位の三次元方向に対応する前記作業者側の画面における二次元方向を算出し、前記推定部は、前記二次元座標および前記二次元方向に応じた前記作業者側の画面における領域を前記重要領域として推定してもよい。
【0014】
前記特定部は、前記複数の三次元座標に基づいて、前記作業に係る物体を構成する複数の部位それぞれの曲がり度合いを推定し、前記複数の部位それぞれの曲がり度合いに基づいて、前記作業に係る部位を特定してもよい。
【0015】
前記特定部は、前記複数の部位のうち前記曲がり度合いが閾値以下である部位を、前記作業に係る部位として特定してもよい。
【0016】
前記特定部は、前記複数の三次元座標と、所定の機械学習アルゴリズムによる学習によって得られた学習済みのモデルとに基づいて、前記作業に係る部位を特定してもよい。
【0017】
前記遠隔作業支援システムは、前記作業者によって用いられる作業者側システムと、前記指示者によって用いられる指示者側システムと、を備え、前記作業者側システムは、前記符号化処理部と、前記送信制御部と、を備え、前記指示者側システムは、前記取得部と、前記復号部と、前記指示者側表示制御部と、を備えてもよい。
【0018】
前記指示者側表示制御部は、前記復号後の撮像画像に重畳された前記作業に係る物体に対応する画像を前記指示者側の画面に表示させてもよい。
【0019】
前記遠隔作業支援システムは、前記作業空間が撮像された撮像画像に重畳された前記作業に係る物体に対応する画像を前記作業者側の画面に表示させる作業者側表示制御部を備えてもよい。
【0020】
前記作業に係る物体は、前記作業者または前記指示者の手指であり、前記作業に係る部位は、前記手指を構成する1または複数の指であってもよい。
【0021】
前記作業に係る物体は、前記作業者によって用いられる第1の物体を含んでもよい。
【0022】
前記作業に係る物体は、前記指示者によって用いられる第2の物体を含んでもよい。
【0023】
また、上記課題を解決するために本発明の別の観点によれば、作業に係る物体からセンサによって得られたセンサデータに基づいて、前記作業に係る物体が通過する複数の三次元座標を検知することと、前記複数の三次元座標に基づいて、前記作業に係る物体における前記作業に係る部位を特定することと、前記作業に係る部位を通過する三次元座標に対応する、作業者によって視認される作業者側の画面における二次元座標を算出することと、前記二次元座標に応じた前記作業者側の画面における領域を重要領域として推定して前記重要領域を示す情報を得ることと、前記重要領域を示す情報に基づいて、前記作業が行われる作業空間が撮像された撮像画像に対する符号化を行って符号化後の撮像画像を得ることと、前記符号化後の撮像画像の送信を制御することと、前記符号化後の撮像画像を取得することと、前記符号化後の撮像画像を復号して復号後の撮像画像を得ることと、前記復号後の撮像画像を、前記作業者に指示を出す指示者によって視認される指示者側の画面に表示させることと、を備える、遠隔作業支援方法が提供される。
【0024】
また、上記課題を解決するために本発明の別の観点によれば、コンピュータを、作業に係る物体からセンサによって得られたセンサデータに基づいて、前記作業に係る物体が通過する複数の三次元座標を検知する検知部と、前記複数の三次元座標に基づいて、前記作業に係る物体における前記作業に係る部位を特定する特定部と、前記作業に係る部位を通過する三次元座標に対応する、作業者によって視認される作業者側の画面における二次元座標を算出する算出部と、前記二次元座標に応じた前記作業者側の画面における領域を重要領域として推定して前記重要領域を示す情報を得る推定部と、前記重要領域を示す情報に基づいて、前記作業が行われる作業空間が撮像された撮像画像に対する符号化を行って符号化後の撮像画像を得る符号化処理部と、前記符号化後の撮像画像の送信を制御する送信制御部と、前記符号化後の撮像画像を取得する取得部と、前記符号化後の撮像画像を復号して復号後の撮像画像を得る復号部と、前記復号後の撮像画像を、前記作業者に指示を出す指示者によって視認される指示者側の画面に表示させる指示者側表示制御部と、を備える遠隔作業支援システムとして機能させるプログラムが提供される。
【発明の効果】
【0025】
以上説明したように本発明によれば、作業空間を撮像して得られた撮像画像がネットワークに与える通信負荷を軽減しつつ、撮像画像における重要領域の品質の低下を抑制することを可能とする技術が提供される。
【図面の簡単な説明】
【0026】
図1】本発明の実施形態に係る遠隔作業支援システムの機能構成例を示す図である。
図2】作業者側装置14の機能構成例を示すブロック図である。
図3】指示者側装置24の機能構成例を示すブロック図である。
図4】指示が行われる前における指示者側表示部26による復号後の作業撮像映像の表示例を示す図である。
図5】手指検知部241によって検知される手指の三次元骨格情報の例を示す図である。
図6】人差し指の第一関節の曲がり度合いを算出する手法の例について説明するための図である。
図7】作業撮像映像に重畳された手指映像の作業者側表示部16による表示例を示す図である。
図8】補正前領域の推定について説明するための図である。
図9】補正後領域の推定について説明するための図である。
図10】補正前領域R1と補正後領域R2とを含んだ重要領域の推定について説明するための図である。
図11】復号後の作業撮像映像M12に重畳された手指映像の指示者側表示部26による表示例を示す図である。
図12】作業者側システム10の動作例を示すフローチャートである。
図13】指示者側システム20の動作例を示すフローチャートである。
図14】本発明の実施形態に係る指示者側システム10の例としての情報処理装置900のハードウェア構成を示す図である。
【発明を実施するための形態】
【0027】
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0028】
(1.実施形態の詳細)
本発明の実施形態の詳細について説明する。
【0029】
(1-1.遠隔作業支援システムの構成)
まず、本発明の実施形態に係る遠隔作業支援システムの構成例について説明する。図1は、本発明の実施形態に係る遠隔作業支援システムの機能構成例を示す図である。図1に示されるように、遠隔作業支援システム1は、作業者側システム10と、指示者側システム20と、ネットワーク30とを有する。
【0030】
作業者側システム10は、遠隔作業支援システム1のうち、作業者によって用いられるシステムである。作業者は、作業者に指示を出す指示者から離れた場所(すなわち、遠隔地)にて作業を行う。一方、指示者側システム20は、遠隔作業支援システム1のうち、指示者によって用いられるシステムである。作業者側システム10と指示者側システム20とは、ネットワーク30に接続されており、ネットワーク30を介して通信可能に構成されている。
【0031】
なお、遠隔作業支援においては、指示者と作業者との間において音声通話などが行われるのが一般的である。しかし、音声通話などに必要な構成は、本発明の実施形態に係る遠隔作業支援システム1の構成の説明に関与しないため、音声通話などに必要な構成の説明は省略する。
【0032】
図1に示されるように、作業者側システム10は、作業撮像部12と、作業者側装置14と、作業者側表示部16とを備える。一方、図1に示されるように、指示者側システム20は、手指撮像部22と、指示者側装置24と、指示者側表示部26とを備える。
【0033】
(作業撮像部12)
作業撮像部12は、作業者によって作業が行われる空間である作業空間を撮像することにより撮像画像(以下、「作業撮像画像」とも言う。)を得る。以下の説明では、作業撮像画像が、時系列に沿って連続的に撮像される複数のフレームからなる動画像である場合を主に想定する。動画像は、「映像」とも換言され得る。したがって、以下の説明では、作業撮像画像の例として「作業撮像映像」との文言を用いる。しかし、作業撮像画像は静止画像であってもよい。
【0034】
作業撮像部12は、作業者の視線方向と同じ方向を向くように設けられているのが望ましい。したがって、作業撮像部12は、ARディスプレイと一体化されているのが望ましい。しかし、作業撮像部12は、ARディスプレイとは別個のハードウェアとして構成されてもよい。
【0035】
(作業者側装置14)
作業者側装置14は、コンピュータによって実現される。図2を参照しながら、作業者側装置14の機能構成例について説明する。
【0036】
図2は、作業者側装置14の機能構成例を示すブロック図である。図2に示されるように、作業者側装置14は、制御部140と、通信部148と、記憶部149とを備える。以下、制御部140、通信部148および記憶部149それぞれが有する機能について説明する。
【0037】
(制御部140)
制御部140は、各種の演算処理を行う。例えば、制御部140は、CPU(Central Processing Unit)などの演算装置を含み、ROM(Read Only Memory)により記憶されているプログラムが演算装置によりRAMに展開されて実行されることにより、その機能が実現され得る。このとき、当該プログラムを記録した、コンピュータに読み取り可能な記録媒体も提供され得る。あるいは、これらのブロックは、専用のハードウェアにより構成されていてもよいし、複数のハードウェアの組み合わせにより構成されてもよい。
【0038】
演算装置による演算に必要なデータは、記憶部149によって適宜記憶される。図2に示されるように、制御部140は、判定結果取得部141と、符号化部142と、送信制御部143と、作業者側表示制御部144とを備える。判定結果取得部141、符号化部142、送信制御部143および作業者側表示制御部144それぞれが有する機能の詳細については後に説明する。
【0039】
(通信部148)
通信部148は、通信インタフェースによって構成され、ネットワーク30を介して指示者側装置24と通信を行う。
【0040】
(記憶部149)
記憶部149は、制御部140を動作させるためのプログラムおよびデータを記憶することが可能なメモリである。また、記憶部149は、制御部140の動作の過程で必要となる各種データを一時的に記憶することもできる。例えば、記憶部149は、不揮発性メモリであってよい。
【0041】
(作業者側表示部16)
作業者側表示部16は、制御部140による制御に従って作業者に対して各種情報の表示を行う機能を有する。より詳細に、作業者側表示部16は、作業者によって視認される画面(以下、「作業者側画面」とも言う。)を有し、制御部140による制御に従って作業者側画面に対して各種情報の表示を行う。
【0042】
例えば、作業者側表示部16は、液晶ディスプレイ(LCD)装置であってもよいし、OLED(Organic Light Emitting Diode)装置であってもよい。また、作業者側表示部16は、作業者の頭部に装着されるヘッドマウントディスプレイであってもよいし、設置型のディスプレイであってもよい。
【0043】
(手指撮像部22)
手指撮像部22は、指示者の手指を撮像することにより撮像画像(以下、「手指撮像画像」とも言う。)を得る。以下の説明では、手指撮像映像が、動画像(映像)である場合を主に想定する。したがって、以下の説明では、手指撮像画像の例として「手指撮像映像」との文言を用いる。しかし、手指撮像画像は静止画像であってもよい。
【0044】
なお、指示者の手指は、後にも説明するように、作業に係る物体の一例に該当し得る。また、手指は、身体のうち手首から手を構成する複数の指それぞれの先端までの領域を含んでよい。さらに、手指撮像部22は、他のセンサに置き換えられてもよい。すなわち、手指撮像映像は、センサによって得られるセンサデータの一例に該当し得る。
【0045】
(指示者側装置24)
図1に戻って説明を続ける。指示者側装置24は、コンピュータによって実現される。図3を参照しながら、指示者側装置24の機能構成例について説明する。
【0046】
図3は、指示者側装置24の機能構成例を示すブロック図である。図3に示されるように、指示者側装置24は、制御部240と、通信部248と、記憶部249とを備える。以下、制御部240、通信部248および記憶部249それぞれが有する機能について説明する。
【0047】
(制御部240)
制御部240は、各種の演算処理を行う。例えば、制御部240は、CPU(Central Processing Unit)などの演算装置を含み、ROM(Read Only Memory)により記憶されているプログラムが演算装置によりRAMに展開されて実行されることにより、その機能が実現され得る。このとき、当該プログラムを記録した、コンピュータに読み取り可能な記録媒体も提供され得る。あるいは、これらのブロックは、専用のハードウェアにより構成されていてもよいし、複数のハードウェアの組み合わせにより構成されてもよい。
【0048】
演算装置による演算に必要なデータは、記憶部249によって適宜記憶される。図3に示されるように、制御部240は、手指検知部241と、手指判定部242と、判定結果出力部243と、符号化データ取得部244と、復号部245と、指示者側表示制御部246とを備える。手指検知部241、手指判定部242、判定結果出力部243、符号化データ取得部244、復号部245および指示者側表示制御部246それぞれが有する機能の詳細については後に説明する。
【0049】
(通信部248)
通信部248は、通信インタフェースによって構成され、ネットワーク30を介して作業者側装置14と通信を行う。
【0050】
(記憶部249)
記憶部249は、制御部240を動作させるためのプログラムおよびデータを記憶することが可能なメモリである。また、記憶部249は、制御部240の動作の過程で必要となる各種データを一時的に記憶することもできる。例えば、記憶部249は、不揮発性メモリであってよい。
【0051】
(指示者側表示部26)
指示者側表示部26は、制御部240による制御に従って指示者に対して各種情報の表示を行う機能を有する。より詳細に、指示者側表示部26は、指示者によって視認される画面(以下、「指示者側画面」とも言う。)を有し、制御部240による制御に従って指示者側画面に対して各種情報の表示を行う。
【0052】
例えば、指示者側表示部26は、液晶ディスプレイ(LCD)装置であってもよいし、OLED(Organic Light Emitting Diode)装置であってもよい。また、指示者側表示部26は、指示者の頭部に装着されるヘッドマウントディスプレイであってもよいし、設置型のディスプレイであってもよい。
【0053】
(ネットワーク30)
ネットワーク30は、作業者側システム10と指示者側システム20とを接続する。そして、ネットワーク30は、作業者側システム10と指示者側システム20との間における通信路として機能し得る。
【0054】
(指示者による指示の開始前)
指示者による指示の開始前について説明する。作業者側システム10において、符号化部142は、作業撮像部12によって得られた作業撮像映像を取得する。符号化部142は、取得した作業撮像映像に対して重要領域を示す情報(換言すると、どの領域が重要領域であるかを示す情報)に基づいて符号化を行う。ここで、指示者によって指示が行われる前においては、作業撮像映像の全体が、非重要領域として初期化されている。したがって、符号化部142は、作業撮像映像の全体に対して同じ圧縮率による符号化を行ってよい。
【0055】
送信制御部143は、符号化後の作業撮像映像がネットワーク30を介して指示者側装置24に送信されるように通信部148を制御する。指示者側システム20において、符号化データ取得部244は、通信部248によって受信された符号化後の作業撮像映像を取得し、復号部245は、取得した符号化後の作業撮像映像を復号して復号後の作業撮像映像を得る。
【0056】
指示者側表示制御部246は、復号後の作業撮像映像が表示されるように指示者側表示部26を制御する。図4を参照しながら、復号後の作業撮像映像の表示例について説明する。
【0057】
図4は、指示が行われる前における指示者側表示部26による復号後の作業撮像映像の表示例を示す図である。図4を参照すると、指示者側表示部26は、指示者側画面261を有している。そして、指示者側表示制御部246は、復号後の作業撮像映像である作業撮像映像M11が指示者側画面261に表示されるように指示者側表示部26を制御している。作業撮像映像M11には、作業空間が写っており、作業空間には作業の対象となる作業対象物61が存在している。
【0058】
ここでは、作業対象物61がプリンタであり、作業者が作業対象物61を操作すること(例えば、プリンタのボタンを押下する操作を行うことなど)によって紙への印刷を作業対象物61に実行させる作業を行おうとしており、指示者が作業対象物61に対する操作を指示しようとしている場合を想定する。しかし、作業対象物61はプリンタに限定されない。さらに、作業者によって行われる作業も作業対象物61に対する操作に限定されない。
【0059】
指示者は、作業撮像映像M11を視認することによって作業空間の状況を把握することが可能であり、作業空間の状況に応じた指示を検討することが可能である。
【0060】
(指示者による指示の開始後)
続いて、指示者による指示の開始後について説明する。図4を参照すると、指示者によって指示が行われる空間(以下、「指示空間」とも言う。)において、指示者が、手指U1の形状を作業対象物61に対する操作を行うジェスチャの形状にすることによって指示を開始していることが把握される。
【0061】
手指撮像部22による撮像範囲内に指示者の手指U1が入ると、手指撮像部22によって、指示者の手指U1が撮像されることにより手指撮像映像が得られる。
【0062】
(手指検知部241)
手指検知部241は、手指撮像部22によって得られた手指撮像映像を取得する。手指検知部241は、手指撮像映像に基づいて、手指U1が通過する複数の三次元座標を検知する検知部の例として機能する。手指U1が通過する複数の三次元座標は、手指U1の骨格の各位置を示す三次元座標であり得る。以下では、手指U1が通過する複数の三次元座標を「手指の三次元骨格情報」とも言う。手指検知部241は、手指の三次元骨格情報と現在の時刻を示すタイムスタンプとを対応付けて記憶部249に記憶させる。
【0063】
手指の三次元骨格情報は、どのようにして検知されてもよい。例えば、手指の三次元骨格情報は、Ultraleap社によって開発されたLeap Motion(登録商標)などを用いて検知されてもよい。Leap Motion(登録商標)は、複数のLED(Light Emitting Diode)によって手に照射された赤外線の赤外線ステレオカメラによる検出結果に基づいて、手の動きをトラッキングする技術である。
【0064】
ここで、図5を参照しながら、手指の三次元骨格情報について説明する。
【0065】
図5は、手指検知部241によって検知される手指の三次元骨格情報の例を示す図である。図5を参照すると、手指撮像部22によって得られた手指撮像映像内に、指示者の指示者の右手Rhが存在している。図5に示されたように、手指検知部241によって、手指撮像映像に基づいて、右手Rhの各頂点の指示空間における三次元座標が手指の三次元骨格情報の例として検知される。
【0066】
具体的に、手指検知部241によって三次元座標が検知される頂点としては、指先、指関節、掌を構成する多角形の頂点などが含まれ得る。なお、図5には、頂点の一例として、右手Rhの親指の先端P1が示されている。
【0067】
(手指判定部242)
手指判定部242は、手指検知部241によって検知された手指の三次元骨格情報に基づいて、指示者の手指U1における作業に対する指示に使用される指を特定する特定部の例として機能する。作業に対する指示に使用される指は、作業に係る部位の一例に該当し得る。
【0068】
より詳細に、手指判定部242は、記憶部249に記憶されている手指の三次元骨格情報から、現在の時刻までの経過時間が所定の時間未満である時刻を示すタイムスタンプに対応付けられた手指の三次元骨格情報を取得する。そして、手指判定部242は、取得した手指の三次元骨格情報に基づいて、指示者の手指U1における指示に使用される指を特定する。図4に示した例において、指示に使用される指は、指示者の手指U1のうち、右手の人差し指である。
【0069】
指示に使用される指を特定する手法としては、様々な手法が適用され得る。一例として、手指判定部242は、手指の三次元骨格情報に基づいて、指示者の手指U1を構成する複数の指それぞれの曲がり度合いを推定し、複数の指それぞれの曲がり度合いに基づいて、指示に使用される指を特定する。ここでは、指示者の手指U1を構成する複数の指が、親指、人差し指、中指、薬指、小指である場合を想定する。
【0070】
例えば、指示者は、作業に対する指示に使用する指を伸ばす傾向があるため、曲がり度合いが高い指ほど、作業との関連性が低い指であることが考えられる。そこで、手指判定部242は、指示者の手指U1を構成する複数の指のうち曲がり度合いが閾値以下である指を、指示に使用される指として特定してもよい。
【0071】
各指の曲がり度合いの算出には、各指の関節の曲がり度合いが用いられてよい。図6を参照しながら、人差し指の第一関節の曲がり度合いを算出する手法の例について説明する。
【0072】
なお、以下の説明においては、ベクトルAのユークリッドノルムを||A||と記載し、ベクトルAの正規化ベクトルをnormalize(A)と記載する。このとき、||normalize(A)||=1が成立し、normalize(A)×||A||=Aが成立する。また、以下の説明においては、ベクトルAとベクトルBとの内積をdot(A,B)と記載する。
【0073】
図6は、人差し指の第一関節の曲がり度合いを算出する手法の例について説明するための図である。図6を参照すると、人差し指の先端の三次元座標E、人差し指の第一関節の三次元座標J、人差し指の第二関節の三次元座標Rが示されている。手指判定部242は、下記の式(1)に示される内積ipを、人差し指の第一関節の曲がり度合いとして算出し得る。
【0074】
ip:=dot(normalize(E-J),normalize(R-J))
・・・(1)
【0075】
手指判定部242は、このようにして算出した内積ipと、あらかじめ決められた閾値thrbendとが、下記の式(2)を満たすか否かを判断する。
【0076】
ip>thrbend ・・・(2)
【0077】
例えば、閾値thrbendの値は、cos(135°)であってもよいが、他の値であってもよい。手指判定部242は、人差し指の第一関節の曲がり度合いと同様に、人差し指の第二関節の曲がり度合い、中指、薬指、小指それぞれの第一関節および第二関節の曲がり度合い、親指の第一関節の曲がり度合いを算出する。
【0078】
手指判定部242は、人差し指の第一関節および第二関節それぞれの曲がり度合いの少なくとも一方が閾値thrbendを上回るか否かを判断する。そして、手指判定部242は、人差し指の第一関節および第二関節それぞれの曲がり度合いの双方が閾値thrbend以下である場合に、人差し指を指示に使用される指として特定する。一方、手指判定部242は、人差し指の第一関節および第二関節それぞれの曲がり度合いの少なくとも一方が閾値thrbendを上回る場合に、人差し指を指示に使用される指として特定しない。
【0079】
人差し指と同様に、中指、薬指、小指それぞれについても、第一関節および第二関節それぞれの曲がり度合いの双方が閾値thrbend以下である場合に、当該指が指示に使用される指として特定され、第一関節および第二関節それぞれの曲がり度合いの少なくとも一方が閾値thrbendを上回る場合に、当該指が指示に使用される指として特定されない。
【0080】
一方、手指判定部242は、親指の第一関節の曲がり度合いが閾値thrbendを上回るか否かを判断する。そして、手指判定部242は、親指の第一関節の曲がり度合いが閾値thrbend以下である場合に、親指を指示に使用される指として特定する。一方、手指判定部242は、親指の第一関節の曲がり度合いが閾値thrbendを上回る場合に、親指を指示に使用される指として特定しない。
【0081】
(判定結果出力部243)
判定結果出力部243は、手指検知部241によって検知された手指の三次元骨格情報と、手指判定部242によって特定された指示に使用される指を示す情報とを取得する。例えば、指示に使用される指が人差し指である場合には、指示に使用される指を示す情報は、人差し指を示す情報である。そして、判定結果出力部243は、手指の三次元骨格情報と指示に使用される指を示す情報とが、通信部248によって作業者側装置14に送信されるように通信部248を制御する。
【0082】
(判定結果取得部141)
作業者側システム10において、判定結果取得部141は、通信部148によって受信された手指の三次元骨格情報と指示に使用される指を示す情報とを取得する。
【0083】
(作業者側表示制御部144)
作業者側表示制御部144は、手指の三次元骨格情報に基づいて、三次元手指モデルを生成し、生成した三次元手指モデルをあらかじめ決められた射影式によって射影することによって、二次元の手指映像を生成する。かかる手指映像は、作業に係る物体に対応する画像の一例に該当し得る。例えば、かかる射影式は、正射影(平行投影)を示す式であってよい。そして、作業者側表示制御部144は、生成した手指映像を作業撮像部12によって得られた作業撮像映像に重畳し、作業撮像映像に重畳した手指映像を作業者側表示部16に表示させる。
【0084】
図7は、作業撮像映像に重畳された手指映像の作業者側表示部16による表示例を示す図である。図7に示されるように、作業者側表示制御部144は、作業撮像部12によって得られた作業撮像映像M12に生成した手指映像U2を重畳し、作業撮像映像M12に重畳した手指映像U2を作業者側表示部16に表示させる。
【0085】
(符号化部142)
符号化部142は、手指の三次元骨格情報と指示に使用される指を示す情報とに基づいて、指示に使用される指を通過する三次元座標に対応する、作業者側画面161(図7)における二次元座標を算出する算出部の例として機能する。
【0086】
より詳細に、符号化部142は、指示に使用される指の先端の三次元座標に対応する、作業者側画面161における二次元座標を算出する。一例として、符号化部142は、指示に使用される指を示す情報が人差し指を示す情報である場合には、人差し指を構成する指先の三次元座標に対応する、作業者側画面161における二次元座標を算出する。
【0087】
なお、指示に使用される指を通過する三次元座標を作業者側画面161に対応する二次元座標に変換するための変換式は、三次元手指モデルを二次元の手指映像に射影するための射影式と同じであってよい。また、以下の説明では、指示に使用される指を通過する三次元座標に対応する、作業者側画面161における二次元座標を、単に「指示に使用される指の二次元座標」とも言う。
【0088】
符号化部142は、指示に使用される指の二次元座標に応じた作業者側画面161における領域を重要領域として推定して重要領域を示す情報を得る推定部の例として機能する。例えば、符号化部142は、指示に使用される指の位置を加味して重要領域を推定してもよい。より詳細に、符号化部142は、指示に使用される指の二次元座標が示す位置を中央位置とした作業者側画面161における領域(以下、「補正前領域」とも言う。)を重要領域として推定してもよい。
【0089】
あるいは、符号化部142は、指示に使用される指の位置に加えて、指示に使用される指の方向も加味して重要領域を推定してもよい。より詳細に、符号化部142は、指示に使用される指を通過する複数の三次元座標に基づいて、指示に使用される指の三次元方向に対応する作業者側画面161における二次元方向(以下、「指示に使用される指の二次元方向」とも言う。)を算出し、指示に使用される指の二次元座標および指示に使用される指の二次元方向に応じた作業者側画面161における領域(以下、「補正後領域」とも言う。)を重要領域として推定してもよい。
【0090】
以下では、図8図10を参照しながら、補正前領域と補正後領域との双方を含んだ重要領域を推定する手法の例について説明する。なお、ここでは、指示に使用される指が、人差し指である場合における重要領域の推定について主に説明するが、指示に使用される指が、人差し指以外である場合にも、指示に使用される指が人差し指である場合と同様に重要領域が推定され得る。
【0091】
図8は、補正前領域の推定について説明するための図である。図8に示されるように、作業撮像映像M12を、複数の領域に分割することを想定する。図8には、各領域が16×16ピクセルの矩形領域である例が示されている。このように分割された結果として、作業撮像映像M12が縦に6分割され、横に8分割されて生じた、合計48個の矩形領域が示されている。しかし、矩形領域のサイズおよび作業撮像映像M12の分割数などは、かかる例に限定されない。
【0092】
ここで、指示に使用される指の例としての人差し指の先端の三次元座標をEとし、射影式をproj()とする。このとき、符号化部142は、人差し指の先端の三次元座標Eに対応する、作業撮像映像M12における人差し指の先端の二次元座標Fを、下記の式(3)に示すように算出し得る。
【0093】
F:=proj(E) ・・・(3)
【0094】
符号化部142は、作業撮像映像M12における人差し指の先端の二次元座標Fが示す位置を中央位置とした作業撮像映像M12における領域を補正前領域R1として推定する。
【0095】
なお、図8に示された例では、人差し指の先端が含まれる一つの領域を中心とした縦3×横3からなる矩形領域が補正前領域R1として推定されている。しかし、補正前領域R1の縦および横それぞれのサイズは、かかる例に限定されない。また、符号化部142は、作業撮像映像M12の外側の領域を、補正前領域R1に含めない。
【0096】
図9は、補正後領域の推定について説明するための図である。ここで、指示に使用される指の例としての人差し指の第一関節の三次元座標をJとする。このとき、符号化部142は、人差し指の第一関節の三次元座標Jに対応する、作業撮像映像M12における人差し指の第一関節の二次元座標を、proj(J)として算出し得る。
【0097】
人差し指の三次元方向に対応する作業者側画面161における二次元方向をDとする。このとき、符号化部142は、人差し指の先端の二次元座標proj(E)と、人差し指の第一関節の二次元座標proj(J)とに基づいて、指示に使用される指の例としての人差し指の二次元方向Dを、下記の式(4)に示すように算出し得る。
【0098】
D:=normalize(proj(E)-proj(J)) ・・・(4)
【0099】
さらに、符号化部142は、人差し指の先端の二次元座標proj(E)が示す位置から、人差し指の二次元方向Dに所定のシフト量Hだけシフトした位置(以下、「人差し指の先端のシフト後の二次元座標とも言う。)Tを、下記の式(5)に示すように算出し得る。
【0100】
T:=proj(E)+D×H ・・・(5)
【0101】
なお、シフト量Hは、どのようにして決められてもよい。例えば、シフト量Hは、作業撮像映像M12が分割された各領域のサイズ(例えば、16ピクセル)に決められてもよい。あるいは、シフト量Hは、作業撮像映像M12における人差し指が長いほど、大きく決められてもよい。一例として、作業撮像映像M12における人差し指の長さは、人差し指の先端の二次元座標proj(E)と、人差し指の第一関節の二次元座標proj(J)との距離であってよい。
【0102】
ここで、補正前領域R1(図8)だけではなく、人差し指の先端のシフト後の二次元座標Tに応じた領域も指示者が注目すべき重要領域であることが想定される。そこで、符号化部142は、人差し指の先端のシフト後の二次元座標Tを中央位置とした作業撮像映像M12における領域を補正後領域R2として推定する。
【0103】
なお、図9に示された例では、指差し方向へのシフト後の人差し指の先端が含まれる一つの領域を中心とした縦3×横3からなる矩形領域が補正後領域R2として推定されている。しかし、補正後領域R2の縦および横それぞれのサイズは、かかる例に限定されない。また、符号化部142は、作業撮像映像M12の外側の領域を、補正後領域R2に含めない。
【0104】
図10は、補正前領域R1と補正後領域R2とを含んだ重要領域の推定について説明するための図である。図10を参照すると、補正前領域R1と、補正後領域R2とが示されている。符号化部142は、補正前領域R1と補正後領域R2とを足し合わせることによって、重要領域R3を推定する。これによって、作業撮像映像M12において指示者が注目すべき重要領域R3がより包括的に推定され得る。なお、符号化部142は、指示に使用される指が複数である場合には、指示に使用される複数の指それぞれについて重要領域を推定し、推定したそれぞれの重要領域を足し合わせることによって最終的な重要領域を得ればよい。
【0105】
符号化部142は、重要領域を示す情報に基づいて、作業撮像映像M12に対する符号化を行って符号化後の作業撮像映像M12を得る符号化処理部の一例として機能する。より詳細に、符号化部142は、作業撮像映像M12のうち、重要領域R3以外の領域である非重要領域に対する符号化による圧縮率を、重要領域R3に対する符号化による圧縮率よりも高くする。なお、重要領域および非重要領域それぞれに対する具体的な符号化方式は特に限定されない。
【0106】
(送信制御部143)
送信制御部143は、符号化部142によって得られた符号化後の作業撮像映像M12と重要領域R3を示す情報とがネットワーク30を介して指示者側装置24に送信されるように通信部148を制御する。このような符号化後の作業撮像映像M12が送信されることによって、作業撮像映像M12がネットワーク30に与える通信負荷を軽減しつつ、作業撮像映像M12における重要領域R3の品質の低下を抑制することが可能となる。
【0107】
(符号化データ取得部244)
符号化データ取得部244は、通信部248によって受信された符号化後の作業撮像映像M12と重要領域R3を示す情報とを取得する取得部の一例として機能する。
【0108】
(復号部245)
復号部245は、符号化データ取得部244によって取得された符号化後の作業撮像映像M12を復号して復号後の作業撮像映像M12を得る。より詳細に、復号部245は、符号化後の作業撮像映像M12と重要領域R3を示す情報とに基づいて、重要領域R3以外の領域である非重要領域に対して、非重要領域に対する符号化に対応する復号を行い、重要領域R3に対して、重要領域R3に対する符号化に対応する復号を行う。
【0109】
(指示者側表示制御部246)
指示者側表示制御部246は、復号部245によって得られた復号後の作業撮像映像M12を指示者側表示部26に表示させる。また、指示者側表示制御部246は、手指検知部241によって得られた手指の三次元骨格情報に基づいて、三次元手指モデルを生成し、生成した三次元手指モデルをあらかじめ決められた射影式によって射影することによって、二次元の手指映像を生成する。指示者側表示制御部246による射影は、作業者側表示制御部144による射影と同様に実行されてよい。
【0110】
そして、指示者側表示制御部246は、生成した手指映像を復号部245によって得られた復号後の作業撮像映像M12に重畳し、復号後の作業撮像映像M12に重畳した手指映像を指示者側表示部26に表示させる。
【0111】
図11は、復号後の作業撮像映像M12に重畳された手指映像の指示者側表示部26による表示例を示す図である。図11に示されるように、指示者側表示制御部246は、復号部245によって得られた復号後の作業撮像映像M12に生成した手指映像U2を重畳し、作業撮像映像M12に重畳した手指映像U2を指示者側表示部26に表示させる。なお、図11を参照すると、指示空間に存在する指示者の手指U1が示されている。
【0112】
上記したように、作業撮像映像M12のうち、重要領域R3以外の領域である非重要領域に対する符号化による圧縮率は、重要領域R3に対する符号化による圧縮率よりも高くされる。そのため、図11に示されたように、復号後の作業撮像映像M12のうち、重要領域R3以外の領域である非重要領域は、「低画質」であり、重要領域R3は、「高画質」である。
【0113】
以上、本発明の実施形態に係る遠隔作業支援システム1の構成例について説明した。
【0114】
(1-2.遠隔作業支援システムの動作)
続いて、図12および図13を参照しながら(図1図11も適宜参照しながら)、本発明の実施形態に係る遠隔作業支援システム1の動作例について説明する。まず、図12を参照しながら作業者側システム10の動作例について説明し、続いて、図13を参照しながら指示者側システム20の動作例について説明する。
【0115】
図12は、作業者側システム10の動作例を示すフローチャートである。作業者側システム10において、作業撮像部12は、作業者によって作業が行われる空間である作業空間を撮像することにより作業撮像画像を得る。作業者側表示制御部144は、作業撮像部12によって得られた作業撮像映像を取得し(S101)、作業撮像映像を作業者側表示部16に表示させる(S102)。
【0116】
符号化部142は、重要領域を示す情報に基づいて、作業撮像映像に対する符号化を行って符号化後の作業撮像映像を得る(S103)。より詳細に、符号化部142は、作業撮像映像M12のうち、重要領域以外の領域である非重要領域に対する符号化による圧縮率を、重要領域に対する符号化による圧縮率よりも高くする。送信制御部143は、符号化部142によって得られた符号化後の作業撮像映像と重要領域を示す情報とがネットワーク30を介して指示者側装置24に送信されるように通信部148を制御する(S104)。
【0117】
通信部148によって手指の三次元骨格情報と指示に使用される指を示す情報とが受信されない場合には(S110において「NO」)、S101に動作が移行される。一方、通信部148によって手指の三次元骨格情報と指示に使用される指を示す情報とが受信された場合には(S110において「YES」)、判定結果取得部141は、通信部148によって受信された手指の三次元骨格情報と指示に使用される指を示す情報とを取得する。
【0118】
作業者側表示制御部144は、手指の三次元骨格情報に基づいて、三次元手指モデルを生成し、生成した三次元手指モデルをあらかじめ決められた射影式によって射影することによって、二次元の手指映像を生成する。そして、作業者側表示制御部144は、生成した手指映像を作業者側表示部16に表示される作業撮像映像に重畳して表示させる(S111)。
【0119】
符号化部142は、手指の三次元骨格情報と指示に使用される指を示す情報とに基づいて、指示に使用される指を通過する三次元座標に対応する、作業者側画面161における二次元座標を算出する。符号化部142は、指示に使用される指の二次元座標に応じた作業者側画面161における領域を重要領域として推定して重要領域を示す情報を得る(S112)。そして、S101に動作が移行される。
【0120】
図13は、指示者側システム20の動作例を示すフローチャートである。指示者側システム20において、通信部248は、符号化後の作業撮像映像と重要領域を示す情報とを受信し(S201)、符号化データ取得部244は、通信部248によって受信された符号化後の作業撮像映像と重要領域を示す情報とを取得する。
【0121】
復号部245は、符号化データ取得部244によって取得された符号化後の作業撮像映像を復号して復号後の作業撮像映像を得る(S202)。より詳細に、復号部245は、符号化後の作業撮像映像と重要領域を示す情報とに基づいて、重要領域以外の領域である非重要領域に対して、非重要領域に対する符号化に対応する復号を行い、重要領域に対して、重要領域に対する符号化に対応する復号を行う。
【0122】
指示者側表示制御部246は、復号部245によって得られた復号後の作業撮像映像を指示者側表示部26に表示させる(S203)。続いて、手指撮像部22は、指示者の手指を撮像することにより手指撮像映像を得る(S204)。手指検知部241は、手指撮像部22によって得られた手指撮像映像を取得する。手指検知部241は、手指撮像映像に基づいて、指示者の手指が通過する複数の三次元座標である手指の三次元骨格情報の検知を試みる。
【0123】
手指検知部241によって手指の三次元骨格情報が検知されない場合(S210において「NO」)、S201に動作が移行される。
【0124】
一方、手指検知部241によって手指の三次元骨格情報が検知された場合(S210において「YES」)、指示者側表示制御部246は、手指の三次元骨格情報に基づいて、三次元手指モデルを生成し、生成した三次元手指モデルをあらかじめ決められた射影式によって射影することによって、二次元の手指映像を生成する。そして、指示者側表示制御部246は、生成した手指映像を指示者側表示部26に表示される復号後の作業撮像映像に重畳して表示させる(S211)。
【0125】
手指判定部242は、手指検知部241によって検知された手指の三次元骨格情報に基づいて、指示者の手指における作業に対する指示に使用される指を特定して、指示に使用される指を示す情報を得る(S212)。
【0126】
判定結果出力部243は、手指検知部241によって検知された手指の三次元骨格情報と、手指判定部242によって特定された指示に使用される指を示す情報とを取得する。そして、判定結果出力部243は、手指の三次元骨格情報と指示に使用される指を示す情報とが、通信部248によって作業者側装置14に送信されるように通信部248を制御する(S213)。そして、S201に動作が移行される。
【0127】
以上、本発明の実施形態に係る遠隔作業支援システム1の動作例について説明した。
【0128】
(1-3.効果)
以上により、本発明の実施形態によれば、手指検知部241と、手指判定部242と、符号化部142と、送信制御部143と、符号化データ取得部244と、復号部245と、指示者側表示制御部246とを備える、遠隔作業支援システム1が提供される。
【0129】
手指検知部241は、指示者の手指から手指撮像部22によって得られた手指撮像映像に基づいて、指示者の手指が通過する複数の三次元座標を検知する。手指判定部242は、複数の三次元座標に基づいて、指示者の手指における作業に対する指示に使用される指を特定する。
【0130】
符号化部142は、指示に使用される指を通過する三次元座標に対応する、作業者によって視認される作業者側画面161における二次元座標を算出し、二次元座標に応じた作業者側画面161における領域を重要領域として推定して重要領域を示す情報を得る。そして、符号化部142は、重要領域を示す情報に基づいて、作業が行われる作業空間が撮像された作業撮像映像に対する符号化を行って符号化後の撮像画像を得る。
【0131】
送信制御部143は、符号化後の作業撮像映像の送信を制御する。符号化データ取得部244は、符号化後の作業撮像映像を取得する。復号部245は、符号化後の作業撮像映像を復号して復号後の作業撮像映像を得る。指示者側表示制御部246は、復号後の作業撮像映像を、指示者によって視認される指示者側画面261に表示させる。
【0132】
かかる構成によれば、作業空間を撮像して得られた作業撮像映像がネットワークに与える通信負荷を軽減しつつ、作業撮像映像における重要領域の品質の低下を抑制することが可能となる。
【0133】
以上、本発明の実施形態に係る遠隔作業支援システム1が奏する効果について説明した。
【0134】
(2.ハードウェア構成例)
続いて、本発明の実施形態に係る作業者側システム10のハードウェア構成例について説明する。
【0135】
以下では、本発明の実施形態に係る作業者側システム10のハードウェア構成例として、情報処理装置900のハードウェア構成例について説明する。なお、以下に説明する情報処理装置900のハードウェア構成例は、作業者側システム10のハードウェア構成の一例に過ぎない。したがって、作業者側システム10のハードウェア構成は、以下に説明する情報処理装置900のハードウェア構成から不要な構成が削除されてもよいし、新たな構成が追加されてもよい。なお、指示者側システム20のハードウェア構成も、作業者側システム10のハードウェア構成と同様に実現され得る。
【0136】
図14は、本発明の実施形態に係る作業者側システム10の例としての情報処理装置900のハードウェア構成を示す図である。情報処理装置900は、CPU(Central Processing Unit)901と、ROM(Read Only Memory)902と、RAM(Random Access Memory)903と、ホストバス904と、ブリッジ905と、外部バス906と、インタフェース907と、入力装置908と、出力装置909と、ストレージ装置910と、通信装置911と、を備える。
【0137】
CPU901は、演算処理装置および制御装置として機能し、各種プログラムに従って情報処理装置900内の動作全般を制御する。また、CPU901は、マイクロプロセッサであってもよい。ROM902は、CPU901が使用するプログラムや演算パラメータ等を記憶する。RAM903は、CPU901の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一時記憶する。これらはCPUバス等から構成されるホストバス904により相互に接続されている。
【0138】
ホストバス904は、ブリッジ905を介して、PCI(Peripheral Component Interconnect/Interface)バス等の外部バス906に接続されている。なお、必ずしもホストバス904、ブリッジ905および外部バス906を分離構成する必要はなく、1つのバスにこれらの機能を実装してもよい。
【0139】
入力装置908は、マウス、キーボード、タッチパネル、ボタン、マイクロフォン、スイッチおよびレバー等ユーザが情報を入力するための入力手段と、ユーザによる入力に基づいて入力信号を生成し、CPU901に出力する入力制御回路等から構成されている。情報処理装置900を操作するユーザは、この入力装置908を操作することにより、情報処理装置900に対して各種のデータを入力したり処理動作を指示したりすることができる。
【0140】
出力装置909は、例えば、CRT(Cathode Ray Tube)ディスプレイ装置、液晶ディスプレイ(LCD)装置、OLED(Organic Light Emitting Diode)装置、ランプ等の表示装置およびスピーカ等の音声出力装置を含む。
【0141】
ストレージ装置910は、データ格納用の装置である。ストレージ装置910は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置および記憶媒体に記録されたデータを削除する削除装置等を含んでもよい。ストレージ装置910は、例えば、HDD(Hard Disk Drive)で構成される。このストレージ装置910は、ハードディスクを駆動し、CPU901が実行するプログラムや各種データを格納する。
【0142】
通信装置911は、例えば、ネットワークに接続するための通信デバイス等で構成された通信インタフェースである。また、通信装置911は、無線通信または有線通信のどちらに対応してもよい。
【0143】
以上、本発明の実施形態に係る作業者側システム10のハードウェア構成例について説明した。
【0144】
(3.まとめ)
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
【0145】
例えば、上記では、作業に係る物体の例として、作業に対する指示を行う指示者の手指が用いられる場合を主に想定した。しかし、作業に係る物体として、指示者の手指の代わりに、作業者の手指が用いられてもよい。このとき、手指撮像部22は、指示者側システム20の代わりに作業者側システム10に備えられてよい。そして、手指撮像部22は、作業者の手指を撮像し、手指検知部241は、指示者の手指の三次元骨格情報を検知する手法と同様の手法により、作業者の手指の三次元骨格情報を検知すればよい。
【0146】
また、作業に係る物体は、手指に限定されない。すなわち、作業に係る物体は、作業者によって用いられる物体(第1の物体)を含んでもよいし、作業に対して指示を行う指示者によって用いられる物体(第2の物体)を含んでもよい。作業に係る物体は、作業者または指示者によって用いられる各種の道具(例えば、作業に使う道具(ドライバーなど)、医療器具など)であってもよい。あるいは、作業に係る物体は、ロボットによって用いられる物体を含んでもよい。
【0147】
また、上記では、手指判定部242が、あらかじめ決められた条件(具体的には、曲がり度合いが閾値以下であるという条件)を満たす指を、指示に使用される指として特定する場合について主に説明した。しかし、手指判定部242は、手指の三次元骨格情報と、所定の機械学習アルゴリズムによる学習によって得られた学習済みのモデルとに基づいて、指示に使用される指を特定してもよい。
【0148】
一例として、機械学習アルゴリズムによる学習は、ニューラルネットワークによる機械学習(例えば、深層学習など)であってもよい。あらかじめ用意された学習済みのモデルは、遠隔作業支援システム1の使用が開始された後は更新されなくてもよいし、遠隔作業支援システム1の使用中に適宜に更新されてもよい。
【0149】
例えば、指示者または作業者は、手指撮像映像を参照しながら、作業に係る部位の正解データを遠隔作業支援システム1に入力させることが可能であってもよい。そうすれば、遠隔作業支援システム1は、作業に係る部位の正解データと手指撮像映像とに基づいて、あらかじめ用意された学習済みのモデルの追加学習を行うことが可能である。これによって、遠隔作業支援システム1の使用中にもモデルの精度が向上し得る。
【0150】
また、上記では、作業撮像映像が複数の矩形領域に分割される場合を主に想定した。しかし、作業撮像映像が分割される複数の領域それぞれの形状は、矩形領域に限定されない。また、上記したように、作業撮像映像が分割される複数の矩形領域それぞれのサイズも16×16ピクセルに限定されない。
【0151】
さらに、上記では、手指検知部241および手指判定部242が指示者側装置24に備えられる場合について主に想定した。しかし、手指検知部241および手指判定部242の少なくともいずれか一方は、作業者側装置14に備えられてもよいし、図示しないサーバに備えられてもよい。
【0152】
また、符号化部142のうち、指示に使用される指の二次元座標を算出する算出部および重要領域を推定する推定部の少なくともいずれか一方も同様に、作業者側装置14に備えられてもよいし、図示しないサーバに備えられてもよい。
【0153】
上記では、指示者側表示部26に表示される手指映像は、指示者側表示制御部246によって作業撮像映像に重畳される場合を主に想定した。かかる構成によれば、手指映像が作業者側システム10から指示者側システム20に送信されなくてよいため、ネットワーク30に掛かる通信負荷が軽減されるという効果が奏される他、指示者側システム20において手指映像を重畳させるか否かを独自に判断することが可能であるという効果なども奏される。
【0154】
しかし、指示者側表示部26に表示される手指映像は、作業者側表示制御部144によって作業撮像映像に重畳されてもよい。かかる構成によれば、作業者側システム10と指示者側システム20とにおいて同じ手指映像フレームが同じ作業撮像映像フレームに重畳される。換言すると、かかる構成によれば、作業者側システム10と指示者側システム20とにおいて同じ作業撮像映像フレームに重畳される手指映像フレームの時間差がなくなるという効果が奏される。
【符号の説明】
【0155】
1 遠隔作業支援システム
10 作業者側システム
12 作業撮像部
14 作業者側装置
140 制御部
141 判定結果取得部
142 符号化部
143 送信制御部
144 作業者側表示制御部
148 通信部
149 記憶部
16 作業者側表示部
161 作業者側画面
20 指示者側システム
22 手指撮像部
24 指示者側装置
240 制御部
241 手指検知部
242 手指判定部
243 判定結果出力部
244 符号化データ取得部
245 復号部
246 指示者側表示制御部
248 通信部
249 記憶部
26 指示者側表示部
261 指示者側画面
30 ネットワーク

図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14