特開2024-120481 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 学校法人立命館の特許一覧

特開2024-120481模擬オポーネントの制御システム、学習方法、及び模擬オポーネントシステム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024120481

(43)【公開日】2024-09-05

(54)【発明の名称】模擬オポーネントの制御システム、学習方法、及び模擬オポーネントシステム

(51)【国際特許分類】

A63B 69/00 20060101AFI20240829BHJP

B25J 13/08 20060101ALI20240829BHJP

A63B 69/34 20060101ALI20240829BHJP

【ＦＩ】

A63B69/00 Z

B25J13/08 A

A63B69/00 513C

A63B69/00 513D

A63B69/00 513A

A63B69/00 513B

A63B69/00 513Z

A63B69/34

【審査請求】未請求

【請求項の数】8

【出願形態】ＯＬ

(21)【出願番号】P 2023027303

(22)【出願日】2023-02-24

【新規性喪失の例外の表示】特許法第３０条第２項適用申請有り公開の事実１：令和４（２０２２）年１２月１３日、第２３回計測自動制御学会システムインテグレーション部門講演会（ＳＩ２０２２）Ｗｅｂ概要集及び予稿集にて公開公開の事実２：令和４（２０２２）年１２月１５日、第２３回計測自動制御学会システムインテグレーション部門講演会（ＳＩ２０２２）にてポスター発表

(71)【出願人】

【識別番号】593006630

【氏名又は名称】学校法人立命館

(74)【代理人】

【識別番号】100111567

【弁理士】

【氏名又は名称】坂本寛

(72)【発明者】

【氏名】玄相昊

(72)【発明者】

【氏名】渡邊悠希

(72)【発明者】

【氏名】堀川皓史

【テーマコード（参考）】

3C707

【Ｆターム（参考）】

3C707CS08

3C707JU12

3C707JU14

3C707KS04

3C707KS31

3C707KS36

3C707KT01

3C707KT06

3C707KW01

3C707LW12

3C707WA16

(57)【要約】

【課題】模擬オポーネントが、単に、相手との距離を一定に保つだけではなく、相手の動作の種類に応じた適切な行動することが望まれる。
【解決手段】開示のシステムは、模擬オポーネントの制御システムであって、人であるプレーヤーの位置姿勢を示す第１データを求める位置姿勢推定器と、前記模擬オポーネントを動作させる動作データを、前記プレーヤーの前記第１データに基づいて生成する動作生成器と、を備え、前記動作生成器は、前記第１データが入力されると前記動作データを出力するよう機械学習された動作生成モデルに対して、前記第１データを入力することで、前記動作データを生成するよう構成されている。
【選択図】図２

【特許請求の範囲】

【請求項1】

模擬オポーネントの制御システムであって、
人であるプレーヤーの位置姿勢を示す第１データを求める位置姿勢推定器と、
前記模擬オポーネントを動作させる動作データを、前記プレーヤーの前記第１データに基づいて生成する動作生成器と、
を備え、
前記動作生成器は、前記第１データが入力されると前記動作データを出力するよう機械学習された動作生成モデルに対して、前記第１データを入力することで、前記動作データを生成するよう構成されている
制御システム。

【請求項2】

前記動作生成モデルは、前記プレーヤーの前記第１データ及び前記模擬オポーネントの位置を示す第２データが入力されると、前記動作データを出力するよう機械学習されており、
前記動作生成器は、前記動作生成モデルに対して、前記第１データ及び前記第２データを入力することで、前記動作データを生成するよう構成されている
請求項１に記載の制御システム。

【請求項3】

前記動作データは、前記プレーヤーと前記模擬オポーネントとの相対的な距離を変動させるよう前記模擬オポーネントを動作させるデータである
請求項１に記載の制御システム。

【請求項4】

前記模擬オポーネントの動作を人が操作するための操作器から出力された動作データに基づいて前記模擬オポーネントが動作しているときにおける前記プレーヤーの位置姿勢を示す第１学習データと、前記操作器から出力された前記動作データと、を用いて、前記動作生成モデルの機械学習を実行する動作学習器を更に備える
請求項１に記載の制御システム。

【請求項5】

模擬オポーネントの動作生成モデルの機械学習をコンピュータによって実行させる学習方法であって、
前記動作生成モデルは、人であるプレーヤーの位置姿勢を示す第１データが入力されると、前記模擬オポーネントの動作データを出力するよう構成され、
前記学習方法は、前記模擬オポーネントの動作を人が操作するための操作器から出力された動作データに基づいて前記模擬オポーネントが動作しているときにおける前記プレーヤーの位置姿勢を示す第１学習データと、前記操作器から出力された前記動作データと、を用いて、前記動作生成モデルの機械学習を実行する、
ことを備える学習方法。

【請求項6】

人であるプレーヤーの動きに応じて自走動作する模擬オポーネントと、
前記プレーヤーを撮像するセンサと、
前記模擬オポーネントの位置を検出して第２データを出力する位置検出器と、
前記センサで撮像した画像データ又は動画データに基づき前記プレーヤーの位置姿勢を示す第１データを求める位置姿勢推定器と、
前記第１データおよび前記第２データに基づいて前記模擬オポーネントを前記プレーヤーの動きに応じて自走動作させる動作データを生成する動作生成器と、
前記動作データに基づいて前記模擬オポーネントを自走動作させる駆動装置に指示をする制御装置と、
を備え、
前記動作生成器は、前記第１データ及び前記第２データが入力されると前記動作データを出力するよう機械学習された動作生成モデルに対して、前記第１データ及び前記第２データを入力することで、前記動作データを生成するよう構成されている
模擬オポーネントシステム。

【請求項7】

前記模擬オポーネントは、走行体と、前記走行体に搭載された標的と、を備える
請求項６に記載の模擬オポーネントシステム。

【請求項8】

前記模擬オポーネントは、転倒状態から起立状態への自己復元力を生じさせる重心位置を有する自己復元機構を備える
請求項７に記載の模擬オポーネントシステム。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、模擬オポーネントの制御システム、学習方法、及び模擬オポーネントシステムに関する。

【背景技術】

【0002】

格闘技などの練習相手を無人化する試みは、従来から行われている。例えば、特許文献１には、自走式格闘技練習装置が記載されている。特許文献１に記載の練習装置は、練習者を感知する感知手段を備え、練習者の近接及び離隔移動に関する情報をもとに、駆動走行手段及び駆動旋回手段を制御する。

【0003】

特許文献１に記載の練習装置は、練習者の動きを感知して自動的に練習装置を走行移動させることで、練習者と練習装置を一定の距離を隔てて対面させ、仕掛け技、応じ技の練習を連続して行うことを可能とすることを目的としている。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開２００１－６２０２０号公報

【発明の概要】

【0005】

特許文献１に開示の練習装置は、練習者の移動を感知して、練習者との距離を一定に保って移動するものにすぎず、練習相手又は対戦相手として不十分なことがある。

【0006】

例えば、格闘技などの訓練・練習では、相手との間合いを取りながら、相手に打撃を与えるスパーリングが行われることがある。スパーリングにおいては、巧みに相手との間合いを取りつつ、相手に技を繰り出す必要がある。このため、効果的な練習のためには、スパーリング相手は、単に、一定距離を保って移動するものよりも、自ら機敏に動き回るものが好ましい。

【0007】

このように、無人化した練習相手又は対戦相手（以下、「模擬オポーネント」という）は、単に、相手との距離を一定に保つだけではなく、相手の動作の種類に応じた適切な行動をすることが望まれる。

【0008】

本開示のある側面は、模擬オポーネントの制御システムである。開示のシステムは、人であるプレーヤーの位置姿勢を示す第１データを求める位置姿勢推定器と、前記模擬オポーネントを動作させる動作データを、前記プレーヤーの前記第１データに基づいて生成する動作生成器と、を備え、前記動作生成器は、前記第１データが入力されると前記動作データを出力するよう機械学習された動作生成モデルに対して、前記第１データを入力することで、前記動作データを生成するよう構成されている。

【0009】

本開示の他の側面は、学習方法である。開示の学習方法は、模擬オポーネントの動作生成モデルの機械学習をコンピュータによって実行させる。前記動作生成モデルは、人であるプレーヤーの位置姿勢を示す第１データが入力されると、前記模擬オポーネントの動作データを出力するよう構成され、前記学習方法は、前記模擬オポーネントの動作を人が操作するための操作器から出力された動作データに基づいて前記模擬オポーネントが動作しているときにおける前記プレーヤーの位置姿勢を示す第１学習データと、前記操作器から出力された前記動作データと、を用いて、前記動作生成モデルの機械学習を実行する。

【0010】

本開示の他の側面は、模擬オポーネントシステムである。開示のシステムは、人であるプレーヤーの動きに応じて自走動作する模擬オポーネントと、前記プレーヤーを撮像するセンサと、前記模擬オポーネントの位置を検出して第２データを出力する位置検出器と、前記センサで撮像した画像データ又は動画データに基づき前記プレーヤー位置姿勢を示す第１データを求める位置姿勢推定器と、前記第１データおよび前記第２データに基づいて前記模擬オポーネントを前記プレーヤーの動きに応じて自走動作させる動作データを生成する動作生成器と、前記動作データに基づいて前記模擬オポーネントを自走動作させる駆動装置に指示をする制御装置と、を備え、前記動作生成器は、前記第１データ及び前記第２データが入力されると前記動作データを出力するよう機械学習された動作生成モデルに対して、前記第１データ及び前記第２データを入力することで、前記動作データを生成するよう構成されている。

【0011】

更なる詳細は、後述の実施形態として説明される。

【図面の簡単な説明】

【0012】

【図1】図１は、実施形態に係る模擬オポーネントシステムの構成図である。

【図2】図２は、制御システム及び模擬オポーネントのブロック図である。

【図3】図３は、機械学習の手順を示すフローチャートである。

【図4】図４は、自律動作の手順を示すフローチャートである。

【図5】図５は、模擬オポーネントの自己復元動作の説明図である。

【発明を実施するための形態】

【0013】

＜１．格闘技の模擬オポーネントの制御システム、学習方法、及び模擬オポーネントシステムの概要＞

【0014】

（１）実施形態に係るシステムは、模擬オポーネントの制御システムであり得る。制御システムは、人であるプレーヤーの位置姿勢を示す第１データを求める位置姿勢推定器と、前記模擬オポーネントを動作させる動作データを、前記プレーヤーの前記第１データに基づいて生成する動作生成器と、を備え得る。

【0015】

前記動作生成器は、前記第１データが入力されると前記動作データを出力するよう機械学習された動作生成モデルに対して、前記第１データを入力することで、前記動作データを生成するよう構成され得る。

【0016】

実施形態に係る動作生成器は、人であるプレーヤーの位置姿勢から、機械学習された動作生成モデルによって、模擬オポーネントの動作データを生成することができる。実施形態に係るシステムは、プレーヤーの位置姿勢に応じて、模擬オポーネントを動作させることができるため、プレーヤーの動作に応じた反射動作を模擬オポーネントにとらせることができる。したがって、模擬オポーネントは、相手との距離を一定に保つだけではなく、相手の動作の種類に応じた適切な行動をすることが可能である。

【0017】

模擬オポーネントが、格闘技のためのものである場合、模擬オポーネントの反射動作は、例えば、プレーヤーの攻撃を避ける動作、プレーヤーの攻撃を受ける動作、プレーヤーを攻撃する動作、及びプレーヤーの動きを誘うフェイント動作の少なくともいずれか一つ又はそれらの組み合わせである。機械学習によって、このような複雑な反射動作を、模擬オポーネントに実行させることができる。なお、模擬オポーネントは、格闘技のためのものに限らず、プレーヤーの相手が必要とされる競技・その他の運動のためのものであってもよい。

【0018】

プレーヤーの動作に応じた反射動作を行う模擬オポーネントは、プレーヤーの動作に応じて自ら機敏に動き回ることができる。したがって、プレーヤーは、この模擬オポーネントを相手としてスパーリングをすると、効果的に練習を行うことができる。また、プレーヤーは、この模擬オポーネントを相手として対戦することもできる。

【0019】

ここで、格闘技は、相手（オポーネント：opponent）と対戦する競技又はスポーツであり、相手に対する攻撃及び相手からの攻撃に対する防御が行われ得る。格闘技は、打撃系格闘技、組技系格闘技、及び総合系格闘技のいずれであってもよいが、好ましくは打撃系格闘技などの打撃が行われる格闘技である。なお、ここでの格闘技は、人の体で攻撃するもののほか、フェンシング及び剣道のように道具で相手を攻撃するものを含むものとする。

【0020】

打撃系格闘技は、殴る又は蹴るなどの打撃行為が行われる格闘技である。打撃系格闘技は、例えば、空手、ボクシング、キックボクシング、ムエタイ、テコンドーである。組技系格闘技は、投げ技、寝技、関節技、締め技などの組技が行われる格闘技である。組技系格闘技は、例えば、レスリング、柔道、相撲である。総合系格闘技は、打撃及び組技の両方が行われる格闘技である。

【0021】

模擬オポーネントが格闘技のためのものである場合、模擬オポーネントは、格闘技のプレーヤーの練習相手又は対戦相手となる対象であり、人ではなく、模擬的な相手である。模擬オポーネントは、プレーヤーからの攻撃を受ける標的を備え得る。模擬オポーネントは、例えば、プレーヤーの動作に応じて動作するロボットである。模擬オポーネントは、それ自体が人でなければよく、人である操作者によって操作されてもよい。

【0022】

なお、人であるプレーヤーは、１又は複数であり得る。模擬オポーネントは、１又は複数であり得る。また、模擬オポーネントが、人である操作者によって操作される場合、操作者は、１又は複数であり得る。複数の模擬オポーネントは、それぞれ異なる操作者によって操作されてもよいし、一人の操作者によって操作されてもよい。

【0023】

（２）前記動作生成モデルは、前記プレーヤーの前記第１データ及び前記模擬オポーネントの位置を示す第２データが入力されると、前記動作データを出力するよう機械学習されているのが好ましい。前記動作生成器は、前記動作生成モデルに対して、前記第１データ及び前記第２データを入力することで、前記動作データを生成するよう構成され得る。

【0024】

（３）前記動作データは、前記プレーヤーと前記模擬オポーネントとの相対的な距離を変動させるよう前記模擬オポーネントを動作させるデータであり得る。

【0025】

（４）実施形態に係る制御システムは、前記模擬オポーネントの動作を人が操作するための操作器から出力された動作データに基づいて前記模擬オポーネントが動作しているときにおける前記プレーヤーの位置姿勢を示す第１学習データと、前記操作器から出力された前記動作データと、を用いて、前記動作生成モデルの機械学習を実行する動作学習器を更に備え得る。

【0026】

（５）実施形態に係る方法は、模擬オポーネントの動作生成モデルの機械学習をコンピュータによって実行させる学習方法であり得る。前記動作生成モデルは、人であるプレーヤーの位置姿勢を示す第１データが入力されると、前記模擬オポーネントの動作データを出力するよう構成され得る。前記学習方法は、前記模擬オポーネントの動作を人が操作するための操作器から出力された動作データに基づいて前記模擬オポーネントが動作しているときにおける前記プレーヤーの位置姿勢を示す第１学習データと、前記操作器から出力された前記動作データと、を用いて、前記動作生成モデルの機械学習を実行する、ことを備え得る。

【0027】

（６）実施形態に係るシステムは、模擬オポーネントシステムであり得る。模擬オポーネントシステムは、人であるプレーヤーの動きに応じて自走動作する模擬オポーネントと、前記プレーヤーを撮像するセンサと、前記模擬オポーネントの位置を検出して第２データを出力する位置検出器と、前記センサで撮像した画像データ又は動画データに基づき前記プレーヤーの位置姿勢を示す第１データを求める位置姿勢推定器と、前記第１データおよび前記第２データに基づいて前記模擬オポーネントを前記プレーヤーの動きに応じて自走動作させる動作データを生成する動作生成器と、前記動作データに基づいて前記模擬オポーネントを自走動作させる駆動装置に指示をする制御装置と、を備え、前記動作生成器は、前記第１データ及び前記第２データが入力されると前記動作データを出力するよう機械学習された動作生成モデルに対して、前記第１データ及び前記第２データを入力することで、前記動作データを生成するよう構成され得る。

【0028】

（７）前記模擬オポーネントは、走行体と、前記走行体に搭載された標的と、を備え得る。

【0029】

（８）前記模擬オポーネントは、転倒状態から起立状態への自己復元力を生じさせる重心位置を有する自己復元機構を備え得る。

【0030】

＜２．格闘技の模擬オポーネントの制御システム、学習方法、及び模擬オポーネントシステムの例＞

【0031】

図１及び図２は、実施形態に係る模擬オポーネントシステム１０の一例を示している。模擬オポーネントシステム１０は、人であるプレーヤーＡの相手となる模擬オポーネント６００を動作させる。図示の模擬オポーネントシステム１０は、模擬オポーネント６００と、模擬オポーネント６００を制御する制御システム１００と、を備える。

【0032】

プレーヤーＡは、模擬オポーネント６００を相手に、例えば、格闘技の練習又は対戦をすることができる。練習は、例えば、スパーリングである。対戦は、試合であってもよいし、楽しむためのゲームであってもよい。実施形態に係る模擬オポーネント６００は、プレーヤーＡの動きを認識し、プレーヤーＡの状況に応じた反射動作をする。したがって、プレーヤーＡは、効果的な格闘技の練習、又は、適切な対戦をすることができる。また、プレーヤーＡは、健康づくり又はエクササイズのために、模擬オポーネント６００を相手に運動をしてもよい。

【0033】

図１に示す制御システム１００は、第１コンピュータ３００及び第２コンピュータ４００を含む複数のコンピュータを備える。第１コンピュータ３００は、ビジョン処理装置３００として動作する。ビジョン処理装置３００は、プレーヤーＡ及び模擬オポーネント６００のいずれか一方又は両方を撮像するカメラ２００によって撮像された映像を取得して処理する。なお、以下では、カメラ２００は、一例として、プレーヤーＡ及び模擬オポーネント６００の両方を撮像できるよう設置されているものとする。

【0034】

第２コンピュータ４００は、管理装置４００として動作する。管理装置４００は、模擬オポーネント６００を動作させるなどのシステムの管理を行う。なお、制御システム１００は、一つのコンピュータによって構成されてもよい。つまり、第１コンピュータ３００及び第２コンピュータ４００が有する機能は、一つのコンピュータが有していてもよい。

【0035】

第１コンピュータ３００は、プロセッサ３０１と、プロセッサ３０１に接続された記憶装置３０２を備える。また、第１コンピュータ３００は、外部と通信するための通信ユニット３０３を備える。

【0036】

記憶装置３０２は、例えば、一次記憶装置及び二次記憶装置を備える。一次記憶装置は、例えば、ＲＡＭである。二次記憶装置は、例えば、ハードディスクドライブ（ＨＤＤ）又はソリッドステートドライブ（ＳＳＤ）である。記憶装置３０２は、プロセッサ３０１によって実行されるコンピュータプログラムを備える。プロセッサ３０１は、記憶装置３０２に格納されたコンピュータプログラムを読み出して実行する。記憶装置３０２のコンピュータプログラムは、第１コンピュータ３００をビジョン処理装置３００として動作させるための命令を示すプログラムコードを有する。

【0037】

第２コンピュータ４００は、プロセッサ４０１と、プロセッサ４０１に接続された記憶装置４０２を備える。また、第２コンピュータ４００は、外部と通信するための通信ユニット４０３を備える。

【0038】

記憶装置４０２は、例えば、一次記憶装置及び二次記憶装置を備える。一次記憶装置は、例えば、ＲＡＭである。二次記憶装置は、例えば、ハードディスクドライブ（ＨＤＤ）又はソリッドステートドライブ（ＳＳＤ）である。記憶装置４０２は、プロセッサ４０１によって実行されるコンピュータプログラムを備える。プロセッサ４０１は、記憶装置４０２に格納されたコンピュータプログラムを読み出して実行する。記憶装置４０２のコンピュータプログラムは、第２コンピュータ４００を管理装置４００として動作させるための命令を示すプログラムコードを有する。

【0039】

実施形態の管理装置４００は、ビジョン処理装置３００から与えられたデータに基づいて模擬オポーネント６００を動作させるほか、操作器５００から出力された動作データに基づいて模擬オポーネント６００を動作させることもできる。

【0040】

操作器５００は、人である操作者Ｂによって操作され、操作に応じた動作データを出力する。操作器５００は、例えば、管理装置４００と通信可能なリモートコントローラ５００である。リモートコントローラ５００は、例えば、ジョイスティックを有し、模擬オポーネント６００の動作方向等を指定する操作が行えるように構成されている。操作器５００は、模擬オポーネント６００の可動部分（後述）の動作を指定する操作を行えてもよい。なお、以下では、一例として、模擬オポーネント６００は、動作データを、管理装置４００を介して受信するが、操作器５００から直接受信してもよい。

【0041】

模擬オポーネント６００は、一例として、スパーリングロボット６００として構成されている。スパーリングロボット６００は、プレーヤーＡの動作を認識して動き回り、プレーヤーＡの攻撃を受けたり、逆に、プレーヤーの攻撃を避けたりする。したがって、プレーヤーＡは、模擬オポーネント６００をスパーリングパートナーとして効果的な練習をすることができる。

【0042】

図示の模擬オポーネント６００は、走行体６１０と、走行体６１０に搭載された標的６２０と、を備える。実施形態の模擬オポーネント６０は、人であるプレーヤーＡの動きに応じて自動動作することができる。実施形態の模擬オポーネント６００は、人である操作者Ｂ無しで自律的に動作することができるとともに、操作者Ｂによる操作に応じて動作することもできる。模擬オポーネント６００が操作者Ｂ無しで自律的に動作できる場合、プレーヤーＡは、操作者Ｂの助けなく、一人で練習等をすることができる。

【0043】

また、模擬オポーネント６００が操作者Ｂによって操作される場合、第１プレーヤーであるプレーヤーＡと、第２プレーヤーＢとが、対戦するゲームをすることができる。この場合、プレーヤーＡは自ら動作し、プレーヤーＢは模擬オポーネント６００を操作してプレーヤーＡと対戦する。

【0044】

模擬オポーネント６００の走行体６１０は、例えば、水平面の全方向へ移動可能である。全方向へ移動可能であることで、プレーヤーＡの動きに応じた機敏な動作が可能となる。なお、走行体６１０は、旋回も可能であるのが好ましい。走行体６１０は、一例として、オムニホイールを備える。オムニホイールは、全方向への移動及び旋回が可能である。オムニホイールは、例えば、３輪オムニホイール又は４輪オムニホイールである。走行体６１０には、標的６２０が搭載され、標的６２０を移動させる。走行体６１０は、標的６２０が搭載されるため、走行台車と呼ばれてもよい。

【0045】

標的６２０は、走行体６１０の上に搭載されている。標的６２０は、プレーヤーＡの攻撃を受け得る対象物である。標的６２０の形状及び材質は特に限定されないが、競技の種類又はプレーヤーＡの競技レベルに応じて適切なものが選択されるのが好ましい。標的６２０は、例えば、エアバッグ又はスポンジスティックによって構成され得る。図示の標的６２０は、一例として、円筒状のエアバッグによって構成されている。また、標的６２０は、可動部分を有していてもよい。可動部分は、模擬オポーネント６００に与えられる動作データに基づき、適宜のアクチュエータによって動作し得る。可動部分は、例えば、人の腕を模して形成され得る。

【0046】

模擬オポーネント６００は、センサ６３０、６４０を備えてもよい。センサ６３０，６４０は、カメラ又はその他のセンサである。模擬オポーネント６００に設けられたセンサ６３０，６４０は、例えば、プレーヤーＡから受けた打撃を検出するための接触センサ６３０、及び／又は、模擬オポーネント６００からプレーヤーＡまでの距離を測定するための距離センサ６４０であり得る。距離センサ６４０は、例えば、超音波センサによって構成され得る。センサ６３０，６４０によって検出されたデータは、管理装置４００へ送信され得る。管理装置４００は、センサ６３０，６４０によって検出されたデータを用いて、模擬オポーネント６００の動作データを生成し得る。また、模擬オポーネント６００は、センサ６３０，６４０によって検出されたデータを自ら用いて動作を決定し、動作し得る。

【0047】

なお、図１では、プレーヤーＡの位置姿勢を検出するためのセンサとして、模擬オポーネント６００とは別の場所に設けられたカメラ２００が用いられているが、プレーヤーＡの位置姿勢を検出するためのセンサは、模擬オポーネント６００に設けられたセンサ６３０，６４０であってもよい。また、プレーヤーＡの検出のためのセンサは、模擬オポーネント６００外のセンサ２００及び模擬オポーネント６００に設けられたセンサ６３０，６４０の両方であってもよい。例えば、プレーヤーＡの姿勢を検出するためのセンサがカメラ２００であり、プレーヤーＡまでの距離を測定するためのセンサがセンサ６３０，６４０であってもよい。

【0048】

なお、模擬オポーネント６００に設けられたセンサ６３０，６４０によってプレーヤーＡまでの距離を求めると、模擬オポーネント６００とプレーヤーＡとの相対位置が容易に把握できる。

【0049】

また、模擬オポーネント６００外に設けられたセンサ２００の場合、適切な位置に設置されることで、プレーヤーＡ及び模擬オポーネント６００の両方を検出するのが容易となる。

【0050】

プレーヤーＡ及び操作者Ｂそれぞれは、ヘッドマウントディスプレイなどの情報提示デバイス７０１，７０２を装着し得る。情報提示デバイス７０１，７０２は、管理装置４００と通信可能であり、提示すべきデータを管理装置４００から取得し得る。管理装置４００は、模擬オポーネント６００又はプレーヤーＡの動き又は状況に応じた提示データを、情報提示デバイスに提供し得る。

【0051】

プレーヤーＡに装着される情報提示デバイス７０１は、例えば、模擬オポーネント６００に重ねてキャラクター・人物などの画像を、プレーヤーＡに提示することで、臨場感を増すことができる。また、情報提示デバイス７０１は、標的６２０のうち、プレーヤーＡが攻撃すべき部位を強調表示してもよい。また、攻撃した部位に応じて、プレーヤーＡが得られる得点・ポイントが異なるゲーム又は試合が行われる場合、情報提示デバイス７０１は、得点・ポイントごとに、標的６２０を細分化した表示を提示してもよい。

【0052】

操作者Ｂに装着される情報提示デバイス７０２は、例えば、模擬オポーネント６００の操作をガイドする表示を提示することができる。これにより、操作者Ｂによる操作が容易になる。

【0053】

図２は、制御システム１００及び模擬オポーネント６００のブロック図を示している。図２に示す制御システム１００は、位置姿勢推定器３１０を備える。位置姿勢推定器３１０は、プレーヤーＡの位置及び姿勢を推定する。位置姿勢推定器３１０は、例えば、ビジョン処理装置３００を構成する第１コンピュータ３００を位置姿勢推定器３１０として動作させるためのコンピュータプログラムが、プロセッサ３０１によって実行されることで構成される。位置姿勢推定器３１０は、プレーヤーＡを撮像したカメラ２００から出力された画像に基づいて求められる。カメラ２００から出力された画像は、例えば、動画である映像データである。なお、位置姿勢推定器３１０は、ＬｉＤＡＲセンサなどの他のセンサによってプレーヤーＡを検知したデータに基づいて、位置及び姿勢を推定してもよい。

【0054】

位置姿勢推定器３１０（姿勢推定器３１０）は、カメラ２００から取得した画像に対して、適宜の姿勢推定アルゴリズムを適用し、プレーヤーＡの姿勢を推定する。姿勢推定器３１０は、姿勢推定アルゴリズムによって、プレーヤーＡの姿勢を示す特徴点座標を求める。特徴点座標は、例えば、画像座標系における座標である。また、姿勢推定器３１０は、姿勢推定アルゴリズムによって、プレーヤーＡの姿勢の推定信頼度も求める。

【0055】

さらに、位置姿勢推定器３１０（位置推定器３１０）は、カメラ２００から取得した深度画像またはステレオカメラであるカメラ２００から取得したステレオカメラ画像から、前述の特徴点の深度（特徴点までの距離）を推定する。すなわち、ここでは、プレーヤーＡまでの距離が推定される。

【0056】

位置姿勢推定器３１０が求めた特徴点座標、推定信頼度、及び特徴点の深度は、プレーヤーＡの位置姿勢を示す第１データ又は第１学習データとして、後述の動作生成器４１０又は動作学習器４１０に与えられる。第１データ及び第１学習データは、現時点から所定期間の過去までの時系列の動画データ（画像データ）から生成され得る。この場合、第１データ及び第１学習データは、所定期間における位置姿勢の変化を示す時系列データとして得られる。この場合、第１データ及び第１学習データは、プレーヤーＡの現時点から直近の所定期間の動作を示すものとなる。

【0057】

また、図２に示す制御システム１００は、模擬オポーネント６００の位置検出器３２０を備える。位置検出器３２０は、模擬オポーネント６００の位置を検出する。位置検出器３２０は、例えば、ビジョン処理装置３００を構成する第１コンピュータ３００を位置検出器３２０として動作させるためのコンピュータプログラムが、プロセッサ３０１によって実行されることで構成される。位置検出器３２０は、模擬オポーネント６００を撮像したカメラ２００から出力された画像に基づいて求められる。なお、位置検出器３２０は、ＬｉＤＡＲセンサなどの他のセンサによって模擬オポーネント６００を検知したデータに基づいて、位置を検出してもよい。

【0058】

位置検出器３２０は、カメラ２００から取得した画像に対して、適宜の物体検出アルゴリズムを適用し、画像中の模擬オポーネント６００の位置を示す座標を求める。また、位置検出器３２０は、模擬オポーネント６００の位置を示す座標までの深度を求める。

【0059】

位置検出器３２０は、位置姿勢推定器３１０が位置姿勢推定に用いる画像と同じ画像を利用し得る。同じ画像中のプレーヤーＡ及び模擬オポーネント６００それぞれは、画像認識によって区別して認識され得る。また、プレーヤーＡ及び模擬オポーネント６００は、プレーヤーＡ及び模擬オポーネント６００それぞれを区別して認識するためのマーカを備えてもよい。

【0060】

位置検出器３２０が求めた座標及び深度は、模擬オポーネント６００の位置を示す第２データ又は第２学習データとして、後述の動作生成器４１０又は動作学習器４１０に与えられる。第２データ及び第２学習データは、現時点から所定期間の過去までの時系列の動画データ（画像データ）から生成され得る。この場合、第２データ及び第２学習データは、所定期間における模擬オポーネント６０の位置の変化を示す時系列データとして得られる。この場合、第２データ及び第２学習データは、模擬オポーネント６０の現時点から直近の所定期間の動作を示すものとなる。

【0061】

プレーヤーＡ及び模擬オポーネント６００それぞれの位置が求められることで、システム１０は、プレーヤーＡと模擬オポーネント６００との相対位置関係を把握し得る。なお、プレーヤーＡの位置が、模擬オポーネント６００に設けられたセンサによって求められる場合、求められたプレーヤーＡの位置は、プレーヤーＡと模擬オポーネント６００との相対位置関係を示すため、模擬オポーネント６００の位置は求められなくてもよい。

【0062】

動作生成器４１０は、模擬オポーネント６００の動作データを生成する。動作生成器４１０は、例えば、管理装置４００を構成する第２コンピュータ４００を動作生成器４１０として動作させるためのコンピュータプログラムが、プロセッサ４０１によって実行されることで構成される。

【0063】

動作生成器４１０は、動作データを生成するための動作生成モデル４２０を備える。動作生成モデル４２０は、機械学習モデルであり得る。実施形態に係る動作生成器４１０は、プレーヤーＡの位置姿勢を示す第１データ及び模擬オポーネント６００の位置を示す第２データが入力されると、動作データを出力する関数として定義され得る。動作データは、単に、プレーヤーＡとの距離を一定に保って移動するのではなく、プレーヤーＡとの相対的な距離を変動させるよう模擬オポーネント６００に動作指示するデータとなる。なお、第２データは省略されてもよい。すなわち、動作生成モデル４２０は、プレーヤーＡの位置姿勢を示す第１データが入力されると、動作データを出力するものであってもよい。なお、動作生成モデル４２０から出力される動作データの形式は、操作器５００から出力される動作データと同じであるのが好ましい。動作生成モデル４２０から出力される動作データは、模擬オポーネント６００の走行体６１０を移動させるほか、模擬オポーネント６００の可動部分を動作させるものであってもよい。

【0064】

動作学習器４１０は、動作生成モデル４２０の機械学習のための処理を実行する。すなわち、動作学習器４１０によって、動作生成モデル４２０が生成される。動作学習器４１０は、例えば、管理装置４００を構成する第２コンピュータ４００を動作学習器４１０として動作させるためのコンピュータプログラムが、プロセッサ４０１によって実行されることで構成される。

【0065】

動作学習器４１０は、操作器５００から出力された動作データと、その動作データに従って模擬オポーネント６００が動作しているときにおけるプレーヤーＡの位置姿勢と、を学習データとして機械学習を実行し得る。

【0066】

動作学習器４１０は、操作器５００から出力された動作データ（操作用動作データ）に基づいて模擬オポーネント６００が動作しているときにおけるプレーヤーＡの位置姿勢を示す第１学習データと、操作器５００から出力された動作データ（学習用動作データ）と、を学習データとして、機械学習を実行する。すなわち、動作学習器４１０は、プレーヤーＡの動作に応じて操作者Ｂが操作した内容を、手本となる学習データとして機械学習を実行する。操作者Ｂは、プレーヤーＡの動きに応じて模擬オポーネント６００を動作させるため、操作者Ｂの操作を学習することで、プレーヤーＡの動作に応じた適切な反射動作を生成する動作生成モデル４２０が得られる。

【0067】

動作学習器４１０が実行する機械学習は、模倣学習であり得る。動作学習器４１０は、操作者Ｂの操作内容を模倣する模倣学習を実行することができる。

【0068】

例えば、操作者Ｂは、プレーヤーＡの動きに応じて、プレーヤーＡの攻撃を避ける、プレーヤーの攻撃を受ける、プレーヤーを攻撃する、又はプレーヤーの動きを誘うフェイント動作などの反射動作を模擬オポーネント６００が行うように、操作器５００を操作する。動作学習器４１０は、このときの操作内容を手本として機械学習することで、プレーヤーＡの動きに応じた反射動作のための動作データを出力する動作生成モデル４２０を生成することができる。

【0069】

通常の対戦では、例えばプレーヤーＡが右足を上げた場合、右足での蹴りが予想される。右足の蹴りにおいては、右足が上がった後、前側に軌跡を描くことになる。したがって、プレーヤーＡの対戦相手は、その右足の蹴りを避ける場合には、右足の蹴りの軌跡から外れる動作をする。例えば、対戦相手は、左側か後方に移動して、右足の蹴りをかわす動作をすることが想定される。

【0070】

このような動作を実現するため、制御システム１００は、望ましくは、プレーヤーＡの位置および姿勢とプレーヤーＡの位置姿勢から予想される動作の意図と、を認識する。プレーヤーＡの動作の意図を早期に認識することで、制御システム１００は、その動作によって生じるプレーヤーＡの位置又は姿勢の変化を予測することができる。制御システム１００は、予測した位置又は姿勢の変化に応じた適切な行動をするよう、模擬オポーネント６００に動作指示ができることができる。

【0071】

例えば、プレーヤーＡの現在の姿勢が、右足を上げた姿勢である場合、制御システム１００は、プレーヤーＡの現在の右足を上げた姿勢から、予想される動作として「右足での蹴り」を認識する。この場合、制御システム１００は、認識された動作「右足での蹴り」から、プレーヤーＡの位置又は姿勢の変化を予測する。予測される位置又は姿勢の変化は、例えば、プレーヤーＡの右足が、蹴りのため、前側に軌跡を描くように移動することである。制御システム１００は、模擬オポーネント６００が、予測した右足の軌跡に応じた行動として、左側又は後方に移動して、右足の蹴りをかわす動作の指示をすることができる。

【0072】

動作学習器４１０は、プレーヤーＡの位置および姿勢から予想される動作を認識するようモデル４２０を生成することができる。また、動作学習器４１０は、認識した動作に応じたプレーヤーＡの位置又は姿勢の変化に応じた動作のための動作データを出力するモデル４２０を生成することができる。

【0073】

ただし、動作学習器４１０での機械学習の学習範囲に、予想される動作の認識まで含まれると、演算量が増加し、動作生成器４１０によって模擬オポーネント６０の動作データを得るまでに時間がかかるおそれがある。時間がかかると、模擬オポーネント６０のタイムリーな動作が損なわれる。そこで、図示の動作生成器４１０においては、一例として、予想される動作の認識は省略され、画像データから得られる第１データから、直接、動作データを得るよう構成されている。このように、第１データから、直接、動作データを得るエンドツーエンド学習を採用することにより、プレーヤーＡの動きに合わせたタイムリーな模擬オポーネント６０の動作が実現される。

【0074】

なお、動作生成モデル４２０の機械学習の際には、学習データとして、操作器５００から出力された動作データ（操作用動作データ）に基づいて模擬オポーネント６００が動作しているときにおける模擬オポーネント６００の位置を示す第２学習データが更に用いられてもよい。

【0075】

模擬オポーネント６００は、制御装置６１１及び駆動装置６１２を備え得る。制御装置６１１及び駆動装置６１２は、走行体６１０に設けられているのが好ましい。制御装置６１１は、模擬オポーネント６００が備える通信ユニット（図示省略）を介して、動作データを受信する。動作データは、例えば、無線通信によって送受信される。

【0076】

制御装置６１１は、受信した動作データに基づいて、駆動装置６１２を駆動する駆動信号を生成し、駆動装置６１２に与える。駆動装置６１２は、例えば、走行体６１０に設けられており、模擬オポーネント６００の走行のためのモータ等を備える。駆動装置６１２が備えるモータは、例えば、オムニホイールを回転駆動するモータであり得る。駆動装置６１２は、模擬オポーネント６００の可動部分を動作させてもよい。

【0077】

図３は、動作生成モデル４２０の機械学習時の処理の手順の一例を示している。操作者Ｂは、プレーヤーＡの動きに応じて操作器５００を適宜操作することができる（ステップＳ３１）。操作器５００から出力された動作データは、学習用操作データとして制御システム１００に与えられるとともに、操作用動作データとして模擬オポーネント６００に与えられる。模擬オポーネント６００は、与えられた操作用動作データに基づいて動作する（ステップＳ３２）。プレーヤーＡは、模擬オポーネント６００の動作に反応して、さらに動作することができる。

【0078】

制御システム１００は、模擬オポーネント６００とプレーヤーＡとの対戦中における学習用操作データの変化を示す時系列データを記憶装置４０２に保存する。

【0079】

制御システム１００は、模擬オポーネント６００とプレーヤーＡとの対戦中において、プレーヤーＡの位置姿勢を逐次推定し（ステップＳ３３）、対戦中におけるプレーヤーＡの位置姿勢の変化を示す時系列データを、記憶装置４０２に保存する。

【0080】

また、制御システム１００は、模擬オポーネント６００とプレーヤーＡとの対戦中において、模擬オポーネント６００の位置を逐次検出し（ステップＳ３４）、対戦中における模擬オポーネント６００の位置の変化を示す時系列データを記憶装置４０２に保存する。

【0081】

制御システム１００は、学習用操作データ、プレーヤーＡの位置姿勢、及び模擬オポーネント６００の位置を用いて模倣学習を実行し、動作生成モデル４２０を生成する（ステップＳ３５）。

【0082】

なお、ステッＳ３５では機械学習として模倣学習が採用されている。模倣学習は、正解データとなるエキスパートの持つ入出力関数をあらかじめ教師あり学習で学習させた結果を参照し、入力されたデータに対して追加で強化学習などの機械学習をさせることである。また、機械学習は、模倣学習の１種類だけ実行される必要はなく、複数種類の機械学習が実行されてもよい。例えば、模倣学習が実行された後に、適宜の評価指標を用いた強化学習が実行されてもよい。

【0083】

機械学習が完了すると、模擬オポーネント６００は、操作者Ｂによる操作無しで自律的に動作可能になる。図４は、模擬オポーネント６００の自律動作のための処理の手順の一例を示している。

【0084】

制御システム１００は、カメラ２００などのセンサを用いてプレーヤーＡの位置姿勢を推定する（ステップＳ４１）。また、制御システム１００は、カメラ２００などのセンサを用いて模擬オポーネント６００の位置を検出する（ステップＳ４２）。制御システム１００は、プレーヤーＡの位置姿勢及び模擬オポーネント６００の位置を示すデータを、機械学習によって得られた動作生成モデル４２０に入力する。動作生成モデル４２０は、入力されたデータに応じた動作データを出力する（ステップＳ４３）。

【0085】

制御システム１００は、動作データを模擬オポーネント６００に与える。模擬オポーネント６００は、与えられた動作に応じて動作する（ステップＳ４４）。したがって、模擬オポーネント６００は、プレーヤーＡの動きに応じた反応動作をすることができる。したがって、実施形態に係る模擬オポーネント６００は、単に、プレーヤーＡとの距離を一定に保って移動するのではなく、動作データにより、プレーヤーＡと模擬オポーネント６００との相対的な距離を変動させるよう動作することができる。このため、プレーヤーＡ又は模擬オポーネント６００は、相手との間合いを変えつつ、攻撃又は防御を行うことができる。

【0086】

なお、模擬オポーネント６００は、制御システム１００から与えられた動作データに加えて、模擬オポーネント６００自体が備えるセンサ６３０，６４０によって得られたセンサデータに基づいて動作してもよい。例えば、プレーヤーＡの攻撃を回避する場合、制御システム１００から与えられた動作データよりも、模擬オポーネント６００自体が備えるセンサ６３０，６４０によって得られたデータを優先的に用いて動作したほうが良いことがある。センサ６３０，６４０のデータを利用すると、模擬オポーネント６００は、プレーヤーＡの動きに対して迅速に応答でき、例えば、プレーヤーＡの素早い攻撃の回避動作をするなどの迅速な動きを行うのが容易になる。

【0087】

図５は、実施形態に係る模擬オポーネント６００の一例を示している。図５に示す模擬オポーネント６００は、自己復元機構を備える。自己復元機構は、起き上がりこぼしのように、転倒状態から起立状態への自己復元力を生じさせる機構である。自己復元機構は、模擬オポーネント６００の重心を低くすることによって得られる。図５に示すＣ１は、標的６２０を備える模擬オポーネント６００の重心であり、図５に示すＣ２は、標的６２０を有しない模擬オポーネント６００（すなわち、走行体６１０単体）の重心である。

【0088】

転倒状態における重心Ｃ１の位置が、起立状態における重心Ｃ１の位置よりも高くなるように模擬オポーネント６００が構成されていることで、転倒時に自己復元力が生じる。すなわち、転倒時には、高い位置にある重心Ｃ１が低い位置へ移動しようとする自己復元力が生じる。この自己復元力によって、転倒した模擬オポーネント６００は起立状態に復帰できる。したがって、模擬オポーネント６００は、プレーヤーＡから打撃などの攻撃を受けて転倒しても、元に戻ることができる。

【0089】

転倒時の重心Ｃ１を高い位置にするとともに、自己復元動作を円滑にするため、走行体６１０にはカバー６１５が設けられている。カバー６１５は、一例として、走行体６１０に設けられた３輪オムニホイールが備える３つの車輪６１３それぞれの外側を覆うように設けられている。カバー６１５によって、走行体６１０の径が大きくなる。転倒時には、カバー６１５が走行面に接し、転倒時における重心Ｃ１の位置が高くなりやすい。また、カバー６１５は、転倒状態から起立状態に復元する際に、走行面に接するように湾曲した面を有しており、起立状態への復元動作を円滑にする。さらに、カバー６１５は、車輪６１３を保護することもできる。

【0090】

本発明は、上記実施形態に限定されるものではなく、様々な変形が可能である。

【符号の説明】

【0091】

１０：模擬オポーネントシステム
１００：制御システム
２００：カメラ
３００：ビジョン処理装置（第１コンピュータ）
３０１：プロセッサ
３０２：記憶装置
３０３：通信ユニット
３１０：位置姿勢推定器（姿勢推定器・位置推定器）
３２０：位置検出器
４００：管理装置（第２コンピュータ）
４０１：プロセッサ
４０２：記憶装置
４０３：通信ユニット
４１０：動作生成器
４１０：動作学習器
４２０：動作生成モデル
５００：操作器
６００：模擬オポーネント
６１０：走行体
６１１：制御装置
６１２：駆動装置
６１３：車輪
６１５：カバー
６２０：標的
６３０：センサ
６４０：センサ
７０１：情報提示デバイス
７０２：情報提示デバイス
Ａ：プレーヤー
Ｂ：操作者
Ｃ１：重心
Ｃ２：重心

【図1】

【図2】

【図3】

【図4】

【図5】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版