IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ KDDI株式会社の特許一覧

特許7283852マルチモーダル行動認識方法、装置およびプログラム
<>
  • 特許-マルチモーダル行動認識方法、装置およびプログラム 図1
  • 特許-マルチモーダル行動認識方法、装置およびプログラム 図2
  • 特許-マルチモーダル行動認識方法、装置およびプログラム 図3
  • 特許-マルチモーダル行動認識方法、装置およびプログラム 図4
  • 特許-マルチモーダル行動認識方法、装置およびプログラム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-05-22
(45)【発行日】2023-05-30
(54)【発明の名称】マルチモーダル行動認識方法、装置およびプログラム
(51)【国際特許分類】
   G06T 7/20 20170101AFI20230523BHJP
   A63B 69/00 20060101ALI20230523BHJP
   A63B 71/06 20060101ALI20230523BHJP
【FI】
G06T7/20 300Z
A63B69/00 A
A63B69/00 509
A63B71/06 M
【請求項の数】 8
(21)【出願番号】P 2020024394
(22)【出願日】2020-02-17
(65)【公開番号】P2021128691
(43)【公開日】2021-09-02
【審査請求日】2022-02-07
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100092772
【弁理士】
【氏名又は名称】阪本 清孝
(74)【代理人】
【識別番号】100119688
【弁理士】
【氏名又は名称】田邉 壽二
(72)【発明者】
【氏名】田坂 和之
【審査官】片岡 利延
(56)【参考文献】
【文献】特開2005-270508(JP,A)
【文献】国際公開第2017/010154(WO,A1)
【文献】国際公開第2015/098251(WO,A1)
【文献】特表2015-536710(JP,A)
【文献】特表2012-510873(JP,A)
【文献】特開2012-221074(JP,A)
【文献】KDDI株式会社,5G時代を見据えた先端テクノロジー スポーツ行動認識AI×IoTボールでアスリートを育成・支援,[online],2019年10月07日,https://news.kddi.com/kddi/corporate/newsrelease/2019/10/07/4060.html
【文献】石井孝幸,KDDIのCEATECブースでサッカーのフォーム判定、センサー内蔵ボールとAIにより分析,[online],2019年10月15日,https://k-tai.watch.impress.co.jp/docs/news/1212795.html
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/20
A63B 69/00
A63B 71/06
(57)【特許請求の範囲】
【請求項1】
人物のカメラ映像および物体の挙動を検知するセンサ信号をマルチモーダル情報として行動認識を行うマルチモーダル行動認識装置において、
カメラ映像に基づいて人物の姿勢を推定する手段と、
物体の動きに応じて変化するセンサ信号を取得する手段と、
前記センサ信号に基づいて物体の挙動を推定する手段と、
前記推定した物体の挙動に基づいて、人物が接触した当該物体上の位置を推定する手段と、
時刻同期させた人物の姿勢と物体の挙動との関係および人物が接触した物体上の位置に基づいて、物体に対して接触行動する人物の姿勢と当該物体の挙動と人物が接触した物体上の位置との因果関係を認識する手段とを具備したことを特徴とするマルチモーダル行動認識装置。
【請求項2】
人物が物体に接触したタイミングを推定する手段を更に具備し、
前記因果関係を認識する手段は、人物が物体に接触したタイミングにおける人物の姿勢と当該タイミング以降の物体の挙動と人物が接触した物体上の位置との因果関係を認識することを特徴とする請求項1に記載のマルチモーダル行動認識装置。
【請求項3】
前記物体の挙動を推定する手段は、前記物体の回転方向、回転速度、移動方向、移動速度、加速度および高度の少なくとも一つを推定することを特徴とする請求項1または2に記載のマルチモーダル行動認識装置。
【請求項4】
前記センサ信号が、3軸の加速度センサ信号、3軸のジャイロセンサ信号および3軸の地磁気センサ信号のうち少なくとも一つを含むことを特徴とする請求項に記載のマルチモーダル行動認識装置。
【請求項5】
コンピュータが人物のカメラ映像および物体の挙動を検知するセンサ信号をマルチモーダル情報として行動認識を行うマルチモーダル行動認識方法において、
カメラ映像に基づいて人物の姿勢を推定し、
物体の動きに応じて変化するセンサ信号を取得し、
前記センサ信号に基づいて物体の挙動を推定し、
前記推定した物体の挙動に基づいて、人物が接触した当該物体上の位置を推定し、
時刻同期させた人物の姿勢と物体の挙動との関係および人物が接触した物体上の位置に基づいて、物体に対して接触行動する人物の姿勢と当該物体の挙動と人物が接触した物体上の位置との因果関係を認識することを特徴とするマルチモーダル行動認識方法。
【請求項6】
人物が物体に接触したタイミングを更に推定し、
人物が物体に接触したタイミングにおける人物の姿勢と当該タイミング以降の物体の挙動と人物が接触した物体上の位置との因果関係を認識することを特徴とする請求項に記載のマルチモーダル行動認識方法。
【請求項7】
人物のカメラ映像および物体の挙動を検知するセンサ信号をマルチモーダル情報として行動認識を行うマルチモーダル行動認識プログラムにおいて、
カメラ映像に基づいて人物の姿勢を推定する手順と、
物体の動きに応じて変化するセンサ信号を取得する手順と、
前記センサ信号に基づいて物体の挙動を推定する手順と、
前記推定した物体の挙動に基づいて、人物が接触した当該物体上の位置を推定する手順と、
時刻同期させた人物の姿勢と物体の挙動との関係および人物が接触した物体上の位置に基づいて、物体に対して接触行動する人物の姿勢と当該物体の挙動と人物が接触した物体上の位置との因果関係を認識する手順と、
をコンピュータに実行させるマルチモーダル行動認識プログラム。
【請求項8】
人物が物体に接触したタイミングを推定する手順を更に含み、
前記因果関係を認識する手順では、人物が物体に接触したタイミングにおける人物の姿勢と当該タイミング以降の物体の挙動と人物が接触した物体上の位置との因果関係を認識することを特徴とする請求項に記載のマルチモーダル行動認識プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、マルチモーダル情報に基づいてユーザの行動を認識する方法、装置およびプログラムに係り、特に、カメラ画像から推定した人物の姿勢および当該人物が取り扱う物体の挙動をマルチモーダル情報として行動認識を行うマルチモーダル行動認識方法、装置およびプログラムに関する。
【背景技術】
【0002】
特許文献1には、姿勢推定装置のプロセッサがスポーツ映像中に存在する選手の姿勢を推定する方法として、ユーザによって入力された情報に基づいて得られる情報であって、推定対象の試合のスポーツ映像中に存在する特定選手の関節位置を指定する参照姿勢情報を受け取り、参照姿勢情報を用いて、推定対象のスポーツ映像中に存在する特定選手以外の選手である推定対象選手の姿勢を推定する技術が開示されている。
【0003】
特許文献2には、ゴルフスイング中のゴルファーの関節がヘッドスピードに与える影響を算出するために、ゴルファーによるクラブのスイング中のゴルファーの身体の所定部位の位置座標データおよびクラブの所定部位の位置座標データを取得し、スイング中のゴルファーの地面反力データを取得し、ゴルファーの身体の所定部位の位置座標データおよびクラブの所定部位の位置座標データと、取得された地面反力データと、剛体リンクモデルとに基づき、ゴルファーの関節ごとの関節トルクを算出し、算出されたゴルファーの関節ごとの関節トルクおよびスイング中のゴルファーの動作により生じた力の、クラブのヘッドスピードに対する寄与をゴルファーの関節ごとに算出する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特許6589144号公報
【文献】特開2019-110990号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献2は、ゴルフクラブの挙動(クラブのヘッドスピード)をゴルファーの姿勢(関節トルク)と関連付けて分析するが、ゴルファーはゴルフクラブをスイングの開始から終了まで保持し続ける。そのため、ゴルファーがゴルフクラブに接触した(グリップを握った)タイミングにおけるゴルファーの姿勢や接触位置といった接触行動の態様が、その後のスイングに与える影響は無視できてしまう。
【0006】
これに対して、サッカーや野球のようなボール競技では、プレーヤがボールに接触行動したときの姿勢やボールへの接触位置に応じてボールの挙動が変化し、ゲーム展開に大きな影響を与える。したがって、人物の姿勢と物体の挙動との関係を接触行動の態様と関連付けて認識することが重要となる。
【0007】
本発明の目的は、上記の技術課題を解決し、人物の姿勢と物体の挙動との関係を人物の物体に対する接触行動の態様と関連付けて認識するマルチモーダル行動認識方法、装置およびプログラムを提供することにある。
【課題を解決するための手段】
【0008】
上記の目的を達成するために、本発明は、人物のカメラ映像および物体の挙動を検知するセンサ信号をマルチモーダル情報として行動認識を行うマルチモーダル行動認識装置において、以下の構成を具備した点に特徴がある。
【0009】
(1) カメラ映像に基づいて人物の姿勢を推定する手段と、物体の動きに応じて変化するセンサ信号を取得する手段と、前記センサ信号に基づいて物体の挙動を推定する手段と、時刻同期させた人物の姿勢と物体の挙動との関係に基づいて、物体に対して接触行動する人物の姿勢と当該物体の挙動との因果関係を認識する手段とを具備した。
【0010】
(2) 人物が物体に接触したタイミングを推定する手段を更に具備し、人物が物体に接触したタイミングにおける人物の姿勢と当該タイミング以降の物体の挙動との因果関係を認識するようにした。
【0011】
(3) 人物が接触した物体上の位置を推定する手段を更に具備し、人物の姿勢、物体の挙動および人物が接触した物体上の位置の因果関係を認識するようにした。
【0012】
(4) 人物が物体に接触したタイミングを推定する手段と、人物が接触した物体上の位置を推定する手段とを更に具備し、人物が物体に接触したタイミングにおける人物の姿勢、当該タイミング以降の物体の挙動および人物が接触した物体上の位置の因果関係を認識するようにした。
【発明の効果】
【0013】
本発明によれば、以下のような効果が達成される。
【0014】
(1) 時刻同期させた人物の姿勢と物体の挙動との関係に基づいて、物体に対して接触行動する人物の姿勢と当該物体の挙動との因果関係を認識するので、サッカーや野球のように、プレーヤがボールに接触行動したときの姿勢やボールへの接触位置等の態様に応じてボールの挙動が変化し、ゲーム展開に大きな影響を与える分野の行動認識において、人物の姿勢と物体の挙動との関係を接触行動の態様と関連付けて認識できるようになる。
【0015】
(2) 人物が物体に接触したタイミングを推定し、人物が物体に接触したタイミングにおける人物の姿勢と当該タイミング以降の物体の挙動との因果関係を認識するようにしたので、人物の姿勢と物体の挙動との関係が、人物が物体に接触したタイミングTに依存する場合に、人物が物体に接触したタイミングTにおける人物の姿勢と当該タイミング以降の物体の挙動との因果関係を認識できるようになる。
【0016】
(3) 人物が接触した物体上の位置を推定し、人物の姿勢、物体の挙動および人物が接触した物体上の位置の因果関係を認識するようにしたので、人物の姿勢と物体の挙動との関係が、人物が接触した物体上の位置Pに依存する場合に、人物の姿勢、物体の挙動および人物が接触した物体上の位置Pの因果関係を認識できるようになる。
【0017】
(4) 人物が物体に接触したタイミング、および人物が接触した物体上の位置を推定し、人物が物体に接触したタイミングにおける人物の姿勢、当該タイミング以降の物体の挙動および人物が接触した物体上の位置の因果関係を認識するようにしたので、人物の姿勢と物体の挙動との関係が、人物が物体に接触したタイミングTおよび人物が接触した物体上の位置Pのいずれにも依存する場合にも、人物が物体に接触したタイミングTにおける人物の姿勢、当該タイミング以降の物体の挙動および人物が接触した物体上の位置Pの因果関係を認識できるようになる。
【図面の簡単な説明】
【0018】
図1】本発明が適用される行動認識システムの構成を示した図である。
図2】サッカーボールに内蔵されたセンサシステムの機能ブロック図である。
図3】マルチモーダル行動認識システムの機能ブロック図である。
図4】インサイドキックのタイミングにおける姿勢推定の結果を示した図である。
図5】本発明を適用したマルチモーダル行動認識手順のフローチャートである。
【発明を実施するための形態】
【0019】
以下、図面を参照して本発明の実施の形態について詳細に説明する。図1は、本発明が適用される行動認識システムの構成を示した図であり、カメラ画像に基づいて推定した人物の姿勢、および検知した物体の挙動、をマルチモーダル情報として処理し、物体に接触行動する人物の姿勢と当該物体の挙動との因果関係を認識する。
【0020】
本実施形態では、人物の姿勢およびサッカーボールの挙動を推定し、人物がサッカーボールに対して接触行動したときの姿勢とその後のサッカーボールの挙動との因果関係を認識する場合を例にして説明する。
【0021】
マルチモーダル行動認識システムは、カメラおよび通信機能を備えたローカル端末1と、各種の動きセンサおよび通信機能を内蔵してローカル端末1等へセンサ信号を送信する物体2と、ローカル端末1と例えばWi-Fi、無線基地局BSおよびネットワークNW経由で通信し、ローカル端末1から取得した情報に基づいてマルチモーダル行動認識を実行する行動認識サーバ3とを主要な構成としている。なお、ローカル端末1の処理能力が十分に高く、ローカル端末1のみでマルチモーダル行動認識を実行できれば行動認識サーバ3は省略しても良い。
【0022】
図2は、前記サッカーボール2に内蔵されたセンサシステム20の構成を示した機能ブロック図であり、3軸加速度センサ201、3軸ジャイロセンサ202、3軸磁気センサ203および各センサの出力信号を処理する制御部204、各センサおよび制御部204に電力を供給するバッテリ205ならびにBluetooth(登録商標)等の無線通信インタフェース206を主要な構造としている。
【0023】
前記各センサ201,202,203により所定のサンプリング周期で計測された3軸方向の加速度、3軸方向の角速度および3軸方向の地磁気は、その計測時刻情報と共にリアルタイムあるいは一時記憶された後に一括して、無線通信インタフェース206からローカル端末1等へ送信される。
【0024】
図3は、前記ローカル端末1および行動認識サーバ3が協働して実現するマルチモーダル行動認識システム100の主要部の構成を示した機能ブロック図であり、カメラ101、人物領域抽出部102、関節点抽出部103、姿勢推定部104、センサ信号取得部105、挙動推定部106、接触態様推定部107および行動認識部108を主要な構成としている。各構成はローカル端末1および行動認識サーバ3に分散して実装しても良いし、ローカル端末1のみに実装しても良い。
【0025】
このようなローカル端末1および行動認識サーバ3は、CPU、メモリ、インタフェースおよびこれらを接続するバス等を備えた汎用のコンピュータやモバイル端末に、後述する各機能を実現するアプリケーション(プログラム)を実装することで構成できる。あるいは、アプリケーションの一部をハードウェア化またはプログラム化した専用機や単能機としても構成できる。本実施形態では、ローカル端末1をスマートフォンやタブレット端末で代用する場合を例にして説明する。
【0026】
カメラ101は、物体(本実施形態では、サッカーボール)2に接触する人物の動画を撮影し、そのカメラ画像をフレーム単位で出力する。人物領域抽出部102は、カメラ映像の各フレーム画像から人物領域を抽出する。人物領域の抽出には、例えばSSD (Single Shot Multibox Detector) を用いることができる。
【0027】
関節点抽出部103は、フレーム画像の人物領域から、予め抽出対象として登録されている関節点を抽出する。関節点の抽出には既存の関節点抽出技術 (Cascaded Pyramid Network) を用いることができる。姿勢推定部104は、抽出した関節点に基づいて人物の姿勢を推定する。
【0028】
センサ信号取得部105は、人物が取り扱う物体2に実装されたセンサシステム20から、その動きに応じて変化するセンサ信号を取得する。本実施形態では、物体2から加速度センサ信号、モーションセンサ信号および地磁気センサ信号を取得する。
【0029】
挙動推定部106は、前記センサ信号取得部105が取得したセンサ信号に基づいて物体の挙動を推定する。回転方向検知部106aは物体の回転方向を検知する。回転速度検知部106bは物体の回転速度を検知する。移動方向検知部106cは物体の移動方向を検知する。移動速度検知部106dは物体の移動速度を検知する。加速度検知部106eは物体の加速度を検知する。高度検知部106fは物体の高度を検知する。
【0030】
接触態様推定部107は、接触タイミング推定部107aおよび接触位置推定部107bを含む。接触タイミング推定部107aは、物体2の動きに基づいて人物が当該物体2に接触したタイミングTを推定する。本実施形態では、人物がサッカーボール2をキックしたタイミングを推定する。接触位置推定部107bは、物体2の挙動に基づいて人物が接触した物体上の位置Pを推定する。本実施形態では、人物が蹴ったサッカーボール上の位置を推定する。なお、前記接触位置Pには人物が物体に接触した際の当該人物の部位の位置を含めてもよい。
【0031】
行動認識部108は、時刻同期部108a、接触時姿勢推定部108bおよび姿勢/接触関係認識部108cを含み、前記接触位置P、前記接触タイミングT以降のサッカーボールの挙動および前記接触タイミングTにおける人物の姿勢に基づいて、当該人物の姿勢とサッカーボール2の挙動との因果関係を認識する。
【0032】
前記時刻同期部108aは、人物の姿勢推定時刻と物体の挙動推定時刻とを同期させる。前記接触時姿勢推定部108bは、人物が物体に接触した接触タイミングTにおける人物の姿勢を推定する。本実施形態では、人物がサッカーボール2を蹴ったときの姿勢が推定される。姿勢/接触関係認識部108cは、人物がサッカーボール2に接触したタイミングTにおける人物の姿勢、当該タイミングT以降の物体の挙動および人物が接触した物体上の位置Pの因果関係を認識する。
【0033】
図4は、インサイドキックの接触タイミング(キックタイミング)におけるプレーヤの姿勢推定の結果を示した図であり、人物の右足FRの姿勢(指先と踵とを結ぶ骨格Fsで代表できる)が地面に対して略平行となっており、骨格FSの中心位置でボールと接触している。
【0034】
このとき、接触位置(キック位置)がボール側面やや上部かつ骨格FSの中心位置と推定され、接触タイミング以降のボールの挙動として、滑りの無い順回転が推定されていれば、右足FRが地面に対して略平行となる姿勢でサッカーボール2の側面やや上部をキックすることが好ましいインサイドキックの方法であると認識できる。
【0035】
これに対して、接触位置はサッカーボール2の側面やや上部かつ骨格FSの中心位置と推定されるが、プレーヤの右足FRが地面に対して略平行ではなく、接触タイミング以降のボールの挙動に滑りや逆回転が含まれると推定されると、右足FRが地面に対して略平行とならない姿勢でのインサイドキックは、たとえキック位置が適正であっても望ましいインサイドキックではないと認識できる。
【0036】
図5は、本発明を適用したマルチモーダル行動認識の手順を示したフローチャートであり、ステップS1では、フレーム画像ごとに人物の姿勢が関節点に基づいて推定される。ステップS2では、サッカーボール2から、その動きに応じて変化するセンサ信号が取得される。ステップS3では、サッカーボール2から取得したセンサ信号に基づいて人物のボール2に対する接触タイミングTおよび接触位置Pが推定される。
【0037】
ステップS4では、当該接触タイミングT以降のボールの挙動が、サッカーボール2から取得したセンサ信号の時系列に基づいて推定される。本実施形態では、サッカーボール2の回転方向、回転速度、移動方向、移動速度、加速度、高度に基づいてサッカーボール2の挙動が推定される。
【0038】
ステップS5では、前記接触タイミングTにおける人物の姿勢(キック姿勢)、キック位置Pおよびキック後のボールの挙動に基づいて、人物のキック姿勢とその後のボールの挙動との因果関係が認識される。
【0039】
本実施形態によれば、サッカーや野球のように、プレーヤがボールに接触行動したときの姿勢やボールへの接触位置等の態様に応じてボールの挙動が変化し、ゲーム展開に大きな影響を与える分野の行動認識において、人物の姿勢と物体の挙動との関係を接触行動の態様と関連付けて認識できるようになる。
【0040】
なお、上記の実施形態ではインサイドキックにおける人物の姿勢と物体の挙動との因果関係を、キックする足の姿勢と関連付けて認識するものとして説明したが、本発明はこれのみに限定されるものではなく、他の骨格の姿勢と対応付けてもよい。
【0041】
また、上記の実施形態ではパスを行う人物の姿勢とボールの挙動との因果関係を認識するものとして説明したが、パスを受ける人物の姿勢とボールの挙動との因果関係を認識するようにしても良い。
【0042】
さらに、上記の実施形態では人物がボールに直接接触する場合を例にして説明したが、実質的に人物と一体化している用具(バット、スティック、ゴルフクラブ等)がボールに接触する場合にも同様に適用できる。
【0043】
一方、上記の実施形態では、人物が物体に接触したタイミングTおよび人物が接触した物体上の位置Pを推定し、人物が物体に接触したタイミングTにおける人物の姿勢、当該タイミング以降の物体の挙動および人物が接触した物体上の位置Pの因果関係を認識するものとして説明したが、本発明はこれのみに限定されるものではない。
【0044】
例えば、人物の姿勢と物体の挙動との関係が、人物が接触した物体上の位置に依存せず、人物が物体に接触したタイミングTのみに依存するのであれば、前記接触位置推定部107bを省略し、前記行動認識部108は、人物が物体に接触したタイミングTにおける人物の姿勢と当該タイミング以降の物体の挙動との因果関係を認識するようにしても良い。
【0045】
さらに、人物の姿勢と物体の挙動との関係が、人物が物体に接触したタイミングTに依存せず、人物が接触した物体上の位置Pのみに依存するのであれば、前記接触タイミング推定部107aを省略し、前記行動認識部108は、人物の姿勢、物体の挙動および人物が接触した物体上の位置Pの因果関係を認識するようにしても良い。
【0046】
さらに、人物の姿勢と物体の挙動との関係が、人物が物体に接触したタイミングTおよび人物が接触した物体上の位置Pのいずれにも依存しないのであれば、前記接触タイミング推定部107aおよび接触位置推定部107bをいずれも省略し、前記行動認識部108は、人物の姿勢と物体の挙動と因果関係のみを認識するようにしても良い。
【符号の説明】
【0047】
1…ローカル端末,2…サッカーボール,3…行動認識サーバ,101…カメラ,102…人物領域抽出部,103…関節点抽出部,104…姿勢推定部,105…センサ信号取得部,106…挙動推定部,107…接触態様推定部,108…行動認識部,201…3軸加速度センサ,202…3軸ジャイロセンサ,203…3軸地磁気センサ,204…制御部,205…バッテリ,206…無線通信インタフェース
図1
図2
図3
図4
図5