IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧 ▶ 学校法人 工学院大学の特許一覧

特開2024-80233学習用データ作成装置、学習用データ作成方法、およびプログラム
<>
  • 特開-学習用データ作成装置、学習用データ作成方法、およびプログラム 図1
  • 特開-学習用データ作成装置、学習用データ作成方法、およびプログラム 図2
  • 特開-学習用データ作成装置、学習用データ作成方法、およびプログラム 図3
  • 特開-学習用データ作成装置、学習用データ作成方法、およびプログラム 図4
  • 特開-学習用データ作成装置、学習用データ作成方法、およびプログラム 図5
  • 特開-学習用データ作成装置、学習用データ作成方法、およびプログラム 図6
  • 特開-学習用データ作成装置、学習用データ作成方法、およびプログラム 図7
  • 特開-学習用データ作成装置、学習用データ作成方法、およびプログラム 図8
  • 特開-学習用データ作成装置、学習用データ作成方法、およびプログラム 図9
  • 特開-学習用データ作成装置、学習用データ作成方法、およびプログラム 図10
  • 特開-学習用データ作成装置、学習用データ作成方法、およびプログラム 図11
  • 特開-学習用データ作成装置、学習用データ作成方法、およびプログラム 図12
  • 特開-学習用データ作成装置、学習用データ作成方法、およびプログラム 図13
  • 特開-学習用データ作成装置、学習用データ作成方法、およびプログラム 図14
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024080233
(43)【公開日】2024-06-13
(54)【発明の名称】学習用データ作成装置、学習用データ作成方法、およびプログラム
(51)【国際特許分類】
   A61B 5/107 20060101AFI20240606BHJP
   G06T 7/70 20170101ALI20240606BHJP
   G06T 7/00 20170101ALI20240606BHJP
【FI】
A61B5/107 300
G06T7/70 Z
G06T7/00 350B
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2022193258
(22)【出願日】2022-12-02
(71)【出願人】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(71)【出願人】
【識別番号】501241645
【氏名又は名称】学校法人 工学院大学
(74)【代理人】
【識別番号】100121706
【弁理士】
【氏名又は名称】中尾 直樹
(74)【代理人】
【識別番号】100128705
【弁理士】
【氏名又は名称】中村 幸雄
(74)【代理人】
【識別番号】100147773
【弁理士】
【氏名又は名称】義村 宗洋
(72)【発明者】
【氏名】松村 聖司
(72)【発明者】
【氏名】西條 直樹
(72)【発明者】
【氏名】柏野 牧夫
(72)【発明者】
【氏名】三上 弾
(72)【発明者】
【氏名】山口 貴善
【テーマコード(参考)】
4C038
5L096
【Fターム(参考)】
4C038VA04
4C038VB31
4C038VC05
5L096AA02
5L096AA06
5L096CA02
5L096FA66
5L096FA69
5L096KA04
(57)【要約】
【課題】ヒトの関節位置が把握しづらい衣服を着装している場合であっても、精度の良い姿勢推定をするための学習用データを作成する。
【解決手段】入力部は、所定部位に光源2を着装し、かつ、光源2の光の少なくとも一部が透過するウェア3を着装した被験者Xの動作を撮影したものであって、光源2の点灯制御中に一の撮影で取得された動画フレームaを入力として受け付ける。画像作成部20は、動画フレームaから、光源2の点灯時動画M1と消灯時動画M2とを作成する。座標取得部30は、点灯時動画M1から、画像フレーム毎に時系列の座標データZを取得する。データセット作成部40は、点灯時動画M1と、消灯時動画M2と、座標データZとを用いて学習用データを作成する。
【選択図】図3
【特許請求の範囲】
【請求項1】
姿勢推定モデルを作成するための学習用データ作成装置であって、
複数の所定部位に光源を着装し、かつ、前記光源の光の少なくとも一部が透過するウェアを前記光源の夫々を覆って着装した被験者の動作を撮影した動画フレームであって、前記光源の点灯の制御中に一の撮影で取得された前記動画フレームを入力として受け付ける入力部と、
前記動画フレームから、前記光源が点灯している映像の点灯時動画と、前記光源が点灯していない映像の消灯時動画とを作成する画像作成部と、
前記点灯時動画に録画されている前記光源の映像から、画像フレーム毎に時系列の座標データを取得する座標取得部と、
前記点灯時動画と、前記消灯時動画と、前記座標データとを用いてデータセットである学習用データを作成するデータセット作成部と、
を有する学習用データ作成装置。
【請求項2】
前記光源は可視光LEDであり、
前記ウェアは、少なくとも可視光を透過するものであり、
前記光源の点灯の制御とは、所定間隔で前記光源の夫々を点滅させる制御であり、
前記画像作成部は、
前記動画フレームから静止画を抽出し、前記光源の点灯時の静止画である点灯時画像と、前記光源の消灯時の静止画である消灯時画像とに分類する画像分類部と、
前記点灯時画像の各画像を時系列に集めて前記点灯時動画とし、前記消灯時画像の各画像を時系列に集めて前記消灯時動画とする動画作成部と、からなる、
請求項1に記載の学習用データ作成装置。
【請求項3】
前記光源は赤外光LEDであり、
前記ウェアは、可視光は透過しないが赤外光は透過する材質からなり、
前記光源の点灯の制御とは、少なくとも前記被験者の動きを撮影している間は、前記光源を常時点灯させる制御であり、
前記動画フレームは、赤外光カメラにより撮影された第1動画フレームと、赤外光カットフィルタを介してRGBカメラにより撮影された第2動画フレームからなり、
前記画像作成部は、
前記第1動画フレームと、前記第2動画フレームとを判別する画像判別部と、
前記第1動画フレームから前記点灯時動画を作成し、前記第2動画フレームから前記消灯時動画を作成する動画作成部と、からなる、
請求項1に記載の学習用データ作成装置。
【請求項4】
前記光源は赤外光LEDであり、
前記ウェアは、可視光は透過しないが赤外光は透過する材質からなり、
前記光源の点灯の制御とは、所定間隔で前記光源の夫々を点滅させる制御であり、
前記動画フレームは、近赤外まで撮影可能であって、撮影対象の輝度の変化を検知して動画フレームを作成するイベントカメラを用いて録画されたものであり、
前記画像作成部は、
前記動画フレームから、複数の静止画を抽出し、前記赤外光LEDが点灯している間の画像のみを対象として時系列で蓄積して前記点灯時動画を作成する点灯動画作成部と、
前記複数の静止画のうち、前記赤外光LEDが点灯している間の画像を対象から外し、その他の静止画を対象として時系列で蓄積して前記消灯時動画を作成する消灯動画作成部と、からなる、
請求項1に記載の学習用データ作成装置。
【請求項5】
姿勢推定モデルを作成するための学習用データ作成装置による学習用データ作成方法であって、
複数の所定部位に光源を着装し、かつ、前記光源の光の少なくとも一部が透過するウェアを前記光源の夫々を覆って着装した被験者の動作を撮影した動画フレームであって、前記光源の点灯の制御中に一の撮影で取得された前記動画フレームを、入力部が入力として受け付けし、
画像作成部が、前記動画フレームから前記光源が点灯している映像の点灯時動画と、前記光源が点灯していない映像の消灯時動画とを作成し、
座標取得部が、前記点灯時動画に録画されている前記光源の映像から、画像フレーム毎に時系列の座標データを取得し、
データセット作成部が、前記点灯時動画と、前記消灯時動画と、前記座標データとを用いてデータセットである学習用データを作成する、
学習用データ作成方法。
【請求項6】
請求項1から4のいずれかに記載の学習用データ作成装置をコンピュータに機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、人(ヒト)の姿勢データの作成に関する技術である。
【背景技術】
【0002】
コンピュータービジョンを用いたヒトの姿勢推定は、ヒトの動きの映像を、姿勢推定用の学習済モデルに入力することにより、ヒトの姿勢の推定結果を出力する。出力される推定結果としては、例えばヒトの各関節位置を線でつないだ人型モデル(ヒトの姿勢モデル)が出力される。ヒトの姿勢推定は、市販の機器で撮影された動画や静止画を用いて行うことができることから近年広く普及しており、アルゴリズム及び学習済モデルが公開されているケースもある(例えば、非特許文献1参照)。
【0003】
姿勢推定用の学習済モデルを作成するにあたり、学習用データが必要となる。学習用データ(ヒトの姿勢データ)の作成においては、被験者の動きを撮影し、画像上に映っているヒトの関節の位置を正確に特定する必要がある。そのため、スキーウェアのように外見からでは体のラインが把握しづらい、いわゆるルーズなウェア(以下、「ルーズウェア」ともいう。)を被験者に着装させた場合と、薄い生地であって肌に密着しているために、外見からでも体のラインが把握し易い、いわゆるタイトなウェア(以下、「タイトウェア」ともいう。)を着装させた場合や、裸体の場合とでは、関節位置の特定の容易さが大きく異なる。ルーズウェアを着装させた場合、通常、関節の位置を直接確認することができない。一手法として、正確な位置を入力する正解データ作成者に、推測で関節位置を入力させることが考えられるが、その精度は不明あるいは不安定なものとなりうる。
【0004】
つまり、既存の学習済モデルを利用した姿勢推定では、学習段階で、ルーズウェアを着装した状態での学習データが含まれない、あるいはそのような学習データが含まれていたとしても関節位置の精度が高くないこと考えられる。したがって、ルーズウェアを着装した場合における既存の学習済モデルを利用した姿勢推定は、関節位置推定精度が低いと考えられる。
【0005】
ルーズウェアを着装した場合の関節位置をより正確に把握するため、同一の被験者に、タイトウェアを着装させた場合と、ルーズウェアを着装させた場合の2つの場合において、当該被験者に同じ動作をさせて同じ角度(画角)で撮影する方法がある。タイトウェア着装時の動画から得られた関節位置に、ルーズウェア着装時の動画を対応付けることにより、ルーズウェア着装時の関節位置をより正確に把握する(例えば、非特許文献2、及び非特許文献3参照)。
【0006】
また、ヒトの部位の特定技術としては、アクティブマーカ方式のモーションキャプチャ装置がある(例えば、非特許文献4、及び非特許文献5参照。)。
【先行技術文献】
【非特許文献】
【0007】
【非特許文献1】PoseNethttps://www.tensorflow.org/lite/examples/pose_estimation/overview?hl=ja
【非特許文献2】Automatic Human Pose Annotation for Loose-fitting Clotheshttp://www.mva-org.jp/Proceedings/2019/papers/02-17.pdf
【非特許文献3】和装人物の単視点姿勢推定のための遮蔽部位3次元位置推定https://shohei.nobuhara.org/pdf/%E6%A2%B6%E5%8E%9F%E9%81%BC2018.pdf
【非特許文献4】NDIhttps://www.ndigital.com/products/legacy-products/
【非特許文献5】使いごこち快適OPTOTRAKhttps://www.jstage.jst.go.jp/article/sobim/32/4/32_4_247/_pdf
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかし、非特許文献2、あるいは非特許文献3の技術を利用した場合には、たとえ同一の被験者であったとしても、完全に同じ動作を繰り返すことは難しい。このため、タイトウェア着装時の動作と、ルーズウェア着装時の動作とが完全に一致しているとは限らず、ルーズウェア着装時の関節位置の正確な位置(真値)を得られているとは限らないという課題があった。また、非特許文献4あるいは非特許文献5の技術は、部位の特定技術の一手法に過ぎず、必ずしもルーズウェア着装時のような外観からでは体のラインを把握しづらい場合における関節位置の真値を得られる技術ではなかった。
【0009】
そこで、本開示は、上記課題を解決するためになされたものであり、ルーズウェアなどのヒトの関節位置が把握しづらい衣服(ウェア)を着装している場合であっても、精度の良い姿勢推定をするための学習用データを作成する技術を提供することを目的とする。
【課題を解決するための手段】
【0010】
上記課題を解決するために、本開示の一態様の学習用データ作成装置は、姿勢推定モデルを作成するための学習用データ作成装置であって、入力部と、画像作成部と、座標取得部と、データセット作成部とを有する。入力部は、複数の所定部位に光源を着装し、かつ、光源の光の少なくとも一部が透過するウェアを光源の夫々を覆って着装した被験者の動作を撮影した動画フレームであって、光源の点灯の制御中に一の撮影で取得された動画フレームを入力として受け付ける。画像作成部は、動画フレームから、光源が点灯している映像の点灯時動画と、光源が点灯していない映像の消灯時動画とを作成する。座標取得部は、点灯時動画に録画されている光源の映像から、画像フレーム毎に時系列の座標データを取得する。データセット作成部は、点灯時動画と、消灯時動画と、座標データとを用いてデータセットである学習用データを作成する。
【発明の効果】
【0011】
本開示によれば、学習用データYは、被験者Xの所定部位の動きを反映した点灯時動画M1と、被験者Xの動きを反映した消灯時動画M2と、点灯時動画M1の時系列の座標データが反映された座標データZとからなるデータセットとして構成されており、これらは、同一の一の撮影(1回の撮影)で得られた動画フレームを元に作成される。したがって、同一の動作から作成されるものであることから、被験者がヒトの関節位置が把握しづらい衣服(ウェア)を着装している場合であっても、精度の良い姿勢推定をするための学習用データを作成することができる。
【図面の簡単な説明】
【0012】
図1図1は第1の実施の形態に係る学習用データ作成システムの機能構成例を示した図である。
図2図2は第1の実施の形態に係る動画作成方法の処理フロー例を示した図である。
図3図3は第1の実施の形態に係る学習用データ作成装置の機能構成例を示した図である。
図4図4は第1の実施の形態に係る学習用データ作成装置の学習用データ作成方法の処理フロー例を示した図である。
図5図5は第2の実施の形態に係る学習用データ作成システムの機能構成例を示した図である。
図6図6は第2の実施の形態に係る学習用データ作成システムの他の機能構成例を示した図である。
図7図7は第2の実施の形態に係る学習用データ作成装置の機能構成例を示した図である。
図8図8は第2の実施の形態に係る学習用データ作成装置の学習用データ作成方法の処理フロー例を示した図である。
図9図9は第3の実施の形態に係る学習用データ作成システムの機能構成例を示した図である。
図10図10は第3の実施の形態に係る学習用データ作成装置の機能構成例を示した図である。
図11図11は第3の実施の形態及に係る学習用データ作成装置の学習用データ作成方法の処理フロー例を示した図である。
図12図12は学習用データ作成装置の変形例における機能構成例を示した図である。
図13図13は学習用データ作成装置の変形例における学習用データ作成方法の処理フロー例を示した図である。
図14図14はコンピュータの機能構成を例示する図である。
【発明を実施するための形態】
【0013】
以下、図を用いて本開示の実施の形態について詳細に説明する。おな、以下、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
【0014】
<第1の実施の形態>
本開示の第1の実施の形態に係る学習用データ作成システム1は、被験者Xの動きを撮影し、得られた動画フレームaから、姿勢推定モデルを作成するための学習用データYを作成するシステムである。学習用データ作成システム1は、図1に示すように、光源2と、ウェア3と、光源2の点灯を制御する制御部4と、カメラ5と、学習用データ作成装置6から構成される。学習用データ作成システム1の処理フローは、被験者X(図1では点線で示す。)の動きの動画フレームaを作成する「動画作成工程」と、動画フレームaを用いて学習用データYを作成する「学習用データ作成工程」の2つの工程から構成される。
【0015】
<<動画作成工程>>
本実施形態における動画作成工程は、図1に示した光源2と、ウェア3と、制御部4と、カメラ5とを用いて、被験者Xの協力を得る。これらが、図2に示した処理フローを実施することにより、本実施形態に係る動画作成方法が実現される。以下、図1図2とを用いて本実施形態における動画作成方法を説明する。
【0016】
はじめに、図1に示すように、学習用データY作成のための測定対象である被験者Xに対し、所定の部位に光源2を貼り付ける(着装する)(ステップS2)。光源2の貼り付け箇所である所定部位としては、肩、肘、手首、腰、膝、足首などの関節位置が挙げられる。後述するウェア3が頭部や顔などを覆うことができるフードを有している場合には、光源2を、例えば、首や耳の位置にも貼り付けてもよい。本実施形態の光源2には可視光LEDを用いる。図1には、表示されている6つの光源2を識別できるように2、2、…、2と、添え字を付している。図1に示した被験者Xには、被験者Xの右側に当たる関節位置に光源2を貼り付けているが、データの作成方法に合わせて、被験者Xの左側に当たる関節位置や、左右双方の関節位置に光源2を貼り付けてもよい。
【0017】
次に、被験者Xにウェア3を着装させる(ステップS3)。ウェア3は、光源2の光の少なくとも一部が透過する材質から構成された衣服である。本実施形態に用いるウェア3は、少なくとも可視光を透過する材質からなる。ウェア3は、例えば、半透明な材質から構成されたレインウエア、麻あるいはポリエステルで構成された薄手の衣服などである。なお、ウェア3は、少なくとも可視光を透過するように構成されていればよく、半透明や薄手であることは必須ではない。例えば、織られた糸の間から可視光が透過するように緩く織られた素材で構成されていてもよい。被験者Xには、光源2を所定部位に貼り付けた状態において、光源2の上から光源2を覆うようにウェア3を着装してもらう。上述のフード付きのウェア3の場合には、頭部(もしくは顔)に付した光源2も覆うように着装してもらう。ウェア3は、タイトウェアのように被験者Xの体形に密着した構成としてもよいし、ルーズウェアのように密着していない構成としてもよい。
【0018】
次に、制御部4により光源2の点灯を制御する(ステップS4)。本実施形態における制御部4による光源2の点灯の制御とは、所定間隔で光源2の夫々を点滅させる制御である。具体的には、例えば、点灯を10msec、消灯を23.33msecとした点消灯の1周期を33.33msecとして、当該周期を固定して光源2を点滅させる制御である。周期長は上述の例に限られず、後述するカメラ5のフレームレートとの関係で適宜調整してもよい。光源2自体が、所望の周期の点消灯を繰り返す機能を有していれば、必ずしも制御部4を別途設けなくてもよい。また、所望の動画フレームaが取得できれば、制御部4による点消灯の周期調整は行わず、後述するカメラ5のフレームレートのみを調整するように構成してもよい。
【0019】
次に、被験者Xに所定の動作をしてもらい、当該動作を、被験者Xから距離L1離れた場所に配置されたカメラ5にて撮影して動画フレームaを取得する(ステップS5)。本実施形態におけるカメラ5は、例えば240fps、480fps、960fpsなどのフレームレートで動画撮影が可能なハイフレームレートカメラである。
【0020】
例えば、制御部4による光源2の点消灯の周期を上述の33.33msecとした場合、カメラ5のフレームレートを240fpsに設定して撮影すると、1フレームあたり約4.167msecとなる。即ち、光源2の1周期を撮影するには、8フレームが必要となる。光源2が点灯中のフレームと消灯中のフレームを1つずつ取り出してつなげると、30(240/8)周期分の点灯中のシーケンス(編集データ)と消灯中のシーケンスが得られることとなる。実際は、点灯状態から消灯状態への遷移があることから、240fpsでは最大2フレームのズレが生じ得る。例えば、被験者Xが垂直飛びをした場合に、点灯状態における一番高い位置と、消灯状態における一番高い位置とではその位置が異なる場合が生じうる。この差異が最大2フレームのズレに当たる。このズレはヒトの一般的な動作に対しては十分に許容できる場合が多く、実用に耐えうる。但し、例えば高速の動作などの撮影により、2フレームのズレが許容できない場合が生じた際には、カメラ5のフレームレートを480fpsや960fpsなど、より高い値のフレームレートに設定する。この設定に合わせて、光源2の点消灯周期をより短くするなど、制御部4による点灯の制御の調整も行った上で、カメラ5により撮影を行う。
【0021】
動画作成工程では、学習用データYとして多くのデータを集めるべく、被験者Xには光源2とウェア3とを着装した状態で、歩行や跳躍など、様々な動作をしてもらい、予め複数の動画フレームaを取得(作成)しておいてもよい。あるいは、1つの動画フレームaの作成後、直ぐに後述する学習用データ工程を実施するようにしてもよい。
【0022】
<<学習用データ作成工程>>
本実施形態における学習用データ作成工程は、学習用データ作成装置6を用いて学習用データの作成を行う。学習用データ作成装置6は、図3に示すように、入力部10と、画像作成部20と、座標取得部30と、データセット作成部40とから構成される。学習用データ作成装置6が、図4に示した処理フローを実施することにより、本実施形態に係る学習用データ作成方法が実現される。以下、図3図4とを用いて本実施形態における学習用データ作成方法を説明する。
【0023】
はじめに、図4に示すように、入力部10は、動画フレームaを入力として受け付ける。即ち、入力部10は、動画作成工程にて作成した動画フレームaを入力として受け付け、画像作成部20に出力する(ステップS10)。図1では、動画フレームaを、カメラ5から直接、学習用データ作成装置6に出力されているように構成しているが、予め動画フレームaを作成しておく場合には、カメラ5ではなく、所定の記憶領域から動画フレームaが入力されるように構成してもよい。
【0024】
画像作成部20は、入力された動画フレームaから、光源2が点灯している間の被験者Xの動作である点灯時動画M1と、光源2が消灯している間の被験者Xの動作である消灯時動画M2とを作成する。本実施形態における画像作成部20は、画像分類部201と動画作成部202とを有する。
【0025】
画像分類部201は、入力された動画フレームaから複数の静止画を抽出し、光源2の点灯時の静止画である点灯時画像a1と、光源2の消灯時の静止画である消灯時画像a2とに分類し、動画作成部202に出力する(ステップS201)。
【0026】
次に、動画作成部202は、点灯時画像a1の各画像を時系列に集めて動画とした点灯時動画M1を作成する。また、消灯時画像a2の各画像を時系列に集めて動画とした消灯時動画M2を作成する。点灯時動画M1と消灯時動画M2とを座標取得部30へ出力する(ステップS202)。
【0027】
なお、ステップS201及びステップS202を介して作成される点灯時動画M1(あるいは消灯時動画M2)は、点灯時画像a1(あるいは消灯時画像a2)の各画像の全てを時系列に集めて動画とすることは勿論のこと、次のように、点灯時画像a1(あるいは消灯時画像a2)の各画像の一部を時系列に集めて動画としてもよい。例えば、240fpsで撮影した動画フレームaから30fpsの点灯時動画M1(あるいは30fpsの消灯時動画M2)を生成する場合を例にする。この場合、例えば、8フレームを1単位にして、連続する8フレームの中から1枚ずつ点灯時画像a1(あるいは消灯時画像a2)を選択し、選択した各画像を時系列に集めて点灯時動画M1(あるいは消灯時動画M2)としてもよい。
【0028】
次に、座標取得部30は、点灯時動画M1に録画されている光源2の映像から、画像フレーム毎に時系列の2次元の座標データZを取得する。座標取得部30は、点灯時動画M1と消灯時動画M2と座標データZをデータセット作成部40へ出力する(ステップS30)。
【0029】
次に、データセット作成部40は、点灯時動画M1と、消灯時動画M2と、座標データZとを用いてデータセットである学習用データYを作成し、学習用データ作成装置6内あるいは学習用データ作成装置6外に設けられた所定の記憶領域(不図示)に格納する(ステップS40)。
【0030】
本実施の形態によれば、学習用データYは、被験者Xの関節位置(所定部位)の動きを反映した点灯時動画M1と、被験者Xの動きを反映した消灯時動画M2と、点灯時動画M1を元に作成した被験者Xの関節位置(所定部位)の座標データZとからなるデータセットとして構成される。点灯時動画M1と消灯時動画M2と座標データZは、同一の一の撮影(1回の撮影)で得られた動画フレームから作成される。したがって、点灯時動画M1と消灯時動画M2と座標データZは、同一の動作から作成されるものであることから、被験者がヒトの関節位置が把握しづらいルーズウェア等の衣服(ウェア)を着装している場合であっても、精度の良い姿勢推定をするための学習用データを作成することができる。
【0031】
<第2の実施の形態>
本開示の第2の実施の形態に係る学習用データ作成システム1Aを図5に示す。この学習用データ作成システム1Aが、学習用データ作成システム1(図1)と異なる点は、以下の通りである。光源2が赤外光LEDを用いた光源2Aへと変わっている。ウェア3が、可視光は透過しないが赤外光は透過する材質からなるウェア3Aへと変わっている。ウェア3Aは例えばポリエステル製の衣服である。カメラ5が、赤外光カメラ5A1と、赤外光カットフィルタ5A3を介して使用するRGBカメラ5A2の、2種類のカメラを用いるように変わっている。また、上記の変更に伴い、学習用データ作成工程で用いる学習用データ作成装置6が、学習用データ作成装置6Aへと変わっている。
【0032】
<<動画作成工程>>
本実施形態における動画作成工程は、図5に示した光源2Aと、ウェア3Aと、制御部4と、赤外光カメラ5A1と、RGBカメラ5A2、赤外光カットフィルタ5A3とを用いて、被験者Xの協力を得て、図2に示した処理フローを実施することにより、本実施形態に係る動画作成方法が実現される。本実施形態における図2の処理が、第1の実施形態における図2の処理と異なる点は以下の通りである。
【0033】
ステップS2では、測定対象である被験者Xに対し、所定の部位に光源2Aを貼り付ける(着装する)。
【0034】
ステップS3では、被験者Xにウェア3Aを着装してもらう。
【0035】
ステップS4では、光源2Aの点灯の制御として、少なくとも被験者Xの動きを撮影している間は、光源2Aを常時点灯(常灯)させる制御を行う。
【0036】
ステップS5では、赤外光カメラ5A1及びRGBカメラ5A2の2台を用いて被験者Xの動作を撮影し、後述する第1動画フレームb1、及び第2動画フレームb2から構成される動画フレームbを取得する。具体的には、図5で示したように、被験者Xから十分な距離(距離L2)を離した位置に赤外光カメラ5A1と、RGBカメラ5A2とを並列に配置し、RGBカメラ5A2の前方には赤外光カットフィルタ5A3を配置して被験者Xの動画を夫々のカメラにて撮影する。距離L2は、1つのカメラで撮影した場合と同等程度の画角とみなせるほど離れた距離(この距離を「距離LX」ともいう。)以上離れた距離をいう。これにより、赤外光カメラ5A1からは、関節部位に貼られた光源2が点灯し続けて被験者Xの関節位置の動きの軌道が録画された映像(第1動画フレームb1)が得られる。RGBカメラ5A2からは、光源2の点灯が赤外光カットフィルタ5A3によりカットされた映像、即ち光源2の光が消灯しているように見える映像(第2動画フレームb2)が得られる。したがって、光源2A及びウェア3Aを着装した被験者Xの動作が撮影された1回の撮影で作成された動画フレームbから、第1動画フレームb1と第2動画フレームb2の2種類の動画フレームが得られる。
【0037】
被験者Xとカメラとの間の距離が上述した距離LX以上を確保できない場合には、図6に示した構成にしてもよい。図6では、被験者Xとカメラとの間の距離が距離LXよりも短い距離である距離L3である場合に、被験者Xと赤外光カメラ5A1との間にハーフミラー5A4を設置し、このハーフミラー5A4を透過してきた映像を赤外光カメラ5A1にて撮影し、第1動画フレームb1を取得する。RGBカメラ5A2は、ハーフミラー5A4を反射してきた映像を撮影できる位置に配置し、赤外光カットフィルタ5A3を介してRGBカメラ5A2にて当該反射映像を撮影し、第2動画フレームb2を取得する。なお、ハーフミラー5A4に代えてプリズムを用いて同様な効果を得るように構成してもよい。図6の構成では、距離LXに満たない距離L3の場合であっても、第1動画フレームb1と第2動画フレームb2とから構成される動画フレームbを取得できる。図6の構成では、第1動画フレームb1と第2動画フレームb2の撮影画角を揃えることができる。図5図6のどちらの構成においても、第1の実施の形態で生じうるフレームのズレが生じることがない。
【0038】
<<学習用データ作成工程>>
図5図6で示した学習用データ作成システム1Aにおいては、学習用データ作成に、図7で示した学習用データ作成装置6Aが用いられる。学習用データ作成装置6Aが学習用データ作成装置6(図3)と異なる点は、画像作成部20が、画像判別部211と動画作成部212とを有する画像作成部21へと変わっている点である。
【0039】
学習用データ作成装置6Aが、図8に示した処理フローを実施することにより、本実施の形態に係る学習用データ作成方法が実現される。以下、図7図8とを用いて本実施形態における学習用データ作成方法を説明する。
【0040】
学習用データ作成装置6Aは、はじめに、動画フレームb、即ち、赤外光カメラ5A1により撮影して取得した第1動画フレームb1と、RGBカメラ5A2により撮影して取得した第2動画フレームb2とを入力として受け付ける。入力部10は、受け付けた動画フレームbを画像判別部211へ出力する(ステップS10)。
【0041】
画像判別部211は、入力された動画フレームbが、第1動画フレームb1、あるいは第2動画フレームb2のいずれの動画フレームであるかを判別し、第1動画フレームb1と第2動画フレームb2と判別結果を、動画作成部212へ出力する(ステップS211)。判別結果は、予め出力形式を決めておけば、例えば、第1動画フレームb1や第2動画フレームb2とは別ファイルとして出力するように構成してもよい。また、第1動画フレームb1や第2動画フレームb2のファイル名で識別できるようにしてもよい。
【0042】
動画作成部212は、入力された判別結果を参照し、第1動画フレームb1から点灯時動画M1を作成し、第2動画フレームb2から消灯時動画M2を作成し、座標取得部30に出力する(ステップS212)。
【0043】
座標取得部30及び、データセット作成部40の処理は、学習用データ作成システム1と同じであるため説明は割愛する。
【0044】
本実施の形態によれば、赤外光カメラ5A1とRGBカメラ5A2の2種類のカメラを用いて動画フレームbが得られる環境であれば、第1の実施の形態における画像分類部201の処理が不要となり、それに変わって画像判別部211の処理で足りる。このため、学習用データ作成装置6の処理に比して学習用データ作成装置6Aの処理を効率的に行うことができる。
【0045】
<第3の実施の形態>
本開示の第3の実施の形態に係る学習用データ作成システム1Bを図9に示す。学習用データ作成システム1Bが、学習用データ作成システム1(図1)と異なる点は以下の通りである。光源2が学習用データ作成システム1Aで用いた光源2Aへと変わっている。ウェア3が学習用データ作成システム1Aで用いたウェア3Aへと変わっている。カメラ5が、近赤外まで撮影可能であって、撮影対象の輝度の変化を検知して動画フレームを作成するイベントカメラ5Bへと変わっている。上記の変更に伴い、学習用データ作成工程で用いる学習用データ作成装置6が、学習用データ作成装置6Bへと変わっている。
【0046】
<<動画作成工程>>
本実施形態における動画作成工程は、図9に示した光源2Aと、ウェア3Aと、制御部4と、イベントカメラ5Bとを用いて、被験者Xの協力を得て、図2に示した処理フローを実施することにより、本実施形態に係る動画作成方法が実現される。本実施形態における図2の処理が、第1の実施形態における図2の処理と異なる点は以下の通りである。
【0047】
ステップS2では、測定対象である被験者Xに対し、所定の部位に光源2Aを貼り付ける(着装する)。
【0048】
ステップS3では、被験者Xにウェア3Aを着装してもらう。
【0049】
ステップS4の処理は第1の実施の形態と同様である。即ち、ステップS4では、光源2A光源の点灯の制御として、所定間隔で光源2Aの夫々を点滅させる制御を行う。
【0050】
ステップS5では、イベントカメラ5Bを用いて被験者Xの動作を撮影し、動画フレームcを取得する。
【0051】
<<学習用データ作成工程>>
図9で示した学習用データ作成システム1Bにおいては、学習用データ作成に、図10に示す学習用データ作成装置6Bが用いられる。学習用データ作成装置6Bが学習用データ作成装置6(図3)と異なる点は、画像作成部20が、点灯動画作成部221と消灯動画作成部222とを有する画像作成部22へと変わっている点である。
【0052】
学習用データ作成装置6Bが、図11に示した処理フローを実施することにより、本実施の形態に係る学習用データ作成方法が実現される。以下、図10図11とを用いて本実施形態における学習用データ作成方法を説明する。
【0053】
学習用データ作成装置6Bは、はじめに、イベントカメラ5Bが作成した動画フレームcを入力として受け、受け付けたデータを、点灯動画作成部221へ出力する(ステップS10)。
【0054】
点灯動画作成部221は、動画フレームcから、複数の静止画を抽出し、光源2A(赤外光LED)が点灯している間の画像のみを対象として時系列で蓄積して動画とした点灯時動画M1を作成し、抽出した静止画と、点灯時動画M1とを消灯動画作成部222へ出力する(ステップS221)。
【0055】
消灯動画作成部222は、入力された複数の静止画のうち、ステップS221において蓄積の対象となったものを対象から外し、その他の静止画を対象として時系列で蓄積して動画とした消灯時動画M2を作成し、点灯時動画M1と消灯時動画M2とを座標取得部30へ出力する(ステップS222)。なお、画像作成部22は、消灯動画作成部222の処理を先に行い、この処理結果を元して点灯動画作成部221の処理を消灯動画作成部222よりも後に行うように構成してもよい。
【0056】
座標取得部30及び、データセット作成部40の処理は、学習用データ作成システム1と同じであるためその説明は割愛する。
【0057】
図9の構成においても、第1の実施の形態で生じうるフレームのズレが生じることがない。また、図9の構成におけるイベントカメラ5Bは、図5図6に示した赤外光カメラ5A1、RGBカメラ5A2などに比して安価で入手できる。したがって、本実施の形態に係る学習用データ作成システム1Bは、第2の実施の形態の学習用データ作成システム1Aに比して安価でシステムを構成することができる。
【0058】
<学習用データ作成装置の変形例>
上述した学習用データ作成システム1、1A、1Bの各学習用データ作成工程は、図12で示した学習用データ作成装置6Cを用いて実施してもよい。学習用データ作成装置6Cは、入力される動画フレームが、動画フレームa、動画フレームb、及び動画フレームcのいずれであっても、学習用データ作成工程を実施できる機能した学習用データ作成装置である。学習用データ作成装置6Cが、学習用データ作成装置6(図3)と異なる点は、画像作成部として、画像作成部20と画像作成部21と画像作成部22を有する点にある。これに伴い、入力部10が、受付部111と処理判定部112とを有する入力部11へと変わっている。学習用データ作成装置6Cが、図13に示した処理フローを実施することにより、学習用データ作成装置の変形例に係る学習用データ作成方法が実現される。
【0059】
はじめに、入力部11は、被験者Xの動作が録画されている動画フレームを入力として受け付け、受け付けたデータを処理判定部112へ出力する(ステップS111)。即ち、入力部11は、学習用データ作成システム1にて作成された動画フレームa、学習用データ作成システム1Aにて作成された動画フレームb(第1動画フレームb1及び第2動画フレームb2)、学習用データ作成システム1Bにて作成された動画フレームcのいずれかの動画フレームを受け付け、処理判定部112へ出力する。
【0060】
処理判定部112は、動画フレームa、動画フレームb、動画フレームcのいずれの種類の動画フレームであるかを判定する(ステップS112)。処理判定部112が、入力された動画フレームを動画フレームaであると判定した場合には、図13に示したステップS201及びステップS202の処理を行い、処理結果を座標取得部30へ出力する。処理判定部112が、入力された動画フレームを動画フレームbであると判定した場合には、図13に示したステップS211及びステップS212の処理を行い、処理結果を座標取得部30へ出力する。処理判定部112が、入力された動画フレームを動画フレームcであると判定した場合には、図13に示したステップS221及びステップS222の処理を行い、処理結果を座標取得部30へ出力する。
【0061】
ステップS201、S202、及び座標取得部30及びデータセット作成部40での処理は学習用データ作成システム1での処理と同じであり、ステップS211、S212の処理は、学習用データ作成システム1Aでの処理と同じであり、ステップS221、S222の処理は、学習用データ作成システム1Bでの処理と同じであることから、その説明を割愛する。
【0062】
以上、この開示の実施形態、及び変形例について説明したが、具体的な構成は、これらの実施形態や変形例に限られるものではなく、この開示の趣旨を逸脱しない範囲で適宜設計の変更等があっても、この開示に含まれることはいうまでもない。実施形態や変形例において説明した各種の処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。例えば、学習用データ作成装置6Cにおける画像作成部は、画像作成部20と画像作成部21と、画像作成部22とを有しているが、学習用データ作成装置6Cに入力される動画フレームの種類に合わせて、画像作成部20と画像作成部21、画像作成部21と画像作成部22、画像作成部20と画像作成部22など2種類の画像作成部を有するように構成してもよい。
【0063】
[プログラム、記録媒体]
上述の各種の処理は、図14に示すコンピュータ2000の記録部2020に、上記学習用データ作成方法の各ステップを実行させるプログラムを読み込ませ、制御部2010、入力部2030、出力部2040、表示部2050などに動作させることで実施できる。
【0064】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
【0065】
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
【0066】
このようなプログラムを実行するコンピュータは、例えば、はじめに、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
【0067】
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
【符号の説明】
【0068】
1、1A、1B 学習用データ作成システム
10、11、2030 入力部
111 受付部
112 処理判定部
2、2A 光源
20、21、22 画像作成部
201 画像分類部
202、212 動画作成部
211 画像判別部
221 点灯動画作成部
222 消灯動画作成部
2000 コンピュータ
2020 記録部
2040 出力部
2050 表示部
3、3A ウェア
30 座標取得部
4、2010 制御部
40 データセット作成部
5 カメラ
5A1 赤外光カメラ
5A2 RGBカメラ
5A3 赤外光カットフィルタ
5A4 ハーフミラー
5B イベントカメラ
6、6A、6B、6C 学習用データ作成装置
a、b、c 動画フレーム
a1 点灯時画像
a2 消灯時画像
b1 第1動画フレーム
b2 第2動画フレーム
L1、L2、L3、LX 距離
M1 点灯時動画
M2 消灯時動画
X 被験者
Y 学習用データ
Z 座標データ
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14