IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヒンジ ヘルス, インコーポレイテッドの特許一覧

特表2023-549111コンピュータビジョンを通したオブジェクトの運動に関する洞察の導出
<>
  • 特表-コンピュータビジョンを通したオブジェクトの運動に関する洞察の導出 図1
  • 特表-コンピュータビジョンを通したオブジェクトの運動に関する洞察の導出 図2
  • 特表-コンピュータビジョンを通したオブジェクトの運動に関する洞察の導出 図3
  • 特表-コンピュータビジョンを通したオブジェクトの運動に関する洞察の導出 図4
  • 特表-コンピュータビジョンを通したオブジェクトの運動に関する洞察の導出 図5
  • 特表-コンピュータビジョンを通したオブジェクトの運動に関する洞察の導出 図6
  • 特表-コンピュータビジョンを通したオブジェクトの運動に関する洞察の導出 図7
  • 特表-コンピュータビジョンを通したオブジェクトの運動に関する洞察の導出 図8
  • 特表-コンピュータビジョンを通したオブジェクトの運動に関する洞察の導出 図9
  • 特表-コンピュータビジョンを通したオブジェクトの運動に関する洞察の導出 図10
  • 特表-コンピュータビジョンを通したオブジェクトの運動に関する洞察の導出 図11
  • 特表-コンピュータビジョンを通したオブジェクトの運動に関する洞察の導出 図12
  • 特表-コンピュータビジョンを通したオブジェクトの運動に関する洞察の導出 図13
  • 特表-コンピュータビジョンを通したオブジェクトの運動に関する洞察の導出 図14
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-11-22
(54)【発明の名称】コンピュータビジョンを通したオブジェクトの運動に関する洞察の導出
(51)【国際特許分類】
   G16H 50/30 20180101AFI20231115BHJP
   G06T 7/20 20170101ALI20231115BHJP
   G16H 30/00 20180101ALI20231115BHJP
   G16H 50/20 20180101ALI20231115BHJP
【FI】
G16H50/30
G06T7/20 300Z
G16H30/00
G16H50/20
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023526952
(86)(22)【出願日】2021-11-05
(85)【翻訳文提出日】2023-06-13
(86)【国際出願番号】 US2021058332
(87)【国際公開番号】W WO2022099070
(87)【国際公開日】2022-05-12
(31)【優先権主張番号】63/110,660
(32)【優先日】2020-11-06
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】521546728
【氏名又は名称】ヒンジ ヘルス, インコーポレイテッド
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【弁理士】
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【弁理士】
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】クルシェウスキ, ポール アンソニー
(72)【発明者】
【氏名】ジャン, ウェンシン
(72)【発明者】
【氏名】ラクロワ, ロベール
(72)【発明者】
【氏名】ラッセル, ライアン
【テーマコード(参考)】
5L096
5L099
【Fターム(参考)】
5L096AA06
5L096BA06
5L096CA02
5L096DA02
5L096FA66
5L096FA69
5L096HA09
5L096HA11
5L096KA04
5L099AA15
5L099AA26
(57)【要約】
ここに導入されるものは、画像データ(「未加工データ」または「入力データ」とも称される)のローカル分析を通してコンピュータビジョンデータを発生させることが可能である、コンピュータプログラムである。画像データは、画像センサによって発生される、1つまたはそれを上回るデジタル画像を表し得る。また、ここに導入されるものは、画像データおよびコンピュータビジョンデータを発生させ、取り扱うための装置である。これらの装置は、特に限定されず、画像データを発生させる、および/または取り扱うことが可能である、任意のコンピューティングデバイスであってもよい。
【特許請求の範囲】
【請求項1】
コンピュータビジョンデータを発生させるための装置であって、前記システムは、
個人がある時間間隔にわたって位置する環境のデジタル画像を発生させるように構成されるカメラと、
ニューラルネットワークによる前記デジタル画像の分析を通して、コンピュータビジョンデータを発生させるように構成されるプロセッサであって、
前記ニューラルネットワークは、前記デジタル画像のそれぞれに関して、前記時間間隔にわたって前記個人のシリアル化された姿勢を確立するように、前記個人の姿勢を推定するように訓練される、プロセッサと、
前記個人の健康ステータスの決定のために、宛先に前記コンピュータビジョンデータを通信するように構成される通信モジュールと
を備える、装置。
【請求項2】
前記宛先は、前記個人の健康ステータスを視覚的に示すように、前記コンピュータビジョンデータまたは前記コンピュータビジョンデータの分析を表示することが可能であるコンピューティングデバイスを表す、請求項1に記載の装置。
【請求項3】
前記健康ステータスは、筋骨格の健康状態を表す、請求項1に記載の装置。
【請求項4】
前記コンピュータビジョンデータは、前記デジタル画像のそれぞれに関して、前記個人の1つまたはそれを上回る関節の2次元場所を示す、請求項1に記載の装置。
【請求項5】
前記コンピュータビジョンデータは、前記デジタル画像のそれぞれに関して、前記個人の1つまたはそれを上回る関節の3次元場所を示す、請求項1に記載の装置。
【請求項6】
前記コンピュータビジョンデータは、前記デジタル画像のそれぞれに関して、前記個人の1つまたはそれを上回る関節の3次元回転を示す、請求項1に記載の装置。
【請求項7】
前記コンピュータビジョンデータは、前記デジタル画像のそれぞれに関して、前記個人の1つまたはそれを上回る筋肉の場所、サイズ、および/または形状を示す、請求項1に記載の装置。
【請求項8】
前記コンピュータビジョンデータは、前記個人の身体の表面を表す熱マップを含む、請求項1に記載の装置。
【請求項9】
前記コンピュータビジョンデータは、ボクセルから成る前記個人の体積表現を含み、各ボクセルは、その空間位置が前記ニューラルネットワークによって決定される場所を表す、請求項1に記載の装置。
【請求項10】
コンピュータビジョンデータの分析を通して個人の健康ステータスを決定するための方法であって、前記方法は、
個人が位置する環境の高速連続においてカメラによって発生された一連のデジタル画像を入手することと、
前記一連のデジタル画像にモデルを適用し、一連の出力を生産することであって、
前記一連の出力における各出力は、前記一連のデジタル画像の対応するデジタル画像の分析を通して決定されるような前記個人の空間位置に関する情報を表し、
前記一連の出力は、集合的に、コンピュータビジョンデータを表す、ことと、
前記コンピュータビジョンデータに基づいて、前記個人の健康をリアルタイムで査定することと、
前記個人の健康に基づいて、アクションを実施することと
を含む、方法。
【請求項11】
前記査定することは、前記個人の筋骨格パフォーマンスを決定することを含み、前記方法はさらに、
体操療法セッションを開始するための要求を示す入力を受信することと、
前記個人に対する体操を実施するための命令の提示を引き起こすことと
を含み、
前記一連のデジタル画像は、前記個人が前記アクションを実施するにつれて、カメラによって発生される、請求項10に記載の方法。
【請求項12】
前記個人が前記体操を完了したという決定に応答して、前記実施することは、前記個人に別の体操を実施するように命令することを含む、請求項11に記載の方法。
【請求項13】
前記査定することは、前記コンピュータビジョンデータに基づいて転倒検出を実施することを含む、請求項10に記載の方法。
【請求項14】
前記査定することは、前記コンピュータビジョンデータに基づいて歩容分析を実施することを含む、請求項10に記載の方法。
【請求項15】
前記査定することは、前記コンピュータビジョンデータに基づいて活動分析を実施することを含み、前記活動分析は、前記個人によって採用されている労力の推定されるレベルを示す、請求項10に記載の方法。
【請求項16】
前記査定することは、前記コンピュータビジョンデータに基づいて微細運動技能分析を実施することを含む、請求項10に記載の方法。
【請求項17】
前記査定することは、前記コンピュータビジョンデータに基づいて可動域分析を実施することを含む、請求項10に記載の方法。
【請求項18】
前記査定することは、前記コンピュータビジョンデータに基づいて筋肉疲労分析を実施することを含み、前記筋肉疲労分析は、前記個人の筋肉によって体験されている疲労の推定されるレベルを示す、請求項10に記載の方法。
【請求項19】
前記査定することは、前記コンピュータビジョンデータに基づいて筋肉分布分析を実施することを含み、前記筋肉分布分析は、前記個人の筋肉の推定される場所、サイズ、および/または形状を示す、請求項10に記載の方法。
【請求項20】
前記査定することは、前記コンピュータビジョンデータに基づいて肥満度指数(BMI)分析を実施することを含む、請求項10に記載の方法。
【請求項21】
前記査定することは、前記コンピュータビジョンデータに基づいて血流分析を実施することを含み、前記血流分析は、前記個人を通した血流の推定される速度および/または体積が、異常であるかどうかを示す、請求項10に記載の方法。
【請求項22】
前記査定することは、前記コンピュータビジョンデータに基づいて温度分析を実施することを含み、前記温度分析は、少なくとも2つの異なる場所における前記個人の身体の表面に沿った温度を示す、請求項10に記載の方法。
【請求項23】
個人の健康を査定するためのシステムであって、前記システムは、
個人が位置する環境内に展開される複数の撮像装置であって、各撮像装置は、
ある時間間隔にわたって前記個人のデジタル画像を生産するように構成される画像センサと、
前記デジタル画像の分析を通して習得される前記個人に関連する情報を表すデータセットを発生させるように構成されるプロセッサと、
通信インターフェースであって、それを介して前記情報が前記撮像装置から退出する通信インターフェースと
を備える、複数の撮像装置と、
処理装置であって、前記処理装置は、
通信インターフェースであって、そこにおいて前記複数の撮像装置から複数のデータセットを受信する通信インターフェースと、
前記複数のデータセットを診査することによって前記個人の健康を査定するように構成されるプロセッサと
を備える、処理装置と
を備える、システム。
【請求項24】
各撮像装置内に含まれる前記画像センサは、赤外領域、近赤外領域、可視領域、または紫外領域を網羅するように設計される、請求項23に記載のシステム。
【請求項25】
前記処理装置の通信インターフェースは、別個の通信チャネルを介して各撮像装置との無線通信を促進するように構成される送受信機の一部である、請求項23に記載のシステム。
【請求項26】
各撮像装置の前記プロセッサはさらに、前記撮像装置を識別するメタデータを前記データセットに添付するように構成される、請求項23に記載のシステム。
【請求項27】
前記複数の撮像装置は、各撮像装置が、異なる視点から前記個人のデジタル画像を生産するように、前記環境内に展開される、請求項23に記載のシステム。
【請求項28】
前記各撮像装置のプロセッサは、1つまたはそれを上回るコンピュータビジョンアルゴリズムを前記デジタル画像に適用することによって、前記データセットを発生させる、請求項23に記載のシステム。
【請求項29】
前記複数の撮像装置および前記処理装置のうちの少なくとも一方は、単一のコンピューティングデバイスを表す、請求項23に記載のシステム。
【請求項30】
前記情報は、前記時間間隔にわたって前記個人の少なくとも2つの関節の2次元場所または3次元場所を規定する、請求項23に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本願は、参照することによってその全体として本明細書に組み込まれる、2020年11月6日に出願され、「Computer Vision Data」と題された、米国仮出願第63/110,660号の優先権を主張する。
【0002】
種々の実施形態は、コンピュータビジョンデータの分析を通してオブジェクトの運動に関する洞察を導出するためのコンピュータプログラムおよび関連付けられるコンピュータ実装技法、およびコンピュータビジョンデータを発生させることが可能である、システムおよび装置に関する。
【背景技術】
【0003】
コンピュータビジョンは、コンピューティングデバイスがデジタル画像のコンテンツのより高レベルの理解を獲得し得る方法を取り扱う、多分野にわたる科学的分野である。高レベルでは、コンピュータビジョンは、人間の視覚系が実施し得るタスクを理解し、自動化するための試みを表す。
【0004】
コンピュータビジョンタスクは、デジタル画像のコンテンツを入手、処理、分析、および理解し、かつより象徴的な情報(例えば、決定)を生産するために、実世界からデータを推論または抽出するための異なるアプローチを含む。本文脈では、用語「understanding(~を理解する)」は、コンピュータ実装プロセスにとって「意味を成し」、したがって、適切な動作を導き出し得る、視覚コンテンツの非視覚記述への転換を指す。ある意味では、この「understanding(~を理解する)」は、アルゴリズムの使用を通した、デジタル画像からの象徴的情報の解きほぐしと見なされ得る。
【0005】
概して、コンピュータビジョンタスクの性能は、コンピュータビジョンタスクを実施または促進するように設計される、1つまたはそれを上回るアルゴリズムを表す、コンピュータ実装モデル(または単に「モデル」)の適用を伴うであろう。これらのアルゴリズムの本質は、アプリケーションの意図される適用に依存するであろう。アプリケーションにかかわらず、1つまたはそれを上回るデジタル画像に適用されると、モデルによって生産されたデータは、「コンピュータビジョンデータ」と称され得る。
【0006】
コンピュータビジョンデータは、映画、ビデオゲーム、エンターテインメント、生体力学、訓練、およびシミュレーション産業におけるコンピュータ発生像を含め、種々の状況において使用され得る。また、コンピュータビジョンデータは、人間/機械間インターフェースのリアルタイムの制御および管理のためにも使用され得る。
【0007】
実施例として、それによって映画およびビデオゲームのためのアニメーションが生産される、プロセスを検討する。アニメーションを生成するために、個人は、アニメーションが実施される間に個人を録画する、高性能のビジョン捕捉システムを含むスタジオ内で時間を確保する必要があり得る。ビジョン捕捉システムによって発生された画像データは、次いで、アニメーションをプログラムで再生成する方法を決定することに関わる、別のシステム(例えば、コンピュータ実装アニメーションシステム)の中にフィードされることができる。
【0008】
別の実施例として、それによって人体の移動運動が、種々の筋肉の活動に関する洞察を獲得するように視覚的に検査される、プロセスを検討する。本プロセスは、概して、「歩容分析」と称される。その歩容を分析させるために、患者は、物理的環境を中心として移動する間に患者を録画する高性能のビジョン捕捉システムを含む、病院を訪問する必要があり得る。ビジョン捕捉システムによって発生された画像データは、次いで、歩容のいずれかの側面が異常であるかどうかを査定することに関わる、別のシステム(例えば、コンピュータ実装診断システム)の中にフィードされることができる。
【0009】
これらの実施例から分かり得るように、コンピュータビジョンデータを発生させるステップは、労力を要し、高価なプロセスである傾向にある。高性能のビジョン捕捉システムを要求することに加えて、録画される個人は、これらの高性能のビジョン捕捉システムを含む施設を訪問しなければならない。これらの欠点は、コンピュータビジョンの用途を限定する。
【発明の概要】
【課題を解決するための手段】
【0010】
コンピュータビジョンデータは、オブジェクトの運動をより深く理解するために、広範囲の異なる分野において使用されることができる。オブジェクトの一実施例は、人体である。コンピュータビジョンデータは、典型的には、その運動が算出、推論、または別様に決定されている、各オブジェクトの2次元(2D)表現または3次元(3D)表現を含む。コンピュータビジョンデータは、運動のより高レベルの表現を示すため、これは、種々の目的のために「下流」コンピュータプログラムによっても使用され得る。実施例として、コンピュータビジョンデータは、アニメーションを発生させ、イベントを検出し、場面をモデル化するために使用され得る。コンピュータビジョンデータの特性、特に、その形態およびコンテンツは、その最終用途に依存し得、したがって、特に限定されない。
【0011】
同様に、コンピュータビジョンデータの発生は、特に限定されない。コンピュータビジョンデータは、個人(「プログラマ」、「オペレータ」、または「デザイナ」とも称される)によって手動で発生され得る、またはコンピュータビジョンデータは、コンピュータプログラムによって、例えば、デジタル画像の分析に基づいて自動的に発生され得る。実施例として、1つまたはそれを上回るカメラモジュール(または単に「カメラ」)を含む、カメラシステムが、複数の視点から人のデジタル画像を捕捉するために使用されてもよい。次いで、デジタル画像は、プロセッサによって、これらの「未加工」デジタル画像をコンピュータビジョンデータに転換するために処理されてもよい。プロセッサが、カメラシステムまたはカメラシステムに通信可能に接続されるコンピューティングデバイス内に含まれ得ることに留意されたい。コンピュータビジョンデータは、人の関節の3D骨格表現、特定の視点からの人の関節の2D骨格表現、デジタル画像内の重複するオブジェクトに関連するデータ、またはそれらの任意の組み合わせ等の情報を含んでもよい。これらの骨格表現は、便宜上、「骨格」と称され得る。コンピュータビジョンデータは、次いで、種々の目的のために使用されることができる。
【0012】
従来的に、コンピュータビジョンタスクを実施することに関わるシステム全体が、未加工デジタル画像の捕捉およびコンピュータビジョンデータの後続の処理および取扱が、単一のシステム内で行われるように、単一のシステムとして設計される。当業者は、これらのコンピュータビジョンシステムを構築するために必要とされるリソースが、非常に大量であり得ることを理解するであろう。また、コンピュータビジョンデータが発生され、次いで、単一のシステムによって取り扱われる本アプローチが、処理および取扱がローカルで実施されることを意味する。コンピュータビジョンデータの処理および取扱が、ポータブルではないため、コンピュータビジョンデータは、容易に別のコンピューティングデバイスに転送可能ではない場合がある(また、いくつかの状況においては、全く転送可能ではあり得ない)。故に、コンピュータビジョンデータを利用することに関心を持っている個人は、概して、コンピュータビジョンシステムを用いて作業するための時間を確保し、これは、(例えば、費用に起因して)非便宜的および/また非実用的であり得る。
【0013】
ここに導入されるものは、したがって、画像データ(「未加工データ」または「入力データ」とも称される)のローカル分析を通してコンピュータビジョンデータを発生させることが可能である、コンピュータプログラムである。画像データは、画像センサによって発生される、1つまたはそれを上回るデジタル画像を表し得る。また、ここに導入されるものは、画像データを発生させ、次いで、それを取り扱うための装置である。これらの装置は、特に限定されず、画像データを発生させる、および/または取り扱うことが可能である、任意のコンピューティングデバイスであってもよい。便宜上、画像データを発生させることが可能である、装置は、「撮像装置」と称され得る一方、画像データを取り扱うことが可能である、装置は、「処理装置」と称され得る。いくつかのコンピューティングデバイス(例えば、コンピュータサーバ)が、処理装置としての役割を果たすことのみが可能であり得る一方、他のコンピューティングデバイス(例えば、モバイルフォンおよびタブレット型コンピュータ)は、撮像装置および/または処理装置としての役割を果たすことが可能であり得る。
【0014】
下記にさらに議論されるように、本明細書に開示されるアプローチの利点のうちの1つは、単一の視点から捕捉されたデジタル画像が、コンピュータビジョンデータを発生させるように、ローカルで(すなわち、デジタル画像を発生させた撮像装置によって)処理され得ることである。概して、本コンピュータビジョンデータは、「下流」コンピュータプログラムによって容易に使用され得る、ポータブルフォーマットにおいて発生される。これらのコンピュータプログラムは、特に限定されず、実施例は、可視化ツール、アニメーションツール、および(例えば、診断のための)分析ツールとして役割を果たすように設計される、コンピュータプログラムを含む。
【0015】
例証の目的のために、実施形態は、人体の空間位置および移動に関する洞察を導出するために使用される、コンピュータビジョンデータを発生させることとの関連において説明され得る。しかしながら、それらの実施形態の特徴も、他の状況において使用可能である、コンピュータビジョンデータを発生させることに同様に適用可能であり得る。
【0016】
また、実施形態は、例証の目的のために、実行可能命令との関連においても説明され得る。しかしながら、当業者は、本技術の側面が、ハードウェア、ファームウェア、またはソフトウェアを介して実装され得ることを認識するであろう。実施例として、コンピュータビジョンデータは、完了のために患者に割り当てられた処置プログラム(または単に「プログラム」)への準拠およびその成功を改良するために設計される、ソフトウェア実装療法プラットフォーム(または単に「療法プラットフォーム」)によって取得され得る。プログラムの一部として、療法プラットフォームは、患者が、患者が身体活動を実施するように命令される、いくつかの体操療法セッション(または単に「セッション」)を完了することを要求し得る。例えば、患者は、セッションの過程にわたって一連の体操を実施するように命令されてもよい。療法プラットフォームは、コンピュータビジョンデータの分析に基づいて、これらの体操が正常に完了したかどうかを決定してもよい。療法プラットフォームは、直接または間接的に、同一のコンピューティングデバイス上に実装されたハードウェア、ファームウェア、または他のソフトウェアとインターフェースをとってもよい。加えて、または代替として、療法プラットフォームは、下記に議論されるように、直接または間接的に、他のコンピューティングデバイスとインターフェースをとってもよい。
【図面の簡単な説明】
【0017】
図1図1は、本装置によって捕捉された未加工データに基づいてコンピュータビジョンデータを発生させるように構成される、装置の略図を含む。
【0018】
図2図2は、未加工データに基づいてコンピュータビジョンデータを発生させるための方法のフローチャートを含む。
【0019】
図3図3は、着目オブジェクトと関連付けられる未加工データを捕捉するための装置を実装することが可能である、システムのある実施例を図示する。
【0020】
図4図4は、本明細書に説明されるアプローチを集合的に実装することが可能である、複数の装置を含む、システムのある実施例を図示する。
【0021】
図5図5は、装置が、可視化システムとして作用する別のコンピューティングデバイスに通信可能に接続される、システムのある実施例を図示する。
【0022】
図6図6は、装置が、ネットワークアクセス可能なリソース(「クラウドベースのリソース」または単に「クラウド」とも称される)に通信可能に接続される、システムのある実施例を図示する。
【0023】
図7図7は、装置の3つの異なる実装を図示する。
【0024】
図8図8は、装置が、ラップトップコンピュータに通信可能に接続される、モバイルフォンである、システムのある実施例を図示する。
【0025】
図9図9は、装置が、情報(例えば、未加工データまたはコンピュータビジョンデータ)が異なるコンピューティングデバイス間で容易に共有されることを可能にする、インターネットベースの協業サービスに通信可能に接続される、モバイルフォンである、システムのある実施例を図示する。
【0026】
図10図10は、療法プラットフォームを含む、ネットワーク環境のある実施例を図示する。
【0027】
図11図11は、患者が、療法プラットフォームによる体操療法セッションの間に体操等の身体活動を実施することが要求されるプログラムを実装することが可能である、装置のある実施例を図示する。
【0028】
図12図12は、1つまたはそれを上回るソースからデータを取得するように構成される、療法プラットフォームを含む、通信環境のある実施例を描写する。
【0029】
図13図13は、コンピュータビジョンデータの分析を通して個人の健康ステータスを決定するための方法のフローチャートを含む。
【0030】
図14図14は、本明細書に説明される少なくともいくつかの動作が実装され得る、処理システムのある実施例を図示する、ブロック図である。
【0031】
本明細書に説明される技術の種々の特徴は、図面と併せた詳細な説明の精査から、当業者により明白な状態になるであろう。種々の実施形態が、例証の目的のために図面に描写される。しかしながら、当業者は、代替実施形態が、本技術の原理から逸脱することなく採用され得ることを認識するであろう。故に、具体的な実施形態が、図面に示されるが、本技術は、種々の修正に適している。
【発明を実施するための形態】
【0032】
詳細な説明
専門用語
本開示における「ある実施形態」または「いくつかの実施形態」の言及は、説明されている特徴、機能、構造、または特性が、少なくとも1つの実施形態内に含まれることを意味する。そのような語句の表出は、必ずしも同一の実施形態を指すものでもなく、それらは、必ずしも相互と相互排他的である代替実施形態を指しているわけでもない。
【0033】
用語「based on(~に基づいて)」は、排他的意味ではなく、包括的意味において解釈されるべきである。すなわち、「including but not limited to(限定ではないが、~を含む)」の意味において解釈されるべきである。したがって、別様に記載されない限り、用語「based on(~に基づいて)」は、「based at least in part on(少なくとも部分的に、~に基づいて)」を意味することを意図している。
【0034】
用語「connected(接続される)」、「coupled(結合される)」、およびそれらの異形は、2つまたはそれを上回る要素間の直接的または間接的のいずれかの任意の接続または結合を含むことを意図している。接続または結合は、物理的、論理的、またはそれらの組み合わせであることができる。例えば、要素は、物理的接続を共有していないことにもかかわらず、相互に電気的または通信可能に結合され得る。
【0035】
用語「モジュール」は、広義には、ソフトウェア、ファームウェア、ハードウェア、またはそれらの組み合わせを指し得る。モジュールは、典型的には、1つまたはそれを上回る入力に基づいて、1つまたはそれを上回る出力を発生させる、機能構成要素である。コンピュータプログラムは、1つまたはそれを上回るモジュールを含む、またはそれを利用してもよい。例えば、コンピュータプログラムは、異なるタスクを完了させることに関わる、複数のモジュールを利用してもよい、またはコンピュータプログラムは、あらゆるタスクを完了させることに関わる、単一のモジュールを利用してもよい。
【0036】
複数のアイテムのリストを参照して使用されるとき、用語「または」は、以下の解釈、すなわち、リスト内のアイテムのうちのいずれか、リスト内のアイテムの全て、およびリスト内のアイテムの任意の組み合わせの全てを網羅することを意図している。
コンピュータビジョンシステムの概観
【0037】
図1は、装置50によって捕捉された未加工データに基づいてコンピュータビジョンデータを発生させるように構成される、装置50の略図を含む。図1では、装置50は、カメラ55と、画像分析エンジン60(または単に「分析エンジン」)と、通信インターフェース65とを含む。装置50の他の実施形態は、装置50のユーザと相互作用するための、付加的なインターフェース、入力デバイス、または出力デバイス(例えば、インジケータ)等、ここには示されていない、付加的な構成要素を含み得る。相互作用は、装置50の動作ステータスに関連する情報を提供するためにユーザに出力を提供するステップ、および装置50を制御するためにユーザからの入力を受信するステップを含み得る。入力デバイスの実施例は、装置50を制御する、または入力パラメータを提供するためのポインタデバイスと、機械式ボタンと、キーボードと、マイクロホンとを含む。出力デバイスの実施例は、ディスプレイと、発光体と、スピーカとを含む。ディスプレイがタッチセンサ式である場合には、ディスプレイは、入力デバイスおよび出力デバイスとしての役割を果たし得る。
【0038】
装置50は、種々の形態をとることができる。いくつかの実施形態では、装置50は、そのためにコンピュータビジョンデータが発生されることになる、未加工データを捕捉するように調整される、特別に設計されたコンピューティングデバイスである。他の実施形態では、装置50は、汎用目的コンピューティングデバイスである。例えば、装置50は、モバイルフォン、タブレット型コンピュータ、ラップトップコンピュータ、デスクトップコンピュータ、または別のポータブル電子デバイスであり得る。
【0039】
カメラ55は、着目オブジェクト(例えば、人体)の1つまたはそれを上回るデジタル画像の形態にある、未加工データを捕捉するステップに関わり得る。概して、これらのデジタル画像は、カメラ55によって捕捉される、ビデオストリームを表すが、これらのデジタル画像は、異なる時点において異なる場所等から、カメラ55によって独立して発生され得る。カメラ55が、例証の目的のために説明されること、および多くの異なるタイプの画像センサも、想定されることに留意されたい。例えば、装置50は、赤外領域、近赤外領域、可視領域、または紫外領域を網羅するように設計される、画像センサを含んでもよい。
【0040】
概して、カメラ55は、装置50の一部である。例えば、装置50が、モバイルフォンまたはタブレット型コンピュータである場合、カメラ55は、その中に含有される、正面または背面向きカメラであってもよい。しかしながら、カメラ55は、いくつかの実施形態では、装置50に通信可能に接続されてもよい。例えば、カメラ55は、ポータブルビデオカメラ(例えば、ウェブカメラ)、カムコーダ、または直接的または間接的のいずれかにおいて装置50に接続され得る、別のポータブルカメラ内に含まれてもよい。したがって、カメラ55は、発生されるデジタル画像を処理するステップに関わる、コンピューティングデバイス内に含まれてもよい、またはカメラ55は、発生されるデジタル画像を処理するステップに関わる、コンピューティングデバイスに通信可能に接続されてもよい。
【0041】
さらに、未加工データが特に限定されないことが、当業者によって、本開示の恩恵とともに理解されるはずである。本実施例では、未加工データは、着目オブジェクト(例えば、人体)の1つまたはそれを上回るデジタル画像を表し得る。デジタル画像は、カメラ55によって捕捉される、ビデオのフレームを表し得る。有利には、オブジェクトが表される様式(また、未加工データの厳密なフォーマット)は、特に限定されない。例えば、各デジタル画像は、ラスタグラフィックファイル、または、例えば、MPEG-4フォーマットまたはJPEGフォーマットに従ってフォーマット化された、圧縮された画像ファイルであってもよい。他の実施形態では、デジタル画像は、RGBフォーマットに従ってフォーマット化される(すなわち、各ピクセルが、赤色値、緑色値、および青色値を割り当てられる)。また、未加工データが、可視光を使用して発生される、デジタル画像に限定されないことも、理解されたい。上記に述べられるように、装置50は、代わりに、赤外領域、近赤外領域、または紫外領域を網羅するように設計される、画像センサを含み得る。したがって、未加工データは、可視のデジタル画像の代わりとして、またはそれに加えて、赤外デジタル画像または紫外デジタル画像を含んでもよい。未加工データが、可視情報に加えて赤外情報および/または紫外情報を含む、実施形態では、カメラ55は、着目オブジェクトを観察する、複数の画像センサのうちの1つであり得る。これらの複数の画像センサによって発生された画像データは、別個に(例えば、別個のデジタル画像として)記憶され得る、またはこれらの複数の画像センサによって発生された画像データは、(例えば、ピクセルあたりベースで深度を規定する第4の寸法を含む、RGB-Dデジタル画像のように)ともに記憶され得る。
【0042】
デジタル画像内で捕捉された(したがって、未加工データによって表される)オブジェクトもまた、特に限定されない。例証の目的のために、本開示の実施形態は、人を撮像することとの関連において説明される。しかしながら、これらの実施形態の特徴は、動物または機械(例えば、車両またはロボットデバイス)等の運動中であり得る、他のタイプのオブジェクトにも同様に適用可能であり得る。故に、カメラ55は、分析エンジン60がそのオブジェクトを取り扱うように訓練されていることを前提として、分析エンジン60による後続の処理のために運動中の任意のオブジェクトを撮像するために使用されてもよい。
【0043】
分析エンジン60は、カメラ55によって捕捉された未加工データを分析するステップに関わり得る。また、分析エンジン60は、続いて、その分析を使用し、コンピュータビジョンデータを発生させてもよい。分析エンジン60が未加工データを分析する様式は、特に限定されない。本実施例では、分析エンジン60は、装置50のプロセッサによってローカルで実行される。例えば、装置50が、モバイルフォンまたはタブレット型コンピュータであると仮定する。これら等の現代のコンピューティングデバイスは、概して、効率的な様式においてモデルを使用して分析を行うために必要とされる計算リソースを有する。モデルは、例えば、ニューラルネットワークに基づき得る。モデルが、ニューラルネットワークを表す場合、分析エンジン60によって使用されるニューラルネットワークは、装置50上へのインストールに先立って訓練される、または(例えば、インターネット等のネットワークを介して)装置50に利用可能である、訓練データを使用して、装置50上でのインストールの後に訓練されてもよい。代替として、分析エンジン60は、下記にさらに議論されるように、装置50の外部にあるプロセッサによって、遠隔で実行され得る。
【0044】
当業者は、分析エンジン60によって使用されるモデルのタイプおよびアーキテクチャが、特に限定されないことを認識するであろう。上記に述べられるように、モデルは、コンピュータビジョンベースの人間姿勢およびセグメント化システムの一部として使用され得る、ニューラルネットワークを表し得る。具体的実施例として、分析エンジン60は、「Human Pose Analysis System and Method」と題された、WIPO公開第2020/000096号、「Method and System for Monocular Depth Estimation of Persons」と題された、WIPO公開第2020/250046号、または「Method and System for Matching 2D Human Poses from Multiple Views」と題された、WIPO公開第2021/186225号(そのそれぞれは、参照することによってその全体として本明細書に組み込まれる)に説明される、人工知能(AI)エンジンを使用する、または表し得る。他の実施形態では、分析エンジン60は、リアルタイム検出ライブラリ(例えば、OpenPose、AlphaPose、またはPoseNet)、畳み込みニューラルネットワーク(CNN)(例えば、Mask R-CNN)、または立体カメラまたは光検出および測距(LiDAR)センサシステム(例えば、Microsoft KinectまたはIntel RealSense)に基づく深度センサを含む、または利用してもよい。
【0045】
故に、分析エンジン60は、入力として提供された未加工データにモデルを適用することによって、コンピュータビジョンデータを発生させてもよい。概して、分析エンジン60は、データのシリアル化されたストリームとしてコンピュータビジョンデータを発生させる。例えば、分析エンジン60は、カメラ55によって発生されたデジタル画像が、順次、モデルの中にフィードされるにつれて、リアルタイムでコンピュータビジョンデータの「チャンク」を出力してもよい。上記に述べられるように、これらのデジタル画像は、カメラ55によって捕捉されたビデオフィードのフレームを表し得る。コンピュータビジョンデータは、種々の形態をとることができる。例えば、コンピュータビジョンデータは、3D骨格、2D骨格、3Dメッシュ、およびセグメント化データを表す、データを含んでもよい。コンピュータビジョンデータが、コンピュータビジョンデータが下流コンピューティングデバイスおよびコンピュータプログラムに容易に転送され、それらによって取り扱われることを可能にする、ポータブルフォーマットにおいて正常に発生されることを、本開示の恩恵とともに理解されたい。ポータブルフォーマットは、種々の形態をとることができる。例えば、コンピュータビジョンデータは、公知のデータプロトコルに従って、ポータブルフォーマットに発生、構造化、またはコンパイルされ得る。別の実施例として、コンピュータビジョンデータは、分析エンジン60を開発する同一の実体によって開発された、(「wrnch eXchangeデータプロトコル」または「wrXchngデータプロトコル」とも称される)専用データプロトコルに従って、ポータブルフォーマットに発生、構造化、またはコンパイルされ得る。そのコンテンツは、変動し得るが、ポータブルフォーマットは、概して、コンピュータビジョンデータおよび関連付けられるメタデータ(例えば、タイムスタンプ、対応する未加工データを発生させた装置と関連付けられるソース識別子、コンピュータビジョンデータまたはサイズ、長さ等の対応する未加工データに関する情報等)のためのデータ構造を提供する。いくつかの実施形態では、対応する未加工データはまた、ポータブルフォーマット内にも含まれる一方、他の実施形態では、対応する未加工データは、ポータブルフォーマットと別個である、装置50から離れるように転送される。
【0046】
図1に示されていないが、装置50は、通常、カメラ55によって捕捉された未加工データが、分析エンジン60による分析に先立って、少なくとも一時的に記憶される、メモリを含む。特に、メモリは、それからコンピュータビジョンデータが発生されることになる一連のデジタル画像を含む、未加工データを記憶してもよい。本実施例では、メモリは、そのそれぞれが、ある期間にわたって捕捉される、デジタル画像を表す、複数のフレームを含む、ビデオを含んでもよい。フレームの品質は、装置50の特性(例えば、メモリ空間、処理能力)またはカメラ55の特性(例えば、分解能)に基づき得る。同様に、デジタル画像がカメラ55によって発生されるフレームレートは、装置50の特性(例えば、メモリ空間、処理能力)またはカメラ55の特性(例えば、シャッタスピード)に基づき得る。例えば、高分解能デジタル画像が、プロセッサによって十分に迅速に処理されなくてもよく、次いで、次のデジタル画像がフレームレートによって示されるように捕捉されることになる前に、メモリに書き込まれてもよい。カメラ55が、ハードウェアリソースによって限定されると、これが捕捉するデジタル画像の分解能が、低下され得る、またはデジタル画像が捕捉されるフレームレートが、減速され得る。
【0047】
メモリは、未加工データに加えて、他のデータを記憶するためにも使用され得る。例えば、メモリは、分析エンジン60によって使用され得る、種々の参照データを記憶してもよい。参照データの実施例は、発見的手法と、テンプレートと、訓練データと、モデルデータとを含む。また、メモリは、分析エンジン60によって発生されたデータを記憶するために使用されてもよい。例えば、未加工データに適用されることに応じてモデルによって発生されたコンピュータビジョンデータは、メモリ内に少なくとも一時的に記憶されてもよい。
【0048】
さらに、メモリが、(例えば、異なる個人、異なる体操セッション、異なる体操等に対応する)複数のデータベースを維持することが可能である、単一の記憶媒体であり得ることを理解されたい。代替として、メモリは、複数のコンピューティングデバイス(例えば、ネットワークアクセス可能なサーバシステムを表す、1つまたはそれを上回るコンピュータサーバに加えて、モバイルフォンまたはタブレット型コンピュータ)を横断して分散される、複数の記憶媒体であってもよい。
【0049】
メモリはまた、装置50の一般的な動作のための命令を記憶するために使用されてもよい。実施例として、メモリは、プロセッサによって、種々の構成要素およびコンピュータプログラムをサポートするための機能性等、一般的な機能性を装置50に提供するために実行可能である、オペレーティングシステムのための命令を含んでもよい。したがって、メモリは、カメラ55、スピーカ、ディスプレイ、および任意の他の入力デバイスまたは出力デバイス等、装置50の種々の構成要素を動作させるための制御命令を含んでもよい。メモリはまた、分析エンジン60を動作させるための命令を含んでもよい。
【0050】
メモリは、装置50の構成要素を動作させるための訓練データまたは命令等のデータが予めロードされてもよい。加えて、または代替として、データは、通信インターフェース65を介して装置50に転送されてもよい。例えば、命令は、通信インターフェース65を介して装置50にロードされてもよい。通信インターフェース65は、装置50との無線通信を可能にする、無線通信回路網を表し得る、または通信インターフェース65は、そこにデータ伝送のために使用されるべきケーブルの一端を接続する、物理インターフェース(「物理ポート」とも称される)を表し得る。
【0051】
通信インターフェース65は、コンピュータビジョンデータが分析のために伝送されることになる、宛先との通信を促進することに関わってもよい。分析エンジン60によって発生されたコンピュータビジョンデータは、別の装置への伝送のために通信インターフェース65に自動転送されてもよい。実施例として、装置50が、モバイルフォンまたはタブレット型コンピュータである場合、コンピュータビジョンデータは、ネットワークアクセス可能なサーバシステムの一部である、コンピュータサーバへの伝送のために通信インターフェース65に自動転送されてもよい。いくつかの実施形態では、通信インターフェース65は、無線送受信機の一部である。無線送受信機は、他の装置の無線送受信機との無線接続を自動的に確立するように構成されてもよい。これらの無線送受信機は、近距離無線通信(NFC)、無線USB、Bluetooth(登録商標)、Wi-Fi(登録商標)、セルラーデータプロトコル(例えば、LTE、3G、4G、または5G)、または専用の2地点間プロトコル等の双方向通信プロトコルを介して、相互と通信することが可能であり得る。
【0052】
他の装置(「外部装置」とも称される)が、そこにコンピュータビジョンデータが転送され得る、任意のコンピューティングデバイスであり得ることが、当業者によって理解されるはずである。例えば、外部装置は、3Dアニメーションをレンダリングするための可視化システム(「可視化器」とも称される)であり得る。別の実施例として、外部装置は、デジタル画像内に捕捉された人の移動を監視するための診断システム(「診断」とも称される)であり得る。別の実施例として、外部装置は、コンピュータビジョンデータのシリアル化されたストリームを分析し、カメラ55によって捕捉された運動と関連付けられるメトリックを決定、算出、または別様に提供するための、分析システム(「分析器」とも称される)であり得る。故に、装置50は、運動中のオブジェクト(例えば、人)を捕捉するための単純な様式を提供し、次いで、下流コンピューティングデバイスまたはコンピュータプログラムによって分析され得る、ポータブルフォーマットにおけるコンピュータビジョンデータを発生させる。
【0053】
図2は、未加工データに基づいてコンピュータビジョンデータを発生させるための方法200のフローチャートを含む。方法200の解説を補助するために、方法200が、図1の装置50によって実施されることを想定されたい。実際には、方法200は、装置50が構成され得る1つの方法であり得る。さらに、方法200の以下の議論は、装置50およびその構成要素のさらなる理解につながり得る。方法200が、必ずしも示されるような厳密なシーケンスにおいて実施されない場合があることが強調される。種々のステップが、シーケンスにおいてではなく、並行して実施されてもよい、または種々のステップは、完全に異なるシーケンスにおいて実施されてもよい。
【0054】
最初に、装置50が、カメラ55を使用して未加工データを捕捉することができる(ステップ210)。未加工データは、着目オブジェクトの1つまたはそれを上回るデジタル画像を含んでもよい。実施例として、デジタル画像は、人が物理的環境を中心として移動している間に捕捉される、ビデオのフレームを表し得る。いったん装置50によって受信されると、未加工データは、メモリ内に記憶されることができる(ステップ220)。
【0055】
その後、装置50は、未加工データを分析することができる(ステップ230)。より具体的には、装置50は、デジタル画像内に含有される人についての情報を算出、推測、または別様に取得するように、未加工データを入力として分析エンジン60に提供してもよい。装置50によって取得される情報は、特に限定されない。例えば、情報は、3Dメッシュを形成するためのセグメント化マップ、関節ヒートマップ、または表面情報を含んでもよい。いくつかの実施形態では、分析エンジン60は、複数の人々がそのデジタル画像内に存在する場合、各デジタル画像内の人を識別し得る。換言すると、分析エンジン60は、複数の人々の中から着目されている人を識別し、次いで、着目されている人の移動を監視することが可能であり得る。いくつかの状況では、デジタル画像内の着目されている人は、他のオブジェクト(例えば、他の人々)と重複し得る。分析エンジン60は、重複が、着目されている人の移動を監視するためのその能力に影響を及ぼさないように、着目されている人の分析に先立って、種々のオブジェクトを分離することが可能であり得る。
【0056】
装置50は、次いで、ステップ230において取得された情報に基づいて、コンピュータビジョンデータを発生させることができる(ステップ240)。本実施例では、分析エンジン60によって生産された(より具体的には、未加工データ、情報、または両方に適用されたモデルによって出力された)コンピュータビジョンデータは、他のコンピューティングデバイスおよびコンピュータプログラムによって読み取られ得る、ポータブルデータ構造(「データファイル」とも称される)内に取り込まれる、またはエンコードされることができる。例えば、コンピュータビジョンデータは、wrXchngフォーマットに従ってフォーマット化されたデータ構造内に取り込まれる、またはエンコードされ、次いで、装置50は、そのデータ構造を宛先に伝送し得る(ステップ250)。宛先は、本装置に通信可能に接続される、別のコンピューティングデバイスであり得る、または宛先は、装置50上で実行しているコンピュータプログラムであり得る。
【0057】
図3は、着目オブジェクトと関連付けられる未加工データを捕捉するための装置350を実装することが、可能である、システム300のある実施例を図示する。装置350が、図1の装置50に類似し得ることを理解されたい。故に、当業者は、図3の装置350および図1の装置50が、相互に取って代わられ得ることを本開示の恩恵とともに理解するであろう。
【0058】
本実施例では、装置350は、次いで、分析エンジン360の中にフィードされるデジタル画像を発生させるように構成される、カメラ355を含む。上記に議論されるように、分析エンジン360は、デジタル画像に基づいてコンピュータビジョンデータを発生させてもよい。例えば、分析エンジン360は、コンピュータビジョンデータの連続的なストリームを発生させるように、モデルを各デジタル画像に適用してもよい。概して、コンピュータビジョンデータは、装置350から離れるような伝送に先立って、1つまたはそれを上回るデータ構造の中に取り込まれる、またはエンコードされる。実施例として、コンピュータビジョンデータは、データ構造にエンコードされてもよく、次いで、データ構造は、伝送目的のためのペイロードとしての役割を果たす、データ構造をエンコードする、エンコーダ365に、入力として提供されてもよい。
【0059】
上記に述べられるように、コンピュータビジョンデータは、1つまたはそれを上回る下流コンピューティングデバイスまたはコンピュータプログラムに伝送されることができる。ここでは、例えば、コンピュータビジョンデータは、2つのコンピューティングデバイス、すなわち、可視化器370および分析器375に伝送される。可視化器370および分析器375のそれぞれにおいて、デコーダ380a、380bは、その中に含有されるコンピュータビジョンデータがアクセス可能であるように、データ構造をデコードするステップに関わってもよい。
【0060】
図4は、本明細書に説明されるアプローチを集合的に実装することが可能である、複数の装置450a-dを含む、システム400のある実施例を図示する。複数の装置450a-dは、便宜上、集合的に、「装置450」と称され得る。再び、装置450は、図1の装置50に類似し得る。
【0061】
上記に述べられるように、コンピュータビジョンデータは、未加工である、処理される、またはそれらの組み合わせであることができる。未加工コンピュータビジョンデータは、未加工または圧縮されたビデオデータ、オーディオデータ、熱センサデータ等を含み得る。処理されたコンピュータビジョンデータは、2D画像面内の解剖学的特徴(例えば、骨、筋肉、または関節)の(例えば、ピクセル座標における)場所、3D空間内の解剖学的特徴の場所、ビデオデータ内で検出された人間に関する3D関節回転、ビデオデータ内に描写される人間の2Dカットアウト(例えば、検出された人間あたり1つの画像マスク)、ビデオデータ内に描写される人間によって実施される(例えば、活動を表す)移動または一連の移動の文字または数字説明、ビデオデータ内に描写される人間の形状を表す3Dボクセル、および同等物を含み得る。
【0062】
しかしながら、装置450の全てが、必ずしも未加工データを発生させる必要があるわけではないことに留意されたい。いくつかの実施形態では、装置450の全てが、未加工データを発生させ、本未加工データは、ローカルで(すなわち、それを発生させる装置450によって)または遠隔で(例えば、装置450、またはコンピュータサーバ等の別のコンピューティングデバイスのうちの一方によって)処理されることができる。他の実施形態では、装置450のサブセットが、未加工データを発生させる。したがって、各装置450が、未加工データを発生させる、および/またはコンピュータビジョンデータを発生させることが可能であり得る。
【0063】
本実施例では、装置450aは、次いで、分析エンジン454の中にフィードされる、デジタル画像を捕捉するためのカメラ452を含む。分析エンジン454によって出力として生産されたコンピュータビジョンデータ456は、次いで、続いて、下流の宛先に伝送されることができる。例えば、コンピュータビジョンデータ456は、複数のソースからコンピュータビジョンデータを収集するためのハブ装置458(または単に「ハブ」)として作用する、別のコンピューティングデバイスに伝送されてもよい。各ソースは、異なる角度(したがって、異なる視点)からの未加工データを発生させる、装置450の異なるものを表し得る。複数のソースから入手されたコンピュータビジョンデータを同期化するために、ハブ458は、各ソースによってコンピュータビジョンデータに添付されたタイムスタンプを診査してもよい。故に、ハブ458は、複数の装置450から受信されたコンピュータビジョンデータ456を組み合わせ、コンピュータビジョンデータが単一の視点から発生される場合より正確であり得る、「混成された」3Dデータセットを発生させるために使用されてもよい。したがって、図4に示される実装は、ユーザが、高品質のコンピュータビジョンデータ456を取得するために複数の装置450を展開することを可能にし得る。
【0064】
図5は、装置550が、可視化器558として作用する別のコンピューティングデバイスに通信可能に接続される、システム500のある実施例を図示する。再び、装置550は、図1の装置50に類似し得る。本実施例では、装置550は、分析エンジン554にフィードされるデジタル画像を捕捉するための、カメラ552を含む。分析エンジン554は、出力としてコンピュータビジョンデータを生産してもよく、コンピュータビジョンデータは、続いて、(例えば、ビデオファイル560の形態にある)デジタル画像またはメタデータ562に加えて、(例えば、インターネット接続556を介して)可視化器558に伝送されることができる。メタデータ562は、装置550を、デジタル画像またはコンピュータビジョンデータのソースとして識別してもよい。メタデータ562は、可視化器558へのその伝送に先立って、デジタル画像またはコンピュータビジョンデータに添付されることができる。可視化器558は、コンピュータビジョンデータの分析に加えて、またはその代わりに、インターフェース564上にビデオファイル560の表示を引き起こしてもよい。実施例として、可視化器558は、着目オブジェクト(例えば、人)の移動を視覚的に示すように、コンピュータビジョンデータまたはコンピュータビジョンデータの分析を表示してもよい。
【0065】
図6は、装置650が、ネットワークアクセス可能なリソース658(「クラウドベースのリソース」または単に「クラウド」とも称される)に通信可能に接続される、システム600のある実施例を図示する。再び、装置650は、図1の装置50に類似し得る。本実施例では、装置650は、分析エンジン654にフィードされるデジタル画像を捕捉するためのカメラ652を含む。分析エンジン654は、出力としてコンピュータビジョンデータを生産してもよく、コンピュータビジョンデータは、続いて、(例えば、ビデオファイル660の形態にある)デジタル画像またはメタデータ662に加えて、クラウド658を介して(例えば、インターネット接続656を介して)別のコンピューティングデバイスに伝送されることができる。クラウド658は、コンピュータビジョンデータを処理する別のコンピューティングデバイスによる読出に備えて、メモリ664内に単にコンピュータビジョンデータを記憶してもよい。代替として、クラウド658は、コンピュータビジョンデータを処理してもよい。故に、コンピュータビジョンデータは、当事者がコンピューティングデバイスにダウンロードするコンピュータプログラムに基づくサービスとして、別の当事者に提供されてもよい。
【0066】
図7は、装置750a-cの3つの異なる実装を図示する。再び、装置750a-cは、図1の装置50に類似し得る。本実施例では、装置750aは、オペレーティングシステム(例えば、Apple Inc.によって開発されたiOSオペレーティングシステム、またはGoogle LLCによって開発されたAndroid(登録商標)オペレーティングシステム)を実行するコンピューティングデバイス上に実装され、装置750bは、(例えば、グラフィック処理ユニット(GPU)を含み、Microsoft Corp.によって開発されたWindows(登録商標)オペレーティングシステムを実行する)より高性能のコンピューティングデバイス上に実装され、別の装置750cは、オペレーティングシステム(例えば、Apple Inc.によって開発されたiOSオペレーティングシステム、またはGoogle LLCによって開発されたAndroid(登録商標)オペレーティングシステム)を実行するコンピューティングデバイス上に実装される。図7に見られ得るように、コンピュータプログラム(「捕捉アプリケーション」または「捕捉アプリ」とも称される)は、捕捉エンジンと、分析エンジンとの両方を含む、装置750a-b上で実行する。したがって、これらの捕捉アプリケーションは、入力として未加工データ(例えば、ビデオフィード)を受信し、次いで、出力としてコンピュータビジョンデータを生産することが可能であり得る。逆に、装置750上で実行する捕捉アプリケーションは、捕捉エンジンのみを含む。したがって、捕捉エンジンによって取得された未加工データは、分析のために別の装置(例えば、本実施例では、装置750b)上で実行する、別の捕捉アプリケーションに自動転送されてもよい。
【0067】
図8は、装置850が、ラップトップコンピュータ858に通信可能に接続されるモバイルフォンである、システム800のある実施例を図示する。当業者は、タブレット型コンピュータまたはデスクトップコンピュータ等の他のタイプのコンピューティングデバイスも、ラップトップコンピュータ858の代わりに使用され得ることを認識するであろう。装置850は、図1の装置50に類似し得る。
【0068】
装置850が、カメラ852を伴うモバイルフォンである、実施形態では、カメラ852によって発生されたデジタル画像(例えば、体操、ダンス等の活動を実施する人のビデオ)が、モバイルフォン上で実行するモバイルアプリケーションによって実装される、分析エンジン854にフィードされることができる。分析エンジン854によって発生されたコンピュータビジョンデータは、続いて、(例えば、Wi-Fiを介して)分析のためにラップトップコンピュータ858上で実行する別のコンピュータプログラム856に伝送されてもよい。コンピュータビジョンデータは、カメラ852によって発生される、ラップトップコンピュータ858によって表示されることになる、デジタル画像を伴い得る。故に、ラップトップコンピュータ858上で実行する他のコンピュータプログラム856は、可視化器を表し得る。
【0069】
図9は、装置950が、情報(例えば、未加工データまたはコンピュータビジョンデータ)が異なるコンピューティングデバイス間で容易に共有されることを可能にする、インターネットベースの協業サービスに通信可能に接続される、モバイルフォンである、システム900のある実施例を図示する。再び、当業者は、別のタイプのコンピューティングデバイスも、モバイルフォンおよびラップトップコンピュータの代わりに使用され得ることを認識するであろう。例えば、装置950は、分析のためにコンピュータビジョンデータをコンピュータサーバにアップロードするように構成される、タブレット型コンピュータであってもよい。
【0070】
装置950が、カメラ952を伴うモバイルフォンである、実施形態では、カメラ952によって発生されたデジタル画像(例えば、体操、ダンス等の活動を行う人のビデオ)は、入力として分析エンジン954に提供されることができる。図9に示されるように、分析エンジン954は、出力として生産されたコンピュータビジョンデータが下流コンピューティングデバイスまたはコンピュータプログラムに提供されることを可能にする、インターネットベースの協業サービス956(例えば、LiveLink)を介して実行されてもよい。ここでは、例えば、コンピュータビジョンデータは、ラップトップコンピュータ958上で実行する可視化器960に提供される。
療法プラットフォームの概観
【0071】
上記に述べられるように、分析エンジン(例えば、図1の分析エンジン60)によって生産されたコンピュータビジョンデータは、種々の下流コンピューティングデバイスおよびコンピュータプログラムによって使用されることができる。そのようなコンピュータプログラムの一実施例は、完了のために患者に割り当てられた処置プログラム(または単に「プログラム」)への準拠およびその成功を改良するために設計される、療法プラットフォームである。図10-12では、特徴は、プログラムの一部として実施されるセッションを通して患者を誘導することに関わる、療法プラットフォームとの関連において説明される。しかしながら、当業者は、コンピュータビジョンデータが、上記で議論されるような種々の他の方法においても使用され得ることを認識するであろう。
【0072】
図10は、療法プラットフォーム1002を含む、ネットワーク環境1000のある実施例を図示する。個人は、インターフェース1004を介して療法プラットフォーム1002と相互作用することができる。例えば、患者は、彼らをセッションを通して誘導し、教育的コンテンツを提示し、プログラムの進行過程を示し、指導者からのフィードバックを提示すること等を行うように設計される、インターフェースにアクセスすることが可能であり得る。別の実施例として、医療従事者は、それを通して完了されたセッション(したがって、プログラム完了)に関する情報および臨床データが精査され得、フィードバックが提供され得る等である、インターフェースにアクセスすることが可能であり得る。したがって、療法プラットフォーム1002によって発生されるインターフェース1004は、患者または医療従事者のための有益な空間、またはそれを通して患者および医療従事者が相互と通信し得る、協業空間としての役割を果たし得る。
【0073】
図10に示されるように、療法プラットフォーム1002は、ネットワーク環境1000内に常駐してもよい。したがって、療法プラットフォーム1002がその上で実行している本装置は、1つまたはそれを上回るネットワーク1006a-bに接続されてもよい。本装置は、図1の装置50であり得る、または本装置は、図1の装置50に通信可能に接続され得る。ネットワーク1006a-bは、パーソナルエリアネットワーク(PAN)、ローカルエリアネットワーク(LAN)、広域ネットワーク(WAN)、都市規模ネットワーク(MAN)、セルラーネットワーク、インターネット等を含むことができる。加えて、または代替として、本装置は、Bluetooth(登録商標)、近距離無線通信(NFC)、Wi-Fiダイレクト(「Wi-Fi P2P」とも称される)、および同等物等の近距離無線コネクティビティ技術を経由して、他の装置に通信可能に結合されることができる。実施例として、療法プラットフォーム1002は、いくつかの実施形態では、タブレット型コンピュータによって実行可能である、モバイルアプリケーションとして具現化される。そのような実施形態では、タブレット型コンピュータは、インターネットを介してコンピュータビジョンデータを記憶する、または取り扱う、近距離無線コネクティビティ技術およびコンピュータサーバを介して未加工データを発生させる、モバイルフォンに通信可能に接続されてもよい。
【0074】
いくつかの実施形態では、療法プラットフォーム1002の少なくともいくつかの構成要素が、ローカルでホストされる。すなわち、療法プラットフォーム1002の一部が、インターフェース1004のうちの1つにアクセスするために使用される装置上に常駐してもよい。例えば、療法プラットフォーム1002は、モバイルフォンまたはタブレット型コンピュータ上で実行するモバイルアプリケーションとして具現化されてもよい。しかしながら、モバイルアプリケーションが、その上で療法プラットフォーム1002の他の構成要素がホストされる、ネットワークアクセス可能なサーバシステム1008に通信可能に接続され得ることに留意されたい。
【0075】
他の実施形態では、療法プラットフォーム1002は、例えば、Amazon Web Services(登録商標)(AWS)、Google Cloud PlatformTM、またはMicrosoft Azure(登録商標)によって動作される、クラウドコンピューティングサービスによって完全に実行される。そのような実施形態では、療法プラットフォーム1002は、1つまたはそれを上回るコンピュータサーバから成る、ネットワークアクセス可能なサーバシステム1008上に常駐してもよい。これらのコンピュータサーバは、異なるプログラム、セッション、または身体活動に関する情報と、未加工データ(例えば、デジタル画像)の分析に基づいてコンピュータビジョンデータを発生させるためのモデルと、コンピュータビジョンデータの分析に基づいてオブジェクト(例えば、人)の移動を確立するためのモデルと、未加工データを処理するためのアルゴリズムと、氏名、年齢、体重、病気、登録されたプログラム、登録の持続時間、完了されたセッションの数、および指導者とのやりとり等の患者データと、他の資産とを含むことができる。当業者は、本情報がまた、複数の装置間に分散され得ることを認識するであろう。例えば、ある患者データが、セキュリティおよびプライバシ目的のために、患者自身のモバイルフォン上に記憶され、それによって処理されてもよい。本情報は、ネットワークアクセス可能なサーバシステム1008に伝送される前に処理されてもよい(例えば、不明瞭にされてもよい)。別の実施例として、未加工データまたはコンピュータビジョンデータを処理するために必要とされるアルゴリズムおよびモデルが、そのようなデータを発生させ、そのようなデータがリアルタイムで(例えば、身体活動がセッションの一部として実施されている際に)処理され得ることを確実にする、装置上に記憶されてもよい。
【0076】
図11は、患者が、療法プラットフォーム1112によるセッションの間に、体操等の身体活動を実施することが要求されるプログラムを実装することが可能である、装置1100のある実施例を図示する。いくつかの実施形態では、療法プラットフォーム1112は、装置1100によって実行されるコンピュータプログラムとして具現化される。他の実施形態では、療法プラットフォーム1112は、それに装置1100が通信可能に接続される、別の装置(例えば、コンピュータサーバ)によって実行される、コンピュータプログラムとして具現化される。そのような実施形態では、装置1100は、未加工データ、コンピュータビジョンデータ、または患者によって提供される入力等の関連のある情報を、処理のために他の装置に伝送してもよい。当業者は、コンピュータプログラムの側面がまた、複数の装置間に分散され得ることを認識するであろう。
【0077】
装置1100は、プロセッサ1102、メモリ1104、ディスプレイ1106、通信モジュール1108、画像センサ1110、またはそれらの任意の組み合わせを含むことができる。これらの構成要素はそれぞれ、下記により詳細に議論される。当業者は、これらの構成要素の異なる組み合わせが、装置1100の本質に応じて存在し得ることを認識するであろう。
【0078】
プロセッサ1102は、汎用目的プロセッサに類似する、一般的特性を有することができる、またはプロセッサ1102は、装置1100に制御機能を提供する、特定用途向け集積回路(ASIC)であってもよい。図11に示されるように、プロセッサ1102は、通信目的のために、直接的または間接的のいずれかにおいて、装置1100の全ての構成要素に結合されることができる。
【0079】
メモリ1104は、静的ランダムアクセスメモリ(SRAM)、動的ランダムアクセスメモリ(DRAM)、電気的に消去可能なプログラマブル読取専用メモリ(EEPROM)、フラッシュメモリ、またはレジスタ等の任意の好適なタイプの記憶媒体から成り得る。プロセッサ1102によって実行され得る命令を記憶することに加えて、メモリ1104はまた、(例えば、療法プラットフォーム1112のモジュールを実行するときに)プロセッサ302によって発生された、通信モジュール1108によって取得された、または画像センサ1110によって生成されたデータを記憶することもできる。メモリ104が、記憶環境の抽象表現にすぎないことに留意されたい。メモリ104は、実際のメモリチップまたはモジュールから成り得る。
【0080】
ディスプレイ1106は、ユーザに視覚的に情報を伝達するように動作可能である、任意の機構であることができる。例えば、ディスプレイ1106は、発光ダイオード(LED)、有機LED、液晶素子、または電気泳動素子を含む、パネルであってもよい。いくつかの実施形態では、ディスプレイ1106は、タッチセンサ式である。したがって、ユーザは、ディスプレイ1106と相互作用することによって療法プラットフォーム1112に入力を提供することが可能であり得る。
【0081】
通信モジュール1108は、装置1100の構成要素間の通信を管理することに関わってもよい、または通信モジュール1108は、他の装置(例えば、図11のサーバシステム1108)との通信を管理することに関わってもよい。通信モジュール1108は、他の装置との通信チャネルを確立するように設計される、無線通信回路網であってもよい。無線通信回路網の実施例は、Bluetooth(登録商標)、Wi-Fi、NFC、および同等物のために構成される、集積回路(「チップ」とも称される)を含む。図1を参照すると、通信モジュール1108は、通信インターフェース65をサポートまたは開始してもよい、または通信モジュール1108は、通信インターフェース65を表し得る。
【0082】
画像センサ1110は、画像データを発生させるために、情報を検出および伝達することが可能である、任意の電子的センサであってもよい。画像センサの実施例は、電荷結合素子(CCD)センサおよび相補型金属酸化膜半導体(CMOS)センサを含む。画像センサ1110は、装置1100内に実装されるカメラ内に実装されてもよい。いくつかの実施形態では、画像センサ1110は、装置1100内に実装される複数の画像センサのうちの1つである。例えば、画像センサ1110はモバイルフォンまたはタブレット型コンピュータ上の正面または背面向きカメラ内に含まれ得る。
【0083】
便宜上、療法プラットフォーム1112は、メモリ1104内に常駐する、コンピュータプログラムと称される。しかしながら、療法プラットフォーム1112は、装置1100内に実装される、またはそれにアクセス可能である、ソフトウェア、ファームウェア、またはハードウェアから成り得る。本明細書に説明される実施形態によると、療法プラットフォーム1112は、処理モジュール1114と、分析エンジン1116と、グラフィカルユーザインターフェース(GUI)モジュール1118とを含んでもよい。これらのモジュールはそれぞれ、療法プラットフォーム1112の不可欠な部分であることができる。代替として、これらのモジュールは、論理的に療法プラットフォーム1112と別個であるが、これを「並行して」動作させることができる。ともに、これらのモジュールは、療法プラットフォーム1112が、画像センサ1110によって発生された未加工データと関連付けられるコンピュータビジョンデータの分析を通して、着目オブジェクト(例えば、人)の移動を確立することを可能にする。
【0084】
処理モジュール1114は、療法プラットフォーム1112によって、セッションの過程にわたって取得されたデータを、他のモジュールのために好適であるフォーマットに処理することができる。例えば、処理モジュール1114は、療法プラットフォーム1112の他のモジュールによる分析に備えて、画像センサ1110によって発生されたデジタル画像に動作を適用してもよい。したがって、処理モジュール1114は、画像センサ1110によって発生されたデジタル画像からスペックル除去する、ノイズ除去する、または別様にそれをフィルタ処理してもよい。加えて、または代替として、処理モジュール1116は、療法プラットフォーム1112の他のモジュールによって生産された出力を改良するために、コントラスト、彩度、および利得のような性質を調節してもよい。
【0085】
上記に述べられるように、療法プラットフォーム1112は、いくつかの実施形態では、1つまたはそれを上回る他の装置1120a-nから未加工データまたはコンピュータビジョンデータを受信し得る。例えば、装置1100は、別の視点から人を監視する、別の装置1120aから、未加工データまたはコンピュータビジョンデータを受信してもよい。療法プラットフォーム1112が少なくとも1つの他のソースから未加工データまたはコンピュータビジョンデータを取得する、実施形態では、処理モジュール1114はまた、これらのデータと相互を時間的に整合させることに関わってもよい。
【0086】
分析エンジン1116は、画像センサ1110によって発生された未加工データに基づいて、コンピュータビジョンデータを発生させることに関わってもよい。図11の分析エンジン1116は、図1の分析エンジン60に類似し得る。コンピュータビジョンデータを発生させることに加えて、分析エンジン1116は、コンピュータビジョンデータからの観察下にある人との健康に関連する観察を算出、推測、または別様に決定することが可能であり得る。
【0087】
例えば、分析エンジン1116が、複数の装置によって発生された未加工データに基づいて発生された、人の2D骨格を取得すると仮定する。これらの2D骨格は、人に関する3D骨格を生成するために「融合」されることができる。本3D骨格は、人の健康状態をより深く理解するために使用され得る。例えば、本3D骨格は、転倒検出、歩容分析、(例えば、労力のレベルを確立することによる)活動分析、微細運動移動分析、可動域分析、および同等物を実施するために使用され得る。
【0088】
別の実施例として、コンピュータビジョンデータは、物理的環境の完全に重複する、部分的に重複する、または重複していない面積に向かって配向される、いくつかの装置からの(例えば、筋肉、骨等のサイズおよび位置を示す)筋骨格データを表し得る。筋骨格データは、分析エンジン1116によって、物理的環境内に位置する個人の一部または全てに関する、ある期間(例えば、数秒または数分)にわたった、より精密な一連の筋骨格データを生産するために、アルゴリズムを使用して処理され得る。本筋骨格データは、これらの個人の健康状態をより深く理解するために使用され得る。例えば、本筋骨格データは、転倒検出、歩容分析、(例えば、労力の推定されるレベルを確立することによる)活動分析、微細運動移動分析、可動域分析、(例えば、筋肉によって体験されている疲労の推定されるレベルを確立することによる)筋肉疲労推定、(例えば、萎縮または異常を検出するための)筋肉分布分析、肥満度指数(BMI)分析、および同等物を実施するために使用されてもよい。
【0089】
別の実施例として、コンピュータビジョンデータは、物理的環境の完全に重複する、部分的に重複する、または重複していない面積に向かって配向される、いくつかの装置からの熱撮像データおよび/または非侵襲的撮像データ(例えば、テラヘルツ像)との組み合わせにおける、筋骨格データを表し得る。これらのデータは、分析エンジン1116によって、物理的環境内に位置する個人の一部または全てに関する、ある期間(例えば、数秒または数分)にわたった、より精密な筋骨格データ、血管流動データ、および身体形状データを生産するために、アルゴリズムを使用して処理され得る。これらのデータは、これらの個人の健康状態をより深く理解するために使用され得る。例えば、これらのデータは、転倒検出、歩容分析、(例えば、労力の推定されるレベルを確立することによる)活動分析、微細運動移動分析、可動域分析、(例えば、筋肉によって体験されている疲労の推定されるレベルを確立することによる)筋肉疲労推定、(例えば、萎縮または異常を検出するための)筋肉分布分析、BMI分析、(例えば、血流が異常であるかどうかを示すように、血流の推定される速さおよび体積を確立することによる)血流分析、(例えば、温かい解剖学的領域または冷たい解剖学的領域を識別するように、1つまたはそれを上回る解剖学的領域内に、身体の表面に沿って温度を確立することによる)身体ヒート分析、および同等物を実施するために使用されてもよい。
【0090】
GUIモジュール1118は、ディスプレイ1106上に提示され得るインターフェースを発生させることに関わってもよい。種々のタイプの情報が、これらのインターフェース上に提示されることができる。例えば、(例えば、コンピュータビジョンデータの分析に基づく)分析エンジン1116によって計算、導出、または別様に取得された情報は、患者または医療従事者への表示のためにインターフェース上に提示されてもよい。別の実施例として、視覚フィードバックが、未加工データが画像センサ1110によって発生される間に、物理的環境を中心として移動する方法を患者に示すようにインターフェース上に提示されてもよい。
【0091】
図12は、1つまたはそれを上回るソースからデータを取得するように構成される療法プラットフォーム1202を含む、通信環境1200のある実施例を描写する。ここでは、療法プラットフォーム1202は、タブレット型コンピュータ1206および1つまたはそれを上回るセンサユニット1208、モバイルフォン1210、またはネットワークアクセス可能なサーバシステム1212から成る療法システム1204(集合的に、「ネットワーク化されたデバイス」と称される)からデータを取得してもよい。セッションの間に、療法プラットフォーム1202は、タブレット型コンピュータによって発生された画像データと、センサユニット1208によって発生された運動データと、モバイルフォン1210によって発生された画像データと、ネットワークアクセス可能なサーバシステム1212からの他の情報(例えば、療法投与計画情報、体操によって誘発された移動のモデル、医療従事者からのフィードバック、および処理動作)とを含む、種々のデータを取得してもよい。当業者は、療法プラットフォーム1202によって取得されるデータの本質およびそれからデータが取得されるソースの数が、その展開に依存するであろうことを認識するであろう。
【0092】
ネットワーク化されたデバイスは、1つまたはそれを上回るネットワークを介して療法プラットフォーム1202に接続されることができる。これらのネットワークは、PAN、LAN、WAN、MAN、セルラーネットワーク、インターネット等を含むことができる。加えて、または代替として、ネットワーク化されたデバイスは、近距離無線コネクティビティ技術を経由して相互と通信してもよい。例えば、療法プラットフォーム1202が、タブレット型コンピュータ1206上に常駐する場合、運動データは、第1のBluetooth(登録商標)通信チャネルを経由してセンサユニット1208から取得されてもよく、画像データは、第2のBluetooth(登録商標)通信チャネルを経由してモバイルフォン1210から取得されてもよく、情報は、Wi-Fi通信チャネルを介してインターネットを経由してネットワークアクセス可能なサーバシステム1212から取得されてもよい。
【0093】
通信環境1200の実施形態は、ネットワーク化されたデバイスのサブセットを含み得る。例えば、通信環境1200は、いかなるセンサユニット1208も含まない場合がある。そのような実施形態では、療法プラットフォーム1202は、タブレット型コンピュータ1206によって発生された画像データおよび/またはモバイルフォン1210によって発生された画像データの分析に基づいて、リアルタイムで人の移動を監視してもよい。
コンピュータビジョンデータの分析を通した健康ステータスの決定
【0094】
図13は、コンピュータビジョンデータの分析を通して個人の健康ステータスを決定するための方法1300のフローチャートを含む。最初に、療法プラットフォームが、画像センサによって、患者が位置する物理的環境の高速連続において発生された、一連のデジタル画像を入手することができる(ステップ1310)。一連のデジタル画像は、画像センサによって発生されたビデオファイルのフレームを表し得る。概して、療法プラットフォームは、画像センサと同一の装置上に実装される。しかしながら、それは、必ずしもそうである必要はない。例えば、療法プラットフォームが、少なくとも部分的に、ネットワーク(例えば、インターネット)を介してアクセス可能である、コンピュータサーバ上に実装される場合、一連のデジタル画像は、療法プラットフォームに到達するためにネットワークをトラバースする必要があり得る。
【0095】
療法プラットフォームは、次いで、一連のデジタル画像にモデルを適用し、一連の出力を生産することができる(ステップ1320)。一連の出力の各出力は、一連のデジタル画像の対応するデジタル画像の分析を通して決定されるような、個人の空間位置に関する情報を表し得る。例えば、モデルは、デジタル画像毎に、それにわたって一連のデジタル画像が発生される、時間間隔にわたって、個人のシリアル化された姿勢を確立するように、患者の姿勢を推定するように訓練されてもよい。一連の出力は、集合的に、モデルによって出力された、コンピュータビジョンデータを表し得る。
【0096】
コンピュータビジョンデータは、種々の形態をとることができる。いくつかの実施形態では、コンピュータビジョンデータは、デジタル画像毎に、患者の1つまたはそれを上回る関節の2D場所を示す。他の実施形態では、コンピュータビジョンデータは、デジタル画像毎に、患者の1つまたはそれを上回る関節の3D場所を示す。加えて、または代替として、コンピュータビジョンデータは、デジタル画像毎に、患者の1つまたはそれを上回る関節の3D回転を示し得る。患者を表す骨格は、場所および/または回転に基づいて、2次元または3次元に再構築されてもよい。意図される用途に応じて、他のタイプのコンピュータビジョンデータも、上記に述べられるものの代わりに、またはそれに加えて発生され得る。例えば、コンピュータビジョンデータは、デジタル画像毎に、患者の1つまたはそれを上回る筋肉の場所、サイズ、または形状を示し得る。本情報は、筋肉分布が異常であるかどうかを確立すること、および患者によって及ぼされている労力のレベルを決定することに役立ち得る。別の実施例として、コンピュータビジョンデータは、患者の身体の表面を表す、熱マップを含んでもよい。本情報は、血流および温度が異常であるかどうかを決定することに役立ち得る。別の実施例として、コンピュータビジョンデータは、そのそれぞれが、その空間位置がモデルによって決定される場所を表すボクセルから成る、患者の体積表現を含んでもよい。本情報は、筋肉分布が異常であるかどうかを確立すること、およびBMIを測定することに役立ち得る。
【0097】
その後、療法プラットフォームは、コンピュータビジョンデータに基づいて、個人の健康をリアルタイムで査定することができる(ステップ1330)。査定の本質は、設計される、健康洞察のタイプに依存し得る。例えば、療法プラットフォームが、患者の筋骨格パフォーマンスを決定する任務を負うと仮定する。そのようなシナリオでは、療法プラットフォームは、セッションを開始するための要求を示す入力を受信し、個人に対して体操を実施するための命令の提示を引き起こし、コンピュータビジョンデータの分析を通して体操のパフォーマンスを監視してもよい。コンピュータビジョンデータを使用すると、療法プラットフォームは、セッションを通して患者の進展を監視し、次いで、適切なアクションを講じることが可能となり得る。例えば、個人が体操を完了したという決定に応答して、療法プラットフォームは、個人に別の体操を実施するように命令してもよい。別の実施例として、個人が体操を完了していないという決定に応答して、療法プラットフォームは、個人を支援する視覚または可聴フィードバックを提供してもよい。
【0098】
次いで、療法プラットフォームは、患者の健康に基づいてアクションを実施することができる(ステップ1340)。例えば、療法プラットフォームは、コンピュータビジョンデータまたはコンピュータビジョンデータの分析を宛先に向かって伝送してもよい。例えば、本データは、さらなる分析のために自動転送され得る、または本データは、(例えば、患者または医療従事者)に向かって提示のために自動転送され得る。別の実施例として、療法プラットフォームは、査定された健康状態に基づいて、患者が病気を表しているかどうかを決定してもよい。例えば、療法プラットフォームは、査定された健康状態に基づいて、一連の分類(例えば、中程度、軽度、重度)の中で患者を階層化し、次いで、分類に基づいて適切な治療計画を決定し得る。
【0099】
概して、療法プラットフォームは、データ構造内に、個人と関連付けられる、個人の健康に関する情報を記憶する。本データ構造は、その中に個人の健康に関する情報が、記憶され、次いで、経時的に維持される、デジタルプロファイルを表し得る。
【0100】
方法1300は、デジタル画像を発生させ、デジタル画像に基づいてコンピュータビジョンデータを生産する、単一の装置によって実行される、療法プラットフォームとの関連において説明されるが、当業者は、方法1300の側面が、1つを上回る装置によっても実施され得ることを認識するであろう。いくつかの実施形態では、方法1300は、(i)個人が位置する環境内に展開される、複数の撮像装置と、(ii)複数の撮像装置から受信されるデータ(例えば、未加工データまたはコンピュータビジョンデータ)の分析に基づいて個人の健康を査定する、処理装置とから成る、システムによって実施される。そのような実施形態では、療法プラットフォームは、そのそれぞれが対応する撮像装置によって発生される、複数の一連のデジタル画像を入手してもよい。上記に述べられるように、単一の装置が、個人を撮像し、対応するデータを分析することが可能であり得る。故に、複数の撮像装置および処理装置のうちの少なくとも1つが、単一のコンピューティングデバイスを表し得る。
処理システム
【0101】
図14は、その中に本明細書に説明される少なくともいくつかの動作が実装され得る、処理システム1400のある実施例を図示する、ブロック図である。例えば、処理システム1400の構成要素は、未加工データを発生させる、コンピュータビジョンデータを生成する、またはコンピュータビジョンデータを分析する、装置(例えば、図1の装置50)上にホストされてもよい。
【0102】
処理システム1400は、バス1416に通信可能に接続される、プロセッサ1402と、メインメモリ1406と、不揮発性メモリ1410と、ネットワークアダプタ1412と、ディスプレイ1418と、入力/出力デバイス1420と、制御デバイス1422と、記憶媒体1426を含む、駆動ユニット1424と、信号発生デバイス1430とを含み得る。バス1416は、適切なブリッジ、アダプタ、またはコントローラによって接続される、1つまたはそれを上回る物理的バスまたは2地点間接続を表す、抽象概念として図示される。バス1416は、したがって、システムバス、ペリフェラルコンポーネント相互接続(PCI)バスまたはPCIエクスプレスバス、ハイパートランスポートまたは業界標準アーキテクチャ(ISA)バス、小型コンピュータシステムインターフェース(SCSI)バス、ユニバーサルシリアルバス(USB)、集積回路間(IC)バス、または米国電気電子学会(IEEE)規格1394バス(「ファイアワイヤ」とも称される)を含むことができる。
【0103】
メインメモリ1406、不揮発性メモリ1410、および記憶媒体1426が、単一の媒体として示されているが、用語「機械可読媒体」および「記憶媒体」は、命令1428の1つまたはそれを上回るセットを記憶する、単一の媒体または複数の媒体(例えば、一元型/分散型データベースおよび/または関連付けられるキャッシュおよびサーバ)を含むものとして捉えられるべきである。用語「機械可読媒体」および「記憶媒体」はまた、処理システム1400による実行のための命令のセットを記憶、エンコード、または担持することが可能である、任意の媒体を含むものとして捉えられるものとする。
【0104】
一般に、本開示の実施形態を実装するために実行されるルーチンは、オペレーティングシステムまたは具体的なアプリケーション、コンポーネント、プログラム、オブジェクト、モジュール、または命令のシーケンス(集合的に、「コンピュータプログラム」と称される)の一部として実装されてもよい。コンピュータプログラムは、典型的には、コンピューティングデバイス内の種々のメモリおよび記憶デバイス内に種々の時間において設定される、1つまたはそれを上回る命令(例えば、命令1404、1408、1428)を含む。プロセッサ1402によって読み取られ、実行されると、命令は、処理システム1400に本開示の種々の側面を伴う要素を実行するための動作を実施させる。
【0105】
機械およびコンピュータ可読媒体のさらなる実施例は、揮発性メモリデバイスおよび不揮発性メモリデバイス1410、リムーバブルディスク、ハードディスクドライブ、および光ディスク(例えば、コンパクトディスク読取専用メモリ(CD-ROM)およびデジタル多用途ディスク(DVD))等の録画可能なタイプの媒体と、デジタルおよびアナログ通信リンク等の伝送タイプの媒体とを含む。
【0106】
ネットワークアダプタ1412は、処理システム1400が、処理システム1400および外部エンティティによってサポートされる任意の通信プロトコルを通して、処理システム1400の外部にあるエンティティとネットワーク1414内でデータを仲介することを可能にする。ネットワークアダプタ1412は、ネットワークアダプタカード、無線ネットワークインターフェースカード、ルータ、アクセスポイント、無線ルータ、スイッチ、マルチレイヤスイッチ、プロトコルコンバータ、ゲートウェイ、ブリッジ、ブリッジルータ、ハブ、デジタル媒体受信機、リピータ、またはそれらの任意の組み合わせを含むことができる。
備考
【0107】
請求される主題の種々の実施形態の前述の説明は、例証および説明の目的のために提供されている。包括的であること、または請求される主題を開示される精密な形態に限定することは、意図していない。多くの修正および変形例が、当業者に明白となるであろう。実施形態は、本発明の原理およびその実践的な適用を最良に説明し、それによって、当業者が、想定される特定の使用に適している、請求される主題、種々の実施形態、および種々の修正を理解することを可能にするために選定かつ説明された。
【0108】
詳細な説明は、ある実施形態および想定される最良形態を説明するが、本技術は、詳細な説明が表出される詳細度合いにかかわらず、多くの方法において実践されることができる。実施形態は、それらの実装の詳細において大幅に変動し得るが、依然として、本明細書によって包含されている。種々の実施形態のある特徴または側面を説明するときに使用される特定の専門用語は、その専門用語が本明細書において、その専門用語が関連付けられる技術のいかなる具体的な特性、特徴、または側面にも制限されるように再定義されることを含意すると捉えられるべきではない。一般に、以下の請求項において使用される用語は、それらの用語が本明細書において明示的に定義されない限り、本技術を本明細書に開示される具体的な実施形態に限定するように解釈されるべきではない。故に、本技術の実際の範囲は、開示される実施形態だけではなく、実施形態を実践または実装する、あらゆる均等な方法も包含する。
【0109】
本明細書において使用される文言は、主として、可読性および教示的目的のために選択されている。これは、本主題を境界する、または範囲を定めるために選択されてはいない場合がある。したがって、本技術の範囲が、本詳細な説明によってではなく、むしろ、これに基づく出願上で生じる任意の請求項によって限定されることが意図される。故に、種々の実施形態の本開示は、以下の請求項において述べられているような技術の範囲を限定することではなく、それを例証することを意図している。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
【手続補正書】
【提出日】2023-06-13
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
コンピュータビジョンデータを発生させるための装置であって、前記装置は、
個人がある時間間隔にわたって位置する環境のデジタル画像を発生させるように構成されるカメラと、
ニューラルネットワークによる前記デジタル画像の分析を通して、コンピュータビジョンデータを発生させるように構成されるプロセッサであって、
前記ニューラルネットワークは、前記デジタル画像のそれぞれに関して、前記時間間隔にわたって前記個人のシリアル化された姿勢を確立するように、前記個人の姿勢を推定するように訓練される、プロセッサと、
前記個人の健康ステータスの決定のために、宛先に前記コンピュータビジョンデータを通信するように構成される通信モジュールと
を備える、装置。
【請求項2】
前記宛先は、前記個人の健康ステータスを視覚的に示すように、前記コンピュータビジョンデータまたは前記コンピュータビジョンデータの分析を表示することが可能であるコンピューティングデバイスを表す、請求項1に記載の装置。
【請求項3】
前記健康ステータスは、筋骨格の健康状態を表す、請求項1に記載の装置。
【請求項4】
前記コンピュータビジョンデータは、前記デジタル画像のそれぞれに関して、
(i)前記個人の1つまたはそれを上回る関節の2次元場所
(ii)前記個人の1つまたはそれを上回る関節の3次元場所、または、
(iii)前記個人の1つまたはそれを上回る関節の3次元回転、または、
(iv)前記個人の1つまたはそれを上回る筋肉の場所、サイズ、および/または形状
を示す、請求項1に記載の装置。
【請求項5】
前記コンピュータビジョンデータは、前記個人の身体の表面を表す熱マップを含む、請求項1に記載の装置。
【請求項6】
前記コンピュータビジョンデータは、ボクセルから成る前記個人の体積表現を含み、各ボクセルは、その空間位置が前記ニューラルネットワークによって決定される場所を表す、請求項1に記載の装置。
【請求項7】
コンピュータビジョンデータの分析を通して個人の健康ステータスを決定するためのシステムの作動方法であって、前記システムは、プロセッサを備え、前記作動方法は、
前記プロセッサによって、個人が位置する環境の高速連続においてカメラによって発生された一連のデジタル画像を入手することと、
前記プロセッサによって、前記一連のデジタル画像にモデルを適用し、一連の出力を生産することであって、
前記一連の出力における各出力は、前記一連のデジタル画像の対応するデジタル画像の分析を通して決定されるような前記個人の空間位置に関する情報を表し、
前記一連の出力は、集合的に、コンピュータビジョンデータを表す、ことと、
前記プロセッサによって、前記コンピュータビジョンデータに基づいて、前記個人の健康をリアルタイムで査定することと、
前記プロセッサによって、前記個人の健康に基づいて、アクションを実施することと
を含む、作動方法。
【請求項8】
前記査定することは、前記個人の筋骨格パフォーマンスを決定することを含み、前記作動方法はさらに、
前記プロセッサによって、体操療法セッションを開始するための要求を示す入力を受信することと、
前記プロセッサによって、前記個人に対する体操を実施するための命令の提示を引き起こすことと
を含み、
前記一連のデジタル画像は、前記個人が前記アクションを実施するにつれて、カメラによって発生され
前記個人が前記体操を完了したという決定に応答して、前記実施することは、前記個人に別の体操を実施するように命令することを含む、請求項に記載の作動方法。
【請求項9】
前記査定することは、
(i)前記コンピュータビジョンデータに基づ転倒検出
(ii)前記コンピュータビジョンデータに基づく歩容分析、
(iii)前記コンピュータビジョンデータに基づく微細運動技能分析、または
(iv)前記コンピュータビジョンデータに基づく可動域分析
を実施することを含む、請求項に記載の作動方法。
【請求項10】
前記査定することは、前記コンピュータビジョンデータに基づいて活動分析を実施することを含み、前記活動分析は、前記個人によって採用されている労力の推定されるレベルを示す、請求項に記載の作動方法。
【請求項11】
前記査定することは、前記コンピュータビジョンデータに基づいて筋肉疲労分析を実施することを含み、前記筋肉疲労分析は、前記個人の筋肉によって体験されている疲労の推定されるレベルを示す、請求項に記載の作動方法。
【請求項12】
前記査定することは、前記コンピュータビジョンデータに基づいて筋肉分布分析を実施することを含み、前記筋肉分布分析は、前記個人の筋肉の推定される場所、サイズ、および/または形状を示す、請求項に記載の作動方法。
【請求項13】
前記査定することは、前記コンピュータビジョンデータに基づいて肥満度指数(BMI)分析を実施することを含む、請求項に記載の作動方法。
【請求項14】
前記査定することは、前記コンピュータビジョンデータに基づいて血流分析を実施することを含み、前記血流分析は、前記個人を通した血流の推定される速度および/または体積が、異常であるかどうかを示す、請求項に記載の作動方法。
【請求項15】
前記査定することは、前記コンピュータビジョンデータに基づいて温度分析を実施することを含み、前記温度分析は、少なくとも2つの異なる場所における前記個人の身体の表面に沿った温度を示す、請求項に記載の作動方法。
【請求項16】
個人の健康を査定するためのシステムであって、前記システムは、
個人が位置する環境内に展開される複数の撮像装置であって、各撮像装置は、
ある時間間隔にわたって前記個人のデジタル画像を生産するように構成される画像センサと、
前記デジタル画像の分析を通して習得される前記個人に関連する情報を表すデータセットを発生させるように構成されるプロセッサと、
通信インターフェースであって、それを介して前記情報が前記撮像装置から退出する通信インターフェースと
を備える、複数の撮像装置と、
処理装置であって、前記処理装置は、
通信インターフェースであって、そこにおいて前記複数の撮像装置から複数のデータセットを受信する通信インターフェースと、
前記複数のデータセットを診査することによって前記個人の健康を査定するように構成されるプロセッサと
を備える、処理装置と
を備える、システム。
【請求項17】
各撮像装置の前記プロセッサはさらに、前記撮像装置を識別するメタデータを前記データセットに添付するように構成される、請求項16に記載のシステム。
【請求項18】
前記複数の撮像装置は、各撮像装置が、異なる視点から前記個人のデジタル画像を生産するように、前記環境内に展開される、請求項16に記載のシステム。
【請求項19】
前記各撮像装置のプロセッサは、1つまたはそれを上回るコンピュータビジョンアルゴリズムを前記デジタル画像に適用することによって、前記データセットを発生させる、請求項16に記載のシステム。
【請求項20】
前記情報は、前記時間間隔にわたって前記個人の少なくとも2つの関節の2次元場所または3次元場所を規定する、請求項16に記載のシステム。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0016
【補正方法】変更
【補正の内容】
【0016】
また、実施形態は、例証の目的のために、実行可能命令との関連においても説明され得る。しかしながら、当業者は、本技術の側面が、ハードウェア、ファームウェア、またはソフトウェアを介して実装され得ることを認識するであろう。実施例として、コンピュータビジョンデータは、完了のために患者に割り当てられた処置プログラム(または単に「プログラム」)への準拠およびその成功を改良するために設計される、ソフトウェア実装療法プラットフォーム(または単に「療法プラットフォーム」)によって取得され得る。プログラムの一部として、療法プラットフォームは、患者が、患者が身体活動を実施するように命令される、いくつかの体操療法セッション(または単に「セッション」)を完了することを要求し得る。例えば、患者は、セッションの過程にわたって一連の体操を実施するように命令されてもよい。療法プラットフォームは、コンピュータビジョンデータの分析に基づいて、これらの体操が正常に完了したかどうかを決定してもよい。療法プラットフォームは、直接または間接的に、同一のコンピューティングデバイス上に実装されたハードウェア、ファームウェア、または他のソフトウェアとインターフェースをとってもよい。加えて、または代替として、療法プラットフォームは、下記に議論されるように、直接または間接的に、他のコンピューティングデバイスとインターフェースをとってもよい。
本発明は、例えば、以下を提供する。
(項目1)
コンピュータビジョンデータを発生させるための装置であって、上記システムは、
個人がある時間間隔にわたって位置する環境のデジタル画像を発生させるように構成されるカメラと、
ニューラルネットワークによる上記デジタル画像の分析を通して、コンピュータビジョンデータを発生させるように構成されるプロセッサであって、
上記ニューラルネットワークは、上記デジタル画像のそれぞれに関して、上記時間間隔にわたって上記個人のシリアル化された姿勢を確立するように、上記個人の姿勢を推定するように訓練される、プロセッサと、
上記個人の健康ステータスの決定のために、宛先に上記コンピュータビジョンデータを通信するように構成される通信モジュールと
を備える、装置。
(項目2)
上記宛先は、上記個人の健康ステータスを視覚的に示すように、上記コンピュータビジョンデータまたは上記コンピュータビジョンデータの分析を表示することが可能であるコンピューティングデバイスを表す、項目1に記載の装置。
(項目3)
上記健康ステータスは、筋骨格の健康状態を表す、項目1に記載の装置。
(項目4)
上記コンピュータビジョンデータは、上記デジタル画像のそれぞれに関して、上記個人の1つまたはそれを上回る関節の2次元場所を示す、項目1に記載の装置。
(項目5)
上記コンピュータビジョンデータは、上記デジタル画像のそれぞれに関して、上記個人の1つまたはそれを上回る関節の3次元場所を示す、項目1に記載の装置。
(項目6)
上記コンピュータビジョンデータは、上記デジタル画像のそれぞれに関して、上記個人の1つまたはそれを上回る関節の3次元回転を示す、項目1に記載の装置。
(項目7)
上記コンピュータビジョンデータは、上記デジタル画像のそれぞれに関して、上記個人の1つまたはそれを上回る筋肉の場所、サイズ、および/または形状を示す、項目1に記載の装置。
(項目8)
上記コンピュータビジョンデータは、上記個人の身体の表面を表す熱マップを含む、項目1に記載の装置。
(項目9)
上記コンピュータビジョンデータは、ボクセルから成る上記個人の体積表現を含み、各ボクセルは、その空間位置が上記ニューラルネットワークによって決定される場所を表す、項目1に記載の装置。
(項目10)
コンピュータビジョンデータの分析を通して個人の健康ステータスを決定するための方法であって、上記方法は、
個人が位置する環境の高速連続においてカメラによって発生された一連のデジタル画像を入手することと、
上記一連のデジタル画像にモデルを適用し、一連の出力を生産することであって、
上記一連の出力における各出力は、上記一連のデジタル画像の対応するデジタル画像の分析を通して決定されるような上記個人の空間位置に関する情報を表し、
上記一連の出力は、集合的に、コンピュータビジョンデータを表す、ことと、
上記コンピュータビジョンデータに基づいて、上記個人の健康をリアルタイムで査定することと、
上記個人の健康に基づいて、アクションを実施することと
を含む、方法。
(項目11)
上記査定することは、上記個人の筋骨格パフォーマンスを決定することを含み、上記方法はさらに、
体操療法セッションを開始するための要求を示す入力を受信することと、
上記個人に対する体操を実施するための命令の提示を引き起こすことと
を含み、
上記一連のデジタル画像は、上記個人が上記アクションを実施するにつれて、カメラによって発生される、項目10に記載の方法。
(項目12)
上記個人が上記体操を完了したという決定に応答して、上記実施することは、上記個人に別の体操を実施するように命令することを含む、項目11に記載の方法。
(項目13)
上記査定することは、上記コンピュータビジョンデータに基づいて転倒検出を実施することを含む、項目10に記載の方法。
(項目14)
上記査定することは、上記コンピュータビジョンデータに基づいて歩容分析を実施することを含む、項目10に記載の方法。
(項目15)
上記査定することは、上記コンピュータビジョンデータに基づいて活動分析を実施することを含み、上記活動分析は、上記個人によって採用されている労力の推定されるレベルを示す、項目10に記載の方法。
(項目16)
上記査定することは、上記コンピュータビジョンデータに基づいて微細運動技能分析を実施することを含む、項目10に記載の方法。
(項目17)
上記査定することは、上記コンピュータビジョンデータに基づいて可動域分析を実施することを含む、項目10に記載の方法。
(項目18)
上記査定することは、上記コンピュータビジョンデータに基づいて筋肉疲労分析を実施することを含み、上記筋肉疲労分析は、上記個人の筋肉によって体験されている疲労の推定されるレベルを示す、項目10に記載の方法。
(項目19)
上記査定することは、上記コンピュータビジョンデータに基づいて筋肉分布分析を実施することを含み、上記筋肉分布分析は、上記個人の筋肉の推定される場所、サイズ、および/または形状を示す、項目10に記載の方法。
(項目20)
上記査定することは、上記コンピュータビジョンデータに基づいて肥満度指数(BMI)分析を実施することを含む、項目10に記載の方法。
(項目21)
上記査定することは、上記コンピュータビジョンデータに基づいて血流分析を実施することを含み、上記血流分析は、上記個人を通した血流の推定される速度および/または体積が、異常であるかどうかを示す、項目10に記載の方法。
(項目22)
上記査定することは、上記コンピュータビジョンデータに基づいて温度分析を実施することを含み、上記温度分析は、少なくとも2つの異なる場所における上記個人の身体の表面に沿った温度を示す、項目10に記載の方法。
(項目23)
個人の健康を査定するためのシステムであって、上記システムは、
個人が位置する環境内に展開される複数の撮像装置であって、各撮像装置は、
ある時間間隔にわたって上記個人のデジタル画像を生産するように構成される画像センサと、
上記デジタル画像の分析を通して習得される上記個人に関連する情報を表すデータセットを発生させるように構成されるプロセッサと、
通信インターフェースであって、それを介して上記情報が上記撮像装置から退出する通信インターフェースと
を備える、複数の撮像装置と、
処理装置であって、上記処理装置は、
通信インターフェースであって、そこにおいて上記複数の撮像装置から複数のデータセットを受信する通信インターフェースと、
上記複数のデータセットを診査することによって上記個人の健康を査定するように構成されるプロセッサと
を備える、処理装置と
を備える、システム。
(項目24)
各撮像装置内に含まれる上記画像センサは、赤外領域、近赤外領域、可視領域、または紫外領域を網羅するように設計される、項目23に記載のシステム。
(項目25)
上記処理装置の通信インターフェースは、別個の通信チャネルを介して各撮像装置との無線通信を促進するように構成される送受信機の一部である、項目23に記載のシステム。
(項目26)
各撮像装置の上記プロセッサはさらに、上記撮像装置を識別するメタデータを上記データセットに添付するように構成される、項目23に記載のシステム。
(項目27)
上記複数の撮像装置は、各撮像装置が、異なる視点から上記個人のデジタル画像を生産するように、上記環境内に展開される、項目23に記載のシステム。
(項目28)
上記各撮像装置のプロセッサは、1つまたはそれを上回るコンピュータビジョンアルゴリズムを上記デジタル画像に適用することによって、上記データセットを発生させる、項目23に記載のシステム。
(項目29)
上記複数の撮像装置および上記処理装置のうちの少なくとも一方は、単一のコンピューティングデバイスを表す、項目23に記載のシステム。
(項目30)
上記情報は、上記時間間隔にわたって上記個人の少なくとも2つの関節の2次元場所または3次元場所を規定する、項目23に記載のシステム。
【国際調査報告】