IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エフ ホフマン−ラ ロッシュ アクチェン ゲゼルシャフトの特許一覧

特表2024-534073生物学的センサデータの品質を分類するための方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-09-18
(54)【発明の名称】生物学的センサデータの品質を分類するための方法
(51)【国際特許分類】
   G06N 3/08 20230101AFI20240910BHJP
   G06N 3/04 20230101ALI20240910BHJP
   G06N 3/09 20230101ALI20240910BHJP
   G06N 3/0895 20230101ALI20240910BHJP
   A61B 5/02 20060101ALI20240910BHJP
   A61B 5/0245 20060101ALI20240910BHJP
【FI】
G06N3/08
G06N3/04
G06N3/09
G06N3/0895
A61B5/02 310A
A61B5/0245 F
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024509497
(86)(22)【出願日】2022-08-18
(85)【翻訳文提出日】2024-04-05
(86)【国際出願番号】 EP2022073126
(87)【国際公開番号】W WO2023021160
(87)【国際公開日】2023-02-23
(31)【優先権主張番号】21192193.7
(32)【優先日】2021-08-19
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】501205108
【氏名又は名称】エフ ホフマン-ラ ロッシュ アクチェン ゲゼルシャフト
(74)【代理人】
【識別番号】110001896
【氏名又は名称】弁理士法人朝日奈特許事務所
(72)【発明者】
【氏名】クリアラ、リト
(72)【発明者】
【氏名】リプスマイアー、フロリアン
(72)【発明者】
【氏名】ザノン、マッティア
【テーマコード(参考)】
4C017
【Fターム(参考)】
4C017AA02
4C017AA09
4C017AC26
4C017BC21
4C017BD06
4C017FF15
(57)【要約】
生物学的センサデータ(110)の品質を分類するためのコンピュータ実装方法であって、以下:a)少なくとも1つの生物学的センサ(112)によって得られた生物学的センサデータ(110)を提供するステップであって、生物学的センサデータ(110)は、少なくとも1つの信号(116)を含む、生物学的センサデータ(110)を提供するステップと、b)少なくとも1つの訓練済み訓練可能モデル(119)を使用することによって信号(116)の品質を分類するステップであって、訓練可能モデル(119)は、教師あり深層学習アーキテクチャ(134)および/または半教師あり深層学習アーキテクチャ(188)に基づいて履歴生物学的センサデータについて訓練され、訓練可能モデル(119)は、分類に関する1つの損失関数あるいは信号再構成および分類に関する2つの損失関数を最適化することによって訓練される、信号(116)の品質を分類するステップと、を含む、方法。さらに、生物学的センサ(112)、コンピュータプログラム、およびコンピュータ可読記憶媒体が開示される。
【特許請求の範囲】
【請求項1】
生物学的センサデータ(110)の品質を分類するためのコンピュータ実装方法であって、以下の、
a)少なくとも1つの生物学的センサ(112)によって得られた生物学的センサデータ(110)を提供するステップであって、前記生物学的センサデータ(110)は、少なくとも1つの信号(116)を含む、生物学的センサデータ(110)を提供するステップと、
b)少なくとも1つの訓練済み訓練可能モデル(119)を使用することによって前記信号(116)の品質を分類するステップであって、前記訓練可能モデル(119)は、教師あり深層学習アーキテクチャ(134)および/または半教師あり深層学習アーキテクチャ(188)に基づいて履歴生物学的センサデータについて訓練され、前記訓練可能モデル(119)は、分類に関する1つの損失関数、または、信号再構成および分類に関する2つの損失関数を最適化することによって訓練される、前記信号(116)の品質を分類するステップと
を含む、方法。
【請求項2】
前記生物学的センサ(112)は、少なくとも1つの可搬フォトプレチスモグラム装置(120)であり、前記生物学的センサデータ(110)は、前記可搬フォトプレチスモグラム装置(120)によって得られた少なくとも1つのフォトプレチスモグラム(126)を含む、請求項1に記載の方法。
【請求項3】
前記品質は、心拍変動データに関する品質インジケータとして使用され、前記品質は、許容可能な心拍変動データと許容不可能な心拍変動データとを区別するために使用される、請求項2に記載の方法。
【請求項4】
品質を分類することは、ノイズの多い信号とクリーンな信号とを区別することを含む、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記訓練可能モデル(119)は、畳み込みニューラルネットワーク(CNN)、再帰型ニューラルネットワーク(RNN)、長・短期記憶(LSTM)からなる群から選択される少なくとも1つのディープニューラルネットワークを備える、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記方法が、
c)少なくとも1つの訓練ステップをさらに含み、前記訓練ステップにおいて、前記訓練可能モデル(119)は、前記教師あり深層学習アーキテクチャ(134)および/または前記半教師あり深層学習アーキテクチャ(188)に基づいて、前記履歴生物学的センサデータを含む少なくとも1つの訓練データセットについて訓練され、前記訓練可能モデル(119)は、分類に関する前記1つの損失関数、または、信号再構成および分類に関する前記2つの損失関数を最適化することによって訓練される、請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記教師あり深層学習アーキテクチャ(134)に基づいて前記訓練可能モデル(119)を訓練するために、手動でラベリングされた履歴生物学的センサデータが使用される、請求項1~6のいずれか一項に記載の方法。
【請求項8】
前記半教師あり深層学習アーキテクチャ(188)に基づいて前記訓練可能モデル(119)を訓練するために、手動でラベリングされた履歴生物学的センサデータおよびラベリングされていない履歴生物学的センサデータが使用される、請求項1~7のいずれか一項に記載の方法。
【請求項9】
ラベリングされていない生物学的センサデータ(110)について、前記訓練可能モデル(119)は、信号再構成に関する前記損失関数を最適化することによって、および分類に関する前記損失関数を無視することによって訓練される、請求項8に記載の方法。
【請求項10】
前記生物学的センサデータ(110)のフィルタ処理または正規化のうちの1つ以上を含む少なくとも1つの前処理ステップを含む、請求項1~9のいずれか一項に記載の方法。
【請求項11】
生物学的センサ(112)であって、前記生物学的センサ(112)は、生物学的センサデータ(110)の品質を分類するように構成され、前記生物学的センサ(112)は、少なくとも1つの信号(116)を含む生物学的センサデータ(110)を提供するように構成された少なくとも1つの測定ユニット(114)を備え、前記生物学的センサ(112)は、少なくとも1つの訓練済み訓練可能モデル(119)を使用することによって前記信号(116)の品質を分類するように構成された少なくとも1つの処理ユニット(118)を備え、前記訓練可能モデル(119)は、教師あり深層学習アーキテクチャ(134)および/または半教師あり深層学習アーキテクチャ(188)に基づいて履歴生物学的センサデータについて訓練され、前記訓練可能モデル(119)は、分類に関する1つの損失関数、または、信号再構成および分類に関する2つの損失関数を最適化することによって訓練される、生物学的センサ(112)。
【請求項12】
前記生物学的センサ(112)は、可搬フォトプレチスモグラム装置(120)であり、前記可搬フォトプレチスモグラム装置(120)は、少なくとも1つのフォトプレチスモグラム(126)を提供するように構成された、少なくとも1つの照明源(122)および少なくとも1つのフォトディテクタ(124)を備え、前記処理ユニット(118)は、前記訓練済み訓練可能モデル(119)を使用することによって前記フォトプレチスモグラム(126)の品質を分類するように構成される、請求項11に記載の生物学的センサ(112)。
【請求項13】
請求項1~10のいずれか一項に記載の方法を実行するように構成された、請求項11または12に記載の生物学的センサ(112)。
【請求項14】
命令を含んでいるコンピュータプログラムであって、前記命令は、前記プログラムが請求項11~13のいずれか一項に記載の生物学的センサ(112)によって実行されたときに、前記生物学的センサ(112)に、請求項1~10のいずれか一項に記載の方法のステップa)およびステップb)を実行させ、任意にステップc)も実行させる、コンピュータプログラム。
【請求項15】
命令を含んでいるコンピュータ可読記憶媒体であって、前記命令は、請求項11~13のいずれか一項に記載の生物学的センサ(112)によって実行されたときに、前記生物学的センサ(112)に、請求項1~10のいずれか一項に記載の方法のステップa)およびステップb)を実行させ、任意にステップc)も実行させる、コンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、生物学的センサデータの品質を分類するためのコンピュータ実装方法に関する。さらに、本発明は、生物学的センサ、ならびに本発明による方法を実行するためのコンピュータプログラムおよびコンピュータ可読記憶媒体に関する。本方法および装置を、とくには、手首装着型装置または頭部装着型装置などの身体装着型装置の分野で使用し得る。例えば、生物学的センサは、例えば手首または頭部に装着されてよい。しかしながら、胸部または指など、他の測定位置も可能である。しかしながら、本発明について、他の適用分野も実現可能である。
【背景技術】
【0002】
身体装着型センサが、Coravos,A.,Khozin,S.,and Mandl,K.D.,“Developing and adopting safe and effective digital biomarkers to improve patient outcomes”,npj Digital Medicine,2(14),2019に記載されているように、生理学的信号および行動に関する信号を収集するために広く使用され、健康の監視のために使用され、医療機器としても使用されている。これらの健康監視ツールまたは医療装置の予測は、使用されるセンサデータと同程度にしか信頼できない。センサデータの品質は、ハードウェアに左右される可能性があり、ノイズに大きく影響される可能性がある。したがって、Sequeira,N.et al.,“Common wearable devices demonstrate variable accuracy in measuring heart rate during supraventricular tachycardia”,Heart Rhythm,17(5),2020、およびPasadyn,S.R.,et al.,“Accuracy of commercially available heart rate monitors in athletes:A prospective study.Cardiovascular Diagnosis and Therapy”,9(4):379-385,2019に記載されているように、信号の品質および実際の特徴の推定値は変化することが示されている。センサ装置を身につけた者の健康に関する信頼できる予測または推定を行うことができるようにするために、信頼できるデータまたは信号のみが使用されることを確実にする必要があるかもしれない。例えばBent,B.,et al.,“Investigating sources of inaccuracy in wearable optical heart rate sensors”.npj Digital Medicine,3(18),2020に記載されているように、例えばフォトプレチスモグラフ(PPG)、心電図(ECG)、脳波図(EEG)など、センサの信号品質は、運動アーチファクト、センサ配置、さらには血液灌流または皮膚タイプ、などの要因によって悪影響を受ける可能性がある。
【0003】
したがって、クリーンな信号とノイズの多い信号との信頼できる分類を有する必要があるが、これは、現時点において、標準的な方法として存在していない。むしろ、さまざまな用途に関して、人々はセンサ固有のヒューリスティックを使用する傾向にあり(例えば、Bhowmik,T.,et al.,“A novel method for accurate estimation of HRV from smartwatch PPG signals”,in IEEE Engineering in Medicine and Biology Society,pp.109-112,2017を参照)、またはOrphanidou,C.,et al.,“Signal-quality indices for the electrocardiogram and photoplethysmogram:Derivation and applications to wireless monitoring”,IEEE Journal of Biomedical and Health Informatics,19(3):832-838,2014、Elgendi,M.,“Optimal signal quality index for photoplethysmogram signals”,Scientific Reports,3(4),2016、およびZanon,M.,et al.,“A quality metric for heart rate variability from photoplethysmogram sensor data”,in IEEE Engineering in Medicine and Biology Society,pp.706-709,2020に記載されているように、連続的な品質インデックスを報告する方法論を使用する傾向にあるが、これは「信号をクリーンな信号またはノイズの多い信号としてラベリングするための信号品質しきい値を何にすべきか」という単純ではない問題を提示する。
【0004】
米国特許出願公開第2019/133468号明細書が、センサモジュールと、データ処理モジュールと、品質評価モジュールと、イベント予測モジュールとを含む装置を記載している。センサモジュールは、生体信号データサンプルおよび動きデータサンプルを提供する。データ処理モジュールは、生体信号データサンプルを処理してベースラインを除去し、動きデータサンプルを処理して動き有意性尺度を生成する。品質評価モジュールは、第1の深層学習モデルを使用して、処理済み生体信号データサンプルセグメントおよび対応する動き有意性尺度に基づいて信号品質インジケータを生成する。イベント予測モジュールは、第2の深層学習モデルを使用して、所望の信号品質インジケータに関連付けられた処理済み生体信号データサンプルセグメントに基づいてイベント予測結果を生成する。
【0005】
解決すべき課題
したがって、健康監視用および/または医療機器としての身体装着型センサの使用についての上述の技術的課題に対処する方法および装置を提供することが望ましい。具体的には、莫大な手動での注釈の必要性を克服する方法および装置が提案されるべきである。
【発明の概要】
【0006】
概要
この課題は、独立請求項の特徴を有する生物学的センサデータの品質を分類するためのコンピュータ実装方法によって対処される。単独で実現されても、任意の組み合わせにて実現されてもよい好都合な実施形態が、従属請求項ならびに明細書全体に挙げられる。
【0007】
以下で使用されるとき、用語「・・・を有する」、「・・・を備える」、または「・・・を含む」、またはこれらの任意の文法的変種は、非排他的なやり方で使用される。したがって、これらの用語は、これらの用語によって紹介される特徴の他に、この文脈において説明されるエンティティにさらなる特徴が存在しない状況、および1つ以上のさらなる特徴が存在する状況の両方を指し得る。例として、「AはBを有する」、「AはBを備える」、および「AはBを含む」という表現は、いずれも、B以外に他の要素がAに存在しない状況(すなわち、AがBのみで排他的に構成される状況)、およびB以外に要素C、要素CおよびD、またはまたさらなる要素など、1つ以上のさらなる要素がエンティティAに存在する状況を指し得る。
【0008】
さらに、特徴または要素が1回または複数回存在してよいことを示す「少なくとも1つ」または「1つ以上」という用語または同様の表現は、典型的には、それぞれの特徴または要素を紹介するときに一度だけ使用されることに留意されたい。以下では、ほとんどの場合、それぞれの特徴または要素を指すとき、それぞれの特徴または要素が1回または複数回存在してもよいという事実にもかかわらず、「少なくとも1つ」または「1つ以上」という表現を繰り返さない。
【0009】
さらに、以下で使用されるとき、用語「好ましくは」、「より好ましくは」、「とくには」、「さらにとくには」、「具体的には」、「より具体的には」、または同様の用語は、代替の可能性を制限することなく、任意の特徴に関して使用される。したがって、これらの用語によって紹介される特徴は、任意の特徴であり、特許請求の範囲の技術的範囲をいかなるやり方でも限定することを意図していない。本発明は、当業者であれば理解できるとおり、代替の特徴を使用することによって実行されてもよい。同様に、「本発明の実施形態において」または同様の表現によって紹介される特徴は、任意の特徴であることが意図され、本発明の代替の実施形態に関するいかなる制限も伴わず、本発明の範囲に関するいかなる限定も伴わず、そのようなやり方で紹介される特徴を本発明の他の任意の特徴または任意ではない特徴と組み合わせる可能性に関するいかなる制限も伴わない。
【0010】
本発明の第1の態様において、生物学的センサデータの品質を分類するためのコンピュータ実装方法が開示される。
【0011】
本明細書において使用されるとき、「コンピュータ実装方法」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、少なくとも1つのコンピュータならびに/または少なくとも1つのコンピュータネットワークまたはクラウドが関与する方法を指し得る。コンピュータおよび/またはコンピュータネットワークおよび/またはクラウドは、本発明による方法の方法ステップのうちの少なくとも1つを実行するように構成された少なくとも1つのプロセッサを備えてよい。好ましくは、方法ステップの各々が、コンピュータおよび/またはコンピュータネットワークおよび/またはクラウドによって実行される。本方法は、完全に自動的に、具体的にはユーザの相互作用を必要とせずに、実行されてよい。本明細書において使用されるとき、「自動的に」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、少なくとも1つのコンピュータおよび/またはコンピュータネットワークおよび/またはクラウドおよび/または機械によって、とくには手動の動作および/またはユーザとの相互作用を必要とせずに完全に実施されるプロセスを指し得る。
【0012】
本方法は、一例として、所与の順序で実行されてよい以下のステップを含む。しかしながら、異なる順序も可能であることに留意されたい。さらに、方法ステップのうちの1つ以上を1回または繰り返し実行することも可能である。さらに、方法ステップのうちの2つ以上を同時に、または時間的に重なった様相で実行することが可能である。本方法は、挙げられていないさらなる方法ステップを含んでもよい。
【0013】
本方法は、以下:
a)少なくとも1つの生物学的センサによって得られた生物学的センサデータを提供するステップであって、生物学的センサデータは、少なくとも1つの信号を含む、生物学的センサデータを提供するステップと、
b)少なくとも1つの訓練済み訓練可能モデルを使用することによって信号の品質を分類するステップであって、訓練可能モデルは、教師あり深層学習アーキテクチャおよび/または半教師あり深層学習アーキテクチャに基づいて履歴生物学的センサデータについて訓練され、訓練可能モデルは、分類に関する1つの損失関数または信号再構成および分類に関する2つの損失関数を最適化することによって訓練される、信号の品質を分類するステップと
を含む。
【0014】
本明細書において使用されるとき、「生物学的センサ」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、少なくとも1つの生物学的測定変数または生物学的測定特性の検出、測定、または監視のうちの1つ以上のために構成された任意の装置を指し得る。具体的には、生物学的センサは、測定信号など、測定変数および/または測定特性の定性的または定量的指標である少なくとも1つの信号を生成することが可能であってよい。生物学的センサは、被験者の少なくとも1つの健康状態および/または健康状態を表す少なくとも1つの測定変数を定性的および/または定量的に決定するように構成されてよい。用語「被験者」は、本明細書において使用されるとき、動物、好ましくは哺乳動物、より典型的にはヒトを指す。生物学的センサは、被験者の少なくとも1つの生物学的および/または物理的および/または化学的パラメータを定量的または定性的に検出および/または測定し、検出および/または測定されたパラメータをさらなる処理および/または分析などのために少なくとも1つの信号に変換するように構成されてよい。
【0015】
生物学的センサは、可搬であり、とくには手持ち式および/または身体装着型である生物学的センサであってよい。本明細書において使用されるとき、「可搬」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、ユーザによる生物学的センサの保持および/または装用および/または運搬のうちの1つ以上を可能にする生物学的センサの特性を指し得る。具体的には、生物学的センサは、身体装着型であってよい。例えば、生物学的センサは、スマートウォッチなどの腕時計であってよい。しかしながら、頭部、胸部、または指など、他の測定位置も可能である。可搬の生物学的センサを使用すると、運動アーチファクトなど、外乱が測定値に影響を及ぼす可能性がある。日常生活において見られる制御されない条件が、信号を劣化させて、健康状態の判断を当てにならず、信頼できないものにしてしまう可能性がある外乱に関連するいくつかの問題を生じさせる可能性がある。
【0016】
生物学的センサは、少なくとも1つのフォトプレチスモグラム(PPG)装置、少なくとも1つの心電図(ECG)装置、少なくとも1つの脳波図(EEG)装置のうちの1つ以上であってもよく、またはこれらのうちの1つ以上を含んでもよい。しかしながら、他の生物学的センサも実現可能である。
【0017】
例えば、生物学的センサは、少なくとも1つの可搬フォトプレチスモグラム装置であってよい。生物学的センサデータは、可搬フォトプレチスモグラム装置によって得られた少なくとも1つのフォトプレチスモグラムを含み得る。本明細書において使用されるとき、「フォトプレチスモグラム装置」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、少なくとも1つのフォトプレチスモグラムを決定するように構成された少なくとも1つの装置を指し得る。本明細書において使用されるとき、「プレチスモグラム」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、人体または器官の少なくとも一部分の体積変化の測定結果を指し得る。本明細書において使用されるとき、「フォトプレチスモグラム(PPG)」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、光学的に決定されたプレチスモグラムを指し得る。PPGは、PPG装置からの信号の時間推移を示し得る。
【0018】
フォトプレチスモグラム装置は、少なくとも1つの照明源を備え得る。本明細書において使用されるとき、「照明源」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、少なくとも1つの光ビームを生成するように構成された少なくとも1つの任意の装置を指し得る。照明源は、少なくとも1つの発光ダイオード(LED)トランスミッタなどの少なくとも1つの光源を備え得る。照明源は、例えば人体の少なくとも一部分の皮膚を照明するための少なくとも1つの光ビームを生成するように構成されてよい。照明源は、赤色、赤外、または緑色のスペクトル領域の光を生成するように構成されてよい。本明細書において使用されるとき、「光」という用語は、一般に、通常は「光学スペクトル範囲」と呼ばれ、可視スペクトル範囲、紫外スペクトル範囲、および赤外スペクトル範囲のうちの1つ以上を含む電磁放射線の一区画を指す。ここで、用語「紫外スペクトル範囲」は、一般に、1nm~380nm、好ましくは100nm~380nmの波長を有する電磁放射線を指す。「可視スペクトル範囲」という用語は、一般に、380nm~760nmのスペクトル範囲を指す。「赤外スペクトル範囲(IR)」という用語は、一般に、760nm~1000μmの電磁放射線を指し、760nm~1.5μmの範囲が、通常は「近赤外スペクトル範囲(NIR)」と呼ばれる一方で、1.5μ~15μmの範囲は「中赤外スペクトル範囲(MidIR)」と称され、15μm~1000μmの範囲は「遠赤外スペクトル範囲(FIR)」と称される。
【0019】
フォトプレチスモグラム装置は、少なくとも1つのフォトディテクタ、とくには少なくとも1つの感光ダイオードを備え得る。本明細書において使用されるとき、「フォトディテクタ」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、少なくとも1つの光ビームによって生成された照明を検出するためなど、光ビームを検出するための少なくとも1つの感光装置を指し得る。フォトディテクタは、照明源によって生成された光による照明に応答して、透過吸収および/または反射から光を検出するように構成されてよい。
【0020】
PPG装置は、光を皮膚へと照らし、反射されて戻る光を測定することによって、心拍による血液量変動を測定するように構成されてよい。PPG装置の設計に関しては、Biswas,D.,et al.,“Heart rate estimation from wrist-worn photoplethysmography:A review”,IEEE Sensors Journal,19(16):6560-6570,2019が参照される。具体的には、PPGは、Liang,Y.,et al.:“An optimal filter for short photoplethysmogram signals”,Scientific Data,5(180076),2018に記載されているように、心臓血管系における多数の生理学的プロセスの集合的な発現を表し得る。PPG信号が信頼できる場合、例えば、運動回復(例えば、Bechke,E.,et al.,“An examination of single day vs.multi-day heart rate variability and its relationship to heart rate recovery following maximal aerobic exercise in females”,Scientific Reports,10(14760),2020を参照)、心臓状態(例えば、Hoshi,R.A.,et al.,Reduced heart-rate variability and increased risk of hypertension-a prospective study of the elsa-brasil.Journal of Human Hypertension,2021を参照)、睡眠パターン(例えば、Hietakoste,S.,et al.,“Longer apneas and hypopneas are associated with greater ultra-short-term hrv in obstructive sleep apnea”,Scientific Reports,10(21556),2020を参照)、不安(例えば、Rodrigues,J.,et al.,“Locomotion in virtual environments predicts cardiovascular responsiveness to subsequent stressful challenges”,Nature Communications,11(5904),2020を参照)、および情動状態(例えば、Kim,J.J.,et al.“Neurophysiological and behavioral markers of compassion”,Scientific Reports,10(6789),2020を参照)などの個人の身体的、心理的、および精神的状態の複数の態様を理解するために、心拍数(HR)および心拍変動(HRV)の特徴を計算することを可能にできる。
【0021】
本明細書において使用されるとき、「生物学的センサデータ」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、測定データなどの生物学的センサを介して得られたデータを指し得る。生物学的センサデータは、センサ信号とも呼ばれる少なくとも1つの信号を含む。本明細書において使用されるとき、「信号」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、少なくとも1つのアナログ電気信号および/または少なくとも1つのデジタル電気信号などの少なくとも1つの電気信号を指し得る。より具体的には、センサ信号は、少なくとも1つの電圧信号および/もしくは少なくとも1つの電流信号であってよく、または少なくとも1つの電圧信号および/もしくは少なくとも1つの電流信号を含んでよい。より具体的には、センサ信号は、少なくとも1つの光電流を含み得る。例えば、信号は、照明源によって生成された光による照明に応答した透過吸収および/または反射からの検出光に応じたPPG装置、とくにはフォトディテクタの少なくとも1つの電子信号であってよい。
【0022】
さらに、生の信号を使用しても、または処理された信号もしくは前処理された信号を使用して、センサ信号としても使用され得る二次信号を生成してもよい。本方法は、生物学的センサデータのフィルタ処理または正規化のうちの1つ以上を含む少なくとも1つの前処理ステップを含み得る。例えば、PPG装置の信号の場合に、バンドパスフィルタを使用し得る。さらに、信号を、値が0を中心とするように正規化し得る。しかしながら、前処理は、生理学に応じて、さまざまな信号についてさまざまであってよい。
【0023】
例えば、信号はPPG信号であってよい。PPG信号は、指、つま先、耳たぶ、手首、および額などの人間の末梢組織から容易に抽出することができる。したがって、例えばLiang et al.に記載されているように、身体装着型の健康装置における応用に関して、大きな可能性を有し得る。例えば、PPG信号を、スマートウォッチ、とくにはLEDおよびフォトダイオードを備えた手首のスマートウォッチを介して収集し得る。一般に、任意のサンプリング周波数が可能である。高いサンプリング周波数が好ましいかもしれない。例えば、例えばスマートウォッチなどのフォトプレチスモグラム装置が、20Hzのサンプリング周波数でPPGを測定するように構成されてよい。例えば、フォトプレチスモグラム装置は、20Hz~1kHzの周波数でPPGを測定するように構成されてよい。スマートウォッチは、例えばSamsung Gear(登録商標)Sportスマートウォッチなど、特別なスマートウォッチであってよい。PPG信号を、被験者の毎日のPPG信号について0.5および9Hzの周波数カットオンを有する三次バターワースバンドパスフィルタを使用して前処理し得る。毎日のPPG信号を、例えば10秒の区間などの区間に切り分けし得る。
【0024】
本明細書において使用されるとき、「提供する」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、生物学的センサデータを測定すること、および/または生物学的センサデータを取り出すことを指し得る。本明細書で使用される場合、「取り出す」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、データを生成し、かつ/または生物学的センサおよび/またはデータ記憶装置、例えばネットワークまたはさらなるコンピュータもしくはコンピュータシステムからデータを取得するシステム、具体的にはコンピュータシステムのプロセスを指し得る。取り出しを、具体的には、例えばシリアルポートまたはパラレルポートなどのポートを介して、少なくとも1つのコンピュータインターフェースによって行い得る。取り出しは、例えばプロセッサを使用することにより、一次情報の1つ以上のアイテムを取得し、例えば1つ以上のアルゴリズムを一次情報に適用することで、一次情報を利用することによって二次情報を生成するサブステップなど、いくつかのサブステップを含み得る。
【0025】
本明細書において使用されるとき、「品質」という用語は、「信号品質」とも称されるが、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、生物学的センサによって決定された信号の信頼性の尺度を指し得る。具体的には、品質を、信頼できる信号については良好と分類し、信頼できない信号については不良と分類し得る。品質の分類は、ノイズの多い信号とクリーンな信号と区別することを含み得る。品質を、ノイズおよび/またはアーチファクトの存在に応じて分類し得る。信号の信頼性は、ノイズおよび/またはアーチファクトが増加するにつれて低下する可能性がある。品質は、運動アーチファクト、センサ配置、血液灌流、および/または皮膚タイプなどの複数の要因によって悪影響を受ける可能性がある。
【0026】
品質を、心拍変動データの品質インジケータとして使用し得る。本明細書において使用されるとき、「心拍変動(HRV)」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、連続する心拍間の規則性の尺度を指し得る。品質を、許容可能な心拍変動データと許容不可能な心拍変動データとを区別するために使用し得る。
【0027】
取得された生物学的センサデータの品質を、少なくとも1つのユーザインターフェースを介して、被験者などのユーザに提供し得る。本明細書において使用されるとき、「ユーザインターフェース」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、限定はされないが、1つ以上のデータまたはコマンドの交換などのために、例えば一方向または双方向に情報を交換する目的で、周囲の環境と相互作用するように構成された要素を指し得る。例えば、スマートウォッチのユーザインターフェースは、ユーザと情報を共有し、ユーザによって情報を受信するように構成されてよい。ユーザインターフェースは、ディスプレイなど、ユーザと視覚的に相互作用するように設計されてよく、かつ/またはユーザと音響的に相互作用するように設計されてもよい。ユーザインターフェースは、一例として、グラフィカルユーザインターフェース、ワイヤレスデータインターフェースおよび/または有線データインターフェースなどのデータインターフェース、のうちの1つ以上を備えてよい。したがって、提供された品質を、生物学的センサによって得られた生物学的センサデータを解釈するために使用し得る。追加的に、または代替的に、スマートウォッチなどの生物学的センサは、ノイズが多いと分類され、または品質が不良であると分類された生物学的センサデータを、無視および/または拒否するように構成された少なくとも1つの制御ユニットを備え得る。
【0028】
本明細書において使用されるとき、「分類する」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、信号をノイズの多い信号またはクリーンな信号などの少なくとも2つのカテゴリに分類するプロセスを指し得る。
【0029】
信号の品質の分類は、少なくとも1つの訓練済み訓練可能モデルを使用することによって実行される。本明細書において使用されるとき、「訓練可能モデル」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、機械学習、とくには深層学習、または他の形態の人工知能のうちの1つ以上を使用して、少なくとも1つの訓練データセットについて訓練することができる数学的モデルを指し得る。本明細書において使用されるとき、「機械学習」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、自動的なモデル構築のために人工知能(AI)を使用する方法を指し得る。本明細書において使用されるとき、「深層学習」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、複数の層を使用し、とくにはディープニューラルネットワーク、ディープビリーフネットワーク、グラフニューラルネットワーク、再帰型ニューラルネットワーク、および畳み込みニューラルネットワークのうちの1つ以上などの深層学習アーキテクチャを使用する機械学習アルゴリズムの一種類を指し得る。例えば、訓練可能モデルは、WaveNetアーキテクチャ、再帰型ニューラルネットワーク(RNN)、長・短期記憶(LSTM)などにおける畳み込みニューラルネットワーク(CNN)層からなる群から選択される少なくとも1つのディープニューラルネットワークを備え得る。例えば、WaveNetアーキテクチャに着想を得たアーキテクチャを使用し得る。WaveNetに関して、van den Oord,et al.,“Wavenet:A generative model for raw audio”,CoRR,abs/1609.03499,2016が参照される。ディープニューラルネットワークは、積層因果膨張畳み込みを使用し得る。PPGデータにWaveNetのようなアーキテクチャを使用することは、新規かつ独特の手法である。当業者であれば、WaveNetのようなアーキテクチャを使用することはないと考えられ、なぜならば、そもそもスピーチデータについて使用するために、したがってきわめて異なるデータタイプのために開発されたからである。しかしながら、驚くべきことに、PPGデータにWaveNetのようなアーキテクチャを使用することにより、PPGデータの品質を高い信頼性で品質を分類できることが明らかになった。
【0030】
訓練を、少なくとも1つの機械学習システムを使用して実行し得る。本明細書において使用されるとき、「機械学習システム」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、機械学習を行うように構成され、とくには所与のアルゴリズムにおいて論理を実行するように構成されたプロセッサ、マイクロプロセッサ、またはコンピュータシステムなどの少なくとも1つの処理ユニットを備えるシステムまたはユニットを指し得る。機械学習システムは、少なくとも1つの機械学習アルゴリズムを実施および/または実行するように構成されてよく、機械学習アルゴリズムは、訓練済み訓練可能モデルを構築するように構成される。機械学習システムは、生物学的センサの一部であってもよく、かつ/または外部プロセッサによって実行されてもよい。
【0031】
本明細書において使用されるとき、「訓練」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、訓練済み訓練可能モデルを構築するプロセス、とくにはモデルのパラメータ、とりわけモデルの重みを決定するプロセスを指し得る。訓練は、モデルのパラメータを決定および/または更新することを含み得る。訓練済み訓練可能モデルは、少なくとも部分的にデータ駆動型であってよい。本明細書において使用されるとき、「少なくとも部分的なデータ駆動型モデル」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、モデルがデータ駆動型モデル部分と、物理化学法則に基づく他のモデル部分とを含むという事実を指し得る。訓練は、生物学的センサデータについて実行されてよい。訓練は、例えば、スマートウォッチの着用中および操作中などに追加の生物学的センサデータを取得した後に、訓練済み訓練可能モデルを再訓練することを含み得る。
【0032】
訓練可能モデルは、教師あり深層学習アーキテクチャおよび/または半教師あり深層学習アーキテクチャに基づいて、履歴生物学的センサデータについて訓練される。本明細書において使用されるとき、「履歴生物学的センサデータ」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、深層学習アーキテクチャの訓練に使用される少なくとも1つの独立したデータセットを指し得る。履歴生物学的センサデータは、患者、ランタイム、またはテストデータから独立している。
【0033】
本方法は、
c)少なくとも1つの訓練ステップをさらに含み得、訓練ステップにおいて、訓練可能モデルは、教師あり深層学習アーキテクチャおよび/または半教師あり深層学習アーキテクチャに基づいて、履歴生物学的センサデータを含む少なくとも1つの訓練データセットについて訓練され、訓練可能モデルは、分類に関する1つの損失関数または信号再構成および分類に関する2つの損失関数を最適化することによって訓練される。
【0034】
教師あり深層学習アーキテクチャに基づく訓練可能モデルは、本明細書において教師ありモデルとも呼ばれることもある。半教師あり深層学習アーキテクチャに基づく訓練可能モデルは、本明細書において半教師ありモデルとも呼ばれることもある。
【0035】
本明細書において使用されるとき、「教師あり」深層学習アーキテクチャという用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、ラベリング済みの履歴生物学的センサデータに基づいて学習する深層学習を指し得る。とくには、手動でラベリングされた履歴生物学的センサデータを、教師あり深層学習アーキテクチャに基づく訓練可能モデルの訓練に使用し得る。例えば、履歴生物学的センサデータとして、手動でラベリングされたPPGデータセットを使用し得る。例えば、生物学的センサデータの訓練データセットを、以下のように設定し得る。データを、5人の健康なボランティア(女性1人および男性4人、平均年齢33歳)から、いかなる管理にもよらずに、通常の日常活動中および夜間の睡眠中に収集した。各々が10秒の長さである合計13547個の重複しないPPG信号サンプルを収集した。信号を、Elgendi,M.,“Optimal signal quality index for photoplethysmogram signals”,Scientific Reports,3(4),2016の指示に従って、専門家によって手動でラベリングし得る。ノイズの多い8305個のPPG信号およびクリーンな5242個のPPG信号に分類した。例えば、ラベリングされた9380個の信号サンプルからなるバランスしたデータセットを、訓練データセットとして使用し得る。
【0036】
訓練ステップは、例えば各々が20Hzの周波数で合計200個のデータ点を有している10秒間のPPG信号をフィルタ処理するなど、履歴生体センサデータを前処理することを含み得る。ラベルを、訓練のための各々の入力信号に対して、ノイズの多い信号を示す「0」およびクリーンな信号を示す「1」で提供し得る。
【0037】
教師あり深層学習アーキテクチャは、履歴バイオセンサデータおよび/または前処理された履歴バイオセンサデータを受信する少なくとも1つの入力層を備えてよい。例えば、入力として、各々が20Hzの周波数による10秒間のフィルタ処理されたPPG信号を使用し得る。したがって、入力は、200個の値を含む信号を含み得る。異なるサンプリング周波数または長さ(秒単位)では、PPG信号の値は変わると考えられる。
【0038】
教師あり深層学習アーキテクチャは、複数の畳み込み層、とくには畳み込み層の積層を備え得る。例えば、教師あり深層学習アーキテクチャは、5つの畳み込み層を備え得る。畳み込み層は、膨張を伴って設計されてもよい。畳み込み層を、膨張畳み込みのために構成し得る。教師あり深層学習アーキテクチャは、WaveNetのようなニューラルネットワークアーキテクチャを備え得る。例えばvan den Oord,et al.,“Wavenet:A generative model for raw audio”,CoRR,abs/1609.03499,2016に記載されているように、WaveNetの主成分は因果的畳み込みであってよい。因果的畳み込みを使用することにより、深層学習アーキテクチャがデータのモデル化の順序に違反する可能性がなく、とくには将来の時間ステップのいずれにも影響される可能性がないことを、保証可能にし得る。因果的畳み込みを有する深層学習アーキテクチャは、とりわけきわめて長いシーケンスに適用される場合に、典型的にはRNNよりも訓練が高速であるように、再帰接続を有しなくてよい。しかしながら、因果的畳み込みの問題の1つは、それらが多数の層または受容野を広げるための大きなフィルタを必要とすることであり得る。したがって、WaveNetのようなアーキテクチャは、計算コストを大きく増加させることなく受容野を桁違いに大きくするために、膨張畳み込みを使用し得る。本明細書において使用されるとき、「膨張畳み込み」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、特定のステップで入力値をスキップすることによってフィルタをその長さよりも大きい領域にわたって適用する畳み込みを指し得る。これは、ゼロで膨張させることによって元のフィルタから導出されるより大きなフィルタによる畳み込みと同等であり得るが、大幅に効率的であり得る。膨張畳み込みは、ネットワークが通常の畳み込みよりも粗いスケールで動作することを効果的に可能にし得る。これは、プーリングまたはストライド畳み込みと同様であり得るが、ここでは、出力は入力と同じサイズを有し得る。とくには、積層膨張畳み込みを可能にする積層された畳み込み層は、ネットワークが、ネットワーク全体の入力分解能および計算効率を維持しつつ、わずかに数個の層できわめて大きな受容野を有することを可能にし得る。
【0039】
教師あり深層学習アーキテクチャは、各々の畳み込み層に因果的パディングを含んでよい。
【0040】
教師あり深層学習アーキテクチャは、畳み込み層の後かつ出力の前に、少なくとも1つの平坦化層を含み得る。平坦化層は、畳み込み層の行列出力を全結合層に変換するように設計されてよい。全結合層は、すべてのニューロンがすべての入力およびすべての出力に接続されているニューラルネットワーク構造であってよい。
【0041】
教師あり深層学習アーキテクチャは、少なくとも1つのオプティマイザ、とくにはAdamオプティマイザを備えてよい。Adamオプティマイザに関して、Diederik P.Kingma,Jimmy Ba,“Adam:A Method for Stochastic Optimization”,3rd International Conference for Learning Representations,San Diego,2015が参照される。
【0042】
例えば、教師あり深層学習アーキテクチャは、5つの畳み込み層を備え得る。第1の層は、膨張を有しなくてもよく、第2の層は、2という膨張を有してよく、そこから、膨張は、次の各層ごとに2倍になってよい。各層において、16個のフィルタを使用し得る。サイズ3、5、7、またはさらに他のサイズのカーネルを、使用し得る。正則化強度は、0.0005~0.002の範囲、例えば0.0005、0.001、0.0015、または0.002であってよい。しかしながら、他の実施形態も可能である。教師あり深層学習アーキテクチャは、畳み込み層の後かつ出力の前に平坦化層を含み得る。教師あり深層学習アーキテクチャは、例えば0.00001の学習率を有し、10または100またはさらに多くのエポックごとに学習率が半減する減衰を有するAdamオプティマイザを含み得る。しかしながら、他の学習率および学習減衰率も可能である。例えば、訓練のために、128というバッチサイズ、および300までのエポックを使用し得る。例えば、訓練のために、128というバッチサイズ、および50から500またはさらに多くのエポックを使用し得る。しかしながら、他のバッチサイズおよびエポックも可能である。
【0043】
深層学習アーキテクチャは、最終層、とくには全結合層として、2つの経路を備える出力層を備え得る。経路の各々が出力を備え得る。具体的には、深層学習アーキテクチャは、2つの出力、すなわち第1および第2の出力を備え得る。訓練可能モデルは、分類に関する1つの損失関数または信号再構成および分類に関する2つの損失関数を最適化することによって訓練される。教師あり深層学習アーキテクチャを、分類に関する1つの損失関数を最適化することによって訓練し得る。教師あり深層学習アーキテクチャを、信号再構成および分類に関する2つの損失関数を最適化することによって訓練し得る。半教師あり深層学習アーキテクチャを、信号再構成および分類に関する2つの損失関数を最適化することによって訓練し得る。本明細書において使用されるとき、「損失関数」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、真のパラメータから逸脱した決定から生じる損失を、点推定値、範囲推定値、またはテストの形式で各々の決定に割り当てる関数を指し得る。訓練可能モデルの訓練は、最適化問題を解くことを含み得、とくには損失関数の最適化を含み得る。本明細書において使用されるとき、「損失関数の最適化」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、損失関数を最小化するプロセスを指し得る。訓練可能モデルを、分類に関する第1の損失関数、または第1の損失関数および信号再構成に関する第2の損失関数を最適化することによって訓練し得る。
【0044】
第1の出力は、分類された品質を提供する分類出力であってよい。分類出力は、第1の損失関数を用いてよい。第1の損失関数は、分類損失に関連し得る。例えば、分類出力は、平坦化層または全結合層の出力を入力として取得し得る。分類出力は、シグモイド活性化関数を使用し得る。分類出力は、0と1との間の確率を提供するためにバイナリ交差エントロピー損失関数を使用し得、0.5を超える値は、信号がクリーンであることを示す。
【0045】
第2の出力は、入力と畳み込み後の再構成された信号との間の差の尺度を提供する平均二乗誤差(MSE)出力であってよい。MSE出力は、正規化線形ユニット(ReLU)活性化関数を使用し得る。MSE出力は、MSE損失関数を使用し得る。MSE損失関数は、平均二乗誤差(MSE)の観点からの再構成された入力信号と入力信号との間の差に関連し得る。より小さいMSEは、より良好な信号再構成に関連する。MSE出力を推定するために、2つの追加の全結合層を、入力信号と同じサイズの出力を有するように、平坦化層の後にReLU活性化関数によって使用し得る。
【0046】
上記で概説したように、分類出力は、1という重みで学習するアルゴリズムに寄与し得る。第2の出力は、少なくとも1つの重みを使用して重み付けされてよい。重みを変化させることができる。重みは0~1であってよい。経験的に、より小さい重みが、わずかに高い精度をもたらすことができることが明らかになった。MSE値の範囲は、(最大の分類出力である)1よりもはるかに大きくなり得る。重み付けされた第2の出力を使用することにより、信号再構成についての学習および分類出力についての学習の間のアルゴリズムのバランスを可能にし得る。これにより、教師ありアーキテクチャおよび半教師ありアーキテクチャの両方に関して、精度の向上を可能にできる。例えば、教師ありアーキテクチャに関して、精度は、等しい重み(すなわち、1)では91.6%であり得るのに対し、0.1という重みなどのより小さいMSE重みでは、92.5%であり得る。半教師ありアーキテクチャに関して、精度は、等しい重みでは87.7%であり得るのに対し、0.05という重みなどのより小さいMSE重みでは、90.6%であり得る。
【0047】
本方法は、少なくとも1つの検証ステップを含み得る。検証ステップを、訓練可能モデルの訓練中に実行し得る。検証ステップを、訓練の改善を監視するために使用し得る。検証ステップは、少なくとも1つの検証データセットを使用して訓練可能モデルを検証することを含み得る。検証データセットは、例えば、上記のように、5人の健康なボランティアから収集された履歴生物学的センサからの1000個の重複しない手動でラベリングされたサンプルを含み得、検証に使用される1000個の重複しない手動でラベリングされたサンプルは、訓練には使用されていない。
【0048】
本方法は、少なくとも1つのテストステップを含み得、テストステップは、訓練済み訓練可能モデルをテストすることを含む。テストステップは、少なくとも1つのテストデータセットにおいて訓練済み訓練可能モデルをテストすることを含み得る。テストステップは、例えば正確性、リコール、F1スコア、曲線下面積(AUC)などの訓練済み訓練可能モデルの性能特性を求めることを含み得る。
【0049】
例えば、テストデータとして、上記のように、5人の健康なボランティアから収集した履歴生物学的センサからの1000個の重複しない手動でラベリングされたサンプルを使用した。テストに使用した1000個の重複しない手動でラベリングされたサンプルは、訓練に使用されたものではない。結果として、分類しきい値を0.5として、精度が以下のとおりであることが明らかになった。
- 教師あり深層学習アーキテクチャ(1つの損失関数を最適化):98.1%
- 教師あり深層学習アーキテクチャ(1という同じ損失関数の重みで2つの損失関数を最適化):98.1%
【0050】
分類しきい値は、信号をクリーンな信号またはノイズの多い信号としてラベリングするための品質しきい値を示してよく、≧0.5の場合、信号をクリーンな信号と分類でき、<0.5の場合、信号をノイズが多い信号と分類してよい。
【0051】
テストのために、偽陽性と偽陰性との間のバランスを維持するために、最高のF1スコアを有するエポックおよび正則化強度の組み合わせを使用した。分類しきい値を、訓練済み訓練可能モデルが[0,1]の間の値を与えるという観点から選択し、0はノイズの多い信号を意味し、1はクリーンな信号を意味する。0.5という分類しきい値において、訓練済み訓練可能モデルの出力値が0.5を下回る場合、信号はノイズが多いと見なされ、そうでなければクリーンであると見なされる。この分類しきい値はさまざまであってよい。最適な分類しきい値を見つけるための技術は、当業者に知られており、例えばROC曲線に基づく。半教師ありモデルを使用するために、最適な分類しきい値を使用し得る。本方法は、最適な分類しきい値を計算することを含み得る。最適な分類しきい値を計算するためのいくつかの選択肢が可能である。例えば、臨床データのサンプルを使用して最適な分類しきい値を推定し、それを使用して確率(モデルの出力)をその分類しきい値へと丸められるラベルに変換し得る。
【0052】
追加的に、または代替的に、訓練済み訓練可能モデルのテストのために、完全に独立したラベリング済みデータセットを使用してもよい。例えば、訓練セット用のデータを収集するために、モデルの訓練に使用される参加者とは異なる参加者が使用されてもよい。例えば、“A quality metric for heart rate variability from photoplethysmogram sensor data”,of M.Zanon et al.,PMID:33018085,DOI:10.1109/EMBC44109.2020.9175671に記載されているようなデータセットからの1000個の重複しないサンプルを、テストデータセットとして使用し得る。結果として、分類しきい値を0.5として、精度が以下のとおりであることが明らかになった。
- 教師あり深層学習アーキテクチャ(1つの損失関数を最適化):92.5%
- 教師あり深層学習アーキテクチャ(1という同じ損失関数の重みで2つの損失関数を最適化):91.6%
- 教師あり深層学習アーキテクチャ(最適な損失関数の重みで2つの損失関数を最適化):92.5%
【0053】
最適な分類しきい値の場合、精度が以下のとおりであることが明らかになった。
- 教師あり深層学習アーキテクチャ(1つの損失関数を最適化):91.8%
- 教師あり深層学習アーキテクチャ(1という同じ損失関数の重みで2つの損失関数を最適化):90.6%
- 教師あり深層学習アーキテクチャ(最適な損失関数の重みで2つの損失関数を最適化):92.0%
【0054】
教師あり学習は、M.Zanon et al.,PMID:33018085,DOI:10.1109/EMBC44109.2020.9175671の“A quality metric for heart rate variability from photoplethysmogram sensor data”で提案されているような多変量品質メトリックの使用よりも、より良好に機能することが明らかになっており、なぜならば、本発明による方法によれば、特徴ベースの多変量品質メトリックと比べ、生信号のより多くの情報が使用されるからである。同じデータセットについてこの論文からの多変量品質メトリックを使用したモデルの精度は、84%であった。再構成に関する第2の出力を使用することが、説明可能性を助け、すなわち特定の入力信号から畳み込みにおいてモデルが実際に何を学習したかを説明することが明らかになった。例えば、再構成が正しいピークおよび洞波形を示すことができる場合、モデルは、信号をクリーンであると分類するために何が重要であったかを学習済みである。2つの競合する損失関数を有することを学習するためにモデルがより複雑になるため、結果は少し低くなる可能性があると予想された。しかしながら、本方法は多変量品質メトリックよりも良好に機能することが明らかになった。
【0055】
教師あり深層学習アーキテクチャおよび半教師あり深層学習アーキテクチャの両方について、2つの損失関数の使用は、分類、したがってクリーンな信号をノイズの多い信号から区別するためにラベリングされた信号を使用することを一緒に学習することを可能にし、ネットワークが信号の生理学についてより多く学習することを助けることを可能にする。
【0056】
本明細書において使用されるとき、「半教師あり」深層学習アーキテクチャという用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、ラベリング済みの履歴生物学的センサデータおよびラベリングされていない履歴生物学的センサデータに基づいて学習する深層学習を指し得る。半教師ありモデルにおけるラベリングされていないデータの使用は、とくには元の訓練データセットにまだ含まれていない新たな活動/被験者の場合に、信号再構成の学習の改善および分類性能の改善を可能にし得る。
【0057】
例えば、とくには上記のラベリング済みのPPGデータセットに加えて、訓練用の履歴生物学的センサデータとして、ラベリングされていないPPGデータセットを使用し得る。例えば、ラベリングされていないPPGデータセットを、以下のように設定し得る。20人の健康なボランティア(女性4名および男性16名、平均年齢32歳)から、参加者が5分ごとに活動を切り替える管理された様相で一連の活動を実行しつつ、データを収集した。例えば、スクリーニングおよびインフォームドコンセントのプロセス(安静に着席して)、ECGおよびPPGセンサの配置(安静に着席して)、ベースライン(安静に着席)、ペース呼吸(呼吸数を毎分5回から毎分20回まで5刻みで段階的に増加させる)、ゲーム機での5分間のゲームプレイ(PS 4 Aaero)、直立(静かに立っている)、精神的ストレス操作(例えば、Ewing et al 1992に記載されているようなSerial 7s[目を閉じた状態で700から7を引き算していき、各々の答えを声に出す])、身体的活動操作(予め設定された円形経路に沿った途切れない屋内歩行;すべての被験者について同じ経路)、ベースライン(安静に着席)、PPG/ECG機器の回収、および感想などの複数の活動を含むプロトコルを使用し得る。以下の表が、例示的なプロトコルのリストを示す。
【0058】
【0059】
活動は、安静姿勢での着席、ペース呼吸、ゲーム機でのゲームプレイ、直立、精神的ストレス操作、身体的活動、および安静姿勢での着席を含んだ。一部の活動(例えば、身体的活動、直立、およびゲーム機でのゲームプレイ)が、さまざまなレベルの運動アーチファクトを持ち込むと疑われる一方で、他の活動(例えば、ペース呼吸)は、心拍数を増加させ、PPG波形を変化させる。例えば、各々が10秒の長さである合計37564個の重複しないPPG信号サンプルを収集した。ラベリングされていないデータセットの収集のさらなる詳細については、“A quality metric for heart rate variability from photoplethysmogram sensor data”,of M.Zanon et al.,PMID:33018085,DOI:10.1109/EMBC44109.2020.9175671が参照される。
【0060】
上述したように、半教師ありモデルのための訓練データセットは、ラベリング済み履歴生物学的センサデータおよびラベリングされていない履歴生物学的センサデータを含み得る。例えば、手動でラベリング済みの9380個のバランスした信号サンプルを使用してよく、加えて、“A quality metric for heart rate variability from photoplethysmogram sensor data”,of M.Zanon et al.,PMID:33018085,DOI:10.1109/EMBC44109.2020.9175671において収集されたデータセットから収集されたラベリングされていないサンプルを使用してよい。
【0061】
上述のように、本方法は、少なくとも1つの検証ステップを含み得る。半教師あり深層学習アーキテクチャを使用する訓練可能モデルを検証するための検証データセットは、例えば、上記のように、5人の健康なボランティアから収集された履歴生物学的センサからの1000個の重複しない手動でラベリングされたサンプルを含み得、検証に使用される1000個の重複しない手動でラベリングされたサンプルは、訓練には使用されていない。
【0062】
上述のように、本方法は、少なくとも1つのテストステップを含み得る。例えば、半教師あり深層学習アーキテクチャに基づく訓練済み訓練可能モデルのテストのために、テストデータとして、上述したように、5人の健康なボランティアから収集された履歴生物学的センサからの1000個の重複しない手動でラベリングされたサンプルを使用し得る。テストに使用した1000個の重複しない手動でラベリングされたサンプルは、訓練に使用されたものではない。5名からのテストデータセットからのデータを使用した場合の半教師ありモデルの精度は、以下のとおりである。
- 半教師あり深層学習アーキテクチャ(2つの損失関数を1という同じ損失関数の重みで最適化):97.9%
【0063】
追加的に、または代替的に、テストのために、他のテストデータが使用されてもよい。例えば、上記および“A quality metric for heart rate variability from photoplethysmogram sensor data”,of M.Zanon et al.,PMID:33018085,DOI:10.1109/EMBC44109.2020.9175671に記載のように収集されたラベリングされていないデータセットからの1000個の重複しないサンプルを、テストデータセットとして使用し得る。テストに使用したサンプルには、手動で注釈が付けられている。例えば、テストに使用されるデータセットは、796個のノイズの多いPPG信号および204個のクリーンなPPG信号を含んでよい。結果として、分類しきい値を0.5として、精度が以下のとおりであることが明らかになった。
- 半教師あり深層学習アーキテクチャ(2つの損失関数を1という同じ損失関数の重みで最適化):87.7%
- 半教師あり深層学習アーキテクチャ(2つの損失関数を最適な損失関数の重みで最適化):90.6%
【0064】
最適な分類の場合、精度が以下のとおりであることが明らかになった。
- 半教師あり深層学習アーキテクチャ(2つの損失関数を1という同じ損失関数の重みで最適化):90.8%
- 半教師あり深層学習アーキテクチャ(2つの損失関数を最適な損失関数の重みで最適化):91.3%
【0065】
モデルの性能を、例えば“A quality metric for heart rate variability from photoplethysmogram sensor data”,of M.Zanon et al.,PMID:33018085,DOI:10.1109/EMBC44109.2020.9175671に提案されているような他変量品質メトリックを用いた性能と比較し得る。PPG信号をECG信号と同時に収集し、Zanon et al.,2020に記載されているように、導出されたHRV特徴を比較し、最終的に信号ごとのHRV品質メトリックを推定した。HRV品質メトリックを各々のPPGサンプル信号について計算し、HRV品質メトリック値が20未満である場合、PPG信号を信頼できる(すなわち、クリーンである)と見なした。半教師あり学習は、多変量品質メトリックの使用と比べ、性能が良好であることが明らかになった。
【0066】
半教師あり深層学習アーキテクチャのアーキテクチャは、訓練ステップにおけるラベリングなしのデータの使用および追加の入力パラメータZinputが追加されるが、教師あり深層学習アーキテクチャと同一であってよい。したがって、半教師あり深層学習アーキテクチャの説明に関しては、上記の教師あり深層学習アーキテクチャが参照される。例えば、半教師あり深層学習アーキテクチャは、5つの畳み込み層を備え得る。第1の層は、膨張を有しなくてもよく、第2の層は、2という膨張を有してよく、そこから、膨張は、次の各層ごとに2倍になってよい。各層において、16個のフィルタを使用し得る。サイズ3、5、7、またはさらに他のサイズのカーネルを、使用し得る。正則化強度は、0.0005~0.002の範囲、例えば0.0005、0.001、0.0015、または0.002であってよい。しかしながら、他の実施形態も可能である。半教師あり深層学習アーキテクチャは、畳み込み層の後かつ出力の前に平坦化層を含み得る。半教師あり深層学習アーキテクチャは、例えば0.00001の学習率を有し、10または100またはさらに多くのエポックごとに学習率が半減する減衰を有するAdamオプティマイザを含み得る。しかしながら、他の学習率および学習減衰率も可能である。例えば、訓練のために、128というバッチサイズ、および300までのエポックを使用し得る。例えば、訓練のために、128というバッチサイズ、および50から最大500またはさらに多くのエポックを使用し得る。しかしながら、他のバッチサイズおよびエポックも可能である。各々のエポックについて、モデルを、ラベリング済みのデータで一度、ならびにラベリング済みおよびラベリングなしの複合データからランダムに選択されたN個のサンプルで一度、訓練してよく、ここでNは、ラベリング済みのセットのサイズの2倍である。
【0067】
手動でラベリングされた履歴生物学的センサデータおよびラベリングされていない履歴生物学的センサデータを、半教師あり深層学習アーキテクチャに基づく訓練可能モデルの訓練に使用し得る。ラベリングされていない生物学的センサデータについて、訓練可能モデルを、信号再構成に関する損失関数を最適化することによって、および分類に関する損失関数を無視することによって訓練し得る。訓練のために、教師ありモデルと同じバランスしたラベリング済みデータセットを使用してよく、さらに、上述のラベリングなしのデータを使用してよい。上述のような1000個の重複しないランダムサンプルなどの独立したデータセットを、訓練済み訓練可能モデルのテストに使用し得る。
【0068】
本発明は、具体的には、PPG信号データをクリーニングするための新規なWavenetのような膨張畳み込みネットワークを提案する。注釈付きデータの取得には費用も時間もかかるが、ラベリングされていないデータは大量に利用可能である。信号再構成に基づく半教師ありフレームワークを使用することにより、ラベリングされていないデータから信号の良好な表現を学習することが可能になる。偽陽性および偽陰性の制御を学習するためのさまざまな手法を、本明細書に記載されるように、高い全体的な精度を得ながら、さまざまなやり方で実行できることが明らかになった。調整(具体的には、最適な分類しきい値)により、半教師ありモデルは、教師ありの手法を性能において上回ることができ、大量の利用可能なラベリングされていないデータを取り入れることが有利になり得ることを示唆している。
【0069】
本発明は、信号再構成ならびに半教師あり深層学習モデルを有することを可能にする訓練済み訓練可能モデルを適用することによって、生物学的センサのデータ品質を分類する新規な手法を提案する。信号再構成は、通常は画像について使用される技術であるため、PPGのような信号にはこれまで適用されてこなかった。本発明によって提案されるような半教師ありのやり方を使用するためには、ラベリングされていないデータによって学習された情報と、教師ありデータによって学習された情報/分類とを組み合わせるために、信号再構成技術が必要となり得る。このような手法は、これまでに言及されていない。半教師ありの手法は、これまでは、他の用途には使用されていたが、PPG信号の品質推定などの生物学的信号には使用されておらず、信号がクリーンであると仮定するだけであった。
【0070】
本方法は、ラベリングされていないデータセットに基づく訓練のために追加の入力パラメータZinputを導入することを含み得る。これにより、「欠けている」ラベルの処理を可能にできる。追加の入力パラメータは、特定のデータがラベリングされているか否かを示すバイナリ値であってよい。例えば、追加の入力パラメータは、ラベリングされていないデータについて「0」であってよく、ラベリング済みのデータについて「1」であってよい。追加の入力パラメータを、分類の学習がラベリングされていないデータの影響を受けないように、学習プロセスの際に分類出力と乗算し得る。
【0071】
例えば、半教師あり深層学習アーキテクチャに基づく訓練は、まず、分類ラベルおよび信号再構成のための関連情報を学習するためのラベリング済みデータのデータセットを用いた訓練を含み得る。訓練は、その後に、信号再構成をより良好に学習するために、ラベリングされていないデータのランダムなサブセットのみを用いた訓練を含み得る。ラベリングされていないデータを用いた訓練は、例えば異なる人々や異なる活動など、ラベリング済み訓練セットに含まれていなかった信号生理学を導入することをさらに含み得る。データに注釈を付けることは高価であり、利用可能な注釈付きデータセットはきわめて少ない。しかしながら、ラベリングされていないデータは多数が利用可能である。半教師あり学習は、ラベリングされていないデータの活用を可能にし、少量のラベリング済みデータの最も効率的な使用を可能にする。
【0072】
半教師ありアーキテクチャを使用することにより、提案されたモデルを新たなデータセットへと拡張し、かつ/または移転させることを可能にできる。例えば、充分なラベリング済みの例が存在しないなどの理由で、元々の訓練済みモデルの訓練に使用されるデータの最大50%未満など、データがさらに少ない新たな状況にモデルを適応させる必要がある場合に、半教師ありの手法を使用して信頼できるモデルを訓練することが可能である。精度は、すべてのアルゴリズムにおいて90%超を保つことが明らかになった。
【0073】
訓練済み訓練可能モデルは、教師あり深層学習アーキテクチャおよび半教師あり深層学習アーキテクチャの組み合わせに基づいて訓練されてよい。組み合わせは、2つのアーキテクチャによって報告された確率の平均を考慮に入れる2つのアーキテクチャの組み合わせ平均予測を使用し得る。
【0074】
本発明のさらなる態様において、生物学的センサが開示される。生物学的センサは、生物学的センサデータの品質を分類するように構成される。生物学的センサは、少なくとも1つの信号を含む生物学的センサデータを提供するように構成された少なくとも1つの測定ユニットを備える。生物学的センサは、少なくとも1つの訓練済み訓練可能モデルを使用することによって信号の品質を分類するように構成された少なくとも1つの処理ユニットを備える。訓練可能モデルは、教師あり深層学習アーキテクチャおよび/または半教師あり深層学習アーキテクチャに基づいて、履歴生物学的センサデータについて訓練される。訓練可能モデルは、分類に関する1つの損失関数または信号再構成および分類に関する2つの損失関数を最適化することによって訓練される。
【0075】
具体的には、生物学的センサは、本発明による方法を実施するように、かつ/または本発明による方法において使用されるように構成されてよい。生物学的センサの特徴の定義および生物学的センサの任意の特徴に関して、上記で開示され、または以下でさらに詳しく開示される方法の実施形態のうちの1つ以上を参照し得る。
【0076】
本明細書において一般的に使用されるとき、「処理ユニット」という用語は、広義の用語であり、当業者にとってのその通常の慣習的な意味が与えられるべきであり、特殊な意味または特別な意味に限定されるべきではない。この用語は、具体的には、限定はされないが、コンピュータまたはシステムの基本的な動作を実行するように構成された任意の論理回路、および/または一般に、計算または論理動作を実行するように構成された装置を指し得る。とくに、処理ユニットは、コンピュータまたはシステムを駆動する基本的な命令を処理するように構成されてよい。例として、処理ユニットは、少なくとも1つの算術論理演算装置(ALU)、数値演算コプロセッサまたは数値コプロセッサなどの少なくとも1つの浮動小数点ユニット(FPU)、複数のレジスタ、具体的にはALUにオペランドを供給し、演算結果を格納するように構成されたレジスタ、ならびにL1およびL2キャッシュメモリなどのメモリを含み得る。とくには、処理ユニットは、マルチコアプロセッサであってよい。具体的には、処理ユニットは、中央処理装置(CPU)であってよく、またはCPUを備え得る。追加的に、または代替的に、処理ユニットはマイクロプロセッサであってよく、またはマイクロプロセッサを備えてよく、したがって、具体的には、処理ユニットの要素が、1つの単一の集積回路(IC)チップに含まれてよい。追加的に、または代替的に、処理ユニットは、1つ以上の特定用途向け集積回路(ASIC)および/または1つ以上のフィールドプログラマブルゲートアレイ(FPGA)などであってよく、またはこれらを備えてよい。処理ユニットは、具体的には、ソフトウェアプログラミングなどにより、1つまたは複数の評価動作を実行するように構成されてよい。
【0077】
生物学的センサは、可搬フォトプレチスモグラム装置であってよい。可搬フォトプレチスモグラム装置は、少なくとも1つの照明源と、少なくとも1つのフォトプレチスモグラムを提供するように構成された少なくとも1つのフォトディテクタとを備えてよい。処理ユニットは、訓練済み訓練可能モデルを使用することによってフォトプレチスモグラムの品質を分類するように構成されてよい。
【0078】
プログラムがコンピュータまたはコンピュータネットワークまたはクラウド上で実行されるときに本明細書に含まれる実施形態のうちの1つ以上における本発明による方法を実行するためのコンピュータ実行可能命令を含むコンピュータプログラムが、本明細書にさらに開示および提案される。具体的には、コンピュータプログラムは、コンピュータ可読データ担体および/またはコンピュータ可読記憶媒体に格納されてよい。
【0079】
本明細書において使用されるとき、「コンピュータ可読データ担体」および「コンピュータ可読記憶媒体」という用語は、具体的には、コンピュータ実行可能命令を格納したハードウェア記憶媒体などの非一時的データ記憶手段を指し得る。コンピュータ可読データ担体または記憶媒体は、具体的には、ランダムアクセスメモリ(RAM)および/または読み出し専用メモリ(ROM)などの記憶媒体であってよく、または、そのような記憶媒体を備えてよい。
【0080】
したがって、具体的には、上述したような方法ステップa)およびステップb)ならびに任意にc)のうちの1つ、2つ以上、またはすべてを、コンピュータまたはコンピュータネットワークまたはクラウドを使用して、好ましくはコンピュータプログラムを使用して実行し得る。
【0081】
プログラムがコンピュータまたはコンピュータネットワークまたはクラウド上で実行されたときに本明細書に含まれる実施形態のうちの1つ以上における本発明による方法を実行するためのプログラムコード手段を有するコンピュータプログラム製品が、本明細書においてさらに開示および提案される。具体的には、プログラムコード手段は、コンピュータ可読データ担体および/またはコンピュータ可読記憶媒体に格納されてよい。
【0082】
コンピュータまたはコンピュータネットワークまたはクラウドのワーキングメモリまたはメインメモリなど、コンピュータまたはコンピュータネットワークまたはクラウドへのロード後に、本明細書に開示の実施形態のうちの1つ以上による方法を実行し得るデータ構造を格納したデータ担体が、本明細書においてさらに開示および提案される。
【0083】
プログラムがコンピュータまたはコンピュータネットワークまたはクラウド上で実行されるときに本明細書に開示の実施形態のうちの1つ以上による方法を実行するために、プログラムコード手段を機械可読担体上に格納して有するコンピュータプログラム製品が、本明細書においてさらに開示および提案される。本明細書において使用されるとき、コンピュータプログラム製品は、取引可能な製品としてのプログラムを指す。製品は、一般に、紙フォーマット、またはコンピュータ可読データ担体上および/もしくはコンピュータ可読記憶媒体上など、任意のフォーマットで存在してよい。具体的には、コンピュータプログラム製品は、データネットワーク上で配信されてもよい。
【0084】
最後に、本明細書に開示の実施形態のうちの1つ以上による方法を実行するためのコンピュータシステムまたはコンピュータネットワークまたはクラウドによって読み取り可能な命令を含む変調データ信号が、本明細書において開示および提案される。
【0085】
本発明による方法および装置は、同種の既知の方法および装置に勝る多くの利点を提供し得る。具体的には、本発明は、日々の生活活動の最中の実世界のデータセット内の連続PPG信号から信頼できる信号またはクリーンな信号を検出するための手法を提供し得る。一般に、PPG信号の品質の評価は、ラベリングされていないデータは大量に利用可能であるが、利用可能なラベリング済み生理学的信号は少量しかないため、技術的に困難であり得る。本発明による方法および装置を使用し、具体的には半教師あり深層学習アーキテクチャに基づく訓練可能モデルを使用することによって、大量のラベリングされていないデータを活用することを可能にできる。したがって、生物学的センサデータを解釈し、訓練可能モデルが、訓練済みモデルの学習プロセスにおいて信号再構成を使用することによって信号の生理学に関する情報を確実に学習することを可能にし得る。さらに、訓練可能モデルを使用することによって、信号を再構成すると同時に、信号をノイズの多い信号またはクリーンな信号として分類することを可能にし得る。
【0086】
米国特許出願公開第2019/133468号明細書が、個人が心房細動を有するかどうかを分類することを記載している。したがって、米国特許出願公開第2019/133468号明細書によって得られる品質は、特定の疾患に関連しているが、一般に、いかなるPPG信号にも関係がない(例えば、米国特許出願公開第2019/133468号明細書の図5に記載されているとおり)。米国特許出願公開第2019/133468号明細書は、異なる非PPGセンサ(すなわち、IMU)を用いた動きの識別、およびベースライン信号レベルの除去など、複雑で時間のかかる前処理ステップ(例えば、米国特許出願公開第2019/133468号明細書の図4)を記載している。これらの複雑で時間のかかる前処理ステップは、品質の検出をより容易にすることを目的としている。対照的に、本発明は、そのような複雑で時間のかかる前処理ステップを回避し、むしろそのようなステップをモデルにおいて暗黙的にアルゴリズムに組み込むことができる。これにより、実際のモデルの前のこれらの余分なステップを回避することができる。米国特許出願公開第2019/133468号明細書において使用されるモデルは、予測をより容易にすると考えられる追加の入力として、例えば加速度計などの追加のセンサからの動き情報を必要とする(米国特許出願公開第2019/133468号明細書の図6を参照)。本発明によるモデルの場合、動き情報の追加の入力は必要とされない。
【0087】
本発明のコンピュータ実装態様に関して、本明細書に開示の実施形態のうちの1つ以上による方法の方法ステップのうちの1つ以上またはすべてが、コンピュータまたはコンピュータネットワークまたはクラウドを使用することによって実行されてよい。したがって、一般に、データの提供および/または操作を含む方法ステップのいずれも、コンピュータまたはコンピュータネットワークまたはクラウドを使用することによって実行されてよい。一般に、これらの方法ステップは、典型的には試料の提供および/または実際の測定を実行する特定の態様などの手作業を必要とする方法ステップを除いて、任意の方法ステップを含み得る。
【0088】
具体的には、本明細書において、
- 少なくとも1つのプロセッサを備え、プロセッサは、本明細書に記載の実施形態のうちの1つによる方法を実行するように構成されるコンピュータまたはコンピュータネットワークまたはクラウド、
- コンピュータ上で実行されているときに本明細書に記載の実施形態のうちの1つによる方法を実行するように構成されたコンピュータロード可能データ構造、
- コンピュータ上で実行されているときに、本明細書に記載の実施形態のうちの1つによる方法を実行するように構成されたコンピュータプログラム、
- コンピュータまたはコンピュータネットワークまたはクラウド上で実行されているときに本明細書に記載の実施形態のうちの1つによる方法を実行するためのプログラム手段を備えているコンピュータプログラム、
- 先行の実施形態によるプログラム手段を備えているコンピュータプログラムであって、プログラム手段は、コンピュータ可読記憶媒体に格納されているコンピュータプログラム、
- データ構造を格納しており、データ構造は、コンピュータまたはコンピュータネットワークまたはクラウドの主記憶部および/または作業記憶部にロードされた後に本明細書に記載の実施形態のうちの1つによる方法を実行するように構成されている記憶媒体、および
- 記憶媒体上に格納可能または格納されたプログラムコード手段を有しており、プログラムコード手段がコンピュータまたはコンピュータネットワークまたはクラウド上で実行された場合に、本明細書に記載の実施形態のうちの1つによる方法が実行されるコンピュータプログラム製品
がさらに開示される。
【0089】
要約すると、さらなる実施形態の可能性を排除することなく、以下の実施形態が想定され得る:
実施形態1 生物学的センサデータの品質を分類するためのコンピュータ実装方法であって、以下:
a)少なくとも1つの生物学的センサによって得られた生物学的センサデータを提供するステップであって、生物学的センサデータは、少なくとも1つの信号を含む、生物学的センサデータを提供するステップと、
b)少なくとも1つの訓練済み訓練可能モデルを使用することによって信号の品質を分類するステップであって、訓練可能モデルは、教師あり深層学習アーキテクチャおよび/または半教師あり深層学習アーキテクチャに基づいて履歴生物学的センサデータについて訓練され、訓練可能モデルは、分類に関する1つの損失関数、または、信号再構成および分類に関する2つの損失関数を最適化することによって訓練される、信号の品質を分類するステップと
を含む、方法。
【0090】
実施形態2 生物学的センサは、少なくとも1つの可搬フォトプレチスモグラム装置であり、生物学的センサデータは、可搬フォトプレチスモグラム装置によって得られた少なくとも1つのフォトプレチスモグラムを含む、実施形態1に記載の方法。
【0091】
実施形態3 品質は、心拍変動データに関する品質インジケータとして使用され、品質は、許容可能な心拍変動データと許容不可能な心拍変動データとを区別するために使用される、実施形態2に記載の方法。
【0092】
実施形態4 品質を分類することは、ノイズの多い信号とクリーンな信号とを区別することを含む、実施形態1~3のいずれか1つに記載の方法。
【0093】
実施形態5 訓練可能モデルは、畳み込みニューラルネットワーク(CNN)、再帰型ニューラルネットワーク(RNN)、長・短期記憶(LSTM)からなる群から選択される少なくとも1つのディープニューラルネットワークを備える、実施形態1~4のいずれか1つに記載の方法。
【0094】
実施形態6 前記方法が、c)少なくとも1つの訓練ステップをさらに含み、訓練ステップにおいて、訓練可能モデルは、教師あり深層学習アーキテクチャおよび/または半教師あり深層学習アーキテクチャに基づいて、履歴生物学的センサデータを含む少なくとも1つの訓練データセットについて訓練され、訓練可能モデルは、分類に関する1つの損失関数、または、信号再構成および分類に関する2つの損失関数を最適化することによって訓練される、実施形態1~5のいずれか1つに記載の方法。
【0095】
実施形態7 教師あり深層学習アーキテクチャに基づいて訓練可能モデルを訓練するために、手動でラベリングされた履歴生物学的センサデータが使用される、実施形態1~6のいずれか1つに記載の方法。
【0096】
実施形態8 半教師あり深層学習アーキテクチャに基づいて訓練可能モデルを訓練するために、手動でラベリングされた履歴生物学的センサデータおよびラベリングされていない履歴生物学的センサデータが使用される、実施形態1~7のいずれか1つに記載の方法。
【0097】
実施形態9 ラベリングされていない生物学的センサデータについて、訓練可能モデルは、信号再構成に関する損失関数を最適化することによって、および分類に関する損失関数を無視することによって訓練される、実施形態8に記載の方法。
【0098】
実施形態10 生物学的センサデータのフィルタ処理または正規化のうちの1つ以上を含む少なくとも1つの前処理ステップを含む、実施形態1~9のいずれか1つに記載の方法。
【0099】
実施形態11 生物学的センサであって、生物学的センサは、生物学的センサデータの品質を分類するように構成され、生物学的センサは、少なくとも1つの信号を含む生物学的センサデータを提供するように構成された少なくとも1つの測定ユニットを備え、生物学的センサは、少なくとも1つの訓練済み訓練可能モデルを使用することによって信号の品質を分類するように構成された少なくとも1つの処理ユニットを備え、訓練可能モデルは、教師あり深層学習アーキテクチャおよび/または半教師あり深層学習アーキテクチャに基づいて履歴生物学的センサデータについて訓練され、訓練可能モデルは、分類に関する1つの損失関数、または、信号再構成および分類に関する2つの損失関数を最適化することによって訓練される、生物学的センサ。
【0100】
実施形態12 生物学的センサは、可搬フォトプレチスモグラム装置であり、可搬フォトプレチスモグラム装置は、少なくとも1つのフォトプレチスモグラムを提供するように構成された、少なくとも1つの照明源および少なくとも1つのフォトディテクタを備え、処理ユニットは、訓練済み訓練可能モデルを使用することによってフォトプレチスモグラムの品質を分類するように構成される、実施形態11に記載の生物学的センサ。
【0101】
実施形態13 実施形態1~10のいずれか1つに記載の方法を実行するように構成された、実施形態11または12に記載の生物学的センサ。
【0102】
実施形態14 命令を含んでいるコンピュータプログラムであって、命令は、プログラムが実施形態11~13のいずれか1つに記載の生物学的センサによって実行されたときに、生物学的センサに、実施形態1~10のいずれか1つに記載の方法のステップa)からステップb)を実行させ、任意にステップc)も実行させる、コンピュータプログラム。
【0103】
実施形態15 命令を含んでいるコンピュータ可読記憶媒体であって、命令は、実施形態11~13のいずれか1つに記載の生物学的センサによって実行されたときに、生物学的センサに、実施形態1~10のいずれか1つに記載の方法のステップa)からステップb)を実行させ、任意にステップc)も実行させる、コンピュータ可読記憶媒体。
【図面の簡単な説明】
【0104】
さらなる任意の特徴および実施形態が、好ましくは従属請求項と併せて、実施形態の後続の説明においてさらに詳細に開示される。ここで、それぞれの任意の特徴は、当業者であれば理解できるとおり、独立した様相ならびに任意の実行可能な組み合わせにて実現されてよい。本発明の範囲は、好ましい実施形態によって限定されるわけではない。実施形態は、図において概略的に示されている。ここで、これらの図における同一の参照番号は、同一または機能的に同等の要素を指す。
【0105】
図1】生物学的センサデータの品質を分類するためのコンピュータ実装方法のフロー図および生物学的センサの一実施形態の概略図を示している。
図2A】クリーンな信号を含む例示的な生物学的センサデータを示している。
図2B】クリーンな信号を含む例示的な生物学的センサデータを示している。
図2C】ノイズの多い信号を含む例示的な生物学的センサデータを示している。
図2D】ノイズの多い信号を含む例示的な生物学的センサデータを示している。
図3A】教師あり深層学習アーキテクチャの実施形態を概略図にて示している。
図3B】教師あり深層学習アーキテクチャの実施形態を概略図にて示している。
図3C】教師あり深層学習アーキテクチャの実施形態を概略図にて示している。
図4A】教師あり深層学習アーキテクチャの例示的な再構成信号を示している。
図4B】教師あり深層学習アーキテクチャの例示的な再構成信号を示している。
図5A】半教師あり深層学習アーキテクチャの実施形態を概略図にて示している。
図5B】半教師あり深層学習アーキテクチャの実施形態を概略図にて示している。
図6A】教師あり深層学習アーキテクチャの例示的な再構成信号を示している。
図6B】半教師あり深層学習アーキテクチャの例示的な再構成信号を示している。
図7】ランダムに選択されたPPGサンプルの活動のヒストグラムを示している。
図8A】第1の数のラベリングされたデータにおける種々の深層学習アーキテクチャの性能データを示している。
図8B】第1の数のラベリングされたデータにおける種々の深層学習アーキテクチャの性能データを示している。
図8C】第1の数のラベリングされたデータにおける種々の深層学習アーキテクチャの性能データを示している。
図9A】第2の数のラベリングされたデータにおける種々の深層学習アーキテクチャの性能データを示している。
図9B】第2の数のラベリングされたデータにおける種々の深層学習アーキテクチャの性能データを示している。
図9C】第2の数のラベリングされたデータにおける種々の深層学習アーキテクチャの性能データを示している。
図10】ラベリングされた信号の種々の配分における半教師あり深層学習アーキテクチャの性能データを示している。
【発明を実施するための形態】
【0106】
実施形態の詳細な説明
図1が、生物学的センサデータ110の品質を分類するためのコンピュータ実装方法のフロー図および生物学的センサ112の例示的な実施形態の概略図を示している。生物学的センサ112は、生物学的センサデータ110の品質を分類するように構成される。生物学的センサ112は、少なくとも1つの信号116を含む生物学的センサデータ110を提供するように構成された少なくとも1つの測定ユニット114を備える。生物学的センサ112は、少なくとも1つの訓練済み訓練可能モデル119(図1には図示せず)を使用することによって信号116の品質を分類するように構成された少なくとも1つの処理ユニット118を備える。訓練可能モデル119は、教師あり深層学習アーキテクチャ134および/または半教師あり深層学習アーキテクチャ188(図1には示されていない)に基づいて、履歴生物学的センサデータについて訓練される。訓練可能モデル119は、分類に関する1つの損失関数または信号再構成および分類に関する2つの損失関数を最適化することによって訓練される。
【0107】
生物学的センサ112は、可搬フォトプレチスモグラム装置120であってよい。可搬フォトプレチスモグラム装置120は、少なくとも1つの照明源122と、少なくとも1つのフォトプレチスモグラム126を提供するように構成された少なくとも1つのフォトディテクタ124とを備えてよい。処理ユニット118は、訓練済み訓練可能モデル119を使用することによってフォトプレチスモグラム126の品質を分類するように構成されてよい。
【0108】
生物学的センサ112は、具体的には、生物学的センサデータ110の品質を分類するための方法を実行するように構成されてよく、かつ/または生物学的センサデータ110の品質を分類するための方法において使用されるように構成されてよい。生物学的センサデータ110の品質を分類するための方法の例示的な実施形態が、図1のフロー図に示されている。
【0109】
本方法は、一例として、所与の順序で実行されてよい以下のステップを含む。しかしながら、異なる順序も可能であることに留意されたい。さらに、方法ステップのうちの1つ以上を1回または繰り返し実行することも可能である。さらに、方法ステップのうちの2つ以上を同時に、または時間的に重なった様相で実行することが可能である。本方法は、挙げられていないさらなる方法ステップを含んでもよい。
【0110】
本方法は、以下:
a)少なくとも1つの生物学的センサ112によって得られた生物学的センサデータ110を提供するステップであって、生物学的センサデータ110は、少なくとも1つの信号116を含む、生物学的センサデータ110を提供するステップ(参照番号128によって示される)と、
b)少なくとも1つの訓練済み訓練可能モデル119を使用することによって信号116の品質を分類するステップであって、訓練可能モデル119は、教師あり深層学習アーキテクチャ134および/または半教師あり深層学習アーキテクチャ188に基づいて履歴生物学的センサデータについて訓練され、訓練可能モデル119は、分類に関する1つの損失関数または信号再構成および分類に関する2つの損失関数を最適化することによって訓練される、信号116の品質を分類するステップ(参照番号130によって示される)と
を含む。
【0111】
上述したように、生物学的センサ112は、少なくとも1つの可搬フォトプレチスモグラム装置120であってよい。生物学的センサデータ110は、可搬フォトプレチスモグラム装置120によって得られた少なくとも1つのフォトプレチスモグラム126を含み得る。一例として、品質を、心拍変動データの品質インジケータとして使用し得る。品質を、許容可能な心拍変動データと許容不可能な心拍変動データとを区別するために使用し得る。
【0112】
さらに、生の信号を使用しても、または処理された信号もしくは前処理された信号を使用して、センサ信号116としても使用され得る二次信号を生成してもよい。本方法は、生物学的センサデータ110のフィルタ処理または正規化のうちの1つ以上を含む少なくとも1つの前処理ステップ(参照番号131で示される)を含み得る。図1に示されるように、前処理ステップを、具体的には、ステップa)とステップb)との間で実行し得る。例えば、PPG装置120の信号116の場合に、バンドパスフィルタを使用し得る。さらに、信号116を、値が0を中心とするように正規化し得る。しかしながら、前処理は、生理学に応じて、さまざまな信号116についてさまざまであってよい。
【0113】
本方法において、品質を分類することは、ノイズの多い信号とクリーンな信号とを区別することを含み得る。例示的な生物学的センサデータ110が、図2A図2Dに示される。ここでは、具体的には、生物学的センサデータ110に例示的に含まれる信号116が示されている。図2A図2Dの例において、生物学的センサデータ110は、フォトプレチスモグラム126からのデータを含む。したがって、この例において、生物学的センサデータ110に含まれる信号116は、20Hzのサンプリング周波数で200個のPPGデータ点をもたらすPPG信号の10秒の区間であってよい。クリーンな信号116が、図2Aおよび図2Bに示されており、ノイズの多い信号116が、図2Cおよび図2Dに示されている。
【0114】
再び図1に戻る。本方法は、とくにはステップa)の前に、
c)少なくとも1つの訓練ステップ(参照番号132によって示される)をさらに含んでよく、訓練ステップにおいて、訓練可能モデル119は、教師あり深層学習アーキテクチャ134および/または半教師あり深層学習アーキテクチャ188に基づいて、履歴生物学的センサデータを含む少なくとも1つの訓練データセットについて訓練され、訓練可能モデル119は、分類に関する1つの損失関数または信号再構成および分類に関する2つの損失関数を最適化することによって訓練される。
【0115】
訓練可能モデル119は、教師あり深層学習アーキテクチャ134および/または半教師あり深層学習アーキテクチャ188に基づいて、履歴生物学的センサデータについて訓練される。教師あり深層学習アーキテクチャ134の例示的な実施形態が、図3A図3Cに概略図にて示される。
【0116】
教師あり深層学習アーキテクチャ134は、履歴バイオセンサデータおよび/または前処理された履歴バイオセンサデータを受信する少なくとも1つの入力層136を備えてよい。例えば、入力(参照番号138で示される)として、各々が20Hzの周波数による10秒間のフィルタ処理されたPPG信号を使用し得る。したがって、入力138は、図2で例示的に説明した信号116などの200個の値を含む信号116を含み得る。
【0117】
本方法において、手動でラベリングされた履歴生物学的センサデータを、教師あり深層学習アーキテクチャ134に基づく訓練可能モデル119の訓練に使用し得る。履歴生物学的センサデータとして、手動でラベリングされたPPGデータセットを使用し得る。例えば、生物学的センサデータ110の訓練データセットを、以下のように設定し得る。データを、5人の健康なボランティア(女性1人および男性4人、平均年齢33歳)から、いかなる管理にもよらずに、通常の日常活動中および夜間の睡眠中に収集した。各々が10秒の長さである合計13547個の重複しないPPG信号サンプルを収集した。信号を、Elgendi,M.,“Optimal signal quality index for photoplethysmogram signals”,Scientific Reports,3(4),2016の指示に従って、専門家によって手動でラベリングし得る。ノイズの多い8305個のPPG信号およびクリーンな5242個のPPG信号に分類した。例えば、ラベリングされた9380個の信号サンプルからなるバランスしたデータセットを、とくには訓練のための訓練データセットとして使用し得る。
【0118】
訓練ステップは、例えば各々が20Hzの周波数で合計200個のデータ点を有している10秒間のPPG信号をフィルタ処理するなど、履歴生体センサデータを前処理することを含み得る。ラベルを、訓練のための各々の入力信号に対して、ノイズの多い信号を示す「0」およびクリーンな信号を示す「1」で提供し得る。
【0119】
教師あり深層学習アーキテクチャ134は、複数の畳み込み層140、とくには畳み込み層の積層142を含み得る。畳み込み層は、膨張を伴って設計されてもよい。畳み込み層を、膨張畳み込みのために構成し得る。教師あり深層学習アーキテクチャ134は、上記でさらに詳細に説明したように、WaveNetニューラルネットワークを含み得る。しかしながら、再帰型ニューラルネットワーク(RNN)および/または長・短期記憶(LSTM)などの他のディープニューラルネットワークも実現可能である。教師あり深層学習アーキテクチャ134は、各々の畳み込み層に因果的パディングを含んでよい。
【0120】
図3A図3Cに示される例示的な実施形態において、教師あり深層学習アーキテクチャ134は、5つの畳み込み層144、146、148、150、152を含み得る。第1の層144は、膨張を有しなくてもよく、第2の層146は、2という膨張を有してよく、そこから、膨張は、次の各層ごとに2倍になってよい。各層において、16個のフィルタを使用し得る。
【0121】
サイズ3、5、7、またはさらに他のサイズのカーネルを、使用し得る。正則化強度は、0.0005~0.002の範囲、例えば0.0005、0.001、0.0015、または0.002であってよい。しかしながら、他の範囲も可能である。図3A図3Cに見られるように、先行の層の出力が、後続の層の入力を形成し得る。例えば、入力層136の出力(参照番号154によって示される)が、第1の畳み込み層144の入力を形成でき、第1の畳み込み層144の出力(参照番号156によって示される)が、第2の畳み込み層146の入力を形成でき、第2の畳み込み層146の出力(参照番号158によって示される)が、第3の畳み込み層148の入力を形成でき、第3の畳み込み層148の出力(参照番号160によって示される)が、第4の畳み込み層150の入力を形成でき、第4の畳み込み層150の出力(参照番号162によって示される)が、第5の畳み込み層152の入力を形成し得る。
【0122】
教師あり深層学習アーキテクチャ134は、例えば0.00001の学習率を有し、10または100またはさらに多くのエポックごとに学習率が半減する減衰を有するAdamオプティマイザを含み得る。しかしながら、他の学習率も可能である。例えば、訓練のために、128というバッチサイズ、および300までのエポックを使用し得る。例えば、訓練のために、128というバッチサイズ、および50から最大500またはさらに多くのエポックを使用し得る。しかしながら、他のバッチサイズおよびエポックも可能である。
【0123】
図3A図3Cに示されるように、教師あり深層学習アーキテクチャ134は、畳み込み層の後かつ出力の前に、平坦化層164を含み得る。平坦化層164は、畳み込み層の行列出力(参照番号166として示されている)を全結合層168に変換するように設計されてよい。したがって、この例において、平坦化層164の出力(参照番号172によって示される)としての畳み込み層の変換後の行列出力は、全結合層168の入力を形成し得る。
【0124】
深層学習アーキテクチャ、とくには教師あり深層学習アーキテクチャ134は、最終層、とくには全結合層168として、1つまたは2つの経路を備える出力層170を含み得る。図3Aおよび図3Cに示される例示的な実施形態は、2つの経路を備える出力層170を有する教師あり深層学習アーキテクチャ134を示している。この例において、教師あり深層学習アーキテクチャ134を、信号再構成および分類に関する2つの損失関数を最適化することによって訓練し得る。しかしながら、代案として、出力層170は、図3Bに例示的に示されるように、ただ1つの経路を備えてもよい。この例においては、教師あり深層学習アーキテクチャを、分類に関する1つの損失関数を最適化することによって訓練し得る。図3Aおよび図3Cの例において、経路の各々が出力を含み得る。具体的には、教師あり深層学習アーキテクチャ134は、2つの出力、すなわち第1の出力(参照番号174によって示される)および第2の出力(参照番号176によって示される)を含み得る。
【0125】
第1の出力174は、分類された品質を提供する分類出力であってよい。分類出力は、第1の損失関数を用いてよい。第1の損失関数は、分類損失に関連し得る。図3Aの例示的な実施形態において、分類出力は、平坦化層の出力172を入力とし得る。あるいは、図3Bおよび図3Cに例示的に示されるように、分類出力は、とくには平坦化層の出力172の代わりに、全結合層の出力182を入力として使用し得る。分類出力は、シグモイド活性化関数を使用し得る。分類出力は、0と1との間の確率を提供するためにバイナリ交差エントロピー損失関数を使用してよく、0.5を超える値は、信号116がクリーンであることを示す。
【0126】
第2の出力176は、入力138と畳み込み後の再構成された信号184との間の差の尺度を提供する平均二乗誤差(MSE)出力であってよい。MSE出力は、正規化線形ユニット(ReLU)活性化関数を使用し得る。MSE出力は、MSE損失関数を使用し得る。MSE損失関数は、平均二乗誤差(MSE)の観点からの再構成された入力信号と入力信号138との間の差に関連し得る。より小さいMSEは、より良好な信号再構成に関連する。MSE出力を推定するために、2つの追加の全結合層、すなわち図3Aおよび図3Cに示されるような第1の追加の全結合層178および第2の追加の全結合層180を、入力信号138と同じサイズの出力を有するように、平坦化層164の後にReLU活性化関数によって使用し得る。第1の追加の全結合層178の出力(参照番号182によって示される)が、第2の追加の全結合層180の入力を形成し得る。
【0127】
本方法は、少なくとも1つの検証ステップを含み得る。検証ステップを、訓練可能モデル119の訓練中に実行し得る。検証ステップを、訓練の改善を監視するために使用し得る。検証ステップは、少なくとも1つの検証データセットを使用して訓練可能モデル119を検証することを含み得る。検証データセットは、例えば、上記のように、5人の健康なボランティアから収集された履歴生物学的センサからの1000個の重複しない手動でラベリングされたサンプルを含み得、検証に使用される1000個の重複しない手動でラベリングされたサンプルは、訓練には使用されていない。
【0128】
本方法は、少なくとも1つのテストステップを含み得、テストステップは、訓練済み訓練可能モデル119をテストすることを含む。テストステップは、少なくとも1つのテストデータセットにおいて訓練済み訓練可能モデル119をテストすることを含み得る。テストステップは、例えば正確性、リコール、F1スコア、曲線下面積(AUC)などの訓練済み訓練可能モデル119の性能特性を求めることを含み得る。
【0129】
例えば、テストデータとして、上記のように、5人の健康なボランティアから収集した履歴生物学的センサからの1000個の重複しない手動でラベリングされたサンプルを使用した。テストに使用した1000個の重複しない手動でラベリングされたサンプルは、訓練に使用されたものではない。その結果、分類しきい値を0.5として、精度が以下のとおりであることが明らかになった。
- 教師あり深層学習アーキテクチャ134(図3Bに例示的に示されるように1つの損失関数を最適化):98.1%
- 教師あり深層学習アーキテクチャ134(図3Cに例示的に示されるように、2つの損失関数を1という同じ損失関数の重みで最適化):98.1%
【0130】
テストのために、偽陽性と偽陰性との間のバランスを維持するために、最高のF1スコアを有するエポックおよび正則化強度の組み合わせを使用した。分類しきい値を、訓練済み訓練可能モデル119が[0,1]の間の値を与えるという観点から選択し、0はノイズの多い信号を意味し、1はクリーンな信号を意味する。0.5という分類しきい値において、訓練済み訓練可能モデル119の出力値が0.5を下回る場合、信号116はノイズが多いと見なされ、そうでなければクリーンであると見なされる。この分類しきい値はさまざまであってよい。最適な分類しきい値を見つけるための技術は、当業者に知られており、例えばROC曲線に基づく。
【0131】
追加的に、または代替的に、訓練済み訓練可能モデル119のテストのために、完全に独立したラベリング済みデータセットを使用してもよい。例えば、訓練セット用のデータを収集するために、モデル119の訓練に使用される参加者とは異なる参加者が使用されてもよい。例えば、“A quality metric for heart rate variability from photoplethysmogram sensor data”,of M.Zanon et al.,PMID:33018085,DOI:10.1109/EMBC44109.2020.9175671に記載されているようなデータセットからの1000個の重複しないサンプルを、テストデータセットとして使用し得る。その結果、分類しきい値を0.5として、精度が以下のとおりであることが明らかになった。
- 教師あり深層学習アーキテクチャ134(図3Bに例示的に示されるように1つの損失関数を最適化):92.5%
- 教師あり深層学習アーキテクチャ134(図3Cに例示的に示されるように、2つの損失関数を1という同じ損失関数の重みで最適化):91.6%
- 教師あり深層学習アーキテクチャ134(図3Cに例示的に示されるように、2つの損失関数を最適な損失関数の重みで最適化):92.5%
【0132】
最適な分類しきい値の場合、精度が以下のとおりであることが明らかになった。
- 教師あり深層学習アーキテクチャ134(図3Bに例示的に示されるように1つの損失関数を最適化):91.8%
- 教師あり深層学習アーキテクチャ134(図3Cに例示的に示されるように、2つの損失関数を1という同じ損失関数の重みで最適化):90.6%
- 教師あり深層学習アーキテクチャ134(図3Cに例示的に示されるように、2つの損失関数を最適な損失関数の重みで最適化):92.0%
【0133】
図4Aおよび図4Bにおいては、“A quality metric for heart rate variability from photoplethysmogram sensor data”,of M.Zanon et al.,PMID:33018085,DOI:10.1109/EMBC44109.2020.9175671に記載のデータセットを使用した。図4Aおよび図4Bには、教師あり深層学習アーキテクチャ134の例示的な再構成信号184が示されている。教師あり深層学習アーキテクチャ134は、具体的には、図3A図3Cに示した実施形態のいずれかに従って具現化されてよい。しかしながら、他の実施形態も実現可能である。図4Aおよび図4Bには、再構成信号184が、元の信号186と共に示されている。図4Aおよび図4Bに示される2つの例示的な信号116は、それらのHRV品質メトリック値に基づき、それらのHRV多変量品質メトリックが20未満であるため、図4Bに示される信号116が明らかにノイズの多い信号であるにもかかわらず、クリーンな信号として識別された。HRV多変量品質メトリックとも呼ばれるHRV品質メトリック値は、“A quality metric for heart rate variability from photoplethysmogram sensor data”,of M.Zanon et al.,PMID:33018085,DOI:10.1109/EMBC44109.2020.9175671で提案されているような多変量品質メトリックであってよい。図4Aおよび図4Bに見られるように、教師あり深層学習アーキテクチャ134は、クリーンな信号(図4A)およびノイズの多い信号(図4B)のピークを正確に再現することが可能であり得る。教師あり深層学習アーキテクチャ134は、両方の信号116をクリーンであると誤ってラベリングしたHRV品質メトリック値を使用した分類とは対照的に、図4Aの信号116をクリーン(分類=1)として、図4Bの信号116をノイズが多い(分類=0)として、正しく分類し得る。
【0134】
図4Aおよび図4Bの例示的な再構成信号184は、例えば1という同じ重みで等しく重み付けされた分類出力およびMSE出力を使用して示されている。分類しきい値は0.5であってよい。図4Aおよび図4Bでは、300のエポックおよび0.002という正則化強度を使用した。図4Aには、手動でクリーン(0がノイズの多い信号を意味し、1がクリーンな信号を意味する)とラベリングされた信号が示されており、教師あり深層学習アーキテクチャの予測は1(アルゴリズムの正確な予想は0.989)を与える。これに対して、HRV品質メトリックは7.5を与え、HRV品質メトリックの場合、HRV品質メトリック値が20未満であれば、PPG信号はクリーンであると見なされる。図4Bには、手動でノイズが多いとラベリングされた信号が示されており、教師あり深層学習アーキテクチャの予測は0(アルゴリズムの正確な予想は0.002)を与える。これに対して、HRV品質メトリックは9.61を与える。図4Aに示される信号116は、両方のモデル、すなわち教師あり深層学習アーキテクチャ134およびHRV多変量品質メトリックにおいて、クリーンであると正確に予測されることが明らかになった。再構成された信号184は、元の信号186にきわめて良好に一致し得、元の信号186のピークを正しく識別し得る。図4Bに見られるように、教師あり深層学習アーキテクチャ134は、信号116をノイズが多いと正しく予測する。しかしながら、9.61というHRV多変量品質メトリックは、信号116をクリーンと示唆していると考えられる(9.61<20)。さらに、信号再構成は、1より小さい重み(例えば、0.1という重み)など、MSE出力の寄与の重みが小さくなると、再構成信号194の振幅が減少するという点で変化するが、元の信号186および再構成信号184のピークは、等しい重みの場合と同様に依然として一致することが明らかになった。
【0135】
図5Aおよび図5Bが、半教師あり深層学習アーキテクチャ188の例示的な実施形態を概略図にて示している。半教師あり深層学習アーキテクチャ188は、図3A図3Cに示されるとおりの教師あり深層学習アーキテクチャ134におおむね相当し得る。したがって、半教師あり深層学習アーキテクチャ188の説明について、図3A図3Cの説明が参照される。
【0136】
図5Aおよび図5Bの例において、半教師あり深層学習アーキテクチャは、5つの畳み込み層144、146、148、150、152を含み得る。第1の層144は、膨張を有しなくてもよく、第2の層146は、2という膨張を有してよく、そこから、膨張は、次の各層ごとに2倍になってよい。各層において、16個のフィルタを使用し得る。サイズ3、5、7、またはさらに他のサイズのカーネルを、使用し得る。正則化強度は、0.0005~0.002の範囲、例えば0.0005、0.001、0.0015、または0.002であってよい。しかしながら、他の範囲も可能である。半教師あり深層学習アーキテクチャ188は、畳み込み層144、146、148、150、152の後かつ出力の前に、平坦化層164を含み得る。半教師あり深層学習アーキテクチャ188は、例えば0.00001の学習率を有し、10または100またはさらに多くのエポックごとに学習率が半減する減衰を有するAdamオプティマイザを含み得る。しかしながら、他の学習率も可能である。例えば、訓練のために、128というバッチサイズ、および300までのエポックを使用し得る。例えば、訓練のために、128というバッチサイズ、および50から最大500またはさらに多くのエポックを使用し得る。しかしながら、他のバッチサイズおよびエポックも可能である。各々のエポックについて、モデル119を、ラベリング済みのデータで一度、ならびにラベリング済みおよびラベリングなしの複合データからランダムに選択されたN個のサンプルで一度、訓練してよく、ここでNは、ラベリング済みのセットのサイズの2倍である。
【0137】
半教師あり深層学習アーキテクチャ188の例において、本方法は、ラベリングなしのデータセットに基づく訓練のための追加の入力パラメータZinput(参照番号190によって示される)を導入することを含み得る。これにより、「欠けている」ラベルの処理を可能にできる。追加の入力パラメータ190は、特定のデータがラベリングされているか否かを示すバイナリ値であってよい。例えば、追加の入力パラメータ190は、ラベリングされていないデータについて「0」であってよく、ラベリング済みのデータについて「1」であってよい。追加の入力パラメータ190は、分類の学習がラベリングされていないデータの影響を受けないように、学習プロセスの際に分類出力と乗算されてよい。
【0138】
したがって、図5Aおよび図5Bに見られるように、半教師あり深層学習アーキテクチャ188は、追加の入力層192を含み得る。追加の入力層192は、追加の入力パラメータZinput 190に、ラベリングされていないデータについては「0」という値を割り当て、ラベリング済みのデータについては「1」という値を割り当てるように構成し得る。追加の入力層192の出力(参照番号194によって示される)は、追加の出力層196の入力を形成し得る。追加の出力層196において、第1の出力174、具体的には分類出力と、出力194に含まれる追加の入力パラメータ190とを乗算して、結果としての出力198を得てもよい。図5Aの例示的な実施形態において、分類出力は、平坦化層の出力172を入力とし得る。あるいは、図5Bに例示的に示されるように、分類出力は、とくには平坦化層の出力172の代わりに、全結合層の出力182を入力として使用し得る。
【0139】
手動でラベリングされた履歴生物学的センサデータおよびラベリングされていない履歴生物学的センサデータを、半教師あり深層学習アーキテクチャ188に基づく訓練可能モデル119の訓練に使用し得る。ラベリングされていない生物学的センサデータについて、訓練可能モデル119を、信号再構成に関する損失関数を最適化することによって、および分類に関する損失関数を無視することによって訓練し得る。訓練のために、教師ありモデル134と同じバランスしたラベリング済みデータセットを使用してよく、さらに、以下で説明されるラベリングなしのデータを使用してよい。
【0140】
例えば、とくには上記のラベリング済みのPPGデータセットに加えて、訓練用の履歴生物学的センサデータとして、ラベリングされていないPPGデータセットを使用し得る。例えば、ラベリングされていないPPGデータセットを、以下のように設定し得る。20人の健康なボランティア(女性4名および男性16名、平均年齢32歳)から、参加者が5分ごとに活動を切り替える管理された様相で一連の活動を実行しつつ、データを収集した。例えば、スクリーニングおよびインフォームドコンセントのプロセス(安静に着席して)、ECGおよびPPGセンサの配置(安静に着席して)、ベースライン(安静に着席)、ペース呼吸(呼吸数を毎分5回から毎分20回まで5刻みで段階的に増加させる)、ゲーム機での5分間のゲームプレイ(PS 4 Aaero)、直立(静かに立っている)、精神的ストレス操作(例えば、Ewing et al 1992に記載されているようなSerial 7s[目を閉じた状態で700から7を引き算していき、各々の答えを声に出す])、身体的活動操作(予め設定された円形経路に沿った途切れない屋内歩行;すべての被験者について同じ経路)、ベースライン(安静に着席)、PPG/ECG機器の回収、および感想などの複数の活動を含むプロトコルを使用し得る。
【0141】
活動は、安静姿勢での着席、ペース呼吸、ゲーム機でのゲームプレイ、直立、精神的ストレス操作、身体的活動、および安静姿勢での着席を含んだ。一部の活動(例えば、身体的活動、直立、およびゲーム機でのゲームプレイ)が、さまざまなレベルの運動アーチファクトを持ち込むと疑われる一方で、他の活動(例えば、ペース呼吸)は、心拍数を増加させ、PPG波形を変化させる。例えば、各々が10秒の長さである合計37564個の重複しないPPG信号サンプルを収集した。ラベリングされていないデータセットの収集のさらなる詳細については、“A quality metric for heart rate variability from photoplethysmogram sensor data”,of M.Zanon et al.,PMID:33018085,DOI:10.1109/EMBC44109.2020.9175671が参照される。
【0142】
上述したように、半教師ありモデル188のための訓練データセットは、ラベリング済み履歴生物学的センサデータおよびラベリングされていない履歴生物学的センサデータを含み得る。例えば、ラベリングされた9380個のバランスした信号サンプルを使用してよく、さらに、収集されたラベリングされていないサンプルを使用してよい。
【0143】
上述のように、本方法は、少なくとも1つの検証ステップを含み得る。半教師あり深層学習アーキテクチャ188を使用する訓練可能モデルを検証するための検証データセットは、例えば、上記のように、5人の健康なボランティアから収集された履歴生物学的センサからの1000個の重複しない手動でラベリングされたサンプルを含み得、検証に使用される1000個の重複しない手動でラベリングされたサンプルは、訓練には使用されていない。
【0144】
上述のように、本方法は、少なくとも1つのテストステップを含み得る。例えば、半教師あり深層学習アーキテクチャ188に基づく訓練済み訓練可能モデル119のテストのために、テストデータとして、上述したように、5人の健康なボランティアから収集された履歴生物学的センサからの1000個の重複しない手動でラベリングされたサンプルを使用し得る。テストに使用した1000個の重複しない手動でラベリングされたサンプルは、訓練に使用されたものではない。5名からのテストデータセットからのデータを使用した場合の半教師ありモデルの精度は、以下のとおりである。
- 半教師あり深層学習アーキテクチャ(2つの損失関数を1という同じ損失関数の重みで最適化):97.9%
【0145】
追加的に、または代替的に、テストのために、他のテストデータが使用されてもよい。例えば、上記および“A quality metric for heart rate variability from photoplethysmogram sensor data”,of M.Zanon et al.,PMID:33018085,DOI:10.1109/EMBC44109.2020.9175671に記載のように収集されたラベリングされていないデータセットからの1000個の重複しないサンプルを、テストデータセットとして使用し得る。テストに使用したサンプルには、手動で注釈が付けられている。例えば、テストに使用されるデータセットは、796個のノイズの多いPPG信号および204個のクリーンなPPG信号を含んでよい。その結果、分類しきい値を0.5として、精度が以下のとおりであることが明らかになった。
- 半教師あり深層学習アーキテクチャ188(2つの損失関数を1という同じ損失関数の重みで最適化):87.7%
- 半教師あり深層学習アーキテクチャ188(2つの損失関数を最適な損失関数の重みで最適化):90.6%
【0146】
最適な分類の場合、精度が以下のとおりであることが明らかになった。
- 半教師あり深層学習アーキテクチャ188(2つの損失関数を1という同じ損失関数の重みで最適化):90.8%
- 半教師あり深層学習アーキテクチャ188(2つの損失関数を最適な損失関数の重みで最適化):91.3%
【0147】
モデル119の性能を、例えば“A quality metric for heart rate variability from photoplethysmogram sensor data”,of M.Zanon et al.,PMID:33018085,DOI:10.1109/EMBC44109.2020.9175671に提案されているような他変量品質メトリックを用いた性能と比較し得る。PPG信号をECG信号と同時に収集し、Zanon et al.,2020に記載されているように、導出されたHRV特徴を比較し、最終的に信号ごとのHRV品質メトリックを推定した。HRV品質メトリックを各々のPPGサンプル信号について計算し、HRV品質メトリック値が20未満である場合、PPG信号を信頼できる(すなわち、クリーンである)と見なした。半教師あり学習は、多変量品質メトリックの使用と比べ、性能が良好であることが明らかになった。
【0148】
半教師あり深層学習アーキテクチャ188に基づく訓練は、まず、分類ラベルおよび信号再構成のための関連情報を学習するためのラベリング済みデータのデータセットを用いた訓練を含み得る。訓練は、その後に、信号再構成をより良好に学習するために、ラベリングされていないデータのランダムなサブセットのみを用いた訓練を含み得る。ラベリングされていないデータを用いた訓練は、例えば異なる人々や異なる活動など、ラベリング済み訓練セットに含まれていなかった信号生理学を導入することをさらに含み得る。データに注釈を付けることは高価であり、利用可能な注釈付きデータセットはきわめて少ない。しかしながら、ラベリングされていないデータは多数が利用可能である。半教師あり学習は、ラベリングされていないデータの活用を可能にし、少量のラベリング済みデータの最も効率的な使用を可能にする。
【0149】
教師あり深層学習アーキテクチャ134および半教師あり深層学習アーキテクチャ188の両方について、2つの損失関数の使用は、分類、したがってクリーンな信号をノイズの多い信号から区別するためにラベリングされた信号を使用することを一緒に学習することを可能にし、ネットワークが信号116の生理学についてより多く学習することを助けることを可能にする。
【0150】
さらに、本方法において、訓練済み訓練可能モデル119は、教師あり深層学習アーキテクチャ134および半教師あり深層学習アーキテクチャ188の組み合わせ216(図5には図示せず)に基づいて訓練されてもよい。組み合わせ216は、2つのアーキテクチャによって報告された確率の平均を考慮に入れる2つのアーキテクチャの組み合わせ平均予測を使用し得る。
【0151】
図6Aおよび図6Bにおいては、“A quality metric for heart rate variability from photoplethysmogram sensor data”,of M.Zanon et al.,PMID:33018085,DOI:10.1109/EMBC44109.2020.9175671に記載のデータセットを使用した。図6Aおよび図6Bに、教師あり深層学習アーキテクチャ134(図6A)および半教師あり深層学習アーキテクチャ188(図6B)の例示的な再構成信号184が示されている。具体的には、図6Aおよび図6Bに示される再構成は、同じ元の信号186について、教師あり深層学習アーキテクチャ134および半教師あり深層学習アーキテクチャ188を使用したものである。教師あり深層学習アーキテクチャ134および半教師あり深層学習アーキテクチャ188は、それぞれ図3A図3Cならびに図5Aおよび図5Bに示したいずれかの実施形態に従って具現化されてよい。両方の図に、再構成された信号184が、元の信号186と一緒に示されている。
【0152】
半教師あり深層学習アーキテクチャ188の信号再構成(図6B)を教師あり深層学習アーキテクチャ134(図6A)と比較すると、前者が、図示の信号サンプルなどの特定の信号サンプルの信号再構成を改善でき、予測の精度も改善できることを見て取ることができる。分類しきい値は0.5であってよい。図6Aおよび図6Bには、手動でクリーンであるとラベリングされた信号が示されている(0はノイズの多い信号を意味し、1はクリーンな信号を意味する)。図6Aには、0を与える教師あり深層学習アーキテクチャの予想が示されている(アルゴリズムの正確な予想は0.197)。300のエポックおよび0.002という正則化強度を使用した。図6Bには、1を与える半教師あり深層学習アーキテクチャの予想が示されている(アルゴリズムの正確な予想は0.649)。半教師ありモデルは、訓練の際に使用されたラベリングされていないデータゆえに、信号の生理学をより良好に学習している。したがって、信号のピークがはるかにクリアに推定され、より良い予測がもたらされる。400のエポックおよび0.0005という正則化強度を使用した。これに対して、HRV品質メトリックは14.81を与え、HRV品質メトリックの場合、HRV品質メトリック値が20未満であれば、PPG信号はクリーンであると見なされる。図6Aおよび図6Bに示される例において、教師あり深層学習アーキテクチャ134は、信号116をノイズが多いと誤って分類するが、半教師あり深層学習アーキテクチャ188は、信号116をクリーンであると正しく分類する。これは、一般に、半教師あり深層学習アーキテクチャ188は、教師あり深層学習アーキテクチャ134よりも信号再構成に関してより正確であり得、より高い真陽性率をもたらすことを示している。
【0153】
上述したように、図1に関して説明した方法は、少なくとも1つのテストステップをさらに含み得、訓練済み訓練可能モデル119のテストのために、少なくとも1つのテストデータセットを使用し得る。実験プロトコルの各々の活動に関するテストデータセット内のデータ点の量200が、図7に示されている。ここで、安静での開始202、呼吸204、ゲーム206、直立208、精神的ストレス210、身体的活動212、および安静での終了214に関するデータ点の量が、総数およびサンプルの総量に対する相対にて示されている。
【0154】
図8A図8Cが、第1の数のラベリングされたデータを訓練に使用した場合の種々の深層学習アーキテクチャの性能データを示している。第1の数のラベリングされたデータは、9380個のラベリングされた信号サンプルからなるバランスしたデータセットの100%を含んでよい。加えて、半教師ありモデルについては、“A quality metric for heart rate variability from photoplethysmogram sensor data”,of M.Zanon et al.,PMID:33018085,DOI:10.1109/EMBC44109.2020.9175671に記載のとおりに収集されたラベリングされていないデータを使用した。具体的には、図8A図8Cには、信号再構成のある教師あり深層学習アーキテクチャ134および信号再構成のない教師あり深層学習アーキテクチャ134、半教師あり深層学習アーキテクチャ188、ならびに信号再構成ありの教師あり深層学習アーキテクチャ134と半教師あり深層学習アーキテクチャ188との組み合わせ216の性能データが、スケールを合わせたHRV多変量品質メトリック218の性能と共に示されている。教師あり深層学習アーキテクチャ134の性能データは、図3Bに例示的に示されるように分類に関する1つの損失関数220を最適化することによって訓練された教師あり深層学習アーキテクチャ134について示され、さらに図3Cに例示的に示されるように信号再構成および分類に関する2つの損失関数221を最適化することによって訓練された教師あり深層学習アーキテクチャ134について示されている。半教師あり深層学習アーキテクチャ188の性能データは、図5Bに例示的に示されるように信号再構成および分類に関して2つの損失関数を最適化することによって訓練された半教師あり深層学習アーキテクチャ188について示されている。HRV多変量品質メトリックは、深層学習アーキテクチャの比較にのみ使用してよく、Zanon et al.,2020にさらに詳細に記載されている。さらに、HRV多変量品質メトリックは、0に近い値がクリーンな信号を示し、20よりも大きい値がノイズの多い信号を示す連続変数を指すため、種々の深層学習アーキテクチャの分類出力に適合するように、0~1の範囲にスケールを合わせたHRV多変量品質メトリック218を使用してよく、ここで、0はノイズの多い信号を示し、1は完全にクリーンな信号を示す。図8Aの図には、種々のアーキテクチャの各々の真陽性率222が、偽陽性率223の関数として示されている。図8Bは、種々のアーキテクチャを使用して分類された信号の第1の出力174、この例においては分類された品質をもたらす分類出力を、ラベリングされた信号の対応するラベル224と共に示している。
【0155】
さらに、図8Cは、特定の活動、すなわち安静での開始202、呼吸204、ゲーム206、直立208、精神的ストレス210、身体的活動212、および安静での終了214について、種々のアーキテクチャの精度225を示している。種々のアーキテクチャの性能を評価し、互いに比較するために、混同行列のうちの1つ以上、ならびに/または以下の評価メトリック、すなわち精度225、正確性、リコール、およびF1スコアのうちの1つ以上を使用し得る。精度225を、真の陽性結果と真の陰性結果との和をサンプルの総量で割ったものと定義し得る。正確性は、真の陽性結果の数を、正しく分類されていないものを含むすべての陽性結果の数で割ったものを指し得る。リコールは、「エルス感度」とも呼ばれるが、真の陽性結果の数を、陽性と識別されるべきであったすべてのサンプルの数で割ったものであってよい。F1スコアは、正確性およびリコールの調和平均を指し得る。F1スコアの可能な最大値は、完全な正確性およびリコールを示す1であってよく、可能な最小値は、正確性またはリコールのいずれかが0である場合に、0であってよい。
【0156】
教師あり深層学習アーキテクチャ134および半教師あり深層学習アーキテクチャ188についての評価メトリック一式が、表1に示されている。具体的には、表1は、図3Bに例示的に示されるように分類に関する1つの損失関数220を最適化することによって訓練された教師あり深層学習アーキテクチャ134、図3Cに例示的に示されるように信号再構成および分類に関する2つの損失関数221を最適化することによって訓練された教師あり深層学習アーキテクチャ134(1つは同じ重み付けによる結果であり、1つは0.1という重みを用いた最適な重みづけによる結果である)、ならびに図5Bに例示的に示されるような半教師あり深層学習アーキテクチャ188(同じ重み付け、および具体的には0.05という重みを用いた最適な重み付け)についての結果を示している。
【0157】
上記で概説したように、図3A図3Cを参照すると、分類出力は、1という重みでアルゴリズム学習に寄与し得る。第2の出力176は、少なくとも1つの重みを使用して重み付けされてよい。MSE値の範囲は、(最大の分類出力である)1よりもはるかに大きくなり得る。重み付けされた第2の出力176を使用することにより、信号再構成についての学習および分類出力についての学習の間のアルゴリズムのバランスを可能にし得る。これにより、教師ありアーキテクチャ134および半教師ありアーキテクチャ188の両方に関して、精度の向上を可能にできる。表1に見られるように、教師ありアーキテクチャ134の場合、精度は、等しい重みでは91.6%であり得るのに対し、0.1という重みなどのより低いMSE重みでは、92.5%であり得る。半教師ありアーキテクチャ188の場合、精度は、等しい重みでは87.7%であり得るのに対し、0.05という重みなどのより低いMSE重みでは、90.6%であり得る。
【0158】
【表1】
【0159】
学習率および減衰はさまざまであってよく、これにより、精度をさらに高めることが可能である。例えば、学習率が0.00001であり、学習率が半分になる減衰が10から100に増加した場合、精度の向上につながる可能性がある。例えば、精度は、等しい重みで分類に関する1つの損失関数220を最適化することによって訓練された教師あり深層学習アーキテクチャ134について、4.2%向上し得る。
【0160】
これらのアーキテクチャの混同行列を、表2~表5に示す。混同行列の列は、ラベリングによる分類を示し、混同行列の行は、それぞれのアーキテクチャの訓練済みモデル119を使用することによって得られた分類による品質を示す。
【0161】
【表2】
【0162】
【表3】
【0163】
【表4】
【0164】
【表5】
【0165】
【表6】
【0166】
さらに、図9A図9Cが、第2の数のラベリングされたデータを訓練に使用した場合の種々の深層学習アーキテクチャの性能データを示している。第2の数のラベル付きデータは、9380個のラベリングされた信号サンプルからなるバランスしたデータセットの50%、すなわち図8A図8Cで使用した第1の数のラベリングされたデータの50%を含み得る。先行の図と同様に、図9A図9Cは、教師あり深層学習アーキテクチャ134、半教師あり深層学習アーキテクチャ188、および教師あり深層学習アーキテクチャ134と半教師あり深層学習アーキテクチャ188との組み合わせ216の性能データを、スケールを合わせたHRV多変量品質メトリック218の性能と共に示している。教師あり深層学習アーキテクチャ134の性能データは、図3Bに例示的に示されるように分類に関する1つの損失関数220を最適化することによって訓練された教師あり深層学習アーキテクチャ134について示され、さらに図3Cに例示的に示されるように信号再構成および分類に関する2つの損失関数221を最適化することによって訓練された教師あり深層学習アーキテクチャ134について示されている。半教師あり深層学習アーキテクチャ188の性能データは、図5Bに例示的に示されるように信号再構成および分類に関して2つの損失関数を最適化することによって訓練された半教師あり深層学習アーキテクチャ188について示されている。
【0167】
図9Aは、種々のアーキテクチャの各々の真陽性率222を、偽陽性率223の関数として示している。図9Bは、種々のアーキテクチャを使用して分類された信号の第1の出力174、この例においては分類された品質をもたらす分類出力を、対応するラベル224と共に示している。図9Cには、特定の活動、すなわち安静での開始202、呼吸204、ゲーム206、直立208、精神的ストレス210、身体的活動212、および安静での終了214について、種々のアーキテクチャの精度225が示されている。
【0168】
上記で概説したように訓練データの50%を使用するこの例において、教師あり深層学習アーキテクチャ134および半教師あり深層学習アーキテクチャ188についての評価メトリック一式が、表7に示される。
【0169】
【表7】
【0170】
これらのアーキテクチャの混同行列を、表8~表12に示す。
【0171】
【表8】
【0172】
【表9】
【0173】
【表10】
【0174】
【表11】
【0175】
【表12】
【0176】
半教師ありアーキテクチャ188を使用することにより、提案されたモデルを新たなデータセットへと拡張し、かつ/または移転させることを可能にできる。例えば、充分なラベリング済みの例が存在しないなどの理由で、元々の訓練済みモデルの訓練に使用されるデータの最大50%未満など、データがさらに少ない新たな状況にモデルを適応させる必要がある場合に、半教師ありの手法を使用して信頼できるモデルを訓練することが可能である。再構成損失に最適な重みが適用される場合、すべてのアルゴリズムにおいて精度が90%超を保つことが明らかになった。
【0177】
図10に、ラベリングされた信号の種々の配分における半教師あり深層学習アーキテクチャ188の性能データが示されている。半教師あり深層学習アーキテクチャ188は、図5Aに例示的に示されるように具現化されてよい。半教師あり深層学習アーキテクチャ188の性能が、ラベリング済みデータセットのラベリング済みデータの100%の配分(参照番号226によって示されている)、ラベリング済みデータセットのラベリング済みデータの90%の配分(参照番号228によって示されている)、ラベリング済みデータセットのラベリング済みデータの75%の配分(参照番号230によって示されている)、ラベリング済みデータセットのラベリング済みデータの50%の配分(参照番号232によって示されている)、ラベリング済みデータセットのラベリング済みデータの25%の配分(参照番号234によって示されている)、およびラベリング済みデータセットのラベリング済みデータの10%の配分(参照番号236によって示されている)について示されている。図10に示した性能データは、同じ重み付けの損失関数について得られており、具体的には、第1の損失関数、すなわち分類損失関数、および第2の損失関数、すなわち信号再構成損失関数の両方について1という重みで得られている。
【0178】
図10に見られるように、図5Aの半教師あり深層学習アーキテクチャ188の性能は、ラベリング済みデータの配分が減るにつれてゆっくりと低下し得る。ラベリング済みデータの50%を使用すると、ラベリングされていないデータの寄与の余地をより多く残してよく、したがって、利用可能なラベリング済みデータの100%の配分を使用する場合と比較して、曲線下面積(AUC)の増加が見られる。
【符号の説明】
【0179】
110 生物学的センサデータ
112 生物学的センサ
114 測定ユニット
116 信号
118 処理ユニット
119 訓練可能モデル
120 可搬フォトプレチスモグラム装置
122 照明源
124 フォトディテクタ
126 フォトプレチスモグラム
128 生物学的センサデータを提供する
130 信号の品質を分類する
131 前処理ステップ
132 訓練ステップ
134 教師あり深層学習アーキテクチャ
136 入力層
138 入力層の入力
140 複数の畳み込み層
142 畳み込み層の積層
144 第1の畳み込み層
146 第2の畳み込み層
148 第3の畳み込み層
150 第4の畳み込み層
152 第5の畳み込み層
154 入力層の出力
156 第1の畳み込み層の出力
158 第2の畳み込み層の出力
160 第3の畳み込み層の出力
162 第4の畳み込み層の出力
164 平坦化層
166 第5の畳み込み層の行列出力
168 全結合層
170 出力層
172 平坦化層の出力
174 第1の出力
176 第2の出力
178 第1の追加の全結合層
180 第2の追加の全結合層
182 第1の追加の全結合層の出力
184 再構成された信号
186 元の信号
188 半教師あり深層学習アーキテクチャ
190 追加の入力パラメータZinput
192 追加の入力層
194 追加の入力層の出力
196 追加の出力層
198 結果としての出力
200 データ点の量
202 安静での開始
204 呼吸
206 ゲーム
208 直立
210 精神的ストレス
212 身体的活動
214 安静での終了
216 教師あり深層学習アーキテクチャおよび半教師あり深層学習アーキテクチャの信号再構成との組み合わせ
218 スケールを合わせたHRV多変量品質メトリック
220 分類に関する1つの損失関数を最適化することによって訓練された教師あり深層学習アーキテクチャ
221 信号再構成および分類に関する2つの損失関数を最適化することによって訓練された教師あり深層学習アーキテクチャ
222 真陽性率
223 偽陽性率
224 ラベル
225 精度
226 ラベリング済みデータの100%の配分における半教師あり深層学習アーキテクチャ
228 ラベリング済みデータの90%の配分における半教師あり深層学習アーキテクチャ
230 ラベリング済みデータの75%の配分における半教師あり深層学習アーキテクチャ
232 ラベリング済みデータの50%の配分における半教師あり深層学習アーキテクチャ
234 ラベリング済みデータの25%の配分における半教師あり深層学習アーキテクチャ
236 ラベリング済みデータの10%の配分における半教師あり深層学習アーキテクチャ
図1
図2A
図2B
図2C
図2D
図3A
図3B
図3C
図4A
図4B
図5A
図5B
図6A
図6B
図7
図8A
図8B
図8C
図9A
図9B
図9C
図10
【国際調査報告】