【文献】
Linchao Zhu, Zhongwen Xu, Yi Yang,Bidirectional Multirate Reconstruction for Temporal Modeling in Videos,2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) [online],2017年,[2020年7月6日検索],URL,https://arxiv.org/abs/1611.09053
(58)【調査した分野】(Int.Cl.,DB名)
前記重みは、LASSO(Least Absolute Shrinkage and Selection Operator、最小絶対収縮および選択操作)−正規化損失関数を使用して得られる、請求項1に記載のプロセッサ実装方法。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本開示の実施形態は、従来のシステムで本発明者らが認識した、上述の技術的問題の1つまたは複数に対する解決手段として技術上の本改善を提示する。
【課題を解決するための手段】
【0007】
たとえば、一様態では、パラメータの多次元時系列を分類するためのプロセッサ実装方法が提供される。方法は、1つまたは複数の実体の複数のパラメータに対応する複数の独特の時系列データを得るステップであって、独特の時系列データはそれぞれ、複数のパラメータの各パラメータに対応する1つまたは複数の時系列データを備え、独特の時系列データは、固定長データまたは可変長データであるステップと;深層再帰型ニューラルネットワーク(RNN)の中に一体化された
教師無し符号器を使用して、独特の時系列から1つまたは複数の特徴を自動的に抽出して、複数のパラメータごとに、固定次元特徴ベクトルを備える独特の特徴セットを得るステップと;複数のパラメータの各々に関係する独特の特徴セットからの特徴を連結して、固定次元の、連結された特徴ベクトルを備える、連結された特徴セットを得るステップと;連結された特徴セットに基づき、非一時的線形分類モデルを学習するステップであって、非一時的線形分類モデルの学習中、連結された特徴セットからの各特徴に重みを割り当てて、重みは、LASSO−正規化損失関数(「最小絶対収縮および選択操作(Least Absolute Shrinkage Selection Operator)−正規化損失関数」とも呼ばれる)を使用して得られるステップと;連結された特徴セットからの各特徴の重みに基づき、複数のパラメータごとに妥当性スコアを生成して、学習した非一時的線形分類モデルを検証するステップとを備える。
【0008】
一実施形態では、方法は、実体の複数のパラメータに対応する入力時系列を受信するステップと;入力時系列から1つまたは複数の特徴を自動的に抽出するステップと;抽出した1つまたは複数の特徴に基づき、検証され学習された分類モデルを入力時系列に適用して、実体の複数のパラメータに対応する入力時系列に関するクラスを得るステップとをさらに備えてもよい。
【0009】
一様態では、パラメータの多次元時系列を分類するためのプロセッサ実装システムが提供される。システムは:命令を記憶するためのメモリと;1つまたは複数の通信インタフェースと;1つまたは複数の通信インタフェースを介してメモリに結合された1つまたは複数のハードウェアプロセッサとを備え、1つまたは複数のハードウェアプロセッサは、命令により:実体の複数のパラメータに対応する独特の時系列データを得て;システムにより実装された深層再帰型ニューラルネットワーク(RNN)の中に一体化された
教師無し符号器を使用して、独特の時系列から1つまたは複数の特徴を自動的に抽出して、複数のパラメータごとに、固定次元特徴ベクトルを備える独特の特徴セットを得て;複数のパラメータの各々に関係する独特の特徴セットからの特徴を連結して、固定次元の、連結された特徴ベクトルを備える、連結された特徴セットを得て;連結された特徴セットに基づき、非一時的線形分類モデルを学習し、非一時的線形分類モデルの学習中に、LASSO−正規化損失関数(「最小絶対収縮および選択操作−正規化損失関数」とも呼ばれる)を使用して得られる重みを、連結された特徴セットからの各特徴に割り当てて;連結された特徴セットからの各特徴の重みに基づき、複数のパラメータごとに妥当性スコアを生成して、学習された非一時的線形分類モデルを検証するように構成される。
【0010】
一実施形態では、1つまたは複数のハードウェアプロセッサは、実体の複数のパラメータに対応する入力時系列を受信し;入力時系列から1つまたは複数の特徴を自動的に抽出し;抽出した1つまたは複数の特徴に基づき、検証され学習された分類モデルを入力時系列に適用して、実体の複数のパラメータに対応する入力時系列に関するクラスを得るようにさらに構成される。
【0011】
一実施形態では、入力時系列および独特の時系列データは、固定長データまたは可変長データである。
【0012】
さらに別の様態では、1つまたは複数のハードウェアプロセッサにより実行されたとき、実体の複数のパラメータに対応する、固定長データまたは可変長データである独特の時系列データを得ることにより、パラメータの多次元時系列を分類するステップと;深層再帰型ニューラルネットワーク(RNN)の中に一体化された
教師無し符号器を使用して、独特の時系列から1つまたは複数の特徴を自動的に抽出して、複数のパラメータごとに、固定次元特徴ベクトルを備える独特の特徴セットを得るステップと;複数のパラメータの各々に関係する独特の特徴セットからの特徴を連結して、固定次元の、連結された特徴ベクトルを備える、連結された特徴セットを得るステップと;連結された特徴セットに基づき、非一時的線形分類モデルを学習するステップであって、非一時的線形分類モデルの学習中、連結された特徴セットからの各特徴に重みが割り当てられ、重みは、LASSO−正規化損失関数(「最小絶対収縮および選択操作−正規化損失関数」とも呼ばれる)を使用して得られるステップと;連結された特徴セットからの各特徴の重みに基づき、複数のパラメータごとに妥当性スコアを生成して、学習された非一時的線形分類モデルを検証するステップとを引き起こす1つまたは複数の命令を備える1つまたは複数の非一時的機械可読情報記憶媒体が提供される。
【0013】
一実施形態では、命令は、1つまたは複数のハードウェアプロセッサにより実行されたとき、実体の複数のパラメータに対応する入力時系列を受信するステップと;入力時系列から1つまたは複数の特徴を自動的に抽出するステップと;抽出した1つまたは複数の特徴に基づき、検証され学習された分類モデルを入力時系列に適用して、実体の複数のパラメータに対応する入力時系列に関するクラスを得るステップとをさらに引き起こしてもよい。
【0014】
前述の一般的説明も以下の詳細な説明も、代表的なものであり、説明のためだけのものであり、特許請求される本発明を限定するものではないことを理解されたい。
【0015】
本開示に組み込まれ、本開示の一部を構成する添付図面は、代表的実施形態を示し、本明細書と共に、開示する原理を説明するのに役立つ。
【発明を実施するための形態】
【0017】
添付図面を参照して、代表的実施形態について説明する。図では、参照番号の1つまたは複数の左端の数字は、参照番号が最初に出現する図を識別する。好都合なときはいつでも、同じまたは類似する部分を指すために、図面全体を通して同じ参照番号を使用する。開示する原理の例および特徴について本明細書で説明するが、開示する実施形態の精神および範囲を逸脱することなく、修正形態、適応形態、および他の実装形態が可能である。以下の詳細な説明は、ただ単に代表的であると考えられ、真の範囲および精神は、以下の特許請求の範囲により示されることが意図される。
【0018】
多様な実例に対して深層ネットワークをトレーニングすることにより、今まで見たことがない実例に関する一般的特徴を、たとえば、画像に関するVGGNetを提供することができる。また、転移学習を用いて事前にトレーニングされたネットワークを微調整することは、多くの場合、新しいネットワークを最初から構築し、トレーニングするよりも時間がかからず、容易である。そのような手法で学習する利点は、事前にトレーニングされたネットワークが、広範な他の類似の作業に後で適用することができる、豊富な1組の特徴をすでに学習していることである。
【0019】
本開示では、実施形態およびシステム、ならびにそれらに関連する方法が、TimeNetを介して汎用特徴を活用することにより、臨床上の時系列に関する予測モデルを学習するための効率的方法を提供する。TimeNetは、容易にトレーニングできる非一時的線形分類モデルを介して、分類(たとえば、患者の表現型検査、およびMIMIC−IIIデータベース上での院内死亡率予測作業)のために実質的に使用される固定次元特徴ベクトルに可変長時系列(たとえば、臨床上の時系列)をマッピングする。TimeNetに基づく特徴を使用して、非常にわずかなトレーニング努力でそのような分類モデルを構築することができ、その一方で、手作りの特徴に、または注意深くトレーニングされたドメイン特有RNNを伴うモデルに匹敵する性能を生み出すことが本開示により観察された。本開示は、線形分類モデルの重みを活用して、未加工入力パラメータそれぞれの妥当性への洞察を提供することをさらに提案する。
【0020】
次に、類似する参照文字が一貫して図全体を通して、対応する特徴を示す図面を参照すると、より詳細には
図1〜
図4Bを参照すると、好ましい実施形態が示されており、これらの実施形態について、以下の代表的なシステムおよび/または方法に関連して説明する。
【0021】
図1は、本開示の一実施形態による、実体のパラメータの多次元時系列を分類するためのシステム100の代表的構成図を示す。一実施形態では、システム100はまた、「分類システム」とも呼ばれる場合があり、本明細書で以後、交換可能に使用される場合がある。一実施形態では、システム100は、1つまたは複数のプロセッサ104と、1つもしくは複数の通信インタフェース機器または1つもしくは複数の入出力(I/O)インタフェース106と、1つまたは複数のプロセッサ104に動作可能に結合された1つもしくは複数のデータ記憶装置またはメモリ102とを備える。メモリ102は、データベース108を備える。ハードウェアプロセッサである1つまたは複数のプロセッサ104を、1つまたは複数のマイクロプロセッサ、マイクロコンピュータ、マイクロコントローラ、デジタル・シグナル・プロセッサ、中央処理装置、状態機械、論理回路、および/または動作命令に基づき信号を操作する任意の機器として実装することができる。他の機能の中でも、1つまたは複数のプロセッサは、メモリに記憶されたコンピュータ可読命令を取り出して、実行するように構成される。一実施形態では、システム100を、ラップトップコンピュータ、ノートブック、ハンドヘルド機器、ワークステーション、メインフレームコンピュータ、サーバ、ネットワーククラウドなどのような、さまざまなコンピューティングシステムの形で実装することができる。
【0022】
1つまたは複数のI/Oインタフェース106は、さまざまなソフトウェアインタフェースおよびハードウェアインタフェースを、たとえば、ウェブインタフェース、グラフィカル・ユーザ・インタフェースなどを含むことができ、有線ネットワーク、たとえばLAN、ケーブルなど、およびWLAN、携帯電話、または衛星などの無線ネットワークを含む、多種多様のネットワークN/Wおよびプロトコルのタイプの範囲で多重通信を容易にすることができる。一実施形態では、1つまたは複数のI/Oインタフェース機器は、いくつかの機器を互いに、または別のサーバに接続するための、1つまたは複数のポートを含むことができる。
【0023】
メモリ102は、たとえば、スタティック・ランダム・アクセス・メモリ(static random access memory、SRAM)およびダイナミック・ランダム・アクセス・メモリ(dynamic random access memory、DRAM)などの揮発性メモリ、ならびに/または読出し専用メモリ(read only memory、ROM)、消去可能プログラム可能ROM、フラッシュメモリ、ハードディスク、光ディスク、および磁気テープなどの不揮発性メモリを含む、当技術分野で公知の任意のコンピュータ可読媒体を含んでもよい。
【0024】
データベース108は、1つまたは複数のセンサから得た、実体(たとえば、ユーザ、機械など)に特有の複数のパラメータに限定されることなく、情報を記憶してもよい。パラメータは、1人もしくは複数のユーザ、および/または1つもしくは複数の機械に接続されたセンサを通して取り込んだセンサデータを備えてもよい。さらにデータベース108は、本明細書で説明する方法論に特有の、システム100に供給される入力、および/または(たとえば、各ステージで)システムにより生成される出力に関係する情報を記憶する。より詳細には、データベース108は、提案する方法論の各ステップで処理されている情報を記憶する。
【0025】
図1を参照すると、
図2は、本開示の一実施形態による
図1のシステム100を使用して、パラメータの多次元時系列を分類するための方法を示す代表的流れ図を示す。一実施形態では、システム100は、1つまたは複数のハードウェアプロセッサ104に動作可能に結合され、かつ1つまたは複数のプロセッサ104により方法のステップを実行するための命令を記憶するように構成された1つまたは複数のデータ記憶装置またはメモリ102を備える。TimeNetは、たとえば、60のゲート付き再帰型ユニット(GRU)をそれぞれ有する3つの再帰層を伴う単変量時系列のための、事前にトレーニングされた既製の特徴抽出器である。TimeNetは、
図3Aに示すように、シーケンスごとの学習フレームワークを使用して同時にトレーニングされた、符号器RNNおよび復号器RNNから構成される自動符号器を介してトレーニングされたRNNである。より詳細には、
図1および
図2を参照すると、
図3Aには、本開示の例示的一実施形態による
図1のシステム100により実装された、3つの隠れGRU層を伴うRNN符号器−復号器を介してトレーニングされたTimeNetを示す。RNN自動符号器は、入力
【0027】
に関して、目標の出力時系列x
T…1=x
T,x
T-1,…,x
1が入力の逆になるように、再構築作業を介して符号器RNNf
EのパラメータW
Eを得るようにトレーニングされる。RNN符号器f
Eは、多変量入力時系列から固定次元ベクトル表現
【0029】
への非線形マッピングを提供し、次に、z
Tから多変量時系列
【0031】
への、RNN復号器f
Dに基づく非線形マッピングが続き、式中、W
EおよびW
Dは、それぞれ符号器および復号器のパラメータである。平均2乗再構築誤差を最小にするように、モデルをトレーニングする。いくつかの多様なデータセットで同時にトレーニングすることにより、ロバストな時系列特徴がz
Tに取り込まれることとなり、復号器は、時系列を再構築するための唯一の入力としてz
Tに依存し、符号器に、時系列内のすべての妥当な情報を固定次元ベクトルz
Tの中に取り込ませる。このベクトルz
Tは、入力x
1…Tに関する特徴ベクトルとして使用される。次いで、この特徴ベクトルを使用して、最後の作業のために、より簡単な分類器(たとえば、サポート・ベクター・マシン(Support Vector Machine、SVM))をトレーニングする。TimeNetは、多変量入力時系列を180次元特徴ベクトルにマッピングし、各次元は、3つの再帰層内にある60のGRUの1つの最終出力に対応する。
【0032】
次に、
図1に示すようなシステム100の構成要素および
図2の流れ図を参照して、本開示の方法のステップについて説明する。本開示の一実施形態では、ステップ202で、1つまたは複数のハードウェアプロセッサ104は、1つまたは複数の実体(たとえばこの場合、実体はユーザ、機械などとすることができる)の複数のパラメータに対応する独特の時系列データを得る。一実施形態では、1つまたは複数のセンサから、たとえば、温度センサ、動きセンサ、1つまたは複数の健康モニタセンサなどから、複数のパラメータを得る。一実施形態では、1つまたは複数の実体はまた、「複数の実体」と呼ぶことができ、本明細書では以後、交換可能に使用される。独特の時系列データはそれぞれ、複数のパラメータの各パラメータに対応する1つまたは複数の時系列データを備える。1つまたは複数の時系列データは、特徴抽出を遂行する前にシステムへの入力として得られる独特の時系列データを累積的に構成する。したがって、システム100への入力として供給される、複数の独特の時系列データ(UTSD1、UTSD2、UTSD3など)が存在する可能性があり、複数の独特の時系列データの各々はそれぞれ、対応するパラメータおよび実体に特有なものである。たとえば、UTSD1は、たとえば実体E1のパラメータ(たとえば、P1、P2、P3など)に対応する1つまたは複数の時系列データ(たとえば、TSD1、TSD2、TSD3など)を備える。同様に、別の独特の時系列データ(たとえば、UTSD2)は、たとえば別の実体E2のパラメータ(たとえばP1、P2、P3など)に対応する1つまたは複数の時系列データ(たとえば、TSD11、TSD12、TSD13など)を備える。本開示の一実施形態では、ステップ204で、1つまたは複数のハードウェアプロセッサ104は、深層再帰型ニューラルネットワーク(RNN)の中に一体化された
教師無し符号器を使用して、独特の時系列から1つまたは複数の特徴を自動的に抽出して、複数のパラメータごとに、固定次元特徴ベクトルを備える独特の特徴セットを得る。
【0034】
である多変量時系列x=x
1x
2…x
Tについては、システム100は、nの未加工入力パラメータ(たとえば、グルコース濃度、心拍数などの生理学的パラメータ)ごとに時系列を独立に考慮して、単変量時系列x
j=x
j1x
j2…x
jT、j=1,…,nを得る。システムは、x
jに関するベクトル表現
【0038】
であり、(後の節で説明するように)c=180を用いてf
EとしてTimeNetを使用する。一般に、時系列長Tもまた、たとえば、入院の長さに基づきiに依存する。システム100は、事前/事後に0を適切に埋め込むことにより、等しい長さTを有するように各時系列をさらに変換する。換言すれば、独特の特徴セットは、固定次元特徴ベクトルを備える。
【0039】
本開示の一実施形態では、ステップ206で、1つまたは複数のハードウェアプロセッサ104は、複数のパラメータの各々に関係する独特の特徴セットからの特徴を連結して、固定次元の、連結された特徴ベクトルを備える、連結された特徴セットを得る。換言すれば、システム100は、各未加工入力パラメータjに関するTimeNet−特徴z
jTを連結して、固定次元の、連結された特徴ベクトルでもある時系列xに関する最終特徴ベクトル
【0043】
、m=n×cである。より詳細には、
図1〜
図3Aを参照すると、
図3Bは、本開示の例示的一実施形態による
図1のシステム100により実装されるような、TimeNetに基づく特徴抽出を示す。
【0044】
本開示の一実施形態では、ステップ208で、1つまたは複数のハードウェアプロセッサ104は、連結された特徴セットに基づき、非一時的線形分類モデルを学習し、非一時的線形分類モデルの学習中、連結された特徴セットからの各特徴に重みを割り当てる。換言すれば、最終的な連結された特徴ベクトルz
Tは、分類作業(たとえば、生理学的パラメータの場合、表現型検査および死亡率予測など)に関する入力として使用される。上記で論じたように、c=180は大きいので、z
Tは、多数の特徴m≧180を有する。入力TimeNet特徴z
Tから目標ラベルyへのマッピングは、推定値が
【0048】
である。システム100は、重みwを用いて非一時的線形分類モデルを制約して、これらの多数の特徴のうち少しだけを使用する。一実施形態では、重みは、以下の例によって表現されるLASSO−正規化損失関数(「最小絶対収縮および選択操作−正規化損失関数」とも呼ばれる)を使用して得られる。
【0052】
は、L
1−ノルムであり、w
jkは、j番目の未加工入力パラメータに関するk番目のTimeNet特徴に割り当てられた重みを表し、αは、疎の程度を制御し、より高いαは、より疎であることを意味し、すなわち、最終分類器のために、より少ないTimeNet特徴が選択される。
【0053】
本開示の一実施形態では、ステップ210で、1つまたは複数のハードウェアプロセッサ104は、連結された特徴セットからの各特徴の重みに基づき、複数のパラメータごとに妥当性スコアを生成して、学習した非一時的線形分類モデルを検証する。本開示の一実施形態では、学習した非一時的線形分類モデルの検証は、(i)入力された時系列を検証するステップ、(ii)特徴抽出、およびその関連出力を検証するステップ、(iii)連結する処理、およびその生成された出力を検証し、それにより、学習した非一時的線形分類モデル自体を検証するステップを含む。
【0054】
上記の妥当性スコア生成について、以下で例によって記述する。
【0055】
所与の表現型に関するnの未加工入力パラメータの妥当性を決定することは、得られる分類モデルへの洞察を得るのに、場合によっては有用である。疎重みwは、解釈が容易であり、分類作業のための妥当なパラメータへの興味深い洞察をもたらす。本開示では、システム100は、
図3Cに示すように、対応するTimeNet特徴z
jTに割り当てられた重みw
jkの絶対値の合計として、j番目の未加工入力パラメータに関する妥当性スコア、たとえばr
jを生成する。より詳細には、
図1〜
図3Bを参照すると、
図3Cは、本開示の例示的実施形態による
図1のシステム100を使用して未加工入力パラメータに関する妥当性スコアを生成することを示す。ここで、Tは、時系列長であり、nは、未加工入力パラメータの数である。妥当性スコアは、以下の例示的表現によって生成される。
【0059】
となるように、min−max正規化を使用して正規化され、r
minは、{r
1、…,r
n}の最小値であり、かつr
maxは、{r
1、…,r
n}の最大値である。実際には、未加工入力パラメータに関してこの種の妥当性スコアを生成することは、上述のように、学習した非一時的線形分類モデルを解釈し、検証するのに役立つ。たとえば、糖尿病表現型を検出するためのモデルを学習するとき、高い妥当性スコアを有するグルコース濃度特徴が期待される。
【0060】
(検証後に)総合的に解釈可能な、学習された分類モデルを得ると、システム100は、試験入力データに対してこの解釈可能な分類モデルをさらに実装し、実体の複数のパラメータに対応する入力時系列を受信し、入力時系列から1つまたは複数の特徴を自動的に抽出する。次いで、システム100は、抽出した1つまたは複数の特徴に基づき、検証され学習された分類モデルを入力時系列に適用して、実体の複数のパラメータに対応する入力時系列に関するクラスを得る。本開示の一実施形態では、トレーニング段階中(または分類モデルの学習中)も試験段階中も、システム100が受信する入力時系列は、固定長データであっても、可変長データであってもよい。
実験的評価:
【0061】
本開示では、40,000人の救命治療患者にわたり60,000を超えるICU滞在から構成されるMIMIC−III(v1.4)臨床データベースを使用した(たとえば、「Alistair EW Johnson,Tom J Pollard、Lu Shen、H Lehman Li−wei、Mengling Feng,Mohammad Ghassemi、Benjamin Moody、Peter Szolovits、Leo Anthony Celi、およびRoger G Mark、Mimic−iii、a freely accessible critical care database(Mimic−iii、自由にアクセス可能な救命治療データベース)、Scientific data、3:160035、2016年」を参照のこと)。1時間間隔でサンプリングされた、12の実数値および5つのカテゴリ時系列を伴う17の生理学的時系列に基づき、一定数の分割、列、検証、および試験データセット(たとえば、「https://github.com/yerevann/mimiC3−benchmarks」を参照のこと)を用いて実験的セットアップを実装した。最終多変量時系列が、n=76の未加工入力パラメータ(59の実パラメータ、および欠測値を示す17のマスキングパラメータ)を有するように、カテゴリ変数を(one−hot)ベクトルに変換した。
【0062】
表現型検査作業については、成人のICUで一般的な25の表現型を分類することが目的であった。院内死亡率の作業については、患者が生き残るか、最大48時間まで時系列観察をもたらさないかどうかを予測することが目的であった。本開示のシステムおよび方法により遂行したすべての実験では、時系列データのトレーニングは、ICU滞在の最大で最初の48時間までに制限され、その結果、表現型検査作業用分類器をトレーニングするために時系列全体を使用する従来の研究(または技法)(たとえば、従来の方法1−「Harutyunyan et al.、2017年−Hrayr Harutyunyan、Hrant Khachatrian、David C Kale、およびAram Galstyan、Multitask learning and benchmarking with clinical time series data(時系列データを用いたマルチタスク学習およびベンチマーキング).arXiv preprint arXiv:1703.07771、2017年」、および従来の方法2−「Song et al.、2017年−Huan Song Deepta Rajan、Jayaraman J Thiagarajan、およびAndresa Spanias、Attend and diagnose:Clinical time series analysis using attention models(注意および診断:注意モデルを使用する臨床時系列分析). arXiv preprint arXiv:1711.03905、2017年」を参照のこと)と異なり、T=48時間であるが、すべてのモデルをトレーニングして、早期予測が重要な実際の発症を模倣する。
評価:
【0063】
本開示は、n=76の未加工入力パラメータを有し、その結果、入院ごとに、m=13,680次元(m=76×180)のTimeNet特徴ベクトルがもたらされた。本開示のシステムおよび方法は、表現型分類に関してはα=0.0001、院内死亡率に関してはα=0.0003を使用した(ホールドアウト検証セットに基づきαを選んだ)。以下の表1は、結果を要約し、既存の/伝統的なベンチマークとの比較を提供する。表2は、表現型に関する結果を詳細に記述している。
【0065】
上記の表1では、LRは、ロジスティック回帰(Logistic regression)を指し、LSTM−マルチは、LSTMに基づくマルチタスクモデルを指し、SAnD(Simply Attend and Diagnose)は、完全に注意に基づくモデルを指し、SAnD−マルチは、SAnDに基づくマルチタスクモデルを指す(注:
*表現型検査については、本開示、ならびにそれに関連するシステムおよび方法は、実際の発症に、より適用可能であるので、TimeNet−全−Epsについて既存の/従来の、または伝統的なベンチマークとTimeNet−48−Epsを比較する。
**TimeNet−48の変形形態だけが、院内死亡率の作業のために適用可能である)。
【0067】
上記の表(表1および表2)で理解することができるように、本開示では、表現型検査の作業のために、分類モデルの2つの変形形態について、すなわち、i)現在の発症からのデータを使用するTimeNet−x、ii)これまでの発症で表現型の存在または欠如に関係がある追加の入力特徴を介して、(利用できるときはいつでも)患者のこれまでの発症からのデータを同様に使用するTimeNet−x−Epsについて考慮した。ICU入院後の、最大で最初の48時間までのデータを使用して、各分類器をトレーニングした。しかしながら、試験時に目標のクラスを推定するために使用した何時間ものデータxに応じて、2つの分類器変形形態について考慮した。x=48については、表現型を決定するために、入院後、最大で最初の48時間までのデータを使用した。x=全については、患者のICU滞在期間全体にわたり(24時間の移動で重なる)すべての48時間窓に、学習した分類器を適用し、窓全体にわたる平均表現型確率を目標クラスの最終推定値として使用した。TimeNet−x−Epsでは、追加の特徴は、これまでの発症中に表現型が存在する(1)、または欠如する(0)に関係づけられる。この特徴に関するグランドトルース(ground−truth)値を、トレーニング時間中に使用し、(LASSOに基づく分類器(「最小絶対収縮および選択操作−正規化損失関数」とも呼ばれる)を介して与えられるような)これまでの発症中の表現型の存在確率を、試験時に使用した。
【0068】
表3は、以下のように、ユーザに関係する入力パラメータ(この場合、生理学的パラメータ)のリストを示す。
【0069】
【表3-1】
【表3-2】
【表3-3】
1つまたは複数の所見:
1つまたは複数の分類作業:
【0070】
表現型検査作業について、表1から以下の所見が得られた。
【0071】
TimeNet−48対LR:TimeNetに基づく特徴は、発症データ全体を使用するLR(ロジスティック回帰)の取り組み方法と異なり、最初の48時間のデータだけを使用しているが、LRで使用するような手作りの特徴よりも著しく良好に作動する。これは、MIMIC−IIIデータに関するTimeNet特徴の有効性を証明している。さらに、TimeNet特徴は、いくつかの隠れユニット、層、学習速度などを調整するステップを伴う、LSTMのような他の取り組み手法(たとえば、従来の方法1を参照のこと)と異なり、LASSOに関する単一のハイパーパラメータを調節するステップを必要とするだけである。
【0072】
TimeNet−x対TimeNet−x−Eps:患者に関するこれまでの発症の時系列データを活用することにより、分類性能が著しく改善される。
【0073】
TimeNet−48−Epsは、既存の/従来の(または伝統的な)ベンチマークよりも良好に作動し、その一方で、現在の発症全体ではなくむしろ患者の現在の発症の最大48時間までだけに目を向けるので、依然として事実上、より実現可能である。院内死亡率の作業については、上記の表2に示すように、既存のベンチマークと比較したとき、同等の性能が観察された。
【0074】
線形モデルのトレーニングは、著しく高速であり、2.7GHzのクアッドCore i7プロセッサを伴う32GB RAMの機械で、α∈[10
-5〜10
-3]の間で調整しながら、2値分類器のいずれかを得るためにほぼ30分かかった。LASSOは、表現型分類ごとに(13,680の特徴の中から)ほぼ550の有用な特徴につながる分類器すべてに関して、91.2±0.8%の疎(すなわち、重みのパーセンテージw
jk≒0)につながることが観察された。
未加工入力パラメータに関する妥当性スコア:
【0075】
さまざまなTimeNet特徴に割り当てられた重みを使用して、未加工入力パラメータの妥当性に関する直感的解釈が観察された(式(2)を参照のこと)。たとえば、
図4Aおよび
図4Bに示すように、合併症を伴う糖尿病(
図4A)および本態性高血圧症(
図4B)それぞれに関するグルコース濃度(パラメータ1)および収縮期血圧(パラメータ20)に関して、最高の妥当性スコアが得られた。より具体的には、
図1〜
図3Cを参照すると、
図4Aは、本開示の一実施形態による、合併症を伴う表現型糖尿病に関してグルコース濃度(パラメータ1)で得られた最高の妥当性スコアを示すグラフ表示である。
図1〜
図4Aを参照すると、
図4Bは、本開示の一実施形態による、表現型本態性高血圧症に関して収縮期血圧(パラメータ20)で得られた最高の妥当性スコアを示すグラフ表示である。上記の実験結果から理解することができるように、TimeNet符号器は、UCR時系列アーカイブから取得したさまざまなドメインからの時系列に対して事前にトレーニングされていたので、未加工入力パラメータの時系列から意味のある汎用特徴を提供し、LASSOは、ラベル付きデータを使用することにより、最後の作業のために最も妥当なスコアを選択するのに役立つ。さらに、多変量時系列を考慮するのではなくむしろ、未加工入力パラメータそれぞれの時系列に関する深層再帰型ニューラル・ネットワーク・モデルを使用して特徴を抽出することにより、最終的に入力ドメイン内の未加工入力パラメータに妥当性スコアを容易に割り当てることができるようになり、ドメインエキスパートによる高水準の基本モデル検証が可能になる。伝統的なシステムの従来技術では、分類判断および分類モデルが、本開示の実施形態および提案するシステムおよび方法によりどれが克服されるかを解釈できず、検証することが困難であることを、再帰型ニューラルネットワークでの非線形変換が意味することに留意されたい。本開示は、1人または複数のユーザの電子健康記録に関係する例示的発症について記述しているが、そのような例が、本開示の範囲を分類作業に限定していると解釈してはならないことを当業者は理解されたい。
【0076】
記載した説明は、任意の当業者が実施形態を作成し、使用することができるようにする、本明細書の主題について説明している。主題の実施形態の範囲は、特許請求の範囲により規定され、当業者が思いつく他の修正形態を含んでもよい。そのような他の修正形態は、特許請求の範囲の文言と異ならない類似の要素を有する場合、または特許請求の範囲の文言とわずかな差を有する均等の要素を含む場合、特許請求の範囲に入ることが意図される。
【0077】
保護の範囲は、そのようなプログラムに、さらには中にメッセージを有するコンピュータ可読手段に拡張され、そのようなコンピュータ可読記憶手段は、プログラムがサーバもしくは移動体機器、または任意の適切なプログラム可能機器上で走るとき、方法の1つまたは複数のステップを実装するためのプログラムコード手段を含有することを理解されたい。ハードウェア機器は、たとえば、サーバもしくはパーソナルコンピュータなど、またはそれらの任意の組合せのような任意の種類のコンピュータを含む、プログラムすることができる任意の種類の機器とすることができる。機器はまた、たとえば、特定用途向け集積回路(application−specific integrated circuit、ASIC)、フィールド・プログラマブル・ゲート・アレイ(field−programmable gate array、FPGA)などのようなハードウェア手段、またはたとえば、ASICおよびFPGA、もしくは少なくとも1つのマイクロプロセッサおよび中にソフトウェアモジュールが配置された少なくとも1つのメモリなどのハードウェアとソフトウェアの組合せとすることができる手段を含んでもよい。したがって、手段は、ハードウェア手段とソフトウェア手段の両方を含むことができる。本明細書で説明する方法の実施形態を、ハードウェアおよびソフトウェアの形で実装することができる。機器はまた、ソフトウェア手段を含んでもよい。あるいは、たとえば複数のCPUを使用して、異なるハードウェア機器上に実施形態を実装してもよい。
【0078】
本明細書の実施形態は、ハードウェア要素およびソフトウェア要素を備えることができる。ソフトウェアの形で実装された実施形態は、ファームウェア、常駐ソフトウェア、マイクロコードなどを含むが、それらに限定されない。本明細書で説明するさまざまなモジュールが遂行する機能を、他のモジュールで、または他のモジュールを組み合わせて実装してもよい。本明細書が意図するところでは、コンピュータ使用可能媒体またはコンピュータ可読媒体は、命令実行システム、装置、もしくは機器により、またはそれらと共に使用するためのプログラムを備える、記憶する、伝達する、伝播する、または移送することができる任意の装置とすることができる。
【0079】
例示するステップは、示されている代表的実施形態を説明するために提示され、進展している技術開発により、特定の機能を遂行する手法が変わることを認識されたい。これらの例は、例示のために本明細書に提示され、限定するために提示されているわけではない。さらに、説明の便宜上、機能構成要素の境界について、本明細書で任意に規定してきた。指定された機能およびそれらの関係が適切に遂行される限り、代わりの境界を規定することができる。代替形態(本明細書で説明する実施形態の均等形態、拡張形態、変形形態、偏向形態などを含む)は、本明細書に包含される教示に基づき、1つまたは複数の関連技術分野の当業者に明らかであろう。そのような代替形態は、開示する実施形態の範囲および精神に入る。また、用語「comprising(備える)」、「having(有する)」、「containing(含有する)」、および「including(含む)」、ならびに他の類似の形態は、意味が同等であることが意図され、これらの用語の任意の1つに続く1つまたは複数の項目が、そのような1つまたは複数の項目の網羅的な列挙であることを意味することも、列挙した1つまたは複数の項目だけに限定されることを意味することもないという点で、オープンエンド形式であることが意図される。また、本明細書および添付の特許請求の範囲で使用するとき、単数形「a」、「an」、および「the」は、前後関係が他の方法で明確に規定しない限り、複数の参照を含むことを留意しなければならない。
【0080】
さらに、本開示と矛盾しない実施形態を実装する際、1つまたは複数のコンピュータ可読記憶媒体を利用してもよい。コンピュータ可読記憶媒体は、プロセッサにより可読の情報またはデータを記憶してもよい、任意のタイプの物理メモリを指す。したがって、コンピュータ可読記憶媒体は、本明細書で説明する実施形態と矛盾しないステップまたはステージを1つまたは複数のプロセッサに遂行させるための命令を含む、1つまたは複数のプロセッサにより実行するための命令を記憶してもよい。用語「コンピュータ可読媒体」は、有形の項目を含み、かつ搬送波および過渡信号を除外する、すなわち、非一時的であることを理解されたい。例には、ランダム・アクセス・メモリ(RAM)、読出し専用メモリ(ROM)、揮発性メモリ、不揮発性メモリ、ハードドライブ、CD ROM、DVD、フラッシュディスク、ディスク、および任意の他の公知の物理的記憶媒体が含まれる。
【0081】
本開示および例はただ単に代表的であると考えられ、かつ開示する実施形態の真の範囲および精神は、以下の特許請求の範囲により示されることが意図される。