IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ザ ユニバーシティ オブ クィーンズランドの特許一覧

特開2023-164839呼吸器疾患を診断するために疾患シグネチャを使用して咳音を分析するための方法
<>
  • 特開-呼吸器疾患を診断するために疾患シグネチャを使用して咳音を分析するための方法 図1
  • 特開-呼吸器疾患を診断するために疾患シグネチャを使用して咳音を分析するための方法 図2
  • 特開-呼吸器疾患を診断するために疾患シグネチャを使用して咳音を分析するための方法 図3
  • 特開-呼吸器疾患を診断するために疾患シグネチャを使用して咳音を分析するための方法 図4
  • 特開-呼吸器疾患を診断するために疾患シグネチャを使用して咳音を分析するための方法 図5
  • 特開-呼吸器疾患を診断するために疾患シグネチャを使用して咳音を分析するための方法 図6
  • 特開-呼吸器疾患を診断するために疾患シグネチャを使用して咳音を分析するための方法 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023164839
(43)【公開日】2023-11-14
(54)【発明の名称】呼吸器疾患を診断するために疾患シグネチャを使用して咳音を分析するための方法
(51)【国際特許分類】
   A61B 5/08 20060101AFI20231107BHJP
   A61B 10/00 20060101ALI20231107BHJP
【FI】
A61B5/08
A61B10/00 L
【審査請求】有
【請求項の数】17
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023133045
(22)【出願日】2023-08-17
(62)【分割の表示】P 2020534383の分割
【原出願日】2018-12-20
(31)【優先権主張番号】2017905129
(32)【優先日】2017-12-21
(33)【優先権主張国・地域又は機関】AU
(71)【出願人】
【識別番号】503319102
【氏名又は名称】ザ ユニバーシティ オブ クィーンズランド
(74)【代理人】
【識別番号】100108453
【弁理士】
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【弁理士】
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】ウダンタ・アビラトナ
(72)【発明者】
【氏名】ヴィナヤック・スワーンカー
(57)【要約】      (修正有)
【課題】患者の気道の1つまたは複数の疾患を診断するための方法に関する。
【解決手段】患者から咳音を取得するステップと、咳セグメントから1つまたは複数の咳音特徴を表す咳音特徴信号を生成するために咳音を処理するステップと、咳音特徴信号に基づいて1つまたは複数の疾患シグネチャを取得するステップと、咳セグメントを前記疾患の1つまたは複数を示すものとみなすために1つまたは複数の疾患シグネチャを分類するステップとを含み、咳音特徴信号に基づいて1つまたは複数の疾患シグネチャを取得するステップは1つまたは複数の事前訓練された疾患シグネチャ決定マシンの各々に咳音特徴を適用するステップを含み、各々の前記決定マシンは咳音特徴を特定の疾患もしくは非疾患状態のいずれかに対応するものとして、または第1の特定の疾患もしくは第1の特定の疾患とは異なる第2の特定の疾患に対応するものとして分類するように事前訓練されている方法。
【選択図】図1
【特許請求の範囲】
【請求項1】
患者の気道の1つまたは複数の疾患を診断するための方法であって、
前記患者から咳音を取得するステップと、
咳セグメントから1つまたは複数の咳音特徴を表す咳音特徴信号を生成するために前記咳音を処理するステップと、
前記咳音特徴信号に基づいて1つまたは複数の疾患シグネチャを取得するステップと、
前記咳セグメントを前記疾患の1つまたは複数を示すものとみなすために、前記1つまたは複数の疾患シグネチャを分類するステップと、
を含み、
前記咳音特徴信号に基づいて前記1つまたは複数の疾患シグネチャを取得する前記ステップが、1つまたは複数の事前訓練された疾患シグネチャ決定マシンの各々に前記咳音特徴を適用するステップを含み、各々の前記決定マシンが、前記咳音特徴を、特定の疾患もしくは非疾患状態のいずれかに対応するものとして、または、第1の特定の疾患もしくは前記第1の特定の疾患とは異なる第2の特定の疾患に対応するものとして分類するように事前訓練されている、方法。
【請求項2】
前記1つまたは複数の疾患シグネチャ決定マシンが、各々、訓練されたロジスティック回帰モデル(LRM)を備える、請求項1に記載の方法。
【請求項3】
各々の訓練されたロジスティック回帰モデル(LRM)が、前記LRMにとって重要であると判断された特徴である訓練特徴の削減されたセットを使用して訓練され、それによって前記LRMの過剰訓練を回避する、請求項2に記載の方法。
【請求項4】
前記訓練特徴が、すべての訓練特徴について平均p値を計算し、次いで、しきい値Pminよりも小さい平均p値を有する前記特徴を選択することによって、前記LRMにとって重要な訓練特徴であると判定される、請求項2に記載の方法。
【請求項5】
各LRMの独立変数が、前記咳音特徴の値であり、前記LRMからの出力値が、前記第2の特定の疾患に対して、または非疾患状態に対して、前記第1の特定の疾患を示す前記咳の予測確率を備える、請求項2から4のいずれか一項に記載の方法。
【請求項6】
前記1つまたは複数の疾患シグネチャ決定マシンが、1つまたは複数の訓練されたニューラルネットワークを含む、請求項1に記載の方法。
【請求項7】
前記咳特徴に加えて、臨床患者測定値を独立変数として前記疾患シグネチャ決定マシンに適用するステップを含む、請求項1から6のいずれか一項に記載の方法。
【請求項8】
前記咳セグメントを前記疾患の1つまたは複数を示すものとしてみなすために、前記1つまたは複数の疾患シグネチャを分類する前記ステップが、すべての疾患グループをカバーするように訓練された信号分類器に前記1つまたは複数の疾患シグネチャを適用するステップを含む、請求項1から7のいずれか一項に記載の方法。
【請求項9】
前記咳セグメントを前記疾患の1つまたは複数を示すものとしてみなすために、前記1つまたは複数の疾患シグネチャを分類する前記ステップが、関心のある疾患を認識するように各々訓練された多数の分類器に前記1つまたは複数の疾患シグネチャを適用するステップを含む、請求項1から7のいずれか一項に記載の方法。
【請求項10】
前記1つまたは複数の疾患シグネチャを分類する前記ステップが、以下の疾患、細気管支炎(SBO)、偽膜性喉頭炎(Sc)、喘息/RAD(SA)、肺炎(SP)、下気道疾患(SLRTD)、初期URTI(Su)のうちの1つとして前記1つまたは複数の疾患シグネチャを分類するステップを含む、請求項8または9に記載の方法。
【請求項11】
d個の疾患シグネチャが、前記咳音特徴信号に基づいて1つまたは複数の疾患シグネチャを取得する前記ステップによって生成され、対応して、人工ニューラルネットワーク(ANN)が、前記疾患シグネチャの各々に対応する1つの入力ニューロンを有するd次元入力層を有する、請求項9に記載の方法。
【請求項12】
前記ANNが、k次元出力層を有し、前記出力層内の各ニューロンが、疾患に対応する確率を出力する、請求項11に記載の方法。
【請求項13】
前記1つまたは複数の疾患シグネチャを分類する前記ステップが、複合有効確率測度PQ'を、
P'Q=PQ(1-PZ)
としてコンパイルするステップを含み、ここで、PQが、疾患Qに属する前記患者の確率の指標を備え、PZが、疾患Zに属する前記患者の確率の指標を備え、それによって、積PQ(1-PZ)が、前記患者が疾患Qに属し、かつ疾患Zに属さない複合イベントの確率を示す、請求項1から12のいずれか一項に記載の方法。
【請求項14】
ターゲット疾患の各々に関する咳インデックスを計算するステップを含み、ターゲット疾患に関する患者の前記咳インデックスが、前記ターゲット疾患を示すものとして分類された前記患者の咳の、前記患者について分析された咳の総数に対する比として計算される、請求項10に記載の方法。
【請求項15】
支配的な偽陽性を検出するために、前記1つまたは複数の疾患シグネチャを分類するステップからの分類に1つまたは複数のポストスクリーニングテストを適用するステップを含む、請求項1から14のいずれか一項に記載の方法。
【請求項16】
前記検出された偽陽性に基づいて、前記1つまたは複数の疾患シグネチャを分類するステップを調整するステップをさらに含む、請求項15に記載の方法。
【請求項17】
診断された特定の疾患に基づいて前記患者に特定の治療を適用するステップをさらに含む、請求項1から16のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、医療スタッフが呼吸器疾患に罹患している患者を診断および治療するのを支援する方法および装置に関する。
【背景技術】
【0002】
従来技術の方法、装置、または文書へのいかなる言及も、それらが共通の一般知識の一部を形成したまたは形成するといういかなる証拠または承認も構成するものとして解釈されるべきではない。
【0003】
参照によりその全体が本明細書に組み込まれる国際特許出願PCT/AU2013/000323の主題である、同じ発明者らのうちの1人または複数人による以前の研究において、患者の気道音が記録され、そこから咳音が識別された。テスト特徴ベクトルを形成するために、咳音から特徴が抽出され、テスト特徴ベクトルは、次いで、患者における肺炎などの呼吸器機能障害の存在を診断するために、事前訓練された分類器、好ましくはロジスティック回帰モデルに適用された。
【0004】
PCT/AU2013/000323に記載されている疾患状態を診断するための方法は、うまく機能しており、商業的に成功して実装されているが、それでも、改善の必要がある。例えば、より正確な診断を生じることができたという点で改善であった方法が提供された場合、有利であろう。また、方法が領域固有の情報を診断プロセスに挿入できた場合、好ましいであろう。さらに、標準的な臨床診断のいくらか主観的な性質が対応され得る場合、望ましいであろう。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】PCT/AU2013/000323
【非特許文献】
【0006】
【非特許文献1】Abeyratne、U.R.、ら、Cough sound analysis can rapidly diagnose childhood pneumonia. Annals of biomedical engineering、2013年.41(11):2448~2462頁
【非特許文献2】Kosasih、K.、ら、Wavelet augmented cough analysis for rapid childhood pneumonia diagnosis. IEEE Transactions on Biomedical Engineering、2015年.62(4):1185~1194頁
【非特許文献3】Abeyratne、U.Blind reconstruction of non-minimum-phase systems from 1-D oblique slices of bispectrum.1999年.IET.
【非特許文献4】Hinton GE、Salakhutdinov RR.Reducing the dimensionality of data with neural networks science.2006年7月28日;313(5786):504-7
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明の目的は、気道の疾患状態の診断を支援するための方法および装置を提供することである。
【課題を解決するための手段】
【0008】
本発明の第1の態様によれば、患者の気道の1つまたは複数の疾患を診断するための方法が提供され、方法は、
患者から咳音を取得するステップと、
咳セグメントから1つまたは複数の咳音特徴を表す咳音特徴信号を生成するために咳音を処理するステップと、
咳音特徴信号に基づいて1つまたは複数の疾患シグネチャを取得するステップと、
咳セグメントを前記疾患の1つまたは複数を示すものとみなすために、1つまたは複数の疾患シグネチャを分類するステップと、
を含み、
咳音特徴信号に基づいて1つまたは複数の疾患シグネチャを取得するステップは、1つまたは複数の事前訓練された疾患シグネチャ決定マシンの各々に咳音特徴を適用するステップを含み、各々の前記決定マシンは、咳音特徴を、特定の疾患もしくは非疾患状態のいずれかに対応するものとして、または、第1の特定の疾患もしくは第1の特定の疾患とは異なる第2の特定の疾患に対応するものとして分類するように事前訓練されている。
【0009】
本発明の好ましい実施形態において、1つまたは複数の疾患シグネチャマシンは、各々、訓練されたロジスティック回帰モデル(Logistic Regression Model:LRM)を備える。
【0010】
各々の訓練されたロジスティック回帰モデル(LRM)は、LRMにとって重要であると判断された訓練特徴の利用可能なセットの特徴である訓練特徴の削減されたセットを使用して訓練されてもよく、それによってLRMの過剰訓練を回避する。
【0011】
訓練特徴は、すべての訓練特徴について平均p値を計算し、次いで、しきい値Pminよりも小さい平均p値を有する特徴を選択することによって、LRMにとって重要な訓練特徴であると判定されてもよい。本発明の実施形態によるこのプロセスのさらなる詳細は、本明細書の付録Fに記載されている。
【0012】
この実施形態において、各LRMの独立変数は、咳音特徴の値であり、LRMからの出力値は、第2の特定の疾患に対して、または非疾患状態に対して、第1の特定の疾患を示す咳の予測確率を備える。
【0013】
疾患シグネチャはまた、呼吸器内科において使用される特定の評価または測定結果に関連するスケールを生成するように訓練されてもよい。例:低WSS対高WSS、肺活量測定において測定される低FEV1対高FEV1、肺活量測定において測定される低FEV1/FVC対高FEV1/FVCを分離するようにシグネチャを訓練することによる呼気性喘鳴重症度スコア(Wheeze Severity Scores:WSS)。
【0014】
本発明の別の実施形態において、1つまたは複数の疾患シグネチャマシンは、1つまたは複数の訓練されたニューラルネットワークを含んでもよい。連続出力を提供する他の分類器またはモデル(例えば、一般化線形モデル、隠れマルコフモデルなど)も、信号マシンとして使用され得る。
【0015】
方法は、咳特徴に加えて、臨床患者測定値を独立変数として疾患シグネチャ決定マシンに適用するステップをさらに含んでもよい。
【0016】
本発明の一実施形態において、咳セグメントを前記疾患の1つまたは複数を示すものとしてみなすために、1つまたは複数の疾患シグネチャを分類するステップは、すべての疾患グループをカバーするように訓練された信号分類器に1つまたは複数の疾患シグネチャを適用するステップを含む。
【0017】
本発明の別の実施形態において、咳セグメントを前記疾患の1つまたは複数を示すものとしてみなすために、1つまたは複数の疾患シグネチャを分類するステップは、関心のある疾患を認識するように各々訓練された多数の分類器に1つまたは複数の疾患シグネチャを適用するステップを含む。
【0018】
好ましい実施形態において、分類器は、各々、以下の疾患、細気管支炎(SBO)、偽膜性喉頭炎(SC)、喘息/RAD(SA)、肺炎(SP)、下気道疾患(SLRTD)、初期URTI(SU)のうちの1つを認識するように訓練される。
【0019】
好ましくは、d個の疾患シグネチャは、咳音特徴信号に基づいて1つまたは複数の疾患シグネチャを取得するステップによって生成され、対応して、人工ニューラルネットワーク(Artificial Neural Network:ANN)は、疾患シグネチャの各々に対応する1つの入力ニューロンを有するd次元入力層を有する。
【0020】
本発明の好ましい実施形態において、ANNは、k次元出力層を有し、出力層内の各ニューロンは、疾患に対応する確率を出力する。
【0021】
本発明の好ましい実施形態において、1つまたは複数の疾患シグネチャを分類するステップは、複合有効確率測度PQ'を、
P'Q=PQ(1-PZ)
としてコンパイルすることによって複合有効確率測度をコンパイルするステップを含み、ここで、PQは、疾患Qに属する患者の確率の指標を備え、PZは、疾患Zに属する患者の確率の指標を備える。したがって、積PQ(1-PZ)は、患者が疾患Qに属し、かつ疾患Zに属さない複合イベントの確率を示す。
【0022】
方法は、ターゲット疾患の各々に関する咳インデックスを計算するステップを含んでもよく、ターゲット疾患に関する患者の咳インデックスは、ターゲット疾患を示すものとして分類された患者の咳の、前記患者について分析された咳の総数に対する比として計算される。
【0023】
方法は、特定の治療、例えば、診断された特定の疾患に基づいて患者に有効であることが知られている治療を適用するステップをさらに含んでもよい。
【0024】
本発明の好ましい特徴、実施形態、および変形例は、当業者が本発明を実行するのに十分な情報を提供する以下の詳細な説明から識別され得る。詳細な説明は、どのようにも前述の本発明の概要の範囲を限定するものとみなされるべきではない。詳細な説明は、以下のようにいくつかの図面を参照する。
【図面の簡単な説明】
【0025】
図1】本発明の第1の実施形態による好ましい診断方法のフローチャートである。
図2】d次元入力層(図B中のシグネチャブロックからの入力)とk次元出力層とを有する人工ニューラルネットワークアーキテクチャを示す図である。出力層内の各ニューロンは、疾患サブグループに対応する。
図3】プレスクリーニング処理ブロックとポストスクリーニング処理ブロックとを含む、本発明のさらなる実施形態による診断方法のフローチャートの第1の部分である。
図4図3のフローチャートの第2の部分である。
図5】特徴マッピングのために訓練されたオートエンコーダニューラルネットワークのブロック図である。
図6】疾患固有のシグネチャを生成するように訓練されたシグネチャ層ニューラルネットのブロック図である。
図7】本発明の一実施形態による深層ニューラルネットワークのブロック図である。
【発明を実施するための形態】
【0026】
図1は、本発明の好ましい実施形態による方法のフローチャート100を示す。方法100は、以下のような4つの主要な処理ボックスまたはブロック、咳特徴計算ブロック112、疾患シグネチャ生成114、シグネチャ選択116、およびシグネチャ分類器ブロック118を含む。これらのブロックの各々は、例えば、本明細書で説明する様々な機能を実装するために特別にプログラムされたコンピュータを使用することによって、装置を提供するように実装され得る。代替的には、様々な処理ブロックはまた、カスタム電子集積回路チップとディスクリートロジックとを使用して実装され得る。より具体的には、分類器ブロック118などのいくつかのブロックは、人工ニューラルネットワーク(ANN)を実装し、IBMによるSynapseチップ、またはQualcommによるZerothプロセッサ、またはそれらの均等物などの、専用ANN集積回路を使用して実装されてもよい。
【0027】
患者音102は、マイクロフォン104を介して患者101からボックス106において記録される。音声記録は、咳識別およびセグメント化ブロック108に渡され、咳識別およびセグメント化ブロック108は、オーディオ記録を処理し、それを咳音、例えば、CG1 110aおよびCG2 110bに自動的にセグメント化する。デジタル化された信号、例えば、電子MP3ファイルセグメントからなる咳音110a、110bは、咳特徴計算ブロック112に転送される。咳特徴計算ブロック112は、信号、例えば、回路基板または集積回路導体において伝送される電気信号の形式において咳特徴値を抽出するために咳音の各々を処理するように構成され、咳特徴値は、各咳が、説明するいくつかの特徴的な特徴の各々をどの程度所有するかを表す。咳特徴計算ブロック112からの出力信号は、シグネチャ生成ブロック114によって処理される。シグネチャ生成ブロック114は、第1または第2の特定の疾患(または疾患のグループ)を示すものとして咳特徴信号を分類するように各々が事前訓練された、複数の事前訓練された決定マシン2a~2n、好ましくは訓練されたロジスティック回帰マシンを備える。事前訓練された決定マシン2a~2nのうちの1つはまた、特定の疾患または正常(すなわち、非疾患)を示すものとして咳特徴信号を分類するように訓練されてもよい。
【0028】
シグネチャ選択ブロック116は、疾患シグネチャ生成ブロック114から出力された信号を受信し、それらから、分類器ブロック118の出力におけるデータの訓練/検証セットに対する最良の診断結果を提供するシグネチャのセットを識別するように構成される。シグネチャ選択ブロック116は、以下のように複数の要因を考慮するように構成される。
(i)個々のシグネチャ生成プロセスにおいて優れた訓練および検証パフォーマンスを提供する能力。
(ii)領域固有の知識(例えば、最終分類器のターゲットが喘息/RADを診断することである場合、呼気性喘鳴が喘息/RADの強力な指標であるので、WSSシグネチャが有用であると予想される。分類器が肺炎を診断しなければならない場合、臨床診療などにおいて診断上のジレンマを示すことが知られているので、肺炎対細気管支炎のシグネチャが示されてもよい。)。
(iii)シグネチャに対する検索プロセスに基づいて、訓練/検証セットに対する分類器出力における診断パフォーマンスを最大化する。
【0029】
選択されたシグネチャ選択ブロック116からの出力値は、分類器ブロック118に渡され、分類器ブロック118は、好ましくは、複数の事前訓練されたニューラルネットワークから構成され、それらのニューラルネットワークの各々は、選択されたシグネチャ生成器の出力を、いくつかの所定の疾患のどれか1つとして分類するように事前訓練される。
【0030】
診断指示ブロック120は、分類器ブロック118に応答し、疾患診断を確認して適切な治療を患者に提供するために臨床医によって使用され得る疾患診断に関する指示を提示する。出力ボックス120は、患者のための臨床医または他の介護者への、単一の疾患またはいくつかの疾患の診断指示の、例えば、視覚電子ディスプレイ上での提示を含み、患者は、次いで、特定の治療、例えば、診断された特定の疾患に基づいて患者に有効であることが知られている治療を適用してもよい。
【0031】
さらなる詳細は、以下の考察において提供される。
【0032】
咳特徴計算ボックス112
ボックス112において、咳イベントを含むものとして識別された患者記録からのセグメントは、PCT/AU2013/000323に記載の方法において各咳イベントから数学的特徴を抽出するように構成された処理ブロックに適用される。
【0033】
加えて、本発明の好ましい実施形態によれば、咳特徴計算ブロック112はまた、高次スペクトルスライスに基づいて、メル周波数ケプストラム係数(Mel-Frequency Cepstral Coeffcient:MFCC)係数によって触発された、ケプストラム係数を抽出するように構成される。新しい係数は、本明細書ではBFCC(バイスペクトル周波数ケプストラム係数(Bispectral Frequency Cepstral Coefficient))と呼ばれ、本明細書の付録B(i)においてさらに詳細に説明されている。
【0034】
咳特徴計算ボックスが使用中に以下のプロセスを実行するように構成されることは、以下の通りである。
(i)xは、任意の咳イベントからの離散時間音声信号を示すものとする。
(ii)xを、例えば、3つの同じサイズの重複しないサブセグメントにセグメント化する。目標ターゲットは、単一の咳の中での数学的特徴の変化を捕捉することである。xiは、xのi番目のサグセグメントを表すものとし、ここで、i=1,2,3である。
各サブセグメントxiから以下の特徴、8つのバイスペクトル係数(BC)、非ガウス性スコア(NGS)、第1の4つのフォルマント周波数(FF)、対数エネルギー(LogE)、ゼロ交差(ZCR)、尖度(Kurt)、31のメル周波数ケプストラム係数(MFCC)、シャノンエントロピー(ShE)を計算する。
(iii)加えて、咳イベントデータ全体を使用して13のウェーブレット特徴を計算する[2]。各咳特徴の簡単な説明については、付録Bを参照されたい。
(iv)合計Cf=157の特徴が各咳イベントから抽出される。
【0035】
疾患シグネチャ生成ボックス114
PCT/AU2013/000323の主題である以前の研究において、ボックス112において計算された特徴セットにおいてロジスティック回帰モデルを訓練することによって、患者が直接分類された。
【0036】
PCT/AU2013/000323において採用された手法とは対照的に、本発明の好ましい実施形態は、いくつかの目的、(a)領域固有の情報を診断プロセスに注入する方法として、(b)標準的な臨床診断の主観的な性質に対応する方法として、(c)より正確な診断を生じる方法として、を念頭に有する、本明細書では「シグネチャ生成」と呼ばれる新しい手順を含む。
【0037】
ボックス114において行われるシグネチャ生成は、咳特徴計算ブロック112からの入力特徴を、0と1との間で連続的に変化し、分類器が個々の疾患をよりよく診断することができる空間を定義する、デジタルメモリ内に表される軸のセットにマッピングすることを含む。これらの軸の各々は、シグネチャと呼ばれる。すべての患者は、軸(シグネチャ)の各々に沿った応答を提供し、各患者に関する各シグネチャの応答値の集合は、次いで、診断指示ブロック120において提示される診断を生成する分類器ブロック118に送信される。説明するように、軸(シグネチャ)は、領域固有の知識を埋め込む。
【0038】
一実施形態において、ボックス112からボックス114への入力特徴は、ロジスティック回帰モデル(LRM)を訓練することによってシグネチャに変換され得る。例えば、シグネチャ軸は、{(細気管支炎対正常)、(偽膜性喉頭炎対正常)、(細気管支炎対偽膜性喉頭炎)、(細気管支炎対すべての疾患)、(偽膜性喉頭炎対A/RAD)...など}などのモデルの集合を訓練することによって達成され得る。各モデルは、1つのシグネチャを提供する。使用される実際のシグネチャは、診断を必要とする疾患グループに依存する。シグネチャはまた、(高い呼気性喘鳴重症度スコアWSS=5、6、7対低い呼気性喘鳴重症度スコアWSS=0、1、2)などのモデル、および、マップ臨床サインが0と1との間の連続変数にマッピングされる臨床サインベースのモデル(例えば、熱、鼻水)を用いて構築され得る。LRMの代替としてシグネチャブロックを生成する際に、入力を連続決定変数にマッピングする任意の他の分類器、例えば、ニューラルネットワークが使用され得る。
【0039】
ロジスティック回帰(LR)モデルは、分類別のイベントの確率を推定するためにいくつかの独立変数を使用する一般化線形モデルである。関連する独立変数は、咳イベントから計算された数学的特徴であり、分類別のイベントは、疾患サブグループである。したがって、上記の例では、偽膜性喉頭炎疾患に関連して細気管支炎に属する咳の確率を予測するために、LRモデルが訓練され得る。LRモデルは、以下の独立した特徴が与えられた確率Yを推定するために回帰関数を使用して導出される。
【0040】
【数1】
【0041】
z=β01・q12q2+...+βn-1qF (2)
(2)において、β0は、切片と呼ばれ、β1、β2は、特徴を表す独立変数q1、q2、...qFの回帰係数と呼ばれる。
【0042】
疾患シグネチャ生成ブロック114の必要なLRモデル2a、...、2nを生成するために、取得された咳音を使用してそれらを訓練する必要がある。LRMモデル2a、...、2nは、関連する患者サブグループにおいて疾患または測定クラスを正確に分類するそれらの能力に導かれて訓練される。訓練されると、それらは、診断を必要とするすべての患者について(0,1)間の連続値確率出力信号を生成するために使用される。
【0043】
咳音取得
咳音は、両方とも西オーストラリアのパースにある2つの臨床現場、ジューンダラップヘルスキャンパス(JHC)およびプリンセスマーガレット病院(PMH)から記録された。患者集団は、0~12歳の年齢で、肺炎、喘息/RAD(反応性気道疾患)、細気管支炎、偽膜性喉頭炎、および上気道感染症(URTI)などの呼吸器疾患が疑われる子どもを含んでいた。クイーンズランド大学、ジューンダラップヘルスキャンパス、およびプリンセスマーガレット病院の人間倫理委員会は、研究プロトコルと患者募集手順とを承認した。
【0044】
算入基準(咳、呼気性喘鳴、息切れ、吸気性喘鳴、URTI)を満たし、除外基準(呼吸補助を必要とする、同意なし)を満たさない患者が研究に募集された。測定時に呼吸器疾患のいかなる症状もなかった子どもとして定義された健常者も募集された。
【0045】
Apple iPhone (登録商標) 6sを使用して咳音が記録された(図1のボックス106を参照)。サンプルあたり16ビットのビット深度で、fs=44.1kサンプル/秒のサンプリングレートで音声データが記録された。スマートフォンレコーダは、口から約50cm、約45°の角度で配置された。
【0046】
データベースおよび実験計画
図1の装置を実装するために必要な様々なモデルを訓練するために使用されたデータベースは、咳の記録と、最終診断、臨床検査所見、および実験室ならびにイメージング結果を含む、各患者における詳細な臨床診断情報とで構成される。人口統計情報も、患者の匿名化フィーマットにおいて利用可能であった。
【0047】
診断グループ(疾患を診断する際に使用されるケース定義は、付録Aにおいて与えられる)。
【0048】
正常グループ(Nr):測定時に識別できる呼吸器疾患のない健康なボランティア。
【0049】
初期URTIグループ(U):測定時に医学的に識別可能な下気道併発または他の呼吸器疾患のない上気道感染症(URTI)のみの患者。
【0050】
偽膜性喉頭炎グループ(C):偽膜性喉頭炎単独またはURTIの併存疾患の診断分類を有する患者。
【0051】
喘息/反応性気道疾患グループ(A):併存疾患としてURTIありまたはなしの、喘息または反応性気道疾患の診断分類を有する患者。
【0052】
臨床肺炎グループ(P):併存疾患としてURTIありまたはなしの、臨床肺炎の診断分類を有する患者。
【0053】
細気管支炎グループ(Bo):併存疾患としてURTIありまたはなしの、細気管支炎の診断分類を有する患者。
【0054】
気管支炎グループ(Bc):併存疾患としてURTIありまたはなしの、気管支炎の診断分類を有する患者。
【0055】
被験者全体は、分類器モデルを訓練、検証、およびテストするために、2つの相互排他的なセットに分割された。2つの相互に排他的なセットは、(1)訓練-検証セット(TrV)および(2)プロスペクティブテストセット(PT)であった。各被験者は、1セットのみに属した。(臨床チームによって示される)診断の不確実性と、URTIを除く併存疾患の疾患とを有する被験者は、TrVから除外された。
【0056】
訓練-検証セットTrVは、一つ抜き検証(LOOV)またはK分割交差検証手法に従ってモデルを訓練および検証するために使用される。LOOV方法は、モデルを訓練するために1人を除くすべての患者からのデータを使用し、モデルを検証するために残りの患者からの咳イベントを使用することを含む。このプロセスは、TrV内の各患者がモデルを正確に1回検証するために使用されるように、体系的に繰り返された。K分割交差検証において、元のサンプルは、K個の等しいサイズのサブサンプルにランダムに分割される。単一のサブサンプルは、モデルを訓練するための検証データとして保持される。残りの(K-1)個のサンプルは、モデルを訓練するために使用される。プロセスは、TrV内のすべてのデータが方法を訓練する際に一度使用されるまで、K回繰り返される。LOOVは、KがセットTrV内のデータの総数(N)に設定されたK分割交差検証法の特殊なケースであることに留意されたい。
【0057】
Table 1(表1)(裏面)は、図1の疾患シグネチャ生成ブロック114において訓練された様々なLRモデル2a、...、2nをリストしている。
【0058】
【表1】
【0059】
TrVデータセット内のデータは、Table 1(表1)においてリストされたすべてのLRモデルを訓練および検証するために使用された。
【0060】
最も単純な形式において、咳ベースの特徴のみがLRモデルを訓練するために使用される。しかしながら、本発明者らは、追加コストなしで、最小限の複雑さでLRモデルの性能を改善するために使用され得るいくつかの単純な臨床測定の存在を認識した。これによって触発されて、本発明者らは、咳ベースの特徴に単純な臨床特徴を追加し、Table 1(表1)内のLRモデルリストの第2のセットを訓練した。Table 2(表2)は、咳ベースの特徴が追加された単純な臨床特徴を示す。
【0061】
【表2】
【0062】
特徴選択
特徴選択は、最適なシグネチャモデルを設計するための関連する特徴を選択する技法である。例えば、TrVセットを使用してシグネチャとしてLRモデルを構築する際、特定の特徴がモデルにとってどれくらい重要であるかを捕捉するp値が各入力特徴について計算される。重要な特徴は、低いp値を有する。LRモデルのこの特性は、特徴の適切な組合せを選択するために、TrVセット全体にわたって使用された。重要な特徴のサブセットが知られると、それは、TrVデータセットにおけるLOOV(K分割)訓練/検証に基づいてLRモデルを再訓練するために使用された。特徴選択プロセスのさらなる詳細は、以前に参照した以前のPCT出願、およびAbeyratne、U.R.、ら、Cough sound analysis can rapidly diagnose childhood pneumonia. Annals of biomedical engineering、2013年.41(11):2448~2462頁において見られ得る。
【0063】
良好なLRモデルを選択する
LOOV訓練/検証プロセスは、Nk個のLRモデルを結果として生じ、ここで、Nkは、TrVセット内の患者の数である。Nkの値は、TrVセット内の異なる疾患グループ内の患者の異なる数により、Table 1(表1)においてリストされた異なるLRモデルに対して変化する。Nk個のLRモデルから、k-meanクラスタリングアルゴリズムに基づいて最良のモデルの1つが選択された。モデル選択のためにk-meanクラスタリングアルゴリズムを使用することにおけるさらなる詳細は、[1]において見られ得る。
【0064】
Rc,jが、咳のみの特徴を使用して訓練されたLRモデルjに基づく選択されたシグネチャを表し、Rcf,jが、咳に加えて単純な臨床特徴を使用して訓練された選択されたLRモデルを表すとする。LRモデルが選択されると、それは、疾患シグネチャを生成するために、TrVデータセット内のすべての患者に対して実行される。
【0065】
これらのシグネチャは、異なるシグネチャ値を介してテストされたすべての仮説に対する所与の患者iの「応答」ρc,ij=Rc,j(xi)およびρcf,ij=Rcf,j(xi)を提供する。ベクトルxiは、モデルRc,j(xi)およびモデルRcf,j(xi)によって要求される、i番目の患者の咳音および臨床サインなどの情報の集合を表す。
【0066】
例として、テストされている患者が細気管支炎を有する場合、{細気管支炎対すべての他の疾患}などのモデルに対する患者の応答は、1(「完全な応答」)に近い強い値を与えるはずであるが、{A/RAD対すべての他の疾患}は、より低い応答(「部分的応答」)を与えるはずである。しかしながら、患者は、各シグネチャ軸(LRMモデル)に対して特定の応答を与え、各患者「i」に関するそのような応答の集合を表すベクトルVi,cおよびVi,cfは、患者が罹患している疾患を特徴付ける。
Vi,c=[{ρc,ij}|j=すべての選択されたシグネチャ(LRMモデル)] (3)
Vi,cf=[{ρc,ij}|j=すべての選択されたシグネチャ(LRMモデル)] (4)
信号生成ブロック114において利用可能なすべてのモデル2a、...、2nが、必ずしも最終シグネチャ分類器ブロック118において利用されるわけではない。シグネチャの選択は、シグネチャ選択ブロック116において行われ、シグネチャ選択ブロック116は、特定のシグネチャが最終疾患診断パフォーマンスならびにシグネチャ間の情報冗長性にどれくらい寄与しているかについての領域固有の知識および観察を考慮に入れるように構成される。Table 1(表1)のエントリは、より大きい集合から選択されたそのようなシグネチャの好ましいリストを提供する。
【0067】
分類器ブロック118
分類器ブロック118の機能は、シグネチャ生成ブロック114によって提供されるシグネチャVi,cおよびVi,cfを使用し、特定の疾患グループに属する各患者から記録された各咳の可能性にラベル付けすることである。次いで、全体的な診断の決定は、いくつかの異なる方法を使用して患者ごとに行われる。関心のある疾患グループをカバーするため、またはすべての疾患グループをカバーする単一の分類器を構築するために、複数の分類器ブロックが構築され得る。任意の分類器がシグネチャ分類器ブロック118において使用され得るが、ソフトマックス人工ニューラルネットワーク層(ソフトマックスANN)が分類器として使用された。
【0068】
図2は、図1のブロック118において使用されるソフトマックスANNの典型的な構造200を示す。ANNの訓練および検証のために、DTrVデータベースからのデータが使用され、LOOV(またはK分割)交差検証プロセスが続けられた。ソフトマックス関数を使用する利点は、各ニューロンの値が0と1との間の範囲であり、出力層内のすべてのニューロンの合計が1であることである。これは、それを、疾患サブグループの確率をモデル化および予測するのに有用な機能にする。例えば、疾患Qを診断するためにモデルを構築することが望ましく、疾患Zが(例えば、いくつかの症状の重複がある)交絡疾患として現れることが知られている場合、診断パフォーマンスは、複合有効確率測度PQ'を、
P'Q=PQ(1-PZ) (5)
としてコンパイルすることによって改善され得、ここで、PQは、患者が疾患Qに属する確率の指標として扱われ、PZは、患者が疾患Zに属する確率の指標として扱われ得る。したがって、積PQ(1-PZ)は、患者が{疾患Qに属し、かつ、疾患Zに属さない)複合イベントの確率を示す。
【0069】
図2に示すANNは、ニューロン203(図1におけるシグネチャブロック114から受信される入力)から構成されるd次元入力層201と、k次元出力層205とを有する人工ニューラルネットワークアーキテクチャを示す。出力層205内の各ニューロン207は、疾患サブグループに対応する。
【0070】
本発明の好ましい実施形態において、5つの異なるソフトマックスANNモデルが、疾患サブグループ、細気管支炎、偽膜性喉頭炎、喘息/RAD、肺炎、および下気道疾患(LRTD)を識別するように訓練された。これらの疾患固有のソフトマックスANNの詳細を以下に提供する。
1.細気管支炎のためのソフトマックスANN(SBO):このソフトマックスANNモデルにおいて、細気管支炎を中心とするシグネチャが使用された。ANNを訓練するために使用されたシグナトリLRモデルは、{RBO,R,RA,BO,RP,BO,RBO,BC,RBO,C,RBO,U,RHW,LW}であった。出力層において、kの次元は、6つのニューロンに設定され、各ニューロンは、1つの疾患サブグループ、細気管支炎、喘息/RAD、肺炎、気管支炎、pURTI、偽膜性喉頭炎に対応する。式(5)において、PQは、細気管支炎ニューロンの出力であり、PZは、RADニューロンの出力である。
2.偽膜性喉頭炎のためのソフトマックスANN(SC):このANNモデルにおいて、偽膜性喉頭炎を中心とするシグネチャが使用された。使用されたシグナトリLRモデルは、{RC,R,RA,C,RP,C,RB0,C,RBC,C,RC,U}であった。出力層において、kの次元は、6つのニューロンに設定され、各ニューロンは、1つの疾患サブグループ、細気管支炎、喘息/RAD、肺炎、気管支炎、pURTI、偽膜性喉頭炎に対応する。式(5)において、PQは、偽膜性喉頭炎ニューロンの出力であり、PZは、pURTIニューロンの出力である。
3.喘息/RADのためのソフトマックスANN(SA):このANNモデルにおいて、喘息/RADを中心とするシグネチャが使用された。使用されたシグナトリLRモデルは、{RA,R,RA,C,RA,p,RA,BO,RA,BC,RA,U,RHW,LW}であった。出力層において、kの次元は、6つのニューロンに設定され、各ニューロンは、1つの疾患サブグループ、細気管支炎、喘息/RAD、肺炎、気管支炎、pURTI、偽膜性喉頭炎に対応する。式(5)において、PQは、喘息/RADニューロンの出力であり、PZは、pURTIニューロンの出力である。
4.肺炎のためのソフトマックスANN(SP):肺炎のソフトマックスANNモデルにおいて、使用されたシグナトリLRモデルは、{RA,P,RA,BO,RA,C,RP,R,RP,U,RP,C,RP,BO,RP,BC,RBO,R,RC,R,RHW,LW}であった。出力層において、kの次元は、細気管支炎、肺炎、および偽膜性喉頭炎の各々のための1つのニューロン、喘息/RAD、気管支炎、pURTIの疾患のための1つのニューロンの、4つのニューロンに設定された。式(5)において、PQは、肺炎ニューロンの出力であり、PZは、喘息/RAD、気管支炎、pURTIの疾患のためのニューロンの出力である。
5.下気道疾患のためのソフトマックスANN(SLRTD):下気道疾患(LRTD)は、下気道病変を有する疾患を表すために使用される包括的な用語である。LRTDサブグループは、肺炎、喘息/RAD、細気管支炎、および気管支炎の疾患からの患者を組み合わせている。LRTDソフトANNモデルは、偽膜性喉頭炎およびpURTIからLRTD疾患を識別するように訓練された。このANNにおいて、LRTDを中心とするシグネチャが使用された。使用されたシグナトリLRモデルは、{RA,U,RA,C,RP,C,RP,U,RBO,U,RBO,C,RBC,C,RC,R,RC,U,RA,N,RP,N,RBO,N,RBC,N,RHW,LW}であった。出力層において、kの次元は、URTIおよび偽膜性喉頭炎の各々のための1つのニューロン、LRTD疾患グループのための1つのニューロンの、3つのニューロンに設定された。式(5)において、PQは、LRTDニューロンの出力であり、PZは、pURTIのためのニューロンの出力である。
6.初期URTIのためのソフトマックスANN(SU):このANNモデルにおいて、pURTIを中心とするシグネチャが使用された。使用されたシグナトリLRモデルは、{RA,U,RP,U,RBO,R,RBO,U,RBC,U,RC,R,RC,U,RHW,LW,RP,Nr,RU,Nr}であった。出力層において、kの次元は、6ニューロンに設定され、各ニューロンは、1つの疾患サブグループ、細気管支炎、喘息/RAD、肺炎、気管支炎、pURTI、偽膜性喉頭炎に対応する。式(5)において、PQは、pURTIニューロンの出力であり、PZは、肺炎ニューロンの出力である。
【0071】
咳のみのソフトマックスANNを訓練するために、咳特徴のみを使用して開発されたLRシグネチャモデルが使用された。咳に加えて単純な臨床特徴を訓練するために、咳特徴のみおよび/または咳に加えて単純な臨床特徴を使用して開発されたLRシグネチャモデルが使用された。
【0072】
好ましいソフトマックスANNモデルを選択する
LOOV交差検証プロセスは、N個のソフトマックスモデルを結果として生じる。ここで、Nは、TrVデータセット内の患者の数である。N個のモデルから、本発明者らは、再びk平均クラスタリングアルゴリズムに従って最良のモデルのうちの1つを選択した。モデル選択にk平均クラスタリングアルゴリズムを使用することのさらなる詳細は、[1]において見られ得る。SSは、選択されたソフトマックスANNを表し、λSは、特定の疾患サブグループに関する対応する確率決定しきい値であるとする。SSが選択されると、モデルのすべてのパラメータを確定し、訓練プロセスを完全に終了する。モデルSSは、次いで、さらなるテストのための最良のモデルとして使用される。K分割交差検証手法において、同様の手法が使用された。
【0073】
本発明者らがソフトマックスANNを訓練する際に調査した他の要因は、ネットワークのサイズ、訓練エポック、訓練レート、停止基準、および、訓練と検証エラーとの間の違いである。これらの要因は、本発明者らがアクセスしたデータセットの過学習を最小限にし、統計的に類似した以前は目に見えなかった母集団への一般化を最大化することを目的として調査された。
【0074】
以下は、各患者における診断決定に到達するために使用された方法のいくつかの好ましい実施形態について説明する。
【0075】
i).咳インデックスおよび患者ベースの分類
この手法において、分類器(例えば、ソフトマックスANN)の出力が直接(例えば、PQ、PZなど)、またはP'Qなどの確率複合測定値が処理された。第1の目標は、患者によって与えられた各咳を対象疾患クラス(例えば、細気管支炎)に対してテストし、各咳に「成功=1」または「失敗=0」としてラベル付けすることである。例えば、最終的な目標が細気管支炎に対してテストすることであった場合、各咳は、細気管支炎(1のラベルによって示される成功)または非細気管支炎(0のラベルによって示される失敗)としてラベル付けされた。最適な決定しきい値λを選択するために(すなわち、テスト統計≧λの場合、テスト下の咳は、ターゲット疾患に属する(成功、1))、次いで、TrVセットにおいて受信者操作曲線(ROC)分析が使用された。
【0076】
次いで、以下のようにターゲット疾患の各々について咳インデックスが計算された。CTが患者iから分析された咳の総数であり、CSがソフトマックスANNモデルによって「成功」とラベル付けされた咳の数であるとする。次いで、ターゲット疾患サブグループjに関する患者iの咳インデックスCli,jは、Cli,j=CS/CTとして計算される。
【0077】
ii).深層学習戦略に基づく分類
(0と1との間で連続的に変化する実数である)ソフトマックス層の生の出力は、深層学習手法の精神でさらに処理され得る。いくつかの好ましい実施形態を以下に与える。
a)ブロック1183のソフトマックスANNの生の出力は、異なる哲学で訓練された他の同様のネットワークからの入力を同時に受信するニューラルネットワークなどの別の分類器に供給されてもよい。例えば、他のネットワークは、親が簡単に観察して臨床医に報告することができる臨床サインに完全に基づくことができる。臨床サインネットワークは、図1の疾患シグネチャ生成ブロック114と並列のアーキテクチャ、または、臨床サインを所望の疾患グループにマッピングする選択されたLRM分類器(またはANN分類器など)のセットなどのより簡単な変形例を有することができる。
b)図1のブロック114のLRMベースのシグネチャ生成器モデル2a、...、2nは、ネットワーク全体をANNベースにするANN層などの他の分類器によって置き換えられ得、深層学習ネットワークの哲学に従うことができる。本発明者らは、そのようなモデルを構築してテストした。臨床サインモデルは、上記のように組み込まれ得る。
【0078】
1つの好ましい実施形態において、本発明者らは、エンコーダ手法を使用して深層学習ネットワークを訓練した。最終的な分類器自体は、関心のある疾患クラスの各々を表す1つのニューロンを有するニューラルネットワークであった。
【0079】
D.プロセスをテストする
このセクションにおいて、本発明者らは、プロスペクティブデータセットにおける最終的な診断モデルのパフォーマンスについて説明する。プロスペクティブデータセットを使用する前に、本発明者らは、本発明者らの診断モデルを完全に凍結し、さらなる訓練もしくはパラメータ調整またはプロトコル変更は、許可されない。
【0080】
結果
A.データセット
Table 3(表3)は、この研究において使用された被験者母集団の詳細を示す。この作業について、本発明者らは、本発明者らのモデルを開発、検証、およびテストするために、合計N=1151人の被験者(982人の患者および169人の健常者)からの咳音データを使用した。これらの患者は、2つの重複しないデータセット、(1)訓練-検証セット(TrV)および(2)プロスペクティブテストセット(PT)に分けられた。患者は、病院への提示順序に基づいて各セットに割り当てられた。
【0081】
【表3】
【0082】
訓練-検証データセット:本発明者らは、本発明者らが2つの現場から募集された合計1011人の被験者(852人の患者および159人の健常者)を有すると、モデルの訓練および検証について本発明者らのデータセットを凍結した。600人の患者および134人の健常者。
【0083】
プロスペクティブテストデータセット:すべて記録現場JHCからの合計130人の患者および10人の健常者の記録(JHCから9人およびPMHから1人)が存在した。
【0084】
臨床裁定に続いて、臨床チームと相談して、データセット内の被験者は、様々な診断サブグループ、正常グループ(Nr)、初期URTIグループ(U)、偽膜性喉頭炎グループ(C)、喘息/反応性気道疾患グループ(A)、臨床肺炎グループ(P)、細気管支炎グループ(Bo)、気管支炎グループ(Bc)に分類された。
【0085】
B.訓練-検証データセットにおけるシグネチャモデルのパフォーマンス
1011人の被験者のうち、725人の被験者(602人の患者123人の健常者)が、モデルの訓練および検証のために最終的に使用された。
【0086】
【表4】
【0087】
Table 4(表4)は、訓練-検証モデルのために使用された各疾患サブグループ内の患者の数を示す。
【0088】
正常対疾患のためのLRモデル:最初に、本発明者らは、健常者および任意の疾患サブグループ被験者からの咳を分類する際のLRシグナトリモデルのパフォーマンスを調査した。Table 5(表5)は、この調査の一つ抜き検証結果を示す。
【0089】
【表5】
【0090】
Table 5(表5)から、特徴選択後、すべてのLRモデルが非常に高い精度で疾患の咳から正常な咳を分離できたことがわかる。
【0091】
疾患サブグループ間のLRモデル:本発明者らの次の目標は、2つの異なる疾患グループからの咳を分類する際のLRシグナトリモデルのパフォーマンスを調査することである。この調査は、LRモデルがどれくらい良好に疾患のシグネチャを補足したかを決定する際に役立つ。Table 6(A)(表6)は、すべての特徴がモデル訓練のために使用された場合のこの調査の一つ抜き検証結果を示す。
【0092】
【表6】
【0093】
裏面のTable 6(B)(表7)は、特徴選択後の結果を示す。
【0094】
【表7】
【0095】
Table 6(B)(表7)によれば、特徴選択後、LRシグナトリモデルの大部分は、2つのクラスから咳を分離する際に中程度から高い精度(70~90%)を達成した。最も高い精度は、任意の他の疾患または疾患グループから偽膜性喉頭炎または細気管支炎の咳を識別する際に達成された。最も正確でないLRシグナトリモデルは、肺炎対気管支炎および気管支炎対pURTIであった(精度約65%)。
【0096】
C.訓練-検証データセットにおけるソフトマックスモデルのパフォーマンス
【0097】
【表8】
【0098】
セクション3(B)からの結果は、LRシグナトリモデルが疾患固有のシグネチャを捕捉することにかなり成功したことを示した。セクション2(C)のステップ3においてこれらのシグネチャを使用して、本発明者らは、他の疾患からターゲット疾患の咳を分離するようにソフトマックスニューラルネットワークモデルを訓練した。次いで、咳インデックスを使用し、最適なしきい値を適用して、本発明者らは、患者レベルで疾患を分類するという最終目的を達成した。
【0099】
Table 7(B)(表9)は、ソフトマックスANNモデルを使用して1つの疾患を残りの疾患から分離した一つ抜き検証結果を示す。これらの結果によれば、肺炎を除くすべてのモデルは、非常に高い感度および特異性でターゲット疾患を予測することができる。最良の検証結果は、100%の感度および96%の特異性(咳に加えて単純な臨床サインモデルを使用する)ならびに95%の感度および92%の特異性(咳のみのモデル)を有する偽膜性喉頭炎モデルについて得られた。2番目によい結果は、細気管支炎モデルについてであり、初期URTI、喘息、およびLRTDモデルが続く。咳に加えて単純な臨床特徴を用いて訓練されたすべてのモデルについて、咳のみの特徴を使用して訓練されたモデルを明らかに上回った。
【0100】
【表9】
【0101】
一つ抜き検証プロセスは、N個のソフトマックスモデルを結果として生じる。ここで、Nは、TrVデータセット内の患者の数である。N個のモデルから、本発明者らは、再びk平均クラスタリングアルゴリズムに従って最良のモデルのうちの1つを選択した。Table 8(表10)は、選択されたANNモデルのパフォーマンスを示す。
【0102】
【表10】
【0103】
Table 7(B)(表9)およびTable 8(表10)から、偽膜性喉頭炎、細気管支炎、URTI、および喘息のモデルはすべて、非常に感度が高く、同時に特異性であることが認められ得る。一方、肺炎モデルは、中程度の特異性と高い感度とを有する。したがって、本発明者らは、偽陽性のケースを排除し、その特異性を改善するために、肺炎モデル内の他の疾患モデルを使用することが可能であると仮定する。この仮定をテストするために、本発明者らは、喘息、初期URTI、偽膜性喉頭炎、および細気管支炎のモデルを、肺炎モデルにおけるポストスクリーナーとして順次適用した。他の疾患としてスクリーニングされた肺炎の真陽性のケースを回避するために、本発明者らは、スクリーニングモデルの咳インデックスに適用されるしきい値を使用した。このしきい値は、スクリーニングモデルが、被験者が非肺炎であることをどれくらい自信を持って示しているかを示す。スクリーニングしきい値は、訓練-検証データセットを使用して最適化された。
【0104】
【表11】
【0105】
Table 9(表11)(上記)は、様々な疾患ポストスクリーナーを肺炎モデルに順次適用した結果を示す。感度の軽い低下により、ANN肺炎モデルの特異性の増加が達成されることがわかる。感度の低下は、咳のみのモデルでは-9%、咳に加えて単純な臨床特徴のモデルでは-4%であった。特異性の増加は、咳のみのモデルでは18%、咳に加えて単純な臨床特徴のモデルでは16%であった。必須ではないが、本発明の実施形態において、ポストスクリーナーおよびプレスクリーナーが使用されてもよい。
【0106】
肺炎モデルにおけるポストスクリーナーの肯定的な効果に励まされて、本発明者らは、他の疾患モデルへのそれらの適用を調査した。本発明者らの分析は、細気管支炎およびLRTDのモデルの特異性のパフォーマンスが、偽膜性喉頭炎スクリーナーを使用することによって1~3%改善され得ることを示した。喘息および初期URTIのモデルでは、パフォーマンスの改善は見られない。偽膜性喉頭炎モデルのパフォーマンスは、すでに非常に高いので、スクリーナーは試されない。Table 10(表12)は、この調査の結果を示す。
【0107】
【表12】
【0108】
D.プロスペクティブテストデータセットにおけるソフトマックスモデルの性能
図3は、すべての訓練が終了し、すべてのパラメータが固定され、選択されたモデルがプロスペクティブテストの準備ができた後の診断アルゴリズムのフローチャート300を示す。これらのモデルは、訓練-検証データセットから完全に独立しているプロスペクティブデータセットにおいてテストされた。肺炎を除くすべてのモデルは、ターゲット疾患を予測することにおいて高い精度を達成した。すべてのモデルの中で、偽膜性喉頭炎および細気管支炎は、すべてのプロスペクティブ研究リスト全体で、咳のみのモデルと咳に加えて単純な臨床特徴のモデルの両方について、86%~100%の範囲で感度および特異性を達成する最良のものであることがわかった。喘息/RADモデルのパフォーマンスは、咳のみの特徴では中程度であったが、咳特徴への単純な臨床特徴の追加によって大幅に改善された(感度約93%および特異性約90%)。プレスクリーナーおよびポストスクリーナーブロックの詳細について、付録Eを参照されたい。
【0109】
1.付録A
1.臨床肺炎
米国臨床肺炎ケース定義-JHCおよびPMHからのデータセットにラベル付けする際に使用される
2.WHO放射線主要エンドポイント肺炎(PEP)
米国WHO放射線肺炎ケース定義-JHCおよびPMHからのX線データセットにラベル付けする際に使用される
3.偽膜性喉頭炎
米国臨床偽膜性喉頭炎ケース定義-JHCおよびPMHからのデータセットにラベル付けする際に使用される
4.細気管支炎
米国細気管支炎ケース定義-JHCおよびPMHからのデータセットにラベル付けする際に使用される
5.喘息(A)/反応性気道疾患(RAD)-A/RAD
米国A/RADケース定義-JHCおよびPMHからのデータセットにラベル付けする際に使用される
6.気管支炎
米国気管支炎ケース定義-JHCおよびPMHからのデータセットにラベル付けする際に使用される
7.上気道感染症
米国URTIケース定義-JHCおよびPMHからのデータセットにラベル付けする際に使用される
8.下気道疾患(LRTD)
米国LRTDケース定義-JHCおよびPMHからのデータセットにラベル付けする際に使用される
【0110】
2.付録B
咳からの特徴を計算する
咳特徴
本発明者らの方法は、咳音からのいくつかの数学的特徴の数の計算を必要とする。このセクションは、本発明者らが記録された咳音xの各サブセグメントxi、i=1、2、3から計算した特徴について説明する。
i)バイスペクトル周波数ケプストラム係数(BFCC、合計24個の特徴、咳セグメントの各部分から8つ)-信号の3次スペクトルは、バイスペクトルとして知られている[3]。パワースペクトル(自己相関に基づく2次スペクトル)とは異なり、バイスペクトルは、フーリエ位相情報を保存する。セグメントxiのバイスペクトルBxi12)は、(6)から
【0111】
【数2】
【0112】
のように推定され得、ここで、w(τ12)は、この書類で使用されている最小バイスペクトルバイアス上限ウィンドウなどのバイスペクトルウィンドウ関数であり、Cxi12)は、(2)を用いて推定されたxiの3次キュムラントであり、ω1、ω2は、デジタル周波数を示す。
【0113】
【数3】
【0114】
(7)において、Qは、考慮される3次の相関遅延の長さであり、xiは、ゼロ平均信号である。
【0115】
バイスペクトルは、2D信号である。しかしながら、線形信号について、軸に平行なスライス以外のバイスペクトルの任意の1D傾斜スライス、ω1=0、ω2=0、およびω12=0は、位相因子内の2Dバイスペクトル全体を特徴付ける十分な情報を担持することが証明され得る。この作業において、本発明者らは、ω12=ωによって定義される対角スライスP(ω)、すなわち、P(ω)=Bxi(ω,ω)を介してバイスペクトルにおいて利用可能な情報を捕捉する。
【0116】
次いで、フィルタ演算子を対角スライスP(ω)に適用し、本発明者らは、(8)を使用してバイスペクトル周波数ケプストラム係数を計算した。
【0117】
【数4】
【0118】
(8)において、ζは、その下限および上限カットオフ周波数としてωlおよびωhを有するフィルタ演算子を表し、gは、フィルタのゲイン定数である。(8)において、ζは、三角形フィルタ、矩形フィルタ、台形フィルタ、またはより複数な形状のフィルタであり得る。この書類の作業について、本発明者らは、g=1を有する矩形フィルタを使用し、Table 11(表13)に示すように、以下のωlおよびωhの値を使用して8つのBFCC係数を計算した。
【0119】
【表13】
【0120】
ii)非ガウス性スコア(NGS、合計3つの特徴、咳セグメントの各部分から1つ)-NGSスコアは、データxiの所与のセグメントの非ガウス性の数値測定である。正規確率プロットは、データのセットのガウス性の視覚的測定を取得するために使用され得、NGSスコアは、回帰分析に基づいて非ガウス性を定量化する方法である。本発明者らは、NGSスコアを推定するために(9)を使用し、ここで、pおよびqは、参照正常データおよび分析データ(xi)の正規確率プロットを表す。記号Nは、確率プロットにおいて使用されるデータポイントの数である。
【0121】
【数5】
【0122】
iii)フォルマント周波数(合計12個の特徴、咳セグメントの各部分から4つ)-音声分析において、フォルマント周波数(FF)は、声道の共鳴と呼ばれる。咳の分析において、咳音の発生に寄与する気道全体の共鳴がフォルマント構造において表されることを期待することは、合理的である。これのための1つの古典的な例は、呼気性喘鳴である。粘液の存在も、気道の音響特性を変化させる可能性がある。本発明者らは、最初の4つのフォルマント(F1、F2、F3、F4)を本発明者らの候補特徴セット内に含めた。本発明者らは、咳セグメントxiの線形予測コーディング(LPC)スペクトルをピークピッキングすることによって、F1~F4を計算した。この作業のために、本発明者らは、Levinson-Durbin再帰的手続きを介して決定されたパラメータを用いて14次LPCモデルを使用した。
【0123】
iv)対数エネルギー(LogE、合計3つの特徴、咳セグメントの各部分から1つ)-すべてのサブセグメントxiに関する対数エネルギーは、(10)を使用して計算された。
【0124】
【数6】
【0125】
(4)において、εは、0の対数の不注意な計算を防ぐために追加された任意の小さい正の定数である。
【0126】
v)ゼロ交差(Zcr、合計3つの特徴、咳セグメントの各部分から1つ)-ゼロ交差の数は、各サブセグメントxiについてカウントされた。
【0127】
vi)尖度(Kurt、合計3つの特徴、咳セグメントの各部分から1つ)-尖度は、xiの確率密度分布がどれくらいピーキーであるかの尺度である。それは、xiの第4の中心モーメントであり、(11)を使用して計算され得、ここで、μおよびσは、それぞれ、xiの平均および標準偏差を示す。
【0128】
【数7】
【0129】
vii)メル周波数ケプストラム係数(MFCC、合計93個の特徴、咳セグメントの各部分から31個)-MFCCは、音声認識システムにおいて広く使用されている。MFCCは、音声信号の分散の非言語的ソースにいくらかの回復力を提供する。それらは、分類器の訓練を容易にする直交性の特徴も提供する。MFCCの計算は、短期パワースペクトルの推定と、メル周波数スケールにマッピングすることと、次いで、ケプストラム係数を計算することとを含む。本発明者らの作業において、本発明者らは、31個のMFCC係数を本発明者らの特徴セット内に含めた。
【0130】
viii)シャノンエントロピー(ShE、合計3つの特徴、咳セグメントの各部分から1つ):咳音は、気道の様々なサブ構造からの寄与を表す複雑な信号である。これらの構成要素のうちのいくつかは、疑似周期構造を表示し、他のものは、ランダムな確率特性を示す。この作業において、本発明者らは、これらの特徴を捕捉するためにシャノンエントロピーを計算した。すべてのサブセグメントxiのシャノンエントロピー(ShE)は、(12)を使用して計算された。
【0131】
【数8】
【0132】
ix)ウェーブレット特徴(WvL、各咳から合計13個の特徴):本発明者らの研究は、肺炎の診断におけるウェーブレット特徴の有用性を示した[ieee会報論文を参照]。この作業について、本発明者らは、各咳セグメントから13個のウェーブレット特徴を計算した。詳細について、[2]を参照されたい。
【0133】
3.付録C
1.呼気性喘鳴シグネチャ生成器
子どもにおける呼気性喘鳴は、多くの呼吸器疾患の一般的な症状である。呼気性喘鳴は、呼吸中に生成されたかん高いひゅーひゅー鳴る音として定義される。呼気性喘鳴は、最も一般的には喘息に関連するが、細気管支炎、気管支炎、肺炎、嚢胞性線維症、および異物の吸引などの他の呼吸器疾患においても存在する。それは、鑑別診断、および、上気道感染症から下気道疾患を分離する際にしばしば使用される。さらなる詳細については、付録A:ケース定義において利用可能である。
【0134】
呼気性喘鳴の有無は、臨床コミュニティによって実践されているように、臨床決定ツリーにおける重要な決定ノードである。しかしながら、それを臨床的に検出することは、必ずしも簡単な仕事ではない。呼気性喘鳴は、気質的な現象であり、生理学/病理学における根本的な変化の二次的影響である。検査の特定の時間において呼気性喘鳴を検出する医師の能力は、呼気性喘鳴がその時間に存在し、医師が聴診器を肺の上の適切な場所に配置すること、呼気性喘鳴音が肺から胴体の表面に伝播する間にエネルギー損失を乗り切るのに十分な強度で生成されること、および、臨床医が音を知覚し、それを検出するスキルを有することができることを含む、多くの要因に依存する。関心の根底にある生理学的理由は、様々な理由による気道の狭窄であり、呼気性喘鳴は、その現象の代用の尺度である。いくつかの状況において、呼気性喘鳴は、疾患の重要度による気流の制限により、重度の疾患であっても呼気性喘鳴が発生しない場合がある(例えば、重症の喘息/RADにおける「サイレントチェスト」)。
【0135】
呼気性喘鳴の重症度を捕捉するために、臨床医は、呼気性喘鳴重症度スコア(WSS)の多くの様々なバージョンを定義している。本発明者らの臨床協力者のバージョンは、WSSを計算するために3つの異なるサブスコアを使用する。これらは、呼気性喘鳴の存在およびそれが発生する呼吸相、呼吸数、副筋肉の使用である。本発明者らは、咳だけを使用して、または、親が観察することができる単純なサインで増強した咳を使用して、WSSを捕捉するために1つのシグネチャを開発した。本発明者らのWSSモデルは、0と1との間で変化する連続シグネチャスケール(LRM出力)を使用して、高WSS(5~9)を低WSSスコア(0、1)から分離するという目標において訓練された。
【0136】
2.肺機能シグネチャ生成器
肺機能検査技法、特に肺活量測定は、利用可能な場合、喘息および慢性閉塞性肺疾患(chronic obstructive pulmonary disease:COPD)などのいくつかの呼吸器疾患の確定診断において使用される。肺活量測定は、FEV1およびFVCなどの数値測定を提供する。肺活量測定時に収集された咳を使用して、本発明者らは、高FEV1対低FEV1、高FEV1/FVC対低FEV1/FVCなどの、咳ベースのシグネチャモデルを構築した。訓練されると、それらのシグネチャモデルは、次いで、(0,1)の間の出力を提供するシグネチャ生成器としてすべての患者において使用される。
【0137】
4.付録D
臨床サインベースのシグネチャおよび診断モデル
臨床医は、いくつかの呼吸器疾患を診断する際に臨床サイン(彼らが観察したまたは親が報告した)に大きく依存する。以前、本発明者らは、臨床サインのみに基づいて肺炎を診断するための最良の臨床特徴(インドネシアの研究)を特定するためにモデルを調査および構築した。本発明者らはまた、少数の咳を臨床サインモデルに追加すると何が起こるのかを調査した。
【0138】
本発明者らは、図Bに示すアーキテクチャに従って、呼吸器疾患を診断するために(親によって報告され得るサインを使用して)臨床サインのみのモデルを構築した。特定の実施形態において、LRMモデリングに基づいてシグネチャを構築するために、発熱、呼気性喘鳴、鼻水、および、年齢、性別などのサインが使用される。LRMモデルは、分類別のサインをシグネチャ生成器レベルにおける連続出力に変換し、それらの連続出力は、次いで、分類器ブロックのレベルにおいて分類される。他の実施形態において、ANNなどの他の分類器方式が同じ目的のために使用され得る。本発明者らはまた、本発明者らがインドネシアの研究において提出された臨床サインの特許において行ったように、パフォーマンスを改善するために臨床サインモデルに咳を追加することができる。さらに、本発明者らは、深層学習手法を使用して分類を改善するために、臨床サインシグネチャを使用することができる。
【0139】
ニューラル深層学習アーキテクチャのプロセスは、ここで論じる2つのステージに分離される。
【0140】
ステージ1-層ごとの訓練-第1のステージにおいて、本発明者らは、特定のタスクを行うために3つのタイプのニューラルネットワークを個別に訓練した。
【0141】
ステージ1-ニューラルネットタイプ1。特徴符号化ニューラルネット(FeNN):ここで、本発明者らは、オートエンコーダの概念を実装する。オートエンコーダは、出力においてその入力を再現するように訓練されたフィードフォワードニューラルネットワークである。オートエンコーダにおける隠れ層は、入力データを表すために使用され得るコードを記号化する。訓練後、エンコーダステージ出力は、次のステップにおいて使用される。図5は、特徴マッピングのために訓練されたオートエンコーダの例を示す。それは、入力特徴ベクトルのサイズを表す144の入力サイズを有し、隠れ層(エンコーダ)サイズは、10であり、出力層(デコーダ)サイズは、入力層と同じサイズである144である。
【0142】
ステージ1-ニューラルネットタイプ2。シグネチャニューラルネット(Signature Neural Net:SgNN):エンコーダからの出力は、セクション「シグネチャ生成器ブロック」において説明したようにシグネチャを生成するようにフィードフォワードニューラルネットワークを訓練するために使用される。このシグナトリANNは、隠れ層と出力層におけるソフトマックスニューロンとを持たない。ソフトマックスニューロンを使用することの利点は、LRモデルと同様に0と1との間で変化する確率関数になることであるが、ここでは、入力から出力へのマッピングは、非線形である。図6は、シグネチャニューラルネットの例を示す。このネットワークへの入力は、エンコーダからである。このニューラルネットワークは、疾患固有のシグネチャを生成するように訓練される。26個のシグネチャのすべてにおいて、ニューラルネットは、Table 1(表1)においてリストされたシグネチャモデルのすべてについて訓練された。Table 12(表14)は、シグナトリニューラルネットモデルを使用して、疾患の咳から正常な咳を分類する際の一つ抜き検証結果を表す。Table 13(表15)は、シグナトリニューラルネットモデルの一つ抜き検証パフォーマンスを示す。
【0143】
ステージ1-ニューラルネットタイプ3。分類ニューラルネット(Classification Neural Net:CaNN):シグネチャニューラルネットの出力は、次いで、最終的な分類ソフトマックスニューラルネットを訓練するために使用された。このニューラルネットワークは、分類器ブロック118を参照して説明したものと類似している。
【0144】
好ましい実施形態において、本発明者らは、すべてのターゲット疾患サブグループ、細気管支炎、偽膜性喉頭炎、喘息/RAD、肺炎、および下気道疾患を識別するように単一のソフトマックスANNモデルを訓練した。CaNNを訓練するために使用されたシグナトリニューラルネットは、{RHw,Lw、RA,R、RA,C、RA,P、RA,Bo、RA,Bc、RA,U、RA,Nr、RP,Nr、RBo,Nr、RBC,Nr、RC,Nr、RU,Nr}であった。出力層において、kの寸法は、7ニューロンに設定され、各ニューロンは、1つの疾患サブグループ、細気管支炎、喘息/RAD、肺炎、気管支炎、pURTI、偽膜性喉頭炎、および正常に対応する。
【0145】
ステージ2-微調整ステージ、このステージにおいて、ステージ1からの個別に訓練されたニューラルネットワークは、図7に示すスタック型深層ニューラルネットワーク(DNN)を作成するように互いに接続された。図7は、第1の層が特徴符号化ニューラルネットを表し、第2の層がシグネチャニューラルネットを表し、第3の出力層が分類ニューラルネットを表す、DNNを示す。
【0146】
DNNは、次いで、DNNネットワークパラメータを微調整するために、制限された数の訓練エポックを用いて、訓練検証データセットを使用して再訓練された。DNNの微調整は、一つ抜き検証技法に従って行われた。
【0147】
Table 16(表18)は、DNNモデルを使用して患者を分類するための一つ抜き検証結果を表す。
【0148】
5.付録E
プレスクリーナーおよびポストスクリーナー
本発明のさらなる実施形態について、図4および図5における2つの頁にわたって示された診断モデル300のブロック図を参照して説明する。診断モデル300は、図1の第1の実施形態100(図1を参照)の疾患シグネチャ生成ブロック114と分類器ブロック118とを備え、これは、一次モデルと呼ばれる場合がある。しかしながら、診断モデル300の第2の実施形態は、診断方法全体の診断パフォーマンスを改善するために、プレスクリーナーブロック111およびポストスクリーナーブロック121も含む。
【0149】
i)プレスクリーナーブロック111
プレスクリーナーブロック111の機能は、一次モデルによる分析を意図していない被験者をスクリーニングすることである。
【0150】
一例として、一次モデルのタスクが、医療施設に通っている被験者の母集団における他の所与の疾患の混合物から特定の疾患、例えば、細気管支炎を診断することとして定義される状況を考察する。診断アルゴリズム全体の結果は、「細気管支炎yes/no?=no」または「細気管支炎yes/no?=yes」である。この状況におけるプレスクリーナー111は、健常者を細気管支炎のケースから分離し、さらなる分析のためにケースを一次モデルに送る必要なく、「細気管支炎yes/no?=no」として結果を報告するように設計され得る。
【0151】
スクリーナーブロック111におけるスクリーナーモデル4a、...、4nの各々は、一次モデルにおいて対象とされている実際の疾患を有する人が非疾患ラベルを得ることによってさらなる分析から誤ってスクリーニングされないことを確認するために、高く設定された決定しきい値を有する。
【0152】
ii)ポストスクリーナーブロック121
ポストスクリーナーブロック121の機能は、一次モデルの支配的な偽陽性の検出を目標とし、修正を行うことによって、一次モデルの診断パフォーマンスを改善することである。
【0153】
一例として、一次モデルのタスクが、医療施設に通っている被験者の母集団における他の所与の疾患の混合物から特定の疾患、例えば、細気管支炎を診断することとして定義される状況を考察する。診断アルゴリズム全体の結果は、「細気管支炎yes/no?=no」または「細気管支炎yes/no?=yes」である。本発明者らは、一次モデルにおいて偽膜性喉頭炎患者が支配的な偽陽性グループとして存在することを知っているとする。すなわち、「細気管支炎yes/no?=yes」のグループにおいて、本発明者らは、偽膜性喉頭炎の臨床診断でかなりの数の被験者を見出す。このシナリオにおいて、本発明者らの手法は、偽膜性喉頭炎被験者および細気管支炎被験者の混合物から偽膜性喉頭炎患者を選び取るように訓練されたポストスクリーナーモデル{細気管支炎に対する偽膜性喉頭炎}を構築することである。本発明者らは、次いで、本発明者らの{細気管支炎に対する偽膜性喉頭炎}モデルで「細気管支炎yes/no?=yes」グループを処理し、検出された偽膜性喉頭炎患者を一次モデル出力の「細気管支炎yes/no?=no」の側に移動する。
【0154】
必要性と有効性とに応じて、複数のポストスクリーナーモデル6a、...、6mを所与の一次モデルに適用することが可能である。ポストスクリーナーが所与の一次モデルにおいて役に立たないかまたは必要でない場合もある。必要であるとき、一次モデルにおいて対象とされている実際の疾患を有する人が診断決定の反対側に誤って移動しないことを確認するために、決定しきい値が高く設定されて、スクリーナーモデルは、控えめに使用される。
【0155】
6.付録F
モデル開発における特徴削減
本明細書で論じる診断モデルは、利用可能な臨床データセットに対して交差検証(CV)方法を使用して開発された。利用可能なデータに対して、K分割交差検証方法(K=10)および一つ抜き検証(LOOV)方法が使用された。これらの方法の両方は、それらの利点および欠点を有する。10分割CVは、新しいデータセットに対して推定の分散が小さく偏りが大きいモデルにつながる傾向があり(以前に見られなかったデータセットにおける一般化パフォーマンス)、LOOVは、新しいデータセットに対して分散が大きく偏りが小さいモデルにつながる傾向がある。
【0156】
利用可能なデータセットのより小さいサイズのため、診断モデルを開発する際に、10分割よりもLOOV方法が使用されることがしばしば好まれた。モデルにおけるより高い一般化分散を補償するために、モデルの過剰適合のより低いリスクにつながる、モデルの構築が可能な限り小さくなることを目標とする特徴削減プロセスが開発された。手順について以下に説明する。
【0157】
特徴最適化/削減は、堅牢な分類器を構築するために関連する特徴のサブセットを選択する技法である。最適な特徴選択は、特徴のすべての可能なサブセットの徹底的な探索を必要とする。しかしながら、本発明者らが候補特徴として使用する多数の特徴に対してそうすることは、実際的ではない。したがって、ロジスティック回帰モデル(LRM)を使用してシグネチャモデル設計段階においてシグネチャ特徴を決定するために、p値に基づいて代替手法が使用された。LRM設計において、各特徴についてp値が計算され、それは、その特徴がモデルにとってどれくらい重要であるかを示す。重要な特徴は、低いp値を有し、LRMのその特性は、訓練段階中のモデルにおいて、分類を容易にする特徴の最適な組合せを決定するために使用された。
【0158】
取られた手法は、データセット全体にわたるすべての特徴に関する平均p値を計算し、次いで、しきい値Pminよりも小さい平均p値を有する特徴を選択することから構成された。詳細な方法について、以下のステップにおいて説明する。
1.FN=[F1,F2,F3,...,Fn]がすべてのN個の特徴の初期セットを表すとする。
2.FNを使用し、一つ抜き検証(またはK分割)プロセスに従ってロジスティック回帰モデル(LRM)を訓練する。すべての特徴について平均p値を計算する。
PN=[Pf1,Pf2,Pf3,...,Pfn] (1)
(1)において、PNは、すべてのN個の特徴の初期セットに関連する平均値のセットを表す。
3.平均p値がPths=POよりも小さい特徴を選択することによって、FNから特徴の新しいサブセットF'Nを作成する。
4.一つ抜き検証(またはK分割)プロセスに従って、特徴のF'Nセットを使用してLRMを訓練する。特徴のF'Nセットについて平均p値を計算する。
5.平均p値がPthsよりも小さい特徴を選択することによって、F'Nから特徴の新しいサブセットF"Nを作成する。
6.F"NのサイズがF'Nに等しい場合、すなわち、F'N内のすべての特徴がPthsよりも小さい平均p値を有する場合、式(2)を使用してPthsを変更する。
Pths=Pths-c (2)
ここで、c<<Pthsである。
7.F"NセットのサイズがF'Nセットよりも小さくなるまで、ステップ6を繰り返す。
8.F"N特徴のサイズがFminよりも小さくなるまで、Pthsを元の値にリセットし、ステップ4~7を繰り返す。
9.選択された特徴モデルのすべてのサブセットについて、パフォーマンス(感度、特異性、およびカッパ値)が計算される。特徴の最適なサブセットを選び取るために、本発明者らは、以下の方式に従った。
a.モデルパフォーマンスにおいて最大のカッパ値を有する特徴のサブセットを選択する。このサブセットをFaとする。
b.ここで、(感度/特異性に関して)そのパフォーマンスが特徴のFaサブセットによるモデルパフォーマンスのq%以内である特徴のすべてのサブセットを識別する。
c.特徴の識別されたサブセットのこのプールから、そのサイズが最小であるが、Zよりも大きく、Faのサイズよりも小さい1つのサブセットを選択する。これが満たされない場合、最適な特徴サブセットとしてFaを選択する。
【0159】
1つの特定の実施形態において、以下のパラメータ値が、上記で与えたアルゴリズムで使用された。咳のみのモデルに関するFNのサイズは、157である(すなわち、LRMへの157個の入力特徴が開始された)。咳に加えて臨床サインモデルに関するFNのサイズは、157以上であり、使用された臨床特徴の数に依存する。
Pths(ステップ3における)=PO=0.20
c(ステップ6における)=0.001
Fmin(ステップ8における)=10
Z(ステップ9における)=10
【0160】
7.1つの特定の実施形態において、上記で与えたアルゴリズムで以下のパラメータ値が使用された。方法で得られた結果を以下のTable 12(表14)およびTable 13(表15)に示す。
【0161】
【表14】
【0162】
【表15】
【0163】
【表16】
【0164】
【表17】
【0165】
【表18】
【0166】
参考文献
以下の文書は、参照によりその全体が本明細書に組み込まれる。
1.Abeyratne、U.R.、ら、Cough sound analysis can rapidly diagnose childhood pneumonia. Annals of biomedical engineering、2013年.41(11):2448~2462頁
2.Kosasih、K.、ら、Wavelet augmented cough analysis for rapid childhood pneumonia diagnosis. IEEE Transactions on Biomedical Engineering、2015年.62(4):1185~1194頁
3.Abeyratne、U.Blind reconstruction of non-minimum-phase systems from 1-D oblique slices of bispectrum.1999年.IET.
4.Hinton GE、Salakhutdinov RR.Reducing the dimensionality of data with neural networks science.2006年7月28日;313(5786):504-7
【0167】
法令に従って、本発明は、構造的または方法論的特徴に多かれ少なかれ特有の言語で記述された。「備える」という用語、ならびに、「備えている」および「から構成される」などのその変形は、全体を通して、包括的な意味で使用され、任意の追加の特徴の排除には使用されない。本明細書で説明した手段は、本発明を実施する好ましい形態を備えるので、本明細書は、図示または記載された特定の特徴に限定されないことが理解されるべきである。したがって、本明細書は、当業者によって適切に解釈される添付の特許請求の範囲の適切な範囲内のその形態または修正形態のいずれかにおいて特許請求される。
【0168】
明細書および特許請求の範囲(存在する場合)を通して、文脈上他に要求されない限り、「実質的に」または「約」という用語は、用語によって修飾される範囲の値に限定されないことが理解されよう。
【0169】
本発明の特定の態様、実施形態、または例に関連して説明された特徴、整数、特性、化合物、化学的部分、または化学基は、それらと矛盾しない限り、本明細書に記載の任意の他の態様、実施形態、または例に適用可能であると理解されるべきである。
【0170】
本発明の任意の実施形態は、単なる例示であることを意味し、本発明への限定であることを意味しない。したがって、本発明の要旨および範囲から逸脱することなく、説明した任意の実施形態に様々な他の変更および修正がなされ得ることが理解されるべきである。
【符号の説明】
【0171】
2a~2n 決定マシン、LRモデル、LRMモデル、モデル
100 フローチャート
101 患者
102 患者音
104 マイクロフォン
106 ボックス
108 セグメント化ブロック
110a CG1 咳音
110b CG2 咳音
111 プレスクリーナーブロック、プレスクリーナー、スクリーナーブロック
112 咳特徴計算ブロック、咳特徴計算ボックス、ボックス、
114 疾患シグネチャ生成、シグネチャ生成ブロック、ボックス、信号生成器ブロック、シグネチャブロック、ブロック
116 シグネチャ選択、シグネチャ選択ブロック
118 シグネチャ分類器ブロック、分類器ブロック、ブロック
120 診断指示ブロック、出力ボックス
121 ポストスクリーナーブロック
200 構造
201 d次元入力層
203 ニューロン、出力層
205 k次元出力層、出力層
207 ニューロン
図1
図2
図3
図4
図5
図6
図7
【手続補正書】
【提出日】2023-10-04
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
患者の気道の1つまたは複数の疾患に関する予兆情報を提供するための、プロセッサによって実行される、方法であって、前記方法が、
前記患者から取得した咳音を処理して、咳セグメントから1つまたは複数の咳音特徴を表す咳音特徴信号を生成する、ステップと、
前記咳音特徴信号に基づいて1つまたは複数の疾患シグネチャ(signature)を取得するステップと、
前記咳セグメントを前記疾患の1つまたは複数を示すものとみなすために、前記1つまたは複数の疾患シグネチャを分類するステップと、
を含み、
前記咳音特徴信号に基づいて前記1つまたは複数の疾患シグネチャを取得する前記ステップが、複数の事前訓練された疾患シグネチャ決定マシンの各々に前記咳音特徴を適用するステップを含み、前記複数の事前訓練された疾患シグネチャ決定マシンの少なくとも1つが、前記咳音特徴を、特定の疾患もしくは非疾患状態のいずれかに対応するものとして分類するように事前訓練され、前記複数の事前訓練された疾患シグネチャ決定マシンの少なくとも他の1つが、前記咳音特徴を、第1の特定の疾患もしくは前記第1の特定の疾患とは異なる第2の特定の疾患に対応するものとして分類するように事前訓練されている、方法。
【請求項2】
前記1つまたは複数の疾患サイン決定マシンが、各々、訓練されたロジスティック回帰モデル(LRM)を備える、請求項1に記載の方法。
【請求項3】
各々の訓練されたロジスティック回帰モデル(LRM)が、前記LRMにとって重要であると判断された特徴である訓練特徴の削減されたセットを使用して訓練され、それによって前記LRMの過剰訓練を回避する、請求項2に記載の方法。
【請求項4】
前記訓練特徴が、すべての訓練特徴について平均p値を計算し、次いで、しきい値Pminよりも小さい平均p値を有する前記訓練特徴を選択することによって、前記LRMにとって重要な訓練特徴であると判定される、請求項3に記載の方法。
【請求項5】
各LRMの変数が、前記咳音特徴信号の値であり、前記LRMからの出力値が、
前記咳音特徴信号が前記特定の疾患もしくは前記非疾患状態のいずれかに対応するものの場合であって、前記非疾患状態に対応するものの場合に、前記第1の特定の疾患を示す咳の予測確率を備え、
前記咳音特徴信号が前記第1の特定の疾患もしくは前記第2の特定の疾患に対応するものの場合であって、前記第2の特定の疾患に対応するものの場合に、前記第1の特定の疾患を示す咳の予測確率を備える、
請求項2から4のいずれか一項に記載の方法。
【請求項6】
前記1つまたは複数の疾患サイン決定マシンが、1つまたは複数の訓練されたニューラルネットワークを含む、請求項1に記載の方法。
【請求項7】
前記咳音特徴信号に加えて、臨床患者測定値を変数として前記疾患サイン決定マシンに適用するステップを含む、請求項1から6のいずれか一項に記載の方法。
【請求項8】
前記咳セグメントを前記疾患の1つまたは複数を示すものとしてみなすために、前記1つまたは複数の疾患サインを選択する前記ステップが、すべての疾患グループをカバーするように訓練された信号分類器に前記1つまたは複数の前記咳音特徴信号を適用するステップを含む、請求項1から7のいずれか一項に記載の方法。
【請求項9】
前記咳セグメントを前記疾患の1つまたは複数を示すものとしてみなすために、前記1つまたは複数の疾患サインを選択する前記ステップが、関心のある疾患を認識するように各々訓練された多数の分類器に前記1つまたは複数の前記咳音特徴信号を適用するステップを含む、請求項1から7のいずれか一項に記載の方法。
【請求項10】
前記1つまたは複数の疾患サインを選択する前記ステップが、以下の疾患、細気管支炎(SBO)、偽膜性喉頭炎(SC)、喘息/RAD(SA)、肺炎(SP)、下気道疾患(SLRTD)、初期URTI
(Su)のうちの1つとして前記咳音特徴信号を分類するステップを含む、請求項8または9に記載の方法。
【請求項11】
d個の疾患サインが、前記咳音特徴信号に基づいて1つまたは複数の疾患サインを選択する前記ステップによって選択され、対応して、前記多数の分類器として使用される人工ニューラルネットワーク(ANN)が、前記疾患サインの各々に対応する1つの入力ニューロンを有するd次元入力層を有する、請求項9に記載の方法。
【請求項12】
前記ANNが、k次元出力層を有し、前記k次元出力層内の各ニューロンが、疾患に対応する確率を出力する、請求項11に記載の方法。
【請求項13】
前記1つまたは複数の疾患サインを選択する前記ステップが、複合有効確率測度PQ'を、
P'Q=PQ(1-PZ)
としてコンパイルするステップを含み、ここで、PQが、疾患Qに属する前記患者の確率の指標を備え、PZが、疾患Zに属する前記患者の確率の指標を備え、それによって、積PQ(1-PZ)が、前記患者が疾患Qに属し、かつ疾患Zに属さない複合イベントの確率を示す、請求項1から12のいずれか一項に記載の方法。
【請求項14】
ターゲット疾患の各々に関する咳インデックスを計算するステップを含み、ターゲット疾患に関する患者の前記咳インデックスが、前記ターゲット疾患を示すものとして分類された前記患者の咳の、前記患者について分析された咳の総数に対する比として計算される、請求項10に記載の方法。
【請求項15】
支配的な偽陽性を検出するために、前記1つまたは複数の疾患サインを選択するステップからの選択に1つまたは複数のポストスクリーニングテストを適用するステップを含む、請求項1から14のいずれか一項に記載の方法。
【請求項16】
前記検出された偽陽性に基づいて、前記1つまたは複数の疾患サインを選択するステップを調整するステップをさらに含む、請求項15に記載の方法。
【請求項17】
診断された特定の疾患に基づいて疾患診断に関する指示を提示するステップをさらに含む、請求項1から16のいずれか一項に記載の方法。
【外国語明細書】