(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-07-12
(54)【発明の名称】デジタル聴診器によって生成された音声データの分析を通じた健康に関する洞察の導出
(51)【国際特許分類】
A61B 5/08 20060101AFI20230705BHJP
A61B 7/04 20060101ALI20230705BHJP
G10L 25/18 20130101ALI20230705BHJP
G10L 25/21 20130101ALI20230705BHJP
G10L 25/24 20130101ALI20230705BHJP
G10L 25/66 20130101ALI20230705BHJP
【FI】
A61B5/08
A61B7/04 K
A61B7/04 N
G10L25/18
G10L25/21
G10L25/24
G10L25/66
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022570115
(86)(22)【出願日】2021-05-14
(85)【翻訳文提出日】2023-01-16
(86)【国際出願番号】 US2021032595
(87)【国際公開番号】W WO2021231958
(87)【国際公開日】2021-11-18
(32)【優先日】2020-05-15
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】522446063
【氏名又は名称】ヒロイック-フェイス メディカル サイエンス カンパニー リミテッド
【氏名又は名称原語表記】HEROIC-FAITH MEDICAL SCIENCE CO.,LTD.
【住所又は居所原語表記】The Grand Pavilion Commercial Centre,Oleander Way,802 West Bay Road,P.O.Box 32052,Grand Cayman,KY1-1208(KY)
(74)【代理人】
【識別番号】110002734
【氏名又は名称】弁理士法人藤本パートナーズ
(72)【発明者】
【氏名】チェン,ユアン ルェン
(72)【発明者】
【氏名】シュー,フーシュン
(72)【発明者】
【氏名】ホアン,ジィ-デェ
(72)【発明者】
【氏名】ホアン,シャン-ルァン
【テーマコード(参考)】
4C038
【Fターム(参考)】
4C038SS08
4C038SV05
4C038SX05
(57)【要約】
【要約】
本願では、電子聴診器システムによって生成された音声データの分析を通じて患者の健康に関する洞察を導出するためのコンピュータプログラム、及び、関連するコンピュータ実装技術を提示する。診断プラットフォームは、電子聴診器システムによって生成された音声データを検査して、患者の健康に関する洞察を得る役割を担い得る。診断プラットフォームは、機械学習又は人工知能に依存するヒューリスティック、アルゴリズム又はモデルを採用してもよく、それによって、医療専門家による視覚分析に依存する従来のアプローチよりも大幅に優れた方法で聴診を実行し得る。
【選択図】
図1A
【特許請求の範囲】
【請求項1】
呼吸数を計算する方法であって、
患者の肺によって生成された音の記録を表す音声データを取得するステップと、
訓練されたモデルによる分析に備えて前記音声データを処理するステップと、
時間順に並べられたエントリを含むベクトルを生成するために、前記訓練されたモデルを前記音声データに適用するステップであって、
前記ベクトル内の各エントリが、前記音声データの対応するセグメントが呼吸イベントを表しているかどうかを示す、ステップと、
前記ベクトルを検査することによって、(i)第1の呼吸イベントと、(ii)前記第1の呼吸イベントに続く第2の呼吸イベントと、(iii)前記第2の呼吸イベントに続く第3の呼吸イベントとを識別するステップと、
(a)前記第1の呼吸イベントと前記第2の呼吸イベントとの間の第1の期間、及び、(b)前記第2の呼吸イベントと前記第3の呼吸イベントの間との第2の期間を決定するステップと、
前記第1の期間と前記第2の期間に基づいて、呼吸数を計算するステップと
を含む、方法。
【請求項2】
前記ベクトル内の各エントリが、前記音声データの異なるセグメントに対応しており、前記ベクトル内の全てのエントリが、前記音声データの持続時間の等しいセグメントに対応している、請求項1に記載の方法。
【請求項3】
各呼吸イベントが、前記ベクトル内の少なくとも2つの連続するエントリであって、前記音声データの対応するセグメントが呼吸イベントを表していることを示している少なくとも2つの連続するエントリに対応している、請求項1に記載の方法。
【請求項4】
前記処理するステップが、
前記音声データにハイパスフィルタを適用するステップと、
前記音声データに基づいて、(i)スペクトログラムと、(ii)一連のメル周波数ケプストラム係数(MFCC)と、(iii)前記スペクトログラムの異なる周波数帯域にわたって合計されたエネルギーを表す一連の値を生成するステップと、
前記スペクトログラム、前記一連のMFCC及び前記一連の値を連結して、特徴マトリクスとするステップと
を含む、請求項1に記載の方法。
【請求項5】
前記処理するステップが、
各エントリが0と1との間の値を有するように、前記特徴マトリクスにおいて最小最大正規化を実行するステップ
をさらに含む、請求項4に記載の方法。
【請求項6】
前記ハイパスフィルタのカットオフ周波数によって、前記患者の別の内臓によって生じた音が、前記音声データからフィルタリングされる、請求項4に記載の方法。
【請求項7】
所定の数未満のエントリによって区切られた同じタイプの呼吸イベントに対応する一対のエントリを識別するために、前記ベクトルを検査するステップと、
前記一対のエントリが単一の呼吸イベントを表していることを示すように、前記一対のエントリをマージするステップと
をさらに含む、請求項1に記載の方法。
【請求項8】
前記一対のエントリは、前記音声データの対応するセグメントが吸息を表していることを示す、請求項7に記載の方法。
【請求項9】
前記一対のエントリは、前記音声データの対応するセグメントが呼息を表していることを示す、請求項7に記載の方法。
【請求項10】
所定の長さ未満の同じタイプの呼吸イベントに対応する一連の連続エントリを識別するために、前記ベクトルを検査するステップと、
前記一連の連続したエントリによって表される呼吸イベントを削除するように、前記一連の連続したエントリ内の各エントリに関連付けられたラベルを調整するステップと
をさらに含む、請求項1に記載の方法。
【請求項11】
前記第1の期間は、前記第1の呼吸イベントの開始から前記第2の呼吸イベントの開始にまで及んでおり、前記第2の期間は、前記第2の呼吸イベントの開始から前記第3の呼吸イベントの開始にまで及んでおり、前記計算するステップは、
120を前記第1の期間と前記第2の期間の合計で除算することによって、前記呼吸数を確立するステップを含んでいる、請求項1に記載の方法。
【請求項12】
非一時的媒体であって、該媒体には、コンピューティングデバイスのプロセッサによって実行された際に、該コンピューティングデバイスに対して、
時間順に並べられたエントリを含むベクトルを取得する操作であって、前記ベクトル内の各エントリが、音声データの対応するセグメントが呼吸イベントを表しているかどうかに関する予測を示す、操作と、
前記ベクトルの前記エントリを検査することによって、(i)第1の呼吸イベントと、(ii)第2の呼吸イベントと、(iii)第3の呼吸イベントとを識別する操作と、
(a)前記第1の呼吸イベントと前記第2の呼吸イベントとの間の第1の期間、及び、(b)前記第2の呼吸イベントと前記第3の呼吸イベントの間との第2の期間を決定する操作と、
前記第1の期間と前記第2の期間に基づいて、呼吸数を計算する操作と
を含む操作を実行させる複数の命令が記憶されている、非一時的媒体。
【請求項13】
各呼吸イベントが、前記患者による吸息である、請求項12に記載の非一時的媒体。
【請求項14】
前記第1、第2及び第3の呼吸イベントのそれぞれが、前記ベクトル内の一連の連続するエントリであって、(i)所定の長さを超えており、かつ、(ii)前記音声データの前記対応するセグメントが、呼吸イベントを表していることを示している一連の連続するエントリに対応している、請求項12に記載の非一時的媒体。
【請求項15】
前記計算する操作が、
120を前記第1の期間と前記第2の期間の合計で除算することによって、前記呼吸数を確立する操作を含んでいる、請求項12に記載の非一時的媒体。
【請求項16】
前記操作が、
前記音声データに対応するスペクトログラムを含むインタフェースを表示させる操作と、
医療専門家による診断上の決定を容易にするために、前記インタフェースに前記呼吸数を掲示する操作と
をさらに含んでいる、請求項12に記載の非一時的媒体。
【請求項17】
前記操作が、
前記呼吸数を下限閾値と比較する操作と、
前記呼吸数が前記下限閾値を下回っているという決定に応答して、通知を生成する操作と
をさらに含んでいる、請求項12に記載の非一時的媒体。
【請求項18】
前記操作が、
前記呼吸数を上限閾値と比較する操作と、
前記呼吸数が前記上限閾値を超えているという決定に応答して、通知を生成する操作と
をさらに含んでいる、請求項12に記載の非一時的媒体。
【発明の詳細な説明】
【技術分野】
【0001】
様々な実施形態は、電子聴診器システムによって生成された音声データの分析を通じて患者の健康に関する洞察を導出するためのコンピュータプログラム、及び、関連するコンピュータ実装技術に関する。
【背景技術】
【0002】
歴史的に、音響聴診器は、生体内から発生する内部音を聞くために使用されてきている。このプロセスは「聴診」と称されており、通常、生体系を検査する目的で実施され、それら生体系の内部音からパフォーマンスを推測することができる。通常、音響聴診器は、体に当て置くように設計された共振器を備えた単一のチェストピースと、イヤーピースに接続された一対の中空チューブとを含んでいる。音波が共振器によって捕捉されると、該音波は一対の中空チューブを介してイヤーピースへと向かわされる。
【0003】
しかしながら、音響聴診器にはいくつかの欠点に悩まされている。例えば、音響聴診器は、音源の周波数に比例して音を減衰させるようになっている。そのため、イヤホンに伝わる音が非常に微弱になる傾向があり、それによって状態を正確に診断することが困難になる可能性がある。実際に、耳の感度の違いが原因となって、一部の音(例えば、50ヘルツ未満の音)が全く聞こえない場合がある。
【0004】
一部の企業は、音響聴診器の欠点に対処するために、電子聴診器(「ステソフォン」とも称される)の開発を始めている。電子聴診器は、音を電子的に増幅することによって、音響聴診器を改善している。例えば、電子聴診器は、生体内で発生する微弱な音について、これらの音を増幅することにより対処し得る。このことを達成するために、電子聴診器は、チェストピースにあるマイクによって検出された音波を電気信号へと変換し、この電気信号を最適な聴音のために増幅する。
【図面の簡単な説明】
【0005】
【
図1A】
図1Aは、電子聴診器システム用の入力ユニットの上面斜視図を含む。
【
図2】
図2は、電子聴診器システム用の入力ユニットの断面側面図を含む。
【
図3】
図3は、1つ以上の入力ユニットがどのようにハブユニットに接続されて電子聴診器システムが形成されるかを示す。
【
図4】
図4は、電子聴診器システムの入力ユニット及びハブユニットの例示的なコンポーネントを示す高レベルブロック図である。
【
図5】
図5は、診断プラットフォームを含むネットワーク環境を示す。
【
図6】
図6は、患者の健康状態の変化の検出、診断及びモニタリングに役立つ出力を生成するように設計された診断プラットフォームを実装可能なコンピューティングデバイスの例を示す。
【
図7】
図7は、音声データの分析がレビューのためにインタフェース上に表示される前に、診断プラットフォームによって取得された音声データがバックグラウンドサービスによってどのように処理されるかを示すワークフロー図の例を含む。
【
図8】
図8は、検出段階の間に診断プラットフォームによって採用され得る計算パイプラインの概要を示す。
【
図9】
図9は、診断プラットフォームによって使用可能ないくつかのベースラインモデルのアーキテクチャを示す。
【
図10】
図10は、音声データの個々のセグメントが診断プラットフォームによってどのように分類されるかを示す。
【
図11A】
図11Aは、呼吸数を推定するためのアルゴリズムアプローチの大まかな図を含む。
【
図11B】
図11Bは、診断プラットフォームが、所定の頻度で更新される所定の長さの記録にわたってスライディングウィンドウを使用して、どのようにして呼吸数を計算し得るか示す。
【
図12】
図12は、診断プラットフォームが自己相関を使用して吸息と呼息とを識別する、聴診の代替アプローチを示す。
【
図13A】
図13Aは、医療専門家による診断決定を容易にするために、診断プラットフォームによって生成されたスペクトログラムがどのようにしてほぼリアルタイムで提示されるかを示す。
【
図13B】
図13Bは、患者の健康に関する追加の洞察を提供するために、デジタル要素(「グラフィック要素」とも称される)がどのようにスペクトログラムを重ね合わせるかを示す。
【
図14】
図14は、音声データの分析を通じて呼吸イベントを検出し、続いてそれらの呼吸イベントに基づいて呼吸数を計算するプロセスのフロー図を示す。
【
図15】
図15は、患者の肺によって生じる音を含む音声データの分析に基づいて呼吸数を計算するためのプロセスのフロー図を表す。
【
図16】
図16は、本明細書に記載の電子聴診器システム及び診断プラットフォームを、医療専門家がどのように使用して、聴診音を聞き、ほぼリアルタイムで呼吸イベントを確認するかを表す。
【
図17】
図17は、本明細書に記載の少なくともいくつかの動作を実施可能な処理システムの例を示すブロック図である。
【0006】
実施形態は、これらの図面において、限定ではなく例として示される。これらの図面は、説明の目的のために様々な実施形態を表しているが、当業者は、代替の実施形態が、本技術の原理から逸脱することなく採用され得ることを認識するであろう。したがって、図面には特定の実施形態が示されているが、本技術は様々な変更を受け入れる余地がある。
【発明の概要】
【0007】
電子聴診器システムは、以下でさらに論じるように、検査中の生体内及び生体外から発生する音を同時にモニタリングするように設計可能である。以下でさらに論じるように、電子聴診器システムは、ハブユニットに接続された1つ以上の入力ユニットを含み得る。各入力ユニットは、生体内で発生する内部音を示す音声データを生成するように構成された少なくとも1つのマイクへ音波を向けるように設計された円錐形共振器を有し得る。これらのマイクは、「聴診マイク」と称されることがある。さらに、各入力ユニットは、生体外で発生する外部音を示す音声データを生成するように構成された少なくとも1つのマイクを含み得る。これらのマイクは、「周囲マイク」又は「環境マイク」と称されることがある。
【0008】
説明の目的で、「周囲マイク」は、「周囲音」を示す音声データを生成可能であると説明されることがある。しかしながら、これらの「周囲音」には、概して、次の3つの異なる音源から生成される外部音の組み合わせが含まれる:(1)周囲環境から発生する音、(2)入力部から漏れる音、(3)検査中の生体を透過する音。外部音の例には、入力ユニットから直接発生する音(例えば、指又は胸で擦れる音)、及び、入力ユニットを透過する低周波環境ノイズが含まれる。
【0009】
内部音と外部音を別々に録音することには、いくつかの利点がある。特に、内部音を電子的に増幅し得ると同時に、外部音を電子的に低減(dampen)、減衰(attenuate)又はフィルタリングし得る。したがって、電子聴診器システムは、内部音及び外部音を示す音声データを操作することによって、検査中の生体内から発生する微弱な音に対処し得る。しかしながら、操作によって望ましくないデジタルアーチファクトが発生し、内部音の解釈が難しくなることがある。例えば、これらのデジタルアーチファクトによって、聴診マイクによって生成された、吸息又は呼息を示す音声データの値のパターンを識別することが、より困難になることがある。
【0010】
本願では、電子聴診器システムによって生成された音声データの分析を通じて患者の健康に関する洞察を導出するためのコンピュータプログラム、及び、関連するコンピュータ実装技術を提示する。診断プラットフォーム(「診断プログラム」又は「診断アプリケーション」とも称される)は、電子聴診器システムによって生成された音声データを検査して、患者の健康に関する洞察を得る役割を担い得る。以下でさらに論じるように、診断プラットフォームは、機械学習(ML)又は人工知能(AI)に依存するヒューリスティック、アルゴリズム又はモデルを採用してもよく、それによって、医療専門家による視覚分析に依存する従来のアプローチよりも大幅に優れた方法で聴診を実行し得る。
【発明を実施するための形態】
【0011】
例えば、診断プラットフォームが、患者に接続された電子聴診器システムによって生成された音声データに基づいて、患者の呼吸数を推定する役割を担っていると仮定する。用語「呼吸数」は、1分間に行われる呼吸の数を示す。安静時の成人の場合、毎分12~25回の呼吸数が正常と見なされる。安静時の呼吸数が毎分12回未満であるか、毎分25回を超えると、その呼吸数は異常と見なされる。呼吸数は健康の重要な指標であるため、「バイタルサイン」と称されることがある。そのため、呼吸数についての知識は、患者に適切なケアを提供するために重要なことがある。
【0012】
上述のように、電子聴診器システムは、内部音を示す音声データと、外部音を示す音声データとを生成し得る。これらの前者は「第1の音声データ」又は「内部音声データ」と称されることがあり、後者は「第2の音声データ」又は「外部音声データ」と称されることがある。いくつかの実施形態では、診断プラットフォームは、第2の音声データを利用して、第1の音声データを改善する。したがって、診断プラットフォームは、第2の音声データを検査して、もし操作するのであれば、外部音の影響を軽減するために第1の音声データをどのように操作するべきかについて決定し得る。例えば、診断プラットフォームが第2の音声データの分析を通じて外部音を発見した場合、診断プラットフォームは、(例えば、吸息、呼息などに対応する)目的となる内部音を歪めることなく外部音を除去するために、第1の音声データを取得して該第1の音声データにフィルタを適用してもよい。該フィルタは、第2の音声データの分析に基づいて診断プラットフォームによって生成されてもよく、第2の音声データの分析に基づいて診断プラットフォームによって(例えば、複数のフィルタの中から)識別されてもよい。
【0013】
次に、診断プラットフォームは、コンピュータ実装されたモデル(又は、単に「モデル」)を第1の音声データに適用し得る。該モデルは、呼吸における別個の段階、すなわち、吸息と呼息とを識別するように設計及び訓練され得る。該モデルは、1つ以上の人工ニューラルネットワーク(又は、単に「ニューラルネットワーク」)に基づくディープラーニングモデルであり得る。ニューラルネットワークは、複雑な入力を処理するために連携する複数のMLアルゴリズムのフレームワークである。ニューラルネットワークは、人間や動物の脳を構成する生物学的ニューラルネットワークに触発されたものであり、タスク固有のルールによってプログラムされていなくても、実例を検討することでタスクを実行することを「学習」できる。例えば、ニューラルネットワークは、「吸息」、「呼息」又は「吸息又は呼息なし」としてラベル付けされた一連の音声データを検査することによって、吸息と呼息とを識別することを学習し得る。これらの一連の音声データは、「訓練データ」と称されることがある。訓練に対するこのアプローチによって、ニューラルネットワークは、一連の音声データから、その特徴の存在によって吸息及び呼息を示す特徴を自動的に学習することが可能になる。例えば、ニューラルネットワークは、呼息を示す音声データの値のパターン、並びに、吸息を示す音声データの値のパターンを理解するようになり得る。
【0014】
モデルによって生成された出力は役に立ち得るが、その一方で解釈が難しいことがある。例えば、診断プラットフォームは、患者の監視、検査又は診断を担当する医療専門家によるレビューのために、第1の音声データの視覚的表現(「視覚化」とも称される)を生成し得る。診断プラットフォームは、視覚化の分かりやすさを改善するために、吸息又は呼息を視覚的に強調表示してもよい。例えば、診断プラットフォームは、視覚化にデジタル要素(「グラフィック要素」とも称される)を重ねて、患者が息を吸ったことを示し得る。以下でさらに論じるように、デジタル要素は、モデルによって決定された吸息の開始から、モデルによって決定された呼息の終わりまで及び得る。モデルによって生成された出力をよりわかりやすい方法で説明することにより、診断プラットフォームは、それらの出力に依存する医療専門家との信頼を築くことができる。
【0015】
さらに、診断プラットフォームは、モデルによって生成された出力を利用して、患者の健康に関する洞察を得てもよい。例えば、上記のように吸息と呼息とを識別するために、患者に関連付けられた音声データにモデルが適用されると仮定する。このような状況では、診断プラットフォームは、それらの出力を利用して測定基準を生成することがある。このような測定基準の一例は、呼吸数である。上記のように、用語「呼吸数」は、1分間に行われる呼吸の数を示す。しかしながら、直前の1分間における実際の呼吸数を数えることは、実際的ではない。たとえ限定的な時間の間であっても、患者が酸素欠乏症を被ると、重大な不可逆的損傷が生じることがある。したがって、医療専門家にとっては、ほぼリアルタイムで更新される呼吸数について一貫した洞察を得ることが重要である。これを達成するために、診断プラットフォームは、スライディングウィンドウアルゴリズムを使用して、呼吸数を継続的に計算し得る。大まかに言えば、該アルゴリズムは、音声データの一部を含むウィンドウを定義した後、ウィンドウを継続的にスライドさせることによって、音声データの種々異なる部分をカバーする。以下でさらに論じるように、該アルゴリズムは、所定の数の吸息又は呼息が常にその境界内に含まれるように、ウィンドウを調整し得る。例えば、該アルゴリズムは、ウィンドウの境界内に3回の吸息が含まれるようにプログラムされ得る。このとき、1回目の吸息はウィンドウの「開始」を表し、3回目の吸息はウィンドウの「終了」を表す。続いて、診断プラットフォームは、該ウィンドウに含まれる吸息間の間隔に基づいて、呼吸数を計算することができる。
【0016】
例示の目的で、実施形態は、コンピューティングデバイスによって実行可能な命令のコンテキストで説明され得る。しかしながら、本技術の態様は、ハードウェア、ファームウェア、ソフトウェア又はそれらの任意の組み合わせを介して実装可能である。一例として、モデルは、患者の吸息及び呼息を表す出力を識別するために、電子聴診器システムによって生成される音声データに適用されてもよい。そして、該モデルによって生成された出力に対し、患者の呼吸数を示す測定基準を生成するためにアルゴリズムが適用されてもよい。
【0017】
実施形態は、特定のコンピューティングデバイス、ネットワーク及び医療専門家及び施設を参照して説明され得る。しかしながら、当業者は、これらの実施形態の特徴が、他のコンピューティングデバイス、ネットワーク及び医療専門家及び施設に同様に適用可能であることを認識するであろう。例えば、実施形態は深層ニューラルネットワークの文脈で説明され得るが、診断プラットフォームによって採用されるモデルは、深層信念ネットワーク、回帰型ニューラルネットワーク及び畳み込みニューラルネットワーク等の、別の深層学習アーキテクチャに基づくものであってもよい。
【0018】
用語
本出願を通じて使用される用語、略語及び語句の簡単な定義を以下に示す。
【0019】
用語「接続」、「結合」及びその任意の変形は、直接的又は間接的な、2つ以上の要素間の任意の接続又は結合を含むことが意図される。接続又は結合は、物理的、論理的又はそれらの組み合わせであり得る。例えば、オブジェクトは、物理的な接続を共有していなくても、互いに電気的又は通信的に接続されていることがある。
【0020】
用語「モジュール」は、ソフトウェア、ファームウェア、ハードウェア又はそれらの任意の組み合わせを介して実装されるコンポーネントを広く示すために使用され得る。概して、モジュールは、1つ以上の入力に基づいて1つ以上の出力を生成する機能コンポーネントである。コンピュータプログラムは、1つ以上のモジュールを含み得る。したがって、コンピュータプログラムは、種々異なるタスクの完了を担う複数のモジュールを含んでいてもよく、全てのタスクの完了を担う単一のモジュールを含んでいてもよい。
【0021】
電子聴診器システムの概要
図1Aは、電子聴診器システム用の入力ユニット100の上面斜視図を含む。便宜上、入力ユニット100は、「聴診器パッチ」と称されることがあるが、聴診に必要なコンポーネントのサブセットのみを含んでいてもよい。入力ユニット100は、身体の胸部に取り付けられることが多いため、「チェストピース」と称されることもある。しかしながら、当業者は、入力ユニット100が身体の他の部分(例えば、首、腹部又は背中)にも同様に取り付けられ得ることを認識するであろう。
【0022】
以下でさらに論じるように、入力ユニット100は、検査中の身体内の生物学的活動を表す音波を収集し、該音波を電気信号に変換し、その後に(例えば、より簡単な伝送のため、より高い忠実度を確実にするため、等の目的で)該電気信号をデジタル化することができる。入力ユニット100は、剛性材料から構成される構造体102を含み得る。通常、構造体102は、ステンレス鋼、アルミニウム、チタン又は適切な金属合金等の金属により構成される。構造体102を作製するには、典型的には、溶融金属がダイカストされた後、適切な形状に機械加工されるか押し出されることになる。
【0023】
いくつかの実施形態では、入力ユニット100は、構造体102が周囲環境にさらされるのを防止するケーシングを含む。例えば、ケーシングは、汚染を防止したり、洗浄性を向上させたりし得る。概して、ケーシングは、その底面に沿って配置された円錐形共振器を除いて、構造体102の実質的に全てを被包する。円錐形共振器については、
図1B~Cに関して以下でより詳細に説明する。ケーシングは、シリコンゴム、ポリプロピレン、ポリエチレン又は任意の他の適切な材料から構成され得る。さらに、いくつかの実施形態では、ケーシングは、その添加剤の存在によって微生物の増殖、紫外線(UV)分解などを抑制する添加剤を含む。
【0024】
図1B~Cは、入力ユニット100の底面斜視図を含み、入力ユニット100は、遠位部分104及び近位部分106を有する構造体102を含む。聴診プロシージャを開始するために、ある個人(例えば、医師又は看護師などの医療専門家)は、入力ユニット100の近位部分106を、検査中の身体の表面に対して固定することができる。入力ユニット100の近位部分106は、円錐形共振器110の幅広開口部108を含み得る。円錐形共振器110は、幅広開口部108を通して収集された音波を幅狭開口部112に向けるように設計されてもよく、これらの音波が聴診マイクに導かれ得る。従来では、幅広開口部108は、約30~50ミリメートル(mm)、35~45mm又は38~40mmである。しかしながら、本明細書に記載の入力ユニット100は、自動利得制御機能を有することができるため、より小さい円錐形共振器が使用されてもよい。例えば、いくつかの実施形態では、幅広開口部108は、30mm、20mm又は10mm未満である。したがって、本明細書に記載の入力ユニットは、種々異なるサイズを有する円錐形共振器や、種々異なる用途向けに設計された円錐形共振器等の、多種多様な円錐形共振器をサポート可能であり得る。
【0025】
用語「遠位」及び「近位」に関し、別段の指定がない限り、これらの用語は、入力ユニット100の身体に対する相対的な位置を示す。例えば、身体への固定に適した入力ユニット100を参照する場合、「遠位」は、デジタル信号を伝達するのに適したケーブルが入力ユニット100に接続され得る場所に近い第1の位置を示すことができ、「近位」は、入力ユニット100が身体に接触する場所に近い第2の位置を示すことができる。
【0026】
図2は、電子聴診器システム用の入力ユニット200の断面側面図を含む。多くの場合、入力ユニット200は、その構造体202内に画定された内部空洞を有する構造体202を含む。入力ユニット200の構造体202は、内部空洞内に存在するマイクに向かって音波を向けるように設計された円錐形共振器204を有し得る。いくつかの実施形態では、ダイヤフラム212(「振動膜」とも称される)は、円錐形共振器204の幅広開口部(「外側開口部」とも称される)を横切って延在する。ダイヤフラム212は、多くの場合肺によって生成されるような高音を聴音するために使用することができる。ダイヤフラム212は、エポキシガラス繊維化合物又はガラス繊維で構成された薄いプラスチックディスクから形成することができる。
【0027】
円錐形共振器204によって収集される音波の明瞭さを改善するために、入力ユニット200は、種々異なる位置から発生する音を同時にモニタリングするように設計され得る。例えば、入力ユニット200は、検査中の体内から発生する音と、周囲環境から発生する音とを同時にモニタリングするように設計され得る。したがって、入力ユニット200は、内部音を示す音声データを生成するように構成された少なくとも1つのマイク206(「聴診マイク」と称される)と、周囲音を示す音声データを生成するように構成された少なくとも1つのマイク208(「周囲マイク」と称される)とを含むことができる。各聴診マイク及び周囲マイクは、音波を電気信号に変換可能な変換器を含み得る。その後、聴診及び周囲マイク206,208によって生成された電気信号は、ハブユニットに送信する前にデジタル化され得る。デジタル化によって、ハブユニットは複数の入力ユニットから受信した信号を容易にクロッキング(clock)又は同期できる。デジタル化はまた、入力ユニットからハブユニットによって受信された信号が、他の方法によって可能であり得る忠実度よりも高い忠実度を有することを保証し得る。
【0028】
これらのマイクは、あらゆる方向から音を拾うように設計された無指向性マイクであってもよく、特定の方向から来る音を拾うように設計された指向性マイクであってもよい。例えば、入力ユニット200は、円錐形共振器204の外側開口部に隣接する空間から生じる音を拾うように向けられた(1つ以上の)聴診マイク206を含み得る。そのような実施形態では、(1つ以上の)周囲マイク208は、無指向性マイクであってもよく、指向性マイクであってもよい。別の例としては、ノイズ及び干渉を低減するために高度に指向性である周囲音を捕捉可能な位相配列(phased array)を形成するように、一組の周囲マイク208を入力ユニット200の構造体202内に等間隔に配置することができる。これによって、(1つ以上の)聴診マイク206は、入ってくる内部音の経路(「聴診経路」とも称される)に集中するように配置され得ると共に、(1つ以上の)周囲マイク208は、入ってくる周囲音の経路(「周囲経路」とも称される)に集中するように配置され得る。
【0029】
従来では、電子聴診器は、音波を示す電気信号を、望ましくないアーチファクトをフィルタリングする役割を担うデジタル信号処理(DSP)アルゴリズムにかけていた。しかしながら、このようなアクションは、特定の周波数範囲(例:100~800Hz)内のほぼ全ての音を抑制する可能性があり、それによって目的となる内部音(例:吸息、呼息又は心拍に対応する音)を大幅に歪ませることがあった。しかしながら、本明細書では、プロセッサは、聴診マイク206によって生成された音声データと周囲マイク208によって生成された音声データを別々に検査するアクティブノイズキャンセルアルゴリズムを使用することができる。より具体的には、プロセッサは、周囲マイク208によって生成された音声データを解析し、それによって、聴診マイク206によって生成された音声データをどのように修正すべきかを決定し得る。例えば、プロセッサは、特定のデジタル特徴が、(例えば、該特徴が内部音に対応しているため)増幅されるべきであること、(例えば、該特徴が周囲音に対応しているため)減衰されるべきであること、又は、(例えば、該特徴がノイズを表しているため)完全に削除されるべきであることを検出し得る。そのような技術は、入力ユニット200によって記録された音の明瞭さ、詳細及び品質を改善するために使用可能である。例えば、ノイズキャンセルアルゴリズムの適用は、少なくとも1つの入力ユニット200を含む電子聴診器システムによって採用されるノイズ除去プロセスの不可欠な部分であり得る。
【0030】
プライバシーの目的で、円錐形共振器204が身体から離れるように向けられている間に、(1つ以上の)聴診マイク206も(1つ以上の)周囲マイク208も、記録が許可されないことがある。したがって、いくつかの実施形態では、(1つ以上の)聴診マイク206及び/又は(1つ以上の)周囲マイク208は、入力ユニット200が身体に取り付けられるまで、記録を開始しない。そのような実施形態では、入力ユニット200は、構造体202が体の表面に適切に固定されているかどうかを決定する役割を担う1つ以上の取り付けセンサ210a~cを含み得る。
【0031】
入力ユニット200は、本明細書に示される取り付けセンサの任意のサブセットを含むことができる。例えば、いくつかの実施形態では、入力ユニット200は、円錐形共振器204の幅広開口部の近くに配置された取り付けセンサ210a~bのみを含む。別の例としては、いくつかの実施形態では、入力ユニット200は、円錐形共振器204の幅狭開口部(「内側開口部」とも称される)の近くに配置された取り付けセンサ210cのみを含む。さらに、入力部200は、種々異なる種類の装着センサを含み得る。例えば、取り付けセンサ210cは、円錐形共振器204を通して光(例えば、赤外光)を放射すると共に、反射されて円錐形共振器204内へと戻る光に基づいて入力ユニット200と該構造体との間の距離を決定するように設計された、光学近接センサであってもよい。別の例として、取り付けセンサ210a~cは、高周波信号の減衰を決定するようにプログラムされたアルゴリズムの助けを借りて、周囲ノイズ(「環境ノイズ」とも称される)の存在に基づき、構造体202が身体の表面に対して確実に封止されているかどうかを決定するように設計された音声センサであってもよい。別の例として、取り付けセンサ210a~bは、印加された圧力の量に基づき、構造体202が身体の表面に対して確実に封止されているかどうかを決定するように設計された圧力センサであってもよい。入力ユニット200のいくつかの実施形態は、これらの種々異なるタイプの取り付けセンサのそれぞれを含む。これらの取り付けセンサ210a~cの出力を前述のアクティブノイズキャンセルアルゴリズムと組み合わせて考慮することにより、プロセッサは、取り付け状態を動的に決定することが可能であり得る。すなわち、プロセッサは、これらの取り付けセンサ210a~cの出力に基づいて、入力ユニット200が身体に対して封止を形成しているどうかを決定することが可能であり得る。
【0032】
図3は、1つ以上の入力ユニット302a~nがどのようにハブユニット304に接続されて電子聴診器システム300が形成されるかを示す。いくつかの実施形態では、複数の入力ユニットがハブユニット304に接続される。例えば、電子聴診器システム300は、4つの入力ユニット、6つの入力ユニット又は8つの入力ユニットを含んでいてもよい。概して、電子聴診器システム300は、少なくとも6つの入力ユニットを含むことになる。複数の入力ユニットを備えた電子聴診器システムは、「多チャンネル聴診器」と称されることがある。他の実施形態では、1つの入力ユニットのみがハブユニット304に接続される。例えば、単一の入力ユニットは、複数の入力ユニットのアレイをシミュレートするような方法で、身体全体にわたって移動させられ得る。1つの入力ユニットを有する電子聴診器システムは、「単一チャネル聴診器」と称されることがある。
【0033】
図3に示すように、各入力ユニット302a~nは、対応するケーブル306a~nを介してハブユニット304に接続することができる。概して、各入力ユニット302a~nとハブユニット304との間に対応するケーブル306a~nを介して形成される伝送経路は、実質的に干渉がないように設計される。例えば、電子信号は、ハブユニット304への伝送前に入力ユニット302a~nによってデジタル化されてもよく、また、信号の忠実度が、電磁ノイズの発生/汚染を妨げることによって確保されてもよい。ケーブルの例には、リボンケーブル、同軸ケーブル、ユニバーサルシリアルバス(USB)ケーブル、高解像度マルチメディアインタフェース(HDMI)ケーブル、RJ45イーサネットケーブル、及び、デジタル信号の伝達に適した他のケーブルが含まれる。各ケーブルは、ハブユニット304に(例えば、物理ポートを介して)接続された第1端と、対応する入力ユニットに(例えば、物理ポートを介して)接続された第2端とを含む。したがって、各入力ユニット302a~nは単一の物理ポートを含んでいてもよく、またハブユニット304は複数の物理ポートを含んでいてもよい。あるいは、入力ユニット302a~nの全てをハブユニット304に接続するために、単一のケーブルが使用されてもよい。そのような実施形態では、ケーブルは、ハブユニット304とインタフェース可能な第1端と、それぞれが単一の入力ユニットとインタフェース可能な一連の第2端とを含むことができる。そのようなケーブルは、例えば、第2端の数に基づいて、「1対2ケーブル」、「1対4ケーブル」又は「1対6ケーブル」と称されることがある。
【0034】
ハブユニット304に接続された入力ユニット302a~nの全てが聴診モードにある際、電子聴診器システム300は、内部音を周囲音と比較するようにプログラムされた適応利得制御アルゴリズムを採用することができる。適応利得制御アルゴリズムは、対象の聴診音(例えば、正常呼吸音、笛声音(wheezing)、捻髪音、水泡音(crackling)等)を分析して、適切な音レベルが達成されたかどうかを判断し得る。例えば、適応利得制御アルゴリズムは、音レベルが所定の閾値を超えているかどうかを決定し得る。適応利得制御アルゴリズムは、(例えば、2つの異なる段階で)最大100倍の利得制御を実現するように設計され得る。利得レベルは、入力ユニットアレイ308内の入力ユニットの数や、各入力ユニット内の聴診マイクによって記録された音のレベルに基づいて適応的に調整され得る。いくつかの実施形態では、適応利得制御アルゴリズムは、フィードバックループの一部として展開するようにプログラムされる。したがって、適応利得制御アルゴリズムは、入力ユニットによって記録された音声に利得を適用し、音声が事前にプログラムされた強度閾値を超えているかどうかを判断し、その判断に基づいて追加の利得が必要かどうかを動的に判断し得る。
【0035】
電子聴診器システム300は、後処理プロシージャ中に適応利得制御アルゴリズムを展開することができるため、入力ユニットアレイ308は、心臓、肺等によって生じる広範囲の音に関する情報を収集することが可能になり得る。入力ユニットアレイ308内の入力ユニット302a~nは、身体の表面に沿った(又は全く異なる身体上の)種々異なる解剖学的位置に配置可能であるため、種々異なるバイオメトリック特性(例えば、呼吸数、心拍数、又は、笛声音(wheezing)、捻髪音、水泡音(crackling)の程度等)に配置することができる)を、電子聴診器システム300によって同時に監視することができる。
【0036】
図4は、電子聴診器システムの入力ユニット400及びハブユニット450の例示的なコンポーネントを示す高レベルブロック図である。入力ユニット400及びハブユニット450の実施形態は、
図4に示されるコンポーネントの任意のサブセットや、ここでは図示されていない追加のコンポーネントを含むことができる。例えば、入力ユニット400は、(例えば、皮膚の湿度に基づく)発汗、温度等の身体のバイオメトリック特性をモニタリング可能なバイオメトリックセンサを含んでいてもよい。加えて又はこれに代えて、バイオメトリックセンサは、呼吸パターン(breathing pattern)(「呼吸パターン(respiratory pattern)」とも称される)のモニタリング、心臓の電気的活動も記録等を行うように設計されてもよい。別の例として、入力ユニット400は、ジェスチャ、向き又は位置を導出し得るデータを生成可能な慣性測定ユニット(IMU)を含んでいてもよい。IMUは、オブジェクトの力、角速度、傾斜及び/又は磁場を測定するように設計された電子部品である。概して、IMUには、加速度計、ジャイロスコープ、磁力計又はそれらの任意の組み合わせが含まれる。
【0037】
入力ユニット400は、1つ以上のプロセッサ404、無線送受信器406、1つ以上のマイク408、1つ以上の取り付けセンサ410、メモリ412、及び/又は、電力インタフェース416に電気的に結合された電力コンポーネント414を含むことができる。これらのコンポーネントは、ハウジング402(「構造体」とも称される)内に存在し得る。
【0038】
上述のように、マイク408は、音響音波を電気信号に変換することができる。マイク408は、内部音を示す音声データを生成するように構成された聴診マイク、周囲音を示す音声データを生成するように構成された周囲マイク、又は、それらの任意の組み合わせを含み得る。電気信号の値を表す音声データは、少なくとも一時的に、メモリ412内に格納することができる。いくつかの実施形態では、(1つ以上の)プロセッサ404は、ハブユニット450に向かう下流への伝送の前に、音声データを処理する。例えば、(1つ以上の)プロセッサ404は、デジタル信号処理、ノイズ除去、利得制御、ノイズキャンセル、アーチファクト除去、特徴識別等のために設計されたアルゴリズムを適用し得る。他の実施形態では、ハブユニット450に向かう下流への伝送の前に、最小限の処理が(1つ以上の)プロセッサ404によって事前に実行される。例えば、(1つ以上の)プロセッサ404は、入力ユニット400のアイデンティティを特定するメタデータを音声データに単純に追加してもよく、マイク408によって音声データに既に追加されているメタデータを検査してもよい。
【0039】
いくつかの実施形態では、入力ユニット400及びハブユニット450は、対応するデータインタフェース418,470間に接続されたケーブルを介して、互いの間でデータを伝送する。例えば、(1つ以上の)マイク408によって生成された音声データは、ハブユニット450のデータインタフェース470への送信のために、入力ユニット400のデータインタフェース418へと転送され得る。あるいは、データインタフェース470は、無線送受信器456の一部であってもよい。無線送受信器406は、ハブユニット450の無線送受信器456との無線接続を自動的に確立するように構成され得る。無線送受信器406,456は、近距離無線通信(NFC)、ワイヤレスUSB、Bluetooth(登録商標)、Wi-Fi(登録商標)、セルラーデータプロトコル(例えば、LTE、3G、4G又は5G)、又は、独自のポイントツーポイントプロトコル等の双方向通信プロトコルを介して、互いに通信し得る。
【0040】
入力ユニット400は、必要に応じて、ハウジング402内に存在する他のコンポーネントに電力を供給可能な電力コンポーネント414を含み得る。同様に、ハブユニット450は、ハウジング452内に存在する他のコンポーネントに電力を供給可能な電力コンポーネント466を含むことができる。電力コンポーネントの例には、再充電可能なリチウムイオン(Li-Ion)電池、再充電可能なニッケル水素(NiMH)電池、再充電可能なニッケルカドミウム(NiCad)電池等が含まれる。入力ユニット400は、専用の電力コンポーネントを含んでおらず、そのためハブユニット450から電力を受ける必要がある。(例えば、電気接点の物理的接続を介して)電力の伝達を容易にするように設計されたケーブルが、入力ユニット400の電力インタフェース416とハブユニット450の電力インタフェース468との間に接続され得る。
【0041】
電力チャネル(すなわち、電力インタフェース416と電力インタフェース468との間のチャネル)及びデータチャネル(すなわち、データインタフェース418とデータインタフェース470との間のチャネル)は、別個のチャネルとして示されているが、これは例示のみを目的としている。当業者は、これらのチャネルを同一のケーブル内に含めることができることを認識するであろう。したがって、データ及び電力を運搬可能な単一のケーブルが、入力ユニット400とハブユニット450との間に結合されてもよい。
【0042】
ハブユニット450は、1つ以上のプロセッサ454と、無線送受信器456と、ディスプレイ458と、コーデック460と、1つ以上の発光ダイオード(LED)表示器462と、メモリ464と、電力コンポーネント466とを含むことができる。これらのコンポーネントは、ハウジング452(「構造体」とも称される)内に存在し得る。上述のように、ハブユニット450の実施形態は、これらのコンポーネントの任意のサブセットや、ここに示されていない追加のコンポーネントを含み得る。
【0043】
図4に示されるように、ハブユニット450の実施形態は、検査中の個人の呼吸状態又は心拍数、ネットワーク接続状態、電力接続状態、入力ユニット400のための接続状態等の情報を提示するためのディスプレイ458を含み得る。ディスプレイ458は、触覚入力機構(例えば、ハウジング452の表面に沿ってアクセス可能なボタン)、音声入力機構(例えば、マイク)等を介して制御され得る。別の例として、ハブユニット450のいくつかの実施形態は、ディスプレイ458ではなく、操作ガイダンスのための(1つ以上の)LED表示器462を含む。そのような実施形態では、(1つ以上の)LED表示器462は、ディスプレイ458によって提示されるものと同様の情報を伝え得る。別の例として、ハブユニット450のいくつかの実施形態は、ディスプレイ458及び(1つ以上の)LED表示器462を含む。
【0044】
入力ユニット400のマイク408によって生成された電気信号を表す音声データを受信すると、ハブユニット450は、着信データの復号化を担当するコーデック460に音声データを提供することができる。コーデック460は、例えば、編集、処理などに備えて音声データを(例えば、入力ユニット400によって適用された符号化を逆にすることによって)デコードすることができる。入力ユニット400内の(1つ以上の)聴診マイクと、入力ユニット400内の(1つ以上の)周囲マイクによって生成された音声データとを含む。
【0045】
その後に、(1つ以上の)プロセッサ454は、音声データを処理することができる。入力ユニット400の(1つ以上の)プロセッサ404と同様に、ハブユニット450の(1つ以上の)プロセッサ454は、デジタル信号処理、ノイズ除去、利得制御、ノイズキャンセル、アーチファクト除去、特徴識別等のために設計されたアルゴリズムを適用し得る。これらのアルゴリズムのいくつかは、入力ユニット400の(1つ以上の)プロセッサ404によって既に適用されている場合には、不要であってもよい。例えば、いくつかの実施形態では、ハブユニット450の(1つ以上の)プロセッサ454は、音声データ内の診断に関連する特徴を発見するために(1つ以上の)アルゴリズムを適用するが他の実施形態では、(1つ以上の)プロセッサ404の入力ユニット400が診断に関連する特徴を既に発見している場合には、そのようなアクションは不要であってもよい。あるいは、ハブユニット450は、以下でさらに論じるように、分析のために音声データを宛先(例えば、コンピューティングデバイス又は分散システム上で動作する診断プラットフォーム)へと転送することができる。概して、診断に関連する特徴は、所定のパターン定義パラメータにマッチする音声データの値のパターンに対応することになる。別の例として、いくつかの実施形態では、ハブユニット450のプロセッサ454は、信号対雑音(SNR)比を改善するために音声データのノイズを低減するアルゴリズムを適用する一方で、他の実施形態では、これらのアルゴリズムは、入力ユニット400のプロセッサ404によって適用される。
【0046】
電力インタフェース468に加えて、ハブユニット450は電力ポートを含み得る。電力ポート(「電力ジャック」とも称される)は、ハブユニット450を電源(例えば、電気コンセント)へと物理的に接続することを可能にする。電力ポートは、種々異なるコネクタタイプ(例えば、C13、C15、C19等)と接続可能であってもよい。加えて又はこれに代えて、ハブユニット450は、外部源から無線で電力を受けることが可能な集積回路(「チップ」とも称される)を有する受電器を含んでいてもよい。同様に、入力ユニット400は、例えば、入力ユニット400とハブユニット450とがケーブルを介して互いに物理的に接続されていない場合に、外部源から無線で電力を受けることが可能なチップを有する受電器を含んでいてもよい。受電器は、ワイヤレスパワーコンソーシアム(Wireless Power Consortium)によって開発されたQi標準、又は、何らかの他の無線電力標準に従って送信された電力を受けるように構成され得る。
【0047】
いくつかの実施形態では、ハブユニット450のハウジング452は音声ポートを含む。音声ポート(「音声ジャック」とも称される)は、音声等の信号をヘッドフォン等の付属品の適切なプラグへと伝送するために使用可能なレセプタクルである。音声ポートは、典型的には、適切なプラグが音声ポートに挿入された際に音声信号を容易に伝送可能にする1、2、3又は4つの接点を含む。例えば、ほとんどのヘッドフォンは、3.5ミリメートル(mm)の音声ポート用に設計されたプラグを含む。加えて又はこれに代えて、ハブユニット450の無線送受信器456は、音声信号を(例えば、NFC、ワイヤレスUSB、Bluetooth等を介して)無線ヘッドフォンへと直接伝送可能であってもよい。
【0048】
上述のように、入力ユニット400のプロセッサ404及び/又はハブユニット450のプロセッサ454は、種々異なる機能をサポートするために、様々なアルゴリズムを適用することができる。そのような機能の例には、音声データ内において失われたデータパケットの減衰、ノイズに依存する音量制御、ダイナミックレンジ圧縮、自動利得制御、イコライゼーション、ノイズ抑制、音響エコーキャンセル等が含まれる。各機能は、メモリ(例えば、入力ユニット400のメモリ412又はハブユニット450のメモリ464)内に常駐する別個のモジュールに対応し得る。したがって、入力ユニット400及び/又はハブユニット450は、減衰モジュール、音量制御モジュール、圧縮モジュール、利得制御モジュール、イコライゼーションモジュール、ノイズ抑制モジュール、エコーキャンセルモジュール又はそれらの任意の組み合わせを含んでいてもよい。
【0049】
いくつかの実施形態では、入力ユニット400は、マイク408によって生成された音声データを、ハブユニット450以外の宛先へと直接伝送するように構成されることに留意されたい。例えば、入力ユニット400は、音声データを、該音声データの分析を担う診断プラットフォームへと伝送するために、無線送受信器406へと転送してもよい。音声データは、ハブユニット450の代わりに、又は、ハブユニット450に加えて、診断プラットフォームへと伝送されてもよい。音声データがハブユニット450に加えて診断プラットフォームに転送される場合、入力ユニット400は、音声データの複製コピーを生成してもよく、その後、それらの個別のコピーをその先に(例えば、診断プラットフォームへと伝送するために無線送受信器406へと、ハブユニット450へと伝送するためにデータインタフェース418へと)転送してもよい。以下でさらに論じるように、診断プラットフォームは、通常、入力ユニット400に通信可能に接続されたコンピューティングデバイス上に存在するが、診断プラットフォームの態様は、入力ユニット400又はハブユニット450上に存在する可能性がある。
【0050】
電子聴診器システムに関する追加の情報は、米国特許第10,555,717号に見られ、参照によりその全体が本明細書に組み込まれる。
【0051】
診断プラットフォームの概要
図5は、診断プラットフォーム502を含むネットワーク環境500を示す。個人は、インタフェース504を介して、診断プラットフォーム502と対話することができる。例えば、患者が、音声データ、病気、治療及びフィードバックに関する情報が提供され得るインタフェースにアクセス可能であってもよい。別の例として、医療専門家が、適切な診断の決定、健康の監視等の目的で、音声データ及び音声データの分析をレビュー可能なインタフェースにアクセス可能であってもよい。大まかに言えば、インタフェース504は、患者又は医療専門家のいずれかのための情報価値のあるダッシュボードとして機能することが意図され得る。
【0052】
図5に示されるように、診断プラットフォーム502は、ネットワーク環境500内に存在し得る。したがって、診断プラットフォーム502は、1つ以上のネットワーク506a~bに接続され得る。ネットワーク506a~bは、パーソナルエリアネットワーク(PAN)、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、メトロポリタンエリアネットワーク(MAN)、セルラーネットワーク、インターネット等を含むことができる。加えて又はこれに代えて、診断プラットフォーム502は、Bluetooth、NFC、Wi-Fi Direct(「Wi-Fi P2P」とも称される)等の短距離無線接続技術を介して、1つ以上のコンピューティングデバイスに通信可能に結合することができる。
【0053】
インタフェース504は、ウェブブラウザ、デスクトップアプリケーション、モバイルアプリケーション又はオーバーザトップ(OTT)アプリケーションを介してアクセス可能であり得る。例えば、医療専門家は、患者に関する情報を入力可能なインタフェースにアクセス可能であってもよい。そのような情報には、名前、生年月日、診断、症状又は投薬が含まれ得る。あるいは、該情報は、診断プラットフォーム502によって(例えば、ネットワークアクセス可能なサーバシステム508内に格納されたデータに基づいて)インタフェース内に自動的に入力されてもよく、一方で、医療専門家は、必要に応じて該情報を調整することが許可されていてもよい。以下でさらに論じるように、医療専門家は、音声データ及び音声データの分析をレビューのために提示し得るインタフェースにアクセス可能であり得る。この情報によって、医療専門家は、患者の状態(例えば、呼吸しているか呼吸していないか)を容易に確立したり、(例えば、笛声音(wheezing)、捻髪音、水泡音(crackling)などの存在に基づいて)診断を下したり等を行うことが可能であり得る。したがって、インタフェース504は、モバイルワークステーション(「医療用カート」とも称される)、パーソナルコンピュータ、タブレットコンピュータ、携帯電話、ウェアラブル電子デバイス、及び、仮想又は拡張現実システム等のコンピューティングデバイス上で視認され得る。
【0054】
いくつかの実施形態では、診断プラットフォーム502の少なくともいくつかのコンポーネントが、ローカルでホストされる。すなわち、診断プラットフォーム502の一部は、インタフェース504のうちの1つにアクセスするために使用されるコンピューティングデバイス上に存在し得る。例えば、診断プラットフォーム502は、医療専門家に関連付けられた携帯電話上で実行されるモバイルアプリケーションとして実装され得る。しかしながら、モバイルアプリケーションは、診断プラットフォーム502の他のコンポーネントがホストされるネットワークアクセス可能なサーバシステム508に通信可能に接続されてもよいことに留意されたい。
【0055】
他の実施形態では、診断プラットフォーム502は、例えば、Amazon Web Service(登録商標)、Google Cloud Platform(登録商標)、又は、Microsoft Azure(登録商標)によって運営されるクラウドコンピューティングサービスによって、その全てが実行される。そのような実施形態では、診断プラットフォーム502は、1つ以上のコンピュータサーバを備えたネットワークアクセス可能なサーバシステム508上に存在していてもよい。これらのコンピュータサーバは、モデル、(例えば、音声データの処理、呼吸数の計算等のための)アルゴリズム、患者情報(例えば、プロフィール、資格情報、及び、年齢、生年月日、地理的位置、疾患の分類、病状、医療提供者等の健康関連情報等)、及び、その他のアセットを含むことができる。当業者であれば、該情報が、ネットワークアクセス可能なサーバシステム508と1つ以上のコンピューティングデバイスの間で分散されることもあり、ブロックチェーン等の分散ネットワークインフラストラクチャにわたって分散されることもあることを理解するであろう。
【0056】
図6は、患者の健康状態の変化の検出、診断及びモニタリングに役立つ出力を生成するように設計された診断プラットフォーム610を実装可能なコンピューティングデバイス600の例を示す。以下でさらに論じるように、診断プラットフォーム610は、呼吸イベント(respiratory event)(「呼吸イベント(breathing event)」又は「呼吸(breath)」とも称される)の発生を識別するために、患者に関連付けられた音声データに対してモデルを適用し、続いて、患者の健康状態を把握するために、それらの呼吸イベントに対してアルゴリズムを適用することができる。用語「呼吸イベント(respiratory event)」及び「呼吸イベント(breathing event)」は、吸息又は呼息を示すために使用される場合がある。例えば、アルゴリズムは、以下でさらに論じるように、呼吸数を表す測定基準を出力し得る。したがって、診断プラットフォーム610は、診断に関連する音声データの値のパターンを発見することだけでなく、患者の現在の健康状態を理解するのに役立つ方法でそれらのパターンの視覚化を生成することも行い得る。例示の目的で、実施形態は、電子聴診器システムによって生成される音声データの文脈で説明され得る。しかしながら、当業者であれば、該音声データは別のソースから取得され得ることを認識するであろう。
【0057】
通常、コンピューティングデバイス600は、医療専門家又はヘルスケア施設に関連付けられる。例えば、コンピューティングデバイス600は、病院の手術室に配置されたモバイルワークステーションであってもよく、患者にサービスを提供しながら医療専門家がアクセス可能な携帯電話又はタブレットコンピュータであってもよい。あるいは、コンピューティングデバイス600は、電子聴診器システムのハブユニットであってもよい。
【0058】
コンピューティングデバイス600は、プロセッサ602と、メモリ604と、表示機構606と、通信モジュール608とを含むことができる。これらの各コンポーネントについては、以下でより詳細に論じる。当業者であれば、コンピューティングデバイス600の性質に応じて、これらのコンポーネントの種々異なる組み合わせが存在し得ることを認識するであろう。
【0059】
プロセッサ602は、汎用プロセッサと同様の一般的な特性を有することが可能であり、又は、コンピューティングデバイス600に制御機能を提供する特定用途向け集積回路(ASIC)であってもよい。
図6に示されるように、プロセッサ602は、コンピューティングデバイス600の全てのコンポーネントに対して、通信のために直接的又は間接的に接続され得る。
【0060】
メモリ604は、スタティックランダムアクセスメモリ(SRAM)、ダイナミックランダムアクセスメモリ(DRAM)、電気的消去可能プログラマブル読み出し専用メモリ(EEPROM)、フラッシュメモリ又はレジスタ等の任意の適切なタイプの記憶媒体から構成され得る。プロセッサ602によって実行可能な命令を格納することに加えて、メモリ604は、(例えば、診断プラットフォーム610のモジュールを実行する際に)プロセッサ602によって生成されたデータを格納することも可能である。メモリ604は、記憶環境の単なる抽象的な表現であることに留意されたい。メモリ604は、実際のメモリチップ又はモジュールで構成され得る。
【0061】
表示機構606は、情報を視覚的に伝達するように動作可能な任意のコンポーネントであり得る。例えば、表示機構606は、LED、有機LED、液晶素子又は電気泳動素子を含むパネルであり得る。コンピューティングデバイス600が電子聴診器システムのハブユニットを表す実施形態では、表示機構606は、ディスプレイパネル(例えば、
図4のディスプレイ458)であってもよく、LED表示器(例えば、
図4のLED表示器462)であってもよい。いくつかの実施形態では、表示機構606は接触感知式である。したがって、個人は、表示機構606と対話することによって、診断プラットフォーム610に入力を提供可能であり得る。表示機構606が接触感知式でない実施形態では、個人は、キーボード、物理的要素(例えば、機械的なボタン又はノブ)又はポインティングデバイス(例えば、コンピュータのマウス)等の制御デバイス(図示せず)を使用して、診断プラットフォーム610と対話可能であり得る。
【0062】
通信モジュール608は、コンピューティングデバイス600のコンポーネント間の通信を管理する役割を担ってもよく、他のコンピューティングデバイス(例えば、
図5のネットワークアクセス可能なサーバシステム508)との通信を管理する役割を担ってもよい。通信モジュール608は、他のコンピューティングデバイスとの通信チャネルを確立するように設計された無線通信回路であり得る。無線通信回路の例には、セルラーネットワーク(「モバイルネットワーク」とも称される)のために構成されたアンテナモジュール、及び、NFC、ワイヤレスUSB、Bluetoothのために構成されたチップ等が含まれる。
【0063】
便宜上、診断プラットフォーム610は、メモリ604内に常駐し、プロセッサ602によって実行されるコンピュータプログラムと称されることがある。しかしながら、診断プラットフォーム610は、コンピューティングデバイス600に実装されるかコンピューティングデバイス600にアクセス可能であるソフトウェア、ファームウェア又はハードウェアから構成され得る。本明細書に記載の実施形態によれば、診断プラットフォーム610は、訓練モジュール612と、処理モジュール614と、診断モジュール616と、分析モジュール618と、グラフィカルユーザインタフェース(GUI)モジュール620とを含み得る。
【0064】
訓練モジュール612は、診断プラットフォーム610によって使用されるモデルを訓練することを担い得る。訓練は、教師あり、半教師あり又は教師なしの方法で行われ得る。例えば、訓練モジュール612が、音声データ中の呼吸イベントを識別するモデルを訓練するための要求を示す入力を受信すると仮定する。そのような状況では、訓練モジュール612は、訓練されていないモデルを取得し、続いて、例えば「呼吸イベント」又は「呼吸イベントなし」とラベル付けされた音声データを使用して該モデルを訓練し得る。したがって、ラベル付けされた音声データは、モデルがどのようにして呼吸イベントを識別するかを学習するように、訓練データとして該モデルへと提供され得る。通常、モデルは、呼吸イベントを示す音声データの値のパターンを識別することを学習することになる。
【0065】
処理モジュール614は、診断プラットフォーム610によって取得された音声データを、他のモジュールに適したフォーマットとなるように処理することができる。例えば、処理モジュール614は、診断モジュール616による分析に備えて、音声データに対してルール、ヒューリスティック又はアルゴリズムを適用し得る。別の例として、処理モジュール614は、分析モジュール618による分析に備えて、診断モジュール616によって生成された出力に対してルール、ヒューリスティック又はアルゴリズムを適用することができる。したがって、処理モジュール614は、適切なデータが診断プラットフォーム610の他のモジュールにアクセス可能であることを確実にする役割を担い得る。さらに、処理モジュール614は、診断プラットフォーム610の他のモジュールによって生成された出力が、(例えば、メモリ604内への)格納、又は、(例えば、通信モジュール608を介しての)伝送に適することを確実にする役割を担い得る。
【0066】
診断モジュール616は、診断プラットフォーム610によって取得された音声データに適用するための適切なモデルを識別する役割を担い得る。例えば、診断モジュール616は、音声データ、患者又は電子聴診器システムの属性に基づいて、適切なモデルを識別してもよい。これらの属性は、音声データに付随するメタデータ内で指定され得る。一例として、適切なモデルは、内部音が記録されている解剖学的領域に基づいて識別され得る。あるいは、診断モジュール616は、分析モジュール618によって生成される測定基準に基づいて、適切なモデルを識別してもよい。一例として、分析モジュール618が呼吸数を計算する役割を担う場合には、診断モジュール616は、続いて呼吸イベントを発見可能なモジュールを識別し得る。所望の(1つ以上の)測定基準は、医療専門家によって指定されてもよく、診断プラットフォーム610によって決定されてもよい。
【0067】
概して、診断モジュール616によって音声データに適用されるモデルは、メモリ604に維持される複数のモデルのうちの1つである。これらのモデルは、種々異なる呼吸イベント、病気等に関連付けられ得る。例えば、第1のモデルは、設計された後に吸息と呼息を識別するように訓練され、第2のモデルは、設計された後に、笛声音(wheezing)又は捻髪音、水泡音(crackling)のインスタンスを識別するように訓練され得る。
【0068】
大まかに言えば、各モデルは、音声データに適用される際に、患者の健康状態に関する洞察を提供し得る情報を伝達する出力を生成するアルゴリズムの集合(collection)を表し得る。例えば、診断モジュール616によって適用されるモデルが吸息及び呼息を識別する場合、該出力は、患者の呼吸が正常であるか異常であるかを確立するのに有用であり得る。別の例として、診断モジュール616によって適用されるモデルが笛声音(wheezing)又は捻髪音、水泡音(crackling)の事例を識別する場合、該出力は、患者が所与の疾患に罹患しているかどうかを確率するのに有用であり得る。
【0069】
いくつかの状況では、診断モジュール616によって適用されるモデルによって生成される出力は、それ自体では特に有用ではない。分析モジュール618は、これらの出力のコンテキストをより全体論的な意味で考慮する役割を担い得る。例えば、分析モジュール618は、診断モジュール616によって適用されるモデルによって生成された出力に基づいて、患者の健康を表す1つ以上の測定基準を生成し得る。これらの測定基準は、モデルによって生成された出力の完全な分析又は認識を必要とすることなく、患者の健康に関する洞察を提供し得る。例えば、診断モジュール616によって適用されるモデルが、音声データの分析に基づいて呼吸イベントを識別すると仮定する。呼吸イベントの知識は有用であり得る一方で、医療専門家は呼吸数などの測定基準により関心を示すことがある。分析モジュール618は、診断モジュール616によって識別された呼吸イベントに基づいて呼吸数を計算し得る。
【0070】
GUIモジュール620は、表示機構606上におけるレビューのために情報を提示する方法を確立する役割を担い得る。表示機構606の性質に応じて、様々なタイプの情報を提示が提示可能である。例えば、医療専門家に対して表示するために、診断モジュール616及び分析モジュール618によって導出され、推測され又は取得された情報がインタフェース上に提示され得る。別の例として、患者がいつ健康の変化を経験したかを示すために、視覚的フィードバックがインタフェース上に提示され得る。
【0071】
図7は、音声データの分析がレビューのためにインタフェース上に表示される前に、診断プラットフォームによって取得された音声データがバックグラウンドサービスによってどのように処理されるかを示すワークフロー図の例を含む。
図7に示すように、データは診断プラットフォームの「バックエンド」によって取得及び処理される一方で、そのデータの分析は、診断プラットフォームの「フロントエンド」によって提示される。医療専門家や患者等の個人もまた、フロントエンドを介して診断プラットフォームと対話可能であり得る。例えば、コマンドは、ディスプレイに表示されたインタフェースを介して発行される。さらに、診断プラットフォームは、以下でさらに論じるように、通知を生成可能であり得る。例えば、患者の呼吸数が所定の閾値を下回っていると診断プラットフォームが判断した場合、診断プラットフォームは、アラームとして機能する通知を生成してもよい。該通知は、ディスプレイを介して視覚的に提示され得る、及び/又は、スピーカーを介して聴覚的に提示され得る。
【0072】
呼吸数を確立するためのアプローチ
呼吸数を計算する従来のアプローチには、いくつかの欠点がある。
【0073】
いくつかのアプローチは、吸息及び呼息を、比較的長い時間間隔で観測することに依存している。この「観測間隔」は、60秒以上続くことも珍しくない。この観測間隔が非常に長いため、これらのアプローチでは、無呼吸のような短命のイベントを説明することができない。その結果、観測間隔全体にわたる呼吸数への影響がほとんどないため、医療専門家は、全く気付かないとは限らないが、呼吸の一時的な停止にほとんど気付かないおそれがある。呼吸の停止には即座に対処する必要があり得るため、呼吸数に対する理解を誤ると、重大な危害が生じる可能性がある。
【0074】
他のアプローチは、胸部の動き又は呼気空気中の呼気終末二酸化炭素(CO2)のモニタリングに依存している。しかしながら、これらのアプローチは、多くの事態において実際的又は適切ではない。例えば、胸部の動きは、特に患者が全身麻酔下にある又は医療イベント(発作など)を経験している場合において、呼吸イベントの正確な指標にならないことがあり、患者がマスクを着用していない場合には、呼気空気の組成が不明であることがある。
【0075】
本明細書では、音声データの分析を通じて呼吸数を計算することによって、これらの欠点に対処するアプローチを提示する。上述のように、このアプローチは、吸息及び呼息が一貫した正確な方法で検出されることに依存している。聴診では、これらの呼吸イベントは、医療専門家による診断決定のために重要である。
【0076】
大まかに言えば、このアプローチは、2つの段階、すなわち、吸息及び呼息が検出される第1の段階と、これらの吸息及び呼息が呼吸数を計算するために使用される第2の段階とを包含する。第1の段階は「検出段階」と称され、第2の段階は「計算段階」と称される。
【0077】
A.呼吸イベントの検出
図8は、検出段階の間に診断プラットフォームによって採用され得る計算パイプラインの概要を示す。この計算パイプライン(「計算フレームワーク」とも称される)の利点の1つは、そのモジュール設計である。各「ユニット」は、個別にテストされた後、最高の全体的なパフォーマンスを達成するために調整されることができる。さらに、一部のユニットの出力は、複数の目的に使用され得る。例えば、前処理中に生成されたスペクトログラムは、入力としてモデルに提供されること、及び/又は、リアルタイムレビューのためのインタフェースに掲示されることができる。
【0078】
単純化のため、このフレームワークは、前処理、分析及び後処理の3つの部分に分けられている。前処理は、音声データを処理することだけでなく、特徴エンジニアリング技術を採用することをも含み得る。分析は、呼吸イベントを識別するために訓練されたモデルを採用することを含み得る。上述のように、モデルは、出力として、単一の検出(例えば、分類又は診断)ではなく一連の検出(例えば、呼吸イベント)を生成するように設計されたニューラルネットワークを含み得る。各検出は、モデルによって独立して行われる個別の予測を表すことがある。最後に、後処理は、モデルによって生成された検出を検査及び/又は分割することを含み得る。通常、前処理は処理モジュール(例えば、
図6の処理モジュール614)によって実行され、分析は診断モジュール(例えば、
図6の診断モジュール616)によって実行され、後処理は分析モジュール(例えば、
図6の分析モジュール618)によって実行される。
【0079】
各部分に関するさらなる詳細は、以下に一例の文脈において提供される。当業者であれば、以下に提供される数字が例示のみを意図していることを認識するであろう。フレームワークの重要な側面の1つはその柔軟性であり、そのため、他の状況では他の数値が適用可能又は適切であり得る。
【0080】
I.前処理
この例では、肺によって生じた内部音の記録を表す音声データを、4キロヘルツ(kHz)に相当するサンプリング周波数で処理した。次に、この音声データに対してハイパスフィルタを次数10、カットオフ周波数80Hzで適用し、電気的干渉(約60Hz)、及び、心臓(約1~2Hz)又は別の内臓によって生じた内部音を除去した。これによって、診断プラットフォームは、目的でない別の内臓によって生じた音をフィルタリングするのに十分なカットオフ周波数を備えたハイパスフィルタを適用し得る。このフィルタリングされた音声データを、短時間フーリエ変換(STFT)を使用して処理した。この例では、STFTは、ウィンドウサイズ256のハミングウィンドウと、オーバーラップ率0.25とを有していた。これによって、約15秒の信号を、938×129サイズの対応するスペクトログラムへと変換することができた。目的となる内部音のスペクトル情報を活用するために、診断プラットフォームは、(i)スペクトログラム、(ii)メル周波数ケプストラム係数(MFCC)、及び、(iii)エネルギー合計を抽出した。この例では、スペクトログラムは、129ビンの対数振幅スペクトログラムであった。MFCCについては、診断プラットフォームは、20の静的係数、20のデルタ係数及び20の加速係数を抽出した。これを行うために、診断プラットフォームは、0~4,000Hzの周波数範囲内において、40のMelバンドを使用した。デルタ係数及び加速係数の計算に使用される幅は、9フレームであった。これにより、フレームあたり60ビンのベクトルが生成される。一方で、診断プラットフォームは、0~250Hz、251~500Hz及び501~1,000Hzの3つの異なる周波数帯域のエネルギー合計を計算し、それによってフレーム毎に3つの値を得た。
【0081】
これらの特徴を抽出した後、診断プラットフォームは、これらの特徴を連結して938×193の特徴マトリクスを形成した。次に、診断プラットフォームは、各特徴に対してmin-max正規化を適用し、正規化された特徴の値が0~1の間の範囲に及ぶようにした。
【0082】
II.分析
上述のように、前処理中に抽出された特徴を、入力として、呼吸イベントを識別するように訓練されたいくつかのモデルに提供した。最適なモデルを確立するために、抽出された同じ特徴を使用して6つのモデルをテストした。これらのモデルは、単方向回帰型ニューラルネットワーク(Uni-RNN)、単方向長短期記憶ニューラルネットワーク(uni-LSTM)、単方向ゲート付き回帰型ユニットニューラルネットワーク(Uni-GRU)、双方向回帰型ニューラルネットワーク(Bi-RNN)、双方向長短期記憶ニューラルネットワーク(Bi-LSTM)、及び双方向ゲート付き回帰型ユニットニューラルネットワーク(Bi-GRU)を含んでいた。総じて、これらのモデルは「ベースラインモデル」と称される。
【0083】
これらのベースラインモデルのアーキテクチャを
図9に示す。ベースラインモデルは、音声データの分析に基づいて呼吸イベントを検出できるように設計した。第1及び第2の層は回帰層であって、RNN、LSTM又はGRUであり得る。これらの回帰層は、特徴の時間情報を取り扱う。呼吸は通常周期的であるため、これらの回帰層は、ラベル付けされた例(「訓練データ」とも称される)から呼吸サイクルの性質を学習することができる。音声データ内における呼吸イベントの開始時間及び終了時間を検出するために、診断プラットフォームは、時間分散型全結合層を出力層として使用した。このアプローチによって、単一の検出ではなく、一連の検出(例えば、吸息又はアクションなし)を出力可能なモデルが得られた。シグモイド関数は、時間分散型全結合層の活性化関数として使用した。
【0084】
各ベースラインモデルによって生成された各出力は、サイズ938x1の検出ベクトルであった。このベクトルの各要素は、その値が閾値を超えた場合、対応する時間セグメントに吸息又は呼息が存在したことを示す1に設定され、それ以外の場合、その値は0に設定された。この例では、単一タスクの学習アプローチをベースラインモデルに使用したが、マルチタスクの学習アプローチもまた使用可能であった。
【0085】
ベンチマークモデルでは、適応モーメント推定(ADAM)をオプティマイザとして使用した。ADAMは、深層学習及び機械学習において重要なプロセスである確率的最適化を使用して、パラメータの適応学習率を計算する方法である。検証損失が10エポックの間に減少しなかった際、開始学習率をステップ減衰(0.2x)で0.0001に設定した。この学習プロセスは、50回連続して改善が見られなかった際に停止した。
【0086】
III.後処理
ベースラインモデルによって生成された検出ベクトルは、別の目的のためにさらに処理することができる。例えば、診断プラットフォームは、医療専門家によるリアルタイムモニタリングにて使用するために、各予測ベクトルをフレームから時間へと変換し得る。さらに、
図9に示すように、ドメイン知識が適用され得る。呼吸は生体によって行われることが知られているため、呼吸イベントの持続時間は、通常は一定範囲内にある。検出ベクトルが、短い間隔で連続する呼吸イベント(例えば、吸息)があることを示す際に、診断プラットフォームは、これらの呼吸イベントの連続性を検査した後に、それらの呼吸イベントをマージするかどうかを決定することができる。より具体的には、診断プラットフォームは、呼吸イベント間の間隔がT秒より小さい際に、j番目とi番目の呼吸イベントの間のエネルギーピークの周波数差(|p_j-p_i|)を計算することができる。この差が所定の閾値Pより小さい場合に、これらの呼吸イベントを単一の呼吸イベントとしてマージする。この例では、Tを0.5秒に設定し、Pを25Hzに設定した。呼吸イベントが0.05秒より短い場合には、診断プラットフォームはその後、単に呼吸イベントを完全に削除することができる。例えば、診断プラットフォームは、呼吸イベントが発生しなかったことを示すために、対応する(1つ以上の)セグメントに適用される(1つ以上の)ラベルを調整し得る。
【0087】
IV.タスクの定義及び評価
この例では、2つの異なるタスクが診断プラットフォームによって実行された。
【0088】
第1のタスクは、音声データのセグメントの分類であった。これを達成するため、各呼吸イベントの記録を、まずはスペクトログラムへと変換した。スペクトログラムの時間分解能は、上述のように、ウィンドウサイズとSTFTのオーバーラップ率とに依存する。便宜上、これらのパラメータを、各スペクトログラムが938x128のサイズのマトリクスになるように固定した。したがって、各記録を938セグメントに分割して、
図10に示すように、各セグメントを正解ラベル(ground truth label)に基づいて自動的にラベル付けした。
【0089】
記録の前処理及び分析が行われた後、診断プラットフォームは、938x1のサイズのシーケンシャル検出により対応する出力にアクセスできるようになる。この出力は、「推論結果」と称されることがある。シーケンシャル検出を正解セグメント(ground truth segment)と比較することにより、診断プラットフォームは、真陽性(TP)、真陰性(TN)、偽陽性(FP)及び偽陰性(FN)を定義することができる。続いて、これらのセグメントを分類するために使用されるモデルの感度及び特異性を計算することができる。
【0090】
第2のタスクは、音声データ内の呼吸イベントの検出であった。モデルによって行われたシーケンシャル検出を取得した後、診断プラットフォームは、同じラベルを持つ接続されたセグメントを、対応する呼吸イベントとなるように組み立てることができる。例えば、診断プラットフォームは、接続されたセグメントが、吸息、呼息又はアクションなしに対応することを特定し得る。さらに、診断プラットフォームは、組み立てられた各呼吸イベントの開始時間及び終了時間を導出し得る。この例では、モデルによって予測された1つの呼吸イベントが正解イベントと正しくマッチするかどうかを決定するために、ジャカードインデックス(JI)を使用した。JIの値が0.5を超えた場合、診断プラットフォームは、組み立てられた呼吸イベントをTPイベントとして指定した。JIの値が0を超えたが0.5を下回った場合、診断プラットフォームは、組み立てられた呼吸イベントをFNイベントとして指定した。JIの値が0の場合、診断プラットフォームは、組み立てられた呼吸イベントをFPイベントとして指定した。
【0091】
パフォーマンスを評価するために、診断プラットフォームは、各ベースラインモデルの精度、感度、陽性の予測値及びF1スコアを検査した。全ての双方向モデルが、単方向モデルよりも優れていた。この結果は、主として双方向モデルの複雑さ(及び、訓練可能なパラメータの数)の増加に起因している。全体として、Bi-GRUがこれらのベースラインモデルの中で最も有望であったが、他のベースラインモデルがBi-GRUよりも適している事態もあり得る。
【0092】
B.呼吸数の計算
呼吸数の信頼できる推定は、様々な病気の早期発見に重要な役割を果たす。異常な呼吸数は、種々異なる病気や、他の病理学的又は心因性の原因を示唆している可能性がある。呼吸数を継続的に確立するための臨床的に許容可能な正確な技術を探索することは、とらえどころのないものであることが判明している。上記のように、この臨床的ギャップを埋めるためにいくつかのアプローチが開発されてきたが、医療専門家から標準治療になるほどの十分な信用を得られたものはない.
【0093】
図11Aは、呼吸数を推定するためのアルゴリズムアプローチの大まかな図を含む。
図11Aに示すように、このアルゴリズムのアプローチは、診断プラットフォームに採用されているモデルによって予測される呼吸イベントに依存している。呼吸イベントを適切に識別することは、呼吸数を推定するための鍵となるため、検出段階及び計算段階は、一貫して高い精度で完了する必要がある。さらに、検出段階及び計算段階は、呼吸数がほぼリアルタイムで(例えば、30~60秒毎ではなく、数秒毎に)推定されるように、継続的に実行し得る。
【0094】
大まかに言えば、このアルゴリズムアプローチは、呼吸イベントの発生を追跡し、続いてスライディングウィンドウを使用して呼吸数を継続的に計算することに依存している。まず、診断プラットフォームによって実行されるアルゴリズムは、分析のために取得された音声データの一部を含むウィンドウの開始点を定義する。次に、診断プラットフォームは、ウィンドウの終了点を定義するために、上述したようなモデルによって推測された呼吸イベントをモニタリングすることができる。ウィンドウの開始点及び終了点は、所定数の呼吸イベントがその境界内に含まれるように定義され得る。ここでは、例えばウィンドウは3つの呼吸イベントを含むが、他の実施形態では、3つより多くの又は少ない呼吸イベントがウィンドウ内に含まれ得る。ウィンドウが3つの呼吸イベントを含むようにプログラムされた実施形態では、ウィンドウの開始点は、ウィンドウに含まれる第1の呼吸イベント1102の開始に対応し、ウィンドウの終了点は、第4の呼吸イベント1108の開始に対応する。第4の呼吸イベント1108がウィンドウの終了点を定義する一方で、第4の呼吸イベント1108は、最初はウィンドウ内に含まれない。
【0095】
図11Aに示すように、診断プラットフォームは、ウィンドウに含まれる吸息間の間隔に基づいて呼吸数を計算することができる。ここで、ウィンドウは、第1の呼吸イベント1102と、第2の呼吸イベント1104と、第3の呼吸イベント1106とを含む。上述のように、第4の呼吸イベント1108は、ウィンドウの終了点を定義するために使用され得る。「I」によって表される第1の期間は、第1の呼吸イベント1102の開始と第2の呼吸イベント1104の開始との間の時間間隔によって定義される。「II」によって表される第2の期間は、第2の呼吸イベント1104の開始と第3の呼吸イベント1106の開始との間の時間間隔によって定義される。「III」によって表される第3の期間は、第3の呼吸イベント1106の開始と第4の呼吸イベント1108の開始との間の時間間隔によって定義される。
【0096】
各期間は、フレームの数(すなわち、時間間隔)に対応する。例えば、診断プラットフォームによって取得された音声データが合計15秒の記録であり、処理中に記録が938セグメントに分割され、それぞれのセグメントの持続時間が約0.016秒であると仮定する。用語「セグメント」は、用語「フレーム」用語と交換可能に使用されることがある。ここで、第1、第2及び第3の期間の長さは約5秒であるが、第1、第2及び第3の呼吸イベント1102,1104,1106は、セグメント及び秒に関してそれぞれ異なる長さである。しかしながら、当業者は、呼吸イベント間の期間が互いに同一である必要がないことを認識するであろう。
【0097】
図11Aに示すように、呼吸数は、これらの期間に基づいてフレーム毎に計算することができる。一例として、「A」で表される15秒を考慮する。この時点では、第3の呼吸イベント1106がまだ開始していないため、第3の期間はまだ定義されていない。呼吸数は、120を秒単位における第1の期間及び第2の期間の合計で除算することによって計算され得る。「B」で表される16秒目から開始して、診断プラットフォームは、第3の呼吸イベント1106を認識する。したがって、16秒目から開始して、呼吸数は、120を秒単位における第2の期間及び第3の期間の合計で除算することによって計算され得る。
【0098】
通常、診断プラットフォームは、追加の呼吸イベントが識別されると、呼吸数を継続的な方式で計算する。換言すれば、呼吸数は、新しい期間が識別された際に「ローリング」方式で計算することができる。呼吸イベントが識別される(したがって、新しい期間が定義される)たびに、診断プラットフォームは、直近の期間を使用して呼吸数を計算する。一例として、第1及び第2の期間が、それぞれ5秒及び7秒に対応すると仮定する。この状況では、呼吸数は、1分あたり10回の呼吸(すなわち、120/(I+II)=120/(5+7))となる。別の一例として、第1及び第2の期間が、それぞれ4秒及び4秒に対応する仮定する。この状況では、呼吸数は1分あたり15回の呼吸(すなわち、120/(I+II)=120/(4+4))となる。別の期間(すなわち、第3の期間)が識別された後は、呼吸数は、第1及び第2の期間ではなく、第2及び第3の期間を使用して計算され得る。
【0099】
上述のように、呼吸は生体が行うことが知られているため、呼吸イベントの持続時間は、通常は一定範囲内にある。したがって、呼吸数を計算するために診断プラットフォームによって使用されるアルゴリズムは、特定のフレーム数又は秒数内に新たな呼吸イベントが推測されない場合、分母を増加させるようにプログラムされ得る。
図11Aでは、アルゴリズムは、新たな呼吸イベントが6秒以内に発見されなかったという決定に応答して、分母を増加させるようにプログラムされている。したがって、「C」で表される22秒では、診断プラットフォームは、120を第2の期間+6の合計で除算することによって、呼吸数を計算し得る。一方、「D」で表される23秒では、診断プラットフォームは、120を第2の期間+7の合計で除算することによって、呼吸数を計算し得る。
図11Aに示すように、診断プラットフォームは、新たな呼吸イベントが発見されるまで、1秒ごとに分母を増加させ続けることができる。
【0100】
このようなアプローチによって、呼吸数をほぼリアルタイムで更新し、それによって患者の健康状態の変化を反映することが確実になる。患者が完全に呼吸を停止した場合、診断プラットフォームによって計算された呼吸数は即座に0にはならないことがあるが、呼吸数はほぼ瞬時に減少傾向を示すことになり、このことが医療専門家への警告として役立つ。
【0101】
診断プラットフォームによって計算された呼吸数が異常に低い又は高い状況に対処するために、アルゴリズムは、第1の閾値(「下限閾値」とも称される)と第2の閾値(「上限閾値」とも称される)を用いてプログラムされ得る。呼吸数が下限閾値を下回った場合、アルゴリズムは、診断プラットフォームによって警告が提示されるべきであることを示し得る。さらに、診断プラットフォームが、呼吸数が下限閾値を下回っていることを決定した場合、診断プラットフォームは、あたかも呼吸数が実際に0であるかのように機能し得る。このようなアプローチによって、診断プラットフォームが、呼吸数が実際に0に達することを必要とすることなく、長期間にわたって呼吸イベントが発見されなかった状況に容易に対応可能になることが確実になる。同様に、呼吸数が上限閾値を超えている場合、アルゴリズムは、診断プラットフォームによって警告が提示されるべきであることを示し得る。下限閾値及び上限閾値は、患者や、患者に提供されるサービス等に基づいて、手動又は自動で調整され得る。例えば、小児患者の場合、下限閾値及び上限閾値はそれぞれ4及び60であり得、成人患者の場合、下限閾値及び上限閾値はそれぞれ4及び35であり得る。
【0102】
単純化のために、レビューのために(例えば、
図13A~Bに示すインタフェースに)掲示される呼吸数は整数値であり得るが、呼吸数は、小数点第1位又は第2位まで(つまり、10分の1又は100分の1まで)計算されてもよい。このことは、特に緊急事態において、医療専門家及び患者の混乱を避けるのに役立ち得る。上述のように、レビューのために掲示される呼吸数は、下限閾値を下回った又は上限閾値を超えた場合には、視覚的に改変され得る。例えば、呼吸数が下限閾値を下回った場合、診断プラットフォームは、呼吸数が検出不可能であることを示す代替要素(例えば、「-」又は「--」)を掲示してもよい。呼吸数が上限閾値を超えた場合、診断プラットフォームは、呼吸数が異常に高いことを示す別の代替要素(例えば、「35+」又は「45+」)を掲示してもよい。多くの事態において、医療専門家は、呼吸数が正確であることよりも、呼吸数が異常に高い時を知ることに関心がある。
【0103】
概して、診断プラットフォームは、記録時にほぼリアルタイムで取得される音声データのストリームを処理する。換言すれば、診断プラットフォームは、上述のように新しい呼吸イベントが発見される際に、呼吸数を継続的に計算し得る。しかしながら、いくつかの実施形態では、診断プラットフォームは、処理リソースを節約しようとするために、単一のフレーム毎には呼吸数を計算しない。代わりに、診断プラットフォームは呼吸数を定期的に計算し得るが、その場合であっても、呼吸数は通常、医療専門家が患者の健康状態の変化を確実に認識できるように、頻繁に(例えば、数秒毎に)計算されることになる。
【0104】
図11Bは、診断プラットフォームが、所定の頻度(例えば、2、3又は5秒毎)で更新される所定の長さ(例えば、12、15又は20秒)の記録にわたってスライディングウィンドウを使用して、どのようにして呼吸数を計算し得るか示す。
図11Bでは、境界ボックスは、音声データが処理されるスライディングウィンドウの境界を表す。所定の時間が経過した後、スライディングウィンドウの境界がシフトする。ここで、例えば、スライディングウィンドウは15秒をカバーしており、3秒シフトされるため、以前のスライディングウィンドウに含まれていた音声データの12秒が保持される。このようなアプローチにより、使用可能な処理リソースを過度に消費することなく、呼吸数を頻繁に(例えば、スライディングウィンドウの境界がシフトされるたびに)計算することが可能になる。
【0105】
呼吸数を計算する別のアプローチは、聴診を実行するために、MLやAIではなく自己相関に依存する。大まかに言えば、用語「自己相関」は、信号が、遅延の関数としての信号の遅延したコピーと相関するプロセスを示す。自己相関の分析は、繰り返しパターンを識別するための一般的な数学的ツールであるため、繰り返しイベントに関する情報を導出又は推測するためにデジタル信号処理においてよく使用される。
【0106】
診断プラットフォームが検出のために自己相関を使用する実施形態では、診断プラットフォームは、上述のように音声データの記録をスペクトログラムに変換するためにSTFTを使用する。次に、
図12に示すように、吸息と呼息との間の間隔を決定するために、自己相関係数が計算されて、記録のためにプロットされる。まず、診断プラットフォームは、ノイズを低減するために自己相関係数を正規化し得る。次に、閾値(例えば、15Hz)を下回るものを排除するために、自己相関係数にハイパスフィルタが適用され得る。さらに、診断プラットフォームは、自己相関係数をさらに改良するため、トレンド除去修正を実行し得る。
【0107】
自己相関係数を処理した後、診断プラットフォームは、60を1次ピークと2次ピークの間の呼吸間隔(RI)で除算することによって呼吸数を計算することができる。呼吸数指数によって、どのピークが選択されるかが決定され得る。例えば、呼吸数指数が高いことが好ましい。概して、約0.6未満の呼吸数指数は、不安定な呼吸数を示すものであるため、診断プラットフォームによって破棄されることがある。
【0108】
図13A~Bは、診断プラットフォームによって生成され得るインタフェースの例を含む。
図13Aは、医療専門家による診断決定を容易にするために、診断プラットフォームによって生成されたスペクトログラムがどのようにしてほぼリアルタイムで提示されるかを示す。一方、
図13Bは、患者の健康に関する追加の洞察を提供するために、デジタル要素(「グラフィック要素」とも称される)がどのようにスペクトログラムを重ね合わせるかを示す。ここでは、例えば、診断プラットフォームが呼吸イベントに対応すると決定したスペクトログラムの部分に、垂直バンドが重なっている。いくつかの実施形態では、これらの垂直バンドは呼吸サイクル全体(すなわち、吸息及び呼息)をカバーするが、他の実施形態では、これらの垂直バンドは呼吸サイクルの一部のみ(例えば、吸息のみ)をカバーすることに留意されたい。
【0109】
呼吸数は、医療専門家によるレビューのために(例えば、右上隅に)掲示され得る。診断プラットフォームが、呼吸数が異常であると決定した場合、掲示される値は、何らかの方法で視覚的に改変され得る。例えば、掲示される値は、医療専門家の注意を引くために、別の色で描画されたり、別の(例えば、より大きいサイズ)で描画されたり、「点滅」するように定期的に削除された後に再掲示されたりし得る。診断プラットフォームは、値が下限閾値(例えば、4、5又は8)を下回ったか上限閾値(例えば、35、45又は60)を超えた場合に、呼吸数が異常であると決定し得る。あるいは、診断プラットフォームは、所定の時間(例えば、10、15又は20秒)内に呼吸イベントが検出されていない場合に、呼吸数が異常であると決定し得る。
【0110】
図13Bに示すように、インタフェースは、診断プラットフォームによってサポートされる種々異なる機能に関連付けられた様々なアイコンを含み得る。記録アイコン1302は、選択された際に、インタフェース上に示されるコンテンツの記録を開始し得る。例えば、記録は、任意のデジタル要素と共にスペクトログラムを含んでいてもよく、また対応する音声データを含んでいてもよい。フリーズアイコン1304は、選択された際に、インタフェースを現在の表示のままフリーズさせ得る。したがって、フリーズアイコン1304が選択された際は、追加のコンテンツがインタフェースに掲示されないことがある。コンテンツは、フリーズアイコン1304がもう一度選択された後に、インタフェース上に再び表示され得る。制御アイコン1306は、選択された際に、インタフェースの様々な態様を制御し得る。例えば、制御アイコン1306は、(例えば、半永久的又は一時的にさらなる変更を防止するために)インタフェースをロックすること、インタフェースのレイアウトを変更すること、インタフェースの配色を変更すること、インタフェースについての入力機構(例えば、タッチか音声か)を変更する等を医療専門家に許可し得る。補足情報もまた、インタフェース上に表示されてもよい。例えば、
図13Bでは、インタフェースは、アクティブノイズキャンセル(ANC)、再生、及び、接続された電子聴診器システムの状態に関する情報を含む。したがって、医療専門家は、診断プラットフォームが存在する(及び、インタフェースが示されている)コンピューティングデバイスが、音声データの生成を担う電子聴診器システムに通信可能に接続されているかどうかを容易に観測可能であり得る。
【0111】
呼吸数の計算方法
図14は、音声データの分析を通じて呼吸イベントを検出し、続いてそれらの呼吸イベントに基づいて呼吸数を計算するプロセス1400のフロー図を示す。まず、診断プラットフォームは、患者の肺によって生成された音の記録を表す音声データを取得することができる(ステップ1401)。いくつかの実施形態では、診断プラットフォームは、電子聴診器システムから音声データを直接受信する。他の実施形態では、診断プラットフォームは、記憶媒体から音声データを獲得する。例えば、患者は、自分で録音した音声データを記憶媒体にアップロードすることが許可されていてもよい。別の例として、医療専門家は、自分で録音した音声データを記憶媒体にアップロードすることが許可されていてもよい。
【0112】
次に、診断プラットフォームは、訓練されたモデルによる分析に備えて、音声データを処理することができる(ステップ1402)。例えば、診断プラットフォームは、音声データにハイパスフィルタを適用することによって、フィルタリングされた音声データに基づいて、(i)スペクトログラム、(ii)一連のMFCC、及び、(iii)スペクトログラムの種々異なる周波数帯域にわたって合計されたエネルギーを表す一連の値を生成し得る。診断プラットフォームは、これらの特徴を連結して、特徴マトリクスとしてもよい。より具体的には、診断プラットフォームは、これらのスペクトログラム、一連のMFCC及び一連の値を連結して、訓練されたモデルに入力として提供され得る特徴マトリクスとしてもよい。いくつかの実施形態では、特徴マトリクスに対してmin-max正規化を実行し、各エントリが0~1の間の値を有するようにする。
【0113】
続いて、診断プラットフォームは、時間順に並べられたエントリを含むベクトルを生成するために、訓練されたモデルを音声データ(又は、音声データの分析)に適用することができる(ステップ1403)。より具体的には、診断プラットフォームは、上述のように、訓練されたモデルを特徴マトリクスに適用し得る。該ベクトル内の各エントリは、訓練済みモデルによって生成された、音声データの対応するセグメントが呼吸イベントを表すかどうかを示す検出を表し得る。該ベクトル内の各エントリは、音声データの異なるセグメントに対応し得るが、該ベクトル内の全てのエントリは、同じ持続時間の音声データのセグメントに対応し得る。例えば、診断プラットフォームによって取得された音声データが、持続時間の合計が15秒の記録を表していると仮定する。前処理の一部として、この記録は、同じ持続時間の938セグメントに分割され得る。これらのセグメントのそれぞれについて、訓練されたモデルは、音声データの対応する部分が呼吸イベントを表しているかどうかについての検出を表す出力を生成し得る。
【0114】
その後、診断プラットフォームは、上述のように該ベクトル内のエントリの後処理を実行し得る(ステップ1404)。例えば、診断プラットフォームは、該ベクトルを調査し、それによってエントリの所定の数よりも少ない数で区切られた同じタイプの呼吸イベントに対応する一対のエントリを識別した後、該一対のエントリが単一の呼吸イベントを表すことを示すように該一対のエントリをマージする。このことは、モデルが呼吸イベントを示さなかったセグメントが存在することが原因で呼吸イベントを見逃さないようにするために行われ得る。加えて又はこれに代えて、診断プラットフォームは、該ベクトルを調査し、それによって所定の長さよりも短い同じタイプの呼吸イベントに対応する一連の連続エントリを識別した後、該一連の連続するエントリによって表される呼吸イベントを削除するように該一連の連続エントリの各エントリに関連付けられたラベルを調整する。このことは、所定の長さ(例えば、0.25、0.50又は1.00秒)未満の呼吸イベントが認識されないようにすることを確実にするために行われ得る。
【0115】
次に、診断プラットフォームは、該ベクトルを調査することによって、(i)第1の呼吸イベントと、(ii)第2の呼吸イベントと、(iii)第3の呼吸イベントとを識別することができる(ステップ1405)。第2の呼吸イベントは、第1の呼吸イベントに続き得ると共に、第3の呼吸イベントは、第2の呼吸イベントに続き得る。各呼吸イベントは、音声データの対応するセグメントが呼吸イベントを表していることを示す、該ベクトル内の少なくとも2つの連続するエントリに対応し得る。連続するエントリの数は、診断プラットフォームによって課される呼吸イベントの最小の長さに対応し得る。
【0116】
続いて、診断プラットフォームは、(a)第1の呼吸イベントと第2の呼吸イベントとの間の第1の期間、及び、(b)第2の呼吸イベントと第3の呼吸イベントとの間の第2の期間を決定することができる(ステップ1406)。上述のように、第1の期間は、第1の呼吸イベントの開始から第2の呼吸イベントの開始まで及び得ると共に、第2の期間は、第2の呼吸イベントの開始から第3の呼吸イベントの開始まで及び得る。その後、診断プラットフォームは、第1及び第2の期間に基づいて呼吸数を計算することができる(ステップ1407)。例えば、診断プラットフォームは、呼吸数を確立するために、120を第1及び第2の期間の合計で除算し得る。
【0117】
図15は、患者の肺によって生じる音を含む音声データの分析に基づいて呼吸数を計算するためのプロセス1500のフロー図を表す。まず、診断プラットフォームは、時間順に並べられたエントリを含むベクトルを取得することができる(ステップ1501)。大まかに言えば、該ベクトルの各エントリは、音声データの対応するセグメントが呼吸イベントを表しているかどうかに関する検出を示し得る。上述のように、該ベクトルは、音声データに適用されるモデル、又は、診断プラットフォームによる音声データの分析によって、出力として生成され得る。
【0118】
次に、診断プラットフォームは、該ベクトルのエントリを調査することによって、(i)第1の呼吸イベントと、(ii)第2の呼吸イベントと、(iii)第3の呼吸イベントとを識別することができる(ステップ1502)。通常、このことは、該ベクトルを調査し、それによって同じタイプの呼吸イベントに関連付けられた連続したエントリを識別することによって達成される。例えば、診断プラットフォームは、該ベクトルを解析し、それによって同じ検出(例えば、
図9に示すように「吸息」又は「アクションなし」)を備えた連続したエントリを識別し得る。したがって、各呼吸イベントは、(i)所定の長さを超えており、かつ、(ii)前記音声データの前記対応するセグメントが、呼吸イベントを表していることを示している一連の連続するエントリに対応し得る。上述のように、診断プラットフォームは、偽陽性及び陰性が呼吸イベントを識別する能力に影響を与えないことを確実にするために、後処理を実行し得る。
【0119】
続いて、診断プラットフォームは、第1の呼吸イベントと第2の呼吸イベントとの間の第1の期間、及び、(b)第2の呼吸イベントと第3の呼吸イベントの間との第2の期間を決定することができる(ステップ1503)。
図15のステップ1503は、
図14のステップ1406と同様であり得る。その後、診断プラットフォームは、第1及び第2の期間に基づいて呼吸数を計算することができる(ステップ1504)。例えば、診断プラットフォームは、呼吸数を確立するために、呼吸数を確立するために、120を第1及び第2の期間の合計で除算し得る。
【0120】
いくつかの実施形態では、診断プラットフォームは、音声データに対応するスペクトログラムを含むインタフェースを表示させるように構成されている(ステップ1505)。そのようなインタフェースの例は、
図13A~Bに示されている。そのような実施形態では、診断プラットフォームは、医療専門家による診断決定を容易にするために、呼吸数をインタフェースに掲示し得る(ステップ1506)。さらに、診断プラットフォームは、上述のように呼吸数を閾値と比較し得(ステップ1507)、その後、比較の結果に基づいて適切なアクションを取り得る(ステップ1508)。例えば、診断プラットフォームが、呼吸数が下限閾値を下回っていることを決定した場合、診断プラットフォームは、そのことを示す通知を生成し得る。同様に、診断プラットフォームが、呼吸数が上限閾値を超えていることを決定した場合、診断プラットフォームは、そのことを示す通知を生成し得る。通常、該通知は、呼吸数が掲示されているインタフェース上に表示される。例えば、呼吸数は、下限閾値を下回った又は上限閾値を超えたという決定に応答して、視覚的に改変されてもよい。
【0121】
物理的な可能性に反しない限り、上記のステップは、様々な順序及び組み合わせで実行され得ることが想定される。
【0122】
例えば、プロセス1500は、追加の呼吸イベントが発見された際に呼吸数が継続的に再計算されるように繰り返し実行されてもよい。しかしながら、上述のように、診断プラットフォームは、呼吸イベントが発見されない場合、分母を増加させる(それにより、呼吸数を減少させる)ようにプログラムされ得る。
【0123】
別の例として、呼吸数は、2つを超える期間を使用して計算されてもよい。概して、単一の期間を使用して呼吸数を計算することは、医療専門家の役に立てるには値が比較的短期間で大きく変化しすぎるため、望ましくない。しかしながら、診断プラットフォームは、3つ以上の期間を使用して呼吸数を計算し得る。例えば、診断プラットフォームが、4つの呼吸イベントによって定義される3つの期間を使用して呼吸数を計算する役割を担うと仮定する。そのような状況では、診断プラットフォームは、
図14~15を参照して上述したようなステップのほとんどを実行し得る。しかしながら、診断プラットフォームは、180を第1、第2及び第3の期間の合計で除算することになる。該プロセスのほとんどが同じままである一方で、呼吸数を計算するために、診断プラットフォームは、「N」(ここで、「N」は期間の数である)の60倍を、それら「N」個の期間の合計で除算することになる。
【0124】
他のステップもまた、いくつかの実施形態では含まれ得る。例えば、呼吸異常の存在等の診断に関連する洞察が、インタフェース(例えば、
図13Bのインタフェース)に掲示され得るか、患者に関連付けられたプロファイルを表すデータ構造内に格納され得る。したがって、診断に関連する洞察が、対応する患者に関連付けられた音声データでエンコードされたデータ構造内に格納されてもよい。
【0125】
電子聴診器システムと診断プラットフォームの使用例
中等度から重度の麻酔の需要は、従来の挿管手術よりも徐々に大きくなっており、麻酔は医療施設における主流の治療法となってきている。しかしながら、呼吸停止や気道閉塞のリスクは、依然として排除することができない。患者の呼吸状態を直接的かつ継続的に監視する方法が不足しており、上述の聴診主導のアプローチは、この問題の解決策となる。
【0126】
世界保健機関(WHO)によって発行された手術安全ガイダンスによると、中等度の非挿管麻酔は、担当の医療専門家による一貫した監視が必要とされている。このことは、従来では聴診に基づく換気の確認、呼気終末CO2のモニタリング、患者との口頭でのコミュニケーションを含む、いくつかの方法によって達成されてきた。しかしながら、これらの従来のアプローチは、不可能ではないにしても、多くの事態では非現実的である。
【0127】
上記の聴診主導のアプローチは、これらの従来のアプローチには適さない事態において採用することができる。例えば、聴診主導のアプローチは、痛みを軽減するために鎮静剤が使用されることが多い形成外科、消化器内視鏡検査及び歯科的処置などの事態において使用され得る。別の例として、聴診主導のアプローチは、病気が伝染するリスクが高い事態(例えば、呼吸器疾患のある患者の治療)において使用され得る。ここで説明するアプローチの最も重要な用途の1つは、気道が閉塞していることを聴診によって迅速に発見できることである。電子聴診器システムと診断プラットフォームとを組み合わせることによって、医療専門家は、患者の呼吸音を人力で評価する必要なく、患者を継続的にモニタリングすることが可能になる。
【0128】
A.形成外科
鼻形成術等の特定の処置では、必要なマスクを患者が着用できなくなるため、呼気終末CO2を使用して呼吸状態をモニタリングすることが妨げられることになる。周辺機器の酸素濃度計には固有の遅延があり、酸素飽和度があるレベルを下回った際にしか通知を生成できない。
【0129】
B.消化器内視鏡検査
従来では、消化器内視鏡検査中の患者の呼吸状態を監視するために、末梢血酸素濃度計と呼気終末CO2モニタとが使用されてきた。これら2つのアプローチには固有の遅延があり、酸素飽和度低下量又は呼気終末量が少なくとも一定量変化した際にしか通知を提供できない。
【0130】
C.歯科的処置
歯科的処置の間は、医療専門家がバイタルサインを継続的にモニタリングすることは困難である。歯科的処置が行われている間は、高い集中力が求められるだけでなく、医療専門家が1人か2人しかいないことも珍しくない。さらに、患者は自分の唾液によって簡単に吐き気を催したり窒息したりする可能性があり、これらの患者が麻酔の影響下にある場合には特にリスクが高い。
【0131】
D.防疫
病気の伝染を防ぐために、患者が隔離されることはよくある。隔離が必要な場合、医療専門家が従来の聴診を行うのは危険な場合がある。さらに、医療専門家は、防護ガウンやマスク等の個人用保護具(PPE)を着用している間は、聴診を行うことができないことがある。単純に言えば、隔離とPPEとの組み合わせによって、患者の呼吸状態を適切に評価することが困難になる可能性がある。
【0132】
電子聴診器システム及び診断プラットフォームは、呼吸イベントを視覚化する手段を提供するだけでなく、聴診音の再生を開始して、瞬時に通知を生成するために使用することができる。医療専門家は、
図16に示すように、聴診音を聞いて呼吸イベントを確認することができ、これを使用して、気道が部分的に閉塞しだした時点、又は、呼吸数が不安定になってきた時点を確立することができる。
【0133】
処理システム
図17は、本明細書に記載の少なくともいくつかの動作を実施可能な処理システム1700の例を示すブロック図である。例えば、処理システム1700のコンポーネントは、診断プラットフォームを実行するコンピューティングデバイス上でホストされ得る。コンピューティングデバイスの例には、電子聴診器システム、携帯電話、タブレットコンピュータ、パーソナルコンピュータ及びコンピュータサーバが含まれる。
【0134】
処理システム1700は、プロセッサ1702と、メインメモリ1706と、不揮発性メモリ1710と、ネットワークアダプタ1712(例えば、ネットワークインタフェース)と、ビデオディスプレイ1718と、入力/出力デバイス1720と、制御デバイス1722(例えば、キーボード、ポインティングデバイス又はボタン等の機械的入力)と、記憶媒体1726を含むドライブユニット1724と、バス1716に通信可能に接続された信号生成デバイス1730とを含む。バス1716は、適切なブリッジ、アダプタ又はコントローラによって接続される1つ以上の物理バス及び/又はポイントツーポイント接続を表す抽象化として示されている。したがって、バス1716には、システムバス、周辺機器相互接続(PCI)バス、PCI-Expressバス、HyperTransportバス、業界標準アーキテクチャ(ISA)バス、小型コンピュータシステムインタフェース(SCSI)バス、USB、集積回路間(I2C)バス、又は、電気電子技術者協会(IEEE)標準1394に準拠したバスが含まれ得る。
【0135】
処理システム1700は、コンピュータサーバ、ルータ、デスクトップコンピュータ、タブレットコンピュータ、携帯電話、ビデオゲームコンソール、ウェアラブル電子デバイス(例えば、時計又はフィットネストラッカー)、ネットワーク接続(「スマート」)デバイス(例えば、テレビ又はホームアシスタントデバイス)、拡張現実又は仮想現実システム(例えば、ヘッドマウントディスプレイ)、又は、処理システム1700によって行われる(1つ以上の)アクションを指定する一連の命令(シーケンシャル又はその他)を実行可能な別の電子デバイスのアーキテクチャと同様のコンピュータプロセッサアーキテクチャを共有し得る。
【0136】
メインメモリ1706、不揮発性メモリ1710及び記憶媒体1726は、単一の媒体として示されているが、用語「記憶媒体」及び「機械可読媒体」は、1つ以上の命令セット1728を格納する単一の媒体又は複数の媒体を含むものと解釈されるべきである。用語「記憶媒体」及び「機械可読媒体」はまた、処理システム1700による実行のための一連の命令を格納、符号化又は運搬可能な任意の媒体を含むと解釈されるべきである。
【0137】
概して、本開示の実施形態を実施するために実行されるルーチンは、オペレーティングシステム、又は、特定のアプリケーション、コンポーネント、プログラム、オブジェクト、モジュール若しくは一連の命令(まとめて「コンピュータプログラム」と称される)の一部として実装され得る。コンピュータプログラムは、典型的には、様々な時点でコンピューティングデバイス内の様々なメモリ及び記憶デバイス内に設定される1つ以上の命令(例えば、命令1704,1708,1728)を含む。プロセッサ1702によって読み取られて実行される際、これらの命令は、本開示の様々な態様を実行するための動作を処理システム1700に実行させる。
【0138】
実施形態は、完全に機能するコンピューティングデバイスの文脈で説明したが、当業者であれば、様々な実施形態が様々な形態のプログラム製品として配布可能であることを理解するであろう。本開示は、実際に配布を行うために使用される機械又はコンピュータ可読媒体の特定のタイプに関係なく適用される。機械可読媒体及びコンピュータ可読媒体のさらなる例には、揮発性メモリ、不揮発性メモリ1710、リムーバブルディスク、ハードディスクドライブ(HDD)、光ディスク(例えば、コンパクトディスク読み取り専用メモリ(CD-ROM)及びデジタルバーサタイルディスク(DVD))等の記録可能媒体、クラウドベースの記憶媒体、並びに、デジタル及びアナログ通信リンク等の伝送タイプのメディア等が含まれる。
【0139】
ネットワークアダプタ1712は、処理システム1700が、ネットワーク1714内のデータを、処理システム1700及び外部エンティティによってサポートされる任意の通信プロトコルを介して、処理システム1700の外部にあるエンティティと仲介することを可能にする。ネットワークアダプタ1712には、ネットワークアダプタカード、ワイヤレスネットワークインタフェースカード、スイッチ、プロトコルコンバータ、ゲートウェイ、ブリッジ、ハブ、レシーバ、リピータ、又は、(例えば、Bluetooth又はWi-Fi経由の通信を有効にする)集積回路を含む送受信器が含まれ得る。
【0140】
備考
本技術の様々な実施形態についての前述の説明は、例示及び説明の目的で提供されている。それらの説明は、網羅的であることや、特許請求された主題を開示の厳密な形式に限定することは意図されていない。
【0141】
数多くの修正及び変形は、当業者にとって明らかであろう。実施形態は、本技術の原理及びその実際の応用を最もよく説明するために選択及び説明されており、それによって、関連技術の当業者が、特許請求された主題、様々な実施形態及び特定の用途に適した様々な修正を理解することを可能にするものである。
【国際調査報告】