IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ レスアップ ヘルス リミテッドの特許一覧

<>
  • 特表-被験者音声におけるイベント検出 図1
  • 特表-被験者音声におけるイベント検出 図2
  • 特表-被験者音声におけるイベント検出 図3
  • 特表-被験者音声におけるイベント検出 図4
  • 特表-被験者音声におけるイベント検出 図4A
  • 特表-被験者音声におけるイベント検出 図5
  • 特表-被験者音声におけるイベント検出 図6
  • 特表-被験者音声におけるイベント検出 図7
  • 特表-被験者音声におけるイベント検出 図8
  • 特表-被験者音声におけるイベント検出 図9
  • 特表-被験者音声におけるイベント検出 図10
  • 特表-被験者音声におけるイベント検出 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-07-11
(54)【発明の名称】被験者音声におけるイベント検出
(51)【国際特許分類】
   G10L 25/66 20130101AFI20230704BHJP
   A61B 5/08 20060101ALI20230704BHJP
【FI】
G10L25/66
A61B5/08
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022575489
(86)(22)【出願日】2021-06-18
(85)【翻訳文提出日】2022-12-14
(86)【国際出願番号】 AU2021050636
(87)【国際公開番号】W WO2021253093
(87)【国際公開日】2021-12-23
(31)【優先権主張番号】2020902025
(32)【優先日】2020-06-18
(33)【優先権主張国・地域又は機関】AU
(81)【指定国・地域】
(71)【出願人】
【識別番号】519281217
【氏名又は名称】レスアップ ヘルス リミテッド
(74)【代理人】
【識別番号】110002000
【氏名又は名称】弁理士法人栄光事務所
(72)【発明者】
【氏名】ウッド,ジャワン タナー
(72)【発明者】
【氏名】ペルトネン,ヴェサ ツオマス クリスチャン
(72)【発明者】
【氏名】メイ,ジョン キャンベル
(72)【発明者】
【氏名】パートリッジ,ニコラス キム
【テーマコード(参考)】
4C038
【Fターム(参考)】
4C038ST04
4C038SV05
4C038SX05
(57)【要約】
被験者からの音声のデジタル音声記録を識別するための方法であって、セグメントは、着目する特定の音声イベントを含み、方法は、フィルタリングされたデジタル音声信号を生成するために、音声イベントの特性周波数の範囲に基づいて前記デジタル音声記録をフィルタリングすることと、対応する信号エンベロープを生成するために、フィルタリングされたデジタル音声信号を処理することと、統計分布を信号エンベロープにフィッティングすることと、統計分布および予め規定された確率レベルに基づいて、信号エンベロープに対する閾値レベルを決定することと、閾値レベルを超える信号エンベロープのセグメントを識別し、それにより、被験者からの音声のデジタル音声記録の対応するセグメントを、着目する特定の音声イベントを含むデジタル音声記録のセグメントとして識別することと、を有する。
【選択図】図1
【特許請求の範囲】
【請求項1】
被験者からの音声のデジタル音声記録のセグメントを識別するための方法であって、
前記セグメントは、着目する特定の音声イベントを含み、
前記方法は、
フィルタリングされたデジタル音声信号を生成するために、前記音声イベントの特性周波数の範囲に基づいて前記デジタル音声記録をフィルタリングすることと、
対応する信号エンベロープを生成するために、前記フィルタリングされたデジタル音声信号を処理することと、
統計分布を前記信号エンベロープにフィッティングすることと、
前記統計分布および予め規定された確率レベルに基づいて、前記信号エンベロープに対する閾値レベルを決定することと、
前記閾値レベルを超える前記信号エンベロープのセグメントを識別し、それにより、前記被験者からの音声の前記デジタル音声記録の対応するセグメントを、前記着目する特定の音声イベントを含む前記デジタル音声記録のセグメントとして識別することと、
を有する方法。
【請求項2】
第1のダウンサンプリングされたデジタル音声信号を生成するために、前記デジタル音声記録のサンプルレートが整数分の1にて減少される第1のダウンサンプリングを適用することを含む、請求項1に記載の方法。
【請求項3】
前記第1のダウンサンプリングされたデジタル音声信号は、前記着目する音声イベントに対して選択される前記特性周波数の範囲にてフィルタリングされ、それにより、第1のダウンサンプリングされ、かつ、イベントフィルタリングされたデジタル音声信号を生成する、請求項2に記載の方法。
【請求項4】
前記着目するイベントは、呼吸音を含み、
前記デジタル音声記録をフィルタリングすることは、ハイパスフィルタを適用することを含む、請求項3に記載の方法。
【請求項5】
前記着目するイベントは、いびき音を含み、
前記デジタル音声記録をフィルタリングすることは、ローパスフィルタを適用することを含む、請求項3に記載の方法。
【請求項6】
対応する信号エンベロープを生成するために、前記フィルタリングされたデジタル音声信号を処理することは、エンベロープ検出処理によって実装される、請求項3から5のいずれか一項に記載の方法。
【請求項7】
前記エンベロープ検出処理は、絶対値フィルタを、前記第1のダウンサンプリングされ、かつ、イベントフィルタリングされた信号に適用して、絶対値フィルタリングされた信号を生成することを含む、請求項6に記載の方法。
【請求項8】
前記絶対値フィルタリングされた信号は、ローパスフィルタリングされた絶対値信号を生成するために、順逆フィルタによってフィルタリングされる、請求項7に記載の方法。
【請求項9】
前記信号エンベロープを生成するために、第2のダウンサンプリングを、前記ローパスフィルタリングされた絶対値信号に適用することを含み、
前記信号エンベロープは、前記音声記録の振幅の推定である第1の信号エンベロープを含む、請求項8に記載の方法。
【請求項10】
前記第2のダウンサンプリングを適用することは、14.7kHzから100Hzまでのリサンプリングすることを含む、請求項9に記載の方法。
【請求項11】
前記デジタル音声記録のパワー推定を含む第2の信号エンベロープを生成するために、対数圧縮を前記第1の信号エンベロープに適用することを含む、請求項9または10に記載の方法。
【請求項12】
前記統計分布を前記信号エンベロープにフィッティングすることは、前記統計分布を、前記パワー推定を含む前記第2の信号エンベロープにフィッティングすることを含む、請求項11に記載の方法。
【請求項13】
前記統計分布を前記信号エンベロープにフィッティングすることは、ヒストグラムを生成するために、前記信号エンベロープを構成するサンプルを複数のビンに分類することを含む、請求項1から12のいずれか一項に記載の方法。
【請求項14】
前記統計分布をフィッティングすることは、前記ヒストグラムのモーダルビンを選択することを含み、
前記モーダルビンは、最も大きい数のサンプルに分類されたビンである、請求項13に記載の方法。
【請求項15】
前記統計分布は、ラムダパラメータを有するポアソン分布を含み、
前記統計分布をフィッティングすることは、前記ラムダパラメータを前記モーダルビンの数に設定することを含む、請求項14に記載の方法。
【請求項16】
前記統計分布および前記予め規定された確率レベルに基づいて前記信号エンベロープに対する前記閾値レベルを決定することは、前記統計分布に関する累積分布関数(CDF:Cumulative Distribution Function)を計算することを含む、請求項1から15のいずれか一項に記載の方法。
【請求項17】
前記信号エンベロープに対する前記閾値レベルを決定することは、前記予め規定された確率に対応するビンである閾値ビンを取り出すことを含み、
前記予め規定された確率レベルは、前記CDFの確率レベルを含む、請求項16に記載の方法。
【請求項18】
前記閾値レベルを決定することは、前記閾値レベルを、前記閾値ビンのサンプルの大きさの範囲からの値へ設定することを含む、請求項17に記載の方法。
【請求項19】
前記閾値レベルは、前記閾値ビンのサンプルの大きさの前記範囲の上限に設定される、請求項17または18に記載の方法。
【請求項20】
時間フィルタは、前記着目するイベントに基づいて、時間の予め規定された範囲に入らないセグメントを選別することが適用される、請求項16から19のいずれか一項に記載の方法。
【請求項21】
前記着目するイベントは、いびき音を含み、
前記時間の範囲は、225ミリ秒より大きく、かつ、4秒より小さい、請求項20に記載の方法。
【請求項22】
非揮発態様にて、かつ、前記デジタル音声記録に関連して、前記閾値レベルを超える前記信号エンベロープの前記セグメントそれぞれに対し、開始および終了の時間を示す情報を記録することを含む、請求項1から21のいずれか一項に記載の方法。
【請求項23】
特定の着目する音声イベントを含む被験者のデジタル音声記録の部分を識別するように構成された音声イベント識別マシンを有する装置であって、
前記デジタル記録を処理するためのプロセッサと、
前記プロセッサとデータ通信を行うデジタルメモリであって、前記プロセッサを構成するための命令を格納し、前記命令は、前記プロセッサを、
前記音声イベントの特徴周波数の範囲に基づいて、前記記録をフィルタリングし、
前記フィルタリングされた記録を処理して、対応する信号エンベロープを生成し、
統計分布を前記信号エンベロープにフィッティングさせて、それにより、所定の確率レベルに対応する閾値レベルを決定し、
前記閾値を超える前記信号エンベロープのセグメントを識別し、それにより、前記特定の音声イベントを含むセグメントとして、前記デジタル音声記録の対応するセグメントを識別する、
ことを実行するように構成させる、デジタルメモリと、
を有する装置。
【請求項24】
前記被験者の音声を捉えるように構成されるマイクを含む、請求項23に記載の装置。
【請求項25】
フィルタと、前記被験者の前記音声をデジタル音声信号に変換するように構成されアナログ-デジタルコンバータとを含む音声インターフェースを含む、請求項23または24に記載の装置。
【請求項26】
前記装置は、前記プロセッサにアクセス可能な前記デジタルメモリに、前記デジタル音声記録として前記デジタル音声信号を格納するように構成される、請求項25に記載の装置。
【請求項27】
ヒューマンマシンインターフェースを含む、請求項23から26のいずれか一項に記載の装置。
【請求項28】
前記デジタルメモリに格納された前記命令は、前記プロセッサに、前記着目するイベントを含む前記デジタル音声記録におけるセグメントを識別する情報を含む前記ヒューマンマシンインターフェースにおいて、情報を表示するように構成する命令を含む、請求項27に記載の装置。
【請求項29】
前記デジタルメモリに格納された前記命令は、前記プロセッサに、前記着目するイベントを示す情報を含む前記ヒューマンマシンインターフェースにおいて、情報を表示するように構成する命令を含む、請求項28に記載の装置。
【請求項30】
前記ヒューマンマシンインターフェースにおいて表示される前記情報は、前記着目するイベントを含むことを識別するセグメントの数のそれぞれに関して、開始および終了の時間を示す情報を含む、請求項28または29に記載の装置。
【請求項31】
前記デジタルメモリは、前記プロセッサを、非一時的な方法にて各識別されたセグメントに対する開始および終了の時間を記録し、それにより、前記デジタル音声記録に関して、前記着目するイベントを含む明確なラベル付けを行うように構成する命令を含む、請求項30に記載の装置。
【請求項32】
請求項1の前記方法を実装するために1または複数のプロセッサによって実行される、有形の非一時的命令を含むマシン可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本出願は、2020年6月18日出願のオーストラリア仮特許出願第2020902025号の優先権を主張し、同出願の開示は参照により本明細書に援用される。
【0002】
本発明は、医療装置、より具体的には、被験者の音声の記録を解析することにより、特定の音声イベント、例えば、いびき音や喘鳴のような呼吸音の存在を検出するためのシステム、装置、および方法に関する。
【背景技術】
【0003】
先行技術の方法、装置、又は文献へのいかなる言及も、これらが通常の一般知識を成すかその一部を成すことの証拠又は認定に当たるものと解釈されてはならない。
【0004】
被験者の音声を電気信号に変換するための変換器を含み、更に、変換器に応答し、同時に、被験者の音声を処理して呼吸器疾患の存在の予測を生成する様々なアセンブリをさらに含む医療機器が知られている。疾患の症状が、いびきや喘鳴などの呼吸音などのイベントである場合、例えば背景の雑音とは対照的に、イベントを含む被験者の音声のセグメントを識別できるように医療機器を改善できれば有利である。イベントのセグメントを迅速に識別するように構成された医療機器は、イベントを含むセグメントのみをさらに処理し、記録の他の部分をすばやく通すように機器を構成できるため、機器をより効率的にする。
【0005】
被験者の音声における着目特定のイベントを識別するための多くのアプローチが知られている。
例えば、そのような手法の1つは、「Obstructive sleep apnea screening by integrating snore feature classes. Abeyratne U 2013 https://www.ncbi.nlm.nih.gov/pubmed/23343563」や、他には「Dynamics of snoring sounds and its connection with obstructive sleep apnea. A. Alencar 2013」に開示されている。
【0006】
これらの技術はいずれも、被験者の記録からいびきと呼吸音を検出する必要がある。しかしながら、いびきと呼吸音のレベルは、変換器によってキャプチャされた記録の背景のノイズレベルに比べて非常に低い場合がある。さらに、いびきを検出するためのピッチベースの技術は、識別可能なピッチを有さない呼吸音を検出できない。
【0007】
背景ノイズに対するイベントに関連する音声の信号対ノイズ比が非常に低い場合がある。したがって、そのような目的を達成するための医療機器を製造することは技術的に困難である。被験者の記録の音量レベルは非常に低く、着目するイベントの多くは背景ノイズに埋もれている。
【発明の概要】
【発明が解決しようとする課題】
【0008】
現在利用可能な解決策の改善または少なくとも有用な代替となる、実質的な背景ノイズが存在する可能性がある対象から、1または複数の種類の着目する音声イベントを検出する課題に対する解決策が必要である。
【課題を解決するための手段】
【0009】
本発明の第1の態様によると、音声のデジタル音声記録のセグメントを識別するための方法であって、
セグメントは、着目する特定の音声イベントを含み、
前記方法は、
音声イベントの特性周波数の範囲に基づいてデジタル音声記録をフィルタリングし、フィルタリングされたデジタル音声信号を生成することと、
フィルタリングされたデジタル音声信号を処理して、対応する信号エンベロープを生成することと、
統計分布を信号エンベロープにフィッティングすることと、
統計分布および所定の確率レベルに基づいて、信号エンベロープに対する閾値レベルを決定することと、
閾値レベルを超える信号エンベロープのセグメントを識別し、それにより、被験者からの音声のデジタル音声記録の対応するセグメントを、着目する特定の音声イベントを含むデジタル音声記録のセグメントとして識別することと、
を有する方法が提供される。
【0010】
一実施形態において、デジタル音声記録は、複数のフレームから構成されるデジタル音声信号の記録である。例えば、デジタル音声信号は、複数の連続した重複しないフレームを含んでよい。一例では、フレームはそれぞれ5分間の長さであるが、これより短い、もしくは、長くてもよい。
【0011】
一実施形態において、デジタル音声信号は、44.1kHzのサンプリングレートで作成される。
【0012】
一実施形態において、方法は、デジタル音声記録のサンプルレートを整数分の1に減少する第1のダウンサンプリングを適用して、第1のダウンサンプリングされたデジタル音声信号を生成することを含む。例えば、デジタル音声信号は、第1のダウンサンプリングされた音声信号が14.7kHzのサンプリングレートを有するように、44.1kHzから14.7kHzへの3分の1にダウンサンプリングされてよい。
【0013】
一実施形態において、第1のダウンサンプリングされたデジタル音声信号は、特性周波数の範囲でフィルタリングされて、着目する音声イベントを選択し、それによって、第1のダウンサンプリングされ、イベントフィルタリングされたデジタル音声信号を生成する。
【0014】
一実施形態において、着目するイベントは呼吸音を含み、デジタル音声記録をフィルタリングすることはハイパスフィルタを適用することを含む。
【0015】
一実施形態において、着目するイベントはいびき音を含み、デジタル音声記録をフィルタリングすることはローパスフィルタを適用することを含む。
【0016】
一実施形態において、フィルタリングされたデジタル音声信号を処理して対応する信号エンベロープを生成することは、エンベロープ検出処理によって実装される。
【0017】
一実施形態において、エンベロープ検出処理は、絶対値フィルタを第1のダウンサンプリングされ、イベントフィルタリングされた信号に適用して、絶対値フィルタリングされた信号を生成することを含む。
【0018】
一実施形態において、絶対値フィルタリングされた信号は、順方向および逆方向フィルタによってフィルタリングされ、ローパスフィルタリングされた絶対値信号が生成される。
【0019】
一実施形態において、方法は、ローパスフィルタリングされた絶対値信号に第2のダウンサンプリングを適用して信号エンベロープを生成することを含み、信号エンベロープは、音声記録の振幅の推定である第1の信号エンベロープを含む。
【0020】
一実施形態において、第2のダウンサンプリングを適用することは、14.7kHzから1000Hzへリサンプリングすることを含む。
【0021】
一実施形態において、方法は、第1の信号エンベロープに対数圧縮を適用して、デジタル音声記録のパワー推定を含む第2の信号エンベロープを生成することを含む。
【0022】
一実施形態において、統計分布を信号エンベロープにフィッティングすることは、統計分布を、パワー推定を含む第2の信号エンベロープにフィッティングすることを含む。
【0023】
一実施形態において、統計分布を信号エンベロープにフィッティングすることは、信号エンベロープを構成するサンプルを複数のビンに分類してヒストグラムを生成することを含む。例えば、一実施形態では、300個のビンがあってよい。
【0024】
一実施形態において、統計分布をフィッティングすることは、ヒストグラムのモーダルビンを選択することを含み、モーダルビンは、最大数のサンプルが分類されたビンである。
【0025】
一実施形態において、ビン番号nは、n×ステップサイズ+最小から、(n+1)×ステップサイズ+最小の範囲にあるサンプルを含む。
【0026】
一実施形態において、統計分布は、ラムダパラメータを有するポアソン分布を含み、統計分布をフィッティングすることは、ラムダパラメータをモーダルビンの数に設定することを含む。
【0027】
一実施形態において、統計分布および所定の確率レベルに基づいて信号エンベロープに対する閾値レベルを決定することは、統計分布に関して累積分布関数(CDF:Cumulative Distribution Function)を計算することを含む。
【0028】
一実施形態において、信号エンベロープに対する閾値レベルを決定することは、所定の確率に対応するビンである閾値ビンを見つけることを含み、所定の確率レベルはCDF上の確率レベルを含む。
【0029】
一実施形態において、閾値レベルを決定することは、閾値ビン内のサンプルの大きさの範囲からの値に閾値レベルを設定することを含む。
【0030】
一実施形態において、閾値レベルは、閾値ビン内のサンプルの大きさの範囲の上限に設定される。
【0031】
一実施形態において、着目するイベントに基づく期間の所定の範囲内に収まらないセグメントを選別するために、時間フィルタが適用される。
【0032】
一実施形態において、着目するイベントはいびき音を含み、基幹の範囲は225ミリ秒より大きく、4秒より小さい。
【0033】
一実施形態において、方法は、閾値レベルを超える信号エンベロープの各セグメントの開始時間と終了時間を示す情報を、不揮発性でデジタル音声記録に関連付けて記録することを含む。
【0034】
本発明の更なる態様によると、着目する特定の音声イベントを含む被験者のデジタル音声記録の部分を識別するように構成された音声イベント識別装置であって、
デジタル記録を処理するためのプロセッサと、
プロセッサとデータ通信するデジタルメモリであって、プロセッサを、
音声イベントの特性周波数の範囲に基づいて記録をフィルタリングし、
フィルタリングされた記録を処理して、対応する信号エンベロープを生成し、
統計分布を信号エンベロープにフィッティングし、それにより、所定の確率レベルに対応する閾値レベルを決定し、
閾値を超える信号エンベロープのセグメントを識別し、それにより、特定の音声イベントを含むセグメントとしてデジタル音声記録の対応するセグメントを識別する
ようにプロセッサを構成する命令を格納するデジタルメモリと、
を有する音声イベント装置が提供される。
【0035】
一実施形態において、装置は、被験者の音声を取得するように構成されたマイクを含む。
【0036】
一実施形態において、装置は、被験者の音声をデジタル音声信号に変換するように構成されたフィルタ、および、アナログ-デジタル変換器を含む。
【0037】
一実施形態において、装置は、プロセッサにアクセス可能なデジタルメモリに、デジタル音声記録としてデジタル音声信号を格納するように構成される。
【0038】
一実施形態において、装置は、ヒューマンマシンインターフェースを含む。
【0039】
一実施形態において、デジタルメモリに格納された命令は、プロセッサに、着目するイベントを含むデジタル音声記録内のセグメントを識別するための情報を含むヒューマンマシンインターフェース上に、情報を表示するように構成するための命令を含む。
【0040】
一実施形態において、デジタルメモリに格納された命令は、プロセッサに、着目するイベントを示す情報を含むヒューマンマシンインターフェース上に、情報を表示するように構成するための命令を含む。
【0041】
一実施形態において、ヒューマンマシンインターフェースに表示される情報は、着目するイベントを含むことを識別された複数のセグメントのそれぞれに対応して、開始時間および終了時間を示す情報を含む。
【0042】
一実施形態において、デジタルメモリは、プロセッサに、各識別されたセグメントに対する開始時間および終了時間を、非一時的な方法で記録させ、それにより、デジタル音声記録に対応して、着目するイベントを含むセグメントを明確にラベル付けするように構成するための命令を含む。
【0043】
本発明の更なる態様によると、請求項1の方法を実装するために、1または複数のプロセッサによる実行ための、有形で、非一時的な命令を有するマシン可読媒体を提供する。
【0044】
本発明の他の態様によると、着目する特定の音声イベントを含む被験者のデジタル記録の部分を識別するための装置であって、
被験者からの音声を対応するアナログ電気信号に変換する変換器と、
アナログ電気信号からデジタル音声記録を生成するためのアナログ-デジタル変換アセンブリと、
着目する特定の音声イベントの周波数特性にてデジタル音声記録をフィルタリングして、着目するイベントがフィルタリングされたデジタル音声記録を生成するための着目イベントフィルタと、
フィルタリングされたデジタル音声記録を処理して、対応する信号エンベロープを生成するための信号エンベロープアセンブリと、
信号エンベロープアセンブリに応答して、信号エンベロープを含むデジタルサンプルを、それらの大きさによって複数のビンに分類し、複数のビンのモーダルビンを識別するためのヒストグラムジェネレータアセンブリと、
ヒストグラムジェネレータに応答し、識別されたモードビンに基づいて統計的確率分布を計算し、統計的確率分布および所定の確率レベルから信号エンベロープの閾値レベルを決定するように構成された統計的確率分布ジェネレータと、
統計的確率ジェネレータに応答し、閾値レベルを超える信号エンベロープのセグメントを識別し、着目するイベントを含むものとしてデジタル記録の対応するセグメントを明確に識別するように構成されたイベント識別アセンブリと、
を有する装置が提供される。
【0045】
本発明の他の態様によると、着目する1または複数のイベントを識別するために、被験者のデジタル音声記録を処理するための方法であって、
複数のデジタルサンプルを含む対応する信号エンベロープを生成するために、ダウンサンプリングおよびフィルタリングを適用することを含む、デジタルオーディオ録音を前処理することと、
複数のデジタルサンプルをそれらの大きさによって複数のビンに分類することと、
複数のビンのモーダルビンを決定することであって、モーダルビンは、ビンの範囲内の大きさを有する複数のデジタルサンプルの最大数を含むビンである、ことと、
識別されたモーダルビンに基づいて、統計的確率分布を計算することと、
確率分布に対する所定の確率レベルに対応するビンである閾値ビンを決定することと、
閾値ビンの範囲からの値に閾値レベルを設定することと、
閾値レベルを超える信号エンベロープのセグメントを決定し、それにより、着目する1または複数のイベントを含むデジタル音声記録の対応するセグメントを明確に識別することと、
を有する方法が提供される。
【0046】
一実施形態において、信号エンベロープは、デジタル音声記録に対するパワー推定を含む。
【0047】
一実施形態において、信号エンベロープは、デジタル音声記録に対する振幅推定を含む。
【0048】
一実施形態において、デジタル音声記録のダウンサンプリングし、フィルタリングすることは、ローパスフィルタを、順方向および逆方向にてデジタル音声記録に適用することを含む。
【0049】
一実施形態において、デジタル音声記録のダウンサンプリングし、フィルタリングすることは、ハイパスフィルタを適用することを含み、着目するイベントは、被験者の呼吸音を含む。
【0050】
一実施形態において、デジタル音声記録をダウンサンプリングし、フィルタリングすることは、ローパスフィルタを適用することを含み、着目するイベントは、被験者のいびき音を含む。
【0051】
一実施形態において、識別されたモーダルビンに基づいて統計的確率分布の計算をすることは、ポアソン分布のラムダパラメータとしてモーダルビンのインデックスを用いてポアソン分布を計算することを含む。
【0052】
本発明の更なる形態によると、特定の音声イベントを含む被験者のデジタル記録の部分を識別するための装置であって、
プロセッサにアクセス可能なデジタルメモリに格納された命令に従ってデジタル記録を処理するためのプロセッサであって、命令は、着目する特定のイベントを含むデジタル記録のセグメントを検出するための方法を実装するように、プロセッサに対する命令を含む、プロセッサ
を含む装置が提供される。
【0053】
論理が別段の指示をしない限り、任意の態様またはその実施形態の特性または特徴を任意の他の態様に組み込むことができることを理解されたい。
【0054】
本発明の好適な特徴、実施形態、および変形は、本発明を実施するのに充分な情報を当業者に提供する以下の詳細な説明から了解され得る。詳細な説明は、前出の発明の概要の範囲をいかなる点でも限定するものと見なされてはならない。詳細な説明では以下の幾つかの図面を参照する。
【図面の簡単な説明】
【0055】
図1】好適な実施形態に従う方法のフローチャートである。
図2】方法の実行の間に記録されるデジタル音声信号のフレームのグラフである。
図3図2に示す信号の初期の20秒の部分を示す。
図4図3の信号に対応する振幅推定を含む方法の実行中に生成された、ダウンサンプリングされ、圧縮され、フィルタリングされた波形のグラフである。
図4A図3の信号に対応するパワー推定を含む、図4に示される信号の対数のグラフである。
図5】示されているポアソン分布に対するヒストグラムおよびCDFに基づくポアソン分布曲線を用いた方法の実行中に生成された図4の波形のヒストグラムである。
図6】示されたイベント閾値レベルを有する、図4Aに対応するグラフである。
図7図6に示されたセグメント時間に対応する、着目するイベントを含むと識別されたセグメントを示す、図3の波形のグラフである。
図8】一実施形態に係る、被験者の音声信号内の着目するイベントを識別するための装置のブロック図である。
図9】一実施形態に係る、イベント識別装置のブロック図である。
図10】使用段階における図9の装置の外観図である。
図11】使用段階の後における図9の装置の外観図である。
【発明を実施するための形態】
【0056】
本発明の好適な実施形態による自動イベント検出のための方法を、図1のフローチャートを参照して説明する。
【0057】
概要において、方法は、デジタル音声記録を処理して、着目する特定の音声イベントを含む記録のセグメントを識別することを含む。デジタル音声記録は、ボックス11にて、デジタル音声記録をフィルタリングし、破線ボックス14で示されるように、フィルタリングされたデジタル音声記録を処理して、対応する信号エンベロープを生成することを含むいくつかのプロセスに従って処理される。次に、統計分布、典型的にはポアソン分布であるが、ガンマ分布のような別の統計分布である可能性もある統計分布が、破線ボックス16で示されるように、信号エンベロープにフィッティングされる。次に、破線18によって示されるように、閾値レベルが、信号エンベロープに応答して決定される。閾値レベルは、統計分布および所定の確率レベルに基づいて決定される。次に、閾値レベルを超える信号エンベロープのセグメントが、例えば、そのような各セグメントの開始および終了の時間として識別され、それにより、着目する特定の音声イベントを含むデジタル音声記録の対応するセグメントも識別する。例えば、着目する音声イベントは、いびき、喘鳴、呼吸音などの音である。
【0058】
最初に、概要で説明した方法を開始する前に、マイク4の形態の変換器が、被験者1からのアナログの空中音波2を対応するアナログ電気信号3に変換する。アナログ電気信号3は、ボックス5にてアンチエイリアシングフィルタにより処理され、その後、ボックス6にてアナログ-デジタル変換器により、対応するデジタル音声信号に形成される。ボックス9にて、ADC6からのデジタル音声信号は、デジタルメモリのような電気データ記憶アセンブリに、デジタル音声記録として格納される。デジタル音声記録は、その後、デジタル音声信号8の形式にて読み出され、方法の好適な実施形態に従って、図1のフローチャートの以下のボックスによって処理される。本実施形態において、デジタル音声信号8は、複数の連続した重複しない5分のフレームから構成される。図2は、44.1kHzのサンプリングレートで44,100×5×60=13,230サンプルからなるデジタル音声信号8の単一のフレーム36を示す。図3は、フレーム36のデジタル音声信号8の最初の20秒(図2のアイテム44として識別)をより詳細に示す。
【0059】
ボックス10にて、デジタル音声信号8がデジタルメモリから検索され、44.1kHzの元のサンプルレートから14.7kHzへの第1のダウンサンプリングを受け、1秒当たりのサンプル数が3分の1に減少する。この方法でのダウンサンプリングは、その後の処理のためにより少ないサンプルを含む第1のダウンサンプリングされたデジタル音声信号40を生成する。デジタル音声信号はノイズフロアの閾値を検出するために処理されるため、急速に変化するトランジェントは重要ではなく、ダウンサンプリングによって精度が失われることはない。ボックス11にて、第1のダウンサンプリングされたデジタル音声信号40は、デジタル音声信号8において具体的に識別されるべき被験者の音声イベントの周波数の選択に、バンドパス、またはローパスまたはハイパスフィルタを適用することによってフィルタリングされる。例えば、ボックス11にて、着目する特定の音声イベントが呼吸音である場合、1000Hzのハイパスフィルタが第1のダウンサンプリングされたデジタル音声信号40に適用されてよい。あるいは、着目する特定の音声イベントがいびき音を含む場合、1000Hzのローパスフィルタが適用されてよい。
【0060】
ボックス13から19は、後述するように、着目するイベントを識別するための後続のステップを適用する前に、信号42を前処理するエンベロープ検出処理14を実施する。
【0061】
ボックス13にて、ダウンサンプリングされ、イベントフィルタリングされた音声信号42に絶対値フィルタが適用され、すべての負のサンプルが正に反転されて、対応する絶対値フィルタリングされた音声信号44を生成する。例えば、ボックス7にて、ADCが16ビットの分解能でサンプリングする場合、各サンプルは-32,768~+32,767の振幅ステップの範囲の整数の振幅値を有する。ボックス13での絶対値フィルタリングは、負の振幅サンプルの符号を反転して、すべてのサンプルが0~+32,767の範囲の整数の振幅値を取るようにする。
【0062】
次に、絶対値フィルタリングされた音声信号44は、ボックス15にて、7Hzのローパスの順方向および逆方向のフィルタに渡される。ボックス15での処理の逆方向フィルタの部分が動作するためには、デジタルメモリに格納される絶対値フィルタリングされた音声信号が必要である。順方向-逆方向フィルタは、着目するコンテンツの位相に影響を与えずにローパスフィルタリングをもたらす。
【0063】
ボックス17にて、フィルタリングされた絶対値信号44に第2のダウンサンプリング動作が適用される。第2のダウンサンプリング動作は、14.7kHzから100Hzまでリサンプリングする。
【0064】
図4は、ボックス15にて生成された順方向-逆方向フィルタリングされた信号を示しており、これは、第1の信号エンベロープ信号、またはより簡単には、元の記録された信号8に対応し、記録された信号8の振幅の推定である「信号エンベロープ」を含む。
【0065】
次に、ボックス19にて、振幅推定信号46に対数圧縮を適用して、大きな入力信号変動を低減する。対数圧縮を適用する前に、対数圧縮を適用した後に値の範囲を制限するために、10-5未満のパワー比値を有するサンプルを最大10-5の大きさまで調整する。ボックス13の絶対値フィルタ、ボックス15のローパスフィルタ、ボックス17のダウンサンプリング、およびボックス19の対数圧縮により、元のデジタル記録8に対応する第2の信号エンベロープ47が生成される。第2の信号エンベロープ47は、元のデジタル音声信号8のパワーの推定値であるパワー推定信号である。
【0066】
ボックス21にて、第2の信号エンベロープ47のフレームにわたるサンプルの大きさ、例えば、5分、のヒストグラム48(図5)が計算される。ヒストグラム48は、第2の信号エンベロープ(パワー推定信号)47を構成する2000個のサンプルを、それらのマグニチュードによって、それぞれ300個のマグニチュードビンの1つに分類することによって生成される。
【0067】
もちろん、他の実施形態では、5分間のフレームが2000より少ないまたは多いサンプルを含むように、異なるダウンサンプリング比を使用してよいことが理解されるであろう。さらに、5分のフレームが好ましいが、フレームはそれより長くても短くてもよく、その長さはダウンサンプリング比および使用されるビンの数に基づいて調整されてもよい。現在説明されているダウンサンプリング比およびフレーム長に対して良好に機能することが見出されたビンの好ましい数が、300であるが、300より多いまたは少ないビンが使用されてもよいことも理解されるであろう。
【0068】
ボックス21におけるヒストグラム計算処理は、パワー推定信号である第2の信号エンベロープ47にて実行されることが好ましいが、代わりに、第1の信号エンベロープ、すなわち振幅推定信号46において実行されてもよい。ボックス19にて対数処理を実行する理由は、後述する、後続のヒストグラムおよび統計分布のフィッティングステップの信頼性が低下させる振幅信号エンベロープの急速な振幅変化を避けるためである。
【0069】
図4Aに示されるパワー推定信号47を含む第2の信号エンベロープについて、各サンプルは、-5.0から-2.9の範囲(フレーム内の最小および最大のパワー推定である)内に入る。パワー推定信号47を構成するサンプルは、(最大-最小)/ビン数、つまり、((-2.9)-(-5.0))/300=約0.007のステップサイズを用いて、300個のビン(「0」から「299」として順次、インデックス付け)を分類してよい。ビン番号nには、n×ステップサイズ+最小値から、(n+1)×ステップサイズ+最小値の範囲のサンプルが含まれる。例えば、ビン番号150には、150×0.007+-5.0から(150+1)×0.007+(-5.0)、つまり-3.95から-3.94のパワー推定範囲のサンプルが含まれる。
【0070】
ボックス23にて、ヒストグラム48のモーダルビンが選択される。モーダルビンは、フレーム内の最大数のサンプルが分類されたビンである。図5に示される例では、5分間のフレームにわたる第2の信号エンベロープ47を含む30,000個のサンプルのうちのほぼ400個のサンプルがマグニチュードビン135に分類され、他のどのビンよりも多くのサンプルを含むため、ビン番号135がモーダルビンである。マグニチュードビン135は、(135×0.007+(-5.0))から((135+1)×0.007+(-5.0))の範囲、つまり -4.053から-4.046の範囲で元の記録された信号8のパワー推定を表すマグニチュードを有する第2の信号エンベロープのサンプルを含む。
【0071】
ボックス25にて、ポアソン分布のラムダパラメータが、分布をヒストグラムにフィッティングさせるためのモーダルビンの数に設定される。すなわち、ビン135が最も多くのサンプルを含むため、ラムダ=135である。ボックス27にて、ラムダ=135を用いてポアソン分布が計算される。ポアソン分布は、ヒストグラム48にフィッティングさせた図5の線50としてグラフで示される。ボックス29にて、ポアソン分布に対し累積分布関数(CDF:Cumulative Distribution Function)が計算される。CDFは、曲線52として図5のグラフに示される。
【0072】
ボックス31にて、CDF52上の非常に高い確率レベルに対応するビンである、ヒストグラム48の閾値ビンが見出される。着目するイベントを含む音声セグメントを高い信頼度で識別できることが望ましいため、確率レベルは非常に高く設定される。図5に示されているケースでは、確率レベルは、1のCDF曲線の下の合計確率の0.999999に設定されている。0.999999の確率レベルは、破線の垂直線51で示されるように、ビン番号195に対応することがわかる。したがって、閾値ビンであるビン番号195には、195×0.007+(-5.0)から(195+1)×0.007+(-5.0)、つまり、-3.632から-3.625の範囲のパワー推定を表すマグニチュードを有するサンプルが含まれる。ボックス33にて、ビン195内のサンプルのマグニチュードの上限、すなわち-3.625が、第2の信号エンベロープ、すなわちパワー推定信号47の閾値レベルに設定される。
【0073】
ボックス35にて、第2の信号エンベロープ47を構成する各サンプルを閾値レベルと比較することにより、すべての閾値レベルを超えるマグニチュードのサンプルを含む第2の信号エンベロープ47のセグメントが決定される。
【0074】
図6は、第2の信号エンベロープ(すなわち、パワー推定信号)47に重ねられた閾値レベル56を示す。
【0075】
第2の信号エンベロープは、次の閾値を超えるセグメントで閾値を超えていることがわかる。[t1,t2]、[t3,t4]、[t5,t6]、[t7,t8]、[t9,t10]、および[t11,t12]。
【0076】
ボックス37にて、単純な時間フィルタが適用され、イベントが225msよりも長く、4sよりも短い期間でなければならないことに基づいて、着目するイベントである、睡眠音に潜在的に対応する閾値を超えるセグメントを選別する。したがって、間隔101は破棄され、特定の睡眠イベントを含むと識別された間隔が、間隔100、102、103、104、および105として残される。
【0077】
これらのセグメントは、ボックス11にて、着目するイベントとしてフィルタリングされた特定のイベントのサンプルを含む元の波形8のセグメントに対応する可能性が非常に高いと見なされる。
【0078】
ボックス39にて、閾値を超えるレベルのセグメントは、最初のデジタル音声信号8に関して、間隔100、101、102、103、104、および105として明確にラベル付けされる。「明確に(tangibly)」とラベル付けされるということは、閾値を超えるセグメントのそれぞれの開始時間および終了時間、または同等の情報が、デジタル音声の記録に関連付けて、非一時的な方法で記録されることを意味し、閾値を超えるセグメントは容易に識別でき、必要に応じてさらに処理できる。
【0079】
次に、着目するイベントを含む信号内のセグメントを識別するラベルとともに、デジタル音声信号8をさらに処理することができる。例えば、着目するイベントがいびき音である場合、いびきを含むとラベル付けされたセグメントは、従来技術の方法を使用して処理され、いびき音が睡眠時無呼吸を示しているかどうかを判定することができる。同様に、着目するイベントが喘鳴音である場合、デジタル音声信号と、喘鳴音を含むセグメントを識別するラベルを処理して、喘鳴が例えば喘息を示しているかどうかを判定することができる。
【0080】
図8は、前述の方法に従って、特定の音声イベントを含む被験者のデジタル記録の部分を識別するための装置600のブロック図である。装置600は、被験者1からの音声3を、対応するアナログ電気信号8(図2)に変換するためのマイク601の形態の変換器を有する。
【0081】
マイク601は、アナログ電気信号からデジタル音声記録を生成するためのアナログ-デジタル変換アセンブリ604に接続される。アナログ-デジタル変換アセンブリ604は、被験者1からの音声3に対応するデジタル信号を生成する、アンチエイリアシングフィルタ602およびアナログ-デジタル変換器603から構成される。本実施形態では、アナログ-デジタル変換アセンブリ1は、16ビットの分解能で44.1kHzのサンプルレート信号を生成するように構成される。本発明の他の実施形態では、他のサンプリングレートおよびビット分解能も使用できることが理解されるであろう。
【0082】
アナログ-デジタル変換アセンブリ604の出力ポートは、デジタル信号を5分のフレームにて、デジタルメモリ605に提供する。出力ポートは、44.1kHzから14.7kHzにダウンサンプリングするように構成された第1のダウンサンプラ607にも接続される。
【0083】
第1のダウンサンプラ607からの信号は、連動スイッチ609aおよび609bの設定に応じて、いびき音イベントフィルタ611または呼吸音イベントフィルタ613のいずれかを通って絶対値フィルタ615に進む。いびき音イベントフィルタ611および呼吸音イベントフィルタ613はそれぞれ、いびき音イベントを選択するための1000Hzのカットオフローパスフィルタおよび呼吸音イベントを選択するための1000Hzのハイパスフィルタである。どちらのフィルタも、1000hzのカットオフを有する二次バターワースハイ/ローパスIIRフィルタである。
【0084】
スイッチ609bの出力は、フィルタリングされたデジタル音声信号内のすべての負のサンプルの符号を逆にするように構成された絶対値フィルタ615に結合される。次に、絶対値フィルタ615は、絶対値フィルタ615からのフィルタリングされたデジタル信号のフレームを格納するデジタルメモリ617に結合される。
【0085】
順逆ローパスフィルタ619は、二次バターワースローパスIIR、7Hzフィルタのカットオフを用いて順方向および逆方向の両方で、記憶された信号をフィルタリングするためのデジタルメモリ617に結合される。信号は、位相を維持するために、順方向と逆方向の2回のフィルタリングが行われる。
【0086】
第2のダウンサンプラ619は、順逆LPF619の出力側に結合されて、100Hzへの信号のダウンサンプリングを実行し、その結果、図4の信号46などの振幅推定信号が得られる。
【0087】
対数増幅器アセンブリ620は、第2のダウンサンプラ621の出力側に結合される。対数増幅器アセンブリは、パワー推定信号、例えば図4Aの信号47を生成する。デジタルメモリ622は対数増幅器アセンブリ620に結合され、パワー推定信号のフレームを格納する。
【0088】
ヒストグラムジェネレータアセンブリ623は、第2のダウンサンプリングアセンブリの出力側に結合される。ヒストグラムジェネレータアセンブリ623は、パワー推定信号を含むデジタルサンプルを、それらの大きさによって複数のマグニチュードビンに分類し、複数のマグニチュードビンのうちのモーダルマグニチュードビンを示す信号、および分布の予め設定された高い確率閾値に対するポアソン分布のラムダ値を生成するように構成される。
【0089】
ヒストグラムジェネレータ623に応答し、識別されたモーダルマグニチュードビンに基づいて統計的確率分布を計算するように構成された統計的確率分布ジェネレータ625が提供される。ヒストグラムジェネレータアセンブリ623および分布ジェネレータ625は、例えば、ポアソン分布に対するラムダパラメータとしてモーダルマグニチュードビンを示す信号を用いてポアソン分布などの分布を計算するように構成された、1または複数のFPGAやマイクロコントローラによって実装されてよい。統計的確率ジェネレータ625に応答し、デジタルメモリ605内のデジタル記録の、所定の確率レベルに対する背景ノイズサンプル値を超えるサンプルを含むセグメントである特定のイベントを含むセグメントを明確に識別するように構成されたイベント識別アセンブリ627が提供される。
【0090】
イベント識別アセンブリ627は、元の音声信号を格納するファイル629にメタデータコードを挿入するか、または着目するイベントを含む音声信号のセグメントに効果的にラベル付けする一連の時間間隔を含むファイルを書き込むことができる。
【0091】
ポアソン分布の代替として、発明者は他の対数正規分布もテストしており、そこから正規分布も機能すると考えている。ただし、ポアソン分布は、ヒストグラムから簡単に抽出できる推定パラメータが1つしかないため(すなわち、ラムダパラメータ)、単純に適合できるという技術的な利点があるため、好適である。
【0092】
選択された分布の要件は、サンプルのヒストグラムに適合でき、ノイズサンプルがその分布に従うことである。
【0093】
例えば、分布ファミリがガンマとして選択された場合、次のリンクにて、scipyによって提供されるようなフィッティング関数(https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.gamma.html)を使用して、ガンマ分布のパラメータを推定してよい。
【0094】
使用中、手で保持するのに十分小さいハウジング内に実装することができる装置600は、オペレータによって被験者の顔から数センチメートルほど離して保持される。長時間の記録が必要な場合、装置600は、記録の間、三脚に取り付けられてもよい。オペレータは、連動スイッチ609a、609bを構成して、記録された音声信号において識別される着目するイベントのタイプに応じて、いびき音イベントフィルタ611または呼吸音イベントフィルタ613のいずれかを選択する。記録が進行するにつれて、デジタル化された音声記録が、通常、SDカードなどの記録媒体を含むデジタルメモリ605に格納される。同時に、信号は、前述のように、装置600の様々なブロック607から621によって様々にダウンサンプリングおよびフィルタリングされ、第2のダウンサンプラ621の出力側でパワー推定信号が生成される。次いで、ヒストグラムジェネレータ623は、パワー推定信号を構成するサンプルを、それらのマグニチュードによって複数のビンに分類し、モーダルビンを決定する。確率分布ジェネレータ625は、対応するポアソン分布を計算し、その分布のCDFから、ノイズフロアを超えるサンプルを含む非常に高い確率に対応するビンを識別するために、ポアソン分布のラムダパラメータとしてモーダルビンの数を使用する。イベント識別アセンブリ627は、統計的確率ジェネレータ625に応答して、予め規定された確率レベルに対する背景ノイズサンプル値を超えるサンプルを含むセグメントである特定のイベントを含む、デジタルメモリ605に格納される、デジタル記録のセグメントを明確に識別するように構成される。
【0095】
一実施形態において、着目する特定の音声イベントを含む被験者からの音声を含む信号の記録のセグメントを識別するための方法が提供されることが理解されるであろう。方法は、音声イベントの特性周波数の範囲に基づいて記録をフィルタリングすることを含む。例えば、着目する音声イベントが主にいびきなどの低周波音である場合は、低周波の範囲が用いられ、対照的に、呼吸音などの他の音に対しては高周波の範囲が用いられる。次に、方法は、フィルタリングされた記録を処理して、元の録音された音声信号のパワーの推定である、対応するパワー推定信号を生成することを含む。次に、方法は、パワー推定信号に統計分布、例えば、ポアソン分布をフィッティングすることと、ノイズ閾値レベルが着目するイベントに関して信号のノイズフロアを実際に上回っている高い確率レベルを使用して、分布からノイズフロア閾値レベルを決定することを含む。次に、被験者からの音声の記録のセグメントは、ノイズフロアの閾値レベルを超えるセグメントとして識別される。
【0096】
方法は、着目するイベントを含む可能性が非常に高い患者の音声の記録のセグメントを迅速に特定するため、着目する音声イベントを含まないセグメントの処理に時間を浪費することなく、時間と処理能力をこれらのセグメントのさらなる分析に費やすことができる。
【0097】
図9は、本発明の別の実施形態に係る、例えば、いびきや喘鳴音などの着目するイベントを含む記録のセグメントを識別し、ラベル付けするための音声イベント識別装置751のブロック図である。現在説明されている実施形態では、装置は、スマートフォンの1または複数のプロセッサ、マイク、およびメモリを使用して実装される。音声イベント識別装置751は、電子メモリ755にアクセスする少なくとも1つのプロセッサ753を含む。電子メモリ755は、プロセッサ753による実行のために、例えば、Android(登録商標)オペレーティングシステムまたはApple(登録商標) iOSオペレーティングシステムなどのオペレーティングシステム758を含む。電子メモリ755は、本発明の好適な実施形態による音声イベント識別ソフトウェア製品または「App(アプリ)」756も含む。咳識別アプリ756は、音声イベント識別装置751が図1の方法に従って被験者1からの音声702を処理するために、プロセッサ753によって実行可能な命令を含む。その動作中、プロセッサ753は、アプリ756のコマンドの下で音声702を処理し、着目する音声イベントを含むセグメントのリストを、LCDタッチスクリーンインターフェース761によってオペレータ754に提示する。識別された音声イベントは、必要に応じてさらに処理される。アプリ756は、USBポート765に結合されたディスクドライブによって読み取るための、光学または磁気ディスク750などのコンピュータ可読媒体上に保持される、有形で非一時的な機械可読命令として提供されてよい。または、WAN/WLANインターフェース773を介してリモートファイルサーバからアプリをダウンロードしてもよい。
【0098】
プロセッサ753は、プロセッサと様々な周辺機器との間でデジタル信号200が伝達される金属導体から構成されるデータバス757を介して、図9に示されるように、複数の周辺機器アセンブリ759から773とデータ通信する。その結果、必要に応じて、音声イベント識別装置751は、WAN/WLANアセンブリ773および無線周波数アンテナ779を介して、音声および/またはデータ通信ネットワーク781との音声およびデータ通信を確立することができる。
【0099】
また、装置751は、必要に応じて、GPSモジュール767からのデータを使用して画像が撮影された場所とともに被験者752の画像をキャプチャできるように、デジタルカメラに影響を与えるレンズおよびCCDアセンブリ759などの他の周辺機器を含む。装置751は、装置に電力を供給するための電源アダプタポートおよびバッテリ管理アセンブリ769も含む。ヒューマンマシンインターフェースとして機能し、オペレータ754が結果を読み取り、コマンドおよびデータを装置751に入力できるようにするためのLCDタッチスクリーンインターフェース761が提供される。USBポート765は、USBスティックなどの外部記憶装置へのシリアルデータ接続を行うため、またはデータネットワークまたは外部スクリーンおよびキーボードなどへのケーブル接続を行うために提供される。また、二次記憶カード764は、メモリ755によって促進される内部データ記憶空間に加えて、必要に応じて追加の二次記憶のために提供される。
【0100】
音声インターフェース771は、マイク775をデータバス757に結合し、アンチエイリアシングフィルタリング回路およびアナログ-デジタルサンプラを含み、マイク775からのアナログ電気波形4(対象音波3に対応する)を、メモリ755内のデジタル音声ファイル702における記録として保存され、アプリ756の制御下でプロセッサ753によって処理されるデジタル音声信号に変換する。例えば、プロセッサは、Qualcomm社によって製造されたSnapdragon 865プロセッサであってもよいが、他のより性能の低いプロセッサも適している。音声インターフェース771は、スピーカ777にも結合される。音声インターフェース771は、デジタル音声をアナログ信号に変換するためのデジタル-アナログ変換器と、スピーカ771に接続された音声アンプとを含み、メモリ755または二次記憶装置764に記録された音声702をオペレータ754が聞くために再生できるようにする。
【0101】
装置751は、被験者の音声の記録において喘鳴やいびきなどの着目するイベントを含むセグメントを識別するように構成されるように、アプリ756でプログラムされる。
【0102】
前述のように、図9に示されている音声イベント識別装置751は、アプリ756によって独自に構成されたスマートフォンハードウェアの形式で提供されているが、デスクトップコンピュータ、ラップトップ、またはタブレット計算装置などの他の種類の計算デバイスを同様に使用されてもよいし、App756で特別にプログラムされた仮想マシンをハードウェアが含むクラウドコンピューティング環境に実装されてもよい。
【0103】
被験者752の記録702内の着目するイベントを含むセグメントを識別するために咳識別装置751が使用し、アプリ756を構成する命令を含む処理の実施形態は、前述の図1のフローチャートに示されている。
【0104】
使用において、オペレータ754または被験者3は、LCDタッチスクリーンインターフェース761上でOS758によって生成されたアプリ選択画面からアプリ756を選択する。その選択に応答して、プロセッサ753は、図10の画面782などの画面を表示して、オペレータ754に、装置751を操作して、マイク775および音声インターフェース771を介して被験者752から音声3の記録を開始するよう促す。音声インターフェース771は、音声を、バス757に沿って伝達され、プロセッサ753によってメモリ755および/または二次記憶SDカード764に1または複数のデジタルファイル702として記録されるデジタル信号200に変換する。現在説明されている好適な実施形態では、記録は、着目する多数の音声イベントを含むのに十分な期間にわたって進める必要がある。
【0105】
記録が終了した後、プロセッサ753は、図1の方法を実装するアプリ756を含む命令の制御下で、記録702を処理し、着目するイベントを含む記録内のセグメントを識別する。識別されたセグメントは、次に画面778に表示されてもよく、この例では、各セグメントの開始時間および終了時間とともに着目する音声イベントを含む270個のセグメントを識別する。また、アプリ756の制御下にあるプロセッサ753は、識別されたセグメント番号と開始時間および終了時間を、音波記録に関して着目するイベントを明確にラベル付けするために、音波記録も含み得るファイル753に非一時的な方法にて書き込む。
【0106】
イベントラベリングアプリ756を含む命令と組み合わせてプロセッサ753によって実施される方法は、着目するイベントを含む可能性が非常に高い被験者の音声の記録702内のセグメントを迅速に識別する。その結果、必要に応じて、対象の音声イベントを含まないセグメントの処理に時間を浪費することなく、これらのセグメントをさらに分析するために時間と処理能力を費やすことができる。
【0107】
法令を遵守して、本発明は、多かれ少なかれ構造的または方法の特徴について特有の言語で説明されている。用語「有する(comprises)」と、「有する(comprising)」および「から成る(comprised of)」などのその変形は、包括的な意味で使用され、追加の機能を排除するものではない。
【0108】
本明細書に記載された手段は本発明を実施する好適な形態を包含するため、本発明は図示または記載された特定の特徴に限定されないことを理解されたい。したがって、本発明は、当業者によって適切に解釈される添付の特許請求の範囲の適切な範囲内で、その形態または変更のいずれにおいても請求される。
【0109】
明細書および特許請求の範囲(存在する場合)全体を通して、文脈上別段の要求がない限り、用語「実質的に(substantially)」または「約(about)」は、これらの用語によって限定される範囲の値に限定されないと理解されるであろう。
【0110】
明細書及び請求項(存在する場合に)を通して、文脈上それ以外が必要とされない限り、「実質的に(substantially)」または「約(about)」の語は、これらの語により定性化される範囲の値に限定されないことが理解されるであろう。
【0111】
本発明の任意の実施形態は例示的であることのみを意図したものであり、本発明を限定することを意図されていない。したがって、本発明の範囲から逸脱することなく、説明した任意の実施形態に対して、他の様々な変更および変形を行うことが認識されるべきである。
図1
図2
図3
図4
図4A
図5
図6
図7
図8
図9
図10
図11
【国際調査報告】