(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-08-18
(45)【発行日】2023-08-28
(54)【発明の名称】睡眠時無呼吸を診断するための質問票とそれを使用した予備調査方法
(51)【国際特許分類】
A61B 5/08 20060101AFI20230821BHJP
【FI】
A61B5/08
(21)【出願番号】P 2020157997
(22)【出願日】2020-09-21
【審査請求日】2022-08-20
【早期審査対象出願】
【前置審査】
(73)【特許権者】
【識別番号】504132272
【氏名又は名称】国立大学法人京都大学
(73)【特許権者】
【識別番号】518060723
【氏名又は名称】株式会社モノプロダイム
(74)【代理人】
【識別番号】100183575
【氏名又は名称】老田 政憲
(72)【発明者】
【氏名】堀口 由貴男
(72)【発明者】
【氏名】李 佳睿
(72)【発明者】
【氏名】椹木 哲夫
(72)【発明者】
【氏名】村瀬 亨
【審査官】▲高▼木 尚哉
(56)【参考文献】
【文献】国際公開第2020/082115(WO,A1)
【文献】特開2007-164366(JP,A)
【文献】特開2019-063200(JP,A)
【文献】特開2007-299307(JP,A)
【文献】特開2012-045373(JP,A)
【文献】特表2009-515174(JP,A)
【文献】尾下豪人 他,閉塞性睡眠時無呼吸症候群のリスク評価における日本語版STOP-Bangテストの有用性,日本プライマリ・ケア連合学会誌,2019年,vol.42, no.1,pp.26-31
【文献】村田 朗,睡眠時無呼吸症候群の診断と治療 寝ている間に病気が作られる,日本医科大学医学会雑誌,2007年,3(2),pp.96-101
(58)【調査した分野】(Int.Cl.,DB名)
A61B 5/00-5/01
A61B 5/06-5/22
G16H 10/00-80/00
G06Q 50/22
(57)【特許請求の範囲】
【請求項1】
年齢、性別、BMI、いびき頻度、いびき音量、いびきの変化、SF_36の
role-physical、SF_36の活力、SF_36の
role-emotion、咳による覚醒、胸痛による覚醒、息切れによる覚醒、高血圧、夜間頻尿、不安による睡眠の影響、夜に目覚めること、早起きを含む17項目の
みの質問票を使用し、
睡眠時無呼吸を事前チェックすることで、医療施設に行く必要がなくなる
睡眠時無呼吸の予備調査方法。
【請求項2】
年齢、性別、BMI、いびき頻度、いびき音量、いびきの変化、SF_36の
role-physical、SF_36の活力、SF_36の
role-emotion、咳による覚醒、胸痛による覚醒、息切れによる覚醒、高血圧、夜間頻尿
の14項目の
みの質問票を使用し、
睡眠時無呼吸を事前チェックすることで、医療施設に行く必要がなくなる
睡眠時無呼吸の予備調査方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、睡眠時無呼吸を診断するための質問票とそれを使用した予備調査方法に関するものである。
【背景技術】
【0002】
従来、睡眠時無呼吸を診断する簡易的な方法、装置がいくつか知られている(特許文献1、2)。しかし、十分に診断できていない。そのため、現状では、簡易的な診断として、質問形式の診断がされている。エプワース眠気尺度、STOP-Bangアンケート、Epworth眠気スケール、ベルリン質問票、およびSTOPアンケートなど、多くの種類の質問票がある。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2017-18384号公報
【文献】特開2013-533757号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、これらの質問票では、質問事項が多く、睡眠時無呼吸を簡単に診断できない。
【0005】
よって、本願の課題は、睡眠時無呼吸を診断するために、質問数が少ない質問票とそれを使用した予備調査方法を提供することである。
【課題を解決するための手段】
【0006】
上記課題を解決するために、項目数が66項目より少ない項目であり、年齢、性別、BMI、いびき頻度、いびき音量、いびきの変化、身体的影響、活力、感情の影響、咳による覚醒、胸痛による覚醒、息切れによる覚醒、高血圧、夜間頻尿、を項目に含む睡眠時無呼吸を診断するための質問票を用いる。
【0007】
また、上記質問票を使用し、事前チェックすることで、医療施設に行く必要がなくなる予備調査方法を用いる。
【発明の効果】
【0008】
本発明の睡眠時無呼吸を診断するための質問票とそれを使用した予備調査方法によれば、少ない質問を有する質問票により簡単に睡眠時無呼吸を診断でき、予備的に判断できる。
【図面の簡単な説明】
【0009】
【
図1】実施の形態の18項目のCFAモデルを示す図
【
図2】実施の形態の診断されていないがOSA(UO)である因子と、他の因子との関係を明確に示す図
【
図3】実施の形態の診断されていないOSA(UO)解析の構造モデルを示す図
【
図4】実施の形態の日と当てはまる項目数との関係を示す図
【発明を実施するための形態】
【0010】
まず、精度がよい睡眠時無呼吸を診断するための質問票を作成する。質問票には、いくつかの項目がある。項目を抽出する。
<1:データセット>
分析用のデータは、Sleep Heart Health Study(SHHS)(米国の大規模な観察研究)のデータベースから取得した。
PSG(ポリソムノグラフィー(Polysomnography)という正確に睡眠時無呼吸を診断する検査装置)の収集に基づく無呼吸-呼吸低下指数(AHI)データと自己評価アンケートデータが含まれている。全5408人の参加者の中で3931人がすべてのデータ収集を完了した。この人々には、OSA(睡眠時無呼吸)の診断歴はない。表1は、3931人の対象者の情報を示している。
【0011】
【表1】
AHI(1分間あたりの無呼吸回数)≧5は、睡眠時無呼吸の指標(睡眠時無呼吸と判断する基準)である。今回の実施の形態では、合計70%の被験者のAHIが5以上であった(3931人の対象者、1863人の男性、2068女性、平均年齢63.7±11.3歳)。つまり、70%の人が、睡眠時無呼吸症者と想定される人であった。
【0012】
さらに、人体測定(6項目)、健康面接(11項目)、睡眠の習慣と質(41項目)、SF_36アンケート(8計算項目)など、66の項目が自己評価アンケートとして実施された。
ここで、SF_36アンケートは、健康関連QOL(HRQOL: Health Related Quality of Life))を測定するための、科学的で信頼性・妥当性を持つ尺度である。66の項目が自己評価アンケートとして実施された。SF_36アンケートは、米国で作成され、概念構築の段階から計量心理学的な評価に至るまで十分な検討を経て、現在、170カ国語以上に翻訳されて国際的に広く使用されている。
【0013】
さらに、AHI≧5であるか否かを、EFA(以下で説明)手順への67番目の入力項目とした。この目的は、OSAと判断されるべき人々を自己評価アンケートへの回答から特定するためである。そのため、67番目の入力項目としての「AHI≧5であるか否か)」は、SHHS調査研究においてOSA(睡眠時無呼吸症候群)と判断される場合を意味する。OSAであるかどうかの予測モデルの作成時に、この項目は必要であるが、運用時(作成したモデルを適用して自己評価アンケートへの回答からOSAかどうかを推定する際)には不要である。
【0014】
<2:探索的因子分析(EFA)>
EFAの前に、項目分析の結果が悪い6つの項目が、元のデータセットから削除された。その後、最後に、61項目がEFAに入力された。
ここで、項目分析(Item Analysis)と呼ばれる手法がある。この手法を用いると、因子分析にかける項目の数を絞ることができる。具体的には、各項目について、その項目を除くすべての項目の尺度得点の総和との相関が計算し、その相関係数の絶対値が小さい項目を分析対象から除外する。
「項目分析の結果」とはこのような相関係数計算の結果とそれに基づく項目の選別を意味する。項目分析により処理する項目数を限定できるため、この探索的因子分析(EFA)が効率化される。
【0015】
探索的因子分析(exploratory factor analysis: EFA)は、因子と観測変数の間の関係に付いて、先行する仮説や制約を分析時には考えずに、あくまで観測によって自分が得られた観測変数(データ)のみから相関係数を計算し、観測変数間に相関関係をもたらす因子は何かを推定する手法のことである。しかし、全く仮説をおかずに実験や観測を行う訳ではない。観測変数の間にどのような関係性があるか想定して関連がありそうな観測変数をそろえなければ因子を推定できなくなってしまうからである。「どんな関係性があるかは分からないが、何かしら関係はしていそう」な観測変数を選ぶということである。この探索的因子分析では、とりあえず分析内の全ての環境変数と因子が関連するというモデルを想定して分析する。そして得られた推定値を考えて、本当に関連している因子は何かを解釈する。
EFAで、61項目を使用して、6因子(症状)に属する18項目(質問事項)を抽出した。表2にEFAの結果を示す。
【表2】
表2の略語の意味は次のとおりである。1行目(6症状)において、Sn:いびき、SC:睡眠障害、He:健康、HBN:夜の息苦しさ、UD:基礎疾患、UO:診断されていないがOSA、1列目(項目)において、Ge:性別、HoS:頻度いびき、HLD:いびきの音量、CS:いびきの変化、TFA:不安により睡眠するか、WN:夜に目覚める、WE:早起きする、RP:身体的影響、VT:活力、RE:感情の影響、WC:咳による覚醒、CP:胸痛による覚醒、SoB:息切れによる覚醒、Hy:高血圧、Nu:夜間頻尿、AHI:AHIに関する項目(上記で説明した67番目の入力項目)である。
18項目での合計の分散は、62.33%で、Kaiser-Meyer-Olkin(KMO)検定値では0.72である。
【0016】
表2は、EFAが18の項目を6つの因子に分類し、すべての変数の依存性が、ある1つの因子のみに対して、0.3より高いこと示している。
6つの因子-18項目の結果により、次のセクションで示す検証的因子分析モデルが構築される。
【0017】
<3検証的因子分析(CFA)>
検証的因子分析(confirmatory factor analysis: CFA)とは、確率的因子分析とも呼ばれる。先行する理論を元に、因子の数や意味、因子と環境変数の関係をあらかじめ、規定しておいた仮説を作っておき、その仮説が本当に正しいか検証する為に、得られた観測変数を分析する手法のこと。「観測変数間の相関関係は仮定した因子構造と一致するか否か」という問いに答える為に分析を行い、データと仮説の当てはまり具合を検証する。探索的因子分析とは異なり、想定される因子は全ての観測変数に関連するとは見なさずに因子と関連が強い観測変数にのみ焦点を当てている。
EFAの結果を考慮して、因子間の関係の仮説に従って、6つの因子間の合理的な論理パスを描画した。
診断されていないがOSA(UO)に対する他の因子の影響を分析するために、AHIに関する項目(AHI)を、結果変数とした。EFAにせよCFAにせよ、因子分析では観測変数と潜在変数(共通因子)の関係がデータから統計的に推定される。ここでの結果変数は、前者の観測変数に対応する。観測変数はアンケートなり実験計測なりで値が測定されている項目である。一方、潜在変数とは、測定されていない架空の因子である。AHIに関する項目を観測変数の一つにしたというのが、意味するところである。この場合、AHIは、実際の質問事項ではない。
一方、いびきSnと基礎疾患UDは、診断されていないがOSA(UO)あるかどうかに、強い直接的な影響を及ぼす。したがって、仮説では、他の3つの因子がいびきSnと基礎疾患UDを介して、診断されていないがOSA(UO)であるかに影響することも考慮している。
図1は、18項目のCFAモデルを示している。
【0018】
この実施の形態では、最尤推定を使用して、対応する因子に対するマニフェスト変数の因子依存性と2つの因子間の回帰係数とを推定している。
図1に示すように、基礎疾患UDに対する夜間頻尿Nuの因子依存性は0.3より低く、これは好ましくない。
表3および表4は、モデルから夜間多尿Nuを削除した後の、最終的な因子依存性量とモデルのフィッティング結果を示している。
【0019】
【表3】
【表4】
表3では、対応する因子に属する17項目の因子依存性はすべて0.3を超えている。さらに、適合度指数(GFI)、調整済み適合度指数(AGFI)、比較適合度指数(CFI)、近似の二乗平均平方根誤差(RMSEA)などのいくつかの指数を使用して、モデルの適合度をテストした。次のSEM分析では、可能な限り多くのデータ母集団が推奨される。
一般的に使用されるモデル評価指標であるカイ2乗は、この状況では有効性を失う。この実施の形態には、3931人の被験者のデータがあるため、ここではカイ二乗は評価指標ではない。
【0020】
優れたフィッティングモデルには、GFI>0.9、AGFI>0.9、CFI>0.9、およびRESEA<0.08が必要である。表4に示すように、提案されたCFAモデルは許容可能なフィッティング結果を持っている。つまり、仮説は妥当である。
図2は、最終的なCFAモデルを示している。
図1と比較すると、夜間頻尿Nuを削除しても、回帰係数の大きさが小さいため、因子間の因子依存性の変化はほとんどない。
因子の依存性が低すぎると、モデルのフィッティングに役立たなくなる。たとえば、いびきSnと睡眠障害SCの間の依存性は-0.02である。その結果、次のセクションで説明するように、モデルを完全な状態に保ち、適切な結果を得るという前提の下で、因子間のパスの一部が削除され、SEM分析のモデルになる。
【0021】
<4:構造方程式モデリング(SEM)>
SEMとは「構造方程式モデリング」または「共分散構造分析」と呼ばれ、重回帰分析や因子分析、パス解析などの機能を併せ持つ統合手法として、従来の多変量解析を超えた一歩進んだ解析手法である。現在マーケティングや社会調査、心理学などの分野でよく利用されている。技術開発や製造工程のデータ分析、新商品開発における「意識調査分析」「品質改善活動」など、ものづくりや理工学系の研究や教育においても有効な手法である。構造方程式モデリングでは、パス図を用いて変数間の因果関係を表す。矢線で表したパス図により、難しい統計モデルの構造をビジュアルでわかりやすく表現することができる。潜在変数と観測変数との間の因果関係を同定することにより社会現象や自然現象を理解するための統計的アプローチである。今回、この方法を用いた。
図3は、診断されていないOSA(UO)解析の構造モデルを示す。Snoreは、いびきSn、Underlying Diseaseは、基礎疾患UD、Undiagnosed OSAは、UO、診断されていないがOSAは、UO、Healthは、健康He、Hard Breath at Nightは、夜の息苦しさHBN、Sleep Complainは、睡眠障害SCである。
構造モデルで、適合度も取得した。表5に示す。
【0022】
図3は、診断されていないがOSA(UO)である因子と、他の因子との関係を明確に示している。
基礎疾患UDといびきSnは、それぞれ0.45と0.4の因子依存性で、診断されていないがOSA(UO)である因子に直接作用する。
【表5】
【0023】
夜間の息苦しさHBNと健康HTとは、潜在疾患UDを介して、診断されていないがOSA(UO)である因子に間接的に作用する。さらに、他のすべての因子との関係が弱いため、睡眠障害SCには、未診断であるがOSA(UO)である因子を予測する十分な能力がない。
OSA(UO)と他の因子との関係を確認した後、予測モデルを訓練するために、対応する因子に属するマニフェスト変数(潜在変数)を収集する。SEMによって抽出された項目を表6に示す。表6でモデルの予測に使用される項目を示す。
【表6】
なお、1列の項目は、年齢、Ge:性別、BMI、HoS:頻度いびき、HLD:いびきの音量、CS:いびきの変化、WC:咳による覚醒、CP:胸痛による覚醒、SoB:息切れによる覚醒、Hy:高血圧、RP:身体的影響、RE:感情の影響、VT:活力、AHI≧5(UO)である。
表6の項目は、OSA予測モデルを訓練するための提案手法の推奨特性である。次のセクションでは、提案された方法(表2の18項目、表6の14項目)を、最初に収集された67項目(全項目)と比較する。さらに、EFA結果からの18項目とも比較する。なお、各項目で具体的な内容でない項目には、基準を設け、当てはまるかどうか判断される。
【0024】
2種類の実験がされた。
1つは、提案された方法によって抽出された上記項目がOSAを予測するのに十分な能力を持っているかどうかをテストするためのものである。
もう1つは、コンピュータから出力される計算時間を使用して、データ次数削減による効率を評価することである。同じコンピュータ上でMatlabにより、すべての計算処理を実行する。予測モデルの育成に使用されるデータセットは、一貫性を保つためにSEM分析と同じである。すべてのモデルで、学習ターゲットは、AHI≧5が陽性としてラベル付けされた診断されていないOSA(UO)である。
作成するOSA予測モデル(質問票)は、アンケート項目への回答を入力データとして、OSAであるか、または、OSAでないか、を出力する。このモデルの内部パラメータを機械学習アルゴリズムにより推定するには、正解の出力が明らかなデータが必要である。そのため、AHI≧5の場合に、OSAである、AHI<5の場合に、OSAでない、というラベルを正解出力として付したデータセットが学習ターゲットとして、使用される。
【0025】
<5:機械学習の結果>
アンサンブルディシジョンツリー(EDT)、サポートベクターマシン(SVM)、2次判別分析(QDA)、およびディシジョンツリー(DT)の4つの機械学習手法を利用した。4つの方法はすべて、2項分類の強みがある。
特に、アンサンブルディシジョンツリーの場合、すべてのテストの入力として、300計算サイクルのバギングメソッドが使用された。他の3つの方法では、コンピュータによって初期パラメータが設定された。
【0026】
さらに、すべての出力は5分割交差検証の予測結果である。5つのサブセットは、コンピュータによってランダムに分類された。ここで交差検証(cross validation)とは、機械学習においてモデル作成法の妥当性を検証するための手法の一つである。機械学習では、モデルのパラメータを推定(学習)するための訓練データ(training data)と、学習が済んだモデルを評価するためのテストデータ(test data)にデータセットを分割する必要がある。この分割の仕方にモデルの性能が影響を受けるため、分割の仕方を変えたデータセットを何個も用意して、平均的に性能のよいモデル作成法を見極める。さらに、複雑なモデルになればなるほどたくさんのパラメータを推定する必要がある。そのために大量の訓練データを必要とする。限られたデータのできるだけ多くを訓練データに使用したいが、そうすると検証に用いるデータが少なくなってしまい、妥当性を適切に評価できない。
【0027】
そこで、データセットをn個のブロック(サブセット)に分割し、それらの内の1つを検証データにし、残りのn-1個を訓練データにするデータ割り当てをn通り用意して、n回実施した「モデルの学習&検証」の結果の平均(および分散)を使ってモデル作成法を評価する。これがn分割交差検証と呼ばれる手法である。n個のサブセットへのデータセットの分割は通常乱数を使って自動処理される。
<精度>
まず、表7、表8、表9にパフォーマンスの比較を示す。表8および表9のインデックスは、表7の値である(表7の値との差を示す)。
表7~9は、それぞれ、は、67項目、18項目、14項目を使用した4つの方法のパフォーマンスを示す。
【表7】
【表8】
【表9】
アンサンブルディシジョンツリー方式を除いて、他の3つの方式の精度と平均F_1スコアとは、67項目(表7)をすべての入力データセットと比較して、さらに増加した。
EFAとSEMの後続の手順が、予測対象、診断されていないOSAに関連する、どんな抽出された変数と因子を目的としても、結果としては、抽出後の特性は、放棄された変数と比較してより強力な予測能力を持っている。
【0028】
予測した結果が示しているのは、次元の中で除去された部分がOSAの予測に対してより悪い影響をもたらすものでさえあったということである。
アンサンブルツリーの精度の低下はわずか0.3%で、非常に低い。また、アンサンブルディシジョンツリーの機能の1つは、データディメンションが高いほど、予測精度も高くなることである。したがって、ここでの精度のわずかな低下はほとんど無視できる。
さらに、表9と表8のパフォーマンスインデックスを比較すると、インデックスは基本的に変更されていない。
【0029】
構造モデルは、4つの項目をさらに減らすのに役立つが、モデル予測の精度にはほとんど影響しない。データの潜在的な構造を分析するために構造モデルを利用すると、EFAと比較してデータディメンションをさらに簡略化できることがわかる。
<計算時間>
また、計算時間の比較を表10に示す。18項目と14項目のデータは、67項目の値である(±67項目との差)。
表10に示すように、4つの方法の中で、14項目の計算時間が最短である。データ次元の削減により、計算効率が向上する。本論文では高度な機械学習手法を選択していないため、計算時間は比較的短い。
ただし、より多くのデータ対象がある場合、またはより高度な機械学習手法を使用している場合、計算時間は重要な評価指標である。すべての研究において、計算速度は速い方が望ましい。
【0030】
【表10】
<議論>
提示された論文は、機械学習法を実施する前にデータ数(問い数)を削減するための構造方程式モデリングの新しいアプリケーションを示している。
EFAやPCAなどのアクセス可能なコンポーネント抽出方法と比較して、構造モデルは、観測された変数の背後に隠された潜在的な関係を分析する。さらに、研究対象との弱い関係に属する変数をさらに削除できる。
【0031】
予測モデルを作成するとき、社会、医療、経済などの研究のように、研究対象と観測された変数との関係を見つけるのが難しい場合がある。
潜在因子は、密接な関係を持つ観測変数の抽象的な概念を抽出する。構造モデルは、潜在因子間のこれらの関係を分析するのに適している。
したがって、入力データに対して実行される前処理手段としてSEM分析を機械学習フィールドに導入することは、次の2つの側面に特化している。
【0032】
一方の側面では、単純化された入力データ構造は、提示された作業が示すように、精度に影響を与えることなく計算効率を向上させる。
他方の側面では、入力データが保持する特性間の関係を明確にすることで、機械学習法のショートカットがサポートされ、意思決定ルールの作成やモデル構造の学習が可能になる。
<結論>
この実施の形態では、予測モデルを作成する前にデータディメンションを簡略化するために、構造方程式モデリングを機械学習フィールドに導入した。SEMは、社会調査のトピックでデータ分析に一般的に使用される方法である。このアプローチは、SEMのアプリケーション範囲を拡大し、機械学習の問題における次元の単純化に対して、データの新しい方法を提供した
実験結果は、簡略化が有効であり、構造モデル分析が従来のデータ抽出手段であるEFAより優れていることを示した。
なお、18項目と14項目のデータは、比較のためのAHI(≧5)を含んでいる。そのため、実際に使用する場合、質問票は、17項目と13項目のデータである。
【0033】
<応用>
睡眠時無呼吸症であるかどうかを、上記因子を含む質問票を用いて、チェックすることで、病院などの施設に行かなくともよい。
たとえば、会社や各種団体、個人家庭で、上記質問票を用いて、睡眠時無呼吸症であるかどうかを、正確に判断できる。判断の結果、必要に応じて、病院など医療機関に行く。
なお、この応用は、医療行為でなく、医療行為の前段階の健康チェックである。
また、この質問票にスマートホン、情報機器などで回答し、睡眠時無呼吸症を判断できる。また、定期的に質問票に回答することで、睡眠時無呼吸症へ進んでいるか、進んでいないかを判断できる。進んでいる場合は、対策を講じることができる。
図4は、日と質問で当てはまる項目数との関係を示す。要注意ラインを超えると、医療施設に相談するとか、対策を積極的するなどをする。当然、要注意ラインに近づかないように対策をすべきである。
毎年の健康診断時に、質問票を使用してもよい。長期間の傾向を確認し必要に応じて対策ができる。睡眠時無呼吸にならないようにできる。各自家庭で、定期的に実施してもよい。
さらに、診断の結果とともに、
図3のような、各症状間の関係性を提供してもよい。各症状間の関係とは、各症状間の依存性である。または、
図1,2のように、症状と質問との依存性を提供してもよい。提供された人は、対策を検討することがしやすい。
また、問題の質問ごとに、その対策案を提案するようにしてもよい。質問ごとに複数の対策案をデータとしてもち、その質問が問題(当てはまる)である場合に、その対策を提案する。なお、質問ごとの寄与度から、寄与度が高い他の質問の対策も提案してもよい。
【産業上の利用可能性】
【0034】
本発明の質問票とそれを使用した予備調査方法は、会社や各種団体、個人家庭で、睡眠時無呼吸症であるかどうか判断するために利用できる。
【符号の説明】
【0035】
Sn いびき
SC 睡眠障害
He 健康
HBN 夜の息苦しさ
UD 基礎疾患
UO 診断されていないがOSA
Ge 性別
HoS 頻度いびき
HLD いびきの音量
CS いびきの変化
TFA 不安により睡眠するか
WN 夜に目覚める
WE 早起きする
RP 身体的影響
VT 活力
RE 感情の影響
WC 咳による覚醒
CP 胸痛による覚醒
SoB 息切れによる覚醒
Hy 高血圧
Nu 夜間頻尿