(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024003774
(43)【公開日】2024-01-15
(54)【発明の名称】骨粗鬆症による骨折の推測及び予測の少なくとも一方の方法、骨折スコア出力方法、学習モデル生成方法、学習モデル、骨粗鬆症による骨折のリスク因子推定方法、グラフ作成方法、プログラム、情報処理装置、並びに、学習データセット作成方法
(51)【国際特許分類】
G16H 50/50 20180101AFI20240105BHJP
【FI】
G16H50/50
【審査請求】有
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2023101241
(22)【出願日】2023-06-20
(11)【特許番号】
(45)【特許公報発行日】2024-01-04
(31)【優先権主張番号】P 2022099113
(32)【優先日】2022-06-20
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】518162924
【氏名又は名称】山本 威久
(74)【代理人】
【識別番号】110002734
【氏名又は名称】弁理士法人藤本パートナーズ
(72)【発明者】
【氏名】山本 威久
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA04
(57)【要約】
【課題】骨折推測・予測方法、骨折スコア出力方法、学習モデル及び生成方法、リスク因子推定方法、プログラム、情報処理装置、学習データセット作成方法を提供する。
【解決手段】学習モデルに臨床情報を入力し骨折スコアを出力させ、学習モデルは骨折の有無及び骨折数から選ばれた1種以上を判定された各被験者の臨床情報を入力され骨折スコアを出力する機械学習し、臨床情報は、年齢、身長、体重、BMI、骨密度、骨代謝マーカー、腎機能マーカー、骨格筋量マーカー、既存身長低下、初経年齢、閉経年齢、閉経からの年数、経過期間の長さ、FRAX結果、骨密度予測値、骨量減少率予測値等から選ばれる4種以上のデータを含み、各被験者の骨折スコアは判定結果と4種以上のデータを含む5種以上の観測変数を設ける共分散構造分析で判定結果の観測変数に対し直接的に有意な因果関係が認められる潜在変数の因子得点である、骨折スコア出力方法である。
【選択図】
図1
【特許請求の範囲】
【請求項1】
閉経後である第1時点での骨粗鬆症による既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記第1時点を過ぎてから後の第2時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上に関する骨折スコアを出力する方法であって、
前記骨折スコアを出力可能な学習モデルに対象者の前記第1時点での臨床情報を入力して前記対象者の前記骨折スコアを出力する処理を情報処理装置に実行させるステップを含み、
前記骨折スコアを出力可能な学習モデルは、前記第1時点での前記既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記経過期間内での前記新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上を判定された各被験者の前記第1時点での前記臨床情報を入力されると、前記各被験者の前記骨折スコアを出力するように機械学習したものであり、
前記第1時点での前記臨床情報は、年齢、身長、体重、BMI、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第1時点までの年数、前記経過期間の長さ、FRAX(登録商標)による骨折リスク評価結果、前記第2時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータからなる群より選ばれる4種以上の臨床データを含み、
前記各被験者の前記骨折スコアは、前記判定の結果と、前記各被験者の前記4種以上の臨床データと、を含む5種以上の観測変数が設けられ共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである、骨折スコア出力方法。
【請求項2】
前記骨量減少率予測値は、骨量減少率を出力可能な学習モデルに前記第1時点での骨密度と前記第1時点での他の臨床情報とを入力して前記骨量減少率予測値を出力する処理を情報処理装置に実行させて出力される臨床データであり、
前記骨量減少率を出力可能な学習モデルは、前記第1時点と前記第2時点とで骨密度を計測された各被験者についての、前記第1時点での骨密度と、前記第1時点での前記他の臨床情報とを入力されると、前記第2時点での骨密度と、前記経過期間内での骨量減少率とを出力するように機械学習したものであり、
前記第1時点での前記他の臨床情報は、年齢、身長、体重、BMI、体脂肪率、除脂肪体重、体脂肪量、初経年齢、閉経年齢、閉経時から前記第1時点までの年数、及び、これらのいずれかを間接的に示すデータから選ばれた1種以上の他の臨床データを含む、請求項1に記載された骨折スコア出力方法。
【請求項3】
前記骨密度は、上腕骨近位部、橈骨遠位部、頚椎、胸椎、腰椎及び大腿骨近位部から選ばれた1箇所以上の身体部位における少なくとも一部の領域についてのものである、請求項1に記載された骨折スコア出力方法。
【請求項4】
請求項1乃至請求項3のいずれか一項に記載された骨折スコア出力方法により前記対象者の前記骨折スコアを出力し、出力された前記対象者の前記骨折スコアと前記骨折スコアの閾値との比較結果に基づいて、前記対象者についての、前記第1時点での前記既存骨折の有無の推測結果、前記第1時点での前記既存骨折の骨折数の推測結果、前記経過期間内での前記新規骨折の有無の予測結果、及び、前記経過期間内での前記新規骨折の骨折数の予測結果から選ばれた1種以上に関する結果データを出力する処理を情報処理装置に実行させる、骨粗鬆症による骨折の推測及び予測の少なくとも一方の方法。
【請求項5】
閉経後である第1時点での骨粗鬆症による既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記第1時点を過ぎてから後の第2時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上を判定された各被験者の前記第1時点での臨床情報が入力されると前記各被験者の骨折スコアを出力する学習モデルを、機械学習により生成するステップを含み、
前記第1時点での前記臨床情報は、年齢、身長、体重、BMI、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第1時点までの年数、前記経過期間の長さ、FRAX(登録商標)による骨折リスク評価結果、前記第2時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータから選ばれた4種以上の臨床データを含み、
前記各被験者の前記骨折スコアは、前記判定の結果と、前記4種以上の臨床データと、を含む5種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである、学習モデル生成方法。
【請求項6】
閉経後である第1時点での骨粗鬆症による既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記第1時点を過ぎてから後の第2時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上に関する骨折スコアを出力可能な学習モデルであって、
前記学習モデルは、前記第1時点での前記既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記経過期間内での前記新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上を判定された各被験者の前記第1時点での臨床情報が入力されると前記各被験者の前記骨折スコアを出力するように重み付け値が機械学習されたものであり、且つ、対象者の前記第1時点での前記臨床情報が入力される場合には前記対象者の前記臨床情報に対して前記重み付け値に基づく演算を行って前記対象者の前記骨折スコアを出力するように情報処理装置を機能させるものであり、
前記第1時点での前記臨床情報には、年齢、身長、体重、BMI、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第1時点までの年数、前記経過期間の長さ、FRAX(登録商標)による骨折リスク評価結果、前記第2時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータから選ばれた4種以上の臨床データを含み、
前記各被験者の前記骨折スコアは、前記判定の結果と、前記各被験者の前記4種以上の臨床データと、を含む5種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである、学習モデル。
【請求項7】
請求項6に記載された学習モデルに基づいて、応答曲面法により、前記各被験者を含む被験者らの前記臨床情報と前記被験者らの前記骨折スコアとの関係を示す応答曲面を生成し、生成される前記応答曲面に骨折リスク陽性領域が含まれている場合には、推定されるリスク因子を特定する処理を情報処理装置に実行させるステップを含み、
前記骨折リスク陽性領域は、前記学習モデルに基づいて、前記骨折スコアの値を示す第1軸と前記4種以上の臨床データから選択された1種の臨床データの値を示す第2軸とを有し且つ前記応答曲面と前記骨折スコアのカットオフ値との関係を示す二次元グラフ又は三次元グラフを作成する処理を情報処理装置に実行させる場合に、作成される前記二次元グラフ又は前記三次元グラフに含まれる前記応答曲面において前記骨折スコアの値が前記カットオフ値よりも高値となる部分の領域であり、
前記推定されるリスク因子は、少なくとも、前記第2軸における前記選択された1種の臨床データの値に関するものである、骨粗鬆症による骨折のリスク因子推定方法。
【請求項8】
前記対象者の前記第1時点での前記臨床情報を取得し、取得した該臨床情報を請求項6に記載された学習モデルに入力して前記対象者の前記骨折スコアを出力する処理を情報処理装置に実行させるプログラム。
【請求項9】
前記学習モデルが記憶される記憶部と、
前記対象者の前記第1時点での前記臨床情報を取得した場合に、所得した該臨床情報を前記学習モデルに入力して前記対象者の前記骨折スコアを出力する処理を実行する演算部と、
を備える、請求項6に記載された学習モデルを有する情報処理装置。
【請求項10】
閉経後である第1時点での骨粗鬆症による既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記第1時点を過ぎてから後の第2時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上を判定された各被験者の前記判定の結果と、前記各被験者の前記第1時点での4種以上の臨床データと、を含む5種以上の観測変数を設けて共分散構造分析を行い、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータを取得するステップを含み、
前記第1時点での前記4種以上の臨床データは、年齢、身長、体重、BMI、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第1時点までの年数、前記経過期間の長さ、FRAX(登録商標)による骨折リスク評価結果、前記第2時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータから選ばれる、学習データセット作成方法。
【請求項11】
病気に関する受診者らの臨床情報に基づいて、前記病気で発生する場合がある合併症のリスク因子を推定する方法であって、
前記受診者らに含まれる各受診者は、前記病気に関して診察された第1診察時点では前記合併症が発生していないことを診断され、且つ、前記第1診察時点を過ぎてから後の第2診察時点までの経過観察期間内での前記合併症の発生の有無を判定する診断をされた者であり、
前記方法は、前記各受診者の臨床情報が入力されると前記各受診者の合併症発生スコアを出力するように機械学習した学習モデルに基づいて、応答曲面法により前記受診者らの前記臨床情報と前記受診者らの前記合併症発生スコアとの関係を示す応答曲面を生成し、生成される前記応答曲面に合併症発生リスク陽性領域が含まれる場合には推定されるリスク因子を特定する処理を情報処理装置に実行させるステップを含み、
前記各受診者の前記臨床情報は、前記第1診察時点における前記各受診者に関する4種以上の臨床データを含み、
前記各受診者の前記合併症発生スコアは、前記各受診者の前記判定の結果と、前記各受診者の前記4種以上の臨床データと、を含む5種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータであり、
前記合併症発生リスク陽性領域は、前記学習モデルに基づいて、前記合併症発生スコアの値を示す第1軸と前記4種以上の臨床データから選択された1種の臨床データの値を示す第2軸とを有し且つ前記応答曲面と前記合併症発生スコアのカットオフ値との関係を示す二次元グラフ又は三次元グラフを作成する処理を情報処理装置に実行させる場合に、作成される前記二次元グラフ又は前記三次元グラフに含まれる前記応答曲面において前記合併症発生スコアの値が前記カットオフ値よりも高値となる部分の領域であり、
前記推定されるリスク因子は、少なくとも、前記第2軸における前記選択された1種の臨床データの値に関するものである、合併症のリスク因子推定方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、骨粗鬆症による骨折の推測及び予測の少なくとも一方の方法と、推測や予測の指標となる骨折スコアを出力する方法と、骨折スコアを出力可能な学習モデル及びその生成方法と、骨粗鬆症による骨折のリスク因子推定方法と、プログラムと、情報処理装置と、学習データセット作成方法とに関する。また、本発明は、骨粗鬆症や骨折に限られない合併症(ある病気が原因となって起こる他の病気)について、合併症のリスク因子推定方法に関する。
【背景技術】
【0002】
ヒトの骨量は、学童期から思春期に増加し、20歳前後で最大値を示した後、安定的に推移する。その後、女性では、一般的に50歳前後で閉経により女性ホルモン(エストロゲン)が急激に枯渇し、閉経後10年ほどの間に骨量が著しく減少し、骨量減少または骨粗鬆症と診断される領域へと進行する。骨粗鬆症は、2000年に米国立衛生研究所(NIH)のコンセンサス会議で「骨強度の低下を特徴とし、骨折リスクが増大しやすくなる骨格疾患」と定義された。ここでの骨強度は、骨密度(bone mineral density:以下「BMD」ともいう)と骨質という2つの要因からなる(骨強度=BMD+骨質)。BMDは骨強度のほぼ70%を説明でき、残る30%は骨質(例えば、骨の微細構造、骨代謝回転、微小骨折(マイクロクラック)又は骨組織の石灰化度等)で説明できるとされる。つまり、骨粗鬆症では、BMD低下や骨質劣化により骨強度が低下し、骨折の危険性が増す。骨粗鬆症において骨折は、骨強度低下という病状進行に伴って生じ得る合併症の一つといえる。骨粗鬆症による骨折は、骨強度低下により、わずかな外力で生じ得る非外傷性の骨折で、「骨粗鬆症性骨折」又は「脆弱性骨折」ともいわれる。
【0003】
日本では超高齢化社会を迎え、骨粗鬆症患者数が増え続けている。近年、日本において腰椎又は大腿骨近位部で骨粗鬆症と診断された患者数は、男性で約300万人、女性で約980万人といわれ(非特許文献1参照)、女性で圧倒的に多い。骨粗鬆症による骨折は、患者のQOL(quality of life)やADL(activities of daily living)を著しく低下させ、入院治療のために医療費の個人負担額や国の医療保険費用を増大させ、医療経済を悪化させる社会問題となっている。また、骨粗鬆症による腰椎や胸椎の骨折は、別名で「いつのまにか骨折」ともいい、強い疼痛を伴わず患者の自覚なく生じる場合が多く、1つ目の骨折が生じると2つ目の骨折が生じるリスクが約3倍になるといわれる。これらの問題を改善するには、例えば、検診で骨粗鬆症を早期段階で発見し、適切な薬物治療や患者指導(リエゾン)で早期予防・治療を図ることが、臨床医学での重要な課題と考えられる。
【0004】
従来、骨粗鬆症による骨折リスクの定量的評価方法としては、世界保健機関(WHO)の提唱(非特許文献2)に基づき、骨折確率算定モデルによる骨折リスク評価ツールであるFRAX(登録商標、以下同じ)が活用されている。FRAXでは、大腿骨近位部骨折、上腕骨近位部骨折、橈骨遠位端骨折及び臨床椎体骨折をまとめて「主要骨粗鬆症性骨折」としている。ここでの「臨床椎体骨折」は、腰背部痛等の明らかな症状があり、エックス線写真により椎体骨折が確認されたものを指す。FRAXを用いる場合、例えば、インターネットで非特許文献3に係るウェブサイトにアクセスし、骨粗鬆症による骨折リスクを予測される対象者について少なくとも次の11種の骨折危険因子を入力すると、対象者の大腿骨近位部骨折と主要骨粗鬆症性骨折とについて10年間での発生確率が算出される。11種の骨折危険因子は、年齢、性別、体重、身長、骨折歴(骨折既往)の有無、両親の大腿骨近位部骨折歴の有無、現在の喫煙の有無、糖質コルチコイドの経口投与の有無、関節リウマチの確定診断の有無、続発性骨粗鬆症との間で強い関連性がある疾患(例えばI型糖尿病又は甲状腺機能亢進症等)の有無、及び、1日3単位(1単位:エタノール8~10g)以上のアルコール摂取の有無である。この11種の骨折危険因子に、さらに、大腿骨近位部BMDを加え、合計12種の骨折危険因子を入力してもよい。非特許文献1には、BMDが70%YAMよりも大きく80%YAM未満である対象者(ただし、75歳以上の女性を除く)について、「FRAXの10年間の主要骨粗鬆症性骨折確率15%以上」を、骨粗鬆症の治療開始基準とする旨、記載されている。
【0005】
また、特許文献1に記載されたように、本願に係る発明者は以前に、人工ニューラルネットワーク(Artificial Neural Network:以下「ANN」ともいう)に機械学習させた学習モデルを用い、閉経後女性での将来の骨量を予測する方法を創作した。この学習モデルは、閉経後の任意の時点のBMD等の情報を入力されると、その時点から5年以上経過した第2時点のBMDと、この5年以上の経過期間内の骨量減少率(bone loss rate:以下「BLR」ともいう)とを出力するように機械学習したモデルであり、以下「BLR予測値を出力可能な学習モデル」ともいう。この学習モデルで、BMDと共に入力するデータとして、年齢、身長、体重、体格指数(body mass index:以下「BMI」ともいう)、体脂肪率、除脂肪体重、体脂肪量、初経年齢、閉経年齢、閉経後経過年数、及び、これらの数値を間接的に示す情報から選ばれた1種以上の臨床データが挙げられる。
【0006】
また、特許文献2に記載されたように、本願に係る発明者は以前に、川崎病又はIgA血管炎での合併症発生リスク予測方法を創作した。このリスク予測方法では、合併症発生の有無を判定された川崎病又はIgA血管炎の患者について、この患者での前記判定の結果及び3種以上の臨床データの各々を観測変数として、共分散構造分析を行う。また、この患者の3種以上の臨床データと、共分散構造分析により算出されたサンプルスコア(潜在変数の因子得点)との関係を機械学習した学習済みモデルを生成する。生成された学習済みモデルは、新規患者の3種以上の臨床データを入力されると、この新規患者の合併症発生リスクに関するサンプルスコアの予測値を出力可能である。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特許第6585869号公報
【特許文献2】特許第6986650号公報
【特許文献3】特許第6703412号公報
【非特許文献】
【0008】
【非特許文献1】骨粗鬆症の予防と治療ガイドライン作成委員会、「骨粗鬆症の予防と治療ガイドライン2015年版」、一般社団法人日本骨粗鬆症学会、一般社団法人日本骨代謝学会、公益財団法人骨粗鬆症財団、2015年
【非特許文献2】「WHO scientific group on the assessment of osteoporosis at primary health care level」、World Health Organization、Summary Meeting Report Brussels, Belgium 2004
【非特許文献3】「FRAX 骨折リスク評価ツール」、[online]、[令和4年2月10日検索]、インターネット、<URL: https://www.sheffield.ac.uk/FRAX/tool.aspx?lang=jp >
【非特許文献4】Paul Deurenberg、他2名、「Body mass index as a measure of body fatness: age- and sex-specific prediction formulas」、British Journal of Nutrition、1991年、第65巻、第2号、pp.105-114
【非特許文献5】笠松隆洋、他4名、「和歌山県下一漁村住民の骨密度調査(第1報)地域代表性のある集団での性・年齢別骨密度値」、日本衛生学雑誌、1996年、第50巻、第6号、pp.1084-1092
【非特許文献6】吉村典子、他3名、「和歌山県下一漁村住民の骨密度調査(第2報)骨密度に影響を与える要因の分析」、日本衛生学雑誌、1996年、第51巻、第3号、pp.677-684
【非特許文献7】N. Yoshimura、他5名、「Determinants of Bone Loss in a Rural Japanese Community: The Taiji Study」、Osteoporosis International、1998年11月、第8巻、第6号、pp.604-610
【発明の概要】
【発明が解決しようとする課題】
【0009】
しかし、閉経後女性は、BMD減少に関連する体質に個人差が大きく(特許文献1参照)、骨粗鬆症による新規骨折の予測が難しい。また、前述したFRAX(非特許文献1乃至3参照)には、主要骨粗鬆症性骨折(特に椎体骨折)の予測精度が低い問題と、評価結果が年齢に大きく依存している問題とがある。例えば、医療機関を受診した75歳以上の女性らの90%以上の例では、FRAXを用いて主要骨粗鬆症骨折の発生確率を求めると、骨折発生確率20%以上の評価結果が算出される。仮に、この評価結果を受容すれば、ほぼ全ての女性は75歳以上になると薬物治療に該当しかねない。この問題を避けるために、日本骨粗鬆症学会は、FRAXによる評価結果に基づく薬物治療開始を、女性では75歳未満に限るように規定している(非特許文献1参照)。75歳未満の女性でも、50歳前後と比べて60歳代、70歳代前半と高齢になるほど、実際の骨折発生確率と比べてFRAXで高すぎる骨折発生確率が算出されやすく、実態との乖離が大きくなり予測精度が低下することが、日常診療の現場で問題になっている。また、特許文献1に記載された方法では、予測される対象が将来の骨量(BMD又はBLR)であり、新規骨折ではない。骨量と比べて、骨粗鬆症による新規骨折の発生には、既知の要因だけでなく未知の要因も含めて、数多くの要因が少しずつ関連すると考えられ、予測が難しい。このように、従来、骨粗鬆症医療の日常診療の現場では、閉経後女性の骨粗鬆症による新規骨折を予測することが困難である。
【0010】
また、一般的に医師は、骨粗鬆症による既存骨折の有無を診断する際に、エックス線撮影又はMRI等で取得した骨の画像により画像診断している。仮に、このような骨の画像が無ければ、従来、医師にとっては、既存骨折の有無を診断することが難しい。このため、従来、大勢の閉経後女性(大勢の受診者)が骨粗鬆症検診を受ける場合には、全ての受診者が一律にエックス線撮影等を受けている。しかし、大半の受診者は「既存骨折なし」と画像診断され、「既存骨折あり」と画像診断される受診者は比較的少人数に留まる場合が多い。従来、多くの受診者は、「既存骨折なし」と診断される可能性が高いにも関わらずエックス線撮影等を受ける必要があり、検診担当医は、大勢の受診者を次々と短時間で画像診断しなければならないといえる。本願に係る発明者は、新規に骨粗鬆症検診を受ける受診者らについて、例えば骨の画像なしでも、骨粗鬆症による既存骨折が生じている可能性が高いか否かを推測可能な方法があれば望ましいと考えた。そのような方法があれば、既存骨折が生じている可能性が高いと推測された少人数の受診者に絞って、エックス線撮影等で骨の画像を生成し画像診断すればよいと考えられる。既存骨折の可能性が低いと推測された多くの受診者らは、エックス線撮影等を免れ、検診担当医は、絞られた少人数の受診者一人ひとりに時間をかけ慎重に診断しやすくなると期待される。
【0011】
ここで、本願に係る発明者は、前述の合併症発生リスク予測方法(特許文献2)を創作した経験から、共分散構造分析及び機械学習に基づき、骨粗鬆症による骨折の推測方法や予測方法を創作することを考えた。しかし、どのような臨床データを使用すれば比較的高精度の推測や予測が可能となるのか、病気ごとに異なる。可能であれば、骨粗鬆症や骨折に限られず合併症について、合併症を発生させるリスク因子となる臨床データを推定可能な方法があれば、望ましいと考えられる。
【0012】
そこで、本発明の課題は、共分散構造分析及び機械学習に基づく、閉経後女性の骨粗鬆症による骨折の推測及び予測の少なくとも一方の方法と、推測や予測の指標となる骨折スコアを出力する方法と、骨折スコアを出力可能な学習モデル及びその生成方法と、骨粗鬆症による骨折のリスク因子推定方法と、プログラムと、情報処理装置と、学習データセット作成方法と、合併症のリスク因子推定方法とを提供することにある。
【課題を解決するための手段】
【0013】
上記した課題を解決するために、一実施形態に係る骨折スコア出力方法は、閉経後である第1時点での骨粗鬆症による既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記第1時点を過ぎてから後の第2時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上に関する骨折スコアを出力する方法であって、
前記骨折スコアを出力可能な学習モデルに対象者の前記第1時点での臨床情報を入力して前記対象者の前記骨折スコアを出力する処理を情報処理装置に実行させるステップを含み、
前記骨折スコアを出力可能な学習モデルは、前記第1時点での前記既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記経過期間内での前記新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上を判定された各被験者の前記第1時点での前記臨床情報を入力されると、前記各被験者の前記骨折スコアを出力するように機械学習したものであり、
前記第1時点での前記臨床情報は、年齢、身長、体重、BMI、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第1時点までの年数、前記経過期間の長さ、FRAX(登録商標)による骨折リスク評価結果、前記第2時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータからなる群より選ばれる4種以上の臨床データを含み、
前記各被験者の前記骨折スコアは、前記判定の結果と、前記各被験者の前記4種以上の臨床データと、を含む5種以上の観測変数が設けられ共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである。
【0014】
斯かる骨折スコア出力方法によれば、使用する学習モデルは、各被験者の第1時点での臨床情報に含まれる4種以上の臨床データと、各被験者についての共分散構造分析により算出される潜在変数の因子得点に関するデータである骨折スコアとの関係を、機械学習し生成されたモデルである。この学習モデルに、対象者の第1時点での臨床情報に含まれる4種以上の臨床データを入力することより、対象者の骨折スコアを出力可能である。この学習モデルにより出力される対象者の骨折スコアは、機械学習に供した各被験者の骨折スコア(潜在変数の因子得点に関するデータ)が、既存骨折の有無、既存骨折の骨折数、新規骨折の有無及び新規骨折の骨折数から選ばれたどの1種以上の判定結果に基づくものであるかに由来して、既存骨折の有無、既存骨折の骨折数、新規骨折の有無及び新規骨折の骨折数から選ばれた1種以上についての推測及び予測の少なくとも一方の指標となる。臨床情報に含まれる4種以上の臨床データは、従来の骨粗鬆症医療に関する日常診療の現場で取得可能なデータである。ここで説明したことは、以下に述べる、骨粗鬆症による骨折の推測及び予測の少なくとも一方の方法、学習モデル及びその生成方法、骨粗鬆症による骨折のリスク因子推定方法、プログラム、情報処理装置並びに学習データセット作成方法でも同様である。
【0015】
一実施形態に係る骨粗鬆症による骨折の推測及び予測の少なくとも一方の方法は、前記骨折スコア出力方法により前記対象者の前記骨折スコアを出力し、出力された前記対象者の前記骨折スコアと前記骨折スコアの閾値との比較結果に基づいて、前記対象者についての、前記第1時点での前記既存骨折の有無の推測結果、前記第1時点での前記既存骨折の骨折数の推測結果、前記経過期間内での前記新規骨折の有無の予測結果、及び、前記経過期間内での前記新規骨折の骨折数の予測結果から選ばれた1種以上に関する結果データを出力する処理を情報処理装置に実行させ得る。
【0016】
一実施形態に係る学習モデル生成方法は、閉経後である第1時点での骨粗鬆症による既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記第1時点を過ぎてから後の第2時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上を判定された各被験者の前記第1時点での臨床情報が入力されると前記各被験者の骨折スコアを出力する学習モデルを、機械学習により生成するステップを含み、
前記第1時点での前記臨床情報は、年齢、身長、体重、BMI、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第1時点までの年数、前記経過期間の長さ、FRAX(登録商標)による骨折リスク評価結果、前記第2時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータから選ばれた4種以上の臨床データを含み、
前記各被験者の前記骨折スコアは、前記判定の結果と、前記4種以上の臨床データと、を含む5種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである。
【0017】
一実施形態に係る学習モデルは、閉経後である第1時点での骨粗鬆症による既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記第1時点を過ぎてから後の第2時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上に関する骨折スコアを出力可能な学習モデルであって、
前記学習モデルは、前記第1時点での前記既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記経過期間内での前記新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上を判定された各被験者の前記第1時点での臨床情報が入力されると前記各被験者の前記骨折スコアを出力するように重み付け値が機械学習されたものであり、且つ、対象者の前記第1時点での前記臨床情報が入力される場合には前記対象者の前記臨床情報に対して前記重み付け値に基づく演算を行って前記対象者の前記骨折スコアを出力するように情報処理装置を機能させるものであり、
前記第1時点での前記臨床情報には、年齢、身長、体重、BMI、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第1時点までの年数、前記経過期間の長さ、FRAX(登録商標)による骨折リスク評価結果、前記第2時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータから選ばれた4種以上の臨床データを含み、
前記各被験者の前記骨折スコアは、前記判定の結果と、前記各被験者の前記4種以上の臨床データと、を含む5種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである。
【0018】
一実施形態に係る骨粗鬆症による骨折のリスク因子推定方法は、前記学習モデルに基づいて、応答曲面法により、前記各被験者を含む被験者らの前記臨床情報と前記被験者らの前記骨折スコアとの関係を示す応答曲面を生成し、生成される前記応答曲面に骨折リスク陽性領域が含まれている場合には、推定されるリスク因子を特定する処理を情報処理装置に実行させるステップを含み、
前記骨折リスク陽性領域は、前記学習モデルに基づいて、前記骨折スコアの値を示す第1軸と前記4種以上の臨床データから選択された1種の臨床データの値を示す第2軸とを有し且つ前記応答曲面と前記骨折スコアのカットオフ値との関係を示す二次元グラフ又は三次元グラフを作成する処理を情報処理装置に実行させる場合に、作成される前記二次元グラフ又は前記三次元グラフに含まれる前記応答曲面において前記骨折スコアの値が前記カットオフ値よりも高値となる部分の領域であり、
前記推定されるリスク因子は、少なくとも、前記第2軸における前記選択された1種の臨床データの値に関するものであり得る。
【0019】
一実施形態に係るプログラムは、前記対象者の前記第1時点での前記臨床情報を取得し、取得した該臨床情報を前記学習モデルに入力して前記対象者の前記骨折スコアを出力する処理を情報処理装置に実行させ得る。
【0020】
一実施形態に係る前記学習モデルを有する情報処理装置は、前記学習モデルが記憶される記憶部と、前記対象者の前記第1時点での前記臨床情報を取得した場合に、所得した該臨床情報を前記学習モデルに入力して前記対象者の前記骨折スコアを出力する処理を実行する演算部と、を備え得る。
【0021】
一実施形態に係る学習データセット作成方法は、閉経後である第1時点での骨粗鬆症による既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記第1時点を過ぎてから後の第2時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上を判定された各被験者の前記判定の結果と、前記各被験者の前記第1時点での4種以上の臨床データと、を含む5種以上の観測変数を設けて共分散構造分析を行い、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータを取得するステップを含み、
前記第1時点での前記4種以上の臨床データは、年齢、身長、体重、BMI、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第1時点までの年数、前記経過期間の長さ、FRAX(登録商標)による骨折リスク評価結果、前記第2時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータから選ばれる。
【0022】
一実施形態に係る合併症のリスク因子推定方法は、病気に関する受診者らの臨床情報に基づいて、前記病気で発生する場合がある合併症のリスク因子を推定する方法であって、
前記受診者らに含まれる各受診者は、前記病気に関して診察された第1診察時点では前記合併症が発生していないことを診断され、且つ、前記第1診察時点を過ぎてから後の第2診察時点までの経過観察期間内での前記合併症の発生の有無を判定する診断をされた者であり、
前記方法は、前記各受診者の臨床情報が入力されると前記各受診者の合併症発生スコアを出力するように機械学習した学習モデルに基づいて、応答曲面法により前記受診者らの前記臨床情報と前記受診者らの前記合併症発生スコアとの関係を示す応答曲面を生成し、生成される前記応答曲面に合併症発生リスク陽性領域が含まれる場合には推定されるリスク因子を特定する処理を情報処理装置に実行させるステップを含み、
前記各受診者の前記臨床情報は、前記第1診察時点における前記各受診者に関する4種以上の臨床データを含み、
前記各受診者の前記合併症発生スコアは、前記各受診者の前記判定の結果と、前記各受診者の前記4種以上の臨床データと、を含む5種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータであり、
前記合併症発生リスク陽性領域は、前記学習モデルに基づいて、前記合併症発生スコアの値を示す第1軸と前記4種以上の臨床データから選択された1種の臨床データの値を示す第2軸とを有し且つ前記応答曲面と前記合併症発生スコアのカットオフ値との関係を示す二次元グラフ又は三次元グラフを作成する処理を情報処理装置に実行させる場合に、作成される前記二次元グラフ又は前記三次元グラフに含まれる前記応答曲面において前記合併症発生スコアの値が前記カットオフ値よりも高値となる部分の領域であり、
前記推定されるリスク因子は、少なくとも、前記第2軸における前記選択された1種の臨床データの値に関するものである。
【0023】
斯かる合併症のリスク因子推定方法によれば、使用する学習モデルは、各受診者の第1診察時点での臨床情報に含まれる4種以上の臨床データと、各受診者についての共分散構造分析により算出される潜在変数の因子得点に関するデータである合併症発生スコアとの関係を、機械学習し生成されたモデルである。この学習モデルに基づいて、応答曲面法により、受診者らの臨床情報と合併症発生スコアとを反映させた応答曲面を生成可能である。生成される応答曲面において、該応答曲面での合併症発生スコアの値がカットオフ値よりも高値である合併症発生リスク陽性領域が含まれる場合には、機械学習に供した4種以上の臨床データのうちに、合併症のリスク因子と推定される臨床データが少なくとも1種は含まれている。生成される応答曲面を含む二次元グラフ又は三次元グラフを作成し、作成される二次元グラフ又は三次元グラフに含まれる応答曲面に合併症発生リスク陽性領域が形成されている場合には、この場合の二次元グラフ又は三次元グラフが有する第2軸が示す選択された1種の臨床データの値は、合併症のリスク因子に関する値と推定され得る。
【発明の効果】
【0024】
以上に説明した各実施形態によれば、共分散構造分析及び機械学習に基づく、閉経後女性の骨粗鬆症による骨折の推測及び予測の少なくとも一方の方法と、推測や予測の指標となる骨折スコアを出力する方法と、骨折スコアを出力可能な学習モデル及びその生成方法と、骨粗鬆症による骨折のリスク因子推定方法と、プログラムと、情報処理装置と、学習データセット作成方法と、合併症のリスク因子推定方法とを提供可能である。
【図面の簡単な説明】
【0025】
【
図1】実施形態1に係る骨粗鬆症による骨折の推測・予測方法と、該方法に含まれ得る、学習データセット作成方法、学習モデル生成方法及び骨折スコア出力方法とについて、一例を示すフローチャートである。
【
図2】各被験者の第1時点及び第2時点と、対象者の第1時点及び第2時点との時系列関係の一例を説明する図である。
【
図3】構造方程式モデリング(SEM)で共分散構造分析を行う場合に作成し得るパスモデルを示し、それぞれ、(a)は探索的因子分析モデルの例を示すパス図、(b)は確認的因子分析モデルのパスモデルの例を示すパス図、(c)は2つの探索的因子分析モデルを含む2次因子モデルのパスモデルの例を示すパス図である。
【
図4】実施形態1又は2に係る学習モデル生成方法で用い得るANNにおける構成の一例を示す模式図である。
【
図5】試験例1-1に係る学習モデルに基づいて応答曲面法により作成された、被験者らの経過観察期間内での新規骨折の有無に関する複数の三次元グラフのうちの、(a)は、X軸が初診時正規化血中Cr(クレアチニン)検査値を示し、Y軸が初診時正規化BAP(骨型アルカリフォスファターゼ)検査値を示す場合の三次元グラフの一例であり、(b)は、X軸が初診時正規化BMD計測値を示し、Y軸が初診時正規化身長を示す場合の三次元グラフの一例である。(a)及び(b)共に、Z軸は被験者らの骨折スコアを示し、このことは
図6(c)乃至
図6(f)でも同様である。
【
図6】(c)乃至(f)の各々は、
図5(a)及び
図5(b)と同様に作成された三次元グラフの他の例で、それぞれX軸及びY軸で示す臨床データの組み合わせが異なる。
【
図7】実施形態1又は実施形態2に係る、骨粗鬆症による骨折の推測・予測方法と、骨折スコア出力方法との各々について、他の例を示すフローチャートである。
【
図8】実施形態1に係る学習モデルを有する情報処理装置の一例の機能構成を示すブロック図である。
【
図9】実施形態2に係る骨粗鬆症による骨折の推測・予測方法と、該方法に含まれ得る、学習データセット作成方法、学習モデル生成方法及び骨折スコア出力方法とについて、一例を示すフローチャートである。
【
図10】実施形態2に係る学習モデルを有する情報処理装置の一例の機能構成を示すブロック図である。
【
図11】BLR(予測値)を出力可能な学習モデルを生成する機械学習で、ANNの構成を示す模式図である。詳細は特許文献1に記載された実施例1aを参照。
【
図12】試験例1-1でSEMにより平均共分散構造分析の演算を実行し、確定したパスモデルを示すパス図である。
図12、
図16、
図20、
図24、
図28及び
図31で各々、長方形は観測変数を、大きい楕円は潜在変数を、eは誤差変数を、矢印は因果関係が存在するパスを意味する。
【
図13】2020年1月末の検診時に「新規骨折あり」と判定された被験者らと「新規骨折なし」と判定された被験者らとで、試験例1-1に係る平均共分散構造分析で算出された骨折スコア(潜在変数の因子得点)を比較する箱ひげ図である。
図13、
図17、
図21及び
図25の各々で、破線はカットオフ値(骨折スコアの閾値)の高さを示し、四角(箱)は25%分位点から75%分位点までの範囲を示し、この四角(箱)から上下へ延びる線(ひげ)は10%分位点から90%分位点までの範囲を示す。
【
図14】試験例1-1の機械学習におけるANNの構成を示す模式図である。
【
図15】試験例1-1で、機械学習に用いた各受診者の骨折スコアと、学習モデルにより出力された各受診者の骨折スコアとの相関関係を示すグラフである。
図15、
図19、
図23、
図27、
図30及び
図33の各々で、縦軸は機械学習に用いた各被験者の骨折スコア(潜在変数の因子得点)を示し、横軸は学習モデルにより出力された各被験者の骨折スコアを示す。
【
図16】試験例1-2、試験例18、試験例20及び試験例21の各々で、SEMにより平均共分散構造分析の演算を実行し、確定したパスモデルを示すパス図である。
【
図17】初診時に「既存骨折あり」と判定された被験者らと「既存骨折なし」と判定された被験者らとで、試験例1-2に係る平均共分散構造分析で算出された骨折スコア(潜在変数の因子得点)を比較する箱ひげ図である。
【
図18】試験例1-2の機械学習におけるANNの構成を示す模式図である。
【
図19】試験例1-2で、機械学習に用いた各受診者の骨折スコアと、学習モデルにより出力された各受診者の骨折スコアとの相関関係を示すグラフである。
【
図20】試験例4-1でSEMにより平均共分散構造分析の演算を実行し、確定したパスモデルを示すパス図である。
【
図21】2020年1月末の検診時に「新規骨折あり」と判定された被験者らと「新規骨折なし」と判定された被験者らとで、試験例4-1に係る平均共分散構造分析で算出された骨折スコアを比較する箱ひげ図である。
【
図22】試験例4-1の機械学習におけるANNの構成を示す模式図である。
【
図23】試験例4-1で、機械学習に用いた各受診者の骨折スコアと、学習モデルにより出力された各受診者の骨折スコアとの相関関係を示すグラフである。
【
図24】試験例4-2及び試験例19の各々で、SEMにより平均共分散構造分析の演算を実行し、確定したパスモデルを示すパス図である。
【
図25】初診時に「既存骨折あり」と判定された被験者らと「既存骨折なし」と判定された被験者らとで、試験例4-2に係る平均共分散構造分析で算出された骨折スコアを比較する箱ひげ図である。
【
図26】試験例4-2の機械学習におけるANNの構成を示す模式図である。
【
図27】試験例4-2で、機械学習に用いた各受診者の骨折スコアと、学習モデルにより出力された各受診者の骨折スコアとの相関関係を示すグラフである。
【
図28】試験例5-1でSEMにより平均共分散構造分析の演算を実行し、確定したパスモデルを示すパス図である。
【
図29】試験例5-1の機械学習におけるANNの構成を示す模式図である。
【
図30】試験例5-1で、機械学習に用いた各受診者の骨折スコアと、学習モデルにより出力された各受診者の骨折スコアとの相関関係を示すグラフである。
【
図31】試験例5-2でSEMにより平均共分散構造分析の演算を実行し、確定したパスモデルを示すパス図である。
【
図32】試験例5-2の機械学習におけるANNの構成を示す模式図である。
【
図33】試験例5-2で、機械学習に用いた各受診者の骨折スコアと、学習モデルにより出力された各受診者の骨折スコアとの相関関係を示すグラフである。
【
図34】試験例24に係る学習モデルに基づいて応答曲面法により生成された、応答曲面を含む三次元グラフの一例である。
【
図35】試験例25に係る学習モデルに基づいて応答曲面法により生成された、応答曲面を含む三次元グラフの一例である。
【発明を実施するための形態】
【0026】
本明細書における「女性」は、生物学的な性別が女性であるヒトである。ヒトの健常な身体では、古い骨が破骨細胞に吸収される骨吸収と、新しい骨が骨芽細胞により作られ補充される骨形成と、による骨代謝回転(骨リモデリングともいう)が起こっている。また、女性ホルモンの一種であるエストロゲンは、主に卵巣から分泌され、骨吸収を抑制する作用がある。初経から閉経までの期間中の女性は、エストロゲンにより、骨吸収が抑制されて骨強度低下しにくい恩恵を受けているともいえる。閉経後女性では、卵巣のエストロゲン分泌機能が低下し、エストロゲン欠乏により骨吸収が亢進し、これに骨形成が追随しきれず、骨強度が低下するといわれている。一般的に、女性で妊娠や産後の無月経の期間を除き、月経が12ヵ月以上にわたり来ないと、閉経と判定される。この際、過去にふり返って最後の月経が来た時点を「閉経時」としている。一方、例えば子宮摘出された等の場合であっても、卵巣のエストロゲン分泌機能が維持されている状態では閉経とみなされない。このような場合、臨床上、血液検査により、エストロゲンの一種であるエストラジオールの血中濃度が20pg/mL以下、且つ、血中の卵胞刺激ホルモン(FSH)の活性値が40mIU/mL以上であるときに、卵巣機能低下(閉経)と判定される。本明細書における「閉経」は、自然閉経であるか又は人為的な閉経であるかを問わない。人為的な閉経として、例えば、卵巣摘出による外科的閉経又は薬物摂取による閉経等が挙げられるが、これらの例に限られない。
【0027】
本明細書における「骨折」は、骨粗鬆症による骨折であり、疼痛を伴う臨床骨折に限らず、疼痛を伴わない形態骨折(例えば疼痛を伴わない椎体の圧潰変形)も含まれる。本明細書における「既存骨折」は、閉経後のある任意の時点(以下「第1時点」ともいう)で既に発生していた骨折である。第1時点は、閉経後の時点であれば特に限定されないが、例えば、一般臨床の場合は骨粗鬆症診療での初診時若しくは初回エックス線像撮影を伴う診察時でもよく、又は、治験の場合は登録時若しくは薬剤投与開始時でもよい。本明細書における「新規骨折」は、第1時点より後に発生する骨折であり、第1時点では正常(骨折していない)と判定された骨が、第1時点より後のある任意の時点(以下「第2時点」ともいう)では新たに骨折と判定されるものである。後述する各被験者の第2時点は、本明細書に記載された各実施形態に係る方法の実施時点から見て過去の時点であり得るが、一方、後述する対象者の第2時点は、各実施形態に係る方法の実施時点から見て未来の時点であり得る。本明細書における「骨折数」は、骨折が生じた骨の数である。本明細書における「経過観察期間」は、第1時点を過ぎてから(第1時点の直後から)第2時点までの期間である。本明細書における「推測」は、骨折を推し量ることである。本明細書では、対象者で過去に生じた骨折(対象者の既存骨折)を推し量る場合に主に「推測」と記載しているが、字義としては、対象者で未来に生じる骨折(対象者の新規骨折)を推し量る場合も「推測」の一種と言える。本明細書における「予測」は、推測の一種であり、対象者については未来に生じる骨折(対象者の新規骨折)を推し量る場合を指す。本明細書における「推測・予測」は、推測及び予測のうちの少なくとも一方を意味する。「推測・予測」は、対象者で過去に生じた骨折(対象者の既存骨折)を推し量る場合には「推測」に限定されてもよく又は対象者で未来に生じる骨折(対象者の新規骨折)を推し量る場合には「予測」に限定されてもよい。
【0028】
本明細書には、臨床情報(臨床データを含む情報)や医師(医師から指示を受けた者を含む。以下同じ。)による判定結果を取得し使用する旨を記載している。臨床データや判定結果の生成過程で、医師が各被験者又は対象者に対して行う場合がある手術、治療又は診断を含む工程は、本発明に含まれない。本発明の各実施形態では、各被験者若しくは対象者について身体測定、問診、骨密度(BMD)計測若しくは画像診断等が行われて、既に生成された臨床データ若しくは判定結果を取得すればよい。本発明には、このようなデータ取得から、対象者の骨折スコア、推測・予測結果、又は、二次元グラフ若しくは三次元グラフを含む資料が生成され示されるまでの過程が含まれ得る。その後、対象者の骨折スコア、推測・予測結果又は資料を参考にして、医師が対象者に対して行い得る手術、治療又は診断を含む過程は、本発明に含まれない。以下、本発明に係る実施形態の例を、図面を参照して幾つか説明する。以下に説明する図面の記載では、同一又は類似の部分に同一又は類似の符号を付している。
【0029】
<実施形態1>
図1に示すように、実施形態1に係る骨粗鬆症による骨折の推測・予測方法S10aは、学習データセット作成方法S30aと、学習モデル生成方法S20aと、骨折スコア出力方法S15aとを含み得る。学習データセット作成方法S30aは、各被験者の臨床情報及び判定結果取得ステップS31aと、各被験者の臨床情報正規化ステップS32と、各被験者の骨折スコア算出ステップS33aとを含み得る。
【0030】
学習データセット作成方法S30aでは、骨折スコアを出力可能な学習モデルの生成に適した学習データセットを作成するために、複数名の閉経後女性を被験者らとする。各被験者は、第1時点での既存骨折の有無、第1時点での既存骨折の骨折数、経過観察期間内での新規骨折の有無、及び、経過観察期間内での新規骨折の骨折数から選ばれた1種以上を、既に判定された閉経後女性である。各被験者は、好ましくは、第1時点での既存骨折の有無と経過観察期間内での新規骨折の有無とを既に判定された閉経後女性であるか、又は、第1時点での既存骨折の骨折数と経過観察期間内での新規骨折の骨折数とを既に判定された閉経後女性である。医療機関の骨粗鬆症外来を閉経後に2回以上受診した女性を被験者とする場合には、閉経後の初回受診時を第1時点とし、初回受診時より後に受診した時点(2回目以降の任意の受診時)を第2時点としてもよい。被験者どうしで第1時点が同じ日で、その後の第2時点も被験者どうしで同じ日でもよいが、
図2に例示するように、被験者Aでの第1時点は2006年1月で第2時点は2012年1月であり、被験者Bでの第1時点は2014年1月で第2時点は2020年1月である等、被験者どうしで第1時点及び第2時点の各々が異なる日でもよい。閉経時から第1時点までの期間の長さや、経過観察期間の長さが、被験者ごとに異なってもよく又は同じでもよい。各被験者の経過観察期間の長さは、推測・予測精度向上の観点では例えば1年以上、2年以上又は3年以上でもよく、好ましくは5年以上、更に好ましくは10年以上であり、必要以上の長期化を避ける観点では例えば25年以下又は20年以下、好ましくは15年以下である。被験者らの人数は、推測・予測精度向上の観点では例えば30名以上又は50名以上でもよく、好ましくは100名以上であり、100名を超えて人数が多いほど更に好ましい。
【0031】
閉経の要因ごとに特化して骨折を推測・予測する場合、各被験者を、自然閉経した女性に限定してもよく又は人為的に閉経した女性に限定してもよい。なお、早期閉経は、骨粗鬆症により骨強度低下し骨折するリスクを高める危険因子である。例えば卵巣摘出等により人為的に早期閉経した女性では、骨粗鬆症による骨折リスクが高くなりやすい。骨粗鬆症による骨折の早期予防・治療を図る診断を支援する観点では、人為的に閉経した女性での骨折を推測可能又は予測可能とすることに、大きな意義がある。様々な閉経後女性で幅広く骨折を推測可能又は予測可能とする観点では、閉経の要因で被験者を限定しないことが望ましい。各被験者の第1時点での年齢は、閉経後であれば本発明の目的に反しない限り特に限定されない。例えば、早期閉経した女性に特化して骨折を推測・予測する場合には、各被験者の第1時点での年齢が40歳未満でもよい。各被験者の第1時点での年齢は、例えば40歳以上75歳未満でもよく、閉経後のBMD減少に個人差が大きい年代での骨折の推測・予測精度向上を図る観点では、45歳以上70歳未満でもよく又は50歳以上65歳未満でもよい。FRAXでの予測精度が低い年代の女性に特化して骨折を推測・予測する場合、各被験者の第1時点での年齢が75歳以上90歳未満でもよい。様々な閉経後女性で推測・予測精度を高める観点では、被験者らには、幅広い年代の閉経後女性が含まれることが好ましい。
【0032】
図1及び
図2に示す、各被験者の臨床情報及び判定結果取得ステップS31aでは、前述した学習データセットを作成するために、各被験者の臨床情報を取得する。該臨床情報は、各被験者についての、第1時点での年齢、第1時点での身長、第1時点での体重、第1時点でのBMI、第1時点でのBMD、第1時点での骨代謝マーカー検査値、第1時点での腎機能マーカー検査値、第1時点での骨格筋量マーカー検査値、第1時点で既存の身長低下、初経年齢、閉経年齢、閉経時から第1時点までの年数、経過観察期間の長さ、第1時点での11種又は12種の骨折危険因子に基づくFRAX(登録商標)による骨折リスク評価結果(以下「FRAX結果」ともいう)、第1時点でのBMD及び他の臨床データに基づく第2時点のBMD予測値(以下、略して「BMD予測値」ともいう)、第1時点でのBMD及び他の臨床データに基づく経過観察期間内の骨量減少率(BLR)予測値(以下、略して「BLR予測値」ともいう)、及び、これらのいずれかを間接的に示すデータから選ばれた4種以上の臨床データを含む。推測・予測精度向上の観点では、各被験者の臨床情報は、ここで幾つか例示した臨床データのうち、例えば5種以上又は6種以上を含んでもよく、好ましくは7種以上又は8種以上を含み、臨床応用しやすい高精度な推測・予測をしやすい観点では9種以上を含むのが更に好ましく、9種を超えてデータ項目数が増えると更により好ましい。
【0033】
臨床データの例として挙げた「間接的に示すデータ」は、当業者であれば目的とする臨床データの値を概ね推定可能な他のデータ、又は、何らかの変換を行えば目的とする臨床データの値を概算可能な他のデータである。例えば、ある被験者の年齢を月齢(例えば600月齢)で表した場合、月齢の数値を12で割り算する変換(例えば600/12=50)をすれば、目的とする年齢の値(例えば50歳)を概算可能であり、月齢は年齢を間接的に示すデータに該当する。このように、目的とするデータ(例えば年齢)の数値と相関する他の数値データ(例えば月齢)は、目的とするデータを間接的に示すデータの一種といえる。
【0034】
各被験者の臨床情報に含まれる4種以上の臨床データは、第1時点にある被験者に関する臨床データであればよい。該臨床データは、被験者ごとの第1時点で生成された臨床データに限らず、第1時点にある被験者に関する臨床データであれば、第1時点よりも後に生成された臨床データも含まれる。例えば、医療機関では、被験者ごとに第1時点で採取した血液の検査を外注する場合に、外注先から検査結果を得るのに数日待つことになるが、このように第1時点から数日後に得られる検査結果でも第1時点にある被験者に関する臨床データといえる。また、第1時点での年齢は、第1時点よりも後の時点(例えば第2時点)でも、各被験者に問診で「以前の初診時(第1時点)での年齢」を質問する等すれば、被験者の記憶に基づいて生成可能である。例えば、「第2時点での年齢」から「経過観察期間の長さ」を引き算すれば、「第1時点での年齢」を算出可能であり、「第2時点での年齢」と「経過観察期間の長さ」との組み合わせは「第1時点での年齢」を間接的に示すデータに該当する。第1時点での身長と体重との各々は、例えば第1時点で被験者の身体計測を行う等すれば、生成し取得可能なデータである。第1時点でのBMIは、第1時点での身長及び体重から算出可能なデータである。第1時点での身長と体重とが明らかであれば、第1時点の後にBMIを算出してもよい。身長と体重とBMIとの三者は、このうちの二者のデータがあれば残る一者のデータを算出可能であり、この三者のうち二者のデータの組み合わせは残る一者を間接的に示すデータに該当する。
【0035】
第1時点でのBMDは、骨粗鬆症医療の現場で計測可能な方法による計測値であればよい。例えば、超音波骨密度測定法(QUS)、定量的CT測定法(QCT)、MD(Microdensitometry)法、又は、二重エネルギーX線吸収測定法(dual-energy X-ray absorptiometry:以下「DXA」ともいう)等の方法によるBMD計測値が挙げられる。放射線被曝を避ける観点では、QUSによるBMD計測値が好ましい。BMD計測の標準方法と重視されており、計測時間が短く、誤差や放射線被爆量が少ない観点では、DXAによるBMD計測値が好ましい。DXAは、骨に2種類のX線を照射し、骨を他の組織と区別してBMD(g/cm2)を計測する方法である。BMD計測値の単位は、g/cm2又はg/cm3でもよいが、若年成人比較%(percent of Young Adult Mean:以下「%YAM」ともいう)でもよい。%YAMは、若年齢のBMD平均値(基準値)を100%として比較したBMDの高さを示す単位であり、骨粗鬆症診断基準で用いられている。この診断基準では、BMDが70%YAM以下である場合、骨粗鬆症と診断される。
【0036】
BMDを計測する身体部位は、本発明の目的に反しない限り特に限定されず、骨折を推測・予測する価値があるという観点では、一般的に骨粗鬆症による骨折が生じるリスクが比較的に高い部位でもよい。例えば、上腕骨、橈骨、肋骨、頚椎、胸椎、腰椎、骨盤、大腿骨、下腿骨及び中足骨からなる群より選ばれた1箇所以上の身体部位に含まれる、少なくとも一部の領域が挙げられる。骨盤には、仙骨、座骨及び恥骨が含まれる。下腿骨には脛骨や腓骨が含まれる。同様の観点から、BMDを計測する身体部位は、上腕骨近位部、橈骨遠位部、頚椎、胸椎、腰椎及び大腿骨近位部からなる群より選ばれた1箇所以上の身体部位に含まれる、少なくとも一部の領域が好ましい。同様の観点に加えて、骨折するとQOL及びADLの著しい低下を伴う部位について骨粗鬆症の早期予防・治療を図る観点から、BMDを計測する部位は、頚椎、胸椎、腰椎及び大腿骨近位部からなる群より選ばれた1箇所以上の身体部位に含まれる、少なくとも一部の領域が好ましい。ここでの「一部の領域」は、大腿骨では例えば大腿骨近位部等の領域が挙げられ、大腿骨近位部では例えば、大腿骨頸部、転子部又はward三角等の領域が挙げられる。
【0037】
骨代謝マーカーとして例えば、骨形成マーカー、骨吸収マーカー又は骨質マーカー等が挙げられる。骨代謝マーカー検査値は、例えば、骨粗鬆症に関する学術論文(いわゆるエビデンス)でBMD低下又は骨折リスクの予測因子として活用できる可能性が論じられた1種以上の骨代謝マーカーの計測値でもよく、臨床応用しやすい観点では、骨粗鬆症医療の現場で活用されている1種以上の骨代謝マーカーの計測値が好ましい。骨代謝マーカーとして、骨形成マーカーでは例えばオステオカルシン(OC)又はI型プロコラーゲン-N-プロペプチド(PINP)等が挙げられ、骨形成マーカーでは例えばI型コラーゲン架橋N-テロペプチド(NTX)又は骨型酒石酸抵抗性酸性フォスファターゼ5b(TRACP-5b)等が挙げられ、骨質マーカーでは例えば低カルボキシル化オステオカルシン(ucOC)等が挙げられるが、これらの例に限られない。例えば、骨型アルカリフォスファターゼ(bone specific alkaline phosphatase:以下「BAP」ともいう)は、骨形成と骨吸収との両方の指標を兼ねており、骨代謝回転マーカーの一種ともいえる。骨粗鬆症医療の現場で活用されており、BMD減少と有意な関連性がある観点から、骨代謝マーカー検査値として更に好ましくは、BAP計測値である。一般的に骨代謝マーカーは、血液検査により血中又は血清中での濃度又は活性値を測定される場合があり、又は、尿検査により尿中での濃度又は活性値を測定される場合がある。
【0038】
腎臓では、腸内からカルシウム吸収を促進する活性型ビタミンDが生成される。このため、腎機能には、骨強度や骨折リスクとの関連性が認められる。腎機能マーカー検査値は、従来、日常診療の現場で腎機能評価に使用されている計測値でもよく、例えば、血中のクレアチニン(creatinine:以下「Cr」ともいう)濃度、推算糸球体濾過量(eGFR)、血中シスタチンC濃度又は血中尿素窒素(BUN)濃度等の計測値が挙げられる。骨格筋量の影響を除外したい場合、腎機能マーカーとしてシスタチンCが好ましい。また、中高年日本人女性では、骨格筋量とBMDとに関連性があることが知られている。フレイル高齢者では筋肉量低下するほど転倒し骨折するリスクが高まると考えられ、骨格筋量マーカー検査値の減少と、骨粗鬆症による骨折リスクとの間には、関連性があると考えられる。骨格筋量マーカー検査値は、従来、骨格筋量の評価に使用されているマーカーの計測値でもよく、例えば、血中Cr濃度、血中Cr/シスタチンC比(CCR)、血中クレアチンキナーゼ(CPK)活性又は血中アルドラーゼ(ALD)活性等の計測値が挙げられる。従来、日常診療の現場で活用され、腎機能と骨格筋量とを兼ねた評価指標である観点では、腎機能マーカー検査値及び骨格筋量マーカー検査値として好ましくは、血中Cr濃度又は血清中Cr濃度の計測値である。
【0039】
骨粗鬆症患者は、背骨の椎体の圧潰変形(椎体の骨粗鬆症による骨折の一種)により身長低下し得る。第1時点で既存の身長低下は、若年時(例えば25歳頃)の最大身長と、閉経後の第1時点に計測した身長とを比べて、低下した身長量に関する数値データでもよい。または、例えば、身長低下量の数値データを所定の閾値(例えば4.0cm)と比較した結果に基づき、この数値データが閾値以上である場合に「身長低下あり」と判定し、閾値未満である場合に「身長低下なし」と判定した結果でもよい。身長低下データは、例えば問診と身体計測との組み合わせにより生成可能である。ただし、各被験者が記憶に基づいて「若年時の最大身長」を自己申告する場合、最大身長に関する記憶が曖昧であると生成される身長低下データが不正確になりやすい難点がある。あるいは、閉経後女性で高度な脊柱変形が認められる場合、椎体でBMD低下していることが知られている。このため、第1時点での脊柱変形について、被験者ごとに医師が一定基準に基づき「第1時点で脊柱変形あり」又は「第1時点で脊柱変形なし」と判定した結果を、「第1時点での身長低下」を間接的に示す臨床データとして取得してもよい(非特許文献1参照)。
【0040】
対象者の経過観察期間内での新規骨折の有無及び新規骨折の骨折数の少なくとも一方を予測する場合には、頚椎、胸椎及び腰椎の少なくとも1つの身体部位における第1時点での既存骨折の有無や骨折数について、各被験者で例えばX線撮影又はMRI等により画像診断し、一定基準に基づき「第1時点で既存骨折あり」又は「第1時点で既存骨折なし」と判定した結果を、「第1時点の身長低下」を間接的に示す臨床データとして取得してもよい。ここでの画像診断は、医師による既存骨折の有無又は骨折数の判定であるのが好ましい。または、ここでの画像診断では、X線若しくはMRI等による骨の画像を含む更に他の臨床情報と、医師による骨折判定結果との関係を機械学習した、骨折判定結果を出力可能な学習モデルを予め準備し、該学習モデルに各被験者の骨の画像データを含む更に他の臨床情報を入力し、この学習モデルにより骨折判定結果を出力させてもよい。一方、対象者の第1時点での既存骨折の有無又は既存骨折の骨折数を推測する場合には、各被験者の第1時点での既存骨折の有無又は骨折数を判定した結果は、各被験者の臨床情報に含める臨床データとして取得すべきではなく、後述する骨折判定結果に該当するデータとして取得するのがよい。
【0041】
初経年齢と、閉経年齢と、閉経時から第1時点までの年数とは、それぞれ、例えば問診等により生成可能な臨床データである。これらのデータは、前述した年齢と同様に各被験者の記憶に基づき生成し得るデータであり、第1時点に限らず、第1時点の後でも生成可能である。「閉経年齢」と「閉経時から第1時点までの経過年数」との和は、第1時点での年齢に等しいため、「閉経年齢」と「閉経時から第1時点までの年数」との組み合わせは、第1時点での年齢を間接的に示すデータに該当する。同様の理由から、「初経年齢」と「初経から閉経までの期間の長さ」との組み合わせは、閉経年齢を間接的に示すデータに該当する。同様に「初経から閉経までの期間の長さ」と「閉経年齢」との組み合わせは、初経年齢を間接的に示すデータに該当する。初経から閉経までの期間の長さは、女性が卵巣由来のエストロゲンにより骨吸収を抑えられていた期間の長さに関連する。
【0042】
「経過観察期間の長さ」の臨床データは、この長さが各被験者で同じである場合、データ取得しなくてもよい。または、この期間の長さが各被験者で異なる場合、推測・予測精度向上の観点から、「経過観察期間の長さ」をデータ取得するのが好ましい。「第1時点での年齢」と「第2時点での年齢」との組み合わせは、後者の年齢から前者の年齢を引き算することにより、「経過観察期間の長さ」を間接的に示すデータに該当する。
【0043】
前記FRAX結果は、例えば、被験者ごとに第1時点で身体計測、問診及びBMD計測を行い、少なくとも11種の骨折危険因子(第1時点での年齢、性別、第1時点での体重、第1時点での身長、両親の大腿骨近位部骨折歴の有無、第1時点よりも前に生じた骨折既往の有無、第1時点での喫煙の有無、糖質コルチコイドの経口投与の有無、関節リウマチの確定診断の有無、続発性骨粗鬆症との間で強い関連性がある疾患(例えばI型糖尿病又は甲状腺機能亢進症等)の有無、及び、1日3単位(1単位:エタノール8~10g)以上のアルコール摂取の有無)データを取得し、インターネットで非特許文献3に係るウェブサイトにアクセスして11種の骨折危険因子データを入力すれば、非特許文献2に基づく骨折確率算定モデルにより算出される、10年間の骨折発生確率を示すデータである。この11種の骨折危険因子データだけでなく、第1時点での大腿骨近位部BMD計測値データも取得して入力し(つまり合計12種の骨折危険因子データを入力し)、前記FRAX結果の臨床データを算出してもよい。FRAXに入力するこれらの骨折危険因子データが、各被験者の第1時点に関するデータであれば、第1時点の後にFRAXに入力して前記FRAX結果を算出してもよい。大腿骨近位部骨折の推測・予測に特化した学習モデルを生成しようとする場合には、前記FRAX結果として、大腿骨近位部骨折の10年間の発生確率を示すデータを採用するのが好ましい。または、大腿骨近位部以外の身体部位での骨折について骨折スコアを出力可能な学習モデルを生成しようとする場合には、前記FRAX結果として、主要骨粗鬆症性骨折の10年間の発生確率を示すデータを採用するのが好ましい。あるいは、大腿骨近位部骨折の発生確率を示すデータと、主要骨粗鬆症性骨折の発生確率を示すデータとの両方を、前記FRAX結果として採用してもよい。50歳前後と比べて高齢になるほど前記FRAX結果の予測精度は低下し、臨床上で一般的に75歳以上の女性での前記FRAX結果に基づく診断が禁じられている観点では、例えば75歳以上、70歳以上、65歳以上又は60歳以上の被験者については、前記FRAX結果を欠損値としてもよい。
【0044】
経過観察期間内の骨量減少率(BLR)は、各被験者の第1時点と第2時点とでそれぞれBMDを計測し、例えば次の数式1により算出可能な骨量データである。次の数式1でBLRの単位として(%YAM/年)を例示しているが、この単位に限定されない。第1時点における臨床情報に含まれ得る、前記BMD予測値(第1時点のBMD及び他の臨床データに基づく第2時点のBMD予測値)と、前記BLR予測値(第1時点のBMD及び他の臨床データに基づく第1時点から第2時点までの期間内のBLR予測値)とは、それぞれ、第1時点で取得可能なBMD計測値や他の臨床情報のデータを、前述したBLR予測値を出力可能な学習モデルに入力すると、該学習モデルにより出力される臨床データであり、詳細は後述する。各被験者の「第2時点のBMD計測値」は、前記BMD予測値を間接的に示すデータに該当する。ただし、臨床データの項目としては、第2時点のBMD計測値よりも、前記BMD予測値の方が、骨折スコアを出力可能な学習モデルとして、統計上の信頼性が高いモデルを生成しやすく好ましい。同じ理由により、各被験者の経過観察期間内のBLRは、前記BLR予測値を間接的に示すデータに概要するが、臨床データの項目としては、経過観察期間内のBLRよりも、前記BLR予測値の方が好ましい。
【0045】
【0046】
各被験者の臨床情報には、前述した4種以上の臨床データに該当しない1種以上のデータでも、第1時点の各被験者に関する臨床データであり、骨粗鬆症による骨折との間で直接的又は間接的な因果関係を有するデータであれば、推測・予測精度向上に貢献し得る観点から、4種以上の臨床データとは別に、その他のデータとして各被験者の臨床情報に含める形で取得してもよい。
【0047】
図1及び
図2に示す各被験者の臨床情報及び判定結果取得ステップS31aでは、各被験者について、第1時点での既存骨折の有無、第1時点での既存骨折の骨折数、経過観察期間内での新規骨折の有無、及び、経過観察期間内での新規骨折の骨折数から選ばれた1種以上に関する判定結果(以下「骨折判定結果」ともいう)のデータも取得する。ここでの「骨折の有無」は、「骨折あり」又は「骨折なし」のいずれかの判定結果である。また、ここでの骨折数は、骨折があると判定された骨の数である。骨粗鬆症による骨折を推測・予測しようとする身体部位を特に限定しない場合には、例えば、第1時点での腰椎の既存骨折が1つ、経過観察期間内での胸椎の新規骨折が1つ及び大腿骨近位部の新規骨折が1つと判定されたときに、骨折判定結果としては「既存骨折の骨折数1つ、新規骨折の骨折数2つ」となる。このように、第1時点で既存骨折と判定された骨折は、その後の経過観察期間内での新規骨折には該当しない。骨折判定結果は、医師の画像診断による判定結果であるのが好ましい。または、骨折判定結果は、前述した骨折判定結果を出力可能な学習モデルを予め準備し、該学習モデルに各被験者の骨の画像データを含む更に他の臨床情報を入力し、この学習モデルにより出力された骨折判定結果でもよい。
【0048】
骨折判定結果は、骨粗鬆症による骨折を推測・予測しようとする身体部位について、第1時点で、又は、第1時点及び第2時点の各々で、エックス線撮影又はMRI等により各被験者から得られた骨の画像により、骨粗鬆症による骨折の有無及び骨折数の少なくとも一方を、医師が一定基準に従って画像診断し判定した結果であることが好ましい。通常、医師は、第1時点及び第2時点の各々でX線撮影又はMRI等による骨の画像を観察し判定する。または、第1時点及び第2時点の各々での骨の画像に基づき、後日に医師が判定する若しくは上記した学習モデルに骨折判定結果を出力させてもよい。医師の判定基準は、各被験者で概ね一定の基準に従っていればよい。一例を挙げると、椎体(頚椎、胸椎又は腰椎)骨折を判定する場合には、例えば、椎体変形の半定量法(SQ)評価法(非特許文献1参照)により、骨折が疑われる椎体について隣接椎体と比較した椎体高(前縁高、中央高若しくは後縁高)又は減少率を、所定の閾値と比較した結果に基づき「骨折あり」又は「骨折なし」と判定する基準でもよい。この例に限らず、例えば骨粗鬆症に関する学術論文(いわゆるエビデンス)又は日本骨粗鬆症学会が発行する骨粗鬆症医療に関するガイドライン(例えば非特許文献1)に記載される、一定水準を満たす判定基準であればよい。骨折判定結果は、身体の特定部位に限定せず、脆弱性骨折を生じ得る部位全般で、骨折の有無及び骨折数の少なくとも一方を判定した結果でもよい。または、身体の限られた部位での骨折の推測・予測に特化した学習モデルを生成しようとする場合、その部位に限定して骨折の有無及び骨折数の少なくとも一方を判定した結果でもよい。例えば、推測・予測の対象を腰椎の骨折に限定した場合でも、腰椎は5つの椎体(L1乃至L5)を含み、骨折数の判定結果は0乃至5のいずれかの数となる。骨折数の判定結果では、例えば、骨折数が「0」、骨折数が「1」(重症骨粗鬆症と判断)、骨折数が「2以上」(超重症骨粗鬆症と判断)というように、骨折数が所定数以上である場合に「所定数以上」に分類されてもよい。既に述べたように、医師が骨折の有無を判定する診断の工程は、本発明に含まれない。ステップS31aでは、医師の診断により既に生成された骨折判定結果を取得してもよく、又は、前述した学習モデルにより出力された骨折判定結果を取得してもよい。
【0049】
図1に示す各被験者の臨床情報正規化ステップS32では、後に共分散構造分析や機械学習を効率良く行う観点から、各被験者の臨床情報に含まれる4種以上の臨床データと、各被験者の骨折判定結果とを、それぞれ情報処理装置で演算しやすいように正規化してもよい。正規化は、データを一定の規則に基づいて利用しやすいように変形する処理である。正規化後データは、正規化前データを概ね再現可能であるため、正規化前データを間接的に示すデータに該当する。例えば、「第1時点で身長低下あり」又は「第1時点で身長低下なし」等の数値ではないデータは、「身長低下あり」を1.0に変換し、「身長低下なし」を0に変換する等して正規化してもよい。例えば、年齢などの数値データは、次の数式2により0以上1.0以下の範囲内に含まれるように正規化してもよい。
【0050】
【0051】
機械学習では入力変数に0又は1.0の近似値が含まれていなければ演算しやすい観点から、各被験者の臨床情報に含まれる4種以上の臨床データ各々を0.10以上0.90以下の範囲内に含まれるように正規化してもよい。例えば「身長低下あり」又は「身長低下なし」等の数値でないデータは、「身長低下あり」を0.90に変換し、「身長低下なし」を0.10に変換する等して正規化するのが好ましい。同様の観点から、臨床情報に含まれ得る例えば「第1時点での年齢」等の数値データは、次の数式3により0.10以上0.90以下の範囲内に含まれるように正規化するのが好ましい。
【0052】
【0053】
各被験者の骨折判定結果は、後の共分散構造分析で観測変数の一種として用いられるが、更に後の機械学習で特に用いられない。このため、骨折の有無に関する骨折判定結果は例えば、「骨折あり」及び「骨折なし」のいずれか一方を0に変換し、残る他方を1.0に変換するように正規化するのが好ましい。身体の部位別に骨折の有無に関する骨折判定結果を取得した場合、部位別に「骨折あり」又は「骨折なし」の判定結果に応じて、部位別に0又は1.0に正規化するのが好ましい。一方、骨折数に関する骨折判定結果は、数であり、正規化が必須でない。
【0054】
推測・予測精度向上の観点では、骨折数に関する骨折判定結果は、例えば、骨折数が任意の数未満(例えば骨折数2未満)である場合に0に変換し、骨折数が任意の数以上(例えば骨折数2以上)である場合に1.0に変換するのが好ましい。同様の観点から、複数セットの正規化した骨折判定結果を含む、データセットを作成してもよい。例えば、骨折判定結果が「骨折数0」、「骨折数1」又は「骨折数2以上」のいずれかに分類されるように判定した結果である場合は、「骨折数0」を0へと変換し且つ「骨折数1」及び「骨折数2以上」を1.0へと変換したセットAと、「骨折数0」及び「骨折数1」を0へと変換し且つ「骨折数2以上」を1.0へと変換したセットBと、が生成されるように骨折数に関する骨折判定結果を正規化してもよい
【0055】
各被験者の臨床情報に含まれる4種以上の臨床データと、各被験者の骨折判定結果とについて、先のステップS31aで正規化後データを取得できる場合、ステップS32を省略可能である。例えば、ステップS31aでデータ取得時に、骨折判定結果が既に0又は1.0で記録されている場合、このデータを更に正規化することは特に要しない。
【0056】
共分散構造分析は、複数の変数(複数種のデータ)間の関係を検討可能な統計分析手法の一つである。各被験者の骨折スコア算出ステップS33aでは、情報処理装置を用いて共分散構造分析を行い、骨折スコアを算出する。このためには、各被験者について5種以上の観測変数を設ける。観測変数とは、実際に観測(計測)されたデータ又はその正規化後データである。5種以上の観測変数の内訳は、各被験者の第1時点における臨床情報に含まれる4種以上の臨床データと、各被験者の骨折判定結果との組み合わせである。共分散構造分析で各観測変数として用いるデータは、数値データであればよく、必ずしも0以上1.0以下の範囲内にある数値データでなくてもよい。共分散構造分析を行う際、各被験者の骨折判定結果に係る観測変数に対して、直接的な因果関係を有すると仮定される潜在変数を設ける(潜在変数から骨折判定結果の観測変数へ直接パスを設ける)。潜在変数とは、実際には観測(計測)されていない仮説的なデータである。5種以上の観測変数と、潜在変数とを設けた上で、情報処理装置に共分散構造分析を行うよう演算処理を実行させる。それにより、情報処理装置に、骨折判定結果に係る観測変数に対して、直接的な統計学的に有意な因果関係が認められた潜在変数について、因子得点のデータを算出させる。ここでの有意とは、潜在変数から骨折判定結果に係る観測変数への直接パスについて、標準化直接効果を検証した場合に、例えばp<0.05、好ましくはp<0.001の値が得られることである。算出された因子得点の数値データそのもの又は該数値データを再現可能な範囲内で正規化させたデータを、各被験者の骨折スコアとする。ここで算出される潜在変数の因子得点は、「サンプルスコア」ともいわれる(特許文献2参照)。
【0057】
共分散構造分析に用いる情報処理装置は、共分散構造分析の演算処理が可能であれば特に限定されない。例えば、市販のパーソナルコンピュータで、AMOS(Analysis of Moment Structure)、SAS(Statistical Analysis System)、LISREL(Linear Structure Relations)、又はEQS(Structural Equation Modeling Software)等の統計解析ソフトウェアを用いて共分散構造分析を行うことができる。推測・予測精度向上の観点から、各被験者の骨折スコア算出ステップS33aでは、平均共分散構造分析を行うのが好ましい。平均共分散構造分析は、ある変数の平均値と他の変数の平均値との差である切片を変数間の関係に導入し、推定すべきパス係数や分散にこの切片を含める共分散構造分析である。平均共分散構造分析では、ある被験者について観測変数として用いる臨床データに欠損値が含まれている場合、該欠損値の代わりに、他に観測変数として用いる臨床データどうしの関係から算出された数値が補われる。このため、平均共分散構造分析では、欠損値が含まれていても演算処理を実行可能という観点からも好ましい。パスモデルを用いて直感的に統計解析を行うことが可能な観点では、構造方程式モデリング(Structural Equation Modeling:以下「SEM」ともいう)により共分散構造分析を行うのが好ましく、SEMにより平均共分散構造分析を行うのが更に好ましい。例えばAMOSでは、SEMにより平均共分散構造分析を行うことができる。
【0058】
SEMのパスモデルとして例えば、
図3(a)示すように複数の観測変数に対して1つの潜在変数が直接的な因果関係を有する探索的因子分析モデル、
図3(b)に示すように各観測変数に対して2つ以上の潜在変数が直接的な因果関係を有し且つ潜在変数間に相関関係を有する確認的因子分析モデル、
図3(c)に示すように探索的因子分析モデルを複数含んで成る二次因子モデル、又はこれらのモデルで少なくとも一部の観測変数どうしの間に有意と認められる因果関係が規定されるように変形させたモデル等が挙げられる。パスモデルにおいて、単方向矢印は因果関係を表し、矢印の元にある変数が矢印の先にある変数に対して影響を及ぼすことを仮定する。
図3(a)乃至
図3(c)で記載省略しているが、パスモデルにおける単方向矢印にはいずれもパス係数が与えられ、潜在変数から各観測変数へ単方向矢印に与えられるパス係数はいずれも意味のあるもの(統計学的に有意なもの)と仮定する。パスモデルにおいて双方向矢印は、相関関係を表す。
図3(a)乃至
図3(c)で省略しているが、パスモデルにおける双方向矢印にはいずれも相関係数が与えられ、各相関関係の大小を判別可能である。識別問題(パスモデルにより定まる観測変数と潜在変数との関係を規定する関係式が数学的な解を有するか否かの問題)を解きやすい観点では、パスモデルは、
図3(a)に例示する探索的因子分析モデル、又は、このモデルで一部の観測変数どうしの間に因果関係若しくは相関関係の存在が仮定されるように変形させたモデルが好ましい。
【0059】
共分散構造分析における計算結果の妥当性や、パスモデルがデータに適合しているか否かを評価するには、例えば、カイ二乗(以下「χ2」という。)統計量、残差平方平均平方根(Root Mean square Residual:以下「RMR」という。)、適合度指標(Goodness of Fit Index:以下「GFI」という。)、修正適合度指標(Adjusted Goodness of Fit Index:AGFI)、赤池情報量基準(Akaike's Information Criterion:以下「AIC」という。)又はRoot Mean Square Error of Approximation(以下「RMSEA」という。)等の指標を用いてもよい。一般的に例えば、χ2統計量から「パスモデルがデータに適合している」との仮説が棄却されない、GFI値やAGFI値が所定の閾値(例えば0.9)以上である、又はRMSEA値が所定の閾値(例えば0.080)未満である等の条件を数多く満たすほど、共分散構造分析の計算結果やパスモデルの信頼性が高い。パスモデルに含まれるパス係数の信頼性を評価するには、例えばt検定又はワルド検定等を行えばよい。例えばAMOSを用いてSEMにより共分散構造分析を行う場合、ここで例示した指標や方法により、共分散構造分析の計算結果やパスモデルについて信頼性を検討でき、前述した標準化直接効果も検証可能である。作成したパスモデルは、そのRMSEA値が例えば0.080未満である場合、好ましくは0.050未満である場合、信頼できる統計モデルとして共分散構造分析に用いるのがよい。RMSEA値が0.080以上である場合、そのままではパスモデルを信頼できないため、RMSEA値が0.080未満になるように、例えば観測変数として用いる4種以上の臨床データの組み合わせを再考してパスモデルを修正してもよい。同様の観点から、パスモデルのRMSEA値が0.080以上になる4種以上の臨床データの組み合わせは、後の機械学習で4種以上の入力変数の組み合わせとして用いないのが好ましい。
【0060】
各被験者の骨折判定結果が骨折数に関するもので複数セットある場合には、1セットの骨折判定結果ごとに1種の観測変数とし、この1種の観測変数ごとに、該観測変数に対して直接的な因果関係を有すると仮定される潜在変数を1つ設けて、共分散構造分析により各潜在変数の因子得点を算出することが好ましい。演算処理を効率よく実行させる観点では、パスモデルごとに設ける、骨折判定結果に係る観測変数と、潜在変数とは、それぞれ1種に留めることが好ましい。例えば、骨折判定結果が、「骨折数0」を0へと変換し且つ「骨折数1」及び「骨折数2以上」を1.0へと変換したセットAと、「骨折数0」及び「骨折数1」を0へと変換し且つ「骨折数2以上」を1.0へと変換したセットBと、を含むように正規化されている場合には、骨折判定結果に係る観測変数としてセットAのみを使用し共分散構造分析を行って潜在変数の因子得点Aを算出させ、これとは別に、骨折判定結果に係る観測変数としてセットBのみを使用し共分散構造分析を行って潜在変数の因子得点Bを算出させることが好ましい。このようにして算出された潜在変数の因子得点Aは「骨折数0及び骨折数1のいずれか」又は「骨折数2以上」という分類を反映した数値になっており、潜在変数の因子得点Bは「骨折数0」又は「骨折数1及び2以上のいずれか」という分類を反映した数値になっている。
【0061】
以上に説明した学習データセット作成方法S30aでは、第1時点での各被験者について、4種以上の臨床データを含む臨床情報と、共分散構造分析により算出される潜在変数の因子得点に関するデータである各被験者の骨折スコアと、を含む学習データセットを作成可能である。さらに、以下に説明する学習モデル生成方法S20aでは、骨折学習ステップS34aと、骨折学習後選別ステップS35とを含み得る。
【0062】
骨折学習ステップS34aでは、各被験者の臨床情報に含まれる4種以上の臨床データを入力変数(独立変数)とし、上述した各被験者の骨折スコア算出ステップS33aで得られた各被験者の骨折スコア(潜在変数の因子得点に関するデータ)を出力変数(従属変数)とし、入力変数と出力変数との関係をANN(人工ニューラルネットワーク)に機械学習させる。ANNは、ヒト脳での神経学的処理を模した計算技術に基づく情報処理システムで、入力変数と出力変数とが存在するシステムのモデル化に用いられている。ステップS34aで使用可能なANNとして、例えばパーセプトロンが層状につなぎ合わされた多層パーセプトロンが挙げられる。多層パーセプトロンとして
図4に例示するように、入力層52と、一層の中間層55と、出力層58とを有する三層型のANN50が挙げられる。各層(52、55、58)に人工ニューロン(artificial neuron:以下「AN」という)が幾つか設けられる。ANはノードともいわれる。入力層52に設けられた各AN(53a乃至53d)は、ネットワーク54を介して中間層55に設けられた各AN(56a乃至56c)に接続される。中間層55に設けられた各AN(56a乃至56c)は、ネットワーク57を介して、出力層58に設けられたAN59に接続される。
【0063】
ANN50に機械学習させる際、例えば入力層52に設けられた各AN(53a乃至53d)に、入力変数とする4種以上の臨床データのうちのいずれか1種を入力する。また、例えば出力層58に設けられたAN59に、出力変数とする各被験者の骨折スコアを入力する。その上で情報処理装置に演算させると、入力層52に設けられた各AN(53a乃至53d)に入力された入力変数が、中間層55へ向けて出力される。各ネットワーク(54、57)は、重み付け値Wijを有する。中間層55に設けられた各AN(56a乃至56c)と出力層58に設けられたAN59とでは、次の数式4で例示するように、前層からの入力値Siと重み付け値Wijの積和計算と、シグモイド関数を用いた変数変換がされ、出力層58で計算式が出力される。この計算式により算出される数値と、正解(事前に出力層58に入力された出力変数(各被験者の骨折スコア))との誤差が計算され、誤差がゼロになるように、しきい値hi及び重みWijが修正される。機械学習したANNでは、入力変数(独立変数)と出力変数(従属変数)との間に存在する関係が見出されている。このため、骨折スコアを出力可能な学習モデルを、生成させることができる。
【0064】
【0065】
図4に例示するANN50に限らず、
図1に示す骨折学習ステップS34aでは例えば、入力層と、一層以上の中間層と、出力層とを有するANNに機械学習させればよい。機械学習させるANNとして、入力層及び出力層という二層からなる単純パーセプトロンのみを採用するのは、推測・予測精度の大幅な悪化を招くため避けるべきである。過学習を避ける観点から、ANNにおける中間層の数は、四層以下又は三層以下でもよく、好ましくは二層以下である。本発明の目的に反しない限り、入力層、一層以上の中間層、及び出力層を有する階層型ANNを2つ以上組み合わせた状態で機械学習させてもよい。ANNで用いられる動作関数は、例えば動径基底関数又はヘビ関数でもよいが、信頼性が高い観点から、数式4のようなシグモイド関数が好ましい。機械学習の方法は例えば、共役勾配降下法、準ニュートン法又はレーベンバーグ・マーカート法等でもよいが、初学者でも市販の統計解析用ソフトウェアを用いて実施しやすい観点では、正則化させて行ったり又は誤差逆伝搬法を行ったりするのが好ましく、加えて学習時間を短縮させる観点から誤差伝搬法と補修学習法を併用するのが更に好ましい。学習データに隠れた法則性を抽出しやすい観点では、誤差伝搬法と成長抑制学習法を併用するのが更に好ましい。
【0066】
推測・予測精度向上の観点では、機械学習での入力変数として、各被験者の第1時点における臨床情報として挙げた臨床データの例のうち、例えば5種以上又は6種以上を用いてもよく、好ましくは7種以上又は8種以上を用い、臨床応用しやすく推測・予測精度向上の観点では9種以上を用いるのが更に好ましく、9種を超えてデータ項目が多くなると更により好ましい。入力変数には、前述したその他のデータが更に含まれてもよい。学習効率の悪化を避ける観点では、入力変数として用いる各被験者の臨床データは、例えば20種以下、好ましくは15種以下である。推測・予測精度向上の観点では、入力変数と出力変数とを入力し、誤差修正までの演算処理を情報処理装置に繰り返し(例えば50回以上)実行させ、見出された入力変数と出力変数との関係が各々異なる複数の学習モデルを生成させるのが好ましい。
【0067】
各被験者の骨折スコア(潜在変数の因子得点に関するデータ)が骨折数に関する骨折判定結果を反映して複数セットある場合には、1セットの骨折スコアごとに1種の出力変数とし、入力変数と出力変数との関係をANNに機械学習させることが好ましい。例えば、各被験者の骨折スコア(潜在変数の因子得点)Aが「骨折数0」又は「骨折数1及び2以上のいずれか」という分類を反映した数値であり、各被験者の骨折スコア(潜在変数の因子得点)Bが「骨折数0及び1のいずれか」又は「骨折数2以上」という分類を反映した数値である場合には、骨折スコアAを1種の出力変数とし、骨折スコアBを他の1種の出力変数として、ANNに機械学習させることが好ましい。効率よく機械学習させる観点では、機械学習の際に設ける出力変数を1種に留めることが好ましい。例えば、骨折スコアAのみを出力変数として機械学習させた学習モデルAと、骨折スコアBのみを出力変数として機械学習させた学習モデルBと、を生成させることが好ましい。この場合、学習モデルAは「骨折数0」又は「骨折数1及び2以上のいずれか」に分類する推測・予測に適した統計モデルとなっており、学習モデルBは「骨折数0及び1のいずれか」又は「骨折数2以上」に分類する推測・予測に適した統計モデルとなっている。
【0068】
骨折学習後選別ステップS35では、先のステップS34aで複数の学習モデルを生成させた場合に、推測・予測精度向上の観点から、各学習モデルで推測・予測精度の高さを検証し、比較的高精度な学習モデルを選定してもよい。例えば、市販の統計解析ソフトウェアを用い、各学習モデルで単純交差検証法又はK分割交差検証法(例えば五分割交差検証法)を行って決定係数R2を算出し、該R2値が比較的大きい学習モデルを選定してもよい。このR2値は、入力変数が出力変数をどの程度に説明可能か表す指標で、0に近い値ほど説明できず、1.0に近い値ほど説明できることを意味する。構造が単純で出力誤差が小さい学習モデルを選出する観点から、学習モデルごとに、AICや、シュワルツのベイジアン情報量基準(Schwartz's Bayesian information criterion:以下「BIC」という)を検証し、AIC又はBICで比較的高値を示した学習モデルを選出候補から外すのが好ましい。市販の統計ソフトウェアでAICやBICを検証できる。AICやBICが低値な学習モデルは、推測・予測精度が高く、統計モデルとして好ましい。ただし、機械学習に用いた各被験者の学習データセットにはよく適合しても、過学習に陥って、機械学習後に新規入力する閉経後女性の臨床データにはあまり適合せず、汎用性を欠いたモデルになっている場合があり得る。このため、選定した学習モデルで、新規の臨床データセットを入力し、所望する推測・予測精度で骨折スコアを出力可能か検証するのが好ましい。先のステップS34aで生成した学習モデルが1つしかない場合や、ある程度の推測・予測精度があれば充分な場合には、骨折学習後選別ステップS35を省略してもよい。
【0069】
以上に説明した学習モデル生成方法S20aによれば、臨床情報として挙げた臨床データはいずれも、例えば、問診、身体計測、BMD計測若しくは血液検査等をする、又は、FRAX(非特許文献3)若しくは特許文献1に記載された学習モデルを使用する等すれば、従来の骨粗鬆症医療における日常診療の現場でも生成し取得可能なデータである。各被験者の骨折スコア(潜在変数の因子得点に関するデータ)は、各被験者の臨床情報に含まれる4種以上の臨床データと、各被験者の骨折判定結果とから、共分散構造分析により算出可能である。このため、従来の骨粗鬆症医療の日常診療の現場でも、骨折スコアを出力可能な学習モデルを生成可能であり、前述した学習データセットは、この学習モデルの生成に適している。以下に説明する骨折スコア出力方法S15aでは、この学習モデルを用い、対象者の骨折スコアを出力可能である。
【0070】
骨折スコア出力方法S15aは、骨折スコアを出力可能な学習モデルに、対象者とする任意の閉経後女性の第1時点での臨床情報を入力し、この対象者の骨折スコアを出力する処理を、情報処理装置に実行させる。骨折スコア出力方法S15aは、前述したステップS31a、S32、S33a、S34a及びS35を含み得ることに加えて、対象者の臨床情報取得ステップS41aと、対象者の臨床情報正規化ステップS42と、対象者の骨折スコア出力ステップS43aとを更に含み得る。
【0071】
対象者の臨床情報取得ステップS41aでは、対象者の第1時点での臨床情報を取得する。該臨床情報は、対象者についての、第1時点での年齢、第1時点での身長、第1時点での体重、第1時点でのBMI、第1時点での骨密度(BMD)、第1時点での骨代謝マーカー検査値、第1時点での腎機能マーカー検査値、第1時点での骨格筋量マーカー検査値、第1時点で既存の身長低下、初経年齢、閉経年齢、閉経時から第1時点までの経過年数、経過観察期間の長さ、前記FRAX結果、前記BMD予測値、前記BLR予測値、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた4種以上の臨床データである。該4種以上の臨床データは、各被験者の4種以上の臨床データと同様に、第1時点の対象者に基づく臨床データであれば、対象者の第1時点で生成される臨床データに限らず、対象者の第1時点よりも後に生成される臨床データでもよい。推測・予測精度向上の観点では、ここで臨床情報として挙げた臨床データの例のうち、例えば5種以上又は6種以上を取得してもよく、好ましくは7種以上又は8種以上を取得し、臨床応用しやすい高精度な骨折スコアを得る観点では9種以上を取得するのが更に好ましく、9種を超えて多くのデータ項目数を取得すると更により好ましい。通常は、骨折スコアを出力可能な学習モデルを準備(例えば生成)後にステップS41aを実施し、この場合、
図2に示すように、各被験者の少なくとも第1時点と比べて、対象者の第1時点は、暦の上で後になる。
図1に示す、対象者の臨床情報取得ステップS41a及び後続の各ステップ(S42、S43a及びS45)は、対象者の第1時点で記録された対象者の臨床情報に基づき、対象者の第1時点から幾らか期間経過した後に実施してもよいが、期間経過に伴って推測・予測結果の価値が下がることを避ける観点では対象者の第1時点の直後に実施するのが好ましい。
【0072】
推測・予測精度向上の観点から、対象者の臨床情報取得ステップS41aで取得する4種以上の臨床データは、前述したステップS31aで取得して骨折学習ステップS34aで入力変数とした各被験者の4種以上の臨床データの組み合わせに対応する、概ね同項目の臨床データの組み合わせが好ましい。このため、仮に、前述した各被験者の臨床情報でのデータ項目の一種としてその他のデータを取得し、該データを入力変数の一項目とて機械学習に用いた場合、対象者でも対応する同種のその他のデータを更に取得するのがよい。対象者の経過観察期間の長さは、このデータの取得時(ステップS41a実施時)から見て対象者の第2時点が未来にある場合には、「経過観察期間の長さの予定値」であればよい。この予定値は、任意の値でもよく、又は、対象者が定期的に骨粗鬆症外来を受診している場合(例えば3年ごとに受診している場合)には次回の受診予定日までの期間の長さ(例えば3年)でもよい。この予定値は、前述した各被験者の臨床データの例として挙げた「経過観察期間の長さ」に対応する概ね同項目の臨床データといえる。医師が対象者について「経過観察期間の長さの予定値(例えば次回検診までの期間の長さの予定値)」を検討する場合、ステップS41aでは、既に生成(例えば医師により仮決定)された経過観察期間の長さの予定値をデータ取得すればよい。
【0073】
対象者の臨床情報正規化ステップS42では、推測・予測精度向上の観点から、対象者について先のステップS41aで得た4種以上の臨床データを、情報処理装置で演算しやすいように正規化してもよい。例えば、前述したステップS32と同様にして、ステップS42では、対象者の4種以上の臨床データを正規化するのが好ましい。ただし、各被験者とは異なり、通常、対象者についての各ステップ(S41a、S42、S43a及びS45)を実施する際、対象者について前述した画像診断による骨折判定結果は生成されていないため、対象者では骨折判定結果を正規化することを特に要しない。先のステップS41aで既に正規化された臨床データを取得可能な場合、対象者の臨床情報正規化ステップS42は省略可能である。
【0074】
対象者の骨折スコア出力ステップS43aでは、骨折スコアを出力可能な学習モデルを有する情報処理装置に、対象者の臨床情報に含まれる4種以上の臨床データを入力し、対象者の骨折スコアを出力する処理を実行させる。例えば、学習モデルの入力層に設けられたANごとに、対象者の臨床情報に含まれる4種以上の臨床データ又はその正規化データ(入力変数)のうち1種を入力し、出力層に設けられたANから対象者の骨折スコアを出力する処理を、情報処理装置に実行させる。
【0075】
学習モデルにより出力される対象者の骨折スコアは、対象者についての、第1時点での既存骨折の有無の推測、第1時点での既存骨折の骨折数の推測、経過観察期間内での新規骨折の有無の予測、及び、経過観察期間内での新規骨折の骨折数の予測から選ばれた1種以上の指標となる数値データである。出力された対象者の骨折スコアと、骨折スコアの閾値(例えばカットオフ値)との比較結果に基づき、対象者について、第1時点での既存骨折の有無の推測結果、第1時点での既存骨折の骨折数の推測結果、経過観察期間内での新規骨折の有無の予測結果、及び、経過観察期間内での新規骨折の骨折数の予測結果から選ばれた1種以上に関する結果が、明確となる。例えば、対象者の骨折スコアがカットオフ値の所定値未満である場合に「対象者には第1時点で既存骨折がない」という推測結果が示唆され、対象者の骨折スコアがカットオフ値の所定値以上である場合に「対象者には第1時点で既存骨折がある」という推測結果が示唆される。あるいは、対象者の骨折スコアがカットオフ値の所定値未満である場合に「対象者では経過観察期間内に新規骨折が生じない」という予測結果が示唆され、骨折スコアがカットオフ値の所定値以上である場合に「対象者では経過観察期間内に新規骨折が生じる」という予測結果が示唆される。
【0076】
対象者の骨折スコア出力ステップS43aで使用する学習モデルが、各被験者の骨折数に関する骨折判定結果を観測変数として共分散構造分析により算出された潜在変数の因子得点(各被験者の骨折スコア)を出力変数として機械学習したものである場合に、この学習モデルに対象者の臨床情報を入力して出力される対象者の骨折スコアは、対象者の骨折数の推測・予測に関する数値となっている。この場合、学習モデルにより出力された対象者の骨折スコアと、骨折数ごとの閾値との比較に基づき、例えば、「対象者の初診時(第1時点)での既存骨折数が0」を示す推測結果を出力したり、「対象者の経過観察期間内での新規骨折数が1つ」を示す予測結果を出力したりし得る。また、「骨折数が所定数未満」又は「骨折数が所定数以上」のいずれかに分類する複数種の学習モデルを使用することにより、対象者の骨折数の推測・予測に適した、対象者の複数の骨折スコアを出力させることもできる。例えば、「骨折数0」又は「骨折数1及び2以上のいずれか」に分類する学習モデルAと、「骨折数0及び1のいずれか」又は「骨折数2以上」に分類する学習モデルBとを組み合わせて使用することにより、学習モデルAからは「骨折数1以上」が陽性又は陰性のいずれかの推測・予測に適した対象者の骨折スコアAを出力させ、学習モデルBからは「骨折数2以上」が陽性又は陰性のいずれかの推測・予測に適した対象者の骨折スコアBを出力させるように使用することも可能である。また、例えば、骨折数が1つと推測・予測される場合は「重症」に分類し、骨折数が2以上と推測・予測される場合は「超重症」に分類するというように、骨折数に応じて骨粗鬆症又は骨折の重症度を分類し、対象者での骨粗鬆症又は骨折の重症度を示す推測・予測結果を出力する応用も可能である。将来的には、ここで骨折スコアの値について幾つか例示したような判断基準を知っている者(例えば臨床統計学に慣れた医師)にとって、学習モデルにより出力された対象者の骨折スコアの数値そのものが、対象者の骨粗鬆症による骨折の推測・予測結果を示しているも同然と分かるようになる可能性もあり得ると考えられる。
【0077】
以上に説明した骨折スコア出力方法S15aによれば、各被験者の臨床情報に含まれる4種以上の臨床データと、共分散構造分析により算出された各被験者の骨折スコア(潜在変数の因子得点)と、を学習データセットに含めた機械学習により生成された学習モデルを用いることにより、対象者での骨粗鬆症による骨折を推測・予測する指標となる、対象者の骨折スコアを出力することができる。このため、例えば、骨粗鬆症医療の日常診療の現場で、担当医が対象者の骨粗鬆症や既存骨折を早期発見したり、対象者で今後に生じる可能性が高いと予測される新規骨折を未然に抑える予防・治療方針を早期決定する診断をしたりしやすいように、担当医を支援可能である。骨折スコア出力方法S15aは、例えば、骨粗鬆症医療の担当医にとって、骨粗鬆症の早期予防・治療を図る方針を決定する診断をする際、判断材料となる情報の一つとして、対象者の骨折スコアを対象者の第1時点又はその後の数日以内に入手するのに適した方法といえる。担当医は、「骨粗鬆症外来の受診者が第1時点で既存骨折を生じている」旨の推測結果又は「今後の経過観察期間内に新規骨折が生じる」旨の予測結果を、第1時点の直後(例えば受診者が病院で骨粗鬆症検診のために身体計測等を受けた時点(第1時点)の後、帰宅前に担当医から検診の結果説明を受けるために担当医がいる診察室前で順番待ちをしている時点)で得られた場合、担当医は直ぐに骨折スコアに基づく推測・予測結果を受診者に伝えた上で、骨粗鬆症や骨折の早期予防・治療を図るための方針として、例えば、処方を第一選択薬(活性型ビタミンD3製剤又はカルシウム製剤等)から第二選択薬(例えばビスホスホネート製剤)へと変更する提案をしやすいと期待される。特に、対象者の臨床情報として例えば9種以上の臨床データを用いて骨折スコアを出力する場合、臨床応用しやすい水準の高精度な骨折スコアが出力されやすく、担当医は、既存骨折の有無又は近い将来に新規骨折が生じるリスクの高さを対象者に分かりやすく説明しやすくなり、骨粗鬆症や骨折の早期予防・治療を図る方針へと変更することを対象者に納得してもらいやすくなると期待される。
【0078】
対象者の骨折スコアが「対象者の経過観察期間内での新規骨折の有無」を予測する指標となっている場合、予測結果における対象者の経過観察期間の長さは、各被験者の経過観察期間の長さに応じた長さになっていると考えられる。このため、例えば、「対象者の初診時(第1時点)から約3年以内での新規骨折の有無」を予測しようとする場合には、経過観察期間の長さが約3年である閉経後女性らを被験者らとして、各被験者の臨床情報及び判定結果取得ステップS31aを実施するのがよい。また、対象者の骨折スコアが推測又は予測のいずれの指標になるのかは、例えば、ステップS31aで各被験者としてどのような時期に骨折した閉経後女性を選定し、且つ、推測又は予測のいずれに対応する骨折判定結果を取得し共分散構造分析(各被験者の骨折スコア算出ステップS33a)に供したのかに応じて変化すると考えられる。例えば、既存骨折が生じてから約3年後に第1時点を迎えて「第1時点で既存骨折あり」と判定された被験者が多い場合には、その判定結果(推測に対応する骨折判定結果)を観測変数の1種として共分散構造分析を行い、算出された潜在変数の因子得点(各被験者の骨折スコア)を出力変数として機械学習させると、生成する学習モデルから出力可能な対象者の骨折スコアは、「対象者の第1時点で発生から約3年以内程度の既存骨折があるか否かの推測結果」の指標として適していると考えられる。または、「各被験者で数年以上の経過観察期間内での新規骨折の有無に関する判定結果(予測に対応する判定結果)」を用いて、共分散構造分析を行い、算出された潜在変数の因子得点を出力変数として機械学習させると、生成する学習モデルから出力される骨折スコアは、「対象者で経過観察期間内に新規骨折が生じるか否かの予測結果」の指標として適していると考えられるが、意外にも、この場合の骨折スコアは、「対象者の第1時点での既存骨折の有無の推測結果」の指標としても適している場合がある(後述する表7の試験例1-1を参照)。このため、学習モデルにより出力される対象者の骨折スコアが、推測又は予測のいずれの指標となるのか明確には区別できない場合がある。そのように明確に区別できない場合の骨折スコアでも、対象者での骨粗鬆症による骨折の推測及び予測のうちの少なくとも一方の指標になっているといえる。
【0079】
骨折スコア出力方法S15aにより出力される対象者の骨折スコアは、推測又は予測のいずれの指標となるかを問わず、例えば、大勢の閉経後女性(大勢の対象者)が受診する骨粗鬆症検診では、対象者ごとにエックス線撮影又はMRIによる画像診断を要するか否かをスクリーニングする指標として有用と考えられる。例えば、骨粗鬆症検診時における対象者の検査結果(対象者の第1時点における4種以上の臨床データ)を取得して骨折スコア出力方法S15aを実施し、対象者の骨折スコアを出力し、該骨折スコアの数値に基づき骨折の可能性が高いと示唆される対象者については、さらに、検診担当医が骨の画像診断を行うように運用すれば、骨折スコア出力方法S15aにより、検診担当医が対象者について骨粗鬆症や骨折の予防・治療を図る早期診断をすることを効果的に支援可能と期待される。
【0080】
骨折スコアの閾値(例えばカットオフ値)の所定値の高さは、各被験者の臨床情報とした4種以上の臨床データでのデータ項目の組み合わせや、医師が各被験者について骨折の有無を判定した基準等に応じて、変化する場合がある。例えば、骨粗鬆症による椎体骨折が生じたか否かに関して、画像診断により圧迫骨折が疑われる椎体について、隣接椎体と比較して椎体高の低下量が20%以上である場合に「骨折あり」と判定するのか、又は、この低下量が40%以上である場合に「骨折あり」と判定するのか、判定基準値に応じて骨折スコアの閾値における所定値の高さが変化し得る。判定基準値が高くなれば、骨折スコアの閾値の所定値も大きくなり得る。骨粗鬆症による骨折の推測・予測方法S10aでは、対象者の骨折スコア出力ステップS43aの後、学習モデルにより出力された対象者の骨折スコアと、骨折スコアの閾値との比較結果に基づき、対象者についての、第1時点での既存骨折の有無を示す推測結果、第1時点での既存骨折の骨折数を示す推測結果、経過観察期間内での新規骨折の有無を示す予測結果、及び、経過観察期間内での新規骨折の骨折数から選ばれた1種以上の推測・予測結果を出力する処理を情報処理装置に実行させる結果出力ステップS45を更に含む。このように出力させた場合、骨粗鬆症による骨折の推測・予測方法S10aの実施者が統計処理に慣れていなくても、分かりやすい推測・予測結果を入手しやすい。
【0081】
または、結果出力ステップS45では、学習モデルにより出力された対象者の骨折スコアのデータを、該学習モデルを有する情報処理装置から出力(例えば送信)し、少なくとも1つのユーザ端末へ入力(例えば受信)させてもよい。その上で、該ユーザ端末において、骨折スコアとその閾値との比較結果に基づき、対象者についての、第1時点での既存骨折の有無を示す推測結果、第1時点での既存骨折の骨折数を示す推測結果、経過観察期間内での新規骨折の有無を示す予測結果、及び、経過観察期間内での新規骨折の骨折数から選ばれた1種以上の推測・予測結果を出力する処理をユーザ端末に実行させるのが好ましい。
【0082】
上述した推測・予測結果を出力する際、推測・予測結果の出力とは別に、骨折スコアを出力可能な学習モデルに基づいて、被験者らの臨床情報と、被験者らの骨折スコアと、の関係を示す応答曲面を応答曲面法により生成し、生成された応答曲面と骨折スコア閾値(例えばカットオフ値)との位置関係を示す二次元グラフ又は三次元グラフのデータを生成する処理を、情報処理装置に実行させてもよい。応答曲面法は、統計的手法の一種であり、被験者どうしの間で連続していない骨折スコア及び臨床データの値から近似式を作成し、近似式により連続的な曲面(応答曲面)を作成可能である。例えば、AMOS等の市販の統計解析ソフトウェアには、応答曲面法による応答曲面を含む三次元グラフを作成可能な機能が実装されている。このような統計解析ソフトウェアと、骨折スコアを出力可能な学習モデルとがあれば、応答曲面法により応答曲面を作成する処理を情報処理装置に実行させることができる。二次元グラフを作成する場合に該二次元グラフは、骨折スコアの値を示す第1軸と、機械学習に供した4種以上の臨床データから選択された1種の臨床データの値を示す第2軸とを有するグラフである。三次元グラフを作成する場合に該三次元グラフは、前記第1軸と、前記第2軸と、機械学習に供した4種以上の臨床データから選択された他の1種の臨床データの値を示す第3軸とを有するグラフである。なお、応答曲面の全体像は、本来、機械学習に供した入力変数の種類数(例えば12種)と、出力変数の種類数(例えば骨折スコアという1種)との合計数(例えば13)次元グラフで描かれるはずのものであるが、そのような多次元の全体像は視認困難である。応答曲面について二次元の断面が二次元グラフに描かれるか又は三次元の断片が三次元グラフに描かれるかすれば、応答曲面と骨折スコア閾値との位置関係を、視覚的に確認しやすい。二次元グラフ又は三次元グラフは、以下に例示するように活用可能である。
【0083】
骨粗鬆症医療の担当医は、対象者(新規受診者)を診察する際、対象者の骨折スコア又は推測・予測結果を対象者に伝え、今後の骨粗鬆症による骨折の予防・治療方針を対象者と相談する際、上述した二次元グラフ又は三次元グラフを活用可能である。担当医は、診察室で、PCのモニターにグラフを表示してもよく又はグラフが記載された資料をプリンターでプリントアウトしてもよい。二次元グラフを活用する場合、担当医は、二次元グラフに示された応答曲面での第2軸の臨床データの値を仮に変化(増加又は減少)させる場合に、応答曲面上で第1軸(骨折スコア)の値がどのように増加又は減少し、これに伴い応答曲面上の骨折スコアの値と骨折スコア閾値との関係がどのように変化するのか、対象者に対して視覚的に説明可能である。例えば、骨折スコア閾値がカットオフ値である場合に、応答曲面上の第2軸の臨床データの値を仮に増加又は減少させることにより応答曲面上の骨折スコアの値がカットオフ値よりも高値となるように変化するときには、今後、実際に対象者の臨床データの値がそのように変化すれば対象者で骨粗鬆症による骨折が生じるであろうと予測される。そのように骨折スコアの値を変化させる要因となり得る臨床データ(第2軸)の値は、骨粗鬆症による骨折を発生させるリスク因子と推定される。担当医は、このようなグラフと共に推測・予測結果を対象者に伝えることにより、対象者に推測・予測結果を説明しやすくなり、対象者は骨粗鬆症の早期予防・治療を図る方針に納得しやすくなると期待される。あるいは、前述した三次元グラフを活用する場合は、第2軸で示される臨床データの値の変化だけでなく、併せて、第3軸で示される臨床データの値の変化に伴い、応答曲面上の骨折スコアの値と骨折スコア閾値との位置関係がどのように変化するのか対象者に対して視覚的に説明可能なため、更に好ましい。応答曲面上の骨折スコアの値がカットオフ値よりも高値となる領域が三次元グラフに含まれている場合、この三次元グラフの第2軸で示される臨床データと第3軸で示される臨床データとの組み合わせは、骨粗鬆症による骨折を発生させるリスク因子の組み合わせと推定される。担当医は、このようにグラフを活用すると、対象者ごとに一人ひとり異なる体質(遺伝的素因、環境要因)に応じて、対象者ごとに適した骨粗鬆症を早期予防・治療の方針を対象者に説明しやすい。なお、既に述べたとおり、対象者の骨折スコア、推測・予測結果又はグラフ等の出力や表示は本発明に含まれ得るが、その後に医師が骨折スコア等を参考にして対象者に手術、治療又は診断する工程は本発明に含まれない。
【0084】
図5(a)で一例として、後述の試験例1-1に係る学習モデルにより出力された骨折スコア(新規骨折スコア)を示すZ軸(第1軸)と、初診時(第1時点)の正規化された血中Cr検査値(初診時正規化血中Cr検査値)を示すX軸(第2軸)と、初診時(第1時点)の正規化された血中BAP検査値(初診時正規化血中BAP検査値)を示すY軸(第3軸)と、を有する三次元グラフ90aを示す。該三次元グラフ90aは、各被験者の4種以上の臨床データを入力変数とし、各被験者の骨折スコア(潜在変数の因子得点)を出力変数として、統計解析ソフトウェア(SAS Institute Inc.製、JMP(登録商標)version 8.0)に入力し、機械学習により生成された学習モデルに基づいて応答曲面法により作成されたグラフである。JMPに限らず、統計処理ソフトウェア分野の当業者は、任意の方法で応答曲面法によりグラフ作成可能である。この三次元グラフ90aには、骨折スコアの閾値の高さ(
図5(a)ではカットオフ値=1.08)を示す閾値表示95と、骨折スコアを出力可能な学習モデルに基づいて応答曲面法により生成された応答曲面92aとが示されている。応答曲面92aには、閾値表示95よりも骨折スコアが高値である骨折リスク陽性の予測領域99と、閾値表示95よりも骨折スコアが低値である骨折リスク陰性の予測領域97とが含まれている。
【0085】
この三次元グラフ90aは、対象者(骨粗鬆症外来の新規受診者)を初診時(第1時点)に検査し、対象者から取得した4種以上の臨床データを試験例1-1に係る学習モデルに入力し、該学習モデルに入力された対象者の4種以上の臨床データにおいて初診時正規化Cr検査値が0.2以下で且つ初診時正規化BAP検査値が0.5以上で、その結果として該学習モデルにより出力された対象者の骨折スコアが閾値(1.08)よりも高値である場合に、検査後の診察時に担当医が対象者と今後の骨粗鬆症による骨折の予防・治療方針を相談する際、活用するのが好ましいと考えられるグラフである。この場合に、対象者の骨折スコアは、三次元グラフ90aの応答曲面92a上に当てはめて考えると、閾値表示95よりも上側にある骨折リスク陽性の予測領域99内に位置することとなる。このため、三次元グラフ90aは、仮に、対象者が初診前のように骨粗鬆症の予防・治療を試みなければ「初診時(第1時点)から例えば10年後の検診予定時(第2時点)までの経過観察期間内に新規骨折が生じる」という予測結果を示唆している。一方、応答曲面92aでは、仮に、初診時正規化Cr検査値を0.2よりも幾らか高値へと変化させるか又は初診時正規化BAP検査値を0.5未満の値へと変化させる場合には、骨折スコアが閾値表示95よりも低値である骨折リスク陰性の予測領域97内へと移行することが示唆されている。つまり、今後、対象者が正規化Cr検査値を0.3以上へと増加させたり、正規化BAP検査値を0.5未満へと低下させたりすることができれば、対象者において数年以内での新規骨折の発生を避けやすいことを示唆している。このように三次元グラフ90aを活用することにより、担当医は、対象者に対して、例えば、骨格筋量を増やすことによりCr検査値を高めたり、ビスホスホネート製剤の投薬により骨代謝回転を抑えてBAP検査値を低くしたりする等、対象者の体質(遺伝的素因、環境要因)に応じて骨粗鬆症による骨折を早期予防・治療を図る診断をしやすくなる。つまり、グラフの生成により、このような担当医の診断を支援することができる。
【0086】
図5(a)では、BAP検査値とCr検査値との組み合わせが、骨折スコアの値の高さに強く影響した例を挙げた。入力変数として機械学習に供した4種以上の臨床データのうちのどの臨床データが骨折スコアの値の高さに強く影響するかは、第2軸(X軸)として選択された臨床データと、第3軸(Y軸)として選択された臨床データと、の組み合わせをそれぞれ変更した複数の三次元グラフを見比べてみると、分かりやすい。つまり、前述したように本来は多次元グラフに描かれるはずである応答曲面の全体像に対して、第2軸(X軸)及び第3軸(Y軸)の各々として選択された臨床データに応じて、作成される三次元グラフごとに、多次元の全体像の断片として生成される応答曲面の形状が異なり、生成される断片としての応答曲面と閾値表示95との位置関係も異なる。例えば、
図5(a)に示した三次元グラフ90aと比べて、
図5(b)に示す三次元グラフ90bや、
図6(c)乃至
図6(f)に示す三次元グラフ90c乃至90fでは、第2軸(X軸)及び第3軸(Y軸)の各々として選択した臨床データの組み合わせが異なり、この組み合わせの違いに応じて、各々の応答曲線(92a乃至92f)は形状が異なり且つ閾値表示95との位置関係も異なっている。このため、担当医は、一人ひとり体質が異なる対象者に応じて、今後に早期予防・治療を図らない場合には対象者の骨折スコアが骨折リスク陽性の予測領域99へ移行する可能性があり、且つ、今後に早期予防・治療を図る場合には対象者の骨折スコアが骨折リスク陰性の予測領域97へと移行する可能性があることを、対象者に説明しやすい任意のグラフを選んで対象者への説明に使用可能である。例えば、
図5(b)に示す三次元グラフ90bは、後述の試験例1-1に係る学習モデルに基づいて応答曲面法により作成された多数の三次元グラフのうちの1種であり、初診時(第1時点)に低BMD且つ高身長であると、応答曲面92b上での骨折スコアの値が閾値表示95よりも高い骨折リスク陽性の予測領域99へと移行しやすいことが分かりやすいグラフになっている。例えば、担当医は、初診時(第1時点)でのBMD計測値データ及び身長データが三次元グラフ90bの骨折リスク陽性の予測領域99に含まれるか又はその近傍に含まれるような低BMD且つ高身長の対象者に対して、三次元グラフ90bを見せ、今後の経過観察期間内に新規骨折が発生することを避けるために、BMD低下を抑えるビスホスホネート製剤を処方する等の早期予防・治療方針を提案すればよいと考えられる。
【0087】
図1に示すステップS41a及びS42は、学習モデルを使用しないため、例えば学習モデルの生成前でも実施可能である。一方、対象者の骨折スコア出力ステップS43aは、骨折スコアを出力可能な学習モデルを準備(例えば生成)後に実施する。このため、学習モデルを準備(生成)後にステップS41a、S42及びS43aをまとめて実施するのが効率良く好ましい。対象者は、被験者らに含まれない者でもよく、又は、被験者らに含まれる者でもよい。例えば、仮に、
図2に示す被験者Bと対象者Zとが同一人である場合、被験者として2014年1月(被験者の第1時点、48歳)に臨床情報を取得され、2020年1月(被験者の第2時点、54歳)に「経過観察期間内での新規骨折の有無」を医師に判定され、骨折スコアを出力可能な学習モデルが生成された後、同じ女性が今度は対象者として2022年6月(対象者の第1時点、56歳)に臨床情報を取得され、その後の未来である2027年6月(対象者の第2時点、61歳)までの経過観察期間内に新規骨折が生じるか否か予測する指標となる骨折スコアを出力されてもよい。被験者らに幅広い年代の閉経後女性を含めれば、被験者であった女性を対象者とする場合でも、比較的高精度の推測・予測結果を出力しやすい。
【0088】
簡便に実施可能な観点では、
図1に示す骨折スコア出力方法S15aや骨粗鬆症による骨折の推測・予測方法S10aにおけるステップS31a、S32、S33a、S34a及びS35に代えて、
図7に示すように、学習モデル生成方法(
図1、S20a)により予め生成された、骨折スコアを出力可能な学習モデルを準備するステップS29bを含む、骨折スコア出力方法S15bや骨粗鬆症による骨折の推測・予測方法S10bが好ましい。
【0089】
実施形態1に係る学習モデルは、
図1に示す学習モデル生成方法S20aにより生成された、骨折スコアを出力可能な学習モデルである。既に説明したように、この学習モデルは、第1時点での既存骨折の有無、第1時点での既存骨折の骨折数、経過観察期間内での新規骨折の有無及び経過観察期間内での新規骨折の骨折数から選ばれた1種以上を判定された各被験者について、該各被験者の第1時点における臨床情報に含まれる4種以上の臨床データが
図4に例示するANN50の入力層52に入力され、出力層58が各被験者の骨折スコア(潜在変数の因子得点)を出力するように、例えば前述した数式4で示した重み付け値W
ijが機械学習されたものでもよい。この学習モデルは、入力層52に対象者の第1時点の臨床情報(4種以上の臨床データ)が入力される場合、該臨床情報に対して例えば重み付け値W
ijに基づく演算を行い、出力層58から対象者の骨折スコアを出力するように、情報処理装置を機能させるためのものである。
【0090】
図7に示す骨折スコア出力方法S15bや骨粗鬆症による骨折の推測・予測方法S10bを実施するユーザ(例えば、骨粗鬆症医療の担当医又は該担当医を補助する医療従事者等)は、
図8に例示するように、骨折スコアを出力可能な学習モデル72を有する情報処理装置61aを使用してもよい。該情報処理装置61aは、種々の情報処理や情報の送受信が可能な、例えばパーソナルコンピュータ又はサーバコンピュータ等である。情報処理装置61aは、例えば、制御部62a、表示部63a、入力部64a及び記憶部70aを備えていてもよい。
【0091】
制御部62aは、記憶部70aに記憶されたプログラム71aを読み出して実行することにより、情報処理装置61aに係る種々の演算処理、制御処理などを行うプロセッサであり、例えば少なくとも1つのCPU(Central Processing Unit)等を有する。記憶部70aは、各種データを記憶するメモリである。メモリには、RAM(Random Access Memory)と不揮発性メモリとが含まれる。RAMは、制御部62aが演算処理を実行するために必要なデータを一時的に記憶する。不揮発性メモリは、例えばハードディスクドライブを含み、制御部62aが処理を実行するためのプログラム71aと、骨折スコアを出力可能な学習モデル72とを記憶保持する。不揮発性メモリは、学習モデル72を生成した機械学習で学習データセットとして用いられた、被験者らの骨折学習データベース73を、更に記憶保持してもよい。表示部63aは、例えば液晶ディスプレイ又は有機ELディスプレイ等の表示装置であり、制御部62aから与えられた画像を表示する。入力部64aは、例えばキーボード又はタッチパネル等の入力インターフェイスであり、ユーザからの操作入力を受け付ける。制御部62aは、ユーザにより入力部64aを介して情報処理装置61aに対象者の臨床情報が入力された場合、該臨床情報を学習モデル72に適用し、対象者の骨折スコアを出力する処理を実行する演算部として機能する。出力された骨折スコアは、そのまま数値データとして表示部63aに表示されてもよい。ユーザに分かりやすい観点では、出力された骨折スコアとその閾値との比較結果に基づき、対象者についての、第1時点での既存骨折の有無を示す推測結果又は経過観察期間内での新規骨折の有無を示す予測結果が表示部63aに表示されるように、情報処理装置61aを機能させるのが好ましい。
【0092】
情報処理装置61aは、さらに、第1の通信部65aを備えるのが好ましい。第1の通信部65aは、通信に関する処理を行うための処理回路等を含み、少なくとも1つのユーザ端末81との間で例えばインターネット又は病院内イントラネット等の通信ネットワーク80を介して情報の送受信を行う。第1の通信部65aには、この送受信のためのアンテナが含まれてもよい。ユーザ端末81として例えば、骨粗鬆症医療の担当医が所持しているスマートフォン82、この担当医が勤務病院で受診者(対象者)を診察する診察室に設けられたパーソナルコンピュータ83、又は、この担当医を補助する医療従事者が所持しているノートPC84等が挙げられ、これらの例に限定されない。ユーザ端末81には、情報処理装置61aとの間で通信ネットワーク80を介してデータ送受信することにより、骨折スコアを出力可能な学習モデル72を用いて、
図7に示す骨粗鬆症による骨折の推測・予測方法S10bの実施に適した、アプリケーションソフトウェアがインストールされているのが好ましい。例えば、対象者の骨折スコア出力ステップS43aで、ユーザが対象者について4種以上の臨床データを
図8に示すユーザ端末81に入力した場合、入力された4種以上の臨床データがユーザ端末81から送信され、通信ネットワーク80及び第1の通信部65aを介して情報処理装置61aで受信され、制御部62aは、受信した4種以上の臨床データを学習モデル72に適用して対象者の骨折スコアを出力する処理を実行してもよい。出力された骨折スコアデータは、第1の通信部65aから送信され、通信ネットワーク80を介してユーザ端末81で受信されてもよい。該ユーザ端末81で、不図示のプロセッサと前述したアプリケーションプログラムとにより、骨折スコアがその閾値と比較された結果、ユーザ端末81のディスプレイに、骨折スコアに基づき対象者についての第1時点での既存骨折の有無若しくは既存骨折の骨折数を示す推測結果又は経過観察期間内での新規骨折の有無若しくは新規骨折の骨折数を示す予測結果が表示されるのが好ましい。このように、骨折スコアを出力可能な学習モデル72を有する情報処理装置61aと、ユーザ端末81と、を含む骨折推測・予測システム60aが、病院に設けられるのが好ましい。骨折推測・予測システム60aには、図示しないが、更に、例えば、対象者からの問診に対する回答(年齢等)データや血液検査結果等が入力される情報処理端末、身長計若しくは体重計等の身体計測機器、又は、BMD計測装置等、対象者の第1時点における4種以上の臨床データ生成手段との間で、対象者の臨床データを送受信可能に構成されてもよい。
【0093】
<実施形態2>
図9には、実施形態2に係る骨粗鬆症による骨折の推測・予測方法S10cと、該方法S10cに含まれ得る、学習データセット作成方法S30c、学習モデル生成方法S20c及び骨折スコア出力方法S15cとを示す。これらの方法(S10c、S15c、S20c、S30c)の説明にあたり、
図1を用いて説明した各方法(S10a、S15a、S20a及びS30a)と比べて、共通事項の説明を適宜省略し、異なる事項を主に説明する。
図9に示す学習データセット作成方法S30cでは、各被験者の他の臨床情報及びBMDデータ取得ステップS21と、各被験者の他の臨床情報正規化ステップS22と、BLR(骨量減少率)学習ステップS24と、BLR学習後選別ステップS25とを含み得ることにより、BLR(予測値)を出力可能な学習モデルを生成しやすく構成されている。学習データセット作成方法S30cでは、さらに、各被験者の臨床情報及び判定結果取得ステップS31cと、各被験者の臨床情報正規化ステップS32と、各被験者の骨折スコア算出ステップS33aとを含み得る。
【0094】
各被験者の他の臨床情報及びBMDデータ取得ステップS21では、BLR(予測値)を出力可能な学習モデルの生成に適した学習データセットを作成するために、複数名の閉経後女性を被験者らとする。この被験者らに含まれる各被験者(他の各被験者)は、閉経後における任意の第1時点と、該第1時点から後の第2時点とで、各々、BMDを既に計測された女性である。このステップS21での被験者らについて、その他の事項は、
図1を用いて説明したステップS31aに関して前述した被験者らと同様である。
【0095】
その上で、
図9に示すステップS21では、各被験者の他の臨床情報を取得する。該他の臨床情報には、各被験者について、第1時点での年齢、第1時点での身長、第1時点での体重、第1時点でのBMI、第1時点での体脂肪率、第1時点での除脂肪体重、第1時点での体脂肪量、初経年齢、閉経年齢、閉経時から第1時点までの年数、及び、これらのいずれかを間接的に示すデータから選ばれた1種以上の他の臨床データが含まれる。推測・予測精度向上の観点では、各被験者の他の臨床情報には、ここで挙げた他の臨床データの例のうち、例えば2種以上又は3種以上、好ましくは4種以上又は5種以上、更に好ましくは6種以上又は7種以上が含まれる。
図1に示す各被験者の臨床情報及び判定結果取得ステップS31aに関して前述した各被験者の臨床情報と、
図9に示すステップS21で取得する各被験者の他の臨床情報とでは、含まれるデータ項目のうち少なくとも一部が重複してもよい。各被験者の他の臨床情報に含まれ得るデータ項目のうち、第1時点での年齢、第1時点での身長、第1時点での体重、第1時点でのBMI、初経年齢、閉経年齢、閉経時から第1時点までの経過年数、及び「間接的に示すデータ」については、
図1に示すステップS31aに関して既に説明したとおりである。
【0096】
第1時点での体脂肪率は、例えば、水中体重秤量法、空気置換法、皮下脂肪厚法(キャリバー法)、生体インピーダンス法又は前述したDXAにより計測しデータ生成可能である。測定誤差を小さく抑える観点と、体脂肪率だけでなくBMDも計測可能な観点とから、DXAにより生成された体脂肪率の計測値を取得するのが好ましい。または、体脂肪率を計測するコストを削減する観点では、次の数式5により算出された体脂肪率のデータを取得するのも好ましい(非特許文献4参照)。また、第1時点の体重と、第1時点の体脂肪率との数値データが明らかになれば、第1時点の除脂肪体重と、第1時点の体脂肪量とを算出可能である。このため、「第1時点の体重」と「第1時点の体脂肪率」との組み合わせは、「第1時点の除脂肪体重」と「第1時点の体脂肪量」との各々を間接的に示すデータに該当する。
【0097】
【0098】
図9に示すステップS21では、各被験者について、第1時点のBMDと、第2時点のBMDと、もデータ取得する。BMD計測方法や、BMDを計測する身体部位は、
図1に示す各被験者の臨床情報及び判定結果取得ステップS31aに関して説明したとおりである。その上で、各被験者について、第1時点のBMDと第2時点のBMDとから、前述した数式1により「経過観察期間内のBLR」を算出しデータ取得する。
【0099】
図9に示す、各被験者の他の臨床情報正規化ステップS22では、
図1を用いて説明したステップS32と同様に、各被験者の他の臨床データを正規化する。第1時点のBMDと、第2時点のBMDとは、同様に正規化してもよいが、推測・予測精度向上の観点では、正規化しないでBMD計測値のままにしておくのが好ましい。
【0100】
図9に示すBLR学習ステップS24では、各被験者の他の臨床情報に含まれる1種以上の他の臨床データと、各被験者の第1時点のBMDとをそれぞれ入力変数(独立変数)とし、各被験者の第2時点のBMDと、各被験者の経過観察期間内のBLRとを出力変数(従属変数)とし、入力変数と出力変数との関係をANNに機械学習させる。推測・予測精度向上の観点から、各被験者の他の臨床情報における例えば2種以上又は3種以上、好ましくは4種以上又は5種以上、更に好ましくは6種以上又は7種以上の他の臨床データを、入力変数に含めて機械学習させるのが望ましい。このような機械学習により、BLR(予測値)を出力可能な学習モデルが生成される。ステップS24について、その他の事項は、
図1に示す骨折学習ステップS34aでの説明と同様である。
【0101】
図9に示すBLR学習後選別ステップS25では、先のステップS24で複数の学習モデルを生成した場合、推測・予測精度向上のために、各学習モデルで精度の高さを検証し、推測・予測精度が高い学習モデルを選定してもよい。先のステップS24で生成した学習モデルが1つのみの場合や、精度がある程度あれば充分な場合、ステップS25を省略してもよい。ステップS25について、その他の事項は、
図1に示す骨折学習後選別ステップS35での説明と同様である。
【0102】
図9に示すステップS21乃至S25を経て、BLR(予測値)を出力可能な学習モデルが生成される。この学習モデルでは、経過観察期間内のBLR(予測値)と共に、第2時点のBMD(予測値)も出力可能である。この学習モデルは、本願に係る発明者が以前に開発したものであり、詳細は特許文献1を参照する。
【0103】
各被験者の臨床情報及び判定結果取得ステップS31cでは、骨折スコアを出力可能な学習モデルの生成に適した学習データセットを作成するために、複数名の閉経後女性を被験者らとする。ここで選定される各被験者は、前述した骨折判定結果を既にデータ生成された閉経後女性である。このステップS31cで選定される被験者らは、先のステップS21で選定された被験者らと比べて、少なくとも一部の被験者が同一人でもよく、又は、同一人が一人もいなくてもよい(全ての被験者が別人でもよい)。
【0104】
また、各被験者の臨床情報及び判定結果取得ステップS31cでは、該ステップS31cで選定した各被験者の第1時点における臨床情報と、各被験者での骨折判定結果とを取得する。ここで取得する各被験者の臨床情報には、
図1を用いて説明したステップS31aと同様に4種以上の臨床データが含まれるが、この4種以上のうちに、前記BMD予測値、前記BLR予測値及びこれらのいずれかを間接的に示すデータからなる群より選ばれた1種以上の臨床データが含まれる。先のステップS21で選定された被験者らと、ステップS31cとで、選定された被験者らのうち少なくとも一部の被験者が同一人である(重複している)場合、先のステップS21で取得した1種以上の他の臨床データと全く同じデータについては、ステップS31cで4種以上の臨床データとして改めて取得することは特に要さない。全く同じデータである場合、1種以上の他の臨床データから4種以上の臨床データへ流用すればよい。その他の事項について、
図9に示すステップS31cは、
図1を用いて説明したステップS31aと同様である。
【0105】
図9に示す各被験者の臨床情報正規化ステップS32は、
図1を用いて説明したステップS32と同様でよい。
【0106】
図9に示す各被験者の骨折スコア算出ステップS33cは、
図1を用いて説明したステップS33aと比べて、次に説明する事項が異なる。
図9に示す各被験者の骨折スコア算出ステップS33cでは、5種以上の観測変数のうちの1種として各被験者の骨折判定結果を選定し、残る4種以上の観測変数のうちには、前記BMD予測値、前記BLR予測値及びこれらのいずれかを間接的に示すデータからなる群より選ばれた1種以上の臨床データが少なくとも含まれる。その他は、
図1を用いて説明したステップS33aと同様に共分散構造分析を行い、各被験者の骨折判定結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータを算出し、該データを各被験者の骨折スコアとして扱う。5種以上の観測変数に、前記BMD予測値を含めるが、前記BLR予測値を含めない場合、予測精度向上の観点から、5種以上の観測変数に「経過観察期間の長さ」も含めるのが好ましい。以上に説明した学習データセット作成方法S30cでは、骨折スコアを出力可能な学習モデルの生成に適した学習データセットを作成しやすい。
【0107】
学習モデル生成方法S20cでは、上記した学習データセット作成方法S30cの後、さらに、骨折学習ステップS34cと、骨折学習後選別ステップS35とを含み得る。
図1を用いて説明したステップS34aと比べて、
図9に示す骨折学習ステップS34cでは、次に説明する事項が異なる。
図9に示す骨折学習ステップS34cでは、入力変数とする各被験者の4種以上の臨床データのうちに、前記BMD予測値、前記BLR予測値及びこれらのいずれかを間接的に示すデータからなる群より選ばれた1種以上の臨床データを少なくとも含まれる。また、出力変数として、先のステップS33cで算出された骨折スコア(潜在変数の因子得点)を入力し、入力変数と出力変数との関係をANNに機械学習させ、骨折スコアを出力可能な学習モデルを1つ以上生成する。入力変数として各被験者について、前記BMD予測値を含めるが、前記BLR予測値を含めない場合、推測・予測精度向上の観点から、入力変数のデータ項目の1種として、各被験者の「経過観察期間の長さ」も含めるのが好ましい。
【0108】
図9に示す骨折学習後選別ステップS35は、
図1を用いて説明したステップS35と同様でよい。
【0109】
図9に示す学習モデル生成方法S20cでは、
図1を用いて説明した学習モデル生成方法S20aと比べて、共分散構造分析での5種以上の観測変数と機械学習での4種以上の入力変数との各々に、前記BMD予測値、前記BLR予測値及びこれらのいずれかを間接的に示すデータからなる群より選ばれた1種以上の臨床データが含まれており、骨折の予測精度が更に高まりやすい。このため、
図9に示すステップS21乃至S25、S31c、S32及びS33cの組み合わせは、骨折スコアを出力可能な学習モデル生成に更に適した学習データセット作成方法S30cとして機能させやすい。
【0110】
骨折スコア出力方法S15cは、
図1を用いて説明した骨折スコア出力方法S15aと概ね同様に構成されているが、次に説明する事項が異なる。
図9に示す骨折スコア出力方法S15cでは、BLR(予測値)を出力可能な学習モデルと、骨折スコアを出力可能な学習モデルとを併用する。骨折スコア出力方法S15cは、前述したステップS21乃至S25、S31c、S32、S33c、S34c及びS35を含み得る方法であり、さらに、対象者の臨床情報取得ステップS41cと、対象者の臨床情報正規化ステップS42と、対象者の骨折スコア出力ステップS43cとを含み得る。
【0111】
対象者の臨床情報取得ステップS41cは、
図1を用いて説明したステップS41aと概ね同様であるが、次に説明する事項が異なる。
図9に示す対象者の臨床情報取得ステップS41cでは、前述した対象者の第1時点における臨床情報に含まれる4種以上の臨床データを取得する際、前記BMD予測値及び前記BLR予測値の少なくとも一方を含めてデータ取得する。これら予測値データは、対象者の第1時点のBMDと、対象者の第1時点における他の臨床情報とを、BLR(予測値)を出力可能な学習モデル(例えば特許文献1に記載された学習モデル)に入力すると出力され得る。この入力のために、対象者の臨床情報取得ステップS41cでは、対象者の第1時点のBMDと、対象者の他の臨床情報(第1時点での年齢、第1時点での身長、第1時点での体重、第1時点でのBMI、初経年齢、閉経年齢、閉経時から第1時点までの経過年数、第1時点での体脂肪率、第1時点での除脂肪体重、第1時点での体脂肪量及びこれらのいずれかを間接的に示すデータからなる群より選ばれた1種以上の他の臨床データ)と、を取得してもよい。なお、対象者の臨床情報に含まれる4種以上の臨床データと、対象者の他の臨床情報に含まれる1種以上の他の臨床データとの間で、重複するデータ項目がある場合、重複するデータは互いに流用してもよい。両者の間で重複する可能性があるデータ項目は、第1時点での年齢、第1時点での身長、第1時点でのBMI、初経年齢、閉経年齢、閉経時から第1時点までの経過年数、又はこれらのいずれかを間接的に示すデータである。
【0112】
図9に示す対象者の臨床情報正規化ステップS42は、
図1を用いて説明したステップS42と同様である。
【0113】
図9に示す対象者の骨折スコア出力ステップS43cは、
図1を用いて説明したステップS43aと概ね同様であるが、次に説明する事項が異なる。
図9に示すステップS43cでは、骨折スコアを出力可能な学習モデルに、対象者の第1時点における臨床情報に含まれる4種以上の臨床データを適用する際、少なくとも、前記BMD予測値、前記BLR予測値及びこれらのいずれかの正規化後データからなる群より選ばれた1種以上の臨床データを適用(学習モデルの入力層に入力)する。
【0114】
以上に説明した骨折スコア出力方法S15cでは、骨折スコアを出力可能な学習モデルに適用する対象者の臨床情報に、前記BMD予測値、前記BLR予測値及びこれらのいずれかの正規化後データから選ばれた1種以上の臨床データが含まれており、経過期間内で新規骨折の有無又は経過観察期間内での新規骨折の骨折数に関する予測結果について高精度な指標となる骨折スコアが出力されやすい。骨粗鬆症による骨折の推測・予測方法S10cでは、骨折スコア出力方法S15cに加えて、さらに、
図1を用いて説明した結果出力ステップS45と同様にしてステップS45を実施してもよい。
【0115】
簡便に実施可能な観点では、
図9に示す骨折スコア出力方法S15cや骨粗鬆症による骨折の推測・予測方法S10cにおけるステップS21乃至S25、S31c、S32、S33c、S34c及びS35に代えて、
図7に示すように、学習モデル生成方法(
図9、S20c)により予め生成された、骨折スコアを出力可能な学習モデルを準備するステップS29dを含む、骨折スコア出力方法S15dや骨粗鬆症による骨折の推測・予測方法S10dが好ましい。このステップS29dでは、予め生成された、BLR(予測値)を出力可能な学習モデルも準備するのが好ましい。
【0116】
実施形態2に係る骨折スコアを出力可能な学習モデルは、前述した実施形態1に係る学習モデルと概ね同様に構成されているが、以下に説明する事項が異なる。実施形態2に係る学習モデルは、その機械学習の際に
図4に例示する入力層52に入力される各被験者の臨床情報に含まれる4種以上の臨床データのうちに、前記BMD予測値、前記BLR予測値及びこれらのいずれかを間接的に示すデータからなる群より選ばれた1種以上の臨床データが少なくとも含まれる。また、対象者の骨折スコアを出力する際、入力層52に入力される対象者の臨床情報における4種以上の臨床データのうちに、前記BMD予測値、前記BLR予測値及びこれらのいずれかの正規化後データからなる群より選ばれた1種以上の臨床データが含まれる。ここで述べた予測値のデータは、例えばBLR(予測値)を出力可能な学習モデルにより、出力し取得可能なデータである。
【0117】
図7に示す骨折スコア出力方法S15dや骨粗鬆症による骨折の推測・予測方法S10dを実施するユーザは、
図10に例示する、骨折スコアを出力可能な学習モデル72を有する情報処理装置61aと、BLR(予測値)を出力可能な学習モデル77を有する情報処理装置61cと、少なくとも1つのユーザ端末81と、を備える骨折推測・予測システム60cを使用してもよい。情報処理装置61aとユーザ端末81とは、
図8を用いて既に説明したように構成されてもよい。
【0118】
図10に示す情報処理装置61cは、制御部62c、表示部63c、入力部64c及び記憶部70cを備えてもよく、これらの構成はこの順で、前述した情報処理装置61aの制御部62a、表示部63a、入力部64a及び記憶部70aと概ね同様に構成されていてもよい。記憶部70cには、プログラム71cと、BLR(予測値)を出力可能な学習モデル77とが記憶されている。記憶部70cに、さらに、BLR(予測値)を出力可能な学習モデル77の機械学習に用いた、被験者らのBLR学習データベース78が記憶されていてもよい。情報処理装置61cには、情報処理装置61aにおける第2の通信部66aとの間で他の通信ネットワーク85を介してデータ送受信可能なように、通信部66cが備えられてもよい。通信部66cは、第2の通信部66aと同様に構成されてもよい。他の通信ネットワーク85は例えば、病院内イントラネットでもよい。
【0119】
上記した骨折推測・予測システム60cを使用するユーザは、例えば、ユーザ端末81に、対象者の臨床情報に含まれる4種以上の臨床データと、対象者の第1時点のBMDと、対象者の他の臨床情報に含まれる1種以上の他の臨床データとを入力してもよい。入力された臨床情報、第1時点のBMD及び他の臨床情報は、ユーザ端末81の通信部から送信され、通信ネットワーク80を介して情報処理装置61aの第1の通信部65aで受信されてもよい。受信された対象者の臨床情報、第1時点のBMD及び他の臨床情報のうち、第1時点のBMD及び他の臨床情報は、第2の通信部66aから送信され、他の通信ネットワーク85を介して情報処理装置61cの通信部66cで受信され、BLR(予測値)を出力可能な学習モデル77に入力されることにより、対象者について、前記BMD予測値、前記BLR予測値及びこれらのいずれかの正規化後データからなる群より選ばれた1種以上のデータが出力されるように、2つの情報処理装置(61a及び61c)を機能させてもよい。BLR(予測値)を出力可能な学習モデルにより出力された予測値又はその正規化後データは、情報処理装置61cの通信部66cから送信され、他の通信ネットワーク85を介して情報処理装置61aの第2の通信部66aで受信された後、対象者の臨床情報に含まれる4種以上の臨床データの一部として、骨折スコアを出力可能な学習モデル72に入力され、対象者の骨折スコアが出力されるように2つの情報処理装置(61a及び61c)を機能させてもよい。出力された骨折スコアは、情報処理装置61aの第1の通信部65aから送信され、通信ネットワーク80を介してユーザ端末81で受信されるように機能させてもよい。ユーザ端末81で受信した対象者の骨折スコアと、骨折スコアの閾値との比較結果に基づき、対象者の第1時点での既存骨折の有無を示す推測結果又は経過観察期間内での新規骨折の有無を示す予測結果を出力する処理を実行するように、ユーザ端末81を機能させてもよい。骨折スコアの閾値や、参考資料として前述の三次元グラフ(
図5及び
図6、90a乃至90f)が、ユーザ端末81の記憶部に予め記憶されていてもよく又は情報処理装置61aからユーザ欄末81へデータ送信されてもよい。
【0120】
図示しないが、骨折スコアを出力可能な学習モデルを有する情報処理装置と、BLR(予測値)を出力可能な学習モデルを有する情報処理装置とは、同じ一つの情報処理装置でもよい。例えば、骨折スコアを出力可能な学習モデルと、BLR(予測値)を出力可能な学習モデルとは、同じ1つの情報処理装置の記憶部に記憶され、この情報処理装置に対象者の臨床情報、第1時点のBMD及び他の臨床情報が入力される場合、2つの学習モデルが連動して対象者の骨折スコアを出力するように構成されていてもよい。
【0121】
本願に係る発明者は、本発明を完成させる過程で、骨粗鬆症による骨折の推測・予測について次のように考えた。従来、骨粗鬆症による骨折について、未来の新規骨折の予測が困難で、且つ、レントゲン撮影等による骨の画像なしでは既存骨折の推測が困難である理由としては、骨粗鬆症による骨折との間で高い相関関係を有する指標が、発見されていないことが考えられる。そのような指標が、閉経後女性ごとに個人差ある体質(遺伝的素因、環境要因)に潜在しているのか又は実在していないのか、明らかでない。この考えに基づき、本願に係る発明者は、共分散構造分析に着目した。従来、共分散構造分析は、社会学、心理学又はマーケティング等の分野で、幾つかの未知の因子が含まれる複雑な問題の分析に活用されていた(例えば特許文献3参照)が、臨床医学分野で合併症発生と体質との因果関係を説明するために有効活用された前例は、ほとんどなかった。臨床医学では、複数の臨床的指標の間に複雑な関連性が存在する場合があり、骨粗鬆症による骨折の推測・予測に共分散構造分析を活用できる可能性があると考えた。そこで、閉経後女性の体質に「骨粗鬆症による骨折の発生に対して直接的に有意な因果関係を有する未知の指標」が潜在しているものと仮想し(そのような指標が実在していなくてもよい)、ここで「骨粗鬆症による骨折の発生」を「骨折判定結果」に置き換え且つ「未知の指標」を「潜在変数」に置き換えて、共分散構造分析により「骨折判定結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数」の因子得点を算出することを考えた。その上で、算出された潜在変数の因子得点(各被験者の骨折スコア)を含む学習データセットにより、ANNに機械学習させ、骨折スコアを出力可能な学習モデルを生成し、該学習モデルに対象者の骨折スコアを出力させることを考え、本発明を完成させるに至った。
【0122】
なお、本発明とは異なり、共分散構造分析は行うが機械学習を行わない場合、新規な対象者について骨折スコアを出力できない欠点がある。また、骨粗鬆症により骨折を生じる様々な要因が詳細には解明されていない現状で、前述した「未知の指標」が具体的には何であるか不明であり、この未知の指標に該当するデータ(つまり、骨折スコアに該当するデータ)を各被験者で実測するのは不可能と考えられる。このため、本発明とは異なり、共分散構造分析で算出される潜在変数の因子得点(各被験者の骨折スコア)を学習データセットに含めることなく機械学習を行う場合、各被験者で実測可能なデータ及び骨折判定結果のみを学習データセットとして、機械学習を行うことになる。しかし、骨折の有無に関する骨折判定結果そのものは、例えば「骨折あり」の場合は1.0、「骨折なし」の場合は0というように、不連続なデータである。骨折数に関する骨折判定結果そのものも、0以上の整数に限られ、不連続なデータである。そのように不連続なデータを出力変数とする機械学習で生成される学習モデルでは、骨折判定結果との間で高い相関関係を有するスコアを出力不可能という欠点がある。つまり、本発明では、共分散構造分析と機械学習との組み合わせにより、両者それぞれの欠点を互いに補完させ、新規な対象者の骨折スコアを学習モデルにより出力可能なのである。
【0123】
<合併症のリスク因子推定方法>
前述した
図5(a)、
図5(b)、及び、
図6(c)乃至
図6(f)では、第1軸(Z軸)で骨折スコアの値を示す三次元グラフにおいて、応答曲面法により生成される応答曲面(92a乃至92f)に骨折スコアの値が閾値表示95(カットオフ値)よりも高値となる骨折リスク陽性の予測領域99が形成される場合に、その三次元グラフの第2軸(X軸)に示される臨床データと第3軸(Z軸)に示される臨床データとの組み合わせが、骨粗鬆症という病気の合併症の一種である骨折を発生させるリスク因子の組み合わせと推定され得ることを説明した。また、後述するように、それぞれ、試験例22では骨粗鬆症による新規骨折を発生させるリスク因子の組み合わせを推定でき、試験例23では骨粗鬆症による既存骨折数1を発生させるリスク因子の組み合わせを推定でき、試験例24では川崎病(KD)の合併症の1種である冠動脈拡大病変(CAL)を発生させるリスク因子の組み合わせを推定でき、試験例25ではIgA血管炎(IgAV)の合併症の1種である紫斑病性腎炎(PN)で高度蛋白尿を伴う症例を発生させるリスク因子の組み合わせを推定できた。これらの合併症はいずれも、発生の正確な作用機序が未だ不明で、従来は発生の推測・予測が難しかったにも関わらず、後述の試験例22乃至試験例25で合併症発生のリスク因子を推定可能であったことを考慮すると、試験例22乃至試験例25の手法は、多種多様な病気の様々な合併症に関して、合併症発生のリスク因子を探索可能又は推定可能な汎用性を有していると考えられる。このため、一実施形態に係る合併症のリスク因子推定方法において、リスク因子を探索又は推定しようとする合併症と、この合併症を誘発させる場合がある病気との組み合わせは、特に限定されないが、例えば次の例が挙げられる。
【0124】
上記した病気の例は、特に限定されないが、例えば、代謝疾患又は血管炎でもよく、骨代謝疾患又は血管炎でもよく、好ましくは、骨粗鬆症、川崎病又はIgA血管炎が挙げられる。一般的に骨粗鬆症で誘発され得る合併症としては、例えば、骨折、神経麻痺、歩行障害、逆流性食道炎、直腸膀胱障害又は廃用症候群等の後遺症が挙げられる。特に、骨粗鬆症の合併症としての廃用症候群は、筋肉の衰え、関節拘縮、心機能低下、起立性低血圧、血栓症、2次膀胱炎、鬱又はせん妄等を伴う場合があり、廃用症候群を発生させるリスク因子を探索し推定することは社会的意義が大きい。また、骨粗鬆症が、骨を形成するコラーゲンの遺伝子異常を伴う遺伝性骨粗鬆症である場合に、その合併症としては、緑内障、脳動脈瘤又は大動脈解離等の後遺症が挙げられる。川崎病の合併症としては、冠動脈拡大病変(CAL)、冠動脈瘤(CAA)、心筋炎、不整脈、心原性ショック、肝障害、腎障害又は脳症等の後遺症が挙げられる。なお、CALは冠動脈径計測値がZスコアで例えば2.0SD以上、2.5SD以上又は3.0SD以上となった病態で、CAAは冠動脈径計測値がZスコアで5.0SD以上又は10SD以上となった病態であり得る。CALには、心筋炎が先行して発生する症例もある。IgA血管炎で誘発され得る合併症としては、例えば、紫斑病性腎炎(PN)、PNで且つ高度蛋白尿を伴う症例、ネフローゼ又は腎不全等の後遺症が挙げられる。
【0125】
合併症のリスク因子を推定するには、病気に関する各受診者(各被験者)の臨床情報及び合併症発生スコア(潜在変数の因子得点)を含む学習データセットを作成し、該学習データセットにより、各受診者の臨床情報と各受診者の合併症発生スコア(潜在変数の因子得点)との関係をANNに機械学習させて、合併症発生スコアを出力可能な学習モデルを生成させる。このためには、各受診者(各被験者)としては、病気に関して診察された第1診察時点(第1時点)では合併症が発生していないことを診断され、且つ、第1診察時点(第1時点)を過ぎてから後の第2診察時点(第2時点)までの経過観察期間内での合併症の発生の有無を判定する診断をされた者を選定する。第1診察時点での各受診者は、病気に関して医療機関で受診し、第1時点でその病気に罹患していると診断された者でもよく又は第1時点で罹患していないと診断された者でもよい。第1診察時点は、例えば、各被験者が病気に関して入院後に一次(初回)治療を受けていない時点でもよく、その後に一次(初回)治療を受けている途中の時点も含まれてもよい。第1診察時点を過ぎてから第2診断時点までの経過期間の長さは、特に限定されず、リスク因子を探索又は推定しようとする合併症と、その合併症を誘発する場合がある病気との組み合わせに応じて、その病気で一般的に第1診察時点を過ぎてから合併症発生に至るまでにかかると考えられる期間よりも幾らか長い期間に設定すればよい。各受診者についてその他の事項は、前述の学習データセット作成方法(S30a、S30c)に関して説明した各被験者と同様でよい。
【0126】
合併症のリスク因子推定に関して、学習データセットを作成するための各受診者(各被験者)の臨床情報は、第1診察時点における各受診者に基づいて生成し取得可能な4種以上の臨床データを含む。ここでの4種以上の臨床データの各々は、リスク因子と推定されるか否かを探索し確認しようとする候補となる臨床データともいえる。例えば、合併症のリスク因子推定方法の実施者が、第1診察時点での各受診者に基づいて生成し取得可能な様々な臨床データのうちから「リスク因子と推定されるか否か探索する候補にしたい」と考える任意の臨床データを、4種以上選定して取得すればよい。様々な医療機関でリスク因子の推定方法を実施しやすい観点では、二次医療機(入院治療が可能な一般的な病院)の日常診療の現場で、一般的に取得されている様々な臨床データのうちから、4種以上の臨床データをリスク因子の候補として選定するのが好ましい。同様の観点から、4種以上の臨床データは、第1診察時点での各受診者に基づいて、身体計測、問診、体液(血液又は尿等)検査、及び、リスク因子を推定しようとする合併症やその原因となり得る病気の診断で一般的に使用される機器での測定、から選ばれた1種以上により得られるデータであるのが好ましい。
【0127】
病気が川崎病である場合に、各受診者の4種以上の臨床データは、例えば、性別、第1診察時点での月齢、第1診察時点での冠動脈径、第1診察時点での全身性血管炎マーカー検査値、第1診察時点での高サイトカイン血症マーカー検査値、第1診察時点での静注用免疫グロブリン(IVIG)不応予測スコア得点、一次治療で抗炎症療法を受けた回数、及びこれらを間接的に示すデータから選ばれた4種以上の臨床データであることが好ましい。冠動脈径は、左冠動脈主幹部、左冠動脈前下行枝近位部、左冠動脈回旋枝及び右冠動脈近位部から選ばれた1種以上の部位における冠動脈直径の最大値であることが好ましく、実測値をLMS法により変換したZスコアであることも好ましい。全身性血管炎マーカー検査値として例えば、赤血球沈降速度、血清補体価、又は、血中若しくは血清中の、ペントラキシンスーパーファミリー濃度、免疫複合体濃度、プロカルシトニン濃度、フィブリン分解産物濃度、及びこれらのいずれかに代用可能なマーカー検査値が挙げられる。ペントラキシンスーパーファミリーとして例えば、ペントラキシン-3、アミロイドP又はC反応性蛋白(CRP)等が挙げられる。高サイトカイン血症マーカー検査値としては、例えば、血中若しくは血清中の、TNF-α、インターフェロン、IL-1β、MCP-1若しくはIL-6等の抗炎症性サイトカイン濃度検査値、又は、尿中β2マイクログロブリン濃度等が挙げられ、簡便な観点では尿中におけるβ2マイクログロブリンのクレアチニンに対する濃度比(尿中β2MG/Cr)であるのが好ましい。IVIG不応予測スコア得点としては、例えば、小林スコア、江上スコア又は佐野スコアの得点が挙げられる。一次治療で抗炎症療法を受けた回数としては、例えば、アスピリン(登録商標)投与、IVIG投与、静注用メチルプレドニゾロンパルス(IVMP)投与、プレドニゾロン(PSL)投与、インフリキシマブ投与、ウリナスタチン投与、シクロスポリンA(CsA)投与及び血症交換から選ばれた1種以上の処置を受けた回数が挙げられる(詳細は特許文献2参照)。
【0128】
病気がIgA血管炎である場合に、各受診者の4種以上の臨床データは、第1診察時点での月齢、第1診察時点での全身性血管炎マーカー検査値、第1診察時点での腹痛の有無、第1診察時点での即時性アレルギー疾患の有無、第1診察時点での血中IgA検査値、第1診察時点での血中IgE検査値、初回治療で抗炎症療法を受けた回数、及びこれらを間接的に示すデータから選ばれた4種以上の臨床データであることが好ましい。ここでの全身性血管炎マーカー検査値は、川崎病での4種以上の臨床データの説明で述べた全身性血管炎マーカー検査値でもよいが、血中におけるフィブリン分解産物であるDダイマー(血中FDP・Dダイマー)濃度検査値であるのが好ましい。即時型アレルギー疾患として例えば、アナフィラキシーショック、アレルギー性鼻炎、結膜炎、気管支喘息、蕁麻疹又はアトピー性皮膚炎等が挙げられる。初回治療で抗炎症両方を受けた回数としては、例えば、PSL投与、IVMP投与、シクロホスファミド投与、アザチオプリン投与、ミコフェノール酸モフェチル投与、CsA投与及び血漿交換から選ばれた1種以上の処置を受けた回数が挙げられる(詳細は特許文献2参照)。
【0129】
学習データセットに含まれる各受診者の合併症発生スコアは、各受診者での経過観察期間内での合併症の発生の有無に関する判定の結果と、各受診者の4種以上の臨床データと、を含む合計5種以上の観測変数を設けて共分散構造分析を行い、判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである。その他、前述の学習データセット作成方法(S30a、S30c)や、学習モデル生成方法(S20a、S20c)と同様にして、共分散構造分析及び機械学習を行い、合併症発生スコアを出力可能な学習モデルを生成可能であり、好ましい事項も前述の方法(S20a、S20c、S30a、S30c)と同様である。共分散構造分析の演算を行う際、パスモデルが収束しにくい場合には、観測変数とする4種以上の臨床データの組み合わせを、適宜、他の4種以上の臨床データの組み合わせに変更し、パスモデルについてベイズ法による標準化総合効果の平均値が0.3以上又は0.4以上となり、好ましくは0.5以上のなるべく高値となり、且つ、この平均値のp値が例えばp<0.05となる組み合わせ、好ましくはp<0.01となる組み合わせを探せばパスモデルを収束可能である。例えばAMOS等、共分散構造分析を実施可能な市販の統計ソフトウェアには、ベイズ法による検定機能が実装されているものがある。また、リスク因子を推定しようと試みる病気の合併症に関する学術論文(いわゆるエビデンス)を幾つか読むと、その合併症を発生させる可能性が高いと考えられるリスク因子の候補に適した4種以上の臨床データの組み合わせを比較的見出しやすく、そのような4種以上の臨床データの組み合わせを観測変数として共分散構造分析を行えば、パスモデルが比較的収束しやすい。合併症発生スコアのカットオフ値は、後述の試験例1-1で説明するROC解析により算出可能である。
【0130】
また、前述の
図5(a)、
図5(b)、及び、
図6(c)乃至
図6(f)について説明した手法と同様にして、合併症発生スコアを出力可能な学習モデルに基づいて、応答曲面法により、受診者らの臨床情報と受診者らの合併症発生スコアとの関係を示す応答曲面を生成し、生成される応答曲面に合併症発生リスク陽性領域が含まれる場合には、推定されるリスク因子を特定する処理を情報処理装置に実行させることで、合併症の発生について推定されるリスク因子の組み合わせを探索可能である。生成された応答曲面と、合併症発生スコアのカットオフ値を示す閾値表示と、受診者らの合併症発生スコアの値を示す第1軸と、4種以上の臨床データから選択された1種の臨床データの値を示す第2軸と、4種以上の臨床データから選択された他の1種の臨床データの値を示す第3軸とを含む三次元グラフを情報処理装置に作成させることができる。該三次元グラフに含まれる応答曲面において、合併症発生スコアがカットオフ値よりも高値である合併症発生リスク陽性の予測領域が形成されている場合には、その場合の三次元グラフにおいて、第2軸が示す選択された1種の臨床データと、第3軸が示す選択された他の1種の臨床データとの組み合わせは、合併症発生のリスク因子として推定される組み合わせである。推定されたリスク因子の組み合わせは、新規受診者の体質に合わせて、新規受診者で今後の合併症発生を避けるテーラーメイド医療の方針決定に活用可能である。三次元グラフは、新規受診者に対して、今後の合併症発生を避けるための早期予防・治療方針の説明資料として活用可能である。
【0131】
合併症発生のリスク因子として推定される有用な臨床データの組み合わせを探索する観点から、本来は5次元以上のグラフに描かれるはずの応答曲面の全体像に対して、第2軸及び第3軸の各々で選択される1種の臨床データの組み合わせを変更した三次元グラフを、多数作成するのが好ましい。作成した三次元グラフごとに、グラフ中において、応答曲面とカットオフ値との位置関係や、応答曲面における合併症発生スコア最大値の高さは、異なっている。多数作成した三次元グラフのうちから、応答曲面における合併症発生スコア最大値が大きいものから順に順位付けし、順位が高い三次元グラフほど、その三次元グラフの第2軸及び第3軸の各々で示す選択された臨床データの組み合わせは、合併症発生のリスク因子として有用と推定される組み合わせとなる。このため、合併症発生スコアを出力可能な学習モデルに基づいて、リスク因子として有用と推定される臨床データの組み合わせを順位付けする処理を情報処理装置に実行させることが、好ましい。
【0132】
本明細書により開示されるものには、以下のものが含まれる。
(1)
閉経後である第1時点での骨粗鬆症による既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記第1時点を過ぎてから後の第2時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上に関する骨折スコアを出力する方法であって、
前記骨折スコアを出力可能な学習モデルに対象者の前記第1時点での臨床情報を入力して前記対象者の前記骨折スコアを出力する処理を情報処理装置に実行させるステップを含み、
前記骨折スコアを出力可能な学習モデルは、前記第1時点での前記既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記経過期間内での前記新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上を判定された各被験者の前記第1時点での前記臨床情報を入力されると、前記各被験者の前記骨折スコアを出力するように機械学習したものであり、
前記第1時点での前記臨床情報は、年齢、身長、体重、BMI、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第1時点までの年数、前記経過期間の長さ、FRAX(登録商標)による骨折リスク評価結果、前記第2時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータからなる群より選ばれる4種以上の臨床データを含み、
前記各被験者の前記骨折スコアは、前記判定の結果と、前記各被験者の前記4種以上の臨床データと、を含む5種以上の観測変数が設けられ共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである、骨折スコア出力方法。
(2)
前記骨量減少率予測値は、骨量減少率を出力可能な学習モデルに前記第1時点での骨密度と前記第1時点での他の臨床情報とを入力して前記骨量減少率予測値を出力する処理を情報処理装置に実行させて出力される臨床データであり、
前記骨量減少率を出力可能な学習モデルは、前記第1時点と前記第2時点とで骨密度を計測された各被験者についての、前記第1時点での骨密度と、前記第1時点での前記他の臨床情報とを入力されると、前記第2時点での骨密度と、前記経過期間内での骨量減少率とを出力するように機械学習したものであり、
前記第1時点での前記他の臨床情報は、年齢、身長、体重、BMI、体脂肪率、除脂肪体重、体脂肪量、初経年齢、閉経年齢、閉経時から前記第1時点までの年数、及び、これらのいずれかを間接的に示すデータから選ばれた1種以上の他の臨床データを含む、前記(1)に記載された骨折スコア出力方法。
(3)
前記骨密度は、上腕骨近位部、橈骨遠位部、頚椎、胸椎、腰椎及び大腿骨近位部から選ばれた1箇所以上の身体部位における少なくとも一部の領域についてのものである、前記(1)に記載された骨折スコア出力方法。
(4)
前記(1)乃至(3)のいずれかに記載された骨折スコア出力方法により前記対象者の前記骨折スコアを出力し、出力された前記対象者の前記骨折スコアと前記骨折スコアの閾値との比較結果に基づいて、前記対象者についての、前記第1時点での前記既存骨折の有無の推測結果、前記第1時点での前記既存骨折の骨折数の推測結果、前記経過期間内での前記新規骨折の有無の予測結果、及び、前記経過期間内での前記新規骨折の骨折数の予測結果から選ばれた1種以上に関する結果データを出力する処理を情報処理装置に実行させる、骨粗鬆症による骨折の推測及び予測の少なくとも一方の方法。
(5)
閉経後である第1時点での骨粗鬆症による既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記第1時点を過ぎてから後の第2時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上を判定された各被験者の前記第1時点での臨床情報が入力されると前記各被験者の骨折スコアを出力する学習モデルを、機械学習により生成するステップを含み、
前記第1時点での前記臨床情報は、年齢、身長、体重、BMI、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第1時点までの年数、前記経過期間の長さ、FRAX(登録商標)による骨折リスク評価結果、前記第2時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータから選ばれた4種以上の臨床データを含み、
前記各被験者の前記骨折スコアは、前記判定の結果と、前記4種以上の臨床データと、を含む5種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである、学習モデル生成方法。
(6)
閉経後である第1時点での骨粗鬆症による既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記第1時点を過ぎてから後の第2時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上に関する骨折スコアを出力可能な学習モデルであって、
前記学習モデルは、前記第1時点での前記既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記経過期間内での前記新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上を判定された各被験者の前記第1時点での臨床情報が入力されると前記各被験者の前記骨折スコアを出力するように重み付け値が機械学習されたものであり、且つ、対象者の前記第1時点での前記臨床情報が入力される場合には前記対象者の前記臨床情報に対して前記重み付け値に基づく演算を行って前記対象者の前記骨折スコアを出力するように情報処理装置を機能させるものであり、
前記第1時点での前記臨床情報には、年齢、身長、体重、BMI、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第1時点までの年数、前記経過期間の長さ、FRAX(登録商標)による骨折リスク評価結果、前記第2時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータから選ばれた4種以上の臨床データを含み、
前記各被験者の前記骨折スコアは、前記判定の結果と、前記各被験者の前記4種以上の臨床データと、を含む5種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである、学習モデル。
(7)
前記(6)に記載された学習モデルに基づいて、応答曲面法により、前記各被験者を含む被験者らの前記臨床情報と前記被験者らの前記骨折スコアとの関係を示す応答曲面を生成し、生成される前記応答曲面に骨折リスク陽性領域が含まれている場合には、推定されるリスク因子を特定する処理を情報処理装置に実行させるステップを含み、
前記骨折リスク陽性領域は、前記学習モデルに基づいて、前記骨折スコアの値を示す第1軸と前記4種以上の臨床データから選択された1種の臨床データの値を示す第2軸とを有し且つ前記応答曲面と前記骨折スコアのカットオフ値との関係を示す二次元グラフ又は三次元グラフを作成する処理を情報処理装置に実行させる場合に、作成される前記二次元グラフ又は前記三次元グラフに含まれる前記応答曲面において前記骨折スコアの値が前記カットオフ値よりも高値となる部分の領域であり、
前記推定されるリスク因子は、少なくとも、前記第2軸における前記選択された1種の臨床データの値に関するものである、骨粗鬆症による骨折のリスク因子推定方法。
(8)
前記対象者の前記第1時点での前記臨床情報を取得し、取得した該臨床情報を前記(6)に記載された学習モデルに入力して前記対象者の前記骨折スコアを出力する処理を情報処理装置に実行させるプログラム。
(9)
前記学習モデルが記憶される記憶部と、
前記対象者の前記第1時点での前記臨床情報を取得した場合に、所得した該臨床情報を前記学習モデルに入力して前記対象者の前記骨折スコアを出力する処理を実行する演算部と、
を備える、前記(6)に記載された学習モデルを有する情報処理装置。
(10)
閉経後である第1時点での骨粗鬆症による既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記第1時点を過ぎてから後の第2時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上を判定された各被験者の前記判定の結果と、前記各被験者の前記第1時点での4種以上の臨床データと、を含む5種以上の観測変数を設けて共分散構造分析を行い、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータを取得するステップを含み、
前記第1時点での前記4種以上の臨床データは、年齢、身長、体重、BMI、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第1時点までの年数、前記経過期間の長さ、FRAX(登録商標)による骨折リスク評価結果、前記第2時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータから選ばれる、学習データセット作成方法。
(11)
病気に関する受診者らの臨床情報に基づいて、前記病気で発生する場合がある合併症のリスク因子を推定する方法であって、
前記受診者らに含まれる各受診者は、前記病気に関して診察された第1診察時点では前記合併症が発生していないことを診断され、且つ、前記第1診察時点を過ぎてから後の第2診察時点までの経過観察期間内での前記合併症の発生の有無を判定する診断をされた者であり、
前記方法は、前記各受診者の臨床情報が入力されると前記各受診者の合併症発生スコアを出力するように機械学習した学習モデルに基づいて、応答曲面法により前記受診者らの前記臨床情報と前記受診者らの前記合併症発生スコアとの関係を示す応答曲面を生成し、生成される前記応答曲面に合併症発生リスク陽性領域が含まれる場合には推定されるリスク因子を特定する処理を情報処理装置に実行させるステップを含み、
前記各受診者の前記臨床情報は、前記第1診察時点における前記各受診者に関する4種以上の臨床データを含み、
前記各受診者の前記合併症発生スコアは、前記各受診者の前記判定の結果と、前記各受診者の前記4種以上の臨床データと、を含む5種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータであり、
前記合併症発生リスク陽性領域は、前記学習モデルに基づいて、前記合併症発生スコアの値を示す第1軸と前記4種以上の臨床データから選択された1種の臨床データの値を示す第2軸とを有し且つ前記応答曲面と前記合併症発生スコアのカットオフ値との関係を示す二次元グラフ又は三次元グラフを作成する処理を情報処理装置に実行させる場合に、作成される前記二次元グラフ又は前記三次元グラフに含まれる前記応答曲面において前記合併症発生スコアの値が前記カットオフ値よりも高値となる部分の領域であり、
前記推定されるリスク因子は、少なくとも、前記第2軸における前記選択された1種の臨床データの値に関するものである、合併症のリスク因子推定方法。
【0133】
本発明は、その趣旨を逸脱しない範囲で当業者の知識に基づいて種々なる改良、修正、又は変形を加えた態様でも実施できる。また、同一の作用または効果が生じる範囲内で、いずれかの発明特定事項を他の技術に置換した形態で実施してもよい。
【実施例0134】
以下に本発明の試験例などを説明するが、本発明は以下の試験例に限定されない。
【0135】
箕面市立病院は、大阪市郊外にある二次医療機関(入院治療可能な一般病院)で、骨粗鬆症外来を行っており、少なくとも本願出願当時には、多数の閉経後女性が定期的に検診を受けていた。本願に係る発明者は、この病院でオプトアウトを利用し、骨粗鬆症外来の受診者らのうち、初診時に記録された臨床データ項目数が比較的に多い受診者233名を被験者らとし、後ろ向き研究を行った。後ろ向き研究は、疾病の要因と発症との関連を調べる研究手法の一種である。研究開始時点から過去にふり返り、初診時(第1時点)に、「骨粗鬆症による既存骨折が生じていた」と判定された各受診者と、「骨粗鬆症による既存骨折は生じていなかった」と判定された各受診者とで、初診時の臨床データを比較した。同様に、2020年1月末の検診時(第2時点)に、「初診時(第1時点)から2020年1月末の検診時(第2時点)までの経過観察期間内に骨粗鬆症による新規骨折が生じた」と判定された各受診者と、「経過観察期間内に新規骨折が生じなかった」と判定された各受診者らとで、初診時の臨床データを比較し、骨折に至った要因を検証した。箕面市立病院の倫理審査委員会は、この研究を承認し、インフォームドコンセントの必要性を断念することも承認した。全ての方法は、ヘルシンキ宣言と関連性がある指針に従って実施した。
【0136】
本願に係る発明者は、骨粗鬆症による骨折のリスク因子として1)BMDが低値、2)骨代謝マーカー(骨代謝回転)検査値が高値、3)前記FRAX結果が高値、4)身長低下量が大きい又は低体重、5)閉経年齢が低い、6)生活習慣病(糖尿病、高脂血症又は慢性閉塞性肺疾患)罹患、及び7)腎機能低下(血中Cr検査値の上昇)の7種があると考えた。また、箕面市立病院の骨粗鬆症外来では、二次医療機関の骨粗鬆症検診で一般的に用いられる機器、手法及び市販の臨床検査キット等により、各受診者の身体計測、問診、DXAによる腰椎BMD計測、血液検査、尿検査、並びに、胸椎及び腰椎のレントゲン撮影による画像診断を行ってきた。受診者(被験者)233名について、初診時の検査等で取得した様々な臨床データから、上記7種の要因のうちの1種以上に関連し得る臨床データに基づくプロフィールを、次の表1に示した。
【0137】
【0138】
受診者233名に含まれる各受診者は、それぞれ第1時点(初診時)が異なるが、第2時点は2020年1月末の検診時で共通であった。受診者233名には、40歳未満で早期閉経した女性が十数名含まれ、初診時年齢75歳以上の女性が44名含まれていた。一部の受診者らからデータ取得できず、n数が233未満になった(つまり欠損値を含む)データ項目が幾つかあった。例えば、75歳以上の女性でFRAXに基づく診断を避けていたため、受診者44名では初診時の前記FRAX結果をデータ取得していなかった(233名-44名=189名)。受診者57名では、若年時の最大身長を忘れた等の理由で、初診時既存身長低下をデータ取得できなかった(233名-57名=176名)。受診者233名のうち、表1に示すデータ項目に欠損値がない受診者は141名であった。表1に示す初診時BLR予測値は、各被験者について、初診時の他の臨床データと、初診時及び2020年1月末の検診時の各々で計測したBMD計測値とを、本願に係る発明者が以前に生成したBLR(予測値)を出力可能な学習モデル(特許文献1の実施例1a)に入力し、該学習モデルにより出力されたデータである。
【0139】
この以前に生成した学習モデルは、和歌山県太一町の地域住民を被験者らとする疫学的研究(Taiji Cohort Study、非特許文献5乃至7参照)で取得された多数の臨床情報のうち、閉経後女性135名分の臨床情報において、1993年6月及び2003年6月の各々の検診時で得られた他の臨床データに基づき、三層型ANNに入力変数と出力変数との関係を機械学習させ生成した統計モデルである。この機械学習では、
図11に示すように、入力変数として入力層に、1993年6月検診時のBMD計測値は正規化せず入力し、1993年6月検診時における年齢、身長、体重、初経年齢、閉経年齢、閉経後経過年数(閉経時から1993年6月検診時までの経過年数)、体脂肪率、除脂肪体重及び体脂肪率の各々は、前述した数式3で正規化後に入力した。この機械学習の出力変数として、2003年6月検診時のBMD計測値と、1993年6月検診時から2003年6月検診時までの期間内のBLRと、を出力層に入力した。ここでのBMD計測値は、Hologic社製QDR-1000を用いたDXAによる腰椎L2からL4のBMD計測値であった。ここでのBLRは、1993年6月及び2003年6月の各々の検診時でのBMD計測値に基づき、前述した数式1により算出した(詳細は特許文献1参照)。つまり、表1に示す「初診時BLR予測値」は、箕面市立病院の受診者233名での初診時腰椎BMD計測値と、前述の数式3で正規化した他の臨床情報(初診時正規化年齢、初診時正規化身長、初診時正規化体重、初診時正規化BMI、正規化初経年齢、正規化閉経年齢、閉経時から初診時までの正規化経過年数、初診時正規化体脂肪率、初診時正規化除脂肪体重及び初診時正規化体脂肪率)を、予め生成した学習モデル(BLR(予測値)を出力可能な学習モデル)の入力層に入力して出力させた、各受診者の初診時から10年後までの期間内のBLR予測値データであった。
【0140】
受診者233名の胸椎及び腰椎の少なくとも一方に関して、初診時(第1時点)での骨粗鬆症による既存骨折の有無に関する判定結果(以下「既存骨折判定結果」ともいう)と、初診時(第1時点)から2020年1月末の検診時(第2時点)までの経過観察期間内での骨粗鬆症による新規骨折の有無に関する判定結果(以下「新規骨折判定結果」ともいう)とについて、箕面市立病院の骨粗鬆症外来で整形外科医を含む担当医らが一定基準で判定した結果を、次の表2に示した。これらの判定結果は、担当医らにより、「骨折あり」の場合は1.0と記録され、「骨折なし」の場合は0と記録された。「いつのまにか骨折」といわれるように、初診時に「既存骨折あり」と判定された49名では、この既存骨折が初診時よりも何年前に発生したものか不明で、初診時よりも10年以上前に発生していた可能性が考えられた。各受診者は、初診時から2020年1月末まで毎年1回は骨粗鬆症外来を受診しており、経過観察期間内に「新規骨折あり」と2020年1月末の検診時に判定された10名では、毎年の検診での電子カルテの記載から、「初診時(第1時点)よりも後の新規骨折発生時点から2020年1月末の検診時(第2時点)までの期間の長さ」が、平均5.5年程度と考えられた。
【0141】
【0142】
以下に記載する幾つかの試験例では、統計分析において、p<0.05である場合に統計的に有意と認め、0.05<p<0.10である場合に傾向があると認めた。スチューデントt検定又はχ2検定を行う際は、JMP(登録商標)version 8.0(SAS Institute Inc.製ソフトウェア)を用いた。SEMによる平均共分散構造分析は、AMOS23.0(IBM-SPSS社製)を用いて行った。平均共分散構造分析では、RMSEA値が0.080未満、且つ、パスモデルの適合に関するR2値が0.95を上回る場合に、統計学的有意性があり信頼できる統計モデルとした。RMSEA値が0.050未満で、CFI(comparative fit index)値が0.95よりも大きく、パスモデル適合に関するR2値が1.000である場合、更に統計的有意性があり信頼できる統計モデルと判断した。
【0143】
<試験例1-1>
各受診者について、骨粗鬆症による新規骨折の発生を予測可能か、共分散構造分析と機械学習との組み合わせにより検証した。このために、各受診者について表1に示す臨床情報のうち12種の臨床データを観測変数とし、表2に示す新規骨折判定結果も観測変数とした。次の表3に示すように合計13種の観測変数を選定し、
図12に示すパスモデルを作成した。このパスモデルでは、各被験者の新規骨折判定結果に係る観測変数に対して、直接的な因果関係を有すると仮定される潜在変数を設けた。このパスモデルを用いてSEMによる平均共分散構造分析の演算を実行し、潜在変数の因子得点を算出し、各受診者の骨折スコアとした。スチューデントt検定により、新規骨折判定結果と、骨折スコア(潜在変数の因子得点)との間で、統計的有意性を分析した。
図12に示すパスモデルでは、0.3を上回る相関係数とp<0.001という有意なp値とに基づいて、潜在変数と結果との間の標準化されたパスで最大の係数値を示した複数のパスを選定した。
【0144】
【0145】
図12に示すパスモデルの評価結果では、表3に示すように、RMSEA値が0.033で、AICが180で、CFIが0.991で、パスモデル適合に関するR
2値は1.000で、優れた適合(統計的有意性)が示された。このパスモデルで、潜在変数と「新規骨折判定結果に係る観測変数」との標準化パス係数は、標準化直接効果として1.67(p<0.001)であり、潜在変数から「新規骨折判定結果に係る観測変数」に対して直接的な有意な因果関係が認められた。このパスモデルで、標準化総合効果は0.448で、ベイズ法による標準化総合効果の平均値±標準誤差は0.409±0.0041(p<0.001)であった。
【0146】
図13に示すように、「新規骨折あり」と判定された受診者10名の骨折スコア(潜在変数の因子得点)は、「新規骨折なし」と判定された受診者223名の骨折スコア(潜在変数の因子得点)と比べて、著しく高値であった(p<0.0001)。このため、骨折スコアの高さに基づき、新規骨折判定結果を予測可能なことが示唆された。骨折スコアに基づき「新規骨折あり」又は「新規骨折なし」を判別するカットオフ値を決定するために、受信者動作特性(Receiver Operating Characteristic:以下「ROC」ともいう)解析を行った。ROC解析では、各被験者の骨折スコア(潜在変数の因子得点)を用いて「(潜在変数の感度)+(潜在変数の特異度)-1」の値を計算し、被験者らでの最大値が算出された場合に、その最大値の元になった被験者の骨折スコアの数値が、骨折スコアのカットオフ値(骨折スコアの閾値)となる。ROC解析で示されたカットオフ値は1.08であった。
【0147】
ANNによる機械学習では、パスモデル(
図12)で観測変数とした13種の臨床データから新規骨折判定結果を除き、残る12種の臨床データを選定した。
図14及び次の表4に示すように、この12種の臨床データ各々を数式3で正規化し、入力変数とした。出力変数は、SEMによる平均共分散構造分析で算出された、各受診者の骨折スコアとした。三層型ANNで、入力層に12種の入力変数を入力し、出力層で出力変数とした骨折スコアを出力するように機械学習させ、統計学的モデル(学習モデル)を生成した。この機械学習を繰り返して多数の学習モデルを生成する際、0.01、0.02及び0.04のオーバーフィットペナルティにより、中間層で2つから4つのノードが選定された。多数の学習モデルで、0.81以上のR
2値(r=0.9)と、五分割交差検証法のR
2値0.64(r=0.8)とが測定された。多数の学習モデルから、過学習のモデルを避け、R
2値が比較的に大きいモデルを1つ選定し、試験例1-1に係る学習モデルとした。この学習モデルでは、ノード数は3で、オーバーフィットペナルティは0.04で、五分割交差検証法によるR
2値は0.56であった。試験例1-1に係る学習モデルで、機械学習に用いた12種の入力変数を入力層に入力し、各受診者の骨折スコア(予測値)を出力させた。平均共分散構造分析により算出された骨折スコア(潜在変数の因子得点)と、試験例1-1に係る学習モデルにより出力された骨折スコア(予測値)とでは、
図15及び次の表4に示したように、関連性の高さとしてR
2=0.940という高値が示された。このため、学習モデルから出力された骨折スコア(予測値)は、潜在変数の因子得点と高度に相関しているといえる。
【0148】
【0149】
試験例1-1に係る学習モデルにより出力された各受診者の骨折スコア(予測値)について、カットオフ値(骨折スコアの閾値)1.08と比較し、カットオフ値以上の受診者を「新規骨折あり」と予測し、カットオフ値未満の受診者を「新規骨折なし」と予測する基準で、各被験者で新規骨折の有無を判別した。その結果、予測精度として、表4に示したように、C統計量(c-index)が0.865で、感度が83.3%(5/6)で、特異度が89.6%(121/135)であり、試験例1-1に係る学習モデルでは骨粗鬆症による新規骨折の有無を高精度に予測可能なことが示唆された。なお、平均共分散構造分析では、臨床データに欠損値が含まれている場合、他の臨床データどうしの関係から、欠損値に対して自動的に適当な値が代入され演算処理が実行される。一方、ANNや学習モデルでは、入力する臨床データに欠損値が含まれている受診者について、機械学習したり予測値を出力したりすることができない。このため、平均共分散構造分析では受診者ら233名全員について演算処理を実行したが、ANNや学習モデルでは、入力変数とする12種の臨床データに欠損値がない141名について機械学習し骨折スコアを出力した。
【0150】
<試験例1-2>
試験例1-1と比べて、前述の表2に示した「新規骨折判定結果」に代わり「既存骨折判定結果」データを用い、その他は同様にして検証した。
図16に示すパスモデルを作成し、平均共分散構造分析により骨折スコア(潜在変数の因子得点)を算出させた。試験例1-2で作成した場合のパスモデル(
図16)では、表3に示した評価がされ、優れた適合(統計的有意性)が示され、潜在変数から「既存骨折判定結果に係る観測変数」に対して直接的な有意な因果関係が認められた。
図17に示すように、「既存骨折あり」と判定された受診者49名の骨折スコアは、「既存骨折なし」と判定された受診者184名の骨折スコアと比べて、著しく高値であった(p<0.0001)。このため、骨折スコアの高さに基づき、既存骨折判定結果を推測可能なことが示唆された。ROC解析により算出された「既存骨折あり」又は「既存骨折なし」を判別するカットオフ値(骨折スコアの閾値)は0.27であった。
図18及び表4に示したように機械学習を繰り返し行い、生成された多数の学習モデルから過学習のモデルを避け、R
2値が比較的に大きいモデルを1つ選定し、試験例1-2に係る学習モデルとした。平均共分散構造分析で算出された骨折スコアと、試験例1-2に係る学習モデルにより出力された骨折スコア(推測値)とでは、
図19及び表4に示したように、関連性の高さとしてR
2=0.915という高値が示された。骨折スコア(推測値)とカットオフ値0.27との比較により、各受診者で既存骨折の有無を判別したところ、表4に示した推測精度であった。試験例1-2に係る学習モデルで骨粗鬆症による既存骨折の有無を高精度に推測可能なことが、示唆された。
【0151】
<参考試験例2>
受診者233名のうち初診時年齢が75歳未満である189名について、初診時の前記FRAX結果で骨折発生確率15%以上である場合に「新規骨折あり」と予測し、この確率が15%未満である場合に「新規骨折なし」と予測する条件で、FRAX(登録商標)による新規骨折判定結果の予測精度を検証したところ、次の表5に示す結果であった。FRAXと比べて、試験例1-1に係る学習モデルでは、予測精度が高いことが示唆された。
【0152】
【0153】
<参考試験例3>
受診者233名のうち臨床データに欠損値がない141名について、初診時年齢、初診時身長、初診時体重、初診時BMI、初診時身長低下、初診時の前記FRAX結果、初診時BLR予測値、初診時BMD計測値、閉経年齢、初経年齢、初診時血中Cr検査値及び初診時BAP検査値の臨床データを用い、SPSS version 23.0(IBM-SPSS社製ソフトウェア)の多変量ロジスチック回帰分析により新規骨折判定結果の予測精度を検証したところ、表5に示す結果であった。多変量ロジスチック回帰分析と比べて、試験例1-1に係る学習モデルでは、予測精度が高いことが示唆された。
【0154】
<再検証I>
再検証Iでは、実験例1-1及び実験例1-2の各学習モデルを臨床応用可能か、新たなデータセットで検証した。2020年2月以降に初めて箕面市立病院の骨粗鬆症外来を受診した閉経後女性(以下「新規受診者」ともいう)を、対象者とした。初診時(第1時点)が2020年2月から2021年1月末までの期間内である新規受診者27名について、次の表6に示す12種の臨床データと、既存骨折判定結果とを新たなデータセットに含めた。なお、この27名のうちで初診時年齢が75歳以上の者は4名であった。
【0155】
【0156】
新規受診者27名のうち、前述の担当医らに「既存骨折あり(骨折数1)」と判定された新規受診者は、3名であった。問診によると、初診前の骨折発生時から初診時までの期間の長さは、3名とも3年以内であった。この27名は、初診時から2021年1月末までの経過観察期間が1年未満と短く、経過観察期間内に「新規骨折が生じた」と担当医らに判定された新規受診者は、1名もいなかった。このため、新規受診者らで新規骨折判定結果の予測精度を再検証することはできなかった。代わりに、新規受診者27名のうちBLR予測値に欠損値がない23名で、既存骨折判定結果の推測精度を再検証した。
【0157】
試験例1-1及び試験例1-2の各学習モデルに対して、表6に示した12種の臨床データを前述の数式3で正規化後に入力した。試験例1-1の再検証では、試験例1-1に係る学習モデルにより出力された各新規受診者の骨折スコア(推測値)を、カットオフ値1.08と比較し、各新規受診者で既存骨折の有無を判別した。試験例1-2の再検証では、試験例1-2に係る学習モデルにより出力された各新規受診者の骨折スコア(推測値)を、カットオフ値0.27と比較し、各新規受診者で既存骨折の有無を判別した。これら再検証Iの結果を次の表7に示した。
【0158】
【0159】
表4と比べて表7で推測精度が低下したが、表7は各新規受診者(新規症例)での推測結果で、臨床応用を検討する上で学習モデルは許容可能な推測精度を有すると考えられる。表7から明らかなように、試験例1-2よりも試験例1-1の方が、意外にも、各新規受診者で既存骨折判定結果を高精度に推測でき、優れた汎用性を示した。その理由は不明だが、臨床経験上、骨粗鬆症患者に「1つ目の骨折発生時点から間もない時期ほど、2つ目の骨折が発生するリスクが高い」要素が潜んでいると考えられ、おそらく、試験例1-2よりも試験例1-1の方がこの要素を幾らか含めて学習できたことに因るものと考えられる。つまり、学習データセットの元になった受診者らで「初診時の何年前に生じた既存骨折か」を特定できず、試験例1-2の学習に「骨折の発生時点から初診時までの期間の長さ」要素があまり含まれず、且つ、この期間の長さが受診者らと新規受診者らとの間で大幅に異なるため、試験例1-2で各新規受診者に対する推測精度が低下しやすかったのであろうと考えられる。一方、試験例1-1の学習では、初診時から2020年1月末の検診時までの経過観察期間内での新規骨折の有無を出力したので、期間の長さの要素をある程度は学習し、各新規受診者に対して高い推測精度を発揮しやすかったのであろうと考えられる。同じ理由から、仮に、試験例1-1で新規症例について新規骨折判定結果の予測精度を評価できる機会があれば、同様に高い予測精度が発揮されやすいと考えられる。
【0160】
<再検証II>
再検証IIでは、上述した再検証Iの新規受診者27名に、初診時(第1時点)が2020年4月から2022年9月末までの期間内である新規受診者33名を加え、合計60名を対象者とした。この新規受診者60名のプロフィールを、次の表8に示した。再検証Iと同様に、新規受診者60名のうち表8に示した12種の臨床データに欠損値がない41名について、12種の臨床データを試験例1-1に係る学習モデルに入力し、学習モデルにより出力された骨折スコア(推測値)により初診時(第1時点)の既存骨折判定結果を推測可能か検証した。この再検証IIでは前述の表7に示した結果が得られ、再検証Iと同程度の推測精度が認められた。
【0161】
【0162】
<試験例4-1>
前述した試験例1-1と比べて、観測変数や入力変数で「初診時BLR予測値」を削減する他は同様に試験し、新規骨折判定結果を予測可能か検証した。
図20に示したパスモデルを用いて平均共分散構造分析により骨折スコア(潜在変数の因子得点)を算出させた。このパスモデル(
図20)では、後述の表9に示した評価結果で、優れた適合(統計的有意性)と、潜在変数から「新規骨折判定結果に係る観測変数」に対して直接的に有意な因果関係とが認められた。ROC解析による骨折スコアのカットオフ値は1.08であった。
図21に示したように、「新規骨折あり」と判定された被験者らでは、「新規骨折なし」と判定された被験者らと比べて、骨折スコアが著しく高値(p<0.0001)で、骨折スコアの高さに基づき新規骨折判定結果を推測可能なことが示唆された。
【0163】
また、前述した試験例1-1と比べて、次の表10及び
図22に示す11種の入力変数(欠損値のない受診者143名)を選定した他は、同様にしてANNに繰り返し学習させ、生成した多数のモデルから同様に1つのモデルを選定した。選定された試験例4-1に係る学習モデルでは、オーバーフィットペナルティは0.04、五分割交差検証法によるR
2値は0.51であった。平均共分散構造分析で算出した骨折スコアと、試験例4-1に係る学習モデルにより出力した骨折スコア(予測値)との関連性は、
図23に示すようにR
2=0.956であった。各受診者の骨折スコア(予測値)をカットオフ値1.08と比較し、各受診者で新規骨折の有無を判別したところ、次の表10に示した予測精度であり、試験例4-1でも新規骨折判定結果を高精度に予測可能なことが示唆された。
【0164】
【0165】
【0166】
<試験例4-2>
前述した試験例1-2と比べて、観測変数や入力変数で「初診時BLR予測値」を削減する他は同様に試験し、既存骨折判定結果を推測可能か検証した。
図24に示すパスモデルで平均共分散構造分析を行い、骨折スコア(潜在変数の因子得点)を算出した。パスモデル(
図24)では、前述の表9に示した評価結果が得られ、優れた適合(統計的有意性)と、潜在変数から「既存骨折判定結果に係る観測変数」に対して直接的な有意な因果関係と、が認められた。ROC解析による骨折スコアのカットオフ値は0.27であった。
図25に示すように、「既存骨折あり」と判定された被験者らでは、「既存骨折なし」と判定された被験者らと比べて、骨折スコアが著しく高値(p<0.0001)で、骨折スコアの高さに基づき既存骨折判定結果を推測可能なことが示唆された。表10に示した11種の臨床データ(欠損値のない受診者143名)を入力変数とし、
図26に示すようにANNに繰り返し学習させ、生成した多数のモデルから選定した試験例4-2に係る学習モデルでは、オーバーフィットペナルティは0.04で、五分割交差検証法によるR
2値は0.600であった。平均共分散構造分析で算出した骨折スコアと、試験例4-2に係る学習モデルにより出力した骨折スコア(推測値)との関連性はR
2=0.881であった(
図27)。各受診者の骨折スコア(推測値)をカットオフ値と比較し、各受診者で既存骨折の有無を判別したところ、表10に示した推測精度で、試験例4-2でも既存骨折判定結果を高精度に推測可能なことが示唆された。
【0167】
<試験例5-1>
前述した試験例1-1と比べて、観測変数や入力変数から「初診時血中Cr検査値」及び「初診時BAP検査値」を削減する他は同様に試験し、新規骨折判定結果を予測可能か検証した。
図28に示すパスモデルで平均共分散構造分析を行い、骨折スコア(潜在変数の因子得点)を算出させた。このパスモデル(
図28)では、優れた適合(統計的有意性)と、潜在変数で「既存骨折判定結果に係る観測変数」に対して直接的に有意な因果関係と、が認められた(前述の表9)。ROC解析による骨折スコアのカットオフ値は1.15であった。表10に示した10種の臨床データ(欠損値のない受診者141名)を入力変数とし、
図29に示したようにANNに繰り返し学習させ、生成した多数の学習モデルから試験例5-1に係る学習モデルを選定した。平均共分散構造分析で算出した骨折スコアと、試験例5-1に係る学習モデルにより出力した骨折スコア(予測値)との関連性を示すR
2値は0.835であった(
図30及び表10)。骨折スコア(予測値)をROC解析によるカットオフ値と比較し、新規骨折の有無を判別したところ、前述の表11に示す予測精度で、試験例5-1でも新規骨折判定結果を高精度に予測可能なことが示唆された。
【0168】
<試験例5-2>
前述した試験例1-2と比べて、観測変数や入力変数から「初診時血中Cr検査値」及び「初診時BAP検査値」を削減する他は同様に試験し、既存骨折判定結果を推測可能か検証した。
図31に示すパスモデルで平均共分散構造分析を行い、骨折スコア(潜在変数の因子得点)を算出した。パスモデル(
図31)では、表11に示した評価結果が得られ、優れた適合(統計的有意性)と、潜在変数から「既存骨折判定結果に係る観測変数」に対して直接的な有意な因果関係とが認められた。ROC解析による骨折スコアのカットオフ値は0.41であった。表10に示した10種の臨床データ(欠損値のない受診者141名)を入力変数とし、
図32に示したようにANNに繰り返し学習させ、生成した多数の学習モデルから試験例5-2に係る学習モデルを選定した。平均共分散構造分析で算出した骨折スコアと、試験例5-2に係る学習モデルにより出力した骨折スコア(推測値)との関連性はR
2=0.895であった(
図33)。各受診者の骨折スコア(推測値)をROC解析によるカットオフ値と比較し、既存骨折の有無を判別したところ、表11に示した推測精度であった。試験例5-2でも、既存骨折を高精度に推測可能なことが示唆された。
【0169】
<試験例6乃至13>
試験例6乃至13の各々では、前述した試験例1-1と比べて、次の表11に示したように観測変数や入力変数として用いるデータ項目を幾つか削減した他は、同様にして、新規骨折判定結果を予測可能か検証した。表11に示した正規化していない臨床データを観測変数として用いたいずれのパスモデルでも、優れた適合(統計的有意性)と、潜在変数で「新規骨折判定結果に係る観測変数」に対して直接的な有意な因果関係と、が認められた。表11に示した入力変数(正規化した臨床データ)と出力変数(潜在変数の因子得点)とによりANNに繰り返し学習させ、生成した多数の学習モデルから試験例ごとに1つの学習モデルを選定した。平均共分散構造分析で算出した骨折スコアと、選定した学習モデルにより出力した骨折スコア(予測値)との関連性を示すR2値は、表11に示したようにいずれも高値であった。骨折スコア(予測値)をROC解析によるカットオフ値と比較し、新規骨折の有無を判別したところ、表11に示した予測精度であった。このため、例えば、学習データセットに含まれる受診者らの臨床データに測定誤差が少ない等、質の高い臨床データセットを取得できる場合には、新規骨折判定結果を高精度に予測できる可能性が示唆された。
【0170】
【0171】
<試験例14乃至17>
試験例14乃至17の各々では、前述した試験例1-1と比べて、次の表12に示すように観測変数や入力変数として用いるデータ項目を幾つか削減した他は、同様にして、新規骨折判定結果を予測可能か検証した。次の表12に示した正規化していない臨床データを観測変数として用いたいずれのパスモデルでも、優れた適合(統計的有意性)と、潜在変数で「新規骨折判定結果に係る観測変数」に対して直接的な有意な因果関係と、が認められた。表12に示した入力変数(正規化した臨床データ)と出力変数(潜在変数の因子得点)とによりANNに繰り返し学習させ、生成した多数の学習モデルから試験例ごとに1つの学習モデルを選定した。平均共分散構造分析で算出した骨折スコア(潜在変数の因子得点)と、選定した学習モデルにより出力した骨折スコア(予測値)との関連性を示すR2値は、表12に示したように高値であった。骨折スコア(予測値)をROC解析によるカットオフ値と比較し、新規骨折の有無を判別したところ、表12に示した精度であった。観測変数や入力変数として用いる臨床データが4種でも、例えばデータに測定誤差が少ない等、質の高い学習データセットを作成できる場合に、新規骨折判定結果を高精度に予測できる可能性が示唆された。
【0172】
【0173】
<試験例18>
初診時に既存骨折数0と判定された各受診者と、初診時に既存骨折数1と判定された各受診者とを判別する推測可能か、共分散構造分析と機械学習との組み合わせにより検証した。前述した試験例1-2と比べて、以下に説明することの他は同様にして検証した。
【0174】
試験例18では、前述した受診者233名(表1)のうち、初診時の既存骨折数0と判定された179名と、初診時の既存骨折数1と判定された29名とからなる合計208名の受診者を選定した。この208名のプロフィールを次の表13に示した。208名の臨床情報から、12種の臨床データと、既存骨折判定結果(骨折数0又は1)とを、後述の表14に示したように合計13種の観測変数として選定し、
図16に示すパスモデルを作成した。このパスモデルを用い平均共分散構造分析により、骨折数0又は1の判別に関する既存骨折スコア(潜在変数の因子得点)を算出させた。試験例18で作成した場合のこのパスモデル(
図16)では、後述の表15に示した評価結果が得られ、優れた適合(統計的有意性)と、潜在変数から「既存骨折判定結果に係る観測変数」に対して直接的に有意な因果関係とが認められた。ROC解析による既存骨折スコアのカットオフ値は0.53であった。「初診時の既存骨折数0」と判定された受診者らでは、「初診時の既存骨折数1」と判定された受診者らと比べて、既存骨折スコアが著しく高値で(p<0.0001)、既存骨折スコアの高さに基づき既存骨折判定結果(骨折数0又は1)を推測可能なことが示唆された。
【0175】
【0176】
【0177】
表14に示した12種の臨床データを入力変数とし、
図18に示したようにANNに繰り返し学習させ、生成した多数のモデルから選定した試験例18に係る学習モデルでは、オーバーフィットペナルティは0.01で、五分割交差検証法によるR
2値は0.602であった。平均共分散構造分析で算出した既存骨折スコアと、試験例18に係る学習モデルにより出力した既存骨折スコア(推測値)との関連性はR
2=0.933であった。各受診者の骨折スコア(推測値)をカットオフ値と比較し、各受診者で既存骨折数が0又は1のいずれか判別したところ、次の表15に示した精度であった。試験例18で、初診時の既存骨折数(0又は1)を高精度に推測可能なことが示唆された。
【0178】
【0179】
<試験例19>
試験例19では、以下に説明することの他は、上述した試験例18と同様にして検証した。表14に示したように、試験例18と比べて観測変数からBLR予測値を削減し、
図24に示すパスモデルを作成し、平均共分散構造分析により、骨折数0又は1の判別に関する既存骨折スコア(潜在変数の因子得点)を算出させた。この試験例19で作成した場合のパスモデル(
図24)では、表15に示した評価結果が得られ、優れた適合(統計的有意性)と、潜在変数から「既存骨折判定結果に係る観測変数」に対して直接的に有意な因果関係とが認められた。ROC解析による既存骨折スコアのカットオフ値は0.49であった。「初診時の既存骨折数0」と判定された受診者らでは、「初診時の既存骨折数1」と判定された受診者らと比べて、既存骨折スコアが著しく高値で(p<0.0001)、既存骨折スコアの高さに基づき既存骨折判定結果(骨折数0又は1)を推測可能なことが示唆された。BLR予測値を含まない11種の臨床データを入力変数として使用し(表14)、
図26に示したようにANNに繰り返し学習させ、生成した多数のモデルから選定した試験例19に係る学習モデルでは、オーバーフィットペナルティは0.01で、五分割交差検証法によるR
2値は0.517であった。平均共分散構造分析で算出した既存骨折スコアと、試験例19に係る学習モデルにより出力した既存骨折スコア(推測値)との関連性はR
2=0.951であった。各受診者の骨折スコア(推測値)をカットオフ値と比較し、各受診者で既存骨折数が0又は1のいずれか判別したところ、表15に示した精度であった。試験例19で、初診時の既存骨折数(0又は1)を高精度に推測可能なことが示唆された。
【0180】
<試験例20>
初診時に既存骨折数0と判定された各受診者と、初診時に既存骨折数2と判定された各受診者とを判別する推測可能か、共分散構造分析と機械学習との組み合わせにより検証した。前述した試験例1-2と比べて、以下に説明することの他は同様にして検証した。
【0181】
【0182】
試験例20では、前述した受診者233名(表1)のうち、初診時の既存骨折数0と判定された179名と、初診時の既存骨折数2と判定された15名とからなる合計194名の受診者を選定した。この194名のプロフィールを表16に示した。この194名の臨床情報から、12種の臨床データと、既存骨折判定結果(骨折数0又は2)とを、表14に示したように合計13種の観測変数として選定し、
図16に示したパスモデルを作成した。このパスモデルを用い平均共分散構造分析により、骨折数0又は2の判別に関する既存骨折スコア(潜在変数の因子得点)を算出させた。この試験例20で作成した場合のパスモデル(
図16)では、表15に示した評価結果が得られ、優れた適合(統計的有意性)と、潜在変数から「既存骨折判定結果に係る観測変数」に対して直接的に有意な因果関係とが認められた。ROC解析による既存骨折スコアのカットオフ値は0.45であった。「初診時の既存骨折数0」と判定された受診者らでは、「初診時の既存骨折数2」と判定された受診者らと比べて、既存骨折スコアが著しく高値で(p<0.0001)、既存骨折スコアの高さに基づき既存骨折判定結果(骨折数0又は2)を推測可能なことが示唆された。表14に示した12種の臨床データを入力変数とし、
図26に示したようにANNに繰り返し学習させ、生成した多数のモデルから選定した試験例20に係る学習モデルでは、オーバーフィットペナルティは0.01で、五分割交差検証法によるR
2値は0.653であった。平均共分散構造分析で算出した既存骨折スコアと、試験例21に係る学習モデルにより出力した既存骨折スコア(推測値)との関連性はR
2=0.976であった。各受診者の骨折スコア(推測値)をカットオフ値と比較し、各受診者で既存骨折数が0又は3のいずれか判別したところ、表15に示した精度であった。試験例20で、初診時の既存骨折数(0又は3)を高精度に推測可能なことが示唆された。
【0183】
<試験例21>
初診時に既存骨折数0と判定された各受診者と、初診時に既存骨折数3と判定された各受診者とを判別する推測可能か、共分散構造分析と機械学習との組み合わせにより検証した。前述した試験例1-2と比べて、以下に説明することの他は同様にして検証した。
【0184】
【0185】
試験例21では、前述した受診者233名(表1)のうち、初診時の既存骨折数0と判定された179名と、初診時の既存骨折数3と判定された10名とからなる合計189名の受診者を選定した。この189名のプロフィールを表17に示した。この189名の臨床情報から、12種の臨床データと、既存骨折判定結果(骨折数0又は3)とを、表14に示したように合計13種の観測変数として選定し、
図16に示したパスモデルを作成した。このパスモデルを用い平均共分散構造分析により、骨折数0又は3の判別に関する既存骨折スコア(潜在変数の因子得点)を算出させた。この試験例21で作成した場合のパスモデル(
図16)では、表15に示した評価結果が得られ、優れた適合(統計的有意性)と、潜在変数から「既存骨折判定結果に係る観測変数」に対して直接的に有意な因果関係とが認められた。ROC解析による既存骨折スコアのカットオフ値は1.61であった。「初診時の既存骨折数0」と判定された受診者らでは、「初診時の既存骨折数2」と判定された受診者らと比べて、既存骨折スコアが著しく高値で(p<0.0001)、既存骨折スコアの高さに基づき既存骨折判定結果(骨折数0又は3)を推測可能なことが示唆された。表14に示した12種の臨床データを入力変数とし、
図26に示したようにANNに繰り返し学習させ、生成した多数のモデルから選定した試験例21に係る学習モデルでは、オーバーフィットペナルティは0.02で、五分割交差検証法によるR
2値は0.512であった。平均共分散構造分析で算出した既存骨折スコアと、試験例21に係る学習モデルにより出力した既存骨折スコア(推測値)との関連性はR
2=0.991であった。各受診者の骨折スコア(推測値)をカットオフ値と比較し、各受診者で既存骨折数が0又は2のいずれか判別したところ、表15に示した精度であった。試験例21で、初診時の既存骨折数(0又は3)を高精度に推測可能なことが示唆された。
【0186】
<再検証III>
再検証IIIでは、前述した再検証IIと同じ新規受診者60名(表8)を対象者らとし、前述した試験例18及び試験例19の各々に係る学習モデルを用い、初診時に既存骨折なし(骨折数0)と判定された新規受診者52名と、初診時に既存骨折あり(骨折数1)と判定された新規受診者8名と、を判別可能か検討した。このためには、試験例18に係る学習モデルに、新規受診者らの12種の臨床データ(欠損値のない新規受診者 名)を入力変数として入力し、各新規受診者の既存骨折スコア(推測値)を出力させ、出力された既存骨折スコアとカットオフ値0.53とを比較することにより、各新規受診者の骨折数が0又は1のいずれか判別した。また、試験例19の再試験例19に係る学習モデルに、新規受診者らのBLR予測値を除く11種の臨床データ(欠損値のない新規受診者41名)を入力変数として入力し、各新規受診者の既存骨折スコア(推測値)を出力させ、出力された既存骨折スコアとカットオフ値0.49とを比較することにより、各新規受診者の骨折数が0又は1のいずれか判別した。これら判別の結果を次の表18に示した。
【0187】
【0188】
表18から明らかなように、試験例18及び試験例19の各々に係る学習モデルから出力された既存骨折スコアにより、初診時に既存骨折数1と判別された各新規受診者と、初診時に既存骨折数0と判別された各新規受診者とを、高精度で判別する推測可能なことが示唆された。表15と比べて表18では推測精度が低下したが、表18は各新規受診者(新規症例)での推測結果であり、臨床応用を検討する上で、学習モデルは許容可能な推測精度を有すると考えられる。なお、一般的に閉経後女性の一人ひとりでBLRの値が異なる原因は、正確には未だ解明されていないが、一人ひとりの体質の違いのみならず、一人ひとりのリン摂取量の違いを反映し、リン摂取量が多ければBLRの値が増加することが報告されている。試験例18(BLR予測値あり)で試験例19(BLR予測値なし)よりも高い推測精度が示された理由は、正確には不明であるが、試験例18では入力変数にBLR予測値を含むことにより、各受診者において「一人ひとりで体質やリン摂取量が異なること」と「既存骨折数が0又は1のいずれかであること」との関係性を含めて機械学習できたことに因ると考えられる。
【0189】
新規受診者(対象者)60名(表8)には「初診時の既存骨折数2以上」と判定された者がいなかったので、本願に係る発明者は、試験例20(既存骨折数0又は2の判別)や試験例21(既存骨折数0又は3の判別)を再検証することができなかった。試験例18や試験例19(既存骨折数0又は1)の再検証で高い推測精度(表18)が示されたため、試験例20や試験例21も再検証できる新規受診者(既存骨折数2以上)がいれば、同様に高い推測精度を示すであろうと考えられる。試験例18、試験例20及び試験例21の各学習モデルを組み合わせて使用すれば、既存骨折数0乃至3である対象者らに含まれる各対象者を、骨折数0、骨折数1、骨折数2又は骨折数3のいずれかに高精度に分類する推測可能と考えられる。また、経過観察期間内での新規骨折の骨折数を0、1、2又は3のいずれかに高精度に分類する予測可能な学習モデルについては、新規骨折数1以上の受診者(被験者)や新規受診者(対象者)の症例が不足し検証できなかったが、試験例1-1乃至試験例21での推測・予測精度の高さを考えると、そのような症例が十分にあれば高い予測精度を有することを実証可能であろうと考えられる。
【0190】
<試験例22>
市販の統計解析ソフトウェア(SAS Institute Inc.製、JMP(登録商標)version 8.0)をインストールした市販のPCで、前述した試験例1-1に係る学習モデルを生成し、この統計解析ソフトウェアに実装された機能により、試験例1-1に係る学習モデルに基づき、機械学習に供した受診者らの入力変数(12種の臨床データ)及び出力変数(潜在変数の因子得点)を反映した応答曲面を生成させた。この応答曲面の全体像は、本来は13次元グラフに描かれるはずのものであるが、この統計解析ソフトウェアにより視認可能な三次元グラフへと加工された。三次元グラフで、第1軸(Z軸)は骨折スコアの大きさを示す軸とし、第2軸(X軸)及び第3軸(Y軸)の各々は1種の入力変数(1種の臨床データ)を示す軸とした。12種の入力変数から任意の2種の組み合わせを選択する場合の数は、66通りある。市販の統計ソフトウェアにより、それぞれ第2軸(X軸)及び第3軸(Y軸)のデータ項目の組み合わせが異なる三次元グラフを幾つか作成した。作成したうちの大半の三次元グラフでは、応答曲面上の骨折スコアの値がカットオフ値1.08以下で、応答曲面は閾値表示の下側にある骨折リスク陰性の予測領域のみを形成していた。このような三次元グラフで第2軸(X軸)及び第3軸(Y軸)として選定した臨床データ項目の組み合わせは、骨粗鬆症による骨折のリスク因子として不適当と考えられる。
【0191】
一方、作成したうちの幾つかの三次元グラフ(
図5(a)、
図5(b)、及び、
図6(c)乃至
図6(f))では、応答曲面上の骨折スコアの値がカットオフ値1.08を上回る部分があり、応答曲面の一部が閾値表示の下側から上側へと突出した骨折リスク陽性の予測領域が含まれていた。これらの三次元図に示された応答曲面での骨折スコア最高値の大きさに基づいて、推定される「新規骨折あり」リスク因子組み合わせの有用性を順位付けすると、1位(
図6(c)):低BMD且つ高年齢(骨折スコア最高値5)、同点1位(
図5(b)):低BMD且つ高身長(骨折スコア最高値5)、3位(
図5(a)):低Cr且つ高BAP(骨折スコア最高値約4)、同点3位(
図6(f)):低Cr且つ高年齢(骨折スコア最高値約4)、5位(
図6(d)):低Cr且つ高BLR予測値(骨折スコア最高値約3)、同点5位(
図6(e)):低Cr且つ低FRAX結果(骨折スコア最高値約3)であった。これらの結果は、本願に係る発明者が事前に考えた前述のリスク因子1)乃至7)に関連しており、考えが正しかったことが示唆された。カットオフ値に対して、応答曲面上の骨折スコア最高値が高値である臨床データ項目の組み合わせほど(順位が上位のものほど)、新規症例でも、骨粗鬆症による新規骨折リスク因子として活用可能と推定された。
【0192】
<試験例23>
上述の試験例22で述べたPCにおいて、試験例1-1に係る学習モデルに代えて試験例19に係る学習モデルを使用した他は、試験例22と同様にして被験者らの応答曲線を生成させ、第2軸(X軸)及び第3軸(Y軸)として選定した被験者らの臨床データ項目の組み合わせがそれぞれ異なる三次元グラフを66通り作成した。大半の三次元グラフでは、応答曲面上の骨折スコア最高値が、カットオフ値0.53よりも低値であった。一方、幾つかの三次元グラフでは、応答曲面上の骨折スコア最高値がカットオフ値よりも高値で、応答曲面の一部に骨折(既存骨折数1)リスク陽性の推測領域が形成されていた。これら三次元図に示された応答曲面上の骨折スコア最高値の大きさに基づいて、推定される「既存骨折数1」リスク因子の組み合わせの有用性を順位付けすると、次の表19に示す結果となった。順位が上位の組み合わせほど、骨粗鬆症による既存骨折数1のリスク因子として、有用と推定されたと考えられる。
【0193】
【0194】
<試験例24>
特許文献2に記載された「第3期研究(実施例1-1)」で生成した学習モデル(以下「試験例24に係る学習モデル」ともいう)に基づいて、応答曲面法により、川崎病(KD)合併症(冠動脈拡大病変:CAL)発生のリスク因子の組み合わせを推定しようと試みた。なお、試験例24に係る学習モデルは、以下の方法で作成した統計モデルである。
【0195】
2002年3月から2018年12月に箕面市立病院でKD急性期医療を受けた小児314名(男児185名、女児129名)を、被験者らとした。各被験者からは、KDと診断され入院後の一次治療前及び一次治療中の診察時(第1診察時点)に、次の7種の臨床データを含む臨床情報が取得された。7種の臨床データは、性別、一次治療前の冠動脈径(直径)最大値(Zスコア)、一次治療前の月齢、一次治療前の血清中CRP濃度、一次治療前のLog尿中β2MG/Cr、一次治療前のIVIG不応予測スコア(佐野スコア)得点、及び、一次治療中にIVMP投与を受けた回数であった。また、各被験者からは、一次治療の処置を終えた直後から経過観察期間30日以内の診察時(第2診察時点)に、次の合併症判定結果が取得された。合併症判定結果は、KD急性期医療担当医により、第2診察時点の冠動脈径最大値(直径、Zスコア)が3.0SD以上の場合に「CAL発生あり」と判定され、3.0SD未満の場合に「CAL発生なし」と判定された結果であった。7種の臨床データの各々と合併症判定結果とを合計8種の観測変数とし、合併症判定結果に係る観測変数に対して直接的に有意な因果関係が認められると仮定された潜在変数を設け、SEMによる平均共分散構造分析を行い、潜在変数の因子得点(合併症発生スコア)を算出させた。その上で、各被験者の正規化させた7種の臨床データを入力変数とし、各被験者の合併症発生スコア(潜在変数の因子得点)を出力変数とし、入力変数と出力変数との関係をANNに機械学習させた。この試験例24において、パスモデルの標準化総合効果は0.741(p<0.001)で、潜在変数から「合併症判定結果に係る観測変数」への直接的に有意な因果関係が認められた。ROC解析による合併症発生スコアのカットオフ値は2.0であった。機械学習で生成された試験例24に係る学習モデルでは、各被験者の合併症発生スコア(潜在変数の因子得点)と該学習モデルに出力させた各被験者の合併症発生スコア(予測値)との相関関係がR2=0.89で、C統計量が0.860で、感度が72.7%(8/11)で、特異度が99.1%(232/234)で、各被験者の第2診察時点でのCAL発生の有無を高精度に予測可能なことが示唆された(詳細は特許文献2参照)。
【0196】
試験例22で述べたPCで前述の統計解析ソフトウェアを使用し、上述の試験例24に係る学習モデルに基づいて、応答曲面法により、被験者らの7種の臨床データ及び合併症判定結果を反映させた8次元の応答曲面を作成した。その上で、同じ統計解析ソフトウェアにより、第1軸(Z軸)を被験者らの合併症発生スコア(潜在変数の因子得点)とし、第2軸(X軸)及び第3軸(Y軸)の各々を被験者らの7種の臨床データから選択された1種の臨床データ項目として、多数の三次元グラフを作成した。作成したうちの大半の三次元グラフでは、応答曲面上の合併症発生スコア(潜在変数の因子得点)最大値が、閾値表示(カットオフ値2.0)を下回っていた。
【0197】
一方、幾つかの三次元グラフでは、応答曲面上の合併症発生スコア最高値がカットオフ値よりも高値で、応答曲面の一部に合併症(冠動脈径最大値(Zスコア)3.0SD以上のCAL)発生リスク陽性の予測領域が形成されていた。これら三次元図に示された応答曲面の合併症発生スコア最高値の大きさに基づいて、合併症(Zスコア3.0SD以上のCAL)発生のリスク因子として推定される組み合わせ有用性を順位付けすると、有用性が高いものから順に、1位:「一次治療前の(正規化)血清中CRP検査値」と「一次治療前の(正規化)尿中β2MG/Cr」との組み合わせ、2位:「一次治療前の(正規化)尿中β2MG/Cr」と「一次治療前の(正規化)IVIG不応スコア(佐野スコア)得点」との組み合わせ、3位:「一次治療前の冠動脈径最大値(Zスコア)」と「一次治療前の(正規化)尿中β2MG/Cr」との組み合わせ、4位:「一次治療前の冠動脈径最大値(Zスコア)」と「一次治療前の(正規化)血清中CRP検査値」との組み合わせ、5位:「一次治療前の(正規化)血清中CRP検査値」と「一次治療前の(正規化)IVIG不応スコア(佐野スコア)得点」との組み合わせであった。これらの組み合わせは、順位が上位の組み合わせほど、KD一時治療後の経過観察期間内での合併症(Zスコア3.0以上のCAL)発生のリスク因子として、有用と推定されたと考えられる。
【0198】
上記順位が3位の三次元グラフを、
図34に示した。なお、一次治療前(第1診察時点)で既に冠動脈径最大値(Zスコア)3.0SD以上である場合は、一次治療前で既に「CAL発生あり」との判定が確定し得るため、上記の順位付けで合併症発生のリスク因子として推定される候補から除外した。
図34において一次治療前の冠動脈径最大値(Zスコア)3.0SD未満の部分では、「一次治療前の冠動脈径最大値(Zスコア)が1.5SDあたり」で且つ「一次治療前の尿中β2MG/Cr検査値が正規化していない状態で約60mg/gCr以上」である領域において、応答曲線の合併症発生スコア(潜在変数の因子得点)の値が閾値表示(カットオフ値2.0)を上回り、合併症発生リスク陽性の予測領域を形成し、KD合併症(CAL)発生のリスク因子の組み合わせとして有用と推定されたと考えられる。
【0199】
<試験例25>
特許文献2に記載された「IgAVにおいてPNで高度蛋白尿を伴う症例発生予測:実施例2-1」と比べて、被験者の人数を増やし、合併症発生の判定基準を「尿蛋白/Cr比が2.0以上」へと高める変更をした他は、同様にして試験例25に係る学習モデルを生成した。具体的には、以下に説明する手法により生成した。
【0200】
1996年10月から2021年10月に箕面市立病院でIgAVと診断され入院治療を受けた小児144名(男児70名、女児74名、平均年齢8.2歳)を、被験者らとした。各被験者からは、IgAVと診断され入院後の初回治療前及び初回治療中の診察時(第1診察時点)に、次の6種の臨床データを含む臨床情報が取得された。6種の臨床データは、性別、初回治療前の月齢、初回治療前の血中FDP・Dダイマー濃度、初回治療前の即時型アレルギー疾患の有無、初回治療前の腹痛の有無、及び、初回治療でのPSL経口投与の有無であった。初回治療の処置を終えた直後から経過観察期間約30日を経た診察時(第2診察時点)に、一部の被験者らは担当医によりPN発生と診断された。PN発生と診断された被験者らで尿化学検査を行い、尿蛋白/Cr比が2.0以上である場合に「PNで高度蛋白尿を伴う症例が発生」と判定した。6種の臨床データの各々と合併症(PNで高度蛋白尿を伴う症例発生の有無)判定結果とを合計7種の観測変数とし、合併症判定結果に係る観測変数に対して直接的に有意な因果関係が認められると仮定された潜在変数を設け、SEMによる平均共分散構造分析を行い、潜在変数の因子得点(合併症発生スコア)を算出させた。その上で、各被験者の正規化させた6種の臨床データを入力変数とし、各被験者の合併症発生スコア(潜在変数の因子得点)を出力変数とし、入力変数と出力変数との関係をANNに機械学習させた。この試験例25では、パスモデルの標準化総合効果でp<0.001が示され、潜在変数から「合併症判定結果に係る観測変数」への直接的に有意な因果関係が認められた。機械学習で生成された試験例25に係る学習モデルでは、各被験者の合併症発生スコア(潜在変数の因子得点)と該学習モデルに出力させた各被験者の合併症発生スコア(予測値)との相関関係を示すR2値が高値で、C統計量が0.87で、感度が80.0%(4/5)で、特異度が94.4%で、各被験者の第2診察時点においてPNで高度尿蛋白を伴う症例発生の有無を高精度に予測可能なことが示唆された(詳細は特許文献2参照)。
【0201】
試験例22で述べたPCで前述の統計解析ソフトウェアを使用し、上述の試験例25に係る学習モデルに基づいて、応答曲面法により、被験者らの6種の臨床データ及び合併症判定結果を反映させた7次元の応答曲面を作成した。その上で、同じ統計解析ソフトウェアにより、第1軸(Z軸)を被験者らの合併症発生スコア(潜在変数の因子得点)とし、第2軸(X軸)及び第3軸(Y軸)の各々を被験者らの6種の臨床データから選択された1種の臨床データ項目として、多数の三次元グラフを作成した。多数を作成したうちの大半の三次元グラフでは、応答曲面上の合併症発生スコア(潜在変数の因子得点)最大値が、閾値表示(カットオフ値)を下回っていた。
【0202】
一方、幾つかの三次元グラフでは、応答曲面上の合併症発生スコア最高値がカットオフ値よりも高値で、応答曲面の一部に合併症(PNで尿蛋白/Cr比が2.0以上の高度蛋白尿を伴う症例)発生リスク陽性の予測領域が形成されていた。これら三次元グラフに示された応答曲面の合併症発生スコア最高値の大きさに基づいて、合併症(PNで尿蛋白/Cr比が2.0以上の高度蛋白尿を伴う症例)発生のリスク因子として推定される組み合わせ有用性を順位付けすると、有用性が高いものから順に、1位:「初回治療前の(正規化)PSL経口投与の有無」と「初回治療前の(正規化)腹痛の有無」との組み合わせ、2位:「初回治療前の(正規化)月齢」と「初回治療前の(正規化)FDP・Dダイマー検査値」との組み合わせ、3位:「初回治療前の(正規化)FDP・Dダイマー検査値」と「(正規化)性別が男性」との組み合わせであった。これらの組み合わせは、順位が上位の組み合わせほど、IgAV初回治療後の経過観察期間内での合併症(PN且つ尿蛋白/Cr比が2.0以上の高度蛋白尿を伴う症例)発生のリスク因子として、有用と推定されたと考えられる。
【0203】
上記した順位が2位の三次元グラフを、
図35に示した。この三次元グラフでは、「初回治療前の(正規化)血中FDP・Dダイマー高濃度」且つ「初回治療前の(正規化)高月齢」の部分で、応答曲線上の合併症発生スコア(潜在変数の因子得点)値が閾値表示(カットオフ値)を上回り、合併症発生リスク陽性の予測領域を形成していた。「初回治療前の(正規化)血中FDP・Dダイマー高濃度」且つ「初回治療前の(正規化)高月齢」の組み合わせが、IgAV合併症(PNで尿蛋白/Cr比が2.0以上の高度蛋白尿を伴う症例)発生のリスク因子の組み合わせとして、有用と推定されたと考えられる。
S10a,S10b,S10c,S10d:骨粗鬆症による骨折の推測・予測方法、S15a,S15b,S15c,S15d:骨折スコア出力方法、S20a,S20c:学習モデル生成方法、S30a,S30c:学習データセット作成方法、50:ANN、52:入力層、55:中間層、58:出力層、60a,60c:骨折推測・予測システム、61a,61c:情報処理装置、62a,62c:制御部、70a,70c:記憶部、72:骨折スコアを出力可能な学習モデル、73:骨折学習データベース、77:BLR(予測値)を出力可能な学習モデル、78:BLR学習データベース、81:少なくとも1つのユーザ端末、90a,90b,90c,90d,90e,90f:三次元グラフ、92a,92b,92c,92d,92e,92f:応答曲面、95:閾値表示、97:骨折リスク陰性の予測領域、99:骨折リスク陽性の予測領域
骨代謝マーカーとして例えば、骨形成マーカー、骨吸収マーカー又は骨質マーカー等が挙げられる。骨代謝マーカー検査値は、例えば、骨粗鬆症に関する学術論文(いわゆるエビデンス)でBMD低下又は骨折リスクの予測因子として活用できる可能性が論じられた1種以上の骨代謝マーカーの計測値でもよく、臨床応用しやすい観点では、骨粗鬆症医療の現場で活用されている1種以上の骨代謝マーカーの計測値が好ましい。骨代謝マーカーとして、骨形成マーカーでは例えばオステオカルシン(OC)又はI型プロコラーゲン-N-プロペプチド(PINP)等が挙げられ、骨吸収マーカーでは例えばI型コラーゲン架橋N-テロペプチド(NTX)又は骨型酒石酸抵抗性酸性フォスファターゼ5b(TRACP-5b)等が挙げられ、骨質マーカーでは例えば低カルボキシル化オステオカルシン(ucOC)等が挙げられるが、これらの例に限られない。例えば、骨型アルカリフォスファターゼ(bone specific alkaline phosphatase:以下「BAP」ともいう)は、骨形成と骨吸収との両方の指標を兼ねており、骨代謝回転マーカーの一種ともいえる。骨粗鬆症医療の現場で活用されており、BMD減少と有意な関連性がある観点から、骨代謝マーカー検査値として更に好ましくは、BAP計測値である。一般的に骨代謝マーカーは、血液検査により血中又は血清中での濃度又は活性値を測定される場合があり、又は、尿検査により尿中での濃度又は活性値を測定される場合がある。
腎臓では、腸内からカルシウム吸収を促進する活性型ビタミンDが生成される。このため、腎機能には、骨強度や骨折リスクとの関連性が認められる。腎機能マーカー検査値は、従来、日常診療の現場で腎機能評価に使用されている計測値でもよく、例えば、血中のクレアチニン(creatinine:以下「Cr」ともいう)濃度、推算糸球体濾過量(eGFR)、血中シスタチンC濃度又は血中尿素窒素(BUN)濃度等の計測値が挙げられる。骨格筋量の影響を除外したい場合、腎機能マーカーとしてシスタチンCが好ましい。また、中高年日本人女性では、骨格筋量とBMDとに関連性があることが知られている。フレイル高齢者では筋肉量低下するほど転倒し骨折するリスクが高まると考えられ、骨格筋量マーカー検査値の減少と、骨粗鬆症による骨折リスクとの間には、関連性があると考えられる。骨格筋量マーカー検査値は、従来、骨格筋量の評価に使用されているマーカーの計測値でもよく、例えば、血中Cr濃度、血中Cr/シスタチンC比、血中クレアチンキナーゼ(CPK)活性又は血中アルドラーゼ(ALD)活性等の計測値が挙げられる。従来、日常診療の現場で活用され、腎機能と骨格筋量とを兼ねた評価指標である観点では、腎機能マーカー検査値及び骨格筋量マーカー検査値として好ましくは、血中Cr濃度又は血清中Cr濃度の計測値である。
閉経後である第1時点での骨粗鬆症による既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記第1時点を過ぎてから後の第2時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上に関する骨折スコアを出力する方法であって、
前記骨折スコアを出力可能な学習モデルに対象者の前記第1時点での臨床情報を入力して前記対象者の前記骨折スコアを出力する処理を情報処理装置に実行させるステップを含み、
前記骨折スコアを出力可能な学習モデルは、前記第1時点での前記既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記経過期間内での前記新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上を判定された各被験者の前記第1時点での前記臨床情報を入力されると、前記各被験者の前記骨折スコアを出力するように機械学習したものであり、
前記第1時点での前記臨床情報は、年齢、身長、体重、BMI、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第1時点までの年数、前記経過期間の長さ、FRAX(登録商標)による骨折リスク評価結果、前記第2時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータからなる群より選ばれる4種以上の臨床データを含み、
前記各被験者の前記骨折スコアは、前記判定の結果と、前記各被験者の前記4種以上の臨床データと、を含む5種以上の観測変数が設けられ共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである、骨折スコア出力方法。
前記骨量減少率予測値は、骨量減少率を出力可能な学習モデルに前記第1時点での骨密度と前記第1時点での他の臨床情報とを入力して前記骨量減少率予測値を出力する処理を情報処理装置に実行させて出力される臨床データであり、
前記骨量減少率を出力可能な学習モデルは、前記第1時点と前記第2時点とで骨密度を計測された各被験者についての、前記第1時点での骨密度と、前記第1時点での前記他の臨床情報とを入力されると、前記第2時点での骨密度と、前記経過期間内での骨量減少率とを出力するように機械学習したものであり、
前記第1時点での前記他の臨床情報は、年齢、身長、体重、BMI、体脂肪率、除脂肪体重、体脂肪量、初経年齢、閉経年齢、閉経時から前記第1時点までの年数、及び、これらのいずれかを間接的に示すデータから選ばれた1種以上の他の臨床データを含む、請求項1に記載された骨折スコア出力方法。
前記骨密度は、上腕骨近位部、橈骨遠位部、頚椎、胸椎、腰椎及び大腿骨近位部から選ばれた1箇所以上の身体部位における少なくとも一部の領域についてのものである、請求項1に記載された骨折スコア出力方法。
請求項1乃至請求項3のいずれか一項に記載された骨折スコア出力方法により前記対象者の前記骨折スコアを出力し、出力された前記対象者の前記骨折スコアと前記骨折スコアの閾値との比較結果に基づいて、前記対象者についての、前記第1時点での前記既存骨折の有無の推測結果、前記第1時点での前記既存骨折の骨折数の推測結果、前記経過期間内での前記新規骨折の有無の予測結果、及び、前記経過期間内での前記新規骨折の骨折数の予測結果から選ばれた1種以上に関する結果データを出力する処理を情報処理装置に実行させる、骨粗鬆症による骨折の推測及び予測の少なくとも一方の方法。
閉経後である第1時点での骨粗鬆症による既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記第1時点を過ぎてから後の第2時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上を判定された各被験者の前記第1時点での臨床情報が入力されると前記各被験者の骨折スコアを出力する学習モデルを、機械学習により生成するステップを含み、
前記第1時点での前記臨床情報は、年齢、身長、体重、BMI、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第1時点までの年数、前記経過期間の長さ、FRAX(登録商標)による骨折リスク評価結果、前記第2時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータから選ばれた4種以上の臨床データを含み、
前記各被験者の前記骨折スコアは、前記判定の結果と、前記4種以上の臨床データと、を含む5種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである、学習モデル生成方法。
閉経後である第1時点での骨粗鬆症による既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記第1時点を過ぎてから後の第2時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上に関する骨折スコアを出力可能な学習モデルであって、
前記学習モデルは、前記第1時点での前記既存骨折の有無、前記第1時点での前記既存骨折の骨折数、前記経過期間内での前記新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた1種以上を判定された各被験者の前記第1時点での臨床情報が入力層に入力されると出力層が前記各被験者の前記骨折スコアを出力するように重み付け値が機械学習されたものであり、且つ、対象者の前記第1時点での前記臨床情報が前記入力層に入力される場合には前記対象者の前記臨床情報に対して前記重み付け値に基づく演算を行って前記出力層が前記対象者の前記骨折スコアを出力するように情報処理装置を機能させるものであり、
前記第1時点での前記臨床情報には、年齢、身長、体重、BMI、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第1時点までの年数、前記経過期間の長さ、FRAX(登録商標)による骨折リスク評価結果、前記第2時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータから選ばれた4種以上の臨床データを含み、
前記各被験者の前記骨折スコアは、前記判定の結果と、前記各被験者の前記4種以上の臨床データと、を含む5種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである、学習モデル。
請求項6に記載された学習モデルに基づいて、応答曲面法により、前記各被験者を含む被験者らの前記臨床情報と前記被験者らの前記骨折スコアとの関係を示す応答曲面を生成し、生成される前記応答曲面に骨折リスク陽性領域が含まれている場合には、推定されるリスク因子を特定する処理を情報処理装置に実行させるステップを含み、
前記骨折リスク陽性領域は、前記学習モデルに基づいて、前記骨折スコアの値を示す第1軸と前記4種以上の臨床データから選択された1種の臨床データの値を示す第2軸とを有し且つ前記応答曲面と前記骨折スコアのカットオフ値との関係を示す二次元グラフ又は三次元グラフを作成する処理を情報処理装置に実行させる場合に、作成される前記二次元グラフ又は前記三次元グラフに含まれる前記応答曲面において前記骨折スコアの値が前記カットオフ値よりも高値となる部分の領域であり、
前記推定されるリスク因子は、少なくとも、前記第2軸における前記選択された1種の臨床データの値に関するものである、骨粗鬆症による骨折のリスク因子推定方法。
前記対象者の前記第1時点での前記臨床情報を取得し、取得した該臨床情報を請求項6に記載された学習モデルに入力して前記対象者の前記骨折スコアを出力する処理を情報処理装置に実行させるプログラム。