特許6986650 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 山本　威久の特許一覧

特許6986650川崎病またはＩｇＡ血管炎での合併症発生リスク予測方法、学習済みモデル及びその生成方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】6986650

(24)【登録日】2021年12月1日

(45)【発行日】2021年12月22日

(54)【発明の名称】川崎病またはＩｇＡ血管炎での合併症発生リスク予測方法、学習済みモデル及びその生成方法

(51)【国際特許分類】

G16H 50/20 20180101AFI20211213BHJP

G01N 33/68 20060101ALI20211213BHJP

【ＦＩ】

G16H50/20

G01N33/68

【請求項の数】9

【全頁数】54

(21)【出願番号】特願2021-118250(P2021-118250)

(22)【出願日】2021年7月16日

【審査請求日】2021年8月11日

(31)【優先権主張番号】特願2020-122464(P2020-122464)

(32)【優先日】2020年7月16日

(33)【優先権主張国】JP

【早期審査対象出願】

(73)【特許権者】

【識別番号】518162924

【氏名又は名称】山本威久

(74)【代理人】

【識別番号】110002734

【氏名又は名称】特許業務法人藤本パートナーズ

(72)【発明者】

【氏名】山本威久

【審査官】高田亜希

(56)【参考文献】

【文献】特許第６７０３４１２（ＪＰ，Ｂ２）

【文献】特開２００６−９９４８２（ＪＰ，Ａ）

【文献】特開２０２０−３０６６２（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１４／００１８４４６（ＵＳ，Ａ１）

【文献】山本威久ほか，川崎病の冠動脈病変のリスク因子：平均共分散構造分析による検討，日本小児感染症学会総会・学術集会プログラム・抄録集，H-1-12，日本，日本小児感染症学会，2016年11月19日，P237

【文献】 Haolin Wang et al.，Mining incomplete clinical data for the early assessment of Kawasaki disease based on feature clustering and convolutional neural networks，Artificial Intelligence In Medecine，2020年05月03日，105，P1-7

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０１Ｎ３３／４８ー３３／９８

Ｇ１６Ｈ５０／２０

ＪＳＴＰｌｕｓ／ＪＭＥＤＰｌｕｓ／ＪＳＴ７５８０（ＪＤｒｅａｍＩＩＩ）

(57)【特許請求の範囲】

【請求項1】

川崎病の患者で合併症の発生リスクを予測するための予測方法であって、
前記予測方法は、学習済みモデルを有する情報処理装置に、前記患者の臨床情報を入力して、前記合併症の発生リスクに関するサンプルスコアについて前記患者での予測値を出力する処理を実行させるステップを含み、
前記合併症は、冠動脈拡大病変であり、
前記学習済みモデルは、既に前記合併症の発生の有無を判定された被験者らにおける各々の被験者の臨床情報と、前記サンプルスコアについて前記各々の被験者での計算値との関係を機械学習させたものであり、
前記各々の被験者の臨床情報は、性別、川崎病の急性期であり且つ抗炎症療法を受けていない時点での月齢、前記時点での冠動脈径、前記時点での全身性血管炎マーカー検査値、前記時点での高サイトカイン血症マーカー検査値、前記時点での静注用免疫グロブリン（ＩＶＩＧ）不応予測スコアの得点、前記時点の後に前記抗炎症療法を受けた回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた３種以上の被験者臨床データを含み、
前記サンプルスコアについて前記各々の被験者での計算値は、前記３種以上の被験者臨床データと、前記各々の被験者での前記合併症の発生の有無に関する判定結果と、を含む４種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータであり、
前記患者の臨床情報は、性別、前記時点での月齢、前記時点での冠動脈径、前記時点での全身性血管炎マーカー検査値、前記時点での高サイトカイン血症マーカー検査値、前記時点でのＩＶＩＧ不応予測スコアの得点、前記時点の後に前記抗炎症療法を受ける予定回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた３種以上の患者臨床データを含む、予測方法。

【請求項2】

ＩｇＡ血管炎の患者で合併症の発生リスクを予測するための予測方法であって、
前記予測方法は、学習済みモデルを有する情報処理装置に、前記患者の臨床情報を入力して、前記合併症の発生リスクに関するサンプルスコアについて前記患者での予測値を出力する処理を実行させるステップを含み、
前記合併症は、紫斑病性腎炎か又は前記紫斑病性腎炎で蛋白尿を伴う症例かであり、
前記学習済みモデルは、既に前記合併症の発生の有無を判定された被験者らにおける各々の被験者の臨床情報と、前記サンプルスコアについて前記各々の被験者での計算値との関係を機械学習させたものであり、
前記各々の被験者の臨床情報は、性別、ＩｇＡ血管炎の急性期であり且つ抗炎症療法を受けていない時点での月齢、前記時点での全身性血管炎マーカー検査値、前記時点での腹痛の有無、前記時点での即時型アレルギー疾患の有無、前記時点での血中ＩｇＡ検査値、前記時点での血中ＩｇＥ検査値、前記時点の後に前記抗炎症療法を受けた回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた４種以上の被験者臨床データを含み、
前記サンプルスコアについて前記各々の被験者での計算値は、前記４種以上の被験者臨床データと、前記各々の被験者での前記合併症の発生の有無に関する判定結果と、を含む５種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータであり、
前記患者の臨床情報は、性別、前記時点での月齢、前記時点での全身性血管炎マーカー検査値、前記時点での腹痛の有無、前記時点での即時型アレルギー疾患の有無、前記時点での血中ＩｇＡ検査値、前記時点での血中ＩｇＥ検査値、前記時点の後に前記抗炎症療法を受ける予定回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた４種以上の患者臨床データを含む、予測方法。

【請求項3】

前記抗炎症療法が、アセチルサリチル酸および／またはその塩の投与、ＩＶＩＧ投与、静注用メチルプレドニゾロンパルス投与、プレドニゾロン投与、インフリキシマブ投与、ウリナスタチン投与、シクロスポリンＡ投与、並びに血漿交換からなる群より選ばれた１種以上の治療方法である、請求項１又は請求項２に記載された予測方法。

【請求項4】

前記サンプルスコアについて前記患者での予測値が所定のカットオフ値以上である場合に、前記患者で前記合併症の発生に至る予測結果を出力する処理を実行するように前記情報処理装置を機能させる、請求項１から請求項３までのいずれか一項に記載された予測方法。

【請求項5】

川崎病の患者で合併症の発生リスクを予測するための学習済みモデルの生成方法であって、
前記生成方法は、既に前記合併症の発生の有無を判定された被験者らにおける各々の被験者の臨床情報が入力層に入力されると、出力層が前記合併症の発生リスクに関するサンプルスコアについて前記各々の被験者での計算値を出力するように機械学習させて、前記学習済みモデルを生成するステップを含み、
前記合併症は、冠動脈拡大病変であり、
前記各々の被験者の臨床情報は、性別、川崎病の急性期であり且つ抗炎症療法を受けていない時点での月齢、前記時点での冠動脈径、前記時点での全身性血管炎マーカー検査値、前記時点での高サイトカイン血症マーカー検査値、前記時点でのＩＶＩＧ不応予測スコアの得点、前記時点の後に前記抗炎症療法を受けた回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた３種以上の被験者臨床データを含み、
前記サンプルスコアについて前記各々の被験者での計算値は、前記３種以上の被験者臨床データと、前記各々の被験者での前記合併症の発生の有無に関する判定結果と、を含む４種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである、学習済みモデルの生成方法。

【請求項6】

ＩｇＡ血管炎の患者で合併症の発生リスクを予測するための学習済みモデルの生成方法であって、
前記生成方法は、既に前記合併症の発生の有無を判定された被験者らにおける各々の被験者の臨床情報が入力層に入力されると、出力層が前記合併症の発生リスクに関するサンプルスコアについて前記各々の被験者での計算値を出力するように機械学習させて、前記学習済みモデルを生成するステップを含み、
前記合併症は、紫斑病性腎炎か又は前記紫斑病性腎炎で蛋白尿を伴う症例かであり、
前記各々の被験者の臨床情報は、性別、ＩｇＡ血管炎の急性期であり且つ抗炎症療法を受けていない時点での月齢、前記時点での全身性血管炎マーカー検査値、前記時点での腹痛の有無、前記時点での即時型アレルギー疾患の有無、前記時点での血中ＩｇＡ検査値、前記時点での血中ＩｇＥ検査値、前記時点の後に前記抗炎症療法を受けた回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた４種以上の被験者臨床データを含み、
前記サンプルスコアについて前記各々の被験者での計算値は、前記４種以上の被験者臨床データと、前記各々の被験者での前記合併症の発生の有無に関する判定結果と、を含む５種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである、学習済みモデルの生成方法。

【請求項7】

川崎病の患者で合併症の発生リスクを予測するための学習済みモデルであって、
前記学習済みモデルは、既に前記合併症の発生の有無を判定された被験者らにおける各々の被験者の臨床情報が入力層に入力され、出力層が前記合併症の発生リスクに関するサンプルスコアについて前記各々の被験者での計算値を出力するように重み付け値が機械学習されたものであり、且つ、前記入力層に前記患者の臨床情報が入力される場合には、入力される前記患者の臨床情報に対して前記重み付け値に基づく演算を行い、前記出力層から前記サンプルスコアについて前記患者での予測値を出力するように情報処理装置を機能させるためのものであり、
前記合併症は、冠動脈拡大病変であり、
前記各々の被験者の臨床情報は、性別、川崎病の急性期であり且つ抗炎症療法を受けていない時点での月齢、前記時点での冠動脈径、前記時点での全身性血管炎マーカー検査値、前記時点での高サイトカイン血症マーカー検査値、前記時点でのＩＶＩＧ不応予測スコアの得点、前記時点の後に前記抗炎症療法を受けた回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた３種以上の被験者臨床データを含み、
前記サンプルスコアについて前記各々の被験者での計算値は、前記３種以上の被験者臨床データと、前記各々の被験者での前記合併症の発生の有無に関する判定結果と、を含む４種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータであり、
前記患者の臨床情報は、性別、前記時点での月齢、前記時点での冠動脈径、前記時点での全身性血管炎マーカー検査値、前記時点での高サイトカイン血症マーカー検査値、前記時点でのＩＶＩＧ不応予測スコアの得点、前記時点の後に前記抗炎症療法を受ける予定回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた３種以上の患者臨床データを含む、学習済みモデル。

【請求項8】

ＩｇＡ血管炎の患者で合併症の発生リスクを予測するための学習済みモデルであって、
前記学習済みモデルは、既に前記合併症の発生の有無を判定された被験者らにおける各々の被験者の臨床情報が入力層に入力され、出力層が前記合併症の発生リスクに関するサンプルスコアについて前記各々の被験者での計算値を出力するように重み付け値が機械学習されたものであり、且つ、前記入力層に前記患者の臨床情報が入力されるときには、入力される前記患者の臨床情報に対して前記重み付け値に基づく演算を行い、前記出力層から前記サンプルスコアについて前記患者での予測値を出力するように情報処理装置を機能させるためのものであり、
前記合併症は、紫斑病性腎炎か又は前記紫斑病性腎炎で蛋白尿を伴う症例かであり、
前記各々の被験者の臨床情報は、性別、ＩｇＡ血管炎の急性期であり且つ抗炎症療法を受けていない時点での月齢、前記時点での全身性血管炎マーカー検査値、前記時点での腹痛の有無、前記時点での即時型アレルギー疾患の有無、前記時点での血中ＩｇＡ検査値、前記時点での血中ＩｇＥ検査値、前記時点の後に抗炎症療法を受けた回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた４種以上の被験者臨床データを含み、
前記サンプルスコアについて前記各々の被験者での計算値は、前記４種以上の被験者臨床データと、前記各々の被験者での前記合併症の発生の有無に関する判定結果と、を含む５種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータであり、
前記患者の臨床情報は、性別、前記時点での月齢、前記時点での全身性血管炎マーカー検査値、前記時点での腹痛の有無、前記時点での即時型アレルギー疾患の有無、前記時点での血中ＩｇＡ検査値、前記時点での血中ＩｇＥ検査値、前記時点の後に前記抗炎症療法を受ける予定回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた４種以上の患者臨床データを含む、学習済みモデル。

【請求項9】

前記学習済みモデルが記憶される記憶部と、
前記患者の臨床情報が入力された場合に、入力された前記患者の臨床情報を前記学習済みモデルに適用して、前記サンプルスコアについて前記患者での予測値を出力する処理を実行する処理部と、
を備える、請求項７又は請求項８に記載された学習済みモデルを有する情報処理装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、川崎病（Kawasaki disease：以下「ＫＤ」ともいう）患者またはＩｇＡ血管炎（IgA vasculitis：以下「ＩｇＡＶ」ともいう）患者での合併症の発生リスクを予測するための予測方法、前記予測のための学習済みモデル及びその生成方法に関する。

【背景技術】

【0002】

川崎病（ＫＤ）は、別名で小児急性熱性皮膚粘膜リンパ節症候群（ＭＣＬＳ）ともいう。ＩｇＡ血管炎（ＩｇＡＶ）は、別名でヘノッホ・シェーンライン紫斑病（ＨＳＰ）、アナフィラクトイド紫斑病、アレルギー性紫斑病、又は血管性紫斑病ともいう。ＫＤとＩｇＡＶとは、それぞれ血管炎の一種であり、小児で好発し、明確な病因が未だ不明という点では共通している。血管炎は、血管炎症候群または全身性血管炎ともいい、血管そのものに炎症を認める疾患の総称である。また、急性期は、病気になり始めて症状が急激に現れる時期である。合併症は、ある病気が原因となって起こる他の病気である。例えば、ＩｇＡＶの急性期には、血管内皮にＩｇＡ型免疫複合体が沈着して、小型動脈炎や糸球体腎炎が惹起される。ＩｇＡＶの３０％から５０％の症例では、ＩｇＡＶ発症より約３０日目頃から、合併症である紫斑病性腎炎（purpura nephritis：以下「ＰＮ」ともいう）が発生する。ＰＮは、ＩｇＡＶ合併症として単に「腎炎」という場合もあれば（非特許文献９参照）、ヘノッホ・シェーンライン紫斑病性腎炎（ＨＳＰＮ）という場合もある。ＰＮは、小児の二次性糸球体腎炎で最も症例が多いといわれ、発症すると血尿を伴う。ＰＮで血尿に高度蛋白尿を伴う症例では、更にネフローゼ症候群を呈して重症化し、腎不全に至る場合がある。

【0003】

また、ＫＤの急性期では、ＫＤ発症より７日目頃から、心臓の冠動脈で血管炎（中動脈血管炎）が惹起される場合がある。さらに、ＫＤ発症より１０日目頃から、中動脈血管炎に起因して、冠動脈径が拡大する病変（冠動脈拡大病変、coronary artery lesion：以下「ＣＡＬ」ともいう）発生に至る場合がある。冠動脈径の拡大の程度が大きいＣＡＬは、冠動脈瘤（coronary artery aneurysm：以下「ＣＡＡ」）ともいい、心筋梗塞による死亡の原因になり得る。心筋梗塞に至らなかったとしても、ＣＡＬ発生による心臓血管後遺症と診断された小児らの大半は、その後の人生で何らかの冠動脈イベントリスクを抱え続けることになる。このため、ＫＤは、小児後天性心臓病の最大の原因といわれている。ＫＤまたはＩｇＡＶの急性期医療を行う担当医には、合併症の発生を抑える観点から、血管炎を早期に終息させることが求められている。

【0004】

図３１に、従来のＫＤ急性期医療Ｓ２０のアルゴリズムを示す。担当医は、ＫＤと診断Ｓ２１した患者を入院させ、患者で発熱持続しているか判断する（Ｓ２２）。既に解熱していると判断した場合には、患者にアセチルサリチル酸（acetylsalicylic acid：以下「ＡＳＡ」ともいう）を投与して経過観察する（Ｓ２３）。発熱持続している場合には、担当医は、患者が後述するＩＶＩＧ不応例に該当するリスクが低リスクであるか否かを判断する（Ｓ２４）。低リスクと判断した場合には、標準的に確立された一次治療Ｓ３０として、中等量のＡＳＡ投与と共に、静注用免疫グロブリン（Intravenous immunoglobulin：以下「ＩＶＩＧ」ともいう）を大量に投与するＩＶＩＧ療法を行い、この際、更に他の抗炎症薬を投与する併用治療を行わない（Ｓ３１）。または、高リスクと判断した場合、担当医は、一次治療Ｓ３０でＩＶＩＧ及びＡＳＡの投与だけでなく、ＣＡＬ発生を避けるために、更に他の抗炎症薬を投与する併用治療を行っても良い（Ｓ３２乃至Ｓ３５）。一次治療Ｓ３０後、担当医は、ＩＶＩＧ投与終了から２４時間以上３６時間以内に、患者が３７．５℃以下に解熱して再燃しない症例である「ＩＶＩＧ反応例」に該当するか否かを判断する（Ｓ３６）。ＩＶＩＧ反応例の患者には、更にＡＳＡ投与して経過観察する（Ｓ２３）。

【0005】

一方、ＫＤ急性期の一部の症例は、一次治療Ｓ３０後に解熱しないか又は再燃し、「ＩＶＩＧ不応例」といわれる。担当医は、ＩＶＩＧ不応例の患者に、二次治療Ｓ４０や更に必要に応じて三次治療以降Ｓ５０を行う。それでも、ＩＶＩＧ不応例のうち一部の症例では、ＣＡＬ発生に至る。ＫＤ急性期のＩＶＩＧ不応例は、その標準的な治療方法が未だ確立されていない。このため、担当医には、二次治療Ｓ４０や三次治療以降Ｓ５０で採り得る治療方法の選択肢として、ＩＶＩＧ再投与（Ｓ４１、Ｓ５１）だけでなく、より抗炎症効果に優れた他の抗炎症療法もある（Ｓ４２乃至Ｓ４４、Ｓ５２乃至Ｓ５６）。担当医は、ＩＶＩＧ不応例の患者ごとに異なる臨床情報に基づき、非特許文献１やＫＤ急性期医療の研究論文など（いわゆるエビデンス）を判断の根拠にして、患者ごとに適すると判断した任意の抗炎症療法を選択し実施してきた。

【0006】

担当医が一次治療Ｓ３０前に判断する（Ｓ２４）時点で、患者がＩＶＩＧ不応例であるか否かを予測するためのリスクスコア（以下「ＩＶＩＧ不応予測スコア」ともいう）として、小林スコア（非特許文献３）、江上スコア（非特許文献４）、及び佐野スコア（非特許文献５）が提唱された（非特許文献１及び２参照）。一部の医師らは、一次治療Ｓ３０前に判断する（Ｓ２４）時点でＩＶＩＧ不応予測スコアの得点から高リスクと判断された患者に対して、その後の一次治療Ｓ３０で、ＩＶＩＧ及びＡＳＡの投与だけでなく、静注用メチルプレドニゾロンパルス（intravenous methylprednisolone：以下「ＩＶＭＰ」という。）投与の併用Ｓ３４を推奨している（非特許文献６参照）。

【先行技術文献】

【特許文献】

【0007】

【特許文献1】特許第６７０３４１２号公報

【非特許文献】

【0008】

【非特許文献1】三浦大、他１４名、「日本小児循環器学会川崎病急性期治療のガイドライン（２０２０年改訂版）」、Pediatric Cardiology and Cardiac Surgery、２０２０年、第３６巻、Supplement 1

【非特許文献2】日本循環器学会、「２０２０年改訂版川崎病心臓血管後遺症の診断と治療に関するガイドライン」、[online]、２０２０年３月、[令和２年７月８日検索]、インターネット、<URL: https://www.j-circ.or.jp/old/guideline/pdf/JCS2020_Fukazawa_Kobayashi.pdf >

【非特許文献3】Tohru Kobayashi、他７名、「Prediction of intravenous immunoglobulin unresponsiveness in patients with Kawasaki disease」、Circulation、２００６年６月、第１１３巻、第２２号、２６０６頁から２６１２頁まで

【非特許文献4】Kimiyasu Egami、他６名、「Prediction of resistance to intravenous immunoglobulin treatment in patients with Kawasaki disease」、The Journal of Pediatrics、２００６年８月、第１４９巻、第２号、２３７頁から２４０頁まで

【非特許文献5】Tetsuya Sano、他７名、「Prediction of non-responsiveness to standard high-dose gamma-globulin therapy in patients with acute Kawasaki disease before starting initial treatment」、European Journal of Pediatrics、２００７年２月、第１６６巻、第２号、１３１頁から１３７頁まで

【非特許文献6】Keiko Okada、他９名、「Pulse methylprednisolone with gammaglobulin as an initial treatment for acute Kawasaki disease」、European Journal of Pediatrics、２００９年２月、第１６８巻、第２号、１８１頁から１８５頁まで

【非特許文献7】日本川崎病学会、特定非営利活動法人日本川崎病研究センター、厚生労働科学研究難治性血管炎に関する調査研究班、「川崎病診断の手引き改訂第６版」、[online]、２０１９年６月、[令和２年６月２５日検索]、インターネット、<URL: http://www.jskd.jp/info/pdf/tebiki201906.pdf >

【非特許文献8】Tohru Kobayashi、他１７名、「A New Z Score Curve of the Coronary Arterial Internal Diameter Using the Lambda-Mu-Sigma Method in a Pediatric Population.」、Journal of the American Society of Echocardiography、２０１６年８月、第２９巻、第８号、７９４頁から８０１頁まで、e29

【非特許文献9】磯部光章、他４９名、「血管炎症候群の診療ガイドライン（２０１７年改訂版）」、[online]、２０１８年６月、[令和３年７月１２日検索]、インターネット、<URL: https://www.j-circ.or.jp/cms/wp-content/uploads/2020/02/JCS2017_isobe_h.pdf >

【発明の概要】

【発明が解決しようとする課題】

【0009】

しかし、従来、ＩＶＩＧ不応予測スコアの感度と特異度とからすれば、担当医にとっては、患者が一次治療Ｓ３０後にＣＡＬ発生に至ることを、一次治療Ｓ３０前に判断する（Ｓ２４）時点で高精度に予測するのは、難しかった。例えば、従来、担当医が、一次治療Ｓ３０前に判断する（Ｓ２４）時点でＩＶＩＧ不応予測スコアの得点から「低リスクの患者である」と予測し、それでも念のためにこの患者に対して一次治療Ｓ３０でＩＶＩＧとＡＳＡとＩＶＭＰとを併用して投与（Ｓ３４）したとしても、この患者が一次治療Ｓ３０後に解熱せずＩＶＩＧ不応例であると明らかになってＣＡＬ発生に至る場合が幾らかあった。このため、仮に、担当医が一次治療Ｓ３０前に判断する（Ｓ２４）時点において「一次治療Ｓ３０でＩＶＭＰを併用Ｓ３４してもＣＡＬ発生に至る」旨を高精度に予測できていれば、例えば、一次治療Ｓ３０で別の抗炎症療法を併用（Ｓ３２、Ｓ３３、Ｓ３５）するように治療方針の変更を検討する余地があったかもしれないと、本願発明者は考えた。

【0010】

一方、ＩＶＩＧ投与（Ｓ３１、Ｓ４１、Ｓ５１）と比べて他の抗炎症療法（Ｓ３２乃至Ｓ３５、Ｓ４２乃至Ｓ４４、Ｓ５２乃至Ｓ５６）では、より抗炎症効果に優れるという利点がある反面、副作用があるか又は実施の手間や費用負担が大きいという欠点もある。このため、従来、ＫＤ急性期医療Ｓ２０を行う担当医は、一般的に、まず併用治療なしＳ３１の一次治療Ｓ３０を行い、その後にＩＶＩＧ不応例であると明らかになった患者に対して、二次治療Ｓ４０以降で初めて他の抗炎症療法（Ｓ４２乃至Ｓ４４、Ｓ５２乃至Ｓ５６）を試すのが通例であった。例えば、担当医が上司や患者の保護者に対して、一次治療Ｓ３０でのＩＶＭＰ併用（Ｓ３４）を提案したとしても、上司や保護者が、ステロイド薬の一種であるＩＶＭＰの副作用を懸念したり、ＩＶＭＰ併用（Ｓ３４）は保険適応の対象外であること憂慮したりして、提案を拒む場合が多くあった。従来、併用療法を行えば高確率でＣＡＬ発生を抑制できる根拠は十分になかったから、担当医は併用療法を実施する方針で関係者らを説得することができず、実際には一次治療Ｓ３０や二次治療Ｓ４０でＩＶＩＧ及びＡＳＡの投与を行うに留めた（Ｓ３１、Ｓ４１）ところ、結局、その後に患者が解熱せずＣＡＬ発生に至る場合があったと考えられる。

【0011】

このため、従来、ＫＤ急性期医療Ｓ２０の担当医にとって、初期の治療方針を決定する過程で、ＩＶＩＧ投与（Ｓ３１、Ｓ４１、Ｓ５１）よりも抗炎症効果に優れる他の抗炎症療法（Ｓ３２乃至Ｓ３５、Ｓ４２乃至Ｓ４４、Ｓ５２乃至Ｓ５６）を選択し早期実施する方針で診断するのは難しい場合が多く、その結果、患者でＣＡＬ発生に至る場合があり得ると本願発明者は考えた。ＩｇＡＶ急性期医療で初期の治療方針を決定する過程でも、同様の問題があり、患者が高度蛋白尿をきたす場合があり得ると考えた。

【0012】

上記した問題を鑑みて本発明の課題は、川崎病またはＩｇＡ血管炎における急性期医療の担当医が合併症の発生を抑える治療方針を早期決定する診断をしやすいように支援する観点から、患者ごとでの合併症の発生リスクをなるべく高精度に予測可能な予測方法と、この予測を行うための学習済みモデル及びその生成方法と、を提供することにある。

【課題を解決するための手段】

【0013】

上記した課題を解決するために、本発明の一実施形態に係る予測方法は、川崎病の患者で合併症の発生リスクを予測するための予測方法であって、前記予測方法は、学習済みモデルを有する情報処理装置に、前記患者の臨床情報を入力して、前記合併症の発生リスクに関するサンプルスコアについて前記患者での予測値を出力する処理を実行させるステップを含み、前記合併症は、冠動脈拡大病変であり、前記学習済みモデルは、既に前記合併症の発生の有無を判定された被験者らにおける各々の被験者の臨床情報と、前記サンプルスコアについて前記各々の被験者での計算値との関係を機械学習させたものであり、前記各々の被験者の臨床情報は、性別、川崎病の急性期であり且つ抗炎症療法を受けていない時点での月齢、前記時点での冠動脈径、前記時点での全身性血管炎マーカー検査値、前記時点での高サイトカイン血症マーカー検査値、前記時点での静注用免疫グロブリン（ＩＶＩＧ）不応予測スコアの得点、前記時点の後に前記抗炎症療法を受けた回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた３種以上の被験者臨床データを含み、前記サンプルスコアについて前記各々の被験者での計算値は、前記３種以上の被験者臨床データと、前記各々の被験者での前記合併症の発生の有無に関する判定結果と、を含む４種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータであり、前記患者の臨床情報は、性別、前記時点での月齢、前記時点での冠動脈径、前記時点での全身性血管炎マーカー検査値、前記時点での高サイトカイン血症マーカー検査値、前記時点でのＩＶＩＧ不応予測スコアの得点、前記時点の後に前記抗炎症療法を受ける予定回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた３種以上の患者臨床データを含む、予測方法である。

【0014】

斯かる構成の予測方法によれば、３種以上の被験者臨床データと、共分散構造分析により算出されるサンプルスコアの計算値との関係を機械学習して生成された学習済みモデルを用いることにより、ＫＤ患者についてＣＡＬ発生に至るか否かの指標となるサンプルスコアの予測値を従来よりも高精度に得ることが可能となる。このため、例えば、ＫＤ急性期医療でＫＤ患者に一次治療を行う前の時点でも、担当医がＣＡＬ発生を抑える治療方針を早期決定する診断をしやすいように、診断の際に判断材料となる予測結果（サンプルスコアの予測値）の情報を出力する形で、この担当医を支援可能である。

【0015】

本発明の他の実施形態に係る予測方法は、ＩｇＡ血管炎の患者で合併症の発生リスクを予測するための予測方法であって、前記予測方法は、学習済みモデルを有する情報処理装置に、前記患者の臨床情報を入力して、前記合併症の発生リスクに関するサンプルスコアについて前記患者での予測値を出力する処理を実行させるステップを含み、前記合併症は、紫斑病性腎炎か又は前記紫斑病性腎炎で蛋白尿を伴う症例かであり、前記学習済みモデルは、既に前記合併症の発生の有無を判定された被験者らにおける各々の被験者の臨床情報と、前記サンプルスコアについて前記各々の被験者での計算値との関係を機械学習させたものであり、前記各々の被験者の臨床情報は、性別、ＩｇＡ血管炎の急性期であり且つ抗炎症療法を受けていない時点での月齢、前記時点での全身性血管炎マーカー検査値、前記時点での腹痛の有無、前記時点での即時型アレルギー疾患の有無、前記時点での血中ＩｇＡ検査値、前記時点での血中ＩｇＥ検査値、前記時点の後に前記抗炎症療法を受けた回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた４種以上の被験者臨床データを含み、前記サンプルスコアについて前記各々の被験者での計算値は、前記４種以上の被験者臨床データと、前記各々の被験者での前記合併症の発生の有無に関する判定結果と、を含む５種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータであり、前記患者の臨床情報は、性別、前記時点での月齢、前記時点での全身性血管炎マーカー検査値、前記時点での腹痛の有無、前記時点での即時型アレルギー疾患の有無、前記時点での血中ＩｇＡ検査値、前記時点での血中ＩｇＥ検査値、前記時点の後に前記抗炎症療法を受ける予定回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた４種以上の患者臨床データを含む、予測方法である。

【0016】

斯かる構成の予測方法によれば、４種以上の被験者臨床データと、共分散構造分析により算出されるサンプルスコアの計算値との関係を機械学習して生成された学習済みモデルを用いることにより、ＩｇＡＶ患者について、ＰＮ発生か又はＰＮで蛋白尿を伴う症例発生に至るか否かの指標となるサンプルスコアの予測値を、従来よりも高精度に得ることが可能となる。このため、例えばＩｇＡＶ急性期医療でＩｇＡＶ患者に初回治療を行う前の時点でも、担当医がＰＮ発生か又はＰＮで蛋白尿を伴う症例発生かを抑える治療方針を早期決定する診断をしやすいように、診断の際に判断材料となる予測結果（サンプルスコアの予測値）の情報を出力する形で、この担当医を支援可能である。

【0017】

本発明に係る予測方法での前記抗炎症療法が、アセチルサリチル酸および／またはその塩の投与、ＩＶＩＧ投与、静注用メチルプレドニゾロンパルス投与、プレドニゾロン投与、インフリキシマブ投与、ウリナスタチン投与、シクロスポリンＡ投与、並びに血漿交換からなる群より選ばれた１種以上の治療方法であり得る。斯かる構成の予測方法によれば、ここで挙げた抗炎症療法の実施予定回数に応じて、患者での合併症発生リスクの予測結果（サンプルスコアの予測値）が異なる可能性がある。このため、例えば、急性期医療の担当医は、合併症発生を抑える治療方針を早期決定する診断をしやすいように、診断の際に判断材料として予測結果（サンプルスコアの予測値）を参考にしやすい。

【0018】

本発明に係る予測方法では、前記サンプルスコアについて前記患者での予測値が所定のカットオフ値以上である場合に、前記患者で前記合併症の発生に至る予測結果を出力する処理を実行するように前記情報処理装置を機能させ得る。斯かる構成の予測方法によれば、予測方法を実施する者にとっては、サンプルスコアの予測値の数値データそのものよりも、患者が合併症発生に至るか否か分かりやすい形で予測結果を得ることができる。

【0019】

本発明の一実施形態に係る生成方法は、川崎病の患者で合併症の発生リスクを予測するための学習済みモデルの生成方法であって、前記生成方法は、既に前記合併症の発生の有無を判定された被験者らにおける各々の被験者の臨床情報が入力層に入力されると、出力層が前記合併症の発生リスクに関するサンプルスコアについて前記各々の被験者での計算値を出力するように機械学習させて、前記学習済みモデルを生成するステップを含み、前記合併症は、冠動脈拡大病変であり、前記各々の被験者の臨床情報は、性別、川崎病の急性期であり且つ抗炎症療法を受けていない時点での月齢、前記時点での冠動脈径、前記時点での全身性血管炎マーカー検査値、前記時点での高サイトカイン血症マーカー検査値、前記時点でのＩＶＩＧ不応予測スコアの得点、前記時点の後に前記抗炎症療法を受けた回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた３種以上の被験者臨床データを含み、前記サンプルスコアについて前記各々の被験者での計算値は、前記３種以上の被験者臨床データと、前記各々の被験者での前記合併症の発生の有無に関する判定結果と、を含む４種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである、学習済みモデルの生成方法である。斯かる構成の学習済みモデルの生成方法によれば、ここで例として挙げた被験者臨床データはいずれも、例えばＫＤ急性期医療の担当医が入手可能な情報である。また、サンプルスコアの計算値は、３種以上の被験者臨床データと、ＣＡＬ発生の有無に関する判定結果とから、共分散構造分析により算出可能である。このため、ＣＡＬ発生リスクを従来よりも高精度で予測可能な学習済みモデルを、例えば従来の一般病院の小児科でも生成可能である。

【0020】

本発明の他の実施形態に係る学習済みモデルの生成方法は、ＩｇＡ血管炎の患者で合併症の発生リスクを予測するための学習済みモデルの生成方法であって、前記生成方法は、既に前記合併症の発生の有無を判定された被験者らにおける各々の被験者の臨床情報が入力層に入力されると、出力層が前記合併症の発生リスクに関するサンプルスコアについて前記各々の被験者での計算値を出力するように機械学習させて、前記学習済みモデルを生成するステップを含み、前記合併症は、紫斑病性腎炎か又は前記紫斑病性腎炎で蛋白尿を伴う症例かであり、前記各々の被験者の臨床情報は、性別、ＩｇＡ血管炎の急性期であり且つ抗炎症療法を受けていない時点での月齢、前記時点での全身性血管炎マーカー検査値、前記時点での腹痛の有無、前記時点での即時型アレルギー疾患の有無、前記時点での血中ＩｇＡ検査値、前記時点での血中ＩｇＥ検査値、前記時点の後に前記抗炎症療法を受けた回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた４種以上の被験者臨床データを含み、前記サンプルスコアについて前記各々の被験者での計算値は、前記４種以上の被験者臨床データと、前記各々の被験者での前記合併症の発生の有無に関する判定結果と、を含む５種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである、学習済みモデルの生成方法である。斯かる構成の学習済みモデルの生成方法によれば、ここで例として挙げた被験者臨床データは、いずれも例えばＩｇＡＶ急性期医療の担当医が入手可能な情報である。また、サンプルスコアの計算値は、４種以上の被験者臨床データと、ＰＮ発生の有無に関する判定結果か又はＰＮで蛋白尿を伴う症例発生の有無に関する判定結果とから、共分散構造分析により算出可能である。このため、ＰＮ発生リスクか又はＰＮで蛋白尿を伴う症例発生リスクを従来よりも高精度で予測可能な学習済みモデルを、例えば従来の一般病院の小児科でも生成可能である。

【0021】

本発明の一実施形態に係る学習済みモデルは、川崎病の患者で合併症の発生リスクを予測するための学習済みモデルであって、前記学習済みモデルは、既に前記合併症の発生の有無を判定された被験者らにおける各々の被験者の臨床情報が入力層に入力され、出力層が前記合併症の発生リスクに関するサンプルスコアについて前記各々の被験者での計算値を出力するように重み付け値が機械学習されたものであり、且つ、前記入力層に前記患者の臨床情報が入力される場合には、入力される前記患者の臨床情報に対して前記重み付け値に基づく演算を行い、前記出力層から前記サンプルスコアについて前記患者での予測値を出力するように情報処理装置を機能させるためのものであり、前記合併症は、冠動脈拡大病変であり、前記各々の被験者の臨床情報は、性別、川崎病の急性期であり且つ抗炎症療法を受けていない時点での月齢、前記時点での冠動脈径、前記時点での全身性血管炎マーカー検査値、前記時点での高サイトカイン血症マーカー検査値、前記時点でのＩＶＩＧ不応予測スコアの得点、前記時点の後に前記抗炎症療法を受けた回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた３種以上の被験者臨床データを含み、
前記サンプルスコアについて前記各々の被験者での計算値は、前記３種以上の被験者臨床データと、前記各々の被験者での前記合併症の発生の有無に関する判定結果と、を含む４種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータであり、前記患者の臨床情報は、性別、前記時点での月齢、前記時点での冠動脈径、前記時点での全身性血管炎マーカー検査値、前記時点での高サイトカイン血症マーカー検査値、前記時点でのＩＶＩＧ不応予測スコアの得点、前記時点の後に前記抗炎症療法を受ける予定回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた３種以上の患者臨床データを含む、学習済みモデルである。斯かる構成の学習済みモデルによれば、既に述べた理由により、ＣＡＬ発生リスクを従来よりも高精度で予測可能な学習済みモデルを、例えば従来の一般病院の小児科でも生成可能である。

【0022】

本発明の他の実施形態に係る学習済みモデルは、ＩｇＡ血管炎の患者で合併症の発生リスクを予測するための学習済みモデルであって、前記学習済みモデルは、既に前記合併症の発生の有無を判定された被験者らにおける各々の被験者の臨床情報が入力層に入力され、出力層が前記合併症の発生リスクに関するサンプルスコアについて前記各々の被験者での計算値を出力するように重み付け値が機械学習されたものであり、且つ、前記入力層に前記患者の臨床情報が入力されるときには、入力される前記患者の臨床情報に対して前記重み付け値に基づく演算を行い、前記出力層から前記サンプルスコアについて前記患者での予測値を出力するように情報処理装置を機能させるためのものであり、前記合併症は、紫斑病性腎炎か又は前記紫斑病性腎炎で蛋白尿を伴う症例かであり、前記各々の被験者の臨床情報は、性別、ＩｇＡ血管炎の急性期であり且つ抗炎症療法を受けていない時点での月齢、前記時点での全身性血管炎マーカー検査値、前記時点での腹痛の有無、前記時点での即時型アレルギー疾患の有無、前記時点での血中ＩｇＡ検査値、前記時点での血中ＩｇＥ検査値、前記時点の後に抗炎症療法を受けた回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた４種以上の被験者臨床データを含み、前記サンプルスコアについて前記各々の被験者での計算値は、前記４種以上の被験者臨床データと、前記各々の被験者での前記合併症の発生の有無に関する判定結果と、を含む５種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータであり、前記患者の臨床情報は、性別、前記時点での月齢、前記時点での全身性血管炎マーカー検査値、前記時点での腹痛の有無、前記時点での即時型アレルギー疾患の有無、前記時点での血中ＩｇＡ検査値、前記時点での血中ＩｇＥ検査値、前記時点の後に前記抗炎症療法を受ける予定回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた４種以上の患者臨床データを含む、学習済みモデルである。斯かる構成の学習済みモデルによれば、ＰＮ発生リスクか又はＰＮで蛋白尿を伴う症例発生リスクを従来よりも高精度で予測可能な学習済みモデルを、例えば従来の一般病院の小児科でも生成可能である。

【0023】

本発明の実施形態に係る学習済みモデルを有する情報処理装置は、前記学習済みモデルが記憶される記憶部と、前記患者の臨床情報が入力された場合に、入力された前記患者の臨床情報を前記学習済みモデルに適用して、前記サンプルスコアについて前記患者での予測値を出力する処理を実行する処理部と、を備えたものであり得る。斯かる構成の学習済みモデルを有する情報処理装置によれば、例えば、従来の一般病院の小児科で急性期医療の担当医が、合併症発生を抑える治療方針を早期決定する診断をしやすいように、診断の際に判断材料となる予測結果（サンプルスコアの予測値）の情報を出力する形で、この担当医を支援可能である。

【発明の効果】

【0024】

以上に説明したように本発明によれば、患者ごとでの合併症の発生リスクをなるべく高精度に予測可能な予測方法と、この予測を行うための学習済みモデル及びその生成方法と、を提供することができる。

【図面の簡単な説明】

【0025】

【図1】本発明の一実施形態に係る学習済みモデルの生成方法の例を示すフローチャート。

【図2】構造方程式モデリング（ＳＥＭ）で共分散構造分析を行う場合に作成し得る、探索的因子分析モデルのパスモデルの例を示すパス図。

【図3】ＳＥＭで共分散構造分析を行う場合に作成し得る、確認的因子分析モデルのパスモデルの例を示すパス図。

【図4】ＳＥＭで共分散構造分析を行う場合に作成し得る、２つの探索的因子分析モデルを含む２次因子モデルのパスモデルの例を示すパス図。

【図5】本発明の一実施形態に係る学習済みモデルの生成方法で用い得る人工ニューラルネットワーク（ＡＮＮ）における構成の一例を示す模式図。

【図6】本発明の一実施形態に係る予測方法の第一例を示すフローチャート。

【図7】本発明の一実施形態に係る予測方法の第二例を示すフローチャート。

【図8】本発明の一実施形態に係る学習済みモデルを有する情報処理装置の一例について、機能構成を示すブロック図。

【図9】ＣＡＬ発生リスクの予測について、第１期研究から第３期研究で被験者らの処理を説明する図。

【図10】ＣＡＬ発生リスク予測に関する第１期研究で、６種の被験者臨床データと、ＣＡＬ発生の有無に関する判定結果と、それぞれ観測変数としてＳＥＭで共分散構造分析を行い、確定したパスモデルを示すモデル図。図１０乃至図１２、図２０、図２１、図２５、図２６、及び図３０の各々で、長方形は観測変数を、ｅは誤差変数を、細い実線で描かれた矢印は因果関係が存在するパスを意味する。図１０乃至図１２、図２１、及び図２６で、楕円は潜在変数を意味する。太い破線で描かれた矢印は、因果関係が存在するパスを意味するが、図１１や図１２とは異なる。

【図11】ＣＡＬ発生リスク予測に関する第２期研究で、６種の被験者臨床データと、ＣＡＬ発生の有無に関する判定結果と、をそれぞれ観測変数としてＳＥＭで共分散構造分析を行い、確定したパスモデルを示すモデル図。太い実線で描かれた矢印は、因果関係が存在するパスを意味するが、図１０や図１２とは異なる。

【図12】ＣＡＬ発生リスク予測に関する第３期研究で、６種の被験者臨床データと、ＣＡＬ発生の有無に関する判定結果と、をそれぞれ観測変数としてＳＥＭで共分散構造分析を行い、確定したパスモデルを示すモデル図。

【図13】第１期研究の被験者ら１０６名について、判定時での冠動脈径最大値のＺスコアが３．０ＳＤ以上でＣＡＬ発生ありと判定する場合に、ＣＡＬ発生ありと判定された被験者らと、ＣＡＬ発生なしと判定された被験者らとで、ＣＡＬ発生リスクに関するサンプルスコアの計算値を比較するグラフ。図１３乃至図１７の各々で、グラフ縦軸はＣＡＬ発生リスクに関するサンプルスコア計算値の大きさを示す。

【図14】第２期研究の被験者ら２０８名について、判定時での冠動脈径最大値のＺスコアが３．０ＳＤ以上でＣＡＬ発生ありと判定する場合に、ＣＡＬ発生ありと判定された被験者らと、ＣＡＬ発生なしと判定された被験者らとで、ＣＡＬ発生リスクに関するサンプルスコア計算値を比較するグラフ。

【図15】第３期研究の被験者ら３１４名について、判定時での冠動脈径最大値のＺスコアが３．０ＳＤ以上でＣＡＬ発生ありと判定する場合に、ＣＡＬ発生ありと判定された被験者らと、ＣＡＬ発生なしと判定された被験者らとで、ＣＡＬ発生リスクに関するサンプルスコア計算値を比較するグラフ。

【図16】第３期研究の被験者ら３１４名について、判定時での冠動脈径最大値のＺスコアが２．５ＳＤ以上でＣＡＬ発生ありと判定する場合に、ＣＡＬ発生ありと判定された被験者らと、ＣＡＬ発生なしと判定された被験者らとで、ＣＡＬ発生リスクに関するサンプルスコア計算値を比較するグラフ。

【図17】第３期研究の被験者ら３１４名について、判定時での冠動脈径最大値のＺスコアが２．０ＳＤ以上でＣＡＬ発生ありと判定する場合に、ＣＡＬ発生ありと判定された被験者らと、ＣＡＬ発生なしと判定された被験者らとで、ＣＡＬ発生リスクに関するサンプルスコア計算値を比較するグラフ。

【図18】ＣＡＬ発生リスク予測について、実施例１−１で機械学習させたＡＮＮの構成を説明する模式図。

【図19】第３期研究の被験者ら３１４名について、平均共分散構造分析で算出されたサンプルスコア計算値と、実施例１−１に係る学習済みモデルから出力されたサンプルスコア予測値との関連性を示すグラフ。矢印は外れ値のプロットを示す。図１９、図２４、及び図２９で、グラフ縦軸はサンプルスコア計算値の大きさを、グラフ横軸はサンプルスコア予測値の大きさを示す。

【図20】比較例１−１に係るパスモデルを示すモデル図。

【図21】ＰＮで高度蛋白尿を伴う症例発生リスク予測について、６種の被験者臨床データと、ＰＮで高度蛋白尿を伴う症例発生の有無に関する判定結果と、をそれぞれ観測変数としてＳＥＭで共分散構造分析を行い、確定したパスモデルを示すモデル図。

【図22】ＩｇＡＶを発症した被験者ら９３名について、ＰＮで高度蛋白尿を伴う症例発生ありと判定された被験者らと、この症例発生なしと判定された被験者らとで、サンプルスコア計算値を比較するグラフ。グラフ縦軸は、ＰＮで高度蛋白尿を伴う症例発生リスクに関するサンプルスコア計算値の大きさを示す。

【図23】ＰＮで高度蛋白尿を伴う症例発生リスク予測について、実施例２−１で機械学習させたＡＮＮの構成を説明する模式図。

【図24】ＰＮで高度蛋白尿を伴う症例発生リスク予測に関する被験者ら９３名について、平均共分散構造分析で算出されたサンプルスコア計算値と、実施例２−１に係る学習済みモデルから出力されたサンプルスコア予測値との関連性を示すグラフ。

【図25】比較例２−１に係るパスモデルを示すモデル図。

【図26】ＰＮ発生リスク予測について、５種の被験者臨床データと、ＰＮ発生の有無に関する判定結果と、をそれぞれ観測変数としてＳＥＭで共分散構造分析を行い、確定したパスモデルを示すモデル図。

【図27】ＩｇＡＶを発症した被験者ら９３名について、ＰＮ発生ありと判定された被験者らと、ＰＮ発生なしと判定された被験者らとで、サンプルスコア計算値を比較するグラフ。グラフ縦軸は、ＰＮ発生リスクに関するサンプルスコア計算値の大きさを示す。

【図28】ＰＮ発生リスク予測について、実施例３−１で機械学習させたＡＮＮの構成を説明する模式図。

【図29】ＰＮ発生リスク予測に関する被験者ら９３名について、平均共分散構造分析で算出されたサンプルスコア計算値と、実施例３−１に係る学習済みモデルから出力されたサンプルスコア予測値との関連性を示すグラフ。

【図30】比較例３−１に係るパスモデルを示すモデル図。

【図31】ＫＤ急性期医療のアルゴリズムを説明するフロー図。非特許文献１参照。

【発明を実施するための形態】

【0026】

［ＫＤでのＣＡＬ発生リスク予測用の学習済みモデル生成方法］
本願発明者は、本発明を完成させるまでの過程で、次のように考えた。従来、ＫＤ急性期患者がＣＡＬ発生に至るリスクを、図３１における一次治療Ｓ３０前に判断する（Ｓ２４）時点で高精度に予測するのは難しかった。その原因は、患者ごとにＣＡＬ発生と関連性がある未知の因子が隠れているため、つまり、患者ごとに異なる体質（遺伝的素因や環境要因）が潜在しているためと考えた。この考えに基づき、本願発明者は、共分散構造分析に着目した。従来、共分散構造分析は、社会学、心理学、又はマーケティング等の分野で、幾つかの未知の因子が含まれる複雑な問題を分析するのに活用されていた（例えば特許文献１参照）が、本願発明者が知り得る限り、臨床医学分野で潜在変数と体質との因果関係を説明するために活用した前例は皆無であった。小児の臨床医学では、複数の臨床的指標の間に複雑な関連性が存在すると考えられる場合がある。このため、例えば、小児科医が日常診療の現場で取得可能な、ＫＤ急性期患者の検査値などの臨床情報に基づいて、共分散構造分析により、一次治療Ｓ３０後のＣＡＬ発生を一次治療Ｓ３０前に予測するという複雑な問題を解明できる可能性があると考えた。

【0027】

そこで、当初、本願発明者は、過去にＫＤ急性期医療Ｓ２０を行ってＣＡＬ発生の有無を評価した被験者らについて、ＫＤ急性期医療Ｓ２０を行った当時に得られた臨床情報を用いて、共分散構造分析を行った。共分散構造分析には、ＣＡＬ発生に対して因果関係を有するであろう変数（臨床データ）を臨床情報から任意に抽出して、この因果関係を検証可能という利点がある。しかし、共分散構造分析により作成した統計モデルには、新規ＫＤ患者の臨床データをこの統計モデルに適用して新規ＫＤ患者がＣＡＬ発生に至るか否かの予測値を算出することが、できないという欠点があった。ここで、本願発明者が試験的に、既にＣＡＬ発生の有無を評価された被験者らの臨床情報と、この臨床情報を用いて共分散構造分析により算出したサンプルスコア（sample score：以下「ＳＳ」ともいう）の計算値とを、学習用データとして人工ニューラルネットワーク（artificial neural network：以下「ＡＮＮ」ともいう）に機械学習させた。つまり、本願発明者は、共分散構造分析とＡＮＮ解析とを組み合わせて試行した。その結果、生成された学習済みモデルにより、意外にも、ＣＡＬ発生との間で高い相関関係を有するＳＳの予測値を得ることができた。このため、本願発明者は、患者ごとでの合併症の発生リスクをなるべく高精度に予測可能な予測方法と、この予測を行うための学習済みモデル及びその生成方法とを提供可能なことを見出し、本発明を創作するに至った。以下、図面を用いて本発明の実施形態を説明する。

【0028】

図１に示す、本発明の一実施形態に係る学習済みモデル生成方法Ｓ１ａは、被験者らの臨床情報取得ステップＳ２ａと、学習前の正規化ステップＳ３ａと、共分散構造分析ステップＳ４ａと、学習ステップＳ６ａと、選別ステップＳ７ａとを含む。

【0029】

被験者らの臨床情報取得ステップＳ２ａでは、学習用データを作成するために、例えば図３１に示すＫＤ急性期医療Ｓ２０で既に少なくとも一次治療Ｓ３０を受けた後にＣＡＬ発生の有無を判定された被験者らについて、この被験者らに含まれる各々の被験者の臨床情報と、各々の被験者でのＣＡＬ発生の有無に関する判定結果と、を取得する。一次治療Ｓ３０は、first lineともいわれる。図１に示すステップＳ２ａで取得する臨床情報や判定結果は、以下に説明するように医師（医師から指示を受けた者を含む。以下同じ。）が各々の被験者について診断や治療を行った結果、既に生成された情報である。この情報が生成されるまでの過程で医師が行った診断や治療の工程は、本発明やステップＳ２ａに含まれない。

【0030】

ＡＮＮの機械学習に適したデータを選定する観点から、生成方法Ｓ１ａにおける各々の被験者は、定型例ＫＤか又は不全型ＫＤ（ＫＤ類例）と医師に診断された患者でも良く、好ましくは定型例ＫＤと医師に診断された患者である。なお、非特許文献７に記載されたＫＤ診断基準では、以下に説明するＫＤの６種の主要症状のうち、５種以上の症状を呈する受診者は定型例ＫＤと診断され、４種の症状を呈する受診者は定型例ＫＤ又は不全型ＫＤと診断される。３種の症状を呈する受診者は、他の疾患が否定され「症候または所見」からＫＤが最も考えられる場合、不全型ＫＤと診断される。ＫＤの６種の主要症状は、（１）発熱、（２）両側眼球結膜の充血、（３）口唇または口腔所見：口唇の紅潮、いちご舌、又は口腔咽頭粘膜のびまん性発赤、（４）発疹（ＢＣＧ接種痕の発赤を含む）、（５）四肢末端の変化：急性期での手足の硬性浮腫または掌蹠もしくは指趾先端の紅斑、並びに（６）急性期での非化膿性頸部リンパ節腫脹である。ここでの「症候または所見」は、例えば、病初期のトランスアミナーゼ値の上昇、乳児の尿中白血球数増加、脳性ナトリウム利尿ホルモン（以下「ＢＮＰ」ともいう）またはＮＴ−ｐｒｏＢＮＰの上昇、心臓超音波検査での僧帽弁閉鎖不全または心膜液貯留、胆嚢腫大、および、低アルブミン血症又は低ナトリウム血症、からなる群より選ばれた１種以上の症候または所見である。

【0031】

被験者らの人数は、学習用データを充実させて予測精度を高める観点から、例えば３０名以上、好ましくは５０名以上、更に好ましくは１００名以上であり、１００名を超えて人数が多いほど更により好ましい。同様の観点から、被験者らには、二次治療や三次治療を受けてＣＡＬ発生に至らなかったＩＶＩＧ不応例の被験者や、二次治療や三次治療を受けたがＣＡＬ発生に至ったＩＶＩＧ不応例の被験者のみならず、主にＩＶＩＧ療法による一次治療で解熱してＣＡＬ発生に至らなかったＩＶＩＧ反応例の被験者も、それぞれなるべく多くの人数を含めるのが好ましい。

【0032】

生成方法Ｓ１ａでの各々の被験者の臨床情報は、ＣＡＬ発生との間に直接的または間接的な因果関係を有しやすい臨床データである観点から、性別、ＫＤ急性期であり且つ抗炎症療法を受けていない時点（以下「一次治療前時点」ともいう）での月齢、一次治療前時点での冠動脈径、一次治療前時点での全身性血管炎マーカー検査値、一次治療前時点での高サイトカイン血症マーカー検査値、一次治療前時点でのＩＶＩＧ不応予測スコアの得点、一次治療前時点の後に抗炎症療法を受けた回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた３種以上の被験者臨床データ、例えば４種以上でも良く、好ましくは５種以上、更に好ましくは６種以上の被験者臨床データを含む。ここでの「間接的に示すデータ」とは、当業者であれば目的のデータを概ね推定可能なデータ、又は、何らかの変換を行えば目的のデータを概算可能なデータである。例えば、各々の被験者の年齢（例えば１．５歳）は、数値を１２倍する変換を行えば月齢（例えば１８ヵ月齢）を概算可能なため、月齢を間接的に示すデータに該当する。このように、目的のデータと相関するデータは、目的のデータを間接的に示すデータの一種といえる。

【0033】

上記した一次治療前時点は、予測精度を高める観点から、例えば、ＫＤを発症した日（ＫＤ発症日）を０日目としてＫＤ発症日から実質的に７日以内であり、且つ、一次治療を受けていない時点である。本明細書で「実質的に」とは、例外が存在しても、内容や本質において本発明の目的や作用効果の妨げにならない程度に過ぎなければ許容されることを意味する。例えば、小児がＫＤ発症から数日後に保護者に連れられて初回受診した場合、保護者が症状の発症日を覚えていなければ、医師は正確なＫＤ発症日を特定できないが、この様な場合でも例えば小児の症候または所見から「おそらくＫＤ発症から７日以内であろう」と医師が判断可能な時点は「ＫＤ発症から実質的に７日以内」に該当する。初回受診時にＫＤの主要症状が十分に現れておらずＫＤと診断されなかったが、数日後の再受診時にＫＤと診断された場合、ＫＤ以外の疾患が否定されれば、ＫＤ発症日は初回受診の原因となった症状の発症日である。

【0034】

被験者臨床データの一例として挙げた性別は、例えば出生時の身体的構造または性染色体などから判断可能な、生物学的な性別を示すデータである。例えば、各々の被験者での血中性ホルモン濃度の検査値は、当業者であればこの検査値に基づき各々の被験者の性別を概ね推定可能であるため、性別を間接的に示すデータに該当する。

【0035】

被験者臨床データの一例として挙げた冠動脈径は、例えば、径拡大が疑われる複数箇所で冠動脈直径（冠動脈内径）を測定して得られた平均値、中央値、最大値、又はこれらのいずれかを間接的に示すデータでも良いが、予測精度を高める観点から、冠動脈の直径を測定して得られた最大値が好ましい。冠動脈径を間接的に示すデータとして例えば、冠動脈半径の測定値が挙げられる。なお、従来、小児科の日常診療の現場で担当医（小児科医）は、ＫＤと診断する際、断層心エコー法で検査機器のズーム機能を活用して冠動脈径を実測してきた。冠動脈径のデータは、現場の担当医にとって簡便な観点では断層心エコー法による実測値であるのが好ましく、または、更に正確に測定可能な観点では、心臓カテーテル検査による冠動脈造影、造影ＣＴ検査、もしくはＭＲＩを用いた検査での測定値であるのも好ましい。

【0036】

ＣＡＬ発生しやすい部位である観点から、径を測定する冠動脈の部位は、左冠動脈主幹部（left main coronary trunk artery：以下「ＬＭＴ」という）、左冠動脈前下行枝（left anterior descending coronary artery：以下「ＬＡＤ」という）近位部、左冠動脈回旋枝、及び右冠動脈（right coronary artery：以下「ＲＣＡ」という）近位部、からなる群より選ばれた１種以上の部位であるのが好ましい。冠動脈径のデータは、後の予測精度を高める観点では、ここで挙げた冠動脈の部位の全てのうち又は１種以上の部位のうちでの最大値のデータであるのが好ましい。あるいは、冠動脈の部位別にＣＡＬ発生の危険性を予測可能にする観点では、各々の被験者について、ここで挙げた部位ごとの冠動脈径の最大値のデータを取得しても良い。

【0037】

冠動脈径の計測値データを、例えば次の数式１により、仮説母集団での冠動脈径の平均値（研究論文に記載された日本の小児における冠動脈径の推定平均値）が０となり、仮説母集団での冠動脈径の標準偏差（ＳＤ）が１．０となるように、Ｚスコアに変換しても良い。冠動脈の部位別に冠動脈径の計測値データを取得した場合、部位別にＺスコアに変換しても良い。

【0038】

【数1】

【0039】

小児は、齢を重ねて体格成長し、身長と体重とから算出される体表面積を増すほど、健常時の冠動脈径も増す。このため、例えば、１歳児と５歳児とで同じ冠動脈径が計測されても、１歳児でＣＡＬ発生ありと判定され、５歳児でＣＡＬ発生なしと判定される場合があり得る。齢や体表面積が各々異なる被験者らについて、体格成長に伴って冠動脈径が拡大する要素を考慮して修正されたＺスコアを取得可能な観点から、冠動脈径の計測値を、次の数式２に示すＬＭＳ法でＺスコアに変換するのが好ましい。ＬＭＳ法は、体表面積ごとの冠動脈径の計測値の分布をひとつひとつ正規分布化させて、歪度（λ，Ｌ）、中央値（Ｍ）、及び変動係数（Ｓ）(ＳＤ／Ｍ）により分布を変化させる統計学的手法である。

【0040】

【数2】

【0041】

標本数と研究手法の観点から従来、小児科の日常臨床の現場で高い信用度で汎用されている観点から、Z score project（例えば非特許文献８）又はその2nd stageの研究成果として作成された冠動脈内径の標準曲線を考慮したＬＭＳ法の計算式に基づき、各々の被験者での冠動脈径をＺスコアに変換するのが更に好ましい。本願出願当時では例えばインターネットで、小児冠動脈内径Z Score計算アプリを利用可能なウェブサイト（https://kwsd.info/）、または、Coronary Z Score Calculatorをダウンロード可能なウェブサイト（例えばhttp://raise.umin.jp/zsp2/data/zsp_calculator_version4_full.xlsx若しくはhttp://raise.umin.jp/zsp2/data/zsp_calculator_version4_light.xlsx）にアクセスし、各々の被験者の性別、身長、体重、及び冠動脈の各部の計測値のデータを入力すれば、冠動脈の各部それぞれのＺスコアを算出可能である。同様の観点から、本願の出願後にCoronary Z Score Calculatorのversion5以降が公開されるか、又はZ score project 2nd stageを発展させた研究成果として作成された冠動脈径の計算式が公開される等した場合、日本川崎病学会で推奨などされている最新の計算方法により、各々の被験者の冠動脈径をＺスコアに変換するのが好ましい。

【0042】

被験者臨床データの一例として挙げた全身性血管炎マーカー検査値は、全身性の血管炎やこれに伴う組織（例えば血管内皮）破壊の指標となる検査値である。全身性血管炎マーカーとして例えば、赤血球沈降速度、血清補体価、または、血中もしくは血清中の、ペントラキシンスーパーファミリー濃度、免疫複合体濃度、プロカルシトニン濃度、フィブリン分解産物濃度、及びこれらのいずれかに代用可能なマーカー検査値が挙げられる。ペントラキシンスーパーファミリーとして例えば、ペントラキシン−３、アミロイドＰ、又はＣ反応性蛋白（C-reactive protein：以下「ＣＲＰ」ともいう）等が挙げられる。小児科臨床の現場で簡便に広く活用されてきた検査値であり臨床応用しやすい観点から、全身性血管炎マーカー検査値は、血球沈降速度か又は血液中もしくは血清中のＣＲＰ濃度であるのが好ましく、血清中ＣＲＰ濃度であるのが更に好ましい。

【0043】

被験者臨床データの一例として挙げた高サイトカイン血症マーカー検査値は、いわゆるサイトカインストーム、又はサイトカイン放出症候群の指標となる検査値である。高サイトカイン血症マーカー検査値として例えば、血中または血清中における、ＴＮＦ−α、インターフェロン、ＩＬ−１β、ＭＣＰ−１、又はＩＬ−６などの抗炎症性サイトカインの濃度の検査値が挙げられる。予測精度を高める観点から、高サイトカイン血症マーカー検査値としては、血中もしくは血清中のＩＬ−６濃度、または、尿中β２マイクログロブリン濃度が好ましい。高サイトカイン血症マーカー検査値は、従来から一般病院（入院治療可能な二次医療機関）の小児科臨床の現場において一般検査で簡便に広く活用されているから、検査費用が安価で済み、また、患者がＫＤと診断され入院してから一次治療を受けるまでの例えば３日以内でも一般病院で検査結果を得やすいため、臨床応用しやすい観点から、尿中におけるβ２マイクログロブリンのクレアチニンに対する濃度比（以下「尿中β２ＭＧ／Ｃｒ」ともいう）であるのが更に好ましい。

【0044】

被験者臨床データの一例として挙げたＩＶＩＧ不応予測スコアの得点として、例えば、岩佐スコアまたは原田スコア等のＩＶＩＧ不応例を予測するためのリスクスコアにより算出された得点のデータが挙げられる（非特許文献２参照）。ＩＶＩＧ不応予測スコアの得点は、従来の小児科の日常診療の現場で活用されている観点から、小林スコア（非特許文献１及び３と次の表１）、江上スコア（非特許文献１及び４と次の表２）、又は佐野スコア（非特許文献１及び５と次の表３）により算出される得点のデータであるのが好ましく、更に好ましくは佐野スコアにより算出される得点のデータである。ＩＶＩＧ不応予測スコアの得点を間接的に示すデータとして、この得点に基づいてＩＶＩＧ不応に該当するリスクが高リスクか否かの判定結果が挙げられる。例えば、一次治療前時点で佐野スコアの得点が２点以上である被験者は、一次治療後にＩＶＩＧ不応に該当するリスクが高い（高リスク）と判定され、または、２点未満である被験者は一次治療後にＩＶＩＧ不応に該当するリスクが低い（低リスク）と判定される。次の表１から表３に関して「病日」は、ＫＤを発症した日（ＫＤ発症日）を０日目として、このＫＤ発症日から何日目であるか示す単位である。「感度」は、検査で検出したい疾患を有するもののうち、検査で正しく陽性と判定されたものが占める割合である。「特異度」は、検査で検出したい疾患を有さないもののうち、検査で正しく陰性と判定されたものが占める割合である。

【0045】

【表1】

【0046】

【表2】

【0047】

【表3】

【0048】

本明細書での抗炎症療法は、疾患の医療に関するガイドライン（例えば非特許文献１）又は研究論文（いわゆるエビデンス）で抗炎症効果が報告された治療方法である。被験者臨床データの一例として挙げた、一次治療前時点の後に抗炎症療法を受けた回数は、患者が一次治療からＣＡＬ発生の有無を判定した時点までの間に抗炎症療法を受けた回数のデータである。抗炎症療法を受けた回数を間接的に示すデータとして、例えば、抗炎症療法の実施の有無のデータが挙げられる。抗炎症療法として、例えば図３１で例示されているように、アセチルサリチル酸（ＡＳＡ）及び／又はその塩の投与、ＩＶＩＧ投与、ＩＶＭＰ投与、プレドニゾロン（prednisolone：以下「ＰＳＬ」ともいう）投与、インフリキシマブ（Infliximab：以下「ＩＦＸ」ともいう）投与、ウリナスタチン（ulinastatin：以下「ＵＴＩ」ともいう）投与、シクロスポリンＡ（Cyclosporine A：以下「ＣｓＡ」ともいう）投与、及び血漿交換からなる群より選ばれた１種以上の治療方法が挙げられる（非特許文献１参照）。ＡＳＡは、アスピリン（登録商標）ともいわれる。ＡＳＡの塩は、薬理学的に許容可能な塩であれば良く、好ましくはナトリウム塩またはカリウム塩である。ＩＶＩＧ不応と予測される患者で一次治療後にＣＡＬ発生に至るか否かを予測可能にする観点から、ここでの抗炎症療法は、ＩＶＭＰ投与、ＣｓＡ投与、及び血漿交換からなる群より選ばれた１種以上の治療方法であるのが更に好ましく、この１種以上の治療法とＩＶＩＧ投与および／又はＡＳＡ投与との併用であるのも更に好ましい。

【0049】

ＡＳＡ及び／又はその塩の投与、ＩＶＩＧ投与、ＩＶＭＰ投与、ＩＦＸ投与、ＵＴＩ投与、及びＣｓＡ投与の各々では、通常、実施時に被験者は薬物を血管内投与されるため、抗炎症療法を受けた回数を数えやすい。血漿交換では、通常、実施時に被験者は所定量の血液製剤を血管内投与されるため、抗炎症療法を受けた回数を数えやすい。一方、例えばＰＳＬのように患者に抗炎症薬を経口投与する抗炎症療法では、患者に抗炎症薬が一定期間にわたり経口投与される場合に患者が抗炎症療法を１回受けたものとして数え、その後、一旦、投薬が中断されてから、抗炎症療法が再開されて改めて抗炎症薬が一定期間にわたり経口投与される場合に患者が２回目の抗炎症療法を受けたものとして数える。また、ＫＤ急性期医療で担当医がいずれの抗炎症療法を選択するかに応じてＣＡＬ発生リスクがどのように変化するか検証可能にする観点では、各々の被験者が複数種類の抗炎症療法を受けた場合、抗炎症療法を受けた回数のデータでは、被験者が受けた抗炎症療法の種類ごとに複数項目を設けても良い。例えば、ある被験者について、ＩＶＩＧ投与を受けた回数が１回、ＡＳＡ投与を受けた回数が１回、ＩＶＭＰ投与を受けた回数が２回などという様に被験者臨床データを取得しても良い。

【0050】

各々の被験者の臨床情報には、「性別、一次治療前時点での月齢、一次治療前時点での冠動脈径、一次治療前時点での全身性血管炎マーカー検査値、一次治療前時点での高サイトカイン血症マーカー検査値、ＩＶＩＧ不応予測スコアの得点、一次治療前時点の後に抗炎症療法を受けた回数、及びこれらを間接的に示すデータからなる群より選ばれた３種以上の被験者臨床データ」の他にも、ＫＤ急性期に各々の被験者から取得可能な臨床データであり、且つ、ＫＤ急性期におけるＣＡＬ発生との間で直接的または間接的な因果関係を有する臨床データであれば、予測精度の向上に貢献し得るため、臨床情報に含める形で取得しても良い。この様な臨床データとして、例えば、一次治療前時点での心不全マーカー検査値、又はこの検査値を間接的に示すデータ等が挙げられる。心不全マーカー検査値として例えば、心臓性トロポニン、心房性ナトリウム利尿ぺプチド（ＡＮＰ）、Ｎ末端（ＮＴ）−ｐｒｏＡＮＰ、ｐｒｏＡＮＰ、ＢＮＰ、ｐｒｏＢＮＰ、ＮＴ−ｐｒｏＢＮＰ、トロポニン、及び血中尿素窒素（ＢＵＮ）からなる群より選ばれた１種以上のバイオマーカーの検査値が挙げられる。本明細書で既に述べた全身性血管炎マーカー（例えばＣＲＰ）や高サイトカイン血症マーカーは、心不全マーカーに含まれない。ここで挙げた心不全マーカーは、従来、小児科臨床の現場で馴染みのない特殊検査の検査値であり、一般病院（二次医療機関）では外注を要して費用が高額となり、また、被験者がＫＤと診断され入院してから一次治療を受けるまで例えば３日以内では外注先から検査結果を得るのが間に合わない場合が多いため、生成方法Ｓ１ａの臨床応用を容易にする観点では、各々の被験者の臨床情報に心不全マーカー検査値またはこれを間接的に示すデータを含まないのが好ましい。

【0051】

ＣＡＬ発生の有無に関する判定結果は、各々の被験者で一次治療後の所定期間内（例えば一次治療後かつＫＤ発症から９０日以内）に、ＣＡＬが形成されているか否かを医師が検査し判定した結果のデータである。ＣＡＬ発生に至る症例ではＫＤ発症から３０日以内にＣＡＬが形成される場合が多い観点から、ここでの「一次治療後の所定期間内」は、一次治療後かつＫＤ発症から３０日以内であるのが好ましい。判定結果は、前述した「一次治療前時点での冠動脈径」と対応する部位での判定結果であるのが好ましい。例えば、各々の被験者で、一次治療前時点で複数箇所の冠動脈で径を測定して最大値のデータを１つのみ取得した場合、ＣＡＬ発生の有無の判定結果でも同様に幾つかの部位のうちで径の最大値を１つのみ取得して判定された結果であるのが良い。あるいは、各々の被験者で、一次治療前時点で冠動脈の部位別に径の最大値を取得した場合、ＣＡＬ発生の有無の判定結果でも同様に幾つかの部位別に径の最大値を取得して判定された結果であるのが良い。

【0052】

ＣＡＬ発生の有無に関する判定結果は、例えば各々の被験者の体表面積が同程度であれば、判定時に冠動脈直径の最大値が所定の閾値（例えば２ｍｍ）以上である場合にＣＡＬ陽性（ＣＡＬ発生あり）と判定し、または、最大値が所定の閾値未満である場合にＣＡＬ陰性（ＣＡＬ発生なし）と判定したデータでも良い。体格成長に伴い冠動脈径が拡大する要素を考慮してＣＡＬ発生の有無を判定する観点から、判定結果は、前述したＬＭＳ法またはZ score project等の研究成果である計算式に基づいて、各々の被験者での判定時の冠動脈径をＺスコアに変換し、Ｚスコアの値が所定値以上である場合にＣＡＬ陽性と判定され、又は所定値未満である場合にＣＡＬ陰性と判定された結果であるのが好ましい。冠動脈瘤（ＣＡＡ）に至らないＣＡＬでも発生リスクを予測する観点では、例えば、Ｚスコアが１．５ＳＤ以上である場合にＣＡＬ陽性と判定されても良いし、米国と同様Ｚスコアが２．０ＳＤ以上である場合にＣＡＬ陽性と判定されるも好ましい。予測精度を更に高める観点では、好ましくはＺスコアが２．５ＳＤ以上である場合に、更に好ましくはＺスコアが３．０ＳＤ以上である場合に、それぞれＣＡＬ陽性と判定されるのが望ましい。ＣＡＡ発生リスクを予測する場合、判定基準は５．０ＳＤ以上が好ましい。ＣＡＡのうち巨大瘤の発生リスクを予測する場合、判定基準は１０．０ＳＤ以上が好ましい。

【0053】

学習前の正規化ステップＳ３ａでは、後で共分散構造分析や機械学習を効率良く行うために、先のステップＳ２ａで得た臨床情報に含まれる３種以上の被験者臨床データと、ＣＡＬ発生の有無に関する判定結果とを、それぞれ情報処理装置で演算しやすいように正規化する。正規化とは、データを一定の規則に基づいて利用しやすいように変形する処理である。正規化後データは、正規化前データを概ね再現可能であるため、正規化前データを間接的に示すデータに該当する。例えば、性別などの数値でないデータは、例えば男性を１に変換し、女性を０に変換する等して正規化するのが好ましい。例えば、月齢などの数値データは、次の数式３により０以上１．０以下の範囲内に含まれるように正規化するのが好ましい。

【0054】

【数3】

【0055】

後に機械学習を行う際、入力変数に０又は１．０の近似値が含まれていなければ演算しやすい観点から、各々の被験者の臨床情報に含まれる３種以上の被験者臨床データを、０．１０以上０．９０以下の範囲内に含まれるように正規化するのが更に好ましい。例えば性別のように数値でないデータは、男性を０．９０に変換し、女性を０．１０に変換する等して正規化すれば良い。同様の観点から、臨床情報に含まれる例えば月齢などの数値データは、次の数式４により０．１０以上０．９０以下の範囲内に含まれるように正規化するのが更に好ましい。

【0056】

【数4】

【0057】

各々の被験者でのＣＡＬ発生の有無に関する判定結果は、後の共分散構造分析ステップでは用いられるが、更にその後の機械学習では特に用いられない。このため、この判定結果は例えば、ＣＡＬ陽性とＣＡＬ陰性とのいずれか一方を０に変換するように正規化し、残る他方を１．０に変換するように正規化するのが好ましい。各々の被験者で冠動脈の部位別にＣＡＬ発生の有無の判定結果を取得した場合、部位別にＣＡＬ陽性か又はＣＡＬ陰性かに応じて、部位別に０又は１．０に正規化するのが好ましい。

【0058】

各々の被験者の臨床情報に含まれる３種以上の被験者臨床データと、各々の被験者でのＣＡＬ発生の有無の判定結果とについて、先のステップＳ２ａでいきなり正規化後データを取得可能な場合には、学習前の正規化ステップＳ３ａを省略可能である。例えば、先のステップＳ２ａで取得した時点で、ＣＡＬ発生の有無に関する判定結果のデータが既に０又は１．０であった場合、このデータを更に正規化することを特に要しない。

【0059】

共分散構造分析は、複数の変数（複数種のデータ）間の関係を検討可能な統計分析手法の一つである。共分散構造分析ステップＳ４ａでは、各々の被験者についてＣＡＬ発生との間で高い相関関係を有するＳＳ計算値を算出するために、情報処理装置を用いて共分散構造分析を行う。このためには、各々の被験者について４種以上の観測変数を設ける。観測変数とは、実際に観測（計測）されたデータ又はその正規化後データである。ここで４種以上の観測変数の内訳は、各々の被験者の臨床情報に含まれる３種以上の被験者臨床データと、各々の被験者での「ＣＡＬ発生の有無に関する判定結果」との組み合わせである。共分散構造分析で各々の観測変数として用いるデータは、数値データであれば良く、必ずしも０以上１．０以下の範囲内にある数値データでなくても良い。また、共分散構造分析を行うために、各々の被験者での「ＣＡＬ発生の有無に関する判定結果」に係る観測変数に対して、直接的な因果関係を有すると仮定される潜在変数を設ける。潜在変数とは、実際には観測されていない仮説的なデータである。４種以上の観測変数と、潜在変数と、を設けた上で、情報処理装置に共分散構造分析を行うよう演算処理を実行させ、「ＣＡＬ発生の有無に関する判定結果」に係る観測変数に対して、直接的な統計学的に有意な因果関係が認められた潜在変数について、因子得点のデータを算出させる。ここでの有意とは、例えばｐ＜０．０５、好ましくはｐ＜０．００１である。ここで算出された因子得点の数値データそのものか、又はこの数値データそのものを再現可能な範囲内で正規化させたデータを、各々の被験者でのＣＡＬ発生リスクに関するＳＳ計算値とする。

【0060】

共分散構造分析に用いる情報処理装置は、共分散構造分析の演算処理が可能であれば特に限定されない。例えば、市販のパーソナルコンピュータで、ＡＭＯＳ（Analysis of Moment Structure）、ＳＡＳ（Statistical Analysis System）、ＬＩＳＲＥＬ（Linear Structure Relations）、又はＥＱＳ（Structural Equation Modeling Software）等の統計解析用ソフトウェアを用いて共分散構造分析を行うことができる。後の予測精度を高める観点では、共分散構造分析ステップＳ４ａで、平均共分散構造分析を行うのが好ましい。平均共分散構造分析は、ある変数の平均値と他の変数の平均値との差である切片を変数間の関係に導入して、推定すべきパス係数や分散にこの切片を含める共分散構造分析である。また、パスモデルを用いて直感的に統計解析を行うことが可能な観点では、構造方程式モデリング（Structural Equation Modeling：以下「ＳＥＭ」ともいう）により共分散構造分析を行うのが好ましく、ＳＥＭにより平均共分散構造分析を行うのが更に好ましい。例えばＡＭＯＳを用いれば、ＳＥＭにより平均共分散構造分析を行うことができる。

【0061】

ＳＥＭのパスモデルとして例えば、図２に例示するように複数の観測変数に対して１つの潜在変数が直接的な因果関係を有する探索的因子分析モデルか、図３に例示するように各々の観測変数に対して２つ以上の潜在変数が直接的な因果関係を有し且つ潜在変数間に相関関係を有する確認的因子分析モデルか、図４に例示するように探索的因子分析モデルを複数含んで成る二次因子モデルか、又はこれらのモデルで少なくとも一部の観測変数間に有意と認められる因果関係が規定されるように変形させたモデル等が挙げられる。パスモデルにおいて、単方向矢印は因果関係を表し、矢印の元にある変数が、矢印の先にある変数に対して影響を及ぼすことを仮定する。図２から図４では省略しているが、パスモデルにおける単方向矢印にはいずれもパス係数が与えられており、潜在変数から各々の観測変数へ単方向矢印に与えられるパス係数はいずれも意味のあるもの（統計学的に有意なもの）と仮定する。つまり、パスモデルにおいて、潜在変数から各々の観測変数に対する因果関係は、いずれも有意なものである。また、パスモデルにおいて双方向矢印は相関関係を表す。図２から図４では省略しているが、パスモデルにおける双方向矢印にはいずれも相関係数が与えられており、各相関関係の大小を判別可能になっている。識別問題（パスモデルにより定まる観測変数と潜在変数との関係を規定する関係式が数学的な解を有するか否かの問題）を解きやすい観点から、パスモデルは、図２に示す探索的因子分析モデルか、又はこのモデルで一部の観測変数間に因果関係の存在が仮定されるように変形させたモデルであるのが好ましい。

【0062】

図１に示す共分散構造分析ステップＳ４ａで、共分散構造分析の計算結果の妥当性や、パスモデルがデータに適合しているかを評価するには、例えば、カイ二乗（以下「χ^２」という。）統計量、残差平方平均平方根（Root Mean square Residual：以下「ＲＭＲ」という。）、適合度指標（Goodness of Fit Index：以下「ＧＦＩ」という。）、修正適合度指標（Adjusted Goodness of Fit Index：ＡＧＦＩ）、赤池情報量基準（Akaike's Information Criterion：以下「ＡＩＣ」という。）、又はRoot Mean Square Error of Approximation（以下「ＲＭＳＥＡ」という。）等の指標を用いれば良い。一般的には例えば、χ^２統計量から「パスモデルがデータに適合している」との仮説が棄却されず、ＧＦＩ値やＡＧＦＩ値が所定の閾値（例えば０．９）以上であり、又はＲＭＳＥＡ値が所定の閾値（例えば０．０８０）未満である等の条件を数多く満たすほど、共分散構造分析の計算結果やパスモデルについて信頼性が高い。パスモデルに含まれるパス係数の信頼性を評価するには、例えばｔ検定、又はワルド検定などを行えば良い。例えばＡＭＯＳを用いてＳＥＭにより共分散構造分析を行う場合、ここで例示した指標や方法により、共分散構造分析の計算結果やパスモデルについて信頼性を検討可能である。

【0063】

共分散構造分析ステップＳ４ａでは、作成したパスモデルでのＲＭＳＥＡ値が、例えば０．０８０未満である場合に、好ましくは０．０５０未満である場合に、信頼できる統計モデルとして共分散構造分析に用いるのが良い。ＲＭＳＥＡ値が０．０８０以上になった場合、そのままではパスモデルを信頼できないため、ＲＭＳＥＡ値が０．０８０未満になるように、例えば観測変数として用いる３種以上の被験者臨床データの組み合わせを再考してパスモデルを修正するのが良い。同様の観点から、ＲＭＳＥＡ値が０．０８０以上になった場合の３種以上の被験者臨床データの組み合わせは、後の機械学習で３種以上の入力変数の組み合わせとして用いないのが好ましい。例えば、本願発明者が試行したところ、各々の被験者について、一次治療前時点での総ビルビリン量と、一次治療前時点での白血球数と、一次治療後でのＫＤ再燃の有無とについては、観測変数として用いてＳＥＭで平均共分散構造分析を行っても潜在変数との間で有意な因果関係が認められなかったため、データを観測変数として用いないのが好ましく、後の機械学習でも入力変数として用いないのが好ましい。ステップＳ２ａ、Ｓ３ａ、及びＳ４ａの組み合わせは、機械学習用データを生成するステップＳ５ａとして機能し得る。

【0064】

学習ステップＳ６ａでは、各々の被験者の臨床情報に含まれる３種以上の被験者臨床データを入力変数（独立変数）とし、各々の被験者について先の共分散構造分析ステップＳ４ａで得られたＳＳ計算値を出力変数（従属変数）として、入力変数と出力変数の関係をＡＮＮに機械学習させる。ＡＮＮは、ヒト脳での神経学的処理を模した計算技術に基づく情報処理システムであり、入力変数と出力変数が存在するシステムのモデル化に用いられている。学習ステップＳ６ａで活用可能なＡＮＮとして、例えばパーセプトロンが層状につなぎ合わされた多層パーセプトロンが挙げられる。多層パーセプトロンとして図５に例示するように、入力層２と、一層の中間層５と、出力層８とを有する三層型ＡＮＮ１が挙げられる。これらの層（２、５、８）各々に人工ニューロン（artificial neuron：以下「ＡＮ」という）が幾つか設けられている。ＡＮはノードともいわれる。入力層２に設けられた各々のＡＮ（３ａから３ｄ）は、ネットワーク４を介して中間層５に設けられた各々のＡＮ（６ａから６ｃ）に接続されている。中間層５に設けられた各々のＡＮ（６ａから６ｃ）は、ネットワーク７を介して、出力層８に設けられたＡＮ９に接続されている。

【0065】

ＡＮＮ１に機械学習させる際、例えば入力層２に設けられた各々のＡＮ（３ａから３ｄ）に、入力変数として用いるいずれか１種の被験者臨床データを入力する。また、例えば出力層８に設けられたＡＮ９に、出力変数として用いるＳＳ計算値を入力する。その上で情報処理装置に演算させると、入力層２に設けられた各々のＡＮ（３ａから３ｄ）に入力された入力変数が、中間層５へ向けて出力される。各々のネットワーク（４、７）は、重み付け値Ｗ_ｉｊを有する。中間層５に設けられたＡＮ（６ａから６ｃ）と出力層８に設けられたＡＮ９では、次の数式５で例示するように、前層からの入力値Ｓ_ｉと重み付け値Ｗ_ｉｊの積和計算と、シグモイド関数を用いた変数変換がされ、出力層８で計算式が出力される。次いで、この計算式により算出される数値と、正解（事前に出力層８に入力された出力変数）との間の誤差が計算され、この誤差がゼロになるように、しきい値ｈ_ｉと重みＷ_ｉｊが修正される。機械学習させたＡＮＮでは、入力変数（独立変数）と出力変数（従属変数）との間に存在する関係が見出されている。このため、学習ステップＳ６ａでは、学習済みモデルを生成させることができる。

【0066】

【数5】

P_i ＡＮが発火する確率
W_ij 前層のＡＮと次層のＡＮ間の重み付け値（シナプス結合計数）
S_i 前層のＡＮからの入力値
h_i しきい値
T シグモイド関数の傾き

【0067】

図５に例示するＡＮＮ１に限らず、図１に示す学習ステップＳ６ａでは例えば、入力層と、一層以上の中間層と、出力層とを有するＡＮＮに機械学習させれば良い。機械学習させるＡＮＮとして、入力層と中間層の二層から成る単純パーセプトロンのみを採用するのは、予測精度の大幅な悪化を招くため避けるべきである。過学習を避ける観点から、ＡＮＮにおける中間層の数は、四層以下または三層以下でも良く、好ましくは二層以下である。本発明の目的に反しない限り、入力層、一層以上の中間層、及び出力層を有する階層型ＡＮＮを２つ以上組み合わせた状態で機械学習させても良い。ＡＮＮで用いられる動作関数は、例えば動径基底関数またはヘビ関数でも良いが、信頼性が高い観点から、前述した数式５のようなシグモイド関数が好ましい。機械学習の方法は例えば、共役勾配降下法、準ニュートン法、又はレーベンバーグ・マーカート法などでも良いが、初学者でも市販の統計解析用ソフトウェアを用いて実施しやすい観点では、正則化させて行ったり又は誤差逆伝搬法を行ったりするのが好ましく、加えて学習時間を短縮させる観点から誤差伝搬法と補修学習法を併用するのが更に好ましい。学習用データに隠れた法則性を抽出しやすい観点では、誤差伝搬法と成長抑制学習法を併用するのが更に好ましい。

【0068】

後に予測精度を向上させる観点では、機械学習で入力変数として、各々の被験者の臨床情報に含まれる例えば４種以上の被験者臨床データを、好ましくは５種以上の被験者臨床データを、更に好ましくは６種以上の被験者臨床データを用いるのが更に好ましい。学習効率の悪化を避ける観点では入力変数として用いる被験者臨床データは、例えば２０種以下、好ましくは１５種以下、更に好ましくは１０種以下である。予測精度が更に高い学習済みモデルを得るためには、入力変数と出力変数とを入力してから誤差修正までの演算処理を情報処理装置に繰り返し（例えば５０回以上）実行させ、見出された入力変数と出力変数との関係が各々異なっている、複数の学習済みモデルを生成させるのが好ましい。

【0069】

選別ステップＳ７ａは、先の学習ステップＳ６ａで複数の学習済みモデルを生成させた場合に、予測精度を更に高めるために、学習済みモデルごとに予測精度の高さを検証して、比較的に予測精度が高い学習済みモデルを選定する。例えば、市販の統計解析ソフトウェアを用いて、学習済みモデルごとに単純交差検証法またはＫ分割交差検証法（例えば五分割交差検証法）を行い、学習済みモデルごとに決定係数Ｒ^２を算出して、最もＲ^２値が大きい１つの学習済みモデルを選定するのが好ましい。選別ステップＳ７ａでのＲ^２値は、入力変数が出力変数をどの程度に説明可能か表す指標であり、０に近い値ほど説明できず、１．０に近い値ほど説明できることを意味する。構造が単純で出力誤差が小さい学習済みモデルを選出する観点から、学習済みモデルごとに、ＡＩＣや、シュワルツのベイジアン情報量基準（Schwartz's Bayesian information criterion：以下「ＢＩＣ」という）を検証し、ＡＩＣ値またはＢＩＣ値で比較的に高値を示した学習済みモデルを選出の候補から外すのが好ましい。市販の統計ソフトウェアを用いればＡＩＣやＢＩＣを検証可能である。ＡＩＣ値とＢＩＣ値が低値な学習済みモデルほど、予測精度が高くて統計モデルとして好ましい。先の学習ステップＳ６ａで１つの学習済みモデルのみを生成させた場合や、後の予測精度がある程度に高ければ充分な場合は、選別ステップＳ７ａを省略しても良い。

【0070】

以上に説明した生成方法Ｓ１ａによれば、３種以上の被験者臨床データの例として挙げた性別、月齢、冠動脈径、全身性血管炎マーカー検査値、高サイトカイン血症マーカー検査値、及びＩＶＩＧ不応予測スコアの得点はいずれも、ＫＤ急性期医療の担当医（例えば病院勤務の小児科医）が一次治療前時点で問診または検査などにより入手可能な情報である。冠動脈径は、例えば担当医がＫＤと診断する際、従来から小児科の日常診療の現場に広く普及している断層心エコー等の検査方法や検査機器を用いて、入手可能な情報である（非特許文献１と非特許文献２参照）。各々の被験者は、既に一次治療を受けてＣＡＬ発生の有無を判定された者であるため、一次治療前時点の後に受けた抗炎症療法の回数や、ＣＡＬ発生の有無の判定結果も、ＫＤ急性期医療の担当医が病院の小児科で入手可能な情報である。各々の被験者でのＣＡＬ発生リスクに関するＳＳ計算値は、３種以上の被験者臨床データと、ＣＡＬ発生の有無の判定結果とから、共分散構造分析により算出可能である。このため、生成方法Ｓ１ａによれば、従来の小児科の日常診療の現場で馴染みのある検査値などの情報を用いて、学習済みモデルを生成可能である。この学習済みモデルを以下に説明するように活用すれば、予測対象者であるＫＤ急性期患者でＣＡＬ発生に至るか否かを、一次治療前時点でなるべく高精度に予測可能となる。

【0071】

［ＫＤでのＣＡＬ発生リスク予測方法］
図６に示す本発明の一実施形態に係る予測方法Ｓ１０ａは、学習済みモデルを有する情報処理装置を用いて、ＫＤ急性期患者でのＣＡＬ発生リスクを予測するための予測方法である。予測方法Ｓ１０ａは、被験者らの臨床情報取得ステップＳ２ａと、学習前の正規化ステップＳ３ａと、共分散構造分析ステップＳ４ａと、学習ステップＳ６ａと、選別ステップＳ７ａと、患者の臨床情報取得ステップＳ１２ａと、予測前の正規化ステップＳ１３ａと、予測ステップＳ１４ａとを含み得る。ステップＳ２ａからＳ７ａは、前述した生成方法Ｓ１ａと同様に行えば良い。

【0072】

患者の臨床情報取得ステップＳ１２ａでは、例えば一次治療後にＣＡＬ発生に至るか否かを予測したいＫＤ急性期患者について、一次治療前時点で入手可能な患者の臨床情報を入手する。ここで入手する患者の臨床情報は、性別、一次治療前時点での月齢、一次治療前時点での冠動脈径、一次治療前時点での全身性血管炎マーカー検査値、一次治療前時点での高サイトカイン血症マーカー検査値、一次治療前時点でのＩＶＩＧ不応予測スコアの得点、一次治療前時点の後（一次治療以降）での抗炎症療法の実施予定回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた３種以上の患者臨床データである。予測精度を高める観点から、ここで例示した患者の臨床情報のうち、例えば４種以上、好ましくは５種以上、更に好ましくは６種以上の患者臨床データを取得するのが望ましい。この臨床情報が生成されるまでの過程で医師が行った診断の工程は、本発明やステップＳ１２ａに含まれない。

【0073】

予測精度を高める観点から、患者の臨床情報取得ステップＳ１２ａで入手する３種以上の患者臨床データは、先のステップＳ２ａで取得した各々の被験者の３種以上の被験者臨床データと比べて、概ね同種のデータであるのが好ましい。患者臨床データの一例である「抗炎症療法の実施予定回数」は、被験者臨床データの一例である「抗炎症療法を実施した回数」と概ね同種のデータといえる。一般的にＫＤ急性期医療の担当医は、患者についてＫＤと診断してから一次治療に至るまでに、少なくとも２回は診断する。例えば、一次治療前の最終診断よりも前の診断で医師が既に作成した治療計画、処方計画、又はその案に基づいて、ステップＳ１２ａでは抗炎症療法の実施予定回数の患者臨床データを取得すれば良い。医師が治療計画、処方計画、又はその案を作成した工程は、本発明やステップＳ１２ａに含まれない。また、ＫＤ急性期医療に関するいわゆるエビデンスで、ＫＤ急性期患者の一次治療前時点での検査値などに基づいて抗炎症療法について特定の回数を実施することが推奨されている場合、その推奨されている基準に従って医師の判断を介さず自動的に「抗炎症療法の実施予定回数」が定まるように設定しても良い。その他、患者の臨床情報取得ステップＳ１２ａは、先のステップＳ２ａについて既に説明したことと同様である。ただし、先のステップＳ２ａとは異なり、患者の臨床情報取得ステップＳ１２ａでは、患者でのＣＡＬ発生の有無の判定結果を取得することを要しない。

【0074】

予測前の正規化ステップＳ１３ａでは、効率良く予測するために、先の患者の臨床情報取得ステップＳ１２ａで得た３種以上の患者臨床データを、情報処理装置で演算しやすいように正規化する。同じ理由で、先の学習前の正規化ステップＳ３ａで３種以上の被験者臨床データを正規化したのと概ね同様にして、予測前の正規化ステップＳ１３ａでは３種以上の患者臨床データを正規化するのが好ましい。なお、先の学習前の正規化ステップＳ３ａとは異なり、予測前の正規化ステップＳ１３ａでは、患者でのＣＡＬ発生の有無についての判定結果の正規化を特に要しない。先の患者の臨床情報取得ステップＳ１２ａでいきなり正規化された３種以上の患者臨床データを取得できた場合、予測前の正規化ステップＳ１３ａを省略可能である。

【0075】

予測ステップＳ１４ａでは、学習済みモデルを有する情報処理装置に、ＫＤ急性期患者の臨床情報に含まれる３種以上の患者臨床データを入力して、ＣＡＬ発生リスクに関するＳＳについてＫＤ急性期患者での予測値を出力する処理を実行させる。例えば、学習済みモデルの入力層に設けられたＡＮごとに１種の患者臨床データ又はその正規化データ（入力変数）を入力し、学習済みモデルを有する情報処理装置に演算を実行させ、出力層に設けられたＡＮにおいて、ＫＤ急性期患者でのＣＡＬ発生リスクに関するＳＳ予測値（出力変数）を出力させる。

【0076】

予測ステップＳ１４ａで出力されるＫＤ急性期患者でのＳＳ予測値は、この患者が一次治療後にＣＡＬ発生に至るか否かを予測する指標となる数値データである。ＳＳ予測値が所定のカットオフ値以上である場合には予測結果としてＣＡＬ陽性（一次治療後にＣＡＬ発生に至る）であり、または、所定のカットオフ値未満である場合には予測結果としてＣＡＬ陰性（一次治療後にＣＡＬ発生に至らない）である。ただし、このカットオフ値の所定値は、各々の被験者でのＣＡＬ発生の有無の判定結果を定めた際の基準値に応じて変動する。例えば、各々の被験者で少なくとも一次治療を受けた後での冠動脈径について、Ｚスコアの値が３．０ＳＤ以上である場合にＣＡＬ陽性と判定したのか、２．５ＳＤ以上である場合にＣＡＬ陽性と判定したのか、それとも、２．０ＳＤ以上である場合にＣＡＬ陽性と判定したのか、という基準値に応じてカットオフ値の所定値は変動する。基準値が高ければカットオフ値の所定値も高くなる。このため、さらに、予測ステップＳ１４ａでは、ＫＤ急性期患者でのＳＳ予測値が所定のカットオフ値以上である場合に、この患者でＣＡＬ発生に至ることを示す予測結果を出力する処理を実行するように、学習済みモデルを有する情報処理装置を機能させるのが好ましい。このように機能させた場合、例えば予測方法Ｓ１０ａの実施者が統計処理に慣れていなくても、高精度の予測結果を容易に入手可能となり得る。

【0077】

以上に説明した予測方法Ｓ１０ａによれば、各々の被験者の臨床情報に含まれる３種以上の被験者臨床データと、共分散構造分析ステップＳ４ａで出力された各々の被験者でのＳＳ計算値と、を用いた機械学習で生成された学習済みモデルを用いることにより、予測対象者であるＫＤ急性期患者について、一次治療後にＣＡＬ発生に至るか否かの指標値となるＳＳ予測値を、一次治療前時点で高精度に得ることが可能となる。このため、例えばＫＤ急性期医療の担当医がＣＡＬ発生を抑える治療方針を早期決定する診断をしやすいように、支援可能である。つまり、予測方法Ｓ１０ａは、例えば、ＫＤ急性期医療の担当医にとって、初期の治療方針を決定する診断をする際の判断材料となる情報の一つとして、予測結果（ＳＳ予測値）という情報を、一次治療前時点で入手するのに適した方法ともいえる。担当医は、ＫＤ急性期患者が一次治療後にＣＡＬ発生に至る旨の予測結果を一次治療前に得られた場合には、既に作成した治療計画、処方計画、又はこれら計画の案の変更を検討すること、つまり、一次治療で実施する予定であった抗炎症療法の種類や実施予定回数の変更を検討することが可能となる。変更後の計画またはその案に基づいて、変更された「抗炎症療法を受ける予定回数」の患者臨床データを取得して、改めて予測方法Ｓ１０ａを実施することも可能である。一次治療後にＣＡＬ陰性との予測結果が得られるまで、計画またはその案を変更しては改めて予測方法Ｓ１０ａを実施することも可能である。

【0078】

簡便に実施可能にする観点では、予測方法Ｓ１０ａでのステップＳ２ａからＳ７ａに代えて、図７に示すように、あらかじめ生成された学習済みモデルを準備するステップＳ１ｂを含む予測方法Ｓ１０ｂであるのが好ましい。

【0079】

［ＫＤでのＣＡＬ発生リスク予測用の学習済みモデル］
本発明の一実施形態に係る学習済みモデルは、ＫＤ患者でＣＡＬ発生に至るか否かを予測するための学習済みモデルである。既に説明したように、この学習済みモデルは、既にＫＤ急性期医療における少なくとも一次治療を受けた後にＣＡＬ発生の有無を判定された被験者らについて、各々の被験者の臨床情報が図５に示すＡＮＮ１の入力層２に入力され、出力層８がＣＡＬ発生リスクに関するＳＳについて各々の被験者での計算値を出力するように、前述した数式５で示した重み付け値Ｗ_ｉｊが機械学習されたものである。また、この学習済みモデルは、入力層にＫＤ急性期患者の臨床情報が入力される場合には、入力されるＫＤ急性期患者の臨床情報に対して重み付け値Ｗ_ｉｊに基づく演算を行い、出力層からＫＤ急性期患者でのＳＳ予測値を出力するように、情報処理装置を機能させるためのものである。

【0080】

図７の予測方法Ｓ１０ｂを実施するユーザ（例えば、ＫＤ急性期医療の担当医、又はこの担当医を補助する医療従事者など）は、図８に例示するように、上記した学習済みモデル６７を有する情報処理装置６０を使用しても良い。情報処理装置６０は、種々の情報処理や、情報の送受信が可能な情報処理装置であり、例えばパーソナルコンピュータ、又はサーバコンピュータ等である。情報処理装置６０は、例えば、制御部６１と、表示部６２と、入力部６３と、記憶部６５とを備える。

【0081】

制御部６１は、記憶部６５に記憶されたプログラム６６を読み出して実行することにより、情報処理装置６０に係る種々の演算処理、制御処理などを行うプロセッサであり、例えば、一又は複数のＣＰＵ（Central Processing Unit）等を有する。記憶部６５は、各種データを記憶するメモリである。メモリには、ＲＡＭ（Random Access Memory）と不揮発性メモリとが含まれる。ＲＡＭは、制御部６１が演算処理を実行するために必要なデータを一時的に記憶する。不揮発性メモリは、例えばハードディスクドライブを含み、制御部６１が処理を実行するためのプログラム６６と学習済みモデル６７とを記憶保持する。不揮発性メモリは、学習済みモデル６７の生成時に学習用データとして用いられた、被験者らの臨床情報データベース６８を、更に記憶保持しても良い。表示部６２は、例えば液晶ディスプレイ又は有機ＥＬディスプレイ等の表示装置であり、制御部６１から与えられた画像を表示する。入力部６３は、例えばキーボード又はタッチパネル等の入力インターフェイスであり、ユーザからの操作入力を受け付ける。制御部６１は、ユーザにより入力部６３を介して情報処理装置６０にＫＤ急性期患者の臨床情報が入力された場合に、入力された臨床情報を学習済みモデル６７に適用して、ＣＡＬ発生の有無に関するＳＳについてＫＤ急性期患者での予測値を出力する処理を実行する処理部として機能する。出力されたＳＳ予測値は、そのまま数値データとして表示部６２に表示されても良い。ユーザに分かりやすい観点から、出力されたＳＳ予測値の数値データが所定のカットオフ値以上である場合にＫＤ急性期患者で一次治療後にＣＡＬ発生に至ることを示す予測結果が表示部６２に表示され、または、所定のカットオフ値未満である場合にＣＡＬ発生に至らないことを示す予測結果が表示されるように、情報処理装置６０が機能するのが好ましい。

【0082】

情報処理装置６０は、通信部６４を備えるのが好ましい。通信部６４は、通信に関する処理を行うための処理回路等を含み、少なくとも一つのユーザ端末７１との間で例えばインターネット又は病院内イントラネット等の通信ネットワーク７０を介して情報の送受信を行う。通信部６４は、この送受信のためのアンテナを含んでも良い。ユーザ端末７１は、例えば、小児科医が所持しているスマートフォン、又は病院の診察室に設けられたパーソナルコンピュータ等である。ユーザがＫＤ急性期患者の臨床情報をユーザ端末７１に入力した場合に、入力された臨床情報がユーザ端末７１から送信されて通信ネットワーク７０と通信部６４とを介して情報処理装置６０で受信され、制御部６１は受信した臨床情報を学習済みモデル６７に適用してＣＡＬ発生の有無に関するＳＳについてＫＤ急性期患者での予測値を出力する処理を実行し、出力されたＳＳ予測値は通信部６４から送信され通信ネットワーク７０を介してユーザ端末７１で受信され、ユーザ端末７１のディスプレイにＳＳ予測値に基づくＣＡＬ発生リスクの予測結果が表示されるのが好ましい。

【0083】

［ＩｇＡＶでＰＮ又はＰＮで蛋白尿を伴う症例発生予測用の学習済みモデル生成方法］
以下に図１を用いて、本発明の他の実施形態に係る学習済みモデルの生成方法Ｓ１ｅを説明するにあたり、前述した生成方法Ｓ１ａとの共通事項について適宜説明を省略し、生成方法Ｓ１ａと異なる事項を主に説明する。生成方法Ｓ１ｅは、ＩｇＡ血管炎（ＩｇＡＶ）患者での紫斑病性腎炎（ＰＮ）発生リスクを予測するためか又はＰＮで蛋白尿を伴う症例発生リスクを予測するための学習済みモデルを生成させるにあたり、被験者らの臨床情報取得ステップＳ２ｅと、学習前の正規化ステップＳ３ｅと、共分散構造分析ステップＳ４ｅと、学習ステップＳ６ｅと、選別ステップＳ７ｅとを含み得る。

【0084】

被験者らの臨床情報取得ステップＳ２ｅでは、学習用データを作成するために、既にＩｇＡＶ発症から３０日以上経過してＰＮ又はＰＮで蛋白尿を伴う症例発生の有無を判定された被験者らについて、各々の被験者の臨床情報と、各々の被験者でのＰＮ又はＰＮで蛋白尿を伴う症例発生の有無に関する判定結果とを取得する。この臨床情報と判定結果とが生成されるまでの過程で医師が行った診断や治療の工程は、本発明やステップＳ２ｅに含まれない。なお、慢性腎炎の一種であるＩｇＡ腎症ではＩｇＡを含む免疫複合体が主に腎臓に沈着するのに対して、ＩｇＡＶ合併症である紫斑病性腎炎（ＰＮ）ではＩｇＡを含む免疫複合体が腎臓を含めて全身組織に沈着し得るという違いがある。

【0085】

ＰＮの様々な症例について発生リスクを予測可能にする観点から、生成方法Ｓ１ｅの被験者らには、それぞれＩｇＡＶ発症後にＰＮによる重症化の程度が異なる被験者を数多く含むほど好ましい。一般的にＰＮでは血尿を伴い、尿蛋白量が多いほど重症化しやすい。尿蛋白量０．５ｇ／１．７３ｍ^２／ｄａｙ未満か、又は、早朝尿の蛋白／クレアチニン（Ｃｒ）比が０．５未満である場合、ＰＮで軽度蛋白尿を伴う症例と診断される。尿蛋白量０．５ｇ／１．７３ｍ^２／ｄａｙ以上１．０ｇ／１．７３ｍ^２／ｄａｙ未満か、又は、早朝尿の蛋白／Ｃｒ比が０．５以上１．０以下である場合、ＰＮで中等度蛋白尿を伴う症例と診断される。尿蛋白量１．０ｇ／１．７３ｍ^２／ｄａｙ以上か、又は、早朝尿の蛋白／Ｃｒ比が１．０よりも大きい場合、ＰＮで高度蛋白尿を伴う症例と診断される（非特許文献９参照）。特に、ＰＮで尿蛋白量３．０ｇ／１．７３ｍ^２／ｄａｙ以上の症例は、ネフローゼ症候群を呈しやすく重症化しやすい。生成方法Ｓ１ｅの被験者らには、ＰＮ陰性の被験者、ＰＮ陽性で尿蛋白量に異常ない被験者、ＰＮ陽性で軽度蛋白尿を伴う被験者、ＰＮ陽性で中等度蛋白尿を伴う被験者、ＰＮ陽性で高度蛋白尿を伴う被験者、ＰＮ陽性で尿蛋白量２．０ｇ／１．７３ｍ^２／ｄａｙ以上の被験者、及びＰＮ陽性で尿蛋白量３．０ｇ／１．７３ｍ^２／ｄａｙ以上の被験者の各々を、なるべく多い人数で含むのが好ましい。被験者らの好ましい人数は、前述した生成方法Ｓ１ａと同様である。

【0086】

生成方法Ｓ１ｅでの各々の被験者の臨床情報は、ＰＮ発生か又はＰＮで蛋白尿を伴う症例発生との間に因果関係を有しやすい臨床データである観点から、性別、ＩｇＡＶ急性期であり且つ抗炎症療法を受けていない時点（以下「初回治療前時点」ともいう）での月齢、初回治療前時点での全身性血管炎マーカー検査値、初回治療前時点での腹痛の有無、初回治療前時点での即時型アレルギー疾患の有無、初回治療前時点での血中ＩｇＡ検査値、初回治療前時点での血中ＩｇＥ検査値、初回治療前時点の後に抗炎症療法を受けた回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた４種以上の被験者臨床データである。性別、月齢、及び間接的に示すデータについては、前述したステップＳ１ａと同様である。

【0087】

生成方法Ｓ１ｅでの全身性血管炎マーカー検査値については、生成方法Ｓ１ａでの説明と概ね同様であるが、ＰＮ発生か又はＰＮで蛋白尿を伴う症例発生との間で因果関係を持ちやすい臨床データである観点と、小児科臨床の現場で簡便に広く活用されてきた検査値であり臨床応用しやすい観点とから、フィブリン分解産物であるＤダイマー（以下「ＦＤＰ・Ｄダイマー」ともいう）濃度の検査値が好ましい。一般的に血中ＦＤＰ・Ｄダイマー濃度は、血栓症の判定に用いられている。初回治療前時点での腹痛の有無と、初回治療前時点での即時型アレルギー疾患の有無とは、それぞれ例えば、既に医師が各々の被験者についてＩｇＡＶと診断した際の病状の所見に基づいて、取得可能な情報である。なお、ＩｇＡＶ急性期に、５０％の症例で急性腹痛を伴うといわれている。即時型アレルギー疾患として例えば、アナフィラキシーショック、アレルギー性鼻炎、結膜炎、気管支喘息、蕁麻疹、又はアトピー性皮膚炎などの疾患が挙げられる。血中ＩｇＡ検査値と血中ＩｇＥ検査値とは、それぞれ血中または血清中の濃度データである。各々の被験者が初回治療前時点の後に受けた抗炎症療法として、例えば、ＰＳＬ投与、ＩＶＭＰ投与、シクロホスファミド投与、アザチオプリン投与、ミコフェノール酸モフェチル投与、ＣｓＡ投与、及び血漿交換からなる群より選ばれた１種以上の抗炎症療法が挙げられる（非特許文献９参照）。

【0088】

ＰＮ又はＰＮで蛋白尿を伴う症例発生の有無に関する判定結果は、各々の被験者で初回治療後の所定期間内（例えば、初回治療後かつＩｇＡＶ発症から３０日以上９０日以内）に、ＰＮ発生またはＰＮで蛋白尿を伴う症例発生に至ったか否かを医師が既に判定した結果に関するデータである。通常、この所定期間内に血尿を伴った場合、ＰＮ発生と判定される。ＰＮで蛋白尿を伴う症例発生に関する判定結果は、重症化しやすいＰＮ症例の発生リスクを予測可能とすることでＩｇＡＶ急性期医療の担当医が重症化を避けるための治療方針を早期決定する診断をしやすいように支援する観点から、例えば、ＰＮで中等度以上の蛋白尿を伴う症例発生に至ったか否かの判定結果でも良く、好ましくはＰＮで高度蛋白尿を伴う症例発生に至ったか否かの判定結果であり、更に好ましくはＰＮで尿蛋白量２．０ｇ／１．７３ｍ^２／ｄａｙ以上の症例発生に至ったか否かの判定結果であり、更により好ましくはＰＮで尿蛋白量３．０ｇ／１．７３ｍ^２／ｄａｙ以上の症例発生に至ったか否かの判定結果であるのが望ましい。その他、被験者らの臨床情報取得ステップＳ２ｅの詳細は、冠動脈径に関する事項を除いて、既に説明したステップＳ２ａと同様である。

【0089】

学習前の正規化ステップＳ３ｅでは、各々の被験者の臨床情報に含まれる４種以上の被験者臨床データと、ＰＮ発生またはＰＮで蛋白尿を伴う症例発生の有無に関する判定結果とを、情報処理装置で演算しやすいように正規化する。判定結果を正規化する際、例えば、「ＰＮ発生あり（ＰＮ陽性）」と「ＰＮ発生なし（ＰＮ陰性）」とのいずれか一方を０に変換し、残る他方を１．０に変換するように正規化しても良い。前述したように重症化しやすいＰＮ症例の発生リスクを予測可能とする観点では、判定結果を正規化する際、例えば「ＰＮで中等度以上の蛋白尿を伴う症例陽性」と「ＰＮで中等度以上の蛋白尿を伴う症例陰性」とで、好ましくは「ＰＮで高度蛋白尿を伴う症例陽性」と「ＰＮで高度蛋白尿を伴う症例陰性」とで、更に好ましくは「ＰＮで尿蛋白量２．０ｇ／１．７３ｍ^２／ｄａｙ以上の症例陽性」と「ＰＮで尿蛋白量２．０ｇ／１．７３ｍ^２／ｄａｙ以上の症例陰性」とで、更により好ましくは「ＰＮで尿蛋白量３．０ｇ／１．７３ｍ^２／ｄａｙ以上の症例陽性」と「ＰＮで尿蛋白量３．０ｇ／１．７３ｍ^２／ｄａｙ以上の症例陰性」とで、いずれか一方を０に変換して残る他方を１．０に変換するのが望ましい。その他、学習前の正規化ステップＳ３ｅの詳細は、既に説明したステップＳ３ａと同様である。

【0090】

共分散構造分析ステップＳ４ｅでは、各々の被験者についてＰＮ発生またはＰＮで蛋白尿を伴う症例発生との間で高い相関関係を有するＳＳ計算値を算出するために、各々の被験者について、５種以上の観測変数と、潜在変数とを設ける。ここで５種以上の観測変数の内訳は、各々の被験者について、４種以上の被験者臨床データと、ＰＮ発生またはＰＮで蛋白尿を伴う症例発生の有無に関する判定結果と、である。また、「ＰＮ発生またはＰＮで蛋白尿を伴う症例発生の有無に関する判定結果」に係る観測変数に対して、直接的な因果関係を有すると仮定する１つ以上の潜在変数を設ける。その上で、情報処理装置に共分散構造分析を行うように演算処理を実行させ、「ＰＮ発生の有無に関する判定結果」か又は「ＰＮで蛋白尿を伴う症例発生の有無に関する判定結果」に対して直接的な有意な因果関係が認められた潜在変数について、因子得点のデータを算出させる。この因子得点の数値データそのものか、又はこの数値データそのものを再現可能な範囲内で正規化させたデータを、各々の被験者でのＰＮ発生リスクに関するＳＳ計算値とする。

【0091】

共分散構造分析ステップＳ４ｅで用いる５種以上の観測変数について、好ましい事項は先の学習前の正規化ステップＳ３ｅと同様である。２つ以上の潜在変数を設けて共分散構造分析を行う場合、ＰＮの重症化の程度を段階別に予測可能にする観点から、ＰＮ陽性か陰性かの判定結果、ＰＮで蛋白尿を伴う症例陽性か陰性かの判定結果、ＰＮで中等度以上の蛋白尿を伴う症例陽性か陰性かの判定結果、ＰＮで高度蛋白尿を伴う症例陽性か陰性かの判定結果、ＰＮで尿蛋白量２．０ｇ／１．７３ｍ^２／ｄａｙ以上の症例陽性か陰性かの判定結果、および、ＰＮで尿蛋白量３．０ｇ／１．７３ｍ^２／ｄａｙ以上の症例陽性か陰性かの判定結果、からなる群より選ばれた２種以上の判定結果をそれぞれ潜在変数として用いるのが好ましく、この場合に潜在変数として用いる判定結果の種類を多くするほど、観測変数の種類を６種以上から多く設けて共分散構造分析を行うのが好ましい。その他、共分散構造分析ステップＳ４ｅの詳細は、既に説明したステップＳ４ａと同様である。ステップＳ２ｅ、Ｓ３ｅ、及びＳ４ｅの組み合わせは、機械学習用データを生成するステップＳ５ｅとして機能し得る。

【0092】

学習ステップＳ６ｅでは、各々の被験者の臨床情報に含まれる４種以上の被験者臨床データを入力変数としてＡＮＮの入力層に入力し、各々の被験者について先の共分散構造分析ステップＳ４ｅで得られたＳＳ計算値を出力変数として出力層から出力するように、入力変数と出力変数との関係をＡＮＮに機械学習させて、学習済みモデルを生成する。その他、学習ステップＳ６ｅの詳細は、既に説明したステップＳ６ａと同様である。複数の学習済みモデルを生成させた場合、予測精度を更に高める観点から、学習済みモデルごとに予測精度の高さを検証して、比較的に予測精度が高い学習済みモデルを選定する選別ステップＳ７ｅを行うのが良い。その他、選別ステップＳ７ｅの詳細は、既に説明したステップＳ７ａと同様である。

【0093】

以上に説明した生成方法Ｓ１ｅによれば、４種以上の被験者臨床データの例として挙げた性別、月齢、全身性血管炎マーカー検査値、腹痛の有無、即時型アレルギー疾患の有無、血中ＩｇＡ検査値、及び血中ＩｇＥ検査値はいずれも、ＩｇＡＶ急性期医療の担当医（例えば病院勤務の小児科医）が初回治療前時点で問診または検査などにより入手可能な情報である。各々の被験者は、既に初回治療を受けてＰＮ又はＰＮで蛋白尿を伴う症例発生の有無を判定された者であるため、初回治療前時点の後に受けた抗炎症療法の回数や、ＰＮ又はＰＮで蛋白尿を伴う症例発生の有無に関する判定結果も、ＩｇＡＶ急性期医療の担当医が病院の小児科で入手可能な情報である。各々の被験者でのＰＮ又はＰＮで蛋白尿を伴う症例発生リスクに関するＳＳ計算値は、４種以上の被験者臨床データと、ＰＮ又はＰＮのうち蛋白尿を伴う症例発生の有無の判定結果とから、共分散構造分析により算出可能である。このため、生成方法Ｓ１ｅによれば、従来の小児科の日常診療の現場で馴染みのある検査値などの情報を用いて、学習済みモデルを生成可能である。この学習済みモデルを以下に説明するように活用すれば、予測対象者であるＩｇＡＶ急性期患者でＰＮ又はＰＮで蛋白尿を伴う症例発生に至るか否かを、初回治療前時点でなるべく高精度に予測可能となる。

【0094】

［ＩｇＡＶでＰＮ又はＰＮで蛋白尿を伴う症例発生リスク予測方法］
図６に示す本発明の他の実施形態に係る予測方法Ｓ１０ｅは、学習済みモデルを有する情報処理装置を用いて、ＩｇＡＶ急性期患者でのＰＮ発生リスクか又はＰＮで蛋白尿を伴う症例発生リスクを予測するための予測方法である。予測方法Ｓ１０ｅは、被験者らの臨床情報取得ステップＳ２ｅと、学習前の正規化ステップＳ３ｅと、共分散構造分析ステップＳ４ｅと、学習ステップＳ６ｅと、選別ステップＳ７ｅと、患者の臨床情報取得ステップＳ１２ｅと、予測前の正規化ステップＳ１３ｅと、予測ステップＳ１４ｅとを含み得る。ステップＳ２ｅからＳ７ｅは、前述した生成方法Ｓ１ｅと同様に行えば良い。

【0095】

患者の臨床情報取得ステップＳ１２ｅでは、例えば初回治療後の所定期間内にＰＮ発生か又はＰＮで蛋白尿を伴う症例発生に至るか否かを予測したいＩｇＡＶ急性期患者について、初回治療前時点で入手可能な患者の臨床情報を取得する。ここで取得する患者の臨床情報は、性別、初回治療前時点での月齢、初回治療前時点での全身性血管炎マーカー検査値、初回治療前時点での腹痛の有無、初回治療前時点での血中ＩｇＡ検査値、初回治療前時点での血中ＩｇＥ検査値、初回治療前時点での即時型アレルギー疾患の有無、初回治療前時点の後（初回治療以降）での抗炎症療法の実施予定回数、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた４種以上の患者臨床データである。この臨床情報が生成されるまでの過程で医師が行った診断の工程は、本発明やステップＳ１２ｅに含まれない。

【0096】

予測精度を高める観点から、患者の臨床情報取得ステップＳ１２ｅで取得する４種以上の患者臨床データは、先のステップＳ２ａで取得した４種以上の被験者臨床データと比べて、概ね同種のデータであるのが好ましい。「抗炎症療法の実施予定回数」については、初回治療前の診断で医師が既に作成した治療計画、処方計画、又はその案に基づいてデータ取得すれば良い。ＩｇＡＶ急性期医療に関するいわゆるエビデンスで、ＩｇＡＶ急性期患者の初回治療前時点での検査値などに基づいて抗炎症療法について特定の回数を実施することが推奨されている場合、その推奨されている基準に従って医師の判断を介さず自動的に「抗炎症療法の実施予定回数」が定まるように設定しても良い。その他、患者の臨床情報取得ステップＳ１２ｅは、ステップＳ１２ａや先のステップＳ２ｅについて既に説明したことと同様である。ただし、先のステップＳ２ｅとは異なり、患者の臨床情報取得ステップＳ１２ｅでは、患者でのＰＮ発生またはＰＮで蛋白尿を伴う症例発生の有無に関する判定結果を取得することを要しない。

【0097】

予測前の正規化ステップＳ１３ｅでは、効率良く予測するために、先の患者の臨床情報取得ステップＳ１２ｅで得た４種以上の患者臨床データを、情報処理装置で演算しやすいように正規化する。その他、予測前の正規化ステップＳ１３ｅは、ステップＳ１３ａについて既に説明したことと同様である。

【0098】

予測ステップＳ１４ｅでは、学習済みモデルを有する情報処理装置に、ＩｇＡＶ急性期患者の臨床情報に含まれる４種以上の患者臨床データを入力して、ＰＮ発生リスクか又はＰＮで蛋白尿を伴う症例発生リスクに関するＳＳについてＩｇＡＶ急性期患者での予測値を出力する処理を実行させる。例えば、学習済みモデルの入力層に設けられたＡＮごとに１種の患者臨床データ又はその正規化データ（入力変数）を入力し、学習済みモデルを有する情報処理装置に演算を実行させ、出力層に設けられたＡＮにおいて、ＩｇＡＶ急性期患者でのＰＮ発生リスクか又はＰＮで蛋白尿を伴う症例発生リスクに関するＳＳ予測値（出力変数）を出力させる。

【0099】

重症化しやすいＰＮ症例の発生リスクを予測可能とすることによりＩｇＡＶ急性期医療の担当医が重症化を避けるための治療方針を早期決定する診断をしやすいように支援する観点から、ＰＮで蛋白尿を伴う症例発生リスクに関するＳＳ予測値は、例えば、ＰＮで中等度以上の蛋白尿を伴う症例発生リスクに関するものでも良く、好ましくはＰＮで高度蛋白尿を伴う症例発生リスクに関するものであり、更に好ましくはＰＮで尿蛋白量２．０ｇ／１．７３ｍ^２／ｄａｙ以上の症例発生のリスクに関するものであり、更により好ましくはＰＮで尿蛋白量３．０ｇ／１．７３ｍ^２／ｄａｙ以上の症例発生リスクに関するものであるのが望ましい。ＳＳ予測値がここで挙げたいずれのリスクに関するかに応じて、ＩｇＡＶ急性期患者が陽性（発生に至る）か陰性（発生に至らない）かの判別基準であるカットオフ値の所定値が異なる。このため、さらに、予測ステップＳ１４ｅでは、ＩｇＡＶ急性期患者でのＳＳ予測値が所定のカットオフ値以上である場合に、この患者で予測したいＰＮ症例の発生に至ることを示す予測結果を出力する処理を実行するように、学習済みモデルを有する情報処理装置を機能させるのが好ましい。その他、予測ステップＳ１４ｅは、ステップＳ１４ａについて既に説明したことと同様である。

【0100】

以上に説明した予測方法Ｓ１０ｅによれば、各々の被験者の臨床情報に含まれる４種以上の被験者臨床データと、共分散構造分析ステップＳ４ｅで出力された各々の被験者でのＳＳ計算値と、を用いた機械学習で生成された学習済みモデルを用いることにより、予測対象者であるＩｇＡＶ急性期患者について、初回治療後にＰＮ発生に至るか否かの指標値となるＳＳ予測値を、初回治療前時点で高精度に得ることが可能となる。このため、例えばＩｇＡＶ急性期医療の担当医がＰＮ発生か又はＰＮで蛋白尿を伴う症例発生を抑える治療方針を早期決定する診断をしやすいように、支援可能である。簡便に実施可能にする観点では、予測方法Ｓ１０ｅでのステップＳ２ｅからＳ７ｅに代えて、図７に示すように、あらかじめ生成された学習済みモデルを準備するステップＳ１ｆを含む予測方法Ｓ１０ｆであるのが好ましい。

【0101】

［ＩｇＡＶでＰＮ発生又はＰＮで蛋白尿を伴う症例発生リスク予測用学習済みモデル］
本発明の他の実施形態に係る学習済みモデルは、ＩｇＡＶ患者でのＰＮ発生リスクか又はＰＮで蛋白尿を伴う症例発生リスクを予測するための学習済みモデルである。この学習済みモデルは、既にＩｇＡＶ急性期医療における初回治療後の所定期間内にＰＮ発生か又はＰＮで蛋白尿を伴う症例発生の有無を判定された被験者らについて、各々の被験者の臨床情報が図５に示すＡＮＮ１の入力層２に入力され、出力層８がＰＮ発生リスクに関するＳＳについて各々の被験者での計算値を出力するように、前述した数式５で示した重み付け値Ｗ_ｉｊが機械学習されたものである。この学習済みモデルは、入力層にＩｇＡＶ急性期患者の臨床情報が入力される場合には、入力されるＩｇＡＶ急性期患者の臨床情報に対して重み付け値Ｗ_ｉｊに基づく演算を行い、出力層からＩｇＡＶ急性期患者でのＳＳ予測値を出力するように、情報処理装置を機能させるためのものである。例えば図６に示す予測方法Ｓ１０ｅ又は図７に示す予測方法Ｓ１０ｆを実施する者は、この学習済みモデルを有する情報処理装置を使用することとなる。この情報処理装置は、図８を用いて既に説明した情報処理装置６０と同様に構成しても良い。

【0102】

本発明は、その趣旨を逸脱しない範囲で当業者の知識に基づいて種々なる改良、修正、又は変形を加えた態様でも実施できる。また、同一の作用または効果が生じる範囲内で、いずれかの発明特定事項を他の技術に置換した形態で実施しても良い。

【実施例】

【0103】

以下に本発明の実施例などを説明するが、本発明は以下の実施例に限定されない。

【0104】

［ＫＤでのＣＡＬ発生予測：第１期研究および第２期研究］
本願発明者は、箕面市立病院でオプトアウトを用いて、後ろ向き研究を行うこととした。後ろ向き研究は、疾病の要因と発症との関連を調べる研究手法の一種である。研究開始時点から過去にふり返って、ＣＡＬ発生に至った被験者らと、ＣＡＬ発生に至らなかった被験者らとについて、臨床データを比較し、ＣＡＬ発生に至った要因を検証することとした。箕面市立病院の倫理審査委員会は、この研究を承認し、インフォームドコンセントの必要性を断念することも承認した。全ての方法は、ヘルシンキ宣言と関連性がある指針に従って実施した。

【0105】

図９に示すように、第１期研究では２００２年３月から２００５年の間と２００８年７月から２０１２年４月の間に、第２期研究では２０１４年７月から２０１８年１２月の間に、箕面市立病院でＫＤと臨床的に診断され入院した３７５名の小児らについて、被験者として適しているか検討した。ＫＤ診断基準で６項目の主要症状のうち３項目以下を満たした患者２９名と、三次医療機関に転院した患者１６名と、アナフィラキシーや薬剤性過敏症症候群などの深刻な合併症を伴った患者１６名とを、除外した。残る３１４名の小児ら（少年１８５名と少女１２９名）を被験者らとした。この被験者らを、一次治療を受けた時期別に分けて、第１期研究の被験者ら１０６名と、第２期研究の被験者ら２０８名とに分類した。また、総合研究として、第１期研究と第２期研究との被験者を合わせて、３１４名を後述する第３期研究での被験者らとした。

【0106】

前述の表３に示した佐野スコアに従い、３項目のうち２項目以上を満たす被験者らを、ＩＶＩＧ不応高リスクに分類した。残りの被験者らは、佐野スコアに従ってＩＶＩＧ不応低リスクに分類した。図９に示すように、第１期研究では２００２年３月から２００５年の間、高リスクの被験者ら１３名にはＩＶＩＧ療法（体重１ｋｇあたり２ｇ／日のＩＶＩＧ投与および中等量ＡＳＡ投与）と１回のＩＶＭＰ（３０ｍｇ／ｋｇ）投与との併用療法を行い、低リスクの被験者ら３４名にはＩＶＩＧ療法のみを行っていた。一方、第１期研究で２００８年７月から２０１２年４月の間、高リスクの被験者ら１７名にはＩＶＩＧ療法と２回のＩＶＭＰ投与との併用療法を行い、低リスクの被験者ら４２名にはＩＶＩＧ療法と１回のＩＶＭＰ投与の併用療法を行っていた。第２期研究では、高リスクの被験者ら２０名にＩＶＩＧ療法と２回のＩＶＭＰ投与との併用療法を行ったのに対して、一次治療前時点で血清中ＣＲＰ濃度が７ｍｇ／ｄＬ以上であった被験者ら１１３名にはＩＶＩＧ療法と１回のＩＶＭＰ投与との併用療法を行い、低リスクで一次治療前時点での血清中ＣＲＰ濃度が７ｍｇ／ｄＬ未満であった被験者ら７５名にはＩＶＩＧ療法のみを行っていた。

【0107】

被験者らにＫＤ急性期医療を行っていた当時、各々の被験者について冠動脈の拡張を評価するために、一次治療前時点と、一次治療直後と、退院時（一次治療後かつＫＤ発症から３０日以内）との３つの時点で、断層心エコー測定により、左冠動脈主幹部（ＬＭＴ）の直径と、左前下行枝（ＬＡＤ）近位部の直径と、右冠動脈（ＲＣＡ）近位部の直径とを測定していた。各々の被験者の冠動脈直径を、前述したCoronary Z Score Calculatorにデータ入力し、ＬＭＳ法により算出されたＺスコアに変換した。ＬＭＴ、ＬＡＤ、又はＲＣＡでＺスコア最大値が３．０ＳＤ以上である場合に、ＣＡＬ発生と定義した。また、上記した３つの時点で臨床試験を行い、箕面市立病院で行われている標準的な方法で血清成分を測定していた。尿中β２ＭＧ／Ｃｒは、富士フイルム和光純薬株式会社製のラテックス免疫測定キットを用いて測定していた。

【0108】

以下、統計分析において、ｐ＜０．０５である場合に統計的に有意と認め、０．０５＜ｐ＜０．１０である場合に傾向があると認めるものとする。以下、スチューデントｔ検定、又はχ^２検定を行った際は、ＪＭＰバージョン８．０ソフトウェア（ＳＡＳ社製）を用いた。以下、線形混合モデルにより解析を行う際は、ＳＰＳＳバージョン２３．０（ＩＢＭ−ＳＰＳＳ社製）を用いた。また、第１期研究と第２期研究との被験者らのプロフィールを、次の表４に示す。第１期研究の被験者らでは、一次治療前時点の尿中β２ＭＧ／Ｃｒ対数値（Ｌｏｇ尿中β２ＭＧ／Ｃｒ）と、一次治療前時点のＩＶＩＧ不応予測スコア（佐野スコア）得点とが、高値であった。第２期研究の被験者らでは、一次治療前時点の月齢と、一次治療前時点の冠動脈直径最大値とが、高値であった。

【0109】

【表4】

【0110】

第１期研究では、数名の医師により冠動脈径を測定していたため、測定値の変動があり、性別など幾つか臨床上のデータ欠損があった。このため、第１期研究では線形混合モデルを用いて解析した。一方、第２期研究では、一名の医師が冠動脈径のデータをほとんど欠失させず冠動脈直径を測定していたため、スチューデントｔ検定とχ^２検定とを行った。統計的有意性の観点とＣＡＬに共通する特徴の傾向の観点とにより、第１期研究と第２期研究とからＣＡＬ発生に至った危険因子を特定する変数を選定することとした。なお、予備的に、ロジスチック回帰分析により、好中球数、血中ナトリウム濃度、アルブミン等の検査値データが役立つ可能性を調査したが、ＣＡＬ発生の予測に顕著な効果を見出せなかった。ヘマトクリット値については、PubMed Central（登録商標）で検索したが、ＣＡＬ発生の予測因子としての有用性を見出せなかった。

【0111】

線形混合モデルを用いた解析の結果、第１期研究で、ＣＡＬ発生と関係がある変数はなかった。しかし、線形混合モデルで、Ｌｏｇ尿中β２ＭＧ／Ｃｒの平均値はＣＡＬ発生と統計的に有意な正の関連性を示し（ｐ＝０．０３４）、血清中ＣＲＰ濃度の偏差値もＣＡＬ発生と統計的に有意な正の関連性を示した（ｐ＝０．００２）。さらに、アスパラギン酸アミノトランスフェラーゼ（ＡＳＴ）濃度の平均値もＣＡＬ発生と統計的に有意な正の関連性を示した（ｐ＝０．０６４）。第２期研究で、一次治療前時点でのＬｏｇ尿中β２ＭＧ／Ｃｒの最大値がＣＡＬ発生と統計的に有意な正の関連性を示し（ｐ＝０．０１７５）、ＣＡＬ発生と顕著に関係ある疾患の再燃はＣＡＬ発生と統計的に有意な正の関連性を示し（ｐ＝０．０１７５）、一次治療前時点での血清中ＣＲＰ濃度の最大値もＣＡＬ発生と統計的に有意な正の関連性を示した（ｐ＝０．０８５５）。第１期研究と第２期研究とで共通する特徴に基づき、ＣＡＬ発生と関係ある危険因子の候補として、一次治療前時点での尿中β２ＭＧ／Ｃｒの最大値と、一次治療前時点での血中ＣＲＰ濃度とが選定された。多変量ロジスチック回帰分析において、それぞれ、尿中β２ＭＧ／Ｃｒの最大値はＣＡＬ発生と統計的に有意な正の関連性を示す因子であり（ｐ＝０．０６３）、一次治療前時点での冠動脈直径の最大値はＣＡＬ発生と統計的に著しく有意な正の関連性を示す因子であること（ｐ＜０．０００１）が示唆された。

【0112】

ＳＥＭによる平均共分散構造分析を行うために、ＡＭＯＳ２３．０（ＩＢＭ−ＳＰＳＳ社製）を用いてパスモデルを作成した。作成の際、各々の被験者の臨床的背景として、性別と、一次治療前時点での月齢とを選んだ。ＫＤと関係ある因子として、一次治療前時点でのＩＶＩＧ不応予測スコア（佐野スコア）の得点に基づくＩＶＩＧ不応高リスク該当の有無と、一次治療でＩＶＭＰ投与を受けた回数とを選んだ。説明因子として、一次治療前時点でのＬｏｇ尿中β２ＭＧ／Ｃｒの最大値と、一次治療前時点での血清中ＣＲＰ濃度とを選んだ。ここで選んだ６種の被験者臨床データと、各々の被験者で一次治療直後または退院時（一次治療後かつＫＤ発症から３０日以内）に冠動脈径を測定してＺスコアの値が３．０ＳＤ以上である場合にＣＡＬ発生に至ったとの基準で判定した結果とを、それぞれ観測変数としてパスモデルを作成し、平均共分散構造分析を行い、潜在変数の因子得点に関するデータであるＳＳ計算値を算出させた。

【0113】

スチューデントｔ検定を用いて、ＣＡＬ発生の有無に関する判定結果と、ＳＳ計算値との間で、統計的有意性を分析した。図１０に示す第１期研究のパスモデルでは、０．３を上回る相関係数とｐ＜０．００２という有意なｐ値とを示した複数の変数について、これらの変数間に複数のパスを選定した。図１１に示す第２期研究のパスモデルでは、０．３を上回る相関係数とｐ＜０．０００１という有意なｐ値とに基づいて、潜在変数とＣＡＬ発生判定結果との間の標準化されたパスで最大の係数値を示した複数のパスを選定した。

【0114】

以下、本願発明者が行った後ろ向き研究での平均共分散構造分析では、ＲＭＳＥＡ値が０．０８０未満、且つ、パスモデルの適合に関するＲ^２値が０．９５を上回る場合に、統計学的有意性があり信頼できる統計モデルとして扱うこととした。また、ＲＭＳＥＡ値が０．０５０未満で、ＡＩＣ値が７０未満で、ＣＦＩ（comparative fit index）値が０．９５よりも大きく、及びパスモデルの適合に関するＲ^２値が１．０００である場合に、更に統計的有意性があり信頼できる統計モデルと判断した。図１０に示す第１期研究のパスモデルと、図１１に示す第２期研究のパスモデルとで、次の値に基づき優れた適合（統計的有意性）が示された。ＲＭＳＥＡ値は、第１期研究と第２期研究とで各々ｐ＜０．０００１であった。ＡＩＣは、第１期研究で６５、第２期研究で６１であった。ＣＦＩは、第１期研究と第２期研究とで各々１．０００であった。７種の観測変数と１つの潜在変数とを用いたパスモデルの適合に関するＲ^２値は、第１期研究と第２期研究とで各々１．０００であった。標準化直接効果として、潜在変数と「ＣＡＬ発生の有無に関する判定結果」に係る観測変数との標準化パス係数は、第１期研究で０．８０（ｐ＜０．００１）、第２期研究で０．７６（ｐ＜０．００１）であった。これらの結果から、図１０に示す第１期研究のパスモデルで設けた潜在変数と、図１１に示す第２期研究のパスモデルで設けた潜在変数との各々で、「ＣＡＬ発生の有無に関する判定結果」に係る観測変数に対して直接的な有意な因果関係が認められた。

【0115】

図１３に示すように、第１期研究で、冠動脈径のＺスコアが３．０ＳＤ以上であるためＣＡＬ発生ありと判定された被験者らのＳＳ計算値は、このＺスコアが３．０ＳＤ未満であるためＣＡＬ発生なしと判定された被験者らのＳＳ計算値と比べて、著しく高値であった（ｐ＜０．０００１）。第２期研究でも、図１４に示すように、Ｚスコアが３．０ＳＤ以上でＣＡＬ発生ありと判定された被験者らのＳＳ計算値は、Ｚスコアが３．０ＳＤ未満でＣＡＬ発生なしと判定された被験者らのＳＳ計算値と比べて、著しく高値であった（ｐ＜０．０００１）。このため、ＳＳ計算値の値から、ＣＡＬ発生の有無に関する判定結果を推測可能であることが示唆された。ＳＳ計算値の値に基づいて、ＣＡＬ陽性か又はＣＡＬ陰性かを判別するカットオフ値を決定するために、受信者動作特性（以下「ＲＯＣ」という）解析を行った。ＲＯＣ解析では、各々の被験者のＳＳ計算値を用いて「（潜在変数の感度）＋（潜在変数の特異度）−１」を計算して被験者らでの最大値が算出された場合に、その最大値の元になった被験者のＳＳ計算値が、被験者らのＳＳ計算値のカットオフ値となる。カットオフ値は、第１期研究（図１３）で２．０、第２期研究（図１４）で２．１であった。第１期研究と第２期研究とでカットオフ値が異なるため、臨床応用を図るにあたり、パスモデルについて、有意なｐ値を得ることよりも、０．３０以上の相関係数を得ること方が重要と考えられる。

【0116】

［第３期研究（実施例１−１）］
ＳＳ計算値にＣＡＬ発生か否かを正確に判別可能な潜在的価値があるか検証するため、第３期研究では、第１期研究と第２期研究との全データを一体化させ、平均共分散構造分析によりＣＡＬ発生リスクの予測可能性を改めて検討した。図１２に示す第３期研究のパスモデルでは、ｐ＜０．０００１との有意なｐ値と、０．３３以上の相関係数とを基準に用いた。このパスモデルで、ＲＭＳＥＡ値は０．０３２、ＡＩＣ値は６５、ＣＦＩ値は０．９８、７種の観測変数と１つの潜在変数とを用いたパスモデル適合に関するＲ^２値は１．０００であった。標準化直接効果として潜在変数と「ＣＡＬ発生の有無に関する判定結果」に係る観測変数との標準化パス係数は１．４７（ｐ＜０．００１）であり、標準化総合効果として標準化パス係数が０．７４１（ｐ＜０．００１）であった。これらの結果から、第３期研究のパスモデルで設けた潜在変数で、「ＣＡＬ発生の有無に関する判定結果」に係る観測変数に対して直接的な有意な因果関係が認められた。第３期研究では、図１５に示すように、ＳＳ計算値を用いたＣＡＬ発生の判別に優れており（ｐ＜０．０００１）、ＲＯＣ解析によるＳＳ計算値のカットオフ値は２．０であった。

【0117】

また、図１２に示す第３期研究のパスモデルで、「ＣＡＬ発生の有無に関する判定結果」として冠動脈径のＺスコアが２．５ＳＤ以上か否かでＣＡＬ陽性かＣＡＬ陰性かを判別するように変更して、平均共分散構造分析を行ってＳＳ計算値を算出した。その結果、図１６に示すように、Ｚスコアが２．５ＳＤ以上でＣＡＬ発生ありと判定された被験者らのＳＳ計算値は、Ｚスコアが２．５ＳＤ未満でＣＡＬ発生なしと判定された被験者らのＳＳ計算値と比べて、著しく高値であり（ｐ＜０．０００１）、ＲＯＣ解析によるＳＳ計算値のカットオフ値は１．３であった。同様に、図１２に示すパスモデルで、「ＣＡＬ発生の有無に関する判定結果」としてＺスコアが２．０ＳＤ以上か否かでＣＡＬ陽性かＣＡＬ陰性かを判別するように変更し、平均共分散構造分析でＳＳ計算値を算出した。その結果、図１７に示すように、Ｚスコアが２．０ＳＤ以上でＣＡＬ発生ありと判定された被験者らのＳＳ計算値は、Ｚスコアが２．０ＳＤ未満でＣＡＬ発生なしと判定された被験者らのＳＳ計算値と比べて、著しく高値であり（ｐ＜０．０００１）、ＲＯＣ解析によるＳＳ計算値のカットオフ値は０．３８であった。このように、ＣＡＬ発生の定義を３．０ＳＤ以上（図１５）から２．５ＳＤ以上（図１６）又は２．０ＳＤ以上（図１７）へ減少させるほど、ＳＳ計算値の値も減少したため、ＣＡＬ発生の有無の判別に関してＳＳ計算値の潜在能力も幾らかは減少したと考えられる。なお、潜在因子（潜在変数）が一次治療前時点での冠動脈直径最大値と関係するか否かを説明するため、入院時（一次治療前時点）での冠動脈直径最大値を含む別のＳＥＭ解析を試行したが、潜在変数と入院時での冠動脈直径最大値との直接的な関係は認められなかった（標準化パス係数０．０９５、ｐ＝０．２５）。

【0118】

ＡＮＮ解析では、図１２に示す第３期研究のパスモデルで平均共分散構造分析に用いた７種の観測変数のうちから、「ＣＡＬ発生の有無に関する判定結果」を除いて、残る６種の観測変数を図１８に示すように６種の入力変数として選定した。また、一次治療前時点での冠動脈径の最大値も、１種の入力変数として選定した。この冠動脈径の最大値は、前述したCoronary Z Score Calculatorにデータ入力してＬＭＳ法によりＺスコアに変換し、入力変数とした。残る６種の観測変数の各々は、前述した数式４で正規化させて６種の入力変数とした。出力変数は、Ｚスコアが３．０ＳＤ以上である場合にＣＡＬ発生と定義した場合に、ＳＥＭによる平均共分散構造分析で算出されたＳＳ計算値とした。中間層に４つのＡＮを有する三層型ＡＮＮにおいて、入力層に７種の入力変数を入力し、出力層で出力変数（ＳＳ計算値）を出力するように機械学習させて、統計学的モデル（学習済みモデル）を生成させた。この機械学習を繰り返して複数の学習済みモデルを生成させる際、０．０１、０．０２、及び０．０４のオーバーフィットペナルティにより、中間層で２つから４つのノードが選定された。複数の学習済みモデルで、０．８１以上のＲ^２値（ｒ＝０．９）と、五分割交差検証法のＲ^２値０．６４（ｒ＝０．８）とが測定された。選定した最良の統計モデルを、実施例１−１に係る学習済みモデルとした。この学習済みモデルにおいて、図１８に示す媒介変数（中間変数）Ｈ１で規定された数式６を、次に例示する。

【0119】

【数6】

【0120】

実施例１−１に係る学習済みモデルで、オーバーフィットペナルティは０．０２、五分割交差検証法によるＲ^２値は０．６４であった。この学習済みモデルの入力層に、機械学習の際に用いた入力変数を入力し、第３期研究の各々の被験者について「ＣＡＬ発生リスクに関するＳＳ予測値」を出力させた。図１９に示すように、平均共分散構造分析で算出されたＳＳ計算値と、このＳＳ計算値を含む学習用データで機械学習して生成された学習済みモデルから出力されたＳＳ予測値とで、関連性の強さとしてＲ^２＝０．８９という高値が示された。このＳＳ予測値により各々の被験者でＣＡＬ発生の有無を判別したところ、次の表５に示すように、Ｃ統計量（c index）０．８６０、感度７２．７％（８／１１）、及び特異度９９．１％（２３２／２３４）であった。なお、一部の被験者らでは、例えば尿中β２ＭＧ／Ｃｒの臨床データが欠けていた。また、学習済みモデルは、予測に用いる複数の入力変数が一部でも欠けている被験者（例えば尿中β２ＭＧ／Ｃｒの臨床データが欠けている被験者）についてＳＳ計算値を出力できない。このため、次の表５に示す感度と特異度との数値は、予測に用いた６種の臨床データに欠損がない被験者らに関しての結果である。

【0121】

【表5】

【0122】

第３期研究（実施例１−１）の結果から、本願発明者は、ＣＡＬ発生リスクを高精度に判別可能なＳＳ計算値の重要性と、ＣＡＬ発生リスクを高精度に予測可能な学習済みモデルの有用性とを見出した。実施例１−１の学習済みモデルを用いた予測精度は、従来のＩＶＩＧ不応予測スコア（前述した表１から表３）よりも優れていると考えられる。ただし、図１９で外れ値が幾らかあったため、改良の余地はある。もし将来的に、更に予測に適した観測変数や入力変数を発見できれば、更に感度を高めるように改良可能と考えられる。本願発明者が生成した学習済みモデルを活用するＣＡＬ発生リスク予測方法は、例えば、図３１に示すＫＤ急性期医療Ｓ２０で、一次治療前時点での判断（Ｓ２４）の際、一次治療後の判断（Ｓ３６）の際、及び二次治療後の判断（Ｓ４５）の際、通例であるＩＶＩＧ療法（Ｓ３１、Ｓ４１、Ｓ５１）よりも抗炎症効果に優れる他の抗炎症療法（Ｓ３２からＳ３５、Ｓ４２からＳ４４、Ｓ５２からＳ５６）を行う治療方針を早期決定する診断に貢献可能と期待される。

【0123】

実施例１−１に係る学習済みモデルを臨床応用可能か検討するために、新たなデータセットで検証した。新たなデータセットには、箕面市立病院で２０１９年から２０２０年の期間内に一次治療を受けた３８名のＫＤ急性期患者の臨床データを含めた。ただ、この３８名には、ＣＡＬ発生に至った患者が含まれていなかった。このため、新たなデータセットには、ＣＡＬ発生に至ったが除外基準に該当して除外され解析されず三次医療機関に転院したＫＤ急性期患者２名を含めた。そのうち一名のＫＤ急性期患者（少年）は、箕面市立病院でＩＶＩＧ療法と２回のＩＶＭＰ投与とで治療を受けたが、一次治療後に発熱が続いた。本願発明者はその患者（少年）を三次医療機関に転院させ、その患者は三次医療機関で血漿交換療法を受けた。残る一名のＫＤ急性期患者（少女）は、箕面市立病院でＩＶＩＧ療法とＩＶＭＰ投与との併用療法を受けたが、一次治療後にもＫＤの主要症状が５つ持続したため、本発明者はその患者（少女）を三次医療機関に転院させ、その患者は三次医療機関でＣｓＡ経口投与と更なるＩＶＩＧ療法とを受けた。実施例１−１に係る学習済みモデルに４０名分の新たなデータセットを入力し、出力されたＳＳ予測値によりＣＡＬ発生に至ったか否か判別したところ、感度５０％（１／２）、及び特異度１００％（３８／３８）であった。この調査結果は、新たなデータセットに含まれるＫＤ急性期患者が４０名という少人数であることを考慮すると、表５で前述した結果と矛盾していない。

【0124】

［比較例１−１］
従来、疾病の要因と発症との関連を調べる研究では、多変量ロジスチック回帰分析が試行されており、この解析で潜在変数を設けることはできなかった。このことを考慮し、図１２に示す第３期研究のパスモデルと比べて、図２０に示すように潜在変数を除いた比較例１−１に係るパスモデルを作成した。このパスモデルにより平均共分散構造分析を試行したが、前述の表５に示したように全く適合していない悪い統計モデルであったため、ＣＡＬ発生リスクを予測できる見込みが全くなかった。

【0125】

［比較例１−２］
比較例１−２では、従来どおり多変量ロジスチック回帰分析でＣＡＬ発生リスクを予測しようとした。このためには、第３期研究の被験者らの臨床情報から、性別、一次治療前時点での月齢、一次治療前時点での血清中ＣＲＰ濃度、一次治療前時点でのＬｏｇ尿中β２ＭＧ／Ｃｒ、一次治療前時点での佐野スコアによるＩＶＩＧ不応高リスク該当の有無、一次治療前時点での冠動脈直径最大値、及び一次治療でＩＶＭＰ投与を受けた回数という７種の被験者臨床データをそれぞれ独立変数として抽出し、並びにＣＡＬ発生の有無に関する判定結果を目的変数として抽出して、多変量ロジスチック回帰分析を試行した。しかし、前述の表５に示したように、Ｒ^２＝０．０６１５という低値で、Ｃ統計量は０．８０未満であったため、従来どおりＣＡＬ発生リスクの予測精度が低かった。

【0126】

［実施例１−２から実施例１−６］
前述した実施例１−１では、平均共分散構造分析で「ＣＡＬ発生の有無に関する判定結果」以外に６種の被験者臨床データを観測変数とした。実施例１−２から１−６では、この６種の観測変数のうち１種を削減してもＣＡＬ発生リスクを予測可能か否か、検証した。その結果、次の表６に示すように、ある程度に高精度で予測可能なことが示唆された。

【0127】

【表6】

【0128】

［実施例１−７から実施例１−１５］
実施例１−１での「ＣＡＬ発生の有無に関する判定結果」を除く６種の観測変数のうち２種又は３種を削減した場合に、平均共分散構造分析で統計モデルが適合するか検証した。その結果、次の表７と表８とに示すように、ある程度は適合したため、更に機械学習と組み合わせることにより、ＣＡＬ発生リスクをある程度に精度良く予測可能と考えられる。

【0129】

【表7】

【0130】

【表8】

【0131】

表８に示す実施例１−１３について検証したところ、標準化直接効果として潜在変数と「ＣＡＬ発生の有無に関する判定結果」に係る観測変数との標準化パス係数は１．４１３（ｐ＜０．００１）であり、標準化総合効果として標準化パス係数が０．７６８（ｐ＜０．００１）であった。つまり、観測変数として用いる被験者臨床データの種類を、実施例１−１の６種から実施例１−１３の３種に減らしても、潜在変数で「ＣＡＬ発生の有無に関する判定結果」に係る観測変数に対して直接的な有意な因果関係が認められた。このため、表６から表８で挙げた他の実施例についても、標準化パス係数を検討すれば同様に、潜在変数で「ＣＡＬ発生の有無に関する判定結果」に係る観測変数に対して直接的な有意な因果関係が認められるであろうと考えられる。一方、データは示さないが、６種の観測変数のうち４種以上を削減した場合、平均共分散構造分析で収束しなかった。このため、ＣＡＬ発生リスク予測には、３種以上の臨床データを要すると考えられる。

【0132】

［ＩｇＡＶにおいてＰＮで高度蛋白尿を伴う症例発生予測：実施例２−１］
本願発明者は、ＩｇＡＶ急性期患者においてＰＮで高度蛋白尿を伴う症例発生リスクも高精度に予測可能か検証するために、前述した第３期研究と同様にして後ろ向き研究を行った。被験者らは、１９９５年５月から２０１５年１０月の間に箕面市立病院で受診し、ＩｇＡＶと診断され入院治療を受けた９３名の小児ら（男性：女性＝４３：５０）であった。この小児らは、入院時（初回治療前時点）に６．２±２．２歳（平均値±ＳＤ）、入院時での即時型アレルギー疾患既往有２５％、及び入院時での腹痛有６０％であった。また、初回治療でＰＳＬ投与有３０％、つまり、初回治療で一定期間にわたりＰＳＬ経口投与を受けた場合に１回と数えて、ＰＳＬ投与を受けた回数０回が７０％で、回数１回が３０％であった。初回治療後かつＩｇＡＶ発症から３０日経過頃に診断したところ、ＰＮ発症２６名（２８％）であった。この２６名の被験者らで尿化学検査を行い、尿蛋白／Ｃｒ比が１．０以上である場合に、ＰＮで高度蛋白尿を伴う症例発生と判定したところ、この症例発生ありと判定されたもの１０名（９３名の小児らのうち１１％）であった。

【0133】

単変量解析により、入院時（初回治療前時点）での末梢血液、血液生化学、及びＦＤＰ・Ｄダイマー値と、ＰＮで高度蛋白尿を伴う症例で有意差（ｐ＜０．０５）を示した項目と、既報での報告とから、図２１に示すパスモデルを作成した際、各々の観測変数として、性別と、初回治療前時点での月齢と、初回治療前時点での血中ＦＤＰ・Ｄダイマー濃度と、初回治療前時点での即時型アレルギー疾患の有無と、初回治療前時点での腹痛の有無と、初回治療でのＰＳＬ投与の有無と、初回治療後でのＰＮで高度蛋白尿を伴う症例発生の有無に関する判定結果と、を選定した。このパスモデルを用いてＳＥＭによる平均共分散構造分析を行い、潜在変数の因子得点であるＳＳ計算値を算出させた。なお、一部の被験者らでは、判定結果を除く６種の観測変数のうち一部の臨床データ（例えば血中ＦＤＰ・Ｄダイマー濃度）が欠けていた。

【0134】

図２１に示すパスモデルの信頼性を検討したところ、ＡＩＣ値が６７、ＣＦＩ値が０．９８６、潜在変数のＣ統計量が０．９５８、ＲＭＳＥＡ値が０．０５２、７種の観測変数と１つの潜在変数とを用いたパスモデル適合に関するＲ^２値が１．０００であったため、信頼できる統計モデルであることが示唆された。標準化直接効果として潜在変数と「ＰＮで高度蛋白尿を伴う症例発生の有無に関する判定結果」に係る観測変数との標準化パス係数は１．３７（ｐ＜０．００１）であり、標準化総合効果として標準化パス係数が０．５８３（ｐ＜０．００１）であった。これらの結果から、パスモデルで設けた潜在変数で「ＰＮで高度蛋白尿を伴う症例発生の有無に関する判定結果」に係る観測変数に対して直接的な有意な因果関係が認められた。平均共分散構造分析で直接的な因果関係が認められた潜在変数に係る因子得点であるＳＳ計算値は、図２２に示すように、ＰＮで高度蛋白尿を伴う症例発生の判別に優れており（ｐ＜０．０００１）、ＲＯＣ解析によるＳＳ計算値のカットオフ値は１．３６であった。

【0135】

「ＰＮで高度蛋白尿を伴う症例発生の有無に関する判定結果」を除く６種の観測変数を、図２３に示すように６種の入力変数とし、ＳＳ計算値を出力変数として、ＪＭＰバージョン８．０を用いて三層型ＡＮＮに機械学習させて、実施例２−１に係る学習済みモデルを生成させた。この学習済みモデルの入力層に、機械学習で用いた６種の入力変数を入力し、各々の被験者について「ＰＮで高度蛋白尿を伴う症例発生リスクに関するＳＳ予測値」を出力させた。図２４に示すように、平均共分散構造分析で算出されたＳＳ計算値と、このＳＳ計算値を含む学習用データで機械学習して生成された学習済みモデルから出力されたＳＳ予測値とで、関連性の強さとしてＲ^２＝０．９２という高値が示された。交差検証法Ｒ^２値は０．４７であった。このＳＳ予測値により、各々の被験者でのＰＮで高度蛋白尿を伴う症例発生の有無を判別したところ、次の表９に示すように、Ｃ統計量０．９０、感度８７．５％（７／８）、及び特異度９８％（４９／５０）であった。

【0136】

【表9】

【0137】

上記した検証の後、本願発明者は、２０１９年前後に箕面市立病院でＩｇＡＶと診断され入院治療を受けた７名の小児らについて、臨床データを実施例２−１に係る学習済みモデルに入力し、ＳＳ予測値を出力させた。出力されたＳＳ予測値により、小児ら７名でのＰＮで高度蛋白尿を伴う症例発生リスクを予測させたところ、Ｃ統計量１．００、感度１００％（１／１）、特異度８０％（４／５）、Ｃ統計量１．００であった。症例数が少なく予備的な研究結果であるが、実施例２−１に係る学習済みモデルは、ＩｇＡＶ急性期患者でのＰＮで高度蛋白尿を伴う症例発生予測に使用可能であることが示唆された。この学習済みモデルは、ＩｇＡＶ急性期患者の初診時に、その３０日ほど後の近い将来に高度蛋白尿をきたし腎機能低下に至るリスク評価の予測診断に活用できるものと期待される。

【0138】

［比較例２−１］
図２１に示す実施例２−１に係るパスモデルと比べて、図２５に示すように潜在変数を除いた比較例２−１に係るパスモデルを作成した。このパスモデルにより平均共分散構造分析を試行したが、表９で前述したように適合していない悪い統計モデルであったため、ＰＮで高度蛋白尿を伴う症例発生リスクを予測できる見込みが全くなかった。

【0139】

［比較例２−２］
比較例２−２では、従来どおり多変量ロジスチック回帰分析により、ＰＮで高度蛋白尿を伴う症例発生リスクを予測しようとした。このためには、９３名の被験者らの臨床情報から、性別、初回治療前時点での月齢、初回治療前時点での血中ＦＤＰ・Ｄダイマー濃度、初回治療前時点での即時型アレルギー疾患の有無、初回治療前時点での腹痛の有無、及び治療でのＰＳＬ投与の有無という６種の被験者臨床データをそれぞれ独立変数として抽出し、並びに「治療後でのＰＮで高度蛋白尿を伴う症例発生の有無に関する判定結果」を目的変数として抽出して、多変量ロジスチック回帰分析を試行した。しかし、表９で前述したように、Ｒ^２＝０．４９２という低値であったため、ＰＮで高度蛋白尿を伴う症例発生リスクの予測精度が低かった。

【0140】

［実施例２−２から実施例２−５、及び参考例２−６］
実施例２−１での「ＰＮで高度蛋白尿を伴う症例発生の有無に関する判定結果」を除く６種の観測変数のうち１種または２種を削減した場合に、平均共分散構造分析で統計モデルが適合するか検証した。その結果、次の表１０に示すように、ある程度は適合したため、更に機械学習と組み合わせることにより、ＰＮで高度蛋白尿を伴う症例発生リスクを、ある程度に精度良く予測可能と考えられる。

【0141】

【表10】

【0142】

表１０に示す実施例２−４について検証したところ、標準化直接効果として潜在変数と「ＰＮで高度蛋白尿を伴う症例発生の有無に関する判定結果」に係る観測変数との標準化パス係数は１．０９９（ｐ＜０．００１）であり、標準化総合効果として標準化パス係数が０．６７１（ｐ＜０．００１）であった。同様に実施例２−５で検証すると、標準化直接効果として潜在変数と「ＰＮで高度蛋白尿を伴う症例発生の有無に関する判定結果」に係る観測変数との標準化パス係数は１．３５２（ｐ＜０．００１）であり、標準化総合効果として標準化パス係数が０．７００（ｐ＜０．００１）であった。つまり、観測変数として用いる被験者臨床データの種類を、実施例２−１の６種から実施例２−４や２−５の４種に減らしても、潜在変数で「ＰＮで高度蛋白尿を伴う症例発生の有無に関する判定結果」に係る観測変数に対して直接的な有意な因果関係が認められた。このため、表１０で挙げた他の実施例についても、標準化パス係数を検討すれば同様に、潜在変数で「ＣＡＬ発生の有無に関する判定結果」に係る観測変数に対して直接的な有意な因果関係が認められるであろうと考えられる。一方、データは示さないが、６種の観測変数のうち３種以上を削減した場合、平均共分散構造分析で収束しなかった。このため、ＣＡＬ発生リスク予測には、４種以上の臨床データを要すると考えられる。

【0143】

［ＩｇＡＶでのＰＮ発生予測：実施例３−１］
本願発明者は、ＩｇＡＶ急性期患者でＰＮ発生リスクも高精度に予測可能か検証するために、前述した実施例２−１と同じ被験者らの臨床情報から一部別の臨床データを抽出し、同様に後ろ向き研究を行った。図２６に示すパスモデルを作成した際、各々の観測変数として、性別と、初回治療前時点での月齢と、初回治療前時点での血中ＩｇＡ濃度と、初回治療前時点での血中ＩｇＥ濃度と、初回治療でのＰＳＬ投与の有無と、初回治療後でのＰＮ発生の有無に関する判定結果と、を選定した。このパスモデルを用いてＳＥＭによる平均共分散構造分析を行い、潜在変数の因子得点であるＳＳ計算値を算出させた。なお、ＰＮ発生の有無は、市販の尿蛋白試験紙を尿に浸して＋（タンパク質濃度約３０ｍｇ／ｄＬ以上）呈色が３日以上継続した場合、または、市販の尿潜血試験紙を尿に浸して＋（ヘモグロビン濃度約０．０６ｍｇ／ｄＬ以上もしくは赤血球濃度約２０個／μＬ以上）呈色か＋＋（ヘモグロビン濃度約０．１５ｍｇ／ｄＬ以上もしくは赤血球濃度約５０個／μＬ以上）呈色かが２日以上継続した場合、または、市販の尿潜血試験紙を尿に浸して＋＋＋（ヘモグロビン濃度約０．７５ｍｇ／ｄＬ以上もしくは赤血球濃度約２５０個／μＬ以上）呈色が２日以上継続した場合に、ＰＮ発生ありと判定した。また、多くの被験者らで、判定結果を除く５種の観測変数のうち、血中ＩｇＡ濃度および／または血中ＩｇＥ濃度の臨床データが欠けていた。判定結果を除く５種の観測変数について、臨床データに欠けのない被験者らは３２名であった。

【0144】

図２６に示すパスモデルの信頼性を検討したところ、ＣＦＩ値が０．９７９、潜在変数のＣ統計量が０．８０８、ＲＭＳＥＡ値が０．０３９、６種の観測変数と１つの潜在変数とを用いたパスモデル適合に関するＲ^２値が１．０００であったため、信頼できる統計モデルであることが示唆された。標準化直接効果として潜在変数と「ＰＮ発生の有無に関する判定結果」に係る観測変数との標準化パス係数は２．９７（ｐ＜０．００１）であり、標準化総合効果として標準化パス係数が０．４２６（ｐ＜０．００１）であった。これらの結果から、パスモデルで設けた潜在変数で「ＰＮ発生の有無に関する判定結果」に係る観測変数に対して直接的な有意な因果関係が認められた。平均共分散構造分析で直接的な因果関係が認められたＳＳ計算値は、図２７に示すように、ＰＮ発生の判別に優れており（ｐ＜０．０００１）、ＲＯＣ解析によるＳＳ計算値のカットオフ値は−０．２６であった。

【0145】

「ＰＮ発生の有無に関する判定結果」を除く５種の観測変数を、図２８に示すように５種の入力変数とし、ＳＳ計算値を出力変数として、ＪＭＰバージョン８．０を用いて三層型ＡＮＮに機械学習させて、実施例３−１に係る学習済みモデルを生成させた。この学習済みモデルの入力層に、機械学習で用いた５種の入力変数を入力し、各々の被験者について「ＰＮ発生リスクに関するＳＳ予測値」を出力させた。図２９に示すように、平均共分散構造分析で算出されたＳＳ計算値と、このＳＳ計算値を含む学習用データで機械学習して生成された学習済みモデルから出力されたＳＳ予測値とで、関連性の強さとしてＲ^２＝０．９９という高値が示された。交差検証法Ｒ^２値は０．９２であった。このＳＳ予測値により、各々の被験者でＰＮ発生の有無を判別したところ、次の表１１に示すように、Ｃ統計量０．７２５、感度６６．７％（６／９）、及び特異度７８．３％（１８／２３）であった。Ｃ統計量は０．８０未満であるが０．７０よりは大きいため、許容範囲内にあると考えられる。

【0146】

【表11】

【0147】

上記した検証の後、被験者らとは別のＩｇＡＶ患者ら２８名について、患者臨床データを実施例３−１に係る学習済みモデルに入力し、ＳＳ予測値を出力させたところ、感度７５％（３／４）、特異度５０％（１２／２４）であった。症例数が少なく予備的な研究結果であるが、実施例３−１に係る学習済みモデルは、ＩｇＡＶ急性期患者でのＰＮ発生予測に使用可能であることが示唆された。この学習済みモデルは、ＩｇＡＶ急性期患者の初診時に、その３０日ほど後の近い将来にＰＮ発生に至るリスク評価の予測診断に活用できるものと期待される。

【0148】

［比較例３−１］
図２６に示す実施例３−１に係るパスモデルと比べて、図３０に示すように潜在変数を除いた比較例３−１に係るパスモデルを作成した。このパスモデルにより平均共分散構造分析を試行したが、表１１に示すように全く適合していない悪い統計モデルであったため、ＰＮ発生リスクを予測できる見込みが全くなかった。

【0149】

［比較例３−２］
比較例３−２では、従来どおり多変量ロジスチック回帰分析でＰＮ発生リスクを予測しようとした。このためには、９３名の被験者らの臨床情報から、性別、初回治療前時点での月齢、初回治療前時点での血中ＩｇＡ濃度、初回治療前時点での血中ＩｇＥ濃度、及び治療でのＰＳＬ投与の有無という５種の被験者臨床データをそれぞれ独立変数として抽出し、並びに「治療後でのＰＮ発生の有無に関する判定結果」を目的変数として抽出して、多変量ロジスチック回帰分析を試行した。しかし、表１１に示すようにＲ^２＝０．１２２という低値で、特異度が４．３％と低すぎるため、ＰＮ発生リスクの予測精度が低かった。

【要約】

【課題】川崎病又はＩｇＡ血管炎での合併症発生リスク予測方法、学習済みモデル及びその生成方法を提供する。
【解決手段】学習済みモデルに臨床情報を入力してサンプルスコアの予測値を出力させるステップを含み、学習済みモデルは冠動脈拡大病変（ＣＡＬ）の有無を判定された被験者の臨床情報とサンプルスコアの計算値との関係を機械学習しており、臨床情報は、性別、月齢、冠動脈径、血管炎マーカー、高サイトカイン血症マーカー、及び静注用免疫グロブリン不応予測スコアの得点等の３種以上の臨床データを含み、サンプルスコアの計算値は、３種以上の臨床データとＣＡＬ発生の判定結果とを含む４種以上の観測変数で共分散構造分析を行い、判定結果に直接的に有意な因果関係を持つ潜在変数の因子得点である、川崎病でのＣＡＬ発生リスク予測方法である。ＩｇＡ血管炎で腎炎か又は腎炎で高度蛋白尿を伴う症例かの発生リスク予測方法である。
【選択図】図６

【図1】