(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-11-17
(45)【発行日】2023-11-28
(54)【発明の名称】疾患の発症を予測するための方法及び装置
(51)【国際特許分類】
G16H 50/50 20180101AFI20231120BHJP
【FI】
G16H50/50
(21)【出願番号】P 2022524603
(86)(22)【出願日】2021-10-20
(86)【国際出願番号】 KR2021014754
(87)【国際公開番号】W WO2022097971
(87)【国際公開日】2022-05-12
【審査請求日】2022-04-25
(31)【優先権主張番号】10-2020-0145947
(32)【優先日】2020-11-04
(33)【優先権主張国・地域又は機関】KR
(31)【優先権主張番号】10-2021-0123951
(32)【優先日】2021-09-16
(33)【優先権主張国・地域又は機関】KR
【早期審査対象出願】
(73)【特許権者】
【識別番号】522080797
【氏名又は名称】オンタクト ヘルス カンパニー リミテッド
(74)【代理人】
【識別番号】100147485
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100185225
【氏名又は名称】齋藤 恭一
(72)【発明者】
【氏名】リー スジン
(72)【発明者】
【氏名】シム ハクジュン
(72)【発明者】
【氏名】スン ジミン
(72)【発明者】
【氏名】ホン ヤンタケ
(72)【発明者】
【氏名】キム ガウン
(72)【発明者】
【氏名】ハ ソンミン
(72)【発明者】
【氏名】マエン シンヘ
【審査官】梅岡 信幸
(56)【参考文献】
【文献】韓国登録特許第10-1855117(KR,B1)
【文献】韓国公開特許第10-2020-0069217(KR,A)
(58)【調査した分野】(Int.Cl.,DB名)
G16H 10/00-80/00
(57)【特許請求の範囲】
【請求項1】
疾患の発症を予測するための方法であって、
対象者の健康診断データに基づく入力データを取得するステップであって、前記入力データは、複数の時点の情報と、前記時点それぞれで行われた診断結果の情報と、時点間の時間間隔情報とを含む、ステップと、
訓練された人工知能モデルを用いて前記入力データから年度別の疾患発症可能性を指示する出力データを生成するステップと、
前記年度別の前記疾患発症可能性に対する情報を出力するステップと、を含み、
前記人工知能モデルは、前記疾患に対して陽性診断を受けた少なくとも一つの受診者及び前記疾患に対して陰性診断を受けた少なくとも一つの受診者の健康診断データに基づく学習データを用いて訓練され、
前記健康診断データは、前記複数の時点の情報と前記診断結果の情報を含み、
前記陽性診断と前記陰性診断は、前記学習データのラベルとして用いられ、
前記人工知能モデルは、前記学習データに含まれる前記健康診断データを入力データとして用いて決定された予測結果と前記ラベルとに基づいて、逆伝播(backpropagation)を行うことにより、少なくとも一つの重みを更新することにより訓練され、
前記学習データは、前記健康診断データに基づいて生成された基本学習データと、前記健康診断データから派生したデータに基づいて生成された拡張学習データと、を含み、
前記派生したデータは、前記基本学習データに含まれる前記健康診断データにおける前記複数の時点の一部の情報と、前記複数の時点の一部に対応する少なくとも一つの診断結果の情報と、を含む、方法。
【請求項2】
前記派生したデータは、前記健康診断データに含まれている健康診断の実施時点に対する複数のサブセットに対応するデータセットを含む、請求項1に記載の方法。
【請求項3】
前記学習データは、複数のデータセットを含み、
前記複数のデータセットのそれぞれは、第1時点の健診結果情報、前記第1時点直前の健康診断を実施した第2時点と前記第1時点間の時間差情報、該当受診者の疾患診断時点情報に基づくラベルデータを含み、
前記ラベルデータは、予め定義された期間を均等分割した単位時間別に前記疾患の発症可否を指示するベクトルの形態を有する、請求項1に記載の方法。
【請求項4】
前記時間差情報は、第1時点が最も早い健康診断実施時点であれば、0に設定される、請求項3に記載の方法。
【請求項5】
前記人工知能モデルは、複数の時点に対する時点別対象者の健診結果情報、及び各健診結果情報に対応する以前時点との時間間隔値を入力として収容し、前記時間間隔値を考慮して循環的に隠れ状態値を生成し、予め定められた回数だけの循環によって生成された最終隠れ状態値に基づいて、予め定義された期間を均等分割した単位時間別の疾患発症可能性値を出力として生成する、請求項1に記載の方法。
【請求項6】
前記人工知能モデルは、前記最終隠れ状態値を、予め定義された期間を均等分割した単位時間の個数だけの疾患発症可能性値を含む形態で出力データを生成するネットワークを含む、請求項5に記載の方法。
【請求項7】
前記出力データの結果に対して相対的に高い寄与度を有する少なくとも一つの項目を判断するステップと、
前記少なくとも一つの項目に対する情報を出力するステップと、を含み、
前記少なくとも一つの項目を判断するステップは、
前記人工知能モデルの出力層から入力層に向かって順次ノード別の関連度スコア(relevance score)を決定するステップと、
前記入力層に含まれるノードの関連度スコアに基づいて前記ノードのうちの少なくとも一つのノードを選択するステップと、
選択された少なくとも一つのノードに対応する少なくとも一つの診断項目を確認するステップと、を含む、請求項1に記載の方法。
【請求項8】
前記少なくとも一つの項目は、将来に変更される可能性のある項目の中から選択される、請求項7に記載の方法。
【請求項9】
疾患の発症を予測するための方法であって、
対象者の健康診断データに基づく入力データを取得するステップであって、前記入力データは、複数の時点の情報と、前記時点それぞれで行われた診断結果の情報と、時点間の時間間隔情報とを含む、ステップと、
訓練されたT-LSTM(Time-aware-Long Short-Term Memory)ネットワークベース人工知能モデルを用いて前記入力データから年度別の疾患発症可能性を指示する出力データを提供するステップと、を含み、
前記出力データは、予め定義された期間を均等分割した単位時間別の前記疾患の発症可能性値を含み、
前記T-LSTMネットワークベース人工知能モデルは、前記疾患に対して陽性診断を受けた少なくとも一つの受診者及び前記疾患に対して陰性診断を受けた少なくとも一つの受診者の健康診断データに基づく学習データを用いて訓練され、
前記健康診断データは、
不均等な時間間隔で実施された健康診断の前記複数の時点の情報と前記診断結果の情報を含み、
前記陽性診断と前記陰性診断は、前記学習データのラベルとして用いられ、
前記T-LSTMネットワークベース人工知能モデルは、前記学習データに含まれる前記健康診断データを入力データとして用いて決定された予測結果と前記ラベルとに基づいて、逆伝播を行うことにより、少なくとも一つの重みを更新することにより訓練され、
前記学習データは、前記健康診断データに基づいて生成された基本学習データと、前記健康診断データから派生したデータに基づいて生成された拡張学習データと、を含み、
前記派生したデータは、前記基本学習データに含まれる前記健康診断データにおける前記複数の時点の一部の情報と、前記複数の時点の一部に対応する少なくとも一つの診断結果の情報と、を含む、方法。
【請求項10】
プロセッサによって動作すると、請求項1乃至9のいずれか一項に記載の方法を実行するために媒体に保存されたプログラム。
【請求項11】
疾患の発症を予測するための装置であって、
送受信部、
人工知能モデルを保存する保存部、及び
前記送受信部及び前記保存部に接続された少なくとも一つのプロセッサを含み、
前記少なくとも一つのプロセッサは、
対象者の健康診断データに基づく入力データを取得し、前記入力データは、複数の時点の情報と、前記時点それぞれで行われた診断結果の情報と、時点間の時間間隔情報とを含み、
訓練された人工知能モデルを用いて前記入力データから年度別の疾患発症可能性を指示する出力データを生成し、
前記年度別の前記疾患発症可能性に対する情報を出力するように制御され、
前記人工知能モデルは、前記疾患に対して陽性診断を受けた少なくとも一つの受診者及び前記疾患に対して陰性診断を受けた少なくとも一つの受診者の健康診断データに基づく学習データを用いて訓練され、
前記健康診断データは、前記複数の時点の情報と前記診断結果の情報を含み、
前記陽性診断と前記陰性診断は、前記学習データのラベルとして用いられ、
前記人工知能モデルは、前記学習データに含まれる前記健康診断データを入力データとして用いて決定された予測結果と前記ラベルとに基づいて、逆伝播を行うことにより、少なくとも一つの重みを更新することにより訓練され、
前記学習データは、前記健康診断データに基づいて生成された基本学習データと、前記健康診断データから派生したデータに基づいて生成された拡張学習データと、を含み、
前記派生したデータは、前記基本学習データに含まれる前記健康診断データにおける前記複数の時点の一部の情報と、前記複数の時点の一部に対応する少なくとも一つの診断結果の情報と、を含む、装置。
【請求項12】
疾患の発症を予測するための装置であって、
送受信部、
人工知能モデルを保存する保存部、及び
前記送受信部及び前記保存部に接続された少なくとも一つのプロセッサを含み、
前記少なくとも一つのプロセッサは、
対象者の健康診断データに基づく入力データを取得し、前記入力データは、複数の時点の情報と、前記時点それぞれで行われた診断結果の情報と、時点間の時間間隔情報とを含み、
訓練されたT-LSTM(Time-aware-Long Short-Term Memory)ネットワークベース人工知能モデルを用いて前記入力データから年度別の疾患発症可能性を指示する出力データを提供するように制御され、
前記出力データは、予め定義された期間を均等分割した単位時間別の前記疾患の発症可能性値を含み、
前記T-LSTMネットワークベース人工知能モデルは、前記疾患に対して陽性診断を受けた少なくとも一つの受診者及び前記疾患に対して陰性診断を受けた少なくとも一つの受診者の健康診断データに基づく学習データを用いて訓練され、
前記健康診断データは、
不均等な時間間隔で実施された健康診断の前記複数の時点の情報と前記診断結果の情報を含み、
前記陽性診断と前記陰性診断は、前記学習データのラベルとして用いられ、
前記T-LSTMネットワークベース人工知能モデルは、前記学習データに含まれる前記健康診断データを入力データとして用いて決定された予測結果と前記ラベルとに基づいて、逆伝播を行うことにより、少なくとも一つの重みを更新することにより訓練され、
前記学習データは、前記健康診断データに基づいて生成された基本学習データと、前記健康診断データから派生したデータに基づいて生成された拡張学習データと、を含み、
前記派生したデータは、前記基本学習データに含まれる前記健康診断データにおける前記複数の時点の一部の情報と、前記複数の時点の一部に対応する少なくとも一つの診断結果の情報と、を含む、装置。
【請求項13】
疾患を予測する方法であって、
外部装置からヒトの健康データ及び比較情報を取得するステップ-前記健康データは前記ヒトに対する複数回の健康データ及び前記複数回間の時間間隔データを含み-;及び
前記複数回の健康データ、前記時間間隔データ、及び前記比較情報に基づいてT-LSTM(Time-aware-Long Short-Term Memory)を用いて疾患予測情報を算出するステップ;を含み、
前記疾患予測情報は、現時から既定の時間間隔で配置された将来の時点に対して算出され、
前記疾患予測情報は、前記時点それぞれに対応する当該疾患に対する発症確率を数値化した数値情報に基づいて算出され、
前記当該疾患は、前記時点それぞれにおいて、数値情報が既定の閾値以上である場合に発症したと判断され、
前記時点のうちの第1時点における数値情報が前記閾値以上である場合、前記第1時点よりも将来の第2時点における数値情報が既定の閾値未満であっても、前記第2時点でも当該疾患が発症したと判断され、
前記複数回間の時間間隔データは、隣接した複数の時点間の時間間隔値を含み、
前記時間間隔値は、非均等であり、
前記健康データは、前記ヒトに対する一般情報、計測情報、血液情報、問診情報、画像情報、遺伝子情報、及びライフログ情報を含み、
前記比較情報は、前記当該疾患を経た複数の患者の健康データ、健康に対する統計データを含み、
前記T-LSTMは、前記疾患に対して陽性診断を受けた少なくとも一つの受診者及び前記疾患に対して陰性診断を受けた少なくとも一つの受診者の健康診断データに基づく学習データを用いて訓練され、
前記健康診断データは、前記複数回に対する情報と診断結果に対する情報を含み、
前記陽性診断と前記陰性診断は、前記学習データのラベルとして用いられ、
前記T-LSTMは、前記学習データに含まれる健康診断データを入力データとして用いて決定された予測結果と前記ラベルとに基づいて、逆伝播を行うことにより、少なくとも一つの重みを更新することにより訓練される、方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、疾患の発症予測に係り、特に、人工知能(artificial intelligence、AI)アルゴリズムを用いて将来の疾患発症可能性を予測するための方法及び装置に関する。
【背景技術】
【0002】
疾患とは、人間の心身に障害を起こして正常な機能を阻害する状態を意味するものであり、疾患によっては苦痛を受けるだけでなく、さらには生を維持できないことがある。したがって、疾患を診断、治療及び予防するための様々な社会的システム及び技術が人類の歴史と共に発展してきた。疾患の診断及び治療において、技術の眩しい発展に伴って様々なツールや方式が開発されてきたが、これまで、終局的には医師の判断に依存している現実である。
【0003】
一方、最近、人工知能(artificial intelligence、AI)技術が大きく発展し、様々な分野で注目されている。特に、膨大な量の蓄積された医療データと、画像中心のデータなどの環境により、医療分野に人工知能アルゴリズムを組み込む多様な試みと研究が行われている。具体的には、疾患を診断、予測するなど、従来の臨床的判断に留まっていた作業を、人工知能アルゴリズムを用いて解決しようとする様々な研究が行われている。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明は、対象者の将来の疾患発症可能性を効果的に予測するための方法及び装置を提供することを目的とする。
【0005】
本発明は、一定期間にわたって1年単位で疾患発症可能性を予測するための方法及び装置を提供することを目的とする。
【0006】
本発明は、疾患発症可能性を判断するのに影響を与えた寄与因子(contributed factor)を判断するための方法及び装置を提供することを目的とする。
【0007】
本発明は、ヒトに対する多数回に該当する健康データが存在する場合、多数回間の時間間隔を考慮してより正確に特定の時点に対する発症リスクを予測するための方法及び装置を提供することを目的とする。
【0008】
本発明で解決しようとする技術的課題は、上述した技術的課題に制限されず、上述していない別の技術的課題は、以降の記載から本発明の属する技術分野における通常の知識を有する者に明確に理解できるであろう。
【課題を解決するための手段】
【0009】
本発明の一実施例による疾患の発症を予測するための方法は、対象者の健康診断データに基づく入力データを取得するステップと、訓練された人工知能モデルを用いて前記入力データから年度別の疾患発症可能性を指示する出力データを生成するステップと、前記出力データの結果に対して相対的に高い寄与度を有する少なくとも一つの項目を判断するステップと、前記年度別の疾患発症可能性及び前記少なくとも一つの項目に対する情報を出力するステップと、を含むことができる。
【0010】
本発明の一実施例によれば、前記人工知能モデルは、前記疾患に対して陽性診断を受けた少なくとも一つの受診者及び前記疾患に対して陰性診断を受けた少なくとも一つの受診者の健康診断データに基づく学習データを用いて訓練され、前記学習データは、前記健康診断データに基づいて生成された基本学習データと、前記健康診断データから派生したデータに基づいて生成された拡張学習データとを含むことができる。
【0011】
本発明の一実施例によれば、前記派生したデータは、前記健康診断データに含まれている健康診断の実施時点に対する複数のサブセットに対応するデータセットを含むことができる。
【0012】
本発明の一実施例によれば、前記学習データは、複数のデータセットを含み、前記複数のデータセットのそれぞれは、第1時点の健診結果情報、前記第1時点直前の健康診断を実施した第2時点と前記第1時点間の時間差情報、該当受診者の疾患診断時点情報に基づくラベルデータを含み、前記ラベルデータは、予め定義された期間を均等分割した単位時間別に前記疾患の発症可否を指示するベクトルの形態を有することができる。
【0013】
本発明の一実施例によれば、前記時間差情報は、第1時点が最も早い健康診断実施時点であれば、0に設定され得る。
【0014】
本発明の一実施例によれば、前記人工知能モデルは、複数の時点に対する時点別対象者の健診結果情報及び各健診結果情報に対応する以前時点との時間間隔値を入力として収容し、前記時間間隔値を考慮して循環的に隠れ状態値を生成し、予め定められた回数だけの循環によって生成された最終隠れ状態値に基づいて、予め定義された期間を均等分割した単位時間別の疾患発症可能性値を出力として生成することができる。
【0015】
本発明の一実施例によれば、前記人工知能モデルは、前記最終隠れ状態値を、予め定義された期間を均等分割した単位時間の個数だけの疾患発症可能性値を含む形態で出力データを生成するネットワークを含むことができる。
【0016】
本発明の一実施例によれば、前記少なくとも一つの項目を判断するステップは、人工知能モデルの出力層から入力層に向かって順次ノード別の関連度スコア(relevance score)を決定するステップと、前記入力層に含まれるノードの関連度スコアに基づいて前記ノードのうちの少なくとも一つのノードを選択するステップと、選択された少なくとも一つのノードに対応する少なくとも一つの診断項目を確認するステップと、を含むことができる。
【0017】
本発明の一実施例に係る疾患予測方法は、通信部が外部装置からヒトの健康データ及び比較情報を取得する健康データ取得ステップ-前記健康データは一人に対する複数回の健康データ及び複数回間の時間間隔を含む-と、プロセッサが、前記時間間隔を含む前記健康データ及び比較情報に基づいてLSTM(Long Short-Term Memory)を用いて疾患予測情報を算出する疾患予測情報算出ステップと、を含むことができる。
【0018】
本発明の一実施例によれば、前記疾患予測情報算出ステップは、現時点から将来の既定の時間間隔で前記疾患予測情報を算出することができる。
【0019】
本発明の一実施例によれば、前記疾患予測情報算出ステップは、当該疾患に対する発症確率を数値化した数値情報を生成し、前記数値情報が既定の閾値以上である場合、当該疾患が発症したと判断することができる。
【0020】
本発明の一実施例によれば、前記疾患予測情報算出ステップは、現時点から将来の既定の時間間隔で当該疾患に対する前記数値情報を生成し、第1時点で前記数値情報が既定の閾値以上である場合、前記第1時点よりも将来の第2時点で前記数値情報が既定の閾値未満であっても、前記第2時点でも当該疾患が発症したと判断することができる。
【0021】
本発明の一実施例によれば、前記比較情報は、複数回の比較情報を含み、複数回間の時間間隔も含み、前記疾患予測情報算出ステップは、前記時間間隔を含む前記健康データ、及び前記時間間隔を含む比較情報に基づいて前記疾患予測情報を算出することができる。
【0022】
本発明の一実施例によれば、前記少なくとも一つの項目は、将来に変更される可能性のある項目の中から選択できる。
【0023】
本発明の一実施例による疾患の発症を予測するための方法は、対象者の健康診断データに基づく入力データを取得するステップと、訓練された人工知能モデルを用いて前記入力データから年度別の疾患発症可能性を指示する出力データを提供するステップと、を含み、前記人工知能モデルは、不均等な時間間隔で実施された健康診断の健診結果情報に基づいて訓練され、前記出力データは、予め定義された期間を均等分割した単位時間別の前記疾患発症可能性値を含むことができる。
【0024】
本発明の一実施例による媒体に保存されたプログラムは、プロセッサによって動作すると、前述した方法を実行することができる。
【0025】
本発明の一実施例による疾患の発症を予測するための装置は、送受信部、人工知能モデルを保存する保存部、及び前記送受信部及び前記保存部に接続された少なくとも一つのプロセッサを含み、前記少なくとも一つのプロセッサは、対象者の健康診断データに基づいて入力データを取得し、訓練された人工知能モデルを用いて前記入力データから年度別の疾患発症可能性を指示する出力データを生成し、前記出力データの結果に対して相対的に高い寄与度を有する少なくとも一つの項目を判断し、前記年度別の前記疾患発症可能性及び前記少なくとも一つの項目に対する情報を出力するように制御することができる。
【0026】
本発明の一実施例による疾患の発症を予測するための装置は、送受信部、人工知能モデルを保存する保存部、及び前記送受信部及び前記保存部に接続された少なくとも一つのプロセッサを含み、前記少なくとも一つのプロセッサは、対象者の健康診断データに基づく入力データを取得し、訓練された人工知能モデルを用いて前記入力データから年度別の疾患発症可能性を指示する出力データを提供するように制御し、前記人工知能モデルは、不均等な時間間隔で実施された健康診断の健診結果情報に基づいて訓練され、前記出力データは、予め定義された期間を均等分割した単位時間別の前記疾患発症可能性値を含むことができる。
【0027】
本発明の他の一実施例に係る疾患予測システムは、外部装置からヒトの健康データ及び比較情報を取得する通信部-前記健康データは一人に対する複数回の健康データ及び複数回間の時間間隔を含む-と、前記時間間隔を含む前記健康データ及び比較情報に基づいてLSTM(Long Short-Term Memory)を用いて疾患予測情報を算出するプロセッサと、を含むことができる。
【0028】
本発明の一実施例によれば、前記プロセッサは、現時点から将来の既定の時間間隔で前記疾患予測情報を算出することができる。
【0029】
本発明の一実施例によれば、前記プロセッサは、当該疾患に対する発症確率を数値化した数値情報を生成し、前記数値情報が既定の閾値以上である場合、当該疾患が発症したと判断することができる。
【0030】
本発明の一実施例によれば、前記プロセッサは、現時点から将来の既定の時間間隔で当該疾患に対する前記数値情報を生成し、第1時点で前記数値情報が既定の閾値以上である場合、前記第1時点よりも将来の第2時点で前記数値情報が既定の閾値未満であっても、前記第2時点でも当該疾患が発症したと判断することができる。
【0031】
本発明の一実施例によれば、前記比較情報は、複数回の比較情報を含み、複数回間の時間間隔も含み、前記プロセッサは、前記時間間隔を含む前記健康データ、及び前記時間間隔を含む前記比較情報に基づいて前記疾患予測情報を算出することができる。
【0032】
本発明について簡略に要約して上述した特徴は、後述する本発明の詳細な説明の例示的な態様に過ぎず、本発明の範囲を制限するものではない。
【発明の効果】
【0033】
本発明によれば、学習された人工知能モデルを用いて、将来の疾患発症可能性が一定時間単位で予測できる。
【0034】
また、本発明によれば、ヒトに対する多数回に該当する健康データが存在する場合、過去の健康診断記録を全て考慮して特定時点における特定疾患に対する発症リスクを予測するという利点がある。
【0035】
本発明で得られる効果は、上述した効果に限定されず、上述していない別の効果は、以降の記載から、本発明の属する技術分野における通常の知識を有する者に明確に理解できるだろう。
【図面の簡単な説明】
【0036】
【
図2】本発明の一実施例による疾患発症可能性を予測する装置の構造を示す。
【
図3】本発明に適用可能な人工知能モデルを構成するパーセプトロン(perceptron)の例を示す。
【
図4】本発明に適用可能な人工知能モデルを構成する人工ニューラルネットワークの例を示す。
【
図5】本発明に適用可能なLSTM(long short-term memory)ネットワークの例を示す。
【
図6】本発明の一実施例による疾患発症可能性を予測するために使用されるデータの例を示す。
【
図7a】本発明の一実施例による疾患発症可能性を予測するための人工知能モデルの構造の例を示す。
【
図7b】本発明の一実施例による疾患発症可能性を予測するための人工知能モデルの隠れ層の構造の例を示す。
【
図8】本発明の一実施例による疾患発症可能性を予測するための人工知能モデルによって生成される出力の例を示す。
【
図9】本発明の一実施例による疾患発症可能性を予測するための順方向プロセス及び寄与因子(contributed factor)判断のための逆方向プロセスを示す。
【
図10】本発明の一実施例による人工知能モデルを訓練する手順の例を示す。
【
図11】本発明の一実施例による学習データを拡張(augmentation)する手順の例を示す。
【
図12】本発明の一実施例による人工知能モデルを用いて疾患発症可能性を予測する手順の例を示す。
【
図13】本発明の一実施例による疾患予測方法の一例を示す。
【
図14】本発明の一実施例による疾患予測方法における疾患予測情報算出ステップを説明するための数値情報の例を示す。
【発明を実施するための形態】
【0037】
以下、添付図面を参照して、本発明の実施例について、本発明の属する技術分野における通常の知識を有する者が容易に実施し得るように詳細に説明する。しかし、本発明は、様々な異なる形態で実現でき、ここで説明する実施例に限定されない。
【0038】
本発明の実施例を説明するにあたり、公知の構成又は機能についての具体的な説明が本発明の要旨を不明確にするおそれがあると判断される場合には、それについての詳細な説明は省略する。そして、図面において、本発明についての説明と関係ない部分は省略し、同様の部分には同様の図面符号を付した。
【0039】
本発明は、人工知能アルゴリズムを用いて疾患発症可能性を予測するためのものであり、具体的には、時間的に不規則に発生したデータを用いて人工知能モデルを学習し、学習された人工知能モデルを用いて一定の時間単位で疾患発症可能性を予測する技術に関する。
【0040】
また、本発明は、疾患予測システム、疾患予測方法、及びこれを実現する記録媒体に関するものであり、さらに詳細には、ヒトの健康データを用いて特定の時点に対する疾患の発症確率を予測する疾患予測システム、疾患予測方法,及びこれを実現する記録媒体に関する。
【0041】
【0042】
図1を参照すると、システムは、サービスサーバ110、データサーバ120、及び少なくとも一つのクライアント装置130を含む。
【0043】
サービスサーバ110は、人工知能モデルベースのサービスを提供する。すなわち、サービスサーバ110は、人工知能モデルを用いて学習及び予測動作を行う。サービスサーバ110は、ネットワークを介してデータサーバ120又は少なくとも一つのクライアント装置130と通信を行うことができる。例えば、サービスサーバ110は、データサーバ120から人工知能モデルを訓練するための学習データを受信し、訓練を行うことができる。サービスサーバ110は、少なくとも一つのクライアント装置130から学習及び予測(prediction)動作に必要なデータを受信することができる。また、サービスサーバ110は、少なくとも一つのクライアント装置130に予測結果に関する情報を送信することができる。
【0044】
データサーバ120は、サービスサーバ110に保存された人工知能モデルの訓練のための学習データを提供する。様々な実施例によって、データサーバ120は、誰でもアクセス可能な公共データを提供するか、或いは許可を必要とするデータを提供することができる。必要に応じて、学習データは、データサーバ120によって、又はサービスサーバ110によって前処理することができる。他の実施例によって、データサーバ120は省略されてもよい。この場合、サービスサーバ110は、外部で訓練された人工知能モデルを使用するか、或いはサービスサーバ110にオフラインで学習データが提供されることができる。
【0045】
少なくとも一つのクライアント装置130は、サービスサーバ110によって運用される人工知能モデルに関連するデータをサービスサーバ110と送信及び受信する。少なくとも一つのクライアント装置130は、ユーザによって使用される装備であり、ユーザによって入力される情報をサービスサーバ110に送信し、サービスサーバ110から受信される情報を保存するか或いはユーザに提供(例:表示)することができる。場合によっては、いずれか一つのクライアントから送信されたデータに基づいて予測動作が行われ、予測の結果に関連する情報が他のクライアントに提供されることができる。少なくとも一つのクライアント装置130は、デスクトップコンピュータ、ラップトップコンピュータ、スマートフォン、タブレット、ウェアラブル機器などの様々な形態のコンピューティング装置であり得る。
【0046】
図1には示されていないが、システムは、サービスサーバ110を管理するための管理装置をさらに含むことができる。管理装置は、サービスを管理する主体によって使用される装置であって、サービスサーバ110の状態をモニタリングするか、或いはサービスサーバ110の設定を制御する。管理装置は、ネットワークを介してサービスサーバ110に接続するか、或いはケーブル接続を介して直接接続することができる。管理装置の制御に応じて、サービスサーバ110は動作のためのパラメータを設定することができる。
【0047】
図1を参照して説明したように、サービスサーバ110、データサーバ120、少なくとも一つのクライアント装置130、管理装置などがネットワークを介して接続され、相互作用することができる。ここで、ネットワークは、有線ネットワーク及び無線ネットワークのうちの少なくとも一つを含むことができ、セルラーネットワーク、近距離ネットワーク、広域ネットワークのうちのいずれか一つ又は2つ以上の組み合わせからなることができる。例えば、ネットワークは、LAN(local area network)、WLAN(wireless LAN)、ブルートゥース(bluetooth)、LTE(long term evolution)、LTE-A(LTE-advanced)、5G(5th generation)のうちの少なくとも一つに基づいて実現できる。
【0048】
図2は本発明の一実施例による疾患発症可能性を予測する装置の構造を示す。
図2に例示された構造は、
図1のサービスサーバ110、データサーバ120、少なくとも一つのクライアント装置130の構造として理解できる。
【0049】
図2を参照すると、装置は、通信部210、保存部220、制御部230を含む。
【0050】
通信部210は、ネットワークに接続し、他の装置との通信を行うための機能を実行する。通信部210は、有線通信及び無線通信のうちの少なくとも一つを支援することができる。通信のために、通信部210は、RF(radio frequency)処理回路及びデジタルデータ処理回路のうちの少なくとも一つを含むことができる。場合によっては、通信部210は、ケーブルを接続するための端子を含む構成要素として理解できる。通信部210は、データ、信号を送受信するための構成要素であるので、「送受信部(transceiver)」とも呼ばれる。
【0051】
保存部220は、装置の動作のために必要なデータ、プログラム、マイクロコード、命令語集合、アプリケーション等を保存する。保存部220は、一時的又は非一時的な保存媒体で実現できる。さらに、保存部220は、装置に固定されているか、或いは分離可能な形態で実現できる。例えば、保存部220は、コンパクトフラッシュ(compact flash、CF)カード、SD(secure digital)カード、メモリースティック、ソリッドステートドライブ(solid-state drive、SSD)及びマイクロ(micro)SDカードなどのNANDフラッシュメモリ(NAND flash memory)、ハードディスクドライブ(hard disk drive、HDD)などのマグネチックコンピュータ保存装置のうちの少なくとも一つで実現できる。
【0052】
制御部230は、装置の全体的な動作を制御する。このために、制御部230は、少なくとも一つのプロセッサ、少なくとも一つのマイクロプロセッサなどを含むことができる。制御部230は、保存部220に保存されたプログラムを実行し、通信部210を介してネットワークに接続することができる。特に、制御部230は、後述する様々な実施例によるアルゴリズムを行い、後述する実施例によって装置が動作するように制御することができる。
【0053】
図1及び
図2を参照して説明した構造に基づいて、本発明の様々な実施例による人工知能アルゴリズムベースのサービスが提供されることができる。ここで、人工知能アルゴリズムを実現するために、人工ニューラルネットワークからなる人工知能モデルが使用できる。人工ニューラルネットワークの構成単位であるパーセプトロン(perceptron)及び人工ニューラルネットワークの概念は、次のとおりである。
【0054】
パーセプトロンは、生物の神経細胞をモデリングしたものであって、多数の信号を入力として一つの信号を出力する構造を持つ。
図3は本発明に適用可能な人工知能モデルを構成するパーセプトロンの例を示す。
図3を参照すると、パーセプトロンは、入力値(例:x
1、x
2、x
3、…、x
n)のそれぞれに対して重み302-1~302-n(例えば、w
1j、w
2j、w
3j、…、w
nj)を掛けた後、重み付けされた(weighted)入力値を変換関数(transfer function)304を用いて合算する。合算過程で、バイアス(bias)値(例:b
k)が加えられることができる。パーセプトロンは、変換関数304の出力であるネット入力値(例:net
j)に対して活性化関数(activation function)406を適用することにより、出力値(例:o
j)を生成する。場合によっては、活性化関数406は、閾値(例:θ
j)に基づいて動作することができる。活性化関数は、さまざまに定義できる。本発明がこれに限定されるものではないが、例えば、活性化関数として、ステップ関数(step function)、シグモイド(sigmoid)、Relu、Tanhなどが使用できる。
【0055】
図3のようなパーセプトロンが羅列され、層をなすことにより人工ニューラルネットワークが設計され得る。
図4は本発明に適用可能な人工知能モデルを構成する人工ニューラルネットワークの例を示す。
図4において、円で表現された各ノードは
図3のパーセプトロンとして理解できる。
図4を参照すると、人工ニューラルネットワークは、入力層(input layer)402、複数の隠れ層(hidden layer)404a、404b、及び出力層(output layer)406を含む。
【0056】
予測を行う場合、入力層402の各ノードに入力データが提供されると、入力データは、入力層402、隠れ層404a、404bを成すパーセプトロンによる重み付け、変換関数演算、及び活性化関数演算などを経て出力層406まで順伝播(forward propagation)される。逆に、訓練を行う場合、出力層406から入力層402に向かった逆伝播(backward propagation)を介して誤差が計算され、計算された誤差に従って各パーセプトロンに定義された重み値が更新され得る。
【0057】
RNN(recurrent neural network)は、過去に入力された情報を用いて現在の状態を判断する構造を発現した人工ニューラルネットワークである。RNNは、繰り返し構造を用いて以前ステップで取得された情報を持続的に用いる。RNNの一種として、LSTM(long short-term memory)ネットワークが提案されたことがある。LSTMネットワークは、長期(long-term)依存性を制御するために提案されたものであって、RNNと同様に繰り返し構造を持つ。LSTMネットワークの構造は、下記
図5の通りである。
【0058】
図5は本発明に適用可能なLSTMネットワークの例を示す。
図5を参照すると、LSTMネットワークは、入力層と出力層間の隠れネットワーク510-1~510-3が繰り返される構造を持つ。これにより、時間の流れに応じた入力x
t-1、x
t、x
t+1などが提供されると、時点t-1における入力x
t-1のための隠れネットワーク510-1から出力される隠れ状態(hidden state)値は、次の時点tにおける入力x
tと共に次の時点tのための隠れネットワーク510-2に入力される。隠れネットワーク510-2は、シグモイドネットワーク512a、512b、512c、tanhネットワーク514a、514b、乗算演算子516a、516b、516c、及び加算演算子518を含む。シグモイドネットワーク512a、512b、512cのそれぞれは、重み及びバイアスを有し、活性化関数としてシグモイド関数を使用する。tanhネットワーク514a、514bのそれぞれは、重み及びバイアスを有し、活性化関数としてシグモイドtanh関数を使用する。
【0059】
シグモイドネットワーク512aは、忘却ゲート(forget gate)として機能する。シグモイドネットワーク512aは、以前時点の隠れ層の隠れ状態値ht-1と現在時点の入力xtの重み和に対してシグモイド関数を適用した後、結果値を乗算演算子516aに提供する。シグモイド関数の結果値は、乗算演算子516aによって以前時点のセルメモリ(cell memory)値Ct-1に掛けられる。これにより、LSTMネットワークは、以前時点のメモリ値を忘却するか否かを判断することができる。すなわち、シグモイドネットワーク512aの出力値は、以前時点のセルメモリ値Ct-1をどれほど維持するのかを指示する。
【0060】
シグモイドネットワーク512b及びtanhネットワーク514は、入力ゲート(input gate)として機能する。シグモイドネットワーク512bは、以前時点t-1の隠れ状態値h
t-1及び現在時点tの入力x
tの重み和に対してシグモイド関数を適用した後、結果値i
tを乗算演算子516bへ提供する。tanhネットワーク514は、以前時点t-1の隠れ状態値h
t-1及び現在時点tの入力x
tの重み和に対してtanh関数を適用した後、結果値
を乗算演算子516bへ提供する。シグモイドネットワーク512bの結果値i
t及びtanhネットワーク514の結果値
は、乗算演算子516bによって乗算された後、加算演算子510に提供される。これにより、LSTMネットワークは、現在時点のセルメモリ値C
tに現在時点の入力x
tをどれほど反映するかを決定し、決定に従ってスケーリング(scaling)することができる。加算演算子510により、忘却係数に掛けられた以前時点のセルメモリ値C
t-1・f
t及び
が合算される。これにより、LSTMネットワークは、現在時点のセルメモリ値C
tを決定することができる。
【0061】
シグモイドネットワーク512c、tanhネットワーク514b、乗算演算子516cは、出力ゲートとして機能する。出力ゲートは、現在時点のセル状態に基づいてフィルタリングされた値を出力する。シグモイドネットワーク512cは、以前時点t-1の隠れ状態値ht-1及び現在時点tの入力xtの重み和に対してシグモイド関数を適用した後、結果値otを乗算演算子516bへ提供する。tanhネットワーク514bは、現在時点tのセルメモリ値Ctに対してtanh関数を適用した後、結果値を乗算演算子516cに提供する。乗算演算子516cは、tanhネットワーク514bの結果値とシグモイドネットワーク512cの結果値とを乗算することにより、現在時点tの隠れ状態値htを生成する。これにより、LSTMネットワークは、現在時点のセルメモリ値を隠れ層においてどれほど維持するかを制御することができる。
【0062】
様々な疾患のシステムにおいて、患者間の異質性(heterogeneity)は、互いに異なる進行パターンを導き、互いに異なる治療的介入(therapeutic intervention)を要求することができる。時間的変動性(temporal dynamics)及び情報の異質性(heterogeneity)により、複雑な患者データからの所望の結果を予測することは挑戦的である。LSTMネットワークは、順次データを処理するための様々なドメインで成功的に使用されてきた。特に、時間認知(time-aware)LSTM(T-LSTM)ネットワークは、縦的(longitudinal)な患者記録内の不規則な時間区間を処理することができる。
【0063】
図6は本発明の一実施例による疾患発症可能性を予測するために使用されるデータの例を示す。
図6は疾患発症可能性を予測するために使用できる健診結果を生成する機関の訪問時点、すなわち健康診断を実施した時点を示すデータ600を例示する。
図6を参照すると、データ600は連続的な訪問間の時間間隔を示す。2回の連続的な訪問の時間間隔は、変化可能であり、数年の間隔であり得る。
【0064】
本発明において、健康診断又は健診とは、生体情報データを取得するための行為を意味する。生体情報は、ユーザ認証のための要素(例えば、虹彩(網膜)、指紋、顔面など)、生体信号要素(例えば、ECG(electrocardiogram)、EMG(electromyography)、EEG(electroencephalogram)、EOG(electrooculogram)、EGG(electroglottography)、フォトプレチスモグラフ(Photo Plethysmo Graph、PPG)、酸素飽和度(SpO2)、血糖、コレストロール、血流量)、生体インピーダンス要素(例:GSR、体脂肪、BMI(body mass index)、皮膚水和度、呼吸等)、生体力学的要素(例:動き、関節弛緩、動脈血圧、脈波、心拍、声帯発性、呼吸音、心音、血流、血液酸素化、カロリー消費量、体温、ストレス指数、血管年齢など)、又は生化学的要素(例:尿、粘液、唾液、涙、血液、血漿、血清、喀痰、脊髄液、胸水、乳頭吸引物、リンパ液、気道液、漿液、泌尿生殖管液、母乳、リンパ系体液、精液、脳脊髄液、気管系内体液、腹水、嚢胞腫瘍体液、羊水液など)から得ることができる生体が発生する様々な情報、及び性別、年齢、身長、体重、身体サイズ、家族歴、本人過去歴、喫煙如何、運動如何、飲酒如何などを含むことができる。本発明において、健康診断データ、健診結果又は健診データは、生体情報について数字、文字、記号などで表現された資料として理解できる。
【0065】
さらに、健診データの他に、健康データがさらに使用できる。ここで、健康データとは、疾患を予測する当事者である当該ヒトの健康に関連する情報を意味する。様々な実施例によって、健康データは、一般情報、計測情報、血液情報、問診情報のうちの少なくとも一つを含むことができる。例えば、一般情報はヒトの年齢、性別などを含むことができる。例えば、計測情報は、身体指数として背丈、ウエスト周りを含むことができ、体質量指数、血圧などを含むことができる。例えば、血液情報は、空腹時血糖、総コレステロール、中性脂肪、HDLコレステロール、LDLコレステロール、血色素、血清クレアチニン、γ-GTP、血清GOT、血清GPTなどを含むことができる。例えば、問診情報は、ヒトが直接作成した情報であって、家族歴、家族歴、喫煙、飲酒、運動量情報などを含むことができる。
【0066】
また、健康データは、画像情報、遺伝子情報及びライフログ情報をさらに含むことができる。例えば、画像情報は、胸部X線検査によって取得される胸部X線情報、心電図検査によって取得される心電図情報、腎臓弁の閉鎖により発生する振動に対する心臓音情報などを含むことができる。例えば、胸部X線情報は、非常に少量のイオン化放射線を用いて胸部内部の写真を生成した情報であって、肺、心臓及び胸壁を評価するために使用され、呼吸困難、持続的な咳、発熱、胸痛、怪我、肺炎、肺気腫又はがんなどの様々な肺状態を診断するために使用されることができる。例えば、心電図情報は、拍動の不規則性又は心臓筋肉損傷などの心臓状態を診断するために使用できる。例えば、心臓音情報は、測定した心臓音を定量化して横軸では時間、縦軸では心臓音の大きさを表す画像に変換した情報であって、心臓弁疾患などを診断することに使用できる。例えば、遺伝子情報は、遺伝子スクリーニングによって生成された遺伝子に関する情報であって、遺伝子の変形を検出し、これにより遺伝子改変による疾患を予測することに使用できる。例えば、ライフログ(life log)情報は、ヒトが所有するスマートフォン、ウェアラブルデバイスなどの端末40を介して日常における血圧、体温、血糖量などに関する情報であって、疾患などを予測することに使用できる。
【0067】
一方、健康データは、疾患を予測する当事者である一人に対する複数回に該当する健康データを含むことができ、複数回の時点間の時間間隔情報も含むことができる。すなわち、健康データに含まれる一般情報、計測情報、血液情報、問診情報、画像情報、遺伝子情報及びライフログ情報のそれぞれは、複数回にわたって生成されることができ、その結果、健康データは、複数回間の健康データが生成された時間間隔も含まれることができる。
【0068】
図6のようなデータ間の不規則な時間間隔を克服するために、様々な実施例によるシステムは、T(time aware)-LSTMネットワークを利用することができる。T-LSTMネットワークは、過去の状態を反映する際に時間間隔に関する情報を考慮することができる構造を持つ。特に、様々な実施例によるシステムで使用されるT-LSTMネットワークにおいて、最後の層、すなわち出力層はN個の時点(例えば、N個の年度(year))に関する情報を提供するように設計された構造を持つ。N個の時点に対応する値をラベル(label)として用いることにより、LSTMの多対多(many-to-many)方法は、所望の時点までのすべての予想値を導出するために使用できる。このような構造は、訪問の回数に影響されないという利点を持つ。
【0069】
図7aは本発明の一実施例による疾患発症可能性を予測するための人工知能モデルの構造の例を示す。
図7aを参照すると、不均等な時間間隔を有するデータ6000において、各訪問時点での健康診断データ(例えば、x
t-1、x
t、x
t+1など)、以前訪問時点との時間間隔値(例:Δ
t-1、Δt、Δ
t+1など)が入力データとして人工知能モデルに提供される。ここで、健康診断データは、与えられた医療イベント(medical events)の発生如何を指示する情報を含む。例えば、健康診断データは、与えられた医療イベントに関連する値を羅列したベクトルであってもよく、ベクトルの各元素は、対応する医療イベントに応じて異なる形式(例えば、バイナリ値、測定値など)を有することができる。例えば、数値で表されるデータ、具体的には、年齢、BMI(body mass index)、空腹時血糖値、ウエスト周り、各種被検査結果等の場合、全母集団データの各項目に対して最小値を0、最大値を1に設定し、正規化(normalization)された値が健康診断データに含まれることができる。他の例として、カテゴリ化されているデータ、具体的には、性別、家族歴、本人過去歴、喫煙如何、運動如何、飲酒如何などの場合、ワンホットエンコーディング(one-hot encoding)方式でモデル化されたデータが健康診断データに含まれることができる。
【0070】
人工知能モデルは、隠れ層710-~710-3が繰り返される構造を持つ。時点t-1のための隠れ層710-1は、時点t-1におけるセルメモリ値Ct-1及び隠れ状態値ht-1を次の時点tの隠れ層710-1に提供する。このとき、特定の時点で生成される隠れ状態値(例:ht+1)から疾患発症可能性に対する予測結果が生成できる。具体的には、隠れ状態値ht+1は、出力ベクトル生成層720に入力され、出力ベクトル生成層720から疾患発症可能性に対する予測結果が出力される。出力ベクトル生成層720は、完全接続層(fully connected layer)の形態を持つことができる。
【0071】
一実施例によって、予測結果は、特定の疾患に対してn個年度別の発症可能性値を有するベクターの形態を持つように設計される。これにより、予測結果を出力する出力層730は、予め定義された期間(例:10年)を均等分割した単位時間(例:1年)の個数だけの長さのベクトルを出力し、このために、単位時間の個数だけのノードで構成できる。隠れ層710-2の構造及び動作は、下記
図7bを参照してより詳細に説明される。
【0072】
図7bは本発明の一実施例による疾患発症可能性を予測するための人工知能モデルの隠れ層の構造の例を示す。
図7bを参照すると、時点tのための隠れ層710-2は、時点t-1におけるセルメモリ値C
t-1及び隠れ状態値h
t-1を受信し、時点tにおけるセルメモリ値C
t及び隠れ状態値h
tを生成する。隠れ層710-2は、第1ネットワーク711、第2ネットワーク712、乗算演算子713、加算演算子714、減算演算子715、シグモイドネットワーク512a、512b、512c、tanhネットワーク514a、514b、乗算演算子516a、516b、516c、及び加算演算子518を含む。ここで、シグモイドネットワーク512a、512b、512c、tanhネットワーク514a、514b、乗算演算子516a、516b、516c、加算演算子518の機能及び動作は、
図5を参照して説明した通りである。
【0073】
第1ネットワーク711は、非線形関数を活性化関数として使用する。第1ネットワーク711の活性化関数は、入力値である時間間隔値Δtが小さいほど大きい値を出力する。入力値の範囲を昇順に第1範囲、第2範囲、第3範囲に区分すれば、第1範囲における入力対比出力の傾きの絶対値は第2範囲よりも大きいことができる。すなわち、第1範囲における時間間隔の増加による出力値の変化は、第2範囲でより大きいことができる。そして、第3範囲における入力対比出力の傾きの絶対値は第2範囲よりも大きいことができる。すなわち、第1ネットワーク711の活性化関数は、時間間隔の程度に応じて以前時点t-1の状態値をどれほど反映するかを決定する。
【0074】
第2ネットワーク712、乗算演算子713、加算演算子714、減算演算子715は、第1ネットワーク711によって決定された、すなわち、第1ネットワーク711の出力に対応する程度に以前時点t-1の状態値を反映するための演算を行う。具体的には、以前時点t-1の状態値Ct-1は、tanh関数を活性化関数として使用する第2ネットワーク712によって処理される。また、以前時点t-1の状態値Ct-1は、減算演算子715に提供され、減算演算子715によって状態値Ct-1及び第2ネットワーク712の結果値間の減算演算が行われる。ここで、第1ネットワーク711の出力は短期(short-term)メモリ値、減算演算子715の出力は長期(long-term)メモリ値とも呼ばれる。
【0075】
第2ネットワーク712の出力値及び第1ネットワーク711の出力値は乗算演算子713によって乗算される。すなわち、短期メモリ値は、第1ネットワーク711が出力値を重みとして用いて調節される。その後、加算演算子714によって、重み付けされた短期メモリ値と長期メモリ値とが合算、すなわち結合される(combined)。その後、重み付けされた短期メモリ値と長期メモリ値の結合値は、
図5を参照して説明した演算に従って処理される。
【0076】
図8は本発明の一実施例による疾患発症可能性を予測するための人工知能モデルによって生成される出力の例を示す。
【0077】
図8を参照すると、疾患発症可能性の予測は、循環演算部810、学習済み表現(learned representation)生成部830によって行われることができる。循環演算部810は、隠れ計測が循環的に繰り返される構造を持つ。各繰り返しは、各時点における健診結果データ及び時間間隔値を入力として用いることにより、セルメモリ値及び隠れ状態値を生成する。最後の隠れ層の隠れ状態値は、学習済み表現生成部820に入力され、学習済み表現生成部820は、入力された隠れ状態値を再構成(reconstruct)することにより予測結果、すなわち、与えられた期間内の単位時間別の疾患発症可能性情報を決定することができる。
【0078】
上述した様々な実施例によって、T-LSTMネットワークを利用して年度別の疾患発症可能性が予測できる。これに加えて、本発明の様々な実施例によるサービスは、疾患発症可能性に対する予測結果にどの要因が寄与したかを把握し、その結果をユーザに提供することができる。予測結果に対する寄与要因を把握するために、LRP(layer-wise relevance propagation)技術が使用できる。
【0079】
LRP技術は、再帰的分類器(recurrent classifiers)の正確な行為を検証及び理解するのに役立っており、テキストデータセットから主要パターンを検出することができる。他の非勾配(non-gradient)ベースの説明方式(例えば、ランダムサンプリング又は反復表現隠れ(iterative representation occlusion)に依存する)と比較して、本技術は確定的(deterministic)であり、ネットワークを介してワンパス(one pass)で計算できる。しかも、LRP技術は、説明を伝達するために外部分類器を訓練することを要求しないため独立的(self-contained)であり、説明は原本から直接得られる。
【0080】
様々な実施例によるシステムにおいて、LRPの使用はRNN(recurrent neural networks)に拡張される。LSTMなどの再帰的ネットワーク構造において接続の増加が誘発されるので、増加する接続に適用可能な特定の伝搬規則が再定義できる。一実施例によって、10年間の年度別予測課題において、LRP技術は、ワードベースのT-LSTMモデルに適用できる。これは、どのワードが患者記録内の要因に寄与した責任があるかについての信頼すべき説明を提供することができる。
【0081】
図9は本発明の一実施例による疾患発症可能性を予測するための順方向プロセス、及び寄与因子(contributed factor)を判断するための逆方向プロセスを示す。
図9を参照すると、順方向プロセス910は、入力層から出力層に向かって進行し、予測結果を生成する。これに対し、逆方向プロセス910は、出力層から入力層に向かって進行し、LRP技術を用いて、順方向プロセス910によって生成された予測結果に寄与した因子を判断することができる。
【0082】
様々な実施例によるLRP技術は、層別関連性保存原理に基づき、与えられた入力xに対して、ネットワークの出力層から開始して入力層まで量的結果物(quantity)fc(x)を逆伝播することにより、量的結果物を再分配する。LRP関連性伝播手順は、深層CNN(deep convolutional neural network)で発生した層の各タイプに対して層別に説明でき、上位層ニューロンの関連性を考慮して下位層ニューロンに関連性を付与する規則を定義することから構成される。ここで、各中間層ニューロンは、入力層ニューロンまでの関連性スコアに帰属することができる。
【0083】
T-LSTMなどのRNN構造の場合、本発明は、LRP手順に対する定義を多対一(many to one)の種類に制限する。便宜のために、本発明は、非線形活性化関数のための表記法を明示的に提示しない。もし、ある活性がニューロンに存在する場合、本発明は、後続の数式で活性化された下位層ニューロンの値を考慮することができる。入力空間関連性を計算するために、本発明は、値fc(x)に関心のある目標クラスcに対応する出力層ニューロンの関連性を設定することにより開始し、他の出力層ニューロンを単に無視するか或いはそれらの関連性を0に同等に設定することができる。以後、関連した接続の種類に基づいて後続の数式のいずれかに従って、本発明は、各中間下位層ニューロンに対する関連性スコアを層別に計算することができる。
【0084】
図10は本発明の一実施例による人工知能モデルを訓練する手順の例を示す。
図10は、演算能力を有する装置(例:
図1のサービスサーバ110)の動作方法を例示する。
【0085】
図10を参照すると、ステップS1001で、装置は、学習のための健康診断データを取得する。健康診断データは、過去に健康診断を受けたヒト(以下、「受診者」という。)の健康診断結果に関する情報を含む。ここで、学習に使用されるための健康診断データは、対象疾患の診断を受けた少なくとも一つの患者の健康診断結果に関する情報を含む。さらに、学習として使用されるための健康診断データは、対象疾患の診断を受けていない非患者の健康診断結果に関する情報をさらに含むことができる。健康診断結果に関する情報は、健康診断を実施した時点情報(例:年度)、各時点で健康診断を介して得られた健診結果情報を含むことができる。例えば、1人の患者に対する健康診断データは、下記表1のとおりである。
【0086】
【0087】
表1において、健診結果列に含まれる値は、健診項目によって異なる形式で定義できる。ステップS1003で、装置は、健康診断データを前処理し、ラベルを追加することにより、学習データを生成する。すなわち、装置は、健康診断データを人工知能モデルで使用可能な形式に加工し、ラベルを付加する。さらに、装置は、健康診断データから受診者情報(例:受診者ID)を除去することができる。このために、装置は、当該受診者の特定の疾患に対する診断結果データを取得し、診断結果データをラベルとして付加する。ここで、診断結果データは、ステップS1001で健康診断データと共に取得されるか、或いは健康診断データに含まれることができる。例えば、装置は、健康診断データに含まれている健診結果が生成された時点のうち、最も遅い年度から定められた期間(例:10年)の単位時間別に疾患の診断結果値を割り当てる。このとき、診断結果値のうち、疾患発症前の期間内の値は、正常を指示する値であって、疾患発症時点以後の値は疾患発症を示す値として設定される。例えば、表1の受診者が2012年に特定疾患の発症の診断を受けた場合、ラベルは下記表2の通りである。
【0088】
【0089】
表2の例のように、ラベルの開始年度、すなわちベース年度(base year)は、健康診断データに含まれている時点のうちの最も遅い年度である。すなわち、ラベルは、予め定義された期間(例:10年)を均等分割した単位時間(例:1年)別の対象疾患の発症如何値を含むベクトルの形態を有する。ステップS1005で、装置は、学習データを用いて訓練を行う。すなわち、装置は、学習データを人工知能モデルに入力し、予測結果及びラベルに基づいて逆伝播を行うことにより、少なくとも一つの重みを更新する。
図10を参照して説明した実施例において、装置は、ラベルを追加することにより学習データを生成し、訓練を行う。このとき、効果的な訓練のために、装置は、学習データを拡張(augmentation)することができる。この場合、人工知能モデルに対する学習は、健康診断データに基づいて生成された基本学習データ及び健康診断データから派生したデータに基づいて生成された拡張学習データを用いて訓練できる。学習データの拡張に対する一実施例は、下記
図11の通りである。
【0090】
図11は本発明の一実施例による学習データを拡張する手順の例を示す。
図11は、演算能力を有する装置(例:
図1のサービスサーバ110)の動作方法を例示する。
図11は一つの受診者の健康診断データを例として説明される。複数の受診者の健康診断データが存在する場合、以下に説明される手順が繰り返し行われることができる。
【0091】
図11を参照すると、ステップS1101で、装置は、健康診断の実施時点に対する複数のサブセットを決定する。具体的には、装置は、健康診断データに含まれている健康診断の実施時点のうちの少なくとも一つを組み合わせた少なくとも一つのサブセットを生成する。例えば、2003年、2005年、2009年の3つの時点を含む健康診断データが与えられる場合、生成される少なくとも一つのサブセットは、{2003}、{2005}、{2009}、{2003、2005}、{2003、2009}、{2005、2009}のうちの少なくとも一つを含むことができる。
【0092】
ステップS1103で、装置は、サブセットに対応する健康診断データセットを生成する。ここで、健康診断データセットは、時点のサブセットのそれぞれに対応し、ステップS1101で生成されたサブセットの個数だけの健康診断データセットが生成される。すなわち、装置は、サブセットに含まれている時点に対応する健診結果情報を時点のサブセットと組み合わせることにより、新しい健康診断データセットを取得することができる。例えば、前記[表1]のような原本健康診断データセットから、下記[表3]乃至[表8]のうちの少なくとも一つのような健康診断データセットが取得できる。
【0093】
【0094】
【0095】
【0096】
【0097】
【0098】
【0099】
ステップS1105で、装置は、健康診断データセットを前処理し、ラベルを付加する。すなわち、装置は、各健康診断データセットを人工知能モデルで使用可能な形式に加工し、ラベルを付加する。さらに、装置は、各健康診断データセットから受診者情報(例:受診者ID)を除去することができる。これにより、装置は、1つの健康診断データセットから拡張学習データを取得することができる。例えば、下記表9乃至表14のうちの少なくとも一つを含む学習データがさらに取得できる。
【0100】
【0101】
【0102】
【0103】
【0104】
【0105】
【0106】
図11を参照して説明したように、時点から複数のサブセットを抽出し、抽出されたサブセットの個数だけの追加的な学習データが取得できる。一実施例によって、上記に例示された表9乃至表14がいずれも学習データとして使用できる。他の実施例によって、学習データを拡張する際に、疾患の発症が診断された時点に最も近い健康診断の実施時点はサブセットに含まれなければならないという制約が適用できる。この場合、上記に例示された表9乃至表14のうち、2009年を含まない表9、表10、表12は、学習データから除外できる。
【0107】
図12は本発明の一実施例による人工知能モデルを用いて疾患発症可能性を予測する手順の例を示す。
図12は演算能力を有する装置(例:
図1のサービスサーバ110)の動作方法を例示する。
【0108】
図12を参照すると、ステップS1201で、装置は入力データを取得する。例えば、入力データは、クライアント装置(例:
図1のクライアント装置130)から受信できる。入力データは、疾患発症可能性予測の目標となる対象者の健康診断データを含むことができる。ここで、対象者とは、疾患の生成又は疾患の再発が疑われるか、或いは疾患の生成又は再発如何を調べようとする目的となる哺乳動物を意味する。一実施例によって、健康診断データを入力データとして用いるために、装置は健康診断データを前処理することができる。言い換えれば、装置は、健康診断データを人工知能モデルで入力データとして使用できるようにフォーマット化(formatting)することができる。他の実施例によって、健康診断データのフォーマット化はクライアント装置によって行われた後、フォーマット化されたデータが装置に提供できる。
【0109】
ステップS1203で、装置は、入力データに基づいて、年度別の疾患発症可能性を予測する。このために、装置は、人工知能モデルを用いて入力データから年度別の疾患発症可能性を指示する出力データを生成する。出力データは、疾患別情報及び年度別情報を含む二次元ベクトルとして理解できる。すなわち、出力データは、現在から与えられた期間(例:10年)内に疾患別の発症がどの時点(例:年度)に発生する可能性があるかを指示することができる。例えば、現在が2021年であれば、出力データは下記表15の通りである。
【0110】
【0111】
表15において、RA1は、疾患Aに対する1番目の単位時間における発症可能性に対する結果値を意味する。一実施例によって、装置は、単位時間別に疾患発症可能性に対する確率値を計算し、確率値を出力として提供することができる。この場合、RA1は0以上1以下の確率値である。他の実施例によって、装置は、確率値の代わりに、確率値を閾値と比較したバイナリ値を出力として提供することができる。この場合、RA1は肯定又は否定(例:1又は0)を指示するバイナリ値である。ステップS1205で、装置は、疾患予測結果に影響を与えた寄与要因を判断する。言い換えれば、装置は、ステップS1201で取得された入力データに含まれている様々な項目のうち、ステップS1203で取得された年度別の疾患発症可能性の結果に相対的に大きく影響を与えた少なくとも一つの項目を判断する。例えば、相対的に大きく影響を与えた順序で10個の項目が選別できる。他の例として、閾値以上の寄与度を有する少なくとも一つの項目が選別できる。このとき、選択可能な候補プール(pool)で調節可能でない因子、例えば、家族歴、対象者の過去力、年齢、性別などは除外できる。すなわち、少なくとも一つの項目は、将来に変更される可能性のある項目の中から選択できる。このために、装置は、LRP技術に基づいて人工知能モデルに含まれている各ノード(例:パーセプトロン)の関連度スコア(relevance score)を出力層から入力層に向かって順次決定することができる。入力層に含まれたノードの関連度スコアが計算されると、装置は、関連度スコアに基づいて一部のノードを選択し、選択されたノードに対応する入力値を確認する。例えば、装置は、関連度スコアの上位n%に属するノード、又は閾値以上の関連度スコアを有するノードを選択することができる。確認された入力値に対応する因子が、相対的に大きい影響を与えた項目と判定される。
【0112】
ステップ1207で、装置は、疾患予測結果及び寄与要因に関する情報を出力する。一実施例によって、装置は、疾患予測結果及び寄与要因を指示するデータを生成し、生成されたデータをクライアント装置に送信することができる。これにより、クライアント装置はデータを受信し、受信したデータに基づいて対象者の疾患予測結果及び寄与要因を確認し、可視化(例:表示、出力など)するか或いは対象者に伝達(例:電子メール、アップロードなど)することができる。
【0113】
一実施例によって、疾患予測方法は、疾患予測システム及び/又はコンピュータ上で実行されるプログラムを含む記録媒体によって実現できる。
【0114】
図13を参照すると、疾患予測方法は、通信部(例:
図2の通信部210)が外部装置からヒトの健康データ及び比較情報を取得するステップS1301を含むことができる。例えば、外部装置は、病院等の医療機関のサーバ(例:データサーバ120)、健康保険公団などの公的機関のサーバ(例:データサーバ120)、及びヒトが所有する端末(例:クライアント装置130)などを含むことができる。
【0115】
一実施例によって、ステップS1301は、ヒトの疾患を予測するために、基礎データとなる健康データ及び比較情報を外部から取得するステップを含むことができる。例えば、通信部は、病院などの医療機関サーバから一般情報、計測情報、血液情報、問診情報、画像情報、遺伝子情報などを受信することができ、それぞれの情報の生成時間を取得することができる。一実施例によって、通信部は、ヒトの端末(例:クライアント装置130)からライフログ情報などを受信することができ、該当情報の生成時間を取得することができる。
【0116】
ここで、比較情報は、公共機関のサーバ(例:データサーバ120)から取得される情報であって、例えば、健康保険公団のサーバから取得される国民の健康に関する統計データであってもよい。一実施例によって、比較情報は、年齢別・歳別・地域別に統計化された健康に関する情報、例えば、年齢別・歳別・地域別疾患統計、年齢別・歳別・地域別期待余命、年齢別・歳別・地域別身体指数、年齢別・歳別・地域別肥満指数、年齢別・歳別・地域別血糖指数、年齢別・歳別・地域別コレステロール指数などを含むことができる。一実施例によって、比較情報は、1年ごと、3年ごと又は5年ごとに公共機関のサーバ(例:データサーバ120)で更新されてもよく、よって、比較情報も更新された時間間隔を含むことができる。一方、比較情報は、公共機関のサーバ(例:データサーバ120)から取得される国民の健康に関する統計データに限定されず、一実施例によって、従来に疾患が発症した複数の患者の健康に関するデータを含むことができ、これも、疾患が発症した複数の患者の健康に関するデータ間の時間間隔を含むことができる。
【0117】
一実施例によって、疾患予測方法は、プロセッサが時間間隔を含む健康データ及び比較情報に基づいてLSTM(Long Short-Term Memory)を用いて疾患予測情報を算出するステップS1303を含むことができる。例えば、プロセッサは、通信部が外部装置から取得した健康データ及び比較情報に基づいて、疾患を予測しようとする当事者である当該ヒトに対する疾患の種類及び当該疾患の発症時期を予測することができる。
【0118】
一実施例によって、ステップS1303は、LSTMを用いて機械学習で実現できる。LSTMは、RNN(Recurrent Neural Network)の一種であって、以前のデータを活用して現在データを解析する機械学習プログラムであり得る。一実施例によって、疾患を予測しようとする当事者であるヒトに対する健康データは、複数回(例:Visit1~Visit6)にわたって生成されることができ、複数回の時点間の時間間隔(例:Δt1~Δt5)情報も生成されることができる。また、比較情報も、複数回にわたって更新でき、その結果、更新された複数回間の時間間隔も生成できる。
【0119】
ここで、プロセッサは、大きく、2つのデータを用いて疾患予測情報を算出することができる。第1のデータは、複数の健康データ及び比較情報に対するデータであり、第2のデータは、複数の健康データに対する時間間隔及び/又は複数の比較情報に対する時間間隔を含むことができる。すなわち、疾患予測方法は、複数の健康データの相互変化、複数の比較情報の相互変化、少なくとも一つの健康データと少なくとも一つの比較情報間の比較及び/又は複数の健康データに対する時間間隔及び/又は複数の比較情報に対する時間間隔を入力値として用いることにより、LSTMの機械学習を介して疾患を予測しようとする当事者であるヒトに対する疾患の種類及び疾患発症時期をより正確に予測することができる。
【0120】
ここで、一実施例によって、ステップS1303は、現時点から将来の既定の時間間隔で疾患予測情報を算出することができ、当該疾患に対する発症確率を数値化した数値情報を生成することができ、もし数値情報が既定の閾値以上である場合、当該疾患が発症したと判断することができる。数値情報に対する一例は
図14の通りである。本発明の一実施例による疾患予測方法は、10年以上の期間に対する予測結果を提供することができるが、以下、
図14は、説明の便宜のために、5年間の期間に対する予測結果を示す。
【0121】
図14は本発明の一実施例による疾患予測方法における疾患予測情報算出ステップを説明するための数値情報の例を示す。
図14はプロセッサによって算出したデータの一例を例示し、プロセッサは、疾患を予測しようとする当事者であるヒトに対する健康データ及び比較情報を演算して現在(now)及び現在から既定の時間間隔での特定疾患の発症確率を数値化した数値情報をそれぞれ生成することができる。既定の時間間隔はユーザによって定義できるが、説明の便宜のために、1年であると仮定して説明する。
図14に示すように、現在数値情報は0.001であり、現在から1年後の数値情報は0.0014であり、現在から2年後の数値情報は0.50であり得る。
【0122】
ここで、一実施例によって、数値情報が既定の閾値(例:0.50)以上である場合、プロセッサは、当該疾患が発症すると判断することができる。すなわち、現在の数値情報及び現在から1年後の数値情報は閾値0.50以下であることから、当該疾患が発症しないと判断する疾患予測情報を算出することができ、この場合、疾患予測情報のデータは「0」の値に設定できる。
【0123】
一方、現在から2年後の数値情報は閾値0.50以上であることから、プロセッサは、当該疾患が発症すると判断する疾患予測情報を算出することができる。この場合、疾患予測情報のデータは「1」の値に設定されることができる。すなわち、ステップS1301で、プロセッサは、現時点から将来の既定の時間間隔で当該疾患に対する数値情報をそれぞれ生成することができ、数値情報が既定の閾値以上であるか否かに基づいて、当該疾患が発症したか否かを判断することができる。
【0124】
一実施例によって、ステップS1303は、第1時点で数値情報が既定の閾値以上である場合、第1時点よりも将来の第2時点で数値情報が既定の閾値未満であっても、第2時点でも該当疾患が発症したと判断することができる。これをより詳細に説明すると、
図14に示すように、プロセッサは、現在から将来の既定の時間間隔(例えば、1年)で当該疾患に対する数値情報を生成し、生成された数値情報を用いて変換情報を生成することができる。例えば、変換情報は、数値情報が既定の基準値(例:0.50)以上である場合には「1」に設定され、数値情報が既定の基準値未満である場合には「0」に設定され得る。その結果、現在から将来の1年単位で生成された数値情報がそれぞれ0.001、0.0014、0.50、0.64、0.48、0.75である場合、現在から将来の1年単位での変換情報はそれぞれ0、0、1、1、0、1と決定され得る。
【0125】
ここで、ステップS1303によって、プロセッサは、変換情報に基づいて、該当疾患が発症するか否かに対する疾患予測情報を算出することができる。ここで、一実施例によって、プロセッサは、変換情報が既定の設定値(例:「1」)である場合、疾患予測情報を「1」と定義して、当該疾患が発症すると判断することができ、既定の設定値でない場合には、疾患予測情報を「0」と定義して、当該疾患が発症していないと判断することができる。
【0126】
但し、ここで、
図14に示すように、プロセッサは、現在から4年後の数値情報が既定の閾値未満であっても、疾患予測情報を「1」と定義して、現在から4年後にも当該疾患が発症したものと算出することができる。これをより詳細に説明すると、
図14に示すように、第1時点(例:現在から2年後の時点)における数値情報が0.50と算出されることにより、変換情報が「1」と決定されるので、疾患予測情報は「1」に設定されることにより、当該疾患が発症したものと判断できる。このとき、第1時点よりも将来の第2時点(例:現在から4年後の時点)における数値情報が0.48と算出されることにより、変換情報が「0」と定義されるにも拘らず、疾患予測情報は「1」と設定されるので、該当疾患が発症したものと算出できる。
【0127】
すなわち、ステップS1303で、プロセッサは、変換情報が「0」である場合、疾患予測情報が「0」であると算出するが、ただし、先立った時点での疾患予測情報が「1」である場合、変換情報が「0」である場合でも、疾患予測情報が「1」であると算出することができる。その結果、プロセッサは、数値情報、変換情報及び疾患予測情報を利用することにより、LSTMを用いて機械的に演算されて算出される疾患に対する予測結果の誤りを最小限に抑えることができるため、より正確な疾患に対する予測情報をユーザに提供することができる。
【0128】
上述した様々な実施例によって、システムは、疾患の発症可能性を予測し、予測結果に大きく寄与した要因に対する情報を提供することができる。前述した技術を利用して、様々な疾患、例えば、各種のがん、炎症性疾患、自己免疫疾患、代謝性疾患、神経学的疾患及び心血管系疾患に対する発症可能性が一定期間内に単位時間別に(例:最近健康診断実施時点から将来10年の期間内に年度別に)予想されることができる。
【0129】
上述した各種のがんは、癌腫、肉腫、良性腫瘍、原発性腫瘍、転移腫瘍、固形腫瘍、非固形腫瘍、血液腫瘍、白血病及びリンパ腫、並びに原発性及び転移性腫瘍を含む。癌腫は、食道癌、肝細胞癌、基底細胞癌(例:皮膚癌形態)、扁平上皮癌(例:各種組織)、膀胱癌(例:転移細胞癌(例:膀胱の悪性新生物)を含む)、気管支原性癌、結腸癌、結腸直腸癌、胃癌、肺癌(例:小細胞肺癌と非小細胞肺癌を含む)、副腎皮質癌、甲状腺癌、膵癌、乳癌、卵巣癌、前立腺癌、腺癌、汗腺癌、皮脂腺癌、乳頭状癌、乳頭状腺癌、嚢胞腺腫、髄様癌、腎細胞癌、非浸潤性乳管がん又は胆管癌、絨毛膜癌腫、精上皮腫、胚性がん腫、ウィルムス腫瘍、子宮頸癌、子宮癌、精巣癌、骨原性癌、上皮癌、及び鼻咽頭癌などを含むが、これらに限定されない。
【0130】
肉腫は、線維肉腫、粘液肉腫、脂肪肉腫、軟骨肉腫、脊索腫、骨形成性骨肉腫、骨肉腫、血管肉腫、内皮肉腫、リンパ管肉腫、リンパ管内皮肉腫、滑膜腫、中皮腫、ユーイング肉腫、平滑筋肉腫、横紋筋肉腫、及びその他の軟部組織肉腫を含むが、これらに限定されない。
【0131】
固形腫瘍は、神経膠腫、星状細胞腫、髄芽細胞腫、頭蓋咽頭腫、上衣腫、松果体腫瘍、血管芽細胞腫、聴神経腫瘍、乏突起膠腫、髄膜腫、黒色腫、神経芽細胞腫及び網膜芽細胞腫を含むが、これらに限定されない。
【0132】
白血病は、a)慢性骨髄増殖性症候群(例えば、多能性造血幹細胞の新生物性障害);b)急性骨髄白血病(例えば、多能性造血幹細胞又は限られた系統潜在能を有する造血細胞の新生物性形質転換);c)慢性リンパ球性白血病(CLL、免疫学的に未成熟かつ機能的に無能な小型リンパ球のクローナル増殖)(B細胞CLL、T細胞CLL前リンパ球性白血病、及びヘアリー細胞白血病;d)急性リンパ芽球性白血病(例:リンパ芽球の蓄積を特徴とするもの)を含むが、これらに限定されない。リンパ腫はB細胞リンパ腫(例:バケットリンパ腫)、ホジキンリンパ腫などを含むが、これらに限定されない。
【0133】
良性腫瘍は、例えば、血管腫、肝細胞腺腫、海綿状血管腫、限局性結節性過形成、聴神経腫瘍、神経線維腫、胆管腺腫、胆管嚢胞腫、線維腫、脂肪腫、平滑筋腫、中皮腫、奇形腫、粘液腫、結節性再生性過形成、トラコマ及び化膿性肉芽腫を含むが、これらに限定されない。
【0134】
原発性及び転移性腫瘍は、例えば、肺癌(例:肺腺癌、扁平上皮癌、大細胞癌、細気管支肺胞癌、非小細胞癌、小細胞癌、中皮腫を含むが、これらに限定されない)、乳癌(例:乳状癌、小葉性癌、炎症性乳癌、明細胞腺癌、粘液癌を含むが、これらに限定されない);及び結腸直腸癌(例:結腸癌、直腸癌を含むが、これらに限定されない);及び癌;膵癌(例:膵臓腺がん、膵内分泌腫瘍、神経内分泌腫瘍を含むが、これらに限定されない);前立腺癌;卵巣癌腫(例:卵巣上皮癌腫又は表面上皮-基質腫瘍(漿液性腫瘍を含む)、類内膜癌及び粘液性嚢胞腺癌、性索間質腫瘍を含むが、これらに限定されない);肝臓及び胆管癌(例:肝細胞癌、胆管癌、血管腫を含むが、これらに限定されない);食道癌(例:食道腺癌及び扁平上皮癌を含むが、これらに限定されない);非ホジキンリンパ腫;膀胱癌;子宮癌(例:子宮内膜腺癌、子宮乳頭状漿液性癌、子宮明細胞癌、子宮肉腫及び平滑筋肉腫、混合ミュラー管腫瘍を含むが、これらに限定されない);神経膠腫、膠芽細胞腫、髄芽細胞腫、及びその他の脳腫瘍;腎臓癌(例:腎細胞癌腫、明細胞腺癌、ウィルムス腫瘍を含むが、これらに限定されない);頭頸部癌(例:扁平上皮癌を含むが、これらに限定されない);胃癌(例えば、胃腺癌、消化管間質腫瘍を含むが、これらに限定されない);多発性骨髄腫;精巣癌;胚細胞腫瘍;神経内分泌腫瘍;子宮頸癌;消化管、乳房及びその他の器官のカルチノイド;及び印環細胞癌を含む。特定の例としては、肝癌、肺癌、胃癌、大腸癌、乳癌、前立腺癌、子宮癌、甲状腺癌、及び膵癌を含むことができる。
【0135】
前記炎症性疾患とは、炎症に起因するか、炎症から発生するか、或いは炎症を誘導する疾患をいう。また、用語「炎症性疾患」は、異常な組織損傷及び細胞死をもたらすマクロファージ、顆粒球、及び/又はTリンパ球による過剰反応によって誘発される異常調節(dysregulated)炎症反応を指すこともある。特定の具体例において、炎症性疾患は、抗体媒介炎症性過程を含む。「炎症性疾患」は、急性又は慢性の炎症性病態であり、感染又は非感染性の原因で発生し得る。炎症性疾患は、非制限的な例として、アテローム性動脈硬化症、動脈硬化症、自己免疫障害、多発性硬化症、全身紅斑性ループス、多発性筋肉痛リウマチ(PMR)、痛風関節炎、変性関節炎、腱炎、滑液嚢炎、乾癬、嚢胞性線維症、関節骨炎、関節リウマチ、炎症性関節炎、シェーグレン症候群、巨細胞動脈炎、進行性全身性硬化症(強皮症)、強直性脊椎炎、多発性筋炎、皮膚筋炎、天疱瘡、類天疱瘡、糖尿病(例、第I型)、重症筋無力症、橋本甲状腺炎、グレーブス病、グッドパスチャー症候群、混合結合組織病、硬化性胆管炎、炎症性腸疾患、クローン病、潰瘍性大腸炎、悪性貧血、炎症性皮膚病、通常性間質性肺炎(UIP)、石綿沈着症、珪肺症、気管支拡張症、ベリリウム中毒、タルク症、塵肺症、サルコイドーシス、剥離性間質性肺炎、リンパ球性間質性肺炎、巨細胞間質性肺炎、細胞間質性肺炎、外因性アレルギー性肺胞炎、ベゲナー肉芽腫症及び脈管炎関連形態(側頭動脈炎及び結節性多発性動脈炎)、炎症性皮膚病、肝炎、遅延型過敏反応(例えば、漆かぶれ)、肺炎、気道炎症、成人呼吸障害症候群(ARDS)、脳炎、即時性過敏反応、喘息、干し草熱、アレルギー、急性アナフィラキシー、リウマチ性熱、糸球体腎炎、腎盂腎炎、蜂窩織炎、膀胱炎、慢性胆嚢炎、局所貧血(虚血性損傷)、同種移植拒絶反応、宿主対移植片拒絶反応、虫垂炎、動脈炎、眼瞼炎、細気管支炎、気管支炎、子宮頸管炎、胆管炎、絨毛膜羊膜炎、結膜炎、涙腺炎、皮膚筋炎、心臓内膜炎、子宮内膜炎、腸炎、全腸炎、上顆炎、副精巣炎、筋膜炎、結合組織炎、胃炎、胃腸炎、歯肉炎、回腸炎、虹彩炎、喉頭炎、脊髄炎、心筋炎、腎炎、臍炎、卵巣炎、精巣炎、骨炎、耳炎、膵炎、耳下腺炎、心嚢炎、咽頭炎、腓膜炎、静脈炎、間質性肺炎、直腸肛門炎、前立腺炎、鼻炎、卵管炎、副鼻腔炎、口内炎、滑膜炎、精巣炎、扁桃炎、尿道炎、膀胱感染症(urocystitis)、ブドウ膜炎、膣炎、脈管炎、陰門炎、及び外陰膣炎、血管炎、慢性気管支炎、骨髄炎、視神経炎、側頭動脈炎、横断性脊髄炎、脳死性筋膜炎、及び脳死性全腸炎を含む。
【0136】
前記自己免疫疾患は、個体内の自己免疫反応(自己抗原、又は自己抗原に対して作用する免疫反応)の存在を指す。自己免疫疾患は、獲得(adaptive)免疫系が自己抗原に対して反応し、細胞及び組織損傷を媒介するようにする自己耐性の故障(breakdown)に起因する疾患を含む。特定の具体例において、自己免疫疾患は、少なくとも部分的には体液性免疫反応の結果として特徴付けられる。自己免疫疾患の例は、非制限的例として、急性播種性脳脊髄炎(ADEM)、急性壊死性出血性白質脳炎、アジソン病、無ガンマグロブリン血症、アレルギー喘息、アレルギー鼻炎、円形脱毛症、アミロイド症、強直性脊椎炎、抗体媒介移植拒絶反応、抗GBM/抗TBM腎炎,抗リン脂質抗体症候群(APS)、自己免疫血管浮腫、自己免疫再生不良性貧血、自己免疫自律神経異常症、自己免疫性肝炎、自己免疫性高脂血症、自己免疫性免疫不全症、自己免疫性内耳疾患(AIED)、自己免疫性心筋炎、自己免疫性膵炎、自己免疫性糖尿病網膜症、自己免疫性血小板減少性紫斑病(ATP)、自己免疫性甲状腺疾患、自己免疫性蕁麻疹、エキソン及びニューロン神経障害、Balo病(Balo disease)、ベチェット病、類天疱瘡、心筋症、キャッスルマン病、小児脂肪変症、シャーガス病、慢性疲労症候群、慢性炎症性脱髄性多発性神経炎(CIDP)、慢性再発性多発性骨髄炎(CRMO)、チャーグ・ストラウス症候群、瘢痕性類天疱瘡/良性粘膜類天疱瘡、クローン病、コーガン症候群、寒冷凝集素症、先天性心臓遮断、コクサッキー(coxsackie)心筋炎、クレスト(CREST)疾患、本態性混合寒冷グロブリン血症(essential mixed cryoglobulinemia)、脱髄性神経障害(demyelinating neuropathies)、疱疹状皮膚炎、皮膚筋炎、デビック病(視神経脊髄炎、円板状エリテストーデス、ドレスラー症候群(Dressler’s syndrome)、子宮内膜症、好酸球性筋膜炎、結節性紅斑、実験的アレルギー性脳脊髄炎、エヴァンズ症候群、線維筋痛症、線維性肺胞炎、巨細胞性動脈炎(側頭動脈炎)、糸球体腎炎、グッドパスチャー症候群、多発性脈管炎肉芽腫症(GPA:granulomatosis with poly「angiitis)、グレーブス病,ギュラン・バレー症候群、橋本脳炎、橋本甲状腺炎、溶血性貧血、ヘノフ-シェンライン紫斑病、妊娠疱疹、低マグロブミン血症、高ガンマグロブリン血症、特発性血小板減少性紫斑病(ITP)、IgA腎臓病、IgG4関連硬化性疾患、免疫調節脂質タンパク質、包含体筋肉炎、炎症性腸疾患、インスリン依存型糖尿病(1型)、間質性膀胱炎、小児関節炎、小児糖尿病、川崎病、イートン・ランバート症候群、白血球破砕性脈管炎、扁平苔癬、硬化性苔癬、木質結膜炎、線状IgA疾患(LAD)、ループス(SLE)、ライム病、メニエール病、顕微鏡多発性脈管炎、混合結合組織病(MCTD)、意義不明の単クローン性免疫グロブリン血症(MGUS)、潜食性角膜潰瘍、ムッハ・ハーバーマン病、多発性硬化症、重症筋無力症、筋炎、気面症、視神経脊髄炎(デビック病)、好中球減少症、眼球瘢痕性類天疱瘡、視神経炎、再発性リウマチ、PANDAS(連鎖球菌感染症に関連する小児自己免疫性神経精神障害)、傍腫瘍性小脳変性症、発作性夜間ヘモグロビン尿症(PNH)、顔面片側萎縮症、パーソネージジ(Parsonnage)・ターナー症候群、扁平部炎(pars planitis)(周辺性ブドウ膜炎)、天胞窓、末梢神経障害、静脈周囲脳脊髄炎(perivenous encephalomyelitis)、悪性貧血、POEMS症候群、結節性多発動脈炎、結節性多発動脈炎、多腺性(polyglandular)自己免疫症候群I、IIおよびIII型、リウマチ性多発筋痛症、多発性筋炎、心筋梗塞後症候群、心膜切開後症候群、プロゲステロン皮膚炎、原発性胆汁性肝硬変、原発性硬化性胆管炎、乾癬、乾癬性関節炎、特発性肺線維症、壊疽性膿皮症、赤芽球ろう、レイノー現象、反射性交感神経性ジストロフィー、ライター症候群、再発性多発性軟骨炎、むずむず脚症候群、後腹膜線維症、リウマチ熱、関節リウマチ、サルコイドーシス、シュミット症候群、強膜炎、強皮症、シェーグレン症候群、精子および精巣自己免疫、スティッフパーソン症候群(stiff person syndrome)、亜急性細菌性心内膜炎(SBE)、スザック症候群(Susac’s syndrome)、交感性眼炎、高安動脈炎、側頭動脈炎/巨細胞性動脈炎、血小板減少性紫斑病(TTP)、トロサ・ハント症候群、横断性脊髄炎、潰瘍性大腸炎、未分化結合組織病(UCTD)、ブドウ膜炎、脈管炎、水疱性皮膚病(vesiculobullous dermatosis)、白斑、ワルデンシュトレームマクログロブリン血症(WM)、及びウェゲナー肉芽腫症(多発性脈管炎を伴う肉芽腫症(GPA))を含む。
【0137】
代謝性疾患とは、生体内の物質代謝障害によって発生する疾患を総称するものであって、具体的には、肥満、真性糖尿病、インスリン依存性糖尿病などの糖尿病、高血糖症、異常脂質血症、閉塞性睡眠時無呼吸、NAFLD、NASH、肝線維症、肝硬変症、高脂血症、高血圧、動脈硬化症又は脂肪肝などを含むことができるが、これらに限定されない。さらに、前記肥満は、代謝障害(例:高血糖症、高インスリン血症)及び/又はその他の要因(例:過食、身体運動不足など)の結果及び/又はこれに関連する。
【0138】
前記神経学的疾患は、アルツハイマー病、パーキンソン病、ハンチントン病、認知症、脳卒中、注意欠如・多動症(ADHD)、自閉症スペクトラム障害(ASD)、うつ病、双極性障害、統合失調症、てんかん、多発性硬化症(MS)よりなる群から選択できる。前記心血管系疾患は、不整脈(例:心房又は心室又はその両方)、アテローム性動脈硬化症及びその後遺症、狭心症、心臓リズム障害、心筋虚血、心筋梗塞症、心臓又は血管動脈瘤、血管炎、脳卒中、四肢の末梢閉塞性動脈疾患、器官又は組織、脳の虚血後の再灌流損傷、心臓、腎臓又はその他の器官又は組織、動脈血圧の著しい低下に関連するショック状態(例えば、内毒素、手術、外傷性ショック又は敗血性ショック)、肺動脈高血圧(PAH)、高血圧、心臓弁疾患、心不全、血圧異常、ショック、血管収縮(例:片頭痛に関連するものを含む)、血管異常、静脈瘤療法、単一器官又は組織に限定された不全、機能性又は器官の静脈不全、心臓肥大、心室線維症、及び心筋再形成を含む。
【0139】
本発明の例示的な方法は、説明の明確性のために動作のシリーズで表現されているが、これは、ステップが行われる順序を制限するためのものではなく、必要な場合には、それぞれのステップが同時に又は異なる順序で行われてもよい。本発明による方法を実現するために、例示するステップにさらに他のステップを含むか、一部のステップを除いて残りのステップを含むか、又は一部のステップを除いて追加の他のステップを含むこともできる。
【0140】
本発明の様々な実施例は、すべての可能な組み合わせを羅列したものではなく、本発明の代表的な態様を説明するためのものであり、様々な実施例で説明する事項は、独立して適用されてもよく、2つ以上の組み合わせで適用されてもよい。
【0141】
また、本発明の様々な実施例は、ハードウェア、ファームウェア(firmware)、ソフトウェア、又はそれらの組み合わせなどによって実現できる。ハードウェアによる実現の場合、1つ又はそれ以上のASICs(Application Specific Integrated Circuits)、DSPs(Digital Signal Processors)、DSPDs(Digital Signal Processing Devices)、PLDs(Programmable Logic Devices)、FPGAs(Field Programmable Gate Arrays)、汎用プロセッサ(general processor)、コントローラ、マイクロコントローラ、マイクロプロセッサなどによって実現できる。
【0142】
本発明の範囲は、様々な実施例の方法による動作が装置又はコンピュータ上で実行されるようにするソフトウェア又はマシン-実行可能なコマンド(例えば、オペレーティングシステム、アプリケーション、ファームウェア(firmware)、プログラムなど)、及びこのようなソフトウェア又はコマンドなどが保存されて装置又はコンピュータ上で実行できる非一時的なコンピュータ可読媒体(non-transitory computer-readable medium)を含む。