特開2024-137197 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ エヌ・ティ・ティ・コミュニケーションズ株式会社の特許一覧 ▶ 国立大学法人　千葉大学の特許一覧

特開2024-137197推定装置、推定方法及び推定プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024137197

(43)【公開日】2024-10-07

(54)【発明の名称】推定装置、推定方法及び推定プログラム

(51)【国際特許分類】

G16H 50/20 20180101AFI20240927BHJP

【ＦＩ】

G16H50/20

【審査請求】未請求

【請求項の数】9

【出願形態】ＯＬ

(21)【出願番号】P 2023048624

(22)【出願日】2023-03-24

(71)【出願人】

【識別番号】399035766

【氏名又は名称】エヌ・ティ・ティ・コミュニケーションズ株式会社

(71)【出願人】

【識別番号】304021831

【氏名又は名称】国立大学法人千葉大学

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】相津琢磨

(72)【発明者】

【氏名】王祖嘉

(72)【発明者】

【氏名】森下智之

(72)【発明者】

【氏名】櫻井陽一

(72)【発明者】

【氏名】三澤園子

(72)【発明者】

【氏名】水地智基

(72)【発明者】

【氏名】吉村健佑

【テーマコード（参考）】

5L099

【Ｆターム（参考）】

5L099AA04

5L099AA22

(57)【要約】

【課題】希少疾患の発症を推定する推定モデルを構築することができる。
【解決手段】サーバ２０は、患者の検査データ及び診療データに対し、所定の前処理を行う第１前処理部２４と、少なくとも希少疾患を発症した患者の前処理後の検査データ及び診療データを学習データとし、患者の検査データ及び診療データと該患者の希少疾患の発症確率との関係を学習した第１推定モデル２６であって、複数の希少疾患ごとに発症確率を推定する推定モデルを用いて、前処理後の推定対象の患者の検査データ及び診療データを基に、複数の希少疾患ごとに推定対象の患者の発症確率を推定する第１推定部２５と、を有する。
【選択図】図６

【特許請求の範囲】

【請求項1】

患者の検査データ及び診療データに対し、所定の前処理を行う前処理部と、
少なくとも希少疾患を発症した患者の前記前処理後の検査データ及び診療データを学習データとし、患者の検査データ及び診療データと該患者の希少疾患の発症確率との関係を学習した推定モデルであって、複数の前記希少疾患ごとに発症確率を推定する推定モデルを用いて、前記前処理後の推定対象の患者の検査データ及び診療データを基に、前記複数の希少疾患ごとに前記推定対象の患者の発症確率を推定する推定部と、
を有することを特徴とする推定装置。

【請求項2】

前記前処理部は、前記検査データ及び診療データに対し、診察背景、病歴、診察所見、または、検査所見に関する項目を粒度に応じて段階的に設定し、各項目のデータをそれぞれ対応するカテゴリ変数に変換する第１前処理を行うことを特徴とする請求項１に記載の推定装置。

【請求項3】

前記前処理部は、前記検査データ及び診療データに対し、診察背景、病歴、診察所見、または、検査所見に関する項目を粒度に応じて段階的に設定し、各項目のデータをそれぞれ対応するカテゴリ変数に変換し、最も粒度が細かい項目のカテゴリ変数部を、前記カテゴリ変数に対応するデータの意味に従ってラベル付けし、同一ラベルで圧縮する第２前処理を行うことを特徴とする請求項１に記載の推定装置。

【請求項4】

前記前処理部は、前記検査データ及び診療データに対し、診察背景、病歴、診察所見、または、検査所見に関する項目を段階的に設定し、各項目のデータをそれぞれ対応するカテゴリ変数に変換し、最も粒度が細かい第１項目のカテゴリ変数部を、前記カテゴリ変数に対応するデータの意味に従ってラベル付けし、同一ラベルで圧縮するとともに、前記第１項目よりも粒度が粗い第２項目を、前記第２項目に属する前記第１項目の圧縮された各ラベルのカウント数で表現する第３前処理を行うことを特徴とする請求項１に記載の推定装置。

【請求項5】

前記前処理部は、
前記検査データ及び診療データに対し、診察背景、病歴、診察所見、または、検査所見に関する項目を粒度に応じて段階的に設定し、各項目のデータをそれぞれ対応するカテゴリ変数に変換する第１前処理を行う第１前処理部と、
前記検査データ及び診療データに対し、診察背景、病歴、診察所見、または、検査所見に関する項目を粒度に応じて段階的に設定し、各項目のデータをそれぞれ対応するカテゴリ変数に変換し、最も粒度が細かい項目のカテゴリ変数部を、前記カテゴリ変数に対応するデータの意味に従ってラベル付けし、同一ラベルで圧縮する第２前処理を行う第２前処理部と、
前記検査データ及び診療データに対し、診察背景、病歴、診察所見、または、検査所見に関する項目を段階的に設定し、各項目のデータをそれぞれ対応するカテゴリ変数に変換し、最も粒度が細かい第１項目のカテゴリ変数部を、前記カテゴリ変数に対応するデータの意味に従ってラベル付けし、同一ラベルで圧縮するとともに、前記第１項目よりも粒度が粗い第２項目を、前記第２項目に属する前記第１項目の圧縮された各ラベルのカウント数で表現する第３前処理部と、
を有し、
前記推定部は、
少なくとも前記希少疾患を発症した患者の前記第１前処理後の検査データ及び診療データを学習済みである第１推定モデルを用いて、前記第１前処理後の患者の検査データ及び診療データを基に、前記推定対象の患者の発症確率を推定する第１推定部と、
少なくとも前記希少疾患を発症した患者の前記第２前処理後の検査データ及び診療データを学習済みである第２推定モデルを用いて、前記第２前処理後の患者の検査データ及び診療データを基に、前記推定対象の患者の発症確率を推定する第２推定部と、
少なくとも前記希少疾患を発症した患者の前記第３前処理後の検査データ及び診療データを学習済みである第３推定モデルを用いて、前記第３前処理後の患者の検査データ及び診療データを基に、前記推定対象の患者の発症確率を推定する第３推定部と、
を有することを特徴とする請求項１に記載の推定装置。

【請求項6】

前記第１推定部による推定結果、前記第２推定部による推定結果、及び、前記第３推定部による推定結果を基に、前記第１推定部、前記第２推定部、及び、前記第３推定部の推定精度を評価する評価部と、
前記評価部による評価結果を基に、前記第１推定部、前記第２推定部、及び／または、前記第３推定部のいずれの推定結果を採用するかを設定する設定部と、
を有することを特徴とする請求項５に記載の推定装置。

【請求項7】

前記推定装置は、データを断片化したシェアの状態で複数のサーバに分散保管し、前記複数のサーバが秘密計算上で計算処理を行う秘密計算ＡＩ（Artificial Intelligence）によって実現されることを特徴とする請求項１に記載の推定装置。

【請求項8】

推定装置が実行する推定方法であって、
患者の検査データ及び診療データに対し、所定の前処理を行う工程と、
少なくとも希少疾患を発症した患者の前記前処理後の検査データ及び診療データを学習データとし、患者の検査データ及び診療データと該患者の希少疾患の発症確率との関係を学習した推定モデルであって、複数の前記希少疾患ごとに発症確率を推定する推定モデルを用いて、前記前処理後の推定対象の患者の検査データ及び診療データを基に、前記複数の希少疾患ごとに前記推定対象の患者の発症確率を推定する工程と、
を含んだことを特徴とする推定方法。

【請求項9】

患者の検査データ及び診療データに対し、所定の前処理を行うステップと、
少なくとも希少疾患を発症した患者の前記前処理後の検査データ及び診療データを学習データとし、患者の検査データ及び診療データと該患者の希少疾患の発症確率との関係を学習した推定モデルであって、複数の前記希少疾患ごとに発症確率を推定する推定モデルを用いて、前記前処理後の推定対象の患者の検査データ及び診療データを基に、前記複数の希少疾患ごとに前記推定対象の患者の発症確率を推定するステップと、
を実行させることを特徴とする推定プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、推定装置、推定方法及び推定プログラムに関する。

【背景技術】

【0002】

機械学習を用いた推定モデルを用いて、疾患の発症を推定する推定装置が提案されている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０１９－０１６２３５号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

ここで、希少疾患に対しては、一般医の段階では適切な判断を下すのが難しく、早期診断・早期治療の機会を逃している患者が少なくない。このため、希少疾患の発症確率を推定する推定モデルの構築が要望されている。

【0005】

本発明は、上記に鑑みてなされたものであって、希少疾患の発症を推定する推定モデルを構築することができる推定装置、推定方法及び推定プログラムを提供することを目的とする。

【課題を解決するための手段】

【0006】

上述した課題を解決し、目的を達成するために、本発明の推定装置は、患者の検査データ及び診療データに対し、所定の前処理を行う前処理部と、少なくとも希少疾患を発症した患者の前記前処理後の検査データ及び診療データを学習データとし、患者の検査データ及び診療データと該患者の希少疾患の発症確率との関係を学習した推定モデルであって、複数の前記希少疾患ごとに発症確率を推定する推定モデルを用いて、前記前処理後の推定対象の患者の検査データ及び診療データを基に、前記複数の希少疾患ごとに前記推定対象の患者の発症確率を推定する推定部と、を有することを特徴とする。

【発明の効果】

【0007】

本発明によれば、希少疾患の発症を推定する推定モデルを構築することができる。

【図面の簡単な説明】

【0008】

【図1】図１は、実施の形態１における推定モデルの学習フェーズの概要を示す図である。

【図2】図２は、実施の形態１における推定モデルを用いた推定フェーズの概要を示す図である。

【図3】図３は、実施の形態１に係る処理システムの構成の一例を示すブロック図である。

【図4】図４は、図３に示す登録者サーバの構成の一例を模式的に示す図である。

【図5】図５は、図４に示すデータ抽出部の処理を説明する図である。

【図6】図６は、図３に示すサーバの構成の一例を模式的に示す図である。

【図7】図７は、図６に示す第１前処理部の処理を説明する図である。

【図8】図８は、図６に示す第１前処理部の処理を説明する図である。

【図9】図９は、図６に示す第１前処理部の処理を説明する図である。

【図10】図１０は、図３に示す依頼元端末の構成の一例を模式的に示す図である。

【図11】図１１は、実施の形態１に係る学習処理の処理手順を示すシーケンス図である。

【図12】図１２は、実施の形態１に係る推定処理の処理手順を示すシーケンス図である。

【図13】図１３は、実施の形態２に係るサーバの構成の一例を模式的に示す図である。

【図14】図１４は、図１３に示す第２前処理部の処理を説明する図である。

【図15】図１５は、図１３に示す第２前処理部の処理を説明する図である。

【図16】図１６は、実施の形態２に係る学習処理の処理手順を示すシーケンス図である。

【図17】図１７は、実施の形態２に係る推定処理の処理手順を示すシーケンス図である。

【図18】図１８は、実施の形態３に係るサーバの構成の一例を模式的に示す図である。

【図19】図１９は、図１８に示す第３前処理部の処理を説明する図である。

【図20】図２０は、図１８に示す第３前処理部の処理を説明する図である。

【図21】図２１は、実施の形態３に係る学習処理の処理手順を示すシーケンス図である。

【図22】図２２は、実施の形態３に係る推定処理の処理手順を示すシーケンス図である。

【図23】図２３は、実施の形態４に係るサーバの構成の一例を模式的に示す図である。

【図24】図２４は、実施の形態４に係る学習処理の処理手順を示すシーケンス図である。

【図25】図２５は、図２４に示す前処理及び学習処理の処理手順を示すシーケンス図である。

【図26】図２６は、実施の形態４に係る推定処理の処理手順を示すシーケンス図である。

【図27】図２７は、実施の形態１に係る処理システムの構成の他の例を示すブロック図である。

【図28】図２８は、プログラムを実行するコンピュータを示す図である。

【発明を実施するための形態】

【0009】

以下に、本願に係る推定装置、推定方法及び推定プログラムの実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態により本願に係る推定装置、推定方法及び推定プログラムが限定されるものではない。

【0010】

［実施の形態１］
まず、実施の形態１について説明する。実施の形態１では、データを暗号化したまま計算できる秘密計算ＡＩ（Artificial Intelligence）によって、複数の希少疾患ごとに推定対象の患者の発症確率を推定する推定モデルを実現する場合について説明する。

【0011】

［学習フェーズ］
まず、推定モデルの学習フェーズについて説明する。図１は、実施の形態１における推定モデルの学習フェーズの概要を示す図である。

【0012】

図１に示すように、医療機関Ａ，Ｂでは、受診した患者に対する診療が行われ（図１の（１））、希少疾患を発症した患者の、検査データ及び診療データ（患者データ）が収集される。診療データには、この患者が発症した希少疾患を示す希少疾患情報、患者の既往歴、家族歴も含まれる。

【0013】

医療機関Ａ，Ｂの登録者サーバ１０Ａ，１０Ｂが、登録用ＷｅｂＵＩを介して、希少疾患を発症した患者の患者データを、学習データとして、データセンタ（ＤＣ）の秘密計算ＡＩに登録する（図１の（２））。学習データは、希少疾患を発症した患者の患者データのみに限らず、希少疾患以外の疾患を発症した患者の患者データも含む。なお、実施の形態１では、末梢神経疾患、具体的には、慢性炎症性脱髄性ニューロパチー、ギランバレー症候群、POEMS症候群、抗MAG抗体関連ニューロパチー、Charcot-Marie-Tooth病、アミロイドーシスを、希少疾患の一例として説明する。なお、例示した希少疾患は、一例であり、脳神経系の疾患に限らず、他の疾患であってもよい。

【0014】

そして、ＤＣでは、データを、複数のシェアと呼ばれる断片に分割し、これらのシェアを複数のサーバ２０Ａ～２０Ｃに分散保管させた状態で、複数のサーバ２０Ａ～２０Ｃが、複数のサーバ２０Ａ～２０Ｃ間でデータの演算と交換を行うマルチパーティ計算を行うことで秘密計算が実行される（例えば、参考文献１参照）。個々のシェアはそれぞれ意味のないデータになっており、シェア一つだけでは元データを復元できず情報は洩れないが、ある一定数以上のシェアが揃うと元のデータを復元することができる。
参考文献１：日本電信電話株式会社，秘密計算のシステムとその原理, ［online］，［令和４年１０月５日検索］、インターネット＜ＵＲＬ：https://www.rd.ntt/sc/project/data-security/NTT-himitsu-keisan.pdf＞

【0015】

実施の形態１では、秘密計算ＡＩである複数のサーバ２０Ａ～２０Ｃ間で秘密計算を行うことで、複数の希少疾患ごとに発症確率を推定する第１推定モデル２６（例えば、機械学習モデル）を作成する（図１の（３））。第１推定モデル２６のモデルパラメータは、複数のサーバ２０Ａ～２０Ｃに分散保管される。第１推定モデル２６は、暗号化された患者データに対し、複数の希少疾患の発症確率を推定し、暗号化された状態の推定結果を出力する。

【0016】

まず、複数のサーバ２０Ａ～２０Ｃは、学習用の患者データに対して、第１推定モデル２６が学習可能となるように、所定の前処理を行う（図１の（３Ａ））。サーバ２０Ａ～２０Ｃは、学習アルゴリズムを選択して、少なくとも、前処理後の、希少疾患を発症した患者の患者データを学習データとし、患者の患者データと該患者の希少疾患の発症確率との関係を、第１推定モデル２６に学習（例えば、機械学習）させる（図１の（３Ｂ））。サーバ２０Ａ～２０Ｃは、精度評価及びパラメータ調整を行った後に（図１の（３Ｃ））、第１推定モデル２６をデプロイする（図１の（３Ｄ））。

【0017】

［推定フェーズ］
次に、図２を参照して、推定モデルの運用フェーズについて説明する。図２は、第１推定モデル２６を用いた推定フェーズの概要を示す図である。

【0018】

図２に示すように、依頼元の医療機関Ｋでは、医師が、推定対象の、病名が確定できない患者の検査データ及び診療データ（患者データ）等を、依頼元端末３０に入力する（図２の（１））。依頼元端末３０は、推定対象の、病名が確定できない患者の患者データと、推定対象の、病名が確定できない患者の希少疾患の発症確率の推定要求とをＤＣに送信する（図２の（２））。

【0019】

ＤＣでは、サーバ２０Ａ～２０Ｃは、秘密計算を行うことで、推定対象の、病名が確定できない患者の患者データに所定の前処理を行った後に、第１推定モデル２６を用いて、推定対象の患者の希少疾患の発症確率を推定する（図２の（３））。

【0020】

依頼元端末３０は、サーバ２０Ａ～２０Ｃから、推定結果を受信し（図２の（４））、受信した推定結果を復号化した後に、推定結果を表示する（図２の（５））。依頼元端末３０は、推定された発症確率が所定値以上の疾患を「疑いあり」と表示する（図２の（６））。

【0021】

例えば、依頼元端末３０は、慢性炎症性脱髄性ニューロパチー、ギランバレー症候群、POEMS症候群、抗MAG抗体関連ニューロパチー、Charcot-Marie-Tooth病、アミロイドーシス、糖尿性ニューロパチーの一覧と、推定された発症確率が所定値以上の疾患については、発症の疑いがあることを示す「疑いあり」の文言とを対応付けたメニューＭ１を表示する。例えば、メニューＭ１では、推定対象の、病名が確定できない患者が、ギランバレー症候群と、Charcot-Marie-Tooth病との二つの疾患を発症する疑いがあることを示す。

【0022】

［処理システム］
実施の形態１における処理システムについて説明する。図３は、実施の形態１に係る処理システムの構成の一例を示すブロック図である。

【0023】

図１に示す実施の形態１に係る処理システム１００は、データを暗号化したまま計算できる秘密計算ＡＩ上で、複数の希少疾患の発症確率を推定する推定モデルを構築したシステムである。実施の形態１では、図１に示すように、学習用の希少疾患の患者データを収集する医療機関Ａ，Ｂの登録者サーバ１０Ａ，１０Ｂと、ＤＣ内のサーバ２０Ａ，２０Ｂ，２０Ｃと、対象となる患者の希少疾患の発症確率の推定依頼を行う依頼元端末３０とで構成される例について説明する。

【0024】

なお、図１に示す構成は一例に過ぎず、具体的な構成や各装置の数は特に限定されない。また、説明の容易化のために、登録者サーバ１０Ａ，１０Ｂと依頼元端末３０とを分けて説明するが、実際の運用では、登録者サーバ１０Ａ，１０Ｂが有する機能を依頼元端末３０が有していてもよい。また、登録者サーバ１０Ａ，１０Ｂを総称する場合には、登録者サーバ１０とする。サーバ２０Ａ，２０Ｂ，２０Ｃを総称する場合には、サーバ２０とする。

【0025】

医療機関Ａ，Ｂでは、登録者サーバ１０Ａ，１０Ｂが、希少疾患を発症した患者の検査データや医師による診療データから、所定の項目のデータのみを抽出した患者データを作成してＤＣのサーバ２０にアップロードする。患者データは、シェアに断片化された状態で、ＤＣのサーバ２０Ａ～２０Ｃに分散して保管される。すなわち、患者データが断片化された各シェアは、暗号化された状態で、ＤＣのサーバ２０Ａ～２０Ｃに分散して保管される。

【0026】

ＤＣのサーバ２０Ａ～２０Ｃは、サーバ２０Ａ～２０Ｃ間でデータの演算と交換とを行うマルチパーティ計算を行うことで、推定モデルの学習、推定モデルを用いた推定を行う。

【0027】

サーバ２０Ａ～２０Ｃは、学習フェーズでは、登録者サーバ１０Ａ，１０Ｂによって登録された学習用の患者データに所定の前処理を行った後に、第１推定モデル２６に学習させる。

【0028】

また、サーバ２０Ａ～２０Ｃは、推定フェーズでは、依頼元端末３０から、推定対象の、病名が確定できない患者の患者データと、この患者の希少疾患の発症確率の推定要求とを受け付けると、推定対象の患者の患者データに所定の前処理を行う。そして、サーバ２０Ａ～２０Ｃは、前処理後の患者データを基に、第１推定モデル２６を用いて、複数の希少疾患ごとに、この患者の発症確率を推定し、推定結果を依頼元端末３０に送信する。

【0029】

依頼元端末３０は、受信した推定結果を復号化した後に、複数の希少疾患のうち、推定された発症確率が所定値以上の疾患に対し、この疾患が発症する「疑いあり」として表示する。

【0030】

［登録者サーバ］
続いて、処理システム１００の各装置の構成について説明する。図４は、図３に示す登録者サーバ１０の構成の一例を模式的に示す図である。

【0031】

登録者サーバ１０は、ＲＯＭ（Read Only Memory）、ＲＡＭ（Random Access Memory）、ＣＰＵ（Central Processing Unit）等を含むコンピュータ等に所定のプログラムが読み込まれて、ＣＰＵが所定のプログラムを実行することで実現される。また、登録者サーバ１０は、ネットワーク等を介して接続された他の装置との間で、各種情報を送受信する通信インタフェースを有する。例えば、登録者サーバ１０は、ＮＩＣ（Network Interface Card）等を有し、ＬＡＮ（Local Area Network）やインターネットなどの電気通信回線を介した他の装置との間の通信を行う。そして、登録者サーバ１０は、タッチパネル、音声入力デバイス、キーボードやマウス等の入力デバイス、液晶ディスプレイなどの表示装置を有し、情報の入出力を行う。登録者サーバ１０は、データ抽出部１１及び登録部１２を有する。

【0032】

データ抽出部１１は、医療機関ＡのＤＢに登録されている、希少疾患を発症した患者の検査データ及び診療データから、サーバ２０Ａ～２０Ｃに秘密分散にて登録する学習用の患者データを抽出する。図５は、図４に示すデータ抽出部１１の処理を説明する図である。

【0033】

テーブルＴ１は、診療結果の一例であり、例えば、患者番号、患者氏名（不図示）、疾患（疾患名）、・・・、年齢（数値）、性別、身長（数値）、体重（数値）、既往歴、既往歴（自由記載）などの項目がある。

【0034】

データ抽出部１１は、テーブルＴ１から、第１推定モデル２６の学習に必要な項目を抽出する。例えば、データ抽出部は、テーブルＴ１から、ＩＤ、疾患（疾患名）、年齢（数値）、性別、身長（数値）、体重（数値）、既往歴、既往歴（自由記載）、家族歴（類症）、家族歴（疾患名）、主訴、主訴（自由記載）、症状の部位、症状の左右差、発症年齢、発症様式、発症様式（自）、握力（数）などの複数の項目（例えば、２１３項目）を抽出し、テーブルＴ２を作成する。

【0035】

なお、データ抽出部１１は、電子カルテシステムなどによって蓄積された患者データから、第１推定モデル２６の学習に必要な項目のデータを抽出する。また、データ抽出部１１は、紙のカルテに記載された内容を画像認識等によって認識することで、第１推定モデル２６の学習に必要な項目に対応するデータを抽出してもよい。

【0036】

登録部１２は、データ抽出部１１が抽出した、学習用の患者データ（例えば、テーブルＴ１）を複数のシェアに分割し、分割したシェアを２０Ａ～２０Ｃにそれぞれ分散して登録させる要求を行う。例えば、登録者サーバ１０の操作者は、Ｗｅｂブラウザで展開された、処理システム１００用のＷｅｂＵＩ画面を介して、登録データの選択やシェアの分散保管要求を行う。

【0037】

［サーバ］
次に、サーバ２０の構成について説明する。図６は、図３に示すサーバ２０の構成の一例を模式的に示す図である。

【0038】

サーバ２０は、ＲＯＭ、ＲＡＭ、ＣＰＵ等を含むコンピュータ等に所定のプログラムが読み込まれて、ＣＰＵが所定のプログラムを実行することで実現される。また、サーバ２０は、ネットワーク等を介して接続された他の装置との間で、各種情報を送受信する通信インタフェースを有する。例えば、サーバ２０は、ＮＩＣ等を有し、ＬＡＮやインターネットなどの電気通信回線を介した他の装置との間の通信を行う。そして、サーバ２０は、タッチパネル、音声入力デバイス、キーボードやマウス等の入力デバイス、液晶ディスプレイなどの表示装置を有し、情報の入出力を行う。サーバ２０は、シェアＤＢ２１、登録部２２、推定部２３及び第１学習部２７を有する。

【0039】

シェアＤＢ２１は、例えば、登録者サーバ１０Ａ，１０Ｂから登録を要求されたシェアを記憶する。シェアは、例えば、学習用の患者データである。

【0040】

登録部２２は、登録者サーバ１０Ａ，１０Ｂから登録を要求されたシェアを、シェアＤＢ２１に登録する。登録部２２は、登録者サーバ１０Ａ，１０Ｂからの登録要求を受け付けることで、複数の医療機関Ａ，Ｂから、希少疾患を発症した患者の検査データ及び診療データと、希少疾患以外の疾患を発症した患者の検査データ及び診療データとを取得し、登録する。

【0041】

推定部２３は、推定対象の、病名が確定できない患者の患者データを基に、複数の希少疾患ごとに、推定対象の患者の発症確率を推定する。推定部２３は、秘密計算上で、データを復元することなく推定処理を行う。推定部２３は、第１前処理部２４と、第１推定モデル２６を有する第１推定部２５とを有する。

【0042】

第１前処理部２４は、患者の検査データ及び診療データ（患者データ）に対し、所定の前処理を行う。第１前処理部２４は、患者データに対し、患者背景、病歴、診察所見、または、検査所見に関する項目を粒度に応じて段階的に設定し、各項目のデータを、それぞれ対応するカテゴリ変数に変換する第１前処理を行う。

【0043】

図７及び図８は、図６に示す第１前処理部２４の処理を説明する図である。第１前処理部２４は、登録者サーバ１０から登録されたテーブルＴ２に対し、患者の疾患名及び家族歴の疾患名、年齢、身長等の数値以外の項目のデータをそれぞれ対応するカテゴリ変数に変換する第１前処理を行う（図７の（１））。

【0044】

例えば、第１前処理部２４は、既往歴を、図８に示す対応表に応じた数値に変換する。第１前処理部２４は、既往歴の項目のデータについて、既往歴がない場合にはカテゴリ変数「０」に変換し、既往歴が糖尿病である場合にはカテゴリ変数「１」に変換し、既往歴が高血圧症である場合にはカテゴリ変数「２」に変換する。また、第１前処理部２４は、自由記述の項目を削除する。これによって、第１前処理部２４は、例えば、既往歴の項目「高血圧症」がカテゴリ変数「２」に変換されたテーブルＴ３を生成する。このように、第１前処理部２４は、各項目に対応するデータを、数値またはカテゴリ変数に変換する。

【0045】

そして、第１前処理部２４は、患者データに対し、患者背景、病歴、診察所見、または、検査所見に関する項目を、粒度に応じて段階的に設定する。図９は、図６に示す第１前処理部２４の処理を説明する図である。

【0046】

例えば、第１前処理部２４は、図９に示すように、患者背景を大項目とし、小項目として、疾患（目的変数）、年齢（歳）、性別の項目を対応付ける。

【0047】

第１前処理部２４は、病歴を大項目とし、小項目として、主訴１、症状の部位の項目を対応付ける。第１前処理部２４は、主訴１の項目には、意識障害、意識消失を示す各カテゴリ変数を値づける。

【0048】

第１前処理部２４は、診察所見を大項目とし、中項目として、高次機能、脳神経系、運動系の項目を対応付ける。そして、第１前処理部２４は、高次機能の小項目として、意識、失行の項目を対応付ける。失行の項目には、なし、口舌顔面失行、肢節運動失行、不明を示す各カテゴリ変数を値づける。

【0049】

第１前処理部２４は、検査所見を大項目とし、中項目として、血液検査、髄液検査、頭部ＭＲＩの項目を対応付ける。そして、第１前処理部２４は、血液検査の小項目として、WBC(/μL)、Eos(％)を対応付け、各小項目に数値を値づける。

【0050】

このように、第１前処理部２４は、第１推定モデル２６に入力可能なデータとなるように、患者データに対し、第１前処理を行う。

【0051】

第１推定部２５は、第１推定モデル２６を用いて、第１前処理後の推定対象の、病名が確定できない患者の患者データを基に、複数の希少疾患ごとに推定対象の患者の発症確率を推定する第１推定処理を行う。

【0052】

第１推定モデル２６は、複数の希少疾患ごとに発症確率を推定するモデルである。第１推定モデル２６は、第１前処理後の患者データが入力されると、複数の希少疾患と、この患者の各希少疾患の発症確率とを対応付けたデータを出力する。第１推定モデル２６のモデルパラメータは、複数のサーバ２０Ａ～２０Ｃに分散保管される。サーバ２０Ａ～２０Ｃの各第１推定部２５は、サーバ２０Ａ～２０Ｃ間でマルチパーティ計算を行うことで、暗号化かつ第１前処理が実行された患者データを基に、この患者の各希少疾患の発症確率を推定する。

【0053】

第１学習部２７は、第１前処理後の、希少疾患を発症した患者の検査データ及び診療データと、希少疾患以外の疾患を発症した患者の検査データ及び診療データとを学習データとし、患者の検査データ及び診療データと該患者の希少疾患の発症確率との関係を、第１推定モデル２６に学習させる。

【0054】

第１学習部２７は、第１前処理後の学習データである検査データ及び診療データ（希少疾患情報を除く）を第１推定モデル２６に入力し、第１推定モデル２６が推定した各希少疾患の発症確率が、実際に診断された希少疾患に近づくように、第１推定モデル２６のパラメータを更新する第１パラメータ更新処理を行う。第１学習部２７は、例えば、所定の終了条件を満たすまで、第１推定モデル２６の学習を実行する。なお、終了条件は、例えば、処理が一定回数だけ繰り返されたこと、パラメータの更新量が収束したこと等である。

【0055】

［依頼元端末］
次に、依頼元端末３０の構成について説明する。図１０は、図３に示す依頼元端末３０の構成の一例を模式的に示す図である。

【0056】

依頼元端末３０は、ＲＯＭ、ＲＡＭ、ＣＰＵ等を含むコンピュータ等に所定のプログラムが読み込まれて、ＣＰＵが所定のプログラムを実行することで実現される。また、依頼元端末３０は、ネットワーク等を介して接続された他の装置との間で、各種情報を送受信する通信インタフェースを有する。例えば、依頼元端末３０は、ＮＩＣ等を有し、ＬＡＮやインターネットなどの電気通信回線を介した他の装置との間の通信を行う。そして、依頼元端末３０は、タッチパネル、音声入力デバイス、キーボードやマウス等の入力デバイス、液晶ディスプレイなどの表示装置を有し、情報の入出力を行う。依頼元端末３０は、受付部３１、推定結果受信部３２及び推定結果出力部３３を有する。

【0057】

受付部３１は、依頼元端末３０の操作者（医師等）の操作にしたがって、希少疾患の推定対象の、病名が確定できない患者の検査データ及び診療データの入力を受け付ける。受付部３１は、希少疾患の推定対象の患者の検査データ及び診療データから、第１推定モデル２６の推定に必要な項目のデータを抽出し、抽出した患者データとともに、推定対象の患者の希少疾患の発症確率の推定要求をＤＣに送信する。

【0058】

推定結果受信部３２は、各サーバ２０Ａ～２０Ｃから暗号化されたままの推定結果を受信する。

【0059】

推定結果出力部３３は、受信した各計算結果を復元し、希少疾患の推定対象の、病名が確定できない患者の、複数の希少疾患ごとに発症確率を出力する。例えば、推定結果出力部３３は、複数の希少疾患を一覧表示するとともに、推定された発症確率が所定値以上の疾患については、「疑いあり」と表示する。

【0060】

［学習処理］
次に、実施の形態１に係る学習処理について説明する。図１１は、実施の形態１に係る学習処理の処理手順を示すシーケンス図である。

【0061】

図１１に示すように、登録者サーバ１０Ａ，１０Ｂは、希少疾患を発症した患者の検査データ及び診療データから、学習用の患者データを抽出し（ステップＳ１Ａ，Ｓ１Ｂ）、複数のシェアに分割し、分割したシェアをサーバ２０Ａ～２０Ｃにそれぞれ分散して登録させる（ステップＳ２Ａ，Ｓ２Ｂ，Ｓ３Ａ－１～Ｓ３Ａ－３，Ｓ３Ｂ－１～Ｓ３Ｂ－３，Ｓ４）。

【0062】

サーバ２０Ａ～２０Ｃは、学習用の患者データに対し、第１前処理を行った後に（ステップＳ５）、第１前処理後の学習用の患者データを基に、複数の希少疾患ごとに、この患者の発症確率を推定する第１推定処理を行う（ステップＳ６）。

【0063】

サーバ２０Ａ～２０Ｃは、第１推定モデル２６が推定した各希少疾患の発症確率が、実際に診断された希少疾患に近づくように、第１推定モデル２６のパラメータを更新する第１パラメータ更新処理を行う（ステップＳ７）。サーバ２０Ａ～２０Ｃは、所定の終了条件を満たすまで、ステップＳ５～ステップＳ７を繰り返し実行する。サーバ２０Ａ～２０Ｃは、秘密計算ＡＩ上で、ステップＳ４～ステップＳ７を実行する。

【0064】

［推定処理］
次に、実施の形態１に係る推定処理について説明する。図１２は、実施の形態１に係る推定処理の処理手順を示すシーケンス図である。

【0065】

図１２に示すように、依頼元端末３０は、希少疾患の推定対象の、病名が確定できない患者の検査データ及び診療データ（患者データ）の入力と、推定対象の患者の希少疾患の発症確率の推定要求を受け付ける（ステップＳ１１，Ｓ１２）。依頼元端末３０は、希少疾患の推定対象の患者の検査データ及び診療データから、第１推定モデル２６の推定に必要な項目のデータを抽出し、抽出した患者データとともに、希少疾患の発症確率の推定要求をＤＣのサーバ２０Ａ～２０Ｃに送信する（ステップＳ１３－１～Ｓ１３－３）。

【0066】

サーバ２０Ａ～２０Ｃは、推定対象の患者データに対し、第１前処理を行った後に（ステップＳ１４）、第１前処理後の推定対象の患者データを基に、複数の希少疾患ごとに、この患者の発症確率を推定する第１推定処理を行う（ステップＳ１５）。サーバ２０Ａ～２０Ｃは、秘密計算ＡＩ上で、ステップＳ１４，Ｓ１５を実行する。サーバ２０Ａ～２０Ｃは、推定対象の患者の希少疾患の発症確率の推定結果を依頼元端末３０に送信する（ステップＳ１６－１～Ｓ１６－３）。

【0067】

依頼元端末３０は、推定結果を受信し（ステップＳ１７）、受信した推定結果を復号化した後に、推定対象の患者の希少疾患の発症確率の推定結果を表示する（ステップＳ１８）。依頼元端末３０は、複数の各希少疾患のうち、推定された発症確率が所定値以上の疾患を「疑いあり」と表示する。

【0068】

［実施の形態１の効果］
このように、実施の形態１では、サーバ２０Ａ～２０Ｃが、複数の希少疾患ごとに発症確率を推定する第１推定モデル２６を作成及び利用することで、症例数が少ない希少疾患の診断を支援することができ、希少疾患の早期診断・早期治療の促進を実現する。

【0069】

また、サーバ２０Ａ～２０Ｃは、秘密計算ＡＩ上で、暗号化されたまま、患者データを学習する。このため、実施の形態１によれば、個人情報を含む患者データを安全に取り扱うことができ、症例数が少ない希少疾患であっても、複数の医療機関から患者データを収集することを可能とする。したがって、実施の形態１によれば、第１推定モデル２６の学習に必要な量の患者データを収集することができ、第１推定モデル２６の適切な学習が可能になる。

【0070】

また、実施の形態１では、秘密計算ＡＩ上で、暗号化されたまま、推定対象の、病名が確定できない患者の希少疾患の発症確率を推定する。このため、実施の形態１によれば、個人情報を含む患者データを安全に取り扱いながら、症例数が少ない希少疾患の発症確率を推定することができる。また、実施の形態１では、依頼元端末３０が、発症の可能性がある希少疾患を複数表示することで、広い視野で診断を行うよう医師を支援することができる。

【0071】

［実施の形態２］
次に、実施の形態２について説明する。実施の形態２では検査データ及び診療データの項目のうち、最も粒度が細かい項目のカテゴリ変数部を、カテゴリ変数に対応するデータの意味に従ってラベル付けし、同一ラベルで圧縮する第２前処理を行うことで、学習（例えば、機械学習）の効率化を図る。

【0072】

実施の形態２に係る処理システムは、実施の形態１に係るサーバ２０に代えて、サーバ２２０を有する。なお、実施の形態２においても、ＤＣは複数のサーバ２２０（後述の２２０Ａ～２２０Ｃ）を有し、複数のサーバ２２０は、各種データを、シェアに断片化した状態で分散して保管するとともに、複数のサーバ２２０間でマルチパーティ計算を行うことで、以降に説明する各種処理を実行する。

【0073】

［サーバ］
次に、サーバ２２０の構成について説明する。図１３は、実施の形態２に係るサーバ２２０の構成の一例を模式的に示す図である。サーバ２２０は、図６に示すサーバ２０の推定部２３及び第１学習部２７に代えて、推定部２２３及び第２学習部２２７を有する。

【0074】

推定部２２３は、第２前処理部２２４と、第２推定モデル２２６（例えば、機械学習モデル）を有する第２推定部２２５を有する。

【0075】

第２前処理部２２４は、患者の検査データ及び診療データ（患者データ）に対し、第２前処理を行う。第２前処理部２２４は、第２前処理として、患者データに対し、患者背景、病歴、診察所見、または、検査所見に関する項目を粒度に応じて段階的に設定し、各項目のデータをそれぞれ対応するカテゴリ変数に変換する。そして、第２前処理部２２４は、第２前処理として、最も粒度が細かい項目のカテゴリ変数部を、カテゴリ変数に対応するデータの意味に従ってラベル付けし、同一ラベルで圧縮する。

【0076】

図１４及び図１５は、図１３に示す第２前処理部２２４の処理を説明する図である。第２前処理部２２４は、図１４に示すように、例えば、診察所見の小項目である「失行」のカテゴリ変数部（枠Ｗ２）を、カテゴリ変数に対応するデータの意味に従って圧縮する。

【0077】

図１５に示すように、第２前処理部２２４は、小項目「失行」の、「なし」、「口舌顔面失行」、「肢節運動失行」、「観念失行」、「観念運動失行」、「その他」、「不明」に対応するカテゴリ変数を、カテゴリ変数に対応するデータの意味でさらにラベル付けする（図１５の（１））。

【0078】

具体的には、第２前処理部２２４は、カテゴリ変数のうち、「なし」に対応するカテゴリ変数に「正常」ラベルを付与する。第２前処理部２２４は、「口舌顔面失行」、「肢節運動失行」、「観念失行」及び「観念運動失行」に対応するカテゴリ変数に「異常」ラベルを付与する。第２前処理部２２４は、「その他」に対応するカテゴリ変数に「異常（仮）」ラベルを付与し、「不明」に対応するカテゴリ変数に「所見なし」ラベルを付与する。

【0079】

そして、第２前処理部２２４は、同一ラベルを圧縮する（図１５の（２））。例えば、図１５の例では、小項目「失行」の各カテゴリ変数に付与されたラベルが「正常」、「異常」、「所見なし」の３種であるため、第２前処理部２２４は、小項目「失行」については、カテゴリ変数を、「正常」、「異常」、「所見なし」に圧縮する。第２前処理によって、カテゴリ変数の種類分、情報量（次元数）が減るため、第２推定モデル２２６（後述）の学習時間の改善及び学習に必要なデータ量の低減を図ることができる。

【0080】

第２推定部２２５は、第２推定モデル２２６を用いて、第２前処理後の推定対象の、病名が確定できない患者の患者データを基に、複数の希少疾患ごとに推定対象の患者の発症確率を推定する第２推定処理を行う。

【0081】

第２推定モデル２２６は、複数の希少疾患ごとに発症確率を推定するモデルである。第２推定モデル２２６は、第２前処理後の患者データが入力されると、複数の希少疾患と、この患者の各希少疾患の発症確率とを対応付けたデータを出力する。第２推定モデル２２６のモデルパラメータは、複数のサーバ２２０に分散保管される。サーバ２２０の各第２推定部２２５は、サーバ２２０間でマルチパーティ計算を行うことで、暗号化かつ第２前処理が実行された患者データを基に、この患者の各希少疾患の発症確率を推定する。

【0082】

第２学習部２２７は、第２前処理後の、希少疾患を発症した患者の検査データ及び診療データと、希少疾患以外の疾患を発症した患者の検査データ及び診療データとを学習データとし、患者の検査データ及び診療データと該患者の希少疾患の発症確率との関係を、第２推定モデル２２６に学習させる。

【0083】

第２学習部２２７は、第２前処理後の学習データである検査データ及び診療データ（希少疾患情報を除く）を第２推定モデル２２６に入力し、第２推定モデル２２６が推定した各希少疾患の発症確率が、実際に診断された希少疾患に近づくように、第２推定モデル２２６のパラメータを更新する第２パラメータ更新処理を行う。

【0084】

［学習処理］
次に、実施の形態２に係る学習処理について説明する。図１６は、実施の形態２に係る学習処理の処理手順を示すシーケンス図である。

【0085】

図１６に示すステップＳ２１Ａ～ステップＳ２４は、図１１に示すステップＳ１Ａ～ステップＳ４と同じ処理である。

【0086】

サーバ２２０Ａ～２２０Ｃは、学習用の患者データに対し、第２前処理を行った後に（ステップＳ２５）、第２前処理後の学習用の患者データを基に、複数の希少疾患ごとに、この患者の発症確率を推定する第２推定処理を行う（ステップＳ２６）。

【0087】

サーバ２２０Ａ～２２０Ｃは、第２推定モデル２２６が推定した各希少疾患の発症確率が、実際に診断された希少疾患に近づくように、第２推定モデル２２６のパラメータを更新する第２パラメータ更新処理を行う（ステップＳ２７）。サーバ２２０Ａ～２２０Ｃは、所定の終了条件を満たすまで、ステップＳ２５～ステップＳ２７を繰り返し実行する。サーバ２２０Ａ～２２０Ｃは、秘密計算ＡＩ上で、ステップＳ２４～ステップＳ２７を実行する。

【0088】

［推定処理］
次に、実施の形態２に係る推定処理について説明する。図１７は、実施の形態２に係る推定処理の処理手順を示すシーケンス図である。

【0089】

図１７に示すステップＳ３１～ステップＳ３３－３は、図１２に示すステップＳ１１～ステップＳ１３－３と同じ処理である。

【0090】

サーバ２２０Ａ～２２０Ｃは、推定対象の、病名が確定できない患者データに対し、第２前処理を行った後に（ステップＳ３４）、第２前処理後の推定対象の患者データを基に、複数の希少疾患ごとに、この患者の発症確率を推定する第２推定処理を行う（ステップＳ３５）。サーバ２２０Ａ～２２０Ｃは、秘密計算ＡＩ上で、ステップＳ３４，Ｓ３５を実行する。サーバ２２０Ａ～２２０Ｃは、推定対象の患者の希少疾患の発症確率の推定結果を依頼元端末３０に送信する（ステップＳ３６－１～Ｓ３６－３）。図１７に示すステップＳ３７，Ｓ３８は、図１２に示すステップＳ１７，Ｓ１８と同じ処理である。

【0091】

［実施の形態２の効果］
実施の形態２では、実施の形態１と同様の効果を奏するとともに、第２前処理によって
患者データの小項目のカテゴリ変数の種類分、情報量（次元数）が減るため第２推定モデル２２６（後述）の学習時間の改善及び学習に必要なデータ量の低減を図ることができる。

【0092】

そして、実施の形態２では、実施の形態１と同様に、発症の可能性がある希少疾患を複数表示することによって、医師が、候補となる複数の希少疾患から、検査等を基に疾患を絞り込むことができるよう支援している。言い換えると、実施の形態２は、患者が希少疾患である可能性の気づきを医師に与えることを目的とする。

【0093】

このため、候補となる希少疾患を複数提示し、その中に正解疾患が含まれていれば、上記の目的を果たすことができるといえる。すなわち、上記の目的を果たすため、ある一つの正解疾患をピンポイントで推定することよりも、正解の希少疾患が候補から漏れないことを重要視すべきであるといえる。したがって、実施の形態２では、同じ小項目で別の異常がみられる疾患を区別できなくなる第２前処理を行ったとしても、複数の希少疾患について発症確率を推定することで、正解の希少疾患が候補から漏れることを低減し、医師の診断を支援することができる。

【0094】

［実施の形態３］
次に、実施の形態３について説明する。実施の形態３では検査データ及び診療データの項目のうち、最も粒度が細かい第１項目のカテゴリ変数部を、カテゴリ変数に対応するデータの意味に従ってラベル付けし、同一ラベルで圧縮するとともに、第１項目よりも粒度が粗い第２項目のカテゴリ変数部を圧縮する第３前処理を行うことで、さらに学習（例えば、機械学習）の効率化を図る。

【0095】

実施の形態３に係る処理システムは、実施の形態２に係るサーバ２２０に代えて、サーバ３２０を有する。なお、実施の形態３においても、ＤＣは複数のサーバ３２０（後述の３２０Ａ～３２０Ｃ）を有し、複数のサーバ３２０は、各種データを、シェアに断片化した状態で分散して保管するとともに、複数のサーバ３２０間でマルチパーティ計算を行うことで、以降に説明する各種処理を実行する。

【0096】

［サーバ］
次に、サーバ３２０の構成について説明する。図１８は、実施の形態３に係るサーバ３２０の構成の一例を模式的に示す図である。サーバ３２０は、図１３に示すサーバ２２０の推定部２２３及び第２学習部２２７に代えて、推定部３２３及び第３学習部３２７を有する。

【0097】

推定部３２３は、第３前処理部３２４と、第３推定モデル３２６（例えば、機械学習モデル）を有する第３推定部３２５を有する。

【0098】

第３前処理部３２４は、患者の検査データ及び診療データ（患者データ）に対し、所定の前処理を行う。第３前処理部３２４は、第３前処理を行う。

【0099】

第３前処理部３２４は、第３前処理として、患者データに対し、患者背景、病歴、診察所見、または、検査所見に関する項目を粒度に応じて段階的に設定し、各項目のデータをそれぞれ対応するカテゴリ変数に変換する。そして、第３前処理部３２４は、第３前処理として、最も粒度が細かい第１項目のカテゴリ変数部を、カテゴリ変数に対応するデータの意味に従ってラベル付けし、同一ラベルで圧縮する。これとともに、第３前処理部３２４は、第３前処理として、第１項目よりも粒度が粗い第２項目を、第２項目に属する第１項目の圧縮された各ラベルのカウント数で表現する第３前処理を行う。

【0100】

図１９及び図２０は、図１８に示す第３前処理部３２４の処理を説明する図である。第３前処理部３２４は、前述の図１４及び図１５に示すように、最も粒度が細かい小項目のカテゴリ変数部を、カテゴリ変数に対応するデータの意味に従ってラベル付けし、同一ラベルで圧縮する。

【0101】

そして、第３前処理部３２４は、図１９に示すように、例えば、小項目よりも粒度が粗い中項目単位でさらに情報圧縮を行う。例えば、第３前処理部３２４は、大項目「診察所見」の中項目「高次機能」、「脳神経系」、「運動系」（枠Ｗ３）の情報を圧縮する。

【0102】

具体的に、「診察所見」の中項目「高次機能」を例に説明する。例えば、図２０に示すように、第３前処理部３２４は、中項目「高次機能」に属する全小項目の圧縮された各ラベルをカウントする（図２０の（１））。この場合、中項目「高次機能」に属する全小項目は、「正常」、「異常」、「所見なし」の３種のラベルに圧縮されている。

【0103】

第３前処理部３２４は、中項目「高次機能」に属する全小項目の圧縮された各ラベル「正常」、「異常」、「所見なし」をカウントする。この結果、中項目「高次機能」（例えば、１４次元）には、「正常」ラベルが５、「異常」ラベルが６、「所見なし」ラベルが３カウントされる。

【0104】

そして、第３前処理部３２４は、中項目「高次機能」を、中項目「高次機能」に属する全小項目の圧縮された各ラベル「正常」、「異常」、「所見なし」のカウント数「５，６，３」で表現する（図２０の（２））。第３前処理によって、１４次元で表現されていた中項目「高次機能」を３次元ベクトルで表現できるため、情報量（次元数）が減り、第３推定モデル３２６（後述）の学習時間の改善及び学習に必要なデータ量の低減を図ることができる。また、この場合、中項目がすべて不明等のデータであっても入力がsparseとならない。

【0105】

第３推定部３２５は、第３推定モデル３２６を用いて、第３前処理後の推定対象の、病名が確定できない患者の患者データを基に、複数の希少疾患ごとに推定対象の患者の発症確率を推定する第３推定処理を行う。

【0106】

第３推定モデル３２６は、複数の希少疾患ごとに発症確率を推定するモデルである。第３推定モデル３２６は、第３前処理後の患者データが入力されると、複数の希少疾患と、この患者の各希少疾患の発症確率とを対応付けたデータを出力する。第３推定モデル３２６のモデルパラメータは、複数のサーバ３２０に分散保管される。サーバ３２０の各第３推定部３２５は、サーバ３２０間でマルチパーティ計算を行うことで、暗号化かつ第３前処理が実行された患者データを基に、この患者の各希少疾患の発症確率を推定する。

【0107】

第３学習部３２７は、第３前処理後の、希少疾患を発症した患者の検査データ及び診療データと、希少疾患以外の疾患を発症した患者の検査データ及び診療データとを学習データとし、患者の検査データ及び診療データと該患者の希少疾患の発症確率との関係を、第３推定モデル３２６に学習させる。

【0108】

第３学習部３２７は、第３前処理後の学習データである検査データ及び診療データ（希少疾患情報を除く）を第３推定モデル３２６に入力し、第３推定モデル３２６が推定した各希少疾患の発症確率が、実際に診断された希少疾患に近づくように、第３推定モデル３２６のパラメータを更新する第３パラメータ更新処理を行う。

【0109】

［学習処理］
次に、実施の形態３に係る学習処理について説明する。図２１は、実施の形態３に係る学習処理の処理手順を示すシーケンス図である。

【0110】

図２１に示すステップＳ４１Ａ～ステップＳ４４は、図１１に示すステップＳ１Ａ～ステップＳ４と同じ処理である。

【0111】

サーバ３２０Ａ～３２０Ｃは、学習用の患者データに対し、第３前処理を行った後に（ステップＳ４５）、第３前処理後の学習用の患者データを基に、複数の希少疾患ごとに、この患者の発症確率を推定する第３推定処理を行う（ステップＳ４６）。

【0112】

サーバ３２０Ａ～３２０Ｃは、第３推定モデル３２６が推定した各希少疾患の発症確率が、実際に診断された希少疾患に近づくように、第３推定モデル３２６のパラメータを更新する第３パラメータ更新処理を行う（ステップＳ４７）。サーバ３２０Ａ～３２０Ｃは、所定の終了条件を満たすまで、ステップＳ４５～ステップＳ４７を繰り返し実行する。サーバ３２０Ａ～３２０Ｃは、秘密計算ＡＩ上で、ステップＳ４４～ステップＳ４７を実行する。

【0113】

［推定処理］
次に、実施の形態３に係る推定処理について説明する。図２２は、実施の形態３に係る推定処理の処理手順を示すシーケンス図である。

【0114】

図２２に示すステップＳ５１～ステップＳ５３－３は、図１２に示すステップＳ１１～ステップＳ１３－３と同じ処理である。

【0115】

サーバ３２０Ａ～３２０Ｃは、推定対象の患者データに対し、第３前処理を行った後に（ステップＳ５４）、第３前処理後の推定対象の患者データを基に、複数の希少疾患ごとに、この患者の発症確率を推定する第３推定処理を行う（ステップＳ５５）。サーバ３２０Ａ～３２０Ｃは、秘密計算ＡＩ上で、ステップＳ５４，Ｓ５５を実行する。サーバ３２０Ａ～３２０Ｃは、推定対象の、病名が確定できない患者の希少疾患の発症確率の推定結果を依頼元端末３０に送信する（ステップＳ５６－１～Ｓ５６－３）。図２２に示すステップＳ５７，Ｓ５８は、図１２に示すステップＳ１７，Ｓ１８と同じ処理である。

【0116】

［実施の形態３の効果］
実施の形態３では、第３前処理によって、中項目の次元をさらに低次元化できるため、第３推定モデル３２６の学習時間の改善及び学習に必要なデータ量の低減を図ることができ、中項目がすべて不明等のデータであっても入力がsparseとならないため、第３推定モデル３２６の学習を適切に実行できる。

【0117】

［実施の形態４］
次に、実施の形態４について説明する。実施の形態４に係るＤＣのサーバは、実施の形態１～３の各推定部及び各学習部を有し、各推定モデルの推定精度を評価し、評価を基に、いずれの推定モデルの推定結果を採用するかを設定する。また、ＤＣのサーバは、各推定モデルの推定精度の評価結果を基に、いずれの推定モデルを重点的に学習させるかを設定してもよい。

【0118】

実施の形態４に係る処理システムは、実施の形態１に係るサーバ２０に代えて、サーバ４２０を有する。なお、実施の形態４においても、ＤＣは複数のサーバ４２０（後述の４２０Ａ～４２０Ｃ）を有し、複数のサーバ４２０は、各種データを、シェアに断片化した状態で分散して保管するとともに、複数のサーバ４２０間でマルチパーティ計算を行うことで、以降に説明する各種処理を実行する。

【0119】

［サーバ］
次に、サーバ４２０の構成について説明する。図２３は、実施の形態４に係るサーバ４２０の構成の一例を模式的に示す図である。サーバ４２０は、図３に示す２０と比して、図１３に示すサーバ２２０の推定部２２３及び第２学習部２２７と、図１８に示す推定部３２３及び第３学習部３２７と、評価部４２８と、設定部４２９とを有する。

【0120】

評価部４２８は、推定フェーズにおいて、第１推定部２５による推定結果、第２推定部２２５による推定結果、第３推定部３２５による推定結果を基に、第１推定部２５、第２推定部２２５、及び、第３推定部３２５の推定精度を評価する。例えば、評価部４２８は、任意の患者データに対する第１推定部２５、第２推定部２２５、及び、第３推定部３２５の推定確率と、該任意の患者が発症した希少疾患とを比較することで、各推定部の推定精度を評価する。

【0121】

設定部４２９は、評価部４２８による評価結果を基に第１推定部２５、第２推定部２２５、及び、第３推定部３２５のいずれの推定結果を採用するかを設定する。

【0122】

推定精度が、第２推定部２２５が最も高く、第３推定部３２５、第１推定部２５の順に低くなる場合を例に説明する。この場合、例えば、設定部４２９は、最も精度が高い第２推定部２２５の推定結果のみを採用して、依頼元端末３０に送信する。或いは、設定部４２９は、推定部２２３のみに前処理及び推定処理を実行させてもよい。また、設定部４２９は、推定精度の高さに応じた重みを各推定部に設定し、第１推定部２５、第２推定部２２５、及び、第３推定部３２５の推定結果の重みづけ和を依頼元端末３０に送信する。

【0123】

また、設定部４２９は、学習処理の設定を行ってもよい。例えば、設定部４２９は、サーバ４２０のリソース等によって全ての推定モデルの学習が難しい場合には、最も精度が高い第２推定部２２５の第２推定モデル２２６に対する学習を優先して、第２学習部２２７に学習を実行させてもよい。

【0124】

［学習処理］
次に、実施の形態４に係る学習処理について説明する。図２４は、実施の形態４に係る学習処理の処理手順を示すシーケンス図である。

【0125】

図２４に示すステップＳ６１Ａ～ステップＳ６４は、図１１に示すステップＳ１Ａ～ステップＳ４と同じ処理である。サーバ４２０Ａ～４２０Ｃは、学習用の患者データを基に前処理及び学習処理を実行する（ステップＳ６５）。

【0126】

［前処理及び学習処理の処理手順］
次に、図２４に示す前処理及び学習処理（ステップＳ６５）について説明する。図２５は、図２４に示す前処理及び学習処理の処理手順を示すシーケンス図である。

【0127】

サーバ４２０Ａ～４２０Ｃの各推定部２３及び各第１学習部２７は、図１１に示すステップＳ５～ステップＳ７と同じ処理を行うことで、第１前処理（ステップＳ７１）、第１推定処理（ステップＳ７２）及び第１パラメータ更新処理（ステップＳ７３）を行う。

【0128】

サーバ４２０Ａ～４２０Ｃの各推定部２２３及び各第２学習部２２７は、図１６に示すステップＳ２５～ステップＳ２７と同じ処理を行うことで、第２前処理（ステップＳ７４）、第２推定処理（ステップＳ７５）及び第２パラメータ更新処理（ステップＳ７６）を行う。

【0129】

サーバ４２０Ａ～４２０Ｃの各推定部３２３及び各第３学習部３２７は、図２１に示すステップＳ４５～ステップＳ４７と同じ処理を行うことで、第３前処理（ステップＳ７７）、第３推定処理（ステップＳ７８）及び第３パラメータ更新処理（ステップＳ７９）を行う。

【0130】

ステップＳ７１～ステップＳ７３、ステップＳ７４～ステップＳ７６及びステップＳ７７～ステップＳ７９は、並列処理でなくともよい。また、設定部４２９の設定に従って、ステップＳ７１～ステップＳ７３、ステップＳ７４～ステップＳ７６、及び、ステップＳ７７～ステップＳ７９のいずれかの実行であってもよい。

【0131】

［推定処理］
次に、実施の形態４に係る推定処理について説明する。図２６は、実施の形態４に係る推定処理の処理手順を示すシーケンス図である。

【0132】

サーバ４２０Ａ～４２０Ｃは、第１推定部２５による推定結果、第２推定部２２５による推定結果、第３推定部３２５による推定結果を基に、第１推定部２５、第２推定部２２５、及び、第３推定部３２５の推定精度を評価する評価処理を行う（ステップＳ８１）。

【0133】

設定部４２９は、評価部４２８による評価結果を基に第１推定部２５、第２推定部２２５、及び、第３推定部３２５のいずれの推定結果を採用するかを設定する設定処理を行う（ステップＳ８２）。ステップＳ８１，Ｓ８２は、例えば、定期的に実行される。或いは、ステップＳ８１，Ｓ８２は、データ蓄積量が所定量を超えた場合、推定回数が所定回数を超えた場合、採用されている推定モデルの推定精度が目的の精度を下回った場合等、所定のタイミングで実行される。

【0134】

図２６に示すステップＳ８３～ステップＳ８５－３は、図１２に示すステップＳ１１～ステップＳ１３－３と同じ処理である。

【0135】

サーバ４２０Ａ～４２０Ｃは、推定部２３，２２３，３２３にそれぞれ前処理（ステップＳ８６）及び推定処理（ステップＳ８７）を実行させ、設定処理において採用を設定された推定部の推定結果を採用して、依頼元端末３０に送信する（ステップＳ８８－１～ステップＳ８８－３）。なお、サーバ４２０Ａ～４２０Ｃは、設定処理において採用を設定された推定部２３，２２３，３２３のみに前処理及び推定処理を実行させてもよいし、第１推定部２５、第２推定部２２５、及び、第３推定部３２５の推定結果の重みづけ和を依頼元端末３０に送信してもよい。

【0136】

図２６に示すステップＳ８９，Ｓ９０は、図１２に示すステップＳ１７，Ｓ１８と同じ処理である。

【0137】

［実施の形態４の効果］
このように、実施の形態４に係るサーバ４２０Ａ～４２０Ｃは、実施の形態１～３の各推定部及び各学習部を有するとともに、各推定モデルの推定精度を評価し、評価を基に、いずれの推定モデルの推定結果を採用するかを設定するため、依頼元端末３０に発症推定結果を、安定した精度で提供することができる。また、サーバ４２０Ａ～４２０Ｃは、各推定モデルの推定精度の評価結果を基に、いずれの推定モデルを重点的に学習させるかを設定するため、効率的に、推定モデルを学習或いは再学習することができる。

【0138】

なお、実施の形態１～４では、学習処理及び推定処理を秘密計算ＡＩ上で実行した場合について説明したが、これに限らない。図２７は、実施の形態１に係る処理システムの構成の他の例を示すブロック図である。

【0139】

図２７の処理システム５００に示すように、サーバ２０Ａ，２０Ｂ，２０Ｃの間で分散保管されていたデータを、サーバ５２０のみで保管してもよい。また、サーバ２０Ａ，２０Ｂ，２０Ｃがマルチパーティ計算を行うことで行っていた学習処理及び推定処理を、サーバ５２０のみで実行してもよい。すなわち、実施の形態１～４に係る学習処理及び推定処理を、暗号化せずに実行してもよい。

【0140】

［システム構成等］
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、ＣＰＵやＧＰＵ及び当該ＣＰＵやＧＰＵにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。

【0141】

また、本実施形態において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。

【0142】

［プログラム］
また、上記実施形態において説明した登録者サーバ１０Ａ，１０Ｂ、サーバ２０，２２０，３２０，４２０，５２０及び依頼元端末３０が実行する処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。例えば、実施形態における登録者サーバ１０Ａ，１０Ｂ、サーバ２０，２２０，３２０，４２０，５２０及び依頼元端末３０が実行する処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。この場合、コンピュータがプログラムを実行することにより、上記実施形態と同様の効果を得ることができる。さらに、かかるプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータに読み込ませて実行することにより上記実施形態と同様の処理を実現してもよい。

【0143】

図２８は、プログラムを実行するコンピュータを示す図である。図２８に例示するように、コンピュータ１０００は、例えば、メモリ１０１０と、ＣＰＵ１０２０と、ハードディスクドライブインタフェース１０３０と、ディスクドライブインタフェース１０４０と、シリアルポートインタフェース１０５０と、ビデオアダプタ１０６０と、ネットワークインタフェース１０７０とを有し、これらの各部はバス１０８０によって接続される。

【0144】

メモリ１０１０は、図２８に例示するように、ＲＯＭ（Read Only Memory）１０１１及びＲＡＭ１０１２を含む。ＲＯＭ１０１１は、例えば、ＢＩＯＳ（Basic Input Output System）等のブートプログラムを記憶する。ハードディスクドライブインタフェース１０３０は、図２８に例示するように、ハードディスクドライブ１０９０に接続される。ディスクドライブインタフェース１０４０は、ディスクドライブ１１００に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ１１００に挿入される。シリアルポートインタフェース１０５０は、例えばマウス１１１０、キーボード１１２０に接続される。ビデオアダプタ１０６０は、例えばディスプレイ１１３０に接続される。

【0145】

ここで、図２８に例示するように、ハードディスクドライブ１０９０は、例えば、ＯＳ１０９１、アプリケーションプログラム１０９２、プログラムモジュール１０９３、プログラムデータ１０９４を記憶する。すなわち、上記の、プログラムは、コンピュータ１０００によって実行される指令が記述されたプログラムモジュールとして、例えばハードディスクドライブ１０９０に記憶される。

【0146】

また、上記実施形態で説明した各種データは、プログラムデータとして、例えばメモリ１０１０やハードディスクドライブ１０９０に記憶される。そして、ＣＰＵ１０２０が、メモリ１０１０やハードディスクドライブ１０９０に記憶されたプログラムモジュール１０９３やプログラムデータ１０９４を必要に応じてＲＡＭ１０１２に読み出し、各種処理手順を実行する。

【0147】

なお、プログラムに係るプログラムモジュール１０９３やプログラムデータ１０９４は、ハードディスクドライブ１０９０に記憶される場合に限られず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ等を介してＣＰＵ１０２０によって読み出されてもよい。あるいは、プログラムに係るプログラムモジュール１０９３やプログラムデータ１０９４は、ネットワーク（ＬＡＮ（Local Area Network）、ＷＡＮ（Wide Area Network）等）を介して接続された他のコンピュータに記憶され、ネットワークインタフェース１０７０を介してＣＰＵ１０２０によって読み出されてもよい。

【0148】

上記の実施形態やその変形は、本願が開示する技術に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。

【符号の説明】

【0149】

１０Ａ，１０Ｂ登録者サーバ
１１データ抽出部
１２登録部
２０，２０Ａ～２０Ｃ，２２０，２２０Ａ～２２０Ｃ，３２０，３２０Ａ～３２０Ｃ，４２０，４２０Ａ～４２０Ｃ，５２０サーバ
２１シェアＤＢ
２２登録部
２３，２２３，３２３推定部
２４第１前処理部
２５第１推定部
２６第１推定モデル
２７第１学習部
３０依頼元端末
３１受付部
３２推定結果受信部
３３推定結果出力部
１００，５００処理システム
２２４第２前処理部
２２５第２推定部
２２６第２推定モデル
２２７第２学習部
３２４第３前処理部
３２５第３推定部
３２６第３推定モデル
３２７第３学習部
４２８評価部
４２９設定部

【図1】