IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ NECソリューションイノベータ株式会社の特許一覧

特開2024-139976胃がん判定装置、学習済みモデルの製造方法、学習済みモデル、胃がん判定方法、プログラム及び記録媒体
<>
  • 特開-胃がん判定装置、学習済みモデルの製造方法、学習済みモデル、胃がん判定方法、プログラム及び記録媒体 図1
  • 特開-胃がん判定装置、学習済みモデルの製造方法、学習済みモデル、胃がん判定方法、プログラム及び記録媒体 図2
  • 特開-胃がん判定装置、学習済みモデルの製造方法、学習済みモデル、胃がん判定方法、プログラム及び記録媒体 図3
  • 特開-胃がん判定装置、学習済みモデルの製造方法、学習済みモデル、胃がん判定方法、プログラム及び記録媒体 図4
  • 特開-胃がん判定装置、学習済みモデルの製造方法、学習済みモデル、胃がん判定方法、プログラム及び記録媒体 図5
  • 特開-胃がん判定装置、学習済みモデルの製造方法、学習済みモデル、胃がん判定方法、プログラム及び記録媒体 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024139976
(43)【公開日】2024-10-10
(54)【発明の名称】胃がん判定装置、学習済みモデルの製造方法、学習済みモデル、胃がん判定方法、プログラム及び記録媒体
(51)【国際特許分類】
   G01N 33/68 20060101AFI20241003BHJP
   G16H 50/00 20180101ALI20241003BHJP
   G01N 33/48 20060101ALI20241003BHJP
【FI】
G01N33/68
G16H50/00
G01N33/48 Z
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2023050945
(22)【出願日】2023-03-28
(71)【出願人】
【識別番号】000232092
【氏名又は名称】NECソリューションイノベータ株式会社
(74)【代理人】
【識別番号】100115255
【弁理士】
【氏名又は名称】辻丸 光一郎
(74)【代理人】
【識別番号】100201732
【弁理士】
【氏名又は名称】松縄 正登
(74)【代理人】
【識別番号】100154081
【弁理士】
【氏名又は名称】伊佐治 創
(74)【代理人】
【識別番号】100227019
【弁理士】
【氏名又は名称】安 修央
(72)【発明者】
【氏名】金子 直人
(72)【発明者】
【氏名】加藤 信太郎
【テーマコード(参考)】
2G045
5L099
【Fターム(参考)】
2G045AA26
2G045DA36
2G045JA01
5L099AA04
(57)【要約】
【課題】 本発明は、簡易に実施可能な検査を利用した胃がん判定装置、胃がん判定装置の学習済みモデルの製造方法及び学習済みモデルの提供を目的とする。
【解決手段】 本発明の胃がん判定装置10は、情報取得部11、胃がん判定部12、及び、情報出力部13を含み、前記情報取得部11は、判定対象者における生体情報を取得し、前記生体情報は、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含み、前記胃がん判定部12は、前記生体情報に基づき、前記判定対象者に胃がんがあるか否かを判定して胃がん判定情報を生成し、前記情報出力部13は、前記胃がん判定情報を出力する。
【選択図】 図1

【特許請求の範囲】
【請求項1】
情報取得部、胃がん判定部、及び、情報出力部を含み、
前記情報取得部は、判定対象者における生体情報を取得し、
前記生体情報は、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含み、
前記胃がん判定部は、前記生体情報に基づき、前記判定対象者に胃がんがあるか否かを判定して胃がん判定情報を生成し、
前記情報出力部は、前記胃がん判定情報を出力する、
胃がん判定装置。
【請求項2】
前記胃がん判定部は、学習済みモデルを含み、
前記学習済みモデルは、機械学習装置に学習データセットを入力して生成された学習済みモデルであり、
前記学習データセットは、前記推算糸球体濾過量(eGFR)、前記体格指数(BMI)、並びに、前記ペプシノーゲン1(PG1)及び前記ペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含む説明変数データ、並びに、胃がん罹患歴を含む目的変数データを含む、
請求項1記載の胃がん判定装置。
【請求項3】
機械学習装置に学習データセットを入力して学習済みモデルを生成する機械学習工程を含み、
前記学習データセットは、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含む説明変数データ、並びに、胃がん罹患歴を含む目的変数データを含む、
胃がん判定装置用の学習済みモデルの製造方法。
【請求項4】
機械学習装置に学習データセットを入力して学習済みモデルを生成する機械学習工程を含み、
機械学習装置に、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含む説明変数データ、並びに、胃がん罹患歴を含む目的変数データを含む学習データセットを入力して生成された、
胃がん判定装置用の学習済みモデル。
【請求項5】
情報取得工程、胃がん判定工程、及び、情報出力工程を含み、
前記情報取得工程は、判定対象者における生体情報を取得し、
前記生体情報は、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含み、
前記胃がん判定工程は、前記生体情報に基づき、前記判定対象者に胃がんがあるか否かを判定して胃がん判定情報を生成し、
前記情報出力工程は、前記胃がん判定情報を出力し、
前記各工程が、コンピュータにより実行される、
胃がん判定方法。
【請求項6】
前記胃がん判定工程は、学習済みモデルを用いて実施され、
前記学習済みモデルは、機械学習装置に学習データセットを入力して生成された学習済みモデルであり、
前記学習データセットは、前記推算糸球体濾過量(eGFR)、前記体格指数(BMI)、並びに、前記ペプシノーゲン1(PG1)及び前記ペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含む説明変数データ、並びに、胃がん罹患歴を含む目的変数データを含み、
前記各工程が、コンピュータにより実行される、
請求項5記載の胃がん判定方法。
【請求項7】
情報取得手順、胃がん判定手順、及び、情報出力手順を含み、
前記情報取得手順は、判定対象者における生体情報を取得し、
前記生体情報は、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含み、
前記胃がん判定手順は、前記生体情報に基づき、前記判定対象者に胃がんがあるか否かを判定して胃がん判定情報を生成し、
前記情報出力手順は、前記胃がん判定情報を出力し、
前記各手順を、コンピュータに実行させるためのプログラム。
【請求項8】
機械学習手順を含み、
前記機械学習手順は、機械学習装置に学習データセットを入力して学習済みモデルを生成し、
前記学習データセットは、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含む説明変数データ、並びに、胃がん罹患歴を含む目的変数データを含み、
前記各手順を、コンピュータに実行させるためのプログラム。
【請求項9】
情報取得手順、胃がん判定手順、及び、情報出力手順を含み、
前記情報取得手順は、判定対象者における生体情報を取得し、
前記生体情報は、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含み、
前記胃がん判定手順は、前記生体情報に基づき、前記判定対象者に胃がんがあるか否かを判定して胃がん判定情報を生成し、
前記情報出力手順は、前記胃がん判定情報を出力し、
前記各手順を、コンピュータに実行させるためのプログラムを記録しているコンピュータ読み取り可能な記録媒体。
【請求項10】
機械学習手順を含み、
前記機械学習手順は、機械学習装置に学習データセットを入力して学習済みモデルを生成し、
前記学習データセットは、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含む説明変数データ、並びに、胃がん罹患歴を含む目的変数データを含み、
前記各手順を、コンピュータに実行させるためのプログラムを記録しているコンピュータ読み取り可能な記録媒体。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、胃がん判定装置、学習済みモデルの製造方法、学習済みモデル、胃がん判定方法、プログラム及び記録媒体に関する。
【背景技術】
【0002】
胃がんの検査は、通常、X線検査や内視鏡検査によるが、検査を受ける者の負担が大きい。そこで、代替する精度の高く、簡易に判別できる検査方法が求められている。簡易な判別方法として、胃がん検出用マーカーに関する技術が公開されている(特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特表2012-526550号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1のようなバイオマーカーの探索等が行われているが、一般的な人間ドックに含まれていないものもあり、十分に普及されている状態にはなっていない。
【0005】
そこで本発明は、簡易に実施可能な検査を利用した胃がん判定装置、胃がん判定装置の学習済みモデルの製造方法及び学習済みモデルの提供を目的とする。
【課題を解決するための手段】
【0006】
前記目的を達成するために、本発明の胃がん判定装置は、
情報取得部、胃がん判定部、及び、情報出力部を含み、
前記情報取得部は、判定対象者における生体情報を取得し、
前記生体情報は、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含み、
前記胃がん判定部は、前記生体情報に基づき、前記判定対象者に胃がんがあるか否かを判定して胃がん判定情報を生成し、
前記情報出力部は、前記胃がん判定情報を出力する。
【0007】
本発明の学習済みモデルの製造方法は、
機械学習装置に学習データセットを入力して学習済みモデルを生成する機械学習工程を含み、
前記学習データセットは、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含む説明変数データ、並びに、胃がん罹患歴を含む目的変数データを含む。
【0008】
本発明の学習済みモデルは、
機械学習装置に学習データセットを入力して学習済みモデルを生成する機械学習工程を含み、
機械学習装置に、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含む説明変数データ、並びに、胃がん罹患歴を含む目的変数データを含む学習データセットを入力して生成された、
胃がん判定装置用の学習済みモデルである。
【0009】
本発明の胃がん判定方法は、
情報取得工程、胃がん判定工程、及び、情報出力工程を含み、
前記情報取得工程は、判定対象者における生体情報を取得し、
前記生体情報は、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含み、
前記胃がん判定工程は、前記生体情報に基づき、前記判定対象者に胃がんがあるか否かを判定して胃がん判定情報を生成し、
前記情報出力工程は、前記胃がん判定情報を出力し、
前記各工程が、コンピュータにより実行される。
【0010】
本発明の第1のプログラムは、
情報取得手順、胃がん判定手順、及び、情報出力手順を含み、
前記情報取得手順は、判定対象者における生体情報を取得し、
前記生体情報は、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含み、
前記胃がん判定手順は、前記生体情報に基づき、前記判定対象者に胃がんがあるか否かを判定して胃がん判定情報を生成し、
前記情報出力手順は、前記胃がん判定情報を出力し、
前記各手順を、コンピュータに実行させるためのプログラムである。
【0011】
本発明の第2のプログラムは、
機械学習手順を含み、
前記機械学習手順は、機械学習装置に学習データセットを入力して学習済みモデルを生成し、
前記学習データセットは、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含む説明変数データ、並びに、胃がん罹患歴を含む目的変数データを含み、
前記各手順を、コンピュータに実行させるためのプログラムである。
【0012】
本発明の第1の記録媒体は、
情報取得手順、胃がん判定手順、及び、情報出力手順を含み、
前記情報取得手順は、判定対象者における生体情報を取得し、
前記生体情報は、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含み、
前記胃がん判定手順は、前記生体情報に基づき、前記判定対象者に胃がんがあるか否かを判定して胃がん判定情報を生成し、
前記情報出力手順は、前記胃がん判定情報を出力し、
前記各手順を、コンピュータに実行させるためのプログラムを記録しているコンピュータ読み取り可能な記録媒体である。
【0013】
本発明の第2の記録媒体は、
機械学習手順を含み、
前記機械学習手順は、機械学習装置に学習データセットを入力して学習済みモデルを生成し、
前記学習データセットは、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含む説明変数データ、並びに、胃がん罹患歴を含む目的変数データを含み、
前記各手順を、コンピュータに実行させるためのプログラムを記録しているコンピュータ読み取り可能な記録媒体である。
【発明の効果】
【0014】
本発明によれば、簡易に実施可能な検査によって、胃がんの判定が可能になる。
【図面の簡単な説明】
【0015】
図1図1は、実施形態1の胃がん判定装置の一例の構成を示すブロック図である。
図2図2は、実施形態1の胃がん判定装置のハードウェア構成の一例を示すブロック図である。
図3図3は、実施形態1の胃がん判定装置における処理の一例を示すフローチャートである。
図4図4は、実施形態2の学習済みモデルの特徴等を説明する参考図である。
図5図5は、実施形態2の学習済みモデルの有利な効果を説明する参考図である。
図6図6は、実施形態2の学習済みモデルの有利な効果を説明する別の参考図である。
【発明を実施するための形態】
【0016】
本発明の実施形態について図を用いて説明する。本発明は、以下の実施形態には限定されない。以下の各図において、同一部分には、同一符号を付している。また、各実施形態の説明は、特に言及がない限り、互いの説明を援用でき、各実施形態の構成は、特に言及がない限り、組合せ可能である。
【0017】
[実施形態1]
図1は、本実施形態の胃がん判定装置10(以下「本装置」ともいう。)の一例の構成を示すブロック図である。図1に示すように、本装置10は、情報取得部11、胃がん判定部12及び情報出力部13を含む。また、本装置10は、図示していないが、例えば、入力部、出力部、表示部及び/又は記憶部を含んでもよい。
【0018】
本装置10は、例えば、前記各部を含む1つの装置でもよいし、前記各部が、通信回線網を介して接続可能な装置でもよい。また、本装置10は、前記通信回線網を介して、後述する外部装置と接続可能である。前記通信回線網は、特に制限されず、公知のネットワークを使用でき、例えば、有線でも無線でもよい。前記通信回線網は、例えば、インターネット回線、WWW(World Wide Web)、電話回線、LAN(Local Area Network)、SAN(Storage Area Network)、DTN(Delay Tolerant Networking)、LPWA(Low Power Wide Area)、L5G(ローカル5G)、等が挙げられる。無線通信としては、例えば、Wi-Fi(登録商標)、Bluetooth(登録商標)、ローカル5G、LPWA等が挙げられる。前記無線通信としては、各装置が直接通信する形態(Ad Hoc通信)、インフラストラクチャ(infrastructure通信)、アクセスポイントを介した間接通信等であってもよい。本装置10は、例えば、システムのサーバに組み込まれていてもよい。また、本装置10は、例えば、本発明のプログラムがインストールされたパーソナルコンピュータ(PC、例えば、デスクトップ型、ノート型)、スマートフォン、タブレット端末等であってもよい。さらに、本装置10は、例えば、前記各部のうち少なくとも一つがサーバ上にあり、その他の前記各部が端末上にあるような、クラウドコンピューティングやエッジコンピューティング等の形態であってもよい。
【0019】
図2に、本装置10のハードウェア構成のブロック図を例示する。本装置10は、例えば、中央処理装置(CPU、GPU等)101、メモリ102、バス103、記憶装置104、入力装置105、出力装置106、通信デバイス107等を含む。本装置10の各部は、それぞれのインタフェース(I/F)により、バス103を介して相互に接続されている。
【0020】
中央処理装置101は、コントローラ(システムコントローラ、I/Oコントローラ等)等により、他の構成と連携動作し、本装置10の全体の制御を担う。本装置10において、中央処理装置101により、例えば、本発明のプログラムやその他のプログラムが実行され、また、各種情報の読み込みや書き込みが行われる。具体的には、例えば、中央処理装置101が、情報取得部11、胃がん判定部12、及び情報出力部13として機能する。本装置10が、前記出力部を含む場合、中央処理装置101は、前記出力部として機能してもよい。本装置10は、演算装置として、CPU、GPU(Graphics Processing Unit)、APU(Accelerated Processing Unit)等の他の演算装置を備えてもよいし、CPUとこれらとの組合せを備えてもよい。
【0021】
バス103は、例えば、外部装置とも接続できる。前記外部装置は、例えば、ユーザの端末、外部記憶装置(外部データベース等)、プリンタ、外部入力装置、外部表示装置、外部撮像装置等が挙げられる。本装置10は、例えば、バス103に接続された通信デバイス107により、外部ネットワーク(前記通信回線網)に接続でき、外部ネットワークを介して、他の装置と接続することもできる。
【0022】
メモリ102は、例えば、メインメモリ(主記憶装置)が挙げられる。中央処理装置101が処理を行う際には、例えば、後述する記憶装置104に記憶されている本発明のプログラム等の種々の動作プログラムを、メモリ102が読み込み、中央処理装置101は、メモリ102からデータを受け取って、プログラムを実行する。前記メインメモリは、例えば、RAM(ランダムアクセスメモリ)である。また、メモリ102は、例えば、ROM(読み出し専用メモリ)であってもよい。
【0023】
記憶装置104は、例えば、前記メインメモリ(主記憶装置)に対して、いわゆる補助記憶装置ともいう。前述のように、記憶装置104には、本発明のプログラムを含む動作プログラムが格納されている。記憶装置104は、例えば、記録媒体と、記録媒体に読み書きするドライブとの組合せであってもよい。前記記録媒体は、特に制限されず、例えば、内蔵型でも外付け型でもよく、HD(ハードディスク)、CD-ROM、CD-R、CD-RW、MO、DVD、フラッシュメモリ、メモリーカード等が挙げられる。記憶装置104は、例えば、記録媒体とドライブとが一体化されたハードディスクドライブ(HDD)、及びソリッドステートドライブ(SSD)であってもよい。本装置10が前記記憶部を含む場合、例えば、記憶装置104は、前記記憶部として機能する。前記記憶部は、例えば、後述する生体情報及び胃がん判定情報等を記憶できる。
【0024】
本装置10において、メモリ102及び記憶装置104は、ログ情報、外部データベース(図示せず)や外部の装置から取得した情報、本装置10によって生成した情報、本装置10が処理を実行する際に用いる情報等の種々の情報を記憶することも可能である。この場合、メモリ102及び記憶装置104は、例えば、前記生体情報等を記憶していてもよい。なお、少なくとも一部の情報は、例えば、メモリ102及び記憶装置104以外の外部サーバに記憶されていてもよいし、複数の端末にブロックチェーン技術等を用いて分散して記憶されていてもよい。
【0025】
本装置10は、例えば、さらに、入力装置105、出力装置106を備える。入力装置105は、例えば、タッチパネル、トラックパッド、マウス等のポインティングデバイス;キーボード;カメラ、スキャナ等の撮像手段;ICカードリーダ、磁気カードリーダ等のカードリーダ;マイク等の音声入力手段;等が挙げられる。出力装置106は、例えば、LEDディスプレー、液晶ディスプレー等の表示装置;スピーカ等の音声出力装置;プリンタ;等が挙げられる。本実施形態1において、入力装置105と出力装置106とは、別個に構成されているが、入力装置105と出力装置106とは、タッチパネルディスプレーのように、一体として構成されてもよい。
【0026】
つぎに、本実施形態の胃がん判定方法の一例を、図3のフローチャートに基づき説明する。本実施形態の胃がん判定方法は、例えば、図1又は図2の本装置10を用いて、次のように実施する。なお、本実施形態の胃がん判定方法は、図1又は図2の本装置10の使用には限定されない。
【0027】
まず、情報取得部11は、判定対象者における生体情報を取得する(S1、情報取得工程)。前記生体情報は、推算糸球体濾過量(eGFR)(以下、「eGFR」ともいう。)、体格指数(BMI)(以下、「BMI」ともいう。)、並びに、ペプシノーゲン1(PG1)(以下、「PG1」ともいう。)及びペプシノーゲン2(PG2)(以下「PG2」ともいう。)の少なくとも一方の値に基づく数値を含む。なお、前記PG1及びPG2の少なくとも一方の値に基づく数値は、例えば、PG1とPG2との比(PG1/PG2比)であるが、これに限定されず、PG1の値そのもの、PG2の値そのもの、PG2/PG1比でもよく、PG1とPG2との比に基づかないものでもよく、PG1及びPG2の少なくとも一方の値に基づくものであれば、どのようなものでもよい。また、前記生体情報に含まれるものは、前述の例示に限定されず、例えば、年齢、シスタチンC等を含むものであってもよい。生体情報の取得は、例えば、外部データベースからの取得、入力装置への直接の入力によるが、これに限定されず、通信回線を介して外部端末から受信する方法等、前述の各情報が取得できる方法であれば、どのような態様であってもよい。
【0028】
つぎに、胃がん判定部12は、生体情報に基づき、判定対象者に胃がんがあるか否かを判定して胃がん判定情報を生成する(S2、胃がん判定情報工程)。また、前記胃がん判定部12は、学習済みモデルを含んでもよい。なお、前記学習済みモデルは、機械学習装置に学習データセットを入力して生成された学習済みモデルである。また、前記学習データセットは、eGFR、BMI、並びに、PG1及びPG2の少なくとも一方の値に基づく数値を含む説明変数データ、並びに、胃がん罹患歴を含む目的変数データを含む。前記説明変数データは、前記情報取得部11が取得する生体情報と同様に、前述の例示に限定されず、年齢、シスタチンC等を含むものであってもよい。なお、前記学習済みモデルの製造方法の詳細は、後述の実施形態2の説明のとおりである。
【0029】
つぎに、情報出力部13は、胃がん判定情報を出力する(S3、情報出力工程)。前記疾患予測情報の出力は、例えば、外部装置として接続された専用のモニタに表示する。なお、前記出力は、これに限定されず、例えば、外部装置として接続されたプリンタによって印刷するものでもよく、通信回線を介して前記疾患予測対象者の端末に送信するものでもよく、外部データベースに出力することでもよく、利用用途に合わせて、任意に設定してよい。
【0030】
本装置10は、前述のとおり、eGFR、BMI、並びに、PG1及びPG2の少なくとも一方の値に基づく数値を含む生体情報に基づき、胃がんの判定を行うものである。後述の学習済みモデルの製造方法の説明に記載のとおり、腎機能の指標であるeGFRとBMI、並びに、PG1及びPG2の少なくとも一方の値に基づく数値との組合せは、胃がん判別の結果と相関関係がある。このことは、後述のとおり、前記学習済みモデルによる判別結果が、バイオマーカーとしてのPG1、PG2よりAUCが高いことによって証明されている。また、本装置10は、前記学習済みモデルと同様に、他のがんとの判別が可能であり、年代による影響を受けないという優位性を有している。
【0031】
[実施形態2]
実施形態2は、本発明の胃がん判定装置用の学習済みモデルの製造方法である。
【0032】
実施形態1の胃がん判定装置用の学習済みモデルの製造方法は、機械学習装置に学習データセットを入力して学習済みモデルを生成する機械学習工程を含む。なお、前記学習データセットは、eGFR、BMI、並びに、PG1及びPG2の少なくとも一方の値に基づく数値を含む説明変数データ、並びに、胃がん罹患歴を含む目的変数データを含む。なお、前記機械学習工程は、例えば、ロジスティック回帰によるが、これに限定されず、例えば、ディープラーニング等、様々な機械学習が使用できる。
【0033】
以下、前記学習済みモデル生成の一例を示す。なお、以下の説明は、製造方法の一例であり、前記学習済みモデルの製造方法は、これに限定されない。
【0034】
以下、機械学習工程は、ロジスティック回帰の方法による。なお、罹患したものとそうでないものに数の差があるため、重み付けを行っている。東北メディカル・メガバンク機構の地域住民コホート特定検診相乗り型ベースライン調査TMM67Kの健康調査情報を使用した。前記健康調査情報は、検体検査情報として、血液・尿検査値の情報、調査票(生活・食)情報として、運動、飲酒、喫煙、ストレス、既往症、食生活等の情報、特定健康検診情報として、身長、体重、胸囲、血圧、尿タンパク等の情報を含む。なお、連続値はログスケールに変換し、返還前より正規分布に近いものは、ログスケールに変換した方を使用している。まず、前記各情報は、学習データと評価データに振り分けた。そして、前記学習データに対して胃がんについての単点解析が実施され、前記単点解析は、51項目中17項目に有意差が見られるという結果となった。前記単点解析は、特にPG1及びPG2について、胃がんとの関連が強いことを示した。つぎに、前記単点解析を実施した学習データに対して、ステップワイズで特徴量の選択を実施した。その結果、赤池情報量基準(AIC)によるモデルの特徴量には、PG2、シスタチンC、年齢、高血圧、BMI、赤血球数、eGFR、及びPG1/PG2比が選択された。選択された特徴量に基づき機械学習を実施し、学習済みモデルを生成した。前記学習済みモデルによる学習データ及び評価データによるAUCを算出し、比較すると、それぞれのAUCは、学習データにつき0.91(0.88-0.93)、評価データにつき0.88(0.86-0.90)という結果となった。この結果、前記AICによるモデルは、胃がん判別の学習済みモデルとして有効なものであると確認された。なお、ベイズ情報量基準(BIC)によるモデルの特徴量には、PG2、高血圧、BMI、eGFR、及びPG1/PG2比が選択され、学習済みモデルによる学習データ及び評価データによるAUCは、学習データにつき0.90(0.87-0.92)、評価データにつき0.86(0.85-0.88)という結果となった。
【0035】
以下、前述の方法によって生成された学習済みモデルの効果について、図4を用いて説明する。図4は、上段が、前記学習済みモデル(AIC)とPG1/PG2比によるモデルとのROC曲線を比較した図である。2つの曲線のうち、上に位置する曲線が、前記学習済みモデルのものであり、下に位置する曲線が、PG1/PG2比のものである。また、図4の下段は、各モデルの選択された特徴量及びAUCの数値をまとめた表である。以上から、前記学習済みモデル(AIC)による胃がん判定は、PG1/PG2比による胃がん判定よりもAUCが高いことが確認できる。なお、図4の下段の表によれば、前述のBICによるモデルにおいても、胃がん判定のAUCは、PG1/PG2比によるものよりも高いことが確認できる。ここで、腎機能の指標であるeGFRとBMI並びにPG1及びPG2の少なくとも一方の値に基づく数値との組合せは、前記学習済みモデル(AIC)及び前記BICによるモデルのいずれにも含まれることから、胃がん判定の結果との相関関係が認められる。また、前記学習済みモデル(AIC)のAUCは、図4の下段の表によれば、PG1、PG2のいずれのAUCより高いことが確認できる。したがって、前記学習済みモデル(AIC)による胃がん判定は、バイオマーカーとしてのPG1、PG2よりAUCが高いことが確認できる。
【0036】
さらに、前記学習済みモデルの効果について、図5及び図6を用いて説明する。図5は、年代毎の判定結果の上限値及び下限値を示す浮遊棒グラフである。グラフの下のTは、胃がんの罹患が確認された者を示し、Fは罹患が確認されなかった者を示す。図5のグラフによって、前記学習済みモデルは、年代に依存せずに、胃がんを見分けることができることが示されている。図6は、胃がんを含むがん等の罹患歴毎の判定結果の上限値及び下限値を示す浮遊棒グラフである。図6の最も左の棒グラフは、胃がんの罹患歴がある者を示す。胃がんの罹患歴がある者を示す棒グラフの右隣の棒グラフは、胃がんの罹患歴がない者を示している。胃がんの罹患歴がない者を示す棒グラフより右側の各棒グラフは、胃がん以外のがん等の罹患歴がある者を示している。この結果、前記学習済みモデルは、胃がんと胃がん以外のがん及び疾患(心筋梗塞・狭心症:MI.Angina、脳梗塞:Stroke、心不全:HF、脳出血:ICH、くも膜下出血:SAH、大腸がん:Colorectal Cancer、肺がん:Lung Cancer、腎臓がん:Kidney Cancer、肝がん:Hepatoma、すい臓がん:Pancreatic Cancer、脳腫瘍:Brain Cancer、乳がん:Breast Cancer、前立腺がん:Prostatic Cancer、子宮頸がん:Cervical Cancer、子宮体がん:Uterine Cancer、精巣がん:Testicular Cancer、悪性リンパ腫:Lymphoma、卵巣がん:Ovarian 、脂肪肝:Fatty Liver、慢性腎炎:Chronic Nephritis)とを見分けることができることが示されている。
【0037】
実施形態1の胃がん判定装置用の学習済みモデルは、例えば、前述の方法により生成される。なお、前述のとおり、機械学習工程は、ロジスティック回帰に限定されず、ディープラーニング等、様々な機械学習が使用できる。また、機械学習装置に入力される学習データセットは、例えば、eGFR、BMI、並びに、PG1及びPG2の少なくとも一方の値に基づく数値を含むものであるが、これに限定されず、例えば、年齢、シスタチンC等を含むものとしてもよい。これにより、前記学習済みモデルは、PG1/PG2比よりも高いAUCを示し、年代により影響を受けず、他のがんとの見分けることができるという効果が生じる。
【0038】
[実施形態3]
実施形態3は、本発明の胃がん判定装置用の学習済みモデルである。
【0039】
本実施形態の学習済みモデルは、実施形態2の製造方法によって製造された学習済みモデルである。なお、前述のとおり、前記学習済みモデルは、eGFR、BMI、並びに、PG1及びPG2の少なくとも一方の値に基づく数値を含む説明変数データ、並びに、胃がん罹患歴を含む目的変数データを含む学習データセットを特徴とし、その結果、PG1/PG2比よりも高いAUCを示し、年代により影響を受けず、他のがんとの見分けることができるという効果を特徴とするものである。一方、前記学習済みモデルは、前記学習データセットを機械学習装置に入力し、機械学習の結果として生成されるものであり、前記学習データセットの内容に応じて、機械学習後の学習済みパラメータ等が決定されるものである。そこで、機械学習後の学習済みパラメータ等によって発明を特定することはできない。以上から、前記学習済みモデルは、出願時において当該物をその構造又は特性により直接特定することが不可能であるか、又はおよそ実際的でないという事情が存在する場合に該当する。
【0040】
本実施形態の学習済みモデルは、実施形態1の胃がん判定装置に用いられ、判定対象者における生体情報に基づき、判定対象者に胃がんがあるか否かの判定を行うものである。
【0041】
[実施形態4]
本実施形態の第1のプログラムは、前述の胃がん判定方法の各工程を、コンピュータに実行させるためのプログラムである。具体的に、本実施形態の第1のプログラムは、コンピュータに、例えば、情報取得手順、胃がん判定手順、及び情報出力手順を実行させるためのプログラムである。
【0042】
前記情報取得手順は、判定対象者における生体情報を取得し、
前記生体情報は、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含み、
前記胃がん判定手順は、前記生体情報に基づき、前記判定対象者に胃がんがあるか否かを判定して胃がん判定情報を生成し、
前記情報出力手順は、前記胃がん判定情報を出力する。
【0043】
また、本実施形態の第1のプログラムは、コンピュータを、例えば、情報取得手順、胃がん判定手順、及び情報出力手順として機能させるプログラムということもできる。
【0044】
本実施形態の第2のプログラムは、前述の学習済みモデルの製造方法の各工程を、コンピュータに実行させるためのプログラムである。具体的に、本実施形態の第2のプログラムは、コンピュータに、例えば、機械学習手順を実行させるためのプログラムである。
【0045】
機械学習手順を含み、
前記機械学習手順は、機械学習装置に学習データセットを入力して学習済みモデルを生成し、
前記学習データセットは、推算糸球体濾過量(eGFR)、前記体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含む説明変数データ、並びに、胃がん罹患歴を含む目的変数データを含む。
【0046】
また、本実施形態の第2のプログラムは、コンピュータを、例えば、機械学習手順として機能させるプログラムということもできる。
【0047】
本実施形態のプログラムは、前記本発明の胃がん判定装置及び胃がん判定方法並びに学習済みモデル及び学習済みモデルの製造方法における記載を援用できる。前記各手順は、例えば、「手順」を「処理」と読み替え可能である。また、本実施形態のプログラムは、例えば、コンピュータ読み取り可能な記録媒体に記録されてもよい。前記記録媒体は、例えば、非一時的なコンピュータ可読記録媒体(non-transitory computer-readable storage medium)である。前記記録媒体は、特に制限されず、例えば、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、ハードディスク(HD)、フラッシュメモリ(例えば、SSD(Solid State Drive)、USBフラッシュメモリ、SD/SDHCカード等)、光ディスク(例えば、CD‐R/CD‐RW、DVD‐R/DVD‐RW、BD‐R/BD‐RE等)、光磁気ディスク(MO)、フロッピー(登録商標)ディスク(FD)等があげられる。また、本実施形態のプログラム(例えば、プログラミング製品、又はプログラム製品ともいう)は、例えば、外部のコンピュータから配信される形態であってもよい。前記「配信」は、例えば、通信回線網を介した配信でもよいし、有線で接続された装置を介した配信であってもよい。本実施形態のプログラムは、配信された装置にインストールされて実行されてもよいし、インストールされずに実行されてもよい。
【0048】
以上、実施形態を参照して本発明を説明したが、本発明は、上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しうる様々な変更をできる。
【0049】
<付記>
上記の実施形態の一部又は全部は、以下の付記のように記載されうるが、以下には限られない。
(付記1)
情報取得部、胃がん判定部、及び、情報出力部を含み、
前記情報取得部は、判定対象者における生体情報を取得し、
前記生体情報は、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含み、
前記胃がん判定部は、前記生体情報に基づき、前記判定対象者に胃がんがあるか否かを判定して胃がん判定情報を生成し、
前記情報出力部は、前記胃がん判定情報を出力する、
胃がん判定装置。
(付記2)
前記胃がん判定部は、学習済みモデルを含み、
前記学習済みモデルは、機械学習装置に学習データセットを入力して生成された学習済みモデルであり、
前記学習データセットは、前記推算糸球体濾過量(eGFR)、前記体格指数(BMI)、並びに、前記ペプシノーゲン1(PG1)及び前記ペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含む説明変数データ、並びに、胃がん罹患歴を含む目的変数データを含む、
付記1記載の胃がん判定装置。
(付記3)
機械学習装置に学習データセットを入力して学習済みモデルを生成する機械学習工程を含み、
前記学習データセットは、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含む説明変数データ、並びに、胃がん罹患歴を含む目的変数データを含む、
胃がん判定装置用の学習済みモデルの製造方法。
(付記4)
機械学習装置に学習データセットを入力して学習済みモデルを生成する機械学習工程を含み、
機械学習装置に、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含む説明変数データ、並びに、胃がん罹患歴を含む目的変数データを含む学習データセットを入力して生成された、
胃がん判定装置用の学習済みモデル。
(付記5)
情報取得工程、胃がん判定工程、及び、情報出力工程を含み、
前記情報取得工程は、判定対象者における生体情報を取得し、
前記生体情報は、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含み、
前記胃がん判定工程は、前記生体情報に基づき、前記判定対象者に胃がんがあるか否かを判定して胃がん判定情報を生成し、
前記情報出力工程は、前記胃がん判定情報を出力し、
前記各工程が、コンピュータにより実行される、
胃がん判定方法。
(付記6)
前記胃がん判定工程は、学習済みモデルを用いて実施され、
前記学習済みモデルは、機械学習装置に学習データセットを入力して生成された学習済みモデルであり、
前記学習データセットは、前記推算糸球体濾過量(eGFR)、前記体格指数(BMI)、並びに、前記ペプシノーゲン1(PG1)及び前記ペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含む説明変数データ、並びに、胃がん罹患歴を含む目的変数データを含み、
前記各工程が、コンピュータにより実行される、
付記5記載の胃がん判定方法。
(付記7)
情報取得手順、胃がん判定手順、及び、情報出力手順を含み、
前記情報取得手順は、判定対象者における生体情報を取得し、
前記生体情報は、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含み、
前記胃がん判定手順は、前記生体情報に基づき、前記判定対象者に胃がんがあるか否かを判定して胃がん判定情報を生成し、
前記情報出力手順は、前記胃がん判定情報を出力し、
前記各手順を、コンピュータに実行させるためのプログラム。
(付記8)
前記胃がん判定手順は、学習済みモデルを用いて実施され、
前記学習済みモデルは、機械学習装置に学習データセットを入力して生成された学習済みモデルであり、
前記学習データセットは、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含む説明変数データ、並びに、胃がん罹患歴を含む目的変数データを含み、
前記各手順を、コンピュータに実行させるための請求項7記載のプログラム。
(付記9)
機械学習手順を含み、
前記機械学習手順は、機械学習装置に学習データセットを入力して学習済みモデルを生成し、
前記学習データセットは、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含む説明変数データ、並びに、胃がん罹患歴を含む目的変数データを含み、
前記各手順を、コンピュータに実行させるためのプログラム。
(付記10)
情報取得手順、胃がん判定手順、及び、情報出力手順を含み、
前記情報取得手順は、判定対象者における生体情報を取得し、
前記生体情報は、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含み、
前記胃がん判定手順は、前記生体情報に基づき、前記判定対象者に胃がんがあるか否かを判定して胃がん判定情報を生成し、
前記情報出力手順は、前記胃がん判定情報を出力し、
前記各手順を、コンピュータに実行させるためのプログラムを記録しているコンピュータ読み取り可能な記録媒体。
(付記11)
前記胃がん判定手順は、学習済みモデルを用いて実施され、
前記学習済みモデルは、機械学習装置に学習データセットを入力して生成された学習済みモデルであり、
前記学習データセットは、前記推算糸球体濾過量(eGFR)、前記体格指数(BMI)、並びに、前記ペプシノーゲン1(PG1)及び前記ペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含む説明変数データ、並びに、胃がん罹患歴を含む目的変数データを含み、
前記各手順を、コンピュータに実行させるためのプログラムを記録しているコンピュータ読み取り可能な付記10記載の記録媒体。
(付記12)
機械学習手順を含み、
前記機械学習手順は、機械学習装置に学習データセットを入力して学習済みモデルを生成し、
前記学習データセットは、推算糸球体濾過量(eGFR)、体格指数(BMI)、並びに、ペプシノーゲン1(PG1)及びペプシノーゲン2(PG2)の少なくとも一方の値に基づく数値を含む説明変数データ、並びに、胃がん罹患歴を含む目的変数データを含み、
前記各手順を、コンピュータに実行させるためのプログラムを記録しているコンピュータ読み取り可能な記録媒体。
【産業上の利用可能性】
【0050】
本発明によれば、精度が高く、簡易な胃がん判定が可能になる。
【符号の説明】
【0051】
10 胃がん判定装置
11 情報取得部
12 胃がん判定部
13 上昇出力部
101 中央処理装置
102 メモリ
103 バス
104 記憶装置
105 入力装置
106 出力装置
107 通信デバイス

図1
図2
図3
図4
図5
図6