(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022141983
(43)【公開日】2022-09-30
(54)【発明の名称】NASH予測装置及びNASH予測方法
(51)【国際特許分類】
G01N 33/483 20060101AFI20220921BHJP
G01N 33/48 20060101ALI20220921BHJP
G01N 21/65 20060101ALN20220921BHJP
【FI】
G01N33/483 C
G01N33/48 M
G01N21/65
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2021041383
(22)【出願日】2021-03-15
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成28年度、国立研究開発法人科学技術振興機構、戦略的創造研究推進事業「ラマンスペクトル計測と情報科学の高度融合型解析技術の開発」委託研究、産業技術力強化法第17条の適用を受ける特許出願 平成28年度、国立研究開発法人科学技術振興機構、戦略的創造研究推進事業「ラマンスペクトルによる細胞・組織のシグネチャー解析」委託研究、産業技術力強化法第17条の適用を受ける特許出願 平成28年度、国立研究開発法人科学技術振興機構、戦略的創造研究推進事業「プログラマブル照明ラマン散乱顕微鏡の開発」委託研究、産業技術力強化法第17条の適用を受ける特許出願
(71)【出願人】
【識別番号】504173471
【氏名又は名称】国立大学法人北海道大学
(71)【出願人】
【識別番号】509349141
【氏名又は名称】京都府公立大学法人
(71)【出願人】
【識別番号】504176911
【氏名又は名称】国立大学法人大阪大学
(74)【代理人】
【識別番号】100088155
【弁理士】
【氏名又は名称】長谷川 芳樹
(74)【代理人】
【識別番号】100124800
【弁理士】
【氏名又は名称】諏澤 勇司
(72)【発明者】
【氏名】小松崎 民樹
(72)【発明者】
【氏名】テイラー ジェームズ ニコラス
(72)【発明者】
【氏名】原田 義規
(72)【発明者】
【氏名】岡嶋 亮
(72)【発明者】
【氏名】田中 秀央
(72)【発明者】
【氏名】伊藤 義人
(72)【発明者】
【氏名】藤田 克昌
(72)【発明者】
【氏名】熊本 康昭
【テーマコード(参考)】
2G043
2G045
【Fターム(参考)】
2G043AA01
2G043AA04
2G043BA16
2G043CA03
2G043CA05
2G043CA09
2G043EA03
2G043FA02
2G045AA25
2G045CA25
2G045CA26
2G045CB01
2G045FA28
(57)【要約】
【課題】ラマン分光法を用いてNASHに関する予測を行うこと。
【解決手段】NASH予測装置1は、細胞、組織又は血液の一部についてラマン分光法により得られるラマンシフトに関する予測元情報に基づいて、細胞、組織又は血液の一部がNASH(Nonalcoholic steatohepatitis)と化学環境が似ている度合であるNASH度を予測する予測モデルを格納する格納部11と、細胞、組織又は血液から構成される試料の一部についてラマン分光法により得られるラマンシフトに関する試料情報を取得する取得部12と、取得部12によって取得された試料情報を格納部11によって格納された予測モデルに適用することで、試料の一部のNASH度を予測する予測部13と、を備える。予測モデルは、予測元情報に対してNASHである又はNASHではないと対応付けられた学習データに基づいて学習されていてもよい。
【選択図】
図1
【特許請求の範囲】
【請求項1】
細胞、組織又は血液の一部についてラマン分光法により得られるラマンシフトに関する予測元情報に基づいて、前記細胞、組織又は血液の一部がNASH(Nonalcoholic steatohepatitis)と化学環境が似ている度合であるNASH度を予測する予測モデルを格納する格納部と、
細胞、組織又は血液から構成される試料の一部についてラマン分光法により得られるラマンシフトに関する試料情報を取得する取得部と、
前記取得部によって取得された前記試料情報を前記格納部によって格納された前記予測モデルに適用することで、前記試料の一部のNASH度を予測する予測部と、
を備えるNASH予測装置。
【請求項2】
前記予測モデルは、前記予測元情報に対してNASHである又はNASHではないと対応付けられた学習データに基づいて学習されている、
請求項1に記載のNASH予測装置。
【請求項3】
前記予測モデルは、病理組織学的にNAFL(Nonalcoholic fatty liver)と判定される細胞、組織又は血液の一部を除く学習データに基づいて学習されている、
請求項1又は2に記載のNASH予測装置。
【請求項4】
前記予測モデルは、病理組織学的にNASHと判定されるデータに加えて、病理組織学的に正常と判定されるデータ、病理組織学的にNAFLと判定される細胞、組織又は血液の一部のうち、化学的にはNASHであると判定される細胞、組織又は血液の一部の前記予測元情報に対してNASHであると対応付けられた学習データ、及び、化学的にはNASHではないと判定される細胞、組織又は血液の一部の前記予測元情報に対してNASHではないと対応付けられた学習データ、の少なくとも一つに基づいて学習されている、
請求項1又は2に記載のNASH予測装置。
【請求項5】
前記ラマンシフトは、高波数領域、脂肪含有を定量する領域、CH(Carbon-Hydrogen)領域、低波数領域、又は、高波数領域及び低波数領域の両方、の何れかのラマンシフトである、
請求項1~4の何れか一項に記載のNASH予測装置。
【請求項6】
細胞、組織又は血液の一部についてラマン分光法により得られるラマンシフトに関する予測元情報に基づいて、前記細胞、組織又は血液の一部がNASH(Nonalcoholic steatohepatitis)と化学環境が似ている度合であるNASH度を予測する予測モデルを格納する格納部を備えるNASH予測装置により実行されるNASH予測方法であって、
細胞、組織又は血液から構成される試料の一部についてラマン分光法により得られるラマンシフトに関する試料情報を取得する取得ステップと、
前記取得ステップにおいて取得された前記試料情報を前記格納部によって格納された前記予測モデルに適用することで、前記試料の一部のNASH度を予測する予測ステップと、
を含むNASH予測方法。
【請求項7】
前記予測モデルは、前記予測元情報に対してNASHである又はNASHではないと対応付けられた学習データに基づいて学習されている、
請求項6に記載のNASH予測方法。
【請求項8】
前記予測モデルは、病理組織学的にNAFL(Nonalcoholic fatty liver)と判定される細胞、組織又は血液の一部を除く学習データに基づいて学習されている、
請求項6又は7に記載のNASH予測方法。
【請求項9】
前記予測モデルは、病理組織学的にNASHと判定されるデータに加えて、病理組織学的に正常と判定されるデータ、病理組織学的にNAFLと判定される細胞、組織又は血液の一部のうち、化学的にはNASHであると判定される細胞、組織又は血液の一部の前記予測元情報に対してNASHであると対応付けられた学習データ、及び、化学的にはNASHではないと判定される細胞、組織又は血液の一部の前記予測元情報に対してNASHではないと対応付けられた学習データ、の少なくとも一つに基づいて学習されている、
請求項6又は7に記載のNASH予測方法。
【請求項10】
前記ラマンシフトは、高波数領域、脂肪含有を定量する領域、CH(Carbon-Hydrogen)領域、低波数領域、又は、高波数領域及び低波数領域の両方、の何れかのラマンシフトである、
請求項6~9の何れか一項に記載のNASH予測方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の一側面は、試料の一部がNASH(Nonalcoholic steatohepatitis)と化学環境が似ている度合であるNASH度を予測するNASH予測装置及びNASH予測方法に関する。
【背景技術】
【0002】
下記特許文献1では、対象からの体液試料中の長鎖アシルカルニチンの量を測定して基準値と比較することで、対象におけるNASHを検出する方法が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、ラマン分光法を用いてNASHに関する予測を行う方法は知られていない。そこで、ラマン分光法を用いてNASHに関する予測を行うことが望まれている。
【課題を解決するための手段】
【0005】
本開示の一側面に係るNASH予測装置は、細胞、組織又は血液の一部についてラマン分光法により得られるラマンシフトに関する予測元情報に基づいて、細胞、組織又は血液の一部がNASHと化学環境が似ている度合であるNASH度を予測する予測モデルを格納する格納部と、細胞、組織又は血液から構成される試料の一部についてラマン分光法により得られるラマンシフトに関する試料情報を取得する取得部と、取得部によって取得された試料情報を格納部によって格納された予測モデルに適用することで、試料の一部のNASH度を予測する予測部と、を備える。このような側面においては、試料の一部についてラマン分光法により得られるラマンシフトに関する試料情報が予測モデルに適用されることで、試料の一部がNASHと化学環境が似ている度合であるNASH度が予測される。これにより、ラマン分光法を用いてNASHに関する予測を行うことができる。
【0006】
また、本開示の一側面に係るNASH予測装置において、予測モデルは、予測元情報に対してNASHである又はNASHではないと対応付けられた学習データに基づいて学習されていてもよい。このような側面においては、例えば、細胞、組織又は血液の一部について医師(病理医及び臨床医を含む。以降同様)がNASHである又はNASHではないと予め判定した結果を用いた学習データに基づいて予測モデルを学習させることができる。それにより、より簡易に用意できる学習データを利用することができると共に、より汎用な予測を行う予測モデルを利用することができる。
【0007】
また、本開示の一側面に係るNASH予測装置において、予測モデルは、病理組織学的にNAFL(Nonalcoholic fatty liver)と判定される細胞、組織又は血液の一部を除く学習データに基づいて学習されていてもよい。NAFLD(Nonalcoholic fatty liver disease)に関する判定を行った場合、正常である、NAFLである、又は、NASHである、の3パターンに主に判定される場合がある。上記側面においては、病理組織学的にNAFLと判定される細胞、組織又は血液の一部を除く学習データに基づいて予測モデルを学習させるため、例えば、正常であるかNASHであるかの2パターンに判定される学習データに基づいて予測モデルを学習させる。これにより、NASHと化学環境が似ている度合であるNASH度をより汎用に予測する予測モデルを利用することができる。
【0008】
また、本開示の一側面に係るNASH予測装置において、予測モデルは、病理組織学的にNASHと判定されるデータに加えて、病理組織学的に正常と判定されるデータ、病理組織学的にNAFLと判定される細胞、組織又は血液の一部のうち、化学的にはNASHであると判定される細胞、組織又は血液の一部の予測元情報に対してNASHであると対応付けられた学習データ、及び、化学的にはNASHではないと判定される細胞、組織又は血液の一部の予測元情報に対してNASHではないと対応付けられた学習データ、の少なくとも一つに基づいて学習されていてもよい。このような側面においては、病理組織学的にNAFLと判定される細胞、組織又は血液の一部であっても、化学的にはNASHであると判定される細胞、組織又は血液の一部の予測元情報に対してNASHであると対応付けられた学習データ、及び、化学的にはNASHではないと判定される細胞、組織又は血液の一部の予測元情報に対してNASHではないと対応付けられた学習データ、の少なくとも一つに基づいて予測モデルを学習させることができる。それにより、NASHと化学環境が似ている度合であるNASH度をより汎用に予測する予測モデルを利用することができる。
【0009】
また、本開示の一側面に係るNASH予測装置において、ラマンシフトは、高波数領域、脂肪含有を定量する領域、CH(Carbon-Hydrogen)領域、低波数領域、又は、高波数領域及び低波数領域の両方、の何れかのラマンシフトであってもよい。このような側面においては、例えば、全波数領域を計測するラマン分光法ではなく、特定の領域のみを計測するラマン分光法を利用できるため、用いるラマン分光法のバリエーションが増える。
【0010】
本開示の別の一側面に係るNASH予測方法は、細胞、組織又は血液の一部についてラマン分光法により得られるラマンシフトに関する予測元情報に基づいて、細胞、組織又は血液の一部がNASHと化学環境が似ている度合であるNASH度を予測する予測モデルを格納する格納部を備えるNASH予測装置により実行されるNASH予測方法であって、細胞、組織又は血液から構成される試料の一部についてラマン分光法により得られるラマンシフトに関する試料情報を取得する取得ステップと、取得ステップにおいて取得された試料情報を格納部によって格納された予測モデルに適用することで、試料の一部のNASH度を予測する予測ステップと、を含む。このような側面においては、試料の一部についてラマン分光法により得られるラマンシフトに関する試料情報が予測モデルに適用されることで、試料の一部がNASHと化学環境が似ている度合であるNASH度が予測される。これにより、ラマン分光法を用いてNASHに関する予測を行うことができる。
【0011】
また、本開示の別の一側面に係るNASH予測方法において、予測モデルは、予測元情報に対してNASHである又はNASHではないと対応付けられた学習データに基づいて学習されていてもよい。このような側面においては、例えば、細胞、組織又は血液の一部について医師がNASHである又はNASHではないと予め判定した結果を用いた学習データに基づいて予測モデルを学習させることができる。それにより、より簡易に用意できる学習データを利用することができると共に、より汎用な予測を行う予測モデルを利用することができる。
【0012】
また、本開示の別の一側面に係るNASH予測方法において、予測モデルは、病理組織学的にNAFLと判定される細胞、組織又は血液の一部を除く学習データに基づいて学習されていてもよい。NAFLDに関する判定を行った場合、正常である、NAFLである、又は、NASHである、の3パターンに主に判定される場合がある。上記側面においては、病理組織学的にNAFLと判定される細胞、組織又は血液の一部を除く学習データに基づいて予測モデルを学習させるため、例えば、正常であるかNASHであるかの2パターンに判定される学習データに基づいて予測モデルを学習させる。これにより、NASHと化学環境が似ている度合であるNASH度をより汎用に予測する予測モデルを利用することができる。
【0013】
また、本開示の別の一側面に係るNASH予測方法において、予測モデルは、病理組織学的にNASHと判定されるデータに加えて、病理組織学的に正常と判定されるデータ、病理組織学的にNAFLと判定される細胞、組織又は血液の一部のうち、化学的にはNASHであると判定される細胞、組織又は血液の一部の予測元情報に対してNASHであると対応付けられた学習データ、及び、化学的にはNASHではないと判定される細胞、組織又は血液の一部の予測元情報に対してNASHではないと対応付けられた学習データ、の少なくとも一つに基づいて学習されていてもよい。このような側面においては、病理組織学的にNAFLと判定される細胞、組織又は血液の一部であっても、化学的にはNASHであると判定される細胞、組織又は血液の一部の予測元情報に対してNASHであると対応付けられた学習データ、及び、化学的にはNASHではないと判定される細胞、組織又は血液の一部の予測元情報に対してNASHではないと対応付けられた学習データ、の少なくとも一つに基づいて予測モデルを学習させることができる。それにより、NASHと化学環境が似ている度合であるNASH度をより汎用に予測する予測モデルを利用することができる。
【0014】
また、本開示の別の一側面に係るNASH予測方法において、ラマンシフトは、高波数領域、脂肪含有を定量する領域、CH領域、低波数領域、又は、高波数領域及び低波数領域の両方、の何れかのラマンシフトであってもよい。このような側面においては、例えば、全波数領域を計測するラマン分光法ではなく、特定の領域のみを計測するラマン分光法を利用できるため、用いるラマン分光法のバリエーションが増える。
【発明の効果】
【0015】
本開示の一側面によれば、ラマン分光法を用いてNASHに関する予測を行うことができる。
【図面の簡単な説明】
【0016】
【
図1】実施形態に係るNASH予測装置の機能構成の一例を示す図である。
【
図2】実施形態に係るNASH予測装置で用いられるコンピュータのハードウェア構成の一例を示す図である。
【
図3】実施形態に係るNASH予測装置が実行する予測処理の一例を示すフローチャートである。
【
図4】実施形態に係るNASH予測プログラムの構成を記憶媒体と共に示す図である。
【
図5】単一決定木の概略を示すフローチャートである。
【
図6】決定ノード内で起こる処理の概略を示すフローチャートである。
【
図7】NASHインデックス計算処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0017】
以下、図面を参照しながら本開示での実施形態に係るNASH予測装置1を詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。また、以下の説明における本開示での実施形態は、本発明の具体例であり、特に本発明を限定する旨の記載がない限り、これらの実施形態に限定されないものとする。
【0018】
NASH予測装置1は、試料の一部がNASHと化学環境が似ている度合であるNASH度を予測するコンピュータ装置である。より具体的には、NASH予測装置1は、試料の一部についてラマン分光法により得られるラマンシフトに関する試料情報に基づいて、試料の一部のNASH度を予測する。
【0019】
試料は、細胞、組織又は血液から構成される。試料は、形態及び機能を同じくする細胞の集合体である組織、何種類かの組織が集まって構成される器官など、細胞を含むものを含んでもよいし、血液(血漿・血清)を含んでもよい。本開示での実施形態において、細胞は、肝臓を構成する主要な細胞である肝細胞・星細胞を想定するが、これに限るものではない。
【0020】
NASHは、非アルコール性脂肪肝炎である。ここで、組織診断又は画像診断で脂肪肝を認め、アルコール性肝障害など他の肝疾患を除外した病態として非アルコール性脂肪性肝疾患(Nonalcoholic fatty liver disease;NAFLD)がある。NAFLDの多くは、肥満、糖尿病、脂質異常症又は高血圧などを基盤に発症することから、メタボリックシンドロームの肝病変として捉えられている。NAFLDは、組織学的に大滴性の肝脂肪変性を基盤に発症して病態がほとんど進行しないと考えられる非アルコール性脂肪肝(Nonalcoholic fatty liver;NAFL)と、進行性で肝硬変や肝癌の発症母地にもなる非アルコール性脂肪肝炎(Nonalcoholic steatohepatitis;NASH)とに分類される。
【0021】
ラマン分光法は、ラマン効果に基づく分光法である。ラマン効果は、物質に光を入射したとき、散乱された光の中に入射された光(入射光)の振動数と異なる振動数の光(ラマン散乱光)が含まれる現象である。ラマンシフトは、入射光とラマン散乱光との振動数の差である。ラマンシフトは、個々の原子又は分子に固有な振動数に対応するので、ラマンシフトを測定することにより、その物質を同定したり、物質の構造を調べたりすることができる。本開示での実施形態におけるラマンシフトは、高波数領域、脂肪含有を定量する領域、CH(Carbon-Hydrogen)領域、低波数領域、又は、高波数領域及び低波数領域の両方、の何れかのラマンシフトであってもよい。
【0022】
試料情報は、試料などの細胞、組織又は血液の一部についてラマン分光法により得られるラマンシフトに関する情報である。試料情報の一例として、ラマンシフト自体、ラマンシフト(及びラマン散乱強度)に基づくラマンスペクトル、及び、ラマンシフト又はラマンスペクトルに基づくラマン画像(ラマンイメージ)などが挙げられるが、これらに限るものではない。試料情報は、分光装置の情報(校正データ、装置構成、測定条件(強度、波長、露光時間など))、及び、スペクトル以外の情報(試料取得方法、測定環境など)も含んでよい。
【0023】
図1は、NASH予測装置1の機能構成の一例を示す図である。
図1に示す通り、NASH予測装置1(NASH予測装置)は、学習部10、格納部11(格納部)、取得部12(取得部)、及び、予測部13(予測部)を含んで構成される。
【0024】
NASH予測装置1の各機能ブロックは、NASH予測装置1内にて機能することを想定しているが、これに限るものではない。例えば、NASH予測装置1の機能ブロックの一部は、NASH予測装置1とは異なるコンピュータ装置であって、NASH予測装置1とネットワーク接続されたコンピュータ装置内において、NASH予測装置1と情報を適宜送受信しつつ機能してもよい。また、NASH予測装置1の一部の機能ブロックは無くてもよいし、複数の機能ブロックを一つの機能ブロックに統合してもよいし、一つの機能ブロックを複数の機能ブロックに分解してもよい。
【0025】
図2は、NASH予測装置1で用いられるコンピュータのハードウェア構成の一例を示す図である。NASH予測装置1は物理的には、
図2に示すように、中央処理装置(プロセッサ)であるCPU(Central Processing Unit)100、主記憶装置であるRAM(Random access memory)101及びROM(Read Only Memory)102、キーボード、マイク及びディスプレイなどの入出力装置103、データ送受信デバイスである通信モジュール104、並びに、ハードディスク及びSSD(Solid State Drive)などの補助記憶装置105を含むコンピュータシステムとして構成されている。CPU100、RAM101及びROM102、入出力装置103、通信モジュール104、及び、補助記憶装置105は、それぞれ複数で構成されてもよい。
図1に示す各機能ブロックの機能は、
図2に示すCPU100、RAM101などのハードウェア上に所定のコンピュータソフトウェアを読み込ませることにより、CPU100の制御のもとで入出力装置103及び通信モジュール104を動作させるとともに、RAM101及び補助記憶装置105におけるデータの読み出し及び書き込みを行うことで実現される。
【0026】
以下、
図1に示すNASH予測装置1の各機能について説明する。
【0027】
学習部10は、学習データを学習することで、(任意の)細胞、組織又は血液の一部についてラマン分光法により得られるラマンシフトに関する予測元情報に基づいて、(当該)細胞、組織又は血液の一部がNASHと化学環境が似ている度合であるNASH度を予測する予測モデルを生成する。
【0028】
学習データは、通信モジュール104を介して学習部10が他の装置から取得したものであってもよいし、入出力装置103を介してNASH予測装置1のユーザから入力された学習データを学習部10が取得したものであってもよいし、格納部11によって予め格納された学習データを学習部10が取得したものであってもよい。
【0029】
学習データは、予測元情報に対してNASHである又はNASHではないと対応付けられたデータであってもよい。すなわち、予測モデルは、予測元情報に対してNASHである又はNASHではないと対応付けられた学習データに基づいて(学習部10によって)学習されていてもよい。例えば、学習データは、肝臓構成細胞のラマン画像に対する医師によるNASHである又はNASHではないとの判定に基づいて準備された、当該ラマン画像の各ピクセル(細胞の一部に対応)に対してNASHである又はNASHではないと対応付けられたデータであってもよい。
【0030】
学習データは、病理組織学的にNAFLと判定される細胞、組織又は血液の一部を除くデータであってもよい。すなわち、予測モデルは、病理組織学的にNAFLと判定される細胞、組織又は血液の一部を除く学習データに基づいて(学習部10によって)学習されていてもよい。例えば、学習データは、肝臓構成細胞のラマン画像に対する医師による、正常である、NAFLである、又は、NASHである、との病理組織学的な判定に基づいて準備された、正常である及びNASHであると判定されたラマン画像(NAFLと判定されたラマン画像は除く)に関するデータであってもよい。
【0031】
学習データは、病理組織学的にNASHと判定されるデータに加えて、病理組織学的に正常と判定されるデータ、病理組織学的にNAFLと判定される細胞、組織又は血液の一部のうち、化学的にはNASHであると判定される細胞、組織又は血液の一部の予測元情報に対してNASHであると対応付けられたデータ、及び、化学的にはNASHではないと判定される細胞、組織又は血液の一部の予測元情報に対してNASHではないと対応付けられたデータ、の少なくとも一つを含んでもよい。すなわち、予測モデルは、病理組織学的にNASHと判定されるデータに加えて、病理組織学的に正常と判定されるデータ、および、病理組織学的にNAFLと判定される細胞、組織又は血液の一部のうち、化学的にはNASHであると判定される細胞、組織又は血液の一部の予測元情報に対してNASHであると対応付けられた学習データ、及び、化学的にはNASHではないと判定される細胞、組織又は血液の一部の予測元情報に対してNASHではないと対応付けられた学習データ、の少なくとも一つに基づいて(学習部10によって)学習されていてもよい。例えば、学習データは、病理組織学的にNASHと判定されるデータに加えて、病理組織学的に正常と判定されるデータ、および医師により病理組織学的にNAFLであると判定される肝実質細胞のラマン画像の各ピクセルについて、化学的にはNASHであると判定されるピクセルに対してNASHであると対応付けられたデータ、及び、化学的にはNASHではないと判定されるピクセルに対してNASHではないと対応付けられたデータ、の少なくとも一つを含んでもよい。なお、化学的にはNASHであると判定される、とは、例えば、ラマンシフトに基づく分析によればNASHであると判定される、であってもよい。同様に、化学的にはNASHではないと判定される、とは、例えば、ラマンシフトに基づく分析によればNASHではないと判定される、であってもよい。本開示での実施形態において、「化学的」は「生化学的」に置き換えてもよい。
【0032】
NASH度は、「0」以上「1」以下の実数であって、「0」に近いほどNASHと化学環境が似ておらず、「1」に近いほどNASHと化学環境が似ていることを示す実数で表現してもよい。また、NASH度は、「0」以上「100」以下の実数であって、NASHと化学環境が似ている確率を示す実数で表現してもよい。また、NASH度は、NASHと化学環境が同一である、又は、NASHと化学環境が同一ではない、を示す2値で表現してもよい。なお、NASH度は、これら表現に限られない。NASH度が低いことはNASHへ移行する確率が低いことを意味し、NASH度が高いことはNASHへ移行する確率が高いことを意味する。
【0033】
格納部11は、予測モデルを格納する。格納部11は、学習部10によって生成された予測モデルを格納してもよいし、通信モジュール104を介して格納部11が他の装置から取得した予測モデルを格納してもよいし、入出力装置103を介してNASH予測装置1のユーザから入力された予測モデルを格納してもよい。その他、格納部11は、NASH予測装置1の処理などで利用又は出力される任意の情報を格納する。格納部11は、NASH予測装置1の各機能にて算出される情報を格納してもよい。格納部11によって格納された情報は、NASH予測装置1の各機能によって適宜参照されてもよい。
【0034】
取得部12は、細胞、組織又は血液から構成される試料の一部についてラマン分光法により得られるラマンシフトに関する試料情報を取得する。取得部12は、通信モジュール104を介して他の装置から試料情報を取得してもよいし、入出力装置103を介してNASH予測装置1のユーザから入力された試料情報を取得してもよいし、格納部11によって予め格納された試料情報を取得してもよい。取得部12は、取得した試料情報を予測部13に出力する。
【0035】
予測部13は、取得部12によって取得(出力)された試料情報を格納部11によって格納された予測モデルに適用することで、試料の一部のNASH度を予測する。上述の通り、予測モデルは、任意の細胞、組織又は血液の一部についてラマン分光法により得られるラマンシフトに関する予測元情報に基づいて、当該細胞、組織又は血液の一部がNASHと化学環境が似ている度合であるNASH度を予測するため、予測モデルに細胞、組織又は血液から構成される試料の一部の試料情報を適用することで、当該試料の一部のNASH度を予測することができる。
【0036】
予測部13は、予測したNASH度又はNASH度に基づく情報を出力してもよい。例えば、予測部13は、通信モジュール104を介して他の装置へ送信してもよいし、入出力装置103を介してNASH予測装置1のユーザに表示又は音声出力してもよいし、格納部11によって格納させてもよい。NASH度に基づく情報とは、例えば、NASHであるか否か、NASHである確率、NASHと化学環境が同じ領域が存在する割合などであるが、これらに限るものではない。
【0037】
図3は、NASH予測装置1が実行する処理(NASH予測方法)の一例を示すフローチャートである。まず、学習部10が、予測モデルを生成する(ステップS1、学習ステップ)。次に、格納部11が、S1にて生成された予測モデルを格納する(ステップS2、格納ステップ)。次に、取得部12が、細胞、組織又は血液から構成される試料の一部についてラマン分光法により得られるラマンシフトに関する試料情報を取得する(ステップS3、取得ステップ)。次に、予測部13が、S3にて取得した試料情報をS2にて格納された予測モデルに適用することで、試料の一部のNASH度を予測する(ステップS4、予測ステップ)。なお、S1は無くて、S2では別の手段で取得した予測モデルを格納してもよい。また、S2は無くて、S4では別の手段で取得した予測モデルに適用してもよい。また、S3は、S1の前に行ってもよいし、S2の前に行ってもよい。
【0038】
続いて、NASH予測装置1による一連の処理をコンピュータに実行させるためのNASH予測プログラム300を説明する。NASH予測プログラム300は、
図4に示すように、コンピュータに挿入されてアクセスされる、又は、コンピュータが備える記憶媒体200に形成されたプログラム格納領域201内に格納される。より具体的には、NASH予測プログラム300は、NASH予測装置1が備える記憶媒体200に形成されたプログラム格納領域201内に格納される。
【0039】
NASH予測プログラム300は、学習モジュール301、格納モジュール302、取得モジュール303、及び、予測モジュール304を備えて構成される。学習モジュール301、格納モジュール302、取得モジュール303、及び、予測モジュール304を実行させることにより実現される機能は、上述したNASH予測装置1の学習部10、格納部11、取得部12、及び、予測部13の機能とそれぞれ同様である。
【0040】
NASH予測プログラム300は、NASH予測装置1(の一つ以上のCPU)を、細胞、組織又は血液の一部についてラマン分光法により得られるラマンシフトに関する細胞情報に基づいて、細胞、組織又は血液の一部がNASHと化学環境が似ている度合であるNASH度を予測する予測モデルを格納する格納部11、細胞、組織又は血液から構成される試料の一部についてラマン分光法により得られるラマンシフトに関する試料情報を取得する取得部12、取得部12によって取得された試料情報を格納部11によって格納された予測モデルに適用することで、試料の一部のNASH度を予測する予測部13、として機能させるためのプログラムである。
【0041】
なお、NASH予測プログラム300は、その一部若しくは全部が、通信回線等の伝送媒体を介して伝送され、他の機器により受信されて記憶(インストールを含む)される構成としてもよい。また、NASH予測プログラム300の各モジュールは、1つのコンピュータでなく、複数のコンピュータのいずれかにインストールされてもよい。その場合、当該複数のコンピュータによるコンピュータシステムよって上述したNASH予測プログラム300の一連の処理が行われる。
【0042】
以下では、予測モデルの一実施例として、ランダムフォーレストを採用する場合の処理について説明する。なお、予測モデルは、ランダムフォーレストに限らず、例えば、深層学習などの機械学習に基づく学習済みモデル又は統計回帰モデルなどであってもよい。
【0043】
図5は、単一決定木の概略を示すフローチャートである。ラベル付けされたラマンスペクトルデータ母集団からブートストラップサンプリングした後、入力スペクトルの集合(「開始」以外はその部分集合)に対して、各決定ノードにおける条件選択を経て2つの部分集合にそれぞれ分割し、決定木は次の決定ノードに進む。部分集合の2分割は、すべてのノードが終端するまで継続され、含まれるスペクトルは単一クラス(NASHかNASHでないか)のみとなるまで続ける。
【0044】
図6は、決定ノード内で起こる処理の概略を示すフローチャートである。初めにN個の波数全体から
【数1】
個の波数の部分集合をランダムに選ぶ(
【数2】
は経験的に一般に用いられている)。前提として、開始ノードには、スペクトルの集合が付与されていて、その中でどのスペクトルがNASHかNASHではないかがラベルづけされており、ジニ係数
【数3】
(p
iはそのノードに含まれるラベルiの帰属確率)が各ノードに対して付与される。ジニ係数が小さいほどラベルづけされたものがラベル毎により分割されることに対応する。考え方として、
【数4】
個の波数候補のうち、ある波数のラマンシフト値がある閾値以下であれば、サブセット2、そうでなければサブセット1へ2分割することを考える。どの波数を選択するかは、2分割された各ノードのジニ係数g
iの加重平均n
1g
1+n
2g
2(n
iは分割後の各ノードのスペクトル数)が一番小さくなる波数と閾値を選択する。これを繰り返すことで、できるだけラベル毎に分割されるように
【数5】
個の波数の条件を設定し(1つの木の中で同じ波数を複数回選択することも可能)、最終的には単一クラスのラベルを含む部分集合の終端ノードに繋がるまで実行する。
【0045】
図7は、NASHインデックス(NASH度)計算処理の一例を示すフローチャートである。予め病理組織学的にNASHである又はNASHではない(Normal(正常))と判定された2つの訓練用ラマン画像グループに対して、100個の決定木から構成される上述のランダムフォレストを構築する。このとき、使用するラマンシフトは、脂質含有を定量するCH領域の入力スペクトルを用いる。NAFLはNASH様の群とNormal様の群に大別されることを発明者らが見出しているので、訓練用ラマン画像データではNASHでないものとして扱う。構築されたランダムフォレストに対して、任意のラマン画像上の各ピクセル上のCH領域のラマンスペクトルを用いて、各ピクセル上のNASHインデックスηの計算を次のように進める:
1.初期化する(η=0など)。
2.個々の決定木において次の2-1及び2-2の手順を行う:
2-1.個々の決定木を使用して、入力スペクトルに対してNASHである又はNASHではないと分類する。
2-2.決定木によって入力スペクトルがNASHであると分類されている場合は、NASHインデックスを増やす(η=η+1)。
3.全ての個々のツリーで入力スペクトルを分類後に終了する。
4.ηを比率に再スケーリングする(η=η/100)。
【0046】
続いて、NASH予測装置1及びNASH予測方法の作用効果について説明する。
【0047】
NASH予測装置1及びNASH予測方法によれば、細胞、組織又は血液の一部についてラマン分光法により得られるラマンシフトに関する予測元情報に基づいて、細胞、組織又は血液の一部がNASHと化学環境が似ている度合であるNASH度を予測する予測モデルが格納部11によって格納され、細胞、組織又は血液から構成される試料の一部についてラマン分光法により得られるラマンシフトに関する試料情報が取得部12によって取得され、取得部12によって取得された試料情報を格納部11によって格納された予測モデルに適用することで、試料の一部のNASH度が予測部13によって予測される。このような側面においては、試料の一部についてラマン分光法により得られるラマンシフトに関する試料情報が予測モデルに適用されることで、試料の一部がNASHと化学環境が似ている度合であるNASH度が予測される。これにより、ラマン分光法を用いてNASHに関する予測を行うことができる。
【0048】
また、NASH予測装置1及びNASH予測方法において、予測モデルは、予測元情報に対してNASHである又はNASHではないと対応付けられた学習データに基づいて学習されていてもよい。このような側面においては、例えば、細胞、組織又は血液の一部について医師がNASHである又はNASHではないと予め判定した結果を用いた学習データに基づいて予測モデルを学習させることができる。それにより、より簡易に用意できる学習データを利用することができると共に、より汎用な予測を行う予測モデルを利用することができる。
【0049】
また、NASH予測装置1及びNASH予測方法において、予測モデルは、病理組織学的にNAFLと判定される細胞、組織又は血液の一部を除く学習データに基づいて学習されていてもよい。NAFLDに関する判定を行った場合、正常である、NAFLである、又は、NASHである、の3パターンに主に判定される場合がある。上記側面においては、病理組織学的にNAFLと判定される細胞、組織又は血液の一部を除く学習データに基づいて予測モデルを学習させるため、例えば、正常であるかNASHであるかの2パターンに判定される学習データに基づいて予測モデルを学習させる。これにより、NASHと化学環境が似ている度合であるNASH度をより汎用に予測する予測モデルを利用することができる。
【0050】
また、NASH予測装置1及びNASH予測方法において、予測モデルは、病理組織学的にNASHと判定されるデータに加えて、病理組織学的に正常と判定されるデータ、病理組織学的にNAFLと判定される細胞、組織又は血液の一部のうち、化学的にはNASHであると判定される細胞、組織又は血液の一部の予測元情報に対してNASHであると対応付けられた学習データ、及び、化学的にはNASHではないと判定される細胞、組織又は血液の一部の予測元情報に対してNASHではないと対応付けられた学習データ、の少なくとも一つに基づいて学習されていてもよい。このような側面においては、病理組織学的にNAFLと判定される細胞、組織又は血液の一部であっても、化学的にはNASHであると判定される細胞、組織又は血液の一部の予測元情報に対してNASHであると対応付けられた学習データ、及び、化学的にはNASHではないと判定される細胞、組織又は血液の一部の予測元情報に対してNASHではないと対応付けられた学習データ、の少なくとも一つに基づいて予測モデルを学習させることができる。それにより、NASHと化学環境が似ている度合であるNASH度をより汎用に予測する予測モデルを利用することができる。
【0051】
また、NASH予測装置1及びNASH予測方法において、ラマンシフトは、高波数領域、脂肪含有を定量する領域、CH領域、低波数領域、又は、高波数領域及び低波数領域の両方、の何れかのラマンシフトであってもよい。このような側面においては、例えば、全波数領域を計測するラマン分光法ではなく、特定の領域のみを計測するラマン分光法を利用できるため、用いるラマン分光法のバリエーションが増える。
【0052】
NASH予測装置1によれば、例えば、NAFLDモデルにおいて、肝組織内の生化学的に異なる領域に基づいて、通常の病理組織診断では判別不可能な組織の微小化学環境を捉えることができる。
【0053】
NASHは、進展すると肝線維化を生じ、肝硬変や肝癌を発症する。従来、NAFLはほとんど病態が進行しないと考えられていたが、NAFLをNASHと明確に鑑別できない症例、及び、NAFLからNASHに進展する症例が存在することが明らかとなった。現在、NAFL及びNASHの診断はヘマトキシリン・エオジン染色標本を用いた肝生検組織診断が黄金律(ゴールドスタンダード)であるが、本法は医師の経験が重要で、原理的に主観的判断が存在する。また、病理形態学的変化が比較的乏しい場合には、NAFLからNASHへ進行しやすいNASHの前駆状態が存在しても予測することはできない。NASH予測装置1によれば、ラマン分光法により得られるラマンシフトに基づいた予測を行うことで、微小化学環境の差異に基づいた、より高精度なNASH度を予測することができる。
【0054】
NASH予測装置1によれば、医師にNAFLと判定されている試料についても、化学的にはNASHを示す部位を特定することができる。
【0055】
従来は、医師が病理組織学的な診断を行うことで、組織単位(ラマン画像単位)でNASHか否かを診断していた。NASH予測装置1によれば、任意のラマン画像(試料)について、NASHと組織内化学環境がどれくらい似ているかをラマン画像の画像レベル又はピクセル単位で定量・出力することができる。例えば、NASH予測装置1によれば、ラマン画像の10000ピクセル中の数ピクセルで定量・出力すること、すなわちNASHに関する予測が可能である。一方、例えば上記特許文献1に記載の発明など、試料をすりつぶして計測するとした場合、それだけ濃度が薄まるので検出感度が弱くなる。
【符号の説明】
【0056】
1…NASH予測装置、10…学習部、11…格納部、12…取得部、13…予測部、100…CPU、101…RAM、102…ROM、103…入出力装置、104…通信モジュール、105…補助記憶装置、200…記憶媒体、201…プログラム格納領域、300…NASH予測プログラム、301…学習モジュール、302…格納モジュール、303…取得モジュール、304…予測モジュール。