(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-01-07
(45)【発行日】2025-01-16
(54)【発明の名称】ベクトル場情報生成装置、状態判定支援システム、状態予測システム、ベクトル場情報生成方法およびプログラム
(51)【国際特許分類】
G16B 40/00 20190101AFI20250108BHJP
C12Q 1/68 20180101ALI20250108BHJP
C12M 1/00 20060101ALI20250108BHJP
C12M 1/34 20060101ALI20250108BHJP
C12N 15/113 20100101ALN20250108BHJP
【FI】
G16B40/00
C12Q1/68
C12M1/00 A
C12M1/34 Z
C12N15/113 Z
(21)【出願番号】P 2020075692
(22)【出願日】2020-04-21
【審査請求日】2023-03-24
【国等の委託研究の成果に係る記載事項】(出願人による申告)令和1年度、国立研究開発法人新エネルギー・産業技術総合開発機構「次世代人工知能・ロボット中核技術開発/人工知能の信頼性に関する技術開発/生体データを用いて発がんリスクを説明できる“高信頼性進化的機械学習”の研究開発」委託研究、産業技術力強化法第17条の適用を受ける特許出願
(73)【特許権者】
【識別番号】504182255
【氏名又は名称】国立大学法人横浜国立大学
(73)【特許権者】
【識別番号】000001421
【氏名又は名称】キユーピー株式会社
(74)【代理人】
【識別番号】110001634
【氏名又は名称】弁理士法人志賀国際特許事務所
(72)【発明者】
【氏名】長尾 智晴
(72)【発明者】
【氏名】白川 真一
(72)【発明者】
【氏名】有井 栞
(72)【発明者】
【氏名】河野 純範
(72)【発明者】
【氏名】大塚 蔵嵩
(72)【発明者】
【氏名】栗城 大輔
【審査官】松野 広一
(56)【参考文献】
【文献】特表2012-506053(JP,A)
【文献】国際公開第2019/244949(WO,A1)
【文献】米国特許出願公開第2019/0220733(US,A1)
【文献】国際公開第2019/156254(WO,A1)
【文献】特表2011-523473(JP,A)
【文献】米国特許出願公開第2019/0221316(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G16B 5/00 -99/00
C12Q 1/68
C12M 1/00
C12M 1/34
C12N 15/113
(57)【特許請求の範囲】
【請求項1】
バイオマーカの種類毎にバイオマーカの量を示すバイオマーカ量データを取得するバイオマーカ量データ取得部と、
前記バイオマーカ量データの特徴量
として2次元以上の特徴量を抽出する特徴量抽出部と、
複数の人の前記特徴量の履歴情報に基づいて、
特徴量空間内の同一の点に複数の異なる変化量ベクトルを取得し、前記特徴量毎に前記特徴量の変化量を確率的に示すベクトル場情報を生成するベクトル場情報生成部と、
前記ベクトル場情報における特徴量空間の部分に、当該部分の状態を示す状態情報が付加された状態情報付ベクトル場情報
、かつ、1つの前記ベクトル場情報に複数種類のがんそれぞれの状態の前記状態情報が付加された状態情報付ベクトル場情報を生成する状態情報付加部と、
を備えるベクトル場情報生成装置。
【請求項2】
前記ベクトル場情報生成部は、前記特徴量毎に前記特徴量の変化速度を示すベクトル場を生成する、
請求項1に記載のベクトル場情報生成装置。
【請求項3】
前記状態情報付加部は、未病の状態を示す状態情報が付加された前記状態情報付ベクトル場情報を生成する、
請求項1または請求項2に記載のベクトル場情報生成装置。
【請求項4】
請求項1から
3の何れか一項に記載のベクトル場情報生成装置と、状態判定支援装置とを備え、
前記状態判定支援装置は、
対象者の前記バイオマーカ量データを取得する第二バイオマーカ量データ取得部と、
前記ベクトル場情報生成装置の特徴量抽出部と同様の特徴量抽出方法で、前記対象者の前記バイオマーカ量データの特徴量を抽出する第二特徴量抽出部と、
前記ベクトル場情報における特徴量空間での、前記対象者の前記バイオマーカ量データの特徴量の位置を示す状態判定支援処理部と、
を備える
状態判定支援システム。
【請求項5】
請求項1から
3の何れか一項に記載のベクトル場情報生成装置と、状態予測装置とを備え、
前記状態予測装置は、
対象者の前記バイオマーカ量データを取得する第二バイオマーカ量データ取得部と、
前記ベクトル場情報生成装置の特徴量抽出部と同様の特徴量抽出方法で、前記対象者の前記バイオマーカ量データの特徴量を抽出する第二特徴量抽出部と、
前記状態情報付ベクトル場情報から、前記対象者の前記バイオマーカ量データの特徴量に応じた特徴量の変化速度を読み取り、特徴量に変化速度を加算して単位期間経過後の特徴量の予測値を算出し、特徴量に応じた変化速度の読取、および、特徴量に変化速度を加算することによる単位期間経過後の特徴量の予測値の算出を、予測対象時期に至るまで繰り返して、前記対象者の状態を予測する状態予測部と、
を備える
状態予測システム。
【請求項6】
バイオマーカの種類毎にバイオマーカの量を示すバイオマーカ量データを取得する工程と、
前記バイオマーカ量データの特徴量
として2次元以上の特徴量を抽出する工程と、
複数の人の前記特徴量の履歴情報に基づいて、
特徴量空間内の同一の点に複数の異なる変化量ベクトルを取得し、前記特徴量毎に前記特徴量の変化量を確率的に示すベクトル場情報を生成する工程と、
前記ベクトル場情報における特徴量空間の部分に、当該部分の状態を示す状態情報が付加された状態情報付ベクトル場情報
、かつ、1つの前記ベクトル場情報に複数種類のがんそれぞれの状態の前記状態情報が付加された状態情報付ベクトル場情報を生成する工程と、
を含むベクトル場情報生成方法。
【請求項7】
コンピュータに、
バイオマーカの種類毎にバイオマーカの量を示すバイオマーカ量データを取得する工程と、
前記バイオマーカ量データの特徴量
として2次元以上の特徴量を抽出する工程と、
複数の人の前記特徴量の履歴情報に基づいて、
特徴量空間内の同一の点に複数の異なる変化量ベクトルを取得し、前記特徴量毎に前記特徴量の変化量を確率的に示すベクトル場情報を生成する工程と、
前記ベクトル場情報における特徴量空間の部分に、当該部分の状態を示す状態情報が付加された状態情報付ベクトル場情報
、かつ、1つの前記ベクトル場情報に複数種類のがんそれぞれの状態の前記状態情報が付加された状態情報付ベクトル場情報を生成する工程と、
を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ベクトル場情報生成装置、状態判定支援システム、状態予測システム、ベクトル場情報生成方法およびプログラムに関する。
【背景技術】
【0002】
マイクロRNAの発現量に基づいて、罹患の有無を判定する技術が提案されている。
例えば、特許文献1に記載の疾患の罹患判定装置は、マイクロRNAを含むバイオマーカそれぞれの発現量を含むサンプルデータを取得する。また、罹患判定装置は、複数の疾患のそれぞれについて罹患の有無を判定するための学習済モデルを備える。そして、罹患判定装置は、サンプルデータと学習済みモデルとを用いて複数の疾患について罹患しているか否かを判定する。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ある疾病について罹患し易さを判定するなど、疾患に罹患しているか否かだけでなく、対象者の状態をより詳細に判定できることが好ましい。
【0005】
本発明は、疾患に罹患しているか否かだけでなく、対象者の状態をより詳細に判定することを支援することができる、ベクトル場情報生成装置、状態判定支援システム、状態予測システム、ベクトル場情報生成方法およびプログラムを提供する。
【課題を解決するための手段】
【0006】
本発明の第1の態様によれば、ベクトル場情報生成装置は、バイオマーカの種類毎にバイオマーカの量を示すバイオマーカ量データを取得するバイオマーカ量データ取得部と、前記バイオマーカ量データの特徴量として2次元以上の特徴量を抽出する特徴量抽出部と、複数の人の前記特徴量の履歴情報に基づいて、特徴量空間内の同一の点に複数の異なる変化量ベクトルを取得し、前記特徴量毎に前記特徴量の変化量を確率的に示すベクトル場情報を生成するベクトル場情報生成部と、前記ベクトル場情報における特徴量空間の部分に、当該部分の状態を示す状態情報が付加された状態情報付ベクトル場情報、かつ、1つの前記ベクトル場情報に複数種類のがんそれぞれの状態の前記状態情報が付加された状態情報付ベクトル場情報を生成する状態情報付加部と、を備える。
前記ベクトル場情報生成部は、前記特徴量毎に前記特徴量の変化速度を示すベクトル場を生成するようにしてもよい。
前記状態情報付加部は、未病の状態を示す状態情報が付加された前記状態情報付ベクトル場情報を生成するようにしてもよい。
【0007】
前記特徴量抽出部は、想定される状態毎に1次元の前記特徴量を抽出し、前記ベクトル場情報生成部は、前記特徴量毎に前記ベクトル場情報を生成するようにしてもよい。
【0008】
前記特徴量抽出部は、2次元以上の前記特徴量を抽出し、前記状態情報付加部は、1つの前記ベクトル場情報に複数の状態の前記状態情報が付加された前記状態情報付ベクトル場情報を生成するようにしてもよい。
【0009】
本発明の第2の態様によれば、状態判定支援システムは、上記の何れかのベクトル場情報生成装置と、状態判定支援装置とを備え、前記状態判定支援装置は、対象者の前記バイオマーカ量データを取得する第二バイオマーカ量データ取得部と、前記ベクトル場情報生成装置の特徴量抽出部と同様の特徴量抽出方法で、前記対象者の前記バイオマーカ量データの特徴量を抽出する第二特徴量抽出部と、前記ベクトル場情報における特徴量空間での、前記対象者の前記バイオマーカ量データの特徴量の位置を示す状態判定支援処理部と、を備える。
【0011】
本発明の第3の態様によれば、状態予測システムは、上記の何れかのベクトル場情報生成装置と、状態予測装置とを備え、前記状態予測装置は、対象者の前記バイオマーカ量データを取得する第二バイオマーカ量データ取得部と、前記ベクトル場情報生成装置の特徴量抽出部と同様の特徴量抽出方法で、前記対象者の前記バイオマーカ量データの特徴量を抽出する第二特徴量抽出部と、前記状態情報付ベクトル場情報から、前記対象者の前記バイオマーカ量データの特徴量に応じた特徴量の変化速度を読み取り、特徴量に変化速度を加算して単位期間経過後の特徴量の予測値を算出し、特徴量に応じた変化速度の読取、および、特徴量に変化速度を加算することによる単位期間経過後の特徴量の予測値の算出を、予測対象時期に至るまで繰り返して、前記対象者の状態を予測する状態予測部と、を備える。
【0013】
本発明の第4の態様によれば、ベクトル場情報生成方法は、バイオマーカの種類毎にバイオマーカの量を示すバイオマーカ量データを取得する工程と、前記バイオマーカ量データの特徴量として2次元以上の特徴量を抽出する工程と、複数の人の前記特徴量の履歴情報に基づいて、特徴量空間内の同一の点に複数の異なる変化量ベクトルを取得し、前記特徴量毎に前記特徴量の変化量を確率的に示すベクトル場情報を生成する工程と、前記ベクトル場情報における特徴量空間の部分に、当該部分の状態を示す状態情報が付加された状態情報付ベクトル場情報、かつ、1つの前記ベクトル場情報に複数種類のがんそれぞれの状態の前記状態情報が付加された状態情報付ベクトル場情報を生成する工程と、を含む。
【0014】
本発明の第5の態様によれば、プログラムは、コンピュータに、バイオマーカの種類毎にバイオマーカの量を示すバイオマーカ量データを取得する工程と、前記バイオマーカ量データの特徴量として2次元以上の特徴量を抽出する工程と、複数の人の前記特徴量の履歴情報に基づいて、特徴量空間内の同一の点に複数の異なる変化量ベクトルを取得し、前記特徴量毎に前記特徴量の変化量を確率的に示すベクトル場情報を生成する工程と、前記ベクトル場情報における特徴量空間の部分に、当該部分の状態を示す状態情報が付加された状態情報付ベクトル場情報、かつ、1つの前記ベクトル場情報に複数種類のがんそれぞれの状態の前記状態情報が付加された状態情報付ベクトル場情報を生成する工程と、を実行させるためのプログラムである。
【発明の効果】
【0015】
本発明によれば、疾患に罹患しているか否かだけでなく、対象者の状態をより詳細に判定することを支援することができる。
【図面の簡単な説明】
【0016】
【
図1】実施形態に係る状態判定支援システムの装置構成の例を示す構成図である。
【
図2】実施形態に係る状態予測システムの装置構成の例を示す構成図である。
【
図3】実施形態に係るベクトル場情報生成装置の機能構成の例を示す概略ブロック図である。
【
図4】実施形態に係るベクトル場情報生成装置にGCMを適用する場合の、GCMの処理の構成例を示す図である。
【
図5】実施形態に係る状態判定支援装置の機能構成の例を示す概略ブロック図である。
【
図6】実施形態に係る状態判定支援装置による1次元の状態情報付ベクトル場情報の表示例を示す図である。
【
図7】実施形態に係る状態判定支援装置による2次元の状態情報付ベクトル場情報の表示例を示す図である。
【
図8】実施形態に係る状態判定支援装置による3次元の状態情報付ベクトル場情報の表示例を示す図である。
【
図9】実施形態に係るベクトル場情報生成部が算出する特徴量の変化ベクトルの例を示す図である。
【
図10】実施形態に係るベクトル場情報生成部による特徴量の変化ベクトルの補間例を示す図である。
【
図11】実施形態に係るベクトル場情報生成部がベクトル場情報に変化ベクトルを補間する処理手順の例を示すフローチャートである。
【
図12】実施形態に係る特徴量空間への特徴量のプロットの例を示す図である。
【
図13】実施形態に係るベクトル場情報の表示例を示す図である。
【
図14】実施形態に係る特徴量の遷移の例を示す図である。
【
図15】実施形態に係るベクトル場情報生成装置が、マイクロRNAの発現量データの特徴量の履歴情報を生成し更新する処理手順の例を示すフローチャートである。
【
図16】実施形態に係るベクトル場情報生成装置が、状態情報付ベクトル場情報を生成する処理手順の例を示すフローチャートである。
【
図17】実施形態に係る状態判定支援装置が、対象者の特徴量を状態情報付ベクトル場情報の特徴量空間にプロットする処理手順の例を示すフローチャートである。
【
図18】実施形態に係る状態予測装置の機能構成の例を示す概略ブロック図である。
【
図19】実施形態に係る状態予測装置による1次元の状態情報付ベクトル場情報の表示例を示す図である。
【
図20】実施形態に係る状態予測装置による2次元の状態情報付ベクトル場情報の表示例を示す図である。
【
図21】実施形態に係る状態予測装置による3次元の状態情報付ベクトル場情報の表示例を示す図である。
【
図22】実施形態に係る状態予測装置が、対象者の状態を予測する処理手順の例を示すフローチャートである。
【
図23】少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
【発明を実施するための形態】
【0017】
以下、本発明の実施形態を説明するが、以下の実施形態は請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
図1は、実施形態に係る状態判定支援システムの装置構成の例を示す構成図である。
図1に示す構成で、状態判定支援システム100は、ベクトル場情報生成装置200と、状態判定支援装置300とを備える。
【0018】
状態判定支援システム100は、バイオマーカに基づいて状態判定対象者の状態の判定を支援するための情報を生成し提示する。状態判定対象者を、単に対象者とも称する。
以下では、判定対象の状態(状態判定支援システム100が判定を支援する対象の状態)が、健康な状態(健常状態)、ある病気の状態、または、ある病気の未病の状態といった健康状態である場合を例に説明する。ただし、状態判定支援システム100が判定を支援する対象の状態は、健康状態に限定されない。状態判定支援システム100は、バイオマーカ―の測定データから抽出される特徴量と相関性のあるいろいろな状態の判定を支援することができる。
【0019】
以下では、バイオマーカとしてマイクロRNA(miRNA)を用いる場合を例に説明する。ただし、状態判定支援システム100が用いるバイオマーカは特定のものに限定されず、判定対象の状態と相関性のあるいろいろなバイオマーカを用いることができる。
マイクロRNAの発現量は、マイクロRNAの被採取者の状態を示す指標値として用いられる。このことから、マイクロRNAの発現量の特徴量は、マイクロRNAの被採取者の状態の特徴量でもある。マイクロRNAの被採取者を、単に被採取者とも称する。ある人(被採取者または対象者)のマイクロRNAの発現量の特徴量を、その人の特徴量とも称する。
【0020】
ベクトル場情報生成装置200は、マイクロRNAの発現量の測定データに基づいて、状態情報付ベクトル場情報を生成する。
ここでいうベクトル場情報は、マイクロRNAの発現量に関する特徴量と、その特徴量の変化との関係を示す情報である。具体的には、ベクトル場情報は、特徴量空間(特徴量がとり得る値のなす空間)における、特徴量の変化量ベクトル(変化量を示すベクトル)の分布を示すベクトル場を示す情報である。特徴量の変化量ベクトルを、単に変化量ベクトルとも称する。
【0021】
ここでいう状態情報付ベクトル場情報は、ベクトル場情報に、所定の健康状態を示す状態情報がさらに付加された情報である。具体的には、状態情報付ベクトル場情報では、ベクトル場情報における特徴量空間の部分(特徴量空間のうちの一部)に、その部分の健康状態を示す状態情報が付加されている。
ここでの特徴量空間の部分は、点(ある座標)であってもよい。例えば、特徴量空間内のある点に、「〇〇がん罹患の1年前の特徴量の例」といった状態情報が付加されていてもよい。
あるいは、ここでの特徴量空間の部分は、特徴量空間の部分領域であってもよい。この場合の状態情報が示す健康状態は、健康な状態、ある病気の状態、またはある病気の未病の状態であってもよいが、これらに限定されない。状態情報付ベクトル場情報の特徴量空間の部分への状態情報の付加を、状態のラベル付け(ラベリング)とも称する。
【0022】
状態情報の表現方法は、特定の方法に限定されない。例えば、状態情報が文言、色、図名の何れか、あるいはこれらの組み合わせで示されていてもよい。
例えば、特徴量空間内の点に対して状態情報が付加される場合に、Aがんの場合の特徴量の例を示す点が青で示され、Bがんの場合の特徴量の例を示す点が緑で示されるというように、状態情報が、その点(プロット)の色で示されていてもよい。この場合、例えば青の点が特徴量空間内の一部にまとまってプロットされることで、青の点の集まりの付近では、Aがんである可能性が高いことを示すことができる。
また、Aがんの場合の特徴量の例を示す点が丸(〇)で示され、Bがんの場合の特徴量を示す点が四角(□)で示されるなど、状態情報が、点(プロット)の色に加えて、あるいは代えて、プロットの図形で示されていてもよい。
【0023】
変化量ベクトルによって、少なくとも変化の向きが示される。特徴量空間が1次元の場合、変化量ベクトルによって特徴量が増加するか減少するかが示される。特徴量空間が2次元以上の場合、変化量ベクトルによって各特徴量(特徴量空間の座標軸毎の特徴量)の変化の割合が示される。
【0024】
状態判定支援システム100によれば、変化量ベクトルの向きを参照して、対象者の健康状態の変化の傾向を判定することができる。例えば、対象者のマイクロRNAの発現量の測定データから抽出される特徴量を、ベクトル場情報生成装置200が生成する状態情報付ベクトル場情報における特徴量空間にプロットする。この特徴量がプロットされた状態情報付ベクトル場情報を用いて、対象者の状態は、例えば、プロットされた点から変化量ベクトルを辿って到達する領域の状態(その領域の状態情報が示す状態)に比較的なり易い状態であると判定することができる。
対象者の特徴量のプロットから1つの変化量ベクトルを辿ってある領域に到達してもよいし、対象者の特徴量のプロットから2つ以上の変化量ベクトルを辿ってある領域に到達してもよい。
【0025】
例えば、状態情報付ベクトル場情報における特徴量空間内に、Aがん(癌)の状態、Bがんの状態、・・・といったがんの種類毎の領域が設定されている場合を考える。例えば、対象者の特徴量のプロットから変化量ベクトルを辿ってAがんの状態の領域に到達する場合、対象者は比較的Aがんになり易い状態にあると判定することができる。対象者は、この判定結果に基づいて、Aがんにならないための対策を講じることができる。
あるいは、対象者の特徴量のプロットがある領域に含まれる場合、対象者の状態は、その領域の状態であると判定できる。
【0026】
あるいは、特徴量空間内の点に状態情報が付加されている場合、対象者の状態が、対象者の特徴量のプロットの近傍の点に付加されている状態情報が示す状態に近い状態であると判定するようにしてもよい。
ベクトル場情報生成装置200は、例えばパソコン(Personal Computer;PC)またはワークステーション(Workstation)等のコンピュータを用いて構成される。
【0027】
状態判定支援装置300は、状態情報付ベクトル場情報における特徴量空間での、対象者の特徴量の位置を示す。具体的には、状態判定支援装置300は、対象者のマイクロRNAの発現量の測定データを取得して、特徴量(マイクロRNAの発現量の特徴量)を抽出(算出)する。そして、状態判定支援装置300は、対象者のマイクロRNAの発現量の測定データから抽出される特徴量を、ベクトル場情報生成装置200が生成する状態情報付ベクトル場情報における特徴量空間にプロットする。
【0028】
これにより、状態判定支援装置300は、対象者の状態の判定を支援する。上述したように、対象者の特徴量のプロットから変化量ベクトルを辿ることで、対象者の状態の変化の傾向を推定することができる。
状態判定支援装置300は、例えばパソコン(Personal Computer;PC)またはワークステーション(Workstation)等のコンピュータを用いて構成される。
【0029】
ベクトル場情報生成装置200と状態判定支援装置300とが1つの装置として構成されていてもよい。特に、ベクトル場情報生成装置200が状態情報付ベクトル場情報の生成または更新を頻繁に行う場合、ベクトル場情報生成装置200と状態判定支援装置300とを一体化して、マイクロRNAの発現量の履歴情報などのデータを共用し、また、マイクロRNAの発現量の特徴量を抽出機能などの機能も共用することで、状態判定支援システム100のコンパクト化を図ることができる。
一方、状態情報付ベクトル場情報が確定し更新の必要がない場合、状態判定支援装置300をベクトル場情報生成装置200とは別の装置として構成することで、状態判定支援装置300のコンパクト化を図ることができる。
【0030】
状態情報付ベクトル場情報を用いた状態判定として状態予測を行うようにしてもよい。
図2は、実施形態に係る状態予測装置システムの装置構成の例を示す構成図である。
図2に示す構成で、状態予測システム100bは、ベクトル場情報生成装置200と、状態予測装置300bとを備える。
【0031】
状態予測装置300bは、状態判定の支援として状態予測を行う。それ以外の点では、状態予測システム100bは、状態判定支援システム100と同様である。
ベクトル場情報が、特徴量(の値)毎に、単位期間(単位時間)当たりの特徴量の変化量を示す情報であってもよい。この場合のベクトル場を速度場とも称し、この場合のベクトル場情報を速度場情報とも称する。また、この場合の状態情報付ベクトル場情報を状態情報付速度場情報とも称する。単位期間(例えば、1年)当たりの特徴量の変化量を、特徴量の変化速度とも称する。特徴量の変化速度は、特徴量空間の座標系のベクトルで示される。特徴量の変化速度のベクトルを、変化速度ベクトル、または、速度ベクトルとも称する。
【0032】
ベクトル場が速度場として構成されていることで、対象者の特徴量のプロットから変化量ベクトルを1つ辿った先の点は、単位期間経過後の対象者の特徴量の予測値を示す。さらに、特徴慮ベクトルを辿った先の点は、さらに単位期間経過後の対象者の特徴量の予測値を示す。そして、予測値が含まれる領域に付されている状態情報によって、対象者の状態の予測が示される。
【0033】
例えば、特徴量空間内に、Aがん(癌)の状態、Bがんの状態、・・・といったがんの種類毎の領域が設定されている場合を考える。例えば、特徴量の予測値がAがんの状態の領域に含まれる場合、対象者が予測対象の時期(単位期間に、辿った変化量ベクトルの個数を乗算した期間経過後)に、Aがんになっているとの予測が示される。対象者は、この予測を受けて、将来Aがんにならないための対策を講じることができる。
【0034】
図3は、ベクトル場情報生成装置200の機能構成の例を示す概略ブロック図である。
図3に示す構成で、ベクトル場情報生成装置200は、第一通信部210と、第一表示部220と、第一操作入力部230と、第一記憶部270と、第一制御部280とを備える。第一制御部280は、第一発現量データ取得部281と、第一特徴量抽出部282と、クラス分類部283と、機械学習制御部284と、履歴情報登録部285と、ベクトル場情報生成部286と、状態情報付加部287とを備える。
【0035】
第一通信部210は、他の装置と通信を行う。例えば、第一通信部210は、マイクロRNAの解析システムからの、マイクロRNAの発現量の測定データを受信する。また、第一通信部210は、状態判定支援装置300と通信を行って、状態情報付ベクトル場情報を送信する。
第一表示部220は、例えば液晶パネルまたはLED(Light Emitting Diode、発光ダイオード)パネル等の表示画面を備え、各種画像を表示する。例えば、第一表示部220は、ベクトル場情報生成装置200が生成した状態情報付ベクトル場情報を表示する。また、第一表示部220は、ベクトル場情報生成装置200のユーザが、マイクロRNAの発現量の測定データの取得の指示や、状態情報付ベクトル場情報の生成の指示など、各種指示を行うための操作画面を表示する。
第一操作入力部230は、例えばキーボードおよびマウス等の入力デバイスを備え、ユーザ操作を受け付ける。例えば、第一操作入力部230は、マイクロRNAの発現量の測定データの取得の指示や、状態情報付ベクトル場情報の生成の指示などのユーザ操作を受け付ける。
【0036】
第一記憶部270は、各種データを記憶する。例えば、第一記憶部270は、マイクロRNAの発現量の測定データの履歴情報を、被採取者毎に記憶する。また、第一記憶部270は、マイクロRNAの発現量の測定データから抽出される特徴量の履歴情報を、被採取者毎に記憶する。あるいは、第一記憶部270が、マイクロRNAの発現量の測定データの履歴情報、または、特徴量の履歴情報の何れか一方のみを記憶するようにしてもよい。
また、第一記憶部270は、状態情報付ベクトル場情報を記憶する。
第一記憶部270は、ベクトル場情報生成装置200が備える記憶デバイスを用いて構成される。
【0037】
第一制御部280は、ベクトル場情報生成装置200の各部を制御して各種処理を行う。第一制御部280の機能は、例えば、ベクトル場情報生成装置200が備えるCPU(Central Processing Unit、中央処理装置)が、第一記憶部270からプログラムを読み出して実行することで実行される。
第一発現量データ取得部281は、マイクロRNAの発現量の測定データを発現量データに纏める。ここでいう発現量データは、マイクロRNAの種類毎に発現量を示すデータである。例えば、ヒトのマイクロRNAの種類は約2500種類以上あるといわれており、2500種類のマイクロRNAについて発現量を解析した場合、発現量データは、2500次元ベクトルのデータで表される。
【0038】
発現量データは、バイオマーカ量データの例に該当する。バイオマーカ量データは、バイオマーカの種類毎にバイオマーカの量を示すデータである。
第一発現量データ取得部281は、第一バイオマーカ量データ取得部の例、および、バイオマーカ量データ取得部の例に該当する。
第一記憶部270が、マイクロRNAの発現量の測定データの履歴情報を、発現量データの履歴情報の形式で記憶するようにしてもよい。
【0039】
第一特徴量抽出部282は、発現量データの特徴量を抽出する。第一特徴量抽出部282は、特徴量抽出部の例に該当する。
第一特徴量抽出部282が、被採取者の状態毎(例えば、病名毎)に1次元の特徴量を抽出するようにしてもよい。あるいは、第一特徴量抽出部282が、2次元以上の特徴量を抽出するようにしてもよい。第一特徴量抽出部282が抽出する特徴量の次元は、状態情報付ベクトル場情報の次元となる。
【0040】
発現量データから特徴量を抽出する方法は、特定の方法に限定されない。例えば、主成分分析(Principal Component Analysis;PCA)、AE(Autoencoder、自己符号化器)またはVAE(Variational AE、バリエーショナルオートエンコーダ)などのニューラルネットワーク、あるいは、自己組織化マップ(Self Organizing Map;SOM)など公知の次元圧縮手法を用いるようにしてもよい。
【0041】
主成分分析では、例えば、多次元データ全体の重心からの分散が最大となる方向を第1主成分として算出し、第1主成分に直交する方向で分散が最大となる方向を第2主成分として算出することで、多次元データを2次元に圧縮できる。
第一特徴量抽出部282が主成分分析を用いる場合、発現量データの第1成分から第N(Nは正の整数)まで算出することで、発現量データをN次元に圧縮できる。
【0042】
AEは、入力データと同じデータを出力層から出力する恒等写像の階層型ニューラルネットワークをEncoderとDecoderで構成したモデルであり、中間層(潜在変数)に入力データの特徴量が現れると考えられる。
第一特徴量抽出部282がAEを用いる場合、中間層をN次元にすることで、発現量データをN次元に圧縮できる。
【0043】
VAEは、AEの中間層(潜在変数の部分)に確率分布を導入したモデルである。VAEでは、入力データをガウス分布で近似することで次元圧縮を行う。
第一特徴量抽出部282がVAEを用いる場合も、潜在変数をN次元にすることで、発現量データをN次元に圧縮できる。
【0044】
SOMは、高次元データを1次元または2次元などの低次元の空間に写像する。写像先の空間はSOMマップと呼ばれる。現空間(写像元の高次元データ)おいて距離が近いデータほどSOMマップ(写像先の低次元空間)でも近接するような写像をランダムな写像から作ることで、教師なしでクラスタリング(グループ分け)することができる。
第一特徴量抽出部282がSOMを用いる場合、SOMマップをN次元にすることで、発現量データをN次元に圧縮できる。
第一特徴量抽出部282が用いる特徴量抽出方法として、写像元(特徴量抽出への入力)の発現量データが連続である場合に、写像先(特徴量抽出の出力)の特徴量も連続となるいろいろな次元圧縮方法を用いることができる。
【0045】
図4は、ベクトル場情報生成装置200にGCMを適用する場合の、GCMの処理の構成例を示す図である。
図4の例で、GCM400の処理を実行する第一制御部280は、エンコーダ411と、第1クラスデコーダ412-1から第Nクラスデコーダ412-Nと、第1乗算器413-1から第N乗算器413-Nと、第1平均演算部414-1から第N平均演算部414-Nと、Argmax演算部415とを備える。ここでのNは、クラス分類におけるクラスの個数を示す正の整数である。
【0046】
第1クラスデコーダ412-1から第Nクラスデコーダ412-Nを総称してデコーダ412と表記する。第1乗算器413-1から第N乗算器413-Nを総称して乗算器413と表記する。第1平均演算部414-1から第N平均演算部414-Nを総称して平均演算部414と表記する。
【0047】
エンコーダ411は、発現量データの入力を受けて、入力されたデータの特徴量を抽出する。エンコーダ411は、第一特徴量抽出部282の例に該当する。
デコーダ412はクラス毎に設けられ、エンコーダ411が算出した特徴量を入力データと同じ次元のデータに再構成する。このデータは入力データ(発現量データ)の各部が注目クラスに関してどの程度そのクラスらしいかの重みを示す。
【0048】
乗算器413は、クラス毎に設けられ、デコーダ412が算出したデータを、入力データに乗算する。これにより、入力データを部分毎にクラス分類への寄与度に応じて重み付けしたデータを得られる。
【0049】
平均演算部414は、クラス毎に設けられ、クラス毎に、乗算器413が算出したデータの平均を算出する。平均演算部414が算出する平均値は、クラス分類における評価値(クラススコア)として用いられる。
Argmax演算部415は、平均演算部414がクラス毎に算出するクラススコアを比較し、クラススコアが最も大きいクラスを判定する。これによりArgmax演算部415は、入力データをクラスに分類する。
第1平均演算部414-1から第N平均演算部414-NおよびArgmax演算部415の組み合わせは、クラス分類部283例に該当する。
【0050】
機械学習制御部284は、第一制御部280の学習を制御する。例えば、第一特徴量抽出部282およびクラス分類部283がニューラルネットワークなどの計算モデルを用いて構成されていてもよい。そして、機械学習制御部284が、第一特徴量抽出部282およびクラス分類部283に学習を行わせて計算モデルのパラメータ値を決定するようにしてもよい。
【0051】
あるいは、第一制御部280が
図4に例示されるGCM400の処理を実行する場合、エンコーダ411およびデコーダ412がニューラルネットワークなどの計算モデルを用いて構成されていてもよい。そして、機械学習制御部284が、エンコーダ411およびデコーダ412に学習を行わせて計算モデルのパラメータ値を決定するようにしてもよい。
第一特徴量抽出部282およびクラス分類部283の学習に、公知の技術を用いることができる。
【0052】
履歴情報登録部285は、発現量データ、発現量データの特徴量、および、発現量データのクラス分類結果の履歴情報を、被採取者毎に第一記憶部270に記憶させる。
ベクトル場情報生成部286は、特徴量の履歴情報に基づいて、特徴量と特徴量の変化との関係を示すベクトル場情報を生成する。
【0053】
上述したように、ベクトル場情報は、特徴量空間における、特徴量の変化量ベクトルの分布を示すベクトル場を示す情報である。ベクトル場情報生成部286は、特徴量の履歴情報から同一の被採取者について特徴量の変化量(変化量ベクトル)を算出する。そして、ベクトル場情報生成部286は、算出した変化量を変化前のほうの特徴量に紐付けてベクトル場情報の特徴量空間にプロットする。具体的には、ベクトル場情報生成部286は、特徴量空間における変化前の特徴量の座標(変化前の特徴量の特徴量空間へのプロット)に、算出した変化量を示す変化量ベクトルを紐付ける。
【0054】
第一特徴量抽出部282が、被採取者の状態毎に1次元の特徴量を抽出する場合、ベクトル場情報生成部286は、特徴量毎に1次元のベクトル場情報を生成する。あるいは、第一特徴量抽出部282が、2次元以上の特徴量を抽出する場合、ベクトル場情報生成部286は、特徴量と同じ次元のベクトル場情報を生成する。
【0055】
状態情報付加部287は、状態情報付ベクトル場情報を生成する。上述したように、状態情報付ベクトル場情報は、ベクトル場情報生成部286が生成するベクトル場情報における特徴量空間の部分に、状態情報が付加された情報である。第一特徴量抽出部282が、2次元以上の特徴量を抽出する場合、状態情報付加部287が、1つのベクトル場情報に複数の状態の状態情報が付加された状態情報付ベクトル場情報を生成するようにしてもよい。
【0056】
図5は、状態判定支援装置300の機能構成の例を示す概略ブロック図である。
図5に示す構成で、状態判定支援装置300は、第二通信部310と、第二表示部320と、第二操作入力部330と、第二記憶部370と、第二制御部380とを備える。第二制御部380は、第二発現量データ取得部381と、第二特徴量抽出部382と、状態判定支援処理部383とを備える。
【0057】
第二通信部310は、他の装置と通信を行う。例えば、第二通信部310は、マイクロRNAの解析システムからの、対象者のマイクロRNAの発現量の測定データを受信する。また、第二通信部310は、ベクトル場情報生成装置200と通信を行って、状態情報付ベクトル場情報を受信する。
【0058】
また、第一操作入力部230の第一記憶部270が、対象者の発現量データの履歴情報を記憶している場合、第二通信部310が第一操作入力部230から対象者の発現量データの履歴情報を受信するようにしてもよい。この履歴情報を用いて、状態判定支援装置300が、対象者の現在の特徴量だけでなく、過去の特徴量も状態情報付ベクトル場情報上にプロットするようにしてもよい。
【0059】
第二表示部320は、例えば液晶パネルまたはLED(Light Emitting Diode、発光ダイオード)パネル等の表示画面を備え、各種画像を表示する。例えば、第二表示部320は、状態情報付ベクトル場情報に対象者の特徴量のプロットを含めて表示する。
第二操作入力部330は、例えばキーボードおよびマウス等の入力デバイスを備え、ユーザ操作を受け付ける。例えば、第二操作入力部330は、状態情報付ベクトル場情報に対象者の特徴量をプロットして表示するように指示するユーザ操作を受け付ける。
【0060】
第二記憶部370は、各種データを記憶する。例えば、第二記憶部370は、ベクトル場情報生成装置200から得られた状態情報付ベクトル場情報を記憶しておく。
また、第二記憶部370が、対象者のマイクロRNAの発現量の測定データの履歴情報を記憶するようにしてもよい。この履歴情報を用いて、状態判定支援装置300が、対象者の現在の特徴量だけでなく、過去の特徴量も状態情報付ベクトル場情報上にプロットするようにしてもよい。状態判定支援装置300が、複数の対象者それぞれの状態判定を支援する場合、第二記憶部370は、対象者毎に、マイクロRNAの発現量の測定データの履歴情報を記憶するようにしてもよい。
【0061】
第二制御部380は、状態判定支援装置300の各部を制御して各種処理を行う。第二制御部380の機能は、例えば、状態判定支援装置300が備えるCPUが、第二記憶部370からプログラムを読み出して実行することで実行される。
第二発現量データ取得部381は、対象者のマイクロRNAの発現量の測定データを発現量データに纏める。
第二発現量データ取得部381は、第二バイオマーカ量データ取得部の例、および、バイオマーカ量データ取得部の例に該当する。
【0062】
第二特徴量抽出部382は、第一特徴量抽出部282と同様の特徴量抽出方法で、対象者の発現量データの特徴量を抽出する。ベクトル場情報生成装置200が生成する状態情報付ベクトル場情報上にプロットするための特徴量を抽出するためである。
第二特徴量抽出部382は、特徴量抽出部の例に該当する。
状態判定支援処理部383は、状態情報付ベクトル場情報に、対象者の特徴量をプロットする。上記のように、状態判定支援処理部383が、状態情報付ベクトル場情報に、対象者の現在の特徴量に加えて対象者の過去の特徴量もプロットするようにしてもよい。
【0063】
図6は、状態判定支援装置300による1次元の状態情報付ベクトル場情報の表示例を示す図である。
図6の例では、特徴量空間が変数x
1の1次元座標空間で示されている。この1次元座標空間上に、「健康」の領域(健常状態の領域)、および、「〇〇がん」の領域(〇〇がんの状態の領域)が示されている。
【0064】
第二表示部320が、健常状態の領域と〇〇がんの状態の領域とに加えて、〇〇がんの未病の領域も明示するようにしてもよい。ここでいう未病(の状態)は、特定の疾病に関して、罹患はしていないが、何らかの自覚症状があるか、検査をすれば異常値を示す状態のことを指し、疾病の罹患リスクが高い状態をいう。例えば、脂肪肝は、脂肪肝という疾病に関しては罹患状態だが、肝臓がんという疾病に関しては未病状態に該当する。
【0065】
ベクトル場情報生成装置200のクラス分類部283が、特徴量をクラス分類する際に、健常状態のクラス、病気の状態のクラス(例えば、〇〇がんのクラス)に加えて、未病の状態のクラス(例えば、〇〇がんの未病のクラス)を設けておくことで、状態情報付ベクトル場情報に未病の領域を設定することができる。第二表示部320が、未病の領域も明示するようにしてもよい。
【0066】
また、
図6の例では、ベクトル場に対象者の特徴量がプロットされている。対象者の特徴量が「健康」と「〇〇がん」との間の領域にプロットされていることから、対象者は、〇〇がんに罹患してはいないが、健康な状態ともいえないと判定できる。さらに、対象者の特徴量のプロットから変化量ベクトルを辿ると「〇〇がん」の領域に到達することから、対象者は比較的〇〇がんになりやすい状態にあると判定できる。
【0067】
対象者は、この判定結果を参照して、〇〇がんに罹患しないように予防策を講じることができる。
状態判定支援装置300が、複数の種類のがんについて状態判定の支援を行うなど、判定対象の状態が複数ある場合、第二表示部320は、状態毎に、
図6に例示されるような1次元の状態情報付ベクトル場情報、および、対象者の特徴量の遷移のプロットを表示する。
【0068】
図7は、状態判定支援装置300による2次元の状態情報付ベクトル場情報の表示例を示す図である。
図7の例では、特徴量空間が変数x
1およびx
2の2次元直交座標空間で示されている。この2次元座標空間上に、「健康」の領域、および、「Aがん」から「Dがん」までの、それぞれの種類のがんの領域が示されている。
【0069】
図7の例でも、第二表示部320が、「健康」の領域と各がんの領域との間の領域に加えて、未病の領域も明示するようにしてもよい。その場合、第二表示部320が、がんの種類毎に、そのがんの未病の領域を明示するようにしてもよい。あるいは、第二表示部320が、各がんの種類の未病の領域を1つに纏めた領域を、未病の領域として明示するようにしてもよい。
【0070】
図7の例でも、ベクトル場に対象者の特徴量がプロットされている。対象者の特徴量が「健康」と各がんとの間の領域にプロットされていることから、対象者は、これらのがんに罹患してはいないが、健康な状態ともいえないと判定できる。さらに、対象者の特徴量のプロットから変化量ベクトルを辿ると「Cがん」の領域に到達することから、対象者は比較的Cがんになりやすい状態にあると判定できる。
対象者は、この判定結果を参照して、Cがんに罹患しないように予防策を講じることができる。
【0071】
図8は、状態判定支援装置300による3次元の状態情報付ベクトル場情報の表示例を示す図である。
図8の例では、特徴量空間が変数x
1、x
2およびx
3の3次元直交座標空間で示されている。この3次元座標空間上に、「健康」の領域、および、「Aがん」から「Dがん」までの、それぞれの種類のがんの領域が示されている。
【0072】
図8の例でも、第二表示部320が、未病の領域も明示するようにしてもよい。その場合、第二表示部320が、がんの種類毎に、そのがんの未病の領域を明示するようにしてもよい。あるいは、第二表示部320が、各がんの種類の未病の領域を1つに纏めた領域を、未病の領域として明示するようにしてもよい。
【0073】
図8の例でも、ベクトル場に対象者の特徴量がプロットされている。対象者の特徴量が「健康」と各がんとの間の領域にプロットされていることから、対象者は、これらのがんに罹患してはいないが、健康な状態ともいえないと判定できる。さらに、対象者の特徴量のプロットから変化量ベクトルを辿ると「Dがん」の領域に到達することから、対象者は比較的Dがんになりやすい状態にあると判定できる。
対象者は、この判定結果を参照して、Dがんに罹患しないように予防策を講じることができる。
【0074】
図9は、ベクトル場情報生成部286が算出する特徴量の変化量ベクトルの例を示す図である。
図9では、
図7の例の特徴量空間についてベクトル場情報生成部286が算出する特徴量の変化量ベクトルの例が示されている。ベクトル場情報生成部286は、上述したように、特徴量の履歴情報から同じ被採取者の特徴量の変化量を変化量ベクトルとして算出する。そして、ベクトル場情報生成部286は、算出した変化量を変化前のほうの特徴量に紐付けてベクトル場情報の特徴量空間にプロットする。
【0075】
複数の人のデータを集約する等により、特徴量空間内の同一点に複数の異なる実測ベクトル(実測値に基づく変化量ベクトル)が得られることが考えられる。この場合、ベクトル場情報生成部286が、得られた複数の実測ベクトルの平均ベクトルを求める等により、特徴量の変化量を一意に算出するようにしてもよい。あるいは、ベクトル場情報生成部286が、特徴量の変化量を確率的に算出するようにしてもよいし、例えば年代別など条件別に設定するようにしてもよい。
【0076】
ベクトル場情報生成部286が、特徴量の変化量を確率的に算出した場合、状態判定支援処理部383が、個々のケースにおける変化量を、乱数を用いて確率的に決定するようにしてもよいし、平均または期待値を算出するようにしてもよい。あるいは、第二表示部320が、複数通りの可能性を全て表示するようにしてもよい。
【0077】
図10は、ベクトル場情報生成部286による特徴量の変化量の補間例を示す図である。
図10では、
図9の例から変化量を補間する場合の例を示している。ベクトル場情報生成部286は、補間対象の点Pから最近傍の3点p
1、p
2およびp
3を検出して参照点(補間のために参照される点)に決定している。参照点は、実測点であることが好ましいが、補間点であってもよい。
【0078】
ここでいう実測点は、実測値による変化量ベクトルが紐付けられている点である。ここでいう実測値による変化量ベクトルは、ベクトル場情報生成部286が特徴量の履歴情報から算出した特徴量の変化量(変化量ベクトル)である。
ここでいう補間点は、ベクトル場情報生成部286が変化量ベクトルを補間した点(特徴量空間への特徴量のプロット)である。
【0079】
図11は、ベクトル場情報生成部286がベクトル場情報に変化量ベクトルを補間する処理手順の例を示すフローチャートである。
図11の処理で、ベクトル場情報生成部286は、参照点を決定する(ステップS1)。
ここでは、
図10の例と同様、特徴量空間が2次元である場合を例に説明する。補間対象の点Pの座標を(x
p,y
p)と表記し、点Pにおける変化量ベクトルv
pを(v
px,v
py)と表記する。
【0080】
また、ベクトル場情報生成部286は、補間対象の点Pから最近傍のN点(Nは、N≧2の整数)を検出し、参照点に設定するものとする。すなわち、ベクトル場情報生成部286は、変化量ベクトルが紐付けられている点のうち、補間対象の点Pから近い順にN個の点を参照点に決定する。
N個の参照点をp1、p2、・・・、pNとし、これらの参照点の座標をp1=(xp1,yp1)、p2=(xp2,yp2)、・・・、pN=(xpN,ypN)とする。また、参照点p1、p2、・・・、pNにおける変化量ベクトルを、それぞれ、vp1=(vxp1,vyp1)、vp2=(vxp2,vyp2)、・・・、vpN=(vxpN,vypN)とする。
【0081】
次に、ベクトル場情報生成部286は、補間対象の点Pから参照点p1、p2、・・・、pNの各々までの距離を算出する(ステップS2)。
補間対象の点Pから参照点p1、p2、・・・、pNのまでの距離を、それぞれd1、d2、・・・、dNとする。
【0082】
次にベクトル場情報生成部286は、参照点における変化量ベクトルおよび補間対象の点か参照点までの距離に基づいて、補間対象の点における変化量ベクトルを算出する(ステップS3)。
例えば、ベクトル場情報生成部286は、式(1)に基づいて、vpxを算出する。
【0083】
【0084】
また、ベクトル場情報生成部286は、式(2)に基づいて、vpyを算出する。
【0085】
【0086】
式(1)および(2)の例で、ベクトル場情報生成部286は、参照点における変化量ベクトルについて、補間対象の点から参照点までの距離に反比例する重みによる重み付け平均を算出している。これにより、ベクトル場情報生成部286は、補間対象の点に近い参照点ほど重みを重くして、補間対象の点における変化量ベクトルを算出する。
なお、式(1)および(2)の例では、特徴量空間が2次元である場合(特徴量の個数が2つの場合)の例を示している。特徴量空間が2次元以外の場合も、ベクトル場情報生成部286は、座標軸ごとに、式(1)および(2)の例と同様の重み付け平均を算出するようにすればよい。
【0087】
次に、ベクトル場情報生成部286は、算出した変化量ベクトルv
pを、ベクトル場情報の特徴量空間における補間対象の点Pの座標(x
p,y
p)に紐付ける(ステップS4)。
ステップS4の後、ベクトル場情報生成部286は、
図11の処理を終了する。
【0088】
このようにして、N個の参照点p
1、p
2、・・・、p
Nにおける変化量ベクトルに基づいて、ベクトル場情報の特徴量空間内の任意の点の変化量ベクトルを内挿するこができる。特徴量空間内の任意の点における変化量を決定することで、ベクトル場を得ることができる。
ただし、変化量の内挿方法は、上述した方法に限定されず、いろいろな方法を用いることができる。
また、
図10に示す四角形の特徴量空間の四隅については、特異点として変化量ベクトルをゼロベクトルとしてもよい。
【0089】
図12は、特徴量空間への特徴量のプロットの例を示す図である。
図12の例で、被採取者の状態毎(ここでは、がんの種類毎)におおよそ纏まって特徴量がプロットされている。このことから、
図9の例のように被採取者の状態毎の領域を設定でき、また、特徴量の変化量ベクトルがそれぞれ何れかの状態に向かってベクトル場を設定できると期待される。
第二表示部320が
図7または
図9の例のような状態情報付ベクトル場情報を表示したときにも、
図12を参照して説明したのと同様、被採取者の状態を示して特徴量のプロットを表示するようにしてもよい。このプロットを参照して、状態毎の領域が適切に設定されているか確認できる。
【0090】
図13は、ベクトル場情報の表示例を示す図である。
図13では、大腸がんに罹患した被採取者について、がんと診断される前1年以上2年未満の期間、がんと診断される前1年未満の期間、がんと診断されてから後、および、治療後の各時期における特徴量、および、患者ではない別の被採取者(健常者)の特徴量が、特徴量空間にプロットされている。
【0091】
また、
図13の例では、同一の被採取者の履歴情報(同一の被採取者についての、異なる時期におけるデータ)を用いて変化量ベクトルを算出し、特徴量空間に表示している。また、実測データから変化量ベクトルを得られなかった箇所について、実測データから得られた変化量ベクトルを用いて変化量ベクトルを補間している。
これにより、
図13に例示されるベクトル場が得られた。また、
図13の例で、健常状態(「健常者」)の特徴量、および、大腸がんの状態(「がん診断後」)の特徴量が、それぞれおおよそ纏まってプロットされており、状態毎の領域を設定し得る。
【0092】
図14は、特徴量の遷移の例を示す図である。
図14は、
図13の特徴量の例で、健常状態(「健常者」)の特徴量のプロットをおおよそ囲むように健常状態の領域を設定している。また、大腸がんの状態(「がん診断後」)の特徴量のプロットをおおよそ囲むように大腸がんの状態の領域を設定している。
また、同じ被採取者の特徴量を線で結び、健常状態から大腸がんの状態に至る場合の状態量の変化の例を矢印で示している。大腸がんの状態から回復する場合については、状態量の変化の例を点線の矢印で示している。
【0093】
大腸がんに罹患した被採取者の特徴量は、がんと診断される前1年以上2年未満の期間、がんと診断される前1年未満の期間のように、時間が進むにつれて次第に大腸がんの領域に近付いている。対象者についても、特徴量をプロットすることで、健常状態から大腸がんの状態までのおおよそどの段階か推定することができる。
【0094】
第二表示部320が、対象者の特徴量を状態情報付ベクトル場情報にプロットして表示する際に、
図14に矢印で例示されるように、健常状態から病気の状態に至る経路の例も表示するようにしてもよい。対象者の特徴量が、例示される経路のうちどの位置に相当するかを判定することで、対象者の状態が、健常状態から病気の状態までのどの段階かの推定の参考にすることができる。
【0095】
さらに、
図14の、がんと診断される前1年以上2年未満の期間の状態量プロット、および、がんと診断される前1年未満の期間の状態量プロットのように、サンプルのプロットを表示するようにしてもよい。対象者の特徴量のプロットの位置と、サンプルのプロットの位置とを比較することで、対象者の状態が、健常状態から病気の状態までのどの段階かを推定することができる。
【0096】
図15は、ベクトル場情報生成装置200が、マイクロRNAの発現量データの特徴量の履歴情報を生成し更新する処理手順の例を示すフローチャートである。ベクトル場情報生成装置200は、例えばユーザ操作による指示に従って
図15の処理を繰り返し行い、マイクロRNAの発現量の測定データの特徴量の履歴情報を蓄積する。
【0097】
図15の処理で、第一発現量データ取得部281は、発現量データを取得する(ステップS11)。具体的には、第一発現量データ取得部281は、マイクロRNAの発現量の測定結果を発現量データの形式に纏める。
次に、第一特徴量抽出部282は、発現量データから特徴量を算出(抽出)する(ステップS12)。
【0098】
また、クラス分類部283は、第一特徴量抽出部282が算出した特徴量をクラス分類する(ステップS13)。このクラス分類は、被採取者の健康状態をクラス分類することに相当する。
そして、履歴情報登録部285は、特徴量(の値)およびクラスを被採取者の履歴として第一記憶部270に記憶させる(ステップS14)。該当する被採取者の履歴情報がある場合は、履歴情報登録部285は、履歴情報にデータを追加する。一方、該当する被採取者の履歴情報がない場合は、履歴情報登録部285は、その被採取者の履歴情報を新たに生成し、第一記憶部270に記憶される。
履歴情報登録部285が、特徴量に加えて発現量データを第一記憶部270に記憶させるようにしてもよい。
ステップS14の後、ベクトル場情報生成装置200は、
図15の処理を終了する。
【0099】
図16は、ベクトル場情報生成装置200が、状態情報付ベクトル場情報を生成する処理手順の例を示すフローチャートである。ベクトル場情報生成装置200は、
図15の処理で特徴量の履歴情報が所定の基準以上に溜まった後に、
図16の処理を行う。
図16の処理で、ベクトル場情報生成部286は、第一記憶部270が記憶する特徴量の履歴情報に基づいて変化量を算出して状態情報付ベクトル場情報を生成する(ステップS21)。
【0100】
そして、状態情報付加部287は、クラス分類部283のクラス分類に応じて(例えば、クラス分類のモデルに基づいて)、状態情報付ベクトル場情報に各クラスの領域を設定し、クラス設定後の状態情報付ベクトル場情報を第一記憶部270に記憶させる(ステップS22)。
ステップS22の後、ベクトル場情報生成装置200は、
図16の処理を終了する。
なお、ベクトル場情報生成装置200は、
図15の処理の段階では特徴量抽出(ステップS13)およびクラス分類(ステップS14)を行わず、
図16の処理のときに特徴量抽出およびクラス分類を行うようにしてもよい。
【0101】
図17は、状態判定支援装置300が、対象者の特徴量を状態情報付ベクトル場情報の特徴量空間にプロットする処理手順の例を示すフローチャートである。
図17の処理で、第二発現量データ取得部381は、対象者の発現量データを取得する(ステップS31)。具体的には、第二発現量データ取得部381は、対象者のマイクロRNAの発現量の測定結果を発現量データの形式に纏める。
【0102】
次に、第一特徴量抽出部282は、対象者の発現量データから特徴量を算出(抽出)する(ステップS32)。
次に、状態判定支援処理部383は、対象者の特徴量を状態情報付ベクトル場情報にプロットする(ステップS33)。
ステップS33の後、状態判定支援装置300は、
図17の処理を終了する。
【0103】
以上のように、第一発現量データ取得部281は、マイクロRNAの種類毎にマイクロRNAの量を示す発現量データを取得する。第一特徴量抽出部282は、発現量データの特徴量を抽出する。ベクトル場情報生成部286は、特徴量の履歴情報に基づいて、ベクトル場情報を生成する。ベクトル場情報は、特徴量と特徴量の変化との関係を示す情報である。状態情報付加部287は、状態情報付ベクトル場情報を生成する。状態情報付ベクトル場情報は、ベクトル場情報における特徴量空間の部分に、当該部分の状態を示す状態情報が付加された情報である。
【0104】
ベクトル場情報生成装置200が生成する状態情報付ベクトル場情報を用いれば、対象者のマイクロRNAの発現量の測定データから抽出した特徴量(特徴量の現在値)を状態情報付ベクトル場情報にプロットして、対象者の状態判定に用いることができる。例えば、特徴量空間内の領域に状態情報が付加されている場合、対象者の状態を、対象者の特徴量がプロットされる領域が示す状態と判定することができる。また、対象者の特徴量のプロットから特徴量ベクトルを辿って到達する領域が示す状態を、対象者が比較的なりやすい状態と判定することができる。
あるいは、特徴量空間内の点に状態情報が付加されている場合、対象者の状態を、対象者の特徴量がプロットされた点の近傍の点に付加されている状態情報が示す状態に近い状態と判定することができる。また、対象者の特徴量のプロットから特徴量ベクトルを辿って到達する点の近傍の点に付加されている状態情報が示す状態を、対象者が比較的なりやすい状態と判定することができる。
このように、ベクトル場情報生成装置200によれば、対象者の状態の判定を支援することができる。
【0105】
また、第一特徴量抽出部282は、被採取者の状態毎に1次元の特徴量を抽出する。ベクトル場情報生成部286は、特徴量毎にベクトル場情報を生成する。
ベクトル場情報生成装置200によれば、
図6の例のように、状態毎(例えば病気の種類毎)に対象者の状態を状態情報付ベクトル場情報に示すことができる。個々の状態毎に対象者の状態を示せる点で、対象者の状態を見易く示すことができる。
また、上述したように未病の状態も示すことができる。
【0106】
また、第一特徴量抽出部282は、2次元以上の特徴量を抽出する。状態情報付加部287は、1つのベクトル場情報に複数の状態の状態情報が付加された状態情報付ベクトル場情報を生成する。
ベクトル場情報生成装置200によれば、複数の状態に共通の状態情報付ベクトル場情報を提供することができる。これにより、例えば対象者など状態情報付ベクトル場情報を参照する者は、1つの状態情報付ベクトル場情報を参照することで、対象者の複数の状態を把握できる。
【0107】
また、第二発現量データ取得部381は、対象者について、マイクロRNAの種類毎にマイクロRNAの量を示す発現量データを取得する。第二特徴量抽出部382は、発現量データの特徴量を抽出する。状態判定支援処理部383は、状態情報付ベクトル場情報における特徴量空間での、対象者の発現量データの特徴量の位置を示す。
状態判定支援装置300によれば、対象者の状態を発現量データの特徴量空間内に提示することができる。例えば、特徴量空間内の領域に状態情報が付加されている場合、対象者の状態を、対象者の特徴量がプロットされる領域が示す状態と判定することができる。また、対象者の特徴量のプロットから特徴量ベクトルを辿って到達する領域が示す状態を、対象者が比較的なりやすい状態と判定することができる。
あるいは、特徴量空間内の点に状態情報が付加されている場合、対象者の状態を、対象者の特徴量がプロットされた点の近傍の点に付加されている状態情報が示す状態に近い状態と判定することができる。また、対象者の特徴量のプロットから特徴量ベクトルを辿って到達する点の近傍の点に付加されている状態情報が示す状態を、対象者が比較的なりやすい状態と判定することができる。
このように、状態判定支援装置300によれば、対象者の状態の判定を支援することができる。
【0108】
図2を参照して説明したように、状態情報付ベクトル場情報を用いた状態判定として状態予測を行うようにしてもよい。この点についてさらに説明する。
図18は、状態予測システム100b(
図2)の状態予測装置300bの機能構成の例を示す概略ブロック図である。
図18に示す構成で、状態予測装置300bは、第二通信部310と、第二表示部320と、第二操作入力部330と、第二記憶部370と、第二制御部380とを備える。第二制御部380は、第二発現量データ取得部381と、第二特徴量抽出部382と、状態予測部383bとを備える。
【0109】
状態予測装置300bでは、第二制御部380は、状態判定支援装置300(
図5)の第二制御部380が備える状態判定支援処理部383に代えて、状態予測部383bを備える。
なお、以下では、ベクトル場情報生成装置200が、状態情報付ベクトル場情報として上述した状態情報付速度場情報を生成する場合を例に説明する。上述したように、状態情報付速度場情報では、変化量ベクトルとして変化速度ベクトルが用いられる。
【0110】
変化速度ベクトルは、単位期間当たりの特徴量の変化量を示すベクトルである。例えば、
図16のステップS21で、ベクトル場情報生成部286が、特徴量の変化量(変化量ベクトル)として変化速度ベクトルを算出する。ベクトル場情報生成部286は、特徴量の履歴情報から同一の被採取者について特徴量の変化量を算出し、変化の期間(マイクロRNAの発現量の測定時間間隔)で除算して単位期間当たりの変化量(変化速度)を算出する。
【0111】
状態予測部383bは、対象者の発現量データの特徴量と、状態情報付速度場情報とに基づいて、対象者の状態を予測する。
具体的には、状態予測部383bは、対象者の発現量データの特徴量を、状態情報付速度場情報上にプロットし、特徴量(の値)に応じた変化速度を読み取る。そして、状態予測部383bは、特徴量に変化速度を加算して、単位期間経過後の特徴量の予測値を算出する。状態予測部383bは、予測対象時期に至るまでこれを繰り返して、予測対象時期における特徴量の予測値を算出する。そして、状態予測部383bは、速度場情報における特徴量空間のうち、予測対象時期における特徴量の予測値が含まれる部分(ここでは部分領域)に付加された状態情報を読み取ることで、対象者の状態を予測する。
それ以外の点では、状態予測装置300bは、状態判定支援装置300と同様である。
【0112】
図19は、状態予測装置300bによる1次元の状態情報付ベクトル場情報の表示例を示す図である。
図6の場合と同様、
図19の例では、特徴量空間が変数x
1の1次元座標空間で示されている。この1次元座標空間上に、「健康」の領域(健常状態の領域)、および、「〇〇がん」の領域(〇〇がんの状態の領域)が示されている。
第二表示部320が、健常状態の領域と〇〇がんの状態の領域とに加えて、〇〇がんの未病の領域も明示するようにしてもよい。
【0113】
また、
図19の例では、対象者の特徴量(の値)が、2020年から2024年まで1年ごとに表示されている。上述したように、状態予測部383bが、対象者の特徴量(の値)に、その速度場情報でその特徴量から読み取られる変化速度を加算して、単位期間(
図19の例では1年)経過後の特徴量の予測値を算出する処理を、2024年に至るまで繰り返す。第二表示部320は、第二制御部380の制御に従って、年ごとに算出された特徴量を、x
1座標空間上に表示する。
【0114】
図19の例で、2020年の特徴量が「健康」の領域にプロットされることで、対象者が健常状態にあるとの推定結果が示されている。2021年および2022年については、特徴量が「健康」と「〇〇がん」との間の領域にプロットされることで、対象者が、〇〇がんには罹患していないが、健康な状態ともいえない状態にあるとの予測結果が示されている。
【0115】
2023年および2024年については、特徴量が「〇〇がん」の領域にプロットされることで、対象者が〇〇がんに罹患するとの予測結果が示されている。
さらに、2023年については、特徴量が、「〇〇がん」の領域のうち「健康」の領域に近い側にプロットされることに基づいて、がんの初期状態と予測するようにしてもよい。2024年については、特徴量が、「〇〇がん」の領域のうち「健康」の領域と反対側にプロットされることに基づいて、がんが進行した状態と予測するようにしてもよい。
【0116】
対象者は、この予測結果を参照して、〇〇がんに罹患しないように予防策を講じることができる。
状態予測装置300bが、複数の種類のがんについて予測を行うなど、予測対象の状態が複数ある場合、第二表示部320は、状態毎に、
図19に例示されるような1次元の状態情報付速度場情報、および、対象者の特徴量の遷移のプロットを表示する。
【0117】
図20は、状態予測装置300bによる2次元の状態情報付ベクトル場情報の表示例を示す図である。
図7の場合と同様、
図20の例では、特徴量空間が変数x
1およびx
2の2次元直交座標空間で示されている。この2次元座標空間上に、「健康」の領域、および、「Aがん」から「Dがん」までの、それぞれの種類のがんの領域が示されている。
【0118】
図20の例でも、第二表示部320が、未病の領域も明示するようにしてもよい。その場合、第二表示部320が、がんの種類毎に、そのがんの未病の領域を明示するようにしてもよい。あるいは、第二表示部320が、各がんの種類の未病の領域を1つに纏めた領域を、未病の領域として明示するようにしてもよい。
【0119】
また、
図19の場合と同様、
図20の例でも、対象者の特徴量(の値)が、2020年から2024年まで1年ごとに表示されている。
図20の例でも、状態予測部383bが、対象者の特徴量(の値)に、その速度場情報でその特徴量から読み取られる変化速度を加算して、単位期間経過後の特徴量の予測値を算出する処理を、2024年に至るまで繰り返す。第二表示部320は、第二制御部380の制御に従って、年ごとに算出された特徴量を、2次元座標空間上に表示する。
【0120】
図20の例で、2020年の特徴量が「健康」の領域にプロットされることで、対象者が健常状態にあるとの推定結果が示されている。2021年および2022年については、特徴量が「健康」と各がんとの間の領域にプロットされることで、対象者が、これらのがんには罹患していないが、健康な状態ともいえない状態にあるとの予測結果が示されている。
【0121】
2023年および2024年については、特徴量が「Cがん」の領域にプロットされることで、対象者がCがんに罹患するとの予測結果が示されている。
さらに、2023年については、特徴量が、「Cがん」の領域のうち「健康」の領域に近い側にプロットされることに基づいて、がんの初期状態と予測するようにしてもよい。2024年については、特徴量が、「Cがん」の領域のうち「健康」の領域と反対側にプロットされることに基づいて、がんが進行した状態と予測するようにしてもよい。
対象者は、この予測結果を参照して、Cがんに罹患しないように予防策を講じることができる。
【0122】
図21は、状態予測装置300bによる3次元の状態情報付ベクトル場情報の表示例を示す図である。
図8の場合と同様、
図21の例でも、特徴量空間が変数x
1、x
2およびx
3の3次元直交座標空間で示されている。この3次元座標空間上に、「健康」の領域、および、「Aがん」から「Dがん」までの、それぞれの種類のがんの領域が示されている。
【0123】
図21の例でも、第二表示部320が、未病の領域も明示するようにしてもよい。その場合、第二表示部320が、がんの種類毎に、そのがんの未病の領域を明示するようにしてもよい。あるいは、第二表示部320が、各がんの種類の未病の領域を1つに纏めた領域を、未病の領域として明示するようにしてもよい。
【0124】
また、
図20の場合と同様、
図21の例でも、対象者の特徴量(の値)が、2020年から2024年まで1年ごとに表示されている。
図21の例でも、状態予測部383bが、対象者の特徴量(の値)に、その速度場情報でその特徴量から読み取られる変化速度を加算して、単位期間経過後の特徴量の予測値を算出する処理を、2024年に至るまで繰り返す。第二表示部320は、第二制御部380の制御に従って、年ごとに算出された特徴量を、2次元座標空間上に表示する。
【0125】
図21の例で、2020年の特徴量が「健康」の領域にプロットされることで、対象者が健常状態にあるとの推定結果が示されている。2021年、2022年および2023年については、特徴量が「健康」と各がんとの間の領域にプロットされることで、対象者が、これらのがんには罹患していないが、健康な状態ともいえない状態にあるとの予測結果が示されている。
【0126】
2024年については、特徴量が「Dがん」の領域にプロットされることで、対象者がDがんに罹患するとの予測結果が示されている。
さらに、2024年の特徴量が、「Dがん」の領域のうち「健康」の領域に近い側にプロットされることに基づいて、がんが初期の状態と予測するようにしてもよい。
対象者は、この予測結果を参照して、Dがんに罹患しないように予防策を講じることができる。
【0127】
図22は、状態予測装置300bが、対象者の状態を予測する処理手順の例を示すフローチャートである。
図22のステップS31およびS32は、
図17のステップS31およびS32と同様である。
図22のステップS33は、状態判定支援処理部383に代えて状態予測部383bが処理を行う点以外は、
図17のステップS33と同様である。
【0128】
ステップS33の後、状態予測部383bは、対象者の状態を予測する(ステップS34)。具体的には、状態予測部383bは、
図19から
図21を参照して上述したように、対象者の状態の予測値についても状態情報付速度場情報の特徴量空間にプロットする。そして、状態予測部383bは、状態情報付速度場情報の特徴量空間のうち、対象者の特徴量をプロットした領域にラベル付けされている状態を対象者の将来の状態と予測する
ステップS34の後、状態予測装置300bは、
図22の処理を終了する。
【0129】
以上のように、第二発現量データ取得部381は、対象者について、マイクロRNAの種類毎にマイクロRNAの量を示す発現量データを取得する。第二特徴量抽出部382は、発現量データの特徴量を抽出する。状態予測部383bは、発現量データの特徴量と、状態情報付ベクトル場情報とに基づいて、前記対象者の状態を予測する。
状態予測装置300bによれば、対象者の状態を予測することができる。対象者は、予測結果を参照して、例えば病気に罹患しないように予防策を講じる等の、対策を講じることができる。
【0130】
図23は、少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
図18に示す構成で、コンピュータ700は、CPU(Central Processing Unit)710と、主記憶装置720と、補助記憶装置730と、インタフェース740とを備える。
【0131】
上記のベクトル場情報生成装置200、状態判定支援装置300、および、状態予測装置300bのうち何れか1つ以上が、コンピュータ700に実装されてもよい。その場合、上述した各処理部の動作は、プログラムの形式で補助記憶装置730に記憶されている。CPU710は、プログラムを補助記憶装置730から読み出して主記憶装置720に展開し、当該プログラムに従って上記処理を実行する。また、CPU710は、プログラムに従って、上述した各記憶部に対応する記憶領域を主記憶装置720に確保する。
【0132】
ベクトル場情報生成装置200がコンピュータ700に実装される場合、第一制御部280およびその各部の動作は、プログラムの形式で補助記憶装置730に記憶されている。CPU710は、プログラムを補助記憶装置730から読み出して主記憶装置720に展開し、当該プログラムに従って上記処理を実行する。
また、CPU710は、プログラムに従って、第一記憶部270に対応する記憶領域を主記憶装置720に確保する。
【0133】
第一通信部210による通信は、インタフェース740が通信機能を有し、CPU710の制御に従って通信を行うことで実行される。第一表示部220の機能は、インタフェース740が表示装置を備え、CPU710の制御に従って画像を表示することで実行される。第一操作入力部230の機能は、インタフェース740が入力デバイスを備えてユーザ操作を受け付け、受け付けたユーザ操作を示す信号をCPU710に出力することで実行される。
【0134】
状態判定支援装置300がコンピュータ700に実装される場合、第二制御部380およびその各部の動作は、プログラムの形式で補助記憶装置730に記憶されている。CPU710は、プログラムを補助記憶装置730から読み出して主記憶装置720に展開し、当該プログラムに従って上記処理を実行する。
また、CPU710は、プログラムに従って、第二記憶部370に対応する記憶領域を主記憶装置720に確保する。
【0135】
第二通信部310による通信は、インタフェース740が通信機能を有し、CPU710の制御に従って通信を行うことで実行される。第二表示部320の機能は、インタフェース740が表示装置を備え、CPU710の制御に従って画像を表示することで実行される。第二操作入力部330の機能は、インタフェース740が入力デバイスを備えてユーザ操作を受け付け、受け付けたユーザ操作を示す信号をCPU710に出力することで実行される。
【0136】
状態予測装置300bがコンピュータ700に実装される場合、第二制御部380およびその各部の動作は、プログラムの形式で補助記憶装置730に記憶されている。CPU710は、プログラムを補助記憶装置730から読み出して主記憶装置720に展開し、当該プログラムに従って上記処理を実行する。
また、CPU710は、プログラムに従って、第二記憶部370に対応する記憶領域を主記憶装置720に確保する。
【0137】
第二通信部310による通信は、インタフェース740が通信機能を有し、CPU710の制御に従って通信を行うことで実行される。第二表示部320の機能は、インタフェース740が表示装置を備え、CPU710の制御に従って画像を表示することで実行される。第二操作入力部330の機能は、インタフェース740が入力デバイスを備えてユーザ操作を受け付け、受け付けたユーザ操作を示す信号をCPU710に出力することで実行される。
補助記憶装置730は、たとえば、CDC(Compact Disc)や、DVD(digital versatile disc)等の不揮発性(non-transitory)記録媒体である。
【0138】
なお、第一制御部280および第二制御部380の全部または一部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することで各部の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OS(Operating System)や周辺機器等のハードウェアを含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM(Read Only Memory)、CD-ROM(Compact Disc Read Only Memory)等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
【0139】
以上、本発明の実施形態を図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計変更等も含まれる。
【符号の説明】
【0140】
100 状態判定支援システム
100b 状態予測システム
200 ベクトル場情報生成装置
210 第一通信部
220 第一表示部
230 第一操作入力部
270 第一記憶部
280 第一制御部
281 第一発現量データ取得部
282 第一特徴量抽出部
283 クラス分類部
284 機械学習制御部
285 履歴情報登録部
286 ベクトル場情報生成部
287 状態情報付加部
300 状態判定支援装置
300b 状態予測装置
310 第二通信部
320 第二表示部
330 第二操作入力部
370 第二記憶部
380 第二制御部
381 第二発現量データ取得部
382 第二特徴量抽出部
383 状態判定支援処理部
383b 状態予測部