IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社NTTドコモの特許一覧 ▶ 国立大学法人 東京大学の特許一覧

特許7264375情報処理装置、情報処理方法及び情報処理プログラム
<>
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図1
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図2
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図3
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図4
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図5
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図6
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図7
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図8
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図9
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図10
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図11
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図12
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図13
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図14
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図15
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図16
  • 特許-情報処理装置、情報処理方法及び情報処理プログラム 図17
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-04-17
(45)【発行日】2023-04-25
(54)【発明の名称】情報処理装置、情報処理方法及び情報処理プログラム
(51)【国際特許分類】
   G01N 21/27 20060101AFI20230418BHJP
【FI】
G01N21/27 Z
【請求項の数】 7
(21)【出願番号】P 2019168542
(22)【出願日】2019-09-17
(65)【公開番号】P2021047049
(43)【公開日】2021-03-25
【審査請求日】2022-03-02
(73)【特許権者】
【識別番号】392026693
【氏名又は名称】株式会社NTTドコモ
(73)【特許権者】
【識別番号】504137912
【氏名又は名称】国立大学法人 東京大学
(74)【代理人】
【識別番号】100088155
【弁理士】
【氏名又は名称】長谷川 芳樹
(74)【代理人】
【識別番号】100113435
【弁理士】
【氏名又は名称】黒木 義樹
(74)【代理人】
【識別番号】100121980
【弁理士】
【氏名又は名称】沖山 隆
(74)【代理人】
【識別番号】100128107
【弁理士】
【氏名又は名称】深石 賢治
(72)【発明者】
【氏名】中村 達也
(72)【発明者】
【氏名】山田 祐樹
(72)【発明者】
【氏名】檜山 聡
(72)【発明者】
【氏名】田畑 仁
(72)【発明者】
【氏名】松井 裕章
(72)【発明者】
【氏名】山原 弘靖
【審査官】横尾 雅一
(56)【参考文献】
【文献】特開平11-064218(JP,A)
【文献】特開2019-039773(JP,A)
【文献】特表平9-504603(JP,A)
【文献】米国特許出願公開第2017/0045441(US,A1)
【文献】米国特許第5593894(US,A)
【文献】志賀 元紀,スペクトル解析のための統計的機械学習,まてりあ,2019年01月01日,58巻、1号,第23頁-第28頁,https://www.jstage.jst.go.jp/article/materia/58/1/58_23/_pdf/-char/ja,DOI : https://doi.org/10.2320/materia.58.23
【文献】ACQUARELLI, J. et al.,Convolutional neural networks for vibrational spectroscopic data analysis,Analytica Chimica Acta,2016年12月27日,Vol.954,p.22-31,http://dx.doi.org/10.1016/j.aca.2016.12.010
【文献】LIU, J. et al.,Deep Convolutional Neural Networks for Raman Spectrum Recognition : A Unified Solution,arXiv,2017年08月18日,arXiv:1708.09022v1,p.1-14,https://arxiv.org/pdf/1708.09022.pdf
(58)【調査した分野】(Int.Cl.,DB名)
G01N 21/00 - G01N 21/74
A61B 9/00 - A61B 10/06
A61B 5/00 - A61B 5/22
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
試料溶液に対して光を照射する光照射部と、
前記光照射部からの光を照射された前記試料溶液からの光を受光して光の強度情報に係る受光データを取得する受光部と、
前記受光部で受光した前記受光データから前記試料溶液に含まれる脂質成分に関する推定を行うために、教師用データセットから作成された機械学習モデルを保持するモデル保持部と、
前記受光データと前記機械学習モデルとに基づいて前記試料溶液に含まれる脂質成分に関する推定を行う演算部と、
を有し、
前記演算部は、190nm、191nm、194nm、284nm、405nm、579nm、1314nm、1315nm、1316nm、1458nm及び1888nmの各波長の光の強度情報から、前記脂質成分であるLDL-Cに関する推定を行い、又は190nm、191nm、193nm、285nm、310nm、370nm、377nm、543nm、594nm、1445nm、1797nm及び1877nmの各波長の光の強度情報から、前記脂質成分であるHDL-Cに関する推定を行う情報処理装置。
【請求項2】
前記演算部は、前記脂質成分に関する推定として、前記脂質成分の濃度を推定する、請求項1に記載の情報処理装置。
【請求項3】
前記演算部は、前記脂質成分に関する推定として、前記脂質成分の濃度に関するクラスを推定する、請求項1に記載の情報処理装置。
【請求項4】
光照射部から照射する光は190nm~2700nmの範囲に含まれる波長の光である、請求項1~3のいずれか一項に記載の情報処理装置。
【請求項5】
前記演算部は、前記受光データから前記機械学習モデルに適用する特徴量を抽出し、当該特徴量を前記機械学習モデルに代入することで、前記脂質成分に関する推定を行う、請求項1~4のいずれか一項に記載の情報処理装置。
【請求項6】
試料溶液に対して光を照射することによって前記試料溶液からの光を受光して光の強度情報に係る受光データを取得する取得ステップと、
前記受光データと、前記試料溶液に含まれる脂質成分に関する推定を行うための教師用データセットから作成された機械学習モデルと、に基づいて前記試料溶液に含まれる脂質成分に関する推定を行う演算ステップと、
を有し、
前記演算ステップにおいて、190nm、191nm、194nm、284nm、405nm、579nm、1314nm、1315nm、1316nm、1458nm及び1888nmの各波長の光の強度情報から、前記脂質成分であるLDL-Cに関する推定を行い、又は190nm、191nm、193nm、285nm、310nm、370nm、377nm、543nm、594nm、1445nm、1797nm及び1877nmの各波長の光の強度情報から、前記脂質成分であるHDL-Cに関する推定を行う情報処理方法。
【請求項7】
情報処理装置としてコンピュータを機能させるための情報処理プログラムであって、
試料溶液に対して光を照射することで、前記試料溶液からの光を受光して光の強度情報に係る受光データを取得する受光機能と、
前記受光機能により受光された前記受光データから前記試料溶液に含まれる脂質成分に関する推定を行うための教師用データセットから作成された機械学習モデルを保持するモデル保持機能と、
前記機械学習モデルに基づいて前記試料溶液に含まれる脂質成分に関する推定を行う演算機能と、
を実現させ
前記演算機能は、190nm、191nm、194nm、284nm、405nm、579nm、1314nm、1315nm、1316nm、1458nm及び1888nmの各波長の光の強度情報から、前記脂質成分であるLDL-Cに関する推定を行い、又は190nm、191nm、193nm、285nm、310nm、370nm、377nm、543nm、594nm、1445nm、1797nm及び1877nmの各波長の光の強度情報から、前記脂質成分であるHDL-Cに関する推定を行う情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理装置、情報処理方法及び情報処理プログラムに関する。
【背景技術】
【0002】
生活習慣病に関連する疾患の一種である脂質異常症を検出する方法が種々検討されている。例えば、特許文献1では、血管を含む生体を透過する光の輝度を測定することにより、血中コレステロール量を非侵襲に検査する技術が開示されている。また、特許文献2では、生体に照射した光の散乱光を異なる2点で受光し、その光強度の減衰をもとに血中のCM(Chylomicron)やVLDL(Very Low-DensityLipoprotein)などの脂質成分の濃度を測定する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2010-246578号公報
【文献】特許第6029128号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
脂質異常症に係る評価を適切に行うためには、悪玉コレステロール(LDL-C)、善玉コレステロール(HDL-C)、及び、中性脂肪(TG)等の脂質成分の濃度を把握する必要がある。しかしながら、特許文献1,2に記載の方法では、脂質異常症に関する評価を行うために必要な脂質成分についての評価を十分にできているとはいえず、改善の余地があった。
【0005】
本開示は上記を鑑みてなされたものであり、試料溶液に含まれる脂質成分に係る評価を精度良く行うことが可能な情報処理装置、情報処理方法、及び、情報処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するため、本開示の一形態に係る情報処理装置は、試料溶液に対して光を照射する光照射部と、前記光照射部からの光を照射された前記試料溶液からの光を受光して光の強度情報に係る受光データを取得する受光部と、前記受光部で受光した前記受光データから前記試料溶液に含まれる脂質成分に関する推定を行うための教師用データセットから作成された機械学習モデルを保持するモデル保持部と、前記受光データと前記機械学習モデルとに基づいて前記試料溶液に含まれる脂質成分に関する推定を行う演算部と、を有する。
【0007】
上記の情報処理装置によれば、機械学習モデルと試料溶液からの光の強度情報に係る受光データとに基づいて、試料溶液に含まれる脂質成分に関する推定が行われる。機械学習モデルは、試料溶液に含まれる脂質成分に関する推定を行うための教師用データセットから作成されている。したがって、このような機械学習モデルを用いて脂質成分に係る推定を行うため、試料溶液に含まれる脂質成分に係る評価を精度良く行うことが可能となる。
【発明の効果】
【0008】
本開示によれば、試料溶液に含まれる脂質成分に係る評価を精度良く行うことが可能な情報処理装置、情報処理方法、及び、情報処理プログラムが提供される。
【図面の簡単な説明】
【0009】
図1】本実施形態の情報処理装置の機能的構成を示すブロック図である。
図2】情報処理方法を説明するフロー図である。
図3】教師用データセットから算出する機械学習モデルについて説明する図である。
図4】受光データの一例を示す図である。
図5】機械学習モデルを用いた処理について説明する図である。
図6】第1分析例で使用した教師用データセットについて説明する図である。
図7】第1分析例で使用した教師用データセットについて説明する図である。
図8】第1分析例で作成した機械学習モデルの推定性能の評価結果を示す図である。
図9】第1分析例で使用した試料溶液の受光データを示す図である。
図10】第1分析例で使用した特徴量を示す図である。
図11】第2分析例で使用した教師用データセットについて説明する図である。
図12】第2分析例で使用した教師用データセットについて説明する図である。
図13】第2分析例で作成した機械学習モデルの推定性能の評価結果を示す図である。
図14】第2分析例で使用した試料溶液の受光データを示す図である。
図15】第2分析例で使用した特徴量を示す図である。
図16】情報処理装置のハードウェア構成を示す図である。
図17】情報処理プログラムの構成を示す図である。
【発明を実施するための形態】
【0010】
以下、添付図面を参照して、本開示を実施するための形態を詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。
【0011】
[情報処理装置]
図1は、一実施形態に係る情報処理装置の構成を説明する図である。本実施形態に係る情報処理装置1は、試料溶液Sに対して光を照射することで、試料溶液Sに含まれる脂質成分に係る推定を行う装置である。試料溶液としては、例えば、血液、または、血液に対して所定の処理を行うことで得られる溶液等が挙げられる。試料溶液Sは、測定に用いられる光(測定光)を透過可能な容器等に収容されていてもよい。また、分析の対象となる脂質成分としては、LDL-C(Low Density Lipoprotein-Cholesterol:悪玉コレステロール)、HDL-C(High Density Lipoprotein-Cholesterol:善玉コレステロール)、TG(Triglyceride:中性脂肪)が挙げられる。ただし、これらの成分に限定されるものではない。以下の実施形態では上記の成分を分析する場合について説明する。
【0012】
図1に示されるように、情報処理装置1は、光照射部11、受光部12、モデル保持部13、演算部14、出力部15、及び、制御部16を含んで構成される。なお、これらの機能部は1台の装置(コンピュータ)にまとめられていてもよいが、複数台の装置に分散していてもよい。例えば、光照射部11及び受光部12は、他の機能部が搭載された装置とは別途設けられていてもよい。
【0013】
光照射部11は、制御部16からの指示に基づいて、測定光を試料溶液Sに対して照射する。
【0014】
受光部12は、光照射部11からの測定光を照射した際に試料溶液Sを透過、反射あるいは散乱した光を受光し、受光データを取得する。
【0015】
受光部12で取得する受光データとは、測定光を照射した試料溶液Sからの光の波長に応じた光強度に係る情報である。試料溶液Sに含まれる脂質成分の分析を行う際には、少なくとも190nm~270nmの波長範囲に含まれる測定光を光照射部11から照射する。測定光は、所定の波長帯域の光を全て含む光であってもよい。波長帯域の例としては、800nm~2500nmが挙げられるが、これに限定されるものではない。また、測定光は、例えば、波長1315nmの単一波長の光であってもよい。さらに、所定の波長範囲から選ばれる複数の波長の光を組み合わせたものを測定光として用いてもよい。
【0016】
また、測定光が単一波長の光ではない場合、光照射部11から出射する光の波長を徐々に変化させることで、受光部12において受光データとして分光スペクトルを取得する構成としてもよい。光の波長を徐々に変化させるための構成としては、例えば、光照射部11に分光器を設けることが考えられる。また、光照射部11から出射する測定光は複数波長の光を全て含むものとしてもよい。この場合、受光部12に分光器を設けることで、受光部12において受光データとして分光スペクトルを取得する構成としてもよい。
【0017】
モデル保持部13は、受光部12で取得した受光データに基づいて、試料溶液S中の脂質成分(LDL-C、HDL-C、TG)の濃度を算出するための機械学習モデルが保存されている。このモデルは、機械学習によって作成されるものである。モデル(機械学習モデル)の詳細については後述する。
【0018】
演算部14は、受光部12にて取得した受光データと、モデル保持部13にて保持する機械学習モデルとに基づいて、試料溶液S中の脂質成分(LDL-C、HDL-C、TG)の濃度を算出する機能を有する。脂質成分の濃度の算出方法については後述する。
【0019】
出力部15は、演算部14による演算結果を出力する機能を有する。
【0020】
制御部16は、上記の各部での動作を制御する機能を有する。
【0021】
[情報処理方法]
次に、図2を参照しながら、情報処理装置1による情報処理方法について説明する。まず、試料溶液Sに係る分析を行う前に、教師用のデータセットを用いて分析に使用する機械学習モデルを作成する(S01)。教師用データセットとは、分析の対象となる脂質成分(HDL-C、LDL-C、TG)の濃度が既知である教師用試料について、情報処理装置1を用いて得られた受光データと、脂質成分(HDL-C、LDL-C、TG)の濃度と、を組み合わせたものである。教師用試料は互いに脂質成分の濃度が異なるものが複数準備される。複数の教師用試料それぞれの脂質成分の濃度の測定方法は特に限定されないが、例えば、電気泳動法などの化学分析法を用いることができる。また、複数の教師用試料それぞれの受光データとしては、可能な限り幅広い帯域の波長の光に対するデータであることが好ましい。「幅広い帯域」としては、例えば、190nm~2700nmとすることができる。
【0022】
上記のようにして得られた教師用データセットを用いて、各脂質成分の濃度(のうちのいずれかであってもよい)を目的変数とし、受光データの各波長における光強度情報(吸光度、反射率、散乱係数等)を特徴量として、機械学習を実施する。これにより、試料溶液Sに係る脂質成分の濃度の推定に寄与する特徴量を選択する。その後、上記の手順で選択された特徴量を用いて試料溶液Sに含まれる脂質成分の濃度を推定するために、どのようなモデルを組めばよいかを機械学習を用いて決定する。
【0023】
図3(a)は、教師用データセットに含まれる情報を例示したものである。図3(a)では、3種類(A~C)の教師用試料について、特定の波長における光強度情報をそれぞれx~xとして示し、各脂質成分(HDL-C、LDL-C、TG)の濃度をy~yとして示している。教師用データセットにはデータセットを構成する試料毎にこれらの情報が含まれる。ここで、機械学習を利用して、脂質成分の濃度(y~y)を目的変数とし、これらとの関連性が高い光強度情報を全光強度情報(x~x)から選択する。そして、機械学習を利用して、選択された光強度情報から脂質成分の濃度を推定するための関係式を作成する。作成された関係式が機械学習モデルとなる。図3(b)は機械学習モデルの記述例である。図3(b)に示す例では、脂質成分の濃度(y~y)が6つの光強度情報(x~x)を用いた関数として記述している。このように、試料溶液Sに係る分析を行う前に、情報処理装置1では機械学習モデルの作成(S01)を行う。なお、機械学習モデルの作成は、制御部16の指示に基づいて演算部14において行われる態様とすることができる。また、上記の手順で作成された機械学習モデルはモデル保持部13において保持される。
【0024】
なお、本実施形態の情報処理装置1において用いられる機械学習とは、上記のように関係式を作成するためのプロセスにおいて、教師用データから、算出対象の脂質成分に係る情報(濃度、クラス等)を目的変数とし、当該目的変数を求めるための特徴量を(必要に応じて)選択した上で、目的変数を求めるための関係式を算出するものである。このようなプロセスに用いられる機械学習の手法としては、SVR(Support Vector Regression)、リッジ回帰(RidgeRegression)、ラッソ回帰(Lasso Regression)、Elastic Net、ニューラルネットワーク、ディープラーニング等が挙げられる。これらの手法のいずれかを用いてもよいし、これらを組み合わせて用いてもよい。また、主成分分析等の統計処理的手法を組み合わせて用いてもよい。
【0025】
次に、情報処理装置1では、試料溶液Sに対して光照射部11から測定光を照射することで、受光部12が受光データを取得する(S02:取得ステップ)。試料溶液Sを所定の位置に配置した後に、制御部16の指示に基づいて光照射部11から試料溶液Sに対して測定光を照射し、透過、反射あるいは散乱した光を受光部12において受光することで、受光部12は受光データを取得することができる。図4は、受光データの一例を示している。図4に示す例は、190nm~2700nmの波長範囲の光を測定光として試料溶液Sに対して照射することで得られる分光スペクトルの例である。このように、受光データには、各波長に対応付けられた光強度情報が含まれる。受光部12が取得した受光データは、演算部14に送られる。
【0026】
次に、情報処理装置1の演算部14では、受光部12が取得した受光データと、モデル保持部13において保持される機械学習モデルと、に基づいて脂質成分の濃度の算出を行う(S03:演算ステップ)。
【0027】
演算部14による脂質成分濃度の算出(S03)について、図5を参照しながらさらに説明する。機械学習モデルでは特徴量として使用する光強度情報が決められている。そこで、演算部14では、まず、受光データから特徴量として使用する光強度情報を選択する(S11)。このステップは、すなわち、図3(b)で示す6つの光強度情報(x~x)に対応する光強度情報を抽出する処理に相当する。そして、機械学習モデルに対して、選択した光強度情報を特徴量として代入する(S12)。このステップは、すなわち、抽出した6つの光強度情報(x~x)を、図3(b)に示す関係式に代入する処理に相当する。その後、特徴量を代入した関係式を計算することで、脂質成分濃度を算出する(S13)。このような手順を経ることで、受光データに含まれる光強度情報を用いて、脂質成分濃度を算出することができる。
【0028】
図2に戻り、上記の手順(S01~S03)により得られた脂質成分の濃度の算出結果は、例えば、制御部16の指示によって、出力部15から出力される(S04)。これにより、受光データに基づいて算出された脂質成分の濃度に係る情報を装置の操作者等に通知することが可能となる。
なお、上記手順では、脂質成分の「濃度」を算出する場合について説明したが、脂質成分に係る推定であれば、「濃度」に限定されない。例えば、濃度のように数値を算出するのでは無く、脂質成分がどの程度含まれているか等を示す分類(クラス)を試料溶液S毎に特定することが求められる場合もある。その場合は、分類(クラス)を目的変数とすることで、濃度を推定する場合と同様の処理を行うことができる。
【0029】
[第1分析例]
次に、図6図10を参照しながら、上記の情報処理装置1による第1の分析例について説明する。第1の分析例では、情報処理装置1を用いて試料溶液Sに含まれるLDL-Cの濃度を算出する場合について説明する。
【0030】
試料溶液Sとしては、バッファ溶液にヘモグロビン、LDL-C、HDL-C、TGを溶解した溶液を用いることを想定し、まず、機械学習モデルの作成(図2のステップS01)を行った。
【0031】
機械学習モデルの作成では、バッファ溶液に対して異なる濃度の組み合わせのヘモグロビン、LDL-C、HDL-C、TGを溶解させた教師用試料を144種類(Sample 1~144)準備した。各教師用試料に対して、情報処理装置1の光照射部11から190nm~2,700nmの波長の光を照射し、試料を透過した透過光を受光部12において受光した。144個の試料に係る受光データの例を図6に示す。図6に示すように、各試料について、190nm~2700nmの間について1nm毎の吸光度に係るデータが得られた。また、144個の試料のそれぞれについては、LDL-C、HDL-C、TGの濃度が既知である。144個の試料に係る各脂質成分の例を図7に示す。図6及び図7に示すデータが教師用データセットとなる。
【0032】
なお、第1分析例では、教師用試料の数を144個としているが、サンプル数は144個より多くても少なくてもよい。
【0033】
その後、情報処理装置1の演算部14では、図6に示した吸光特性に係る情報を特徴量とし、図7に示すLDL-C濃度を目的変数とした機械学習を実施する。これにより、LDL-Cの濃度推定に有用な特徴量を選択する。ここで選択される特徴量とは、LDL-Cの濃度との関連性が高い光強度情報を指す。一例としては、以下の表1に示す各波長の光強度情報を特徴量として用いることができる。
【0034】
【表1】
【0035】
なお、特徴量の抽出にはLasso回帰やRidge回帰やElastic Netなどにより有用なデータ項目を限定する方法や、主成分分析の寄与率などからデータ項目を限定する方法などがある。ただし、これらに限定されるものではない。
【0036】
その後、選択された特徴量を用いた機械学習モデルを作成する。機械学習モデルを作成する際には、教師用データセットに含まれるデータを利用して精度を評価してもよい。また、教師用データセットとは別の評価用のデータセットを別途準備し、このデータセットを用いて精度を評価してもよい。
【0037】
機械学習モデルには、SVM(Support Vector Machine)、ロジスティック回帰モデルなどがあるが、それらに限定されるものではない。また、評価方法には決定係数、相関係数などがあるが、それらに限定されるものではない。作成した機械学習モデルによる推定性能を評価した例を図8に示す。図8では、横軸をLDL-C濃度の正解値とし、縦軸に機械学習モデルを用いて推定したLDL-C濃度の推定値とし、データセットに含まれる各試料それぞれをプロットしたものである。図8に示すように、機械学習モデルによる推定結果は、正解値と概ね同じような傾向を示している。作成された機械学習モデルは、モデル保持部13に保持される。
【0038】
次に、濃度推定の対象となる試料溶液Sを準備し、試料溶液Sに対して190nm~2700nmの波長域の測定光を光照射部11から照射し、試料溶液Sを透過した透過光を受光部12において受光する。測定光は、表1に示す特徴量に含まれる波長の光が含まれていればよい。上記の手順により、試料溶液Sに係る受光データが受光部12において取得される。図9は、受光データの一例を示したものである。
【0039】
次に、情報処理装置1の演算部14では、図9に示した受光データから、LDL-Cの濃度推定に使用する特徴量を抽出する。抽出した結果を図10に示す。これらの特徴量を、先に作成した機械学習モデルに対して代入することにより、試料溶液SのLDL-Cの濃度を推定することができる。図9及び図10で示した試料溶液Sの場合には、例えば、LDL-Cの濃度を1.69752[mg/ml]と推定することができる。
【0040】
[第2分析例]
次に、図11図15を参照しながら、上記の情報処理装置1による第2の分析例について説明する。第1の分析例では、情報処理装置1を用いて試料溶液Sに含まれるLDL-Cの濃度を算出する場合について説明したが、第2分析例では、脂質成分の濃度自体を算出するのではなく、脂質成分の濃度がどのような傾向にあるかを分類する点が第1分析例と相違する。具体的には、試料溶液S中に含まれる、HDL-Cの濃度が脂質異常症、予備軍、健康のどの状態と判断される濃度かを推定する場合について説明する。なお、本分析例では、判定基準は、以下の表2に基づくものとする。
【0041】
【表2】
【0042】
本分析例では、上記の基準に基づいて試料溶液Sがどのクラスに属するかを判定する。ただし、クラス数は3つに限定されるものではなく、その閾値も表2に記載されている値に限定されるものではない。
【0043】
試料溶液Sとしては、バッファ溶液にヘモグロビン、LDL-C、HDL-C、TGを溶解した溶液を用いることを想定し、まず、機械学習モデルの作成(図2のステップS01)を行った。
【0044】
機械学習モデルの作成では、バッファ溶液に対して異なる濃度の組み合わせのヘモグロビン、LDL-C、HDL-C、TGを溶解させた教師用試料を144種類(Sample 1~144)準備した。各教師用試料に対して、情報処理装置1の光照射部11から190nm~2,700nmの波長の光を照射し、試料を透過した透過光を受光部12において受光した。144個の試料に係る受光データの例を図11に示す。図11に示すように、各試料について、190nm~2700nmの間について1nm毎の吸光度に係るデータが得られた。また、144個の試料のそれぞれについては、LDL-C、HDL-C、TGの濃度が既知であるから、上記の表2に基づいて各脂質成分の濃度が3つのクラスのどれに該当するかを判定することができる。144個の試料に係る各脂質成分についてクラス分類を行った例を図12に示す。第2分析例の場合、図11及び図12に示すデータが教師用データセットとなる。
【0045】
なお、第2分析例においても第1分析例と同様に教師用試料の数を144個としているが、サンプル数は144個より多くても少なくてもよい。
【0046】
その後、情報処理装置1の演算部14では、図11に示した吸光特性に係る情報を特徴量とし、図12に示すHDL-Cのクラス分類を目的変数とした機械学習を実施する。これにより、HDL-Cの濃度に基づくクラス分類の推定に有用な特徴量を選択する。一例として、以下の表3に示す各波長の光を特徴量として用いることができる。
【0047】
【表3】
【0048】
なお、特徴量の抽出にはLasso回帰やRidge回帰やElastic Netなどにより有用なデータ項目を限定する方法や、主成分分析の寄与率などからデータ項目を限定する方法などがある。ただし、これらに限定されるものではない。
【0049】
その後、選択された特徴量を用いた機械学習モデルを作成する。機械学習モデルを作成する際には、教師用データセットに含まれるデータを利用して精度を評価してもよい。また、教師用データセットとは別の評価用のデータセットを別途準備し、このデータセットを用いて精度を評価してもよい。
【0050】
機械学習モデルには、k-最近傍法、ロジスティック回帰などがあるが、それらに限定されるものではない。また、評価方法には精度、適合率などがあるが、それらに限定されるものではない。作成した機械学習モデルによる推定性能を分析した結果を図13に示す。図13では、機械学習モデルを用いて推定されたクラスと、各データの実際のクラスの混同行列を表として示している。作成された機械学習モデルは、モデル保持部13に保持される。
【0051】
次に、濃度推定の対象となる試料溶液Sを準備し、試料溶液Sに対して190nm~2700nmの波長域の測定光を光照射部11から照射し、試料溶液Sを透過した透過光を受光部12において受光する。測定光は、表3に示す特徴量に含まれる波長の光が含まれていればよい。上記の手順により、試料溶液Sに係る受光データが受光部12において取得される。図14は、受光データの一例を示したものである。
【0052】
次に、情報処理装置1の演算部14では、図14に示した受光データから、HDL-Cの濃度に基づくクラスの推定に使用する特徴量を抽出する。抽出した結果を図15に示す。これらの特徴量を、先に作成した機械学習モデルに対して代入することにより、試料溶液SのHDL-Cの濃度に係るクラスを推定することができる。図14及び図15で示した試料溶液Sの場合には、例えば、HDL-Cの濃度が脂質異常症に該当する濃度であると推定することができる。
【0053】
[ハードウェア構成]
上記実施の形態の説明に用いた各機能は、ハードウェア及び/又はソフトウェアの任意の組み合わせによって実現される。また、各機能の実現手段は特に限定されない。すなわち、各機能は、物理的及び/又は論理的に結合した1つの装置により実現されてもよいし、物理的及び/又は論理的に分離した2つ以上の装置を直接的及び/又は間接的に(例えば、有線及び/又は無線)で接続し、これら複数の装置により実現されてもよい。
【0054】
例えば、上述の情報処理装置1は、コンピュータとして機能してもよい。図16は、情報処理装置1のハードウェア構成の一例を示す図である。情報処理装置1は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成されてもよい。
【0055】
なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。情報処理装置1のハードウェア構成は、図に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。
【0056】
情報処理装置1における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることで、プロセッサ1001が演算を行い、通信装置1004による通信や、メモリ1002及びストレージ1003におけるデータの読み出し及び/又は書き込みを制御することで実現される。
【0057】
プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)で構成されてもよい。例えば、情報処理装置1の各種処理等は、プロセッサ1001で実現されてもよい。
【0058】
また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュールやデータを、ストレージ1003及び/又は通信装置1004からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態で説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、情報処理装置1の各種処理を実行する機能は、メモリ1002に格納され、プロセッサ1001で動作する制御プログラムによって実現されてもよく、他の機能ブロックについても同様に実現されてもよい。上述の各種処理は、1つのプロセッサ1001で実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップで実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。
【0059】
メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つで構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、情報処理装置1の各種処理を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。
【0060】
ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD-ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つで構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及び/又はストレージ1003を含むデータベース、サーバその他の適切な媒体であってもよい。
【0061】
通信装置1004は、有線及び/又は無線ネットワークを介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。例えば、情報処理装置1の各種処理の一部は、通信装置1004で実現されてもよい。
【0062】
入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプなど)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。
【0063】
また、プロセッサ1001やメモリ1002などの各装置は、情報を通信するためのバス1007で接続される。バス1007は、単一のバスで構成されてもよいし、装置間で異なるバスで構成されてもよい。
【0064】
また、情報処理装置1は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つで実装されてもよい。
【0065】
[情報処理プログラム]
次に、コンピュータを、本実施形態の情報処理装置1として機能させるための情報処理プログラムについて説明する。図17は、情報処理プログラムP1の構成を示す図である。
【0066】
情報処理プログラムP1は、情報処理装置1における上記の処理を統括的に制御するメインモジュールm10、光照射モジュールm11、受光モジュールm12、モデル保持モジュールm13、演算モジュールm14、出力モジュールm15、制御モジュールm16を備えて構成される。そして、各モジュールm11~m16により、情報処理装置1における光照射部11、受光部12、モデル保持部13、演算部14、出力部15、及び、制御部16のための各機能が実現される。なお、情報処理プログラムP1は、通信回線等の伝送媒体を介して伝送される態様であってもよいし、図17に示されるように、記録媒体M1に記憶される態様であってもよい。
【0067】
[作用]
以上説明した本実施形態の情報処理装置1は、試料溶液に対して光を照射する光照射部と、前記光照射部からの光を照射された前記試料溶液からの光を受光して光の強度情報に係る受光データを取得する受光部と、前記受光部で受光した前記受光データから前記試料溶液に含まれる脂質成分に関する推定を行うために、教師用データセットから作成された機械学習モデルを保持するモデル保持部と、前記受光データと前記機械学習モデルとに基づいて前記試料溶液に含まれる脂質成分に関する推定を行う演算部と、を有する。
【0068】
また、本実施形態に係る情報処理方法は、試料溶液に対して光を照射することによって前記試料溶液からの光を受光して光の強度情報に係る受光データを取得する取得ステップと、前記受光データと、前記試料溶液に含まれる脂質成分に関する推定を行うための教師用データセットから作成された機械学習モデルと、に基づいて前記試料溶液に含まれる脂質成分に関する推定を行う演算ステップと、を有する。
【0069】
また、本実施形態に係る情報処理プログラムP1は、情報処理装置としてコンピュータを機能させるための情報処理プログラムであって、試料溶液に対して光を照射することで、前記試料溶液からの光を受光して光の強度情報に係る受光データを取得する受光機能と、前記受光機能により受光された前記受光データから前記試料溶液に含まれる脂質成分に関する推定を行うための教師用データセットから作成された機械学習モデルを保持するモデル保持機能と、前記機械学習モデルに基づいて前記試料溶液に含まれる脂質成分に関する推定を行う演算機能と、を実現させる。
【0070】
上記の情報処理装置、情報処理方法、及び、情報処理プログラムによれば、機械学習モデルと試料溶液からの光の強度情報に係る受光データとに基づいて、試料溶液に含まれる脂質成分に関する推定が行われる。機械学習モデルは、試料溶液に含まれる脂質成分に関する推定を行うための教師用データセットから作成されている。したがって、このような機械学習モデルを用いて脂質成分に係る推定を行うため、試料溶液に含まれる脂質成分に係る評価を精度良く行うことが可能となる。
【0071】
近年、健康寿命の延伸を目的として、生活習慣病の予防技術に関心が集まっている。予防すべき生活習慣病は多く存在するが、その中でも、脂質異常症が注目されている。脂質異常症とは、血中に含まれる複数の脂質成分の濃度が、閾値よりも高い、あるいは低い状態を示し、脂質異常症を発症すると、血管壁の表面にプラークが生じ、血管が詰まりやすくなる動脈硬化を引き起こし得る。しかしながら、脂質異常症は、心疾患や脳血管疾患に繋がる可能性が高いにもかかわらず、発症している人の自覚症状がないという特徴がある。そのため、生活習慣病の予防としては、何らかの方法で脂質異常症に罹患していないかを評価することが望ましい。
【0072】
脂質異常症であるか否かを判定する際に用いられる脂質成分は、上記実施形態で説明したLDL-C、HDL-C、TGであり、それぞれ異なる閾値を設定されている。そのため、それぞれの脂質成分が血中にどの程度含まれているかを知ることが脂質異常症の予防にとって重要である。しかしながら、この方法を非侵襲な方法で簡便に且つ精度良く評価する方法は検討されておらず、改善が求められていた。
【0073】
これに対して、上記の情報処理装置、情報処理方法、及び、情報処理プログラムによれば、機械学習モデルと試料溶液からの光の強度情報に係る受光データとに基づいて、試料溶液に含まれる脂質成分に関する推定を行うことができる。すなわち、非侵襲な方法によって、脂質成分に係る評価を精度良く行うことができる。また、上記実施形態で説明した脂質成分に係る推定は光学的手法で得られる受光データを用いた評価となるため、操作も簡便である。
【0074】
別の実施形態において、前記演算部は、前記脂質成分に関する推定として、前記脂質成分の濃度を推定する態様とすることができる。
【0075】
演算部において機械学習モデルを用いて脂質成分濃度を推定する態様とすることで、試料溶液に含まれる脂質成分の濃度を精度良く推定することが可能となる。
【0076】
別の実施形態において、前記脂質成分に関する推定として、前記脂質成分の濃度に関するクラスを推定する態様とすることができる。
【0077】
演算部において機械学習モデルを用いて脂質成分の濃度に関するクラスを推定する態様とすることで、脂質成分の濃度の傾向をより精度良く推定することが可能となる。
【0078】
別の実施形態において、光照射部から照射する光は190nm~2700nmの範囲に含まれる波長の光である態様とすることができる。
【0079】
脂質成分に係る推定は、上記の波長範囲の光を用いることで精度良く行うことができる。したがって、上記の波長範囲の光を光照射部から照射する構成とすることで、脂質成分に係る推定を精度良く行うことができる。
【0080】
別の実施形態において、前記演算部は、前記受光データから前記機械学習モデルに適用する特徴量を抽出し、当該特徴量を前記機械学習モデルに代入することで、前記脂質成分に関する推定を行う態様とすることができる。
【0081】
上記の構成とすることで、演算部における脂質成分に係る推定を精度良く行うことができる。
【0082】
以上のように、本開示によれば、非侵襲かつ簡便な方法での脂質異常症の指標となり得る脂質成分の濃度、クラス等を検査・確認することができる。上記で説明した情報処理装置、情報処理方法、及び、情報処理プログラムを脂質異常症の予防に適用する場合、上記の脂質成分に係る推定を定期的に行う事によって、脂質異常症発症前に脂質異常症の指標となる脂質成分の濃度の異常に気付くことが可能となる。すなわち、脂質異常症を発症する前の予防が可能となり、生活習慣病を未然に防ぐことができる。
【0083】
[その他]
以上、本実施形態について詳細に説明したが、当業者にとっては、本実施形態が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本実施形態は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本明細書の記載は、例示説明を目的とするものであり、本実施形態に対して何ら制限的な意味を有するものではない。
【0084】
情報の通知は、本明細書で説明した態様/実施形態に限られず、他の方法で行われてもよい。例えば、情報の通知は、物理レイヤシグナリング(例えば、DCI(Downlink Control Information)、UCI(Uplink Control Information))、上位レイヤシグナリング(例えば、RRC(Radio Resource Control)シグナリング、MAC(Medium Access Control)シグナリング、報知情報(MIB(Master Information Block)、SIB(System Information Block)))、その他の信号又はこれらの組み合わせによって実施されてもよい。また、RRCシグナリングは、RRCメッセージと呼ばれてもよく、例えば、RRC接続セットアップ(RRC Connection Setup)メッセージ、RRC接続再構成(RRC Connection Reconfiguration)メッセージなどであってもよい。
【0085】
本明細書で説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。
【0086】
入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルで管理してもよい。入出力される情報等は、上書き、更新、または追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。
【0087】
判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:trueまたはfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。
【0088】
本明細書で説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。
【0089】
ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。
【0090】
また、ソフトウェア、命令などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア及びデジタル加入者回線(DSL)などの有線技術及び/又は赤外線、無線及びマイクロ波などの無線技術を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び/又は無線技術は、伝送媒体の定義内に含まれる。
【0091】
本明細書で説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。
【0092】
なお、本明細書で説明した用語及び/又は本明細書の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。
【0093】
本明細書で使用する「システム」および「ネットワーク」という用語は、互換的に使用される。
【0094】
また、本明細書で説明した情報、パラメータなどは、絶対値で表されてもよいし、所定の値からの相対値で表されてもよいし、対応する別の情報で表されてもよい。
【0095】
上述したパラメータに使用する名称はいかなる点においても限定的なものではない。さらに、これらのパラメータを使用する数式等は、本明細書で明示的に開示したものと異なる場合もある。
【0096】
本明細書で使用する「判断(judging)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定(judging)、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up)(例えば、テーブル、データベースまたは別のデータ構造での探索)、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)(例えば、情報を受信すること)、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)(例えば、メモリ中のデータにアクセスすること)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。
【0097】
「接続された(connected)」、「結合された(coupled)」という用語、又はこれらのあらゆる変形は、2又はそれ以上の要素間の直接的又は間接的なあらゆる接続又は結合を意味し、互いに「接続」又は「結合」された2つの要素間に1又はそれ以上の中間要素が存在することを含むことができる。要素間の結合又は接続は、物理的なものであっても、論理的なものであっても、或いはこれらの組み合わせであってもよい。本明細書で使用する場合、2つの要素は、1又はそれ以上の電線、ケーブル及び/又はプリント電気接続を使用することにより、並びにいくつかの非限定的かつ非包括的な例として、無線周波数領域、マイクロ波領域及び光(可視及び不可視の両方)領域の波長を有する電磁エネルギーなどの電磁エネルギーを使用することにより、互いに「接続」又は「結合」されると考えることができる。
【0098】
本明細書で使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。
【0099】
「含む(include)」、「含んでいる(including)」、およびそれらの変形が、本明細書あるいは特許請求の範囲で使用されている限り、これら用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本明細書あるいは特許請求の範囲において使用されている用語「または(or)」は、排他的論理和ではないことが意図される。
【0100】
本明細書において、文脈または技術的に明らかに1つのみしか存在しない装置である場合以外は、複数の装置をも含むものとする。本開示の全体において、文脈から明らかに単数を示したものではなければ、複数のものを含むものとする。
【符号の説明】
【0101】
1…情報処理装置、11…光照射部、12…受光部、13…モデル保持部、14…演算部、15…出力部、16…制御部、P1…情報処理プログラム、S…試料溶液。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17