IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ サンスター株式会社の特許一覧

特開2024-165190化学物質によって引き起こされる事象の陽性における定量的な指標の予測方法、システム、プログラム
<>
  • 特開-化学物質によって引き起こされる事象の陽性における定量的な指標の予測方法、システム、プログラム 図1
  • 特開-化学物質によって引き起こされる事象の陽性における定量的な指標の予測方法、システム、プログラム 図2
  • 特開-化学物質によって引き起こされる事象の陽性における定量的な指標の予測方法、システム、プログラム 図3
  • 特開-化学物質によって引き起こされる事象の陽性における定量的な指標の予測方法、システム、プログラム 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024165190
(43)【公開日】2024-11-28
(54)【発明の名称】化学物質によって引き起こされる事象の陽性における定量的な指標の予測方法、システム、プログラム
(51)【国際特許分類】
   G06Q 50/10 20120101AFI20241121BHJP
   G01N 33/15 20060101ALI20241121BHJP
【FI】
G06Q50/10
G01N33/15 Z
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2023081119
(22)【出願日】2023-05-16
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.PYTHON
(71)【出願人】
【識別番号】000106324
【氏名又は名称】サンスター株式会社
(74)【代理人】
【識別番号】110003823
【氏名又は名称】弁理士法人柳野国際特許事務所
(72)【発明者】
【氏名】浅井 崇穂
【テーマコード(参考)】
5L049
5L050
【Fターム(参考)】
5L049CC20
5L050CC20
(57)【要約】
【課題】外部データでの検証をすることなく化学物質により引き起こされる事象の陽性における指標を定量的に且つ精度良く予測できるin silico 評価系を提供する。
【解決手段】前記定量的な指標の情報を目的変数として記憶し、実験に基づく情報、化学構造についての情報、及び被験物質に類似した物質についての情報のうち少なくとも一つの情報を説明変数として記憶し、目的変数および説明変数の各情報を学習用データと検証用データとに振り分けられて記憶し、機械学習手法により学習用データの目的変数および説明変数を用いて指標の値の予測モデルを構築し、検証用データの目的変数および説明変数を用いて予測モデルを評価し、予測モデルの必要な再構築を行い、予測モデルを用いて化学物質の予測される指標の値を出力する。
【選択図】図1
【特許請求の範囲】
【請求項1】
化学物質によって引き起こされる事象の陽性における定量的な指標の予測を行う情報処理システムであって、
化学物質によって引き起こされる事象の陽性における定量的な指標の情報を、目的変数として記憶する目的変数記憶部と、
実験に基づく情報、化学構造についての情報、及び被験物質に類似した物質についての情報のうち少なくとも一つの情報を、説明変数として記憶する説明変数記憶部と、
前記目的変数および説明変数の各情報を、学習用データと検証用データとに振り分けられて記憶する振り分け処理部と、
機械学習手法により、前記学習用データの前記目的変数および説明変数を用いて、前記指標の予測モデルを構築するとともに、前記検証用データの前記目的変数および説明変数を用いて前記予測モデルを評価し、予測モデルの必要な再構築を行う、予測モデル構築処理部と、
前記予測モデルを用いて、化学物質の予測される前記指標の値を出力する出力処理部とを備える情報処理システム。
【請求項2】
前記予測モデル構築処理部は、前記検証用の前記目的変数および説明変数を用いて、前記予測モデルの予測精度及び過学習の有無を評価する、請求項1記載の情報処理システム。
【請求項3】
前記予測モデル構築処理部は、下記式で求まるR2値及びRMSE値により前記予測精度の評価及び過学習の有無判定を行う、請求項2記載の情報処理システム。
【数1】
【請求項4】
前記振り分け処理部が、前記検証用データについて、さらに内部検証用データと外部検証用データの2つに振り分け、
前記予測モデル構築処理部は、前記内部検証用データを用いて前記過学習の有無を判定し、且つ前記外部検証用データを用いて予測精度を評価する、請求項3記載の情報処理システム。
【請求項5】
前記振り分け処理部は、前記目的変数および説明変数の各情報について、正規化・標準化により圧縮することでスケール(桁数)を合わせたうえ、前記学習用データと検証用データとに振り分けられて記憶する、請求項1記載の情報処理システム。
【請求項6】
前記予測モデル構築処理部は、ITSv2ハザード評価による正誤の結果を適用範囲の閾値として用いる、請求項1記載の情報処理システム。
【請求項7】
請求項1記載の情報処理システムとしてコンピュータを機能させるための制御プログラムであって、上記振り分け処理部、上記予測モデル構築処理部、及び上記出力処理部としてコンピュータを機能させるための制御プログラム。
【請求項8】
化学物質によって引き起こされる事象の陽性における定量的な指標の情報を、目的変数として記憶する目的変数記憶部と、実験に基づく情報、化学構造についての情報、及び被験物質に類似した物質についての情報のうち少なくとも一つの情報を、説明変数として記憶する説明変数記憶部とを有し、化学物質によって引き起こされる事象の陽性における定量的な指標の予測を行うシステムにより実行される情報処理方法であって、
前記目的変数および説明変数の各情報を、学習用データと検証用データとに振り分けられて記憶する振り分け手順と、
機械学習手法により、前記学習用データの前記目的変数および説明変数を用いて、前記指標の値の予測モデルを構築するとともに、前記検証用データの前記目的変数および説明変数を用いて前記予測モデルを評価し、予測モデルの必要な再構築を行う、予測モデル構築手順と、
前記予測モデルを用いて、化学物質の予測される前記指標の値を出力する出力手順とを含む情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械学習モデルを用いた化学物質によって引き起こされる事象の陽性における定量的な指標の予測方法、システム、プログラムに関する。
【背景技術】
【0002】
工業製品の原料、製品に含まれる化学物質の皮膚感作性の評価は、ヒト試験の前に、まずは動物を用いて皮膚感作性の有無、感作が生じる濃度を評価し、最終的にパッチテスト、使用試験等、ヒト試験によって安全性を評価することが行われている。しかし、動物愛護やコスト面に加え、2013年のEUにおける化粧品のための動物実験および動物実験された化粧品の販売禁止に関する指令を契機に、動物を用いない代替試験法の開発が強く求められるようになった。
【0003】
動物を用いない皮膚感作性の有無の評価方法としては、有害事象経路(AOP: Adverse Outcome Pathway)に基づく生体反応(KE(Key Event))を検討して評価する3つの試験方法がある。具体的には、KE1(皮膚タンパク質への共有結合)に対応するDPRA(Direct Peptide Reactivity Assay)法、KE2(炎症性サイトカインの誘導、細胞防御遺伝子経路の誘導)に対応する KeratinoSensTM法、KE3(炎症性サイトカイン及び表面抗原の誘導、樹状細胞の遊走)に対応するヒト細胞株活性化試験(h-CLAT)法などのin chemico/in vitro試験法が用いられている。
【0004】
これに対し、動物を用いない感作が生じる濃度の評価は、従来、十分なものがない。局所リンパ節試験(LLNA)のEC3値は、国連の化学物質の分類および表示に関する世界調和システム(UNGHS)の基準や、観察可能な有害影響なしレベルに相当する指標であるNESIL(No Expected Sensitization Induction Level)として、皮膚感作性のヒトリスク評価に用いられている。このLLNAのEC3値を定量的に予測することができればヒト評価以前に、より詳細な皮膚感作性リスクを予見することが可能となる。しかし、従来提案されているEC3値を定量的に予測するin silico 評価系は、モデル構築に含まれない外部データを用いたさらなる検証が別途必要であり、且つ精度に限界もあった(非特許文献1、2参照。)。
【先行技術文献】
【特許文献】
【0005】
【非特許文献1】M. Hirota, et al., Development of an artificial neural network model for risk assessment of skin sensitization using human cell line activation test, direct peptide reactivity assay, KeratinoSensTM and in silico structure alert parameter. J. Appl. Toxicol., 38 (2018), p514-526
【非特許文献2】K. Ambe et al., Development of quantitative model of a local lymph node assay for evaluating skin sensitization potency applying machine learning CatBoost. Regulatory ToxicoLogy and Pharmacology, 125 (2021) 105019
【発明の概要】
【発明が解決しようとする課題】
【0006】
そこで、本発明が前述の状況に鑑み、解決しようとするところは、更なる外部データでの別途の検証をすることなく、EC3値などの化学物質によって引き起こされる事象の陽性における指標を定量的に且つ精度良く予測できるin silico 評価系を提供する点にある。
【課題を解決するための手段】
【0007】
すなわち本発明は、以下の発明を包含する。
(1) 化学物質によって引き起こされる事象の陽性における定量的な指標の予測を行う情報処理システムであって、化学物質によって引き起こされる事象の陽性における定量的な指標の情報を、目的変数として記憶する目的変数記憶部と、実験に基づく情報、化学構造についての情報、及び被験物質に類似した物質についての情報のうち少なくとも一つの情報を、説明変数として記憶する説明変数記憶部と、前記目的変数および説明変数の各情報を、学習用データと検証用データとに振り分けられて記憶する振り分け処理部と、機械学習手法により、前記学習用データの前記目的変数および説明変数を用いて、前記指標の値の予測モデルを構築するとともに、前記検証用データの前記目的変数および説明変数を用いて前記予測モデルを評価し、予測モデルの必要な再構築を行う、予測モデル構築処理部と、前記予測モデルを用いて、化学物質の予測される前記指標の値を出力する出力処理部とを備える情報処理システム。
【0008】
(2) 前記予測モデル構築処理部は、前記検証用の前記目的変数および説明変数を用いて、前記予測モデルの予測精度及び過学習の有無を評価する、(1)記載の情報処理システム。
【0009】
(3) 前記予測モデル構築処理部は、下記式で求まるR2値及びRMSE値により前記予測精度の評価及び過学習の有無判定を行う、(2)記載の情報処理システム。
【0010】
【数1】
【0011】
R2値は、明確な規定はないが0.8以上が良いとされる。RMSEは、予測値-実際の値の二乗平均値の平方根である。学習用と検証用の比較に用いられ、小さい方がよい。たとえばR2値が、学習用データで「0.889」、検証用データで「0.372」であった場合、このモデルは過学習を起こしており改善が必要と評価する。
【0012】
(4) 前記振り分け処理部が、前記検証用データについて、さらに内部検証用データと外部検証用データの2つに振り分け、前記予測モデル構築処理部は、前記内部検証用データを用いて前記過学習の有無を判定し、且つ前記外部検証用データを用いて予測精度を評価する、(3)記載の情報処理システム。
【0013】
(5) 前記振り分け処理部は、前記目的変数および説明変数の各情報について、正規化・標準化により圧縮することでスケール(桁数)を合わせたうえ、前記学習用データと検証用データとに振り分けられて記憶する、(1)記載の情報処理システム。
【0014】
(6) 前記予測モデル構築処理部は、ITSv2ハザード評価(OECD Guideline No. 497 ITSv2)による正誤の結果を適用範囲の閾値として用いる、(1)記載の情報処理システム。
【0015】
(7) (1)記載の情報処理システムとしてコンピュータを機能させるための制御プログラムであって、上記振り分け処理部、上記予測モデル構築処理部、及び上記出力処理部としてコンピュータを機能させるための制御プログラム。
【0016】
(8) 化学物質によって引き起こされる事象の陽性における定量的な指標の情報を、目的変数として記憶する目的変数記憶部と、実験に基づく情報、化学構造についての情報、及び被験物質に類似した物質についての情報のうち少なくとも一つの情報を、説明変数として記憶する説明変数記憶部とを有し、化学物質によって引き起こされる事象の陽性における定量的な指標の予測を行うシステムにより実行される情報処理方法であって、前記目的変数および説明変数の各情報を、学習用データと検証用データとに振り分けられて記憶する振り分け手順と、機械学習手法により、前記学習用データの前記目的変数および説明変数を用いて、前記指標の値の予測モデルを構築するとともに、前記検証用データの前記目的変数および説明変数を用いて前記予測モデルを評価し、予測モデルの必要な再構築を行う、予測モデル構築手順と、前記予測モデルを用いて、化学物質の予測される前記指標の値を出力する出力手順とを含む情報処理方法。
【発明の効果】
【0017】
以上にしてなる本願発明によれば、更なる外部データでの別途の検証をすることなく、化学物質によって引き起こされる事象の陽性における指標の値を定量的に且つ精度良く予測できるin silico 評価系を提供できる。
【0018】
具体的には、下記実施例に示すように、LLNA EC3値および皮膚感作性AOP(Adverse Outcome Pathway)の各Key Eventに関するin chemico/in vitro試験データを有する195物質を用いて、各試験データ、分子記述子、リード・アクロスの考え方に基づく距離情報を使用した機械学習モデルとITSv2ハザード評価を組み合わせたことで、二つのCatBoostモデルとITSv2ハザード評価を組み合わせた予測系のパフォーマンスは、R2値として学習用データで0.862、内部検証用データで0.550、外部検証用データで0.617であった。更に、ITSv2ハザード評価で誤分類であった物質は、想定されているAOPと皮膚感作性との対応に合致しない性質を有していると考え、ITSv2ハザード評価の正誤を当予測系の適用範囲の閾値として定めた。ITSv2ハザード評価が誤っていた物質を除いて再評価したところ、R2値として学習用データで0.963、内部検証用データで0.681、外部検証用データで0.815であり、予測精度が大幅に向上した。また、適用範囲内の物質のみでCatBoostモデルを再構築することで、R2値として学習用データで0.995、内部検証用データで0.787、外部検証用データで0.824となり、予測精度が更に向上した。
【図面の簡単な説明】
【0019】
図1】本発明の代表的な実施形態にかかる情報処理システムの概略構成を示すブロック図。
図2】外部検証用データにのみNS物質を含んだ場合のModel R4による実測値-予測値のプロット図。
図3】最終的な予測系Model F1のワークフローを示す説明図。
図4】最終的な予測系モデルによる実測値-予測値のプロット図。
【発明を実施するための形態】
【0020】
次に、本発明の実施形態を添付図面に基づき詳細に説明する。
【0021】
本発明に係る情報処理システムは、コンピュータにより皮膚感作性の定量予測を行う情報処理システムであり、図1に示すように、処理装置2、記憶手段3、情報表示部4および入力手段5を備えた、単または複数の情報処理装置で構成されている。具体的には処理装置2を中心に、記憶手段3、ポインティングデバイスやキーボード、タッチパネルなどの入力手段5、ディスプレイなどの情報表示部4、その他図示しない通信制御部などを備えるコンピュータ装置である。なお、本実施形態は、皮膚感作性の定量予測を行うシステムを例に説明するが、本発明はこれに限定されず、反復投与毒性などの他の毒性や、代謝反応性など、広く化学物質によって引き起こされる事象のうち、陽性と陰性が定義でき、その陽性における指標を定量予測するシステムとして用いることができ、広い生物学的反応について用いることができる。
【0022】
処理装置2は、マイクロプロセッサなどのCPUを主体に構成され、図示しないRAM、ROMからなる記憶部を有して各種処理動作の手順を規定するプログラムや処理データが記憶される。記憶手段3は、情報処理システム1内外のメモリやハードディスクなどからなる。情報処理システム1に通信接続された他のコンピュータのメモリやハードディスクなどで一部又は全部の記憶部の内容を記憶してもよい。記憶手段3には、複数の化学物質の皮膚感作性の指標としてLLNAのEC3値の情報を、目的変数として記憶する目的変数記憶部31と、前記複数の化学物質に関するKE試験結果についての情報、化学構造についての情報、及び類似物質についての情報のうち少なくとも一つの情報を、説明変数として記憶する説明変数記憶部32とを有している。
【0023】
目的変数(LLNAのEC3値の情報)は、公的機関のWebサイトや論文から集めることができる。具体的な例としては、たとえば、次の2つのデータソースから195物質の情報を取得できる。
(データソース1)
Development of an artificial neural network model for risk assessment of skin sensitization using human cell line activation test, direct peptide reactivity assay, KeratinoSensTM and in silico structure alert parameter, M. Hirota(Shiseido Co. Ltd) et al., J Appl Toxicol. 2018; 38: 514-526.
(データソース2)
Development of quantitative model of a local lymph node assay for evaluating skin sensitizasion potency applying machine learning CatBoost, K. Ambe et al., Regulatory Toxicology and Pharmacology, 125 (2021) 105019。
【0024】
説明変数は、たとえば、目的変数を取得した物質について、分子記述子計算ソフトウェアにより取得される記述子や、文献より取得したLog(EC150(CD86)(μM)), Log(EC200(CD54)(μM)), Log(MIT(μM)), Log(CV75(μM)), Log(Adjusted Cys depletion), Log(Adjusted Lys depletion), Log(KEC1.5), h-CLAT P/N, CD86 P/N, CD54 P/N,DPRA P/N, KeratinoSensTM P/Nなどのデータ、さらにはこれらを学習用データに基づいて正規化したデータによって形成されるユークリッド空間において、各データと学習用データにおける感作性分類NS, Weak, Moderate, Strong, Extremeの物質との最短距離(「min_dist_NS」、「min_dist_Weak」、「min_dist_Moderate」、「min_dist_Strong」、「min_dist_Extreme」)、および最近傍物質のLog(EC3(μmol/cm2))及びLog(EC3値(「Nearest Log(EC3(μmol/cm2))」、「Nearest Log(EC3値)」)などが該当する。
【0025】
処理装置2は、機能的には、前記目的変数および説明変数の各情報を、学習用データと検証用データとに振り分けられて記憶する振り分け処理部21と、機械学習手法により、前記学習用データの前記目的変数および説明変数を用いて、前記EC3値の予測モデルを構築するとともに、前記検証用データの前記目的変数および説明変数を用いて前記予測モデルを評価し、予測モデルの必要な再構築を行う、予測モデル構築処理部22と、前記予測モデルを用いて、化学物質の予測される前記EC3値を出力する出力処理部23とを備えており、これらの処理機能は上記プログラムにより実現される。
【0026】
振り分け処理部21が振り分ける検証用データは、構築した予測モデルが、未知のデータにも適用できるか評価するためのテスト用データである。学習用データと検証用データを振り分ける際には、正規化・標準化により0~1に圧縮する等してスケールを合わせる処理を行うことが好ましい。これにより桁の異なるデータを同じ計算式で扱うことができる。また、振り分け処理部21は、検証用データについて、さらに内部検証用データと外部検証用データの2つに振り分ける。具体的には、目的変数および説明変数の各情報について、正規化・標準化により圧縮することでスケール(桁数)を合わせたうえ、学習用データと検証用データとに振り分けて記憶する。
【0027】
予測モデル構築処理部22は、学習用データに基づいてモデル構築を行い、内部検証用データへの当てはまりのよいモデルを採用することで過学習を回避し、外部検証用データで予測精度を客観的に評価する。予測モデルの構築は、ANN,Read-acrossなどを用いて行うことができる。なかでもCatBoostモデルは順列駆動型の手法によってカテゴリ変数をうまく扱い、over-fittingしにくい手法として、2017年に公開されたGBDTアルゴリズムである。本発明では説明変数としていくつかのカテゴリ変数を扱うため、CatBoostを用いることが好ましい。
【0028】
さらに、予測モデル構築処理部22では、皮膚感作性評価手法に関するガイドライン(OECD Test Guideline No. 497)収載の皮膚感作性評価手法(Defined Approach)のうちITSv2ハザード評価を組み合わせ、当該評価による正誤の結果を適用範囲の閾値として、評価が誤っていた物質を除く等して再評価することにより、過学習等を回避するように構成されている。ITSv2ハザード評価以外の方法として、同じくDefined Approach として広く知られている2 out of 3 approachや、3 out of 3 approachを用いることも可能である。予測モデル構築処理部22は、検証用の目的変数および説明変数を用いて、予測モデルの予測精度及び過学習の有無を評価する。具体的には、下記式で求まるR2値及びRMSE値により前記予測精度の評価及び過学習の有無判定を行う。
【0029】
【数2】
【0030】
R2値は、明確な規定はないが0.8以上が良いとされる。RMSEは、予測値-実際の値の二乗平均値の平方根である。学習用と検証用の比較に用いられ、小さい方がよい。たとえばR2値が、学習用データで「0.889」、検証用データで「0.372」であった場合、このモデルは過学習を起こしており改善が必要と評価する。過学習の有無は、内部検証用データを用いて判定する。予測精度は、外部検証用データを用いて評価する。
【0031】
出力処理部23は、ディスプレイなどに化学物質の予測される前記EC3値の結果を表示出力したり、通信接続されたクライアントコンピュータに結果を送信する等の処理を行うものである。
【0032】
以上、本発明の実施形態について説明したが、本発明はこうした実施例に何ら限定されるものではなく、例えば、処理装置をコンピュータによるソフトウエア処理で構成する代わりに、一部又は全部をハードウエア処理回路で構成することも好ましく、この場合、機械学習機構として人工知能用処理回路を用いることもでき、本発明の要旨を逸脱しない範囲において種々なる形態で実施し得ることは勿論である。
【実施例0033】
以下、具体的な実施例に基づき、本発明の情報処理システムを説明する。
【0034】
(目的変数の取得)
上述のデータソース1、2において、化合物名、CAS No.、SMILESのいずれか1つ以上が同一である重複物質に関して、データベースとしてより新しい論文を引用いているデータソース2のデータを採用する。重複を除いた195物質を解析対象とする。これら複数の化学物質におけるLLNAのEC3の値以外に、Log(EC150(CD86)(μM)), Log(EC200(CD54)(μM)), Log(MIT(μM)), Log(CV75(μM)), Log(Adjusted Cys depletion), Log(Adjusted Lys depletion), Log(KEC1.5), h-CLAT P/N, CD86 P/N, CD54 P/N, DPRA P/N, KeratinoSensTM P/N のデータを取得する(P/NはPositive/Negativeを示し、Logは常用対数である。)。
【0035】
さらに、ITSv2(OECD Guideline No. 497 ITSv2)ハザード評価に使用される各試験で適用範囲外となる物質(e.g. h-CLATの結果が陰性であり、LogP >3.5の物質)を解析対象から除外し、195物質を解析対象とする(OECD, 2022b)。ITSv2は、動物実験を行わずに化学物質の皮膚感作性ハザード(UN GHS NC(Not Classified) vs. Category 1)及びリスク(UN GHS NC vs. Sub-Category 1B vs. Sub-Category 1A)を特定するための評価法であり、OECD Guideline No. 497に収載されている (OECD., 2021)。皮膚感作性AOPに対応する2つの試験法(DPRA, OECD TG 442C; h-CLAT, OECD TG 442E)に加えて、OECD QSAR Toolbox (ver.4.5)による予測値に基づいて判定される。
【0036】
また、データを整理するために、LLNA Category NS(EC3(%) >100)のEC3(%)を、「150」に統一する (Ambe et al., 2021)。実際には感作性が無いためEC3値は定まらないが、回帰を行うために、上限値として「150」を設定する。同様に、LLNA Category Extreme(EC3(%) <0.1)のEC3(%)を、「0.1」に統一する。回帰の目的変数としてEC3値の常用対数値をとるため、小数点以下の微小な値は大きく負の値に変換される。理論上負の無限大までの値をとり得るため、EC3(%)の下限値を定める。
【0037】
EC150 (CD86) (μM)、EC200(CD54) (μM)について、Negativeの場合はそれぞれ「100000」を代入する。よって、Log(MIT(μM))の最大値は「5」となる。Adjusted Cys/Lys depletionは、対数値をとる際の真数条件を満たすため、最小値を「0.01」とする。KEC1.5は、最大値を「2000」に統一する。全195物質をEC3(%)について降順に並べ、S001-195の通し番号を振る.
【0038】
(説明変数の取得)
分子記述子計算ソフトウェアMordredにより、上記した195物質について分子記述子を取得する。全物質で計算可能で、全物質で同一の値を示さない記述子を取得する。その中で、全学習用データのLog(EC3(μmol/cm2)と相関が高く、記述子同士の相関が高くない記述子を「分子記述子セット1」とし、また、学習用データのうち皮膚感作性がNSでない物質のLog(EC3(μmol/cm2))と相関が高く、記述子同士の相関が高くない記述子を「分子記述子セット2」とし、これらを説明変数「Molecular descriptor1, 2」(以下、「MD1」、「MD2」と称す。)として使用する。
【0039】
また、文献より取得したデータであるLog(EC150(CD86)(μM)), Log(EC200(CD54)(μM)), Log(MIT(μM)), Log(CV75(μM)), Log(Adjusted Cys depletion), Log(Adjusted Lys depletion), Log(KEC1.5), h-CLAT P/N, CD86 P/N, CD54 P/N, DPRA P/N, KeratinoSensTM P/Nを、In vitro/chemico descriptor(以下、「IVD」と称す。)と定義する。
【0040】
そして、IVDとMD1、MD2を学習用データに基づいて正規化したデータによって形成されるユークリッド空間において、各データと、学習用データにおける感作性分類NS, Weak, Moderate, Strong, Extremeの物質との最短距離(「min_dist_NS」、「min_dist_Weak」、「min_dist_Moderate」、「min_dist_Strong」、「min_dist_Extreme」)、および最近傍物質のLog(EC3(μmol/cm2))及びLog(EC3値(「Nearest Log(EC3(μmol/cm2))」、「Nearest Log(EC3値)」)の7変数を、説明変数「Distance-based descriptoR1, 2」(以下、「DD1」、「DD2」と称す。)とする。以上のIVD, MD1、MD2、DD1、DD2を説明変数として、モデル構築に用いる。
【0041】
(振り分け処理)
皮膚感作性分類ではLLNACategory NS(EC3値 >100)をLLNANegative、それ以外(EC3値 ≦100)をLLNA Positiveとして、目的変数とする。回帰モデルでは、Log(EC3値)およびLog(EC3(μmol/cm2))を目的変数として使用する。(EC3値)*250/MWによって、EC3値をEC3(μmol/cm2)に変換可能である。また、EC3値について、振り分け処理部21により均一にデータを振り分けるために、上から1-5の番号を順に振り、1,3,5を学習用、2を内部検証用、4を外部検証用に設定する。
【0042】
(予測モデル構築)
予測モデル構築処理部22によるモデル構築は、Python for Windows v3.9.12を使用し、CatBoostRegressor for CatBoost(1.0.6)を使用できる。パラメータチューニングはベイズ最適化アルゴリズムに基づくパラメータチューニングツールoptuna(2.10.1)を使用し、「depth」、「learning_rate」、「bagging_temperature」、及び「od_type」についてチューニングを行うことが好ましい。
【0043】
分子記述子計算ソフトウェアMordredにより、全195物質で計算可能かつ分散が「0」でない703分子記述子を取得し、次の条件によりMD1、MD2を選定した。MD1の選定条件は、全学習用データのLog(EC3(μmol/cm2))との相関係数の絶対値が0.20以上で、且つ記述子同士の相関係数の絶対値が0.75以下の記述子である。MD2の選定条件は、学習用データのうち皮膚感作性がNSでない物質のLog(EC3(μmol/cm2))との相関係数の絶対値が0.30以上で、記述子同士の相関係数の絶対値が0.75以下の記述子である。上記の条件によって、表1に示すように、MD1として10個、MD2として9個の記述子が選定された。
【0044】
【表1】
【0045】
IVDとMD1、MD2をもとに、DD1、DD2をそれぞれ算出した。
【0046】
次に、IVDを用いて回帰モデルを構築した。各モデルのパラメータチューニングは、ベイズ最適化アルゴリズムに基づくパラメータチューニングツールoptunaを使用して行った。また、感作性NSの物質のEC3値は、上限値として「150」を与えている。これは実測値ではないため、連続値の予測において負の影響を及ぼす可能性がある。よって、NSの物質をデータに含めるか否かを条件の一つに設定した。評価指標をR2値、RMSEとして、目的変数およびNSデータの影響を確認した。結果を表2に示す。特に外部検証用データにおいて、NS物質を含んだ方がR2値は高い。これはNS物質がEC3値のとり得る値の幅を広げることで、高値を示しやすくなったためであると考えられる。
【0047】
【表2】
【0048】
NS物質以外についてのModel R1, R2による予測をModel R1’, R2’として評価指標を算出し比較した。結果を表3に示す。Model R3, R4はR1’, R2’と同等以上の予測精度であった。
【0049】
【表3】
【0050】
以上から、皮膚感作性NSの物質を除くことが、定量的予測において有効であることが示された。また、Model R1とR2、R3とR4の比較から、Log(EC3(%))を目的変数に設定するよりもLog(EC3(μmol/cm2))を設定した方が殆どの評価指標で良い値を示しており、Log(EC3(μmol/cm2))が目的変数として有効であることが示された。よって、以降の回帰モデルの目的変数をLog(EC3(μmol/cm2))とした。
【0051】
ただし、Log(EC3(μmol/cm2))を目的変数とし、NS物質を除いたデータを用いて構築されたModel R4によってNS物質を予測しようとすると、図2に示すように、NS物質を学習できていないため実測値よりも低い値に予測されてしまう。予測の段階ではNSか否かは知りえないので、皮膚感作性陽性物質のみのデータから得られる単一の回帰モデルによって、NS物質を含む多様なデータに対して有効なモデルを得ることは難しい。しかし逆に言えば、皮膚感作性ハザード評価法によって皮膚感作性陽性物質を特定することができれば、皮膚感作性陽性物質にのみModel R4のようなモデルを適用することができる。よって、OECD Guideline No. 497に収載されており信頼性の高い手法である、ITSv2ハザード評価を予測系に組み込むこととした。
【0052】
次に、MD(Molecular descriptor)、DD(Distance-based descriptor)の影響を評価した。結果を表4に示す。NS物質のデータを含む場合はNS物質データを含む条件で選択されたMD1、DD1を採用した。同様に、NS物質のデータを含まない場合はMD2,DD2を採用した。表4のModel R5とR6の比較、及びR7とR8の比較から、MDおよびDDは、ともに説明変数として予測に有効であることが示された。
【0053】
【表4】
【0054】
最終的なLLNA EC3予測値は、図3に示すように、ITSv2ハザード評価でNegativeであれば、Model R6の予測値とNegativeに相当する値であるLog(150*250/MW)との平均値として算出し、ITSv2ハザード評価でPositiveであれば、Model R6の予測値とModel R8の予測値との平均値として算出した。この予測系をModel F1として評価した結果を表5及び図4に示す。
【0055】
なお、ここまでの過程で、内部検証用データに対して著しく予測精度が悪かった。図4のModel F1の実測値-予測値のプロットを見てみると、内部検証用データにおいて明らかに予測が外れている物質が存在し、これらの多くはITSv2ハザード評価で誤った分類をされた物質であった。これらの物質は、ITSv2ハザード評価で想定されている皮膚感作性AOPを表現する各試験と皮膚感作性との対応に合致しない性質を有する物質であると考えられる。
【0056】
そこで、ITSv2ハザード評価がFalse Positive/Negativeであった物質を各データセットから除いてModel F1を評価した場合をModel F1’とした。尚、全195物質に対するITSv2ハザード評価の一致率は「0.790」、Balanced accuracyは「0.725」であった。
【0057】
また、ITSv2ハザード評価での予測がFalse Positive/Negativeであった物質を各データセットから除き、Model R6, 8に対応するModel R6’, 8’を再構築してModel F1に組み込んだものをModel F2として評価した。Model R6’, R8’では、MD1, 2と同様の手法で選択したMD1’,2’をMDとして使用し、DD1’,2’を算出した。
【0058】
【表5】
【0059】
表5からわかるように、Model F1では内部検証用データで予測精度が最も低く、R2値が「0.550」、RMSEが「0.639」であった。また、外部検証用データではR2値が「0.617」、RMSEが「0.637」であった。Model F1’では内部検証用データでR2値が「0.681」、RMSEが「0.537」、外部検証用データでR2値が「0.815」、RMSEが「0.441」であり、ITSv2ハザード評価で誤った分類をされた物質をモデル適用範囲外とすることで過学習が軽減され、大幅に予測精度が向上した。また、適用範囲内の物質のみを用いてCatBoostモデルを再構築したModel F2では、外部検証用データでR2値が「0.824」、RMSEが「0.430」であり、Model F1およびModel F1’の予測精度を上回った。これは、ITSv2で想定されているAOPを表現する各試験とLLNA Positive/Negativeとの対応に則っていると考えられる物質に限定することで、より鮮明に定量的な予測を行うことができたためであると考えられる。
【0060】
尚、Model F1からModel R6を除いた場合の予測精度は、R2値として学習用データで「0.670」、内部検証用データで「0.542」、外部検証用データで「0.548」であり、元のModel F1の予測精度を下回った(data not shown)。この結果は、Model R6がITSv2ハザード評価による誤分類の影響を緩和する作用を有することを示した。このように、Model R6を除けばITSv2ハザード評価の負荷が大きく、ITSv2ハザード評価を除けばR8による陽性物質に対する予測精度の補強をうまく機能させられず、Model R8を除けば陽性物質の予測が弱くなってしまう。この予測系は3つの予測モデルがバランス良く組み合わせられ、負荷が分散するような構成となっている。
【0061】
また、UN GHS分類に則り、予測値をEC3(%)に換算したときに100より大きいまたはITSv2ハザード評価による分類でNegativeなら「NC」とし、EC3%が2以上100以下ならSub category「1B」とし、2未満ならSub category 「1A」として、3つのクラスに分類し、評価した結果を表6に示す (United Nations. Economic Commission for 2021)。
【0062】
【表6】
【0063】
表6からわかるように、Model F2による分類では最も予測精度の低い外部検証用データにおいても一致率が「0.879」であり、十分な予測精度が得られた。また、Model F1の予測値による分類ではITSv2リスク評価と比較して同等以上の予測精度であった。言い換えれば、ITSv2リスク評価の一致率は各データセットで60-70%であり、機械学習モデルに近い予測精度を示す有用なリスク評価法であることが確認できた。
【0064】
また、Model R6, R8, R6’, R8’について、変数重要度を算出した結果を表7に示す。
【0065】
【表7】
【0066】
尚、表7中、Log(Adjusted Cys depletion)、Log(CV75(μM))、Log(EC150 (CD86)(μM))、Log(Adjusted Lys depletion)、Log(MIT(μM))、DPRA P/N、Log(EC200(CD54)(μM))、Log(KEC1.5)はIVDであり、MATS2dv、ATSC6dv、AATS0v、GATS2dv、GATS1m、ZMIC5、piPC6、NaasC、BalabanJ、VSA_EState8、ZMIC2、ATSC8vはMDであり、Nearest Log(EC3(μmol/cm2))、min dist Weak、min dist Moderate、min dist NSはDDである。
【0067】
表7に示すように、Log(CV75(μM))及びLog(MIT(μM))は、すべてのモデルで上位10変数として使用されている。これらはh-CLATに関する変数であり、h-CLATがEC3値の定量的な予測に重要であるという既報の内容と合致する結果であった (Ambe et al., 2021; Hirota et al., 2018)。また、Molecular descriptorについても、GATS2dv(geary coefficient of lag 2 weighted by valence electrons)やMATS2dv(moran coefficient of lag 2 weighted by valence electrons)などの変数が上位に見られた。これらは価電子を重みとした空間的自己相関を表現する変数であり、化学構造中の価電子の分布を表現する。
【0068】
(考察)
以上説明した実施例では、皮膚感作性AOPの各KEに対応する試験データであるin vitro/chemico descriptor、化学構造に基づいて計算で求められるMolecular descriptor、リード・アクロスの考え方に基づくDistance-based descriptorを用いて、IATAアプローチに基づいてLLNAEC3値を定量的に予測するin silicoモデルを構築した。また、予測モデル内においてITSv2ハザード評価による分類を組み込むこと、ITSv2ハザード評価による分類の正確さをモデルの適用範囲の閾値とすることの有用性を示した。
【0069】
全195物質をEC3(%)に関して降順に並べ、学習用、内部検証用、外部検証用データに振り分けた。この方法は、各データセットにおける皮膚感作強度の分布を可能な限り均一にする為である。内部検証用データをパラメータチューニングに用いることで過学習を回避し、外部検証用データで予測精度を客観的に評価した。交差検証を採用しなかった理由は、各データセットに対する各予測モデルの評価結果を比較しやすくする為である。各データセットの分類可能性や、過学習を容易に確認することができた。
【0070】
皮膚感作性ハザード評価手法としてITSv2を採用することは、実施の為のデータが揃っていることに加え、信頼性の部分でも大きな利点がある。ITSv2はOECD Guideline No. 497に収載されており、LLNA Positive/Negativeとの一致率は88%、Balanced Accuracyは80%と公表されている(OECD., 2021)。本実施例のデータに対しても、全195物質に対して一致率が「0.790」、Balanced Accuracy が「0.725」と、公表値に至らないまでも高い予測精度を示した。
【0071】
In silico予測モデルにおいて、幅広い化学物質に対する予測の信頼性を担保することは難しい課題である。本発明では外部検証用データを設定することで客観的検証を行っており、また、適切な適用限界を設けることもひとつの対応策である。本例ではITSv2ハザード評価が誤っていた物質は、ITSv2で想定されている皮膚感作性AOPを表現する各試験と皮膚感作性との対応に合致しない性質を有する物質であると考え、ITSv2ハザード評価の正誤を適用限界の閾値として定めた。
【0072】
これによって予測精度が大きく向上し、上記のとおり、Model F1’では外部検証用データにおいてR2値が「0.815」、RMSEが「0.441」を示した。ITSv2の一致率が公表値で88%、今回のデータでも79%であることから、適用範囲は狭すぎず、多くの物質についての予測を許容する閾値となり得る。ただし、ITSv2ハザード評価が当たっているかどうかは、予測段階ではLLNAの結果が分からないため、事前に判断することはできない。よって、実際にLLNAの結果が未知の物質を評価するにあたっては、別途ITSv2ハザード評価への適合性を判定する手法を開発する必要がある。例えばh-CLATでは、LogP>3.5の化学物質に対する陰性判定は信頼性が低いと報告されており、このような各試験の適用範囲外の物質は、ITSv2の適用範囲外として定められている(OECD., 2021)。適合性については、各試験の適用範囲だけでなく、包括的に検討する必要があるだろう。
【0073】
本実施例における最終的な予測モデルでは、分類と回帰を組み合わせることで、NS物質をデータから除いた場合に予測精度が向上する性質を利用することができた。NS物質を除いた方がよいことは、上記のとおり、Model R1-R4の比較で示されており、NS物質が本来EC3値を有さないことからも推察できる。この組み合わせアプローチに加えてITSv2ハザード評価の正誤に基づく適用限界を定めることで、Model F2では外部検証用データへの予測精度がR2値が「0.824」、RMSEが「0.430」に向上した。
【0074】
また、Model F1, F1’, F2を構成するModel R6, R8, R6’, R8’において、h-CLATの値が予測に有用であるという既報に合致する結果に加え、リード・アクロスの考え方に基づく変数や、化学構造における価電子数の分布を表す分子記述子等、多様な変数の重要性が示された。皮膚感作性物質は一般に求電子性を有するとされており、これらの変数は化学物質の求電子性を含む反応性を表現している可能性がある (OECD, 2022a)。
【0075】
また、予測したEC3値を用いた多クラス分類について、UN GHS分類に基づく3クラス分類では、ITSv2, Model F1, F2の外部検証用データにおける一致率はそれぞれ「0.667」,「0.744」,「0.879」であった。Model F2において、適用範囲の設定によって分類でも高い一致率を得ることが出来ている。ただし、Model F1とModel F2とでは、ITSv2ハザード評価で誤分類の物質を除いたことで評価対象のデータセットが異なるため、注意が必要である。
【0076】
EC3値を定量的に予測することでUN GHS分類や感作性強度の比較など、評価における自由度が大きく向上する。例えばHRIPT(Human Repeated Insult Patch Test)等のヒト評価での適切な暴露濃度の検討において、分類による事前評価のみでは、暴露濃度を定量的に検討することができない。In silicoモデルによるリスク評価のためのPoD(Point of Departure)の予測は、皮膚感作性評価の実施において今後重要な役割を果たすことが期待される (Api et al., 2020; Natsch et al., 2014)。
【産業上の利用可能性】
【0077】
機械学習モデルおよびITSv2ハザードを利用して、LLNA EC3値を定量的に予測するin silico 評価系を構築した。適用範囲の指定と外部検証用データによる外部データの予測性能の評価によって、より頑健な予測モデルを構築することができた。本発明におけるモデル構築、評価、limitationのデザインはin silico毒性予測評価研究の進展に寄与し、化学物質の皮膚感作性評価に貢献することを確信している。
【符号の説明】
【0078】
1 情報処理システム
2 処理装置
3 記憶手段
4 情報表示部
5 入力手段
21 振り分け処理部
22 予測モデル構築処理部
23 出力処理部
31 目的変数記憶部
32 説明変数記憶部
図1
図2
図3
図4