IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ EPSホールディングス株式会社の特許一覧

特開2022-67563統計シグナル推論モデルを生成するための方法、並びに、当該統計シグナル推論モデル用いて統計シグナルの推定値を得るための方法、システム及びプログラム
<>
  • 特開-統計シグナル推論モデルを生成するための方法、並びに、当該統計シグナル推論モデル用いて統計シグナルの推定値を得るための方法、システム及びプログラム 図1
  • 特開-統計シグナル推論モデルを生成するための方法、並びに、当該統計シグナル推論モデル用いて統計シグナルの推定値を得るための方法、システム及びプログラム 図2
  • 特開-統計シグナル推論モデルを生成するための方法、並びに、当該統計シグナル推論モデル用いて統計シグナルの推定値を得るための方法、システム及びプログラム 図3A
  • 特開-統計シグナル推論モデルを生成するための方法、並びに、当該統計シグナル推論モデル用いて統計シグナルの推定値を得るための方法、システム及びプログラム 図3B
  • 特開-統計シグナル推論モデルを生成するための方法、並びに、当該統計シグナル推論モデル用いて統計シグナルの推定値を得るための方法、システム及びプログラム 図4
  • 特開-統計シグナル推論モデルを生成するための方法、並びに、当該統計シグナル推論モデル用いて統計シグナルの推定値を得るための方法、システム及びプログラム 図5A
  • 特開-統計シグナル推論モデルを生成するための方法、並びに、当該統計シグナル推論モデル用いて統計シグナルの推定値を得るための方法、システム及びプログラム 図5B
  • 特開-統計シグナル推論モデルを生成するための方法、並びに、当該統計シグナル推論モデル用いて統計シグナルの推定値を得るための方法、システム及びプログラム 図5C
  • 特開-統計シグナル推論モデルを生成するための方法、並びに、当該統計シグナル推論モデル用いて統計シグナルの推定値を得るための方法、システム及びプログラム 図5D
  • 特開-統計シグナル推論モデルを生成するための方法、並びに、当該統計シグナル推論モデル用いて統計シグナルの推定値を得るための方法、システム及びプログラム 図6
  • 特開-統計シグナル推論モデルを生成するための方法、並びに、当該統計シグナル推論モデル用いて統計シグナルの推定値を得るための方法、システム及びプログラム 図7
  • 特開-統計シグナル推論モデルを生成するための方法、並びに、当該統計シグナル推論モデル用いて統計シグナルの推定値を得るための方法、システム及びプログラム 図8A
  • 特開-統計シグナル推論モデルを生成するための方法、並びに、当該統計シグナル推論モデル用いて統計シグナルの推定値を得るための方法、システム及びプログラム 図8B
  • 特開-統計シグナル推論モデルを生成するための方法、並びに、当該統計シグナル推論モデル用いて統計シグナルの推定値を得るための方法、システム及びプログラム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022067563
(43)【公開日】2022-05-06
(54)【発明の名称】統計シグナル推論モデルを生成するための方法、並びに、当該統計シグナル推論モデル用いて統計シグナルの推定値を得るための方法、システム及びプログラム
(51)【国際特許分類】
   G16H 20/10 20180101AFI20220425BHJP
   G06N 20/00 20190101ALI20220425BHJP
【FI】
G16H20/10
G06N20/00 130
【審査請求】有
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2020176322
(22)【出願日】2020-10-20
(71)【出願人】
【識別番号】520153648
【氏名又は名称】EPSホールディングス株式会社
(74)【代理人】
【識別番号】100118902
【弁理士】
【氏名又は名称】山本 修
(74)【代理人】
【識別番号】100106208
【弁理士】
【氏名又は名称】宮前 徹
(74)【代理人】
【識別番号】100196508
【弁理士】
【氏名又は名称】松尾 淳一
(72)【発明者】
【氏名】▲高▼木 毅
(72)【発明者】
【氏名】岡島 伸之
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA25
(57)【要約】
【課題】医薬品の化学構造式に基づき、当該医薬品についての統計シグナルを推定すること。
【解決手段】本発明の一態様によれば、統計シグナル推論モデルを生成する方法100が提供される。当該方法は、複数の教師データを準備するステップ120であって、各教師データは、医薬品の化学構造式を符号化したデータと、有害事象を符号化したデータと、当該医薬品及び当該有害事象に少なくとも関連した統計シグナルの実際値とを含む、ステップと、前記複数の教師データを用いた機械学習により、統計シグナル推論モデルを生成するステップ130であって、該統計シグナル推論モデルは、医薬品の化学構造式を符号化したデータと、有害事象を符号化したデータとを少なくとも入力とし、符号化したデータが入力された前記医薬品及び前記有害事象に少なくとも関連した統計シグナルの推定値を出力とする、ステップとを含む。
【選択図】図1
【特許請求の範囲】
【請求項1】
複数の教師データを準備するステップであって、各教師データは、
医薬品の化学構造式を符号化したデータと、
有害事象を符号化したデータと、
当該医薬品及び当該有害事象に少なくとも関連した統計シグナルの実際値と
を含む、ステップと、
前記複数の教師データを用いた機械学習により、統計シグナル推論モデルを生成するステップであって、該統計シグナル推論モデルは、
医薬品の化学構造式を符号化したデータと、
有害事象を符号化したデータと
を少なくとも入力とし、
符号化したデータが入力された前記医薬品及び前記有害事象に少なくとも関連した統計シグナルの推定値
を出力とする、ステップと
を含む方法。
【請求項2】
請求項1に記載の方法であって、
各教師データは、層別条件を符号化したデータを更に含み、当該教師データに実際値が含まれる統計シグナルは、当該層別条件にも関連し、
前記統計シグナル推論モデルは、層別条件を符号化したデータを更に入力とし、当該入力に対して推定値が出力される前記統計シグナルは、当該層別条件にも関連した、
方法。
【請求項3】
請求項1に記載の方法であって、
各教師データに実際値が含まれる統計シグナルは、所定の層別条件にも関連し、
前記統計シグナル推論モデルにおいて推定値が出力される統計シグナルは、前記所定の層別条件にも関連した、
方法。
【請求項4】
請求項1から3のうちの何れか一項に記載の方法であって、
複数の教師データを準備する前記ステップは、医薬品の化学構造式を符号化した前記データの少なくとも一部として、該化学構造式をグラフ構造として符号化したデータをメモリから取得又は生成するステップを含み、
前記統計シグナル推論モデルは、医薬品の化学構造式をグラフ構造として符号化した前記データを入力とするグラフ畳み込みネットワークを含む、
方法。
【請求項5】
請求項1から4のうちの何れか一項に記載の方法により生成された統計シグナル推論モデル。
【請求項6】
医薬品の化学構造式を符号化したデータと、
有害事象を符号化したデータと
を含む入力データを準備するステップと、
前記入力データを統計シグナル推論モデルへの入力として用いることにより、該統計シグナル推論モデルの出力として前記医薬品及び前記有害事象に少なくとも関連した統計シグナルの推定値を取得するステップと
をコンピュータに実行させるプログラムであって、前記統計シグナル推論モデルは、
様々な医薬品の化学構造式を符号化したデータと、
様々な有害事象を符号化したデータと、
各医薬品及び各有害事象に関連した統計シグナルの実際値と
を少なくとも用いた機械学習により生成されたものである、プログラム。
【請求項7】
請求項6に記載にプログラムであって、
前記入力データは、層別条件を符号化したデータを更に含み、
前記統計シグナル推論モデルから推定値が出力される前記統計シグナルは、前記層別条件にも関連し、
前記統計シグナル推論モデルを生成するための機械学習は、様々な層別条件を符号化したデータをも用い、
実際値が前記統計シグナル推論モデルを生成するための機械学習で用いられる前記統計シグナルは、各層別条件にも関連した、
プログラム。
【請求項8】
請求項6に記載のプログラムであって、
前記統計シグナル推論モデルから推定値が出力される統計シグナルは、所定の層別条件にも関連し、
実際値が前記統計シグナル推論モデルを生成するための機械学習で用いられる統計シグナルは、前記所定の層別条件にも関連した、
プログラム。
【請求項9】
請求項6から8のうちの何れか一項に記載のプログラムであって、
入力データを準備する前記ステップは、医薬品の化学構造式を符号化した前記データの少なくとも一部として、該化学構造式をグラフ構造として符号化したデータをメモリから取得又は生成するステップを含み、
前記統計シグナル推論モデルは、医薬品の化学構造式をグラフ構造として符号化した前記データを入力とするグラフ畳み込みネットワークを含む、
プログラム。
【請求項10】
医薬品の化学構造式を符号化したデータと、
有害事象を符号化したデータと
を含む入力データを準備するステップと、
前記入力データを統計シグナル推論モデルへの入力として用いることにより、該統計シグナル推論モデルの出力として前記医薬品及び前記有害事象に少なくとも関連した統計シグナルの推定値を取得するステップと
を含む方法であって、前記統計シグナル推論モデルは、
様々な医薬品の化学構造式を符号化したデータと、
様々な有害事象を符号化したデータと、
各医薬品及び各有害事象に関連した統計シグナルの実際値と
を少なくとも用いた機械学習により生成されたものである、方法。
【請求項11】
医薬品の化学構造式を符号化したデータと、
有害事象を符号化したデータと
を含む入力データを準備し、
前記入力データを統計シグナル推論モデルへの入力として用いることにより、該モデルの出力として前記医薬品及び前記有害事象に少なくとも関連した統計シグナルの推定値を取得する
ように構成されたシステムであって、前記統計シグナル推論モデルは、
様々な医薬品の化学構造式を符号化したデータと、
様々な有害事象を符号化したデータと、
各医薬品及び各有害事象に関連した統計シグナルの実際値と
を少なくとも用いた機械学習により生成されたものである、システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、医薬品の有害事象についての統計シグナルを推定することに関する。より詳細には、本発明は、医薬品の化学構造式に基づき、当該医薬品の有害事象についての統計シグナルを推定することに関する。
【背景技術】
【0002】
医薬品の安全対策のため、それまで知られていなかったか、又は、不完全にしか立証されていなかった有害事象と、当該医薬品との因果関係の可能性を表現する情報として、シグナルと呼ばれるものが用いられている。特に、医薬品を投与した症例情報を統計的に分析した結果得られた数値評価である統計シグナルと呼ばれるものが用いられている。
【0003】
これに関連して、機械学習ロジスティック回帰モデルを用いて、コンピュータの情報処理により、薬物有害事象を予測する方法が提案されている(特許文献1を参照。)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特許第6722076号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
従来、医薬品を投与した症例情報の不足等により、統計的手法では統計シグナルを計算することができない場合があった。
本発明は、以上に鑑みてなされたものである。
【0006】
本発明の課題の1つは、機械学習を用いて、医薬品の化学構造式に基づき、当該医薬品の有害事象についての統計シグナルを推定することが可能な統計シグナル推論モデルを生成することである。
【0007】
本発明の課題の1つは、上記のような統計シグナル推論モデルを用いて、医薬品の化学構造式に基づき、当該医薬品の有害事象についての統計シグナルを推定することである。
【課題を解決するための手段】
【0008】
本発明の一態様によれば、統計シグナル推論モデルを生成する方法が提供される。当該方法は、複数の教師データを準備するステップであって、各教師データは、医薬品の化学構造式を符号化したデータと、有害事象を符号化したデータと、当該医薬品及び当該有害事象に少なくとも関連した統計シグナルの実際値とを含む、ステップと、前記複数の教師データを用いた機械学習により、統計シグナル推論モデルを生成するステップであって、該統計シグナル推論モデルは、医薬品の化学構造式を符号化したデータと、有害事象を符号化したデータとを少なくとも入力とし、符号化したデータが入力された前記医薬品及び前記有害事象に少なくとも関連した統計シグナルの推定値を出力とする、ステップとを含む。
【0009】
かかる構成によれば、統計シグナル推論モデルを生成することができる。
上記方法において、各教師データは、層別条件を符号化したデータを更に含み、当該教師データに実際値が含まれる統計シグナルは、当該層別条件にも関連し、前記統計シグナル推論モデルは、層別条件を符号化したデータを更に入力とし、当該入力に対して推定値が出力される前記統計シグナルは、当該層別条件にも関連していてよい。
【0010】
かかる構成によれば、様々な層別条件に対応した統計シグナル推論モデルを生成することができる。
上記方法において、各教師データに実際値が含まれる統計シグナルは、所定の層別条件にも関連し、前記統計シグナル推論モデルにおいて推定値が出力される統計シグナルは、前記所定の層別条件にも関連していてよい。
【0011】
かかる構成によれば、所定の層別条件についての又は層別条件ごとの統計シグナル推論モデルを生成することができる。
上記方法は、複数の教師データを準備する前記ステップは、医薬品の化学構造式を符号化した前記データの少なくとも一部として、該化学構造式をグラフ構造として符号化したデータをメモリから取得又は生成するステップを含んでいてよく、前記統計シグナル推論モデルは、医薬品の化学構造式をグラフ構造として符号化した前記データを入力とするグラフ畳み込みネットワークを含んでいてよい。
【0012】
かかる構成によれば、医薬品の化学構造式の特徴を適切に使用して、統計シグナル推論モデルを生成することができる。
本発明の一態様によれば、上記方法により生成された統計シグナル推論モデルが提供される。
【0013】
本発明の一態様によれば、統計シグナルの推定値を得るためのプログラムが提供される。当該プログラムは、医薬品の化学構造式を符号化したデータと、有害事象を符号化したデータとを含む入力データを準備するステップと、前記入力データを統計シグナル推論モデルへの入力として用いることにより、該統計シグナル推論モデルの出力として前記医薬品及び前記有害事象に少なくとも関連した統計シグナルの推定値を取得するステップとをコンピュータに実行させるものである。なお、前記統計シグナル推論モデルは、様々な医薬品の化学構造式を符号化したデータと、様々な有害事象を符号化したデータと、各医薬品及び各有害事象に関連した統計シグナルの実際値とを少なくとも用いた機械学習により生成されたものである。
【0014】
かかる構成によれば、医薬品の化学構造式に基づき、当該医薬品の所与の有害事象についての統計シグナルの推定値を得ることができる。
上記プログラムにおいて、前記入力データは、層別条件を符号化したデータを更に含んでいてよく、前記統計シグナル推論モデルから推定値が出力される前記統計シグナルは、前記層別条件にも関連していてよく、前記統計シグナル推論モデルを生成するための機械学習は、様々な層別条件を符号化したデータをも用いてよく、実際値が前記統計シグナル推論モデルを生成するための機械学習で用いられる前記統計シグナルは、各層別条件にも関連していてよい。
【0015】
かかる構成によれば、医薬品の化学構造式に基づき、当該医薬品の所与の有害事象についての所与の層別条件下での統計シグナルの推定値を得ることができる。
上記プログラムにおいて、前記統計シグナル推論モデルから推定値が出力される統計シグナルは、所定の層別条件にも関連していてよく、実際値が前記統計シグナル推論モデルを生成するための機械学習で用いられる統計シグナルは、前記所定の層別条件にも関連していてよい。
【0016】
かかる構成によれば、医薬品の化学構造式に基づき、当該医薬品の所与の有害事象についての所定の層別条件下での統計シグナルの推定値を得ることができる。
上記プログラムにおいて、入力データを準備する前記ステップは、医薬品の化学構造式を符号化した前記データの少なくとも一部として、該化学構造式をグラフ構造として符号化したデータをメモリから取得又は生成するステップを含んでいてよく、前記統計シグナル推論モデルは、医薬品の化学構造式をグラフ構造として符号化した前記データを入力とするグラフ畳み込みネットワークを含んでいてよい。
【0017】
かかる構成によれば、医薬品の化学構造式の特徴を適切に使用して、統計シグナルの推定値を得ることができる。
本発明の一態様によれば、統計シグナルの推定値を得るための方法が提供される。当該方法は、医薬品の化学構造式を符号化したデータと、有害事象を符号化したデータとを含む入力データを準備するステップと、前記入力データを統計シグナル推論モデルへの入力として用いることにより、該統計シグナル推論モデルの出力として前記医薬品及び前記有害事象に少なくとも関連した統計シグナルの推定値を取得するステップとを含む。また、前記統計シグナル推論モデルは、様々な医薬品の化学構造式を符号化したデータと、
様々な有害事象を符号化したデータと、各医薬品及び各有害事象に関連した統計シグナルの実際値とを少なくとも用いた機械学習により生成されたものである。
【0018】
かかる構成によれば、医薬品の化学構造式に基づき、当該医薬品の所与の有害事象についての統計シグナルの推定値を得ることができる。
本発明の一態様によれば、統計シグナルの推定値を得るためのシステムが提供される。当該システムは、医薬品の化学構造式を符号化したデータと、有害事象を符号化したデータとを含む入力データを準備し、前記入力データを統計シグナル推論モデルへの入力として用いることにより、該モデルの出力として前記医薬品及び前記有害事象に少なくとも関連した統計シグナルの推定値を取得するように構成されたものである。また、前記統計シグナル推論モデルは、様々な医薬品の化学構造式を符号化したデータと、様々な有害事象を符号化したデータと、各医薬品及び各有害事象に関連した統計シグナルの実際値とを少なくとも用いた機械学習により生成されたものである。
【0019】
かかる構成によれば、医薬品の化学構造式に基づき、当該医薬品の所与の有害事象についての統計シグナルの推定値を得ることができる。
【発明の効果】
【0020】
本発明の実施形態によれば、患者に投与した結果、有害事象が報告されていない等の理由により、安全対策に必要な統計シグナルを計算するためのデータが存在しない医薬品であったとしても、その化学構造式に基づき、所与の有害事象についての統計シグナルを推定することができる。
【0021】
また、本発明の実施形態によれば、統計シグナル推論モデルを活用して、従来の業務プロセスを改善したり、新たなサービスを提供したりすることができる。
【図面の簡単な説明】
【0022】
図1】統計シグナル推論モデルを生成するための例示の方法100のフローチャートである。
図2】ステップ110が含む例示の処理200のフローチャートである。
図3A】統計シグナル推論モデルを生成するための例示のニューラルネットワーク300Aを表す図である。
図3B】統計シグナル推論モデルを生成するための別の例示のニューラルネットワーク300Bを表す図である。
図4】GCNにおける処理を説明するための例示のグラフである。
図5A】ノードnについて、複数のベクトルに基づき新たに1つのベクトルを計算する例示の処理を表す図である。
図5B】ノードnについて、複数のベクトルに基づき新たに1つのベクトルを計算する例示の処理を表す図である。
図5C】ノードnについて、複数のベクトルに基づき新たに1つのベクトルを計算する例示の処理を表す図である。
図5D】ノードnについて、複数のベクトルに基づき新たに1つのベクトルを計算する例示の処理を表す図である。
図6】統計シグナルを推定するための例示の方法600のフローチャートである。
図7】統計シグナル推論モデルの妥当性を説明するための例示の表700である。
図8A】統計シグナル推論モデルを活用した業務プロセスの概念図である。
図8B】統計シグナル推論モデルを活用した業務プロセスのイメージである。
図9】コンピュータのハードウエア構成の一例を表す図である。
【発明を実施するための形態】
【0023】
1 統計シグナル推論モデルの生成
図1は、本発明の一実施形態に係る、統計シグナル推論モデルを生成するための例示の方法100のフローチャートである。
【0024】
110は、基礎データを準備するステップを示している。本実施形態において統計シグナル推論モデルの生成には複数の教師データが必要なところ、この基礎データは、当該教師データを生成するために用いられるものである。ステップ110は、人による作業を含んでいてよい。
【0025】
図2は、ステップ110が含む例示の処理200のフローチャートである。
210は、様々な医薬品の投与についての既知の様々な症例情報を入手するステップを示している。
【0026】
症例情報は、オープンデータとして各国の医薬品に関する規制当局が公開している、医薬品を投与した結果発現した有害事象を記録したデータベース(以下、「有害事象データベース」という。)から入手してよい。そのようなデータベースとしては、JADER(日本)やFAERS(米国)、Canada Vigilance(カナダ)が挙げられる。また、症例情報は、Vigibase(WHO)等の有料のデータベースや、Eudra Vigilance(欧州)等の認可制のデータベースから入手してもよい。更に、症例情報は、本発明を実施する製薬企業等が自社で記録している非公開の自社データベースから入手してもよい。
【0027】
なお、症例情報は、一般的には以下のような情報を含むものであるが、含まれる情報はこれに限定されるわけではない。
・ 症例の識別番号
・ 当該症例に係る患者の性別や年齢等の身体的特徴
・ 当該患者に投与した医薬品の一般名(成分名)
・ 当該患者に投与した医薬品の販売名(製品名)
・ 当該患者に投与した医薬品の有害事象に対する関与(特定の有害事象に対する被疑薬となっているか等)
・ 当該患者に投与した医薬品の使用理由
・ 当該患者に発現した有害事象(有害事象名)
220は、様々な医薬品の化学構造式についての情報を入手するステップを示している。
【0028】
上市済みの医薬品の化学構造は、各種データベースにオープンデータとして公開されている。そのようなデータベースとして、限定するわけではないが、KEGGやPubChem、Wikipediaが挙げられる。
【0029】
230は、入手した化学構造式についての情報に基づき、入手した症例情報に現れる各医薬品を特定する名称に、化学構造式を関連付けるステップを示している。このステップにより、各医薬品に化学構造式が対応付けられることになる。
【0030】
240は、ステップ210において入手した症例情報に基づき、1以上の統計シグナルを計算するステップを示している。以下、入手した症例情報に基づき実際に計算された統計シグナルを、統計シグナルの『実際値』という。
【0031】
計算される1以上の統計シグナルは、限定するわけではないが、Proportional Reporting Ratios(PRR)、Reporting Odds Ratio(ROR)、Bayesian Confidence Propagation Neural Network(BCPNN)及びGamma-Poisson Shrinker(GPS)のうちの1以上であってよい。以下、これら統計シグナルについて説明する。
【0032】
統計シグナルは、1つの医薬品(注目する医薬品)及び1つの有害事象(注目する有害事象)の組ごとに計算されるものである。統計シグナルを計算するためには、症例情報に基づき、以下のような四分表を作成する。
【0033】
【表1】
【0034】
以下、上記四分表における変数nxxについて説明する。
11は、入手した症例情報から把握される、注目する医薬品の投与と注目する有害事象の発現とが同時に現れた例数又は件数(以下、『例数等』という。)に対応するものである。なお、例数とは症例を識別する番号の一意性を考慮して数え上げた数であり、件数とは医薬品を投与することで発現した医薬品毎の有害事象の数である。例えば、1つの症例について同じ医薬品を2回投与し、各投与について同じ有害事象が発現した場合、例数としてのカウントは1であるが、件数としてのカウントは2となる。
【0035】
1+は、入手した症例情報から把握される、注目する医薬品の投与が現れた例数等に対応する。
+1は、入手した症例情報から把握される、注目する有害事象の発現が現れた例数等に対応する。
【0036】
++は、入手した症例情報から把握される、全ての例数等に対応する。
その他の変数nxxは、上記n11、n1+、n+1及びn++に基づき計算されてよい。
【0037】
上に例示したPRR、ROR、BCPNN及びGPSは公知の統計シグナルであるが、そのうちの幾つかの計算すべき値について、以下、説明する。
PRRの実際値として計算すべき値(PRR)は、以下のように定義されるものである。
【0038】
【数1】
【0039】
PRRについては、関連する標準誤差(SE(logPRR))及び95%信頼区間(95%CI)を以下のように定義することができる。
【0040】
【数2】
【0041】
RORの実際値として計算すべき値(ROR)は、以下のように定義されるものである。
【0042】
【数3】
【0043】
RORについては、関連する標準誤差(SE(logROR))及び95%信頼区間(95%CI)を以下のように定義することができる。
【0044】
【数4】
【0045】
BCPNNの実際値として計算すべき値(E(IC11))は、以下のように定義されるものである。
【0046】
【数5】
【0047】
BCPNNについては、関連する分散(V(IC11))及びおおよその95%信頼区間(CI)を以下のように定義することができる。
【0048】
【数6】
【0049】
ここで、α、β及びγ(添え字付きのものを含む)はハイパーパラメータであり、適宜値を設定すべきものである。
上記数式から明らかなように、1つの統計シグナルは、1つの医薬品(注目する医薬品)及び1つの有害事象(注目する有害事象)に少なくとも関連することになる。
【0050】
なお、上記四分表は、所定の層別条件のみに作成されるか、あるいは、層別条件ごとに複数作成されてもよい。層別条件とは、患者の性別(例えば、患者は、男性、女性及び不明のうちの何れか1つに分類することができる。)や年代(例えば、患者は、0~9歳、10~19歳、…のうちの何れか1つに分類することができる。)等の患者についての条件のことである。即ち、表におけるn11は、所与の層別条件に該当する患者について、注目する医薬品の投与と注目する有害事象の発現とが同時に現れた例数等に対応し、n1+は、当該所与の層別条件に該当する患者について、注目する医薬品の投与が現れた例数等に対応し、n+1は、当該所与の層別条件に該当する患者について、注目する有害事象の発現が現れた例数等に対応し、n++は、当該所与の層別条件に該当する患者についての全ての例数等に対応してよい。上記四分表を層別条件ごとに作成する場合、1つの統計シグナルは、1つの医薬品(注目する医薬品)、1つの有害事象(注目する有害事象)及び1つの層別条件(所与の層別条件)に関連することになる。
【0051】
また、ステップ240は、信頼区間等の上述した関連する値を計算するステップを含んでいてもよい。
1150Xは、基礎データを生成するステップを示している。基礎データは、以上のステップにより得られた情報を整理したものである。より詳細には、基礎データは、医薬品及び有害事象の組(層別条件を用いる場合には、医薬品、有害事象及び層別条件の組)ごとに、以下のような情報を含んでいてよいが、基礎データに含まれる情報は、これに限定されるわけではない。
【0052】
・ 医薬品名(drugname)
・ 有害事象名(reacname)
・ 層別条件
・ 統計シグナルの実際値
・ 関連して計算された上述の値(信頼区間等)
・ 四分表に含まれる値(例えば、n11
・ 医薬品の化学構造式を表すデータ(例えば、公知のMOL形式やSMILES記法、InChl記法等で当該化学構造式を表したデータ)
なお、基礎データは、後述する化学構造式や有害事象、層別条件を符号化したデータのうちの少なくとも一部を直接含んでいてもよい。また、生成した基礎データは、コンピュータのメモリに記憶することができる。
【0053】
図1に戻ると、120は、基礎データに基づき、複数の教師データを準備するステップを示している。このステップは、コンピュータが実行するものであってよい。
1つの教師データは、
医薬品の化学構造式を符号化したデータと、
有害事象を符号化したデータと、
当該医薬品及び当該有害事象に少なくとも関連した統計シグナルの実際値と
を含むものである。1つの教師データは、更に、層別条件を符号化したデータを含むことができ、統計シグナルの実際値は、当該層別条件にも関連したものであってよい。
【0054】
ステップ120は、基礎データに基づき、化学構造式及び有害事象を符号化したデータ(層別条件を用いる場合には、更に層別条件を符号化したデータ)を生成するステップを含むことができる。
【0055】
医薬品の化学構造式を符号化したデータは、当該化学構造式をグラフ構造として符号化したデータを含んでいてよい。化学構造式のグラフ構造としての符号化は、任意の手法により行ってよいが、その一例を、以下、説明する。
【0056】
化学構造式が含む各原子の特徴は、グラフ構造の各ノードに関連したベクトルとして符号化することができる。例えば、原子の特徴の1つである原子の種類は、OneHotベクトルとして符号化することができる。そのようなOneHotベクトルは、想定される全ての元素の種類の数の要素を有し、符号化する元素に対応した要素が1、それ以外の要素が0であるものであってよい。例えば、水素原子を[1,0,0,…,0]、酸素原子を[0,1,0,…,0]に符号化することができる。原子の種類のほか、原子の特徴として符号化すべきものとして以下のようなものが挙げられるが、符号化される特徴は、これらに限定されるわけではない。
【0057】
・ 次数
・ 結合価
・ 形式電荷(ルイスフォーマルチャージ)
・ 電子数
・ Hybridization
・ 芳香族か否か
・ キラリティ
・ 互変異性を構成する原子か否か
・ 塩形成に関与するか否か
また、化学構造式における原子間の結合状況(例えば、どの原子がどの原子と結合しているのか)は、隣接行列として符号化することができる。なお、隣接行列は、そのi行j列の要素が、i番目とj番目のノード間にエッジが存在するとき即ちi番目とj番目の原子が結合しているときに1、そうでないときに0である正方行列であることができる。化学構造式における原子間の結合状況は、グラフラプラシアンとして符号化されてもよい。
【0058】
なお、化学構造式が含む原子間の結合の特徴を、グラフ構造のエッジに関連したベクトルとして更に符号化して用いてもよい。
即ち、医薬品の化学構造式を符号化したデータは、上述したように符号化された複数のベクトルの各々を要素とするベクトル(テンソル)であることができる。
【0059】
有害事象を符号化したデータは、当該有害事象を符号化したOneHotベクトルであってよい。そのようなOneHotベクトルは、対象となる全ての有害事象の数の要素を有し、符号化すべき有害事象に対応した要素が1、それ以外の要素が0であるものであってよい。例えば、低血糖を[1,0,0,…,0]、ケトアシドーシスを[0,1,0,…,0]に符号化することができる。
【0060】
層別条件を符号化したデータは、当該層別条件を符号化したOneHotベクトルであってよい。そのようなOneHotベクトルは、対象となる全ての層別条件の数の要素を有し、符号化すべき層別条件に対応した要素が1、それ以外の要素が0であるものであってよい。例えば、層別条件としての男性を[1,0,0]、女性を[0,1,0]、不明を[0,0,1]に符号化することができる。
【0061】
なお、基礎データ自体が化学構造式及び有害事象を符号化したデータ(層別条件を用いる場合には、更に層別条件を符号化したデータ)を含んでいる場合には、ステップ120は、当該データをメモリから取得するステップであってよい。
【0062】
130は、複数の教師データを用いて、機械学習により、統計シグナル推論モデルを生成するステップを示している。このステップは、コンピュータが実行するものであってよい。
【0063】
統計シグナル推論モデルは、所定構成のニューラルネットワークを訓練することにより生成されてよい。図3Aは、統計シグナル推論モデルを生成するための例示のニューラルネットワーク300Aを表している。なお、訓練後のニューラルネットワーク300Aが、生成される統計シグナル推論モデルとなる。
【0064】
310は、ニューラルネットワーク300Aの一部を構成する、医薬品の化学構造式を符号化したデータを入力として受けるグラフ畳み込みネットワーク(Graph Convolutional Network;GCN)を示している。GCNは公知のニューラルネットワークの1つである。GCN310は、ノードごとに、当該ノードに係る情報と、当該ノードに接続されているノードに係る情報と、当該ノードと接続されているノードとの間のエッジに係る情報とを集約し、各ノードの特徴を表すテンソルを出力するものである。GCNにおける処理について、図4に表されたグラフを用いて簡単に説明する。
【0065】
~nは、グラフのノードを示しており、v~vは、ノードn~nにそれぞれ関連したベクトルを示している。ベクトルv~vは、例えば、上述した原子の種類を符号化したOneHotベクトルであるか、当該ベクトルに基づくベクトルに相当することに留意されたい。また、v1,2、v2,3及びv2,4は、ノードnとnとの間のエッジ、ノードnとnとの間のエッジ及びノードnとnとの間のエッジにそれぞれ関連したベクトルを示している。GCNにおける処理は、各ノードについて、当該ノードに関連するベクトルと、当該ノードに接続されているノードに関連するベクトルとに基づき、新たに当該ノードに関連したベクトルを計算することを含んでいてよい。GCNにおける処理は、ノードと接続されている別のノードとの間のエッジに関連するベクトルにも基づき新たに当該ノードに関連したベクトルを計算することを含んでいてもよい。図4における例えばノードnに着目すると、当該ノードに関連した新たなベクトルv’は、当該ノードの現在のベクトルvと、接続されているノードnに関連した現在のベクトルvと、場合によっては当該ノードとノードnとの間のエッジに関連したベクトルv1,2とに基づき計算されてよい。一方、例えばノードnに着目すると、当該ノードに関連した新たなベクトルv’は、当該ノードの現在のベクトルvと、接続されているノードn、n及びnにそれぞれ関連した現在のベクトルv、v及びvと、場合によっては当該ノードと接続されているノードとの間のエッジに関連したベクトルv1,2、v2,3及びv2,4に基づき計算されてよい。なお、複数のベクトルに基づき新たに1つのベクトルを計算することは、複数のベクトルを行列とみなして所定の行列(例えば、重み行列)をかけて別の複数のベクトルを計算することと、複数のベクトルの対応する要素を合計して別の1つのベクトルを計算することと、ベクトルの各要素に所定の関数(例えば、ReLU等の活性化関数)を適用して別のベクトルを計算することと、複数のベクトルの間で対応する要素の代表値(例えば、最大値)を用いて別の1つのベクトルを計算すること(例えば、Maxプーリング処理)とのうちの1以上を含んでいてよい。
【0066】
図5A及び5Bは、それぞれ、ノードn及びnについての、複数のベクトルに基づき新たに1つのベクトルを計算する例示の処理500A及び500Bを表している。
510A及び510Bは、重み行列Wを複数のベクトル(510A:v及びv;510B:v、v、v及びv)に基づく行列をかけて別の複数のベクトルを計算するステップを示している。
【0067】
520A及び520Bは、それぞれ、ステップ510A及び510Bにおいて計算された別の複数のベクトルの対応する要素525を合計して別の1つのベクトルを計算するステップを示している。
【0068】
530A及び530Bは、それぞれ、ステップ520A及び520Bにおいて計算された別の1つのベクトルの各要素にReLU関数を適用して別のベクトルv’’を計算するステップを示している。
【0069】
540A及び540Bは、それぞれ、複数のベクトル(540A:v’’及びv’’;540B:v’’、v’’、v’’及びv’’)の間で対応する要素545の最大値を用いて別の1つのベクトルv’及びv’を計算するステップを示している。なお、v’’、v’’、v’’及びv’’、v1,2’’、v2,3’’は、それぞれ、ノードn、n、n及びnについてのステップ530A、530B又はこれらステップに相当するステップにおいて計算されたベクトルである。
【0070】
異なる観点からの例示の処理について述べると、グラフの全ノードの特徴量Vを、以下のような行列として表すことができる。
【0071】
【数7】
【0072】
また、全ノードの隣接ノードの特徴量Uを、以下のような行列として表すことができる。
【0073】
【数8】
【0074】
ここで、Aは隣接行列を表している。
上記ノードの特徴量V及び隣接ノードの特徴量Uを、化学構造式を符号化したデータとしてGCN310に入力することができる。GCN310では、以下のような計算を行い、新たな全ノードの特徴量V’’を計算することができる。
【0075】
【数9】
【0076】
ここで、Wは重み行列であり、Bはバイアス行列であり、h()はReLU等の活性化関数を表している。
図5C及び5Dは、それぞれ、ノードn及びnについての、複数のベクトルに基づき新たに1つのベクトルを計算する、化学構造式が含む原子間の結合の特徴をも用いる場合の例示の処理500C及び500Dを表している。
【0077】
510C及び510Dは、重み行列Wを複数のベクトル(510C:v、v及びv1,2;510D:v、v、v、v、v1,2、v2,3及びv2,4)に基づく行列をかけて別の複数のベクトルを計算するステップを示している。
【0078】
520C及び520Dは、それぞれ、ステップ510C及び510Dにおいて計算された別の複数のベクトルの対応する要素525を合計して別の1つのベクトルを計算するステップを示している。
【0079】
530C及び530Dは、それぞれ、ステップ520C及び520Dにおいて計算された別の1つのベクトルの各要素にReLU関数を適用して別のベクトルv’’を計算するステップを示している。
【0080】
540C及び540Dは、それぞれ、複数のベクトル(540C:v’’、v’’及びv1,2’’;540D:v’’、v’’、v’’、v’’、v1,2’’、v2,3’’及びv2,4’’)の間で対応する要素545の最大値を用いて別の1つのベクトルv’及びv’を計算するステップを示している。なお、v’’、v’’、v’’、v’’、v1,2’’、v2,3’’及びv2,4’’は、それぞれ、ノードn、n、n、n並びにノードnとnとの間のエッジ、ノードnとnとの間のエッジ及びノードnとnとの間のエッジについてのステップ530C、530D又はこれらステップに相当するステップにおいて計算されたベクトルである。
【0081】
このような処理を複数回繰り返すことにより、上記情報が集約されることになる。そして、GCN310からは、このような処理を複数回繰り返した後の各ノードに関連したベクトルから構成されるテンソルが出力されてよい。
【0082】
なお、GCN310は、具体的には、例えばhttps://www.deepchem.io/にて提供されるDeepChemを利用して実装することが可能である。その場合、特に、GraphConvやGraphPool、GraphGather、TrimGraphOutputといったクラスを用いてGCN310を実装することが可能である。
【0083】
図3Aに戻ると、315は、各ノードの特徴を表すテンソルを入力として受け、化学構造式に対応したグラフ構造全体の特徴を表すテンソルを出力する層を示している。
なお、GCN310と層315は、グラフニューラルネットワーク(GNN)を構成するものであり、層315は当該GNNの出力層に相当する。また、以上に説明したGCN310に係る処理はあくまで例示であり、任意の手法を用いてグラフ畳み込み処理を行う任意のネットワークをGCN310として利用可能なことは留意されたい。
【0084】
330Aは、層315からの出力と、有害事象を符号化したデータとを入力として受け、それらを合成したベクトル又はテンソルを出力する層を示している。
340は、層330Aが出力したベクトル又はテンソルを入力として受ける全結合層を示している。全結合層340は複数の層から構成されることが好ましい。
【0085】
350は、ニューラルネットワーク300Aの出力層を示している。出力層350は4つのノードを有しており、各ノードの出力がPRR、ROR、BCPNN及びGPSの推定値に対応する。
【0086】
教師データに含まれる医薬品の化学構造式を符号化したデータ及び有害事象を符号化したデータをニューラルネットワーク300Aに入力したときに出力されるPRR、ROR、BCPNN及びGPSの推定値と、当該教師データに含まれるPRR、ROR、BCPNN及びGPSの実際値との誤差が小さくなるように、公知の手法によりニューラルネットワーク300Aを訓練できることは理解されよう。
【0087】
図3Bは、統計シグナル推論モデルを生成するための別の例示のニューラルネットワーク300Bを表している。ニューラルネットワーク300Bは、ニューラルネットワーク300Aの層330Aを、層別条件を符号化したデータをも入力として受けるように構成された層330Bへと置き換えたものである。
【0088】
2 統計シグナルの推定
図6は、本発明の一実施形態に係る、統計シグナルを推定するための例示の方法600のフローチャートである。
【0089】
610は、統計シグナル推論モデルを準備するステップを示している。このステップは、統計シグナル推論モデルを生成するための方法100を実行するステップであってよい。あるいは、このステップは、方法100によって生成された統計シグナル推論モデルが有するパラメータ(訓練されたニューラルネットワークの各エッジの重み等)をメモリから取得し、該パラメータをニューラルネットワーク300B又は600のパラメータとして設定することによって、当該ニューラルネットワーク300B又は600を統計シグナル推論モデルとして機能させるステップであることができる。
【0090】
620は、準備した統計シグナル推論モデルへの入力としての入力データを準備するステップを示している。このステップは、統計シグナルを推定したい医薬品の化学構造式を符号化したデータ及び有害事象を符号化したデータを生成するステップを含むことができる。更に、このステップは、統計シグナルを推定する際の層別条件を符号化したデータを生成するステップを含むことができる。
【0091】
630は、ステップ610にて準備した統計シグナル推論モデルに、ステップ620にて準備した入力データを入力し、出力として統計シグナルの推定値を取得するステップを示している。
【0092】
なお、本発明実施形態は、方法600をコンピュータに実行させるプログラムや、方法600を実行するように構成された、1以上のコンピュータから構成されたシステムをも含むことに留意されたい。
【0093】
3 統計シグナル推論モデルの妥当性
図7は、複数の医薬品(drugname)及び複数の有害事象(reacname)について、所定の有害事象データベースからのデータに基づき計算した統計シグナルの実際値(prr)と、同じデータに基づき方法100により生成された統計シグナル推論モデルを用いて推定された統計シグナルの推定値(pred_prr)とを表す表700である。表700は、統計シグナルの実際値についての、上記データに基づき計算された信頼区間の下限(prr_ci_under)と上限(prr_ci_upper)とも表している。
【0094】
表700から、統計シグナルの推定値は、対応する統計シグナルの実際値の信頼区間に含まれていることが把握できる。このことは、統計シグナルの推定に医薬品の化学構造式を用いることを少なくとも特徴とする、本実施形態に係る統計シグナル推論モデルの妥当性を示すものである。
【0095】
更に、表700から、実際値が得られない統計シグナル(NaN)についても、統計シグナルの推定値は得られていることが把握できる。これは、本発明の実施形態に係る統計シグナル推論モデルが、医薬品の化学構造式に基づき統計シグナルを推定できるためである。このように、十分なデータが得られない等の理由により実際値が得られない統計シグナルであっても、上述したように妥当な推定値が得られることは、本発明の特徴の一つである。
【0096】
なお、表700における未知の化合物T1は、化学構造式は特定可能であるが、投与したときの有害事象の発現は未知である医薬品を参照している。
4 統計シグナル推論モデルの活用
本発明の一実施形態に係る統計シグナル推論モデルは、以下のように活用することが可能である。
【0097】
4-1 化学構造的に類似している医薬品同士の統計シグナルを比較する
医薬品安全性情報管理業務(以下、「PV業務」という。)における医薬品安全対策では、領域が同じ医薬品同士で有害事象の発現数や発現の頻度を比較するという作業が行われる。例えば、糖尿病薬という領域において、ある医薬品の投与についてケトアシドーシスという有害事象の発現数が多い場合当該医薬品はリスクであると認識され、低い場合当該医薬品はベネフィットであると認識される。
【0098】
例えば糖尿病薬という領域は、医薬品開発時に設定する適応症に基づく分類であるが、化学構造が類似している、異なる適応症の領域の医薬品についても比較対象とすることで、新たな知見が得られる可能性がある。
【0099】
例えば、安全対策について、異なる適応症領域の化学構造が類似している医薬品を参考にすることができる。より詳細には、例えば、類似している医薬品の用法・用量や、対象の患者(高齢者や腎障害を持っている方には投与しない等)を参考にすることで、より効果的な安全対策を実施できる可能性がある。これに関し、現在のPV業務では、医薬品を比較するときには同じ適応症領域内のことがほとんどで、構造に着目して比較するケースはほぼないことに留意されたい
この比較は、以下のような手法によって実現可能である。
【0100】
最新の有害事象データベースを入手する。
評価対象の医薬品の化学構造式を基準として、化学的に類似する1以上の医薬品を比較対象として選定する。
【0101】
入手した有害事象データベースに基づき統計シグナルの実際値を計算する。
評価対象の医薬品として注目すべき1以上の有害事象を選定する。
入手した有害事象データベースに基づき統計シグナル推論モデルを生成する。
【0102】
評価対象の医薬品及び選定した化学的に類似する1以上の医薬品の各々について、化学構造式に基づき、選定した1以上の有害事象の各々についての統計シグナルの推定値を、生成した統計シグナル推論モデルを用いて取得する。
【0103】
取得した統計シグナルの推定値に、統計シグナルの実際値を追記する。
得られた全ての統計シグナルの推定値及び実際値を比較する。
4-2 既存のPV業務の受付段階において統計シグナルを予測する
現在のPV業務において、蓄積された一定量の症例を評価するために、半年に一度等の定期的なルーティーンとして統計シグナルが評価されている。これに対して統計シグナル推論モデルを活用することで、新規の症例の蓄積を待たずに、現在の傾向から統計シグナルを予測することが可能となり、この予測された統計シグナルを利用することで、現在の手法よりも早い段階で安全対策を行うことが可能となる。
【0104】
より詳細には、以下のような活用手法が提案される。
月次などのデータベースの更新のタイミングで、当該データベースから統計シグナル推論モデルを生成するためのデータを入手する。
【0105】
有害事象データベース更新のタイミングで、入手したデータに基づき統計シグナルの実際値を計算する。
有害事象データベース更新のタイミングで、入手したデータに基づき統計シグナル推論モデルを生成する。
【0106】
新規症例を受け付けた段階で、当該症例に係る医薬品の化学構造式に基づき、統計シグナル推論モデルを用いて統計シグナルの推定値を取得する。
統計シグナルの推定値が、統計シグナルの実際値又は過去の統計シグナルの推定値から大きく変化していた場合、新規の安全対策を検討する。
【0107】
図8Aは、統計シグナル推論モデルを利用して、Contract Research Organization(CRO)と製薬企業の役割分担について再定義した業務プロセスの概念図を表している。
【0108】
4-3 治験段階などの新薬に対して、上市後にどのようなシグナルが予測されるかを提示する
新薬の開発時にはRisk Management Plan(RMP)の制定や添付文書への注意事項の記載等が求められているところ、一般的に治験段階では症例数が不足しているため、治験の対象にならない高齢者や幼児、妊婦等への対策を論理的に設定することが従来困難であった。
【0109】
統計シグナル推論モデルを活用することで、現時点で得られている市場での症例情報を治験等の新薬開発段階から利用し、RMPの制定や添付文書の作成等の安全対策業務に反映させることが可能となる。
【0110】
より詳細には、以下のような活用手法が提案される。
有害事象データベースから、統計シグナルの実際値を計算し、統計シグナル推論モデルを生成するためのデータを入手する。
【0111】
入手したデータに基づき、統計シグナルの実際値を計算する。
入手したデータに基づき、統計シグナル推論モデルを生成する。
治験などで確認されたか、あるいは同領域の医薬品で注目すべき有害事象を選定する。
【0112】
評価対象の医薬品の化学構造式に基づき、選定された注目すべき有害事象の全てについて、統計シグナル推論モデルを用いて統計シグナルの推定値を取得する。
統計シグナルの推定値を、同領域の医薬品等の比較対象とする医薬品の統計シグナルと比較し、安全対策を検討する。
【0113】
評価対象の医薬品の市販後に、都度入手したデータに基づき計算された統計シグナルの実際値又は都度入手したデータに基づき生成された統計シグナル推論モデルにより取得された統計シグナルの推定値の変化の観察を行うことにより、治験等の医薬品開発段階で検討した安全対策の変更の必要性を検討する。
【0114】
図8Bは、医薬品の治験段階及び市販後における、統計シグナル推論モデルを活用した安全対策の検討に関する業務プロセスのイメージを表している。
5 コンピュータ
以下、本発明の一実施形態を実施するために用いることができるコンピュータのハードウエア構成の一例について説明する。なお、本発明の一実施形態を実施するために用いることができるコンピュータは任意のものであってよく、例えば、パーソナル・コンピュータやクラウド上のコンピュータ等である。なお、本発明の一実施形態を実施するために用いることができるコンピュータは、GPUであってよいし、GPUを含むものであってよい。
【0115】
図9は、コンピュータのハードウエア構成の一例を表している。同図に示すように、コンピュータ900は、ハードウエア資源として、主に、プロセッサ910と、主記憶装置920と、補助記憶装置930と、入出力インターフェース940と、通信インターフェース950とを備えており、これらはアドレスバス、データバス、コントロールバス等を含むバスライン960を介して相互に接続されている。なお、バスライン960と各ハードウエア資源との間には適宜インターフェース回路(図示せず)が介在している場合もある。
【0116】
プロセッサ910は、CPUやマイクロプロセッサ等のコンピュータ全体又は少なくとも一部の制御を行うものである。なお、1つのコンピュータは複数のプロセッサ910を含む場合がある。このような場合、以上の説明における「プロセッサ」は、複数のプロセッサ910の総称であってもよい。
【0117】
主記憶装置920は、プロセッサ910に対して作業領域を提供する、SRAM(Static Random Access Memory)やDRAM(Dynamic Random Access Memory)等の揮発性メモリである。
【0118】
補助記憶装置930は、ソフトウエアであるプログラム等やデータ等を格納する、HDDやSSD、フラッシュメモリ等の不揮発性メモリである。当該プログラムやデータ等は、任意の時点で補助記憶装置930からバスライン960を介して主記憶装置920へとロードされる。補助記憶装置930は、コンピュータ可読記憶媒体、非一時的コンピュータ可読記憶媒体、又は、コンピュータ判読可能な貯蔵媒体として参照されることがある。なお、プログラムは、プロセッサに所望の処理を実行させる命令を含むものである。
【0119】
入出力インターフェース940は、情報を提示すること及び情報の入力を受けることの一方又は双方を行うものであり、デジタル・カメラ、キーボード、マウス、ディスプレイ、タッチパネル・ディスプレイ、マイク、スピーカ、各種センサ等である。
【0120】
通信インターフェース950は、インターネットやローカル・エリア・ネットワーク(LAN)の等うちの1以上から構成されたネットワーク955と接続されるものであり、ネットワーク955を介してデータを送受する。通信インターフェース950とネットワーク955とは、有線又は無線で接続されうる。通信インターフェース950は、ネットワークに係る情報、例えば、Wi-Fiのアクセスポイントに係る情報、通信キャリアの基地局に関する情報等も取得することがある。
【0121】
上に例示したハードウエア資源とソフトウエアとの協働により、コンピュータ900は、所望の手段として機能し、所望のステップを実行し、所望の機能を実現させることできることは、当業者には明らかであろう。
【0122】
6 むすび
以上、本発明の実施形態の幾つかの例を説明してきたが、これらは例示にすぎず、本発明の技術的範囲を限定するものではないことが理解されるべきである。本開示の趣旨及び範囲から逸脱することなく、実施形態の変更、追加、改良などを適宜行うことができることが理解されるべきである。本発明の技術的範囲は、上述した実施形態のいずれによっても限定されるべきではなく、特許請求の範囲及びその均等物によってのみ規定されるべきである。
【符号の説明】
【0123】
100…統計シグナル推論モデルを生成するための例示の方法
200…ステップ110が含む例示の処理
300A、300B…例示のニューラルネットワーク
525、545…対応する要素
600…統計シグナルを推定するための例示の方法
700…統計シグナルの実際値及び推定値等を含む例示の表
900…例示のコンピュータ
955…ネットワーク(インターネットやLAN等)
図1
図2
図3A
図3B
図4
図5A
図5B
図5C
図5D
図6
図7
図8A
図8B
図9
【手続補正書】
【提出日】2021-04-08
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
複数の教師データを準備するステップであって、各教師データは、
医薬品の化学構造式を符号化したデータと、
有害事象を符号化したデータと、
当該医薬品及び当該有害事象に少なくとも関連した統計シグナルの実際値と
を含む、ステップと、
前記複数の教師データを用いた機械学習により、統計シグナル推論モデルを生成するステップであって、該統計シグナル推論モデルは、
医薬品の化学構造式を符号化したデータと、
有害事象を符号化したデータと
を少なくとも入力とし、
符号化したデータが入力された前記医薬品及び前記有害事象に少なくとも関連した統計シグナルの推定値
を出力とする、ステップと
を含む方法。
【請求項2】
請求項1に記載の方法であって、
各教師データは、層別条件を符号化したデータを更に含み、当該教師データに実際値が含まれる統計シグナルは、当該層別条件にも関連し、
前記統計シグナル推論モデルは、層別条件を符号化したデータを更に入力とし、当該入力に対して推定値が出力される前記統計シグナルは、当該層別条件にも関連した、
方法。
【請求項3】
請求項1に記載の方法であって、
各教師データに実際値が含まれる統計シグナルは、所定の層別条件にも関連し、
前記統計シグナル推論モデルにおいて推定値が出力される統計シグナルは、前記所定の層別条件にも関連した、
方法。
【請求項4】
請求項1から3のうちの何れか一項に記載の方法であって、
複数の教師データを準備する前記ステップは、医薬品の化学構造式を符号化した前記データの少なくとも一部として、該化学構造式をグラフ構造として符号化したデータをメモリから取得又は生成するステップを含み、
前記統計シグナル推論モデルは、医薬品の化学構造式をグラフ構造として符号化した前記データを入力とするグラフ畳み込みネットワークを含む、
方法。
【請求項5】
請求項1から4のうちの何れか一項に記載の方法により生成された統計シグナル推論モデル。
【請求項6】
医薬品の化学構造式を符号化したデータと、
有害事象を符号化したデータと
を含む入力データを準備するステップと、
前記入力データを統計シグナル推論モデルへの入力として用いることにより、該統計シグナル推論モデルの出力として前記医薬品及び前記有害事象に少なくとも関連した統計シグナルの推定値を取得するステップと
をコンピュータに実行させるプログラムであって、前記統計シグナル推論モデルは、
様々な医薬品の化学構造式を符号化したデータと、
様々な有害事象を符号化したデータと、
各医薬品及び各有害事象に関連した統計シグナルの実際値と
を少なくとも用いた機械学習により生成されたものである、プログラム。
【請求項7】
請求項6に記載にプログラムであって、
前記入力データは、層別条件を符号化したデータを更に含み、
前記統計シグナル推論モデルから推定値が出力される前記統計シグナルは、前記層別条件にも関連し、
前記統計シグナル推論モデルを生成するための機械学習は、様々な層別条件を符号化したデータをも用い、
実際値が前記統計シグナル推論モデルを生成するための機械学習で用いられる前記統計シグナルは、各層別条件にも関連した、
プログラム。
【請求項8】
請求項6に記載のプログラムであって、
前記統計シグナル推論モデルから推定値が出力される統計シグナルは、所定の層別条件にも関連し、
実際値が前記統計シグナル推論モデルを生成するための機械学習で用いられる統計シグナルは、前記所定の層別条件にも関連した、
プログラム。
【請求項9】
請求項6から8のうちの何れか一項に記載のプログラムであって、
入力データを準備する前記ステップは、医薬品の化学構造式を符号化した前記データの少なくとも一部として、該化学構造式をグラフ構造として符号化したデータをメモリから取得又は生成するステップを含み、
前記統計シグナル推論モデルは、医薬品の化学構造式をグラフ構造として符号化した前記データを入力とするグラフ畳み込みネットワークを含む、
プログラム。
【請求項10】
医薬品の化学構造式を符号化したデータと、
有害事象を符号化したデータと
を含む入力データを、コンピュータが準備するステップと、
前記入力データを統計シグナル推論モデルへの入力として用いることにより、該統計シグナル推論モデルの出力として前記医薬品及び前記有害事象に少なくとも関連した統計シグナルの推定値を、コンピュータが取得するステップと
を含む方法であって、前記統計シグナル推論モデルは、
様々な医薬品の化学構造式を符号化したデータと、
様々な有害事象を符号化したデータと、
各医薬品及び各有害事象に関連した統計シグナルの実際値と
を少なくとも用いた機械学習により生成されたものである、方法。
【請求項11】
医薬品の化学構造式を符号化したデータと、
有害事象を符号化したデータと
を含む入力データを準備し、
前記入力データを統計シグナル推論モデルへの入力として用いることにより、該モデルの出力として前記医薬品及び前記有害事象に少なくとも関連した統計シグナルの推定値を取得する
ように構成されたシステムであって、前記統計シグナル推論モデルは、
様々な医薬品の化学構造式を符号化したデータと、
様々な有害事象を符号化したデータと、
各医薬品及び各有害事象に関連した統計シグナルの実際値と
を少なくとも用いた機械学習により生成されたものである、システム。
【手続補正書】
【提出日】2021-09-09
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
複数の教師データを準備するステップであって、各教師データは、
医薬品の化学構造式を符号化したデータと、
有害事象を符号化したデータと、
当該医薬品及び当該有害事象に少なくとも関連した統計シグナルの実際値と
を含む、ステップと、
前記複数の教師データを用いた機械学習により、統計シグナル推論モデルを生成するステップであって、該統計シグナル推論モデルは、
医薬品の化学構造式を符号化したデータと、
有害事象を符号化したデータと
を少なくとも入力とし、
符号化したデータが入力された前記医薬品及び前記有害事象に少なくとも関連した前記統計シグナルの推定値
を出力とする、ステップと
を含む方法。
【請求項2】
請求項1に記載の方法であって、
各教師データは、層別条件を符号化したデータを更に含み、当該教師データに実際値が含まれる前記統計シグナルは、当該層別条件にも関連し、
前記統計シグナル推論モデルは、層別条件を符号化したデータを更に入力とし、当該入力に対して推定値が出力される前記統計シグナルは、当該層別条件にも関連した、
方法。
【請求項3】
請求項1に記載の方法であって、
各教師データに実際値が含まれる前記統計シグナルは、所定の層別条件にも関連し、
前記統計シグナル推論モデルにおいて推定値が出力される前記統計シグナルは、前記所定の層別条件にも関連した、
方法。
【請求項4】
請求項1から3のうちの何れか一項に記載の方法であって、
複数の教師データを準備する前記ステップは、医薬品の化学構造式を符号化した前記データの少なくとも一部として、該化学構造式をグラフ構造として符号化したデータをメモリから取得又は生成するステップを含み、
前記統計シグナル推論モデルは、医薬品の化学構造式をグラフ構造として符号化した前記データを入力とするグラフ畳み込みネットワークを含む、
方法。
【請求項5】
請求項1から4のうちの何れか一項に記載の方法により生成された統計シグナル推論モデルであって、当該統計シグナル推論モデルの入力とされる前記データを入力として用いることにより、当該統計シグナル推論モデルの出力とされる前記統計シグナルの推定値を出力することをコンピュータに実行させる統計シグナル推論モデル
【請求項6】
医薬品の化学構造式を符号化したデータと、
有害事象を符号化したデータと
を含む入力データを準備するステップと、
前記入力データを統計シグナル推論モデルへの入力として用いることにより、該統計シグナル推論モデルの出力として前記医薬品及び前記有害事象に少なくとも関連した統計シグナルの推定値を取得するステップと
をコンピュータに実行させるプログラムであって、前記統計シグナル推論モデルは、
様々な医薬品の化学構造式を符号化したデータと、
様々な有害事象を符号化したデータと、
各医薬品及び各有害事象に関連した前記統計シグナルの実際値と
を少なくとも用いた機械学習により生成されたものである、プログラム。
【請求項7】
請求項6に記載にプログラムであって、
前記入力データは、層別条件を符号化したデータを更に含み、
前記統計シグナル推論モデルから推定値が出力される前記統計シグナルは、前記層別条件にも関連し、
前記統計シグナル推論モデルを生成するための機械学習は、様々な層別条件を符号化したデータをも用い、
実際値が前記統計シグナル推論モデルを生成するための機械学習で用いられる前記統計シグナルは、各層別条件にも関連した、
プログラム。
【請求項8】
請求項6に記載のプログラムであって、
前記統計シグナル推論モデルから推定値が出力される前記統計シグナルは、所定の層別条件にも関連し、
実際値が前記統計シグナル推論モデルを生成するための機械学習で用いられる前記統計シグナルは、前記所定の層別条件にも関連した、
プログラム。
【請求項9】
請求項6から8のうちの何れか一項に記載のプログラムであって、
入力データを準備する前記ステップは、医薬品の化学構造式を符号化した前記データの少なくとも一部として、該化学構造式をグラフ構造として符号化したデータをメモリから取得又は生成するステップを含み、
前記統計シグナル推論モデルは、医薬品の化学構造式をグラフ構造として符号化した前記データを入力とするグラフ畳み込みネットワークを含む、
プログラム。
【請求項10】
医薬品の化学構造式を符号化したデータと、
有害事象を符号化したデータと
を含む入力データを、コンピュータが準備するステップと、
前記入力データを統計シグナル推論モデルへの入力として用いることにより、該統計シグナル推論モデルの出力として前記医薬品及び前記有害事象に少なくとも関連した統計シグナルの推定値を、コンピュータが取得するステップと
を含む方法であって、前記統計シグナル推論モデルは、
様々な医薬品の化学構造式を符号化したデータと、
様々な有害事象を符号化したデータと、
各医薬品及び各有害事象に関連した前記統計シグナルの実際値と
を少なくとも用いた機械学習により生成されたものである、方法。
【請求項11】
医薬品の化学構造式を符号化したデータと、
有害事象を符号化したデータと
を含む入力データを準備し、
前記入力データを統計シグナル推論モデルへの入力として用いることにより、該モデルの出力として前記医薬品及び前記有害事象に少なくとも関連した統計シグナルの推定値を取得する
ように構成されたシステムであって、前記統計シグナル推論モデルは、
様々な医薬品の化学構造式を符号化したデータと、
様々な有害事象を符号化したデータと、
各医薬品及び各有害事象に関連した前記統計シグナルの実際値と
を少なくとも用いた機械学習により生成されたものである、システム。
【手続補正書】
【提出日】2022-02-25
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
複数の教師データを準備するステップであって、各教師データは、
医薬品の化学構造式を符号化したデータと、
有害事象を符号化したデータと、
当該医薬品及び当該有害事象に少なくとも関連した統計シグナルの実際値と
を含む、ステップと、
前記複数の教師データを用いた機械学習により、統計シグナル推論モデルを生成するステップであって、該統計シグナル推論モデルは、
医薬品の化学構造式を符号化したデータと、
有害事象を符号化したデータと
を少なくとも入力とし、
符号化したデータが入力された前記医薬品及び前記有害事象に少なくとも関連した前記統計シグナルの推定値
を出力とする、ステップと
を含む方法。
【請求項2】
請求項1に記載の方法であって、
各教師データは、層別条件を符号化したデータを更に含み、当該教師データに実際値が含まれる前記統計シグナルは、当該層別条件にも関連し、
前記統計シグナル推論モデルは、層別条件を符号化したデータを更に入力とし、当該入力に対して推定値が出力される前記統計シグナルは、当該層別条件にも関連した、
方法。
【請求項3】
請求項1に記載の方法であって、
各教師データに実際値が含まれる前記統計シグナルは、所定の層別条件にも関連し、
前記統計シグナル推論モデルにおいて推定値が出力される前記統計シグナルは、前記所定の層別条件にも関連した、
方法。
【請求項4】
請求項1からのうちの何れか一項に記載の方法により生成された統計シグナル推論モデルであって、当該統計シグナル推論モデルの入力とされる前記データを入力として用いることにより、当該統計シグナル推論モデルの出力とされる前記統計シグナルの推定値を出力することをコンピュータに実行させる統計シグナル推論モデル。
【請求項5】
医薬品の化学構造式を符号化したデータと、
有害事象を符号化したデータと
を含む入力データを準備するステップと、
前記入力データを統計シグナル推論モデルへの入力として用いることにより、該統計シグナル推論モデルの出力として前記医薬品及び前記有害事象に少なくとも関連した統計シグナルの推定値を取得するステップと
をコンピュータに実行させるプログラムであって、前記統計シグナル推論モデルは、
様々な医薬品の化学構造式を符号化したデータと、
様々な有害事象を符号化したデータと、
各医薬品及び各有害事象に関連した前記統計シグナルの実際値と
を少なくとも用いた機械学習により生成されたものである、プログラム。
【請求項6】
請求項に記載にプログラムであって、
前記入力データは、層別条件を符号化したデータを更に含み、
前記統計シグナル推論モデルから推定値が出力される前記統計シグナルは、前記層別条件にも関連し、
前記統計シグナル推論モデルを生成するための機械学習は、様々な層別条件を符号化したデータをも用い、
実際値が前記統計シグナル推論モデルを生成するための機械学習で用いられる前記統計シグナルは、各層別条件にも関連した、
プログラム。
【請求項7】
請求項に記載のプログラムであって、
前記統計シグナル推論モデルから推定値が出力される前記統計シグナルは、所定の層別条件にも関連し、
実際値が前記統計シグナル推論モデルを生成するための機械学習で用いられる前記統計シグナルは、前記所定の層別条件にも関連した、
プログラム。
【請求項8】
医薬品の化学構造式を符号化したデータと、
有害事象を符号化したデータと
を含む入力データを、コンピュータが準備するステップと、
前記入力データを統計シグナル推論モデルへの入力として用いることにより、該統計シグナル推論モデルの出力として前記医薬品及び前記有害事象に少なくとも関連した統計シグナルの推定値を、コンピュータが取得するステップと
を含む方法であって、前記統計シグナル推論モデルは、
様々な医薬品の化学構造式を符号化したデータと、
様々な有害事象を符号化したデータと、
各医薬品及び各有害事象に関連した前記統計シグナルの実際値と
を少なくとも用いた機械学習により生成されたものである、方法。
【請求項9】
医薬品の化学構造式を符号化したデータと、
有害事象を符号化したデータと
を含む入力データを準備し、
前記入力データを統計シグナル推論モデルへの入力として用いることにより、該モデルの出力として前記医薬品及び前記有害事象に少なくとも関連した統計シグナルの推定値を取得する
ように構成されたシステムであって、前記統計シグナル推論モデルは、
様々な医薬品の化学構造式を符号化したデータと、
様々な有害事象を符号化したデータと、
各医薬品及び各有害事象に関連した前記統計シグナルの実際値と
を少なくとも用いた機械学習により生成されたものである、システム。