(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-01
(45)【発行日】2024-07-09
(54)【発明の名称】情報処理装置、情報処理方法及び情報処理プログラム
(51)【国際特許分類】
G16H 50/70 20180101AFI20240702BHJP
G06Q 50/10 20120101ALI20240702BHJP
【FI】
G16H50/70
G06Q50/10
(21)【出願番号】P 2020104416
(22)【出願日】2020-06-17
【審査請求日】2023-05-11
(73)【特許権者】
【識別番号】504137912
【氏名又は名称】国立大学法人 東京大学
(74)【代理人】
【識別番号】100079108
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】齋藤 良行
(72)【発明者】
【氏名】吉原 浩之
(72)【発明者】
【氏名】芦澤 匠
【審査官】吉田 誠
(56)【参考文献】
【文献】米国特許出願公開第2018/0336318(US,A1)
【文献】米国特許出願公開第2020/0118665(US,A1)
【文献】特開2016-212853(JP,A)
【文献】特開2019-159871(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G16H 10/00 - 80/00
G06Q 50/10
(57)【特許請求の範囲】
【請求項1】
薬物の副作用に関する実績データから生成される学習データであって前記薬物に関する薬物情報、対象者に関する対象者情報及び時間に関する時間情報の特徴量を含む多次元特徴ベクトルと副作用の発現実績に関する情報とを対応付けた前記学習データに基づいて生成された予測モデルを記憶する記憶部と、
薬物情報、対象者情報及び時間情報の一以上の特徴量を含む入力情報を受け付ける受付部と、
前記予測モデルと、前記入力情報と、に基づいて、副作用の発現に関する発現情報を算出する算出部と、
前記発現情報を出力する出力部と、
を備える情報処理装置。
【請求項2】
前記発現情報に基づいて、副作用に関する評価情報を演算する演算部をさらに備え、
前記出力部は、前記評価情報を出力する、
請求項1に記載の情報処理装置。
【請求項3】
前記演算部は、前記発現情報と、前記副作用の重症度に基づく重み係数とに基づいて、前記評価情報を演算する、
請求項2に記載の情報処理装置。
【請求項4】
前記受付部はさらに、特定の対象者に関する特定対象者情報を受け付け、
前記演算部は、前記特定の対象者についての前記発現情報に基づいて、前記特定の対象者の副作用の発現に関する前記評価情報を演算する、
請求項2又は3に記載の情報処理装置。
【請求項5】
前記受付部はさらに、特定の薬物に関する特定薬物情報を受け付け、
前記演算部は、前記特定の薬物についての前記発現情報に基づいて、前記特定の薬物の安全性の指標値として、前記評価情報を演算する、
請求項2から請求項4のいずれかに記載の情報処理装置。
【請求項6】
薬物の副作用に関する実績データを取得する取得部と、
前記実績データから生成される学習データであって前記薬物に関する薬物情報、対象者に関する対象者情報及び時間に関する時間情報を含む多次元特徴ベクトルと副作用の発現実績に関する情報とを対応付けた前記学習データを生成する生成部と、
前記学習データに基づく機械学習によって、副作用の発現に関する予測モデルを生成する学習部と、
を備える学習装置。
【請求項7】
薬物情報、対象者情報及び時間情報の一以上の特徴量を含む入力情報を受け付けるステップと、
薬物の副作用に関する実績データから生成される学習データであって前記薬物に関する薬物情報、対象者に関する対象者情報及び時間に関する時間情報の特徴量を含む多次元特徴ベクトルと副作用の発現実績に関する情報とを対応付けた前記学習データに基づいて生成された予測モデルと、前記入力情報と、に基づいて、副作用の発現に関する発現情報を算出するステップと、
前記発現情報を出力するステップと、を有する、
情報処理装置における情報処理方法。
【請求項8】
情報処理装置に対して、
薬物情報、対象者情報及び時間情報の一以上の特徴量を含む入力情報を受け付けることと、
薬物の副作用に関する実績データから生成される学習データであって前記薬物に関する薬物情報、対象者に関する対象者情報及び時間に関する時間情報の特徴量を含む多次元特徴ベクトルと副作用の発現実績に関する情報とを対応付けた前記学習データに基づいて生成された予測モデルと、前記入力情報と、に基づいて、発現情報を算出することと、
前記発現情報を出力することと、
を実行させる情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。
【背景技術】
【0002】
従来、医薬品の安全性評価には、副作用や有害事象(以下、「副作用」と総称する)が発生した場合に、医療者、患者又は製薬企業等から当局に自発的に報告される副作用に関する情報を管理するデータベース(以下、「自発報告データベース」)等が用いられる。当該自発報告データベースとしては、例えば、独立行政法人医薬品医療機器総合機構(Pharmaceuticals and Medical Devices Agency:PMDA)の医薬品副作用データベース(Japanese Adverse Drug Event Report database:JADER)が知られている。
【0003】
例えば、非特許文献1では、医薬品の安全性評価のために、自発報告データベースを用いたシグナル検出を行うことが記載されている。ここで、シグナル検出とは、詳細調査が必要な自発報告の発見と調査の必要性の優先付けを行うことである。シグナル検出には、例えば、Proportion Reporting Ratio(PRR)、Reporting Odds Ratio(ROR)、Bayesian Confidence Propagation Neural Network method(BCPNN)又はMulti-Item Gamma-Poisson Shrinker(MGPS)等の不均衡分析と呼ばれる分析手法が用いられる。
【先行技術文献】
【非特許文献】
【0004】
【文献】須々田寛,高橋行雄. 企画/PMDAの自発報告データベースの新たな活用と今後の課題 4.重篤な薬疹を引き起こす薬剤相互作用の探索, 薬剤疫学, 2014年19巻1号p.39-49, インターネット<URL:https://www.jstage.jst.go.jp/article/jjpe/19/1/19_39/_pdf/-char/ja>
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、例えば、非特許文献1に記載されるように、自発報告データベースを用いる場合、薬物の投与による副作用に関する評価を適切に行うことができない恐れがある。例えば、副作用の発現実績に関するデータ(以下、「実績データ」という)が十分に得られない薬物(例えば、自発報告データベース上に報告例がない医薬品、医薬品として承認されていない化合物等)、対象者(例えば、90歳代の対象者等)等について、副作用に関する評価を適切に行うことができない恐れがある。また、自発報告データベースは、報告の偏り等のバイアスの影響を受けやすいため、副作用に関する評価を適切に行うことができない恐れもある。
【0006】
そこで、本発明は、薬物の副作用に関する評価を適切に行うことが可能な情報処理装置、情報処理方法及び情報処理プログラムを提供することを目的の一つとする。
【課題を解決するための手段】
【0007】
本発明の一態様に係る情報処理装置は、薬物の副作用に関する実績データから生成される学習データであって前記薬物に関する薬物情報、対象者に関する対象者情報及び時間に関する時間情報の特徴量を含む多次元特徴ベクトルと副作用の発現実績に関する情報とを対応付けた前記学習データに基づいて生成された予測モデルを記憶する記憶部と、薬物情報、対象者情報及び時間情報の一以上の特徴量を含む入力情報を受け付ける受付部と、前記予測モデルと、前記入力情報と、に基づいて、副作用の発現に関する発現情報を算出する算出部と、前記発現情報を出力する出力部と、を備える。
【0008】
この態様によれば、薬物情報、対象者情報及び時間情報の特徴量を含む多次元特徴ベクトルと副作用の発現実績に関する情報とを対応付けた学習データに基づいて生成された予測モデルを用いて各副作用の発現情報が算出されるので、実績データを十分に得られない薬物、対象者、副作用等についても各副作用の発現情報を適切に演算できる。
【0009】
上記態様において、前記発現情報に基づいて、副作用に関する評価情報を演算する演算部をさらに備え、前記出力部は、前記評価情報を出力してもよい。この態様によれば、上記発現情報に基づいて副作用に関する評価情報が演算されるので、当該評価情報の信頼性を向上させることができる。
【0010】
上記態様において、前記演算部は、前記発現情報と、前記副作用の重症度に基づく重み係数とに基づいて、前記評価情報を演算してもよい。この態様によれば、副作用の重症度に基づく重み係数に基づいて評価情報が演算されるので、当該評価情報をより適切に演算できる。
【0011】
上記態様において、前記受付部はさらに、特定の対象者に関する特定対象者情報を受け付け、前記演算部は、前記特定の対象者についての前記発現情報に基づいて、前記特定の対象者の副作用の発現に関する前記評価情報を演算してもよい。この態様によれば、特定の対象者に対する薬物の投与前に副作用の起きやすさを認識できるので、特定の対象者に対する投薬時の安全性を向上できる。
【0012】
上記態様において、前記受付部はさらに、特定の薬物に関する特定薬物情報を受け付け、前記演算部は、前記特定の薬物についての前記発現情報に基づいて、前記特定の薬物の安全性の指標値として、前記評価情報を演算してもよい。この態様によれば、特定の薬物の安全性の指標値を適切に演算できる
【0013】
本発明の他の態様に係る学習装置は、薬物の副作用に関する実績データを取得する取得部と、前記実績データから生成される学習データであって前記薬物に関する薬物情報、対象者に関する対象者情報及び時間に関する時間情報の特徴量を含む多次元特徴ベクトルと副作用の発現実績に関する情報とを対応付けた前記学習データを生成する生成部と、前記学習データに基づく機械学習によって、副作用の発現に関する予測モデルを生成する学習部と、を備える。
【0014】
本発明の他の態様に係る情報処理方法は、薬物情報、対象者情報及び時間情報の一以上の特徴量を含む入力情報を受け付けるステップと、薬物の副作用に関する実績データから生成される学習データであって前記薬物に関する薬物情報、対象者に関する対象者情報及び時間に関する時間情報の特徴量を含む多次元特徴ベクトルと副作用の発現実績に関する情報とを対応付けた前記学習データに基づいて生成された予測モデルと、前記入力情報と、に基づいて、副作用の発現に関する発現情報を算出するステップと、前記発現情報を出力するステップと、を有する、情報処理装置における情報処理方法。
【0015】
本発明の他の態様に係る情報処理プログラムは、情報処理装置に対して、薬物情報、対象者情報及び時間情報の一以上の特徴量を含む入力情報を受け付けることと、薬物の副作用に関する実績データから生成される学習データであって前記薬物に関する薬物情報、対象者に関する対象者情報及び時間に関する時間情報の特徴量を含む多次元特徴ベクトルと副作用の発現実績に関する情報とを対応付けた前記学習データに基づいて生成された予測モデルと、前記入力情報と、に基づいて、副作用の発現に関する発現情報を算出することと、前記発現情報を出力することと、を実行させる。
【発明の効果】
【0016】
本発明によれば、薬物の副作用に関する評価を適切に行うことできる。
【図面の簡単な説明】
【0017】
【
図1】本実施形態に係る副作用の発現情報の導出の一例を示す図である。
【
図2】本実施形態に係る特定の副作用の発現確率の一例を示す図である。
【
図3】本実施形態に係る特定の薬物についての各副作用の発現確率の一例を示す図である。
【
図4】本実施形態に係る特定の対象者についての各副作用の発現確率の一例を示す図である。
【
図5】本実施形態に係る情報処理システムの機能構成の一例を示す図である。
【
図6】本実施形態に係る実績データの一例を示す図である。
【
図7】本実施形態に係る情報処理システム内の各装置のハードウェア構成の一例を示す図である。
【
図8】本実施形態に係る学習装置の動作の一例を示すフローチャートである。
【
図9】本実施形態に係る情報処理装置の動作の一例を示すフローチャートである。
【発明を実施するための形態】
【0018】
添付図面を参照して、本発明の実施形態について説明する。なお、各図において、同一の符号を付したものは、同一又は同様の構成を有する。
【0019】
本実施形態において、副作用(Adverse Event(AE))とは、薬物を投与された患者に生じた好ましくない又は意図しない作用(例えば、兆候、症状又は病気等)であり、有害事象と呼ばれてもよい。当該副作用は、薬物との因果関係があるものに限られず、因果関係がはっきりしないものを含んでもよい。以下では、副作用は、例えば、医薬品規制調和国際会議(International Council for Harmonization of Technical Requirements for Pharmaceuticals for Human Use :ICH)の国際医薬用語集(Medical Dictionary for Regulatory Activities(MedDRA)で表記されたものを想定するが、これに限られない。
【0020】
また、本実施形態において、薬物とは、承認を受けた医薬品だけでなく、医薬品として承認されていない化合物を含んでもよい。
【0021】
図1は、本実施形態に係る副作用の発現情報の導出の一例を示す図である。
図1に示すように、薬物に関する情報(以下、「薬物情報」という)D、当該薬物が投与される対象者に関する情報(以下、「対象者情報」という)P、及び、時間に関する情報(以下、「時間情報」という)Tに基づいて、所定対象者による所定薬物を服用したときの所定時間における副作用の発現に関する情報(以下、「発現情報」という)が導出されてもよい。
【0022】
ここで、発現情報は、例えば、副作用が発現するか否か(すなわち、発現の有無)を示す情報であってもよいし、又は、副作用が発現する確率(以下、「発現確率」という)又は発現しない確率等を示す情報であってもよい。また、発現情報は、所定期間(例えば、月単位、半年単位)毎の将来の副作用の報告数等を示す情報であってもよい。
【0023】
図1に示すように、発現情報は、薬物情報D、対象者情報P及び時間情報Tの特徴量を含む特徴ベクトルに基づいて導出されてもよい。当該特徴ベクトルは、薬物、対象者及び時間を少なくとも含む三次元以上の特徴空間上の所定の点及び/又は領域(以下、「セグメント」という)を示す。当該三次元以上の特徴空間は「多次元特徴空間」と呼ばれてもよく、当該特徴ベクトルは、「多次元特徴ベクトル」と呼ばれてもよい。このように、発現情報は、薬物、対象者及び時間から成る特徴空間上の関数と考えることができ、「f(P,D,T)」と表されてもよい。
【0024】
ここで、薬物情報Dは、例えば、以下の少なくとも一つに関する情報を含んでもよいし、又は、示してもよい。薬物情報Dによって薬物が特定されてもよい。
・名称(Name)
・化学構造(Chemical Structure)
・剤形(Dosage Form)
・医薬品が承認を得ている適応疾患(Indication Disease)
・使用理由
・臨床試験(例えば、治験)の有効性又は安全性
・臨床試験の情報(例えば、試験目的、デザイン、使用方法等)
・薬物動態(pharmacokinetics(PK)及び/又はpharmacodynamics(PD)ともいう、例えば、医薬品を承認する際に提出されたPK及び/又はPD)
・すでに知られているCytochrome P450(CYP)阻害の有無
・非臨床試験の情報(LD50やED50等の情報、物性情報等)
・分子量
・他薬物との薬物相互作用
・薬効分類
・薬物を利用した際の対象疾患等の使用目的又は使用理由
・販売開始からの時間情報(例えば、所定単位(例えば、月又は年)の連続数)
・過去の副作用報告数
・医薬品の使用患者数
・処方医療機関または処方医
・調剤した薬局または薬剤師
・薬剤の管理者(本人、家族、介護提供者等)
・医療従事者(医師、薬剤師等の意見)
・薬剤使用者の意見
・副作用報告者の意見
・行政等の指導内容(ブルーレター・イエローレターの発出内容及び頻度、添付文書の改定、副作用救済制度の実施及びその内容等)
・服薬期間
・製造販売会社
・製造場所及び会社
・含まれる添加物
・製造原薬情報
・製造工程
・薬価
ここで、上記化学構造は、化学構造式とも呼ばれ、例えば、simplified molecular input line entry system(SMILES)記法で表記されてもよい。また、上記剤形は、例えば、錠剤・カプセル・散剤・水剤・注射剤等であってもよい。上記薬効分類は、例えば、解剖治療化学分類法(Anatomical Therapeutic Chemical(ATC) Classification System)による薬価基準収載医薬品コードに付される薬効分類番号等であってもよい。また、医薬品の使用患者数は、例えば、National Data Base、レセプト情報や出荷情報等から得られてもよい。
【0025】
また、対象者情報Pは、例えば、以下の少なくとも一つに関す情報を含んでもよいし、又は、示してもよい。対象者情報Pによって対象者が特定されてもよい。
・性別(Sex)
・年齢(Age)
・人種(Race)
・職業(Occupation)
・体重
・身長
・臨床経過(入院場所、入院日、副作用発現日等)
・罹患している疾患の有無、疾患が有る場合その疾患
・既往歴
・合併症の有無、合併症が有る場合その合併症
・併用薬の有無、併用薬が有る場合その併用薬や薬剤数
・遺伝子
・生活スタイル
・性格
・ヘルスリテラシー
・医師との関係性
・受診状況または受療行動
・アドヒアランス等の服薬行動
・個人または集団のSNSの使用情報
・社会経済的状況(例えば、教育、所得等)
ここで、上記疾患は、例えば、国際疫病分類(International Classification of Diseases(ICD)10)レベルで表記される疾患であってもよい。また、上記併用薬とは、医薬品として使用実績があるものに限られず、医薬品の成分名レベル、医薬品として使用又は未使用の薬物又は化学化合物であってもよい。
【0026】
また、時間情報Tは、例えば、以下の少なくとも一つに関す情報を含んでもよいし、又は、示してもよい。時間情報Tによって所定時間が特定されてもよい。
・副作用が発現するまでの期間
・経時的な各時点の副作用の発現有無
・薬物を投与した期間(投与期間(Treatment Duration))
・副作用が発現している期間
・副作用の発現の開始日
ここで、上記期間は、例えば、所定の時間単位(例えば、1秒、1分、1時間等)の数、所定の時間カテゴリー(例えば、服用直後、半日後、数日後)を示す変数等)、開始日時及び終了日時、開始日及び終了日等によって示されてもよい。
【0027】
上記薬物情報D、対象者情報P及び時間情報Tとしては、例えば、医薬品開発時の臨床試験での情報、自発報告データベースに登録された情報等の各副作用の発現実績に基づくデータ(以下、「実績データ」)を利用することができる。実績データでは、当該薬物情報D、対象者情報P及び時間情報Tと、発現情報と、が対応付けられてもよい。また、上記薬物情報D、対象者情報P及び時間情報Tの少なくとも一つには、ICHにおける合意に基づく個別症例安全性報告を伝送するためのデータ項目(「E2B」データ項目等とも呼ばれる)を用いることもできる。
【0028】
図2は、本実施形態に係る特定の副作用の発現確率の一例を示す図である。
図2では、上記実績データに基づいて演算された嘔吐の発現確率が、セグメント毎に示される。例えば、
図2では、各セグメントは、対象者情報P、薬物情報D及び時間情報Tによって特定されるが、上記の通り、これに限られない。
【0029】
図2に示すように、薬物Xについて嘔吐の発現確率は、対象者情報P(例えば、年齢、疾患等)及び/又は時間情報T(例えば、投与後の経過時間)等によって異なることが想定される。例えば、
図2に示すように、同一の薬物Xの投与後の経過時間が同一でも、10歳代、50歳代、90歳代の対象者では、発現確率が異なることが想定される。同様に、対象者が同一でも、薬物Xの投与直後と投与後6時間以内とでは、発現確率が異なることが想定される。
【0030】
しかしながら、例えば、臨床試験での情報や自発報告データベースに登録された情報等の実績データは限定的である。このため、当該実績データから得られる薬物情報D、対象者情報P及び時間情報Tからだけでは、特徴空間上の全てのセグメントの発現確率を網羅的に導出できない恐れがある。例えば、
図2では、薬物Xの投与実績がない対象者及び時間のセグメントについては、発現確率が示されてない。また、仮想的な化学構造を持つ薬物(例えば、新薬等)や、発生が稀な副作用については、各セグメントの発現確率を導出できない恐れがある。
【0031】
そこで、本実施形態では、薬物情報D、対象者情報P及び時間情報Tの特徴量を含む多次元特徴ベクトルと、副作用の発現実績に関する情報とを対応付けた学習データを用いた機械学習を行うことで、対象者に対する薬物の投与により所定時間において各副作用が発現するか否かに関する予測モデルを生成し、当該予測モデルに基づいて、各セグメントの発現情報を算出する。
【0032】
本実施形態ではさらに、予測モデルを用いて、薬物情報D、対象者情報P及び時間情報Tの少なくとも一つ毎の発現情報を導出することで、例えば、(1)特定の薬物についての各副作用の発現情報、(2)特定の対象者についての各副作用の発現情報が導出可能となる。(1)特定の薬物についての一つ又は複数の副作用の発現情報は、例えば、当該特定の薬物の安全性の評価情報(以下、「安全性スコア」という)等の導出に利用できる。また、(2)特定の対象者についての一つ又は複数の副作用の発現情報は、例えば、特定の個人に対する副作用の起きやすさの評価情報(以下、「副作用スコア」という)等の導出に利用できる。なお、本実施形態では、発現情報の一例として発現確率を中心に説明するが、上記の通り、発現情報は発現確率に限られない。また、評価情報は、評価指標などと呼ばれてもよい。
【0033】
図3及び4を参照し、(1)特定の薬物についての各副作用の発現確率に基づく安全性スコアの導出、及び、(2)特定の対象者についての各副作用の発現確率に基づく副作用スコアの導出について説明する。なお、
図4及び5では、嘔吐、血圧上昇及び眠気の各々について、機械学習の結果得られた予測モデルを用いて、全てのセグメントの発現確率が算出されているものとする。
【0034】
図3は、本実施形態に係る特定の薬物についての各副作用の発現確率の一例を示す図である。例えば、
図3では、各対象者に対する薬物Xの投与による嘔吐、血圧上昇及び眠気の発現確率が示される。なお、
図3では、副作用として嘔吐、血圧上昇及び眠気が示されるが、副作用が図示するものに限られないことは勿論である。
【0035】
図3に示すように、薬物Xについて集計された対象者情報P、時間情報T及び副作用毎の発現確率に基づいて、薬物Xの安全性スコアが導出されてもよい。また、当該発現確率と、各副作用の重症度に基づく重み係数とに基づいて安全性スコアが導出されてもよい。
【0036】
例えば、
図3では、各副作用についての対象者情報P及び時間情報T毎の発現確率の平均値を加算して、薬物Xの安全性スコアが演算されてもよい。また、当該平均値には、上記重み係数が乗算されてもよい。例えば、血圧上昇は、眠気や嘔吐と比べて重篤性が高いと考えられるため、血圧上昇の発現確率の平均値には、眠気及び嘔吐の発現確率の平均値と比べて大きい値の重み付け係数が乗算されてもよい。
【0037】
このように、薬物Xの安全性スコアを、薬物Xについて集計された対象者情報P、時間情報T及び副作用毎の発現確率に基づいて導出することにより、実績データの偏り等のバイアスの影響を軽減することができ、安全性スコアの信頼性を向上させることができる。また、薬物Xの安全性スコアを対象者及び/又は時間毎に演算することもできる。また、既存の安全性評価のような相対的な評価値ではなく、薬物毎の絶対的な評価値を導出できる。なお、安全性スコアは、薬物毎に限られず、一つ又は複数の薬物の組み合わせ毎に演算されてもよい。複数の薬物の組み合わせの安全性スコアを演算することにより、多剤併用(ポリファーマシー)における安全性評価を適切に行うことができる。
【0038】
図4は、本実施形態に係る特定の対象者についての各副作用の発現確率の一例を示す図である。例えば、
図4では、特定の対象者に対する薬物X、Y及びZの投与による嘔吐、血圧上昇及び眠気の発現確率が示される。なお、
図4に示す副作用及び薬物は一例にすぎず、図示するものに限られないことは勿論である。
【0039】
図4に示すように、特定の対象者について集計された副作用、薬物情報D及び時間情報T毎の発現確率に基づいて、特定の対象者の副作用スコアが導出されてもよい。例えば、
図4では、各副作用についての薬物情報D及び時間情報T毎の発現確率の平均値を、特定の対象者の副作用スコアとしてもよい。
【0040】
このように、特定の対象者の副作用スコアを、特定の対象者について集計された副作用、薬物情報D及び時間情報T毎の発現確率に基づいて導出することにより、特定の対象者に対する薬物の投与前に副作用の起きやすさを認識できるので、特定の対象者に対する投薬時の安全性を向上できる。なお、副作用スコアは、特定の対象者について特定の薬物(例えば、一つ又は複数の薬物の組み合わせ)について演算されてもよい。複数の薬物の組み合わせの副作用スコアを演算することにより、特定の対象者に対する多剤併用(ポリファーマシー)時の安全性を向上できる。
【0041】
以下、本実施形態に係る情報処理システムについて詳細に説明する。
【0042】
(情報処理システムの構成)
図5は、本実施形態に係る情報処理システムの機能構成の一例を示す図である。
図5に示すように、情報処理システム1は、学習装置10、記憶装置20、情報処理装置30を含む。なお、本例では、学習装置10、記憶装置20及び情報処理装置30が別体の装置として示されているが、これらの少なくとも二つは一体の装置で構成されてもよい。一体の装置として構成される複数の装置は、例えば、PLC(Programmable Logic Controller)の異なる動作として実現されてもよい。また、学習装置10、記憶装置20及び情報処理装置30の少なくとも一つが複数の装置に分割されてもよい。
【0043】
<学習装置>
図5に示すように、学習装置10は、取得部11、生成部12及び学習部13を備える。
【0044】
取得部11は、副作用の発現実績に関する実績データを取得する。実績データは、ある対象者に対するある薬物の投与により所定時間において各副作用が実際に発現したか否かに関するデータである。取得部11は、例えば、記憶装置20に記憶された実績データを取得してもよい。なお、取得部11は、通信部10cを介して他の装置から実績データを取得してもよい。
【0045】
図6は、本実施形態に係る実績データの一例を示す図である。
図6に示すように、実績データは、対象者情報P、薬物情報D及び時間情報Tと、各副作用の発現実績に関する情報(以下、「発現実績情報」という)と、を対応付けたデータであってもよい。当該薬物情報D、対象者情報P及び時間情報Tは、例えば、医薬品開発時の臨床試験での情報、自発報告データベース(例えば、JADER)に登録された情報であってもよいし、又は、独自に収集した副作用の発現に関する情報であってもよい。
【0046】
なお、
図6は例示にすぎず、対象者情報P、薬物情報D及び時間情報Tは、
図6に示すものに限られない。また、
図6では、各副作用の発現実績情報は、各副作用の発現の有無を示すが、各副作用の発現確率等を示してもよい。
【0047】
生成部12は、取得部11で取得した実績データから、対象者情報P、薬物情報D及び時間情報Tの特徴量を含む多次元特徴ベクトルと、副作用の発現実績情報とを抽出し、これらを対応付けた学習データを生成する。
【0048】
例えば、
図6に示す実績データであれば、対象者情報P(性別「男性」、年齢「60歳代」、体重「50kg」、身長「160cm」)、薬物情報D(名称「酸化マグネシウム」、使用理由「便秘」)、時間情報T(発現時間「服用直後」)を含む特徴ベクトルに対して、教師データとして各副作用の発現実績情報(嘔吐「有」、血圧上昇「無」、眠気「有」)を対応付けた学習データを生成する。このようにして、多数の実績データから、学習データセットを生成する。
【0049】
学習部13は、生成部12で生成された学習データセットを用いて機械学習を行う。これにより、対象者情報P、薬物情報D及び時間情報Tの特徴量を含む多次元特徴ベクトルを入力すると、当該特徴ベクトルに対応する各副作用の発現情報が出力されるような予測モデル13aが生成される。
【0050】
なお、学習部13による機械学習では、クラス識別により各副作用の発現の有無(クラス)、各副作用の発現確率等が導出されてもよい。クラス識別の場合、例えば、ニューラルネットワークで予測モデル13aが構成されてもよい。この場合、副作用の発現実績情報は、機械学習におけるラベルとして使用され、学習部13は、例えば、誤差逆伝播法によってニューラルネットワークの学習処理を行ってもよい。或いは、学習部13による機械学習では、値予測により各副作用の発現確率が導出されてもよい。値予測の場合、例えば、回帰分析又は重回帰分析を用いて予測モデル13aが構築されてもよい。
【0051】
<情報処理装置>
情報処理装置30は、受付部31、抽出部32、算出部33、演算部34及び出力部35を備える。受付部31(又は、受付部31及び抽出部32)は、本発明の「受付部」を構成してもよい。
【0052】
受付部31は、薬物情報D、対象者情報P及び時間情報Tの一以上の特徴量を含む入力情報を受け付ける。具体的には、受付部31は、発現情報の予測対象となる薬物情報D、対象者情報P及び時間情報Tに含まれる特徴量のうち、少なくとも一つ以上の特徴量の入力を受け付ける。
【0053】
例えば、70歳代の男性が、便秘薬として酸化マグネシウムを服用したときの1日後の副作用について予測したい場合には、対象者情報Pとして、性別「男性」、年齢「70歳代」、薬物情報Dとして、名称「酸化マグネシウム」、使用理由「便秘」、時間情報Tとして、発現時間「1日後」を含む入力情報を受け付ける。当該薬物情報D、対象者情報P及び時間情報Tは、例えば、
図2に示す特徴空間において実績データに基づいて発現確率を演算できないセグメントに対応してもよい。また、当該薬物情報Dは、仮想的な薬物(例えば、新薬、承認前の化学物質等)を示してもよい。
【0054】
なお、入力情報は、情報処理装置30が備える入力手段から入力されてもよいし、他の装置から通信部10cを介して受信されてもよいし、又は、記憶装置20から受け取ってもよい。
【0055】
また、受付部31は、特定の対象者に関する特定対象者情報及び/又は特定の薬物に関する特定薬物情報を受け付けてもよい。当該特定対象者情報及び/又は特定薬物情報は、後述する評価情報(例えば、副作用スコア、安全性スコア等)の演算に用いられてもよい。
【0056】
抽出部32は、受付部31によって受け付けられた入力情報から、対象者情報P、薬物情報D及び/又は時間情報Tの特徴量を示す特徴ベクトルを抽出する。例えば、上記の例では、入力情報から、対象者情報P(性別「男性」、年齢「70歳代」)、薬物情報D(名称「酸化マグネシウム」、使用理由「便秘」)、時間情報T(発現時間「1日後」)を含む特徴ベクトルを抽出する。
【0057】
算出部33は、抽出部32によって抽出された特徴ベクトルを予測モデル33aに入力することによって、各副作用の発現情報を算出する。例えば、算出部33は、特徴ベクトルによって示される対象者情報P、薬物情報D及び/又は時間情報Tに基づいて、所定の対象者に対する所定の薬物の投与による所定時間における各副作用の発現確率を発現情報として算出する。また、特定の薬物情報D、対象者情報P及び/又は時間情報T毎に、所定の副作用の発現確率を算出してもよい。
【0058】
予測モデル33aは、具体的には、学習装置10における機械学習により生成された予測モデル13aであってよい。また、予測モデル13aをさらに蒸留(distillation)して生成される新たな予測モデルであってもよい。蒸留では、学習装置10で機械学習された予測モデル13aへの入出力データを用いて新たな予測モデルが生成されてもよい。
【0059】
算出部33は、算出された発現情報と薬物情報D、対象者情報P及び/又は時間情報Tとを対応付けた予測データを生成し、生成した予測データを記憶装置20に記憶させてもよい。
【0060】
演算部34は、算出部33により算出された発現情報に基づいて、副作用に関する評価情報を演算する。例えば、演算部34は、算出部33によって算出された副作用の発現確率を、特定の薬物、特定の対象者、特定の時間及び特定の副作用の少なくとも一つについて評価情報として集計してもよい。演算部34は、当該集計の要求情報が受け付けられた場合に、当該要求情報に基づいて集計を実施してもよい。
【0061】
演算部34は、特定の薬物について集計された各副作用の発現確率に基づいて、特定の薬物についての安全性に関するスコアを演算してもよい。すなわち、演算部34は、ある特定の薬物で発生し得る全て又は任意の副作用の発現確率から、当該特定の薬物の副作用に関する総合的な安全性スコアを演算する。また、演算部34は、算出部33によって算出された各副作用の発現確率と、当該各副作用の重症度に基づく重み係数とに基づいて、安全性スコアを演算してもよい。
【0062】
演算部34は、特定の対象者について集計された各副作用の発現確率に基づいて、当該特定の対象者がもつ副作用スコアを演算してもよい。
【0063】
出力部35は、算出部33で算出された副作用の発現情報及び/又は演算部34で演算された副作用に関する評価情報を出力する。具体的には、出力部35は、発現情報や評価情報を後述する通信部10c又は出力部10eを介してユーザに提供する。
【0064】
<ハードウェア構成>
次に、情報処理システム1内の各装置(例えば、学習装置10、記憶装置20、情報処理装置30の各々)のハードウェア構成を説明する。
図7に示すように、情報処理システム1内の各装置は、演算装置に相当するCPU(Central Processing Unit)等のプロセッサ10aと、記憶装置10bと、通信部10cと、入力部10dと、出力部10eとを有する。これらの各構成は、バスを介して相互にデータ送受信可能に接続される。なお、本例では、学習装置10、記憶装置20及び情報処理装置30は、別々のコンピュータで構成されるが、少なくとも二つが一台のコンピュータで構成されてもよい。
【0065】
プロセッサ10aは、記憶装置10bに記憶されたプログラムの実行に関する制御やデータの演算、加工を行う制御部である。プロセッサ10aは、各副作用の発現確率を演算するプログラム(情報処理プログラム)を実行する演算装置(演算部)であってもよい。プロセッサ10aは、入力部10d及び/又は通信部10cから種々の入力データを受け取り、入力データの演算結果を出力部10eに出力(例えば、表示)したり、記憶装置10bに格納したり、又は、通信部10cを介して送信したりする。
【0066】
記憶装置10bは、メモリ、HDD(Hard Disk Drive)、SSD(Solid State Drive)、の少なくとも一つである。情報処理装置30の記憶装置10bは、プロセッサ10aが実行する情報処理プログラムを記憶してもよい。また、学習装置10及び情報処理装置30の記憶装置10bは、予測モデル13a及び33aを記憶してもよい。当該記憶装置10bは、本発明の「記憶部」を構成してもよい。
【0067】
通信部10cは、情報処理システム1内の各装置を外部機器に接続するインターフェースである。なお、学習装置10及び情報処理装置30が一体の装置で構成される場合、通信部10cは、学習装置10として動作するプロセスと、情報処理装置30として動作するプロセスとの間のプロセス間通信を含んでよい。
【0068】
入力部10dは、ユーザからデータの入力を受け付けるものであり、例えば、キーボード、マウス、タッチパネル、マイクの少なくとも一つを含んでよい。
【0069】
出力部10eは、プロセッサ10aによる演算結果を出力するものであり、例えば、LCD(Liquid Crystal Display)等のディスプレイ及びスピーカの少なくとも一つにより構成されてよい。
【0070】
情報処理プログラムは、記憶装置10b等のコンピュータによって読み取り可能な記憶媒体に記憶されて提供されてもよいし、通信部10cにより接続されるネットワークを介して提供されてもよい。当該判定プログラムを格納した記憶媒体は、コンピュータ読み取り可能な非一時的な記憶媒体(Non-transitory computer readable medium)であってもよい。非一時的な記憶媒体は特に限定されないが、例えば、USBメモリ、CD-ROM又はDVD等の記憶媒体であってもよい。
【0071】
情報処理装置30では、プロセッサ10aが情報処理プログラムを実行することにより、
図5を用いて説明した受付部31、抽出部32、算出部33、演算部34及び出力部35の動作が実現される。なお、これらの物理的な構成は例示であって、必ずしも独立した構成でなくてもよい。例えば、情報処理装置30は、プロセッサ10aと記憶装置10bが一体化したLSI(Large-Scale Integration)を備えていてもよい。
【0072】
(情報処理システムの動作)
<学習装置の動作>
図8は、本実施形態に係る学習装置の動作の一例を示すフローチャートである。なお、
図8に示す学習装置10の動作は一例にすぎず、図示するものに限られない。
【0073】
図8に示すように、ステップS101において、学習装置10は、対象者情報P、薬物情報D及び時間情報Tと各副作用の発現実績情報とを対応付けた実績データ(例えば、
図6)を取得する。実績データにおいて対象者情報P、薬物情報D及び時間情報Tに対応付けられる当該発現実績情報は、ステップS103における機械学習の教師データとして用いられてもよい。学習装置10は、当該実績データを記憶装置20に記憶させてもよい。
【0074】
ステップS102において、学習装置10は、上記実績データに含まれる対象者情報P、薬物情報D及び時間情報Tの特徴量を含む多次元特徴ベクトルを抽出し、当該多次元特徴ベクトルと、実績データに含まれる各副作用の発現実績情報とを対応付けた学習データを生成する。
【0075】
ステップS103において、学習装置10は、生成された学習データを用いた機械学習を行うことで、特徴ベクトルを入力すると、当該特徴ベクトルに対応する副作用の発現情報を出力する予測モデル13aを生成する。
【0076】
<情報処理装置の動作>
図9は、本実施形態に係る情報処理装置の動作の一例を示すフローチャートである。なお、
図9に示す情報処理装置30の動作は一例にすぎず、図示するものに限られない。例えば、情報処理装置30は、ステップS204を省略してもよい。
【0077】
図9に示すように、ステップS201において、情報処理装置30は、発現情報の予測対象となる薬物情報D、対象者情報P及び時間情報Tに含まれる特徴量のうち、一以上の特徴量を含む入力情報を受け付ける。当該薬物情報D、対象者情報P及び時間情報Tは、例えば、
図2に示す特徴空間において実績データに基づいて発現確率を演算できないセグメントに対応してもよい。また、当該薬物情報Dは、仮想的な薬物(例えば、新薬、承認前の化学物質等)を示してもよい。
【0078】
ステップS202において、情報処理装置30は、発現情報の予測対象となる薬物情報D、対象者情報P及び/又は時間情報Tの特徴量を含む特徴ベクトルを抽出する。
【0079】
ステップS203において、情報処理装置30は、ステップS202で抽出された特徴ベクトルを予測モデル33aに入力して、特徴ベクトルが示す薬物情報D、対象者情報P及び/又は時間情報Tに対応する各副作用の発現確率を、発現情報として算出する。情報処理装置30は、薬物情報D、対象者情報P及び/又は時間情報Tと算出した発現情報とを対応付けた予測データを生成し、記憶装置20に記憶させてもよい。
【0080】
ステップS204において、情報処理装置30は、算出された各副作用の発現情報に基づいて、副作用に関する評価情報を演算する。例えば、情報処理装置30は、ステップS203で算出された各副作用の発現確率を、特定の薬物、特定の対象者、特定の時間及び特定の副作用の少なくとも一つについて集計する。
【0081】
情報処理装置30は、評価情報として、
図3に示すように、薬物Xについて集計された対象者情報P、時間情報T及び副作用毎の発現確率を演算してもよい。また、情報処理装置30は、薬物X及び特定の対象者について集計された時間情報T及び副作用毎の発現確率を演算してもよい。また、情報処理装置30は、薬物X及び特定の副作用(例えば、嘔吐)について集計された対象者情報P及び時間情報T毎の発現確率を演算してもよい。
【0082】
また、情報処理装置30は、評価情報として、
図4に示すように、特定の対象者情報Pについて集計された薬物情報D、時間情報T及び副作用毎の発現確率を演算してもよい。また、情報処理装置30は、特定の対象者情報P及び特定の副作用について集計された薬物情報D及び時間情報T毎の発現確率を演算してもよい。
【0083】
また、情報処理装置30は、各副作用の発現確率に基づいて、特定の薬物の安全性スコア及び特定の対象者の副作用スコアの少なくとも一つを演算してもよい。
【0084】
具体的には、情報処理装置30は、
図3に示すように、薬物Xについて集計された対象者情報P、時間情報T及び副作用毎の発現確率を用いて、薬物Xの安全性スコアを演算してもよい。例えば、
図3では、各副作用の対象者情報P及び時間情報T毎の発現確率の平均値を加算して、薬物Xの安全性スコアを導出してもよい。
【0085】
また、情報処理装置30は、
図4に示すように、特定の対象者について集計された薬物情報D、時間情報T及び副作用毎の発現確率を用いて、特定の対象者の副作用スコアを演算してもよい。例えば、
図4では、各副作用についての薬物情報D及び時間情報T毎の発現確率の平均値を、特定の対象者の副作用スコアを導出してもよい。
【0086】
ステップS205において、情報処理装置30は、ステップS203で算出された発現情報及びステップS204で演算された評価情報の少なくとも一つを出力して、ユーザに提供する。
【0087】
以上のように、本実施形態に係る情報処理システム1によれば、薬物情報、対象者情報及び時間情報の特徴量を含む多次元特徴ベクトルと副作用の発現実績に関する情報とを対応付けた学習データに基づいて生成された予測モデルを用いて、副作用の発現情報(例えば、発現確率)が演算されるので、実績データを十分に得られない薬物、対象者、副作用等についても副作用の発現情報を適切に演算できる。
【0088】
また、本実施形態に係る情報処理システム1によれば、上記発現情報に基づいて特定の対象者の副作用スコアが演算されるので、特定の対象者に対する薬物の投与前に副作用の起きやすさを認識でき、特定の対象者に対する投薬時の安全性を向上できる。
【0089】
また、本実施形態に係る情報処理システム1によれば、発現情報に基づいて特定の薬物の安全性スコアが演算されるので、特定の薬物の安全性の指標値を適切に演算でき、特定の薬物の投薬時の安全性を向上できる。
【0090】
以上説明した実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。実施形態が備える各要素並びにその配置、材料、条件、形状及びサイズ等は、例示したものに限定されるわけではなく適宜変更することができる。また、異なる実施形態で示した構成同士を部分的に置換し又は組み合わせることが可能である。
【0091】
例えば、上記実施形態では、薬物とは、医薬品や化合物であるものとして説明したが、これに限らず、例えば、医療機器や治療用アプリケーションなど、医師によって処方されるものを薬物に含めてもよい。
【0092】
また、上記実施形態では、薬物情報D、対象者情報P及び時間情報Tの特徴量を含む多次元特徴ベクトルと副作用の発現実績に関する情報とを対応付けた学習データに基づいて生成された予測モデルを用いることで、薬物についての適切な評価を可能としたが、これに限られない。例えば、薬物情報Dに代えて、医療機器や医療アプリケーションに関する情報等の医療に関する情報(「医療情報」ともいう)を用いた学習データに基づいて生成された予測モデルを用いることで、医療に関する評価(例えば、医療機器又は医療アプリケーション等の評価)を適切に行うこともできる。このように、本実施形態は、医療情報、対象者情報P及び時間情報Tの特徴量を含む多次元特徴ベクトルと、所定の実績に関する情報(例えば、医療機器や医療アプリケーション等を用いた治療実績)とを対応付けた学習データに基づいて生成された予測モデルを用いることで、医療に関する様々な評価を行うことに応用できる。
【符号の説明】
【0093】
1…情報処理システム、10…学習装置、20…記憶装置、30…情報処理装置、11…取得部、12…生成部、13…学習部、13a…予測モデル、31…受付部、32…抽出部、33…算出部、33a…予測モデル、34…演算部、35…出力部、D…薬物情報、P…対象者情報、T…時間情報、10a…プロセッサ、10b…記憶装置、10c…通信部、10d…入力部、10e…出力部