特許7513254 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ 国立大学法人　東京大学の特許一覧

特許7513254情報処理装置、情報処理方法及び情報処理プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-07-01

(45)【発行日】2024-07-09

(54)【発明の名称】情報処理装置、情報処理方法及び情報処理プログラム

(51)【国際特許分類】

G16H 50/70 20180101AFI20240702BHJP

G06Q 50/10 20120101ALI20240702BHJP

【ＦＩ】

G16H50/70

G06Q50/10

【請求項の数】 8

(21)【出願番号】P 2020104416

(22)【出願日】2020-06-17

(65)【公開番号】P2021197005

(43)【公開日】2021-12-27

【審査請求日】2023-05-11

(73)【特許権者】

【識別番号】504137912

【氏名又は名称】国立大学法人東京大学

(74)【代理人】

【識別番号】100079108

【弁理士】

【氏名又は名称】稲葉良幸

(74)【代理人】

【識別番号】100109346

【弁理士】

【氏名又は名称】大貫敏史

(74)【代理人】

【識別番号】100117189

【弁理士】

【氏名又は名称】江口昭彦

(74)【代理人】

【識別番号】100134120

【弁理士】

【氏名又は名称】内藤和彦

(72)【発明者】

【氏名】齋藤良行

(72)【発明者】

【氏名】吉原浩之

(72)【発明者】

【氏名】芦澤匠

【審査官】吉田誠

(56)【参考文献】

【文献】米国特許出願公開第２０１８／０３３６３１８（ＵＳ，Ａ１）

【文献】米国特許出願公開第２０２０／０１１８６６５（ＵＳ，Ａ１）

【文献】特開２０１６－２１２８５３（ＪＰ，Ａ）

【文献】特開２０１９－１５９８７１（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ１６Ｈ１０／００－８０／００

Ｇ０６Ｑ５０／１０

(57)【特許請求の範囲】

【請求項1】

薬物の副作用に関する実績データから生成される学習データであって前記薬物に関する薬物情報、対象者に関する対象者情報及び時間に関する時間情報の特徴量を含む多次元特徴ベクトルと副作用の発現実績に関する情報とを対応付けた前記学習データに基づいて生成された予測モデルを記憶する記憶部と、
薬物情報、対象者情報及び時間情報の一以上の特徴量を含む入力情報を受け付ける受付部と、
前記予測モデルと、前記入力情報と、に基づいて、副作用の発現に関する発現情報を算出する算出部と、
前記発現情報を出力する出力部と、
を備える情報処理装置。

【請求項2】

前記発現情報に基づいて、副作用に関する評価情報を演算する演算部をさらに備え、
前記出力部は、前記評価情報を出力する、
請求項１に記載の情報処理装置。

【請求項3】

前記演算部は、前記発現情報と、前記副作用の重症度に基づく重み係数とに基づいて、前記評価情報を演算する、
請求項２に記載の情報処理装置。

【請求項4】

前記受付部はさらに、特定の対象者に関する特定対象者情報を受け付け、
前記演算部は、前記特定の対象者についての前記発現情報に基づいて、前記特定の対象者の副作用の発現に関する前記評価情報を演算する、
請求項２又は３に記載の情報処理装置。

【請求項5】

前記受付部はさらに、特定の薬物に関する特定薬物情報を受け付け、
前記演算部は、前記特定の薬物についての前記発現情報に基づいて、前記特定の薬物の安全性の指標値として、前記評価情報を演算する、
請求項２から請求項４のいずれかに記載の情報処理装置。

【請求項6】

薬物の副作用に関する実績データを取得する取得部と、
前記実績データから生成される学習データであって前記薬物に関する薬物情報、対象者に関する対象者情報及び時間に関する時間情報を含む多次元特徴ベクトルと副作用の発現実績に関する情報とを対応付けた前記学習データを生成する生成部と、
前記学習データに基づく機械学習によって、副作用の発現に関する予測モデルを生成する学習部と、
を備える学習装置。

【請求項7】

薬物情報、対象者情報及び時間情報の一以上の特徴量を含む入力情報を受け付けるステップと、
薬物の副作用に関する実績データから生成される学習データであって前記薬物に関する薬物情報、対象者に関する対象者情報及び時間に関する時間情報の特徴量を含む多次元特徴ベクトルと副作用の発現実績に関する情報とを対応付けた前記学習データに基づいて生成された予測モデルと、前記入力情報と、に基づいて、副作用の発現に関する発現情報を算出するステップと、
前記発現情報を出力するステップと、を有する、
情報処理装置における情報処理方法。

【請求項8】

情報処理装置に対して、
薬物情報、対象者情報及び時間情報の一以上の特徴量を含む入力情報を受け付けることと、
薬物の副作用に関する実績データから生成される学習データであって前記薬物に関する薬物情報、対象者に関する対象者情報及び時間に関する時間情報の特徴量を含む多次元特徴ベクトルと副作用の発現実績に関する情報とを対応付けた前記学習データに基づいて生成された予測モデルと、前記入力情報と、に基づいて、発現情報を算出することと、
前記発現情報を出力することと、
を実行させる情報処理プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。

【背景技術】

【0002】

従来、医薬品の安全性評価には、副作用や有害事象（以下、「副作用」と総称する）が発生した場合に、医療者、患者又は製薬企業等から当局に自発的に報告される副作用に関する情報を管理するデータベース（以下、「自発報告データベース」）等が用いられる。当該自発報告データベースとしては、例えば、独立行政法人医薬品医療機器総合機構（Pharmaceuticals and Medical Devices Agency：ＰＭＤＡ）の医薬品副作用データベース（Japanese Adverse Drug Event Report database：ＪＡＤＥＲ）が知られている。

【0003】

例えば、非特許文献１では、医薬品の安全性評価のために、自発報告データベースを用いたシグナル検出を行うことが記載されている。ここで、シグナル検出とは、詳細調査が必要な自発報告の発見と調査の必要性の優先付けを行うことである。シグナル検出には、例えば、Proportion Reporting Ratio（ＰＲＲ）、Reporting Odds Ratio（ＲＯＲ）、Bayesian Confidence Propagation Neural Network method（ＢＣＰＮＮ）又はMulti-Item Gamma-Poisson Shrinker（ＭＧＰＳ）等の不均衡分析と呼ばれる分析手法が用いられる。

【先行技術文献】

【非特許文献】

【0004】

【文献】須々田寛,高橋行雄. 企画／PMDAの自発報告データベースの新たな活用と今後の課題 4.重篤な薬疹を引き起こす薬剤相互作用の探索, 薬剤疫学, ２０１４年１９巻１号ｐ．３９－４９，インターネット＜ＵＲＬ：https://www.jstage.jst.go.jp/article/jjpe/19/1/19_39/_pdf/-char/ja＞

【発明の概要】

【発明が解決しようとする課題】

【0005】

しかしながら、例えば、非特許文献１に記載されるように、自発報告データベースを用いる場合、薬物の投与による副作用に関する評価を適切に行うことができない恐れがある。例えば、副作用の発現実績に関するデータ（以下、「実績データ」という）が十分に得られない薬物（例えば、自発報告データベース上に報告例がない医薬品、医薬品として承認されていない化合物等）、対象者（例えば、９０歳代の対象者等）等について、副作用に関する評価を適切に行うことができない恐れがある。また、自発報告データベースは、報告の偏り等のバイアスの影響を受けやすいため、副作用に関する評価を適切に行うことができない恐れもある。

【0006】

そこで、本発明は、薬物の副作用に関する評価を適切に行うことが可能な情報処理装置、情報処理方法及び情報処理プログラムを提供することを目的の一つとする。

【課題を解決するための手段】

【0007】

本発明の一態様に係る情報処理装置は、薬物の副作用に関する実績データから生成される学習データであって前記薬物に関する薬物情報、対象者に関する対象者情報及び時間に関する時間情報の特徴量を含む多次元特徴ベクトルと副作用の発現実績に関する情報とを対応付けた前記学習データに基づいて生成された予測モデルを記憶する記憶部と、薬物情報、対象者情報及び時間情報の一以上の特徴量を含む入力情報を受け付ける受付部と、前記予測モデルと、前記入力情報と、に基づいて、副作用の発現に関する発現情報を算出する算出部と、前記発現情報を出力する出力部と、を備える。

【0008】

この態様によれば、薬物情報、対象者情報及び時間情報の特徴量を含む多次元特徴ベクトルと副作用の発現実績に関する情報とを対応付けた学習データに基づいて生成された予測モデルを用いて各副作用の発現情報が算出されるので、実績データを十分に得られない薬物、対象者、副作用等についても各副作用の発現情報を適切に演算できる。

【0009】

上記態様において、前記発現情報に基づいて、副作用に関する評価情報を演算する演算部をさらに備え、前記出力部は、前記評価情報を出力してもよい。この態様によれば、上記発現情報に基づいて副作用に関する評価情報が演算されるので、当該評価情報の信頼性を向上させることができる。

【0010】

上記態様において、前記演算部は、前記発現情報と、前記副作用の重症度に基づく重み係数とに基づいて、前記評価情報を演算してもよい。この態様によれば、副作用の重症度に基づく重み係数に基づいて評価情報が演算されるので、当該評価情報をより適切に演算できる。

【0011】

上記態様において、前記受付部はさらに、特定の対象者に関する特定対象者情報を受け付け、前記演算部は、前記特定の対象者についての前記発現情報に基づいて、前記特定の対象者の副作用の発現に関する前記評価情報を演算してもよい。この態様によれば、特定の対象者に対する薬物の投与前に副作用の起きやすさを認識できるので、特定の対象者に対する投薬時の安全性を向上できる。

【0012】

上記態様において、前記受付部はさらに、特定の薬物に関する特定薬物情報を受け付け、前記演算部は、前記特定の薬物についての前記発現情報に基づいて、前記特定の薬物の安全性の指標値として、前記評価情報を演算してもよい。この態様によれば、特定の薬物の安全性の指標値を適切に演算できる

【0013】

本発明の他の態様に係る学習装置は、薬物の副作用に関する実績データを取得する取得部と、前記実績データから生成される学習データであって前記薬物に関する薬物情報、対象者に関する対象者情報及び時間に関する時間情報の特徴量を含む多次元特徴ベクトルと副作用の発現実績に関する情報とを対応付けた前記学習データを生成する生成部と、前記学習データに基づく機械学習によって、副作用の発現に関する予測モデルを生成する学習部と、を備える。

【0014】

本発明の他の態様に係る情報処理方法は、薬物情報、対象者情報及び時間情報の一以上の特徴量を含む入力情報を受け付けるステップと、薬物の副作用に関する実績データから生成される学習データであって前記薬物に関する薬物情報、対象者に関する対象者情報及び時間に関する時間情報の特徴量を含む多次元特徴ベクトルと副作用の発現実績に関する情報とを対応付けた前記学習データに基づいて生成された予測モデルと、前記入力情報と、に基づいて、副作用の発現に関する発現情報を算出するステップと、前記発現情報を出力するステップと、を有する、情報処理装置における情報処理方法。

【0015】

本発明の他の態様に係る情報処理プログラムは、情報処理装置に対して、薬物情報、対象者情報及び時間情報の一以上の特徴量を含む入力情報を受け付けることと、薬物の副作用に関する実績データから生成される学習データであって前記薬物に関する薬物情報、対象者に関する対象者情報及び時間に関する時間情報の特徴量を含む多次元特徴ベクトルと副作用の発現実績に関する情報とを対応付けた前記学習データに基づいて生成された予測モデルと、前記入力情報と、に基づいて、副作用の発現に関する発現情報を算出することと、前記発現情報を出力することと、を実行させる。

【発明の効果】

【0016】

本発明によれば、薬物の副作用に関する評価を適切に行うことできる。

【図面の簡単な説明】

【0017】

【図1】本実施形態に係る副作用の発現情報の導出の一例を示す図である。

【図2】本実施形態に係る特定の副作用の発現確率の一例を示す図である。

【図3】本実施形態に係る特定の薬物についての各副作用の発現確率の一例を示す図である。

【図4】本実施形態に係る特定の対象者についての各副作用の発現確率の一例を示す図である。

【図5】本実施形態に係る情報処理システムの機能構成の一例を示す図である。

【図6】本実施形態に係る実績データの一例を示す図である。

【図7】本実施形態に係る情報処理システム内の各装置のハードウェア構成の一例を示す図である。

【図8】本実施形態に係る学習装置の動作の一例を示すフローチャートである。

【図9】本実施形態に係る情報処理装置の動作の一例を示すフローチャートである。

【発明を実施するための形態】

【0018】

添付図面を参照して、本発明の実施形態について説明する。なお、各図において、同一の符号を付したものは、同一又は同様の構成を有する。

【0019】

本実施形態において、副作用（Adverse Event（ＡＥ））とは、薬物を投与された患者に生じた好ましくない又は意図しない作用（例えば、兆候、症状又は病気等）であり、有害事象と呼ばれてもよい。当該副作用は、薬物との因果関係があるものに限られず、因果関係がはっきりしないものを含んでもよい。以下では、副作用は、例えば、医薬品規制調和国際会議（International Council for Harmonization of Technical Requirements for Pharmaceuticals for Human Use ：ＩＣＨ）の国際医薬用語集（Medical Dictionary for Regulatory Activities（ＭｅｄＤＲＡ）で表記されたものを想定するが、これに限られない。

【0020】

また、本実施形態において、薬物とは、承認を受けた医薬品だけでなく、医薬品として承認されていない化合物を含んでもよい。

【0021】

図１は、本実施形態に係る副作用の発現情報の導出の一例を示す図である。図１に示すように、薬物に関する情報（以下、「薬物情報」という）Ｄ、当該薬物が投与される対象者に関する情報（以下、「対象者情報」という）Ｐ、及び、時間に関する情報（以下、「時間情報」という）Ｔに基づいて、所定対象者による所定薬物を服用したときの所定時間における副作用の発現に関する情報（以下、「発現情報」という）が導出されてもよい。

【0022】

ここで、発現情報は、例えば、副作用が発現するか否か（すなわち、発現の有無）を示す情報であってもよいし、又は、副作用が発現する確率（以下、「発現確率」という）又は発現しない確率等を示す情報であってもよい。また、発現情報は、所定期間（例えば、月単位、半年単位）毎の将来の副作用の報告数等を示す情報であってもよい。

【0023】

図１に示すように、発現情報は、薬物情報Ｄ、対象者情報Ｐ及び時間情報Ｔの特徴量を含む特徴ベクトルに基づいて導出されてもよい。当該特徴ベクトルは、薬物、対象者及び時間を少なくとも含む三次元以上の特徴空間上の所定の点及び／又は領域（以下、「セグメント」という）を示す。当該三次元以上の特徴空間は「多次元特徴空間」と呼ばれてもよく、当該特徴ベクトルは、「多次元特徴ベクトル」と呼ばれてもよい。このように、発現情報は、薬物、対象者及び時間から成る特徴空間上の関数と考えることができ、「ｆ（Ｐ，Ｄ，Ｔ）」と表されてもよい。

【0024】

ここで、薬物情報Ｄは、例えば、以下の少なくとも一つに関する情報を含んでもよいし、又は、示してもよい。薬物情報Ｄによって薬物が特定されてもよい。
・名称（Name）
・化学構造（Chemical Structure）
・剤形（Dosage Form）
・医薬品が承認を得ている適応疾患（Indication Disease）
・使用理由
・臨床試験（例えば、治験）の有効性又は安全性
・臨床試験の情報（例えば、試験目的、デザイン、使用方法等）
・薬物動態（pharmacokinetics（ＰＫ）及び／又はpharmacodynamics（ＰＤ）ともいう、例えば、医薬品を承認する際に提出されたＰＫ及び／又はＰＤ）
・すでに知られているCytochrome P450（ＣＹＰ）阻害の有無
・非臨床試験の情報（LD50やED50等の情報、物性情報等）
・分子量
・他薬物との薬物相互作用
・薬効分類
・薬物を利用した際の対象疾患等の使用目的又は使用理由
・販売開始からの時間情報（例えば、所定単位（例えば、月又は年）の連続数）
・過去の副作用報告数
・医薬品の使用患者数
・処方医療機関または処方医
・調剤した薬局または薬剤師
・薬剤の管理者（本人、家族、介護提供者等）
・医療従事者（医師、薬剤師等の意見）
・薬剤使用者の意見
・副作用報告者の意見
・行政等の指導内容（ブルーレター・イエローレターの発出内容及び頻度、添付文書の改定、副作用救済制度の実施及びその内容等）
・服薬期間
・製造販売会社
・製造場所及び会社
・含まれる添加物
・製造原薬情報
・製造工程
・薬価
ここで、上記化学構造は、化学構造式とも呼ばれ、例えば、simplified molecular input line entry system（ＳＭＩＬＥＳ）記法で表記されてもよい。また、上記剤形は、例えば、錠剤・カプセル・散剤・水剤・注射剤等であってもよい。上記薬効分類は、例えば、解剖治療化学分類法（Anatomical Therapeutic Chemical（ＡＴＣ） Classification System）による薬価基準収載医薬品コードに付される薬効分類番号等であってもよい。また、医薬品の使用患者数は、例えば、National Data Base、レセプト情報や出荷情報等から得られてもよい。

【0025】

また、対象者情報Ｐは、例えば、以下の少なくとも一つに関す情報を含んでもよいし、又は、示してもよい。対象者情報Ｐによって対象者が特定されてもよい。
・性別（Sex）
・年齢（Age）
・人種（Race）
・職業（Occupation）
・体重
・身長
・臨床経過（入院場所、入院日、副作用発現日等）
・罹患している疾患の有無、疾患が有る場合その疾患
・既往歴
・合併症の有無、合併症が有る場合その合併症
・併用薬の有無、併用薬が有る場合その併用薬や薬剤数
・遺伝子
・生活スタイル
・性格
・ヘルスリテラシー
・医師との関係性
・受診状況または受療行動
・アドヒアランス等の服薬行動
・個人または集団のSNSの使用情報
・社会経済的状況（例えば、教育、所得等）
ここで、上記疾患は、例えば、国際疫病分類（International Classification of Diseases（ＩＣＤ）１０）レベルで表記される疾患であってもよい。また、上記併用薬とは、医薬品として使用実績があるものに限られず、医薬品の成分名レベル、医薬品として使用又は未使用の薬物又は化学化合物であってもよい。

【0026】

また、時間情報Ｔは、例えば、以下の少なくとも一つに関す情報を含んでもよいし、又は、示してもよい。時間情報Ｔによって所定時間が特定されてもよい。
・副作用が発現するまでの期間
・経時的な各時点の副作用の発現有無
・薬物を投与した期間（投与期間（Treatment Duration））
・副作用が発現している期間
・副作用の発現の開始日
ここで、上記期間は、例えば、所定の時間単位（例えば、１秒、１分、１時間等）の数、所定の時間カテゴリー（例えば、服用直後、半日後、数日後）を示す変数等）、開始日時及び終了日時、開始日及び終了日等によって示されてもよい。

【0027】

上記薬物情報Ｄ、対象者情報Ｐ及び時間情報Ｔとしては、例えば、医薬品開発時の臨床試験での情報、自発報告データベースに登録された情報等の各副作用の発現実績に基づくデータ（以下、「実績データ」）を利用することができる。実績データでは、当該薬物情報Ｄ、対象者情報Ｐ及び時間情報Ｔと、発現情報と、が対応付けられてもよい。また、上記薬物情報Ｄ、対象者情報Ｐ及び時間情報Ｔの少なくとも一つには、ＩＣＨにおける合意に基づく個別症例安全性報告を伝送するためのデータ項目（「Ｅ２Ｂ」データ項目等とも呼ばれる）を用いることもできる。

【0028】

図２は、本実施形態に係る特定の副作用の発現確率の一例を示す図である。図２では、上記実績データに基づいて演算された嘔吐の発現確率が、セグメント毎に示される。例えば、図２では、各セグメントは、対象者情報Ｐ、薬物情報Ｄ及び時間情報Ｔによって特定されるが、上記の通り、これに限られない。

【0029】

図２に示すように、薬物Ｘについて嘔吐の発現確率は、対象者情報Ｐ（例えば、年齢、疾患等）及び／又は時間情報Ｔ（例えば、投与後の経過時間）等によって異なることが想定される。例えば、図２に示すように、同一の薬物Ｘの投与後の経過時間が同一でも、１０歳代、５０歳代、９０歳代の対象者では、発現確率が異なることが想定される。同様に、対象者が同一でも、薬物Ｘの投与直後と投与後６時間以内とでは、発現確率が異なることが想定される。

【0030】

しかしながら、例えば、臨床試験での情報や自発報告データベースに登録された情報等の実績データは限定的である。このため、当該実績データから得られる薬物情報Ｄ、対象者情報Ｐ及び時間情報Ｔからだけでは、特徴空間上の全てのセグメントの発現確率を網羅的に導出できない恐れがある。例えば、図２では、薬物Ｘの投与実績がない対象者及び時間のセグメントについては、発現確率が示されてない。また、仮想的な化学構造を持つ薬物（例えば、新薬等）や、発生が稀な副作用については、各セグメントの発現確率を導出できない恐れがある。

【0031】

そこで、本実施形態では、薬物情報Ｄ、対象者情報Ｐ及び時間情報Ｔの特徴量を含む多次元特徴ベクトルと、副作用の発現実績に関する情報とを対応付けた学習データを用いた機械学習を行うことで、対象者に対する薬物の投与により所定時間において各副作用が発現するか否かに関する予測モデルを生成し、当該予測モデルに基づいて、各セグメントの発現情報を算出する。

【0032】

本実施形態ではさらに、予測モデルを用いて、薬物情報Ｄ、対象者情報Ｐ及び時間情報Ｔの少なくとも一つ毎の発現情報を導出することで、例えば、（１）特定の薬物についての各副作用の発現情報、（２）特定の対象者についての各副作用の発現情報が導出可能となる。（１）特定の薬物についての一つ又は複数の副作用の発現情報は、例えば、当該特定の薬物の安全性の評価情報（以下、「安全性スコア」という）等の導出に利用できる。また、（２）特定の対象者についての一つ又は複数の副作用の発現情報は、例えば、特定の個人に対する副作用の起きやすさの評価情報（以下、「副作用スコア」という）等の導出に利用できる。なお、本実施形態では、発現情報の一例として発現確率を中心に説明するが、上記の通り、発現情報は発現確率に限られない。また、評価情報は、評価指標などと呼ばれてもよい。

【0033】

図３及び４を参照し、（１）特定の薬物についての各副作用の発現確率に基づく安全性スコアの導出、及び、（２）特定の対象者についての各副作用の発現確率に基づく副作用スコアの導出について説明する。なお、図４及び５では、嘔吐、血圧上昇及び眠気の各々について、機械学習の結果得られた予測モデルを用いて、全てのセグメントの発現確率が算出されているものとする。

【0034】

図３は、本実施形態に係る特定の薬物についての各副作用の発現確率の一例を示す図である。例えば、図３では、各対象者に対する薬物Ｘの投与による嘔吐、血圧上昇及び眠気の発現確率が示される。なお、図３では、副作用として嘔吐、血圧上昇及び眠気が示されるが、副作用が図示するものに限られないことは勿論である。

【0035】

図３に示すように、薬物Ｘについて集計された対象者情報Ｐ、時間情報Ｔ及び副作用毎の発現確率に基づいて、薬物Ｘの安全性スコアが導出されてもよい。また、当該発現確率と、各副作用の重症度に基づく重み係数とに基づいて安全性スコアが導出されてもよい。

【0036】

例えば、図３では、各副作用についての対象者情報Ｐ及び時間情報Ｔ毎の発現確率の平均値を加算して、薬物Ｘの安全性スコアが演算されてもよい。また、当該平均値には、上記重み係数が乗算されてもよい。例えば、血圧上昇は、眠気や嘔吐と比べて重篤性が高いと考えられるため、血圧上昇の発現確率の平均値には、眠気及び嘔吐の発現確率の平均値と比べて大きい値の重み付け係数が乗算されてもよい。

【0037】

このように、薬物Ｘの安全性スコアを、薬物Ｘについて集計された対象者情報Ｐ、時間情報Ｔ及び副作用毎の発現確率に基づいて導出することにより、実績データの偏り等のバイアスの影響を軽減することができ、安全性スコアの信頼性を向上させることができる。また、薬物Ｘの安全性スコアを対象者及び／又は時間毎に演算することもできる。また、既存の安全性評価のような相対的な評価値ではなく、薬物毎の絶対的な評価値を導出できる。なお、安全性スコアは、薬物毎に限られず、一つ又は複数の薬物の組み合わせ毎に演算されてもよい。複数の薬物の組み合わせの安全性スコアを演算することにより、多剤併用（ポリファーマシー）における安全性評価を適切に行うことができる。

【0038】

図４は、本実施形態に係る特定の対象者についての各副作用の発現確率の一例を示す図である。例えば、図４では、特定の対象者に対する薬物Ｘ、Ｙ及びＺの投与による嘔吐、血圧上昇及び眠気の発現確率が示される。なお、図４に示す副作用及び薬物は一例にすぎず、図示するものに限られないことは勿論である。

【0039】

図４に示すように、特定の対象者について集計された副作用、薬物情報Ｄ及び時間情報Ｔ毎の発現確率に基づいて、特定の対象者の副作用スコアが導出されてもよい。例えば、図４では、各副作用についての薬物情報Ｄ及び時間情報Ｔ毎の発現確率の平均値を、特定の対象者の副作用スコアとしてもよい。

【0040】

このように、特定の対象者の副作用スコアを、特定の対象者について集計された副作用、薬物情報Ｄ及び時間情報Ｔ毎の発現確率に基づいて導出することにより、特定の対象者に対する薬物の投与前に副作用の起きやすさを認識できるので、特定の対象者に対する投薬時の安全性を向上できる。なお、副作用スコアは、特定の対象者について特定の薬物（例えば、一つ又は複数の薬物の組み合わせ）について演算されてもよい。複数の薬物の組み合わせの副作用スコアを演算することにより、特定の対象者に対する多剤併用（ポリファーマシー）時の安全性を向上できる。

【0041】

以下、本実施形態に係る情報処理システムについて詳細に説明する。

【0042】

（情報処理システムの構成）
図５は、本実施形態に係る情報処理システムの機能構成の一例を示す図である。図５に示すように、情報処理システム１は、学習装置１０、記憶装置２０、情報処理装置３０を含む。なお、本例では、学習装置１０、記憶装置２０及び情報処理装置３０が別体の装置として示されているが、これらの少なくとも二つは一体の装置で構成されてもよい。一体の装置として構成される複数の装置は、例えば、ＰＬＣ（Programmable Logic Controller）の異なる動作として実現されてもよい。また、学習装置１０、記憶装置２０及び情報処理装置３０の少なくとも一つが複数の装置に分割されてもよい。

【0043】

＜学習装置＞
図５に示すように、学習装置１０は、取得部１１、生成部１２及び学習部１３を備える。

【0044】

取得部１１は、副作用の発現実績に関する実績データを取得する。実績データは、ある対象者に対するある薬物の投与により所定時間において各副作用が実際に発現したか否かに関するデータである。取得部１１は、例えば、記憶装置２０に記憶された実績データを取得してもよい。なお、取得部１１は、通信部１０ｃを介して他の装置から実績データを取得してもよい。

【0045】

図６は、本実施形態に係る実績データの一例を示す図である。図６に示すように、実績データは、対象者情報Ｐ、薬物情報Ｄ及び時間情報Ｔと、各副作用の発現実績に関する情報（以下、「発現実績情報」という）と、を対応付けたデータであってもよい。当該薬物情報Ｄ、対象者情報Ｐ及び時間情報Ｔは、例えば、医薬品開発時の臨床試験での情報、自発報告データベース（例えば、ＪＡＤＥＲ）に登録された情報であってもよいし、又は、独自に収集した副作用の発現に関する情報であってもよい。

【0046】

なお、図６は例示にすぎず、対象者情報Ｐ、薬物情報Ｄ及び時間情報Ｔは、図６に示すものに限られない。また、図６では、各副作用の発現実績情報は、各副作用の発現の有無を示すが、各副作用の発現確率等を示してもよい。

【0047】

生成部１２は、取得部１１で取得した実績データから、対象者情報Ｐ、薬物情報Ｄ及び時間情報Ｔの特徴量を含む多次元特徴ベクトルと、副作用の発現実績情報とを抽出し、これらを対応付けた学習データを生成する。

【0048】

例えば、図６に示す実績データであれば、対象者情報Ｐ（性別「男性」、年齢「６０歳代」、体重「５０ｋｇ」、身長「１６０ｃｍ」）、薬物情報Ｄ（名称「酸化マグネシウム」、使用理由「便秘」）、時間情報Ｔ（発現時間「服用直後」）を含む特徴ベクトルに対して、教師データとして各副作用の発現実績情報（嘔吐「有」、血圧上昇「無」、眠気「有」）を対応付けた学習データを生成する。このようにして、多数の実績データから、学習データセットを生成する。

【0049】

学習部１３は、生成部１２で生成された学習データセットを用いて機械学習を行う。これにより、対象者情報Ｐ、薬物情報Ｄ及び時間情報Ｔの特徴量を含む多次元特徴ベクトルを入力すると、当該特徴ベクトルに対応する各副作用の発現情報が出力されるような予測モデル１３ａが生成される。

【0050】

なお、学習部１３による機械学習では、クラス識別により各副作用の発現の有無（クラス）、各副作用の発現確率等が導出されてもよい。クラス識別の場合、例えば、ニューラルネットワークで予測モデル１３ａが構成されてもよい。この場合、副作用の発現実績情報は、機械学習におけるラベルとして使用され、学習部１３は、例えば、誤差逆伝播法によってニューラルネットワークの学習処理を行ってもよい。或いは、学習部１３による機械学習では、値予測により各副作用の発現確率が導出されてもよい。値予測の場合、例えば、回帰分析又は重回帰分析を用いて予測モデル１３ａが構築されてもよい。

【0051】

＜情報処理装置＞
情報処理装置３０は、受付部３１、抽出部３２、算出部３３、演算部３４及び出力部３５を備える。受付部３１（又は、受付部３１及び抽出部３２）は、本発明の「受付部」を構成してもよい。

【0052】

受付部３１は、薬物情報Ｄ、対象者情報Ｐ及び時間情報Ｔの一以上の特徴量を含む入力情報を受け付ける。具体的には、受付部３１は、発現情報の予測対象となる薬物情報Ｄ、対象者情報Ｐ及び時間情報Ｔに含まれる特徴量のうち、少なくとも一つ以上の特徴量の入力を受け付ける。

【0053】

例えば、７０歳代の男性が、便秘薬として酸化マグネシウムを服用したときの１日後の副作用について予測したい場合には、対象者情報Ｐとして、性別「男性」、年齢「７０歳代」、薬物情報Ｄとして、名称「酸化マグネシウム」、使用理由「便秘」、時間情報Ｔとして、発現時間「１日後」を含む入力情報を受け付ける。当該薬物情報Ｄ、対象者情報Ｐ及び時間情報Ｔは、例えば、図２に示す特徴空間において実績データに基づいて発現確率を演算できないセグメントに対応してもよい。また、当該薬物情報Ｄは、仮想的な薬物（例えば、新薬、承認前の化学物質等）を示してもよい。

【0054】

なお、入力情報は、情報処理装置３０が備える入力手段から入力されてもよいし、他の装置から通信部１０ｃを介して受信されてもよいし、又は、記憶装置２０から受け取ってもよい。

【0055】

また、受付部３１は、特定の対象者に関する特定対象者情報及び／又は特定の薬物に関する特定薬物情報を受け付けてもよい。当該特定対象者情報及び／又は特定薬物情報は、後述する評価情報（例えば、副作用スコア、安全性スコア等）の演算に用いられてもよい。

【0056】

抽出部３２は、受付部３１によって受け付けられた入力情報から、対象者情報Ｐ、薬物情報Ｄ及び／又は時間情報Ｔの特徴量を示す特徴ベクトルを抽出する。例えば、上記の例では、入力情報から、対象者情報Ｐ（性別「男性」、年齢「７０歳代」）、薬物情報Ｄ（名称「酸化マグネシウム」、使用理由「便秘」）、時間情報Ｔ（発現時間「１日後」）を含む特徴ベクトルを抽出する。

【0057】

算出部３３は、抽出部３２によって抽出された特徴ベクトルを予測モデル３３ａに入力することによって、各副作用の発現情報を算出する。例えば、算出部３３は、特徴ベクトルによって示される対象者情報Ｐ、薬物情報Ｄ及び／又は時間情報Ｔに基づいて、所定の対象者に対する所定の薬物の投与による所定時間における各副作用の発現確率を発現情報として算出する。また、特定の薬物情報Ｄ、対象者情報Ｐ及び／又は時間情報Ｔ毎に、所定の副作用の発現確率を算出してもよい。

【0058】

予測モデル３３ａは、具体的には、学習装置１０における機械学習により生成された予測モデル１３ａであってよい。また、予測モデル１３ａをさらに蒸留（distillation）して生成される新たな予測モデルであってもよい。蒸留では、学習装置１０で機械学習された予測モデル１３ａへの入出力データを用いて新たな予測モデルが生成されてもよい。

【0059】

算出部３３は、算出された発現情報と薬物情報Ｄ、対象者情報Ｐ及び／又は時間情報Ｔとを対応付けた予測データを生成し、生成した予測データを記憶装置２０に記憶させてもよい。

【0060】

演算部３４は、算出部３３により算出された発現情報に基づいて、副作用に関する評価情報を演算する。例えば、演算部３４は、算出部３３によって算出された副作用の発現確率を、特定の薬物、特定の対象者、特定の時間及び特定の副作用の少なくとも一つについて評価情報として集計してもよい。演算部３４は、当該集計の要求情報が受け付けられた場合に、当該要求情報に基づいて集計を実施してもよい。

【0061】

演算部３４は、特定の薬物について集計された各副作用の発現確率に基づいて、特定の薬物についての安全性に関するスコアを演算してもよい。すなわち、演算部３４は、ある特定の薬物で発生し得る全て又は任意の副作用の発現確率から、当該特定の薬物の副作用に関する総合的な安全性スコアを演算する。また、演算部３４は、算出部３３によって算出された各副作用の発現確率と、当該各副作用の重症度に基づく重み係数とに基づいて、安全性スコアを演算してもよい。

【0062】

演算部３４は、特定の対象者について集計された各副作用の発現確率に基づいて、当該特定の対象者がもつ副作用スコアを演算してもよい。

【0063】

出力部３５は、算出部３３で算出された副作用の発現情報及び／又は演算部３４で演算された副作用に関する評価情報を出力する。具体的には、出力部３５は、発現情報や評価情報を後述する通信部１０ｃ又は出力部１０ｅを介してユーザに提供する。

【0064】

＜ハードウェア構成＞
次に、情報処理システム１内の各装置（例えば、学習装置１０、記憶装置２０、情報処理装置３０の各々）のハードウェア構成を説明する。図７に示すように、情報処理システム１内の各装置は、演算装置に相当するＣＰＵ（Central Processing Unit）等のプロセッサ１０ａと、記憶装置１０ｂと、通信部１０ｃと、入力部１０ｄと、出力部１０ｅとを有する。これらの各構成は、バスを介して相互にデータ送受信可能に接続される。なお、本例では、学習装置１０、記憶装置２０及び情報処理装置３０は、別々のコンピュータで構成されるが、少なくとも二つが一台のコンピュータで構成されてもよい。

【0065】

プロセッサ１０ａは、記憶装置１０ｂに記憶されたプログラムの実行に関する制御やデータの演算、加工を行う制御部である。プロセッサ１０ａは、各副作用の発現確率を演算するプログラム（情報処理プログラム）を実行する演算装置（演算部）であってもよい。プロセッサ１０ａは、入力部１０ｄ及び／又は通信部１０ｃから種々の入力データを受け取り、入力データの演算結果を出力部１０ｅに出力（例えば、表示）したり、記憶装置１０ｂに格納したり、又は、通信部１０ｃを介して送信したりする。

【0066】

記憶装置１０ｂは、メモリ、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、の少なくとも一つである。情報処理装置３０の記憶装置１０ｂは、プロセッサ１０ａが実行する情報処理プログラムを記憶してもよい。また、学習装置１０及び情報処理装置３０の記憶装置１０ｂは、予測モデル１３ａ及び３３ａを記憶してもよい。当該記憶装置１０ｂは、本発明の「記憶部」を構成してもよい。

【0067】

通信部１０ｃは、情報処理システム１内の各装置を外部機器に接続するインターフェースである。なお、学習装置１０及び情報処理装置３０が一体の装置で構成される場合、通信部１０ｃは、学習装置１０として動作するプロセスと、情報処理装置３０として動作するプロセスとの間のプロセス間通信を含んでよい。

【0068】

入力部１０ｄは、ユーザからデータの入力を受け付けるものであり、例えば、キーボード、マウス、タッチパネル、マイクの少なくとも一つを含んでよい。

【0069】

出力部１０ｅは、プロセッサ１０ａによる演算結果を出力するものであり、例えば、ＬＣＤ（Liquid Crystal Display）等のディスプレイ及びスピーカの少なくとも一つにより構成されてよい。

【0070】

情報処理プログラムは、記憶装置１０ｂ等のコンピュータによって読み取り可能な記憶媒体に記憶されて提供されてもよいし、通信部１０ｃにより接続されるネットワークを介して提供されてもよい。当該判定プログラムを格納した記憶媒体は、コンピュータ読み取り可能な非一時的な記憶媒体（Non-transitory computer readable medium）であってもよい。非一時的な記憶媒体は特に限定されないが、例えば、ＵＳＢメモリ、ＣＤ－ＲＯＭ又はＤＶＤ等の記憶媒体であってもよい。

【0071】

情報処理装置３０では、プロセッサ１０ａが情報処理プログラムを実行することにより、図５を用いて説明した受付部３１、抽出部３２、算出部３３、演算部３４及び出力部３５の動作が実現される。なお、これらの物理的な構成は例示であって、必ずしも独立した構成でなくてもよい。例えば、情報処理装置３０は、プロセッサ１０ａと記憶装置１０ｂが一体化したＬＳＩ（Large-Scale Integration）を備えていてもよい。

【0072】

（情報処理システムの動作）
＜学習装置の動作＞
図８は、本実施形態に係る学習装置の動作の一例を示すフローチャートである。なお、図８に示す学習装置１０の動作は一例にすぎず、図示するものに限られない。

【0073】

図８に示すように、ステップＳ１０１において、学習装置１０は、対象者情報Ｐ、薬物情報Ｄ及び時間情報Ｔと各副作用の発現実績情報とを対応付けた実績データ（例えば、図６）を取得する。実績データにおいて対象者情報Ｐ、薬物情報Ｄ及び時間情報Ｔに対応付けられる当該発現実績情報は、ステップＳ１０３における機械学習の教師データとして用いられてもよい。学習装置１０は、当該実績データを記憶装置２０に記憶させてもよい。

【0074】

ステップＳ１０２において、学習装置１０は、上記実績データに含まれる対象者情報Ｐ、薬物情報Ｄ及び時間情報Ｔの特徴量を含む多次元特徴ベクトルを抽出し、当該多次元特徴ベクトルと、実績データに含まれる各副作用の発現実績情報とを対応付けた学習データを生成する。

【0075】

ステップＳ１０３において、学習装置１０は、生成された学習データを用いた機械学習を行うことで、特徴ベクトルを入力すると、当該特徴ベクトルに対応する副作用の発現情報を出力する予測モデル１３ａを生成する。

【0076】

＜情報処理装置の動作＞
図９は、本実施形態に係る情報処理装置の動作の一例を示すフローチャートである。なお、図９に示す情報処理装置３０の動作は一例にすぎず、図示するものに限られない。例えば、情報処理装置３０は、ステップＳ２０４を省略してもよい。

【0077】

図９に示すように、ステップＳ２０１において、情報処理装置３０は、発現情報の予測対象となる薬物情報Ｄ、対象者情報Ｐ及び時間情報Ｔに含まれる特徴量のうち、一以上の特徴量を含む入力情報を受け付ける。当該薬物情報Ｄ、対象者情報Ｐ及び時間情報Ｔは、例えば、図２に示す特徴空間において実績データに基づいて発現確率を演算できないセグメントに対応してもよい。また、当該薬物情報Ｄは、仮想的な薬物（例えば、新薬、承認前の化学物質等）を示してもよい。

【0078】

ステップＳ２０２において、情報処理装置３０は、発現情報の予測対象となる薬物情報Ｄ、対象者情報Ｐ及び／又は時間情報Ｔの特徴量を含む特徴ベクトルを抽出する。

【0079】

ステップＳ２０３において、情報処理装置３０は、ステップＳ２０２で抽出された特徴ベクトルを予測モデル３３ａに入力して、特徴ベクトルが示す薬物情報Ｄ、対象者情報Ｐ及び／又は時間情報Ｔに対応する各副作用の発現確率を、発現情報として算出する。情報処理装置３０は、薬物情報Ｄ、対象者情報Ｐ及び／又は時間情報Ｔと算出した発現情報とを対応付けた予測データを生成し、記憶装置２０に記憶させてもよい。

【0080】

ステップＳ２０４において、情報処理装置３０は、算出された各副作用の発現情報に基づいて、副作用に関する評価情報を演算する。例えば、情報処理装置３０は、ステップＳ２０３で算出された各副作用の発現確率を、特定の薬物、特定の対象者、特定の時間及び特定の副作用の少なくとも一つについて集計する。

【0081】

情報処理装置３０は、評価情報として、図３に示すように、薬物Ｘについて集計された対象者情報Ｐ、時間情報Ｔ及び副作用毎の発現確率を演算してもよい。また、情報処理装置３０は、薬物Ｘ及び特定の対象者について集計された時間情報Ｔ及び副作用毎の発現確率を演算してもよい。また、情報処理装置３０は、薬物Ｘ及び特定の副作用（例えば、嘔吐）について集計された対象者情報Ｐ及び時間情報Ｔ毎の発現確率を演算してもよい。

【0082】

また、情報処理装置３０は、評価情報として、図４に示すように、特定の対象者情報Ｐについて集計された薬物情報Ｄ、時間情報Ｔ及び副作用毎の発現確率を演算してもよい。また、情報処理装置３０は、特定の対象者情報Ｐ及び特定の副作用について集計された薬物情報Ｄ及び時間情報Ｔ毎の発現確率を演算してもよい。

【0083】

また、情報処理装置３０は、各副作用の発現確率に基づいて、特定の薬物の安全性スコア及び特定の対象者の副作用スコアの少なくとも一つを演算してもよい。

【0084】

具体的には、情報処理装置３０は、図３に示すように、薬物Ｘについて集計された対象者情報Ｐ、時間情報Ｔ及び副作用毎の発現確率を用いて、薬物Ｘの安全性スコアを演算してもよい。例えば、図３では、各副作用の対象者情報Ｐ及び時間情報Ｔ毎の発現確率の平均値を加算して、薬物Ｘの安全性スコアを導出してもよい。

【0085】

また、情報処理装置３０は、図４に示すように、特定の対象者について集計された薬物情報Ｄ、時間情報Ｔ及び副作用毎の発現確率を用いて、特定の対象者の副作用スコアを演算してもよい。例えば、図４では、各副作用についての薬物情報Ｄ及び時間情報Ｔ毎の発現確率の平均値を、特定の対象者の副作用スコアを導出してもよい。

【0086】

ステップＳ２０５において、情報処理装置３０は、ステップＳ２０３で算出された発現情報及びステップＳ２０４で演算された評価情報の少なくとも一つを出力して、ユーザに提供する。

【0087】

以上のように、本実施形態に係る情報処理システム１によれば、薬物情報、対象者情報及び時間情報の特徴量を含む多次元特徴ベクトルと副作用の発現実績に関する情報とを対応付けた学習データに基づいて生成された予測モデルを用いて、副作用の発現情報（例えば、発現確率）が演算されるので、実績データを十分に得られない薬物、対象者、副作用等についても副作用の発現情報を適切に演算できる。

【0088】

また、本実施形態に係る情報処理システム１によれば、上記発現情報に基づいて特定の対象者の副作用スコアが演算されるので、特定の対象者に対する薬物の投与前に副作用の起きやすさを認識でき、特定の対象者に対する投薬時の安全性を向上できる。

【0089】

また、本実施形態に係る情報処理システム１によれば、発現情報に基づいて特定の薬物の安全性スコアが演算されるので、特定の薬物の安全性の指標値を適切に演算でき、特定の薬物の投薬時の安全性を向上できる。

【0090】

以上説明した実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。実施形態が備える各要素並びにその配置、材料、条件、形状及びサイズ等は、例示したものに限定されるわけではなく適宜変更することができる。また、異なる実施形態で示した構成同士を部分的に置換し又は組み合わせることが可能である。

【0091】

例えば、上記実施形態では、薬物とは、医薬品や化合物であるものとして説明したが、これに限らず、例えば、医療機器や治療用アプリケーションなど、医師によって処方されるものを薬物に含めてもよい。

【0092】

また、上記実施形態では、薬物情報Ｄ、対象者情報Ｐ及び時間情報Ｔの特徴量を含む多次元特徴ベクトルと副作用の発現実績に関する情報とを対応付けた学習データに基づいて生成された予測モデルを用いることで、薬物についての適切な評価を可能としたが、これに限られない。例えば、薬物情報Ｄに代えて、医療機器や医療アプリケーションに関する情報等の医療に関する情報（「医療情報」ともいう）を用いた学習データに基づいて生成された予測モデルを用いることで、医療に関する評価（例えば、医療機器又は医療アプリケーション等の評価）を適切に行うこともできる。このように、本実施形態は、医療情報、対象者情報Ｐ及び時間情報Ｔの特徴量を含む多次元特徴ベクトルと、所定の実績に関する情報（例えば、医療機器や医療アプリケーション等を用いた治療実績）とを対応付けた学習データに基づいて生成された予測モデルを用いることで、医療に関する様々な評価を行うことに応用できる。

【符号の説明】

【0093】

１…情報処理システム、１０…学習装置、２０…記憶装置、３０…情報処理装置、１１…取得部、１２…生成部、１３…学習部、１３ａ…予測モデル、３１…受付部、３２…抽出部、３３…算出部、３３ａ…予測モデル、３４…演算部、３５…出力部、Ｄ…薬物情報、Ｐ…対象者情報、Ｔ…時間情報、１０ａ…プロセッサ、１０ｂ…記憶装置、１０ｃ…通信部、１０ｄ…入力部、１０ｅ…出力部

【図1】