IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ オラクル・インターナショナル・コーポレイションの特許一覧

<>
  • 特表-ニューラル信号検出 図1
  • 特表-ニューラル信号検出 図2
  • 特表-ニューラル信号検出 図3
  • 特表-ニューラル信号検出 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-04-02
(54)【発明の名称】ニューラル信号検出
(51)【国際特許分類】
   G06N 20/00 20190101AFI20240326BHJP
   G16H 20/10 20180101ALI20240326BHJP
【FI】
G06N20/00
G16H20/10
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023562563
(86)(22)【出願日】2022-02-01
(85)【翻訳文提出日】2023-11-08
(86)【国際出願番号】 US2022014693
(87)【国際公開番号】W WO2022220909
(87)【国際公開日】2022-10-20
(31)【優先権主張番号】17/227,801
(32)【優先日】2021-04-12
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.TENSORFLOW
(71)【出願人】
【識別番号】502303739
【氏名又は名称】オラクル・インターナショナル・コーポレイション
(74)【代理人】
【識別番号】110001195
【氏名又は名称】弁理士法人深見特許事務所
(72)【発明者】
【氏名】ハーパズ,レイブ
(72)【発明者】
【氏名】デュムーシェル,ウィリアム
(72)【発明者】
【氏名】ブライト,スティーブン・ティ
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA25
(57)【要約】
ニューラル信号検出に関連付けられたシステム、方法、および他の実施形態が開示される。一実施形態では、複数の報告について、ニューラル信号検出ネットワークの埋め込み層によって、報告に含まれる情報オブジェクトのセットの各々のためのベクトル埋め込みを作成する。情報オブジェクトのセットはターゲットオブジェクトを含む。表現層によって、ターゲット事象の発生と情報オブジェクトとの相関を記述し、かつ、報告を構成する情報オブジェクト間の依存性を勘案する態様で、報告を表現する。ロジット層によって、報告の表現に基づいて、ターゲット事象を含む事象のセットをモデル化する。モデル化された事象のセットを与えられた、ターゲット事象についての発生確率を求める。複数の報告にわたるターゲット事象についての要約発生確率を比較基準確率と比較することによって、信号の存在を識別する。
【特許請求の範囲】
【請求項1】
格納されたコンピュータ実行可能命令を含む、非一時的コンピュータ読取可能媒体であって、前記コンピュータ実行可能命令は、コンピュータの少なくともプロセッサによって実行されると、前記コンピュータに複数のステップを行なわせ、前記複数のステップは、
報告データベースにおける複数の報告について、
少なくとも前記プロセッサが、ニューラル信号検出ネットワークの埋め込み層によって、報告に含まれる1つ以上の情報オブジェクトのセットの各々のためのベクトル埋め込みを作成するステップを含み、前記1つ以上の情報オブジェクトのセットはターゲットオブジェクトを含み、前記複数のステップはさらに、
少なくとも前記プロセッサが、前記ニューラル信号検出ネットワークの表現層によって、ターゲット事象の発生と前記情報オブジェクトとの相関を記述し、かつ、前記報告を構成する前記情報オブジェクト間の依存性を勘案する態様で、前記報告を表現するステップと、
少なくとも前記プロセッサが、前記ニューラル信号検出ネットワークのロジット層によって、前記報告の表現に基づいて、前記ターゲット事象を含む事象のセットをモデル化するステップと、
少なくとも前記プロセッサが、モデル化された前記事象のセットを与えられた前記ターゲット事象についての発生確率を求めるステップと、
少なくとも前記プロセッサが、前記報告データベースにおける前記複数の報告にわたる前記ターゲット事象についての要約発生確率を比較基準確率と比較することによって、信号の存在を識別するステップとを含む、非一時的コンピュータ読取可能媒体。
【請求項2】
少なくとも前記プロセッサによって実行されると、前記プロセッサに、
前記要約発生確率と、前記要約発生確率を作成するために使用された同じ報告のセットから導き出された比較基準確率とから、信号スコアを計算するステップと、
(i)前記要約発生確率を計算するために使用された各報告から前記ターゲットオブジェクトを除去した状態で、または(ii)各報告について前記ターゲットオブジェクトに割り当てられた注意重みをゼロに設定した状態で前記要約発生確率を計算するために使用された各報告から、さらに別の要約発生確率を再計算することによって、前記比較基準確率を計算するステップとを行なわせる命令をさらに備える、請求項1に記載の非一時的コンピュータ読取可能媒体。
【請求項3】
少なくとも前記プロセッサによって実行されると、前記プロセッサに、最小化されるべき損失関数としてデータ対数尤度を使用して、確率的勾配降下法によって前記ニューラル信号検出ネットワークのパラメータを推定することによって、前記ニューラル信号検出ネットワークを訓練するステップを行なわせる命令をさらに備える、請求項1または請求項2に記載の非一時的コンピュータ読取可能媒体。
【請求項4】
少なくとも前記プロセッサによって実行されると、前記プロセッサに、前記情報オブジェクトの各々に注意重みを付けるステップを行なわせる命令をさらに備え、各情報オブジェクトに付けられた前記注意重みは、前記情報オブジェクトのうちの少なくとも1つの他の情報オブジェクトに基づいている、請求項1、請求項2、または請求項3に記載の非一時的コンピュータ読取可能媒体。
【請求項5】
前記ターゲットオブジェクトはターゲット薬剤であり、前記報告に含まれる前記1つ以上のオブジェクトのセットは、前記ターゲット薬剤に関して交絡効果またはマスキング効果を有する第2の薬剤をさらに含む、請求項1、請求項2、請求項3、または請求項4に記載の非一時的コンピュータ読取可能媒体。
【請求項6】
コンピュータが実現する方法であって、
報告データベースにおける複数の報告について、
ニューラル信号検出ネットワークの埋め込み層によって、報告に含まれる1つ以上の情報オブジェクトのセットの各々のためのベクトル埋め込みを作成するステップを備え、前記1つ以上の情報オブジェクトのセットはターゲットオブジェクトを含み、前記方法はさらに、
前記ニューラル信号検出ネットワークの表現層によって、ターゲット事象の発生と前記情報オブジェクトとの相関を記述し、かつ、前記報告を構成する前記情報オブジェクト間の依存性を勘案する態様で、前記報告を表現するステップと、
前記ニューラル信号検出ネットワークのロジット層によって、前記報告の表現に基づいて、前記ターゲット事象を含む事象のセットをモデル化するステップと、
モデル化された前記事象のセットを与えられた前記ターゲット事象についての発生確率を求めるステップと、
前記報告データベースにおける前記複数の報告にわたる前記ターゲット事象についての要約発生確率を比較基準確率と比較することによって、信号の存在を識別するステップとを備える、コンピュータが実現する方法。
【請求項7】
前記要約発生確率と比較基準確率とから信号スコアを計算するステップをさらに備え、前記比較基準確率は、前記要約発生確率を計算するために使用された各報告から前記ターゲットオブジェクトを除去した状態でさらに別の要約発生確率を再計算することによって、前記信号スコアを作成するために使用された同じ報告のセットから導き出されたものである、請求項6に記載のコンピュータが実現する方法。
【請求項8】
前記要約発生確率と比較基準確率とから信号スコアを計算するステップをさらに備え、前記比較基準確率は、各報告について前記ターゲットオブジェクトに割り当てられた注意重みをゼロに設定した状態で前記要約発生確率を計算するために使用された各報告からさらに別の要約発生確率を再計算することによって、前記信号スコアを作成するために使用された同じ報告のセットから導き出されたものである、請求項6に記載のコンピュータが実現する方法。
【請求項9】
最小化されるべき損失関数としてデータ対数尤度を使用して、確率的勾配降下法によって前記ニューラル信号検出ネットワークのパラメータを推定することによって、前記ニューラル信号検出ネットワークを訓練するステップをさらに備える、請求項6、請求項7、または請求項8に記載のコンピュータが実現する方法。
【請求項10】
前記情報オブジェクトの各々に注意重みを付けるステップをさらに備え、
(i)前記ターゲット事象を引き起こすことが知られている第1の情報オブジェクトに付けられた第1の注意重みは、前記ターゲット事象を引き起こすことが知られていない他の情報オブジェクトに割り当てられた他の注意重みよりも大きく、または(ii)前記ターゲット事象の尤度を減少させることが知られている第1の情報オブジェクトに付けられた第1の注意重みは、前記ターゲット事象の尤度を減少させることが知られていない他の情報オブジェクトに割り当てられた他の注意重みよりも大きい、請求項6、請求項7、請求項8、または請求項9に記載のコンピュータが実現する方法。
【請求項11】
前記ターゲットオブジェクトはターゲット薬剤であり、前記ターゲット事象のセットは(i)有害健康事象、または(ii)プラスの健康事象を含む、請求項6、請求項7、請求項8、請求項9、または請求項10に記載のコンピュータが実現する方法。
【請求項12】
コンピューティングシステムであって、
プロセッサと、
前記プロセッサに動作可能に接続されたメモリと、
前記プロセッサおよびメモリに動作可能に接続され、コンピュータ実行可能命令を格納する、非一時的コンピュータ読取可能媒体とを備え、前記コンピュータ実行可能命令は、コンピュータの少なくともプロセッサによって実行されると、前記コンピューティングシステムに複数のステップを行なわせ、前記複数のステップは、
報告データベースにおける複数の報告について、
ニューラル信号検出ネットワークの埋め込み層によって、報告に含まれる1つ以上の情報オブジェクトのセットの各々のためのベクトル埋め込みを作成するステップを含み、前記1つ以上の情報オブジェクトのセットはターゲットオブジェクトを含み、前記複数のステップはさらに、
前記ニューラル信号検出ネットワークの表現層によって、ターゲット事象の発生と前記情報オブジェクトとの相関を記述し、かつ、前記報告を構成する前記情報オブジェクト間の依存性を勘案する態様で、前記報告を表現するステップと、
前記ニューラル信号検出ネットワークのロジット層によって、前記報告の表現に基づいて、前記ターゲット事象を含む事象のセットをモデル化するステップと、
モデル化された前記事象のセットを与えられた前記ターゲット事象についての発生確率を求めるステップと、
前記報告データベースにおける前記複数の報告にわたる前記ターゲット事象についての要約発生確率を比較基準確率と比較することによって、信号の存在を識別するステップとを含む、コンピューティングシステム。
【請求項13】
前記命令は、実行されると、前記コンピューティングシステムに、前記情報オブジェクトの各々に注意重みを付けるステップをさらに行なわせ、各情報オブジェクトに付けられた前記注意重みは、前記情報オブジェクトのうちの少なくとも1つの他の情報オブジェクトに基づいている、請求項12に記載のコンピューティングシステム。
【請求項14】
前記ターゲットオブジェクトはターゲット薬剤であり、
前記ターゲット事象のセットは有害健康事象を含み、
前記命令は、実行されると、前記コンピューティングシステムに、
前記事象確率と比較基準確率とから信号スコアを計算するステップと、
信号の存在を示すしきい値を前記信号スコアが上回ることに応答して信号の存在を判定するステップと、
信号が検出されたことを示す、リモートシステムによる表示用の警告を提示するステップとをさらに行なわせる、請求項12または請求項13に記載のコンピューティングシステム。
【請求項15】
前記命令は、実行されると、前記コンピューティングシステムに、前記報告における前記ターゲット薬剤を無視しつつ、前記要約発生確率を計算するために使用された各報告からさらに別の要約発生確率を再計算することによって、前記信号スコアを作成するために使用された同じ報告のセットから前記比較基準確率を導き出すステップをさらに行なわせる、請求項12、請求項13、または請求項14に記載のコンピューティングシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本明細書に記載されているシステムおよび方法は、機械学習システムおよび人工ニューラルネットワークを含む知能のエミュレーションのための人工知能コンピュータおよびデジタルデータ処理システム、方法、および製品に関する。より特定的には、本明細書に記載されているシステムおよび方法は、データ信号検出についての事実および関係のその一体化された集合に追加する能力を有するディープニューラルネットワークを使用する機械学習に関する。
【背景技術】
【0002】
背景
信号検出とは、パターンを運ぶ情報、すなわち「信号」を、当該情報から転ずるかまたは当該情報を偽るランダムパターン、すなわち「ノイズ」から区別する能力である。
【0003】
有害反応とは、薬剤または他の医学的処置に対する、有害で意図されたものでない患者の反応である。薬剤、生物製剤、ワクチン、デバイス、または他の医療製品に対する有害反応の原因は複雑であり、観察された治療と有害事象との因果関係を研究するための高度な分析的アプローチを必要とする。量的信号検出としても知られている計算信号検出は、観察/報告された製品と有害事象との潜在的な因果関係を審査するためのツールである。
【発明の概要】
【0004】
概要
一実施形態では、格納されたコンピュータ実行可能命令を含む、非一時的コンピュータ読取可能媒体であって、コンピュータ実行可能命令は、コンピュータの少なくともプロセッサによって実行されると、コンピュータに複数のステップを行なわせ、複数のステップは、報告データベースにおける複数の報告について、少なくともプロセッサが、ニューラル信号検出ネットワークの埋め込み層によって、報告に含まれる1つ以上の情報オブジェクトのセットの各々のためのベクトル埋め込みを作成するステップを含み、1つ以上の情報オブジェクトのセットはターゲットオブジェクトを含み、複数のステップはさらに、少なくともプロセッサが、ニューラル信号検出ネットワークの表現層によって、ターゲット事象の発生と情報オブジェクトとの相関を記述し、かつ、報告を構成する情報オブジェクト間の依存性を勘案する態様で、報告を表現するステップと、少なくともプロセッサが、ニューラル信号検出ネットワークのロジット層によって、報告の表現に基づいて、ターゲット事象を含む事象のセットをモデル化するステップと、少なくともプロセッサが、モデル化された事象のセットを与えられたターゲット事象についての発生確率を求めるステップと、少なくともプロセッサが、報告データベースにおける複数の報告にわたるターゲット事象についての要約発生確率を比較基準確率と比較することによって、信号の存在を識別するステップとを含む、非一時的コンピュータ読取可能媒体が提供される。
【0005】
一実施形態では、非一時的コンピュータ読取可能媒体は、少なくともプロセッサによって実行されると、プロセッサに、要約発生確率と、要約発生確率を作成するために使用された同じ報告のセットから導き出された比較基準確率とから、信号スコアを計算するステップと、(i)要約発生確率を計算するために使用された各報告からターゲットオブジェクトを除去した状態で、または(ii)各報告についてターゲットオブジェクトに割り当てられた注意重みをゼロに設定した状態で要約発生確率を計算するために使用された各報告から、さらに別の要約発生確率を再計算することによって、比較基準確率を計算するステップとを行なわせる命令をさらに備える。
【0006】
一実施形態では、非一時的コンピュータ読取可能媒体は、少なくともプロセッサによって実行されると、プロセッサに、最小化されるべき損失関数としてデータ対数尤度を使用して、確率的勾配降下法によってニューラル信号検出ネットワークのパラメータを推定することによって、ニューラル信号検出ネットワークを訓練するステップを行なわせる命令をさらに備える。
【0007】
一実施形態では、非一時的コンピュータ読取可能媒体は、少なくともプロセッサによって実行されると、プロセッサに、情報オブジェクトの各々に注意重みを付けるステップを行なわせる命令をさらに備え、各情報オブジェクトに付けられた注意重みは、情報オブジェクトのうちの少なくとも1つの他の情報オブジェクトに基づいている。
【0008】
一実施形態では、非一時的コンピュータ読取可能媒体において、ターゲットオブジェクトはターゲット薬剤であり、報告に含まれる1つ以上のオブジェクトのセットは、ターゲット薬剤に関して交絡効果またはマスキング効果を有する第2の薬剤をさらに含む。
【0009】
一実施形態では、コンピュータが実現する方法であって、報告データベースにおける複数の報告について、ニューラル信号検出ネットワークの埋め込み層によって、報告に含まれる1つ以上の情報オブジェクトのセットの各々のためのベクトル埋め込みを作成するステップを備え、1つ以上の情報オブジェクトのセットはターゲットオブジェクトを含み、方法はさらに、ニューラル信号検出ネットワークの表現層によって、ターゲット事象の発生と情報オブジェクトとの相関を記述し、かつ、報告を構成する情報オブジェクト間の依存性を勘案する態様で、報告を表現するステップと、ニューラル信号検出ネットワークのロジット層によって、報告の表現に基づいて、ターゲット事象を含む事象のセットをモデル化するステップと、モデル化された事象のセットを与えられたターゲット事象についての発生確率を求めるステップと、報告データベースにおける複数の報告にわたるターゲット事象についての要約発生確率を比較基準確率と比較することによって、信号の存在を識別するステップとを備える、コンピュータが実現する方法が提供される。
【0010】
一実施形態では、コンピュータが実現する方法は、要約発生確率と比較基準確率とから信号スコアを計算するステップをさらに備え、比較基準確率は、要約発生確率を計算するために使用された各報告からターゲットオブジェクトを除去した状態でさらに別の要約発生確率を再計算することによって、信号スコアを作成するために使用された同じ報告のセットから導き出されたものである。
【0011】
一実施形態では、コンピュータが実現する方法は、要約発生確率と比較基準確率とから信号スコアを計算するステップをさらに備え、比較基準確率は、各報告についてターゲットオブジェクトに割り当てられた注意重みをゼロに設定した状態で要約発生確率を計算するために使用された各報告からさらに別の要約発生確率を再計算することによって、信号スコアを作成するために使用された同じ報告のセットから導き出されたものである。
【0012】
一実施形態では、コンピュータが実現する方法は、最小化されるべき損失関数としてデータ対数尤度を使用して、確率的勾配降下法によってニューラル信号検出ネットワークのパラメータを推定することによって、ニューラル信号検出ネットワークを訓練するステップをさらに備える。
【0013】
一実施形態では、コンピュータが実現する方法は、情報オブジェクトの各々に注意重みを付けるステップをさらに備え、(i)ターゲット事象を引き起こすことが知られている第1の情報オブジェクトに付けられた第1の注意重みは、ターゲット事象を引き起こすことが知られていない他の情報オブジェクトに割り当てられた他の注意重みよりも大きく、または(ii)ターゲット事象の尤度を減少させることが知られている第1の情報オブジェクトに付けられた第1の注意重みは、ターゲット事象の尤度を減少させることが知られていない他の情報オブジェクトに割り当てられた他の注意重みよりも大きい。
【0014】
一実施形態では、コンピュータが実現する方法において、ターゲットオブジェクトはターゲット薬剤であり、ターゲット事象のセットは(i)有害健康事象、または(ii)プラスの健康事象を含む。
【0015】
一実施形態では、コンピューティングシステムであって、プロセッサと、プロセッサに動作可能に接続されたメモリと、プロセッサおよびメモリに動作可能に接続され、コンピュータ実行可能命令を格納する、非一時的コンピュータ読取可能媒体とを備え、コンピュータ実行可能命令は、コンピュータの少なくともプロセッサによって実行されると、コンピューティングシステムに複数のステップを行なわせ、複数のステップは、報告データベースにおける複数の報告について、ニューラル信号検出ネットワークの埋め込み層によって、報告に含まれる1つ以上の情報オブジェクトのセットの各々のためのベクトル埋め込みを作成するステップを含み、1つ以上の情報オブジェクトのセットはターゲットオブジェクトを含み、複数のステップはさらに、ニューラル信号検出ネットワークの表現層によって、ターゲット事象の発生と情報オブジェクトとの相関を記述し、かつ、報告を構成する情報オブジェクト間の依存性を勘案する態様で、報告を表現するステップと、ニューラル信号検出ネットワークのロジット層によって、報告の表現に基づいて、ターゲット事象を含む事象のセットをモデル化するステップと、モデル化された事象のセットを与えられたターゲット事象についての発生確率を求めるステップと、報告データベースにおける複数の報告にわたるターゲット事象についての要約発生確率を比較基準確率と比較することによって、信号の存在を識別するステップとを含む、コンピューティングシステムが提供される。
【0016】
一実施形態では、コンピューティングシステムにおいて、命令は、実行されると、コンピューティングシステムに、情報オブジェクトの各々に注意重みを付けるステップをさらに行なわせ、各情報オブジェクトに付けられた注意重みは、情報オブジェクトのうちの少なくとも1つの他の情報オブジェクトに基づいている。
【0017】
一実施形態では、コンピューティングシステムにおいて、ターゲットオブジェクトはターゲット薬剤であり、ターゲット事象のセットは有害健康事象を含み、命令は、実行されると、コンピューティングシステムに、事象確率と比較基準確率とから信号スコアを計算するステップと、信号の存在を示すしきい値を信号スコアが上回ることに応答して信号の存在を判定するステップと、信号が検出されたことを示す、リモートシステムによる表示用の警告を提示するステップとをさらに行なわせる。
【0018】
一実施形態では、コンピューティングシステムにおいて、命令は、実行されると、コンピューティングシステムに、報告におけるターゲット薬剤を無視しつつ、要約発生確率を計算するために使用された各報告からさらに別の要約発生確率を再計算することによって、信号スコアを作成するために使用された同じ報告のセットから比較基準確率を導き出すステップをさらに行なわせる。
【0019】
図面の簡単な説明
明細書において援用され、その一部を構成する添付図面は、この開示のさまざまなシステム、方法、および他の実施形態を図示する。図面における図示された要素境界(たとえばボックス、ボックスのグループ、または他の形状)は、当該境界の一実施形態を表わすということが理解されるであろう。いくつかの実施形態では、1つの要素が複数の要素として実現されてもよく、または、複数の要素が1つの要素として実現されてもよい。いくつかの実施形態では、別の要素の内部構成要素として示された要素が外部構成要素として実現されてもよく、逆もまた同様である。さらに、要素は縮尺通りに図示されていない場合がある。
【図面の簡単な説明】
【0020】
図1】ニューラル信号検出に関連付けられたコンピューティングシステムの一実施形態を示す図である。
図2】ニューラル信号検出に関連付けられたニューラルネットワークのトポロジの一実施形態を示す図である。
図3】ニューラル信号検出に関連付けられた方法の一実施形態を示す図である。
図4】開示された例示的なシステムおよび/または方法を用いて構成されたコンピューティングシステムの実施形態を示す図である。
【発明を実施するための形態】
【0021】
詳細な説明
ニューラル信号検出(neural signal detection:NSD)、すなわちニューラルネットワークを使用する信号検出を提供するシステムおよび方法が、本明細書に記載される。本明細書に記載されているニューラル信号検出システムおよび方法は、有害事象、医薬品、および他の入力要因の間の複雑な依存性のモデル化を可能にするだけでなく、交絡効果およびマスキング効果にも対処し、それにより、信号検出システムおよび方法の精度を向上させる。本明細書に記載されているニューラル信号検出システムおよび方法は、他の統計的方法論または機械学習方法論を使用して実現された信号検出と比べて、間違った警告および欠落した信号を減少させる。精度のこれらの向上は、より迅速な、またはより適時の信号検出をもたらす。本明細書に記載されているニューラル信号検出システムおよび方法は、複数の事象の同時モデル化を可能にする。本明細書に記載されているニューラル信号検出システムおよび方法はまた、事象階層または製品階層のコンテキストにおける依存性のモデル化を可能にする。本明細書に記載されているニューラル信号検出システムおよび方法は、入力における外部情報(薬剤の生化学的特性など)の含有を容易にサポートする。
【0022】
本明細書に記載されているニューラル信号検出システムおよび方法は、患者の安全性などの安全性および規制遵守コンテキストにおいて容易に適用される。一実施形態では、本明細書に記載されているニューラル信号検出システムおよび方法は、薬剤の有害健康効果を検出するために適用され、このため、患者の安全性を向上させる。たとえば、信号検出のためのターゲットオブジェクトはターゲット薬剤であり、ターゲット事象のセットは有害健康事象を含む。逆の場合、本明細書に記載されているニューラル信号検出システムおよび方法は、薬剤の思いがけないプラスの効果を検出するために採用されてもよく、それにより、医学研究を早めて患者の健康を改善する。たとえば、信号検出のためのターゲットオブジェクトはターゲット薬剤であり、ターゲット事象のセットはプラスの健康事象を含む。また、本明細書に記載されているニューラル信号検出システムおよび方法は、期待される薬理作用の失敗の原因を特定するために適用されてもよく、治療の代替案の識別を可能にして患者の健康を改善する。ニューラル信号検出は、それが健康部門で提供する利点のコンテキストにおいて本明細書に記載され得るものの、ニューラル信号検出は、入力と出力事象との間に複雑な依存性が存在するあらゆる分野、もしくは、出力事象または入力における階層のコンテキストにおいて複数の事象を同時にモデル化する必要があるあらゆる分野で有利に適用され得る。
【0023】
信号検出アルゴリズムの目的は、特定の入力に関連付けられた潜在的に新しい(または少なくとも、以前に検出されなかった)事象を目立たせるために使用される、不均衡比率としても知られている統計的信号スコアを生成することである。信号検出アルゴリズムは、入力と事象との関係をモデル化する手法の上に構築される。本明細書に示され記載されているようなニューラル信号検出(NSD)は、これらの関係をモデル化するためにディープラーニング(deep learning:DL)手法を使用する。信号検出アルゴリズムの有効性は主として、それらが生成する信号の精度に基づいて判断される。シグナリングエラーは、間違った警告および未検出の真の事象につながる。本明細書に示され記載されている新しいニューラル信号検出アルゴリズムは、既存のアルゴリズムよりも高い精度で信号を生成し得る。
【0024】
一実施形態では、医薬品安全性監視データセットに適用された場合、統計的有意性スコア(不均衡比率)は、医薬品の使用に関連付けられた有害事象を検出するために使用される。本明細書に記載されているニューラル信号検出システムおよび方法によって提供される信号検出における感度および精度の向上は、製薬会社にとって高くつく間違った警告を減少させる。また、本明細書に記載されているニューラル信号検出システムおよび方法によって提供される信号検出における精度の向上は、未検出の真の事象を減少させ、患者への損害を防止する。さらに、本明細書に記載されているニューラル信号検出システムおよび方法によって提供される信号検出における感度の向上は、真の事象がより早期に、またはより小さいデータセットから検出されることを可能にし、この場合も患者への損害を防止する。
【0025】
本明細書に記載または特許請求されているいかなるアクションまたは機能も、人間の精神によって行なわれない。本明細書に記載または特許請求されているいかなるアクションまたは機能も、人間の精神によって行なわれ得ない。任意のアクションまたは機能が人間の精神において行なわれ得るという解釈は、この開示と矛盾しており、この開示に反している。
【0026】
オラクル(Oracle)(登録商標)エンピリカ・シグナル(Empirica Signal)などの信号管理ソフトウェアシステムは、製薬会社などのユーザが、自社の製品(市販前および市販後薬剤、生物製剤、ワクチン、デバイス、および組合せ製品など)に関連付けられた新しい有害(またはプラスの思いがけない)事象を管理し、追跡し、識別するために使用するソフトウェアアプリケーションである。信号管理ソフトウェアは、利用可能なデータにおける信号の識別を達成するためのいくつかの信号検出アルゴリズムを実現し得る。一実施形態では、信号検出システムおよび方法が動作するデータは、その顧客によって収集され管理された有害事象の自発報告(個別症例安全性報告など)である。各報告は構造化されたフォーマットで利用可能であり、報告された有害事象、事象に関連付けられた疑わしい医薬品、日付、限定された患者の人口統計学的情報(たとえば年齢および性別)、報告者情報、および、報告された有害事象に関係する潜在的な他の情報を含む。一実施形態では、信号検出が動作するデータは、情報を記録しているものの報告された有害事象として提出されていない患者データから生成された、同じ構造化されたフォーマットに従って動的に生成された事象報告である。たとえば、この患者データは、病院または病院群の患者記録から引き出され得る。このデータは匿名化され得る。別の例では、信号検出が動作するデータは、報告がコンパイルされ得る元となる情報を含む医学文献または他のデータソースを含み得る。
【0027】
信号管理ソフトウェアは、使用の複雑性および容易性に幅がある1つ以上の信号検出方法論を利用可能にし得る。比例報告比(proportional reporting ratio:PRR)、マルチ項目ガンマポアソン収縮器(multi-item gamma Poisson shrinker:MGPS)、および情報コンポーネント(information component:IC)などの標準的な方法論は、ターゲット製品およびターゲット有害事象の2×2分割表(またはクロス集計)に基づいている。これらの2×2分割表に含まれる情報のみから導き出されたモデルおよび信号スコアは、ほぼ間違いなく複雑な問題であることを、はるかにより単純なことに減少させる。有害事象関係の研究に関連付けられた複雑性は、用量、持続時間、および経路、人口統計、表示、併発症、遺伝学、製品および有害事象をとらえるために使用される用語および/または言語可変性に関連付けられた問題、ならびに、製品相互作用、交絡効果およびマスキング効果、製品クラス効果、症候群事象、および二次効果として表明された要因間依存性における違いを含むもののそれらに限定されない多くの要因から生じる。したがって、2×2分割表への信号検出の減少は、観察/報告された製品と有害事象との複雑な関係を研究するために必要な重大情報の損失につながり得る。これは次に、間違った警告および/または欠落した信号につながり得る。
【0028】
間違った警告および欠落した信号というこれらの問題の克服を試みて、2×2分割表を超え、より高度なモデル化手法をより多くの情報(データ変数など)とともに利用する、より高度なシグナリング方法論が開発されてきた。拡張ロジスティック回帰(extended logistic regression:ELR)および回帰調整ガンマポアソン収縮器(regression-adjusted gamma Poisson shrinker:RGPS)(双方ともオラクル(登録商標)エンピリカ・シグナルで利用可能)、ならびに、世界保健機関(World Health Organization)の2値ロジスティック回帰(binary logistic regression:BLR)といった、これらの高度なアプローチの大部分は、ロジスティック回帰に基づいている。ロジスティック回帰では、ターゲット有害事象の発生が、ターゲット製品、および追加の回帰予測因子として表わされる追加情報のコンテキストにおいてモデル化される。これらの追加の予測因子は、用量、人口統計、付随物、および一般に、利用可能な任意の他の関連情報を表わし得る。この点に関し、2×2分割表に基づいたアプローチは、たった1つの予測因子、すなわちターゲット製品を用いるロジスティック回帰として考えられ得る。
【0029】
ディープラーニングおよびニューラル信号検出
概して言えば、人工知能(Artificial Intelligence:AI)とは、データの統計的解析、if-then文に依拠するエキスパートシステム、および機械学習などの手法を使用して学習および問題解決などの認知プロセスを模倣するインテリジェントなコンピュータシステムを作る科学である。AIは、機械学習(machine learning:ML)、ニューラルネットワーク、ディープラーニング自然言語処理(natural language processing:NLP)および自然言語生成(natural language generation:NLG)、ならびに画像処理を含む、多くのサブフィールドを含む。これらのサブフィールドは、かなりの重複を有し得る。
【0030】
機械学習とは、明確な命令を使用せず、代わりにパターンおよび推論に依拠して、データから学習するようにソフトウェアアルゴリズムを訓練するために使用されるAI手法である。機械学習の形式は、教師あり学習、教師なし学習、および半教師あり学習を含む。一般に、教師あり学習の目的は、入力と出力との間のマッピング関数を、当該関数が新しい入力についての出力を正確に予測するために使用され得るように近似することである。教師あり学習では、例示的な入力および「正しい」出力の訓練データセットが機械学習アルゴリズムに提示され、それに応答してアルゴリズムは、入力を出力にマッピングし、新しい入力についての出力を予測するために使用され得る推論された関数またはモデルを生成する。教師あり学習アルゴリズムは、出力が「チーズ」または「赤い」などのカテゴリである分類のためのものであるか、もしくは、出力がお金、重み、または次元などの数値(または他の値)である回帰のためのものである。一般に、教師なし学習の目的は、ラベルなしデータの根本的な構造または分布を発見してモデル化することである。教師なし学習では、ラベルなしデータが機械学習アルゴリズムに提示され、それに応答してアルゴリズムは、ラベルなしデータを表わす推論された関数またはモデルを生成する。半教師あり学習は、訓練データセットの一部のみが出力でラベル付けされている、教師あり学習と教師なし学習との間の中央空間を占める。半教師あり学習では、入力変数における構造を発見して学習するために、教師なし学習手法が採用され、一方、ラベルなしデータの「最良の推測」予測を行ない、その「最良の推測」データを使用してモデルをさらに訓練するために、教師あり学習手法が使用され得る。
【0031】
ニューラルネットワークは、方向付けられ重み付けされたグラフにおいて複数の層(入力層、隠れ層、および出力層)になるよう接続され組織される人工ニューロンから複雑なシステムが構成される、人間の脳から着想されたAI手法である。ニューロン(グラフのノード)および接続部(「シナプス」とも呼ばれることがある、グラフのエッジ)は典型的には、学習が進むにつれて調節される重みを有し、それは、出力信号の強度を増加または減少させる。学習中、ニューロンおよび接続部の重みは、ニューラルネットワークがパターンを正確にかつ矛盾なく識別するまで、(初期値(たとえばランダム値)から連続した世代にわたって)プロセッサによって調節される。各ニューロンは1つ以上の入力を受け付けて単一の出力を生成し、それは、次の層における複数の他のニューロンに送られ得る。1つの層のニューロンは、直前の層および直後の層のニューロンにのみ接続する。入力層のニューロンは、入力データの特徴値であり得る。出力層のニューロンは、出力の特徴値である。入力層と出力層との間には、ゼロ以上の隠れ層がある。ニューロンの出力は、ニューロンへの入接続の重みによって重み付けされた、ニューロンへのすべての入力の合計を取り、この重み付けされた合計をニューロンの活性化関数を通過させてニューロンの重み付けなし出力を生成し、次に、ニューロンに割り当てられた重みを出力に適用して、次の層におけるニューロンに渡されるであろうニューロンの重み付け出力を生成することによって見出される。ニューラルネットワークは、教師あり機械学習、半教師あり機械学習、および教師なし機械学習において使用され得る。
【0032】
ニューラルネットワークは、入力からより高いレベルの特徴を漸進的に抽出するために、複数の隠れ層を有するニューラルネットワークが使用される、ディープラーニングと呼ばれるAI手法においてさらに拡張され得る。ディープラーニングにおける「ディープ」という用語は、ニューラルネットワークにおける複数の隠れ層の使用を指す。ディープラーニングは、教師あり機械学習、半教師あり機械学習、および教師なし機械学習において使用され得る。他の機械学習アルゴリズムとは異なり、ディープラーニングのためのニューラルネットワーク、すなわちディープニューラルネットワーク(deep neural network:DNN)は、複雑な非線形関係をモデル化するために使用され得る。加えて、ディープラーニングは、ロジスティック回帰などを用いる特定のパラメトリックモデルに、または、決定木の背後で使用される特定のロジックに限定されない。むしろ、それは、特定の問題に調整され得る柔軟なフレームワークである。ディープラーニングは、(たとえばコンピュータビジョン、音声認識、および自然言語処理などのアプリケーションにおいて)従来の機械学習アルゴリズムと比較して優れたモデル化パワーを提供することを、理論的観点および経験的観点の双方から証明している。
【0033】
一実施形態では、本明細書に示され記載されているようなニューラル信号検出は、RGPSを超える著しい対策を取る方法論である。ニューラル信号検出では、ディープニューラルネットワークは、RGPSによって使用されるロジスティック回帰などの他の統計的方法論または機械学習方法論を置換する。ニューラル信号検出はこのため、製品と有害事象との関係をモデル化するためにディープラーニング手法を使用する。ニューラル信号検出は、より高い精度で信号を生成するために、ディープラーニングニューラルネットワークの優れたモデル化パワーを活用する。
【0034】
したがって、ニューラル信号検出は、既存の方法論に比べて著しい利点を実証する。信号検出のコンテキストでは、より大きいモデル化パワーは、有害事象、製品、および他の要因の間のより複雑な依存性のモデル化を、より高い精度で可能にする。より大きいモデル化柔軟性は、(1)複数の事象のモデル化を同時にサポートし、(2)転移学習を可能にし、(3)事象階層または製品階層のコンテキストにおけるモデル化を可能にし、(4)外部情報の含有を容易に可能にする、ニューラルネットワークの設計を可能にする。これは、モデル化のために利用可能なデータ量を増加させ、モデル化中に異なる事象が互いに通知することを可能にし、より多くの情報の含有を可能にし、めったに起こらない事象をモデル化することに関連付けられた問題に対処する。まとめると(または別個に)、より大きいモデル化パワーおよび柔軟性は、より高いシグナリング精度、すなわち、間違った警告および欠落した信号の減少、ならびに、検出の適時性(早期性)における向上につながる。医薬品安全性監視部門では、間違った警告の減少は著しいコストおよび労力を節減し、一方、欠落した信号の減少およびより早期の信号検出は命を救う。
【0035】
例示的な信号管理環境
図1は、ニューラル信号検出に関連付けられたコンピューティングシステム100の一実施形態を示す。一実施形態では、コンピューティングシステム100は、インターネット110(または他の好適な通信ネットワークまたはネットワークの組合せ)によって企業ネットワーク115に接続された信号管理システム105を含む。一実施形態では、信号管理システム105は、本明細書に記載されているニューラル信号検出のためのシステムおよび方法を実行するようにさらに構成されたオラクル(登録商標)エンピリカ・シグナルまたは他の信号管理システムであってもよい。一実施形態では、クラウド信号管理システム105は、ニューラル信号検出コンポーネント120、他の信号管理システムコンポーネント125、データストア130、およびウェブインターフェイスサーバ135などのさまざまなシステムおよびコンポーネントを含む。
【0036】
一実施形態では、信号管理システム105のコンポーネントは、データネットワークによって相互接続された1つ以上のハードウェアコンピューティングデバイスまたはホスト上で実現される。たとえば、信号管理システム105のコンポーネントは、標準(CPUまたは汎用)形状、密入力/出力(input/output:I/O)形状、グラフィックス処理装置(graphics processing unit:GPU)形状、および高性能コンピューティング(high-performance computing:HPC)形状といった、1つ以上のコンピュートハードウェア形状のネットワーク接続されたコンピューティングデバイスによって実行され得る。ディープニューラルネットワーク(本明細書に記載されているようなニューラル信号検出のために使用されるものなど)は汎用コンピュート形状を使用して訓練され得るものの、一実施形態では、GPUコンピュート形状を使用してディープニューラルネットワークを訓練することが望ましい、ということに特に留意されたい。メインメモリにおける帯域幅最適化、スレッド並列性、および、GPU形状の処理装置に対する集約レジスタサイズのより高い比率は(待ち時間最適化、減少した並列性、および、GPU形状の処理装置に対する集約レジスタサイズのより低い比率と比較して)、ニューラル信号検出などのディープラーニングアプリケーションにおいてGPU形状をCPU形状よりも好ましくし得る。一実施形態では、信号管理システム105、または少なくともニューラル信号検出コンポーネント120は、オラクル(登録商標)GPU3またはGPU4形状によって実行されてもよい。一実施形態では、信号管理システム105のコンポーネントは各々、1つ以上の専用コンピューティングデバイスによって実現される。一実施形態では、信号管理システム105のいくつかのまたはすべてのコンポーネントは、図1では別個のユニットとして表わされているものの、共通の(または共有された)コンピューティングデバイスによって実現される。一実施形態では、信号管理システム105のコンポーネントは、複数のコンピューティングデバイスにわたって実現され得る。
【0037】
一実施形態では、信号管理システム105のコンポーネントは、電子メッセージまたは信号によって相互通信する。これらの電子メッセージまたは信号は、たとえばアプリケーションプログラミングインターフェイス(application programming interface:API)呼び出しといった、コンポーネントの特徴またはデータにアクセスする機能または手順への呼び出しとして構成され得る。一実施形態では、これらの電子メッセージまたは信号は、伝送制御プロトコル/インターネットプロトコル(transmission control protocol/internet protocol:TCP/IP)または他のコンピュータネットワークプロトコルと互換性のあるフォーマットで、ホスト間で送信される。信号管理システム105の各コンポーネントは、受信された電子メッセージまたは信号の内容を解析して、当該コンポーネントが実行できるコマンドまたは要求を識別し得る。また、コマンドの識別に応答して、当該コンポーネントはコマンドまたは要求を自動的に実行するであろう。
【0038】
一実施形態では、信号管理システム105は、クラウドインフラストラクチャ上のサービスとして実現され得る。一実施形態では、信号管理システム105は、たとえばインフラストラクチャ・アズ・ア・サービス(infrastructure-as-a-service:IAAS)、プラットフォーム・アズ・ア・サービス(platform-as-a-service:PAAS)、またはソフトウェア・アズ・ア・サービス(software-as-a-service:SAAS)アーキテクチャにおける専用のサードパーティによってホストされ得る。一実施形態では、信号管理システム105は、1つ以上の専用サーバのセットなどのオンプレミスインフラストラクチャ上で実現され得る。
【0039】
一実施形態では、他の信号管理システムコンポーネント125は、信号マネジメントシステム105を動作させるためのコンポーネントを含む。たとえば、他の信号管理システムコンポーネント125は、PRR、MGPS、IC、ELR、RGPS、および/またはBLR信号検出のためのモジュール;検出された事象または信号に関係するアクションを管理するための検出事象管理モジュール;検出された事象または信号を監視するための検出事象追跡モジュール;有害事象報告の提出を受け付けるための有害事象報告受け入れモジュール;有害事象報告として構造化されていないデータを取り込むための他のデータ収集モジュール;有害事象報告として正式に提出されていない患者データから事象報告を生成するための動的事象報告生成モジュール;信号検出に加えてデータ解析を行なうためのデータ解析および視覚化モジュール;信号管理システム105の他のコンポーネント/モジュールへのユーザインターフェイスを生成するためのユーザインターフェイスモジュール;安全信号情報を作成し、規制機関への提出を監視するための規制報告モジュール;ならびに/もしくは、システム105へのテナントおよびユーザのアクセスを管理するための管理モジュールといった、他の信号検出方法論モジュールを含み得る。
【0040】
企業ネットワーク115は、製薬メーカーまたは医療機器メーカーなどの会社、もしくは、製品の下流挙動を監視することに関心を有する他のエンティティに関連付けられ得る。説明を簡潔かつ明確にするために、企業ネットワーク115は、1つ以上のパーソナルコンピュータ145またはサーバ150が動作可能に接続されたオンサイトローカルエリアネットワーク140と、インターネット110を通して企業ネットワーク115に接続された1つ以上のリモートユーザコンピュータ155またはモバイルデバイス160とによって表わされる。各パーソナルコンピュータ145、リモートユーザコンピュータ155、またはモバイルデバイス160は一般に、会社に関連付けられた従業員または契約者などの特定のエンドユーザ専用のものであるが、そのような専用性は要求されない。パーソナルコンピュータ145およびリモートユーザコンピュータ155は、たとえば、ローカルエリアネットワーク140またはインターネット110に接続する能力を有するデスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、または他のデバイスであり得る。モバイルデバイス160は、たとえば、携帯電話ネットワークまたはWi-Fiなどの無線ネットワークを通してローカルエリアネットワーク140またはインターネット110に接続する能力を有するスマートフォン、タブレットコンピュータ、携帯電話、または他のデバイスであり得る。
【0041】
企業ネットワーク115のユーザらは、インターネット110経由で信号管理システム105と相互作用し得る。一実施形態では、信号管理システム105の外部のコンピューティングシステム(企業ネットワーク115のコンピューティングシステムなど)は、ウェブインターフェイスサーバ130を通して、信号管理システム105によって提供される情報またはアプリケーションにアクセスし得る。一実施形態では、外部のコンピューティングシステムは、ウェブインターフェイスサーバ130に要求を送信し、ウェブインターフェイスサーバ130から応答を受信し得る。一例では、情報またはアプリケーションへのアクセスは、パーソナルコンピュータ145、リモートユーザコンピュータ155、またはモバイルデバイス160でのウェブブラウザの使用を通して実施され得る。たとえば、企業ネットワーク115のこれらのコンピューティングデバイス145、155、160は、信号管理システム105においてニューラル信号検出を使用して信号を検出するためのウェブページベースのグラフィカルユーザインターフェイス(graphical user interface:GUI)を要求して受信し得る。一例では、ウェブインターフェイスサーバ130は、パーソナルコンピュータ145、サーバ150、リモートユーザコンピュータ155、またはモバイルデバイス160にHTMLコードを提示して、これらのコンピューティングデバイスが信号管理システム105のためのGUI(ニューラル信号検出コンポーネント120の機能へのアクセスのためのGUIを含む)に描写されるようにし得る。別の例では、ウェブインターフェイスサーバ130とパーソナルコンピュータ145、サーバ150、リモートユーザコンピュータ155、またはモバイルデバイス160との間で交換される通信は、たとえばデータ交換フォーマットとしてJavaScript(登録商標)オブジェクト表記法(JavaScript object notation:JSON)を使用するリモートのレプリゼンテーショナル・ステート・トランスファー(representational state transfer:REST)要求、または、XMLサーバとの間での簡易オブジェクトアクセスプロトコル(simple object access protocol:SOAP)要求の形態を取り得る。
【0042】
一実施形態では、データストア130は、信号管理システム105において動作するアプリケーションに関連する広範囲の情報を格納してサービス提供するように構成された1つ以上のデータベースを含む。一実施形態では、データストア130は、オラクル(登録商標)データベースなどのデータベースを含む。いくつかの例示的な構成では、データストア130は、1つ以上のオラクル(登録商標)エクサデータ(Exadata)コンピュート形状、ネットワーク接続ストレージ(network-attached storage:NAS)デバイス、および/または、他の専用サーバデバイスを使用して実現され得る。
【0043】
一実施形態では、ニューラル信号検出コンポーネント120は、ニューラル信号検出ネットワーク165と、ニューラルネットワーク訓練器170と、ディープラーニングフレームワーク175と、報告データベース180と、注意メカニズム185とを含む。一実施形態では、ニューラル信号検出ネットワーク165とは、本明細書に示され記載されているように、報告における入力情報を与えられた1つ以上の有害事象の発生確率を生成するように構成され、構築され、動作されるニューラルネットワークである。一実施形態では、ニューラルネットワーク訓練器170は、たとえば本明細書に示され記載されているように確率的勾配降下法によってニューラル信号検出モデルの訓練可能パラメータを推定することによって、ニューラル信号検出ネットワーク165を訓練するように構成される。一実施形態では、ディープラーニングフレームワーク175は、本明細書に示され記載されているようにディープラーニングネットワークを訓練するためのツールおよびライブラリ(テンソルフロー(TensorFlow)およびパイトーチ(PyTorch)など)のセットを含む。報告データベース180とは、本明細書に示され記載されているように情報入力(薬剤など)と事象(有害健康事象など)との間の信号について調べられるべき報告(ある事象と当該事象を取り巻く情報とを記述するデータ構造)のリポジトリである。一実施形態では、報告データベース180は、データストア130の一部を占める。注意メカニズム185は、本明細書に示され記載されているようにニューラル信号検出ネットワーク165への情報入力にコンテキスト感知型の(context-sensitive)重みを提供するように構成される。
【0044】
信号管理システム105のコンポーネント(サブコンポーネントを含む)の各々は、コンポーネントが実行するとして記載されている機能を実行するように、ロジックによって構成される。一実施形態では、信号管理システム105のコンポーネントは各々、そのような実行のために特別に構成された1つ以上のコンピューティングデバイス(クラウドネットワークコンピューティングシステムのホストなど)によって実行される1つ以上のソフトウェアモジュールのセットとして実現され得る。一実施形態では、これらのモジュールは、本明細書に示され記載されている特徴を実現するための1つ以上のモジュールを含む。
【0045】
例示的なニューラル信号検出ネットワーク
一実施形態では、所与のターゲット有害事象について、ニューラル信号検出は、報告に含まれる情報(たとえば製品および患者情報)を、ターゲット有害事象の確率にマッピングする。これらの確率は次に、ターゲットとされた事象と特定のターゲット製品との関連性についての統計的信号スコア(不均衡比率)を生成するために集約される。
【0046】
これらの確率は、モデルをデータに適合させること(データに合うようモデルを訓練すること)によって計算される。モデルは、報告における情報(たとえば、報告で述べられた薬剤)と、ターゲットとされた有害事象の発生確率との関係をとらえることを目標とする。ニューラル信号検出は、モデルを適合させるために、たとえばロジスティック回帰の代わりにディープニューラルネットワークを使用する。
【0047】
多くのディープラーニングアプリケーションでは、自然言語処理における単語および文、ならびに、コンピュータビジョンにおける画像などのモデル化オブジェクトは、回帰で使用されるようなスカラ指標変数、カテゴリ変数、順序変数、または連続変数としてではなく、実数の密ベクトルとして表わされる。信号検出では、モデル化されているオブジェクトは、報告に含まれる製品、有害事象、および別の情報(患者の人口統計または他の患者情報など)である。一実施形態では、本明細書に記載されているニューラル信号検出システムおよび方法は、これらのオブジェクトを同様に密ベクトルとして表わす。これらの密ベクトルは、訓練/モデル適合プロセスの一環として学習される。
【0048】
ディープラーニングは、特定のタスクを達成するかまたは特定の関係をモデル化するように特定のニューラルネットワークトポロジを設計または調整し得る際に用いられる一般的なフレームワークである。この理由により、ディープラーニングアプリケーションは典型的には、モデルを表わすために使用されるニューラルネットワークトポロジまたは層によって記述される。
【0049】
図2は、ニューラル信号検出に関連付けられたニューラルネットワーク200のトポロジの一実施形態を示す。一実施形態では、ニューラル信号検出のためのニューラルネットワーク200は、オブジェクト埋め込み(またはオブジェクト表現)層205、報告表現層210、およびロジット層215という3つの主要層を含む。オブジェクト埋め込み層205は、製品および他の情報といった、報告におけるオブジェクトのベクトル表現を学習するために使用される。報告表現層210は、報告を構成するオブジェクト間の依存性を勘案して、報告全体のベクトル表現、すなわち、報告に含まれるすべての情報を要約するベクトル表現を学習する。ロジット層215は、報告のベクトル表現を、モデル化された有害事象の発生確率に変換する。一実施形態では、これらの層205、210、215のうちの1つ以上は、主要層205、210、215について記載される結果を生成するために使用されるディープラーニングプリミティブ、変換層、または、他の層といった、より小さいサブ層をさらに含み得る。一実施形態では、これらの層205、210、215のうちの1つ以上は、必要に応じてモデル複雑性を増加させるために複製され得る。一実施形態では、各層205、210、215は、異なる次元性のベクトルを使用することができる。
【0050】
一実施形態では、ニューラルネットワーク200は、報告ベクトル表現225などの報告のベクトル表現を与えられた有害事象1の発生確率220で示されるように、1つのターゲット有害事象を他から独立してモデル化するために使用され得る。一実施形態では、ニューラルネットワーク200は、報告のベクトル表現225を与えられた有害事象2の発生確率230および有害事象3の発生確率235で示されるように、複数のターゲット有害事象を同時にモデル化するために容易に拡張され得る。ターゲット事象は1つ以上(最大Q個)あり得る。これらQ個のターゲット事象の各々の発生確率は、p(x)として与えられ得る。
【0051】
【数1】
【0052】
一実施形態では、ロジット層215において、個々のロジット層(ロジット1 261、ロジット2 262、ロジットQ 263など)が、Q個のターゲット事象の各々のために実現される。各ターゲット事象の個々のロジット層は、ネットワークの下位レベルで生成された学習を共有する。ロジット関数、すなわち対数オッズ関数とは、(0以上1以下の範囲にある)確率値を(―∞~+∞の範囲にある)実数値に変換するよう機能するいくつかの関数のうちの1つである。逆ロジット関数、すなわちロジスティック関数とは、―∞~+∞の範囲にある実数値を0以上1以下の範囲にある確率値に変換するよう機能するいくつかのシグモイド関数のうちの1つである。一実施形態では、ロジット層は、逆ロジット関数または他のシグモイド関数を実行し、215は、報告ベクトル表現225の実数値のベクトルを発生確率値(発生確率p(x)220、p(x)230、およびp(x)235など)に変換する。
【0053】
ニューラル信号検出モデル
ベースラインニューラル信号検出モデルの一実施形態について、この節で説明する。ベースラインモデルを超える拡張は、たとえば、(i)注意メカニズムの異なるバージョンを使用すること、(ii)層を複製すること(計算)、(iii)さらに別の中間層を追加すること(たとえば変換、正規化、正則化)、および(iv)複数の有害事象を(図示されたように独立してではなく)同時にモデル化することによって、いくつかのやり方で構築され得る。なお、本明細書に記載されているベースラインニューラル信号検出モデルは、ニューラル信号検出の単なる1つの単純な実施形態であり、特に、拡張可能な基本構造である。ニューラル信号検出を適用する個々の実施形態は複雑性が異なるかもしれず、このベースラインニューラル信号検出モデルに基づいている。
【0054】
【数2】
【0055】
【数3】
【0056】
ニューラル信号検出モデルの訓練
一実施形態では、ニューラルネットワーク訓練器(信号管理システム105のニューラルネットワーク訓練器170など)は、ニューラル信号検出モデル(上述されたベースラインニューラル信号検出モデルなど)を訓練する。一実施形態では、ニューラルネットワーク訓練器170は、本明細書に記載されている訓練機能を行なうための1つ以上のモジュールを含む。ニューラルネットワーク訓練器170は、訓練に続いてニューラル信号検出モデルによってターゲット情報(薬剤または他の医療製品など)とターゲット事象(有害健康事象など)との信号関係を検出するために調べられるべき報告のセット(報告データベース280など)を使用して、ニューラル信号検出モデルを訓練する。
【0057】
一実施形態では、訓練プロセスは、複数の報告のバッチで行なわれる。バッチサイズは、プロセッサ(CPUまたはGPU)が利用可能なメモリによって取り扱い可能な最大値に設定されるハイパーパラメータであり得る。
【0058】
パラメータ推定‐一実施形態では、ニューラル信号検出モデルのパラメータは、最小化されるべき損失関数としてデータ対数尤度を使用して、確率的勾配降下法によって推定される。データ対数尤度関数は、以下の式によって与えられる。
【0059】
【数4】
【0060】
【数5】
【0061】
【数6】
【0062】
【数7】
【0063】
例示的な方法
一実施形態では、本明細書に記載されているコンピュータが実現する方法の各ステップは、1つ以上のコンピューティングデバイスのプロセッサ(図4を参照して示され記載されているようなプロセッサ410など)が、(i)メモリ(図4を参照して示され記載されているメモリ415および/または他のコンピューティングデバイスコンポーネントなど)にアクセスすること、および(ii)システムに方法のステップを実行させるためのロジック(図4を参照して示され記載されているニューラル信号検出ロジック430など)を用いて構成されることによって行なわれ得る。たとえば、プロセッサは、本明細書に記載されているコンピュータが実現する方法のステップを行なうために、メモリにアクセスしてメモリから読み出すかまたはメモリに書き込む。これらのステップは、(i)任意の必要な情報を検索すること、(ii)任意のデータを計算し、決定し、生成し、分類し、または他の態様で作成すること、および(iii)計算され、決定され、生成され、分類され、または他の態様で作成された任意のデータをその後の使用のために格納することを含み得る。ストレージまたは格納への言及は、コンピューティングデバイスのメモリまたはストレージ/ディスク(図4を参照して示され記載されているコンピューティングデバイス405またはリモートコンピュータ465のメモリ415またはストレージ/ディスク435、もしくは、図1を参照して示され記載されているデータストア130など)におけるデータ構造としてのストレージを示す。
【0064】
一実施形態では、方法の次のステップの各々は、少なくとも次のステップが始まるのに必要な程度まで前のステップが行なわれたことを示す受信された信号または検索された格納済データの解析に応答して、自動的に始まる。一般に、受信された信号または検索された格納済データは、前のステップの完了を示す。
【0065】
図3は、ニューラル信号検出に関連付けられた方法300の一実施形態を示す。一実施形態では、方法300のステップは、(図1を参照して示され記載されているような)信号管理システム105のニューラル信号検出コンポーネント120によって行なわれる。一実施形態では、ニューラル信号検出コンポーネント120は、ニューラル信号検出ロジック430を用いて構成された特殊用途コンピューティングデバイス(コンピューティングデバイス405など)である。一実施形態では、ニューラル信号検出コンポーネント120は、ロジック430を用いて構成された特殊用途コンピューティングデバイスのモジュールである。一実施形態では、データにおける迅速なまたは早期の信号検出が、方法300のステップによって可能にされる。そのような早期の信号検出は以前には、コンピューティングデバイスによって行なうことができなかった。
【0066】
方法300は、(i)信号管理システム105のユーザ(または管理者)が方法300を開始したこと、(ii)その方法300が、規定された時間または時間間隔で開始されるよう予定されていること、(iii)信号管理システム105が1つ以上の報告の新しいセット(報告データベースなど)を受信したことを示す、ネットワークを通した信号の受信、または格納済データの解析などに応答して、さまざまなトリガに基づいて自動的に開始され得る。方法300は、受信された信号または検索された格納済データの解析、および、信号または格納済データが方法300は始まるべきであるということを示すとの判定に応答して、開始ブロック305で始まる。処理はプロセスブロック310へ続く。
【0067】
プロセスブロック310で、プロセッサは、ニューラル信号検出ネットワークの埋め込み層によって、報告に含まれる1つ以上の情報オブジェクトのセットの各々のためのベクトル埋め込みを作成する。1つ以上の情報オブジェクトのセットは、ターゲットオブジェクトを含む。
【0068】
一実施形態では、報告データ構造として格納された1つ以上の報告の報告データベース(報告データベース180など)が、たとえばデータストア130において維持される。たとえば、報告データ構造は、報告の表における行であり得る。一実施形態では、報告データ構造は、1つ以上の観察された事象(他の入力オブジェクトとの信号関係について調べられているターゲット事象を含む);事象の時間に患者が使用している1つ以上の薬剤、生物製剤、ワクチン、デバイス、または他の医療製品;患者の特徴を記述する限定された患者の人口統計学的情報;報告を生成するエンティティを識別する報告者情報;または、患者が食べた食べ物などの他の潜在的に関連する情報、といった入力情報オブジェクトを1つ以上含む。報告は、報告における各情報(またはデータ)オブジェクトについての1つ以上のインデックスを有する。ある事象についてのデータオブジェクトは、発生日時;医療符号化辞書(MedDRAなど)からの標準化された用語を使用して符号化された事象の記述;および、重症度判定(たとえばある事象が、死に至るかまたは生命を脅かすもの、入院患者の入院または既存の入院の延長を必要とするもの、持続的なまたは重大な障害または無能力をもたらすもの、先天性異常をもたらすもの、もしくは他の態様で医学的に重大なものとして分類される場合には、その事象は重症であると判定し、その他の場合には、その事象は重症でないと判定する)についてのインデックスを含み得る。ある薬剤についてのデータオブジェクトは、名前、化学式(報告における名前のみの提出に応答して自動的に追加され得る)、バッチ番号、および用量についてのインデックスを含み得る。患者についてのデータオブジェクトは、患者の年齢、体重、および性別についてのインデックスを含み得る。一実施形態では、ベクトル表現として埋め込まれるべき、報告に含まれるM個の情報(またはデータ)オブジェクトのセットは、報告におけるすべての情報オブジェクトである。一実施形態では、M個のオブジェクトのセットは、報告におけるすべてのオブジェクトでなくてもよく、報告におけるすべての情報オブジェクトのサブセットである。
【0069】
一実施形態では、プロセッサは、ニューラル信号検出ネットワークの埋め込み層によって、報告に含まれる1つ以上の情報オブジェクトのセットの各々のためのベクトル埋め込みを作成し、生成し、または埋め込む。ベクトル埋め込みとは、実数のベクトルへの離散カテゴリ変数のマッピングである。一実施形態では、ニューラル信号検出ネットワークにおいてそれらのオブジェクトを使用するために、オブジェクトプリミティブのベクトル埋め込みが使用され得る。一実施形態では、ニューラル信号検出ネットワーク(ニューラル信号検出ネットワーク165など)におけるオブジェクト埋め込み層(オブジェクト埋め込み層205など)が、報告におけるM個のオブジェクトからプリミティブを作成する。オブジェクト埋め込み層は、訓練段階中、報告における情報(またはデータ)オブジェクトを、当該オブジェクトを表わすベクトルに変換するように(報告データベースの報告を使用して)訓練される。一実施形態では、プロセッサは、報告データベースからある報告を検索する。この報告は、報告の初期オブジェクト表現であり、報告におけるM個のオブジェクトを記述するインデックスを含む。プロセッサは、報告におけるM個のオブジェクトの各々に順番にアクセスし、オブジェクトのインデックスを評価し、オブジェクトのベクトル埋め込み、すなわち、連続的な次元値のベクトルへのインデックスの離散値のマッピングを生成する。これらのベクトルは、d1次元を有する。オブジェクト埋め込み層は、モデル化されている別個のオブジェクトのうちの1つを各々表わすM個のベクトルを含む。これらM個のベクトルは、報告データベースにおける情報オブジェクトのためのベクトル表現(オブジェクトベクトル表現250など)である。
【0070】
プロセッサがこのように、ニューラル信号検出ネットワークの埋め込み層によって、報告に含まれる1つ以上の情報オブジェクトのセットの各々のためのベクトル埋め込みを作成することをいったん完了すると、プロセスブロック310での処理は完了し、処理はプロセスブロック315へ続く。
【0071】
プロセスブロック315で、プロセッサは、ニューラル信号検出ネットワークの表現層によって、(i)ターゲット事象の発生と情報オブジェクトとの相関を記述し、かつ、(ii)報告を構成する情報オブジェクト間の依存性を勘案する態様で、報告を表現する。
【0072】
一実施形態では、プロセッサは、たとえば本明細書の式4に関して示され記載されているような注意重みを、埋め込み層における情報オブジェクトのn個のベクトル表現の各々について1つ有する、n個の注意重みのセットを計算する。プロセッサは次に、たとえば本明細書の式3に関して示され記載されているような報告のベクトル表現を計算する。
【0073】
【数8】
【0074】
【数9】
【0075】
プロセッサがこのように、ニューラル信号検出ネットワークの表現層によって、ターゲット事象の発生と情報オブジェクトとの相関を記述し、かつ、報告を構成する情報オブジェクト間の依存性を勘案する態様で、報告を表現することをいったん完了すると、プロセスブロック315での処理は完了し、処理はプロセスブロック320へ続く。
【0076】
プロセスブロック320で、プロセッサは、ニューラル信号検出ネットワークのロジット層によって、報告の表現に基づいて、ターゲット事象を含む事象のセットをモデル化する。
【0077】
一実施形態では、プロセッサは、たとえば本明細書の式2を参照して示され記載されているような、ロジット層(ロジット層215など)によって行なわれる中間線形計算の出力値(中間線形計算zの値など)を計算する。
【0078】
【数10】
【0079】
プロセッサがこのように、ニューラル信号検出ネットワークのロジット層によって、報告の表現に基づいて、ターゲット事象を含む事象のセットをモデル化することをいったん完了すると、プロセスブロック320での処理は完了し、処理はプロセスブロック325へ続く。
【0080】
プロセスブロック325で、プロセッサは、モデル化された事象のセットを与えられたターゲット事象についての発生確率を求める。
【0081】
一実施形態では、プロセッサは、たとえばロジット層215において事象のモデルを与えられた事象の発生を表わす逆ロジット(またはロジスティック)関数などのシグモイド関数を計算することによって、(事象のモデルにおける)モデル化された事象を表わす実数値を、事象についての発生確率に変換する。一実施形態では、逆ロジット(またはロジスティック)関数、双曲正接関数、逆正接関数、誤り関数、または他の関数などのシグモイド関数は、シグモイド関数のS字形の曲線特性を実証する。プロセッサは、中間線形計算の出力値、すなわち、報告全体のベクトル表現から生成された事象のモデルを検索する。ロジット層において、プロセッサは、中間線形計算の出力値のためのシグモイド関数を計算する。シグモイド関数の計算から生じる値は、報告の初期オブジェクト表現を与えられた、事象についての発生確率である。
【0082】
一実施形態では、プロセッサは、たとえば参照符号220で示されるような、事象のセットに属する単一のターゲット事象についての発生確率を求める。一実施形態では、プロセッサは、たとえば参照符号230および235で示されるような、事象のセットに属する複数の異なるターゲット事象についての発生確率を求める。
【0083】
プロセッサは、ターゲット事象の発生確率を、報告データベースに含まれるすべての報告についての発生確率のセット(または、報告の他のセット)に格納する。たとえば、プロセッサは、発生確率データ構造の、特定の報告のために指定された位置(および、複数のターゲット事象が発生し得る場合には、特定のターゲット事象のためにさらに指定された位置)に、ターゲット事象の発生確率を格納し得る。
【0084】
プロセッサがこのように、モデル化された事象のセットを与えられたターゲット事象についての発生確率を求めることをいったん完了すると、プロセスブロック325での処理は完了し、処理はプロセスブロック330へ続く。
【0085】
一実施形態では、プロセスブロック310~330で説明された、報告の事象を与えられたターゲット事象についての発生確率を求めるためのプロセスは、報告データベースにおけるすべての報告、または、報告データベースにおける報告のサブセットといった、報告のセットにおける複数の報告のために繰り返される。一実施形態では、報告の任意のセットが選択されてもよく、利用可能な報告のうちのすべて、いくつか、または1つのみを含んでいてもよい。決定ブロック330で、プロセッサは、報告のセットに報告が残っているかどうかを判定する。報告のセットに報告が残っている場合(決定ブロック330:はい)、決定ブロック330での処理は完了し、処理はプロセスブロック310へ続き、そこで、報告のセットにおける次の報告のために処理が繰り返される。一実施形態では、プロセッサは、報告インデックス(たとえば報告インデックスi)をインクリメントして、プロセスブロック310へ戻り、報告インデックスによって示された報告のためにブロック310~325を繰り返してもよい。報告のセットに報告が残っていない場合(決定ブロック330:いいえ)、決定ブロック330での処理は完了し、処理はプロセスブロック335へ続く。
【0086】
プロセスブロック335で、プロセッサは、報告データベースにおけるすべての報告にわたるターゲット事象についての要約発生確率を比較基準確率と比較することによって、信号の存在を識別する。
【0087】
一実施形態では、プロセッサは、たとえば以下の式12~14に関して示され記載されているように、信号スコアを決定する。プロセッサは、ターゲット事象のためのすべての報告についての発生確率のセットを、たとえば発生確率データ構造からそれらを検索することによって検索する。プロセッサは次に、ターゲット事象についてのすべての検索された発生確率の合計を計算して、報告データベースにおけるすべての報告にわたるターゲット事象についての要約発生確率を生成する。プロセッサは次に、要約発生確率を比較基準確率で除算して、信号スコアを生成する。比較基準確率は、ターゲット事象との関係について調べられているターゲット情報(薬剤または他の医療製品など)を報告が含まない場合のターゲット事象の確率を表わす。プロセッサは次に、信号スコアを、信号が存在することを示すしきい値と比較する。一実施形態では、プロセッサは、信号スコアがしきい値を満たすかそれを上回る場合には信号の存在を識別し、信号スコアがしきい値に満たない場合には信号の不在を識別する。プロセッサは、この信号の検出された存在または不在の表示を、その後の使用のために出力データ構造に書き込む。
【0088】
しきい値の値は、たとえば、信号とノイズとの間の妥当な差別化要因であることが知られているしきい値を選択することによって、予め定められ得る。たとえば、報告がターゲット情報(薬剤など)を含む場合には、報告がターゲット情報を含まない場合よりもターゲット事象が2倍起こりやすい、およそ2という信号スコアしきい値は、明確な信号関係を示すのに十分である。1~2の信号スコアしきい値はまた、感度を増加させるために使用され得る。信号検出では、感度の増加は、厄介な偽陽性信号検出を生み出すリスクを伴う。本明細書に記載されているニューラル信号検出のためのシステムおよび方法は、他の信号検出アルゴリズムを使用した場合に存在するものよりも、偽陽性信号検出のリスクがより低い状態で、より高い感度を提供する。したがって、本明細書に記載されているニューラル信号検出のためのシステムおよび方法は、ニューラル信号検出によって提供されるより精細な相関モデル化および依存性モデル化に起因して、1~2のより低い信号スコアしきい値を使用して信号を検出することができる。2を超える信号スコアはまた、実際の信号検出の欠落を犠牲にして感度を減少させるために使用され得る。
【0089】
加えて、1、特に0.5を下回る信号スコアは、ターゲット情報とターゲット事象との逆信号関係を示し得る。たとえば、ターゲット薬剤およびターゲット有害事象についての、1を下回る信号スコアは、ターゲット有害事象に対する薬剤の予防効果を示し得る。たとえば、ターゲット情報(薬剤)がある場合には、ターゲット情報がない場合に比べてターゲット事象の起こりやすさが半分であることを示す、0.5という追加の逆信号しきい値はしたがって、設定されて信号スコアと比較され得る。
【0090】
一実施形態では、信号管理システム105は、信号の存在の表示が、信号管理システム105のグラフィカルユーザインターフェイスに警告として表示されるようにし得る。一実施形態では、信号の存在の表示はまた、警告メッセージを送信すること、または表示用の信号データを示すグラフを生成して提示することを含む他のプロセスを信号管理システム105に開始させるトリガであり得る。これは、反応速度が命を救い得る、薬剤または他の医療製品の有害効果の検出に関する早期警告にとって、特に有用である。このため、ターゲットオブジェクトがターゲット薬剤であり、ターゲット事象のセットが有害健康事象を含む一実施形態では、システムは、事象確率と比較基準確率とから信号スコアを計算すること、信号の存在を示すしきい値を信号スコアが上回ることに応答して信号の存在を判定すること、および、信号が検出されたことを示す、リモートシステムによる表示用の警告を直ちに提示することへ進むことができる。
【0091】
プロセッサがこのように、報告データベースにおけるすべての報告にわたるターゲット事象についての要約発生確率を比較基準確率と比較することによって、信号の存在を識別することをいったん完了すると、プロセスブロック335での処理は完了し、処理は終了ブロック340へ続き、そこで処理300は終了する。
【0092】
推論および信号スコア計算
一実施形態では、ニューラル信号検出の信号スコアは、プロセスブロック335を参照して上述されたように、ターゲット薬剤についての事象確率(またはカウント)と比較基準との比率として計算される。これは、医薬品安全性監視空間において使用される他の信号検出方法論と整合している。たとえば、ターゲット薬剤およびターゲット有害事象について、ニューラル信号検出比率は、ターゲット薬剤を含む報告に含まれる情報を与えられたターゲット事象の平均確率を、比較基準を作成するために操作された同じ報告のセットについての事象の平均確率で除算したものとして定義される。このように、各報告は、それ自体の制御として機能してもよく、それは、他の信号検出システムおよび方法では広く利用可能ではない、本明細書に記載されているニューラル信号検出のためのシステムおよび方法によって提供される別の利点である。モデルがデータに適合され、モデルパラメータが推定された後で、比率(信号スコア)は計算される。モデルは、比較基準確率(比率分母)を計算するためにデータに再適合されない。代わりに、報告またはモデルパラメータは、比較基準確率に達するために、異なるように使用される。このため、一実施形態では、信号管理システム105は、要約発生確率と、要約発生確率を作成するために使用された同じ報告のセットから導き出された比較基準確率とから、信号スコアを計算し得る。
【0093】
【数11】
【0094】
注意メカニズム
一実施形態では、報告表現層210は、報告全体のベクトル表現255を学習する際に報告を構成するオブジェクト間の依存性を勘案する依存性モデル化機能を含む。たとえば、ターゲット薬剤とターゲット有害事象との関係が第2の薬剤の存在によって交絡されると仮定すると、報告表現層210はこの依存性を学習して、ターゲット薬剤と交絡させる薬剤とを含む報告を、ターゲット薬剤と異なる薬剤とを含む報告とは異なるように、また、この交絡を反映する態様で表現する。または、同様の例では、第2の薬剤が、ターゲット薬剤を交絡させるのではなく、ターゲット薬剤と相互作用する場合、報告表現層210はこの依存性を学習して、ターゲット薬剤と相互作用する薬剤とを含む報告を、ターゲット薬剤と異なる薬剤とを含む報告とは異なるように、また、この相互作用を反映する態様で表現する。
【0095】
一実施形態では、本明細書に記載されているニューラル信号検出システムおよび方法は、報告表現層210を実現し、報告全体のベクトル表現を学習するために、ディープラーニング注意メカニズムを使用する。注意メカニズムは、自然言語処理アプリケーションにおいて広く使用されており、認知注意を模倣するために考案されたものである。注意メカニズムは、入力データの重要な部分により多くの計算能力を識別し、増強し、費やす一方で、残りを弱め、減衰し、または無視するように設計されている。データのどの部分が他の部分よりも重要であるかを決定することは、コンテキスト、すなわち、入力データの他の部分(たとえば、報告におけるオブジェクト)に依存する。データのさまざまな部分の相対的重要性を決定することは、ディープラーニング訓練プロセスを通して学習される。注意メカニズムは、他の部分に関連する、ひいては、全体に関連する各部分の相対的重要性を反映するコンテキスト感知型の重みを、入力の各部分に付ける。これらの重みはコンテキスト感知型であるため、同じオブジェクトが、それとともに現われる他のオブジェクトに依存して、異なる重みを受ける場合がある。これらの重みを与えられて、注意メカニズムは、これらの部分の加重平均を計算することによって全体のコンテキスト感知型の要約を計算するために使用され得る。
【0096】
一実施形態では、入力は、報告で述べられた薬剤などのオブジェクトのセットによって表現される報告に対応する。たとえば、報告は、薬剤についての、および患者の人口統計学的情報についての他のデータ構造またはオブジェクトを含む行オブジェクトなどのデータ構造である。この報告行オブジェクトは、リレーショナルデータベースにおけるそのような報告オブジェクトの表の行であり得る。
【0097】
一実施形態では、注意メカニズムは、報告における各オブジェクト(薬剤、患者の人口統計、患者の体調)が、報告における他のオブジェクトと比べて、有害事象の尤度について有する予測力を決定する。たとえば、注意メカニズムは、ターゲット有害事象を引き起こすことが知られている薬剤と有害事象を引き起こさない別の薬剤とが双方とも同じ報告で述べられている場合に、ターゲット有害事象を引き起こすことが知られている薬剤に、有害事象を引き起こさない別の薬剤に比べてより多くの重みを割り当てるよう学習する。このように、ニューラル信号検出のためのニューラルネットワークは、有害事象を引き起こすことが知られている薬剤により多くの「注意」を払うであろう。注意メカニズムはまた、ターゲット薬剤が、有害事象とのその関係を交絡させる別の薬剤とともに報告される場合、または、ターゲット薬剤が、有害事象の尤度を修正するためにそれと相互作用する薬剤とともに報告される場合に、ターゲット薬剤の重みを修正するよう学習する。このように、ニューラル信号検出のためのニューラルネットワークは、報告における他のオブジェクトがターゲット事象の尤度を減少させることが知られていることが知られている場合、ターゲット薬剤により多くの「注意」を払うであろう。
【0098】
一実施形態では、報告におけるすべてのオブジェクトを与えられた有害事象の全体的尤度は、一実施形態ではロジット層によって行なわれる、これらのオブジェクトの注意加重平均の関数である。したがって、報告全体のベクトル表現は、注意メカニズムによって決定された重みを用いる、報告オブジェクトのベクトル表現の加重平均である。報告全体のベクトル表現は、より形式的に上述されている。
【0099】
このため、一実施形態では、ニューラル信号検出コンポーネント120は注意メカニズム180を含む。一実施形態では、注意メカニズム180のパラメータは、ニューラルネットワーク訓練器170によって学習され、それは、訓練段階中にニューラル信号検出ネットワークにおいて重みを割り当てることを担当する。訓練中、入力と事象との関係の強さおよびタイプ(プラスまたはマイナス)がデータから学習される。注意メカニズムはこのため、選ばれたターゲット効果または他の入力情報とのその関係の強さに基づいて、入力情報に適用される重みを調節し得る。たとえば、情報と効果との関係の強さが増加するにつれて、重みが増加され得る。
【0100】
一実施形態では、注意重みはコンテキスト的であり、ターゲットオブジェクト以外の入力情報に依存する。このため、注意メカニズム180は情報オブジェクトの各々に注意重みを付け、各情報オブジェクトに付けられた注意重みは、情報オブジェクトのうちの少なくとも1つの他の情報オブジェクトに基づいている。たとえば、ターゲットオブジェクトがターゲット薬剤である場合、関係データベースは、報告に含まれる1つ以上の情報オブジェクトのセットが、ターゲット薬剤に関して交絡効果またはマスキング効果を有する第2の薬剤をさらに含むということを示し得る。一実施形態では、関係データベースは、第1の情報オブジェクトがターゲット事象を引き起こすことが知られているということを示し得る。この場合、注意メカニズム180は、ターゲット事象を引き起こすことが知られている第1の情報オブジェクトに付けられた第1の注意重みが、ターゲット事象を引き起こすことが知られていない他の情報オブジェクトに割り当てられた他の注意重みよりも大きい状態で、情報オブジェクトの各々に注意重みを付けるであろう。一実施形態では、関係データベースは、第1の情報オブジェクトがターゲット事象の尤度を減少させることが知られているということを示し得る。この場合、注意メカニズム180は、ターゲット事象の尤度を減少させることが知られている第1の情報オブジェクトに付けられた第1の注意重みが、ターゲット事象の尤度を減少させることが知られていない他の情報オブジェクトに割り当てられた他の注意重みよりも大きい状態で、情報オブジェクトの各々に注意重みを付けるであろう。
【0101】
ソフトウェアモジュール実施形態
一般に、ソフトウェア命令は、好適にプログラムされた1つ以上のプロセッサが、たとえばCPUまたはGPUリソースにアクセスすることによってメモリにアクセスすることによって、実行されるように設計されている。これらのソフトウェア命令は、たとえば、コンピュータ実行可能コードと、コンピュータ実行可能コードにコンパイルされ得るソースコードとを含み得る。これらのソフトウェア命令はまた、スクリプト言語などの解釈されたプログラミング言語で書かれた命令を含み得る。
【0102】
複雑なシステムでは、そのような命令はプログラムモジュールに配置されてもよく、そのような各モジュールは特定のタスク、プロセス、機能、または動作を行なう。モジュールのセット全体は、それらの動作が、システムのためのメインプログラム、オペレーティングシステム(operating system:OS)、または他の形態の組織的プラットフォームによって制御または連係され得る。
【0103】
一実施形態では、本明細書に記載されているコンポーネントのうちの1つ以上は、非一時的コンピュータ読取可能媒体に格納されたモジュールとして構成される。モジュールは、少なくともプロセッサがメモリまたはストレージにアクセスすることによって実行されると本明細書に記載されているような対応する機能をコンピューティングデバイスに実行させる、格納されたソフトウェア命令を用いて構成される。
【0104】
クラウドまたは企業実施形態
一実施形態では、本システム(信号管理システム105など)は、ネットワーク(ネットワーク110など)を通して本システムと通信する、企業に関連付けられた他のクライアントコンピューティングデバイス(企業ネットワーク115のクライアントコンピュータ144、150、155、および160など)によるアクセスおよび使用のためのコンピューティングアプリケーションまたは分散コンピューティングアプリケーションの集合を含むコンピューティング/データ処理システムである。アプリケーションおよびコンピューティングシステムは、クラウドベースのネットワークコンピューティングシステム、インフラストラクチャ・アズ・ア・サービス(IAAS)、プラットフォーム・アズ・ア・サービス(PAAS)、またはソフトウェア・アズ・ア・サービス(SAAS)アーキテクチャ、または他のタイプのネットワーク化されたコンピューティングソリューションを用いて動作するかまたはそういうものとして実現されるように構成され得る。一実施形態では、本システムは、本明細書に開示された機能のうちの少なくとも1つ以上と、当該機能にアクセスして動作させるためのグラフィカルユーザインターフェイスとを提供する。
【0105】
コンピューティングデバイス実施形態
図4は、本明細書に記載されている例示的なシステムおよび/または方法、ならびに/もしくは同等物のうちの1つ以上を用いて専用コンピューティングデバイスとして構成および/またはプログラムされた例示的なコンピューティングシステム400を示す。例示的なコンピューティングデバイスは、バス425によって動作可能に接続されたプロセッサ410とメモリ415と入力/出力ポート420とを含むコンピュータ405であり得る。一例では、コンピュータ405は、図1~3を参照して示され記載されているロジック、システム、および方法と同様の、ニューラル信号検出を容易にするように構成されたニューラル信号検出ロジック430を含み得る。異なる例では、ニューラル信号検出ロジック430は、ハードウェア、格納された命令を有する非一時コンピュータ読取可能媒体、ファームウェア、および/またはそれらの組合せで実現され得る。ニューラル信号検出ロジック430はバス425に取り付けられたハードウェアコンポーネントとして示されているが、他の実施形態では、ニューラル信号検出ロジック430は、プロセッサ410で実現されてもよく、メモリ415に格納されてもよく、または、ディスク435のコンピュータ読取可能媒体437上に格納されてもよい。
【0106】
一実施形態では、ニューラル信号検出ロジック430またはコンピューティングシステム400は、記載されているアクションを行なうための手段(構造:ハードウェア、非一時的コンピュータ読取可能媒体、ファームウェアなど)である。いくつかの実施形態では、コンピューティングデバイスは、クラウドコンピューティングシステムで動作するサーバ、ソフトウェア・アズ・ア・サービス(SaaS)アーキテクチャで構成されたサーバ、スマートフォン、ラップトップ、タブレットコンピューティングデバイスなどであり得る。
【0107】
手段はたとえば、ニューラル信号検出を行なうようにプログラムされたASICとして実現され得る。手段はまた、メモリ415に一時的に格納され、その後プロセッサ410によって実行されるデータ440としてコンピュータ405に提示される、格納されたコンピュータ実行可能命令として実現され得る。
【0108】
ニューラル信号検出ロジック430はまた、ニューラル信号検出を行なうための手段(たとえば、ハードウェア、実行可能命令を格納する非一時的コンピュータ読取可能媒体、ファームウェア)を提供し得る。
【0109】
コンピュータ405の例示的な構成を概して説明すると、プロセッサ410は、デュアルマイクロプロセッサおよび他のマルチプロセッサアーキテクチャを含む種々様々なプロセッサであり得る。メモリ415は、揮発性メモリおよび/または不揮発性メモリを含み得る。不揮発性メモリは、たとえばROM、PROM、EPROM、EEPROMなどを含み得る。揮発性メモリは、たとえばRAM、SRAM、DRAMなどを含み得る。
【0110】
ストレージディスク435は、たとえば、少なくとも入力/出力(I/O)コントローラ447によって制御される入力/出力(I/O)インターフェイス(たとえばカードまたはデバイス)445および入力/出力ポート420を通して、コンピュータ405に動作可能に接続され得る。ディスク435は、たとえば磁気ディスクドライブ、ソリッドステートディスクドライブ、フロッピー(登録商標)ディスクドライブ、テープドライブ、ジップドライブ、フラッシュメモリカード、メモリスティックなどであり得る。さらに、ディスク435は、CD-ROMドライブ、CD-Rドライブ、CD-RWドライブ、DVD ROMなどであり得る。メモリ415は、たとえば、1つ以上のデータ構造としてフォーマットされたプロセス450および/またはデータ440を格納することができる。ディスク435および/またはメモリ415は、コンピュータ405のリソースを制御して割り当てるオペレーティングシステムを格納することができる。
【0111】
コンピュータ405は、入力/出力(I/O)コントローラ447、I/Oインターフェイス445、および入力/出力ポート420を介して、入力/出力(I/O)デバイスと相互作用し、入力/出力デバイスを制御し、および/または、入力/出力デバイスによって制御され得る。入力/出力デバイスは、1つ以上のディスプレイ470、プリンタ472(インクジェット、レーザーまたは3Dプリンタなど)、および音声出力デバイス474(スピーカまたはヘッドホンなど)、テキスト入力デバイス480(キーボードなど)、ポインティングおよび選択デバイス482(マウス、トラックボール、タッチパッド、タッチスクリーン、ジョイスティック、ポインティングスティック、スタイラスマウスなど)、音声入力デバイス484(マイクロホンなど)、ビデオ入力デバイス486(ビデオカメラおよびスチルカメラなど)、ビデオカード(図示せず)、ディスク435、ネットワークデバイス455などを含む。入力/出力ポート420は、たとえばシリアルポート、パラレルポート、およびUSBポートを含み得る。
【0112】
コンピュータ405はネットワーク環境で動作可能であり、このため、I/Oインターフェイス445および/またはI/Oポート420を介してネットワークデバイス455に接続され得る。ネットワークデバイス455を通して、コンピュータ405はネットワーク460と相互作用し得る。ネットワーク460を通して、コンピュータ405はリモートコンピュータ465に論理的に接続され得る。一実施形態では、コンピュータ405および他のコンピュータ465は協力して、他のクライアントコンピュータにコンピューティングサービスを提供するクラウドネットワークとして機能するように構成され得る。コンピュータ405が相互作用し得るネットワークは、LAN、WAN、クラウド、および他のネットワークを含むものの、それらに限定されない。
【0113】
定義および他の実施形態
別の実施形態では、記載されている方法および/またはそれらの同等物は、コンピュータ実行可能命令を用いて実現され得る。このため、一実施形態では、マシンによって実行されると当該マシン(および/または関連コンポーネント)に方法を行なわせるアルゴリズム/実行可能アプリケーションのコンピュータ実行可能命令が格納された、非一時的コンピュータ読取可能/記憶媒体が構成される。例示的なマシンは、プロセッサ、コンピュータ、クラウドコンピューティングシステムで動作するサーバ、ソフトウェア・アズ・ア・サービス(SaaS)アーキテクチャで構成されたサーバ、スマートフォンなどを含むものの、それら限定されない。一実施形態では、コンピューティングデバイスは、開示された方法のうちのいずれかを行なうように構成された1つ以上の実行可能アルゴリズムを用いて実現される。
【0114】
1つ以上の実施形態では、開示された方法またはそれらの同等物は、方法を行なうように構成されたコンピュータハードウェアか、または、非一時的コンピュータ読取可能媒体に格納されたモジュールで具現化されたコンピュータ命令のいずれかによって行なわれ、命令は、コンピューティングデバイスの少なくともプロセッサによって実行されると方法を行なうように構成された実行可能アルゴリズムとして構成される。
【0115】
説明を簡潔にするために、図面の図示された方法論はアルゴリズムの一連のブロックとして示され記載されているが、これらの方法論はブロックの順序によって限定されないということが理解されるべきである。ブロックの一部は、示され記載されたものとは異なる順序で、および/または、他のブロックと同時に起こる場合がある。また、例示的な方法論を実現するために、図示されたブロックがすべて使用されなくてもよい。ブロックは組合されてもよく、または、複数のアクション/コンポーネントに分離されてもよい。さらに、追加のおよび/または代替的な方法論が、ブロックに図示されていない追加のアクションを採用してもよい。
【0116】
下記は、本明細書で採用された、選択された用語の定義を含む。これらの定義は、用語の範囲に該当し、実現のために使用され得る、構成要素のさまざまな例および/または形態を含む。これらの例は、限定的であるよう意図されてはいない。用語の単数形および複数形は双方とも、これらの定義の範囲内にあり得る。
【0117】
「一実施形態」、「実施形態」、「一例」、「例」などへの言及は、そのように記載された実施形態または例が特定の機能、構造、特徴、特性、要素、または制限を含み得るものの、すべての実施形態または例が必ずしもその特定の機能、構造、特徴、特性、要素、または制限を含むとは限らないということを示す。さらに、「一実施形態では」という句の反復使用は、必ずしも同じ実施形態を指すとは限らないものの、同じ実施形態を指す場合もある。
【0118】
AI:人工知能。
API(application programming interface):アプリケーションプログラミングインターフェイス。
【0119】
ASIC(application specific integrated circuit):特定用途向け集積回路。
BLR:2値ロジスティック回帰。
【0120】
CD(compact disk):コンパクトディスク。
CD-R(CD recordable):記録可能CD。
【0121】
CD-RW(CD rewriteable):書換可能CD。
CPU(central processing unit):中央処理装置。
【0122】
DNN:ディープニューラルネットワーク。
DVD:デジタルバーサタイルディスク(digital versatile disk)および/またはデジタルビデオティスク(digital video disk)。
【0123】
ELR:拡張ロジスティック回帰。
GPU:グラフィックス処理装置。
【0124】
GUI:グラフィカルユーザインターフェイス。
HPC:高性能コンピューティング。
【0125】
HTTP(hypertext transfer protocol):ハイパーテキスト転送プロトコル。
IAAS:インフラストラクチャ・アズ・ア・サービス。
【0126】
IC:情報コンポーネント。
I/O:入力/出力。
【0127】
JSON:JavaScriptオブジェクト表記法。
LAN(local area network):ローカルエリアネットワーク。
【0128】
MGPS:マルチ項目ガンマポアソン収縮器。
ML:機械学習。
【0129】
NAS:ネットワーク接続ストレージ。
NLG:自然言語生成。
【0130】
NLP:自然言語処理。
PAAS:プラットフォーム・アズ・ア・サービス。
【0131】
PCI(peripheral component interconnect):ペリフェラル・コンポーネント・インターコネクト。
【0132】
PRR:比例報告比。
RAM(random access memory):ランダムアクセスメモリ。
【0133】
DRAM(dynamic RAM):ダイナミックRAM。
SRAM(synchronous RAM):同期RAM。
【0134】
ReLU(rectified linear unit):整流線形ユニット。
REST:レプリゼンテーショナル・ステート・トランスファー。
【0135】
RGPS:回帰調整ガンマポアソン収縮器。
ROM(read only memory):読出専用メモリ。
【0136】
PROM(programmable ROM):プログラマブルROM。
EPROM(erasable PROM):消去可能PROM。
【0137】
EEPROM(electrically erasable PROM):電気的消去可能PROM。
SaaS:ソフトウェア・アズ・ア・サービス。
【0138】
SOAP:簡易オブジェクトアクセスプロトコル。
SQL(structured query language):構造化クエリ言語。
【0139】
TCP/IP:伝送制御プロトコル/インターネットプロトコル。
USB(universal serial bus):ユニバーサルシリアルバス。
【0140】
XML(extensible markup language):拡張マークアップ言語。
WAN(wide area network):ワイドエリアネットワーク。
【0141】
本明細書で使用されるような「データ構造」とは、メモリ、ストレージデバイス、または他のコンピュータ化システムに格納された、コンピューティングシステムにおけるデータの構成である。データ構造は、たとえば、データフィールド、データファイル、データアレイ、データレコード、データベース、データテーブル、グラフ、ツリー、リンクリストなどのうちのいずれか1つであり得る。データ構造は、多くの他のデータ構造から形成され、それらを含み得る(たとえば、データベースは多くのデータレコードを含む)。他の実施形態によれば、データ構造の他の例も同様に可能である。
【0142】
本明細書で使用されるような「コンピュータ読取可能媒体」または「コンピュータ記憶媒体」とは、実行されると開示された機能のうちの1つ以上を行なうように構成された命令および/またはデータを格納する非一時的媒体を指す。いくつかの実施形態では、データは命令として機能し得る。コンピュータ読取可能媒体は、不揮発性媒体および揮発性媒体を含むもののそれらに限定されない形態を取り得る。不揮発性媒体は、たとえば光ディスク、磁気ディスクなどを含み得る。揮発性媒体は、たとえば半導体メモリ、ダイナミックメモリなどを含み得る。コンピュータ読取可能媒体の一般的な形態は、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、他の磁気媒体、特定用途向け集積回路(ASIC)、プログラマブルロジックデバイス、コンパクトディスク(CD)、他の光学媒体、ランダムアクセスメモリ(RAM)、読出専用メモリ(ROM)、メモリチップまたはカード、メモリスティック、ソリッドステートストレージデバイス(solid state storage device:SSD)、フラッシュドライブ、および、コンピュータ、プロセッサまたは他の電子デバイスがともに機能できる他の媒体を含み得るものの、それらに限定されない。各タイプの媒体は、一実施形態における実現のために選択された場合、開示および/または特許請求されている機能のうちの1つ以上を行なうように構成されたアルゴリズムの格納された命令を含み得る。
【0143】
本明細書で使用されるような「ロジック」とは、本明細書に開示されるような機能またはアクションのうちのいずれかを行なうために、ならびに/もしくは、別のロジック、方法および/またはシステムからの機能またはアクションが本明細書に開示されるように行なわれるようにするために、コンピュータまたは電気的ハードウェア、実行可能アプリケーションまたはプログラムモジュールの命令が格納された非一時的媒体、および/またはそれらの組合せを用いて実現されるコンポーネントを表わす。同等のロジックは、ファームウェア、アルゴリズムを用いてプログラムされたマイクロプロセッサ、個別ロジック(たとえばASIC)、少なくとも1つの回路、アナログ回路、デジタル回路、プログラムドロジックデバイス、アルゴリズムの命令を含むメモリデバイスなどを含んでいてもよく、それらのいずれも、開示された機能のうちの1つ以上を行なうように構成され得る。一実施形態では、ロジックは、開示された機能のうちの1つ以上を行なうように構成された1つ以上のゲート、ゲートの組合せ、または他の回路部品を含み得る。複数のロジックが記載される場合、それら複数のロジックを1つのロジックに組み込むことが可能であり得る。同様に、単一のロジックが記載される場合、その単一のロジックを複数のロジック間で分散させることが可能であり得る。一実施形態では、これらのロジックのうちの1つ以上は、開示および/または特許請求されている機能を行なうことに関連付けられた対応する構造である。どのタイプのロジックを実現するかについての選択は、所望のシステム条件または仕様に基づき得る。たとえば、より早い速度が考慮事項である場合には、機能を実現するために、ハードウェアが選択されるであろう。より低いコストが考慮事項である場合には、機能を実現するために、格納された命令/実行可能アプリケーションが選択されるであろう。
【0144】
「動作可能な接続」、または、エンティティが「動作可能に接続される」接続とは、信号、物理的通信、および/または論理的通信が送信および/または受信され得る接続である。動作可能な接続は、物理的インターフェイス、電気的インターフェイス、および/またはデータインターフェイスを含み得る。動作可能な接続は、動作可能な制御を可能にするのに十分なインターフェイスおよび/または接続の異なる組合せを含み得る。たとえば、2つのエンティティが、直接、または1つ以上の中間エンティティ(たとえば、プロセッサ、オペレーティングシステム、ロジック、非一時的コンピュータ読取可能媒体)を通して互いに信号を通信するために、動作可能に接続され得る。動作可能な接続を作り出すために、論理的および/または物理的通信チャネルが使用され得る。
【0145】
本明細書で使用されるような「ユーザ」とは、1人以上の人間、1つ以上のコンピュータまたは他のデバイス、もしくはそれらの組合せを含むものの、それらに限定されない。
【0146】
開示された実施形態をかなり詳細に示して説明してきたが、添付された請求の範囲をそのような詳細に制限すること、または何らかのやり方で限定することは、意図されていない。主題のさまざまな局面を説明するために、構成要素または方法論の考えられるすべての組合せを説明することは、もちろん不可能である。したがって、この開示は、示され説明された特定の詳細または例示的な例に限定されない。このため、この開示は、添付された請求の範囲にある変更、修正、および変形を包含するよう意図されている。
【0147】
詳細な説明または請求項で「含む」または「含んでいる」という用語が採用される限りにおいて、それは、「備える」という用語が請求項で移行句として採用される際に解釈される場合と同様の態様で、包括的であるよう意図されている。
【0148】
詳細な説明または請求項で「または」という用語(たとえば、AまたはB)が使用される限りにおいて、それは、「AまたはBまたはそれら双方」を意味するよう意図されている。出願人が「AまたはBのみであって、それら双方ではない」ことを示すよう意図している場合、「AまたはBのみであって、それら双方ではない」という句が使用されるであろう。このため、本明細書での「または」という用語の使用は、排他的使用ではなく、包括的使用である。
図1
図2
図3
図4
【国際調査報告】