(58)【調査した分野】(Int.Cl.,DB名)
前記一つまたは複数の物理的なコンピュータ・プロセッサは、前記関連する療法特徴が、階層的成分コードリスト(HICL)における薬物成分、全国薬物データ・ファイル(NDDF)における薬物名称、療法名称または分類番号の一つまたは複数を含むよう構成される、請求項1記載のシステム。
前記一つまたは複数の物理的なコンピュータ・プロセッサは、前記非構造化項目特徴が、構造化されていない薬物成分、構造化されていない薬物名称、構造化されていない療法名称または構造化されていない分類番号の一つまたは複数を含むよう構成され、前記一つまたは複数の物理的なコンピュータ・プロセッサは、個別の非構造化項目特徴が関連する療法特徴のある集合に関係している第一の確率を決定し、前記個別の非構造化項目特徴が関連する療法特徴の前記集合における関連する療法特徴の特定のクラスに関係している第二の確率を決定するよう構成される、請求項1記載のシステム。
前記一つまたは複数の物理的なコンピュータ・プロセッサは、前記第一の非構造化項目特徴と前記対応する関連する療法特徴との間の相関強さを示す信頼性因子を決定するよう構成されている、請求項1記載のシステム。
相関付けシステムにより、非構造化療法項目における非構造化項目特徴を、構造化された療法情報における関連する療法特徴に一様に相関付けする方法であって、前記システムは一つまたは複数の物理的なコンピュータ・プロセッサを有し、当該方法は:
前記一つまたは複数の物理的なコンピュータ・プロセッサによって、第一の非構造化療法項目を含むテキストの非構造化療法項目を取得し;
前記一つまたは複数の物理的なコンピュータ・プロセッサによって、個別の非構造化療法項目における非構造化項目特徴を、非構造化項目特徴が含まれる非構造化療法項目に関連付けられているコンテキスト情報に基づいて識別し;
前記一つまたは複数の物理的なコンピュータ・プロセッサによって、非構造化療法項目における識別された非構造化項目特徴を対応する関連する療法特徴に相関付けすることを含み、それにより、第一の非構造化療法項目における識別された第一の非構造化項目特徴は、対応する関連する療法特徴に相関付けされ、
前記コンテキスト情報は、前記テキストの非構造化療法項目のシンタックスおよび/またはフォーマットの一つまたは複数を含む、
方法。
前記関連する療法特徴が、階層的成分コードリスト(HICL)における薬物成分、全国薬物データ・ファイル(NDDF)における薬物名称、療法名称または分類番号の一つまたは複数を含む、請求項6記載の方法。
前記非構造化項目特徴が、構造化されていない薬物成分、構造化されていない薬物名称、構造化されていない療法名称または構造化されていない分類番号の一つまたは複数を含み、当該方法はさらに、個別の非構造化項目特徴が関連する療法特徴のある集合に関係している第一の確率を決定し、前記個別の非構造化項目特徴が関連する療法特徴の前記集合における関連する療法特徴の特定のクラスに関係している第二の確率を決定することを含む、請求項6記載の方法。
前記関連する療法特徴が、階層的成分コードリスト(HICL)における薬物成分、全国薬物データ・ファイル(NDDF)における薬物名称、療法名称または分類番号の一つまたは複数を含む、請求項11記載のシステム。
前記非構造化項目特徴が、構造化されていない薬物成分、構造化されていない薬物名称、構造化されていない療法名称または構造化されていない分類番号の一つまたは複数を含むよう構成され、当該システムは、個別の非構造化項目特徴が関連する療法特徴のある集合に関係している第一の確率を決定し、前記個別の非構造化項目特徴が関連する療法特徴の前記集合における関連する療法特徴の特定のクラスに関係している第二の確率を決定する手段をさらに有する、請求項11記載のシステム。
【発明を実施するための形態】
【0009】
本稿での用法では、単数形は、文脈がそうでないことを明確に指定するのでない限り、複数の言及を含む。本稿での用法では、二つ以上の部分またはコンポーネントが「結合されている」という陳述は、それらの部分が、直接的にまたは間接的に、すなわち一つまたは複数の中間部分またはコンポーネントを通じて、つながっているまたは一緒に動作することを意味する。リンクが生じていさえすればよい。本稿での用法では、「直接結合された」は二つの要素が直接的に互いに接触していることを意味する。本稿での用法では、「固定的に結合された」または「固定された」は、二つのコンポーネントが、互いに対する一定の配向を維持しながら一体として動くよう結合されていることを意味する。
【0010】
本稿での用法では、単語「ユニット的」は、コンポーネントが単一の片またはユニットとして作られていることを意味する。すなわち、別個に作られてその後一緒に結合された複数の片を含むコンポーネントは「ユニット的」なコンポーネントまたはボディではない。本稿での用法では、二つ以上の部分またはコンポーネントが互いに「係合する」という陳述は、それらの部分が直接的にまたは一つまたは複数の中間の部分またはコンポーネントを通じて互いに力をはたらかせることを意味する。本稿での用法では、用語「数」は1または1より大きい整数(すなわち複数)を意味する。
【0011】
本稿での方向に関する句、たとえば限定なしに上、下、左、右、上のほう、下のほう、前、後およびそれらの派生形は、図面に示される要素の配向に関するものであり、請求項において明確に記載されているのでない限り、請求項に対して限定するものではない。
【0012】
図1は、非構造化療法項目における非構造化項目特徴を、構造化された療法情報における関連する療法特徴に一様に相関付けするよう構成されたシステム10を概略的に示している。電算式プロバイダー注文入力(CPOE)システムおよび薬物データ相互運用性に関する問題が、薬物名称および/または標準コーディング・システムについてのローカルな(臨床担当者が生成する)選好の変動性のため、残っている。その結果、薬物データベースにおける項目の正規化が限定的なものとなり、可能性としてはそのようなデータから導出される研究知見における不正確さが生じる。米国食品医薬品局(FDA)のNDC(National Drug Code[全国薬物コード])のような広く使われている標準用語は、それらのコードがユニバーサルな統制団体ではなく個々の薬物供給者によって作成されるので、実装し、管理するのが難しいことがある。ファーストデータバンクメドノレッジ(First Data Bank MedKnowledge)、全国薬物データ・ファイル(NDDF: National Drug Data File)および階層的成分コードリスト(HICL: Hierarchical Ingredient Code List)用語はNDCに対する有望な代替を提供する。しかしながら、データ入力における誤りおよびヘルスケア環境内での医薬品についての曖昧な略語の使用のため、薬物データベースにおいては、名称とHICLまたはNDDFコードにおける食い違いが多い。これらの問題は、臨床ケア関係の研究における薬物データベースの二次使用に悪影響を与える。
【0013】
システム10は、非構造化療法項目特徴を識別および/または解析し、それらを構造化された情報における対応する関連する療法特徴に相関付けるよう構成されている。そのような識別および/または解析は、自然言語処理(NLP)を用いたテキスト解析、機械学習および/または他の技法および/またはモデルを含んでいてもよい。機械学習モデル(たとえば、単純ベイズおよび/または他のモデル)は、以前に識別され、(関連する療法特徴に)相関付けされた非構造化項目特徴の集合から学習し、学習された規則を適用して、その後に識別された非構造化項目特徴を分類する。非構造化療法項目における誤りおよび/または他の非一貫性(たとえば綴りの誤りおよび/または一貫しない略語)があるときは、典型的な機械学習システムの性能は低下する。システム10は、向上した一様性および/または正確さをもって、非構造化療法項目特徴を、対応する関連する療法特徴と相関付けする(たとえば、非構造化療法項目特徴をHICLまたはNDDFコードに基づいて分類する)ために、機械学習技法(たとえば、単純ベイズおよび/またはその他)を前処理および/または曖昧さ解消(disambiguation)手法(たとえばNLPベースのテキスト解析)と組み合わせてもよい。向上した一様性での非構造化療法項目特徴の分類を容易にすることは、非構造化療法項目特徴を大規模な構造化された療法関係情報のデータベースに正規化することによって相互運用性を向上させる。向上した一様性での非構造化療法項目特徴の分類を容易にすることにより、データは、臨床および患者安全性に関係した研究における二次使用のためにより有益になる。たとえば、システム10は、薬品/臨床データベースにおける薬物名称の標準化されたコーディングを容易にしうる。いくつかの実施形態では、システム10は、コンピューティング装置21、データ源25、プロセッサ20および/または他のコンポーネントの一つまたは複数を含む。
【0014】
コンピューティング装置21は、ユーザーがコンピューティング装置21を介してシステム10にアクセスしうるよう構成されてもよい。コンピューティング装置21は、ユーザー・インターフェース24、電子記憶22、プロセッサ20および/または他のコンポーネントのうちの一つまたは複数を含んでいてもよい。いくつかの実施形態では、コンピューティング装置21は一つまたは複数の外部データ源25、プロセッサ20および/またはシステム10の他のコンポーネントと通信するよう構成されていてもよい。コンピューティング装置21は、データ源25、プロセッサ20および/またはシステム10の他のコンポーネントと、ピアツーピア・アーキテクチャ、クライアント/サーバー・アーキテクチャおよび/または他のアーキテクチャに基づいて通信するよう構成されていてもよい。限定しない例として、所与のコンピューティング装置21は、デスクトップ・コンピュータ、ラップトップ・コンピュータ、ハンドヘルド・コンピュータ、タブレット・コンピューティング・プラットフォーム、ネットブック、スマートフォンおよび/または他のコンピューティング・プラットフォームの一つまたは複数を含んでいてもよい。コンピューティング装置21は、ネットワーク、他のコンピューティング・プラットフォーム(たとえば一つまたは複数の他のコンピューティング装置21)および/または他の装置との情報交換を可能にするために通信線および/またはポートを含んでいてもよい。いくつかの実施形態では、コンピューティング装置21、プロセッサ20、データ源25および/またはシステム10の他のコンポーネントの間の通信は、無線および/または有線経由でありうる。たとえば、コンピューティング装置21はプロセッサ20および/またはデータ源25とWi-Fiネットワーク、ブルートゥース(登録商標)技術および/または他の無線技術を介して無線で通信してもよい。いくつかの実施形態では、コンピューティング装置21はユーザー・プロセッサ20および/またはデータ源25と、たとえば有線USB接続を介して通信してもよい。いくつかの実施形態では、コンピューティング装置21はプロセッサ20および/またはデータ源25を含んでいてもよい。
【0015】
ユーザー・インターフェース24は、システム10とプロバイダー12および/または他のユーザーとの間のインターフェースを提供するよう構成されており、それを通じて、プロバイダー12および/または他のユーザーは、システム10に情報を提供し、システム10から情報を受領しうる。これにより、本稿でまとめて「情報」と称される、データ、キュー、結果、非構造化療法項目および/または命令および他の任意の通信可能なアイテムが、ユーザーと一つまたは複数のデータ源25、プロセッサ20および/またはシステム10の他のコンポーネントとの間で通信されることができる。
【0016】
ユーザー・インターフェース24に含めるのに好適なインターフェース装置の例は、キーパッド、ボタン、スイッチ、キーボード、ノブ、レバー、表示画面、タッチスクリーン、スピーカー、マイクロフォン、インジケーター・ライト、可聴アラーム、プリンター、触覚フィードバック装置および/または他のインターフェース装置を含む。いくつかの実施形態では、ユーザー・インターフェース24は複数の別個のインターフェースを有する。いくつかの実施形態では、ユーザー・インターフェース24は、データ源25、プロセッサ20および/またはシステム10の他のコンポーネントと統合的に提供される少なくとも一つのインターフェースを有する。
【0017】
固定結線であれ無線であれ他の通信技法も本開示によってユーザー・インターフェース24として考えられていることは理解しておくものとする。たとえば、本開示は、ユーザー・インターフェース24が、電子記憶22によって与えられるリムーバブル記憶インターフェースと統合されていてもよいことを考えている。この例では、リムーバブル記憶(たとえばスマートカード、フラッシュドライブ、リムーバブルディスクなど)から情報がシステム10にロードされてもよく、それによりユーザー(単数または複数)がシステム10の実装をカスタマイズできる。システム10と一緒にユーザー・インターフェース24として使うために適応された他の例示的な入力装置および技法は、これに限られないが、RS-232ポート、RFリンク、IRリンク、モデム(電話、ケーブルまたはその他)を含む。要するに、システム10と情報を通信するための任意の技法が本開示によってユーザー・インターフェース24として考えられている。
【0018】
ユーザー・インターフェース24は、電算式プロバイダー注文入力(CPOE)および/またはその他の情報入力および/または選択を容易にするよう構成される。これは、ユーザー・インターフェース24を介した非構造化療法情報(療法項目特徴を含む非構造化療法項目)の入力および/または選択を含んでいてもよい。いくつかの実施形態では、プロバイダー〔提供者〕(たとえば医師、看護師、ユーザーおよび/または他のプロバイダー)が、ユーザー・インターフェース24および/または他のコンポーネントを用いて、非構造化療法情報(unstructured therapy information)(たとえば、特定の患者のための、その患者に与えられたおよび/または処方された薬物名称、量、処置時間、頻度および/または他の項目特徴(entry feature)を含む処置を記述するテキストの療法項目(therapy entry))を入力する。システム10は、この情報がデータ源25および/または他の装置に記憶されるよう構成される。上記のように、非構造化(たとえばテキスト形式の)療法項目は薬物単位、用量、略語、薬物/療法情報および/または他の情報および/または特徴を含みうる。いくつかの実施形態では、非構造化療法項目は、綴りの誤り、略語、当該情報を入力するプロバイダーに固有の略語、曖昧な用語および/または他の情報を含むことがある。いくつかの実施形態では、コンピューティング装置21は、そのような非構造化療法項目の電子記憶22における記憶を容易にし、非構造化療法項目のデータ源25への通信を容易にし、および/または非構造化療法項目に関して他のアクションを行なうよう構成されてもよい。
【0019】
電子記憶22は、電子的に情報を記憶する電子記憶媒体を含む。電子記憶22の電子記憶媒体は、コンピューティング装置21と統合して(すなわち実質的に取り外し不可能に)設けられるシステム記憶および/またはたとえばポート(たとえばUSBポート、ファイアワイヤ・ポートなど)またはドライブ(たとえばディスク・ドライブなど)を介してシステム10に取り外し可能式に接続できるリムーバブル記憶の一方または両方を含みうる。電子記憶22は、光学式に読み取り可能な記憶媒体(たとえば光ディスクなど)、磁気的に読み取り可能な記憶媒体(たとえば磁気テープ、磁気ハードドライブ、フロッピーディスクなど)、電荷ベースの記憶媒体(たとえばEPROM、RAMなど)、半導体記憶媒体(たとえばフラッシュドライブなど)および/または他の電子的に読み取り可能な記憶媒体の一つまたは複数を含んでいてもよい。電子記憶22は、ソフトウェア・アルゴリズム、プロセッサ20によって決定された情報、ユーザー・インターフェース24を介してユーザーから受領された情報および/またはシステム10が適正に機能できるようにする他の情報を記憶していてもよい。電子記憶22は(全体的にまたは部分的に)システム10内の別個のコンポーネントであってもよく、あるいは電子記憶22は(全体的にまたは部分的に)システム10の一つまたは複数の他のコンポーネントと統合して(たとえばコンピューティング装置21内に)設けられてもよい。
【0020】
データ源25は、療法記録、非構造化療法項目、構造化された療法情報(たとえば関連する療法特徴、関連する療法特徴の連合(association)(たとえば関係している関連する療法特徴のグループ)、非構造化療法項目特徴と関連する療法特徴との間の以前に決定された相関付けおよび/または他の情報を電子的に記憶するよう構成される。いくつかの実施形態では、データ源25は非構造化データ源42、構造化データ源44および/または他の情報源を含みうる。いくつかの実施形態では、データ源25はサーバー46および/または他のコンポーネントであってもよく、および/またはそれを含んでいてもよい。
【0021】
非構造化データ源42は、非構造化療法情報を記憶するよう構成される。非構造化療法情報は療法記録および/または他の情報を含む。療法記録(therapy record)は、非構造化療法項目、コンテキスト情報および/または他の情報を含んでいてもよい。非構造化療法項目はさまざまな源(たとえばさまざまなコンピューティング装置21)から取得および/または受領される。非構造化療法項目は、非構造化療法項目特徴および/または他の情報を含む。非構造化データ源42は、コンピューティング装置21および/または他の非構造化療法情報源を介して受領される非構造化療法項目を記憶するよう構成される。非構造化データ源42は、療法(たとえば医学的療法および/または他の療法)に関係したおよび/または療法を特徴付けるコンテキスト情報(contextual information)を記憶するよう構成される。そのような情報は、プロバイダーによって入力および/または提供されてもよい。そのような情報は、プロバイダー(単数または複数)の名前、患者および/または処置施設の地理的位置、病院の名前および/または位置、施設種別、プロバイダーの職名(たとえば医師、看護師、薬剤師など);非構造化療法項目内のさまざまな薬物名称、量、処置頻度および/または他の情報をつなぐ単語、文、略語、シンタックス、フォーマットなど;および/または他の情報の一つまたは複数を含んでいてもよい。非構造化療法項目は、非構造化療法項目特徴(unstructured therapy entry feature)(たとえば、プロバイダー名、プロバイダー職名、処置施設名/位置、薬物名称、量、処置頻度など)および/または他の情報を含んでいてもよい。非構造化療法項目は、略語、曖昧な単語、綴りの誤り、一貫しない単位および/または他の非一様性を含んでいることがある。これらの非一様性は、ユーザー入力、機関の実務および/またはデフォルト、健康情報システム内の冗長な誤りの意図せざる伝搬の所産であることがあり、および/または他の要因によって引き起こされることがある。
【0022】
構造化データ源44は、関連する療法特徴、関連する療法特徴の連合、非構造化項目特徴の、構造化された情報の関連する療法特徴への以前に決定された相関付けおよび/または他の情報を記憶するよう構成される。関連する療法特徴(associated therapy feature)は、薬物名称、薬物成分、量(たとえば用量)、識別コード、シーケンス・コード、化学組成、投与ルートおよび/または他の治療上の情報を含んでいてもよい。関連する療法特徴の連合(association of associated therapy features)は、関連する療法特徴の集合、(たとえば集合内の)関連する療法特徴のクラスおよび/または関係した関連する療法特徴の他のグループを含んでいてもよい。いくつかの実施形態では、構造化されたデータ源44は、構造化された情報の一つまたは複数のデータベースであってもよく、および/またはそれを含んでいてもよい。いくつかの実施形態では、構造化データ源44に記憶される構造化された情報は、階層的な配列および/または他のフォーマットを有していてもよい。たとえば、構造化されたデータ源44はNDC、ファーストデータバンクメドノレッジ(NDDF)、RxNorm、HICLおよび/または他のデータベースを含んでいてもよい。限定しない例として、NDDFデータベースのようなデータベースにおいて、関連する療法特徴は、たとえば薬物名称に対応してもよい。(たとえば)このデータベースでは、関連する療法特徴の連合は、いくつかの薬物名称を含む薬物クラスを含んでいてもよい。この薬物クラスは、同じ型の複数の薬物クラス(たとえば関連する療法特徴の別の連合)からなる、より大きな集合の一部であってもよい。
【0023】
いくつかの実施形態では、データ源25は、一つまたは複数のサーバー46であってもよく、および/またはそれを含んでいてもよい。サーバー46は、非構造化療法項目、非構造化療法項目特徴、関連する療法項目、非構造化療法項目特徴と関連する療法特徴との間の以前に決定された相関付けおよび/または他の情報を記憶し(たとえば、サーバー46は非構造化データ源42および/または構造化データ源44を含んでいてもよい);コンピューティング装置21、プロセッサ20および/または他の装置と通信し;および/または他の機能を実行するよう構成されてもよい。いくつかの実施形態では、プロセッサ20がサーバー46に含まれてもよく、および/または後述のプロセッサ20の機能がサーバー46によって実行されてもよい。いくつかの実施形態では、サーバー46は単一のサーバーであってもよい。いくつかの実施形態では、サーバー46は、本稿に記載される機能を実行するためのクラウド構成と一緒に動作する複数のサーバーを含んでいてもよい。サーバー46は電子記憶、一つまたは複数のプロセッサ(たとえばプロセッサ20)および/または他のコンポーネントを含んでいてもよい。サーバー46はネットワークおよび/または他のコンピューティング・プラットフォームとの情報交換を可能にするための通信線またはポートを含んでいてもよい。
図1のサーバー46の単一のエンティティとしての図示は、サーバー46および/またはデータ源25を限定することは意図されていない。サーバー46は、本稿でサーバー46に帰される機能を提供するために一緒に動作する複数のハードウェア、ソフトウェアおよび/またはファームウェア・コンポーネントを含んでいてもよい。たとえば、サーバー46は、サーバー46として一緒に動作するコンピューティング・プラットフォームのクラウドによって実装されてもよい。
【0024】
プロセッサ(単数または複数)20は、システム10における情報処理機能を提供する。よって、プロセッサ20は、デジタル・プロセッサ、アナログ・プロセッサ、情報を処理するよう設計されたデジタル回路、情報を処理するよう設計されたアナログ回路、状態機械および/または情報を電子的に処理するための他の機構の一つまたは複数を含んでいてもよい。プロセッサ20は
図1では単一のエンティティとして示されているが、これは単に図示のためである。いくつかの実施形態では、プロセッサ20は複数の処理ユニットを有していてもよい。これらの処理ユニットは物理的に、同じ装置内に位置されていてもよく、あるいはプロセッサ20は協調して動作する複数の装置の処理機能を表わしていてもよい。
【0025】
図1に示されるように、プロセッサ20は一つまたは複数のコンピュータ・プログラム・コンポーネントを実行するよう構成される。プロセッサ20は、ユーザー入力コンポーネント30、識別コンポーネント32、相関付けコンポーネント34および/または他のコンポーネントの一つまたは複数を含んでいてもよい。プロセッサ20は、コンポーネント30、32、34および/または他のコンピュータ処理コンポーネントをソフトウェア;ハードウェア;ファームウェア;ソフトウェア、ハードウェアおよび/またはファームウェアの何らかの組み合わせ;および/またはプロセッサ20上で処理機能を構成するための他の機構によって、実行するよう構成されていてもよい。コンポーネント30、32、34は
図1では単一の処理ユニット内で共位置にあるものとして示されているが、プロセッサ20が複数の処理ユニットを含む実施形態では、コンポーネント30、32、34および/または他のコンピュータ処理コンポーネントの一つまたは複数が他のコンポーネントからリモートに位置されていてもよいことは理解しておくべきである。種々のコンポーネント30、32、34および/または後述する他のコンピュータ処理コンポーネントによって提供される機能の記述は例解目的のためであって、限定することは意図されていない。コンポーネント30、32、34および/または他のコンピュータ処理コンポーネントのいずれも、記述されるより多いまたは少ない機能を提供してもよいのである。たとえば、コンポーネント30、32、34および/または他のコンピュータ処理コンポーネントの一つまたは複数をなしにしてもよく、その機能の一部または全部がコンポーネント30、32、34および/または他のコンピュータ処理コンポーネントの他のものによって提供されてもよい。もう一つの例として、プロセッサ20は、下記でコンポーネント30、32、34および/または他のコンピュータ処理コンポーネントのうちの一つに帰される機能の一部または全部を実行しうる一つまたは複数の追加的なコンポーネントを実行するよう構成されていてもよい。
【0026】
ユーザー入力コンポーネント30は、非構造化療法項目を、コンピューティング装置21から(たとえばプロバイダーおよび/またはシステム10の他のユーザーによる入力および/または選択後)、非構造化データ源42からおよび/または他の源から、得るよう構成される。ユーザー入力コンポーネント30は非構造化療法項目を、コンピューティング装置21からリアルタイムでまたはほぼリアルタイムで、非構造化データ源42から一つまたは複数の非構造化療法項目の一つまたは複数のバッチにおいて、および/または他の仕方で得てもよい。
【0027】
識別コンポーネント32は、非構造化療法項目内の非構造化療法項目特徴を識別するよう構成される。いくつかの実施形態では、識別コンポーネント32は、非構造化療法項目内の非構造化療法項目特徴のコンテキストを判別するよう構成される。いくつかの実施形態では、識別コンポーネント32は、非構造化療法項目の特徴を識別するために、非構造化療法項目に関係した療法記録におけるコンテキスト情報を使うよう構成される。
【0028】
相関付けコンポーネント34は、非構造化療法項目内の識別された非構造化項目特徴を、対応する構造化された項目特徴に相関付けるよう構成される。相関付けコンポーネント34は非構造化療法項目を構造化された項目特徴に相関付けることを、非構造化項目特徴が含まれている個別の非構造化療法項目に関連付けられたコンテキスト情報に基づいて行なう。たとえば、第一の非構造化療法項目特徴の識別に応答して、第一の非構造化療法項目特徴は、該第一の非構造化療法項目特徴に関連付けられたコンテキスト情報に基づいて、対応する構造化された項目特徴に相関付けされる。
【0029】
いくつかの実施形態では、相関付けコンポーネント34は、相関付けが、非構造化療法項目のテキスト解析のために自然言語処理(NLP)アルゴリズムを使うことを含むよう構成される。テキスト解析のためにNLPアルゴリズムを使うことは:(a)非構造化療法項目における綴りの誤りを訂正すること、(b)略語についての完全長の記載を与えることによって略語の曖昧さを解消すること、(c)薬物および/または療法についての商標名および/または慣用名を識別してそれらを該商標名および/または慣用名の一般名および/または記載にマッピングすること、および/または(d)非構造化療法項目に含まれる意味的でない(意味のない)単語を識別して除去することおよび/または他のステップといったいくつかのステップを含んでいてもよい。
【0030】
限定しない例として、
図2は、ある療法記録の非構造化療法項目202における識別された非構造化項目特徴212を構造化された情報204の対応する関連する療法特徴210と相関付けすることを示す。構造化された情報204は、関連する療法特徴210の連合206を含む。薬物名称(たとえばタイレノール)のような識別された非構造化項目特徴(feature)212は、構造化された情報204の一つまたは複数の関連する特徴210(たとえば一般名アセトアミノフェン、薬物番号、推奨される用量など)と相関付けされてもよい。いくつかの実施形態では、相関付けコンポーネント34(
図1)による非構造化項目特徴212の関連する療法特徴210との相関付け208はまた、特定の非構造化療法項目特徴212を、構造化された情報204(たとえばHICL薬物コード・データベースのような特定のデータベース)内の関連する療法特徴210の連合206(たとえば薬物および/または薬物コードのクラス)と相関付けする。非構造化項目特徴212に関連付けられたコンテキスト情報(contextual information)214(たとえば非構造化療法項目202のシンタックス、作成者、フォーマットおよび/または他の特徴)は、非構造化項目特徴212の関連する特徴210との相関付けのために、相関付けコンポーネント34(
図1)によって使用される。いくつかの実施形態では、非構造化項目特徴212の、特定の関連する療法特徴210との相関付け208は、非構造化項目特徴212をある構造化された項目特徴に相関付けする、修正するおよび/または変更する。
【0031】
図1に戻ると、いくつかの実施形態では、相関付けコンポーネント34は、相関付けがトレーニング・フェーズおよび適用フェーズを含むよう構成される。トレーニング・フェーズでは、識別コンポーネント32による非構造化療法項目特徴の識別およびその後の相関付けコンポーネント34による非構造化療法項目特徴の関連する療法特徴への相関付けの後に、機械学習モデル(たとえば単純ベイズ推定器)を使っておよび/または他の方法によって相関付けコンポーネント34によって相関が学習されうる。相関を学習することは、それらの非構造化療法項目における一つまたは複数の非構造化療法項目特徴について一回または複数回生起する同様のおよび/または同じ相関を認識することを含んでいてもよい。いくつかの実施形態では、機械学習モデルは、訂正された薬物名称およびその対応するコード(たとえばRxNorm、HICLまたはNDDFシーケンス・コードおよび/または他の全国的および/または国際的に受け入れられているコーディング標準)に基づく。トレーニング・フェーズの間に、(たとえば機械学習モデルを使って)相関コンポーネント34は、個々の相関についての相関強さ(たとえば、非構造化項目特徴が、それが相関付けされた関連する療法特徴と実際に関連していることの確からしさ)を決定する。いくつかの実施形態では、非構造化項目特徴と関連する療法特徴との間の決定された相関強さに基づいて、相関コンポーネント34は、次いで、特定の非構造化療法項目特徴が特定のデータベース(たとえばHICL薬物コード・データベース)における薬物および/または薬物コードのあるクラス(関連する療法特徴の連合)の中にはいることの確からしさを決定するよう構成される。たとえば、非構造化項目特徴は、療法名および/または分類番号を含んでいてもよく、相関付けコンポーネント34は、それらの療法名および/または分類番号があるデータベース(たとえば構造化された情報)における療法名および/または分類番号の集合(たとえば関連する療法特徴の連合)に関係している第一の確率を決定し、前記非構造化療法特徴(たとえば名前および/または分類番号)が療法名および/または分類番号の特定の情報クラス(たとえば関連する療法特徴の第二の連合)に関係している第二の確率を決定するよう構成される。
【0032】
相関強さおよび非構造療法項目特徴が薬物および/または薬物コードのあるクラスの中にはいることの確からしさは、その後の適用フェーズの間に相関付けコンポーネント34によって使われる。適用フェーズの間、識別された非構造化療法項目特徴は、学習フェーズの間の以前の相関付けに基づいて、関連する療法特徴に相関付けされる。適用フェーズの間、相関付けは、学習された相関付けの以前に決定された相関強さに基づいてなされてもよい。適用フェーズは、同様のおよび/または同じ相関付け(たとえば上記で学習されたもの)を、それらが非構造化療法項目における一つまたは複数の非構造化療法項目特徴について一回または複数回生起する際に認識することを含んでいてもよい。いくつかの実施形態では、項目特徴と関連する療法特徴との間の決定された相関強さは、特定の非構造化療法項目特徴を個別の関連する療法特徴および/または関連する療法特徴の連合(たとえば薬物のクラス)と相関付けするために相関付けコンポーネント34によって使われる。たとえば、第一の確率(たとえば、非構造化療法特徴がある関連する療法特徴に関係している確率)および第二の確率(たとえば、前記非構造化療法特徴が、関連する療法特徴のある特定の連合に関係している確率)が、その後の非構造化療法特徴について相関の強さを決定するために使われることができる。相関付けの適用フェーズの間、非構造化項目特徴が関連する療法特徴の一つまたは複数の特定の連合(たとえば薬物クラス)に属する事後確率が決定される。いくつかの実施形態では、非構造化療法項目特徴は、相関の事後確率が最高である関連する療法特徴に相関付けされる。いくつかの実施形態では、対応する事後確率は、信頼性係数(reliability coefficient)である。
【0033】
図3は、相関付けコンポーネント34(
図1に示す)によって実行される自然言語処理(NLP)動作を示している。NLPエンジン300(たとえば相関付けコンポーネント34)は、単位および数字フィルタ302、複数単語句のための綴り訂正器304、連結単語分離器306、プレフィックス単語併合器308および/または他のコンポーネントを用いて、非正規化療法情報を正規化してもよい。単位および数字フィルタ302は、非構造化療法項目特徴(たとえば名前および/または分類番号)正規化を可能にしうる。非正規化療法項目(たとえば単位)に関連する療法記録に含まれるコンテキスト情報を認識することで、単位および数字フィルタ302は単位を除去することができ、システム10は項目特徴自身を相関付けすることができる。
【0034】
複数単語句のための綴り訂正器304は、複数データ源25(
図1に示す)から構築される辞書を含む。複数単語句のための綴り訂正器304は、一般的な英語語彙、SNOMED CT、RadLex、RxNorm、NDDF、HICL、独自の投薬および入院テーブル(medication and admission tables)および/または他の複数単語辞書句を含むデータベース310を含んでいてもよい。いくつかの実施形態では、データベース310はユニグラムおよびバイグラム・エンティティ両方でインデックス付けされる。いくつかの実施形態では、コンテキストを認識する綴り検査アルゴリズムが薬物名称における綴りの誤りを訂正する。
【0035】
非構造化療法項目(たとえば薬物名称)は、正確な空白および/または句読点を欠いている単語を含むことがある。連結単語分離器306は、療法項目を識別して、正確かつ一様な仕方で再フォーマットするよう構成される。たとえば、一般的な非構造化療法項目は薬物名称「calciumgluconate」(これは「calcium gluconate」〔グルコン酸カルシウム〕であるべき)や「sodabicarb」(これは「soda bicarb」〔重曹〕であるべき)を含む。連結単語分離器306は、プレフィックス・ミスマッチ検出および/またはバイグラム探索に基づいて連結されている単語を分離する。
【0036】
同様に、時に、単語は含まれるべきでない空白および/または句読点を与えられる。プレフィックス単語併合器308は、療法項目をフォーマットする正確かつ一様な方法を作り出す。あるデータベースにおける薬物名称項目についての特定の文書化スタイルは他のデータベースと(あるいは同じデータベース内部で)一様ではないことがあるので、一部のプロバイダー12(たとえば臨床担当者)は薬物名称におけるプレフィックスおよび/または実際の用語の間に空白を加える。たとえば、「multivitamins」〔総合ビタミン剤〕が「multi vitamins」と書かれたりする。プレフィックス単語併合器308は、正確かつ一様な仕方でプレフィックスを先行単語とつなげることによって、そのような単語を正規化することをねらいとする。
【0037】
図4は、(たとえば識別コンポーネント32によって)前処理された療法項目を用いてシステム10をトレーニングするための機械学習の実装を示している。非構造化療法項目402aおよび402bはトレーニング・フェーズ404(たとえば上記のようなトレーニング・フェーズ)および適用フェーズ406(たとえば上記のような適用フェーズ)を通じて処理される。機械学習モデルがNLPモジュール408aにより前処理され、対応する関連する療法特徴に相関付けされた薬物および/または療法名称(たとえば非構造化項目特徴)を使って(たとえばトレーニング・フェーズ404の間に)トレーニングされたのち、モデルは新たな薬物および/または療法名称(たとえば非構造化項目特徴)に適用されて、薬物/療法特徴を正確かつ一様に相関付けする(たとえば適用フェーズ406)。いくつかの実施形態では、非構造化項目特徴の、前処理(たとえばNLPモジュール)でクリーニングされた所与のキーワード・リストからの関連する療法特徴との相関の事後確率を推定するために、単純ベイズ機械学習が使われる。事後確率が最も高い諸構造化された療法特徴が、機械学習出力410として選択される。システム10によって見出される相関の事後確率は、信頼性係数として与えられ、機械学習された出力410において与えられる。
【0038】
いくつかの実施形態では、トレーニングのために使われる非構造化療法項目402aは、機械学習された相関の適用フェーズ406において使われる非構造化療法項目402bと類似している。トレーニング・フェーズ404および適用フェーズ406の両方において、非構造化療法項目は、非構造化療法項目特徴を関連する療法特徴に相関付けする前に、NLPモジュール(それぞれ408a、408b)を用いて前処理される。相関付けは、トレーニングされた相関付け412aおよび適用相関付け412bについて、それぞれの非構造化項目特徴の、関連する療法特徴への推定される確率を比較することに関わってもよい。この比較は、非構造化療法特徴リストに含まれる関連する療法特徴の諸連合の事後確率を生成する。相関付けは、非構造化療法項目データにおける各構造化された療法項目がある関連する療法特徴に相関付けられる確からしさおよび各構造化された療法項目が構造化された情報内である事前確率に比例する。これらのパラメータは、トレーニング・フェーズ404の間に、正しい構造化された療法項目をもつ非構造化療法項目の大規模なコレクションを用いて計算される。次いでこれらのパラメータは、非構造化療法項目特徴と関連する療法特徴との間の相関付けをするために適用フェーズ406において使われる。
【0039】
たとえば、いくつかの実施形態では、三つの非構造化特徴(たとえば非構造化療法項目特徴)の、二つのHICL構造化情報クラス(たとえば関連する療法特徴の連合)内の関連する療法特徴への相関付けは、各非構造化特徴がそのHICLクラス(たとえば関連する療法特徴の連合)内である確率を計算することを要求する:
【数1】
【0040】
もし非構造化特徴1(feature1)のみが非構造化療法項目に現われる場合には、非構造化療法項目がHICLクラス1に属する事後確率は次のように計算される:
【数2】
【0041】
上記の式の四つのパラメータはトレーニング・フェーズの間に計算できる。たとえば
p(feature1=1|HICL=1)=(HICL=1 AND feature1が出現 の総数)/(HICL=1 の総数)
。
【0042】
非構造化療法項目を構造化療法項目に一様に相関付けする機械学習側面は、臨床研究におけるeRI薬物データベースの二次使用を容易にするよう設計される(データマイニングおよび知識発見)。二次的な療法項目データ使用の拡張として、本システムは、非構造化項目の他のデータベースのための相関付け効果を提供しうる(たとえばeRIデータベースを外部顧客へ)。療法項目の使用の例は、限定することは意図されていない。たとえば、ヘルスケア品質重視および公共健康機関、たとえば疾病予防管理センター(CDC)によって実行される有害事象および/または感染検出、バイオサーベイランスが、大量の非構造化項目特徴を関連する療法特徴および/または関連する療法特徴の連合に正確かつ一様に相関付けるシステムの実装によって、改善されうる。一様な標準化技法は、他の研究領域でも、たとえば国の薬物データベースを洗練することまたは臨床研究CPOE文書化を統一することにおいて有用でありうる。ここで説明した例は単に例示的であり、本開示の範囲を限定することは意図されていない。
【0043】
図5は、相関付けシステムにより、非構造化療法項目における非構造化項目特徴を、関連する療法特徴に一様に相関付けする方法に関する。相関付けシステムは一つまたは複数の物理的なコンピュータ・プロセッサおよび/または他のコンポーネントであってコンピュータ・プログラム・コンポーネントを実行するためのコンピュータ可読命令によって構成されたものを有する。コンピュータ・プログラム・コンポーネントは、ユーザー入力コンポーネント、識別コンポーネント、相関付けコンポーネントおよび/または他のコンポーネントを含む。下記で呈示する方法500の動作は例示的であることが意図されている。いくつかの実施形態では、方法500は、記載されていない一つまたは複数の追加的な動作とともに、および/または論じられている動作のうちの一つまたは複数なしで、達成されてもよい。さらに、方法500の動作が
図5において示され、下記で例解される順序は、限定的であることは意図されていない。
【0044】
いくつかの実施形態では、方法500は一つまたは複数の処理装置(たとえばデジタル・プロセッサ、アナログ・プロセッサ、情報を処理するよう設計されたデジタル回路、情報を処理するよう設計されたアナログ回路、状態機械および/または電子的に情報を処理するための他の機構)において実装されてもよい。一つまたは複数の処理装置は、電子記憶媒体上に電子的に記憶されている命令に応答して、方法500の動作の一部または全部を実行する一つまたは複数の装置を含んでいてもよい。前記一つまたは複数の処理装置は、方法500の動作の一つまたは複数の実行のために特定的に設計されるハードウェア、ファームウェアおよび/またはソフトウェアを通じて構成された一つまたは複数の装置を含んでいてもよい。
【0045】
動作502では、ユーザー入力が得られる。ユーザー入力は、非構造化療法項目を含んでいてもよい。たとえば、プロバイダーがCPOEユーザー・インターフェースにおいて非構造化療法項目(たとえば薬物の処方)を入力してもよい。いくつかの実施形態では、動作502は、ユーザー入力コンポーネント30(
図1に示され、本稿で記述されている)と同じまたは同様のユーザー入力コンポーネントによって実行される。
【0046】
動作504では、個別の非構造化療法項目特徴が識別される。非構造化療法項目特徴は、動作502で入力された非構造化療法項目に含まれる。いくつかの実施形態では、動作504は識別コンポーネント32(
図1に示され、本稿で記述されている)と同じまたは同様の識別コンポーネントによって実行される。
【0047】
動作506では、個別の非構造化療法項目特徴が関連する療法特徴に相関付けされる。非構造化療法項目における識別された非構造化項目特徴は構造化項目特徴に相関付けされ、該相関付けは、非構造化項目特徴が含まれる個別の非構造化療法項目に関連付けられているコンテキスト情報に基づく。非構造化療法項目の識別に応答して、非構造化療法項目は、非構造化療法項目に関連付けられたコンテキスト情報に基づいて対応する関連する療法特徴に相関付けされる。コンテキスト情報は、前記第一の非構造化療法項目のシンタックス、前記第一の非構造化療法項目の作成者および/または前記第一の非構造化療法項目のフォーマットの一つまたは複数を含む。いくつかの実施形態では、相関付けは、非構造化療法項目における綴りの誤りを訂正すること、非構造化療法項目における略語についての記述を与えること、非構造化療法項目から非意味的なおよび/または意味のないデータを除去すること、単位をフィルタリングすること、単語の綴りを訂正すること、単語を分離すること、プレフィックスが分離された単語を併合すること、綴りの誤りを訂正すること、記述を与えること、非意味的なおよび/または意味のないデータを除去することおよび/または他の動作を含んでいてもよい。いくつかの実施形態では、動作506は相関付けコンポーネント34(
図1に示され、本稿で記述されている)と同じまたは同様の相関付けコンポーネントによって実行される。
【0048】
請求項において、括弧内に置かれた参照符号があったとしても、請求項を限定するものと解釈されるものではない。単語「有する」または「含む」は、請求項に挙げられている以外の要素や段階の存在を排除するものではない。いくつかの手段を列挙する装置請求項では、これらの手段のいくつかは同一のハードウェア項目によって具現されてもよい。要素の単数形の表現はそのような要素の複数の存在を排除しない。いくつかの手段を列挙するいかなる装置請求項でも、これらの手段のいくつかは同一のハードウェア項目によって具現されてもよい。ある種の要素が互いに異なる従属請求項において記載されているというだけの事実がこれらの要素が組み合わせて有利に使用できないことを示すものではない。
【0049】
上記に与えた記述は、例解のために、現在のところ最も実際的で好ましい実施形態であると考えられるものに基づいて詳細を与えているが、そのような詳細は単にその目的のためであって、本開示は明示的に開示される実施形態に限定されるものではなく、逆に、付属の請求項の精神および範囲内にある修正および等価な構成をカバーすることが意図されていることは理解しておくものとする。たとえば、本開示が、可能な限りにおいて、任意の実施形態の一つまた複数の事項が他の任意の実施形態の一つまたは複数の事項と組み合わされることができることを考えていることは理解されるものとする。
いくつかの態様を記載しておく。
〔態様1〕
非構造化療法項目における非構造化項目特徴を、構造化された療法情報における関連する療法特徴に一様に相関付けするよう構成されたシステムであって:
一つまたは複数の物理的なコンピュータ・プロセッサを有し、該コンピュータ・プロセッサは、コンピュータ可読命令によって:
第一の非構造化療法項目を含む非構造化療法項目を取得し;
個別の非構造化療法項目における非構造化項目特徴を識別し;
非構造化療法項目における識別された非構造化項目特徴を対応する関連する療法特徴に相関付けするよう構成され、該相関付けは、非構造化項目特徴が含まれる非構造化療法項目に関連付けられているコンテキスト情報に基づき、それにより、第一の非構造化療法項目における第一の非構造化項目特徴の識別に応答して、第一の非構造化項目特徴は、第一の非構造化療法項目に関連付けられているコンテキスト情報に基づいて対応する関連する療法特徴に相関付けされ、前記第一の非構造化療法項目に関連付けられたコンテキスト情報は、前記第一の非構造化療法項目のシンタックス、前記第一の非構造化療法項目の作成者および/または前記第一の非構造化療法項目のフォーマットの一つまたは複数を含む、
システム。
〔態様2〕
前記一つまたは複数の物理的なコンピュータ・プロセッサは、前記関連する療法特徴が、階層的成分コードリスト(HICL)における薬物成分、全国薬物データ・ファイル(NDDF)における薬物名称、療法名称または分類番号の一つまたは複数を含むよう構成される、態様1記載のシステム。
〔態様3〕
前記一つまたは複数の物理的なコンピュータ・プロセッサは、前記非構造化項目特徴が、構造化されていない薬物成分、構造化されていない薬物名称、構造化されていない療法名称または構造化されていない分類番号の一つまたは複数を含むよう構成され、前記一つまたは複数の物理的なコンピュータ・プロセッサは、個別の非構造化項目特徴が関連する療法特徴のある集合に関係している第一の確率を決定し、前記個別の非構造化項目特徴が関連する療法特徴の前記集合における関連する療法特徴の特定のクラスに関係している第二の確率を決定するよう構成される、態様1記載のシステム。
〔態様4〕
前記一つまたは複数の物理的なコンピュータ・プロセッサは、前記第一の非構造化項目特徴と前記対応する関連する療法特徴との間の相関強さを示す信頼性因子を決定するよう構成されている、態様1記載のシステム。
〔態様5〕
前記一つまたは複数の物理的なコンピュータ・プロセッサは、前記相関付けが:
前記非構造化療法項目からの単位をフィルタリングすること;
前記非構造化療法項目における単語の綴りを訂正すること;
前記非構造化療法項目における単語を分離すること;
前記非構造化療法項目におけるプレフィックスが分離された単語を併合すること;
前記非構造化療法項目における綴りの誤りを訂正すること;
前記非構造化療法項目における略語についての記述を与えること;および/または
前記非構造化療法項目から非意味的なおよび/または意味のないデータを除去すること
の一つまたは複数を含む、態様1記載のシステム。
〔態様6〕
相関付けシステムにより、非構造化療法項目における非構造化項目特徴を、構造化された療法情報における関連する療法特徴に一様に相関付けする方法であって、前記システムは一つまたは複数の物理的なコンピュータ・プロセッサを有し、当該方法は:
前記一つまたは複数の物理的なコンピュータ・プロセッサによって、第一の非構造化療法項目を含む非構造化療法項目を取得し;
前記一つまたは複数の物理的なコンピュータ・プロセッサによって、個別の非構造化療法項目における非構造化項目特徴を識別し;
前記一つまたは複数の物理的なコンピュータ・プロセッサによって、非構造化療法項目における識別された非構造化項目特徴を対応する関連する療法特徴に相関付けすることを含み、該相関付けは、非構造化項目特徴が含まれる非構造化療法項目に関連付けられているコンテキスト情報に基づき、それにより、第一の非構造化療法項目における第一の非構造化項目特徴の識別に応答して、第一の非構造化項目特徴は、第一の非構造化療法項目に関連付けられているコンテキスト情報に基づいて、対応する関連する療法特徴に相関付けされ、前記第一の非構造化療法項目に関連付けられたコンテキスト情報は、前記第一の非構造化療法項目のシンタックス、前記第一の非構造化療法項目の作成者および/または前記第一の非構造化療法項目のフォーマットの一つまたは複数を含む、
方法。
〔態様7〕
前記関連する療法特徴が、階層的成分コードリスト(HICL)における薬物成分、全国薬物データ・ファイル(NDDF)における薬物名称、療法名称または分類番号の一つまたは複数を含む、態様6記載の方法。
〔態様8〕
前記非構造化項目特徴が、構造化されていない薬物成分、構造化されていない薬物名称、構造化されていない療法名称または構造化されていない分類番号の一つまたは複数を含み、当該方法はさらに、個別の非構造化項目特徴が関連する療法特徴のある集合に関係している第一の確率を決定し、前記個別の非構造化項目特徴が関連する療法特徴の前記集合における関連する療法特徴の特定のクラスに関係している第二の確率を決定することを含む、態様6記載の方法。
〔態様9〕
前記第一の非構造化項目特徴と前記対応する関連する療法特徴との間の相関強さを示す信頼性因子を決定することをさらに含む、態様6記載の方法。
〔態様10〕
相関付けが:
前記非構造化療法項目からの単位をフィルタリングすること;
前記非構造化療法項目における単語の綴りを訂正すること;
前記非構造化療法項目における単語を分離すること;
前記非構造化療法項目におけるプレフィックスが分離された単語を併合すること;
前記非構造化療法項目における綴りの誤りを訂正すること;
前記非構造化療法項目における略語についての記述を与えること;および/または
前記非構造化療法項目から非意味的なおよび/または意味のないデータを除去すること
の一つまたは複数を含む、態様6記載の方法。
〔態様11〕
非構造化療法項目における非構造化項目特徴を、構造化された療法情報における関連する療法特徴に一様に相関付けするよう構成されたシステムであって:
第一の非構造化療法項目を含む非構造化療法項目を取得する手段と;
個別の非構造化療法項目における非構造化項目特徴を識別する手段と;
非構造化療法項目における識別された非構造化項目特徴を対応する関連する療法特徴に相関付けする手段とを有し、該相関付けは、非構造化項目特徴が含まれる非構造化療法項目に関連付けられているコンテキスト情報に基づき、それにより、第一の非構造化療法項目における第一の非構造化項目特徴の識別に応答して、第一の非構造化項目特徴は、第一の非構造化療法項目に関連付けられているコンテキスト情報に基づいて、対応する関連する療法特徴に相関付けされ、前記第一の非構造化療法項目に関連付けられたコンテキスト情報は、前記第一の非構造化療法項目のシンタックス、前記第一の非構造化療法項目の作成者および/または前記第一の非構造化療法項目のフォーマットの一つまたは複数を含む、システム。
〔態様12〕
前記関連する療法特徴が、階層的成分コードリスト(HICL)における薬物成分、全国薬物データ・ファイル(NDDF)における薬物名称、療法名称または分類番号の一つまたは複数を含む、態様11記載のシステム。
〔態様13〕
前記非構造化項目特徴が、構造化されていない薬物成分、構造化されていない薬物名称、構造化されていない療法名称または構造化されていない分類番号の一つまたは複数を含むよう構成され、当該システムは、個別の非構造化項目特徴が関連する療法特徴のある集合に関係している第一の確率を決定し、前記個別の非構造化項目特徴が関連する療法特徴の前記集合における関連する療法特徴の特定のクラスに関係している第二の確率を決定する手段をさらに有する、態様11記載のシステム。
〔態様14〕
前記第一の非構造化項目特徴と前記対応する関連する療法特徴との間の相関強さを示す信頼性因子を決定する手段をさらに有する、態様11記載のシステム。
〔態様15〕
相関付けが:
前記非構造化療法項目からの単位をフィルタリングすること;
前記非構造化療法項目における単語の綴りを訂正すること;
前記非構造化療法項目における単語を分離すること;
前記非構造化療法項目におけるプレフィックスが分離された単語を併合すること;
前記非構造化療法項目における綴りの誤りを訂正すること;
前記非構造化療法項目における略語についての記述を与えること;および/または
前記非構造化療法項目から非意味的なおよび/または意味のないデータを除去すること
の一つまたは複数を含む、態様11記載のシステム。