特許7010267 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ＦＲＯＮＴＥＯの特許一覧

特許7010267リスク対策解析システム、リスク対策解析方法およびリスク対策解析用プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2022-01-17

(45)【発行日】2022-01-26

(54)【発明の名称】リスク対策解析システム、リスク対策解析方法およびリスク対策解析用プログラム

(51)【国際特許分類】

G06N 20/00 20190101AFI20220119BHJP

G06Q 10/06 20120101ALI20220119BHJP

G16H 50/30 20180101ALI20220119BHJP

【ＦＩ】

G06N20/00 130

G06Q10/06 326

G16H50/30

【請求項の数】 11

(21)【出願番号】P 2019073961

(22)【出願日】2019-04-09

(65)【公開番号】P2020173525

(43)【公開日】2020-10-22

【審査請求日】2021-06-24

【早期審査対象出願】

(73)【特許権者】

【識別番号】316014906

【氏名又は名称】株式会社ＦＲＯＮＴＥＯ

(74)【代理人】

【識別番号】100105784

【弁理士】

【氏名又は名称】橘和之

(72)【発明者】

【氏名】西川久仁子

(72)【発明者】

【氏名】豊柴博義

(72)【発明者】

【氏名】内山秀文

【審査官】三坂敏夫

(56)【参考文献】

【文献】特表２０１３－５０８８５９（ＪＰ，Ａ）

【文献】特開２０１８－０１９６１１（ＪＰ，Ａ）

【文献】国際公開第２０１６／０３５３３６（ＷＯ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ３／００－３／１２

１０／００－２０／２０

Ｇ１６Ｈ５０／３０

(57)【特許請求の範囲】

【請求項1】

解析対象データを解析し、解析対象の特徴を表す特徴ベクトルを算出する特徴ベクトル算出部と、
上記特徴ベクトル算出部により算出された特徴ベクトルを、学習済みのリスク予測モデルに入力し、予測対象物に関するリスクレベルを予測するリスク予測部と、
上記特徴ベクトル算出部により算出された特徴ベクトルと探索用ベクトルとを用いて所定の演算を行った結果として得られる演算後ベクトルを上記リスク予測モデルに対して入力し、その結果得られるリスクレベルが、上記特徴ベクトルを上記リスク予測モデルに入力した場合に得られるリスクレベルよりも小さくなるという条件を満たす探索用ベクトルを探索し、上記条件を満たす探索用ベクトルと上記特徴ベクトルとに基づいて演算されるベクトルをリスク低減ベクトルとして特定するリスク低減ベクトル特定部と、
複数の上記解析対象データについて上記特徴ベクトル算出部により算出される複数の特徴ベクトルの中から、上記リスク低減ベクトルと同一の特徴ベクトルおよび近似する特徴ベクトルを特定し、特定した特徴ベクトルに対応する解析対象データを用いて、当該解析対象データまたは当該解析対象データに含まれる文章または単語をリスク対策に関する情報として生成する対策情報生成部とを備え、
上記リスク予測モデルは、上記特徴ベクトルが入力された際に上記予測対象物に関するリスクレベルを出力するように、教師データを用いた機械学習処理により生成されている
ことを特徴とするリスク対策解析システム。

【請求項2】

上記リスク低減ベクトル特定部は、上記特徴ベクトル算出部により算出された特徴ベクトルと探索トピックとを学習済みの対策予測モデルに入力し、上記特徴ベクトルと上記探索トピックとに基づき特定される探索範囲に含まれる上記探索用ベクトルを用いて上記リスク低減ベクトルの探索を行い、
上記対策予測モデルは、上記探索トピックと上記特徴ベクトルとが入力された際にそれらに応じた探索範囲を出力するように、教師データを用いた機械学習処理により生成されている
ことを特徴とする請求項１に記載のリスク対策解析システム。

【請求項3】

ユーザからの上記探索トピックに関する指定を受け付ける探索トピック指定部を更に備え、
上記リスク低減ベクトル特定部は、上記特徴ベクトル算出部により算出された特徴ベクトルと、上記探索トピック指定部により受け付けられた探索トピックとを上記学習済みの対策予測モデルに入力する
ことを特徴とする請求項２に記載のリスク対策解析システム。

【請求項4】

上記解析対象データを解析することによって上記探索トピックを特定する探索トピック特定部を更に備え、
上記リスク低減ベクトル特定部は、上記特徴ベクトル算出部により算出された特徴ベクトルと、上記探索トピック特定部により特定された探索トピックとを上記学習済みの対策予測モデルに入力する
ことを特徴とする請求項２に記載のリスク対策解析システム。

【請求項5】

上記解析対象データを解析することによって上記探索トピックを特定する探索トピック特定部を更に備え、
上記リスク低減ベクトル特定部は、上記特徴ベクトル算出部により算出された特徴ベクトルと、上記探索トピック特定部により特定された探索トピックとは異なる探索トピックとを上記学習済みの対策予測モデルに入力する
ことを特徴とする請求項２に記載のリスク対策解析システム。

【請求項6】

上記リスク低減ベクトル特定部は、複数の探索トピックごとに上記対策予測モデルにより特定される探索範囲に含まれる上記探索用ベクトルと、上記特徴ベクトル算出部により算出された特徴ベクトルとを用いて、上記複数の探索トピックごとに探索を行い、上記複数の探索トピックについてそれぞれ探索された探索用ベクトルと、上記特徴ベクトル算出部により算出された特徴ベクトルとを用いて、所定の重み付け加算を行うことによって算出されるベクトルをリスク低減ベクトルとして特定する
ことを特徴とする請求項２に記載のリスク対策解析システム。

【請求項7】

上記リスク低減ベクトル特定部は、
特定の探索トピックが入力された場合、当該入力された探索トピックと上記特徴ベクトル算出部により算出された特徴ベクトルとを学習済みの対策予測モデルに入力し、上記対策予測モデルにより特定される探索範囲に含まれる上記探索用ベクトルと上記特徴ベクトル算出部により算出された特徴ベクトルとを用いて上記リスク低減ベクトルを特定し、
上記特定の探索トピックが入力されていない場合、上記複数の探索トピックごとに上記対策予測モデルにより特定される探索範囲に含まれる上記探索用ベクトルと、上記特徴ベクトル算出部により算出された特徴ベクトルとを用いて、上記複数の探索トピックごとに探索を行い、上記複数の探索トピックについてそれぞれ探索された探索用ベクトルと、上記特徴ベクトルとに基づいて演算されるベクトルとを用いて所定の重み付け加算を行うことによってリスク低減ベクトルを特定する
ことを特徴とする請求項６に記載のリスク対策解析システム。

【請求項8】

上記リスク予測部は、上記特徴ベクトル算出部により算出された特徴ベクトルと予測トピックとを学習済みのリスク予測モデルに入力し、上記予測対象物に関して上記予測トピックに応じたリスクレベルを予測し、
上記リスク予測モデルは、上記特徴ベクトルと上記予測トピックとが入力された際にそれらに応じたリスクレベルを出力するように、教師データを用いた機械学習処理により生成されている
ことを特徴とする請求項２に記載のリスク対策解析システム。

【請求項9】

解析対象データを解析することによって得られる解析対象の特徴を表す特徴ベクトルを入力して予測対象物に関するリスクレベルを出力するように学習済みのリスク予測モデルに適用された特徴ベクトル、および、リスク予測モデルから出力されたリスクレベルを取得するリスク情報取得部と、
上記リスク情報取得部により取得された特徴ベクトルと探索用ベクトルとを用いて所定の演算を行った結果として得られる演算後ベクトルを上記リスク予測モデルに対して入力し、その結果得られるリスクレベルが、上記リスク情報取得部により取得されたリスクレベルよりも小さくなるという条件を満たす探索用ベクトルを探索し、上記条件を満たす探索用ベクトルと上記特徴ベクトルとに基づいて演算されるベクトルをリスク低減ベクトルとして特定するリスク低減ベクトル特定部と、
複数の上記解析対象データを解析することによって得られる複数の特徴ベクトルの中から、上記リスク低減ベクトルと同一の特徴ベクトルおよび近似する特徴ベクトルを特定し、特定した特徴ベクトルに対応する解析対象データを用いて、当該解析対象データまたは当該解析対象データに含まれる文章または単語をリスク対策に関する情報として生成する対策情報生成部とを備えた
ことを特徴とするリスク対策解析システム。

【請求項10】

予測対象物について起こり得るリスクとそれに対する対策とをコンピュータによって解析する方法であって、
上記コンピュータの特徴ベクトル算出部が、解析対象データを解析し、解析対象の特徴を表す特徴ベクトルを算出する第１のステップと、
上記コンピュータのリスク予測部が、上記特徴ベクトル算出部により算出された特徴ベクトルを、上記特徴ベクトルが入力された際に上記予測対象物に関するリスクレベルを出力するように教師データを用いて機械学習済みのリスク予測モデルに入力し、上記予測対象物に関するリスクレベルを予測する第２のステップと、
上記コンピュータのリスク低減ベクトル特定部が、上記特徴ベクトル算出部により算出された特徴ベクトルと探索用ベクトルとを用いて所定の演算を行った結果として得られる演算後ベクトルを上記リスク予測モデルに対して入力し、その結果得られるリスクレベルが、上記特徴ベクトルを上記リスク予測モデルに入力した場合に得られるリスクレベルよりも小さくという条件を満たす探索用ベクトルを探索し、上記条件を満たす探索用ベクトルと上記特徴ベクトルとに基づいて演算されるベクトルをリスク低減ベクトルとして特定する第３のステップと、
上記コンピュータの対策情報生成部が、複数の上記解析対象データについて上記特徴ベクトル算出部により算出される複数の特徴ベクトルの中から、上記リスク低減ベクトルと同一の特徴ベクトルおよび近似する特徴ベクトルを特定し、特定した特徴ベクトルに対応する解析対象データを用いて、当該解析対象データまたは当該解析対象データに含まれる文章または単語をリスク対策に関する情報として生成する第４のステップとを有することを特徴とするリスク対策解析方法。

【請求項11】

予測対象物について起こり得るリスクとそれに対する対策とを解析するようにコンピュータを機能させるためのプログラムであって、
解析対象データを解析し、解析対象の特徴を表す特徴ベクトルを算出する特徴ベクトル算出手段、
上記特徴ベクトル算出手段により算出された特徴ベクトルを、上記特徴ベクトルが入力された際に上記予測対象物に関するリスクレベルを出力するように教師データを用いて機械学習済みのリスク予測モデルに入力し、上記予測対象物に関するリスクレベルを予測するリスク予測手段、
上記特徴ベクトル算出手段により算出された特徴ベクトルと探索用ベクトルとを用いて所定の演算を行った結果として得られる演算後ベクトルを上記リスク予測モデルに対して入力し、その結果得られるリスクレベルが、上記特徴ベクトルを上記リスク予測モデルに入力した場合に得られるリスクレベルよりも小さくなるという条件を満たす探索用ベクトルを探索し、上記条件を満たす探索用ベクトルと上記特徴ベクトルとに基づいて演算されるベクトルをリスク低減ベクトルとして特定するリスク低減ベクトル特定手段、および
複数の上記解析対象データについて上記特徴ベクトル算出手段により算出される複数の特徴ベクトルの中から、上記リスク低減ベクトルと同一の特徴ベクトルおよび近似する特徴ベクトルを特定し、特定した特徴ベクトルに対応する解析対象データを用いて、当該解析対象データまたは当該解析対象データに含まれる文章または単語を、上記リスク予測手段により予測されたリスクに対する対策に関する情報として生成する対策情報生成手段、
として上記コンピュータを機能させるためのリスク対策解析用プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、リスク対策解析システム、リスク対策解析方法およびリスク対策解析用プログラムに関し、特に、人や企業、環境、物などの対象物について起こり得るリスクとそれに対する対策とを解析するシステムに関するものである。

【背景技術】

【0002】

一般に、様々な産業分野においてリスク管理が行われている。リスク管理とは、予想されるリスクを特定（発見または認識）し、そのリスクが受容可能か否かを決定し、受容できない場合にリスク軽減またはリスク回避の対策を講じるという一連のプロセスをいう。また、リスクとは、人や企業、環境、物など（以下、これらをまとめて「対象物」という）に対して与える可能性のある悪い影響を意味する。

【0003】

従来、ある特定の事象に関してどのようなリスクが起こり得るかの予測をコンピュータによって行うシステムや、ある特定のリスクに対してどのような対策が有効であるかの予測をコンピュータによって行うシステムが知られている（例えば、特許文献１，２参照）。特許文献１には、患者が危険行動を起こすリスクを予測する技術が開示されている。特許文献２には、ベクトル演算によってリスクに対する対策案を立案する技術が開示されている。

【0004】

特許文献１に記載の行動予測装置では、患者の危険行動に関するインシデントレポートと紐付けられることによって危険行動が特定されたカルテ情報である既判断カルテ情報からあらかじめ抽出された、当該危険行動に関連する医療情報を記憶部に格納する。関係性評価部は、インシデントレポートが紐付けられていない未判断カルテ情報を取得して、記憶部に格納された危険行動に関連する医療情報をもとに、未判断カルテ情報と当該未判断カルテ情報に対応する患者が取り得る危険行動との関係性を評価する。予測部は、関係性評価部の評価結果に応じて、未判断カルテ情報に対応する患者の危険行動を予測する。

【0005】

特許文献２に記載の対策案立案支援システムでは、業務の状態を表す複数の指標を含む一般的業務指標ベクトルｆと、一般的業務指標ベクトルｆにおける解決すべき場合における対処方法を示す対策案を複数含む一般的対策案ベクトルｘと、課題を示す課題指標ベクトルｆ’とに基づいて、課題指標ベクトルｆ’と対策案ベクトルｘ’との対応関係を規定する課題指標－対策案マトリクスＭｍ’を作成する。そして、一般的対策案ベクトルｘから、マトリクスＭｍ’の列に存在する対策案を抜粋して、候補対策案ベクトルｘ’を選択する。

【0006】

近年、起こり得るリスクの予測や、リスクに対する有効な対策の解析を人工知能（ＡＩ）によって行うシステムの研究開発が盛んである。人工知能の１つとして機械学習がある。機械学習は、人間が行っている学習と同様の機能をコンピュータで実現しようとする技術のことである。最も広く普及している教師あり学習は、正解付きの多数の教師データを用いて学習を行うことにより分類モデルを生成し、生成した分類モデルをもとに予測対象のデータを分類するというものである。何を教師データとして用いるかは多様であるが、文書データを教師データとして用いて機械学習を行うシステムが古くから知られている。

【先行技術文献】

【特許文献】

【0007】

【文献】特許第５９７７８９８号公報

【文献】特開２００７－２４２０６３号公報

【発明の概要】

【発明が解決しようとする課題】

【0008】

機械学習を用いた従来のリスク予測システムは、ある特定の事象に関して実際に発生した問題や不具合、事故、障害、疾病などについて記述した複数のレポート情報を解析することによって予測モデルを生成し、特定の対象物について起こり得るリスクを予測モデルにより予測するものが殆どである。また、機械学習を用いた従来のリスク対策解析システムは、ある特定のリスクに関して実際に行われた対策とその結果について記述した複数のレポート情報を解析することによって予測モデルを生成し、ある特定のリスクに対してどのような対策が有効であるかを予測モデルにより予測するものが殆どである。

【0009】

しかしながら、従来のリスク予測システムでは、特定の対象物についてリスクを予測することはできても、予測されたリスクに対してどのような対策が有効であるかまでは予測することができないという問題があった。また、従来のリスク対策解析システムでは、特定のリスクに対してある程度の有効な対策を予測することはできるものの、そのリスクが特定の対象物との関係で実際に発生する可能性については考慮されていないため、予測された対策が特定の対象物にとって実際に有効なものとは限らないという問題があった。

【0010】

本発明は、このような問題を解決するために成されたものであり、特定の対象物に関して発生する可能性があると予測されたリスクについて、そのリスク対応として実際に有効である可能性のある対策を予測して提供することができるようにすることを目的とする。

【課題を解決するための手段】

【0011】

上記した課題を解決するために、本発明では、解析対象データを解析することにより、解析対象の特徴を表す特徴ベクトルを算出し、当該算出された特徴ベクトルを学習済みのリスク予測モデルに入力し、予測対象物に関するリスクレベルを予測する。さらに、本発明では、リスクレベルを予測する際に算出された特徴ベクトルと探索用ベクトルとを用いて所定の演算を行った結果として得られる演算後ベクトルをリスク予測モデルに対して入力し、その結果得られるリスクレベルが、特徴ベクトルから予測されたリスクレベルよりも小さくなるという条件を満たす探索用ベクトルを探索し、当該条件を満たす探索用ベクトルと特徴ベクトルとに基づいて演算されるベクトルをリスク低減ベクトルとして特定する。そして、複数の解析対象データについて算出される複数の特徴ベクトルの中から、リスク低減ベクトルと同一の特徴ベクトルおよび近似する特徴ベクトルを特定し、特定した特徴ベクトルに対応する解析対象データを用いて、当該解析対象データまたは当該解析対象データに含まれる文章または単語をリスク対策に関する情報として生成するようにしている。

【発明の効果】

【0012】

上記のように構成した本発明によれば、解析対象データを解析することによって得られる特徴ベクトルからリスクレベルが予測され、さらに、その特徴ベクトルと共に所定の演算を行ったときにリスクレベルが低減するような探索用ベクトルが探索されて、当該探索用ベクトルと特徴ベクトルとに基づいて演算されるリスク低減ベクトルと同一または近似する特徴ベクトルに対応する解析対象データを用いて、リスク対策に関する情報が生成される。このため、予測対象物についてリスクレベルを予測するだけでなく、そのリスクレベルを低減し得る対策まで予測することができる。本発明によれば、特定の予測対象物について実際にリスクレベルが予測されたリスクについて、リスクレベルが低減するような対策が予測されるので、予測された対策が特定の予測対象物にとって実際に有効なものである可能性が高くなる。以上により、本発明によれば、特定の対象物に関して発生する可能性があると予測されたリスクについて、そのリスク対応として実際に有効である可能性のある対策を予測し、対策に関する情報として提供することができる。

【図面の簡単な説明】

【0013】

【図1】第１の実施形態によるリスク対策解析システムの機能構成例を示すブロック図である。

【図2】第１の実施形態によるリスク低減ベクトル特定部の処理内容を説明するための図である。

【図3】リスク予測モデルを生成する予測モデル生成装置の機能構成例を示すブロック図である。

【図4】文章指標値群から成る特徴ベクトルを説明するための図である。

【図5】第１の実施形態による特徴ベクトル算出部の具体的な機能構成例を示すブロック図である。

【図6】第１の実施形態によるリスク対策解析システムの動作例を示すフローチャートである。

【図7】第２の実施形態によるリスク対策解析システムの機能構成例を示すブロック図である。

【図8】探索トピックに応じて特定される探索範囲内の探索用ベクトルおよびリスク低減ベクトルを模式的に示す図である。

【図9】第２の実施形態によるリスク対策解析システムの他の機能構成例を示すブロック図である。

【図10】第２の実施形態によるリスク対策解析システムの他の機能構成例を示すブロック図である。

【発明を実施するための形態】

【0014】

（第１の実施形態）
以下、本発明の第１の実施形態を図面に基づいて説明する。図１は、第１の実施形態によるリスク対策解析システムの機能構成例を示すブロック図である。図１に示すように、第１の実施形態によるリスク対策解析システムは、その機能構成として、特徴ベクトル算出部１１、リスク予測部１２、リスク低減ベクトル特定部１３および対策情報生成部１４を備えている。また、第１の実施形態によるリスク対策解析システムは、記憶媒体として、リスク予測モデル記憶部２１および解析対象データ記憶部２２を備えている。

【0015】

上記各機能ブロック１１～１４は、ハードウェア、ＤＳＰ（Digital Signal Processor）、ソフトウェアの何れによっても構成することが可能である。例えばソフトウェアによって構成する場合、上記各機能ブロック１１～１４は、実際にはコンピュータのＣＰＵ、ＲＡＭ、ＲＯＭなどを備えて構成され、ＲＡＭやＲＯＭ、ハードディスクまたは半導体メモリ等の記憶媒体に記憶されたプログラムが動作することによって実現される。

【0016】

上記各機能ブロック１１～１４および各記憶媒体２１～２２は、これらの全てを１つの装置が備える構成としてもよいし、複数の装置に分散して設ける構成としてもよい。例えば、各機能ブロック１１～１４を１つの演算装置が備えるとともに、各記憶媒体２１～２２を当該演算装置とは異なるサーバ装置またはストレージ装置が備え、演算装置とサーバ装置またはストレージ装置とを通信ネットワークを介して接続する構成とすることが可能である。また、特徴ベクトル算出部１１およびリスク予測部１２を第１の演算装置が備え、リスク低減ベクトル特定部１３および対策情報生成部１４を第２の演算装置が備える構成としてもよい。

【0017】

第１の演算装置と第２の演算装置とに分ける場合、第２の演算装置は、第１の演算装置で算出された特徴ベクトル（後述する学習済みのリスク予測モデルに適用された特徴ベクトル）と、その特徴ベクトルを入力したリスク予測モデルから出力されたリスクレベルとを取得するリスク情報取得部を備える。そして、第２の演算装置のリスク低減ベクトル特定部１３および対策情報生成部１４は、リスク情報取得部により取得された特徴ベクトルとリスクレベルとを用いて後述する処理を実行する。

【0018】

特徴ベクトル算出部１１は、解析対象データを解析し、解析対象の特徴を表す特徴ベクトルを算出する。解析対象データは、複数の特徴量から成る特徴ベクトル（特徴行列と言ってもよい）を算出可能なデータであればよく、例えば文書データ、画像データ、音声データなどである。本実施形態のリスク対策解析システムは、人や企業、環境、物などの対象物について起こり得るリスクとそれに対する対策とを解析するものであるので、解析対象データとしては、何らかのリスクに関連する内容を有するものを用いる。

【0019】

例えば、人が特定の病気にかかるリスク（疾病罹患リスク）、患者が特定の危険行動をするリスク（危険行動リスク）などを解析する場合に、電子カルテやインシデントレポート、アンケート回答などの文書データを解析対象データとして用いることが可能である。また、同様に疾病罹患リスクまたは危険行動リスクなどを解析する場合に、身体の外部または内部を撮影した画像データ、患者と医師との対話を録音した音声データ、位置測定装置などで検出される入院患者の移動軌跡を表した移動軌跡データ、人の日時の行動内容をレポート形式等で記録した行動履歴データなどを解析対象データとして用いることが可能である。また、システム障害の発生可能性の有無を解析する場合に、システムの監視または検査の結果を記述したレポートに関する文書データなどを解析対象データとして用いることが可能である。

【0020】

また、企業が行う事業に潜むリスクを解析する際に、事業計画書や事業報告書などの文書データ、企業の財務諸表および市場の株価や円相場などの値動きを表す数値データ、労働人口や技術動向、特許取得動向などを表す各種統計データなどを解析対象データとして用いることも可能である。さらに、特定の工事を行う際に発生し得る事故や怪我などのリスクを解析する際に、工事計画書や工事報告書などの文書データ、工事対象物を撮影した画像データ、工事現場で録音した音声データ、工事対象物に設置したセンサにより検出される測定データなどを解析対象データとして用いることも可能である。ここに挙げたものは一例であり、これ以外のデータを解析対象データとして用いることも可能である。

【0021】

以下では一例として、電子カルテやインシデントレポートなどの文書データを解析対象データとして用いて、人が特定の病気にかかるリスク（疾病罹患リスク）を解析する場合について説明する。解析対象データとして文書データを用いる場合、解析対象の特徴とは、文書の特徴を意味する。文書の特徴とは、例えば、その文書内に含まれる文章の特徴や、その文書内に含まれる単語の特徴である。特徴ベクトル算出部１１は、一例として、文章および単語の少なくとも一方に関して複数の特徴要素を解析対象の文書データから算出することにより、それら複数の特徴要素を含む特徴ベクトルを算出する。なお、この特徴ベクトルの具体的な算出例については後述する。

【0022】

リスク予測部１２は、特徴ベクトル算出部１１により算出された特徴ベクトルを、学習済みのリスク予測モデルに入力し、予測対象物に関するリスクレベルを予測する。リスク予測モデルは、リスクが実際に発生（顕在化）したか否かの正解ラベルを有する複数の解析対象データを教師データとして用いて機械学習を行うことによってあらかじめ生成されたものであり、リスク予測モデル記憶部２１に記憶されている。このリスク予測モデルは、特徴ベクトルが入力された際に、予測対象物に関するリスクレベルを出力するように、教師データを用いた機械学習処理により生成されている。リスクレベルとは、リスクが発生する可能性（ここでは、特定の病気にかかる可能性）の程度を表す値であり、例えば０以上１以下のスコア値である。

【0023】

ここで、リスクレベルが所定の閾値より大きい場合は疾病罹患の「可能性あり」、リスクレベルが閾値以下の場合は疾病罹患の「可能性なし」などと２つのタイプに分類することが可能である。また、リスクレベルが第１の閾値より大きい場合は疾病罹患の「可能性大」、リスクレベルが第１の閾値以下かつ第２の閾値より大きい場合は疾病罹患の「可能性中」、リスクレベルが第２の閾値以下の場合は疾病罹患の「可能性小」などと３つのタイプに分類することも可能である。もちろん、疾病罹患の可能性について４つ以上のタイプに分類することも可能である。なお、リスク予測モデルの具体的な生成例については後述する。

【0024】

リスク低減ベクトル特定部１３は、特徴ベクトル算出部１１により算出された特徴ベクトルと探索用ベクトルとを用いて所定の演算を行った結果として得られる演算後ベクトルをリスク予測モデルに対して入力し、その結果得られるリスクレベルが、特徴ベクトルをリスク予測モデルに入力した場合に得られるリスクレベル（すなわち、リスク予測部１２により予測されたリスクレベル）よりも小さくなるという条件を満たす探索用ベクトルを探索する。そして、探索された探索用ベクトル（条件を満たす探索用ベクトル）と特徴ベクトルとに基づいて演算されるベクトルをリスク低減ベクトルとして特定する。

【0025】

図２は、このリスク低減ベクトル特定部１３の処理内容を説明するための図であり、特徴ベクトルＶｆ、探索用ベクトルＶｓ、リスク低減ベクトルＶｒ－を模式的に示している。リスク低減ベクトル特定部１３は、探索用ベクトルＶｓをランダムに生成し、特徴ベクトル算出部１１により算出された特徴ベクトルＶｆに対して探索用ベクトルＶｓを加算する（Ｖ＝Ｖｆ＋Ｖｓ）。次いで、リスク低減ベクトル特定部１３は、この加算（所定の演算に相当）を行った結果として得られる演算後ベクトルＶ（＝Ｖｆ＋Ｖｓ）を、リスク予測モデル記憶部２１に記憶されているリスク予測モデルに対して入力することにより、リスクレベル（以下、これを「探索リスクレベル」という）を算出する。

【0026】

そして、リスク低減ベクトル特定部１３は、以上のようにして演算後ベクトルＶから算出した探索リスクレベルが、特徴ベクトルＶｆをリスク予測モデルに入力した場合に得られるリスクレベル（リスク予測部１２から出力されるリスクレベル。以下、これを「予測リスクレベルという）よりも小さくなるか否かを判定する。ここで、探索リスクレベルが予測リスクレベルより小さくならないと判定した場合は、探索用ベクトルＶｓの内容を変えて以上と同様の処理を行う。一方、探索リスクレベルが予測リスクレベルより小さくなる場合は、そのときの演算後ベクトルＶをリスク低減ベクトルＶｒ－とする（図２（ａ）の例）。

【0027】

なお、探索リスクレベルが予測リスクレベルより小さくなるという条件を満たす探索用ベクトルＶｓは、１つのみとは限らない。そこで、リスク低減ベクトル特定部１３は、ある探索用ベクトルＶｓについて算出した探索リスクレベルが予測リスクレベルより小さくなる場合でも、探索用ベクトルＶｓの内容を変えて探索リスクレベルを算出する。そして、予測リスクレベルより小さくなる探索リスクレベルの中で最小のものを特定し、当該最小の探索リスクレベルが算出されたときの演算後ベクトルＶをリスク低減ベクトルＶｒ－とするようにしてよい。

【0028】

探索リスクレベルが最小となる探索用ベクトルＶｓを探索する際に、公知の確率的勾配降下法などを適用することにより、探索リスクレベルが小さくなると予想される範囲に限定して探索を行うようにしてもよい。あるいは、所定の収束条件を設定し、収束条件を満たすまで探索用ベクトルＶｓを変えて探索リスクレベルを順次算出し、収束条件を満たして探索を終了した時点で最小の探索リスクレベルが算出されたときの演算後ベクトルＶをリスク低減ベクトルＶｒ－とするようにしてもよい。

【0029】

リスク低減ベクトル特定部１３は、上記の条件を満たす探索用ベクトルＶｓ（探索リスクレベルが最小となるもの）と特徴ベクトルＶｆとに基づいて以下のように演算されるベクトルＶ’をリスク低減ベクトルＶｒ－とするようにしてもよい（図２（ｂ）の例）。
Ｖ’＝Ｖｆ＋（１－Ｔ）＊Ｖｓ（Ｔは０≦Ｔ＜１の任意の値）
ここで、パラメータＴの値は、コンピュータがランダムに１つを選択するようにしてもよいし、ランダムに複数を選択するようにしてもよい。あるいは、ユーザが任意にパラメータＴの値を指定できるようにしてもよい。

【0030】

リスク低減ベクトル特定部１３は、例えば、疾病罹患の「可能性あり」または「可能性大」と分類された特徴ベクトルＶｆについて、以上のような演算によってリスク低減ベクトルＶｒ－を算出する。なお、図２（ｂ）のようにリスク低減ベクトルＶｒ－を算出する場合において、Ｔの値を大きくすると、ベクトルＶ’は、「リスクあり」と予測された特徴ベクトルＶｆに近いものとなる。従って、Ｔの値を大きくし過ぎないようにするのが好ましい。例えば、Ｔの値は０≦Ｔ≦０．５とするようにしてもよい。

【0031】

対策情報生成部１４は、複数の解析対象データについて特徴ベクトル算出部１１により算出される複数の特徴ベクトルの中から、リスク低減ベクトルＶｒ－と同一または近似する特徴ベクトルＶｆ’を特定し、特定した特徴ベクトルＶｆ’に対応する解析対象データを用いて、リスク対策に関する情報を生成する。複数の解析対象データ（文書データ）と、当該複数の文書データについて特徴ベクトル算出部１１により算出された複数の特徴ベクトルとが紐付けられて、解析対象データ記憶部２２にあらかじめ記憶されている。対策情報生成部１４は、この解析対象データ記憶部２２に記憶されているデータを用いて、リスク対策に関する情報を生成する。

【0032】

ここで、リスク低減ベクトルＶｒ－と近似する特徴ベクトルＶｆ’は、任意に定義することが可能である。例えば、リスク低減ベクトルＶｒ－との内積値が所定値以上となる特徴ベクトルを、リスク低減ベクトルＶｒ－と近似する特徴ベクトルＶｆ’とすることが可能である。このような定義に該当する特徴ベクトルが複数ある場合に、それらの全てを特徴ベクトルＶｆ’として特定するようにしてもよいし、その中でリスク低減ベクトルＶｒ－に最も近いもの（内積値が最も大きいもの）だけ、または、リスク低減ベクトルＶｒ－に最も近い方から順に所定個を特徴ベクトルＶｆ’として特定するようにしてもよい。

【0033】

リスク対策に関する情報は、例えば、特定した特徴ベクトルＶｆ’に紐付けられた文書データに含まれている文章または単語である。あるいは、特定した特徴ベクトルＶｆ’に紐付けられた文書データそのものをリスク対策に関する情報としてもよい。リスク低減ベクトルＶｒ－と同一または近似する特徴ベクトルＶｆ’は、疾病罹患の「可能性あり」または「可能性大」と分類された特徴ベクトルＶｆについて、リスクレベルを低減する方向性を示すものと言える。そして、特徴ベクトルＶｆ’に紐付けられた文書データには、リスクレベルを低減する方向性に関連する情報（文章や単語）が含まれていて、それが特徴ベクトルＶｆ’の算出に寄与している可能性があると言える。従って、特徴ベクトルＶｆ’に紐付けられた文書データに含まれている文章または単語は、リスク対策に関する情報として有用なものである可能性があると言える。

【0034】

なお、解析対象データが画像データ、音声データ、数値データ、統計データなどの場合についても、対策情報生成部１４は、複数の解析対象データについて算出された複数の特徴ベクトルのうち、リスク低減ベクトルＶｒ－と同一または近似する特徴ベクトルＶｆ’に対応する解析対象データを用いて、リスク対策に関する情報を生成する。これらの場合は、例えば、解析対象データそのものをリスク対策に関する情報としてもよい。この情報を得たユーザは、リスクの予測に使用した解析対象データと、対策情報生成部１４により対策に関する情報として生成された解析対象データとを比較して差異を把握するなどにより、対策情報生成部１４により生成された解析対象データに近づけるために有効な対策を講じるためのヒントを得ることも可能である。

【0035】

図３は、リスク予測モデル記憶部２１に記憶させるリスク予測モデルを生成する予測モデル生成装置の機能構成例を示すブロック図である。図３に示す予測モデル生成装置は、その機能構成として、単語抽出部１０１、ベクトル算出部１０２および指標値算出部１０３を含む特徴ベクトル算出部１００と、リスク予測モデル生成部１０４とを備えて構成されている。ベクトル算出部１０２は、より具体的な機能構成として、文章ベクトル算出部１０２Ａおよび単語ベクトル算出部１０２Ｂを備えている。この予測モデル生成装置は、本実施形態のリスク対策解析システムが備えてもよいし、他の装置として備えるようにしてもよい。

【0036】

上記各機能ブロック１０１～１０４は、ハードウェア、ＤＳＰ、ソフトウェアの何れによっても構成することが可能である。例えばソフトウェアによって構成する場合、上記各機能ブロック１０１～１０４は、実際にはコンピュータのＣＰＵ、ＲＡＭ、ＲＯＭなどを備えて構成され、ＲＡＭやＲＯＭ、ハードディスクまたは半導体メモリ等の記憶媒体に記憶されたプログラムが動作することによって実現される。

【0037】

特徴ベクトル算出部１００は、予測する対象期間内においてリスクが実際に発生したか否か（実際に病気にかかったか否か）の正解ラベルを有する複数の文書データ（例えば、複数の患者に関する電子カルテ）を教師データとして入力する。なお、１つの文書データは、１つの文章（句点によって区切られる単位）から成るものであってもよいし、複数の文章を含むものであってもよい。

【0038】

単語抽出部１０１は、複数の文書データに含まれるｍ個（ｍは２以上の任意の整数）の文章を解析し、当該ｍ個の文章からｎ個（ｎは２以上の任意の整数）の単語を抽出する。文章の解析方法としては、例えば、公知の形態素解析を用いることが可能である。ここで、単語抽出部１０１は、形態素解析によって分割される全ての品詞の形態素を単語として抽出するようにしてもよいし、特定の品詞の形態素のみを単語として抽出するようにしてもよい。

【0039】

なお、１つの文書データの中に複数の文章が含まれている場合に、その中の全部の文章を解析対象としてもよいし、一部の文章を解析対象としてもよい。１つの文書データに含まれる一部の文章を教師データとして使用する場合、特徴ベクトル算出部１００は、文書データの中のどの部分の文章を教師データとして使用するのかを設定した状態で、文書データを入力する。例えば、複数の記載項目が存在する電子カルテの中で、特定の記載項目に関する文章を教師データとして使用するように設定することが考えられる。この設定は、ユーザによる操作を通じて行うことが可能である。

【0040】

なお、ｍ個の文章の中には、同じ単語が複数含まれていることがある。この場合、単語抽出部１０１は、同じ単語を複数個抽出することはせず、１つのみ抽出する。すなわち、単語抽出部１０１が抽出するｎ個の単語とは、ｎ種類の単語という意味である。ここで、単語抽出部１０１は、ｍ個の文章から同じ単語が抽出される頻度を計測し、出現頻度が大きい方からｎ個（ｎ種類）の単語、あるいは出現頻度が閾値以上であるｎ個（ｎ種類）の単語を抽出するようにしてもよい。

【0041】

ベクトル算出部１０２は、ｍ個の文章およびｎ個の単語から、ｍ個の文章ベクトルおよびｎ個の単語ベクトルを算出する。ここで、文章ベクトル算出部１０２Ａは、単語抽出部１０１による解析対象とされたｍ個の文章をそれぞれ所定のルールに従ってｑ次元にベクトル化することにより、ｑ個（ｑは２以上の任意の整数）の軸成分から成るｍ個の文章ベクトルを算出する。また、単語ベクトル算出部１０２Ｂは、単語抽出部１０１により抽出されたｎ個の単語をそれぞれ所定のルールに従ってｑ次元にベクトル化することにより、ｑ個の軸成分から成るｎ個の単語ベクトルを算出する。

【0042】

ベクトル算出部１０２は、一例として、以下のようにして文章ベクトルおよび単語ベクトルを算出する。今、ｍ個の文章とｎ個の単語とから成る集合Ｓ＝＜ｄ∈Ｄ，ｗ∈Ｗ＞を考える。ここで、各文章ｄ_ｉ（ｉ＝１，２，・・・，ｍ）および各単語ｗ_ｊ（ｊ＝１，２，・・・，ｎ）に対してそれぞれ文章ベクトルｄ_ｉ→および単語ベクトルｗ_ｊ→（以下では、記号“→”はベクトルであることを指すものとする）を関連付ける。そして、任意の単語ｗ_ｊと任意の文章ｄ_ｉに対して、次の式(1)に示す確率Ｐ（ｗ_ｊ｜ｄ_ｉ）を計算する。

【0043】

【数1】

【0044】

この確率Ｐ（ｗ_ｊ｜ｄ_ｉ）は、例えば、文章や文書をパラグラフ・ベクトルにより評価することについて記述した論文「“Distributed Representations of Sentences and Documents”by Quoc Le and Tomas Mikolov, Google Inc, Proceedings of the 31st International Conference on Machine Learning Held in Bejing, China on 22-24 June 2014」に開示されている確率ｐに倣って算出することが可能な値である。この論文には、例えば、“the”、“cat”、“sat”という３つの単語があるときに、４つ目の単語として“on”を予測するとあり、その予測確率ｐの算出式が掲載されている。当該論文に記載されている確率ｐ（wt｜wt-k,・・・,wt+k）は、複数の単語wt-k,・・・,wt+kから別の１つの単語wtを予測したときの正解確率である。

【0045】

これに対し、本実施形態で用いる式(1)に示される確率Ｐ（ｗ_ｊ｜ｄ_ｉ）は、ｍ個の文章のうち一の文章ｄ_ｉから、ｎ個の単語のうち一の単語ｗ_ｊが予想される正解確率を表している。１つの文章ｄ_ｉから１つの単語ｗ_ｊを予測するというのは、具体的には、ある文章ｄ_ｉが出現したときに、その中に単語ｗ_ｊが含まれる可能性を予測するということである。

【0046】

式(1)では、ｅを底とし、単語ベクトルｗ→と文章ベクトルｄ→との内積値を指数とする指数関数値を用いる。そして、予測対象とする文章ｄ_ｉと単語ｗ_ｊとの組み合わせから計算される指数関数値と、文章ｄ_ｉとｎ個の単語ｗ_ｋ（ｋ＝１，２，・・・，ｎ）との各組み合わせから計算されるｎ個の指数関数値の合計値との比率を、一の文章ｄ_ｉから一の単語ｗ_ｊが予想される正解確率として計算している。

【0047】

ここで、単語ベクトルｗ_ｊ→と文章ベクトルｄ_ｉ→との内積値は、単語ベクトルｗ_ｊ→を文章ベクトルｄ_ｉ→の方向に投影した場合のスカラ値、つまり、単語ベクトルｗ_ｊ→が有している文章ベクトルｄ_ｉ→の方向の成分値とも言える。これは、単語ｗ_ｊが文章ｄ_ｉに寄与している程度を表していると考えることができる。したがって、このような内積を利用して計算される指数関数値を用いて、ｎ個の単語ｗ_ｋ（ｋ＝１，２，・・・，ｎ）について計算される指数関数値の合計に対する、１つの単語ｗ_ｊについて計算される指数関数値の比率を求めることは、１つの文章ｄ_ｉからｎ個の単語のうち１つの単語ｗ_ｊが予想される正解確率を求めることに相当する。

【0048】

式(1)はｄ_ｉとｗ_ｊについて対称なので、ｎ個の単語のうち一の単語ｗ_ｊから、ｍ個の文章のうち一の文章ｄ_ｉが予想される確率Ｐ（ｄ_ｉ｜ｗ_ｊ）を計算してもよい。１つの単語ｗ_ｊから１つの文章ｄ_ｉを予測するというのは、ある単語ｗ_ｊが出現したときに、それが文章ｄ_ｉの中に含まれる可能性を予測するということである。この場合、文章ベクトルｄ_ｉ→と単語ベクトルｗ_ｊ→との内積値は、文章ベクトルｄ_ｉ→を単語ベクトルｗ_ｊ→の方向に投影した場合のスカラ値、つまり、文章ベクトルｄ_ｉ→が有している単語ベクトルｗ_ｊ→の方向の成分値とも言える。これは、文章ｄ_ｉが単語ｗ_ｊに寄与している程度を表していると考えることができる。

【0049】

なお、ここでは、単語ベクトルｗ→と文章ベクトルｄ→との内積値を指数とする指数関数値を用いる計算例を示したが、指数関数値を用いることを必須とするものではない。単語ベクトルｗ→と文章ベクトルｄ→との内積値を利用した計算式であればよく、例えば、内積値そのものの比率により確率を求めるようにしてもよい。

【0050】

次に、ベクトル算出部１０２は、次の式(2)に示すように、上記式(1)により算出される確率Ｐ（ｗ_ｊ｜ｄ_ｉ）を全ての集合Ｓについて合計した値Ｌを最大化するような文章ベクトルｄ_ｉ→および単語ベクトルｗ_ｊ→を算出する。すなわち、文章ベクトル算出部１０２Ａおよび単語ベクトル算出部１０２Ｂは、上記式(1)により算出される確率Ｐ（ｗ_ｊ｜ｄ_ｉ）を、ｍ個の文章とｎ個の単語との全ての組み合わせについて算出し、それらを合計した値を目標変数Ｌとして、当該目標変数Ｌを最大化する文章ベクトルｄ_ｉ→および単語ベクトルｗ_ｊ→を算出する。

【0051】

【数2】

【0052】

ｍ個の文章とｎ個の単語との全ての組み合わせについて算出した確率Ｐ（ｗ_ｊ｜ｄ_ｉ）の合計値Ｌを最大化するというのは、ある文章ｄ_ｉ（ｉ＝１，２，・・・，ｍ）からある単語ｗ_ｊ（ｊ＝１，２，・・・，ｎ）が予想される正解確率を最大化するということである。つまり、ベクトル算出部１０２は、この正解確率が最大化するような文章ベクトルｄ_ｉ→および単語ベクトルｗ_ｊ→を算出するものと言える。

【0053】

上述したように、ベクトル算出部１０２は、ｍ個の文章ｄ_ｉをそれぞれｑ次元にベクトル化することにより、ｑ個の軸成分から成るｍ個の文章ベクトルｄ_ｉ→を算出するとともに、ｎ個の単語をそれぞれｑ次元にベクトル化することにより、ｑ個の軸成分から成るｎ個の単語ベクトルｗ_ｊ→を算出する。これは、ｑ個の軸方向を可変として、上述の目標変数Ｌが最大化するような文章ベクトルｄ_ｉ→および単語ベクトルｗ_ｊ→を算出することに相当する。

【0054】

指標値算出部１０３は、ベクトル算出部１０２により算出されたｍ個の文章ベクトルｄ_ｉ→とｎ個の単語ベクトルｗ_ｊ→との内積をそれぞれとることにより、ｍ個の文章ｄ_ｉおよびｎ個の単語ｗ_ｊ間の関係性を反映したｍ×ｎ個の類似性指標値を算出する。本実施形態では、指標値算出部１０３は、次の式(3)に示すように、ｍ個の文章ベクトルｄ_ｉ→の各ｑ個の軸成分（ｄ₁₁～ｄ_mq）を各要素とする文章行列Ｄと、ｎ個の単語ベクトルｗ_ｊ→の各ｑ個の軸成分（ｗ₁₁～ｗ_nq）を各要素とする単語行列Ｗとの積をとることにより、ｍ×ｎ個の類似性指標値を各要素とする指標値行列ＤＷを算出する。ここで、Ｗ^ｔは単語行列の転置行列である。

【0055】

【数3】

【0056】

このようにして算出された指標値行列ＤＷの各要素は、どの単語がどの文章に対してどの程度寄与しているのかを表したものと言える。例えば、１行２列の要素ｄｗ₁₂は、単語ｗ₂が文章ｄ₁に対してどの程度寄与しているのかを表した値である。これにより、指標値行列ＤＷの各行は文章の類似性を評価するものとして用いることが可能であり、各列は単語の類似性を評価するものとして用いることが可能である。

【0057】

指標値算出部１０３は、以上のように算出したｍ×ｎ個の類似性指標値を用いて、１つの文章ｄ_ｉ（ｉ＝１，２，・・・，ｍ）についてｎ個の類似性指標値ｄｗ_ｊ（ｊ＝１，２，・・・，ｎ）から成る文章指標値群を、文章ｄ_ｉの特徴ベクトルＶｆ_ｉとして特定する。図４は、文章指標値群から成る特徴ベクトルＶｆを説明するための図である。図４に示すように、文章指標値群とは、例えば１つ目の文章ｄ_１の場合、指標値行列ＤＷの１行目に含まれるｎ個の類似性指標値ｄｗ₁₁～ｄｗ_1nがこれに該当する。同様に、２つ目の文章ｄ₂の場合、指標値行列ＤＷの２行目に含まれるｎ個の類似性指標値ｄｗ₂₁～ｄｗ_2nがこれに該当する。以下、ｍ個目の文章ｄ_mに関する文章指標値群（ｎ個の類似性指標値ｄｗ_m1～ｄｗ_mn）まで同様である。このように、特徴ベクトル算出部１００は、複数の文書データから抽出したｍ個の文章ｄ_ｉについて、ｍ個の特徴ベクトルＶｆ_ｉを算出する。

【0058】

なお、指標値算出部１０３は、以上のようにして算出したｍ×ｎ個の類似性指標値を用いて、所定の次元圧縮処理を行うことにより、ｍ×ｋ個（ｋは１≦ｋ＜ｎを満たす任意の整数）の類似性指標値を算出し、１つの文章ｄ_ｉ（ｉ＝１，２，・・・，ｍ）についてｋ個の類似性指標値ｄｗ_ｊ（ｊ＝１，２，・・・，ｋ）から成る文章指標値群を、文章ｄ_ｉの特徴ベクトルＶｆ_ｉとして特定するようにしてもよい。次元圧縮処理は、例えば、行列を分解する方法として公知の特異値分解（singular value decomposition：ＳＶＤ）を用いることが可能である。

【0059】

すなわち、指標値算出部１０３は、上記式(3)のようにして算出された指標値行列ＤＷを、３つの行列Ｕ，Ｓ，Ｖに分解する。ここで、行列Ｕはｍ×ｋ次元の左特異行列で、各列はＤＷ＊ＤＷ^ｔの固有ベクトルである（ＤＷ^ｔは指標値行列ＤＷの転置行列を示す）。行列Ｓはｋ×ｋ次元の正方行列で、対角行列成分が指標値行列ＤＷの特異値を示し、それ以外の値が全て０となっている。行列Ｖはｋ×ｎ次元の右特異行列で、各行はＤＷ^ｔ＊ＤＷの固有ベクトルである。なお、圧縮後の次元ｋは、あらかじめ定めた固定の値としてもよいし、任意の値を指定可能としてもよい。

【0060】

指標値算出部１０３は、以上のようにして分解した３つの行列のうち、右特異行列Ｖの転置行列Ｖ^ｔによって指標値行列ＤＷを変換することにより、指標値行列ＤＷの次元を圧縮する。すなわち、ｍ×ｎ次元の指標値行列ＤＷと、ｎ×ｋ次元の右特異転置行列Ｖ^ｔとの内積を計算することにより、ｍ×ｎ次元の指標値行列ＤＷをｍ×ｋ次元の指標値行列ＤＷ_SVDに次元圧縮する（ＤＷ_SVD＝ＤＷ＊Ｖ^ｔ）。なお、ＤＷ_SVDは指標値行列ＤＷをＳＶＤにより次元圧縮した行列を示しており、ＤＷ≒Ｕ＊Ｓ＊Ｖ＝ＤＷ_SVD＊Ｖの関係が成り立つ。

【0061】

このように、ＳＶＤの手法を用いて指標値行列ＤＷの次元を圧縮することにより、指標値行列ＤＷで表現される特徴を可能な限り損ねること無く指標値行列ＤＷを低ランク近似することができる。なお、ここでは右特異行列Ｖの転置行列Ｖ^ｔによって指標値行列ＤＷを変換する例について説明したが、ｍの値とｎの値が一致する場合には、左特異行列Ｕによって指標値行列ＤＷを変換するようにしてもよい（ＤＷ_SVD＝ＤＷ＊Ｕ）。

【0062】

リスク予測モデル生成部１０４は、特徴ベクトル算出部１００により算出されたｍ個の特徴ベクトルＶｆ_ｉをもとに、特徴ベクトルＶｆから予測対象物に関するリスクレベルを算出するためのリスク予測モデルを生成する。すなわち、リスク予測モデル生成部１０４は、病気にかかったことが既知である患者の文書データ（例えば、「リスクあり」の正解ラベルが付与された文書データ）から抽出された文章をもとに算出される特徴ベクトルＶｆ_ｉ（ｉは１～ｍの何れか）が入力された場合にはリスクレベルが所定の閾値より大きくなり、病気にかからなかったことが既知である患者の文書データ（例えば、「リスクなし」の正解ラベルが付与された文書データ）から抽出された文章をもとに算出される特徴ベクトルＶｆ_ｉ（ｉは１～ｍの何れか）が入力された場合にはリスクレベルが閾値以下となるように調整されたリスク予測モデルを生成する。そして、リスク予測モデル生成部１０４は、生成したリスク予測モデルをリスク予測モデル記憶部２１に記憶させる。

【0063】

リスク予測モデル生成部１０４は、例えば、各文章ｄ_ｉの特徴ベクトルＶｆ_ｉを構成している文章指標値群についてそれぞれ特徴量を算出し、当該算出した特徴量の値に応じて、マルコフ連鎖モンテカルロ法による複数群分離の最適化を行うことにより、特徴ベクトルＶｆが「リスクあり」に分類される可能性の高さを示す値をリスクレベルとして算出するためのリスク予測モデルを生成する。すなわち、リスク予測モデル生成部１０４が生成するリスク予測モデルは、特徴ベクトルＶｆを入力として、「リスクあり」に該当する可能性を確率として出力する学習モデルである。なお、ここに挙げたリスク予測モデルの生成法は一例であり、これに限定されるものではない。また、学習モデルの形態は任意である。

【0064】

例えば、リスク予測モデル生成部１０４が生成するリスク予測モデルの形態は、回帰モデル（線形回帰、ロジスティック回帰、サポートベクターマシーンなどをベースとする学習モデル）、木モデル（決定木、回帰木、ランダムフォレスト、勾配ブースティング木などをベースとする学習モデル）、ニューラルネットワークモデル（パーセプトロン、畳み込みニューラルネットワーク、再起型ニューラルネットワーク、残差ネットワーク、ＲＢＦネットワーク、確率的ニューラルネットワーク、スパイキングニューラルネットワーク、複素ニューラルネットワークなどをベースとする学習モデル）、ベイズモデル（ベイズ推論などをベースとする学習モデル）、クラスタリングモデル（ｋ近傍法、階層型クラスタリング、非階層型クラスタリング、トピックモデルなどをベースとする学習モデル）などのうち何れかとすることが可能である。なお、ここに挙げた分類モデルは一例に過ぎず、これに限定されるものではない。

【0065】

図５は、図１に示した特徴ベクトル算出部１１の具体的な機能構成例を示すブロック図である。図５に示すように、特徴ベクトル算出部１１は、その具体的な機能構成として、単語抽出部１１１、ベクトル算出部１１２および指標値算出部１１３を備えている。ベクトル算出部１１２は、より具体的な機能構成として、文章ベクトル算出部１１２Ａおよび単語ベクトル算出部１１２Ｂを備えている。特徴ベクトル算出部１１の動作は、図３に示した特徴ベクトル算出部１００の動作と基本的には同様である。

【0066】

特徴ベクトル算出部１１は、解析対象とする１つ以上の文章を含む文書データを予測用データとして入力する。特徴ベクトル算出部１１が入力する文書データは、例えば、特定の病気に現時点ではかかっていない患者で、将来の所定期間以内に特定の病気になるリスクがあるか否かを予測したい患者の電子カルテ（文書データ）である。ここで、特徴ベクトル算出部１１は、文書データの中のどの部分の文章を解析対象として使用するのかを設定した状態で、文書データを入力してよい。なお、特徴ベクトル算出部１１は、文書データの中から指定された文章に関する文章データのみを入力するようにしてもよい。

【0067】

特徴ベクトル算出部１１が解析対象とする文章の数ｍ’は、特徴ベクトル算出部１００が解析対象とした文章の数ｍと必ずしも同数でなくてもよい。特徴ベクトル算出部１１が解析対象とする文章は、１つであってもよいし、複数であってもよい。ただし、指標値算出部１１３が文章から算出する類似性指標値は、どの単語がどの文章に対してどの程度寄与しているのか、どの文章がどの単語に対してどの程度寄与しているのかを表したものであるため、特徴ベクトル算出部１１が解析対象とする文章についても複数とするのが好ましい。例えば、ｍ’人の患者の電子カルテから１つずつ文章を抽出することが考えられる。あるいは、１人の患者のカルテから複数の文章を抽出して解析対象とするようにしてもよい。この場合は、１人の患者について複数の文章から複数の特徴ベクトルＶｆが特徴ベクトル算出部１１により算出され、それぞれの特徴ベクトルＶｆについてリスクレベルがリスク予測部１２により算出されることになる。

【0068】

特徴ベクトル算出部１１は、ｍ’個の文章データが予測用データとして入力された場合、そのｍ’個の文章データについて単語抽出部１１１、ベクトル算出部１１２および指標値算出部１１３の処理（それぞれの処理は、図３の単語抽出部１０１、ベクトル算出部１０２および指標値算出部１０３の処理と同様）を実行することにより、ｍ’個の文章指標値群（特徴ベクトルＶｆ）を得る。リスク予測部１２は、特徴ベクトル算出部１１により算出されたｍ’個の特徴ベクトルＶｆを１つずつリスク予測モデル記憶部２１のリスク予測モデルに入力することにより、ｍ’個の文章のそれぞれについてリスクレベルを算出する。

【0069】

ここで、単語抽出部１１１は、図３の単語抽出部１０１がｍ個の教師データから抽出したｎ個の単語と同じ単語をｍ’個の予測用データから抽出するのが好ましい。予測用データから抽出されるｎ個の単語から成る文章指標値群が、教師データから抽出されたｎ個の単語から成る文章指標値群と同じ単語を要素とするものとなるので、リスク予測モデル記憶部２１に記憶されたリスク予測モデルに対する適合度が高くなるからである。ただし、学習時と同じｎ個の単語を予測時にも抽出することを必須とするものではない。

【0070】

図６は、以上のように構成した第１の実施形態によるリスク対策解析システムの動作例を示すフローチャートである。まず、特徴ベクトル算出部１１は、１人以上の患者に関する電子カルテの中からｍ’個の文章を予測用データとして入力する（ステップＳ１）。特徴ベクトル算出部１１の単語抽出部１１１は、入力されたｍ’個の文章を解析し、当該ｍ’個の文章からｎ個の単語を抽出する（ステップＳ２）。次いで、ベクトル算出部１１２は、入力されたｍ’個の文章および単語抽出部１１１により抽出されたｎ個の単語から、ｍ’個の文章ベクトルｄ_ｉ→およびｎ個の単語ベクトルｗ_ｊ→を算出する（ステップＳ３）。

【0071】

そして、指標値算出部１１３は、ｍ’個の文章ベクトルｄ_ｉ→とｎ個の単語ベクトルｗ_ｊ→との内積をそれぞれとることにより、ｍ’個の文章ｄ_ｉおよびｎ個の単語ｗ_ｊ間の関係性を反映したｍ’×ｎ個の類似性指標値（ｍ’×ｎ個の類似性指標値を各要素とする指標値行列ＤＷ）を算出する（ステップＳ４）。さらに、指標値算出部１１３は、以上のように算出したｍ’×ｎ個の類似性指標値を用いて、１つの文章ｄ_ｉ（ｉ＝１，２，・・・，ｍ’）についてｎ個の類似性指標値ｄｗ_ｊ（ｊ＝１，２，・・・，ｎ）から成る文章指標値群を、文章ｄ_ｉの特徴ベクトルＶｆ_ｉとして特定する（ステップＳ５）。

【0072】

次いで、リスク予測部１２は、特徴ベクトル算出部１１により算出されたｍ’個の特徴ベクトルＶｆ_ｉを１つずつリスク予測モデル記憶部２１のリスク予測モデルに入力することにより、ｍ’個の文章のそれぞれについてリスクレベルを算出する（ステップＳ６）。そして、リスク低減ベクトル特定部１３は、例えば、リスク予測部１２により算出されたリスクレベルの中に所定の閾値より大きいもの（疾病罹患の「可能性あり」と分類されるもの）があるか否かを判定する（ステップＳ７）。

【0073】

ここで、所定の閾値より大きいリスクレベルが１つも存在しない場合、図６に示すフローチャートの処理は終了する。一方、所定の閾値より大きいリスクレベルが少なくとも１つ存在する場合、リスク低減ベクトル特定部１３は、その閾値より大きいリスクレベルが算出された特徴ベクトルＶｆについて、探索用ベクトルＶｓを用いてリスク低減ベクトルＶｒ－を算出する（ステップＳ８）。ここで、リスクレベルが所定の閾値より大きくなる特徴ベクトルＶｆが複数存在する場合は、そのそれぞれについてリスク低減ベクトルＶｒ－を算出する。

【0074】

次いで、対策情報生成部１４は、解析対象データ記憶部２２に記憶されている複数の特徴ベクトルの中から、リスク低減ベクトルＶｒ－と同一または近似する特徴ベクトルＶｆ’を特定し、特定した特徴ベクトルＶｆ’に対応する解析対象データを用いて、リスク対策に関する情報を生成する（ステップＳ９）。そして、対策情報生成部１４は、生成したリスク対策に関する情報を、例えばディスプレイ（図示せず）に表示することによってユーザに提示する（ステップＳ１０）。ここで、どの文章に対するリスク対策であるか、またはどの患者に対するリスク対策であるかを明示した状態で情報をユーザに提示するようにしてもよい。これにより、図６に示すフローチャートの処理が終了する。

【0075】

以上詳しく説明したように、第１の実施形態によれば、解析対象データ（例えば、電子カルテ等の文書データ）を解析することによって得られる特徴ベクトルＶｆからリスクレベルが予測される。さらに、その特徴ベクトルＶｆと共に所定の演算を行ったときにリスクレベルが低減するような探索用ベクトルＶｓが探索されて、当該探索用ベクトルＶｓと特徴ベクトルＶｆとに基づいて演算されるリスク低減ベクトルＶｒ－が特定され、それと同一または近似する特徴ベクトルＶｆ’に対応する解析対象データを用いて、リスク対策に関する情報が生成される。このため、予測対象物についてリスクレベルを予測するだけでなく、そのリスクレベルを低減し得る対策まで予測することができる。

【0076】

また、第１の実施形態によれば、特定の予測対象物（上記の例では患者）について実際にリスクレベルが予測された疾病罹患のリスクについて、リスクレベルが低減するような対策が予測されるので、予測された対策が特定の予測対象物にとって実際に有効なものである可能性が高くなる。以上により、第１の実施形態によれば、特定の対象物に関して発生する可能性があると予測されたリスクについて、そのリスク対応として実際に有効である可能性のある対策を予測し、対策に関する情報として提供することができる。

【0077】

（第２の実施形態）
次に、本発明の第２の実施形態を図面に基づいて説明する。図７は、第２の実施形態によるリスク対策解析システムの機能構成例を示すブロック図である。なお、この図７において、図１に示した符号と同一の符号を付したものは同一の機能を有するものであるので、ここでは重複する説明を省略する。

【0078】

図７に示すように、第２の実施形態によるリスク対策解析システムは、その機能構成として、リスク低減ベクトル特定部１３に代えてリスク低減ベクトル特定部１３’を備えるとともに、探索トピック指定部１５を更に備えている。また、記憶媒体として、対策予測モデル記憶部２３を更に備えている。

【0079】

リスク低減ベクトル特定部１３’は、特徴ベクトル算出部１１により算出された特徴ベクトルと、探索トピック指定部１５により指定された探索トピックとを学習済みの対策予測モデルに入力し、特徴ベクトルと探索トピックとに基づき特定される探索範囲に含まれる探索用ベクトルを用いてリスク低減ベクトルの探索を行う。すなわち、第２の実施形態では、リスク低減ベクトルを算出する際に使用する探索用ベクトルを、特徴ベクトルと探索トピックとに基づいて特定される探索範囲に含まれるものに限定する。探索範囲を限定することによって処理効率を上げると同時に、探索トピックに応じた適切なリスク低減ベクトルを算出できるようにすることが目的である。

【0080】

探索トピックは、予測されるリスクに対して採るべき対策の大まかなテーマを示すものであり、リスク低減ベクトルの探索条件とも言えるものである。例えば、特定の病気にかかるリスク（疾病罹患リスク）を予測してその対策に関する情報を提供するリスク対策解析システムを構成する場合において、探索トピックは、例えば運動関連の改善などを内容とする「活動量」、例えば食事関連の改善などを内容とする「食生活」、例えば睡眠関連の改善などを内容とする「生活習慣」などとすることが可能である。

【0081】

対策予測モデルは、どの探索トピックに該当するかが既知である複数の解析対象データから算出された複数の特徴ベクトルを教師データとして用いて機械学習を行うことによってあらかじめ生成されたものであり、対策予測モデル記憶部２３に記憶されている。探索トピックが既知であるというのは、解析対象データ（例えば、電子カルテ等の文書データ）の内容がどの探索トピックに関連するものであるかが既知であるということである。解析対象データと探索トピックとの関連付けは、人間が行ってもよいし、コンピュータが解析対象データの内容を解析して行ってもよい。例えば、解析対象データが文書データである場合、文書データ内に含まれる単語を解析し、多く含まれる単語がどの探索トピックに該当するものであるかによって、文書データに対応する探索トピックを自動的に特定するようにすることが可能である。

【0082】

対策予測モデル記憶部２３に記憶される対策予測モデルは、探索トピックと特徴ベクトルとが入力された際にそれらに応じた探索範囲を出力するように、教師データを用いた機械学習処理によって生成されている。すなわち、対策予測モデルは、探索トピックと特徴ベクトルとの組み合わせごとに、その特徴ベクトルからリスク予測モデルに基づいて予測されるリスクレベルを低減させることができる複数のリスク低減ベクトルを特定する際に用いた複数の探索用ベクトルが含まれる範囲を探索範囲として出力するように学習されたものである。

【0083】

ここで、対策予測モデルが出力する探索範囲は、例えば、探索リスクレベルが予測リスクレベルより小さくなるような探索用ベクトルのうち、探索リスクレベルが最小の方から順に所定個の探索用ベクトルが含まれる範囲として定義することが可能である。また、探索リスクレベルが予測リスクレベルより小さくなるような探索用ベクトルのうち、探索リスクレベルが最小となる探索用ベクトルとの内積値が所定値以上となるような探索用ベクトルが含まれる範囲を探索範囲とするようにしてもよい。

【0084】

なお、対策予測モデルは、探索トピックと特徴ベクトルとの組み合わせごとに、１つの探索用ベクトルを探索範囲として出力するものとしてもよい。例えば、リスクレベルを最も小さくできるリスク低減ベクトルを特定する際に用いた探索用ベクトルを探索範囲として出力するものとしてもよい。あるいは、上述した複数の探索用ベクトルを平均加算した１つのベクトルを探索範囲として出力するものとしてもよい。

【0085】

図８は、探索トピックに応じて特定される探索範囲内の探索用ベクトルＶｓ１～Ｖｓ３およびリスク低減ベクトルＶｒ－１～Ｖｒ－３を模式的に示す図である。図８では、１つの特徴ベクトルＶｆに対して３つの探索トピック（活動量、食生活、生活習慣）ごとに特定される探索範囲を示したものであり、１つの探索用ベクトルを探索範囲とする例を示している。対策予測モデル記憶部２３に記憶される対策予測モデルは、例えば、図８に示す特徴ベクトルＶｆと、探索トピック「活動量」を示す情報とが入力された際に、探索範囲として１つの探索用ベクトルＶｓ１を出力するように学習されている。

【0086】

なお、対策予測モデルに入力される特徴ベクトルが、図８に示す特徴ベクトルＶｆと完全に一致するものであるとは限らない。対策予測モデルは、このような場合でも適切に探索範囲を出力できるように学習されている。すなわち、対策予測モデルは、図８に示す特徴ベクトルＶｆに近似する特徴ベクトル（例えば、内積値が所定値以上の特徴ベクトル）と、探索トピック「活動量」を示す情報とが入力された場合には、特徴ベクトルＶｆが与えられた場合と同じ１つの探索用ベクトルＶｓ１を探索範囲として出力するように学習されている。

【0087】

図７に示す例において、探索範囲を特定するために使用する探索トピックは、探索トピック指定部１５により指定される。探索トピック指定部１５は、ユーザからの探索トピックに関する指定を受け付けて、探索トピックを指定する。例えば、リスク予測部１２により算出されたリスクレベルが所定値以上となって疾病罹患のリスクがあると予測された場合において、患者または医師が特定のトピックについて対策を講じたいと考えた場合などに、患者または医師が希望する探索トピックを指定することが可能である。

【0088】

リスク低減ベクトル特定部１３’は、探索トピック指定部１５により受け付けられた探索トピックと、特徴ベクトル算出部１１により算出された特徴ベクトルとを、対策予測モデル記憶部２３に記憶された学習済みの対策予測モデルに入力することにより、探索範囲を特定する。そして、特定した探索範囲に含まれる探索用ベクトルと、特徴ベクトル算出部１１により算出された特徴ベクトルとを用いて、第１の実施形態で説明したリスク低減ベクトル特定部１３と同様の処理によってリスク低減ベクトルを特定する。

【0089】

以上詳しく説明したように、第２の実施形態によれば、トピックによって変わる可能性のある最適なリスク低減ベクトルを、探索トピックを指定することによって、あらかじめ学習済みの対策予測モデルから予測される適切な探索範囲内から特定することができる。これにより、指定した探索トピックに応じて有効な対策に関する情報を得ることができる。また、探索用ベクトルの探索範囲を限定することにより、リスク低減ベクトルを特定する際の処理負荷を軽減し、処理時間の短縮を図ることができるというメリットも有する。

【0090】

なお、上記第２の実施形態では、探索トピックをユーザが指定する例について説明したが、本発明はこれに限定されない。例えば、図９に示すように、探索トピック指定部１５に代えて探索トピック特定部１６を備えるようにしてもよい。探索トピック特定部１６は、解析対象データを解析することによって探索トピックを特定する。例えば、解析対象データが文書データである場合、探索トピック特定部１６は、文書データ内に含まれる単語を解析し、多く含まれる単語がどの探索トピックに該当するものであるかによって、文書データに対応する探索トピックを特定する。なお、単語と探索トピックとをあらかじめ関連付けたテーブル情報などを用意し、探索トピック特定部１６はこのテーブル情報を参照することによって、文書データに対応する探索トピックを特定する。

【0091】

なお、ここに示した解析内容は一例であり、これに限定されるものではない。例えば、トピックが既知である複数の文書データまたはこれから算出される特徴ベクトルを教師データとして用いた機械学習によってトピック予測モデルを生成しておき、解析対象の文書データまたはこれから算出される特徴ベクトルをこのトピック予測モデルに入力することにより、探索トピックの特定を行うようにしてもよい。

【0092】

リスク低減ベクトル特定部１３’は、探索トピック特定部１６により特定された探索トピックと、特徴ベクトル算出部１１により算出された特徴ベクトルとを、対策予測モデル記憶部２３に記憶された学習済みの対策予測モデルに入力することにより、探索範囲を特定する。そして、特定した探索範囲に含まれる探索用ベクトルと、特徴ベクトル算出部１１により算出された特徴ベクトルとを用いて、第１の実施形態で説明したリスク低減ベクトル特定部１３と同様の処理によってリスク低減ベクトルを特定する。

【0093】

このように構成した場合、解析対象データから特徴ベクトル算出部１１およびリスク予測部１２により算出されたリスクレベルが所定値以上となって疾病罹患のリスクがあると予測された場合において、その解析対象データ自体から特定されるトピックについてリスク低減ベクトルを算出し、当該リスク低減ベクトルをもとに対策に関する情報を得ることができる。このため、特定のトピックに関連する解析対象データから予測されたリスクに対して、当該特定のトピックに関連する対策に関する情報を得ることができるため、リスクに対して親和性の高い、有効な対策情報を得ることができる。

【0094】

なお、リスク低減ベクトル特定部１３’は、探索トピック特定部１６により特定された探索トピックとは異なる探索トピックを学習済みの対策予測モデルに入力するようにしてもよい。このように構成した場合、解析対象データ自体から特定されるトピックとは異なるトピックについてリスク低減ベクトルを算出し、当該リスク低減ベクトルをもとに対策に関する情報を得ることができる。このため、特定のトピックに関連する解析対象データから予測されたリスクに対して、当該特定のトピック以外のトピックに関連する対策に関する情報を得ることができるため、既存の知見や経験則などから人間の判断では得にくい新たな対策情報を得ることが期待できる。

【0095】

また、上記第２の実施形態では、探索トピック指定部１５により指定された探索トピックまたは探索トピック特定部１６により特定された探索トピックについて特定される探索範囲の探索用ベクトルのみを用いてリスク低減ベクトルを算出するようにしたが、本発明はこれに限定されない。すなわち、探索トピックの指定および特定はせずに、複数の探索トピックに関連する探索範囲の探索用ベクトルを用いてリスク低減ベクトルを算出するようにしてもよい。

【0096】

一例として、リスク低減ベクトル特定部１３’は、複数の探索トピックごとに対策予測モデルにより特定される探索範囲に含まれる探索用ベクトルと、特徴ベクトル算出部１１により算出された特徴ベクトルとを用いて、複数の探索トピックごとに探索を行う。そして、複数の探索トピックについてそれぞれ探索された探索用ベクトルを重み付け加算したベクトルと、特徴ベクトル算出部１１により算出された特徴ベクトルとに基づいて演算されるベクトルをリスク低減ベクトルとして特定する。

【0097】

これを図８の例で説明する。ここでは、探索用ベクトルＶｓ１～Ｖｓ３は、複数の探索トピック（活動量、食生活、生活習慣）ごとに特定される探索範囲の中から、リスクレベルを低減することができるものとして探索された結果のベクトルであるものとする。リスク低減ベクトル特定部１３’は、これらの探索用ベクトルＶｓ１～Ｖｓ３を重み付け加算し、その加算結果のベクトルと、特徴ベクトル算出部１１により算出された特徴ベクトルＶｆとを加算することによってリスク低減ベクトルＶｒ－を特定する。

【0098】

ここで、各探索用ベクトルＶｓ１～Ｖｓ３に対する重み付けをどのようにして行うかについては、任意に定めることが可能である。例えば、特徴ベクトルＶｆと探索用ベクトルＶｓ１～Ｖｓ３との内積値をそれぞれ算出し、その内積値を利用して重みを設定する。この場合、各探索用ベクトルＶｓ１～Ｖｓ３に対する重みをｗ１，ｗ２，ｗ３とすると、リスク低減ベクトルＶｒ－は次に示す演算により算出することが可能である。
ｗ１＝exp（Ｖｆ，Ｖｓ１）／｛exp（Ｖｆ，Ｖｓ１）＋exp（Ｖｆ，Ｖｓ２）＋exp（Ｖｆ，Ｖｓ３）｝
ｗ２＝exp（Ｖｆ，Ｖｓ２）／｛exp（Ｖｆ，Ｖｓ１）＋exp（Ｖｆ，Ｖｓ２）＋exp（Ｖｆ，Ｖｓ３）｝
ｗ３＝exp（Ｖｆ，Ｖｓ３）／｛exp（Ｖｆ，Ｖｓ１）＋exp（Ｖｆ，Ｖｓ２）＋exp（Ｖｆ，Ｖｓ３）｝
Ｖｒ－＝Ｖｆ＋｛（ｗ１・Ｖｓ１）＋（ｗ２・Ｖｓ２）＋（ｗ３・Ｖｓ３）｝

【0099】

なお、ここでは各探索用ベクトルＶｓ１～Ｖｓ３を重み付け加算する例を示したが、各リスク低減ベクトルＶｒ－１～Ｖｒ－３を重み付け加算するようにしてもよい。これを図８の例で説明すると、リスク低減ベクトル特定部１３’は、３つの探索用ベクトルＶｓ１～Ｖｓ３と特徴ベクトルＶｆとをそれぞれ加算することによって３つのリスク低減ベクトルＶｒ－１～Ｖｒ－３を算出し、これらのリスク低減ベクトルＶｒ－１～Ｖｒ－３を重み付け加算することにより、リスク低減ベクトルＶｒ－を特定する。

【0100】

この場合における演算は次の通りである。
Ｖｒ－１＝Ｖｆ＋Ｖｓ１
Ｖｒ－２＝Ｖｆ＋Ｖｓ２
Ｖｒ－３＝Ｖｆ＋Ｖｓ３
Ｖｒ－＝（ｗ１・Ｖｒ－１）＋（ｗ２・Ｖｒ－２）＋（ｗ３・Ｖｒ－３）

【0101】

なお、リスク低減ベクトルＶｒ－１～Ｖｒ－３を用いることに代えて、以下に示すリスク低減ベクトルＶｒ－１’～Ｖｒ－３’を用いるようにしてもよい。
Ｖｒ－１’＝Ｖｆ＋（１－Ｔ）＊Ｖｓ１（Ｔは０≦Ｔ≦１の任意の値）
Ｖｒ－２’＝Ｖｆ＋（１－Ｔ）＊Ｖｓ２（Ｔは０≦Ｔ≦１の任意の値）
Ｖｒ－３’＝Ｖｆ＋（１－Ｔ）＊Ｖｓ３（Ｔは０≦Ｔ≦１の任意の値）

【0102】

また、上記第２の実施形態において、リスク低減ベクトル特定部１３’は、特定の探索トピックが入力された場合（探索トピック指定部１５により探索トピックが指定された場合、または探索トピック特定部１６により探索トピックが特定された場合）には、当該入力された探索トピックを学習済みの対策予測モデルに入力して特定される探索範囲に含まれる探索用ベクトルのみを用いてリスク低減ベクトルを特定する一方、特定の探索トピックが入力されていない場合には、複数の探索トピックごとに特定される探索範囲に含まれる探索用ベクトルを用いた重み付け加算によってリスク低減ベクトルを特定するようにしてもよい。

【0103】

また、上記第２の実施形態において、所定の予測トピック（探索トピック指定部１５と同様にユーザにより指定されるもの、探索トピック特定部１６と同様に解析対象データの解析により特定されるものの何れでもよい）をリスク予測部１２に入力し、予測トピックを考慮してリスクレベルの予測を行うようにしてもよい。図１０は、この場合の構成例を示す図である。

【0104】

図１０（ａ）において、予測トピック指定部１７は、ユーザからの予測トピックに関する指定を受け付けて、予測トピックを指定する。そして、指定した予測トピックをリスク予測部１２’に供給する。また、図１０（ｂ）において、予測トピック特定部１８は、解析対象データを解析することによって予測トピックを特定する。そして、特定した予測トピックをリスク予測部１２’に供給する。

【0105】

リスク予測部１２’は、特徴ベクトル算出部１１により算出された特徴ベクトルと、予測トピック指定部１７により指定された予測トピックまたは予測トピック特定部１８により特定された予測トピックとを、リスク予測モデル記憶部２１’に記憶された学習済みのリスク予測モデルに入力し、予測対象物に関して予測トピックに応じたリスクレベルを予測する。リスク予測モデル記憶部２１’に記憶されるリスク予測モデルは、特徴ベクトルと予測トピックとが入力された際に、予測対象物に関して特徴ベクトルおよび予測トピックに応じたリスクレベルを出力するように、教師データを用いた機械学習処理により生成されている。

【0106】

なお、リスク予測部１２’に入力する予測トピックと、リスク低減ベクトル特定部１３’に入力する探索トピックとを同じものとすることにより、予測されるリスクと、そのリスクについて予測される対策に関する情報とが特定のトピックについて関連付けられたものとなるので、より有効な対策情報を得ることができる可能性が高まる。

【0107】

上記第１および第２の実施形態では、ｍ×ｎ個の類似性指標値のうち、１つの文章ｄ_ｉ（ｉ＝１，２，・・・，ｍ）についてｎ個の類似性指標値ｄｗ_ｊ（ｊ＝１，２，・・・，ｎ）から成る文章指標値群を特徴ベクトルＶｆ_ｉとして特定する例について説明したが、本発明はこれに限定されない。例えば、１つの単語ｗ_ｊ（ｊ＝１，２，・・・，ｎ）についてｍ個の類似性指標値ｄｗ_ｉ（ｉ＝１，２，・・・，ｍ）から成る単語指標値群を特徴ベクトルＶｆ_ｊとして特定するようにしてもよい。

【0108】

また、上記第１および第２の実施形態では、対策情報生成部１４がリスクに対する対策に関する情報を生成する際に、そのリスクに関連する内容を有する解析対象データ（特徴ベクトルと共に解析対象データ記憶部２２にあらかじめ記憶されている）を用いる例について説明した。例えば、特定の病気にかかる可能性に係る疾病罹患リスクへの対策に関する情報を生成する際に、患者の電子カルテやインシデントレポートなどの文書データを用いて対策に関する情報を生成することとした。この場合における電子カルテ等は、予測した特定の病気とはいっけん無関係と思われる内容の電子カルテ等であってもよい。また、電子カルテ等の医療に関する文書データとは異なる種類の文書データを用いるようにしてもよい。このようにすれば、既存の知見や経験則などから人間の判断では得ることが難しい、固定観念や制約などに捕らわれない新たな有効な対策情報を得ることが期待できる。

【0109】

その他、上記第１および第２の実施形態は、何れも本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその要旨、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。

【符号の説明】

【0110】

１１特徴ベクトル算出部
１２リスク予測部
１３，１３’ リスク低減ベクトル特定部
１４対策情報生成部
１５探索トピック指定部
１６探索トピック特定部
１７予測トピック指定部
１８予測トピック特定部
２１リスク予測モデル記憶部
２２解析対象データ記憶部
２３対策予測モデル記憶部

【図1】