IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士フイルム株式会社の特許一覧

特開2024-35034情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム
<図1>
  • 特開-情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム 図1
  • 特開-情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム 図2
  • 特開-情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム 図3
  • 特開-情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム 図4
  • 特開-情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム 図5
  • 特開-情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム 図6
  • 特開-情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム 図7
  • 特開-情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム 図8
  • 特開-情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム 図9
  • 特開-情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム 図10
  • 特開-情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム 図11
  • 特開-情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム 図12
  • 特開-情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム 図13
  • 特開-情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム 図14
  • 特開-情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム 図15
  • 特開-情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム 図16
  • 特開-情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム 図17
  • 特開-情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム 図18
  • 特開-情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム 図19
  • 特開-情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム 図20
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024035034
(43)【公開日】2024-03-13
(54)【発明の名称】情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラム
(51)【国際特許分類】
   G06F 16/35 20190101AFI20240306BHJP
   G06N 20/00 20190101ALI20240306BHJP
   G16H 10/60 20180101ALI20240306BHJP
【FI】
G06F16/35
G06N20/00 130
G16H10/60
【審査請求】未請求
【請求項の数】22
【出願形態】OL
(21)【出願番号】P 2023030561
(22)【出願日】2023-02-28
(31)【優先権主張番号】P 2022138807
(32)【優先日】2022-08-31
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】306037311
【氏名又は名称】富士フイルム株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】古川 大記
(72)【発明者】
【氏名】三沢 翔太郎
(72)【発明者】
【氏名】鑓水 大和
(72)【発明者】
【氏名】狩野 竜示
(72)【発明者】
【氏名】谷口 友紀
(72)【発明者】
【氏名】大熊 智子
(72)【発明者】
【氏名】小野田 浩平
【テーマコード(参考)】
5B175
5L099
【Fターム(参考)】
5B175DA01
5B175FA03
5B175FB04
5L099AA04
5L099AA23
(57)【要約】
【課題】複数の文書データを含む文書データ群を入力とする機械学習モデルにおける評価値を、文書データ毎に得ることができる情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラムを提供する。
【解決手段】少なくとも1つのプロセッサを備え、前記プロセッサは、複数の文書データを含む文書データ群を入力とし、出力データを出力する機械学習モデルについて、前記文書データ群に含まれる文書データ毎に、前記機械学習モデルにおける評価値を導出する。
【選択図】図6
【特許請求の範囲】
【請求項1】
少なくとも1つのプロセッサを備え、
前記プロセッサは、
複数の文書データを含む文書データ群を入力とし、出力データを出力する機械学習モデルについて、
前記文書データ群に含まれる文書データ毎に、前記機械学習モデルにおける評価値を導出する
情報処理装置。
【請求項2】
前記プロセッサは、
導出した前評価値に基づいて、前記文書データ群から表示対象とする文書データの特定、及び文書データに応じた文書の表示順序の特定の少なくとも一方を行う
請求項1に記載の情報処理装置。
【請求項3】
前記プロセッサは、
前記文書データ毎に前記機械学習モデルの入力とし、前記文書データ毎に出力された文書単位出力データを取得し、
前記文書単位出力データに基づいて、前記文書データ毎に前記評価値を導出する
請求項1に記載の情報処理装置。
【請求項4】
前記評価値は、前記文書単位出力データに対して相関関係を有する
請求項3に記載の情報処理装置。
【請求項5】
前記プロセッサは、
前記文書データ群に含まれる各文書データを正規化し、
正規化した文書データ毎に、前記評価値を導出する
請求項1に記載の情報処理装置。
【請求項6】
前記プロセッサは、
前記文書データ群に含まれる各文書データから複数の単語データを抽出し、
前記単語データ毎に、前記機械学習モデルにおける評価値を単語単位評価値として導出し、
前記文書データ毎に、前記文書データに含まれる単語データの単語単位評価値の統計値に応じて前記評価値を導出する
請求項1に記載の情報処理装置。
【請求項7】
文書データ毎に導出した第1評価値が最も大きい文書データを第1文書データとし、また、前記文書データ群に含まれる前記第1文書データ以外の複数の文書データの各々を第2文書データとし、
前記プロセッサは、
前記第1文書データと、前記第2文書データとを組み合わせた組合せデータ毎に前記機械学習モデルの入力とし、前記組合せデータ毎に出力された出力データから第2評価値を導出する
請求項1に記載の情報処理装置。
【請求項8】
前記プロセッサは、
前記第1文書データに第1表示優先度を付与し、
前記第2評価値に基づいて、前記第2文書データに前記第1表示優先度よりも低い第2表示優先度を付与する
請求項7に記載の情報処理装置。
【請求項9】
前記プロセッサは、
前記文書データ群に含まれる各文書データから複数の単語データを抽出し、
前記単語データ毎に、前記機械学習モデルにおける評価値を単語単位評価値として導出し、
前記文書データ毎に、前記文書データに含まれる単語データの単語単位評価値の第1統計値を導出して、前記第1統計値が最も大きい前記文書データである第1評価値文書データに、第1評価値を付与し、
前記第1評価値文書データと、前記文書データ群に含まれる前記第1評価値文書データ以外の複数の文書データの各々とを組み合わせた複数の組合せデータについて、組み合わせデータ毎に、前記組合せデータに含まれる単語データの単語単位評価値の第2統計値を導出して、前記第2統計値が最も大きい文書データである第2評価値文書データに、前記第1評価値よりも低い第2評価値を付与し、
前記第2統計値の導出では、前記第1評価値文書データと組み合わせる文書データに含まれる単語データのうち、前記第1評価値文書データに含まれる単語データの単語単位評価値を、前記第1評価値文書データに含まれない単語データの単語単位評価値よりも相対的に低くする
請求項1に記載の情報処理装置。
【請求項10】
複数の文書データを入力とし、出力データを出力する機械学習モデルの学習装置であって、
少なくとも1つのプロセッサを備え、
前記プロセッサは、
複数の学習用文書データについて、学習用文書データ毎に、前記機械学習モデルの入力とし、前記学習用文書データ毎に出力された出力データを取得し、
前記学習用文書データ毎に得られた前記出力データと正解データとに基づいて、前記複数の学習用文書データから一部の学習用文書データについて、学習用文書データ毎に、正解データと出力データとの差異の程度を表す損失関数を演算し、
前記損失関数に基づいて、前記機械学習モデルを更新する
学習装置。
【請求項11】
前記プロセッサは、
前記出力データと前記正解データとの類似度に基づいて前記一部の学習用文書データを抽出する
請求項10に記載の学習装置。
【請求項12】
前記プロセッサは、
前記一部の学習用文書データ以外の他の学習用文書データについても、学習用データ毎に、前記一部の学習用文書データよりも重みを低くして前記損失関数を演算し、
前記他の学習用文書データの前記損失関数にも基づいて、前記機械学習モデルを更新する
請求項10に記載の学習装置。
【請求項13】
前記プロセッサは、
前記一部の学習用文書データについて、前記学習用文書データ毎に得られた前記出力データと前記正解データとに基づいて重み付けをして前記損失関数を演算する
請求項10に記載の学習装置。
【請求項14】
前記プロセッサは、
前記出力データと前記正解データとの類似度が高いほど重み付けを重くする
請求項13に記載の学習装置。
【請求項15】
前記プロセッサは、
前記一部の学習用文書データにより得られた損失関数に基づく前記機械学習モデルの更新を繰り返し行い、
前記機械学習モデルの更新回数に応じて、抽出する前記一部の学習用文書データの数を変動させる、
請求項10に記載の学習装置。
【請求項16】
前記学習用文書データの各々は、対応付けられている前記機械学習モデルの予測結果の種類を表すラベルが付与されており、
前記プロセッサは、
前記ラベルの種類毎に、前記学習用文書データを抽出する
請求項10に記載の学習装置。
【請求項17】
少なくとも1つのプロセッサを備え、
前記プロセッサは、
複数の文書データを含む文書データ群を入力とし、出力データを出力する機械学習モデルについて、
前記文書データ群に含まれる文書データ毎に、前記機械学習モデルにおける評価値を導出する
前記機械学習モデルは、
複数の文書データを含む文書データ群を入力とし、出力データを出力する機械学習モデルの学習装置であって、
少なくとも1つの学習用プロセッサを備え、
前記学習用プロセッサは、
学習用文書データ群に含まれる学習用文書データ毎に、前記機械学習モデルの入力とし、前記学習用文書データ毎に出力された出力データを取得し、
前記学習用文書データ毎に得られた前記出力データと正解データとに基づいて、前記学習用文書データ群から一部の学習用文書データについて、学習用文書データ毎に、正解データと出力データとの差異の程度を表す損失関数を演算し、
前記損失関数に基づいて、前記機械学習モデルを更新する学習装置によって学習された機械学習モデルである、
情報処理装置。
【請求項18】
請求項1から請求項9のいずれか1項に記載の情報処理装置と、
請求項10から請求項16のいずれか1項に記載の学習装置と、
を備えた情報処理システム。
【請求項19】
少なくとも1つのプロセッサを備える情報処理装置の前記プロセッサが実行する情報処理方法であって、
複数の文書データを含む文書データ群を入力とし、出力データを出力する機械学習モデルについて、
前記文書データ群に含まれる文書データ毎に、前記機械学習モデルにおける評価値を導出する
情報処理方法。
【請求項20】
少なくとも1つのプロセッサを備える情報処理装置の前記プロセッサに、
複数の文書データを含む文書データ群を入力とし、出力データを出力する機械学習モデルについて、
前記文書データ群に含まれる文書データ毎に、前記機械学習モデルにおける評価値を導出する
処理を実行させるための情報処理プログラム。
【請求項21】
プロセッサが、
複数の学習用文書データについて、学習用文書データ毎に、機械学習モデルの入力とし、前記学習用文書データ毎に出力された出力データを取得し、
前記学習用文書データ毎に得られた前記出力データと正解データとに基づいて、前記複数の学習用文書データから一部の学習用文書データについて、学習用文書データ毎に、正解データと出力データとの差異の程度を表す損失関数を演算し、
前記損失関数に基づいて、前記機械学習モデルを更新する
学習方法。
【請求項22】
プロセッサが、
複数の学習用文書データについて、学習用文書データ毎に、機械学習モデルの入力とし、前記学習用文書データ毎に出力された出力データを取得し、
前記学習用文書データ毎に得られた前記出力データと正解データとに基づいて、前記複数の学習用文書データから一部の学習用文書データについて、学習用文書データ毎に、正解データと出力データとの差異の程度を表す損失関数を演算し、
前記損失関数に基づいて、前記機械学習モデルを更新する
処理を実行させるための学習プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理装置、学習装置、情報処理システム、情報処理方法、学習方法、情報処理プログラム、及び学習プログラムに関する。
【背景技術】
【0002】
機械学習モデルを解釈するために、機械学習モデルにおける入力データの評価値を導出する技術が知られている。このような評価値として、例えば、機械学習モデルを解釈するために、機械学習モデルにおける出力データの導出に対する、入力データの寄与度を導出する技術が知られている。寄与度を導出するための技術としては、LIME(Local Interpretable Model-agnostic Explanations)等の手法が挙げられる。また、複数のデータをまとめたデータ群を入力データとし、機械学習モデルから出力データを出力させることが行われている。例えば、特許文献1には、複数の単語データを含むテキストを入力データとする機械学習モデルが開示されている。特許文献1では、テキストを入力データとし分類結果を出力する機械学習モデルにおいて、テキストを分割した単語毎に、分類結果に対する寄与度を割り当てる技術が記載されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2020-113218号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の技術では、複数の文書データを含む文書データ群を入力とする機械学習モデルにおける評価値を得るには、十分とは言えなかった。例えば、特許文献1に記載の技術では、テキストが複数の文書データを含む文書データ群である場合、単語毎の寄与度を導出することができるものの、文書データ毎の寄与度を導出するには不十分であった。
【0005】
本開示は、上記の事情を鑑みてなされたものであり、複数の文書データを含む文書データ群を入力とする機械学習モデルにおける評価値を、文書データ毎に得ることができる情報処理装置、学習装置、情報処理方法、情報処理システム、学習方法、情報処理プログラム、及び学習プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するために本開示の第1の態様の情報処理装置は、少なくとも1つのプロセッサを備え、プロセッサは、複数の文書データを含む文書データ群を入力とし、出力データを出力する機械学習モデルについて、文書データ群に含まれる文書データ毎に、機械学習モデルにおける評価値を導出する。
【0007】
第2の態様の情報処理装置は、第1の態様の情報処理装置において、プロセッサは、導出した前評価値に基づいて、文書データ群から表示対象とする文書データの特定、及び文書データに応じた文書の表示順序の特定の少なくとも一方を行う。
【0008】
第3の態様の情報処理装置は、第1の態様の情報処理装置において、プロセッサは、文書データ毎に機械学習モデルの入力とし、文書データ毎に出力された文書単位出力データを取得し、文書単位出力データに基づいて、文書データ毎に評価値を導出する。
【0009】
第4の態様の情報処理装置は、第3の態様の情報処理装置において、評価値は、文書単位出力データに対して相関関係を有する。
【0010】
第5の態様の情報処理装置は、第1の態様の情報処理装置において、プロセッサは、文書データ群に含まれる各文書データを正規化し、正規化した文書データ毎に、評価値を導出する。
【0011】
第6の態様の情報処理装置は、第1の態様の情報処理装置において、プロセッサは、文書データ群に含まれる各文書データから複数の単語データを抽出し、単語データ毎に、機械学習モデルにおける評価値を単語単位評価値として導出し、文書データ毎に、文書データに含まれる単語データの単語単位評価値の統計値に応じて評価値を導出する。
【0012】
第7の態様の情報処理装置は、第1の態様の情報処理装置において、文書データ毎に導出した第1評価値が最も大きい文書データを第1文書データとし、また、文書データ群に含まれる第1文書データ以外の複数の文書データの各々を第2文書データとし、プロセッサは、第1文書データと、第2文書データとを組み合わせた組合せデータ毎に機械学習モデルの入力とし、組合せデータ毎に出力された出力データから第2評価値を導出する。
【0013】
第8の態様の情報処理装置は、第7の態様の情報処理装置において、プロセッサは、第1文書データに第1表示優先度を付与し、第2評価値に基づいて、第2文書データに第1表示優先度よりも低い第2表示優先度を付与する。
【0014】
第9の態様の情報処理装置は、第1の態様の情報処理装置において、プロセッサは、文書データ群に含まれる各文書データから複数の単語データを抽出し、単語データ毎に、機械学習モデルにおける評価値を単語単位評価値として導出し、文書データ毎に、文書データに含まれる単語データの単語単位評価値の第1統計値を導出して、第1統計値が最も大きい文書データである第1評価値文書データに、第1評価値を付与し、第1評価値文書データと、文書データ群に含まれる第1評価値文書データ以外の複数の文書データの各々とを組み合わせた複数の組合せデータについて、組み合わせデータ毎に、組合せデータに含まれる単語データの単語単位評価値の第2統計値を導出して、第2統計値が最も大きい文書データである第2評価値文書データに、第1評価値よりも低い第2評価値を付与し、第2統計値の導出では、第1評価値文書データと組み合わせる文書データに含まれる単語データのうち、第1評価値文書データに含まれる単語データの単語単位評価値を、第1評価値文書データに含まれない単語データの単語単位評価値よりも相対的に低くする。
【0015】
第10の態様の学習装置は、複数の文書データを入力とし、出力データを出力する機械学習モデルの学習装置であって、少なくとも1つのプロセッサを備え、プロセッサは、複数の学習用文書データについて、学習用文書データ毎に、機械学習モデルの入力とし、学習用文書データ毎に出力された出力データを取得し、学習用文書データ毎に得られた出力データと正解データとに基づいて、複数の学習用文書データから一部の学習用文書データについて、学習用文書データ毎に、正解データと出力データとの差異の程度を表す損失関数を演算し、損失関数に基づいて、機械学習モデルを更新する。
【0016】
第11の態様の学習装置は、第10の態様学習装置において、プロセッサは、出力データと正解データとの類似度に基づいて一部の学習用文書データを抽出する。
【0017】
第12の態様学習装置は、第10の態様学習装置において、プロセッサは、一部の学習用文書データ以外の他の学習用文書データについても、学習用データ毎に、一部の学習用文書データよりも重みを低くして損失関数を演算し、他の学習用文書データの損失関数にも基づいて、機械学習モデルを更新する。
【0018】
第13の態様の学習装置は、第10の態様学習装置において、プロセッサは、一部の学習用文書データについて、学習用文書データ毎に得られた出力データと正解データとに基づいて重み付けをして損失関数を演算する。
【0019】
第14の態様学習装置は、第13の態様学習装置において、プロセッサは、出力データと正解データとの類似度が高いほど重み付けを重くする。
【0020】
第15の態様の学習装置は、第10の態様学習装置において、プロセッサは、一部の学習用文書データにより得られた損失関数に基づく機械学習モデルの更新を繰り返し行い、機械学習モデルの更新回数に応じて、抽出する一部の学習用文書データの数を変動させる。
【0021】
第16の態様の学習装置は、第10の態様学習装置において、学習用文書データの各々は、対応付けられている機械学習モデルの予測結果の種類を表すラベルが付与されており、プロセッサは、ラベルの種類毎に、学習用文書データを抽出する。
【0022】
第17の態様の情報処理装置は、少なくとも1つのプロセッサを備え、プロセッサは、複数の文書データを含む文書データ群を入力とし、出力データを出力する機械学習モデルについて、文書データ群に含まれる文書データ毎に、機械学習モデルにおける評価値を導出し、機械学習モデルは、複数の文書データを含む文書データ群を入力とし、出力データを出力する機械学習モデルの学習装置であって、少なくとも1つの学習用プロセッサを備え、学習用プロセッサは、学習用文書データ群に含まれる学習用文書データ毎に、機械学習モデルの入力とし、学習用文書データ毎に出力された出力データを取得し、学習用文書データ毎に得られた出力データと正解データとに基づいて、学習用文書データ群から一部の学習用文書データについて、学習用文書データ毎に、正解データと出力データとの差異の程度を表す損失関数を演算し、損失関数に基づいて、機械学習モデルを更新する学習装置によって学習された機械学習モデルである。
【0023】
第18の態様の情報処理システムは、本開示の情報処理装置と、本開示の学習装置と、を備える。
【0024】
また、上記目的を達成するために本開示の第19の態様の情報処理方法は、少なくとも1つのプロセッサを備える情報処理装置のプロセッサが実行する情報処理方法であって、複数の文書データを含む文書データ群を入力とし、出力データを出力する機械学習モデルについて、文書データ群に含まれる文書データ毎に、機械学習モデルにおける評価値を導出する情報処理方法である。
【0025】
また、上記目的を達成するために本開示の第20の態様の情報処理プログラムは、少なくとも1つのプロセッサを備える情報処理装置のプロセッサに、複数の文書データを含む文書データ群を入力とし、出力データを出力する機械学習モデルについて、文書データ群に含まれる文書データ毎に、機械学習モデルにおける評価値を導出する処理を実行させるためのものである。
【0026】
また、本開示の第21の学習方法は、プロセッサが、複数の学習用文書データについて、学習用文書データ毎に、機械学習モデルの入力とし、学習用文書データ毎に出力された出力データを取得し、学習用文書データ毎に得られた出力データと正解データとに基づいて、複数の学習用文書データから一部の学習用文書データについて、学習用文書データ毎に、正解データと出力データとの差異の程度を表す損失関数を演算し、損失関数に基づいて、機械学習モデルを更新する学習方法である。
【0027】
また、本開示の第22の学習プログラムは、プロセッサが、複数の学習用文書データについて、学習用文書データ毎に、機械学習モデルの入力とし、学習用文書データ毎に出力された出力データを取得し、学習用文書データ毎に得られた出力データと正解データとに基づいて、複数の学習用文書データから一部の学習用文書データについて、学習用文書データ毎に、正解データと出力データとの差異の程度を表す損失関数を演算し、損失関数に基づいて、機械学習モデルを更新する処理を実行させるためのものである。
【発明の効果】
【0028】
本開示によれば、複数の文書データを含む文書データ群を入力とする機械学習モデルにおける評価値を、文書データ毎に得ることができる。
【図面の簡単な説明】
【0029】
図1】実施形態の情報処理システムにおける全体の構成の一例を概略的に表した構成図である。
図2】予後予測モデルの入力及び出力を説明するための図である。
図3】予後予測モデルの学習フェーズにおける処理の概要を示す図である。
図4】第1実施形態における情報処理装置の構成の一例を示すブロック図である。
図5】第1実施形態における情報処理装置の構成の一例を表す機能ブロック図である。
図6】第1実施形態における情報処理装置の作用を説明するための図である。
図7】第1実施形態における情報処理装置による情報処理の流れの一例を表したフローチャートである。
図8】表示部に表示対象とした文書データを特定した表示順序で表示させた状態の一例を示す図である。
図9】変形例1における情報処理の流れの一例を表したフローチャートである。
図10】変形例1における情報処理装置の作用を説明するための図である。
図11】第2実施形態における情報処理装置の構成の一例を表す機能ブロック図である。
図12】第2実施形態における情報処理装置の作用を説明するための図である。
図13】第2実施形態における情報処理装置による情報処理の流れの一例を表したフローチャートである。
図14】第2実施形態における情報処理装置による情報処理の流れの変形例を表したフローチャートである。
図15】第3実施形態の情報処理システムにおける全体の構成の一例を概略的に表した構成図である。
図16】第3実施形態における学習データの一例を示す図である。
図17】第3実施形態における情報処理装置の構成の一例を示すブロック図である。
図18】第3実施形態における情報処理装置の構成の一例を表す機能ブロック図である。
図19】第3実施形態における学習処理を説明するための図である。
図20】第3実施形態における学習装置による学習処理の流れの一例を表したフローチャートである。
【発明を実施するための形態】
【0030】
以下、図面を参照して本開示の実施形態を詳細に説明する。なお、本実施形態は本開示の技術を限定するものではない。
【0031】
[第1実施形態]
まず、本実施形態の情報処理システムにおける、全体の構成の一例について説明する。図1には、本実施形態の情報処理システム1における、全体の構成の一例を表す構成図が示されている。図1に示すように、本実施形態の情報処理システム1は、情報処理装置10及び患者情報DB(DataBase)14を備える。情報処理装置10及び患者情報DB14は、ネットワーク19を介して有線通信または無線通信により接続されている。
【0032】
患者情報DB14には、複数の患者に関する患者情報15が記憶される。患者情報DB14は、汎用コンピュータにデータベース管理システム(DataBase Management system:DBMS)の機能を提供するソフトウェアプログラムがインストールされたサーバ装置等に備えられた、HDD(Hard Disk Drive)、SSD(Solid State Drive)、及びフラッシュメモリ等の記憶媒体によって実現される。
【0033】
一例として本実施形態の患者情報15は、特定の患者の診療に係わる文書を表す文書データ15Dである。図2に示すように、文書データ15Dは、例えば、カルテ情報や、患者プロファイル情報、及び検査結果情報を含む。なお、本実施形態において「文書」とは、単語及び文の少なくとも一方を構成要素とした情報である。例えば、文書は、1つの単語のみを含んでいてもよいし、また、複数の文を含んでいてもよい。図2に示した例では、カルテ情報である文書データ15Dとして、「9/5S」、「9/5O」、「9/5A」、「9/7O」、及び「9/7P」の5つが図示されている。また、患者プロファイル情報である文書データ15Dとして、「年齢・性別」及び「既往症」の2つが図示されている。また、検査結果情報の文書データ15Dとして、「アルブミン」(アルブミンの検査値)、及び「尿素・窒素」(尿素の検査値と窒素の検査値)の2つが図示されている。
【0034】
患者情報15は、特定の患者毎に、患者を識別するための識別情報と対応付けられて患者情報DB14に記憶されている。本実施形態の患者情報15が、本開示の文書データ群の一例であり、本実施形態の文書データ15Dが、本開示の文書データの一例である。
【0035】
情報処理装置10は、任意の患者に関する、予後予測モデル32を用いた予後予測結果、及び予後予測結果に与える影響の度合いに応じた患者情報15をユーザに提供する機能を有する装置である。本実施形態の予後予測モデル32が、本開示の機械学習モデルの一例である。
【0036】
本実施形態の予後予測モデル32は、図2に示すように患者情報15を入力すると、予後予測結果16として、患者が死亡状態となる確率、具体的には死亡確率を予後予測結果16として出力するモデルである。なお、本実施形態では、予後予測モデル32から出力された予後予測結果について、患者情報15に含まれる全ての文書データ15Dを入力した場合に出力される予後予測結果16A(図6参照)、文書データ15D毎に入力した場合に出力される予後予測結果16B(図6参照)等を区別せずに総称する場合、単に予後予測結果16という。
【0037】
一例として図3に示すように、本実施形態の予後予測モデル32は、学習フェーズにおいて、訓練データまたは教師データとも呼ばれる学習データ90を与えられて学習される。学習データ90は、学習用患者情報95と、正解予後予測結果96Cとの組である。学習用患者情報95は、ある患者の診療に係わる複数の学習用文書データ95Dを含む。正解予後予測結果96Cは、例えば、その患者の予後を実際に観察した結果から得られた死亡確率である。具体的には、実際に死亡した患者の死亡確率を1(100%))」、「死亡しなかった患者の死亡確率を0(0%)」とする。なお、死亡確率については、100%及び0%に限らず、種々の調整が可能である。例えば、死亡までの期間が長い場合は死亡確率を100%から低下させる等としてもよい。なお、本形態に限定されず、正解予後予測結果96Cとして、例えば、医師が学習用文書データ95Dを参照して、その患者に対して実際に下した死亡確率を用いてもよい。
【0038】
学習フェーズにおいて、予後予測モデル32には、学習用患者情報95が学習用文書データ95D毎にベクトル化されて入力される。予後予測モデル32は、学習用患者情報95に対して学習用予後予測結果96を出力する。学習用予後予測結果96及び正解予後予測結果96Cに基づいて、損失関数を用いた予後予測モデル32の損失演算がなされる。そして、損失演算の結果に応じて予後予測モデル32の各種係数の更新設定がなされ、更新設定にしたがって、予後予測モデル32が更新される。
【0039】
学習フェーズにおいては、学習用患者情報95の予後予測モデル32への入力、予後予測モデル32からの学習用予後予測結果96の出力、損失演算、更新設定、及び予後予測モデル32の更新の上記一連の処理が、学習データ90が交換されつつ繰り返し行われる。上記一連の繰り返しは、正解予後予測結果96Cに対する学習用予後予測結果96の予測精度が、予め定められた設定レベルまで達した場合に終了される。このようにして、学習済みの予後予測モデル32が生成される。
【0040】
図4に示すように本実施形態の情報処理装置10は、制御部20、記憶部22、通信I/F(Interface)部24、操作部26、及び表示部28を備えている。制御部20、記憶部22、I/F部24、操作部26、及び表示部28はシステムバスやコントロールバス等のバス29を介して相互に各種情報の授受が可能に接続されている。
【0041】
本実施形態の制御部20は、情報処理装置10の全体の動作を制御する。制御部20は、プロセッサであり、CPU(Central Processing Unit)20Aを備える。また、制御部20は、後述する記憶部22と接続される。なお、制御部20は、GPU(Graphics Processing Unit)を備えても良い。
【0042】
操作部26は、特定の患者の予後予測に関する指示や各種情報等をユーザが入力するために用いられる。操作部26は特に限定されるものではなく、例えば、各種スイッチ、タッチパネル、タッチペン、及びマウス等が挙げられる。表示部28は、予後予測結果16、文書データ15D、及び各種情報等を表示する。なお、操作部26と表示部28とを一体化してタッチパネルディスプレイとしてもよい。
【0043】
通信I/F部24は、無線通信または有線通信により、ネットワーク19を介して患者情報DB14との間で各種情報の通信を行う。情報処理装置10は、患者情報DB14から患者情報15を、通信I/F部24を介して無線通信または有線通信により受信する。
【0044】
記憶部22は、ROM(Read Only Memory)22A、RAM(Random Access Memory)22B、ストレージ22Cを備える。ROM22Aには、CPU20Aにより実行される各種のプログラム等が予め記憶されている。RAM22Bは、各種データを一時的に記憶する。ストレージ22Cは、CPU20Aで実行される情報処理プログラム30、予後予測モデル32、及びその他の各種情報等が記憶される。ストレージ22Cは不揮発性の記憶部であり、例えば、HDDやSSD等が挙げられる。
【0045】
さらに、図5には、本実施形態の情報処理装置10の構成の一例の機能ブロック図が示されている。図5に示すように情報処理装置10は、取得部40、予後予測結果導出部41、文書抽出部42、前処理部44、予後予測結果導出部46、後処理部48、評価値導出部49、及び表示制御部50を備える。一例として本実施形態の情報処理装置10は、制御部20のCPU20Aがストレージ22Cに記憶されている情報処理プログラム30を実行することにより、CPU20Aが取得部40、予後予測結果導出部41、文書抽出部42、前処理部44、予後予測結果導出部46、後処理部48、評価値導出部49、及び表示制御部50として機能する。
【0046】
取得部40は、患者情報DB14から特定の患者の患者情報15を取得する機能を有する。一例として、本実施形態の取得部40は、予後予測を行う対象となる特定の患者を表す患者識別情報を受け付けると、受け付けた患者識別情報に応じた患者情報15を、ネットワーク19を介して患者情報DB14から取得する。取得部40は、取得した患者情報15を、予後予測結果導出部41及び文書抽出部42に出力する。
【0047】
予後予測結果導出部41は、予後予測モデル32の学習において用いられる。予後予測結果導出部41は、図6に示すように、患者情報15に含まれる全ての文書データ15Dをベクトル化して、予後予測モデル32に入力し、出力された患者情報単位の予後予測結果16Aを取得する。すなわち、予後予測結果導出部41は、予後予測モデル32を用いて、患者情報15毎の予後予測結果16Aを導出する。
【0048】
文書抽出部42は、患者情報15から文書データ15Dを、予め定められた基準に基づいて抽出する機能を有する。一例として本実施形態の文書抽出部42は、患者情報15に含まれる1つの単文を1つの文書データ15Dとして、単文単位で文書データ15Dを抽出する。なお、患者情報15から文書データ15Dを抽出するための上記基準は特に限定されず、例えば、対応付けられている日付が同日であることを基準としてもよい。この場合、例えば、図6に示した例では、「9/5:A,9/5:P,9/5:S,9/5:O」が1つの文書データ15Dとして抽出される。文書抽出部42は、抽出した文書データ15Dを、前処理部44に出力する。
【0049】
前処理部44は、抽出した文書データ15Dに対して予後予測モデル32に入力する前の前処理を行う機能を有する。患者情報15全体と、抽出した文書データ15Dとでは、テキストの長さが異なる。そのため、本実施形態では、文書データ15Dのテキストの長さを、患者情報15に含まれる全ての文書データ15Dのテキストを繋げた長さに合わせるための正規化を前処理として行う。なお、正規化の方法は特に限定されない。例えば、文書データ15Dを予後予測モデル32に入力するためにベクトル化する際の値を、患者情報15に含まれる文書データ15Dの数で正規化する方法を採用してもよい。また例えば、患者情報15に含まれる全ての文書データ15Dのテキストを繋げた長さと同等とみなせる長さになるように、抽出した文書データ15Dを繰り返し繋げる方法を採用してもよい。
【0050】
なお、前処理部44による前処理は必須ではない。例えば、入力するベクトルの値を平均化する等、入力される文書(テキスト)の長さに左右されない機械学習モデルを予後予測モデル32として採用する場合、前処理を行わなくてもよい。
【0051】
前処理部44は、前処理を行った文書データ15Dを予後予測結果導出部46に出力する。なお、上記のように正規化を行った場合、テキストが短い文書データ15D、特に1つの単語のみしか含まない単語文の文書データ15Dの場合、詳細を後述する評価値17が高くなる傾向がある。そのため、前処理部44は、文(テキスト)の長さが比較的短い文書データ15D、例えば、含まれる単語の総数が所定の数以下の文書データ15Dについては、予後予測結果導出部46に出力しないようにしてもよい。
【0052】
予後予測結果導出部46は、図6に示すように、文書データ15D毎に、文書データ15Dをベクトル化して、予後予測モデル32に入力し、出力された文書単位の予後予測結果16Bを取得する機能を有する。なお、ベクトル化した文書データ15Dに加えて、予後予測モデル32の学習フェーズで利用した患者プロファイルや検査結果情報について、入力情報として用いてもよい。予後予測結果導出部46は、取得した患者情報15毎の予後予測結果16Bを後処理部48に出力する。
【0053】
後処理部48は、予後予測結果16Bに対して、前処理を行ったことに対する後処理を行う機能を有する。上述したように、正規化を行った場合、文(テキスト)が短い文書データでは、詳細を後述する評価値17が高くなる傾向がある。そのため、後処理部48は、その補正を後処理として行う。例えば、後処理部48は、予後予測結果16Bに、文(テキスト)の長さを加味することで正規化を行う後処理を行ってもよい。この場合の後処理としては、例えば、後処理部48は、下記(1)式により予後予測結果16Bを正規化してもよい。
log(文書データ15Dに含まれる単語数)×予後予測結果16B ・・・(1)
【0054】
後処理部48は、後処理後の予後予測結果16Bを評価値導出部49に出力する。
【0055】
評価値導出部49は、後処理後の予後予測結果16に応じて、文書データ15D毎に、評価値17を導出する。本実施形態の評価値17は、文書単位の予後予測結果16Bに対して相関関係を有する。一例として本実施形態では、予後予測モデル32が、患者が死亡状態となる確率を導出するものであり、死亡確率を予後予測結果16Bとして出力するモデルであるため、文書単位の予後予測結果16Bの値が大きいほど、評価値17の値が大きくなる。なお、本実施形態と異なり、予後予測モデル32は患者が死亡状態となる確率の導出として、死亡確率と相反関係を有する生存確率を予後予測結果16Bとして出力するモデルである場合、文書単位の予後予測結果16Bの値が小さいほど、評価値17の値が大きくなる。このように、本実施形態では、死亡状態となり易いと予測されるほど、評価値17の値が大きくなる。換言すると、予後予測結果16Bが極端な値を示すほど、評価値17の値が大きくなる。なお、本実施形態では、評価値17を具体的な数値として表しているが、例えば、「高」、「中」、及び「低」等で表すようにしてもよい。評価値導出部49は、文書データ15D毎に導出した評価値17を表示制御部50に出力する。
【0056】
表示制御部50は、文書データ15D毎の評価値17に基づいて、患者情報15に含まれる全ての複数の文書データ15Dから、表示対象とする文書データ15Dを特定する。例えば、表示制御部50は、評価値17が高い順に所定の数の文書データ15Dを、表示対象として特定する。また、表示制御部50は、評価値17が所定値以上の文書データ15Dを、表示対象として特定する。
【0057】
また、表示対象の特定において、Beam Searchの手法を用いて、文書データ15Dを1つずつ選択してもよい。この場合、表示制御部50は、まず、表示優先度が最も高い第1表示優先度を付与する文書データ15Dとして、患者情報15に含まれる全ての文書データ15Dのうちから、評価値17のランキングにおいて上位K個の文書データ15Dを抽出する。そして、抽出した文書データ15Dに、患者情報15に含まれる残りの文書データ15Dに含まれる他の文書データ15Dを加えて、評価値17を元にランキングし、上位K個の文書データ15Dに、第1表示優先度の次に高い、第2表示優先度を付与する。この処理を、所定の数の文書データ15Dを特定するか、または、表示優先度を付与した全ての文書データ15Dの長さを加算した全長が、所定の長さとなるまで繰り返す。
【0058】
また、表示制御部50は、評価値17に基づいて、文書データ15Dを表示する表示順序を特定する。例えば、表示制御部50は、評価値17が高い順に、表示優先度が高くなるように表示順序を特定する。なお、表示制御部50は、表示順序として、文書データ15Dに対応付けられている日時に基づいた時系列順を採用してもよい。表示順序を時系列順とする場合、日時が新しいものほど、表示優先度が高くなる。また、評価値17に応じた順序と、時系列順とを組み合わせた表示順序を採用してもよい。なお、この場合、文書データ15Dが長いほど、文書データ15Dを読むユーザに係る負担が大きくなるため、文書データ15Dの長さをペナルティとして加えてもよい。具体的には、文書データ15Dの長さが長くなるほど大きくなるペナルティを加えてもよい。
【0059】
なお、表示対象及び表示順序の少なくとも一方について予め定められている場合、表示制御部50は、表示対象及び表示順序のうち、予め定められていない方の特定を行えばよく、両方とも予め定められている場合は、表示対象の特定及び表示順序の特定を省略してもよい。例えば、表示対象を全ての文書データ15Dとすることが予め定められている場合、表示制御部50は、表示順序のみを特定すればよい。
【0060】
また、表示制御部50は、表示対象として特定した文書データ15Dを、特定した表示順序で表示部28に表示させる制御を行う。なお、表示制御部50は、予後予測結果導出部41が導出した予後予測結果16Aも表示部28に表示させる制御を行ってもよい。
【0061】
次に、本実施形態の情報処理装置10の作用について図面を参照して説明する。図7には、本実施形態の情報処理装置10において実行される情報処理の流れの一例を表したフローチャートが示されている。本実施形態の情報処理装置10は、一例として、操作部26により行われた、ユーザの開始指示等に基づいて、制御部20のCPU20Aが、ストレージ22Cに記憶されている情報処理プログラム30を実行することにより、図7に一例を示した情報処理を実行する。
【0062】
図7のステップS100で取得部40は、上述したようにユーザが、操作部26を用いて指定した、患者識別情報を受け付ける。次のステップS102で取得部40は、上述したように、患者識別情報に対応付けられている患者情報15を患者情報DB14からネットワーク19を介して取得する。
【0063】
次のステップS104で予後予測結果導出部41は、上述したように、患者情報15に含まれる全ての文書データ15Dを予後予測モデル32の入力として、患者情報単位の予後予測結果16Aを導出する。次のステップS106で文書抽出部42は、上述したように患者情報15から文書データ15Dを1つ抽出する。次のステップS108で前処理部44は、上述したように、文書データ15Dに対して前処理を行い、文書データ15Dの長さについて正規化を行う。
【0064】
次のステップS110で予後予測結果導出部46は、上述したように、上記ステップS106で抽出した文書データ15Dを予後予測モデル32の入力として、文書単位の予後予測結果16Bを導出する。次のステップS112で後処理部48は、上述したように、文書単位の予後予測結果導出部46Bに対して後処理を行い、正規化を行う。
【0065】
次のステップS114で文書抽出部42は、患者情報15に含まれる全ての文書データ15Dについて、予後予測結果16Bを導出したか否かを判定する。未だ全ての文書データ15Dについて、予後予測結果16Bを導出していない場合、ステップS114の判定が否定判定となり、ステップS106に戻り、ステップS106~S112の処理を繰り返す。一方、全ての文書データ15Dについて、予後予測結果16Bを導出した場合、ステップS114の処理が肯定判定となり、ステップS116へ移行する。
【0066】
ステップS116で評価値導出部49は、上述したように、文書データ15D毎に、文書単位の予後予測結果16Bに対して相関関係を有する評価値17を導出する。次のステップS118で表示制御部50は、上述したように、患者情報15に含まれる全ての文書データ15Dから表示対象の特定を行い、また、表示対象とした文書データ15Dの表示順序を特定する。
【0067】
次のステップS119で表示制御部50は、上述したように表示対象とした文書データ15Dに応じた文書を特定した表示順序で表示部28に表示させる。図8には、表示部28に表示対象とした文書データ15Dを特定した表示順序で表示させた状態の一例を示す。図8に示した例では、文書データ15Dには第1表示優先度が付与されており、文書データ15Dには第2表示優先度が付与されている。このように上記ステップS118で特定した表示対象の文書データ15Dを、特定した表示順序で表示部28に表示することにより、予後予測モデル32により予後予測を行った特定の患者に対して、有用な情報が、重要度が高い順で表示される。ステップS119の処理が終了すると図7に示した情報処理が終了する。
【0068】
なお、本実施形態では、予後予測モデル32から出力された文書単位の予後予測結果16Bに基づいて、評価値17を導出する形態について説明したが、本実施形態に限定されない。例えば、変形例1の情報処理を適用してもよい。
【0069】
(変形例1)
図9には、本変形例の情報処理装置10において実行される情報処理の流れの一例を表したフローチャートが示されている。ステップS100~S114の処理は、図7を参照して上述した情報処理のステップS100~S114と同様の処理であるため、説明を省略する。
【0070】
次のステップS116で評価値導出部49は、図9に示した情報処理のステップS116と同様に、文書データ15D毎に、文書単位の予後予測結果16Bに対して相関関係を有する評価値17を導出する。なお、本処理により付与した評価値を第1評価値とする。
【0071】
次のステップS120で文書抽出部42は、第1評価値に基づいて、患者情報15に含まれる文書データ15Dのうちから、第1文書データ及び第2文書データを特定する。一例として、本実施形態の文書抽出部42は、第1評価値が最も高い文書データ15Dを、第1文書データとして特定し、患者情報15に含まれる、第1文書データ以外の文書データ15Dを第2文書データとして特定する。
【0072】
図10に示した例では、文書抽出部42は、評価値17に基づいて、文書データ15D~15Dのうち、文書データ15Dを第1文書データとして特定し、文書データ15D、15Dを第2文書データとして特定する。
【0073】
次のステップS122で文書抽出部42は、上記ステップS120で特定した第1文書データに、複数の第2文書データのうちの1つを組み合わせた組合せデータを抽出する。図10に示した例では、第1文書である文書データ15Dと、第2文書である文書データ15Dとを組み合わせた組み合わせデータ、及び第1文書である文書データ15Dと、第2文書である文書データ15Dとを組み合わせた組み合わせデータが示されている。
【0074】
次のステップS124で前処理部44は、上記ステップS122で抽出した組合せデータに対して上述したように、前処理を行い、組合せデータの長さについて正規化を行う。
【0075】
次のステップS126で予後予測結果導出部46は、図10に示すように、上記ステップS122で抽出した組合せデータを予後予測モデル32の入力として、組合せデータ単位の予後予測結果16Cを導出する。次のステップS128で後処理部48は、組合せデータ単位の予後予測結果16Cに対して、上述したように後処理を行い、正規化を行う。
【0076】
次のステップS130で文書抽出部42は、全ての組み合わせデータについて、予後予測結果16Cを導出したか否かを判定する。未だ全ての組合せデータについて、予後予測結果16Cを導出していない場合、ステップS130の判定が否定判定となり、ステップS122に戻り、ステップS122~S128の処理を繰り返す。すなわち、第1文書データに組み合わせる第2文書を異ならせて、組み合わせデータ単位の予後予測結果16Cを導出する処理を順次、繰り返す。一方、全ての組合せデータについて、予後予測結果16Cを導出した場合、ステップS130の処理が肯定判定となり、ステップS132へ移行する。
【0077】
ステップS132で評価値導出部49は、組合せデータ毎に、組合せデータ単位の予後予測結果16Cに対して相関関係を有する評価値17を、上述したように導出する。ここで導出した評価値17を第2評価値とする。
【0078】
次のステップS134で表示制御部50は、表示対象を特定する。ここでは、第1文書を表示対象として特定する。また、第2評価値に基づいて、第2文書データとした複数の文書データ15Dのうちから、表示対象とする文書データ15Dを特定する。例えば、表示制御部50は、第2評価値が最も高い文書データ15Dを表示対象として特定する。なお、ここで第2文書データとした文書データ15Dの中から表示対象として特定した文書データ15Dを、第1文書データに追加して表示対象とした意味から、「追加文書データ」という。
【0079】
次のステップS136で文書抽出部42は、表示対象とする文書データ15Dの追加を終了するか否かを判定する。一例として本実施形態の文書抽出部42は、所定の終了条件を満たす場合、文書データ15Dの追加を終了する。所定の終了条件としては、例えば、表示対象とした文書データ15Dの数が所定の数となった場合、及び表示対象とした複数の文書データ15Dのテキストの長さの全長が、所定の長さ以上となった場合等が挙げられる。所定の終了条件を満たさない場合、ステップS136の判定が否定判定となり、ステップS138へ移行する。ステップS138で文書抽出部42は、再び、第1文書データ及び第2文書データの特定を行う。ここでは、先に第1文書データとした文書データ15Dに、追加文書データである文書データ15Dを追加した文書データを、新たな第1文書データとして特定する。また、患者情報15に含まれる、新たな第1文書データ以外の文書データ15Dを第2文書データとして特定する。
【0080】
一方、ステップS136において、終了条件を満たす場合、判定が否定判定となり、ステップS140へ移行する。ステップS140で表示制御部50は、図7に示した情報処理のステップS119と同様に、表示対象とした文書データ15Dに応じた文書を表示部28に表示させる。ステップS119の処理が終了すると図9に示した情報処理が終了する。
【0081】
[第2実施形態]
本実施形態では、予後予測モデル32から出力された単語単位の予後予測結果16Bに基づいて、評価値17を導出する形態について説明する。図11には、本実施形態の情報処理装置10の構成の一例の機能ブロック図が示されている。本実施形態の情報処理装置10は、前処理部44、予後予測結果導出部46、及び後処理部48を備えておらず、単語抽出部43をさらに備える点で、第1実施形態の情報処理装置10(図5参照)と異なっている。
【0082】
単語抽出部43は、取得部40が取得した患者情報15に含まれる全ての文書データ15Dから、単語データ15Wを抽出する機能を有する。なお、単語抽出部43が文書データ15Dから単語データ15Wを抽出する方法は特に限定されず、例えば、単語抽出部43は、JUMAN等の公知の形態素解析器で形態素解析して得られる形態素を単語データ15Wとして抽出してもよい。単語抽出部43は、抽出した全ての単語データ15Wを、予後予測結果導出部41及び予後予測結果導出部46に出力する。
【0083】
本実施形態の予後予測結果導出部41は、図12に示すように、全ての単語データ15Wをベクトル化して、予後予測モデル32に入力し、出力された患者情報単位の予後予測結果16Dを取得する。すなわち、予後予測結果導出部41は、予後予測モデル32を用いて、患者情報15毎の予後予測結果16Dを導出する。なお、単語Wをベクトル化する際は、公知のTF-IDF(Term Frequency - Inverse Document Frequency)やBoW(Bag of Words)を適用してベクトル化を行ってもよい。
【0084】
一方、本実施形態の評価値導出部49は、予後予測結果16Dに応じて、単語データ15W毎に、評価値17Aを導出する。ここで用いる評価値とは、LIME等の手法により得られる、いわゆる機械学習モデルに対する「寄与度」や、GBDT(Gradient Boosting Decision Tree)により得られる、いわゆる機械学習モデルに対する「寄与特徴量」等を適用することができる。また、評価値導出部49は、単語単位の評価値17Aに基づいて、文書データ15D毎の評価値17(文書単位の評価値17)を導出する。一例として本実施形態の評価値導出部49は、図12に示すように、文書データ15Dに含まれる単語データ15Wの評価値17Aを加算した加算値(合計値)をその文書データ15Dの評価値17として導出する。図12に示した例では、「右手がしびれる」との文書データ15Dに対しては、「しびれる」という単語データ15Wを含むため、「しびれる」という単語データ15Wの評価値1が、文書データ15Dの評価値17の値となる。また、「脳梗塞のため急性期的治療」との文書データ15Dに対しては、「脳梗塞」及び「急性期的治療」という2つの単語データ15Wを含むため、「脳梗塞」という単語データ15Wの評価値8と、「急性期的治療」という単語データ15Wの評価値4とを加算した値(8+4=12)が、文書データ15Dの評価値17の値となる。なお、文書データ15Dに同一の単語データ15Wが複数含まれる場合、同一の単語データ15Wについては、評価値17Aを低くして加算するようにしてもよいし、評価値17Aを加算しないようにしてもよい。なお、本実施形態の評価値17Aの合計値が、本開示の統計値の一例である。
【0085】
このように、本実施形態では、文書単位の評価値17を、その文書データ15Dに含まれる単語データ15Wの評価値17Aの合計値としているが、合計値以外であってもよく、文書単位の評価値17から得られる統計値であればよい。例えば、合計値を加算した単語データ15Wの数または名詞の数で割った平均値を文書データ15Dの評価値17としてもよい。
【0086】
評価値導出部49は、導出した文書単位の評価値17を表示制御部50に出力する。
【0087】
本実施形態の表示制御部50は、第1実施形態の表示制御部50と同様に、文書単位の評価値17に基づいて、表示対象とする文書データ15Dの特定及び表示順序の特定を行う。
【0088】
次に、本実施形態の情報処理装置10の作用について図面を参照して説明する。図13には、本実施形態の情報処理装置10において実行される情報処理の流れの一例を表したフローチャートが示されている。
【0089】
図13のステップS200で取得部40は、第1実施形態の情報処理(図7参照)のステップS100と同様に、患者識別情報を受け付ける。次のステップS202で取得部40は、第1実施形態の情報処理(図7参照)のステップS102と同様に、患者識別情報に対応付けられている患者情報15を患者情報DB14からネットワーク19を介して取得する。
【0090】
次のステップS204で単語抽出部43は、上述したように、上記ステップS202で取得した患者情報15に含まれる全ての文書データ15Dから、形態素解析等により全ての単語データ15Wを抽出する。
【0091】
次のステップS206で予後予測結果導出部41は、上述したように、患者情報15に含まれる全ての単語データ15Wを予後予測モデル32の入力として、患者情報単位(全単語単位)の予後予測結果16Dを導出する。
【0092】
次のステップS210で評価値導出部49は、上述したように、寄与度等である単語単位の評価値17Aを導出する。
【0093】
次のステップS212で評価値導出部49は、患者情報15から文書データ15Dを1つ抽出する。次のステップS214で評価値導出部49は、上記ステップS212で抽出した文書データ15Dの評価値17(文書単位の評価値17)を、単語単位の評価値17Aに基づいて導出する。
【0094】
次のステップS216で評価値導出部49は、患者情報15に含まれる全ての文書データ15Dについて、文書単位の評価値17を導出したか否かを判定する。未だ全ての文書データ15Dについて、文書単位の評価値17を導出していない場合、ステップS216の判定が否定判定となり、ステップS212に戻り、ステップS212及びS214の処理を繰り返す。一方、全ての文書データ15Dについて、文書単位の評価値17を導出した場合、ステップS216の判定が肯定判定となり、ステップS218へ移行する。
【0095】
ステップS218表示制御部50は、上述したように文書単位の評価値17に基づいて、患者情報15に含まれる全ての文書データ15Dから表示対象及び表示順序を特定する。次のステップS220で表示制御部50は、第1実施形態の情報処理(図7参照)のステップS119と同様に、表示対象とした文書データ15Dに応じた文書を表示部28に表示させる。ステップS220の処理が終了すると図13に示した情報処理が終了する。
【0096】
なお、表示制御部50は、各々の文書データ15Dと対応付けて、文書データ15Dの評価値17、又は、文書データ15Dに含まれる評価値17Aの高い単語データ15Wの少なくともいずれかを表示してもよい。表示制御部50は、例えば、評価値17Aが一定の閾値より高い単語データ15W、又は、文書データ15Dに含まれる単語データ15Wの内、評価値17Aが高い順で所定の閾値(例えば、3)以上を表示するとしてもよい。
【0097】
なお、本実施形態においても、第1実施形態の情報処理で行った、前処理や後処理等を行ってもよい。
【0098】
なお、本実施形態において、第1実施形態の変形例1の形態を組み合わせてもよい。図14には、この場合の情報処理装置10において実行される情報処理の流れの一例を表したフローチャートが示されている。
【0099】
この場合、単語抽出部43は、上述したように、患者情報15に含まれる各文書データ15Dから複数の単語データ15Wを抽出する。また、評価値導出部49は、上述したように、単語データ15W毎に、単語単位の評価値17Aを導出する。また、評価値導出部49は、文書データ15D毎に、文書データ15Dに含まれる単語データ15Wの評価値17Aに基づいた文書毎の評価値17を導出し、図14のステップS230で、文書毎の評価値17が最も大きい文書データ15Dを、第1評価値文書データとして、第1評価値を付与する。この場合の文書毎の評価値17が、本開示の第1統計値の一例である。なお第1評価値は、評価値17と相関関係を有する値であればよく、具体的な数値等は特に限定されない。
【0100】
次のステップS232で評価値導出部49は、記第1評価値文書データと、患者情報15に含まれる第1評価値文書データ以外の複数の文書データ15Dの各々とを組み合わせた複数の組合せデータを抽出する。次のステップS234で評価値導出部49は、組み合わせデータ毎に、組合せデータに含まれる単語データ15Wの評価値17Aに基づいた組合せデータ毎の評価値17を導出する。なお、第1評価値文書データと組み合わせる文書データ15Dに含まれる単語データ15Wのうち、第1評価値文書データに含まれる単語データ15Wの単語単位の評価値17Aを、第1評価値文書データに含まれない単語データ15Wの単語単位の評価値17Aよりも相対的に低くする。なお、相対的に低くした結果、評価値17Aを「0」としてもよい。すなわち、各単語データ15Wについて、1度のみ評価値17Aをカウントする形態としてもよい。
【0101】
次のステップS236で評価値導出部49は、全ての組合せデータを抽出したか否かを判定する。未だ全ての組合せデータを抽出していない場合、ステップS236の判定が否定判定となり、ステップS232に戻り、ステップS232及びS234の処理を繰り返す。一方、全ての組合せデータを抽出した場合ステップS236の判定が肯定判定となり、ステップS238へ移行する。
【0102】
ステップS238で評価値導出部49は、上記ステップS234で導出した評価値17が最も大きい組合せデータを、第2評価値文書データとして、第1評価値よりも低い第2評価値を付与する。この場合の組合せデータ毎の評価値17が、本開示の第2統計値の一例である。
【0103】
次のステップS240で表示制御部50は、第1評価値及び第2評価値に基づいて、患者情報15に含まれる全ての文書データ15Dから表示対象とする文書データ15Dを特定し、また、表示対象とした文書データ15Dの表示順序を特定する。
【0104】
次のステップS242で表示制御部50は、上述したように表示対象とした文書データ15Dに応じた文書を特定した表示順序で表示部28に表示させる。ステップS242の処理が終了すると、図14に示した情報処理が終了する。
【0105】
以上説明したように、上記各形態の情報処理装置10のCPU20Aは、複数の文書データ15Dを含む患者情報15を入力とし、出力データを出力する予後予測モデル32について、患者情報15に含まれる文書データ15D毎に、予後予測モデル32における評価値17を導出する。
【0106】
このように、上記各形態の情報処理装置10によれば、複数の文書データ15Dを含む患者情報15を入力とする予後予測モデル32における評価値17を、文書データ毎に得ることができる。これにより、評価値17に基づいてユーザに提供する文書データ15Dの特定、及び提供する順序の特定の少なくとも一方を行うことができるため、ユーザに対して、特定の患者に対して、有用な情報が、重要度が高い順で提供することが可能となる。となる
【0107】
[第3実施形態]
本実施形態では、上記各形態で用いられる機械学習モデルの学習方法について説明する。
【0108】
図15には、本実施形態の情報処理システム1における、全体の構成の一例を表す構成図が示されている。図15に示すように、本実施形態の情報処理システム1は、学習装置60及び学習情報DB62をさらに備える点で、上記実施形態の情報処理システム1(図1参照)と異なっている。学習装置60は、ネットワーク19を介して有線通信または無線通信により設計装置10と接続されており、また、有線通信または無線通信により学習情報DB62と接続されている。
【0109】
学習情報DB62には、機械学習モデルの学習に用いられる学習データ63が記憶される。学習情報DB62は、汎用コンピュータにデータベース管理システムの機能を提供するソフトウェアプログラムがインストールされたサーバ装置等に備えられた、HDD、SSD、及びフラッシュメモリ等の記憶媒体によって実現される。
【0110】
一例として本実施形態の学習データ63は、図16に示すように、学習用患者情報65と正解予後予測結果66Cとの組である。学習用患者情報65は、ある患者の診療に係わる複数の学習用文書データ65Dを含む。学習用文書データ65Dは、例えば、カルテ情報や、患者プロファイル情報、及び検査結果情報等の各々に含まれる文書毎のデータである。例えば、図16では、「カルテ情報」の「9/5 13:00」に対応する「CRP高値」、「食事をとられた」、「面談実施」、及び「微熱が続いている」の各々が学習用文書データ65Dである。なお、学習用文書データ65Dは、1文単位であってもよいし、予め定められた基準を満たす複数の文単位であってもよい。予め定められた基準としては、例えば、「S」、「O」、「A」、及び「P」等のカテゴリ毎とする基準や、カルテ毎とする基準等が挙げられる。一方、正解予後予測結果66Cは、上述の実施形態における正解予後予測結果96C(図3参照)と同様に、例えば、その患者の予後を実際に観察した結果から得られた死亡確率である。本実施形態の学習用患者情報65が本開示の学習用文書データ群の一例であり、本実施形態の学習用文書データ65Dが本開示の学習用文書データの一例である。また、本実施形態の正解予後予測結果66Cが本開示の正解データの一例である。
【0111】
図17に示すように本実施形態の学習装置60は、制御部70、記憶部72、通信I/F部74、操作部76、及び表示部78を備えている。制御部70、記憶部72、I/F部74、操作部76、及び表示部78はシステムバスやコントロールバス等のバス79を介して相互に各種情報の授受が可能に接続されている。
【0112】
本実施形態の制御部70は、学習装置60の全体の動作を制御する。制御部70は、プロセッサであり、CPU70Aを備える。なお、制御部70は、GPUを備えても良い。
【0113】
操作部76は、予後予測モデル82の学習に関する指示や情報等をユーザが入力するために用いられる。操作部76は特に限定されるものではなく、例えば、各種スイッチ、タッチパネル、タッチペン、マウス、音声入力用のマイク、及びジェスチャー入力用のカメラ等が挙げられる。表示部78は、予後予測モデル82の学習に関する情報等を表示する。なお、操作部76と表示部68とを一体化してタッチパネルディスプレイとしてもよい。
【0114】
通信I/F部64は、無線通信または有線通信により、ネットワーク19を介して情報処理装置10との間で各種情報の通信を行う。また、学習装置60は、学習情報DB62から学習データ63を、通信I/F部74を介して無線通信または有線通信により受信する。
【0115】
記憶部72は、ROM72A、RAM72B、ストレージ72Cを備える。ROM72Aには、CPU70Aにより実行される各種のプログラム等が予め記憶されている。RAM72Bは、各種データを一時的に記憶する。ストレージ72Cは、CPU70Aで実行される学習プログラム80、学習した予後予測モデル82、及びその他の各種情報等が記憶される。ストレージ72Cは不揮発性の記憶部であり、例えば、HDDやSSD等が挙げられる。
【0116】
さらに、図18には、本実施形態の学習装置60の構成の一例の機能ブロック図が示されている。図18に示すように学習装置60は、学習データ取得部100、文書抽出部102、出力データ取得部104、更新データ抽出部106、損失関数演算部108、及び制御基板110を備える。一例として本実施形態の学習装置60は、制御部70のCPU70Aがストレージ72Cに記憶されている学習プログラム80を実行することにより、CPU70Aが学習データ取得部100、文書抽出部102、出力データ取得部104、更新データ抽出部106、損失関数演算部108、及び制御基板110として機能する。
【0117】
学習データ取得部100は、学習情報DB62から学習データ63を取得する機能を有する。学習データ取得部100は、取得した学習データ63のうち、学習用患者情報65を文書抽出部102に出力し、また正解予後予測結果66Cを更新データ抽出部106に出力する。
【0118】
文書抽出部102は、学習用患者情報65から学習用文書データ65Dを、予め定められた基準に基づいて抽出する機能を有する。文書抽出部102は、抽出した学習用文書データ65Dを、出力データ取得部104に出力する。
【0119】
出力データ取得部104は、学習用文書データ65Dを予後予測モデル82に入力させた結果、予後予測モデル82から出力される出力データを取得する機能を有する。一例として本実施形態の出力データ取得部104は、図19に示すように、文書抽出部102が抽出した学習用患者情報65Dを1つずつ、予後予測モデル82に入力させる。具体的には、出力データ取得部104は、学習用文書データ65Dをベクトル化させて予後予測モデル82に入力させる。そして出力データ取得部104は、予後予測モデル82から出力されたそれぞれの出力データ120を取得する機能を有する。出力データ取得部104は、取得した複数の出力データ120を、更新データ抽出部106へ出力する。なお、本実施形態では、出力データ120として、百分率で表される死亡確率を、少数に直した値を用いている。例えば、図19における出力データ120が「0.9」とは、死亡確率が90%であることを意味している。なお、出力データ120と同様に、正解予後予測結果66Cに応じた正解データ124として、百分率で表される正解の死亡確率を、少数に直した値を用いている。例えば、図19における正解データ124が「1.0」とは、死亡確率が100%であることを意味している。
【0120】
更新データ抽出部106は、出力データ120と、正解予後予測結果66Cとに基づいて、複数の学習用文書データ65Dから一部の学習用文書データ65Dを、予後予測モデル82を更新するための更新データとして抽出する機能を有する。一例として、本実施形態の更新データ抽出部106は、出力データ120と正解データ124との類似度に基づいて、複数の学習用文書データ65Dから一部の学習用文書データ65Dを更新データとして抽出する。
【0121】
正解データ124と出力データ120との差が小さい出力データ120ほど、出力データ120と正解データ124との類似度が高いとみなせる。そのため、本実施形態の更新データ抽出部106は、複数の出力データ120のうち、類似度が高い方から上位X割(Xは予め定められた閾値)の出力データ120を出力させた際の学習用文書データ65Dを更新データとして抽出する。なお、本実施形態と異なり、更新データ抽出部106は、出力データ120と正解データ124との差が閾値以上となる出力データ120を出力させた際の学習用文書データ65Dを更新データとして抽出する形態であってもよい。更新データ抽出部106は、更新データとして抽出した学習用文書データ65Dを損失関数演算部108に出力する。
【0122】
損失関数演算部108は、更新データ抽出部106が更新データとして抽出した学習用文書データ65Dについて、学習用文書データ65D毎に、正解データ124と出力データ120との差異の程度を表す損失関数122を演算する。具体的には、本実施形態の損失関数122は、正解データ124と出力データ120との差の絶対値である。損失関数演算部108は、演算結果である損失関数122を更新部110に出力する。
【0123】
なお、本実施形態では、更新データ抽出部106が更新データとして学習用文書データ65Dを抽出した後、損失関数演算部108が、抽出した学習用文書データ65Dについて損失関数を演算する形態について説明したが、本実施形態と異なり、損失関数演算部108が損失関数を演算する際に、同時に出力データ抽出部106が更新データの抽出を行う形態としてもよい。具体的には下記(2)式及び(3)式の演算式のような形で対応してもよい。なお、(2)式及び(3)式における、Lは、i番目の学習データに対する損失を表しており、Tは、ある入院に対するカルテの文集合であり、ytは、t番目の文の正解ラベル、y^tは、t番目の文に対する予後予測モデル82の出力値、rは、その入院内でのその文の出力順位、lは、その入院に対するカルテの文書を表す。αとγは入院ごとに一部の文のみを考慮する度合いを決めるハイパパラメータである。
【数1】
【0124】
更新部110は、損失関数122に基づいて、予後予測モデル82を更新する機能を有する。
【0125】
出力データ取得部104、更新データ抽出部106、損失関数演算部108、及び制御基板110の各処理を繰り返すことにより、予後予測モデル82の精度が向上され、学習済みの予後予測モデル82が生成される。
【0126】
次に、本実施形態の学習装置60の作用について図面を参照して説明する。図20には、本実施形態の情報処理装置10において実行される学習処理の流れの一例を表したフローチャートが示されている。本実施形態の学習装置60は、一例として、操作部76により行われた、ユーザの開始指示等に基づいて、制御部70のCPU70Aが、ストレージ72Cに記憶されている学習プログラム80を実行することにより、図20に一例を示した学習処理を実行する。
【0127】
図20のステップS300で学習データ取得部100は、上述したように学習情報DB62から学習データ63を取得する。
【0128】
次のステップS302で文書抽出部102は、上述したように学習データ63の学習用患者情報65から複数の学習用文書データ65Dを抽出する。
【0129】
次のステップS304で出力データ取得部104は、上記ステップS302で抽出した複数の学習用文書データ65Dのうちの1つを予後予測モデル82に入力させる。次のステップS306で出力データ取得部104は、上記ステップS304の処理の結果、予後予測モデル82から出力される出力データ120を取得する。
【0130】
次のステップS308で出力データ取得部104は、上記ステップS302で抽出した全ての学習用文書データ65Dについて出力データ120を取得したか否か判断する。全ての学習用文書データ65Dについて出力データ120を取得するまで、ステップS308の判定が否定判定となり、ステップS304に戻り、ステップS304、306の処理を繰り返す。一方、全ての学習用文書データ65Dについて出力データ120を取得した場合、ステップS308の判定が肯定判定となり、ステップS310へ移行する。
【0131】
ステップS310で更新データ抽出部106は、上述したように、出力データ120と正解データ124との類似度に基づいて、学習用文書データ65Dを抽出する。
【0132】
次のステップS312で損失関数演算部108は、上述したように、上記ステップS310で抽出した学習用文書データ65Dについて、損失関数122を演算する。
【0133】
次のステップS314で更新部110は、上述したように、上記ステップS312で演算した損失関数122に基づいて予後予測モデル82を更新する。
【0134】
次のステップS316で更新部110は、図20に示した学習処理を終了するか否かを判定する。一例として本実施形態の更新部110は、正解データ124に対する予後予測モデル82の予測精度が予め定められた設定レベルまで達した場合に図20に示した学習処理を終了する。更新部110は、正解データ124に対する予後予測モデル82の予測精度が予め定められた設定レベルまで達していない場合、ステップS316の判定が否定判定となり、ステップS304に戻り、ステップS304~S314の処理を繰り返す。一方、正解データ124に対する予後予測モデル82の予測精度が予め定められた設定レベルまで達した場合、ステップS316の判定が肯定判定となり、図19に示した学習処理が終了する。
【0135】
なお、学習処理を終了する条件は、上記の条件に限られない。例えば、前述の損失関数の値が前のステップと比較して更新されなくなることを条件としてもよいし、また、文書抽出した性能を測る指標を用意してその数値が更新されなくなることを条件としてもよい。なお、文書抽出した性能を測る指標とは、例えば、予後予測モデル82を用いて予後予測に対する寄与度の高い文書として抽出した文書リストに対して、学術的、又はユーザにより重要と判断された文書リストとを比較した際の一致度、又は、類似度等が考えられる。
【0136】
(変形例)
本実施形態の学習装置60は上記形態に限定されず、種々の変形例が可能である。
【0137】
例えば、上記形態では、予測結果と関連性が低い学習用文書データ65Dは、予後予測モデル82の更新に用いなかったが、学習用文書データ65Dについても予後予測モデル82の更新に用いる形態としてもよい。例えば、損失関数演算部108が、予測結果と関連性が低い学習用文書データ65Dについては、予測結果と関連性が高い学習用文書データ65Dよりも重み付けを低くして損失関数122を演算し、この損失関数も用いて更新部110が予後予測モデル82を更新する形態としてもよい・
【0138】
また、予測結果と関連性が高い学習用文書データ65Dについても、損失関数演算部108が、出力データ120と損失関数122とに基づいて重み付けを行って、損失関数122を演算してもよい。例えば、損失関数演算部108は、類似度に応じて類似度が高くなるほど重くなる重み付けを行って損失関数122を演算してもよい。具体例としては、類似度が高い順の逆の順位、すなわち類似度が低い順に並べた場合の順位をGとし、予め設定したλを用いて重み付けを行った下記(1)式により得られる値を重みとして用いてもよい。
λ÷予測結果と関連性が高い学習用文書データ65Dの総数λ ・・・(1)
また、上記(1)式に代わり、出力データ120の値に応じて設定された重み付け値を用いてもよい。
【0139】
また、学習装置60は、予後予測モデル82の更新を繰り返す際に、更新回数が特定条件を満たす場合に、上記ステップS310の処理において抽出する学習用文書データ65Dの数を維持、または増加させてもよい。例えば、10回更新するごとに、1回は、全ての学習用文書データ65Dを抽出し、その他は、類似度が高い上位X割の学習用文書データ65Dを抽出する形態としてもよい。
【0140】
また、正解予後予測結果66Cに基づいて、学習用文書データ65Dについて異なるラベルを付与しても良い。例えば、予後予測モデル82の正解予後予測結果66Cが退院直前である確率を示す場合、学習用文書データ65Dを、退院直前である文書データとそれ以外の文書データに分離し、それぞれに対応するラベルを付与する。それぞれのラベルが付された文書データ群ごとに損失関数を演算して、演算された複数の損失関数を用いて予後予測モデル82を更新してもよい。このようにすることで、退院直前は患者の状態が良いことに着目して、状態が良いことを示す文書データを抽出するのに適した予後予測モデル82を生成することができる。
【0141】
以上のようにして学習された学習装置60は、複数の学習用文書データ65Dのうち出力データ120が、正解データ124に類似する一部の学習用文書データ65Dを重点的に用いて予後予測モデル82の更新を行うことで予後予測モデル82の学習を行う。複数の学習用文書データ65Dに含まれている、予測結果との関連性が低い学習用文書データ65Dを用いず、または用いても重要性を低くして予後予測モデル82の更新を行うため、より精度が高い予後予測モデル82を生成することができる。
【0142】
また、本実施形態の学習装置60により学習された予後予測モデル82は、文書データを入力とする高性能な機械学習モデルとなる。従って、文書データ群毎に予後予測モデル82に入力するのにかえて、文書データ毎に予後予測モデル82に入力し予測結果を得るのに用いることができる。
【0143】
なお、上記各形態では、本開示の機械学習モデルの一例として、所定のタスクに応じた状態の一例である患者が死亡状態となる確率を出力データとして出力する予後予測モデル32に関して説明したが、機械学習モデルは予後予測モデル32に限定されない。例えば、人員変動に関する情報や、製品に関する情報等にかかわる単語を含む企業のレポートを文書データ15Dとして複数含む文書データ群を入力データとし、その企業の経営状況が悪化する確率等、企業の動向についての予測結果を出力データとして出力する予測モデルにも適用できる。
【0144】
また、上記形態において、例えば、取得部40、予後予測結果導出部41、文書抽出部42、単語抽出部43、前処理部44、予後予測結果導出部46、後処理部48、評価値導出部49、及び表示制御部50といった各種の処理を実行する処理部(processing unit)のハードウェア的な構造としては、次に示す各種のプロセッサ(processor)を用いることができる。上記各種のプロセッサには、前述したように、ソフトウェア(プログラム)を実行して各種の処理部として機能する汎用的なプロセッサであるCPUに加えて、FPGA(Field Programmable Gate Array)等の製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス(Programmable Logic Device:PLD)、ASIC(Application Specific Integrated Circuit)等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が含まれる。
【0145】
1つの処理部は、これらの各種のプロセッサのうちの1つで構成されてもよいし、同種又は異種の2つ以上のプロセッサの組み合わせ(例えば、複数のFPGAの組み合わせや、CPUとFPGAとの組み合わせ)で構成されてもよい。また、複数の処理部を1つのプロセッサで構成してもよい。
【0146】
複数の処理部を1つのプロセッサで構成する例としては、第1に、クライアント及びサーバ等のコンピュータに代表されるように、1つ以上のCPUとソフトウェアの組み合わせで1つのプロセッサを構成し、このプロセッサが複数の処理部として機能する形態がある。第2に、システムオンチップ(System On Chip:SoC)等に代表されるように、複数の処理部を含むシステム全体の機能を1つのIC(Integrated Circuit)チップで実現するプロセッサを使用する形態がある。このように、各種の処理部は、ハードウェア的な構造として、上記各種のプロセッサの1つ以上を用いて構成される。
【0147】
更に、これらの各種のプロセッサのハードウェア的な構造としては、より具体的には、半導体素子などの回路素子を組み合わせた電気回路(circuitry)を用いることができる。
【0148】
また、上記各実施形態では、情報処理プログラム30が記憶部22に予め記憶(インストール)されている態様を説明したが、これに限定されない。情報処理プログラム30は、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disc Read Only Memory)、及びUSB(Universal Serial Bus)メモリ等の記録媒体に記録された形態で提供されてもよい。また、情報処理プログラム30の各々は、ネットワークを介して外部装置からダウンロードされる形態としてもよい。つまり、本実施形態で説明したプログラム(プログラム製品)は、記録媒体で提供するほか、外部のコンピュータから配信する形態であっても良い。
【0149】
以上の上記実施形態に関し、更に以下の付記を開示する。
【0150】
(付記1)
少なくとも1つのプロセッサを備え、
プロセッサは、
複数の文書データを含む文書データ群を入力とし、出力データを出力する機械学習モデルについて、
文書データ群に含まれる文書データ毎に、機械学習モデルにおける評価値を導出する
情報処理装置。
【0151】
(付記2)
プロセッサは、
導出した前評価値に基づいて、文書データ群から表示対象とする文書データの特定、及び文書データに応じた文書の表示順序の特定の少なくとも一方を行う
付記1に記載の情報処理装置。
【0152】
(付記3)
プロセッサは、
文書データ毎に機械学習モデルの入力とし、文書データ毎に出力された文書単位出力データを取得し、
文書単位出力データに基づいて、文書データ毎に評価値を導出する
付記1または付記2に記載の情報処理装置。
【0153】
(付記4)
評価値は、文書単位出力データに対して相関関係を有する
付記3に記載の情報処理装置。
【0154】
(付記5)
プロセッサは、
文書データ群に含まれる各文書データを正規化し、
正規化した文書データ毎に、評価値を導出する
付記1から付記4のいずれか1つに記載の情報処理装置。
【0155】
(付記6)
プロセッサは、
文書データ群に含まれる各文書データから複数の単語データを抽出し、
単語データ毎に、機械学習モデルにおける評価値を単語単位評価値として導出し、
文書データ毎に、文書データに含まれる単語データの単語単位評価値の統計値に応じて評価値を導出する
付記1または付記2に記載の情報処理装置。
【0156】
(付記7)
文書データ毎に導出した第1評価値が最も大きい文書データを第1文書データとし、また、文書データ群に含まれる第1文書データ以外の複数の文書データの各々を第2文書データとし、
プロセッサは、
第1文書データと、第2文書データとを組み合わせた組合せデータ毎に機械学習モデルの入力とし、組合せデータ毎に出力された出力データから第2評価値を導出する
付記1または付記2に記載の情報処理装置。
【0157】
(付記8)
プロセッサは、
第1文書データに第1表示優先度を付与し、
第2評価値に基づいて、第2文書データに第1表示優先度よりも低い第2表示優先度を付与する
付記7に記載の情報処理装置。
【0158】
(付記9)
プロセッサは、
文書データ群に含まれる各文書データから複数の単語データを抽出し、
単語データ毎に、機械学習モデルにおける評価値を単語単位評価値として導出し、
文書データ毎に、文書データに含まれる単語データの単語単位評価値の第1統計値を導出して、第1統計値が最も大きい文書データである第1評価値文書データに、第1評価値を付与し、
第1評価値文書データと、文書データ群に含まれる第1評価値文書データ以外の複数の文書データの各々とを組み合わせた複数の組合せデータについて、組み合わせデータ毎に、組合せデータに含まれる単語データの単語単位評価値の第2統計値を導出して、第2統計値が最も大きい文書データである第2評価値文書データに、第1評価値よりも低い第2評価値を付与し、
第2統計値の導出では、第1評価値文書データと組み合わせる文書データに含まれる単語データのうち、第1評価値文書データに含まれる単語データの単語単位評価値を、第1評価値文書データに含まれない単語データの単語単位評価値よりも相対的に低くする
付記1または付記2に記載の情報処理装置。
【0159】
(付記10)
機械学習モデルは、所定のタスクの遂行に用いられ、タスクに応じた状態となる確率を出力データとして出力するモデルである、
付記1から付記9のいずれか1つに記載の情報処理装置。
【0160】
(付記11)
文章データ群に含まれる複数の文書データは、特定の患者の診療に係わる文章を表す文書データであり、
機械学習モデルは、特定の患者の状態を予測するモデルである
付記1から付記10のいずれか1つに記載の情報処理装置。
【0161】
(付記12)
少なくとも1つのプロセッサを備える情報処理装置のプロセッサが実行する情報処理方法であって、
複数の文書データを含む文書データ群を入力とし、出力データを出力する機械学習モデルについて、
文書データ群に含まれる文書データ毎に、機械学習モデルにおける評価値を導出する
情報処理方法。
【0162】
(付記13)
少なくとも1つのプロセッサを備える情報処理装置のプロセッサに実行させるための情報処理プログラムであって、
複数の文書データを含む文書データ群を入力とし、出力データを出力する機械学習モデルについて、
文書データ群に含まれる文書データ毎に、機械学習モデルにおける評価値を導出する
情報処理プログラム。
【0163】
(付記14)
複数の文書データを入力とし、出力データを出力する機械学習モデルの学習装置であって、
少なくとも1つのプロセッサを備え、
前記プロセッサは、
複数の学習用文書データについて、学習用文書データ毎に、前記機械学習モデルの入力とし、前記学習用文書データ毎に出力された出力データを取得し、
前記学習用文書データ毎に得られた前記出力データと正解データとに基づいて、前記複数の学習用文書データから一部の学習用文書データについて、学習用文書データ毎に、正解データと出力データとの差異の程度を表す損失関数を演算し、
前記損失関数に基づいて、前記機械学習モデルを更新する
学習装置。
【0164】
(付記15)
前記プロセッサは、
前記出力データと前記正解データとの類似度に基づいて前記一部の学習用文書データを抽出する
付記14に記載の学習装置。
【0165】
(付記16)
前記プロセッサは、
前記一部の学習用文書データ以外の他の学習用文書データについても、学習用データ毎に、前記一部の学習用文書データよりも重みを低くして前記損失関数を演算し、
前記他の学習用文書データの前記損失関数にも基づいて、前記機械学習モデルを更新する
付記14または付記15に記載の学習装置。
【0166】
(付記17)
前記プロセッサは、
前記一部の学習用文書データについて、前記学習用文書データ毎に得られた前記出力データと前記正解データとに基づいて重み付けをして前記損失関数を演算する
付記14から付記16のいずれか1つに記載の学習装置。
【0167】
(付記18)
前記プロセッサは、
前記出力データと前記正解データとの類似度が高いほど重み付けを重くする
付記17に記載の学習装置。
【0168】
(付記19)
前記プロセッサは、
前記一部の学習用文書データにより得られた損失関数に基づく前記機械学習モデルの更新を繰り返し行い、
前記機械学習モデルの更新回数に応じて、抽出する前記一部の学習用文書データの数を変動させる、
付記14から付記18のいずれか1つに記載の学習装置。
【0169】
(付記20)
前記学習用文書データの各々は、対応付けられている前記機械学習モデルの予測結果の種類を表すラベルが付与されており、
前記プロセッサは、
前記ラベルの種類毎に、前記学習用文書データを抽出する
付記14から付記19のいずれか1つに記載の学習装置。
【0170】
(付記21)
少なくとも1つのプロセッサを備え、
前記プロセッサは、
複数の文書データを含む文書データ群を入力とし、出力データを出力する機械学習モデルについて、
前記文書データ群に含まれる文書データ毎に、前記機械学習モデルにおける評価値を導出する
前記機械学習モデルは、
複数の文書データを含む文書データ群を入力とし、出力データを出力する機械学習モデルの学習装置であって、
少なくとも1つの学習用プロセッサを備え、
前記学習用プロセッサは、
学習用文書データ群に含まれる学習用文書データ毎に、前記機械学習モデルの入力とし、前記学習用文書データ毎に出力された出力データを取得し、
前記学習用文書データ毎に得られた前記出力データと正解データとに基づいて、前記学習用文書データ群から一部の学習用文書データについて、学習用文書データ毎に、正解データと出力データとの差異の程度を表す損失関数を演算し、
前記損失関数に基づいて、前記機械学習モデルを更新する学習装置によって学習された機械学習モデルである、
情報処理装置。
【0171】
(付記22)
付記1から付記11のいずれか1つに記載の情報処理装置と、
付記14から付記20のいずれか1つに記載の学習装置と、
を備えた情報処理システム。
【0172】
(付記23)
プロセッサは、
複数の学習用文書データについて、学習用文書データ毎に、機械学習モデルの入力とし、前記学習用文書データ毎に出力された出力データを取得し、
前記学習用文書データ毎に得られた前記出力データと正解データとに基づいて、前記複数の学習用文書データから一部の学習用文書データについて、学習用文書データ毎に、正解データと出力データとの差異の程度を表す損失関数を演算し、
前記損失関数に基づいて、前記機械学習モデルを更新する
学習方法。
【0173】
(付記24)
プロセッサは、
複数の学習用文書データについて、学習用文書データ毎に、機械学習モデルの入力とし、前記学習用文書データ毎に出力された出力データを取得し、
前記学習用文書データ毎に得られた前記出力データと正解データとに基づいて、前記複数の学習用文書データから一部の学習用文書データについて、学習用文書データ毎に、正解データと出力データとの差異の程度を表す損失関数を演算し、
前記損失関数に基づいて、前記機械学習モデルを更新する
処理を実行させるための学習プログラム。
【符号の説明】
【0174】
1 情報処理システム
10 情報処理装置
14 患者情報DB
15 患者情報、15D、15D~15D 文書データ、15W 単語データ
16、16A~16D 予後予測結果
17、17A 評価値
19 ネットワーク
20、70 制御部、20A、70A CPU
22、72 記憶部、22A、72A ROM、22B、72B RAM、22C、72C ストレージ
24、74 通信I/F部
26、76 操作部
28、78 表示部
29、79 バス
30、82 情報処理プログラム
32 予後予測モデル
40 取得部
41 予後予測結果導出部
42 文書抽出部
43 単語抽出部
44 前処理部
46、46B 予後予測結果導出部
48 後処理部
49 評価値導出部
50 表示制御部
60、90 学習装置
62 学習情報DB
63 学習データ
65、95 学習用患者情報、65D、95D 学習用文書データ
66C、96C 正解予後予測結果
80 学習プログラム
100 学習データ取得部
102 文書抽出部
104 出力データ取得部
106 更新データ抽出部
108 損失関数演算部
110 更新部
120 出力データ
122 損失関数
124 正解データ
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20