IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士フイルム株式会社の特許一覧

特開2024-125070情報処理装置、情報処理方法及びプログラム
<>
  • 特開-情報処理装置、情報処理方法及びプログラム 図1
  • 特開-情報処理装置、情報処理方法及びプログラム 図2
  • 特開-情報処理装置、情報処理方法及びプログラム 図3
  • 特開-情報処理装置、情報処理方法及びプログラム 図4
  • 特開-情報処理装置、情報処理方法及びプログラム 図5
  • 特開-情報処理装置、情報処理方法及びプログラム 図6
  • 特開-情報処理装置、情報処理方法及びプログラム 図7
  • 特開-情報処理装置、情報処理方法及びプログラム 図8
  • 特開-情報処理装置、情報処理方法及びプログラム 図9
  • 特開-情報処理装置、情報処理方法及びプログラム 図10
  • 特開-情報処理装置、情報処理方法及びプログラム 図11
  • 特開-情報処理装置、情報処理方法及びプログラム 図12
  • 特開-情報処理装置、情報処理方法及びプログラム 図13
  • 特開-情報処理装置、情報処理方法及びプログラム 図14
  • 特開-情報処理装置、情報処理方法及びプログラム 図15
  • 特開-情報処理装置、情報処理方法及びプログラム 図16
  • 特開-情報処理装置、情報処理方法及びプログラム 図17
  • 特開-情報処理装置、情報処理方法及びプログラム 図18
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024125070
(43)【公開日】2024-09-13
(54)【発明の名称】情報処理装置、情報処理方法及びプログラム
(51)【国際特許分類】
   G16H 15/00 20180101AFI20240906BHJP
【FI】
G16H15/00
【審査請求】未請求
【請求項の数】18
【出願形態】OL
(21)【出願番号】P 2023033155
(22)【出願日】2023-03-03
(71)【出願人】
【識別番号】306037311
【氏名又は名称】富士フイルム株式会社
(74)【代理人】
【識別番号】100083116
【弁理士】
【氏名又は名称】松浦 憲三
(74)【代理人】
【識別番号】100170069
【弁理士】
【氏名又は名称】大原 一樹
(74)【代理人】
【識別番号】100128635
【弁理士】
【氏名又は名称】松村 潔
(74)【代理人】
【識別番号】100140992
【弁理士】
【氏名又は名称】松浦 憲政
(74)【代理人】
【識別番号】100153822
【弁理士】
【氏名又は名称】増田 重之
(72)【発明者】
【氏名】初谷 太郎
(72)【発明者】
【氏名】小笠原 彩
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA21
(57)【要約】
【課題】文章及び画像を含む文書の画像と文章との対応付けに関する間違いを減らし、及び/又は元の文書と比較して読みやすい文書を作成する情報処理装置、情報処理方法及びプログラムを提供する。
【解決手段】少なくとも1つのプロセッサと、少なくとも1つのプロセッサに実行させるための命令を記憶する少なくとも1つのメモリと、を備え、少なくとも1つのプロセッサは、受け付けた1以上の画像に写っている物体に関する情報を取得し、受け付けた1以上の文章に記載されている情報を取得し、物体に関する情報と記載されている情報とに基づいて、画像と文章との対応の有無を判断し、対応の有無に基づいて画像と文章とを含む文書の作成を補助する処理を実行する。
【選択図】図3
【特許請求の範囲】
【請求項1】
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに実行させるための命令を記憶する少なくとも1つのメモリと、
を備え、
前記少なくとも1つのプロセッサは、
受け付けた1以上の画像に写っている物体に関する情報を取得し、
受け付けた1以上の文章に記載されている情報を取得し、
前記物体に関する情報と前記記載されている情報とに基づいて、前記画像と前記文章との対応の有無を判断し、
前記対応の有無に基づいて前記画像と前記文章とを含む文書の作成を補助する処理を実行する、
情報処理装置。
【請求項2】
前記処理は、前記文章に対応する前記画像が非存在の場合に警告する処理である、
請求項1に記載の情報処理装置。
【請求項3】
前記処理は、前記文章に対応する前記画像が非存在であり、かつ前記文章の重要度であって、前記文章に対応する画像が必要である程度を示す重要度が閾値以上の場合に警告する処理である、
請求項1に記載の情報処理装置。
【請求項4】
前記処理は、前記画像に対応する前記文章が非存在の場合に警告する処理である、
請求項1に記載の情報処理装置。
【請求項5】
前記処理は、前記対応が有ると判断された前記文章及び前記画像のうちの一方の順序に基づいて他方の順序を並べ替える処理である、
請求項1に記載の情報処理装置。
【請求項6】
前記処理は、前記文章の順序に基づいて前記画像の順序を並べ替える処理である、
請求項5に記載の情報処理装置。
【請求項7】
前記処理は、前記対応が有ると判断された前記文章及び前記画像のうちの前記画像に図番号を付与する処理である、
請求項1に記載の情報処理装置。
【請求項8】
前記図番号を付与する処理は、前記画像に写っている物体が前記対応する前記文章に登場する順に図番号を付与する処理である、
請求項7に記載の情報処理装置。
【請求項9】
前記処理は、前記対応が有ると判断された前記文章及び前記画像のうちの前記文章に対して前記画像に付与された図番号を付与する処理である、
請求項8に記載の情報処理装置。
【請求項10】
前記処理は、前記文章の対応する部分に図番号を付与する処理である、
請求項9に記載の情報処理装置。
【請求項11】
前記少なくとも1つのプロセッサは、
前記画像の入力、及び前記文章の入力のうちのいずれかを受け付けるごとに、前記処理を実行する、
請求項1に記載の情報処理装置。
【請求項12】
前記画像の入力、及び前記文章の入力のうちのいずれかを受け付けるごとに、前記処理を実行する第1のモードと、すべての前記画像、及びすべての前記文章の入力を受け付けた後に前記処理を実行する第2のモードと、
を備える、
請求項11に記載の情報処理装置。
【請求項13】
前記少なくとも1つのプロセッサは、
前記物体に関する情報と前記記載されている情報とが対応している確からしさを示す確信度を取得し、
前記確信度に基づいて前記画像と前記文章との対応の有無を判断する、
請求項1に記載の情報処理装置。
【請求項14】
前記少なくとも1つのプロセッサは、
前記受け付けた画像、又は前記受け付けた画像の作成元となった元画像を解析して前記物体に関する情報を取得する、
請求項1に記載の情報処理装置。
【請求項15】
前記画像は、医療画像に基づくキー画像である、
請求項1から14のいずれか1項に記載の情報処理装置。
【請求項16】
前記物体は、臓器及び腫瘍のうちの少なくとも一方を含み、
前記物体に関する情報は、大きさ、性状、病名、位置、及び特徴量のうちの少なくとも1つを含む、
請求項15に記載の情報処理装置。
【請求項17】
少なくとも1つのプロセッサが、
受け付けた1以上の画像に写っている物体に関する情報を取得し、
受け付けた1以上の文章に記載されている情報を取得し、
前記物体に関する情報と前記記載されている情報とに基づいて、前記画像と前記文章との対応の有無を判断し、
前記対応の有無に基づいて前記画像と前記文章とを含む文書の作成を補助する処理を実行する、
情報処理方法。
【請求項18】
請求項17に記載の情報処理方法をコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は情報処理装置、情報処理方法及びプログラムに係り、特に文章及び画像を含む文書の作成を補助する技術に関する。
【背景技術】
【0002】
医師は読影レポートを作成する際に、重要所見に対してキー画像を作成する。キー画像は、他の医師が読影レポートを読む際に素早く病変の状況及び位置等を確認できるように、また将来同一患者の画像を読影する際に参考にするために作成される。
【0003】
医師はキー画像の作成に伴い、重要所見のキー画像が作成されているかの確認、読影レポートの順番とキー画像の順番とを同じにする並べ替え、読影レポートへの図番号の挿入、といった作業が必要となる。
【0004】
しかしながら、これらの作業は負担のかかる作業であり、読影レポートの順番とキー画像の順番とが一致しない、不要なキー画像が存在する、及び記述漏れのあるキー画像が存在する等の不具合が発生することがある。
【0005】
特許文献1には、読影中の注目領域と読影レポートの内容を取得し、整合性を判断する技術が開示されている。特許文献1の技術は、キー画像の有無の判定は行っておらず、読影レポート中の重要所見に対してキー画像の添付がない不具合が発生する可能性がある。また、特許文献1の技術は、キー画像と所見文との対応付けを行っておらず、図番号の付与等を行うことはできない。
【0006】
また、特許文献2には、所見文の順番に画像を並べ替える技術が開示されている。しかしながら、特許文献2の技術は、ユーザが画像と所見との対応付けを行う技術であり、医師の負担を減らすものではなかった。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2016-057695号公報
【特許文献2】特許第6923863号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
本発明はこのような事情に鑑みてなされたもので、文章及び画像を含む文書の画像と文章との対応付けに関する間違いを減らし、及び/又は元の文書と比較して読みやすい文書を作成する情報処理装置、情報処理方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成するために、本開示の第1態様に係る情報処理装置は、少なくとも1つのプロセッサと、少なくとも1つのプロセッサに実行させるための命令を記憶する少なくとも1つのメモリと、を備え、少なくとも1つのプロセッサは、受け付けた1以上の画像に写っている物体に関する情報を取得し、受け付けた1以上の文章に記載されている情報を取得し、物体に関する情報と記載されている情報とに基づいて、画像と文章との対応の有無を判断し、対応の有無に基づいて画像と文章とを含む文書の作成を補助する処理を実行する情報処理装置である。
【0010】
第1態様によれば、文章及び画像を含む文書の画像と文章との対応付けに関する間違いを減らし、及び/又は元の文書と比較して読みやすい文書を作成することができる。
【0011】
本開示の第2態様に係る情報処理装置は、第1態様に係る情報処理装置において、処理は、文章に対応する画像が非存在の場合に警告する処理であってもよい。これにより、文章に対応する画像が非存在となる画像添付漏れを無くすことができる。
【0012】
本開示の第3態様に係る情報処理装置は、第1態様又は第2態様に係る情報処理装置において、処理は、文章に対応する画像が非存在であり、かつ文章の重要度であって、文章に対応する画像が必要である程度を示す重要度が閾値以上の場合に警告する処理であってもよい。これにより、重要な文章にもかかわらず対応する画像が非存在となる画像添付漏れを無くすことができる。
【0013】
本開示の第4態様に係る情報処理装置は、第1態様から第3態様のいずれかに係る情報処理装置において、処理は、画像に対応する文章が非存在の場合に警告する処理であってもよい。これにより、画像に対応する文章が非存在となる文章記載漏れを無くすことができる。
【0014】
本開示の第5態様に係る情報処理装置は、第1態様から第4態様のいずれかに係る情報処理装置において、処理は、対応が有ると判断された文章及び画像のうちの一方の順序に基づいて他方の順序を並べ替える処理であってもよい。これにより、文章の順番と画像の順番とを一致させて読みやすい文書にすることができる。
【0015】
本開示の第6態様に係る情報処理装置は、第1態様から第5態様のいずれかに係る情報処理装置において、処理は、文章の順序に基づいて画像の順序を並べ替える処理であってもよい。これにより、文章の順番と画像の順番とを一致させることができる。
【0016】
本開示の第7態様に係る情報処理装置は、第1態様から第6態様のいずれかに係る情報処理装置において、処理は、対応が有ると判断された文章及び画像のうちの画像に図番号を付与する処理であってもよい。これにより、画像に図番号を付与し、文書の記載を豊富にすることができる。
【0017】
本開示の第8態様に係る情報処理装置は、第7態様に係る情報処理装置において、図番号を付与する処理は、画像に写っている物体が対応する文章に登場する順に図番号を付与する処理であってもよい。これにより、文章の登場順に図番号を付与することができる。
【0018】
本開示の第9態様に係る情報処理装置は、第8態様に係る情報処理装置において、処理は、対応が有ると判断された文章及び画像のうちの文章に対して画像に付与された図番号を付与する処理であってもよい。これにより、文章に図番号を付与し、文書の記載を豊富にすることができる。
【0019】
本開示の第10態様に係る情報処理装置は、第9態様に係る情報処理装置において、処理は、文章の対応する部分に図番号を付与する処理であってもよい。これにより、読みやすい文書にすることができる。
【0020】
本開示の第11態様に係る情報処理装置は、第1態様から第10態様のいずれかに係る情報処理装置において、少なくとも1つのプロセッサは、画像の入力、及び文章の入力のうちのいずれかを受け付けるごとに、処理を実行してもよい。これにより、処理を随時実行することができる。
【0021】
本開示の第12態様に係る情報処理装置は、第1態様から第11態様のいずれかに係る情報処理装置において、画像の入力、及び文章の入力のうちのいずれかを受け付けるごとに、処理を実行する第1のモードと、すべての画像、及びすべての文章の入力を受け付けた後に処理を実行する第2のモードと、を備えてもよい。これにより、いずれかのモードで処理を実行することができる。
【0022】
本開示の第13態様に係る情報処理装置は、第1態様から第12態様のいずれかに係る情報処理装置において、少なくとも1つのプロセッサは、物体に関する情報と記載されている情報とが対応している確からしさを示す確信度を取得し、確信度に基づいて画像と文章との対応の有無を判断してもよい。これにより、画像と文章との対応の有無を適切に判断することができる。
【0023】
本開示の第14態様に係る情報処理装置は、第1態様から第13態様のいずれかに係る情報処理装置において、少なくとも1つのプロセッサは、受け付けた画像、又は受け付けた画像の作成元となった元画像を解析して物体に関する情報を取得してもよい。これにより、物体に関する情報を適切に取得することができる。
【0024】
本開示の第15態様に係る情報処理装置は、第1態様から第14態様のいずれかに係る情報処理装置において、画像は、医療画像に基づくキー画像であってもよい。
【0025】
本開示の第16態様に係る情報処理装置は、第15態様に係る情報処理装置において、物体は、臓器及び腫瘍のうちの少なくとも一方を含み、物体に関する情報は、大きさ、性状、病名、位置、及び特徴量のうちの少なくとも1つを含んでもよい。
【0026】
上記目的を達成するために、本開示の第17態様に係る情報処理方法は、少なくとも1つのプロセッサが、受け付けた1以上の画像に写っている物体に関する情報を取得し、受け付けた1以上の文章に記載されている情報を取得し、物体に関する情報と記載されている情報とに基づいて、画像と文章との対応の有無を判断し、対応の有無に基づいて画像と文章とを含む文書の作成を補助する処理を実行する情報処理方法である。
【0027】
第17態様によれば、文章及び画像を含む文書の画像と文章との対応付けに関する間違いを減らし、及び/又は元の文書と比較して読みやすい文書を作成することができる。第17態様において、第2態様から第16態様で特定した事項と同様の事項を適宜組み合わせることができる。
【0028】
上記目的を達成するために、本開示の第18態様に係るプログラムは、第17態様の情報処理方法をコンピュータに実行させるプログラムである。第18態様に係るプログラムを記憶したCD-ROM(Compact Disk-Read Only Memory)等の非一時的かつコンピュータ読取可能な記録媒体も本開示に含まれる。
【0029】
第18態様によれば、文章及び画像を含む文書の画像と文章との対応付けに関する間違いを減らし、及び/又は元の文書と比較して読みやすい文書を作成することができる。
【発明の効果】
【0030】
本発明によれば、文章及び画像を含む文書の画像と文章との対応付けに関する間違いを減らし、及び/又は元の文書と比較して読みやすい文書を作成することができる。
【図面の簡単な説明】
【0031】
図1図1は、医用情報処理システムの全体構成図である。
図2図2は、医用情報処理装置の電気的構成を示すブロック図である。
図3図3は、医用情報処理装置の機能的構成を示すブロック図である。
図4図4は、読影レポートを示す図である。
図5図5は、医用情報処理方法を示すフローチャートである。
図6図6は、読影レポートを示す図である。
図7図7は、読影レポートを示す図である。
図8図8は、確信度を用いた所見文とキー画像との対応を説明するための図である。
図9図9は、2つ以上のキー画像と1つの所見文とが対応付いた場合を説明するための図である。
図10図10は、1つのキー画像と複数の所見文とが対応付いた場合を説明するための図である。
図11図11は、言語特徴抽出モデルの生成方法に用いられる学習用のデータの例を示す説明図である。
図12図12は、言語特徴抽出モデルを学習させる機械学習装置の機能的構成を概略的に示すブロック図である。
図13図13は、機械学習装置のハードウェア構成の例を示すブロック図である。
図14図14は、機械学習装置が実行する機械学習方法の例を示すフローチャートである。
図15図15は、画像特徴抽出モデル及びクロスモーダル特徴統合モデルを学習させる機械学習装置の機能的構成を概略的に示すブロック図である。
図16図16は、機械学習装置が実行する機械学習方法の例を示すフローチャートである。
図17図17は、物体情報取得部の機能的構成を示すブロック図である。
図18図18は、物体情報取得部による医療画像解析方法を示すフローチャートである。
【発明を実施するための形態】
【0032】
以下、添付図面に従って本発明の好ましい実施形態について詳説する。ここでは、本発明に係る情報処理装置、情報処理方法及びプログラムの一例として、医用情報処理システムを例に説明する。
【0033】
<医用情報処理システム>
本実施形態に係る医用情報処理システムは、医療画像に基づくキー画像に写っている物体に関する情報を取得し、所見文に記載されている情報を取得し、物体に関する情報と記載されている情報とに基づいてキー画像と所見文との対応の有無を判断し、対応の有無に基づいて所見文及びキー画像を含む読影レポートの作成を補助する補助処理を実行するシステムである。医用情報処理システムにより、読影レポート(「文書」の一例)の医療画像と所見文との対応付けに関する間違いを減らし、及び/又は元の読影レポートと比較して読みやすい読影レポートを作成することができる。
【0034】
図1は、医用情報処理システム10の全体構成図である。図1に示すように、医用情報処理システム10は、医療画像検査機器12と、医療画像データベース14と、ユーザ端末装置16と、読影レポートデータベース18と、医用情報処理装置20と、を備えて構成される。
【0035】
医療画像検査機器12と、医療画像データベース14と、ユーザ端末装置16と、読影レポートデータベース18と、医用情報処理装置20とは、ネットワーク22を介してそれぞれデータを送受信可能に接続される。ネットワーク22は、医療機関内の各種機器を通信接続する有線、又は無線のLAN(Local Area Network)を含む。ネットワーク22は、複数の医療機関のLAN同士を接続するWAN(Wide Area Network)を含んでもよい。
【0036】
医療画像検査機器12は、被検体の検査対象部位を撮像し、医療画像を生成する撮影装置である。医療画像検査機器12の例として、X線撮影装置、CT(Computed Tomography)装置、MRI(Magnetic Resonance Imaging)装置、PET(Positron Emission Tomography)装置、超音波装置、平面X線検出器を用いたCR(Computed Radiography)装置、及び内視鏡装置が挙げられる。
【0037】
医療画像データベース14は、医療画像検査機器12によって撮像された医療画像を管理するデータベースである。医療画像データベース14は、医療画像を保存するための大容量ストレージ装置を備えるコンピュータが適用される。コンピュータには、データベース管理システムの機能を提供するソフトウェアが組み込まれる。
【0038】
医療画像は、CT装置、MRI装置等によって撮像された複数の断層画像であってもよいし、複数の断層画像を用いて再構成された3次元再構成画像であってもよい。3次元再構成画像の任意の方向の断面画像であってもよい。
【0039】
医療画像のフォーマットは、Dicom(Digital Imaging and COmmunications in Medicine)規格を適用可能である。医療画像は、Dicom規格において規定された付帯情報(Dicomタグ情報)が付加されてもよい。なお、本明細書における画像という用語には、写真等の画像自身の意味の他に、画像を表す信号である画像データの意味が含まれる。
【0040】
ユーザ端末装置16は、ユーザである医師が読影レポートを作成、及び閲覧するための端末機器であり、医師が医療画像を閲覧するビューアソフトウェアを含む。ユーザ端末装置16は、例えばパーソナルコンピュータが適用される。ユーザ端末装置16は、ワークステーションであってもよいし、タブレット端末であってもよい。ユーザ端末装置16は、入力装置16A及び表示装置であるディスプレイ16Bを備える。入力装置16Aは、マウス、及びキーボードを含んでもよい。
【0041】
医師は、入力装置16Aを使用して医療画像の表示の指示を入力する。ユーザ端末装置16は、指示に従って医療画像をディスプレイ16Bに表示させる。医師は、入力装置16Aを使用して表示された医療画像からキー画像を作成する。さらに、医師は、入力装置16Aを使用して医療画像の読影結果を示す文章である所見文を入力する。このように、医師は、ユーザ端末装置16を用いてキー画像及び所見文を含む読影レポートを作成する。
【0042】
なお、キー画像とは、読影レポートの対象となる被検体の検査において撮像された医療画像のうち、所見文の内容から読影において重要と判断される画像である。
【0043】
読影レポートデータベース18は、医師が作成した読影レポートを管理するデータベースである。読影レポートデータベース18は、読影レポートを保存するための大容量ストレージ装置を備えるコンピュータが適用される。コンピュータには、データベース管理システムの機能を提供するソフトウェアが組み込まれる。医療画像データベース14と読影レポートデータベース18とは、1つのコンピュータで構成されてもよい。
【0044】
医用情報処理装置20は、読影レポートの作成を補助する処理である補助処理を実行する装置である。医用情報処理装置20は、パーソナルコンピュータ、又はワークステーション(「コンピュータ」の一例)を適用可能である。図2は、医用情報処理装置20の電気的構成を示すブロック図である。図2に示すように、医用情報処理装置20は、プロセッサ20Aと、メモリ20Bと、通信インターフェース20Cと、を備える。
【0045】
プロセッサ20Aは、メモリ20Bに記憶された命令を実行する。プロセッサ20Aのハードウェア的な構造は、次に示すような各種のプロセッサ(processor)である。各種のプロセッサには、ソフトウェア(プログラム)を実行して各種の機能部として作用する汎用的なプロセッサであるCPU(Central Processing Unit)、画像処理に特化したプロセッサであるGPU(Graphics Processing Unit)、FPGA(Field Programmable Gate Array)等の製造後に回路構成を変更可能なプロセッサであるPLD(Programmable Logic Device)、ASIC(Application Specific Integrated Circuit)等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が含まれる。
【0046】
1つの処理部は、これら各種のプロセッサのうちの1つで構成されていてもよいし、同種又は異種の2つ以上のプロセッサ(例えば、複数のFPGA、又はCPUとFPGAの組み合わせ、あるいはCPUとGPUの組み合わせ)で構成されてもよい。また、複数の機能部を1つのプロセッサで構成してもよい。複数の機能部を1つのプロセッサで構成する例としては、第1に、クライアント又はサーバ等のコンピュータに代表されるように、1つ以上のCPUとソフトウェアの組合せで1つのプロセッサを構成し、このプロセッサが複数の機能部として作用させる形態がある。第2に、SoC(System On Chip)等に代表されるように、複数の機能部を含むシステム全体の機能を1つのIC(Integrated Circuit)チップで実現するプロセッサを使用する形態がある。このように、各種の機能部は、ハードウェア的な構造として、上記各種のプロセッサを1つ以上用いて構成される。
【0047】
さらに、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子等の回路素子を組み合わせた電気回路(circuitry)である。
【0048】
メモリ20Bは、プロセッサ20Aに実行させるための命令を記憶する。メモリ20Bは、不図示のRAM(Random Access Memory)、及びROM(Read Only Memory)を含む。プロセッサ20Aは、RAMを作業領域とし、ROMに記憶された後述する医用情報処理プログラムを含む各種のプログラム及びパラメータを使用してソフトウェアを実行し、かつROM等に記憶されたパラメータを使用することで、医用情報処理装置20の各種の処理を実行する。
【0049】
通信インターフェース20Cは、所定のプロトコルに従って、ネットワーク22を介した医療画像検査機器12、医療画像データベース14、ユーザ端末装置16、及び読影レポートデータベース18との通信を制御する。
【0050】
医用情報処理装置20は、インターネットを介して複数の医療機関からアクセス可能なクラウドサーバであってもよい。医用情報処理装置20で行う処理は、課金制、又は固定料金制のクラウドサービスであってもよい。
【0051】
〔医用情報処理装置の機能的構成〕
図3は、医用情報処理装置20の機能的構成を示すブロック図である。医用情報処理装置20の各機能は、プロセッサ20Aがメモリ20Bに記憶された医用情報処理プログラムを実行することで具現化される。図3に示すように、医用情報処理装置20は、画像取得部32と、物体情報取得部34と、文章取得部36と、記載情報取得部38と、対応判断部40と、補助処理実行部42と、を備える。
【0052】
画像取得部32は、読影レポートに使用される1以上のキー画像を取得する。例えば、画像取得部32は、医療画像データベース14から医療画像を取得し、ディスプレイ16Bに表示させる。医師は、ディスプレイ16Bに表示された医療画像から読影において重要と判断される領域を入力装置16Aによってトリミングしてキー画像を作成する。画像取得部32は、医師によって作成されたキー画像を受け付ける。画像取得部32は、読影レポートに既に記載されているキー画像を取得してもよい。
【0053】
物体情報取得部34は、画像取得部32が取得した1以上のキー画像に写っている物体に関する物体情報を取得する。物体情報取得部34は、キー画像を解析して物体情報を取得してもよいし、キー画像の作成元となった元画像である医療画像を解析して物体情報を取得してもよい。物体は、臓器及び腫瘍のうちの少なくとも一方を含む。物体情報は、大きさ、性状、病名、位置、及び特徴量のうちの少なくとも1つを含む。物体情報取得部34は、物体情報として、キー画像の特徴量を示す画像特徴を取得してもよい。画像特徴は、キー画像を特徴ベクトル化して得られる画像特徴ベクトルで表現されてもよいし、複数チャンネルの特徴マップであってもよい。
【0054】
文章取得部36は、読影レポートに使用される1以上の所見文を取得する。例えば、医師は、キー画像に関する所見文を入力装置16Aによって入力する。文章取得部36は、医師によって入力された所見文を受け付ける。文章取得部36は、医師によって入力された所見文を構造解析によって構造化した構造化データを受け付けてもよい。
【0055】
記載情報取得部38は、文章取得部36が取得した1以上の所見文に記載されている記載情報を取得する。記載情報取得部38は、記載情報として、所見文に対応する特徴量が抽出された言語特徴ベクトルを取得してもよい。
【0056】
対応判断部40は、物体情報取得部34が取得した物体情報と記載情報取得部38が取得した記載情報とに基づいて、画像取得部32が取得したキー画像と文章取得部36が取得した所見文とのそれぞれの組み合わせについて対応の有無を判断する。対応判断部40は、物体情報と記載情報とが対応している確からしさを示す確信度を取得し、取得した確信度に基づいてキー画像と所見文との対応の有無を判断してもよい。例えば、対応判断部40は、キー画像の物体情報と所見文の記載情報との確信度が閾値以上の場合にキー画像と所見文との対応が有ると判断し、確信度が閾値未満の場合にキー画像と所見文との対応が無いと判断してもよい。
【0057】
補助処理実行部42は、対応判断部40が判断した対応の有無に基づく補助処理を実行する。補助処理は、所見文に対応するキー画像が非存在の場合に警告する処理であってもよい。補助処理は、所見文に対応するキー画像が非存在であり、かつ所見文が重要所見である場合に警告する処理であってもよい。所見文に対応するキー画像が非存在であり、かつ所見文が重要所見ではない場合は、補助処理を行わなくてよい。
【0058】
なお、重要所見とは、キー画像を作成する必要がある所見である。キー画像を作成する必要がある所見とは、例えば特定の病気が記載された所見である。補助処理実行部42は、所見文の重要度であって、所見文に対応するキー画像が必要である程度を示す重要度を算出し、所見文の重要度が閾値以上の場合に重要所見であると判断してもよい。
【0059】
補助処理は、キー画像に対応する所見文が非存在の場合に警告する処理であってもよい。補助処理は、対応が有ると判断された所見文及びキー画像のうちの一方の順序に基づいて他方の順序を並べ替える処理であってもよい。補助処理は、所見文の順序に基づいてキー画像の順序を並べ替える処理であってもよい。
【0060】
補助処理は、対応が有ると判断された所見文及びキー画像のうちのキー画像に図番号を付与する処理であってもよい。図番号を付与する処理は、キー画像に写っている物体が対応する所見文に登場する順に図番号を付与する処理であってもよい。
【0061】
補助処理は、対応が有ると判断された所見文及びキー画像のうちの所見文にキー画像に付与された図番号を付与する処理であってもよい。補助処理は、所見文の対応する部分に図番号を付与する処理であってもよい。
【0062】
補助処理実行部42は、画像取得部32におけるキー画像、及び文章取得部36における所見文のうちのいずれかを受け付けるごとに、補助処理を実行してもよい。補助処理実行部42は、画像取得部32におけるすべてのキー画像、及び文章取得部36におけるすべての所見文を受け付けた後に補助処理を実行しもよい。医用情報処理装置20は、キー画像及び所見文のうちのいずれかを受け付けるごとに補助処理を実行する第1のモードと、すべてのキー画像及びすべての所見文の取得を受け付けた後に補助処理を実行する第2のモードと、を備えてもよい。第1のモードと第2のモードとは、医師による入力装置16Aの操作によって切り替え可能であってもよい。
【0063】
<医用情報処理方法>
図4は、ユーザ端末装置16のディスプレイ16Bに表示された読影レポートRP1を示す図である。読影レポートRP1は、医師によって作成されたものである。
【0064】
読影レポートRP1の表示領域D1は、所見文が表示される領域である。表示領域D1には、上から順に、所見文SN1「有意なリンパ節腫大は認めません。」、所見文SN2「coronary a.に石灰化が認められます。」、所見文SN3「少量の右胸水が認められます。」、所見文SN4「甲状腺左葉に11mm大の低吸収が認められます。」、及び所見文SN5「右鎖骨遠位部及び右第肋骨に骨折後の変化が認められます。」が表示されている。
【0065】
また、読影レポートRP1の表示領域D2は、キー画像が表示される領域である。表示領域D2には、左から順に病変領域A1を含むキー画像IK1、及び病変領域A2を含むキー画像IK2が表示されている。
【0066】
図5は、医用情報処理装置20を用いた医用情報処理方法を示すフローチャートである。医用情報処理方法は、キー画像に写っている物体情報と、所見文に記載されている記載情報とに基づいて、キー画像と所見文との対応の有無に基づく補助処理を実行する方法である。医用情報処理方法は、プロセッサ20Aがメモリ20Bに記憶された医用情報処理プログラムを実行することで実現される。医用情報処理プログラムは、コンピュータが読み取り可能な非一時的記憶媒体によって医用情報処理装置20に提供されてもよいし、インターネットを介して医用情報処理装置20に提供されてもよい。ここでは、図4に示した読影レポートRP1に対して補助処理を実行する例を説明する。
【0067】
ステップS1では、画像取得部32は、読影レポートに使用される1以上のキー画像を取得する。ここでは、画像取得部32は、キー画像IK1、及びキー画像IK2を取得する。
【0068】
ステップS2では、物体情報取得部34は、ステップS1で取得したキー画像IK1、及びキー画像IK2にそれぞれ写っている物体に関する物体情報を取得する。ここでは、物体情報取得部34は、物体情報として、キー画像IK1から病変領域A1の情報を、キー画像IK2から病変領域A2の情報を取得する。
【0069】
ステップS3では、文章取得部36は、読影レポートに使用される1以上の所見文を取得する。ここでは、文章取得部36は、所見文SN1~SN5を取得する。
【0070】
ステップS4では、記載情報取得部38は、ステップS3で取得した所見文SN1~SN5にそれぞれ記載されている記載情報を取得する。ここでは、記載情報取得部38は、記載情報として、所見文SN1から「認めません」を、所見文SN2から「coronary a.」と「石灰化」を、所見文SN3から「少量」と「右胸水」を、所見文SN4から「甲状腺左葉」と「11mm大の低吸収」を、所見文SN5から「右鎖骨遠位部」と「右第肋骨」と「骨折後の変化」を取得する。
【0071】
ステップS5では、対応判断部40は、ステップS2で取得した物体情報とステップS4で取得した記載情報とに基づいて、キー画像IK1、及びキー画像IK2と所見文SN1~SN5とについて総当たりで対応の有無を判断する。すなわち、対応判断部40は、キー画像IK1と所見文SN1、キー画像IK1と所見文SN2、…、キー画像IK1と所見文SN5、キー画像IK2と所見文SN1、キー画像IK2と所見文SN2、…、キー画像IK2と所見文SN5、とのそれぞれの組み合わせの対応の有無を判断する。ここでは、対応判断部40は、キー画像IK1と所見文SN5との組み合わせ、及びキー画像IK2と所見文SN4との組み合わせにおいて、対応が有ると判断したものとする。
【0072】
ステップS6では、補助処理実行部42は、ステップS5で判断した対応の有無に基づく補助処理を実行する。ここでは、補助処理は、対応が有ると判断された所見文とキー画像との複数の組み合わせにおいて、所見文の順序に基づいてキー画像の順序を並べ替える処理であるとする。
【0073】
図6は、ユーザ端末装置16のディスプレイ16Bに表示された読影レポートRP2を示す図である。読影レポートRP2は、読影レポートRP1について補助処理が実行されたものである。読影レポートRP2は、表示領域D1の所見文SN1~SN5の表示は読影レポートRP1と同様である。また、読影レポートRP2は、表示領域D2のキー画像の位置が読影レポートRP1から変更されており、左から順にキー画像IK2、キー画像IK1が表示されている。
【0074】
すなわち、補助処理実行部42は、対応が有ると判断されたキー画像IK1と所見文SN5との組み合わせ、及びキー画像IK2と所見文SN4との組み合わせにおいて、所見文SN5及びSN4のうち表示領域D1における上からの順序が先である所見文SN4と対応するキー画像IK2を左側に、上からの順序が後である所見文SN5と対応するキー画像IK1を右側に配置している。
【0075】
読影レポートの所見文は上から下に順に読まれ、キー画像は左から右に順に視認されると考えられる。したがって、所見文の上下の順序に基づいてキー画像の左右の順序を並べ替えることで、読みやすい読影レポートを作成することができる。
【0076】
補助処理は、キー画像の順序を並べ替える処理に限定されない。図7は、ユーザ端末装置16のディスプレイ16Bに表示された読影レポートRP3を示す図である。読影レポートRP3は、補助処理が実行されたものである。ここでは、図5と同様の所見文SN1~SN5、及びキー画像IK1~IK2に加えて、所見文SN6「右肺S10に径68mm程度の辺縁分葉状の充実型腫瘤を認めます。肺癌疑い。」、及び病変領域A3を含むキー画像IK3が記載された場合を示している。
【0077】
読影レポートRP3では、所見文SN6に対応するキー画像が存在しない(「非存在」の一例)ことが所見文SN6を強調表示するマーカMK1により警告されている。所見文SN6は、対応するキー画像が存在せず、かつ所見文SN6が重要所見の場合にのみ警告されてもよい。ここでは、所見文SN6の記載情報「充実型腫瘤」が病気の記載であるため、所見文SN6が重要所見であると判断されている。
【0078】
また、読影レポートRP3の表示領域D2には、読影レポートRP2と同様に、対応する所見文SN4、所見文SN5の順序に基づいて、左から順にキー画像IK2、キー画像IK1が表示されている。さらに、キー画像IK2、キー画像IK1には、左から順に図番号が付与されている。ここでは、キー画像IK2には図番号NF1として「図1」が、キー画像IK1には図番号NF2として「図2」が付与されている。このように、図番号NF1、図番号NF2は、キー画像IK2に写っている病変領域A2、キー画像IK1に写っている病変領域A1がそれぞれ対応する所見文SN4、所見文SN5に登場する順に付与されている。
【0079】
所見文SN4、所見文SN5には、それぞれ対応するキー画像の図番号NF1、図番号NF2が付与されている。所見文SN4、所見文SN5に付与される図番号NF1、図番号NF2は、所見文SN4、所見文SN5の対応する部分に付与されてもよい。
【0080】
読影レポートRP3では、キー画像IK3に対応する所見文が存在しないことがキー画像IK3を強調表示する枠FL1により警告されている。
【0081】
<キー画像と所見文との対応付けの詳細>
図8は、確信度を用いた所見文とキー画像との対応付けを説明するための図である。図8に示す例では、画像取得部32によりキー画像IK11、キー画像IK12、キー画像IK13が取得され、文章取得部36により所見文SN11「右鎖骨遠位部及び右第肋骨に骨折後の変化が認められます。」、所見文SN12「甲状腺左葉に11mm大の低吸収が認められます。」が取得されている。この場合、対応判断部40は、所見文SN11とキー画像IK11、所見文SN11とキー画像IK12、所見文SN11とキー画像IK13、所見文SN12とキー画像IK11、所見文SN12とキー画像IK12、所見文SN12とキー画像IK13、のそれぞれの組み合わせについて、物体情報と記載情報とに基づいて確信度を算出し、対応の有無を判断する。
【0082】
確信度は、値が大きいほど物体情報と記載情報とが対応している確からしさが高いことを示す指標であり、例えば0以上かつ1以下の値である。また、閾値は例えば0.90である。すなわち、対応判断部40は、確信度が0.90以上の場合に、キー画像と所見文との対応が有ると判断し、キー画像と所見文とを対応付ける。
【0083】
図9は、2つ以上のキー画像と1つの所見文とが対応付いた場合を説明するための図である。図9に示す例では、所見文SN21「S3に径1cm大の結節状の早期濃染域を認める。平衡相ではwashoutが認められ、HCC再発を考える。」とキー画像IK21との確信度が0.95であり、所見文SN21とキー画像IK22との確信度が0.96である。キー画像IK21とキー画像IK22とは同じ解剖学的位置の画像であり、いずれも確信度が閾値0.90より高いため、キー画像IK21とキー画像IK22との両方が所見文SN21と対応付けられる。このように、1つの所見文に2つ以上のキー画像が対応する場合がある。
【0084】
なお、所見文SN21は、文L1「S3に径1cm大の結節状の早期濃染域を認める。」と文L2「平衡相ではwashoutが認められ、HCC再発を考える。」とを含んでいるが、文L1と文L2とをそれぞれ異なる所見文として扱ってもよい。
【0085】
図10は、1つのキー画像と複数の所見文との確信度が閾値以上となった場合を説明するための図である。図10に示す例では、所見文SN31「右鎖骨遠位部及び右第肋骨に骨折後の変化が認められます。」とキー画像IK31との確信度は0.95であり、閾値0.90以上である。また、所見文SN32「coronary a.に石灰化が認められます。」とキー画像IK31との確信度は0.90であり、閾値0.90以上である。この場合は、確信度が相対的に高い所見文に対応付けされる。すなわち、対応判断部40は、キー画像IK31と所見文SN31とを対応付ける。このように、1つのキー画像には1つの所見文が対応する。
【0086】
<言語特徴抽出モデル>
記載情報取得部38は、言語特徴抽出モデルを備えてもよい。言語特徴抽出モデルは、所見文の入力を受けて、対応する所見特徴を出力するように訓練された学習済みモデルである。
【0087】
〔機械学習に用いるデータの例〕
図11は、言語特徴抽出モデルの生成方法に用いられる学習(訓練)用のデータの例を示す説明図である。ここでは、キー画像IMjと、キー画像IMj内の関心領域ROIjに関する位置情報TPjと、関心領域ROIjについて記述された所見文TXjとを含む訓練データTDjの例を説明する。キー画像IMj、関心領域ROIjに関する位置情報TPj及び所見文TXjは互いに関連付け(紐付け)されている。添字のjは、関連付けされたデータ組の識別符号としてのインデックス番号を表す。関心領域ROIjとは主に病変領域である。
【0088】
関心領域ROIjに関する位置情報TPjとは、キー画像IMj中における関心領域ROIjの位置を特定し得る情報である。位置情報TPjは、キー画像IMj中の座標を示す座標情報であってもよいし、キー画像IMj中の領域又は範囲を示す情報であってもよく、これらの組み合わせであってもよい。位置情報TPjは、キー画像IMjに対するアノテーション情報として付与された情報であってもよいし、DICOMタグのようなキー画像IMjに付属するメタ情報であってもよい。
【0089】
所見文TXjは、例えば、読影レポートに記載された文章であってよい。ここでは、所見文TXjとして、構造化される前の自由記述型の文章形式による非構造化データであるテキストを例示するが、文章の構造解析によって構造化された構造化データを用いることも可能である。
【0090】
このような訓練データTDjは、病院等の医療機関における過去の検査事例に係る医療画像及び読影レポートのデータが関連付けされて蓄積保存されるデータベースから適当なデータをサンプリングして生成することができる。
【0091】
〔機械学習装置の構成例〕
図12は、言語特徴抽出モデルを学習させる機械学習装置100の機能的構成を概略的に示すブロック図である。機械学習装置100は、医用情報処理装置20と同じ装置であってもよいし、異なる装置であってもよい。
【0092】
機械学習装置100は、言語特徴抽出モデル102と、領域推定モデル104と、損失演算部106と、パラメータ更新部108とを含む。機械学習装置100の各部の機能は、コンピュータのハードウェアとソフトウェアとの組み合わせによって実現し得る。
【0093】
言語特徴抽出モデル102には、例えば、BERT(Bidirectional Encoder Representations from Transformers)と呼ばれる自然言語処理モデルが適用される。言語特徴抽出モデル102は、テキストである所見文TXjの入力を受け付け、入力された所見文TXjに対応する特徴量を抽出して言語特徴ベクトル(所見特徴ベクトル)である所見特徴LFVjを出力する。
【0094】
領域推定モデル104には、例えば、畳み込みニューラルネットワーク(Convolutional Neural Network:CNN)が適用される。領域推定モデル104は、キー画像IMjと、所見特徴LFVjとの入力を受け付け、入力された所見文TXjで言及しているキー画像IMj内の病変領域を推定し、推定した病変領域の位置を示す推定領域情報PAjを出力する。推定領域情報PAjは、例えば、推定した病変領域の範囲を囲む矩形(バウンディングボックス)の位置を特定する座標情報であってもよいし、推定した病変領域を画素単位で特定するセグメンテーションマスク画像等であってもよい。
【0095】
損失演算部106は、領域推定モデル104から出力された推定領域情報PAjに示される推定病変領域と、キー画像IMjに紐付けされている正解の位置情報TPjが示す正解の関心領域ROIjとの誤差を示す損失(ロス)を算出する。
【0096】
パラメータ更新部108は、損失演算部106によって算出された損失に基づいて、損失が小さくなるように、領域推定モデル104及び言語特徴抽出モデル102の各モデルのパラメータの更新量を算出し、算出した更新量にしたがい各モデルのパラメータを更新する。各モデルのパラメータは、ニューラルネットワークの各層の処理に用いるフィルタのフィルタ係数(ノード間の結合の重み)及びノードのバイアス等を含む。パラメータ更新部108は、例えば確率的勾配降下法(Stochastic Gradient Descent:SGD)等の手法により、各モデルのパラメータの最適化を行う。
【0097】
図13は、機械学習装置100のハードウェア構成の例を示すブロック図である。機械学習装置100は、プロセッサ112と、非一時的な有体物であるコンピュータ可読媒体114と、通信インターフェース116と、入出力インターフェース118と、バス119とを備える。プロセッサ112は、バス119を介してコンピュータ可読媒体114、通信インターフェース116及び入出力インターフェース118と接続される。
【0098】
機械学習装置100の形態は、特に限定されず、サーバであってもよいし、ワークステーション、又はパーソナルコンピュータ等であってもよい。
【0099】
プロセッサ112は、CPU(Central Processing Unit)を含む。プロセッサ112は、GPU(Graphics Processing Unit)を含んでもよい。コンピュータ可読媒体114は、主記憶装置であるメモリ114A及び補助記憶装置であるストレージ114Bを含む。コンピュータ可読媒体114は、例えば、半導体メモリ、ハードディスク(Hard Disk Drive:HDD)装置、もしくはソリッドステートドライブ(Solid State Drive:SSD)装置又はこれらの複数の組み合わせであってよい。
【0100】
機械学習装置100は、さらに、入力装置142と、表示装置144とを備えていてもよい。入力装置142は、例えば、キーボード、マウス、マルチタッチパネル、もしくはその他のポインティングデバイス、もしくは、音声入力装置、又はこれらの適宜の組み合わせによって構成される。表示装置144は、例えば、液晶ディスプレイ、有機EL(organic electro-luminescence:OEL)ディスプレイ、もしくは、プロジェクタ、又はこれらの適宜の組み合わせによって構成される。入力装置142と表示装置144とは、入出力インターフェース118を介してプロセッサ112と接続される。
【0101】
機械学習装置100は、通信インターフェース116を介して不図示の電気通信回線に接続され得る。電気通信回線は、広域通信回線であってもよいし、構内通信回線であってもよく、これらの組み合わせであってもよい。
【0102】
機械学習装置100は、通信インターフェース116を介して訓練データ保存部150等の外部装置と通信可能に接続される。訓練データ保存部150は、複数の訓練データTDjを含む訓練データセットが保存されているストレージを含む。なお、訓練データ保存部150は、機械学習装置100内のストレージ114Bに構築されてもよい。
【0103】
コンピュータ可読媒体114には、学習処理プログラム120及び表示制御プログラム130を含む複数のプログラム及びデータ等が記憶される。「プログラム」という用語はプログラムモジュールの概念を含む。プロセッサ112は、コンピュータ可読媒体114に記憶されたプログラムの命令を実行することにより、各種の処理部として機能する。
【0104】
学習処理プログラム120は、訓練データTDjを取得して言語特徴抽出モデル102及び領域推定モデル104の学習処理を実行させる命令を含む。すなわち、学習処理プログラム120は、データ取得プログラム122、言語特徴抽出モデル102、領域推定モデル104、損失算出プログラム126及びオプティマイザ128を含む。データ取得プログラム122は、訓練データ保存部150から訓練データTDjを取得する処理を実行させる命令を含む。
【0105】
損失算出プログラム126は、領域推定モデル104から出力された病変領域の位置を示す情報が示す推定領域情報と、言語特徴抽出モデル102に入力した所見文TXjに対応する正解の位置情報TPjとの誤差を示す損失を算出する処理を実行させる命令を含む。オプティマイザ128は、算出された損失から領域推定モデル104及び言語特徴抽出モデル102の各モデルのパラメータの更新量を算出し、各モデルのパラメータを更新する処理を実行させる命令を含む。
【0106】
表示制御プログラム130は、表示装置144への表示出力に必要な表示用信号を生成し、表示装置144の表示制御を実行させる命令を含む。
【0107】
〔機械学習方法の概要〕
図14は、機械学習装置100が実行する機械学習方法の例を示すフローチャートである。図14のフローチャートを実行する前に、訓練用のキー画像IMjと、キー画像IMj中のある関心領域ROIjを説明したテキストである所見文TXjと、関心領域ROIjに関する位置情報TPjとが紐付けされたデータの組である訓練データTDjを複数組用意して、訓練用のデータセットを準備しておく。
【0108】
ステップS100において、プロセッサ112は、訓練用のデータセットからキー画像IMjと、キー画像IMj中の関心領域ROIjに関する位置情報TPjと、関心領域ROIjを説明した所見文TXjとを含むデータ組を取得する。
【0109】
ステップS110において、プロセッサ112は、所見文TXjを言語特徴抽出モデル102に入力し、言語特徴抽出モデル102に所見文TXjの特徴量を示す所見特徴LFVjを抽出させ、言語特徴抽出モデル102から所見特徴LFVjの出力を得る。所見特徴LFVjは、所見文TXjを特徴ベクトル化して得られる言語特徴ベクトルで表現される。
【0110】
ステップS120において、プロセッサ112は、言語特徴抽出モデル102が出力した所見特徴LFVjと、所見文TXjに紐付けされたキー画像IMjとを領域推定モデル104に入力し、所見文TXjで言及しているキー画像IMj中の関心領域(病変領域)を領域推定モデル104に推定させる。領域推定モデル104は、入力された所見特徴LFVjとキー画像IMjとから推定した推定領域情報PAjを出力する。
【0111】
ステップS130において、プロセッサ112は、領域推定モデル104によって推定された病変領域の推定領域情報PAjと正解の関心領域ROIjの位置情報TPjとの誤差を示す損失を算出する。
【0112】
ステップS140において、プロセッサ112は、損失を最小化するように、言語特徴抽出モデル102及び領域推定モデル104の各モデルのパラメータ更新量を算出する。
【0113】
そして、ステップS150において、プロセッサ112は、算出したパラメータ更新量に従い、言語特徴抽出モデル102及び領域推定モデル104の各モデルのパラメータを更新する。なお、損失を最小化するように各モデルを訓練することは、領域推定モデル104によって推定される推定病変領域が正解の関心領域ROIjと一致するように(両者の誤差が小さくなるように)各モデルを訓練することを意味している。上述したステップS100からステップS150の動作はミニバッチの単位で実施されてもよい。
【0114】
ステップS150の後、ステップS160において、プロセッサ112は、学習を終了するか否かを判定する。学習の終了条件は、損失の値に基づいて定められていてもよいし、パラメータの更新回数に基づいて定められていてもよい。損失の値に基づく方法としては、例えば、損失が規定の範囲内に収束していることを学習終了条件としてよい。また、更新回数に基づく方法としては、例えば、更新回数が規定回数に到達したことを学習終了条件としてよい。あるいは、訓練データとは別にモデルの性能評価用のデータセットを用意しておき、評価用のデータを用いた評価値に基づいて学習終了の可否を判定してもよい。
【0115】
ステップS160の判定結果がNo判定である場合、プロセッサ112はステップS100に戻り、学習処理を継続する。一方、ステップS160の判定結果がYes判定である場合、プロセッサ112は図14のフローチャートを終了する。
【0116】
こうして、生成された学習済み(訓練済み)の言語特徴抽出モデル102は、所見文の入力を受けて、その所見文が言及している画像中の病変領域(関心領域)に関する位置の情報が埋め込まれた所見特徴(特徴ベクトル)を出力し得るモデルとなる。つまり、言語特徴抽出モデル102が出力する所見特徴には、画像中の病変領域に関する位置を特定するために必要な情報が埋め込まれる。機械学習装置100が実行する機械学習方法は、所見文に記述された画像中の病変領域の位置を特定する情報を含んだ言語特徴ベクトルを出力する言語特徴抽出モデル102を生成する方法と理解することができる。
【0117】
<画像特徴抽出モデルとクロスモーダル特徴統合モデル>
物体情報取得部34は、画像特徴抽出モデルを備えてもよい。画像特徴抽出モデルは、キー画像とキー画像内の関心領域に関する位置情報との入力を受け付け、キー画像の特徴量を示す画像特徴を出力するように訓練された学習済みモデルである。
【0118】
対応判断部40は、クロスモーダル特徴統合モデルを備えてもよい。クロスモーダル特徴統合モデルは、画像中の関心領域に関する位置情報を備えた画像と、関心領域について説明した所見文との対応関係を判別するように訓練された学習済みモデルである。
【0119】
図15は、学習済みの言語特徴抽出モデルを用いて画像特徴抽出モデル及びクロスモーダル特徴統合モデルを学習させる機械学習装置160の機能的構成を概略的に示すブロック図である。機械学習装置160は、機械学習装置100と同じ装置であってもよいし、医用情報処理装置20と同じ装置であってもよい。
【0120】
機械学習装置160は、言語特徴抽出モデル102Eと、画像特徴抽出モデル162と、クロスモーダル特徴統合モデル164と、損失演算部166と、パラメータ更新部168とを含む。
【0121】
訓練用のデータセットは、機械学習装置100で用いたデータセットと同様であってよい。画像特徴抽出モデル162には、例えば、CNNが適用される。画像特徴抽出モデル162は、キー画像IMjとキー画像内の関心領域ROIjに関する位置情報TPjとの入力を受け付け、キー画像IMjの特徴量を示す画像特徴IFVjを出力する。画像特徴IFVjは、キー画像IMjを特徴ベクトル化して得られる画像特徴ベクトルで表現されてもよい。画像特徴IFVjは、複数チャンネルの特徴マップであってもよい。
【0122】
言語特徴抽出モデル102Eは、所見文TXiの入力を受けて、対応する所見特徴LFViを出力するように訓練された学習済みモデルである。言語特徴抽出モデル102Eに入力される所見文TXiは、キー画像IMjに紐付けされている所見文TXj(i=j)である場合に限らず、キー画像IMjに紐付けされていない所見文(i≠j)である場合もあり得る。
【0123】
クロスモーダル特徴統合モデル164は、画像特徴IFVjと所見特徴LFVjとの入力を受け付け、両者の関連性を示す関連度スコアを出力する。関連度スコアは、関連性の程度を示す数値であってよく、例えば、関連性がない場合を「0」、関連性がある場合を「1」として0から1の範囲の数値により関連性の確信度を示してもよい。
【0124】
損失演算部166は、クロスモーダル特徴統合モデル164から出力された関連度スコアと、正解の関連度スコアとの誤差を示す損失を算出する。画像特徴抽出モデル162と言語特徴抽出モデル102Eとに対してキー画像IMjとこれに紐付けされた所見文TXi(i=j)との組み合わせが入力される場合、正解関連度スコアは「1」と定められてよい。一方、画像特徴抽出モデル162と言語特徴抽出モデル102Eとに対してキー画像IMjと紐付けされていない無関係な所見文TXi(i≠j)との組み合わせが入力される場合、正解関連度スコアは「0」と定められてよい。
【0125】
パラメータ更新部168は、損失演算部166にて算出される損失が最小化するように、クロスモーダル特徴統合モデル164と画像特徴抽出モデル162との各モデルのパラメータの更新量を算出し、算出した更新量に従い各モデルのパラメータを更新する。
【0126】
機械学習装置160のハードウェア構成は、図13に示した機械学習装置100と同様であってよい。機械学習装置160は、図13の領域推定モデル104の代わりに、クロスモーダル特徴統合モデル164を含む。機械学習装置160は、損失算出プログラム126が算出する損失の損失関数と、オプティマイザ128によりパラメータの更新する対象のモデルとが、機械学習装置100と異なる。
【0127】
〔機械学習方法の概要〕
図16は、機械学習装置160が実行する機械学習方法の例を示すフローチャートである。ステップS101において、プロセッサ112は、訓練用のデータセットからキー画像IMjと、キー画像IMj中の関心領域ROIjに関する位置情報TPjと、関心領域ROIiについて説明した(記述された)所見文TXiとのデータ組を取得する。この際に取得されたデータ組においてi=jである場合、プロセッサ112は、正解関連度スコアとして「1」を取得し、i≠jである場合、正解関連度スコアとして「0」を取得する。
【0128】
ステップS111において、プロセッサ112は、所見文TXiを言語特徴抽出モデル102Eに入力し、言語特徴抽出モデル102Eに所見特徴LFViを抽出させる。
【0129】
ステップS112において、プロセッサ112は、キー画像IMjと、キー画像IMj中の関心領域ROIjに関する位置情報TPjとを画像特徴抽出モデル162に入力し、画像特徴抽出モデル162に画像特徴IFVjを抽出させる。
【0130】
ステップS114において、プロセッサ112は、画像特徴抽出モデル162から出力された画像特徴IFVjと、言語特徴抽出モデル102Eから出力された所見特徴LFViとをクロスモーダル特徴統合モデル164に入力し、クロスモーダル特徴統合モデル164に関連度スコアを推定させる。画像特徴抽出モデル162に画像特徴IFVjを抽出させる。
【0131】
その後、ステップS128において、プロセッサ112は、クロスモーダル特徴統合モデル164から出力された関連度スコア(推定値)と、正解関連度スコアとの誤差を示す損失を算出する。
【0132】
そして、ステップS142において、プロセッサ112は、算出された損失が最小化するように、画像特徴抽出モデル162及びクロスモーダル特徴統合モデル164の各モデルのパラメータ更新量を算出する。
【0133】
ステップS152において、プロセッサ112は、算出されたパラメータ更新量に従い、画像特徴抽出モデル162及びクロスモーダル特徴統合モデル164の各モデルのパラメータを更新する。
【0134】
図16に示すステップS101~ステップS152の動作は、ミニバッチの単位で実施されてもよい。
【0135】
ステップS152の後、ステップS160において、プロセッサ112は、学習を終了するか否かを判定する。
【0136】
ステップS160の判定結果がNo判定である場合、プロセッサ112はステップS101に戻り、学習処理を継続する。一方、ステップS160の判定結果がYes判定である場合、プロセッサ112は図16のフローチャートを終了する。
【0137】
このように各モデルを学習させることにより、入力された画像と所見文とが対応するか(関連性があるか否か)を精度よく判定し得る関連度判定AI(Artificial Intelligence)を構築することが可能である。
【0138】
<医療画像の関心領域の特定>
〔物体情報取得部の構成〕
物体情報取得部34は、キー画像の作成元となった元画像である医療画像を解析して物体情報を取得してもよい。ここでは、キー画像の病変領域である関心領域に基づいて、キー画像の作成元の医療画像の関心領域を特定する方法について説明する。
【0139】
図17は、物体情報取得部34の機能的構成を示すブロック図である。図17に示すように、物体情報取得部34は、キー画像取得部170と、紐付け情報抽出部172と、関心領域特定部182と、出力部190と、を備える。
【0140】
キー画像取得部170は、医用情報処理装置20の画像取得部32が受け付けたキー画像を取得する。
【0141】
紐付け情報抽出部172は、キー画像を解析してキー画像の作成元の医療画像との紐付け情報を抽出する。すなわち、紐付け情報とは、キー画像とキー画像の作成元の医療画像とを紐付けるための情報である。紐付け情報は、例えば、被写体とは別にキー画像に写り込んだ情報である。紐付け情報は、例えば、キー画像の作成元の医療画像のシリーズ番号、スライス番号、ウィンドウ幅、ウィンドウレベル、及びアノテーションのうちの少なくとも1つを含む。紐付け情報は、キー画像とキー画像の作成元の医療画像との位置合わせの結果であってもよい。紐付け情報抽出部172は、文字認識部174と、画像認識部176と、位置合わせ結果取得部180と、を含む。
【0142】
文字認識部174は、OCR(Optical Character Recognition)等の既知の手法の文字認識によってキー画像内の文字を解析して紐付け情報を抽出する。文字認識部174によって抽出する紐付け情報は、キー画像のウィンドウ幅、ウィンドウレベル、スライス番号、及びシリーズ番号のうちの少なくとも1つを含んでもよい。
【0143】
画像認識部176は、キー画像を画像認識して紐付け情報を抽出する。画像認識部176が抽出する紐付け情報は、キー画像のウィンドウ幅、ウィンドウレベル、及びアノテーションのうちの少なくとも1つを含んでもよい。画像認識部176は、画像認識モデル178を備える。キー画像のウィンドウ幅、又はウィンドウレベルを抽出する画像認識モデル178は、CNNを用いた分類モデル、又は回帰モデルである。また、キー画像のアノテーションを認識する画像認識モデル178は、畳み込みニューラルネットワークが適用されたセグメンテーションモデル、又は検出モデルである。画像認識部176は、分類モデル、回帰モデル、セグメンテーションモデル、及び検出モデルのうちの複数の画像認識モデル178を備えてもよい。画像認識モデル178は、メモリ20Bに記憶される。
【0144】
また、画像認識部176は、キー画像に付加されたアノテーションを検出する。画像認識部176が検出するアノテーションは、円、矩形、矢印、線分、点、及びスクリブルのうちの少なくとも1つを含んでもよい。
【0145】
位置合わせ結果取得部180は、後述する位置合わせ部186によるキー画像と医療画像との位置合わせの結果を取得する。
【0146】
関心領域特定部182は、紐付け情報抽出部172が抽出した紐付け情報に基づいて関心領域を特定する。関心領域特定部182は、紐付け情報を用いて、例えば、まずキー画像の作成元の医療画像のうちキー画像に対応する位置を推定し、次に医療画像の関心領域を特定する。
【0147】
関心領域特定部182は、2次元画像から関心領域を特定してもよいし、3次元画像から関心領域を特定してもよい。特定される関心領域は、2次元の領域であってもよいし、3次元の領域であってもよい。
【0148】
関心領域特定部182は、関心領域推定モデル184と、位置合わせ部186と、アノテーション付加部188と、を含む。関心領域推定モデル184は、画像を入力として与えると入力された画像内の関心領域の位置を出力する深層学習モデルである。関心領域推定モデル184は、CNNが適用された学習済みモデルであってもよい。関心領域推定モデル184は、メモリ20Bに記憶される。
【0149】
位置合わせ部186は、キー画像とキー画像の作成元の医療画像との位置合わせを行う。キー画像とキー画像の作成元の医療画像と位置合わせとは、臓器等の同じ被写体を示す両画像のそれぞれの画素を対応付けることをいう。位置合わせ部186によるキー画像と医療画像との位置合わせの結果とは、キー画像の画素と医療画像の画素との対応関係を含む。アノテーション付加部188は、キー画像の作成元の医療画像にアノテーションを付加する。
【0150】
出力部190は、関心領域特定部182によって特定された関心領域を出力する。出力される関心領域は、キー画像の作成元の医療画像に付与されたマスク、バウンディングボックス、及びヒートマップのうちの少なくとも1つであってもよい。
【0151】
〔医療画像解析方法〕
図18は、物体情報取得部34による医療画像解析方法を示すフローチャートである。医療画像解析方法は、キー画像の作成元の医療画像の関心領域を特定する方法である。
【0152】
ステップS171では、キー画像取得部170は、医用情報処理装置20の画像取得部32が受け付けたキー画像を取得する。紐付け情報抽出部172は、キー画像からキー画像の作成元の医療画像と紐付けるのに必要な紐付け情報を抽出する。ここでは、画像認識部176は、画像認識モデル178によりキー画像から紐付け情報を抽出する。また、文字認識部174は、OCRによりキー画像から紐付け情報を抽出する。
【0153】
ステップS172では、ステップS171で取得したキー画像にアノテーションが付加されている場合、画像認識部176はキー画像からアノテーションを検出する。
【0154】
ステップS173では、関心領域特定部182は、ステップS171で抽出した紐付け情報のうちのスライス番号に基づいて、作成元の医療画像のスライス画像であって、キー画像と同じ位置のスライス画像を特定する。ステップS171において、スライス番号を抽出できなかった場合は、既知の方法でキー画像と同じ位置のスライス画像を特定する。
【0155】
ステップS174では、位置合わせ部186は、キー画像とステップS173で特定したスライス画像との位置合わせを行う。キー画像は、作成元の医療画像のスライス画像からクロップ、又は回転されている場合があるので、位置合わせが必要なケースがある。
【0156】
ステップS175では、ステップS171で取得したキー画像にアノテーションが付加されている場合、アノテーション付加部188は、ステップS173で特定したスライス画像にアノテーションを付加する。アノテーション付加部188は、ステップS174での位置合わせにより、キー画像のアノテーションの位置と同じスライス画像の位置にアノテーションを付加することができる。
【0157】
ステップS176では、関心領域特定部182は、ステップS175で付加したアノテーションに基づいてスライス画像の関心領域を特定する。ここでは、関心領域特定部182は、関心領域推定モデル184を用いて関心領域を特定する。関心領域を特定した結果は、マスク、バウンディングボックス、及びヒートマップのうちの少なくとも1つであってもよい。出力部190は、特定された関心領域を出力する。
【0158】
このように、キー画像のアノテーションをキー画像の作成元のスライス画像に付加し、これに基づいて関心領域を推定することで、スライス画像の関心領域を特定することができる。したがって、作成元の医療画像の関心領域を特定することができる。
【0159】
ここでは、ステップS171で取得したキー画像にアノテーションが付加されている場合について説明したが、関心領域推定モデル184は、アノテーションが含まれないキー画像から関心領域を推定することも可能である。
【0160】
<その他>
本実施形態に係る医用情報処理装置、医用情報処理方法及び医用情報処理プログラムは、医療画像以外の自然画像を用いる情報処理装置、情報処理方法及び情報処理プログラムにも適用可能である。
【0161】
例えば、交通、電気、ガス、及び水道等の社会的インフラ設備に関するレポート作成に適用することができる。この場合、受け付けた1以上のインフラ設備の画像に写っている物体に関する情報を取得し、受け付けた1以上のインフラ設備に関する文章に記載されている情報を取得し、物体に関する情報と記載されている情報とに基づいて、画像と文章との対応の有無を判断し、対応の有無に基づいて画像と文章とを含む文書の作成を補助する処理を実行することができる。
【0162】
本発明の技術的範囲は、上記の実施形態に記載の範囲には限定されない。各実施形態における構成等は、本発明の趣旨を逸脱しない範囲で、各実施形態間で適宜組み合わせることができる。
【符号の説明】
【0163】
10…医用情報処理システム
12…医療画像検査機器
14…医療画像データベース
16…ユーザ端末装置
16A…入力装置
16B…ディスプレイ
18…読影レポートデータベース
20…医用情報処理装置
20A…プロセッサ
20B…メモリ
20C…通信インターフェース
22…ネットワーク
32…画像取得部
34…物体情報取得部
36…文章取得部
38…記載情報取得部
40…対応判断部
42…補助処理実行部
100…機械学習装置
102…言語特徴抽出モデル
102E…言語特徴抽出モデル
104…領域推定モデル
106…損失演算部
108…パラメータ更新部
112…プロセッサ
114…コンピュータ可読媒体
114A…メモリ
114B…ストレージ
116…通信インターフェース
118…入出力インターフェース
119…バス
120…学習処理プログラム
122…データ取得プログラム
126…損失算出プログラム
128…オプティマイザ
130…表示制御プログラム
142…入力装置
144…表示装置
150…訓練データ保存部
160…機械学習装置
162…画像特徴抽出モデル
164…クロスモーダル特徴統合モデル
166…損失演算部
168…パラメータ更新部
170…キー画像取得部
172…情報抽出部
174…文字認識部
176…画像認識部
178…画像認識モデル
180…結果取得部
182…関心領域特定部
184…関心領域推定モデル
186…位置合わせ部
188…アノテーション付加部
190…出力部
A1…病変領域
A2…病変領域
A3…病変領域
D1…表示領域
D2…表示領域
FL1…枠
IK1…キー画像
IK2…キー画像
IK3…キー画像
IK11…キー画像
IK12…キー画像
IK13…キー画像
IK21…キー画像
IK22…キー画像
IK31…キー画像
IMj…キー画像
L1…文
L2…文
LFVj…所見特徴
MK1…マーカ
NF1…図番号
NF2…図番号
PAj…推定領域情報
ROIi…関心領域
ROIj…関心領域
RP1…読影レポート
RP2…読影レポート
RP3…読影レポート
SN1…所見文
SN2…所見文
SN3…所見文
SN4…所見文
SN5…所見文
SN6…所見文
SN11…所見文
SN12…所見文
SN21…所見文
SN31…所見文
SN32…所見文
S1~S6……医用情報処理方法のステップ
S101~S160……機械学習方法のステップ
S171~S176……医療画像解析方法のステップ
TDj…訓練データ
TPj…位置情報
TXi…所見文
TXj…所見文
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18