(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-09-04
(45)【発行日】2023-09-12
(54)【発明の名称】情報処理装置、情報処理方法、及びプログラム
(51)【国際特許分類】
A61B 3/10 20060101AFI20230905BHJP
A61B 3/024 20060101ALI20230905BHJP
【FI】
A61B3/10 100
A61B3/024
(21)【出願番号】P 2019114984
(22)【出願日】2019-06-20
【審査請求日】2022-06-16
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成30年度、国立研究開発法人科学技術振興機構、戦略的創造研究推進事業、チーム型研究(CREST)、研究課題「複雑データからのディープナレッジ発見と価値化」、研究題目「ディープナレッジのモデル論、推定論の構築」、産業技術力強化法第17条の適用を受ける特許出願
(73)【特許権者】
【識別番号】504137912
【氏名又は名称】国立大学法人 東京大学
(74)【代理人】
【識別番号】100122275
【氏名又は名称】竹居 信利
(72)【発明者】
【氏名】山西 健司
(72)【発明者】
【氏名】木脇 太一
(72)【発明者】
【氏名】許 林川
(72)【発明者】
【氏名】王 晶
(72)【発明者】
【氏名】鄭 宇輝
(72)【発明者】
【氏名】朝岡 亮
(72)【発明者】
【氏名】村田 博史
【審査官】増渕 俊仁
(56)【参考文献】
【文献】特表2013-501553(JP,A)
【文献】特開2013-027439(JP,A)
【文献】国際公開第2018/083853(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
A61B 3/00-3/18
(57)【特許請求の範囲】
【請求項1】
時刻情報
の関数のパラメータを含むパラメータ群で規定される潜在空間の情報を保持する保持手段と、
複数の互いに異なる種類の測定情報を含む測定情報群であって、前記測定情報が、それぞれ任意の時間に測定されてなる測定情報群の入力を受け入れる受入手段と、
前記受け入れた測定情報群に含まれる測定情報の種類ごとに予め定められた方法で、当該種類の測定情報を用いて、前記保持手段が保持する前記潜在空間の情報を更新して設定する設定手段と、
前記設定手段により更新された、前記保持手段が保持する前記潜在空間の情報を用い、所定の出力情報を生成する出力情報生成手段と、
を含
み、
前記潜在空間の情報は、時刻情報の関数のパラメータを含むパラメータ群で規定される情報処理装置。
【請求項2】
請求項1に記載の情報処理装置であって、
前記測定情報は、その種類ごとに予め、前記潜在空間の情報との変換関係が所定の変換パラメータを用いて設定されており、
前記設定手段は、前記測定情報の種類ごとの前記変換パラメータと、前記保持手段が保持する前記潜在空間の情報とを、前記潜在空間の情報に基づく前記出力情報が、前記測定情報の少なくともいずれかとの誤差を小さくするよう機械学習する情報処理装置。
【請求項3】
請求項1または2に記載の情報処理装置であって、
前記測定情報には、画像系列データと視野検査の結果とが含まれ、
前記潜在空間の情報は測定情報の対象ごとに定められ、
前記設定手段は、前記画像系列データの変換パラメータと前記潜在空間の情報とに基づく項と、並びに、前記視野検査結果の変換パラメータと前記潜在空間の情報とに基づく項とを含む目的関数を最小化して、前記測定情報の種類ごとの前記変換パラメータと、前記保持手段が保持する前記潜在空間の情報とを、前記潜在空間の情報に基づく前記出力情報が、前記測定情報のそれぞれとの誤差を小さくするようまとめて機械学習する情報処理装置。
【請求項4】
請求項1から3のいずれか一項に記載の情報処理装置であって、
前記測定情報には、画像系列データが含まれ、
前記設定手段は、前記画像
系列データと前記潜在空間の情報との変換関係を、ニューラルネットワークにより規定してなる情報処理装置。
【請求項5】
時刻情報
の関数のパラメータを含むパラメータ群で規定される潜在空間の情報を保持する保持手段を備えるコンピュータを用い、
受入手段が、複数の互いに異なる種類の測定情報を含む測定情報群であって、前記測定情報が、それぞれ任意の時間に測定されてなる測定情報群の入力を受け入れ、
設定手段が、前記受け入れた測定情報群に含まれる測定情報の種類ごとに予め定められた方法で、当該種類の測定情報を用いて、前記保持手段が保持する前記潜在空間の情報を更新して設定し、
出力情報生成手段が、前記設定手段により更新された、前記保持手段が保持する前記潜在空間の情報を用い、所定の出力情報を生成する情報処理方法。
【請求項6】
コンピュータを、
時刻情報
の関数のパラメータを含むパラメータ群で規定される潜在空間の情報を保持する保持手段と、
複数の互いに異なる種類の測定情報を含む測定情報群であって、前記測定情報が、それぞれ任意の時間に測定されてなる測定情報群の入力を受け入れる受入手段と、
前記受け入れた測定情報群に含まれる測定情報の種類ごとに予め定められた方法で、当該種類の測定情報を用いて、前記保持手段が保持する前記潜在空間の情報を更新して設定する設定手段と、
前記設定手段により更新された、前記保持手段が保持する前記潜在空間の情報を用い、所定の出力情報を生成する出力情報生成手段と、
として機能させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、及びプログラムに関する。
【背景技術】
【0002】
緑内障など、種々の治療行為において、患者の症状の進行状態を把握することは必要なことである。具体的に緑内障の治療においては患者の視野の状態を把握する必要があり、現状では、この視野の状態把握のために、光刺激による視野検査を行っている。しかし、治療のために十分な情報を得るためには、視野となり得る多数の点での患者の見え方を検査する必要があり、検査の負担が大きい。
【0003】
また、緑内障の進行の状態を知るために、長期に亘って計測される視野感度の測定情報が必要となるのでは、治療に係る判断まで期日を要することとなってしまう。
【0004】
一方、近年、乳頭部網膜層厚の部分領域平均と視野感度の関係性の有無についての研究がなされている(非特許文献1)。
【先行技術文献】
【非特許文献】
【0005】
【文献】Donald C. Hood, et.al., “A Framework for comparing structural and functional measures of glaucomatous damage”, Progress in Retinal and Eye Research, 2007 Nov. 26(6), pp. 688-710
【発明の概要】
【発明が解決しようとする課題】
【0006】
上述のように、従来の検査等においては、現在の状態の測定のために検査負担が大きくなっている場合がある。一方で、非特許文献1のように新たな知見が得られることで、過去に行われた種々の検査結果を参考に、検査の負担を軽減でき、また、進行の状態の判断も迅速化できる場合もあると期待できる。
【0007】
しかしながら複数の異なる種類の検査結果の間に、上記非特許文献1にあるような相関関係が示唆されたとしても、互いに相関があると考えられる、異なる種類の検査が、例えば同日など、症状の進行が同じとみなせる状態で行われていることは一般に稀なことである。このため、複数の種類の検査の間に相関関係があることが新たな知見として得られたとしても、これらの検査結果の相関関係を検証できず、結局、過去の検査結果の情報を有効に利用できていないのが現状である。
【0008】
本発明は上記実情に鑑みて為されたもので、過去の検査結果の情報を有効に利用し、検査負荷の軽減、並びに治療等に資する判断材料を早期に提供できる情報処理装置、情報処理方法、及びプログラムを提供することを、その目的の一つとする。
【課題を解決するための手段】
【0009】
上記従来例の問題点を解決する本発明の一態様は、情報処理装置であって、時刻情報に関連するパラメータを含むパラメータ群で規定される潜在空間の情報を保持する保持手段と、複数の互いに異なる種類の測定情報を含む測定情報群であって、前記測定情報が、それぞれ任意の時間に測定されてなる測定情報群の入力を受け入れる受入手段と、前記受け入れた測定情報群に含まれる測定情報の種類ごとに予め定められた方法で、当該種類の測定情報を用いて、前記保持手段が保持する前記潜在空間の情報を更新して設定する設定手段と、前記設定手段により更新された、前記保持手段が保持する前記潜在空間の情報を用い、所定の出力情報を生成する出力情報生成手段と、を含むこととしたものである。
【発明の効果】
【0010】
本発明によると、過去の検査結果の情報を有効に利用できる。
【図面の簡単な説明】
【0011】
【
図1】本発明の実施の形態に係る情報処理装置の構成例を表すブロック図である。
【
図2】本発明の実施の形態に係る情報処理装置の例を表す機能ブロック図である。
【
図3】本発明の実施の形態に係る情報処理装置の動作を概念的に表す説明図である。
【
図4】本発明の実施の形態に係る情報処理装置の動作例を表すフローチャート図である。
【発明を実施するための形態】
【0012】
本発明の実施の形態について図面を参照しながら説明する。本発明の実施の形態に係る情報処理装置1は、
図1に例示するように、制御部11と、記憶部12と、操作部13と、表示部14と、インタフェース部15とを含んで構成される。
【0013】
制御部11は、CPU等のプログラム制御デバイスであり、記憶部12に格納されたプログラムに従って動作する。本実施の形態の例では、制御部11は、時刻情報に関連するパラメータを含むパラメータ群で規定される潜在空間の情報を記憶部12に格納して保持し、また、複数の互いに異なる種類の測定情報を含む測定情報群の入力を受け入れる。
【0014】
ここで測定情報群は、それぞれ任意の時間に測定されてなる複数の種類の測定情報を含む。制御部11は、受け入れた測定情報群に含まれる測定情報を、その種類ごとに予め定められた方法で、当該種類の測定情報を用いて、記憶部12に保持している潜在空間の情報を更新して設定する。
【0015】
そして制御部11は、記憶部12が保持する、当該更新された潜在空間の情報を用い、所定の出力情報を生成する。この制御部11の詳しい動作については後に述べる。
【0016】
記憶部12は、メモリデバイス等であり、制御部11によって実行されるプログラムを保持する。このプログラムは、コンピュータ可読、かつ非一時的な記録媒体に格納されて提供され、この記憶部12に複写されたものであってもよい。またこの記憶部12は制御部11のワークメモリとしても動作し、保持手段としても機能する。
【0017】
操作部13は、マウスやキーボード等のデバイスであり、利用者の指示操作の内容を受け入れて制御部11に対して出力する。表示部14は、ディスプレイ等であり、制御部11から入力される指示に従い、情報を出力する。
【0018】
インタフェース部15は、USB(Universal Serial Bus)や、ネットワークインタフェース等であり、外部のメモリや検査装置、サーバ等から、測定情報を受け入れて制御部11に出力する。本実施の形態の一例では、この測定情報は、患者の網膜層の厚さに係る検査結果の情報や、視野内の複数の点における視覚の感度に係る検査結果(光刺激による検査の結果等)の情報を含む。またこのインタフェース部15は、制御部11から入力される指示に従って、外部の装置等に対して、出力の対象となる情報を送出してもよい。
【0019】
次に、本実施の形態の制御部11の動作例について説明する。以下の例では、特定の人物(視野等の検査を受けているものとする)の視野の状態を予測することも目的の一つとなっているものとして説明する。本実施の形態に係る情報処理装置1の制御部11は、記憶部12に格納されたプログラムを実行することで、
図2に例示するように、情報受入部21と、設定部22と、出力生成部23と、出力部24とを機能的に含む構成を実現する。
【0020】
なお、以下の説明では、記憶部12には、時刻情報に関連するパラメータを含むパラメータ群で規定される潜在空間の情報が保持されているものとする。ここでは具体的に、潜在空間が、
At+B
という時刻tに対して線型に変化する関数として(時刻情報の一次関数のパラメータを含むパラメータ群で)記述されているものとする。ここでA,Bは、R次元のベクトルであり、以下、
W=[AB]
を、R行2列の行列として定義する。初期的には、A,Bの各要素はランダムに定められる。この例では記憶部12は、ベクトルA,B(つまり行列W)の各要素の値を、潜在空間の情報として保持する。なお、この例では、ベクトルAの各要素が時刻情報に関連するパラメータであり、A,Bの各要素がパラメータ群に相当する。
【0021】
また本実施の形態では、この潜在空間の情報は、後に説明する測定情報の対象ごとに得られるものとする。一例として、本実施の形態の情報処理装置1が、ある人物の視野の状態を予測するものである場合、ここでの測定情報の対象は、視野等の検査を受けた人物の各目であり、潜在空間の情報は、当該人物ごと、かつ、当該人物の目ごとに定められる。以下、各目i(i=0,1,2…)についての潜在空間の情報をWiなどとしてiを添字にして区別して記述する。
【0022】
情報受入部21は、複数の互いに異なる種類の測定情報を含む測定情報群であって、当該測定情報が、それぞれ任意の時間に測定されてなる測定情報群の入力を受け入れる。具体的には、ここでの測定情報は、光干渉断層計(OCT)による、網膜層厚検査結果(網膜の構造に関する情報)と、視野検査の結果とを含む。本実施の形態では、情報受入部21は、このような網膜層厚検査結果と視野検査結果など、複数の互いに異なる種類の、かつ、任意の時点で(必ずしも同時として評価できない時点でそれぞれ)得られた検査の結果を受け入れる。また、この検査の結果は、必ずしも、特定の人物に係る検査の結果である必要はなく、複数の人物の検査結果が含まれてよい。
【0023】
なお、以下の例で視野検査の結果は、人の目の視野内に設定されたD個の視野検査点での、検査対象者の目が視認した最低明度を表すものとする。つまり視野検査の結果は、D次元のベクトルとなっている。
【0024】
設定部22は、受け入れた測定情報群に含まれる測定情報を、その測定情報の種類ごとに予め定められた方法で、潜在空間の情報に関連付ける。
【0025】
本実施の形態の一例では、測定情報として、画像データである網膜層厚検査結果(網膜の層ごとにGCIPL(Ganglion Cell and Inner Plexiform Layer),RNFL(Retinal Nerve Fiber Layer),RCL(Rod and Cone Layer)の3つの画像データがセットで得られる)と、ベクトルのデータである視野検査結果とを用いる。設定部22は、画像データである網膜層厚検査結果については所定の機械学習処理が施されたニューラルネットワークを用いて、画像データを、潜在空間の情報に関連するベクトルデータに変換する。ここで用いるニューラルネットワークについては後に述べる。また設定部22は、視野検査結果については、次の方法で潜在空間の情報への関連付けを行う。
【0026】
すなわち設定部22は、視野検査結果に対応する潜在空間の情報W0(ここで添字の「0」は、視野を予測しようとする人物の目(以下予測対象と呼ぶ)であることを意味する)を、
G0W0PT0+ε
とおき、この演算の結果が、過去に(T0-1)回行われた実際の視野検査結果と、現在(視野を予測しようとする時点)とを表す視野検査結果行列F0との誤差をできるだけ小さくするG0及びW0を定める。
【0027】
ここで視野検査結果行列F0は、過去の時点τk(k=1,2,…,T0-1)における予測対象の視野検査の結果の列ベクトルをk列目に配列し、最終列に現在(視野を予測しようとする時点)での視野検査の結果の仮の値(以下の処理を行うことにより予測値に更新される)である列ベクトルを配列したものである。従って、この視野検査結果行列は((T0-1)+1)=T0個のD次元のベクトルを配列したものであり、D行T0列の行列となっている。
【0028】
また、G0は、D行R列(Rは潜在空間の次元)の射影行列であり、P0は[t0,1T0]なる行列である。ここでt0は、過去に(T0-1)回の視野検査が行われた時刻(過去の所定の時点を基準時刻Tbとした相対時刻でよい)と、予測したい時刻とを表すT0次元のベクトル、1T0は、すべての要素を「1」としたT0次元のベクトルを意味する。またP0の肩のTは、転置をとることを意味する。なお、εは誤差を表す。
【0029】
本実施の形態の設定部22は、F0-G0W0P
T0のフロベニウスノルムの二乗を最小とするような、G0,W0を求めるよう動作する。つまり、設定部22は、
【数1】
を演算することとなる。
【0030】
ここでM0は、最終列のみを「0」、その他の要素を「1」としたマスク行列であり、
【数2】
は、要素ごとの積を求めることを意味する。また、
【数3】
は、Xのフロベニウスノルムである。
【0031】
つまり、この例では、G0W0PT0が、視野検査結果と潜在空間の情報との変換関係を規定する情報であり、G0がその変換パラメータの一例に相当する。
【0032】
なお、過去の視野検査結果のみから、現在の視野検査の結果を予測するのであれば、設定部22は、F0-G0W0PT0のフロベニウスノルムの二乗を最小とするような、G0,W0を得ればよい。この方法については、種々の広く知られた方法があるので、ここでの詳しい説明は省略する。
【0033】
次に、設定部22が画像データを潜在空間の情報に関連付ける方法の例について述べる。本実施の形態の例では、画像データと潜在空間の情報との変換関係を、CNN(畳み込み)ネットワークを含む多層のニューラルネットワークを利用して規定する。
【0034】
この畳み込みネットワークに入力される情報は、時刻t0_k(k=1,2,…)において網膜層厚検査が行われるごとに得られた画像データ(網膜層厚検査結果)を配列したもので、画像データの次元(2次元)に時刻の次元(1次元)が加算され、さらに3つの画像データのセットが配列された4次元のデータ(画像の幅w×画像の高さh×検査の時刻T0×検査ごとの画像データの数(ここではGCIPL,RNFL,RCLの3つ))となる。なお、ここでの時刻t0_kもまた、視野検査結果の各時刻tの基準とした基準時刻tbとの相対時刻として表す(視野検査結果と同じ時系列に合わせるためである)。
【0035】
設定部22はここで、検査の時点ごとに得られる3つの画像データを連接して三次元データとし、これを検査の時刻順に配列して4次元のデータ(画像系列データ)とする。そして設定部22は、この4次元の画像系列データを、画像系列データと潜在空間の情報との変換関係を規定するニューラルネットワークへの入力とする。
【0036】
このニューラルネットワークは、入力層側では3次元の畳み込みネットワーク(多層のニューラルネットワーク)となっており、中間の層(3次元畳み込みネットワークの出力層)において情報をリシェイプ(次元の変換)し、2次元の畳み込みネットワーク(多層のニューラルネットワーク)にさらに当該リシェイプ後の情報を入力し、その出力としてR×2の要素を有した行列を得るものである。
【0037】
設定部22は、この2次元の畳み込みネットワークの出力を、潜在空間の情報W0として用いる。つまり、このニューラルネットワークは、
【数4】
と表すことができる。ここでC0は、入力データ(複数の画像データを配列した4次元の画像系列データ)であり、ΘEは、ニューラルネットワークの各層間の重みやバイアス等であり、変換パラメータの一例に相当する。
【0038】
従って、設定部22は、現在の視野検査結果を表すような、潜在空間の情報W0が出力されるよう、ニューラルネットワークを機械学習すればよいが、このような潜在空間の情報W0は必ずしも自明ではない。
【0039】
そこで本実施の形態では、設定部22は、次のようにして、潜在空間の情報W0と、視野検査結果の変換パラメータであるG0と、画像系列データ(網膜層厚検査結果)の変換パラメータであるΘEとを、まとめて機械学習する。
【0040】
具体的に設定部22は、次のように定義される目的関数LDLLRを設定する。
【数5】
【0041】
なお、λ1は、網膜層厚検査結果をどれだけ潜在空間のパラメータに影響させるかを表すハイパーパラメータであり、実験的、あるいは経験的に定める。
【0042】
そして設定部22は、上記の目的関数LDLLRを最小化するように、潜在空間の情報W0と、視野検査結果の変換パラメータであるG0と、画像系列データ(網膜層厚検査結果に基づく4次元のデータ)の変換パラメータであるΘEとを、まとめて最適化する。ここでの最適化の方法としては、adam法(D.P.Kingma et.al., Adam: A method for stochastic optimization, arXiv:1412.6980(2014))など、広く知られた方法を採用できるので、ここでの詳しい説明は省略する。設定部22は、ここで最適化して得た視野検査結果の変換パラメータであるG0と、潜在空間の情報W0とを、更新した潜在空間の情報W0として記憶部12に格納する。
【0043】
このように本実施の形態では、
図3に概念的に示すように、設定部22が、測定情報I,Jの種類ごとに定められる変換パラメータ(G0やΘE)を用いて、各種類の測定情報を、潜在空間に対して射影し、あるいは変換するなどの方法で、潜在空間Wの情報(W0)に関連付ける。情報処理装置1は、上記の変換パラメータや潜在空間の情報を表すパラメータを、潜在空間の情報に基づく出力情報(F0)が、前記測定情報の少なくともいずれかに一致することとなるよう(目的関数が最小となるよう)機械学習を通じて求める。また、潜在空間Wは
図3に例示するように、時刻に対して変化する関数(W0)の空間として表現しておく。
【0044】
出力生成部23は、記憶部12に格納された、更新された潜在空間の情報W0を用いて、ユーザが求める出力情報を生成する。本実施の形態の例では、ユーザは、現時点(処理の時点)での視野検査結果の情報が求められているので、出力生成部23は、記憶部12に格納されている潜在空間の情報W0及びG_0、並びにP(現在の時刻を表すパラメータ)を用いて、
F=G0W0PT
を求める。出力生成部23は、このFを、現時点(処理の時点)での視野検査結果の情報を表すベクトルとして、出力部24に出力する。
【0045】
出力部24は、出力生成部23が出力するベクトルの情報を、表示部14等に表示するなどしてユーザに提示する。
【0046】
[他の目の情報を含める例]
また、ここまでの説明では設定部22が、予測の対象とする目に関する測定情報を用いて、潜在空間の情報を最適化し、当該最適化された潜在空間の情報に基づいて、視野検査の結果を予測することとしていたが、本実施の形態では、予測の対象とする目だけではなく、他の目(予測の対象となる人物のもう一つの目、あるいは他の人物の目)に係る測定情報をも用いて、潜在空間の情報の最適化を行ってもよい。
【0047】
この例では、設定部22は、(1)式に代えて、次の(2)式を用い、この(2)式を最小化する。
【数6】
【0048】
この(2)式において、λ0は、ハイパーパラメータであり、また、Nは測定情報が得られている目の数に1を加算した数であり、z0,jは、目の類似度を表すパラメータである。このz0,jは、ここでは、
【数7】
と定義しておく。
【0049】
ここで、F*jは、F0に対応する目以外の、測定対象の目について、F0に含まれる視野検査結果が得られた時点τk(k=1,2,…T0-1)での目j(j=1,2,…)の視野検査結果の予測値(列ベクトル)を、対応する列(k列目)に配列したものである。この視野検査結果の予測値は、ここでは、目jについての実際の視野検査結果に基づく線形回帰による予測値とする。その演算方法は、Kenji Yamanishi, et.al., Predicting glaucoma progression using multi-task learning with heterogeneous features, In Big Data. 2014, IEEE International Conference on. IEEE 261-270に詳細な説明があるので、ここではその説明を省略する。
【0050】
また、σ
2は、
【数8】
を、可能なi,jの組み合わせについて求めたときの中央値(median)である。
【0051】
また、設定部22は、網膜層厚検査結果に基づいて得られる画像系列データについても次のように、他の目(予測の対象となる人物のもう一つの目、あるいは他の人物の目)も含めた処理を行う。すなわち設定部22は、
【数9】
となるようニューラルネットワークfの機械学習を行う。
【0052】
具体的に設定部22は、この例においても潜在空間の情報W0と、視野検査結果の変換パラメータであるG0と、画像系列データ(網膜層厚検査結果に基づく4次元のデータ)の変換パラメータであるΘEとを、まとめて機械学習するため、次のように目的関数LDLLRを設定する:
【数10】
【0053】
そして設定部22は、上記の目的関数LDLLRを最小化するように、潜在空間の情報Wi(i=0を含む)と、視野検査結果の変換パラメータであるGiと、画像系列データ(網膜層厚検査結果に基づく4次元のデータ)の変換パラメータであるΘEとを、まとめて最適化する。
【0054】
さらにここで目的関数には、正則化項として、L2正則化項及び、オートエンコーダの正則化項を加えてもよい。すなわち、
【数11】
としてもよい。ここで、LDLLRは、(4)式のLDLLRである。また、g(・,ΘD)は、f(Ci,ΘE)のデコーダであり、f(Ci,ΘE)と対称的な構造を有するニューラルネットワークである。従って、
【数12】
は、オートエンコーダを意味し、その出力は、入力情報と同じサイズの画像系列データとなる。(5)式の目的関数の第2項ではオートエンコーダの出力と、入力情報との差のフロベニウスノルムの二乗を求めていることとなる。
【0055】
また(5)式の第3項は、L2正則化項である。なお、λ2,λ3はハイパーパラメータであり、それぞれの項の重要度を定めるものである。これらλ2,λ3も、経験的あるいは実験的に定められる。
【0056】
この例においても、設定部22は、上記の目的関数L′DLLRを最小化するように、潜在空間の情報W0と、視野検査結果の変換パラメータであるG0と、画像系列データ(網膜層厚検査結果に基づく4次元のデータ)の変換パラメータであるΘEとを、まとめて最適化する。
【0057】
ここでも最適化の方法としては、adam法など、広く知られた方法を採用できる。設定部22は、ここで述べたLDLLRあるいは、L′DLLRを最適化して得た視野検査結果の変換パラメータであるG0と、潜在空間の情報W0とを、更新した潜在空間の情報W0として記憶部12に格納する。
【0058】
[動作]
本発明の実施の形態に係る情報処理装置1は、例えば以上の構成を備えてなり、次のように動作する。なお、以下の説明では、複数の目(複数の計測対象者の各目)について、過去の任意の時点で行われた視野検査の結果(視野内の各点での計測対象者の感度の情報)や、また別の時点で行われた網膜層厚検査結果(画像データとなっている)との入力を受けて、特定の計測対象者のいずれかの目を予測対象として、当該予測対象となった目の視野検査の結果を予測する例について説明する。
【0059】
この例では、情報処理装置1は、
図4に例示するように、過去に行われた、光干渉断層計(OCT)による、網膜層厚検査結果(網膜の構造に関する情報)と、視野検査の結果とをそれぞれ測定情報として含む、測定情報群を受け入れる(S11)。既に述べたように、これらの検査は、いずれも過去の任意の時点で個別に行われており、同じ目についても、必ずしも双方が同時として評価できる時点で得られたとは限らないものとする。
【0060】
情報処理装置1は、ここで受け入れた測定情報群に含まれる各測定情報を、測定情報の種類ごとに予め定められた方法で、潜在空間の情報に関連付ける。具体的に情報処理装置1は、計測対象の目を順次予測対象の目として選択して、次の処理を繰り返す(S12)。
【0061】
情報処理装置1は、予測対象の目について過去に(T0-1)回行われた実際の視野検査結果を列ベクトルとして行方向に配列し、最後の列に、現在(視野を予測しようとする時点)の視野検査結果の仮の値を列ベクトルとして配列した、D行T0列(Dは視野検査の検査点の数)の視野検査結果行列F0を生成する(S13)。
【0062】
また情報処理装置1は、予測対象以外の、測定対象の目ごとに、視野検査結果の線形回帰のパラメータを求め、処理S13で生成した、F0の最初の(T0-1)列に含まれる各検査の時点に対応する時点での、測定対象の目ごとの視野検査結果の予測値を、この線形回帰のパラメータを利用して求めて、対応する時点の予測値を列ベクトルとして配列してF*jを得る(S14)。情報処理装置1は、処理S15で得たF*jを用いて、(3)式により、予測対象と目jとの類似度を表すパラメータz0,jを得る(S15)。
【0063】
情報処理装置1は、次に、網膜層厚検査結果の画像データについて、検査の時点ごとの画像データを連接してニューラルネットワークに入力する4次元の画像系列データを得る(S16)。なお、ここで情報処理装置1は、予め定めた数より多い回数の網膜層厚検査結果の画像データがある場合は、上記予め定めた数以下の網膜層厚検査結果の画像データを選択して用いてもよい。
【0064】
ここで情報処理装置1は、予測対象となり得る目ごとの潜在空間を規定する情報Wi(i=0,1,2…)を初期化する。この例では目iの潜在空間が、
Ait+Bi
という時刻tに対して線型に変化する関数として記述されているものとすると、
Wi=[AiBi]
なるR行2列の行列として定義する。情報処理装置1は、この潜在空間の情報を表すパラメータであるAi,Biの各要素をランダムに、あるいは事前の知識に基づいて定める(S17)。また情報処理装置1は、オートエンコーダ
【数13】
を、予備的に機械学習する(S18)。この機械学習は、処理S16で生成した画像系列データのうちから任意に(ランダムに)選択した複数の画像系列データをオートエンコーダに入力し、オートエンコーダの出力と、入力した画像系列データとの誤差が小さくなるよう機械学習することで行えばよい。具体的に情報処理装置1は、
【数14】
を最小化するように、adam法などを用いて
【数15】
を定める。そして、情報処理装置1は、その後LDLLR,L′DLLRを用いた演算を行う際には、LDLLR,L′DLLRに含まれるΘE,ΘDを、
【数16】
で初期化して演算を行うこととする。
【0065】
また情報処理装置1は、処理S18において、視野検査結果の変換パラメータであるGiについても予備的に機械学習を行って初期化する。この初期化も、先にランダムに定めたWiを用いて、Fi-GiWiPTiをadam法などにより最小化するよう機械学習を行うことにより実行できる。
【0066】
この場合も、情報処理装置1は、
【数17】
を最小化するGをadam法などにより得て、Giを用いた演算を行う際には、いずれのGiについても(任意のiについて)、Gi=Gと初期化する。
【0067】
そして情報処理装置1は、(5)式を最小化するよう、adam法などにより繰り返し演算を行う(S19)。この繰り返し演算は、L′DLLRが収束するまで(前回得たL′DLLRと、そこから更新して得たL′DLLRとの差が所定のしきい値を下回るまで)行われる。
【0068】
処理S19における繰り返しの演算が終了すると(L′DLLRが最小化されたと判断されると)、情報処理装置1は、その時点でのGi,Wiを記憶部12に格納して(S20)、予測対象としていない目がある場合は処理S13に戻って処理を続け(S21)、ここで全ての目について予測対象として処理を行ったならば、処理を終了する、
【0069】
情報処理装置1は、そして、記憶部12に格納された、更新された潜在空間の情報Wi、及び視野検査結果の変換パラメータであるGiのうち、予測対象とする目についてのWi,Giを選択してW0,G0とし、P(現在の時刻を表すパラメータ)を用いて、
F=G0W0PT
を求める。情報処理装置1は、このFを、現時点(処理の時点)での視野検査結果の情報を表すベクトルとして、ユーザに提示する。具体的には、Fの各要素が表す視野検査点の位置に、当該Fの要素の値を表示することとしてもよい。
【0070】
なお、情報処理装置1は上記の、Gi,Wiの演算の際に、Fの要素を、正規化(最大値が「1」となるように、各検査点での値としてあり得る最大の値qmaxで、各検査点での検査結果の値を除しておくことと)してもよい。このように正規化が行われている場合は、情報処理装置1は、現時点(処理の時点)での視野検査結果の情報を表すベクトルとして得られたFの各要素の値に、上記各検査点での値としてあり得る最大の値qmaxを乗じてから出力してもよい。
【0071】
このように本実施の形態によると、異なる種類の検査が、それぞれ異なる時点で行われていた場合であっても、それぞれの検査の結果等を、共通の潜在空間のパラメータに関連付けて扱い、当該潜在空間で必要な情報に対応する結果を生成して、必要な情報に逆変換することで、各種、各時点での検査の結果を総合した予測を得ることができ、過去の検査結果の情報を有効に利用させることができる。
【0072】
なお、本実施の形態のここでの例では、視野に関する潜在空間の情報を得て、視野検査の結果を予測する例について述べたが、本実施の形態の情報処理装置1は、このような処理を行うものに限られず、時系列変化する情報(例えば何らかの構造物の経年劣化など)について、当該情報に関連すると想定される複数種類の測定値が散発的に得られているようなケースについて幅広く応用できる。
【実施例】
【0073】
次に、本実施の形態の情報処理装置1による視野検査結果の予測と、実際に測定した結果との誤差(RMSE:root mean squared error)を求めた例を示す。
【0074】
[表1]には、本実施の形態の方法(DLLR)との比較のため、比較例1として測定対象者ごとの線型回帰により予測した例(LR)と、Zenghan Liangらによる(Zenhang Liang, et.al., Quantitative prediction of glaucomatous visual field loss from few measurements., In Data Mining(ICDM), 2013, IEEE 13th International Conference on. IEEE,. 1121-1126)クラスタリングを用いた方法(TSLR)と、Shigeru Mayaらによる(Shigeru Maya, et. al., Predicting glaucoma progression using multi-task learning with heterogeneous features. In Big Data(Big Data), 2014, IEEE International Conference on. IEEE, 261-270 )、Multitask Matrix Completionを用いた方法(MTMC)を併せて示す。
【0075】
なお、[表1]において横軸のSは、使用する網膜層厚検査結果の回数(
図4の処理S16で用いる数)である。
【0076】
[表1]に示されるように、他の方法に比べ、本実施の形態の方法によると、用いる検査数が比較的少数であっても、比較的低い誤差で、視野検査結果を予測できる。
【表1】
【符号の説明】
【0077】
1 情報処理装置、11 制御部、12 記憶部、13 操作部、14 表示部、15 インタフェース部、21 情報受入部、22 設定部、23 出力生成部、24 出力部。