(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023113031
(43)【公開日】2023-08-15
(54)【発明の名称】照合装置、照合方法、および照合プログラム
(51)【国際特許分類】
G06N 20/00 20190101AFI20230807BHJP
【FI】
G06N20/00 130
【審査請求】未請求
【請求項の数】15
【出願形態】OL
(21)【出願番号】P 2022015123
(22)【出願日】2022-02-02
(71)【出願人】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(71)【出願人】
【識別番号】504173471
【氏名又は名称】国立大学法人北海道大学
(74)【代理人】
【識別番号】110001678
【氏名又は名称】藤央弁理士法人
(72)【発明者】
【氏名】レイ ミャオメイ
(72)【発明者】
【氏名】中村 宝弘
(72)【発明者】
【氏名】竹本 享史
(72)【発明者】
【氏名】眞山 学徳
(57)【要約】
【課題】アノテーションの信頼性の向上を図ること。
【解決手段】照合装置は、サンプル群の各々の説明変数に基づいて、前記サンプル群を、第1分類を示す第1グループと、前記第1分類よりも評価が低い第2分類を示す第2グループと、にグループ分けするグループ分け処理部と、前記グループ分け処理部によってグループ分けされた前記第1グループおよび前記第2グループの分類と、前記サンプル群の各々の目的変数によって特定される分類と、を照合する照合部と、前記照合部による照合結果を出力する出力部と、を有する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
サンプル群の各々の説明変数に基づいて、前記サンプル群を、第1分類を示す第1グループと、前記第1分類よりも評価が低い第2分類を示す第2グループと、にグループ分けするグループ分け処理部と、
前記グループ分け処理部によってグループ分けされた前記第1グループおよび前記第2グループの分類と、前記サンプル群の各々の目的変数によって特定される分類と、を照合する照合部と、
前記照合部による照合結果を出力する出力部と、
を有することを特徴とする照合装置。
【請求項2】
請求項1に記載の照合装置であって、
前記照合部は、前記サンプル群のうち前記第1グループに所属する第1サンプルの目的変数によって特定される分類が前記第1分類であれば、前記第1サンプルに前記第1分類を示すアノテーションを付与する、
ことを特徴とする照合装置。
【請求項3】
請求項1に記載の照合装置であって、
前記照合部は、前記サンプル群のうち前記第1グループに所属する第1サンプルの目的変数によって特定される分類が前記第2分類であれば、前記第1サンプルに矛盾を示すアノテーションを付与する、
ことを特徴とする照合装置。
【請求項4】
請求項1に記載の照合装置であって、
前記照合部は、前記サンプル群のうち前記第2グループに所属する第2サンプルの目的変数によって特定される分類が前記第2分類であれば、前記第2サンプルに前記第2分類を示すアノテーションを付与する、
ことを特徴とする照合装置。
【請求項5】
請求項1に記載の照合装置であって、
前記照合部は、前記サンプル群のうち前記第2グループに所属する第2サンプルの目的変数によって特定される分類が前記第1分類であれば、前記第2サンプルに矛盾を示すアノテーションを付与する、
ことを特徴とする照合装置。
【請求項6】
請求項1に記載の照合装置であって、
前記グループ分け処理部は、前記説明変数による教師無し学習でクラスタリングすることにより、前記サンプル群を、前記第1グループと前記第2グループとにグループ分けする、
ことを特徴とする照合装置。
【請求項7】
請求項1に記載の照合装置であって、
前記グループ分け処理部は、前記説明変数と、前記目的変数の実測値によって特定される分類と、による教師有り学習に基づいて、前記サンプル群を、前記第1グループと前記第2グループとにグループ分けする、
ことを特徴とする照合装置。
【請求項8】
請求項2に記載の照合装置であって、
前記第1分類を示すアノテーションが付与された第1サンプルの説明変数と、目的変数となる前記第1分類を示すアノテーションと、に基づいて学習して、学習モデルを生成する学習部と、
前記学習部によって生成された学習モデルに予測対象サンプル群の各々の説明変数を入力することにより、前記予測対象サンプル群の各々の目的変数の予測値を算出する算出部と、
を有する照合装置。
【請求項9】
請求項8に記載の照合装置であって、
前記グループ分け処理部は、前記予測対象サンプル群の各々の説明変数に基づいて、前記予測対象サンプル群を、前記第1グループと、前記第2グループと、にグループ分けし、
前記照合部は、前記グループ分け処理部によって前記予測対象サンプル群がグループ分けされた前記第1グループおよび前記第2グループの分類と、前記算出部によって算出された予測値によって特定される分類と、を照合する、
ことを特徴とする照合装置。
【請求項10】
請求項9に記載の照合装置であって、
前記照合部は、前記予測対象サンプル群のうち前記第1グループに所属する第1予測対象サンプルの前記予測値によって特定される分類が前記第1分類であれば、前記第1予測対象サンプルに前記第1分類を示すアノテーションを付与する、
ことを特徴とする照合装置。
【請求項11】
請求項9に記載の照合装置であって、
前記照合部は、前記予測対象サンプル群のうち前記第1グループに所属する第1予測対象サンプルの前記予測値によって特定される分類が前記第2分類であれば、前記第1予測対象サンプルに矛盾を示すアノテーションを付与する、
ことを特徴とする照合装置。
【請求項12】
請求項9に記載の照合装置であって、
前記照合部は、前記予測対象サンプル群のうち前記第2グループに所属する第2予測対象サンプルの前記予測値によって特定される分類が前記第2分類であれば、前記第2予測対象サンプルに前記第2分類を示すアノテーションを付与する、
をことを特徴とする照合装置。
【請求項13】
請求項9に記載の照合装置であって、
前記照合部は、前記予測対象サンプル群のうち前記第2グループに所属する第2予測対象サンプルの前記予測値によって特定される分類が前記第1分類であれば、前記第2予測対象サンプルに矛盾を示すアノテーションを付与する、
ことを特徴とする照合装置。
【請求項14】
プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有する照合装置による照合方法であって、
前記プロセッサが、
サンプル群の各々の説明変数に基づいて、前記サンプル群を、第1分類を示す第1グループと、前記第1分類よりも評価が低い第2分類を示す第2グループと、にグループ分けするグループ分け処理と、
前記グループ分け処理によってグループ分けされた前記第1グループおよび前記第2グループの分類と、前記サンプル群の各々の目的変数によって特定される分類と、を照合する照合処理と、
前記照合処理による照合結果を出力する出力処理と、
を実行することを特徴とする照合方法。
【請求項15】
プロセッサに、
サンプル群の各々の説明変数に基づいて、前記サンプル群を、第1分類を示す第1グループと、前記第1分類よりも評価が低い第2分類を示す第2グループと、にグループ分けするグループ分け処理と、
前記グループ分け処理によってグループ分けされた前記第1グループおよび前記第2グループの分類と、前記サンプル群の各々の目的変数によって特定される分類と、を照合する照合処理と、
前記照合処理による照合結果を出力する出力処理と、
を実行させることを特徴とする照合プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データを照合する照合装置、照合方法、および照合プログラムに関する。
【背景技術】
【0002】
CTG(CardioTocoGram:胎児心拍陣痛図)は、胎児心拍数計と外側陣痛計それぞれから得られた胎児心拍数と陣痛図(子宮収縮)の経時的変化を示す波形であり、胎児のWell being(元気さ)の評価に用いられる。分娩時の胎児の評価には必須の検査である。CTGは、分娩中に生じうる胎児の低酸素やアシドーシスを早期発見し、生まれてくる胎児の低酸素脳症や脳性麻痺を減らすために有用である。
【0003】
医者は、胎児心拍の基線と徐脈のパターンから評価を行うレベル分類により、胎児心拍陣痛図の評価を行うが、CTGの波形は複雑であり、判断する医療従事者の経験に左右される。また、非特許文献1は、胎児心拍の信号から、胎児の状態を予測する技術を開示する。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】Ramanujam, E., et al. "Prediction of Fetal Distress Using Linear and Non-linear Features of CTG Signals." International Conference On Computational Vision and Bio Inspired Computing. Springer, Cham, 2019.
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上述した非特許文献1で提示された予測方法は、医者のアノテーション付きのデータを使い、胎児の心拍と子宮収縮の波形から特徴量を抽出し、胎児状態を予測する技術だが、整備されたアノテーション付きのデータが必要となる。データのアノテーションは医者の経験に左右されるため、信頼性にばらつきがある。また、医者によるアノテーションだけでは、いくつかのカテゴリに分類するにとどまり(例:安全または危険)、ph値を予測できない。
【0006】
本発明は、アノテーションの信頼性の向上を図ることを目的とする。
【課題を解決するための手段】
【0007】
本願において開示される発明の一側面となる照合装置は、サンプル群の各々の説明変数に基づいて、前記サンプル群を、第1分類を示す第1グループと、前記第1分類よりも評価が低い第2分類を示す第2グループと、にグループ分けするグループ分け処理部と、前記グループ分け処理部によってグループ分けされた前記第1グループおよび前記第2グループの分類と、前記サンプル群の各々の目的変数によって特定される分類と、を照合する照合部と、前記照合部による照合結果を出力する出力部と、を有することを特徴とする。
【発明の効果】
【0008】
本発明の代表的な実施の形態によれば、アノテーションの信頼性の向上を図ることができる。前述した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。
【図面の簡単な説明】
【0009】
【
図1】
図1は、学習DBの整備例を示す説明図である。
【
図2】
図2は、照合装置のハードウェア構成例を示すブロック図である。
【
図3】
図3は、学習DBの一例を示す説明図である。
【
図4】
図4は、特徴量に含まれる測定因子例1を示す説明図である。
【
図5】
図5は、特徴量に含まれる測定因子例2を示す説明図である。
【
図6】
図6は、基本情報DBの一例を示す説明図である。
【
図7】
図7は、照合装置の機能的構成例を示すブロック図である。
【
図8】
図8は、前処理部による前処理手順例を示すフローチャートである。
【
図9】
図9は、学習時における選択画面の表示例を示す説明図である。
【
図10】
図10は、予測時における選択画面の表示例を示す説明図である。
【
図11】
図11は、学習時の照合処理手順例を示すフローチャートである。
【
図12】
図12は、特徴量選択画面の一例を示す説明図である。
【
図13】
図13は、照合結果表示画面の一例を示す説明図である。
【
図14】
図14は、照合結果表示画面の一例を示す説明図である。
【
図15】
図15は、照合結果表示画面の一例を示す説明図である。
【
図16】
図16は、照合結果表示画面の一例を示す説明図である。
【
図17】
図17は、予測時の照合処理手順例を示すフローチャートである。
【発明を実施するための形態】
【0010】
<学習DBの整備例>
図1は、学習DBの整備例を示す説明図である。学習DB100は、妊婦であるサンプルごとに説明変数となる特徴量と目的変数となる正解データとの組み合わせをサンプルデータとして記憶するデータベースである。正解データは、学習時では、たとえば、分娩済みのサンプルに対する医者によるアノテーション(胎児の状態が安全または危険)であり、pH予測時では、分娩前のサンプルに対する、学習時に得られたアノテーション(胎児の状態が安全または危険)である。
【0011】
サンプルデータの各々は、胎児の状態が安全である安全グループと胎児の状態が危険である危険グループにクラスタリングされる。クラスタリングは、正解データを用いない教師無し学習または正解データを用いた教師有り学習で実行される。ここでは、正解データを用いない教師無し学習を例に挙げる。正解データを用いない教師無し学習では、サンプルデータ群は、2つのグループにクラスタリングされ、サンプルデータ数が多い方のグループを安全グループとし、少ない方を危険グループとする。
【0012】
また、pHは、胎児の低酸素またはアシドーシスの指標となる、分娩直後の臍帯動脈血ガス分析値である。たとえば、pH値は7.2を基準とし、pH>7.2であれば胎児は安全であり、pH≦7.2であれば胎児は危険とされる。pH値は、分娩済みのサンプルの場合は分娩直後の実測値であり、分娩前のサンプルの場合は分娩前の予測値である。
【0013】
サンプルデータが安全グループに属し、かつ、pH値が安全値であるという照合結果101(ともに安全)であれば、そのサンプルデータは、学習対象として学習DB100に保持され、かつ、「安全」を示すアノテーションが付与される。「安全」を示すアノテーションは、ユーザに表示される。
【0014】
サンプルデータが安全グループに属し、かつ、pH値が危険値であるという照合結果102(矛盾)であれば、そのサンプルデータは、学習対象外として学習DB100において学習利用不能に設定され、かつ、サンプルの属性「安全」とpHの安全値とが「矛盾」することがユーザに表示される。
【0015】
サンプルデータが危険グループに属し、かつ、pH値が安全値であるという照合結果103(矛盾)であれば、そのサンプルデータは、学習対象外として学習DB100において学習利用不能に設定され、かつ、サンプルの属性「危険」とpHの安全値とが「矛盾」することがユーザに表示される。
【0016】
サンプルデータが危険グループに属し、かつ、pH値が危険値であるという照合結果104(ともに危険)であれば、そのサンプルデータは、学習対象外として学習DB100において学習利用不能に設定され、かつ、「危険」を示すアノテーションが付与される。「危険」を示すアノテーションは、ユーザに表示される。
【0017】
このように、「安全」、「矛盾」および「危険」を示す照合結果101~104がアノテーションとして自動付与される。これにより、アノテーションの信頼性の向上を図ることができる。また、「矛盾」または「危険」を示す照合結果102~104がアノテーションとして付与されたサンプルデータは、学習対象外となるため、「安全」を示す照合結果101がアノテーションとして付与されたサンプルデータが残存する。したがって、学習DB100の自動整理化を図ることができる。また、残存したサンプルデータ群を用いて学習モデルを生成することにより、pHの予測値の高精度化を図ることができる。
【0018】
<照合装置のハードウェア構成例>
図2は、照合装置のハードウェア構成例を示すブロック図である。照合装置200は、プロセッサ201と、記憶デバイス202と、入力デバイス203と、出力デバイス204と、通信インターフェース(通信IF)205と、を有する。プロセッサ201、記憶デバイス202、入力デバイス203、出力デバイス204、および通信IF205は、バス206により接続される。プロセッサ201は、照合装置200を制御する。記憶デバイス202は、プロセッサ201の作業エリアとなる。また、記憶デバイス202は、各種プログラムやデータを記憶する非一時的なまたは一時的な記録媒体である。記憶デバイス202としては、たとえば、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)、フラッシュメモリがある。入力デバイス203は、データを入力する。入力デバイス203としては、たとえば、キーボード、マウス、タッチパネル、テンキー、スキャナ、マイク、センサがある。出力デバイス204は、データを出力する。出力デバイス204としては、たとえば、ディスプレイ、プリンタ、スピーカがある。通信IF205は、ネットワークと接続し、データを送受信する。
【0019】
<学習DB100>
図3は、学習DB100の一例を示す説明図である。学習DB100は、記憶デバイス202または照合装置とアクセス可能な他のコンピュータの記憶デバイスに格納される。
【0020】
学習DB100は、フィールドとして、サンプルID301と、特徴量302と、pH303と、所属グループ304と、アノテーション305と、学習対象外フラグ306とを有する。同一行の各フィールド301~306の値の組み合わせが、1個のサンプルのサンプルデータを示すエントリを規定する。サンプルは妊婦を示すが、同一妊婦が異なる日時で心拍および陣痛強度を測定した場合、それぞれ異なるサンプルとなる。
図3では、m個(mは1以上の整数)のサンプルのサンプルデータが登録されている。
【0021】
サンプルID301は、サンプルを一意に特定する識別情報である。特徴量302は、サンプルID301で特定されるサンプルの特徴を示すデータである。特徴量302は、妊婦の年齢、妊娠週数、胎児の発達遅延、胎児の数、出産方式、服薬情報、喫煙などの基本因子や心拍および陣痛強度を測定する測定装置による測定結果などの測定因子などの因子F1~Fn(nは1以上の整数)で構成される。
【0022】
pH303は、分娩直後の臍帯動脈血ガス分析値であり、予測値331と実測値332とが格納される。分娩前では予測値331のみが後述する算出部703によって算出されて格納される。分娩後では臍帯動脈血ガス分析値が測定されて実測値332として格納される。
【0023】
所属グループ304は、サンプルID301で特定されるサンプルが所属するグループである。グループには、安全グループと危険グループがある。
図1で説明したように、教師無し学習でクラスタリングされた場合、サンプルデータ数が多い方のグループを安全グループとし、少ない方を危険グループとする。
【0024】
一方、実測値332を、pH値=7.2を基準とし、実測値332がpH>7.2であれば安全を示す正解ラベル、pH≦7.2であれば危険を示す正解ラベルを付与して、教師有り学習をすることにより、サンプルデータの所属グループ304を決定してもよい。
【0025】
アノテーション305は、サンプルの胎児に対する評価指標であり、医師によって付与され、または、後述する照合部704による照合結果として付与される。
【0026】
学習対象外フラグ306は、そのサンプルデータを学習対象外に設定するためのフラグである。「0」が学習対象でデフォルトの値、「1」が学習対象外を示す。なお、学習対象外フラグ306を用いずに、照合装置は、学習対象外となったサンプルデータのエントリを削除してもよい。
【0027】
<特徴量302>
図4は、特徴量302に含まれる測定因子例1を示す説明図である。
図4は、CTGの波形から得られるヒストグラム400を示す。ヒストグラム400から得られる特徴量302の因子には、たとえば、最頻値(mode)、平均値、中央値、分散、ヒストグラム幅、低頻度(low frequency)、代表値(tendency)がある。
【0028】
図5は、特徴量302に含まれる測定因子例2を示す説明図である。
図5は、CTGの波形を示す。波形には、心拍波形501と陣痛強度波形502がある。心拍波形501から得られる因子には、たとえば、ベースライン、波形最大値、波形最小値、波形平均値、波形分散がある。陣痛強度波形502から得られる因子には、たとえば、陣痛の割合(総陣痛時間/測定期間)がある。また、医学的な知見として得られる因子には、たとえば、胎児心拍回数が80[bpm]以下に下がった回数、胎児心拍回数がベースラインから30[bpm]以上下がった回数、胎児心拍回数が80[bpm]以下に下がった継続時間、胎児心拍回数がベースラインから30[bpm]以上下がった継続時間、胎児心拍回数が一番低い時から生まれるまでの時間がある。
【0029】
<基本情報DB>
図6は、基本情報DBの一例を示す説明図である。基本情報DB600は、記憶デバイス202または照合装置とアクセス可能な他のコンピュータの記憶デバイスに格納される。
【0030】
基本情報DB600は、サンプルデータのクレンジングに用いるデータを記憶する。具体的には、たとえば、基本情報DB600は、基本因子群に関する条件601と、データの質条件602と、を含む。基本因子群に関する条件601は、例えば、サンプルである妊婦の年齢、妊娠週数、出産方式、胎児の数、胎児の発達遅延、服薬情報、喫煙などの基本因子群が学習対象外となる条件である。たとえば、年齢の場合、45歳以上のサンプルデータであれば、学習対象外に設定される。また、妊娠週数であれば、27週未満または43週以上のサンプルデータは学習対象外に設定される。このように、因子ごとに学習対象外となる条件が設定される。
【0031】
データの質条件602は、基本因子群に関する条件601とは異なり、サンプルデータの値の質に関する条件であり、たとえば、欠損値が20%以上のサンプルデータは学習対象外に設定される。なお、学習対象外とは、学習に用いられなければ、単にサンプルデータ自体が学習DB100に残された状態でもよく、また、学習DB100から削除された状態でもよい。なお、学習DB100から削除された場合であっても、記憶デバイス202には残存してもよい。
【0032】
<照合装置の機能的構成例>
図7は、照合装置200の機能的構成例を示すブロック図である。照合装置200は、学習DB100および基本情報DB600にアクセス可能である。また、照合装置200は、前処理部701と、グループ分け処理部702と、算出部703と、照合部704と、出力部705と、学習部706と、を有する。前処理部701、グループ分け処理部702、算出部703、照合部704、出力部705、および学習部706は具体的には、たとえば、
図2に示した記憶デバイス202に記憶されたプログラムをプロセッサ201に実行させることにより実現される。
【0033】
前処理部701は、基本情報DB600を参照して、学習DB100内のサンプルデータ群をクレンジングし、不要なサンプルデータを学習対象外にする。
【0034】
グループ分け処理部702は、学習DB100内のサンプルデータ群を安全グループと危険グループとにグループ分けする。具体的には、たとえば、上述したように、グループ分け処理部702は、教師無し学習により、サンプルデータの特徴量302(具体的には、たとえば、測定因子群)間の距離が近いサンプルデータ同士でグルーピングし、最終的に2つのグループに収束するまでグルーピングを実行する。最終的な2つのグループが安全グループと危険グループであり、サンプルデータ数が多い方が安全グループ、少ない方が危険グループである。
【0035】
また、グループ分け処理部702は、特徴量302(具体的には、測定因子群)とpH303の実測値332に基づく正解ラベル(pH>7.2であれば安全、pH≦7.2であれば危険)との組み合わせを教師データとし、教師有り学習により、安全グループと危険グループに分類する。pH303の実測値332を用いるため、グループ分けの対象となるサンプルデータは、出産済みの妊婦のサンプルデータとなる。
【0036】
算出部703は、学習部706によって生成された学習モデルに、pH303の予測値331が算出されていないサンプルデータ(予測対象サンプルデータ)の特定の測定因子群(医学的な知見として得られる因子群)を入力することにより、pH303の予測値331を算出する。
【0037】
照合部704は、
図1に示したように、サンプルデータごとにpH303から得られる安全値(pH>7.2)または危険値(pH≦7.2)と、アノテーション305と、を照合する。pH303については、実測値332があるサンプルデータについては実測値332、実測値332がないサンプルデータについては予測値331が用いられる。
【0038】
照合部704による照合前では、アノテーション305は、医師によるアノテーションであり、照合部704による照合後では、照合部704による照合結果となる。
【0039】
出力部705は、前処理部701による前処理結果や照合部704による照合結果を表示可能に出力する。具体的には、たとえば、出力部705は、出力デバイス204の一例である表示装置に前処理結果や照合結果を表示したり、通信IF206を介して他のコンピュータに前処理結果や照合結果に送信して他のコンピュータに表示させたりする。
【0040】
学習部706は、特徴量302内の各サンプルデータの医学的な知見として得られる因子群とpH303の実測値332とを用いて重回帰モデルを学習モデルとして生成する。
【0041】
<照合処理手順>
つぎに、照合装置200による照合処理手順例について機能ごとに説明する。照合装置200は、学習モデルの学習と、学習モデルを用いたpH303の予測と、を実行するが、後述の各機能による処理では、学習と予測のいずれに適用されるかを示して説明する。
【0042】
[前処理手順例]
図8は、前処理部701による前処理手順例を示すフローチャートである。前処理手順は、学習および予測の両方で実行される。前処理部701は、学習DB100に未選択のサンプルデータがあるか否かを判断する(ステップS801)。未選択のサンプルデータがある場合(ステップS801:Yes)、前処理部701は、未選択サンプルデータを1つ選択する(ステップS802)。前処理部701は、選択サンプルデータについて、基本情報DB600を用いて前処理(クレンジング)、すなわち、選択サンプルデータが基本因子群に関する条件601およびデータの質条件602に該当するか否かを判定する処理を実行する(ステップS802)。
【0043】
そして、前処理部701は、選択画面を表示可能に出力する(ステップS804)。具体的には、たとえば、前処理部701は、出力デバイス204の一例である表示装置に表示したり、ユーザが操作する他のコンピュータに表示させたりする。
【0044】
図9は、学習時における選択画面の表示例を示す説明図である。選択画面900は、前処理結果として、第1ラジオボタン901と、第2ラジオボタン902と、実行ボタン903と、第1文字列910と、第2文字列920と、を表示する。
【0045】
第1ラジオボタン901は、ユーザが、前処理された選択サンプルデータを学習対象にするための選択ボタンであり、その理由が第1文字列910として表示される。第1文字列910の「すべての条件」とは、基本情報DB600の基本因子群に関する条件601およびデータの質条件602である。すなわち、その選択サンプルデータは、学習対象であることを示す。
【0046】
第2ラジオボタン902は、ユーザが、前処理された選択サンプルデータを学習対象外にするための選択ボタンであり、その理由が第2文字列920として表示される。第2文字列920は、たとえば、基本情報DB600の基本因子群に関する条件601およびデータの質条件602のうち、その選択サンプルデータが該当した条件である。
【0047】
実行ボタン903は、第1ラジオボタン901および第2ラジオボタン902のいずれかの選択を確定するためのボタンであり、前処理部701は、その選択サンプルデータが学習対象および学習対象外のいずれに選択されたかを示す信号を受け付ける。
【0048】
図10は、予測時における選択画面の表示例を示す説明図である。選択画面1000は、前処理結果として、第1ラジオボタン1001と、第2ラジオボタン1002と、実行ボタン1003と、第1文字列1010と、第2文字列1020と、を表示する。
【0049】
第1ラジオボタン1001は、ユーザが、前処理された選択サンプルデータを学習対象にするための選択ボタンであり、その理由が第1文字列1010として表示される。第1文字列1010の「すべての条件」とは、基本情報DB600の基本因子群に関する条件601およびデータの質条件602である。すなわち、その選択サンプルデータは、学習対象であることを示す。
【0050】
第2ラジオボタン1002は、ユーザが、前処理された選択サンプルデータを学習対象外にし、かつ、測定装置の装着の再確認を促すための選択ボタンであり、再確認を促す内容が第2文字列1020として表示される。実行ボタン1003は、第1ラジオボタン1001および第2ラジオボタン1002のいずれかの選択を確定するためのボタンであり、前処理部701は、その選択サンプルデータが学習対象および学習対象外のいずれに選択されたかを示す信号を受け付ける。
【0051】
図8に戻り、実行ボタン903または実行ボタン1003の押下により、前処理部701は、選択信号を受け付ける(ステップS805)。選択信号が学習対象を示す場合(ステップS806:Yes)、ステップS801に戻る。一方、選択信号が学習対象外を示す場合(ステップS806:No)、前処理部701は、選択サンプルデータの学習対象外フラグ306を学習対象外に設定して(ステップS807)、ステップS801に戻る。ステップS801において、未選択サンプルデータがない場合、前処理部701は、前処理を終了する。
【0052】
[学習時の照合処理手順例]
図11は、学習時の照合処理手順例を示すフローチャートである。グループ分け処理部702は、特徴量の因子を選択する(ステップS1101)。具体的には、たとえば、グループ分け処理部702は、照合開始時に、特徴量選択画面を表示可能に出力する。
【0053】
図12は、特徴量選択画面の一例を示す説明図である。特徴量選択画面1200は、自動選択ボタン1201と、番号選択ボタン1202と、因子群一覧1203と、実行ボタン1204と、を有する。自動選択ボタン1201は、照合装置200が自動で特徴量302の因子を選択するためのボタンである。番号選択ボタン1202は、因子群一覧1203の因子群から任意の1以上の因子を選択するためのボタンである。ユーザは、因子群一覧1203の左端にある各因子のラジオボタン(丸図形で表示)を選択する。実行ボタン1204は、押下により、グループ分け処理部702は、自動選択または番号選択(選択番号を含む)を示す選択方法信号を受け付ける。
【0054】
図11に戻り、グループ分け処理部702は、選択方法信号を受け付けると、特徴量の因子を選択する。具体的には、たとえば、自動選択の場合、グループ分け処理部702は、T検定または主成分分析により、特徴量302の因子を自動選択する。また、番号選択の場合、グループ分け処理部702は、番号選択された因子を選択する。
【0055】
グループ分け処理部702は、ステップS1101で選択された因子を特徴量302として、学習DB100内のサンプルデータ群についてグループ分け処理を実行する(ステップS1102)。グループ分け処理(ステップS1102)の対象となるサンプルデータは、pH303の実測値332を有し、かつ、学習対象外フラグ306が「0」(学習対象)であるサンプルデータである。これにより、不良データがグループ分け処理(ステップS1102)に適用されないため、学習時のグループ分け処理(ステップS1102)の精度が向上する。
【0056】
また、学習時において、グループ分け処理(ステップS1102)では、グループ分け処理部702は、サンプルデータの選択因子と正解データ(pH303の実測値332から得られる正解ラベル)とを学習データセットとする教師有り学習を実行してもよく、サンプルデータの選択因子のみを用いる教師無し学習を実行してもよい。いずれにしても、グループ分け処理部702は、サンプルデータ群を安全グループと危険グループとにグループ分けし、所属グループ304を設定する。
【0057】
つぎに、照合部704は、
図1に示したように、サンプルデータごとに、pH303の実測値332の分類(安全または危険)と、所属グループ304の分類(安全または危険)と、を照合する(ステップS1103)。照合部704は、照合結果101~104をアノテーション305として付与し(ステップS1104)、照合結果101~104に基づいて学習対象外フラグ306を更新する(ステップS1105)。具体的には、たとえば、照合部704は、照合結果101~104のサンプルデータについて学習対象外フラグ306を「1」に更新する。そして、出力部705は、照合結果101~104を表示可能に出力する(ステップS1106)。
【0058】
図13~
図16は、照合結果表示画面の一例を示す説明図である。照合結果表示画面1300は、照合結果101を表示し、照合結果表示画面1400は、照合結果102を表示し、照合結果表示画面1500は、照合結果103を表示し、照合結果表示画面1600は、照合結果104を表示する。
【0059】
図11に戻り、学習部706は、照合結果101のサンプルデータ群の各々の選択因子およびpH303の実測値332の組み合わせである学習データセットを用いて学習し、学習モデル(たとえば、重回帰モデル)を生成する(ステップS1107)。これにより、グループ分け処理部702、照合部704、出力部705および学習部706による学習時の照合処理が終了する。
【0060】
[予測時の照合処理手順例]
図17は、予測時の照合処理手順例を示すフローチャートである。グループ分け処理部702は、ステップS1101と同様、特徴量の因子を選択する(ステップS1701)。グループ分け処理部702は、ステップS1701で選択された因子を特徴量302として、学習DB100内のサンプルデータ群についてグループ分け処理を実行する(ステップS1702)。
【0061】
グループ分け処理(ステップS1702)の対象となるサンプルデータは、pH303の実測値332がなく、かつ、学習対象外フラグ306が「0」(学習対象)であるサンプルデータである。これにより、不良データがグループ分け処理(ステップS1102)に適用されないため、予測時のグループ分け処理(ステップS1702)の精度が向上する。
【0062】
また、学習時において、グループ分け処理(ステップS1702)では、グループ分け処理部702は、サンプルデータの選択因子のみを用いる教師無し学習を実行してもよく、サンプルデータの選択因子と正解データとを学習データセットとする教師有り学習を実行してもよい。
【0063】
教師有り学習の場合、正解データは、たとえば、ステップS1104で付与されたアノテーション305の分類(ともに安全が「安全」の正解ラベル、矛盾およびともに危険が「危険」の正解ラベル)とする。いずれにしても、グループ分け処理部702は、サンプルデータ群を安全グループと危険グループとにグループ分けし、所属グループ304を設定する。正解データを用いて教師有り学習をすることにより、ステップS1104でアノテーション305として付与された照合結果101を学習モデルに反映することができる。
【0064】
つぎに、算出部703は、サンプルデータの選択因子の値を学習モデルに入力することにより、当該サンプルデータのpH303の予測値331を算出し、学習DBに格納する(ステップS1703)。
【0065】
つぎに、照合部704は、
図1に示したように、サンプルデータごとに、pH303の予測値331の分類(安全または危険)と、所属グループ304の分類(安全または危険)と、を照合する(ステップS1704)。照合部704は、照合結果101~104をアノテーション305として付与し(ステップS1705)、照合結果101~104に基づいて学習対象外フラグ306を更新する(ステップS1706)。
【0066】
具体的には、たとえば、照合部704は、照合結果101~104のサンプルデータについて学習対象外フラグ306を「1」に更新する。そして、照合部704は、
図14~
図17に示したように、照合結果101~104を表示可能に出力する(ステップS1707)。これにより、グループ分け処理部702、算出部703、照合部704および出力部705による予測時の照合処理が終了する。
【0067】
なお、分娩前のpH303の実測値332がないサンプルであっても、分娩後にはpH303の実測値332が得られる。この場合、照合装置は、pH303の実測値332について
図11に示した学習時の照合処理を実行することで、アノテーション305を更新することができる。また、照合装置は、pH303の予測値331と実測値332との差に基づいて誤差逆伝播することにより、学習モデルを再学習する。これにより、学習モデルの高精度化を図ることができる。
【0068】
以上説明したように、「安全」、「矛盾」および「危険」を示す照合結果101~104がアノテーション305として自動付与されるため、アノテーション305の信頼性の向上を図ることができる。また、「矛盾」または「危険」を示す照合結果102~104がアノテーション305として付与されたサンプルデータは、学習対象外となるため、「安全」を示す照合結果101がアノテーション305として付与されたサンプルデータが残存する。したがって、学習DB100の自動整理化を図ることができる。また、残存したサンプルデータ群を用いて学習モデルを生成することにより、pH303の予測値331の高精度化を図ることができる。したがって、データの処理コストをかけずに胎児状態の予測が可能となる。
【0069】
また、上述した実施例では、安全と危険の2つのグループとしたが、グループの分類は、安全および危険に限らず、サンプルの精度や信頼度のような程度を表す評価の分類であればよい。また、上述した実施例では、サンプルを妊婦としたが、妊婦に限らず、人や装置など様々な測定対象をサンプルとしてもよい。
【0070】
なお、本発明は前述した実施例に限定されるものではなく、添付した特許請求の範囲の趣旨内における様々な変形例及び同等の構成が含まれる。たとえば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに本発明は限定されない。また、ある実施例の構成の一部を他の実施例の構成に置き換えてもよい。また、ある実施例の構成に他の実施例の構成を加えてもよい。また、各実施例の構成の一部について、他の構成の追加、削除、または置換をしてもよい。
【0071】
また、前述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、たとえば集積回路で設計する等により、ハードウェアで実現してもよく、プロセッサがそれぞれの機能を実現するプログラムを解釈し実行することにより、ソフトウェアで実現してもよい。
【0072】
各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、SSD(Solid State Drive)等の記憶装置、又は、IC(Integrated Circuit)カード、SDカード、DVD(Digital Versatile Disc)の記録媒体に格納することができる。
【0073】
また、制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。
【符号の説明】
【0074】
101~104 照合結果
200 照合装置
201 プロセッサ
202 記憶デバイス
302 特徴量
304 所属グループ
305 アノテーション
306 学習対象外フラグ
331 予測値
332 実測値
701 前処理部
702 グループ分け処理部
703 算出部
704 照合部
705 出力部
706 学習部