IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人北海道大学の特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023058429
(43)【公開日】2023-04-25
(54)【発明の名称】画像診断システム及び学習方法
(51)【国際特許分類】
   G06T 7/00 20170101AFI20230418BHJP
   G01N 21/27 20060101ALI20230418BHJP
【FI】
G06T7/00 350C
G01N21/27 A
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2022144017
(22)【出願日】2022-09-09
(31)【優先権主張番号】P 2021168299
(32)【優先日】2021-10-13
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】504173471
【氏名又は名称】国立大学法人北海道大学
(74)【代理人】
【識別番号】100145403
【弁理士】
【氏名又は名称】山尾 憲人
(74)【代理人】
【識別番号】100135703
【弁理士】
【氏名又は名称】岡部 英隆
(74)【代理人】
【識別番号】100189544
【弁理士】
【氏名又は名称】柏原 啓伸
(72)【発明者】
【氏名】猪熊 泰英
(72)【発明者】
【氏名】瀧川 一学
(72)【発明者】
【氏名】井手 雄紀
【テーマコード(参考)】
2G059
5L096
【Fターム(参考)】
2G059AA05
2G059BB04
2G059BB09
2G059EE02
2G059EE13
2G059FF01
2G059KK04
2G059MM01
2G059MM09
2G059MM10
5L096BA03
5L096DA02
5L096FA02
5L096FA59
5L096FA64
5L096HA11
5L096JA11
5L096KA04
(57)【要約】      (修正有)
【課題】化学反応収率や混合試料の混合比率の管理を行う画像診断システム及び学習方法を提供する。
【解決手段】コンピュータ装置4を含む画像診断システム2には、複数物質の混合状態の画像データを説明変数として当該複数物質の混合比率を目的変数とするか又は反応系の反応化合物の画像データを説明変数として当該反応化合物の反応収率を目的変数とする機械学習モデルが構築されている。機械学習モデルを複数物質の混合状態における混合比率を推定するために用いる場合には、複数物質の混合状態の画像データと当該混合状態における混合比率の数値データとの組み合わせを教師データとして学習を行う。機械学習モデルを反応系の反応化合物における反応収率を推定するために用いる場合には、反応前の化合物と反応後の化合物とを混合して作出された混合状態の画像データと当該混合状態における混合比率の数値データとの組み合わせを、教師データとして学習を行う。
【選択図】図1
【特許請求の範囲】
【請求項1】
画像診断システムであって、
前記画像診断システムは、インタフェース装置と、記憶装置と、処理回路とを含み、
前記画像診断システムには、
複数物質の混合状態の画像データを説明変数とし、当該複数物質の混合比率を目的変数とする、又は、反応系の反応化合物の画像データを説明変数とし、当該反応化合物の反応収率を目的変数とする、比率推定のための機械学習モデルが構築されており、
(1)前記比率推定のための機械学習モデルを、複数物質の混合状態における混合比率を推定するために用いる場合には、
前記処理回路が、前記記憶装置に記憶される、複数物質の混合状態の画像データと当該混合状態における混合比率の数値データとの組み合わせを、前記インタフェース装置を介して取得して、教師データとして学習を行い、
(2)前記比率推定のための機械学習モデルを、反応系の反応化合物における反応収率を推定するために用いる場合には、
前記処理回路が、前記記憶装置に記憶される、反応前の化合物と、反応後の化合物とを混合して作出された混合状態の画像データと、当該混合状態における混合比率の数値データとの組み合わせを、前記インタフェース装置を介して取得して、教師データとして学習を行う、
画像診断システム。
【請求項2】
前記比率推定のための機械学習モデルの学習を、外部ネットワークを介して前記画像診断システムと接続する学習サーバが行う、請求項1に記載の画像診断システム。
【請求項3】
(3)前記比率推定のための機械学習モデルを、複数物質の混合状態における混合比率を推定するために用いる場合、
学習済みの前記比率推定のための機械学習モデルに、外部ネットワークを介して取得される当該複数物質の混合状態の画像データを入力として、混合比率の推定値を出力し、
(4)前記比率推定のための機械学習モデルを、反応系の反応化合物における反応収率を推定するために用いる場合、
学習済みの前記比率推定のための機械学習モデルに、外部ネットワークを介して取得される当該反応化合物の画像データを入力データとして、反応収率の推定値を出力する、
請求項1に記載の画像診断システム。
【請求項4】
比率推定のための機械学習モデルとして、畳み込みニューラルネットワークのモデルが用いられる、
請求項1に記載の画像診断システム。
【請求項5】
前記複数物質の混合状態が、主たる物質と、当該主たる物質以外の物質との、混合状態であり、
更に、
前記主たる物質以外の物質の比率が所定の閾値よりも大きいときには、前記処理回路が所定の信号を出力する、
請求項3に記載の画像診断システム。
【請求項6】
複数物質の混合状態の画像データを説明変数とし、当該複数物質の混合比率を目的変数とする、又は、反応系の反応化合物の画像データを説明変数とし、当該反応化合物の反応収率を目的変数とする、比率推定のための機械学習モデルについての学習方法であって、
(1)前記比率推定のための機械学習モデルを、複数物質の混合状態における混合比率を推定するために用いる場合には、
処理回路が、記憶装置に記憶される、複数物質の混合状態の画像データと当該混合状態における混合比率の数値データとの組み合わせを、教師データとして学習を行い、
(2)前記比率推定のための機械学習モデルを、反応系の反応化合物における反応収率を推定するために用いる場合には、
前記処理回路が、前記記憶装置に記憶される、反応前の化合物と、反応後の化合物とを混合して作出された混合状態の画像データと、当該混合状態における混合比率の数値データとの組み合わせを、教師データとして学習を行う、
学習方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、画像診断システム及び方法、特に、混合試料の混合割合評価や化学反応収率の定量化のための画像診断システムに関する。
【背景技術】
【0002】
化学反応の反応収率の確認は、粉末状や結晶状等の混合状態における反応割合を観察者の目視により判断することによって通常行われる。観察者は、混合状態の色や形状を目視する。更に、複数物質の混合状態における個別物質の存在割合の確認も、観察者の目視により判断することによって通常行われる。化学反応の反応収率の確認も、複数物質の混合状態における個別物質の存在割合の確認も、観察者の実験技能を中心とする経験及び知識量に依存することとなる。
【0003】
混合試料における個別物質の存在割合のより詳細な確認のための、及び、化学反応の反応収率のより詳細な確認のための、従来の手法として、NMR(Nuclear Magnetic Resonance:核磁気共鳴)、MS(Mass Spectrometry:質量分析)、HPLC(High Performance Liquid Chromatography:高速液体クロマトグラフィー)等が挙げられる。しかしながら、いずれも、溶液状態で分析を行うものであり、よって、混合試料や反応化合物の溶解性に大きく依存してしまう。また、手法に対する観察者(操作者)の経験にも依存してしまう。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2020-64589号公報
【特許文献2】特許第6077947号公報
【特許文献3】特開2020-3328号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
本開示は、反応化合物や混合試料の画像データを入力データとして、化学プラントにおける化学反応収率や、混合試料の混合比率の正確な推定を行う、画像診断システムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本開示の画像診断システムは、インタフェース装置と、記憶装置と、処理回路とを含む。画像診断システムには、複数物質の混合状態の画像データを説明変数とし、当該複数物質の混合比率を目的変数とする、又は、反応系の反応化合物の画像データを説明変数とし、当該反応化合物の反応収率を目的変数とする、比率推定のための機械学習モデルが構築されている。(1)比率推定のための機械学習モデルを、複数物質の混合状態における混合比率を推定するために用いる場合には、処理回路が、記憶装置に記憶される、複数物質の混合状態の画像データと当該混合状態における混合比率の数値データとの組み合わせを、インタフェース装置を介して取得して、教師データとして学習を行う。(2)比率推定のための機械学習モデルを、反応系の反応化合物における反応収率を推定するために用いる場合には、処理回路が、記憶装置に記憶される、反応前の化合物と、反応後の化合物とを混合して作出された混合状態の画像データと、当該混合状態における混合比率の数値データとの組み合わせを、インタフェース装置を介して取得して、教師データとして学習を行う。
【発明の効果】
【0007】
本開示の画像診断システムは、反応化合物や混合試料の画像データを入力データとして、化学プラントにおける化学反応収率や、混合試料の混合比率の正確な推定を行うことができる。
【図面の簡単な説明】
【0008】
図1図1は、実施の形態に係る画像診断システムの概略の全体構成を示すブロック図である。
図2図2は、実施の形態に係る画像診断システムにおける機械学習モデルを示す図である。
図3A図3Aは、混合試料の例を示す図である。図3A(1)は、砂糖(スクロース)の画像データの例である。図3A(2)は、食塩(塩化ナトリウム)の画像データの例である。図3A(3)は、砂糖と食塩との混合試料の画像データの例である。
図3B図3Bは、砂糖と食塩との、様々な混合試料における、混合比率の推定例である。
図3C図3Cは、砂糖と食塩との混合試料における砂糖の混合比率のプロットの例である。横軸は実際の混合比率を示し、縦軸は実施の形態に係る画像診断システムによる推定値(予測値)を示す。
図4図4は、うまみ調味料(グルタミン酸ナトリウム)と砂糖(スクロース)と食塩(塩化ナトリウム)との混合試料における、うまみ調味料の混合比率のプロットの例(左端)と、砂糖の混合比率のプロットの例(中央)と、食塩の混合比率のプロットの例(右端)である。3成分のいずれのグラフにおいても、横軸は実際の混合比率を示し、縦軸は実施の形態に係る画像診断システムによる予測値(推定値)を示す。
図5A図5Aは、p-アミノサリチル酸からm-アミノフェノールへの、加熱による脱炭酸反応を示す図である。
図5B図5Bは、p-アミノサリチル酸からm-アミノフェノールへの化学反応の反応収率のプロットの例である。横軸は実際の反応収率を示し、縦軸は実施の形態に係る画像診断システムによる予測値(推定値)を示す。
図6A図6Aは、テトラキスフェニルポルフィリンの、HTPP(配位子)からZnIITPP(亜鉛錯体)への化学反応を示す図である。
図6B図6Bは、HTPP(配位子)からZnIITPP(亜鉛錯体)への化学反応の反応収率のプロットの例である。横軸は実際の反応収率を示し、縦軸は実施の形態に係る画像診断システムによる予測値(推定値)を示す。
図7A図7Aは、α-グリシンからγ-グリシンへの、結晶多型を異ならせる反応を示す図である。
図7B図7Bは、α-グリシンからγ-グリシンへの結晶多型を異ならせる反応における、γ-グリシンの存在割合のプロットの例である。横軸は実際の反応収率を示し、縦軸は実施の形態に係る画像診断システムによる予測値(推定値)を示す。
図8A図8A(1α)は、L(+)-酒石酸の画像データの例である。図8A(1β)は、L(+)-酒石酸の化学式である。図8A(2α)は、D(-)-酒石酸の画像データの例である。図8A(2β)は、D(-)-酒石酸の化学式である。
図8B図8Bは、L(+)-酒石酸とD(-)-酒石酸との様々な混合試料における、混合比率の推定例である。
図8C図8C(1)は、L(+)-酒石酸とD(-)-酒石酸との混合試料におけるD(-)-酒石酸の混合比率(重量割合)のプロットの例である。図8C(2)は、図8C(1)の重量割合のプロットを、鏡像異性体過剰率(%ee)に変換したプロットである。
図9A図9A(1α)は、サリチル酸(o-ヒドロキシ安息香酸)の画像データの例である。図9A(1β)は、サリチル酸(o-ヒドロキシ安息香酸)の化学式である。図9A(2α)は、p-ヒドロキシ安息香酸の画像データの例である。図9A(2β)は、p-ヒドロキシ安息香酸の化学式である。
図9B図9Bは、サリチル酸(o-ヒドロキシ安息香酸)とp-ヒドロキシ安息香酸との様々な混合試料における、混合比率の推定例である。
図9C図9Cは、サリチル酸(o-ヒドロキシ安息香酸)とp-ヒドロキシ安息香酸との混合試料におけるサリチル酸(o-ヒドロキシ安息香酸)の混合比率(重量割合)のプロットの例である。
図10A図10A(1)は、ナフタレンの画像データの例である。図10A(2)(3)(4)は、夫々、シリカゲル、アルミナ、セライトの、画像データの例である。
図10B図10Bは、ナフタレンと、その他化合物(シリカゲル、アルミナ、セライト)との、様々な多成分存在系における、ナフタレンの比率(割合)の推定例である。
図10C図10Cは、ナフタレンと、その他化合物(シリカゲル、アルミナ、セライト)との多成分存在系におけるナフタレンの比率(割合)のプロットの例である。
図11A図11A(1α)は、実体顕微鏡及び撮像装置(即ち、デジタルマイクロスコープ)により撮像した画像データである。図11A(1β)は、図11A(1α)に示す画像データを正方形へトリミングしたものである。図11A(2α)は、一般的な画像撮影装置により撮像した画像データである。図11A(2β)は、図11A(2α)に示す画像データを正方形へトリミングしたものである。
図11B図11Bは、4つの混合試料の画像データと、当該混合試料における砂糖と食塩の混合比率の推定値と実測値(実際値)とを示す図である。
図11C図11Cは、100の混合試料における、砂糖と食塩の混合比率のプロット図である。
図12A図12A(1α)は、実体顕微鏡及び撮像装置(即ち、デジタルマイクロスコープ)により撮像した、砂糖と食塩の混合試料の画像データである。図12A(2α)は、一般的な画像撮影装置により撮像した、砂糖と食塩の混合試料の画像データである。図12A(1β)は、実体顕微鏡及び撮像装置(即ち、デジタルマイクロスコープ)により撮像してグレースケール処理を施した、砂糖と食塩の混合試料の画像データである。図12A(2β)は、一般的な画像撮影装置により撮像してグレースケール処理を施した、砂糖と食塩の混合試料の画像データである。
図12B図12B(1)は、複数の混合試料における、砂糖と食塩の混合比率のプロット図であり、混合比率を推定した画像診断システムに対する教師データ及び推定のための画像データの何れもがフルカラー画像であったものである。図12B(2)は、複数の混合試料における、砂糖と食塩の混合比率のプロット図であり、混合比率を推定した画像診断システムに対する教師データ及び推定のための画像データの何れもが、グレースケール処理によりモノカラー画像とされたものである。
【発明を実施するための形態】
【0009】
以下、適宜図面を参照しながら、実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
【0010】
なお、発明者らは、当業者が本開示を十分に理解するために添付図面および以下の説明を提供するのであって、これらによって特許請求の範囲に記載の主題を限定することを意図するものではない。
【0011】
1.[本開示に至る経緯]
化学反応の進行を確認する際、化合物が示す色や形状で判断する機会は非常に多い。そこで、発明者は、化合物の色や粒径、形状という情報は、化学反応における収率や電子状態の確認等に応用でき、これら情報を利用することは、収率や電子状態を容易かつ迅速に評価できる手法となると考えた。
【0012】
しかしながら、評価者の実験技能及び知識量により、化学反応の進行に関する判断の結果は大きく変わることがある。発明者は、経験値とも称される実験技能及び知識量という不明瞭なパラメータを数値化し、評価及び判断に応用するために、深層機械学習を活用することを想到するに至った。
【0013】
本開示は、混合試料の顕微鏡画像や化合物の顕微鏡画像を集めて教師データを作成し、これらにより夫々機械学習を行うことで、誰もが容易に混合試料の混合割合評価や、化学反応の反応収率の定量化を行うことができる、システムの構築を示すものである。教師データの画像は、顕微鏡画像だけではなく、撮像装置による画像や汎用画像であってもよい。
【0014】
2.[実施の形態]
以下、添付の図面を参照して、本開示の好ましい実施の形態を説明する。
【0015】
2.1.[システム構成]
実施の形態に係る画像診断システムは、反応化合物や混合試料の画像データを入力データとして、化学プラントにおける化学反応収率や、混合試料の混合比率の正確な推定を行うシステムである。図1は、本実施の形態に係る画像診断システム2のシステム構成図である。
【0016】
画像診断システム2は、コンピュータ装置4及び記憶装置12を有する。コンピュータ装置4及び記憶装置12は有線または無線の通信回線で接続されており、互いにデータを送受信可能である。画像診断システム2は更に外部ネットワーク14に接続されていてもよく、外部ネットワーク14に接続された他のコンピュータシステムとの間でデータを授受してもよい。画像診断システム2は、外部ネットワーク14を介して、例えば、学習サーバ16と接続してもよい。
【0017】
コンピュータ装置4は、一つ以上のプロセッサを搭載するサーバ機、若しくはワークステーションコンピュータ等である。
【0018】
記憶装置12は、ディスクドライブやフラッシュメモリ等の、コンピュータ装置4の外部に設けられる記憶装置であり、コンピュータ装置4で用いられる各種データセット18、各種データベース、及び、各種コンピュータプログラムを記憶する。各種データセット18には、例えば、後で説明する、コンピュータ装置4のインタフェース装置6を介してコンピュータ装置4が取得するデータや、画像診断システム2が生成する各種データが、格納される。
【0019】
外部ネットワーク14は、例えば、インターネットであり、ネットワーク端子等のインタフェース装置6を介して、コンピュータ装置4と接続する。
【0020】
学習サーバ16は、記憶装置12に記憶される画像データ等を用いて、後で説明する機械学習モデルの学習を行う。
【0021】
更にコンピュータ装置4は、インタフェース装置6、処理回路8、及びメモリ10を含む。
【0022】
インタフェース装置6は、ネットワーク端子、映像入力端子、USB端子、キーボード、マウス等を含む、外部からデータを取得可能なインタフェースユニットである。外部から、インタフェース装置6を介して、種々のデータが取得される。データは、例えば、後で説明する、混合試料の画像データ、反応化合物の画像データ等である。取得後、これらのデータは、記憶装置12に格納され得る。記憶装置12に格納されるデータは適宜、インタフェース装置6を介して、コンピュータ装置4内に取得され得る。
【0023】
更に、画像診断システム2により生成される各種データは、記憶装置12に適宜格納される。各種データは、例えば、後で説明する、混合試料の混合割合の数値データ、反応化合物の反応収率の数値データ等である。このような画像診断システム2により生成され記憶装置12に適宜格納される各種データは、インタフェース装置6を介して、コンピュータ装置4内に再び取得され得る。
【0024】
処理回路8は、プロセッサにより構成される。ここでのプロセッサは、CPU(Central Processing Unit;中央処理ユニット)やGPU(Graphics Processing Unit;画像処理ユニット)を包括するものである。本実施の形態に係る画像診断システム2の諸機能は、各種プログラムを処理回路8が実行することによって実現される。なお、当該諸機能は、ASIC(Application Specific Integrated Circuit)などによって実現されてもよいし、これらの組合せによって実現されてもよい。
【0025】
本開示における処理回路8は、複数台の信号処理回路(プロセッサ)から構成されてもよい。本実施の形態に係る画像診断システム2における様々な処理の一部をあるプロセッサが実行し、他の一部の処理を他のプロセッサが実行してもよい。
【0026】
メモリ10は、コンピュータ装置4内部のデータ書き換えが可能な記憶部であり、例えば、多数の半導体記憶素子を含むRAM(Random Access Memory)により構成される。メモリ10は、処理回路8が様々な処理を実行する際の、具体的なコンピュータプログラムや、変数値や、パラメータ値等を一時的に格納する。なおメモリ10は、いわゆるROM(Read Only Memory)を含んでもよい。ROMには、以下で説明する画像診断システム2の処理を実現するコンピュータプログラムが予め格納されている。処理回路8がROMからコンピュータプログラムを読み出し、RAMに展開することにより、処理回路8が当該コンピュータプログラムを実行可能になる。
【0027】
本開示に係る画像診断システム2は、Python等のコンピュータ言語を用いて構築されている。本開示に係る画像診断システムの構築のために用いられ得るコンピュータ言語はこれらに限定されるものでは無く、勿論、他のコンピュータ言語が用いられてもよい。
【0028】
更に、本実施の形態に係る画像診断システム2においては、学習済みの機械学習モデルが構築されている。本実施の形態に係る機械学習モデルは、後でも説明するように、例えば、ResNet等のネットワーク構造を用いて構築される。
【0029】
2.1.1.[機械学習モデルについて]
本実施の形態に係る画像診断システム2において構築されている、混合割合若しくは反応収率の、比率推定のための機械学習モデルを説明する。
【0030】
比率推定のための機械学習モデルは、複数物質の混合状態の画像データを説明変数(入力)とし、当該複数物質の混合割合(モル比率若しくは重量比率)を目的変数(出力)とする、又は、反応系の反応中の、即ち、反応化合物の、画像データを説明変数(入力)とし、当該反応化合物の反応収率を目的変数(出力)とする、機械学習モデルである。本実施の形態に係る機械学習モデルは、コンピュータ装置4の処理回路8にて学習が行われるものであってもよいし、コンピュータ装置4と外部ネットワーク14を介して接続する学習サーバ16にて学習が行われるものであってもよい。
【0031】
従って、教師データは、複数物質の混合状態の画像データと、混合割合(モル比率若しくは重量比率)の数値データとの組み合わせ、又は、反応系における反応化合物の画像データと、反応収率の数値データとの組み合わせ、ということになる。
【0032】
反応系における反応化合物の画像データとは、反応前の化合物(物質)と反応後の化合物(物質)との混合状態の画像データである。より精確な機械学習モデルの作成のために、教師データとしてのこれらの組み合わせデータは大量のものが要求される。
【0033】
しかしながら、反応系における反応化合物の画像データと反応収率の数値データとの組み合わせを多数用意することは、非常に困難である。というのは、或る反応化合物の複数の時点における画像データを取得することは比較的容易ではあるが、当該反応化合物の反応収率を、様々な測定器具や装置を用いて、それら複数の時点において精確に計測することには多大な操作や作業を要するからである。
【0034】
そこで、本実施の形態では、既製品である反応前の化合物(物質)と、やはり既製品である反応後の化合物(物質)を混合して作出した混合状態の画像データと、その混合状態における混合比率(モル比率若しくは重量比率)の数値データとの組み合わせを大量に用意して、教師データとして利用する。ここでの混合比率(モル比率若しくは重量比率)は、反応収率に相当する数値データとして取り扱われる。
【0035】
比率推定のための機械学習モデルは、比率を精確に導出するには、混合試料における物質の組み合わせ毎に、又は、反応系毎に、学習されて別の学習済みの機械学習モデルとされることが好ましい。
【0036】
教師データとしての、混合状態の画像データの取得に当たっては、図2に示すように、混合試料の量、拡大率、背景色、照明量が様々調整される。また、露光及び角度が調整されることにより反射率が様々に調整される。更に、偏光フィルタを用いて画像データに対して偏光が施されることもある。
【0037】
混合状態の作出に当たっては、取得される混合状態の画像データにおいて混合比率をより正確に反映させるべく、混合試料の厚さにも留意される。例えば、平均粒径が「r」である物質「A」と平均粒径が「r」である物質「B」により混合状態を作出することを想定する。この場合、混合試料の厚さは、平均粒径の和「r+r」より小さいこと、若しくは、平均粒径の和の所定係数(例えば、0.8)倍より小さいことが、望ましい。
【0038】
或いは、例えば、平均粒径が「r」である、或る反応系の反応前の物質「C」と、平均粒径が「r」である、当該反応系の反応後の物質「D」とにより、混合状態を作出することを想定する。この場合も、混合試料の厚さは、平均粒径の和「r+r」より小さいこと、若しくは、平均粒径の和の所定係数(例えば、0.8)倍より小さいことが、望ましい。
【0039】
また、混合状態を構成する物質が、10ミクロン(μm)未満の微粉体である場合、混合試料の厚さは、例えば、0.1mm未満であることが望ましい。
【0040】
更に、教師データとしての混合状態の画像データについては、データオーグメンテーションにより、更なる増加が図られることが望ましい。例えば、画像の回転、反転、一部抜き出し、リサイズ、適応ヒストグラム平均化(CLAHE)、白黒化などにより、更なる増加が図られることが望ましい。
【0041】
図2は、本実施の形態に係る画像診断システムにおける機械学習モデルを示す図である。上述のように、教師データとしての混合状態の画像データの取得に当たっては、混合試料の量、拡大率、厚さ、露光、角度、背景色、照明量、偏光が、様々に調整されるのが望ましい。更に、画像の回転、反転、一部抜き出し、リサイズ、適応ヒストグラム平均化(CLAHE)、白黒化などの、データオーグメンテーションに係る画像処理により、教師データの増加が図られることが望ましい。
【0042】
本実施の形態では、機械学習モデルとして、畳み込みニューラルネットワーク(CNN: Convolution Neural Network)のモデルが用いられる。CNN(畳み込みニューラルネットワーク)では、図2に示すように、全結合層による識別が行われる。具体的には、オープンソースであるPytorchライブラリにおけるResNetが用いられている。もちろん、機械学習モデルとしてCNN以外のものが用いられても構わない。
【0043】
図2に示すCNN(畳み込みニューラルネットワーク)は、画像データ中での化合物の形状、色(R、G、B)、大きさ、等の要素を、畳み込み(テンソル変換)により、数字情報として扱う。機械学習により、混合状態の画像データから特徴量が抽出される。更に、画像データ及び特徴量が、混合割合若しくは反応収率の、比率と紐付けされて、学習済みの機械学習モデルが作成される。
【0044】
図2では例として、p-アミノサリチル酸からm-アミノフェノールへの反応(加熱脱炭酸反応)が採り上げられている。つまり、p-アミノサリチル酸とm-アミノフェノールの混合状態の画像データと、PAS(p-アミノサリチル酸)90%及びMAP(m-アミノフェノール)10%の比率データとが、紐付けられて学習されていることを示している。
【0045】
2.2.[システム動作]
2.2.1.[学習動作]
本実施の形態に係る画像診断システム2における、比率推定のための機械学習モデルは、複数物質の混合状態における、混合割合(混合比率)を推定するために用いる場合には、複数物質の混合状態の画像データと混合割合の数値データとの多数の組み合わせを教師データとして、学習を行う。
【0046】
教師データとしての複数物質の混合状態の画像データは、例えば、実体顕微鏡及び撮像装置によって取得されて、外部ネットワーク14及びインタフェース装置6を介して記憶装置12に格納され得る。また、教師データとしてとしての混合比率の数値データは、例えば、キーボード等のインタフェース装置6を介して記憶装置12に格納され得る。
【0047】
更に、本実施の形態に係る画像診断システム2における、比率推定のための機械学習モデルは、反応系の反応化合物における、反応収率を推定するために用いる場合には、反応系の反応化合物の画像データと反応収率の数値データとの組み合わせを教師データとして、学習を行ってもよい。しかしながら、上述のように、より精確な機械学習モデルを作成できる程度に、教師データとしての、反応系の反応化合物の画像データと反応収率の数値データとの組み合わせを大量に用意することは、非常に困難である。
【0048】
そこで、本実施の形態に係る画像診断システム2における、比率推定のための機械学習モデルは、反応系の反応化合物における反応収率を推定するために用いる場合には、既製品である反応前の化合物と、やはり既製品である反応後の化合物とを混合して作出した混合状態の画像データと、その混合状態における混合比率の数値データとの組み合わせを教師データとして、学習を行う。
【0049】
教師データとしての、反応前後の化合物の、混合状態の画像データも、例えば、実体顕微鏡及び撮像装置によって取得されて、外部ネットワーク14及びインタフェース装置6を介して記憶装置12に格納され得る。また、教師データとしての混合比率の数値データも、例えば、キーボード等のインタフェース装置6を介して記憶装置12に格納され得る。
【0050】
2.2.2.[推定動作]
複数物質の混合状態における、混合割合(混合比率)を推定するために用いる場合には、本実施の形態に係る画像診断システム2における、学習済みの比率推定のための機械学習モデルは、複数物質の混合状態の画像データを入力データとして混合比率の推定を行う。入力データとしての複数物質の混合状態の画像データも、例えば、実体顕微鏡及び撮像装置によって撮像され、外部ネットワーク14及びインタフェース装置6を介して取得され得る。学習済みの比率推定のための機械学習モデルの出力データである混合比率の数値データは、コンピュータ装置4と接続する、例えば、ディスプレイ装置(図示せず)に出力され得、また、記憶装置12に格納され得る。
【0051】
更に、反応系の反応化合物における、反応収率を推定するために用いる場合には、本実施の形態に係る画像診断システム2における、学習済みの比率推定のための機械学習モデルは、反応系の反応化合物の画像データを入力データとして反応収率の推定を行う。入力データとしての反応系の反応化合物の画像データも、例えば、実体顕微鏡及び撮像装置によって撮像され、外部ネットワーク14及びインタフェース装置6を介して取得され得る。学習済みの比率推定のための機械学習モデルの出力データである反応収率の数値データも、ディスプレイ装置(図示せず)に出力され得、また、記憶装置12に格納され得る。
【0052】
2.3.[推定例]
以下、複数の比率推定のための機械学習モデルによる、推定例を説明する。
【0053】
2.3.1.[砂糖と塩の混合状態における混合割合の推定]
様々な粒径サイズを有するスクロース(C122211:砂糖、分子量342.3)と食塩(NaCl:塩、分子量58.44)との、2成分の混合状態における、混合割合を推定する、比率推定のための機械学習モデルを含む画像診断システム2を構築した。
【0054】
砂糖(スクロース)と塩(塩化ナトリウム)は、夫々有機化合物と無機化合物として分類され、混合状態での存在割合を診断する分析手法が限られており、割合分析は非常に難しいとされている。
【0055】
なお、混合試料においては、混合割合(混合比率)は、一般的に、それぞれの試料を測定した重さ(g)から算出される重量比率(重量%)、若しくは、重さ(g)からモル(mol、物質量)へと変換したモル比率(モル%)で表される。両者は、用途や目的に応じて適宜利用分けされる。今回の推定例では、モル比率を利用している。
【0056】
まず、教師データの作成及び収集について説明する。分析天秤を利用して重さを測った食用砂糖(グラニュー糖(主成分:スクロース):粒径0.09×0.05×0.04cm)と食卓塩(塩化ナトリウム)(粒径0.05×0.05×0.05cm)をスライドガラス若しくはカバーガラス上にて混合した。その混合試料(3mg程度)に対して、実体顕微鏡(例えば、2048×1536ピクセル)及び(デジタルカメラ等の)撮像装置を用いて撮影を行うことで、教師データとしての、混合状態の画像データを取得した。教師データとしての画像データ数を増やすために、混合試料を少し掻き混ぜた後の状態の画像データを、5枚程度追加で取得した。また、実体顕微鏡において、拡大率や背景色、照明強度等の撮影条件の調整を適宜行った。ここで混合試料を「3mg程度」としているが、ここでの教師データの作成及び収集の手法は、~20mgスケールの少量の混合試料に対してもgスケールの大量の混合試料に対しても適用可能である。
【0057】
また、5×5cmのガラスプレート上にて大きなスケール(100mg程度)で任意の割合で砂糖(スクロース)と塩(塩化ナトリウム)の混合を行い、混合試料の厚さを均一にした上で、実体顕微鏡により取得した画像を6分割した。ここでの混合試料のスケールを「100mg程度」としているが、ここでの教師データの作成及び収集の手法も、~20mgスケールの少量の混合試料に対してもgスケールの大量の混合試料に対しても適用可能である。
【0058】
更に、スパーテルを用いて約3mgの混合試料をすくい取り、上述の3mg程度の混合試料に対する撮影条件によって、画像データの収集を行った。この画像データの収集手法も、~20mgスケールの混合試料に対してもgスケールの混合試料に対しても適用可能である。
【0059】
粒径サイズの違いによる影響を検討するために、実験試薬として販売されている砂糖(スクロース:粒径0.24×0.17×0.11cm)と食塩(塩化ナトリウム:粒径0.05×0.06×0.05cm)とを用いて、同様の撮影条件にて画像データの収集を行った。大きく粒径サイズが異なる組み合わせや殆ど同じ粒径サイズの組み合わせにおいても画像データの収集を行った。
【0060】
以上のようにし作成及び収集された、スクロースと塩化ナトリウムの混合状態の画像データと混合比率の数値データとの多数の組み合わせを教師データとして、比率推定のための機械学習モデルの学習を行った。
【0061】
図3Aは、スクロースと塩化ナトリウムとの混合試料の例を示す図である。図3A(1)は、砂糖(スクロース)の画像データの例である。図3A(2)は、食塩(塩化ナトリウム)の画像データの例である。図3A(3)は、スクロースと塩化ナトリウムとの混合試料の画像データの例である。比率推定のための機械学習モデルの学習のために、例えば、160枚程のスクロースと塩化ナトリウムとの混合試料の画像データを、教師データとして用いるために取得した。
【0062】
図3Bは、スクロースと塩化ナトリウムとの様々な混合試料における、学習済みの比率推定のための機械学習モデルによる、混合比率の推定例である。図3B(1)~(6)に示す混合試料の画像データの上部において、「Pred」はスクロースと塩化ナトリウムとの夫々の混合比率(モル%)の推定値を示し、「True」はスクロースと塩化ナトリウムとの夫々の混合比率(モル%)の実際値を示す。例えば、図3B(1)に示す混合試料では、スクロースの比率の推定値が98%であり、塩化ナトリウムの比率の推定値が2%であり、スクロースの比率の実際値が100%であり、塩化ナトリウムの比率の実際値が0%である。図3Bに示すように、推定値と実際値には略差異は無い。
【0063】
図3Cは、砂糖(スクロース)と食塩(塩化ナトリウム)との混合試料における砂糖(スクロース)の混合比率のプロットの例である。横軸は実際の混合比率(実際値)を示し、縦軸は推定値(予測値)を示す。図3Cに示すプロットの例において、RMSE(Root Mean Squared Error:二乗平均平方根誤差)、MAE(Mean Absolute Error:平均絶対誤差)、R(決定係数)が、以下のように算出された。即ち、推定値(予測値)が実際値に非常に近いことが示されている。
【表1】
【0064】
更に、うまみ調味料(CNONa:グルタミン酸ナトリウム、分子量169.1)と砂糖(C122211:スクロース、分子量342.3)と食塩(NaCl:塩、分子量58.4)との、3成分の混合状態における混合割合を推定する、比率推定のための機械学習モデルを含む画像診断システム2を構築した。図4は、うまみ調味料(グルタミン酸ナトリウム)と砂糖(スクロース)と食塩(塩化ナトリウム)との、3成分混合試料における、(左から右に)うまみ調味料、砂糖、及び、食塩の混合比率のプロットの例である。いずれのプロットにおいても、横軸は実際の混合比率(実際値)を示し、縦軸は推定値(予測値)を示す。ここで、比率推定のための機械学習モデルの学習のために、300枚のうまみ調味料と砂糖と食塩の混合状態の画像データが、教師データとして用いられた。2種の化合物のみならず、3種の化合物を用いた混合物の画像においても、高い推定精度で本開示に係る比率推定のための機械学習モデルが適用可能であることが、図4の各プロットにて明確に示されている。
【0065】
2.3.2.[p-アミノサリチル酸の加熱脱炭酸反応における反応収率の推定]
化学反応の反応収率の画像診断を実際に行う例として、最も簡略化された系である1分子反応に着目した。そこでまず、p-アミノサリチル酸の加熱による脱炭酸反応のための画像診断システム2の構築を行った。
【0066】
図5Aは、p-アミノサリチル酸からm-アミノフェノールへの加熱による脱炭酸反応を示す図である。この反応は無溶媒反応(固体反応)であり、副反応物の生成は無く、粉末から結晶に変化するものである。
【0067】
当該加熱による脱炭酸反応では、加熱時間に伴い固体試料の形状が大きく変化した。NMRやHPLC測定による確認も併せて行ない、変換収率の結果と画像の変化割合とが概ね一致した。変換収率(反応収率)と反応系の画像データとを紐付けしたデータセットにより機械学習モデルを作成して、反応収率推定のための画像診断システム2を構築することとした。
【0068】
p-アミノサリチル酸(PAS、粉末状)は、110-120℃にて加熱することで脱炭酸反応が進行し、m-アミノフェノール(MAP、結晶状)が生成されることが知られている。本推定例では、多くのデータが要求される教師データの作成に当たっては、砂糖と塩の混合試料における混合比率推定のための機械学習モデルに対する、教師データの作成と同様の手法(上述「2.3.1.」参照)を採用した。つまり、反応前の化合物であるp-アミノサリチル酸と、反応後の化合物であるm-アミノフェノールとを混合して作出した混合状態の画像データと、その混合状態における混合比率の数値データとの組み合わせを教師データとした。
【0069】
本推定例では、分析天秤を利用して重さを測ったp-アミノサリチル酸とm-アミノフェノールをスライドガラス若しくはカバーガラス上にて混合した。その混合試料(3mg程度)に対して、実体顕微鏡(例えば、2048×1536ピクセル)及び(デジタルカメラ等の)撮像装置を用いて撮影を行うことで、教師データとしての、混合状態の画像データを取得した。教師データとしての画像データ数を増やすために、混合試料を少し掻き混ぜた後の画像データを、5枚程度追加で取得した。
【0070】
両者を混合すると、結晶状であるm-アミノフェノールに粉末状のp-アミノサリチル酸が纏わり付いた状態となってしまい、m-アミノフェノールを確認することが非常に難しい状況となっていた。そこで、混合する際、始めに粉末状のp-アミノサリチル酸をカバーガラス上にのせ、その上に結晶状のm-アミノフェノールを「載せる」という方法を試みた。画像データ数を増やすために、スパーテルを用いて混合試料の一部の位置を僅かに動かした画像データも追加で取得した。また、実体顕微鏡において、拡大率や背景色、照明強度等の撮影条件の調整を適宜行った。
【0071】
また、5×5cmのガラスプレート上にて大きなスケール(100mg程度)で任意の割合でp-アミノサリチル酸とm-アミノフェノールの混合を行い、混合試料の厚さを均一にした上で、実体顕微鏡により取得した画像を6分割した。更に、スパーテルを用いて約3mgの混合試料をすくい取り、上述の3mg程度の混合試料に対する撮影条件によって、画像データの収集を行った。
【0072】
以上のように作成及び収集された、p-アミノサリチル酸とm-アミノフェノールの混合状態の画像データと混合比率の数値データとの多数の組み合わせを教師データとして、比率推定のための機械学習モデルの学習を行った。
【0073】
なお、反応収率の推定を行う実際の反応系のために行ったことを簡単に述べる。実際の反応系では、スライドガラス(18×18mm)及びカバーガラス(15×15mm)上に、粉末状のp-アミノサリチル酸(1mg、3mg、5mg)をのせ、温度調節可能なホットプレート上で110~120℃での加熱を1~5時間行なった。加熱前に粉末状であったp-アミノサリチル酸は、加熱時間の経過に伴って結晶状のm-アミノフェノールに徐々に変化した。実際の反応系における反応収率の算出は、反応系における化合物の全量を溶解させた上でNMR及びHPLCによる分析を行い、それら分析結果を用いて対応化合物のシグナル積分比率を求めることに、基づくものである。また、反応収率の算出結果と、画像データにおける化合物の変化割合とが、概ね一致していることも確認した。
【0074】
図5Bは、p-アミノサリチル酸からm-アミノフェノールへの化学反応の反応収率のプロットの例である。横軸は実際の反応収率(実際値)を示し、縦軸は推定値(予測値)を示す。比率推定のための機械学習モデルの学習のために、例えば、75枚程のp-アミノサリチル酸とm-アミノフェノールの混合状態の画像データが、教師データとして用いられた。図5Bに示すプロットにおいて、RMSE、MAEは、以下のように算出された。即ち、推定値(予測値)が実際値に非常に近いことが示されている。
【表2】
【0075】
2.3.3.[テトラキスフェニルポルフィリン(TPP)の配位子から亜鉛錯体への反応における反応収率の推定]
次に、テトラキスフェニルポルフィリン(TPP)の配位子から亜鉛錯体への反応についての、画像診断システム2の構築を行った。図6Aは、テトラキスフェニルポルフィリンの、HTPP(配位子、分子量614.8)からZnIITPP(亜鉛錯体、分子量678.1)への化学反応を示す図である。
【0076】
本推定例に係る画像診断システムにおいても、反応前の化合物であるHTPP(配位子)と、反応後の化合物であるZnIITPP(亜鉛錯体)とを混合して作出した混合状態の画像データと、その混合状態における混合比率の数値データとの組み合わせを教師データとして、比率推定のための機械学習モデルの学習を行った。
【0077】
実際の反応系では、ZnIITPPは、HTPPとZn(OAc)をCHCl-MeOH混合溶媒中で、還流条件にて反応させることで生成される。反応後の混合化合物に対して、分液操作およびシリカゲルクロマトグラフィーにより精製操作が行われる。
【0078】
図6Bは、HTPP(配位子)からZnIITPP(亜鉛錯体)への化学反応の反応収率のプロットの例である。横軸は実際の反応収率(実際値)を示し、縦軸は推定値(予測値)を示す。ここで、比率推定のための機械学習モデルの学習のために、50枚のHTPP(配位子)とZnIITPP(亜鉛錯体)との混合状態の画像データが、教師データとして用いられた。更に、図6Bに示すプロットにおいて、MSE(Mean Squared Error:平均二乗誤差)が以下のように算出された。即ち、予測値(推定値)が実際値に非常に近いことが示されている。
【表3】
【0079】
2.3.4.[α-グリシンからγ-グリシンへの結晶多型を異ならせる反応における反応収率の推定]
次に、α-グリシンからγ-グリシンへの、結晶多型を異ならせる反応についての、画像診断システム2の構築を行った。図7Aは、α-グリシンからγ-グリシンへの、結晶多型を異ならせる反応を示す図である。α-グリシンとγ-グリシンのいずれも単結晶系であるが、α-グリシンは針状結晶であり、γ-グリシンはブロック状結晶である。
【0080】
本推定例に係る画像診断システムにおいても、反応前の化合物であるα-グリシンと、反応後の化合物であるγ-グリシンとを混合して作出した混合状態の画像データと、その混合状態における混合比率の数値データとの組み合わせを教師データとして、比率推定のための機械学習モデルの学習を行った。
【0081】
実際の反応系では、α-グリシンに蒸留水を加えて飽和水溶液とし、90℃にまで加熱し、静置したまま1時間かけて0℃へ冷却して結晶化させることで、結晶多型が異なるγ-グリシンが得られる。
【0082】
図7Bは、α-グリシンからγ-グリシンへの結晶多型を異ならせる反応における、γ-グリシンの存在割合(反応収率)のプロットの例である。横軸は実際の反応収率(実際値)を示し、縦軸は推定値(予測値)を示す。ここで、比率推定のための機械学習モデルの学習のために、200枚のα-グリシンとγ-グリシンとの混合状態の画像データが、教師データとして用いられた。更に、図7Bに示すプロットにおいて、MAEが以下のように算出されている。即ち、予測値(推定値)が実際値に近いことが示されている。
【表4】
【0083】
2.3.5.[鏡像異性体の混合状態における混合割合の推定]
次に、鏡像異性体であり、互いにキラル分子である、L(+)-酒石酸と、D(-)-酒石酸との、混合状態における混合割合を推定する、比率推定のための機械学習モデルを含む画像診断システム2を構築した。なお、使用したL(+)-酒石酸の比旋光率と、同じく使用したD(-)-酒石酸の比旋光率は、夫々、以下の通りである。
【数1】
【数2】
【0084】
図8A(1α)は、L(+)-酒石酸の画像データの例である。図8A(2α)は、D(-)-酒石酸の画像データの例である。画像データの形状は四角である。試料の総重量は何れも200mgである。なお、図8A(1β)と図8A(2β)は、夫々、L(+)-酒石酸とD(-)-酒石酸の、化学式である。
【0085】
更に、比率推定のための機械学習モデルの学習のために、300枚のL(+)-酒石酸とD(-)-酒石酸との混合試料の画像データを、教師データとして用いるために取得した。また、混合比率の推定のために、100枚のL(+)-酒石酸とD(-)-酒石酸との混合試料の画像データを取得した。画像データの形状は四角である。ここでの混合試料の総重量も何れも200mgとしている。これらの画像データにより学習及び推定を行った。
【0086】
図8Bは、L(+)-酒石酸とD(-)-酒石酸との様々な混合試料における、学習済みの比率推定のための機械学習モデルによる、混合比率の推定例である。図8B(1)~(3)に示す混合試料の画像データの上部において、「L-体」(即ち、L(+)-酒石酸)と「D-体」(即ち、D(-)-酒石酸)との夫々の混合比率の推定値と、実測値とを示している。なおここでは、混合比率として重量比率(重量%)を用いている。例えば、図8B(1)に示す混合試料では、L(+)-酒石酸の比率の推定値が84%であり、D(-)-酒石酸の比率の推定値が16%であり、L(+)-酒石酸の比率の実測値が82%であり、D(-)-酒石酸の比率の実測値が18%である。図8Bに示すように、推定値と実測値には略差異は無い。
【0087】
図8C(1)は、L(+)-酒石酸とD(-)-酒石酸との混合試料におけるD(-)-酒石酸の混合比率(重量割合)のプロットの例であり、図8C(2)は、図8C(1)の重量割合のプロットを、鏡像異性体過剰率(%ee)に変換したプロットである。いずれにおいても、横軸は実際の混合比率(実際値)を示し、縦軸は推定値を示す。図3C(1)に示すプロットの例において、RMSE、MAE、Rが、以下のように算出された。即ち、推定値が実際値に非常に近いことが示されている。
【表5】
【0088】
図8C(2)に係る、鏡像異性体過剰率(%ee)は、以下の式で定義される。
【数3】
図8C(1)(2)に結果としてのプロットを示す、機械学習を行う画像診断システムの稼働により、任意割合の混合試料についての画像データから、混合重量割合の推定を行うことが可能になり、更には、その推定の結果から鏡像異性体過剰率(%ee)の診断を行うことも可能となった。
【0089】
2.3.6.[構造異性体の混合状態における混合割合の推定]
次に、構造異性体である、サリチル酸(o-ヒドロキシ安息香酸)と、p-ヒドロキシ安息香酸との、混合状態における混合割合を推定する、比率推定のための機械学習モデルを含む画像診断システム2を構築した。ここでの二つの構造異性体は、o-体(オルト体)とp-体(パラ体)である。
【0090】
図9A(1α)は、サリチル酸(o-ヒドロキシ安息香酸)の画像データの例である。図9A(2α)は、p-ヒドロキシ安息香酸の画像データの例である。画像データの形状は四角である。試料の総重量は何れも200mgである。なお、図9A(1β)と図9A(2α)は、夫々、サリチル酸(o-ヒドロキシ安息香酸)とp-ヒドロキシ安息香酸の、化学式である。
【0091】
更に、比率推定のための機械学習モデルの学習のために、100枚のサリチル酸(o-ヒドロキシ安息香酸)とp-ヒドロキシ安息香酸との混合試料の画像データを、教師データとして用いるために取得した。また、混合比率の推定のために、10枚のサリチル酸(o-ヒドロキシ安息香酸)とp-ヒドロキシ安息香酸との混合試料の画像データを取得した。画像データの形状は四角である。ここでの混合試料の総重量も何れも200mgとしている。これらの画像データにより学習及び推定を行った。
【0092】
図9Bは、サリチル酸(o-ヒドロキシ安息香酸)とp-ヒドロキシ安息香酸との様々な混合試料における、学習済みの比率推定のための機械学習モデルによる、混合比率の推定例である。図9B(1)~(3)に示す混合試料の画像データの上部において、「o-体」(即ち、o-ヒドロキシ安息香酸)と「p-体」(即ち、p-ヒドロキシ安息香酸)との夫々の混合比率(ここでも、重量比率(重量%))の推定値と、実測値とを示している。例えば、図9B(1)に示す混合試料では、o-ヒドロキシ安息香酸の比率の推定値が73%であり、p-ヒドロキシ安息香酸の比率の推定値が27%であり、o-ヒドロキシ安息香酸の比率の実測値が80%であり、p-ヒドロキシ安息香酸の比率の実測値が20%である。図9Bに示すように、推定値と実測値には略差異は無い。
【0093】
図9Cは、サリチル酸(o-ヒドロキシ安息香酸)とp-ヒドロキシ安息香酸との混合試料におけるサリチル酸(o-ヒドロキシ安息香酸)の混合比率(重量割合)のプロットの例である。横軸は実際の混合比率(実際値)を示し、縦軸は推定値を示す。図8Cに示すプロットの例において、RMSE、MAE、Rが、以下のように算出された。即ち、推定値が実際値に非常に近いことが示されている。
【表6】
図9Cに結果としてのプロットを示す、機械学習を行う画像診断システム2の稼働により、同じ分子量であるが構造が異なる構造異性体の存在割合を、画像診断により推定できることが示された。このような画像診断システムは、反応合成で生成する構造異性体の混合割合の見積りに応用され得る。
【0094】
2.3.7.[多成分存在系における目的化合物の混合割合の推定]
次に、目的化合物であるナフタレンと、その他化合物(ここでは、シリカゲル、アルミナ、セライト)とを混合させた多成分存在系において、目的化合物のナフタレンの割合を推定する、比率推定のための機械学習モデルを含む画像診断システム2を構築した。
【0095】
図10A(1)は、ナフタレンの画像データの例である。図10A(2)(3)(4)は、夫々、シリカゲル、アルミナ、セライトの、画像データの例である。画像データの形状は四角である。
【0096】
更に、ナフタレンの比率(割合)の推定のための機械学習モデルの学習のために、300枚の、ナフタレンと、その他化合物(シリカゲル、アルミナ、セライト)との、多成分存在系の画像データを、教師データとして用いるために取得した。また、ナフタレンの比率(割合)の推定のために、100枚の、ナフタレンと、その他化合物(シリカゲル、アルミナ、セライト)との、多成分存在系の画像データを取得した。画像データの形状は四角である。ここでの多成分存在系の総重量は何れも200mgである。これらの画像データにより学習及び推定を行った。
【0097】
図10Bは、ナフタレンと、その他化合物(シリカゲル、アルミナ、セライト)との、様々な多成分存在系における、学習済みの比率推定のための機械学習モデルによる、ナフタレンの比率(割合)の推定例である。図10B(1)~(3)に示す多成分存在系の画像データの上部において、「ナフタレン」と「その他」(即ち、シリカゲル、アルミナ、及びセライト)との、夫々の混合比率(ここでも重量比率(重量%))の推定値と、実測値とを示している。例えば、図10B(1)に示す多成分存在系では、ナフタレンの比率(割合)の推定値が87%であり、その他の比率(割合)の推定値が13%であり、ナフタレンの比率(割合)の実測値が85%であり、その他の比率(割合)の実測値が15%である。図10Bに示すように、推定値と実測値には略差異は無い。
【0098】
図10Cは、ナフタレンと、その他化合物(シリカゲル、アルミナ、セライト)との多成分存在系におけるナフタレンの比率(割合)のプロットの例である。横軸は実際の混合比率(実際値)を示し、縦軸は推定値を示す。図10Cに示すプロットの例において、RMSE、MAE、Rが、以下のように算出された。即ち、推定値が実際値に非常に近いことが示されている。
【表7】
複数種類(上述では、4種類)の化合物が含まれる多成分存在系の画像データにより、本実施の形態に係る画像診断システム2における機械学習を行った結果、目的化合物に着目した混合重量割合の推定が、高い精度にて達成された。
【0099】
このような画像診断システムは、廃棄固体物質中などから再利用すべき化合物がどれくらい含まれているか診断する、というような工業的な応用が可能である。
【0100】
2.4.[実施の形態のまとめ]
実施の形態に係る画像診断システム2は、インタフェース装置6と、記憶装置12と、処理回路8とを含む。画像診断システム2には、複数物質の混合状態の画像データを説明変数とし、当該複数物質の混合比率を目的変数とする、又は、反応系の反応化合物の画像データを説明変数とし、当該反応化合物の反応収率を目的変数とする、比率推定のための機械学習モデルが構築されている。(1)比率推定のための機械学習モデルを、複数物質の混合状態における混合比率を推定するために用いる場合には、処理回路8が、記憶装置12に記憶される、複数物質の混合状態の画像データと当該混合状態における混合比率の数値データとの組み合わせを、インタフェース装置6を介して取得して、教師データとして学習を行う。(2)比率推定のための機械学習モデルを、反応系の反応化合物における反応収率を推定するために用いる場合には、処理回路8が、記憶装置12に記憶される、反応前の化合物と、反応後の化合物とを混合して作出された混合状態の画像データと、当該混合状態における混合比率の数値データとの組み合わせを、インタフェース装置6を介して取得して、教師データとして学習を行う。
【0101】
このような画像診断システム2では、反応化合物や混合試料の画像データを入力として、化学反応における反応収率や混合試料の混合比率を正確に推定することができる。
【0102】
3.[他の実施の形態]
以上のように、本出願において開示する技術の例示として、実施の形態を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置き換え、付加、省略などを行った実施の形態にも適用可能である。
【0103】
3.1.[簡易且つ迅速に構築可能な画像診断システム]
実施の形態に係る説明にて、オープンソースであるPytorchライブラリを利用してCNNを構築し得ることを述べた。実施の形態に係る画像診断システムの一部は、Google(登録商標)社が提供する“Google Colaboratory”を活用することで構築することが可能である。発明者が構築した、実施の形態に係る画像診断システムの例を以下にて、「システム1」、「システム2」、及び「システム3」として、簡単に示す。
【0104】
3.1.(1).システム1
システム1は、画像1枚から混合比率の推定値を出すことが可能である画像診断システムである。
https://colab.research.google.com/drive/1v88D3DMrAJGhb95z_fj8lO9WSy4W16dD?usp=sharing
システム1では、訓練データとしての画像は予め読み込ませており、学習モデルを組み込み済みである。推定のための画像データをアップロードして画像診断を行う。画像診断のための所要時間は、約10秒/枚である。
【0105】
3.1.(2).システム2
システム2は、実際値と推定値のプロット図、及び診断評価指標(例えば、MAE、RMSE、R)を取得することが可能である画像診断システムである。
https://colab.research.google.com/drive/1HrXTFVGDix-1yFgi1kP86nM7oXOvrBVS?authuser=1
システム2では、訓練データとしての画像は予め読み込ませており、学習モデルを組み込み済みである。推定のための画像データ、及び実際値をリスト化したテキストファイルをアップロードする。実際値と推定値のプロット図の作成、及び診断評価指標の取得のための、所要時間は約10分である。
【0106】
3.1.(3).システム3
システム3は、機械学習モデルの作成から行う画像診断システムである。
https://colab.research.google.com/drive/1v88D3DMrAJGhb95z_fj8lO9WSy4W16dD?authuser=0
システム3は、実測した画像データセットをアップロードして機械学習モデルを作成する。推定のための画像データセットもアップロードし、作成した学習モデルを用いて画像診断を行う。機械学習モデルの作成、及び画像診断のための、所要時間は、約1時間である。
【0107】
3.2.[偏光画像データ]
上述のように、画像診断システムが取得する画像データが、偏光フィルタにより偏光が施されたものであることもある。このような偏光が施された画像データを使用することで、人間の目から得られる画像とは異なる画像データを利用することが可能となり、キラル化合物における光学分割純度の推定等にも、本開示の画像診断システムを適用することが可能となる。なお、キラル分子に関する画像診断システムによる推定例については、上述の「2.3.5.[鏡像異性体の混合状態における混合割合の推定]」にて採り上げている。
【0108】
3.3.[一般的な画像撮影装置による画像データ]
また、本開示の比率推定のための機械学習モデルの説明変数である画像データは、実体顕微鏡及び撮像装置により取得されるものに限定されない。例えば、スマートフォンの撮像機能により撮像される画像であってもよいし、人工衛星から撮像される衛星写真であってもよい。更に、様々な撮像装置による画像であってもよいし、汎用画像であってもよい。
【0109】
図11A(1α)は、実施の形態における説明でも言及した、実体顕微鏡及び撮像装置(例えば、デジタルマイクロスコープ)により撮像した画像データである。砂糖と食塩の混合試料が撮像されている。なお、図11A(1β)は、図11A(1α)に示す画像データを正方形へトリミングしたものである。
【0110】
これに対して、図11A(2α)は、一般的な画像撮影装置(ここでは、iPod touch(登録商標))により撮像した画像データである。やはり砂糖と食塩の混合試料が撮像されている。図11A(2β)は、図11A(2α)に示す画像データを正方形へトリミングしたものである。
【0111】
なお、上述のデジタルマイクロスコープの画素密度は、96ppiであり、上述の一般的な画像撮影装置の画素密度は、72ppiである。図11A(1α)に示す画像データは2048×1536ピクセルであり、図11A(2α)に示す画像データは3264×2448ピクセルであり、図11A(1β)及び(2β)に示す画像データは1536×1536ピクセルである。
【0112】
実施の形態に係る画像診断システムに対して、上述の一般的な画像撮影装置により撮像した100枚の画像データ(撮像対象:砂糖と食塩の混合試料)を教師データとして入力して、学習を行った。その後、同画像診断システムに対して、やはり上述の一般的な画像撮影装置により撮像した100枚の画像データ(撮像対象:砂糖と食塩の混合試料)を、推定のための画像データとして入力して、夫々の画像データにおける混合比率の推定を行った。画像データの形状は四角である。混合試料の総重量は何れも200mgである。
【0113】
図11B(1)(2)(3)(4)は、100のうちの4つの混合試料の画像データと、当該混合試料における砂糖と食塩の混合比率の推定値と実測値(実際値)とを示している。図11Bに示すように、推定値と実測値(実際値)とには略差異は無い。図11Cは、100の混合試料における、砂糖と食塩の混合比率のプロット図であり、横軸は実際値を示し、縦軸は推定値を示す。RMSE、MAE、Rが、以下のように算出された。即ち、推定値が実測値(実際値)に非常に近いことが示されている。
【表8】
【0114】
3.4.[異なる画像撮影装置による画像データ]
更に、本開示の比率推定のための機械学習モデルの説明変数である画像データは、異なる画像撮影装置により撮像されたものが、混ぜられたものであってもよい。図12A(1α)は、実体顕微鏡及び撮像装置(例えば、デジタルマイクロスコープ(画素密度:96ppi))により撮像した、砂糖と食塩の混合試料の画像データである。図12A(2α)は、一般的な画像撮影装置(ここでは、iPod touch(登録商標)(画素密度:72ppi))により撮像した、砂糖と食塩の混合試料の画像データである。これらの画像データに対して、色合いを統一させるためにグレースケール処理を施して、モノカラーの画像データとしている。図12A(1β)は、実体顕微鏡及び撮像装置(例えば、デジタルマイクロスコープ)により撮像してグレースケール処理を施した、砂糖と食塩の混合試料の画像データである。図12A(2β)は、一般的な画像撮影装置(ここでは、iPod touch(登録商標))により撮像してグレースケール処理を施した、砂糖と食塩の混合試料の画像データである。
【0115】
色合いの統一は、画像診断システムの精度を増すために行うものである。
【0116】
まず、実施の形態に係る画像診断システムに対して、上述のデジタルマイクロスコープにより撮像した、フルカラーの(即ち、グレースケール処理前の)500枚の画像データ(撮像対象:砂糖と食塩の混合試料)と、上述の一般的な画像撮影装置により撮像した、フルカラーの(即ち、グレースケール処理前の)24枚の画像データ(撮像対象:砂糖と食塩の混合試料)とを、教師データとして入力して、学習を行った。その後、同画像診断システムに対して、やはり上述の一般的な画像撮影装置により撮像した、フルカラーの6枚の画像データ(撮像対象:砂糖と食塩の混合試料)を、推定のための画像データとして入力して、夫々の画像データにおける混合比率の推定を行った。画像データの形状は四角である。混合試料の総重量は何れも200mgである。
【0117】
図12B(1)は、6個(6枚)の混合試料における、砂糖と食塩の混合比率のプロット図であり、横軸は実際値を示し、縦軸は推定値を示す。RMSE、MAE、Rが以下のように算出された。
【表9】
【0118】
一方で、実施の形態に係る画像診断システムに対して、上述のデジタルマイクロスコープにより撮像しグレースケール処理を施した(即ち、モノカラーの)500枚の画像データ(撮像対象:砂糖と食塩の混合試料)と、上述の一般的な画像撮影装置により撮像しグレースケール処理を施した(即ち、モノカラーの)24枚の画像データ(撮像対象:砂糖と食塩の混合試料)とを、教師データとして入力して、学習を行った。その後、同画像診断システムに対して、やはり上述の一般的な画像撮影装置により撮像しグレースケール処理を施した、6枚の画像データ(撮像対象:砂糖と食塩の混合試料)を、推定のための画像データとして入力して、夫々の画像データにおける混合比率の推定を行った。
【0119】
図12B(2)は、6つ(6枚)の混合試料における、砂糖と食塩の混合比率のプロット図であり、横軸は実際値を示し、縦軸は推定値を示す。RMSE、MAE、Rが以下のように算出された。
【表10】
推定値が実測値(実際値)に非常に近いことが示されている。更に、図12B(1)の場合、即ち、教師データ及び推定のための画像データがフルカラー画像である場合に比べて、図12B(2)の場合、即ち、教師データ及び推定のための画像データがグレースケール処理の施されたモノカラー画像である場合では、診断精度が格段に向上していることが、示されている。
【0120】
このように、異なる画像撮影装置による画像データを混ぜて利用できるということは、ファインチューニングを用いて転移学習への応用が可能である、ということが示されるものである。
【0121】
3.5.[物質の存在の有無の確認]
「2.3.7.[多成分存在系における目的化合物の混合割合の推定]」でも述べたように、本開示の画像診断システムは、異なる複数の物質を定量化して見分けるために用いることができる。例えば、主たる物質以外の物質(例えば、微小な砂)が混じったことが疑われる主たる物質(例えば、小麦粉)に対して、主たる物質以外の物質の存在若しくは不存在をチェックすることができる。この場合、主たる物質と、主たる物質以外の物質との、様々な混合試料の画像データと、それら混合試料の混合比率の数値データとの、組み合わせを教師データとして、比率推定のための機械学習モデルを予め学習させておく必要がある。
【0122】
この場合の、学習済みの比率推定のための機械学習モデルに、主たる物質と、主たる物質以外の物質との、混合状態の画像データが入力されると、100%の値若しくは100%を僅かに下回る値である、主たる物質の比率と、0%の値若しくは0%を僅かに上回る値である、主たる物質以外の物質の比率が、出力され得ることになる。主たる物質の比率及び主たる物質以外の物質の比率は、例えば、ディスプレイ装置(図示せず)に出力され、また、記憶装置12に格納される。このとき、主たる物質以外の物質の比率が、所定の閾値よりも大きいときには、処理回路8は、所定の信号、例えば、主たる物質以外の物質の存在を示す信号を出力するように、画像診断システム2が構築されてもよい。この主たる物質以外の物質の存在を示す信号は、ディスプレイ装置(図示せず)にて、主たる物質以外の物質の存在を示すメッセージとして表示され得る。ここで、所定の閾値は、0%を含む極微小な値であることが好ましい。
【0123】
上述のように、主たる物質以外の物質の存在若しくは不存在をより精度よくチェックすることができる画像診断システム2とするためには、主たる物質以外の物質の混入の比率が低い画像データと、そのときの、主たる物質の比率が高く主たる物質以外の物質の比率が低い、混合比率の数値データとの、組み合わせを、教師データとしてできるだけ多く用意した上で、比率推定のための機械学習モデルを予め学習させておくのが好ましい。
3.6.[その他]
【0124】
また、実施の形態を説明するために、添付図面および詳細な説明を提供した。したがって、添付図面および詳細な説明に記載された構成要素の中には、課題解決のために必須な構成要素だけでなく、上記技術を例示するために、課題解決のためには必須でない構成要素も含まれ得る。そのため、それらの必須ではない構成要素が添付図面や詳細な説明に記載されていることをもって、直ちに、それらの必須ではない構成要素が必須であるとの認定をするべきではない。
【0125】
また、上述の実施の形態は、本開示における技術を例示するためのものであるから、特許請求の範囲またはその均等の範囲において種々の変更、置き換え、付加、省略などを行うことができる。
【産業上の利用可能性】
【0126】
本開示の画像診断システムは、混合試料の混合割合評価や化学反応の反応収率の定量化に利用できる。また、本開示の画像診断システムは、大量の反応試料の画像データの収集を実現するための、ロボットによるハイスループットスクリーニングへ適用可能である。また、本開示の画像診断システムは、薬剤調剤におけるヒューマンエラー防止のための監視システムにも適用可能である。更に、本開示の画像診断システムは、化成品及び製薬プラントの品質管理にも適用可能である。
【符号の説明】
【0127】
2・・・画像診断システム、4・・・コンピュータ装置、6・・・インタフェース装置、8・・・処理回路、10・・・メモリ、12・・・記憶装置、14・・・外部ネットワーク、16・・・学習サーバ、18・・・データセット。
図1
図2
図3A
図3B
図3C
図4
図5A
図5B
図6A
図6B
図7A
図7B
図8A
図8B
図8C
図9A
図9B
図9C
図10A
図10B
図10C
図11A
図11B
図11C
図12A
図12B