IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 宏碁智醫股▲ふん▼有限公司の特許一覧

<>
  • 特許-画像関連の検出方法及び検出装置 図1
  • 特許-画像関連の検出方法及び検出装置 図2
  • 特許-画像関連の検出方法及び検出装置 図3
  • 特許-画像関連の検出方法及び検出装置 図4
  • 特許-画像関連の検出方法及び検出装置 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-21
(45)【発行日】2024-07-01
(54)【発明の名称】画像関連の検出方法及び検出装置
(51)【国際特許分類】
   G06T 7/00 20170101AFI20240624BHJP
   G06N 3/08 20230101ALI20240624BHJP
【FI】
G06T7/00 350C
G06T7/00 612
G06N3/08
【請求項の数】 12
【外国語出願】
(21)【出願番号】P 2021142738
(22)【出願日】2021-09-01
(65)【公開番号】P2022145429
(43)【公開日】2022-10-04
【審査請求日】2021-09-02
(31)【優先権主張番号】110109981
(32)【優先日】2021-03-19
(33)【優先権主張国・地域又は機関】TW
【前置審査】
(73)【特許権者】
【識別番号】522096916
【氏名又は名称】宏碁智醫股▲ふん▼有限公司
(74)【代理人】
【識別番号】100147485
【弁理士】
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【弁護士】
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100169823
【弁理士】
【氏名又は名称】吉澤 雄郎
(72)【発明者】
【氏名】陳 名科
(72)【発明者】
【氏名】蔡 金翰
【審査官】稲垣 良一
(56)【参考文献】
【文献】米国特許出願公開第2017/0357879(US,A1)
【文献】国際公開第2019/178561(WO,A2)
【文献】国際公開第2019/245597(WO,A1)
【文献】特開2019-211913(JP,A)
【文献】国際公開第2019/220622(WO,A1)
【文献】特開2019-152968(JP,A)
【文献】特開2020-103880(JP,A)
【文献】特表2004-535569(JP,A)
【文献】木村 知広 、他1名,機械学習による退院時サマリからのDPC分類の推測,第39回医療情報学連合大会(第20回日本医療情報学会学術大会)論文集 [CD-ROM] 第39回医療情報学連合大会 第20回日本医療情報学会学術大会,日本医療情報学会,2019年11月21日,p.684-689
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00 - 7/90
G06N 3/00 - 3/12
G06N 20/00 - 20/20
(57)【特許請求の範囲】
【請求項1】
医用画像に適用可能な検出方法であって、
人工ニューラル・ネットワークであるインセプション・モデルにより、評価される画像に対する非対称畳み込みカーネル構造による特徴抽出を実行して、少なくとも1つの特徴マップを得るステップと、
分類器によって、前記分類器に入力された前記少なくとも1つの特徴マップを検出して、分類結果を得るステップとを含み、
前記分類器はディープ・ニューラル・ネットワーク構造によって学習させることができ、該ディープ・ニューラル・ネットワーク構造は改良結合層を含み、該改良結合層内では、ニューロンの数が入力層から出力層までに逐次的に減少し、ドロップアウトがデフォルトで実行される前記インセプション・モデルにおいて、前記分類器の学習段においてドロップアウトを無効にする検出方法。
【請求項2】
前記分類器によって、前記分類器に入力された前記少なくとも1つの特徴マップを検出するステップが、
前記改良結合層内のニューロンの各々を、前記分類器の前記学習段及び推論段用に活性化するステップを含む、請求項1に記載の検出方法。
【請求項3】
前記改良結合層がO個の隠れ層を含み、k番目の前記隠れ層内のニューロンの数がk+1番目の前記隠れ層内のニューロンの数の整数倍であり、ここにOは1よりも大きい正の整数であり、kは1~Oの正の整数である、請求項1に記載の検出方法。
【請求項4】
前記分類器によって、前記分類器に入力された前記少なくとも1つの特徴マップを検出するステップが、
前記改良結合層内の前記出力層内のニューロンの数を1に設定するステップを含み、
前記分類結果が1つの値を含み、該値は複数のクラスのうちの1つに対応する、請求項1に記載の検出方法。
【請求項5】
前記医用画像が眼底写真撮影を対象とする、請求項1に記載の検出方法。
【請求項6】
前記分類器が複数の副分類器を具え、該副分類器は同じ学習データを用いることによって学習させることができ、前記分類器によって、前記分類器に入力された前記少なくとも1つの特徴マップを検出するステップが、
前記副分類器の出力により前記分類結果を決定するステップを含む、請求項1に記載の検出方法。
【請求項7】
医用画像に適用可能な検出装置であって、
プログラミングコードを記憶する記憶装置と、
前記記憶装置に結合されたプロセッサとを具え、
前記プロセッサは、前記プログラミングコードをロードされて実行し、前記プログラミングコードは、
人工ニューラル・ネットワークであるインセプション・モデルにより、評価される画像に対する非対称畳み込みカーネル構造による特徴抽出を実行して、少なくとも1つの特徴マップを得て、
分類器によって、前記分類器に入力された前記少なくとも1つの特徴マップを検出して、分類結果を得るように構成され、
前記分類器はディープ・ニューラル・ネットワーク構造によって学習させることができプ、該ディープ・ニューラル・ネットワーク構造は改良結合層を含み、該改良結合層内では、ニューロンの数が入力層から出力層までに逐次的に減少し、ドロップアウトがデフォルトで実行される前記インセプション・モデルにおいて、前記分類器の学習段においてドロップアウトを無効にする検出装置。
【請求項8】
前記分類器の前記学習段及び推論段が、前記改良結合層内のニューロンの各々を活性化するように構成されている、請求項7に記載の検出装置。
【請求項9】
前記改良結合層がO個の隠れ層を含み、k番目の前記隠れ層内のニューロンの数がk+1番目の前記隠れ層内のニューロンの数の整数倍であり、ここにOは1よりも大きい正の整数であり、kは1~Oの正の整数である、請求項7に記載の検出装置。
【請求項10】
前記改良結合層内の前記出力層内のニューロンの数が1であり、前記分類結果が1つの値を含み、該値は複数のクラスのうちの1つに対応する、請求項7に記載の検出装置。
【請求項11】
前記医用画像が眼底写真撮影を対象とする、請求項7に記載の検出装置。
【請求項12】
前記分類器が複数の副分類器を具え、該副分類器は同じ学習データを用いることによって学習させることができ、前記プロセッサは、
前記副分類器の出力により前記分類結果を決定するように構成されている、請求項7に記載の検出装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は画像認識技術に関するものであり、より具体的には、画像関連の検出方法及び検出装置に関するものである。
【背景技術】
【0002】
関連技術の説明
医用画像は、生体の特定部位上での写真撮影により得られる画像である。これらの画像を用いて、病気にかかっている恐れまたは病気の重症度を評価することができる。例えば、眼底撮影検査により、網膜症、緑内障、黄斑症のような病気、あるいは他の病気を明確に検出することができる。一般的に言えば、大部分の医師は医用画像中の病変を手作業で判断している。医用画像に対するコンピュータ支援評価は、現在利用可能であるが、効率、複雑性、及び精度といった指標では、まだブレークスルー(飛躍的進歩)が要求される。
【発明の概要】
【発明が解決しようとする課題】
【0003】
技術課題
以上を考慮して、本発明の好適例は、画像関連の検出方法及び検出装置を提供し、これらの検出方法及び検出装置は、ニューラル・ネットワーク(NN:neural network:神経回路網)構造によって支援され、NNを改良して検出における効率及び精度を増大させる。
【課題を解決するための手段】
【0004】
課題の解決策
本発明の好適例では、検出方法が医用画像に適用可能である。この検出方法は次のステップを含む(但し、これらのステップに限定されない)。評価される画像に対する特徴抽出を実行して、特徴マップを得る。分類器によってこの特徴マップを検出して、分類結果を得る。この分類器はディープ・ニューラル・ネットワーク(DNN:deep neural network:深層神経回路網)構造によって学習させることができる。このDNN構造は改良結合層を含む。この改良結合層内では、ニューロンの数が入力層から出力層までに逐次的に減少する。
【0005】
本発明の好適例では、検出装置が医用画像に適用可能である。この検出装置は、記憶装置及びプロセッサを含む(但し、これらに限定されない)。記憶装置はプログラミングコードを記憶する。プロセッサは記憶装置に結合されている。プロセッサはプログラミングコードをロードされて実行し、このプログラミングコードは、評価される画像に対する特徴抽出を実行して、少なくとも1つの特徴マップを得て、分類器によってこの少なくとも1つの特徴マップを検出して分類結果を得るように構成されている。この分類器はディープ・ニューラル・ネットワーク構造によって学習させることができる。このディープ・ニューラル・ネットワーク構造は改良結合層を含む。この改良結合層内では、ニューロンの数が入力層から出力層までに逐次的に減少する。
【発明の効果】
【0006】
以上のことに基づいて、本発明の好適例によれば、画像関連の検出方法及び検出装置において、逐次的に減少するチャネルを有するディープ・ニューラル・ネットワーク構造を利用することによって、画像に対応するクラスに対して推論を行うことができる。その結果、ノイズをフィルタ処理することができ、効率を増大させることができ、そして推論の精度を向上させることができる。
【0007】
上述した本発明の特徴及び利点をよりわかりやすくするために、図面を伴ういくつかの実施形態を以下に詳細に説明する。
【図面の簡単な説明】
【0008】
図1】本発明の一実施形態による検出装置の要素のブロック図である。
図2】本発明の一実施形態による検出方法のフローチャートである。
図3】本発明の一実施形態によるインセプション・バージョン4モデルのフローチャートである。
図4図4Aは、本発明の一実施形態による改良結合層の概略図であり、図4Bは、本発明の他の実施形態による改良結合層の概略図である。
図5】本発明の一実施形態によるアンサンブルの概略図である。
【発明を実施するための形態】
【0009】
実施形態の説明
図1は、本発明の一実施形態による検出装置100の要素のブロック図である。図1を参照すれば、検出装置100が記憶装置110及びプロセッサ130を含む(但し、これらに限定されない)。検出装置100は、デスクトップ・コンピュータ、ネットワーク・コンピュータ、スマートホン、タブレット・コンピュータ、サーバー、医療検査機器、または他のコンピュータ装置とすることができる。
【0010】
記憶装置110は、あらゆる形態の固定または可動のランダムアクセスメモリ(RAM:random access memory)、読出し専用メモリ(ROM:read only memory)、フラッシュメモリ、ハードディスクドライブ(HDD:hard disc drive)、半導体ドライブ(SSD:solid state drive)、または同様な要素とすることができる。一実施形態では、記憶装置110が、プログラミングコード、ソフトウェア・モジュール、コンフィギュレーション(機器構成)、データ(例えば、画像、特徴マップ、ニューラル・ネットワーク・パラメータ、ニューラル・ネットワーク(NN)モジュール、等)またはファイルを記録するように構成され、これらの中で、上記実施形態を後に詳細に説明する。
【0011】
プロセッサ130は記憶装置110に結合されている。プロセッサ130は、中央処理装置(CPU:central processing unit)、グラフィックス処理装置(GPU:graphics processing unit)、または他のプログラマブルな汎用または専用マイクロプロセッサ、デジタル・シグナル・プロセッサ(DSP:digital signal processor)、プログラマブル・コントローラ、フィールド・プログラマブル・ゲートアレイ(FPGA:field programmable gate array)、特定用途向け集積回路(ASIC:application specific integrated circuit)、ニューラル・ネットワーク・アクセラレータ、または他の同様な素子、あるいは上記の素子の組合せとすることができる。一実施形態では、プロセッサ130が、検出装置100の動作の全部または一部を実行するように構成され、記憶装置110に記憶されている種々のプログラミングコード、ソフトウェア・モジュール、ファイル、及びデータをロードして実行することができる。
【0012】
以下に、本発明の上記実施形態による方法を、検出装置100内の種々の装置、要素、及びモジュールと共に説明する。この方法の各処理の流れは、実現環境に応じて調整することができ、説明するものに限定されない。
【0013】
図2は、本発明の一実施形態による検出方法のフローチャートである。図2を参照すれば、プロセッサ130が、評価される画像に対する特徴抽出を実行して、1つ以上の特徴マップを得る(ステップS210)。具体的には、評価される画像は、医用画像、モニター画面の画像、または他の形態の画像とすることができる。評価される画像は、1つ以上の被写体上での写真撮影により得られる。異なる設計要件に応じて、評価される画像の形態、本体、及び/または内容は異なり得る。例えば、評価される画像は、眼底撮影における医用画像(即ち、眼底像)である。他の例では、評価される画像が胸部超音波画像である。さらに他の例では、評価される画像が入口及び出口のモニター画面の画像である。
【0014】
一方、特徴抽出は、機械学習、パターン認識、画像処理、または他の技術分野において適用することができる。特徴抽出は、初期に測定/収集/抽出したデータサンプルについて、情報を与える冗長でない 派生物(または特徴と称するもの)を構成することである。特徴抽出は、その後の学習プロセス及びルール(規則)誘導プロセスを支援して、初期のデータサンプルに対するより良好な解釈を提供する。換言すれば、特徴抽出は入力データを簡略化して特徴集合にし(特徴集合は重要または有用な情報と考えることができる)、特徴集合を直接採用して、その後のタスク(例えば、モデル学習、成分分析、物体検出)を実行することができる。例えば、画像に対する特徴抽出により、エッジ(縁部)、コーナー(隅部)、スケール不変特徴変換(SIFT:scale-invariant feature transform)、屈曲、及び形状のような特徴を得ることができる。
【0015】
一実施形態では、プロセッサ130が、人工ニューラル・ネットワーク(ANN:artificial neural network)により、評価される画像に対する特徴抽出を実行することができる。例えば、プロセッサ130は、任意のバージョンのインセプション・モデル(例えば、インセプション・バージョン4(v4))、残差ニューラル・ネットワーク(ResNet:residual neural network)、グーグルネット(GoogLeNet:登録商標)、ビジュアル・ジオメトリー・グループ(VGG:Visual Geometry Group:登録商標)、その改良型、あるいは他の画像関連のネットワークを採用した特徴抽出を実行することができる。
【0016】
インセプションv4モデルを例として挙げ、図3は、本発明の一実施形態によるインセプション・バージョン4モデルのフローチャートである。図3を参照すれば、次のモジュールをプロセッサ130によって実行することができる。入力モジュール310は評価される画像を入力する。ステム・モジュール320は、インセプション・バージョン3(v3)において用いられる並列構造及び非対称畳み込みカーネル(核)構造を用いる。インセプション-Aモジュール330、インセプション-Bモジュール350、及びインセプション-Cモジュール370も、それぞれ異なる並列構造及び非対称畳み込みカーネル構造により特徴を抽出する。低減-Aモジュール340及び低減-Bモジュール360は、特徴マップのサイズを低減することができる。平均プーリング・モジュール380は、特徴マップ中のいくつかの領域内で隣接する特徴点の平均値を求める。活性化モジュール395は、活性化関数(例えば、ソフトマックス(Softmax)、シグモイド(Sigmoid)、または正規化線形ユニット(ReLU:Rectified Linear Unit))を用いる。
【0017】
他の実施形態では、プロセッサ130が、評価される画像に対する特徴抽出を、例えば、輝度勾配ヒストグラム(HOG:histogram of oriented gradient)、ハール(Harr)、高速化ロバスト特徴(SURF:speeded up robust features)、または他の抽出アルゴリズムを用いることによって実行することができる。
【0018】
一実施形態では、特徴マップが、畳み込みカーネル/フィルタにより実行した畳み込み総和後の出力である。他の実施形態では、二次元像の形式の特徴抽出アルゴリズムから得られた特徴集合/特徴ベクトルを記録することによって、特徴マップが得られる。
【0019】
プロセッサ130は、分類器により1つ以上の特徴マップを検出して、分類結果を得ることができる(ステップS230)。具体的には、この分類器はディープ・ニューラル・ネットワーク(DNN)構造によって学習させることができる。このディープ・ニューラル・ネットワークは、人工ニューラル・ネットワークを主構造として適応させる。このディープ・ニューラル・ネットワーク構造は改良結合層を含む。この改良結合層は、入力層、隠れ層、及び出力層を含む。このディープ・ニューラル・ネットワークは、多層ニューロン構造によって形成される。ニューロンの各層は、入力(例えば、ニューロンの前層の出力)及び出力を有して構成される。いずれか1つの隠れ層内のニューロンによって、入力ベクトルと重み付きベクトルとの内積が得られ、スカラーの結果が非線形変換関数により出力される。分類器の学習段では、この重み付きベクトルを学習により決定し、分類器の推論段では、決定した重み付きベクトルを用いることによって分類結果が得られる。この分類結果は、評価される画像が関連する1つ以上のクラスまたはラベルに関連する。
【0020】
本発明の上記実施形態では、改良結合層内のニューロンの数が入力層から出力層までに逐次的に減少する。改良結合層がM個の隠れ層を含むものと仮定すれば、j+1番目の隠れ層内のニューロンの数はj番目の層内のニューロンの数よりも小さく、ここにMは1よりも大きい正の整数であり、jは1~Mの正の整数である。換言すれば、入力層から出力層までに、次の層のニューロンの数が前の層のニューロンの数よりも小さい。
【0021】
例えば、図4Aは、本発明の一実施形態による改良結合層の概略図である。図4Aを参照すれば、改良結合層CL1が3つの層を含む。第1層L1-1は4つのニューロンを含み、第2層L1-2は3つのニューロンを含み、第3層L1-3は2つのニューロンを含む。
【0022】
一実施形態では、改良結合層がO個の隠れ層を含み、k番目の隠れ層内のニューロンの数がk+1番目の隠れ層内のニューロンの数の整数倍であり、ここにOは1よりも大きい正の整数であり、kは1~Oの正の整数である。この整数倍は、2倍、4倍、8倍、または他の倍数とすることができる。
【0023】
例えば、図4Bは、本発明の他の実施形態による改良結合層の概略図である。図4Bを参照すれば、改良結合層CL2がN個の層を含み、i番目の層内のニューロンの数はi+1番目の層内のニューロンの数の整数倍であり、ここにNは1よりも大きい正の整数であり、iは1~Nの正の整数である。例えば、第1層としての入力層L2-1は1024個のニューロンを含み、第2層としての隠れ層L2-2は512個のニューロンを含む。類推により、N―1番目の層としての隠れ層L2-(N-1)は2つのニューロンを含み、N番目の層としての出力層L2-Nは1つのニューロンを含む。
【0024】
他の実施形態では、ニューロンの数が、改良結合層内の入力層から出力層までに順次に減少する。例えば、第1層は8つのニューロンを含み、第2層は6つのニューロンを含む。
【0025】
さらに他の実施形態では、減少するニューロンの数が規則的でない。例えば、第1層は10個のニューロンを含み、第2層は7つのニューロンを含み、第3層は2つのニューロンを含む。
【0026】
なお、改良結合同内の層の数、及び各層内のニューロンの数は、実際の要求に応じてさらに変更することができる。
【0027】
一実施形態では、プロセッサ130が改良結合層内のニューロンの各々を、分類器の学習段及び推論段用に活性化する。具体的には、図3に示すように、既存のインセプションv4が、学習段内のドロップアウト(脱落)モジュール390によりニューロンをランダムに不活性化して過学習(オーバーフィッティング)の可能性を低減する。本発明の上記実施形態では、ドロップアウト・モジュール390を、逐次的に減少するチャネルを有するディープ・ニューラル・ネットワーク構造(即ち、改良結合層)に置き換える(即ち、ドロップアウトを無効にし;場合によっては活性化モジュール395も失効させる)ことによって、ノイズ・フィルタリング(ノイズのフィルタ処理)を実現することができ、そして次元を低減することができる。換言すれば、分類器の学習段及び推論段は、ニューロンをランダムに不活性化せずに、改良結合層内のニューロンの各々を活性化するように構成されている。
【0028】
一実施形態では、改良結合層内の出力層内のニューロンの数が1である。上記分類結果は1つの値を含み、この値は複数の(ラベルとも称する)クラスのうちの1つに対応する。クラスは、分類器によって出力することができる結果である。加齢に関連する黄斑症を例に挙げれば、この値はある範囲内に入り、この範囲は4つの部分に分割され、各部分は重症度の特定レベルに対応する。
【0029】
他の実施形態では、改良結合層の出力層が複数のニューロンを含み、出力層内の各ニューロンは、対応するクラスとして検出される確率または可能性を表す。
【0030】
一実施形態では、分類器がいくつかの副分類器を含み、これらの副分類器は同じ学習データを用いて学習させることができる。これらの副分類器は同じ構造を有し、各々が改良結合層を含む。同じ学習データを用いても、同じ構造を有する2つの副分類器は異なる重みパラメータを得る。プロセッサ130は、これらの副分類器の出力により分類結果を決定することができる。例えば、これらの副分類器の分類結果は各々が数値である。従って、プロセッサ130は、これらの副分類器の分類結果の平均値、最大値、中央値、または他の代表値を、分類器の分類結果として求める。
【0031】
図5は、本発明の一実施形態によるアンサンブルの概略図である。図5を参照すれば、2つの副分類器SC1及びSC2の各々が同じ特徴マップを検出し、2つの出力分類結果に対する包括的評価が実行される(ステップS501)。この包括的評価は、例えば、算術平均、重み付き平均、または他の数式である。
【0032】
一実施形態では、プロセッサ130が使用する副分類器を事前に選択する。選択した副分類器は、検査データ集合及び学習データ集合の両方において好適な、あるいは最も好適な(例えば、実際の結果に近い、あるいは実際の結果と同じ)結果を有する。それに加えて、選択されない副分類器は、より好適でない、あるいは最も好適でない(例えば、実際の結果から離れた)結果を有する。
【0033】
以上を要約すれば、本発明の実施形態では、画像関連の検出方法及び検出装置において、逐次的に減少するチャネルを有する改良結合層を用いて不純物をフィルタ処理して効率を増大させる。それに加えて、副分類器の分類結果は包括的に評価することができ、それに応じて最終的な分類結果を得ることができる。その結果、感度及び特異性を増大させることができる。医用画像検査への応用では、医師または一般大衆が検査結果を迅速に得ることに役立つことができ、検査時間を大幅に節減する。
【0034】
以上の実施形態の形で本発明を開示してきたが、これらの実施形態は本発明を限定することは意図していない。本発明の精神または範囲から逸脱することなしに、いくつかの変更及び変形を加えることができることは、通常の当業者にとって明らかである。以上のことを考慮すれば、本発明の保護の範囲は、添付した特許請求の範囲によって規定される範囲に支配される。
【産業上の利用可能性】
【0035】
上記画像関連の検出方法及び検出装置は、眼底撮影検査のような検査による、網膜症、緑内障、黄斑症のような病気、あるいは他の病気の検出に適用することができる。
【符号の説明】
【0036】
100:検出装置
110:記憶装置
130:プロセッサ
S210~S230、S501:ステップ
310:入力モジュール
320:ステム・モジュール
330:インセプション-Aモジュール
340:低減-Aモジュール
350:インセプション-Aモジュール
360:低減-Bモジュール
370:インセプション-Cモジュール
380:平均プーリング・モジュール
390:ドロップアウト・モジュール
395:活性化モジュール
CL1、CL2:改良結合層
L1-1:第1層
L1-2:第2層
L1-3:第3層
L2-1:入力層
L2-2、L2-(N-1):隠れ層
L2-N:出力層
SC1、SC2:副分類器
図1
図2
図3
図4
図5