特開2024-75635 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ コスモ　アーティフィシャル　インテリジェンス−エーアイ　リミティドの特許一覧

特開2024-75635敵対的生成ネットワークをトレーニングするシステム及び方法、並びに、トレーニング済みの敵対的生成ネットワークの使用

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8A
8B
8C

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024075635

(43)【公開日】2024-06-04

(54)【発明の名称】敵対的生成ネットワークをトレーニングするシステム及び方法、並びに、トレーニング済みの敵対的生成ネットワークの使用

(51)【国際特許分類】

G06T 7/00 20170101AFI20240528BHJP

A61B 1/045 20060101ALI20240528BHJP

【ＦＩ】

G06T7/00 350C

A61B1/045 618

A61B1/045 614

G06T7/00 612

【審査請求】有

【請求項の数】20

【出願形態】ＯＬ

(21)【出願番号】P 2024039030

(22)【出願日】2024-03-13

(62)【分割の表示】P 2021518989の分割

【原出願日】2019-06-11

(31)【優先権主張番号】16/008,006

(32)【優先日】2018-06-13

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】18180570.6

(32)【優先日】2018-06-28

(33)【優先権主張国・地域又は機関】EP

(71)【出願人】

【識別番号】520492282

【氏名又は名称】コスモアーティフィシャルインテリジェンス－エーアイリミティド

(74)【代理人】

【識別番号】100099759

【弁理士】

【氏名又は名称】青木篤

(74)【代理人】

【識別番号】100123582

【弁理士】

【氏名又は名称】三橋真二

(74)【代理人】

【識別番号】100092624

【弁理士】

【氏名又は名称】鶴田準一

(74)【代理人】

【識別番号】100114018

【弁理士】

【氏名又は名称】南山知広

(74)【代理人】

【識別番号】100153729

【弁理士】

【氏名又は名称】森本有一

(72)【発明者】

【氏名】ナーンゴーディン

(72)【発明者】

【氏名】ジュリオエバンジェリスティ

(72)【発明者】

【氏名】フラビオナバーリ

(57)【要約】（修正有）

【課題】敵対的生成ネットワークをトレーニングし、且つ、医療画像分析等の用途のためにこれを使用するシステム及び方法を提供する。
【解決手段】システムは、対象の特徴の表現を含む第１の複数の画像と、対象の特徴の場所のインジケータとを提供し、且つ、物体検出ネットワークをトレーニングするべく前記第１の複数及びインジケータを使用する少なくとも１つのプロセッサを含み、前記プロセッサは、対象の特徴の表現を含む第２の複数の画像を提供すると共に、対象の特徴の複数の検出を生成するべく、トレーニング済みの物体検出ネットワークを第２の複数のものに適用し、複数の検出との関係における真陽性及び偽陽性の手動的に設定された検証を提供し、敵対的生成ネットワークをトレーニングするべく検証を使用し、且つ、少なくとも１つの画像の更なる組、更なる検出及び更なる手動的に設定された検証を使用して敵対的生成ネットワークを再トレーニングする。
【選択図】図３

【特許請求の範囲】

【請求項1】

対象の特徴の表現を含む画像を使用して敵対的生成ネットワークをトレーニングするシステムであって、
命令を保存するように構成された少なくとも１つのメモリと、
動作を実行するべく前記命令を実行するように構成された少なくとも１つのプロセッサと、
を有し、
前記動作は、
前記対象の特徴の表現を含む第１の複数の画像と、前記第１の複数の画像のうちの画像内の前記対象の特徴の場所のインジケータと、を提供するステップと、
前記第１の複数の画像及び前記対象の特徴の場所のインジケータを使用することにより、前記対象の特徴を検出するべく物体検出ネットワークをトレーニングするステップであって、任意選択により、前記物体検出ネットワークは、畳み込みニューラルネットワークである、ステップと、
前記対象の特徴の表現を含む第２の複数の画像を提供するステップであって、前記第２の複数の画像は、前記第１の複数の画像内に含まれているものよりも多くの数の画像を有する、ステップと、
第１の複数の前記対象の特徴の検出を生成するべく、前記トレーニング済みの物体検出ネットワークを前記第２の複数の画像に適用するステップと、
前記第１の複数の前記対象の特徴の検出との関係における真陽性及び偽陽性の手動的に設定された検証を提供するステップと、
前記第１の複数の前記対象の特徴の検出との関係における前記真陽性及び偽陽性の前記検証を使用することにより、敵対的生成ネットワークをトレーニングするステップと、
前記対象の特徴の更なる検出との関係における真陽性及び偽陽性の更なる手動的に設定された検証と共に、少なくとも１つの画像の更なる組及び前記対象の特徴の検出を使用することにより、前記敵対的生成ネットワークを再トレーニングするステップと、
を有する、システム。

【請求項2】

前記少なくとも１つのプロセッサは、２つ以上の画像内の前記対象の特徴の見逃された検出についての偽陰性の検証を提供することにより、前記敵対的生成ネットワークを再トレーニングするように更に構成されている、請求項１に記載のシステム。

【請求項3】

前記第２の複数の画像内の画像の数は、前記第１の複数の画像に含まれているものよりも、少なくとも１００倍だけ、大きい、請求項１又は２に記載のシステム。

【請求項4】

前記第１の複数の画像及び前記第２の複数の画像は、医療画像を有しており、且つ、前記医療画像は、任意選択により、胃腸臓器の画像を有する、請求項１から３のいずれか１項に記載のシステム。

【請求項5】

前記第１の複数の画像及び前記第２の複数の画像の少なくとも１つは、胃鏡検査、結腸内視鏡検査、小腸内視鏡検査、或いは、任意選択により、内視鏡検査装置を含む上部内視鏡検査のうちの少なくとも１つにおいて使用されている撮像装置からの画像を有する、請求項１から４のいずれか１項に記載のシステム。

【請求項6】

前記対象の特徴は、異常性であり、且つ、前記異常性は、任意選択により、１つのタイプの細胞から別のタイプの細胞へのヒト組織における変化、前記ヒト組織が予想されている場所からのヒト組織の欠如、及び／又は、ヒト組織上における形成又はヒト組織の形成を有する、請求項１から５のいずれか１項に記載のシステム。

【請求項7】

前記異常性は、任意選択により、ポリープ状病変又は非ポリープ状病変を含む、病変を有する、請求項６に記載のシステム。

【請求項8】

人間臓器の画像内において異常性を検出するべくニューラルネットワークシステムをトレーニングする方法であって、少なくとも１つのプロセッサによって実行される、
データベース内において、異常性の表現を含む複数のビデオを保存するステップと、
前記複数のビデオの第１サブセットを選択するステップと、
異常性の第１の複数の検出を生成するべく、物体検出ネットワークの知覚ブランチを前記複数のビデオの前記第１サブセットのフレームに適用するステップと、
前記複数のビデオの第２サブセットを選択するステップと、
前記第１の複数の検出及び前記複数のビデオの前記第２サブセットからのフレームを使用することにより、ポリープの複数の人工的表現を生成するべく、生成器ネットワークをトレーニングするステップであって、前記複数の人工的表現は、残差学習を通じて生成されており、且つ、前記生成器ネットワークは、任意選択により、敵対的生成ネットワークを有する、ステップと、
前記異常性の前記人工的表現と異常性の真の表現の間を弁別するべく、ディスクリミネータネットワークの敵対的ブランチをトレーニングするステップであって、前記ディスクリミネータネットワークは、任意選択により、畳み込みニューラルネットワークを有する、ステップと、
前記異常性の人工的表現と前記複数のビデオの前記第２サブセットのフレーム内に含まれている異常性の真の表現の間の差インジケータを生成するべく、前記ディスクリミネータネットワークの前記敵対的ブランチを前記複数の人工的表現に適用するステップと、
前記異常性の第２の複数の検出を生成するべく、前記ディスクリミネータネットワークの前記知覚ブランチを前記人工的表現に適用するステップと、
前記差インジケータ及び前記第２の複数の検出に基づいて前記知覚ブランチを再トレーニングするステップと、
を有する方法。

【請求項9】

前記異常性は、１つのタイプの細胞から別のタイプの細胞へのヒト組織における変化、前記ヒト組織が予想されている場所からのヒト組織の欠如、及び／又は、ヒト組織上における形成又はヒト組織の形成を有する、請求項８に記載の方法。

【請求項10】

前記異常性は、任意選択により、ポリープ状病変又は非ポリープ状病変を含む、病変を有する、請求項９に記載の方法。

【請求項11】

それぞれの人工的表現は、異常性の真の表現に非常に類似した異常性の偽の表現を提供している、請求項８から１０のいずれか１項に記載の方法。

【請求項12】

人間臓器の画像内において異常性を検出するシステムであって、
命令を保存する少なくとも１つのメモリと、
動作を実行するべく前記命令を実行するように構成された少なくとも１つのプロセッサと、
を有し、
動作は、
人間臓器のビデオからフレームを選択するステップと、
前記異常性の少なくとも１つの検出を生成するべく、トレーニング済みのニューラルネットワークシステムを前記フレームに適用するステップと、
前記フレームの１つ上における前記少なくとも１つの検出の場所のインジケータを生成するステップと、
前記フレームをビデオとして再エンコーディングするステップと、
前記インジケータと共に、前記再エンコーディングされたビデオを出力するステップと、
を有し、
前記ニューラルネットワークは、請求項８から１１のいずれか１項に記載の方法に従ってトレーニングされている、システム。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、一般に、ニューラルネットワークの分野と、画像分析及び物体検出用のこの種のネットワークの使用と、に関する。更に詳しくは、且つ、限定を伴うことなしに、本開示は、敵対的生成ネットワークをトレーニングする、且つ、これを使用する、コンピュータ実装されたシステム及び方法に関する。本明細書において開示されているシステム及び方法並びにトレーニング済みのニューラルネットワークは、医療画像分析及び正確な物体検出能力から受益するシステムなどの、様々な用途及びビジョンシステムにおいて使用することができる。

【背景技術】

【0002】

多くの物体検出システムにおいて、物体が画像内において検出されている。対象の物体は、人物、場所、又は物であってよい。医療画像分析及び診断などの、いくつかの用途においては、物体の場所も、同様に重要である。但し、画像クラシファイアを利用しているコンピュータ実装されたシステムは、通常、検出された物体の場所を識別又は提供することができない。従って、画像クラシファイアのみを使用している現存のシステムは、あまり有用ではない。

【0003】

更には、物体検出用のトレーニング技法は、手動的に注釈付けされたトレーニングセットに依存しうる。このような注釈付けは、トレーニング対象の検出ネットワークが、ユー・オンリー・ルック・ワンス（ＹＯＬＯ：ＹｏｕＯｎｌｙＬｏｏｋＯｎｃｅ）アーキテクチャ、シングルショット検出器（ＳＳＤ：ＳｉｎｇｌｅＳｈｏｔＤｅｔｅｃｔｏｒ）アーキテクチャ、又はこれらに類似したもの、などの、境界ボックスに基づいたものである際に、時間を所要している。従って、大きなデータセットは、トレーニング用に注釈付けすることが困難であり、これにより、しばしば、相対的に小さなデータセットにおいてトレーニングされるニューラルネットワークを結果的にもたらしており、この結果、精度が低減されている。

【0004】

コンピュータ実装されたシステムの場合に、現存の医療撮像は、通常、単一の検出器ネットワーク上において構築されている。従って、検出が実施されたら、ネットワークは、単に、例えば、医師又はその他の医療従事者に検出を出力している。但し、このような検出は、内視鏡検査における非ポリープ又はこれに類似したもののように、偽陽性である場合がある。このようなシステムは、真陽性から偽陽性を弁別するための別個のネットワークを提供してはいない。

【0005】

更には、ニューラルネットワークに基づいた物体検出器は、通常、ニューラルネットワークによって識別された特徴を検出器に供給しており、検出器は、第２のニューラルネットワークを有しうる。但し、このようなネットワークは、しばしば、不正確であり、その理由は、特徴検出が、一般化されたネットワークによって実行されており、専門化されているのは、検出器部分のみである、からである。

【0006】

最後に、多くの現存の物体検出器は、遅延を伴って機能している。例えば、医療画像は、分析の前に、キャプチャ及び保存される場合がある。但し、内視鏡検査などの、いくつかの医療手順は、リアルタイムで診断されている。この結果、これらのシステムは、通常、必要とされているリアルタイム方式によって適用することが困難である。

【発明の概要】

【0007】

以上の内容に鑑み、本開示の実施形態は、敵対的生成ネットワークをトレーニングする、且つ、医療画像分析などの用途のために、これを使用する、コンピュータ実装されたシステム及び方法を提供している。本開示のシステム及び方法は、現存のシステム及び技法との比較において、改善された物体検出及び場所情報を含む、利益を提供している。

【0008】

いくつかの実施形態によれば、その場所と共に、対象の特徴（即ち、対象の異常性又は物体）を識別する物体検出器ネットワークと、偽陽性から真陽性を弁別する敵対的ネットワークと、を含む、コンピュータ実装されたシステムが提供されている。更には、本開示の実施形態は、物体検出器ネットワークをトレーニングするための２ループ技法をも提供している。このトレーニングプロセスは、手動的な注釈付けが、格段に高速に、且つ、従って、相対的に大きなデータセットを伴って、発生しうるように、検出の検討に基づいた注釈付けを使用している。更には、このプロセスは、真陽性から偽陽性を弁別するために、敵対的生成ネットワークをトレーニングするべく、使用することができる。

【0009】

これに加えて、物体検出器ネットワークを敵対的生成ネットワークと組み合わせる、開示されたシステムが提供されている。このようなネットワークを組み合わせることにより、偽陽性が真陽性から弁別され、これより、相対的に正確な出力を提供することができる。偽陽性を低減することにより、医師又はその他の医療従事者は、増大した精度の故に、増大した注意をネットワークからの出力に付与することができる。

【0010】

更には、本開示の実施形態は、専門化された検出器と組み合わせられた１つのニューラルネットワークによる一般的な特徴識別を使用してはいないニューラルネットワークを含む。むしろ、単一の、シームレスなニューラルネットワークが、物体検出器部分についてトレーニングされており、この結果、相対的に高度な専門化のみならず、増大した精度及び効率がもたらされている。

【0011】

最後に、本開示の実施形態は、単一のディスプレイ上において、物体検出と共に、（内視鏡検査ビデオ又はその他の医療画像などの）リアルタイムビデオを表示するように、構成されている。従って、本開示の実施形態は、物体検出器に伴う誤り及びその他の潜在的な欠点に由来する潜在的な問題を極小化するべく、ビデオバイパスを提供している。更には、物体検出は、医師又はその他の医療従事者の注意を相対的に良好に引き付けるように設計された特殊な方式によって表示することができる。

【0012】

一実施形態において、対象の特徴の表現を含む画像を使用して敵対的生成ネットワークをトレーニングするシステムは、命令を保存するように構成された少なくとも１つのメモリと、動作を実行するべく命令を実行するように構成された少なくとも１つのプロセッサと、を有することができる。動作は、対象の特徴の表現を含む第１の複数の画像と、第１の複数の画像の画像内の対象の特徴の場所のインジケータと、を提供するステップと、第１の複数の画像及び対象の特徴のインジケータを使用することにより、対象の特徴を検出するべく物体検出ネットワークをトレーニングするステップと、を有することができる。動作は、対象の特徴の表現を含む第２の複数の画像を提供するステップと、対象の特徴の第１の複数の検出を生成するべく、トレーニング済みの物体検出ネットワークを第２の複数の画像に適用するステップと、を更に有することができる。第２の複数の画像は、第１の複数の画像に含まれているものよりも多くの数の画像を有することができる。動作は、第１の複数の検出との関係における真陽性及び偽陽性の手動的に設定された検証を提供するステップと、第１の複数の検出との関係における真陽性及び偽陽性の検証を使用することにより、敵対的生成ネットワークをトレーニングするステップと、対象の特徴の更なる検出との関係における真陽性及び偽陽性の更なる手動的に設定された検証と共に、少なくとも１つの更なる画像の組及び対象の特徴の検出を使用して敵対的生成ネットワークを再トレーニングするステップと、を更に有することができる。

【0013】

いくつかの実施形態において、少なくとも１つのプロセッサは、２つ以上の画像内における対象の特徴の見逃された検出についての偽陰性の検証を提供することにより、敵対的生成ネットワークを再トレーニングするように更に構成することができる。

【0014】

実施形態のいずれかにおいて、物体検出ネットワークは、畳み込みニューラルネットワークであってよい。

【0015】

実施形態のいずれかにおいて、第２の複数の画像内の画像の数は、第１の複数の画像に含まれているものよりも、少なくとも１００倍だけ大きくてもよい。

【0016】

実施形態のいずれかにおいて、第１の複数の画像及び第２の複数の画像は、医療画像を有することができる。例えば、医療画像は、胃腸臓器の画像を有することができる。

【0017】

実施形態のいずれかにおいて、第１の複数の画像及び第２の複数の画像の少なくとも１つは、内視鏡検査装置からの画像を有する。これに加えて、或いは、この代わりに、第１の複数の画像及び第２の複数の画像の少なくとも１つは、胃鏡検査、結腸内視鏡検査、小腸内視鏡検査、或いは、食道内視鏡検査などの上部内視鏡検査のうちの少なくとも１つの際に使用される撮像装置からの画像を有することができる。

【0018】

実施形態のいずれかにおいて、対象の特徴は、異常性であってよい。例えば、異常性は、細胞の１つのタイプから細胞の別のタイプへのヒト組織内における変化を有することができる。これに加えて、又はこの代わりに、異常性は、ヒト組織が予想されている場所からのヒト組織の欠如を有することもできる。これに加えて、又はこの代わりに、異常性は、ヒト組織上における形成又はヒト組織の形成を有することもできる。

【0019】

実施形態のいずれかにおいて、異常性は、病変を有することができる。例えば、病変は、ポリープ状病変又は非ポリープ状病変を有することができる。

【0020】

一実施形態において、人間臓器の画像内において異常性を検出するべくニューラルネットワークシステムをトレーニングする方法は、データベース内において、異常性の表現を含む複数のビデオを保存するステップと、複数のビデオの第１サブセットを選択するステップと、第１の複数の異常性の検出を生成するべく、物体検出ネットワークの知覚ブランチを複数のビデオの第１サブセットのフレームに適用するステップと、を有することができる。方法は、複数のビデオの第２サブセットを選択するステップと、第１の複数の検出及び複数のビデオの第２サブセットからのフレームを使用することにより、複数の異常性の人工的表現を生成するべく、生成器ネットワークをトレーニングするステップと、を更に有することができる。複数の人工的表現は、残差学習を通じて生成することができる。この方法は、異常性の人工的表現と異常性の真の表現の間を弁別するべく、ディスクリミネータネットワークの敵対的ブランチをトレーニングするステップと、異常性の人工的表現と複数のビデオの第２サブセットのフレーム内に含まれている異常性の真の表現の間の差インジケータを生成するべく、ディスクリミネータネットワークの敵対的ブランチを複数の人工的表現に適用するステップと、第２の複数の異常性の検出を生成するべく、ディスクリミネータネットワークの知覚ブランチを人工的表現に適用するステップと、差インジケータ及び第２の複数の検出に基づいて知覚ブランチを再トレーニングするステップと、を更に有することができる。これらのステップは、少なくとも１つのプロセッサによって実行することができる。

【0021】

いくつかの実施形態において、異常性は、１つのタイプの細胞から別のタイプの細胞へのヒト組織における変化を有することができる。これに加えて、又はこの代わりに、異常性は、ヒト組織が予想されている場所からのヒト組織の欠如を有することもできる。これに加えて、又はこの代わりに、異常性は、ヒト組織上における形成又はヒト組織の形成を有することができる。

【0022】

【0023】

実施形態のいずれかにおいて、それぞれの人工的表現は、異常性の真の表現に非常に類似した異常性の偽の表現を提供することができる。

【0024】

実施形態のいずれかにおいて、生成器ネットワークは、敵対的生成ネットワークを有することができる。

【0025】

実施形態のいずれかにおいて、ディスクリミネータネットワークは、畳み込みニューラルネットワークを有することができる。

【0026】

一実施形態において、人間臓器の画像内において対象の特徴を検出するシステムは、命令を保存する少なくとも１つのメモリと、動作を実行するべく命令を実行するように構成された少なくとも１つのプロセッサと、を有することができる。動作は、人間臓器のビデオからフレームを選択するステップと、対象の特徴の少なくとも１つの検出を生成するべく、トレーニング済みのニューラルネットワークをフレームに適用するステップと、フレームの１つのもの上の少なくとも１つの検出の場所のインジケータを生成するステップと、フレームをビデオに再エンコーディングするステップと、インジケータと共に、再エンコーディングされたビデオを出力するステップと、を有することができる。ニューラルネットワークシステムは、上述の実施形態のいずれかに従ってトレーニングすることができる。

【0027】

本開示の更なる目的及び利点については、部分的には、以下の詳細な説明に記述されており、且つ、部分的には、その説明から明らかとなり、或いは、本開示の実施により、学習することができる。本開示の目的及び利点は、添付の請求項において具体的に指摘されている要素及び組合せを利用して実現及び達成されることになる。

【0028】

上述の一般的な説明及び以下の詳細な説明は、例示及び説明を目的としたものに過ぎず、且つ、開示されている実施形態を限定するものではない、ことを理解されたい。

【0029】

本明細書の一部分を構成する、添付の図面は、いくつかの実施形態を示しており、且つ、記述と共に、開示されている実施形態の原理及び特徴を説明するべく機能している。添付図面は、以下のとおりである。

【図面の簡単な説明】

【0030】

【図1】本開示の実施形態による、物体検出をビデオフィード上においてオーバーレイする例示用のコンピュータ実装されたシステムの概略表現である。

【図2】本開示の実施形態による、物体検出ネットワーク用の例示用の２フェーズトレーニングループである。

【図3】本開示の実施形態による、物体検出ネットワークをトレーニングする例示用の方法のフローチャートである。

【図4】本開示の実施形態による、ディスクリミネータネットワーク及び生成ネットワークを有する例示用の物体検出器の概略表現である。

【図5】本開示の実施形態による、ディスクリミネータネットワーク及び生成ネットワークを使用して対象の特徴を検出する例示用の方法のフローチャートである。

【図6】本開示の実施形態による、物体検出器ネットワークを使用するコンピュータ実装されたシステムの概略表現である。

【図7】本開示の実施形態による、物体検出器ネットワークを使用して物体インジケータをビデオフィード上においてオーバーレイする例示用の方法のフローチャートである。

【図8A】本開示の実施形態による、ビデオ内における物体検出用のオーバーレイを有する表示の一例である。

【図8B】本開示の実施形態による、ビデオ内における物体検出用のオーバーレイを有する表示の別の例である。

【図8C】本開示の実施形態による、ビデオ内における物体検出用のオーバーレイを有する表示の一例である。

【発明を実施するための形態】

【0031】

開示されている実施形態は、敵対的生成ネットワークをトレーニングする、且つ、これを使用する、コンピュータ実装されたシステム及び方法に関する。有利には、例示用の実装形態は、改善されたトレーニング済みのネットワークと、高速且つ効率的な物体検出と、を提供することができる。又、本開示の実施形態は、低減された偽陽性を伴う、医療画像分析用の改善された物体検出を提供することもできる。

【0032】

本開示の実施形態は、様々な用途及びビジョンシステムにおいて実装及び使用することができる。例えば、本開示の実施形態は、医療画像分析システム及び物体が真陽性又は偽陽性でありうる物体検出から受益するその他のタイプのシステムのために実装することができる。本開示の実施形態は、本明細書においては、医療画像分析及び内視鏡検査に対する一般的な参照を伴って記述されているが、実施形態は、胃鏡検査、結腸内視鏡検査、小腸内視鏡検査、並びに、食道内視鏡検査などの上部内視鏡検査などの、その他の医療画像手順に適用されうる、ことを理解されたい。更には、本開示の実施形態は、ＬＩＤＡＲ、偵察、オートパイロット、及びその他の撮像システム用の、或いは、これらを含む、ものなどの、その他の環境及びビジョンシステムに限定されるものではない。

【0033】

本開示の一態様によれば、対象の特徴の表現を含む画像を使用して敵対的生成ネットワークをトレーニングするための、コンピュータ実装されたシステムが提供されている。システムは、命令を保存するように構成された少なくとも１つのメモリと、命令を実行するように構成された少なくとも１つのプロセッサと、を含むことができる（例えば、図１及び図６を参照されたい）。少なくとも１つのプロセッサは、第１の複数の画像を提供することができる。例えば、少なくとも１つのプロセッサは、１つ又は複数のデータベースから第１の複数の画像を抽出することができる。これに加えて、又はこの代わりに、第１の複数の画像は、１つ又は複数のビデオから抽出された複数のフレームを有することもできる。

【0034】

本明細書において使用されている「画像」という用語は、シーン又は視野の任意のデジタル表現を意味している。デジタル表現は、ＪＰＥＧ（ＪｏｉｎｔＰｈｏｔｏｇｒａｐｈｉｃＥｘｐｅｒｔｓＧｒｏｕｐ）フォーマット、ＧＩＦ（ＧｒａｐｈｉｃＩｎｔｅｒｃｈａｎｇｅＦｏｒｍａｔ）、ビットマップフォーマット、ＳＶＧ（ＳｃａｌａｂｌｅＶｅｃｔｏｒＧｒａｐｈｉｃｓ）フォーマット、ＥＰＳ（ＥｎｃａｐｓｕｌａｔｅｄＰｏｓｔＳｃｒｉｐｔ）フォーマット、又はこれらに類似したものなどの、任意の適切なフォーマットにおいてエンコーディングすることができる。同様に、「ビデオ」という用語も、複数の連続的な画像から構成された、対象のシーン又はエリアの任意のデジタル表現を意味している。デジタル表現は、ＭＰＥＧ（ＭｏｖｉｎｇＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐ）フォーマット、フラッシュビデオフォーマット、ＡＶＩ（ＡｕｄｉｏＶｉｄｅｏＩｎｔｅｒｌｅａｖｅ）フォーマット、又はこれらに類似したものなどの、任意の適切なフォーマットにおいてエンコーディングすることができる。いくつかの実施形態において、一連の画像は、オーディオとペア化することができる。

【0035】

第１の複数の画像は、対象の特徴の表現（即ち、対象の異常性又は物体）と、第１の複数の画像の画像内の対象の特徴の場所のインジケータと、を含むことができる。例えば、対象の特徴は、ヒト組織上における異常性又はヒト組織の異常性を有することができる。いくつかの実施形態において、対象の特徴は、車両、人物、又はその他のエンティティなどの、物体を有することができる。

【0036】

本開示によれば、「異常性」は、ヒト組織上における形成又はヒト組織の形成、１つのタイプの細胞から別のタイプの細胞へのヒト組織における変化、並びに／或いは、ヒト組織が予想されている場所からのヒト組織の欠如を含むことができる。例えば、腫瘍又はその他の組織の成長は、異常性を有する場合があり、その理由は、予想されているものよりも多くの細胞が存在しているからである。同様に、細胞タイプにおける傷又はその他の変化は、異常性を有する場合があり、その理由は、血液細胞が、予想されている場所の外側（即ち、毛細血管の外側）の場所に存在しているからである。同様に、ヒト組織内における窪みも、異常性を有する場合があり、その理由は、細胞が、予想されている場所内に存在しておらず、その結果、窪みがもたらされているからである。

【0037】

いくつかの実施形態において、異常性は、病変を有することができる。病変は、胃腸粘膜の病変を有することができる。病変は、組織学的に（例えば、ウイーン分類に基づいて）分類されてもよく、形態学的に（例えば、パリ分類に基づいて）分類されてもよく、且つ／又は、構造的に（例えば、鋸歯形又は非鋸歯形として）分類されてもよい。パリ分類は、ポリープ状及び非ポリープ状病変を含む。ポリープ状病変は、突出した、有茎性の且つ突出した、或いは、無茎性の、病変を有することができる。非ポリープ状病変は、表面が盛り上がった、フラットな、表面が浅く窪んだ、或いは、掘り込まれた、病変を有することができる。

【0038】

検出された異常性との関連において、鋸歯状病変は、無茎性鋸歯状腺腫（ＳＳＡ）、従来の鋸歯状腺腫（ＴＳＡ）、過形成性ポリープ（ＨＰ）、線維芽細胞性ポリープ（ＦＰ）、又は混合型ポリープ（ＭＰ）を有することができる。ウイーン分類によれば、異常性は、（カテゴリ１）腫瘍形成／形成異常の陰性、（カテゴリ２）腫瘍形成／形成異常の不定、（カテゴリ３）非侵襲的な低レベル腫瘍形成（低レベルの腺腫／形成異常）、（カテゴリ４）高レベルの腺腫／形成異常、非侵襲的な癌腫（原位置癌腫）、或いは、侵襲的癌腫の疑いなどの、粘膜性高レベル腫瘍形成、並びに、（カテゴリ５）侵襲的な腫瘍形成、粘膜内癌、粘膜下癌、又はこれらに類似したもの、という、５つのカテゴリに分割されている。

【0039】

異常性又は対象の特徴の場所のインジケータは、ポイント（例えば、座標）又は領域（例えば、矩形、正方形、楕円、又は任意のその他の規則的又は不規則な形状）を有することができる。インジケータは、画像上における手動的な注釈付け又は画像の手動的な注釈付けを有することができる。いくつかの実施形態において、第１の複数の画像は、胃腸臓器又はその他の臓器或いはヒト組織のエリアの画像などの、医療画像を有することができる。画像は、内視鏡検査、胃鏡検査、結腸内視鏡検査、小腸内視鏡検査、或いは、食道内視鏡検査手順などの上部内視鏡検査の際に使用されるものなどの、医療撮像装置から生成することができる。このような実施形態において、対象の特徴が病変又はその他の異常性である場合に、医師又はその他の医療従事者は、画像内において異常性のインジケータを配置するべく、画像に注釈付けすることができる。

【0040】

システムの１つ又は複数のプロセッサは、対象の特徴を検出するために物体検出ネットワークをトレーニングするべく、第１の複数の画像及び対象の特徴のインジケータを使用することができる。例えば、物体検出ネットワークは、入力として画像を受け入れると共に対象の特徴の場所のインジケータを出力するように構成された１つ又は複数の層を有するニューラルネットワークを有することができる。いくつかの実施形態において、物体検出ネットワークは、畳み込みネットワークを有することができる。

【0041】

物体検出ネットワークのトレーニングは、ネットワークの１つ又は複数のノードの重みを調節するステップ及び／又はネットワークの１つ又は複数のノードの活性化（又は、伝達）関数を調節するステップを含むことができる。例えば、物体検出ネットワークの重みは、ネットワークと関連する損失関数を極小化するように調節することができる。いくつかの実施形態において、損失関数は、平方損失関数、ヒンジ損失関数、ロジスティック損失関数、クロスエントロピー損失関数、又は任意のその他の適切な損失関数、或いは、損失関数の組合せを有することができる。いくつかの実施形態において、物体検出ネットワークの活性化（又は、伝達）関数は、１つ又は複数のノードの１つ又は複数のモデルと１つ又は複数のノードに対する入力の間のフィットを改善するように、変更することができる。例えば、１つ又は複数のプロセッサは、１つ又は複数のノードと関連する多項式関数の指数を増大又は減少させてもよく、関連する関数を１つのタイプから別のものに変更してもよく（例えば、多項式から指数関数に、対数関数から多項式に、或いは、これらに類似したもの）、或いは、任意のその他の調節を１つ又は複数のノードの１つ又は複数のモデルに対して実行してもよい。

【0042】

１つ又は複数のシステムプロセッサは、対象の特徴の表現を含む、第２の複数の画像を更に提供することができる。例えば、１つ又は複数のプロセッサは、第１の複数の画像を保存したものと同一の１つ又は複数のデータベースであるのか又は１つ又は複数の異なるデータベースであるのかを問わず、１つ又は複数のデータベースから第１の複数の画像を抽出することができる。これに加えて、或いは、この代わりに、第２の複数の画像は、第１の複数の画像を抽出するべく使用された１つ又は複数の同一のビデオであるのか又は１つ又は複数の異なるビデオであるのかを問わず、１つ又は複数のビデオから抽出された複数のフレームを有することができる。

【0043】

いくつかの実施形態において、第２の複数の画像は、内視鏡検査装置からの画像などの、医療画像を有することができる。このような実施形態において、対象の特徴は、病変又はその他の異常性を有することができる。

【0044】

いくつかの実施形態において、第２の複数の画像は、第１の複数の画像内に含まれているものよりも多くの数の画像を有することができる。例えば、第２の複数の画像は、第１の複数の画像よりも、少なくとも百倍だけ、多くの画像を含むことができる。いくつかの実施形態において、第２の複数の画像は、少なくとも部分的に、第１の複数のものを含んでいてもよく、或いは、第１の複数のものとは異なる画像であってもよい。第２の複数の画像が、少なくとも部分的に、第１の複数の画像の少なくとも一部分が抽出された１つ又は複数のビデオから抽出されている、実施形態において、第２の複数の画像は、１つ又は複数の同一のビデオからの第１の複数のものとは異なるフレームを有することができる。

【0045】

１つ又は複数のプロセッサは、対象の特徴の第１の複数の検出を生成するべく、トレーニング済みの物体検出ネットワークを第２の複数の画像に適用することができる。例えば、トレーニング済みの物体検出ネットワークがニューラルネットワークを有する実施形態において、少なくとも１つのプロセッサは、第２の複数の画像をネットワークに入力することができると共に、検出を受け取ることができる。検出は、第２の複数の画像内の対象の特徴の場所のインジケータを有することができる。第２の複数の画像が対象の特徴を含んでいない場合には、インジケータは、ヌルインジケータ又は対象の特徴が存在していないという旨のその他のインジケータを有することができる。

【0046】

１つ又は複数のプロセッサは、第１の複数の検出との関係における真陽性及び偽陽性の手動的に設定された検証を更に提供することができる。例えば、検証は、１つ又は複数のデータベースから抽出されてもよく、或いは、入力として受け取られてもよい。対象の特徴が病変又はその他の異常性を有する実施形態において、検証は、医師又はその他の医療従事者によって入力されてもよい。例えば、１つ又は複数のプロセッサは、表示のために、医師又はその他の医療従事者に検出を出力することができると共に、表示された検出に応答して検証を受け取ることができる。

【0047】

１つ又は複数のシステムプロセッサは、敵対的生成ネットワークをトレーニングするべく、第１の複数の検出との関係における真陽性及び偽陽性の検証を使用することができる。例えば、ネットワークの生成ブランチは、対象の特徴の人工的表現を生成するべく、トレーニングすることができる。従って、生成ブランチは、畳み込みニューラルネットワークを有することができる。

【0048】

物体検出ネットワークと同様に、生成ブランチのトレーニングは、ネットワークの１つ又は複数のノードの重みを調節するステップ及び／又はネットワークの１つ又は複数のノードの活性化（又は、伝達）関数を調節するステップを含むことができる。例えば、上述のように、生成ブランチの重みは、ネットワークと関連する損失関数を極小化するように、調節することができる。これに加えて、又はこの代わりに、生成ブランチの活性化（又は、伝達）関数は、１つ又は複数のノードの１つ又は複数のモデルと１つ又は複数のノードに対する入力間のフィットを改善するように、変更することができる。

【0049】

更には、ネットワークの敵対的ブランチは、手動的な検証に基づいて真陽性から偽陽性を弁別するべく、トレーニングすることができる。例えば、敵対的ブランチは、入力として画像及び１つ又は複数の対応する検出を受け取ると共に出力として検証を生成するニューラルネットワークを有することができる。いくつかの実施形態において、１つ又は複数のプロセッサは、２つ以上の画像内における対象の特徴の見逃された検出についての偽陰性の検証を提供することにより、生成ネットワークを更に再トレーニングすることができる。敵対的ブランチへの入力として生成ブランチからの人工的表現を提供すると共に敵対的ブランチからの出力を再帰的に使用することにより、敵対的ブランチ及び生成ブランチは、教師なし学習を実行することができる。

【0050】

生成ブランチと同様に、敵対的ブランチのトレーニングは、ネットワークの１つ又は複数のノードの重みを調節するステップ及び／又はネットワークの１つ又は複数のノードの活性化（又は、伝達）関数を調節するステップを含むことができる。例えば、上述のように、敵対的ブランチの重みは、ネットワークと関連する損失関数を極小化するように、調節することができる。これに加えて、又はこの代わりに、敵対的ブランチの活性化（又は、伝達）関数は、１つ又は複数のノードの１つ又は複数のモデルと１つ又は複数のノードに対する入力の間のフィットを改善するように、変更することができる。

【0051】

従って、対象の特徴が病変又はその他の異常性を有する実施形態において、生成ブランチは、異常性と同様に見える非異常性の表現を生成するべく、トレーニングすることができると共に、敵対的ブランチは、第２の複数の画像内の異常性から人工的な非異常性を弁別するべく、トレーニングすることができる。

【0052】

１つ又は複数のシステムプロセッサは、対象の特徴の更なる検出との関係における真陽性及び偽陽性の更なる手動的に設定された検証と共に、画像の少なくとも１つの更なる組及び対象の特徴の検出を使用することにより、敵対的生成ネットワークを再トレーニングすることができる。例えば、１つ又は複数のプロセッサは、第１の複数の画像及び／又は第２の複数の画像を保存したものと同一の１つ又は複数のデータベースであるのか又は１つ又は複数の異なるデータベースであるのかを問わず、１つ又は複数のデータベースから画像の更なる組を抽出することができる。これに加えて、又はこの代わりに、画像の更なる組は、第１の複数の画像及び／又は第２の複数の画像を抽出するべく使用されたものと同一の１つ又は複数のビデオであるのか又は１つ又は複数の異なるビデオであるのかを問わず、１つ又は複数のビデオから抽出された複数のフレームを有することができる。トレーニングと同様に、敵対的ブランチの再トレーニングは、ネットワークの１つ又は複数のノードの重みに対する更なる調節及び／又はネットワークの１つ又は複数のノードの活性化（或いは、伝達）関数に対する更なる調節を含むことができる。

【0053】

本開示の別の態様によれば、人間臓器の画像内の異常性を検出するためにニューラルネットワークシステムをトレーニングするべく、コンピュータ実装された方法が提供されている。方法は、少なくとも１つのプロセッサ（例えば、図６のプロセッサ６０７を参照されたい）により、実装することができる。

【0054】

例示用の方法によれば、１つ又は複数のプロセッサは、データベース内において、異常性の表現を含む複数のビデオを保存することができる。例えば、ビデオは、内視鏡検査ビデオを有することができる。ビデオは、ＭＰＥＧ（ＭｏｖｉｎｇＰｉｃｔｕｒｅＥｘｐｅｒｓＧｏｕｐ）フォーマット、フラッシュビデオフォーマット、ＡＶＩ（ＡｕｄｉｏＶｉｄｅｏＩｎｔｅｒｌｅａｖｅ）フォーマット、又はこれらに類似したものなどの、１つ又は複数のフォーマットにおいてエンコーディングすることができる。

【0055】

方法は、１つ又は複数のプロセッサにより、複数のビデオの第１サブセットを選択するステップを更に含むことができる。例えば、１つ又は複数のプロセッサは、第１サブセットをランダムに選択することができる。或いは、この代わりに、１つ又は複数のプロセッサは、第１サブセットを選択するべく、データベースの１つ又は複数のインデックスを使用することができる。例えば、１つ又は複数のプロセッサは、異常性の表現を含むものとしてインデックス付けされたビデオとして第１サブセットを選択することができる。

【0056】

方法は、１つ又は複数のプロセッサにより、第１の複数の異常性の検出を生成するべく、物体検出ネットワークの知覚ブランチを複数のビデオの第１サブセットのフレームに適用するステップを更に含むことができる。例えば、物体検出ネットワークは、入力として画像を受け付けると共に第１の複数の検出を出力するようにトレーニングされたニューラルネットワークを有することができる。第１の複数の検出は、検出された異常性のポイント又は領域などの、フレーム内の異常性の場所のインジケータを有することができる。異常性の欠如は、ヌルインジケータ又は非異常性のその他のインジケータを結果的にもたらしうる。知覚ブランチは、異常性を検出すると共に任意の検出された異常性の場所のインジケータを出力するように構成されたニューラルネットワーク（例えば、畳み込みニューラルネットワーク）を有することができる。

【0057】

方法は、１つ又は複数のプロセッサにより、複数のビデオの第２サブセットを選択するステップを更に含むことができる。いくつかの実施形態において、第２サブセットは、少なくとも部分的に、第１サブセットを含んでいてもよく、或いは、第１サブセットとは異なるビデオであってもよい。

【0058】

方法は、異常性の複数の人工的表現を生成するために、生成器ネットワークをトレーニングするべく、第１の複数の検出及び複数のビデオの第２サブセットからのフレームを使用するステップを更に含むことができる。例えば、生成器ネットワークは、人工的表現を生成するように構成されたニューラルネットワークを有することができる。いくつかの実施形態において、生成器ネットワークは、畳み込みニューラルネットワークを有することができる。複数の人工的表現は、残差学習を通じて生成することができる。

【0059】

上述のように、生成ネットワークのトレーニングは、ネットワークの１つ又は複数のノードの重みを調節するステップ及び／又はネットワークの１つ又は複数のノードの活性化（又は、伝達）関数を調節するステップを含むことができる。例えば、上述のように、生成ネットワークの重みは、ネットワークと関連する損失関数を極小化するように、調節することができる。これに加えて、又はこの代わりに、生成ネットワークの活性化（又は、伝達）関数は、１つ又は複数のノードの１つ又は複数のモデルと１つ又は複数のノードに対する入力の間のフィットを改善するように、変更することもできる。

【0060】

方法は、１つ又は複数のプロセッサにより、異常性の人工的表現と異常性の真の表現の間を弁別するべく、ディスクリミネータの敵対的ブランチをトレーニングするステップを更に含むことができる。例えば、敵対的ブランチは、入力として表現を受け取ると共に入力表現が人工的なものであるのか又は真であるのかの通知を出力するニューラルネットワークを有することができる。いくつかの実施形態において、ニューラルネットワークは、畳み込みニューラルネットワークを有することができる。

【0061】

生成ブランチと同様に、ディスクリミネータネットワークの敵対的ブランチのトレーニングは、ネットワークの１つ又は複数ノードの重みを調節するステップ及び／又はネットワークの１つ又は複数のノードの活性化（又は、伝達）関数を調節するステップを含むことができる。例えば、上述のように、ディスクリミネータネットワークの敵対的ブランチの重みは、ネットワークと関連する損失関数を極小化するように、調節することができる。これに加えて、又はこの代わりに、ディスクリミネータネットワークの敵対的ブランチの活性化（又は、伝達）関数は、１つ又は複数のノードの１つ又は複数のモデルと１つ又は複数のノードに対する入力の間のフィットを改善するように、変更することができる。

【0062】

方法は、１つ又は複数のプロセッサにより、異常性の人工的表現と複数のビデオの第２サブセットのフレーム内に含まれている異常性の真の表現の間の差インジケータを生成するべく、ディスクリミネータネットワークの敵対的ブランチを複数の人工的表現に適用するステップを更に含むことができる。例えば、人工的表現は、異常性と同様に見える非異常性の表現を有することができる。従って、それぞれの人工的表現は、異常性の真の表現に非常に類似した異常性の偽の表現を提供することができる。敵対的ブランチは、非異常性（偽の表現）と異常性（真の表現）の間の差、特に、異常性に類似した非異常性、を識別するべく、学習することができる。

【0063】

方法は、１つ又は複数のプロセッサにより、第２の複数の異常性の検出を生成するべく、ディスクリミネータネットワークの知覚ブランチを人工的な表現に適用するステップを更に含むことができる。第１の複数の検出と同様に、第２の複数の検出は、検出された異常性のポイント又は領域などの、人工的表現における異常性の場所のインジケータを有することができる。異常性の欠如は、ヌルインジケータ又は非異常性のその他のインジケータを結果的にもたらしうる。

【0064】

方法は、差インジケータ及び第２の複数の検出に基づいて知覚ブランチを再トレーニングするステップを更に含むことができる。例えば、知覚ブランチの再トレーニングは、ネットワークの１つ又は複数のノードの重みを調節するステップ及び／又はネットワークの１つ又は複数のノードの活性化（又は、伝達）関数を調節するステップを含むことができる。例えば、上述のように、知覚ブランチの重みは、ネットワークと関連する損失関数を極小化するように、調節することができる。これに加えて、又はこの代わりに、知覚ブランチの活性化（又は、伝達）関数は、１つ又は複数のノードの１つ又は複数のモデルと差インジケータ及び第２の複数の検出の間のフィットを改善するように、変更することができる。

【0065】

上述のトレーニングの例示用の方法は、トレーニング済みのニューラルネットワークシステムを生成することができる。トレーニング済みのニューラルネットワークシステムは、人間臓器の画像内において対象の特徴を検出するべく使用されるシステムの一部分を形成することができる（例えば、ニューラルネットワークシステムは、図１のオーバーレイ装置１０５の一部分として実装することができる）。例えば、このようなシステムは、命令を保存するように構成された少なくとも１つのメモリと、命令を実行するように構成された少なくとも１つのプロセッサと、を含むことができる。少なくとも１つのプロセッサは、人間臓器のビデオからフレームを選択することができる。例えば、ビデオは、内視鏡検査ビデオを有することができる。

【0066】

１つ又は複数のシステムプロセッサは、対象の特徴の少なくとも１つの検出を生成するべく、トレーニング済みのニューラルネットワークシステムをフレームに適用することができる。いくつかの実施形態において、対象の特徴は、異常性を有することができる。少なくとも１つの検出は、対象の特徴の場所のインジケータを含むことができる。例えば、場所は、検出された対象の特徴のポイント又はこれを含む領域を有することができる。ニューラルネットワークシステムは、上述のように、異常性を検出するようにトレーニング済みであってよい。

【0067】

いくつかの実施形態において、１つ又は複数のプロセッサは、１つ又は複数の更なるクラシファイア及び／又はニューラルネットワークを検出された対象の特徴に更に適用することができる。例えば、対象の特徴が病変を有する場合に、少なくとも１つのプロセッサは、病変を１つ又は複数のタイプに分類することができる（例えば、癌性又は非癌性、或いは、これらに類似したもの）。これに加えて、又はこの代わりに、ニューラルネットワークシステムは、検出された対象の特徴が偽陽性であるのか又は真陽性であるのかを更に出力することができる。

【0068】

１つ又は複数のシステムプロセッサは、フレームの１つ上における少なくとも１つの検出の場所のインジケータを生成することができる。例えば、対象の特徴の場所は、フレーム上において配置された場所のインジケータ及びグラフィカルインジケータから抽出することができる。場所がポイントを有する実施形態において、グラフィカルインジケータは、ポイント上において配置された円、星、又は任意のその他の形状を有することができる。場所が領域を有する実施形態において、グラフィカルインジケータは、領域の周りの境界を有することができる。いくつかの実施形態において、形状又は境界は、アニメーション化されてもよく、従って、形状又は境界は、フレームに跨って対象の特徴の場所を追跡するように、のみならず、フレームが順番に示された際に、アニメーション化された状態において現れるように、複数のフレームについて生成することができる。更に後述するように、グラフィカルインジケータは、サウンド及び／又は振動インジケータなどの、その他のインジケータとペア化することができる。

【0069】

インジケータの任意の態様は、例えば、１つ又は複数のタイプとしての、或いは、偽又は真陽性としての、などのような、対象の特徴の分類に依存しうる。従って、グラフィカルインジケータの色、形状、パターン、又はその他の態様は、分類に依存しうる。又、サウンド及び／又は振動インジケータを使用している実施形態において、サウンド及び／又は振動の持続時間、周波数、及び／又は振幅は、分類に依存しうる。

【0070】

１つ又は複数のシステムプロセッサは、フレームをビデオとして再エンコーディングすることができる。従って、（グラフィック）インジケータを生成し、且つ、これを１つ又は複数のフレーム上においてオーバーレイした後に、フレームをビデオとして再度組み立てることができる。従って、システムの１つ又は複数のプロセッサは、インジケータと共に、再エンコーディングされたビデオを出力することができる。

【0071】

本開示の別の態様に従って、リアルタイムビデオを処理するコンピュータ実装されたシステム（例えば、図１及び図６を参照されたい）について説明する。システムは、リアルタイムビデオ用の入力ポートを有することができる。例えば、入力ポートは、ビデオグラフィクスアレイ（ＶＧＡ）ポート、高精細マルチメディアインターフェイス（ＨＤＭＩ（登録商標））ポート、デジタルビジュアルインターフェイス（ＤＶＩ）ポート、シリアルデジタルインターフェイス（ＳＤＩ）、或いは、これらに類似したものを有することができる。リアルタイムビデオは、医療ビデオを有することができる。例えば、システムは、内視鏡検査装置からリアルタイムビデオを受け取ることができる。

【0072】

システムは、受け取られたリアルタイムビデオを伝達するための第１バスを更に有することができる。例えば、第１バスは、並列接続又は直列接続を有することができると共に、マルチドロップトポロジー又はデイジーチェーントポロジーにおいて配線することができる。第１バスは、ＰＩＣＥｘｐｒｅｓｓ（ＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔＥｘｐｒｅｓｓ）バス、ユニバーサルシリアルバス（ＵＳＢ）、ＩＥＥＥ１３９４インターフェイス（ＦｉｒｅＷｉｒｅ（登録商標））、又はこれらに類似したものを有することができる。

【0073】

システムは、第１バスからリアルタイムビデオを受け取り、受け取られたリアルタイムビデオのフレーム上において物体検出を実行し、且つ、フレーム内の少なくとも１つの検出された物体の場所を通知する境界をオーバーレイする、ように構成された少なくとも１つのプロセッサを有することができる。１つ又は複数のプロセッサは、物体の少なくとも１つの検出を生成するようにトレーニングされたニューラルネットワークシステムを使用することにより、物体検出を実行することができる。いくつかの実施形態において、少なくとも１つの物体は、病変又はその他の異常性を有することができる。従って、ニューラルネットワークシステムは、上述のように、異常性を検出するようにトレーニング済みであってよい。

【0074】

１つ又は複数のプロセッサは、上述のように、境界をオーバーレイすることができる。例えば、境界は、物体を含む領域を取り囲んでいてもよく、この場合に、領域は、１つ又は複数のプロセッサにより、少なくとも１つの検出と共に、受け取れられている。

【0075】

システムは、オーバーレイされた境界と共に、ビデオを受け取るべく、第２バスを更に有することができる。例えば、第１バスと同様に、第２バスは、並列接続又は直列接続を有することができると共に、マルチドロップトポロジー又はデイジーチェーントポロジーにおいて配線することができる。従って、第１バスと同様に、第２バスは、ＰＣＩＥｘｐｒｅｓｓ（ＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔＥｘｐｒｅｓｓ）バス、ユニバーサルシリアルバス（ＵＳＢ）、ＩＥＥＥ１３９４インターフェイス（ＦｉｒｅＷｉｒｅ（登録商標））、又はこれらに類似したものを有することができる。第２バスは、第１バスと同一のタイプのバスを有していてもよく、或いは、異なるタイプのバスを有していてもよい。

【0076】

システムは、第２バスから外部ディスプレイに、オーバーレイされた境界と共にビデオを出力するべく、出力ポートを更に有することができる。出力ポートは、ＶＧＡポート、ＨＤＭＩ（登録商標）ポート、ＤＶＩポート、ＳＤＩポート、又はこれらに類似したものを有することができる。従って、出力ポートは、入力ポートと同一のタイプのポートであってもよく、或いは、異なるタイプのポートであってもよい。

【0077】

システムは、受け取られたリアルタイムビデオを出力ポートに直接的に送信するべく、第３バスを有することができる。第３バスは、全体システムがターンオフされた際にも、有効になるように、入力ポートから出力ポートにリアルタイムビデオを受動的に搬送することができる。いくつかの実施形態において、第３バスは、全体システムがオフ状態にある際に、有効である、既定のバスであってよい。このような実施形態において、第１及び第２バスは、全体システムが起動された際に、起動されてもよく、且つ、第３バスは、従って、停止されてもよい。第３バスは、全体システムがターンオフされた際に、或いは、１つ又は複数のプロセッサからのエラー信号の受信の際に、起動されてもよい。例えば、プロセッサによって実装された物体検出が誤動作した場合に、１つ又は複数のプロセッサは、第３バスを起動し、これにより、誤動作に起因した中断を伴うことなしに、リアルタイムビデオストリームの継続した出力を許容することができる。

【0078】

いくつかの実施形態において、オーバーレイされた境界は、フレームに跨って変更することができる。例えば、オーバーレイされた境界は、少なくとも１つの検出された物体を含む画像の領域の周りにおいて表示された２次元形状を有していてもよく、この場合に、境界は、第１色である。所定の時間が経過した後に、１つ又は複数のプロセッサは、少なくとも１つの検出された物体が真陽性である場合には、境界を第２色に変更することができると共に、少なくとも１つの検出された物体が偽陽性である場合には、第３色に変更することができる。これに加えて、又はこの代わりに、１つ又は複数のプロセッサは、検出された物体の分類に基づいて境界を変更することもできる。例えば、物体が病変又はその他の異常性を有する場合に、変更は、病変又は形成が癌性であるのか又はその他の方式による異常性であるのかに基づいたものであってもよい。

【0079】

上述の実施形態のいずれかにおいて、オーバーレイされたインジケータは、１つ又は複数の更なるインジケータとペア化することができる。例えば、１つ又は複数のプロセッサは、少なくとも１つの物体が検出された際に、サウンドを生成するべく、コマンドを１つ又は複数のスピーカに送信することができる。境界が変更される実施形態において、１つ又は複数のプロセッサは、境界が変更された際に、コマンドを送信することができる。このような実施形態において、サウンドの持続時間、トーン、周波数、及び振幅の少なくとも１つは、少なくとも１つの検出された物体が真陽性であるのか又は偽陽性であるのかに依存しうる。これに加えて、又はこの代わりに、サウンドの持続時間、トーン、周波数、及び振幅の少なくとも１つは、検出された物体の分類にも依存しうる。

【0080】

これに加えて、又はこの代わりに、１つ又は複数のプロセッサは、少なくとも１つの物体が検出された際に、振動するべく、コマンドを少なくとも１つのウェアラブル装置に送信することができる。境界が変更される実施形態において、１つ又は複数のプロセッサは、境界が変更された際に、コマンドを送信することができる。このような実施形態において、振動の持続時間、周波数、及び振幅の少なくとも１つは、少なくとも１つの検出された物体が真陽性であるのか又は偽陽性であるのかに依存しうる。これに加えて、又はこの代わりに、振動の持続時間、周波数、及び振幅の少なくとも１つは、検出された物体の分類にも依存しうる。

【0081】

本開示の別の態様に従って、リアルタイムビデオを処理するシステムについて説明する。上述の処理システムと同様に、システムは、リアルタイムビデオを受け取る入力ポートと、入力ポートからリアルタイムビデオを受け取り、トレーニング済みのニューラルネットワークを受け取られたリアルタイムビデオのフレームに適用することにより、物体検出を実行し、且つ、フレーム内において少なくとも１つの検出された物体の場所を通知する境界をオーバーレイするように構成された少なくとも１つのプロセッサと、オーバーレイされた境界と共に、ビデオをプロセッサから外部ディスプレイに出力する出力ポートと、を有することができる。

【0082】

システムは、ユーザーから感度設定を受け取る入力装置を更に有することができる。例えば、入力装置は、設定を増大させるための１つのコマンド及び設定を減少させるための別のコマンドを受け取るのに適した、ノブ、１つ又は複数のボタン、又は任意のその他の装置を有することができる。

【0083】

１つ又は複数のシステムプロセッサは、感度設定に応答して、トレーニング済みのニューラルネットワークの少なくとも１つのパラメータを調節することができる。例えば、１つ又は複数のプロセッサは、感度設定に基づいて、ネットワークによって生成される検出の数を増大させる又は減少させるべく、ネットワークの１つ又は複数のノードの１つ又は複数の重みを調節することができる。これに加えて、又はこの代わりに、ネットワークの出力層の、且つ／又は、ネットワークの出力層から受け取られた検出に適用される、１つ又は複数の閾値を感度設定に応答して増大又は減少させることができる。従って、感度設定が増大された場合には、１つ又は複数のプロセッサは、ネットワークによって生成される検出の数を増大させるように、１つ又は複数の閾値を減少させることができる。同様に、感度設定が減少された場合には、１つ又は複数のプロセッサは、ネットワークによって生成される検出の数を減少させるように、１つ又は複数の閾値を増大させることができる。

【0084】

図１は、本開示の実施形態と一貫性を有する、ビデオフィード上において物体検出をオーバーレイするパイプラインを含む例示用のシステム１００の概略表現である。図１の例において示されているように、システム１００は、画像装置１０３を制御する操作者１０１を含む。ビデオフィードが医療ビデオを有する実施形態において、操作者１０１は、医師又はその他の医療従事者を有することができる。画像装置１０３は、Ｘ線装置、コンピュータ断層撮影（ＣＴ）装置、磁気共鳴撮像（ＭＲＩ）装置、内視鏡検査装置、或いは、人体又はその一部分のビデオ又は１つ又は複数の画像を生成する、その他の医療撮像装置などの、医療撮像装置を有することができる。操作者１０１は、例えば、人体を通じた又はこれとの関係における、装置１０３のキャプチャレート及び／又は装置１０３の運動を制御することにより、画像装置１０３を制御することができる。いくつかの実施形態において、画像装置１０３は、Ｘ線装置、或いは、内視鏡検査装置などの人体の空洞を通じて挿入された撮像装置などの、外部撮像装置の代わりに、Ｐｉｌｌ－Ｃａｍ（商標）装置又はその他の形態のカプセル内視鏡検査装置を有することができる。

【0085】

図１に更に描かれているように、画像装置１０３は、キャプチャされたビデオ又は画像をオーバーレイ装置１０５に送信することができる。オーバーレイ装置１０５は、上述のように、ビデオを処理するべく、１つ又は複数のプロセッサを有することができる。又、いくつかの実施形態において、操作者１０１は、例えば、オーバーレイ装置１０５の物体検出器（図示されてはいない）の感度を制御することにより、画像装置１０３に加えて、オーバーレイ装置１０５を制御することもできる。

【0086】

図１に描かれているように、オーバーレイ装置１０５は、画像装置１０３から受け取れたビデオを拡張することができると共に、次いで、拡張されたビデオをディスプレイ１０７に送信することができる。いくつかの実施形態において、拡張は、上述のオーバーレイ化を有することができる。又、図１に更に描かれているように、オーバーレイ装置１０５は、画像装置１０３からのビデオを直接的にディスプレイ１０７に中継するように構成することもできる。例えば、オーバーレイ装置１０５は、オーバーレイ装置１０５内に含まれている物体検出器（図示されてはいない）が誤動作した場合などの、既定の状態下において直接的な中継を実行することができる。これに加えて、又はこの代わりに、オーバーレイ装置１０５は、操作者１０１が直接的な中継を実行するようにコマンドをオーバーレイ装置１０５に入力した場合に、直接的な中継を実行することができる。コマンドは、オーバーレイ装置１０５上において含まれている１つ又は複数のボタンを介して、且つ／又は、キーボード又はこれに類似したものなどの入力装置を通じて、受け取ることができる。

【0087】

図２は、本開示の実施形態と一貫性を有する、物体検出ネットワーク用の２フェーズトレーニングループ２００の概略表現である。ループ２００は、１つ又は複数のプロセッサによって実装することができる。図２に示されているように、ループ２００のフェーズＩは、対象の特徴を含む画像のデータベース２０１を使用することができる。画像が医療画像を有する実施形態において、対象の特徴は、病変などの異常性を含むことができる。

【0088】

上述のように、データベース２０１は、個々の画像及び／又は１つ又は複数のビデオを保存していてもよく、この場合に、それぞれのビデオは、複数のフレームを含む。ループ２００のフェーズＩにおいて、１つ又は複数のプロセッサは、データベース２０１から画像及び／又はフレームのサブセット２０３を抽出することができる。１つ又は複数のプロセッサは、ランダムに、或いは、少なくとも部分的に、１つ又は複数のパターンを使用することにより、サブセット２０３を選択することができる。例えば、データベース２０１がビデオを保存している場合に、１つ又は複数のプロセッサは、サブセット２０３内に含まれているそれぞれのビデオから、１つ、２つ、又は類似の数以下のフレームを選択することができる。

【0089】

図２に更に描かれているように、特徴インジケータ２０５は、サブセット２０３に対する注釈を有することができる。例えば、注釈は、対象の特徴のポイント又はこれを含む領域を含みうる。いくつかの実施形態において、操作者は、ビデオ又は画像を観察することができると共に、入力装置（例えば、キーボード、マウス、タッチスクリーン、及びディスプレイの任意の組合せ）を介して、１つ又は複数のプロセッサに注釈を手動的に入力することができる。注釈は、ＪＳＯＮ、ＸＭＬ、テキスト、又はこれらに類似したものなどのフォーマットにおいて、画像とは別個のデータ構造として保存することができる。例えば、画像が医療画像である実施形態において、操作者は、医師又はその他の医療従事者であってよい。抽出の後に、サブセット２０３に追加されるものとして描かれているが、サブセット２０３には、データベース２０１内における保存の前に、或いは、別の以前の時点において、注釈付け済みであってもよい。このような実施形態において、１つ又は複数のプロセッサは、特徴インジケータ２０５を有するデータベース２０１内において画像を選択することにより、サブセット２０３を選択することができる。

【0090】

サブセット２０３は、特徴インジケータ２０５と共に、トレーニングセット２０７を有する。１つ又は複数のプロセッサは、トレーニングセット２０７を使用することにより、ディスクリミネータネットワーク２０９をトレーニングすることができる。例えば、ディスクリミネータネットワーク２０９は、上述のように、物体検出ネットワークを有することができる。更に上述したように、ディスクリミネータネットワークのトレーニングは、ネットワークの１つ又は複数のノードの重みを調節するステップ及び／又はネットワークの１つ又は複数のノードの活性化（又は、伝達）関数を調節するステップを含むことができる。例えば、物体検出ネットワークの重みは、ネットワークと関連する損失関数を極小化するように調節することができる。別の例において、物体検出ネットワークの活性化（又は、伝達）関数は、１つ又は複数のノードの１つ又は複数のモデルと１つ又は複数のノードに対する入力の間のフィットを改善するように変更することができる。

【0091】

図２に示されているように、ループ２００のフェーズＩＩにおいて、１つ又は複数のプロセッサは、データベース２０１から画像（及び／又は、フレーム）のサブセット２１１を抽出することができる。サブセット２１１は、少なくとも部分的に、サブセット２０３からの画像のいくつか又はすべてを有していてもよく、或いは、異なるサブセットを有していてもよい。サブセット２０３が１つ又は複数のビデオからの複数のフレームを有する実施形態において、サブセット２１１は、同一のビデオの１つ又は複数からの隣接した又はその他のフレームを含みうる。サブセット２１１は、例えば、少なくとも１００倍だけ、多い数の画像などの、サブセット２０３よりも多くの数の画像を有することができる。

【0092】

１つ又は複数のプロセッサは、複数の特徴インジケータ２１３を生成するべく、ディスクリミネータネットワーク２０９’（フェーズＩのトレーニングが完了した後のディスクリミネータネットワーク２０９を表している）をサブセット２１１に適用することができる。例えば、特徴インジケータ２１３は、ディスクリミネータネットワーク２０９’によって検出された対象の特徴のポイント又はこれを含む領域を有することができる。

【0093】

図２に更に描かれているように、検証２１５は、特徴インジケータ２１３に対する注釈を有することができる。例えば、注釈は、それぞれの特徴インジケータが真陽性であるのか又は偽陽性であるのかのインジケータを含むことができる。検出された対象の特徴を有していなかったが、対象の特徴を含んでいる、画像は、偽陰性として注釈付けすることができる。

【0094】

サブセット２１１は、特徴インジケータ２１３及び検証２１５と共に、トレーニングセット２１７を有する。１つ又は複数のプロセッサは、トレーニングセット２１７を使用することにより、敵対的生成ネットワーク２１９をトレーニングすることができる。例えば、敵対的生成ネットワーク２１９は、上述のように、生成ネットワーク及び敵対的ネットワークを有することができる。敵対的生成ネットワークのトレーニングは、対象の特徴の、或いは、真の対象の特徴に類似して見える偽の対象の特徴の、人工的表現を生成するべく、生成ネットワークをトレーニングするステップと、例えば、サブセット２１１内に含まれているものなどの、実際の表現から人工的表現を弁別するべく、敵対的ネットワークをトレーニングするステップと、を含むことができる。

【0095】

図２には描かれていないが、検証２１５は、ディスクリミネータネットワーク２０９’を再トレーニングするべく、更に使用することができる。例えば、ディスクリミネータネットワーク２０９’の重み及び／又は活性化（又は、伝達）関数は、偽陽性として注釈付けされた画像内の検出を除去するように調節することができると共に／又は、偽陰性として注釈付けされた画像内の検出を生成するように調節することもできる。

【0096】

図３は、物体検出ネットワークをトレーニングする例示用の方法３００のフローチャートである。方法３００は、１つ又は複数のプロセッサによって実行することができる。図３のステップ３０１において、少なくとも１つのプロセッサは、対象の特徴の表現を含む第１の複数の画像と、第１の複数の画像のうちの画像内の対象の特徴の場所のインジケータと、を提供することができる。インジケータは、手動的に設定されたインジケータを有することができる。手動的に設定されたインジケータは、データベースから抽出されてもよく、或いは、操作者から入力として受け取られてもよい。

【0097】

ステップ３０３において、少なくとも１つのプロセッサは、第１の複数の画像及び対象の特徴のインジケータを使用することにより、対象の特徴を検出するべく、物体検出ネットワークをトレーニングすることができる。例えば、物体検出ネットワークは、上述のように、トレーニングすることができる。

【0098】

ステップ３０５において、少なくとも１つのプロセッサは、対象の特徴の表現を含む、第２の複数の画像を提供してもよく、この場合に、第２の複数の画像は、第１の複数の画像内に含まれているものよりも多い数の画像を有する。いくつかの実施形態において、第２の複数の画像は、少なくとも部分的に、第１の複数の画像とオーバーラップすることができる。或いは、この代わりに、第２の複数の画像は、第１の複数のもの内のものとは異なる画像から構成することもできる。

【0099】

ステップ３０７において、少なくとも１つのプロセッサは、対象の特徴の第１の複数の検出を生成するべく、トレーニング済みの物体検出ネットワークを第２の複数の画像に適用することができる。いくつかの実施形態において、上述のように、検出は、検出された対象の特徴の場所のインジケータを含むことができる。例えば、物体検出ネットワークは、任意選択により、それぞれの検出ごとの１つ又は複数の関連するコンフィデンススコアと共に、それぞれのマトリックスが、任意の検出された対象の特徴の座標及び／又は領域を定義している、１つ又は複数のマトリックスを出力する畳み込みニューラルネットワークを有することができる。

【0100】

ステップ３０９において、少なくとも１つのプロセッサは、第１の複数の検出との関係における真陽性及び偽陽性の手動的に設定された検証を提供することができる。例えば、少なくとも１つのプロセッサは、手動的に設定された検証をデータベースから抽出してもよく、或いは、操作者から入力として、これらを受け取ってもよい。

【0101】

ステップ３１１において、少なくとも１つのプロセッサは、第１の複数の検出との関係における真陽性及び偽陽性の検証を使用することにより、敵対的生成ネットワークをトレーニングすることができる。例えば、敵対的生成ネットワークは、上述のようにトレーニングすることができる。

【0102】

ステップ３１３において、少なくとも１つのプロセッサは、対象の特徴の更なる検出との関係における真陽性及び偽陽性の更なる手動的に設定された検証と共に、少なくとも１つの画像の更なる組及び対象の特徴の検出を使用することにより、敵対的生成ネットワークを再トレーニングすることができる。いくつかの実施形態において、画像の更なるセットは、少なくとも部分的に、第１の複数の画像及び／又は第２の複数の画像とオーバーラップすることができる。或いは、この代わりに、画像の更なる組は、第１の複数のもの内のもの及び第２の複数のもの内のものとは異なる画像から構成されていてもよい。従って、ステップ３１３は、対象の特徴の更なる検出を生成するべく、トレーニング済みの物体検出ネットワークを画像の更なる組に適用するステップと、更なる検出との関係における真陽性及び偽陽性の手動的に設定された検出を提供するステップと、更なる検出との関係における検証を使用して敵対的生成ネットワークを再トレーニングするステップと、を有することができる。

【0103】

本開示と一貫性を有する状態において、例示用の方法３００は、更なるステップを含むことができる。例えば、いくつかの実施形態において、方法３００は、２つ以上の画像内の対象の特徴の見逃された検出についての偽陰性の検証を提供することにより、敵対的生成ネットワークを再トレーニングするステップを含むことができる。従って、データベースから抽出された、或いは、入力として受け取られた、手動的に設定された検証は、偽陰性の検証のみならず、真陽性及び偽陽性の検証を含むことができる。偽陰性は、敵対的生成ネットワークを再トレーニングするべく、使用することができる。これに加えて、又はこの代わりに、偽陰性は、物体検出ネットワークを再トレーニングするべく、使用することもできる。

【0104】

図４は、物体検出器４００の概略表現である。物体検出器４００は、１つ又は複数のプロセッサによって実装することができる。図４に示されているように、物体検出器４００は、対象の特徴を含むビデオのデータベース４０１を使用することができる。画像が医療画像を有する実施形態において、対象の特徴は、病変などの異常性を含むことができる。図４の例において、データベース４０１は、内視鏡検査ビデオのデータベースを有する。

【0105】

図４に更に描かれているように、検出器４００は、データベース４０１からビデオのサブセット４０３を抽出することができる。図２との関係において上述したように、サブセット４０３は、ランダムに、且つ／又は、１つ又は複数のパターンを使用することにより、選択することができる。検出器４００は、ディスクリミネータネットワーク４０５の知覚ブランチ４０７をサブセット４０３のフレームに適用することができる。知覚ブランチ４０７は、上述のように、物体検出ネットワークを有することができる。知覚ブランチ４０７は、対象の特徴を検出するべく、且つ、検出された対象の特徴と関連する場所（例えば、ポイント又は領域）を識別するべく、トレーニング済であってよい。例えば、知覚ブランチ４０７は、異常性を検出することができると共に、検出された異常性を含む境界ボックスを出力することができる。

【0106】

図４に示されているように、知覚ブランチ４０７は、検出４１３を出力することができる。上述のように、検出４１３は、サブセット４０３内の検出された対象の特徴の場所を識別するポイント又は領域を含むことができる。図４に更に描かれているように、検出器４００は、データベース４０１からビデオのサブセット４１１を抽出することができる。例えば、サブセット４１１は、少なくとも部分的に、サブセット４０３とオーバーレイしていてもよく、或いは、異なるビデオから構成されていてもよい。サブセット４１１は、例えば、少なくとも１００倍だけ、多い数のビデオなどの、サブセット４０３よりも多くの数のビデオを有することができる。検出器４００は、生成器ネットワーク４１５をトレーニングするべく、サブセット４１１及び検出器４１３を使用することができる。生成器ネットワーク４１５は、例えば、異常性などの、対象の特徴の人工的表現４１７を生成するべく、トレーニングすることができる。人工的表現４１７は、対象の特徴の真の表現に類似して見える対象の特徴の偽の表現を有しうる。従って、生成器ネットワーク４１５は、偽陽性であるという決定を下すように、知覚ブランチ４０７を騙すべく、トレーニングすることができる。

【0107】

図４に更に描かれているように、生成器ネットワーク４１５は、トレーニングされたら、人工的表現４１７を生成することができる。検出器４００は、ディスクリミネータネットワーク４０５の敵対的ブランチ４０９をトレーニングするべく、人工的表現４１７を使用することができる。上述のように、敵対的ブランチ４０９は、サブセット４１１から人工的表現４１７を弁別するべく、トレーニングすることができる。従って、敵対的ブランチ４０９は、差インジケータ４１９を判定することができる。差インジケータ４１９は、人工的表現４１７内に存在しているが、サブセット４１１内には存在していない、サブセット４１１内には存在しているが、人工的表現４１７内には存在していない、画像の任意の特徴ベクトル又はその他の態様、或いは、特徴ベクトル間の差を表す減算ベクトル又はその他の態様、或いは、人工的表現４１７のその他の態様、並びに、サブセット４１１のもの、を表すことができる。

【0108】

図４に描かれているように、検出器４００は、差インジケータ４１９を使用することにより、知覚ブランチ４０７を再トレーニングすることができる。例えば、人工的表現４１７が対象の特徴の偽の表現を有する実施形態において、検出器４００は、偽の表現がサブセット４１１内の真の表現の検出を結果的にもたらさないように、知覚ブランチ４０７を再トレーニングすることができる。

【0109】

図４には描かれていないが、検出器４００は、生成器ネットワーク４１５、知覚ブランチ４０７、及び／又は敵対的ブランチ４０９を改善するべく、再帰的なトレーニングを更に使用することができる。例えば、検出器４００は、差インジケータ４１９を使用して生成器ネットワーク４１５を再トレーニングすることができる。従って、敵対的ブランチ４０９の出力は、人工的表現が真の表現に相対的に類似して見えるように、生成器ネットワーク４１５を再トレーニングするべく、使用することができる。これに加えて、再トレーニング済みの生成器ネットワーク４１５は、敵対的ブランチ４０９を再トレーニングするべく使用される人工的表現の新しい組を生成することができる。従って、敵対的ブランチ４０９及び生成器ネットワーク４１５は、教師なし学習を実行してもよく、この場合に、それぞれのものの出力は、再帰的な方式によってその他のものを再トレーニングするべく使用されている。この再帰的なトレーニングは、閾値数のサイクルに到達する時点まで、且つ／又は、生成器ネットワーク４１５と関連する損失関数及び／又は敵対的ブランチ４０９と関連する損失関数が閾値に到達する時点まで、反復することができる。更には、この再帰的トレーニングにおいては、知覚ブランチ４０７は、新しい検出を有する新しいサブセットが、生成器ネットワーク４１５を更に再トレーニングするべく、使用されうるように、差インジケータのそれぞれの新しい出力を使用することにより、再トレーニングすることもできる。

【0110】

図５は、ディスクリミネータネットワーク及び生成器ネットワークを使用して対象の特徴を検出する例示用の方法５００のフローチャートである。方法５００は、１つ又は複数のプロセッサにより、実行することができる。

【0111】

図５のステップ５０１において、少なくとも１つのプロセッサは、データベース内において、異常性などの、対象の特徴の表現を含む複数のビデオを保存することができる。例えば、ビデオは、内視鏡検査手順においてキャプチャ済みであってよい。ステップ５０１の一部分として、少なくとも１つのプロセッサは、複数のビデオの第１サブセットを更に選択することができる。上述のように、少なくとも１つのプロセッサは、ランダムに、且つ／又は、１つ又は複数のパターンを使用することにより、選択することができる。

【0112】

ステップ５０３において、少なくとも１つのプロセッサは、第１の複数の異常性の検出を生成するべく、物体検出ネットワークの知覚ブランチを複数のビデオの第１サブセットのフレームに適用することができる。いくつかの実施形態において、上述のように、検出は、検出された異常性の場所のインジケータを含みうる。又、いくつかの実施形態において、知覚ブランチは、上述のように、畳み込みニューラルネットワークを有することができる。

【0113】

ステップ５０５において、少なくとも１つのプロセッサは、複数のビデオの第２サブセットを選択することができる。上述のように、少なくとも１つのプロセッサは、ランダムに、且つ／又は、１つ又は複数のパターンを使用することにより、選択することができる。第１の複数の検出及び複数のビデオの第２サブセットからのフレームを使用することにより、少なくとも１つのプロセッサは、複数の異常性の人工的表現を生成するべく、生成器ネットワークを更にトレーニングしてもよく、この場合に、複数の人工的表現は、残差学習を通じて生成されている。上述のように、それぞれの人工的表現は、異常性の真の表現に非常に類似した異常性の偽の表現を提供している。

【0114】

ステップ５０７において、少なくとも１つのプロセッサは、異常性の人工的な表現と異常性の真の表現の間を弁別するべく、ディスクリミネータネットワークの敵対的ブランチをトレーニングすることができる。例えば、上述のように、敵対的ブランチは、人工的表現とフレーム内の真の表現の間の差を識別するべく、トレーニングすることができる。いくつかの実施形態において、敵対的ブランチは、上述のように、畳み込みニューラルネットワークを有することができる。

【0115】

ステップ５０９において、少なくとも１つのプロセッサは、異常性の人工的表現と複数のビデオの第２サブセットのフレーム内に含まれている異常性の真の表現の間の差インジケータを生成するべく、ディスクリミネータネットワークの敵対的ブランチを複数の人工的表現に適用することができる。例えば、上述のように、差インジケータは、人工的表現には存在しているが、フレーム内には存在していない、フレーム内には存在しているが、人工的表現には存在していない、画像の任意の特徴ベクトル又はその他の態様を表していてもよく、或いは、特徴ベクトルの間の差を表す減算ベクトル又は人工的表現のその他の態様、或いは、フレームのものである。

【0116】

ステップ５１１において、少なくとも１つのプロセッサは、第２の複数の異常性の検出を生成するべく、ディスクリミネータネットワークの知覚ブランチを人工的表現に適用することができる。第１の複数の検出と同様に、検出は、人工的表現内の検出された異常性の場所のインジケータを含むことができる。

【0117】

ステップ５１３において、少なくとも１つのプロセッサは、差インジケータ及び第２の複数の検出に基づいて知覚ブランチを再トレーニングすることができる。例えば、それぞれの人工的表現が、異常性の真の表現に非常に類似している異常性の偽の表現を提供している、実施形態において、少なくとも１つのプロセッサは、人工的表現から返される検出の数を減少させるべく、且つ、従って、人工的表現から返される非異常性のヌルインジケータ又はその他のインジケータの数を増大させるべく、知覚ブランチを再トレーニングすることができる。

【0118】

本開示と一貫性を有する状態において、例示用の方法５００は、更なるステップを含むことができる。例えば、いくつかの実施形態において、方法５００は、差インジケータに基づいて生成ネットワークを再トレーニングするステップを含みうる。このような実施形態において、方法５００は、更なる複数の異常性の人工的表現を生成するべく、生成ネットワークを適用するステップと、更なる複数の異常性の人工的表現に基づいて敵対的ブランチを再トレーニングするステップと、を更に含むことができる。このような再トレーニングステップは、再帰的なものであってよい。更には、方法５００は、異常性の更なる人工的表現と複数のビデオの第２サブセットのフレームに含まれている異常性の真の表現の間の更なる差インジケータを生成するべく、再トレーニング済みの敵対的ブランチを更なる複数の人工的表現に適用するステップと、更なる差インジケータに基づいて生成ネットワークを再トレーニングするステップと、を含むことができる。上述のように、この再帰的な再トレーニングは、閾値数のサイクルに到達する時点まで、且つ／又は、生成ネットワークと関連する損失関数及び／又は敵対的ブランチと関連する損失関数が閾値に到達する時点まで、反復することができる。

【0119】

図６は、本開示の実施形態と一貫性を有する、ビデオフィード用のハードウェア構成を有するシステム６００の概略表現である。図６に示されているように、システム６００は、カメラ又はビデオフィードを出力するその他の装置などの、画像装置６０１に通信自在に結合されていてもよい。例えば、画像装置６０１は、ＣＴスキャナ、ＭＲＩ装置、内視鏡検査装置、又はこれらに類似したものなどの、医療撮像装置を有することができる。システム６００は、更には、ビデオを表示又は保存するべく、ディスプレイ６１５又はその他の装置に通信自在に結合されていてもよい。例えば、ディスプレイ６１５は、ユーザーに画像を表示するモニタ、スクリーン、又はその他の装置を有することができる。いくつかの実施形態において、ディスプレイ６１５は、クラウドに基づいたストレージシステム（図示されてはいない）に通信自在に接続されたストレージ装置（こちらも、図示されてはいない）又はネットワークインターフェイスコントローラ（ＮＩＣ）によって置換又は補完することができる。

【0120】

図６に更に描かれているように、システム６００は、カメラ６０１からビデオフィードを受け取る入力ポート６０３のみならず、ビデオをディスプレイ６１５に出力する出力ポート６１１を含むことができる。上述のように、入力ポート６０３及び出力ポート６１１は、ＶＧＡポート、ＨＤＭＩ（登録商標）ポート、ＤＶＩポート、又はこれらに類似したものを有することができる。

【0121】

システム６００は、第１バス６０５及び第２バス６１３を更に含む。図６に示されているように、第１バス６０５は、少なくとも１つのプロセッサ６０７を通じて入力ポート６０３を通じて受け取られたビデオを送信することができる。例えば、１つ又は複数のプロセッサ６０７は、上述の物体検出器ネットワーク及び／又はディスクリミネータネットワークのいずれかを実装することができる。従って、１つ又は複数のプロセッサ６０７は、例えば、図７の例示用の方法７００を使用することにより、第１バス６０２を介して受け取られたビデオ上において、例えば、図８の例示用のグラフィカルインジケータなどの、１つ又は複数のインジケータをオーバーレイすることができる。次いで、プロセッサ６０７は、第３バス６０９を介して、出力ポート６１１に、オーバーレイされたビデオを送信することができる。

【0122】

特定の状況において、１つ又は複数のプロセッサ６０７によって実装された物体検出器は、誤動作する場合がある。例えば、物体検出器を実装したソフトウェアは、クラッシュする場合があり、或いは、さもなければ、適切な動作を停止する場合がある。これに加えて、又はこの代わりに、１つ又は複数のプロセッサ６０７は、（例えば、システム６００の操作者から）ビデオのオーバーレイ動作を停止するためのコマンドを受け取る場合もある。誤動作及び／又はコマンドに応答して、１つ又は複数のプロセッサ６０７は、第２バス６１３を起動することができる。例えば、１つ又は複数のプロセッサ６０７は、図６に描かれているように、第２バス６１３を起動するべく、コマンド又はその他の信号を送信することができる。

【0123】

図６に描かれているように、第２バス６１３は、受け取られたビデオを直接的に入力ポート６０３から出力ポート６１１に送信し、これにより、システム６００が画像装置６０１用のパススルーとして機能することを許容することができる。第２バス６１３は、プロセッサ６０７によって実装されたソフトウェアが誤動作した場合にも、或いは、ハードウェアオーバーレイ６００の操作者がビデオフィードの途中でオーバーレイ動作を停止するべく決定した場合にも、画像装置６０１からのビデオのシームレスな提示を許容することができる。

【0124】

図７は、本開示の実施形態と一貫性を有する、物体検出器ネットワークを使用してビデオフィード上において物体インジケータをオーバーレイする例示用の方法７００のフローチャートである。方法７００は、１つ又は複数のプロセッサによって実行することができる。図７のステップ７０１において、少なくとも１つのプロセッサは、少なくとも１つの画像を提供することができる。例えば、少なくとも１つの画像は、データベースから抽出されてもよく、或いは、撮像装置から受け取られてもよい。いくつかの実施形態において、少なくとも１つの画像は、ビデオフィード内のフレームを有することができる。

【0125】

ステップ７０３において、少なくとも１つのプロセッサは、対象の特徴を含むものとして検出された画像の領域の周りにおいて２次元形状を有する境界をオーバーレイしてもよく、この場合に、境界は、第１色においてレンダリングされている。ステップ７０５において、所定の時間が経過した後に、少なくとも１つのプロセッサは、対象の特徴が真陽性である場合には、第２色において出現するように、且つ、対象の特徴が偽陽性である場合には、第３色において出現するように、境界を変更することができる。所定の時間の経過は、事前に設定された期間（例えば、閾値数のフレーム及び／又は秒）を表していてもよく、且つ／又は、対象の特徴の検出と真又は偽陽性としてのその分類の間の時間の経過を表していてもよい。

【0126】

これに加えて、又はこの代わりに、少なくとも１つのプロセッサは、対象の特徴が第１カテゴリにおいて分類された場合には、境界を第２色に変更することができると共に、対象の特徴が第２カテゴリにおいて分類された場合には、境界を第３色に変更することができる。例えば、対象の特徴が病変である場合には、第１カテゴリは、癌性病変を有することができると共に、第２カテゴリは、非癌性病変を有することができる。

【0127】

本開示と一貫性を有する状態において、例示用の方法７００は、更なるステップを含むことができる。例えば、いくつかの実施形態において、方法７００は、境界が変更された際に、サウンドを生成するべく、コマンドを１つ又は複数のスピーカに送信するステップ及び／又は境界が変更された際に振動するべく少なくとも１つのウェアラブル装置にコマンドを送信するステップを含むことができる。このような実施形態において、サウンド及び／又は振動の持続時間、トーン、周波数、及び振幅の少なくとも１つは、少なくとも１つの検出された物体が真陽性であるのか又は偽陽性であるのかに依存しうる。

【0128】

図８Ａは、本開示の実施形態と一貫性を有する、ビデオ内の物体検出用の例示用のオーバーレイ８０１を示している。図８Ａのみならず、図８Ｂ及び図８Ｃの例において、図示されているビデオサンプル８００ａ及び８００ｂは、結腸内視鏡検査手順からのものである。本開示から、本開示の実施形態を実装する際には、その他の手順及び撮像装置からのビデオが利用されうることが理解されよう。従って、ビデオサンプル８００ａ及び８００ｂは、本開示の非限定的な例である。これに加えて、例として、図８Ａ～図８Ｃのビデオ表示は、図１のディスプレイ１０７又は図６のディスプレイ６１５などの、表示装置上において提示されてもよい。

【0129】

オーバーレイ８０１は、検出された異常性又はビデオ内の対象の特徴用のインジケータとして使用されるグラフィカル境界の一例を表している。図８Ａに示されているように、画像８００ａ及び８００ｂは、検出された対象の特徴を含むビデオのフレームを有する。画像８００ｂは、グラフィカルオーバーレイ８０１を含み、且つ、画像８００ａよりも、順番において後である、或いは、時間において後である、フレームに対応している。

【0130】

図８Ａに示されているように、画像８００ａ及び８００ｂは、結腸内視鏡検査からのビデオフレームを有しており、且つ、対象の特徴は、病変又はポリープを有する。その他の実施形態においては、上述のように、胃鏡検査、小腸内視鏡検査、食道内視鏡検査などの上部内視鏡検査、或いは、これらに類似したものなどの、その他の医療手順からの画像を利用することができると共に、オーバーレイ８０１などの、グラフィカルインジケータとオーバーレイさせることができる。いくつかの実施形態において、インジケータ８０１は、異常性の検出及び時間（例えば、画像８００ａと画像８００ｂの間の特定数のフレーム及び／又は秒）の経過の後にオーバーレイさせることができる。図８Ａの例において、オーバーレイ８０１は、既定のパターンを有する矩形境界の形態におけるインジケータ（即ち、実線のコーナー角）を有する。その他の実施形態において、オーバーレイ８０１は、異なる形状であってもよい（規則的であるのか又は不規則的であるのかを問わない）。これに加えて、オーバーレイ８０１は、既定の色において表示されてもよく、或いは、第１色から別の色に遷移してもよい。

【0131】

図８Ａの例において、オーバーレイ８０１は、ビデオフレーム内の対象の特徴の検出された場所を取り囲む実線のコーナー角を有するインジケータを有する。オーバーレイ８０１は、ビデオフレーム８００ｂ内において出現しており、ビデオフレーム８００ｂは、順番において、ビデオフレーム８００ａに後続するものでありうる。

【0132】

図８Ｂは、本開示の実施形態による、ビデオ内の物体検出用のオーバーレイを有するディスプレイの別の例を示している。図８Ｂは、（画像８００ａに類似した）画像８１０ａと、インジケータ８１１とオーバーレイされた後の（画像８００ｂに類似した）画像８１０ｂと、を描いている。図８Ｂの例において、オーバーレイ８１１は、すべての辺において実線を有する矩形境界を有する。その他の実施形態において、オーバーレイ８１１は、第１色及び／又は異なる形状であってもよい（規則的であるのか又は不規則的であるのかを問わない）。これに加えて、オーバーレイ８１１は、既定の色において表示されてもよく、或いは、第１色から別の色に遷移してもよい。図８Ｂに示されているように、オーバーレイ８１１は、ビデオ内の検出された異常性又は対象の特徴上において配置されている。オーバーレイ８１１は、ビデオフレーム８１０ｂ内において出現しており、ビデオフレーム８１０Ｂは、順番において、ビデオフレーム８１０ａに後続するものでありうる。

【0133】

図８Ｃは、本開示の実施形態による、ビデオ内の物体検出用のオーバーレイを有するディスプレイの別の例を示している。図８Ｃは、（画像８００ａに類似した）画像８２０ａと、インジケータ８２１とオーバーレイされた、後の（画像８００ｂに類似した）画像８２０ｂと、を描いている。図８Ｃの例において、オーバーレイ８２１は、すべての辺において破線を有する矩形境界を有する。その他の実施形態において、インジケータ８２１は、異なる形状であってもよい（規則的であるのか又は不規則的であるのかを問わない）。これに加えて、オーバーレイ８２１は、既定の色において表示されてもよく、或いは、第１色から別の色に遷移してもよい。図８Ｃにおいて示されているように、オーバーレイ８２１は、ビデオ内の検出された異常性又は対象の特徴上において配置されている。オーバーレイ８２１は、ビデオフレーム８２０ｂ内において出現しており、ビデオフレーム８２０ｂは、順番において、ビデオフレーム８２０ａに後続するものでありうる。

【0134】

いくつかの実施形態において、グラフィカルインジケータ（即ち、オーバーレイ８０１、８１１、又は８２１）は、パターン及び／又は色を変化させることができる。例えば、パターン及び／又はパターンの境界の色を時間の経過（例えば、画像８００ａと画像８００ｂ、画像８１０ａと画像８１０ｂ、或いは、画像８２０ａと画像８２０ｂ、の間の既定数のフレーム及び／又は秒）に応答して変更することができる。これに加えて、又はこの代わりに、インジケータのパターン及び／又は色を対象の特徴の特定の分類（例えば、対象の特徴がポリープである場合に、癌性又は非癌性としてのポリープの分類など）に応答して変更することもできる。更には、インジケータのパターン及び／又は色は、対象の特徴の分類にも依存しうる。従って、インジケータは、対象の特徴が第１カテゴリにおいて分類された場合に、第１パターン又は色を有してもよく、対象の特徴が第２カテゴリにおいて分類された場合には、第２パターン又は色を有してもよく、以下同様である。或いは、この代わりに、インジケータのパターン及び／又は色は、対象の特徴が真陽性として識別されたのか又は偽陽性として識別されたのかにも依存しうる。例えば、対象の特徴は、上述のように、物体検出ネットワーク（或いは、ディスクリミネータネットワークの知覚ブランチ）によって検出され、これにより、インジケータを結果的にもたらしうるが、次いで、上述のように、敵対的ブランチ又はネットワークによって偽陽性であると判定され、これにより、インジケータが第１パターン又は色になるという結果をもたらしうる。その代わりに、対象の特徴が、敵対的ブランチ又はネットワークによって真陽性であると判定された場合には、インジケータは、第２パターン又は色において表示することができる。

【0135】

以上の説明は、例示を目的として提示されたものである。これは、すべてを網羅したものではなく、且つ、開示されている形態又は実施形態そのままに限定されるものでもない。実施形態の変更及び適合については、本明細書の検討及び開示されている実施形態の実施から明らかとなろう。例えば、記述されている実装形態は、ハードウェアを含むが、本開示と一貫性を有するシステム及び方法は、ハードウェア及びソフトウェアにより、実装することができる。これに加えて、特定のコンポーネントは、互いに結合されるものとして記述されているが、このようなコンポーネントは、互いに統合されていてもよく、或いは、任意の適切な方式により、分散されていてもよい。

【0136】

更には、本明細書においては、例示用の実施形態が記述されているが、範囲は、本開示に基づいた、等価な要素、変更、省略、（例えば、様々な実施形態に跨る態様の）組合せ、適合、及び／又は変形を有する任意の且つすべての実施形態を含む。請求項における要素は、請求項において利用されている言語に基づいて広範に解釈することを要し、且つ、本明細書において、或いは、適用の実行において、記述されている例に限定されるものではなく、これらの例は、非排他的なものであると解釈することを要する。更には、開示されている方法のステップは、ステップの再順序付け及び／又はステップの挿入又は削除を含む、任意の方式により、変更することができる。

【0137】

本開示の特徴及び利点については、以上の詳細な説明から明らかであり、且つ、従って、添付の請求項は、本開示の真の精神及び範囲内に含まれるすべてのシステム及び方法を含むものと解釈されたい。本明細書において使用されている不定冠詞「ａ」及び「ａｎ」は、「１つ又は複数」を意味している。同様に、複数形の用語の使用は、所与の文脈において明らかでない限り、必ずしも、複数を表記しているものではない。「及び」又は「又は」などの用語は、具体的にそうではない旨が明示されていない限り、「及び／又は」を意味している。更には、本開示の検討から、多数の変更及び変形が容易に発生することになることから、本開示を図示及び記述されている構造及び動作そのままに限定することは望ましいことではなく、且つ、従って、すべての適切な変更及び均等物が本開示の範囲に包含されるものと解釈されたい。

【0138】

その他の実施形態については、本明細書の検討及び本明細書において開示されている実施形態の実施から明らかとなろう。本説明及び例は、例としてのみ見なすことを要し、開示されている実施形態の真の範囲及び精神は、添付の請求項によって示されているものと解釈されたい。

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

【図8A】

【図8B】

【図8C】

【手続補正書】

【提出日】2024-03-29

【手続補正1】

【補正対象書類名】明細書

【補正対象項目名】０１３８

【補正方法】変更

【補正の内容】

【0138】

その他の実施形態については、本明細書の検討及び本明細書において開示されている実施形態の実施から明らかとなろう。本説明及び例は、例としてのみ見なすことを要し、開示されている実施形態の真の範囲及び精神は、添付の請求項によって示されているものと解釈されたい。
上述の実施形態は下記のようにも記載され得るが下記には限定されない。
［構成１］
対象の特徴の表現を含む画像を使用して敵対的生成ネットワークをトレーニングするシステムであって、
命令を保存するように構成された少なくとも１つのメモリと、
動作を実行するべく前記命令を実行するように構成された少なくとも１つのプロセッサと、
を有し、
前記動作は、
前記対象の特徴の表現を含む第１の複数の画像と、前記第１の複数の画像のうちの画像内の前記対象の特徴の場所のインジケータと、を提供するステップと、
前記第１の複数の画像及び前記対象の特徴の場所のインジケータを使用することにより、前記対象の特徴を検出するべく物体検出ネットワークをトレーニングするステップであって、任意選択により、前記物体検出ネットワークは、畳み込みニューラルネットワークである、ステップと、
前記対象の特徴の表現を含む第２の複数の画像を提供するステップであって、前記第２の複数の画像は、前記第１の複数の画像内に含まれているものよりも多くの数の画像を有する、ステップと、
第１の複数の前記対象の特徴の検出を生成するべく、前記トレーニング済みの物体検出ネットワークを前記第２の複数の画像に適用するステップと、
前記第１の複数の前記対象の特徴の検出との関係における真陽性及び偽陽性の手動的に設定された検証を提供するステップと、
前記第１の複数の前記対象の特徴の検出との関係における前記真陽性及び偽陽性の前記検証を使用することにより、敵対的生成ネットワークをトレーニングするステップと、
前記対象の特徴の更なる検出との関係における真陽性及び偽陽性の更なる手動的に設定された検証と共に、少なくとも１つの画像の更なる組及び前記対象の特徴の検出を使用することにより、前記敵対的生成ネットワークを再トレーニングするステップと、
を有する、システム。
［構成２］
前記少なくとも１つのプロセッサは、２つ以上の画像内の前記対象の特徴の見逃された検出についての偽陰性の検証を提供することにより、前記敵対的生成ネットワークを再トレーニングするように更に構成されている、構成１に記載のシステム。
［構成３］
前記第２の複数の画像内の画像の数は、前記第１の複数の画像に含まれているものよりも、少なくとも１００倍だけ、大きい、構成１又は２に記載のシステム。
［構成４］
前記第１の複数の画像及び前記第２の複数の画像は、医療画像を有しており、且つ、前記医療画像は、任意選択により、胃腸臓器の画像を有する、構成１から３のいずれか１項に記載のシステム。
［構成５］
前記第１の複数の画像及び前記第２の複数の画像の少なくとも１つは、胃鏡検査、結腸内視鏡検査、小腸内視鏡検査、或いは、任意選択により、内視鏡検査装置を含む上部内視鏡検査のうちの少なくとも１つにおいて使用されている撮像装置からの画像を有する、構成１から４のいずれか１項に記載のシステム。
［構成６］
前記対象の特徴は、異常性であり、且つ、前記異常性は、任意選択により、１つのタイプの細胞から別のタイプの細胞へのヒト組織における変化、前記ヒト組織が予想されている場所からのヒト組織の欠如、及び／又は、ヒト組織上における形成又はヒト組織の形成を有する、構成１から５のいずれか１項に記載のシステム。
［構成７］
前記異常性は、任意選択により、ポリープ状病変又は非ポリープ状病変を含む、病変を有する、構成６に記載のシステム。
［構成８］
人間臓器の画像内において異常性を検出するべくニューラルネットワークシステムをトレーニングする方法であって、少なくとも１つのプロセッサによって実行される、
データベース内において、異常性の表現を含む複数のビデオを保存するステップと、
前記複数のビデオの第１サブセットを選択するステップと、
異常性の第１の複数の検出を生成するべく、物体検出ネットワークの知覚ブランチを前記複数のビデオの前記第１サブセットのフレームに適用するステップと、
前記複数のビデオの第２サブセットを選択するステップと、
前記第１の複数の検出及び前記複数のビデオの前記第２サブセットからのフレームを使用することにより、ポリープの複数の人工的表現を生成するべく、生成器ネットワークをトレーニングするステップであって、前記複数の人工的表現は、残差学習を通じて生成されており、且つ、前記生成器ネットワークは、任意選択により、敵対的生成ネットワークを有する、ステップと、
前記異常性の前記人工的表現と異常性の真の表現の間を弁別するべく、ディスクリミネータネットワークの敵対的ブランチをトレーニングするステップであって、前記ディスクリミネータネットワークは、任意選択により、畳み込みニューラルネットワークを有する、ステップと、
前記異常性の人工的表現と前記複数のビデオの前記第２サブセットのフレーム内に含まれている異常性の真の表現の間の差インジケータを生成するべく、前記ディスクリミネータネットワークの前記敵対的ブランチを前記複数の人工的表現に適用するステップと、
前記異常性の第２の複数の検出を生成するべく、前記ディスクリミネータネットワークの前記知覚ブランチを前記人工的表現に適用するステップと、
前記差インジケータ及び前記第２の複数の検出に基づいて前記知覚ブランチを再トレーニングするステップと、
を有する方法。
［構成９］
前記異常性は、１つのタイプの細胞から別のタイプの細胞へのヒト組織における変化、前記ヒト組織が予想されている場所からのヒト組織の欠如、及び／又は、ヒト組織上における形成又はヒト組織の形成を有する、構成８に記載の方法。
［構成１０］
前記異常性は、任意選択により、ポリープ状病変又は非ポリープ状病変を含む、病変を有する、構成９に記載の方法。
［構成１１］
それぞれの人工的表現は、異常性の真の表現に非常に類似した異常性の偽の表現を提供している、構成８から１０のいずれか１項に記載の方法。
［構成１２］
人間臓器の画像内において異常性を検出するシステムであって、
命令を保存する少なくとも１つのメモリと、
動作を実行するべく前記命令を実行するように構成された少なくとも１つのプロセッサと、
を有し、
動作は、
人間臓器のビデオからフレームを選択するステップと、
前記異常性の少なくとも１つの検出を生成するべく、トレーニング済みのニューラルネットワークシステムを前記フレームに適用するステップと、
前記フレームの１つ上における前記少なくとも１つの検出の場所のインジケータを生成するステップと、
前記フレームをビデオとして再エンコーディングするステップと、
前記インジケータと共に、前記再エンコーディングされたビデオを出力するステップと、
を有し、
前記ニューラルネットワークは、構成８から１１のいずれか１項に記載の方法に従ってトレーニングされている、システム。

【手続補正2】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

対象の特徴の表現を含む画像フレームを使用して敵対的生成ネットワークをトレーニングする方法であって、
第１のトレーニング段階であって、
データベースから第１の複数の画像フレームを抽出するステップと、
表示装置を介して前記第１の複数の画像フレームを操作者に表示するステップと、
入力装置を介して、前記操作者から、第１の複数の画像フレーム内の少なくとも１つの領域に対する第１の複数の特徴インジケータを受け取るステップであって、前記少なくとも１つの領域は、前記対象の特徴の１つ又は複数の表現を含む、ステップと、
前記第１の複数の画像フレーム及び前記第１の複数の特徴インジケータを含む第１のトレーニングセットを使用してディスクリミネータネットワークをトレーニングするステップと、を含む、第１のトレーニング段階と、
第２のトレーニング段階であって、
前記データベースから第２の複数の画像フレームを更に抽出するステップと、
前記トレーニング済みのディスクリミネータネットワークを前記第２の複数の画像フレームに適用して、前記第２の複数の画像フレーム内の少なくとも１つの領域に対する第２の複数の特徴インジケータを生成するステップであって、前記少なくとも１つの領域は、前記対象の特徴の１つ又は複数の表現を含む、ステップと、
前記第２の複数の特徴インジケータとの関係における真陽性及び偽陽性の検証を受け取るステップと、
前記第２の複数の画像フレーム及び前記検証を含む第２のトレーニングセットを使用して敵対的生成ネットワークをトレーニングするステップであって、前記敵対的生成ネットワークは生成ネットワーク及び敵対的ネットワークを含み、前記敵対的生成ネットワークをトレーニングするステップは、前記対象の特徴の人工的表現を生成するべく、前記敵対的生成ネットワークをトレーニングするステップと、前記対象の特徴の前記人工的表現と前記対象の特徴の実際の表現とを区別するべく、前記敵対的ネットワークをトレーニングするステップと、を含む、第２のトレーニング段階と、
を含む、方法。

【請求項2】

前記第１の複数の画像フレーム及び前記第２の複数の画像フレームは、内視鏡検査、胃内視鏡検査、結腸内視鏡検査及び小腸内視鏡検査のうちの少なくとも１つの間に使用される撮像装置によってキャプチャされた医療画像を含む、請求項１に記載の方法。

【請求項3】

前記対象の特徴は、ヒト組織上における形成又はヒト組織の形成、１つのタイプの細胞から別のタイプの細胞へのヒト組織における変化、前記ヒト組織が予想されている場所からのヒト組織の欠如及び病変のうちの少なくとも１つを含む異常性を含む、請求項１に記載の方法。

【請求項4】

前記第１の複数の画像フレーム及び前記第２の複数の画像フレームのうちの少なくとも１つは、前記データベースから、ランダムに抽出されるか、１つ又は複数のパターンを使用して抽出される、請求項１に記載の方法。

【請求項5】

前記ディスクリミネータネットワークは物体検出ネットワークを含む、請求項１に記載の方法。

【請求項6】

前記入力装置は、ノブ、キーボード、マウス及びタッチスクリーンのうちの少なくとも１つを含む、請求項１に記載の方法。

【請求項7】

前記ディスクリミネータネットワークをトレーニングするステップは、前記ディスクリミネータネットワークの１つ又は複数のノードに関連付けられた１つ又は複数の重みを調節するステップ又は前記ディスクリミネータネットワークの１つ又は複数のノードに関連付けられた関数を調節するステップを含む、請求項１に記載の方法。

【請求項8】

前記敵対的生成ネットワークをトレーニングするステップは、真の対象の特徴に類似して見える偽の対象の特徴の人工的表現を生成するべく、生成ネットワークをトレーニングするステップを更に含む、請求項１に記載の方法。

【請求項9】

前記検証は、前記入力装置を介して前記操作者から受け取られる、請求項１に記載の方法。

【請求項10】

前記真陽性及び偽陽性の前記検証を使用して、前記トレーニング済みのディスクリミネータネットワークを再トレーニングするステップを更に含む、請求項１に記載の方法。

【請求項11】

少なくとも１つのプロセッサに方法を実施させるように構成された命令を含む非一時的コンピュータ可読媒体であって、前記方法は、
第１のトレーニング段階であって、
データベースから第１の複数の画像フレームを抽出するステップと、
表示装置を介して前記第１の複数の画像フレームを操作者に表示するステップと、
入力装置を介して、前記操作者から、第１の複数の画像フレーム内の少なくとも１つの領域に対する第１の複数の特徴インジケータを受け取るステップであって、前記少なくとも１つの領域は、対象の特徴の１つ又は複数の表現を含む、ステップと、
前記第１の複数の画像フレーム及び前記第１の複数の特徴インジケータを含む第１のトレーニングセットを使用してディスクリミネータネットワークをトレーニングするステップと、を含む、第１のトレーニング段階と、
第２のトレーニング段階であって、
前記データベースから第２の複数の画像フレームを更に抽出するステップと、
前記トレーニング済みのディスクリミネータネットワークを前記第２の複数の画像フレームに適用して、前記第２の複数の画像フレーム内の少なくとも１つの領域に対する第２の複数の特徴インジケータを生成するステップであって、前記少なくとも１つの領域は、前記対象の特徴の１つ又は複数の表現を含む、ステップと、
前記第２の複数の特徴インジケータとの関係における真陽性及び偽陽性の検証を受け取るステップと、
前記第２の複数の画像フレーム及び前記検証を含む第２のトレーニングセットを使用して敵対的生成ネットワークをトレーニングするステップであって、前記敵対的生成ネットワークは生成ネットワーク及び敵対的ネットワークを含み、前記敵対的生成ネットワークをトレーニングするステップは、前記対象の特徴の人工的表現を生成するべく、前記敵対的生成ネットワークをトレーニングするステップと、前記対象の特徴の前記人工的表現と前記対象の特徴の実際の表現とを区別するべく、前記敵対的ネットワークをトレーニングするステップと、を含む、第２のトレーニング段階と、
を含む、非一時的コンピュータ可読媒体。

【請求項12】

前記第１の複数の画像フレーム及び前記第２の複数の画像フレームは、内視鏡検査、胃内視鏡検査、結腸内視鏡検査及び小腸内視鏡検査のうちの少なくとも１つの間に使用される撮像装置によってキャプチャされた医療画像を含む、請求項１１に記載の非一時的コンピュータ可読媒体。

【請求項13】

前記対象の特徴は、ヒト組織上における形成又はヒト組織の形成、１つのタイプの細胞から別のタイプの細胞へのヒト組織における変化、前記ヒト組織が予想されている場所からのヒト組織の欠如及び病変のうちの少なくとも１つを含む異常性を含む、請求項１１に記載の非一時的コンピュータ可読媒体。

【請求項14】

前記第１の複数の画像フレーム及び前記第２の複数の画像フレームのうちの少なくとも１つは、前記データベースから、ランダムに抽出されるか、１つ又は複数のパターンを使用して抽出される、請求項１１に記載の非一時的コンピュータ可読媒体。

【請求項15】

前記ディスクリミネータネットワークは物体検出ネットワークを含む、請求項１１に記載の非一時的コンピュータ可読媒体。

【請求項16】

前記入力装置は、ノブ、キーボード、マウス及びタッチスクリーンのうちの少なくとも１つを含む、請求項１１に記載の非一時的コンピュータ可読媒体。

【請求項17】

前記ディスクリミネータネットワークをトレーニングするステップは、前記ディスクリミネータネットワークの１つ又は複数のノードに関連付けられた１つ又は複数の重みを調節するステップ又は前記ディスクリミネータネットワークの１つ又は複数のノードに関連付けられた関数を調節するステップを含む、請求項１１に記載の非一時的コンピュータ可読媒体。

【請求項18】

前記敵対的生成ネットワークをトレーニングするステップは、真の対象の特徴に類似して見える偽の対象の特徴の人工的表現を生成するべく、前記生成ネットワークをトレーニングするステップを更に含む、請求項１１に記載の非一時的コンピュータ可読媒体。

【請求項19】

前記検証は、前記入力装置を介して前記操作者から受け取られる、請求項１１に記載の非一時的コンピュータ可読媒体。

【請求項20】

前記真陽性及び偽陽性の前記検証を使用して、前記トレーニング済みのディスクリミネータネットワークを再トレーニングするステップを更に含む、請求項１１に記載の非一時的コンピュータ可読媒体。

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版