(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-11-15
(54)【発明の名称】クリアトレイアライナにおけるセットアップ及び段階分けのための幾何学的深層学習
(51)【国際特許分類】
G16H 20/00 20180101AFI20241108BHJP
G06T 7/00 20170101ALI20241108BHJP
【FI】
G16H20/00
G06T7/00 350C
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024532455
(86)(22)【出願日】2022-11-29
(85)【翻訳文提出日】2024-06-26
(86)【国際出願番号】 IB2022061551
(87)【国際公開番号】W WO2023100078
(87)【国際公開日】2023-06-08
(32)【優先日】2021-12-03
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】524062087
【氏名又は名称】ソルベンタム インテレクチュアル プロパティズ カンパニー
(74)【代理人】
【識別番号】100099759
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100146466
【氏名又は名称】高橋 正俊
(74)【代理人】
【識別番号】100202418
【氏名又は名称】河原 肇
(72)【発明者】
【氏名】ジョナサン ディー.ガンドルード
(72)【発明者】
【氏名】セイエド アミール ホセイン ホセイニー
(72)【発明者】
【氏名】ウェンボ トン
【テーマコード(参考)】
5L096
5L099
【Fターム(参考)】
5L096BA06
5L096HA11
5L099AA00
(57)【要約】
1つ以上のコンピュータプロセッサが、患者の歯の第1のデジタル表現を受信することと、1つ以上のコンピュータプロセッサが、1つ以上の歯の移動の予測を決定するために、敵対的生成ネットワーク(GAN)に含まれたニューラルネットワークであり、1つ以上の歯の移動を予測するように訓練された生成器を使用することと、1つ以上のプロセッサが、最終セットアップ及び1つ以上の中間段階のうちの少なくとも1つを含む出力状態を生成することと、を含む、クリアトレイアライナ(CTA)のための中間段階及び最終セットアップを製作するためにGANを訓練及び使用するためのシステム及び手法が記載されている。
【特許請求の範囲】
【請求項1】
歯科矯正整列治療のためのセットアップを生成するためのコンピュータ実装方法であって、
1つ以上のコンピュータプロセッサが、患者の歯の第1のデジタル表現を受信することであって、前記第1のデジタル表現は、複数のメッシュ要素と、前記複数のメッシュ要素内の各メッシュ要素に関連付けられたそれぞれのメッシュ要素特徴ベクトルと、を含む、ことと、
前記1つ以上のコンピュータプロセッサが、セットアップのための1つ以上の歯の移動の予測を決定するために、1つ以上のニューラルネットワークを含み、セットアップのための1つ以上の歯の移動を予測するように最初に訓練された生成器を使用することと、
前記1つ以上のコンピュータプロセッサが、前記使用することに基づいて、前記生成器を更に訓練することであって、前記ニューラルネットワークの前記訓練は、
前記生成器が、前記患者の歯の前記第1のデジタル表現に基づいて、セットアップのための1つ以上の歯の移動を予測することであって、前記1つ以上の歯の移動は、位置及び配向のうちの少なくとも1つによって記述される、ことと、
前記生成器が、前記生成器によって予測された前記1つ以上の歯の移動の表現と、1つ以上の基準歯の移動の表現との間の差を定量化することと、
前記定量化することに基づいて、損失値を生成することと、
前記損失値に少なくとも部分的に基づいて、前記生成器を修正することと、を含む動作を実行することによって修正される、ことと、を含む、コンピュータ実装方法。
【請求項2】
メッシュ要素は、頂点、辺、面、及びボクセルのうちの少なくとも1つを含む、請求項1に記載のコンピュータ実装方法。
【請求項3】
メッシュ特徴部は、空間的特徴部及び構造的特徴部のうちの少なくとも1つを含む、請求項1に記載のコンピュータ実装方法。
【請求項4】
前記1つ以上のプロセッサが、1つ以上の歯に適用される1つ以上の変換を記述する出力を生成することを更に含む、請求項1に記載のコンピュータ実装方法。
【請求項5】
前記セットアップは、中間セットアップである、請求項4に記載のコンピュータ実装方法。
【請求項6】
前記セットアップは、最終セットアップである、請求項4に記載のコンピュータ実装方法。
【請求項7】
前記生成器の前記訓練を修正することは、前記生成器の1つ以上のニューラルネットワークの1つ以上の重みを調整することを含む、請求項1に記載のコンピュータ実装方法。
【請求項8】
1つ以上の前記メッシュ特徴部は、頂点XYZ位置、表面法線ベクトル、及び頂点曲率を含む、請求項3に記載のコンピュータ実装方法。
【請求項9】
前記生成器は、3次元U-Net、3次元エンコーダ、3次元デコーダ、3次元ピラミッドエンコーダ/デコーダ、及び多層パーセプトロン(MLP)のうちの少なくとも1つを含む、請求項1に記載のコンピュータ実装方法。
【請求項10】
前記1つ以上のコンピュータプロセッサが、前記1つ以上の基準歯の移動に基づいて、前記患者の歯のデジタル表現を生成することを更に含む、請求項1に記載のコンピュータ実装方法。
【請求項11】
前記生成器はまた、1つ以上のニューラルネットワークを含み、予測された歯の移動と基準歯の移動とを区別するように訓練されている、識別器によって少なくとも部分的に訓練される、請求項1に記載のコンピュータ実装方法。
【請求項12】
システムであって、
1つ以上のコンピュータプロセッサと、
1つ以上のニューラルネットワークを含み、セットアップのための1つ以上の歯の移動を予測するように最初に訓練された生成器と、前記1つ以上のプロセッサによって実行されると、前記1つ以上のプロセッサに、
患者の歯の第1のデジタル表現を受信することであって、前記第1のデジタル表現は、複数のメッシュ要素と、前記複数のメッシュ要素内の各メッシュ要素に関連付けられたそれぞれのメッシュ要素特徴ベクトルと、を含む、ことと、
セットアップのための1つ以上の歯の移動の予測を決定するために、前記生成器を使用することと、
前記使用することに基づいて、前記生成器を更に訓練することであって、前記ニューラルネットワークの前記訓練は、
前記生成器が、前記患者の歯の前記第1のデジタル表現に基づいて、セットアップのための1つ以上の歯の移動を予測することであって、前記1つ以上の歯の移動は、位置及び配向のうちの少なくとも1つによって記述される、ことと、
前記生成器が、前記生成器によって予測された前記1つ以上の歯の移動の表現と、1つ以上の基準歯の移動の表現との間の差を定量化することと、
前記定量化することに基づいて損失値を生成することと、
前記損失値に少なくとも部分的に基づいて前記生成器を修正することと、を含む動作を行うことによって修正される、ことと、を行わせる命令と、を格納する、非一時的コンピュータ可読ストレージと、を備える、システム。
【請求項13】
メッシュ要素は、頂点、辺、面、及びボクセルのうちの少なくとも1つを含む、請求項12に記載のシステム。
【請求項14】
メッシュ特徴部は、空間的特徴部及び構造的特徴部のうちの少なくとも1つを含む、請求項12に記載のシステム。
【請求項15】
前記命令は更に、前記1つ以上のプロセッサに、1つ以上の歯に適用される1つ以上の変換を記述する出力を生成させる、請求項12に記載のシステム。
【請求項16】
前記セットアップは、中間セットアップである、請求項15に記載のシステム。
【請求項17】
前記セットアップは、最終セットアップである、請求項15に記載のシステム。
【請求項18】
前記生成器の前記訓練を修正することは、前記生成器の1つ以上のニューラルネットワークの1つ以上の重みを調整することを含む、請求項12に記載のシステム。
【請求項19】
前記1つ以上のメッシュ特徴部は、頂点XYZ位置、表面法線ベクトル、及び頂点曲率を含む、請求項14に記載のシステム。
【請求項20】
前記生成器は、3次元U-Net、3次元エンコーダ、3次元デコーダ、3次元ピラミッドエンコーダ/デコーダ、及び多層パーセプトロン(MLP)のうちの少なくとも1つを含む、請求項12に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、歯科矯正治療において使用される自動的に生成されたクリアトレイアライナ(clear tray aligner、CTA)デバイスの精度を改善するためのニューラルネットワークの構成及び訓練に関する。
【背景技術】
【0002】
不正咬合段階から最終段階への歯の中間期の段階分けは、歯が互いに衝突せず、歯がそれらの最終状態に向かって移動し、歯が最適かつ好ましくは短い軌道に従うように、正確な個々の歯の移動を決定することを必要とする。各歯は6自由度を有し、平均的な歯列弓は、約14個の歯を有するので、初期段階から最終段階までの最適な歯の軌道を見つけることは、大きく複雑な課題である。
【0003】
CTAの製作を自動化するための以前のアプローチは、1つ以上のCTAデバイスを使用する再調整のために、歯のセットの状態を定量化するために、ある規則又は測定基準の使用を伴った。他のアプローチは、CTAデバイスを生成するために機械学習手法を使用することを試みたが、功罪相半ばする結果となった。結果として、CTAの製作を自動化するシステムを改善するためのより良い機械学習モデル及び訓練手法が必要とされている。
【発明の概要】
【0004】
本開示は、CTAのための中間段階及び最終セットアップを製作するために敵対的生成ネットワーク(generative adversarial network、GAN)を訓練及び使用するためのシステム及び手法を説明する。第1の態様では、1つ以上のコンピュータプロセッサが、患者の歯の第1のデジタル表現を受信するステップと、1つ以上のコンピュータプロセッサが、最終セットアップのための1つ以上の歯の移動の予測を決定するために、敵対的生成ネットワークGANに含まれるニューラルネットワークであり、最終セットアップのための1つ以上の歯の移動を予測するように最初に訓練された生成器を使用するステップと、1つ以上のコンピュータプロセッサが、使用するステップに基づいてGANを更に訓練するステップであって、GANを訓練することは、生成器が、患者の歯の第1のデジタル表現に基づいて最終セットアップのための1つ以上の歯の移動を予測することと、予測された歯の移動と基準歯の移動とを区別するように構成されたニューラルネットワークでもあり、GANの一部でもある識別器が、生成器によって予測された1つ以上の歯の移動の表現が1つ以上の基準歯の移動の表現から区別可能であるか否かを決定することと、識別器の決定に基づいて、生成器及び識別器のうちの少なくとも一方のためのニューラルネットワークのうちの1つを修正することと、を含む動作を実行することによって修正される、ステップと、を含む、歯科矯正整列治療のためのセットアップを生成する第1のコンピュータ実装方法が記載される。
【0005】
第1の態様は、追加の特徴を任意選択で含むことができる。例えば、本方法は、1つ以上のプロセッサによって、最終セットアップのための出力状態を生成することができる。本方法は、1つ以上のコンピュータプロセッサによって、1つ以上の予測された歯の移動と1つ以上の基準歯の移動との間の差を決定することができる。1つ以上の予測された歯の移動と1つ以上の基準歯の移動との間の決定された差を使用して、生成器の訓練を修正することができる。生成器の訓練を修正することは、生成器のニューラルネットワークの1つ以上の重みを調整することを含むことができる。本方法は、1つ以上のコンピュータプロセッサによって、患者の歯の第1のデジタル表現の要素を指定する1つ以上のリストを生成することができる。1つ以上のリストのうちの少なくとも1つは、患者の歯の第1のデジタル表現における1つ以上の辺を指定することができる。1つ以上のリストのうちの少なくとも1つは、患者の歯のデジタル表現における1つ以上の多角形面を指定することができる。1つ以上のリストのうちの少なくとも1つは、患者の歯の第1のデジタル表現における1つ以上の頂点を指定することができる。本方法は、1つ以上のコンピュータプロセッサによって、1つ以上のメッシュ特徴部(mesh feature)を算出することができる。1つ以上のメッシュ特徴部は、辺の端点、辺の曲率、辺の法線ベクトル、辺の移動ベクトル、辺の正規化された長さ、頂点、関連する3次元表現の面、ボクセル、及びこれらの組み合わせを含むことができる。本方法は、1つ以上のコンピュータプロセッサによって、1つ以上の予測された歯の移動に基づいて、患者の歯の位置及び配向を予測するデジタル表現を生成することができる。本方法は、1つ以上のコンピュータプロセッサによって、1つ以上の基準歯の移動に基づいて患者の歯のデジタル表現を生成することができる。生成器によって予測された1つ以上の歯の移動の表現が1つ以上の基準歯の移動の表現から区別可能であるか否かを識別器によって決定することは、生成器によって予測された1つ以上の歯の移動の表現、1つ以上の基準歯の移動の表現、及び患者の歯の第1のデジタル表現を受信するステップと、生成器によって予測された1つ以上の歯の移動の表現、1つ以上の基準歯の移動の表現を比較するステップであって、比較は、患者の歯の第1のデジタル表現に少なくとも部分的に基づいている、ステップと、1つ以上のコンピュータプロセッサが、生成器によって予測された1つ以上の歯の移動の表現が1つ以上の基準歯の移動の表現と同じである確率を決定するステップと、を含むことができる。
【0006】
第2の態様では、1つ以上のコンピュータプロセッサが、患者の歯の第1のデジタル表現及び最終セットアップの表現を受信するステップと、1つ以上のコンピュータプロセッサが、1つ以上の中間段階のための1つ以上の歯の移動の予測を決定するために、敵対的生成ネットワーク(GAN)に含まれるニューラルネットワークであり、1つ以上の中間段階のための1つ以上の歯の移動を予測するように最初に訓練された生成器を使用するステップと、1つ以上のコンピュータプロセッサが、使用するステップに基づいてGANを更に訓練するステップであって、GANの訓練は、生成器が、患者の歯の第1のデジタル表現に基づいて、少なくとも1つの中間段階のための1つ以上の歯の移動を予測することと、予測された歯の移動と基準歯の移動とを区別するように構成されたニューラルネットワークでもあり、GANの一部でもある識別器が、生成器によって予測された1つ以上の歯の移動の表現が1つ以上の基準歯の移動の表現から区別可能であるか否かを決定することと、識別器の決定に基づいて、生成器及び識別器のうちの少なくとも一方のためのニューラルネットワークのうちの1つを修正することと、を含む動作を実行することによって修正される、ステップと、を含む、歯科矯正整列治療のためのセットアップを生成する第2のコンピュータ実装方法が記載される。第2の態様はまた、第1の態様を参照して上述した任意選択の特徴のうちの1つ以上を含むことができる。
【0007】
第3の態様では、1つ以上のコンピュータプロセッサが、患者の歯の第1のデジタル表現を受信するステップと、1つ以上のコンピュータプロセッサが、1つ以上の歯の移動の予測を決定するために、敵対的生成ネットワーク(GAN)に含まれるニューラルネットワークであり、1つ以上の歯の移動を予測するように訓練された生成器を使用するステップと、1つ以上のコンピュータプロセッサが、最終セットアップ及び1つ以上の中間段階のうちの少なくとも一方を含む出力状態を生成するステップであって、GANは、生成器が、患者の歯の第1のデジタル表現に基づいて、1つ以上の歯の移動を予測することと、予測された歯の移動と基準歯の移動とを区別するように構成されたニューラルネットワークでもあり、GANの一部でもある識別器が、生成器によって予測された1つ以上の歯の移動の表現が1つ以上の基準歯の移動の表現から区別可能であるか否かを決定することと、識別器の決定に基づいて、生成器及び識別器のうちの少なくとも一方のためのニューラルネットワークのうちの1つを修正することと、を含む動作を使用して訓練されている、ステップと、を含む、歯科矯正整列治療のためのセットアップを生成する第3のコンピュータ実装方法が記載される。第3の態様はまた、第1の態様を参照して上述した任意選択の特徴のうちの1つ以上を含んでもよい。
【図面の簡単な説明】
【0008】
【
図1】CTAの最終セットアップを決定するために使用される機械学習モデルを訓練するために使用することができる例示的な手法の図である。
【
図2】
図1に示される手法を使用して実行されるワークフローの例示的な視覚化の図である。
【
図4】CTAの中間期の段階分けを決定するために使用される機械学習モデルを訓練するために使用することができる例示的な手法の図である。
【
図5】
図4に示される手法を使用して実行されるワークフローの例示的な視覚化の図である。
【
図7】幾何学的深層学習を使用する手法の態様に焦点を当てた、
図1に示される手法の拡大図である。
【
図8】
図1又は
図4のいずれかに示される生成器のためのU-Netアーキテクチャを使用する例示的なワークフローを示す図である。
【
図9】
図8に示した例示的なU-Netアーキテクチャを示す図である。
【
図10】
図1又は
図4のいずれかに示される生成器110のための例示的なワークフロー1000を示す図である。
【
図11】
図10に示される例示的なピラミッドエンコーダ-デコーダを示す図である。
【
図13】本開示の手法に従って動作する例示的な処理ユニットを示す図である。
【発明を実施するための形態】
【0009】
クリアトレイアライナ、すなわちCTAは、治療の過程にわたって任意の数の患者の歯の位置付け及び/又は配向を再調整するために使用される一連の歯科矯正用の型である。患者の歯が1つのトレイ又は型に適合すると、所望の結果を達成するために、既存のトレイを配列内の次のトレイと交換することができる。CTAは、様々な材料で作ることができるが、名前が示すように、それらは概ね透明であり、したがって、トレイは、美容的に過度に乱されることなく所望の効果を達成するために一日中着用することができる。本明細書で使用される場合、「最終セットアップ」は、配列内の最終CTAに対応する(すなわち、患者の歯の最終的な所望の整列を表す)歯の目標配列を意味する。「中間段階」は、本明細書では、最終セットアップに達するために使用される配列内の他のトレイに対応する歯の中間配列を識別するために使用される。
【0010】
自動化ツールは、中間段階及び最終セットアップを表す物理的トレイを生成するために使用され得るデジタル式の最終セットアップ及び中間段階の作成のために開発されてきた。1つの既知の実施態様では、中間段階及び最終セットアップのデジタル表現を決定するために、特定の測定基準又は規則に従って、歯のセットの状態を定量化することを試みた、ランドマークベースの解剖学的構造に基づく手法が使用された。別の実施態様では、最終セットアップ及び中間段階のためのデジタル表現の生成のためにニューラルネットワークが使用された。
【0011】
しかしながら、これらの解決策を用いた研究において、改善を要する部分が明らかになっている。1つの改善を要する部分は、上記の手法によって実装されるモデルが、患者の歯を所望のように位置付けるために必要とされるであろう歯の移動のすべてを生成することが場合によりできないことである。例えば、一例を挙げると、算出された歯の移動によって、1つ以上の歯が重なり続ける場合があることが観察されている。これは、最終セットアップが患者によって装着された後であっても、特定の歯が依然として重なり合う可能性があるため、最終的に、所望の美容上の結果をもたらさないアライナの配列をもたらす場合がある。デジタル表現は、訓練されたモデルにおける識別された欠点に対処するために、更なる回数処理される必要があり得、更なる計算上のオーバーヘッドをもたらし、これは、計算リソースを不必要に消費することとなる。その場合であっても、デジタル表現を確定することは可能でない場合があり、したがって、これらのシステム及び手法の結果として生じる出力を補正するために人間の介入が必要とされる場合がある。言い換えれば、本開示の利点は、2つの例を挙げると、基礎となるシステムのより正確なデジタル表現及び改善された自動化をもたらす、より良好に訓練されたシステムを提供する。要するに、開示された手法を実施するシステムは、より良好に訓練され、それぞれの中間段階及び最終セットアップのより正確に生成されたデジタル表現を生成し、より短い持続時間でそれを行う。
【0012】
図1は、CTAの最終セットアップを決定するために使用される機械学習モデルを訓練するために使用することができる例示的な手法100である。以下でより詳細に説明するように、手法100は、所望の結果を達成するためにコンピュータハードウェア上で実施することができる。受信モジュール102は、患者症例データを受信する。一般に、患者症例データは、患者の口のデジタル表現を表す。図示されるように、モジュール102によって受信された患者症例データは、不正咬合歯列弓106(例えば、患者の歯の上側歯列弓及び下側歯列弓を表す3次元(「3D」)メッシュ)、図示されるような不正咬合歯列弓106であるが、上側歯列弓及び下側歯列弓が互いに係合される「咬合」位置104に配置されるもの、又は2つの組み合わせのいずれかとして受信されることができる。特定の実施態様によれば、咬合位置104を表す3Dメッシュはまた、患者の歯のメッシュデータに加えて、患者の歯肉組織(すなわち、歯肉)の3Dメッシュ幾何形状を含み得る。
図1の説明の部分は、実行されている訓練のタイプ(すなわち、最終セットアップのための訓練又は中間段階のための訓練)にとらわれないものとして提示されている。しかしながら、メッシュ変換訓練を参照してそれらの変換を分析する場合、手法100は、ニューラルネットワークを訓練して、最終セットアップをより正確かつ迅速に生成する目的で動作するように意図されていることを理解されたい。中間段階の訓練は、
図4を参照して説明される。
【0013】
特定の実施態様によれば、咬合位置幾何形状104及び不正咬合歯列弓幾何形状106は、同じ若しくは類似の3D幾何形状を含むか、又はそうでなければそれによって画定されるが、特定の構成で配列されてもよいことを理解されたい。すなわち、状況によっては、咬合位置幾何形状104は、不正咬合歯列弓幾何形状106内に含まれるように、咬合構成を表すように配列又は別様に描画された同じ基礎となるメッシュデータを含む。したがって、例えば、受信モジュール102が不正咬合歯列弓幾何形状106のみを受信する場合、受信モジュール102は、咬合位置幾何形状104を自動的に生成してもよい。逆に、受信モジュール102が咬合位置幾何形状104のみを受信する場合、受信モジュール102は、不正咬合歯列弓幾何形状106を自動的に生成してもよい。本明細書で使用される場合、「3Dメッシュ」及び「3D幾何形状」は、3Dデジタル表現を言及するために互換的に使用される。すなわち、一般性を失うことなく、様々なタイプの3D表現が存在することが理解されるべきである。3D表現の1つのタイプは、3Dメッシュ、3D点群、ボクセル化幾何形状(すなわち、ボクセルの集合)、又は数式によって記述される他の表現を含むことができる。「メッシュ」という用語が本開示全体を通して頻繁に使用されるが、この用語は、いくつかの実施態様では、他のタイプの3D表現と互換性があると理解されるべきである。
【0014】
本明細書で説明される様々なセットアップの予測の実施態様の各態様は、クリアトレイアライナ及びインダイレクトボンディングトレイの製作に適用可能である。様々なセットアップの予測の実施態様は、最終的な歯の姿勢を伴う他の製品にも適用可能であり得る。姿勢は、位置(又は場所)及び回転(又は配向)のうちの少なくとも1つを含む。
【0015】
3Dメッシュは、歯、ハードウェア要素又は患者の歯肉組織などの物体の幾何形状(又は形状)及び構造を記述するデータ構造である。3Dメッシュは、頂点、辺、及び面などのメッシュ要素からなる。いくつかの実施態様では、メッシュ要素は、低密度(sparse)メッシュ処理動作のコンテキストなどにおいて、ボクセルを含み得る。様々な空間的特徴部及び構造的特徴部が、これらのメッシュ要素について算出され、本開示の予測モデルに入力されてもよく、これらのモデルが正確な予測を行う能力を向上させるという利点がある。
【0016】
メッシュ特徴部モジュール108は、受信モジュール102によって受信された患者症例データを使用し、3Dメッシュ104及び106に関連するいくつかの特徴部を算出することができる。一般に、手法100は、患者の歯に関連する3D幾何形状を最適化することに最も関心があり、患者の歯肉組織に関連する3D幾何形状を最適化することにはあまり関心がない。結果として、メッシュ特徴部モジュール108は、対応する3D幾何形状内に存在する各歯の特徴を算出するように構成されている。特定の実施態様によれば、メッシュ特徴部モジュール108は、辺の中点、辺の曲率、辺の法線ベクトル、辺の正規化ベクトル、辺の移動ベクトル、並びに3Dメッシュ104及び106内の各歯に関する他の情報のうちの1つ以上を算出することができる。特定の実施態様によれば、メッシュ特徴部モジュール108は、利用されてもよく、又は利用されなくてもよい。すなわち、3Dメッシュ104及び106内の各歯についての辺の中点、辺の曲率、辺の法線ベクトル、及び辺の移動ベクトルのいずれかの算出は任意であることを理解されたい。メッシュ特徴部モジュール108を使用する1つの利点は、メッシュ特徴部モジュール108を利用するシステムをより迅速かつ正確に訓練することができるが、それにもかかわらず、手法100は、メッシュ特徴部モジュール108を使用しない既存の手法よりも良好に機能することである。従来の手法に対する3Dメッシュを使用する別の利点は、2次元の結果を3D空間にマッピングし、戻すことによって生じる誤差が、本開示には存在しないことである。したがって、3Dで直接動作することは、機械学習モデル及び生成される結果の基礎となる精度を改善する。
【0017】
3Dメッシュは、辺、頂点、及び面を含む。相互に関連しているが、これらの3つのタイプのデータは別個である。頂点は、メッシュの境界を画定する3D空間内の点である。これらの点は、点が互いにどのように接続されるか、すなわち、辺についての更なる情報を伴わず、点群として記述される。辺は、2つの点から構成され、線分と呼ぶこともできる。面は、辺と頂点から構成される。三角形のメッシュの場合、面は、3つの頂点を含み、それらの頂点は、相互接続されて、3つの隣接する辺を形成する。いくつかのメッシュは、処理を進めることができる前に除去されなければならない非マニフォールド幾何形状などの縮退要素を含み得る。他のメッシュ前処理動作も可能である。3Dメッシュは、一般に、三角形を使用して形成されるが、他の実施態様では、四辺形、五角形、又はいくつかの他のn角形を使用して形成され得る。いくつかの実施態様では、3Dメッシュは、低密度処理が実行される場合など、1つ以上のボクセル化幾何形状(すなわち、ボクセルを含む)に変換され得る。
【0018】
3Dメッシュ上で動作する本開示の手法は、入力として、(例えば、1つ以上の歯列弓内に配列される)1つ以上の歯のメッシュを受信してもよい。これらのメッシュの各々は大体、予測アーキテクチャ(例えば、エンコーダ、デコーダ、ピラミッドエンコーダ-デコーダ、及びU-Netのうちの少なくとも1つを含む)に入力される前に前処理を受ける。この前処理は、メッシュを、頂点、辺、面、又は低密度処理の場合、ボクセルなどのメッシュ要素のリストに変換することを含む。選択されたメッシュ要素の(複数の)タイプ(例えば、頂点)に対して、特徴ベクトルが生成される。いくつかの例では、メッシュの頂点ごとに1つの特徴ベクトルが生成される。各特徴ベクトルは、以下の表に指定されているように、空間的特徴部と構造的特徴部の組み合わせを含むことができる。
【0019】
【0020】
上記の説明と一致して、ボクセルはまた、ボクセルと交差するか、又はいくつかの実施態様ではボクセル内に主に若しくは完全に含まれるかのいずれかである他のメッシュ要素(例えば、頂点、辺、及び面)の集合体として算出される特徴部を有し得る。メッシュを回転させることは、構造的特徴部を変化させないが、空間的特徴部を変化させ得る。また、既に説明したように、メッシュという用語は、非限定的な意味で、3Dメッシュ、3D点群、及び3Dボクセル化幾何形状を含むものと考えるべきである。いくつかの実施態様では、メッシュ要素特徴部とは別に、3Dキーポイント及び3D記述子などのメッシュの幾何形状を記述する代替方法が存在する。そのような3Dキーポイント及び3D記述子の例は、「TONIONI Aら、「Learning to detect good 3D keypoints.」、Int J Comput Vis.2018 Vol.126,pages 1-20.」において見出される。いくつかの実施態様では、3Dキーポイント及び3D記述子は、メッシュ表面の極値(最小値又は最大値のいずれか)を記述し得る。
【0021】
手法100はまた、改善の特定の態様を達成するために、敵対的生成ネットワーク(「GAN」)を活用する。一般に、GANは、予測を提供するために2つのニューラルネットワークが互いに「競合」し、これらの予測が評価され、2つのモデルの評価がそれぞれの訓練を改善するために使用される機械学習モデルである。
図1に示すように、GANの2つのニューラルネットワークは、生成器110及び識別器134である。生成器110は、入力(例えば、咬合位置104、不正咬合歯列弓106、及びメッシュ特徴部モジュール108によって決定されたメッシュ特徴部のうちの1つ以上)を受信する。生成器110は、受信した入力を使用して、各歯のメッシュについて予測された歯の移動112を決定する。いくつかの実施態様では、生成器110はまた、生成器110を意図的に混乱させようと試みるために使用され得るガベージデータ又は他の情報を含み得るランダムノイズを受信し得る。生成器110が予測された歯の移動112を決定する方法は、
図7~
図12において以下でより詳細に説明される。
【0022】
本明細書で説明するように、歯の移動は、セットアップ内の歯の位置及び配向を指定するために様々な方法で符号化することができ、歯の3D表現に適用される1つ以上の歯の変換を指定する。例えば、特定の実施態様によれば、歯の位置は、何らかの意味論的文脈で定義される歯の基準原点位置のデカルト座標であり得る。歯の配向は、回転行列、単位四元数、又は基準系(グローバル又はローカルのいずれか)に対するオイラー角などの別の3D回転表現として表すことができる。寸法は、実数値の3D空間範囲であり、間隙は、バイナリプレゼンスインジケータ又は特に特定の歯が欠けている場合には、歯間の実数値の間隙サイズであり得る。いくつかの実施態様では、歯の回転は、3×3行列によって(又は他の次元の行列によって)記述され得る。いくつかの実施態様では、歯の位置及び回転情報は、例えば、同次座標を反映し得る4×4行列として、同じ変換行列に組み合わせられてもよい。事例によっては、アフィン空間変換行列を使用して、歯の変換、例えば、歯の不正咬合姿勢、歯の中間姿勢、及び/又は歯の最終セットアップ姿勢を記述する変換を記述することができる。いくつかの実施態様は、相対座標を使用することができ、セットアップ変換は、不正咬合座標系に対して予測される(すなわち、不正咬合からセットアップへの変換は、セットアップ座標系の代わりに直接予測される)。他の実施態様は、絶対座標を使用することができ、セットアップ座標系は、各歯について直接予測される。相対モードでは、変換は、各歯のメッシュの重心(対グローバル原点)に対して算出することができ、これは「相対的局所」と呼ばれる。相対的局所座標を使用する利点のいくつかは、すべての患者症例データセットに利用可能ではない可能性がある不正咬合座標系(ランドマーキングデータ)の必要性を排除することを含む。絶対座標を使用する利点のいくつかは、メッシュデータが元々グローバル原点に対して相対的に表されるので、データ前処理を簡略化することを含む。
【0023】
予測された歯の移動112が生成器110によって決定された後、生成器110を訓練することができる。例えば、一実施態様では、予測された歯の移動112の各々は、歯のメッシュごとに対応するグラウンドトゥルースの歯の移動114と比較される。例えば、国際的な歯の付番システムの27番に対応する犬歯に対する予測された歯の移動112は、同じ犬歯に対するグラウンドトゥルースの歯の移動114と比較される。グラウンドトゥルースの歯の移動は、特定の歯のメッシュに対して正しい歯の移動として検証された歯の移動である。いくつかの実施態様では、グラウンドトゥルースの歯の移動114は、歯科医又は他の医療提供者などのヒトユーザによって指定される。他の実施態様では、グラウンドトゥルースの歯の移動114は、手法100を実装するシステムに提供される患者症例データ又は他の情報に基づいて自動的に生成され得る。
【0024】
予測された歯の移動112とグラウンドトゥルースの歯の移動114との間の差を使用して、1つ以上の損失値G1 116を算出することができる。例えば、G1 116は、予測された歯の移動112とグラウンドトゥルースの歯の移動114との間の回帰損失を表すことができる。すなわち、一実施態様によれば、損失G1 116は、予測された歯の移動112がグラウンドトゥルースの歯の移動115から逸脱する割合を反映する。とは言うものの、生成器の損失G1 116は、L2損失、平滑L1損失、又は何らかの他の種類の損失であり得る。特定の実施態様によれば、L1損失は、
【0025】
【数1】
のように定義される(式中、Pは、予測された歯の移動112を表し、Gは、グラウンドトゥルースの歯の移動114を表す)。歯の移動は、変換行列(例えば、アフィン変換)、四元数、及び並進ベクトルのうちの少なくとも1つによって具現化され得る。特定の実施態様によれば、L2損失は、
【0026】
【数2】
のように定義され得る(式中、Pは、予測された歯の移動112を表し、Gは、グラウンドトゥルースの歯の移動114を表す)。加えて、以下でより詳細に説明されるように、損失値G1 116は、生成器110に提供され、例えば、生成器110のニューラルネットワーク内の1つ以上の重みを変更して、基礎となるモデルを訓練し、グラウンドトゥルースの歯の移動114を反映又は実質的に反映する予測された歯の移動112を生成するモデルの能力を改善することによって、生成器110を更に訓練することができる。
【0027】
予測された歯の移動112を再び参照すると、予測された歯の移動112の各々は、それぞれの歯のメッシュへの1つ以上の変換によって表される。例えば、一実施態様では、予測された歯の移動112の各々は、6要素回転ベクトル変換及び3要素並進ベクトルによって表される。この実施態様では、6要素回転ベクトルは、3D幾何形状内のその回転を修正するためにそれぞれの歯に対して実行される1つ以上の回転を表し、3要素並進ベクトルは、X、Y、及びZ座標を使用して3D幾何形状内の各歯のそれぞれの位置を記述する。他の実施態様では、予測された歯の移動112の各々は、7要素ベクトル、すなわち、四元数回転を記述する4つの要素と、X、Y、及びZ座標を使用して位置を記述する3つの要素とによって表される。予測的な歯の移動を決定することの一部として回転予測及び並進予測の両方を生成することによって、既存のシステムに対して更なる利点が実現され得る。例えば、同じ変換において並進予測と回転予測の両方を一緒に生成することは、並進予測又は回転予測の一方が決定された後に、別々に予測された並進予測と回転予測とを別々に又は別様に組み合わせることを試みるシステムよりも精度を改善することが観察されている。
【0028】
次いで、メッシュ変換器118及び126を使用して、手法100は、3Dメッシュ104及び106に対応する歯のメッシュを、予測された歯の移動112及びグラウンドトゥルースの歯の移動114をそれぞれ使用して変換する。すなわち、指定された移動に対応するように3D幾何形状を修正するために、それぞれの変換が3D幾何形状に適用される。例えば、予測された歯の移動112を参照して、7要素ベクトルによって表される実施態様では、歯のメッシュは、3Dメッシュ104及び106におけるその歯のメッシュの予測された歯の移動112の指定された四元数回転を使用して回転され、メッシュのX、Y、及びZ座標は、3Dメッシュ104及び106におけるその歯のメッシュの予測された歯の移動112のX、Y、及びZ座標に等しくなるように修正される。同様に、グラウンドトゥルースの歯の移動114を3Dメッシュ104及び106に適用して、3Dメッシュ104及び106内の各歯についてグラウンドの歯の移動を生成することができる。
【0029】
これらの変換は、予測された歯の移動表現120及びグラウンドトゥルースの歯の移動表現128に対応する修正された3D幾何形状をもたらす。特定の実施態様によれば、予測された歯の移動の表現120及びグラウンドトゥルースの歯の移動の表現128の両方は、それぞれ、咬合位置3D幾何形状124及び132と、それぞれ、不正咬合歯列弓3D幾何形状122及び130と、を含むことができる。すなわち、予測された歯の移動表現120は、予測された歯の移動変換112によって指定されるような咬合位置メッシュ124及び不正咬合歯列弓メッシュ122の変化に対応する咬合位置メッシュ104及び1つ以上の不正咬合歯列弓メッシュ106によって表すことができる。同様に、グラウンドトゥルースの歯の移動表現128は、グラウンドトゥルースの歯の移動変換114によって指定されるように、咬合位置メッシュ132及び1つ以上の不正咬合歯列弓メッシュ132によって表すことができる。
【0030】
加えて、予測された歯の移動表現120及びグラウンドトゥルースの歯の移動表現128は、表現がグラウンドトゥルースの変換に対応するか否かを示すために、フラグを立てられるか、又は他の方法で注釈を付けられることができる。例えば、一実施態様では、予測された歯の移動表現120は、グラウンドトゥルースの歯の移動114に対応しないことを示すために「偽」の値を割り当てられ、グラウンドトゥルースの歯の移動表現128は、「真」の値を割り当てられる。
【0031】
特定の実施態様によれば、表現120及び128は、識別器134への入力として提供される。更に、特定の実施態様によれば、メッシュ幾何形状104及び106もまた識別器134に提供される。しかしながら、表現120及び128並びにメッシュ104及び106に関する情報はまた、他の方法で識別器134に提供されてもよい。具体的には、識別器134は、変換されたメッシュ(すなわち、表現120及び128)を受信する必要はない。代わりに、識別器134は、開始メッシュ幾何形状104及び106と、変換112及び114と、を受信することができる。別の実施態様によれば、変換112及び114の代わりに、識別器134は、メッシュ104及び106内の各要素に適用される1つ以上の移動のリストを受信することができる。すなわち、識別器134は、メッシュ104及び106、変換112及び114、並びに表現120及び128に対応するデータの様々な表現を受信することができる。一般に、識別器134は、予測された歯の移動112から入力がいつ生成されるか、又はグラウンドトゥルースの歯の移動表現128から入力がいつ生成されるかを決定するように構成される。例えば、一実施態様では、識別器134は、入力が予測された歯の移動112から生成されたと識別器134が判定したときに「偽」の指示を出力することができ、入力がグラウンドトゥルースの歯の移動114から生成されたときに「真」の指示を出力することができる。
【0032】
識別器134は、最初に様々な方法で訓練され得る。例えば、識別器134は、エンコーダ(特定の種類のニューラルネットワーク)として構成することができ、これは、本明細書で説明されるような状況によっては、検証を実行するように構成することができる。例えば、識別器134に含まれる初期エンコーダは、ランダムな辺の重みが設定され得る。バックプロパゲーションを使用して、エンコーダ、したがって識別器134は、重みの値を修正することによって連続的に改良を加えられて、識別器134が、どの入力が「真」のグラウンドトゥルース表現として識別されるべきか、及びどの入力が「偽」のグラウンドトゥルース表現として識別されるべきかをより正確に決定することを可能にすることができる。言い換えれば、識別器134は、最初に訓練され得るが、手法100が実行されるにつれて、識別器134は、進化/訓練され続ける。生成器110と同様に、手法100を実行するたびに、識別器の精度が向上する。当業者によって理解されるように、識別器134に対する改善は、識別器134の精度が統計的に改善しない限界に達するが、その時点で識別器134の訓練は完了したと考えられる。
【0033】
識別器134が出力を生成した後、次いで、手法100は、識別器134の出力を入力と比較して、識別器が予測された歯の移動表現120とグラウンドトゥルースの歯の移動表現128とを正確に区別したか否かを判定する。例えば、識別器134の出力は、表現の注釈と比較することができる。出力と注釈が一致する場合、識別器134は、識別器134が受信した入力のタイプを正確に予測した。逆に、出力と注釈が一致しない場合、識別器134は、識別器134が受信した入力のタイプを正確に予測しなかった。いくつかの実施態様では、生成器110と同様に、識別器134もランダムノイズを受信し、識別器134を意図的に混乱させようとしてもよい。
【0034】
加えて、特定の実施態様によれば、識別器134は、手法100を実施するシステムの態様を訓練するために使用され得る追加の値を生成し得る。一例では、識別器134は、識別器損失値136を生成することができ、これは、入力が予測された歯の移動の表現120及び/又はグラウンドトゥルースの歯の移動の表現128に対応するか否かを識別器134がどの程度正確に決定したかを反映する。特定の実施態様によれば、識別器損失136は、識別器134がその予測においてあまり正確でないときにより大きくなり、識別器134がその予測においてより正確であるときにより小さくなる。別の例では、識別器134は、生成器損失値G2 138を生成し得る。特定の実施態様によれば、生成器損失値G2 138は、識別器損失136に対して直接的に逆ではないが、概して、識別器損失136に対して逆の関係を示す。すなわち、識別器損失136が大きいとき、生成器損失G2 138は小さく、識別器損失136が小さいとき、生成器損失G2 138は大きい。いくつかの実施態様では、識別器損失136は、「真」のモデルと「偽」のモデルの両方について計算されるバイナリクロスエントロピー損失関数を使用して決定され得る。いくつかの実施態様では、生成器損失は、2つの損失から構成され得る。すなわち、1)第1の損失は、識別器によって決定されるような生成器損失G2 138である(したがって、バイナリクロスエントロピーが使用され得る)、2)第2の損失は、例えば、生成器損失G1 116によって指定されるような、生成器110の所望の出力と実際の出力との間の差を測定するl1ノルム又は平均二乗誤差によって実装され得る。
【0035】
言い換えれば、
図1に示すように、生成器損失G2 138は、加算演算140を使用して生成器損失G1 116に加算することができる。そして、生成器損失G1 116及びG2 138の合計値は、生成器110を訓練する目的で生成器110に提供することができる。とは言うものの、生成器損失G1 116の計算は、GANの訓練に必要でないことを理解されたい。いくつかの実施態様では、生成器損失G2 138と識別器損失136との組み合わせのみを使用して、生成器110又は識別器134のいずれかを訓練することが可能であり得る。しかし、本開示の他の任意選択の態様と同様に、生成損失G1 116を使用することは、生成器134をより迅速に訓練して、より正確な予測を生成するために利用することができる。手法100の追加の態様は、後続の図の説明の一部として明らかになるであろう。
【0036】
図2は、
図1に示される手法100を使用して実行されるワークフロー200の例示的な視覚化である。
図1の説明によって理解されるはずであるように、ワークフロー200の第1のステップ202において、初期3D位置及び配向データ(例えば、咬合位置104、不正咬合歯列弓106のうちの1つ以上)が、1つ以上の3D幾何形状の形態で受信され、手法100は、ワークフロー200のステップ206において、最終位置及び配向情報を計算する。追加のステップ204a~204nもまた、ワークフロー200に示されている。しかしながら、全般的には、ワークフローのこれらのステップは、
図1を参照して説明されるような最終セットアップを決定するときに意図的に省略される。代わりに、ステップ204a~204nを使用して、
図4~
図6を参照して以下でより詳細に説明する中間段階を生成することができる。
【0037】
図3は、
図1に示す手法100(本明細書では手法300と呼ぶ)の異なる図である。特定の実施態様によれば、手法300はまず、モジュール102によって受信された患者データなどの患者データにアクセスする。ステップ302において、手法300を実行するプロセッサは、任意選択でランダムノイズを生成することができる。次に、プロセッサは、患者症例データ及び任意のランダムノイズを生成器110に提供する。
図1を参照して上述したように、プロセッサは、訓練された生成器110に、予測された歯の移動表現120を決定するために使用することができる予測された歯の移動112を生成させる命令を実行する。
【0038】
手法300を実行するシステムはまた、ステップ304において1つ以上のグラウンドトゥルースの変換にアクセスし、モジュール102によって受信された選択された患者症例データに対応する1つ以上のサンプルグラウンドトゥルースの変換114を選択することができる。
図1を参照して上述したように、1つ以上のサンプルグラウンドトゥルースの変換114を使用して、グラウンドトゥルースの歯の移動表現128を生成することができる。次に、手法300を実行するシステムは、受信モジュール102によって受信された患者症例データ、予測された歯の移動表現120、及びグラウンドトゥルースの歯の移動表現128のいずれかを識別器134に提供することができる。
【0039】
次に、手法100を参照して説明したように、ステップ306において、識別器134は、入力が真のグラウンドトゥルースの変換であるか偽のグラウンドトゥルースの変換であるかの確率を提供することによって、入力がグラウンドトゥルースの変換に対応するか否かを決定する。いくつかの実施態様では、識別器134によって返される確率は、0~1の範囲内であり得る。すなわち、識別器134は、入力が真である(すなわち、予測された歯の移動112に対応する)確率が低いことを示すために0に近い値を提供することができ、又は入力が真である(すなわち、グラウンドトゥルースの歯の移動114に対応する)確率が高いことを示すために1に近い値を提供することができる。
【0040】
図1を参照して上述したように、識別器134の出力は、識別器134及び生成器110の両方を訓練するために使用することができる。
【0041】
図4は、CTAの中間期の段階分けを決定するために使用される機械学習モデルを訓練するために使用することができる例示的な手法400である。図示のように、手法400の態様は、手法100と同様である。例えば、手法400は、患者症例データを受信する受信モジュール402を利用する。受信モジュール402は、受信モジュール102と同様に動作し、例えば、受信モジュール402は、咬合位置付け幾何形状及び不正咬合歯列弓幾何形状106に対応するデータを受信することができる。受信モジュールは、受信モジュール402が最終セットアップに対応する終点の歯の変換404を受信するようにも構成されるという点で、受信モジュール102とは異なる。特定の実施態様によれば、終点の歯の変換404は、手法100を実行した結果として事前定義又は提供することができる。
【0042】
手法400はまた、
図1を参照して上述したように、受信モジュール102によって受信された患者症例データを使用し、3Dメッシュ104及び106に関連するいくつかの特徴を計算することができる、メッシュ特徴部モジュール108を使用する。手法100と同様に、手法100はまた、敵対的生成ネットワーク(「GAN」)を活用して、本開示全体を通して説明されるような改善の特定の態様を達成する。しかしながら、手法400は、
図1を参照して上述したような生成器110及び識別器134とは異なって使用される生成器411及び識別器435を使用する。例えば、生成器411は、入力(例えば、咬合位置置104、不正咬合歯列弓106、及びメッシュ特徴部モジュール108によって決定されるメッシュ特徴部のうちの1つ以上)を受信し、最終セットアップのための予測された歯の移動を生成する代わりに、生成器411は、受信された入力を使用して、各歯のメッシュのための予測された中間歯の移動406を決定する。いくつかの実施態様によれば、予測された中間段階の歯の移動406を使用して、1)歯がどの方向に移動しているか、2)現在の段階について歯が最終状態に向かってどれだけ遠くに位置しているか、及び3)歯がどのように回転しているかという値のうちの1つ以上を決定することができる。しかし、生成器411の他の態様は、同じである。例えば、いくつかの実施態様では、生成器411はまた、生成器411を意図的に混乱させようと試みるために使用され得るガベージデータ又は他の情報を含み得るランダムノイズを受信し得る。結果として、本明細書で説明される本開示の多くの態様では、生成器110及び生成器411は、互換的に使用され得ることを理解されたい。同様に、識別器134及び識別器435は、互換的に使用することができる。
【0043】
予測された中間歯の移動406が生成器411によって決定された後、生成器411を訓練することができる。例えば、一実施態様では、予測された中間歯の移動406の各々は、各歯のメッシュについて、対応するグラウンドトゥルースの中間歯の移動408と比較される。手法400の一部として実行される比較は、
図1を参照して説明した手法100と同じである。
【0044】
同様に、予測された中間歯の移動406とグラウンドトゥルースの中間歯の移動408との間の差は、手法100に関して上述したように、1つ以上の損失値G1 116を計算するために使用され得る。同様に、手法100に関連して説明したように、損失値G1 116を生成器411に提供して、例えば、生成器411のニューラルネットワーク内の1つ以上の重みを修正して、基礎となるモデルを訓練し、グラウンドトゥルースの中間歯の移動408を反映又は実質的に反映する予測された中間歯の移動406を生成するモデルの能力を向上させることによって、生成器411を更に訓練することができる。
【0045】
予測された中間歯の移動406を再び参照すると、予測された中間歯の移動406の各々は、それぞれの歯のメッシュへの1つ以上の変換によって表される。例えば、一実施態様では、予測された中間歯の移動406の各々は、6要素回転ベクトル変換及び3要素並進ベクトルによって表される。この実施態様では、6要素回転ベクトルは、3D幾何形状内のその回転を修正するためにそれぞれの歯に対して実行される1つ以上の回転を表し、3要素並進ベクトルは、X、Y、及びZ座標を使用して3D幾何形状内の各歯のそれぞれの位置を記述する。他の実施態様では、予測された中間歯の移動406の各々は、7要素ベクトル、すなわち、四元数回転を記述するための4つの要素と、X、Y、及びZ座標を使用して位置を記述するための3つの要素とによって表される。
【0046】
次いで、メッシュ変換器118及び126を使用して、手法400は、3Dメッシュ104及び106に対応する歯のメッシュを、それぞれ、予測された中間歯の移動406及びグラウンドトゥルースの中間歯の移動408を使用して変換する。すなわち、指定された移動に対応するように3D幾何形状を修正するために、それぞれの変換が3D幾何形状に適用される。例えば、予測された中間歯の移動406を参照して、7要素ベクトルによって表される実施態様では、歯のメッシュは、3Dメッシュ104及び106内のその歯のメッシュに対する予測された中間歯の移動406の指定された四元数回転を使用して回転され、メッシュのX、Y、及びZ座標は、3Dメッシュ104及び106内のその歯のメッシュに対する予測された中間歯の移動406のX、Y、及びZ座標に等しくなるように修正される。同様に、グラウンドトゥルースの中間歯の移動114を3Dメッシュ104及び106に適用して、3Dメッシュ104及び106内の各歯についてグラウンドの歯の移動を生成することができる。
【0047】
これらの変換は、予測された中間歯の移動表現410及びグラウンドトゥルースの中間歯の移動表現418に対応する修正された3D幾何形状をもたらす。特定の実施態様によれば、予測された中間歯の移動表現410とグラウンドトゥルースの中間歯の移動表現418の両方は、それぞれ、咬合位置3D幾何形状414及び422と、それぞれ、不正咬合歯列弓3D幾何形状412及び420と、を含むことができる。すなわち、予測された中間歯の移動表現410は、予測された中間歯の移動変換406によって指定されるような咬合位置メッシュ414及び不正咬合歯列弓メッシュ412の変化に対応する咬合位置メッシュ104及び1つ以上の不正咬合歯列弓メッシュ106によって表すことができる。同様に、グラウンドトゥルースの中間歯の移動表現418は、グラウンドトゥルースの中間歯の移動変換408によって指定されるような咬合位置メッシュ422及び1つ以上の不正咬合歯列弓メッシュ420によって表すことができる。
【0048】
加えて、予測された中間歯の移動表現410及びグラウンドトゥルースの中間歯の移動表現418は、表現がグラウンドトゥルースの変換に対応するか否かを示すために、フラグを立てられるか、又は別様に注釈を付けられることができる。例えば、一実施態様では、予測された中間歯の移動表現410には「偽」の値が割り当てられて、それがグラウンドトゥルースの中間歯の移動408に対応しないことを示し、グラウンドトゥルースの中間歯の移動表現418には「真」の値が割り当てられる。
【0049】
表現410及び418は、識別器134への入力として提供される。更に、特定の実施態様によれば、メッシュ幾何形状104及び106も識別器435に提供される。とは言え、表現410及び418並びにメッシュ104及び106に関する情報は、他の方法で識別器435に提供されてもよい。具体的には、識別器435は、変換されたメッシュ(すなわち、表現410及び418)を受信する必要はない。代わりに、識別器435は、開始メッシュ幾何形状104及び106と、変換406及び408とを受信することができる。別の実施態様によれば、変換406及び408の代わりに、識別器435は、メッシュ104及び106内の各要素に適用される1つ以上の移動のリストを受信することができる。すなわち、識別器134と同様に、識別器435は、メッシュ104及び106、変換406及び408、並びに表現410及び418に対応するデータの様々な表現を受け取ることができる。手法400によれば、識別器435は、予測された中間歯の移動406から入力がいつ生成されるか、又はグラウンドトゥルースの中間歯の移動408から入力がいつ生成されるかを決定するように構成される。例えば、一実施態様では、識別器435は、入力が、予測された中間歯の移動408から生成されたと識別器435が決定したときに「偽」の指示を出力することができ、入力がグラウンドトゥルースの中間歯の移動406から生成されたときに「真」の指示を出力することができる。
【0050】
識別器435は、その他の点では、
図1を参照して説明した識別器435とほぼ同じである。例えば、識別器435が出力を生成した後、手法400は、次いで、識別器435の出力を入力と比較して、識別器が予測された歯の移動表現410とグラウンドトゥルースの歯の移動表現418とを正確に区別したか否かを判定する。例えば、識別器435の出力は、表現の注釈と比較することができる。出力と注釈が一致する場合、識別器435は、識別器435が受信した入力のタイプを正確に予測した。逆に、出力と注釈が一致しない場合、識別器435は、識別器435が受信した入力のタイプを正確に予測しなかった。いくつかの実施態様では、生成器411と同様に、識別器435もまたランダムノイズを受信して、識別器435を意図的に混乱させようとしてもよい。
【0051】
更に、特定の実施態様によれば、識別器435は、手法400を実装するシステムの態様を訓練するために使用され得る追加の値を生成し得る。一例では、識別器435は、識別器損失値136を生成することができ、これは、識別器435が、入力が予測された中間歯の移動表現410及び/又はグラウンドトゥルース中間歯の移動表現418に対応するか否かを識別器がどの程度正確に決定したかを反映する。特定の実施態様によれば、識別器損失136は、識別器435がその予測においてあまり正確でないときにより大きくなり、識別器435がその予測においてより正確であるときにより小さくなる。別の例では、識別器435は、生成器損失値G2 138を生成し得る。特定の実施態様によれば、生成器損失値G2 138は、識別器損失136に対して直接的に逆ではないが、概して、識別器損失136に対して逆の関係を示す。すなわち、識別器損失136が大きいとき、生成器損失G2 138は小さく、識別器損失136が小さいとき、生成器損失G2 138は大きい。いくつかの実施態様では、識別器損失136は、「真」のモデルと「偽」のモデルの両方について計算されるバイナリクロスエントロピー損失関数を使用して決定され得る。いくつかの実施態様では、生成器損失は、2つの損失から構成され得る。すなわち、1)第1の損失は、識別器によって決定されるような生成器損失G2 138である(したがって、バイナリクロスエントロピーが使用され得る)、2)第2の損失は、例えば、生成器損失G1 116によって指定されるような、生成器110の所望の出力と実際の出力との間の差を測定するl1ノルム又は平均二乗誤差によって実装され得る。
【0052】
言い換えれば、
図4に示すように、生成器損失G2 138は、加算演算140を使用して生成器損失G1 116に加算することができる。生成器損失G1 116及びG2 138の合計値は、生成器411を訓練する目的で生成器411に提供することができる。手法400の追加の態様は、後続の図の説明の一部として明らかになるであろう。
【0053】
図5は、
図4に示される手法400を使用して実行されるワークフロー500の例示的な視覚化である。
図4の説明によって理解されるはずであるように、ワークフロー500の第1のステップ502において、初期及び最終の3D位置及び配向データ(例えば、咬合位置104、不正咬合歯列弓106のうちの1つ以上)の両方が、1つ以上の3D幾何形状の形態で受信され、手法400は、ワークフローにおけるステップ204a~204nにおいて、中間位置及び配向情報を計算して、CTAのためのn個の中間段階を生成する。
【0054】
図6は、
図4に示される手法400(本明細書では手法600と呼ぶ)の異なる図である。特定の実施態様によれば、手法300はまず、患者データ402などの患者データにアクセスする。ステップ302において、手法600を実行するプロセッサは、任意選択でランダムノイズを生成することができる。次に、プロセッサは、患者症例データ、最終的な歯のセットアップ404、及び任意選択のランダムノイズを生成器411に提供する。
図4を参照して上述したように、プロセッサは、訓練された生成器411に、予測された中間歯の移動表現410を決定するために使用することができる予測された中間歯の移動406を生成させる命令を実行する。
【0055】
手法600を実行するシステムはまた、ステップ304において1つ以上のグランドトゥルース変換にアクセスし、モジュール102によって受信された選択された患者症例データに対応する1つ以上のサンプルグランドトゥルース中間変換408を選択することができる。
図4を参照して上述したように、1つ以上のサンプルグラウンドトゥルースの変換408を使用して、グラウンドトゥルースの歯の移動表現418を生成することができる。次に、手法600を実行するシステムは、受信モジュール402によって受信された患者症例データ、予測された歯の移動表現410、及びグラウンドトゥルースの歯の移動表現418のいずれかを識別器435に提供することができる。
【0056】
次に、手法400を参照して説明したように、ステップ306において、識別器435は、入力が真のグラウンドトゥルースの変換であるか、又は偽のグラウンドトゥルースの変換であるかの確率を提供することによって、入力がグラウンドトゥルースの変換に対応するか否かを決定する。いくつかの実施態様では、識別器435によって返される確率は、0から1の範囲内であり得る。すなわち、識別器435は、入力が真である(すなわち、予測された中間歯の移動406に対応する)低い確率を示すために0に近い値を提供することができ、又は入力が真である(すなわち、グラウンドトゥルースの中間歯の移動408に対応する)高い確率を示すために1に近い値を提供することができる。
【0057】
図4を参照して上述したように、識別器435の出力は、識別器435及び生成器411の両方を訓練するために使用することができる。
【0058】
図7は、幾何学的深層学習を使用する手法100の態様に焦点を当てる、
図1に示される手法100の拡大
図700である。特定の実施態様によれば、3Dメッシュ104及び106に関する幾何学的情報は、メッシュ変換器702によって識別又は他の方法で決定され得る。
図1には含まれていないが、手法100の多くの実施態様は、メッシュ変換器702を利用することが意図されており、その理由は、そのようにすることによって、生成器110の出力の予測品質を改善することと、上述のように生成器110の出力に基づくGANのための訓練を改善することとの両方に関連する手法100に様々な利益がもたらされるからである。
【0059】
図7に示すように、受信モジュール102は、3D咬合位置幾何形状104及び3D不正咬合歯列弓幾何形状106をメッシュ変換器702に提供することができる。一般に、よく確立された定義によれば、3D幾何形状104及び106は、頂点の集合によって定義され、頂点の各対は、3Dポリゴンの辺を指定し、辺の集合は、3D幾何形状の1つ以上の面(又は表面)を指定することができる。したがって、特定の実施態様によれば、これは、3Dメッシュ変換器702が3Dメッシュ104及び106をそれらのそれぞれの構成部分に分解することを可能にする。
【0060】
別の言い方をすれば、3Dメッシュ変換器702は、3Dメッシュ104及び106から様々な幾何学的特徴を抽出又は生成することができ、次いで、これらの変換されたメッシュデータは、生成器110への入力データとして使用される。例えば、3Dメッシュ変換器702は、1つ以上のメッシュ辺リスト704、1つ以上のメッシュ面リスト706、及び1つ以上のメッシュ頂点リスト708のうちの1つ以上を生成することができる。
【0061】
生成器110にこの追加情報を提供することによって、いくつかの利点を実現することができる。例えば、この情報を生成器110に提供することは、生成器110がより正確な予測された歯の移動112を生成することを可能にする。生成器110の訓練と識別器134の訓練の両方が、予測された歯の移動112の品質に少なくとも部分的に基づくので、これは、手法100を実装するシステムの訓練が改善されることを可能にする。要するに、手法100の一部としてメッシュ変換器702を実装することは、生成器110及び識別器134において構成されるニューラルネットワークが経験しなければならない訓練エポックの数を低減することができ、同時に精度も改善する。別の言い方をすれば、手法100の一部としてメッシュ変換器702を使用することにより、手法100を実行するシステムは、説明したように訓練されるモデルを改善しながら、訓練プロセスに関与する計算リソースを節約することができる。
【0062】
更に、拡大
図700の説明において、限定するものとして考慮されるべきではない。例えば、拡大
図700は、
図1に提示される手法100に関連して示され、説明されるが、拡大
図700は、
図4に示される手法400の一部としても使用され得ることを理解されたい。例えば、
図7の受信モジュール102は、
図4に示される受信モジュール402で置き換えることができる。これにより、例えば、手法400は、手法100に関連して上述したのと同じ改善されたコンピューティングリソースの利用及びモデル精度を達成することができる。唯一の違いは、手法100が最終セットアップの予測を生成するのに対して、手法400が中間段階の予測を生成することである。換言すれば、
図7においてモジュール102をモジュール402で置換することはまた、生成器411が生成器110の代わりに置換されることを引き起こし、生成器411は、予測された歯の移動112の代わりに予測された中間歯の移動406を生成する。しかし、これらの構成変更にもかかわらず、手法400は、それでもなお、上述の幾何学的深層学習からの改善を活用することができる。
【0063】
図8~
図12は、特定の実施態様による生成器110の特定の態様を示す。これらの図示された実施態様では、生成器110は、第1の3Dエンコーダ、3D U-Netエンコーダ-デコーダ、又は3Dピラミッドエンコーダ-デコーダのうちの少なくとも1つとして構成することができ、その後に第2の3Dエンコーダ(任意選択で多層パーセプトロン(multi-layer perceptron、MLP)と置き換えることができる)が続く。生成器は、1つ以上のニューラルネットワークとして実装され得るので、生成器は、活性化関数を含み得る。活性化関数は、ニューラルネットワーク内のニューロンが発火する(例えば、出力を次の層に送る)か否かを決定する。いくつかの活性化関数は、バイナリステップ関数、及び線形活性化関数を含み得る。他の活性化関数は、ネットワークに非線形挙動を与え、シグモイド/ロジスティック活性化関数、Tanh(双曲線正接)関数、整流線形単位(rectified linear unit、ReLU)、リーキーReLU関数、パラメトリックReLU関数、指数線形単位(exponential linear unit、ELU)、ソフトマックス関数、スウィッシュ関数、ガウス誤差線形単位(Gaussian error linear unit、GELU)、及びスケーリングされた指数線形単位(scaled exponential linear unit、SELU)を含む。線形活性化関数は、出力層において、(他のアプリケーションの中でも)いくつかの回帰アプリケーションによく適し得る。シグモイド/ロジスティック活性化関数は、出力層において、(他のアプリケーションの中でも)いくつかのバイナリ分類アプリケーションによく適し得る。ソフトマックス活性化関数は、出力層において、(他のアプリケーションの中でも)いくつかのマルチクラス分類アプリケーションによく適し得る。シグモイド活性化関数は、出力層において、(他のアプリケーションの中でも)いくつかのマルチラベル分類アプリケーションによく適し得る。ReLU活性化関数は、隠れ層において、(他のアプリケーションの中でも)いくつかの畳み込みニューラルネットワーク(convolutional neural network、CNN)アプリケーションによく適し得る。Tanh及び/又はシグモイド活性化関数は、(他のアプリケーションの中でも)いくつかのリカレントニューラルネットワーク(recurrent neural network、RNN)アプリケーションにおいて、例えば、隠れ層において、よく適し得る。
【0064】
勾配降下法(1階微分値を使用して訓練勾配を決定し、ニューラルネットワークの訓練において一般的に使用される)、ニュートン法(勾配降下法よりも良好な訓練方向を見出すために損失計算において2階微分値を利用し得るが、ヘッセ行列を伴う計算を必要とし得る)、及び共役勾配法(勾配降下法よりも速い収束を有し得るが、ニュートン法によって必要とされ得るヘッセ行列計算を必要としない)を含む、本開示のニューラルネットワークの訓練において使用され得る複数の最適化アルゴリズムが存在する。バックプロパゲーションアルゴリズムは、損失計算の結果をネットワークに転送して戻すために使用され、その結果、ネットワーク重みを調整することができ、学習を進めることができる。
【0065】
いくつかの実施態様では、本開示のニューラルネットワークは、3D点群データ上で(代替として、3Dメッシュ又は3Dボクセル化幾何形状上で)動作するように適合されることができる。多数のニューラルネットワークの実施態様が、3D表現の処理に適用されてもよく、PointNet、PointNet++、SO-Net、球状畳み込み、モンテカルロ畳み込み及び動的グラフネットワーク、PointCNN、ResNet、MeshNet、DGCNN、VoxNet、3D-ShapeNets、Kd-Net、Point GCN、Grid-GCN、KCNet、PD-Flow、PU-Flow、MeshCNN及びDSG-Netを含む、口腔ケア用途のための予測及び/又は生成モデルの訓練に適用されてもよい。
【0066】
上述したように、各歯のメッシュ104及び106は、辺、面及び頂点などのいくつかのメッシュ要素を含む。いくつかの実施態様では、メッシュ104及び106に含まれる辺は、正確な予測を生成する際により有用であり得るが、面及び頂点に対して動作を実行することもできる。予測を行うために辺を使用する場合、各辺のメッシュ要素について特徴ベクトルが計算される。特徴ベクトルは、頂点の3D座標、又は辺の曲率及び中点などの、様々な3D幾何学的表現を含み得る。他の特徴も可能である。特定の実施態様によれば、エンコーダ-デコーダ構造の出力は、入力と同じ解像度を維持する(すなわち、入力及び出力は同じ数の要素を有する)。一般に、エンコーダ-デコーダ構造(U-Netアーキテクチャ又はピラミッドアーキテクチャのいずれか)は、例えば、1つ以上の歯のメッシュを、第2のエンコーダが最終セットアップ又は中間段階のいずれかのための歯の変換を生成するために使用することができる表現(歯のメッシュに関するローカル情報及びグローバル情報のいずれか又は両方を含むことができる)に変換することによって、歯のメッシュから高次元の特徴を抽出する働きをする。
【0067】
更に、明示的に示されていないが、
図8~
図12の追加の実施態様は、U-Netエンコーダ-デコーダ806又はピラミッドエンコーダ-デコーダ1004をエンコーダ(
図8及び
図10に示されたエンコーダ814など)で置き換える。この実施態様によれば、生成器110は、より低い解像度のメッシュに対して動作する。すなわち、第1のエンコーダ(図示されていないが、それぞれ、
図8及び
図10のU-Netエンコーダ-デコーダ806又はピラミッドエンコーダ-デコーダ1004のいずれかに取って代わる)は、エンコーダ814によって受信される入力幾何形状の解像度を粗くする。これは、生成器110のメモリ消費を低減することを含む特定の利点を提供する。とは言うものの、これらの改善を達成するために、限定はしないが、各要素について(すなわち、3D幾何形状内の各辺、面、又は頂点について)歯のラベルのリストを維持することを含む追加の処理が行われ得る。
【0068】
図8は、
図1又は
図4のいずれかに示され、U-Netアーキテクチャを使用する生成器110の例示的なワークフロー800を示す。ワークフローのステップ802において、入力は、辺要素として抽出され得るデータフォーマットに入力を修正するように処理される。一般に、ステップ802は、第1のサイズの特徴ベクトルを有するメッシュデータを取り、機械学習モデルに提供し、機械学習モデルは、メッシュデータに対応する第2のサイズの特徴ベクトルを生成する。
【0069】
図8に示されるように、ステップ804におけるメッシュデータは、歯のメッシュ104及び106の任意の組み合わせであり得る。これらのメッシュ104及び106は、辺、面、頂点、及び/又はボクセルなどの、数千又は数万のメッシュ要素を含み得る。1つ以上のメッシュ要素について、1つ以上のメッシュ特徴ベクトルが計算され得る。メッシュ要素及び任意の関連付けられたメッシュ特徴ベクトルは、生成器に入力され得る。通常、メッシュ104及び106内のメッシュ要素の各々は、特徴に応じて、可変サイズを有する特徴ベクトルによって記述することができる。例えば、点を記述するとき、メッシュ要素は、3チャネルベクトルによって記述されてもよく、3つのチャネルは、3次元空間における位置のX、Y、及びZ座標を記述する。辺を記述するとき、メッシュ要素は、辺を定義する各頂点に1つずつ、2つの整数によって表されてもよく、各整数は、メッシュを構成する頂点のアレイへのインデックスである。面を記述する場合、メッシュ要素は、面を定義する各頂点に1つずつ、3つの整数によって表すことができる。ボクセルを記述するとき、メッシュ要素は、空間の立方体積によって表され得る。いくつかの実施態様では、3Dメッシュの頂点のリストが、オープンソースMinkowskiEngineツールキットに供給され得、オープンソースMinkowskiEngineツールキットは、スパース(sparce)処理のためにそれらの頂点をボクセルに変換し得る。いくつかの実施態様では、メッシュ特徴ベクトルは、1つ以上のメッシュ要素について計算され得る。メッシュ特徴部は、特定のメッシュ要素の位置におけるメッシュの属性(例えば、幾何学的及び/又は構造的属性)を記述する量である。いくつかの実施態様では、メッシュ要素のみが生成器に入力される。いくつかの実施態様では、各メッシュ要素は、上記の表1に関連して説明した特徴ベクトルなどの、関連するメッシュ要素特徴ベクトルを伴う。更に、特徴ベクトルは、総計9個のチャネルに対して、メッシュ曲率情報(3個のチャネルの追加)及び辺法線ベクトル情報(更なる3個のチャネルの追加)などの追加情報を含むことができる。更に他の特徴ベクトル構成も可能であり、対応するチャネル数を伴う。これまで説明した3Dメッシュは、歯を記述するために使用することができるいくつかのタイプの3D表現のうちの1つにすぎない。3D表現の他の形態は、3D点群及びボクセル化表現を含む。
【0070】
ステップ806で使用されるU-Netアーキテクチャは、最初に入力された歯のメッシュ804の解像度を低下させ、次いで、簡略化された歯のメッシュ(すなわち、低解像度メッシュ)を元の解像度に復元することによって機能する。この動作は、隣接する歯についての情報(又は歯列弓全体についての情報)が捕捉され、特徴の計算に統合されることを可能にする。ワークフロー800のステップ808において、特徴ベクトルが、高次元空間(例えば、128個のチャネル)内の各要素(例えば、各辺)について計算される。
【0071】
ワークフローのステップ810において、歯ごとに、エンコーダ-デコーダ構造の出力から高次元の特徴を有する要素が抽出される。これは、ワークフロー800のステップ814で別のエンコーダに提供されるn個の歯の辺812a~812nを生成する。エンコーダは、歯の移動を予測するために、所与の歯の高次元の特徴によるバックプロパゲーションによって訓練される。バックプロパゲーションは、ニューラルネットワークを訓練するための十分に確立された手法であり、当業者に知られている。
【0072】
ワークフロー800のステップ814におけるエンコーダの出力は、(
図1~
図3を参照して説明した最終セットアップ又は
図4~
図6を参照して説明した中間段階のいずれかについて)歯を所望の位置に移動させるために、歯に適用される予測された歯の移動112である。ワークフロー800のステップ814におけるエンコーダは、歯のアイデンティティにかかわらず、歯の変換を出力するようにバックプロパゲーションを介して訓練される。図に示されるこれらの実施態様では、同じエンコーダが、2つの歯列弓形状106の各々に存在する歯の各々を処理するように訓練される。他の実施態様では、エンコーダは、特定の歯又は歯の特定のセットを提供するように訓練され得る。この後者の実施態様は、図示されたものだけでなく、ステップ814において複数のエンコーダとしてワークフロー800において反映されると考えられる。
【0073】
図9は、
図8に示される例示的なU-Netアーキテクチャ900を示す。全般的には、U-Netアーキテクチャは、プーリング層904a及び904bなどのいくつかのプーリング層を使用する。畳み込み層902a、902b、908a、908b、及び910などの畳み込み層に関連するプーリング層は、メッシュ入力をダウンサンプリング又は縮小する。例えば、3D空間における情報のダウンサンプリングは、3×3×3の情報セットを取得し、それを単一の1×1×1の表現に組み合わせることができる。3Dメッシュ情報のコンテキストでは、例えば、所与の辺の4つの隣接辺が、次の解像度レベルで単一の辺に結合される。ダウンサンプリング後のメッシュ解像度(メッシュ表面積)は、4倍だけ減少する。
【0074】
特定の実施態様によれば、畳み込み層902a、902b、908b、908b、及び910は、辺データを使用して、メッシュ畳み込みを実行することができる。辺情報の使用は、モデルが3D要素の異なる入力順序にセンシティブでないことを保証する。辺データを使用することに加えて、又はそれとは別に、畳み込み層902a、902b、908b、908b、及び910は、メッシュ畳み込みを実行するために頂点データを使用し得る。頂点情報の使用は、典型的には辺又は面よりも少ない頂点が存在するという点で有利であり、したがって、頂点指向処理は、より低い処理オーバーヘッド及びより低い計算コストにつながり得る。
【0075】
辺データ若しくは頂点データを使用することに加えて、又はそれとは別に、畳み込み層902a、902b、908b、908b、及び910は、面データを使用して、メッシュ畳み込みを実行することができる。更に、辺データ、頂点データ、若しくは面データを使用することに加えて、又はそれとは別に、畳み込み層902a、902b、908b、908b、及び910は、ボクセルデータを使用して、メッシュ畳み込みを実行することができる。ボクセル情報の使用は、選択された粒度に応じて、メッシュ内の頂点、辺、又は面と比較して処理すべきボクセルが著しく少なくなり得るという点で有利である。(ボクセルを用いた)低密度処理は、(特に、コンピュータメモリ又はRAM使用に関して)より低い処理オーバーヘッド及びより低い計算コストにつながり得る。
【0076】
図8を参照して上述したように、U-Netアーキテクチャ900の目的は、入力メッシュ(1つ以上の歯のメッシュについてのローカル情報及びグローバル情報のいずれか又は両方を含み得る)についての高次元の特徴ベクトルを計算することである。例えば、特定の実施態様によれば、U-Netアーキテクチャ900は、各メッシュ要素の特徴ベクトル(例えば、各辺の128要素特徴ベクトル)を計算する。このベクトルは、局所的な歯のコンテキスト内の辺の局所的な幾何形状を表すことができ、2つの歯列弓の全体的な幾何形状も表すことができる高次元空間に存在する。各歯内の要素の高次元の特徴は、歯の移動を予測するためにエンコーダによって使用される。歯の移動予測の精度は、このローカル情報とグローバル情報との組み合わせによって支援される。ローカル情報とグローバル情報の組み合わせにより、U-Netアーキテクチャ900は、幾何学的制約を考慮することができる。例えば、CTA治療の過程で、歯が3D空間で衝突することは望ましくない。ローカル情報とグローバル情報の組み合わせにより、U-Netアーキテクチャ900は、衝突の発生を低減又は排除する変換を生成することができ、したがって、従来技術に比べてより高い精度をもたらすことができる。別の言い方をすれば、メッシュ要素特徴部を使用して、機械学習モデル(U-Netアーキテクチャ900など)を訓練することの、従来の手法に対する1つの利点は、メッシュ要素特徴部が、歯のメッシュの幾何形状及び構造のうちの少なくとも1つに関する追加の情報を提供することであり、これは、訓練されたU-Netアーキテクチャから生成される、結果として得られる表現(複数可)を改善する。
【0077】
U-Netアーキテクチャ900は、メッシュ要素近隣情報を抽出するプロセスを支援するプーリング動作及びアンプーリング動作を伴う。各連続するプーリング層は、前の層に対して解像度を減少させることによって、モデルが隣接する幾何形状情報を学習するのを助ける。各連続するアンプーリング層は、モデルがこの要約された近傍情報をより高い解像度に拡張して戻すのを助ける。アンプーリング層の配列に続くプーリング層の配列は、U-Netの効率的かつ正確な訓練を可能にし、U-Netがローカル及びグローバル幾何形状情報の両方を含む各要素についての特徴を出力することを可能にする。
【0078】
図9は、合計9つの層で示されているが、U-Netアーキテクチャ900は、所望の結果を達成するために、任意の数の畳み込み層、任意の数のプーリング層、及び任意の数のアンプーリング層で構成することができることを理解されたい。
【0079】
図10は、
図1又は
図4のいずれかに示される生成器110のための例示的ワークフロー1000を示す。ワークフロー1000は、
図8に図示及び記載したワークフロー800と同様である。例えば、ワークフロー800及び1000の両方が、予測された歯の移動112を生成する。更に、特定の実施態様によれば、ワークフロー1000のステップ814におけるエンコーダは、
図8を参照して上述したように、複数のエンコーダで置き換えられてもよい。したがって、簡潔にするために、ワークフロー1000の各要素は説明されず、代わりに、ワークフロー800とワークフロー1000との間の差異のみが言及される。
【0080】
具体的には、ステップ1002において、ステップ806で使用されるU-Netアーキテクチャの代わりに、ピラミッドエンコーダ-デコーダがステップ1004で使用される。予想されるように、ステップ1004で使用されるピラミッドエンコーダ-デコーダは、ステップ806で使用されるU-Netアーキテクチャとは異なって動作する。例えば、各歯のメッシュの入力要素(例えば、ワークフロー1000のステップ804で識別された辺要素)は、エンコーダ構造を通過して、ピラミッド内の特徴の複数の層を生成する。エンコーダの各連続層は、より少ない要素を有するが、要素は、特徴ベクトル内の歯のメッシュに関するより高次元の情報を明らかにする。換言すれば、ピラミッドアーキテクチャにおける各連続層は、歯のメッシュに関するより高い次元の情報を明らかにするように構成される。更に、一連の低解像度からの特徴を元の歯のメッシュの入力解像度に戻すために、各層において補間ステップが実行される。複数の層から補間された特徴は、連結され、更に処理されて、ピラミッドエンコーダ-デコーダの出力として各メッシュ要素の高次元の特徴となる。
【0081】
ステップ1004で生成されたピラミッドエンコーダアーキテクチャの出力は、ステップ806で生成されたU-Netアーキテクチャの出力がワークフロー800の残りの部分によって使用される方法と同様に、ワークフロー1000の残りの部分によって使用される。重要なことに、ワークフロー800と同様に、ワークフロー1000の最終結果は、予測された歯の移動112である。これは、上述の手法100及び400が、生成器110及び411のタイプの実施態様にとらわれないことを可能にする。この柔軟性は、システム全体を再構成しなくてもよい、異なって訓練されたU-Net及びピラミッドアーキテクチャベースの生成器の精度を調査する能力を含むが、これに限定されない様々な利点を提供する。これは、例えば、手法100及び400を実装するシステムが、システムの中断又は性能の劣化なしに、モジュール102又は402によって受信されたある種類の患者症例データに対して訓練された1つの生成器110又は411と、異なる種類の患者症例データに対して訓練された別の生成器110又は411と、を使用することを可能にし得る。いくつかの実施態様では、生成器110又は411は、すべてのタイプの歯(例えば、切歯、犬歯、小臼歯、大臼歯など)のための歯の移動を生成するように訓練されることができる。他の実施態様では、1つの生成器110又は411は、前歯(例えば、切歯及び犬歯)のみに対して訓練されてもよく、別の生成器110又は411は、臼歯(例えば、小臼歯及び臼歯)のみに対して訓練されてもよい。この後者の手法の利点は、2つの生成器110又は411の各々が、それら自体の特定の幾何形状を有する特定の歯のための変換を生成するように調整されるので、精度が改善されることである。
【0082】
ステップ806におけるU-Net構造は、各メッシュ要素について学習された近隣幾何形状情報の細粒度表現のために、高いコンピュータメモリ使用量を伴う。ステップ806におけるU-Net構造の利点は、計算のために使用されるきめの細かいデータに見合った、歯の移動の非常に正確な予測である。ステップ1004におけるピラミッドエンコーダ構造は、より低いメモリ要件が存在する場合(コンピューティング環境が、ステップ806におけるU-Net構造の使用に関与する細粒度データを処理することができない場合など)に代替として使用され得る。ステップ1004におけるU-Netアーキテクチャ900又はピラミッドアーキテクチャをエンコーダで置き換える、上述の代替構造を実装することによって、更なるメモリの節約を実現することができる。
【0083】
図11は、
図10に示される例示的なピラミッドエンコーダ-デコーダ1100を示す。前述したように、ピラミッドエンコーダ-デコーダは、連続する層1104a~1104nを有する。ピラミッドアーキテクチャ1100がワークフロー1000のステップ1004の間に使用される方法も前述した。特に、第1のステップ1102において、ピラミッドアーキテクチャ1100は、より低いメッシュ解像度の連続する層を生成する。このステップは、歯のメッシュについての高次元情報を明らかにし、この高次元情報は、ピラミッドアーキテクチャ1100が出力として生成する特徴ベクトルに含まれる。
【0084】
次に、ステップ1106において、ピラミッドアーキテクチャ1100は、補間を使用してメッシュ要素(例えば、辺、面、又は頂点)の各連続層の解像度を増加させる。例えば、ピラミッドアーキテクチャ1100内に含まれるエンコーダは、連続する層1110a~1110nを含み、それによって、各メッシュ要素がダウンサンプリングされて、一連の解像度のそれぞれにおけるメッシュに関する情報が抽出される。各連続層は、追加の特徴チャネルを包含されたメッシュ要素の各々に帰属させる。各連続層は、メッシュ要素が属する歯のより大きな部分、更には隣接する歯に関する情報、歯列弓全体に関する情報、又は更には2つの歯列弓全体に関する情報を包含する。補間は、低解像度層からのグローバルメッシュ情報を高解像度層からのローカルメッシュ情報と連結するプロセスを容易にするために実行される。図示のように、この補間の結果、層1110a~1110nが得られる。最後に、ステップ1108において、ピラミッドアーキテクチャ1100は、入力メッシュの要素を連続する層の要素と連結して、アーキテクチャ1100の出力を生成する。特定の実施態様によれば、最終的な集中ベクトルは、すべて同じ解像度(すなわち、同じ要素数)である。
【0085】
図12は、
図8及び
図10に示される例示的なエンコーダ814を示す。図示されるように、エンコーダ814は、畳み込み層1202a、1202b、及び1206、並びにプーリング層1204a及び1204bの集合である。
図12は、合計5つの層で示されているが、エンコーダ814は、任意の数の層で構成され得ることを理解されたい。
【0086】
図13は、本開示の手法に従って動作する例示的な処理ユニット1302を示す。処理ユニット1302は、上述したニューラルネットワークのうちの1つ以上の訓練のためのハードウェア環境を提供する。例えば、処理ユニット1302は、ニューラルネットワーク110及び134を訓練するために手法100及び/又は400を実行し得る。
【0087】
この例では、処理ユニットは、1つ以上のプロセッサ1304及びメモリ1306を含み得る処理回路を含み、これらは、いくつかの例では、例えば、リアルタイムマルチタスクオペレーティングシステム、又は他のタイプのオペレーティングシステムであり得るオペレーティングシステム1316を実行するためのコンピュータプラットフォームを提供する。次に、オペレーティングシステム1316は、アプリケーション1318などの1つ以上のソフトウェアコンポーネントを実行するためのマルチタスク動作環境を提供する。プロセッサ1304は、キーボード、コントローラ、ディスプレイデバイス、画像キャプチャデバイス、他のコンピューティングシステムなどのデバイスと通信するためのI/Oインターフェースを提供する1つ以上のI/Oインターフェース1314に連結される。更に、1つ以上のI/Oインターフェース1314は、ネットワークと通信するための1つ以上の有線又は無線ネットワークインターフェースコントローラ(network interface controller、NIC)を含んでもよい。加えて、プロセッサ1304は、電子ディスプレイ1308に連結され得る。
【0088】
この例では、処理ユニットは、1つ以上のプロセッサ1304及びメモリ1306を含み得る処理回路を含み、これらは、いくつかの例では、例えば、リアルタイムマルチタスクオペレーティングシステム、又は他のタイプのオペレーティングシステムであり得るオペレーティングシステム1316を実行するためのコンピュータプラットフォームを提供する。次に、オペレーティングシステム1316は、アプリケーション1318などの1つ以上のソフトウェアコンポーネントを実行するためのマルチタスク動作環境を提供する。プロセッサ1304は、キーボード、コントローラ、ディスプレイデバイス、画像キャプチャデバイス、他のコンピューティングシステムなどのデバイスと通信するためのI/Oインターフェースを提供する1つ以上のI/Oインターフェース1314に連結される。更に、1つ以上のI/Oインターフェース1314は、ネットワークと通信するための1つ以上の有線又は無線ネットワークインターフェースコントローラ(NIC)を含んでもよい。加えて、プロセッサ1304は、電子ディスプレイ1308に連結され得る。
【0089】
いくつかの例では、プロセッサ1304及びメモリ1306は、別個の個別的な構成要素であり得る。他の例では、メモリ1306は、単一の集積回路内でプロセッサ1304とコロケートされたオンチップメモリであり得る。並行してアプリケーションを実行することを容易にするために、処理ユニット1302内に処理回路(例えば、複数のプロセッサ1304及び/又はメモリ1306)の複数のインスタンスが存在し得る。複数のインスタンスは、同じタイプ、例えば、マルチプロセッサシステム又はマルチコアプロセッサであってもよい。複数のインスタンスは、異なるタイプ、例えば、関連付けられた複数のグラフィックスプロセッサユニット(graphics processor unit、GPU)を有するマルチコアプロセッサであってもよい。いくつかの例では、プロセッサ1304は、1つ以上のマイクロプロセッサ、デジタル信号プロセッサ(digital signal processor、DSP)、特定用途向け集積回路(application specific integrated circuit、ASIC)、フィールドプログラマブルゲートアレイ(field-programmable gate array、FPGA)、又は同等のディスクリート若しくは集積論理回路、又は前述のデバイス若しくは回路のいずれかの組み合わせとして実装されてもよい。
【0090】
図13に示される処理ユニット1302のアーキテクチャは、例示目的のみのために示されている。処理ユニット1302は、図示された例示的なアーキテクチャに限定されるべきではない。他の例では、処理ユニット1302は、様々な方法で構成され得る。処理ユニット1302は、本開示の少なくとも1つの態様に従って説明される動作及び/又は機能を実行することが可能であり得る、任意の好適なコンピューティングシステム(例えば、少なくとも1つのサーバコンピュータ、ワークステーション、メインフレーム、アプライアンス、クラウドコンピューティングシステム、及び/又は他のコンピューティングシステム)として実装され得る。例として、処理ユニット1302は、クラウドコンピューティングシステム、サーバコンピュータ、デスクトップコンピュータ、サーバファーム、及び/又はサーバクラスタ(又はその一部)を表すことができる。他の例では、処理ユニット1302は、データセンタ、クラウドコンピューティングシステム、サーバファーム、及び/若しくはサーバクラスタの少なくとも1つの仮想化されたコンピュートインスタンス(例えば、仮想マシン又はコンテナ)を表してもよいか、又はそれを通じて実装されてもよい。いくつかの例では、処理ユニット1302は、少なくとも1つのコンピューティングデバイスを含み、各コンピューティングデバイスは、メモリ1306及び少なくとも1つのプロセッサ1304を有する。
【0091】
ストレージユニット1334は、動作中に処理ユニット1302内の情報(例えば、幾何形状104及び106、又は変換114若しくは408)を格納するように構成され得る。ストレージユニット1334は、コンピュータ可読記憶媒体又はコンピュータ可読記憶デバイスを含み得る。いくつかの例では、ストレージユニット1334は、少なくとも短期メモリ又は長期メモリを含む。ストレージユニット1334は、例えば、ランダムアクセスメモリ(random access memory、RAM)、ダイナミックランダムアクセスメモリ(dynamic random-access memory、DRAM)、スタティックランダムアクセスメモリ(static random-access memory、SRAM)、磁気ディスク、光ディスク、フラッシュメモリ、磁気ディスク、光ディスク、フラッシュメモリ、又は電気的プログラマブルメモリ(electrically programmable memory、EPROM)若しくは電気的消去可能プログラマブルメモリ(electrically erasable and programmable memory、EEPROM)の形態を含み得る。
【0092】
いくつかの例では、ストレージユニット1334は、プロセッサ1304による実行のためのプログラム命令を格納するために使用される。ストレージユニット1334は、処理ユニット1302上で動作するソフトウェア又はアプリケーションによって使用されて、プログラム実行中に情報を格納し、プログラム実行の結果を格納することができる。例えば、ストレージユニット1334は、ニューラルネットワーク構成110及び134を、各々が手法100及び400を使用して訓練されているときに格納することができる。
【0093】
本明細書は、多くの具体的な実施態様の詳細を説明するが、これらは、特許請求され得るものの範囲に対する限定として解釈されるべきではなく、むしろ、特定の実施態様に特有であり得る特徴の説明として解釈されるべきである。別個の実施態様の文脈で本明細書において説明される特定の特徴はまた、単一の実施態様において組み合わせて実装され得る。逆に、単一の実施態様の文脈で説明される様々な特徴はまた、複数の実施態様において別々に、又は任意の好適な部分組み合わせにおいて実装され得る。更に、特徴は、特定の組み合わせで作用するものとして上記で説明され、最初にそのように特許請求されてもよいが、特許請求される組み合わせからの1つ以上の特徴は、場合によっては、組み合わせから削除することができ、特許請求される組み合わせは、部分組み合わせ又は部分組み合わせの変形形態を対象とすることができる。
【0094】
同様に、動作は特定の順序で図面に示されているが、これは、所望の結果を達成するために、そのような動作が示された特定の順序で若しくは連続的な順序で実行されること、又はすべての図示された動作が実行されることを必要とすると理解されるべきではない。特定の状況では、マルチタスキング及び並列処理が有利であり得る。更に、上記で説明した実施態様における様々なシステムモジュール及び構成要素の分離は、すべての実施態様においてそのような分離を必要とすると理解されるべきではなく、説明した構成要素及びシステムは、一般に、単一のシステムに一緒に統合され得るか、又は複数のシステムにわたって分散され得ることを理解されたい。
【0095】
主題の特定の実施態様について説明してきた。他の実施態様は、以下の特許請求の範囲内にある。
【国際調査報告】