IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社モリタ製作所の特許一覧

特許7469351識別装置、識別方法、および識別プログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-08
(45)【発行日】2024-04-16
(54)【発明の名称】識別装置、識別方法、および識別プログラム
(51)【国際特許分類】
   A61C 19/04 20060101AFI20240409BHJP
【FI】
A61C19/04 Z
【請求項の数】 11
(21)【出願番号】P 2022050077
(22)【出願日】2022-03-25
(65)【公開番号】P2023142939
(43)【公開日】2023-10-06
【審査請求日】2023-06-30
(73)【特許権者】
【識別番号】000138185
【氏名又は名称】株式会社モリタ製作所
(74)【代理人】
【識別番号】110001195
【氏名又は名称】弁理士法人深見特許事務所
(72)【発明者】
【氏名】鍛治 亮佑
(72)【発明者】
【氏名】西村 巳貴則
【審査官】望月 寛
(56)【参考文献】
【文献】国際公開第2020/185527(WO,A1)
【文献】特開2020-096691(JP,A)
【文献】特開2021-111254(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
A61C 19/04
(57)【特許請求の範囲】
【請求項1】
口腔内の複数の物体を識別する識別装置であって、
前記複数の物体の各々の位置情報を含む位置データが入力される入力部と、
前記入力部から入力される前記位置データと、少なくとも前記口腔内において互いに相対的な位置関係が定まる前記複数の物体の各々の位置データに基づき前記複数の物体の各々を推定するための機械学習が行われた推定モデルとに基づき、前記複数の物体のうちの少なくとも1つの物体を識別する演算部とを備え
前記推定モデルは、前記複数の物体の各々の位置情報を含む前記位置データと、前記複数の物体の各々を示す正解ラベルと、前記複数の物体の間における相対的な位置関係を示しかつ前記複数の物体の各々の前記位置データに対応付けられている位置関係ラベルとを含む学習用データを用いて、前記位置データに基づき前記複数の物体の各々を推定するように機械学習が行われている、識別装置。
【請求項2】
前記複数の物体は、歯牙、舌、唇、小帯、歯肉、粘膜、補綴物、および前記口腔内に挿入される挿入物体のうちの少なくとも1つを含む、請求項1に記載の識別装置。
【請求項3】
前記挿入物体は、前記口腔内を撮像するための撮像装置が前記口腔内に挿入される際に、前記口腔内の軟組織を押さえるために挿入される指および診療器具のうちの少なくとも1つを含む、請求項2に記載の識別装置。
【請求項4】
前記学習用データにおいては、前記位置関係ラベルが、対応する前記位置データに近接するように配列されている、請求項1~請求項3のいずれか1項に記載の識別装置。
【請求項5】
前記位置関係ラベルは、歯牙が存在する第1領域、舌が存在する第2領域、唇が存在する第3領域、前記第1領域と前記第2領域との間の第4領域、および前記第1領域と前記第3領域との間の第5領域のうちの少なくとも1つを示すデータを含む、請求項1~請求項3のいずれか1項に記載の識別装置。
【請求項6】
前記複数の物体は、前記口腔内に挿入される挿入物体を含み、
前記挿入物体は、前記第4領域または前記第5領域に存在する、請求項に記載の識別装置。
【請求項7】
前記複数の物体は、歯科診療に不要な物体として、前記口腔内に挿入される挿入物体、舌、唇、および粘膜(頬裏)のうちの少なくとも1つを含む不要物体を含み、
前記演算部は、前記入力部から入力される前記位置データから、識別結果に基づき特定した前記不要物体に対応する不要位置データを除去する、請求項1に記載の識別装置。
【請求項8】
前記演算部は、前記不要位置データを除去した後の位置データを用いて生成した画像データを出力する、請求項に記載の識別装置。
【請求項9】
前記入力部から入力される前記位置データは、前記口腔内に挿入されて共焦点法または三角測量法に基づき前記口腔内を撮像する撮像装置によって取得される、請求項1に記載の識別装置。
【請求項10】
コンピュータによる口腔内の複数の物体を識別する識別方法であって、
前記複数の物体の各々の位置情報を含む位置データが入力されるステップと、
入力される前記位置データと、少なくとも前記口腔内において互いに相対的な位置関係が定まる前記複数の物体の各々の位置データに基づき前記複数の物体の各々を推定するための機械学習が行われた推定モデルとに基づき、前記複数の物体のうちの少なくとも1つの物体を識別するステップとを含み、
前記推定モデルは、前記複数の物体の各々の位置情報を含む前記位置データと、前記複数の物体の各々を示す正解ラベルと、前記複数の物体の間における相対的な位置関係を示しかつ前記複数の物体の各々の前記位置データに対応付けられている位置関係ラベルとを含む学習用データを用いて、前記位置データに基づき前記複数の物体の各々を推定するように機械学習が行われている、識別方法。
【請求項11】
口腔内の複数の物体を識別する識別プログラムであって、
コンピュータに、
前記複数の物体の各々の位置情報を含む位置データが入力されるステップと、
入力される前記位置データと、少なくとも前記口腔内において互いに相対的な位置関係が定まる前記複数の物体の各々の位置データに基づき前記複数の物体の各々を推定するための機械学習が行われた推定モデルとに基づき、前記複数の物体のうちの少なくとも1つの物体を識別するステップとを実行させ
前記推定モデルは、前記複数の物体の各々の位置情報を含む前記位置データと、前記複数の物体の各々を示す正解ラベルと、前記複数の物体の間における相対的な位置関係を示しかつ前記複数の物体の各々の前記位置データに対応付けられている位置関係ラベルとを含む学習用データを用いて、前記位置データに基づき前記複数の物体の各々を推定するように機械学習が行われている、識別プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、口腔内の複数の物体を識別する識別装置、識別方法、および識別プログラムに関する。
【背景技術】
【0002】
従来、歯科分野においては、三次元スキャナによって口腔内をスキャン(走査)することによって、歯牙などの物体の三次元データを取得する技術が公知である。三次元スキャナによるスキャン中においては、スキャン対象である歯牙などの物体と三次元スキャナとの間に、術者の指または診療器具、あるいは患者の舌などの不要物体が入り込み、三次元スキャナがスキャン対象である物体の三次元データを適切に取得することができない場合がある。この点、特許文献1には、三次元スキャナによって取得された三次元データのうち、ユーザによって選択された三次元データを削除することを可能とする情報処理装置が開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2021-111254号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に開示された情報処理装置によれば、ユーザは、スキャン中に口腔内に不要物体が入り込んだとしても、三次元スキャナによって取得された三次元データを修正することができる。しかしながら、ユーザは、三次元データを修正するために、三次元スキャナによって取得された三次元データに基づき、口腔内の複数の物体を自ら識別して削除対象の三次元データを選択しなければならず、手間が掛かっていた。
【0005】
本開示は、このような問題を解決するためになされたものであり、口腔内の複数の物体を容易にかつ適切に識別することができる技術を提供することを目的とする。
【課題を解決するための手段】
【0006】
本開示の一例に従えば、口腔内の複数の物体を識別する識別装置が提供される。識別装置は、複数の物体の各々の位置情報を含む位置データが入力される入力部と、入力部から入力される位置データと、少なくとも口腔内において互いに相対的な位置関係が定まる複数の物体の各々の位置データに基づき複数の物体の各々を推定するための機械学習が行われた推定モデルとに基づき、複数の物体のうちの少なくとも1つの物体を識別する演算部とを備える。推定モデルは、複数の物体の各々の位置情報を含む位置データと、複数の物体の各々を示す正解ラベルと、複数の物体の間における相対的な位置関係を示しかつ複数の物体の各々の位置データに対応付けられている位置関係ラベルとを含む学習用データを用いて、位置データに基づき複数の物体の各々を推定するように機械学習が行われている。
【0007】
本開示の一例に従えば、コンピュータによる口腔内の複数の物体を識別する識別方法が提供される。識別方法は、複数の物体の各々の位置情報を含む位置データが入力されるステップと、入力される位置データと、少なくとも口腔内において互いに相対的な位置関係が定まる複数の物体の各々の位置データに基づき複数の物体の各々を推定するための機械学習が行われた推定モデルとに基づき、複数の物体のうちの少なくとも1つの物体を識別するステップとを含む。推定モデルは、複数の物体の各々の位置情報を含む位置データと、複数の物体の各々を示す正解ラベルと、複数の物体の間における相対的な位置関係を示しかつ複数の物体の各々の位置データに対応付けられている位置関係ラベルとを含む学習用データを用いて、位置データに基づき複数の物体の各々を推定するように機械学習が行われている。
【0008】
本開示の一例に従えば、口腔内の複数の物体を識別する識別プログラムが提供される。識別プログラムは、コンピュータに、複数の物体の各々の位置情報を含む位置データが入力されるステップと、入力される位置データと、少なくとも口腔内において互いに相対的な位置関係が定まる複数の物体の各々の位置データに基づき複数の物体の各々を推定するための機械学習が行われた推定モデルとに基づき、複数の物体のうちの少なくとも1つの物体を識別するステップとを実行させる。推定モデルは、複数の物体の各々の位置情報を含む位置データと、複数の物体の各々を示す正解ラベルと、複数の物体の間における相対的な位置関係を示しかつ複数の物体の各々の位置データに対応付けられている位置関係ラベルとを含む学習用データを用いて、位置データに基づき複数の物体の各々を推定するように機械学習が行われている。
【発明の効果】
【0009】
本開示によれば、ユーザは、口腔内の複数の物体を容易にかつ適切に識別することができる。
【図面の簡単な説明】
【0010】
図1】実施の形態1に係る識別システムおよび識別装置の適用例を示す図である。
図2】実施の形態1に係る識別装置のハードウェア構成を示すブロック図である。
図3】実施の形態1に係る三次元スキャナの構成を示す図である。
図4】実施の形態1に係る三次元スキャナが共焦点法に基づき三次元データを取得する例を説明するための図である。
図5】三次元スキャナによるスキャン方法を説明するための図である。
図6】実施の形態1に係る三次元スキャナによって取得された各スキャン範囲における物体を示す図である。
図7】三次元スキャナを用いて物体をスキャンする様子を示す図である。
図8】三次元スキャナを用いて物体をスキャンする様子を示す図である。
図9】実施の形態1に係る識別装置の機能構成を示すブロック図である。
図10】実施の形態1に係る識別装置に入力される三次元データを説明するための図である。
図11】実施の形態1に係る推定モデルを機械学習させるときに用いられる学習用データを説明するための図である。
図12】位置関係ラベルを説明するための図である。
図13】複数の物体の各々と位置関係ラベルおよび正解ラベルとの対応関係を説明するための図である。
図14】実施の形態1に係る識別装置によって生成された不要物体除去後の結合データを説明するための図である。
図15】実施の形態1に係る識別装置が実行する処理の一例を説明するためのフローチャートである。
図16】実施の形態2に係る識別装置の機能構成を示すブロック図である。
図17】実施の形態2に係る推定モデルを機械学習させるときに用いられる学習用データを説明するための図である。
図18】実施の形態2に係る識別装置が実行する処理の一例を説明するためのフローチャートである。
図19】実施の形態3に係る識別装置の機能構成を示すブロック図である。
図20】実施の形態3に係る推定モデルを機械学習させるときに用いられる学習用データを説明するための図である。
図21】実施の形態3に係る識別装置によって生成された不要物体除去後の二次元データを説明するための図である。
図22】実施の形態3に係る識別装置が実行する処理の一例を説明するためのフローチャートである。
図23】実施の形態4に係る識別装置の機能構成を示すブロック図である。
図24】実施の形態4に係る推定モデルを機械学習させるときに用いられる学習用データを説明するための図である。
図25】実施の形態4に係る識別装置が実行する処理の一例を説明するためのフローチャートである。
図26】実施の形態5に係る三次元スキャナが三角測量法に基づき三次元データを取得する例を説明するための図である。
図27】実施の形態5に係る三次元スキャナによって取得された三次元データに基づき任意の視点から見た二次元画像を示す図である。
図28】実施の形態6に係る推定モデルを機械学習させるときに用いられる学習用データを説明するための図である。
【発明を実施するための形態】
【0011】
<実施の形態1>
本開示の実施の形態1について、図面を参照しながら詳細に説明する。なお、図中の同一または相当部分については、同一符号を付してその説明は繰り返さない。
【0012】
[適用例]
図1を参照しながら、実施の形態1に係る識別システム10および識別装置1の適用例を説明する。図1は、実施の形態1に係る識別システム10および識別装置1の適用例を示す図である。
【0013】
図1に示すように、ユーザは、三次元スキャナ2を用いて対象者の口腔内をスキャンすることによって、口腔内の複数の物体の三次元データを取得することができる。「ユーザ」は、歯科医師などの術者、歯科助手、歯科大学の先生または生徒、歯科技工士、メーカの技術者、製造工場の作業者など、三次元スキャナ2を用いて歯牙などの物体の三次元データを取得する者であればいずれであってもよい。「対象者」は、歯科医院の患者、歯科大学における被験者など、三次元スキャナ2のスキャン対象となり得る者であればいずれであってもよい。「物体」は、対象者の口腔内にある歯牙など、三次元スキャナ2のスキャン対象となり得るものであればいずれであってもよい。
【0014】
識別システム10は、識別装置1と、三次元スキャナ2とを備える。識別装置1には、ディスプレイ3、キーボード4、およびマウス5が接続されている。
【0015】
三次元スキャナ2は、口腔内を撮像する撮像装置であり、内蔵された三次元カメラによって物体の三次元データを取得する。具体的には、三次元スキャナ2は、口腔内をスキャンすることで、三次元データとして、物体の表面を示す点群(複数の点)の各々の位置情報(縦方向,横方向,高さ方向の各軸の座標)を、光学センサなどを用いて取得する。すなわち、三次元データは、物体の表面を構成する点群の各々の位置の位置情報を含む位置データである。
【0016】
三次元スキャナ2が一度に測定できる測定範囲は限られているため、ユーザは、口腔内の歯列全体(歯列弓)の三次元データを取得したい場合、三次元スキャナ2を歯列に沿って口腔内を移動させるように操作して複数回に亘って口腔内をスキャンする。
【0017】
識別装置1は、三次元スキャナ2によって取得された三次元データに基づき、任意の視点から見た二次元画像に対応する二次元画像データを生成し、生成した二次元画像をディスプレイ3に表示させることで、物体の表面を特定の方向から見た場合の二次元投影図をユーザに見せることができる。
【0018】
さらに、識別装置1は、三次元データを歯科技工所に出力する。歯科技工所においては、識別装置1から取得した三次元データに基づき、歯科技工士が補綴物などの歯牙モデルを作製する。なお、ミリングマシンおよび3Dプリンタなど、歯牙モデルを自動で製造可能な自動製造装置が歯科医院内に配置されている場合、識別装置1は、三次元データを自動製造装置に出力してもよい。
【0019】
[識別装置のハードウェア構成]
図2を参照しながら、実施の形態1に係る識別装置1のハードウェア構成を説明する。図2は、実施の形態1に係る識別装置1のハードウェア構成を示すブロック図である。識別装置1は、たとえば、汎用コンピュータで実現されてもよいし、識別システム10専用のコンピュータで実現されてもよい。
【0020】
図2に示すように、識別装置1は、主なハードウェア要素として、演算部11と、記憶部12と、スキャナインターフェース13と、通信部14と、ディスプレイインターフェース15と、周辺機器インターフェース16と、読取部17とを備える。
【0021】
演算部11は、各種のプログラムを実行することで、各種の処理を実行する演算主体(演算装置)であり、コンピュータの一例である。演算部11は、たとえば、CPU(Central Processing Unit)、FPGA(Field-Programmable Gate Array)、およびGPU(Graphics Processing Unit)などで構成される。なお、演算部11は、CPU、FPGA、およびGPUの少なくとも1つで構成されてもよいし、CPUとFPGA、FPGAとGPU、CPUとGPU、あるいはCPU、FPGA、およびGPUの全てから構成されてもよい。また、演算部11は、演算回路(processing circuitry)で構成されてもよい。なお、演算部11は、1チップで構成されてもよいし、複数のチップで構成されてもよい。さらに、演算部11の全ての機能または一部の機能は、図示しないサーバ装置(たとえば、クラウド型のサーバ装置)に設けられてもよい。
【0022】
記憶部12は、演算部11が任意のプログラムを実行するにあたって、プログラムコードやワークメモリなどを一時的に格納する揮発性の記憶領域(たとえば、ワーキングエリア)を含む。たとえば、記憶部12は、DRAM(Dynamic Random Access Memory)またはSRAM(Static Random Access Memory)などの揮発性メモリデバイスで構成される。さらに、記憶部12は、不揮発性の記憶領域を含む。たとえば、記憶部12は、ROM(Read Only Memory)、ハードディスク、またはSSD(Solid State Drive)などの不揮発性メモリデバイスで構成される。
【0023】
なお、本実施の形態においては、揮発性の記憶領域と不揮発性の記憶領域とが同一の記憶部12に含まれる例を示したが、揮発性の記憶領域と不揮発性の記憶領域とが互いに異なる記憶部に含まれていてもよい。たとえば、演算部11が揮発性の記憶領域を含み、記憶部12が不揮発性の記憶領域を含んでいてもよい。識別装置1は、演算部11と、記憶部12とを含むマイクロコンピュータを備えていてもよい。
【0024】
記憶部12は、識別プログラム121と、推定モデル122とを格納する。識別プログラム121は、演算部11が三次元スキャナ2によって取得された三次元データと推定モデル122とに基づき、口腔内の物体を識別するための識別処理が記述されている。
【0025】
推定モデル122は、ニューラルネットワーク1221と、ニューラルネットワーク1221によって用いられるパラメータ1222とを含む。推定モデル122は、口腔内の複数の物体の各々の位置情報を含む三次元データと、複数の物体の各々の種類を示す正解ラベルとを含む学習用データを用いて、三次元データに基づき各物体の種類を推定するように機械学習が行われている。
【0026】
具体的には、学習フェーズにおいて、推定モデル122は、口腔内の各物体の位置情報を含む三次元データが入力されると、ニューラルネットワーク1221によって、三次元データに基づき各物体の特徴および互いの位置関係を抽出し、抽出した特徴および位置関係に基づき各物体の種類を推定する。そして、推定モデル122は、推定した各物体の種類と、三次元データに関連付けられた各物体の種類を示す正解ラベルとに基づき、両者が一致すればパラメータ1222を更新しない一方で、両者が一致しなければ両者が一致するようにパラメータ1222を更新することで、パラメータ1222を最適化する。このように、推定モデル122は、入力データである三次元データと、正解データである各物体の種類とを含む学習用データに基づき、パラメータ1222が最適化されることで機械学習される。これにより、推定モデル122は、口腔内の複数の物体の各々の三次元データに基づき、口腔内の複数の物体の各々を推定することができる。
【0027】
なお、このような推定モデル122を学習することによって最適化された推定モデル122を、特に「学習済モデル」とも称する。つまり、学習前の推定モデル122および学習済みの推定モデル122をまとめて「推定モデル」と称する一方で、特に、学習済みの推定モデル122を「学習済モデル」とも称する。
【0028】
推定モデル122は、演算部11が推定処理および学習処理を実行するためのプログラムを含む。実施の形態1においては、画像に特化した処理を行うプログラムとして、たとえば、U-Net、SegNet、ENet、ErfNet、VoxNet、3D ShapeNets、3D U-Net、Multi-View CNN、RotationNet、OctNet、PointCNN、FusionNet、PointNet、PointNet++、SSCNet、MarrNet、VoxelNet、PAConv、VGGNet、ResNet、DGCNN、KPConv、FCGF、ModelNet40、ShapeNet、SemanticKITTI、SunRGB-D、VoteNet、LinkNet、Lambda Network、PREDATOR、3D Medical Point Transformer、およびPCTなどが推定モデル122のプログラムに用いられるが、順伝搬型ニューラルネットワーク、リカレント型ニューラルネットワーク、グラフニューラルネットワーク、注意機構(Attention Mechanism)、Transformerなど、その他のプログラムが推定モデル122のプログラムに用いられてもよい。
【0029】
スキャナインターフェース13は、三次元スキャナ2を接続するためのインターフェースであり、識別装置1と三次元スキャナ2との間のデータの入出力を実現する。識別装置1と三次元スキャナ2とは、ケーブルを用いた有線、または無線(WiFi,BlueTooth(登録商標)など)を介して接続される。
【0030】
通信部14は、有線通信または無線通信を介して、上述した歯科技工所または自動製造装置との間でデータを送受信する。たとえば、識別装置1は、通信部14を介して、三次元データに基づき生成した補綴物生成用のデータを、歯科技工所または自動製造装置に送信する。
【0031】
ディスプレイインターフェース15は、ディスプレイ3を接続するためのインターフェースであり、識別装置1とディスプレイ3との間のデータの入出力を実現する。
【0032】
周辺機器インターフェース16は、キーボード4およびマウス5などの周辺機器を接続するためのインターフェースであり、識別装置1と周辺機器との間のデータの入出力を実現する。
【0033】
読取部17は、記憶媒体であるリムーバブルディスク20に格納されている各種データを読み出す。たとえば、読取部17は、リムーバブルディスク20から識別プログラム121を取得してもよい。
【0034】
[三次元スキャナの構成]
図3および図4を参照しながら、実施の形態1に係る三次元スキャナ2の構成を説明する。図3は、実施の形態1に係る三次元スキャナ2の構成を示す図である。図4は、実施の形態1に係る三次元スキャナ2が共焦点法に基づき三次元データを取得する例を説明するための図である。
【0035】
図3に示すように、三次元スキャナ2は、手持ち式のハンドピースであり、ハウジング21と、ハウジング21に対して着脱可能に接続されたプローブ22と、制御装置40とを備える。
【0036】
プローブ22は、口腔内に挿入され、口腔内の物体にパターンを有する光(以下、単に「パターン」とも称する。)を投影する。プローブ22は、パターンが投影された物体からの反射光をハウジング21の内部に導く。
【0037】
三次元スキャナ2は、ハウジング21の内部に、光源23と、レンズ24と、光学センサ25と、プリズム26と、カウンタウェイト27と、開口部29とを備える。なお、図3および図4においては、説明の便宜上、開口部29に平行な平面方向をX軸およびY軸で規定する。また、X軸およびY軸に対して垂直な方向をZ軸で規定する。
【0038】
光源23は、レーザー素子またはLED(Light Emitting Diode)などを含む。光源23からの光(光軸L)は、プリズム26およびレンズ24を通過し、プローブ22に設けられた反射部28によって反射されて開口部29から出力される。開口部29から出力された光は、Z軸方向に沿って物体に照射され、当該物体で反射される。すなわち、三次元スキャナ2から出力される光の光軸方向は、Z軸方向と一致し、X軸およびY軸からなる平面方向に直交する。
【0039】
物体で反射された光は、開口部29および反射部28を介して再びハウジング21の内部に進入し、レンズ24を通過してプリズム26に入力される。プリズム26は、物体からの光の進行方向を、光学センサ25が位置する方向に変化させる。プリズム26によって進行方向が変化した光は、光学センサ25によって検出される。
【0040】
共焦点法の技術を用いて物体の三次元データを取得する場合、レンズ24と物体との間に設けられたパターン生成素子(図示せず)を通過した市松模様などのパターンを有する光がスキャン範囲R内で物体に投影される。レンズ24が同一直線上を往復直線運動すると、Z軸上において、物体に投影されたパターンの焦点位置が変化する。光学センサ25は、Z軸上において焦点位置が変化するごとに物体からの光を検出する。
【0041】
制御装置40は、たとえば、CPU、ROM、およびRAMなどから構成され、三次元スキャナ2で行われる処理を制御する。なお、制御装置40は、FPGAまたはGPUで構成されてもよい。また、制御装置40は、CPU、FPGA、およびGPUの少なくとも1つで構成されてもよいし、CPUとFPGA、FPGAとGPU、CPUとGPU、あるいはCPU、FPGA、およびGPUの全てから構成されてもよい。また、制御装置40は、演算回路(processing circuitry)で構成されてもよい。制御装置40は、レンズ24の位置と、そのときの光学センサ25の検出結果とに基づいて、物体の表面を示す点群の各々の位置情報を算出する。
【0042】
これにより、三次元スキャナ2は、スキャン範囲R内のXY平面における物体の表面を示す点群の各々の位置情報(X座標およびY座標)を取得する。図4に示すように、三次元スキャナ2と物体との間の仮想視点からZ軸方向に物体を見た場合、XY平面において、物体の表面を示す二次元画像を表すことができる。三次元スキャナ2は、このようなX座標およびY座標を含む二次元データの束を、Z軸方向に順番に取得することによって、1スキャンごとに物体の三次元データ(X座標、Y座標、およびZ座標)を取得することができる。1スキャンとは、三次元スキャナ2のプローブ22の位置が固定された状態で物体の三次元データ(X座標、Y座標、およびZ座標)を1回取得することに対応する。
【0043】
より具体的には、三次元スキャナ2を動かさずに固定された光軸で3次元データを取得するような1回のスキャンが行われた場合、制御装置40は、スキャン対象の物体の表面を示す点群の各々に対して、光軸方向をZ座標とし、かつ光軸方向(Z軸方向)と直交する平面方向をX座標およびY座標として、三次元の位置情報を付与する。制御装置40は、三次元スキャナ2によって複数回のスキャンが行われた場合、各スキャンによって取得された点群の三次元データを、複数回のスキャン同士で結合する際に、重複する部分の一致する形状に基づいて三次元データを結合させる。制御装置40は、結合の完成時、または、一定のタイミングで、結合された点群の三次元データに対して、任意の原点に基づくX座標、Y座標、およびZ座標を改めて付与することによって、全体として統一のある物体の位置情報を含む点群の三次元データを取得する。
【0044】
三次元スキャナ2によって取得された物体の三次元データは、スキャナインターフェース13を介して識別装置1に入力される。なお、制御装置40の全ての機能または一部の機能を、識別装置1が備えていてもよい。たとえば、識別装置1の演算部11が、制御装置40の機能を備えていてもよい。
【0045】
[三次元スキャナによるスキャンの一例]
図5図8を参照しながら、三次元スキャナ2によるスキャンの一例を説明する。
【0046】
図5は、三次元スキャナ2によるスキャン方法を説明するための図である。三次元スキャナ2のスキャン範囲は、口腔内に挿入可能なプローブ22の大きさによって制限される。このため、ユーザは、プローブ22を口腔内に挿入し、プローブ22を歯列に沿って口腔内を移動させるようにして複数回に亘って口腔内をスキャンする。
【0047】
たとえば、図5に示すように、ユーザは、口腔内でプローブ22を動かすことによって、スキャン範囲をR1,R2,R3,・・・Rnといったように順番に切り替えて、口腔内の様々な部分の三次元データを取得する。より具体的には、ユーザは、歯牙の舌側面から咬合面を経由して歯牙の唇側面へとプローブ22を動かすことによって一部の歯牙をスキャンし、このようなスキャンを左奥歯側から前歯を経由して右奥歯側へとプローブ22を動かすことによって複数の歯牙を順番にスキャンする。なお、口腔内におけるプローブ22の動かし方は、ユーザごとまたは歯科診療ごとに異なるため、三次元データが取得される口腔内の部分および取得順は変化し得る。
【0048】
図6は、実施の形態1に係る三次元スキャナ2によって取得された各スキャン範囲における物体を示す図である。図6に示すように、ユーザがプローブ22を動かしながら物体をスキャンすることにより、三次元スキャナ2は、各スキャン範囲に含まれる物体の三次元データを取得することができる。たとえば、三次元スキャナ2は、1スキャンごとに1つのスキャン範囲における三次元データを取得することができ、図6の例においては、スキャン範囲R11~R15の各々の三次元データを取得することができる。三次元スキャナ2は、複数回のスキャンによって得られた複数のスキャン範囲R11~R15のそれぞれに対応する複数の三次元データを結合することによって、複数のスキャン範囲R11~R15に含まれる物体全体の三次元データを取得することができる。
【0049】
図7および図8は、三次元スキャナ2を用いて物体をスキャンする様子を示す図である。図7および図8に示すように、口腔内においては、舌、下顎の歯列と舌との間の小帯、下顎の歯列、下顎の歯列と下唇との間の小帯(図示は省略する)、下唇、硬口蓋、上顎の歯列と硬口蓋との間の小帯、上顎の歯列、上顎の歯列と上唇との間の小帯(図示は省略する)、上唇、歯肉、粘膜、および補綴物(金属歯、セラミック歯、レジン歯)などの複数の物体が含まれる。三次元スキャナ2によるスキャン中においては、スキャン対象である歯牙などの物体と三次元スキャナ2との間に、術者の指または診療器具、あるいは患者の舌、唇、粘膜(頬裏)などの不要物体が入り込み、三次元スキャナ2が物体の三次元データを適切に取得することができない場合がある。たとえば、図6の例では、範囲R12~R14に不要物体である指が入り込んでいる。なお、指は、術者の生身の指に限らず、術者が手袋をはめた状態の指も含まれる。また、診療器具としては、バキューム、開口器、および舌圧子などの歯科用インスツルメントが挙げられる。
【0050】
たとえば、図7および図8に示すように、三次元スキャナ2のプローブ22が口腔内に挿入される際には、口腔内の軟組織を押さえるために、歯牙と唇との間に指が挿入されることがある。
【0051】
具体的には、図7に示すように、ユーザは、唇側の歯牙の側面の三次元データを取得する場合、プローブ22を歯牙と唇との隙間に挿入するが、このとき、歯列と唇との隙間に指を挿入して軟組織を押さえることによって、軟組織がスキャンの邪魔をしないようにする。また、図8に示すように、ユーザは、舌側の歯牙の側面の三次元データを取得する場合、プローブ22を歯列と舌との隙間に挿入するが、このとき、歯列と舌との隙間に指を挿入して軟組織を押さえることによって、軟組織がスキャンの邪魔をしないようにする。なお、指に限らず、歯牙と唇との隙間または歯牙と舌との隙間に軟組織を押さえるための診療器具が挿入されることもある。このように、軟組織を押さえている指が歯列に接触した状態で口腔内をスキャンすると、図6に示すように、範囲R12~R14に不要物体である指が入り込んだ状態で、三次元データが取得される。
【0052】
このように、歯科診療においては、通常、指および診療器具などの挿入物体が口腔内に挿入された状態で口腔内がスキャンされるが、たとえば、図4のスキャン範囲Rおよび図6のスキャン範囲R12~R14に示すように、スキャン範囲内に挿入物体が入り込み、三次元スキャナ2が物体の三次元データを適切に取得することができない場合がある。
【0053】
そこで、実施の形態1に係る識別装置1は、AI(人工知能:Artificial Intelligence)を利用して、口腔内の歯牙、舌、唇、小帯、歯肉、粘膜、補綴物(金属歯、セラミック歯、レジン歯)、および口腔内に挿入される挿入物体などの複数の物体の各々の種類を識別し、識別結果に基づいて、歯科診療に不要な物体の三次元データを抽出して削除するように構成されている。以下、識別装置1の具体的な機能について説明する。
【0054】
[識別装置の機能構成]
図9を参照しながら、実施の形態1に係る識別装置1の機能構成について説明する。図9は、実施の形態1に係る識別装置1の機能構成を示すブロック図である。
【0055】
図9に示すように、識別装置1は、主な機能部として、入力部1101と、識別部1102と、除去部1103と、結合部1104と、画像生成部1105と、記憶部12とを備える。
【0056】
入力部1101は、スキャナインターフェース13の機能部であり、三次元スキャナ2によって取得される1スキャンごとの三次元データを取得する。なお、入力部1101は、通信部14、周辺機器インターフェース16、または読取部17の機能部であってもよい。たとえば、入力部1101が通信部14の機能部である場合、通信部14は、有線通信または無線通信を介して、外部装置から三次元データを取得する。なお、外部装置は、歯科医院に設置されたサーバ装置であってもよいし、歯科医院とは別の場所に設置されたクラウド型のサーバ装置であってもよい。入力部1101が周辺機器インターフェース16の機能部である場合、周辺機器インターフェース16は、キーボード4およびマウス5を用いてユーザによって入力された三次元データを取得する。入力部1101が読取部17の機能部である場合、読取部17は、リムーバブルディスク20に記憶された三次元データを取得する。
【0057】
ここで、図10を参照しながら、識別装置1に入力される三次元データについて説明する。図10は、実施の形態1に係る識別装置1に入力される三次元データを説明するための図である。図10に示すように、入力部1101に入力される1スキャンごとの三次元データは、スキャン範囲内の物体の表面を示す点群の各々に対応付けられた、X座標、Y座標、およびZ座標の位置情報と、X成分、Y成分、およびZ成分の法線情報とを含む。なお、図示は省略するが、三次元データは、スキャン範囲内の物体の表面を示す点群の各々に対応付けられた色情報も含む。
【0058】
位置情報とは、図4を用いて説明したように、スキャン範囲に含まれる物体の表面を示す点群の各々におけるX座標、Y座標、およびZ座標である。法線情報とは、点群に含まれる1つの点に注目して、その注目点における接線に垂直な法線のX成分、Y成分、およびZ成分である。なお、点群に含まれる1つの点に対する法線の生成には、主成分分析などの公知の技術を用いればよい。
【0059】
図9に戻り、識別部1102は、演算部11の機能部である。識別部1102は、入力部1101から入力される口腔内の複数の物体の各々の三次元データと、推定モデル122とに基づき、複数の物体のうちの少なくとも1つの物体を識別する。具体的には、識別部1102は、スキャン範囲内に含まれる歯牙、舌、唇、小帯、歯肉、粘膜、補綴物(金属歯、セラミック歯、レジン歯)、および指または診療器具などの挿入物体の各々を識別する。すなわち、識別部1102は、ユーザが取得したい歯牙の表面を示す点群の各々の位置情報を含む三次元データを抽出するとともに、ユーザにとって不要な指、診療器具、または舌などの不要物体の表面を示す点群の各々の位置情報を含む三次元データ(以下、「不要三次元データ」とも称する。)を抽出する。識別部1102は、識別結果を除去部1103に出力する。
【0060】
ここで、図11図13を参照しながら、推定モデル122の機械学習について説明する。図11は、実施の形態1に係る推定モデル122を機械学習させるときに用いられる学習用データを説明するための図である。図11に示すように、実施の形態1に係る推定モデル122は、口腔内の複数の物体の各々の位置情報および法線情報を含む三次元データと、複数の物体の間における相対的な位置関係を示す位置関係ラベルと、複数の物体の各々を示す正解ラベルとを含む1スキャン分の学習用データを用いて、1スキャン分の三次元データに基づき複数の物体の各々を推定するように機械学習(教師あり学習)が行われる。
【0061】
ここで、複数の物体の間における相対的な位置関係について説明する。口腔内においては、解剖学的に歯牙および舌などの複数の物体の各々の位置が任意のランドマークとの関係で、つまり、相対的な関係で予め決まっている。たとえば、上述した図7および図8に示すように、口を開けた顔を正面から見た状況で、下顎においては、上顎または下顎の中心付近(口腔の奥側)から外側(開口方向)の順に、舌、下顎の歯列と舌との間の小帯、下顎の歯列、下顎の歯列と下唇との間の小帯(図示は省略する)、および下唇が位置している。言い換えると、下顎の歯列を起点(任意のランドマーク)とした場合、舌は下顎の歯列よりも口腔の奥側に位置し、下唇は下顎の歯列よりも口腔の手前側に位置する。また、口を開けた顔を正面から見た状況で、上顎においては、上顎または下顎の中心付近(口腔の奥側)から外側(開口方向)の順に、硬口蓋、上顎の歯列と硬口蓋との間の小帯、上顎の歯列、上顎の歯列と上唇との間の小帯(図示は省略する)、および上唇が位置している。言い換えると、上顎の歯列を起点(任意のランドマーク)とした場合、硬口蓋は上顎の歯列よりも口腔の奥側に位置し、上唇は上顎の歯列よりも口腔の開口方向側に位置する。すなわち、口腔内においては、歯牙、舌、および唇などの複数の物体の間における相対的な位置関係が定まっている。
【0062】
このように、口腔内の複数の物体の間においては相対的な位置関係が定まっているため、推定モデル122の入力データである物体の位置情報を含む三次元データと、推定モデル122の出力データである当該物体の種類の識別結果との間には、相関関係があると言える。すなわち、三次元データに含まれる物体の位置情報は当該物体の種類に対応付けられるといったように、入力データと出力データとの間で相関関係があるため、推定モデル122は、入力された物体の位置情報を含む三次元データに基づき、当該三次元データに対応する位置が口腔内のどの領域に含まれるかを特定することによって、物体の種類を識別することができる。
【0063】
図12は、位置関係ラベルを説明するための図である。図12に示すように、口腔内を複数の領域に分けた場合、下顎においては、舌が存在する領域と、下顎の歯列と舌との隙間(以下、「下顎第1隙間」とも称する。)が存在する領域と、下顎の歯列が存在する領域と、下顎の歯列と下唇との隙間(以下、「下顎第2隙間」とも称する。)が存在する領域と、下唇が存在する領域とに分けることができる。上顎においては、硬口蓋が存在する領域と、上顎の歯列と硬口蓋との隙間(以下、「上顎第1隙間」とも称する。)が存在する領域と、上顎の歯列が存在する領域と、上顎の歯列と上唇との隙間(以下、「上顎第2隙間」とも称する。)が存在する領域と、上唇が存在する領域とに分けることができる。位置関係ラベルは、これら複数の領域うちの少なくとも1つを示すデータを含む。
【0064】
具体的には、舌が存在する領域に対しては、位置関係ラベルとして「001」を示すデータが対応付けられる。下顎第1隙間が存在する領域に対しては、位置関係ラベルとして「002」を示すデータが対応付けられる。下顎の歯列が存在する領域に対しては、位置関係ラベルとして「003」を示すデータが対応付けられる。下顎第2隙間が存在する領域に対しては、位置関係ラベルとして「004」を示すデータが対応付けられる。下唇が存在する領域に対しては、位置関係ラベルとして「005」を示すデータが対応付けられる。硬口蓋が存在する領域に対しては、位置関係ラベルとして「006」を示すデータが対応付けられる。上顎第1隙間が存在する領域に対しては、位置関係ラベルとして「007」を示すデータが対応付けられる。上顎の歯列が存在する領域に対しては、位置関係ラベルとして「008」を示すデータが対応付けられる。上顎第2隙間が存在する領域に対しては、位置関係ラベルとして「009」を示すデータが対応付けられる。上唇が存在する領域に対しては、位置関係ラベルとして「010」を示すデータが対応付けられる。なお、舌は動作することによって、その先端が下顎第1隙間および下顎第2隙間などの他の領域に存在することがあり得るが、舌の根元が存在する位置は固定されているため、舌の根元が存在する領域に対して、位置関係ラベルとして「001」を示すデータが対応付けられる。
【0065】
図13は、複数の物体の各々と位置関係ラベルおよび正解ラベルとの対応関係を説明するための図である。図13に示すように、下顎について、舌に対しては、位置関係ラベルとして「001」を示すデータが対応付けられ、正解ラベルとして「01」を示すデータが対応付けられる。下顎第1隙間に対しては、位置関係ラベルとして「002」を示すデータが対応付けられ、正解ラベルとして「02」を示すデータが対応付けられる。下顎の歯列に含まれる複数の歯牙のそれぞれに対しては、位置関係ラベルとして「003」を示すデータが対応付けられ、正解ラベルとして「31」~「48」を示すデータが対応付けられる。下顎第2隙間に対しては、位置関係ラベルとして「004」を示すデータが対応付けられ、正解ラベルとして「04」を示すデータが対応付けられる。下唇に対しては、位置関係ラベルとして「005」を示すデータが対応付けられ、正解ラベルとして「05」を示すデータが対応付けられる。
【0066】
上顎について、硬口蓋に対しては、位置関係ラベルとして「006」を示すデータが対応付けられ、正解ラベルとして「06」を示すデータが対応付けられる。上顎第1隙間に対しては、位置関係ラベルとして「007」を示すデータが対応付けられ、正解ラベルとして「07」を示すデータが対応付けられる。上顎の歯列に含まれる複数の歯牙のそれぞれに対しては、位置関係ラベルとして「008」を示すデータが対応付けられ、正解ラベルとして「11」~「28」を示すデータが対応付けられる。上顎第2隙間に対しては、位置関係ラベルとして「009」を示すデータが対応付けられ、正解ラベルとして「09」を示すデータが対応付けられる。上唇に対しては、位置関係ラベルとして「010」を示すデータが対応付けられ、正解ラベルとして「10」を示すデータが対応付けられる。
【0067】
上述したように、歯科診療においては、指および診療器具などの挿入物体が口腔内に挿入され得るが、挿入物体が挿入される口腔内の位置は概ね決まっている。具体的には、挿入物体は、下顎の歯列と舌との間の下顎第1隙間、下顎の歯列と下唇との間の下顎第2隙間、上顎の歯列と硬口蓋との間の上顎第1隙間、および上顎の歯列と上唇との間の上顎第2隙間のうち、いずれかに挿入されて位置する可能性が高い。
【0068】
その理由は、図7を用いて説明したように、術者などのユーザは、唇側の歯牙の側面の三次元データを取得する場合に、歯列と唇との間(図7の例では下顎第2隙間)に指または診療器具を挿入して軟組織を押さえることによって、軟組織がスキャンの邪魔をしないようにするからである。また、図8を用いて説明したように、術者などのユーザは、舌側の歯牙の側面の三次元データを取得する場合に、歯列と舌との間(図8の例では下顎第1隙間)に指または診療器具を挿入して軟組織を押さえることによって、軟組織がスキャンの邪魔をしないようにするからである。言い換えると、たとえば、舌が歯列を跨いで口腔から外側へ飛び出すケース、および、指が歯牙を覆い被さるようなケースは、スキャン中において発生する可能性は低い。
【0069】
よって、図13に示すように、挿入物体のうち、指に対しては、位置関係ラベルとして、下顎第1隙間に対応する「002」を示すデータ、下顎第2隙間に対応する「004」を示すデータ、上顎第1隙間に対応する「007」を示すデータ、または上顎第2隙間に対応する「009」を示すデータが対応付けられ、正解ラベルとして「51」を示すデータが対応付けられる。また、挿入物体のうち、診療器具に対しては、位置関係ラベルとして、下顎第1隙間に対応する「002」を示すデータ、下顎第2隙間に対応する「004」を示すデータ、上顎第1隙間に対応する「007」を示すデータ、または上顎第2隙間に対応する「009」を示すデータが対応付けられ、正解ラベルとして「52」を示すデータが対応付けられる。
【0070】
図11に戻り、学習用データにおいては、1スキャンで得られる複数の物体の各々の表面を示す点群の各々の三次元データ(位置情報,法線情報)に対して、物体の種類を示す正解ラベルと、複数の物体の間における相対的な位置関係を示す位置関係ラベルとが対応付けられている。
【0071】
たとえば、図11に示すように、舌をスキャンすることによって得られた三次元データに対しては、位置関係ラベルとして「001」を示すデータが対応付けられ、正解ラベルとして「01」を示すデータが対応付けられている。下顎左第三大臼歯をスキャンすることによって得られた三次元データに対しては、位置関係ラベルとして「003」を示すデータが対応付けられ、正解ラベルとして「38」を示すデータが対応付けられている。下顎左第二大臼歯をスキャンすることによって得られた三次元データに対しては、位置関係ラベルとして「003」を示すデータが対応付けられ、正解ラベルとして「37」を示すデータが対応付けられている。さらに、下顎第2隙間に挿入された指をスキャンすることによって得られた三次元データに対しては、位置関係ラベルとして「004」を示すデータが対応付けられ、正解ラベルとして「51」を示すデータが対応付けられている。
【0072】
このように、実施の形態1においては、推定モデル122を機械学習させるための学習用データとして、1スキャンで得られる複数の物体の各々の表面を示す点群の各々の三次元データ(位置情報,法線情報)に対して、物体の種類を示す正解ラベルに加えて、複数の物体の間における相対的な位置関係を示す位置関係ラベルが対応付けられている。
【0073】
推定モデル122は、1スキャン分の三次元データに基づき、スキャンされた複数の物体の各々の種類を識別し、識別結果と正解ラベルとの一致度合いに基づきパラメータ1222を調整する。
【0074】
これにより、推定モデル122は、1スキャン分の三次元データに対応付けられた正解ラベルに基づき、当該三次元データに対応する物体の種類を識別するように機械学習することができ、さらに、当該三次元データに対応付けられた位置関係ラベルに基づき、当該三次元データに対応する位置が口腔内のどの領域に含まれるかを機械学習することによって、より精度よく当該三次元データに対応する物体の種類を識別することができるようになる。
【0075】
また、学習用データは、点群の各点ごとに、位置関係ラベル、三次元データ(位置情報,法線情報)、正解ラベルの順に推定モデル122に入力される。たとえば、点群に含まれる第1の点について、位置関係ラベル、三次元データ(位置情報,法線情報)、正解ラベルの順に推定モデル122に入力され、次に、点群に含まれる第2の点について、位置関係ラベル、三次元データ(位置情報,法線情報)、正解ラベルの順に推定モデル122に入力される。1スキャンで得られた全ての点について位置関係ラベル、三次元データ(位置情報,法線情報)、および正解ラベルが順番に推定モデル122に入力されるまで、上述したような入力が繰り返される。
【0076】
学習用データにおいて、位置関係ラベルは、三次元データ(位置情報,法線情報)に近接して配列されており、上述したように、三次元データの直前に推定モデル122に入力される。これにより、推定モデル122は、位置関係ラベルで規定された複数の物体の間における相対的な位置関係に基づき、三次元データの特徴を見出し易くなるため、三次元データに対応する位置が口腔内のどの領域に含まれるかを効率的かつ精度よく機械学習することができる。
【0077】
図9に戻り、除去部1103は、演算部11の機能部である。除去部1103は、識別部1102から物体の種類の識別結果を取得する。識別結果は、図13に示すように、舌、下顎第1隙間、下顎の歯列に含まれる各歯牙、下顎第2隙間、下唇、硬口蓋、上顎第1隙間、上顎の歯列に含まれる各歯牙、上顎第2隙間、および上唇の各々の識別結果とともに、指および診療器具などの挿入物体の識別結果も含まれる。除去部1103は、識別部1102の識別結果に、術者の指または診療器具、あるいは患者の舌などの不要物体の識別結果が含まれている場合、入力部1101から入力された三次元データから、識別部1102によって識別された不要物体の表面を示す点群の各々の位置情報を含む不要三次元データを除去する。除去部1103は、入力部1101から入力された三次元データから不要三次元データを除去した後の三次元データを、結合部1104に出力する。
【0078】
結合部1104は、演算部11の機能部である。結合部1104は、入力部1101に1スキャン分の三次元データが入力されるごとに、除去部1103から1スキャン分の三次元データを取得し、蓄積された複数スキャン分の三次元データを結合させることによって、結合された複数スキャン分の三次元データ(以下、「結合データ」とも称する。)を生成する。
【0079】
図14は、実施の形態1に係る識別装置1によって生成された不要物体除去後の結合データを説明するための図である。識別部1102は、入力部1101から入力された図10に示す三次元データに基づき、図14に示すように、各点についての識別結果を出力する。除去部1103は、識別部1102の識別結果に、術者の指または診療器具、あるいは患者の舌、唇、粘膜などの不要物体の識別結果が含まれている場合、図14に示すように、識別部1102によって識別された不要物体に対応する三次元データ(不要三次元データ)に対して除去フラグをセットする。図14の例では、除去対象となる舌、唇、粘膜、および指に対応する不要三次元データに対して、除去フラグとして「01」をセットする。識別装置1は、除去フラグに「01」がセットされた不要三次元データについては、ディスプレイ3に表示する二次元画像に用いないように構成されている。結合部1104は、除去部1103から入力された三次元データに基づき、図14に示すように、複数スキャン分の三次元データを結合させることによって、不要物体除去後の結合データを生成する。
【0080】
図9に戻り、結合部1104は、結合データを記憶部12および画像生成部1105に出力する。記憶部12は、結合部1104から入力された結合データを記憶する。画像生成部1105は、演算部11の機能部である。画像生成部1105は、結合部1104から入力された結合データに基づき、任意の視点から見た二次元画像に対応する二次元画像データを生成し、生成した二次元画像データをディスプレイ3に出力する。このとき、画像生成部1105は、除去フラグに「01」がセットされた不要三次元データを用いることなく、二次元画像データを生成する。これにより、識別装置1は、不要物体が除去された後の口腔内の二次元画像をディスプレイ3に表示させてユーザに見せることができる。
【0081】
[識別装置の処理フロー]
図15を参照しながら、識別装置1が実行する処理の一例を説明する。図15は、実施の形態1に係る識別装置1が実行する処理の一例を説明するためのフローチャートである。図15に示す各ステップ(以下、「S」で示す。)は、識別装置1の演算部11が識別プログラム121を実行することで実現される。また、識別装置1は、三次元スキャナ2によるスキャンが開始された後、図15に示すフローチャートの処理を実行する。
【0082】
図15に示すように、識別装置1は、三次元スキャナ2によってスキャンされた任意の点の三次元データを取得する(S11)。識別装置1は、三次元スキャナ2によって取得された1スキャン分の三次元データと、推定モデル122とに基づき、スキャンされた複数の物体の各々を識別する(S12)。
【0083】
識別装置1は、識別結果に基づき、不要物体を検出したか否かを判定する(S13)。すなわち、識別装置1は、識別結果として、舌に対応する「01」を示すデータ、指に対応する「51」を示すデータ、または診療器具に対応する「52」を示すデータ、下唇に対応する「05」を示すデータ、上唇に対応する「10」を示すデータを出力したか否かを判定する。識別装置1は、不要物体を検出した場合(S13でYES)、検出した不要物体に対応する不要三次元データを抽出し、抽出した不要三次元データを除去する(S14)。すなわち、識別装置1は、不要三次元データに対して除去フラグをセットする。
【0084】
識別装置1は、不要物体を検出しなかった場合(S13でNO)、または、S14で不要三次元データを除去した後、複数スキャン分の三次元データを結合させることによって、結合データを生成する(S15)。
【0085】
識別装置1は、結合データを記憶部12に記憶する(S16)。さらに、識別装置1は、結合データに基づき、任意の視点から見た二次元画像に対応する二次元画像データを生成し、生成した二次元画像データをディスプレイ3に出力することによって、口腔内の二次元画像をディスプレイ3に表示させる(S17)。
【0086】
識別装置1は、三次元スキャナ2によるスキャンが停止したか否かを判定する(S18)。識別装置1は、三次元スキャナ2によるスキャンが停止していない場合(S18でNO)、S11に処理を戻す。一方、識別装置1は、三次元スキャナ2によるスキャンが停止した場合(S18でYES)、本処理を終了する。
【0087】
以上のように、識別装置1は、三次元スキャナ2によってスキャンされた口腔内において互いに相対的な位置関係が定まる口腔内の複数の物体の各々を、学習済みの推定モデル122を用いて識別することができる。推定モデル122は、複数の物体の間における相対的な位置関係に基づき、三次元データに対応する位置が口腔内のどの領域に含まれるかを効率的かつ精度よく機械学習されている。これにより、ユーザは、口腔内の複数の物体の各々を自ら識別する必要がなく、口腔内の複数の物体の各々を容易にかつ適切に識別することができる。
【0088】
識別装置1は、三次元スキャナ2によってスキャンされた複数の物体のうち、歯科診療に不要な不要物体も推定モデル122を用いて識別し、識別した不要物体の表面を示す点群の各々の位置情報を含む不要三次元データを抽出することができる。これにより、ユーザは、不要物体の三次元データを自ら抽出する必要がなく、不要物体の三次元データを容易にかつ適切に抽出することができる。
【0089】
識別装置1は、三次元スキャナ2によって入力される三次元データから、不要三次元データを除去することができるため、ユーザは、不要物体の三次元データを自ら除去して不要物体除去後の三次元データを作成する必要がなく、不要物体が除去された後の三次元データを容易に取得することができる。
【0090】
識別装置1は、不要三次元データを除去した後の三次元データを用いて生成した画像データをディスプレイ3に出力するため、ユーザは、不要物体が除去された後の口腔内の二次元画像を自ら生成する必要がなく、不要物体が除去された後の二次元画像を容易に取得することができる。
【0091】
<実施の形態2>
本開示の実施の形態2について、図面を参照しながら詳細に説明する。なお、実施の形態2においては、実施の形態1と異なる部分のみを説明し、実施の形態1と同じ部分については、同一符号を付してその説明は繰り返さない。
【0092】
[識別装置の機能構成]
図16は、実施の形態2に係る識別装置200の機能構成を示すブロック図である。実施の形態2に係る識別装置200は、先に、三次元スキャナ2によって取得された複数スキャン分の三次元データを結合することによって結合データを生成し、結合データに基づき、推定モデル122を用いて口腔内の複数の物体の各々を識別し、識別結果に基づき不要物体に対応する三次元データを抽出するように構成されている。
【0093】
具体的には、図16に示すように、識別装置200は、主な機能部として、入力部1101と、結合部1104と、識別部1102と、除去部1103と、画像生成部1105と、記憶部12とを備える。
【0094】
入力部1101は、三次元スキャナ2によって取得される1スキャンごとの三次元データを取得する。
【0095】
結合部1104は、入力部1101に1スキャン分の三次元データが入力されるごとに、1スキャン分の三次元データを取得し、蓄積された複数スキャン分の三次元データを結合させることによって、結合データを生成する。結合部1104は、生成した結合データを、識別部1102、画像生成部1105、および記憶部12に出力する。
【0096】
識別部1102は、結合部1104から入力される結合データと、推定モデル122とに基づき、複数の物体のうちの少なくとも1つの物体を識別する。識別部1102は、識別結果を除去部1103に出力する。
【0097】
ここで、図17を参照しながら、推定モデル122の機械学習について説明する。図17は、実施の形態2に係る推定モデル122を機械学習させるときに用いられる学習用データを説明するための図である。図17に示すように、実施の形態2に係る推定モデル122は、口腔内の複数の物体の各々の位置情報および法線情報を含む三次元データと、複数の物体の間における相対的な位置関係を示す位置関係ラベルと、複数の物体の各々を示す正解ラベルとを含む複数スキャン分の学習用データを用いて、複数スキャン分の三次元データに基づき複数の物体の各々を推定するように機械学習(教師あり学習)が行われる。
【0098】
学習用データにおいては、複数スキャンで得られる複数の物体の各々の表面を示す点群の各々の三次元データ(位置情報,法線情報)に対して、物体の種類を示す正解ラベルと、複数の物体の間における相対的な位置関係を示す位置関係ラベルとが対応付けられている。
【0099】
推定モデル122は、複数スキャン分の三次元データに基づき、スキャンされた複数の物体の各々の表面を示す点群の各々について物体の種類を識別し、識別結果と正解ラベルとの一致度合いに基づきパラメータ1222を調整する。
【0100】
これにより、推定モデル122は、複数スキャン分の三次元データに対応付けられた正解ラベルに基づき、当該三次元データに対応する物体の種類を識別するように機械学習することができ、さらに、当該三次元データに対応付けられた位置関係ラベルに基づき、当該三次元データに対応する位置が口腔内のどの領域に含まれるかを機械学習することによって、より精度よく当該三次元データに対応する物体の種類を識別することができるようになる。
【0101】
図16に戻り、除去部1103は、識別部1102の識別結果に、不要物体の識別結果が含まれている場合、入力部1101から入力された三次元データから、識別部1102によって識別された不要物体の表面を示す点群の各々の位置情報を含む不要三次元データを除去することによって、不要物体除去後の結合データを生成する。除去部1103は、結合データを記憶部12および画像生成部1105に出力する。
【0102】
記憶部12は、除去部1103から入力された結合データを記憶する。さらに、記憶部12は、結合部1104から入力された不要物体除去前の結合データを記憶する。画像生成部1105は、除去部1103から入力された結合データに基づき、任意の視点から見た二次元画像に対応する二次元画像データを生成し、生成した二次元画像データをディスプレイ3に出力する。これにより、識別装置200は、不要物体が除去された後の口腔内の二次元画像をディスプレイ3に表示させてユーザに見せることができる。さらに、画像生成部1105は、除去部1103から入力された不要物体除去前の結合データに基づき、任意の視点から見た二次元画像に対応する二次元画像データを生成し、生成した二次元画像データをディスプレイ3に出力する。これにより、識別装置200は、不要物体が除去される前の口腔内の二次元画像をディスプレイ3に表示させてユーザに見せることができる。
【0103】
[識別装置の処理フロー]
図18を参照しながら、識別装置200が実行する処理の一例を説明する。図18は、実施の形態2に係る識別装置200が実行する処理の一例を説明するためのフローチャートである。図18に示す各ステップ(以下、「S」で示す。)は、識別装置200の演算部11が識別プログラム121を実行することで実現される。また、識別装置200は、三次元スキャナ2によるスキャンが開始された後、図18に示すフローチャートの処理を実行する。
【0104】
図18に示すように、識別装置200は、三次元スキャナ2によってスキャンされた任意の点の三次元データを取得する(S21)。識別装置200は、三次元スキャナ2によって取得された複数スキャン分の三次元データを結合させることによって、結合データを生成する(S22)。
【0105】
識別装置200は、所定タイミングに到達したか否かを判定する(S23)。「所定タイミング」は、三次元スキャナ2によるスキャン開始後に蓄積された結合データのデータ量が所定量に達した第1タイミング、過去において直近でS23で所定タイミングに達したと判定した後に蓄積された結合データのデータ量が所定量に達した第2タイミング、三次元スキャナ2によるスキャン開始後からの経過時間が所定時間に達した第3タイミング、過去において直近でS23で所定タイミングに達したと判定した後からの経過時間が所定時間に達した第4タイミング、ユーザによって所定操作がなされた第5タイミングなどを含む。なお、上述の第1タイミング~第4タイミングの判定について、後述するS25において不要物体を検出してS27以降の処理に移行した場合には、第1タイミング~第4タイミングに到達したと判定されずにS27以降の処理に移行した場合よりも、その後のS23においてYESと判定される期間が短くなる(早期検出モードになる)。識別装置200は、所定タイミングに到達した場合(S23でYES)、三次元スキャナ2によって取得された複数スキャン分の三次元データと、推定モデル122とに基づき、スキャンされた複数の物体の各々を識別する(S24)。
【0106】
識別装置200は、識別結果に基づき、不要物体を検出したか否かを判定する(S25)。識別装置200は、不要物体を検出した場合(S25でYES)、検出した不要物体に対応する不要三次元データを抽出し、抽出した不要三次元データを除去する(S26)。
【0107】
識別装置200は、所定タイミングに到達しなかった場合(S23でNO)、不要物体を検出しなかった場合(S25でNO)、または、S26で不要三次元データを除去した後、S27の記憶処理およびS28の表示処理に移行する。
【0108】
識別装置200は、S26の除去処理によって不要物体が除去された後の結合データを記憶部12に記憶する(S27)。さらに、識別装置200は、S22の結合処理の次の処理として、不要物体が除去される前の結合データを記憶部12に記憶する(S27)。また、識別装置200は、S26の除去処理によって不要物体が除去された後の結合データに基づき、任意の視点から見た二次元画像に対応する二次元画像データを生成し、生成した二次元画像データをディスプレイ3に出力することによって、不要物体が除去された後の口腔内の二次元画像をディスプレイ3に表示させる(S28)。さらに、識別装置200は、S22の結合処理の次の処理として、不要物体が除去される前の結合データに基づき、任意の視点から見た二次元画像に対応する二次元画像データを生成し、生成した二次元画像データをディスプレイ3に出力することによって、不要物体が除去される前の口腔内の二次元画像をディスプレイ3に表示させる(S28)。
【0109】
識別装置200は、三次元スキャナ2によるスキャンが停止したか否かを判定する(S29)。識別装置200は、三次元スキャナ2によるスキャンが停止していない場合(S29でNO)、S21に処理を戻す。一方、識別装置200は、三次元スキャナ2によるスキャンが停止した場合(S29でYES)、本処理を終了する。
【0110】
以上のように、識別装置200は、複数スキャン分の三次元データに基づき、歯科診療に不要な不要物体も推定モデル122を用いて識別することができる。これにより、ユーザは、口腔内の複数の物体の各々を自ら識別する必要がなく、口腔内の複数の物体の各々を容易にかつ適切に識別することができる。また、ユーザは、不要物体の三次元データを自ら抽出する必要がなく、不要物体の三次元データを容易にかつ適切に抽出することができる。
【0111】
<実施の形態3>
本開示の実施の形態3について、図面を参照しながら詳細に説明する。なお、実施の形態3においては、実施の形態1と異なる部分のみを説明し、実施の形態1と同じ部分については、同一符号を付してその説明は繰り返さない。
【0112】
[識別装置の機能構成]
図19は、実施の形態3に係る識別装置300の機能構成を示すブロック図である。実施の形態3に係る識別装置300は、撮像装置である口腔内カメラ7によって取得された口腔内の複数の物体の各々の二次元データに基づき、推定モデル122を用いて口腔内の複数の物体の各々を識別し、識別結果に基づき不要物体に対応する二次元データを抽出するように構成されている。
【0113】
具体的には、図19に示すように、識別装置300は、主な機能部として、入力部1101と、識別部1102と、除去部1103と、画像生成部1105と、記憶部12とを備える。
【0114】
入力部1101は、口腔内カメラ7が口腔内を撮像することによって得られた撮像画像の撮像データを取得する。撮像データは、図4で示すようなX軸およびY軸で規定することができる撮影画像のデータであり、撮影画像に表された物体の表面を示すX座標およびY座標の2次元データで表され得る。
【0115】
識別部1102は、入力部1101から入力される口腔内の複数の物体の各々の二次元データと、推定モデル122とに基づき、複数の物体のうちの少なくとも1つの物体を識別する。識別部1102は、識別結果を除去部1103に出力する。
【0116】
ここで、図20を参照しながら、推定モデル122の機械学習について説明する。図20は、実施の形態3に係る推定モデル122を機械学習させるときに用いられる学習用データを説明するための図である。図20に示すように、実施の形態3に係る推定モデル122は、口腔内の複数の物体の各々の位置情報を含む二次元データと、複数の物体の間における相対的な位置関係を示す位置関係ラベルと、複数の物体の各々を示す正解ラベルとを含む画像1枚分の学習用データを用いて、画像1枚分の二次元データに基づき複数の物体の各々を推定するように機械学習(教師あり学習)が行われる。
【0117】
学習用データにおいては、複数の物体の各々の表面を示す二次元データ(位置情報)に対して、物体の種類を示す正解ラベルと、複数の物体の間における相対的な位置関係を示す位置関係ラベルとが対応付けられている。
【0118】
推定モデル122は、画像1枚分の二次元データに基づき、撮像された複数の物体の各々について物体の種類を識別し、識別結果と正解ラベルとの一致度合いに基づきパラメータ1222を調整する。
【0119】
これにより、推定モデル122は、画像1枚分の二次元データに対応付けられた正解ラベルに基づき、当該二次元データに対応する物体の種類を識別するように機械学習することができ、さらに、当該二次元データに対応付けられた位置関係ラベルに基づき、当該二次元データに対応する位置が口腔内のどの領域に含まれるかを機械学習することによって、より精度よく当該二次元データに対応する物体の種類を識別することができるようになる。
【0120】
図19に戻り、除去部1103は、識別部1102の識別結果に、不要物体の識別結果が含まれている場合、入力部1101から入力された二次元データから、識別部1102によって識別された不要物体の表面を示す二次元データ(以下、「不要二次元データ」とも称する。)を除去することによって、不要物体除去後の二次元データを生成する。除去部1103は、不要物体除去後の二次元データを記憶部12および画像生成部1105に出力する。
【0121】
図21は、実施の形態3に係る識別装置300によって生成された不要物体除去後の二次元データを説明するための図である。識別部1102は、入力部1101から入力された二次元データに基づき、各点についての識別結果を出力する。除去部1103は、識別部1102の識別結果に、不要物体の識別結果が含まれている場合、図21に示すように、識別部1102によって識別された不要物体に対応する二次元データ(不要二次元データ)に対して除去フラグをセットする。図21の例では、除去対象となる舌、唇、粘膜、および指に対応する不要二次元データに対して、除去フラグとして「01」をセットする。識別装置300は、除去フラグに「01」がセットされた不要二次元データについては、ディスプレイ3に表示する二次元画像に用いないように構成されている。
【0122】
図19に戻り、記憶部12は、除去部1103から入力された不要物体除去後の二次元データを記憶する。画像生成部1105は、除去部1103から入力された不要物体除去後の二次元データに基づき、二次元画像データを生成し、生成した二次元画像データをディスプレイ3に出力する。このとき、画像生成部1105は、除去フラグに「01」がセットされた不要二次元データを用いることなく、二次元画像データを生成する。これにより、識別装置300は、不要物体が除去された後の口腔内の二次元画像をディスプレイ3に表示させてユーザに見せることができる。
【0123】
[識別装置の処理フロー]
図22を参照しながら、識別装置300が実行する処理の一例を説明する。図22は、実施の形態3に係る識別装置300が実行する処理の一例を説明するためのフローチャートである。図22に示す各ステップ(以下、「S」で示す。)は、識別装置300の演算部11が識別プログラム121を実行することで実現される。また、識別装置300は、口腔内カメラ7による撮影が開始された後、図22に示すフローチャートの処理を実行する。
【0124】
図22に示すように、識別装置300は、口腔内カメラ7によって撮像された撮像画像に表された物体の表面を示す二次元データを取得する(S31)。識別装置300は、口腔内カメラ7の撮像によって取得された画像1枚分の二次元データと、推定モデル122とに基づき、撮像された複数の物体の各々を識別する(S32)。
【0125】
識別装置300は、識別結果に基づき、不要物体を検出したか否かを判定する(S33)。識別装置300は、不要物体を検出した場合(S33でYES)、検出した不要物体に対応する不要二次元データを抽出し、抽出した不要二次元データを除去する(S34)。すなわち、識別装置300は、不要二次元データに対して除去フラグをセットする。
【0126】
識別装置300は、不要物体を検出しなかった場合(S33でNO)、または、S34で不要二次元データを除去した後、不要二次元データを除去した後の二次元データを記憶部12に記憶する(S35)。さらに、識別装置300は、不要二次元データを除去した後の二次元データに基づき、二次元画像データを生成し、生成した二次元画像データをディスプレイ3に出力することによって、口腔内の二次元画像をディスプレイ3に表示させる(S36)。
【0127】
識別装置300は、口腔内カメラ7による撮像が停止したか否かを判定する(S37)。識別装置300は、口腔内カメラ7による撮像が停止していない場合(S37でNO)、S31に処理を戻す。一方、識別装置300は、口腔内カメラ7による撮像が停止した場合(S37でYES)、本処理を終了する。
【0128】
以上のように、識別装置300は、口腔内カメラ7の撮影によって得られた画像1枚分の二次元データに基づき、歯科診療に不要な不要物体も推定モデル122を用いて識別することができる。これにより、ユーザは、口腔内の複数の物体の各々を自ら識別する必要がなく、口腔内の複数の物体の各々を容易にかつ適切に識別することができる。また、ユーザは、不要物体の二次元データを自ら抽出する必要がなく、不要物体の二次元データを容易にかつ適切に抽出することができる。
【0129】
<実施の形態4>
本開示の実施の形態4について、図面を参照しながら詳細に説明する。なお、実施の形態4においては、実施の形態1と異なる部分のみを説明し、実施の形態1と同じ部分については、同一符号を付してその説明は繰り返さない。
【0130】
[識別装置の機能構成]
図23は、実施の形態4に係る識別装置400の機能構成を示すブロック図である。実施の形態4に係る識別装置400は、三次元スキャナ2によって取得された三次元データから次元を落とした二次元データを生成し、二次元データに基づき、推定モデル122を用いて口腔内の複数の物体の各々を識別し、識別結果に基づき不要物体に対応する三次元データを抽出するように構成されている。
【0131】
具体的には、図23に示すように、識別装置400は、主な機能部として、入力部1101と、二次元データ生成部1106と、識別部1102と、除去部1103と、結合部1104と、画像生成部1105と、記憶部12とを備える。
【0132】
入力部1101は、三次元スキャナ2によって取得される1スキャンごとの三次元データが入力される。
【0133】
二次元データ生成部1106は、演算部11の機能部である。二次元データ生成部1106は、入力部1101から入力される1スキャン分の三次元データから二次元データを生成する。
【0134】
具体的には、図4を用いて説明したように、共焦点法の技術を用いた三次元スキャナ2は、スキャン範囲に含まれる物体からの光を検出することによって、物体の表面を示す点群の各々の位置情報を含む三次元データを取得することができる。図10に示すように、三次元スキャナ2によって取得されて入力部1101から入力される三次元データは、位置情報として、物体の表面を示す点群の各々のX座標、Y座標、およびZ座標を含み、その位置での色情報を含む。二次元データ生成部1106は、入力部1101から入力される三次元データに含まれる位置情報のうち、X座標およびY座標のみを用いて物体の表面を示す点群の各々の二次元データを生成する。X座標およびY座標は、二次元データのピクセル位置であり、色情報はそのピクセル位置での画素値である。すなわち、二次元データ生成部1106によって三次元データに基づき生成される二次元データは、スキャン範囲に含まれる少なくとも1つの物体を一定距離離間した位置(たとえば、図4の仮想視点位置)から見た場合の当該少なくとも1つの物体の外観を示す二次元画像のデータである。二次元データ生成部1106は、生成した二次元データを識別部1102に出力する。
【0135】
なお、二次元データ生成部1106は、入力部1101から入力される三次元データに含まれる位置情報のうち、X座標、Y座標、およびZ座標を用いて物体の表面を示す点群の各々を、距離画像として二次元データを生成してもよい。すなわち、二次元データ生成部1106は、X座標およびY座標を二次元データのピクセル位置とし、Z座標をそのピクセル位置での画素値に変換してもよい。距離画像は、Z座標が画像の濃淡を含む色情報によって表現される二次元データである。さらに、二次元データ生成部1106は、X座標およびY座標のみを用いて生成した物体の表面を示す二次元データと、X座標、Y座標、およびZ座標を用いて生成した距離画像を用いた二次元データの両方を生成してもよい。このように、Z座標を色情報とすれば、人間が視覚的に二次元画像(距離画像)を見る場合に有用である。たとえば、奥歯を上からスキャンした場合の距離画像(Z座標を画素値に変換した画像)においては、歯の咬合面付近が白に近い色になり、歯肉の奥側は黒に近い色になる。すなわち、奥歯における高低差を白黒によって表すことができる。一方、カラー写真のような通常の二次元画像の場合は、色またはXY平面における輪郭によって奥歯の形状が表され、高低差は表現され得ない。特に、機械学習においては、カラー写真のような二次元画像だけでは、スキャンされた物体が歯肉、粘膜(頬の裏側)、および唇のいずれであるのか判断が難しい場合に、上述したような高低差のある距離画像を用いれば各物体を識別することが可能になる。また、演算部11のようなコンピュータ(AI)においても、距離画像のようなZ座標に画素値を用いる場合は、Z座標に単に形状の高さを用いる場合よりも、隣り合う複数の物体間の関係が分かりやすくなるため、畳み込み演算(convolution)を使って計算し易くなる。
【0136】
識別部1102は、二次元データ生成部1106から入力される二次元データと、推定モデル122とに基づき、複数の物体のうちの少なくとも1つの物体を識別する。識別部1102は、識別結果を除去部1103に出力する。
【0137】
ここで、図24を参照しながら、推定モデル122の機械学習について説明する。図24は、実施の形態4に係る推定モデル122を機械学習させるときに用いられる学習用データを説明するための図である。図24に示すように、実施の形態4に係る推定モデル122は、口腔内の複数の物体の各々の位置情報として、X座標およびY座標を含む二次元データと、複数の物体の間における相対的な位置関係を示す位置関係ラベルと、複数の物体の各々を示す正解ラベルとを含む1スキャン分の学習用データを用いて、1スキャン分の二次元データに基づき複数の物体の各々を推定するように機械学習(教師あり学習)が行われる。すなわち、推定モデル122は、Z座標を用いることなく、X座標およびY座標を含む二次元データに基づき物体を推定するように機械学習が行われている。
【0138】
学習用データにおいては、1スキャンで得られる複数の物体の各々の表面を示す点群の各々の二次元データ(位置情報)に対して、物体の種類を示す正解ラベルと、複数の物体の間における相対的な位置関係を示す位置関係ラベルとが対応付けられている。
【0139】
推定モデル122は、1スキャン分の二次元データに基づき、スキャンされた複数の物体の各々の表面を示す点群の各々について物体の種類を識別し、識別結果と正解ラベルとの一致度合いに基づきパラメータ1222を調整する。
【0140】
これにより、推定モデル122は、1スキャン分の二次元データに対応付けられた正解ラベルに基づき、当該二次元データに対応する物体の種類を識別するように機械学習することができ、さらに、当該二次元データに対応付けられた位置関係ラベルに基づき、当該二次元データに対応する位置が口腔内のどの領域に含まれるかを機械学習することによって、より精度よく当該二次元データに対応する物体の種類を識別することができるようになる。
【0141】
さらに、推定モデル122は、Z座標の分だけ次元を落とした2次元データに基づき機械学習するため、Z座標を含む三次元データを用いるよりも、演算処理の負担を低減しながら機械学習することができる。
【0142】
図23に戻り、除去部1103は、識別部1102の識別結果に、不要物体の識別結果が含まれている場合、入力部1101から入力された三次元データから、識別部1102によって識別された不要物体の表面を示す点群の各々の位置情報を含む不要三次元データを除去することによって、不要物体除去後の三次元データを生成する。
【0143】
具体的には、除去部1103は、不要物体の表面を示す点群の各々のXY平面方向における位置情報(X座標,Y座標)を抽出し、不要物体の表面を示す点群の各々に対応する光軸方向における位置情報(Z座標)を抽出することによって、不要三次元データを抽出する。たとえば、除去部1103は、二次元データ生成部1106によって生成された二次元データに基づき、識別部1102によって識別された不要物体の表面を示す点群の各々のX座標およびY座標を抽出する。さらに、除去部1103は、抽出した不要物体のX座標およびY座標を検索キーにして、入力部1101が取得した三次元データに基づき、不要物体のX座標およびY座標に対応付けられたZ座標を抽出する。除去部1103は、抽出した不要物体のX座標、Y座標、およびZ座標を不要三次元データとすることができる。ここで、不要物体を抽出するとは、たとえば、X座標、Y座標、およびZ座標の各データに対して不要物体を識別できるような識別データを関連付けて記憶することを含む。除去部1103は、入力部1101から入力された三次元データから、不要三次元データを除去することによって、不要物体除去後の三次元データを生成することができる。除去部1103は、不要物体除去後の三次元データを結合部1104に出力する。
【0144】
結合部1104は、入力部1101に1スキャン分の三次元データが入力されるごとに、除去部1103から1スキャン分の三次元データを取得し、蓄積された複数スキャン分の三次元データを結合させることによって、結合データを生成する。結合部1104は、結合データを記憶部12および画像生成部1105に出力する。
【0145】
記憶部12は、結合部1104から入力された結合データを記憶する。画像生成部1105は、結合部1104から入力された結合データに基づき、任意の視点から見た二次元画像に対応する二次元画像データを生成し、生成した二次元画像データをディスプレイ3に出力する。これにより、識別装置400は、不要物体が除去された後の口腔内の二次元画像をディスプレイ3に表示させてユーザに見せることができる。
【0146】
[識別装置の処理フロー]
図25を参照しながら、識別装置400が実行する処理の一例を説明する。図25は、実施の形態4に係る識別装置400が実行する処理の一例を説明するためのフローチャートである。図2に示す各ステップ(以下、「S」で示す。)は、識別装置400の演算部11が識別プログラム121を実行することで実現される。また、識別装置400は、三次元スキャナ2によるスキャンが開始された後、図25に示すフローチャートの処理を実行する。
【0147】
図25に示すように、識別装置400は、三次元スキャナ2によってスキャンされた任意の点の三次元データを取得する(S41)。識別装置400は、取得した三次元データから、X座標およびY座標のみを用いて二次元データを生成する(S42)。識別装置400は、二次元データと、推定モデル122とに基づき、スキャンされた複数の物体の各々を識別する(S43)。
【0148】
識別装置400は、識別結果に基づき、不要物体を検出したか否かを判定する(S44)。識別装置400は、不要物体を検出した場合(S44でYES)、検出した不要物体に対応する不要三次元データを抽出し、抽出した不要三次元データを除去する(S45)。すなわち、識別装置400は、不要三次元データに対して除去フラグをセットする。
【0149】
識別装置400は、不要物体を検出しなかった場合(S44でNO)、または、S45で不要三次元データを除去した後、複数スキャン分の三次元データを結合させることによって、結合データを生成する(S46)。
【0150】
識別装置400は、結合データを記憶部12に記憶する(S47)。さらに、識別装置400は、結合データに基づき、任意の視点から見た二次元画像に対応する二次元画像データを生成し、生成した二次元画像データをディスプレイ3に出力することによって、口腔内の二次元画像をディスプレイ3に表示させる(S48)。
【0151】
識別装置400は、三次元スキャナ2によるスキャンが停止したか否かを判定する(S49)。識別装置400は、三次元スキャナ2によるスキャンが停止していない場合(S49でNO)、S41に処理を戻す。一方、識別装置400は、三次元スキャナ2によるスキャンが停止した場合(S49でYES)、本処理を終了する。
【0152】
以上のように、識別装置400は、三次元スキャナ2によって取得された三次元データに基づき、歯科診療に不要な不要物体も推定モデル122を用いて識別することができる。これにより、ユーザは、口腔内の複数の物体の各々を自ら識別する必要がなく、口腔内の複数の物体の各々を容易にかつ適切に識別することができる。また、ユーザは、不要物体の三次元データを自ら抽出する必要がなく、不要物体の三次元データを容易にかつ適切に抽出することができる。さらに、識別装置400は、Z座標の分だけ次元を落とした2次元データに基づき、推定モデル122を用いて口腔内の複数の物体の各々を識別することができるため、Z座標を含む三次元データを用いて口腔内の複数の物体の各々を識別するよりも、演算処理の負担を低減しながら不要物体の三次元データを抽出することができる。
【0153】
<実施の形態5>
本開示の実施の形態5について、図面を参照しながら詳細に説明する。なお、実施の形態5においては、実施の形態1と異なる部分のみを説明し、実施の形態1と同じ部分については、同一符号を付してその説明は繰り返さない。
【0154】
図26は、実施の形態5に係る三次元スキャナ102が三角測量法に基づき三次元データを取得する例を説明するための図である。図27は、実施の形態5に係る三次元スキャナ102によって取得された三次元データに基づき任意の視点から見た二次元画像を示す図である。実施の形態5に係る三次元スキャナ102は、実施の形態1に係る三次元スキャナ2と異なり、三角測量法に基づき三次元データを取得する。
【0155】
図26に示すように、三角測量法においては、プロジェクタ8によって物体にパターンが投影され、プロジェクタ8とは異なる位置にあるカメラ9によって物体に投影されたパターンが撮像される。図26(A)に示すように、プロジェクタ8が物体に対して直線パターンを投影した場合、プロジェクタ8と物体とを結ぶ線と、カメラ9と物体とを結ぶ線とによって成される角度に基づき、図26(B)に示すように、カメラ9の撮像によって得られたパターン画像は、物体の形状に沿ったパターンが表れる。図26(C)に示すように、三次元スキャナ102は、プロジェクタ8と物体とを結ぶ線の長さ、カメラ9と物体とを結ぶ線の長さ、プロジェクタ8とカメラ9とを結ぶ線の長さ、およびこれら複数の線によって生成される三角形の各頂点の角度に基づき、公知の三角測量法を用いて物体に投影されたパターンの位置を検出する。
【0156】
図27に示すように、三次元スキャナ102は、口腔内の物体にパターンを投影するプロジェクタ8と、物体に投影されたパターンを撮像するカメラ9とを備える。三次元スキャナ102は、図27(A)に示すように、プロジェクタ8によって物体にパターンが投影された状態でカメラ9によって物体を撮像する。三次元スキャナ102は、図27(A)の撮像画像に基づき、公知の三角測量法を用いて物体の表面を示す点群の各々の位置情報(X座標,Y座標,Z座標)を取得する。
【0157】
さらに、三次元スキャナ102は、図27(B)に示すように、プロジェクタ8によって物体にパターンが投影されていない状態でカメラ9によって物体を撮像してもよい。上述したように、実施の形態3に係る識別装置300は、二次元データに基づき口腔内の複数の物体の各々を識別するように構成されており、識別装置300は、三次元スキャナ102によって取得された図27(B)の撮像画像に基づき、口腔内の複数の物体の各々を識別してもよい。さらに、識別装置300は、抽出した不要物体のX座標およびY座標を検索キーにして、図27(A)の撮像画像に基づき取得した不要物体のZ座標を抽出してもよい。
【0158】
なお、三次元スキャナ102は、プロジェクタ8によって物体にパターンが投影された状態でカメラ9によって物体を撮像する処理と、プロジェクタ8によって物体にパターンが投影されていない状態でカメラ9によって物体を撮像する処理とを切り替えることによって、図27(A)の撮像画像と、図27(B)の撮像画像とを取得してもよい。あるいは、三次元スキャナ102は、カメラ9を複数備え、プロジェクタ8によって物体にパターンが投影された状態で第1のカメラによって物体を撮像し、プロジェクタ8によって物体にパターンが投影されていない状態で第2のカメラによって物体を撮像することによって、図27(A)の撮像画像と、図27(B)の撮像画像とを取得してもよい。
【0159】
<実施の形態6>
本開示の実施の形態6について、図面を参照しながら詳細に説明する。なお、実施の形態6においては、実施の形態1と異なる部分のみを説明し、実施の形態1と同じ部分については、同一符号を付してその説明は繰り返さない。
【0160】
図28は、実施の形態6に係る推定モデルを機械学習させるときに用いられる学習用データを説明するための図である。図28に示すように、実施の形態6に係る推定モデルは、口腔内の複数の物体の各々の位置情報および法線情報を含む三次元データと、複数の物体の間における相対的な位置関係を示す位置関係ラベルと、複数の物体の各々を示す正解ラベルと、複数の物体の各々が可動可能であるか否かを示す可動ラベルとを含む学習用データを用いて、三次元データに基づき複数の物体の各々を推定するように機械学習(教師あり学習)が行われる。
【0161】
具体的には、口腔内の複数の物体のうち、口腔内に挿入される指または診療器具などの挿入物、および舌の先端は、動作することによって下顎第1隙間および下顎第2隙間などに存在することが可能であり、その場合、三次元スキャナ2を用いた三次元データの取得において不要物体となり得る。そこで、舌、唇、粘膜、および挿入物体などの可動物体をスキャンすることによって得られた三次元データに対しては、可動ラベルとして「01」を示すデータが対応付けられる。
【0162】
これにより、推定モデル122は、三次元データに対応付けられた正解ラベルに基づき、当該三次元データに対応する物体の種類を識別するように機械学習することができ、さらに、当該三次元データに対応付けられた可動ラベルに基づき、当該三次元データに対応する物体が可動可能な物体(すなわち、舌、唇、粘膜、または挿入物体)であるかを機械学習することによって、より精度よく当該三次元データに対応する物体の種類を識別することができるようになる。
【0163】
<変形例>
本開示は、上記の実施例に限られず、さらに種々の変形、応用が可能である。以下、本開示に適用可能な変形例について説明する。
【0164】
入力部1101に入力される三次元データには、物体の表面を示す点群の各々における位置情報および法線情報に加えて、点群の各々における実際の色を表す色情報(RGB値)が含まれていてもよい。さらに、推定モデル122は、入力部1101に入力された三次元データに対応付けられた色情報(RGB値)に基づき、物体の種類を識別するように機械学習されてもよい。なお、入力部1101に入力される三次元データには、点群の各々における位置情報のみが含まれ、法線情報および色情報が含まれていなくてもよい。
【0165】
除去部1103は、不要三次元データを除去することに限らず、不要三次元データに不要物体を示す色情報を付加してもよい。そして、画像生成部1105は、不要物体が除去された後の口腔内の二次元画像を生成することに限らず、不要物体に対応する部分に当該不要物体を示す色が付された二次元画像を生成してディスプレイ3に出力してもよい。
【0166】
三次元計測方法として、上記の技術以外には、ランダムパターン投影またはパターン投影のないSfM(Structure From Motion)及びSLAM(Simultaneous Localization and Mapping)などの三角測量法を用いてもよいし、TOF(Time Of Flight)またはLIDAR(Light Detection and Ranging)などのレーザー技術などを用いてもよい。
【0167】
今回開示された実施の形態は全ての点で例示であって制限的なものではないと考えられるべきである。本開示の範囲は上記した説明ではなく特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内での全ての変更が含まれることが意図される。なお、本実施の形態で例示された構成および変形例で例示された構成は、適宜組み合わせることができる。
【符号の説明】
【0168】
1,200,300,400 識別装置、2,102 三次元スキャナ、3 ディスプレイ、4 キーボード、5 マウス、7 口腔内カメラ、8 プロジェクタ、9 カメラ、10 識別システム、11 演算部、12 記憶部、13 スキャナインターフェース、14 通信部、15 ディスプレイインターフェース、16 周辺機器インターフェース、17 読取部、20 リムーバブルディスク、21 ハウジング、22 プローブ、23 光源、24 レンズ、25 光学センサ、26 プリズム、27 カウンタウェイト、28 反射部、29 開口部、40 制御装置、121 識別プログラム、122 推定モデル、1101 入力部、1102 識別部、1103 除去部、1104 結合部、1105 画像生成部、1106 二次元データ生成部、1221 ニューラルネットワーク、1222 パラメータ。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27
図28