(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022070002
(43)【公開日】2022-05-12
(54)【発明の名称】特徴量抽出装置、特徴量抽出方法及びプログラム
(51)【国際特許分類】
G06T 7/00 20170101AFI20220502BHJP
G06T 19/00 20110101ALI20220502BHJP
【FI】
G06T7/00 C
G06T19/00 A
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2020178996
(22)【出願日】2020-10-26
(71)【出願人】
【識別番号】000233055
【氏名又は名称】株式会社日立ソリューションズ
(74)【代理人】
【識別番号】110000279
【氏名又は名称】特許業務法人ウィルフォート国際特許事務所
(72)【発明者】
【氏名】古川 雄貴
(72)【発明者】
【氏名】桐畑 康裕
(72)【発明者】
【氏名】中山 晃治
【テーマコード(参考)】
5B050
5L096
【Fターム(参考)】
5B050AA03
5B050BA09
5B050CA01
5B050EA27
5L096AA09
5L096EA16
5L096FA19
5L096FA38
5L096FA60
5L096FA62
5L096FA64
5L096FA66
5L096FA68
5L096FA81
5L096GA59
5L096JA11
(57)【要約】
【課題】3次元画像の形状を反映した単一の特徴量を抽出することで、高速で精度の高い類似画像検索を可能にする特徴量抽出装置を提供する。
【解決手段】演算部11は、対象画像に含まれる3次元点群データの重心を中心点とした3次元点群データを囲む球面に対して、3次元点群の各点と中心点との距離を示す情報を各点の深度情報として射影した射影画像を生成する。演算部11は、射影画像を2次元平面に展開した球面深度画像を特徴量として抽出する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
3次元点群データを含む3次元画像の特徴量を抽出する特徴量抽出装置であって、
前記3次元点群データの重心を中心点とした前記3次元点群データを囲む球面に対して、前記3次元点群の各点と前記中心点との距離を示す情報を各点の深度情報として射影した射影画像を生成し、前記射影画像を2次元平面に展開した画像を前記特徴量として抽出する演算部を有する特徴量抽出装置。
【請求項2】
前記演算部は、前記3次元点群に対して主成分分析を行って、前記3次元点群データの主成分を特定し、前記主成分に基づいて前記3次元画像を回転させた状態で前記射影画像を生成する、請求項1に記載の特徴量抽出装置。
【請求項3】
前記演算部は、各点の深度情報を、当該点と前記中心点とを結ぶ直線が前記球面とが交わる交点に射影する、請求項1に記載の特徴量抽出装置。
【請求項4】
前記演算部は、前記交点に複数の前記深度情報が射影される場合、当該複数の深度情報のうち最も外側の点の深度情報を射影する、請求項3に記載の特徴量抽出装置。
【請求項5】
前記3次元画像は、前記3次元点群データの各点を頂点とする複数のポリゴンで形成され、
前記演算部は、各ポリゴンの各辺に点を補間し、当該補間した点を前記3次元点群データに追加する、請求項1に記載の特徴量抽出装置。
【請求項6】
前記球面は、前記3次元点群データの外接球の球面である、請求項1に記載の特徴量抽出装置。
【請求項7】
3次元点群データを含む3次元画像の特徴量を抽出する特徴量抽出装置による特徴量抽出方法であって、
前記3次元点群データの重心を中心点とした前記3次元点群データを囲む球面に対して、前記3次元点群の各点と前記中心点との距離を示す情報を各点の深度情報として射影した射影画像を生成し、
前記射影画像を2次元平面に展開した画像を前記特徴量として抽出する、特徴量抽出方法。
【請求項8】
3次元点群データを含む3次元画像の特徴量を抽出するためのプログラムであって、
前記3次元点群データの重心を中心点とした前記3次元点群データを囲む球面に対して、前記3次元点群の各点と前記中心点との距離を示す情報を各点の深度情報として射影した射影画像を生成する手順と、
前記射影画像を2次元平面に展開した画像を前記特徴量として抽出する手順とを、コンピュータに実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、特徴量抽出装置、特徴量抽出方法及びプログラムに関する。
【背景技術】
【0002】
近年、ユーザが指定した3次元画像と類似する類似画像を検索する3次元類似画像検索が注目されている。例えば、製造業などの分野では、製品の設計を行う際に、設計図面と類似する図面を検索することで、製品設計及びその見積などの効率化を図ることが可能となる。
【0003】
3次元類似画像検索では、3次元画像からその3次元画像の特徴を表す特徴量を抽出し、その特徴量に基づいて類似画像が検索される(特許文献1参照)。3次元画像から特徴量を抽出する手法としては、D2(Shape Distribution:2点間距離)法、SHD(Spherical Harmonics Descriptor: 調和変換)法、LFD(Light Field Descriptor:多方向撮影)法、及び、MFSD(Multi-Fourier Spectra Descriptor:複合特徴量)法が知られている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
D2法は、3次元画像における2点間の距離などの分布をヒストグラム化することで特徴量を抽出するものである。D2方法では、単一の特徴量を容易に抽出することができるため、類似画像検索の検索速度が速い。しかしながら、3次元画像の形状が特徴量に反映されていないため、検出精度が低いという問題がある。
【0006】
SHD法は、3次元画像に複数の球殻を生成し、各球殻に応じた球面調和関数に基づいて特徴量を抽出するものである。SHD法では、3次元画像の形状を反映した特徴量を抽出することができるため、検出精度は比較的高い。しかしながら、球殻ごとに特徴量を算出する必要があるため、複数の特徴量が必要となり、特徴量の取り扱いが難しく、検索速度が遅いという問題がある。
【0007】
LFD法は、3次元画像を様々な方向から撮影した複数の2次元画像に基づいて特徴量を抽出するものであり、SHD法は、LFD法による複数の特徴量に加えて、3次元画像の輪郭、影及び深度などを複合した特徴量を抽出するものである。これらの方法では、3次元画像の形状を反映した特徴量を抽出することができるため、検出精度は高い。しかしながら、特徴量の数が非常に多く、検索速度が非常に遅いという問題がある。
【0008】
本開示の目的は、3次元画像の形状を反映した単一の特徴量を抽出することで、高速で精度の高い類似画像検索を可能とする特徴量抽出装置、特徴量抽出方法及びプログラムを提供することにある。
【課題を解決するための手段】
【0009】
本開示の一態様に従う特徴量抽出装置は、3次元点群データを含む3次元画像の特徴量を抽出する特徴量抽出装置であって、前記3次元点群データの重心を中心点とした前記3次元点群データを囲む球面に対して、前記3次元点群の各点と前記中心点との距離を示す情報を各点の深度情報として射影した射影画像を生成し、前記射影画像を2次元平面に展開した画像を前記特徴量として抽出する演算部を有する。
【発明の効果】
【0010】
本発明によれば、3次元画像の形状を反映した単一の特徴量を抽出することが可能となり、高速で精度の高い類似画像検索が可能となる。
【図面の簡単な説明】
【0011】
【
図1】本開示の一実施形態の特徴量抽出システムを示すブロック図である。
【
図2】サーバ1の動作の一例を説明するためのフローチャートである。
【
図3】回転処理の一例を説明するためのフローチャートである。
【
図4】補間処理の一例を説明するためのフローチャートである。
【
図5】補間処理による点の補間の一例を示す図である。
【
図6】射影処理の一例を説明するためのフローチャートである。
【
図7】展開処理の一例を説明するためのフローチャートである。
【発明を実施するための形態】
【0012】
以下、本開示の実施形態について図面を参照して説明する。
【0013】
図1は、本開示の一実施形態の特徴量抽出システムを示すブロック図である。
図1に示す特徴量抽出システムは、サーバ1と、ユーザ端末2とを含む。サーバ1及びユーザ端末2は、互いに通信可能に接続される。なお、サーバ1及びユーザ端末2は、インターネットのような通信ネットワークを介して互いに接続されてもよい。
【0014】
サーバ1は、ユーザ端末2からの指示に従って3次元画像の特徴量を抽出する特徴量抽出装置である。ユーザ端末2は、特徴量抽出システムを利用するユーザが操作する端末装置であり、サーバ1に対して種々の指示を送信する。サーバ1及びユーザ端末2は、例えば、CPU(Central Processing Unit)のようなプロセッサ、メモリ、補助記憶装置、入力装置、出力装置、及びネットワークカードのような通信装置(いずれも図示せず)を備えた一般的なコンピュータ装置と同等なハードウェア構成で実現できる。
【0015】
サーバ1は、演算部11と、処理部12と、格納部13と、送受信部14とを有する。
【0016】
演算部11は、処理対象の3次元画像である対象画像から、その対象画像の特徴を示す特徴量として球面深度画像を抽出する計算処理を行う。処理部12は、対象画像の取得し、及び、演算部11にて生成された球面深度画像の保存どの計算処理以外の処理を主に行う。演算部11及び処理部12は、プロセッサがメモリに記録されたプログラムを読み取り、その読み取ったプログラムを実行することで実現されてもよい。また、演算部11及び処理部12の少なくとも一部の機能が1以上のハードウェア回路(例えば、FPGA(Field-Programmable Gate Array)又はASIC(Application Specific Integrated Circuit))によって実現されてもよい。
【0017】
格納部13は、例えば、メモリ及び補助記憶装置などにて実現され、演算部11及び処理部12の動作を規定するプログラム、対象画像及び球面深度画像などを格納する。送受信部14は、例えば、通信装置で実現され、ユーザ端末2との間で通信を行う。
【0018】
図2は、サーバ1の動作の一例を説明するためのフローチャートである。
【0019】
先ず、送受信部14がユーザ端末2から対象画像の特徴量の抽出を指示する特徴量抽出指示を受信すると、処理部12は、その特徴量抽出指示に従って対象画像を取得し、その対象画像を演算部11に渡す(ステップS101)。対象画像は、本実施形態では、3次元点群データを含む3次元画像であり、より具体的には、3次元点群データの各点を頂点とするポリゴンで形成されたポリゴンデータである。対象画像は、特徴量抽出指示と共にユーザ端末2から送信されてもよいし、格納部13に予め格納されていてもよい。
【0020】
演算部11は、対象画像に含まれる3次元点群データに対して主成分分析を行って、前記3次元点群データの主成分を特定し、その主成分に基づいて対象画像を回転させる回転処理(
図3参照)を行う(ステップS102)。
【0021】
演算部11は、回転処理を行った対象画像を囲む球面を設定する(ステップS103)。本実施形態では、対象画像を囲む球面は、対象画像に含まれる3次元点群データの重心を中心点とし、3次元点群データに外接する外接球の球面である。
【0022】
演算部11は、回転処理を行った対象画像を形成するポリゴンの各辺上に点を補間して3次元点群データに追加する補間処理(
図4及び
図5参照)を行う(ステップS104)。
【0023】
演算部11は、対象画像内の3次元点群データの各点(補間した各点を含む)の対象画像内の深度を示す深度情報を、外接球の球面に射影した射影画像を生成する射影処理(
図6参照)を行う(ステップS105)。
【0024】
演算部11は、深度情報が射影された外接球の球面を2次元平面に展開した画像を、対象画像の特徴を表す特徴量である球面深度画像として抽出する展開処理(
図7及び
図8参照)を行う(ステップS106)。
【0025】
そして、処理部12は、演算部11が生成した球面深度画像を格納部13に格納して(ステップS107)、処理を終了する。なお、処理部12は、特徴量抽出指示に対する応答情報として特徴量を抽出した旨の情報を、送受信部14を介してユーザ端末2に送信してもよい。
【0026】
図3は、
図2のステップS102の回転処理の一例を説明するためのフローチャートである。
【0027】
回転処理では、先ず、演算部11は、対象画像内の3次元点群データに対して主成分分析を行って、3次元点群データの主成分として、第1主成分、第2主成分及び第3主成分を特定する(ステップS201)。
【0028】
演算部11は、第1主成分及び第3主成分をそれぞれ基準軸として設定する(ステップS202)。
【0029】
演算部11は、基準軸がそれぞれ所定の方向を向くように対象画像を回転させ(ステップS203)、回転処理を終了する。本実施形態では、演算部11は、第1主成分がx軸を向き、第3主成分がy軸を向くように対象画像を回転させる。
【0030】
図4は、
図2のステップS104の補間処理の一例を説明するためのフローチャートである。
【0031】
補間処理では、演算部11は、外接球の半径に基づいて、点を補間する補間間隔を決定する(ステップS301)。例えば、演算部11は、外接球の半径が大きいほど、補間間隔を小さくする。
【0032】
演算部11は、対象画像の各ポリゴンの各辺の長さを算出する(ステップS302)。演算部11は、各ポリゴンの各辺に対して、その辺の長さと補間間隔とに基づいて、補間する点の個数を決定する(ステップS303)。例えば、演算部11は、(辺の長さ)/(補間距離)の商を個数として決定する。
【0033】
演算部11は、各ポリゴンの各辺上に、その辺に対して決定した個数分の点を3次元点群データの点として補間し、その点を3次元点群データに追加して(ステップS304)、補間処理を終了する。
【0034】
図5は、補間処理による点の補間の一例を示す図である。具体的には、
図5(a)は、補間処理前の対象画像の一例を示す図であり、
図5(b)は、補間処理後の対象画像の一例を示す図である。
【0035】
補間処理前では、
図5(a)に示すように、対象画像の各ポリゴン21の頂点にのみ3次元点群データの点22が存在する。これに対して補間処理後では、
図5(b)に示すように、各ポリゴン21の頂点の点22だけでなく、各ポリゴン21の各辺に補間された点23が存在する。このため、対象画像内の点の数が補間処理前と比べて増加している。
【0036】
図6は、
図2のステップS105の射影処理の一例を説明するためのフローチャートである。
【0037】
射影処理では、演算部11は、対象画像内の各点について、その点と外接球の中心点との距離を深度として示す深度情報を算出する(ステップS401)。
【0038】
演算部11は、各点の深度情報を所定の規則に従って規格化する(ステップS402)。ここでは、演算部11は、外接球の中心点と一致する点の深度が0となり、外接球の表面と一致する点の深度が255となるように深度情報を規格化する。
【0039】
演算部11は、各点の深度情報を濃淡情報として外接球の表面に射影して、外接球の表面に濃淡情報(深度情報)をマッピングすることで、射影画像を生成する(ステップS403)。ここでは、演算部11は、各点の深度情報を、その点と外接球の中心点とを結ぶ直線が外接球と交わる交点に射影する。
【0040】
そして、演算部11は、外接球の表面の点において複数の深度情報が射影された点が存在するか否かを判断する。複数の深度情報が射影された点が存在する場合、演算部11は、の複数の深度情報のいずれかを選択し、それ以外の深度情報を削除することで、複数の深度情報のいずれかが射影されて射影画像を生成し(ステップS404)、射影処理を終了する。ここでは、演算部11は、複数の深度情報のうち最も外側の点の深度情報を選択する。なお演算部11は、複数の深度情報のうち最も内側の点の深度情報などを選択してもよい。また、複数の深度情報が射影された点がない場合、演算部11は、そのまま射影処理を終了する。
【0041】
図7は、
図2のステップS106の展開処理の一例を説明するためのフローチャートである。
【0042】
展開処理では、演算部11は、外接球の球面の各点の座標を極座標に変換する(ステップS501)。ここでは、変換前の各点の座標は、直交座標(x,y,z)で表され、回転処理(
図3参照)によって、3次元点群データの第1主成分がx軸方向を向いており、第3主成分がy軸方向を向いている。この場合、演算部11は、以下の数1を用いて、各点の座標を極座標(r,θ,φ)に変換する。
【数1】
【0043】
そして、演算部11は、球面の各点の極座標を2次元座標(x、y)に変換することで、球面の各点をxy平面に展開して球面深度画像を生成し(ステップS502)、展開処理を終了する。ここでは、演算部11は、以下の数2を用いて各点の極座標を2次元座標(x、y)に変換する。
【数2】
【0044】
図8は、展開処理の一例を説明するための図である。具体的には、
図8(a)は、展開処理前の画像の一例を示す図であり、
図8(b)は、展開処理後の画像の一例を示す図である。
【0045】
図8に示すように展開処理により、外接球の表面上に深度情報として濃淡情報が射影された射影画像(
図8(a))が2次元のグレースケール画像である球面深度画像(
図8(b))に変換される。
【0046】
なお、特徴量である球面深度画像に対して数1及び数2で示した変換の逆変換を行うことで射影画像を概ね再現することが可能であり、さらに射影処理による射影の逆射影を行うことで射影画像から元の対象画像を概ね再現することが可能である。これは、球面深度画像が元の対象画像の形状等の特徴を概ね保持しており、特徴量損失が少ないことを示している。
【0047】
以上説明したように本実施形態によれば、演算部11は、対象画像に含まれる3次元点群データの重心を中心点とした3次元点群データを囲む球面に対して、3次元点群の各点と中心点との距離を示す情報を各点の深度情報として射影した射影画像を生成する。演算部11は、射影画像を2次元平面に展開した球面深度画像を特徴量として抽出する。したがって、対象画像の形状を反映した単一の球面深度画像を特徴量として抽出することが可能になるため、高速で精度の高い類似画像検索が可能となる。
【0048】
また、本実施形態では、演算部11は、3次元点群に対して主成分分析を行って、3次元点群データの主成分を特定し、その主成分に基づいて3次元画像を回転させた状態で射影画像を生成する。したがって、対象画像の向きを揃えて特徴量を抽出することが可能となるため、精度の高い類似画像検索が可能となる。
【0049】
また、本実施形態では、演算部11は、各点の深度情報を、その点と球面の中心点とを結ぶ直線が球面とが交わる交点に射影する。したがって、3次元画像の形状をより正確に反映した特徴量を抽出することが可能となる。
【0050】
また、本実施形態では、演算部11は、球面上の点に複数の深度情報が射影される場合、当該複数の深度情報のうち最も外側の点の深度情報を射影する。この場合、3次元画像の外側の形状を反映した特徴量を抽出することが可能となるため、精度の高い類似画像検索が可能となる。
【0051】
また、本実施形態では、演算部11は、対象画像の各ポリゴンの各辺に点を補間し、その補間した点を3次元点群データに追加し、深度情報を射影する。このため、特徴量に反映させる情報量を増加させることが可能となるため、精度の高い類似画像検索が可能となる。
【0052】
また、本実施形態では、球面は、3次元点群データの外接球の球面である。このため、3次元点群データの各点の深度を適切に射影することが可能となる。
【0053】
上述した本開示の実施形態は、本開示の説明のための例示であり、本開示の範囲をそれらの実施形態にのみ限定する趣旨ではない。当業者は、本開示の範囲を逸脱することなしに、他の様々な態様で本開示を実施することができる。
【0054】
例えば、サーバ1は、抽出した特徴量を用いて3次元画像の類似画像検索を行う機能を有していてもよい。
【符号の説明】
【0055】
1:サーバ、2:ユーザ端末、11:演算部、12:処理部、13:格納部、14:送受信部