(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-12-26
(54)【発明の名称】円検出方法、装置、電子機器および記憶媒体
(51)【国際特許分類】
G06T 7/60 20170101AFI20241219BHJP
G06T 7/13 20170101ALI20241219BHJP
G06V 10/25 20220101ALI20241219BHJP
G06V 10/22 20220101ALI20241219BHJP
G06V 10/44 20220101ALI20241219BHJP
G06F 3/04883 20220101ALI20241219BHJP
【FI】
G06T7/60 200C
G06T7/13
G06V10/25
G06V10/22
G06V10/44
G06F3/04883
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024539659
(86)(22)【出願日】2022-09-13
(85)【翻訳文提出日】2024-07-24
(86)【国際出願番号】 CN2022118332
(87)【国際公開番号】W WO2023124233
(87)【国際公開日】2023-07-06
(31)【優先権主張番号】202111683480.2
(32)【優先日】2021-12-31
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
(71)【出願人】
【識別番号】519059292
【氏名又は名称】杭州海康机器人股▲ふん▼有限公司
【氏名又は名称原語表記】Hangzhou Hikrobot Co., Ltd.
【住所又は居所原語表記】Room 304, Unit B, Building 2, 399 Dangfeng Road, Binjiang District, Hangzhou, Zhejiang 310051, China
(74)【代理人】
【識別番号】100103894
【氏名又は名称】家入 健
(72)【発明者】
【氏名】邵 駿傑
(72)【発明者】
【氏名】▲デン▼ 志輝
【テーマコード(参考)】
5E555
5L096
【Fターム(参考)】
5E555AA64
5E555BA04
5E555BB04
5E555BC04
5E555CA12
5E555CB10
5E555CB12
5E555DB56
5E555EA14
5E555FA00
5L096CA24
5L096DA02
5L096FA03
5L096FA04
5L096FA05
5L096FA14
5L096FA64
5L096FA69
5L096GA02
5L096GA32
(57)【要約】
本願実施例が提供する円検出方法、装置、電子機器および記憶媒体は、情報技術分野に適用され、認識対象画像における目標参照点を取得する。前記認識対象画像には円形パターンが含まれており、前記目標参照点が前記円形パターンのエッジのプリセット範囲内に配置されている。前記目標参照点を基準としてエッジ抽出を行って、少なくとも3つの目標エッジ点を取得する。前記少なくとも3つの目標エッジ点に基づいて円のフィッティングを行って、フィッティングした円を取得する。これにより、ユーザーが1つの円形パターンのエッジ付近の点を入力するたけで、円検出を実現できるため、ユーザーの操作プロセスが簡単になる。
【選択図】
図1
【特許請求の範囲】
【請求項1】
認識対象画像における目標参照点を取得することであって、前記認識対象画像には円形パターンが含まれており、前記目標参照点が前記円形パターンのエッジのプリセット範囲内に配置されていることと、
前記目標参照点を基準としてエッジ抽出を行って、少なくとも3つの目標エッジ点を取得することと、
前記少なくとも3つの目標エッジ点に基づいて円のフィッティングを行って、フィッティングした円を取得することと、を含む
円検出方法。
【請求項2】
請求項1に記載の円検出方法であって、
前記目標参照点を基準としてエッジ抽出を行って、少なくとも3つの目標エッジ点を取得することは、
前記認識対象画像における目標参照点の周囲の第1プリセット範囲内の各画素点に対して画素勾配認識を行って、第1エッジ点を取得することであって、前記第1エッジ点の画素勾配はプリセット勾配閾値より大きいことと、
前記第1エッジ点の周囲の第2プリセット範囲内の各画素点に対して画素勾配認識を行って、複数の第2エッジ点を取得することと、
前記第1エッジ点および前記複数の第2エッジ点から少なくとも3つの目標エッジ点を選択することと、を含む
円検出方法。
【請求項3】
請求項2に記載の円検出方法であって、
前記フィッティングした円のパラメータは前記フィッティングした円の位置座標を含み、
前記少なくとも3つの目標エッジ点に基づいて円のフィッティングを行って、フィッティングした円を取得した後、前記円検出方法は、
前記フィッティングした円の位置座標に基づいて認識対象領域を生成することと、
前記認識対象領域において円の認識を行って、認識結果を取得することであって、前記認識結果は認識された円のパラメータを含むことと、をさらに含む
円検出方法。
【請求項4】
請求項3に記載の円検出方法であって、
前記フィッティングした円の位置座標は前記フィッティングした円の円心座標とフィッティングした円の半径とを含み、
前記フィッティングした円の位置座標に基づいて認識対象領域を生成することは、
前記フィッティングした円の半径に基づいて、生成対象であるプリセット形状の認識対象領域の特徴パラメータを計算して取得することであって、前記プリセット形状は円形または矩形であり、前記特徴パラメータは円の半径または矩形の長さおよび幅であることと、
前記特徴パラメータに基づいて、前記フィッティングした円の円心座標を、生成対象である認識対象領域の中心として、認識対象領域を生成することと、を含む
円検出方法。
【請求項5】
請求項3に記載の円検出方法であって、
前記フィッティングした円の位置座標は前記フィッティングした円の円心座標とフィッティングした円の半径とを含み、
前記フィッティングした円の位置座標に基づいて認識対象領域を生成することは、
前記フィッティングした円の円心座標とフィッティングした円の半径とに基づいて、円環形の認識対象領域の内径および外径を計算して取得することと、
前記フィッティングした円の円心座標を中心として、前記円環形の認識対象領域の内径および外径に基づいて、円環形の認識対象領域を生成することと、を含み
前記認識対象領域において円の認識を行って、認識結果を取得することは、
前記円環形の認識対象領域において円の認識を行って、認識結果を取得することを含む
円検出方法。
【請求項6】
請求項5に記載の円検出方法であって、
前記フィッティングした円の円心座標とフィッティングした円の半径とに基づいて、円環形の認識対象領域の内径および外径を計算して取得することは、
前記フィッティングした円の半径とプリセット円環状領域の幅との合計を計算し、認識対象領域の外径を取得することと、前記フィッティングした円の半径とプリセット円環状領域の幅との差分を計算して、認識対象領域の内径を取得することと、を含む
円検出方法。
【請求項7】
請求項2に記載の円検出方法であって、
前記第1エッジ点の周囲の第2プリセット範囲内の各画素点に対して画素勾配認識を行って、複数の第2エッジ点を取得することは、
前記第1エッジ点の周囲の第2プリセット範囲内において、前記第1エッジ点の時計回り方向および反時計回り方向における各画素点に対して画素勾配認識を行って、前記複数の第2エッジ点を取得することを含む
円検出方法。
【請求項8】
請求項2に記載の円検出方法であって、
前記認識対象画像における目標参照点の周囲の第1プリセット範囲内の各画素点に対して画素勾配認識を行って、第1エッジ点を取得することは、
前記認識対象画像における目標参照点の周囲の第1プリセット範囲内において、複数のプリセット方向における各画素点に対して画素勾配認識を行って、第1エッジ点を取得することを含む
円検出方法。
【請求項9】
請求項8に記載の円検出方法であって、
前記認識対象画像における目標参照点の周囲の第1プリセット範囲内において、複数のプリセット方向における各画素点に対して画素勾配認識を行って、第1エッジ点を取得することは、
前記認識対象画像における目標参照点の周囲の第1プリセット範囲内において、プリセット基準方向に基づいてプリセット角度おきに1つの方向を選択し、複数の目標方向を取得することと、
前記プリセット基準方向および前記複数の目標方向における各画素点に対して画素勾配認識を行って、第1エッジ点を取得することと、を含む
円検出方法。
【請求項10】
請求項2に記載の円検出方法であって、
前記第1エッジ点および前記複数の第2エッジ点から少なくとも3つの目標エッジ点を選択することは、
前記複数の第2エッジ点に対してダウンサンプリングを行って、少なくとも3つの第3サンプリングエッジ点を取得することを含み、
前記少なくとも3つの目標エッジ点に基づいて円のフィッティングを行って、フィッティングした円を取得することは、
前記少なくとも3つの第3サンプリングエッジ点に基づいて円のフィッティングを行って、前記フィッティングした円を取得することを含む
円検出方法。
【請求項11】
請求項3に記載の円検出方法であって、
前記認識対象領域において円の認識を行って、認識結果を取得することは、
前記認識対象領域と前記フィッティングした円との面積の大きさを比較することと、
前記認識対象領域と前記フィッティングした円との面積の割合がプリセット閾値より大きいである場合、前記目標参照点とプリセット領域の大きさとに基づいて更新された認識対象領域を生成することと、
前記更新された認識対象領域において円の認識を行って、認識結果を取得することと、を含む
円検出方法。
【請求項12】
請求項1に記載の円検出方法であって、
前記目標参照点を基準としてエッジ抽出を行って、少なくとも3つの目標エッジ点を取得することは、
ユーザーの認識対象領域情報を受信することであって、前記認識対象領域情報はユーザーが入力した認識対象領域の大きさおよび位置を含むことと、
前記目標参照点を基準として、前記認識対象領域においてエッジ抽出を行って、少なくとも3つの目標エッジ点を取得することと、を含む
円検出方法。
【請求項13】
認識対象画像における目標参照点を取得する、参照点取得モジュールであって、前記認識対象画像には円形パターンが含まれており、前記目標参照点が前記円形パターンのエッジのプリセット範囲内に配置されている、参照点取得モジュールと、
前記認識対象画像における目標参照点の周囲の第1プリセット範囲内の各画素点に対して画素勾配認識を行って、第1エッジ点を取得する、第1エッジ点検出モジュールであって、第1エッジ点の画素勾配はプリセット勾配閾値より大きい、第1エッジ点検出モジュールと、
前記第1エッジ点の周囲の第2プリセット範囲内の各画素点に対して画素勾配認識を行って、複数の第2エッジ点を取得する、第2エッジ点検出モジュールと、
前記第1エッジ点および前記複数の第2エッジ点から少なくとも3つの目標エッジ点を選択する、目標エッジ点取得モジュールと、
前記少なくとも3つの目標エッジ点に基づいて円のフィッティングを行って、フィッティングした円を取得する、円フィッティングモジュールとを含む
円検出装置。
【請求項14】
プロセッサと、通信インタフェースと、メモリと、通信バスと含む電子機器であって、プロセッサと通信インタフェースとメモリとが通信バスを介して互いに通信し、
メモリは、コンピュータプログラムを格納することに用いられ、
プロセッサは、メモリに格納されたプログラムを実行すると、請求項1~12のいずれか1項に記載の円検出方法のステップを実現することに用いられる、電子機器。
【請求項15】
コンピュータプログラムが記憶されているコンピュータ可読記憶媒体であって、前記コンピュータプログラムはプロセッサによって実行されると、請求項1~12のいずれか1項に記載の円検出方法のステップを実現する、コンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本出願は、2021年12月31日に中国国家知的財産権局に出願した、出願番号が202111683480.2であり、発明名称が「円検出方法、装置、電子機器および記憶媒体」である中国特許出願に基づき優先権を主張する。ここで、その全ての内容は、援用により本出願に組み込まれる。
【0002】
本出願は情報技術分野に関し、特に円検出方法、装置、電子機器および記憶媒体に関する。
【背景技術】
【0003】
マシンビジョン分野において、円形パターンを認識することで、認識結果に基づいて測位、測定等を行うことができる。例えば、認識された認識対象物体における円形パターンの円心を基準点として、認識対象物体の座標位置を確定する。
【0004】
しかしながら、従来、円形パターンの認識を行う際に、ユーザーによる複数回の入力が必要であることが多い。例えば、ユーザーが円心の位置を入力すること、およびマウスのドラッグ操作等で円形パターンの半径を入力することにより、円形の認識対象領域を算出し、そして認識対象領域において円形パターンの認識を行う必要があり、操作が複雑である。
【発明の概要】
【0005】
本願実施例は、円形パターン認識過程における操作が複雑である課題を解決するために、円検出方法、装置、電子機器および記憶媒体を提供することを目的とする。具体的な技術案は以下の通りである。
【0006】
本願実施例の第1態様として、
認識対象画像における目標参照点を取得することであって、前記認識対象画像には円形パターンが含まれており、前記目標参照点が前記円形パターンのエッジのプリセット範囲内に配置されていることと、
前記目標参照点を基準としてエッジ抽出を行って、少なくとも3つの目標エッジ点を取得することと、
前記少なくとも3つの目標エッジ点に基づいて円のフィッティングを行って、フィッティングした円を取得することと、を含む
円検出方法を提供する。
【0007】
本願実施例の第2態様として、
認識対象画像における目標参照点を取得する、参照点取得モジュールであって、前記認識対象画像には円形パターンが含まれており、前記目標参照点が前記円形パターンのエッジのプリセット範囲内に配置されている、参照点取得モジュールと、
前記目標参照点を基準としてエッジ抽出を行って、少なくとも3つの目標エッジ点を取得する、エッジ点選択モジュールと、
前記少なくとも3つの目標エッジ点に基づいて円のフィッティングを行って、フィッティングした円を取得する、円フィッティングモジュールと、を含む
円検出装置を提供する。
【0008】
本願実施例の他の態様として、
プロセッサと、通信インタフェースと、メモリと、通信バスと含む電子機器であって、プロセッサと通信インタフェースとメモリとが通信バスを介して互いに通信し、
メモリは、コンピュータプログラムを格納することに用いられ、
プロセッサは、メモリに格納されたプログラムを実行すると、上記いずれかの円検出方法のステップを実現することに用いられる、電子機器をさらに提供する。
【0009】
本願実施例の他の態様として、
コンピュータプログラムが記憶されているコンピュータ可読記憶媒体であって、前記コンピュータプログラムはプロセッサによって実行されると、上記いずれかの円検出方法のステップを実現する、コンピュータ可読記憶媒体をさらに提供する。
【0010】
本願実施例の他の態様として、
コマンドを含むコンピュータプログラム製品であって、コンピュータで実行されると、コンピュータに上記いずれかの円検出方法のステップを実行させる、コンピュータプログラム製品をさらに提供する。
【0011】
本願の実施例の有益な効果は以下のとおりである。
【0012】
本願実施例が提供する円検出方法、装置、電子機器および記憶媒体は、認識対象画像における目標参照点を取得することができ、前記認識対象画像には円形パターンが含まれており、前記目標参照点が前記円形パターンのエッジのプリセット範囲内に配置されていることと、前記目標参照点を基準としてエッジ抽出を行って、少なくとも3つの目標エッジ点を取得することと、前記少なくとも3つの目標エッジ点に基づいて円のフィッティングを行って、フィッティングした円を取得することと、を含む。このように、ユーザーが1つの円形パターンのエッジ付近の点を入力するたけで、円検出を実現できるため、ユーザーの操作プロセスが簡単になる。
【0013】
勿論、本願のいずれかの製品や方法を実施すると、必ずしも上記のすべての利点を同時に達成する必要はない。
【図面の簡単な説明】
【0014】
本出願の実施例および従来技術の技術案をより明確に説明するために、以下の実施例および従来技術に必要な図面を簡単に説明するが、無論、以下に説明される図面は単に本出願の実施例の一部であり、当業者であれば、創造的な働きをせずに、これらの図面に基づいて他の実施例が得られることができる。
【
図1】
図1は本願実施例が提供する円検出方法のプロセス模式図である。
【
図2】
図2は本願実施例が提供する円検出方法のプロセス模式図である。
【
図3】
図3は本願実施例が提供する円検出方法の実例図である。
【
図4】
図4は本願実施例が提供する認識対象領域を生成するプロセス模式図である。
【
図5】
図5は本願実施例が提供する円検出方法の他の実例図である。
【
図6】
図6は本願実施例が提供する円検出装置の構成模式図である。
【
図7】
図7は本願実施例が提供する電子機器の構成模式図である。
【発明を実施するための形態】
【0015】
本発明の目的、技術案、および利点をより明確にするために、以下、図面を参照し、実施例を挙げて、本発明をより詳しく説明する。説明される実施例は単に本発明の一部の実施例に過ぎず、全ての実施例ではないことは明らかである。本発明における実施例に基づいて、当業者が創造的な働きをせずに得られるすべての他の実施例は、いずれも本発明の保護範囲に含まれる。
【0016】
まず、本願実施例に利用される用語について解釈する。
単点:画素座標における1つの点である。
円検出:円の具体的な位置を測位し、円の円心位置および半径長さを示す。
ROI(region of interest、関心領域):限定された領域であり、アルゴリズムがこの領域において操作を実行する。
検出点:ユーザーによって提供された円周付近の点であり、円を検出することに用いられる。
チェス盤距離:2つの画素点の横座標の差の絶対値と縦座標の差の絶対値との最大値である。
RANSAC(Random Sample Consensus、ランダムサンプルコンセンサスアルゴリズム):繰り返しにより、外れ値が含まれている1組の観測されるデータから数学モデルのパラメータを推定する。
【0017】
円形パターンの認識を行う際に、ユーザーが複数回入力する必要があり、操作が複雑であるという、従来技術の課題を解決するために、
本願実施例の第1態様として、
認識対象画像における目標参照点を取得することであって、認識対象画像には円形パターンが含まれており、目標参照点が円形パターンのエッジ(即ち円形パターンの円周)のプリセット範囲内に配置されていることと、
目標参照点を基準としてエッジ抽出を行って、少なくとも3つの目標エッジ点を取得することと、
少なくとも3つの目標エッジ点に基づいて円のフィッティングを行って、フィッティングした円を取得することと、を含む
円検出方法を提供する。
【0018】
これから分かるように、本願実施例の方法により、ユーザーが1つの円形パターンのエッジ付近の点を入力するたけで、円検出を実現できるため、ユーザーの操作プロセスが簡単になる。
【0019】
具体的に、
図1を参照して、
図1は本願実施例が提供する円検出方法のプロセス模式図であり、当該円検出方法は以下のステップを含む。
【0020】
ステップS11、認識対象画像における目標参照点を取得する。
【0021】
本願実施例における認識対象画像は円形パターンを含む画像であり、目標参照点は単点であり、人が入力した点であってよい。具体的に、人のタッチ操作またはマウスにより認識対象画像に参照点として1つの点を付してもよく、キーボードにより参照点の座標位置を入力してもよい。本願実施例の方法は、スマートフォン等の機器に適用される際に、人のタッチ操作等により、目標参照点を選択してもよい。実用の過程において、ユーザーが目標参照点として1つの円形パターンのエッジの付近の1つの点を入力すればよい。具体的に、この点はエッジ上の点であってよく、エッジ上の点でなくてもよい。実用の過程において、目標参照点は認識すべく円形パターンのエッジ上に設置されてもよく、認識すべく円形パターンのエッジのプリセット範囲内に設置されてもよい。このプリセット範囲は予め設定されてよく、具体的に、このプリセット範囲は目標参照点および円形パターンのエッジ上の点を同時に含んでよい。
【0022】
従来の方法では、円を検出する過程において、通常、参照点を円心および円周上に配置する必要があり、円心座標および半径を確定することで、確定された円心および半径に基づいて円を検出する。しかし、ユーザーは、操作誤差により参照点を円心上に正確に配置できないことが多いため、複数回の操作が必要になることが多く、操作が複雑であり誤差もある。本願実施例の方法は、参照点を円周のプリセット範囲内に配置するだけで、目標参照点の選択を実現できるため、操作プロセスを簡素化し、ユーザーの体験を向上する。
【0023】
本願実施例の方法は、インテリジェント端末に適用され、インテリジェント端末によって実施されてよい。具体的に、このインテリジェント端末はコンピュータ、携帯電話、サーバーまたはインテリジェントカメラ等であってよい。
【0024】
ステップS12、目標参照点を基準としてエッジ抽出を行って、少なくとも3つの目標エッジ点を取得する。
【0025】
認識対象画像には円形パターンが含まれており、目標参照点が円形パターンのエッジ(即ち円形パターンの円周)のプリセット範囲内に配置されている。具体的に、このプリセット範囲は第1プリセット範囲であってよい。好ましくは、目標参照点を基準としてエッジ抽出を行って、少なくとも3つの目標エッジ点を取得することは、認識対象画像における目標参照点の周囲の第1プリセット範囲内の各画素点に対して画素勾配認識を行って、第1エッジ点を取得することであって、第1エッジ点の画素勾配はプリセット勾配閾値より大きいことと、第1エッジ点の周囲の第2プリセット範囲内の各画素点に対して画素勾配認識を行って、複数の第2エッジ点を取得することと、第1エッジ点および複数の第2エッジ点から少なくとも3つの目標エッジ点を取得することと、を含む。好ましくは、目標参照点を基準としてエッジ抽出を行って、少なくとも3つの目標エッジ点を取得することは、ユーザーの認識対象領域情報を受信することであって、認識対象領域情報はユーザーが入力した認識対象領域の大きさおよび位置を含むことと、目標参照点を基準として、認識対象領域においてエッジ抽出を行って、少なくとも3つの目標エッジ点を取得することと、を含む。
【0026】
認識対象画像における目標参照点の周囲の第1プリセット範囲内の各画素点に対して画素勾配認識を行って、第1エッジ点を取得する。第1エッジ点の画素勾配はプリセット勾配閾値より大きい。本願実施例において、認識対象画像における目標参照点の周囲の第1プリセット範囲内の各画素点に対して画素勾配認識を行うことは、予め設定された検出アルゴリズムにより、認識対象画像における目標参照点の周囲の第1プリセット範囲内の各画素点に対して画素値の認識を行って、認識された画素値に基づいてこの画素点に対応する画素勾配を計算することができる。実用の過程において、Sobel演算子(ソーベル演算子)を計算することで、各画素点の画素勾配を計算することができる。具体的に、この予め設定された検出アルゴリズムは、例えばcannyアルゴリズム(エッジ検出アルゴリズム)等の、エッジ点検出アルゴリズムのいずれかであってよい。一例において、認識対象画像における目標参照点の周囲の第1プリセット範囲内の各画素点に対して画素勾配認識を行うことは、第1エッジ点を取得するまで、目標参照点からのチェス盤距離が0、1、2…である画素点を順次に探索し、それらがエッジ点であるかを判断することができる。第1エッジ点は複数の画素点を含んでよい。
【0027】
第1プリセット範囲の大きさは実際状況に応じて設定されてよい。一例において、認識すべく円の範囲が小さいほど、この第1プリセット範囲が小さくべきであり、認識すべく円の範囲が大きいほど、この第1プリセット範囲が大きいはずである。例えば、認識対象画像の範囲が大きいが、認識すべく円形パターンの範囲が小さい場合、第1プリセット範囲の設定により目標参照点の周囲の小さい範囲内の点を認識すればよい。これにより、エッジ点を迅速に検出できるほか、作業メモリと計算量とを減らすこともできる。認識すべく円形パターンの範囲が大きい場合、目標参照点の周囲の大きい範囲を認識すべきである。
【0028】
好ましくは、認識対象画像における目標参照点の周囲の第1プリセット範囲内の各画素点に対して画素勾配認識を行って、第1エッジ点を取得することは、認識対象画像における目標参照点の周囲の第1プリセット範囲内において、複数のプリセット方向における各画素点に対して画素勾配認識を行って、第1エッジ点を取得することを含む。好ましくは、認識対象画像における目標参照点の周囲の第1プリセット範囲内において、複数のプリセット方向における各画素点に対して画素勾配認識を行って、第1エッジ点を取得することは、認識対象画像における目標参照点の周囲の第1プリセット範囲内において、プリセット基準方向に基づいてプリセット角度おきに1つの方向を選択し、複数の目標方向を取得することと、プリセット基準方向および複数の目標方向における各画素点に対して画素勾配認識を行って、第1エッジ点を取得することと、を含む。一例において、プリセット方向とは、目標参照点の上下左右という4つの方向、および上記4つの方向との間隔が45°である4つの方向、合計8つの方向のうちの1つまたは複数の方向と指すことができる。
【0029】
第1エッジ点の周囲の第2プリセット範囲内の各画素点に対して画素勾配認識を行って、複数の第2エッジ点を取得する。第2プリセット範囲の大きさは第1プリセット範囲の大きさと同じであってよく、異なってもよい。第1エッジ点の周囲の第2プリセット範囲内の複数の第2エッジ点を検出する際に、第1エッジ点を起点として円周輪郭上の他のエッジ点を探索してよい。探索する際に、エッジ点を円周の各位置に満遍なく配置させるように、全てのエッジ点を探索してよい。第1エッジ点の周囲の第2プリセット範囲内の各画素点に対して画素勾配認識を行うことは、例えばcannyアルゴリズム等の、上記いずれかのエッジ点検出アルゴリズムにより認識してよい。
【0030】
好ましくは、第1エッジ点の周囲の第2プリセット範囲内の各画素点に対して画素勾配認識を行って、複数の第2エッジ点を取得することは、第1エッジ点の周囲の第2プリセット範囲内において、第1エッジ点の時計回り方向および反時計回り方向における各画素点に対して画素勾配認識を行って、複数の第2エッジ点を取得することを含む。円形パターンの半径が大きい場合、これらのエッジ点に対してサンプリングを行って、サンプリングされたエッジ点のみ保留することで、メモリの消費と後続の計算量とを減らすことができる。
【0031】
第1エッジ点および複数の第2エッジ点から少なくとも3つの目標エッジ点を選択する。円のフィッティングを行う際に、円のフィッティングを行うために、少なくとも3つのエッジ点が必要であるため、第1エッジ点および複数のエッジ点を取得した後、3つのエッジ点を選択して円のフィッティングを行うことが必要である。選択された少なくとも3つの目標エッジ点は第1エッジ点および複数の第2エッジ点であってよく、第2エッジ点のうちの少なくとも3つのエッジ点であってもよい。第1エッジ点および複数の第2エッジ点から少なくとも3つの目標エッジ点を選択することは、ランダムで選択することにより、第1エッジ点および複数の第2エッジ点から3つのエッジ点を選択して目標エッジ点としてよい。
【0032】
ステップS13、少なくとも3つの目標エッジ点に基づいて円のフィッティングを行って、フィッティングした円を取得する。
【0033】
少なくとも3つの目標エッジ点に基づいて円のフィッティングを行うことは、複数種のプリセット円のフィッティング方法によりフィッティングを行い、例えば最小二乗法またはRANSACに基づく最小二乗法によりフィッティングを行って、フィッティングした円と、例えば半径および円心座標等の円フィッティングするパラメータとを取得することができる。この円フィッティングするパラメータを、認識対象画像における円形パターンのパラメータとする。
【0034】
第1エッジ点および複数の第2エッジ点から少なくとも3つのエッジ点を選択して目標エッジ点とする際に、ダウンサンプリング方法により、第1エッジ点および複数の第2エッジ点から少なくとも3つのエッジ点を選択して目標エッジ点としてよい。好ましくは、第1エッジ点および複数の第2エッジ点から少なくとも3つの目標エッジ点を選択することは、複数の第2エッジ点に対してダウンサンプリングを行って、少なくとも3つの第3サンプリングエッジ点を取得することを含み、少なくとも3つの目標エッジ点に基づいて円のフィッティングを行って、フィッティングした円を取得することは、少なくとも3つの第3サンプリングエッジ点に基づいて円のフィッティングを行って、フィッティングした円を取得することを含む。ダウンサンプリングされた第3エッジ点の数は第2エッジ点の数より小さいため、ダウンサンプリングの際に、サンプリングされた第3エッジ点ができるだけフィッティングした円に均一に分布するように、第3エッジ点間の距離に基づいてダウンサンプリングを行いよい。このため、ダウンサンプリングにより、計算および保存すべく第2エッジ点の数を減らすことができることで、メモリの消費と後続の計算量とを減らし、フィッティング効率を高めることができる。
【0035】
これから分かるように、本願実施例の方法により、ユーザーが1つの目標参照点を入力するだけで、第1エッジ点および複数の第2エッジ点を自動的に認識できることで、第1エッジ点と第2エッジ点とを認識することにより円のフィッティングを行って、認識対象画像における円のパラメータを取得し、これによりユーザーの操作プロセスが簡単になる。
【0036】
好ましくは、
図2を参照して、フィッティングした円のパラメータはフィッティングした円の位置座標を含み、少なくとも3つの目標エッジ点に基づいて円のフィッティングを行って、フィッティングした円を取得した後、上記方法はさらに以下のステップを含む。
【0037】
ステップS21、フィッティングした円の位置座標に基づいて認識対象領域を生成する。
ステップS22、認識対象領域において円の認識を行って、認識結果を取得し、認識結果は認識された円のパラメータを含む。
【0038】
好ましくは、フィッティングした円の位置座標は、フィッティングした円の円心座標とフィッティングした円の半径とを含み、フィッティングした円の位置座標に基づいて認識対象領域を生成することは、フィッティングした円の半径に基づいて、生成対象であるプリセット形状の認識対象領域の特徴パラメータを計算して取得することであって、プリセット形状は円形または矩形であり、特徴パラメータは円の半径または矩形の長さおよび幅であることと、フィッティングした円の円心座標を、生成対象である認識対象領域の中心として、認識対象領域を生成することと、を含む。フィッティングした円の半径に基づいて、生成対象であるプリセット形状の認識対象領域の特徴パラメータを計算して取得する際に、この生成対象であるプリセット形状の認識対象領域はフィッティングした円全体を含んでよく、例えば、プリセット形状が円形である場合、プリセット形状の認識対象領域に対応する円の半径はフィッティングした円の半径より大きく、例えば、フィッティング円の半径が4である場合、計算して取得したプリセット形状の認識対象領域に対応する円の半径が5であってよい。また例えば、フィッティング円の半径が4である場合、計算して取得したプリセット形状の認識対象領域に対応する矩形の長さおよび幅は両方このフィッティング円の半径の2倍より大きく、例えば、フィッティング円の半径が4である場合、プリセット形状の認識対象領域に対応する矩形の長さおよび幅が9および10であってよい。
【0039】
上記認識対象領域は多種形状の領域であってよく、例えば、認識対象領域は円形、円環形、正方形、長方形等であってよい。認識対象領域を生成する際に、認識対象領域の範囲は認識対象画像における円形パターンの範囲を含むべきである。
【0040】
好ましくは、認識対象領域において円の認識を行って、認識結果を取得することは、認識対象領域とフィッティングした円との面積の大きさを比較することと、認識対象領域とフィッティングした円との面積の割合がプリセット閾値より大きいである場合、目標参照点とプリセット領域の大きさとに基づいて更新された認識対象領域を生成することと、更新された認識対象領域において円の認識を行って、認識結果を取得することとを含む。一例において、認識すべく円の範囲が小さいほど、この第1プリセット範囲が小さくべきであり、認識すべく円の範囲が大きいほど、この第1プリセット範囲が大きくてもよい。例えば、認識対象画像の範囲が大きいが、認識すべく円形パターンの範囲が小さい場合、第1プリセット範囲の設定により目標参照点の周囲の小さい範囲内の点を認識すればよい。これにより、エッジ点を迅速に検出できるほか、作業メモリと計算量とを減らすこともできる。認識すべく円形パターンの範囲が大きい場合、目標参照点の周囲の大きい範囲を認識すべきである。
【0041】
本願実施例において、プリセット認識方法により、認識対象領域において円形パターンの認識を行う際に、上記プリセット認識方法は、例えばRANSAC等の、複数種の画像認識を行う方法であってよい。本願実施例において、
図3を参照して、円形パターンのパラメータに基づいてROIを生成した後、ROIにおいてより高精度な円検出を行いよい。
【0042】
これから分かるように、本願実施例の方法により、フィッティングした円の位置座標に基づいて認識対象領域を生成し、そして認識対象領域において円の認識を行って、認識結果を取得することができる。これにより、認識対象領域において円形パターンの認識を行うことにより、認識結果を取得でき、認識された円形のパラメータの精度を高めることができるだけでなく、認識領域の選択により、認識対象領域において円を検出することができることで、画像全体において検出を行う必要がなく、計算量を減らし、計算効率を高める。
【0043】
好ましくは、
図4を参照して、フィッティングした円の位置座標はフィッティングした円の円心座標とフィッティングした円の半径とを含み、フィッティングした円の位置座標に基づいて認識対象領域を生成することは、以下のステップを含む。
ステップS211、フィッティングした円の円心座標とフィッティングした円の半径とに基づいて、円環形の認識対象領域の内径および外径を計算して取得する。
ステップS212、前記特徴パラメータに基づいて、フィッティングした円の円心座標を中心として、円環形の認識対象領域の内径および外径に基づいて、円環形の認識対象領域を生成する。
【0044】
ステップS22において、認識対象領域において円の認識を行って、認識結果を取得することは、以下のステップを含む。
ステップS221、円環形の認識対象領域において円の認識を行って、認識結果を取得する。
【0045】
好ましくは、フィッティングした円の円心座標とフィッティングした円の半径とに基づいて、円環形の認識対象領域の内径および外径を計算して取得することは、フィッティングした円の半径とプリセット円環状領域の幅との合計を計算し、認識対象領域の外径を取得することと、フィッティングした円の半径とプリセット円環状領域の幅との差分を計算し、認識対象領域の内径を取得することと、を含む。
【0046】
円形パターンの半径とプリセット長さとに基づいて、生成対象である円環形領域の内径および外径を計算して取得することは、円形パターンの半径からプリセット値を減算して生成対象である円環形領域の内径を取得し、円形パターンの半径にこのプリセット値を加算して生成対象である円環形領域の外径を取得することができる。具体的に、このプリセット値は実際状況に応じて設定されてよい。一例において、このプリセット値の大きさが円の半径に対応し、円の半径が大きいほど、このプリセット値が大きくてよく、円の半径が小さいほど、このプリセット値が小さくてよい。そして、フィッティングした円の円心座標を中心として、円環形の認識対象領域の内径および外径に基づいて、円環形の認識対象領域を生成する。本願実施例において、生成された円環形領域は円形パターンの全てのエッジ点を含む。
【0047】
円環形の認識対象領域において円の認識を行って、認識結果を取得することは、上記プリセット認識方法により、円環形の認識対象領域において円形パターンの認識を行って、認識結果を取得してよい。具体的に、上記RANSAC等の画像認識方法により、円環形の認識対象領域において円形パターンの認識を行ってよい。本願実施例において、認識結果は円の半径と円心座標等パラメータとを含んでよい。円環形領域は円形パターンの全てのエッジ点を含み、円環形領域の領域面積が小さく、認識すべく領域が小さいため、認識効率がより高くなる。
【0048】
これから分かるように、本願実施例の方法により、フィッティングした円の円心座標とフィッティングした円の半径とに基づいて、円環形の認識対象領域の内径および外径を計算して取得し、フィッティングした円の円心座標を中心として、円環形の認識対象領域の内径および外径に基づいて、円環形の認識対象領域を生成し、円環形の認識対象領域において円の認識を行って、認識結果を取得することができる。これにより、認識すべく領域を減らし、認識の効率を高めることができる。
【0049】
図5を参照して、
図5は本願実施例が提供する円検出方法の他の実例図であり、当該円検出方法は以下のステップを含む。
1、円周付近の検出点を設置する。本願における検出点は円形パターンの円周附近に位置する。
2、画像に対してエッジ抽出を行う。検出対象である画像が大きいが、検出すべく円直径が小さく、画像領域全体のほんの一部を占める場合、作業メモリと計算量とを減らすように、ユーザーが設置した検出点付近の領域のみを抽出してよい。
3、最も近いエッジ点を探索する。具体的に、検出点からのチェス盤距離が0、1、2…である点を順次に探索し、または、固定の8つの方向(隣接する2つの方向の間隔が45°である)に沿って探索し、円周上の点を取得する。
4、エッジに沿って他のエッジ点を探索する。時計回りと反時計回りとの2方向から探索を行って、見つけたエッジ点を保存する。好ましくは、探索対象である円の半径が大きい場合、これらのエッジ点に対してサンプリングを行って、サンプリングされたエッジ点のみ保留してよく、メモリの消費と後続の計算量とを減らすことができる。
5、エッジ点に対して円フィッティングを行う。保留されたエッジ点に対して円フィッティングを行って、円フィッティングの際に、例えば最小二乗法またはRANSACに基づく最小二乗法等の、複数種の異なる方式を採用してよく、最終的には、この単点により円を検出する結果を取得する。
【0050】
本願実施例の第2態様として、
図6を参照して、
認識対象画像における目標参照点を取得する、参照点取得モジュール601であって、認識対象画像には円形パターンが含まれており、目標参照点が前記円形パターンのエッジのプリセット範囲内に配置されている、参照点取得モジュール601と、
目標参照点を基準としてエッジ抽出を行って、少なくとも3つの目標エッジ点を取得する、エッジ点選択モジュール602と、
少なくとも3つの目標エッジ点に基づいて円のフィッティングを行って、フィッティングした円を取得する、円フィッティングモジュール603と、を含む
円検出装置を提供する。
【0051】
好ましくは、エッジ点選択モジュール602は、
認識対象画像における目標参照点の周囲の第1プリセット範囲内の各画素点に対して画素勾配認識を行って、第1エッジ点を取得する、第1エッジ点検出モジュールであって、第1エッジ点の画素勾配はプリセット勾配閾値より大きい、第1エッジ点検出モジュールと、
第1エッジ点の周囲の第2プリセット範囲内の各画素点に対して画素勾配認識を行って、複数の第2エッジ点を取得する、第2エッジ点検出モジュールと、
第1エッジ点および複数の第2エッジ点から少なくとも3つの目標エッジ点を選択する、目標エッジ点取得モジュールと、を含む。
【0052】
好ましくは、フィッティングした円のパラメータはフィッティングした円の位置座標を含み、上記円検出装置は、
フィッティングした円の位置座標に基づいて認識対象領域を生成する、認識対象領域生成モジュールと、
認識対象領域において円の認識を行って、認識結果を取得する、認識対象領域認識モジュールであって、認識結果は認識された円のパラメータを含む、認識対象領域認識モジュールと、をさらに含む。
【0053】
好ましくは、フィッティングした円の位置座標はフィッティングした円の円心座標とフィッティングした円の半径とを含み、認識対象領域生成モジュールは、
フィッティングした円の半径に基づいて、生成対象であるプリセット形状の認識対象領域の特徴パラメータを計算して取得する、特徴パラメータ計算モジュールであって、プリセット形状は円形または矩形であり、特徴パラメータは円の半径または矩形の長さおよび幅である、特徴パラメータ計算モジュールと、
前記特徴パラメータに基づいて、フィッティングした円の円心座標を、生成対象である認識対象領域の中心として、認識対象領域を生成する、特徴パラメータ生成モジュールと、を含む。
【0054】
好ましくは、フィッティングした円の位置座標はフィッティングした円の円心座標とフィッティングした円の半径とを含み、認識対象領域生成モジュールは、
フィッティングした円の円心座標とフィッティングした円の半径とに基づいて、円環形の認識対象領域の内径および外径を計算して取得する、内外径計算サブモジュールと、
フィッティングした円の円心座標を中心として、円環形の認識対象領域の内径および外径に基づいて、円環形の認識対象領域を生成する、円環形領域生成サブモジュールと、
円環形の認識対象領域において円の認識を行って、認識結果を取得する、認識対象領域認識モジュールと、を含む。
【0055】
好ましくは、内外径計算サブモジュールは、フィッティングした円の半径とプリセット円環状領域の幅との合計を計算し、認識対象領域の外径を取得することと、フィッティングした円の半径とプリセット円環状領域の幅との差分を計算し、認識対象領域の内径を取得することと、に用いられる。
【0056】
好ましくは、第2エッジ点検出モジュールは、第1エッジ点の周囲の第2プリセット範囲内において、第1エッジ点の時計回り方向および反時計回り方向における各画素点に対して画素勾配認識を行って、複数の第2エッジ点を取得することに用いられる。
【0057】
好ましくは、第1エッジ点検出モジュールは、認識対象画像における目標参照点の周囲の第1プリセット範囲内において、複数のプリセット方向における各画素点に対して画素勾配認識を行って、第1エッジ点を取得することに用いられる。
【0058】
好ましくは、第1エッジ点検出モジュールは、
認識対象画像における目標参照点の周囲の第1プリセット範囲内において、プリセット基準方向に基づいてプリセット角度おきに1つの方向を選択し、複数の目標方向を取得する、方向選択サブモジュールと、
プリセット基準方向および複数の目標方向における各画素点に対して画素勾配認識を行って、第1エッジ点を取得する、画素認識サブモジュールと、を含む。
【0059】
好ましくは、目標エッジ点取得モジュールは、複数の第2エッジ点に対してダウンサンプリングを行って、少なくとも3つの第3サンプリングエッジ点を取得ることに用いられ、
円フィッティングモジュールは、少なくとも3つの第3サンプリングエッジ点に基づいて円のフィッティングを行って、フィッティングした円を取得することに用いられる。
【0060】
好ましくは、認識対象領域認識モジュールは、
認識対象領域とフィッティングした円との面積の大きさを比較する、面積比較サブモジュールと、
認識対象領域とフィッティングした円との面積の割合がプリセット閾値より大きいである場合、目標参照点とプリセット領域の大きさとに基づいて更新された認識対象領域を生成する、領域更新サブモジュールと、
更新された認識対象領域において円の認識を行って、認識結果を取得する、更新領域認識サブモジュールと、を含む。
【0061】
好ましくは、エッジ点選択モジュール602は、
ユーザーの認識対象領域情報を受信する、領域情報受信サブモジュールであって、認識対象領域情報はユーザーが入力した認識対象領域の大きさおよび位置を含む、領域情報受信サブモジュールと、
目標参照点を基準として、認識対象領域においてエッジ抽出を行って、少なくとも3つの目標エッジ点を取得する、領域エッジ抽出サブモジュールと、を含む。
【0062】
これから分かるように、本願実施例の円検出装置、ユーザーが1つの円形パターンのエッジ付近の点を入力するたけで、円検出を実現できるため、ユーザーの操作プロセスが簡単になる。
【0063】
図7に示すように、本願実施例は、電子機器をさらに提供する。電子機器は、プロセッサ701と、通信インタフェース702と、メモリ703と通信バス704とを含み、プロセッサ701と通信インタフェース702とメモリ703とが通信バス704を介して互いに通信し、
メモリ703は、コンピュータプログラムを格納することに用いられ、
プロセッサ701は、メモリ703に格納されたプログラムを実行すると、
認識対象画像における目標参照点を取得することであって、認識対象画像には円形パターンが含まれており、目標参照点は円形パターンのエッジからの距離がプリセット距離閾値より小さい点であることと、
目標参照点を基準としてエッジ抽出を行って、少なくとも3つの目標エッジ点を取得することと、
少なくとも3つの目標エッジ点に基づいて円のフィッティングを行って、フィッティングした円を取得することと、を実現することに用いられる。
【0064】
上記電子デバイスに言及した通信バスは外設部件コンポーネント接続標準(Peripheral Component Interconnect、PCI)バスまたは拡張業界標準アーキテクチャ(Extended Industry Standard Architecture、EISA)バス等であってもよい。この通信バスは、アドレスバス、データバス、コントロールバス等に分けられる。図示の都合上、図面には1本の太線のみで表示されるが、1本のバスまたは1種類のバスのみを有することを意味するものではない。
【0065】
通信インタフェースは上記電子デバイスと他のデバイスとの間の通信に用いられる。
【0066】
メモリは、ランダムアクセスメモリ(Random Access Memory、RAM)を含んでもよく、非揮発性メモリ(Non-Volatile Memory、NVM)を含んでもよく、例えば、少なくとも1つの磁気ディスクメモリである。好ましくは、メモリは、さらに、少なくとも1つの前述プロセッサから離れた記憶装置であってもよい。
【0067】
上記したプロセッサは、中央処理装置(Central Processing Unit、CPU)、ネットワークプロセッサ(Network Processor、NP)等を含む汎用なプロセッサであってもよく、デジタルシグナルプロセッサ(Digital Signal Processor、DSP)、特定用途向け集積回路(Application Specific Integrated Circuit、ASIC)、現場で書き換え可能な論理回路の多数配列(Field-Programmable Gate Array、FPGA)または他の書き換え可能な論理デバイス、ディスクリートゲートまたはトランジスタ倫理デバイス、ディスクリートハードウェアアセンブリを含む汎用プロセッサであってもよい。
【0068】
本願に係るさらなる実施例において、コンピュータ可読記憶媒体をさらに提供する。このコンピュータ可読記憶媒体には、コンピュータプログラムが記憶されており、前記コンピュータプログラムはプロセッサによって実行されると、上記いずれかの円検出方法のステップを実現させる。
【0069】
本願に係るさらなる実施例において、コマンドを含むコンピュータプログラム製品をさらに提供する。コンピュータプログラム製品は、コンピュータで実行されると、コンピュータに上記実施例におけるいずれかの円検出方法を実現させる。
【0070】
上記実施例において、全部または一部がソフトウェア、ハードウェア、ファームウェアまたはそれらの任意の組み合わせによって実現できる。ソフトウェアを用いて実現する場合、全部または一部がコンピュータプログラム製品の形で実現できる。前記コンピュータプログラム製品は1つまたは複数のコンピュータコマンドを含む。コンピュータに前記コンピュータプログラムコマンドをロードして実行する場合、全部または一部が本願の実施例に記載に従う流れまたは機能を実現する。前記コンピュータは汎用なコンピュータ、特定用途向けコンピュータ、コンピュータネットワーク、または他の書き換え可能な装置であってもよい。前記コンピュータコマンドはコンピュータ可読記憶媒体に記憶され、または、1つのコンピュータ可読記憶媒体から他のコンピュータ可読記憶媒体へ伝送され得る。例えば、前記コンピュータコマンドは1つのウェブサイト、コンピュータ、サーバーまたはデータセンターから、有線(例えば同軸ケーブル、ファイバー、デジタル加入者線(DSL))または無線(例えば赤外、無線、マイクロ波等)によって他のウェブサイト、コンピュータ、サーバーまたはデータセンターに伝送され得る。前記コンピュータ可読記憶媒体は、コンピュータが読み書き可能な、任意の利用可能な媒体であってもよく、または1つまたは複数の利用可能な媒体が集積したサーバー、データセンター等を含むデータ記憶デバイスであってもよい。前記利用可能な媒体は磁気媒体、(例えば、フロッピーディスク、ハードディスク、テープ)、光媒体(例えば、DVD)、または半導体媒体(例えばソリッドステートドライブSolid State Disk (SSD))等であってもよい。
【0071】
なお、本文において、「第1」と「第2」等の関係用語は1つのエンティティまたは運用を他のエンティティまたは運用を区別するのみに用いられ、これらのエンティティまたは運用の間にこのような実際な関係または順序がいずれかあることを、要求または示唆するものではない。また、用語「含まれる」、「含む」または他のいずれかの変形は非排他的な「含む」を意味する。従って、一連の要素を含む流れ、方法、製品またはデバイスは、それらの要素のみを含むものではなく、さらに明確に挙げていない他の要素も含み、または、さらにこのような流れ、方法、製品またはデバイスに固有する要素も含む。これ以上の制限が存在しない場合、「1つの…を含む」という記述によって限定した要素は、記載した要素を含む流れ、方法、製品、またはデバイスに、他の同じの要素が存在することを排除しない。
【0072】
本明細書中の各実施例は、関連するように説明されており、各実施例の間に同一または類似する部分については相互参照すればよく、各実施例において重点的に説明したのは、他の実施例と異なる箇所である。特に、装置と、電子機器と、記憶媒体と、コンピュータプログラム製品との実施例に対して、基本的に方法の実施例に類似しているため、簡単に説明した。関連するところは方法の実施例の部分の説明を参照すればよい。
【0073】
以上の記載は本願の好ましい実施例に過ぎず、本願の保護範囲を限定することを意図するものではない。本出願の旨と原則の範囲内で行われた変更、同等の交換、改良などは、本願の保護範囲に含まれる。
【国際調査報告】