特許第6784704号(P6784704)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アリババ・グループ・ホールディング・リミテッドの特許一覧

<>
  • 特許6784704-画像処理方法及び装置 図000002
  • 特許6784704-画像処理方法及び装置 図000003
  • 特許6784704-画像処理方法及び装置 図000004
  • 特許6784704-画像処理方法及び装置 図000005
  • 特許6784704-画像処理方法及び装置 図000006
  • 特許6784704-画像処理方法及び装置 図000007
  • 特許6784704-画像処理方法及び装置 図000008
  • 特許6784704-画像処理方法及び装置 図000009
  • 特許6784704-画像処理方法及び装置 図000010
  • 特許6784704-画像処理方法及び装置 図000011
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6784704
(24)【登録日】2020年10月27日
(45)【発行日】2020年11月11日
(54)【発明の名称】画像処理方法及び装置
(51)【国際特許分類】
   G06T 7/13 20170101AFI20201102BHJP
   G06T 7/00 20170101ALI20201102BHJP
   G06T 3/40 20060101ALI20201102BHJP
【FI】
   G06T7/13
   G06T7/00 350Z
   G06T3/40 700
【請求項の数】14
【全頁数】30
(21)【出願番号】特願2017-562016(P2017-562016)
(86)(22)【出願日】2016年4月28日
(65)【公表番号】特表2018-520428(P2018-520428A)
(43)【公表日】2018年7月26日
(86)【国際出願番号】CN2016080445
(87)【国際公開番号】WO2016192494
(87)【国際公開日】20161208
【審査請求日】2019年5月7日
(31)【優先権主張番号】201510291061.2
(32)【優先日】2015年5月29日
(33)【優先権主張国】CN
【早期審査対象出願】
【前置審査】
(73)【特許権者】
【識別番号】510330264
【氏名又は名称】アリババ・グループ・ホールディング・リミテッド
【氏名又は名称原語表記】ALIBABA GROUP HOLDING LIMITED
(74)【代理人】
【識別番号】100188558
【弁理士】
【氏名又は名称】飯田 雅人
(74)【代理人】
【識別番号】100205785
【弁理士】
【氏名又は名称】▲高▼橋 史生
(72)【発明者】
【氏名】ディン,ウェイ
【審査官】 粕谷 満成
(56)【参考文献】
【文献】 特開2014−195148(JP,A)
【文献】 特開2000−113203(JP,A)
【文献】 特開2007−189665(JP,A)
【文献】 特開2011−166728(JP,A)
【文献】 特開2011−217130(JP,A)
【文献】 特開2012−231367(JP,A)
【文献】 特表2011−517888(JP,A)
【文献】 米国特許出願公開第2012/0057802(US,A1)
【文献】 米国特許出願公開第2006/0034500(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/13
G06T 7/00
G06T 3/40
(57)【特許請求の範囲】
【請求項1】
コンピュータにより実行される画像処理方法であって
前記コンピュータの原画像取得部によって、対象画像を含む原画像を取得するステップと
前記コンピュータの低画素画像取得部によって、予め設定された圧縮率に従って前記原画像に画像圧縮処理を実行し、前記画像圧縮処理に基づいて低画素画像を生成するステップと
前記コンピュータの境界線判定部によって、前記低画素画像内の前記対象画像の境界線を判定するステップと
前記コンピュータの対象画像取得部によって、前記低画素画像内の前記判定した境界線を前記原画像内にマッピングし、前記原画像から対象画像を生成するステップと
備え、
前記原画像に画像圧縮処理を実行する前記ステップは
記予め設定された圧縮率に従った圧縮後の各画素点の位置を判定するステップと
記原画像内の全ての原画素点のうち、前記予め設定された圧縮率に従った圧縮後の各画素点に対応する4つの原画素点を判定するステップと
縮後の各画素点に対応する前記4つの原画素点のうち、第1の方向への2対の原画素点と、第2の方向への2対の原画素点とを判定するステップであって、前記第1の方向は横方向で、前記第2の方向は縦方向である、或いは、前記第1の方向は縦方向で、前記第2の方向は横方向である、ステップと
記第1の方向への、圧縮後の各画素点の前記2対の原画素点にそれぞれ対応する第1補間を取得し、前記取得した2つの第1補間を初期補間とするステップ、又は、前記第2の方向への、圧縮後の各画素点の前記2対の原画素点にそれぞれ対応する第2補間を取得し、前記取得した2つの第2補間を初期補間とするステップと
縮後の各画素点に対応する前記初期補間に従って、圧縮後の各画素点に対応する補間を算出し、前記算出した、圧縮後の各画素点に対応する補間に従って、圧縮後の各画素点の画素値を判定するステップと
縮後の各画素点の前記画素値及び前記位置に従って前記低画素画像を生成するステップと
を備える、画像処理方法。
【請求項2】
前記低画素画像内の前記対象画像の境界線を判定する前記ステップは
前記低画素画像から検出対象領域を判定するステップと
前記対象画像の前記境界線を判定するために、前記検出対象領域内の2つ毎の隣接した画素点間の勾配値に従って、前記検出対象領域に境界線検出処理を実行するステップと
を備える、求項1に記載の画像処理方法。
【請求項3】
前記低画素画像から検出対象領域を判定する前記ステップは
前記低画素画像をバイナリ画像へ変換するために、前記低画素画像をバイナリ化するステップであって、前記バイナリ画像は2色のみを含む、バイナリ化するステップと
前記バイナリ画像内の少なくとも1本のエッジラインを取得するために、前記バイナリ画像にエッジ検出処理を実行するステップと
各エッジラインを別個に拡大するステップと
連結領域を取得するために、各々の拡大されたエッジラインを連結するステップと
特定領域を取得するために、前記連結領域を、各連結領域の位置情報のそれぞれに従ってスクリーニングするステップであって、前記特定領域とは前記対象画像内の特定のグラフィック部分を含む領域である、テップと
前記低画素画像内の前記特定領域以外の領域を前記検出対象領域として判定するステップと
備える、求項2に記載の画像処理方法。
【請求項4】
前記バイナリ画像にエッジ検出処理を実行する前記ステップの前に、め設定されたガウス・スムージングパラメータを用いて、前記バイナリ画像にガウス・スムージングを実行するステップを更に備える、求項3に記載の画像処理方法。
【請求項5】
前記対象画像の前記境界線を判定するために、前記検出対象領域内の2つ毎の隣接した画素点間の勾配値に従って、前記検出対象領域に境界線検出処理を実行する前記ステップが、
前記低画素画像を2色のみを含むバイナリ画像へ変換するために、前記低画素画像をバイナリ化するステップと、
以下の演算を任意方向に実行するステップであって、前記以下の演算は、前記任意方向において前記バイナリ画像の前記検出対象領域内の2つ毎の隣接した画素点間の勾配値を、前記任意方向に対応する予め設定された初期勾配閾値と別個に比較すること、及び、比較結果に従って前記任意方向への初期境界線を取得することである、テップと
各方向にて取得した初期境界線の数に従って、前記対象画像の前記境界線をそれぞれ判定するステップと
を備える、求項2に記載の画像処理方法。
【請求項6】
各方向にて取得した初期境界線の数に従って、前記対象画像の前記境界線をそれぞれ判定する前記ステップはが、任意方向への検出結果を得るために、次の演算を実行するステップを備え
前記演算は
前記任意方向にて取得した初期境界線の数が少なくとも2本である場合に、前記任意方向への各初期境界線の位置情報に従って、前記任意方向への各初期境界線に直線検出を別個に実行し、及び、前記任意方向への少なくとも2本の前記初期境界線から前記任意方向への境界線を取得する演算か、または
前記任意方向にて取得した初期境界線の数が2本未満である場合に、前記任意方向に対応する前記予め設定された初期勾配閾値を、予め設定された第1の勾配差に従って連続的に低減し、及び、前記低減した初期勾配閾値を用いて、前記任意方向にて取得した初期境界線の数が少なくとも2本になるまで、前記任意方向にて前記バイナリ画像の前記検出対象領域を検出する演算
ある、請求項5に記載の画像処理方法。
【請求項7】
前記原画像内の前記対象画像を取得するために、前記低画素画像内の境界線を前記原画像内にマッピングする前記ステップが、
前記低画素画像内の2つ毎の隣接した境界線の交差点を取得するステップと
対応するマッピング点を前記原画像内に生成するために、前記取得した交差点を、前記予め設定された圧縮率に従って前記原画像内に別個にマッピングするステップと
前記原画像内にマッピングされた前記マッピング点を連続的に連結し、及び、前記連結後に生成された四角形を、前記原画像内の前記対象画像として判定するステップと
を備える、求項2に記載の画像処理方法。
【請求項8】
前記原画像内の前記対象画像を取得後に、影変換アルゴリズムを用いて前記対象画像を修正するステップを更に備える、求項2に記載の画像処理方法。
【請求項9】
コンピュータシステムによって実行可能な1つ以上のコンピュータプログラム命令を格納する、コンピュータ読取り可能記憶媒体であって、前記コンピュータシステムに前記コンピュータプログラム命令をロードすることにより、前記コンピュータプログラム命令は、前記コンピュータシステムに、
対象画像を含む原画像を取得することと
予め設定された圧縮率に従って前記原画像に画像圧縮処理を実行し、前記画像圧縮処理に基づいて低画素画像を生成することと
前記低画素画像内の前記対象画像の境界線を判定することと
前記低画素画像内の前記判定した境界線を前記原画像内にマッピングし、前記原画像から対象画像を生成することと
を備える動作を行わせ
前記原画像に画像圧縮処理を実行することが、
前記予め設定された圧縮率に従った圧縮後の各画素点の位置を判定することと
前記原画像内の全ての原画素点のうち、前記予め設定された圧縮率に従った圧縮後の各画素点に対応する4つの原画素点を判定することと
圧縮後の各画素点に対応する前記4つの原画素点のうち、第1の方向への2対の原画素点と、第2の方向への2対の原画素点とを判定することであって、前記第1の方向は横方向で、前記第2の方向は縦方向である、或いは、前記第1の方向は縦方向で、前記第2の方向は横方向である、判定することと
前記第1の方向への、圧縮後の各画素点の前記2対の原画素点にそれぞれ対応する第1補間を取得し、前記取得した2つの第1補間を初期補間とすること、又は、前記第2の方向への、圧縮後の各画素点の前記2対の原画素点にそれぞれ対応する第2補間を取得し、前記取得した2つの第2補間を初期補間とすることと
圧縮後の各画素点に対応する前記初期補間に従って、圧縮後の各画素点に対応する補間を算出し、前記算出した、圧縮後の各画素点に対応する補間に従って、圧縮後の各画素点の画素値を判定することと
圧縮後の各画素点の前記画素値及び前記位置に従って前記低画素画像を生成することと
備える、ンピュータ読取り可能記憶媒体。
【請求項10】
前記低画素画像内の前記対象画像の境界線を判定することが、
前記低画素画像から検出対象領域を判定することと
前記対象画像の前記境界線を判定するために、前記検出対象領域内の2つ毎の隣接した画素点間の勾配値に従って、前記検出対象領域に境界線検出処理を実行することと
備える、求項9に記載のコンピュータ読取り可能記憶媒体。
【請求項11】
前記低画素画像から検出対象領域を判定することが、
前記低画素画像をバイナリ画像へ変換するために、前記低画素画像をバイナリ化することであって、前記バイナリ画像は2色のみを含む、バイナリ化することと
前記バイナリ画像内の少なくとも1本のエッジラインを取得するために、前記バイナリ画像にエッジ検出処理を実行することと
各エッジラインを別個に拡大することと
連結領域を取得するために、各々の拡大されたエッジラインを連結することと
特定領域を取得するために、前記連結領域を、各連結領域の位置情報のそれぞれに従ってスクリーニングすることであって、前記特定領域とは前記対象画像内の特定のグラフィック部分を含む領域である、スクリーニングすることと
前記低画素画像内の前記特定領域以外の領域を前記検出対象領域として判定することと
を備える、求項10に記載のコンピュータ読取り可能記憶媒体。
【請求項12】
コンピュータ実装システムであって
1つ以上のコンピュータと
前記1つ以上のコンピュータと相互利用可能に結合された、1つ以上のコンピュータメモリデバイスであって、1つ以上の命令を格納する有形の非一時的なマシン読取り可能媒体を有するメモリデバイスと
備え、
前記命令は、前記1つ以上のコンピュータにより実行された場合、1つ以上の演算を実行し、前記演算は
対象画像を含む原画像を取得することと
予め設定された圧縮率に従って前記原画像に画像圧縮処理を実行し、前記画像圧縮処理に基づいて低画素画像を生成することと
前記低画素画像内の前記対象画像の境界線を判定することと
前記低画素画像内の前記判定した境界線を前記原画像内にマッピングし、前記原画像から対象画像を生成することと
備え、
前記原画像に画像圧縮処理を実行することが、
前記予め設定された圧縮率に従った圧縮後の各画素点の位置を判定することと
前記原画像内の全ての原画素点のうち、前記予め設定された圧縮率に従った圧縮後の各画素点に対応する4つの原画素点を判定することと
圧縮後の各画素点に対応する前記4つの原画素点のうち、第1の方向への2対の原画素点と、第2の方向への2対の原画素点とを判定することであって、前記第1の方向は横方向で、前記第2の方向は縦方向である、或いは、前記第1の方向は縦方向で、前記第2の方向は横方向である、判定することと
前記第1の方向への、圧縮後の各画素点の前記2対の原画素点にそれぞれ対応する第1補間を取得し、前記取得した2つの第1補間を初期補間とすること、又は、前記第2の方向への、圧縮後の各画素点の前記2対の原画素点にそれぞれ対応する第2補間を取得し、前記取得した2つの第2補間を初期補間とすることと
圧縮後の各画素点に対応する前記初期補間に従って、圧縮後の各画素点に対応する補間を算出し、前記算出した、圧縮後の各画素点に対応する補間に従って、圧縮後の各画素点の画素値を判定することと
圧縮後の各画素点の前記画素値及び前記位置に従って前記低画素画像を生成することと
備える、ンピュータ実装システム。
【請求項13】
前記低画素画像内の前記対象画像の境界線を判定することが、
前記低画素画像から検出対象領域を判定することと
前記対象画像の前記境界線を判定するために、前記検出対象領域内の2つ毎の隣接した画素点間の勾配値に従って、前記検出対象領域に境界線検出処理を実行することと
備える、求項12に記載のコンピュータ実装システム。
【請求項14】
前記低画素画像から検出対象領域を判定することが、
前記低画素画像をバイナリ画像へ変換するために、前記低画素画像をバイナリ化することであって、前記バイナリ画像は2色のみを含む、バイナリ化することと
前記バイナリ画像内の少なくとも1本のエッジラインを取得するために、前記バイナリ画像にエッジ検出処理を実行することと
各エッジラインを別個に拡大することと
連結領域を取得するために、各々の拡大されたエッジラインを連結することと
特定領域を取得するために、前記連結領域を、各連結領域の位置情報のそれぞれに従ってスクリーニングすることであって、前記特定領域とは前記対象画像内の特定のグラフィック部分を含む領域である、スクリーニングすることと
前記低画素画像内の前記特定領域以外の領域を前記検出対象領域として判定することと
備える、求項13に記載のコンピュータ実装システム。
【発明の詳細な説明】
【技術分野】
【0001】
本願は、画像処理の分野に関し、特に、画像処理方法及び装置に関する。
【背景技術】
【0002】
科学技術の急速な発展にともない、ビデオ技術は、特定のシーンの監視、対象者の検索など、様々な分野で幅広く利用されている。
【0003】
カメラで集めた原画像を処理するときに、多くの場合、この原画像から対象物体又は対象人物を識別する(即ち、対象画像を判定する)ことが必要となる。これまで、原画像から対象画像を判定するには(図1を参照)、原画像中の画素を1つずつ走査して、原画像から対象画像の境界線を判定するのが普通であった。この技術解決策を用いた場合、原画像が高解像画像であると、原画像には多数の画素点が含まれるので、原画像から対象画像を判定するために数秒間又はそれ以上に長い時間をかける必要がある。対象画像の取得に要する時間が長いため、効率が低下する。
【0004】
以上のように、現在、原画像から対象画像を取得するために長い時間がかかるという問題がある。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本願の実施の形態は、原画像から対象画像を取得するために長い時間がかかるという既存の問題を解決するための画像処理方法及び装置を提供する。
【課題を解決するための手段】
【0006】
本願の実施の形態が提供する特定の技術的解決策は、以下のとおりである。
【0007】
画像取得方法は:
原画像を取得するステップであって、前記原画像は対象画像を含む、取得するステップと;画像圧縮処理後に低画素画像を取得するために、予め設定された圧縮率に従って前記原画像に画像圧縮処理を実行するステップと;前記低画素画像内の前記対象画像の境界線を判定するステップと;前記原画像内に含まれる前記対象画像を取得するために、前記判定した前記低画素画像内に含まれる境界線を前記原画像内にマッピングするステップと;を備える。
【0008】
任意に、前記画像圧縮処理後に低画素画像を取得するために、予め設定された圧縮率に従って前記原画像に前記画像圧縮処理を実行する前記ステップは、具体的に:前記予め設定された圧縮率に従って圧縮後の各画素点の位置を判定するステップと;圧縮後の各画素点の画素値を取得するために、高速バイリニア補間アルゴリズムを用いて前記原画像に画像圧縮処理を実行するステップと;圧縮後の各画素点の前記画素値及び前記位置に従って前記低画素画像を生成するステップと;を備える。
【0009】
任意に、圧縮後の各画素点の画素値を取得するために、高速バイリニア補間アルゴリズムを用いて前記原画像に前記画像圧縮処理を実行する前記ステップは、具体的に:前記原画像内に含まれる全ての原画素点のうち、前記予め設定された圧縮率に従って圧縮後の各画素点に対応する4つの原画素点を判定するステップと;圧縮後の各画素点に対応する前記4つの原画素点のうち、第1の方向への2対の原画素点と、第2の方向への2対の原画素点とを判定するステップであって、前記第1の方向は横方向で、前記第2の方向は縦方向である、或いは、前記第1の方向は縦方向で、前記第2の方向は横方向である、判定するステップと;前記第1の方向への圧縮後の各画素点の前記2対の原画素点にそれぞれ対応する第1補間を取得し、前記取得した2つの第1補間を初期補間とするステップ、又は、前記第2の方向への圧縮後の各画素点の前記2対の原画素点にそれぞれ対応する第2補間を取得し、前記取得した2つの第2補間を初期補間とするステップと;圧縮後の各画素に対応する前記初期補間に従って、圧縮後の各画素点に対応する補間を算出し、前記算出した圧縮後の各画素点に対応する補間に従って、圧縮後の各画素点の前記画素値を判定するステップと;を備える。
【0010】
任意に、前記低画素画像内の前記対象画像の境界線を判定する前記ステップは、具体的に:前記低画素画像から検出対象領域を判定するステップと;前記対象画像の前記境界線を判定するために、前記検出対象領域内の2つ毎の隣接した画素点間の勾配値に従って、前記検出対象領域に境界線検出処理を実行するステップと;を備える。
【0011】
任意に、前記低画素から前記検出対象領域を判定する前記ステップは、具体的に:前記低画素画像をバイナリ画像へ変換するために、前記低画素画像をバイナリ化するステップであって、前記バイナリ画像は2色のみを含む、バイナリ化するステップと;前記バイナリ画像内に含まれる少なくとも1本のエッジラインを取得するために、前記バイナリ画像にエッジ検出処理を実行するステップと;各エッジラインを別個に拡大するステップと;連結領域を取得するために、各々の拡大されたエッジラインを連結するステップと;特定領域を取得するために、前記連結領域を、各連結領域の位置情報のそれぞれに従ってスクリーニングするステップであって、前記特定領域とは前記対象画像内の特定のグラフィック部分を含む領域である、スクリーニングするステップと;前記低画素画像内の前記特定領域以外の領域を検出対象領域として判定するステップと;を備える。
【0012】
更に、前記バイナリ画像に前記エッジ検出処理を実行する前記ステップの前に、本方法は;予め設定されたガウス・スムージング(平滑化)パラメータを用いて、前記バイナリ画像にガウス・スムージングを実行するステップを更に備える。
【0013】
任意に、前記対象画像の前記境界線を判定するために、前記検出対象領域内の2つ毎の隣接した画素点間の勾配値に従って、前記検出対象領域に前記境界線検出処理を実行するステップは、具体的に:前記低画素画像を2色のみを備えたバイナリ画像へ変換するために、前記低画素画像をバイナリ化するステップと;以下の演算を任意方向に実行するステップであって、前記以下の演算は、前記任意方向において前記バイナリ画像の前記検出対象領域内の2つ毎の隣接した画素点間の勾配値を、前記任意方向に対応する予め設定された初期勾配閾値と別個に比較すること、及び、前記比較結果に従って前記任意方向への初期境界線を取得することである、実行するステップと;各方向にて取得した初期境界線の数に従って前記対象画像の前記境界線をそれぞれ判定するステップと;を備える。
【0014】
任意に、各方向にて取得した前記初期境界線の数に従って、前記対象画像の前記境界線をそれぞれ判定する前記ステップは、具体的に:任意方向への検出結果を得るために、次の演算を実行するステップを備え;
前記演算は:前記任意方向への前記少なくとも2本の初期境界線から前記任意方向への境界線を取得するために、前記任意方向にて取得した初期境界線の数が少なくとも2本である場合に、前記任意方向への各初期境界線の位置情報に従って、前記任意方向への各初期境界線に直線検出を別個に実行する演算;又は、前記任意方向にて取得した前記初期境界線の数が2本未満である場合に、前記任意方向に対応する前記予め設定された初期勾配閾値を、予め設定された第1の勾配差に従って連続的に低減し、又、前記低減した初期勾配閾値を用いて、前記任意方向にて取得した前記初期境界線の数が少なくとも2本になるまで、前記任意方向にて前記バイナリ領域の前記検出対象領域を検出する演算;である。
【0015】
任意に、前記原画像内に含まれる前記対象画像を取得するために、前記低画素画像内に含まれる前記境界線を前記原画像内にマッピングする前記ステップは、具体的に:前記低画素画像内の2つ毎の隣接した境界線の交差点を取得するステップと;前記取得した交差点を、前記予め設定された圧縮率に従って前記原画像内に別個にマッピングして、対応するマッピング点を前記原画像内に生成するステップと;前記原画像内にマッピングされた前記マッピング点を連続的に連結し、前記連結後に生成された四角形を、前記原画像内に含まれる対象画像として判定するステップと;を備える。
【0016】
更に、前記原画像内に含まれる前記対象画像を取得する前記ステップの後に、本方法は;射影変換アルゴリズムを用いて前記対象画像を修正するステップを更に備える。
【0017】
画像取得装置は:対象画像を含む原画像を取得するように構成された原画像取得部と;予め設定された圧縮率に従って前記原画像に画像圧縮処理を実行し、前記画像圧縮処理後に低画素画像を取得するように構成された低画素画像取得部と;前記低画素画像内の前記対象画像の境界線を判定するように構成された境界線判定部と;前記低画素画像内の前記判定された境界線を前記原画像内にマッピングして、前記原画像内に含まれる前記対象画像を取得するように構成された対象画像取得部と;を備える。
【0018】
任意に、前記低画素画像取得部は、具体的に:前記予め設定された圧縮率に従って、圧縮後の各画素点の位置を判定し;高速バイリニア補間アルゴリズムを用いて前記原画像に画像圧縮処理を実行して、圧縮後の各画素点の画素値を取得し;圧縮後の各画素点の前記画素値及び前記位置に従って、前記低画素画像を生成する;ように構成される。
【0019】
任意に、前記低画素画像取得部により、高速バイリニア補間アルゴリズムを用いて前記原画像に画像圧縮処理を実行して、圧縮後の各画素点の画素値を取得することは、具体的に:
前記予め設定された圧縮率に従って、前記原画像内に含まれる全ての原画素点から、圧縮後の各画素点に対応する4つの原画素点を判定することと;
圧縮後の各画素点に対応する前記4つの原画素点から、第1の方向への2対の原画素点と、第2の方向への2対の原画素点とを判定することであって、前記第1の方向は横方向、前記第2の方向は縦方向であり、又は、前記第1の方向は縦方向、前記第2の方向は横方向である、判定することと;
前記第1の方向への圧縮後の各画素点の前記2対の原画素点にそれぞれ対応する第1補間を取得し、前記取得した2つの第1補間を初期補間とすること;又は、前記第2の方向への圧縮後に各画素点の前記2対の原画素点にそれぞれ対応する第2補間を取得し、前記取得した2つの第2補間を初期補間とすることと;
圧縮後の各画素点に対応する前記初期補間に従って、圧縮後の各画素点に対応する補間を算出し、又、前記算出した圧縮後の各画素点に対応する補間に従って圧縮後の各画素点の前記画素値を判定することと;を備える。
【0020】
任意に、前記境界線判定部は:前記低画素画像から検出対象領域を判定し;前記対象画像の前記境界線を判定するために、前記検出対象領域内の2つ毎の隣接した画素点間の勾配値に従って、前記検出対象領域に境界線検出処理を実行する;ように構成される。
【0021】
任意に、前記境界線判定部によって、前記低画素画像から検出対象領域を判定することは、具体的に:前記低画素画像を2色のみを備えたバイナリ画像へ変換するために前記低画素画像をバイナリ化することと;前記バイナリ画像内に含まれる少なくとも1本のエッジラインを取得するために、前記バイナリ画像にエッジ検出処理を実行することと;各エッジラインを別個に拡大することと;連結領域を取得するために、各々の拡大されたエッジラインを連結することと;特定領域を取得するために、前記連結領域を、各々の連結領域の位置情報にそれぞれ従ってスクリーニングすることであって、前記特定領域は、前記対象画像内の特定のグラフィック部分を含む領域である、スクリーニングすることと;前記低画素画像内の前記特定領域以外の領域を前記検出対象領域として判定することと;を備える。
【0022】
更に、本装置は:前記バイナリ画像に前記エッジ検出処理を実行する前に、予め設定されたガウス・スムージングパラメータを用いて前記バイナリ画像にガウス・スムージングを実行するように構成されたガウス・スムージング部を更に備える。
【0023】
任意に、前記対象画像の前記境界線を判定するために、前記境界線判定部により、検出対象領域内の2つ毎の隣接した画素点間の勾配値に従って、前記検出対象領域に境界線検出を実行することは、具体的に:前記低画素画像を2色のみを含むバイナリ画像へ変換するために、前記低画素画像をバイナリ化することと;以下の演算を任意方向に実行することであって、前記以下の演算は、前記任意方向において前記バイナリ画像の前記検出対象領域内の2つ毎の隣接した画素点間の勾配値を、前記任意方向に対応する予め設定された初期勾配閾値と別個に比較すること、及び、前記比較結果に従って前記任意方向にて初期境界線を取得すること、である演算を任意方向に実行することと;各方向にて取得した前記初期境界線の数に従って、前記対象画像の前記境界線をそれぞれ判定することと;を備える。
【0024】
任意に、前記境界線判定部により、各方向にて取得した前記初期境界線の数に従って、前記対象画像の前記境界線をそれぞれ判定することは、具体的に:任意方向への検出結果を得るために、次の演算を実行することを備え;
前記演算は:前記任意方向への前記少なくとも2本の初期境界線から前記任意方向への境界線を取得するために、前記任意方向にて取得した初期境界線の数が少なくとも2本である場合に、前記任意方向への各初期境界線の位置情報に従って、前記任意方向への各初期境界線に直線検出を別個に実行する演算;又は、前記任意方向にて取得した前記初期境界線の数が2本未満である場合に、前記任意方向に対応する前記予め設定された初期勾配閾値を、予め設定された第1の勾配差に従って連続的に低減し、又、前記低減した初期勾配閾値を用いて、前記任意方向にて取得した前記初期境界線の数が少なくとも2本になるまで、前記任意方向にて前記バイナリ領域の前記検出対象領域を検出する演算;である。
【0025】
任意に、前記対象画像取得部は、具体的に:前記低画素画像内に含まれる2つ毎の隣接した境界線の交差点を取得し;前記取得した交差点を、前記予め設定された圧縮率に従って、前記原画像内に別個にマッピングし;前記原画像内にマッピングされた前記点を連続的に連結し、前記連結後に生成された四角形を前記原画像内に含まれる対象画像として判定する;ように構成される。
【0026】
更に、本装置は:前記原画像内に含まれる前記対象画像の取得後に、射影変換アルゴリズムを用いて前記対象画像を修正するように構成された修正部を更に備える。
【0027】
本願の実施の形態では、原画像を、予め設定された圧縮率に従って低画素画像へ変換し、この低画素画像に境界線検出を実行して、低画素画像に含まれる対象画像の境界線を判定し、次に、低画素画像に含まれる境界線を原画像内にマッピングして、原画像に含まれる対象画像を取得する。本願の技術的解決策により、原画像を低画素画像へ変換する。低画素画像は画素点数が少なく、この低画素画像に基づいて対象画像は取得されるため、低画素画像に基づく対象画像取得工程により、対象画像の取得時間が短縮され、対象画像の取得効率は向上する。
【図面の簡単な説明】
【0028】
図1】従来技術における原画像の略図である。
図2】本願の実施の形態における画像処理システムのアーキテクチャ図である。
図3】本願の実施の形態における画像処理のフローチャートである。
図4】本願の実施の形態における低画素画像を生成するためのフローチャートである。
図5a】本願の実施の形態における直交座標系の概略図である。
図5b】本願の実施の形態における補間計算の概略図である。
図6】本願の実施の形態において取得された連結領域の概略図である。
図7】本願の実施の形態における対象画像の境界線を判定するためのフローチャートである。
図8】本願の実施の形態における対象画像の境界線を判定するための概略図である。
図9】本願の実施の形態における画像処理装置の構造概略図である。
【発明を実施するための形態】
【0029】
原画像から対象画像を取得するために長い時間がかかるという既存の問題を解決するために、本願の実施の形態では、原画像を、予め設定された圧縮率に従って低画素画像へ変換し、この低画素画像に境界線検出を実行して、低画素画像に含まれる対象画像の境界線を判定し、次に、低画素画像に含まれる境界線を原画像内にマッピングして、原画像に含まれる対象画像を取得する。本願の技術的解決策により、原画像を低画素画像へ変換する。低画素画像は画素点数が少なく、この低画素画像に基づいて対象画像は取得されるため、低画素画像に基づく対象画像取得工程により、対象画像の取得時間が短縮され、対象画像の取得効率は向上する。
【0030】
図2に示すのは、本願の実施の形態における画像処理システムのアーキテクチャ図である。画像処理システムは、原画像から対象画像を判定するべく、取得した原画像を処理するように構成された画像処理デバイスを含む。この画像処理デバイスは、対象画像をユーザに提示するために、ユーザ対話インターフェースを有していてもよい。加えて、画像処理システムは、処理されることになる原画像を画像処理デバイスへ提供するように構成された複数のカメラデバイスを更に含んでよい。任意であるが、画像処理システムは、カメラデバイスにより提供された原画像を集め、この集めた原画像を画像処理デバイスへ送信するように構成された画像収集デバイスを含んでもよい。画像処理デバイスは、カメラ機能を備えた様々なモバイル端末であってもよい。本願の実施の形態では、画像取得工程を詳細に説明するために、カメラ機能を有する様々なモバイル端末を、画像処理デバイスの一例として挙げている。
【0031】
以下、本願の好ましい実施の形態を、添付図面を参照しながら詳細に例証する。
【0032】
図3を参照すると、本願の実施の形態において、原画像を処理して原画像に含まれる対象画像を取得する工程は以下を含む。
ステップ300:原画像が取得される。前記原画像は対象画像を含む。
ステップ310:画像圧縮処理後に低画素画像を取得するために、予め設定された圧縮率に従って前記原画像に画像圧縮処理が実行される。
ステップ320:前記対象画像の境界線が前記低画素画像から判定される。
ステップ330:前記原画像内に含まれる前記対象画像を取得するために、前記低画素画像内に含まれる境界線が前記原画像内にマッピングされる。
【0033】
ステップ300で、各カメラデバイスが撮影した原画像を画像処理デバイスが直接取得できるようにするために、画像収集デバイスは、各カメラデバイスから取得した原画像を画像処理デバイスへ別個に送信する。
【0034】
ステップ310で、画像処理デバイスは、予め設定された圧縮率に従って低画素画像内の各画素点の位置を判定し、低画素画像内の各画素点の画素値を取得するために、高速バイリニア補間アルゴリズムを用いて原画像に画像圧縮処理を行い、更に、圧縮後の各画素点の画素値と位置とに従って低画素画像を生成する。ここで、予め設定された圧縮率とは、特定のアプリケーションシナリオに従って予め構成される値であり、予め設定された圧縮率は予め設定された横方向圧縮率と縦方向圧縮率を含み、横方向圧縮率は縦方向圧縮率と同等であっても同等でなくてもよい。
【0035】
図4を参照すると、画像処理デバイスにより低画素画像を生成する工程において、画像処理デバイスにより低画素画像内の各画素点の画素値を取得する工程は具体的に次を含む。
【0036】
ステップa1:画像処理デバイスは、予め設定された圧縮率に従って、前記原画像内に含まれる全ての原画素点から、圧縮後の各画素点に対応する4つの原画素点を判定する。
【0037】
本願のこの実施の形態では、任意ではあるが、図5aを参照すると、画像処理デバイスは原画像中に直交座標系を確立し、ここで、横方向を横軸とし、この横軸に対して垂直な縦方向を縦軸とし、原画像の左上隅を原点とする。直交座標系に基づき、第1の方向は横軸の正方向、第2の方向は縦軸の正方向である、或いは、第1の方向は縦軸の正方向、第2の方向は横軸の正方向である。
【0038】
更に、画像処理デバイスは、原画像に含まれる全ての原画素点の中から、圧縮後の各画素点に対応する4つの原画素点を、原画像の解像度と予め設定された圧縮率とに従って判定する。ここで、1つの圧縮された画素点に対応する原画素点の数は1と同値若しくはこれより大きく、又は、4より小さい若しくは4と同値であり、又、この数は予め設定された圧縮率に従って判定される。例えば、予め設定された圧縮率が5:2である(つまり、5×5の画素点を2×2の画素点に圧縮する)場合には、圧縮後の第1の画素点に対応する原画素点は、第2行の第2の画素点、第2行の第3の画素点であり、並びに、第3行の第2の画素点、第3行の第3の画素点である。このケースでは、1つの圧縮された画素点に対応する原画素点の数は4つである。別の実施例では、予め設定された横方向圧縮率と縦方向圧縮率が両方とも3:1である(つまり、3×3の画素点を1つの画素点に圧縮する)場合には、圧縮後の第1の画素点に対応する原画素点は、第3行の第3の画素点である(3÷1=3)。このケースでは、1つの圧縮された画素点に対応する原画素点の数は1つである。
【0039】
任意であるが、計算を容易にするために、圧縮された画素点に対応する原画素点の数が4つ未満である場合、通常は、原画素点の数を4つまで拡大する。つまり、原画素点の付近にある原画素点は、予め設定された圧縮率に従って圧縮された画素点に対応する原画素点として判定される。判定されたそれぞれの原画素点について対応する重み値が構成され、4つの原画素点とその重み値に基づいて、1つの圧縮された画素点の画素値が判定される。例えば、図5bを参照すると、上述の確立された直交座標系に基づいて、原画像の解像度はa×a、予め設定された圧縮率はqであり、したがって、生成される低画素画像の解像度はb×bとなり、ここで、a/b=q、及び、a/b=qである。直交座標系の原点から開始して、低画素画像内の第1の画素点はPであり、画素点Pに対応する原画像の第1の原画素点はQ11で表され、画素点Pに対応する原画像の第2の原画素点はQ12で表され、画素点Pに対応する原画像の第3の原画素点はQ21で表され、画素点Pに対応する原画像の第4原画素点はQ22で表される。ここで、各原画素点の重み値は、予め設定された圧縮率に従って取得できる。例えば、予め設定された圧縮率が5:2である(つまり、5×5の画素点を2×2の画素点に圧縮する)場合には、圧縮後の第1の画素点に対応している原画素に対応する4つの原画素点は、第2行の第2の画素点、第2行の第3の画素点、並びに、第3行の第2の画素点、第3行の第3の画素点である。第2行の第2の画素点から圧縮された画素点までの距離は0.5(5÷2−2の絶対値)であり、第2行の第2の画素点の重み値は0.5であり、同様に、他の3つの画素点の重み値もやはり0.5である。
【0040】
重み値は正の整数又は正でない整数であるため、重み値が正でない整数の場合には、任意であるが、重み値にシフト演算を実行して対応する正の整数を取得し、取得した正の整数に従って画像処理を実行する。画像処理が完了したら、取得した低画素画像に含まれる各画素点の位置に再びシフト演算を実行し、各画素値に修正演算を実行することで、画像処理量を確実に減らしつつ、最終的に取得された対象画像の精度を高める。
【0041】
ステップa2:画像処理デバイスは、圧縮後の各画素点に対応する前記4つの原画素点から、第1の方向への2対の原画素点と、第2の方向への2対の原画素点とを判定する。
【0042】
本願のこの実施の形態では、画像処理デバイスが、1つの圧縮された画素点に対応する4つの原画像を2つの対に分割し、ここで、4つの原画素点の中で、同一行又は同一列に位置した2つの原画素点を1つの対とする。例えば、予め設定された圧縮率が5:2の場合、圧縮後の第1の画素点に対応している原画素に対応する4つの原画素点は第2行の第2の画素点、第2行の第3の画素点、並びに、第3行の第2の画素点、第3行の第3の画素点である。このケースでは、第2行の第2の画素点と第2行の第3の画素点が対であり、第3行の第2の画素点と第3行の第3の画素点が対である。
【0043】
取得した4つの原画素点に基づき、画像処理デバイスは、圧縮後の各画素点に対応する4つの原画素点のうち、第1の方向における2対の原画素点と、第2の方向における2対の原画素点とを判定する。例えば、図5bを参照すると、第1の方向が横軸の正方向、第2の方向が縦軸の正方向である場合、第1の方向における2対の原画素点はそれぞれQ11とQ12、並びに、Q21とQ22であり、第2の方向における2対の原画素点はそれぞれQ11とQ21、並びに、Q12とQ22である。
【0044】
ステップa3:画像処理デバイスは、前記第1の方向への圧縮後の各画素点の前記2対の原画素点にそれぞれ対応する第1補間を取得し、前記取得した2つの第1補間を初期補間とし;又は、画像処理デバイスは、前記第2の方向への圧縮後の各画素点の前記2対の原画素点にそれぞれ対応する第2補間を取得し、前記取得した2つの第2補間を初期補間とする。
【0045】
本願のこの実施の形態では、圧縮後の各画素点に対応する初期補間を取得する場合、画像処理デバイスは次の2つの方式を採用できる。
【0046】
第1の方式:画像処理デバイスが、第1の方向への圧縮後の各画素点の2対の原画素点にそれぞれ対応する第1補間を取得し、取得した2つの補間を圧縮後の各画素点に対応する初期補間とする。例えば、図5bを参照すると、第1の方向が横軸の正方向であり、第2の方向が縦軸の正方向である場合には、第1補間はQ11とQ12の補間、Q21とQ22の補間である。
【0047】
第2の方式:画像処理デバイスが、第2の方向への圧縮後の各画素点の2対の原画素点にそれぞれ対応する第2補間を取得し、取得した2つの補間を圧縮後の各画素点に対応する初期補間とする。例えば、図5bを参照すると、第1の方向が横軸の正方向であり、第2の方向が縦軸の正方向である場合、第2補間はQ11とQ21の補間、Q12とQ22の補間である。
【0048】
ステップa4:画像処理デバイスが、圧縮後の各画素点に対応する補間を、圧縮後の各画素点に対応する2つの初期補間に従って算出し、この算出した圧縮後の各画素点に対応する補間を圧縮後の各画素点の画素値として判定する。
【0049】
本願のこの実施の形態では、ステップa3の2つの方式に基づき、圧縮後の各画素点に対応する補間を取得するための2つの方式がある。
【0050】
第1の方式:画像処理デバイスは、第1の方向への圧縮後の各画素点の2対の原画素点にそれぞれ対応する第1補間を、圧縮後の各画素点に対応する初期補間として判定し、第2の方向への圧縮後の各画素点に対応する判定した2つの初期補間の補間を算出し、この補間を圧縮後の各画素点に対応する補間とする。例えば、図5bを参照すると、第1の方向が横軸の正方向であり、第2の方向が縦軸の正方向である場合に、Q11とQ12の初期補間はRであり、Q21とQ22の初期補間はRであり、初期補間Rと初期補間Rとの補間を算出し、この算出した補間を、原画素点Q11、Q12、Q21、Q22の圧縮後の画素点Pの画素値として判定する。
【0051】
第2の方式:画像処理デバイスは、第2の方向への圧縮後の各画素点の2対の原画素点にそれぞれ対応する第2の補間を、圧縮後の各画素点に対応する初期補間として判定し、第1の方向への圧縮後の各画素点に対応する判定した2つの初期補間の補間を算出し、この補間を圧縮後の各画素点に対応する補間とする。例えば、図5bを参照すると、第1の方向が横軸の正方向であり、第2の方向が縦軸の正方向である場合に、Q11とQ21の初期補間はRであり、Q12とQ22の初期補間はRであり、初期補間Rと初期補間Rとの補間を算出し、この算出した補間を、原画素点Q11、Q12、Q21、Q22の圧縮後の画素点Pの画素値として判定する。
【0052】
低画素画像内の画素点の全ての画素値は、原画素点の画素値に従って高速バイリニア補間アルゴリズムを用いて取得できる。ここで、次式を用いて任意のRを取得できる。

=Q×q+Q×q

ここで、Rは補間であり、Qは第1の原画素点の画素値であり、qは第1の原画素点の重み値であり、重み値は予め設定された圧縮率に従って取得されたものであり、Qは第2の原画素点の画素値であり、qは第2の原画素点の重み値であり、重み値は予め設定された圧縮率に従って取得されたものである。
【0053】
任意であるが、圧縮後の各画素点に対応する補間の算出中に、原画素点の各行の重み値と、原画素点の各列の重み値とを最初に算出してもよく、そして、算出した原画素点の各行の重み値と、算出した原画素点の各列の重み値とを記録することで、原画素点の行数と列数が既知である場合には、補間の算出工程中に原画素点の重み値を直接呼び出すことができる。そして、圧縮後の各画素点に対応する原画素点の重み値を算出する必要がないので、低画素画像の効率的な生成が強化される。
【0054】
任意であるが、圧縮後の各画素点に対応する補間の算出中に、任意の圧縮された画素点に対応する第1補間又は第2補間を算出によって入手する場合には、画像処理デバイスは第1の補間又は第2の補間を局所的にバッファリングしてよい。別の圧縮された画素点に対応する補間の算出中に採用した原画素点が、任意の圧縮された画素点に対応する原画素点と同一である場合には、再度算出することなく、第1の補間又は第2の補間を直接呼び出すだけでよいため、これにより低画素画像の取得に要する時間を短縮する。
【0055】
本願のこの実施の形態では、画像処理デバイスは、圧縮後の各画素点の画素値を既述の方式によって判定し、圧縮後の各画素点の位置及び画素値に従って低画素画像を生成する。
【0056】
高解像度の原画像は先に述べた技術的解決策によって低画素画像へ変換される。また、以下で述べる画像を処理するための各ステップは低画素画像に基づくものであるため、原画像の処理中に原画像内の過剰に多い画素点の数によって生じる大容量の画像処理の問題を回避でき、システムの処理負担が軽減され、画像処理時間が短縮され、画像処理効率が向上する。
【0057】
ステップ320で、取得した低画素画像内の対象画像の境界線を判定する。対象画像はいくつかの特定のグラフィック部分を含んでよいため、特定のグラフィック部分によって、以降での対象画像の境界線の検出工程に干渉が生じ、これにより、検出された対象画像の境界線にエラーを生じる可能性がある。そのため、低画素画像から対象画像の境界線を判定する場合には、先ず、特定のグラフィック部分を除去してから、特定のグラフィック部分を含まない検出対象領域のみを検出し、次に、検出対象領域から対象画像の境界線を判定する必要がある。例えば、IDカード画像を含む原画像では、IDカード画像を対象画像とし、このケースでは、対象画像に含まれる人物写真部分と文字部分とが特定のグラフィック部分である。
【0058】
具体的には、低画素画像をカラー画像からグレー画像へ変換し、このグレー画像をバイナリ化して、低画素画像をバイナリ画像へ変換する。ここで、バイナリ画像は2色のみであり、2色のうち一方は画素値0、他方は画素値255であることが好ましい。このバイナリ画像にエッジ検出処理を実行して、バイナリ画像に含まれる少なくとも1本のエッジラインを取得する。エッジ検出処理はキャニーエッジ検出処理であってよい。各エッジラインは別個に拡大される。取得した各エッジラインにはクラックが入っていることがあるが、このケースでは、拡大された各エッジラインどうしを連結して連結領域を取得する。全ての連結領域を各々の連結領域の位置情報にそれぞれ従ってスクリーニングして、特定領域を取得する。ここで、特定領域とは、対象画像に含まれた特定のグラフィック部分である。低画素画像内の特定領域以外の部分は検出対象領域として判定される。位置情報は、低画素画像内の各々の連結領域の位置である。
【0059】
任意であるが、画像処理デバイスは、予め設定されたエッジ検出パラメータを用いてバイナリ画像にエッジ検出処理を実行できる。エッジ検出パラメータが低いほど、より多くのエッジラインが検出され、エッジ検出パラメータが高いほど、検出されるエッジラインは少ない。加えて、画像処理デバイスは、予め設定された拡大パラメータを用いて各エッジラインを更に拡大してよい。この拡大パラメータはエッジ検出パラメータに適合されている。エッジ検出パラメータがより低く、より多くのエッジラインが検出される場合には、より小さい拡大パラメータを採用する。エッジ検出パラメータがより高く、検出されるエッジラインがより少ない場合には、より大きい拡大パラメータを採用する。拡大パラメータは5×5又は3×3であることが好ましい。
【0060】
前出の工程において、特定領域を取得するために、全ての連結領域を各々の連結領域の位置情報に従ってそれぞれスクリーニングするステップは、各連結領域の位置情報を取得するステップと、対象画像の予め推定された領域を取得するステップとを具体的に含む。この予め推定された領域とは、既存の技術を用いて予め推定された領域である。全ての連結領域のうち、予め推定された領域内に位置する任意の連結領域を特定領域として判定する。全ての連結領域のうち、予め推定された領域外に位置する任意の連結領域を非特定領域として判定する。例えば、図6を参照すると、低画素画像に画像処理を実行した後に、連結領域Aと連結領域Bとが取得され、対象画像の予め推定された領域はCである。図6からは、連結領域Aが予め推定された領域C内に位置し、連結領域Bは予め推定された領域C外に位置していることがわかる。したがって、連結領域Aは特定領域であり、連結領域Bは特定領域ではない。
【0061】
更に、バイナリ画像にエッジ検出処理を行う前に、画像処理デバイスは、第1の予め設定されたガウス・スムージングパラメータを用いて、バイナリ画像にガウス・スムージングを更に行ってもよい。ここで、第1の予め設定されたガウス・スムージングパラメータは、特定のアプリケーションシナリオに従って予め設定することができる。例えば、第1の予め設定されたガウス・スムージングパラメータは5×5又は3×3であってよい。技術的解決策により、エッジ検出処理を画像に施す前にバイナリ画像にガウス・スムージングを行って、バイナリ画像に含まれるノイズテクスチャを除去することで、ノイズ干渉によって生じる画像処理精度低下の問題が回避され、画像処理精度が効率的に向上する。
【0062】
先の技術的解決策により、低画素画像に含まれる特定領域を除去し、特定領域を含まない検出対象領域のみに境界線検出を実行すれば、検出対象でない領域に対して画像処理デバイスが画像処理工程を実行することが回避されるので、画像処理効率は効率的に向上する。加えて、画像処理デバイスは、特定領域を含まない検出対象領域に限って境界線検出を実行すれば、特定領域内の特定のグラフの勾配値が境界線検出条件を満たす場合には、特定領域内の曲線を境界線として判定してしまう問題が回避され、対象画像取得精度が効果的に確保される。
【0063】
ステップ320で、画像処理デバイスが、検出対象領域内の2つ置きに隣接する画素点間の勾配値を算出し、算出した勾配値に従って検出対象領域にエッジ領域検出を行い、更に、低画素画像に含まれる対象画像の境界線を判定する。
【0064】
具体的に、図7を参照すると、低画素画像に含まれる対象画像の境界線を判定する工程は以下のステップを含む。
【0065】
ステップb1:前記低画素画像はバイナリ化され、前記低画素画像はバイナリ画像に変換され、前記バイナリ画像は2色のみを含む。
【0066】
本願のこの実施の形態では、低画素画像を、カラー画像から、2色のみを含むバイナリ画像へ変換する。この2色の一方は画素値0であり、他方は画素値255である。技術的解決策により、画像処理デバイスはカラー低画素画像をバイナリ画像へ変換するので、勾配値を用いて行う境界線検出における複雑性は低減し、画像処理の効率が向上する。
【0067】
更に、画像処理デバイスによって、2つ置きに隣接する画素点間の勾配を取得する工程は:第1の画素点及び第2の画素点を含む2つの任意の隣接した画素点について、第1の画素点の第1のカラー画素値(S)、第2のカラー画素値(S)、第3のカラー画素値(S)を取得するステップと;第2の画素点の第1のカラー画素値(U)、第2のカラー画素値(U)、第3のカラー画素値(U)を取得するステップと;第1の画素点の第1のカラー画素値(S)と第2の画素点の第1のカラー画素値(U)との間の差分の絶対値、第1の画素点の第2のカラー画素値(S)と第2の画素点の第2のカラー画素値(U)との間の差分の絶対値、第1の画素点の第3のカラー画素値(S)と第2の画素点の第3のカラー画素値(U)との間の差分の絶対値を別個に算出し、算出した3つの絶対値を第1の画素点間の勾配値とするステップとを含む。具体的に、画像処理デバイスは、次式を用いて、2つの任意の隣接した画素点間の勾配値を算出できる:

T=|S−U|+|S−U|+|S−U

ここで、Tは2つの任意の隣接した画素点間の勾配値、Sは第1の画素点の第1のカラー画素値、Sは第1の画素点の第2のカラー画素値、Sは第1の画素点の第3のカラー画素値、Uは第2の画素点の第1のカラー画素値、Uは第2の画素点の第2のカラー画素値、Uは第2の画素点の第3のカラー画素値である。2つの隣接した画素点は、2つの縦方向に隣接した画素点、又は、2つの横方向に隣接した画素点を含む。
【0068】
本願のこの実施の形態では、2つ毎の隣接した画素点間の勾配値を算出する工程を説明するために、3つの基本色のみから成る原画像を例に挙げている。また、原画像が4つ以上の基本色を含む場合には、2つ毎の隣接した画素点間の勾配値の取得中に採用される原理は、3つの基本色から成る原画素から、2つ毎の隣接した画素点間の勾配値の取得中に採用される原理と同じであってよい。そのため、ここでは詳細について繰り返し述べない。
【0069】
ステップb2:以下の演算が任意方向に実行され、前記以下の演算は:前記任意方向において前記バイナリ画像の前記検出対象領域内の2つ毎の隣接した画素点間の勾配値を、前記任意方向に対応する予め設定された初期勾配閾値と別個に比較すること、及び、前記比較結果に従って前記任意方向への初期境界線を取得することである。
【0070】
本願のこの実施の形態において、対象画像は閉じた四角形である。そのため、端末は、予め設定された初期勾配閾値が任意方向に対応する状態で、バイナリ画像の検出対象領域内の任意方向に2つ置きに隣接した画素点間の勾配値を別個に比較し、任意方向に沿って隣接した画素点の任意の群における隣接した画素点間の勾配値が、全て予め設定された初期勾配閾値よりも大きい場合に、端末は、隣接した画素点群内の一群の画素で構成された線を任意方向への境界線として判定する。ここで、任意方向とは第1の方向又は第2の方向であり、第1の方向は、原点から横軸の正方向に沿う方向であり、第2の方向は、原点から縦軸の正方向に沿う方向であり(第1の解決策)、又は、第1の方向は原点から縦軸の正方向に沿う方向であり、第2の方向は原点から横軸の正方向に沿う方向である(第2の解決策)。
【0071】
第1の解決策を採用する場合には、画像処理デバイスは、第1の方向への境界線の取得処理中に、バイナリ画像内の2つ毎の縦方向に隣接した画素点間の勾配値を算出して、取得した勾配値を第1の初期勾配閾値と比較し、更に、2つの任意の隣接した行内の全ての画素点のうち2つ毎の縦方向に隣接した画素点間の勾配値が第1の初期勾配閾値に達する場合に、2つの任意の隣接した行の上方の行の画素点で形成された線を、第1の方向における1つの初期境界線であると判定する必要がある。2つの任意の隣接した行内の全ての画素点のうち任意の2つの縦方向に隣接した画素点間の勾配値が第1の初期勾配閾値に達しない場合には、画像処理デバイスは、画素点から成る次の隣接した2行間の勾配値が全て境界線検出条件を満たしているかどうかを検出し続ける。同様に、画像処理デバイスは、第2の方向への境界線の取得処理中に、バイナリ画像内の2つ毎の横方向に隣接した画素点間の勾配値を算出し、取得した勾配値を第2の初期勾配閾値と比較し、更に、2つの任意の隣接した列内の全ての画素点のうち2つ毎の横方向に隣接した画素点間の勾配値が第2の初期勾配閾値に達する場合に、2つの任意の隣接した列の左側の線を、第2の方向における1つの初期境界線であると判定する必要がある。2つの任意の隣接した列内の全ての画素点のうち任意の2つの横方向に隣接した画素点間の勾配値が第2の初期勾配閾値に達しない場合には、画像処理装置は、画素点から成る次の隣接した2列間の勾配値が全て境界線検出条件を満たしているかどうかを検出し続ける。
【0072】
第2の解決策を採用する場合には、画像処理デバイスは、第1の方向への境界線の取得処理中に、第1の方向への境界線を取得する際に、バイナリ画像内の2つ毎の横方向に隣接した画素点間の勾配値を算出し、取得した勾配値を第1の初期勾配閾値と比較し、更に、2つの任意の隣接した列内の全ての画素点のうち2つ毎の横方向に隣接した画素点間の勾配値が第1の初期勾配閾値に達する場合に、2つの任意の隣接した列の左側の線を、第1の方向における1つの初期境界線であると判定する必要がある。2つの任意の隣接した列内の全ての画素点のうち任意の2つの横方向に隣接した画素点間の勾配値が第1の初期勾配閾値に達しない場合には、画像処理デバイスは、画素点から成る次の隣接した2列間の勾配値が全て境界線検出条件を満たしているかどうかを検出し続ける。同様に、画像処理デバイスは、第2の方向への境界線の取得処理中に、バイナリ画像内の2つ毎の縦方向に隣接した画素点間の勾配値を算出し、取得した勾配値を第2の初期勾配閾値と比較し、更に、2つの任意の隣接した行内の全ての画素点のうち2つ毎の縦方向に隣接した画素点間の勾配値が第2の初期勾配閾値に達する場合に、2つの任意の隣接した行の上方の行における線を、第2の方向における1つの初期境界線であると判定する必要がある。2つの任意の隣接した行内の全ての画素点のうち任意の2つの縦方向に隣接した画素点間の勾配値が第2の初期勾配閾値に達しない場合には、画像処理デバイスは、画素点から成る次の隣接した2行間の勾配値が全て境界線検出条件を満たしているかどうかを検出し続ける。第1の初期勾配閾値と第2の初期勾配閾値は共に、特定のアプリケーションシナリオに従って予め設定された値であり、これらは互いに等しくても等しくなくてもよい。
【0073】
例えば、図8を参照すると、第1の方向が横軸の正方向である際の、第1の方向への境界線の検出を例にとると、バイナリ画像内のi番目の行と(i+1)番目の行が隣接した2行であり、各行は3つの画素点を含んでいる。ここで、i番目の行は画素点Zi1、Zi2、Zi3を含み、(i+1)番目の行は画素点Z(i+1)1、Z(i+1)2、Z(i+1)3を含み、第1の初期勾配閾値はTであり、Zi1とZ(i+1)1は2つの縦方向に隣接した画素点であり、Zi2とZ(i+1)2は2つの縦方向に隣接した画素点であり、Zi3とZ(i+1)3は2つの縦方向に隣接した画素点であり、画素点Zi1と画素点Z(i+1)1の間の勾配値はTであり、画素点Zi2と画素点Z(i+1)2の間の勾配値はTであり、画素点Zi3と画素点Z(i+1)3の間の勾配値はTである。T、T、Tが全てTより大きい又はTと等しい場合には、i番目の行を第1の方向への境界線として判定する。T、T、Tのうち少なくとも1つがTよりも小さい場合には、境界線条件を満たしている境界線が(i+1)番目の行と(i+2)番目の行との間に存在するかどうかを検出し続ける。
【0074】
任意であるが、画像処理デバイスは、境界線を検出する際に、連続的なハフ変換アルゴリズムを用いて境界線検出を実行してよい。
【0075】
本願のこの実施の形態では、画像処理デバイスは、バイナリ画像内の検出対象領域に境界線検出を実行する前に、第2の予め設定されたガウス・スムージングパラメータを用いてバイナリ画像にガウス・スムージングを更に実行してよく、第2の予め設定されたガウス・スムージングパラメータは、特定のアプリケーションシナリオに従って予め設定されてよい。例えば、第1の予め設定されたガウス・スムージングパラメータは5×5又は3×3であってよい。技術的解決策により、エッジ検出処理を画像に実行する前にバイナリ画像にガウス・スムージングを行ってバイナリ画像に含まれるノイズテクスチャを除去することで、ノイズ干渉により生じる画像処理精度の低下の問題を回避でき、画像処理精度が効果的に高まる。
【0076】
ステップb3:直線検出は、前記任意方向への前記少なくとも2本の初期境界線から前記任意方向への境界線を取得するために、前記任意方向にて取得した初期境界線の数が少なくとも2本である場合に、前記任意方向への各初期境界線の位置情報に従って、前記任意方向への各初期境界線に別個に実行される。
【0077】
本願のこの実施の形態では、画像処理デバイスは、任意方向にて取得した初期境界線の数が2よりも大きい又は等しいかどうかを判断し、任意方向にて取得した初期境界線の数が2よりも大きい又は等しい場合には、各初期境界線の位置に従って、初期境界線にスクリーニングを実行することで、全ての初期境界線から任意方向への境界線を選択する。
【0078】
具体的に、対象画像の境界線検出処理では、検出結果が少なくとも2本の第1の方向への初期境界線と、少なくとも2本の第2の方向への初期境界線とを得ると、第1の方向への各初期境界線の位置情報に従って、第1の方向への初期境界線の各々に直線検出を個別に実行し、これにより、少なくとも2本の第1の方向への初期境界線から第1の方向への2本の境界線を取得し、更に、第2の方向への各初期境界線の位置情報に従って、第2の方向への初期境界線の各々に直線検出を個別に実行し、これにより、少なくとも2本の第2の方向への初期境界線から2本の第2の方向への境界線を取得する。
【0079】
本願のこの実施の形態では、画像処理デバイスは、複数の初期境界線を得るために、様々な方向での検出が可能である。複数の初期境界線は背景画像のような干渉因子を含んでいる可能性があるため、複数の初期境界線は対象画像の全ての境界線ではなく、又、同時に、対象画像の境界線を判定するために、取得した全ての初期境界線を検出する必要がある。
【0080】
具体的に、画像処理デバイスは、各初期境界線に次の演算を実行する。画像処理デバイスが初期境界線の位置情報を取得する。この位置情報は、低画素画像における横軸からの初期境界線の距離と、縦軸からの初期境界線の距離である。画像処理デバイスは、対象画像の予め推定された領域を取得し、初期境界線の位置情報を予め推定された領域と比較する。初期境界線の位置情報と予め推定された領域との間のマッチングが成功すると、初期境界線が対象画像の境界線として判定される。初期境界線の位置情報と予め推定された領域との間のマッチングが失敗すると、初期境界線は対象画像の境界線ではないと判定される。ここで、初期境界線の位置情報と予め推定された領域との間のマッチングの成功は、横軸からの初期境界線の距離が、横軸からの予め推定された領域の任意の境界線の距離と等しい、又は、縦軸からの初期境界線の距離が、縦軸からの予め推定された領域の任意の境界線の距離と等しいことを指す。
【0081】
更に、初期境界線のスクリーニング処理後に依然として複数の境界線が存在している場合には、画像処理デバイスは、初期境界線どうしが交差した後の交差点どうしの間の各初期境界線において或る長さの線分を取得し、多様な方向へ延び、対象画像の側部間の比率を満たしており、交差点を有する初期境界線を、対象画像の辺どうしの間の比率に従って、複数の初期境界線から除去して、対象画像の境界線として機能できるようにする。例えば、対象画像はIDカード画像であり、IDカードの長さ/幅比は4:3であり、画像処理デバイスが取得した第1の方向への第1の初期境界線の長さは8cmであり、第2の方向にあって、第1の初期境界線と交差する第2の初期境界線の長さは4cmである。第1の初期境界線と第2の境界線の長さ比は4:3と等しくないため、第1の初期境界線と第2の初期境界線は対象画像の境界線ではない。画像処理デバイスが取得した第1の方向への第3の初期境界線の長さは8cm、第2の方向にあって、第1の初期境界線と交差する第4の初期境界線の長さは6cmである。第1の初期境界線の第2の初期境界線に対する長さ比は4:3であるので、第1の初期境界線と第2の初期境界線は対象画像の境界線である。
【0082】
この技術的解決策により、複数の限定条件を採用して、初期境界線から対象画像の境界線を取得することで、取得した対象画像の境界線の精度を確保する。
【0083】
ステップb3:前記任意方向に対応する前記予め設定された初期勾配閾値は、前記任意方向にて取得した前記初期境界線の数が2本未満である場合に、予め設定された第1の勾配差に従って連続的に低減され、又、前記バイナリ領域の前記検出対象領域は、前記低減した初期勾配閾値を用いて、前記任意方向にて取得した前記初期境界線の数が少なくとも2本になるまで、前記任意方向にて検出される。
【0084】
本願のこの実施の形態では、任意方向にて取得した初期境界線の数が予め設定された数よりも少ない場合には、予め設定された初期勾配閾値を下げ、この低下した初期勾配閾値を用いてエッジ領域検出を再び実行する。任意方向において取得できる境界線の数が依然として2本よりも少ない場合には、予め設定された初期勾配閾値を再び下げ、任意方向にて取得される初期境界線の数が2本を下回らなくなるまでこの工程を繰り返し、更に、各初期境界線の位置に従って初期境界線にスクリーニングを実行して、全ての初期境界線の中から任意方向への境界線を選択する。
【0085】
具体的には、対象画像の境界線検出工程において、検出結果で、第1の方向への初期境界線を少なくとも2本取得できなかった場合には、第1の方向において取得される初期境界線の数が少なくとも2本になるまで、第1の初期勾配閾値を予め設定された第1の勾配差に従って連続的に下げる。第1の方向への初期境界線が複数取得された場合には、第1の方向への各初期境界線の位置情報に従って、第1の方向への各初期境界線に直線検出を個別に実行し、第1の方向への複数の初期境界線から第1の方向への2本の境界線を取得する。同様に、検出結果で、第2の方向への初期境界線を少なくとも2本取得できなかった場合には、第2の方向において少なくとも2本の初期境界線が取得されるまで、第2の初期勾配閾値を、予め設定された第2の勾配差に従って連続的に下げる。第2の方向への初期境界線が複数取得された場合には、第2の方向への各初期境界線の位置情報に従って、第2の方向への各初期境界線に直線検出を個別に実行し、複数の第2の方向への初期境界線から第2の方向への2本の境界線を取得する。
【0086】
本願のこの実施の形態では、第1の方向が横軸の正方向であり、第2の方向が縦軸の正方向である場合に、画像処理デバイスが、第1の方向への2つ毎の隣接した画素点間の勾配を連続的に算出した後に、画素点から成る任意の2つの隣接した行間に、予め設定された第1の勾配閾値を満たす勾配がないと判定すると、画像処理デバイスは、予め設定された第1の勾配差に従って第1の初期勾配閾値を下げ、前出の工程を再び実行する。減少した勾配閾値に従って第1の方向への2本の初期境界線を取得できる場合には、画像処理デバイスは工程を終了する。減少した勾配閾値に従って第1の方向への2本の初期境界線を取得できない場合には、画像処理デバイスが、下げた勾配閾値に従って第1の方向への2本の初期境界線を取得できるまで、再び、予め設定された第1の勾配差に従って第1の初期勾配閾値を下げる。同様に、画素点から成る2つ毎の隣接した列間の勾配を連続的に算出した後に、画像処理デバイスが、画素点から成る任意の2つの隣接した列間に、予め設定された第2の勾配閾値を満たす勾配値がないと判定すると、画像処理デバイスが、予め設定された第2の勾配差に従って第2の初期勾配閾値を下げ、前出の処理を再び実行する。減少した勾配閾値に従って第2の方向への2本の初期境界線を取得できる場合には、画像処理デバイスが処理を終了する。減少した勾配閾値に従って第2の方向への2本の初期境界線を取得できない場合には、画像処理デバイスが、下げた勾配閾値に従って第2の方向への2本の初期境界線が取得できるまで、予め設定された第2の勾配差に従って第2の初期勾配閾値を再び下げる。
【0087】
更に、第1の方向が縦軸の正方向であり、第2の方向が横軸の正方向である場合には、画像処理デバイスによって対象画像の境界線を取得する方式は、第1の方向が横軸の正方向であり、第2の方向が縦軸の正方向であるケースと同一である。したがって、ここでは詳細について繰り返さない。
【0088】
ここで、第1の予め設定された勾配差は特定のアプリケーションシナリオに従って予め設定された値である。例えば、この値は10である。
【0089】
ステップ330で、低画素画像に含まれる境界線の交差点の位置情報を取得する。取得した交差点を、予め設定された圧縮率に従って、原画像内に個別にマッピングする。交差点から原画像内にマッピングされた点を連続的に連結し、連結後に生成された四角形を原画像に含まれた対象画像として判定する。ここで、ステップ310の高速バイリニア補間アルゴリズムの反転処理を採用して、各々の補間点を原画像にマッピングする。
【0090】
更に、原画像に含まれる対象画像を取得した後に、射影変換アルゴリズムを用いて対象画像を修正する。具体的には、原画像内における対象画像の形状は、撮影アングルにより、対象物体の形状といくらか違っていてよい。例えば、対象物体はIDカードであり、その形状は四角形である一方、対象画像は平行四辺形である。そのため、画像処理デバイスが、射影変換アルゴリズムを用いて対象画像を修正し、全ての交差点のうち任意の交差点を頂点とし、この頂点と任意の隣接する頂点との間の距離を対象画像の任意の辺長とし、対象画像の他の頂点を対象画像の長さ/幅比に従って判定し、全ての頂点を連続的に連結すると、グラフが修正された対象画像が形成される。
【0091】
技術的解決策により、原画像はカラー画像又はグレー画像であってよく、原画像の形式は限定されず、高い普遍性を達成する。更に、2つの隣接した画素点間の勾配値に従って対象画像の初期境界線を判定し、取得した初期境界線を、対象物体の形状と取得した初期境界線の位置情報とに従ってスクリーニングして、対象画像の境界線を判定し、これにより、背景画像が対象画像と非常に類似している場合に対象画像上の背景画像からの干渉の問題を回避でき、取得した対象画像の精度が確保される。加えて、画像処理デバイスがモバイル端末である場合には、先の技術的解決策によって、対象画像の取得処理と修正処理にかかる時間はほんの600msとなり、画像処理が高速化する。
【0092】
本願のこの実施の形態では、画像処理デバイスがモバイル端末である場合には、この技術的解決策を、Androidシステム、IOSシステム及びその他の様々なオペレーティングシステムに適用できる。
【0093】
上記技術的解決策に基づいて、図9を参照し、本願の実施の形態は、画像取得装置を更に提供し、本装置は、原画像取得部90と、原画像取得部91と、境界線判定部92と、対象画像取得部93とを備え:
原画像取得部90は、対象画像を含む原画像を取得するように構成され;
原画像取得部91は、予め設定された圧縮率に従って前記原画像に画像圧縮処理を実行し、前記画像圧縮処理後に低画素画像を取得するように構成され;
境界線判定部92は、前記低画素画像内の前記対象画像の境界線を判定するように構成され;
対象画像取得部93は、前記低画素画像内の前記判定された境界線を前記原画像内にマッピングして、前記原画像内に含まれる前記対象画像を取得するように構成される。
【0094】
前記低画素画像取得部91は、具体的に:前記予め設定された圧縮率に従って、圧縮後の各画素点の位置を判定し;高速バイリニア補間アルゴリズムを用いて前記原画像に画像圧縮処理を実行して、圧縮後の各画素点の画素値を取得し;圧縮後の各画素点の前記画素値及び前記位置に従って、前記低画素画像を生成する;ように構成される。
【0095】
任意で、前記低画素画像取得部91により、高速バイリニア補間アルゴリズムを用いて前記原画像に画像圧縮処理を実行して、圧縮後の各画素点の画素値を取得することは、具体的に:
前記予め設定された圧縮率に従って、前記原画像内に含まれる全ての原画素点から、圧縮後の各画素点に対応する4つの原画素点を判定することと;
圧縮後の各画素点に対応する前記4つの原画素点から、第1の方向への2対の原画素点と、第2の方向への2対の原画素点とを判定することであって、前記第1の方向は横方向、前記第2の方向は縦方向であり、又は、前記第1の方向は縦方向、前記第2の方向は横方向である、判定することと;
前記第1の方向への圧縮後の各画素点の前記2対の原画素点にそれぞれ対応する第1補間を取得し、前記取得した2つの第1補間を初期補間とすること;又は、前記第2の方向への圧縮後に各画素点の前記2対の原画素点にそれぞれ対応する第2補間を取得し、前記取得した2つの第2補間を初期補間とすることと;
圧縮後の各画素点に対応する前記初期補間に従って、圧縮後の各画素点に対応する補間を算出し、又、前記算出した圧縮後の各画素点に対応する補間に従って圧縮後の各画素点の前記画素値を判定することと;を含む。
【0096】
任意で、前記境界線判定部92は:前記低画素画像から検出対象領域を判定し;前記対象画像の前記境界線を判定するために、前記検出対象領域内の2つ毎の隣接した画素点間の勾配値に従って、前記検出対象領域に境界線検出処理を実行する;ように構成される。
【0097】
任意で、前記境界線判定部92によって、前記低画素画像から検出対象領域を判定することは、具体的に:前記低画素画像を2色のみを備えたバイナリ画像へ変換するために前記低画素画像をバイナリ化することと;前記バイナリ画像内に含まれる少なくとも1本のエッジラインを取得するために、前記バイナリ画像にエッジ検出処理を実行することと;
各エッジラインを別個に拡大することと;連結領域を取得するために、各々の拡大されたエッジラインを連結することと;特定領域を取得するために、前記連結領域を、各々の連結領域の位置情報にそれぞれ従ってスクリーニングすることであって、前記特定領域は、前記対象画像内の特定のグラフィック部分を含む、スクリーニングすることと;前記低画素画像内の前記特定領域以外の領域を前記検出対象領域として判定することと;を含む。
【0098】
更に、ガウス・スムージング部94を更に備え、ガウス・スムージング部は、前記バイナリ画像に前記エッジ検出処理を実行する前に、予め設定されたガウス・スムージングパラメータを用いて前記バイナリ画像にガウス・スムージングを実行するように構成される。
【0099】
任意で、前記対象画像の前記境界線を判定するために、前記境界線判定部92により、検出対象領域内の2つ毎の隣接した画素点間の勾配値に従って、前記検出対象領域に境界線検出を実行することは、具体的に:前記低画素画像を2色のみを備えたバイナリ画像へ変換するために、前記低画素画像をバイナリ化することと;以下の演算を任意方向に実行することであって、前記以下の演算は、前記任意方向において前記バイナリ画像の前記検出対象領域内の2つ毎の隣接した画素点間の勾配値を、前記任意方向に対応する予め設定された初期勾配閾値と別個に比較すること、及び、前記比較結果に従って前記任意方向にて初期境界線を取得すること、である演算を任意方向に実行することと;各方向にて取得した前記初期境界線の数に従って、前記対象画像の前記境界線をそれぞれ判定することと;を含む。
【0100】
任意で、境界線判定部92により、各方向にて取得した前記初期境界線の数に従って、前記対象画像の前記境界線をそれぞれ判定することは、具体的に:任意方向への検出結果を得るために、次の演算を実行することを備え;
前記演算は:前記任意方向への前記少なくとも2本の初期境界線から前記任意方向への境界線を取得するために、前記任意方向にて取得した初期境界線の数が少なくとも2本である場合に、前記任意方向への各初期境界線の位置情報に従って、前記任意方向への各初期境界線に直線検出を別個に実行し;前記任意方向にて取得した前記初期境界線の数が2本未満である場合に、前記任意方向に対応する前記予め設定された初期勾配閾値を、予め設定された第1の勾配差に従って連続的に低減し、又、前記低減した初期勾配閾値を用いて、前記任意方向にて取得した前記初期境界線の数が少なくとも2本になるまで、前記任意方向にて前記バイナリ画像の前記検出対象領域を検出する。
【0101】
任意で、前記対象画像取得部93は、具体的に:前記低画素画像内に含まれる2つ毎の隣接した境界線の交差点を取得し;前記取得した交差点を、前記予め設定された圧縮率に従って、前記原画像内に別個にマッピングし;前記原画像内にマッピングされた前記点を連続的に連結し、前記連結後に生成された四角形を前記原画像内に含まれる対象画像として判定する;ように構成される。
【0102】
任意で、本装置は修正部95を更に備え、修正部は、前記原画像内に含まれる前記対象画像が取得された後に、射影変換アルゴリズムを用いて前記対象画像を修正するように構成される。
【0103】
画像取得装置はその一部が画像処理デバイス内に配置されてもよく、画像取得装置は画像処理デバイスであってもよい。
【0104】
結論として、本願のこの実施の形態では、原画像を取得し;予め設定された圧縮率に従ってこの原画像に画像圧縮処理を実行し、画像圧縮処理の後に低画素画像を取得し;低画素画像から検出対象領域を取得し、ここで、検出対象領域は特定のグラフィック部分を含まない領域であり;検出対象領域内の2つ毎の隣接した画素点間の勾配値に従って検出対象領域に境界線検出を実行して、低画素画像に含まれる対象画像の境界線を判定し;低画素画像に含まれる境界線を原画像内にマッピングして、原画像に含まれた対象画像を取得する。本願の技術的解決策により、原画像を低画素画像へ変換する処理と、対象画像の境界線を取得する処理は、両方とも低画素画像に基づくものであり、また、低画素画像は画素点の数が少ないため、低画素画像の処理時間が短縮され、対象画像の取得効率が向上する。更に、特定領域は干渉因子であるため、低画素画像内の特定領域を含まない部分を検出対象領域とし、即ち、低画素画像内の干渉因子を除去して、検出対象領域のみを検出するようにすることで、画像処理時間を短縮しつつ画像処理精度を確保できる。加えて、検出対象領域内の2つ毎の隣接した画素点間の勾配値の変化に従って対象画像の境界線を判定し、得られた境界線を原画像内にマッピングして、原画像内の対象画像を判定する。これにより、取得した低画素画像内の対象画像と原画像内の対象画像との間に差が存在する問題が回避され、対象画像取得の精度を確保できる。
【0105】
当業者は、本願の実施の形態は、方法、システム、又はコンピュータプログラム製品として提供され得ることを理解するはずである。したがって、本願の実施の形態は、完全なハードウェアの実施の形態、完全なソフトウェアの実施の形態、又はソフトウェアとハードウェアの組み合わせの実施の形態において実現できる。さらに、本願は、コンピュータで用いることができるプログラムコードを含む1つ以上のコンピュータで用いることができる記憶媒体(磁気ディスクメモリ、CD−ROM、光学メモリなどを非限定的に含む)上で実現されるコンピュータプログラム製品の形態を採ることもできる。
【0106】
本願を、本願の実施の形態による方法、デバイス(システム)、及びコンピュータプログラム製品のフローチャート及び/又はブロック図を参照に説明した。コンピュータプログラム命令を用いて、フローチャート及び/又はブロック図の各工程及び/又はブロックを実施でき、またフローチャート及び/又はブロック図の工程及び/又はブロックの組み合わせを実施できることは言うまでもない。これらのコンピュータプログラム命令を、汎用コンピュータ、専用コンピュータ、組込み型プロセッサ、又はマシンを生成する別のあらゆるプログラム可能な処理デバイスに提供することで、コンピュータ又は別のプログラム可能な処理デバイスのプロセッサによって実行される命令が、フローチャートの1つ以上の工程及び/又はブロック図の1つ以上のブロックにおける特定機能を実施する装置を生成する。
【0107】
これらのコンピュータプログラム命令は、コンピュータ又は別のあらゆるプログラム可能な処理デバイスを特定方法で作動するよう命令できるコンピュータで読取り可能なメモリに格納することもでき、コンピュータで読取り可能なメモリに格納された命令は、命令装置を含む製品を生成する。この命令装置は、フローチャートの1つ以上の工程における、及び/又は、ブロック図の1つ以上のブロックにおける特定機能を実施する装置である。
【0108】
これらのコンピュータプログラム命令はコンピュータ又は別のプログラム可能なデータ処理デバイスにロードすることもでき、そうすることで一連の演算及びステップがコンピュータ又は別のプログラム可能な端末デバイス上で実行され、コンピュータ実装処理を達成することができる。したがって、コンピュータ又は別のプログラム可能なデバイス上で実行される命令は、フローチャートの1つ以上の工程、及び/又はブロック図の1つ以上のブロックにおける特定機能を実施するためのステップを提供する。
【0109】
本願の実施の形態のうちの好ましい実施の形態を説明したが、当業者は、基本的な発明の概念を知った上で、これらの実施の形態に他の変更及び修正を加えることができる。したがって、付帯の特許請求の範囲は、本願の実施の形態の範囲に含まれる、好ましい実施の形態と全ての変更及び修正とを包含すると解釈されることを意図している。
【0110】
当業者は、本願の実施の形態の趣旨及び範囲から逸脱せずに、本願の実施の形態に様々な補正及び修正を加えられることが明白である。したがって、本願の実施の形態のこれらの補正及び修正が本願の特許請求の範囲及びその均等な技術の範囲に含まれる場合、本願はその補正及び修正を含むことを意味する。
[第1の局面]
画像処理方法であって:
対象画像を含む原画像を取得するステップと;
画像圧縮処理後に低画素画像を取得するために、予め設定された圧縮率に従って前記原画像に画像圧縮処理を実行するステップと;
前記低画素画像内の前記対象画像の境界線を判定するステップと;
前記原画像内に含まれる前記対象画像を取得するために、前記判定した前記低画素画像内に含まれる境界線を前記原画像内にマッピングするステップと;を備える、
画像処理方法。
[第2の局面]
前記画像圧縮処理後に低画素画像を取得するために、予め設定された圧縮率に従って前記原画像に前記画像圧縮処理を実行する前記ステップは、具体的に:
前記予め設定された圧縮率に従って圧縮後の各画素点の位置を判定するステップと;
圧縮後の各画素点の画素値を取得するために、高速バイリニア補間アルゴリズムを用いて前記原画像に画像圧縮処理を実行するステップと;
圧縮後の各画素点の前記画素値及び前記位置に従って前記低画素画像を生成するステップと;を備える、
第1の局面に記載の方法。
[第3の局面]
圧縮後の各画素点の画素値を取得するために、高速バイリニア補間アルゴリズムを用いて前記原画像に前記画像圧縮処理を実行する前記ステップは、具体的に:
前記原画像内に含まれる全ての原画素点のうち、前記予め設定された圧縮率に従って圧縮後の各画素点に対応する4つの原画素点を判定するステップと;
圧縮後の各画素点に対応する前記4つの原画素点のうち、第1の方向への2対の原画素点と、第2の方向への2対の原画素点とを判定するステップであって、前記第1の方向は横方向で、前記第2の方向は縦方向である、或いは、前記第1の方向は縦方向で、前記第2の方向は横方向である、判定するステップと;
前記第1の方向への圧縮後の各画素点の前記2対の原画素点にそれぞれ対応する第1補間を取得し、前記取得した2つの第1補間を初期補間とするステップ、又は、前記第2の方向への圧縮後の各画素点の前記2対の原画素点にそれぞれ対応する第2補間を取得し、前記取得した2つの第2補間を初期補間とするステップと;
圧縮後の各画素に対応する前記初期補間に従って、圧縮後の各画素点に対応する補間を算出し、前記算出した圧縮後の各画素点に対応する補間に従って、圧縮後の各画素点の前記画素値を判定するステップと;を備える、
第2の局面に記載の方法。
[第4の局面]
前記低画素画像内の前記対象画像の境界線を判定する前記ステップは、具体的に:
前記低画素画像から検出対象領域を判定するステップと;
前記対象画像の前記境界線を判定するために、前記検出対象領域内の2つ毎の隣接した画素点間の勾配値に従って、前記検出対象領域に境界線検出処理を実行するステップと;を備える、
第1の局面乃至第3の局面のいずれか1項に記載の方法。
[第5の局面]
前記低画素から前記検出対象領域を判定する前記ステップは、具体的に:
前記低画素画像をバイナリ画像へ変換するために、前記低画素画像をバイナリ化するステップであって、前記バイナリ画像は2色のみを含む、バイナリ化するステップと;
前記バイナリ画像内に含まれる少なくとも1本のエッジラインを取得するために、前記バイナリ画像にエッジ検出処理を実行するステップと;
各エッジラインを別個に拡大するステップと;
連結領域を取得するために、各々の拡大されたエッジラインを連結するステップと;
特定領域を取得するために、前記連結領域を、各連結領域の位置情報のそれぞれに従ってスクリーニングするステップであって、前記特定領域とは前記対象画像内の特定のグラフィック部分を含む領域である、スクリーニングするステップと;
前記低画素画像内の前記特定領域以外の領域を検出対象領域として判定するステップと;を備える、
第4の局面に記載の方法。
[第6の局面]
前記バイナリ画像に前記エッジ検出処理を実行する前記ステップの前に、
予め設定されたガウス・スムージングパラメータを用いて、前記バイナリ画像にガウス・スムージングを実行するステップを更に備える、
第5の局面に記載の方法。
[第7の局面]
前記対象画像の前記境界線を判定するために、前記検出対象領域内の2つ毎の隣接した画素点間の勾配値に従って、前記検出対象領域に前記境界線検出処理を実行するステップは、具体的に:
前記低画素画像を2色のみを備えたバイナリ画像へ変換するために、前記低画素画像をバイナリ化するステップと;
以下の演算を任意方向に実行するステップであって、前記以下の演算は、前記任意方向において前記バイナリ画像の前記検出対象領域内の2つ毎の隣接した画素点間の勾配値を、前記任意方向に対応する予め設定された初期勾配閾値と別個に比較すること、及び、前記比較結果に従って前記任意方向への初期境界線を取得することである、実行するステップと;
各方向にて取得した初期境界線の数に従って前記対象画像の前記境界線をそれぞれ判定するステップと;を備える、
第4の局面に記載の方法。
[第8の局面]
各方向にて取得した前記初期境界線の数に従って、前記対象画像の前記境界線をそれぞれ判定する前記ステップは、具体的に:
任意方向への検出結果を得るために、次の演算を実行するステップを備え;
前記演算は:
前記任意方向への前記少なくとも2本の初期境界線から前記任意方向への境界線を取得するために、前記任意方向にて取得した初期境界線の数が少なくとも2本である場合に、前記任意方向への各初期境界線の位置情報に従って、前記任意方向への各初期境界線に直線検出を別個に実行する演算;又は
前記任意方向にて取得した前記初期境界線の数が2本未満である場合に、前記任意方向に対応する前記予め設定された初期勾配閾値を、予め設定された第1の勾配差に従って連続的に低減し、又、前記低減した初期勾配閾値を用いて、前記任意方向にて取得した前記初期境界線の数が少なくとも2本になるまで、前記任意方向にて前記バイナリ領域の前記検出対象領域を検出する演算;である、
第7の局面に記載の方法。
[第9の局面]
前記原画像内に含まれる前記対象画像を取得するために、前記低画素画像内に含まれる前記境界線を前記原画像内にマッピングする前記ステップは、具体的に:
前記低画素画像内の2つ毎の隣接した境界線の交差点を取得するステップと;
前記取得した交差点を、前記予め設定された圧縮率に従って前記原画像内に別個にマッピングして、対応するマッピング点を前記原画像内に生成するステップと;
前記原画像内にマッピングされた前記マッピング点を連続的に連結し、前記連結後に生成された四角形を、前記原画像内に含まれる対象画像として判定するステップと;を備える、
第4の局面に記載の方法。
[第10の局面]
前記原画像内に含まれる前記対象画像を取得する前記ステップの後に、
射影変換アルゴリズムを用いて前記対象画像を修正するステップを更に備える、
第4の局面に記載の方法。
[第11の局面]
画像処理装置であって:
対象画像を含む原画像を取得するように構成された原画像取得部と;
予め設定された圧縮率に従って前記原画像に画像圧縮処理を実行し、前記画像圧縮処理後に低画素画像を取得するように構成された低画素画像取得部と;
前記低画素画像内の前記対象画像の境界線を判定するように構成された境界線判定部と;
前記低画素画像内の前記判定された境界線を前記原画像内にマッピングして、前記原画像内に含まれる前記対象画像を取得するように構成された対象画像取得部と;を備える、
画像処理装置。
[第12の局面]
前記低画素画像取得部は、具体的に:
前記予め設定された圧縮率に従って、圧縮後の各画素点の位置を判定し;
高速バイリニア補間アルゴリズムを用いて前記原画像に画像圧縮処理を実行して、圧縮後の各画素点の画素値を取得し;
圧縮後の各画素点の前記画素値及び前記位置に従って、前記低画素画像を生成する;ように構成された、
第11の局面に記載の装置。
[第13の局面]
前記低画素画像取得部により、高速バイリニア補間アルゴリズムを用いて前記原画像に画像圧縮処理を実行して、圧縮後の各画素点の画素値を取得することは、具体的に:
前記予め設定された圧縮率に従って、前記原画像内に含まれる全ての原画素点から、圧縮後の各画素点に対応する4つの原画素点を判定することと;
圧縮後の各画素点に対応する前記4つの原画素点から、第1の方向への2対の原画素点と、第2の方向への2対の原画素点とを判定することであって、前記第1の方向は横方向、前記第2の方向は縦方向であり、又は、前記第1の方向は縦方向、前記第2の方向は横方向である、判定することと;
前記第1の方向への圧縮後の、各画素点の前記2対の原画素点にそれぞれ対応する第1補間を取得し、前記取得した2つの第1補間を初期補間とすること;又は、前記第2の方向への圧縮後の、各画素点の前記2対の原画素点にそれぞれ対応する第2補間を取得し、前記取得した2つの第2補間を初期補間とすることと;
圧縮後の各画素点に対応する前記初期補間に従って、圧縮後の各画素点に対応する補間を算出し、又、前記算出した圧縮後の各画素点に対応する補間に従って圧縮後の各画素点の前記画素値を判定することと;を備える、
第12の局面に記載の装置。
[第14の局面]
前記境界線判定部は:
前記低画素画像から検出対象領域を判定し;
前記対象画像の前記境界線を判定するために、前記検出対象領域内の2つ毎の隣接した画素点間の勾配値に従って、前記検出対象領域に境界線検出処理を実行する;ように構成された、
第11の局面乃至第13の局面のいずれか1項に記載の装置。
[第15の局面]
前記境界線判定部によって、前記低画素画像から検出対象領域を判定することは、具体的に:
前記低画素画像を2色のみを備えたバイナリ画像へ変換するために前記低画素画像をバイナリ化することと;
前記バイナリ画像内に含まれる少なくとも1本のエッジラインを取得するために、前記バイナリ画像にエッジ検出処理を実行することと;
各エッジラインを別個に拡大することと;
連結領域を取得するために、各々の拡大されたエッジラインを連結することと;
特定領域を取得するために、前記連結領域を、各々の連結領域の位置情報にそれぞれ従ってスクリーニングすることであって、前記特定領域は、前記対象画像内の特定のグラフィック部分を含む領域である、スクリーニングすることと;
前記低画素画像内の前記特定領域以外の領域を前記検出対象領域として判定することと;を備える、
第14の局面に記載の装置。
[第16の局面]
前記バイナリ画像に前記エッジ検出処理を実行する前に、予め設定されたガウス・スムージングパラメータを用いて前記バイナリ画像にガウス・スムージングを実行するように構成されたガウス・スムージング部を更に備える、
第15の局面に記載の装置。
[第17の局面]
前記対象画像の前記境界線を判定するために、前記境界線判定部により、検出対象領域内の2つ毎の隣接した画素点間の勾配値に従って、前記検出対象領域に境界線検出を実行することは、具体的に:
前記低画素画像を2色のみを含むバイナリ画像へ変換するために、前記低画素画像をバイナリ化することと;
以下の演算を任意方向に実行することであって、前記以下の演算は、前記任意方向において前記バイナリ画像の前記検出対象領域内の2つ毎の隣接した画素点間の勾配値を、前記任意方向に対応する予め設定された初期勾配閾値と別個に比較すること、及び、前記比較結果に従って前記任意方向にて初期境界線を取得すること、である演算を任意方向に実行することと;
各方向にて取得した前記初期境界線の数に従って、前記対象画像の前記境界線をそれぞれ判定することと;を備える、
第14の局面に記載の装置。
[第18の局面]
各方向にて取得した前記初期境界線の数に従って、前記対象画像の前記境界線をそれぞれ判定することは、具体的に:
任意方向への検出結果を得るために、次の演算を実行することを備え;
前記演算は:
前記任意方向への前記少なくとも2本の初期境界線から前記任意方向への境界線を取得するために、前記任意方向にて取得した初期境界線の数が少なくとも2本である場合に、前記任意方向への各初期境界線の位置情報に従って、前記任意方向への各初期境界線に直線検出を別個に実行する演算;又は
前記任意方向にて取得した前記初期境界線の数が2本未満である場合に、前記任意方向に対応する前記予め設定された初期勾配閾値を、予め設定された第1の勾配差に従って連続的に低減し、又、前記低減した初期勾配閾値を用いて、前記任意方向にて取得した前記初期境界線の数が少なくとも2本になるまで、前記任意方向にて前記バイナリ領域の前記検出対象領域を検出する演算;である、
第17の局面に記載の装置。
[第19の局面]
前記対象画像取得部は、具体的に:
前記低画素画像内に含まれる2つ毎の隣接した境界線の交差点を取得し;
前記取得した交差点を、前記予め設定された圧縮率に従って、前記原画像内に別個にマッピングし;
前記原画像内にマッピングされた前記点を連続的に連結し、前記連結後に生成された四角形を前記原画像内に含まれる対象画像として判定する;ように構成された、
第14の局面に記載の装置。
[第20の局面]
前記原画像内に含まれる前記対象画像の取得後に、射影変換アルゴリズムを用いて前記対象画像を修正するように構成された修正部を更に備える、
第14の局面に記載の装置。
図1
図2
図3
図4
図5a
図5b
図6
図7
図8
図9