特許第6244787号(P6244787)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ カシオ計算機株式会社の特許一覧

特許6244787画像認識装置、画像認識方法および画像認識プログラム
<>
  • 特許6244787-画像認識装置、画像認識方法および画像認識プログラム 図000002
  • 特許6244787-画像認識装置、画像認識方法および画像認識プログラム 図000003
  • 特許6244787-画像認識装置、画像認識方法および画像認識プログラム 図000004
  • 特許6244787-画像認識装置、画像認識方法および画像認識プログラム 図000005
  • 特許6244787-画像認識装置、画像認識方法および画像認識プログラム 図000006
  • 特許6244787-画像認識装置、画像認識方法および画像認識プログラム 図000007
  • 特許6244787-画像認識装置、画像認識方法および画像認識プログラム 図000008
  • 特許6244787-画像認識装置、画像認識方法および画像認識プログラム 図000009
  • 特許6244787-画像認識装置、画像認識方法および画像認識プログラム 図000010
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6244787
(24)【登録日】2017年11月24日
(45)【発行日】2017年12月13日
(54)【発明の名称】画像認識装置、画像認識方法および画像認識プログラム
(51)【国際特許分類】
   H04N 5/21 20060101AFI20171204BHJP
   G06T 7/60 20170101ALI20171204BHJP
   H04N 1/409 20060101ALI20171204BHJP
【FI】
   H04N5/21
   G06T7/60 300A
   H04N1/40 101C
【請求項の数】19
【全頁数】18
(21)【出願番号】特願2013-204764(P2013-204764)
(22)【出願日】2013年9月30日
(65)【公開番号】特開2015-69530(P2015-69530A)
(43)【公開日】2015年4月13日
【審査請求日】2016年8月30日
(73)【特許権者】
【識別番号】000001443
【氏名又は名称】カシオ計算機株式会社
(74)【代理人】
【識別番号】100074099
【弁理士】
【氏名又は名称】大菅 義之
(72)【発明者】
【氏名】手島 義裕
【審査官】 佐田 宏史
(56)【参考文献】
【文献】 特開2007−315967(JP,A)
【文献】 特開平11−184445(JP,A)
【文献】 井上 育徳、辻原 進,“CRT投写型ディスプレイ用オートセットアップ方式”,画像情報工学と放送技術,日本,社団法人テレビジョン学会,1995年 1月20日,Vol.49, No.1,pp.73-77
(58)【調査した分野】(Int.Cl.,DB名)
H04N 1/40−1/409,5/20−5/217
G06T 1/00,5/00,5/20,7/00−7/90
(57)【特許請求の範囲】
【請求項1】
所定の情報を示すアイコンである表示画像を撮影する撮影手段と、
前記撮影手段が前記表示画像を撮影して得た撮影画像において、前記表示画像の表示特性と前記撮影手段の構造に起因して生じる色縞雑音を除去する色縞雑音除去手段と、
前記色縞雑音が除去されて得られる縞除去画像中の前記表示画像を認識する画像認識手段と、
を備えることを特徴とする画像認識装置。
【請求項2】
前記アイコンは白黒データである、
ことを特徴とする請求項1に記載の画像認識装置。
【請求項3】
前記表示画像は、前記アイコンと、前記色縞雑音の向きと異なる向きの線で構成され前記アイコンの周囲に配置されるアイコン枠とから構成され、
前記縞除去画像または前記撮影画像から前記アイコン枠を検出することにより、前記アイコンの位置合せを行う位置合せ手段をさらに備える、
ことを特徴とする請求項1又は2に記載の画像認識装置。
【請求項4】
前記アイコン枠はひし形の枠である、
ことを特徴とする請求項3に記載の画像認識装置。
【請求項5】
前記アイコン枠は円形の枠である、
ことを特徴とする請求項3に記載の画像認識装置。
【請求項6】
所定の情報を示す表示画像を撮影する撮影手段と、
前記撮影手段が前記表示画像を撮影して得た撮影画像において、前記表示画像の表示特性と前記撮影手段の構造に起因して生じる色縞雑音を除去する色縞雑音除去手段と、
前記色縞雑音が除去されて得られる縞除去画像中の前記表示画像を認識する画像認識手段と、
を備え
前記表示画像はデジタルミラーデバイスを備えた投影装置によって投影面上に投影された画像である、
ことを特徴とする画像認識装置。
【請求項7】
所定の情報を示す表示画像を撮影する撮影手段と、
前記撮影手段が前記表示画像を撮影して得た撮影画像において、前記表示画像の表示特性と前記撮影手段の構造に起因して生じる色縞雑音を除去する色縞雑音除去手段と、
前記色縞雑音が除去されて得られる縞除去画像中の前記表示画像を認識する画像認識手段と、
を備え
前記画像認識手段は、前記縞除去画像中の前記表示画像を、前記表示画像と同じ表示画像が登録されている画像データベース上の各登録画像と照合して、撮影した前記表示画像を認識し、
前記画像認識手段は、前記撮影画像中の前記表示画像と前記画像データベース中の前記各登録画像との照合において、エッジベース特徴量を用いた類似度を評価するとともに、
前記画像認識手段は、前記画像データベースに登録されている前記登録画像から作成したマスク画像を前記縞除去画像に適用して得られる画像領域から前記エッジベース特徴量を算出する、
ことを特徴とする画像認識装置。
【請求項8】
所定の情報を示す表示画像を撮影する撮影手段と、
前記撮影手段が前記表示画像を撮影して得た撮影画像において、前記表示画像の表示特性と前記撮影手段の構造に起因して生じる色縞雑音を除去する色縞雑音除去手段と、
前記色縞雑音が除去されて得られる縞除去画像中の前記表示画像を認識する画像認識手段と、
を備え
前記画像認識手段は、前記縞除去画像中の前記表示画像を、前記表示画像と同じ表示画像が登録されている画像データベース上の各登録画像と照合して、撮影した前記表示画像を認識し、
前記画像認識手段は、前記撮影画像中の前記表示画像と前記画像データベース中の前記各登録画像との照合において、エッジベース特徴量を用いた類似度を評価するとともに、
前記画像認識手段は、前記撮影画像または前記縞除去画像から作成したマスク画像を前記縞除去画像に適用して得られる画像領域から前記エッジベース特徴量を算出する、
ことを特徴とする画像認識装置。
【請求項9】
前記画像データベースは前記画像認識装置に内蔵される、
ことを特徴とする請求項7又は8に記載の画像認識装置。
【請求項10】
前記画像データベースは前記画像認識装置とは異なるサーバ装置に内蔵され、
前記画像認識手段は、前記サーバ装置内の前記画像データベースと通信することにより、前記表示画像を認識する処理を実行する、
ことを特徴とする請求項7又は8に記載の画像認識装置。
【請求項11】
前記マスク画像は、前記撮影画像の色成分を除去した後に、エッジ抽出した第1のデータと、前記撮影画像の色相成分から抽出したエッジを膨張した第2のデータから作成する、
ことを特徴とする請求項7又は8に記載の画像認識装置。
【請求項12】
前記エッジベース特徴量は、HOG特徴量である、
ことを特徴とする請求項7乃至11の何れか一項に記載の画像認識装置。
【請求項13】
所定の情報を示す表示画像を撮影する撮影手段と、
前記撮影手段が前記表示画像を撮影して得た撮影画像において、前記表示画像の表示特性と前記撮影手段の構造に起因して生じる色縞雑音を除去する色縞雑音除去手段と、
前記色縞雑音が除去されて得られる縞除去画像中の前記表示画像を認識する画像認識手段と、
を備え
前記色縞雑音除去手段は、前記撮影画像の色成分を除去する、
ことを特徴とする画像認識装置。
【請求項14】
前記色縞雑音除去手段は、前記撮影画像の画素ごとに、HSV色空間の彩度値を0にする処理を実行し、前記縞除去画像を生成する、
ことを特徴とする請求項13に記載の画像認識装置。
【請求項15】
前記色縞雑音除去手段は、前記撮影画像の画素ごとに、R成分値、G成分値、およびB成分値を当該各成分値の中の最大値で置き換える処理を実行し、前記縞除去画像を生成する、
ことを特徴とする請求項13に記載の画像認識装置
【請求項16】
所定の情報を示すアイコンである表示画像を撮影し、
前記表示画像を撮影して得た撮影画像において、前記表示画像の表示特性と前記撮影手段の構造に起因して生じる色縞雑音を除去し、
前記色縞雑音が除去されて得られる縞除去画像中の前記表示画像を認識する、
ことを特徴とする画像認識方法。
【請求項17】
画像認識装置のコンピュータに、
所定の情報を示すアイコンである表示画像を撮影する撮影ステップと、
前記撮影ステップで前記表示画像を撮影して得た撮影画像において、前記表示画像の表示特性と前記撮影手段の構造に起因して生じる色縞雑音を除去する色縞雑音除去ステップと、
前記色縞雑音が除去されて得られる縞除去画像中の前記表示画像を認識する画像認識ステップと、
を実行させるための画像認識プログラム。
【請求項18】
所定の情報を示す表示画像を撮影し、
前記表示画像を撮影して得た撮影画像において、前記表示画像の表示特性と前記撮影手段の構造に起因して生じる色縞雑音を除去し、
前記色縞雑音が除去されて得られる縞除去画像中の前記表示画像を認識し、
前記色縞雑音の除去は、前記撮影画像の色成分を除去する、
ことを特徴とする画像認識方法。
【請求項19】
画像認識装置のコンピュータに、
所定の情報を示す表示画像を撮影する撮影ステップと、
前記撮影ステップで前記表示画像を撮影して得た撮影画像において、前記表示画像の表示特性と前記撮影手段の構造に起因して生じる色縞雑音を除去する色縞雑音除去ステップと、
前記色縞雑音が除去されて得られる縞除去画像中の前記表示画像を認識する画像認識ステップと、
を実行させ、
前記色縞雑音除去ステップは、前記撮影画像の色成分を除去する、
像認識プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像認識技術に関する。
【背景技術】
【0002】
従来、被認識画像を入力し、認識テンプレート画像を記憶したデータベースから認識テンプレート画像を読み出し、この認識テンプレート画像を被認識画像と比較することにより認識を行う技術が知られている(例えば特許文献1)。
【0003】
このような画像認識においては、認識対象となる画像に含まれる雑音成分をいかに有効に除去するかが、画像の認識精度を高める上で重要である。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2004−151771号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ここで、画像認識の対象となる表示画像をデジタルカメラ等の撮影装置によって取り込む場合、表示画像の表示特性と撮影装置の構造に起因して生じる色縞雑音が問題となることがある。特に、デジタルミラーデバイス(DMD:Digital Mirror Device)を備えたDLP(Digital Light Processing)(「DLP」は米国Texas Instruments Incorporatedの登録商標)と呼ばれる投影装置(プロジェクタ)によって投影面(スクリーン)上に投影された画像を、自動露光制御を行うスマートフォン内蔵カメラ等で撮影した場合に、色縞雑音が顕著に現れる。
【0006】
DLP投影装置では、デジタルミラーデバイスにおけるミラーのオンとオフの時間比率を制御することにより、投影面に投影される表示画像の輝度を制御する。さらに、DLP投影装置でよく使用される単板式の投影方式では、R、G、Bの光を高速で切り替えることにより、色を制御する。投影面に投影される表示画像では、非常に短い時間で観察すると、ミラーがオンで光があたっている瞬間とミラーがオフで光があたっていない瞬間や、R、G、B単色で表示されている瞬間が存在し、人間の目で見るとそれらの時間比が表示画像の輝度に感じ、R、G、Bを合成した色が表示画像の色として感じる。一方、自動露光制御の撮影装置では、表示画像の明るさに応じて、表示画像上のライン毎に露光タイミングを制御して撮影画像をライン毎に取り込む。従って、あるラインタイミングにおいては光が投影面にあたっている瞬間に表示画像の該当するライン上の各画素値が取り込まれ、他のラインタイミングにおいては光が投影面にあたっていない瞬間に表示画像の該当するライン上の各画素値が取り込まれる可能性が生じる。また、R、G、B単色が投影面にあたっている瞬間に表示画像の該当するライン上の各画素値が取り込まれる可能性が生じる。この結果、撮影画像上で、明るく撮影されるラインと暗く撮影されるラインや、R、G、B単色で撮影されるラインが存在することにより、それが色縞雑音として現れる。
【0007】
このような色縞雑音は、その他の表示画像の表示特性と撮影装置の構造に起因しても現れる可能性がある。
【0008】
そして、この色縞雑音は、撮影画像に基づいて画像認識を行う場合に、認識精度を低下させる。
【0009】
このような色縞雑音は、投影装置による輝度制御タイミングと撮影装置による露光制御タイミングの組合せによりほぼランダムに発生する。このため、従来は、撮影装置で撮影した撮影画像上で発生する色縞雑音を有効に除去する従来技術は知られておらず、色縞雑音を有効に除去できないという問題点を有していた。
【0010】
本発明は、撮影画像に基づいて撮影画像中の表示画像を認識する画像認識装置において、表示画像の表示特性と撮影装置の構造に起因して生じる色縞雑音を有効に除去して、画像認識の精度を向上させることを目的とする。
【課題を解決するための手段】
【0011】
態様の一例では、画像認識装置であって、所定の情報を示すアイコンである表示画像を撮影する撮影手段と、撮影手段が表示画像を撮影して得た撮影画像において、表示画像の表示特性と撮影手段の構造に起因して生じる色縞雑音を除去する色縞雑音除去手段と、色縞雑音が除去されて得られる縞除去画像中の表示画像を認識する画像認識手段とを備える。
態様の他の一例では、画像認識装置であって、所定の情報を示す表示画像を撮影する撮影手段と、撮影手段が表示画像を撮影して得た撮影画像において、表示画像の表示特性と撮影手段の構造に起因して生じる色縞雑音を除去する色縞雑音除去手段と、色縞雑音が除去されて得られる縞除去画像中の表示画像を認識する画像認識手段とを備え、前記表示画像はデジタルミラーデバイスを備えた投影装置によって投影面上に投影された画像である。
態様の他の一例では、画像認識装置であって、所定の情報を示す表示画像を撮影する撮影手段と、撮影手段が表示画像を撮影して得た撮影画像において、表示画像の表示特性と撮影手段の構造に起因して生じる色縞雑音を除去する色縞雑音除去手段と、色縞雑音が除去されて得られる縞除去画像中の表示画像を認識する画像認識手段とを備え、前記画像認識手段は、前記縞除去画像中の前記表示画像を、前記表示画像と同じ表示画像が登録されている画像データベース上の各登録画像と照合して、撮影した前記表示画像を認識し、前記画像認識手段は、前記撮影画像中の前記表示画像と前記画像データベース中の前記各登録画像との照合において、エッジベース特徴量を用いた類似度を評価するとともに、前記画像認識手段は、前記画像データベースに登録されている前記登録画像から作成したマスク画像を前記縞除去画像に適用して得られる画像領域から前記エッジベース特徴量を算出する。
態様の他の一例では、画像認識装置であって、所定の情報を示す表示画像を撮影する撮影手段と、撮影手段が表示画像を撮影して得た撮影画像において、表示画像の表示特性と撮影手段の構造に起因して生じる色縞雑音を除去する色縞雑音除去手段と、色縞雑音が除去されて得られる縞除去画像中の表示画像を認識する画像認識手段とを備え、前記画像認識手段は、前記縞除去画像中の前記表示画像を、前記表示画像と同じ表示画像が登録されている画像データベース上の各登録画像と照合して、撮影した前記表示画像を認識し、前記画像認識手段は、前記撮影画像中の前記表示画像と前記画像データベース中の前記各登録画像との照合において、エッジベース特徴量を用いた類似度を評価するとともに、前記画像認識手段は、前記撮影画像または前記縞除去画像から作成したマスク画像を前記縞除去画像に適用して得られる画像領域から前記エッジベース特徴量を算出する。
態様の他の一例では、画像認識装置であって、所定の情報を示す表示画像を撮影する撮影手段と、撮影手段が表示画像を撮影して得た撮影画像において、表示画像の表示特性と撮影手段の構造に起因して生じる色縞雑音を除去する色縞雑音除去手段と、色縞雑音が除去されて得られる縞除去画像中の表示画像を認識する画像認識手段とを備え、前記色縞雑音除去手段は、前記撮影画像の色成分を除去する。
【発明の効果】
【0012】
本発明によれば、撮影画像に基づいて撮影画像中の表示画像を認識する画像認識装置において、表示画像の表示特性と撮影装置の構造に起因して生じる色縞雑音を有効に除去して、画像認識の精度を向上させることが可能となる。
【図面の簡単な説明】
【0013】
図1】本発明の一実施形態に係る画像認識装置のブロック図である。
図2】マスク枠の例を示す図である。
図3】マスク画像の説明図である。
図4】第1の画像認識処理の説明図である。
図5】第2の画像認識処理におけるマスク画像の生成処理の説明図である。
図6】画像認識装置のハードウェア構成例を示すブロック図である。
図7】第1の画像認識処理を含む本実施形態の処理例を示すフローチャートである。
図8】第2の画像認識処理を含む本実施形態の処理例を示すフローチャートである。
図9】HOG特徴量算出処理の例を示すフローチャートである。
【発明を実施するための形態】
【0014】
以下、本発明を実施するための形態について図面を参照しながら詳細に説明する。
図1は、本発明の一実施形態に係る画像認識装置100のブロック図である。本実施形態の画像認識装置100は、撮影手段101、色縞雑音除去手段102、画像認識手段103、および位置合せ手段107を備える。
【0015】
撮影手段101は、所定の情報を示す表示画像104を撮影する。この表示画像104は例えば、所定の情報を示すアイコンである。また、このアイコンは例えば、白黒データである。表示画像104は例えば、デジタルミラーデバイスを備えた投影装置によって投影面上に投影された画像である。
【0016】
色縞雑音除去手段102は、撮影手段101が表示画像104を撮影して得た撮影画像105において、表示画像104の表示特性と撮影手段101の構造に起因して生じる色縞雑音を除去する。表示画像104の表示特性は例えば、デジタルミラーデバイスを備えた投影装置が投影面上に表示画像104を投影させるときのミラーのオンとオフのタイミング特性である。撮影手段101の構造は例えば、撮影手段101におけるラインスキャン時の露光タイミングを制御する構造である。ここで、撮影画像105に現れる色縞雑音は、投影に使用する光源の色や、それらを混ぜた色として表れる。そのため、色縞雑音除去手段102は、撮影画像105の画素毎の色成分の除去により色縞雑音の除去を行う。より具体的には、色縞雑音除去手段102は、撮影画像105の画素ごとに、HSV色空間の彩度値(S値)を0にする処理を実行し、縞除去画像106を生成する。あるいは、色縞雑音除去手段102は、撮影画像105の画素ごとに、R成分値、G成分値、およびB成分値を各成分値の中の最大値で置き換える処理を実行し、縞除去画像106を生成する。この結果、図1に例示されるような色縞雑音の影響を受けた撮影画像105から、その色縞雑音の影響を軽減させた図1に例示されるような縞除去画像106を生成することができる。
【0017】
画像認識手段103は、色縞雑音が除去されて得られる縞除去画像106中の表示画像104を認識する。画像認識手段103は例えば、縞除去画像106中の表示画像104を、表示画像104と同じ表示画像104が登録されている画像データベース108上の各登録画像と照合して、撮影した表示画像104を認識する。画像データベース108は例えば、画像認識装置100に内蔵される。あるいは、画像データベース108は、画像認識装置100とは異なる特には図示しないサーバ装置に内蔵される。この場合、画像認識手段103は、サーバ装置内の画像データベース108と通信することにより、表示画像104を認識する処理を実行する。
【0018】
ここで、例えば色縞雑音除去手段102と画像認識手段103の間(撮影手段101と色縞雑音除去手段102の間でもよい)に、位置合せ手段107を備えてよい。この場合、表示画像104は、アイコンと、色縞雑音の向きと異なる向きの線で構成されアイコンの周囲に配置されるアイコン枠とから構成され、位置合せ手段107は、縞除去画像106(または撮影画像105)からアイコン枠を検出することにより、アイコンの位置合せを行う。この位置合せの処理は、画像認識手段103が画像認識のために算出する特徴量が、表示画像104の位置等により変化してしまうことを防止するための処理である。画像認識手段103が算出する特徴量が、表示画像104の位置やサイズに不変な特徴量の場合は、位置合せ手段107は備えなくてもよい。アイコン枠としては例えば、図2(a)に示されるひし形の枠が使用される。この形状は、色縞雑音の縞と平行する成分を含まないため、アイコン枠の検出の際に色縞雑音の影響を受けにくい。位置合せ処理では、まず、ハフ変換によりひし形の枠の四辺の直線が検出され、検出された直線の交点(ひし形の頂点)が算出される。そして、算出された4つの交点を使って、射影変換により位置合せが行われる。アイコン枠の形状としては、図2(a)に示されるひし形以外にも、図2(b)に示される円形など、色縞雑音の縞と平行な成分を含まない(検出に使用しない)形状であればよい。
【0019】
図1の構成において、画像認識手段103は例えば、撮影画像105中の表示画像104と画像データベース108中の各登録画像との照合において、HOG(Histogram of Oriented Gradients:輝度勾配ヒストグラム)特徴量等のエッジベース特徴量を用いた類似度を評価する。
【0020】
エッジベース特徴量を用いた類似度の評価に関する画像認識手段103の具体的な動作例として、画像認識手段103が第1の画像認識処理を実行する場合の動作について説明する。この場合、画像認識手段103は、画像データベース108に登録されている登録画像から作成した各マスク画像を縞除去画像106にそれぞれ適用して得られる各画像領域から各エッジベース特徴量を算出する。
図3は、マスク画像の説明図、図4は、第1の画像認識処理の説明図である。
【0021】
図3は、表示画像104とそれに対応するマスク画像301の関係を示す図である。マスク画像301が表示画像104に適用されたときに、図3(b)に例示される白い色の部分は表示画像104上の画素をそのまま出力し、図3(b)に例示される黒い色の部分は表示画像104上の画素はマスクして出力しない。
【0022】
ここで、画像データベース108には、表示画像104のさまざまなパターンのアイコンと同じアイコンが登録されている。この登録アイコンの種類数を例えばN種類とする。すなわち、画像データベース108には、N種類の登録アイコンが登録されている。
【0023】
また、画像認識手段103が第1の画像認識処理を実行する場合には、画像データベース108には、N種類の登録アイコンに対応して、それぞれのアイコンの輪郭部分以外の部分をマスクするように作成された、例えば図4に示されるN種類のマスク画像401(#1)から401(#N)が登録されている。
【0024】
画像認識手段103は、図4の各マスク画像401(#1)〜401(#N)をそれぞれ、縞除去画像106に適用して得られる画像領域から、特徴量402(#1)〜402(#N)を算出する。この特徴量が例えばHOG特徴量であれば、特徴量402(#1)〜402(#N)はそれぞれ、輝度勾配ヒストグラムとなる。
【0025】
ここで、例えば図4において、マスク画像401(#1)のように、縞除去画像106上のアイコンによく一致するマスク画像が縞除去画像106に適用された場合には、それより算出される特徴量402(#1)は、縞除去画像106中のアイコンの特徴を良く示す特徴量となる。この特徴量402(#1)について、画像データベース108に記憶されているマスク画像401(#1)に対応する登録アイコンの特徴量との間で距離計算が実行された場合には、その計算結果は非常に近い距離を示すことになる。
【0026】
一方、例えば図4において、マスク画像401(#2)〜401(#N)のように、縞除去画像106上のアイコンに一致しないマスク画像が縞除去画像106に適用された場合には、それより算出される特徴量402(#2)〜402(#N)は、縞除去画像106中のアイコンの特徴をほとんど示さないものとなる。これらの特徴量402(#2)〜402(#N)が、画像データベース108に記憶されている各マスク画像401(#1)〜401(#N)に対応する各登録アイコンの各特徴量との間で各距離計算が実行された場合には、どの計算結果も遠い距離を示すことになる。
【0027】
以上のようにして、画像認識手段103が第1の画像認識処理を実行する場合、マスク画像401(#1)〜401(#N)は、縞除去画像106上のアイコンの存在をより際立たせる効果を有するとともに、色縞雑音の影響をさらに除去する効果を有し、これにより、画像認識率を向上させることが可能となる。
【0028】
次に、エッジベース特徴量を用いた類似度の評価に関する画像認識手段103の具体的な他の動作例として、画像認識手段103が第2の画像認識処理を実行する場合の動作について説明する。この場合、画像認識手段103は、撮影画像105または縞除去画像106自身から作成したマスク画像を縞除去画像106に適用して得られる画像領域からエッジベース特徴量を算出する。
【0029】
この場合のマスク画像は、次のようにして生成される。図5は、第2の画像認識処理におけるマスク画像の生成処理の説明図である。まず、図1の色縞雑音除去手段102により、撮影画像105から色縞雑音成分が除去されて、縞除去画像106が得られる。次に、この縞除去画像106からエッジ成分501が抽出されて第1のデータ501とされる。一方、撮影画像105から色相成分502が抽出され、その色相成分502からエッジ成分503が抽出され、さらにそのエッジ成分503中の各エッジ部分が膨張させられてエッジ膨張成分504が作成されて第2のデータ504とされる。この第2のデータのエッジ膨張成分504によって、第1のデータのエッジ成分501をマスキングすることにより、色縞雑音の影響が除かれたアイコンおよびアイコン枠部分のマスク画像505が算出される。
【0030】
画像認識手段103は、以上のようにして撮影画像105または縞除去画像106自身から作成したマスク画像505を縞除去画像106に適用して得られる画像領域から、エッジベース特徴量を算出する。この特徴量が例えばHOG特徴量であれば、特徴量506は、輝度勾配ヒストグラムとなる。
【0031】
図5において、マスク画像505は、撮影画像105または縞除去画像106自身から作成されているため、縞除去画像106上のアイコンによく一致するマスク画像となっている。従って、そのマスク画像505が縞除去画像106に適用された場合には、それより算出される特徴量506は、縞除去画像106中のアイコンの特徴を良く示す特徴量となる。この特徴量506について、画像データベース108に記憶されている各登録アイコンの各特徴量との間で各距離計算が実行されることにより、縞除去画像106中のアイコンに最も良く似たアイコンを含む登録アイコンの特徴量との距離を最も小さくすることができる。これにより、画像認識手段103は、正しい画像認識結果を得ることが可能となる。
【0032】
以上のようにして、図1に示される画像認識装置100により、表示画像104の表示特性と撮影手段101の構造に起因して生じる色縞雑音を有効に除去して、画像認識の精度を向上させることが可能となる。
【0033】
図6は、図1の画像認識装置100のハードウェア構成例を示すブロック図である。
【0034】
この画像認識装置100は例えば、いわゆるスマートフォンなどの携帯情報端末であるコンピュータシステム上に実現される。
【0035】
画像認識装置100は、CPU(Central Processing Unit:中央演算処理装置)602と、ROM(Read Only Memory)603と、RAM(Random Access Memory)604を備える。また、画像認識装置100は、ソリッド記憶装置等の外部記憶装置605と、通信インタフェース606と、タッチパネルディスプレイ装置などの入力装置607および表示装置608を備える。さらに、画像認識装置100は、マイクロSDメモリカードやUSB(Universal Serial Bus)メモリカードなどの可搬記録媒体160をセット可能な可搬記録媒体駆動装置609を備える。撮像装置612は、静止画像やビデオ画像を撮像することのできるデジタルカメラ機構であり、レンズ、オートフォーカス駆動制御装置、露出制御装置、撮像センサ等を備える。上述の各機器602〜609および612は、バス611によって相互に接続される。
【0036】
ROM603には、スマートフォン全体の一般的な動作を制御するプログラムのほか、後述する図7から図9のフローチャートによって示される画像認識処理の制御プログラムが記憶されている。CPU602は、ROM603から、この制御プログラムを読み出し、RAM604をワークメモリとして実行することにより、図1のブロックで示される画像認識機能が実現される。この結果、例えばユーザが、撮像装置612によってアイコンを含む表示画像104を撮像して得られる撮影画像105から、アイコンを認識する画像認識処理が実行される。図1の画像データベース108は、図6の外部記憶装置605に内蔵されてもよいが、例えば特には図示しないインターネット上のサーバ装置に内蔵されてもよい。この場合には、CPU602は、通信インタフェース606からインターネットを介してサーバ装置内の画像データベース108と通信をして、画像認識処理を実行する。CPU602は、アイコン等の画像認識結果を、表示装置608に表示させる。
【0037】
図7は、図6のCPU602が実行する、前述した画像認識手段103による第1の画像認識処理(図4参照)を含む本実施形態の処理例を示すフローチャートである。この処理は、CPU602が、ROM603またはRAM604に記憶された制御プログラムを実行する動作として実現される。
【0038】
まず、CPU602は、前処理を実行する(ステップS701)。ここでは、CPU602は、図1で前述した撮影画像105の取得(撮影手段101の機能)と、撮影画像105からの色縞雑音の除去による縞除去画像106の生成(色縞雑音除去手段102の機能)、および位置合わせの処理(位置合せ手段107の機能)を実行する。
【0039】
具体的には、CPU602は、撮像装置612を制御することにより、撮影画像105を、例えばRAM604に取得する。
【0040】
色縞雑音の除去では、CPU602は、前述したように、取得した撮影画像105の画素ごとに、HSV色空間の彩度値(S値)を0にする処理、あるいはR成分値、G成分値、およびB成分値を各成分値の中の最大値で置き換える処理を実行する。CPU602は、この結果得られる縞除去画像106を、例えばRAM604に記憶させる。
【0041】
位置合わせの処理では、CPU602は、前述したように、ハフ変換により例えばひし形(図2(a)参照)の枠の四辺の直線を検出し、検出した直線の交点(ひし形の頂点)を算出し、その4つの交点を使って射影変換により位置合せを行う。
【0042】
次に、CPU602は、前述した第1の画像認識処理を実行する(ステップS702→S703→S704の繰返し処理→S705)。
【0043】
まず、CPU602は、外部記憶装置605に記憶されたまたは通信インタフェース606からアクセス可能な画像データベース108から、各登録アイコンに対応するマスク画像401(#1〜#N)(図4参照)を順次取得し、取得した1つのマスク画像401を縞除去画像106に適用し、その結果得られる画像に対して、特徴量抽出を実行する(ステップS702)。特徴量抽出の詳細については、図9で後述する。
【0044】
CPU602は、マスク画像401に対応して得た特徴量402(#1〜#Nのうちのいずれか)(図4参照)について、画像データベース108内の各登録アイコンの各特徴量との間で特徴量距離を計算する(ステップS703)。
【0045】
CPU602は、全ての登録アイコンについて処理が終了したか否かを判定する(ステップS704)。
【0046】
ステップS704の判定がNOならば、CPU602は、さらに次の登録アイコンのマスク画像401を用いて、ステップS702とS703の処理を繰り返し実行する。
【0047】
ステップS704の判定がYESになったら、CPU602は、ステップS703の特徴量距離計算の結果が最も近い距離を示したときの画像データベース108上の登録アイコンを、認識結果として選択し、表示装置608に出力する(ステップS705)。
【0048】
図8は、図6のCPU602が実行する、前述した画像認識手段103による第2の画像認識処理(図5参照)を含む本実施形態の処理例を示すフローチャートである。この処理は、図7の場合と同様に、CPU602が、ROM603またはRAM604に記憶された制御プログラムを実行する動作として実現される。
【0049】
まず、CPU602は、前処理を実行する(ステップS801)。ここでの処理は、図7のステップS701と同様であり、CPU602は、撮影画像105の取得と、撮影画像105からの色縞雑音の除去による縞除去画像106の生成、および位置合わせの処理を実行する。
【0050】
次に、CPU602は、前述した第2の画像認識処理を実行する(ステップS802→S803→S804とS805の繰返し処理→S806)。
【0051】
まず、CPU602は、マスク画像505(図5参照)の生成処理を実行する。図5で説明したように、CPU602は、縞除去画像106から第1のデータであるエッジ成分501を抽出してRAM604に記憶する。一方、CPU602は、撮影画像105から色相成分502を抽出し、その色相成分502からエッジ成分503を抽出し、さらにそのエッジ成分503中の各エッジ部分を膨張さてエッジ膨張成分504を作成して第2のデータ504としてRAM604に記憶する。CPU602は、RAM604上の第2のデータのエッジ膨張成分504によって、RAM604上の第1のデータのエッジ成分501をマスキングすることにより、色縞雑音の影響が除かれたアイコンおよびアイコン枠部分のマスク画像505を算出し、RAM604に記憶させる。
【0052】
CPU602は、RAM604に生成したマスク画像505を縞除去画像106に適用し、その結果得られる画像に対して、特徴量抽出を実行する(ステップS803)。この処理は、図7のステップS702と異なり、1回だけ実行されればよい。特徴量抽出の詳細については、図9で後述する。
【0053】
CPU602は、マスク画像505に対応して得た特徴量506(図5参照)について、画像データベース108内の各登録アイコンの各特徴量との間で特徴量距離を計算する(ステップS804)。
【0054】
CPU602は、全ての登録アイコンについて処理が終了したか否かを判定する(ステップS805)。
【0055】
ステップS805の判定がNOならば、CPU602は、さらに次の登録アイコンについて、ステップS804の特徴量距離計算を繰り返し実行する。
【0056】
ステップS805の判定がYESになったら、CPU602は、ステップS804の特徴量距離計算の結果が最も近い距離を示したときの画像データベース108上の登録アイコンを、認識結果として選択し、表示装置608に出力する(ステップS806)。
【0057】
図9は、図7のステップS702または図8のステップS803の特徴量抽出の処理であるHOG特徴量算出処理の例を示すフローチャートである。
【0058】
HOG特徴量は、画像の局所領域から輝度勾配・輝度強度を算出して得られる特徴量であり、アイコンの大まかな形状を表現可能な特徴量である。
【0059】
CPU602はまず、マスク適用された後の画像をブロックに分割する(ステップS901)。
【0060】
次に、CPU602は、ブロックを画像内で移動させながら、ブロックをさらに分割したセル毎に、輝度勾配と輝度強度を算出する(ステップS902)。
【0061】
CPU602は、上記ブロック内のセル毎に、輝度勾配ヒストグラムのステップS902で算出した輝度勾配に対応する要素に、ステップS902で算出した輝度強度を累積してゆく(ステップS903)。
【0062】
次に、CPU602は、ブロックごとに輝度勾配ヒストグラムを正規化する(ステップS904)。正規化処理により輝度勾配ヒストグラムの形状を整えることができるので、明るさの変化に対応可能である。
【0063】
CPU602は、画像内の全ブロックについて処理が終了したか判定する(ステップS905)。
【0064】
ステップS905の判定がNOならば、CPU602は、次のブロックについて、ステップS902からS904の一連の処理を実行する。
【0065】
ステップS905の判定がYESになったら、CPU602は、HOG特徴量抽出の処理を終了する。
【0066】
以上のようにして、本実施形態では、前処理として色成分の除去をすることで、特徴量計算における色縞雑音の影響を軽減することが可能となる。
また、マスクを使用して特徴量の計算をすることで、特徴量に対する色縞雑音の影響をさらに軽減することが可能となる。
ここで、マスクを、登録アイコンから作成することで、色縞雑音の影響をより軽減することが可能となる。
あるいは、マスクを、撮影画像または縞除去画像から作成することで、特徴量の計算が1度ですむため、高速に認識処理を実行することが可能となる。
本実施形態では、色縞雑音の縞と平行な成分を含まない形状のアイコン枠を使用して位置合せを行うことにより、色縞雑音に影響されないアイコン枠の検出が可能となる。
【0067】
以上の実施形態に関して、更に以下の付記を開示する。
(付記1)
所定の情報を示す表示画像を撮影する撮影手段と、
前記撮影手段が前記表示画像を撮影して得た撮影画像において、前記表示画像の表示特性と前記撮影手段の構造に起因して生じる色縞雑音を除去する色縞雑音除去手段と、
前記色縞雑音が除去されて得られる縞除去画像中の前記表示画像を認識する画像認識手段と、
を備えることを特徴とする画像認識装置。
【0068】
(付記2)
前記表示画像は前記所定の情報を示すアイコンである、
ことを特徴とする付記1に記載の画像認識装置。
【0069】
(付記3)
前記アイコンは白黒データである、
ことを特徴とする付記2に記載の画像認識装置。
【0070】
(付記4)
前記表示画像はデジタルミラーデバイスを備えた投影装置によって投影面上に投影された画像である、
ことを特徴とする付記1乃至3の何れか一項に記載の画像認識装置。
【0071】
(付記5)
前記画像認識手段は、前記縞除去画像中の前記表示画像を、前記表示画像と同じ表示画像が登録されている画像データベース上の各登録画像と照合して、撮影した前記表示画像を認識する、
ことを特徴とする付記1乃至3の何れか一項に記載の画像認識装置。
【0072】
(付記6)
前記画像データベースは前記画像認識装置に内蔵される、
ことを特徴とする付記5に記載の画像認識装置。
【0073】
(付記7)
前記画像データベースは前記画像認識装置とは異なるサーバ装置に内蔵され、
前記画像認識手段は、前記サーバ装置内の前記画像データベースと通信することにより、前記表示画像を認識する処理を実行する、
ことを特徴とする付記5に記載の画像認識装置。
【0074】
(付記8)
前記表示画像は、前記アイコンと、前記色縞雑音の向きと異なる向きの線で構成され前記アイコンの周囲に配置されるアイコン枠とから構成され、
前記撮影画像から前記アイコン枠を検出することにより、前記アイコンの位置合せを行う位置合せ手段をさらに備える、
ことを特徴とする付記2又は3に記載の画像認識装置。
【0075】
(付記9)
前記アイコン枠はひし形の枠である、
ことを特徴とする付記8に記載の画像認識装置。
【0076】
(付記10)
前記アイコン枠は円形の枠である、
ことを特徴とする付記8に記載の画像認識装置。
【0077】
(付記11)
前記色縞雑音除去手段は、前記撮影画像の色成分を除去する、
ことを特徴とする付記1乃至10の何れか一項に記載の画像認識装置。
【0078】
(付記12)
前記色縞雑音除去手段は、前記撮影画像の画素ごとに、HSV色空間の彩度値を0にする処理を実行し、前記縞除去画像を生成する、
ことを特徴とする付記11に記載の画像認識装置。
【0079】
(付記13)
前記色縞雑音除去手段は、前記撮影画像の画素ごとに、R成分値、G成分値、およびB成分値を当該各成分値の中の最大値で置き換える処理を実行し、前記縞除去画像を生成する、
ことを特徴とする付記11に記載の投影画像認識システム。
【0080】
(付記14)
前記画像認識手段は、前記撮影画像中の前記表示画像と前記画像データベース中の前記各登録画像との照合において、エッジベース特徴量を用いた類似度を評価する、
ことを特徴とする付記5乃至7の何れか一項に記載の画像認識装置。
【0081】
(付記15)
前記画像認識手段は、前記画像データベースに登録されている前記登録画像から作成したマスク画像を前記縞除去画像に適用して得られる画像領域から前記エッジベース特徴量を算出する、
ことを特徴とする付記14に記載の画像認識装置。
【0082】
(付記16)
前記画像認識手段は、前記撮影画像または前記縞除去画像から作成したマスク画像を前記縞除去画像に適用して得られる画像領域から前記エッジベース特徴量を算出する、
ことを特徴とする付記14に記載の画像認識装置。
【0083】
(付記17)
前記マスク画像は、前記撮影画像の色成分を除去した後に、エッジ抽出した第1のデータと、前記撮影画像の色相成分から抽出したエッジを膨張した第2のデータから作成する、
ことを特徴とする付記16に記載の画像認識装置。
【0084】
(付記18)
前記エッジベース特徴量は、HOG特徴量である、
ことを特徴とする付記14乃至17の何れか一項に記載の画像認識装置。
【0085】
(付記19)
所定の情報を示す表示画像を撮影し、
前記表示画像を撮影して得た撮影画像において、前記表示画像の表示特性と前記撮影手段の構造に起因して生じる色縞雑音を除去し、
前記色縞雑音が除去されて得られる縞除去画像中の前記表示画像を認識する、
ことを特徴とする画像認識方法。
【0086】
(付記20)
コンピュータに、
所定の情報を示す表示画像を撮影する撮影ステップと、
前記撮影ステップで前記表示画像を撮影して得た撮影画像において、前記表示画像の表示特性と前記撮影手段の構造に起因して生じる色縞雑音を除去する色縞雑音除去ステップと、
前記色縞雑音が除去されて得られる縞除去画像中の前記表示画像を認識する画像認識ステップと、
を実行させるための画像認識プログラム。
【0087】
(付記21)
所定の情報を示す画像を投影する投影装置と、当該投影装置が投影した投影画面に映る前記画像を撮影し撮影した前記画像を認識する撮影装置と、からなる投影画像認識システムにおいて、
前記投影装置と前記撮影装置の構造に起因する撮影画像の色縞雑音を除去する色縞雑音除去手段を備える、
ことを特徴とする投影画像認識システム。
【符号の説明】
【0088】
100 画像認識装置
602 CPU
603 ROM
604 RAM
605 外部記憶装置
606 通信インタフェース
607 入力装置
608 表示装置
609 可搬記録媒体駆動装置
610 可搬記録媒体
611 バス
612 撮像装置
図1
図2
図3
図4
図5
図6
図7
図8
図9