【文献】
松田 紘、外2名,“大量の漫画画像に基づくパラパラアニメーションの生成”,インタラクション2011予稿集,日本,一般社団法人情報処理学会,2011年 3月10日,pp.1-2
【文献】
兒玉 松男,“静止画が動き出すような新しい映像体験を提供する「ARアプリケーション」”,BUSINESS COMMUNICATION,日本,株式会社ビジネスコミュニケーション社,2011年 1月 1日,Vol.48, No.1,pp.96-97
【文献】
鶴田 直也、外3名,“幼児向け折り紙作品の創作支援システム”,インタラクション2011予稿集,日本,一般社団法人情報処理学会,2011年 3月10日,pp.1-8
(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0009】
以下、本発明の好適な実施形態について添付の図面を参照しながら説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省く。
<第1実施形態>
[画像認識装置の全体構成]
まず、本発明の第1実施形態に係る画像認識装置について、
図1を参照しながら説明する。
図1は、第1実施形態に係る画像認識装置の機能構成図である。画像認識装置は、携帯端末、タブレット、ノートPC、その他の電子機器で構成されることができる。
【0010】
本実施形態に係る画像認識装置1は、画像読取部10、オブジェクト分割部11、内接円抽出部12、外接円設定部13、円弧データ生成部14、抽出部15、モデルデータベース16、判定部17を有している。
【0011】
画像読取部10は、画像を取り込み可能な装置を用いて画像を画像認識装置内に取り入れる。画像を取り込み可能な装置としては、撮像装置や読取装置が挙げられる。撮像装置としては、例えば、携帯端末に内臓されたカメラやビデオカメラ等が挙げられ、読取装置としては、例えば、スキャナ等が挙げられる。読み取られる画像は、子供が描いた塗り絵等の静止画像であってもよく、アニメーション等の動画像であってもよい。
【0012】
オブジェクト分割部11は、入力された静止画像や動画像の1フレームからウェーブレット(Wavelet)手法等による信号処理を用いたオブジェクトの抽出を行い、必要に応じて抽出したオブジェクトを複数のオブジェクトに分割する。
【0013】
例えば、
図3の犬の絵の例では、犬の顔部のみの絵が撮影された画像が入力された場合、犬の顔部のオブジェクトBに対する円弧データが解析される。ここでは顔部のオブジェクトBに加えて、耳部のオブジェクトCに対する円弧データの解析も行われる。
【0014】
一方、犬の体全体の絵が撮影された画像が入力された場合、犬の顔部に加え、犬の体全体のオブジェクトAに対する円弧データが解析される。解析の結果、オブジェクトAに対する円弧データは、犬の体全体についての特徴を表し、オブジェクトBに対する円弧データは、犬の顔部についての特徴を表し、オブジェクトCに対する円弧データは、犬の耳部についての特徴を表す。
【0015】
このように、
図3では、犬というオブジェクトが、犬の体全体のオブジェクトA、犬の顔部のオブジェクトB、犬の耳部のオブジェクトCの3つのオブジェクトに分割された例を示すが、これに限られない。オブジェクト分割部11がオブジェクトの分割を実行しても、結果として得られるオブジェクトは、1つ(オブジェクトが分割されない)であることもあり、2以上であることもある。分割されたオブジェクトは、それぞれが独立して画像認識の対象となる。なお、オブジェクトの分割には、例えば、輪郭抽出処理等の公知の技術を利用することができる。オブジェクトの分割処理は実行されなくてもよいが、実行した方がオブジェクトの認識精度が向上し好ましい。
【0016】
内接円抽出部12は、読取画像内のオブジェクトに内接する円を抽出する。例えば、内接円抽出部12は、オブジェクトに対して面積が最大となる内接円を抽出する。内接円抽出部12は、オブジェクト分割部11により分割されたオブジェクトに対して面積が最大となる内接円をそれぞれ抽出する。例えば、
図3には、犬の体全体のオブジェクトAに対して面積が最大となる内接円AIが計算され、犬の顔部のオブジェクトBに対して面積が最大となる内接円BIが計算され、犬の耳部のオブジェクトCに対して面積が最大となる内接円CIが計算される。
【0017】
外接円設定部13は、内接円の中心点を外接円の中心点とした、オブジェクトに外接する外接円を設定する。例えば外接円設定部13は、犬の体全体のオブジェクトAに対して内接円の中心点a0を外接円の中心点として、オブジェクトAに外接する外接円AOを設定する。外接円設定部13は、内接円の中心点a0を外接円の中心点とすることにより、オブジェクトの多少の形の変化に依存しない中心点を導くことができる。
図3では、オブジェクトAは、犬の鼻先で外接円AOと外接している。
【0018】
外接円設定部13は、犬の顔部のオブジェクトBに対しても内接円の中心点b0を外接円の中心点として、オブジェクトBに外接する外接円BOを設定する。なお、犬の耳部のオブジェクトCに対しても同様であるが、
図3ではオブジェクトBに外接する外接円は図示していない。
【0019】
円弧データ生成部14は、外接円に対するオブジェクトの外形の相対位置に基づき、オブジェクトに応じた波形を生成するデータ生成部に相当する。具体的には、円弧データ生成部14は、外接円の中心点から半径方向に伸びる線とオブジェクトの外形(輪郭)との交点、及び外接円の中心点から半径方向に伸びる線と外接円との交点とを用いてオブジェクトの外形に応じた波形を生成する。
【0020】
例えば円弧データ生成部14は、犬の体全体のオブジェクトAに対して、外接円の中心点a0から半径方向に伸びる線a1とオブジェクトAの外形(
図3では、しっぽ部分)との交点a11、及び前記線a1と外接円AOとの交点a01とに基づき、オブジェクトAに応じた波形を構成する一点を生成する。具体的には、円弧データ生成部14は、外接円AOの中心点a0に対するオブジェクトAの外形上の交点の位置、及び外接円の中心点a0に対する外接円の交点の位置の相対位置関係に基づき、オブジェクトAの外形を外接円AOの円周に対する相対位置を示す波形として生成する。
【0021】
同様にして、線a2〜a6とオブジェクトAの外形との交点、及び線a2〜a6と外接円AOとの交点とに基づき、オブジェクトAに応じた波形の各点を生成する。このようにて、円弧データ生成部14は、外接円の中心点a0から半径方向に伸びる360°の線とオブジェクトAの外形との交点、及び前記360°の線と外接円AOとの交点とに基づき、オブジェクトAに応じた円弧状の波形(以下、円弧データともいう。)を生成する。
【0022】
図3の犬の体全体のオブジェクトAの円弧データを
図4に示す。線a1〜a6とオブジェクトAの外形との交点(又は接点)a11〜a66は、オブジェクトAの外形のうちの比較的突出した部分を示し、円弧データのグラフの特徴点として表されている。なお、
図4のグラフの横軸は外接円の円周方向の位置、縦軸は円弧データの値を示す。
図4のグラフでは、
図3の犬の体全体のオブジェクトAに示された始点から円周方向に360°、外接円AOに対するオブジェクトAの外形の相対位置が解析され、その結果が波形として示されている。よって、円弧データの始点と終点とは一致する。
【0023】
以上に説明したように、円弧データ生成部14は、オブジェクトの中心点から外接円への直線上にあるオブジェクトの交点と外接円上の交点を求め、一つのオブジェクトに関する円弧の配列を生成する。
【0024】
円弧データ生成部14は、分割された複数のオブジェクトのそれぞれに対して上記円弧状の波形を生成する。
図3では、オブジェクトA、オブジェクトB、オブジェクトCに対して、それぞれ内接円抽出→外接円設定→円弧データ生成の処理が行われることになる。
【0025】
抽出部15は、生成されたオブジェクトの波形に対応するテンプレート候補を、モデルデータベース16に蓄積された複数のテンプレートの波形から抽出する。
【0026】
モデルデータベース16には、様々なオブジェクトのテンプレートの波形がテンプレートに関連付けられて、予め登録されている。例えば、
図5に示したように、モデルデータベース16には、ねこ、ぶた、いぬ、きりん、円、四角形・・・等の様々な図示しないテンプレートに対応する円弧データが格納されている。各テンプレート自体は、これらに対応する円弧データに関連付けてモデルデータベース16又はその他の画像認識装置の内部の記憶領域又は画像認識装置の外部の記憶領域に蓄積されている。
【0027】
例えば、モデルデータベース16には、「いぬ」と「きりん」の基本的なテンプレートの波形が円弧データとして保存されている。テンプレートの波形の生成方法は、上記円弧データ生成部による生成方法と同じである。
【0028】
これに対して、例えば、子供が
図3に示した「いぬ」と
図6に示した「きりん」とを描いた場合について考える。本実施形態に係る画像認識を用いて、円弧データ生成部14により「いぬの絵」から
図4の円弧データが生成され、「きりんの絵」から
図7の円弧データが生成される。
【0029】
すなわち、「きりんの絵」のオブジェクトも同様に、
図6に示したオブジェクトの内接円DIの中心点d0を中心点とする外接円DOを作成し、中心点d0から半径方向に伸びる線ときりんの外形との交点及び前記線と外接円DOとの交点の比率を配列として保持する。この結果、子供が書いた「きりんの絵」から抽出される円弧データは
図7に示す円弧データとなる。
【0030】
外接円に対するオブジェクトの外形の相対位置は、例えば、オブジェクトの中心点から半径方向に伸びる線とオブジェクトの外形との交点と、線と外接円との交点との割合で表される。例えば、外接円に対するオブジェクトの外形の相対位置は、外接円の中心点からオブジェクトの外形の交点までの長さとオブジェクトの外形の交点から外接円の交点までの長さの比率であってもよい。また、例えば、外接円に対するオブジェクトの外形の相対位置は、外接円の中心点からオブジェクトの外形の交点までの長さと外接円の中心点から外接円の交点までの長さの比率であってもよい。また、例えば、外接円の中心点から外接円の交点までの半径の長さを1として外接円の中心点からオブジェクトの外形の交点までの長さを1に対する長さの割合として正規化した値としてもよい。
【0031】
生成された「いぬの絵」の円弧データ、「きりんの絵」の円弧データは、モデルデータベース16に保存された複数のテンプレートの円弧データと比較される。
【0032】
図4の「いぬの絵」の円弧データは顔と四肢としっぽが特徴点(a11、a22、a33、a44、a55、a66)として波形に示され、
図7の「きりんの絵」の円弧データは首と、その先についた顔とつのと耳が特徴点(d55、d66、d77)として波形に示される。
【0033】
これに対して、
図5の「いぬ」のテンプレートの円弧データは、
図7の「きりんの絵」の円弧データが持っている長い首に関連する特徴点(d55、d66、d77)を有しない。一方、
図5の「きりん」のテンプレートの円弧データは、
図7の「きりんの絵」の円弧データが持っている特徴点を有する類似した波形である。
【0034】
同様に、
図5の「きりん」のテンプレートの円弧データは、
図4の「いぬの絵」の円弧データが持っている顔と四肢としっぽに相当する特徴点(a11、a22、a33、a44、a55、a66)を有しない。一方、
図5の「いぬ」のテンプレートの円弧データは、
図4の「いぬの絵」の円弧データが持っている特徴点を有する類似した波形である。
【0035】
したがって、
図4の「いぬ」の円弧データは、
図5の「いぬ」の円弧データに類似し、
図7の「きりん」の円弧データは、
図5の「きりん」の円弧データに類似すると認識される。
【0036】
このように、オブジェクトの外形を、外接円を基準とした円弧データとして抽出し、テンプレートの円弧データと比較することにより、高速に画像認識処理を実行することができ、かつ多少の変形したオブジェクトであってもそのオブジェクトの画像認識を可能とする。また、オブジェクトを認識するための特徴点を、中間データとして機能する円弧データに変換して表し、変換後の中間データ同士を比較するため、オブジェクトの外形の特徴を維持したまま、描かれたオブジェクトの大きさに関係なく比較することができる。また、円弧データに対する一定の閾値を設けることにより、描かれた足の位置など、多少の変化に関してもオブジェクト全体の特徴に基づき、モデルデータベース16を柔軟に検索して円弧データが類似するテンプレートをモデルデータベース16から高速に抽出できる。なお、抽出部15は、分割された複数のオブジェクトの少なくともいずれかの波形に対応するテンプレート候補を抽出してもよい。ただし、抽出部15は、分割された複数のオブジェクトのすべてについてその波形に対応するテンプレート候補を抽出することにより、テンプレート候補をより絞り込むことができる。
【0037】
更に、抽出部15は、モデルデータベース16に蓄積された複数のテンプレートの波形上のいずれかの点を始点として、生成されたオブジェクトの波形と比較することができる。前述のように、オブジェクトの特徴は円弧状の波形として示され、始点と終点とを有さない。よって、テンプレートと比較する際、オブジェクトの波形の始点を固定位置にする必要はなく、波形のいずれの点を始点としてテンプレートの波形との比較を開始することができる。画像読み取り時、通常、撮像方向や撮像角度はそのときによって一定しない。よって、オブジェクトが正面から撮られていない、例えばオブジェクトが背面から撮られたような場合も生じる。このような場合であっても、オブジェクトの波形の始点を、概ね物体を正面から表現したテンプレートの波形の始点にあわせることにより両者の波形の比較が可能になる。
【0038】
抽出部15は、モデルデータベース16に蓄積された複数のテンプレートに対応する波形と円弧データ生成部14により生成された波形とをマッチングする際、例えば、各波形の高周波成分と低周波成分とに分ける等の周波数解析し、解析結果に基づき生成されたオブジェクトの波形に対応するテンプレート候補を抽出する。
【0039】
円弧データのマッチングの技術としては、例えば、比較対象となる2つの円弧データの波形の特徴を抽出して、一致するか否かを判定する。一例としては、
図8(a)〜
図8(c)に示した波形のピークの位置と変化の少ないピーク間中央位置と分けて抽出し、抽出された波形のピークの位置は高周波解析、変化の少ないピーク間中央位置は低周波解析を実行してもよい。
【0040】
図8(a)は、モデルデータベース16に記憶された、「いぬ」のテンプレートの円弧データの波形の一例である。
図8(b)は、
図4で示した「いぬの絵」の円弧データの波形である。
図8(c)は、
図7で示した「きりんの絵」の円弧データの波形である。
【0041】
上記解析法では、
図8(a)の波形の高周波成分HTと
図8(b)の波形の高周波成分HAと
図8(c)の波形の高周波成分HDを抽出して、高周波解析する。また、
図8(a)の波形の低周波成分LTと
図8(b)の波形の低周波成分LAと
図8(c)の波形の低周波成分LDを抽出して、低周波解析する。
【0042】
これにより、読取画像内のオブジェクトの波形がどのテンプレートの波形に類似しているかを判断し、テンプレート候補を選択する。この例では、
図8(b)の「いぬの絵」の波形が
図8(a)の「いぬ」のテンプレートの波形に類似していると判定し、
図8(a)の「いぬ」のテンプレートを「いぬの絵」に対するテンプレート候補の一つとする。一方、この例では、
図8(c)の「きりんの絵」の波形は、
図8(a)の「いぬ」のテンプレートの波形に類似していないと判定する。よって、
図8(a)の「いぬ」のテンプレートは、「きりんの絵」に対するテンプレート候補の一つとされない。
【0043】
以上のようにして、生成したオブジェクトの円弧データを、登録されているテンプレートの円弧データと比較し、読み込んだオブジェクトに対するテンプレートの候補をモデルデータベース16から複数抽出する。たとえば、単純な正四角形の円弧データは91.25度ずつにピークが表現されるが、正四角形が構成要素となっているオブジェクトは、抽出部15により候補となるテンプレートは抽出できるが、複数の候補から一つのテンプレートを確定することはできない。
【0044】
判定部17は、分割されたオブジェクト間の外接円の中心点の相関情報に基づき、前記テンプレート候補から前記読取画像内のオブジェクトに対応するテンプレート候補を絞り込む。例えば、
図3において、分割されたオブジェクトAとオブジェクトBについて、
図9に示したように、抽出部15により抽出した円弧データのオブジェクトAの外接円AOと、オブジェクトBの中心点b0の相関情報に基づき、モデルデータベース16の円弧データと比較することにより、対象のオブジェクトが何であるか判断する。複数の円弧の中心点の関連性を保持することによって、入力画像が、あるオブジェクトの一部であっても、その一部の情報に特有の形を有していれば、オブジェクトの判定が可能であり、また、膨大なデータからある程度絞りこむことが可能である。
【0045】
[画像認識処理]
次に、第1実施形態に係る画像認識装置1により実行される画像認識処理の動作について、
図2を参照しながら説明する。
【0046】
画像認識装置1による画像認識処理が開始されると、ステップS10にて、画像読取部10は、画像を入力する。画像の入力方法には、カメラによる画像の撮像やスキャナ装置による画像の読込みの他画像の受信もありうる。
【0047】
次に、ステップS11にて、オブジェクト分割部11は、入力画像に含まれるオブジェクトの抽出を行い、抽出したオブジェクトを複数のオブジェクトに分割する。
【0048】
次に、ステップS12にて、内接円抽出部12は、分割されたオブジェクトのそれぞれに対して、面積が最大となる内接円を描く。
【0049】
次に、ステップS13にて、外接円設定部13は、内接円の中心点を中心とし、オブジェクトの最外点に接する外接円を設定する。
【0050】
次に、ステップS14にて、円弧データ生成部14は、中心点から外接円への直線上にあるオブジェクトの交点と外接円上の交点を求め、オブジェクトに関する円弧の配列(円弧データ)を生成する。
【0051】
次に、ステップS15にて、抽出部15は、分割したすべてのオブジェクトについてステップS11〜ステップS14の処理を実行したかを判定する。すべてのオブジェクトについてステップS11〜ステップS14の処理を実行していない場合、ステップS11に戻り、処理していないオブジェクトについてステップS11〜ステップS14の処理を実行する。すべてのオブジェクトについてステップS11〜ステップS14の処理を実行した場合、ステップS16に進み、抽出部15は、入力画像内のオブジェクトに類似するオブジェクトのテンプレート候補をモデルデータベース16から検索する。
【0052】
次に、ステップS17にて、判定部17は、抽出したオブジェクトが重なりあうオブジェクトについて、ステップS14によって抽出した円弧データの中点との、相対位置を基にデータベースと比較し、対象のオブジェクトが何であるか判断する。複数の円弧の中点の関連を保持することで、入力された画像が、あるオブジェクトの一部であっても、その一部の情報に特有の形を有していれば、オブジェクトの判定が可能であり、また、膨大なデータからある程度絞りこむことが可能である。
【0053】
以上に説明したように、本実施形態に係る画像認識装置1によれば、入力画像のオブジェクトに内接する円のうち最大面積の内接円を抽出し、その内接円の中心点を中心とした、オブジェクトの最外点に接する外接円を描く。そして、外接円を基準としたオブジェクトの外形の相対位置を示す円弧状の特徴データを抽出し、波形として生成する。
【0054】
このようにして、オブジェクトの外形全体の特徴を波形に変換し、同様にして予め変換したモデルデータベース16に登録されているテンプレートの波形と比較する。これにより、子供が手書きした絵等、読取画像に含まれるオブジェクトが多少変形していても、オブジェクトの外形全体の特徴を表す波形とテンプレートの波形とを比較することによって、オブジェクトをより精度良く画像認識することができ、オブジェクトに対応するテンプレート候補を的確に絞り込むことができる。
【0055】
特に、本実施形態では、オブジェクトの特徴は外接円に対するオブジェクトの外形の位置の比率として表される。よって、オブジェクトが実際に描かれた大きさに関係なく、オブジェクトの波形とテンプレートの波形とを比較することができる。
<第2実施形態>
[画像認識装置の全体構成]
次に、本発明の第2実施形態に係る画像認識装置について、
図10を参照しながら説明する。
図10は、第2実施形態に係る画像認識装置の機能構成図である。
【0056】
第1実施形態に係る画像認識装置1では、オブジェクト及びテンプレートは2次元のデータであることを前提に、画像認識処理を行った。これに対して、本実施形態に係る画像認識装置1は、3次元のデータに基づき画像認識処理を実行することができる。
【0057】
本実施形態に係る画像認識装置1は、第1実施形態に係る画像認識装置の機能に加え、視点生成部18を有している。また、本実施形態では、3次元モデルデータベース19が使用される。3次元モデルデータベース19は、テンプレートの波形として2次元データの他、3次元データを有している。
【0058】
その一例として、
図12の3次元モデルデータベース19に含まれる「いぬ」のテンプレートFは、正面のテンプレートF1、側面のテンプレートF2、背面のテンプレートF3を有している。また、正面のテンプレートF1に対応した正面円弧データ、側面のテンプレートF2に対応した側面円弧データ、背面のテンプレートF3に対応した背面円弧データを有する。これらは、すべて「いぬ」のテンプレートFの外形を多視点(ここでは3視点)の円弧データとして示したものである。
【0059】
[画像認識処理]
次に、第2実施形態に係る画像認識装置1により実行される画像認識処理の動作について、
図11を参照しながら説明する。
【0060】
画像認識装置1による画像認識処理が開始されると、ステップS10にて、画像読取部10は、画像を入力する。画像は、例えば複数視点で読み込まれる。ここでは、「いぬ」のオブジェクトを含む正面、側面、背面の画像が読み込まれる。
【0061】
次に、ステップS11にて、オブジェクト分割部11は、入力画像に含まれるオブジェクトの抽出を行い、抽出したオブジェクトを複数のオブジェクトに分割する。オブジェクトの分割は、複数視点の各視点のオブジェクトに対してそれぞれ行われる。
【0062】
次に、ステップS12にて、内接円抽出部12は、各視点の分割されたオブジェクトのそれぞれに対して、面積が最大となる内接円を描く。
【0063】
次に、ステップS13にて、外接円設定部13は、内接円の中心点を中心とし、各視点のオブジェクトの最外点に接する外接円を設定する。
【0064】
次に、ステップS14にて、円弧データ生成部14は、外接円を基準としたオブジェクトの外形の相対位置を示す円弧状の特徴データを抽出し、波形として生成する。
【0065】
次に、ステップS15にて、抽出部15は、分割したすべての視点のオブジェクトについてステップS11〜ステップS14の処理を実行したかを判定する。すべてのオブジェクトについてステップS11〜ステップS14の処理を実行していない場合、ステップS11に戻り、処理していないオブジェクトについてステップS11〜ステップS14の処理を実行する。すべてのオブジェクトについてステップS11〜ステップS14の処理を実行した場合、ステップS16に進み、抽出部15は、入力画像内のオブジェクトに類似するオブジェクトのテンプレート候補をモデルデータベース16から検索する。
【0066】
また、3次元モデルデータは、ステップS18の視点生成処理を用いて、オブジェクトの3次元画像の3次元データからリアルタイムに生成した円弧データを用いてもよい。
【0067】
次に、ステップS17にて、判定部17は、抽出したオブジェクトが重なりあうオブジェクトについて、ステップS14によって抽出した円弧データの中点を結んだ大きい円弧データを生成し、データベースと比較し、対象のオブジェクトが何であるか判断する。複数の円弧の中点の関連を保持することで、入力された画像が、あるオブジェクトの1部であっても、その一部の情報に特有の形を有していれば、オブジェクトの判定が可能であり、また、膨大なデータからある程度絞りこむことが可能である。
【0068】
以上に説明したように、本実施形態に係る画像認識装置1によれば、3次元のオブジェクトの外形全体の特徴をそれぞれの波形に変換し、予め変換した3次元モデルデータベース19に登録されている3次元のテンプレートの波形とそれぞれ比較する。これにより、3次元のオブジェクトの外形全体の特徴を表す波形と3次元のテンプレートの波形とを比較することによって、オブジェクトを更に精度良く画像認識することができ、オブジェクトに対応するテンプレート候補を更に絞り込む又は正確に選択することができる。
【0069】
なお、本実施形態では、3次元モデルデータベース19は正面、側面、背面の3次元モデルに対応した3次元データを有するが、これに限られず、データベースは3視点以外の複数視点分の円弧データを有していてもよい。これにより、様々な角度で撮影された映像中のオブジェクトであっても画像認識することができる。
【0070】
[アプリケーション例]
最後に、上記実施形態にて説明した画像認識処理を利用したアプリケーション例について説明する。例えば、
図13に示したアプリケーション例では、ステップ1にて、子供のぬり絵を携帯端末で撮る。
【0071】
ステップ2にて、上記実施形態に係る画像認識装置1は、読取画像中のオブジェクトの波形を生成し、テンプレートの波形と比較する。このようにして撮ったぬり絵をオブジェクト認識処理し、テンプレートの波形と比較してテンプレート候補を選び出す。テンプレート候補が複数の場合には、テンプレート候補を携帯端末に表示し、好きなテンプレートを利用者が選ぶようにしてもよい。
【0072】
ステップ3にて、撮ったぬり絵から色を抽出し、テンプレートに反映させる。
【0073】
ステップ4にて、色を反映させたテンプレートに動きを与えるモーション生成処理を実行し、アニメーションとして携帯端末の画面上で動かす。その際、音声もあわせて提供するとより魅力的なアプリケーションとなる。
【0074】
これによれば、映像を円弧データの波形(デジタルデータ)に変換し、その波形とテンプレートの波形とをマッチングし、オブジェクトに類似するテンプレートをデータベースから選び、選ばれたテンプレートのコンテンツに塗り絵の色を付けて画面上で動作させる。このようにして、このアプリケーションでは、ぬり絵からデジタルコンテンツをつくり、書いた絵を動かすことができる。よって、ぬり絵をした子供は、自分の作成したぬり絵が紙から飛び出して、動いたり声を出したりする映像に親近感を持ち、楽しむことができる。
【0075】
なお、ステップ1にて、子供のぬり絵を携帯端末で撮る際、ぬり絵の脇にバーコード等の情報を付してもよい。その場合、携帯端末で撮った画像にはオブジェクトとともにバーコード情報が含まれる。このバーコード情報にオブジェクトに関する情報を埋め込んでおくことにより、ステップ2にてテンプレートを判別する際に、本実施形態の特徴である円弧データの比較結果とバーコード情報とを使用して、テンプレートを判別することができる。これにより、よりオブジェクトに類似するテンプレート候補をより的確に選ぶことができる。
【0076】
ステップ3にて完成した、ぬり絵が反映されたテンプレートを、
図14や
図15に示すように利用するアプリケーション例も考えられる。
【0077】
図14では、携帯端末に表示された図示しない選択画面から、利用者が「パラパラで遊ぶ」の実行ボタンを押した場合のアプリケーション例である。利用者は、複数のテンプレートから利用者が好きなキャラクタを一つ選ぶことができる。
【0078】
ステップ5にて、「パラパラ」が選択されると、ステップ6にて、ぬり絵が反映されたテンプレートを使ってMFPや家庭用プリンタで16コマの画像が印刷される。例えば、ぬり絵が反映されたテンプレートが「いぬ」の場合、その「いぬ」が歩くようなモーションをつけた画像が、上記実施形態の画像認識装置から印刷機に送信される。
【0079】
ステップS6にて、印刷機はパラパラ漫画のように16分割した絵を印刷する。ステップ7に示したパラパラ漫画用の16コマの画像の印刷が出力される。
【0080】
ステップS8にて、利用者は完成した印刷物を使って16コマのパラパラを製作し、楽しむことができる。
【0081】
図15では、携帯端末に表示された図示しない選択画面から、利用者が「おりがみで遊ぶ」の実行ボタンを押した場合のアプリケーション例である。利用者は、複数のテンプレートから利用者が好きなキャラクタを一つ選ぶことができる。例えば、利用者は、複数のテンプレートから自分がぬり絵したキャラクタを選ぶと自分がぬり絵したものと同じ位置に同じ色が塗られた折り紙を作ることができる。
【0082】
ステップ9にて、「おりがみ」が選択されると、ステップ10にて、ぬり絵が反映されたテンプレートを使ってMFPや家庭用プリンタでぬり絵が反映されたキャラクタの展開図が印刷される。例えば、ぬり絵が反映されたテンプレートが「いぬ」の場合、その「いぬ」の展開図が印刷される。
【0083】
ステップS11にて、自分のぬり絵が反映された折り紙用の印刷が出力される。
【0084】
ステップS12にて、利用者は完成した印刷物を使って折り紙を楽しむことができる。
【0085】
このようにして、上記実施形態に係る画像認識装置1を利用すれば、カメラで画像認識したいオブジェクトが描かれた紙を撮ると、デジタル的にそのオブジェクトを認識し、テンプレートとマッチングし、オブジェクトと類似するテンプレートを選択することができる。そして、選択されたテンプレートに所望の画像処理を施すことが可能なアプリケーションを利用者に提供することができる。
【0086】
以上、添付図面を参照しながら本発明に係る画像認識装置、画像認識方法の好適な実施形態について詳細に説明したが、本発明に係る画像認識装置、画像認識方法の技術的範囲はかかる例に限定されない。本発明の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明に係る画像認識装置、画像認識方法の技術的範囲に属する。
【0087】
なお、本発明に係る画像認識装置には、図示しないCPUが内蔵されている。CPUにより実行される各機能を実現するためのプログラムは、図示しないコンピュータに備えられた図示しないROMあるいはHDD等の記憶手段に予め格納されてもよい。前記プログラムは、記録媒体であるCD−ROMあるいはフレキシブルディスク,SRAM,EEPROM,メモリカード等の不揮発性記録媒体(メモリ)に記録されてもよい。本発明に係る画像認識装置の機能は、これらのメモリに記録されたプログラムをCPUに実行させることにより実現され得る。さらに、前記プログラムは、ネットワークに接続され、プログラムを記録した記録媒体を備える外部機器あるいはプログラムを記憶手段に記憶した外部機器からダウンロードすることもできる。