IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ サクサ株式会社の特許一覧

<>
  • 特許-画像処理装置及びプログラム 図1
  • 特許-画像処理装置及びプログラム 図2
  • 特許-画像処理装置及びプログラム 図3
  • 特許-画像処理装置及びプログラム 図4
  • 特許-画像処理装置及びプログラム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-15
(45)【発行日】2024-04-23
(54)【発明の名称】画像処理装置及びプログラム
(51)【国際特許分類】
   G06F 3/01 20060101AFI20240416BHJP
   G06T 7/20 20170101ALI20240416BHJP
【FI】
G06F3/01 570
G06T7/20 300A
【請求項の数】 7
(21)【出願番号】P 2020156708
(22)【出願日】2020-09-17
(65)【公開番号】P2022050225
(43)【公開日】2022-03-30
【審査請求日】2023-05-22
(73)【特許権者】
【識別番号】304020498
【氏名又は名称】サクサ株式会社
(74)【代理人】
【識別番号】110004222
【氏名又は名称】弁理士法人創光国際特許事務所
(74)【代理人】
【識別番号】100166006
【弁理士】
【氏名又は名称】泉 通博
(74)【代理人】
【識別番号】100154070
【弁理士】
【氏名又は名称】久恒 京範
(74)【代理人】
【識別番号】100153280
【弁理士】
【氏名又は名称】寺川 賢祐
(72)【発明者】
【氏名】小笠原 奨
(72)【発明者】
【氏名】深井 伸晃
(72)【発明者】
【氏名】松田 和之
(72)【発明者】
【氏名】遠藤 敏志
【審査官】槙 俊秋
(56)【参考文献】
【文献】国際公開第2013/168508(WO,A1)
【文献】国際公開第2019/122915(WO,A1)
【文献】特開2016-177658(JP,A)
【文献】特表2017-522633(JP,A)
【文献】国際公開第2017/057106(WO,A1)
【文献】則枝真[日本電気株式会社],[特別企画]新ギア、スマートグラスに注目する;医療支援ツール活用の有用性; スマートグラスと画像認識技術を用いた仮想キーボードシステムARmKeypadの医療活用の展望,月刊新医療 New Medicine in Japan ,第44巻, 第7号,株式会社エム・イー振興協会 杉山 正幸,2017年07月01日,p.135-138
【文献】菊田 一郎,[特集] 物流・流通IoT+ICT; [NEC] ; IoT/AIを物流・ロジスティクス革新に具体化,ARの実用提案も; ここまで来たデジタル・トランスフォーメーション,月刊マテリアルフロー MATERIAL FLOW ,第59巻,第2号,株式会社流通研究社 野間 勉,2018年02月01日,p.26-31
(58)【調査した分野】(Int.Cl.,DB名)
G06F 3/01-3/04895
G06T 7/20
(57)【特許請求の範囲】
【請求項1】
ユーザの前方の撮像画像からユーザの手の動きの情報を検出する画像処理装置であって、
前記ユーザの第1指の画像を含む前記撮像画像を取得する取得部と、
前記撮像画像に含まれている前記第1指の画像における複数の関節の位置を特定する位置特定部と、
前記位置特定部が特定した前記関節の位置に基づいて定められる複数の操作領域への前記ユーザの第2指による操作を検出する検出部と、
前記検出部が検出した前記操作に対応する前記操作領域に割り当てられた文字を特定する文字特定部と、
前記第1指を含む手のひらが手前側に向いている場合に、当該第1指の関節の位置に基づいて定められる複数の操作領域の位置のそれぞれに、前記操作領域に割り当てられた第1の文字群に属する複数の仮想キー画像を表示し、前記第1指を含む手の甲が手前側に向いている場合に、当該第1指の関節の位置に基づいて定められる複数の操作領域の位置のそれぞれに、前記操作領域に割り当てられた第2の文字群に属する複数の仮想キー画像を表示する表示制御部と、
を備える、画像処理装置。
【請求項2】
前記表示制御部は、前記撮像画像に基づいて、前記第1指又は前記第1指が含まれる手の向きを特定し、特定した前記第1指の向き又は手の向きが第1の向きである場合に、第1の文字群に対応する複数の前記仮想キー画像を表示し、特定した前記第1指の向き又は手の向きが第2の向きである場合に、第2の文字群に対応する複数の前記仮想キー画像を表示する、
請求項に記載の画像処理装置。
【請求項3】
前記検出部は、前記第2指が前記操作領域に近づく向きに移動した後に前記操作領域から離れる向きに移動する動きを前記操作として検出する、
請求項1又は2に記載の画像処理装置。
【請求項4】
前記検出部は、前記第2指が下がって前記操作領域に近づいた後に上がって前記操作領域から離れる動きを前記操作として検出する、
請求項1からのいずれか一項に記載の画像処理装置。
【請求項5】
前記検出部は、前記操作領域において前記第2指により操作された前記第1指の皮膚がくぼむことを前記操作として検出する、
請求項1からのいずれか一項に記載の画像処理装置。
【請求項6】
前記検出部は、前記第2指の所定の動きを検出し、
前記文字特定部は、前記検出部が前記第2指の前記所定の動きを検出した場合に、入力された一以上の文字を消去する、
請求項1からのいずれか一項に記載の画像処理装置。
【請求項7】
コンピュータに、
ユーザの第1指の画像を含む撮像画像を取得するステップと、
前記撮像画像に含まれている前記第1指の画像における複数の関節の位置を特定するステップと、
特定した前記関節の位置に基づいて定められる複数の操作領域への前記ユーザの第2指による操作を検出するステップと、
検出した前記操作に対応する前記操作領域に割り当てられた文字を特定するステップと、
前記第1指を含む手のひらが手前側に向いている場合に、当該第1指の関節の位置に基づいて定められる複数の操作領域の位置のそれぞれに、前記操作領域に割り当てられた第1の文字群に属する複数の仮想キー画像を表示し、前記第1指を含む手の甲が手前側に向いている場合に、当該第1指の関節の位置に基づいて定められる複数の操作領域の位置のそれぞれに、前記操作領域に割り当てられた第2の文字群に属する複数の仮想キー画像を表示するステップと、
を実行させる、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置及びプログラムに関する。
【背景技術】
【0002】
近年、頭部に装着可能なウェアラブルグラス等の画像処理装置では、仮想キーボードをユーザの前方に表示し、この仮想キーボードに対するユーザの入力操作をカメラ等により検出することが行われている(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2000-29621号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載の技術では、ユーザが仮想キーボードを用いて文字を入力する操作をした際に、ユーザが操作したことに応じた感触を得ることができないため、操作性が悪いという問題があった。
【0005】
そこで、本発明はこれらの点に鑑みてなされたものであり、ユーザが文字を入力した感触を得ることができる画像処理装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1の態様の画像処理装置は、ユーザの前方の撮像画像からユーザの手の動きの情報を検出する画像処理装置であって、前記ユーザの第1指の画像を含む前記撮像画像を取得する取得部と、前記撮像画像に含まれている前記第1指の画像における複数の関節の位置を特定する位置特定部と、前記位置特定部が特定した前記関節の位置に基づいて定められる複数の操作領域への前記ユーザの第2指による操作を検出する検出部と、前記検出部が検出した前記操作に対応する前記操作領域に割り当てられた文字を特定する文字特定部と、を備える。
【0007】
前記画像処理装置は、前記第1指の画像と、前記第1指の画像における前記複数の操作領域それぞれに対応付けられた複数の仮想キー画像とを表示する表示部をさらに有してもよい。前記表示部は、前記撮像画像に基づいて、前記第1指又は前記第1指が含まれる手の向きを特定し、特定した前記第1指の向き又は手の向きが第1の向きである場合に、第1の文字群に対応する複数の前記仮想キー画像を表示し、特定した前記第1指の向き又は手の向きが第2の向きである場合に、第2の文字群に対応する複数の前記仮想キー画像を表示してもよい。
【0008】
前記検出部は、前記第2指が前記操作領域に近づく向きに移動した後に前記操作領域から離れる向きに移動する動きを前記操作として検出してもよい。前記検出部は、前記第2指が下がって前記操作領域に近づいた後に上がって前記操作領域から離れる動きを前記操作として検出してもよい。前記検出部は、前記操作領域において前記第2指により操作された前記第1指の皮膚がくぼむことを前記操作として検出してもよい。
【0009】
前記検出部は、前記第2指の所定の動きを検出し、前記文字特定部は、前記検出部が前記第2指の前記所定の動きを検出した場合に、入力された一以上の文字を消去してもよい。
【0010】
本発明の第2の態様のプログラムは、コンピュータに、ユーザの第1指の画像を含む撮像画像を取得するステップと、前記撮像画像に含まれている前記第1指の画像における複数の関節の位置を特定するステップと、特定した前記関節の位置に基づいて定められる複数の操作領域への前記ユーザの第2指による操作を検出するステップと、検出した前記操作に対応する前記操作領域に割り当てられた文字を特定するステップと、を実行させる。
【発明の効果】
【0011】
本発明によれば、ユーザが文字を入力した感触を得るという効果を奏する。
【図面の簡単な説明】
【0012】
図1】実施形態に係る画像処理装置の概要を示す図である。
図2】実施形態に係る画像処理装置の概要を示す図である。
図3】画像処理装置の構成を示す図である。
図4】表示制御部による仮想キー画像の表示方法の例を示す図である。
図5】画像処理装置による文字入力操作の検出の処理手順を示すフローチャートである。
【発明を実施するための形態】
【0013】
[画像処理装置100の概要]
図1及び図2は、本発明の実施形態に係る画像処理装置100の概要を示す図である。図1(a)は、画像処理装置100の外観を示す図である。図1(a)に一例として示す画像処理装置100は、ユーザの頭部に装着されるウェアラブルグラスである。図1(b)は、画像処理装置100が表示する表示画像の一例を示す図である。図2は、画像処理装置100におけるユーザの操作の一例を示す図である。
【0014】
画像処理装置100は、ユーザの前方の撮像画像からユーザの手の動きの情報を検出する。画像処理装置100は、撮像部1、本体ユニット2及びハーフミラー3を備える。図1(a)中には、撮像部1を破線で示す。
【0015】
撮像部1は、ユーザの前方の撮像画像を所定のフレームレートで生成する。撮像部1は、本体ユニット2にケーブル(不図示)又は無線により接続されており、生成した撮像画像を本体ユニット2に入力する。
【0016】
本体ユニット2は、各種の画像をユーザが視認できるように表示させる。本体ユニット2は、二次元配置された光源(不図示)を備える。本体ユニット2は、光源から発生した光をハーフミラー3により反射させ、この反射光をユーザの目に入射させることにより、各種の画像をユーザに視認させる。本体ユニット2は、CPU(Central Processing Unit)を備え、各種の機能を実行する。例えば、本体ユニット2は、撮像部1が生成した撮像画像を解析することにより、ユーザの手の動きを検出し、検出した手の動きに対応する画像を表示させる。
【0017】
図1(b)は、本体ユニット2が表示する表示画像の一例を示す。図1(b)は、パスワードを入力するための表示画像を示す。本体ユニット2は、この表示画像において撮像部1が生成したユーザの前方の撮像画像をパスワードの入力欄の下方に表示する。図1(b)の例では、本体ユニット2は、ユーザの手のひらや指を含む撮像画像を表示する。
【0018】
図1(b)に示される手は、他方の手を用いて文字を入力するためのキーボードとして使用される。本明細書においては、キーボードとして使用される側の手の指を第1指と称し、第1指の部位を選択するために用いられる他の手の指を第2指と称する。第2指は、指自体ではなく、ユーザが把持する物体(例えば棒状の物体)であってもよい。
【0019】
本体ユニット2は、撮像部1が生成した撮像画像を解析し、第1指の画像における複数の関節の位置を特定する。本体ユニット2は、特定した関節の位置に基づいて、ユーザが操作するための複数の操作領域を定める。本体ユニット2は、定めた複数の操作領域それぞれに対応付けられた複数の仮想キー画像を表示する。図1(b)の例では、本体ユニット2は、「0」から「9」の数字等を入力するための仮想キー画像を表示する。
【0020】
図2は、文字を入力するユーザの操作を本体ユニット2が検出する様子を示す図である。本体ユニット2は、撮像画像を解析することにより、ユーザの第1指を含まない方の手の指(以下、第2指ともいう)による操作を検出する。図2の例では、文字「3」を入力するための仮想キー画像に対応する操作領域がユーザの第2指により操作されたものとする。このとき、本体ユニット2は、第2指が操作領域を操作したことを検出し、操作された操作領域に割り当てられた文字「3」を特定する。本体ユニット2は、既にパスワード入力欄に表示されていた文字「1」の後に新たに特定した文字「3」を追加する。
【0021】
このようにして、本体ユニット2は、ユーザの第1指に対する第2指による操作を検出する。ユーザは、第2指による操作の感触を第1指において得ることができ、例えば、空間上に仮想キー画像を表示する場合に比べて、仮想キー画像を操作する際の操作性を向上させることができる。また、ユーザが自身の一方の手の指で他方の手の指に触れるという動作は一般的に行われる動作なので、画像処理装置100が上記のように構成されていることで、画像処理装置100は、第三者がいる場所において画像処理装置100を操作することにユーザが抵抗感を覚えることを抑制することができる。
【0022】
[画像処理装置の構成]
図3は、画像処理装置100の構成を示す図である。画像処理装置100は、撮像部1及び本体ユニット2を備える。本体ユニット2は、表示部21、記憶部22及び制御部23を備える。表示部21は、各種の画像を表示する。表示部21は、光源から発生した光をハーフミラー3により反射させ、この反射光をユーザの目に入射させることにより、各種の画像をユーザに視認させる。
【0023】
記憶部22は、ROM(Read Only Memory)、RAM(Random Access Memory)、ハードディスク等の記憶媒体を含む。記憶部22は、制御部23が実行するプログラムを記憶している。制御部23は、例えば、CPUである。制御部23は、記憶部22に記憶されたプログラムを実行することにより、取得部231、位置特定部232、検出部233、文字特定部234及び表示制御部235として機能する。
【0024】
取得部231は、ユーザの第1指の画像を含む撮像画像を取得する。例えば、取得部231は、画像処理装置100に取り付けられた撮像部1から撮像画像を取得する。取得部231は、画像処理装置100とは別体の撮像装置から無線通信等により撮像画像を取得してもよい。取得部231は、取得した撮像画像を位置特定部232及び表示制御部235へ出力する。
【0025】
位置特定部232は、取得部231が取得した撮像画像に含まれている第1指の画像における複数の関節の位置を特定する。例えば、位置特定部232は、第1指の皮膚のしわの位置を特定することにより、第1指の関節の位置を特定する。位置特定部232は、複数の第1指の関節の位置をそれぞれ特定するものとする。位置特定部232は、特定した関節の位置を示す情報を検出部233へ出力する。なお、一例として、位置特定部232は、表示制御部235が文字を入力するための画面を表示した後に取得した撮像画像に最初に写っている手の指を第1指と判定する。
【0026】
[第2指による操作の検出]
検出部233は、位置特定部232が特定した関節の位置に基づいて定められる複数の操作領域へのユーザの第2指による操作を検出する。まず、検出部233は、第1指の関節の位置に基づいて、複数の操作領域を定める。例えば、検出部233は、図1(b)の破線に示す第1指の関節の位置を操作領域の境界とし、第1指が映っている領域を複数の関節の位置により区分けしたものをそれぞれ異なる操作領域として定める。
【0027】
検出部233は、撮像画像を解析することにより、ユーザの第1指を含まない方の手の第2指を特定する。検出部233は、第1指が写っている状態で新たに撮像画像に写った手に含まれる指を第2指と特定する。
【0028】
検出部233は、第2指が操作領域に近づく向きに移動する動きを監視する。検出部233は、第2指が操作領域に近づく向きに移動した後にこの操作領域から離れる向きに移動する動きをこの操作領域への操作として検出する。例えば、検出部233は、第2指が下がって操作領域に近づいた後に上がってこの操作領域から離れる動きをこの操作領域への操作として検出する。このとき、検出部233は、第2指の爪の動きを検出することがより好ましい。例えば、検出部233は、第2指の爪の移動する向きが反転した位置と操作領域とが撮像画像において重なったこと、あるいは、第2指の爪の移動する向きが反転した位置と操作領域との距離が閾値以下になったことを条件として、操作領域に対する第2指の操作を検出してもよい。閾値は、例えば、ユーザにより予め設定される。
【0029】
ユーザの第1指に対する第2指の操作を検出部233が検出する際に、第2指の上下方向の移動は検出の漏れが比較的生じにくい。このため、検出部233は、第2指の上下方向の移動を検出することにより第1指に対する第2指の操作の検出精度を向上させることができる。また、検出部233は、操作領域において第2指により操作された第1指の皮膚がくぼむことをこの操作領域への操作として検出してもよい。検出部233は、検出した第2指の操作に対応する操作領域を示す情報を文字特定部234へ出力する。
【0030】
検出部233は、さらに、第2指のジェスチャ等の所定の動きを検出する。例えば、検出部233は、第2指側の手を握る動作を検出する。検出部233は、第1指側の手のひらや第1指のいずれかの操作領域を第2指が一定速度でスライドする動作を検出する。検出部233は、第2指の所定の動きを検出した場合には、検出した動きを示す情報を文字特定部234へ出力する。検出部233は、操作領域に対して第2指をスライドする動作を検出した場合には、この動作に対応する操作領域を示す情報と、スライドの方向を示す情報とを文字特定部234へ出力する。
【0031】
[操作領域に対応する文字の特定]
文字特定部234は、検出部233が検出した操作に対応する操作領域に割り当てられた文字を特定する。例えば、複数の操作領域に文字「1」から文字「9」が割り当てられているものとする。文字特定部234は、第2指により操作された操作領域に文字「1」から文字「9」のどの文字が割り当てられているかを特定する。
【0032】
文字特定部234は、特定した文字をバッファに記憶させる。バッファは、文字特定部234が特定した文字または文字列をこれらの文字等を確定する第2指による操作を検出部233が検出するまで記憶する。文字特定部234は、バッファが既に文字等を記憶している場合には、バッファが記憶している文字等の末尾に特定した文字を追加する。文字特定部234は、バッファが記憶している文字等を示す情報を表示制御部235へ逐次出力する。
【0033】
文字特定部234は、検出部233が第2指の所定の動きを検出した場合に、入力された一以上の文字を消去する。例えば、文字特定部234は、第2指側の手を握る動作を検出部233が検出した場合には、バッファが記憶している文字または文字列を消去させる。
【0034】
文字特定部234は、第1指に第2指が近づいてから離れた位置を用いる方法以外の方法で文字を特定してもよい。例えば、文字特定部234は、操作領域に対して第2指がスライドした方向に応じて、異なる文字を特定してもよい。例えば、文字特定部234は、文字「あ」が割り当てられた操作領域に対し、第2指が左方向にスライドする動作を検出部233が検出した場合に、この操作領域に対する左方向のスライド操作に割り当てられた文字として文字「い」を特定してもよい。文字特定部234は、文字「あ」が割り当てられた操作領域に対し、第2指が上方向にスライドする動作を検出部233が検出した場合に、この操作領域に対する上方向のスライド操作に割り当てられた文字として文字「う」を特定してもよい。
【0035】
文字特定部234は、バッファに記憶されている文字列を確定させる仮想キー画像に対応する操作領域への操作を検出部233が検出した場合には、バッファに記憶されている文字列を別のアプリケーションに渡す。別のアプリケーションは、例えば、登録されているパスワードと同じ文字列が第2指により入力されたか否かを判定するアプリケーションである。
【0036】
文字特定部234は、バッファに記憶されている文字列を確定させる仮想キーに対応する操作領域への操作を検出部233が検出した場合に、バッファに記憶されている文字列を外部機器へ出力してもよい。例えば、文字特定部234は、銀行のATM(automated teller machine)へ無線通信により文字列を出力してもよい。このようにして、文字特定部234は、ATMのパスワード認証等をユーザが非接触で行うことを可能にする。
【0037】
[仮想キー画像の表示]
表示制御部235は、第1指の画像と、第1指の画像における複数の操作領域それぞれに対応付けられた複数の仮想キー画像とを表示する。表示制御部235は、第1指を含む撮像画像を表示部21により表示する。このとき、表示制御部235は、検出部233が定めた操作領域の位置に、この操作領域に割り当てられた文字を示す仮想キー画像を撮像画像に重畳させて表示する。
【0038】
また、表示制御部235は、ユーザがハーフミラー3を透過して視認している視界内において検出部233が定めた操作領域の位置に、この操作領域に対応する仮想キー画像を表示してもよい。また、表示制御部235は、仮想キー画像を表示しなくてもよい。ユーザは、第1指の複数の操作領域に割り当てられる文字を覚えていれば、仮想キー画像を表示制御部235が表示していない状態でも操作領域への第2指による操作が可能である。表示制御部235は、バッファに記憶されている文字または文字列を表示する。例えば、表示制御部235は、図2に示すように、バッファに記憶されている文字等をパスワードの入力欄に表示する。
【0039】
表示制御部235は、撮像画像に基づいて、第1指の向きを特定する。表示制御部235は、特定した第1指の向きが第1の向きである場合に、第1の文字群に対応する複数の仮想キー画像を表示する。表示制御部235は、特定した第1指の向きが第2の向きである場合に、第2の文字群に対応する複数の仮想キー画像を表示する。第1の文字群及び第2の文字群は、例えば、かな文字、アルファベットまたは記号等であり、特に限定されない。第1の文字群に含まれる文字と第2の文字群に含まれる文字とは一部が重複していてもよい。表示制御部235は、第1の文字群に対応する仮想キー画像を表示するときの仮想キー画像の数と比較して、第2の文字群に対応する仮想キー画像を表示するときの仮想キー画像の数を多くしてもよく、少なくしてもよい。
【0040】
図4(a)及び図4(b)は、表示制御部235による仮想キー画像の表示方法の例を示す図である。図4(a)は、第1指の向きが第1の向きである場合に表示制御部235が表示する複数の仮想キー画像の例を示す。図4(b)は、第1指の向きが第2の向きである場合に表示制御部235が表示する複数の仮想キー画像の例を示す。表示制御部235は、第1指の向きを特定する。例えば、表示制御部235は、複数の第1指のうち、中指の向きを特定する。図4の例では、第1の向きは、第1指の指先が右上方向に延びる向きであり、第2の向きは、第1指の指先が右下方向に延びる向きであるものとする。
【0041】
図4(a)に示すように、撮像画像において中指の指先は、右上方向を向いている。このとき、表示制御部235は、中指が第1方向を向いていると判定し、第1の文字群として文字「0」から文字「1」までの数字を入力するための複数の仮想キー画像を表示する。
【0042】
図4(b)の例では、撮像画像において中指の指先は、右下方向を向いている。このとき、表示制御部235は、中指が第2方向を向いていると判定し、第2の文字群として、文字「A」、文字「D」、文字「G」等のアルファベットを入力するための複数の仮想キー画像を表示する。このようにして、表示制御部235は、複数の文字群に対応する仮想キー画像を表示するので、ユーザが入力可能な文字の種類を増加させることができる。
【0043】
また、表示制御部235は、第1指の向きを特定する代わりに、第1指が含まれる手の向きを特定してもよい。例えば、表示制御部235は、第1指を含む手のひらが手前側に向いている場合に、手の向きが第1の向きであることを特定し、数字を入力するための第1の文字群に対応する複数の仮想キー画像を表示する。一方、表示制御部235は、第1指を含む手の甲が手前側に向いている場合に、手の向きが第2の向きであることを特定し、アルファベット等を入力するための第2の文字群に対応する複数の仮想キー画像を表示してもよい。
【0044】
表示制御部235は、表示される文字群を切り替えるための仮想キー画像に対応する操作領域への操作を検出部233が検出した場合に、第1指の向きが変わったことを特定した場合と同様に、表示中の文字群とは別の文字群に対応する複数の仮想キー画像を第1指の対応する位置に表示する。表示制御部235は、第1指を含む手のひらに対するスライド操作を検出部233が検出した場合に、第1指の向きが変わったことを特定した場合と同様に、表示中の文字群とは別の文字群に対応する複数の仮想キー画像を第1指の対応する位置に表示する。
【0045】
[画像処理装置による第2指の操作の検出の処理手順]
図5は、画像処理装置100による文字入力操作の検出の処理手順を示すフローチャートである。この処理手順は、文字を入力する操作が行われて、取得部231が取得した撮像画像において位置特定部232が第1指を含む手を特定したときに開始する。
【0046】
まず、位置特定部232は、撮像画像に含まれている第1指の画像における複数の関節の位置を特定する(S101)。検出部233は、位置特定部232が特定した関節の位置に基づいて、複数の操作領域を定める。表示制御部235は、撮像画像において検出部233が定めた操作領域内に、この操作領域に割り当てられた文字を示す仮想キー画像を表示する(S102)。
【0047】
文字特定部234は、操作領域へのユーザの第2指による操作を検出部233が検出したか否かを判定する(S103)。文字特定部234は、操作領域へのユーザの第2指による操作を検出部233が検出した場合に(S103のYES)、検出した操作に対応する操作領域に割り当てられた文字を特定する(S104)。文字特定部234は、バッファが記憶している文字または文字列の末尾に特定した文字を追加する。表示制御部235は、バッファが記憶している文字列を表示する(S105)。
【0048】
文字特定部234は、バッファに記憶されている文字列を確定させる仮想キー画像の操作領域への操作を検出部233が検出したか否かを判定する(S106)。文字特定部234は、バッファに記憶されている文字列を確定させる仮想キー画像の操作領域への操作を検出部233が検出した場合に(S106のYES)、バッファに記憶されている文字列を別のアプリケーションに渡し(S107)、処理を終了する。
【0049】
文字特定部234は、S103の判定において操作領域へのユーザの第2指による操作を検出部233が検出していない場合に(S103のNO)、S101の処理に戻る。文字特定部234は、S106の判定においてバッファに記憶されている文字列を確定させる仮想キー画像の操作領域への操作を検出部233が検出していない場合に(S106のNO)、S101の処理に戻る。
【0050】
本実施形態の画像処理装置100では、検出部233は、ユーザの第1指に対する第2指による操作を検出する。このため、ユーザは、第2指による操作の感触を第1指において得ることができ、文字入力する際の操作性を向上させることができる。また、ユーザが自身の一方の手の指で他方の手の指に触れるという動作は一般的に行われる動作なので、画像処理装置100は、第三者がいる場所において画像処理装置100を操作することにユーザが抵抗感を覚えることを抑制することができる。
【0051】
本実施形態の画像処理装置100は、ゲーム機や銀行のATM等の外部機器と連携し、文字特定部234が特定した文字等を外部機器へ出力することにより、外部機器の仮想的なキーボードとして用いることができる。また、外部機器がゲーム機である場合には、画像処理装置100は、外部機器の仮想的な操作パネルとして用いることができる。
【0052】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
【符号の説明】
【0053】
1 撮像部
2 本体ユニット
3 ハーフミラー
21 表示部
22 記憶部
23 制御部
100 画像処理装置
231 取得部
232 位置特定部
233 検出部
234 文字特定部
235 表示制御部
図1
図2
図3
図4
図5