特許第6695963号(P6695963)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ シェンジェン ピーアールテック カンパニー リミテッドの特許一覧

特許6695963ジェスチャー認識に基づくテキスト入力方法及び装置、及び記録媒体
<>
  • 特許6695963-ジェスチャー認識に基づくテキスト入力方法及び装置、及び記録媒体 図000003
  • 特許6695963-ジェスチャー認識に基づくテキスト入力方法及び装置、及び記録媒体 図000004
  • 特許6695963-ジェスチャー認識に基づくテキスト入力方法及び装置、及び記録媒体 図000005
  • 特許6695963-ジェスチャー認識に基づくテキスト入力方法及び装置、及び記録媒体 図000006
  • 特許6695963-ジェスチャー認識に基づくテキスト入力方法及び装置、及び記録媒体 図000007
  • 特許6695963-ジェスチャー認識に基づくテキスト入力方法及び装置、及び記録媒体 図000008
  • 特許6695963-ジェスチャー認識に基づくテキスト入力方法及び装置、及び記録媒体 図000009
  • 特許6695963-ジェスチャー認識に基づくテキスト入力方法及び装置、及び記録媒体 図000010
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6695963
(24)【登録日】2020年4月24日
(45)【発行日】2020年5月20日
(54)【発明の名称】ジェスチャー認識に基づくテキスト入力方法及び装置、及び記録媒体
(51)【国際特許分類】
   G06K 9/62 20060101AFI20200511BHJP
   G06F 3/01 20060101ALI20200511BHJP
   G06F 3/0346 20130101ALI20200511BHJP
   G06F 3/0488 20130101ALI20200511BHJP
   G06K 9/03 20060101ALI20200511BHJP
   G09G 5/00 20060101ALI20200511BHJP
   G09G 5/36 20060101ALI20200511BHJP
   G09G 5/26 20060101ALI20200511BHJP
【FI】
   G06K9/62 G
   G06F3/01 570
   G06F3/0346 422
   G06F3/0488 130
   G06K9/03 J
   G09G5/00 550C
   G09G5/36 530Y
   G09G5/26 Z
【請求項の数】9
【全頁数】16
(21)【出願番号】特願2018-514781(P2018-514781)
(86)(22)【出願日】2016年8月24日
(65)【公表番号】特表2018-535469(P2018-535469A)
(43)【公表日】2018年11月29日
(86)【国際出願番号】CN2016096501
(87)【国際公開番号】WO2017045517
(87)【国際公開日】20170323
【審査請求日】2018年5月9日
(31)【優先権主張番号】201510593632.8
(32)【優先日】2015年9月17日
(33)【優先権主張国】CN
(73)【特許権者】
【識別番号】515083734
【氏名又は名称】シェンジェン ピーアールテック カンパニー リミテッド
(74)【代理人】
【識別番号】110000176
【氏名又は名称】一色国際特許業務法人
(72)【発明者】
【氏名】リウ,グォファ
【審査官】 村松 貴士
(56)【参考文献】
【文献】 国際公開第2014/054716(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06K 9/00 − 9/82
G06F 3/01
G06F 3/033 − 3/039
G06F 3/048 − 3/0489
G09G 5/00 − 5/42
(57)【特許請求の範囲】
【請求項1】
ハンドジェスチャー認識に基づくテキスト入力方法であって、
対象物を含む画像情報を収集し、
前記画像情報に従って前記対象物を決定し、前記対象物の書き込み面及び移動軌跡を取得し、
前記書き込み面における前記対象物の前記移動軌跡を書き込み軌跡として抽出し、前記書き込み軌跡を出力し、
前記書き込み軌跡に従って文字認識を実施し、文字認識結果を出力することを備え、
ユーザのハンドジェスチャー又は音声を認識し、ハンドジェスチャー認識の結果又は音声認識の結果に従って書き込み状態を開始し、
前記ユーザのハンドジェスチャー又は音声を認識し、ハンドジェスチャー認識の結果又は音声認識の結果に従って前記書き込み状態を終了することを更に備え、
前記画像情報に従って前記対象物を決定して、前記対象物の前記書き込み面及び前記移動軌跡を取得するステップは、
前記対象物を決定するため前記画像情報から画像特徴抽出を実施し、
ある位置での前記対象物の一時停止時間を数え、
前記書き込み状態開始後初めて事前設定された時間に前記対象物の前記一時停止時間が達する第一位置を取得し、二回目に前記事前設定された時間に前記対象物の前記一時停止時間が達する第二位置を取得し、前記対象物の前記第一位置から前記第二位置までの前記移動軌跡を第一ストロークと規定し、前記第一ストロークが位置する面を基準書き込み面として規定し、前記基準書き込み面から事前設定された距離範囲内離れている面を書き込み面として規定することを備え、
前記書き込み面における前記対象物の前記移動軌跡を前記書き込み軌跡として抽出し、前記書き込み軌跡を出力するステップは、
前記書き込み面における前記対象物の前記移動軌跡を前記書き込み軌跡として抽出して、
文字を単位として前記書き込み軌跡を出力することを備えることを特徴とするハンドジェスチャー認識に基づくテキスト入力方法。
【請求項2】
請求項1に記載の方法であって、
前記基準書き込み面に近い前記対象物の一端及び前記基準書き込み面の間の距離に従って前記文字のサイズを調整することを更に備えることを特徴とする方法。
【請求項3】
ハンドジェスチャー認識に基づくテキスト入力方法であって、
対象物を含む画像情報を収集し、
前記画像情報に従って前記対象物を決定し、前記対象物の書き込み面及び移動軌跡を取得し、
前記書き込み面における前記対象物の前記移動軌跡を書き込み軌跡として抽出し、前記書き込み軌跡を出力し、
前記書き込み軌跡に従って文字認識を実施し、文字認識結果を出力することを備え、
前記書き込み軌跡に従って前記文字を認識し、文字認識結果を出力するステップの後、前記方法は、
前記書き込み軌跡を表示するステップを更に備え、
前記書き込み軌跡を表示する前記ステップは、
前記対象物が前記書き込み面から基準書き込み面に対して45度から90度の角度で離れているかを検出するか、又は前記対象物が事前設定された速度で前記書き込み面から離れているかを検出して、前記対象物が前記書き込み面から前記基準書き込み面に対して45度から90度の角度で離れている場合又は前記対象物が前記事前設定された速度で前記書き込み面から離れている場合、前記書き込み軌跡の表示を停止して、
前記対象物が前記書き込み面に前記基準書き込み面に対して45度から90度の角度で達しているかを検出するか、又は前記対象物が前記事前設定された速度で前記書き込み面に達しているかを検出するか、又は前記対象物が前記書き込み面に「L」字型の移動軌跡で達しているかを検出して、前記対象物が前記書き込み面に前記基準書き込み面に対して45度から90度の角度で達している場合、又は前記対象物が前記事前設定された速度で前記書き込み面から離れている場合、又は前記対象物が前記書き込み面に「L」字型の移動軌跡で達している場合、前記書き込み軌跡の表示を開始することを備えることを特徴とするハンドジェスチャー認識に基づくテキスト入力方法。
【請求項4】
ハンドジェスチャー認識に基づくテキスト入力装置であって、前記装置はプロセッサと命令を記録したメモリとを備え、前記命令は前記プロセッサにより実行されると前記プロセッサに、
対象物を含む画像情報を収集させ、
前記画像情報に基づき前記対象物を決定させ、前記対象物の書き込み面及び移動軌跡を取得させ、
前記書き込み面における前記対象物の前記移動軌跡を書き込み軌跡として抽出させ、前記書き込み軌跡を出力させ、
前記書き込み軌跡に基づいて文字認識を実施させ、文字認識結果を出力させることを備えるステップを実施させ、
前記プロセッサは前記命令を更に実行して、
ユーザのハンドジェスチャー又は音声を認識し、ハンドジェスチャー認識の結果又は音声認識の結果を出力し、書き込み状態を開始し、
前記ユーザのハンドジェスチャー又は音声を認識し、ハンドジェスチャー認識の結果又は音声認識の結果を出力し、書き込み状態を終了する
ステップを実施させ、
前記命令が前記プロセッサにより実行されると、前記画像情報に従って前記対象物を決定して、前記対象物の前記書き込み面及び前記移動軌跡を取得することは、
前記対象物を決定するため前記画像情報から画像特徴抽出を実施し、
ある位置での前記対象物の一時停止時間を数え、
前記書き込み状態開始後初めて事前設定された時間に前記対象物の前記一時停止時間が達する第一位置を取得し、二回目に前記事前設定された時間に前記対象物の前記一時停止時間が達する第二位置を取得し、前記対象物の前記第一位置から前記第二位置までの前記移動軌跡を第一ストロークと規定し、前記第一ストロークが位置する面を基準書き込み面として規定し、前記基準書き込み面から事前設定された距離範囲内離れている面を書き込み面として規定することを備え、
前記書き込み面における前記対象物の前記移動軌跡を前記書き込み軌跡として抽出し、前記書き込み軌跡を出力するステップは、
前記書き込み面における前記対象物の前記移動軌跡を前記書き込み軌跡として抽出し、
文字を単位として前記書き込み軌跡を出力することを備えることを特徴とする装置。
【請求項5】
請求項4に記載の装置であって、
前記プロセッサは更に前記命令を実行して、
前記基準書き込み面に近い前記対象物の一端及び前記基準書き込み面の間の距離に従って前記文字のサイズを調整することを更に備えることを特徴とする装置。
【請求項6】
ハンドジェスチャー認識に基づくテキスト入力装置であって、前記装置はプロセッサと命令を記録したメモリとを備え、前記命令は前記プロセッサにより実行されると前記プロセッサに、
対象物を含む画像情報を収集させ、
前記画像情報に基づき前記対象物を決定させ、前記対象物の書き込み面及び移動軌跡を取得させ、
前記書き込み面における前記対象物の前記移動軌跡を書き込み軌跡として抽出させ、前記書き込み軌跡を出力させ、
前記書き込み軌跡に基づいて文字認識を実施させ、文字認識結果を出力させることを備えるステップを実施させ、
前記書き込み軌跡に従って前記文字を認識し、前記文字認識結果を出力するステップの後、前記プロセッサは更に前記命令を実行して
記書き込み軌跡を表示するステップを実施し、
前記命令が実行されると、前記書き込み軌跡を表示する前記ステップは、
前記対象物が前記書き込み面から基準書き込み面に対して45度から90度の角度で離れているかを検出するか、又は前記対象物が事前設定された速度で前記書き込み面から離れているかを検出して、前記対象物が前記書き込み面から前記基準書き込み面に対して45度から90度の角度で離れている場合又は前記対象物が前記事前設定された速度で前記書き込み面から離れている場合、前記書き込み軌跡の表示を停止して、
前記対象物が前記書き込み面に前記基準書き込み面に対して45度から90度の角度で達しているかを検出するか、又は前記対象物が前記事前設定された速度で前記書き込み面に達しているかを検出するか、又は前記対象物が前記書き込み面に「L」字型の移動軌跡で達しているかを検出して、前記対象物が前記書き込み面に前記基準書き込み面に対して45度から90度の角度で達している場合、又は前記対象物が前記事前設定された速度で前記書き込み面から離れている場合、又は前記対象物が前記書き込み面に前記「L」字型の移動軌跡で達している場合、前記書き込み軌跡の表示を開始することを備えることを特徴とする装置。
【請求項7】
コンピュータ読取可能命令を記録する少なくとも一つの非一過性のコンピュータ読取可能記録媒体であって、少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサに、
対象物を含む画像情報を収集し、
前記画像情報に従って前記対象物を決定し、前記対象物の書き込み面及び移動軌跡を取得し、
書き込み軌跡として前記書き込み面における前記対象物の前記移動軌跡を抽出し、前記書き込み軌跡を出力し、
前記書き込み軌跡に従って文字認識を実施し、文字認識結果を出力することを備えるステップを実施させ、
前記少なくとも一つのプロセッサに実施させる前記ステップは、
ユーザのハンドジェスチャー又は音声を認識し、ハンドジェスチャー認識の結果又は音声認識の結果に従って書き込み状態を開始し、
前記ユーザのハンドジェスチャー又は音声を認識し、ハンドジェスチャー認識の結果又は音声認識の結果に従って前記書き込み状態を終了することを更に備え、
前記画像情報に従って前記対象物を決定して、前記対象物の前記書き込み面及び前記移動軌跡を取得するステップは、
前記対象物を決定するため前記画像情報から画像特徴抽出を実施し、
ある位置での前記対象物の一時停止時間を数え、
前記書き込み状態開始後初めて事前設定された時間に前記対象物の前記一時停止時間が達する第一位置を取得し、二回目に前記事前設定された時間に前記対象物の前記一時停止時間が達する第二位置を取得し、前記対象物の前記第一位置から前記第二位置までの前記移動軌跡を第一ストロークと規定し、前記第一ストロークが位置する面を基準書き込み面として規定し、前記基準書き込み面から事前設定された距離範囲内離れている面を書き込み面として規定することを備え、
前記書き込み面における前記対象物の前記移動軌跡を前記書き込み軌跡として抽出し、前記書き込み軌跡を出力するステップは、
前記書き込み面における前記対象物の前記移動軌跡を前記書き込み軌跡として抽出して、
文字を単位として前記書き込み軌跡を出力することを備えることを特徴とする少なくとも一つの非一過性のコンピュータ読取可能記録媒体。
【請求項8】
請求項7に記載のコンピュータ読取可能記録媒体であって、
前記少なくとも一つのプロセッサに実施させる前記ステップは、
前記基準書き込み面に近い前記対象物の一端及び前記基準書き込み面の間の距離に従って前記文字のサイズを調整することを更に備えることを特徴とするコンピュータ読取可能記録媒体。
【請求項9】
コンピュータ読取可能命令を記録する少なくとも一つの非一過性のコンピュータ読取可能記録媒体であって、少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサに、
対象物を含む画像情報を収集し、
前記画像情報に従って前記対象物を決定し、前記対象物の書き込み面及び移動軌跡を取得し、
書き込み軌跡として前記書き込み面における前記対象物の前記移動軌跡を抽出し、前記書き込み軌跡を出力し、
前記書き込み軌跡に従って文字認識を実施し、文字認識結果を出力することを備えるステップを実施させ、
前記書き込み軌跡に従って前記文字を認識し、文字認識結果を出力するステップの後、前記少なくとも一つのプロセッサに実施させる前記ステップは、
前記書き込み軌跡を表示するステップを更に備え、
前記書き込み軌跡を表示する前記ステップは、
前記対象物が前記書き込み面から基準書き込み面に対して45度から90度の角度で離れているかを検出するか、又は前記対象物が事前設定された速度で前記書き込み面から離れているかを検出して、前記対象物が前記書き込み面から前記基準書き込み面に対して45度から90度の角度で離れている場合又は前記対象物が前記事前設定された速度で前記書き込み面から離れている場合、前記書き込み軌跡の表示を停止して、
前記対象物が前記書き込み面に前記基準書き込み面に対して45度から90度の角度で達しているかを検出するか、又は前記対象物が前記事前設定された速度で前記書き込み面に達しているかを検出するか、又は前記対象物が前記書き込み面に「L」字型の移動軌跡で達しているかを検出して、前記対象物が前記書き込み面に前記基準書き込み面に対して45度から90度の角度で達している場合、又は前記対象物が前記事前設定された速度で前記書き込み面から離れている場合、又は前記対象物が前記書き込み面に「L」字型の移動軌跡で達している場合、前記書き込み軌跡の表示を開始することを備えることを特徴とする少なくとも一つの非一過性のコンピュータ読取可能記録媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、2015年9月17日に出願された「空中のストロークを識別する装置及び方法」と題する中国特許出願第201510593632.8号に基づく優先権を主張し、その開示を全て本明細書に援用する。
【0002】
本開示は、コンピュータ認識技術に関し、特にハンドジェスチャー認識に基づくテキスト入力方法、装置、及び記録媒体に関する。
【背景技術】
【0003】
コンピュータサイエンスの発達に伴い、コンピュータによるテキストメッセージで表現を行うことにより多くの人が慣れている。テキスト入力手段として近年広く使用されているものには、キーボード、タッチスクリーン、書き込みパッド等があり、それらのテキスト入力手段にはそれぞれ不利な点がある。従って、より自然に、便利に、そして効果的に空中にテキストを書く方法を設計するという研究分野は重要である。
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、コンピュータビジョンでは、空中のテキスト書きの軌跡は連続しており、従来のテキスト認識技術では連続で書かれたテキストを容易に認識することができるが、認識精度には向上の余地がある。
【課題を解決するための手段】
【0005】
本開示のいくつかの実施形態によると、ハンドジェスチャー認識に基づくテキスト入力方法、装置、及び記録媒体が設けられている。
【0006】
ハンドジェスチャー認識に基づくテキスト入力方法であって、
【0007】
対象物を含む画像情報を収集し、
【0008】
前記画像情報に従って前記対象物を決定し、前記対象物の書き込み面及び移動軌跡を取得し、
【0009】
前記書き込み面における前記対象物の前記移動軌跡を書き込み軌跡として抽出し、前記書き込み軌跡を出力し、
【0010】
前記書き込み軌跡に従って文字認識を実施し、文字認識結果を出力することを備えることを特徴とするハンドジェスチャー認識に基づくテキスト入力方法。
【0011】
ハンドジェスチャー認識に基づくテキスト入力装置であって、前記装置はプロセッサと命令を記録したメモリとを備え、前記命令は前記プロセッサにより実行されると前記プロセッサに、
【0012】
対象物を含む画像情報を収集させ、
【0013】
前記画像情報に基づき前記対象物を決定させ、前記対象物の書き込み面及び移動軌跡を取得させ、
【0014】
前記書き込み面における前記対象物の前記移動軌跡を書き込み軌跡として抽出させ、前記書き込み軌跡を出力させ、
【0015】
前記書き込み軌跡に基づいて文字認識を実施させ、文字認識結果を出力させるステップを実施させることを備えることを特徴とする装置。
【0016】
コンピュータ読取可能命令を記録する少なくとも一つの非一過性の記録媒体であって、少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサは、
【0017】
対象物を含む画像情報を収集し、
【0018】
前記画像情報に従って前記対象物を決定し、前記対象物の書き込み面及び移動軌跡を取得し、
【0019】
書き込み軌跡として前記書き込み面における前記対象物の前記移動軌跡を抽出し、前記書き込み軌跡を出力し、
【0020】
前記書き込み軌跡に従って文字認識を実施し、文字認識結果を出力することを備えることを特徴とする少なくとも一つの非一過性の記録媒体。
【0021】
上記のハンドジェスチャー認識に基づくテキスト入力方法によると、前記画像情報に従って前記対象物を決定し、前記対象物の書き込み面及び移動軌跡を取得し、
出力される書き込み軌跡として前記書き込み面における前記対象物の前記移動軌跡を抽出し、前記書き込み軌跡に従って文字認識を実施し、文字認識結果を出力して、対象物の移動軌跡が空中で連続していても、軌跡抽出モジュールが書き込み面の書き込み軌跡を抽出することができ、これはストローク識別処理と同様であり文字認識モジュールの認識を促進し、認識の精度を向上する。
【図面の簡単な説明】
【0022】
本開示または従来技術の実施形態における技術的手段をより明確に表示するため、実施形態または従来技術を説明するために添付の図面を下記に簡単に説明する。また、下記の説明における添付の図面は本開示のいくつかの実施形態でしかなく、当業者であれば、創造的な努力なしで添付の図面から他の図面も導けるだろう。
【0023】
図1図1は、実施形態におけるハンドジェスチャー認識に基づくテキスト入力装置の概略図である。
図2図2は、実施形態におけるハンドジェスチャー認識に基づくテキスト入力装置のブロック図である。
図3図3は、図2に示す実施形態における対象取得モジュールのブロック図である。
図4図4は、図2に示す実施形態における軌跡抽出モジュールのブロック図である。
図5図5は、実施形態において空中に書いている概略図である。
図6図6は、実施形態におけるハンドジェスチャー認識に基づくテキスト入力方法のフローチャートである。
図7図7は、別の実施形態におけるハンドジェスチャー認識に基づくテキスト入力方法のフローチャートである。
図8図8は、実施形態におけるハンドジェスチャー認識に基づくテキスト入力方法の適用を示す概略図である。
【発明を実施するための形態】
【0024】
本開示の実施形態は、添付の図面を参照して、下記に詳細に記載される。好ましい実施形態は図面に示されている。本開示の様々な実施形態は、いくつもの異なる形で実施されてもよく、ここに明示されている実施形態に限定して解釈されるべきではない。むしろ、これらの実施形態は本開示が完全で完成されて、当業者に開示の範囲を十分に伝えるように設けられている。
【0025】
ここにおいて使用される全ての定義は、他に定義されていない限り、本開示が属する当業者により通常理解される意味と同じ意味を有する。ここで使用される定義は、本開示の実施形態を説明し、限定はしない。本開示で使用されている「及び/又は」という表現は、列記されている一つ又は複数の項目のいずれか又は全ての組み合わせを示す。
【0026】
図1は、実施形態におけるハンドジェスチャー認識に基づくテキスト入力装置の概略図である。
【0027】
本実施形態では、ハンドジェスチャー認識に基づくテキスト入力装置は、プロセッサ、記録媒体、ランダム・アクセス・メモリ(RAM)、および装置のバスを介して接続されている入出力(I/O)インターフェースを含む。操作デバイス、データベース、及びコンピュータ読取可能命令は装置の記録媒体に記録されており、データベースは画像情報、移動軌跡、書き込み軌跡等のデータを記録する。装置のプロセッサは、装置全体の操作を支持する計算及び制御機能を備えている。端末のRAMは、記録媒体内のコンピュータ読取可能命令の操作環境を提供する。装置の入出力インターフェースによって、他の装置と接続する。
【0028】
図2は、実施形態におけるハンドジェスチャー認識に基づくテキスト入力装置のブロック図である。
【0029】
装置の内部構造は図1に示す構造に対応しており、下記の各モジュールの全部または一部はソフトウェア、ハードウェア、又はその組み合わせにより実施できる。図2に示すように、実施形態では、ハンドジェスチャー認識に基づくテキスト入力装置は、画像収集モジュール110、対象取得モジュール120、軌跡抽出モジュール130、文字認識モジュール140、表示モジュール150を含む。画像収集モジュール110は、対象物を含む画像情報を収集する。対象取得モジュール120は、画像情報に従って対象物を決定して、書き込み面および対象物の移動軌跡を取得する。軌跡抽出モジュール130は、書き込み軌跡として書き込み面の対象物の移動軌跡を抽出して、書き込み軌跡を出力する。文字認識モジュール140は、書き込み軌跡に従って文字認識を行い、文字認識結果を出力する。
【0030】
画像収集モジュール110は、対象物を含む画像情報を収集するカメラである。実施形態では、対象物はユーザの指、またはユーザが持っている鉛筆などの棒状の物体である。
【0031】
例えば、ユーザが鉛筆を対象物として用いて空中に書く必要がある場合には、鉛筆を持ち、鉛筆をカメラで見える領域に置くだけで、画像収集モジュール110は鉛筆を含む画像情報を収集する。
【0032】
実施形態では、ハンドジェスチャー認識に基づくテキスト入力装置は、ハンドジェスチャー認識モジュール及び/又は音声認識モジュールも含む。ハンドジェスチャー認識モジュールは、ユーザのハンドジェスチャーを認識してハンドジェスチャー認識の結果を出力して、ハンドジェスチャーの結果により書き込み状態を開始又は終了する。
【0033】
具体的には、ユーザが書き込み状態を開始したい場合には、画像収集モジュール110で見える領域内で対応するハンドジェスチャーを行う。ユーザの手が画像収集モジュール110で見える領域に現れると、ハンドジェスチャー認識モジュールは画像収集モジュール110で見える領域を自動的にハンドジェスチャー画像(ユーザの手に焦点をあてて、レンズをズームさせる等)の収集にあてて、ハンドジェスチャー認識の結果がハンドジェスチャー認識モジュールにより出力される、つまり書き込み状態が開始する。ユーザは音声により直接書き込み状態を開始することもでき、音声をひろうマイクに向かって「書き込み開始」と言うと、音声認識モジュールは音声認識結果を出力し、つまり書き込み状態を開始する。
【0034】
同様に、ユーザが書き込み状態を終了したい場合には、画像収集モジュール110で見える領域内で同様のハンドジェスチャーを行い、ハンドジェスチャー認識モジュールはハンドジェスチャー認識の結果を出力し、つまり書き込み状態を終了する。ユーザは音声により直接書き込み状態を終了することもでき、音声をひろうマイクに向かって「書き込み終了」と言い、音声認識モジュールは音声認識結果を出力し、つまり書き込み状態を終了する。
【0035】
対象取得モジュール120は画像情報に基づき対象物を決定し、対象物の書き込み面及び移動軌跡を取得する。
【0036】
図3に示すように、実施形態では対象取得モジュール120は、画像処理部122、時間計算部124、及び書き込み面決定部126を含む。
【0037】
具体的には、画像処理部122は、対象物を決定するために、画像情報から画像特徴抽出を行う。ここにおける画像特徴とは、エッジ抽出によりデジタル画像の画像輪郭を取得することを主に言う。一般的には、グレースケール値が大きく変化するところがエッジと定義される。対象物が指、鉛筆、又は他の棒状の物体の場合、画像のエッジはとても重要な特徴である。画像特徴を抽出することにより、対象物を速やかに決定できる。
【0038】
時間計算部124は、ある位置での対象物の一時停止の時間を数える。特に、対象物が決定されると、対象物のトラッキングが達成される。対象物が静止している場合には、時間計算部124は時間測定を始めて、対象物が再度動き始めたときに測定を止めて、その間経過した時間がある位置での対象物の一時停止の時間である。
【0039】
書き込み面決定部126は、書き込み状態の開始後に対象物の一時停止の時間が初めて事前設定された時間に達する第一位置を取得し、対象物の一時停止の時間が二回目に事前設定された時間に達する第二位置を取得し、第一位置から第二位置への対象物の移動軌跡を第一ストロークと規定し、第一ストロークが位置する面を基準書き込み面と規定し、基準書き込み面から事前設定されている距離範囲内で離れる面を書き込み面と規定する。
【0040】
例えば、書き込み状態が開始した場合、対象物の一時停止の時間が初めて事前設定の時間に達する第一位置をAと規定して、対象物の一時停止の時間が2回目に事前設定の時間に達する第二位置をBと規定すると、AとBとを接続する線は基準書き込み面となる。対象物AからBへの移動軌跡はユーザが入力した文字の一番初めのストロークである。基準書き込み面の決定は、第一ストロークが位置する空間的位置と、人間の腕の書き込み範囲と組み合わせて行われる。
【0041】
更に、別の実施形態では、書き込み面決定部126は他の方法により基準書き込み面を規定することができ、特定のハンドジェスチャー等により書き込み状態を開始して、対象物の書き込みの一端が位置する面を基準書き込み面とする。別の例では、書き込み状態は音声で開始され、対象物が書き込みを行う位置である一定の時間とどまり、対象物がとどまった面は基準書き込み面として規定される。第3の例では、音声、ジェスチャー、リモコン、又は他の手段により書き込み状態が開始され、対象物は直線的に前方又は下方にある一定の速度である位置へ移動してそこに少しの間とどまり、その位置の面を基準書き込み面と規定する。第4の例では、空中の対象物の軌跡が回転してある位置にとどまり「L」字型の軌跡が書かれると、その位置が書かれた面が基準書き込み面として規定される。「L」字型の軌跡が対象物により書かれたかの決定により対象物を主に追跡して、対象物の移動軌跡を取得して、移動軌跡が「L」字型であるかを決定する。基準書き込み面は、上記の組み合わせにより規定できる。
【0042】
基準書き込み面が決定された後、書き込み面に対して交角が事前設定された角度範囲内(例えば、30度以内)の面が書き込み面として規定され、これは空中に書き込みをする際に全てのストロークが同じ面にあることは不可能であるということを考慮しており、すなわち対象物の各移動軌跡は基準書き込み面に対してそれぞれ交角を有する。書き込み面はいくつかの面のセットであることと等しく、セットの全ての面の移動軌跡は抽出され、文字認識の精度の向上を促進する。
【0043】
実施形態では、事前設定された時間は2秒間であり、すなわち、ユーザは対象物を制御してストロークの開始及び終了の際に2秒以上一時停止させる。事前設定の時間は、1秒間、2秒間、又は3秒間等として設定でき、これは特に限定されていない。
【0044】
軌跡抽出モジュール130は、書き込み面における対象物の移動軌跡を書き込み軌跡として抽出して、書き込み軌跡を出力する。
【0045】
図4を参照すると、実施形態では、軌跡抽出モジュール130は、軌跡抽出部132及び文字出力部134を含む。
【0046】
軌跡抽出部132は、書き込み面における対象物の移動軌跡を書き込み軌跡として抽出する。
【0047】
文字出力部134は、文字をユニットとして、書き込み軌跡を出力する。特に、ユーザが書き込むプロセスの間、文字入力を完了すると対象物はある一定の時間一時停止する。実施形態では、間隔の閾値が4秒であると仮定すると、対象物の一時停止の時間が4秒を超えると、ユーザが文字入力を完了したと考えられる。文字は、漢字、英字、数字、記号、又はユーザが入力した他の独特な文字である。
【0048】
文字認識モジュール140は書き込み軌跡に従って文字認識を実施して、文字認識の結果を出力する。特に、文字認識モジュール140は軌跡抽出モジュール130が出力した書き込み軌跡(即ち、出力された文字)を事前設定された文字ベースにある文字と比較して、文字ベースから文字認識結果の書き込み軌跡に最も似ている文字を探して出力する。
【0049】
表示モジュール150は、文字認識結果及び/又は書き込み軌跡を表示する。詳しくは図5を参照すると、表示モジュール150は、書き込み表示ゾーン152及び認識ゾーン154を備える。書き込み表示ゾーン152は軌跡抽出モジュール130が出力した書き込み軌跡を表示して、認識表示ゾーン154は文字認識モジュール140が出力した文字認識結果を表示する。
【0050】
実施形態では、表示モジュール150は書き込み軌跡をリアルタイムで表示して、書き込み軌跡が文字を単位として文字認識モジュール140に出力されると、表示モジュール150は文字認識モジュール140に出力された文字認識結果を表示する。
【0051】
特に、表示モジュール150は、対象物検出装置及び表示装置を備えている。対象物検出装置は、対象物が書き込み面から基準書き込み面に対して45度から90度の間の角度で離れているかを検出するか、又は対象物が書き込み面から事前設定された速度で離れているかを検出して、「はい」の場合には表示装置は書き込み軌跡の表示を停止する。対象物検出装置は、更に、対象物が書き込み面に基準書き込み面に対して45度から90度の間の角度で達しているかを検出するか、又は対象物が書き込み面に事前設定された速度で達しているかを検出するか、又は対象物が書き込み面に「L」字型の移動軌跡で達しているかを検出して、「はい」の場合には対象物検出装置は書き込み軌跡を表示し始める。「L」字型軌跡が対象物により書かれているかを決定するため、主に対象物の移動軌跡を取得して対象物を追跡して、そして移動軌跡が「L」字型であるかを決定する。
【0052】
更に、サイズ調整モジュールが備えられており、それは基準書き込み面に近い対象物の一端と基準書き込み面との間の距離により文字のサイズを調整する。
【0053】
特に、基準書き込み面に近い対象物の一端とはペンの先端であり、基準書き込み面からペンの先端が遠いほど、文字のストロークが細くなる。反対に、基準書き込み面にペンの先端が近いほど、文字のストロークが太くなる。
【0054】
更に、対象物が基準書き込み面に90度に近い角度及び速度の閾値に近い速度で達しある一定の期間とどまるストロークが「下方ストローク」と規定され、基準書き込み面から90度に近い角度及び速度の閾値に近い速度で離れるストロークが「上方ストローク」と規定されると、サイズ調整モジュールは表示された文字を最初の下方ストロークの一時停止の延長に従って細くから太くなるように調整もできる。また、対象物が基準書き込み面から遠いほど、上方ストロークのストロークは細くなる。対象物が基準書き込み面から離れている距離がある一定の値になると、「上方ストローク」は終了したと考えられて、ストロークを識別するプロセスが実施される。
【0055】
また、実施形態では、対象物が書き込み面に「L」字型の移動軌跡で達すると「下方ストローク」と規定でき、対象物が書き込み面から「L」字型の移動軌跡で離れると「上方ストローク」と規定できる。特に、対象物が書き込み面に近づいた後、約90度で急に曲がり、書き込み面で移動し始めると、書き込み面に達した「L」字型の移動軌跡であると決定される。逆に、対象物が書き込み面で動いている間突然約90度で急に曲がり書き込み面から離れると、書き込み面から離れた「L」字型の移動軌跡であると決定される。
【0056】
図6は、実施形態におけるハンドジェスチャー認識に基づくテキスト入力方法のフローチャートである。
【0057】
ハンドジェスチャー認識に基づくテキスト入力方法は下記を含む。
【0058】
ステップS110にて、対象物を含む画像情報を収集する。
【0059】
実施形態では、対象物はユーザの指、又は鉛筆などユーザが持つ棒状の物体である。
【0060】
ステップS120では、対象物は画像情報に従って決定され、対象物の書き込み面及び移動軌跡が取得される。
【0061】
実施形態では、ステップS120では、基準書き込み面に近い対象物の一端と基準書き込み面との間の距離に従って文字のサイズが調整される。
【0062】
ステップS130では、書き込み面における対象物の移動軌跡は書き込み軌跡として抽出され、書き込み軌跡が出力される。
【0063】
実施形態では、文字を単位としてステップS130で出力される。
【0064】
ステップS140では、文字認識は書き込み軌跡に従って行われ、文字認識結果が出力される。
【0065】
図7は、別の実施形態に従うハンドジェスチャー認識に基づくテキスト入力方法のフローチャートである。
【0066】
ハンドジェスチャー認識に基づくテキスト入力方法であって、方法は下記を含む。
【0067】
ステップS210では、ユーザのハンドジェスチャーが認識され、ハンドジェスチャー認識の結果に従って書き込み状態が開始される。
【0068】
実施形態では、ステップS210ではユーザの音声が認識されて、音声認識の結果に従って書き込み状態が開始される。
【0069】
ステップS220では、対象物を含む画像情報が収集される。
【0070】
ステップS230では、画像情報に従って対象物が決定され、対象物の書き込み面及び移動軌跡が取得される。
【0071】
ステップS240では、書き込み面における対象物の移動軌跡が書き込み軌跡として抽出され、書き込み軌跡が出力される。
【0072】
ステップS250では、書き込み軌跡に従って文字認識が行われ、文字認識結果が出力される。
【0073】
ステップS260では、文字認識結果及び書き込み軌跡が表示される。
【0074】
特に、書き込み軌跡が最初に表示されて、その後文字認識結果が表示される。なぜならば書き込み軌跡はリアルタイムで表示されているからである。実施形態では、文字認識結果又は書き込み軌跡しか表示できない。
【0075】
実施形態では、ステップS260で書き込み軌跡を表示するステップは下記を含む。
【0076】
対象物が基準書き込み面に対して45度から90度の間の角度で書き込み面から離れているか、又は対象物が書き込み面から事前設定された速度で離れているかが検出されて、「はい」の場合には書き込み軌跡の表示を停止する。
【0077】
対象物が基準書き込み面に対して45度から90度の間の角度で書き込み面に達しているかを検出して、又は対象物が書き込み面に事前設定された速度で達しているかを検出して、又は対象物が書き込み面に「L」字型の移動軌跡で達しているかを検出する。対象物が基準書き込み面に対して45度から90度の角度で書き込み面に達している場合、又は対象物が事前設定された速度で書き込み面から離れている場合、又は対象物が「L」字型の移動軌跡で書き込み面に達している場合、書き込み軌跡を表示し始める。
【0078】
ステップS270では、ユーザのハンドジェスチャーが認識されて、ハンドジェスチャー認識の結果に従って書き込み状態が終了する。
【0079】
実施形態では、ステップS270は、ユーザの音声が認識され、音声認識結果に従って書き込み状態が終了する。
【0080】
【0081】
ユーザは、カメラの見える範囲に指を見せて、音声で書き込み状態を開始する。図8に示すように、ユーザの指が位置「0」から第1ストローク開始位置「1」へ移動するのが下方ストロークであり、位置「1」から位置「2」へ移動するのが第1ストロークであり、第1ストロークが位置する面が書き込み面と規定される。位置「2」から位置「3」へは上方へのストロークであり、位置「3」から位置「4」への移動は書き込み面外での動きである。位置「4」から位置「5」へは第2の下方へのストロークであり、位置「5」から位置「6」までが第2ストロークである。位置「6」から位置「7」までは上方へのストロークであり、位置「7」から位置「8」への移動は書き込み面外の動きである。位置「8」から位置「9」までは第3ストロークであり、位置「9」から位置「10」までは第3ストロークであり、位置「10」から位置「11」へは上方へのストロークであり、文字の入力が完成する。ユーザの指は、位置「1」、「2」、「5」、「6」、「9」、「10」で一時停止する。ユーザの指の移動軌跡は位置「0」から位置「11」まで連続しているが、書き込み面での移動軌跡のみが書き込み軌跡として抽出されるため、これはストローク識別処理になり、入力文字の認識精度を向上でき、ユーザのテキスト入力を容易にし、良い書き方を子供に教えることができる。
【0082】
上記のハンドジェスチャーに基づくテキスト入力方法によると、対象物は画像情報により決定され、対象物の書き込み面及び移動軌跡が取得され、書き込み面における対象物の移動軌跡が出力される書き込み軌跡として抽出され、書き込み軌跡に従って文字認識がされ、文字認識結果が出力され、空中の対象物の移動軌跡が連続していても、軌跡抽出モジュールは書き込み面における書き込み軌跡のみを抽出して、これはストローク識別処理と同等であり、文字認識モジュールの認識を容易にして、認識の精度を向上する。
【0083】
実施形態には、少なくとも一つの非一過性の記録媒体も設けられており、非一過性の記録媒体はコンピュータ読み取り可能命令を記録し、少なくとも一つのプロセッサがコンピュータ読み取り可能命令を実行すると、少なくとも一つのプロセッサは下記のステップを実施する。
【0084】
対象物を含む画像情報が収集される。
【0085】
画像情報に従って対象物が決定され、対象物の書き込み面及び移動軌跡が取得される。
【0086】
書き込み面における対象物の移動軌跡が書き込み軌跡として抽出され、書き込み軌跡が出力される。
【0087】
書き込み軌跡に従って文字認識が実施され、文字認識結果が出力される。
【0088】
上記の実施形態の方法のプロセスは、基盤となるハードウェアを命令するコンピュータプログラムに、一部又は全部、実施されることができ、プログラムはコンピュータ読取り可能記録媒体に記録することができ、プログラムは実施されるときに様々な方法の実施形態のプロセスを含むこともできる。記録媒体は、ディスク、CD、読み取り専用メモリ(ROM)、及び他の非一過性記録媒体又はランダムアクセスメモリ(RAM)等である。
【0089】
上記の実施形態における異なる技術特徴は様々な組み合わせが可能であり、それらはここでは省略する。しかしながら、異なる技術特徴の組み合わせが互いにコンフリクトしない程度に、全てのその様な組み合わせは本開示の範囲内であるとみなすべきである。
【0090】
上記の実施形態は単に本開示の特定の実施形態にすぎず、本開示の保護範囲を限定するものではない。当業者により容易に考えられる本開示に記載される技術範囲内にあるあらゆる変形又は代替は、全て本開示の保護範囲内にある。従って、本開示の保護範囲はクレームの保護範囲内であるとされる。
図1
図2
図3
図4
図5
図6
図7
図8