特許第5789270号(P5789270)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ サムスン エレクトロニクス カンパニー リミテッドの特許一覧

特許5789270表面音響信号を用いたユーザインタフェース提供装置及び方法、ユーザインタフェースを備えるデバイス
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5789270
(24)【登録日】2015年8月7日
(45)【発行日】2015年10月7日
(54)【発明の名称】表面音響信号を用いたユーザインタフェース提供装置及び方法、ユーザインタフェースを備えるデバイス
(51)【国際特許分類】
   G06F 3/043 20060101AFI20150917BHJP
   G06F 3/0354 20130101ALI20150917BHJP
   G06F 3/0488 20130101ALI20150917BHJP
【FI】
   G06F3/043
   G06F3/033 450
   G06F3/048 620
【請求項の数】24
【全頁数】22
(21)【出願番号】特願2012-551100(P2012-551100)
(86)(22)【出願日】2011年2月1日
(65)【公表番号】特表2013-519132(P2013-519132A)
(43)【公表日】2013年5月23日
(86)【国際出願番号】KR2011000680
(87)【国際公開番号】WO2011096694
(87)【国際公開日】20110811
【審査請求日】2014年1月8日
(31)【優先権主張番号】10-2010-0083609
(32)【優先日】2010年8月27日
(33)【優先権主張国】KR
(31)【優先権主張番号】10-2010-0009545
(32)【優先日】2010年2月2日
(33)【優先権主張国】KR
(73)【特許権者】
【識別番号】503447036
【氏名又は名称】サムスン エレクトロニクス カンパニー リミテッド
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100091214
【弁理士】
【氏名又は名称】大貫 進介
(72)【発明者】
【氏名】チェ,スン チョル
(72)【発明者】
【氏名】リ,ソン ジェ
(72)【発明者】
【氏名】チャン,キョン ア
(72)【発明者】
【氏名】リ,ホ ソプ
(72)【発明者】
【氏名】チェー,ヒョン ジン
【審査官】 円子 英紀
(56)【参考文献】
【文献】 特開2005−018611(JP,A)
【文献】 国際公開第2008/047294(WO,A2)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 3/043
G06F 3/0354
G06F 3/0488
(57)【特許請求の範囲】
【請求項1】
デバイスのユーザインタフェース提供装置において、
前記デバイス外部の媒質で発生した表面音響信号を取得する表面音響信号取得部と、
前記表面音響信号の特徴を分析して前記媒質に対応する前記表面音響信号のパターンを認識するパターン認識部と、
前記表面音響信号のパターンに基づいてユーザの入力信号を識別するユーザ入力識別部と、
を備え、
前記パターン認識部は、テスト信号を用いて前記媒質の種類を判断する、
ことを特徴とするユーザインタフェース提供装置。
【請求項2】
前記デバイス外部の媒質は、前記デバイスと接触する物体によって前記ユーザに提供されることを特徴とする請求項1に記載のユーザインタフェース提供装置。
【請求項3】
前記表面音響信号取得部は、
前記物体に接触して前記表面音響信号を受信する媒質接触部と、
前記表面音響信号をデジタル信号に変換する音響センサと、
を備えることを特徴とする請求項2に記載のユーザインタフェース提供装置。
【請求項4】
前記デバイス外部の媒質は、前記デバイスの外装ケースを介して前記ユーザに提供されることを特徴とする請求項1に記載のユーザインタフェース提供装置。
【請求項5】
前記パターン認識部は、
前記表面音響信号の時間−ドメイン上の特徴、または周波数−ドメイン上の特徴のうち少なくとも1つの特徴を抽出する特徴抽出部と、
前記時間−ドメイン上の特徴、または周波数−ドメイン上の特徴のうち少なくとも1つの特徴に基づいて前記表面音響信号のパターンを分析するパターン分析部と、
を備えることを特徴とする請求項1に記載のユーザインタフェース提供装置。
【請求項6】
前記時間−ドメイン上の特徴は、前記表面音響信号の振幅、ゼロクロッシングの分布、エネルギーの大きさ、長さ、形態のうち少なくともいずれか1つを含むことを特徴とする請求項5に記載のユーザインタフェース提供装置。
【請求項7】
前記パターン認識部は、前記媒質の種類を考慮して前記表面音響信号のパターンを認識することを特徴とする請求項1に記載のユーザインタフェース提供装置。
【請求項8】
前記パターン認識部は、前記表面音響信号の周波数−ドメイン特性に基づいて前記表面音響信号を発生させたツールを推定し、前記表面音響信号の発生ツールを考慮して前記表面音響信号のパターンを認識することを特徴とする請求項1に記載のユーザインタフェース提供装置。
【請求項9】
前記ユーザ入力識別部は、前記表面音響信号のパターンにマッチングされる最小の意味単位を区分し、前記最小の意味単位に基づいて前記ユーザの入力信号を識別することを特徴とする請求項1に記載のユーザインタフェース提供装置。
【請求項10】
前記パターン認識部から複数のパターンを順に受信し、前記複数のパターンそれぞれに対応する最小の意味単位を組み合わせて前記ユーザの入力信号を識別することを特徴とする請求項1に記載のユーザインタフェース提供装置。
【請求項11】
前記パターンは前記表面音響信号の進行方向に関する情報を含み、前記ユーザ入力識別部は、前記表面音響信号の進行方向に関する情報に基づいて前記ユーザの入力信号を識別することを特徴とする請求項1に記載のユーザインタフェース提供装置。
【請求項12】
媒質の種類及び入力ツールの種類に応じて区分された前記表面音響信号のパターンモデルを格納するパターンモデル格納部をさらに備えることを特徴とする請求項1に記載のユーザインタフェース提供装置。
【請求項13】
前記ユーザの入力信号は、前記媒質の表面上から入力される文字、図形、ドラッギング、タッチイベントのうち少なくとも1つを含むことを特徴とする請求項1に記載のユーザインタフェース提供装置。
【請求項14】
デバイスのユーザインタフェース提供方法において、
前記デバイス外部の媒質で発生した表面音響信号を取得するステップと、
前記表面音響信号の時間−ドメイン上の特徴、または周波数−ドメイン上の特徴のうち少なくとも1つの特徴を抽出するステップと、
前記時間−ドメイン上の特徴、または周波数−ドメイン上の特徴のうち少なくとも1つの特徴に基づいて前記表面音響信号のパターンを分析するステップと、
前記表面音響信号のパターンに基づいてユーザの入力信号を識別するステップと、
を含み、
前記表面音響信号のパターンを分析するステップは、
テスト信号を用いて前記媒質の種類を判断するステップと、
を含む、ことを特徴とするユーザインタフェース提供方法。
【請求項15】
前記表面音響信号のパターンを分析するステップは、さらに、
前記表面音響信号の周波数−ドメイン特性に基づいて前記表面音響信号を発生させたツールを推定するステップと、
前記媒質の種類及び前記表面音響信号を発生させたツールを考慮して前記表面音響信号のパターンを認識するステップと、
を含むことを特徴とする請求項14に記載のユーザインタフェース提供方法。
【請求項16】
前記識別するステップは、
複数のパターンを順に受信するステップと、
前記複数のパターンそれぞれに対応する最小の意味単位を組み合わせて前記ユーザの入力信号を識別するステップと、
を含むことを特徴とする請求項14に記載のユーザインタフェース提供方法。
【請求項17】
デバイスのユーザインタフェース提供方法において、
前記デバイス外媒質からユーザの入力信号を受信する外部入力モードを実行させるステップと、
前記デバイス外媒質から表面音響信号が受信されれば、前記表面音響信号の特徴を分析して前記媒質に対応する前記表面音響信号のパターンを認識するステップと、
前記表面音響信号のパターンに基づいてユーザの入力信号を識別するステップと、
を含み、
前記表面音響信号のパターンを認識するステップは、
テスト信号を用いて前記媒質の種類を判断するステップと、
を含む、ことを特徴とするユーザインタフェース提供方法。
【請求項18】
前記デバイスのユーザインタフェース提供方法は、さらに、
前記デバイス外媒質から表面音響信号が受信されれば、前記表面音響信号の進行方向を判断するステップと、
前記表面音響信号の進行方向に対応する前記デバイスの機能を実行させるステップと、
を含むことを特徴とする請求項17に記載のユーザインタフェース提供方法。
【請求項19】
前記表面音響信号の進行方向は、「前記表面音響信号の波形の形」、「第1音響センサで受信される第1表面音響信号及び第2音響センサで受信される第2表面音響信号の受信時間の差」、「前記第1表面音響信号及び前記第2表面音響信号の大きさ変化」のうち少なくともいずれか1つによって判断されることを特徴とする請求項18に記載のユーザインタフェース提供方法。
【請求項20】
デバイスのユーザインタフェース提供方法において、
デバイスの外部の媒質でユーザによって発生した音響信号を取得するステップと、
前記音響信号を分析するステップと、
前記分析された音響信号に基づいてユーザの入力信号を識別するステップと、
を含み、
前記音響信号を分析するステップは、
テスト信号を用いて前記媒質の種類を判断するステップと、
を含む、ことを特徴とするデバイスのユーザインタフェース提供方法。
【請求項21】
前記音響信号は、媒質と前記ユーザの手の接触によって発生することを特徴とする請求項20に記載のデバイスのユーザインタフェース提供方法。
【請求項22】
前記音響信号は、媒質と前記ユーザによって用いられたツールの接触によって発生することを特徴とする請求項20に記載のデバイスのユーザインタフェース提供方法。
【請求項23】
前記音響信号は、前記デバイスがユーザによって接触された媒質に接触した状態で取得されることを特徴とする請求項20に記載のデバイスのユーザインタフェース提供方法。
【請求項24】
前記音響信号は表面音響信号であることを特徴とする請求項20に記載のデバイスのユーザインタフェース提供方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は表面音響信号を用いたユーザインタフェースの提供に関する。
【背景技術】
【0002】
電子機器の機能を操作するためのユーザインタフェース提供装置は、主に操作キー、ボタン、マウスまたはタッチスクリーンなどを中心に開発されてきた。従来のユーザインタフェース提供装置はボタンやスクリーンのような電子回路で構成されるため、電子回路が装着されていない部分はインタフェースで使用できないという入力範囲の限界が存在する。そして、平面ではない屈曲な箇所や家具、あるいは壁のような一般のオブジェクトにインタフェース装置を内蔵するためには、外部の衝撃や汚染に強い特性を有するべきであるが、このようなユーザインタフェース装置を実現することは難しい。
【0003】
一方、従来におけるユーザインタフェース提供装置は、電子機器の特定領域に固定されて動作する。したがって、電子機器のインタフェース、すなわち、入力領域が服やカバンの内部などの手に届かない所にあれば操作が不便であり、モバイル装置などのように電子機器の自体空間が限定的な場合には十分な入力空間を確保し難い。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の目的は、インタフェースの入力空間の制約を克服して従来のインタフェースで使用可能な装置よりも費用が安価であるインターフェーシング技術を提供する。
【課題を解決するための手段】
【0005】
一側面において、デバイスのユーザインタフェース提供装置は、前記デバイス外部の媒質で発生した表面音響信号を取得する表面音響信号取得部と、前記表面音響信号の特徴を分析して前記媒質に対応する前記表面音響信号のパターンを認識するパターン認識部と、前記表面音響信号のパターンに基づいてユーザの入力信号を識別するユーザ入力識別部とを備える。
【0006】
他の一側面において、デバイスのユーザインタフェース提供方法は、表面音響信号を取得するステップと、前記表面音響信号の時間−ドメイン上の特徴、または周波数−ドメイン上の特徴のうち少なくとも1つの特徴を抽出するステップと、前記時間−ドメイン上の特徴、または周波数−ドメイン上の特徴のうち少なくとも1つの特徴に基づいて前記表面音響信号のパターンを分析するステップと、前記表面音響信号のパターンに基づいてユーザの入力信号を識別するステップとを含む。
【0007】
他の一側面において、デバイスのユーザインタフェース提供方法は、前記デバイスの外部媒質からユーザの入力信号を受信する外部入力モードを実行させるステップと、前記デバイスの外部媒質から表面音響信号が受信されれば、前記表面音響信号の特徴を分析して前記媒質に対応する前記表面音響信号のパターンを認識するステップと、前記表面音響信号のパターンに基づいてユーザの入力信号を識別するステップとを含む。
【0008】
他の一側面において、デバイスのユーザインタフェース提供方法は、前記デバイスの外部媒質からユーザの入力信号を受信する外部入力モードを実行させるステップと、前記デバイスの外部媒質から表面音響信号が受信されれば、前記表面音響信号の進行方向を判断するステップと、前記表面音響信号の進行方向に対応する前記デバイスの機能を実行させるステップとを含む。
【0009】
他の一側面において、電子装置は、前記デバイスの外部で発生した表面音響信号を取得するセンサと、前記表面音響信号の特徴を分析して前記表面音響信号のパターンを区分し、前記表面音響信号のパターンに基づいて前記表面音響信号に対応するユーザの入力信号を識別するように構成された少なくとも1つのプロセッサとを含む。
【発明の効果】
【0010】
本発明のインタフェース提供装置及び方法によると、デバイスのインタフェースの拡張が可能である。すなわち、文字、図形、ドラッギング、タッチイベントなどのユーザ入力のための空間はタッチスクリーン、キーパネルなどの特定の入力空間に制限されない。したがって、ユーザはデバイス周辺の任意の空間でデバイスを操作できる。
【0011】
また、本発明によると、表面音響信号を発生させる媒質が変更される場合にも正確にユーザの入力信号を識別できるインタフェースを提供することができる。
【0012】
また、本発明によると、表面音響信号を発生させたツールを正確に区別することで、ユーザに便宜性を提供することができる
本発明によると、デバイスを直接タッチしない場合にもユーザの意図を識別するため、デバイス及びデバイスの付属品の寿命を増加させる。
【0013】
本発明によると、表面音響信号で発生するスペクトル情報を分析することによって入力ツールまたは入力媒質を判別し、判別された入力ツールまたは入力媒質ごとに異なる機能を付与して用いることができる。これは、入力ツールと入力媒質に応じて発生する周波数スペクトルが異なる特徴を持っているためである。
【0014】
また、本発明によると、2つ以上のセンサから取得される表面音響信号の時間情報を用いてユーザの入力信号をより正確に識別することができる。
【図面の簡単な説明】
【0015】
図1】表面音響信号を用いたインタフェースの拡張例を説明するための図である。
図2】一実施形態に係るユーザインタフェース提供装置を示す図である。
図3図1及び図2で表面音響信号取得部の構成例を示す図である。
図4】他の実施形態に係るユーザインタフェース提供装置の構成を示す。
図5A図4のフィルタ及び単純化部から出力される信号の例を示す図である。
図5B図4のフィルタ及び単純化部から出力される信号の例を示す図である。
図6】「最小の意味単位」に対する例を示す。
図7A】入力ツールによる表面音響信号の周波数特性を例示する図である。
図7B】入力ツールによる表面音響信号の周波数特性を例示する図である。
図7C】入力ツールによる表面音響信号の周波数特性を例示する図である。
図7D】入力ツールによる表面音響信号の周波数特性を例示する図である。
図8】ユーザの入力信号が文字である場合、ユーザの入力信号を識別する例を説明するための図である。
図9】それぞれの直線に対応する表面音響信号の波形の例を示す。
図10】それぞれの直線に対応する表面音響信号の波形の例を示す。
図11】ユーザインタフェース提供装置に2つ以上の音響センサが備えられた場合、取得される表面音響信号の一例を示す図である。
図12】デバイスのケースを例示する図である。
図13】一実施形態に係るデバイスのユーザインタフェース提供方法を示す。
図14】表面音響信号のパターンを分析する過程の例を示す。
図15】他の実施形態に係るユーザインタフェース提供方法を示す。
図16】他の実施形態に係るユーザインタフェース提供方法を示す。
【発明を実施するための形態】
【0016】
本明細書において、「デバイス」はポータブル装置(Potable Device)、電子機器(Electronic Device)などを包括する概念として用いられる。また、ユーザインタフェース提供装置はデバイスに含まれて構成してもよい。すなわち、ユーザインタフェース提供装置はデバイスのユーザインタフェースを提供する。ここで、デバイスは移動端末、タブレットPC、ポータブルメディアプレーヤー、家電製品など、ユーザの操作が可能な全てのデバイスを含む。
【0017】
図1は、表面音響信号を用いたインタフェースの拡張例を説明するための図である。図1を参照すると、デバイス120は特定媒質を有する物体110上にある。物体110は、例えば、テーブルや机であってもよい。物体110の表面でユーザのジェスチャー(gesture)に応じて表面音響信号が発生する。ユーザのジェスチャーはドラッギング(dragging)、文字入力などの様々なタッチイベントを含む。表面音響信号は媒質の形態とは関係なく伝播され、空気、ガラス、金属、木などの全ての媒質を介して伝えられる特性がある。
【0018】
図1の例として、ユーザのジェスチャーに応じて発生した表面音響信号はデバイス120を操作するための「ユーザの入力信号」に該当し、デバイス120はユーザの入力信号に対応する機能を行う。したがって、デバイス120は、拡張されたインタフェースを介して「ユーザの入力信号」を取得する機能及びユーザの入力信号を識別する機能を有する。ユーザの入力信号を識別することによって、デバイス120はユーザの意図を正確に把握することができる。
【0019】
図1の例として、デバイス120は、表面音響信号を取得するためのセンサ及びユーザの入力信号を識別するように構成された少なくとも1つのプロセッサを含んでもよい。ここで、少なくとも1つのプロセッサは、表面音響信号の特徴を分析して前記表面音響信号のパターンを区分し、前記表面音響信号のパターンに基づいて前記表面音響信号に対応するユーザの入力信号を識別するように構成される。すなわち、ユーザのジェスチャーに応じて発生した表面音響信号は、デバイス120を操作するための命令語、文字の入力、その他の機能を実行させるための入力信号として用いられてもよい。
【0020】
図2は、一実施形態に係るユーザインタフェース提供装置を示す図である。図2に示されたデバイスのユーザインタフェース提供装置200は、図1に示すデバイス120に内蔵された形態で構成されてもよい。
【0021】
図2を参照すると、ユーザインタフェース提供装置200は、表面音響信号取得部210、パターン認識部220及びユーザ入力識別部230を備える。また、ユーザインタフェース提供装置200はパターンモデル格納部240をさらに備えてもよい。
【0022】
表面音響信号取得部210は、デバイス外部の媒質(medium)で発生した表面音響信号を取得する。ここで、デバイス外部の媒質は、デバイスと接触する物体によってユーザに提供される拡張されたインタフェースに該当する。また、デバイス外部の媒質は、デバイスの外装ケースを介してユーザに提供される。表面音響信号取得部210は少なくとも1つの音響センサを含んで構成してもよい。
【0023】
パターン認識部220は、表面音響信号の特徴を分析して媒質に対応する表面音響信号のパターンを認識する。パターン認識部220は、表面音響信号の時間−ドメイン上の特徴または周波数−ドメイン上の特徴のうち少なくとも1つの特徴を抽出する特徴抽出部221、及び表面音響信号の時間−ドメイン上の特徴または周波数−ドメイン上の特徴のうち少なくとも1つの特徴に基づいて表面音響信号のパターンを分析するパターン分析部223を備えてもよい。また、パターン認識部220は、雑音除去、信号増幅及び信号を単純化するための表面音響信号処理部(図示せず)をさらに備えてもよい。前記時間−ドメイン上の特徴は、表面音響信号の振幅、ゼロクロッシングの分布、エネルギーの大きさ、長さ、形態のうち少なくともいずれか1つを含む。
【0024】
パターン認識部220は、「表面音響信号の特徴抽出」、「表面音響信号を発生させたツールの推定」及び「表面音響信号が伝えられる媒質の種類推定」を行う。したがって、パターン認識部220は入力ツールまたは入力媒質が変更される場合にも、表面音響信号のパターンを正確に認識することができる。
【0025】
ユーザ入力識別部230は、表面音響信号のパターンに基づいてユーザの入力信号を識別する。ユーザ入力識別部230は、表面音響信号のパターンにマッチングされる「最小の意味単位」を区分し、前記「最小の意味単位」に基づいてユーザの入力信号を識別する。また、ユーザ入力識別部230はパターン認識部220から複数のパターンを順に受信し、前記複数のパターンそれぞれに対応する最小の意味単位を組み合わせて前記ユーザの入力信号を識別する。識別されたユーザの入力信号は、デバイスに備えられた表示部及び制御部に提供される。ユーザの入力信号が文字である場合、ユーザが入力した文字が表示される。ユーザの入力信号が特定機能の実行に該当する場合、制御部は該当機能を実行させる。
【0026】
パターンモデル格納部240は、媒質の種類及び入力ツールの種類に応じて区分された表面音響信号のパターンモデルを格納する。すなわち、パターンモデル格納部240には様々な媒質それぞれの表面音響信号のパターンモデル及び様々な入力ツールそれぞれの特徴情報が格納されている。
【0027】
以下、ユーザインタフェース提供装置200によって行われる「表面音響信号の特徴抽出」、「表面音響信号を発生させたツールの推定」及び「表面音響信号が伝えられる媒質の種類推定」を詳細に説明する。次に、ユーザインタフェース提供装置200によって行われる「ユーザの入力信号識別」を詳細に説明する。
【0028】
<1.表面音響信号の特徴抽出>
表面音響信号の特徴抽出は、表面音響信号のパターンを分析するために必要な特徴を表面音響信号から抽出する。一側面において、表面音響信号の特徴抽出は、DSP(Digital Signal Processor)のようなハードウェア装置、ソフトウェア、またはハードウェア装置に適するようにプログラミングされた手段によって行われてもよい。ただし、説明の便宜上、表面音響信号の特徴抽出は特徴抽出部221によって行われると仮定する。
【0029】
表面音響信号の特徴は、特定の意味を有する「最小の意味単位」に区分され得る。ここで、「最小の意味単位」は、ユーザの入力信号を識別するために必要な最も基本的な形態に対する定義である。「最小の意味単位」は図6に示すように、点、円、直線、アルファベットなどのように最小の意味を有する表面音響信号の単位であってもよい。
【0030】
表面音響信号は、ユーザが手やペンなどの物を用いて媒質の表面に人為的に音を発生させる過程を介して取得され得る。表面音響信号の特徴を抽出するために、文字のような複雑な形の音を分析し、表面音響信号に対する特徴を抽出して表面音響信号を最小の意味単位に分類する過程が求められる。様々な最小の意味単位それぞれは信号の形態が一定のパターンを有する。したがって、特徴抽出部221は表面音響信号から特徴を抽出し、抽出された特徴を用いて最小の意味単位を分類する。
【0031】
一側面において、最小の意味単位は次の5個の過程によって抽出され得る。
1.取得された表面音響信号を最小の意味単位の信号Sを分離する。
2.最小の意味単位の信号SをN個のフレームに分割する。
3.N個のフレームそれぞれの特徴値Cを抽出し、Cを格納する。
4.取得された表面音響信号全体の特徴値Cを抽出し、Cを格納する。
5.DBに最小の意味単位のパターンモデルを格納する場合、C及びCを用いた機械的な学習モデルMを生成し、MをDBに格納する。
【0032】
上記の5個の過程は最小の意味単位のパターンモデルをDBに格納するために用いられてもよい。すなわち、最小の意味単位のパターンモデルは、媒質の種類及び表面音響信号の入力ツールごとに区分されてDBに格納される。現在の入力される表面音響信号から抽出された特徴をDBに格納された「最小の意味単位のパターンモデル」と比較することによって、現在の入力される表面音響信号のパターンが認識される。
【0033】
上記の5個の過程において、「特徴値」とは、該当信号の時間−ドメイン上の特徴(features)を時間的に正規化する値である。また、「特徴値」は該当信号の周波数ドメイン上の特徴であってもよい。時間ドメイン上の特徴を周波数ドメイン上の特徴と適切に結合し、様々な機械的な学習方式によって「最小の意味単位のパターンモデル」を生成する。ここで、時間ドメイン上の特徴は、振幅間の標準偏差及び傾き(wave slope)、振幅のDR(Dynamic Range)、振幅の分布、ゼロクロッシングの分布及び変化量、エネルギー総量及びエネルギー量変化、信号の長さなどがある。
【0034】
音響信号は、信号レベルの強弱が存在することから振幅の変化が存在する。サンプリング比率に応じて表面音響信号から離散的な振幅値が取得できる。離散的な振幅値を繋ぐ線分の傾きを求めると、信号レベルの変化を測定することができる。信号の振幅の変化は、媒質上に入力される直線、曲線、折れ線などの識別のための1つの要素として用いられてもよい。
【0035】
特徴抽出部221は、該当信号の振幅の分布によって類似の信号を区分してもよい。例えば、円に対応する信号の振幅の分布は一定の値が続けて維持される形態であってもよい。
【0036】
ゼロクロッシングの分布は、信号の符号が変わる地点を何個持っているかを意味する。すなわち、1つのフレーム内で信号のレベルが基準点である0と接する地点をゼロクロッシングと定義する。ゼロクロッシングの分布は、該当信号の高周波及び低周波の比率を示す。例えば、時間の長さがNである場合、ゼロクロッシング分布は数式(1)のように定義される。
【0037】
【数1】
特徴抽出部221は、ゼロクロッシングの分布、ゼロクロッシングの分布の変化量の推移などを用いて該当信号の固有な特徴を抽出する。特徴抽出部221は、該当信号が有するエネルギーの総量を該当信号の特徴として用いてもよい。時間の長さがNである場合、時間Nの間に現れた離散信号X(i)のエネルギーの総量は数式(2)の通りである。
【0038】
【数2】
また、特徴抽出部221は、数個のフレームそれぞれのエネルギーの量を該当信号の特徴として用いてもよい。
【0039】
特徴抽出部221は、該当信号の長さを用いて信号を区別してもよい。信号の長さの単位は時間を用いる。例えば、点と円は信号の長さが明確に異なる。すなわち、特徴抽出部221は、表面音響信号の取得が開始する時間と表面音響信号の取得が終了する時間を表面音響信号の長さとして決定してもよい。
【0040】
信号の時間−ドメイン上の特徴は基準時間の単位で正規化され、正規化された値はDBに格納される。信号の時間−ドメイン上の特徴を正規化してDBに格納すると、格納されるデータの大きさを減らし得る。例えば、長い直線と短い直線は先に直線に該当する特徴を認識した後、次に長さ情報を用いて相対的な長さを測定する。
【0041】
該当信号の周波数ドメイン上の特徴は、フーリエ変換、スペクトル分析などを介して把握できる。
【0042】
<2.表面音響信号が伝えられる媒質の種類推定>
媒質の種類推定は、表面音響信号から抽出された特徴をパターンモデルと比較する過程である。ユーザが表面音響信号を生成するとき使用する入力媒質は単一媒質(例えば、ガラス)と複合媒質(例えば、机)に区分してもよい。表面音響信号の形態変化は、センサの種類だけではなく媒質面の凹凸の程度に応じて極めて大きい場合もある。媒質の種類推定は、DSP(Digital Signal Processor)のようなハードウェア装置、ソフトウェア、またはハードウェア装置に適するようにプログラミングされた手段によって行われてもよい。ただし、説明の便宜上、表面音響信号の特徴抽出はパターン認識部220によって行われると仮定する。
【0043】
パターン認識部220はテスト信号を用いて前記媒質の種類を判断し、前記媒質の種類を考慮して前記表面音響信号のパターンを認識する。例えば、媒質の種類は次の3つの過程によって推定されてもよい。
1.テスト信号を発生させる。
2.デバイスに接触した媒質を介して伝播する表面音響信号を取得する。
3.上記の2で取得された表面音響信号の特徴とマッチングされる媒質をDBから探す。
【0044】
テスト信号はデバイスに内蔵されたスピーカまたは振動発生装置を介して発生することがある。ここで、テスト信号は、短い周期を有する一定の信号レベルの音響信号または振動であってもよい。テスト信号に対応する表面音響信号は、デバイスに内蔵されたマイク及び圧電センサを用いて取得され得る。
【0045】
パターン認識部220は上記の2で取得された表面音響信号の周波数の分布範囲、振幅、伝達速度などを算出し、算出された情報をDBに格納されたモデルと比較することによってデバイスに接触した媒質の種類を推定する。一方、パターン認識部220は、上記の2で取得された表面音響信号の特徴とマッチングされるモデルがない場合、最も近接したモデルをデバイスに接触した媒質として判断する。
【0046】
媒質の種類推定を周期的に行う場合、実質的にリアルタイムに近い媒質の変化推定が可能である。
【0047】
<3.表面音響信号を発生させたツールの推定>
表面音響信号を発生させたツールの推定はユーザの入力ツールを推定することにある。ここで、入力ツールは、指、ペン、スタイラス、その他のツールのいずれか1つであってもよい。すなわち、ユーザは指やスタイラスなどの様々な入力ツールによってデバイスを操作してもよい。入力ツールの推定はDSP(Digital Signal Processor)のようなハードウェア装置、ソフトウェア、または、ハードウェア装置に適するようにプログラミングされた手段によって行われてもよい。ただし、説明の便宜上、入力ツールの推定はパターン認識部220によって行われるものと仮定する。
【0048】
パターン認識部220は、表面音響信号の周波数−ドメイン特性に基づいて前記表面音響信号を発生させたツールを推定し、前記表面音響信号の発生ツールを考慮して表面音響信号のパターンを認識する。
【0049】
信号の周波数特性は様々な方式によって抽出される。例えば、周波数特性は、該当信号を離散フーリエ変換(DFT)することによって抽出してもよい。また、信号の周波数特性は、該当信号の「Total Power Spectrum」、「サブバンドパワー」、「中心周波数」、「帯域幅」、「スペクトルフラックス」などを用いて抽出される。入力ツールごとの周波数特性は機械的な学習によってDBに格納されてもよい。
【0050】
入力ツール別の周波数−ドメイン特性の様々な例は図7A乃至図7Dを参照して詳細に説明する。
【0051】
<4.ユーザの入力信号識別>
ユーザの入力信号識別は、ユーザの意図またはユーザのジェスチャーを区分するためのものである。ユーザの入力信号は単純なドラッギング、文字入力、タップ(tap、媒質を軽く打つこと)、特定のタッチイベントなどがある。ユーザの入力信号を識別することによってデバイスは様々な機能を行うことができる。
【0052】
例えば、ユーザがデバイスに接触している外部媒質の表面を左側から右側にドラッギングすれば、デバイスの特定機能が実行されるように設定されてもよい。ここで、ドラッギングの方向は、表面音響信号の進行方向を推定することによって識別され得る。表面音響信号の進行方向推定は、1つの音響センサまたは複数の音響センサによって識別される。すなわち、表面音響信号のパターンは表面音響信号の進行方向に関する情報を含む。ユーザ入力識別部230は、表面音響信号の進行方向に関する情報に基づいて前記ユーザの入力信号を識別することができる。
【0053】
例えば、ユーザがデバイスに接触している外部媒質の表面で文字を入力する場合、文字は「最小の意味単位」によって識別され得る。
【0054】
図3は、図1及び図2で表面音響信号取得部210の構成例を示す図である。図3を参照すると、表面音響信号取得部210は、図3に示すように媒質接触部311及び音響センサ313を含んで構成される。
【0055】
媒質接触部311は、物体110に接触して表面音響信号を受信する。媒質接触部311は、物体110に密着できる様々な材質から構成されてもよい。
【0056】
音響センサ313は表面音響信号をデジタル信号に変換する。音響センサ313の種類として、コンデンサ型マイクロホン、エレクトロニック型マイクロホン、圧電型センサ及び超音波センサがある。コンデンサ型マイクロホンとエレクトロニック型マイクロホンは騒音センサとして、空気のような媒質を介して伝えられる音響の圧力による程度を電気的な信号に変換するセンサである。圧電型(piezo−electronic)センサは振動センサとして、人や物体などによって発生する振動から取得された圧力を電気的な信号に変換するセンサである。超音波センサは、人の耳では聴くことのできない超音波をセンシングして音響信号の距離や位置を判別するセンサである。
【0057】
図4は、他の実施形態に係るユーザインタフェース提供装置の構成を示す。図4を参照すると、ユーザインタフェース提供装置400は、表面音響信号取得部410、音響信号処理部420、特徴抽出部430、データベース(DB:DataBase)440、パターン判断部450、時間信号算出部460及びユーザ入力識別部470を備える。
【0058】
表面音響信号取得部410は図2に示す表面音響信号取得部210と同一の機能を行う。
【0059】
音響信号処理部420は表面音響信号の雑音を除去した後、雑音の除去された表面音響信号の波形を単純化する。音響信号処理部420は増幅器421、フィルタ423及び単純化部425を備えてもよい。増幅器421は取得された表面音響信号を増幅する。フィルタ423は、増幅された表面音響信号を特定の周波数帯域ごとに選別的にフィルタリングし、増幅された表面音響信号に追加された雑音を除去する。例えば、フィルタ423は、表面音響信号の最大周波数の大きさ(例えば、3KHz)以上の信号は雑音と見なして雑音を除去する。単純化部425は、雑音の除去された表面音響信号をリアルタイムでより多く処理するために単純化する。図5Aで示された信号はフィルタ423から出力される表面音響信号であり、図5Bに示された信号は単純化された表面音響信号の一例を示す。図5Aおよび図5Bにおける「振幅」は信号の強弱または高低を示し、「t」は時間である。単純化部435は信号の高低を判断して信号を単純化する。
【0060】
音響信号処理部420は、単純化された表面音響信号を特徴抽出部430で出力し、表面音響信号取得部410の角度センサで取得される表面音響信号を時間信号算出部460に出力してもよい。
【0061】
特徴抽出部430は、「1.表面音響信号の特徴抽出」を行う。すなわち、特徴抽出部430は図2に示された特徴抽出部221と同一の機能を行ってもよい。
【0062】
データベース(DB:Database)440は、表面音響信号のパターン認識及びユーザの入力信号識別に必要な全てのパターンモデルを格納している。例えば、「1.表面音響信号の特徴抽出」で記述された、「最小の意味単位のパターンモデル」及び「機械的な学習モデルM」はDB440に格納されてもよい。ここで、DB440に格納されるパターンモデルは入力ツールごとに区分されて格納される。また、DB440に格納されるパターンモデルは、媒質の種類ごとに区分されて格納される。したがって、特徴抽出部430は、入力ツール推定−入力媒質推定−特徴抽出の順で動作する。同様に特徴抽出部430は、入力媒質推定−入力ツール推定−特徴抽出の順で動作してもよい。
【0063】
表1はデータベース(DB:Database)440に格納されたパターンモデルのルックアップテーブルの例を示す。
【0064】
【表1】
表2は識別されたユーザの入力信号に対応するデバイスの該当機能に対するルックアップテーブルの例を示す。
【0065】
【表2】
パターン判断部450は、図2のパターン分析部223に類似の機能を行ってもよい。また、パターン判断部450は「2.表面音響信号が伝えられる媒質の種類推定」及び「3.表面音響信号を発生させたツールの推定」を行う。
【0066】
時間信号算出部460は、表面音響信号取得部410が少なくとも2つ以上のセンサを含む場合、表面音響信号がそれぞれのセンサに到達する時間差を算出する。時間信号算出部460で算出される時間差は表面音響信号の進行方向を探索するために用いられる。
【0067】
ユーザ入力識別部470は、図2に示すユーザ入力識別部230と同一の機能を行ってもよい。
【0068】
図5A及び図5Bは、図4に示すフィルタ423及び単純化部425から出力される信号の例を示す図である。
【0069】
図5Aに示された信号はフィルタ423から出力される表面音響信号であり、図5Bに示された信号は単純化された表面音響信号の一例を示す。図5Aおよび図5Bにおける「振幅」は信号の強弱または高低を示し、「t」は時間である。単純化部435は信号の高低を判断して信号を単純化する。
【0070】
図6は、「最小の意味単位」に対する例を示す。図6に示された最小の意味単位は表面音響信号のパターンを認識したり、ユーザの入力信号を識別するために用いられてもよい。例えば、図2のパターン認識部220は表面音響信号から最小の意味単位を区分し、ユーザ入力識別部230は最小の意味単位を組み合わせてユーザの入力信号を識別する。ユーザが媒質表面に
を順に入力した場合、ユーザ入力識別部230はユーザの入力信号が「M」であることを識別する。
【0071】
図7A乃至図7Dは、入力ツールに係る表面音響信号の周波数特性を例示する図である。
【0072】
入力ツールは種類の特性に応じて信号波形の大きさ、エネルギー、周波数分布などが変わる。
【0073】
図7Aはユーザがペン(pen)を用いて媒質の表面に円を描いた場合の周波数特性を示す。図7Bはユーザが指を用いて媒質の表面に円を描いた場合の周波数特性を示す。図7Cは指を用いて直線を描いた場合の周波数特性である。図7Dはペンを用いて直線を描いた場合の周波数特性である。図7A乃至図7Dの例として媒質は固定されていると仮定する。
【0074】
図8は、ユーザの入力信号が文字である場合、ユーザの入力信号を識別する例を説明するための図である。図8を参照すると、「A」は2つの長い直線801、803が入力された後、長い直線に比べて相対的に短い1つの直線805が入力される順に表現され、「H」は長い直線807、短い直線809、長い直線811の順に入力される。このような最小の意味単位(直線)が入力される順を示すパターンが文字を識別するために用いられる。ユーザが「F」を入力した場合、ユーザ入力識別部230、470は、直線813、815、817の長さ及び順序を組み合わせてユーザの入力信号を識別する。
【0075】
図9及び図10は、それぞれの直線に対応する表面音響信号の波形の例を示す。
【0076】
図9は、直線が音響センサの近い部分から始まって遠い部分で終了した場合である。すなわち、図9は、表面音響信号の進行方向が音響センサを基準にして遠くなる場合である。本明細書において、「表面音響信号の進行方向」は直線の進行方向と同一な意味で使用することにする。
【0077】
図10は、直線が音響センサの遠い部分から始まって近い部分で終了した場合である。すなわち、図10は、表面音響信号の進行方向が音響センサを基準にして近づく場合である。
【0078】
図9及び図10を参照すると、直線の進行方向に応じて表面音響信号の波形は互いに対称的な形態を有する。したがって、ユーザインタフェース提供装置に1つの音響センサが備えられた場合、波形の相対的な形態によって表面音響信号の進行方向を識別する。ユーザインタフェース提供装置に2つ以上の音響センサが備えられた場合、より正確に表面音響信号の進行方向を推定することができる。
【0079】
図11は、ユーザインタフェース提供装置に2つ以上の音響センサが備えられた場合、取得される表面音響信号の一例を示す図である。図11を参照すると、aの位置で指で音を出した場合、角度センサ1110、1120、1130、1140に受信される表面音響信号の到達時点が異なる。角度センサ1110〜1140は表面音響信号取得部410に備えられるマイクロホンであってもよい。時間信号算出部460は、複数のセンサ1110〜1140を用いて表面音響信号の位置を推定する。時間信号算出部460は、複数のセンサ1110〜1140間の到着遅延時間を算出して候補位置区間を把握した後、候補位置についてのみ位置探索できる。候補位置区間は表面音響信号が発生した位置である。
【0080】
または、算出量を最小化するために時間信号算出部460は、下方右側センサ1120が最も最初に表面音響信号をセンシングしたことをユーザ入力信号識別部470に通知する。図11において、下方右側のセンサ1120によって検出された表面音響信号のピーク(peak)が最も最初に検出されたため、時間信号算出部460はセンサ1120が表面音響信号を最も最初に取得したと判断する。
【0081】
ユーザ入力信号識別部470は、順次判断されるパターンまたは最小の意味単位を組み合わせてユーザ入力信号を識別する。また、ユーザ入力信号識別部470は、時間信号算出部460で算出された時間差を用いて表面音響信号の進行方向を判断する。
【0082】
一方、センサが2つ備えられて2チャネルが形成された場合、ユーザ入力信号識別部470は、表面音響信号が右側または左側で発生したかを判断する。例えば、センサが右側と左側に備えられた場合、右側センサで取得された表面音響信号の振幅(すなわち、音の大きさ)は次第に小さくなり、左側センサで取得された表面音響信号の振幅は次第に大きくなれば、ユーザ入力信号識別部470はユーザが右側から左側方向にドラッギングしたものと判断する。
【0083】
一方、センサが4個備えられて4チャネルが形成された場合、ユーザ入力信号識別部470は、時間信号算出部460で算出された時間信号を用いてパターン(または、最小の意味単位)の方向を判断する。ユーザ入力信号識別部470は、時間信号算出部460から入力される時間差情報を用いて表面音響信号の進行方向と2次元座標を判断する。例えば、ユーザ入力信号識別部470は、図11に示すセンサ1110の位置を基準座標(0、0)に決定し、表面音響信号の発生位置に対する2次元座標と方向を判別する。
【0084】
または、4チャネルの場合、ユーザ入力信号識別部470は、最も最初に表面音響信号をセンシングしたセンサの位置を用いて表面音響信号の進行方向を判断する。例えば、ユーザ入力信号識別部470は、図11に示すセンサ1120の位置を東西南北に表示し、表面音響信号の進行方向を判断する。
【0085】
図12は、デバイスのケースを例示した図である。ケースはプラスチック、金属、紙などの材質で製造されてもよい。センサ(s)とユーザインタフェース提供装置200、400はケースの内部に付着され、ユーザはケースの外部表面にタッチイベントを発生させることによって、表面音響信号を発生させ得る。
【0086】
図13は一実施形態に係るデバイスのユーザインタフェース提供方法を示す。図13を参照すると、ステップS1310において、ユーザインタフェース提供装置は表面音響信号を取得する。
【0087】
ステップS1320において、ユーザインタフェース提供装置は、表面音響信号の時間−ドメイン上の特徴、または周波数−ドメイン上の特徴のうち少なくとも1つの特徴を抽出する。すなわち、ユーザインタフェース提供装置は「1.表面音響信号の特徴抽出」を行う。ここで、前記時間−ドメイン上の特徴は、前記表面音響信号の振幅、ゼロクロッシングの分布、エネルギーの大きさ、長さ、形態のうち少なくともいずれか1つを含む。
【0088】
ステップS1330において、ユーザインタフェース提供装置は、前記時間−ドメイン上の特徴、または周波数−ドメイン上の特徴のうち少なくとも1つの特徴に基づいて表面音響信号のパターンを分析する。ステップS1330は図14の具体的なステップを含む。すなわち、ユーザインタフェース提供装置は、まずテスト信号を用いて前記媒質の種類を判断し(S1431)、表面音響信号の周波数−ドメイン特性に基づいて表面音響信号を発生させたツールを推定し(S1433)、媒質の種類及び表面音響信号を発生させたツールを考慮して前記表面音響信号のパターンを認識する(S1435)。
【0089】
ステップS1340において、ユーザインタフェース提供装置は、前記表面音響信号のパターンに基づいてユーザの入力信号を識別する。すなわち、ユーザインタフェース提供装置は「4.ユーザの入力信号識別」を行う。一側面において、ステップS1340は表面音響信号のパターンにマッチングされる最小の意味単位を区分し、最小の意味単位に基づいて前記ユーザの入力信号を識別する過程を含んでもよい。また、他の側面において、ステップS1340は複数のパターンを順に受信し、前記複数のパターンそれぞれに対応する最小の意味単位を組み合わせて前記ユーザの入力信号を識別する過程を含んでもよい。
【0090】
図15は他の実施形態に係るユーザインタフェース提供方法を示す。図15を参照すると、ステップS1510において、ユーザインタフェース提供装置は、デバイスの外部媒質からユーザの入力信号を受信する外部入力モードを実行させる。ここで、「外部入力モード」は、例えば、図1の外部物体120によってデバイス120を操作できるモードを意味する。デバイスは、外部入力モードが実行されれば、非活性状態にある音響センサを活性化する。外部入力モードの実行は、デバイスが前記デバイスの外部媒質と接触したり、モードの切り替えに対する制御信号によってトリガーリングされてもよい。
【0091】
ステップS1520において、ユーザインタフェース提供装置は、デバイスの外部媒質から表面音響信号が受信されるかを判断する。
【0092】
前記デバイスの外部媒質から表面音響信号が受信されれば、ステップS1530において、ユーザインタフェース提供装置は、表面音響信号の特徴を分析して媒質に対応する前記表面音響信号のパターンを認識する。
【0093】
ステップS1540において、ユーザインタフェース提供装置は、表面音響信号のパターンに基づいてユーザの入力信号を識別する。
【0094】
図16は他の実施形態に係るユーザインタフェース提供方法を示す。図16を参照すると、ステップS1610において、ユーザインタフェース提供装置は、前記デバイスの外部媒質からユーザの入力信号を受信する外部入力モードを実行させる。一方、ステップS1610において、ユーザインタフェース提供装置はテスト信号を発生させ、前記デバイスの外部媒質上におけるテスト信号の特徴を分析し、前記テスト信号の特徴を予め格納されたパターンモデルと比較して媒質の種類を判断する。
【0095】
ステップS1620において、ユーザインタフェース提供装置は、デバイスの外部媒質から表面音響信号が受信されるかを判断する。
【0096】
前記デバイスの外部媒質から表面音響信号が受信されれば、ステップS1630において、ユーザインタフェース提供装置は表面音響信号の進行方向を判断する。例えば、ユーザインタフェース提供装置はユーザのドラッギング方向を判断する。ここで、表面音響信号の進行方向は、「前記表面音響信号の波形の形」、「第1音響センサで受信される第1表面音響信号及び第2音響センサで受信される第2表面音響信号の受信時間の差」、「前記第1表面音響信号及び前記第2表面音響信号の大きさ変化」の少なくともいずれか1つによって判断され得る。
【0097】
ステップS1640において、ユーザインタフェース提供装置は、表面音響信号の進行方向に対応するデバイスの機能を実行させる。例えば、デバイスの設定に応じて音楽または動画を再生するアプリケーションが実行された後、特定方向のドラッギングが入力されれば、音楽または動画が再生することも可能である。
【0098】
本発明の実施形態に係る方法は、多様なコンピュータ手段を介して様々な処理を実行することができるプログラム命令の形態で実現され、コンピュータ読取可能な記録媒体に記録されてもよい。コンピュータ読取可能な媒体は、プログラム命令、データファイル、データ構造などの単独または組み合わせたものを含んでもよい。媒体に記録されるプログラム命令は、本発明の目的のために特別に設計されて構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知のものであり使用可能なものであってもよい。コンピュータ読取可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体、CD−ROM、DVDのような光記録媒体、光ディスクのような光磁気媒体、及びROM、RAM、フラッシュメモリなどのようなプログラム命令を格納して実行するように特別に構成されたハードウェア装置が含まれてもよい。プログラム命令の例としては、コンパイラによって生成されるような機械語コード(machine code)だけでなく、インタプリタなどを用いてコンピュータによって実行され得る高級言語コード(higher level code)を含む。上述したハードウェア装置は、本発明の動作を行うために1つ以上のソフトウェアのレイヤで動作するように構成されてもよい。
【0099】
上述したように本発明を限定された実施形態と図面によって説明したが、本発明は、上記の実施形態に限定されることなく、本発明が属する分野における通常の知識を有する者であれば、このような実施形態から多様な修正及び変形が可能である。
【0100】
したがって、本発明の範囲は、開示された実施形態に限定して定められるものではなく、特許請求の範囲だけではなく特許請求の範囲と均等なものなどによって定められるものである。
図2
図4
図5A
図5B
図6
図7A
図7B
図7C
図7D
図9
図10
図11
図13
図14
図15
図16