(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0021】
本願の実施の例は、添付図面を参照して、より詳細に以下説明される。本願の実施の例が添付図面に示されているが、本願は様々な形態で実施でき、本明細書に記載する実施によって限定されるものではないことを理解されたい。代わりに、これらの実施は、本願のより完全な理解を提供し、本願の範囲を当業者に伝えるために提供される。
【0022】
本発明の実施はデータを抽出するための方法を提供する。この方法は端末デバイス側で用いられる。
図1に示すように、この方法は以下のステップを含む。
【0023】
101:タッチスクリーン上でのプレス(押圧)操作の指示を受信し、そのプレス操作指示に基づいてタッチスクリーン上のプレス操作位置を特定する。
【0024】
ユーザが端末デバイスから保留データを抽出する必要があるとき、ユーザは端末デバイスのタッチスクリーン上でプレス操作を行い、プレス操作は端末デバイスのタッチスクリーン上の静電容量式タッチセンサ又は圧力タッチセンサを用いて端末デバイスへ転送され、端末デバイスは、このプレス操作を、端末デバイスに対するプレス操作指示として解析(パース)し、プレス操作指示に基づいてタッチスクリーン上のプレス操作位置を特定する。
【0025】
ユーザは、通常、指を使ってタッチスクリーンをプレス操作する。ただし、ユーザが異なれば習慣も異なる。中指を使ってタッチスクリーンをプレスする傾向があるユーザもいれば、人差し指を使ってタッチスクリーンをプレスする傾向があるユーザもいる。タッチスクリーンをプレスするために使う指に関係なく、タッチスクリーン上にプレス点が生成される。端末デバイスは、プレス点に基づいてタッチスクリーンに対するプレス操作指示を受信し、プレス点に基づいてタッチスクリーン上のプレス操作位置を特定する。ユーザがプレス操作指示をトリガするために使う指と、端末デバイスのタッチスクリーン上の特定のプレス位置とは、本発明のこの実施では限定されない。
【0026】
ユーザがタッチスクリーンをタップしたのか、タッチスクリーン上のプレス操作位置に基づいてデータを抽出したのかを区別するために、本発明のこの実施では、タッチスクリーンをトリガするためにユーザが行うプレス操作を予め特定する必要があり、それにより、端末デバイスは、ユーザのプレス操作を、データ抽出をトリガするための指示として特定することは、特に留意すべき事項である。説明のためにスマートフォンを例にとる。スマートフォンのシステムがAndroid(登録商標)システムである場合は、ユーザがタッチスクリーンをホールド又はドラッグした後に、タッチスクリーン上でのユーザのプレス操作は所定のデータ抽出操作であると特定される。スマートフォンのシステムがiOSであり、システムが感圧タッチ(force touch)をサポートしている場合は、ユーザがタッチスクリーンを軽くプレス又は強くプレスした後に、タッチスクリーン上のプレス操作は所定のデータ抽出操作であると特定される。先の説明は単なる例である。端末デバイス上でデータを抽出するためにトリガするプレス操作方法は、本発明のこの実施に限定されない。
【0027】
本発明のこの実施では、端末デバイスはタッチスクリーンを含む必要がある。端末デバイスとして、タッチスクリーンスマートフォン、タブレットコンピュータ、タッチスクリーンパーソナルコンピュータ、タッチスクリーンマルチメディア教育デバイスなどが挙げられるが、これらに限定されない。本発明のこの実施は、特定の種類の端末デバイスに限定されない。
【0028】
102:プレス操作位置に基づいて、データを抽出する必要があるデータ領域を特定する。
【0029】
端末デバイスは、タッチスクリーン上のユーザのプレス点を中心として用いて、プレス操作位置の実際のカバー領域を特定し、この実際のカバー領域が、データが抽出されるべきデータ領域である。
【0030】
ユーザがタッチスクリーンをプレスするために使う指は異なるので、タッチスクリーン上のプレス操作位置に基づいて特定されるデータ領域の大きさは異なる。加えて、すべてのユーザが人差し指を使ってタッチスクリーンを押すとしても、各ユーザの人差し指は異なるので、特定されたデータ領域は依然として異なる。データを抽出する必要があるデータ領域の大きさは、タッチスクリーン上のプレス操作位置に基づいて特定されるが、本発明の実施では限定されない。
【0031】
実際のアプリケーション(適用)では、端末デバイスにおける各ユーザの指の大きさは異なるので、指の実際のカバー領域は保留データをカバーできない可能性がある。そこで、所定の許容域を設定する。データ領域を特定するために、端末デバイスは、実際のカバー領域と所定の許容域とを結合して、データ領域がプレス操作位置に基づいて特定された実際のカバー領域よりも大きくなるようにして、保留データの抽出精度を高める。
【0032】
103:データ領域のデータに基づいて、対応するデータ抽出ルールを特定する。
【0033】
対応するデータ抽出ルールは、データを抽出する必要がある、ステップ101で特定されたデータ領域のデータに基づいて特定される。本発明のこの実施では、データ領域内のデータは、数字、英大文字及び小文字、グラフ、漢字、ウェブサイトの特徴文字、並びに数式などのデータを含む。データ領域内のデータは未知であるため、データ領域内のデータの異なるタイプのデータと、異なるデータの属性情報とに基づいて、データ抽出ルールを特定する必要がある。
【0034】
本発明のこの実施では、異なるユーザは、保留データを抽出するための異なる要件を有する。したがって、データの異なる属性情報のために指定されたルールと、異なるデータタイプのデータのために指定されたデータ抽出優先ルールとが生成される。このステップの目的は、データ領域から選択されたデータのデータタイプと属性情報とに基づいて適切なデータ抽出ルールを特定することである。
【0035】
実際のアプリケーションでは、端末デバイスを使用する利便性及び実用性を考慮すると、ユーザは、例えば、記事全体に含まれるすべてのテキストデータを抽出するような比較的長いデータを抽出するためにタッチスクリーンを含む端末デバイスを通常は使用しない。タッチスクリーン端末デバイス側では、保留データを抽出するアプリケーションシナリオは、通常、ユーザの身元を検証するためにスマートフォンSMSメッセージ内の認証コードを抽出するステップと、ウェブページコンテンツからウェブサイトを抽出してウェブページにジャンプするステップと、注文をチェックするためにスマートフォンSMSメッセージ内の注文番号を抽出するステップと、数式を貼り付けて用いるためのウェブページ上の数式を抽出するステップと、スマートフォンの通知バーのSMSメッセージ機能内の確認コードを抽出するステップ等を含む。しかし、保留データを抽出するための先のアプリケーションシナリオは単なる例であり、本発明のこの実施の特定のアプリケーションシナリオを限定することを意図するものではないことは明瞭である。
【0036】
104:保留データを抽出するために、データ抽出ルールに基づいて、データ領域の特定のデータを解析(パース)する。
【0037】
特定のデータは、データ領域の一部又は全部のデータである。データ領域のデータを解析する場合、データ領域の一部のデータのみを用いてユーザが抽出したい関連データを抽出することも、データ領域の全部のデータを用いてユーザが抽出したいデータを抽出することもできる。異なるデータ領域では、データ抽出ルールを特定するために、異なる量の特定のデータが解析される。これは、本発明のこの実施において限定されない。
【0038】
端末デバイスがデータ抽出ルールに基づいて保留データを抽出する場合、保留データを抽出した後、抽出されたデータの精度を保証するために、端末デバイスは、抽出された保留データを出力して表示することで、ユーザは保留データの精度を特定できる。
【0039】
本発明で提供されるデータ抽出方法によると、端末デバイスは、タッチスクリーンに対するプレス操作指示を受信し、プレス操作指示に基づいてタッチスクリーン上のプレス操作位置を特定する;プレス操作位置に基づいてデータを抽出する必要があるデータ領域を特定する;データ領域内のデータに基づいて対応するデータ抽出ルールを特定し、保留中のデータを抽出するために、データ抽出ルールに基づいてデータ領域内の特定のデータを解析する。ここで、特定のデータはデータ領域内の一部又は全部のデータである。本発明では、従来技術と比較して、タッチスクリーン上のプレス操作位置に基づいてユーザが特定したデータ領域において、そのデータ領域に対応するデータ抽出ルールを使用できるので、保留中のデータを迅速且つ正確に、自動的に抽出できる。本願で説明されている操作工程は単純且つ簡単であり、エラー率を下げる。
【0040】
更に、
図1に示す方法を、より深く理解するために、先の実施への拡張及び詳細として、本発明のこの実施では、
図1のステップを詳細に説明する。
【0041】
ステップ103では、データ領域のデータに基づいて、対応するデータ抽出ルールが特定されるが、データ領域に含まれるデータは不確定である。このため、データ抽出ルールを特定する場合、保留データを抽出するためのデータ抽出ルールを以下の2つの方法を用いて特定できる。
【0042】
方法1:データ領域内のデータのタイプを特定し、そのデータタイプに基づいて、対応するデータ抽出ルールを特定する。
【0043】
本発明のこの実施におけるデータ抽出ルールは、異なるデータタイプに対して異なる優先度を有する。したがって、データのタイプを特定することで、領域内のデータのタイプを特定でき、データ抽出ルールの優先度に基づいて、データを抽出するために用いられるデータ抽出ルールを特定できる。
【0044】
方法1では、データ抽出ルールを特定する前に、データ領域内のデータのタイプを特定する必要がある。データ領域内の各データのタイプは、コンパイル時のデータの文字入力状態(character input status)に基づいて特定される。具体的な実施工程は:データ領域内の全データを順次解析するステップと、各データの文字入力状態がダブルバイトかシングルバイトかを特定するステップと、文字入力状態に基づいて各データのタイプを特定するステップとを含む。ダブルバイトとは、1文字が2つの標準文字位置を占めることを意味し、ダブルバイトには、通常、漢字、規定の2バイトの英語文字、グラフィック記号、及びGB2312−80の特殊文字などがある。シングルバイトとは、1文字が1つの標準文字位置を占めることを意味し、シングルバイトには、通常、英語の文字、数字、及び西欧言語の記号がある。
【0045】
実際のアプリケーションでは、データ領域のデータは複数の連続した文字で構成される。加えて、ダブルバイト又はシングルバイトが占める標準文字位置の数に基づいて、各データの文字入力状態を特定する際、データ領域内の各文字が占める標準文字位置を特定することで、データのタイプを特定できる。
【0046】
方法2:データ領域内のデータの属性情報を取得し、その属性情報に基づいてデータ抽出ルールを特定する。
【0047】
方法2では、以下の方法を用いてデータ領域のデータの属性情報を取得できる。例えば、データ領域内の全データを単語に分割し、単語分割後に得られたデータから所定のキーワードと一致するデータを検索し、所定のキーワードに基づいてデータの属性情報を特定する。所定のキーワードは、属性情報と一対一のマッピング関係にあり、属性情報を識別するために用いられる。本発明のこの実施では、データ領域内のデータが単語に分割されるとき、従来技術における任意の単語分割方法を参照できるので、単語分割方法については本発明の本実施では再度説明しない。
【0048】
実際のアプリケーションでは、データ領域内のデータの属性情報(所定のキーワード)に基づいてデータの現在のアプリケーションシナリオを特定できる。例えば、データの所定のキーワードがSMSメッセージ認証コード又は携帯電話確認コードである場合、端末デバイスによって抽出されたデータの現在のアプリケーションシナリオはスマートフォンのSMSメッセージアプリケーションであると特定できる。データの所定のキーワードが「http://」「.com」又は「.cn」などのコンテンツである場合、端末デバイスによって抽出されたデータの現在のアプリケーションシナリオはウェブページ閲覧であると特定できる。先の説明は単なる例であり、データ領域内のデータを抽出するためのアプリケーションシナリオを限定するものではない。
【0049】
例えば、表1は、本発明の実施に係る、属性情報とデータ抽出ルールとの間のマッピング関係を示す。データ領域内の単語分割後に得られたデータが表1のいずれかの所定のキーワードと一致する場合、所定のキーワードに対応するデータ抽出ルールが特定される。説明の例として、表1の所定のキーワード(注文番号*)を用いる。*は、注文番号の後の任意の1つ以上のデータを表す。単語分割後に得られたデータに「注文番号は」、「注文番号」、「注文番号:」などのデータが含まれている場合、それらは全て所定のキーワードと一致することができる。したがって、データ抽出ルールは、注文番号*の後且つ句読点の前に連続した数字データを抽出することである、と特定される。
【表1】
【0050】
更に、本発明の実施は、端末デバイス上のデータを、迅速且つ正確に自動抽出でき、データ領域内のデータに基づいて、対応するデータ抽出ルールが特定された後、データ抽出ルールに基づいてデータが抽出される。データ抽出ルールが方法1に基づいて特定されたデータ抽出ルールである場合、最も優先度の高いデータ抽出ルールに基づいて保留データが抽出され、保留データが抽出された後、特定された保留データを表示するために用いられるプロンプト情報が出力されるので、ユーザは、保留データが、ユーザが抽出したいデータであるかどうかを特定できる。ユーザが、保留データは正しい、と特定した場合、プロンプト情報内の確認ボタンがトリガされ、端末デバイスは所定の確認指示を受信し、保留データをシステムクリップボードに自動的にコピーし、保留データが正常に取得されたことを示すプロンプト情報を出力し、ユーザは保留データを使用できる。ユーザが、保留データは間違いである、と特定した場合、ユーザはプロンプト情報内の再選択ボタンをトリガし、端末デバイスは所定の再選択指示を受信し、2番目に優先度の高いデータ抽出ルールを用いてデータ領域内のデータを抽出し続ける。データの抽出後、端末デバイスが所定の確認指示を受信するまで、保留データを確認するためのプロンプト情報を表示し、再抽出後の保留データを取得する。
【0051】
データ抽出ルールが方法2に基づいて特定されたデータ抽出ルールである場合、特定されたデータ抽出ルールに基づいてデータ領域から保留データを抽出するステップは、特定されたデータ抽出ルールに基づいてデータ領域から保留データを直接抽出するステップを含む。方法2では、特定されたデータ抽出ルールは、属性情報と1対1のマッピング関係にあることは特に留意すべき事項である。すなわち、データ領域内のデータの属性情報が確認された場合には、その属性情報(所定のキーワード)に対応するデータ抽出ルールに基づいてデータが抽出され、データ抽出ルールの優先度は設定されない。異なるアプリケーションシナリオにおいてデータが抽出される場合に特定されるデータ抽出ルールを説明するために、2つの例を以下提供する。例1:データ領域内のデータがSMSメッセージ内の認証コード情報である、と特定された場合、端末デバイスはデータ領域内のすべてのデータに対して単語分割及び意味解析(semantic parsing)を実行する。端末デバイスは、所定のキーワード認証コードを取得すると、その認証コードの実体データ、例えば:123abcを自動的に取得する。例2:データ領域に特定のウェブサイトリンク又は特定のウェブサイトリンクの一部が含まれる、と特定された場合、端末デバイスはデータの属性情報を解析してウェブサイトリンクを抽出する。というのは、タッチスクリーン上のプレス操作位置に基づいてユーザによって特定されたデータ領域はウェブサイトのリンク又はウェブサイトのリンクの一部よりも小さいからである。先の2つの例は単なる例である。本発明のこの実施において、データ領域に対応する特定のアプリケーションシナリオは限定されない。
【0052】
端末デバイスが、方法1又は方法2に基づいて対応するデータ抽出ルールを特定するとき、方法1に基づいてデータ抽出ルールを特定できない場合は方法2に基づいてデータ抽出ルールを特定し、方法2に基づいてデータ抽出ルールを特定できない場合は方法1に基づいてデータ抽出ルールを特定することができることは特に留意すべき事項である。本発明のこの実施では、データ抽出ルールの特定に用いられる方法は限定されず、データ領域のデータに基づいてデータ抽出ルールを特定する必要がある。
【0053】
例えば、
図2に示すように、ユーザはタブレットコンピュータのブラウザを用いてウェブページを閲覧し、ウェブページ上のデータhttp://ABCd.comを抽出し、端末デバイスはユーザのプレス操作指示に基づいて、
図2に示すデータ領域を特定する。データ領域のデータには「http://」が含まれ、端末デバイスはデータhttp://を解析し、各データの文字入力状態がシングルバイトしかない、と特定する。このように、データのタイプに基づいて、データ抽出ルールはシングルバイト文字だけを抽出することである。
図3に示すように、保留データ「http://」を抽出した後は、端末デバイスは、ダイアログボックスを用いて「保留データの特定/再選択」を表示するために用いられるプロンプト情報を出力する。再選択ボタンをタップした後、ユーザは保留データを再取得する。データ領域内のすべてのデータは単語に分割され、単語分割後に得られたデータは所定のキーワードと照合される。所定のキーワードは、データの属性情報と1対1のマッピング関係にある。特定されたデータの属性情報がウェブサイトである。属性情報に基づいて、データ抽出ルールは、ウェブサイト全体を抽出することである、と特定され、保留データ「http://www.ABCd.com」が抽出された後、保留データの特定又は再選択に用いられるプロンプト情報が表示され、ユーザが確認ボタンを押すと、http://www.ABCd.comが自動的にシステムクリップボードにコピーされてユーザが使用できるようになる。
【0054】
オプションではあるが、データ抽出ルールに基づいてデータ領域内のデータを解析して保留データを抽出する場合、先ず、データ領域内のデータ間の冗長データを削除し、次にデータ抽出ルールに基づいて冗長データが除去された後に得られた保留データを抽出する。冗長データは、スペース、句読点などを含むことができるが、これらに限定されない。
【0055】
更に、データ領域内のデータに基づいて対応するデータ抽出ルールを特定する前に、データ抽出ルールを生成し、データ抽出ルールを構成(設定)する。データ抽出ルールは、以下の方法を用いて構成できる。例えば、データ抽出ルールの優先度は、異なるデータタイプに基づいて構成される;又は、データの属性情報に基づいてデータ抽出ルールが構成される。一般に、属性情報に基づいてデータ抽出ルールが構成される場合、属性情報とデータ抽出ルールとは1対1のマッピング関係にある。
【0056】
例えば、データ抽出ルールの優先度が、異なるデータタイプに基づいて構成されている場合、抽出文字にシングルバイト文字が含まれるデータ抽出ルールが最優先に設定される、又は、データ領域のデータタイプがダブルバイト文字とシングルバイト文字との両方を含む場合、シングルバイト文字に対応するデータ量とダブルバイト文字に対応するデータ量とは別々にカウントされ、シングルバイト文字とダブルバイト文字との間で量の多い方の文字が抽出される、又は、抽出文字が数字のみからなるデータ抽出ルールが設定される。先の説明は単なる例であり、データ抽出ルールを構成するための特定の方法は、本発明のこの実施では限定されない。
【0057】
更に、ユーザの指の大きさは異なるので、特定されたデータ領域のサイズが異なる場合や不完全な場合がある。したがって、端末デバイスは、所定の許容域を設定して先の問題を解決する。所定の許容域を設定する場合、端末デバイスは、所定の許容域を固定領域としても、タッチスクリーン上のプレス操作位置の実際のカバー領域に対して所定の割合を設定してもよい。タッチスクリーン上のプレス操作位置に基づいて、データを抽出する必要があるデータ領域を特定する際に、端末デバイスは、タッチスクリーン上のプレス操作位置の実際のカバー領域を特定し、所定の許容域を得て、実際のカバー領域及び所定の許容域を結合してデータ領域を特定する。所定の許容域を設定するための具体的な方法は、本発明のこの実施において限定されない。
【0058】
例えば、データ領域を特定する工程を詳細に説明するために、例として補足説明を以下に提供する。例えば、
図4は、本発明の実施に係る、携帯電話がデータ領域をどのように特定するかを示す概略図である。
図4に示すように、端末デバイスがスマートフォンであると仮定する。端末デバイスのユーザは、SMSメッセージの認証コード情報を入手したい。ユーザは、タッチアンドホールドを通して認証コードを入手する。図中には、タッチスクリーン上の実際のプレス操作位置のカバー領域が点線で示されている。実際のカバー領域と所定の許容域とを結合した後、図中の実線領域、すなわちデータ領域を特定する。
図4は単なる例であり、本発明のこの実施ではユーザがデータを抽出する位置は限定されないことは特に留意すべき事項である。
【0059】
更に、端末デバイスは、保留データを抽出した後、ユーザが抽出に成功したデータを使用するのを助けるために、保留データが正常に取得されたことを示すプロンプト情報を出力する。保留データが正常に取得されたことを示すプロンプト情報が出力された場合は、ダイアログボックスをポップすることでプロンプト情報を表示できる、又は、保留データが正常に取得された後、端末デバイスのユーザは音声放送を介して通知される。保留データが正常に取得されたことを示すプロンプト情報の形式は、本発明のこの実施では限定されない。
【0060】
端末デバイスから保留データを抽出する工程は、上で詳細に説明されている。本発明のこの実施で提供される方法では、数字、文字、及び特殊記号などのデータが中国語シナリオで抽出され、そのデータを迅速且つ正確に抽出できることは特に留意すべき事項である。しかし、中国語シナリオで漢字を抽出しようとする場合、本発明で提供される方法を用いてデータを正確に自動抽出することはできない。従来技術の保留データを手動で選択する方法を用いて、中国語シナリオで中国語を抽出することはできる。同様に、英語及び他の言語のアプリケーションシナリオにおける漢字及び特殊記号のようなデータも、迅速且つ正確に抽出できるが、同じ言語のデータは、英語及び他の言語のアプリケーションシナリオでは正確且つ自動的に抽出されないことがある。
【0061】
更に、
図1に示す方法の実施として、本発明の実施によると、データを抽出するための別のデバイスが提供される。このデバイスの実施は、先の方法の実施に対応する。読みやすくするために、本方法の実施における詳細な内容は、このデバイスの実施において繰り返し説明しないが、本実施におけるデバイスは、先の方法の実施におけるすべての内容に対応して実施できることは明らかである。
【0062】
本発明の実施はデータを抽出するためのデバイスを提供する。
図5に示すように、このデバイスは:タッチスクリーン上のプレス操作指示を受信するよう構成された受信部51と;受信部51が受信したプレス操作指示に基づいて、タッチスクリーン上のプレス操作位置を特定するよう構成された第1の特定部52と;第1の特定部52によって特定されたプレス操作位置に基づいて、データを抽出する必要があるデータ領域を特定するよう構成された第2の特定部53と;第2の特定部53によって特定されたデータ領域内のデータに基づいて対応するデータ抽出ルールを特定するよう構成された第3の特定部54と;第3の特定部54によって特定されたデータ抽出ルールに基づいてデータ領域内の一部又は全部のデータである特定のデータを解析し、保留データを抽出するよう構成された抽出部55と;を含む。
【0063】
更に、
図6に示すように、第3の特定部54は:データ領域内のデータのデータタイプを特定するよう構成された第1の特定モジュール541と;第1の特定モジュール541によって特定されたデータタイプに基づいてデータタイプに対応するデータ抽出ルールを特定するよう構成された第2の特定モジュール542と;を含む。ここでデータ抽出ルールは、異なるデータタイプに対して異なる優先度を有する。
【0064】
更に、
図6に示すように、第1の特定モジュール541は:データ領域内のすべてのデータを順次解析するよう構成された解析サブモジュール5411と;解析サブモジュール5411がデータ領域内のすべてのデータを順次解析する工程において、ダブルバイト及びシングルバイトを含む各データの文字入力状態を特定するよう構成された第1の特定サブモジュール5412と;第1の特定サブモジュール5412によって特定された文字入力状態に基づいて各データのタイプを特定するよう構成された第2の特定サブモジュール5413と;を含む。
【0065】
更に、抽出部55は、保留データを抽出するために、最も優先度の高いデータ抽出ルールに基づいてデータ領域の特定のデータを解析する。
【0066】
更に、
図6に示すように、抽出部55は:保留データを確認するためのプロンプト情報を表示するよう構成された表示部551と;所定の確認指示が受信された場合に保留データを取得するよう構成された取得モジュール552と;所定の確認指示を受信するまでデータ抽出ルール優先度に基づいてデータ領域内の特定のデータを抽出し続け、所定の再選択指示を受信した場合に再抽出後の保留データを取得するよう構成された処理モジュール553と;を含む。
【0067】
更に、
図6に示すように、第3の特定部54は:データ領域内のデータの属性情報を取得するよう構成された取得モジュール543と;取得モジュール543によって取得された属性情報に基づいてデータ抽出ルールを特定するよう構成された第3の特定モジュール544と;を更に含む。
【0068】
更に、
図6に示すように、取得モジュール543は:データ領域内のすべてのデータを単語に分割するよう構成された単語分割サブモジュール5431と;単語分割サブモジュール5431が単語分割した後に得られるデータから所定のキーワードに一致するデータを検索するよう構成され、所定のキーワードは属性情報を識別するために用いられる、検索サブモジュール5432と;検索サブモジュール5432によって識別された所定のキーワードに基づいてデータの属性情報を特定するよう構成された特定サブモジュール5433と;を含む。
【0069】
更に、
図6に示すように、デバイスは:第3の特定部54がデータ領域内のデータに基づいて対応するデータ抽出ルールを特定する前に、データ抽出ルールを生成するよう構成された生成部56と;生成部56により生成されたデータ抽出ルールを構成(設定)するよう構成された構成部57と;を更に含む。
【0070】
更に、
図6に示すように、構成部57は:異なるデータタイプに基づいてデータ抽出ルールの優先度を構成(設定)するよう構成された第1の構成モジュール571と;データの属性情報に基づいてデータ抽出ルールを構成(設定)するよう構成された第2の構成モジュール572と;を含む。
【0071】
更に、
図6に示すように、第1の特定部52は:タッチスクリーン上のプレス操作位置の実際のカバー領域を特定するよう構成された第1の特定モジュール521と:第1の特定モジュール521によって特定される実際のカバー領域と所定の許容域とを結合するよう構成された結合モジュール522と;結合モジュール522が実際のカバー領域と所定の許容域とを結合した後にデータ領域を特定するよう構成された第2の特定モジュール523と;を含む。
【0072】
更に、
図6に示すように、デバイスは:保留データを抽出し、抽出部55がデータ抽出ルールに基づいてデータ領域内のデータを解析した後に保留データが正常に取得されたことを示すプロンプト情報を出力するよう構成された表示出力部58を更に含む。
【0073】
更に、本発明の実施は、端末デバイスを更に提供し、端末デバイスは、
図5又は
図6のいずれかに示されるデータを抽出するためのデバイスを含む。
【0074】
本発明の実施において提供されるデータ抽出するためのデバイス及び端末デバイスによると、端末デバイスは、タッチスクリーンに対するプレス操作指示を受信し、それに基づいてタッチスクリーン上のプレス操作位置を特定する。プレス操作指示は、プレス操作位置に基づいてデータを抽出する必要があるデータ領域を特定し、データ領域内のデータに基づいて、対応するデータ抽出ルールを特定し、データ抽出ルールに基づいてデータ領域内のデータを解析し、保留データを抽出する。ここで特定のデータは、データ領域内の一部又は全部のデータである。本発明の実施では、従来技術と比較して、タッチスクリーン上のプレス操作位置に基づいてユーザが特定したデータ領域において、そのデータ領域に対応するデータ抽出ルールを用いることができるので、保留中のデータを迅速且つ正確に自動抽出することができ、操作工程は単純且つ簡単で、エラー率は低い。
【0075】
データ生成デバイスは、プロセッサとメモリとを含み、第1の特定部、第2の特定部、第3の特定部、及び抽出部は、プログラム部としてメモリに記憶され、プロセッサは、対応する機能を実施するために、メモリに記憶された先に述べたプログラム部を実行する。
【0076】
プロセッサはカーネルを含み、カーネルはメモリから対応するプログラム部を呼び出す。保留中のデータを迅速且つ正確に抽出するために、データを抽出する工程において、操作工程が複雑でエラー率が高いという従来技術の欠点を解決するために、1つ又は複数のカーネルを設定できる。
【0077】
メモリはコンピュータ読取可能な媒体内の非永続性メモリ、ランダムアクセスメモリ(RAM)、及び/又は、読み取り専用メモリ(ROM)やフラッシュメモリ(flash RAM)のような不揮発性メモリを含むことができる。メモリは少なくとも1つの記憶チップを含む。
【0078】
本願は、コンピュータプログラム製品を更に提供する。データ処理デバイス上で実行されるとき、コンピュータプログラム製品は、以下の方法ステップを含むプログラムコードを実行するのに適している。即ち、タッチスクリーン上のプレス操作指示を受信し、プレス操作指示に基づいてタッチスクリーン上のプレス操作位置を特定する;プレス操作位置に基づいてデータを抽出する必要があるデータ領域を特定する;データ領域内のデータに基づいて、対応するデータ抽出ルールを特定する;データ抽出ルールに基づいてデータ領域内の特定のデータを解析して保留データを抽出する。ここで、特定のデータはデータ領域内の一部又は全部のデータである。
【0079】
当業者は、本願の実施が方法、システム、又はコンピュータプログラム製品として提供され得ることを理解するはずである。そのため、本願は、ハードウェアのみの実施、ソフトウェアのみの実施、又は、ソフトウェアとハードウェアとの組み合わせによる実施の形式を用いることができる。さらに、本願は、コンピュータで使用可能なプログラムコードを含んだ1台以上のコンピュータで使用可能な記憶媒体(磁気ディスクストレージ、CD−ROM、及び光学メモリを非限定的に含む)上で実施されるコンピュータプログラム製品の形式で使用できる。
【0080】
本願は、本願の実施に係るグラフ表示方法、デバイス(装置)、及びコンピュータプログラム製品のフローチャート及び/又はブロック図を参照して説明されている。コンピュータプログラム命令は、フローチャート及び/又はブロック図内の各工程及び/又は各ブロックを実施するために用いることができ、さらに、フローチャート及び/又はブロック図内の各工程及び/又は各ブロックの組み合わせを実施するために用いることができる点が理解されるはずである。これらのコンピュータプログラム命令は、汎用コンピュータ、専用コンピュータ、組み込みプロセッサ、又はあらゆるその他のプログラム可能なデータ処理デバイスに、マシンを生成するために提供されることができ、これにより、コンピュータ、又は、あらゆるその他のプログラム可能なデータ処理デバイスのプロセッサが、フローチャートの1つ以上の工程において、及び/又は、ブロック図の1つ以上のブロックにおいて、特定の機能を実施するデバイスを生成できるようになる。
【0081】
これらのコンピュータプログラム命令を、コンピュータ又はあらゆるその他のプログラム可能なデータ処理デバイスに特定の態様を使用することで機能するように命令することができるコンピュータ読み取り可能なメモリに記憶して、これらのコンピュータ読み取り可能なメモリに記憶された命令が、命令デバイスを含むアーチファクトを作り出すようにすることができる。この命令デバイスは、フローチャート内の1つ以上の工程における、及び/又は、ブロック図内の1つ以上のブロックにおける特定の機能を実施する。
【0082】
これらのコンピュータプログラム命令をコンピュータ又はその他のプログラム可能なデータ処理デバイスにロードして、コンピュータ又はその他のプログラム可能なデバイス上で一連の操作及びステップが実行されるようにし、コンピュータで実施される処理を生成することができる。これにより、コンピュータ又はその他のプログラム可能なデバイス上で実行される命令が、フローチャート内の1つ以上のステップ及び/又はブロック図内の1つ以上のブロックにおける特定の機能を実施するデバイスを提供することを可能とする。
【0083】
典型的な構成では、コンピューティングデバイスは1つ以上のプロセッサ(CPU)、入出力インタフェース、ネットワークインタフェース、及びメモリを含む。
【0084】
メモリはコンピュータ読取可能な媒体内の非永続性メモリ、ランダムアクセスメモリ(RAM)、及び/又は、読み取り専用メモリ(ROM)やフラッシュメモリ(flash RAM)のような不揮発性メモリを含むことができる。メモリはコンピュータ読取可能な媒体の一例である。
【0085】
コンピュータ読取可能な媒体には、任意の方法又は技術を用いて情報を記憶できる、永続的、非永続的、移動可能な、移動不能な媒体が含まれる。この情報はコンピュータ読取可能な命令、データ構造、プログラムモジュール、又はその他のデータであってよい。コンピュータの記憶媒体の例として、コンピューティングデバイスによってアクセスできる情報を記憶するために用いることが可能な、相変化ランダムアクセスメモリ(PRAM)、スタティックランダムアクセスメモリ(SRAM)、ダイナミックランダムアクセスメモリ(DRAM)、別タイプのランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、電気的に消去可能でプログラム可能なROM(EEPROM)、フラッシュメモリ、又は別のメモリ技術、コンパクトディスクROM(CD−ROM)、デジタル多用途ディスク(DVD)、又は別の光学記憶装置、磁気カセット、磁気テープ、磁気テープ/磁気ディスクメモリ、又は別の磁気記憶デバイス、若しくはその他任意の非一時的媒体があるが、それらに限定されない。本願で定義しているように、コンピュータ読取可能な媒体は、変調されたデータ信号及び搬送波のような一時的な媒体(transitory media)を含まない。
【0086】
上述のものは本願の一実施形態であるが、本願を限定するものではない。当業者は、本願に様々な修正及び変更を加えることができる。本願の主旨及び原理から逸脱せずに為されるあらゆる修正、均等物による代替、改善は、本願の特許請求の範囲に含まれるものである。
以下、本発明の実施の態様の例を列挙する。
[第1の局面]
データを抽出するための方法であって:
タッチスクリーンに対するプレス操作の指示を受信し、前記プレス操作の指示に基づいてタッチスクリーン上のプレス操作位置を特定するステップと;
前記プレス操作位置に基づいてデータを抽出する必要があるデータ領域を特定するステップと;
前記データ領域の前記データに基づいて、対応するデータ抽出ルールを特定するステップと;
保留データを抽出するために、前記データ抽出ルールに基づいて前記データ領域内の特定のデータを解析するステップであって、前記特定のデータは前記データ領域内の一部又は全部のデータである、ステップと;を備える、
データを抽出するための方法。
[第2の局面]
前記データ領域内の前記データに基づいて、対応するデータ抽出ルールを特定する前記ステップは:
前記データ領域内の前記データのタイプを特定するステップと;
前記データタイプに基づいて前記データタイプに対応する前記データ抽出ルールを特定するステップであって、前記データ抽出ルールは、異なるデータタイプに対して異なる優先度を有する、ステップと;を備える、
第1の局面に記載のデータを抽出するための方法。
[第3の局面]
前記データ領域内の前記データのタイプを特定する前記ステップは:
前記データ領域内のすべてのデータを順次に解析し、各データの文字入力状態を特定するステップであって、前記文字入力状態はダブルバイト及びシングルバイトを含む、ステップと;
前記文字入力状態に基づいて各データのタイプを特定するステップと;を備える、
第2の局面に記載のデータを抽出するための方法。
[第4の局面]
保留データを抽出するために、前記データ抽出ルールに基づいて前記データ領域内の特定のデータを解析する前記ステップは:
前記保留データを抽出するよう、最も優先度の高いデータ抽出ルールに基づいて前記データ領域内の前記特定のデータを解析するステップを備える、
第2の局面に記載のデータを抽出するための方法。
[第5の局面]
前記保留データを抽出するために、最も優先度の高いデータ抽出ルールに基づいて前記データ領域内の前記特定のデータを解析する前記ステップは:
前記保留データを確認するためのプロンプト情報を表示するステップと;
所定の確認指示を受信した場合、前記保留データを取得するステップと;
所定の再選択指示を受信した場合、所定の確認指示を受信するまでデータ抽出ルールの優先度に基づいて前記データ領域内の前記特定のデータを抽出し続け、再抽出後の保留データを取得するステップと;を備える、
第4の局面に記載のデータを抽出するための方法。
[第6の局面]
前記データ領域内の前記データに基づいて、対応するデータ抽出ルールを特定する前記ステップは:
前記データ領域内の前記データの属性情報を取得するステップと;
前記属性情報に基づいて前記データ抽出ルールを特定するステップと;を更に備える、
第2の局面に記載のデータを抽出するための方法。
[第7の局面]
前記データ領域内の前記データの属性情報を取得する前記ステップは:
前記データ領域内のすべてのデータを単語に分割するステップと;
単語分割後に得られたデータから所定のキーワードと一致するデータを検索するステップであって、前記所定のキーワードは前記属性情報を識別するために用いられる、ステップと;
前記所定のキーワードに基づいて前記データの属性情報を特定するステップと;を備える、
第6の局面に記載のデータを抽出するための方法。
[第8の局面]
前記データ領域内の前記データに基づいて、対応するデータ抽出ルールを特定する前記ステップの前に:
前記データ抽出ルールを生成し、前記データ抽出ルールを構成するステップを更に備える、
第7の局面に記載のデータを抽出するための方法。
[第9の局面]
前記データ抽出ルールを構成する前記ステップは:
異なるデータタイプに基づいて前記データ抽出ルールの優先度を構成するステップ;又は
前記データの前記属性情報に基づいて前記データ抽出ルールを構成するステップ;を備える、
第8の局面に記載のデータを抽出するための方法。
[第10の局面]
前記プレス操作位置に基づいてデータを抽出する必要があるデータ領域を特定する前記ステップは:
前記タッチスクリーン上の前記プレス操作位置の実際のカバー範囲を特定するステップと;
前記実際のカバー領域と所定の許容域とを結合し、前記データ領域を特定するステップと;を備える、
第1乃至9の局面のいずれかに記載のデータを抽出するための方法。
[第11の局面]
保留データを抽出するために、前記データ抽出ルールに基づいて前記データ領域内の特定のデータを解析する前記ステップの後に:
前記保留データが正常に取得されたことを示すプロンプト情報を出力するステップ;を更に備える、
第10の局面に記載のデータを抽出するための方法。
[第12の局面]
データを抽出するためのデバイスであって:
タッチスクリーン上のプレス操作指示を受信するよう構成された受信部と;
前記受信部が受信した前記プレス操作指示に基づいて前記タッチスクリーン上のプレス操作位置を特定するよう構成された第1の特定部と;
前記第1の特定部によって特定された前記プレス操作位置に基づいて、データが抽出される必要があるデータ領域を特定するよう構成された第2の特定部と;
前記第2の特定部によって特定された前記データ領域内の前記データに基づいて対応するデータ抽出ルールを特定するよう構成された第3の特定部と;
前記第3の特定部によって特定された前記データ抽出ルールに基づいて、前記データ領域内の特定のデータを解析して前記保留データを抽出するように構成された抽出部であって、前記特定のデータは前記データ領域内の一部又は全部のデータである、前記抽出部と;を備える、
データを抽出するためのデバイス。
[第13の局面]
前記第3の特定部は:
前記データ領域内の前記データのタイプを特定するよう構成された第1の特定モジュールと;
前記第1の特定モジュールによって特定された前記データタイプに基づいて前記データタイプに対応する前記データ抽出ルールを特定するよう構成された第2の特定モジュールであって、前記データ抽出ルールは異なるデータタイプに対して異なる優先度を有する、前記第2の特定モジュールと;を備える、
第12の局面に記載のデータを抽出するためのデバイス。
[第14の局面]
前記第1の特定モジュールは:
前記データ領域内のすべてのデータを順次解析するよう構成された解析サブモジュールと;
前記解析サブモジュールが前記データ領域内のすべてのデータを順次解析する工程において各データの文字入力状態を特定するよう構成された第1の特定サブモジュールであって、前記文字入力状態はダブルバイトとシングルバイトで構成された、前記第1の特定サブモジュールと;
前記第1の特定サブモジュールによって特定された前記文字入力状態に基づいて各データの種類を特定するよう構成された第2の特定サブモジュールと;を備える、
第13の局面に記載のデータを抽出するためのデバイス。
[第15の局面]
前記抽出部は、最も優先度の高いデータ抽出ルールに基づいて前記データ領域内の前記特定のデータを解析して前記保留データを抽出する、
第13の局面に記載のデータを抽出するためのデバイス。
[第16の局面]
前記抽出部は:
前記保留データを確認するためのプロンプト情報を表示するよう構成された表示部と;
所定の確認指示が受信された場合に前記保留データを取得するよう構成された取得モジュールと;
所定の確認指示が受信されるまで、データ抽出ルールの優先度に基づいて前記データ領域内の前記特定のデータを抽出し続け、所定の再選択指示を受信した場合に再抽出後に前記保留データを取得するよう構成された処理モジュールと;を備える、
第15の局面に記載のデータを抽出するためのデバイス。
[第17の局面]
前記第3の特定部は:
前記データ領域内の前記データの属性情報を取得するよう構成された取得モジュールと;
前記取得モジュールによって取得された前記属性情報に基づいて前記データ抽出ルールを特定するよう構成された第3の特定モジュールと;を更に備える、
第13の局面に記載のデータを抽出するためのデバイス。
[第18の局面]
前記取得モジュールは:
前記データ領域内のすべてのデータを単語に分割するよう構成された単語分割サブモジュールと;
前記単語分割サブモジュールが単語分割を実行した後に得られたデータから所定のキーワードと一致するデータを検索するよう構成された検索サブモジュールであって、前記所定のキーワードは前記属性情報を識別するために用いられる、前記検索サブモジュールと;
前記検索サブモジュールによって識別された前記所定のキーワードに基づいて前記データの属性情報を特定するよう構成された特定サブモジュールと;を備える、
第17の局面に記載のデータを抽出するためのデバイス。
[第19の局面]
前記第3の特定部が前記データ領域の前記データに基づいて前記対応するデータ抽出ルールを特定する前に、前記データ抽出ルールを生成するよう構成された生成部と;
前記生成部によって生成された前記データ抽出ルールを構成するよう構成された構成部と;を更に備える、
第18の局面に記載のデータを抽出するためのデバイス。
[第20の局面]
前記構成部は:
異なるデータタイプに基づいて前記データ抽出ルールの優先度を構成するよう構成された第1の構成モジュールと;
前記データの前記属性情報に基づいて前記データ抽出ルールを構成するよう構成された第2の構成モジュールと;を備える、
第19の局面に記載のデータを抽出するためのデバイス。
[第21の局面]
前記第1の特定部は:
前記タッチスクリーン上の前記プレス操作位置の実際のカバー領域を特定するよう構成された第1の特定モジュールと;
前記第1の特定モジュールによって特定された前記実際のカバー領域と所定の許容域とを結合するよう構成された結合モジュールと;
前記結合モジュールが前記実際のカバー領域と前記所定の許容域とを結合した後に前記データ領域を特定するよう構成された第2の特定モジュールと;を備える、
第12乃至20の局面のいずれかに記載のデータを抽出するためのデバイス。
[第22の局面]
前記保留データを抽出し、前記抽出部が前記データ抽出ルールに基づいて前記データ領域内の前記データを解析した後に前記保留データが正常に取得されたことを示すプロンプト情報を出力するよう構成された表示出力部を更に備える、
第21の局面に記載のデータを抽出するためのデバイス。
[第23の局面]
端末デバイスであって、前記端末デバイスは第12乃至22の局面のいずれかに記載の前記データを抽出するためのデバイスを備える、
端末デバイス。