特表2023-523764 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ スリーエム　イノベイティブ　プロパティズ　カンパニーの特許一覧

特表2023-523764デジタル記録を管理するシステムおよび方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1A
1B
1C
1D
1E
2
3A
3B
3C
3D
3E
3F
3G
4A
4B
4C
4D
5
6
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2023-06-07

(54)【発明の名称】デジタル記録を管理するシステムおよび方法

(51)【国際特許分類】

H04N 1/00 20060101AFI20230531BHJP

G06F 3/0481 20220101ALI20230531BHJP

G06F 3/01 20060101ALI20230531BHJP

G06T 3/00 20060101ALI20230531BHJP

G06F 16/583 20190101ALI20230531BHJP

【ＦＩ】

H04N1/00 127A

G06F3/0481

G06F3/01 560

G06T3/00 770

G06F16/583

H04N1/00 350

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2022565987

(86)(22)【出願日】2021-04-29

(85)【翻訳文提出日】2022-10-28

(86)【国際出願番号】 IB2021053573

(87)【国際公開番号】W WO2021220213

(87)【国際公開日】2021-11-04

(31)【優先権主張番号】62/704,269

(32)【優先日】2020-05-01

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

【公序良俗違反の表示】

（特許庁注：以下のものは登録商標）

１．ＢＬＵＥＴＯＯＴＨ

２．ＺＩＧＢＥＥ

(71)【出願人】

【識別番号】505005049

【氏名又は名称】スリーエムイノベイティブプロパティズカンパニー

(74)【代理人】

【識別番号】100130339

【弁理士】

【氏名又は名称】藤井憲

(74)【代理人】

【識別番号】100135909

【弁理士】

【氏名又は名称】野村和歌子

(74)【代理人】

【識別番号】100133042

【弁理士】

【氏名又は名称】佃誠玄

(74)【代理人】

【識別番号】100171701

【弁理士】

【氏名又は名称】浅村敬一

(72)【発明者】

【氏名】アクセルソン，ポンタス

(72)【発明者】

【氏名】アンスマンイエッツ，ニクラスアー．

(72)【発明者】

【氏名】ペーション，ローランド

(72)【発明者】

【氏名】アカーランド，アルフリーナス

(72)【発明者】

【氏名】ヤールバーグ，アンダースエフ．

(72)【発明者】

【氏名】ロトシュタイン，ミカエル

(72)【発明者】

【氏名】カールソン，ジョンエー．

【テーマコード（参考）】

5B057

5B175

5C062

5E555

【Ｆターム（参考）】

5B057CA08

5B057CA12

5B057CA16

5B057CB08

5B057CB12

5B057CB16

5B057CD11

5B057DA17

5B057DB02

5B057DB09

5B057DC08

5B057DC22

5B175DA02

5B175FB02

5B175GA03

5C062AA14

5C062AB23

5C062AB26

5C062AB38

5C062AB41

5C062AB42

5C062AC05

5C062AC22

5C062AC23

5C062AC24

5C062AC38

5C062AE08

5E555AA26

5E555AA76

5E555BA02

5E555BA05

5E555BA06

5E555BA38

5E555BA72

5E555BB02

5E555BB05

5E555BB06

5E555BB38

5E555BC04

5E555CA24

5E555CA42

5E555CA48

5E555CB02

5E555CB44

5E555CB49

5E555CC17

5E555CC20

5E555DA01

5E555DA21

5E555DA24

5E555DB18

5E555DB37

5E555DB41

5E555DB53

5E555DB57

5E555DC11

5E555DC13

5E555DC18

5E555DC21

5E555DC30

5E555DC35

5E555DC85

5E555EA11

5E555EA22

5E555EA24

5E555FA00

(57)【要約】

物理的記録のデジタル記録または画像のいずれかを管理するための方法である。この方法は、光学的文字認識を使用して、手書きコンテンツを文字およびアイコンに変換する。この方法はまた、カメラによって様々な角度から撮像された場合の正方形ではない物理的記録のサイズを決定する。角部が欠損した記録などの、屈曲した記録または破損した記録では、この方法は、画像内の物理的記録の縁部を検出して処理し、検出した縁部を使用して、物理的記録の画像を、屈曲または破損のない対応するデジタル記録に変換する。

【特許請求の範囲】

【請求項1】

記録を管理する方法であって、プロセッサによって実行される、
各々が手書きコンテンツの画像を含む複数のデジタル記録を受信するステップと、
前記複数のデジタル記録を単一の電子文書に組み立てるステップと、
前記手書きコンテンツを文字に変換するために、前記電子文書を光学的文字認識（ＯＣＲ）サービスまたは前記ＯＣＲを使用するためのアプリケーションに送信するステップと、
前記ＯＣＲを使用して前記手書きコンテンツを文字に変換した結果を有する前記電子文書を前記ＯＣＲサービスまたはアプリケーションから受信するステップと、
前記電子文書から前記複数のデジタル記録を電子的に分離して、前記ＯＣＲの前記結果を、対応する前記手書きコンテンツを有する前記デジタル記録に割り当てるステップと、
を含む方法。

【請求項2】

前記組み立てるステップが、前記複数のデジタル記録をグリッドに組み立てるステップを含む、請求項１に記載の方法。

【請求項3】

前記複数のデジタル記録を前記受信するステップが、対応する物理的記録の画像から変換された前記デジタル記録を受信するステップを含む、請求項１に記載の方法。

【請求項4】

前記結果がテキストを含む、請求項１に記載の方法。

【請求項5】

前記結果がアイコンを含む、請求項１に記載の方法。

【請求項6】

記録を管理する方法であって、プロセッサによって実行される、
デジタル記録を電子ディスプレイデバイスに表示するステップと、
前記デジタル記録を削除または消去するコマンドを受信するステップと、
前記コマンドに応答して、クシャクシャにされている前記デジタル記録のデジタル表現およびアニメーションを表示するステップと、
を含む方法。

【請求項7】

前記デジタル記録を前記表示するステップが、対応する物理的記録の画像から変換された前記デジタル記録を受信するステップを含む、請求項６に記載の方法。

【請求項8】

前記アニメーションの間に視覚効果を提供するステップをさらに含む、請求項６に記載の方法。

【請求項9】

前記視覚効果が、前記デジタル記録上のテクスチャを含む、請求項８に記載の方法。

【請求項10】

前記視覚効果が、前記デジタル記録上のシェーディングを含む、請求項８に記載の方法。

【請求項11】

前記アニメーションの間にクシャクシャ音の音響効果を提供するステップをさらに含む、請求項６に記載の方法。

【請求項12】

前記アニメーションの間に振動を介した触覚効果を提供するステップをさらに含む、請求項６に記載の方法。

【請求項13】

前記デジタル表現を前記表示するステップが、
前記デジタル記録を球体オブジェクト内に配置するステップと、
前記アニメーションの間に前記球体オブジェクトを縮小するステップと、
を含む、請求項６に記載の方法。

【請求項14】

【請求項15】

記録を管理する方法であって、プロセッサによって実行される、
非ゼロ角度から撮られた物理的記録の画像を受信するステップと、
前記画像内の前記物理的記録の角部を検出するステップと、
複数のカメラ角度に一致する投影に従って前記角部を再計算するステップと、
前記カメラ角度の各々において前記再計算するステップに基づいて前記角部のスコアを演算するステップと、
前記演算するステップに基づいて前記角部に対する投影角度を選択し、前記選択された投影角度における前記デジタル記録のアスペクト比に基づいて、前記デジタル記録のサイズを計算するステップと、
を含む方法。

【請求項16】

前記再計算するステップが、最大カメラ角度および最小カメラ角度を使用するステップを含む、請求項１５に記載の方法。

【請求項17】

前記再計算するステップが、前記複数のカメラ角度間で角度を漸増させながら前記角部を再計算することを含む、請求項１５に記載の方法。

【請求項18】

前記計算するステップが、
前記選択されたサイズについて、インチあたりのピクセル値を計算するステップと、
前記計算されたインチあたりのピクセル値と、前記選択されたサイズに対応する物理的記録の面積との差を求めるステップと、
を含む、請求項１５に記載の方法。

【請求項19】

記録を管理する方法であって、プロセッサによって実行される、
物理的記録の画像を受信するステップと、
前記画像内の前記物理的記録の縁部を検出するステップと、
前記縁部内の第１のセグメントを選択するステップと、
前記第１のセグメントに関連して、前記縁部内の複数の他のセグメントを選択するステップと、
前記第１のセグメントおよび前記複数の他のセグメントを前記縁部に割り当てるステップと、
前記第１のセグメントおよび前記複数の他のセグメントに基づいて、前記縁部にラベル付けするステップと、
前記ラベルに基づいて、前記画像内の前記物理的記録が屈曲または破損しているか判断するステップと、
を含む、方法。

【請求項20】

前記縁部の前記ラベルが、直線状、内曲がり、および外曲がりから選択される、請求項１９に記載の方法。

【請求項21】

前記判断するステップが、
前記物理的記録の両端の縁部が前記内曲がりまたは外曲がりのラベルを有する場合、前記物理的記録が屈曲記録であると判断するステップと、
前記物理的記録の両端の縁部が前記内曲がりまたは外曲がりのラベルを有さない場合、前記物理的記録が屈曲記録ではないと判断するステップと、
を含む、請求項２０に記載の方法。

【請求項22】

内折りまたは外折りとラベル付けされた前記縁部の屈曲係数を決定するステップをさらに含み、前記屈曲係数が、前記対応する縁部の屈曲の量を示す値である、請求項２０に記載の方法。

【請求項23】

請求項１～２２に記載の方法のうちいずれかを実行するように構成されたプロセッサを含む、記録を管理するシステム。

【請求項24】

電子ディスプレイデバイス上にユーザインタフェースを表示する方法であって、前記ユーザインタフェースが、請求項６～１４のいずれかに記載の方法に従ってクシャクシャにされている記録を表示する、方法。

【発明の詳細な説明】

【背景技術】

【0001】

アイデアおよび情報を記録、共有、および連絡する際に、紙の記録が広く使用されてきた。例えば共働セッション（例えば、ブレーンストーミングセッション）時に、参加者は再配置可能な付箋紙、ホワイトボード、または紙にアイデアを書き込んでから、互いに共有する。さらに、人々は一般に、一日を通して、その個人が忘れたくない情報またはコンテンツを記念しておくために記録を使用する。その他の例として、人々は、電話をかける、文書を修正する、またはタイムシートに記入するなど、将来に行うアクションまたはイベントのリマインダとして頻繁に記録を使用する。

【0002】

現在では、コンピュータユーザがデジタル形式でソフトウェアベースの記録を作成し、そのデジタル記録をコンピューティング環境内で利用できるようにするソフトウェアプログラムが存在する。例えば、コンピュータユーザは、デジタル記録を作成し、そのデジタル記録をコンピューティング環境によって提示される電子文書、デスクトップまたは電子ワークスペースに「添付する」ことができる。

【発明の概要】

【0003】

記録を管理する第１の方法が、各々が手書きコンテンツの画像を含む複数のデジタル記録を受信するステップと、複数のデジタル記録を単一の電子文書に組み立てるステップと、手書きコンテンツを文字に変換するために、電子文書を光学的文字認識（ＯＣＲ）サービスまたはＯＣＲを使用するためのアプリケーションに送信するステップと、ＯＣＲを使用して前記手書きコンテンツを文字に変換した結果を有する電子文書をＯＣＲサービスまたはアプリケーションから受信するステップと、電子文書から複数のデジタル記録を電子的に分離して、ＯＣＲの結果を、対応する手書きコンテンツを有するデジタル記録に割り当てるステップと、を含む。

【0004】

記録を管理する第２の方法が、デジタル記録を電子ディスプレイデバイスに表示するステップと、デジタル記録を削除または消去するコマンドを受信するステップと、コマンドに応答して、クシャクシャに（ｃｒｕｍｐｌｅ）されているデジタル記録のデジタル表現およびアニメーションを表示するステップと、を含む。

【0005】

記録を管理する第３の方法が、非ゼロ角度から撮られた物理的記録の画像を受信するステップと、画像内の物理的記録の角部を検出するステップと、複数のカメラ角度にマッチする投影に従って角部を再計算するステップと、カメラ角度の各々において再計算するステップに基づいて角部のスコアを演算するステップと、演算するステップに基づいて角部に対する投影角度を選択し、選択された投影角度におけるデジタル記録のアスペクト比に基づいて、デジタル記録のサイズを計算するステップと、を含む。

【0006】

記録を管理する第４の方法が、物理的記録の画像を受信するステップと、画像内の物理的記録の縁部を検出するステップと、縁部内の第１のセグメントを選択するステップと、第１のセグメントに関連して、縁部内の複数の他のセグメントを選択するステップと、第１のセグメントおよび複数の他のセグメントを縁部に割り当てるステップと、第１のセグメントおよび複数の他のセグメントに基づいて縁部にラベル付けするステップと、ラベルに基づいて、画像内の物理的記録が屈曲または破損しているか判断するステップと、を含む。

【図面の簡単な説明】

【0007】

【図1A】モバイルデバイス上の画像取り込みデバイスを使用して、記録が置かれた作業場所の画像を撮影するユーザの一例を示す表現である。

【図1B】モバイルデバイスの一例を示すブロック図である。

【図1C】モバイルデバイス上で実行している記録管理アプリケーションの一例を示すブロック図である。

【図1D】記録認識システムの別の実施形態を示す。

【図1E】記録管理システムの別の実施形態を示す。

【図2】対応するデジタル記録への記録の変換を行うために光学的文字認識を使用する方法のフローチャートである。

【図3A】デジタル記録のクシャクシャ機能のフローチャートである。

【図3B】クシャクシャにする３つの連続した段階における３Ｄモデルのワイヤフレームを示す画像である。

【図3C】クシャクシャにする３つの連続した段階における３Ｄモデルのワイヤフレームを示す画像である。

【図3D】クシャクシャにする３つの連続した段階における３Ｄモデルのワイヤフレームを示す画像である。

【図3E】図３Ｂ～図３Ｄに示した３Ｄモデルに対応する一連の段階の各々における、クシャクシャにされている記録をレンダリングした図を示す画像である。

【図3F】図３Ｂ～図３Ｄに示した３Ｄモデルに対応する一連の段階の各々における、クシャクシャにされている記録をレンダリングした図を示す画像である。

【図3G】図３Ｂ～図３Ｄに示した３Ｄモデルに対応する一連の段階の各々における、クシャクシャにされている記録をレンダリングした図を示す画像である。

【図4A】正方形ではない記録および、破損または屈曲した記録の、対応するデジタル記録への変換を行う方法のフローチャートである。

【図4B】スコアリングアルゴリズムを使用した結果の投影検索の出力を示す図である。

【図4C】ある角度で撮られた記録の取り込まれた画像である。

【図4D】画像が角度をつけずに撮影されたように見えるように射影変換した、図４Ｃの取り込まれた画像である。

【図5】屈曲した記録の、対応するデジタル記録への変換を行っている状態を示す画像である。

【図6】屈曲した記録の、対応するデジタル記録への変換を行っている状態を示す画像である。

【図7】屈曲した記録の、対応するデジタル記録への変換を行っている状態を示す画像である。

【図8】屈曲した記録の、対応するデジタル記録への変換を行っている状態を示す画像である。

【図9】屈曲した記録の、対応するデジタル記録への変換を行っている状態を示す画像である。

【図10】屈曲した記録の、対応するデジタル記録への変換を行っている状態を示す画像である。

【発明を実施するための形態】

【0008】

概観
本開示は、物理的記録を表現するソフトウェア記録を作成および操作する技法を記載する。例えば、物理的環境内に存在する物理的記録を認識し、そこから情報を取り込み、物理的記録に対応するデジタル表現を作成する技法が記載され、この表現は、本明細書においてデジタル記録またはソフトウェアベースの記録と称される。さらに、本開示の少なくともいくつかの態様は、複数の記録を管理する技法を対象とする。

【0009】

一般に、記録には、物理的記録およびデジタル記録が含まれ得る。物理的記録は一般に、全体的な境界と認識可能なコンテンツとを有するオブジェクトを指す。物理的記録としては、例えば紙、ホワイトボード、または入力を受け入れる他のオブジェクトなどのオブジェクト上に、人が筆記、描画、または他のタイプの入力することにより得られた結果のオブジェクトが挙げられ得る。例として、物理的記録としては、手書きの再配置可能な付箋、紙、フィルム、図が描かれたホワイトボード、ポスター、看板が挙げられ得る。いくつかの事例では、物理的記録は、例えば、印刷可能な再配置可能な付箋紙への印刷または印刷された文書の印刷などのデジタル手段を使用して生成され得る。いくつかの事例では、１つのオブジェクトが、いくつかの記録を含み得る。例えば、いくつかのアイデアが、１枚のポスター用紙またはホワイトボードに書き込まれ得る。物理的記録は、二次元または三次元であり得る。物理的記録は、様々な形状およびサイズを有し得る。例えば、ある物理的記録は、３インチ×３インチの記録であってもよく、ある物理的記録は、２６インチ×３９インチのポスターであってもよく、ある物理的記録は、三角形の金属看板であってもよい。いくつかの事例では、物理的記録は、既知の形状および／またはサイズを有する。デジタル記録は、一般に、情報および／またはアイデアを有するデジタルオブジェクトを指す。デジタル記録は、デジタル入力を使用して生成できる。デジタル入力としては、例えばキーボード、タッチスクリーン、デジタルカメラ、デジタル録画デバイス、スタイラス、デジタルペンなどが挙げられ得る。いくつかの事例では、デジタル記録は、物理的記録の表現であってもよい。

【0010】

記録管理システム
図１Ａは、記録認識環境１０の例を示す。図１Ａの例では、環境１０は、作業場所２０から１つ以上の記録２２を取り込んで認識するモバイルデバイス１５を含む。本明細書に記載されるように、モバイルデバイスは、記載されるように、作業場所２０からの記録２２の集合体などの多数の物理的記録から記録コンテンツを効率的に取り込み、抽出することのできる、１つ以上のソフトウェアアプリケーションの実行環境を提供する。この例では、記録２２は、複数の参加者を有する共同ブレーンストーミングセッションの結果であってもよい。記載されるように、モバイルデバイス１５およびその上で実行しているソフトウェアは様々な記録関連動作を実施してもよく、それらの動作には、作業場所２０の物理的記録２２を表現するデジタル記録の自動作成が含まれる。

【0011】

この実装形態例では、モバイルデバイス１５は、他の構成要素の中でもとりわけ、画像取り込みデバイス１８および提示デバイス２８を含む。さらに、図１Ａには示されていないが、モバイルデバイス１５は、本明細書に記載の機能を提供するためにソフトウェアまたはファームウェアを実行する１つ以上のプロセッサ、マイクロプロセッサ、内部メモリおよび／またはデータストレージ、ならびに他の電子回路を含んでもよい。

【0012】

一般に、画像取り込みデバイス１８は、作業場所２０および、その中に配置された記録２２を表現する画像データを取り込むように構成された、カメラまたは他の構成要素である。換言すれば、画像データは、作業場所２０などの、複数の視覚的記録を有する環境の視覚表現を取り込む。画像取り込みデバイス１８は、モバイルデバイス１５のカメラとして説明されるが、ビデオレコーダ、赤外線カメラ、ＣＣＤ（電荷結合素子）アレイ、レーザスキャナなどの、画像データを取り込むことができる他の構成要素を含んでもよい。さらに、取り込まれた画像データは、画像、ビデオ、画像のシーケンス（すなわち、ある期間内に、および／または、ある順序で撮られた複数の画像）、画像の集合体などのうち少なくとも１つを含み得、本明細書では、入力画像という用語は様々な例示的なタイプの画像データを指すために使用される。

【0013】

提示デバイス２８としては、モバイルデバイス２８と共に使用するための、液晶ディスプレイ（ＬＣＤ）または他のタイプのディスプレイデバイスなどの電子的にアドレス可能なディスプレイが挙げられるが、これらに限定されない。いくつかの実装形態では、モバイルデバイス１５は、提示デバイス２８上に表示する記録のコンテンツを、例えば、行および／または列にグループ化されたリスト、フロー図など様々なフォーマットで生成する。いくつかの場合では、モバイルデバイス１５は、タブレットコンピュータ、プロジェクタ、電子掲示板、または他の外部デバイスなどの他のデバイスで表示するために、表示情報を通信してもよい。

【0014】

本明細書に記載されるように、モバイルデバイス１５およびその上で実行するソフトウェアは、物理的記録２２を表現したデジタル記録を作成して操作するためのプラットフォームを提供する。例えば、一般にモバイルデバイス１５は、画像取り込みデバイス１８によって生成された画像データを処理して、作業場所２０内に配置された物理的記録２２のうち少なくとも１つを検出して認識するように構成されている。いくつかの例では、モバイルデバイス１５は、記録の全体的な境界を判断することによって記録を認識するように構成されている。記録を認識した後に、モバイルデバイス１５は、１つ以上の記録のうち少なくとも１つのコンテンツを抽出し、コンテンツとは記録２２の視覚情報である。

【0015】

いくつかの例示的な実装形態では、モバイルデバイス１５は、ユーザ２６がデジタル記録をクラウドベースのリポジトリ（例えば、クラウドサーバ１２）または他のコンピューティングデバイス（例えば、コンピュータシステム１４またはモバイルデバイス１６）などの他のシステムにエクスポートすることができる機能を提供する。

【0016】

図１Ａの例では、モバイルデバイス１５は、携帯電話として示されている。しかし、他の例では、モバイルデバイス１５は、タブレットコンピュータ、携帯情報端末（ＰＤＡ）、ラップトップコンピュータ、メディアプレーヤ、電子書籍リーダ、ウェアラブルコンピューティングデバイス（例えば、時計、アイウェア、グローブ）、または本明細書に記載の技法を実施するのに適した任意の他のタイプのモバイルまたは非モバイルのコンピューティングデバイスであってもよい。

【0017】

図１Ｂは、本明細書に記載の技法に従って動作するモバイルデバイスの例を示すブロック図である。例を目的として、図１Ｂのモバイルデバイスは、図１Ａのモバイルデバイス１５に関して説明される。

【0018】

この例では、モバイルデバイス１５は、デバイスの動作のためのコア機能を提供する様々なハードウェア構成要素を含む。例えば、モバイルデバイス１５は、典型的にはスタティックランダムアクセスメモリ（ＳＲＡＭ）デバイスまたはフラッシュメモリデバイスなどのコンピュータ可読媒体またはデータストレージ６８に記憶されている実行可能命令（すなわち、プログラムコード）に従って動作するように構成された、１つ以上のプログラム可能なプロセッサ７０を含む。図１Ａに記載されるように、Ｉ／Ｏ７６は、キーボード、カメラボタン、電源ボタン、音量ボタン、ホームボタン、バックボタン、メニューボタン、または提示デバイス２８などの１つ以上のデバイスを含んでもよい。送信器７２および受信器７４は、図１Ａに記載されるとおりの無線通信インタフェースを介して、図１Ａに記載されるとおりのクラウドサーバ１２、コンピュータシステム１４、または他のモバイルデバイス１６などの他のデバイスとの高周波無線周波数（ＲＦ）信号などの無線通信を提供するが、ＲＦ信号に限定されない。マイクロフォン７１が、音声情報を対応する電気信号に変換する。スピーカ７３が、電気信号を対応する音声情報に変換する。振動モータ７５が、モバイルデバイス１５またはそのハウジングを振動させるために使用される。モバイルデバイス１５は、図１Ｂに示されていない、付加的な別個のデジタルロジックまたはアナログ回路を含んでもよい。

【0019】

一般に、プロセッサ７０上でオペレーティングシステム６４を実行して、記録管理アプリケーション７８を含めた１つ以上のユーザアプリケーション７７（一般に「アプリ」と呼ばれる）に動作環境を提供する。ユーザアプリケーション７７は、例えば、プロセッサ７０によって実行するための、コンピュータ可読記憶デバイス（例えば、データストレージ６８）に記憶された実行可能なプログラムコードを含んでもよい。他の例として、ユーザアプリケーション７７はファームウェアを含んでもよく、またはいくつかの例では、別個のロジックで実装されてもよい。

【0020】

動作中、モバイルデバイス１５は、入力画像データを受信し、本明細書に記載の技法に従って入力画像データを処理する。例えば、画像取り込みデバイス１８は、図１Ａの記録２２を有する作業場所２０などの、複数の記録を有する環境の入力画像を取り込んでもよい。別の例として、モバイルデバイス１５は、クラウドサーバ１５、コンピュータシステム１４、またはモバイルデバイス１６などの外部ソースから受信器７４を介して画像データを受信してもよい。一般に、モバイルデバイス１５は、記録管理アプリケーション７８および／または他のユーザアプリケーション７７によってアクセスおよび処理するために、データストレージ６８に画像データを記憶する。

【0021】

図１Ｂに示すように、ユーザアプリケーション７７は、オペレーティングシステム６４のカーネル機能を呼び出して、モバイルデバイスのユーザに情報を表示するためのグラフィカルユーザインタフェース（ＧＵＩ）７９を出力してもよい。以下でさらに説明するように、記録管理アプリケーション７８は、ＧＵＩ７９を構築および制御して、物理的記録２２を表現した対応するデジタル記録を生成して操作するための改善された電子環境を提供することができる。例えば、記録管理アプリケーション７８は、特定の特性をもつ記録を取り込んだことに応答して自動的にトリガされるイベントをユーザ２６が容易に制御することを可能にする機構を含むように、ＧＵＩ７９を構築してもよい。さらに、記録管理アプリケーション７８は、ユーザ２６がデジタル記録のグループ間の関係を管理することを可能にする機構を含むように、ＧＵＩ７９を構築してもよい。

【0022】

図１Ｃは、本明細書に記載の技法に従って動作する記録管理アプリケーション７８の１つの例示的な実装形態を示すブロック図である。ユーザアプリケーション７７は、モバイルデバイス１５上で実行するとして記載されているが、本明細書に記載の例は、クラウドサーバ１２、コンピュータシステム１４、または他のモバイルデバイスなどの、任意のコンピューティングデバイスに実装されてもよい。

【0023】

この例では、記録管理アプリケーション７８は、画像処理およびオブジェクト認識機能を提供する画像処理エンジン８２を含む。画像処理エンジン８２は、画像通信モジュール９０、記録識別モジュール８６、およびデジタル記録生成モジュール８８を含んでもよい。さらに、画像処理エンジン８２は、画像処理エンジン８２の他の構成要素によって使用するための、例えば、画像の２値化、マスキング、フィルタリング、縁部検出などの画像操作機能のライブラリを提供する、画像処理アプリケーションプログラミングインタフェース（ＡＰＩ）９５を含む。

【0024】

一般に、画像データは、データ記憶デバイス６８に記憶されてもよい。この例では、記録管理アプリケーション７８は、データ記憶デバイス６８に画像９７を記憶する。画像９７の各々は、図１Ａの作業場所２０などの、複数の物理的画像を有する環境のピクセルデータを含み得る。

【0025】

本明細書に記載されるように、記録識別モジュール８６は、画像９７を処理し、画像内の複数の物理的記録を識別する（すなわち、認識する）。デジタル記録生成モジュール８８は、画像９７内で認識された物理的記録に対応するデジタル記録９９を生成する。例えば、デジタル記録９９の各々は、入力画像９７で識別された物理的記録のうち１つに対応する。このプロセスの間に、デジタル記録生成モジュール８８は、デジタル記録のレコードを含むようにデータベース９４を更新し、また、記録識別モジュール８６によって検出された物理的記録の決定された境界内の入力画像から抽出された情報（例えば、コンテンツ）をデータベースに記憶してもよい。さらに、デジタル記録生成モジュール８８は、デジタル記録をデジタル記録の１つ以上のグループに関連付けるメタデータをデータベース９４に記憶してもよい。

【0026】

さらに、記録管理アプリケーション７８は、特定の特性を有する物理的記録の検出に応答してアクションをトリガする規則１０１を、例えばユーザ入力２６によって指定するように構成されてもよい。例えば、ユーザインタフェース９８は、ユーザ入力に基づいて、記録の特定の特性にアクションをマッピングしてもよい。記録管理アプリケーション７８は、記録グループ化アクション、または、カレンダーアプリケーションに関連するアクションなどのモバイルデバイスで実行している別のソフトウェアアプリケーションに関連するアクションなどの、アクションを伴う規則をユーザが指定することのできるユーザインタフェース９８を出力してもよい。ユーザインタフェース９８は、各規則について、アクションをトリガするための基準をユーザが定義することを可能にする。この構成プロセスの間、ユーザインタフェース９８は、アクションをトリガし、画像データを処理して色またはコンテンツなどの特性を抽出するための例示的な記録を表現した画像データを取り込むようにユーザに促してもよい。次いで、ユーザインタフェース９８は、その例示的な記録に対応する規則を定義することを支援するために、決定された基準をユーザに提示してもよい。

【0027】

画像通信モジュール９０は、モバイルデバイス１５と、クラウドサーバ１２、コンピュータシステム１４、モバイルデバイス１６、または画像取り込みデバイス１８などの外部デバイスとの間の画像データの通信を制御する。いくつかの例では、画像通信モジュール９０は、例えば、環境および／またはデジタル記録の処理済みまたは未処理の画像９７と、そこから抽出された関連情報とを、データベース６８からのメタデータを含めてユーザが通信することを可能にしてもよい。いくつかの例では、画像通信モジュール９０は、このデータを、ＦＴＰ、ＨＴＴＰ、電子メール、Ｂｌｕｅｔｏｏｔｈまたは他の機構によって通信され得るｚｉｐファイルにエクスポートする。

【0028】

図１Ｃの例では、記録管理アプリケーション７８は、ＧＵＩ７９（図１Ｂ）を構築して制御するユーザインタフェース９８を含む。以下に記載されるように、いくつかの例では、ユーザインタフェース９８は、複数のデジタル記録９９にオーバーレイされた入力画像９７を表示するために出力してもよく、対応する物理的記録の代わりにデジタル記録の各々がオーバーレイされる。さらに、ユーザインタフェース９８は、ユーザによって指定されたデジタル記録９９のグループを表示してもよい。このデジタル記録９９のグループは、例えば、特定の入力画像９７内で認識されたデジタル記録のサブセットであってもよい。ユーザインタフェース９８は、この指定されたデジタル記録のグループ（セット）をＧＵＩ７９の第２の部分に表示し、ユーザ２６が指定されたグループからデジタル記録９９を容易に追加または消去することを可能にしてもよい。

【0029】

いくつかの例示的な実装形態では、ユーザインタフェース９８は、ユーザがオーバーレイ画像および／またはデジタル記録を編集することを可能にする画像エディタ９６を提供する。別の例では、デジタル記録生成モジュール８８は、入力画像から抽出された情報を強化するプロセスまたは複数のプロセスを含んでもよい。

【0030】

図１Ｄは、記録認識システム１００Ａの別の例示的な実施形態を示す。システム１００Ａは、処理ユニット１１０、１つ以上の記録１２０、センサ１３０、および記録コンテンツリポジトリ１４０を含み得る。処理ユニット１１０は、１つ以上のプロセッサ、マイクロプロセッサ、コンピュータ、サーバ、および他のコンピューティングデバイスを含み得る。センサ１３０、例えば画像センサは、１つ以上の記録１２０を有するシーンの視覚表現を取り込むように構成されている。センサ１３０は、カメラ、ビデオレコーダ、赤外線カメラ、ＣＣＤ（電荷結合素子）アレイ、スキャナなどのうち少なくとも１つを含み得る。視覚表現は、画像、ビデオ、画像のシーケンス（すなわち、ある期間内に、および／または、ある順序で撮られた複数の画像）、画像の集合体などのうち少なくとも１つを含み得る。処理ユニット１１０は、センサ１３０に結合され、視覚表現を受信するように構成されている。いくつかの事例では、処理ユニット１１０は、センサ１３０に電子的に結合される。処理ユニット１１０は、視覚表現から、１つ以上の記録１２０のうち少なくとも１つを認識するように構成されている。いくつかの実施形態では、処理ユニット１１０は、記録の全体的な境界を判断することによって記録を認識するように構成されている。記録を認識した後、処理ユニット１１０は記録のコンテンツを抽出する。いくつかの事例では、処理ユニット１１０は、それらの記録を有するシーンの視覚表現から、２つ以上の記録のコンテンツを認識および抽出するように構成されている。

【0031】

いくつかの事例では、処理ユニット１１０は、非一時的コンピュータ可読媒体に記憶されたソフトウェアまたはファームウェアを実行して、システム１００Ａの様々なプロセス（例えば、記録を認識する、記録を抽出するなど）を実装することができる。記録コンテンツリポジトリ１４０は、単一のコンピュータ、サーバ、記憶デバイス、クラウドサーバ上などで実行してもよい。いくつかの他の場合では、記録コンテンツリポジトリ１４０は、一連のネットワークコンピュータ、サーバ、またはデバイス上で実行してもよい。いくつかの実装形態では、記録コンテンツリポジトリ１４０は、ローカル、リージョナル、および中央を含む、データ記憶デバイスの階層を含む。記録１２０は、共同スペースに規則的またはランダムに配置された物理的記録を含むことができ、センサ１３０は共同スペース内にある記録１２０の視覚表現を生成する。

【0032】

いくつかの実装形態では、記録認識システム１００Ａは、どの記録が認識されているか、および／またはどの記録のコンテンツが抽出されているかをユーザに示す、提示デバイス（図１Ｄには示されていない）を含み得る。さらに、記録認識システム１００Ａは、抽出されたコンテンツを提示デバイスを介して提示することができる。いくつかの実施形態では、処理ユニット１１０は、記録のコンテンツを抽出する前に、記録を認証することができる。記録が認証された場合は、コンテンツを抽出し、記録コンテンツリポジトリ１４０に記憶する。

【0033】

図１Ｅは、記録管理システム１００Ｂの実施形態を示す。この実施形態では、記録管理システム１００Ｂは、処理ユニット１１０、１つ以上の記録１２０、１つ以上の記録ソース１５０、および記録コンテンツリポジトリ１４０を含む。いくつかの事例では、システム１００Ｂは、提示デバイス１６０を含む。処理ユニット１１０、記録１２０、および記録コンテンツリポジトリ１４０は、図１Ａに示すとおりの記録認識システム１００Ａの構成要素と同様である。記録ソース１５０は、１つ以上の記録を有するシーンの視覚表現などの物理的記録のコンテンツを提供するソースと、キーボードから入力されたデータストリームなどのデジタル記録のコンテンツを提供するソースと、を含み得る。いくつかの実施形態では、記録管理システム１００Ｂは、第１のソースおよび第２のソースを含み、第１のソースは、１つ以上の記録１２０を有するシーンの視覚表現である。第１のソースおよび第２のソースは、異なるデバイスによって生成される。第２のソースは、テキストストリーム、画像、ビデオ、ファイル、およびデータエントリのうち少なくとも１つを含む。処理ユニット１１０は、記録認識システム１００Ａについて説明したように、第１のソースから記録のうち少なくとも１つを認識し、記録のコンテンツを抽出する。いくつかの場合では、処理ユニット１１０は、記録にカテゴリをラベル付けする。処理ユニット１１０は、記録の特定の形状、色、コンテンツ、および／または他の情報に基づいて、記録をラベル付けすることができる。例えば、記録の各グループは、異なる色（例えば、赤、緑、黄色など）を有することができる。

【0034】

いくつかの実施形態では、記録管理システム１００Ｂは、記録１２０のコンテンツをユーザに示すために、１つ以上の提示デバイス１６０を含み得る。提示デバイス１６０は、液晶ディスプレイ（ＬＣＤ）、タブレットコンピュータ、プロジェクタ、電子掲示板、携帯電話、ラップトップなどの電子的にアドレス可能なディスプレイを含み得るが、これらに限定されない。いくつかの実装形態では、処理ユニット１１０は、提示デバイス１６０上に表示する記録のコンテンツを、例えば、行および／または列にグループ化されたリスト、フロー図など様々なフォーマットで生成する。

【0035】

記録認識システムおよび記録管理システムの、処理ユニット、画像センサ、および記録コンテンツリポジトリなどの様々な構成要素は、通信インタフェースを介して通信することができる。通信インタフェースとしては、有線または無線の短距離および長距離の任意の通信インタフェースが挙げられるが、これらに限定されない。短距離通信インタフェースは、例えば、ローカルエリアネットワーク（ＬＡＮ）や、Ｂｌｕｅｔｏｏｔｈ規格、ＩＥＥＥ８０２規格（例えば、ＩＥＥＥ８０２．１１）、ＩＥＥＥ８０２．１５．４規格に基づくＺｉｇＢｅｅまたは同様の仕様など、または他の公共もしくは独自の無線プロトコルなどの、既知の通信規格に準拠するインタフェースであってもよい。長距離の通信インタフェースは、例えば、ワイドエリアネットワーク（ＷＡＮ）、セルラーネットワークインタフェース、衛星通信インタフェースなどであってもよい。通信インタフェースは、イントラネットなどのプライベートコンピュータネットワーク内、または、インターネットなどの公共コンピュータネットワーク上のいずれかにあってもよい。

【0036】

記録のための光学的文字認識（ＯＣＲ）
図２は、対応するデジタル記録への記録の変換を行うために光学的文字認識を使用する方法のフローチャートである。この方法は、モバイルデバイス１５内のプロセッサ７０によって実行するためのソフトウェアまたはファームウェアに実装することができる。この方法は、例えばコンテンツ１を有するデジタル記録２１０、コンテンツ２を有するデジタル記録２１２、およびコンテンツ３を有するデジタル記録２１４などの、手書きコンテンツを有するデジタル記録を受信すること（ステップ２００）を含む。手書きコンテンツは、例えば文字、テキスト、記号、アイコン、または絵文字を含み得る。手書きコンテンツは、例えば、記録用紙に直接手書きされた、もしくはデジタル記録に電子的に書かれたコンテンツ、または、手書きのように見えるコンテンツを含み得る。例示目的のため、デジタル記録は３つしか示されていないが、この方法は、より多くの複数のデジタル記録に対応することができる。

【0037】

デジタル記録は、単一の電子文書または画像においてグリッドまたは他のフォーマットに組み立てられる（ステップ２０２）。例えば、グリッド２１６は、デジタル記録２１０、２１２、および２１４からのコンテンツを含む。デジタル記録のグリッドは、ＯＣＲサービスまたはアプリケーションに送信され（ステップ２０４）、これはデジタル記録のグリッドをネットワークを介してＯＣＲサービスまたはアプリケーションに電子的に伝送することを含み得る。ＯＣＲの結果が受信される（ステップ２０６）。結果は、例えば、デジタル記録２１０の結果１、デジタル記録２１２の結果２、およびデジタル記録２１４の結果３を含む、電子文書のグリッド２１８を含み得る。ＯＣＲの結果は、受信したデジタル記録内のコンテンツを、例えばテキスト、シンボル、アイコン、または絵文字などの対応する文字に変換したものを含む。

【0038】

方法は、ＯＣＲの結果を元のデジタル記録に割り当てる（ステップ２０８）。例えば、結果１は、デジタル記録２１０に割り当てられ、結果２は、デジタル記録２１２に割り当てられ、結果３は、デジタル記録２１４に割り当てられる。結果を割り当てることは、例えば、手書きコンテンツを結果に置き換えてデジタル記録を表示すること、または、結果および元の手書きコンテンツの両方を表示することを含み得る。

【0039】

ＯＣＲサービスまたはアプリケーションは、典型的には、コンテンツを対応する文字に変換するための各ＯＣＲ要求に対して料金を請求する。複数のデジタル記録を単一の電子文書または画像に組み立てることによって、デジタル記録のためにＯＣＲを要求する数を削減することができ、コスト削減および、より効率的なＯＣＲサービスまたはアプリケーションの使用をもたらす。

【0040】

記録のクシャクシャ機能
図３Ａは、デジタル記録のクシャクシャ機能のフローチャートである。この方法は、モバイルデバイス１５内のプロセッサ７０によって実行するためのソフトウェアまたはファームウェアに実装することができる。

【0041】

この方法は、例えばモバイルデバイス１５のＧＵＩ７９などのディスプレイ画面上に表示されたデジタル記録を、削除もしくは消去するためのユーザコマンド、または他の命令を受信する（ステップ３０２）。この方法は、クシャクシャにされているデジタル記録のデジタル表現およびアニメーションを表示し、デジタル記録がしわくちゃになったり折り畳まれたりする様子を示して物理的記録をクシャクシャにするのをシミュレートする（ステップ３０４）。デジタル表現およびアニメーションは、例えば、アニメーションの少なくとも一部の間に、視覚効果（ステップ３０６）、音響効果（ステップ３０８）、および触覚効果（ステップ３１０）のうち１つ以上を含み得る。アニメーションの後、クシャクシャにされたデジタル記録は、ＧＵＩ７９または他のディスプレイ画面から任意選択で消去できる。

【0042】

ステップ３０６の視覚効果は、例えば、ライティング、テクスチャ、陰影、および表面効果を含み得る。ステップ３０８の音響効果は、例えば、物理的記録がクシャクシャにされてスピーカ７３上で再生される音、または、アニメーションの少なくとも一部の間にスピーカ７３で再生される別のタイプの音を含み得る。触覚効果は、例えば、ユーザの手の中で物理的記録をクシャクシャにする感覚の触覚体験を作るために、振動モータ７５を使用してモバイルデバイス１５を振動させることを含み得る。振動モータ７５を特定のパターンでトリガして触覚経験を作ることができる。１つの例示的なパターンは、音とアニメーションに同期するように構成された連続的および一時的な触覚イベントの組み合わせであり、１つの短い（１００ミリ秒）連続的なイベントと、３００ミリ秒にわたって綿密に間隔をあけて、精細に調整された強度レベルをもつ７つの一時的イベントである。

【0043】

表１は、図３Ａの方法を実装するアルゴリズムのステップを提供する。

【表1】

【0044】

表１のアルゴリズムのステップに示すとおり、図３Ｂ～３Ｄは、例示的なデジタル記録をクシャクシャにする３つの順次的な段階における３Ｄモデルのワイヤフレームを示す画像であり、図３Ｅ～図３Ｇは、図３Ｂ～図３Ｄに示した３Ｄモデルに対応する連続的な各段階における、クシャクシャにされている例示的なデジタル記録をレンダリングした図を示す画像である。

【0045】

正方形ではない記録
図４Ａは、正方形ではない記録および、破損または屈曲した記録の、対応するデジタル記録への変換を行う方法のフローチャートである。この方法は、モバイルデバイス１５内のプロセッサ７０によって実行するためのソフトウェアまたはファームウェアに実装することができる。

【0046】

この方法は、例えば、正方形ではない記録４１０、破損した記録４１２（角部が破れている、欠損している、または折れ曲がっている）、もしくは屈曲した記録４１４などの、正方形ではない記録、または破損もしくは屈曲した記録の画像を受信すること（ステップ４０２）を含む。この方法は、受信した記録の画像にスコアリングアルゴリズムを適用し（ステップ４０４）、受信した記録の画像に検出アルゴリズムを適用する（ステップ４０６）。この方法は、スコアリングアルゴリズムおよび検出アルゴリズムを使用して、受信した記録を、例えば、正方形ではないデジタル記録４１６、角部が欠損していないデジタル記録４１８、および屈曲していないデジタル記録４２０などの、対応するデジタル記録に変換する（ステップ４０８）。

【0047】

図４Ａの方法は、再配置可能な付箋紙を含む、さまざまな形状およびサイズの紙製品に使用できる。この方法では、矩形（正方形ではない）および矩形ではない記録用紙などの製品、ならびにホワイトボードなどの紙ではない製品を検出することができる。これらの製品のいくつかの例は、５×８インチ、２×２インチ、および８×６インチの再配置可能な付箋紙である。

【0048】

取り込んだ画像内の物理的記録のサイズを判断できるように、あるアルゴリズムを使用して図４Ａの方法を実装することができる。アルゴリズムを実行した後、この方法は、４つの角部によって画定されるほぼ矩形の形状の「記録」の集合体を有する。物理的記録のすべてが同じサイズであっても、取り込まれた画像では射影によって記録の形状が歪んでいるので、これらの矩形には形状およびサイズにばらつきがあり、アルゴリズムが報告した角部の位置は１００％正確でないこともある。

【0049】

デジタル記録がどの物理的サイズに対応するか正しく判断できるように、デジタル記録は射影補正され、すなわち、角部の位置が再計算され、記録が正面から真っ直ぐに（非ゼロ角度ではなく、正面から）取り込まれたように見える。これは、以下のサーチを使用して行われる。

【0050】

１．Ｘ軸およびＹ軸に沿った最小角度から最大角度までのすべてのカメラ角度について、カメラ角度と一致する投影に従って記録の角部が再計算され、スコアが計算される。（例：－５５度から開始して５５度で終了し、２度ごとの段階でで、すなわち、－５５度で開始して、次いで－５３度で、次いで－５１度で、記録の角部を再計算する）。図４Ｂを参照されたい。

【0051】

２．スコアは、デジタル記録の「直角度」を最大化するように、すなわち、角部の角度が可能な限り９０度に近く、垂直縁部の長さが可能な限り類似し、水平縁部が可能な限り類似するように、設計されている。

【0052】

図４Ｂは、投影サーチからの出力を示す。各点は、Ｘ値とＹ値の組み合わせのスコアリングの結果である。色が暗いほど、より良いスコアを意味する。サーチスペース内のより明るい色の点は、最良のスコアを有するものである。

【0053】

図４Ｃは、ある角度で（ゼロ以外の角度で正面から）で撮られた記録の取り込まれた画像である。図４Ｄは、図４Ｃの取り込まれた画像であるが、射影変換され、画像が角度をつけずに正面から見たもののように見える。

【0054】

次のステップのために最良スコアを有する投影角度が選択され、このステップには、個々の記録のアスペクト比に最もよく対応する記録サイズの組み合わせと、それらの相対的なサイズを以下のようにして見つけることを含む。

【0055】

１．各記録について、アスペクト比に基づいて、最も近い記録サイズ（複数）を計算する。最も近いサイズクラスは、デジタル記録に類似したアスペクト比を有するものである。例えば、アスペクト比が０．９８の記録は、アスペクト比１を有する、すべての正方形記録サイズに非常に近いことになる。アスペクト比１．２８を有する記録は、８×６（アスペクト比１．２５を有する）および６×４（アスペクト比１．３３を有する）の両方に十分に近いことになる。サイズクラスの各々について、インチあたりのピクセル値、すなわち、記録サイズが正しいものである場合に各ピクセルが表現する物理的面積がどれぐらいの大きさであるかを計算する。

【0056】

２．計算されたインチあたりのピクセル値の各々について、各記録について最も一致するサイズクラスを計算し、物理的記録とデジタル記録の計算値との間の面積およびアスペクト比の差に基づいて、総誤差を計算する。

【0057】

３．最小の総誤差を有する区分を選択する。選択された区分に基づくサイズを有する対応するデジタル記録を生成するために、選択された区分を記録に割り当てることができる。

【0058】

破損した記録および屈曲した記録
破損した記録（すなわち、角部が折れ曲がっている、または角部が裂けている記録）、および屈曲した記録（すなわち、貼り付けられている表面と同一平面にない記録）は、記録が完全に欠落するか、または記録の形状が正しくないかのいずれかである、準最適な検出結果を引き起こす可能性がある。これらの問題を適切に修正するために、ステップ４０６の検出アルゴリズムを使用する図４Ａの方法を、破損または屈曲した記録を処理するために用いることもでき、ソフトウェアアルゴリズムが記録の正確な形状を見つけることを可能にする。

【0059】

検出アルゴリズムは、デジタル記録の角部について生成された追加のメタデータを調べることによって、記録が屈曲しているかを見つける。サポートされる記録サイズは矩形なので、最終結果は記録の４つの角部の位置を含む。しかし、検出アルゴリズム自体においては、さらに詳細な輪郭、すなわち、５つ以上の縁部を有する輪郭が使用される（図５参照）。

【0060】

詳細な輪郭では、開始点として、最も長いセグメントが最初に選択される。このセグメントを考慮して、さらに３つのセグメントが、それらの長さ（例えば、最長セグメントの少なくとも２５％）および、最長セグメントに対する相対位置に基づいて、「主縁部」であると判断される（図６参照）。詳細な輪郭内にある残りのセグメントは、主縁部に対する角度の類似性に基づいて、４つの縁部に割り当てられる（図７参照）。

【0061】

こうしてアルゴリズムは、４つの縁部を検出し、各縁部は１つ以上のセグメントからなる。

【0062】

１．縁部が１つのセグメントのみからなる場合、それは直線状の縁部としてラベル付けされる。

【0063】

２．縁部が２つ以上のセグメントを有する場合、セグメントは、直線状（それらのセグメントがある程度直線状のラインを形成する場合）、または、内曲がりもしくは外曲がりのいずれかとして、屈曲係数を付してラベル付けされ、屈曲係数は、縁部がどのように屈曲しているかを示す値を意味する。縁部を構成するセグメント間の角度を合計することによって、縁部が屈曲しているか直線状であるか判断される。屈曲は、単にバイナリ値として、すなわち記録が屈曲しているか屈曲していないかのいずれか記録される。次いで、記録が屈曲しているという事実は、サイズおよび形状が、屈曲していない記録よりも正確ではない可能性があるというヒントとして使用される。屈曲係数は、例えば、縁部を構成するセグメント間の角度の合計に基づくことができる。

【0064】

記録の両端の２つの縁部がそれぞれ内曲がりおよび外曲がりになっている場合、その記録は屈曲した記録であり、その記録候補にはこの情報が付される（図９を参照）。

【0065】

このアルゴリズムはまた、同じ方法または類似した方法で記録の縁部を調べて、欠落した部分のない対応するサイズのデジタル記録を見つけることによって、破損した記録、例えば、一部が欠落している記録を処理することができる。

【0066】

図５～図１０は、対応するデジタル記録への屈曲記録の変換を行っている状態を示す画像である。図５は、入力された輪郭を有する記録、図６は、主縁部、図７は、セグメントの割り当て、図８は、縁部の終端、図９は、縁部の区分、図１０は、記録の最終的な角部位置である。

【図1A】