(58)【調査した分野】(Int.Cl.,DB名)
前記フォント種別特定部は、前記所定処理単位が単語である場合において、(a)3文字以上の単語および1文字の単語に対しては前記フォント種別特定処理を実行し、(b)2文字の単語については、当該2文字の単語の直前の単語のフォント種別と当該2文字の単語の直後の単語のフォント種別とが同一である場合には、当該2文字の単語のフォント種別を、当該2文字の単語の直前および直後の単語のフォント種別と同一とすることを特徴とする請求項1記載の画像処理装置。
前記フォント種別特定部は、2文字の単語については、(b1)当該2文字の単語の直前の単語のフォント種別と当該2文字の単語の直後の単語のフォント種別とが同一である場合には、前記フォント種別特定処理をせずに、当該2文字の単語のフォント種別を、当該2文字の単語の直前および直後の単語のフォント種別と同一とし、(b2)当該2文字の単語の直前の単語のフォント種別と当該2文字の単語の直後の単語のフォント種別とが互いに異なる場合には、当該2文字の単語に対して前記フォント種別特定処理を実行することを特徴とする請求項2記載の画像処理装置。
前記フォント種別特定部は、前記所定処理単位に対する上位処理単位のテキストに関し、前記上位処理単位のテキストにおける前記所定処理単位のテキストの全個数に対する、同一フォント種別の前記所定処理単位のテキストの個数の割合が所定閾値を超えたときに、前記上位処理単位のテキスト内の文字のフォント種別をすべて前記同一フォント種別とすることを特徴とする請求項1から請求項3のうちのいずれか1項記載の画像処理装置。
【発明を実施するための形態】
【0012】
以下、図に基づいて本発明の実施の形態を説明する。
【0014】
図1は、本発明の実施の形態に係る画像処理装置の構成を示すブロック図である。
図1に示す画像処理装置は、画像読取装置1、通信装置2、記憶装置3、および演算処理装置4を備える。
【0015】
画像読取装置1は、テキストを含む原稿から原稿画像を読み取り、原稿画像のラスター画像データを生成する。
【0016】
通信装置2は、図示せぬ外部装置とデータ通信を行い、テキストを含む画像のラスター画像データを受信する。
【0017】
記憶装置3は、不揮発性の記憶装置であって、テキストを含む画像のラスター画像データを記憶する。
【0018】
演算処理装置4は、プログラムを実行するコンピューター、ASIC(Application Specific Integrated Circuit)などを備え、そのコンピューター、ASICなどで各種処理部として動作する。
【0019】
ここでは、演算処理装置4は、文字認識部21、フォント種別特定部22、およびファイル生成部23として動作する。
【0020】
文字認識部21は、既知の方法で、ラスター画像データに基づく画像(ラスター画像)における所定処理単位のテキスト内の文字の文字コードを特定する。
【0021】
フォント種別特定部22は、フォント種別特定処理を実行し、文字コードが特定された上述の文字のフォント種別を特定する。
【0022】
具体的には、フォント種別特定部22は、フォント種別特定処理において、(a)既知の文字比較方法で1文字ずつフォント種別を特定していき、(b)所定処理単位のテキストの全文字数に対する、同一フォント種別の文字の文字数の割合が所定閾値を超えたときに、所定処理単位のテキスト内の文字のフォント種別をすべて、その同一フォント種別とする。したがって、その割合が所定閾値を超えたときまでに上述の既知の文字比較方法でのフォント種別の特定を行っていない文字に対しては、上述の既知の文字比較方法でのフォント種別の特定のための処理を行わずに、フォント種別が特定される。その結果、所定処理単位のテキストのフォント種別特定処理が短時間で終わる。
【0023】
上述の文字比較方法では、例えば、対象文字の文字画像と複数のフォント種別のフォント辞書に登録されている文字画像(対象文字の文字コードに関連付けられている文字画像)とが比較され、両者が一致する確度が最も高いフォント種別が、対象文字のフォント種別であると判定される。
【0024】
図2は、フォント種別特定処理の所定処理単位を説明する図である。この「所定処理単位」は、例えば
図2に示すような単語、行、ブロックなどであり、文字認識部21により文字コードが特定される文字の集合の単位とされる。つまり、文字認識部21は、単語、行、ブロックなどを単位として、その中に含まれる文字の文字コードの集合を生成し、フォント種別特定部22は、その単位となる文字の集合ごとに文字コードを取得し、これにより、所定処理単位のテキストを特定する。
【0025】
例えば、所定処理単位が単語であり、上述の所定閾値が50%であり、所定処理単位のテキストが「This」である場合において、文字「T」、文字「h」、および文字「i」のフォント種別が先頭から順番に既知の文字比較方法で特定され、文字「T」、文字「h」、および文字「i」のフォント種別が、すべて「Arial」であるときには、残りの文字「s」のフォント種別は、既知の文字比較方法で特定されずに、文字「i」のフォント種別が特定されたときに、ただちに、「Arial」とされる。
【0026】
また、実施の形態1では、フォント種別特定部22は、所定処理単位のテキストのすべての文字に対してフォント種別を上述の既知の文字比較方法で特定しても、上述の割合が上述の所定閾値を超えているフォント種別がない場合には、所定処理単位のテキスト内の文字のフォント種別を、上述の割合が最も多いフォント種別とする。
【0027】
例えば、所定処理単位が単語であり、上述の所定閾値が50%であり、所定処理単位のテキストが、「This」である場合において、文字「T」、文字「h」、文字「i」、および文字「s」のフォント種別が先頭から順番に既知の文字比較方法で特定され、文字「T」のフォント種別がゴシックであり、文字「i」のフォント種別が明朝であり、文字「h」および文字「s」のフォント種別が「Arial」であるときには、当該単語「This」のすべての文字のフォント種別は、上述の割合が最も多い(=50%)フォント種別である「Arial」とされる。
【0028】
ファイル生成部23は、所定のファイル形式(例えば、PDFや、特定アプリケーション(例えばマイクロソフト社製品)用に規定されているファイル形式)で、テキストにおける各文字の文字コードおよびフォント種別を含む文書データファイルを生成する。なお、生成された文書データファイルは、記憶装置3に格納されたり、通信装置2で外部の装置へ送信されたりする。
【0029】
次に、実施の形態1に係る画像処理装置の動作について説明する。
図3は、実施の形態1に係る画像処理装置の動作について説明するフローチャートである。
【0030】
文字認識部21における所定処理単位のテキストの文字認識処理の完了後、フォント種別特定部22は、その所定処理単位のテキストに対して、以下のフォント種別特定処理を実行する。
【0031】
フォント種別特定部22は、所定処理単位のテキストにおいて、フォント種別を特定していない文字(文字コード)を1つ選択する(ステップS1)。ここでは、所定処理単位のテキストの先頭の文字から順番に1つの文字が選択される。
【0032】
次に、フォント種別特定部22は、既知の文字比較方法で、選択した文字のフォント種別を特定する(ステップS2)。例えば、その文字比較方法では、フォント種別特定部22は、選択した文字について所定の確度以上であってかつ最大確度のフォント種別を、当該選択した文字のフォント種別として特定し、選択した文字に対して所定の確度以上のフォント種別が発見されなかった場合には、選択した文字のフォント種別を「不定」とする。
【0033】
そして、フォント種別特定部22は、その所定処理単位のテキストにおいて、その所定処理単位のテキストの全文字数に対する、特定されたフォント種別が同一である文字の文字数の割合を特定し、特定した割合が所定閾値を超えているか否かを判定する(ステップS3)。なお、所定処理単位で区切られた各テキストの文字数は、文字認識処理の結果(つまり、各テキストに対応して特定された文字コードの数)に基づいて特定される。また、所定処理単位のテキストの文字数をNとし、所定閾値をTHとすると(0<TH<1)、フォント種別特定部22は、既知の文字比較方法でフォント種別を特定した文字数がN×THを超えるまで、ステップS3およびステップS5の判定をスキップし、連続的に、既知の文字比較方法でフォント種別を特定してもよい。
【0034】
所定処理単位のテキストにおいて現時点までに特定されたフォント種別のいずれかについて上述の割合が所定閾値を超えている場合、フォント種別特定部22は、その所定処理単位のテキストにおける全文字のフォント種別を、上述の割合が所定閾値を超えているそのフォント種別とする(ステップS4)。
【0035】
一方、現時点までに特定されているすべてのフォント種別について、特定した割合が所定閾値を超えていない場合、フォント種別特定部22は、その所定処理単位のテキストにおけるすべての文字のフォント種別を特定したか否かを判定する(ステップS5)。その所定処理単位のテキストにおけるすべての文字のフォント種別を特定していない場合には、フォント種別特定部22は、ステップS1に戻り、フォント種別を特定していない次の文字を選択する。
【0036】
つまり、上述の割合が所定閾値を超えるフォント種別が出現するか(ステップS3)、すべての文字のフォント種別が既知の文字比較方法で特定される(ステップS5)まで、1文字ずつ文字のフォント種別が既知の文字比較方法で特定される。
【0037】
例えば所定閾値が50%であり、
図2における単語「This」が所定処理単位のテキストである場合において、先頭の文字「T」のフォント種別が「Arial」であると特定され、文字「h」,「i」,「s」が未処理であるときには、全文字数が4であり、フォント種別が「Arial」である文字の文字数が1であるため、上述の割合は25%となり、所定閾値を超えていないと判定される。
【0038】
例えば所定閾値が50%であり、
図2における単語「This」が所定処理単位のテキストである場合において、先頭の文字「T」,「h」,「i」のフォント種別が「Arial」であると特定され、文字「s」が未処理であるときには、全文字数が4であり、フォント種別が「Arial」である文字の文字数が3であるため、上述の割合は75%となり、所定閾値を超えていると判定され、既知の文字比較方法でフォント種別を特定されていない文字「s」のフォント種別が「Arial」とされる。
【0039】
なお、ステップS4において、既知の文字比較方法でフォント種別を特定されていない文字のフォント種別が、上述のようにして確定された場合、その文字に対して、既知の文字比較方法でのフォント種別の特定は実行されない。
【0040】
また、所定処理単位のテキストにおいて、すべての文字のフォント種別が既知の文字比較方法で特定された場合(ステップS5)、フォント種別特定部22は、所定処理単位のテキストにおいて特定されたフォント種別のうち、上述の割合が最も多いフォント種別を特定し(ステップS6)、所定処理単位のテキストにおける全文字のフォント種別を、ステップS6で特定したフォント種別とする(ステップS7)。
【0041】
このようにして、所定処理単位のテキストのフォント種別が特定され、文字認識処理の結果において、所定処理単位の複数のテキスト(例えば、複数の単語や複数の行)があれば、その所定処理単位の次のテキストが選択され、上述のようにして同様に処理される。
【0042】
以上のように、上記実施の形態1によれば、文字認識部21は、画像における所定処理単位のテキスト内の文字の文字コードを特定する。フォント種別特定部22は、文字コードが特定された所定処理単位のテキストに対するフォント種別特定処理を実行し、フォント種別特定処理において、(a)1文字ずつフォント種別を特定していき、(b)所定処理単位のテキストの全文字数に対する、同一フォント種別の文字の文字数の割合が所定閾値を超えたときに、所定処理単位のテキスト内の文字のフォント種別をすべて同一フォント種別とする。
【0043】
これにより、既知の文字比較方法でフォント種別を特定すべき文字の数が減るため、画像内の文字のフォント種別が高速に特定される。
【0045】
実施の形態2に係る画像処理装置では、フォント種別特定部22は、所定処理単位が単語である場合において、(a)3文字以上の単語および1文字の単語に対しては上述のフォント種別特定処理(つまり、実施の形態1と同様の処理)を実行し、(b)2文字の単語については、以下に示す処理を実行する。
【0046】
実施の形態2では、2文字の単語については、フォント種別特定部22は、当該2文字の単語の直前の単語のフォント種別と当該2文字の単語の直後の単語のフォント種別とが同一である場合には、当該2文字の単語のフォント種別を、当該2文字の単語の直前および直後の単語のフォント種別と同一とする。
【0047】
例えば、実施の形態2では、2文字の単語については、フォント種別特定部22は、(b1)当該2文字の単語の直前の単語のフォント種別と当該2文字の単語の直後の単語のフォント種別とが同一である場合には、上述のフォント種別特定処理をせずに、当該2文字の単語のフォント種別を、当該2文字の単語の直前および直後の単語のフォント種別と同一とし、(b2)当該2文字の単語の直前の単語のフォント種別と当該2文字の単語の直後の単語のフォント種別とが互いに異なる場合には、当該2文字の単語に対して上述のフォント種別特定処理を実行する。
【0048】
また、例えば、実施の形態2では、ここで、フォント種別特定部22は、2文字の単語について、1文字ずつ既知の文字比較方法でフォント種別を特定し、単語内の2文字に対して同一のフォント種別が特定されなかった場合、当該2文字の単語の直前の単語のフォント種別と当該2文字の単語の直後の単語のフォント種別とが同一であるとき、当該2文字の単語のフォント種別を、当該2文字の単語の直前および直後の単語のフォント種別と同一とし、単語内の2文字に対して同一のフォント種別が特定された場合には、直前および直後の単語のフォント種別に拘わらず、その単語内の2文字のフォント種別を、その特定されたフォント種別とするようにしてもよい。
【0049】
また、実施の形態2において、2文字の単語が連続している場合(例えば
図2における「is」「an」の場合)、それらの2文字の単語の最初の単語(例えば
図2における「is」「an」のうちの「is」)の直前の単語(例えば
図2における「is」「an」の前の「This」)および最後の単語(例えば
図2における「is」「an」のうちの「an」)の直後の単語(例えば
図2における「is」「an」の後の「announcement」)が同一のフォント種別とされた場合には、それらの2文字の単語(例えば
図2における「is」「an」)のフォント種別は、それらの直前および直後の単語(例えば
図2における「This」と「announcement」)のフォント種別と同一とするようにしてもよい。
【0050】
2文字の単語には、be動詞、前置詞など、それ単体で大きな意味を持たない単語が多く、2文字の単語のフォント種別を、直前および直後の単語のフォント種別とは異なるように設定される可能性は低いため、実施の形態2では、上述のような処理が実行される。また、1文字の単語には、冠詞「a」の他、記号として使用されている文字の場合などもあるため、既知の文字比較方法でフォント種別が特定される。
【0051】
なお、実施の形態2に係る画像処理装置のその他の構成および動作については実施の
形態1と同様であるので、その説明を省略する。
【0053】
実施の形態3に係る画像処理装置では、フォント種別特定部22は、所定処理単位に対する上位処理単位のテキストに関し、上位処理単位のテキストにおける所定処理単位のテキストの全個数に対する、同一フォント種別の所定処理単位のテキストの個数の割合が所定閾値を超えたときに、上位処理単位のテキスト内の文字のフォント種別をすべて、その同一フォント種別とする。
【0054】
例えば、実施の形態3では、「所定処理単位」は、単語であり、「上位処理単位」は、行、または、行の集合としてのブロックである。つまり、上位処理単位のテキストは、複数の所定処理単位のテキストで構成されている。
【0055】
図4は、実施の形態3に係る画像処理装置の動作を説明する図である。
【0056】
例えば
図2に示すブロックにおける2つの行がそれぞれ上位処理単位とされ、各行内の単語が所定処理単位とされ、所定閾値が40%とされる場合、
図4に示すように、最初の行では、7つの単語のうち、6つの単語までのフォント種別特定処理が完了した時点で、3つの単語「This」,「announcement」,「next」のフォント種別が「Arial」であると判定されたときには、残りの1つの単語「meeting」の、文字比較方法によるフォント種別特定は実行されず、その単語「meeting」のフォント種別(およびフォント種別が「不定」であった単語「is」,「an」,「of」のフォント種別)が、「Arial」とされる。
【0057】
また、その場合において、
図4に示すように、2つ目の行では、8つの単語のうち、5つの単語までのフォント種別特定処理が完了した時点で、4つの単語「Next」,「meeting」,「will」,「held」のフォント種別が「Arial」であると判定されたときには、残りの3つの単語「on」,「next」,「Tuesday」の、文字比較方法によるフォント種別特定は実行されず、それらの単語「on」,「next」,「Tuesday」のフォント種別(およびフォント種別が「不定」であった単語「be」のフォント種別)が、「Arial」とされる。
【0058】
なお、実施の形態3に係る画像処理装置のその他の構成および動作については実施の形態1または実施の形態2と同様であるので、その説明を省略する。
【0059】
なお、上述の実施の形態に対する様々な変更および修正については、当業者には明らかである。そのような変更および修正は、その主題の趣旨および範囲から離れることなく、かつ、意図された利点を弱めることなく行われてもよい。つまり、そのような変更および修正が請求の範囲に含まれることを意図している。
【0060】
例えば、上記実施の形態1,2,3において、所定処理単位のテキストが、括弧やクオーテーションで囲われた範囲を含んである場合、その範囲を抽出して、独立した所定処理単位として、上述の処理を実行するようにしてもよい。