IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 理想科学工業株式会社の特許一覧

特開2023-142686テキスト情報認識装置および方法並びにプログラム
<>
  • 特開-テキスト情報認識装置および方法並びにプログラム 図1
  • 特開-テキスト情報認識装置および方法並びにプログラム 図2
  • 特開-テキスト情報認識装置および方法並びにプログラム 図3
  • 特開-テキスト情報認識装置および方法並びにプログラム 図4
  • 特開-テキスト情報認識装置および方法並びにプログラム 図5
  • 特開-テキスト情報認識装置および方法並びにプログラム 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023142686
(43)【公開日】2023-10-05
(54)【発明の名称】テキスト情報認識装置および方法並びにプログラム
(51)【国際特許分類】
   G06V 30/12 20220101AFI20230928BHJP
【FI】
G06V30/12 J
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022049704
(22)【出願日】2022-03-25
(71)【出願人】
【識別番号】000250502
【氏名又は名称】理想科学工業株式会社
(74)【代理人】
【識別番号】100128451
【弁理士】
【氏名又は名称】安田 隆一
(72)【発明者】
【氏名】稲川 博敬
【テーマコード(参考)】
5B064
【Fターム(参考)】
5B064AA01
5B064AB03
5B064EA05
5B064EA11
(57)【要約】
【課題】テキスト情報の誤認識を即座に把握することができるテキスト情報認識装置および方法並びにプログラムを提供する。
【解決手段】テキスト情報を含む原稿を読み取った原稿データを受け付け、その原稿データに含まれるテキスト情報を認識するテキスト情報認識部21と、認識したテキスト情報と、原稿に含まれうる予め設定された正解テキスト情報とを対応づけたテーブルを生成するテーブル生成部22とを備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
テキスト情報を含む原稿を読み取った原稿データを受け付け、該原稿データに含まれるテキスト情報を認識するテキスト情報認識部と、
前記認識したテキスト情報と、前記原稿に含まれうる予め設定された正解テキスト情報とを対応づけたテーブルを生成するテーブル生成部とを備えたテキスト情報認識装置。
【請求項2】
前記テーブルを表示させる表示制御部を備えた請求項1記載のテキスト情報認識装置。
【請求項3】
前記表示制御部が、前記読み取った原稿データと前記テーブルとを同時に表示させる請求項2記載のテキスト情報認識装置。
【請求項4】
前記表示制御部が、前記読み取った原稿データおよび前記テーブルのいずれか一方において特定のテキスト情報が指定された場合、前記特定のテキスト情報が指定されていない他方における前記特定のテキスト情報の部分を識別可能に表示させる請求項3記載のテキスト情報認識装置。
【請求項5】
前記表示制御部が、前記特定のテキスト情報が指定された場合、前記特定のテキスト情報の訂正画面を表示させる請求項4記載のテキスト情報認識装置。
【請求項6】
前記テーブル生成部が、前記テキスト情報の種類または前記原稿の種類を受け付け、該受け付けた前記テキスト情報の種類または前記原稿の種類に応じた前記正解テキスト情報に基づいて、前記テーブルを生成する請求項1から5いずれか1項記載のテキスト情報認識装置。
【請求項7】
テキスト情報を含む原稿を読み取った原稿データを受け付け、
該原稿データに含まれるテキスト情報を認識し、
該認識したテキスト情報と、前記原稿に含まれうる予め設定された正解テキスト情報とを対応づけたテーブルを生成するテキスト情報認識方法。
【請求項8】
テキスト情報を含む原稿を読み取った原稿データを受け付けるステップと、
該原稿データに含まれるテキスト情報を認識するステップと、
該認識したテキスト情報と、前記原稿に含まれうる予め設定された正解テキスト情報とを対応づけたテーブルを生成するステップとをコンピュータに実行させるテキスト情報認識プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、読み取られた原稿データに含まれるテキスト情報を認識するテキスト情報認識装置および方法並びにプログラムに関する。
【背景技術】
【0002】
従来、手書きのテキスト情報を含む原稿を光電的に読み取って原稿データを取得し、その原稿データに含まれるテキスト情報を自動的に認識することが行われている。
【0003】
たとえば百ます計算プリントやひっ算プリントなどに回答が手書きされた答案を読み取って原稿データを取得し、その原稿データに含まれる回答のテキスト情報を自動的に認識することによって、自動採点を行う試みが行われている。
【0004】
しかしながら、手書きのテキスト情報であるため、自動的に認識した場合、誤認識が生じる場合があり、その結果、誤採点となるため、最終的には人によって誤認識の確認を行うことが必要となる。
【0005】
たとえば特許文献1には、手書き文字の認識結果を目視で確認し、誤認識があった場合には、文字種を特定して再認識する方法が提案されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開平9-102012号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、特許文献1では、ユーザが認識結果を目視する際、誤認識された文字をそのまま表示するだけなので、どの文字が誤認識された文字であるのか即座に把握することが難しい場合がある。たとえば特許文献1では、「この商品は8320円です」という手書きのテキスト情報を認識した結果、「3」が「ろ」と誤認識され、「0」(ゼロ)が「o」(オー)と誤認識された場合、「この商品は8ろ2o円です」という誤認識された結果を表示するだけである。したがって、数字、平仮名、アルファベットが混在している中で、誤認識された文字を即座に把握することが難しい。
【0008】
本発明は、上記事情に鑑み、テキスト情報の誤認識を即座に把握することができるテキスト情報認識装置および方法並びにプログラムを提供することを目的とするものである。
【課題を解決するための手段】
【0009】
本発明のテキスト情報認識装置は、テキスト情報を含む原稿を読み取った原稿データを受け付け、その原稿データに含まれるテキスト情報を認識するテキスト情報認識部と、認識したテキスト情報と、原稿に含まれうる予め設定された正解テキスト情報とを対応づけたテーブルを生成するテーブル生成部とを備える。
【発明の効果】
【0010】
本発明のテキスト情報認識装置によれば、認識したテキスト情報と、原稿に含まれうる予め設定された正解テキスト情報とを対応づけたテーブルを生成するようにしたので、テキスト情報の誤認識を即座に把握することができる。
【図面の簡単な説明】
【0011】
図1】本発明のテキスト情報認識装置の一実施形態を用いたテキスト情報認識システムの概略構成を示すブロック図
図2】認識されたテキスト情報と、予め設定された正解テキスト情報とを対応づけたテーブルの一例を示す図
図3】誤認識があった場合のテーブルの一例を示す図
図4】原稿データとテーブルを同時に表示した画面の一例を示す図
図5】訂正画面の一例を示す図
図6】本発明のテキスト情報認識装置の一実施形態を用いたテキスト情報認識システムの処理の流れを説明するためのフローチャート
【発明を実施するための形態】
【0012】
以下、図面を参照して本発明のテキスト情報認識装置の一実施形態を用いたテキスト情報認識システムについて詳細に説明する。図1は、本実施形態のテキスト情報認識システム1の概略構成を示すブロック図である。
【0013】
本実施形態のテキスト情報認識システム1は、図1に示すように、原稿読取装置10と、テキスト情報認識装置20と、表示装置30と、入力装置40とを備える。
【0014】
原稿読取装置10は、テキスト情報を含む原稿を光電的に読み取って原稿データを出力する。原稿としては、文字、数字および記号などのテキスト情報を含む原稿であれば如何なるものでもよいが、たとえば百ます計算プリントやひっ算プリントなどの数字が手書きされた原稿や、英語のテストプリントなど英語が手書きされた原稿や、@を含むメールアドレスのリストが手書きされた原稿などがある。
【0015】
テキスト情報認識装置20は、テキスト情報認識部21と、テーブル生成部22と、表示制御部23とを備える。
【0016】
テキスト情報認識部21は、原稿読取装置10から出力された原稿データを受け付け、その原稿データに含まれるテキスト情報を認識する。テキスト情報とは、上述したように文字、数字および記号などであり、文字は言語に関わらず、全ての言語の文字を含む。テキスト情報認識部21は、たとえばOCR(Optical Character Recognition)技術を用いてテキスト情報を認識するが、テキスト情報の認識方法としては、これに限らず公知な方法を用いることができる。たとえば畳み込みニューラルネットワーク (Convolutional Neural Network)を用いてテキスト情報を認識するようにしてもよい。
【0017】
テーブル生成部22は、テキスト情報認識部21によって認識されたテキスト情報と、予め設定された正解テキスト情報とを対応づけたテーブルを生成する。予め設定された正解テキスト情報とは、原稿読取装置10によって読み取られる原稿に含まれうるテキスト情報である。たとえば原稿が上述した百ます計算プリントやひっ算プリントなどの場合には、正解テキスト情報は、その回答欄に手書きによって書き込まれる0~9までの数字である。また、原稿が、英語のテストプリントである場合には、正解テキスト情報は、a~zまでのアルファベットである。また、原稿が、メールアドレスのリストである場合には、正解テキスト情報は、メールアドレスに含まれる可能性のあるアルファベット、数字および記号などである。
【0018】
テーブル生成部22は、たとえば数字の正解テキスト情報のみ、すなわち1種類の正解テキスト情報のみを記憶するようにしてもよいし、複数種類の正解テキスト情報を記憶するようにしてもよい。
【0019】
テーブル生成部22が、複数種類の正解テキスト情報を記憶する場合には、たとえば文字、数字、または文字、数字および記号の組み合わせなどといった原稿のテキスト情報の種類を受け付け、その受け付けたテキスト情報の種類に応じて、予め設定された正解テキスト情報を選択するようにしてもよい。
【0020】
また、テキスト情報の種類を受け付けるのではなく、百ます計算プリント、ひっ算プリントおよび英語のテストプリントなどといった原稿の種類を受け付け、その原稿の種類に応じて、予め設定された正解テキスト情報を選択するようにしてもよい。なお、この場合、原稿の種類と正解テキスト情報とを対応づけた正解テキスト情報参照テーブルが予め設定されているものとする。
【0021】
上述したようにテキスト情報の種類または原稿の種類を受け付け、これに応じた正解テキスト情報を選択可能とすることによって、原稿のバリエーションを広げることができ、利便性を向上させることができる。
【0022】
次に、テーブル生成部22によって生成されるテーブルについて説明する。図2は、テーブル生成部22によって生成されるテーブルの一例を示す図である。図2に示すテーブルは、正解テキスト情報が0~9の場合のテーブルである。そして、図2に示すテーブルでは、一番上の行に、正解テキスト情報である0~9の数字が、インデックスとして配置されている。そして、0~9の各インデックスの下に、テキスト情報認識部21によって認識されたテキスト情報が一列に配置される。具体的には、テーブル生成部22は、テキスト情報認識部21によって認識された各数字を、その認識情報に基づいて、各数字が属するインデックスの下に配置する。図2は、誤認識がなかった場合のテーブルの一例を示す図である。
【0023】
ここで、テキスト情報認識部21は、上述したように手書きされた文字を認識した場合、その書き方によっては誤認識をする場合がある。すなわち、原稿データでは「2」であっても、テキスト情報認識部21によって認識された結果、「1」と誤認識される場合がある。このように誤認識された場合、テーブル生成部22は、原稿データの「2」の数字の認識情報として「1」を受け付けるので、「1」のインデックスの下に「2」の数字が配置されることになる。図3は、上述したような誤認識があった場合のテーブルの一例を示す図である。このようにテーブルを生成することによって、「1」のインデックスの下に配置された「2」の数字が誤認識された数字であると即座に把握することができる。
【0024】
なお、図2および図3のテーブルは正解テキスト情報が数字であり、0~9をインデックスとして生成したものであるが、正解テキスト情報が英語である場合には、a~zのアルファベットをインデックスとしたテーブルが生成される。
【0025】
表示制御部23は、テーブル生成部22によって生成されたテーブルを表示装置30に表示させる。また、表示制御部23は、テーブル生成部22によって生成されたテーブルと原稿データを同時に表示装置30に表示させる。図4は、テーブル生成部22によって生成されたテーブルと原稿データとを同時に表示した画面の一例を示す図である。図4では、原稿データが百ます計算プリントを読み取った原稿データである場合の例を示している。このようにテーブルを表示させることによって、テーブルを目視することによって即座に誤認識を把握することができる。また、テーブルと原稿データとを同時に表示することによって、これらを比較することができ、原稿データにおける誤認識の箇所を把握することができる。なお、原稿データに含まれるテキスト情報を認識する際、回答欄に記載された数字のみを認識するように予め設定されているものとする。
【0026】
また、図4に示すように原稿データが百ます計算プリントを読み取った原稿データである場合、その採点結果も表示させるようにしてもよい。具体的には、原稿データに含まれる回答欄の数字の認識情報と、予め設定された回答の数字とを照合し、正解の回答については、その数字を丸印で囲むような表示を行ってもよい。
【0027】
また、表示制御部23は、図4に示す原稿データおよびテーブルのいずれか一方において特定のテキスト情報が指定された場合、その特定のテキスト情報が指定されていない他方における特定のテキスト情報の部分を識別可能に表示させる。
【0028】
具体的には、たとえば図4に示すテーブルにおいて、インデックスが「1」の列の中に誤認識された「2」が含まれている場合、ユーザが入力装置40を用いて、誤認識された「2」を指定する。このとき、表示制御部23は、ユーザによって指定された「2」と、その指定された「2」に対応する原稿データおける「2」とを識別可能に表示させる。「2」を識別可能に表示させる方法としては、図4に示すように「2」を囲むような点線の四角の枠を表示させてもよいし、「2」の色をその他の数字の色とは異なるように表示させてもよいし、「2」を点滅表示させてもよく、「2」を識別可能な表示方法であれば、如何なる表示方法でもよい。
【0029】
このように、ユーザによって指定されたテーブルにおける「2」に対応する原稿データおける「2」を識別可能に表示させようにした場合には、誤認識した数字の対応関係を即座に把握することができる。
【0030】
また、上記説明では、テーブルにおいて特定のテキスト情報(「2」)が指定されたときに、原稿データにおいて対応するテキスト情報(「2」)を識別可能に表示する例について説明したが、逆に、原稿データにおいて特定のテキスト情報(「2」)が指定されたときに、テーブルにおいて対応するテキスト情報(「2」)を識別可能に表示するようにしてもよい。
【0031】
なお、表示制御部23は、テキスト情報認識部21による認識情報に基づいて、テーブルにおける特定のテキスト情報と原稿データにおける特定のテキスト情報との対応づけを行う。
【0032】
さらに、表示制御部23は、図4に示す原稿データにおいて、誤認識された「2」が識別可能に表示されている状態において、その誤認識された「2」がクリックやタップなどによって指定された場合に、その誤認識された「2」の識別情報を訂正する訂正画面を表示させる。
【0033】
図5は、その訂正画面の一例を示す図である。図5に示す訂正画面においては、訂正前のテキスト情報の認識情報(「1」)が表示されるとともに、訂正後のテキスト情報の認識情報(「2」)を設定入力可能に表示される。図5に示すように、訂正画面には、0~9の数字を含むテンキーが表示され、ユーザが、テンキーの数字を選択することによって、訂正後の数字の表示欄に、その選択された数字が表示される。
【0034】
そして、図5に示す訂正画面の「終了」ボタンが選択された場合には、訂正後の数字の表示欄に表示された数字の認識情報が、訂正後の数字の認識情報として決定され、原稿データにおける誤認識された数字の認識情報が、訂正後の数字の認識情報に置き換えられる。このように訂正画面を表示させるようにした場合には、誤認識された数字の認識情報を即座に訂正することができる。
【0035】
また、誤認識された数字の訂正方法としては、上述したような訂正画面を用いた訂正に限らず、たとえば図4に示す画面のテーブルにおいて、「1」のインデックスの列に配置された誤認識されている「2」の数字を、「2」のインデックスの列にドラッグアンドドロップすることによって、誤認識されている「2」の数字の認識情報を「1」から「2」に訂正するようにしてもよい。
【0036】
なお、上述したように原稿データの数字の認識情報が訂正された後、その数字の認識情報と百ます計算の正解の数値とが照合されて、百ます計算の自動採点が行われる。
【0037】
テキスト情報認識装置20は、コンピュータから構成されており、CPU(Central Processing Unit)、ROM(Read Only Memory)およびRAM(Random access memory)などの半導体メモリ、ハードディスクなどのストレージ、並びに通信I/Fを備えている。そして、テキスト情報認識装置20の半導体メモリまたはストレージには、テキスト情報認識プログラムがインストールされており、このテキスト情報認識プログラムがCPUによって実行されることにより、テキスト情報認識装置20のテキスト情報認識部21、テーブル生成部22および表示制御部23が機能する。
【0038】
なお、本実施形態においては、テキスト情報認識部21、テーブル生成部22および表示制御部23の機能をテキスト情報認識プログラムにより実現するようにしたが、これに限らず、一部または全部の機能もしくは制御をASIC(Application Specific Integrated Circuit)やFPGA(Field-Programmable Gate Array)、その他の電気回路などのハードウェアによって実現するようにしてもよい。
【0039】
表示装置30は、たとえば液晶ディスプレイなどのディスプレイを有し、上述したように原稿データやテーブル生成部22によって生成されたテーブルなどを表示する。
【0040】
入力装置40は、たとえばキーボートやマウスなどのデバイスを有し、ユーザによる種々の設定入力を受け付ける。
【0041】
また、テキスト情報認識装置20、表示装置30および入力装置40をタブレット端末によって実現するようにしてもよい。さらに、原稿読取装置10も含めたテキスト情報認識システム1をカメラ機能付きのタブレット端末で実現し、カメラ機能によってテキスト情報を含む原稿を読み取るようにしてもよい。
【0042】
次に、本実施形態のテキスト情報認識システム1の処理の流れについて、図6に示すフローチャートを参照しながら説明する。
【0043】
まず、原稿読取装置10において原稿が読み取られ、原稿データが取得される(S10)。原稿読取装置10からテキスト情報認識装置20に原稿データが出力され、テキスト情報認識部21は、入力された原稿データを受け付け、その原稿データに含まれるテキスト情報を認識する(S12)。
【0044】
次いで、テーブル生成部22は、テキスト情報認識部21において認識されたテキスト情報に基づいて、上述したテーブルを生成する(S14)。
【0045】
続いて、表示制御部23は、テーブル生成部22によって生成されたテーブルと原稿データとを表示装置30において同時に表示させる(S16)。
【0046】
そして、ユーザは、表示装置30に表示されたテーブルを目視確認することによって、テキスト情報認識部21において誤認識が生じていないか確認する(S18)。具体的には、各インデックスの下に、そのインデックスとは異なるテキスト情報が含まれているか否かを確認することによって、誤認識が生じていないか確認する。
【0047】
そして、S18において誤認識が生じていることが確認された場合には(S18,YES)、ユーザは、その誤認識されたテキスト情報を指定することによって訂正画面を表示させ、その訂正画面上において正しい認識情報に訂正する(S20)。訂正後の認識情報が、原稿データのテキスト情報に反映される(S22)。誤認識されたテキスト情報が存在しなくなるまで、S18~S22までの処理が繰り返して行われる。
【0048】
そして、S18において誤認識されたテキスト情報が無いことが確認された場合には(S18,NO)、処理を終了する。
【0049】
なお、本発明は、上記実施形態に限定されるものではなく、実施段階でその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。たとえば実施形態に示される全構成要素を適宜組み合わせても良い。このような、発明の趣旨を逸脱しない範囲内において種々の変形や応用が可能であることはもちろんである。
【0050】
本発明のテキスト情報認識装置に関し、さらに以下の付記を開示する。
(付記)
【0051】
本発明のテキスト情報認識装置においては、上記テーブルを表示させる表示制御部を備えることができる。
【0052】
また、本発明のテキスト情報認識装置において、表示制御部は、読み取った原稿データとテーブルとを同時に表示させることができる。
【0053】
また、本発明のテキスト情報認識装置において、表示制御部は、読み取った原稿データおよびテーブルのいずれか一方において特定のテキスト情報が指定された場合、特定のテキスト情報が指定されていない他方における特定のテキスト情報の部分を識別可能に表示させることができる。
【0054】
また、本発明のテキスト情報認識装置において、表示制御部は、特定のテキスト情報が指定された場合、特定のテキスト情報の訂正画面を表示させることができる。
【0055】
また、本発明のテキスト情報認識装置において、テーブル生成部は、テキスト情報の種類または原稿の種類を受け付け、その受け付けたテキスト情報の種類または原稿の種類に応じた正解テキスト情報に基づいて、上記テーブルを生成することができる。
【0056】
本発明のテキスト情報認識方法は、テキスト情報を含む原稿を読み取った原稿データを受け付け、その原稿データに含まれるテキスト情報を認識し、その認識したテキスト情報と、原稿に含まれうる予め設定された正解テキスト情報とを対応づけたテーブルを生成する。
【0057】
本発明のテキスト情報認識プログラムは、テキスト情報を含む原稿を読み取った原稿データを受け付けるステップと、その原稿データに含まれるテキスト情報を認識するステップと、その認識したテキスト情報と、原稿に含まれうる予め設定された正解テキスト情報とを対応づけたテーブルを生成するステップとをコンピュータに実行させる。
【符号の説明】
【0058】
1 テキスト情報認識システム
10 原稿読取装置
20 テキスト情報認識装置
21 テキスト情報認識部
22 テーブル生成部
23 表示制御部
30 表示装置
40 入力装置
図1
図2
図3
図4
図5
図6