(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024167017
(43)【公開日】2024-11-29
(54)【発明の名称】データ入力システム
(51)【国際特許分類】
G06Q 50/10 20120101AFI20241122BHJP
G06V 30/12 20220101ALI20241122BHJP
【FI】
G06Q50/10
G06V30/12 C
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2023083533
(22)【出願日】2023-05-19
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り 本願発明に係る「データ入力システム」を公開した情報 1.掲載年月日:令和5年1月5日 掲載アドレス:https://www.hammock.jp/release/230105.html 2.掲載年月日:令和5年1月26日 掲載アドレス:https://www.hammock.jp/release/230126.html
(71)【出願人】
【識別番号】596177043
【氏名又は名称】株式会社 ハンモック
(74)【代理人】
【識別番号】100113804
【弁理士】
【氏名又は名称】岩田 敏
(72)【発明者】
【氏名】若山 大典
(72)【発明者】
【氏名】小林 雄志
(72)【発明者】
【氏名】渡邉 由紀
【テーマコード(参考)】
5B064
5L049
5L050
【Fターム(参考)】
5B064AA01
5B064EA39
5L049CC12
5L050CC12
(57)【要約】 (修正有)
【課題】OCRと人の入力の組み合わせ方法を工夫することで、効率化・人的コスト削減を実現しつつも、限りなく精度の高いデータ化を実現させるデータ入力システムを提供すること。
【解決手段】データ入力システムは、データの記入されたフォームを電子画像フォームとして受け付ける画像受付手段と、受け付けた電子画像フォームに対して、OCRエンジンとデータ入力スタッフとを使い、3つのテキストデータを取得するテキストデータ取得手段と、取得したテキストデータのうち、全て一致する部分については確定し、不一致の部分については、異なるデータ入力スタッフによるテキストデータの取得を繰り返し、3つのテキストデータで一致したものを確定するテキストデータ確定手段と、確定したテキストデータを保存するテキストデータ保存手段と、保存したテキストデータを出力するテキストデータ出力手段と、を備える。
【選択図】
図2
【特許請求の範囲】
【請求項1】
データの記入されたフォームを電子画像フォームとして受け付ける画像受付手段と、
画像受付手段で受け付けた電子画像フォームに対して、OCRエンジンとデータ入力スタッフとを使い、3つのテキストデータを取得するテキストデータ取得手段と、
テキストデータ取得手段で取得したテキストデータのうち、全て一致する部分については確定し、不一致の部分については、異なるデータ入力スタッフによるテキストデータの取得を繰り返し、3つのテキストデータで一致したものを確定するテキストデータ確定手段と、
テキストデータ確定手段で確定したテキストデータを保存するテキストデータ保存手段と、
テキストデータ保存手段で保存したテキストデータを出力するテキストデータ出力手段と、
を備えることを特徴としたデータ入力システム。
【請求項2】
テキストデータ取得手段において、OCRエンジンから2つのテキストデータとデータ入力スタッフから1つのテキストデータ、または、OCRエンジンから1つのテキストデータとデータ入力スタッフから2つのテキストデータ、を取得することを特徴とした請求項1記載のデータ入力システム。
【請求項3】
テキストデータ取得手段において、OCRエンジンを2つ使用してOCRエンジンから2つのテキストデータを取得する場合、2つのOCRエンジンは特性の異なるOCRエンジンであることを特徴とした請求項2記載のデータ入力システム。
【請求項4】
テキストデータ取得手段において、データ入力スタッフから2つのテキストデータを取得する場合、それぞれ異なるデータ入力スタッフによるテキストデータの取得であることを特徴とした請求項2記載のデータ入力システム。
【請求項5】
テキストデータ取得手段において、電子画像フォームを複数のフィールドに分離し、各フィールドごとに異なるデータ入力スタッフによってテキストデータを取得させて、それらを結合させることを特徴とした請求項1から4のいずれかに記載のデータ入力システム。
【発明の詳細な説明】
【技術分野】
【0001】
本願発明は、データの記入されたフォーム(帳票等)を高精度にデータ(テキスト)化するシステムに関するものである。
【背景技術】
【0002】
一般的なデータ入力業務で99.97%の精度でデータ化を行うには、同一帳票に対して2人別々に入力作業を行い、不一致箇所を修正入力する方式とする必要があるとされる(業務1)(参考:https://www.jim.co.jp/service/data-entry/index.html)
【0003】
また、99.97%の精度では不十分な業務については、同一帳票に対し2人別々に入力作業を行った上、第三者が入力結果に誤りがないかを2人の入力結果の一致・不一致を問わず全件確認を行う方式があり、これにより99.997%程度の精度が得られるとされている(業務2)。
【0004】
しかしながら、上記のような高精度のデータ化は、2人以上の人間が入力を行うことで担保されており、この業務をOCRで代替することは困難であった。
一方、本願出願人は、OCRを用いたデータ化の業務(システム)について長年研究・開発を進めている(特許文献1~3等)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2010-073201号公報
【特許文献2】特開2014-194599号公報
【特許文献3】特開2016-126796号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
そこで、本願発明者は、OCRと人の入力の組み合わせ方法を工夫することで、効率化・人的コスト削減を実現しつつも、99.997%のデータ化の精度を実現させることを目標に、鋭意研究・開発を進め、本願発明を完成するに至った。
【課題を解決するための手段】
【0007】
上記目的を達成するために、本願発明の第1の発明は、データの記入されたフォームを電子画像フォームとして受け付ける画像受付手段と、画像受付手段で受け付けた電子画像フォームに対して、OCRエンジンとデータ入力スタッフとを使い、3つのテキストデータを取得するテキストデータ取得手段と、テキストデータ取得手段で取得したテキストデータのうち、全て一致する部分については確定し、不一致の部分については、異なるデータ入力スタッフによるテキストデータの取得を繰り返し、3つのテキストデータで一致したものを確定するテキストデータ確定手段と、テキストデータ確定手段で確定したテキストデータを保存するテキストデータ保存手段と、テキストデータ保存手段で保存したテキストデータを出力するテキストデータ出力手段と、を備えることを特徴としたデータ入力システムである。
本願発明の第2の発明は、テキストデータ取得手段において、OCRエンジンから2つのテキストデータとデータ入力スタッフから1つのテキストデータ、または、OCRエンジンから1つのテキストデータとデータ入力スタッフから2つのテキストデータ、を取得することを特徴とした上記第1の発明に係るデータ入力システムである。
本願発明の第3の発明は、テキストデータ取得手段において、OCRエンジンを2つ使用してOCRエンジンから2つのテキストデータを取得する場合、2つのOCRエンジンは特性の異なるOCRエンジンであることを特徴とした上記第2の発明に係るデータ入力システムである。
本願発明の第4の発明は、テキストデータ取得手段において、データ入力スタッフから2つのテキストデータを取得する場合、それぞれ異なるデータ入力スタッフによるテキストデータの取得であることを特徴とした上記第2の発明に係るデータ入力システムである。
本願発明の第5の発明は、テキストデータ取得手段において、電子画像フォームを複数のフィールドに分離し、各フィールドごとに異なるデータ入力スタッフによってテキストデータを取得させて、それらを結合させることを特徴とした上記第1の発明から第4の発明のいずれかに係るデータ入力システムである。
【発明の効果】
【0008】
本願発明によれば、以下のような効果を有する。
(1)本願発明は、画像受付手段で受け付けた電子画像フォームに対して、OCRエンジンとデータ入力スタッフをともに使い、OCRと人の入力を意図的に組み合わせることで高精度なデータ化(99.997%)を実現できた。
(2)すなわち、電子画像フォームに対しOCRエンジンによる入力結果(テキストデータ取得)とデータ入力スタッフによる入力結果(テキストデータ取得)を計3つ集めて、3つ全ての入力結果が一致するものについては「確定」し、3つの入力結果が異なるもの(不一致のもの)については別のデータ入力スタッフによる入力結果(テキストデータ取得)を集めて、同じ入力結果が3つ集まるまでそれを繰り返し、3つの同じ入力結果が集まって(一致して)初めて「確定」する。
(3)これにより、OCRエンジンのみを複数使用したデータ化の場合よりも高精度で、且つ、人間のみを使用した最高精度のデータ化の場合(上記業務2)よりも圧倒的に効率化を図ることができる。
(4)ここで、テキストデータ(入力結果)を3つ取得する場合、OCRエンジンからの取得とデータ入力スタッフからの取得の組み合わせは、任意である。詳しくは、OCRエンジンからの取得「2つ」とデータ入力スタッフからの取得「1つ」、或いは、OCRエンジンからの取得「1つ」とデータ入力スタッフからの取得「2つ」、そのどちらでも構わない。要は、OCRエンジンのみから取得しないことが重要なのである。
(5)また、OCRエンジンからテキストデータ(入力結果)を「2つ」取得する場合、それぞれ特性の異なるOCRエンジンから取得することが重要である。同じく、データ入力スタッフからテキストデータ(入力結果)を「2つ」取得する場合、異なるデータ入力スタッフから取得することが重要である。同じ特性のOCRエンジン又はデータ入力スタッフであると、同一の入力結果になる傾向が高く、誤認識を招く(発見できない)おそれがあるためである。
(6)電子画像フォームを複数のフィールドに分離(画像分割)し、各フィールドごとに異なるデータ入力スタッフからテキストデータ(入力結果)を取得することで、個人情報や秘密情報としての漏洩を防止して、高いセキュリティが保たれる。
【図面の簡単な説明】
【0009】
【
図1】本願発明のデータ入力システムを説明する説明図(1)。
【
図2】本願発明のデータ入力システムを説明する説明図(1)。
【
図3】本願発明のデータ入力システムを説明する説明図(1)。
【発明を実施するための形態】
【0010】
本願発明の実施形態を図面に基づいて説明する。
図1は、本願発明のデータ入力システムの一例をクラウドサービスとして図示したものである。
図1に図示するように、データの記入されたフォーム(以下「帳票」)のデータ(テキスト)化を希望するユーザーは、当該帳票の「電子画像フォーム」を用意し(紙ベースの帳票であればスキャニング等で電子化)、これをアップロードする。
アップロードされた電子画像フォームをデータ入力システムの画像受付手段で受け付けて、これを高精度にデータ(テキスト)化してテキストデータ保存手段に保存する。
そして、テキストデータ保存手段に保存されたテキストデータは、テキストデータ出力手段によってユーザーへのダウンロードを可能にして、ユーザーはデータ化された帳票を入手できる。
【0011】
図2及び
図3は、本願発明のデータ入力システムによる帳票のデータ(テキスト)化を図示したものである。
まず、
図2では、データ入力システムの「テキストデータ取得手段」及び「テキストデータ確定手段」を図示している。
図2に図示するように、テキストデータ取得手段では、特性の異なる2つのOCRエンジン(第1エンジン及び第2エンジン)とデータ入力スタッフとで、3つのテキストデータを取得する。そして、3つのテキストデータが一致すると、テキストデータ確定手段はそのテキストデータを確定する。上段の場合、第1エンジン「0」、第2エンジン「0」、データ入力スタッフ「0」で、全て一致するので、テキストデータ確定手段はこれを「0」と確定(採用)する。
【0012】
中段の場合、第1エンジン「0」、第2エンジン「6」、データ入力スタッフ「6」で、一致していない。「6」が2つあるが、3つではないため、テキストデータ確定手段は確定(採用)できない。そこで、異なるデータ入力スタッフ(2人目)によるテキストデータの取得を行う。その結果、当該データ入力スタッフ(2人目)が「6」とした場合、第2エンジンの「6」と最初のデータ入力スタッフの「6」と合わせて「6」が3つそろうので、テキストデータ確定手段はこれを「6」と確定(採用)する。
もし、当該データ入力スタッフ(2人目)が「9」とした場合、テキストデータ確定手段は確定(採用)できない。そこで、さらに異なるデータ入力スタッフ(3人目)によるテキストデータの取得を行い、以後、3つのテキストデータが一致するまでこれを繰り返す。
【0013】
下段の場合、第1エンジン「0」、第2エンジン「6」、データ入力スタッフ「9」で、全て異なっている。そのため、テキストデータ確定手段は確定(採用)できない。そこで、異なるデータ入力スタッフ(2人目と3人目)によるテキストデータの取得を行う。3人目のデータ入力スタッフによるテキストデータの取得でも3つそろわない場合には、3つのテキストデータが一致するまでこれを繰り返す。
【0014】
このように、OCRエンジン(機械)とデータ入力スタッフ(人間)とを意図的に組み合わせることで、OCRエンジン(機械)のみでは不可能な高精度と、データ入力スタッフ(人間)のみでは不可能な効率化という両立することの難しい課題を確実に実現できることになる。
【0015】
なお、別の発想として、特性の異なる(開発元の異なる)OCRエンジンを3つ用意し、データ入力スタッフ3人による入力の代わりに3種類のOCRエンジンの結果を用いるという方式も考え得る。
しかし、本願発明のデータ入力システム(主に「テキストデータ取得手段」及び「テキストデータ確定手段」)では、OCRエンジンを3つ使う方式よりも高精度でありつつ、現行の全て人間が行うデータ化業務よりも効率化を実現できることが判明した。
【0016】
その理由は、次のようなものであると思料される。
(1)OCRは、似たような誤りをする。
(2)OCRは、文脈・値の妥当性を考慮しない。
後者については、罫線やノイズなのか、意味のあるデータなのか、OCRでは判断ができない場合があるが、人間は周囲の雰囲気から判断できる。
一方で、人間だけの入力の場合、思い込みや、変換ミスしやすいデータのときは、複数人が同じ誤りをしてしまうことがある。
従って、人とOCRを組み合わせることで、それぞれ(OCRや人間)の短所を補って高精度を実現できた。
【0017】
次に、
図3では、データ入力システムの「テキストデータ取得手段」を
図2とは異なる観点から図示している。
図3に図示するように、データ入力システムの画像受付手段で受け付けてアップロードされた電子画像フォームは、元の帳票をそのまま電子画像化(スキャニング)されたものであるため、そのままでは個人情報や企業秘密などが記載されている可能性があり、情報漏洩の危険性がある(特にデータ入力スタッフによるテキストデータ取得の場合)。
そこで、本願発明者は、電子画像フォームを複数のフィールド(例えば、図示する「申込日」「姓」「名」等)に分離し、各フィールドごとに異なるデータ入力スタッフによってテキストデータを取得させて、取得したテキストデータを結合させることで、電子画像フォームのデータ化に高いセキュリティーを担保した。
【0018】
このような「テキストデータ取得手段」は、これまでデータ入力スタッフが専業で行ってきた帳票のデータ化作業を、クラウドワーカー等にでも行える業務に進化させることにつながる。すなわち、各フィールドごとのデータ化なので、小画面の携帯情報端末(スマートフォンや小型タブレットなど)でも簡単に行え、また、短時間でも行える。従って、データ入力スタッフの確保やコスト面などで有利である。
【0019】
なお、本実施形態では、データ入力システムによる帳票のデータ(テキスト)化について、特性の異なる2つのOCRエンジン(第1エンジン及び第2エンジン)と1人のデータ入力スタッフとの組み合わせ(OCR+OCR+人)で説明してきたが、1つのOCRエンジン(第1エンジン)と2人のデータ入力スタッフとの組み合わせ(OCR+人+人)であってもよい。
【産業上の利用可能性】
【0020】
本願発明は、データの記入されたフォーム(帳票等)を高精度にデータ(テキスト)化するためのデータ入力システムとして、クラウドサービスなどによって幅広く利用できるものである。