(58)【調査した分野】(Int.Cl.,DB名)
前記認識調整部は、前記入力された値を取得する際に、前記認識調整部によるユーザ認証にて認証された操作者を示す情報に対応付けて前記調整履歴記憶部が記憶する情報に基づく情報を、提示する、請求項2に記載の文字認識装置。
前記認識調整部が提示する情報は、前記認識調整部によるユーザ認証にて認証された操作者による前記複数のパラメータ各々についての値の入力回数と、前記認識調整部によるユーザ認証にて認証された操作者による前記複数のパラメータ各々についての値を入力したときの認識率の変化を表す情報とのいずれかを含む、請求項3に記載の文字認識装置。
前記認識調整部によるユーザ認証にて認証された操作者による前記複数のパラメータ各々についての値を入力したときの認識率の変化を表す情報は、前記入力された値を適用する前における所定の画像群のうち文字の認識に成功した画像の数である適用前成功数および前記入力された値を適用した後における前記所定の画像群のうち文字の認識に成功した画像の数である適用後成功数と、前記適用前成功数と前記適用後成功数との差と、前記入力された値を適用する前における所定の画像群のうち文字の認識に失敗した画像の数である適用前失敗数および前記入力された値を適用した後における前記所定の画像群のうち文字の認識に失敗した画像の数である適用後失敗数と、前記適用前失敗数と前記適用後失敗数との差とのうち、いずれかを含む、請求項4に記載の文字認識装置。
前記認識調整部は、前記認識調整部によるユーザ認証にて認証された操作者を示す情報に対応付けて前記調整履歴記憶部が記憶する、前記パラメータの設定に関する習熟度を表す情報を参照して、値の設定が可能なパラメータを選択する、請求項2に記載の文字認識装置。
前記認識調整部は、前記入力された値を取得する際に、前記認識調整部によるユーザ認証にて認証された操作者を示す情報に対応付けて前記調整履歴記憶部が記憶する情報に基づく情報に加えて、前記認識調整部によるユーザ認証にて認証された操作者以外の操作者に対応付けて前記調整履歴記憶部が記憶する情報に基づく情報を、提示する請求項3に記載の文字認識装置。
【発明を実施するための形態】
【0007】
以下、実施形態の文字認識装置、区分機、およびプログラムを、図面を参照して説明する。
【0008】
図1は、実施形態の配達物用の区分機の全体構成の概略を示すブロック図である。配達物は、郵便局が扱う葉書、封書などの郵便物、小包、民間物流会社が扱うメール便、宅配物などのいずれであってもよい。区分機100は、供給部10、スキャナ部20、搬送部30、区分部40、文字認識装置50、ビデオコーディング部60、制御部70を含む。供給部10は、配達物Dを、ひとつずつスキャナ部20に供給する。スキャナ部20は、供給された配達物Dをスキャナにより撮影し、撮影画像を文字認識装置50に送信する。搬送部30は、スキャナ部20にて撮影された配達物Dを、区分部40のうち、制御部70から指定された区分の区分箱に搬送する。区分部40は、配達物Dの配達先に応じた区分毎の区分箱である。
【0009】
文字認識装置50は、スキャナ部20から入力された画像に対して文字認識を行い、認識した文字列を表す文字コード列を、宛先の住所として制御部70に入力する。文字認識装置50は、文字認識に失敗(リジェクト)したときは、スキャナ部20から入力された画像を、ビデオコーディング部60に入力する。ビデオコーディング部60は、文字認識装置50から入力された画像、すなわち配達物Dの撮影画像を表示する。ビデオコーディング部60のオペレータが、表示された撮影画像から宛先の住所を読み取ってビデオコーディング部60に入力すると、ビデオコーディング部60は、入力された宛先の住所を制御部70に入力する。制御部70は、文字認識装置50、またはビデオコーディング部60から入力された宛先の住所から、その配達物の区分を判定する。制御部70は、配達物Dの区分として、判定結果の区分を制御部70に指定する。
【0010】
なお、ビデオコーディング部60は、オペレータが、文字認識の途中結果を参照しながら、正解教示のみならずリジェクト原因などの追加情報を入力できるようにしてもよい。そのために、文字認識装置50は、文字認識の途中結果などの情報も、ビデオコーディング部60に入力するようにしてもよい。また、ビデオコーディング部60は、追加情報を文字認識装置50に入力するようにしてもよい。
【0011】
なお、追加情報としては、例えば現在表示されている画像に関する文字認識失敗(リジェクト)の原因の種別などが考えられる。例えば認識途中結果のうち、「田中町」と書かれた部分を誤って「日中町」と文字認識が誤っている部分が確認できた場合、オペレータは認識失敗原因として「文字認識」、さらに「田」を「日」と誤認識した、等の情報を入力することが可能である。また、認識失敗原因の種別はオペレータによる正解教示結果をもとに文字認識装置50が判断するようにしてもよい。
【0012】
図2は、文字認識装置50の構成を示す概略ブロック図である。文字認識装置50は、画像取得部501、画像蓄積部502、認識辞書記憶部503、文字認識部504、文字出力部505、画像出力部506、認識調整部507、表示部508、オペレータ入力部509、調整履歴管理部510、調整履歴記憶部511、結果ログ記憶部512を含む。画像取得部501は、スキャナ部20から入力された撮影画像を取得する。画像蓄積部502は、画像取得部501が取得した撮影画像を蓄積する。なお、画像蓄積部502は、画像取得部501が取得した撮影画像のうち、文字認識に失敗したものなど、所定の条件を満たすものだけを記憶するようにしてもよい。
【0013】
認識辞書記憶部503は、単語を構成する文字コード列からなる辞書を記憶する。この辞書は、文字認識を行う際に利用される。文字認識部504は、画像取得部501が取得した撮影画像に対して、文字認識を行い、認識した文字列を表す文字コード列を文字出力部505に入力する。文字認識部504は、画像取得部501が取得した撮影画像に対する文字認識に失敗したときは、画像出力部506に、その撮影画像を入力する。また、文字認識部504は、画像取得部501が取得した撮影画像各々に対する文字認識に成功したか否かなどを示す結果ログを、結果ログ記憶部512に記憶させる。なお、文字認識部504は、認識調整部507により設定された、文字認識を行う際のパラメータの値を記憶している。また、認識調整部507は、認識調整部507から指示されると、画像蓄積部502から画像を読み出して、文字認識を行う。認識調整部507は、このときの文字認識結果については、文字出力部505に入力しない。
【0014】
文字出力部505は、文字認識部504から入力された文字コード列を、宛先の住所として制御部70に入力する。画像出力部506は、入力された画像を、ビデオコーディング部60に入力する。認識調整部507は、例えば、IDと、パスワードなどで、操作者のユーザ認証を行い、ユーザ認証した操作者について、文字認識部504に設定可能なパラメータのリストと、それらの推奨順位を示すリスト画面を表示部508に表示させる。認識調整部507は、このリスト画面を表示させる際に、調整履歴記憶部511が記憶する情報のうち、ユーザ認証された操作者を示すオペレータIDに対応付けられた、各パラメータに関する習熟度を表す情報を参照する。
【0015】
操作者が、オペレータ入力部509を用いて、設定するパラメータの選択と、その値の指定とを行うと、認識調整部507は、その値を適用する前と、後とでの認識率の変化を表す情報を生成し、表示部508に表示させる。表示部508が表示した認識率の変化を表す情報を見た操作者が、オペレータ入力部509を用いて、その値の適用を指示すると、認識調整部507は、その値を文字認識部504に設定する。なお、認識率の変化を表す情報は、画像蓄積部502が記憶する画像に対する文字認識を行った結果から算出される。認識率の変化を表す情報の算出方法については、後述する。
【0016】
表示部508は、液晶ディスプレイ、有機ELディスプレイなどの表示デバイスを備え、認識調整部507の指示に従い、画像および文字を表示する。オペレータ入力部509は、マウス、キーボード、タッチパネルなどの入力デバイスを備え、操作者の入力操作を検出する。調整履歴管理部510は、認識調整部507が文字認識部504にパラメータを設定すると、設定を行った操作者のオペレータIDと、そのパラメータを示す情報とに対応付けられた、習熟度を表す情報とを更新する。
【0017】
調整履歴記憶部511は、操作者のオペレータIDと、文字認識のパラメータを示す情報と、習熟度を表す情報を対応付けて記憶する。習熟度を表す情報は、その操作者の、そのパラメータの設定に関する習熟度を示す情報であり、例えば、そのパラメータの調整回数(入力回数)、調整したことによる認識率の変化を表す情報である。結果ログ記憶部512は、画像取得部501が取得した撮影画像に対する文字認識部504の処理結果を表す結果ログを記憶する。
【0018】
図3は、調整履歴記憶部511の記憶内容例を示すテーブルである。
図3に示すように、調整履歴記憶部511は、操作者のオペレータIDと、文字認識のパラメータを示す情報と、調整回数と、累計改善数と、改善数と、改悪数とを対応付けて記憶する。これらのうち、累計改善数と、改善数と、改悪数とが、認識成績を表す情報である。なお、調整回数は、対応付けて記憶しているオペレータIDの操作者が、対応付けて記憶しているパラメータを調整した回数である。
【0019】
改善数は、パラメータの調整前は文字認識に失敗していた画像のうち、パラメータの調整後は文字認識に成功するようになった画像の数である。本実施形態では、対応付けて記憶しているオペレータIDの操作者が、対応付けて記憶しているパラメータを調整した各回における改善数の和を調整履歴記憶部511は記憶している。改悪数は、逆に、パラメータの調整前は文字認識に成功していた画像のうち、パラメータの調整後は文字認識に失敗するようになった画像の数である。累計改善数は、改善数から改悪数を引いた値である。言い換えると、累計改善数は、パラメータの調整後における文字認識に成功する画像の数から、パラメータの調整前における文字認識に成功する画像の数を引いた値である。
【0020】
図3に示す例では、調整履歴記憶部511は、オペレータID「123456」と、パラメータ「二値化閾値」と、調整回数「5」と、累計改善数「5」と、改善数「7」と、改悪数「2」とを対応付けて記憶している。同様に、調整履歴記憶部511は、オペレータID「123456」と、パラメータ「使用候補順位」と、調整回数「0」と、累計改善数「−」(なしを意味する)と、改善数「−」と、改悪数「−」とを対応付けて記憶している。調整履歴記憶部511は、オペレータID「135488」と、パラメータ「読み取り範囲」と、調整回数「112」と、累計改善数「23」と、改善数「38」と、改悪数「15」とを対応付けて記憶している。
【0021】
図4は、認識調整部507が表示させるリスト画面の例D1を示す図である。リスト画面D1には、ユーザ認証されたユーザのオペレータID「123456」と、パラメータ毎に、習熟度を表す情報と、パラメータの推奨順位とが含まれる。パラメータとしては、「1」番の「二値化閾値」と、「2」番の「使用候補順位」と、「3」番の「読み取り範囲」とが示されている。パラメータ毎の習熟度を表す情報は、例えば、「1」番のパラメータ「二値化閾値」であれば、「過去調整回数:5」と、「調整時認識累計改善数:5件(改善7件/改悪2件)」とが表示されている。これらの習熟度を表す情報は、調整履歴記憶部511から読み出された情報である。
【0022】
また、パラメータの推奨順位は、推奨順位「1」として、「3」番のパラメータ「読み取り範囲」が示され、推奨順位「2」として、「1」番のパラメータ「二値化閾値」が示されている。「2」番のパラメータ「使用候補順位」は、過去に調整されたことがないため、推奨されていない。操作者が、入力領域A1に、調整するパラメータの番号を入力すると、認識調整部507は、その値を入力するパラメータ値入力画面を表示させる。パラメータ値入力画面については後述する。なお、認識調整部507は、例えば、以下のようにして推奨順位を決定する。
【0023】
認識調整部507は、まず、その操作者のオペレータIDと対応付けて調整履歴記憶部511が記憶している調整回数のうち、予め決められた閾値(例えば「5」)以上のものを選択する。認識調整部507は、選択した調整回数と調整履歴記憶部511が対応付けて記憶している累計改善数を、調整回数で割った値が大きい順を、対応付けられたパラメータの推奨順位とする。
【0024】
リスト画面D1の場合は、「2」番の「使用候補順位」は、調整回数が閾値「5」以上ではないため、推奨順位が付けられていない。調整回数が閾値「5」以上である「1」番の「二値化閾値」と、「3」番の「読み取り範囲」とは、それぞれ、累計改善数を調整回数で割った値が、「1.0」、「1.06・・・」であり、「3」番の「読み取り範囲」の方が大きい。このため、「3」番の「読み取り範囲」が推奨順位1位であり、「1」番の「二値化閾値」が推奨順位2位となっている。
【0025】
図5は、パラメータ値入力画面の例D2を示す図である。パラメータ値入力画面D2は、
図4のリスト画面D1で、「1」番の「二値化閾値」が入力されたときに、表示される画面の例である。パラメータ値入力画面D2では、パラメータ「二値化閾値」に関する習熟度を表す情報の下に、パラメータ「二値化閾値」の現状値「128」が表示されている。さらに、その下に、パラメータ「二値化閾値」の値を入力する入力領域A2が表示されている。操作者が、この入力領域A2に値を入力すると、認識調整部507は、認識率の変化を表す情報を生成して、表示させる。
【0026】
図6は、パラメータ値入力画面の例D3を示す図である。
図6のパラメータ値入力画面D3は、
図5のパラメータ値入力画面D2において、入力領域A2に調整値として「63」が入力された場合の例である。認識調整部507は、パラメータ「二値化閾値」が現状値「128」のときと、調整値「63」のときについて、画像蓄積部502が記憶する画像群に対して、文字認識部504に文字認識を行わせる。
【0027】
認識調整部507は、画像蓄積部502が記憶する画像群の画像数を、「総画像件数 156」として表示させる。また、認識調整部507は、その画像群の画像について、現状値「128」で文字認識したときに失敗した画像数を、「パラメータ変更前NG件数 28」として表示させる。同様に、認識調整部507は、調整値「63」で文字認識したときに失敗した画像数を、「パラメータ変更後NG件数 20」として表示させる。なお、失敗数ではなく成功数を表示してもよい。認識調整部507は、現状値「128」で失敗した画像数から、調整値「63」で失敗した画像数が、どれだけ減ったかを表す「累計改善数 8」を表示させる。また、認識調整部507は、現状値「128」で成功した画像数から、調整値「63」で成功した画像数が、どれだけ増えたかを表示させてもよい。
【0028】
パラメータ値入力画面D3の末尾には、パラメータ「二値化閾値」を調整値(ここでは「63」)に決定するかどうかの指定の入力を促す文字列A3「YorN」が表示される。ここで「Y」が選択されると、調整履歴管理部510は、調整履歴記憶部511の、操作者のオペレータIDと、パラメータ「二値化閾値」とに対応付けられた調整回数、累計改善数、改善数、改悪数を更新する。
【0029】
図7は、パラメータ値入力画面の例D4を示す図である。
図7のパラメータ値入力画面D4は、
図6のパラメータ値入力画面D3で「Y」が入力され、調整履歴が更新された際の画面である。パラメータ値入力画面D4では、調整を継続するか終了するかの指定を入力する領域A4が表示される。調整の継続が指示されたときは、リスト画面D1に戻り、終了が指示された場合は終了画面が表示される。
【0030】
図8は、リスト画面の変形例D1aを示す図である。本実施形態において、認識調整部507は、調整するパラメータの推奨順位をリスト画面D1にて表示させているが、所定の条件を満たすパラメータを、値の設定が可能なパラメータとして選択し、選択されなかったパラメータを操作者が選択できないようにしてもよい。
図8のリスト画面D1aは、パラメータのうち、調整回数が所定の閾値(ここでは、「5」)未満のパラメータについて、選択できないようにされている例である。リスト画面D1aでは、「2」番の「使用候補順位」に関する表示に網掛けがされており、入力領域A1に「2」が入力できないことを示している。
【0031】
図9は、リスト画面の変形例D1bを示す図である。本実施形態において、認識調整部507は、リスト画面にユーザ認証した操作者による調整の情報のみを表示させているが、その他の操作者に関する情報を表示させてもよい。
図9のリスト画面D1bは、その他の操作者に関する情報として、認識調整部507が、各パラメータにおける累計改善数の全操作者の平均値である全体平均を表示させている例である。なお、他の操作者に関する情報として、例えば、全操作者の中で最も良い値や、全操作者の中でのユーザ認証された操作者の順位、ユーザ認証された操作者が選択した操作者の習熟度を表す情報などを、認識調整部507が表示させるようにしてもよい。
【0032】
また、文字認識装置50は、インターネットなどのネットワークを介して、スキャナ部20、制御部70などと接続されていてもよい。さらに、複数のスキャナ部20、制御部70と接続されてもよい。
図10は、そのような区分処理システム100aの構成を示す概略ブロック図である。区分処理システム100aは、複数の区分処理部200、複数の制御部70、文字認識装置50、ビデオコーディング部60を含む。区分処理部200は、供給部10、スキャナ部20、搬送部30、区分部40を含む。文字認識装置50は、ネットワークを介して、複数の区分処理部200、複数の制御部70、ビデオコーディング部60と接続されている。
【0033】
また、上述の実施形態では、認識率の変化を表す情報や、認識成績を表す情報に、文字認識に失敗した画像数や、成功した画像数を用いているが、文字認識の失敗率や、成功率を用いるようにしてもよい。
【0034】
このように、調整履歴記憶部511は、複数のパラメータのうちのいずれかを示す情報と、操作者によるパラメータの設定に関する習熟度を表す情報とを対応付けて記憶する。また、調整履歴管理部510は、入力された値を文字認識部504に設定すると、入力された値のパラメータを示す情報と対応付けて調整履歴記憶部511が記憶する習熟度を表す情報を、更新する。
これにより、認識調整部507は、調整履歴記憶部511が記憶する習熟度を表す情報を用いて、操作者がパラメータの値を入力する際の操作画面などを生成できる。したがって、操作者自身の習熟度に応じた文字認識の調整を操作者はすることができる。
【0035】
さらに、認識調整部507は、操作者に対して、ユーザ認証を行う。調整履歴管理部510は、調整履歴記憶部511が記憶する習熟度を表す情報を更新する際に、ユーザ認証にて認証されたオペレータIDと対応付けられたものを更新する。
【0036】
これにより、認識調整部507は、操作者がパラメータの値を入力する際の操作画面などを、そのとき操作している操作者のオペレータIDに対応付けられた習熟度を表す情報を用いて、生成することができる。したがって、操作者自身の習熟度に応じた文字認識の調整を操作者はすることができる。
【0037】
さらに、認識調整部507は、パラメータの値を取得する際に、ユーザ認証にて認証されたオペレータIDに対応付けて調整履歴記憶部511が記憶する情報に基づく情報を、提示する。
これにより、認識調整部507は、習熟度の高いパラメータの設定を操作者に促すなどすることができ、操作者自身の習熟度に応じた文字認識の調整を操作者はすることができる。
【0038】
さらに、認識調整部507が提示する情報は、複数のパラメータ各々について調整回数と、認識率の変化を表す情報とのいずれかを含む。
これにより、操作者は、自身がどのパラメータの設定に習熟しているかを判断できる。
【0039】
さらに、認識調整部507は、入力された値の適用前の成功数および適用後の成功数と、適用前の成功数と適用後の成功数との差と、適用前の失敗数および適用後の失敗数と、適用前の失敗数と適用後の失敗数との差とのうち、いずれかを含む。
これにより、操作者は、自身がどのパラメータの設定に習熟しているかを判断できる。
【0040】
さらに、画像取得部501が取得した画像を記憶する画像蓄積部502を備え、適用前の成功数、適用後の成功数、適用前の失敗数、適用後の失敗数は、画像蓄積部502が記憶する画像に対する文字認識の結果である。
これにより、実際に文字認識を行う画像に対する認識率の変化を算出することができる。
【0041】
さらに、認識調整部507は、パラメータの設定に関する習熟度を表す情報を参照して、値の設定が可能なパラメータを選択する。
これにより、操作者が習熟していないパラメータの設定を、その操作者に行わせないようにすることができる。
【0042】
さらに、認識調整部507は、他の操作者のオペレータIDに対応付けて調整履歴記憶部511が記憶する情報に基づく情報を、提示する。
これにより、操作者は自分の成績が相対的にどのようなものであるかを把握することができ、より適切な調整方法や調整パラメータを選択することができる。また、より良い調整結果を残すようにモチベーションを上げる効果も期待される。
【0043】
以上説明した少なくともひとつの実施形態によれば、文字認識に関する複数のパラメータのうちのいずれかを示す情報と、操作者によるパラメータの設定に関する習熟度を表す情報とを対応付けて記憶する調整履歴記憶部511を持つことにより、操作者自身の習熟度に応じた文字認識の調整を操作者はすることができる。
【0044】
また、
図1における文字認識装置50の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより文字認識装置50を実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
【0045】
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
【0046】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。