(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023157274
(43)【公開日】2023-10-26
(54)【発明の名称】機械学習データ収集システム、機械学習データ収集方法、およびプログラム
(51)【国際特許分類】
G06V 30/194 20220101AFI20231019BHJP
【FI】
G06V30/194
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2022067074
(22)【出願日】2022-04-14
(71)【出願人】
【識別番号】000003193
【氏名又は名称】TOPPANホールディングス株式会社
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100139686
【弁理士】
【氏名又は名称】鈴木 史朗
(74)【代理人】
【識別番号】100169764
【弁理士】
【氏名又は名称】清水 雄一郎
(74)【代理人】
【識別番号】100147267
【弁理士】
【氏名又は名称】大槻 真紀子
(72)【発明者】
【氏名】高瀬 紘一
【テーマコード(参考)】
5B064
【Fターム(参考)】
5B064AB03
5B064DA27
(57)【要約】 (修正有)
【課題】手書き情報の学習データを生成する際にかかる、個人の負担を軽減する機械学習データ収集システム、機械学習データ収集方法及びプログラムを提供する。
【解決手段】機械学習データ収集システムにおいて、サービス提供サーバは、ユーザの学習又は娯楽のための課題に対するデータ化された手書きの回答を取得する回答取得部12と、回答に対して、課題への回答としての評価を付す回答評価部13と、を有する。機械学習データ収集サーバ20は、回答に基づき機械学習データを生成して登録するデータ登録部23と、を備える。
【選択図】
図2
【特許請求の範囲】
【請求項1】
ユーザの学習または娯楽のための課題への回答であって、データ化された手書きの回答を取得する回答取得部と、
前記回答に対して、前記課題への回答としての評価を付す回答評価部と、
前記回答に基づき機械学習データを生成して登録するデータ登録部と
を備える機械学習データ収集システム。
【請求項2】
前記回答が正答であることの尤度を、前記課題、前記課題への正答または前記評価を用いて算出する尤度算出部を備え、
前記データ登録部は、前記回答の中から前記尤度に基づき抽出されたものに基づき、前記機械学習データを生成する、
請求項1に記載の機械学習データ収集システム。
【請求項3】
前記手書きの回答は、文字、描画画像、または、画像への着色である、請求項1に記載の機械学習データ収集システム。
【請求項4】
前記課題を、生成すべき機械学習データに基づき生成し、前記回答を作成するユーザに通知する課題生成部を備える、請求項1に記載の機械学習データ収集システム。
【請求項5】
機械学習データ収集方法であって、
ユーザの学習または娯楽のための課題への回答であって、データ化された手書きの回答を取得するステップと、
前記回答に対して、前記課題への回答としての評価を付すステップと、
前記回答に基づき機械学習データを生成して登録するステップと
を有する機械学習データ収集方法。
【請求項6】
コンピュータを、
ユーザの学習または娯楽のための課題への回答であって、データ化された手書きの回答を取得する回答取得部、
前記回答に対して、前記課題への回答としての評価を付す回答評価部、
前記回答に基づき機械学習データを生成して登録するデータ登録部
として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械学習データ収集システム、機械学習データ収集方法、およびプログラムに関する。
【背景技術】
【0002】
ニューラルネットワークなどによる機械学習では、個人が生成した大量の学習データを必要とすることがある。例えば、手書き文字の文字認識のための機械学習では、多数の筆記者から入手した手書き文字データで学習すると、癖のある文字の認識精度が低くなってしまうことがある。そのため、特許文献1の文字認識方法では、筆記者を個人に限定し、個人用認識部を設けることで認識率を向上させている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、個人が生成した大量の学習データを用いる場合においては、学習データを大量に生成する個人に負担がかかってしまうことがあるという問題がある。
【0005】
本発明は、このような事情に鑑みてなされたもので、学習データを生成する際にかかる個人の負担を軽減することができる機械学習データ収集システム、機械学習データ収集方法、およびプログラムを提供する。
【課題を解決するための手段】
【0006】
この発明は上述した課題を解決するためになされたもので、本発明の一態様は、ユーザの学習または娯楽のための課題への回答であって、データ化された手書きの回答を取得する回答取得部と、前記回答に対して、前記課題への回答としての評価を付す回答評価部と、前記回答に基づき機械学習データを生成して登録するデータ登録部とを備える機械学習データ収集システムである。
【0007】
また、本発明の他の一態様は、上述した機械学習データ収集システムであって、前記回答が正答であることの尤度を、前記課題、前記課題への正答または前記評価を用いて算出する尤度算出部を備え、前記データ登録部は、前記回答の中から前記尤度に基づき抽出されたものに基づき、前記機械学習データを生成する。
【0008】
また、本発明の他の一態様は、上述した機械学習データ収集システムであって、前記手書きの回答は、文字、描画画像、または、画像への着色である。
【0009】
また、本発明の他の一態様は、上述した機械学習データ収集システムであって、前記課題を、生成すべき機械学習データに基づき生成し、前記回答を作成するユーザに通知する課題生成部を備える。
【0010】
また、本発明の他の一態様は、機械学習データ収集方法であって、ユーザの学習または娯楽のための課題への回答であって、データ化された手書きの回答を取得するステップと、前記回答に対して、前記課題への回答としての評価を付すステップと、前記回答に基づき機械学習データを生成して登録するステップとを有する。
【0011】
また、本発明の他の一態様は、コンピュータを、ユーザの学習または娯楽のための課題への回答であって、データ化された手書きの回答を取得する回答取得部、前記回答に対して、前記課題への回答としての評価を付す回答評価部、前記回答に基づき機械学習データを生成して登録するデータ登録部として機能させるためのプログラムである。
【発明の効果】
【0012】
この発明によれば、機械学習データを生成する際にかかる個人の負担を軽減することができる。
【図面の簡単な説明】
【0013】
【
図1】この発明の一実施形態による機械学習データ収集システム100の構成を示す概略ブロック図である。
【
図2】同実施形態におけるサービス提供サーバ10、機械学習データ収集サーバ20の機能構成を示す概略ブロック図である。
【
図3】同実施形態における機械学習用データベース30が記憶する機械学習データの第1の例を示す表である。
【
図4】実施形態における機械学習用データベース30が記憶する機械学習データの第2の例を示す表である。
【
図5】実施形態における機械学習用データベース30が記憶する機械学習データの第3の例を示す表である。
【
図6】同実施形態における機械学習データ収集システム100の動作を説明するシーケンス図である。
【発明を実施するための形態】
【0014】
以下、図面を参照して、本発明の実施の形態について説明する。
図1は、この発明の一実施形態による機械学習データ収集システム100の構成を示す概略ブロック図である。機械学習データ収集システム100は、サービス提供サーバ10、機械学習データ収集サーバ20、機械学習用データベース30を備える。サービス提供サーバ10、機械学習データ収集サーバ20、および機械学習用データベース30は、コンピュータがアプリケーションを実行することで実現される。
【0015】
なお、一台または複数台のコンピュータで、サービス提供サーバ10、機械学習データ収集サーバ20、および機械学習用データベース30のうちの1つまたは複数を実現してもよい。また、1つまたは複数のアプリケーションで、サービス提供サーバ10、機械学習データ収集サーバ20、および機械学習用データベース30のうちの1つまたは複数を実現してもよい。ユーザ端末40は、スマートフォン、タブレット端末、パーソナルコンピュータなどのコンピュータであり、汎用のウェブブラウザなどを実行することで実現してもよいし、専用のアプリケーションを実行することで実現してもよい。
【0016】
サービス提供サーバ10は、複数のユーザ端末40および機械学習データ収集サーバ20とネットワーク50を介して通信可能に接続されている。サービス提供サーバ10は、ユーザ端末40に、ユーザ端末40のユーザの学習あるいは娯楽のための課題を提示させ、該課題へのユーザの回答であって、データ化された手書きの回答をユーザ端末40から取得する。
【0017】
学習あるいは娯楽のための課題は、例えば、漢字などの文字や単語の書き取り、漢字の読み書き、穴埋め文章問題、クロスワードパズル、クイズ、ナンパ―プレースなど、文字で回答するものがある。また、その他にも、デッサン、模写など、描画画像で回答するもの、塗り絵など、画像への着色で回答するものがある。
【0018】
機械学習データ収集サーバ20は、サービス提供サーバ10とネットワーク50を介して通信可能に接続されている。機械学習データ収集サーバ20は、サービス提供サーバ10から回答を取得し、該回答に基づき機械学習データを生成して、機械学習用データベース30に登録する。なお、機械学習データ収集サーバ20は、機械学習データの生成に必要な課題もしくは課題の正答も、上述の回答とともにサービス提供サーバ10から取得してもよい。
【0019】
機械学習用データベース30は、機械学習データ収集サーバ20により登録された機械学習データを記憶する。機械学習用データベース30は、機械学習データ収集サーバ20と直接接続されていてもよいし、ネットワーク50などを介して接続されていてもよい。機械学習用データベース30は、記憶している機械学習データを、機械学習を行うためのデータとして提供する。
【0020】
図2は、本実施形態におけるサービス提供サーバ10、機械学習データ収集サーバ20の機能構成を示す概略ブロック図である。
図2に示すようにサービス提供サーバ10は、課題提示部11、回答取得部12、回答評価部13を備える。課題提示部11(課題生成部)は、課題をユーザ端末40に通知して提示させる。なお、課題は、データ取得部21からの要求に基づくものであってもよい。例えば、データ取得部21が、収集済みの機械学習データの網羅性や、収集済みの機械学習データを用いた機械学習精度などに基づいて、必要な漢字(例えば「地」)を示す文字コードをデータ要求として課題提示部11に通知する。課題提示部11は、該文字コードの漢字もしくは該漢字を含む熟語(例えば「地球」)や文章の書き取りを課題としてユーザ端末40に通知する。熟語や文章について、課題提示部11は、例えば、辞書を検索して取得する。
【0021】
また、データ取得部21が、描画画像として必要なものの画像または名称を課題提示部11に通知し、課題提示部11が該画像または名称のものの描画を課題としてユーザ端末40に通知してもよい。また、データ取得部21が、着色されていない線画画像を課題提示部11に通知し、課題提示部11が該線画画像への着色を課題としてユーザ端末40に通知してもよい。なお、課題は、郵送によりユーザに通知されてもよい。
課題提示部11は、データ取得部21から名称を通知された場合、例えば、名称と関連付けされた画像を検索して取得する。また、ユーザに線画画像を通知する場合、着色された画像をデータ取得部21から取得し、線画化して通知してもよい。
【0022】
ユーザ端末40は、課題提示部11から通知された課題をユーザに提示する。ユーザ端末40は、課題に対するユーザの回答であって、手書きの回答をデジタル化し、回答取得部12に送信する。デジタル化は、例えば、紙などに手書きされたものを、デジタルカメラ、スキャナなどで読み込むことで行ってもよいし、タッチパネルに対してスタイラスペンなどで手書きされたものを取り込むことで行ってもよいし、マウスなどのポインティングデバイスにより手書きされたものを取り込むことで行ってもよい。
【0023】
回答取得部12は、ユーザ端末40がデジタル化し、送信した回答を受信することで、該回答を取得する。回答評価部13は、回答取得部12が取得した回答に対して、課題提示部11が通知した課題への回答としての評価を付し、評価結果をユーザ端末40に通知する。この評価は、回答が提出されたという評価であってもよいし、回答が正答か否かの評価であってもよい。また、回答が正答か否かの判断は、人間が行ってもよいし、文字認識技術などを用いて回答評価部13が正答でないと判断したものについて人間が行ってもよい。
【0024】
データ取得部21は、回答取得部12から回答を取得する。なお、データ取得部21は、回答評価部13により正答と判定された回答のみを取得するようにしてもよい。また、データ取得部21は、機械学習データの生成に必要な課題もしくは課題の正答も、上述の回答と対応付けて課題提示部11から取得する。また、データ取得部21は、取得した回答の評価結果を、回答評価部13から取得してもよい。
【0025】
尤度算出部22は、回答取得部12が取得した回答が正答であることの尤度を、課題、課題への正答または評価を用いて算出する。例えば、回答が手書きの文字の画像である場合、尤度算出部22は、文字認識技術を用いて該画像の文字を認識し、尤度を算出する。尤度算出部22は、尤度が所定の閾値を超えたときは、該文字の画像を機械学習データの候補とする。ここで、用いる閾値は、一般的な文字認識において用いられるものよりも低い値とする。これにより、癖が強く、一般的な文字認識において認識されない、あるいは、誤認識される画像も機械学習データの候補に含めることができる。
【0026】
また、尤度算出部22は、データ取得部21が取得した正答と一致する認識結果の尤度が、所定の閾値を超えたときは、該文字の画像を機械学習データの候補とするようにしてもよい。例えば、ある画像の文字認識結果として、正答と一致する文字Aの尤度がXであり、正答と一致しない文字Bの尤度がYであるとする。この場合、尤度算出部22は、Xが所定の閾値を超えていれば、Xの尤度がYより低かったとしても、該画像を機械学習データの候補とするようにしてもよい。
【0027】
なお、尤度算出部22は、文字認識を行う際に、それまでに機械学習データとして、機械学習用データベース30に登録した機械学習データにより学習された学習モデルを用いるようにしてもよい。さらに、この学習モデルを、ユーザ毎に用意しておいてもよい。すなわち、データ取得部21は、回答に対応付けて、該回答のユーザを識別する情報を取得し、あるユーザの学習モデルは、該ユーザの回答に基づく機械学習データを用いて学習することで生成されたものであってもよい。これにより、ユーザごとの癖が反映され学習モデルを得ることができる。回答が文字の画像以外の場合も同様である。
【0028】
また、回答が着色された画像である場合、尤度算出部22は、例えば、空や森、動物などの一般的な色、あるいは、正答とされる画像の色との色差から尤度を算出してもよい。画像を構成する、例えば空や森、動物などの領域を予め設定しておき、領域ごとに正答とされる画像の色との色差から尤度を算出してもよい。あるいは、尤度算出部22を備えないか、用いないかであり、全ての回答を機械学習データの候補に含めるようにしてもよい。
【0029】
また、回答が描画画像である場合、文字の画像の場合の文字認識と正答に代えて、物体認識技術(画像認識技術)と課題(描画するものの名称、あるいは、課題の画像の画像認識結果)を用いて、尤度算出部22は、描画画像中の物体を認識して、文字の画像の場合と同様の処理を行ってもよい。さらに、課題が画像である場合、尤度算出部22は、課題の画像と、回答の描画画像との類似度を算出し、該類似度を尤度として用いてもよい。
【0030】
データ登録部23は、尤度算出部22により機械学習データの候補とされた回答を、課題もしくは課題の正答と対応付けて、機械学習用データベース30に登録する。このとき、データ登録部23は、さらにユーザを識別する情報も対応づけておいてもよい。
回答が着色された画像である場合、例えば、空や森、動物などの画像を構成する要素ごとに機械学習用データベース30に登録されてもよい。
また、回答が描画画像である場合、認識した物体ごとに機械学習用データベース30に登録されてもよい。
【0031】
図3は、本実施形態における機械学習用データベース30が記憶する機械学習データの第1の例を示す表である。
図3に示す第1の例は、回答が文字の画像である場合の例である。この第1の例では、機械学習用データベース30は、「文字コードA1」と「文字画像B1」とを対応付けて記憶し、「文字コードA2」と「文字画像B2」とを対応付けて記憶し、「文字コードA3」と「文字画像B3」とを対応付けて記憶する。
【0032】
例えば、課題が、漢字の読み書き、穴埋め文章問題、クロスワードパズル、クイズ、ナンパ―プレースなどであれば、これらの文字コードは、正答の文字の文字コードであり、これらの文字画像は、回答の文字の画像である。また、課題が、書き取りであれば、これらの文字コードは、課題の文字の文字コードであり、これらの文字画像は、回答の文字の画像である。
【0033】
図4は、本実施形態における機械学習用データベース30が記憶する機械学習データの第2の例を示す表である。
図4に示す第2の例は、回答が描画画像である場合の例である。この第2の例では、機械学習用データベース30は、「名称C1」と「描画画像D1」とを対応付けて記憶し、「名称C2」と「描画画像D2」とを対応付けて記憶し、「名称C3」と「描画画像D3」とを対応付けて記憶する。これらの名称は、例えば、デッサンする課題とされた物体の名称であり、模写する課題とされた画像中の物体の名称である。
【0034】
図5は、本実施形態における機械学習用データベース30が記憶する機械学習データの第3の例を示す表である。
図5に示す第3の例は、回答が着色された画像である場合の例である。この第3の例では、機械学習用データベース30は、「名称E1」と「着色画像F1」とを対応付けて記憶し、「名称E2」と「着色画像F2」とを対応付けて記憶し、「名称E3」と「着色画像F3」とを対応付けて記憶する。これらの名称は、課題とされた線画画像を構成する領域の名称である。
【0035】
なお、
図3から
図5における文字画像、描画画像、着色画像は、画像形式のデータでなくてもよく、どのようなデータ形式であってもよい。また、機械学習を行うための特徴量に変換されたものであってもよい。
【0036】
図6は、本実施形態における機械学習データ収集システム100の動作を説明するシーケンス図である。まず、機械学習データ収集サーバ20が、必要なデータを示すデータ要求S1をサービス提供サーバ10に送信する。サービス提供サーバ10は、該データ要求S1に基づき、課題S2を生成して、ユーザ端末40に通知する。ユーザ端末40は、通知された課題S2を表示し、ユーザによる回答S3をサービス提供サーバ10に送信する。
【0037】
サービス提供サーバ10は、該回答S3に対して、課題S2への回答としての評価をし、その評価結果S4をユーザ端末40に通知する。また、サービス提供サーバ10は、該回答S3とともに、課題S2または正答S5を機械学習データ収集サーバ20に送信する。機械学習データ収集サーバ20は、回答S3と、課題S2または正答S5とに基づき、機械学習データS6を生成して、機械学習用データベース30に登録する。
【0038】
このように、機械学習データ収集システム100は、学習または娯楽のための課題の回答を取得し、該回答に対して、該課題への回答としての評価を付す。そして、機械学習データ収集システム100は、該回答に基づき、機械学習データを生成する。このように、回答を生成する個人は、課題への回答としての評価結果が得られるため、機械学習データを生成する際にかかる個人の負担を軽減することができる。
【0039】
なお、本発明における
図1の機械学習データ収集システム100の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませて実行することにより、機械学習データ収集システム100を実現してもよい。なお、ここでいう「コンピュータシステム」とは、OS(Operating System)や周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWW(World Wide Web)システムも含むものとする。
【0040】
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM(Read Only Memory)、CD-ROM(Compact Disc - Read Only Memory)等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM(Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
【0041】
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【0042】
以上、この発明の実施形態を図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計変更等も含まれる。
【符号の説明】
【0043】
10 サービス提供サーバ
11 課題提示部
12 回答取得部
13 回答評価部
20 機械学習データ収集サーバ
21 データ取得部
22 尤度算出部
23 データ登録部
30 機械学習用データベース
40 ユーザ端末
100 機械学習データ収集システム