【解決手段】実施形態の一態様に係る情報処理方法は、バウンディングボックスによって物体が囲まれた画像を取得するステップと、バウンディングボックスによって囲まれた物体の画像を認識して物体の名称と名称の信頼度とを導出するステップと、バウンディングボックスに付与する名称の候補を信頼度に基づいて選択し、名称の候補のリストを生成して提示するステップとを含む。
前記同一の前記物体について導出される全ての前記名称の前記信頼度が前記閾値未満である場合は、前記リストの提示を行わずに、前記物体の名称の入力要求を行うステップと
を含むことを特徴とする請求項2に記載の情報処理方法。
【発明を実施するための形態】
【0010】
以下、添付図面を参照して、情報処理方法および情報処理プログラムの実施形態を詳細に説明する。なお、以下に示す実施形態によりこの発明が限定されるものではない。また、以下の説明では、同一の構成要素に対して同一の符号を付することにより、重複する説明を省略する。
【0011】
図1は、実施形態に係る情報処理方法の概要説明図である。実施形態に係る情報処理方法では、機械学習の一つである教師あり学習用の教師データとして使用される画像に付与される正解値の候補を教師データの作成者(以下、単に「作成者」と記載する)に提示する。
【0012】
ここでは、CNN(Convolutional Neural Network)を用いて画像認識を行う機械学習モデルに学習させる教師データ用の画像に付与される正解値の候補として、認識対象物の名称の候補を提示する場合を例に挙げて説明する。
【0013】
例えば、機械学習モデルによって車両を画像認識させる場合、あらゆる方向から撮像された膨大な数の車両の画像に、車両という正解値が付与された教師データを機械学習モデルに入力して事前に学習させる。
【0014】
しかしながら、例えば、数千枚から数万枚の車両の画像に人が名称を付与するとなると、教師データの作成に膨大な量の作業が必要となる。また、膨大な数の画像に対して名称を付与する必要があるため、複数人で名称の付与作業が行われることが一般的である。このため、人によって名称が画像に付与される場合に、名称のバラツキおよび間違い等の人為的なミスが発生するおそれがある。
【0015】
そこで、実施形態に係る情報処理方法では、コンピュータが、教師データとなる画像に含まれる認識対象物の名称として信頼度の高い名称の候補のリストを作成者に提示することによって、人為的なミスの発生を抑制する。
【0016】
例えば、
図1に示すように、作成者100は、教師データの作成に使用する端末装置101によって、まず、教師データとなる画像に対して、画像中の車両を囲むバウンディングボックス(以下、「BB10」と記載する)を作成して付与する(ステップS1)。
【0017】
コンピュータの一例である情報処理装置1は、端末装置101からBB10によって物体の一例である車両が囲まれた画像(以下、「BB付画像」と記載する)を取得する(ステップS2)。情報処理装置1は、BB付画像を画像認識して、物体の名称と、名称の信頼度とを導出する(ステップS3)。
【0018】
情報処理装置1は、BB10に付与する名称の候補を導出した信頼度に基づいて選択し、名称の候補のリストを生成する(ステップS4)。そして、情報処理装置1は、生成した名称の候補のリストを端末装置101へ送信して、作成者100に提示する(ステップS5)。
【0019】
作成者100は、提示されるリストから名称を選択してBB10に付与する(ステップS6)。これにより、作成者100は、BB10に名称を付与する場合に、人為的なミスの発生を抑制することができる。
【0020】
また、情報処理装置1は、BB10に付与された名称を端末装置101から取得する(ステップS7)。そして、情報処理装置1は、取得した名称とBB10が付与された画像とを対応付けて画像データベース(以下、「画像DB」と記載する)に登録する(ステップS8)。
【0021】
これにより、情報処理装置1は、画像DBに順次登録される画像を使用することによって、例えば、次回以降に導出する物体の名称および名称の信頼度の精度を向上させることができる。
【0022】
次に、
図2を参照して実施形態に係るコンピュータの一例である情報処理装置の構成について説明する。
図2は、実施形態に係る情報処理装置の構成の一例を示すブロック図である。
図2に示すように、情報処理装置1は、端末装置101と接続される。
【0023】
情報処理装置1は、制御部2と記憶部3とを備える。記憶部3は、例えば、データフラッシュ等の情報記憶デバイスであり、画像DB31を記憶する。ここで、
図3を参照して画像DB31について説明する。
【0024】
図3に示すように、画像DB31には、名称が既知の物体の画像が予め蓄積されている。具体的には、画像DB31には、画像と画像中の物体の名称とが対応付けられた情報が予め蓄積されている。例えば、画像DB31には、セダンタイプの車両の画像に対してセダンという名称が対応付けられた情報、小型車の画像に対してコンパクトカーという名称が対応付けられた情報等が蓄積されている。
【0025】
また、画像DB31には、車両以外にも、信号機の画像に信号機という名称が対応付けられた情報、人の画像に人という名称が対応付けられた情報等が蓄積されている。画像DB31には、例えば、数千から数万単位の情報が予め蓄積される。
【0026】
図2へ戻り、制御部2の説明を行う。制御部2は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)などを有するマイクロコンピュータや各種の回路を含む。
【0027】
制御部2は、CPUがROMに記憶された情報処理プログラムを、RAMを作業領域として使用して実行することにより機能するBB付画像取得部21と、名称信頼度導出部22と、名称候補リスト提示部23と、名称取得部24と、名称登録部25とを備える。
【0028】
なお、制御部2が備えるBB付画像取得部21、名称信頼度導出部22、名称候補リスト提示部23、名称取得部24、および名称登録部25は、一部または全部がASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等のハードウェアで構成されてもよい。
【0029】
制御部2が備えるBB付画像取得部21、名称信頼度導出部22、名称候補リスト提示部23、名称取得部24、および名称登録部25は、それぞれ以下に説明する情報処理の作用を実現または実行する。なお、制御部2の内部構成は、
図2に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
【0030】
BB付画像取得部21は、端末装置101からBB付画像を取得して、名称信頼度導出部22へ出力する。名称信頼度導出部22は、BB付画像取得部21から入力されるBB付画像におけるBB10によって囲まれる物体を画像認識によって検知する。
【0031】
そして、名称信頼度導出部22は、BB10によって囲まれた物体の画像と、画像DB31とを比較して、名称の候補と、名称の信頼度とを導出する。具体的には、名称信頼度導出部22は、画像DB31を参照して、検知した物体と類似する複数の物体を検索し、例えば、該当する物体に対応付けられた名称が同一の物体の数が多い名称ほど高くなる信頼度を導出する。
【0032】
このように、名称信頼度導出部22は、BB10によって囲まれた物体の画像と、名称が既知の物体の画像DB31とを比較して、名称の候補の信頼度を導出するので、正確な信頼度を導出することができる。名称信頼度導出部22は、導出した名称の候補と、名称の信頼度とを名称候補リスト提示部23へ出力する。
【0033】
名称候補リスト提示部23は、同一の物体について導出される名称の候補から、信頼度が閾値(例えば、70%)以上の名称の候補を選択し、信頼度が高い順に配置してリストを生成し、端末装置101へ送信して作成者100に提示する。
【0034】
また、名称候補リスト提示部23は、同一の物体について導出される全ての名称の信頼度が閾値(例えば、70%)未満である場合は、リストの提示を行わずに、作成者100に対して物体の名称の入力要求を行う。
【0035】
ここで、
図4および
図5を参照して名称候補リスト提示部23によって提示される情報の一例について説明する。
図4および
図5は、実施形態に係る名称候補リスト提示部によって提示される情報の一例を示す説明図である。
【0036】
名称候補リスト提示部23は、端末装置101から入力される車両のBB付画像について、信頼度が閾値を超える名称の候補を導出した場合、例えば、
図4に示す表示画面103を端末装置101に表示させる。
【0037】
このとき、名称候補リスト提示部23は、例えば、表示画面103における左側に、端末装置101から取得したBB10によって囲まれる車両の画像を表示させる。そして、名称候補リスト提示部23は、表示画面103の右側に、信頼度が高い上位3つの名称の候補を信頼度が高い順に配置した名称の候補のリスト11を表示させる。
【0038】
名称候補リスト提示部23は、リスト11における名称の候補の左側に、信頼度の順位を表示させ、名称の候補の右側に信頼度の値を表示させる。作成者100は、表示画面に表示されるカーソル12を移動させて、BB10に付与する名称の候補を選択し、決定ボタン13をクリックすることによって、BB10に付与する名称を決定することができる。
【0039】
このように、名称候補リスト提示部23は、名称の候補を絞り込んで作成者100に提示することにより、作成者100によって正解値が画像に付与される場合に、人為的なミスの発生を抑制することができる。
【0040】
また、端末装置101から入力される車両のBB付画像について導出した名称の候補の信頼度が全て閾値未満であった場合、例えば、
図5に示す表示画面104を端末装置101に表示させる。
【0041】
このとき、名称候補リスト提示部23は、例えば、表示画面103における左側に、端末装置101から取得したBB付画像を表示させ、表示画面103における右側に、名称入力要求14を表示させる。
【0042】
名称候補リスト提示部23は、例えば、「該当する名称がありません。名称を入力してください。」というテキスト情報を表示させて、作成者100に、BB10に付与する名称の入力を促す。作成者100は、テキストボックスに名称を手動入力することによって、BB10に名称を付与することができる。
【0043】
図2へ戻り名称取得部24について説明する。名称取得部24は、作成者100によってBB10に名称が付与された場合、および手動入力によって名称が入力されてBB10に付与された場合に、端末装置101からBB10に付与された名称を取得する。名称取得部24は、取得した名称を名称登録部25へ出力する。
【0044】
名称登録部25は、名称取得部24から入力される名称と、BB付画像とを対応付けて画像DB31に登録する。名称登録部25は、作成者100によってBB10に名称が付与される度に、名称と、BB付画像とを対応付けて画像DB31に登録する。これにより、名称信頼度導出部22は、画像DB31に蓄積される情報量が増大するので、導出する名称の信頼度を向上させることができる。
【0045】
次に、
図6を参照して実施形態に係る情報処理装置1が実行する処理の一例について説明する。
図6は、実施形態に係る情報処理装置が実行する処理の一例を示すフローチャートである。
【0046】
図6に示すように、制御部2は、まず、端末装置101からBB付画像を取得し(ステップS101)、BB付画像から物体を画像認識する(ステップS102)。その後、制御部2は、物体の名称および名称の信頼度を導出する(ステップS103)。
【0047】
続いて、制御部2は、信頼度が全て閾値未満か否かを判定する(ステップS104)。そして、制御部2は、信頼度が全て閾値未満ではないと判定した場合(ステップS104,No)、つまり、信頼度が閾値以上の名称があると判定した場合、信頼度が閾値以上の名称候補を選択する(ステップS105)。
【0048】
そして、制御部2は、名称の候補のリストを生成する(ステップS106)。このとき、制御部2は、同一の物体について導出される名称の候補から、信頼度が閾値以上の名称の候補を選択し、信頼度が高い順に所定数(例えば、上位3つ)の名称を配置してリストを生成する。
【0049】
その後、制御部2は、名称の候補のリストを端末装置101へ送信して提示し(ステップS107)、処理をステップS108へ移す。また、制御部2は、導出した信頼度が全て閾値未満であると判定した場合(ステップS104,Yes)、作成者100に対して物体の名称の入力要求を行い(ステップS110)、処理をステップS108へ移す。
【0050】
ステップS108において、制御部2は、作成者100によってBBに付与された名称を取得したか否かを判定する。そして、制御部2は、付与された名称を取得したと判定した場合(ステップS108,Yes)、名称と画像とを対応付けて画像DB31(ステップS109)に登録し、処理を終了する。そして、制御部2は、再度ステップS101から処理を開始する。また、制御部2は、付与された名称を取得しないと判定した場合(ステップS108,No)、処理を終了し、再度ステップS101から処理を開始する。
【0051】
なお、上述した実施形態では、情報処理装置1と端末装置101とが有線によって接続される場合を例に挙げて説明したが、情報処理装置1は、例えば、クラウド上に設けられ、無線通信によって端末装置101と接続されてもよい。また、上述した実施形態では、情報処理装置1が画像DB31を備える場合を例に挙げて説明したが、画像DB31は、例えば、クラウド上に設けられてもよい。
【0052】
さらなる効果や変形例は、当業者によって容易に導き出すことができる。このため、本発明のより広範な態様は、以上のように表しかつ記述した特定の詳細および代表的な実施形態に限定されるものではない。したがって、添付の特許請求の範囲およびその均等物によって定義される総括的な発明の概念の精神または範囲から逸脱することなく、様々な変更が可能である。