(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024113439
(43)【公開日】2024-08-22
(54)【発明の名称】情報処理方法、情報処理装置、およびプログラム
(51)【国際特許分類】
G06T 7/37 20170101AFI20240815BHJP
G06T 7/00 20170101ALI20240815BHJP
G06T 7/174 20170101ALI20240815BHJP
G06V 20/64 20220101ALI20240815BHJP
【FI】
G06T7/37
G06T7/00 C
G06T7/174
G06V20/64
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2023018412
(22)【出願日】2023-02-09
(71)【出願人】
【識別番号】000004123
【氏名又は名称】JFEエンジニアリング株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】芳賀 継彦
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA09
5L096CA05
5L096EA35
5L096EA39
5L096FA25
5L096FA54
5L096JA18
(57)【要約】
【課題】撮像カメラによって撮像して得られた撮像画像データにおいて対象物の状態を高精度にアノテーションできるようにすること。
【解決手段】対象施設に貯留された対象物を撮像手段によって異なる方向から撮像した複数の撮像画像データを記憶部に記憶させ、記憶部から読み出した少なくとも1つの撮像画像データに対して、対象物が撮像された対象物領域と対象物が撮像されていない非抽出領域とを識別し、撮像画像データ内の対象物を含み、所定の移動線に沿って平行移動可能な平面状の投影面を設定し、投影面に対して、識別された対象物領域の画素数に起因して設定された評価指標を導出して、評価指標が所定条件を満たした場合の投影面を選択して選択投影面とし、選択投影面に基づいて幾何変換処理を施すことによって、対象物が選択投影面に投影された変換画像データを生成する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
ハードウェアを備えた制御部が実行する情報処理方法であって、
対象施設に貯留された対象物を複数台の撮像手段によって異なる方向から撮像してそれぞれ得られた複数の撮像画像データを記憶部に記憶させる記憶ステップと、
前記記憶部から読み出した少なくとも1つの撮像画像データに対して、前記対象物が撮像された対象物領域と前記対象物が撮像されていない非抽出領域とを識別する識別ステップと、
前記撮像画像データ内の前記対象物を含み、所定の移動線に沿って平行移動可能な平面状の投影面を設定する設定ステップと、
前記投影面に対して、識別された前記対象物領域の画素数に起因して設定された評価指標を導出して、前記評価指標が所定条件を満たした場合の投影面を選択して選択投影面として設定する選択ステップと、
前記選択投影面に基づいて幾何変換処理を施すことによって、前記対象物が前記選択投影面に投影された変換画像データを生成する変換ステップと、を含む
情報処理方法。
【請求項2】
前記対象物が、底面が平面状である所定の空間に収納され、
前記所定の投影面を、前記底面に対して平行または重力に対して垂直に設定する
請求項1に記載の情報処理方法。
【請求項3】
前記評価指標は、λを0より大きい重み付け係数とした場合に、次式に基づいて導出される
評価指標=(投影面内の対象物領域画素数-投影面外の対象物領域画素数×λ)/投影面全体の画素数
請求項1に記載の情報処理方法。
【請求項4】
前記撮像画像データは、前記撮像手段によって前記対象物を撮像した時点に関する時刻情報と関連付けされている
請求項1に記載の情報処理方法。
【請求項5】
前記記憶部から読み出した、前記時刻情報において前記撮像した時点が同時刻である複数の前記撮像画像データのうちの一部の撮像画像データに対して前記選択投影面を設定し、残部の撮像画像データに対して前記選択投影面を適用する
請求項4に記載の情報処理方法。
【請求項6】
前記記憶部から読み出した、前記時刻情報において前記撮像した時点が同時刻である複数の前記撮像画像データに対して、互いに独立してそれぞれの撮像画像データにおける前記選択投影面を設定する
請求項4に記載の情報処理方法。
【請求項7】
前記対象施設が廃棄物貯留設備における貯留ピットであり、前記対象物が前記貯留ピットに貯留された廃棄物である
請求項1に記載の情報処理方法。
【請求項8】
対象物を撮像して得られた撮像画像データを記憶する記憶部と、前記撮像画像データに対する画像処理を実行する制御部と、を備え、
前記制御部は、
対象施設に貯留された対象物を複数台の撮像手段によって異なる方向から撮像してそれぞれ得られた複数の撮像画像データを前記記憶部に記憶させ、
前記記憶部から読み出した少なくとも1つの撮像画像データに対して、前記対象物が撮像された対象物領域と前記対象物が撮像されていない非抽出領域とを識別し、
前記撮像画像データ内の前記対象物を含み、所定の移動線に沿って平行移動可能な平面状の投影面を設定し、
前記投影面に対して、識別された前記対象物領域の画素数に起因して設定された評価指標を導出して、前記評価指標が所定条件を満たした場合の投影面を選択して選択投影面として設定し、
前記選択投影面に基づいて幾何変換処理を施すことによって、前記対象物が前記選択投影面に投影された変換画像データを生成して前記記憶部に格納する
情報処理装置。
【請求項9】
ハードウェアを備えた制御部に、
対象施設に貯留された対象物を複数台の撮像手段によって異なる方向から撮像してそれぞれ得られた複数の撮像画像データを記憶部に記憶させる記憶ステップと、
前記記憶部から読み出した少なくとも1つの撮像画像データに対して、前記対象物が撮像された対象物領域と前記対象物が撮像されていない非抽出領域とを識別する識別ステップと、
前記撮像画像データ内の前記対象物を含み、所定の移動線に沿って平行移動可能な平面状の投影面を設定する設定ステップと、
前記投影面に対して、識別された前記対象物領域の画素数に起因して設定された評価指標を導出して、前記評価指標が所定条件を満たした場合の投影面を選択して選択投影面として設定する選択ステップと、
前記選択投影面に基づいて幾何変換処理を施すことによって、前記対象物が前記選択投影面に投影された変換画像データを生成する変換ステップと、
を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理方法、情報処理装置、およびプログラムに関する。
【背景技術】
【0002】
近年、廃棄物処理施設における焼却炉の運転の効率化のために、貯留ピット内におけるごみ、いわゆる廃棄物の混合状態や種別を機械学習によって判別したり認識したりする、貯留ピット内の把握技術の開発が求められている。例えば特許文献1,2,3には、画像を用いたごみピットの混合状態の推定技術が提案されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特許第6731680号公報
【特許文献2】特許第6603822号公報
【特許文献3】特許第6856522号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、ごみピットなどの貯留ピット内の廃棄物の堆積形状は、クレーンによる撹拌によって時々刻々と変化する。そのため、同じ貯留ピット内で同じような攪拌状態の廃棄物であっても、貯留ピット内を撮像する複数のカメラの設置位置や撮像角度によって、それぞれのカメラからの見え方が全く異なる。このような複数のカメラによって貯留ピット内の廃棄物を撮像して得られた複数の撮像画像データに対してラベルの対応付けを行い、撮像画像データに対して機械学習を実行しても、認識精度を向上させることは困難であった。これは、貯留ピット内の廃棄物を撮像する場合に限らず、複数の撮像カメラによって対象物を撮像することにより得られた複数の撮像画像データに対して機械学習を実行した場合においても同様に生じる問題である。そのため、複数の撮像カメラによって撮像した複数の撮像画像データにおける対象物の認識精度を向上できる技術が求められていた。
【0005】
本発明は、このような事情に鑑みてなされたもので、その目的は、複数の撮像カメラによって撮像した複数の撮像画像データにおける対象物の認識精度の向上を図ることができる情報処理方法、情報処理装置、およびプログラムを提供することにある。
【課題を解決するための手段】
【0006】
上述した課題を解決し、目的を達成するために、本発明の一態様に係る情報処理方法は、ハードウェアを備えた制御部が実行する情報処理方法であって、対象施設に貯留された対象物を複数台の撮像手段によって異なる方向から撮像してそれぞれ得られた複数の撮像画像データを記憶部に記憶させる記憶ステップと、前記記憶部から読み出した少なくとも1つの撮像画像データに対して、前記対象物が撮像された対象物領域と前記対象物が撮像されていない非抽出領域とを識別する識別ステップと、前記撮像画像データ内の前記対象物を含み、所定の移動線に沿って平行移動可能な平面状の投影面を設定する設定ステップと、前記投影面に対して、識別された前記対象物領域の画素数に起因して設定された評価指標を導出して、前記評価指標が所定条件を満たした場合の投影面を選択して選択投影面として設定する選択ステップと、前記選択投影面に基づいて幾何変換処理を施すことによって、前記対象物が前記選択投影面に投影された変換画像データを生成する変換ステップと、を含む。
【0007】
本発明の一態様に係る情報処理方法は、上記の発明において、前記対象物が、底面が平面状である所定の空間に収納され、前記所定の投影面を、前記底面に対して平行または重力に対して垂直に設定する。
【0008】
本発明の一態様に係る情報処理方法は、上記の発明において、前記評価指標は、λを0より大きい重み付け係数とした場合に、次式に基づいて導出される。
評価指標=(投影面内の対象物領域画素数-投影面外の対象物領域画素数×λ)/投影面全体の画素数
【0009】
本発明の一態様に係る情報処理方法は、上記の発明において、前記撮像画像データは、前記撮像手段によって前記対象物を撮像した時点に関する時刻情報と関連付けされている。
【0010】
本発明の一態様に係る情報処理方法は、上記の発明において、前記記憶部から読み出した、前記時刻情報において前記撮像した時点が同時刻である複数の前記撮像画像データのうちの一部の撮像画像データに対して前記選択投影面を設定し、残部の撮像画像データに対して前記選択投影面を適用する。
【0011】
本発明の一態様に係る情報処理方法は、上記の発明において、前記記憶部から読み出した、前記時刻情報において前記撮像した時点が同時刻である複数の前記撮像画像データに対して、互いに独立してそれぞれの撮像画像データにおける前記選択投影面を設定する。
【0012】
本発明の一態様に係る情報処理方法は、上記の発明において、前記対象施設が廃棄物貯留設備における貯留ピットであり、前記対象物が前記貯留ピットに貯留された廃棄物である。
【0013】
本発明の一態様に係る情報処理装置は、対象物を撮像して得られた撮像画像データを記憶する記憶部と、前記撮像画像データに対する画像処理を実行する制御部と、を備え、前記制御部は、対象施設に貯留された対象物を複数台の撮像手段によって異なる方向から撮像してそれぞれ得られた複数の撮像画像データを前記記憶部に記憶させ、前記記憶部から読み出した少なくとも1つの撮像画像データに対して、前記対象物が撮像された対象物領域と前記対象物が撮像されていない非抽出領域とを識別し、前記撮像画像データ内の前記対象物を含み、所定の移動線に沿って平行移動可能な平面状の投影面を設定し、前記投影面に対して、識別された前記対象物領域の画素数に起因して設定された評価指標を導出して、前記評価指標が所定条件を満たした場合の投影面を選択して選択投影面として設定し、前記選択投影面に基づいて幾何変換処理を施すことによって、前記対象物が前記選択投影面に投影された変換画像データを生成して前記記憶部に格納する。
【0014】
本発明の一態様に係るプログラムは、ハードウェアを備えた制御部に、対象施設に貯留された対象物を複数台の撮像手段によって異なる方向から撮像してそれぞれ得られた複数の撮像画像データを記憶部に記憶させる記憶ステップと、前記記憶部から読み出した少なくとも1つの撮像画像データに対して、前記対象物が撮像された対象物領域と前記対象物が撮像されていない非抽出領域とを識別する識別ステップと、前記撮像画像データ内の前記対象物を含み、所定の移動線に沿って平行移動可能な平面状の投影面を設定する設定ステップと、前記投影面に対して、識別された前記対象物領域の画素数に起因して設定された評価指標を導出して、前記評価指標が所定条件を満たした場合の投影面を選択して選択投影面として設定する選択ステップと、前記選択投影面に基づいて幾何変換処理を施すことによって、前記対象物が前記選択投影面に投影された変換画像データを生成する変換ステップと、を実行させる。
【発明の効果】
【0015】
本発明に係る情報処理方法、情報処理装置、およびプログラムによれば、複数の撮像カメラによって撮像した複数の撮像画像データにおける対象物の認識精度を向上することが可能となる。
【図面の簡単な説明】
【0016】
【
図1】
図1は、本発明の一実施形態による情報処理システムを示すブロック図である。
【
図2】
図2は、本発明の一実施形態による情報処理装置を示すブロック図である。
【
図3】
図3は、本発明の一実施形態における貯留ピットの内部を撮像した撮像画像データの例を示す図である。
【
図4】
図4は、本発明の一実施形態における貯留ピット内を2台の撮像カメラによって撮像した場合の一対の撮像画像データの例を示す図である。
【
図5】
図5は、本発明の一実施形態による情報処理方法を説明するためのフローチャートである。
【
図6A】
図6Aは、本発明の一実施形態における撮像画像データに含まれる貯留ピットの底面の設定例を示す図である。
【
図6B】
図6Bは、本発明の一実施形態における撮像画像データに含まれる貯留ピットの底面を仮想的に平行移動させた状態の例を示す図である。
【
図7】
図7は、
図3に示す撮像画像データに対して対象物領域と非抽出領域とで2値化した2値化画像データの例を示す図である。
【
図8A】
図8Aは、
図7に示す2値化画像データに対する投影面の取得方法を説明するための所定の評価指標での2値化画像データを示す図である。
【
図8B】
図8Bは、
図7に示す2値化画像データに対する投影面の取得方法を説明するための所定の評価指標での2値化画像データを示す図である。
【
図8C】
図8Cは、
図7に示す2値化画像データに対する投影面の取得方法を説明するための所定の評価指標での2値化画像データを示す図である。
【
図9】
図9は、本発明の一実施形態における2値化画像データにおいて設定された投影面の底面からの高さを説明するための図である。
【
図10A】
図10Aは、本発明の一実施形態における貯留ピット内を一方の撮像カメラによって撮像した撮像画像データおよび対応する変換画像データの例を示す図である。
【
図10B】
図10Bは、本発明の一実施形態における貯留ピット内を他方の撮像カメラによって撮像した撮像画像データおよび対応する変換画像データの例を示す図である。
【
図11A】
図11Aは、本発明の一実施形態による貯留ピット内を2台の撮像カメラによって撮像した場合の一対の撮像画像データに対して投影面を相互に対応させた例を示す図である。
【発明を実施するための形態】
【0017】
以下、本発明の一実施形態について図面を参照しつつ説明する。なお、以下の一実施形態の全図においては、同一または対応する部分には同一の符号を付す。また、本発明は以下に説明する一実施形態によって限定されるものではない。
【0018】
まず、本発明の一実施形態による情報処理装置を説明するにあたり、本発明者が行った鋭意検討について説明する。すなわち、本発明者の知見によれば、例えば対象物を貯留する対象施設においては、対象施設内の全体を高精度に撮像するために、撮像カメラを異なる位置に複数設けて対象施設内を撮像することが考えられる。また、対象施設内において対象物が混合されたり変化したりする場合、対象施設内の対象物の形状は刻々と変化する可能性がある。また、対象施設内を撮像した撮像画像データにおいて、複数台の撮像カメラの距離が互いに離れている場合、対象物領域を評価する所定領域が同一であっても、複数台の撮像カメラによって撮像されたそれぞれの撮像画像データに対して、それぞれの撮像画像データにおける同一とされる所定領域の対応付けが困難であるという問題が生じる。
【0019】
例えば、対象施設が廃棄物の貯留ピットであって対象物が廃棄物である場合、貯留ピットは広いため、複数の撮像カメラを用いて廃棄物の撮像を行うことが多い。この場合、貯留ピット内の同一位置における同一の廃棄物であっても、撮像カメラからの距離や撮像方向によって見え方が異なる。具体的に、それぞれの撮像カメラによって撮像した撮像画像データに対して、それぞれ個別にアノテーションを行うと、異なる方向から見た状況によって設定するラベルを間違える可能性が高くなる。すなわち、貯留ピット内に対して同じタイミングで異なる撮像カメラによって撮像された異なる撮像画像データにおいては、同じ位置であっても、近傍で撮像された廃棄物と遠方で撮像された廃棄物とでは混合度が異なって見えてしまう。そのため、作業者が目視でのアノテーションを行う場合に、同一の廃棄物に対して異なるラベルを付与してしまう可能性がある。また、貯留ピット内の廃棄物の堆積形状がクレーンなどによる撹拌によって刻々と変化する場合、貯留ピット内において同じ廃棄物であって同じ領域を撮像した部分であっても、撮像カメラからの位置や角度によって見え方が全く異なる場合がある。そのため、複数の異なる撮像カメラによって対象物を撮像した場合、異なる複数の撮像カメラによって対象物を撮像して得られた撮像画像データに対して作業者がラベル付けを行う、いわゆるアノテーションを行ってもラベルの対応付けが安定しない。これにより、このようにして得られた複数の撮像画像データを用いて機械学習を行っても、対象物に対する認識精度を向上させることは困難であった。
【0020】
そこで本発明者は、対象施設内を異なる方向から撮像した複数の撮像画像データに対してアノテーション作業を行う方法について検討を行った。本発明者は、対象施設内を撮像した撮像画像データから対象物の存在する範囲(対象物領域)を抽出して適切な幾何変換処理を適用することによって、対象物の形状による見え方の変化を軽減する方法を案出した。これにより、撮像画像データを用いて機械学習を行う場合に、画像データの位置情報も含めることによって、得られる学習モデルによる撮像画像データに対する認識精度を向上させることが可能になる。すなわち、同じ時点において互いに異なる方向から対象施設内や対象物を撮像して得られた複数の撮像画像データに対してそれぞれ、所定の幾何変換処理を適用することによって変換画像データを生成し、複数の撮像画像データを高精度に対応させることを想到した。これによって、同一の対象物に対して異なる方向から撮像して得られた複数の撮像画像データをそれぞれ幾何学的に変換させた変換画像データに対して、アノテーション作業を行う作業者が同じ位置から見た画像として認識できるので、アノテーション作業において修正や補正を低減でき、アノテーション作業の作業負荷を低減できる。以下に説明する本発明の一実施形態は、本発明者による以上の鋭意検討に基づいて案出されたものである。
【0021】
(アノテーションデータ生成システム)
図1は、本発明の一実施形態による情報処理装置が適用される情報処理システムを示す。
図1に示すように、情報処理システムとしてのアノテーションデータ生成システム1は、ネットワーク2を介して相互に通信可能な、情報処理装置としての情報処理装置10と、廃棄物貯留設備20と、廃棄物焼却設備30とを備える。廃棄物処理施設3は、少なくとも廃棄物貯留設備20および廃棄物焼却設備30を備える。情報処理装置10は、ネットワーク2を通じて廃棄物処理施設3と通信可能な外部に設けられていても、廃棄物処理施設3の一部であっても良い。また、情報処理装置10は、廃棄物貯留設備20の内部に設けられていても良く、設置場所は限定されない。
【0022】
ネットワーク2は、有線通信や無線通信が適宜組み合わされて構成され、インターネット回線網や携帯電話回線網などの通信網から構成される。ネットワーク2は、例えば、専用線、インターネットなどの公衆通信網、例えばLAN(Local Area Network)、WAN(Wide Area Network)、携帯電話などの電話通信網や公衆回線、VPN(Virtual Private Network)などの一または複数の組み合わせからなる。情報処理装置10と廃棄物貯留設備20と廃棄物焼却設備30とは、ネットワーク2を介して接続されている。
【0023】
(廃棄物焼却設備)
ごみ焼却部としての廃棄物焼却設備30は、従来公知の構成を有する。すなわち、廃棄物焼却設備30は、燃焼制御装置(ACC)31、センサ部32、および焼却炉33を備える。燃焼制御装置31は、あらかじめ定められた操作量基準値の設定に基づいて、それぞれの操作端の操作量として、燃焼用空気量、冷却用空気量、ごみ供給装置送り速度、および火格子送り速度などを制御する。ごみ焼却炉である焼却炉33は、廃棄物26aの燃焼が行われる炉、廃棄物26aを投入する廃棄物投入口、およびボイラ(いずれも図示せず)などを備える。センサ部32は、例えば種々の場所に設けられた温度計や圧力計などから構成される。センサ部32によって計測された、焼却炉33の内部の状態、および焼却炉33に関連する施設、具体的には、例えば電力を発電するための発電施設における、圧力や速度などの種々の物理量は、センサ部32からセンサ情報として出力される。センサ部32から出力されたセンサ情報は、パラメータとして燃焼制御装置31に供給される。燃焼制御装置31は、入力されたパラメータに基づいて焼却炉33の燃焼を制御する。
【0024】
(廃棄物貯留設備)
廃棄物貯留部としての廃棄物貯留設備20は、制御部21、通信部22、撮像部23、把持部25、および貯留ピット26を備える。貯留ピット26には、把持部25が移動可能に設けられているとともに、撮像部23が設けられている。把持部25は、情報処理装置10の制御部11から送信される制御信号に基づいて、制御部21が制御する。制御部21は、制御部11から送信される制御信号に基づいて、撮像部23を制御しても良い。なお、情報処理装置10の制御部11が、撮像部23および把持部25を直接的に制御しても良い。
【0025】
制御部21は、具体的に、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、FPGA(Field-Programmable Gate Array)などのハードウェアを有するプロセッサ、およびRAM(Random Access Memory)やROM(Read Only Memory)などの主記憶部(いずれも図示せず)を備える。制御部21は、RAMやROMなどの主記憶部に格納された各種プログラムに従い、通信部13,22を通じて情報処理装置10から入力された制御信号などに基づいて、撮像部23および把持部25を制御する。
【0026】
通信部22は、例えば、LANインターフェースボード、有線通信のための有線通信回路、または無線通信のための無線通信回路である。LANインターフェースボードや有線通信回路や無線通信回路は、ネットワーク2に接続される。送信部および受信部としての通信部22は、ネットワーク2に接続して、情報処理装置10との間で通信を行う。
【0027】
把持部25は、貯留ピット26に貯留されている廃棄物26aを把持して移動させる。開閉部としてのバケット252は、廃棄物26aを把持できる。移動部としてのクレーン251は、バケット252を連結して移動可能に構成される。クレーン251は、情報処理装置10の制御部11から送信される制御信号によって制御される。貯留ピット26は、内壁26bによって囲まれた空間であり、廃棄物26aを一時的に貯留可能なピットである。貯留ピット26内の廃棄物26aは、把持部25によって把持されて、廃棄物焼却設備30の焼却炉33に供給され、焼却される。
【0028】
撮像部23は、複数の撮像手段としての例えば2台の撮像カメラ231,232を有する。撮像部23は、撮像カメラ231,232によって、貯留ピット26内の廃棄物26aや内壁26bの表面を撮像可能に構成される。撮像部23を構成する撮像カメラ231,232はそれぞれ、互いに異なる方向から貯留ピット26内の廃棄物26aの状態を撮像する。
【0029】
一方の撮像カメラ231が撮像して生成した撮像画像データを
図3に示す。撮像カメラ231によって撮像されて得られた
図3に示す撮像情報としての撮像画像データ100は、撮像時における時刻情報と関連付けされて、撮像カメラ231から通信部22を介して情報処理装置10に送信される。また、撮像カメラ232によって、撮像カメラ231とは異なる方向から貯留ピット26内が撮像されて得られた撮像画像データ100も、撮像時における時刻情報と関連付けされて、撮像カメラ232から通信部22を介して情報処理装置10に送信される。これにより、情報処理装置10においては、撮像カメラ231,232によって互いに異なる方向から貯留ピット26内を撮像して得られた、異なる複数の撮像画像データ100を、時刻情報に基づいて関連付けることが可能となる。すなわち、情報処理装置10においては、複数の異なる撮像カメラ231,232によって撮像され、時刻情報が等しい複数の撮像画像データ100は互いに、同時に撮像された同時刻の撮像画像データ100として処理可能となる。撮像カメラが3台以上であっても同様である。
【0030】
(情報処理装置)
図2は、
図1における情報処理装置10の詳細を示す。
図2に示すように情報処理装置10は、制御部11、記憶部12、通信部13、および入出力部14を備える。制御部11および通信部13はそれぞれ、物理的には上述した制御部21および通信部22と同様である。本実施形態による情報処理装置10は、例えば貯留ピット26内の廃棄物26aを撮像した撮像画像データ100に対して適切な幾何変換を施して見え方のばらつきを軽減した状態でラベリングおよび機械学習を行う情報処理装置として機能する。また、情報処理装置10は、貯留ピット26内の廃棄物の混合状態をラベリングすることによって、混合度を計測可能な学習モデルの教師データとなる入出力データセットを生成する情報処理装置としても機能する。なお、学習モデルは学習済みモデルとも単にモデルとも称される。
【0031】
入出力部14は、例えばタッチパネルディスプレイやスピーカマイクロホンなどから構成することができる。入力手段としての入出力部14は、例えば廃棄物貯留設備20に設置された撮像部23から、通信部22を通じて送信された各種情報を入力して、制御部11に出力するインターフェースを含む。なお、撮像部23から入出力部14への情報の送信は、有線通信を用いても無線通信を用いても良い。また、入出力部14は、キーボードや入力用のボタン、レバーや、液晶などのディスプレイに重畳して設けられる手入力のためのタッチパネル、または音声認識のためのマイクロホンなどの、ユーザインターフェースを含む。作業者などが入出力部14を操作することによって、制御部11に所定の情報を入力可能に構成される。出力手段としての入出力部14は、制御部11による制御に従って、ディスプレイモニタに廃棄物貯留設備20の貯留ピット26内の画像などを表示したり、タッチパネルディスプレイの画面上に文字や図形などを表示したり、スピーカから音声を出力したりする。すなわち、入出力部14は、所定の情報を外部に報知可能に構成される。なお、入出力部14における入力部および出力部を別体に構成しても良い。
【0032】
記憶部12は、RAMなどの揮発性メモリ、ROMなどの不揮発性メモリ、EPROM(Erasable Programmable ROM)、ハードディスクドライブ(HDD、Hard Disk Drive)、およびリムーバブルメディアなどから選ばれた記憶媒体から構成される。なお、リムーバブルメディアは、例えば、USB(Universal Serial Bus)メモリ、または、CD(Compact Disc)、DVD(Digital Versatile Disc)、またはBD(Blu-ray(登録商標) Disc)のようなディスク記録媒体である。また、外部から装着可能なメモリカードなどのコンピュータ読み取り可能な記録媒体を用いて記憶部12を構成しても良い。
【0033】
記憶部12には、情報処理装置10の動作を実行するための、オペレーティングシステム(Operating System:OS)、画像処理アプリケーションなどの各種プログラム、各種テーブル、各種データベースなどを格納可能である。これらの各種プログラムは、ハードディスク、フラッシュメモリ、CD-ROM、DVD-ROM、フレキシブルディスクなどのコンピュータ読み取り可能な記録媒体に記録して広く流通させることも可能である。
【0034】
記憶部12には、画像情報121、座標情報122、アノテーション情報123、および領域抽出モデル124が格納されている。画像情報121、座標情報122、およびアノテーション情報123はいずれも、記憶部12にデータベースとして検索可能に格納されている。領域抽出モデル124は、撮像画像データから所定の領域を抽出する学習モデルである。
【0035】
画像情報121は、貯留ピット26内の廃棄物26aを撮像部23によって撮像して得られた複数の撮像画像データ100(
図3参照)と、廃棄物26aを撮像した時刻に関する時刻情報とを含む。撮像画像データ100には撮像された時刻情報が関連付けされている。座標情報122は、作業者が所定の画像処理アプリケーションと情報処理装置10の入出力部14とを用いて画像情報121の撮像画像データ100に対して行った画像処理に関する各種の操作に基づいて変換や対応付けされた座標の情報を含む。アノテーション情報123は、上述のように得られた画像情報121に含まれる撮像画像データ100に対してアノテーション処理が施されたアノテーションデータ(図示せず)を含む。
【0036】
制御部11は、記憶部12に記憶されたプログラムを主記憶部の作業領域にロードして実行し、プログラムの実行を通じて各構成部などを制御することによって、所定の目的に合致した機能を実現できる。具体的に制御部11は、記憶部12からロードした各種プログラムの実行によって、画像処理部111、アノテーション処理部112、および学習部113の機能を実行可能である。また、各種プログラムには、本実施形態による処理を実現可能な人工知能や学習済みモデルを実現するプログラムも含まれる。制御部11による処理の詳細については、後述する。
【0037】
(情報処理方法)
次に、以上のように構成された本実施形態による情報処理装置10が実行する情報処理方法について説明する。なお、以下の説明において、それぞれの構成要素間での情報の送受信は、通信部13,22およびネットワーク2を介して行われるが、この点についての都度の説明は省略する。
【0038】
図4は、本実施形態による情報処理方法による貯留ピット26内の廃棄物26aの撮像方法を説明するための図である。
図4に示すように、本実施形態による対象施設としての貯留ピット26の内部を複数の撮像カメラ231,232によって撮像する場合、これらの撮像カメラ231,232は、可能な限り広範囲の廃棄物26aを撮像可能な位置に設置することが好ましいが、限定されない。なお、複数の撮像カメラ231,232の設置位置は、貯留ピット26の形状や寸法に応じて適宜変更可能である。
【0039】
図4に示すように、貯留ピット26内に廃棄物26aが貯留されている。
図4に示す例においては、一方の撮像カメラ231が貯留ピット26の4隅のうちの1つの隅に設けられ、撮像カメラ231によって所定の一方向から、すなわち所定の一視点から貯留ピット26内に貯留された廃棄物26aの少なくとも表層を撮像可能である。撮像カメラ231によって貯留ピット26内の廃棄物26aを撮像することによって、撮像カメラ231が撮像画像データ141を生成して情報処理装置10に送信する。同様に、他方の撮像カメラ232が貯留ピット26の4隅のうちの撮像カメラ231とは異なる1つの隅に設けられ、撮像カメラ232によって所定の一方向とは異なる他方向から、すなわち上述した一視点とは異なる他視点から貯留ピット26内に貯留された廃棄物26aの少なくとも表層を撮像可能である。撮像カメラ232によって貯留ピット26内の廃棄物26aを撮像することによって、撮像カメラ232が撮像画像データ142を生成して情報処理装置10に送信する。
【0040】
貯留ピット26内を撮像して得られた撮像画像データ141,142には、時刻情報が関連付けされているとともに、貯留ピット26に貯留された廃棄物26aや貯留ピット26の内壁26bなどが撮像された情報として含まれる。なお、
図4において図示省略したが、廃棄物26aを把持したり放下したりするクレーン251やバケット252なども撮像される場合がある。
【0041】
(変換処理方法)
次に、本実施形態による情報処理装置10によって実行されるアノテーション方法の一部としての撮像画像データ100に対する変換処理方法について説明する。
図5は、本実施形態による情報処理装置10が実行する変換処理方法を説明するためのフローチャートである。
図6Aおよび
図6Bはそれぞれ、本実施形態における撮像画像データ100に含まれる貯留ピットの底面および底面を平行移動させた状態の例を示す図である。
図7は、撮像画像データ100に対して対象物領域と非抽出領域とで2値化した2値化画像データ101の例を示す図である。
図8A、
図8B、および
図8Cはそれぞれ、2値化画像データ101に対する投影面の取得方法を説明するための評価指標ごとの2値化画像データを示す図である。
図9は、本実施形態における2値化画像データ101において設定された投影面の底面からの高さを説明するための図である。
【0042】
(内側形状設定処理)
図5に示すように、ステップST1において情報処理装置10の制御部11における画像処理部111は、撮像カメラ231,232から貯留ピット26内を撮像して得られた、例えば
図3に示すような撮像画像データ100を取得する。画像処理部111は、取得した撮像画像データ100に対して、貯留ピット26の形状を設定する。なお、貯留ピット26の内面の形状は、通常において直方体形状であるが、円筒形状や楕円筒形状や正方体形状であっても良く、少なくとも底面を規定可能な形状であれば、種々の形状を設定できる。また、底面は平面状であることが望ましいが、必ずしも平面状でなくても良い。撮像カメラ231,232は所定の位置に固定され、撮像カメラ231,232の画角なども固定されている場合、撮像カメラ231,232と貯留ピット26の内面との相対的な位置は固定される。そのため、画像処理部111は、撮像カメラ231,232によって撮像された撮像画像データ100において、対象物としての廃棄物26aが存在していない状態における貯留ピット26の内面の座標情報に基づいて撮像画像データ100の内面を設定できる。
【0043】
すなわち、画像処理部111は、記憶部12から座標情報122として、貯留ピット26内の内周面である内壁26bおよび底面100aの各位置の座標、および撮像カメラ231,232の設置位置の座標を取得する。次に、
図6Aに示すように、取得した貯留ピット26内の各位置の座標と撮像カメラ231,232の設置位置の座標に基づいて、撮像画像データ100内の底面100aおよび移動線100b,100cを設定する。ここで、画像処理部111は、貯留ピット26の底面100aに対して垂直な高さ方向に沿って移動線100b,100cを設定する。これにより、貯留ピット26の底面100aが矩形状である場合、底面100aに対して垂直な高さ方向に沿って、矩形の4頂点に対応した4本の移動線を仮想的に設定できる。なお、貯留ピット26の底面100aとしては、矩形状に限定されず、円形状、楕円形状、閉曲線状、多角形状などの形状の領域を設定可能である。
【0044】
図6Aに示す撮像画像データ100においては、撮像カメラ231,232に対向した2隅に移動線100b,100cが設定され、撮像カメラ231,232の設置側、すなわち撮像画像データ100においては手前側に仮想的な移動線(図示せず)が設定される。すなわち、撮像画像データ100においては、貯留ピット26の内部の全てが撮像されていないが、画像処理部111は、撮像されていない位置における仮想的な移動線を設定する。なお、移動線の設定方法としては、種々の設定方法を採用することができ、上述した方法に限定されない。
【0045】
以上により、画像処理部111は、廃棄物26aが貯留されていない状態の貯留ピット26の内面の形状を設定できる。換言すると、画像処理部111は、撮像画像データ100内において、廃棄物26aによって隠された状態の底面100aの位置を確定して固定できる。さらに、
図6Bに示すように、画像処理部111は、底面100aに平行な平行面100dを設定する。平行面100dは、上述のように設定された底面100aに対して平行であって、移動線100b,100cに沿って仮想的に平行移動可能な面である。また、平行面100dは、貯留ピット26の底面100aに対して平行な仮想面として撮像画像データ100に重畳した状態で設定される。なお、底面100aが平面でない場合、平行面100dは、重力に対して垂直な平面として設定または規定することが可能である。この場合、移動線100b,100cは重力方向に略平行に設定可能である。この場合においても、平行面100dは、重力に対して直交する仮想平面として移動線100b,100cに対して直交した平面として撮像画像データ100に重畳した状態で設定される。また、以上の垂直、直交、および平行は、撮像画像データ100に撮像された状態を現実の貯留ピット26に適用した場合の線や面の関係であり、撮像画像データ100内における垂直、直交、および平行とは限定されない。
【0046】
(対象物領域抽出処理)
次に、ステップST2に移行すると、制御部11のアノテーション処理部112は、対象物である廃棄物26aの存在領域(以下、対象物領域)と、対象物領域以外の領域(以下、非抽出領域)との境界を判断して、撮像画像データ100において対象物領域を識別する(識別ステップ)。具体的にまず、アノテーション処理部112は、記憶部12から領域抽出モデル124を読み出す。アノテーション処理部112は、読み出した領域抽出モデル124に対して、入力パラメータとして撮像画像データ100を入力する。領域抽出モデル124は、機械学習または特徴量分類によって撮像画像データ100における対象物領域と非抽出領域とを分類可能なモデルである。なお、機械学習によって生成された領域抽出モデル124以外にも、周波数特性に基づいて、廃棄物26aの対象物領域と非抽出領域とを分類することも可能である。
【0047】
領域抽出モデル124は、出力パラメータとして、
図7に示すように、対象物領域と対象物領域以外の領域とを区別した2値化画像データ101を出力する。2値化画像データ101は、対象物領域101a(
図7中、白抜き領域)と非抽出領域101b(
図7中、ハッチング領域)とで2値化された画像データである。アノテーション処理部112は、2値化画像データ101を画像情報121として記憶部12に格納する。本実施形態において2値化画像データ101の対象物領域101aは廃棄物26aの存在領域であり、非抽出領域101bは貯留ピット26の内壁26bの存在領域である。ここで、撮像画像データ100において対象物が廃棄物26aであり、対象物以外の非抽出領域が内壁26bである場合、廃棄物26aの存在領域と内壁26bの領域とは、撮像画像データ100内において特徴が大きく異なるため見え方も大きく異なる。そのため、アノテーション処理部112による撮像画像データ100からの対象物領域101aの分類を高精度で容易に行うことが可能である。
【0048】
(投影面取得処理)
次に、ステップST3に移行して画像処理部111は、記憶部12から画像情報121として2値化画像データ101を読み出す。画像処理部111は、
図6Bに示す平行面100dに基づいて、2値化画像データ101に対して投影面の取得を実行する。画像処理部111は、対象物領域101aと非抽出領域101bとの画素数に基づいて、幾何変換処理のための投影面101dを取得する。すなわち、画像処理部111は設定した平行面100dを2値化画像データ101に重畳するように適用させて、
図8Aに示す投影面101dを設定する。次に、画像処理部111は例えば、
図8A~
図8Cに示すように、投影面101dを少しずつ上下方向に移動させ、対象物領域101aの画素数に基づいて以下の(1)式から評価指標を導出する。分母の投影面101dの画素数は、2値化画像データ101における画素数に相当し正規化を行うためである。
【0049】
評価指標P=(投影面内の対象物領域画素数-投影面外の対象物領域画素数×λ)
/投影面全体の画素数 ……(1)
なお、λは投影面101dの範囲外となる対象物領域101aの重み付け係数(λ>0)である。また、重み付け係数λは投影面101dの範囲外に存在する対象物領域101aに対するペナルティとなるため、貯留ピット26内の廃棄物26aの堆積状態などに応じて静的に変更したり動的に変更したりすることが可能である。さらに、評価指標の式としては(1)式に限定されず、その他の評価指標を採用することも可能である。
【0050】
具体的に、以下において重み付け係数λを1として評価指標を検討する。
図8Aに示す2値化画像データ101Aにおいて投影面101dに含まれる対象物領域101aの画素数が例えば100画素であり、投影面101dの外側の対象物領域101aの画素数が例えば30画素であるとする。この場合、投影面101dの内側は全て対象物領域101aであるため、(1)式から評価指標Pは((100-30×λ)/100=)0.7となる。
【0051】
また、
図8Bに示す2値化画像データ101Bにおいて投影面101dに含まれる対象物領域101aの画素数が例えば120画素であり、投影面101dの外側の対象物領域101aの画素数が例えば10画素であるとする。また、投影面101dの内側の画素数は、
図8Aに示す2値化画像データ101Aに比して増加しており、例えば115画素程度であるとする。この場合、(1)式から評価指標は((120-10×λ)/115≒)0.9となる。
【0052】
また、
図8Cに示す2値化画像データ101Cにおいて投影面101dに含まれる対象物領域101aの画素数が例えば130画素であり、投影面101dの外側の対象物領域101aの画素数が例えば0画素であるとする。また、投影面101dの内側の画素数は、
図8Bに比してさらに増加して例えば160程度であるとする。この場合、(1)式から評価指標は((130-0×λ)/160≒)0.8となる。
【0053】
以上のようにして、画像処理部111が評価指標を導出し、評価指標が例えば最も高い投影面101dを選択して、
図9に示す選択投影面101hに設定する(選択ステップ)。この場合、画像処理部111は、選択投影面101hとして、評価指標があらかじめ設定された所定条件を満たす投影面101dを選択することが望ましい。本実施形態において所定条件は、評価指標が最も高い条件である。この場合、上述した
図8A~
図8Cにおいては、
図8Bに示す投影面101dを選択することが望ましい。なお、画像処理部111は、評価指標Pが最も低い投影面101dを選択して選択投影面101hに設定したり、評価指標Pの所定値との差または所定値との差の絶対値が最も小さい投影面101dを選択して選択投影面101hに設定したりすることも可能である。画像処理部111は、
図9に示す選択投影面101hの高さの情報(以下、レベル情報)を記憶部12の座標情報122として格納する。
【0054】
次に、ステップST4に移行して画像処理部111は、記憶部12の座標情報122から選択投影面101hのレベル情報を読み出す。次に、画像処理部111は、撮像画像データ100を選択投影面101hに対して投影する所定の画像変換処理、例えばアフィン変換処理を施す。
図10Aおよび
図10Bはそれぞれ、撮像カメラ231,232によって撮像された撮像画像データ141,142、およびこれらの撮像画像データ141,142に対して画像処理部111によってアフィン変換を施した後の変換画像データ141S,142Sを示す。
【0055】
すなわち、画像処理部111は、撮像カメラ231,232によって撮像された撮像画像データ141,142に対して2値化処理を行う。画像処理部111は、対象物領域101aと非抽出領域101bとを識別し、対象物領域101aの評価指標が最高値になる選択投影面101hを設定する。画像処理部111は、例えば
図10Aの左側の撮像画像データ141に対して選択投影面101hへの画像変換処理を行うことにより、右側の変換画像データ141Sを生成する。変換画像データ141Sは、撮像画像データ141を、貯留ピット26の底面(底面100a)に平行な面に投影して出力された画像データである。換言すると、変換画像データ141Sは、貯留ピット26内の廃棄物26aを斜めから撮像した撮像画像データ141に対して、底面100aに平行な選択投影面101h、すなわち重力方向に直交する平面に投影させた状態を撮像したような状態に変換した画像データである。
【0056】
同様に、
図10Bに示すように、撮像カメラ232によって撮像された撮像画像データ142(
図10B左側)は、画像処理部111による画像変換処理によって選択投影面101hへの画像変換処理が実行される(変換ステップ)。これにより、画像処理部111は、左側の撮像画像データ142から右側の変換画像データ142Sを生成する。なお、撮像画像データ141,142において選択投影面101hの設定は、互いに独立して実行しても良く、撮像画像データ141,142における選択投影面101hの底面100aからの高さHの平均を共通の選択投影面101hとして設定しても良い。複数の撮像画像データ間における選択投影面101hの設定は、互いに関連させても互いに独立させても良い。また、複数、例えば2つの撮像画像データ141,142のうちの1つの撮像画像データ、例えば撮像画像データ141に対して設定した選択投影面101hを、残部の撮像画像データ、例えば撮像画像データ142に対する選択投影面101hに設定しても良い。本実施形態において変換画像データ141Sは、撮像画像データ141を、設定された選択投影面101hに投影させた状態で出力することによって、貯留ピット26の底面(底面100a)に平行な面に投影するように出力された画像データである。換言すると、変換画像データ141Sは、貯留ピット26内の廃棄物26aを斜めから撮像した撮像画像データ141に対して、重力方向に直交する平面である選択投影面101hに投影させた状態を撮像したように変換させた画像データである。画像処理部111により生成された変換画像データ141S,142Sは、記憶部12に画像情報121として格納される。これらの変換画像データ141S,142Sは、少なくとも学習に必要な数量だけ生成されて記憶部12に画像情報121として蓄積される。
【0057】
次に、ステップST5、ST6に移行する。なお、以下に説明するステップST5,ST6は並行して実行しても良く、逆順に実行しても良く、実行の順序は問わない。
【0058】
まず、ステップST5においては、変換画像データ141S,142Sに対してアノテーション処理が実行されて、画像処理が施される。
図11Aは、複数の撮像カメラ231,232から取得される撮像画像データ141,142において所定位置を選択した状態を示し、
図11Bは、それぞれの変換画像データ141S,142Sにおいて選択された処置位置の対応箇所を示す。
【0059】
ステップST5においてはまず、変換画像データ141S,142Sに対してアノテーション処理が実行される。すなわち、貯留ピット26内に貯留された廃棄物26aは種々の物体から構成され、廃棄物26aの攪拌状態や混合状態としては種々の状態が考えられる。本実施形態において作業者は、
図11Aに示すように、異なる位置に設定された撮像カメラ231,232によって、同じ廃棄物26aを異なる撮像方向から同時刻に撮像した時刻情報が等しい複数の撮像画像データを取得する。その後、上述したステップST2~ST4を実行することによって、
図11Bに示す変換画像データ141S,142Sを取得する。作業者は、2つの変換画像データ141S,142Sに対してアノテーション処理を行う。なお、情報処理装置10において2つの変換画像データ141S,142Sを入出力部14に同時に出力表示させても別々に出力表示させても良い。
【0060】
作業者は、入出力部14に出力表示される変換画像データ141S,142Sを目視で確認することによって、貯留ピット26内の廃棄物26aを確認する。アノテーション処理において作業者は、所定の画像処理装置、本実施形態においては情報処理装置10を用いて入出力部14に表示された変換画像データ141S,142Sに対して、作業者の経験や知識などに基づいて変換画像データ141S,142Sに撮像された対象物の状態、ここでは廃棄物26aの混合状態を目視によって評価する。なお、混合度の評価は、混合度の判別や判断とも言う。
【0061】
作業者は、情報処理装置10の入出力部14を用いて評価を行う変換画像データ141Sのうちの評価を行う領域を選択する。これにより、制御部11の画像処理部111は、選択された領域を画像パッチA1として設定する。さらに作業者は、変換画像データ141Sの画像パッチA1に対応する変換画像データ142Sの画像パッチA2を選択する。なお、アノテーション処理部112が座標情報122に基づいて一方の変換画像データ141Sの画像パッチA1に対する変換画像データ142Sの対応位置を選択するようにしても良い。なお、座標情報122を用いた対応位置のマップの生成方法の詳細は後述する。
【0062】
作業者は、変換画像データ141S,142Sに表示されたそれぞれの画像パッチA1,A2に対して、評価に基づいて決定されたラベルを設定する。ここで、貯留ピット26に貯留された複数の物体が混合された混合物である廃棄物26aの混合状態に対してラベルを設定する場合、例えば、高混合領域、中混合領域、および低混合領域、ならびに壁領域および袋ゴミ領域などがそれぞれ、互いに区別可能な所定のラベルとしてあらかじめ設定されている。
【0063】
具体的に例えば、作業者が入出力部14を用いて、変換画像データ141Sの画像パッチA1に対して所定のラベルを設定する情報を入力する。この場合、制御部11のアノテーション処理部112は、入力された情報に基づいて、入出力部14に表示された変換画像データ141Sのうちの画像パッチA1に対して、所定のラベルを設定する。これにより、
図11Bに示す変換画像データ141Sにおける廃棄物26aの画像に対してアノテーション処理が実行されて、廃棄物26aの場所ごと、すなわち選択された画像パッチA1ごとに所定のラベルが設定される。なお、画像処理部111は、入力されて設定されたラベルを、変換画像データ141Sの画像パッチA1に重畳表示させても良い。
【0064】
(対応マップの生成方法)
また、ステップST6において複数の変換画像データ間の対応関係を導出する。ここで、位置の対応に関する対応マップの生成方法について説明する。
図11Aおよび
図11Bに示すように、情報処理装置10の制御部11における画像処理部111は、複数の撮像カメラ231,232によって撮像された複数の撮像画像データを画像情報121として記憶部12に格納する(記憶ステップ)。画像処理部111は、撮像画像データ141,142から変換画像データ141S,142Sを生成する。
【0065】
次に、作業者が入出力部14の表示画面に表示された変換画像データ141S,142Sに対して、貯留ピット26内の廃棄物26aの任意の部分における混合度を評価する。作業者は例えば、入出力部14を用いて、変換画像データ141S,142Sの一方を選択する。続いて作業者は、撮像画像データ141に対してアノテーション処理におけるラベルを設定する画像パッチA1を選択する。画像処理部111は選択された画像パッチA1を撮像画像データ141に対して設定した後に記憶部12に画像情報121として格納する(注目領域設定ステップ)。
【0066】
続いて、アノテーション処理部112は、記憶部12から画像パッチA1の座標範囲を座標情報122として読み出す。ここで、座標情報122における画像パッチA1の座標範囲としては、画像パッチA1の所定の頂点を指定して、「A1(x11,y11)」として読み出すことも、画像パッチA1の矩形範囲として、「A1(x11~x12,y11~y12)」として読み出すことも、「A1(x11,y11)~(x12,y12)」として読み出すことも可能である。本実施形態においては、例えば注目領域の所定の頂点をA1(x11,y11)として指定する。
【0067】
作業者は、入出力部14を用いて、画像パッチA1(x11,y11)に対して混合度を評価内容に基づいたラベルの設定、すなわちラベリングを行う。画像パッチA1に対して設定されたラベルは、画像パッチA1の座標情報122に関連付けされて、記憶部12にアノテーション情報123として格納される(ラベリングステップ)。
【0068】
また、
図11Bに示すように、作業者は、変換画像データ141S,142Sのうちから選択しなかった他方の変換画像データ142Sに対して、変換画像データ141Sにおける画像パッチA1に対応する画像パッチA2を選択する。変換画像データ141S,142Sのうちの一方の変換画像データ141Sにおいて画像パッチA1を選択すると、他方の変換画像データ141Sにおいて対応する画像パッチA2が存在する場合が多い。
【0069】
そこで、作業者は入出力部14を用いて、一方の変換画像データ141Sにおける画像パッチA1に対応する変換画像データ142Sにおける領域を画像パッチA2として選択して設定する。変換画像データ142Sにおいて選択された画像パッチA2は、撮像画像データ141における画像パッチA1と、貯留ピット26内において略同位置および略同領域を示すことになる。画像処理部111は、選択された画像パッチA2の座標(x21,y21)を、画像パッチA1(x11,y11)と関連付けて座標情報122として記憶部12に格納する(対応領域設定ステップ)。
【0070】
また、アノテーション処理部112は、画像パッチA2に対して、画像パッチA1に設定されたラベルと同じラベルを設定する。これにより、一方の変換画像データ141Sの一部の画像パッチA1に対するアノテーション処理を、他方の変換画像データ142Sに対して実行することが可能となる。反対に、画像パッチA2(x21,y21)を選択することで、画像パッチA1(x11,y11)を抽出することも可能となる。ここで、対となる変換画像データ141S,142Sはいずれも、貯留ピット26の上方から俯瞰した状態として表示されているため、廃棄物26aの状態をより高精度に評価可能になる。したがって、アノテーション処理の精度を向上できる。
【0071】
また、画像パッチA1と画像パッチA2との対応については、上述した方法以外にも種々の方法を採用可能である。すなわち、あらかじめ座標情報122として、貯留ピット26の上面視の座標(x,y)を記憶部12に格納しておくことも可能である。この場合、画像処理部111は、撮像カメラ231,232の設置位置の座標情報122、例えば貯留ピット26の4隅のうちの2隅の座標情報122に基づいて、画像変換処理が施された後の変換画像データ141S,142S内の任意の位置を、貯留ピット26の上面視の座標(x,y)に対応可能となる。これにより、画像処理部111は、変換画像データ141Sにおける画像パッチA1(x11,y11)を、貯留ピット26における座標(x1,y1)に対応させる一方、対応した貯留ピット26における座標(x1,y1)を画像パッチA2(x21,y21)に対応させることができる。そのため、画像処理部111は、画像パッチA1から貯留ピット26における座標を経由して、画像パッチA2を決定でき、画像パッチA1と画像パッチA2との対応関係をマッチングによって導出できる。これにより、画像処理部111は、対応マップを生成できる(対応マップ生成ステップ)。ここで、マッチングによって画像パッチA1と画像パッチA2との間にズレが生じる場合も考えられる。この場合、作業者が入出力部14から画像パッチA2の位置を画像パッチA1の位置に対応する位置に移動させて補正を行うことによって、画像パッチA1と画像パッチA2との対応した位置情報の精度をより高精度化でき、対応マップをより正確に生成できる。したがって、アノテーション処理をより一層正確に実行できる。
【0072】
また、貯留ピット26内の廃棄物26aの表層を、例えば3D-LiDAR(3 Dimension Laser Imaging Detection and Ranging)などの測距センサ(図示せず)を用いて計測可能な場合がある。この場合、測距センサによって得られた例えば点群データなどのデータを、貯留ピット26内の廃棄物26aの位置情報と関連付けることによって、画像パッチA1と画像パッチA2とを対応させて対応関係を導出し、対応マップを生成することも可能である。さらに、上述した画像パッチA1および画像パッチA2は例えば長方形または正方形の領域としているが、その他の形状の領域を適宜設定可能である。具体的に例えば、画像パッチA1および画像パッチA2はいずれも、この場合、画像パッチA1と画像パッチA2との形状は互いに相似であることが好ましい。
【0073】
(混合度評価学習モデル)
その後、ステップST2~ST4によって変換された変換画像データ141S,142Sにおいて生成され、アノテーション処理が行われた変換画像データ141S,142Sを用いた機械学習の方法について説明する。すなわち、
図2に示す情報処理装置10の制御部11の学習部113は、教師データとして、上述のようにラベリングされた変換画像データ141S,142Sを含むアノテーション情報123を用いて機械学習を行う。
【0074】
学習手段としての学習部113は、記憶部12の画像情報121からあらかじめ取得して幾何変換処理が施された変換画像データ141S,142Sを学習用入力パラメータとし、アノテーション情報123からアノテーション処理によって廃棄物26aの混合度がラベリングされた変換画像データ141S,142Sを取得して学習用出力パラメータとした入出力データセットによる教師あり学習などの機械学習により、混合度を評価する学習モデルを生成する。なお、機械学習は、例えば、ニューラルネットワークを用いた深層学習(ディープラーニング)などの種々の機械学習を採用でき、ミニバッチ学習などによって行うことができる。以上により、本実施形態による情報処理が終了する。
【0075】
このような、複数の貯留ピット26における複数の撮像画像データ141,142を用いてアノテーション処理を行うことにより、高精度なラベルの付与を行うことが可能になるので、機械学習の精度を向上させることができる。
【0076】
以上説明した一実施形態によれば、複数の貯留ピット26の撮像画像データ141,142に対して幾何変換処理を実行することにより、作業者によるラベリングを高精度に実行可能となるので、学習モデルを生成するための機械学習の精度を向上できる。また、変換画像データ141S,142Sが貯留ピット26を上方から俯瞰した画像データとすることができるので、複数の変換画像データ141S,142S間で座標変換可能な対応マップを容易に生成できる。これにより、実際の廃棄物26aの混合度の評価や判定においても、撮像画像データ141,142に対して幾何変換処理を施して変換画像データ141S,142Sとして、これらの変換画像データ141S,142Sを入力パラメータとして学習済みモデルに入力し、混合度の評価値を出力パラメータとして出力することによって、貯留ピット26内の廃棄物26aの混合度をより高精度に判定することが可能となる。また、対応マップに基づいて、一部の変換画像データ141Sに対するラベリングを他の変換画像データ142Sに自動で反映させることができ、複数の撮像画像データの対に対するアノテーション処理の作業負荷を低減できる。
【0077】
以上、本発明の一実施形態について具体的に説明したが、本発明は、上述の一実施形態に限定されるものではなく、本発明の技術的思想に基づく各種の変形が可能である。例えば、上述の一実施形態において挙げた数値はあくまでも例に過ぎず、必要に応じてこれと異なる数値を用いても良く、本実施形態による本発明の開示の一部をなす記述および図面により本発明は限定されることはない。
【0078】
例えば、上述した実施形態においては、貯留ピット26内に貯留された廃棄物26aを撮像画像データ141,142の対象物としているが、例えば所定の会場などに集合した人間の数や会場の混雑度などを撮像した撮像画像データを採用しても良い。この場合、学習モデルとしては、混雑度の評価を行う学習モデルを生成するための入出力データセットを生成することが可能となる。
【0079】
また、一実施形態においては、上述してきた「部」を、「回路」などに読み替えることができる。例えば、制御部は、制御回路に読み替えることができる。
【0080】
さらなる効果や変形例は、当業者によって容易に導き出すことができる。本開示のより広範な態様は、以上のように表しかつ記述した特定の詳細および代表的な実施形態に限定されるものではない。したがって、添付のクレームおよびその均等物によって定義される総括的な発明の概念の精神または範囲から逸脱することなく、様々な変更が可能である。
【符号の説明】
【0081】
1 アノテーションデータ生成システム
2 ネットワーク
3 廃棄物処理施設
10 情報処理装置
11,21 制御部
12 記憶部
13,22 通信部
14 入出力部
20 廃棄物貯留設備
23 撮像部
25 把持部
26 貯留ピット
26a 廃棄物
26b 内壁
30 廃棄物焼却設備
31 燃焼制御装置
32 センサ部
33 焼却炉
100,141,142 撮像画像データ
100a 底面
100b,100c 移動線
100d 平行面
101a 対象物領域
101b 非抽出領域
101d 投影面
101h 選択投影面
111 画像処理部
112 アノテーション処理部
113 学習部
121 画像情報
122 座標情報
123 アノテーション情報
124 領域抽出モデル
141S,142S 変換画像データ
231,232 撮像カメラ
251 クレーン
252 バケット