IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日立アプライアンス株式会社の特許一覧

特開2024-157387画像選定装置、画像選定方法及び収納庫システム
<>
  • 特開-画像選定装置、画像選定方法及び収納庫システム 図1
  • 特開-画像選定装置、画像選定方法及び収納庫システム 図2
  • 特開-画像選定装置、画像選定方法及び収納庫システム 図3
  • 特開-画像選定装置、画像選定方法及び収納庫システム 図4
  • 特開-画像選定装置、画像選定方法及び収納庫システム 図5
  • 特開-画像選定装置、画像選定方法及び収納庫システム 図6
  • 特開-画像選定装置、画像選定方法及び収納庫システム 図7
  • 特開-画像選定装置、画像選定方法及び収納庫システム 図8
  • 特開-画像選定装置、画像選定方法及び収納庫システム 図9
  • 特開-画像選定装置、画像選定方法及び収納庫システム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024157387
(43)【公開日】2024-11-07
(54)【発明の名称】画像選定装置、画像選定方法及び収納庫システム
(51)【国際特許分類】
   G06T 7/00 20170101AFI20241030BHJP
【FI】
G06T7/00 350B
【審査請求】未請求
【請求項の数】15
【出願形態】OL
(21)【出願番号】P 2023071723
(22)【出願日】2023-04-25
(71)【出願人】
【識別番号】399048917
【氏名又は名称】日立グローバルライフソリューションズ株式会社
(74)【代理人】
【識別番号】110001807
【氏名又は名称】弁理士法人磯野国際特許商標事務所
(72)【発明者】
【氏名】林 大介
(72)【発明者】
【氏名】樋口 晴彦
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA02
5L096AA06
5L096CA02
5L096DA02
5L096FA59
5L096FA77
5L096GA51
5L096KA04
(57)【要約】
【課題】認識結果の精度を向上するために、学習データを効率的に選定する。
【解決手段】
本発明の画像選定装置は、品目を撮影した画像の認識精度を出力する認識推論処理部と、複数の画像から認識精度が所定の基準を満たす程度に低い低精度品目を選定し、前記低精度品目を含む画像のうち、前記低精度品目の認識精度が所定の基準を満たす程度に低い低精度画像を選定する画像選定部と、を備えること、を特徴とする。
【選択図】図7
【特許請求の範囲】
【請求項1】
品目を撮影した画像の認識精度を出力する認識推論処理部と、
複数の画像から認識精度が所定の基準を満たす程度に低い低精度品目を選定し、前記低精度品目を含む画像のうち、前記低精度品目の認識精度が所定の基準を満たす程度に低い低精度画像を選定する画像選定部と、
を備えること、
を特徴とする画像選定装置。
【請求項2】
前記選定した低精度画像を、モデルを学習するための学習データセットに追加するデータセット更新部を備えること、
を特徴とする請求項1に記載の画像選定装置。
【請求項3】
前記学習データセットを使用して、前記モデルを学習するモデル学習部を備えること、
を特徴とする請求項2に記載の画像選定装置。
【請求項4】
前記画像選定部は、
前記モデルが前記品目を認識した結果が、所定の認識精度を満たすまで、前記低精度画像を選定する処理を繰り返すこと、
を特徴する請求項2に記載の画像選定装置。
【請求項5】
前記画像選定部は、
学習が行われた前記モデルが前記品目を認識した結果が、所定の認識精度を満たした場合、前記選別した低精度画像を任意の装置に表示すること、
を特徴とする請求項4に記載の画像選定装置。
【請求項6】
前記画像の質を示す検知対象情報を取得する検知対象情報処理部と、
前記検知対象情報に基づき、追加学習重要度を出力する重要度指標出力部と、
を備えること、
を特徴とする請求項1に記載の画像選定装置。
【請求項7】
前記検知対象情報処理部は、
前記画像の検知枠のうち過剰なものを、前記検知対象情報の1つである重複割合情報として検出すること、
を特徴とする請求項6に記載の画像選定装置。
【請求項8】
前記検知対象情報処理部は、
合体している検知枠又は暗部にある検知枠を、前記検知対象情報の1つである色彩情報として検出すること、
を特徴とする請求項6に記載の画像選定装置。
【請求項9】
前記検知対象情報処理部は、
品目の一部のみが写っている検知枠を、前記検知対象情報の1つである面積情報として検出すること、
を特徴とする請求項6に記載の画像選定装置。
【請求項10】
前記検知対象情報処理部は、
事前に学習していない特徴量である品目の検知枠を、前記検知対象情報の1つである特徴量距離情報として検出すること、
を特徴とする請求項6に記載の画像選定装置。
【請求項11】
前記検知対象情報処理部は、
ブレ画像の検知枠を、前記検知対象情報の1つである精細度情報として検出すること、
を特徴とする請求項6に記載の画像選定装置。
【請求項12】
前記検知対象情報処理部は、
収納庫本体が写っている検知枠を、前記検知対象情報の1つである本体情報として検出すること、
を特徴とする請求項6に記載の画像選定装置。
【請求項13】
前記画像選定部は、
前記選定した低精度画像に含まれる低精度品目情報を取得し、
前記画像選定装置は、
前記低精度品目情報に基づき追加学習重要度を出力する重要度指標出力部を備えること、
を特徴とする請求項1に記載の画像選定装置。
【請求項14】
画像選定装置の認識推論処理部は、
品目を撮影した画像の認識精度を出力し、
前記画像選定装置の画像選定部は、
複数の画像から認識精度が所定の基準を満たす程度に低い低精度品目を選定し、前記低精度品目を含む画像のうち、前記低精度品目の認識精度が所定の基準を満たす程度に低い低精度画像を選定すること、
を特徴とする画像選定方法。
【請求項15】
品目を撮影した画像の認識精度を出力する認識推論処理部と、
複数の画像から認識精度が所定の基準を満たす程度に低い低精度品目を選定し、前記低精度品目を含む画像のうち、前記低精度品目の認識精度が所定の基準を満たす程度に低い低品質画像を選定する画像選定部と、
を備える画像選定装置と、
前記品目に係る物品を収納する収納庫と、
を備えること、
を特徴とする収納庫システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像選定装置、画像選定方法及び収納庫システムに関する。
【背景技術】
【0002】
近時、内部にどのような食材が保管されているかを自動的に推論する冷蔵庫が普及し始めている。
特許文献1においては、同じ冷蔵庫を使用する複数のユーザのそれぞれが、食材ごとに特徴量情報を記憶した端末装置を操作し、ある端末装置が食材の種類を認識できない場合、他の端末装置に食材の種類の認識を依頼する。このことによって、ある端末装置ではある食材の種類を認識できない場合も、他の端末装置は、当該食材の種類を認識できる。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2021-196636号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
一般に、食材の種類を推論するには、食材を撮影した多量の画像を学習データとして使用し、画像を入力とし食材の種類を出力とするモデルを機械学習しなければならない。認識の精度は、学習データの数と質に大きく左右される。認識結果の向上に真に資する学習データを選定することが重要である。
しかしながら、特許文献1は、認識結果の精度を向上するために、学習データを選定することについては言及していない。
【課題を解決するための手段】
【0005】
本発明の画像選定装置は、品目を撮影した画像の認識精度を出力する認識推論処理部と、複数の画像から認識精度が所定の基準を満たす程度に低い低精度品目を選定し、前記低精度品目を含む画像のうち、前記低精度品目の認識精度が所定の基準を満たす程度に低い低精度画像を選定する画像選定部と、を備えること、を特徴とする。
【図面の簡単な説明】
【0006】
図1】冷蔵庫及び画像選定装置の構成等を説明する図である。
図2】平均認識精度リストの例である。
図3】画像選定部の処理の全体像を示す図である。
図4】低精度画像自動選定処理を説明する図である。
図5】低精度品目数及び追加学習重要度の関係を示す図である。
図6】検知対象情報処理部の詳細を説明する図である。
図7】画像選定処理手順のフローチャートである。
図8図7に低精度品目情報の取得及び追加学習重要度の出力を追加したフローチャートである。
図9図8に検知対象情報の取得を追加したフローチャートである。
図10】携帯端末の構成等を説明する図である。
【発明を実施するための形態】
【0007】
以下、本発明を実施するための形態(実施形態という)を説明する。
(モデルの精度と学習データの質)
あるモデルは、食材が撮影された画像を入力とし、その食材の種類(卵、豆腐、牛乳、納豆、・・・)を出力とする。このモデルは、例えば、入力層、複数の中間層及び出力層を有するニューラルネットワークである。各層のノードには、次の層のどのノードにどれだけの情報を伝えるかという伝搬パラメータが設定される。この伝播パラメータが無作為的な初期値である場合、モデルが真の食材の種類を出力する可能性は低い。
【0008】
そこで、学習データを使用して、モデルの伝播パラメータを機械学習(最適化)することが一般的に行われる。ここでの学習データは、1以上の食材が写り込んだ膨大な数の画像の集合であり、その1つ1つに人間の目で検証した“ラベル”(正解)が付された“教師付き学習データ”である。
【0009】
以降では、図面に基づいて、本実施形態を説明する。本実施形態は、冷蔵庫内に保管された食材の種類を認識する例である。しかしながら、本発明は、より一般的に、常温保管庫、温蔵庫、冷蔵庫等を含む収納庫に適用可能である。本実施形態の食材は、より広義の物品の代表例である。食材は、素材でもよいし、調理済の食品又は調味料でもよい。
【0010】
本実施形態は、カメラが食材の画像を撮影する例を説明する。但し、重量センサ、マイコトキシン(カビ)検出センサ、ICタグ読み取り機、文字読み取り機等が、カメラに代替して又は追加して使用されてもよい。
【0011】
本実施形態では、認識推論処理部が、貯蔵領域における食材の存在、ユーザが消費した食材の使用状況等を認識する。本実施形態では、認識推論処理部は、画像データ処理部を介して取得したカメラ画像を使用して認識を行うが、スマートフォン等の携帯端末及び貯蔵庫自身に対するユーザからの入力に応じて、認識推論処理部が認識を行う構成としてもよい。本実施形態は、実施例1及び実施例2を有する。
【0012】
〈実施例1〉
図1は、冷蔵庫及び画像選定装置の構成を説明する図である。冷蔵庫100は、ネットワーク117を介して、携帯端末115及び計算機116と接続されている。
【0013】
冷蔵庫100は、画像選定装置101及び冷蔵庫本体118を備える。冷蔵庫100は、収納庫の一例である。外部記憶装置としての携帯端末115は、冷蔵庫100のユーザが使用する、タブレット、スマートフォン、パーソナルコンピュータ等の情報処理装置である。また、本実施形態の主な処理を、画像選定装置101及び携帯端末115が分担して実行してもよい。計算機116は、画像選定装置101に対して各種の情報、機械学習モデル等を配信する。
【0014】
図1は、冷蔵庫100が画像選定装置101を含む構成を示している。しかしながら、画像選定装置101が冷蔵庫100から独立した構成であってもよい。この場合、冷蔵庫(収納庫)100及び画像選定装置101は、収納庫システムを構成する。
【0015】
冷蔵庫100には、庫内を撮影するカメラ(図示せず)が取り付けられている。カメラの位置は、庫内でもよいし、庫外でもよい。カメラの台数は、1以上の任意の数である。より一般的には、カメラは、必ずしも冷蔵庫100に取り付けられている必要はなく、例えば、携帯端末115に組み込まれていてもよい。
【0016】
冷蔵庫100を制御する画像選定装置101は、例えば、プロセッサ113、記憶装置102、ネットワーク117に接続された通信部114及び入出力インタフェース112を備える。記憶装置102は、揮発性又は不揮発性のメモリから構成される主記憶装置、及び、フラッシュメモリ又はハードディスクドライブ等から構成される補助記憶装置である。
【0017】
画像選定装置101は、記憶装置102に記憶されたコンピュータプログラム及びデータの一部又は全部を、ネットワーク117を介して、外部に送信することもできる。逆に、画像選定装置101は、外部の計算機116等からネットワーク117を介して、コンピュータプログラム及びデータを受信したうえで、記憶装置102に記憶することもできる。
【0018】
画像選定装置101は、自身に接続されたフラッシュメモリ又はハードディスクドライブ等の記憶媒体111との間で、コンピュータプログラム及びデータの一部又は全部を送信・受信することもできる。
【0019】
記憶装置102は、画像データ処理部103、認識推論処理部104、画像選定部105、重要度指標出力部106、検知対象情報処理部107、データセット更新部108、モデル学習部109及び庫内制御部110を記憶している。これらは、所定の機能を実現するコンピュータプログラムである。
【0020】
プロセッサ113が、これらの各コンピュータプログラムを実行することにより、各機能が実現される。このため、これら各部を各コンピュータプログラムと読み替えることが可能であり、後記する各部の処理及び機能を、プロセッサ113が各コンピュータプログラムと協働して実現する。但し、これら各部は、専用ハードウェア、FPGA(Field Programmable Gate Array)等で実現されてもよい。さらに、これらコンピュータプログラムは、図示した数未満の数で構成されてもよい。この場合、各部はコンピュータモジュールとして構成され得る。
【0021】
以上のように、プロセッサ113は、コンピュータプログラムに従って処理を実行することにより、所定の機能を提供する機能部として稼働する。例えば、プロセッサ113は、画像データ処理プログラムに従って処理を実行することで画像データ処理部103として機能する。他のコンピュータプログラムについても同様である。さらに、プロセッサ113は、各コンピュータプログラムが実行する複数の処理のそれぞれの機能を提供する機能部としても稼働する。なお、本実施形態では、1つのプロセッサ113がコンピュータプログラムを実行しているが、複数のプロセッサが実行してもよい。
【0022】
画像データ処理部103は、入出力インタフェース112を介して冷蔵庫本体118から画像を取得し、取得した画像を記憶装置102に格納する。また、画像データ処理部103は、魚眼又は広角のレンズで撮影した画像を取得した場合、それらを平面画像(標準的な画像の歪のない画像)に変換してもよい。魚眼又は広角のレンズで撮影した画像を平面画像に変換する技術は公知である。また、教師付き学習データは、手動でのアノテーション作業(データにタグ又はメタデータと呼ばれる情報を付けて行く処理)の他に、機械学習によって自動的にアノテーションを出力することで作成されてもよい。
【0023】
認識推論処理部104は、貯蔵領域を撮影した画像から貯蔵領域内の食材を認識する。このとき、認識推論処理部104は、例えば、予め深層学習等の機械学習が行われたモデルに画像を入力し、そのモデルに食材の種類を出力させる。モデルに入力される画像のそれぞれには、卵、納豆、牛乳、豆腐、・・・のように、複数の食材が同時に写り込んでいる。そこで、モデルは、認識結果として、卵、納豆、牛乳、豆腐、・・・のような複数の文字列(品目)を出力する。図1の説明の途中であるが、説明は一旦図2に移る。
【0024】
図2は、平均認識精度リスト201の例である。認識推論処理部104は、モデルが処理した教師付き学習データが含む複数の画像に写り込んでいる品目ごとの認識精度の平均値(平均認識精度)を、図2のようにリスト化する。つまり、認識推論処理部104は、画像及び品目(ラベル)の組み合わせの集合である教師付き学習データを構成する複数の画像をモデルに入力する。すると、モデルは、品目を出力する。出力された品目は、当該画像に付された品目(ラベル)と同じであるとは限らない。そこで、品目ごとの平均認識精度が定義される。平均認識精度リスト201は、品目ごとの平均認識精度をリスト化している。品目とは、食材を含む物品の種類を示す普通名詞(卵、豆腐、牛乳、納豆、・・・)である。
【0025】
平均認識精度の指標は、例えばF値(=適合率と再現率の調和平均又は加重平均)である。適合率は、食材Aであると認識した画像のうち、実際に食材Aである割合である。再現率は、実際に食材Aである画像のうち、正しく食材Aと認識できた割合である。誤検知を減らしたい場合は適合率を重視し、未検知を減らしたい場合は再現率を重視する。なお、認識精度として、F値の代わりに、適合率、再現率、正解率、特異度、不確実性、AUC(Area Under the Curve)等が用いられてもよい。説明は、図1に戻る。
【0026】
本実施形態の認識推論処理部104は、画像を使用して冷蔵庫100内の食材を認識するが、これに限定されない。画像以外の情報を使用する場合、画像データ処理部103は、省略され得る。そして、これの代わりに、認識推論処理部104による認識に使用するための構成が別途設けられる。例えば、重量センサが使用される場合、重量と食材とを対応付けるための処理を行う機能部が設けられる。
【0027】
認識推論処理部104は、食材のパッケージの変更及び追加等に応じて、モデルを最新のものに更新することができる。認識推論処理部104は、例えば、図示しないサーバから受信したモデルを、自身が使用するモデルとして更新してもよい。
【0028】
一般に、“認識”とは、物品の種類を出力することである。“学習”とは、モデルが認識を行う場合において、モデルを最適化することである。“推論”とは、学習済のモデルが物品の種類を自動的に出力することである。本実施形態は、モデルを使用する例であるので、“認識”と“推論”には、本質的な違いはない。そして、認識推論処理部104は、学習済のモデルが認識(=推論)を行うという意味で、このように命名されている。
【0029】
画像選定部105は、平均認識精度が低い品目の平均認識精度を向上させるのに好適な低精度画像を自動選定する。図1の説明の途中であるが、説明は一旦図3に移る。
【0030】
図3は、画像選定部105の処理の全体像を示す図である。画像選定部105の処理は、低精度品目自動選定処理306及び低精度画像自動選定処理307の2ステップ(2本の矢印に相当)からなる。円301は、複数画像を示しており、円302は、画像選定部105が複数画像から平均認識精度が低い品目(低精度品目)を選定した結果である。円303は、画像選定部105が低精度品目を含む画像のうち、より低精度な画像(低精度画像)を選定した結果である。これにより、画像選定部105は、低精度品目を多く含む低精度画像を選定することができる。
【0031】
すなわち、画像選定部105は、低精度品目の認識精度向上に好適な画像を選定することにより、低精度品目の認識精度向上を実現することができる。円301、302及び303の大きさは、画像数の規模を示しており、円が大きいほど画像数が多い。また、破線の長方形304は高精度品目を示し、実線の長方形305は低精度品目を示している。
【0032】
低精度品目自動選定処理306において、画像選定部105は、複数画像から平均認識精度が低い低精度品目(平均認識精度<β)を選定する。“β”は、閾値である。図2の平均認識精度リスト201の例において、例えば、β=80%であったとする。この場合、画像選定部105は、平均認識精度<80%である牛乳及び納豆を低精度品目に自動選定する(符号202)。
次に、低精度画像自動選定処理307において、画像選定部105は、低精度品目を含む画像のうち、その品目が写り込んでいる部分の画像が低精度である画像(認識精度<β)を選定する。説明は、さらに図4に移る。
【0033】
図4は、低精度画像自動選定処理を説明する図である。図4において、“卵込画像”とは、その画像に写り込んでいる複数の品目(正解ラベル)のうちに卵が含まれる画像である。同様に、“豆腐込画像”とは、その画像に写り込んでいる複数の品目のうちに豆腐が含まれる画像である。その他の食材についても同様である。したがって、ある卵込画像が、同時に豆腐込画像である場合もある。
【0034】
卵込画像401は、複数個(ここでは4個)の□402を含む。□402は、個々の卵込画像を示す。□402に付された百分率は、その画像に写り込んでいる卵の認識精度である。他の品目についても同様である。仮に、複数の卵込画像に同じ個体としての卵が写り込んでいても、その位置、画像の明るさ、他の食材との干渉等の状態は、変化する。よって、卵の認識精度は、卵込画像ごとに異なる。また、例えば、正解が卵であるのに対して、ペットボトルと誤検知してしまうと、卵の認識精度(F値等)の低下を招いてしまうため、卵の認識精度は、他の品目の状態によっても変化する。他の品目についても同様である。
【0035】
点線403には、牛乳込画像及び納豆込画像が含まれる。牛乳及び納豆は、平均認識精度が低い品目(低精度品目)である(図2参照)。破線404内の“□65%”は、その牛乳込画像のうち牛乳の認識精度が65%であることを示す。破線405内の“□75%”、“□62%”及び“□58%”は、3個の納豆込画像の納豆の認識精度がそれぞれ、75%、62%及び58%であることを示す。破線404内の牛乳込画像が、牛乳の平均認識精度を下げている可能性が高い。破線405内の納豆込画像が、納豆の平均認識精度を下げている可能性が高い。
【0036】
画像選定部105は、平均認識精度リスト201(図2)から、低精度品目として牛乳及び納豆を選定している。図4において、画像選定部105は、牛乳込画像のうち、牛乳の認識精度<80%である破線404内の画像を低精度画像として選定する。同様に、画像選定部105は、納豆込画像のうち、納豆の認識精度<80%である破線405内の画像を低精度画像として選定する。
【0037】
平均認識精度は、品目に対して定義される。これに対し、図4において“〇の認識精度”と記載され、□に紐付けられている百分率は、画像に写り込んでいる特定の品目に対して定義される“認識精度”である。平均認識精度に適用される閾値βは、認識精度に適用される閾値βと同じであってもよいし、異なっていてもよい。なお、平均認識精度及び認識精度を算出(出力)する主体は、認識推論処理部104である。低精度品目及び低精度画像を選定する主体は、画像選定部105である。また、画像選定部105は、低精度品目を含む画像のうち、その品目が写り込んでいる部分のみの画像を切り出して、切り出した画像を低精度画像として選定してもよい。説明は、図1に戻る。
【0038】
画像選定部105は、自身が選定した低精度画像のそれぞれについて、低精度品目情報を出力する。重要度指標出力部106は、低精度品目情報に基づき、画像ごとの追加学習重要度を出力する。低精度品目情報とは、例えば、ある画像に写り込んでいる低精度品目の数(低精度品目数)である。低精度品目数が多いほど、その画像の追加学習重要度は高くなる。図1の説明の途中であるが、説明は、一旦図5に移る。
【0039】
図5は、低精度品目数及び追加学習重要度の関係を説明する図である。図5において、選定された低精度画像501に含まれる(写り込んでいる)品目は、卵、豆腐、牛乳及び納豆の4つである。このうち、認識精度<80%である品目は、納豆のみである。このとき、選定された低精度画像501の低精度品目数は、“1”となる。選定された低精度画像502に含まれる品目も、卵、豆腐、牛乳及び納豆の4つである。このうち、認識精度<80%である品目は、牛乳及び納豆の2つである。このとき、選定された低精度画像502の低精度品目数は、“2”となる。
【0040】
これより、追加学習重要度が高い“選定された低精度画像”502が、追加学習のための教師付き学習データとして優先的に使用される。また、追加学習重要度は、低精度品目数に応じて算出される場合に限定されず、認識精度の高低等に応じて算出されてもよい。例えば、低精度画像が2つ選定され、その一方の納豆の認識精度が58%であり、他方の納豆の認識精度が78%であるとする。この場合、前者の追加学習重要度が高くなってもよい。また、選定された低精度画像502に偶々写り込んでいる“豆腐”の認識精度は、80%未満である。しかしながら、豆腐は、低精度品目ではないので、ここでは低精度品目数にカウントされない。もちろん、豆腐もまた、低精度品目数にカウントされてもよい。説明は、図1に戻る。
【0041】
結局、画像選定部105は、再学習の対象となる画像を、認識精度が低い品目が写り込んでいるものに絞り込み、さらに、そのうちその品目が写り込んでいる部分の認識精度が実際に低いものに絞り込む。重要度指標出力部106は、絞り込まれた画像のうち、いわば“一石二鳥”を狙える画像の追加学習重要度を高くする。
【0042】
検知対象情報処理部107は、認識推論処理部104が出力した検知枠に基づき検知対象情報(詳細後記)を出力する。この場合、重要度指標出力部106は、検知対象情報及び低精度品目情報に基づき追加学習重要度を出力する。図1の説明の途中であるが、説明は、一旦図6に移る。
【0043】
図6は、検知対象情報処理部107の詳細を説明する図である。検知対象情報処理部107は、過剰検知モジュール601、色彩検知モジュール602、低画質検知モジュール603、人体検知モジュール604、局所検知モジュール605、本体検知モジュール606及び未学習検知モジュール607を有する。
【0044】
過剰検知モジュール601は、同一の食材が過剰に(重複して)検出された場合、その検知枠を、重複割合情報として検出する。
色彩検知モジュール602は、周囲の色彩が食材と類似しているため、周囲及び食材が合体してしまっている検知枠又は暗部に写っている検知枠を、色彩情報として検出する。
低画質検知モジュール603は、検知枠内の解像度を出力し、透明棚を通して写っている検知枠及びブレ画像の検知枠を、精細度情報として検出する。
【0045】
人体検知モジュール604は、人体を検出し、人の手等の検知枠を、環境情報として検出する。
局所検知モジュール605は、食材の面積が小さく、かつ、食材が周囲と重複しているため食材一部のみが写っている検知枠を、面積情報として検出する。
本体検知モジュール606は、冷蔵庫本体118の仕切り板等を検出し、検知枠内に仕切り板等の収納庫本体が写っている検知枠を、本体情報として検出する。
未学習検知モジュール607は、特徴量の距離情報に基づき、事前に学習していない特徴量の検知枠を、特徴量距離情報として検出する。
【0046】
重複割合情報、色彩情報、精細度情報、環境情報、面積情報、本体情報及び特徴距離情報は、まとめて検知対象情報と総称される。検知対象情報は、画像の質を示す情報であり、質的な不具合に起因してその画像(検知枠)の品目が正しく認識されない恐れがある、という情報である。検知対象情報処理部107は、検知対象情報に該当する画像の追加学習重要度を高く設定することで、優先的に追加学習に低精度画像が適用されやすくする。検知対象情報を出力するモジュールとして、前記7つのモジュールのすべてが使用される必要はなく、少なくとも1つが使用されればよい。また、検知対象情報を出力するモジュールは、前記7つのみに限定されず、他のモジュールを適宜追加・削除・置換してもよい。説明は、図1に戻る。
【0047】
データセット更新部108は、画像選定部105又は重要度指標出力部106が選定した低精度画像を教師付き学習データセットに追加する。教師付き学習データセットとは、食材を認識するモデルを機械学習するための教師付き学習データとなり得る画像の最大の母集合である。なお、データセット更新部108は、画像選定部105等が選定した低精度画像に対して回転、シフト、水平反転等のデータ拡張により低精度画像のデータ量を増加させたうえで、教師付き学習データセットに追加してもよい。
【0048】
モデル学習部109は、例えば、深層学習等により教師付き学習データセットを使用して、庫内の食材を認識するモデルを機械学習する。モデル学習部109は、学習モデルの汎化性能の向上及び過学習の抑制のために、交差検証によって学習回数を増やしてもよい。また、モデル学習部109は、学習済モデルに対してさらにファインチューニング(微調整)や移転学習を行い、教師付き学習データセットの未使用部分等を使用してモデルを再度学習することで、汎化性能の向上を図ってもよい。モデル学習部109は、必要に応じ、誤ったラベルを正しいラベルに更新してもよい。
【0049】
例えば、トマトのように光沢のあるりんごの画像にラベル“トマト”が付されている場合、モデル学習部109は、そのラベルを“りんご”で更新する。いちごのような形状を有するプチトマトの画像にラベル“プチトマト”が付されている場合、厳しい例ではあるが、ラベルを更新せず、学習回数を増やす。
【0050】
庫内制御部110は、図示しないモータ及びコンプレッサを制御して、冷蔵庫100の庫内の温度及び湿度を制御する。
【0051】
図7は、画像選定処理手順のフローチャートである。
ステップS201において、画像データ処理部103は、既存の教師付き学習データから、カメラで撮影した画像を取得し、必要に応じて魚眼画像を平面画像に変換する。
【0052】
ステップS202において、認識推論処理部104は、複数画像に基づき、すべての品目ごとの平均認識精度を算出する。認識推論処理部104は、平均認識精度として、例えば、“重み付け後の適合率=重み付け後の再現率”となるようなF値を算出する。つまり、認識推論処理部104は、必ずしも“適合率=再現率”となるようなF値を算出する必要はなく、“適合率≧再現率”となるF値、又は、“適合率≦再現率”となるF値を算出してもよい。適合率、再現率、F値が、正解率、特異度、不確実性、AUC等に代替されてもよい。なお、“所定の認識精度”は、適合率、再現率、F値、正解率、特異度、不確実性及びAUCを含む概念である。
【0053】
ステップS203において、画像選定部105は、すべての品目ごとの平均認識精度がβ以上であるか否かを判定し、繰り返しモデルを機械学習するべきか否かを判定する。画像選定部105は、すべての品目ごとの平均認識精度がβ以上でない場合(ステップS203“Nо”)、S204に進む。画像選定部105は、すべての品目ごとの平均認識精度がβ以上である場合(ステップS203“Yes”)、直前の繰り返し処理において選定した低精度画像を任意の装置(例えば、携帯端末115、入出力インタフェース112等)に表示(出力)した後、画像選定処理を終了する。
また、画像選定部105は、繰り返しモデルを機械学習するべきか否かを判定する指標として、すべての品目ごとの平均認識精度がβ以上であるか否かに加えて、低精度品目数=0、又は、低精度画像選定数=0であるか否かを使用して、前記指標のいずれにも該当しない場合、ステップS204に進んでもよい。
【0054】
ステップS204において、画像選定部105は、複数画像から、低精度品目(平均認識精度<β)を選定する。
ステップS205において、画像選定部105は、低精度品目を含む画像のうち、低精度画像(認識精度<β)を選定する。このとき、認識推論処理部104は、認識精度を算出する。
ステップS206において、データセット更新部108は、ステップS205において選定された低精度画像を学習データセットに追加する。データセット更新部108は、この段階で前記したデータ拡張を実行してもよい。
【0055】
ステップS207において、モデル学習部109は、ステップS206において追加された学習データセットを使用して、食材を認識するモデルを機械学習する。この段階で使用される学習データセットは、メーカ、ユーザ及び/又は機械学習によって“教師データ”が付与されたものである。モデル学習部109は、この段階で、前記したファインチューニングや移転学習を実行してもよい。ステップS207の処理の後、ステップS202に戻る。
【0056】
ステップS202~S207の繰り返し処理において、すべての品目ごとの平均認識精度に適用される閾値βは、“所定の認識精度”に相当する。したがって、画像選定部105は、機械学習が行われたモデルが物品を認識した結果が、所定の認識精度を満たすまで、教師付き学習データを前記画像から選定する処理を繰り返すことになる。このことに伴い、モデル学習部109は、すべての品目ごとの平均認識精度が一定以上になるまで繰り返しモデルを機械学習することにより、低精度品目に対しても高精度で認識可能なモデルを構築できる。
【0057】
以上のように、本実施形態は、追加学習ごとに複数画像から平均認識精度が低い低精度な品目を選定し、低精度品目を含む画像のうち、より低精度な画像を選定することで、低精度品目の認識精度向上に好適な画像を選定できる。
【0058】
図8は、図7に低精度品目情報の取得及び追加学習重要度の出力を追加したフローチャートである。図8では、図7との相違を中心に説明する。図7の特徴的な処理は、選定された低精度画像中の低精度品目情報に基づき追加学習重要度を出力することである。
【0059】
図8のステップS201~S205、S206及びS207は、図7で述べたステップS201~S205、S206及びS207と同様であるため、ここでは説明を省略する。図8では、ステップS301~S303が新たに追加されている。
【0060】
ステップS301において、画像選定部105は、ステップS205で選定された低精度画像に含まれる低精度品目の個数等の低精度品目情報を取得する。
ステップS302において、重要度指標出力部106は、低精度品目情報に基づき、追加学習重要度を任意の装置に出力する。
【0061】
ステップS303において、画像選定部105は、追加学習重要度に応じて学習データセットに追加するべき低精度画像を選定する。つまり、画像選定部105は、追加学習重要度が高い画像ほど優先的に学習データセットに追加されやすくする。
以上のように、本実施形態は、低精度品目情報に基づき出力した追加学習重要度が高い低精度画像ほど、低精度品目の認識精度を向上するのに好適であるとし、優先的に学習データセットに追加されやすくする。
【0062】
図9は、図8に検知対象情報の取得を追加したフローチャートである。図9では、実施図8との相違を中心に説明する。図9の特徴的な処理は、選定された低精度画像中の低精度品目情報及び検知対象情報に基づき追加学習重要度を出力することである。
【0063】
図9のステップS201~S205、S206及びS207は、図7で述べたステップS201~S205、S206及びS207と同様であり、かつ、図9のステップS301及びS303は、図8で述べたステップS301及びS303と同様であるため、説明を省略する。
【0064】
ステップS401において、検知対象情報処理部107は、重複割合情報、色彩情報、精細度情報等の検知対象情報を取得する。
ステップS402において、重要度指標出力部106は、低精度品目情報及び検知対象情報に基づき、追加学習重要度を任意の装置に出力する。重要度指標出力部106は、例えば“追加学習重要度=低精度品目数×該当する検知対象情報の数”という計算式で追加学習重要度を算出する。
【0065】
以上のように、本実施形態は、重複割合情報、色彩情報、精細度情報等の検知対象情報に該当する画像であるほど低精度画像とし、低精度品目情報及び検知対象情報に基づき出力した追加学習重要度を用いることで、低精度品目及び/又は低精度画像の認識精度を向上するのに好適な画像を選定できる。
【0066】
〈実施例2〉
実施例1においては、冷蔵庫100の一部である画像選定装置101が画像選定処理を実行している。しかしながら、冷蔵庫100から独立した別筐体の構成が、画像選定処理を実行してもよい。以下では、携帯端末115が画像選定処理を実行する変形例を説明する。
【0067】
図10は、携帯端末115の構成等を説明する図である。携帯端末115は、プロセッサ902、記憶装置904、タッチパネル901及び通信部903を備える。携帯端末115は、スマートフォン等のコンピュータである。
【0068】
プロセッサ902及び記憶装置904は、図1に示すプロセッサ113及び記憶装置102と同様の機能を備える。タッチパネル901は、入出力部として機能する。通信部903は、ネットワーク117と接続される。この接続は、無線、有線を問わない。
【0069】
記憶装置904は、実施例2の処理を実行する画像選定プログラム912を記憶している。画像選定プログラム912は、画像データ処理モジュール905、認識推論処理モジュール906、画像選定モジュール907、重要度指標出力モジュール908、検知対象情報処理モジュール909、データセット更新モジュール910、モデル学習モジュール911及び庫内制御モジュール913で構成される。これらのモジュールのうちの複数の一部がまとまって、より大きなモジュールを構成してもよい。
【0070】
例えば、図10の画像データ処理モジュール905は、図1の画像データ処理部103と同様の機能を有する。他のモジュールについても同様である。但し、庫内制御モジュール913は、さらに庫内食材等の使用状況を管理することが望ましい。例えば、庫内制御モジュール913は、ユーザからの入力情報及び食材のコードから読み取られた情報を取得し、認識推論処理モジュール906が該当の食材を認識する。
画像選定プログラム912は、ネットワーク117を介して、携帯端末115に配信されることが望ましい。このため、ネットワーク117は、インターネットで実現されることになる。
【0071】
以上のように、実施例1及び2によれば、追加学習ごとに複数の画像から平均認識精度が低い低精度品目を選定し、低精度品目を含む画像のうち、より精度が低い低精度画像を選定することで、低精度品目の認識精度を向上するのに好適な画像を選定することができる。また、低精度品目情報に基づき出力した追加学習重要度が高い画像ほど、低精度品目の認識精度を向上するのに好適であるとし、優先的に学習データセットに追加されやすくなる。このことで、低精度品目の認識精度を向上するのに好適な画像を選定することができる。重複割合情報、色彩情報、精細度情報等の検知対象情報に該当する画像ほど低精度画像とし、低精度品目情報及び検知対象情報に基づき出力した追加学習重要度を使用することで、低精度品目及び/又は低精度画像の認識精度を向上するのに好適な画像を選定することができる。さらに、実施例1及び2によれば、処理対象の画像を限定することにより、画像選定装置の処理負担(負荷)を減らすことができる。
【0072】
なお、本発明(画像選定装置又は貯蔵庫)は、前記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、前記した実施例は、本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明したすべての構成を備えるものに限定されるものではない。また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
【0073】
また、前記の各構成、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、前記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムで解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリやハードディスク、SSD(Solid State Drive)等の記録装置、又は、ICカード、SDカード、DVD等の記録媒体に置くことができる。
また、制御線及び情報線は説明上必要と考えられるものを示しており、製品上必ずしもすべての制御線及び情報線を示しているとは限らない。実際には殆どすべての構成が相互に接続されていると考えてもよい。画像選定装置の各種情報は、クラウド上に存在していてもよい。
【符号の説明】
【0074】
100 冷蔵庫
101 画像選定装置
102 記憶装置
103 画像データ処理部
104 認識推論処理部
105 画像選定部
106 重要度指標出力部
107 検知対象情報処理部
108 データセット更新部
109 モデル学習部
110 庫内制御部
111 記憶媒体
112 入出力インタフェース
113 プロセッサ
114 通信部
115 携帯端末
116 計算機
117 ネットワーク
901 タッチパネル
902 プロセッサ
903 通信部
904 記憶装置
905 画像データ処理モジュール
906 認識推論処理モジュール
907 画像選定モジュール
908 重要度指標出力モジュール
909 検知対象情報処理モジュール
910 データセット更新モジュール
911 モデル学習モジュール
912 画像選定プログラム
913 庫内制御モジュール
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10