特表2024-545378 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ヌビ・ラブズ・カンパニー・リミテッドの特許一覧

特表2024-545378階層的モデルを利用したオブジェクト識別方法及び装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2024-12-06

(54)【発明の名称】階層的モデルを利用したオブジェクト識別方法及び装置

(51)【国際特許分類】

G06T 7/11 20170101AFI20241129BHJP

G06T 7/00 20170101ALI20241129BHJP

【ＦＩ】

G06T7/11

G06T7/00 350B

【審査請求】有

【予備審査請求】未請求

(21)【出願番号】P 2023571484

(86)(22)【出願日】2023-09-07

(85)【翻訳文提出日】2023-11-15

(86)【国際出願番号】 KR2023013394

(87)【国際公開番号】W WO2024101625

(87)【国際公開日】2024-05-16

(31)【優先権主張番号】10-2022-0148837

(32)【優先日】2022-11-09

(33)【優先権主張国・地域又は機関】KR

(81)【指定国・地域】

(71)【出願人】

【識別番号】523432896

【氏名又は名称】ヌビ・ラブズ・カンパニー・リミテッド

(74)【代理人】

【識別番号】100108453

【弁理士】

【氏名又は名称】村山靖彦

(74)【代理人】

【識別番号】100110364

【弁理士】

【氏名又は名称】実広信哉

(74)【代理人】

【識別番号】100133400

【弁理士】

【氏名又は名称】阿部達彦

(72)【発明者】

【氏名】デ・フン・キム

(72)【発明者】

【氏名】ジェイ・ユン・ル

【テーマコード（参考）】

5L096

【Ｆターム（参考）】

5L096AA06

5L096CA02

5L096DA01

5L096DA02

5L096FA06

5L096HA09

5L096JA11

(57)【要約】

本発明は、階層的モデルを利用したオブジェクト識別方法及び装置に関するものであって、本発明の一実施形態に係る階層的モデルを利用したオブジェクト識別方法は、オブジェクト識別装置が、学習されたオブジェクト領域抽出モデルに基づいてオブジェクトイメージからオブジェクトが位置したオブジェクト領域を検出し、前記検出されたオブジェクト領域を切り出すステップと、オブジェクト管理サーバがオブジェクト種類推論モデルに基づいて前記オブジェクト識別装置から切り出したオブジェクト領域に位置したオブジェクト種類情報を識別するステップとを含む。

【特許請求の範囲】

【請求項1】

オブジェクト識別システムにより行われるオブジェクト識別方法において、
オブジェクト識別装置が、学習されたオブジェクト領域抽出モデルに基づいてオブジェクトイメージからオブジェクトが位置したオブジェクト領域を検出し、前記検出されたオブジェクト領域を切り出すステップと、
オブジェクト管理サーバがオブジェクト種類推論モデルに基づいて前記オブジェクト識別装置から切り出したオブジェクト領域に位置したオブジェクト種類情報を識別するステップと、
を含む、階層的モデルを利用したオブジェクト識別方法。

【請求項2】

前記検出されたオブジェクト領域を切り出すステップは、
前記学習されたオブジェクト領域抽出モデルに基づいて前記オブジェクトイメージから前記オブジェクトを囲んでいるボックス（Ｂｏｘ）または前記オブジェクトが占めているピクセル（Ｐｉｘｅｌ）を用いてオブジェクト領域を検出する、請求項１に記載の階層的モデルを利用したオブジェクト識別方法。

【請求項3】

前記検出されたオブジェクト領域を切り出すステップは、
前記学習されたオブジェクト領域抽出モデルの第１イメージエンコーダを介して第１特徴点を抽出し、前記抽出された第１特徴点から特徴点領域を抽出してオブジェクト領域を推論する、請求項１に記載の階層的モデルを利用したオブジェクト識別方法。

【請求項4】

前記オブジェクト識別装置が前記切り出したオブジェクト領域に位置したオブジェクト種類のカテゴリーを段階的に分類するステップをさらに含み、
前記オブジェクト種類情報を識別するステップは、前記オブジェクト管理サーバが前記分類されたカテゴリーと対応するオブジェクト種類推論モデルを利用してオブジェクト種類情報を識別する、請求項１に記載の階層的モデルを利用したオブジェクト識別方法。

【請求項5】

前記オブジェクト種類のカテゴリーを段階的に分類するステップは、
前記オブジェクト識別装置が前記切り出したオブジェクト領域に位置したオブジェクトのカテゴリーを最上位大分類から順次最下位小分類まで段階的に分類する、請求項４に記載の階層的モデルを利用したオブジェクト識別方法。

【請求項6】

前記オブジェクト種類情報を識別するステップは、
前記オブジェクト管理サーバが前記分類されたカテゴリーである最下位小分類と対応するオブジェクト種類推論モデルを利用してオブジェクト種類情報を識別する、請求項５に記載の階層的モデルを利用したオブジェクト識別方法。

【請求項7】

前記オブジェクト種類情報を識別するステップは、
前記オブジェクト管理サーバが前記オブジェクト種類情報を前記分類された最下位小分類に含まれた複数のクラスのうち、いずれか１つのクラスとして判別する、請求項５に記載の階層的モデルを利用したオブジェクト識別方法。

【請求項8】

前記オブジェクト種類情報を識別するステップは、
前記オブジェクト管理サーバが前記分類されたカテゴリーと対応するオブジェクト種類推論モデルの第２イメージエンコーダを介して第２特徴点を抽出し、前記抽出された第２特徴点を特徴点デコーダに入力させてオブジェクト種類情報を推論する、請求項４に記載の階層的モデルを利用したオブジェクト識別方法。

【請求項9】

オブジェクト識別装置により行われるオブジェクト識別方法において、
学習されたオブジェクト領域抽出モデルに基づいてオブジェクトイメージからオブジェクトが位置したオブジェクト領域を検出し、前記検出されたオブジェクト領域を切り出すステップと、
オブジェクト種類推論モデルに基づいて前記切り出したオブジェクト領域に位置したオブジェクト種類情報を識別するステップと、
を含む、階層的モデルを利用したオブジェクト識別方法。

【請求項10】

オブジェクト管理サーバにより行われるオブジェクト識別方法において、
学習されたオブジェクト領域抽出モデルに基づいてオブジェクトイメージからオブジェクトが位置したオブジェクト領域を検出し、前記検出されたオブジェクト領域を切り出すステップと、
オブジェクト種類推論モデルに基づいて前記切り出したオブジェクト領域に位置したオブジェクト種類情報を識別するステップと、
を含む、階層的モデルを利用したオブジェクト識別方法。

【請求項11】

オブジェクト識別システムにおいて、
学習されたオブジェクト領域抽出モデルに基づいてオブジェクトイメージからオブジェクトが位置したオブジェクト領域を検出し、前記検出されたオブジェクト領域を切り出すオブジェクト識別装置と、
オブジェクト種類推論モデルに基づいて前記オブジェクト識別装置から切り出したオブジェクト領域に位置したオブジェクト種類情報を識別するオブジェクト管理サーバと、
を備える、階層的モデルを利用したオブジェクト識別システム。

【請求項12】

前記オブジェクト識別装置は、
前記学習されたオブジェクト領域抽出モデルに基づいて前記オブジェクトイメージから前記オブジェクトを囲んでいるボックス（Ｂｏｘ）または前記オブジェクトが占めているピクセル（Ｐｉｘｅｌ）を用いてオブジェクト領域を検出する、請求項１１に記載の階層的モデルを利用したオブジェクト識別システム。

【請求項13】

前記オブジェクト識別装置は、
前記学習されたオブジェクト領域抽出モデルの第１イメージエンコーダを介して第１特徴点を抽出し、前記抽出された第１特徴点から特徴点領域を抽出してオブジェクト領域を推論する、請求項１１に記載の階層的モデルを利用したオブジェクト識別システム。

【請求項14】

前記オブジェクト識別装置は、前記オブジェクト識別装置が、前記切り出したオブジェクト領域に位置したオブジェクト種類のカテゴリーを段階的に分類し、
前記オブジェクト管理サーバは、前記分類されたカテゴリーと対応するオブジェクト種類推論モデルを利用してオブジェクト種類情報を識別する、請求項１１に記載の階層的モデルを利用したオブジェクト識別システム。

【請求項15】

前記オブジェクト識別装置は、
前記切り出したオブジェクト領域に位置したオブジェクトのカテゴリーを最上位大分類から順次最下位小分類まで段階的に分類する、請求項１４に記載の階層的モデルを利用したオブジェクト識別システム。

【請求項16】

前記オブジェクト管理サーバは、
前記分類されたカテゴリーである最下位小分類と対応するオブジェクト種類推論モデルを利用してオブジェクト種類情報を識別する、請求項１５に記載の階層的モデルを利用したオブジェクト識別システム。

【請求項17】

前記オブジェクト管理サーバは、
前記オブジェクト種類情報を前記分類された最下位小分類に含まれた複数のクラスのうち、いずれか１つのクラスとして判別する、請求項１５に記載の階層的モデルを利用したオブジェクト識別システム。

【請求項18】

前記オブジェクト管理サーバは、
前記分類されたカテゴリーと対応するオブジェクト種類推論モデルの第２イメージエンコーダを介して第２特徴点を抽出し、前記抽出された第２特徴点を特徴点デコーダに入力させてオブジェクト種類情報を推論する、請求項１４に記載の階層的モデルを利用したオブジェクト識別システム。

【請求項19】

オブジェクト識別装置において、
１つ以上のプログラムを格納するメモリと、
前記格納された１つ以上のプログラムを実行するプロセッサと、
を備え、
前記プロセッサは、
学習されたオブジェクト領域抽出モデルに基づいてオブジェクトイメージからオブジェクトが位置したオブジェクト領域を検出し、前記検出されたオブジェクト領域を切り出し、
オブジェクト種類推論モデルを利用して前記切り出したオブジェクト領域に位置したオブジェクト種類情報を識別する、階層的モデルを利用したオブジェクト識別装置。

【請求項20】

オブジェクト管理サーバにおいて、
１つ以上のプログラムを格納するメモリと、
前記格納された１つ以上のプログラムを実行するプロセッサと、
を備え、
前記プロセッサは、
学習されたオブジェクト領域抽出モデルに基づいてオブジェクトイメージからオブジェクトが位置したオブジェクト領域を検出し、前記検出されたオブジェクト領域を切り出し、
オブジェクト種類推論モデルを利用して前記切り出したオブジェクト領域に位置したオブジェクト種類情報を識別する、階層的モデルを利用したオブジェクト管理サーバ。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、オブジェクト識別方法及び装置に関する。

【背景技術】

【0002】

近年、健康についての関心が高まっているが、それに対し、過体重や肥満のため、苦しめられる人々も次第に増加している。このような過体重や肥満は、糖尿、高血圧など、各種疾患の原因になる深刻な問題である。

【0003】

したがって、このような過体重や肥満を解決するためには、自分の食習慣を分析することが先行されなければならない。一般に、本人の好き嫌いオブジェクトに対して知っているが、実際に摂取するオブジェクトの種類と回数を記憶してはいない。したがって、自分の食習慣を分析するために、実際に摂取するオブジェクトを把握し、把握したオブジェクトに関する情報に応じて個人の食習慣を分析する必要がある。

【0004】

しかし、現在公開されたほとんどの技術は、カメラを介して撮影されたオブジェクトイメージを単純イメージ検索するのにとどめているため、その正確度が顕著に落ちる。また、イメージ検索でオブジェクト種類識別の正確度が落ちていたら、カロリー計算などのような次の段階では、より大きい誤差が発生するという問題点がある。

【0005】

一例として、実際に摂取するオブジェクトを把握するために、ユーザがモバイル端末や入力装置を利用してオブジェクト情報を入力しなければならない。ここで、ユーザは、モバイル端末に実行されたオブジェクト関連アプリケーションや一般撮影モードを実行してオブジェクトを撮影する。このとき、ユーザは、オブジェクト関連アプリケーションで撮影されたオブジェクトイメージを検索し、再度、これに対するオブジェクト情報を入力しなければならないという不便さがある。または、一般撮影モードで撮影した場合、ユーザは、アルバムから撮影したオブジェクトイメージを探し、探したオブジェクトイメージをオブジェクト関連アプリケーションに載せ、載せたオブジェクトイメージを再度探してオブジェクト情報を入力しなければならないという不便さがある。したがって、オブジェクト撮影とオブジェクト識別とが別の動作でなされて不便であるため、ユーザは、いくつのオブジェクトイメージを撮影した後には、オブジェクト情報を載せる頻度が急激に低くなる。

【0006】

仮りに、ユーザがオブジェクトを撮影ばかりし、後でオブジェクト情報を入力することになる場合が発生しうる。オブジェクトイメージを撮影した期間が長く経過した場合、ユーザは、撮影する際に入力しようとしたオブジェクト情報を記憶しておらず、オブジェクト情報を記録できないか、誤ったオブジェクト情報を載せて、食習慣分析でエラーが発生しうる。また、ユーザが撮影されたオブジェクトイメージに対して種々のオブジェクト情報を入力することを望んでも、アプリケーション毎に設定されたいくつの固定されたオブジェクト情報のみ入力せざるをえない。このような場合、オブジェクト情報の個数が制限されて、ユーザ食習慣分析が正確になされないことがある。このように、ユーザの不便が加重されることで、オブジェクト識別を介して一例として個人の食習慣を分析するサービスに対する満足度が低下している実情である。

【発明の概要】

【発明が解決しようとする課題】

【0007】

本発明の実施形態等は、オブジェクト識別装置でオブジェクト領域を識別し、オブジェクト管理サーバでオブジェクト種類情報を識別することで、オブジェクト識別速度を増加させるための、階層的モデルを利用したオブジェクト識別方法及び装置を提供しようとする。

【0008】

本発明の実施形態等は、オブジェクト領域抽出モデルとオブジェクト種類推論モデルとを利用してオブジェクトのカテゴリーを段階的に分類し、オブジェクト種類情報を識別することで、オブジェクトイメージで位置したオブジェクトを速かに決定するための、階層的モデルを利用したオブジェクト識別方法及び装置を提供しようとする。

【0009】

ただし、本発明の解決しようとする課題は、これに限定されるものではなく、本発明の思想及び領域から逸脱しない範囲の環境でも様々に拡張されることができるであろう。

【課題を解決するための手段】

【0010】

本発明の一実施形態によれば、オブジェクト識別システムにより行われるオブジェクト識別方法において、オブジェクト識別装置が、学習されたオブジェクト領域抽出モデルに基づいてオブジェクトイメージからオブジェクトが位置したオブジェクト領域を検出し、前記検出されたオブジェクト領域を切り出すステップと、オブジェクト管理サーバがオブジェクト種類推論モデルに基づいて前記オブジェクト識別装置から切り出したオブジェクト領域に位置したオブジェクト種類情報を識別するステップとを含む、階層的モデルを利用したオブジェクト識別方法が提供され得る。

【0011】

前記検出されたオブジェクト領域を切り出すステップは、前記学習されたオブジェクト領域抽出モデルに基づいて前記オブジェクトイメージから前記オブジェクトを囲んでいるボックス（Ｂｏｘ）または前記オブジェクトが占めているピクセル（Ｐｉｘｅｌ）を用いてオブジェクト領域を検出できる。

【0012】

前記検出されたオブジェクト領域を切り出すステップは、前記学習されたオブジェクト領域抽出モデルの第１イメージエンコーダを介して第１特徴点を抽出し、前記抽出された第１特徴点から特徴点領域を抽出してオブジェクト領域を推論できる。

【0013】

前記方法は、前記オブジェクト識別装置が前記切り出したオブジェクト領域に位置したオブジェクト種類のカテゴリーを段階的に分類するステップをさらに含み、前記オブジェクト種類情報を識別するステップは、前記オブジェクト管理サーバが前記分類されたカテゴリーと対応するオブジェクト種類推論モデルを利用してオブジェクト種類情報を識別できる。

【0014】

前記オブジェクト種類のカテゴリーを段階的に分類するステップは、前記オブジェクト識別装置が前記切り出したオブジェクト領域に位置したオブジェクトのカテゴリーを最上位大分類から順次最下位小分類まで段階的に分類することができる。

【0015】

前記オブジェクト種類情報を識別するステップは、前記オブジェクト管理サーバが前記分類されたカテゴリーである最下位小分類と対応するオブジェクト種類推論モデルを利用してオブジェクト種類情報を識別できる。

【0016】

前記オブジェクト種類情報を識別するステップは、前記オブジェクト管理サーバが前記オブジェクト種類情報を前記分類された最下位小分類に含まれた複数のクラスのうち、いずれか１つのクラスとして判別することができる。

【0017】

前記オブジェクト種類情報を識別するステップは、前記オブジェクト管理サーバが前記分類されたカテゴリーと対応するオブジェクト種類推論モデルの第２イメージエンコーダを介して第２特徴点を抽出し、前記抽出された第２特徴点を特徴点デコーダに入力させてオブジェクト種類情報を推論できる。

【0018】

一方、本発明の他の実施形態によれば、オブジェクト識別装置により行われるオブジェクト識別方法において、学習されたオブジェクト領域抽出モデルに基づいてオブジェクトイメージからオブジェクトが位置したオブジェクト領域を検出し、前記検出されたオブジェクト領域を切り出すステップと、オブジェクト種類推論モデルに基づいて前記切り出したオブジェクト領域に位置したオブジェクト種類情報を識別するステップとを含む、階層的モデルを利用したオブジェクト識別方法が提供され得る。

【0019】

一方、本発明の他の実施形態によれば、オブジェクト管理サーバにより行われるオブジェクト識別方法において、学習されたオブジェクト領域抽出モデルに基づいてオブジェクトイメージからオブジェクトが位置したオブジェクト領域を検出し、前記検出されたオブジェクト領域を切り出すステップと、オブジェクト種類推論モデルに基づいて前記切り出したオブジェクト領域に位置したオブジェクト種類情報を識別するステップとを含む、階層的モデルを利用したオブジェクト識別方法が提供され得る。

【0020】

一方、本発明の他の実施形態によれば、オブジェクト識別システムにおいて、学習されたオブジェクト領域抽出モデルに基づいてオブジェクトイメージからオブジェクトが位置したオブジェクト領域を検出し、前記検出されたオブジェクト領域を切り出すオブジェクト識別装置と、オブジェクト種類推論モデルに基づいて前記オブジェクト識別装置から切り出したオブジェクト領域に位置したオブジェクト種類情報を識別するオブジェクト管理サーバとを備える、階層的モデルを利用したオブジェクト識別システムが提供され得る。

【0021】

前記オブジェクト識別装置は、前記学習されたオブジェクト領域抽出モデルに基づいて前記オブジェクトイメージから前記オブジェクトを囲んでいるボックス（Ｂｏｘ）または前記オブジェクトが占めているピクセル（Ｐｉｘｅｌ）を用いてオブジェクト領域を検出できる。

【0022】

前記オブジェクト識別装置は、前記学習されたオブジェクト領域抽出モデルの第１イメージエンコーダを介して第１特徴点を抽出し、前記抽出された第１特徴点から特徴点領域を抽出してオブジェクト領域を推論できる。

【0023】

前記オブジェクト識別装置は、前記オブジェクト識別装置が、前記切り出したオブジェクト領域に位置したオブジェクト種類のカテゴリーを段階的に分類し、前記オブジェクト管理サーバは、前記分類されたカテゴリーと対応するオブジェクト種類推論モデルを利用してオブジェクト種類情報を識別できる。

【0024】

前記オブジェクト識別装置は、前記切り出したオブジェクト領域に位置したオブジェクトのカテゴリーを最上位大分類から順次最下位小分類まで段階的に分類することができる。

【0025】

前記オブジェクト管理サーバは、前記分類されたカテゴリーである最下位小分類と対応するオブジェクト種類推論モデルを利用してオブジェクト種類情報を識別できる。

【0026】

前記オブジェクト管理サーバは、前記オブジェクト種類情報を前記分類された最下位小分類に含まれた複数のクラスのうち、いずれか１つのクラスとして判別することができる。

【0027】

前記オブジェクト管理サーバは、前記分類されたカテゴリーと対応するオブジェクト種類推論モデルの第２イメージエンコーダを介して第２特徴点を抽出し、前記抽出された第２特徴点を特徴点デコーダに入力させてオブジェクト種類情報を推論できる。

【0028】

一方、本発明の他の実施形態によれば、オブジェクト識別装置において、１つ以上のプログラムを格納するメモリと、前記格納された１つ以上のプログラムを実行するプロセッサとを備え、前記プロセッサは、学習されたオブジェクト領域抽出モデルに基づいてオブジェクトイメージからオブジェクトが位置したオブジェクト領域を検出し、前記検出されたオブジェクト領域を切り出し、オブジェクト種類推論モデルを利用して前記切り出したオブジェクト領域に位置したオブジェクト種類情報を識別する、階層的モデルを利用したオブジェクト識別装置が提供され得る。

【0029】

一方、本発明の他の実施形態によれば、オブジェクト管理サーバにおいて、１つ以上のプログラムを格納するメモリと、前記格納された１つ以上のプログラムを実行するプロセッサとを備え、前記プロセッサは、学習されたオブジェクト領域抽出モデルに基づいてオブジェクトイメージからオブジェクトが位置したオブジェクト領域を検出し、前記検出されたオブジェクト領域を切り出し、オブジェクト種類推論モデルを利用して前記切り出したオブジェクト領域に位置したオブジェクト種類情報を識別する、階層的モデルを利用したオブジェクト管理サーバが提供され得る。

【発明の効果】

【0030】

開示された技術は、次の効果を有することができる。ただし、特定実施形態が次の効果を全部含むべきであるか、次の効果だけを含むべきであるという意味ではないので、開示された技術の権利範囲は、これによって制限されることと理解されてはならないであろう。

【0031】

本発明の実施形態等は、オブジェクト識別装置でオブジェクト領域を識別し、オブジェクト管理サーバでオブジェクト種類情報を識別することで、オブジェクト識別速度を増加させることができる。

【0032】

本発明の実施形態等は、オブジェクト領域抽出モデルとオブジェクト種類推論モデルとを利用してオブジェクトのカテゴリーを段階的に分類し、オブジェクト種類情報を識別することで、オブジェクトイメージで位置したオブジェクトを速かに決定することができる。

【0033】

本発明の実施形態等は、分類時点のリアルタイム性やオブジェクト識別装置の資源状態や演算負荷などを考慮して、分類すべきカテゴリーを調整することにより、オブジェクト識別動作の効率性を増加させることができる。

【0034】

本発明の実施形態等は、オブジェクト識別装置が自ら行い難いオブジェクトカテゴリー分類動作やオブジェクト情報決定動作をオブジェクト管理サーバと分けて速かに行うことにより、オブジェクト識別時間やオブジェクト識別正確性を向上させることができる。

【図面の簡単な説明】

【0035】

【図1】本発明の一実施形態に係る階層的モデルを利用したオブジェクト識別システムの構成を示した図である。

【0036】

【図2】本発明の一実施形態に係る階層的モデルを利用したオブジェクト識別方法を示したフローチャートである。

【0037】

【図3】本発明の一実施形態に使用されるオブジェクト領域推論モデルを示した図である。

【0038】

【図4】本発明の一実施形態に使用されるオブジェクト種類推論モデルを示した図である。

【0039】

【図5】本発明の一実施形態に係る階層的モデルを利用したオブジェクト識別方法を示したフローチャートである。

【0040】

【図6】本発明の一実施形態に係る階層的モデルを利用したオブジェクト識別動作の例示を示した図である。

【0041】

【図7】本発明の一実施形態に係る階層的モデルを利用したオブジェクト識別動作の例示を示した図である。

【0042】

【図8】本発明の一実施形態に係る階層的モデルを利用したオブジェクト識別動作の例示を示した図である。

【0043】

【図9】本発明の一実施形態に係る階層的モデルを利用したオブジェクト識別動作の例示を示した図である。

【0044】

【図10】本発明の一実施形態に係る階層的モデルを利用したオブジェクト識別方法がオブジェクト管理サーバと連動する動作を示した図である。

【発明を実施するための形態】

【0045】

本発明は、様々な変更を加えることができ、種々の実施形態を有することができるところ、特定実施形態を図面に例示し、詳細な説明に具体的に説明しようとする。しかしながら、これは、本発明を特定実施形態に限定しようとするものではなく、本発明の技術的思想及び技術範囲に含まれるあらゆる変換、均等物ないし代替物を含むことと理解されることができる。本発明を説明するにあたり、関連した公知技術についての具体的な説明が本発明の要旨を濁す恐れがあると判断される場合、その詳細な説明を省略する。

【0046】

第１、第２などの用語は、様々な構成要素を説明するのに使用されることができるが、構成要素等が用語等により限定されるものではない。用語等は、１つの構成要素を他の構成要素から区別する目的としてのみ使用される。

【0047】

本発明において使用した用語は、単に特定の実施形態を説明するために使用されたものであって、本発明を限定しようとする意図ではない。本発明において使用した用語は、本発明における機能を考慮しながら、なるべく現在広く使用される一般的な用語を選択したが、これは当分野に従事する技術者の意図、判例、または新しい技術の出現などによって変わることができる。また、特定の場合は、出願人が任意に選定した用語もあり、この場合、該当する発明の説明部分で詳細にその意味を記載するであろう。したがって、本発明において使用される用語は、単純な用語の名称ではない、その用語が有する意味と本発明の全般にわたる内容を基に定義されなければならない。

【0048】

単数の表現は、文脈上明白に異なるように意味しない限り、複数の表現を含む。本明細書において「含む」または「有する」などの用語は、明細書上に記載された特徴、数字、ステップ、動作、構成要素、部品、またはこれらを組み合わせたものが存在することを指定しようとするものであり、１つまたはそれ以上の他の特徴や数字、ステップ、動作、構成要素、部品、またはこれらを組み合わせたものなどの存在または付加可能性を予め排除しないことと理解されるべきである。

【0049】

以下、本発明の実施形態を添付図面を参照して詳細に説明し、添付図面を参照して説明するにあたり、同一であるか、対応する構成要素は、同じ図面番号を付与し、これについての重複する説明を省略する。

【0050】

図１は、本発明の一実施形態に係る階層的モデルを利用したオブジェクト識別システムの構成を示した図である。

【0051】

まず、図１に示すように、本発明に係るオブジェクト識別システム１０は、オブジェクト識別装置１００及びオブジェクト識別装置１００と通信するオブジェクト管理サーバ２００を備えることができる。

【0052】

オブジェクト識別装置１００は、学習されたオブジェクト領域抽出モデルに基づいてオブジェクトイメージからオブジェクトが位置したオブジェクト領域を検出し、検出されたオブジェクト領域を切り出すことができる。そして、オブジェクト識別装置１００は、切り出したオブジェクト領域をオブジェクト管理サーバ２００に送信することができる。

【0053】

オブジェクト管理サーバ２００は、オブジェクト種類推論モデルに基づいてオブジェクト識別装置１００から切り出したオブジェクト領域に位置したオブジェクト種類情報を識別できる。

【0054】

このように、オブジェクト種類情報を識別する動作は、オブジェクト識別装置１００で行わずに、オブジェクト管理サーバ２００で行われることができる。ここで、オブジェクト管理サーバ２００は、クラウドサーバで実現されることができる。または、オブジェクト領域を検出する動作とオブジェクト種類情報を識別する動作とは、オブジェクト識別装置１００で共に行われることができる。

【0055】

これは、オブジェクト領域検出及びオブジェクト種類識別動作の速度を上げるためである。例えば、ユーザが、オブジェクト識別装置１００が含まれたモバイル端末でオブジェクト（飲食）の写真を撮影したときに撮影した原本イメージファイルが４ＭＢであるが、４ＭＢの原本イメージファイルをクラウドにあるオブジェクト管理サーバ２００に送信すれば、容量が大き過ぎるようになる。したがって、オブジェクト識別装置１００は、原本イメージからオブジェクト（飲食）領域のみ切り出して、例えば、２００ＫＢのみクラウドにあるオブジェクト管理サーバ２００に送信することができる。このように、モバイル端末では、オブジェクト領域を検出する動作のみ行い、クラウドでオブジェクト種類情報を識別する動作を行うこともできる。または、モバイル端末でオブジェクト領域を検出する動作とオブジェクト種類情報を識別する動作とを共に行うこともできる。

【0056】

ここで、オブジェクト領域を検出する動作とオブジェクト種類情報を識別する動作との主体は、オブジェクト管理サーバ２００に送信するデータ容量、オブジェクト識別装置１００のハードウェア性能、オブジェクト管理サーバ２００とオブジェクト識別装置１００との間の通信速度、オブジェクト領域抽出モデルまたはオブジェクト種類推論モデルの大きさ、及びオブジェクト種類情報の識別正確度のうち、少なくとも１つに基づいて決定されることができる。例えば、予め設定された閾値よりデータ容量が小さく、ハードウェア性能が高く、通信速度が遅く、モデルの大きさが小さく、正確度が高い場合では、オブジェクト識別装置１００がオブジェクト領域を検出する動作とオブジェクト種類情報を識別する動作とを行うことが有利でありうる。逆に、予め設定された閾値よりデータ容量が大きく、ハードウェア性能が低く、通信速度が速く、モデルの大きさが大きく、正確度が低い場合では、オブジェクト識別装置１００がオブジェクト領域を検出する動作を行い、オブジェクト管理サーバ２００がオブジェクト種類情報を識別する動作を行うことが有利でありうる。このとき、オブジェクト識別装置１００は、検出されたオブジェクト領域を切り出す動作の代りに、検出されたオブジェクト領域を変換してオブジェクト管理サーバ２００に送信することができる。例えば、オブジェクト識別装置１００は、検出されたオブジェクト領域の解像度を低くし、サムネールに変換してオブジェクト管理サーバ２００に速く送るか、オブジェクト領域が含まれたファイルを送るとき、拡張子やファイル形式を変換してオブジェクト管理サーバ２００に送ることができる。

【0057】

一方、図１に示されたように、オブジェクト識別装置１００は、通信モジュール１１０、カメラ１２０、ディスプレイ１３０、メモリ１４０、及びプロセッサ１５０を備えることができる。オブジェクト管理サーバ２００は、通信モジュール２１０、メモリ２２０、及びプロセッサ２３０を備えることができる。

【0058】

しかし、図示された構成要素が全て必須構成要素であるものではない。図示された構成要素より多い構成要素によりオブジェクト識別システム１０が実現され得るし、それより少ない構成要素によってもオブジェクト識別システム１０が実現され得る。

【0059】

以下、図１のオブジェクト識別システム１０の各構成要素の具体的な構成及び動作を説明する。

【0060】

まず、オブジェクト識別装置１００の各構成要素の具体的な構成及び動作を説明する。

【0061】

通信モジュール１１０は、オブジェクト識別装置１００と無線通信装置との間、またはオブジェクト識別装置１００とオブジェクト管理サーバ２００との間の通信を可能にする１つ以上のモジュールを含むことができる。また、通信モジュール１１０は、オブジェクト識別装置１００を１つ以上のネットワークに連結する１つ以上のモジュールを含むことができる。

【0062】

カメラ１２０は、ユーザの操作によってイメージまたは動画を撮影できる。カメラ１２０は、単一カメラ、複数のカメラ、単一イメージセンサ、または複数のイメージセンサからなることができる。カメラ１２０は、少なくとも１つの２Ｄカメラ、少なくとも１つの３Ｄカメラ、少なくとも１つのステレオカメラ、少なくとも１つのイメージセンサのうち、少なくとも１つで構成されることができる。ここで、カメラ１２０は、ユーザの操作によって食事前後にオブジェクトをイメージまたは動画で撮影することができる。

【0063】

ディスプレイ１３０は、タッチセンサと相互レイヤ構造をなすか、一体型で形成されることによってタッチスクリーンを実現できる。このようなタッチスクリーンは、オブジェクト識別装置１００とユーザとの間の入力インターフェースを提供するとともに、オブジェクト識別装置１００とユーザとの間の出力インターフェースを提供することができる。

【0064】

メモリ１４０は、オブジェクト識別装置１００の様々な機能を支援するデータを格納することができる。メモリ１４０は、オブジェクト識別装置１００で駆動される１つ以上のプログラム、複数の応用プログラム（ａｐｐｌｉｃａｔｉｏｎｐｒｏｇｒａｍ）、またはアプリケーション（ａｐｐｌｉｃａｔｉｏｎ）、オブジェクト識別装置１００の動作のためのデータ、命令語を格納することができる。このような応用プログラムのうち少なくとも一部は、無線通信を介してオブジェクト管理サーバ２００からダウンロードされることができる。また、このような応用プログラムのうち少なくとも一部は、オブジェクト識別装置１００の基本的な機能のために存在することができる。一方、応用プログラムは、メモリ１４０に格納され、オブジェクト識別装置１００上に設けられて、プロセッサ１５０によりオブジェクト識別装置１００の動作（または、機能）を行うように駆動されることができる。

【0065】

プロセッサ１５０は、前記応用プログラムと関連した動作の他にも、通常的にオブジェクト識別装置１００の全般的な動作を制御できる。プロセッサ１５０は、上記で説明した構成要素を介して入力または出力される信号、データ、情報などを処理するか、メモリ１４０に格納された応用プログラムを駆動することにより、ユーザに適切な情報または機能を提供または処理することができる。

【0066】

一実施形態において、プロセッサ１５０は、メモリ１４０に格納された１つ以上のプログラムを実行することで、学習されたオブジェクト領域抽出モデルに基づいてオブジェクトイメージからオブジェクトが位置したオブジェクト領域を検出し、検出されたオブジェクト領域を切り出し、オブジェクト種類推論モデルに基づいて前記切り出したオブジェクト領域に位置したオブジェクト種類情報を識別する。

【0067】

実施形態等によれば、プロセッサ１５０は、学習されたオブジェクト領域抽出モデルに基づいてオブジェクトイメージから前記オブジェクトを囲んでいるボックス（Ｂｏｘ）またはオブジェクトが占めているピクセル（Ｐｉｘｅｌ）を用いてオブジェクト領域を検出できる。

【0068】

実施形態等によれば、プロセッサ１５０は、学習されたオブジェクト領域抽出モデルの第１イメージエンコーダを介して第１特徴点を抽出し、抽出された第１特徴点から特徴点領域を抽出してオブジェクト領域を推論できる。

【0069】

実施形態等によれば、プロセッサ１５０は、学習されたオブジェクト領域抽出モデルに基づいてオブジェクトイメージからオブジェクトが位置したオブジェクト領域を検出し、検出されたオブジェクト領域を切り出し、切り出したオブジェクト領域に位置したオブジェクト種類のカテゴリーを段階的に分類し、分類されたカテゴリーと対応するオブジェクト種類推論モデルを利用してオブジェクト種類情報を識別できる。

【0070】

実施形態等によれば、プロセッサ１５０は、切り出したオブジェクト領域に位置したオブジェクトのカテゴリーを最上位大分類から順次最下位小分類まで段階的に分類することができる。

【0071】

実施形態等によれば、プロセッサ１５０は、分類されたカテゴリーである最下位小分類と対応するオブジェクト種類推論モデルを利用してオブジェクト種類情報を識別できる。

【0072】

実施形態等によれば、プロセッサ１５０は、オブジェクト種類情報を前記分類された最下位小分類に含まれた複数のクラスのうち、いずれか１つのクラスとして判別することができる。

【0073】

実施形態等によれば、プロセッサ１５０は、分類されたカテゴリーと対応するオブジェクト種類推論モデルの第２イメージエンコーダを介して第２特徴点を抽出し、抽出された第２特徴点を特徴点デコーダに入力させてオブジェクト種類情報を推論できる。

【0074】

実施形態等によれば、オブジェクト識別装置１００は、オブジェクト管理サーバ２００と通信する通信モジュール２１０をさらに備え、プロセッサ１５０は、通信モジュール２１０を介して切り出したオブジェクト領域及び分類されたオブジェクト種類のカテゴリーをオブジェクト管理サーバ２００に送信してオブジェクト種類識別を要請し、オブジェクト管理サーバ２００から分類されたカテゴリーと対応するオブジェクト種類推論モデルを利用して判別されたオブジェクト種類情報を受信することができる。

【0075】

また、プロセッサ１５０は、メモリ１４０に格納された応用プログラムを駆動するために、図１とともに説明した構成要素のうち少なくとも一部を制御できる。さらに、プロセッサ１５０は、前記応用プログラムの駆動のために、オブジェクト識別装置１００に含まれた構成要素のうち少なくとも２つ以上を互いに組み合わせて動作させることができる。ここで、プロセッサ１５０についての詳細な説明は後述する。

【0076】

一方、次に、オブジェクト管理サーバ２００の各構成要素の具体的な構成及び動作を説明する。

【0077】

通信モジュール２１０は、オブジェクト管理サーバ２００と無線通信装置との間、またはオブジェクト管理サーバ２００とオブジェクト識別装置１００との間の通信を可能にする１つ以上のモジュールを含むことができる。また、通信モジュール２１０は、オブジェクト管理サーバ２００を１つ以上のネットワークに連結する１つ以上のモジュールを含むことができる。

【0078】

メモリ２２０は、オブジェクト管理サーバ２００の様々な機能を支援するデータを格納することができる。メモリ２２０は、オブジェクト管理サーバ２００で駆動される１つ以上のプログラム、複数の応用プログラム（ａｐｐｌｉｃａｔｉｏｎｐｒｏｇｒａｍ）、またはアプリケーション（ａｐｐｌｉｃａｔｉｏｎ）、オブジェクト管理サーバ２００の動作のためのデータ、命令語を格納することができる。このような応用プログラムのうち少なくとも一部は、無線通信によって外部通信網を介してオブジェクト管理サーバ２００にダウンロードされることができる。また、このような応用プログラムのうち少なくとも一部は、オブジェクト管理サーバ２００の基本的な機能のために存在することができる。一方、応用プログラムは、メモリ２２０に格納され、オブジェクト管理サーバ２００上に設けられて、プロセッサ２３０によりオブジェクト管理サーバ２００の動作（または、機能）を行うように駆動されることができる。

【0079】

プロセッサ２３０は、前記応用プログラムと関連した動作の他にも、通常的にオブジェクト管理サーバ２００の全般的な動作を制御できる。プロセッサ２３０は、上記で説明した構成要素を介して入力または出力される信号、データ、情報などを処理するか、メモリ２２０に格納された応用プログラムを駆動することにより、ユーザに適切な情報または機能を提供または処理することができる。

【0080】

一実施形態において、プロセッサ２３０は、メモリ２２０に格納されたオブジェクト識別装置１００と連動してオブジェクトイメージでオブジェクト情報を決定する動作と関連した１つ以上のプログラムを実行できる。一例として、プロセッサ２３０は、切り出したオブジェクト領域に位置したオブジェクトのカテゴリーの中でオブジェクト識別装置１００で分類しなかった残りのカテゴリーを段階的に分類し、分類されたカテゴリーと対応するオブジェクト種類推論モデルを利用してオブジェクト種類情報を決定できる。

【0081】

以上、図１を参照して、本発明に係るオブジェクト識別システム１０の構成について詳細に説明した。オブジェクト識別システム１０は、図１に示された構成要素よりさらに少ない数の構成要素やさらに多くの構成要素を含むこともできる。

【0082】

以下、図２～図６を参照して、本発明の様々な実施形態に係るオブジェクト識別方法について説明する。

【0083】

図２は、本発明の一実施形態に係る階層的モデルを利用したオブジェクト識別方法を示したフローチャートである。

【0084】

図２に示されたように、ステップＳ１０１において、本発明の一実施形態に係る階層的モデルを利用したオブジェクト識別装置１００は、学習されたオブジェクト領域抽出モデルに基づいてオブジェクトイメージからオブジェクトが位置したオブジェクト領域を検出し、検出されたオブジェクト領域を切り出す。次いで、オブジェクト識別装置１００は、検出されたオブジェクト領域をオブジェクト管理サーバ２００に送信する。

【0085】

ステップＳ１０２において、オブジェクト管理サーバ２００は、オブジェクト種類推論モデルに基づいて切り出したオブジェクト領域に位置したオブジェクト種類情報を識別する。

【0086】

このように、本発明の一実施形態に係るオブジェクト識別装置１００は、オブジェクト領域抽出モデルに基づいてオブジェクトイメージからオブジェクトが位置したオブジェクト領域を検出し、オブジェクト管理サーバ２００は、オブジェクト種類推論モデルが含まれた階層的モデルを利用して階層的にオブジェクトを分類する。このような階層的オブジェクト分類の利点を説明する。すなわち、人工知能（ＡＩ）モデルを１つのステージ（ｏｎｅ－ｓｔａｇｅ）にて直ちにオブジェクトの細部クラスを把握せずに上位カテゴリーを探すことができるモデルと上位モデルが探したオブジェクトを切り出して、オブジェクトのクラスを分類するモデルとを利用してシステムを構成したときの利点は、下記のとおりである。

【0087】

一例として、飲食の場合、モデルを学習するために、飲食イメージを収集することになる。このとき、飲食の場合、米飯、白菜キムチ、カットゥギなどが相対的にかなり多く出現し、桔梗の根の和え物、わらびのナムル、いりこ炒めなどの飲食は、低い頻度で出現するようになる。すると、米飯、白菜キムチ、カットゥギ、桔梗の根の和え物、わらびのナムル、いりこ炒めなどが含まれた飲食イメージがあるとき、１つのステージ（ｏｎｅ－ｓｔａｇｅ）モデルを作るための学習データは、全ての飲食をラベリングしなければならない。

【0088】

しかし、本発明の実施形態のように、飲食を探すモデル（Ａ）と、探した飲食を切り出して、どの飲食であるか分類するモデル（Ｂ）との２つを組み合わせた人工知能システムを作ることができる。本発明の実施形態は、飲食イメージから全ての飲食を探したら、モデル（Ａ）は、この飲食イメージに対してはさらに学習しなくても良い。したがって、本発明の実施形態は、飲食分類のためのモデル（Ｂ）が必要なデータ（例：わらびのナムル、いりこ炒め、桔梗の根の和え物）のみラベリングし、切り出して学習を進行しても良い。

【0089】

追加的な利点では、１つのステージ（ｏｎｅ－ｓｔａｇｅ）モデルの場合に、一度もみたことのない飲食の場合には、全く認識できない場合も発生しうる。

【0090】

しかし、本発明の実施形態に係るオブジェクト識別装置１００は、いろいろな飲食を「飲食」という１つのクラスとして学習したモデルを介して動作するので、飲食という全般的な（ｏｖｅｒａｌｌ）特徴を学習したモデルを利用して、新しい飲食をみたときにも、飲食ということを予測できる長所を有することができる。

【0091】

更には、本発明の実施形態は、飲食ドメインだけでなく、自律走行ドメインにも適用されることができる。自動車が認知すべき移動手段対象をカテゴリーに括り（例えば、自動車、自転車、耕運機等）、その後、細部カテゴリーを分類したら、自動車を十分によく捕まえるモデルがあるときは、自動車をラベリングする費用を減らし、耕運機をラベリングするのにさらにリソースを多く使うことができる。したがって、効率的なラベリング及び早いモデル開発になることができる。また、本発明の実施形態がトラクターを初めてみる場合にも、「移動手段」ということと認知する可能性を増加させることができる。

【0092】

図３は、本発明の一実施形態に使用されるオブジェクト領域推論モデルを示した図である。

【0093】

図３に示されたように、オブジェクト識別装置１００は、オブジェクト領域推論モデル３００を基本にオブジェクトイメージからオブジェクトが位置したオブジェクト領域を検出できる。

【0094】

オブジェクト識別装置１００で実行されるオブジェクト領域推論モデル３００は、入力されたオブジェクトイメージを第１エンコーダ３１０に入れて第１エンコード動作を行う。オブジェクト領域推論モデル３００は、第１エンコード動作を介してオブジェクトイメージに対する特徴点を抽出する。ここで、オブジェクト領域推論モデル３００は、複数の第１エンコーダ３１０と複数の特徴点抽出ブロック３２０とが順序通りに連結されている構造を有することができる。

【0095】

そして、オブジェクト領域推論モデル３００は、抽出された複数の特徴点を利用して特徴点領域を抽出し（３３０）、抽出された特徴点領域を利用してオブジェクトイメージからオブジェクト領域を推論する（３４０）。

【0096】

その後、オブジェクト領域推論モデル３００は、推論されたオブジェクト領域を切り出し、切り出したオブジェクト領域を出力する。

【0097】

図４は、本発明の一実施形態に使用されるオブジェクト種類推論モデルを示した図である。

【0098】

図４に示されたように、オブジェクト識別装置１００は、分類されたカテゴリーと対応するオブジェクト種類推論モデル４００を利用してオブジェクト種類情報を識別できる。

【0099】

オブジェクト識別装置１００で実行されるオブジェクト種類推論モデル４００は、入力された切り出したオブジェクト領域イメージを第２エンコーダ４１０に入れて第２エンコード動作を行う。オブジェクト種類推論モデル４００は、第２エンコード動作を介して切り出したオブジェクト領域イメージに対する特徴点を抽出する（４２０）。ここで、オブジェクト種類推論モデル４００は、オブジェクト領域推論モデル３００と異なり、１つの第２エンコーダ４１０と特徴点デコーダ４３０とを備えることができる。

【0100】

そして、オブジェクト種類推論モデル４００は、抽出された切り出したオブジェクト領域に対する特徴点を特徴点デコーダ４３０に入力させて特徴点デコード動作を行う。次いで、オブジェクト種類推論モデル４００は、特徴点デコード結果を利用して、切り出したオブジェクト領域に位置したオブジェクト種類を推論する（４４０）。

【0101】

その後、オブジェクト種類推論モデル４００は、推論されたオブジェクト種類を出力する。

【0102】

一方、一般的な人工知能（ＡＩ）技法でオブジェクトを分析する場合、オブジェクト位置判別（例えば、ボックスまたはピクセル）動作と、オブジェクト種類判別動作とが１つのモデルで同時に起こるようになる。

【0103】

本発明の一実施形態に係るオブジェクト識別装置１００は、オブジェクト領域推論モデル３００に基づいてオブジェクトイメージからオブジェクトが位置したオブジェクト領域を検出し、オブジェクト種類推論モデル４００に基づいてオブジェクト種類情報を識別できる。すなわち、オブジェクト識別装置１００は、オブジェクトイメージからオブジェクトを探すオブジェクト領域推論モデル３００とオブジェクトイメージから探したオブジェクトの種類を分析するオブジェクト種類推論モデル４００とを備える。

【0104】

ここで、オブジェクト識別装置１００は、切り出したオブジェクト領域に位置したオブジェクト種類のカテゴリーを分類し、オブジェクト種類を分析することができる。または、オブジェクト識別装置１００は、切り出したオブジェクト領域に位置したオブジェクト種類のカテゴリーを分類せずに、オブジェクト種類を分析することができる。

【0105】

このように、オブジェクト領域推論モデル３００とオブジェクト種類推論モデル４００とを分離する場合、下記のような長所を得るようになることができる。

【0106】

第１に、オブジェクト領域推論モデル３００とオブジェクト種類推論モデル４００とが分離されているので、各モデルでの学習データが分離され得る。オブジェクトモデルを１つのモデルとして使用する場合、学習データを作るために、オブジェクトイメージを収集する。そして、オブジェクトイメージ内にある新規オブジェクトと以前に知っているオブジェクトとがあるとき、知っているオブジェクトであってもラベリングしなければならない。仮りに、ラベリングしない場合、オブジェクトモデルがそのオブジェクトに対して忘却するようになることができる。逆に、本発明の一実施形態のようにオブジェクトモデルを分離する場合は、新規オブジェクトのみラベリングすることができる。オブジェクトイメージからオブジェクト領域が位置した当該領域のみ切り出して学習するので、オブジェクト識別装置１００は、知っているオブジェクトに対してラベリングしなくても良い。

【0107】

第２に、オブジェクト領域推論モデル３００とオブジェクト種類推論モデル４００とが分離されているので、オブジェクトイメージに表れることができる新規オブジェクトに対して認識性能が上昇され得る。オブジェクトモデルを１つのモデルとして使用する場合は、自分が知っているオブジェクトのみ探すため、新規オブジェクトを認知できない可能性が高い。逆に、本発明の一実施形態のようにオブジェクトモデルを分離する場合は、種々のオブジェクトをみて、オブジェクトイメージでオブジェクトという特徴点を学習したオブジェクトモデルである。したがって、オブジェクト領域推論モデル３００は、オブジェクトイメージで初めてみるオブジェクトが表れた場合にも、オブジェクト種類を正確に認識できなくてもオブジェクトということを認知し、感知することができる。

【0108】

図５は、本発明の一実施形態に係る階層的モデルを利用したオブジェクト識別方法を示したフローチャートである。

【0109】

図５に示されたように、ステップＳ２０１において、本発明の一実施形態に係る階層的モデルを利用したオブジェクト識別装置１００は、オブジェクト領域抽出モデルに基づいてオブジェクトイメージから少なくとも１つのオブジェクトが位置したオブジェクト領域を検出する。

【0110】

ステップＳ２０２において、オブジェクト識別装置１００は、検出オブジェクト領域を切り出し、切り出したオブジェクト領域に位置したオブジェクトのカテゴリーを分類する。

【0111】

ステップＳ２０３において、オブジェクト識別装置１００は、分類されたカテゴリーと対応するオブジェクト種類推論モデルを利用してオブジェクトを決定する。

【0112】

図６～図９は、本発明の一実施形態に係る階層的モデルを利用したオブジェクト識別動作の例示を示した図である。

【0113】

オブジェクト識別装置１００は、オブジェクトイメージでどのオブジェクトがあるか区別するために、図６～図９に示された動作を介してオブジェクト情報を決定できる。

【0114】

図６に示されたように、オブジェクト識別装置１００は、オブジェクトイメージ５１０を受信することができる。このようなオブジェクトイメージ５１０は、オブジェクト５１１が含まれた原本イメージであることができる。オブジェクトイメージ５１０は、オブジェクト識別装置１００に備えられたカメラを介して撮影されたオブジェクトイメージまたは現在カメラを介してオブジェクトを撮影して画面にディスプレイされているオブジェクトイメージであることができる。オブジェクトイメージ５１０には、少なくとも１つのオブジェクト５１１が含まれ得る。オブジェクトイメージ５１０には、食器やトレーなどにオブジェクト５１１が入れられていることができる。

【0115】

図７に示されたように、オブジェクト識別装置１００は、学習されたオブジェクト領域抽出モデル３００に基づいてオブジェクトイメージ５１０からオブジェクト５１１がどの領域にあるか確認することができる。オブジェクト識別装置１００は、オブジェクトイメージ５１０からオブジェクトがあるオブジェクト領域５１２とオブジェクト以外の他のものが位置したオブジェクト以外の領域を検出できる。

【0116】

一例として、オブジェクト識別装置１００は、学習されたオブジェクト領域抽出モデル３００に基づいてオブジェクトイメージ５１０からオブジェクト５１１を囲んでいるボックス（ｂｏｘ）を探すことができる。オブジェクト識別装置１００は、オブジェクトを囲んでいるボックスを用いてオブジェクト領域５１２を検出できる。オブジェクト識別装置１００は、オブジェクト５１１を囲んでいるボックス以外の残りの領域をオブジェクト以外の領域として検出することができる。または、オブジェクト識別装置１００は、オブジェクトを囲んでいるエッジ（Ｅｄｇｅ）を検出し、検出されたエッジを連結した領域をオブジェクト領域として検出することができる。

【0117】

他の例として、オブジェクト識別装置１００は、学習されたオブジェクト領域抽出モデル３００に基づいてオブジェクトイメージ５１０からオブジェクト５１１が占めているピクセル（ｐｉｘｅｌ）を探すことができる。オブジェクト識別装置１００は、オブジェクトが占めているピクセルを用いてオブジェクト領域５１２を検出できる。オブジェクト識別装置１００は、オブジェクトが占めているピクセル以外の残りの領域をオブジェクト以外の領域として検出することができる。

【0118】

オブジェクトイメージ５１０でボックスまたはピクセルに対するオブジェクト領域検出動作を説明すれば、次のとおりである。オブジェクト識別装置１００は、まず、オブジェクトイメージを受信する。そして、オブジェクト識別装置１００は、オブジェクトイメージでコンボリューション神経網（ｃｏｎｖｏｌｕｔｉｏｎｎｅｕｒａｌｎｅｔｗｏｒｋ）を介してオブジェクトイメージに対する特徴マップを抽出できる。次いで、オブジェクト識別装置１００は、抽出された特徴マップからオブジェクト特徴があるオブジェクト領域を抽出できる。

【0119】

図８に示されたように、オブジェクト識別装置１００は、図６で検出されたオブジェクト領域を切り出し、切り出したオブジェクト領域５１３に位置したオブジェクト５１１のカテゴリーを分類することができる。ここで、オブジェクト識別装置１００は、図６で検出されたオブジェクト領域５１２が含まれたボックス（ｂｏｘ）をクロップ（ｃｒｏｐ）してオブジェクト領域５１２を切り出すことができる。

【0120】

このとき、オブジェクト識別装置１００は、切り出したオブジェクト領域５１３に含まれたオブジェクト５１１に対してオブジェクトのカテゴリーを最上位カテゴリーから段階的に下向きにして分類することができる。一例として、オブジェクト識別装置１００は、最上位カテゴリーに該当する複数の大分類のうち、特定大分類でオブジェクトのカテゴリーを分類することができる。例えば、オブジェクト識別装置１００は、切り出したオブジェクト領域に含まれたオブジェクトが韓食である場合、韓食の包括的な範囲に該当するカテゴリーに分類することができる。オブジェクト識別装置１００は、ご飯、汁物、どんぶり、麺、キムチ類、デザート類などの包括的な範囲の中で当該オブジェクトのカテゴリーを探すことができる。図８において、オブジェクト識別装置１００は、それぞれのクロップされたオブジェクト領域に含まれたオブジェクトがご飯種類に判別されて、ご飯のカテゴリーに分類を進行できる。当該オブジェクトが含まれた最上位カテゴリーが韓食、和食、中華、洋食である場合、最上位カテゴリーの中で当該オブジェクトカテゴリーを探すことができる。

【0121】

オブジェクトカテゴリーは、特定カテゴリーに限定されず、オブジェクト識別装置１００は、オブジェクトを最優先で包括できる最上位カテゴリーから順次下向きにして分類することができる。ここで、オブジェクト識別装置１００は、オブジェクトの最上位カテゴリーが大分類、次上位カテゴリーが中分類、最下位カテゴリーが小分類である場合、オブジェクト識別装置１００は、オブジェクト領域に対する大分類を１次的に分類し、分類された大分類の中でオブジェクト領域に対する中分類を２次的に分類し、分類された中分類の中でオブジェクト領域に対する小分類を３次的に分類することができる。

【0122】

図９に示されたように、オブジェクト識別装置１００は、オブジェクトイメージ５１０でオブジェクト領域５１２に含まれたオブジェクト全体に対して先にオブジェクト５１１のカテゴリーを分類し、分類されたカテゴリーと対応するオブジェクト種類推論モデル４００を利用してオブジェクト情報５１４を最終的に決定することができる。オブジェクト識別装置１００は、オブジェクト領域５１２のカテゴリーをご飯種類に分類した場合、ご飯種類に対応するご飯オブジェクト推論モデルを利用してオブジェクト情報５１４をキビご飯に決定することができる。例えば、オブジェクト識別装置１００は、ご飯種類に対応するご飯オブジェクト推論モデル、すなわち、ご飯種類の中で下位分類に属する米飯、黒米ご飯、または黒豆ご飯であるかなどを区別することができるオブジェクトモデルを利用して特定ご飯を決定できる。図８では、オブジェクト識別装置１００は、ご飯種類に対応するご飯オブジェクト推論モデルを利用してオブジェクト領域に含まれたオブジェクトを最終的にキビご飯に決定することができる。

【0123】

その後、オブジェクト識別装置１００は、オブジェクトイメージ５１０から検出されたオブジェクト領域に含まれたそれぞれのオブジェクトに対して同じオブジェクト識別方法でオブジェクト情報の決定動作を進行して、オブジェクトイメージ内にどのオブジェクトがあるかを正確に判別することができる。例えば、オブジェクト識別装置１００は、オブジェクトトレーに含まれたそれぞれのオブジェクトに対して、キビご飯、ほうれん草味噌汁、牛肉及びうずらの卵醤油煮、キムチチヂミ、カットゥギ、ミカンなどにオブジェクト情報を最終的に決定することができる。このとき、オブジェクト識別装置１００は、オブジェクトカテゴリーを最下位カテゴリーまで決定し、決定されたオブジェクトのカテゴリーの中でオブジェクト種類推論モデル４００の種類、例えば、ご飯オブジェクト推論モデル、汁物オブジェクト推論モデル、おかずオブジェクト推論モデルなどを各々利用して最下位オブジェクトカテゴリーに該当するオブジェクト情報を決定できる。

【0124】

図１０は、本発明の一実施形態に係る階層的モデルを利用したオブジェクト識別方法がオブジェクト管理サーバと連動する動作を示した図である。

【0125】

オブジェクトイメージから切り出したオブジェクト領域に含まれたオブジェクトが最上位カテゴリーから最下位カテゴリーまで大分類、中分類、小分類に区分されている場合に、オブジェクト識別装置１００とオブジェクト管理サーバ２００との連動動作を介してオブジェクトを識別する動作が図７に示されている。ここで、オブジェクトカテゴリーは、階層的に特定個数の階層に限定されない。例えば、オブジェクトカテゴリーは、２個の階層、すなわち、大分類、中分類にのみ分類されることができるか、３個の階層、すなわち、大分類、中分類、小分類に分類されることができる。オブジェクトカテゴリーは、自然数ｎ個の階層が含まれたカテゴリーに分類されることができ、特定階層に限定されない。

【0126】

このとき、オブジェクト識別装置１００は、全体カテゴリー分類動作の中で予め分類しなければならないカテゴリー階層が予め設定され得る。または、オブジェクト識別装置１００は、分類時点のリアルタイム性や装置資源状態や演算負荷などを考慮して、分類すべきカテゴリーが調整され得る。これと対応して、オブジェクト管理サーバ２００は、オブジェクト識別装置１００に比べて分類性能が高く、可用可能な資源が多いので、オブジェクト識別装置１００で時間的または正確性の側面で効率が低い動作を行い、オブジェクト識別装置１００に当該結果を送信することができる。

【0127】

例えば、オブジェクトイメージからオブジェクト領域を切り出し、切り出したオブジェクト領域に対する大分類、中分類、小分類に対する分類動作は、時間または負荷が少なくかかることに対し、特定オブジェクト情報を決定する動作は、演算量が多く必要であり、正確性が低くなるとき、オブジェクト管理サーバ２００がこのような動作をオブジェクト識別装置１００に代えて行うことができる。これを通じて、オブジェクト管理サーバ２００は、オブジェクト識別装置１００が自ら行い難い動作を行い、識別時間や識別正確性を向上させることができる。

【0128】

図１０に示されたように、ステップＳ３０１において、オブジェクト識別装置１００は、オブジェクト領域抽出モデルに基づいてオブジェクトイメージから少なくとも１つのオブジェクトが位置したオブジェクト領域を検出する。

【0129】

ステップＳ３０２において、オブジェクト識別装置１００は、検出オブジェクト領域を切り出し、切り出したオブジェクト領域に位置したオブジェクトのカテゴリーを特定大分類に１次に分類する。

【0130】

ステップＳ３０３において、オブジェクト識別装置１００は、特定大分類情報を利用してオブジェクト領域イメージのオブジェクトカテゴリーを特定中分類に２次に分類する。

【0131】

ステップＳ３０４において、オブジェクト識別装置１００は、特定中分類情報を利用してオブジェクト領域イメージのオブジェクトカテゴリーを特定小分類に３次に分類する。

【0132】

ステップＳ３０５において、オブジェクト識別装置１００は、切り出したオブジェクト領域イメージ及び分類された大分類、中分類、小分類情報を送信する。

【0133】

ステップＳ３０６において、オブジェクト管理サーバ２００は、特定小分類情報と対応するオブジェクト種類推論モデルを利用してオブジェクト領域イメージのオブジェクト種類情報を決定する。

【0134】

ステップＳ３０７において、オブジェクト管理サーバ２００は、決定されたオブジェクト情報をオブジェクト識別装置１００に送信する。

【0135】

ステップＳ３０８において、オブジェクト識別装置１００は、受信されたオブジェクト種類情報を利用してオブジェクトイメージに含まれた各オブジェクトに対してオブジェクト種類情報を確認する。

【0136】

このように、図１０のオブジェクト識別動作例示は、カテゴリー分類動作はオブジェクト識別装置１００が行い、オブジェクト情報決定動作はオブジェクト管理サーバ２００が行う例示である。ここで、各ステップを行う主体が固定的でないことがある。例えば、オブジェクトイメージに含まれたオブジェクトの個数、オブジェクトイメージの大きさや容量、オブジェクトイメージに含まれたオブジェクト情報に必要な時間、オブジェクト識別装置１００とオブジェクト管理サーバ２００との間の通信状態、オブジェクト識別装置１００に格納されたオブジェクトモデルの状態などによって段階別カテゴリー分類動作とオブジェクト情報識別動作との主体が変わり得る。

【0137】

一方、プロセッサにより実行されるとき、前記プロセッサをして方法を実行させる命令語を格納するための非一時的コンピュータ読み取り可能格納媒体であって、オブジェクト識別装置が、学習されたオブジェクト領域抽出モデルに基づいてオブジェクトイメージからオブジェクトが位置したオブジェクト領域を検出し、前記検出されたオブジェクト領域を切り出すステップと、オブジェクト管理サーバがオブジェクト種類推論モデルに基づいて前記オブジェクト識別装置から切り出したオブジェクト領域に位置したオブジェクト種類情報を識別するステップとを含む、非一時的コンピュータ読み取り可能な格納媒体が提供され得る。

【0138】

一方、本発明の一実施形態によれば、以上で説明された様々な実施形態は、機器（ｍａｃｈｉｎｅ）（例：コンピュータ）で読み出すことができる格納媒体（ｍａｃｈｉｎｅ－ｒｅａｄａｂｌｅｓｔｏｒａｇｅｍｅｄｉａ）に格納された命令語を含むソフトウェアで実現されることができる。機器は、格納媒体から格納された命令語を呼び出し、呼び出された命令語によって動作が可能な装置であって、開示された実施形態等に係る電子装置（例：電子装置（Ａ））を含むことができる。命令がプロセッサにより実行される場合、プロセッサが直接、またはプロセッサの制御下に他の構成要素を利用して命令に該当する機能を実行できる。命令は、コンパイラーまたはインタープリターにより生成または実行されるコードを含むことができる。機器で読み出すことができる格納媒体は、非一時的（ｎｏｎ－ｔｒａｎｓｉｔｏｒｙ）格納媒体の形態で提供されることができる。ここで、「非一時的」は、格納媒体が信号（ｓｉｇｎａｌ）を含まず、実在（ｔａｎｇｉｂｌｅ）するということを意味し、データが格納媒体に半永久的または臨時的に格納されることを区分しない。

【0139】

また、本発明の一実施形態によれば、以上で説明された様々な実施形態に係る方法は、コンピュータプログラム製品（ｃｏｍｐｕｔｅｒｐｒｏｇｒａｍｐｒｏｄｕｃｔ）に含まれて提供されることができる。コンピュータプログラム製品は、商品として販売者及び購買者間に取引されることができる。コンピュータプログラム製品は、機器で読み出すことができる格納媒体（例：ｃｏｍｐａｃｔｄｉｓｃｒｅａｄｏｎｌｙｍｅｍｏｒｙ（ＣＤ－ＲＯＭ））の形態で、またはアプリケーションストア（例：プレイストアＴＭ）を介してオンラインで配信されることができる。オンライン配信の場合に、コンピュータプログラム製品の少なくとも一部は、製造社のサーバ、アプリケーションストアのサーバ、または中継サーバのメモリのような格納媒体に少なくとも一時格納されるか、臨時的に生成されることができる。

【0140】

また、本発明の一実施形態によれば、以上で説明された様々な実施形態は、ソフトウェア（ｓｏｆｔｗａｒｅ）、ハードウェア（ｈａｒｄｗａｒｅ）、またはこれらの組み合わせを利用してコンピュータ（ｃｏｍｐｕｔｅｒ）またはこれと類似した装置で読み出すことができる記録媒体内で実現されることができる。一部の場合において、本明細書において説明される実施形態等がプロセッサ自体で実現されることができる。ソフトウェア的な実現によれば、本明細書において説明される手順及び機能のような実施形態等は、別のソフトウェアモジュールで実現されることができる。ソフトウェアモジュールの各々は、本明細書において説明される１つ以上の機能及び動作を行うことができる。

【0141】

一方、上述した様々な実施形態に係る機器のプロセシング動作を行うためのコンピュータ命令語（ｃｏｍｐｕｔｅｒｉｎｓｔｒｕｃｔｉｏｎｓ）は、非一時的コンピュータ読み取り可能媒体（ｎｏｎ－ｔｒａｎｓｉｔｏｒｙｃｏｍｐｕｔｅｒ－ｒｅａｄａｂｌｅｍｅｄｉｕｍ）に格納されることができる。このような非一時的コンピュータ読み取り可能媒体に格納されたコンピュータ命令語は、特定機器のプロセッサにより実行されたとき、上述した様々な実施形態に係る機器での処理動作を特定機器が行うようにする。非一時的コンピュータ読み取り可能媒体とは、レジスタ、キャッシュ、メモリなどのように、短い瞬間の間データを格納する媒体でなく、半永久的にデータを格納し、機器により読み取り（ｒｅａｄｉｎｇ）が可能な媒体を意味する。非一時的コンピュータ読み取り可能媒体の具体的な例では、ＣＤ、ＤＶＤ、ハードディスク、ブルーレイディスク、ＵＳＢ、メモリカード、ＲＯＭなどがありうる。

【0142】

また、上述した様々な実施形態に係る構成要素（例：モジュールまたはプログラム）の各々は、単数または複数の個体で構成されることができ、前述した当該サブ構成要素のうち、一部サブ構成要素が省略されるか、または他のサブ構成要素が様々な実施形態にさらに含まれることができる。大体的にまたは追加的に、一部構成要素等（例：モジュールまたはプログラム）は、１つの個体で統合されて、統合される前のそれぞれの当該構成要素により行われる機能を同一または類似に行うことができる。様々な実施形態に係る、モジュール、プログラム、または他の構成要素により行われる動作は、順次的、並列的、繰り返し的、またはヒューリスティックに実行されるか、少なくとも一部動作が他の順序で実行されるか、省略されるか、または他の動作が追加され得る。

【0143】

以上では、本発明の望ましい実施形態について図示し、説明したが、本発明は、上述した特定の実施形態に限定されず、請求の範囲で請求する本発明の要旨を逸脱することなく、当該開示に属する技術分野における通常の知識を有する者により様々な変形実施が可能であることはもちろん、このような変形実施等は、本発明の技術的思想や展望から個別的に理解されてはならないであろう。

【符号の説明】

【0144】

１０オブジェクト識別システム
１００オブジェクト識別装置
１１０通信モジュール
１２０カメラ
１３０ディスプレイ
１４０メモリ
１５０プロセッサ
２００オブジェクト管理サーバ
２１０通信モジュール
２２０メモリ
２３０プロセッサ

【図1】