特開2022-122232 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ アウーインテリジェンス，インコーポレイテッドの特許一覧

特開2022-122232画像分類およびマーキング方法、並びに、そのシステム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2022122232

(43)【公開日】2022-08-22

(54)【発明の名称】画像分類およびマーキング方法、並びに、そのシステム

(51)【国際特許分類】

G06T 7/00 20170101AFI20220815BHJP

【ＦＩ】

G06T7/00 350B

【審査請求】有

【請求項の数】11

【出願形態】ＯＬ

(21)【出願番号】P 2021077717

(22)【出願日】2021-04-30

(31)【優先権主張番号】110105018

(32)【優先日】2021-02-09

(33)【優先権主張国・地域又は機関】TW

【公序良俗違反の表示】

（特許庁注：以下のものは登録商標）

１．ＢＬＵＥＴＯＯＴＨ

(71)【出願人】

【識別番号】521190325

【氏名又は名称】アウーインテリジェンス，インコーポレイテッド

【氏名又は名称原語表記】ＡｗｏｏＩｎｔｅｌｌｉｇｅｎｃｅ，Ｉｎｃ．

【住所又は居所原語表記】１４Ｆ．，Ｎｏ．９６，Ｓｅｃ．２，ＺｈｏｎｇｓｈａｎＮ．Ｒｄ．，ＺｈｏｎｇｓｈａｎＤｉｓｔ．，ＴａｉｐｅｉＣｉｔｙ１０４，Ｔａｉｗａｎ

(74)【代理人】

【識別番号】100137095

【弁理士】

【氏名又は名称】江部武史

(74)【代理人】

【識別番号】100091627

【弁理士】

【氏名又は名称】朝比一夫

(72)【発明者】

【氏名】シュウリン

(72)【発明者】

【氏名】ガンフェンホ

(72)【発明者】

【氏名】クオミンリン

【テーマコード（参考）】

5L096

【Ｆターム（参考）】

5L096DA01

5L096FA02

5L096JA22

5L096KA04

(57)【要約】（修正有）

【課題】画像分類およびマーキング方法並びにマーキングシステムを提供する。
【解決手段】画像分類およびマーキングシステム１は、画像分類およびマーキングシステムを実行するための中央処理モジュール１１と、中央処理モジュール１１と情報接続し、分類モデルに基づいて前記画像に対する分類を行い、且つ、画像に対してラベルまたはテキスト説明のうちの何れか１種類またはそれらの組み合わせを付与する人工知能モジュール１５と、中央処理モジュール１１と情報接続し、画像を受信するための入力モジュール１２と、中央処理モジュール１１と情報接続し、分類モデル及びストリングネットワークを保存するためのストレージモジュール１３と、中央処理モジュールと情報接続１１し、ストリングネットワークを形成するためのストリングモジュール１６と、を備える。
【選択図】図１

【特許請求の範囲】

【請求項1】

画像の分類を行い、少なくとも１つのラベルまたは少なくとも１つのテキスト説明のうちの何れか１種類またはそれらの組み合わせを付与する画像分類およびマーキングシステムであって、
前記画像分類およびマーキングシステムを実行するための中央処理モジュールと、
前記中央処理モジュールと情報接続し、分類モデルに基づいて前記画像に対する分類を行い、且つ前記画像に対して前記ラベルまたは前記テキスト説明のうちの何れか１種類またはそれらの組み合わせを付与する人工知能モジュールと、
前記中央処理モジュールと情報接続し、前記画像を受信するための入力モジュールと、
前記中央処理モジュールと情報接続し、前記分類モデル及びストリングネットワークを保存するためのストレージモジュールと、
前記中央処理モジュールと情報接続し、前記ストリングネットワークを形成するためのストリングモジュールと、を備えていることを特徴とする画像分類およびマーキングシステム。

【請求項2】

前記ストレージモジュールは少なくとも１つのラーニング画像を保存しているラーニング画像データベースを備え、前記人工知能モジュールは前記ラーニング画像に基づいて前記分類モデルを構築することを特徴とする請求項１に記載の画像分類およびマーキングシステム。

【請求項3】

前記中央処理モジュールと情報接続し、前記画像を複数の分割画像に分割する分割モジュールをさらに備えることを特徴とする請求項１に記載の画像分類およびマーキングシステム。

【請求項4】

前記中央処理モジュールと情報接続し、前記画像の文字を抽出するキャラクター認識モジュールをさらに備えることを特徴とする請求項１に記載の画像分類およびマーキングシステム。

【請求項5】

前記ラーニング画像データベースには少なくとも１つの前記ラベルまたは少なくとも１つの前記テキスト説明を有している前記画像をさらに保存し、前記ラーニング画像とすることを特徴とする請求項２に記載の画像分類およびマーキングシステム。

【請求項6】

画像の分類を行い、少なくとも１つのラベルまたは少なくとも１つのテキスト説明のうちの何れか１種類またはそれらの組み合わせを付与する画像分類およびマーキング方法であって、
前記画像分類およびマーキング方法により前記画像を受信する画像入力ステップと、
前記画像分類およびマーキング方法により分類モデルに基づいて前記画像に対する分類を行う画像分類ステップと、
前記画像分類およびマーキング方法によりストリングネットワークに基づいて分類が完了した前記画像に対し少なくとも１つの前記ラベルを付与する画像上付き文字付与ステップと、
前記画像分類およびマーキング方法によりストリングネットワークに基づいて分類が完了した前記画像に対し少なくとも１つの前記テキスト説明を付与する画像テキスト説明付与ステップと、を含むことを特徴とする画像分類およびマーキング方法。

【請求項7】

前記画像分類およびマーキング方法により少なくとも１つのラーニング画像に基づいて前記分類モデルを構築するラーニングステップを含むことを特徴とする請求項６に記載の画像分類およびマーキング方法。

【請求項8】

前記画像分類およびマーキング方法により前記画像を分割画像に分割する画像分割ステップを含むことを特徴とする請求項６に記載の画像分類およびマーキング方法。

【請求項9】

前記画像分類ステップにおいて、キャラクター認識モジュールにより前記画像に対する分類を行うことを特徴とする請求項６に記載の画像分類およびマーキング方法。

【請求項10】

前記ラーニング画像は前記画像上付き文字付与ステップが完了した前記画像を含むことを特徴とする請求項７に記載の画像分類およびマーキング方法。

【請求項11】

前記ラーニング画像は前記画像テキスト説明付与ステップが完了した前記画像を含むことを特徴とする請求項７に記載の画像分類とマーキング方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、人工知能を利用して画像の分割及び文字認識を行い、且つ分類、マッチング、ラベル付与、及びテキスト説明を行う画像分類およびマーキング方法、並びに、そのシステムに関する。

【背景技術】

【0002】

現在、科学技術の発展に伴って画像分類が各分野で広く応用されており、日常的な撮影から工業生産に至るまで画像分類技術が求められている。従来の特許文献では、例えば、下記特許文献１の「製品推奨の精度を向上させる方法」という記載があり、ユーザー側で商品画像ファイルを入力すると、ショッピングプラットフォームが商品画像を単独で認識し、且つ商品画像に関連する商品ラベルを生成する。また、下記特許文献２の「複数の商品画像中からの商品認識」という記載があり、画像中の商品を認識し、認識した商品の商品情報（ブランド、型番号、または商品説明）を提供している。また、下記特許文献３の「分類ラベル情報の取得方法と装置」、下記特許文献４の「Web情報発掘による映像中の商品注釈」及び下記特許文献５の「情報処理装置、情報処理方法及びプログラム」という記載がある。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】台湾特許出願公開第２０１９１３４９３号明細書

【特許文献2】米国特許出願公開第２０１９／０３１８４０５号明細書

【特許文献3】中国特許出願公開第１０６９０９６９４号明細書

【特許文献4】米国特許第０９３５５３３０号明細書

【特許文献5】特開２０２０－１４０４８８号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

上述の特許文献に記載されている内容は画像から商品を認識し、且つ分類すると共に情報ラベルを貼り付けている。しかしながら、商品は通常複数種の属性を有し、複数種のラベル情報を表示する必要があった。また、ラベル情報用語の多くは現在使用されているものとは異なった古い語彙が使用されていた。なお、商品間の関連性や商品の高速テキスト説明は全て現在商務で応用するための必須の技術であり、よって、画像の分類及びマッチングを高速且つ精確に行い、対応する複数の情報ラベルを付与し、画像内容に対して高速にテキスト説明を行い、且つラベル及びテキスト説明を当時の時代背景に最も関連する語彙とすることが、解決が待たれている問題であった。

【0005】

そこで、本発明者は上記の欠点が改善可能と考え、鋭意検討を重ねた結果、合理的設計で上記の課題を効果的に改善する本発明の提案に至った。

【0006】

本発明は、かかる事情に鑑みてなされたものであり、その目的とするところは、画像分類およびマーキング方法、並びに、そのシステムを提供することにある。

【課題を解決するための手段】

【0007】

上記課題を解決するために、本発明のある態様の画像分類とマーキング方法及びそのシステムは、中央処理モジュールと、入力モジュールと、ストレージモジュールと、分割モジュールと、人工知能モジュールと、ストリングモジュールと、を備えている。人工知能モジュールはストレージモジュール内のラーニング画像をラーニングデータとして機械学習法により分類モデルを構築する。入力モジュールにより分類する画像を受信し、人工知能モジュールが分類する画像を分類モデルに基づいて分類する。分割モジュールは分類する画像の各部分の特徴を認識すると共にさらに分割、分類、及びマッチングを行い、人工知能モジュールはストリングモジュールと協同で分類及びマッチングが完了した画像に対し少なくとも１つのラベル及びテキスト説明を付与する。また、本発明は、画像中の文字を認識して総合学習及び演算を行うためのキャラクター認識モジュールをさらに備えている。

【0008】

本発明の他の特徴については、本明細書及び添付図面の記載により明らかにする。

【図面の簡単な説明】

【0009】

【図1】本発明に係るシステムを示す概略構成図（１）である。

【図2】本発明の実施形態に係る画像分類およびマーキング方法のフローチャート（１）である。

【図3】本発明の実施形態を示す概略図（１）である。

【図4】本発明の実施形態を示す概略図（２）である。

【図5】本発明の実施形態を示す概略図（３）である。

【図6】本発明の実施形態を示す概略図（４）である。

【図7】本発明の実施形態を示す概略図（５）である。

【図8】本発明の実施形態に係る画像分類およびマーキング方法のフローチャート（２）である。

【図9】本発明の他の実施形態を示す図（１）である。

【図10】本発明のさらなる他の実施形態を示す図（２）である。

【発明を実施するための形態】

【0010】

本発明における好適な実施の形態について、添付図面を参照して説明する。尚、以下に説明する実施の形態は、特許請求の範囲に記載された本発明の内容を限定するものではない。また、以下に説明される構成の全てが、本発明の必須要件であるとは限らない。

【0011】

本発明の画像分類およびマーキングシステム１は、中央処理モジュール１１を備え、中央処理モジュール１１に情報接続している入力モジュール１２と、ストレージモジュール１３と、分割モジュール１４と、人工知能モジュール１５と、ストリングモジュール１６とをさらに有している（図１参照）。以下、各構成部材の機能について例示する。
＜中央処理モジュール１１＞

【0012】

中央処理モジュール１１は画像分類およびマーキングシステム１を実行し、上述の各モジュール（１２～１６）を作動するように駆動し、論理演算を行い、演算結果を一時保存し、命令実行位置を保存する等の機能を備える中央処理装置（Central Processing Unit、CPU）でもよいが、これに限られない。
＜入力モジュール１２＞

【0013】

入力モジュール１２は分類する画像Ｐ１を受信するUSB（Universal Serial Bus）、シリアルポート（RS232またはRS485等）、PCIE（Peripheral Component Interconnect Express）等でもよい。BluetoothやWiFi等のワイヤレス伝送でもよい。また、ブラウザ検索、データキャプチャ、Webクローラー（Web Crawler）等の方式またはそれらの組み合わせにより画像Ｐ１を獲得してもよいが、これらに限られない。
＜ストレージモジュール１３＞

【0014】

ストレージモジュール１３は人工知能モジュール１５のラーニングに必要なデータを提供する。ストレージモジュール１３はラーニング画像データベース１３１をさらに備えている。ラーニング画像データベース１３１には少なくとも１つのラーニング画像Ｐ２を保存し、ラーニング画像Ｐ２はラベルまたはテキスト説明のうちの何れか１種類またはそれらの組み合わせを有している上付き文字画像でもよく、或いはラベル及びテキスト説明を有していない画像でもよく、人工知能モジュール１５はラーニング画像Ｐ２を利用してラーニングを行って分類モデルを構築する。
＜分割モジュール１４＞

【0015】

分割モジュール１４は画像Ｐ１中の各物体を認識及び検出し、画像Ｐ１内の異なる物体、物品、標的等を各分割画像Ｐ３に分割し、画像をさらに分析する。
＜人工知能モジュール１５＞

【0016】

人工知能モジュール１５はストレージモジュール１３内のデータを目標としてラーニングを行って分類モデルを構築する。人工知能モジュール１５はラーニングを行う機械学習（Machine Learning）であり、教師なし学習（Un-supervised learning）或いは自己教師あり学習（Self-Supervised Learning）のうちの何れか１種類またはそれらの組み合わせを使用している。人工知能モジュール１５はラーニングにより構築した分類モデルに基づいて画像（Ｐ１及びＰ３）の分類及びマッチングを行い、画像（Ｐ１及びＰ３）にラベル及び／或いはテキスト説明を付与する。前述のマッチングでは、人工知能モジュール１５が画像Ｐ１中の各分割画像Ｐ３間の内容、相対位置、大きさ、及び関連度等のパラメータに基づいて、各分割画像Ｐ３間の関連点数を計算する。よって、人工知能モジュール１５は関連点数により補完して画像（Ｐ１及びＰ３）により適切なラベル及び／或いはテキスト説明を付与する。
＜ストリングモジュール１６＞

【0017】

ストリングモジュール１６はテキストを収集し、且つ機械学習（Machine Learning）方式によりテキスト内の有価値文字または単語を抽出する。有価値文字または単語は検索頻度の高さ、話題性を有する等のホットワードであり、且つ相互に関連する単字を相互に連結してストリングネットワークを形成し、ストレージモジュール１３に保存している。人工知能モジュール１５はストリングモジュール１６と協同で、ストリングネットワークに基づいて分類した画像（Ｐ１及びＰ３）にラベル及び／或いはテキスト説明を付与する。

【0018】

図２は本発明の実施形態に係る画像分類およびマーキング方法のフローチャート（１）である。以下、図を参照しながら、本発明の画像分類およびマーキング方法、並びに、そのシステムの実施形態を詳しく説明する。
＜画像入力ステップＳ１＞

【0019】

図３に示すように、入力モジュール１３は少なくとも１つの分類する画像Ｐ１を受信し、入力モジュール１３は有線、ワイヤレス等の伝送方式で画像Ｐ１を受信する。
＜画像分割ステップＳ２＞

【0020】

図４に示すように、分割モジュール１４は受信した画像Ｐ１を認識及び識別し、各部分の特徴に基づいて分割し、画像Ｐ１中の各物体を独立させて分割して分割画像Ｐ３を生成し、人工知能モジュール１５が画像Ｐ１の全体及び各部分をさらに全面的に分析して判断する。図示するように、入力モジュール１３がスポーツ用商品の画像Ｐ１を受信した後、分割モジュール１４が認識すると共に「自転車」、「ヘルメット」、「ランニングシューズ」、「水泳キャップ」等の分割画像Ｐ３に分割する。
＜画像分類ステップＳ３＞

【0021】

人工知能モジュール１５は各画像（Ｐ１及びＰ３）をラーニングが完了した分類モデルに基づいて画像の分類及びマッチングを行う。各画像（Ｐ１及びＰ３）は単一のカテゴリに分類しても、単一の画像（Ｐ１及びＰ３）を複数のカテゴリに分類してもよい。また、分類は、人工知能モジュール１５が画像（Ｐ１及びＰ３）中の内容、相対位置、大きさ、関連度等に基づいて各分割画像Ｐ３間の関連点数を計算し、画像（Ｐ１及びＰ３）の分類を行い、且つ画像入力ステップＳ１で入力した未分割の画像Ｐ１も直接画像分類ステップＳ３を実行し、画像分割ステップＳ２を実行する必要がない。図４に示すように、人工知能モジュール１５がこれを「スポーツ」に分類し、図４の分割画像Ｐ３の「自転車」を例にすると、人工知能モジュール１５がこれを「自転車」及び「陸上スポーツ」に分類する。また、「自転車」、「水泳キャップ」、「ランニングシューズ」等の画像から三者が「トライアスロン」のカテゴリに関連することを見出す。
＜画像上付き文字付与ステップＳ４＞

【0022】

図５と図６に示すように、人工知能モジュール１５は分類及びマッチングが完了した画像（Ｐ１及びＰ３）にラベルＴを付与する。人工知能モジュール１５は画像（Ｐ１及びＰ３）に単一のラベルＴを付与しても、画像（Ｐ１及びＰ３）に複数のラベルＴを付与してもよい。また、人工知能モジュール１５はさらに画像Ｐ１中の各分割画像Ｐ３の関連点数に基づいて、ストリングモジュール１６と協同でストリングネットワークに基づいて画像（Ｐ１及びＰ３）に関連するラベルＴを付与する。図５に示すように、「自転車」、「水泳キャップ」、「ランニングシューズ」等の分割画像を同時に有するため、画像分類およびマーキングシステム１は前述の分割画像、関連点数、及びストリングネットワークに基づいて画像に「トライアスロン」のラベルを付与する。また、図６を参照し、分割画像Ｐ３の「自転車」にはその分類と関連する「自転車」、「自転車」、「陸上スポーツ」等のラベルを付与し、且つ分割画像Ｐ３の「自転車」が「水泳キャップ」、「ランニングシューズ」等の分割画像Ｐ３を有している画像Ｐ１から分割したものであるため、前述の分割画像、関連点数、及びストリングネットワークに基づいて「トライアスロン」のラベルを付与する。
＜画像テキスト説明付与ステップＳ５＞

【0023】

図７を併せて参照し、人工知能モジュール１５はストリングモジュール１６と協同でストリングネットワークに基づいて画像（Ｐ１及びＰ３）にテキスト説明Ｄを付与する。テキスト説明Ｄは画像（Ｐ１及びＰ３）についての簡単な説明でも長い文章でもよい。図示するように、オリンピックの年に防疫という時代背景がある場合、画像Ｐ３の「自転車」に「歩く代わりに自転車で通勤及び帰宅する」、「オリンピックではまず競技専用自転車を選択する」、「多機能の変速機能を有し、軽量化された自転車」等のテキスト説明Ｄを付与する。

【0024】

図８と図２を併せて参照し、本発明はモデルラーニングステップＳ６をさらに含む。画像入力ステップＳ１の前に、モデルラーニングステップＳ６では人工知能モジュール１５に用いる分類モデルを構築する。人工知能モジュール１５はストレージモジュール１３内のラーニング画像（Ｐ２及びＰ３）に基づいて、教師なし学習（Un-supervised Learning）、自己教師あり学習（Self-Supervised Learning）のうちの何れか１種類またはそれらの組み合わせ等の機械学習法を使用する。教師なし学習（Un-supervised Learning）を例にすると、人工知能モジュール１５はストレージモジュール１３内のラベルＴ及びテキスト説明Ｄを有していないラーニング画像Ｐ２に基づいて、教師なし学習（Un-supervised Learning）を使用して分類モデルを構築する。また、ステップＳ３、ステップＳ４、及びステップＳ５が完了した画像（Ｐ１及びＰ３）を新たなラーニングデータとし、分類が完了しているためラベルＴ及び／或いはテキスト説明Ｄを有しており、続いて人工知能モジュール１５による分類モデルの構築を改善する。

【0025】

図９と図１０に示すように、本発明はキャラクター認識モジュール１７を備えている。キャラクター認識モジュール１７は画像中の文字を抽出して総合学習及び演算を行い、人工知能モジュール１５が画像上付き文字付与ステップＳ４及び画像テキスト説明付与ステップＳ５を実行する際に、さらに精確に分類及びマッチングを行ってラベルＴ及び／或いはテキスト説明Ｄを付与するようにしている。キャラクター認識モジュール１７は光学文字認識モデル（Optical Character Recognition、OCR）を有している。図示するように、画像Ｐ３の「自転車」がフレーム上に「CARBON」という書体を有している場合、キャラクター認識モジュール１７が文字を抽出し、画像Ｐ３の「自転車」に、「炭素繊維製自転車」というより精確なラベルＴ及び／或いはテキスト説明Ｄを付与する。

【0026】

以上を総合すると、本発明の画像分類とマーキング方法及びそのシステムは、中央処理モジュールと、入力モジュールと、ストレージモジュールと、分割モジュールと、人工知能モジュールと、ストリングモジュールと、キャラクター認識モジュールと、を備えている。人工知能モジュールは機械学習により分類モデルを構築し、画像に対して本発明により分類、マッチング、ラベル付与、及びテキスト説明付与を行う。また、分割モジュールにより各画像の特徴に基づいて分割し、ストリングモジュールにより分類した画像に現代的な有価値文字のラベル及びテキスト説明を付与する。なお、キャラクター認識モジュールは画像の文字を認識してより精確な分類、ラベル付与、及びテキスト説明を達成する。よって、本発明を実施することで、高速で精確な画像の分類及び対応するラベル及びテキスト説明の付与を確実に達成する。

【0027】

上述の実施形態は本発明の技術思想及び特徴を説明するためのものにすぎず、当該技術分野を熟知する者に本発明の内容を理解させると共にこれをもって実施させることを目的とし、本発明の特許請求の範囲を限定するものではない。従って、本発明の精神を逸脱せずに行う各種の同様の効果をもつ改良又は変更は、後述の請求項に含まれるものとする。

【符号の説明】

【0028】

１画像分類およびマーキングシステム
１１中央処理モジュール
１２入力モジュール
１３ストレージモジュール
１３１ラーニング画像データベース
１４分割モジュール
１５人工知能モジュール
１６ストリングモジュール
１７キャラクター認識モジュール
Ｓ１画像入力ステップ
Ｓ２画像分割ステップ
Ｓ３画像分類ステップ
Ｓ４画像上付き文字付与ステップ
Ｓ５画像テキスト説明付与ステップ
Ｓ６モデルラーニングステップ
Ｐ１画像
Ｐ２ラーニング画像
Ｐ３分割画像
Ｔラベル
Ｄテキスト説明

【図1】