特開2024-133013 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ 三星ディスプレイ株式會社の特許一覧

特開2024-133013欠落不対画像および表形データの多重モード融合方法およびシステム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024133013

(43)【公開日】2024-10-01

(54)【発明の名称】欠落不対画像および表形データの多重モード融合方法およびシステム

(51)【国際特許分類】

G06N 3/09 20230101AFI20240920BHJP

G06F 18/15 20230101ALI20240920BHJP

【ＦＩ】

G06N3/09

G06F18/15

【審査請求】未請求

【請求項の数】10

【出願形態】ＯＬ

(21)【出願番号】P 2024040024

(22)【出願日】2024-03-14

(31)【優先権主張番号】63/452,638

(32)【優先日】2023-03-16

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】18/339,075

(32)【優先日】2023-06-21

(33)【優先権主張国・地域又は機関】US

(71)【出願人】

【識別番号】512187343

【氏名又は名称】三星ディスプレイ株式會社

【氏名又は名称原語表記】ＳａｍｓｕｎｇＤｉｓｐｌａｙＣｏ．，Ｌｔｄ．

【住所又は居所原語表記】１，Ｓａｍｓｕｎｇ－ｒｏ，Ｇｉｈｅｕｎｇ－ｇｕ，Ｙｏｎｇｉｎ－ｓｉ，Ｇｙｅｏｎｇｇｉ－ｄｏ，ＲｅｐｕｂｌｉｃｏｆＫｏｒｅａ

(74)【代理人】

【識別番号】110002619

【氏名又は名称】弁理士法人ＰＯＲＴ

(72)【発明者】

【氏名】チェン，キセン

(72)【発明者】

【氏名】カウシクバラクリシュナン

(72)【発明者】

【氏名】ク，シュフイ

(72)【発明者】

【氏名】リ，ジャンファン

(57)【要約】

【課題】欠落および／または不対様式を有するデータセットから効果的に学習することができる多重モード融合遂行方法を提供する。
【解決手段】本発明の一実施形態による方法は、少なくとも一つの不対様式行と少なくとも一つの対様式行を含むデータ行を含むデータセットを提供し（但し、前記少なくとも一つの対様式行は第１様式と第２様式の両方ともを含み、前記少なくとも一つの不対様式行は前記第１様式を含む）、様式専用符号器によって、前記対様式の第２様式からエンベディングを補間することによって前記少なくとも一つの不対様式行を帰属させ、単一モード予測および二重モード予測に対する帰属に基づいて前記様式専用符号器を潜在空間で訓練し、そして前記単一モード予測および前記二重モード予測に対する信頼度値を生成することを含む。
【選択図】図８

【特許請求の範囲】

【請求項1】

少なくとも一つの不対様式行（ｒｏｗｏｆｕｎｐａｉｒｅｄｍｏｄａｌｉｔｙ）と少なくとも一つの対様式行（ｒｏｗｏｆｐａｉｒｅｄｍｏｄａｌｉｔｙ）を含むデータ行を含むデータセットを提供し（但し、前記少なくとも一つの対様式行は第１様式と第２様式の両方ともを含み、前記少なくとも一つの不対様式行は前記第１様式を含む）、
様式専用符号器（ｍｏｄａｌｉｔｙ－ｓｐｅｃｉｆｉｃｅｎｃｏｄｅｒ）によって、前記対様式の第２様式からエンベディング（ｅｍｂｅｄｄｉｎｇ）を補間（ｉｎｔｅｒｐｏｌａｔｉｎｇ）することによって前記少なくとも一つの不対様式行を帰属させ、
単一モード予測（ｕｎｉｍｏｄａｌｐｒｅｄｉｃｔｉｏｎ）および二重モード予測（ｂｉｍｏｄａｌｐｒｅｄｉｃｔｉｏｎ）に対する帰属（ｉｍｐｕｔａｔｉｏｎ）に基づいて前記様式専用符号器を潜在空間（ｌａｔｅｎｔｓｐａｃｅ）で訓練し、そして
前記単一モード予測および前記二重モード予測に対する信頼度値（ｃｏｎｆｉｄｅｎｃｅｖａｌｕｅ）を生成すること
を含む方法。

【請求項2】

前記信頼度値を生成することは、前記単一モード予測および前記二重モード予測に対するシャプリー基盤説明（Ｓｈａｐｌｅｙ－ｂａｓｅｄｅｘｐｌａｎａｔｉｏｎ）を計算することを含む、請求項１に記載の方法。

【請求項3】

前記シャプリー基盤説明を計算することは、前記単一モード予測の影響（ｉｍｐａｃｔ）と前記二重モード予測の影響を所定しきい値と比較する段階を含む、請求項２に記載の方法。

【請求項4】

前記生成された信頼度値に基づいて前記単一モード予測または前記二重モード予測のうちの一つを選択することをさらに含む、請求項３に記載の方法。

【請求項5】

前記第２様式は前記不対様式から欠落した様式であり、
前記エンベディングを補間することは、前記第２様式のＫ個の以前項目（ｐｒｉｏｒ）を選択することを含み、
前記Ｋ個の以前項目は、観察様式（ｏｂｓｅｒｖｅｄｍｏｄａｌｉｔｙ）に最も近いエンベディングを有する前記少なくとも一つの対様式行のＫ個の標本の前記第２様式のエンベディングである、請求項１に記載の方法。

【請求項6】

前記Ｋ個の標本と前記Ｋ個の以前項目の間の交差注意（ｃｒｏｓｓ－ａｔｔｅｎｔｉｏｎ）を取ることによって前記Ｋ個の以前項目の加重合計を計算することをさらに含む、請求項５に記載の方法。

【請求項7】

前記第１様式は画像様式（ｉｍａｇｅｍｏｄａｌｉｔｙ）に対応し、前記第２様式は表様式（ｔａｂｕｌａｒｍｏｄａｌｉｔｙ）に対応するか、または
前記第１様式は表様式に対応し、前記第２様式は画像様式に対応する、請求項１に記載の方法。

【請求項8】

視覚認識変換器（ｖｉｓｉｏｎｔｒａｎｓｆｏｒｍｅｒ）を行うことによって前記様式専用符号器を画像様式に対して訓練させることをさらに含む、請求項１に記載の方法。

【請求項9】

特性－トークン化変換器（ｆｅａｔｕｒｅ－ｔｏｋｅｎｉｚｅｒｔｒａｎｓｆｏｒｍｅｒ）を行うことによって前記様式専用符号器を表形データ様式に対して訓練させることをさらに含む、請求項１に記載の方法。

【請求項10】

メモリ、そして
プロセッサー
を含み、
前記プロセッサーは前記メモリに記憶された命令を実行して、
少なくとも一つの不対様式行（ｒｏｗｏｆｕｎｐａｉｒｅｄｍｏｄａｌｉｔｙ）と少なくとも一つの対様式行（ｒｏｗｏｆｐａｉｒｅｄｍｏｄａｌｉｔｙ）を含むデータ行を含むデータセットを提供し（但し、前記少なくとも一つの対様式行は第１様式と第２様式の両方ともを含み、前記少なくとも一つの不対様式行は前記第１様式を含む）、
様式専用符号器（ｍｏｄａｌｉｔｙ－ｓｐｅｃｉｆｉｃｅｎｃｏｄｅｒ）によって、前記対様式の第２様式からエンベディング（ｅｍｂｅｄｄｉｎｇ）を補間（ｉｎｔｅｒｐｏｌａｔｉｎｇ）することによって前記少なくとも一つの不対様式行を帰属させ、
単一モード予測（ｕｎｉｍｏｄａｌｐｒｅｄｉｃｔｉｏｎ）および二重モード予測（ｂｉｍｏｄａｌｐｒｅｄｉｃｔｉｏｎ）に対する帰属（ｉｍｐｕｔａｔｉｏｎ）に基づいて前記様式専用符号器を潜在空間（ｌａｔｅｎｔｓｐａｃｅ）で訓練し、
前記単一モード予測および前記二重モード予測に対する信頼度値（ｃｏｎｆｉｄｅｎｃｅｖａｌｕｅ）を生成する
システム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は深層学習に関するものであって、より詳しくは、欠落不対画像および表形データを多重モード融合する方法およびシステムに関するものである。

【0002】

本出願は２０２３年３月１６日に米国特許庁に出願した米国特許出願番号第６３／４５２，６３８号を優先権主張し、ここに引用することによってこの出願の全体内容を本願に含む。

【背景技術】

【0003】

ＴＶおよびモバイル表示装置産業は数年にわたって急速に成長している。新たな種類の表示パネルモジュールと生産方法が考案されるにつれて、向上した装置と品質管理方法を使用して生産過程で品質を維持する必要があるが、これは表示パネルの欠陥によって過度な費用と損失が発生することがあるためである。生産過程で発生する欠陥を識別するための厳密な監視を通じてこのような費用と損失を減らすことができる。

【0004】

例えば、生産過程で発生する欠陥のうちの一部は修理可能である。このような欠陥による損失を最少化するために、センサー装置を使用して表示パネルと関連する特定データを収集することによって修理可能欠陥を識別することができる。しかし、大規模生産および潜在的欠陥の微細な大きさによっては、人間運営者がこのような欠陥を捜し出すことは容易でない。その代わりに、多くの現代技術はコンピュータを使用して様々な種類のセンサーからセンサーデータを収集して生産された表示装置の潜在的欠陥を判断する。例えば、光学カメラや赤外線カメラなどのセンサーを使用して表示パネルの多様な部分の画像を捕捉し、コンピュータ視覚認識（ｃｏｍｐｕｔｅｒｖｉｓｉｏｎ）を使用して特定特徴および／または表示パネルの特性を識別し、次いで当該表示パネルが生産標準および公差（ｔｏｌｅｒａｎｃｅ）に従って正確に生産されたかどうかを決定する。他の例として、レーザを使用して表示パネルの多様な側面を測定して表示パネルが予想寸法に従って特定公差内で製造されたかを確認することができる。したがって、コンピュータはこのようなセンサーデータを使用して生産過程での欠陥を自動的に判断してこのような欠陥を修理するか欠陥を起こす生産条件または機械を修正してそれ以上欠陥が発生しないようにすることができる。

【0005】

したがって、表示パネルに関して収集したセンサーデータは大抵二つの様式（ｍｏｄａｌｉｔｙ）、即ち、画像と表形データ（ｔａｂｕｌａｒｄａｔａ）を含むことができる。画像は例えば表示パネルの上面を捕捉したカメラから提供され、表は測定値（ｍｅａｓｕｒｅｍｅｎｔ）［例えば、：寸法（ｄｉｍｅｎｓｉｏｎ）］およびその他関連情報を記録する。修理可能な欠陥と修理不可能な欠陥を効果的に区分するために、多重モード（ｍｕｌｔｉｍｏｄａｌ）分類器を使用して両側モードからの情報を融合することができる。言い換えれば、一つの画像は当該表形データと関連していて、人工知能（ＡＩ：ａｒｔｉｆｉｃｉａｌｉｎｔｅｌｌｉｇｅｎｃｅ）を使用するコンピュータソフトウェアをこのような融合モデル（ｆｕｓｅｄｍｏｄｅｌ）を使用して訓練させて欠陥の有無を判断するようにする。さらに具体的には、一部多重モード融合技術は完全対様式（ｃｏｍｐｌｅｔｅａｎｄｐａｉｒｅｄｍｏｄａｌｉｔｉｅｓ）に依存し、この技術で各画像は表形データの該当行と対を成す。しかし、欠落記録（ｍｉｓｓｉｎｇｒｅｃｏｒｄｉｎｇ）または異種（ｈｅｔｅｒｏｇｅｎｅｏｕｓ）ソースなどのような理由によってモード訓練（ｍｏｄａｌｔｒａｉｎｉｎｇ）用完全対モードデータセット（ｍｏｄａｌ－ｃｏｍｐｌｅｔｅａｎｄｐａｉｒｅｄｄａｔａｓｅｔ）を得にくい場合が多い。一つのデータセットは完全対モードデータと残りデータの組み合わせであり、完全対モードデータの比率が小さいことが一般的である。ここで、残りデータは表形データが抜け落ちた画像であるかまたは画像が抜け落ちた表形データである。したがって、見本標本（ｔｅｓｔｓａｍｐｌｅ）に対して常に二つの様式全てを入手することができると見るのは難しい。したがって、高い正確度の分類のために、欠落および／または不対（ｕｎｐａｉｒｅｄ）様式を有するデータセットから効果的に学習することができテスト－時間欠落様式（ｔｅｓｔ－ｔｉｍｅｍｉｓｓｉｎｇｍｏｄａｌｉｔｙ）にも強力な多重モード融合遂行方法が必要である。

【発明の概要】

【発明が解決しようとする課題】

【0006】

本発明が解決しようとする課題は、欠落および／または不対様式を有するデータセットから効果的に学習することができる多重モード融合遂行方法を提供することである。

【課題を解決するための手段】

【0007】

本発明の一実施形態による方法は、少なくとも一つの不対様式行（ｒｏｗｏｆｕｎｐａｉｒｅｄｍｏｄａｌｉｔｙ）と少なくとも一つの対様式行（ｒｏｗｏｆｐａｉｒｅｄｍｏｄａｌｉｔｙ）を含むデータ行を含むデータセットを提供し（但し、前記少なくとも一つの対様式行は第１様式と第２様式の両方ともを含み、前記少なくとも一つの不対様式行は前記第１様式を含む）、様式専用符号器（ｍｏｄａｌｉｔｙ－ｓｐｅｃｉｆｉｃｅｎｃｏｄｅｒ）によって、前記対様式の第２様式からエンベディング（ｅｍｂｅｄｄｉｎｇ）を補間（ｉｎｔｅｒｐｏｌａｔｉｎｇ）することによって前記少なくとも一つの不対様式行を帰属させ、単一モード予測（ｕｎｉｍｏｄａｌｐｒｅｄｉｃｔｉｏｎ）および二重モード予測（ｂｉｍｏｄａｌｐｒｅｄｉｃｔｉｏｎ）に対する帰属（ｉｍｐｕｔａｔｉｏｎ）に基づいて前記様式専用符号器を潜在空間（ｌａｔｅｎｔｓｐａｃｅ）で訓練し、そして前記単一モード予測および前記二重モード予測に対する信頼度値（ｃｏｎｆｉｄｅｎｃｅｖａｌｕｅ）を生成することを含む。

【0008】

前記信頼度値生成することは、前記単一モード予測および前記二重モード予測に対するシャプリー基盤説明（Ｓｈａｐｌｅｙ－ｂａｓｅｄｅｘｐｌａｎａｔｉｏｎ）を計算することを含むことができる。

【0009】

前記シャプリー基盤説明計算することは、前記単一モード予測の影響（ｉｍｐａｃｔ）と前記二重モード予測の影響を所定しきい値と比較することを含むことができる。

【0010】

前記方法は、前記生成された信頼度値に基づいて前記単一モード予測または前記二重モード予測のうちの一つを選択することをさらに含むことができる。

【0011】

前記第２様式は前記不対様式の欠落様式であり、前記エンベディング補間することは前記第２様式のＫ個の以前項目（ｐｒｉｏｒ）を選択することを含み、前記Ｋ個の以前項目は前記少なくとも一つの不対様式行で観察様式（ｏｂｓｅｒｖｅｄｍｏｄａｌｉｔｙ）の最も近いエンベディングを有するＫ個の標本の前記第２様式エンベディングであってもよい。

【0012】

前記方法は、前記Ｋ個の標本と前記Ｋ個の以前項目の間の交差注意（ｃｒｏｓｓ－ａｔｔｅｎｔｉｏｎ）を取ることによって前記Ｋ個の以前項目の加重合計を計算することをさらに含むことができる。

【0013】

前記第１様式は画像様式（ｉｍａｇｅｍｏｄａｌｉｔｙ）に該当し、前記第２様式は表様式（ｔａｂｕｌａｒｍｏｄａｌｉｔｙ）に該当し得る。

【0014】

前記第１様式は表様式に該当し、前記第２様式は画像様式に該当し得る。

【0015】

前記方法は、視覚認識変換器（ｖｉｓｉｏｎｔｒａｎｓｆｏｒｍｅｒ）を行うことによって前記様式専用符号器を画像様式に対して訓練させることをさらに含むことができる。

【0016】

前記方法は、特性－トークン化変換器（ｆｅａｔｕｒｅ－ｔｏｋｅｎｉｚｅｒｔｒａｎｓｆｏｒｍｅｒ）を行うことによって前記様式専用符号器を表形データ様式に対して訓練させることをさらに含むことができる。

【0017】

本発明の一実施形態によるシステムは、メモリ、そしてプロセッサーを含み、前記プロセッサーは前記メモリに記憶された命令を実行して、少なくとも一つの不対様式行（ｒｏｗｏｆｕｎｐａｉｒｅｄｍｏｄａｌｉｔｙ）と少なくとも一つの対様式行（ｒｏｗｏｆｐａｉｒｅｄｍｏｄａｌｉｔｙ）を含むデータ行を含むデータセットを提供し（但し、前記少なくとも一つの対様式行は第１様式と第２様式の両方ともを含み、前記少なくとも一つの不対様式行は前記第１様式を含む）、様式専用符号器（ｍｏｄａｌｉｔｙ－ｓｐｅｃｉｆｉｃｅｎｃｏｄｅｒ）によって、前記対様式の第２様式からエンベディング（ｅｍｂｅｄｄｉｎｇ）を補間（ｉｎｔｅｒｐｏｌａｔｉｎｇ）することによって前記少なくとも一つの不対様式行を帰属させ、単一モード予測（ｕｎｉｍｏｄａｌｐｒｅｄｉｃｔｉｏｎ）および二重モード予測（ｂｉｍｏｄａｌｐｒｅｄｉｃｔｉｏｎ）に対する帰属（ｉｍｐｕｔａｔｉｏｎ）に基づいて前記様式専用符号器を潜在空間（ｌａｔｅｎｔｓｐａｃｅ）で訓練し、前記単一モード予測および前記二重モード予測に対する信頼度値（ｃｏｎｆｉｄｅｎｃｅｖａｌｕｅ）を生成する。

【0018】

前記信頼度値生成は、前記単一モード予測および前記二重モード予測に対するシャプリー基盤説明（Ｓｈａｐｌｅｙ－ｂａｓｅｄｅｘｐｌａｎａｔｉｏｎ）を計算することを含むことができる。

【0019】

前記シャプリー基盤説明計算は、前記単一モード予測の影響（ｉｍｐａｃｔ）と前記二重モード予測の影響を所定しきい値と比較することを含むことができる。

【0020】

【0021】

【0022】

前記プロセッサーは前記メモリに記憶された命令を実行して、前記Ｋ個の標本と前記Ｋ個の以前項目の間の交差注意（ｃｒｏｓｓ－ａｔｔｅｎｔｉｏｎ）を取ることによって前記Ｋ個の以前項目の加重合計を計算することができる。

【0023】

前記第１様式は画像様式（ｉｍａｇｅｍｏｄａｌｉｔｙ）に該当し、前記第２様式は表様式（ｔａｂｕｌａｒｍｏｄａｌｉｔｙ）に該当し得る。

【0024】

前記第１様式は表様式に該当し、前記第２様式は画像様式に該当し得る。

【0025】

前記プロセッサーは前記メモリに記憶された命令を実行して、視覚認識変換器（ｖｉｓｉｏｎｔｒａｎｓｆｏｒｍｅｒ）を行うことによって前記様式専用符号器を画像様式に対して訓練させることができる。

【0026】

前記プロセッサーは前記メモリに記憶された命令を実行して、特性－トークン化変換器（ｆｅａｔｕｒｅ－ｔｏｋｅｎｉｚｅｒｔｒａｎｓｆｏｒｍｅｒ）を行うことによって前記様式専用符号器を表形データ様式に対して訓練させることができる。

【発明の効果】

【0027】

このようにすることによって欠落および／または不対様式を有するデータセットから効果的に学習することができる。

【図面の簡単な説明】

【0028】

【図1】本発明の一実施形態による画像および表形データを含む捕捉センサーデータの例である。

【図2】本発明の一実施形態による多重モード深層学習モデルを通過するセンサーデータの例である。

【図3】それぞれ本発明の一実施形態による画像事前訓練段階のブロック図の例および表事前訓練段階のブロック図の例である。

【図4】それぞれ本発明の一実施形態による画像事前訓練段階（ｉｍａｇｅｐｒｅ－ｔｒａｉｎｉｎｇｓｔａｇｅ）のブロック図の例および表事前訓練段階（ｔａｂｕｌａｒｐｒｅ－ｔｒａｉｎｉｎｇｓｔａｇｅ）のブロック図の例である。

【図5】本発明の一実施形態による欠落様式帰属過程を示したブロック図である。

【図6】本発明の一実施形態による検査段階のブロック図の例である。

【図7】本発明の一実施形態による訓練および推論枠組みのブロック図の例である。

【図8】本発明の一実施形態によって欠落不対画像および／または表様式を融合する方法を示したフローチャートである。

【図9】本発明の一実施形態による通信網環境内にある電子装置のブロック図である。

【発明を実施するための形態】

【0029】

以下の詳細な説明で、本発明を完全に理解することができるように多くの具体的な項目を提示する。しかし、このような具体的項目がなくても本発明の特徴を実施することができるのを当業者には理解できるはずである。他の事例として、本発明の要旨を曖昧にしないためによく知られた方法、順序、構成要素および回路については詳細に説明しない。

【0030】

本明細書全体で「一実施形態」に関する言及はその実施形態について説明した特定の特徴（ｆｅａｔｕｒｅ）、構造（ｓｔｒｕｃｔｕｒｅ）または特性（ｃｈａｒａｃｔｅｒｉｓｔｉｃ）がここで説明する少なくとも一つの実施形態に含まれるということを意味する。したがって、「一実施形態で」、「一実施形態では」または「一実施形態によれば」という文句（または類似の意味を有する他の文句）が明細書全体の多様なところに現れても全て同一の実施形態を言及するのではない。また、一つ以上の実施形態で特定の特徴、構造および特性が適切に結合できる。これと関連してここで使用する「例示の（ｅｘｅｍｐｌａｒｙ）」という単語は「例示、事例、実例、例などとして使われる（ｓｅｒｖｉｎｇａｓａｎｅｘａｍｐｌｅ、ｉｎｓｔａｎｃｅ、ｏｒｉｌｌｕｓｔｒａｔｉｏｎ）」ことを意味する。ここで「例示の（ｅｘｅｍｐｌａｒｙ）」ものと説明する実施形態（ｅｍｂｏｄｉｍｅｎｔ）が必ずしも他の実施形態に比べて好ましいかまたは有利であると解釈してはならない。また、一つ以上の実施形態で特定特徴、構造または特性を適切に結合することができる。また、脈絡によって単数用語が対応する複数形態を含むことができ、複数用語が対応する単数形態を含むことができる。同様に、ハイフンでつながれた用語（ｈｙｐｈｅｎａｔｅｄｔｅｒｍ）［例えば、「２－次元（ｔｗｏ－ｄｉｍｅｎｓｉｏｎａｌ）」、「８－ビット（８－ｂｉｔ）」、「画素－固有（ｐｉｘｅｌ－ｓｐｅｃｉｆｉｃ）」など］は、これに対応するハイフン省略型（ｎｏｎ－ｈｙｐｈｅｎａｔｅｄｖｅｒｓｉｏｎ）［例えば、「２次元（ｔｗｏｄｉｍｅｎｓｉｏｎａｌ）」、「８ビット（８ｂｉｔ）」、「画素固有（ｐｉｘｅｌ－ｓｐｅｃｉｆｉｃ）」など］とたまに換えて使用することができ、英語大文字で始まる項目（ｃａｐｉｔａｌｉｚｅｄｅｎｔｒｙ）（例えば、「ＣｏｕｎｔｅｒＣｌｏｃｋ」、「ＲｏｗＳｅｌｅｃｔ」、「ＰＩＸＯＵＴ」など）は、これに対応する非大文字型（ｎｏｎ－ｃａｐｉｔａｌｉｚｅｄｖｅｒｓｉｏｎ）（例えば、「ｃｏｕｎｔｅｒｃｌｏｃｋ、「ｒｏｗｓｅｌｅｃｔ」、「ｐｉｘｏｕｔ」など）と換えて使用することができる。このような間欠的交替使用を互いに符合しないと見なしてはならない。

【0031】

また説明の脈絡によって、一つの用語が該当する複数の形態を含むことができ、複数の用語が該当する一つの形態を含むこともできる。ここで図示し説明する［構成図（ｃｏｍｐｏｎｅｎｔｄｉａｇｒａｍ）を含む］様々の図面は例示を目的にして提示したものに過ぎず、一定比率で拡大／縮小して描いたものではない。例えば、明確性のために一部構成要素の大きさを他の構成要素に比べて誇張することもある。また、図面符号は、不適切でない限り、同一／対応または類似の構成要素を示すように様々の図面で繰り返して使用した。

【0032】

ここで使用された用語は特定実施形態を説明する目的で使用するものに過ぎず、本発明を制限しようとするものではない。ここで数を特に言及しなければ単数または複数の場合を全て含む。ある特徴、段階、動作、部分、成分、構成要素などを「含む」という表現は当該部分以外に他の特徴、段階、動作、部分、成分、構成要素なども含むことができるということを意味する。

【0033】

構成要素（ｅｌｅｍｅｎｔ）または層（階）（ｌａｙｅｒ）が他の構成要素または層（階）「の上に」あるかまたはこれらと「連結」または「結合」されていると記載する場合、他の構成要素または層（階）真上にあるかまたは直接連結または結合されている場合だけでなく、中間にまた他の構成要素または層（階）が挟まれている場合も含む。しかし、構成要素または層（階）が他の構成要素または層（階）「真上に」あるかまたはこれらと「直接連結」または「直接結合」されていると記載すれば、中間にまた他の構成要素または層（階）が挟まれていないということを意味する。明細書全体にわたって同一または類似の構成要素については同一図面符号を付けた。ここで「および／または」という表現は羅列されたもののうちの一つまたは二つ以上の全ての組み合わせを含む。

【0034】

「第１」、「第２」などの用語を先行名詞に対する修飾語として使用するが、明確に定義しない限り（例えば、空間的、時間的、論理的など）ある類型の配置を意味するのではない。また、二つ以上の図面で同一または類似の機能を有する部分（ｐａｒｔ）、部品（ｃｏｍｐｏｎｅｎｔ）、ブロック（ｂｌｏｃｋ）、回路（ｃｉｒｃｕｉｔ）、単位（ｕｎｉｔ）、モジュール（ｍｏｄｕｌｅ）を同一の図面符号で示すことができる。しかし、このような使用は図示を簡便にし説明を簡単にするためのものに過ぎず、このような部品または単位の具体的構成または構造が全ての実施形態で同一であるかまたは同一符号で示す部分／モジュールが一部実施形態を実現する唯一の方法であるということを意味しない。

【0035】

別段に定義しない限り、ここで使用する（技術的、科学的用語を含む）全ての用語は本発明の属する技術分野における通常の知識を有する者が一般に理解するものと同一の意味を有する。ここで明らかに定義しない限り、一般に使用される辞典で定義された用語などの用語は関連技術分野で使用する意味と一致する意味を有すると解釈しなければならず、理想化されるかまたは過度に形式的な意味に解釈されないことと理解しなければならない。

【0036】

ここで「モジュール（ｍｏｄｕｌｅ）」という用語はモジュールと関連してここで説明する機能を提供するソフトウェア（ｓｏｆｔｗａｒｅ）、ファームウエア（ｆｉｒｍｗａｒｅ）および／またはハードウェア（ｈａｒｄｗａｒｅ）の任意の組み合わせを示す。例えば、ソフトウェアはソフトウェアパッケージ（ｓｏｆｔｗａｒｅｐａｃｋａｇｅ）、コードおよび／または命令集合または命令で体現／実施することができ、ここで説明する実施で使用する「ハードウェア」という用語は、例えば、アセンブリー（ａｓｓｅｍｂｌｙ）、ハードウェア内蔵回路（ｈａｒｄｗｉｒｅｄｃｉｒｃｕｉｔｒｙ）、プログラム可能回路（ｐｒｏｇｒａｍｍａｂｌｅｃｉｒｃｕｉｔｒｙ）、状態機械（ｓｔａｔｅｍａｃｈｉｎｅ）回路および／またはプログラム可能回路が実行する命令を記憶するファームウエアなど単独またはこれらの組み合わせを含むことができる。モジュールは、例えば、集積回路（ＩＣ：ｉｎｔｅｇｒａｔｅｄｃｉｒｃｕｉｔ）、ＳｏＣ（ｓｙｓｔｅｍｏｎ－ａ－ｃｈｉｐ）、アセンブリーなど（しかし、これに限定されない）さらに大きなシステムの一部を成す回路で集合的または個別的に体現／実施できる。

【0037】

図１は、画像および表形データを含む捕捉センサーデータ（ｃａｐｔｕｒｅｄｓｅｎｓｏｒｄａｔａ）の例を示す。さらに詳細に説明すれば、一部データ行は画像様式（ｉｍａｇｅｍｏｄａｌｉｔｙ）を含み、一部データ行は表形データ様式（ｔａｂｕｌａｒｄａｔａｍｏｄａｌｉｔｙ）［または表様式（ｔａｂｕｌａｒｍｏｄａｌｉｔｙ）］を含み、一部データ行は画像および表形データ様式を全て含む。したがって、画像および表形データを全て含む行は対様式（ｐａｉｒｅｄｍｏｄａｌｉｔｙ）または完全様式（ｃｏｍｐｌｅｔｅｍｏｄａｌｉｔｙ）と言える。本明細書で「対様式」、「完全様式」および「完全対様式（ｃｏｍｐｌｅｔｅｌｙｐａｉｒｅｄｍｏｄａｌｉｔｙ）」という用語を互いに換えて使用することができる。一方、一部行は画像様式または表様式がないかまたは抜け落ちている。このような行は不対様式（ｕｎｐａｉｒｅｄｍｏｄａｌｉｔｙ）または不完全様式（ｉｎｃｏｍｐｌｅｔｅｍｏｄａｌｉｔｙ）と言える。しかし、センサーが画像データおよび当該表形データの両方ともを常に捕捉するのではないため、捕捉センサーデータには多くの不対様式が含まれる。

【0038】

このような捕捉センサーデータが深層学習モデルのモデルデータセットとして使用されれば、一部技術は不対様式を使用することができない。その代わりに、多くの技術は対様式のみを使用することができ、これにより不対様式は役に立たなくなることがある。したがって、このような対様式要件を達成するための一つの方法は、不完全標本（即ち、不対様式）を無視するかまたは捨てることである。しかし、このようにすれば、既に収集したデータを大量浪費するようになる。この要件を達成するための他の方法は、欠落様式を０または平均値で代置することである。しかし、この方法は画像様式など複合様式（ｃｏｍｐｌｅｘｍｏｄａｌｉｔｙ）に対して難しい過程になるはずである。この要件を達成するための他の方法は、当該行の観察された様式（ｏｂｓｅｒｖｅｄｍｏｄａｌｉｔｙ）（例えば、表形データ様式が抜け落ちる場合、画像様式、またはその反対）から欠落様式を生成することである。しかし、この技術の短所は、様式の間の相互関係に過度に依存するため、費用が多くかかり情報より雑音がさらに多く入ることがあるということである。したがって、欠落様式があるモデルデータセットを使用するために、浪費がさらに少なく、費用がさらに安く、雑音が少なく発生する向上した技術が必要である。

【0039】

先に言及したように、センサーデータが欠落様式を有することが頻繁であるとしても、多くのモデルは画像および表現データ様式の両方ともで訓練できる。欠落様式があるセンサーデータで検査する間にこのようなモデルを使用すれば、これらモデルがこのようなクエリー標本（ｑｕｅｒｙｓａｍｐｌｅ）を処理する程度に十分に堅固でないことが判明する。図２はこのような一例を示すものであって、多重モード訓練を受けたモデル（ｍｕｌｔｉｍｏｄａｌｔｒａｉｎｅｄｍｏｄｅｌ）を完全様式一行、表形データ様式欠落一行、そして画像様式欠落一行を有するクエリー標本と共に使用する。このような場合、検査中に欠落様式が帰属されても定量的な説明が生成されない。

【0040】

以下、本発明の様々の実施形態によって欠落または不対様式があるデータで多重モード欠陥分類器を訓練させるための効果的、効率的枠組みを構築する技術について説明する。このような枠組みは全てのデータに対する表現（ｒｅｐｒｅｓｅｎｔａｔｉｏｎ）を生成するのに効果的なようにモデルを訓練することによって構築できる。欠落様式は対様式から得ることができるデータを使用することによって効率的に帰属できる。この過程で、様式が対様式として融合できる。一応枠組みが生成されれば、単一モード予測と多重モード（例えば、二重モード）予測の両方ともに効果的なようにモデルを訓練することによって、欠落様式がある検査標本に対する強力な予測を達成することができる。したがって、効果的な枠組みを構築し単一モード予測と多重モード予測の両方ともを生成することによって、欠落様式がある検査標本に対するモデル予測に関する定量的説明を得ることができる。即ち、二つの様式（例えば、画像および表形データ）を結合する理由と方法について説明することができる定量的測定、そして結合された予測の信頼度要因が生成できる。

【0041】

図３および図４はそれぞれ、本発明の一実施形態による画像事前訓練段階（ｉｍａｇｅｐｒｅ－ｔｒａｉｎｉｎｇｓｔａｇｅ）のブロック図の例および表事前訓練段階（ｔａｂｕｌａｒｐｒｅ－ｔｒａｉｎｉｎｇｓｔａｇｅ）のブロック図の例である。これによれば、図３の画像事前訓練段階３０６は例えば、ＫａｉｍｉｎｇＨｅなどの論文[He, Kaiming, et al. 「Masked autoencoders are scalable vision learners.」 Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2022.]（ここに引用することによってこの論文の全体内容を本願に含む）に記載された視覚認識変換器（ｖｉｓｉｏｎｔｒａｎｓｆｏｒｍｅｒ）技術など再建事前訓練画像モデル（ｒｅｃｏｎｓｔｒｕｃｔｉｖｅｐｒｅ－ｔｒａｉｎｉｎｇｉｍａｇｅｍｏｄｅｌ）を符号器（ｅｎｃｏｄｅｒ）３０８として使用することができる。したがって、符号器３０８は画像の表現（ｒｅｐｒｅｓｅｎｔａｔｉｏｎ）またはエンベディング（ｅｍｂｅｄｄｉｎｇ）を生成するように訓練できる。本発明の一実施形態によれば、視覚認識変換器技術は原本画像（ｏｒｉｇｉｎａｌｉｍａｇｅ）３０２の約７５％のパッチ（ｐａｔｃｈ）を無作為に隠し（３０４）、符号器３０８は符号器出力で隠したパッチ（ｍａｓｋｅｄｐａｔｃｈ）の予測を生成する３１０。その次に、復号器（ｄｅｃｏｄｅｒ）３１２を使用して原本画像３０２の形態を最もよく示すように共に画像３１４を生成することができる。したがって、画像再建符号器３０８は隠された入力画像を再建するようにこの事前訓練段階で訓練できる。この事前訓練段階終了後に、符号器３０８を今訓練し、符号器３０８を動作（例えば、表示パネル欠陥分類システムを動作させる時）に今使用することができる。言い換えれば、隠し（ｍａｓｋｉｎｇ）３０４または復号器３１２をそれ以上使用しない。

【0042】

本発明の他の実施形態によれば、図４の表事前訓練段階ではＤａｒａＢａｈｒｉなどの論文[Bahri, Dara, et al. 「Scarf: Self-Supervised Contrastive Learning using Random Feature Corruption.」International Conference on Learning Representations. 2021.]およびJinsung Yoonなどの論文[Yoon, Jinsung, et al. 「Vime: Extending the success of self-and semi-supervised learning to tabular domain.」 Advances in Neural Information Processing Systems 33 (2020): 11033-11043.]（ここに引用することによってこの論文の全体内容を本願に含む）に記載されたＳｃａｒｆおよびＶｉｍｅ技術を結合することによって表形モデルを訓練させ、特性－トークン化変換器（ｆｅａｔｕｒｅ－ｔｏｋｅｎｉｚｅｒｔｒａｎｓｆｏｒｍｅｒ）を表の表現またはエンベディングを生成するように表形符号器として訓練させる。特性－トークン化変換器技術に対する詳細な内容はＹｕｒｙＧｏｒｉｓｈｎｉｙなどの論文[Gorishniy, Yury, et al. 「Revisiting deep learning models for tabular data.」 Advances in Neural Information Processing Systems 34 (2021): 18932-18943.]（ここに引用することによってこの論文の全体内容を本願に含む）に開示されている。したがって、値がある表形標本（ｔａｂｌｅｓａｍｐｌｅｓｗｉｔｈｖａｌｕｅｓ）の無作為損傷項目（ｒａｎｄｏｍｌｙｃｏｒｒｕｐｔｅｎｔｒｙ）はその限界確率（ｍａｒｇｉｎａｌｐｒｏｂａｂｉｌｉｔｙ）によって選ばれ（ｄｒａｗ）、ａｎｄ多段階認識（ＭＬＰ：ｍｕｌｔｉｌｅｖｅｌｐｅｒｃｅｐｔｉｏｎ）復号器を使用して比較および雑音消去を通じて学習する。したがって、図４に示したように、特性－トークン化変換器など符号器４０８は無作為損傷された４０４原本表形入力（ｏｒｉｇｉｎａｌｔａｂｕｌａｒｉｎｐｕｔ）４０２を取り、符号器４０８の出力は原本表形入力を再建４１２しようとする努力の一環として復号器４１０によって復号化される。図３の画像符号器のように、この事前訓練段階終了後に、表形符号器４０８を今訓練し、符号器４０８を［画像符号器３０８と共に］動作（例えば、表示パネル欠陥分類システムを動作させる時）に今使用することができる。言い換えれば、損傷器（ｃｏｒｒｕｐｔｏｒ）４０４または復号器４１０をそれ以上使用しない。

【0043】

事前訓練段階を終えると、画像様式用モデル符号器と表様式用モデル符号器は欠陥分類などの動作に使用する準備ができたのである。したがって、符号器がデータセットを例えば画像および表形データなどの原始情報（ｒａｗｉｎｆｏｒｍａｔｉｏｎ）を収集するセンサーから受信した時、そのデータセットは欠落様式であり得る。即ち、データセットの一部行は画像様式のみを含むかまたは表様式のみを含むことができ、一部行は画像様式と表様式の両方ともを含む完全対を含むことができる。本発明の一実施形態によれば、欠落様式は潜在空間（ｌａｔｅｎｔｓｐａｃｅ）に帰属できるが、これは欠落エンベディングを他の観察様式（ｏｂｓｅｒｖｅｄｍｏｄａｌｉｔｙ）から生成する代わりに、既存の完全対様式のうちの同一な様式の他のエンベディングを補間することによって帰属させるのである。言い換えれば、完全対様式を有する他のデータ行で該当する同一の様式からエンベディングを補間することによって帰属を行う。

【0044】

図５は、本発明の一実施形態による欠落様式帰属過程を示したブロック図である。ここで、データセット５０２は、画像様式または表様式が抜け落ちた不完全様式であってもよい。したがって、標本に特定様式（ｅｍｉｓｓｉｎｇ）がなければ、対データ（ｐａｉｒｅｄｄａｔａ）からＫ個の以前項目（ｐｒｉｏｒ）を選択することができる。例えば、表様式が欠落様式であれば、Ｋ個の完全対様式標本からＫ個の以前項目を選択し（５０４）、Ｋ個の標本から画像様式用エンベディングを補間することができる。本発明の一実施形態によれば、Ｋ個の以前項目は観察様式（即ち、画像様式）（ｅｏｂｓｅｒｖｅｄ）のエンベディングの間のコサイン類似性（ｃｏｓｉｎｅｓｉｍｉｌａｒｉｔｙ）で測定した時、観察様式のエンベディングに最も近いエンベディングを有する標本として選択される。その次にＫ個の標本とＫ個の以前項目の間の交差注意（ｃｒｏｓｓ－ａｔｔｅｎｔｉｏｎ）を取ることによって、欠落様式（即ち、表様式）のＫ個の以前エンベディングを加重値（ｗｊ）で加重合算することができる。加重合計は次いで浅い（ｓｈａｌｌｏｗ）（例えば、２階層）ＭＬＰｊを通過して表帰属ブロック（ｔａｂｕｌａｒｉｍｐｕｔａｔｉｏｎｂｌｏｃｋ）５０８で帰属エンベディング（ｉｍｐｕｔａｔｉｏｎｅｍｂｅｄｄｉｎｇ）を生成することができる。最後に、補間エンベディング（ｉｎｔｅｒｐｏｌａｔｅｄｅｍｂｅｄｄｉｎｇｓ）を観察エンベディング（ｏｂｓｅｒｖｅｄｅｍｂｅｄｄｉｎｇｓ）と結合して連結エンベディング（ｃｏｎｃａｔｅｎａｔｅｄｅｍｂｅｄｄｉｎｇｓ）５１２を生成することができる。

【0045】

同様に、画像様式が欠落様式であれば、Ｋ個の完全対様式標本からＫ個の以前項目を選択し（５０６）、Ｋ個の標本から表様式用エンベディングを補間することができる。本発明の一実施形態によれば、Ｋ個の以前項目は観察様式（即ち、表様式）（ｅｏｂｓｅｒｖｅｄ）のエンベディングの間のコサイン類似性（ｃｏｓｉｎｅｓｉｍｉｌａｒｉｔｙ）で測定した時、観察様式のエンベディングに最も近いエンベディングを有する標本として選択できる。その次に、Ｋ個の標本とＫ個の以前項目の間の交差注意（ｃｒｏｓｓ－ａｔｔｅｎｔｉｏｎ）を取ることによって、欠落様式（即ち、画像様式）のＫ個の以前エンベディングを加重値（ｗ_ｊ）で加重合算することができる。加重合計は次いで浅い（ｓｈａｌｌｏｗ）（例えば、２階層）ＭＬＰ_ｊを通過して画像帰属ブロック（ｉｍａｇｅｉｍｐｕｔａｔｉｏｎｂｌｏｃｋ）５１０で帰属エンベディング（ｉｍｐｕｔａｔｉｏｎｅｍｂｅｄｄｉｎｇ）を生成することができ、補間エンベディング（ｉｎｔｅｒｐｏｌａｔｅｄｅｍｂｅｄｄｉｎｇｓ）を観察エンベディング（ｏｂｓｅｒｖｅｄｅｍｂｅｄｄｉｎｇｓ）と結合して連結エンベディング（ｃｏｎｃａｔｅｎａｔｅｄｅｍｂｅｄｄｉｎｇｓ）５１２を生成することができる。

【0046】

帰属を行った後に、単一モード（例えば、単一様式）予測と二重モード（例えば、二重様式）予測の両方ともを行って欠落様式に対する堅固性を確保するように画像符号器および表符号器それぞれを訓練させることができる。したがってこのために、単一様式予測が信頼できるかを確認し、多重様式予測も信頼できるかを確認するために検査段階で符号器を検査する。

【0047】

図６は、検査段階のブロック図の例である。ここで、原始入力（ｒａｗｉｎｐｕｔ）から得られたデータセット６０２を様式専用符号器（ｍｏｄａｌｉｔｙ－ｓｐｅｃｉｆｉｃｅｎｃｏｄｅｒ）、具体的に画像符号器（ｉｍａｇｅｅｎｃｏｄｅｒ）６０４および表符号器（ｔａｂｕｌａｒｅｎｃｏｄｅｒ）６０６に提供する。ここで、各様式の表現を抽出した後、表現を連結し（６０８）、これを予測ブロック６１０に提供することができる。本発明の一実施形態によれば、予測ブロック６１０は相対的に浅い（例えば、２階層）変換器であってもよい。この方式で、符号器６０４、６０６は予測ブロック６１０と共に微細調整できる。

【0048】

本発明の一実施形態によれば、予測ブロック６１０（例えば、変換器）は３個の分類トークン（ｃｌａｓｓｉｆｉｃａｔｉｏｎｔｏｋｅｎ）（ＣＬＳｉ、ｉ∈｛Ｉ、Ｔ、Ｉ＆Ｔ｝）を有することができ、ここでＩは画像基盤予測に該当し、Ｔは表基盤予測に該当し、Ｉ＆Ｔは二重モード基盤予測に該当する。したがって、訓練中に注意（ａｔｔｅｎｔｉｏｎ）を隠して単一モード分類トークンが当該様式のトークンのみを見るようにする反面、二重モード分類は全てのトークンを見る。このような分類トークンは互いに隠すことができる。本発明の一実施形態によれば、変換器を３個の交差エントロピー損失（ｃｒｏｓｓ－ｅｎｔｒｏｐｙｌｏｓｓ）で訓練して欠落様式に対する堅固性を確保することができる。さらに詳しい内容はＭｅｎｇｍｅｎｇＭａなどの論文[Ma, Mengmeng, et al. 「Are Multimodal Transformers Robust to Missing Modality?」 Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2022.]（ここに引用することによってこの論文の全体内容を本願に含む）に開示されている。

【0049】

図７は、本発明の一実施形態による訓練および推論枠組みのブロック図の例である。前述のように、予測ブロックは３個の分類トークンを有し、予測ブロックの出力は様式影響説明ブロック（ｍｏｄａｌｉｔｙｉｍｐａｃｔｅｘｐｌａｉｎｅｒｂｌｏｃｋ）７０２に供給される。本発明の一実施形態によれば、予測（ｖ）に対する各様式（ｉ）の影響（ｉｍｐａｃｔ）はシャプリー値（Ｓｈａｐｌｅｙｖａｌｕｅ）を使用して測定することができ、その様式がある場合とない場合の予測差を確認することによって可能である。したがって、影響説明ブロック７０２は各様式の重要度（ｉｍｐｏｒｔａｎｃｅ）の定量的測定を生成して各様式がモデルにどんな影響を与えることができるかを決定するようにし、これは再びモデルの予測に影響を与える。

【0050】

本発明の一実施形態によれば、ＮｅｉｌＪｅｔｈａｎｉなどの論文[Jethani, Neil, et al. 「FastSHAP: Real-Time Shapley Value Estimation.」 International Conference on Learning Representations. 2021.]（ここに引用することによってこの論文の全体内容を本願に含む）に記載されたＦａｓｔＳＨＡＰ推定技術（ｅｓｔｉｍａｔｉｏｎｔｅｃｈｎｉｑｕｅ）を使用して償却推定（ａｍｏｒｔｉｚｅｄｅｓｔｉｍａｔｉｏｎ）を行うことができる。分類モデルをθで媒介変数化（ｐａｒａｍｅｔｅｒｉｚａｔｉｏｎ）すると仮定し、他の多段階認識（ＭＬＰ：ｍｕｌｔｉｌｅｖｅｌｐｅｒｃｅｐｔｉｏｎ）（β）をシャプリー値（φ’）のプロキシ（ｐｒｏｘｙ）を得る推定器（ｅｓｔｉｍａｔｏｒ）として訓練することができる。

【0051】

【数1】

【0052】

ＭＬＰは次の損失を最少化するように訓練することができる。

【数2】

【0053】

【0054】

【数3】

【0055】

したがって、シャプリー値を使用して単一モード予測および二重モード予測に対する信頼度値（ｃｏｎｆｉｄｅｎｃｅｖａｌｕｅ）を決定して信頼度値が高いものを選択することができ、符号器はこれを抜け落ちた不対（ｕｎｐａｉｒｅｄ）画像と表形データの融合に使用することができる。したがって、製造施設のセンサー装置から原始画像および表形データを持ってきて、製作された製品（例えば、表示パネル）に存在する欠陥を自動的に識別するニューラルネットワークでコンピュータをプログラミングすることができる。

【0056】

図８は、本発明の一実施形態によって欠落不対画像および／または表様式を融合する方法を示したフローチャートである。本発明の一実施形態によれば、データ行を含むデータセットが提供される。各データ行は少なくとも二つの様式に対する列を含むことができる。一例によれば、様式のうちの一つは画像様式であり、他の様式は表様式であってもよい。したがって好ましいシナリオでは、一つのデータ行が画像様式と表様式の両方ともを含む。しかし、本明細書では二つの様式のうちの一つが抜け落ちる場合に一つの様式を提供する方法を提示する。したがって、本発明の一実施形態によれば、データ行は少なくとも一つの不対様式行（ｒｏｗｏｆｕｎｐａｉｒｅｄｍｏｄａｌｉｔｙ）と少なくとも一つの対様式データ行（ｒｏｗｏｆｄａｔａｔｈａｔｉｎｃｌｕｄｅｓａｐａｉｒｅｄｍｏｄａｌｉｔｙ）を含むことができる（８０２）。言い換えれば、不対様式は（例えば、画像様式または表様式であり得る）第１様式を含み、第２様式は抜け落ちることがあり、これによりこの行で様式は不対である（対を成さない）。対様式を含む他の行は第１様式と第２様式を両方とも含み、例えば画像様式と表様式が両方とも存在する。その次に、様式専用符号器（ｍｏｄａｌｉｔｙ－ｓｐｅｃｉｆｉｃｅｎｃｏｄｅｒ）を使用して、対様式中の第２様式からエンベディングを補間することによって、少なくとも一つの不対様式行を帰属させることができる（８０４）。言い換えれば、欠落様式、この例では第２様式は、入手可能な完全対様式から欠落様式と同一な様式の既存データを補間することによって帰属できる。その次に、様式専用符号器を単一モード予測および二重モード予測の帰属に基づいて潜在空間で訓練させることができ（８０６）、単一モード予測および二重モード予測に対する信頼度値を生成することができる（８０８）。本発明の一実施形態によれば、信頼度値は各様式の重要度に対応する定量的測定値であるシャプリー基盤説明を計算することによって生成することができる。したがって、このような説明は各様式がモデルにどんな影響を与えるかを定量化する。

【0057】

図９は、本発明の一実施形態による通信網環境（ｎｅｔｗｏｒｋｅｎｖｉｒｏｎｍｅｎｔ）９００内にある電子装置９０１のブロック図である。

【0058】

図９を参照すれば、通信網環境９００内にある電子装置９０１は第１通信網９９８（例えば、短距離無線通信網）を通じて電子装置９０２と通信するか、または第２通信網９９９（例えば、長距離無線通信網）を通じて電子装置９０４またはサーバー９０８と通信できる。電子装置９０１はサーバー９０８を通じて電子装置９０４と通信できる。電子装置９０１はプロセッサー（ｐｒｏｃｅｓｓｏｒ）９２０、メモリ（ｍｅｍｏｒｙ）９３０、入力装置９５０、音響出力装置（ｓｏｕｎｄｏｕｔｐｕｔｄｅｖｉｃｅ）９５５、表示装置（ｄｉｓｐｌａｙｄｅｖｉｃｅ）９６０、オーディオモジュール（ａｕｄｉｏｍｏｄｕｌｅ）９７０、センサーモジュール（ｓｅｎｓｏｒｍｏｄｕｌｅ）９７６、インターフェース（ｉｎｔｅｒｆａｃｅ）９７７、触覚モジュール（ｈａｐｔｉｃｍｏｄｕｌｅ）９７９、カメラモジュール９８０、電力管理モジュール９８８、乾電池（ｂａｔｔｅｒｙ）９８９、通信モジュール９９０、加入者識別モジュール（ＳＩＭ：ｓｕｂｓｃｒｉｂｅｒｉｄｅｎｔｉｆｉｃａｔｉｏｎｍｏｄｕｌｅ）カード９９６、またはアンテナモジュール（ａｎｔｅｎｎａｍｏｄｕｌｅ）９９４を含むことができる。本発明の一実施形態によれば、電子装置９０１の部品のうちの少なくとも一つ（例えば、表示装置９６０またはカメラモジュール９８０）を除くか、または電子装置９０１に一つ以上の他の部品を加えることができる。一部部品は一つの集積回路（ＩＣ：ｉｎｔｅｇｒａｔｅｄｃｉｒｃｕｉｔ）として実現できる。例えば、センサーモジュール９７６［例えば、指紋センサー（ｆｉｎｇｅｒｐｒｉｎｔｓｅｎｓｏｒ）、虹彩センサー（ｉｒｉｓｓｅｎｓｏｒ）または照度センサー（ｉｌｌｕｍｉｎａｎｃｅｓｅｎｓｏｒ）］を表示装置９６０に内蔵することができる。

【0059】

プロセッサー９２０は、ソフトウェア（例えば、プログラム９４０）を実行して自分と連結された電子装置９０１の少なくとも一つの部品を制御することができ、様々のデータ処理と計算を行うことができる。

【0060】

データ処理と計算の少なくとも一部として、プロセッサー９２０は揮発性メモリ（ｖｏｌａｔｉｌｅｍｅｍｏｒｙ）９３２内にある、他の部品（例えば、センサーモジュール９７６または通信モジュール９９０）から受信したデータまたは命令をローディングし、揮発性メモリ９３２内に記憶されたデータまたは命令を処理し、結果データを非揮発性メモリ（ｎｏｎ－ｖｏｌａｔｉｌｅｍｅｍｏｒｙ）９３４内に記憶させる。プロセッサー９２０は主プロセッサー（ｍａｉｎｐｒｏｃｅｓｓｏｒ）９２１［例えば、中央処理装置（ＣＰＵ：ｃｅｎｔｒａｌｐｒｏｃｅｓｓｉｎｇｕｎｉｔ）またはアプリケーションプロセッサー（ＡＰ：ａｐｐｌｉｃａｔｉｏｎｐｒｏｃｅｓｓｏｒ）］および補助プロセッサー（ａｕｘｉｌｉａｒｙｐｒｏｃｅｓｓｏｒ）９２３［例えば、グラフィック処理装置（ＧＰＵ：ｇｒａｐｈｉｃｓｐｒｏｃｅｓｓｉｎｇｕｎｉｔ）、画像信号プロセッサー（ＩＳＰ：ｉｍａｇｅｓｉｇｎａｌｐｒｏｃｅｓｓｏｒ）、センサーハブプロセッサー（ｓｅｎｓｏｒｈｕｂｐｒｏｃｅｓｓｏｒ）または通信プロセッサー（ＣＰ：ｃｏｍｍｕｎｉｃａｔｉｏｎｐｒｏｃｅｓｓｏｒ）］を含むことができ、補助プロセッサー９２３は主プロセッサー９２１と独立して動作するかまたは連係して動作する。追加的に、または代案として、補助プロセッサー９２３は主プロセッサー９２１より電力消耗が少ないかまたは特定の関数を実行するのに適したものであり得る。補助プロセッサー９２３は主プロセッサー９２１の一部として実現されるかまたは主プロセッサー９２１と分離実現できる。

【0061】

補助プロセッサー９２３は、主プロセッサー９２１が非活動（ｉｎａｃｔｉｖｅ）状態（例えば、睡眠状態）であるとき、主プロセッサー９２１の代わりに、主プロセッサー９２１が活動（ａｃｔｉｖｅ）状態である時（例えば、アプリケーションを実行する時）は主プロセッサー９２１と共に、電子装置９０１の部品のうちの少なくとも一つ（例えば、表示装置９６０、センサーモジュール９７６または通信モジュール９９０）と関連する少なくとも一部関数または状態を制御することができる。補助プロセッサー９２３（例えば、画像信号プロセッサーまたは通信プロセッサー）は補助プロセッサー９２３と機能的に関連する他の部品（例えば、カメラモジュール９８０または通信モジュール９９０）の一部として実現できる。

【0062】

メモリ９３０は電子装置９０１の少なくとも一つの部品（例えば、プロセッサー９２０またはセンサーモジュール９７６）が使用する様々のデータを記憶することができる。そのようなデータの例としてはソフトウェア（例えば、プログラム９４０）およびこれと関連した命令のための入力データまたは出力データが挙げられる。メモリ９３０は揮発性メモリ９３２または非揮発性メモリ９３４を含むことができる。非揮発性メモリ９３４は内部メモリ９３６および／または外部メモリ９３８を含むことができる。

【0063】

プログラム９４０はメモリ９３０にソフトウェアとして記憶され、例えばオペレーティングシステム（ＯＳ：ｏｐｅｒａｔｉｎｇｓｙｓｔｅｍ）９４２、ミドルウェア（ｍｉｄｄｌｅｗａｒｅ）９４４またはアプリケーション９４６を含むことができる。

【0064】

入力装置９５０は、電子装置９０１の他の部品（例えば、プロセッサー９２０）が使用する命令またはデータを電子装置９０１の外部（例えば、ユーザ）から受信できる。入力装置９５０は、例えば、マイク（ｍｉｃｒｏｐｈｏｎｅ）、マウス（ｍｏｕｓｅ）またはキーボード（ｋｅｙｂｏａｒｄ）を含むことができる。

【0065】

音響出力装置９５５は、電子装置９０１の外部に音響信号を出力することができる。音響出力装置９５５は、例えば、スピーカまたは受信機を含むことができる。スピーカはマルチメディア再生または記録など汎用であってもよく、受信機は着信呼出（ｉｎｃｏｍｉｎｇｃａｌｌ）を受信するのに使用できる。受信機はスピーカの一部として実現されるか、またはスピーカと独立して実現できる。

【0066】

表示装置９６０は、電子装置９０１の外部（例えば、ユーザ）に視覚的に情報を提供することができる。表示装置９６０は例えば、ディスプレイ（ｄｉｓｐｌａｙ）、ホログラム装置（ｈｏｌｏｇｒａｍｄｅｖｉｃｅ）またはプロジェクター（ｐｒｏｊｅｃｔｏｒ）、そしてこれらのうちの対応する一つを制御するための制御回路を含むことができる。表示装置９６０は、接触を感知するのに適した接触回路（ｔｏｕｃｈｃｉｒｃｕｉｔｒｙ）または接触で発生した力の強さを測定するのに適したセンサー回路（例えば、圧力センサー）を含むことができる。

【0067】

オーディオモジュール９７０は、音響を電気信号に変換するか、またはその反対に変換することができる。オーディオモジュール９７０は、入力装置９５０を通じて音響を受信するか、または音響出力装置９５５または電子装置９０１と直接（例えば、有線で）または無線で連結された外部電子装置９０２のヘッドホンを通じて音響を出力することができる。

【0068】

センサーモジュール９７６は、電子装置９０１の動作状態（例えば、電力または温度）または電子装置９０１外部の環境状態（例えば、ユーザ状態）を感知し、感知した状態に対応する電気信号またはデータ値を生成することができる。センサーモジュール９７６は、例えばジェスチャーセンサー（ｇｅｓｔｕｒｅｓｅｎｓｏｒ）、ジャイロセンサー（ｇｙｒｏｓｅｎｓｏｒ）、気圧センサー（ａｔｍｏｓｐｈｅｒｉｃｐｒｅｓｓｕｒｅｓｅｎｓｏｒ）、磁気センサー（ｍａｇｎｅｔｉｃｓｅｎｓｏｒ）、加速度センサー（ａｃｃｅｌｅｒａｔｉｏｎｓｅｎｓｏｒ）、握力センサー（ｇｒｉｐｓｅｎｓｏｒ）、近接センサー（ｐｒｏｘｉｍｉｔｙｓｅｎｓｏｒ）、色センサー（ｃｏｌｏｒｓｅｎｓｏｒ）、赤外線センサー［ｉｎｆｒａｒｅｄ（ＩＲ）ｓｅｎｓｏｒ］、生体認識センサー（ｂｉｏｍｅｔｒｉｃｓｅｎｓｏｒ）、温度センサー、湿度センサー（ｈｕｍｉｄｉｔｙｓｅｎｓｏｒ）または照度センサー（ｉｌｌｕｍｉｎａｎｃｅｓｅｎｓｏｒ）を含むことができる。

【0069】

インターフェース９７７は、電子装置９０１を外部電子装置９０２と直接（例えば、有線で）または無線で連結するのに使用する一つ以上の特定プロトコル（ｐｒｏｔｏｃｏｌ）を支援することができる。インターフェース９７７は、例えば高鮮明マルチメディアインターフェース（ＨＤＭＩ（登録商標）：ｈｉｇｈ－ｄｅｆｉｎｉｔｉｏｎｍｕｌｔｉｍｅｄｉａｉｎｔｅｒｆａｃｅ）、汎用直列バス（ＵＳＢ：ｕｎｉｖｅｒｓａｌｓｅｒｉａｌｂｕｓ）インターフェース、ＳＤ（ｓｅｃｕｒｅｄｉｇｉｔａｌ）カードインターフェースまたはオーディオインターフェース（ａｕｄｉｏｉｎｔｅｒｆａｃｅ）を含むことができる。

【0070】

接続端末（ｃｏｎｎｅｃｔｉｎｇｔｅｒｍｉｎａｌ）９７８は、電子装置９０１を外部電子装置９０２と物理的に連結できるコネクタ（ｃｏｎｎｅｃｔｏｒ）を含むことができる。接続端末９７８は、例えばＨＤＭＩ（登録商標）コネクタ、ＵＳＢコネクタ、ＳＤカードコネクタまたはオーディオコネクタ（例えば、ヘッドホンコネクタ）を含むことができる。

【0071】

触覚モジュール９７９は、電気信号をユーザが触覚（ｔａｃｔｉｌｅｓｅｎｓａｔｉｏｎ）または運動感覚（ｋｉｎｅｓｔｈｅｔｉｃｓｅｎｓａｔｉｏｎ）を通じて認識できる機械的刺激（ｍｅｃｈａｎｉｃａｌｓｔｉｍｕｌｕｓ）（例えば、振動または移動）または電気的刺激（ｅｌｅｃｔｒｉｃａｌｓｔｉｍｕｌｕｓ）に変換することができる。触覚モジュール９７９は、例えば電動機（ｍｏｔｏｒ）、圧電素子（ｐｉｅｚｏｅｌｅｃｔｒｉｃｅｌｅｍｅｎｔ）または電気刺激器（ｅｌｅｃｔｒｉｃａｌｓｔｉｍｕｌａｔｏｒ）を含むことができる。

【0072】

カメラモジュール９８０は、静止画像または動画像を撮影することができる。カメラモジュール９８０は、一つ以上のレンズ、画像センサー（ｉｍａｇｅｓｅｎｓｏｒ）、画像信号プロセッサーまたはフラッシュ（ｆｌａｓｈ）を含むことができる。電力管理モジュール９８８は、電子装置９０１に供給される電力を管理することができる。電力管理モジュール９８８は、例えば電力管理集積回路（ＰＭＩＣ：ｐｏｗｅｒｍａｎａｇｅｍｅｎｔｉｎｔｅｇｒａｔｅｄｃｉｒｃｕｉｔ）の一部として実現できる。

【0073】

乾電池９８９は、電子装置９０１の少なくとも一つの部品に電力を供給することができる。乾電池９８９は、例えば充電不可能な１次電池（ｐｒｉｍａｒｙｃｅｌｌ）、充電可能な二次電池（ｓｅｃｏｎｄａｒｙｃｅｌｌ）または燃料電池（ｆｕｅｌｃｅｌｌ）を含むことができる。

【0074】

通信モジュール９９０は、電子装置９０１と外部電子装置（例えば、電子装置９０２、電子装置９０４またはサーバー９０８）の間の直接（例えば、有線）通信チャンネルまたは無線通信チャンネルの構築および構築された通信チャンネルを通した通信遂行を支援することができる。通信モジュール９９０はプロセッサー９２０（例えば、ＡＰ）と独立して動作できる一つ以上の通信プロセッサーを含むことができ、直接（例えば、有線）通信または無線通信を支援する。通信モジュール９９０は無線通信モジュール９９２［例えば、セルラー通信モジュール（ｃｅｌｌｕｌａｒｃｏｍｍｕｎｉｃａｔｉｏｎｍｏｄｕｌｅ）、短距離無線通信モジュールまたは衛星測位システム（ＧＮＳＳ：ｇｌｏｂａｌｎａｖｉｇａｔｉｏｎｓａｔｅｌｌｉｔｅｓｙｓｔｅｍ）通信モジュール］または有線通信モジュール９９４［例えば、近距離通信網（ＬＡＮ：ｌｏｃａｌａｒｅａｎｅｔｗｏｒｋ）通信モジュールまたは電力線通信（ＰＬＣ：ｐｏｗｅｒｌｉｎｅｃｏｍｍｕｎｉｃａｔｉｏｎ）モジュール］を含むことができる。これら通信モジュールは第１通信網９９８［例えば、ブルートゥース（登録商標）（Ｂｌｕｅｔｏｏｔｈ（登録商標））、ワイファイダイレクト（Ｗｉ－Ｆｉ（登録商標）Ｄｉｒｅｃｔ）またはＩｒＤＡ（ＩｎｆｒａｒｅｄＤａｔａＡｓｓｏｃｉａｔｉｏｎ）標準など短距離通信網］または第２通信網９９９｛例えば、セルラー通信網、インターネットまたはコンピュータ通信網［例えば、ＬＡＮまたは遠隔通信網（ＷＡＮ：ｗｉｄｅａｒｅａｎｅｔｗｏｒｋ）］など長距離通信網｝を通じて対応する外部電子装置と通信できる。これら多様な種類の通信モジュールは単一部品（例えば、単一ＩＣ）として実現されるか、または互いに分離された複数の部品（例えば、複数のＩＣ）として実現できる。無線通信モジュール９９２は、第１通信網９９８または第２通信網９９９など通信網内の電子装置９０１を加入者識別モジュール９９６に記憶されている加入者情報［例えば、国際端末器加入者識別子（ＩＭＳＩ：ｉｎｔｅｒｎａｔｉｏｎａｌｍｏｂｉｌｅｓｕｂｓｃｒｉｂｅｒｉｄｅｎｔｉｔｙ）］を使用して識別および認証する（ａｕｔｈｅｎｔｉｃａｔｅ）ことができる。

【0075】

アンテナモジュール９９７は、電子装置９０１の外部（例えば、外部電子装置）にまたは外部から信号または電力を伝送または受信することができる。アンテナモジュール９９７は一つ以上のアンテナを含むことができ、これにより第１通信網９９８または第２通信網９９９など通信網に使用される通信方式に適した少なくとも一つのアンテナを例えば通信モジュール９９０（例えば、無線通信モジュール９９２）が選択することができる。選択された少なくとも一つのアンテナを通じて通信モジュール９９０と外部電子装置の間に信号または電力が送信または受信できる。

【0076】

第２通信網９９９と連結されたサーバー９０８を通じて電子装置９０１と外部電子装置９０４の間に命令またはデータが伝送または受信できる。電子装置９０２、９０４のそれぞれは電子装置９０１と同一な種類の装置であってもよく、異なる種類の装置であってもよい。電子装置９０１で実行される動作の全部または一部が外部電子装置９０２、９０４、サーバ９０８のうちの少なくとも一つで実行できる。例えば、電子装置９０１が自動的に、またはユーザまたは他の装置の指示に応じて関数またはサービスを行わなければならないのであれば、電子装置９０１はその関数やサービスを実行する代わりに、または実行すると共に少なくとも一つの外部電子装置にその関数またはサービスの少なくとも一部を行うことを指示することができる。その指示を受信した少なくとも一つの外部電子装置は指示した関数またはサービスの少なくとも一部、またはその指示と関連する付加サービスを遂行することができ、遂行結果物を電子装置９０１に伝達することができる。電子装置９０１はその結果物をさらに処理するか、またはそうでなければそのまま、指示に対する応答の少なくとも一部として提供することができる。このために、例えばクラウドコンピューティング（ｃｌｏｕｄｃｏｍｐｕｔｉｎｇ）、分散コンピューティング（ｄｉｓｔｒｉｂｕｔｅｄｃｏｍｐｕｔｉｎｇ）またはクライアント－サーバーコンピューティング（ｃｌｉｅｎｔ－ｓｅｒｖｅｒｃｏｍｐｕｔｉｎｇ）技術を使用することができる。

【0077】

本明細書で説明した発明の要旨（ｓｕｂｊｅｃｔｍａｔｔｅｒ）および動作の体現／実施はデジタル電子回路、または本明細書で説明した構造およびその等価物を含むコンピュータソフトウェア、ファームウエアまたはハードウェア、またはこれらのうちの一つ以上の組み合わせの形態で実施できる。本明細書で説明した発明要旨の体現／実施は、データ処理装置が実行するかまたはデータ処理装置の動作を制御するためにコンピュータ記憶媒体に符号化された一つ以上のコンピュータプログラム、即ち、一つ以上のコンピュータプログラム命令モジュールとして実施できる。その代わりに、または追加的に、プログラム命令は人工的に生成された電波信号（ａｒｔｉｆｉｃｉａｌｌｙ－ｇｅｎｅｒａｔｅｄｐｒｏｐａｇａｔｅｄｓｉｇｎａｌ）、例えば機械が生成した（ｍａｃｈｉｎｅ－ｇｅｎｅｒａｔｅｄ）電気、光学または電磁気信号に符号化でき、この信号は、データ処理装置の実行のための、適切な受信装置への伝送のための、情報の符号化のために生成される。コンピュータ記憶媒体はコンピュータ可読記憶装置、コンピュータ可読記憶基板（ｃｏｍｐｕｔｅｒ－ｒｅａｄａｂｌｅｓｔｏｒａｇｅｓｕｂｓｔｒａｔｅ）、任意（ｒａｎｄｏｍ）または直列（ｓｅｒｉａｌ）接近メモリアレイまたは装置、またはこれらの組み合わせであるか、またはその内部に含まれてもよい。また、コンピュータ記憶媒体は伝播信号（ｐｒｏｐａｇａｔｅｄｓｉｇｎａｌ）ではないが、人工的に生成された伝播信号に符号化されたコンピュータプログラム命令のソースまたは宛先（ｄｅｓｔｉｎａｔｉｏｎ）であってもよい。コンピュータ記憶媒体はまた、一つ以上の分離された物理的部品または媒体（例えば、多数枚のＣＤ、ディスクまたは他の記憶装置）であるか、またはその内部に含まれてもよい。また、本明細書で説明した動作はデータ処理装置が一つ以上のコンピュータ可読記憶装置に記憶されるか、または他のソースから受信したデータに対して行う動作として実施できる。

【0078】

本明細書に特定の具体的な実施形態が多く含まれているが、このような実施形態が本発明の範囲を限定すると解釈してはならず、特定体現／実施の固有特徴に関する説明と解釈しなければならない。本明細書で別個の様々な実施形態と関連して説明した特定特徴を一つの実施形態で互いに結合して実施することができる。逆に、一つの実施形態と関連して説明した様々の特徴を様々の実施形態で別個にまたは適切な部分組み合わせ（ｓｕｂｃｏｍｂｉｎａｔｉｏｎ）で実施することができる。また、様々の特徴が特定の組み合わせで動作すると前述してそのような特徴を初めに請求することができるが、時には請求した組み合わせから一つ以上の特徴を除外することができ、請求した組み合わせが部分組み合わせまたはその変形に関するものであり得る。

【0079】

同様に、図面に特定の順序で動作を示したが、このような動作を示した特定の順序でまたは順次に行うか、または所期の結果を達成するためには図示の動作を全て行わなければならないと理解してはならない。時によっては多重作業または並列処理が利益であることもある。また、前述の実施形態で様々のシステム部品が分離されているとしても全ての実施形態でそのように分離されなければならないのではなく、言及したプログラム成分とシステムが一般に一つのソフトウェア製品として共に集積されてもよく多数のソフトウェア製品として包装されてもよい。

【0080】

本発明の特定実施形態をここで説明した。その他の実施形態は次の請求範囲の権利範囲内にある。時によっては請求範囲に記載した動作を他の順序で行いながらも所期の成果を収めることができる。また、所期の成果を得るために、添付した図面に示された過程を図示の特定の順序で、または順次に行う必要はない。時によっては多重作業または並列処理がより良いこともある。

【0081】

ここで説明した画期的な概念を広い応用分野で改良または変形することができるのを当業者であれば理解するはずである。したがって、請求した本発明の権利範囲は前述の特定思想の例示のいずれにも限定されず、その代わりに次の請求範囲によって定義される。

【符号の説明】

【0082】

３０２、３１４：画像
３０４：無作為パッチ隠し（ｒａｎｄｏｍｐａｔｃｈｍａｓｋｉｎｇ）
３０６：画像事前訓練段階
３０８、４０８：符号器
３１２：復号器
４１０：復号器（ヘッド）
５０２、６０２：データセット
５０８：表帰属ブロック
５１０：画像帰属ブロック
５１２：連結エンベディング
６０４：画像符号器
６０６：表符号器
６１０：予測ブロック
７０２：様式影響説明ブロック
９００：通信網環境
９０１、９０２、９０４：電子装置
９０８：サーバー
９２０：プロセッサー
９２１：主プロセッサー
９２３：補助プロセッサー
９３０：メモリ
９３２：揮発性メモリ
９３４：非揮発性メモリ
９３６：内部メモリ
９３８：外部メモリ
９４０：プログラム
９４２：運営体制
９４４：ミドルウェア
９４６：アプリケーション
９５０：入力装置
９５５：音響出力装置
９６０：表示装置
９７０：オーディオモジュール
９７６：センサーモジュール
９７７：インターフェース
９７８：接続端末
９７９：触覚モジュール
９８０：カメラモジュール
９８８：電力管理モジュール
９８９：乾電池
９９０：通信モジュール
９９２：無線通信モジュール
９９４：有線通信モジュール
９９６：加入者識別モジュール
９９７：アンテナモジュール
９９８、９９９：通信網

【図1】