(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-02-07
(54)【発明の名称】一般的なコンテンツの脳反応モデルを使用した専門分野固有のコンテンツの分類
(51)【国際特許分類】
G06Q 50/10 20120101AFI20240131BHJP
G06N 3/02 20060101ALI20240131BHJP
【FI】
G06Q50/10
G06N3/02
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023534244
(86)(22)【出願日】2021-12-27
(85)【翻訳文提出日】2023-06-05
(86)【国際出願番号】 IB2021062329
(87)【国際公開番号】W WO2022153120
(87)【国際公開日】2022-07-21
(32)【優先日】2021-01-14
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】521229670
【氏名又は名称】ブランヴィヴォ リミテッド
(74)【代理人】
【識別番号】100086461
【氏名又は名称】齋藤 和則
(72)【発明者】
【氏名】アサフ、ヤニフ
(72)【発明者】
【氏名】ホロヴィッツ、アサフ
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049CC11
(57)【要約】
コンテンツの分類方法は、特定の専門分野のカテゴリからのコンテンツ項目(200)を受信し、各前記コンテンツ項目からそれぞれのフィーチャを抽出するステップを有する。人間の観察者によって実行される、特定の専門分野の前記コンテンツ項目のラベルが受信され、ラベルは、人間の観察者によって前記コンテンツ項目に割り当てられたそれぞれのカテゴリを示す。一般コンテンツ脳反応モデル(212)がアップロードされ、そのモデルは一般的コンテンツのデータベース(204)を提示された人間の脳の測定値を使用して推定され、一般的コンテンツのデータベースは、フィーチャを使用して定義され、フィーチャと脳アクティビティの間のマッピングを含む。モデルは抽出されたフィーチャに適用され、ラベルを使用して、特定の専門分野に対する脳反応を計算する。専門分野に関連付けられた新しいコンテンツ項目が与えられると、モデルと専門分野固有の脳反応に基づいて、新しいコンテンツ項目に最もよく一致するカテゴリが推定される。
【選択図】
図1
【特許請求の範囲】
【請求項1】
コンテンツの分類方法であって:、
特定の専門分野の複数の事前定義されたカテゴリに属するコンテンツ項目のセットを受信し、前記特定の専門分野の各前記コンテンツ項目からそれぞれのフィーチャを抽出するステップと;
1人または複数の人間の観察者によって実行される、前記特定の専門分野の前記コンテンツ項目のラベルを受信するステップであって、前記ラベルは、前記コンテンツ項目ごとに、前記複数の事前定義されたカテゴリの中から前記1人または複数の人間の観察者によって前記コンテンツ項目に割り当てられたそれぞれのカテゴリを示す、ステップと;
一般的コンテンツのデータベースを提示された人間の脳の測定値を使用して推定された一般コンテンツ脳反応モデルをアップロードするステップであって、前記一般的コンテンツのデータベースは、前記フィーチャのセットを使用して定義され、前記フィーチャのセットと前記抽出された脳アクティビティのセットとの間のマッピングを含む、ステップと;
前記一般コンテンツ脳反応モデルを前記抽出されたフィーチャに適用し、前記ラベルを使用して、前記特定の専門分野に対する前記カテゴリごとの脳反応のセットを計算するステップと; そして
前記専門分野に関連付けられた新しいコンテンツ項目が与えられた時に、前記一般コンテンツ脳反応モデルと専門分野固有の脳反応に基づいて、前記複数の事前定義されたカテゴリの中から前記新しいコンテンツ項目に最もよく一致するカテゴリを推定するステップと;
を有することを特徴とするコンテンツの分類方法。
【請求項2】
前記カテゴリを推定するステップは:
前記新しいコンテンツ項目から複数の前記フィーチャを抽出するステップと;
前記一般コンテンツ脳反応モデルを前記新しいコンテンツ項目から抽出された前記フィーチャに適用して、新しいコンテンツ脳反応を計算するステップと;そして
前記専門分野固有の脳反応のセットと前記新しいコンテンツ脳反応を使用して、前記新しいコンテンツ項目に最もよく一致する前記カテゴリを推定するステップと;
を有する、ことを特徴とする請求項1に記載のコンテンツの分類方法。
【請求項3】
前記カテゴリを推定するステップは、脳アクティビティ座標系において、前記新しいコンテンツ脳反応と前記専門分野固有の脳反応との間の距離のそれぞれのセットを推定し、そして前記ラベルを使用して、前記距離のセットに従って、前記新しいコンテンツ項目を前記事前定義されたカテゴリの1つに分類するステップを有する、ことを特徴とする請求項2に記載のコンテンツ分類方法。
【請求項4】
前記カテゴリを推定するステップは、前記新しいコンテンツ項目が前記所与のカテゴリのいずれかと同じラベルを有する確率のそれぞれのセットを計算し、そして計算された確率のセットに従って前記新しいコンテンツ項目を前記所定のカテゴリのうちの1つに分類するステップを有する、ことを特徴とする請求項1に記載のコンテンツ分類方法。
【請求項5】
前記フィーチャを抽出するステップは、抽出された前記フィーチャから、統計的に重要でないとみなされる1つ以上の所定のフィーチャを省略するステップを有する、ことを特徴とする請求項1~4のいずれかに記載のコンテンツ分類方法。
【請求項6】
前記抽出されたフィーチャは、色の濃淡、特徴的な空間周波数、コントラストレベル、および普及率のうちの少なくとも1つを有する、ことを特徴とする請求項1~4のいずれかに記載のコンテンツ分類方法。
【請求項7】
線形回帰および非線形回帰のうちの1つである統計モデルを使用して、前記一般コンテンツ脳反応モデルを導出するステップを有する、ことを特徴とする請求項1~4のいずれかに記載のコンテンツ分類方法。
【請求項8】
前記人間の脳の測定値が脳接続行列を含む、ことを特徴とする請求項1~4のいずれかに記載のコンテンツ分類方法。
【請求項9】
前記脳接続性行列は、脳コネクトームを形成するための脳組織の微細構造推定に基づく接続性行列の重みを有する、ことを特徴とする請求項8に記載のコンテンツ分類方法。
【請求項10】
前記人間の脳の測定値が、接続性関連行列と組み合わされた認知層に基づいてモデル化される、ことを特徴とする請求項1~4のいずれかに記載のコンテンツ分類方法。
【請求項11】
前記特定の分野の前記コンテンツ項目は半導体ダイの画像を含み、前記カテゴリは事前に定義された品質ビンであり、前記人間によるレビューによるラベルは各画像を事前定義された品質ビンの1つに属するダイを示すとして割り当てるステップを有する、ことを特徴とする請求項1~4のいずれかに記載のコンテンツ分類方法。
【請求項12】
当該ダイの画像が所定のビンの1つに属するダイを表すものとして分類された、半導体ダイの使用を決定するステップを有する、ことを特徴とする請求項11に記載のコンテンツ分類方法。
【請求項13】
前記脳の測定は、解剖学的磁気共鳴画像法(MRI)、拡散テンソル画像法(DTI)、機能的MRI(fMRI)、脳波図(EEG)、脳磁図(MEG)、赤外線イメージング、紫外線イメージング、コンピュータ断層撮影(CT)、脳マッピング超音波、生体内細胞データ、生体内分子データ、ゲノムデータ、および光学イメージングのうちの1つまたは複数によって実行される、ことを特徴とする請求項1~4のいずれかに記載のコンテンツ分類方法。
【請求項14】
前記ラベルは、一連のフレーム、画像、音声、触覚信号、匂い、味、および抽象的なコンテンツタイプのうちの少なくとも1つのラベルを有する、ことを特徴とする請求項1~4のいずれかに記載のコンテンツ分類方法。
【請求項15】
前記抽象的なコンテンツタイプは、感情であることを特徴とする請求項14に記載のコンテンツ分類方法。
【請求項16】
前記フィーチャが第1の空間として表され、前記脳アクティビティの集合が第2の空間として表され、そして前記第1の空間と前記第2の空間の間の線形変換として前記一般コンテンツ脳反応モデルが定義される、ことを特徴とする請求項1~4のいずれかに記載のコンテンツ分類方法。
【請求項17】
コンテンツ分類装置であって、インタフェースとプロセッサとを有し、
前記インタフェースは:
特定の専門分野の複数の事前定義されたカテゴリに属するコンテンツ項目のセットを受信し、前記特定の専門分野の各前記コンテンツ項目からそれぞれのフィーチャを抽出するステップと;
1人または複数の人間の観察者によって実行される、前記特定の専門分野の前記コンテンツ項目のラベルを受信するステップであって、前記ラベルは、前記コンテンツ項目ごとに、前記複数の事前定義されたカテゴリの中から前記1人または複数の人間の観察者によって前記コンテンツ項目に割り当てられたそれぞれのカテゴリを示す、ステップと;
を実行するように構成され、
前記プロセッサは:
一般的コンテンツのデータベースを提示された人間の脳の測定値を使用して推定された一般コンテンツ脳反応モデルをアップロードするステップであって、前記一般的コンテンツのデータベースは、前記フィーチャのセットを使用して定義され、前記フィーチャのセットと前記抽出された脳アクティビティのセットとの間のマッピングを含む、ステップと;
前記一般コンテンツ脳反応モデルを前記抽出されたフィーチャに適用し、前記ラベルを使用して、前記特定の専門分野に対する前記カテゴリごとの脳反応のセットを計算するステップと; そして
前記専門分野に関連付けられた新しいコンテンツ項目が与えられた時に、前記一般コンテンツ脳反応モデルと専門分野固有の脳反応に基づいて、前記複数の事前定義されたカテゴリの中から前記新しいコンテンツ項目に最もよく一致するカテゴリを推定するステップと;
を実行するように構成される、
ことを特徴とするコンテンツ分類装置。
【請求項18】
前記プロセッサは:
前記新しいコンテンツ項目から複数の前記フィーチャを抽出するステップと;
前記一般コンテンツ脳反応モデルを前記新しいコンテンツ項目から抽出された前記フィーチャに適用して、新しいコンテンツ脳反応を計算するステップと;そして
前記専門分野固有の脳反応のセットと前記新しいコンテンツ脳反応を使用して、前記新しいコンテンツ項目に最もよく一致する前記カテゴリを推定するステップと;
により前記カテゴリを推定する、
ことを特徴とする請求項17に記載のコンテンツ分類装置。
【請求項19】
前記プロセッサは、脳アクティビティ座標系において、前記新しいコンテンツ脳反応と前記専門分野固有の脳反応との間の距離のそれぞれのセットを推定し、そして前記ラベルを使用して、前記距離のセットに従って、前記新しいコンテンツ項目を前記事前定義されたカテゴリの1つに分類することにより、前記カテゴリを推定するように構成される、ことを特徴とする請求項18に記載のコンテンツ分類装置。
【請求項20】
前記プロセッサは、前記新しいコンテンツ項目が前記所与のカテゴリのいずれかと同じラベルを有する確率のそれぞれのセットを計算し、そして計算された確率のセットに従って前記新しいコンテンツ項目を前記所定のカテゴリのうちの1つに分類することにより、前記カテゴリを推定するように構成される、ことを特徴とする請求項17に記載のコンテンツ分類装置。
【請求項21】
前記プロセッサは、抽出された前記フィーチャから、統計的に重要でないとみなされる1つ以上の所定のフィーチャを省略することにより、前記フィーチャを抽出するように構成される、ことを特徴とする請求項17~20のいずれかに記載のコンテンツ分類装置。
【請求項22】
前記抽出されたフィーチャは、色の濃淡、特徴的な空間周波数、コントラストレベル、および普及率のうちの少なくとも1つを有する、ことを特徴とする請求項17~20のいずれかに記載のコンテンツ分類装置。
【請求項23】
前記プロセッサはさらに、線形回帰および非線形回帰のうちの1つである統計モデルを使用して、前記一般コンテンツ脳反応モデルを導出するように構成される、ことを特徴とする請求項17~20のいずれかに記載のコンテンツ分類装置。
【請求項24】
前記人間の脳の測定値が脳接続行列を含む、ことを特徴とする請求項17~20のいずれかに記載のコンテンツ分類装置。
【請求項25】
前記脳接続性行列は、脳コネクトームを形成するための脳組織の微細構造推定に基づく接続性行列の重みを有する、ことを特徴とする請求項24に記載のコンテンツ分類装置。
【請求項26】
前記人間の脳の測定値が、接続性関連行列と組み合わされた認知層に基づいてモデル化される、ことを特徴とする請求項17~20のいずれかに記載のコンテンツ分類装置。
【請求項27】
前記特定の専門分野の前記コンテンツ項目は半導体ダイの画像を含み、前記カテゴリは事前に定義された品質ビンであり、前記人間によるレビューによるラベルは各画像を事前定義された品質ビンの1つに属するダイを示すとして割り当てるステップを有する、ことを特徴とする請求項17~20のいずれかに記載のコンテンツ分類装置。
【請求項28】
前記プロセッサはさらに、当該ダイの画像が所定のビンの1つに属するダイを表すものとして分類された、半導体ダイの使用を決定するように構成される、ことを特徴とする請求項27に記載のコンテンツ分類装置。
【請求項29】
前記脳の測定は、解剖学的磁気共鳴画像法(MRI)、拡散テンソル画像法(DTI)、機能的MRI(fMRI)、脳波図(EEG)、脳磁図(MEG)、赤外線イメージング、紫外線イメージング、コンピュータ断層撮影(CT)、脳マッピング超音波、生体内細胞データ、生体内分子データ、ゲノムデータ、および光学イメージングのうちの1つまたは複数によって実行される、ことを特徴とする請求項17~20のいずれかに記載のコンテンツ分類装置。
【請求項30】
前記ラベルは、一連のフレーム、画像、音声、触覚信号、匂い、味、および抽象的なコンテンツタイプのうちの少なくとも1つのラベルを有する、ことを特徴とする請求項17~20のいずれかに記載のコンテンツ分類装置。
【請求項31】
前記抽象的なコンテンツタイプは、感情であることを特徴とする請求項30に記載のコンテンツ分類装置。
【請求項32】
前記フィーチャが第1の空間として表され、前記脳アクティビティの集合が第2の空間として表され、そして前記第1の空間と前記第2の空間の間の線形変換として前記一般コンテンツ脳反応モデルが定義される、ことを特徴とする請求項17~20のいずれかに記載のコンテンツ分類装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は一般に人工知能(AI)に関する。より具体的には、本発明は、脳反応モデルを使用して専門分野固有のコンテンツを自動分類するための技術を対象とする。
【背景技術】
【0002】
人間の脳とその基礎となる生物学的ニューラルネットワークは、少量のデータを処理して認知的分類を迅速に行う効率的な方法を備えている。したがって、人間の脳の反応を模倣できる機械学習(ML)アルゴリズムには、コンテンツを分類するために利用できる非常に限られたトレーニングに依存するなど、特別な利点がある可能性がある。
【0003】
たとえば、電子回路の欠陥検査の分野では、一部の検査作業は依然として人間の専門家によって手作業で実行されなければならない。その理由は、まれな欠陥などの欠陥を特定したり、欠陥の結果を決定したり(たとえば、特定の欠陥によるダイの廃棄)など、既存の自動検査技術では代替できない人間の専門家の能力が依然として存在するためである。
【0004】
別の例は健康診断の分野でも見られ、診断プロセスのほとんどが医療専門家によって手動で実行されている。診断用のAIモデルはより利用可能になる可能性があるが、データの収集、構造化、ラベル付けによってAIが医療システムの制御下で自律的なツールになることが制限されるため、人間の専門家が引き続き診断プロセスの一部となることが予想される。
【0005】
したがって、そのような人間による専門家のレビューに代わることができる自動化された目視検査技術が必要である。
【発明の概要】
【0006】
本明細書に記載の本発明の一実施形態は、特定の専門分野の複数の事前定義されたカテゴリに属するコンテンツ項目のセットを受信し、特定の専門分野の各コンテンツ項目からそれぞれのフィーチャを抽出するステップを有するコンテンツの分類方法を提供する。1人または複数の人間の観察者によって実行される、特定の専門分野のコンテンツ項目のラベルが受信され、そのラベルは、コンテンツ項目ごとに、複数の事前定義されたカテゴリの中から1人または複数の人間の観察者によってコンテンツ項目に割り当てられたそれぞれのカテゴリを示す。一般的コンテンツのデータベースを提示された人間の脳の測定値を使用して推定された一般コンテンツ脳反応モデルがアップロードされ、一般的コンテンツのデータベースは、フィーチャのセットを使用して定義され、フィーチャのセットと抽出された脳アクティビティのセットとの間のマッピングを含む。一般コンテンツ脳反応モデルが抽出されたフィーチャに適用され、ラベルを使用して、特定の専門分野に対するカテゴリごとの脳反応のセットが計算される。専門分野に関連付けられた新しいコンテンツ項目が与えられた時に、一般コンテンツ脳反応モデルと専門分野固有の脳反応に基づいて、複数の事前定義されたカテゴリの中から新しいコンテンツ項目に最もよく一致するカテゴリが推定される。
【0007】
幾つかの実施形態では、カテゴリを推定するステップは:(a)新しいコンテンツ項目から複数のフィーチャを抽出するステップと;(b)一般コンテンツ脳反応モデルを新しいコンテンツ項目から抽出されたフィーチャに適用して、新しいコンテンツ脳反応を計算するステップと;そして(c)専門分野固有の脳反応のセットと新しいコンテンツ脳反応を使用して、新しいコンテンツ項目に最もよく一致するカテゴリを推定するステップと;を有する.
幾つかの実施形態では、カテゴリを推定するステップは、脳アクティビティ座標系において、新しいコンテンツ脳反応と専門分野固有の脳反応との間の距離のそれぞれのセットを推定し、そしてラベルを使用して、距離のセットに従って、新しいコンテンツ項目を事前定義されたカテゴリの1つに分類するステップを有する。
一実施形態では、カテゴリを推定するステップは、新しいコンテンツ項目が所与のカテゴリのいずれかと同じラベルを有する確率のそれぞれのセットを計算し、そして計算された確率のセットに従って新しいコンテンツ項目を所定のカテゴリのうちの1つに分類するステップを有する.
【0008】
他の実施形態では、フィーチャを抽出するステップは、抽出されたフィーチャから、統計的に重要でないとみなされる1つ以上の所定のフィーチャを省略するステップを有する。
幾つかの実施形態では、抽出されたフィーチャは、色の濃淡、特徴的な空間周波数、コントラストレベル、および普及率のうちの少なくとも1つを有する。
幾つかの実施形態では、コンテンツの分類方法はさらに、線形回帰および非線形回帰のうちの1つである統計モデルを使用して、一般コンテンツ脳反応モデルを導出するステップを有する。
一実施形態では、人間の脳の測定値が脳接続行列を含む.
他の実施形態では、人間の脳の測定値が、接続性関連行列と組み合わされた認知層に基づいてモデル化される。
幾つかの実施形態では、特定の分野のコンテンツ項目は半導体ダイの画像を含み、カテゴリは事前に定義された品質ビンであり、人間によるレビューによるラベルは各画像を事前定義された品質ビンの1つに属するダイを示すとして割り当てるステップを有する。
【0009】
幾つかの実施形態では、当該ダイの画像が所定のビンの1つに属するダイを表すものとして分類された、半導体ダイの使用を決定するステップを有する。
一実施形態では、脳の測定は、解剖学的磁気共鳴画像法(MRI)、拡散テンソル画像法(DTI)、機能的MRI(fMRI)、脳波図(EEG)、脳磁図(MEG)、赤外線イメージング、紫外線イメージング、コンピュータ断層撮影(CT)、脳マッピング超音波、生体内細胞データ、生体内分子データ、ゲノムデータ、および光学イメージングのうちの1つまたは複数によって実行される。
幾つかの実施形態では、ラベルは、一連のフレーム、画像、音声、触覚信号、匂い、味、および抽象的なコンテンツタイプのうちの少なくとも1つのラベルを有する。
幾つかの実施形態では、抽象的なコンテンツタイプは、感情である。
一実施形態では、フィーチャが第1の空間として表され、脳アクティビティの集合が第2の空間として表され、そして第1の空間と第2の空間の間の線形変換として一般コンテンツ脳反応モデルが定義される。
【0010】
本発明の他の一実施形態は、コンテンツ分類装置であって、インタフェースとプロセッサとを有する、コンテンツ分類装置を提供する。インタフェースは:(i)特定の専門分野の複数の事前定義されたカテゴリに属するコンテンツ項目のセットを受信し、前記特定の専門分野の各前記コンテンツ項目からそれぞれのフィーチャを抽出するステップと;(ii)1人または複数の人間の観察者によって実行される、前記特定の専門分野の前記コンテンツ項目のラベルを受信するステップであって、前記ラベルは、前記コンテンツ項目ごとに、前記複数の事前定義されたカテゴリの中から前記1人または複数の人間の観察者によって前記コンテンツ項目に割り当てられたそれぞれのカテゴリを示す、ステップと;を実行するように構成され、プロセッサは:(i)一般的コンテンツのデータベースを提示された人間の脳の測定値を使用して推定された一般コンテンツ脳反応モデルをアップロードするステップであって、一般的コンテンツのデータベースは、フィーチャのセットを使用して定義され、フィーチャのセットと抽出された脳アクティビティのセットとの間のマッピングを含む、ステップと;(ii)一般コンテンツ脳反応モデルを抽出されたフィーチャに適用し、ラベルを使用して、特定の専門分野に対するカテゴリごとの脳反応のセットを計算するステップと; そして(iii)専門分野に関連付けられた新しいコンテンツ項目が与えられた時に、一般コンテンツ脳反応モデルと専門分野固有の脳反応に基づいて、複数の事前定義されたカテゴリの中から新しいコンテンツ項目に最もよく一致するカテゴリを推定するステップと;を実行するように構成される。
【図面の簡単な説明】
【0011】
本発明は以下の図を参照した実施形態の詳細な説明からより完全に理解されよう:
【
図1】本発明の一実施形態による、一般的な脳反応モデルとラベル付き脳反応の専門分野固有のデータベースを使用して、特定の専門分野に属する新しいコンテンツ項目を分類するように構成された装置を概略的に示すブロック図である。
【
図2】本発明の一実施形態による、
図1の装置の要素と、一般的な脳反応モデルを生成しそれを使用して
図1のラベル付き脳反応のデータベースを導出するために適用される処理スキームと、を概略的に示す、フローチャートを伴うブロック図である。
【
図3】本発明の一実施形態による、
図1の装置を使用して特定の分野に属する新しいコンテンツ項目を分類する方法を概略的に示すフローチャートである。
【
図4】本発明の一実施形態による、新しいコンテンツ項目を分類するために使用される、新しいコンテンツ項目の脳反応と、専門分野固有のラベル付き脳反応の分散との間の推定距離のセットの絵画的概略図である。
【発明を実施するための形態】
【0012】
(概要)
以下に説明する本発明の実施形態は、一般的な脳反応モデルを使用して所与の専門分野のコンテンツを分類するための装置および方法を提供する。専門分野の例には、半導体処理欠陥の検査が含まれるが、一般に、開示された技術は、他の適切な専門分野に関連するコンテンツの分類に使用することができる。コンテンツ項目は、例えば、(例えば、処理された半導体ダイの)画像を含むことができる。しかしながら、一般に、開示された技術は、音響ファイルであるコンテンツ項目など、他のタイプのコンテンツの分類に使用することができる。
【0013】
一般に、開示された技術は、一般的な脳反応モデル(以下「裸の脳反応モデル」とも呼ばれる)を生成および使用して、必要な専門分野固有の脳反応を計算する。 一般的な脳反応モデルは、専門分野に特化したものではないという意味で、一般的、または裸のものである。一般的に言えば、裸の脳反応モデルは何千もの脳領域の反応で構成されており、各領域はコンテンツの異なる属性によって独自に活性化される。応答は、例えば、十分に大きな画像セットなど、専門分野に特化していないコンテンツデータベースを提示された人間の観察者の脳の機能的MRIスキャンから推定することができる。
【0014】
一般的な脳反応モデルは、以下「フィーチャ」と呼ぶ非常に多くの属性をカバーしている。 このカバレッジにより、特定の分野のコンテンツにさらされた人間の脳をスキャンして、モデルにコンテンツ固有の属性を追加する必要がなく、コンテンツ固有の脳反応のシミュレーションが可能になる。たとえば、グレーの色合いなどの特徴は、特定のコンテンツに対する脳の反応がグレーの色合いのフィーチャリストに新しいグレーの色合いを追加する必要がない程度まで、一般モデルによってカバーされる。
【0015】
特定の分類タスクについては、ラベル付き専門分野固有の脳反応のセットが計算される。その専門分野に属するがラベルが不明な新しいコンテンツ項目が与えられると、その脳の反応も計算される。
【0016】
統計分析を使用して、新しいコンテンツが属するカテゴリ(たとえば、そのラベル)は、たとえばマッピングされた応答を専門分野固有の脳反応のばらつきと比較することによって、プロセッサによって推定される。このようにして、専門分野の新しいコンテンツ項目を分類できる。以下で詳細に説明する裸の脳反応モデルは、通常、フィーチャの空間(コンテンツ項目を定義する)と、fMRI で抽出された脳振幅を含む脳アクティビティ空間との間の1つまたは複数のマッピング(たとえば、演算子)を含む。
【0017】
上で示したように、開示された技術は、特定の条件下で、十分に包括的な一般コンテンツを人間に提示し、その過程で脳をスキャンすることによって、一般的な脳反応モデルを構築できるという観察に基づいている。 その後、専門分野固有のラベル付きコンテンツ項目のデータベースを使用して、一般的な脳反応モデルをそれぞれの専門分野固有の脳反応を計算するために使用することができる。 専門分野固有の脳反応は、後で特定の専門分野の新しいコンテンツを分類するために使用できる。
【0018】
例えば、洗練された都市環境を捉えた一連の画像などの一般的なコンテンツのデータベースは、脳スキャン中に多数の人に提示される場合がある。fMRI スキャン、およびfMRIで抽出された脳反応を使用して、専門分野固有の画像 (電子回路など)に対する脳反応をシミュレートできる。
【0019】
したがって、開示された技術は、実際の人間の脳を利用して、新しいコンテンツを自動的に分類するために、多くの異なる専門分野における人間の専門家の能力をより厳密に(例えば、完全に人工的なモデルよりも近い)採用および模倣する「エキスパートマシン」を生成する。それにもかかわらず、この専門家のパフォーマンスは、ほとんどが裸の脳反応モデルの生成に非専門家を使用し、少数の専門分野固有の人間 (「専門家」) をラベル付けに使用することによって達成される。
【0020】
複雑な環境からのコンテンツを使用は、任意の同じ種類のコンテンツ(例: 画像)のフィーチャの十分に大きなセット F がカバー(例: サンプリング)されることを保証し、それはプロセスが、異なるシミュレートされた脳反応を生成し、その脳反応がそれぞれ異なる専門分野からのコンテンツを成功裏に分類するための基礎として機能するために総合的に充分である。実際、本発明者らは、そのようなフィーチャの「ユニバーサル」セット F を生成し、一般的な脳反応モデルを専門分野固有の脳反応分類問題に成功裏に適用できることを経験的に発見した。
【0021】
このようなフィーチャのユニバーサルセット F は、中でも画像のスペクトル分析およびフィーチャの卓越度を使用して得られた、例えば、幾何学形状、色、色合い、コントラスト、特徴的な空間周波数、などを含むことができる。フィーチャ抽出ステップには通常、平滑化、バイアス、拡張などの初期画像前処理ステップの実行が含まれる。
【0022】
特定の専門分野の複数のカテゴリの一例は、処理された半導体ダイの画像のカテゴリである。このような用途における専門分野は、半導体プロセスの欠陥の検査である。この例では、1人以上の熟練した人間の観察者がコンテンツにラベルを付け、各カテゴリには、同様の(例えば、同じビン)品質のダイを表すとラベル付き画像のみが含まれ、それに応じてカテゴリにラベルが付けられる。言い換えれば、異なるダイ品質を示すものとしてラベル付き異なる画像(つまり、異なるカテゴリビンに属するダイ)は、 M 個のラベルのセット G に対して異なるラベル Ls ∈ G, s=1,2,…M でそれぞれラベル付けされる。(たとえば、同じラベルが付された画像の各グループは、単一の事前定義されたラベル付き品質ビンに対応する)。
【0023】
したがって、いくつかの実施形態では、開示された技術の準備段階は2つのフェーズに分割される:
(i) 最初の「ユニバーサル」フェーズでは、一般コンテンツデータベースのコンテンツを提示された人間の実際の脳スキャンが含まれる。統計モデルを使用して、「裸の」脳反応モデルが生成され、一般的なコンテンツを定義する「ユニバーサル」フィーチャセット F と脳反応振幅の1セット(すなわち、 F )との間の最適変換が確立される。例えば、フィーチャのセットは、コンテンツ項目の各フィーチャベクトルにわたることによって、一般的なコンテンツを表す1つのフィーチャ空間を定義するものであり得る。
(ii) 専門分野固有のフェーズ。このフェーズでは、1人以上の人間の専門家が、特定の専門分野のコンテンツ項目を、その専門分野の事前定義されたカテゴリのグループ G の1つに属するものとしてラベル付けする。裸の脳反応モデルは、ラベル付きコンテンツ項目のカテゴリに従ってラベル付きコンテンツ項目に対する脳反応を計算するために適用され、それによって、その専門分野の人間の専門家の推定脳反応のデータベースが取得される。
【0024】
一実施形態では、最初の準備フェーズ中に、プロセッサは、一般コンテンツデータベースの(デジタル化された)コンテンツのそれぞれから、前述の所定の「ユニバーサル」コンテンツセットに属するフィーチャセット(例えば、フィーチャベクトル)f を抽出する( f ∈ F )。 コンテンツ項目ごとに、フィーチャのセット f ∈ F のそれぞれが異なる重みを指定する。これは、セット F のバイナリ(チェック済み/チェックなし)フィーチャとすることができる(つまり、一部のアプリケーションでは、 f の一部のメンバーがヌル化され、使用されない)。
【0025】
裸の脳反応モデルは、後述するフィーチャ fi ∈ F と推定脳振幅 {A} との間の線形関係など、一連の関係(方程式など)から構築できる。後者は「脳アクティビティマップ」とも呼ばれる:
式(1)
Aj(Rj)=Σ(i=1)
n αijfi ,1 ≦ j ≦ k
ここで、 Aj(Rj) は、以下でさらに説明する脳領域 Rj の fMRI 抽出されたアクティビティであり、プロセッサはその後、たとえば線形回帰を実行することによって統計的に係数 αij を導き出す。
【0026】
別の表現では、画像フィーチャのベクトル f 、f=(f
1,f
2,…,f
n) が、fMRI スキャン中に被験者に示された各画像に対して抽出され、そこからそれぞれの脳活性化フィーチャベクトル、 A=(A
1,A
2,…,A
k) が抽出される。未知のマッピング:
【数1-1】
は上記の式(1)では、係数 α
ij を使用する一組の線形関数によって推定されるが、本明細書では、画像のフィーチャを高次元(すなわち、k > n )の脳活性化空間にマッピングするものとして説明することができる。関数 Φ(f)は、例えば、k 個の線形関数のセットによって Φ(f) をモデル化することにより、スーパーバイズドフィーチャラーニングを使用することによって推定することができる。即ち:
式(1´)
A
j=f
Tβ
j
ここで、
【数1-2】
である。
【0027】
統計的に解かれた式(1)の関係はそれにより、関係の「最良適合」係数の集合を定義し、それは以下では、配列 [αij
F,0] として示される。これは、フィーチャ空間の任意のベクトルを脳アクティビティ空間内のそれぞれの脳アクティビティベクトルに変換する、前述のマッピング(例えば、演算子)としても記述することができる。
【0028】
式(1)の構造は、以下で説明するように、使用される基礎となる脳モデルと統計モデルによって異なることに注意が必要である。示されている方程式は、単に説明を簡単にするために例として提供されている。たとえば、一連の非線形関係で式(1)を置き換えることができる。
【0029】
したがって、より一般的には、以下 Stat と呼ぶ統計アルゴリズム (特に、線形回帰または非線形回帰、または一般線形モデル (GLM) など) は、抽出されたフィーチャと各画像に対するそれぞれ推定された脳の振幅との間の大量の関係式(式(1)の関係など)のセットを統計的に解いて、一般コンテンツ脳反応モデル(または演算子)を取得する:
式(2)
[αij
F,0]=Stat({[αij
F,0]}f∈F)
【0030】
係数 [αij
F,0]の配列 で記述されるこのモデル、または統計的に推定された演算子は、コンテンツ(画像など)がアプリケーション固有ではないという意味で、まだ「裸」または暗示的であり、従って抽出されたフィーチャのセットは実際の分類標的を表さない。
【0031】
上記の裸の脳反応モデルの次元は例としてのみ示されており、実際の次元は使用される基礎となる脳モデルの複雑さ(解剖学的、機能的など)に応じて変化しうる。同時に、正確な数学的記述に関係なく、十分に包括的な(たとえば、大規模なデータベースの)一般的コンテンツにより、使用される任意の裸の脳反応モデルが「完全」であることが保証される(たとえば、係数 [αij
F,0] はデータベースの拡大の影響を受けない)。
【0032】
上で述べたように、前述のエキスパートマシン(例えば、専門分野固有の脳反応のデータベース)を構築するために、プロセッサは、それぞれがそれぞれのラベル Ls∈G を有する、(デジタル化された)コンテンツ項目の専門分野固有のセットをアップロードする。各ラベル付きカテゴリには、 Ns 個のコンテンツ項目が含まれると想定される。プロセッサは、専門分野固有のコンテンツ項目のそれぞれから、前述の事前定義されたフィーチャのユニバーサルセットのフィーチャのサブセット Fds、 Fds⊆F を抽出する。サブセット Fds は、事前定義されたセット F と同一にすることも、より小さい最適化されたサブセットにすることもできる。例えば、白黒画像の表示の検出または受信の場合、抽出されたフィーチャのサブセットは同じセットであるが、グレー以外の色合い(例えば、赤の色合い)については重みがゼロである可能性がある。別の例として、fds および/または f の要素は、それぞれ集合 Fds および/または F のバイナリ(チェック済み/未チェック)フィーチャとすることができる。あるいは、サブセットサイズを縮小してグレーの階調のみを構成することもできる。つまり、他の色の無効な階調を処理しないことでメモリスペースを節約し、計算量を削減できる。
【0033】
いずれにしても、各専門分野固有のコンテンツについて、フィーチャ fds∈Fds のそれぞれのベクトル fds の非ゼロ要素(つまり、重み)は、コンテンツ項目間で異なる。
【0034】
フィーチャセット Fds の抽出には、上記と同様の前処理ステップが含まれ、前述のフィーチャセット F のより小さなフィーチャサブセット Fds への縮小の可能性に加えて、モデルを特定のアプリケーション(例:グレースケール画像コンテンツに基づく画像分類)に最適化する。
【0035】
次に、プロセッサは、裸の脳反応モデル [αij
F,0] (フィーチャ fi∈F に関して脳反応振幅を指定する)を再適用し、カテゴリ Ls∈G ごとにラベル付き専門分野固有の脳反応を計算する:
式(3)
{[αij
F,0]fds}fds∈Fds,Ls∈G
一実施形態では、式(3)によって与えられる専門分野固有の脳反応のセットは、脳反応空間におけるベクトルの散乱として説明できる。
【0036】
分類を必要とする、いまだ未知のラベル x∈G を有する新しいコンテンツ項目が与えられた場合(たとえば、処理された半導体ダイの新しい画像が与えられた場合)、その新しいコンテンツ項目は、その専門分野の複数のカテゴリの1つに属すると想定される。したがって、プロセッサは新しいコンテンツ項目のフィーチャセット(たとえば、フィーチャベクトル) fnc∈ Fds を抽出する。
【0037】
次に、プロセッサは脳反応モデルを新しいコンテンツ項目に適用して、新しいコンテンツの脳反応を計算する:
式(4)
{[αij
F,0]fnc
ここで、上で述べたように、fnc ∈ Fds は、新しいコンテンツの抽出されたフィーチャセットである。 新しいコンテンツが、半導体欠陥の画像の拡張セットのような、同じコンテンツのフィーチャセット fnc ∈ Fν ⊆ Fds を生成する(たとえば、拡張によって)、同じコンテンツ項目の異なる「ビュー」のセットである場合、新しいコンテンツの脳反応は統計的に次のようにリファインできる:
式(5)
Stat({[αij
F,0]fnc}fnc,∈Fν)
【0038】
カテゴリごとに専門分野固有のコンテンツ項目が N
s 個あるため、これらの脳反応の平均:
式(6)
【数6】
は、脳アクティビティの座標系におけるラベルの位置の推定値を与える。
【0039】
別の表現では、特定の専門分野からの仮定されたラベル付きデータセットは、
{f ,Ls}s=1
M として書くことができる。ここで、s ∈ G であり、カテゴリのセット G に M個のカテゴリがあると仮定している。一部のアプリケーションでは f の一部のメンバーがヌル化されて使用されないため、そのような削減されたフィーチャベクトルは上記で fds として示されることに再度注意が必要である。
【0040】
同じカテゴリ (つまり、クラス) に属する脳の活性化は平均され、平均は次のように表される:
式(6´)
【数6B】
新しいフィーチャベクトル f
nc の予測は、
【数6B-1】
とそれぞれの平均値
【数6B-2】
の間の類似性に基づいて行われる。
【0041】
上記の説明では、その後、プロセッサは類似性テストなどの統計テストを適用するか、またはいくつかの実施形態では、ベクトル [α
ij
F,0]f
nc とそれぞれのラベルごとの平均ベクトルとの間の内積を計算し、未知のラベル x がラベル L
s∈G である確率を生成する:
式(7)
【数7】
グローバル正規化係数まで。
【0042】
より一般的には、類似性は、新しいコンテンツ脳反応 [αij
F,0]fnc とラベル付き散乱 {[αij
F,0]fds}fds∈Fds,Ls∈ との間の距離を計算することによって推定できる。 L1 またはヘリンジャー距離などの他の距離を類似性の推定に使用できる。
【0043】
内積が使用される場合、ラベルを使用して、プロセッサは確率分布とその分布に適用される分類基準に従ってコンテンツを分類する。 例えば、プロセッサは、分類の結果とし
て最も可能性の高いラベルを選択することができる。より一般的には、プロセッサは、以下でさらに説明するように、マッピングされた新しいコンテンツとマッピングされたラベル付きコンテンツとの間の類似性のレベルに従ってコンテンツを分類する。
【0044】
いくつかの実施形態では、プロセッサはさらに、分類に基づいて決定を出力する。たとえば、プロセッサは、事前に指定された合格基準を使用して、分類に基づいて半導体ダイを不合格にし、そのダイを社内の根本原因分析に導く決定を下すことができる。
【0045】
感情、口調などの非視覚的な専門分野を含む、非常に異なる専門分野のコンテンツを分類するために、コンテンツ前処理のステップには、開示された技術を使用してさらなる分析を行うためにコンテンツタイプ間でコンテンツを変換することが含まれる場合がある。たとえば、前処理には、オーディオファイルを画像に符号化することが含まれる場合がある。
【0046】
あるいは、非視覚的カテゴリに属するコンテンツは、オーディオに関して、ラウドネスレベル、および特徴的な音の周波数など、定義された関連するフィーチャの独自のタイプのデータベースを有することもできる。しかしながら、本発明者らは、プロセッサが、代わりに異なる前処理ステップを実行するようにプログラムできること、例えば、オーディオ情報を視覚情報に符号化し、検証可能な方法で視覚コンテンツの抽出されたフィーチャを使用できることを発見した。同様に、匂いや抽象的なコンテンツタイプ(例えば、感情)などの他の非視覚的コンテンツタイプも、開示された技術を使用して、多次元視覚スケールにうまく符号化され、分類することができる。
【0047】
(装置の説明)
図1は、本発明の一実施形態による、一般脳反応モデル212とラベル付き脳反応の専門分野固有データベース200を使用して、特定の専門分野に属する新しいコンテンツ項目102を分類するように構成された装置10を概略的に示すブロック図である。 専門分野固有の新しいコンテンツ項目102は、例えば、処理された半導体ダイの画像であり得る。
【0048】
装置10がその意図された使用を実行するために、装置10のメモリ112はデータベース200を保持する。データベース200は、
図2で説明されるように、事前に計算されたカテゴリごとの、ラベル付き脳反応は:
{[α
ij
F,0]f
ds}
fds∈Fds,Ls∈
である。換言すれば、プロセッサ110は、メモリ112内にその専門分野の「エキスパートマシン」を保持する。
【0049】
デジタル化モジュール104は、新しいコンテンツ102を、装置10への入力のために、以下デジタル画像と呼ばれるデジタルデータセットにデジタル化する。デジタル画像は、(例えば、ネットワークを介して、またはローカル通信リンクを介して)装置10のプロセッサ110に通信されうる。デジタル画像はメモリ112に記憶され得る。
【0050】
プロセッサ110のフィーチャ抽出モジュール122は、フィーチャ認識アルゴリズムを実行して、新しいコンテンツ102からそれぞれの新しいコンテンツフィーチャセット(例えば、フィーチャベクトル) fnc を抽出する。通常、フィーチャ抽出モジュール122は、フィーチャベクトル fnc の抽出を支援するため、特定の専門分野のコンテンツでの使用に適した、前述の前処理ステップのうちの1つまたは複数を含み得る。
【0051】
プロセッサ110は、フィーチャベクトル f
nc を乗算モジュール124に入力し、乗算モジュール124は、新しいコンテンツ、 [α
ij
F,0]f
nc の脳反応モデルを導出する。この段階では、新しいコンテンツには前述のいまだ未知のラベル x∈G が付いている。入力を受け取ると、統計的テストモジュール125は、ラベル付きマッピングされた脳反応
{[α
ij
F,0]f
ds}
fds∈Fds,Ls∈
に対するマッピングされた脳反応データ点(例えばベクトル)
[α
ij
F,0]f
nc
を推計し、ここで、これらはすべて脳アクティビティ空間内のベクトル、またはより一般的には、
図4に示すように脳アクティビティ座標系内のデータ点になりうる。続いて、統計的テストモジュール125は、例えば式(7)を用いて、ベクトルの内積を計算することにより、類似性検定を実行し、人間の専門家が新しいコンテンツ102をカテゴリ L
s に属するものとして分類およびラベル付けしたであろう確率 p = p
s、 x = L
s を計算する。より一般的には、以下で説明するように、2つのセットは、
図4に示すような推定距離のセットを使用して類似性チェックを受ける。
【0052】
すべてのラベルをカバーするために、統計的テストモジュール125は(時間論理は図示せず)カテゴリ Ls∈G ごとの脳反応の専門分野固有のセットの全ての格納されたセット200を呼び出し、新しいコンテンツ項目102が専門分野固有のコンテンツのラベル付きセットの1つに属する確率分布を生成する。
【0053】
コンテンツ分類器126は、ラベルが付けられ、選択肢として等級付けされた確率分布を含む結果150を用意する。この目的のために、コンテンツ分類器126は、最大確率のラベル、最小距離を選択するなど、事前定義された基準を適用することができる。コンテンツ分類器126は、結果に応じた決定を、例えばユーザディスプレイ(図示せず)に出力する。
【0054】
例えば、処理された半導体ダイの画像の場合、結果はモジュール126によって3つの選択肢に制限されうる。ダイが「良好」ビンに属するとラベル付けされる97%の確率、ダイが「許容」ビンに属するとラベル付けされる2%の確率、ダイは「不合格」ビンに属するものとしてラベル付けされるべき1%の確率。 この決定は、例えば、「不合格」ビンに許容される最大確率として0.1%の基準を有し、上記の分類に基づいてダイを拒否し、ダイを根本原因分析のために人間の検査に移す、メモリ112に記憶された基準に基づきうる。
【0055】
プロセッサ110は、リモートプログラム/ユーザからのクエリ、または例えばタッチスクリーンを使用するユーザによる選択/クエリなどの通信およびユーザインターフェース114を使用して、ローカルまたはリモートで関与することができる。
【0056】
様々な実施形態において、
図1に示される装置の異なる電子要素は、1つ以上の個別コンポーネント、1つ以上の特定用途向け集積回路(ASIC)および/または1つ以上のフィールド プログラマブル ゲート アレイ (FPGA)の使用など、適切なハードウェアを使用して実装され得る。開示されたプロセッサ、ユニット、およびモジュールの機能の一部、例えば、プロセッサ110およびそのモジュール122~126の一部またはすべての機能は、1つまたは複数の汎用プロセッサで実装することができ、これらのプロセッサは、本明細書に記載の処理を実行するようにソフトウェアでプログラムされる。ソフトウェアは、例えば、ネットワークを介して、またはホストから電子形式でプロセッサにダウンロードすることができ、あるいは、代替的または追加的に、磁気、光学、磁気媒体などの非一過性有形媒体または電子メモリ上に提供および/または保存することもできる。特に、プロセッサ110は、以下でさらに説明するように、
図3を含めて本明細書に開示される専用アルゴリズムをプロセッサ110が実行できるようにする、専用アルゴリズムを実行する。
【0057】
(コンテンツ固有のラベル付き脳反応セットの生成)
図2は、本発明の一実施形態による、
図1の装置10の要素(122、124)と、一般的な脳反応モデル212を生成し、それを使用して
図1のラベル付き脳反応データベース200を導出するために適用される処理スキームと、を概略的に示す、フローチャートを伴うブロック図である。
【0058】
示されている処理は 2つのフェーズに分かれている:
(i)フェーズ201では、実際の脳スキャンを行い、統計モデル222を使用して、一般コンテンツ脳反応モデル [αij
F,0] (212) を生成する。それはコンテンツデータベース204のフィーチャとfMRI抽出脳振幅のそれぞれのセット211を結ぶ。
(ii)フェーズ202では、一般コンテンツ脳反応モデル212を適用して、
カテゴリ Ls∈G ごとの脳反応 {[αij
F,0]fds}fds∈Fds,Ls∈ の専門分野固有のセット、またはデータベース224の専門分野固有のコンテンツ(例えば、半導体ダイの各ラベル付き画像)のフィーチャのベクトルfds 226を計算する。このようにして、予測または分類の人間の脳の力が、複数の専門分野のエキスパートマシンをモデル化するために利用される。
【0059】
提示された実施形態によれば、データベース200の生成には、デジタル化コンテンツのデータベース204を受信することから始まるプロセスを実行するために装置10によって使用されるアルゴリズムが含まれる。デジタル化コンテンツの例を2つ挙げれば、複雑な都市環境を捉えた、および/または種々の人間の活動やジェスチャーなどの他の複雑な環境を捉えた、カラー画像のセットがある。
【0060】
図1のフィーチャ抽出モジュール122を使用して、プロセッサ110は、各コンテンツ(すなわち、デジタル化された画像)から、事前定義されたフィーチャセット206 F=(f
1、f
2、…、f
k) に属するフィーチャ(黒塗りの円)を抽出する。このような抽出には通常、前処理およびパターン認識の予備ステップが含まれる。
【0061】
上で示したように、コンテンツごとにベクトル (f1、f2、…、fk) のフィーチャの一部がチェックされ、一部はチェックされず、コンテンツが特定の項目を表すフィーチャベクトル fcontent を生成する。たとえば、グレースケール画像では色のフィーチャがチェックされず、直線と直角のみを含む対象の画像で欠落している円弧など、一部の幾何学的フィーチャがチェックされている場合とチェックされていない場合がある。
【0062】
プロセッサ110はさらに、データベース204のコンテンツが提示された人の脳の機能的MRI(fMRI)画像を含むfMRIデータ(208)のそれぞれのデータベースを受信する。データ208はfMRIデータとして提示されるが、脳波(EEG)、脳磁図(MEG)、赤外線画像、紫外線画像、コンピュータ断層撮影(CT)、超音波画像、生体内細胞データ、生体内分子データ、ゲノムデータ、または光学イメージングなどの他のタイプのものであってもよい。
【0063】
活性化され得る脳領域および/または脳の神経経路のマップなど、事前に指定された脳モデルを使用して、パターン認識モジュール210は、脳の測定値から、人間に提示された画像ごとの脳反応振幅213のセット211それぞれの脳モデルを生成する(たとえば、そのようなデータをモデルに記入する)。ここで脳反応振幅213は、例えば、式(1)の脳アクティビティ振幅 Aj(Rj) を含む。
【0064】
数学的には、医療画像およびその他の測定ツールによる、特定の脳領域および/または神経経路(後者は「脳コネクトーム」とも呼ばれる)の活性化のモデル化は、一般的な人間の脳反応モデルであるfMRIの行列のセットを置き換えることによって実現できる。提示されたコンテンツのフィーチャに相関する応答値を抽出して脳アクティビティマップを生成し、前述の一般コンテンツ脳反応モデル(演算子)の設定振幅 Aj(Rj) を提供する。
【0065】
示される実施形態では、fMRIで抽出された脳振幅のセット211(例えば、脳アクティビティマップのセット213)は、脳領域(R1、R2、…、Rk)ごとの反応のグレーレベル値を含むことが示されている。脳アクティビティの振幅(例えば、灰色の陰影のバーコード)は、例えば、各脳領域 Rj のアクティビティの振幅を示す数値インデックスを与えるm-ビットスケールを使用し、一方で(別の配列(図示せず)では、脳領域間の相互作用(例えば、カップリング)を考慮する(つまり、コネクトームに従って重み付けされ、そして例えば、対角要素が脳領域の値を表す、一般人脳反応モデルの行列、のセットの非対角要素として表される)ことにより、活性化のレベルを示しうる。
【0066】
したがって、統計モデル222は、抽出されたフィーチャのベクトル fcontent を脳反応振幅213のそれぞれの配列に変換し、そして式(1)~(2)を使用して一般コンテンツ脳反応モデル [αij
F,0] (212)を生成する際に使用するために演算子をメモリに記憶するために、最良適合の裸の脳反応モデル212(すなわち、最良適合演算子 [αij
F,0] )を統計的に導出する(例えば、多次元回帰を使用する)。
【0067】
フェーズ202では、1人以上の専門家が専門分野固有のコンテンツのセット224をレビューし、ラベルを付ける(228)。たとえば、コンテンツが加工された半導体ダイの画像であれば、そのような専門家は欠陥検査技術者でありうる。専門家は、事前定義された可能なラベルのグループ G=(L1,L2, …, Lm) から任意のラベルを選択できる。ラベルの事前定義されたグループには、例えば、L1=「最高ビン」(例えば完全にクリーンなダイ)、L2=「高ビン」、L3=「中ビン」、L4=「低ビン」、L5=「最低ビン」、およびL6=「拒否」などのラベルが含まれる場合がある。ここで、一般に、レビューおよびラベル付けプロセス228の結果は、セット230 G=(L1,L2, …, Lm)のすべてのラベルをカバーする必要がある。
【0068】
並行して、プロセッサ110は、フィーチャ抽出モジュール122を使用してセット224から専門分野固有のコンテンツ、専門分野固有のフィーチャのそれぞれのサブセット226を抽出する。
【0069】
このステップでは、推定された裸のモデル212は、適用された専門分野固有のフィーチャのサブセット226
であり、各ラベル Ls∈G ごとの計算を使用して、カテゴリ Ls ごとのラベル付き専門分野固有の脳反応
{[αij
F,0]fds}fds∈Fds,Ls∈ を得る。
【0070】
図1に戻り、まだ分類されていない、専門分野の新しいコンテンツ項目、たとえばいまだ未知のラベル x∈G があり、フィーチャセット f
nc を持つと仮定すると、一般コンテンツ脳反応モデル212が、式(4)を使用して、新しいコンテンツに対する脳の反応を計算するために適用される。次に、統計的テストモジュール125は、上述したように、ラベル x がラベル L
s∈G の1つであるカテゴリごとの確率を出力する。
【0071】
したがって、
図1の結果150は、新しいコンテンツ(例えば専門分野からの新しい画像)のラベルの確率分布 p= (p
1,p
2,…,p
m)であり、そのラベルは、ラベル(L
1,L
2, …, L
m)の1つであるか、または x=L
s である確率 p= p
s である。このような確率は、たとえば式(7)を使用して計算できる。
【0072】
半導体ダイの例の場合、
図1の結果150は、上にリストされたラベル(L
1,L
2, …, L
6)の1つである新しい画像のラベルの確率分布 p= (p
1,p
2,…,p
6)でありうる。
【0073】
その後、例えば、確率振幅の閾値処理やラベルごとの発生率レベルなどの許容基準に基づいて、確率分布が意思決定プロセス(例えば、画像化されたダイがハイエンドの用途に適しているか、ローエンドの用途に適しているか、または破棄する必要があるか、を決定する商業的決定など)に変換される。
【0074】
(新しいコンテンツを分類する方法)
図3は、本発明の一実施形態による、
図1の装置10を使用して特定の専門分野に属する新しいコンテンツ項目を分類する方法を概略的に示すフローチャートである。本実施形態によるアルゴリズムは、装置10のメモリ112に格納された、一般コンテンツの脳反応モデル212と、カテゴリごとにラベル付き専門分野固有の脳反応200とを使用するプロセスを実行する。新しいコンテンツの一例は、半導体加工欠陥を検出するために検査装置によって撮影された加工済み半導体ダイの前述の画像である。
【0075】
プロセスは、専門分野固有コンテンツのアップロードステップ302から始まり、プロセッサ110は、半導体処理欠陥検査などの特定の専門分野の異なるカテゴリ Ls∈G としてラベル付きの、複数のコンテンツ項目をアップロードする。各カテゴリは、良性欠陥のラベルから重大な欠陥のラベルまでの範囲の異なるラベル Ls を有する。詳細には、コンテンツのカテゴリの1つは、「ゴールデン ダイ」(つまり欠陥のないダイの画像)の参照画像、であってもよい。コンテンツはすでにデジタル形式になっているものとする。
【0076】
次に、専門分野固有のフィーチャ抽出ステップ304で、プロセッサ110のフィーチャ抽出モジュール122が前処理を実行し、フィーチャベクトル fds ∈ Fds のそれぞれのセットを抽出し、メモリ112に格納する。
【0077】
次に、裸の脳反応モデルのアップロードステップ306で、プロセッサ110はメモリ112から裸の脳反応モデル212、 [αij
F,0] をアップロードする。
【0078】
次に、専門分野固有脳反応の計算ステップ308で、ラベル付き(230)フィーチャベクトル fds ∈ Fds のセットを使用して、プロセッサ110によってベアモデル212が適用され、脳反応
{[αij
F,0]fds}fds∈Fds,Ls∈ が計算される、すなわち、当該専門分野の前述のエキスパートマシンデータベース200内で。
【0079】
新しいコンテンツのフィーチャ抽出ステップ310において、いまだ未知のラベル x ∈ G を有する新しいコンテンツ項目が与えられると(例えば、処理された半導体ダイの新しい画像が与えられると)、プロセッサ110は新しいコンテンツ項目からフィーチャベクトル fnc ∈ Fds を抽出する。
【0080】
新しいコンテンツマッピングステップ312で、式(4)を使用して、新しいコンテンツに対する脳反応 [αij
F,0]fnc を計算する。
【0081】
ラベル付けステップ314で、例えば式(7)を含む統計検定を使用して、プロセッサ110は、 x = Ls である確率 p = ps を生成する。具体的には、式(7)を使用して、プロセッサ110は、モジュール125を用いて、ベクトル [αij
F,0]fnc の脳アクティビティ空間における [αij
F,0]fds 方向の成分を計算する。
【0082】
最後に、分類ステップ316で、プロセッサ110のモジュール126は、確率分布Pおよび他の事前に指定された分類基準(例えば、
図4に示す前述の距離のセット)に基づいて新しいコンテンツ項目を分類する(例えば、最も確率の高いラベル、または最適に適合するラベルに分類する。)
【0083】
図3のフローチャートは、単に明確化のために例として挙げたものである。
図3によって説明される検査プロセスはウェハダイについて例示されているが、PCBの回路などの他の電子回路も同様の方法で検査することができる。開示された方法の
図3に示された例は特定の専門分野のものであるが、この方法は必要な変更を加えて、工学から心理学、法執行機関からエンターテイメントに至るまでの多数の専門分野に構築および適用することができる。
【0084】
図4は、本発明の一実施形態による、新しいコンテンツ項目を分類するために使用される、新しいコンテンツ項目の脳反応410と、専門分野固有のラベル付き脳反応の分散との間の推定距離404のセットの絵画的概略図である。
【0085】
見られるように、新しいコンテンツのデータポイント410は、脳反応のラベル付きセット402から異なる距離(例えば、L1 距離)を有し、L2 ラベル付きセット402からの距離 d2 がこれらの最小値であり、 L4 ラベル付きセット402からの距離 d4 が最大値である。
【0086】
一実施形態では、プロセッサ110は、新しいコンテンツにラベルL2を付ける。別の実施形態では、プロセッサ110は、距離 d1、d2、…、ds、…、dm の逆数に基づいて確率分布を生成し、距離から導出された確率分布に従って、確率を有するラベル L1、L2、…、Ls、…、Lm でデータ点410にラベルを付ける。
【0087】
図4の図は、単に明確化のために例として挙げたものである。追加のステップを実行することもできるが、簡単にするために省略している。例えば、一実施形態では、散乱402のそれぞれが最初に単一のデータ点に平均化され、平均値間の距離が計算される。
図4に示す例は、多くの専門分野で構築および適用できる。
【0088】
したがって、上述の実施形態は例として引用したものであり、本発明は特に上に図示し説明したものに限定されないことが理解されるであろう。むしろ、本発明の範囲は、上記の様々な特徴の組み合わせおよびサブ組合せの両方、ならびに上記の説明を読んで当業者に想起される、従来技術には開示されていないそれらの変形および修正が含まれる。
【国際調査報告】