(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024173552
(43)【公開日】2024-12-12
(54)【発明の名称】文化的シンボルを特徴付けるための方法及び装置
(51)【国際特許分類】
G06N 20/00 20190101AFI20241205BHJP
G06T 7/00 20170101ALI20241205BHJP
【FI】
G06N20/00
G06T7/00 350C
【審査請求】有
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2023113914
(22)【出願日】2023-07-11
(31)【優先権主張番号】18/326,993
(32)【優先日】2023-05-31
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.FACEBOOK
(71)【出願人】
【識別番号】523263957
【氏名又は名称】シュ ユァン
【氏名又は名称原語表記】XU Yuan
【住所又は居所原語表記】Flat A, 5/F, Fung Wing Court, 69 Tak Ku Ling Road, Kowloon City, Kowloon, Hong Kong
(74)【代理人】
【識別番号】100091683
【弁理士】
【氏名又は名称】▲吉▼川 俊雄
(74)【代理人】
【識別番号】100179316
【弁理士】
【氏名又は名称】市川 寛奈
(72)【発明者】
【氏名】シュ ユァン
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096HA11
(57)【要約】 (修正有)
【課題】機械学習モデルを使用することによって、文化的シンボルを特徴付ける方法を提供する。
【解決手段】方法は、シンボル単位に関する複数のマテリアルを受信することを含む。複数のマテリアルは、少なくとも、シンボル単位を描写するピクチャー、シンボル単位の発音及びシンボル単位の文化的意味を示す画像又はビデオを含み、シンボル単位は、単一の文化的シンボル又は複数の文化的シンボルの組み合わせである。方法はまた、複数のマテリアルの各マテリアルについて、マテリアルを分析及び学習して、マテリアルの特徴を抽出し、特徴ベクトルのセットを形成することと、形成された特徴ベクトルの全てをテンソルに結合することと、テンソルを分析及び学習して、シンボル単位を特徴付ける概念ベクトルを生成することと、を含む。概念ベクトルは、シンボル単位と直接的かつ一貫して関連付けられる。
【選択図】
図1
【特許請求の範囲】
【請求項1】
機械学習モデルを使用することによって文化的シンボルを特徴付けるための方法であって、
シンボル単位に関する複数のマテリアルを受信することであって、前記複数のマテリアルは、少なくとも、前記シンボル単位を描写するピクチャー、前記シンボル単位の発音、及び前記シンボル単位の文化的意味を示す画像またはビデオを含み、前記シンボル単位は、単一の文化的シンボル、または複数の文化的シンボルの組み合わせである、受信することと、
前記複数のマテリアルの各マテリアルについて、前記マテリアルを分析及び学習して、前記マテリアルの特徴を抽出し、特徴ベクトルのセットを形成することと、
前記形成された特徴ベクトルの全てをテンソルに結合することと、
前記テンソルを分析及び学習して、前記シンボル単位を特徴付ける概念ベクトルを生成することであって、前記概念ベクトルは前記シンボル単位と直接的に及び一貫して関連付けられる、生成することと、
を含む、方法。
【請求項2】
前記テンソルは、後で、前記シンボル単位に関する1つ以上のさらなるマテリアルが前記機械学習モデルによって受信され、前記1つまたは2つのマテリアルが前記1つ以上のさらなるマテリアルで見つからない場合、前記機械学習モデルが、前記シンボル単位を描写するピクチャー、前記シンボル単位の発音、及び前記シンボル単位の文化的意味を示す画像またはビデオにおいて、1つまたは2つのマテリアルに各々対応する特徴ベクトルの1つまたは2つのセットを推論することを可能にする、請求項1に記載の方法。
【請求項3】
さらなるテンソルを形成するために特定の順序で配置された前記概念ベクトル及び1つ以上の概念ベクトルを結合することであって、前記1つ以上の概念ベクトルは、各々、1つ以上の他のシンボル単位を特徴付け、前記機械学習モデルによって生成され、前記特定の順序の前記シンボル単位及び前記1つ以上の他のシンボル単位の配置は、文化的意味を有する文脈を形成する、結合することと、
前記さらなるテンソルを分析及び学習して、さらなる概念ベクトルを生成することであって、前記さらなる概念ベクトルは、前記シンボル単位自体の前記特徴と、前記1つ以上の他のシンボル単位との前記シンボル単位の関連性とを特徴付ける、生成することと、
を含む、請求項1に記載の方法。
【請求項4】
前記単一の文化的シンボルは、文字記号、数学記号、論理記号、商標、フラグ、または政治的シンボルであり、複数の文化的シンボルの前記組み合わせは、文字用語、省略文字、数学公式、または論理的表現である、請求項1に記載の方法。
【請求項5】
前記複数のマテリアルは、さらに、辞書における前記シンボル単位の前記文化的意味の説明を含む、請求項1に記載の方法。
【請求項6】
前記機械学習モデルは、深層学習モデル、完全オートエンコーダー、不完全オートエンコーダー、及び/または数理統計モデルである、請求項1に記載の方法。
【請求項7】
前記機械学習モデルは、機械学習用の単一のモデルである、または機械学習用の複数のモデルの組み合わせである、請求項1に記載の方法。
【請求項8】
機械によって実行されるとき、前記機械に請求項1~7のいずれか1項に記載の方法を行わせる命令を記憶する機械可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の非限定的で例示的な実施形態は、概して、機械学習の技術分野に関し、具体的には、機械学習モデルを使用することによって、文化的シンボルを特徴付けるための方法及び装置に関する。
【背景技術】
【0002】
このセクションは、本開示の良き理解を容易にし得る態様を紹介する。したがって、このセクションの記述は、この観点から読むべきであり、先行技術にある内容または先行技術にはない内容に関する承認として理解すべきはない。
【0003】
機械学習は、研究課題に関するモデル仮定を作る技術であり、コンピューターを使用して、モデルパラメーターをトレーニングデータから学習し、最終的に、データを予測及び分析する。機械学習モデルは、機械学習のコアコンポーネントである。
【0004】
本質的に、機械学習モデルは、データを入力として受信し、出力を生成する機能として理解できる。一種の機械学習モデルは、内部パラメーターを含み、出力を生成するために内部パラメーターに基づいて入力を計算する。別の種類の機械学習モデルは深層学習モデルであり、深層学習モデルは、入力を処理し、出力を生成するために一緒に積み重ねられた機械学習モデルの複数の層を有し、例えば、深層学習モデルによって使用されたディープニューラルネットワークは、入力層、出力層、及び入力層と出力層との間の1つ以上の隠れ層を含み、各層はその入力における非線形変換を行い、その出力を生成する。
【0005】
最近、人々の生活をより便利にするために、機械学習を使用して、テキスト等の人間の文化的シンボルを処理する様々な技術が出現している。例えば、FastTextは、Facebookによって開発された高速のテキスト分類器であり、テキスト分類及び表現学習の簡単で効率的な方法を提供し、FastTextは、機械学習モデルを使用して、文字間の構造及び相関関係を分析し、英単語をデジタルでエンコードするが、象形文字に適用できない。別の例として、Googleの視覚技術は、機械学習モデルを使用して、同じウェブサイトページ上の画像とテキストとの間の相関関係を分析し、テキストに基づいて、同じウェブサイトページ上に現れる画像を検索できるが、画像を見つけるための検索キーワードとして画像自体の説明を使用できない。
【0006】
加えて、現在、また、以下の特許(出願)文献で開示される人間の文化的シンボルを処理するための機械学習の解決策も存在している。
【0007】
米国特許第10621420号明細書の特許番号が付された文献の解決策により、画像をデジタルコードに変換でき、デジタルコードは、画像と直接的に及び一貫して関連付けられ、他の画像の対応するデジタルコードと異なる。この解決策は、文化的シンボルの視覚特徴を抽出するために適用できるが、シンボルの文化的意味及びシンボル間の相互関係を表すことができない。
【0008】
米国特許第9779085号明細書の特許番号が付された文献の解決策により、テキストをデジタルコードに変換でき、デジタルコードは、テキストと直接的に及び一貫して関連付けられ、他のテキストの対応するデジタルコードと異なる。この解決策は、シンボルシステムの構造及び相関分析に適用できるが、デジタルコードは、シンボル自体の文化的意味を表すことができない。
【0009】
米国特許第10635949号明細書の特許番号が付された文献の解決策により、画像のテキストをデジタルコードに変換でき、デジタルコードは、テキストと直接的に及び一貫して関連付けられ、他のテキストのデジタルコードと異なるが、テキストの視覚特徴だけに限定される。
【0010】
米国特許出願公開第2020/0342183号明細書の公開番号が付された文献の解決策では、機械学習モデルを使用して、テキスト列を処理し、応答として、意味を持つテキスト列を生成できる。この解決策はシンボルのテキスト構造及び相関分析に基づいているが、シンボルの視覚処理及び聴覚処理を含まない。
【0011】
中国特許出願公開第106909625号明細書の公開番号が付された文献の解決策により、画像のテキストをデジタルコードに変換でき、デジタルコードは、テキストと直接的に及び一貫した関連性があり、他のテキストのデジタルコードと異なり、画像対画像検索のために使用できる。この解決策は、いずれかのシンボルの聴覚処理を含まない。
【先行技術文献】
【特許文献】
【0012】
【特許文献1】米国特許第10621420号明細書
【特許文献2】米国特許第9779085号明細書
【特許文献3】米国特許第10635949号明細書
【特許文献4】米国特許出願公開第2020/0342183号明細書
【特許文献5】中国特許出願公開第106909625号明細書
【発明の概要】
【発明が解決しようとする課題】
【0013】
上記の課題の少なくとも1つを解決または改善するために、本開示の発明者らは、例えば、順序変換及び記号の理解等の人工知能応用で使用する記号の文化的意味を含む概念ベクトルを生成するために、機械学習モデルを使用することによって、人間の文化的シンボルを処理するための解決策を考えている。
【課題を解決するための手段】
【0014】
本開示の第1の態様によると、その目的は、機械学習モデルを使用することによって、文化的シンボルを特徴付けるための方法によって達成され、本方法は、シンボル単位に関する複数のマテリアルを受信することであって、複数のマテリアルは、少なくとも、シンボル単位を描写するピクチャー、シンボル単位の発音、及びシンボル単位の文化的意味を示す画像またはビデオを含み、シンボル単位は、単一の文化的シンボル、または複数の文化的シンボルの組み合わせである、受信することと、複数のマテリアルの各マテリアルについて、マテリアルを分析及び学習して、マテリアルの特徴を抽出し、特徴ベクトルのセットを形成することと、形成された特徴ベクトルの全てをテンソルに結合することと、テンソルを分析及び学習して、シンボル単位を特徴付ける概念ベクトルを生成することであって、概念ベクトルはシンボル単位と直接的に及び一貫して関連付けられる、生成することと、を含む。
【0015】
本開示の第2の態様によると、その目的は、プロセッサと、プロセッサによって実行されるとき、機械に第1の態様に従った方法を行わせる命令を記憶するメモリとを含む機械によって実現される。
【0016】
本開示の第3の態様によると、その目的は、機械で実行されるとき、機械に第1の態様に従った方法を行わせる命令を記憶する機械可読媒体によって実現される。
【発明の効果】
【0017】
本開示の解決策における文化的シンボルのデジタルエンコードによって取得された概念ベクトルは、例えば、視覚特徴、聴覚特徴、文法特徴、記号のスピーチの一部を含む複数の特徴の意味を含み、記号自体の文化的意味及び記号の間の相互関係を特徴付けることができる。したがって、本開示の解決策は、象形文字、文字記号、数学記号、論理記号、商標、フラグ、政治的シンボル、文字用語、省略文字、数学公式、論理的表現等の広範囲の文化的シンボルを特徴付けることができ、画像から画像、テキストから画像、画像からテキスト、テキストからサウンド、テキストからビデオ等のマルチモーダル情報検索のために使用できる。
【0018】
本開示の上記及び他の態様、特徴、及び利点は、添付図を参照して、以下の詳細な説明からさらに十分に明らかになり、同様の符号または文字を使用して、同様または等価の要素を指定する。図面は、本開示の実施態様の良き理解を容易にするために示されており、必ずしも、縮尺どおりに描かれていない。
【図面の簡単な説明】
【0019】
【
図1】本開示に従った方法のフローチャートを示す。
【
図2】本開示に従った方法の例示的な処理における特徴ベクトル及びテンソルの形成を示す。
【
図3】本開示に従った方法の例示的な処理における、概念ベクトルの生成を示す。
【
図4】本開示に従った方法の例示的な処理において1つまたは2つのマテリアルが見つからないときの、特徴ベクトルの推論及び別の概念ベクトルの生成を示す。
【
図5】本開示に従った方法の例示的な処理におけるベクトル空間の概念ベクトル間の有意差を示す。
【
図6】本開示に従った方法の例示的な処理における、さらなる概念ベクトルの生成を示す。
【
図7】本開示に従った機械の概略ブロック図である。
【発明を実施するための形態】
【0020】
本明細書の実施形態は、添付図を参照して以下にさらに十分に説明される。しかしながら、本明細書の実施形態は、多くの異なる形態で具体化され得、添付の請求項の範囲を制限していると解釈すべきではない。
【0021】
本明細書に使用される専門用語は、特定の実施形態だけを説明する目的のためのものであり、制限することを目的としていない。本明細書に使用されるように、単数形「a」、「an」、及び「the」は、文脈上明らかに他の意味を示す場合を除いて、複数形も含む。「備える(comprises)」、「備える(comprising)」、「含む(includes)」、及び/または「含む(including)」という用語は、本明細書で使用されるとき、記述された特徴、整数、ステップ、動作、要素、及び/またはコンポーネントの存在を特定するが、1つ以上の他の特徴、整数、ステップ、動作、要素、コンポーネント、及び/またはそれらのグループの存在または追加を除外しないことがさらに理解される。
【0022】
また、要素を修正するための本明細書おける「第1の」、「第2の」、「第3の」等の順序語の使用は、それらの用語自体によって、別の要素に対する一方の要素の任意の優先権、優先順位、もしくは順序、または方法のアクションを行う時間的順序を含意しないが、単に、ある名称を有する一方の要素を、同じ名称(しかし、順序語を使用するためのもの)を有する別の要素と区別して、それらの要素を区別するための標識として使用される。
【0023】
別様に定義されない限り、本明細書に使用される全ての用語(技術用語及び科学用語を含む)は、一般的に理解されるものと同じ意味を有する。本明細書に使用される用語は、本明細書及び関連のある技術に関連して、それらの意味と一致する意味を有するとして解釈すべきであり、本明細書にそのように明確に定義される場合を除いて、理想的な意味で、または過度に形式的な意味で解釈されないことをさらに理解されたい。
【0024】
本開示に従った機械学習モデルを使用することによって、文化的シンボルを特徴付けるための方法100のフローチャートは、
図1に示される。方法100は、シンボル単位に関する複数のマテリアルを受信するステップ101であって、複数のマテリアルは、少なくとも、シンボル単位を描写するピクチャー、シンボル単位の発音、及びシンボル単位の文化的意味を示す画像またはビデオを含み、シンボル単位は、単一の文化的シンボル、または複数の文化的シンボルの組み合わせである、受信するステップ101と、複数のマテリアルの各マテリアルについて、マテリアルを分析及び学習して、マテリアルの特徴を抽出し、特徴ベクトルのセットを形成するステップ102と、形成された特徴ベクトルの全てをテンソルに結合するステップ103と、テンソルを分析及び学習して、シンボル単位を特徴付ける概念ベクトルを生成するステップ104であって、概念ベクトルはシンボル単位と直接的に及び一貫して関連付けられる、生成するステップ104と、を含む。
【0025】
一実施形態では、テンソルは、後で、シンボル単位に関する1つ以上のさらなるマテリアルが機械学習モデルによって受信され、1つまたは2つのマテリアルが1つ以上のさらなるマテリアルで見つからない場合、機械学習モデルが、シンボル単位を描写するピクチャー、シンボル単位の発音、及びシンボル単位の文化的意味を示す画像またはビデオにおいて、1つまたは2つのマテリアルに各々対応する特徴ベクトルの1つまたは2つのセットを推論することを可能にする。
【0026】
一実施形態では、方法100は、さらに、さらなるテンソルを形成するために特定の順序で配置された概念ベクトル及び1つ以上の概念ベクトルを結合することであって、1つ以上の概念ベクトルは、各々、1つ以上の他のシンボル単位を特徴付け、機械学習モデルによって生成され、特定の順序のシンボル単位及び1つ以上の他のシンボル単位の配置は、文化的意味を有する文脈を形成する、結合することと、さらなるテンソルを分析及び学習して、さらなる概念ベクトルを生成することであって、さらなる概念ベクトルは、シンボル単位自体の特徴と、1つ以上の他のシンボル単位とのシンボル単位の関連性とを特徴付ける、生成することと、を含む。
【0027】
一実施形態では、単一の文化的シンボルは、文字記号、数学記号、論理記号、商標、フラグ、または政治的シンボルであり、複数の文化的シンボルの組み合わせは、文字用語、省略文字、数学公式、または論理的表現である。
【0028】
一実施形態では、複数のマテリアルは、さらに、辞書におけるシンボル単位の文化的意味の説明を含む。
【0029】
一実施形態では、機械学習モデルは、深層学習モデル、完全オートエンコーダー、不完全オートエンコーダー、及び/または数理統計モデルである。
【0030】
一実施形態では、機械学習モデルは、機械学習用の単一のモデルである、または機械学習用の複数のモデルの組み合わせである。
【0031】
ここで、特定の実施形態は中国語の単語に関連して説明される。本明細書の実施形態は中国語の単語に関連して説明されているが、複数の実施形態また、象形文字、他の文字記号(例えば、英単語)、数学記号、論理記号、商標、フラグ、政治的シンボル等の他の文化的シンボルに適用できることが理解できる。また、特定の用語が複数の実施形態で使用されるが、複数の実施形態が、それらの特定の用語に制限されないが、全ての同様の用語を含み得ることも理解される。
【0032】
シンボル単位を特徴付けるための本開示に従った方法の例示的な処理は、
図2~
図6に示される。例示的な処理では、シンボル単位は、単一の文化的シンボル、具体的には中国語の単語である。
【0033】
図2に示されるように、最初に、機械学習モデルは、イヌを意味する中国語の単語「狗」に関する複数のマテリアルを入力として受信する。本開示に従って、複数のマテリアルは、少なくとも、中国語の単語が描かれるピクチャー、中国語の単語の発音、及び中国語の単語の文化的意味を示す画像またはビデオを含むはずである。具体的には、機械学習モデルによって受信された複数のマテリアルは、この例では、「狗」が描かれるピクチャー、中国語の単語の発音、及びイヌを示す画像を含む。一実施形態では、複数のマテリアルは、さらに、辞書における中国語の単語「狗」の定義の説明を含む。
【0034】
次に、複数のマテリアルの各マテリアルについて、機械学習モデルはマテリアルを分析及び学習して、マテリアルの特徴を抽出し、特徴ベクトルのセットを形成する。具体的には、この例では、分析及び学習の後に、機械学習モデルは、
図2に示されるように、特徴ベクトルの第1のセットを形成するピクチャーの特徴を抽出し、画像の特徴を抽出し特徴ベクトルの第2のセットを形成し、発音の特徴を抽出し特徴ベクトルの第3のセットを形成する。一実施形態では、特徴ベクトルの3つのセットの長さは同じである。次に、機械学習モデルは、形成された特徴ベクトルの全てをテンソルに結合する。
【0035】
図3に示されるように、テンソルを形成した後、機械学習モデルは、テンソルを分析及び学習して、中国語の単語を特徴付ける概念ベクトルVを生成する。概念ベクトルは中国語の単語と直接的に及び一貫して関連付けられ、その結果、概念ベクトルは、他の中国語の単語を特徴付ける他の概念ベクトルとかなり異なる。例えば、
図5のベクトル空間では、概念ベクトルVは、ネコを意味する中国語の単語「猫」に対応する概念ベクトルV’’とかなり異なる。
【0036】
一実施形態では、機械学習モデルは、後で中国語の単語「狗」に関する1つ以上のさらなるマテリアルを受信し得、1つ以上のさらなるマテリアルは、「狗」が描かれるピクチャー図面、中国語の単語の発音、及びイヌを示す画像またはビデオの1つまたは2つのマテリアルが不足している。例えば、
図4では、機械学習モデルは、後で「狗」が描かれるピクチャーだけを受信し、中国語の単語の発音、及びイヌを示す画像を受信しない。本実施形態では、テンソルによって、機械学習モデルが、見つからない1つまたは2つのマテリアルに各々対応する特徴ベクトルの1つまたは2つのセットを推論することを可能にし得る。例えば、
図4では、テンソル(
図2に形成されたもの)によって、機械学習モデルが、中国語の単語の発音及びイヌを示す画像に各々に対応する特徴ベクトルの2つのセットを推論することを可能にする。さらなる実施形態では、
図4に示されるように、機械学習モデルは、特徴ベクトルの全て(特徴ベクトルの2つの推測セットと、この例示的な処理でピクチャーに対応する特徴ベクトルの形成されたセットとを含む)を、別のテンソルに結合し得、別のテンソルは、さらに、シンボル単位(すなわち、この例示的な処理では、中国語の単語「狗」)を特徴付ける別の概念ベクトルV’を生成するために使用される。該別の概念ベクトルは、また、シンボル単位と直接的に及び一貫して関連付けられ、その結果、該別の概念ベクトルは、他のシンボル単位を特徴付ける他の概念ベクトルとかなり異なることにもなる。例えば、
図5のベクトル空間では、該別の概念ベクトルV’は、中国語の単語「猫」に対応する概念ベクトルV’’とかなり異なる。
【0037】
テキスト等の文化的シンボルシステムでは、シンボル単位は、相互に文脈及び意味の相関関係があり得る。すなわち、特定の順序の2つ以上のシンボル単位の配置は、文脈を有する文化的意味を形成し得る。例えば、中国語の単語「狗」は、意味を持つ文を形成するために、特定の順序で、8個の中国語の単語
が配置され得る。同様に、8個の中国語の単語に関して、機械学習モデルは、それらの8個の中国語の単語を各々特徴付ける8個の概念ベクトルを生成し得る。この例では、
図6に示されるように、機械学習モデルは、「狗」に対応する概念ベクトル及び特定の順序で配置された8個の概念ベクトルを結合し、さらなるテンソルを形成し、その後、さらなるテンソルを分析及び学習して、さらなる概念ベクトルを生成し得、さらなる概念ベクトルは、中国語の単語「狗」自体の特徴及びそれらの8個の中国語の単語とのそのベクトルの関連性を特徴付ける。
【0038】
加えて、アルファベットシンボルシステムと同様のいくつかの文化的シンボルシステムでは、文化的シンボル自体(例えば、英語文字))は、深い意味がなく、文化的シンボルの意味は、文化的シンボルの組み合わせ(例えば、英単語)によって決まる。したがって、一実施形態では、本開示に従った機械学習モデルによって特徴付けられるシンボル単位は、単一の文化的シンボルの代わりに、複数の文化的シンボルの組み合わせであり、そして、複数の文化的シンボルの組み合わせに関する複数のマテリアルは入力として受信され、機械学習モデルは、また、複数の文化的シンボルの組み合わせを特徴付ける概念ベクトルを生成するために、本開示に従った上記の方法を行い得る。
【0039】
さらに、単一の文化的シンボルは、文字記号だけでなく、数学記号、論理記号、商標、フラグ、または政治的シンボルでもあり得、複数の文化的シンボルの組み合わせは、文字用語だけでなく、省略文字、数学公式、または論理的表現でもある。
【0040】
さらには、上記に説明したように、機械学習モデルは、深層学習モデル、完全オートエンコーダー、不完全オートエンコーダー、及び/または数理統計モデルであり得、機械学習用の単一のモデル、または機械学習用の複数のモデルの組み合わせを指し得る。
【0041】
ブロック図ならびに/またはフローチャート説明図のブロック、及びブロック図ならびに/またはフローチャート説明図のブロックの組み合わせは、コンピュータープログラム命令によって実施され得ることを理解されたい。これらのコンピュータープログラム命令は、機械を構築するために、汎用コンピューター、専用コンピューター、及び/または他のプログラム可能データ処理装置のプロセッサに提供され得、その結果、コンピューター及び/または他のプログラム可能データ処理装置のプロセッサを用いて実行する命令は、ブロック図及び/またはフローチャートのブロックまたは複数のブロックで定められた機能/アクションを実施するための手段を構築する。
【0042】
また、フローチャートのブロックの機能/アクションは、動作図で指摘された順序と違って発生し得ることも理解される。例えば、連続して示される2つのブロックは、実際に、実質的に同時に実行され得、またはブロックは、時々、関係する機能/アクションに応じて逆順で実行され得る。図の一部が主要な通信方向を示す通信経路の矢印を含むが、通信が示される矢印と反対方向に発生し得ることを理解されたい。
【0043】
さらに、本開示の解決策は、命令実行システムによって、またはそれに関連して使用される媒体で具体化されたコンピューター使用可能プログラムコードまたはコンピューター可読プログラムコードを有するメモリにおいてコンピュータープログラムの形態をとり得る。この文献に関連して、メモリは、命令実行システム、命令実行装置、または命令実行デバイスによって、またはそれらに関連して使用するために、プログラムを含み、記憶し得る、またはプログラムを伝えるように適応する任意の媒体であり得る。
【0044】
したがって、
図7に示されるように、本開示は、また、プロセッサ701及びメモリ702を含む機械700も提供する。機械700では、メモリ702は、プロセッサ701によって実行されるとき、機械700に、上記に説明した本開示に従った方法を行わせる命令を記憶する。
【0045】
本開示は、また、機械で実行されるとき、機械に、上記に説明した本開示に従った方法を行わせる命令を記憶する機械可読媒体(図示しない)も提供する。
【0046】
本明細書が多くの特定の実施態様の詳細を含むが、これらは、任意の実施態様の範囲、または特許請求され得る内容の範囲に制限されるものとして解釈すべきでないが、むしろ、特定の実施態様の特定の実施形態に特有であり得る特徴の説明として解釈すべきである。一定の特徴は、別個の実施形態に関連して説明される本明細書は、また、単一の実施形態で組み合わせて実施できる。逆に、単一の実施形態に関連して説明される様々な特徴は、また、別個に、または任意の適切なサブコンビネーションで複数の実施形態で実施できる。さらには、特徴は、上記に説明した特定の組み合わせで作動し、さらに最初にそのように特許請求され得るが、特許請求された組み合わせからの1つ以上の特徴は、いくつかの場合、その組み合わせから削除でき、特許請求された組み合わせは、サブコンビネーション、またはサブコンビネーションの変形を対象とし得る。
【0047】
当業者に自明である。本技術が進歩するにつれて、本発明の概念は様々な方法で実施できる。上記に説明した実施形態は、本開示を制限するよりもむしろ説明するために与えられ、修正及び変形は、当業者が容易に理解するように本開示の主旨及び範囲から逸脱することなく、使われ得ることを理解されたい。そのような修正及び変形は、本開示及び添付の請求項の範囲内であると考えられる。本開示の保護範囲は、添付の請求項によって定義される。
【手続補正書】
【提出日】2024-11-25
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
コンピュータが機械学習モデルを使用することによって文化的シンボルを特徴付けるための方法であって、
前記コンピュータは、
シンボル単位に関する複数のマテリアルを受信することであって、前記複数のマテリアルは、少なくとも、前記シンボル単位を描写するピクチャー、前記シンボル単位の発音、及び前記シンボル単位の文化的意味を示す画像またはビデオを含み、前記シンボル単位は、単一の文化的シンボル、または複数の文化的シンボルの組み合わせである、受信することと、
前記複数のマテリアルの各マテリアルについて、前記マテリアルを分析及び学習して、前記マテリアルの特徴を抽出し、特徴ベクトルのセットを形成することと、
前記形成された特徴ベクトルの全てをテンソルに結合することと、
前記テンソルを分析及び学習して、前記シンボル単位を特徴付ける概念ベクトルを生成することであって、前記概念ベクトルは前記シンボル単位と直接的に及び一貫して関連付けられる、生成することと、
を実行する、方法。
【請求項2】
前記テンソルは、後で、前記シンボル単位に関する1つ以上のさらなるマテリアルが前記機械学習モデルによって受信され、前記1つまたは2つのマテリアルが前記1つ以上のさらなるマテリアルで見つからない場合、前記機械学習モデルが、前記シンボル単位を描写するピクチャー、前記シンボル単位の発音、及び前記シンボル単位の文化的意味を示す画像またはビデオにおいて、1つまたは2つのマテリアルに各々対応する特徴ベクトルの1つまたは2つのセットを推論することを可能にする、請求項1に記載の方法。
【請求項3】
前記コンピュータは、
さらなるテンソルを形成するために特定の順序で配置された前記概念ベクトル及び1つ以上の概念ベクトルを結合することであって、前記1つ以上の概念ベクトルは、各々、1つ以上の他のシンボル単位を特徴付け、前記機械学習モデルによって生成され、前記特定の順序の前記シンボル単位及び前記1つ以上の他のシンボル単位の配置は、文化的意味を有する文脈を形成する、結合することと、
前記さらなるテンソルを分析及び学習して、さらなる概念ベクトルを生成することであって、前記さらなる概念ベクトルは、前記シンボル単位自体の前記特徴と、前記1つ以上の他のシンボル単位との前記シンボル単位の関連性とを特徴付ける、生成することと、
を実行する、請求項1に記載の方法。
【請求項4】
前記単一の文化的シンボルは、文字記号、数学記号、論理記号、商標、フラグ、または政治的シンボルであり、複数の文化的シンボルの前記組み合わせは、文字用語、省略文字、数学公式、または論理的表現である、請求項1に記載の方法。
【請求項5】
前記複数のマテリアルは、さらに、辞書における前記シンボル単位の前記文化的意味の説明を含む、請求項1に記載の方法。
【請求項6】
前記機械学習モデルは、深層学習モデル、完全オートエンコーダー、不完全オートエンコーダー、及び/または数理統計モデルである、請求項1に記載の方法。
【請求項7】
前記機械学習モデルは、機械学習用の単一のモデルである、または機械学習用の複数のモデルの組み合わせである、請求項1に記載の方法。
【請求項8】
コンピュータに請求項1~7のいずれか1項に記載の方法を行わせる命令を記憶する機械可読媒体。