IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ キンダイ、インコーポレイテッドの特許一覧

特許7105789ネットワーク節点においてソフトウェアエージェントを備えるネットワークを使用した後にネットワーク節点をランク付けする機械学習の方法及び装置
<>
  • 特許-ネットワーク節点においてソフトウェアエージェントを備えるネットワークを使用した後にネットワーク節点をランク付けする機械学習の方法及び装置 図1
  • 特許-ネットワーク節点においてソフトウェアエージェントを備えるネットワークを使用した後にネットワーク節点をランク付けする機械学習の方法及び装置 図2
  • 特許-ネットワーク節点においてソフトウェアエージェントを備えるネットワークを使用した後にネットワーク節点をランク付けする機械学習の方法及び装置 図3
  • 特許-ネットワーク節点においてソフトウェアエージェントを備えるネットワークを使用した後にネットワーク節点をランク付けする機械学習の方法及び装置 図4
  • 特許-ネットワーク節点においてソフトウェアエージェントを備えるネットワークを使用した後にネットワーク節点をランク付けする機械学習の方法及び装置 図5
  • 特許-ネットワーク節点においてソフトウェアエージェントを備えるネットワークを使用した後にネットワーク節点をランク付けする機械学習の方法及び装置 図6
  • 特許-ネットワーク節点においてソフトウェアエージェントを備えるネットワークを使用した後にネットワーク節点をランク付けする機械学習の方法及び装置 図7
  • 特許-ネットワーク節点においてソフトウェアエージェントを備えるネットワークを使用した後にネットワーク節点をランク付けする機械学習の方法及び装置 図8
  • 特許-ネットワーク節点においてソフトウェアエージェントを備えるネットワークを使用した後にネットワーク節点をランク付けする機械学習の方法及び装置 図9
  • 特許-ネットワーク節点においてソフトウェアエージェントを備えるネットワークを使用した後にネットワーク節点をランク付けする機械学習の方法及び装置 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-07-14
(45)【発行日】2022-07-25
(54)【発明の名称】ネットワーク節点においてソフトウェアエージェントを備えるネットワークを使用した後にネットワーク節点をランク付けする機械学習の方法及び装置
(51)【国際特許分類】
   G06F 16/958 20190101AFI20220715BHJP
   G06F 17/16 20060101ALI20220715BHJP
【FI】
G06F16/958
G06F17/16 Z
【請求項の数】 18
(21)【出願番号】P 2019543224
(86)(22)【出願日】2018-02-20
(65)【公表番号】
(43)【公表日】2020-04-09
(86)【国際出願番号】 US2018018833
(87)【国際公開番号】W WO2018152534
(87)【国際公開日】2018-08-23
【審査請求日】2021-02-09
(31)【優先権主張番号】62/460,570
(32)【優先日】2017-02-17
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】517204427
【氏名又は名称】キンダイ、インコーポレイテッド
【氏名又は名称原語表記】KYNDI, INC.
(74)【代理人】
【識別番号】100091982
【弁理士】
【氏名又は名称】永井 浩之
(74)【代理人】
【識別番号】100091487
【弁理士】
【氏名又は名称】中村 行孝
(74)【代理人】
【識別番号】100105153
【弁理士】
【氏名又は名称】朝倉 悟
(74)【代理人】
【識別番号】100107582
【弁理士】
【氏名又は名称】関根 毅
(74)【代理人】
【識別番号】100118843
【弁理士】
【氏名又は名称】赤岡 明
(74)【代理人】
【識別番号】100202429
【弁理士】
【氏名又は名称】石原 信人
(72)【発明者】
【氏名】アルン、マジュムダール
(72)【発明者】
【氏名】ジェームズ、ライアン、ウェルシュ
【審査官】甲斐 哲雄
(56)【参考文献】
【文献】特開2009-140173(JP,A)
【文献】特表2013-536484(JP,A)
【文献】特開2014-115839(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06F 17/00-17/18
(57)【特許請求の範囲】
【請求項1】
ウェブサイトランク付け装置であって、
ェブサイトを含むインターネットに接続され、データ要素を前記ウェブサイトから受信するネットワーク通信インタフェースと、
前記ウェブサイトのデータベースを格納するように構成されるメモリであって、前記データベースがそれぞれの前記ウェブサイト及びそれらから受信する前記データ要素を表す複数の節点を含み、前記複数の節点が前記ウェブサイト間の接続を表現する複数のリンクによってそれぞれ連結される、前記メモリと、
ユーザの入力クエリに従い前記ウェブサイトをランク付けするように構成される処理回路と、
を備え、
前記ウェブサイトの前記ランク付けが、
前記複数のリンクのうちのそれぞれの1つによって連結される前記複数の節点の対の間のワンリンク経路を表す値を含む一次経路行列を決定することと、
前記一次経路行列のべき級数を使用して、代理ランク付け演算子(SRO)を生成すること、
前記入力クエリの状態ベクトルと前記SROとの間の行列積を使用して前記ウェブサイトをランク付けし、前記入力クエリを満たす最良のウェブサイトのレコメンデーションとして前記ランク付けされた節点を前記ユーザへ提供すること、
によって実行される、
前記ウェブサイトランク付け装置。
【請求項2】
ネットワークのデータベースを格納するように構成されるメモリであって、前記データベースがそれぞれのデータ要素を含む複数の節点を含み、前記複数の節点が複数のリンクによってそれぞれ連結される、前記メモリと、
処理回路であって、
前記ネットワークデータベースの前記複数の節点を連結する前記複数のリンクから一次隣接関係を表す値を含む一次経路行列を決定し、
前記一次経路行列のべき級数を使用して、代理ランク付け演算子(SRO)を生成し、
ランク付け基準を表す1つ以上の入力データ要素を受信し、前記入力データ要素の入力状態ベクトルを生成し、
前記SRO及び前記入力状態ベクトルの行列積を使用して前記ネットワークの前記節点をランク付けし、前記1つ以上の入力データ要素に対応するレコメンデーションとして前記ランク付けされた節点をユーザへ提供する、
ように構成される、前記処理回路と、
を備える、レコメンダ装置。
【請求項3】
前記ネットワークは、サイバーセキュリティネットワーク、医療情報ネットワーク、ソーシャルネットワーク、シンボリックネットワーク、意味ネットワーク、ワールドワイドウェブ、ローカルエリアネットワーク、及びウェブネットワークのうちの1つである、請求項2に記載の装置。
【請求項4】
前記処理回路は、
前記一次経路行列を固有値及び固有ベクトルに分解し、前記固有値の対角行列、前記固有ベクトルを列ベクトルとして含むユニタリ行列、及び前記ユニタリ行列のエルミート共役を生成すること、
前記固有値の前記対角行列のn乗を取り、左辺に前記ユニタリ行列を乗算し、右辺に前記ユニタリ行列の前記エルミート共役を乗算することによって、n次経路行列を前記一次経路行列の前記n乗として生成すること、
べき級数を使用して、前記n次経路行列を合計すること、
によって前記SROを生成するように構成される、請求項2に記載の装置。
【請求項5】
前記処理回路は、前記べき級数において、
前記複数のリンクが順序付けされるときに、前記べき級数における各n次経路行列がn乗される2によって除算され、
前記複数のリンクが順序付けされないときに、前記べき級数における各n次経路行列がnの階乗によって除算される、
ように、前記べき級数を合計することによって前記SROを生成するように構成される、請求項4に記載の装置。
【請求項6】
前記処理回路は、前記一次経路行列を前記固有値に分解することによって、前記SROを生成するように構成され、前記固有値は、前記一次経路行列のスペクトルを表す、請求項4に記載の装置。
【請求項7】
前記処理回路は、
前記一次経路行列の行列式を使用して前記一次経路行列を正規化すること、
前記一次経路行列が二重確率行列条件を満たすことを保証すること、
によって、前記SROを生成する前に、前記一次経路行列を修正するようにさらに構成され、
前記SROは、前記修正された一次経路行列を使用し、前記一次経路行列の前記べき級数を計算して生成される、
請求項2に記載の装置。
【請求項8】
前記処理回路は、
前記複数のリンクが無向であることを表すときに、実数である前記一次経路行列の要素と、
前記複数のリンクが単一指向性であるときに、二重ベクトル及び複素数のうちの1つである前記一次経路行列の前記要素と、
前記複数のリンクが双方向性であるときに、テッサリン、双複素数、及び分解型複素数のうちの1つである前記一次経路行列の前記要素と、
前記複数のリンクが混在しているときに、多重ベクトルである前記一次経路行列の前記要素と、
を使用して、前記一次経路行列を決定するように構成される、請求項2に記載の装置。
【請求項9】
前記処理回路は、
前記複数のリンクが前記ネットワークの節点対間の相関性を表すときに、実数である前記一次経路行列の要素と、
前記複数のリンクが前記ネットワークの節点対間の関係を表すときに、二重ベクトル及び複素数のうちの1つである前記一次経路行列の前記要素と、
前記複数のリンクが前記ネットワークの節点対間の方向を表すときに、テッサリン、双複素数、及び分解型複素数のうちの1つである前記一次経路行列の前記要素と、
前記複数のリンクが前記ネットワークの節点対間の姿勢関係を表すときに、多重ベクトルである前記一次経路行列の前記要素と、
を使用して、前記一次経路行列を決定するように構成される、請求項2に記載の装置。
【請求項10】
前記処理回路は、前記固有値の前記対角行列を生成する前に、前記固有値における縮退を解消することによって前記SROを生成するように構成される、請求項4に記載の前記装置。
【請求項11】
前記処理回路は、前記べき級数を使用してn次経路行列を合計する前に、前記n次経路行列における経路冗長性を除去することによって調整される経路である前記SROを生成するように構成される、請求項2に記載の装置。
【請求項12】
前記処理回路は、メタデータを使用して前記SROを拡張させる前記ネットワークの前記節点をランク付けするように構成される、請求項2に記載の装置。
【請求項13】
前記処理回路は、前記SROと共に個別化された選好行列を使用してユーザの個人的選好に従い前記ランク付けを個別化する、前記ネットワークの前記節点をランク付けするように構成される、請求項2に記載の装置。
【請求項14】
前記処理回路は、前記一次経路行列を決定するように構成され、
前記一次経路行列は、ハミルトニアン演算子、及び、ラプラシアン演算子のうちの1つである量子グラフ理論の演算子に基づく、請求項2に記載の装置。
【請求項15】
データベースをランク付けすることによって前記データベースの節点を推奨する方法であって、
非一時的なコンピュータ可読媒体において、ネットワークのデータベースを格納することであって、前記データベースがそれぞれのデータ要素を含む複数の節点を含み、前記複数の節点が複数のリンクによってそれぞれ連結される、前記格納すること、
処理回路を使用して、前記ネットワークデータベースの前記複数の節点を連結する前記複数のリンクから一次隣接関係を表す値を含む一次経路行列を決定すること、
前記処理回路を使用して、前記一次経路行列のべき級数を使用する代理ランク付け演算子(SRO)を生成すること、
ランク付け基準を表す1つ以上の入力データ要素を受信し、前記入力データ要素の入力状態ベクトルを生成すること、
前記処理回路を使用して、前記SRO及び前記入力状態ベクトルの行列積を使用する前記ネットワークの前記節点をランク付けし、前記1つ以上の入力データ要素に対応するレコメンデーションとして前記ランク付けされた節点をユーザへ提供すること、
を備える、前記方法。
【請求項16】
前記SROの前記生成は、
前記一次経路行列を固有値及び固有ベクトルに分解し、前記固有値の対角行列、前記固有ベクトルを列ベクトルとして含むユニタリ行列、及び前記ユニタリ行列のエルミート共役を生成すること、
前記固有値の前記対角行列のn乗を取り、左辺に前記ユニタリ行列を乗算し、右辺に前記ユニタリ行列の前記エルミート共役を乗算することによって、n次経路行列を前記一次経路行列の前記n乗として生成すること、
べき級数を使用して、前記n次経路行列を合計すること、
をさらに備える、請求項15に記載の前記方法。
【請求項17】
前記べき級数の前記合計は、前記べき級数において、
前記複数のリンクが順序付けされるときに、前記べき級数における各n次経路行列がn乗される2によって除算され、
前記複数のリンクが順序付けされないときに、前記べき級数における各n次経路行列がnの階乗によって除算される、
ように実行される、請求項16に記載の前記方法。
【請求項18】
実行可能なインストラクションを格納する非一時的なコンピュータ可読媒体であって、
前記インストラクションは、処理回路によって実行されるときに、前記データベースをランク付けすることによって前記データベースの節点を推奨する請求項15に従う前記方法を前記処理回路に実行させる、
前記非一時的なコンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
関連文書の相互参照
本出願は、2017年2月17日に出願された米国仮出願第62/460,570号に基づき、この優先権の利益を主張し、その全内容が参照により本明細書に援用される。
【0002】
本明細書に記載される例示的な実施形態は、受信したランク付け基準に従いネットワーク節点をランク付けするときに、ネットワーク情報を迅速に適用することに関し、さらに特に、代理ランク付け演算子である行列によってこのランク付け基準を表す状態ベクトルを乗算することによって、ネットワーク節点をランク付けすることに関する。さらに、本明細書に記載される例示的な実施形態は、インタラクティブネットワークにおけるパターンを学習し、学習されたパターンを迅速に適用して問い合わせに答えることに関し、さらに特に、代理ランク付け演算子である行列によってランク付け基準を表す状態ベクトルを乗算することによって、ネットワークの節点をランク付けすることに関する。
【背景技術】
【0003】
コンピュータ関連技術における多くの技術的な問題は、相互接続されたネットワークの節点に提供される情報を適用して、特定セットの基準及び/またはユーザ入力に従い節点をランク付けする問題を本質的に軽減させる。
【0004】
たとえば、Netflix.com(商標)は、デジタルメディアコンテンツ(すなわち、映画)のネットワークとみなされることが可能であり、以前に見た映画のユーザの評価、及び見た映画の記録に基づき、ユーザが将来見るために選好する可能性が高い映画についてレコメンデーションを提供することが可能である。このレコメンデーションは、それらの類似度を表す映画間の連結のネットワークに基づき得、または経時的に累積された他のユーザの評価及び視聴傾向の相関及び統計情報からのベイズ推定に基づき得る。したがって、Netflix.com(商標)または他のオンラインメディアコンテンツプロバイダーにより提供される映画レコメンデーションのようなレコメンダシステムは、基準及び/またはユーザ入力の特定のセットを本質的に使用して、節点間の相互連結に基づき節点のランク付けを提供すると理解され得る。
【0005】
同様に、ワールドワイドウェブは、相互連結された節点のネットワーク(すなわち、ハイパーリンクにより相互接続されるインターネットページ/サイト、関連コンテンツなど)として明らかに理解されることが可能である。さらに、Google’s(商標)PageRankアルゴリズムなどの、検索エンジン及びアルゴリズムは、ユーザ入力(たとえば、テキストとして検索入力に入力されるキーワード)を使用して、それらの相対的重要度(たとえば、ネットワーク内の節点間の相互連結に基づく)と、またネットワーク節点のコンテンツへの検索基準(たとえば、テキスト検索におけるキーワード)の連結とのそれらの両方に従い、このネットワークの節点をランク付けすると理解されることが可能である。
【0006】
技術が進歩するにつれ、相互接続されたネットワークに基づきデータをランク付けする技術的な問題を解決するこのパターンは、医療(たとえば、症状、処置、及び転帰における類似度などによって、接続される関連した医療記録のネットワークを使用して、現在の病歴に類似した症例をランク付けする、または有利な転帰を達成する可能性が高い手順をランク付けする)から、ソーシャルネットワークへの、消費者広告への、セキュリティ及び消費者詐欺の脅威への、交通/GPSナビゲーションシステムなどへのさまざまなコンテキストにおいて繰り返される。したがって、この技術的な問題は、コンピュータ関連技術の根源である、重要かつ繰り返し起こる問題である。その有意性を考慮して、この技術的な問題は、さまざまな手法を用いて対処されており、一般に、(i)検索基準の所与のセット、及び(ii)ネットワークの構造/相互接続、に基づいてネットワーク要素を順序付ける根本的な技術的課題への1つの解決策は、ネットワークに基づくランク付けのすべての同様に提起されたアプリケーション間で基本的、かつ普遍的に適用可能である。たとえば、生化学的にPageRankアルゴリズムを適用して、相対的重要度の尺度を提供し、タンパク質中の見込みのある薬物標的を特定することが可能であると提唱されてきた。ランク付けネットワーク/グラフ節点がこのような共通で繰り返し起こる技術的な問題であるため、改善された、より高速な方法は、ネットワーク情報からランク付けを生成するために望ましい。
【0007】
たとえば、PageRankアルゴリズムなどの従来のリンク分析アルゴリズムは、ワールドワイドウェブなどのドキュメントのハイパーリンクされたセット内のその相対的重要度を測定する目的で、このハイパーリンクされたセットの各要素へ数値重み付けを割り当てることが可能である。一般に、このアルゴリズムは、たとえば、相互引用及び参照を含む、接続の基礎を形成するコンテンツを含むいずれかの節点集合体に適用されることができる。数値重み付けをいずれかの所与の節点にこれらの連結に基づき割り当てる。さらに、ランクは、メタデータ、及び通信されたコンテンツに埋め込まれた属性に対応するネットワークの複数のレベルによって、影響を与えられ得る(たとえば、著者は著者ら及びそれらの相互接続のネットワークに従いランク付けされ得、学者らは相互接続及び引用のネットワークに従いランク付けされることが可能である)。
【0008】
たとえば、PageRankアルゴリズムにおいて、要素Eに割り当てられる数値重み付けは、その全体が参照により本明細書に援用される、S.Brin and L.Page,“The anatomy of a large-scale hypertextual Web search engine”,Computer Networks and ISDN Systems.30:107-117(1998)に記載され、EのPageRankと称される。特に、PageRankは、オーソリティハブを考慮する、節点としてのすべてのワールドワイドウェブページ、及び辺としてのハイパーリンクによって作成されるウェブグラフに基づく数学的アルゴリズムに起因する。ランク値は、特定のページの重要度を示す。ページへのハイパーリンクは、支持投票として計数する。ページのPageRankは、再帰的に定義され、それにリンクするすべてのページ(すなわち、着信リンク)の数及びPageRankメトリックに依存する。したがって、高いPageRankを有する多くのページによってリンクされるページは、高いランク自体を受信する。ネットワークを介するこのような再帰的歩行への不利な点は、それが必要とする時間及び計算リソースである。したがって、より高速なランク付け方法がネットワークに対して望ましく、それは、さらに一般的に口語的にネットワークと称されるデータ構造についてのより厳密な数学用語である。
【0009】
さらに、多くの場合、ネットワーク/グラフ表現は、先験的に知られておらず、実証に基づいた測定値及びデータから代替に学習されなければならない。トレーニングデータに基づきパターンを学習する、人工ニューラルネットワーク(ANN)及びその他のものなどの、さまざまな従来の方法は、既知である。しかしながら、これらの従来の方法は、さまざまな不利な点を有する。したがって、より高速で、さらにロバストな手法を適用し、ネットワーク及びパターンを効率的に学習してモデル化する、ネットワーク及びパターン学習のより良い方法が、望まれる。
【0010】
本明細書に提供される背景の説明は、本開示の文脈を一般的に提示する目的のためのものである。出願時に従来技術として本来であればみなされていない可能性がある説明の態様と同様に、この研究がこの背景技術のセクションに記載される範囲への、名前を挙げられている本発明者らの研究は、本開示に対する従来技術として明示的にも、黙示的にも認められない。
【0011】
機械学習及び人工知能(AI)の科学技術は、多くの異なる問題及び科学技術に適用されているが、従来の手法は、それらの効果を限定するいくつかの不利な点を有する。AI科学技術の大きな強みは、知能のほとんどあらゆる態様のそのカバレッジであるが、その大きな弱点は、フラグメント化である。ほとんどのAIシステムは、1つのパラダイムから設計され、構築される。たとえば、ほとんどの周知のAIパラダイムは今日、深層学習、機械学習のサブセットであり、それ自体がAIのサブセットである。深層学習パラダイムにおいて、多層人工ニューラルネットワーク(「ANN」)は、最も一般的に使用された方法であり、誤差逆伝播法は、最も一般的なANN学習方法である。誤差逆伝播法は、重み付き行列によって画定される空間中の誤差表面上に勾配降下を組み込む。すなわち、それは、損失関数の勾配を計算する。したがって、深層学習は、ロジックなどの、他のAIパラダイムと組み合わされることを簡単に受け入れられない。また同一のことは、他の機械学習方法について言われることが可能である。すなわち、それらを組み合わせることが特別な考慮を必要とするように、それらは、フラグメント化されるため、ロバストではないことが多い。
【0012】
さらに、機械学習方法は、微妙なクラス分け及び予測に良いが、それらは、コンテキストの能力及び最小限の推論能力を欠く。反対に、シンボリック方法は、定義された問題にわたる推論に良いが、学習能力を有さず、不確実性を取り扱う能力に乏しい。これらの手法が組み合わされることが可能である場合、一方のパラダイムの長所は、他方の不足を補うことができ、逆もまた同様である。しかしながら、複数のパラダイムを組み合わせようと努めるいかなるシステムも、コンポーネントを調整し、それらを共に機能させ、多くの組み合わせを所望の出力においてテストするために、かなりの専門的な労力を必要とする。それでも、結果は、変化に対してロバストではない可能性がある。
【0013】
残念ながら、従来の方法は、上記の課題に対してロバストな解決策を提供することができない。
【0014】
開示された本発明、及びそれらの多くの付随する利点のより完全な理解は、同一のことが添付の図面に関連して考慮されるときに、以下の詳細な説明を参照することによって、さらに良く理解されるようになるにつれ、容易に得られる。
【図面の簡単な説明】
【0015】
図1】1つの実施態様に従い、入力ランク付け基準に基づきネットワークをランク付けする方法の流れ図の実施例を示す。
図2】1つの実施態様に従い、重み付き辺/リンクによって接続されるネットワークの概念の実施例を示す。
図3】1つの実施態様に従い、代理ランク付け演算子(SRO)を生成するプロセスの流れ図の実施例を示す。
図4】1つの実施態様に従い、入力ランク付け基準に基づきネットワーク節点をランク付けする方法の概略図の実施例を示す。
図5】1つの実施態様に従い、入力ランク付け基準に基づきネットワーク節点をランク付けする方法の流れ図の別の実施例を示す。
図6】1つの実施態様に従い、双方向リンクを表す双複素数を使用する実施例を示す。
図7】入力ランク付け基準に基づきネットワーク節点をランク付けする方法を実装するコンピューティングハードウェアの実施例を示す。
図8】1つの実施態様に従い、ソフトウェアエージェントのネットワークの実施例を示す。
図9】1つの実施態様に従い、ネットワークにおけるエージェント学習方法の流れ図の実施例を示す。
図10】1つの実施態様に従い、選好関数、目的関数、及び効用関数を使用する仮説を生成し、改訂するエージェントのプロセスの流れ図の実施例を示す。
【発明を実施するための形態】
【0016】
本明細書に記載される、これらの方法及び装置は、ネットワーク節点を通過する複数の再帰的なステップを使用してネットワーク節点(グラフとも称される)をランク付けする、従来の方法における上記に考察されている不具合を克服する。従来の方法と対照的に、本明細書に記載される、これらの方法は、単一の操作ステップにおいてネットワークからの結果をランク付けする代理ランク付け演算子(SRO)を生成するために、量子力学、及び場の量子論への洞察及び類推から描画する。伝播演算子がすべての可能な状態にわたる総和/積分とみなされる、Richard Feynmanの場の量子論への変分法の手法に類似して、SROは、単一の演算子において、グラフ/ネットワークにおけるすべての経路にわたる総和を表すことにより、SROと、入力クエリ(たとえば、検索基準)を表すベクトルとの間の行列乗法に基づきグラフ/ネットワーク節点のランク付けを出力することが可能である行列である。
【0017】
たとえば、本明細書に記載される、これらの方法のある特定の実施態様において、SROは、内部歩行履歴(真のマルコフ過程と対照的に)を入力概念ベクトルへの単一のアプリケーションによってエミュレートする、nステップ再帰的歩行を近似する閉形式解として定式化される。ここで、概念のネットワークは、非限定的な実施例として使用されており、節点に埋め込まれるこれらの概念は、出力(すなわち、最終的な量子状態、または概念のランク付け)に発展する途中で、量子力学における粒子/確率波動関数(すなわち、入力概念または検索基準)が通過する、離散空間における点へ類推される。換言すれば、粒子が1つの節点からつぎの節点へ移動する場合に粒子の計算のn再帰的ステップを計算する代替に、前の頂点の寄与(典型的なベイジアンネットワークのような)を考慮することにより、この演算子は、単一の繰り返しステップにおけるランク付け結果へ直接に粒子(すなわち、入力概念)を発展させる「ジャンプ」をもたらす。
【0018】
ある特定の実施態様において、この発展は、一次経路行列をべき乗して、SROを生成することによって表され、一次経路行列は、正規化及び二重確率行列(bistochasticity)の条件に従わねばならない。
【0019】
ある特定の実施態様において、またSROは、経路冗長性を除去するように調整される経路である。
【0020】
最初に、一次経路行列からSROを生成する方法についての説明を提供する。つぎに、説明は、SROが比較する方法について提供され、ポテンシャル自由空間における量子力学のハイゼンベルク描像における発展演算子(または場の量子論における分配関数)に類似した多くの方式である。
【0021】
ここで図面を参照して、同様の参照番号は、いくつかの図全体を通して同一の、または対応する部分を指定し、図1は、グラフモデルを生成して使用し、グラフ情報についての照会を実行して迅速に出力を生成する方法100の流れ図を示す。
【0022】
方法100のプロセス110において、グラフモデル112を生成する。いくつかの事例において、グラフモデル112は、インターネットウェブサイト及びそれらのリンクの事例のように、すでに存在する。この事例において、グラフモデル112は、そのソースから、または以前に格納されているコンピュータ可読メモリ中の位置から、簡単に読み出される。他の事例において、このモデルは、たとえば、機械学習方法を使用して、トレーニングデータから学習される。
【0023】
方法100のプロセス120において、SROをグラフモデル112の一次経路行列122から生成する。一次経路行列122は、異なる表現を取ることが可能である。たとえば、下記に考察されるように、頂点間の連結は、グラフ中の頂点間の辺が重み付けされる、指向性などであるかどうかに依存する、正数、実数、複素数、または双複素数として表現されることが可能である。ここで、頂点を連結する重み付き辺の非限定的な実施例を使用して、一次経路行列を例示する。一次経路行列は、頂点間の連結をグラフ中に表現する。たとえば、図2は、単語(すなわち、概念)のネットワークの実施例、及び重み付き辺として表現されるネットワーク/グラフの節点/頂点間の連結の強さを示す。図2に示されるネットワークは、さまざまな節点間の関係を表現する古典的な人工知能(AI)テキストに見出される典型的なネットワークである。一般に、いずれかのネットワークは、各行(列)がそれぞれの節点/頂点を表現する行列によって表現されることが可能である。辺が重み付けされないときに、非重み付き隣接行列のいくつかの変形形態は、当業者によって理解されるように、そしてその全体が参照により本明細書に援用される、米国特許第9,158,847号に記載されるように、使用されることが可能である。頂点間に重み付き辺を含む、図2に示されるネットワークについて、このネットワークは、表1に示される、一次経路行列(T)と称される行列によって表現されることが可能である。表1において概念ベクトルは、
によって与えられ、概念の頂点間の重み付きリンクの定義は、
によって与えられる。一次経路行列からSROを生成するプロセスの1つの実施態様のフローチャートは、図3に示され、以下に記載される。
表1:図1に示されるネットワークの一次経路行列(T)
【0024】
方法100のプロセス130において、SROは、グラフにおける頂点のコンテンツのランク付けとして、ネットワークモデルにおける情報についての照会を表現する入力ベクトルに適用され、この照会への回答を表現する出力ベクトルを生成する。以下の考察についての「ネットワーク」及び「グラフ」と同じように、「頂点」及び「節点」を互換的に使用することが可能であることに留意する。したがって、以降本明細書において、用語「頂点」及び「グラフ」のみを使用する表記法を採用する。
【0025】
グラフモデル112の図2における実施例に戻り、方法100の1つの例示的な実施態様において、<bird,flight>のランク付け基準に従い、グラフにおける概念をランク付けする(すなわち、この概念基準は概念ベクトル[0,1,0,1,0,0,0,0]によって表現される)照会は、ランク付け基準についての概念ベクトルをSROによって乗算するときに、以下の結果を返す。
概念の右側の数字は、ランク付け基準にマッチングする尺度を表す。当然のことながら、‘bird’及び‘flight’の概念は、‘wing’及び‘seagull’のように‘bird’及び‘flight’に強連結される概念である場合、上位にランク付けされる。同様に、<penguin>のランク付け基準に基づき照会をランク付けすることは、
のランク付けを返す。さらに、<bird>のランク付け基準に基づくランク付き照会は、
のランク付けを返す。
【0026】
図3は、プロセス120の1つの実施態様の流れ図を示し、図4は、方法100の実施態様の概略図を示す。
【0027】
【0028】
【0029】
ある特定の実施態様において、SROは、節点/頂点が順序付けされていないネットワーク/グラフについての式、
として計算される。また、ネットワーク/グラフが任意の置換を有するときに、この式を使用して、SROを計算することが可能である。
【0030】
ある特定の実施態様において、SROは、節点/頂点が順序付けされるネットワーク/グラフについての式、
として計算される。また、ネットワーク/グラフがバイナリシステムであるときに、この式を使用して、SROを計算する。
【0031】
上記に考察される行列正規化が行列の行列式を計算するステップ、及び計算された行列式によって行列の各要素を除算するステップを備える。さらに、行列正規化は、行列の各行についてのベクトルのノルムを計算することを備えることが可能である。さらに、二重確率行列(bio-stochasticity)条件を課すことは、正規化されたベクトルが二重確率行列の条件を満たすことを検証するために実行される検証プロセスを備えることが可能である。具体的に、各行の要素の総和、及び各列の合計が1であるということを保証する。これらのプロセスは、当業者により理解され、変形形態は、当業者により理解されるように、本発明の趣旨から逸脱することなく実装されることが可能である。
【0032】
たとえば、ある特定の実施態様において、プロセス120は、縮退を検出する(たとえば、1つ以上の固有値が他の固有値と比較して本質的にゼロであるときに)ために固有分解によって、そして縮退を解消する、または解くために変更するデータ要素によって、提供されるフィードバックを使用することを備えることが可能である。
【0033】
さらに、ある特定の実施態様において、プロセス120は、経路調整されたSROを返すステップを備えることが可能である。たとえば、冗長経路消去機能は、以下のように適用されることが可能である。
1)それ自体の近傍であるデータはネットワーク内の同一位置中の2つの同一データ要素間の経路である。その結果、1.0に対角値を設定し、データがそれ自体の近傍である自己経路を消去する。
2)Tのすべての非ゼロ値は1に設定され、対角値は1.0に設定され、一次経路行列T1をもたらす。
3)行列T1を2乗して(Square)(2乗して(raising to second power))二次経路行列T2を得る。
4)この時点で、a-c-aなどのいくつかの冗長経路が存在することが可能である。
5)冗長性を除去するために、行列の2乗における経路消去は対角を1.0に設定することによって達成されることが可能である。これは、経路a-b-cにおいて、「a」が「c」に等しくないということを保証するため、a-c-aのような経路を2回計数しない。
6)行列T1を3乗して三次経路行列T3を得る。
2乗の事例に類似して、冗長経路があることが可能である。データ要素(a)と(b)との間の三次経路に(c)及び(d)を経由させる。したがって、三次経路行列における3つの一次経路は、a及びc、c及びd、d及bであることが可能である。最初に、c及びdがaまたはbのいずれかと同一ではないということを保証する。対角要素を1.0に設定することによって一次経路消去を保証し、それがそのa≠c、及びそのd≠bを保証することに留意する。経路は、三次行列のべきにおける経路消去は、一意性を保証するために我々がa-b-c-b及びa-b-a-cパターンを消去したい、a-b-c-dなどの経路について、同様のプロセスに従う。これを行うために、我々は、元の行列T0(たとえば、隣接行列)である、ゼロ次経路行列を使用する。T0の各行について、我々は、要素の総和を計算し、行コストの列ベクトルC(また経路が双方向であるため、これは要素の列総和の行ベクトルに等しい)を生成する。
7)経路冗長行列(同値経路の)は三次経路行列から減算される経路割引行列として書き込まれる。経路割引行列は、式、
i,j=C+C-1;i≠jについて、
i,j=0;i=jについて、
を使用して、その要素i、jのそれぞれについて計算される。式中、列ベクトルの要素は、C=3、C=2、C=2、C=3である。したがって(最初の行のみについての計算を示す)、
1,1=0
1,2=C+C-1=3+2-1=4
1,3=C+C-1=3+2-1=4
1,4=C+C-1=3+3-1=5。
充足行列は、比較される:
8)冗長経路を消去することによって三次経路行列を補正するために、我々は、T3を以下のように変換し、
T3=T3-DT、
式中、記号「」は、各i=i’及びj=j’についての、Di,j i’,j’の要素積によるスカラー要素である。
つぎに、SROは、上述されるように行列Tのべきを使用して計算される。
【0034】
プロセス130のステップ310において、入力ベクトルを作成し、ゼロをこのベクトルの各データ要素に埋める。つぎに、ランク付け基準におけるデータ要素が元の行列Tからのプロパティを有する場合、0から1の値を対応する指数におけるベクトルの要素について設定する。代替に、グラフ/ネットワークに使用される元のものではないランク付け基準における要素について、グラフ/ネットワークにおける要素への類似度の尺度を使用して、この要素を入力ベクトル中の1つ以上の指数上にマッピングすることが可能である。たとえば、この尺度は、Jaccard尺度または他の尺度系であることが可能である。概念<eagle>を含む検索基準を考慮して、つぎに、正の自己相互情報量(PMMI)などの意味的距離尺度は、参照によりその全体が本明細書に援用される、P.D.Turney and P.Pantel,“From Frequency to Meaning:Vector Space Models of Semantics”,Journal of Artificial Intelligence Research37,141-181(2010)に記載され、そして、参照によりその全体が本明細書に援用される、D.Jurafsky and J.H.Martin“Speech and Language Processing”Prentice Hall Series in Artificial Intelligence(2008)に記載されている。また、意味論的意味において近接を特徴付けるために使用されるこの尺度は、参照により本明細書に援用される、米国特許第8,566,321号に記載されており、いずれかの尺度であることができる。たとえば、概念<eagle>は、概念<bird>上に主に、それには及ばないものの<feather>及び<flight>の概念にマッピングすることができる。
【0035】
つぎに、プロセス130のステップ320において、SROは、ドット積を使用して入力ベクトルにSROを乗算するために適用される。この結果は、グラフにおいて対応する要素/頂点についての各指数に値を提供する出力ベクトルである。ランク付けされたリストは、<bird,flight>及び<penguin>の基準を使用してランク付けするクエリについて上記に示されるように、出力ベクトルの対応する値の番号順に従い、グラフの要素(たとえば、概念)を配列することによって生成される。
【0036】
図5は、別の実施態様に従う方法100の別の流れ図を示す。
【0037】
ステップ510において、概念及びリンクの入力グラフを生成する。ある特定の実施態様において、グラフの各リンクは、一対の概念間の指向性確率的尺度に対応する。
【0038】
ステップ520において、入力グラフに基づく経路行列を入力グラフから生成する。
【0039】
ステップ530において、さまざまな課せられた条件を満たすように経路行列を処理する。たとえば、ある特定の実施態様において、この処理は、経路行列を正規化し、二重確率行列条件を満たすかどうかを判定し、そうでない場合に、行(列)の値を調整して確立性(bistochasticity)を保証するように処理を実行することが可能である。
【0040】
ステップ540において、固有分解を計算して、正規化された行列についての固有値及び固有ベクトルを生成する。
【0041】
ステップ550において、固有値の対角行列を生成し、経路べき乗の行列を生成し、その中でn経路べき乗の行列は、それぞれ経路nリンクを表現する。
【0042】
ステップ560において、代理ランク付け演算子(または経路調整された代理ランク付け演算子)を計算する。
【0043】
方法100の変形形態は、当業者に理解されるような、方法の趣旨から逸脱することなく実装されることが可能である。
【0044】
ある特定の実施態様において、SROは、拡張した代理ランク付け演算子であることが可能である。たとえば、データ項目をラベル付けするための外部メタデータがある場合、データとのメタデータ関係を含む追加の行及び列を一次経路行列(たとえば、ワールドワイドウェブなどのネットワークのコンテキストにおける著者ネットワーク及びランク)に加えることが可能である。つぎにプロセスは、以前のように進行する。このステップを使用して、行列を拡張させる、または個別化することが可能である。
【0045】
ある特定の実施態様において、SROは、偏った代理ランク付け演算子であることが可能である。たとえば、SROを選好行列によって操作することが可能である。これは、ランク付けにわたり個別化された選好を提供し、これらの選好は、ユーザごとの基準で計算される。これは、個別化された指数付け及び検索を可能にする。たとえば、選好行列は、べき級数を計算してSROを生成する前に、べき乗行列を計算するプロセスにおいて挿入される行列として導入されることが可能である。ある特定の実施態様において、SROを生成するために使用される母集団と比較して、個人的な選好行列は、学習され、ランク付け基準を表現する状態ベクトルに適用されることが可能である、またはそれを計算した後に、SROへ直接に適用されることが可能である。
【0046】
上記に考察されるように、ネットワーク節点を相関させることが可能である異なる方法がある。図2において、節点は、重み付き辺によって関連する。しかしながら、他のネットワークにおいて、節点は、重み付きなしで辺によって単純に連結されることができる、またはさらに複雑な状況において、これらの辺は、有向であることが可能である。さらに他のネットワーク/グラフにおいて、連結/辺は、類似度(similarity)または類似性(affinity)/類似の(like)の表現を有することが可能であり、辺の符号として表現されることができる。その結果、異なるタイプの一次経路行列を使用して、これらの異なるタイプのネットワーク/グラフにおける関係を表現することが可能であり、したがって、異なるタイプのSROは、これらの異なるタイプの一次経路行列に起因する。それにもかかわらず、他のデータタイプへの上述される方法100ならびにプロセス110、120、及び130の一般論は、当業者によって理解されるように、わかりやすく、本発明の趣旨から逸脱していない。ネットワーク節点間のリンクのタイプのいくつかは、一次経路行列及びSRO、ならびにリンクタイプが伝える意味論においてそれらを表現するために使用される数字/データ構造のタイプと共に表2に列挙される。その結果、代理ランク付け演算子は、表2に示されるような、いくつかの別個の意味論タイプとなる。
【0047】
分解型複素数は、1848年にJames Cockleに導入され、それらは、テッサリンの特殊な事例であるため、実テッサリンと称された。双複素数は、環を形成し、実数のような体ではない。分解型複素数は、たとえば、1873年にWilliam Cliffordによって、四元数などの数系と共に研究されていることが多い。分解型複素数は、それらが双曲線の角度を表現することが可能であるため、双複素数または双曲線複素数とも称される。しかしながら、図6に示されるように、向き付けが選好において同義性対反意性、または類似度対非類似度、または同類対非同類のように符号化されることが可能である解釈である。
【0048】
【0049】
上記の類似度を考慮して、量子力学及び場の量子論の理論的装置のいくつかを利用して、SROを生成し、適用することが可能である。その結果、グラフ理論だけではなく、量子グラフ理論も、所与のランク付け基準に基づき頂点を迅速にランク付けする問題に適用されることが可能である。すなわち、SROは、グラフ理論の基礎に根ざした概念を表現し、これらの概念がグラフ理論から量子グラフ理論へ拡張されることが可能であることを表現する。
【0050】
本明細書に記載される、これらの方法のある特定の実施態様は、対応する重み付き有向グラフと関連する組み合わせの、及び符号なしのラプラシアン行列の両方のグラフの密度行列(固有要素と同様に)を、グラフが無閉路または閉路であることが可能である複素辺重み付きと関連付ける、意味論及び挙動特性について一般的な手法をネットワーク理論へ使用する。
【0051】
量子グラフ理論のツールを利用する1つの利点は、グラフ理論に引き継ぎ、ネットワークの節点を再帰的に横切る計算集約型の複数ステッププロセスを本来であれば必要とする、SROが単一ステップで実行することを可能にする、経歴総和法を使用して量子論がRichard Feynmanによって定式化されていることである。
【0052】
たとえば、グラフ理論への1つの手法(すなわち、https://www3.nd.edu/~pmnev/graphQM.pdfにおいて利用可能であり、その全体が参照により本明細書に援用される、P.Mnev,“Quantum mechanics on graphs,”MPIM Jahrbuch2016に記載されるような量子グラフ理論)において、グラフのモジュール性を使用して、ファインマン経路積分の離散化を計算する。これらの経路積分結果は、グラフのタイプの位相不変量特性を有する経路の計数を提供する。これは、インターネット-ネットワーク、ソーシャルネットワーク、及び言語(意味)ネットワークなどのネットワークにおける情報の伝播モデル、複雑性尺度、ならびに潜在的に材料科学パラメータ化にも適用することが可能である。
【0053】
【0054】
【0055】
また、上記に考察されるように、ある特定の実施態様において、冗長性を除去することは、生成するために重要であることが可能である。たとえば、1つの節点からいくつかの他の節点への経路:p→sは、冗長性を有することが可能である。連鎖:p→q、q→r、r→sがあると仮定する。したがって、隣接演算子Aを取り、経路Xは、
である。したがって、整数の列挙N={1,2,...,n}、及び経路集合X={p,q,r,s}について、経路集合は、集合N中のpからsへの離散経路としてみられることが可能である。上記に考察されるように、経路集合内に、冗長性がある可能性があるが、これらは、上述される方法を考慮して使用し、克服することが可能である。すなわち、ある特定の実施態様において、その全体が参照により本明細書に援用される、C.Yu“Super-Walk Formulae for Even and Odd Laplacians in Finite Graphs,”Rose-Hulman Undergraduate Mathematics Journal,Volume18,No.1,Spring2017に記載され、AROを調整される経路を使用して、一次経路行列のべきの行列係数が項(いくつかの列指数からいくつかの行指数への各経路についての1項)の総和に等しく、そして複数の項が同一経路に対応するときに二重計数寄与がないため冗長性を説明することが可能であるという事実を説明する。
【0056】
【0057】
初期状態(たとえば、ランク付け基準を表現する入力ベクトル)を与えられている、状態の発展は、分配関数を使用して計算可能であり、この分配関数は、発展演算子の役割を果たし、グラフラプラシアンは、発展演算子の基礎を順に形成する。
【0058】
QFTにおけるシステムの発展は、分配関数Z(M)によって決定され、そこでMは、体の空間をモデル化する多様体である(我々の場合、体の観点からみられる我々のグラフ)。その挙動は、ネットワーク自体の組み合わせに依存する。さらに、このグラフに関連付けられる分配関数は、指数関数であり、指数関数の引数は、所望の結果/照会に従い選択される。たとえば、ランク付けについての照会のために、隣接演算子は、引数として使用される(たとえば、一次経路行列T)。他方で、情報の伝播についての照会のために、または情報の伝播のために、指数関数における引数は、虚数を乗算されるラプラシアン演算子であることが可能である。これらの演算子のスペクトルを分析することによって、ランク付けまたは伝播の問題に対して明示的な解決策を生じる。さらに、チャート及びアトラスの点から分配関数をキャストする際に、Z(M)の貼り付け特性を特徴とするため、2つのネットワークをマージする(情報融合において、データベースウェアハウジング、相互運用性及び多くの他の挙動として)ときに定量的な特徴を提供することが可能である。
【0059】
SROを使用して、本明細書に記載されるように、ネットワークのランク付けを実行するためには、従来の方法を越えるいくつかの利点を有する。たとえば、本明細書に記載される、これらの方法は、ネットワーク(たとえば、これらの方法が適用されることが可能であるネットワークはサイバーセキュリティ、医療情報、ソーシャル、シンボリック、セマンティック、Webネットワークなどを含む)において、頂点間、または節点間の相対的ランク付けを計算する一意の手法を実装する。ランク付け演算子は、入力ランク付け基準(すなわち、ネットワーク節点に表現されるタイプのデータ要素を表現する状態ベクトル)に基づきランク付けを計算し、このランク付けに従い節点を順序付けする。
【0060】
これらの節点は、特定のタイプに限定されない。たとえば、これらの節点は、生データであることが可能であるが、これらの節点は、米国特許出願第14/965,728号及び米国特許出願第14/971,769号(これらの両方は本明細書に参照によりそれらの全体に援用される)に記載され、エージェントのネットワークであることも可能である。たとえば、機械学習方法と、ネットワークが生データ(たとえば、経験的測定値)についてトレーニングすることによってナッシュ均衡に到達すると一次経路行列に使用されるネットワーク接続とを使用して、エージェントのネットワークをトレーニングすることが可能である。
【0061】
その結果、ランク付け演算子は、グラフ中の節点の位置によって表現される状態である1つの状態ベクトルを、サブグラフ中の節点間のランクによって表現される状態であるもう1つの状態ベクトルへマッピングする。これらの属性によって、本明細書に記載される、これらの方法は、たとえば、PageRankによって使用されるように、既約性を強いる「ファッジファクタ」を必要とせずに、一意の優勢固有ベクトルへの収束を可能にする。さらに、本明細書に記載される、これらの方法は、ランク付けされたベクトルの要素間でより高い精度に区別することを可能にする。すなわち、SROは、基礎となるリレーショナルネットワーク構造の正確で精度の高い構築である。さらに本明細書に記載される、これらの方法は、個別化を可能にする(たとえば、選好行列を使用して、母集団からのデータを用いて学習されるSROを修正して、個別化する)。その結果、本明細書に記載される、これらの方法は、SROによって利益を得られる多くのアプリケーションのうちのごくわずかを選ぶために、情報取得などのタスク、及びレコメンデーションエンジンについてのネットワークランク付けに一般的な手法を提供する。
【0062】
したがって、前述の考察は、本発明の例示的な実施形態を開示して、説明するに過ぎない。当業者によって理解されるように、本発明は、それらの趣旨または本質的な特徴から逸脱することなく他の具体的な形態に具現化されることができる。したがって、本発明の本開示は、例示であるが、他の特許請求の範囲と同様に、本発明の範囲の限定ではないことを意図される。本開示は、本明細書における教示のいずれかの容易に認識できる変形形態を含み、本発明の主題が公衆に献じられることがないように前述の請求項の専門用語の範囲を部分的に定義する。
【0063】
本発明の特徴は、コンピュータプロセッサのある形態を使用して実装されることが可能である。当業者が認識するように、コンピュータプロセッサは、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、または他のコンプレックスプログラマブルロジックデバイス(CPLD)として、離散的な論理ゲートとして実装されることが可能である。FPGAまたはCPLD実装は、VHDL、Verilogまたはいずれかの他のハードウェア記述言語において符号化されることができ、符号は、直接にFPGAもしくはCPLD内の電子メモリに、または別々の電子メモリとして、格納されることができる。さらに電子メモリは、ROM、EPROM、EEPROMまたはFLASHメモリなどの、不揮発性であることができる。また電子メモリは、スタティックまたはダイナミックRAMなどの揮発性であることができ、そしてマイクロコントローラまたはマイクロプロセッサなどのプロセッサは、電子メモリ、及びFPGAまたはCPLDと電子メモリとの間のインタラクションを管理するために提供されることができる。
【0064】
代替に、コンピュータプロセッサは、本明細書に記載される機能を実行する1セットのコンピュータ可読インストラクションを含むコンピュータプログラムを実行することができ、このプログラムがいずれかの上述される非一時的な電子メモリ及び/またはハードディスクドライブ、CD、DVD、FLASHドライブまたはいずれかの他の既知の記憶媒体のいずれかに格納される。さらに、コンピュータ可読インストラクションは、米国のIntelからのXenonプロセッサ、または米国のAMDからのOpteronプロセッサなどのプロセッサ、及びMicrosoft VISTA (登録商標) 、UNIX (登録商標) 、Solaris (登録商標) 、LINUX (登録商標) 、Apple (登録商標) 、MAC-OSX (登録商標) 及び当業者に知られている他のオペレーティングシステムなどのオペレーティングシステムと併せて実行する、ユーテリティアプリケーション、バックグラウンドデーモン、もしくはオペレーティングシステムのコンポーネント、またはそれらの組み合わせとして提供されることができる。
【0065】
加えて、本発明は、図7に例証されるように、コンピュータベースのシステム900を使用して実装されることが可能である。コンピュータ900は、バスBまたは情報を通信するための他の通信メカニズム、及び情報を処理するためにバスBと結合されるプロセッサ/CPU904を含む。またコンピュータ900は、情報、及びプロセッサ/CPU904によって実行されるインストラクションを格納するためにバスBに結合される、ランダムアクセスメモリ(RAM)または他のダイナミックストレージデバイス(たとえば、ダイナミックRAM(DRAM)、スタティックRAM(SRAM)、及び同期DRAM(SDRAM))などのメインメモリ/メモリユニット903を含む。加えて、メモリユニット903は、CPU904によるインストラクションの実行中に一時変数または他の中間情報を格納するために使用されることができる。またコンピュータ900は、CPU904にスタティック情報及びインストラクションを格納するためにバスBに結合される、読み出し専用メモリ(ROM)、または他のスタティックストレージデバイス(たとえば、プログラマブルROM(PROM)、消去可能なPROM(EPROM)、及び電気的に消去可能なPROM(EEPROM))をさらに含むことができる。
【0066】
またコンピュータ900は、マスストレージ902、及びドライブデバイス906(たとえば、フロッピーディスクドライブ、読み出し専用コンパクトディスクドライブ、読み出し/書き込みコンパクトディスクドライブ、コンパクトディスクジュークボックス、テープドライブ、及びリムーバブル光磁気ドライブ)などの、情報及びインストラクションを格納するための1つ以上のストレージデバイスを制御する、バスBに結合されるディスクコントローラを含むことができる。ストレージデバイスは、適切なデバイスインタフェース(たとえば、スモールコンピュータシステムインタフェース(SCSI)、統合型デバイス電子機器(IDE)、拡張IDE(E-IDE)、ダイレクトメモリアクセス(DMA)、またはウルトラDMA)を使用してコンピュータ900に加えられることができる。
【0067】
またコンピュータ900は、特殊用途ロジックデバイス(たとえば、特定用途向け集積回路(ASIC))またはコンフィギュラブルロジックデバイス(たとえば、シンプルプログラマブルロジックデバイス(SPLD)、コンプレックスプログラマブルロジックデバイス(CPLD)、及びフィールドプログラマブルゲートアレイ(FPGA))を含むことができる。
【0068】
またコンピュータ900は、コンピュータユーザへ情報を表示するためのカソードレイチューブ(CRT)などのディスプレイを制御する、バス902に結合されるディスプレイコントローラ909を含むことができる。コンピュータシステムは、コンピュータユーザとインタラクトしてプロセッサへ情報を提供するために、キーボード911及びポインティングデバイス912などの入力デバイスを含む。ポインティングデバイス912は、たとえば、プロセッサへ方向情報及びコマンド選択を通信するための、またディスプレイ上でのカーソル移動を制御するための、マウス、トラックボール、またはポインティングスティックであることができる。加えて、プリンタは、コンピュータシステムによって格納される、及び/または生成されるデータの印刷されたリストを提供することができる。
【0069】
コンピュータ900は、メモリユニット903などの、メモリに含まれる1つ以上のインストラクションの1つ以上のシーケンスを実行するCPU904に応答して本発明の処理ステップの少なくとも一部を実行する。これらのようなインストラクションは、マスストレージ902またはリムーバブルメディア901などの、別のコンピュータ可読媒体からメモリユニット中に読み出されることができる。またマルチプロセッシング配置における1つ以上のプロセッサを用いて、メモリユニット903に含まれるインストラクションのシーケンスを実行することができる。代替の実施形態において、ハードワイヤード回路は、ソフトウェアインストラクションの代わりに、またはこれらと組み合わせて使用されることができる。したがって、実施形態は、ハードウェア回路及びソフトウェアのいずれかの特定の組み合わせに限定されない。
【0070】
上述されるように、コンピュータ900は、本発明の教示に従いプログラミングされるインストラクションを保持するために、そして本明細書に記載されるデータ構造、表、記録、または他のデータを含むために、少なくとも1つのコンピュータ可読媒体901またはメモリを含む。コンピュータ可読媒体の実施例は、コンパクトディスク、ハードディスク、フロッピーディスク、テープ、光磁気ディスク、PROM(EPROM、EEPROM、フラッシュEPROM)、DRAM、SRAM、SDRAM、もしくはいずれかの他の磁気媒体、コンパクトディスク(たとえば、CD-ROM)、またはコンピュータが読み出すことが可能であるいずれかの他の媒体である。
【0071】
本発明は、コンピュータ可読媒体のいずれかの1つ、またはこれらの組み合わせ上に格納される、メインプロセッシングユニットを制御するための、本発明を実装する単一デバイスまたは複数のデバイスを駆動するための、そしてメインプロセッシングユニットが人間のユーザとインタラクトすることを可能にするための、ソフトウェアを含む。このようなソフトウェアは、デバイスドライバ、オペレーティングシステム、開発ツール、及びアプリケーションソフトウェアを含むことができるが、これらに限定されない。このようなコンピュータ可読媒体は、本発明を実装する際に実行される処理のすべて、または一部(処理が分散される場合)を実行するための本発明のコンピュータプログラム製品をさらに含む。
【0072】
本発明の媒体上のコンピュータ符号要素は、スクリプト、解釈可能プログラム、ダイナミックリンクライブラリ(DLL)、Javaクラス(Javaは登録商標)、及び完全に実行可能なプログラムを含むが、これらに限定されない、いずれかの解釈可能な、または実行可能な符号メカニズムであることができる。さらに、本発明の処理部分は、より良いパーフォーマンス、信頼性、及び/またはコストのために分散されることができる。
【0073】
本明細書に使用される場合、用語「コンピュータ可読媒体」は、インストラクションを実行のためにCPU904へ提供することに関与するいずれかの媒体を指す。コンピュータ可読媒体は、不揮発性媒体、及び揮発性媒体を含むが、これらに限定されない、多くの形態を取ることができる。不揮発性媒体は、たとえば、マスストレージ902またはリムーバブルメディア901などの、光、磁気ディスク、及び光磁気ディスクを含む。揮発性媒体は、メモリユニット903などの、ダイナミックメモリを含む。
【0074】
コンピュータ可読媒体のさまざまな形態は、たとえば、CPU904へ1つ以上のインストラクションの1つ以上のシーケンスを実行することに関与することができる。たとえば、これらのインストラクションは、リモートコンピュータの磁気ディスク上に最初に搬送されることができる。バスBに結合される入力は、データを受信し、このデータバスB上に置くことが可能である。バスBは、データをメモリユニット903へ搬送し、これからCPU904は、インストラクションを取得し、実行する。メモリユニット903によって受信するこれらのインストラクションは、CPU904による実行前または後のいずれか一方にマスストレージ902上に任意選択で格納されることができる。
【0075】
またコンピュータ900は、バスBに結合される通信インタフェース905を含む。この通信インタフェース904は、たとえば、ローカルエリアネットワーク(LAN)、またはインターネットなどの別の通信ネットワークに接続されるネットワーク916へカップリングする、双方向データ通信を提供する。たとえば、通信インタフェース915は、いずれかのパケット交換LANに取り付けられるネットワークインタフェースカードであることができる。別の実施例として、通信インタフェース905は、通信線の対応するタイプへのデータ通信接続を提供する、非対称デジタル加入者ライン(ADSL)カード、統合デジタルサービス通信網(ISDN)カードまたはモデムであることができる。また無線リンクは、実装されることができる。いずれかのこのような実施態様において、通信インタフェース905は、さまざまなタイプの情報を表現するデジタルデータストリームを搬送する電気、電磁気または光信号を送信し、受信する。
【0076】
ネットワーク916は、1つ以上のネットワークを介して他のデータデバイスへデータ通信を提供する。たとえば、ネットワークは、通信ネットワークを介して通信サービスを提供する、ローカルネットワーク915(たとえば、LAN)を介して、またはサービスプロバイダによって操作される機器を介して、別のコンピュータへの接続を提供することができる。ローカルネットワーク及び通信ネットワークは、たとえば、デジタルデータストリーム及び関連した物理層(たとえば、CAT5ケーブル、同軸ケーブル、光ファイバなど)を搬送する、電気、電磁気、または光信号を使用する。さらに、ネットワークは、コンピュータ900に接続を提供し、コンピュータ900は、パーソナルデジタルアシスタント(PDA)ラップトップコンピュータなどのモバイルデバイス、または携帯電話機であることができる。
【0077】
上記に考察されるように、多くの場合、ネットワーク/グラフ表現は、先験的に知られておらず、経験的な測定値及びデータから代替に学習されなければならない。人工ニューラルネットワーク(ANN)及びその他のものなどの、さまざまな従来の方法は、トレーニングデータに基づきパターンを学習することが知られている。しかしながら、これらの従来の方法は、さまざまな弱点を有する。その結果、ネットワーク及びパターン学習のより良い方法は、望まれ、より高速に、さらにロバストな手法を適用し、ネットワーク及びパターンを効率的に学習し、モデル化するであろう。
【0078】
さらに、機械学習の従来の方法は、いくつかの不利益を有する。たとえば、従来のAI手法は、コンテキスト能力及び最小限の推論能力を欠く。反対に、シンボリック方法は、定義された問題を克服する推論に良いが、学習能力を有さず、不確実性の取り扱いが十分ではない。これらの手法が組み合わされることが可能である場合、一方のパラダイムの強みは、他方の不足を補うことができ、逆もまた同様であることができる。しかしながら、複数のパラダイムを組み合わせようと努める、いずれかのシステムは、コンポーネントを調整し、それらを協調させ、所望の出力で多くの組み合わせをテストするためにかなりの専門的な労力を必要とする。そのときでさえ、結果は、変化に対してロバストではない可能性がある。
【0079】
本明細書に記載される、これらの方法及び装置は、従来の機械学習方法における上記に考察された不足を克服し、SROを生成することが可能であるネットワークをロバストに生成することが可能である。たとえば、本明細書に記載される、これらの方法は、シンボリック方法及び他の機械学習方法とわかりやすくロバストに統合されることが可能である機械学習への手法を提供する。ある特定の実施態様において、本明細書に記載される、これらの方法は、柔軟な、フォールトトレランスシステムに複数のAIパラダイムを効率的に組み合わせる機械学習への取り組みを提供する。異なるアルゴリズムのアンサンブル/ネットワークは、エージェントと称され、(i)選好関数、(ii)効用関数、及び(iii)目的関数を含む、経済学からの概念により制御される。各エージェントは、推論パラダイム(たとえば、信念ネットワーク、決定木など)、または選好関数を与えられる。エージェントのそれぞれの推論パラダイムまたは選好関数に基づき、つぎにこのエージェントは、目的関数(たとえば、利潤、効用、報酬関数など)を最適化しようと努め、実数をその選好に割り当てる。トレーニングデータを使用して、これらのエージェントは、ゲーム理論の原理に従い、アンサンブル/ネットワークにおいて他のエージェントとインタラクトすることによって学習する。ゲームのコンテキスト内のエージェント間のこれらのインタラクションをみると、これらのエージェントがナッシュ均衡に収束するであろうことを理解する。ナッシュ均衡は、トレーニングデータと、そのデータにわたる推論及びクラス分けのためのエージェントの方法とに基づく、意思決定ランドスケープにおけるエージェントの安定点を表現する。この安定意思決定点は、その空間におけるエージェントの学習された状態の状態ベクトルとみなされることが可能である。
【0080】
さらに、この学習された状態は、元のデータ自体を格納することを必要とせずに、学習されたデータにわたり指数として使用されることが可能である。実際に、学習された状態は、学習パラメータのユーザの選択によって限定されるサイズ及び深度への他の多様な、または同様な学習されたモデルによって、保存される、格納される、取得される、使用される、または再結合さえされることが可能である単一モデルとして扱われることが可能である。たとえば、学習された状態は、本明細書に記載される代理ランク付け演算子(SRO)を使用して所与の時間に捕捉されることが可能であり、さらに詳細に米国特許出願公開番号(特許弁護士整理番号506878USに対応する)に、また仮特許出願第62/460,570号に記載され、これら両方は、本明細書にそれらの全体が参照により援用される。
【0081】
これらのエージェントが共通の「通貨」を使用して経済モデルに基づきインタラクトするため、別々の、さまざまな異なるAIパラダイム/モデルは、シームレスかつロバストに統合されることが可能である。さらに、エージェントネットワークの階層を作成することが可能であり、その中で1つのレベルにおいてエージェントにインタラクトするより小さな経済は、たとえば、米国特許出願第14/965,728号及び米国特許出願第14/971,769号に記載され(これら両方が本明細書にそれらの全体が参照により援用される)、第二レベルにおいて他のエージェントのより大きな経済内の第二レベルにおいてインタラクトする集合的出力を有する単一エージェントとして結束されることが可能である。
【0082】
上記に考察されるように、本明細書に記載される方法と対照的に従来の方法は、たとえば、
(1)モデル変数及び関係を理解しないことが原因である不十分な情報、
(2)短期間からより長期間にわたる固有のデータ改訂、及び
(3)弱いながらも重大な影響を有する可能性がある変動及び外乱、
を含む、いくつかの固有の欠点を不可避的に有する。本明細書に記載される、これらの方法は、以下に考察される属性によって、これらの欠点を克服する。たとえば、本明細書に記載される、これらの方法は、データ内の弱い信号へ感度を維持しながらデータ改訂に適応させる、柔軟な、フォールトトレランスシステムを構築することによってこれらの欠点に対処する単位的学習モデルを提供する。加えて、機械学習プロシージャは、学習された状態への高速の収束、ならびに実装、速度、及び複雑度の取り扱いの容易さを示す。さらに、ランク付け演算子合成方法(たとえば、SROを生成する方法)から同じことが言えることが可能である。本明細書に記載される、これらの方法は、ユニタリ二重確率行列構造に頼るため、「単位的」であるモデルを提供した。
【0083】
用語「単位的」は、単位を含む代数構造を指す抽象代数学に広く使用される。用語「単位的」は、本明細書に使用される場合、このような構造も指すが、あるものは、入力データに対して非単位元(すなわち、データのプロパティを表現する異種プレイヤー)から内部に構成され、データに対して単位元からなるモデル(すなわち、サイズが入力データのサイズと同一である自明に学習されたモデル)を回避する。したがって、本明細書に使用される場合、列挙される「単位的モデル」は、共通の知覚言語(たとえば、共通通貨としてエージェント間で情報を交換する経済モデル)を使用して任意の正確さ、忠実度、及び精度へ入力データを近似するパターンを学習することによって、相互運用性があり協調するさまざまなアルゴリズムのネットワークである。
【0084】
ここで図面を参照して、その中で同様の参照番号は、いくつかの図全体を通して同一の、または対応する部分を示し、図8は、エージェント1010(1)から1010(N)のネットワーク1000の概略図を示す。図8に示されるように、エージェント1010(1)から(N)は、通信ネットワーク1030を介して通信することが可能であり、ある特定の実施態様において、通信ネットワーク1030は、クラウドベースのアーキテクチャを有する、またはいずれかの他の計算もしくは通信アーキテクチャ上に実装されるように構成されることが可能である。最下位レベルにおいて、エージェントは、それぞれのセンサ1020(1)から(3)を介して「world」についての情報を受信し、「world」を知覚する。上位レベルにおいて、エージェントは、下位レベル、及び/または同様の状況にあるエージェントからのデータストリーム1020(4)から(N)を受信する。たとえば、エージェントがテキストストリームを分析する場合、それらは、一連の単語を受信し、これらを処理してエージェントのヴァンテージポイント及び選好からデータの認識を表現する信号/シグネチャを生成する。エージェントは、他のエージェントへのリンク経由で(たとえば、特別なピアツーピア(P2P)接続経由で)メタデータ交換を介して情報を交換することによって、情報の特定のタイプについてのそれらの選好を表現することが可能である。また情報は、エージェントの階層に認められず、たとえば、ユーザインタフェース1040を介してユーザへ提供されることが可能である、報告などの実行できる結果1050を生成するまで上位層レベル/層エージェントによって集約されることが可能である。
【0085】
非限定的な実施例として、ある特定の実施態様において、低レベルデータの上位レベルの概念及び意味への集約及び蒸留は、データを取り、セマトン(sematon)と言われる意味論的原子を生成することと称され、これらは、ゲシュタルトと言われる、セマトンの組み合わせのパターンを識別する上位レベルに順に精製され蒸留される。したがって、エージェントのネットワークは、新規のパターンまたはゲシュタルトを社会的及び文化的コンテキスト内で合成することによって学習する。たとえば、米国特許出願第14/965,728号は、その全体が参照により本明細書に援用され、これらのゲシュタルトを新規のコンテキストに使用して、元のデータがもはや出現しない類似した状況を識別することが可能であることを説明する。これは、システムがユーザ入力から類推を引き出し、単一ユーザが考えつくことが不可能である新規の可能性を生み出すため、ユーザ生産性を非常に高める。その結果、インテリジェントソフトウェアエージェントを使用して、分類器または意思決定器のアンサンブルに自己組織化によって構造化及び非構造化データを処理することが可能であるロバストな認知モデルを形成することが可能である。すなわち、この非限定的な実施例において、エージェントは、階層のさまざまな規模及びレベルにおいて発生する、エージェントの社会/ネットワークとして統合され、発展する。たとえば、ネットワーク内のエージェントは、それぞれの選好関数を有し、それらは、情報/メタデータの交換を通じて最大限にしようと努める。
【0086】
さらに、米国特許出願第14/971,769号は、その全体が参照により本明細書に援用され、階層的意味境界指数と称されるエージェントの別の非限定的な実施例を提供し、この中でエージェントの階層は、さまざまなデータストリームからの情報を発展させ、蒸留する。
【0087】
上記に考察されるように、エージェント間のインタラクションによって、本明細書に記載される、これらの方法は、マルチエージェント技術のフレームワーク内の新規のアルゴリズムのハイブリッド組み合わせを可能にする。したがって、本明細書に記載される、これらの方法のアプリケーションは、社会において計算するエージェントに基づき構築されることが可能であり、社会は、凝集的ネットワークである。これらのエージェントは、それらが属するネットワークの頂点沿いに実質的に通信し、または移動し、それらの配位空間を発展させることが可能である。これらのエージェントは、データを意思決定に変換し、それらの性能及び有効性は、直接計算リソースの代替に仮想通貨を使用して作業中に測定される。
【0088】
さらに、これらのエージェントは、分散され共有されたメモリモデルを使用することが可能であり、それらは、グラフの頂点を使用して情報を格納し、抽出する。分散され共有されたメモリモデルの長所は、高度にフォールトトレランスを実装して維持し、高いスケーラビリティを有することがはるかに(たとえば、集中型モデルより)容易であることであり、それがもたらす結果の品質は、完全な知識共有の最強モデル(最大のエキスパートシステム及びそれらの関連した真理性維持システムなどの)と比較して、非常に高い。
【0089】
これらのエージェントは、単純な昆虫様検知から高レベルの推論力まで及ぶ能力を有する「頭脳」を含む。協力することで、高度なエージェントは、データをより単純なエージェントから取得し、異なるアルゴリズムを使用する「同僚」と連携することが可能である。類推を使用して解を推測するエージェントは、演繹によってそれらを検証することができるエージェントへ、または統計を使用してそれらの尤度を推定するエージェントへ、仮説を渡すことが可能である。大量のデータストリームにおけるインテリジェンスの高速認識は、データストリーム内のパターンを協力的に検知するエージェント群を指数付けすることによって達成される。
【0090】
本明細書に記載されるこれらの方法を使用することにより、図9を参照して下記のように、実用的閉路において帰納的、演繹的、及び仮説形成的な推論を用いて、最下層においてクエリに答えることが可能である。つぎに、上位レベルのエージェントが認識する証拠的パターンとして上向きに、これらのクエリ結果を抽象化し、融合し、伝播する。これらのパターン構造は、信号としてエージェントの階層におけるつぎの層まで伝播する下位レベルの知覚に起因し、高レベルの認知表現として解釈される。これらの表現は、意味領域様データ表現を形成するゲシュタルトに集約される知覚である。
【0091】
すべてのエージェントは、下位レベルのエージェントからのその認識に基づきデータの理論について1つ以上の仮説を生成する1つ以上のモデルをカプセル化する。エージェントは、
1)効用関数、
2)目的関数、及び
3)選好関数、
の観点からそれ自体の自己利益に最も適していると評価するように学習しているこれらのモデル及び仮説を選択する。上記に考察されるように、モデルは、エージェントにおける昆虫様応答と同じくらい単純である、または基礎となるデータ上に知覚を提供する、集団分類器として共に機能するエージェントの社会もしくは群化と同じくらい複雑であることが可能である。したがって、それぞれの個々のエージェントは、それ自体の自己利益に基づきそれがどのエージェントの社会に参加するべきかを見出すことが可能である。ゲーム理論の言語において、これらのエージェントは、選択肢(たとえば、どのエージェントと情報を交換するか)を提示され、その自己利益を最適化しようと努める。選択を行った後に、異なる選択がより好ましい結果を有する(すなわち、その自己利益をより良く最適化する)ことにエージェントが気づく場合、つぎにこのエージェントは、つぎの繰り返しでその選択を変更する。最終的に、これより良い選択が含まれないときに、均衡を達成し、これは、ナッシュ均衡と称される。
【0092】
図9は、学習した後に変化した環境に適応し続けるエージェントのネットワークの1つの実施態様の流れ図を示す。無関係な分析の膨大な量を生成することが可能である、機械処理をパイプライン方式で実行する従来の方法と対照的に、本明細書に記載される、これらの方法は、エージェントのネットワークがそれ自体の有効性をもたらし、高品質な、洞察に富む情報をビッグデータから生成することを可能にする。たとえば、エージェントのネットワークは、その全体が参照により本明細書に援用される、M.Minsky,Society of Mind,Simon and Schuster(1988)に記載されており、共同知能についてのモデルを使用する。このモデルにおいて、自律的、かつモジュール方式のコンポーネントの集合体は、知覚及び推論についてのローカライズされた機能を有する。さらに、このモデルは、単純な意思決定器のアンサンブルの集団において、問題解決の際にあらゆる主題の専門家(複数可)のパーフォーマンスに取って代わることが可能であると仮定する。階層の再表現について上記に考察されるゲシュタルト原理を使用して、低レベルのデータから高レベルの概念及びパターンへマッピングする。
【0093】
図9において、このシステムが最初に起動するときに、プロセス1110において、エージェント母集団1112を開始し/作成し(その後更新し)、システムは、データソースに接続されるソース(たとえば、図8中のセンサ及びデータストリーム)から入力を受信することを開始する準備ができる。全体的な目標は、ユーザによって割り当てられるタスク(すなわち、ユーザタスク割り当て1102)によって設定される。すなわち、システムがデータ1122を受信していても、最初に人間のオペレータが目標(すなわち、ユーザタスク割り当て1102)を入力しないと、システムは、何もしない。したがって、ある特定の実施態様において、方法1100は、アナリストがユーザタスク割り当て1102を提供することによって開始する。たとえば、方法1100のプロセス1110において、アナリストは、チャット、ツイート、ブログ、企業電子メール、及びメッセージング内の会話の単一または複数のルーム及びスレッドを含むことができるソースから「不正なトレーダーを識別する」などの、特定のビジネス要件に関してエージェントにタスクを割り当てる。エージェントのシステムは、サンプル入力を介してトレーニング期間から早期に学習された、関連がある証拠信号スキーマ、及び関連した測定値を提供することによって要求に直ちに応答する。したがって、方法1100のプロセス1120において、エージェントは、集団において、「認識」を形成する「知覚」の集合体を生成する、環境中の言語ストリームへ証拠信号尺度を適用する。最も単純なレベルにおいて知覚は、証拠信号尺度と言語ストリームとの間の相関である。
【0094】
方法1100のプロセス1130において、エージェントは、背景知識(ヒューリスティックを含む)を組み合わせて作用する「仮説」を合成することによって何が知覚されているかの「意味(meaning)」を説明しようと努力する仮説推論プロセスにおける認識に作用する。尺度の一方の極端において、完全な知識があるときに、仮説は、既知のモデルに適合するが、他方の極端において、背景知識がないため、このシステムは、仮説選択の無作為プロセスによって、無作為に知覚を仮説に連結する。仮説が定式化されると、仮説のプールは、改訂される。このプールは、ユーザ入力またはフィードバック及び機械学習を含むことが可能である。このシステムは、利用可能な背景知識がない場合、ユーザからのフィードバックを通常必要とする。このフィードバックを使用して、適切さの制約を生成し、競合メカニズムによって無用な予想または仮説を取り除く。改訂段階は、それが一連の経済モデルを使用して「残存性」、したがって仮説のもっともらしさを評価することを伴うので、このシステムの最も複雑な段階の1つである。プロセス1130中に、エージェントは、証拠及び仮説を交換することが可能であり、その時それらの結果を競売する。フィードバックまたは他の信号尺度(前の学習プロセスから)は、もっともらしい仮説の選択を変える。
【0095】
方法1100のプロセス1140において、演繹的な理論に仮説を組み合わせ/集約し、つぎにこれを使用して予測を形成する。我々の例示的な事例において、アナリストが「不正なトレーダー」を必要としたので、このシステムは、その応答を出力する。この段階において、この応答は、このシステム内部に留まることができる、またはモデルが十分に高い適切さスコアを出力する場合に、この応答は、アナリストへ報告として出力される。この報告へのアナリストのフィードバックを検討する前に、適切なスコアがアナリストの定義された閾値を下回った(すなわち、いかなる請求も確証するのに証拠が不十分である)ため、このシステムが「内部に」報告を進行中の仮説として維持すると仮定する。この段階において、このシステムは、請求を確証する、または確証しないためにさらなるデータを探す。
【0096】
方法1100のプロセス1150において、エージェントのネットワークは、さらなる入力を、そしてそれ自体におけるフィードバックによってサンプリングすることが可能である。たとえば、ある特定の実施態様において、フィードバックソースは、アナリスト/ユーザ及び/または新規の入力データ(たとえば、センサ、株式市場ティッカーなどから)であることが可能であり、エージェントのネットワークは、フィードバックを使用して、その部分的に形成された理論のインタラクションを評価することに応じて、その理論を変えることが可能である。
【0097】
フィードバックソースにかかわらず、方法1100のプロセス1160において、システムは、データに関するフィードバックまたはインタラクションから学習し、新規の知見を生成することが可能である。方法1100がプロセス1110へ戻るときに、これらの知見は、アクティブエージェントプールへ新規の追加分を促すことが可能である。プロセス1160におけるこの学習及び帰納的推論プロセスは、プールを新規の証拠及び部分構造によって拡張し、つぎに方法1100の別の繰り返しに供給することが可能である。したがって、方法1100は、変化する環境へ絶えず動的に適応することが可能である。ある特定の実施態様において、また方法1100は、条件付きの停止/出力基準を有することが可能であり、操作サイクルは、十分な証拠、たとえば、上記の閾値が停止/出力基準をトリガするまで継続し、アナリスト/ユーザへの報告(または予測)の生成をもたらす。
【0098】
上記を考慮して、本明細書に記載される、これらの方法(「モデル及びパターン構造オンライン単位的学習」(MAPSOUL)とまとめて称される)がプレイヤーとして表現される多様なデータ処理アルゴリズムを体系化するための計算モデルであることを理解することが可能である。それ自体におけるいかなる単独のプレイヤーでもなく、この能力を生成するプレイヤー群である、プレイヤーをワークフロー中に編成する能力は、MAPSOULが深層パターン学習及びパターン認識を実行することを可能にする能力である。プレイヤーが「真実」を探している、一般的な総和ゲームにおける利己的なプレイヤーとして再キャストする、動作上適切でないデータ、及び誤って指定されたアルゴリズムの仮定にMAPSOULの解釈が基づくため、これは、部分的に達成される。
【0099】
MAPSOULは、プレイヤーの集合体を、互いに対する、また「マネージャー」として指定される特定のプレイヤーに対する、彼らの好ましい通信パターンに基づく彼らの連結性のグラフとして表現する。この集合体におけるプレイヤーのメンバーシップと同様にプレイヤー間の関係は、個人としてプレイヤーが利益になるか、損得なしになるか、利益にならないかどうかに従い発展する。プレイヤー間の1プレイのすべてのターンは、彼らの以前の状態、及び現在のデータを使用して、彼らがデータから獲得する知識の断片を購入、売却、または保持のいずれかを行う意思決定を行う、すべてのプレイヤーによって特徴付けられる。各プレイヤーは、各プレイにおいてその発達中の知識のグラフによって、さらに特徴付けられる。MAPSOULは、かれらのプレイのグラフスペクトルの組み合わせを取ることによって通常のペイオフ計算を置換する。この方式において、プレイヤーをそのグラフスペクトルの時間発展として抽象化する。これらのグラフスペクトルは、経済選択であるこれらの意思決定に基づくため、プレイヤーが意思決定位置を変更するインセンティブを有さない固定点に達することが可能である。この固定点は、ナッシュ均衡である。
【0100】
ある特定の実施態様において、エージェントの異なる階層レベルは、定性的に異なるタイプの最適化基準を有することが可能である。たとえば、さまざまなレベルにおいて、エージェントは、多様性、トレーニングデータとの一致(たとえば、ゴールドスタンダード)、上位レベルのエージェントに対する点別の高い相互情報量を提供することなどの条件を満たそうと努めることが可能である。
【0101】
MAPSOUL機械学習は、フルードまたはレイノルズ数などの、経験的に測定された物理系に無次元数を表現する方式によく似ている、無次元数概念を使用して指定される、ナッシュ均衡条件を利用する。図10を参照して、情報を交換する選択の相対的な長所を決定する際に使用される、さまざまな無次元数を以下に説明する。これは、1つの実施態様に従い、ここで提供されるプロセス1130の非限定的な実施例である。
【0102】
最初に、トレーニングデータであるデータセットDを検討する。すべてのプレイヤー(本明細書に使用される場合、用語「プレイヤー」及び「エージェント」は互換性である)は、目標を与えられる。たとえば、この目標は、ベクトルの基準セットを生成するプレイヤーについての機械学習テストセット(すなわち、ゴールドスタンダードデータ)としてシステムのユーザにより設定されていることができる。すなわち、プレイヤーについての目標は、データセットD上で動作することにより、ベクトルの基準セット(すなわち、ゴールドスタンダードまたはトレーニングデータ)にできる限り近くにマッチングする、データDからの値のベクトルを生成することが可能である。ある特定の実施態様において、プレイヤーによって生成されるデータDのこのベクトル値表現は、複素数値ベクトルであることが可能である。ある特定の実施態様において、パターンベクトル(PV)は、このベクトル値表現から計算されることが可能であり、選好ベクトルと称される。プロセス1130のステップ1220について説明されるように、このPVは、他のエージェントの位置と比較してエージェントの視点からの知覚を表現するものとして理解されることが可能である。
【0103】
第二に、ベクトル値表現をクラスタにカテゴリー化する(不正確にカテゴリー化する可能性がある)。さらに、所与のデータセットDのデータのn個の既知の正の実施例のそれぞれについて、各プレイヤーは、同一データの1つ以上のベクトルを含むことができる。
【0104】
第三に、プレイヤーは、設定される感度閾値を有することにより、プレイヤーのコサイン尺度が閾値以下の量まで異ならない場合、データ上のベクトルは、別のデータベクトルに同一であるとみなされる。
【0105】
このプロセスは、D.Jurafsky and J.Martin,Speech and Language Processing,3rd Ed.(Draft)、https://web.stanford.edu/~jurafsky/slp3/ed3book.pdfに利用可能に記載されており(その全体が(そして特にベクトル意味論を説明する第15章が)参照により本明細書に援用される)、ベクトル意味論(たとえば、自己相互情報量尺度(PMI)間のコサインとして類似度を計算し、メタデータのタグ、またはエージェント間の連結に類似した異なる用語をコンテキストとみなす)において使用される用語間行列に基づく共起ベクトルに類似していると理解されることが可能である。たとえば、ある特定の実施態様において、エージェントは、メタデータによってタグ付けされている、データストリームの特定の位置を参照することが可能であり、メタデータタグ間のこれらのリンクは、それぞれのエージェント間の連結に対応することが可能である。したがって、所与の距離内の単語対間の頻度を測定するベクトル意味論に使用される用語間行列のように、エージェントのベクトルの行列表現は、エージェントのリンクのある一定の数内に発生するメタデータタグの頻度(すなわち、エージェントの連結性及びそれらの近接)を表現することが可能である。
【0106】
これらの計算のそれぞれは、図10を参照してより詳細に以下に記載される。
【0107】
エージェント間のリンクが移行する、または削除される、または加えられることが可能であるため、学習プロセスは、発生する。安定したネットワーク(モノが複数のサイクルについて同一のままである)の場合、その状態は、学習された状態である。経済用語において、学習された状態は、ナッシュ均衡を達成している。トレーニングデータを使用して、データについていずれかの他のエージェントによるその連結を変更するようにエージェントに誘因を与えない(効用関数によって)、ネットワークを学習する。この固定点は、計算のサイクル数(たとえば、何も変更がない場合、その学習された状態とみなす、3回の繰り返しの)に関するパラメータとして通常設定される。システムが最初に初期化されるときに、これらのエージェントは、データへ無作為に割り当てられる。
【0108】
目標が効用関数のそれら自体のプロパティであることに留意する。目的及び選好関数は、エージェントがこれらの関数を使用してそのデータを探索する(通常ランダムに)場合に、どのエージェント値が最適性に向かいやすいかを調整する。このエージェントは、ネットワーク(ナッシュ)において均衡に達する場合にのみ探索する。
【0109】
トレーニングデータは、データ及びメタデータを設定し、目標は、通常人間が提供し、期待し、意図した結果または解釈である。ネットワークによって学習されるのはこれである。このネットワークは、その位置を変更することがエージェントにとってもはや最適ではなくなるまで、エージェントが他のものに関してそれらの位置または関係を変更することが可能であるため、動的である。その時点で、ナッシュ均衡は、達成されている。
【0110】
図10は、提供されたデータからの仮説を定式化し、改訂するプロセス1130の流れ図を示す。上述のように、これらのエージェントは、下位レベルのエージェントからの彼らのそれぞれの認識に基づき、また、
1)効用関数、
2)目的関数、及び
3)選好関数、
の観点からエージェントの自己利益に従い学習される選択されたモデル及び仮説に基づき選択を行う。
【0111】
プロセス1130のステップ1210において、メタデータタグを受信したデータへ適用することによって、データをドメイン独立形式にマッピングする。すなわち、選好関数をエージェントに割り当て、選好関数は、メタデータをデータへマッピングする。ある特定の実施態様に従い、いずれかの入力データについて、最も一般的なメタデータタイプを各入力データへ割り当てる。いずれかのプレイヤーについて定義される最上位レベルのメタデータタイプの5つの主なクラスがある。これらは、(i)ドナー、(ii)アクセプター、(iii)ネゲータ(negator)、(iv)ポジター(positor)、及び(v)論理タイプ(一次論理「and」及び「or」演算子と同様に前置詞関係子、含意子(implicator))である。これらのタイプは、言語の場合の役割もしくはテーマ、または視覚入力の場合に画像記述子、またはオーディオ入力の場合にオーディオ記述子などをユーザが加えたい可能性がある、いずれかのサブタイプ構造によって補われることが可能である。
【0112】
たとえば、自然言語入力の場合に、文章入力において識別される名詞は、メタデータタイプ「ドナー」によってタグ付けされることが可能である。同一の入力文章において、識別された動詞は、メタデータタイプ「アクセプター」によってタグ付けされることが可能である。形容詞/副詞は、これらの用語を使用して感情または判断視点(人間による)からそれらの極性を表すことによって、ネゲータ/ポジターとしてタグ付けされることが可能である。論理タイプを使用して、前置詞及び他の機能語をタグ付けすることが可能である。この結果は、タグによってラベル付けされる文章のグラフである。
【0113】
実施例#1:「John went to Boston」
この実施例において、我々は、メタデータタグ:ドナーJohn、アクセプターwent、論理to、ドナーBostonを使用して、この文章をラベル付けする(いくつかの外部ラベル付けoracleに関する)。
【0114】
別の実施例において、画像入力、及び他のタイプのデータ入力の場合、画像場面内の「ドナー」の概念は、より明るい反射領域の表現であることが可能であり、「アクセプター」は、より暗い非反射領域の表現であることが可能であり、それらのサブコンポーネント部分(サブ画像領域)は、他のタイプのタグの組み合わせで表現されることが可能である。この結果は、タグによりラベル付けされる画像のグラフである。
【0115】
ドメイン依存プロセスは、したがって、最上位メタデータタイプ(5つの最上位タイプのセット)、及びいずれかのサブタイプの制限されたセットを使用して、タグ付けするメタデータをもたらし、これらのタイプのグラフまたは木がデータによって導入されるように表現される。
【0116】
ステップ1220において、それぞれのエージェントのパターンベクトル1222は、下記のように計算される。
1)2つのタグ付けされた部分(一対)間の距離を、この一対間の連結リンク(それらの介在するタグ付けされたデータ間に構築される介在リンク)の最小数として定義する。この数を「n」と称する。
2)各対の最上位レベルのメタデータタイプが、彼らの選好が経時的に変化する可能性がある場合に、1セットのプレイヤーの交換についての所与の「n」(頻度「f」対リンク距離「n」)より短い距離においてそれぞれ何回見出されるか(時間tに)を計数することによって、頻度及びリンク距離行列を作成する。
3)この行列を、選好頻度相関ベクトル(PFCV)と称される1セットのベクトルとして、nfとして解釈する。
4)ベクトルの各エントリを時間枠内のプレイヤー交換の合計数により除算すること:NPFCV=(nf)/(交換数)によって、PFCV値を正規化する。
5)選好ベクトル、NPFCVの論理「or」としてグローバルベクトルを計算する。
6)最後に、プレイヤーの集合体のマネージャーについて、選好逆頻度相関ベクトル:PIFCV=NPFCV/プレイヤーを計算する。
実施例#1:「John went to Boston」に戻る
ドナーJohn、アクセプターwent、論理to、ドナーBoston
John及びBoston間(すなわち、ドナーからドナーへ)の隣接数は、3である。
これがこの3の列挙である:[john,went]、[went,to]、[to,boston]。
【0117】
この数3をリンク距離と呼ぶため、我々は、単語の代わりにこれらのタイプの組み合わせについてそれぞれ2及び1でリンク距離を計数する。したがって、ドナー間は、3のリンク距離を有する。
【0118】
これがこれらのベクトルの部分行列表現である。
(ドナー/アクセプター)(ドナー/論理)(論理/アクセプター)(ドナー/ドナー)
距離=1 1 1 1 0
距離=2 1 1 0 0
距離=3 0 0 0 1
【0119】
これは、メタデータパターン=[(ドナー/アクセプター),(ドナー/論理),(論理/アクセプター),(ドナー/ドナー)]についてのパターンベクトル(列の総和)=(2,2,1,1)をもたらす。
各プレイヤーについて、
として入力についてのパターンベクトルを定義する。n番目のプレイヤーは、「n」によって与えられ、Dは、データの合計数である(この文章の場合、「John went to Boston」に4つの単語がある)。i番目のメタデータ及びj番目のメタデータのタグの距離行列を計算し、それらの総和を取り、データDの合計数で除算する。
【0120】
実施例について、PV(1)=1/4(2,2,1,1)=(0.5,0.5,0.25,0.25)。
【0121】
すべて同一のマネージャー下の、複数の異なるプレイヤーについて、
PV(マネージャー)=PV(n)|PV(n-1)|....PV(1)、
を有し、式中、10進数上で実行される「or」演算子は、10進数の最大値を返す。同様に、10進数上で実行される「and」演算子は、10進数の最小値を返す。
【0122】
その結果、PVは、他のエージェントの位置と比較してエージェントの視点からの知覚を表現すると理解されることが可能である。エージェントが節点であるため、ネットワークにおける各節点について計算される単純な一種の指紋である。各節点は、わずかに異なる値を有するが、いくつかが同一の値を有することができる(それらの局所近傍が別のエージェントの局所近傍と同一であるため)。たとえば、PV(n)は、n番目のエージェントの「視点」から記載される経路行列である。その結果、以下に検討される実施例において、第一位置(すなわち、n-1)を参照するエージェントの「視点」(たとえば、選好)は、
(ドナー/アクセプター)(ドナー/論理)(論理/アクセプター)(ドナー/ドナー)
の行列表現を使用して特徴付けられる。n=2に対応する別のエージェントは、「アクセプター」である第二位置を参照する。したがって、それは、行列表現:
(アクセプター/論理)(論理/ドナー)(論理/アクセプター)(アクセプター/ドナー)
を使用して特徴付けられる。したがって、異なるエージェントは、異なる位置を参照し、異なる視点を有し、したがって異なるベクトル表現を生成する。
【0123】
ステップ1230において、類似検索を選好ベクトル上で実行し、この結果を使用して、類似度プロファイル比率(SPR)1232を計算する。マルチヴァンテージポイント(MVP)木を使用する非限定的な実施例を使用して類似検索を図示するが、類似検索を実行するいずれかの既知の方法を使用することが可能である。
【0124】
基準ベクトルと共にデータセットDを提供したこと、及びベクトル値表現(PV)をクラスタにカテゴリー化する(たとえば、類似検索を使用して)ことを想起する。さらに、所与のデータセットDのデータのn個の既知の正の実施例のそれぞれについて、各プレイヤーは、同一データの1つ以上のベクトルを含むことができる。
【0125】
ある特定の実施態様において、クラスタ化のステップは、選好ベクトルをMVP木に格納することによって実行される。目的関数は、プレイヤーとデータとの間の一致を測定する。類似検索は、MVP木を使用してプレイヤー間データの間に実行される。したがって、n回の類似検索(各プレイヤーのデータについて1回)があり、そこで既知の正の実施例のそれぞれは順に、プレイヤーからMVP木へのクエリ構造であり、その最近傍を類似度スコアとして返す。この結果は、実質的にそれぞれのプレイヤーのペアワイズ類似度である。ペアワイズ類似度に使用される各データは、MVP木内で区別される。
【0126】
つぎに、いずれかのマーク付けされていない残りのデータをつぎに使用して、すべての残りのマーク付けされたデータの実施例(n-1)、及びフィルタリングデータベースのすべての負の実施例(最近傍法検索の閾値外にあるため、類似度にマッチングしない)に対して、追加のペアワイズ類似度スコアを計算する。
【0127】
このプロシージャは、n個の個々のリストのランク付けを組み込む最終的な類似度ランク付けリストに融合される、n個の類似度ランク付けリストをもたらす。
【0128】
つぎに、これらのベクトルを使用して、類似度プロファイル比率(SPR)と称される目的関数を時間tにわたり計算する。この目的関数は、それらが比率:
によって計算されるため、無次元数の時間発展プロファイルをもたらす。式中、初期繰り返し時間t=0、SPR(t-1)=0、である。項Ptotalは、目標(すなわち、標的カテゴリー)に関してプレイヤーによってそれぞれ認識され、カテゴリー化される、または認識されない、正及び負の両方の実施例の合計数である。値Ppositiveは、データセット上にプレイヤーによって正確にカテゴリー化される正の実施例の数である。値Stotalは、現在処理しているデータセットにおける入力データの合成数の実施例である。値Spositiveは、現在処理しているサブセットに見出される正の実施例の数である。値Qは、真実のゴールドスタンダードの役割を果たす人間のプレイヤーに参照される無作為試験におけるアルゴリズムの正の識別の数である。値Rは、アルゴリズム上で無作為試験に利用可能な実施例の合計数である。いくつかのアルゴリズムは、Q/R=1.0の比率(たとえば、データの1つのカテゴリー対データのもう1つのカテゴリーを識別するこれら)を有し、他のものは、意味複雑度(たとえば、2つの異なるデータカテゴリーに相関する1パターンを識別する)に依存するこれより低い比率を有する。
【0129】
クエリへの回答の無作為選択に優るいずれかの方法は、SPR>1.0を返す。これは、したがって、どの程度うまくシステムがそのカテゴリー化対無作為推測(すなわち、サルとダーツボードの類推のような)を実行するかの尺度である。
【0130】
SPR1232は、上限を有する。この上限は、データセット及びプレイヤー品質(人間のパフォーマンスに等しい)における正の実施例の割合に比例する。SPR1232が一定の上界に達するときに、これらの上限に到達する。時間中に、その上界に達するためにSPR1232に必要とされる繰り返しの回数を、カテゴリー化を実行し、カテゴリー化について一致するプレイヤーの集合体の有効性として解釈する。
【0131】
いくつかの異なるプレイヤーを比較することは、無作為に変化するデータに対してプレイヤーを較正することに意味はないが、プレイヤーを同一のデータセットによって実行する場合にのみ意味がある。
【0132】
ステップ1240において、効用関数を計算する。たとえば、コストまたは移行時間などの、距離計量の観点から、効用関数を定義することが多い。効用関数としてのユークリッド距離計量の場合、特徴ベクトルの意味論が同一の方式においてオブジェクトを均質に表現すると仮定する。深層ドメイン差異のために一方から他方に容易にマッピングすることができない複数のタイプのメタデータを有する発展系について、本明細書に定義される効用関数は、これらのような不整合な意味表現がある(すなわち、メタデータが均質な表現ではない)ときでさえ、有用な測定値を生成することが可能である。効用関数は、無次元数であり、類似度及び類推の性質についての直感に基づくヒューリスティック尺度である。最初の直感は、最小のゼロ(完全に非類似)から1(完全に類似)の範囲の間で類似度を判断することが可能であることである。
【0133】
【0134】
第二の直感は、値ρがσにおける特徴の存在の期待値として定義される場合(すなわち、ρ及びσの両方が相関されたデータである場合)、相関されたデータがメタデータにおける差異にもかかわらず評価されることである。これは、高スコアをもたらし、我々はこれを使用して、他のプレイヤーからの近傍にある相関されたデータへ高確率を有するクエリデータの領域内に多くの特徴を有するクラスタを識別する。しかしながら、第三の直感として、非常に低い確率に関する領域内のプレイヤー対の存在にペナルティを課すことも重要である。この場合、分母は、クラスタ内のデータの逆確率を有する対の存在(すなわち、対象となる意味論的特徴を説明するいくつかのデータ要素のモデル)に重み付けをする。
【0135】
したがって、SPR1232を使用してプレイヤー間で比較されることが可能である適切なメタデータタグを選択し、他の確率は、無作為に分布し、クラスタ化は、この領域内に「にじみ」でる(すなわち、それらが相互相関された意味カテゴリーを期待通りに識別し損なう)ことを定義する。プレイヤー間で高い多様性を選択するため、高い忠実度のデータのカテゴリー化についてのそれらの最大相互ポテンシャルが最適であることが重要である。たとえば、Marvin MinskyがSociety of Mindについての彼の研究で述べた、この直感は、多様性の原理である。MAPSOULは、高い多様性が認識力の尺度である直感に基づき順にそれ自体である多様性についてユーザが定義した閾値に基づきそのデータ上で学習するために、無作為にデータをサンプリングし、プレイヤーを拒否する多様性実行化主体を含む。多様性を計算するときに、2つのバイナリ文字列表現、プレイヤー(A)についての検索クエリとしての1つ、及びプレイヤーが人間のユーザ(B)であると想定される比較のための基準構造(ゴールドスタンダード)についての1つを使用する。プレイヤーのサイズ及びデータは、格納される彼らのメタデータ、及び彼らのカテゴリー化されていないデータに基づく。マッチング動作について、以下の値、
1.a=ビットベクトルAにおける1の数、
2.b=ビットベクトルBにおける1の数、
3.c=A及びBについて共通の1の数、
4.d=共通ではないAまたはBにおけるすべての1(XOR)、
5.n=ビット文字列の長さ、
を使用する。
【0136】
Tanimoto係数(Tc)は、ビット文字列類似度を使用する類似度に関して、いずれかの結論を出すために、最も一般に使用された係数である。
実施例#2:4つの共通特徴、
A:(0 1 0 1 1 1 1 1 0 0 0)、
B:(1 0 1 0 1 1 1 1 0 0 0)、
Tc=1/2。
【0137】
Tanimoto多様性は、以下の、
を測定する。この尺度を使用して、少数の、または限定された数の特徴のみを含むメタデータを符号化するプレイヤーは、より多くのプレイヤーと比較されるときに高い多様性に向かう傾向がある。ハミング尺度は、逆の傾向線を有し、多くのメタデータ特徴を有する、より多くのプレイヤーは、高い多様性に向かう傾向がある。
【0138】
我々が使用するこの尺度は、Dixon-Koehler修正、
と称される多様性の尺度の両方について補完する長所及び短所を組み合わせることに基づく。多様性尺度に連結されるサイズ効果は、Dixon-Koehler多様性尺度において相殺される。我々は、これらの尺度を使用して、シリアル化方式におけるプレイヤーベクトルをバイナリ文字列(長い)に変換し、一定期間にわたりプロファイリングすることが可能である。
【0139】
上記を考慮して、非常に高い複雑度においてデータの学習及びクラス分けを迅速に達成する新規の手法をMAPSOULが提示し、データを学習するためにナッシュ均衡をモデル化して使用するすべての伝統的な手法に優ることを理解することが可能である。所与の時間に、エージェント間の学習された関係は、頂点におけるエージェント、及びこれらの頂点間のリンク/辺を表現する情報の交換に関するグラフを表現する。このグラフは、SROを生成するために上述されるような、グラフにおいて頂点を迅速にランク付けするために使用されることが可能である代理ランク付け演算子として捕捉され、表現されることが可能である。
【0140】
すなわち、MAPSOULをシステム及び方法として使用し、ランク付け演算子を使用してネットワーク内のデータを学習してランク付けすることが可能である。データに適用されるときに、ランク付け演算子は、ランク関連データを生成する。機械学習の態様は、ネットワーク内で関連付けられる節点(機械学習または連想索引付けに使用されるような)間の計算またはアクティブ化を伝播することに基づく従来の手法より高速に重み付けを学習し、模倣し、生成するプロパティを有する。ランク付け態様は、2、3例を挙げると、人工ニューラルネットワーク、深層学習、及び強化学習を含む、機械学習から導かれるこれらのような、ネットワーク内の構造及び相互関係のスケーラブルで高速な、近似器である。本開示は、情報取得、情報リソースの集合体から情報ニーズに関連性のあるリソースを取得するアクティビティに適用されることが可能である。Google、Bing、及びYahooなどのウェブ検索エンジンは、情報取得の最も良く知られているアプリケーションである。また本開示は、情報フィルタリングシステム、たとえば、コンテンツをユーザへ推奨するレコメンダシステムまたはレコメンデーションエンジンに適用されることが可能である。また本開示は、医療、金融、及び他の分野におけるデータ分析のためのいずれかの機械学習または人工知能システムに使用されることが可能である。
【0141】
このシステムは、ソフトウェアエージェントをインタラクトする目的関数を継続的に最適化するプロセス並列フレームワーク及び一意適応方法論を含む。これらのエージェントは、データのバッチを処理した後に、各エージェントの推論パラダイム(たとえば、信念ネットワーク、決定木など)の寄与を表現する、ナッシュ均衡に収束する。エージェントのネットワークは、ランク付け演算子をそのとき計算するために最も良い行列を表現する。この特許は、複数の推論パラダイムを柔軟なフォールトトレランスシステムに組み合わせる際に有効性を可能にする。また、この特許は、人工ニューラルネットワークの収束、機械学習エージェントのアンサンブル(処理モジュールまたはエンティティ)、または任意のネットワークに必要な、計算リソースの有効性及び最適化を可能にする。この特許は、処理が進行していながら、システムが貧弱でノイズの多いデータにおける弱い信号に自己同調することを可能にする。
【0142】
また、このシステムは、ネットワーク内の、たとえば、サイバーセキュリティ、医療情報、シンボリック、セマンティック、及びウェブネットワーク内の、頂点または節点間の相対的なランク付けを計算する一意方法論を有する。ランク付け演算子は、入力または状態ベクトルのランク付けを計算し、互いに関して節点を順序付けする。これらの節点は、生データであることが可能であるが、好ましい実施形態において、エージェントである。換言すれば、ランク付け演算子は、グラフ内の節点の位置によって表現される状態である1つの状態ベクトルを、サブグラフ内の節点間のランクによって表現される状態であるもう1つの状態ベクトルへマッピングする。この特許は、PageRankによって使用されるような、既約性を強いるための「ファッジファクタ」を必要とせずに、一意の優勢な固有ベクトルへの収束を可能にする。また、この特許は、ランク付けベクトルの要素間で区別するために、より高次の精度を可能にする。これらの演算子は、基礎となるリレーショナルネットワーク構造の精密で正確な構成である。この特許は、2、3例を挙げると、情報取得、レコメンデーションエンジンなどのタスクについて個別化を可能にする。
【0143】
要約すると、この特許は、複数の推論パラダイムを柔軟なフォールトトレランスシステムに組み合わせる機械学習システムを構築する有効性、及び使用及び/または再利用のために学習された状態を格納する有効性の問題に対処する。我々は、このシステムを、モデル及びパターン構造オンライン単位的学習、またはMAPSOULと称する。
【0144】
MAPSOULは、これらのエージェントが利潤、損失、損益分岐のゲームにおいてプレイヤーとして機能することが可能であるように、ソフトウェアエージェントについての組織化原理として経済学を使用することによって、代理ランク付け演算子上に構築される。各プレイヤーは、それら自体の行動及び情報の関数としてそれら自体の帰結にわたる1セットの指向性確率密度分布(実数及び複素数)である環境の主観的モデルを有する。MAPSOULにおいて、1セットの主観的プレイヤー信念は、真の客観的分布(すなわち、無知の仮定)を含まない。これが顕著な要素であることを理解することが可能である。具体的に、すべてのエージェントは、データをクラス分けし、予測することに関して正しいと証明されるまでそれら自体が正しくないと仮定される。換言すれば、すべてのプレイヤーは、最大無知を常に想定しているため、推定は、反対への証拠の欠如が推定された仮説へ改訂または確約を可能にするまで、誤りとして扱われる。
【0145】
MAPSOULは、1サブセットのプレイヤー(処理モジュール)を、準備ができて待機しているプレイヤーのカタログから無作為に選択することによって機能する。1つの実施形態により、プレイヤーの無作為選択は、遺伝的アルゴリズム(Genetic Algorithm)により実行される。各プレイヤーは、部分的に、または完全に適切でない主観的モデルを有すると仮定される。プレイヤーモデルは、効用関数に関するペイオフ関連の目的関数にわたる1セットの選好に基づく。各プレイヤーは、データまたは環境についての信念が可能な1セットの信念の下で最適と想定される、最適な自己利益の戦略に従う。具体的に、ゲーム理論の観点から、これらのプレイヤーは、データによってプレイしているだけではなく、むしろ互いにプレイすることにより、彼らは、彼らのそれぞれの視点から互いについての予測を形成する。ナッシュ均衡の出現は、特定のコンテキストがデータから導入されていることを示す。すべてのコンテキスト(すなわち、すべてのナッシュ均衡のセット)が導入される場合、つぎにプレイヤーは、正しいモデルを学習した学習する機械であり、それらは、演繹マシンとして再利用されることが可能である。
【0146】
要約すると、MAPSOULは、クラウドにおける実行用のランタイムシステム(すなわち、ネットワーク上での分散された計算)と併せて高度な適応的かつ一般的な並列処理制御モデルを提供する。さらに、従来の方法と対照的に、MAPSOULは、以下の利点、
・不規則な汎用計算エージェントまたはアクターまたはプレイヤー、
・リソース(時間、メモリ、及びCPU消費)弾力性、
・インタラクション、同期、データ転送、局所性及びスケジューリングの抽象化、
・不規則に分散したプレイヤーの大規模セットを処理する能力、
・不規則に構造化されていないデータを処理する能力、ならびに
・フォールトトレランス、自己同調及び適応的回復、
を提供する。
【0147】
ある特定の実施態様が記載されているが、これらの実施態様は、実施例として提示されているに過ぎず、本開示の範囲を限定することを意図されない。本明細書に開示される新規のデバイス、システム及び方法は、多様な他の形態に具現化されることができ、さらに、本明細書に開示されるデバイス、システム及び方法の形態における、さまざまな省略、置換、及び変更は、本開示の趣旨から逸脱することなく行われることができる。添付の特許請求の範囲、及びそれらの均等物は、網羅されることを意図される。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10