特許第6105692号(P6105692)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ プライマル フュージョン インコーポレイテッドの特許一覧

特許6105692複雑な知識表現を分析および合成するシステムおよび方法
<>
  • 特許6105692-複雑な知識表現を分析および合成するシステムおよび方法 図000006
  • 特許6105692-複雑な知識表現を分析および合成するシステムおよび方法 図000007
  • 特許6105692-複雑な知識表現を分析および合成するシステムおよび方法 図000008
  • 特許6105692-複雑な知識表現を分析および合成するシステムおよび方法 図000009
  • 特許6105692-複雑な知識表現を分析および合成するシステムおよび方法 図000010
  • 特許6105692-複雑な知識表現を分析および合成するシステムおよび方法 図000011
  • 特許6105692-複雑な知識表現を分析および合成するシステムおよび方法 図000012
  • 特許6105692-複雑な知識表現を分析および合成するシステムおよび方法 図000013
  • 特許6105692-複雑な知識表現を分析および合成するシステムおよび方法 図000014
  • 特許6105692-複雑な知識表現を分析および合成するシステムおよび方法 図000015
  • 特許6105692-複雑な知識表現を分析および合成するシステムおよび方法 図000016
  • 特許6105692-複雑な知識表現を分析および合成するシステムおよび方法 図000017
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6105692
(24)【登録日】2017年3月10日
(45)【発行日】2017年3月29日
(54)【発明の名称】複雑な知識表現を分析および合成するシステムおよび方法
(51)【国際特許分類】
   G06F 17/30 20060101AFI20170316BHJP
   G06N 5/02 20060101ALI20170316BHJP
   G06F 17/27 20060101ALI20170316BHJP
【FI】
   G06F17/30 220Z
   G06F17/30 320D
   G06F17/30 419A
   G06N5/02
   G06F17/27 635
   G06F17/27 695
【請求項の数】20
【全頁数】49
(21)【出願番号】特願2015-164156(P2015-164156)
(22)【出願日】2015年8月21日
(62)【分割の表示】特願2013-515646(P2013-515646)の分割
【原出願日】2011年6月22日
(65)【公開番号】特開2016-28324(P2016-28324A)
(43)【公開日】2016年2月25日
【審査請求日】2015年9月24日
(31)【優先権主張番号】61/357,266
(32)【優先日】2010年6月22日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】511050240
【氏名又は名称】プライマル フュージョン インコーポレイテッド
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100091214
【弁理士】
【氏名又は名称】大貫 進介
(72)【発明者】
【氏名】アイリアス,イハブ,フランシス
(72)【発明者】
【氏名】スウィーニー,ピーター,ジョーゼフ
(72)【発明者】
【氏名】ハント,アニー,ジュード
(72)【発明者】
【氏名】ブラック,アレクサンダー デイヴィッド
【審査官】 樋口 龍弥
(56)【参考文献】
【文献】 特開2008−071320(JP,A)
【文献】 特開平06−168129(JP,A)
【文献】 特開平05−324713(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
G06F 17/27
G06N 5/02
(57)【特許請求の範囲】
【請求項1】
複雑な知識表現を合成するための、コンピュータにより実施される方法であって、
データ消費者からコンテキストを受領する段階と、
前記コンテキストに従って、第一の概念を含む一つ以上の要素的な構成要素を、一つ以上の内因的関係、外因的関係またはこれらのいくつかの組み合わせを含む要素的な知識表現において、同定する段階と、
少なくとも一つのプロセッサによる記憶された命令の実行を介して、前記一つ以上の要素的な構成要素に一つ以上の規則を適用して、(a)前記要素的な知識表現に存在しなかった、前記第一の概念と第二の概念との間の外因的関係、および/または(b)前記要素的な知識表現に存在しなかった、前記第一の概念に要素的概念を結び付けることによる複雑な概念、のうち少なくとも一つをエンコードする複雑な知識表現を合成する段階と、
を含み、
前記一つ以上の規則を適用することは、前記コンテキストに基づいて、合成される前記複雑な知識表現の知識表現型を決定することと、前記の決定された知識表現型に対応する1つ以上の知識処理規則を適用することとを含む
コンピュータにより実施される方法。
【請求項2】
前記要素的な知識表現における、および/または前記複雑な知識表現における前記内因的関係は、複雑な概念を生成するようにセットにおいて概念を結び付ける、請求項1記載のコンピュータにより実施される方法。
【請求項3】
前記複雑な知識表現を合成する段階は、前記複雑な知識表現において、前記第一の概念と該第一の概念を前記要素的概念に結び付けることにより生成される前記複雑な概念との間の内因的関係をエンコードすることを含む、請求項2記載のコンピュータにより実施される方法。
【請求項4】
前記第一の概念と、前記複雑な概念を生成するように前記第一の概念に結び付けられる前記要素的概念とは、前記複雑な概念のための概念定義を形成する、請求項3記載のコンピュータにより実施される方法。
【請求項5】
前記複雑な知識表現を合成する段階は、前記複雑な知識表現において、前記第一の概念および前記複雑な概念の間の前記内因的関係と前記第一の概念および前記第二の概念の間の前記外因的関係との双方をエンコードすることを含む、請求項3記載のコンピュータにより実施される方法。
【請求項6】
前記要素的な知識表現における、および/または前記複雑な知識表現における前記外因的関係は、概念対の間の特徴を記述する、請求項5記載のコンピュータにより実施される方法。
【請求項7】
前記第一の概念と前記第二の概念との間の前記外因的関係は、前記第一の概念と前記第二の概念との間の階層的関係をエンコードする、請求項6記載のコンピュータにより実施される方法。
【請求項8】
少なくとも1つのプロセッサに複雑な知識表現を合成する方法を実行させるコンピュータプログラムであって、前記方法は、
データ消費者からコンテキストを受領する段階と、
前記コンテキストに従って、第一の概念を含む一つ以上の要素的な構成要素を、一つ以上の内因的関係、外因的関係またはこれらのいくつかの組み合わせを含む要素的な知識表現において、同定する段階と、
少なくとも一つのプロセッサによる記憶された命令の実行を介して、前記一つ以上の要素的な構成要素に一つ以上の規則を適用して、(a)前記要素的な知識表現に存在しなかった、前記第一の概念と第二の概念との間の外因的関係、および/または(b)前記要素的な知識表現に存在しなかった、前記第一の概念に要素的概念を結び付けることによる複雑な概念、のうち少なくとも一つをエンコードする複雑な知識表現を合成する段階と、
を含み、
前記一つ以上の規則を適用することは、前記コンテキストに基づいて、合成される前記複雑な知識表現の知識表現型を決定することと、前記の決定された知識表現型に対応する1つ以上の知識処理規則を適用することとを含む
コンピュータプログラム
【請求項9】
前記要素的な知識表現における、および/または前記複雑な知識表現における前記内因的関係は、複雑な概念を生成するようにセットにおいて概念を結び付ける、請求項8記載のコンピュータプログラム
【請求項10】
前記複雑な知識表現を合成する段階は、前記複雑な知識表現において、前記第一の概念と該第一の概念を前記要素的概念に結び付けることにより生成される前記複雑な概念との間の内因的関係をエンコードすることを含む、請求項9記載のコンピュータプログラム
【請求項11】
前記第一の概念と、前記複雑な概念を生成するように前記第一の概念に結び付けられる前記要素的概念とは、前記複雑な概念のための概念定義を形成する、請求項10記載のコンピュータプログラム
【請求項12】
前記複雑な知識表現を合成する段階は、前記複雑な知識表現において、前記第一の概念および前記複雑な概念の間の前記内因的関係と前記第一の概念および前記第二の概念の間の前記外因的関係との双方をエンコードすることを含む、請求項10記載のコンピュータプログラム
【請求項13】
前記要素的な知識表現における、および/または前記複雑な知識表現における前記外因的関係は、概念対の間の特徴を記述する、請求項12記載のコンピュータプログラム
【請求項14】
前記第一の概念と前記第二の概念との間の前記外因的関係は、前記第一の概念と前記第二の概念との間の階層的関係をエンコードする、請求項13記載のコンピュータプログラム
【請求項15】
少なくとも一つのプロセッサと、
プロセッサ実行可能命令を記憶する少なくとも一つの記憶媒体と、
を含み、
前記プロセッサ実行可能命令は、前記少なくとも一つのプロセッサにより実行されると、複雑な知識表現を合成する方法を実行し、前記方法は、
データ消費者からコンテキストを受領する段階と、
前記コンテキストに従って、第一の概念を含む一つ以上の要素的な構成要素を、一つ以上の内因的関係、外因的関係またはこれらのいくつかの組み合わせを含む要素的な知識表現において、同定する段階と、
前記一つ以上の要素的な構成要素に一つ以上の規則を適用して、(a)前記要素的な知識表現に存在しなかった、前記第一の概念と第二の概念との間の外因的関係、および/または(b)前記要素的な知識表現に存在しなかった、前記第一の概念に要素的概念を結び付けることによる複雑な概念、のうち少なくとも一つをエンコードする複雑な知識表現を合成する段階と、
を含み、
前記一つ以上の規則を適用することは、前記コンテキストに基づいて、合成される前記複雑な知識表現の知識表現型を決定することと、前記の決定された知識表現型に対応する1つ以上の知識処理規則を適用することとを含む
装置。
【請求項16】
前記要素的な知識表現における、および/または前記複雑な知識表現における前記内因的関係は、複雑な概念を生成するようにセットにおいて概念を結び付ける、請求項15記載の装置。
【請求項17】
前記複雑な知識表現を合成する段階は、前記複雑な知識表現において、前記第一の概念と該第一の概念を前記要素的概念に結び付けることにより生成される前記複雑な概念との間の内因的関係をエンコードすることを含む、請求項16記載の装置。
【請求項18】
前記第一の概念と、前記複雑な概念を生成するように前記第一の概念に結び付けられる前記要素的概念とは、前記複雑な概念のための概念定義を形成する、請求項17記載の装置。
【請求項19】
前記複雑な知識表現を合成する段階は、前記複雑な知識表現において、前記第一の概念および前記複雑な概念の間の前記内因的関係と前記第一の概念および前記第二の概念の間の前記外因的関係との双方をエンコードすることを含む、請求項17記載の装置。
【請求項20】
前記要素的な知識表現における、および/または前記複雑な知識表現における前記外因的関係は、概念対の間の特徴を記述する、請求項19記載の装置。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
本願は、その全体がここに参照によって組み込まれる、2010年6月22日に出願された"Systems and Methods for Analyzing and Synthesizing Complex Knowledge Representations"という名称の米国仮出願第61/357,266号の利益を主張する。本願はまた、同じ発明者および/または被譲渡者によって出願された下記のものを含むいくつかの先願に開示されている概念の上に構築されるものでもある。読者は下記で論じることに加えた背景についてはこれらを参照されたい:2011年6月15日に出願された"Systems and Methods for Analyzing and Synthesizing Complex Knowledge Representations"という名称の米国特許出願第13/161,165号;2009年6月4日に出願された"System, Method and Computer Program for Transforming an Existing Complex Data Structure to Another Complex Data Structure"という名称の米国特許出願第12/477,977号;2006年8月31日に出願された"Complex-Adaptive System for Providing a Faceted Classification"という名称の米国特許出願第11/469,258号、今では米国特許第7,596,574号;および2006年3月30日に出願された"System, Method, and Computer Program for Constructing and Managing Dimensional Information Structures"米国特許出願第11/392,937号。
【背景技術】
【0002】
大まかにいうと、知識表現は、機械ベースの蓄積、管理および推論システムを支援するために抽象的な知識を具体的なデータ構造として明示的にする活動である。系統分類、シソーラスおよびファセット分類といった構造化された制御された語彙;意味ネットワークおよびオントロジーといった形式的指定;および自然言語に基づく文書のような構造化されていない形を含む、さまざまな型の知識表現モデルに従って構築された知識表現(KR: knowledge representation)を利用するための従来型の方法およびシステムが存在している。
【0003】
系統分類(taxonomy)は、カテゴリーを階層構造木に整理し、カテゴリーを、物理的な品目、文書または他のデジタル・コンテンツといった関連のあるオブジェクトと関連付けるKR構造である。系統分類におけるカテゴリーまたは概念は典型的には、上位型‐下位型〔スーパータイプ‐サブタイプ〕関係、一般化‐特殊化関係または親子関係としても知られる継承(inheritance)関係を使って整理される。そのような関係では、子カテゴリーまたは概念はその親と同じ属性、挙動および制約に加えて一つまたは複数の追加的な属性、挙動および制約をもつ。たとえば、「犬は哺乳類である」という知識の陳述は、系統分類では、「哺乳類」および「犬」とラベル付けされた概念/カテゴリーが親子の階層関係によってリンクされることによってエンコードできる。そのような表現は、犬(子概念)が哺乳類(親概念)の一つの型であるが、すべての哺乳類が必ずしもいぬではないという知識をエンコードする。
【0004】
シソーラス(thesaurus)は、情報検索のために使われる検索キーのような用語を表現するKRであり、しばしば単一単語の諸名詞概念としてエンコードされる。シソーラスにおける用語/概念間のリンクは典型的には次の三つの型の関係に分類される:階層的関係、等価関係および連想関係。階層的関係は、系統分類における概念間の関係と同様に、相手より狭いまたはより広い範囲の用語をリンクするために使われる。先の例を続けると、「犬」および「哺乳類」は階層関係によってリンクされる用語である。等価関係は、同義語または類義語のような、検索用語として互いの代用にできる用語をリンクする。たとえば、用語「犬」および「イヌ科動物」はコンテキストによっては等価関係を通じてリンクできる。連想関係は、階層的でも等価でもない関係をもつ関係した用語をリンクする。たとえば、用語「犬」を検索するユーザーは「ブリーダー」の検索から返される項目も見たがることがあり、その対の用語についてシソーラス・データ構造中で連想関係がエンコードされる。
【0005】
ファセット分類(faceted classification)は、情報は多次元性をもち、多くの異なる仕方で分類できるという原理に基づいている。ある情報ドメインの諸主題は、この次元性を表現するためにファセット(あるいはより平たくいうとカテゴリー)に細分される。ドメインの属性はファセット階層において関係付けされる。次いでドメイン内のオブジェクトはこれらの属性に基づいて記述され、分類される。たとえば、物理的なまたはウェブ・ベースの衣料店で売りに出されている衣類の集合は、色ファセット、素材ファセット、スタイル・ファセットなどを使って分類でき、各ファセットは色、素材、スタイルなどの種々の型を表現するいくつかの階層的な属性をもつ。ファセット分類はしばしば、たとえばユーザーが、まず色、次にスタイルによって、まずスタイル、次に色によって、まず素材、次に色、次にスタイルによって、など任意の所望されるファセット順で、あるいは他の任意の所望されるファセット優先順位で衣類の集合を検索できるようにするファセット検索システムにおいて使われる。そのようなファセット分類は、カテゴリーの階層が固定されている系統分類を通じた分類とは対照的である。
【0006】
意味ネットワーク(semantic network)は、概念間の意味的関係のさまざまな型を表現するネットワーク構造、またはネットワーク構造をエンコードするまたはインスタンス化するデータ構造である。意味ネットワークは典型的には、概念を表すバーテックスと、対の概念をリンクする関係の型でラベル付けされたエッジとからなる有向または無向のグラフとして表現される。意味ネットワークの一例は、英語の語彙データベースWordNetである。WordNetにおいて定義されている意味上の関係のいくつかの一般的な型は、部分関係(AはBの一部)、包摂関係(AはBの一種)、同義関係(AはBと同じことを表す)、反意関係(AはBの反対を表す)である。
【0007】
オントロジー(ontology)は、それを使ってモデル化しようとする現実世界または仮想世界の特定のドメインに制約された概念および概念間の関係をエンコードするKR構造である。オントロジーに含まれる概念は典型的には、モデル化または分類されるドメインに適用されるときの用語の特定の意味を表し、含められる概念関係は典型的には、そのドメイン内でそれらの概念が関係付けられる仕方を表す。たとえば、単語「カード」に対応する概念は、ポーカーのドメインについてのオントロジーとコンピュータ・ハードウェアのドメインに関するオントロジーでは異なる意味をもつことがある。
【発明の概要】
【発明が解決しようとする課題】
【0008】
一般に、上で論じた型のKRのすべては、他の従来例と同様、抽象概念としての人間の知識およびそれらの概念間の関係をモデル化するとともにさまざまな知識要求タスクを実行するためにその知識をコンピュータのような機械にとってアクセス可能にするためのツールである。よって、人間のユーザーおよびソフトウェア開発者は従来、自分の人間の知識を使ってKRデータ構造を構築し、完成されたKRデータ構造を、機械メモリに記憶され、さまざまな機械実行される機能によってアクセスされるデータ構造として、機械可読な形にエンコードすることを、手動で行っていた。
【課題を解決するための手段】
【0009】
ある実施形態は、複雑な知識表現を生成する方法であって、要求コンテキストを示す入力を受け取る段階と;プロセッサにより、少なくとも一つの要素的概念、少なくとも一つの要素的概念関係または少なくとも一つの要素的概念および少なくとも一つの要素的概念関係を表す要素的データ構造に一つまたは複数の規則を適用する段階と;前記一つまたは複数の規則の適用に基づいて、前記要求コンテキストに従って、一つまたは複数の追加的概念、一つまたは複数の追加的概念関係または一つまたは複数の追加的概念および一つまたは複数の追加的概念関係を合成する段階と;前記追加的概念の少なくとも一つ、前記追加的概念関係の少なくとも一つまたは前記追加的概念の少なくとも一つおよび前記追加的概念関係の少なくとも一つを使って、前記要求コンテキストに従って複雑な知識表現を生成する段階とを含む方法に向けられる。
【0010】
もう一つの実施形態は、プロセッサ実行可能な命令を記憶している少なくとも一つの非一時的コンピュータ可読記憶媒体を有する、複雑な知識表現を生成するシステムであって、前記命令は、少なくとも一つのプロセッサによって実行されたときに、要求コンテキストを示す入力を受け取る段階と;少なくとも一つの要素的概念、少なくとも一つの要素的概念関係または少なくとも一つの要素的概念および少なくとも一つの要素的概念関係を表す要素的データ構造に一つまたは複数の規則を適用する段階と;前記一つまたは複数の規則の適用に基づいて、前記要求コンテキストに従って、一つまたは複数の追加的概念、一つまたは複数の追加的概念関係または一つまたは複数の追加的概念および一つまたは複数の追加的概念関係を合成する段階と;前記追加的概念の少なくとも一つ、前記追加的概念関係の少なくとも一つまたは前記追加的概念の少なくとも一つおよび前記追加的概念関係の少なくとも一つを使って、前記要求コンテキストに従って複雑な知識表現を生成する段階とを実行する、システムに向けられる。
【0011】
もう一つの実施形態は、複雑な知識表現を生成するための複数のコンピュータ実行可能な命令をエンコードされた少なくとも一つの非一時的コンピュータ可読記憶媒体であって、前記命令は、実行されたときに、要求コンテキストを示す入力を受け取る段階と;少なくとも一つの要素的概念、少なくとも一つの要素的概念関係または少なくとも一つの要素的概念および少なくとも一つの要素的概念関係を表す要素的データ構造に一つまたは複数の規則を適用する段階と;前記一つまたは複数の規則の適用に基づいて、前記要求コンテキストに従って、一つまたは複数の追加的概念、一つまたは複数の追加的概念関係または一つまたは複数の追加的概念および一つまたは複数の追加的概念関係を合成する段階と;前記追加的概念の少なくとも一つ、前記追加的概念関係の少なくとも一つまたは前記追加的概念の少なくとも一つおよび前記追加的概念関係の少なくとも一つを使って、前記要求コンテキストに従って複雑な知識表現を生成する段階とを実行する、記憶媒体に向けられる。
【0012】
もう一つの実施形態は、もとの知識表現を分解する方法であって、もとの知識表現に対応する入力を受け取る段階と;プロセッサにより一つまたは複数の規則を適用して前記もとの知識表現を一つまたは複数の要素的概念、一つまたは複数の要素的概念関係または一つまたは複数の要素的概念および一つまたは複数の要素的概念関係に分解する段階と;前記要素的概念の少なくとも一つ、前記要素的概念関係の少なくとも一つまたは前記要素的概念の少なくとも一つおよび前記要素的概念関係の少なくとも一つを要素的データ構造に含める段階とを含む方法に向けられる。
【0013】
もう一つの実施形態は、プロセッサ実行可能な命令を記憶している少なくとも一つの非一時的コンピュータ可読記憶媒体を有する、もとの知識表現を分解するシステムであって、前記命令は、少なくとも一つのプロセッサによって実行されたときに、もとの知識表現に対応する入力を受け取る段階と;一つまたは複数の規則を適用して前記もとの知識表現を一つまたは複数の要素的概念、一つまたは複数の要素的概念関係または一つまたは複数の要素的概念および一つまたは複数の要素的概念関係に分解する段階と;前記要素的概念の少なくとも一つ、前記要素的概念関係の少なくとも一つまたは前記要素的概念の少なくとも一つおよび前記要素的概念関係の少なくとも一つを要素的データ構造に含める段階とを実行する、システムに向けられる。
【0014】
もう一つの実施形態は、もとの知識表現を分解するための複数のコンピュータ実行可能な命令をエンコードされた少なくとも一つの非一時的コンピュータ可読記憶媒体であって、前記命令は、実行されたときに、もとの知識表現に対応する入力を受け取る段階と;一つまたは複数の規則を適用して前記もとの知識表現を一つまたは複数の要素的概念、一つまたは複数の要素的概念関係または一つまたは複数の要素的概念および一つまたは複数の要素的概念関係に分解する段階と;前記要素的概念の少なくとも一つ、前記要素的概念関係の少なくとも一つまたは前記要素的概念の少なくとも一つおよび前記要素的概念関係の少なくとも一つを要素的データ構造に含める段階とを実行する、記憶媒体に向けられる。
【0015】
もう一つの実施形態は、知識表現間の意味的相互運用性を支援する方法であって、複数の入力知識表現のうちの各入力知識表現について、プロセッサにより一つまたは複数の規則を適用して前記入力知識表現を一つまたは複数の要素的概念、一つまたは複数の要素的概念関係または一つまたは複数の要素的概念および一つまたは複数の要素的概念関係に分解する段階と;プロセッサにより、前記複数の入力知識表現のそれぞれについての前記要素的概念の少なくとも一つ、前記要素的概念関係の少なくとも一つまたは前記要素的概念の少なくとも一つおよび前記要素的概念関係の少なくとも一つの表現を、共有される要素的データ構造に含める段階とを含む方法に向けられる。
【0016】
もう一つの実施形態は、プロセッサ実行可能な命令を記憶している少なくとも一つの非一時的コンピュータ可読記憶媒体を有する、知識表現間の意味的相互運用性を支援するシステムであって、前記命令は、少なくとも一つのプロセッサによって実行されたときに、複数の入力知識表現のうちの各入力知識表現について、一つまたは複数の規則を適用して前記入力知識表現を一つまたは複数の要素的概念、一つまたは複数の要素的概念関係または一つまたは複数の要素的概念および一つまたは複数の要素的概念関係に分解する段階と;前記複数の入力知識表現のそれぞれについての前記要素的概念の少なくとも一つ、前記要素的概念関係の少なくとも一つまたは前記要素的概念の少なくとも一つおよび前記要素的概念関係の少なくとも一つの表現を、共有される要素的データ構造に含める段階とを実行する、システムに向けられる。
【0017】
もう一つの実施形態は、知識表現間の意味的相互運用性を支援するための複数のコンピュータ実行可能な命令をエンコードされた少なくとも一つの非一時的コンピュータ可読記憶媒体であって、前記命令は、実行されたときに、複数の入力知識表現のうちの各入力知識表現について、一つまたは複数の規則を適用して前記入力知識表現を一つまたは複数の要素的概念、一つまたは複数の要素的概念関係または一つまたは複数の要素的概念および一つまたは複数の要素的概念関係に分解する段階と;前記複数の入力知識表現のそれぞれについての前記要素的概念の少なくとも一つ、前記要素的概念関係の少なくとも一つまたは前記要素的概念の少なくとも一つおよび前記要素的概念関係の少なくとも一つの表現を、共有される要素的データ構造に含める段階とを実行する、記憶媒体に向けられる。
【0018】
以上は、本発明の限定しない概要であり、本発明は付属の請求項によって定義される。
【図面の簡単な説明】
【0019】
付属の図面は、縮尺通りに描くことは意図していない。図面において、さまざまな図に示される同一またはほぼ同一の各コンポーネントは同様の数字によって表されている。明確のため、すべての図においてすべてのコンポーネントにラベル付けすることはしていない。
図1】本発明のいくつかの実施形態に基づく原子的な知識表現モデルを実装するための例示的なシステムを示すブロック図である。
図2A】本発明のいくつかの実施形態に基づく例示的な複雑な知識表現を示す図である。
図2B】本発明のいくつかの実施形態に基づく原子的な知識表現モデルの例示的な要素的データ構造を示す図である。
図3】本発明のいくつかの実施形態に基づく例示的なデータ・スキーマを示す図である。
図4】本発明のいくつかの実施形態に基づく複雑な知識表現の分析のための例示的な方法を示す図である。
図5】本発明のいくつかの実施形態に基づく複雑な知識表現の分析および合成を実装する例示的な分散型システムを示すブロック図である。
図6】本発明のいくつかの実施形態に基づく、要素的データ構造を生成するために複雑な知識表現を分析するための例示的な方法を示すフローチャートである。
図7】本発明のいくつかの実施形態に基づく、要素的データ構造から複雑な知識表現を合成するための例示的な方法を示すフローチャートである。
図8】本発明のいくつかの実施形態に基づく、知識処理規則の例示的な集合を示す表である。
図9】例示的な自然言語テキストから導出されうる知識表現の例を示す図である。
図10】例示的なシソーラスから分析されうる要素的データ構造の例を示す図である。
図11】本発明のいくつかの実施形態を実施する際に使う例示的なコンピューティング・システムを示すブロック図である。
【発明を実施するための形態】
【0020】
上記で論じたように、従来の方法を通じて生成される知識表現(KR)データ構造は、特定のドメインまたはコンテキストについてモデル化される人間の知識の特定の集合をエンコードし、表現する。KRは典型的には人間の開発者によって構築され、完成された形で機械メモリ中にプログラムされるので、従来のKRは、人間のユーザーによってもともとプログラムされたときに使われた人間の知識の部分集合しか含まない。
【0021】
たとえば、KRは「犬は哺乳類である」という知識陳述をエンコードしてもよく、哺乳類である動物についての、「哺乳類は子を養うために乳を出す」といった陳述または主張をも表してもよい。本発明者は、事実のそのような組み合わせは、適切な論理的および意味的規則と組み合わされるとき、「犬は子を養うために乳を出す」のような、KR内に事実として最初に植え付けられたのでないさまざまな明示的な推定をして、幅広い範囲の人間の推論を支援できることを認識するに至った。本発明者は、そのような推定を通じたKRデータ構造の拡張が、推定/推論(上例のような)、情報検索、データ・マイニングおよび他の形の分析といった、多様な知識ベースの活動およびタスクを支援するために使用されうることを認識するに至った。
【0022】
しかしながら、上で論じたように、KRを構築し、エンコードする方法は従来、コンピュータのような機械によるアクセスおよび使用のために完全なKR構造を手動入力することに限られていた。上記の例を続けると、KR設計者としてはたらく人間は、「犬は子を養うために乳を出す」という事実がなぜ真実なのかを暗黙のうちに理解しうるが、それを真実にするために成り立つ必要がある属性(この場合、推移性(transitivity)および継承(inheritance))は従来はKRの明示的な部分ではなかった。換言すれば、新しい知識の生成を案内しうる根本的な規則の集合が従来はKRの一部としてエンコードされず、KRの構築においてシステム外から人間の設計者によって加えられていた。
【0023】
従来のアプローチの、これまで認識されていなかった帰結は、知識は機械による使用のためにKRにおいて表現されることができるが、KR自身は機械によって生成されることができないということである。人間が、機械の消費のために知識の諸ドメインをモデル化することを強いられる。残念ながら、人間の知識は途方もなく広く、多くの場合主観的なので、あらゆる知識ドメインをモデル化することは技術的に実現可能ではない。
【0024】
さらに、知識のあまりに多くがデータとして明示的にエンコードされる必要があるので、結果として得られるデータ構造は、知識のドメインが成長するにつれてたちまち膨大な大きさになる。従来のKRは、知識生成のための基礎的な理論または実践を、知識表現モデルを構成するデータの一部としてエンコードされていないので、結果として得られるデータ構造は非常に複雑で、扱いにくいものとなることがある。換言すれば、知識表現は機械によって生成されることができないので、従来は、明示的なデータとして与えられるか、そうでなければ論理的または統計的な手段によって演繹または帰納される必要があった。
【0025】
このように、KRへの従来のアプローチはいくつかの問題につながる。
【0026】
大きくて複雑なデータ構造:従来、知識表現をエンコードするデータ構造は、構築し、維持するには複雑である。(犬と哺乳類についての単純な陳述のような)機械可読知識の比較的簡単なドメインでさえ、その自然言語の対応物より数桁大きいデータ量を生成しうる。
【0027】
ドメイン専門家への依存性:KRの実施を方向付ける根本的な理論は、KRデータ構造の従来の生成では、人間によって表現される必要がある。これは、これらの不可欠なデータ資産の生産において大半の人およびすべての機械を排除する、時間のかかる活動である。結果として、これまでの人間の知識の大半は、黙示的なものであり、コンピューティングの領分の外に留まっていた。
【0028】
使用前に生成されるデータ:従来、知識は、具体的な使用のために求められる時点より前にデータとしてモデル化される。これは高価であり、その知識が必要とされない場合、無駄になる可能性がある。したがって、本発明者は、知識が必要に応じてのみ機械によって生成されることができるならば、データ生産および記憶の要件を大幅に削減しうることを認識するに至った。
【0029】
大規模データおよび処理コスト:従来のKRシステムは、新しい事実を生成するまたは問い合わせに答えるサービスにおいて、非常に大きなデータ構造上で推論する必要があった。規模のこの重荷は、従来のKRシステムにおける著しい難題を表している。使用前にデータをという従来の方法ではなく、基礎になるデータ構造を生成するためにもっとジャストインタイム方式を使うことによって削減できる重荷である。
【0030】
統合および相互運用性の難題:意味的相互運用性(二つの異なるKRが知識を共有できること)は、しばしば主観的で曖昧な主題を扱うさまざまなKRが異なるモデルのもとで生成され、異なる仕方で表現されるとき、著しく困難な難題である。精確に推論できる能力および精度はしばしば、複数の異なるKRをまたがる場合には失われる。この点で、本発明者は、知識がどのようにして生成されたかについての基礎となる理論がKRの一部として含まれるなら、異なるKRにまたがる知識の折り合いを付けることが手に負える課題となりうることを認識するに至った。
【0031】
したがって、本開示に基づくいくつかの実施形態は、知識表現を生成するプロセスを自動化するための知識生成規則をエンコードするシステムを提供する。いくつかの実施形態は、知識表現への新しい合成アプローチを、そのようなアプローチから導かれる結果的なデータ構造を生成し、管理するためのコンピューティング・システムと組み合わせる。
【0032】
ドメイン内のすべての知識を明示的なデータとしてモデル化するのではなく、いくつかの実施形態は、より圧縮された(原子的な)データ・セットを、基礎になる知識生成をエンコードする生成規則の集合と組み合わせる。そのような規則は、いくつかの実施形態では、新しい知識を生成し、それをデータとして明示的に表現することが必要とされるまたは所望されるときに、システムによって適用されうる。上記の議論から、そのような技術の利益は、少なくともいくつかの状況では、システム中のデータの量を実質的に減らすとともに、新しい知識の機械ベースの生成(合成)のための新たな機能および応用を提供することでありうることが理解できるはずである。しかしながら、本発明に基づくすべての実施形態が従来のアプローチのすべての同定された問題に対処しうるわけではなく、実施形態によってはこれらの問題のいずれにも対処しないこともありうることは理解しておくべきである。実施形態によっては、ここに記載される以外の問題に対処することもありうる。さらに、すべての実施形態が本稿で論じられる利益のすべてまたはいずれかを提供するわけではなく、実施形態によっては記載されていない他の利益を提供することもありうる。
【0033】
いくつかの実施形態は、データ・レベルだけでなく、意味レベルでも相互運用するよう(意味の相互運用性)、系統分類、オントロジーおよびファセット分類のような複雑な知識表現のための技法をも提供する。
【0034】
いくつかの実施形態によって与えられることがあり、多くの新しいおよび既存の応用分野を通じて適用されうる他の利益は次のようなものを含む:より単純でより経済的なデータ構造によって与えられる知識表現の生産および適応の両方におけるコストの低下;新たな知識生成のための可能性;必要に応じたジャストインタイムの知識によって与えられる、よりスケーラブルなシステム;ユーザーおよびデータ消費者からの入力変数としての「コンテキスト」の支援。知識表現データ構造を生成するためにジャストインタイム式に合成および分析知識処理規則を適用する本開示に基づくいくつかの実施形態の動的な性質は、前もって知識のドメイン全体を分析し、モデル化する従来の方法より多くの経済上の利益を提供しうる。
【0035】
基礎になる知識生成の規則の集合をKR内に組み込むことによって、システム中のデータの量が削減でき、データ管理のより経済的なシステムを提供するとともに、知識管理のための全く新しい応用を提供する。このように、いくつかの実施形態では、必要とされてはじめてデータが生成されることにより、KRシステムの生産および維持のコストが、データ・スケーラビリティの重荷を減らすことによって削減されうる。ひとたび生成されたら、いくつかの実施形態では複雑な知識をモデル化するデータ構造は、当座のタスクに関連するデータのみを含むという点で、従来システムより比較的小さい。これはひいては、これらの知識モデル上で機能する推論エンジンまたはデータ・マイニング・ツールのような下流のアプリケーションのコストを削減しうる。
【0036】
本開示に基づくいくつかの実施形態の合成的な計算されたアプローチは、知識表現およびデータ管理における全く新しい機能をもサポートする。いくつかの実施形態は、「可能性」、すなわち既存のデータからの全く新しい知識の表現の生成のための改善されたサポートを提供しうる。たとえば、可能性のそのような機能は、教育、報道および芸術のような創造的な活動のために有用となりうる。
【0037】
図1は、本発明のいくつかの実施形態に基づく、複雑な知識表現(KR)の分析および合成に関わる原子的知識表現モデル(AKRM: atomic knowledge representation model)を実装するためにいくつかの実施形態において用いられうる例示的なシステム100を示している。例示的なシステム100では、AKRMはコンピュータ可読データとしてエンコードされ、一つまたは複数の有形の非一時的なコンピュータ可読記憶媒体上に記憶されていてもよい。たとえば、AKRMは、のちに例示する不揮発性コンピュータ・メモリ内のデータ・セット110に、要素的な知識表現データ構造および複雑な知識表現データ構造の両方をサポートするよう設計されたデータ・スキーマとともに記憶されていてもよい。
【0038】
いくつかの実施形態では、AKRMは一つまたは複数の要素的データ構造120および一つまたは複数の知識処理規則130を含んでいてもよい。いくつかの実施形態では、規則130は、要素的データ構造120を生成するために一つまたは複数の複雑なKRを分解(分析)するために、システム100によって使用されてもよい。たとえば、システム100は、一つまたは複数のコンピュータ・プロセッサおよび一つまたは複数のコンピュータ・メモリ・ハードウェア・コンポーネントを含んでいてもよい。メモリは、前記一つまたは複数のプロセッサによって実行されたときに、システム100の前記一つまたは複数のプロセッサに、AKRMの要素的データ構造120を生成するための一つまたは複数の複雑なKRの分析において規則130を使わせるコンピュータ実行可能命令をエンコードされていてもよい。メモリはまた、要素的データ構造120から新たな複雑なKRを合成するために規則130を使うよう前記一つまたは複数のプロセッサをプログラムする命令をもエンコードされていてもよい。いくつかの実施形態では、コンピュータ・メモリは、実行されたときに本稿に記載される機能のいずれかを一つまたは複数のプロセッサに実行させるコンピュータ実行可能命令をエンコードされた、一つまたは複数の有形の、非一時的なコンピュータ可読記憶媒体として実装されてもよい。
【0039】
これまでの知識表現システムとは異なり、システム100のような、本発明のいくつかの実施形態に基づくシステムは、データ構造と、データとしてエンコードされた知識表現モデルを生成するための知識処理規則とを組み合わせてもよい。いくつかの実施形態では、規則は知識として(たとえば、特定のドメイン内の知識の境界または制約条件を記述する規則または公準として)エンコードされるのではなく、新たな知識を表現するデータ構造を生成するための構築的または分解的な規則としてエンコードされるのでもよい。もとのKRによって与えられた明示的な概念の論理的な帰結である暗黙的な事実を生成するための「推論規則」に加えて、いくつかの実施形態では、知識表現モデルは、もとのKRデータ構造から黙示されていなくてもよい新たな知識を生成するために適用できる「知識処理規則」をエンコードされていてもよい。
【0040】
たとえば、「メアリーは人である」および「すべての人は人間である」という二つの明示的な知識陳述から出発して、推論規則が適用され、黙示された知識の陳述「メアリーは人間である」を判別しうる。これは先の二つの陳述の論理的な帰結である。本発明のいくつかの実施形態に基づく異なる例では、「メアリーはボブの友人である」および「ボブはチャーリーの友人である」という二つの明示的な知識陳述から出発して、友人関係の意味をモデル化する例示的な知識処理規則が適用されて、「メアリーはチャーリーの友人である」という新たな知識陳述を判別してもよい。注目すべきことに、そのような知識処理規則の適用は、必ずしももとの入力KRで与えられている明示的な知識の論理的な帰結ではない新たな知識を与えることがある。上記のように、概念および概念関係をエンコードするデータ構造と関連付けて記憶されている知識処理規則を(論理的な推論規則ではなくまたは論理的な推論規則に加えて)含む本発明のいくつかの実施形態に基づく知識表現モデルは、新しい、黙示されていない可能性もある知識がいかにして生成および/または分解されることができるかの枠組みをモデル化しうる。
【0041】
知識の合成に対するそのようなフォーカスは、システム100のようなシステムを新しい応用分野に動かしうる。既存のシステムは演繹的な推論(すなわち、既存の事実および議論からの厳密な演繹を通じて洞察が得られる)に焦点を当てる一方、本発明のいくつかの実施形態に基づくシステムは、帰納的な推論および他の型の理論構築(すなわち、新たな知識の確率論的な予測をサポートするために既存の事実が利用されうる)をサポートしうる。
【0042】
本発明に基づくいくつかの実施形態では、システム100のようなシステムは、意味的プリミティブ(たとえば「原子的」または「要素的」概念)と、より複雑な知識を生成するためにそのような原子的構造がどのように組み合わされることができるかを案内する規則(原理)とをエンコードする、概念的意味論(conceptual semantics)の枠組みにゆるく基づいていてもよい。しかしながら、本発明の実施形態に基づくシステムは多くのそのような枠組み内で機能できることは理解しておくべきである。本発明の諸側面は、知識表現のいかなる特定の理論、モデルまたは実践にも限定されない。いくつかの実施形態では、システム100のようなシステムは、これらの枠組みをモデル化する幅広い範囲の(たとえばソフトウェア・アプリケーションまたはコンポーネントとして実装される)方法および技術とインターフェースをもつよう設計されてもよい。たとえば、分析エンジン150のような分析コンポーネントとインターフェースをもたせれば、入力された複雑なKR 160を要素的データ構造120に分解しうる。合成エンジン170のような合成コンポーネントは、要素的データ構造120を使って新しい出力される複雑なKR 190を構築しうる。
【0043】
いくつかの実施形態では、分析エンジン150は、たとえばシステム100の一つまたは複数のプロセッサによる適切なコンピュータ可読命令の実行を通じて、知識処理規則130の一つまたは複数を適用することによって入力された複雑なKR160を分析し、入力されたKR 160のデータ構造をより要素的な構造体に分解してもよい。いくつかの実施形態では、AKRM 110の要素的データ構造120内に含まれる最も要素的な構造体は、総体として、入力データ構造を分類するために用いる情報担持能(information-carrying capacity)を提供する、情報および情報関係の根本的な構成ブロックの最小の集合を表していてもよい。入力KR 160は、システム100と対話するユーザーまたはソフトウェア・アプリケーションからの直接入力を含め、いかなる好適な源から得られてもよい。いくつかの実施形態では、入力KR 160は、リレーショナルまたはグラフ・ベースのデータベース・システムといったさまざまなデータベース技術とインターフェースをもつことを通じて得られてもよい。入力KR 160がいかなる好適な仕方でいかなる好適な形で得られてもよいことは理解しておくべきである。本発明の諸側面はこの点で限定されるものではない。
【0044】
たとえば、図2Aは、たとえばシステム100を使うユーザーまたはソフトウェア・アプリケーションによって分析エンジン150に入力されうる小さな複雑なKR 200(この場合は系統分類)を示している。複雑なKR 200は、さまざまな階層関係によってリンクされた一組の概念を含む。たとえば、「動物」とラベル付けされた概念210は「ペット」とラベル付けされた概念220および「山岳動物」とラベル付けされた概念230に親子関係でリンクされている。階層構造の各レベルにおいて、概念エンティティは、より複雑な意味内容を生成するために組み合わされることのできる、あるいは可能性としてはより要素的な意味内容に分解されることのできる意味の単位を表す。たとえば、「山岳動物」という複雑な意味は、「山」および「動物」の概念を含みうる。
【0045】
いくつかの実施形態では、システム100は、たとえば分析エンジン150を通じて、複雑なKR 200のような複合型KRを分解して、該複合型KRの複雑な概念をなす要素的な概念を発見してもよい。たとえば、図2Bは、複雑なKR 200の分析および分解から帰結しうる要素的データ構造300を示している。要素的データ構造300では、「山岳動物」とラベル付けされた複合概念230は、「山」とラベル付けされた235および「動物」とラベル付けされた240のより要素的な概念を含むことが見出されている。この例において、「山」および「動物」は、「山岳動物」とラベル付けされた前記より複雑な概念よりも要素的な概念を表す。「山」および「動物」の概念を組み合わせて「山岳動物」とラベル付けされる概念を生成することができるからである。同様に、「家庭内の犬」とラベル付けされた複合概念250は、「家庭内の」とラベル付けされた255および「犬」とラベル付けされた260という、より要素的な概念を含むことが見出されており、「シャム猫」とラベル付けされた複合概念270は、「シャム」とラベル付けされた275および「猫」とラベル付けされた280という、より要素的な概念275を含むことが見出されている。さらに、新たに発見された各要素的概念は、それを含む複合概念からの継承された概念関係をもつ。よって、「家庭内の」「犬」「シャム」および「猫」は「ペット」の子であり、「山岳」および「動物」(概念240)は「動物」(概念210)の子であり、「山岳」および「動物」(概念240)はいずれも「ライオン」とラベル付けされた概念290および「山羊」とラベル付けされた概念295の親である。
【0046】
ラベル「動物」が要素的データ構造300内の概念210および概念240の両方に帰されているが、それでもこれら二つの概念は、知識表現階層構造内で異なる機能をする異なる抽象的意味を表すことを注意しておく。いくつかの実施形態では、概念および関係についての人間に読み取れるおよび/または機械に読み取れる用語またはラベルを提供するとともに、(テキスト解析のような)さまざまなシンボル・ベースの処理方法の基礎を提供するために「ラベル」または「シンボル」が抽象概念に結び付けられてもよい。ラベルは、人間および/または機械にとって識別可能な知識表現エンティティを提供してもよく、ソース・ドメインの一意的な語彙から導出されてもよい。このように、各概念要素に割り当てられるラベルはそのドメインにおいて呈示される言語および用語から引き出されてもよいが、ラベル自身は、それを使って名付けられる抽象概念および概念関係を完全に記述しなくてもよい。そうした抽象エンティティは人間の知識において把握されるからである。
【0047】
同様に、いくつかの実施形態では、知識表現モデルにおける抽象概念とそれらの概念を使って記述または分類しうるオブジェクトとの間の相違を理解しておくべきである。オブジェクトは、概念によって記述されることのできる、現実世界または仮想世界におけるいかなる項目であってもよい(たとえば、オブジェクトの例は、文書、ウェブ・ページ、人々などである)。たとえば、現実世界のある人は「ボブ」とラベル付けされた概念によって抽象的に表現されることができる。記述、分類または分析されるべきドメインにおける情報は、仮想的または物理的なオブジェクト、プロセスおよびそのような情報間の関係に関係してもよい。いくつかの例示的な実施形態では、本稿に記載される複雑なKRはウェブ・ページ内にあるコンテンツの分類において使用されてもよい。いくつかの実施形態における他の型のドメインは、文書貯蔵所、音楽のための推薦システム、ソフトウェア・コード貯蔵所、作業フローのモデルおよびビジネス・プロセスなどを含んでいてもよい。
【0048】
いくつかの実施形態では、分類されるべきドメインのオブジェクトはコンテンツ・ノードと称されてもよい。コンテンツ・ノードは、知識表現モデルを使った分類、記述、分析などになじむいかなるブジェクトから構成されていてもよい。たとえば、コンテンツ・ノードは、ファイル、文書、(注釈のような)文書のチャンク、画像または記憶された文字列であってもよい。コンテンツ・ノードは物理的なオブジェクトまたは仮想的なオブジェクトを指しうる。いくつかの実施形態では、コンテンツ・ノードは、アドレス指定可能な(または位置特定可能な)情報を提供するコンテンツ・コンテナ内に含まれていて、それを通じてコンテンツ・ノードが取得できてもよい。たとえば、URLを通じてアドレス指定可能なウェブ・ページのコンテンツ・コンテナは、テキストおよび画像の形で多くのコンテンツ・ノードを含みうる。何らかの意味(コンテンツ・ノードの説明、目的、使用または意図など)を抽出するために、コンテンツ・ノードに概念が関連付けられてもよい。たとえば、現実世界におけるコンテンツ・ノードの諸側面は、知識の抽象表現における概念によって記述されてもよい。
【0049】
概念は、他のエンティティへの関係を通じた抽象化の混成的な(compound)諸レベルを用いて、また構造的には他のより基本的な知識表現エンティティ(たとえばキーワードおよび形態素)を用いて定義されうる。そのような構造はここでは概念定義として知られる。いくつかの実施形態では、概念は、二つの基本的な型の概念関係を通じて関係付けられてもよい。二つの概念関係とは、より複雑な概念を生成するための要素的概念間の結び付きを指す内因性(たとえば要素的データ構造300内の「山岳」「動物」および「山岳動物」の間の関係)と、複雑な関係間の結び付きを指す外因性である。外因性の関係は、等価、階層構造(たとえば「動物」と「ペット」の関係)および連想といった、概念対の間の特徴を記述してもよい。さらに、いくつかの実施形態では、外因性および内因性の概念関係自身も概念の型として記述されてもよく、より複雑な関係に類型化され(typed)てもよい。たとえば、「と結婚している」という連想関係は「と」「結婚している」という関係概念を含みうる。
【0050】
いくつかの実施形態では、システム100内の要素的データ構造120として記憶されているAKRMデータ・モデルの全体的な編成は、ファセットをもつデータ構造(faceted data structure)としてエンコードされてもよい。ここで、概念エンティティは階層構造において明示的に関係付けられる(外因的関係)とともに、複雑な概念を生成するために諸セットにおいて結び付けられる(内因的関係)。さらに、これらの外因性および内因性の関係自身が上で論じたように概念を使って類型化されてもよい。しかしながら、いかなる好適な型の概念関係を含むいかなる好適な型の知識表現モデルまたは理論的構造体がAKRMを表現する際に利用されてもよいことは理解しておくべきである。本発明の諸側面はこの点で限定されるものではない。
【0051】
例解のため、図3は、本発明のいくつかの実施形態に基づくシステム100のデータ・セット110において用いられてもよい例示的なデータ・スキーマ350を与えている。そのようなデータ・スキーマは、オントロジーまたは系統分類のような複雑な知識表現データ構造(複雑なKR)ならびに複雑なKRが分解されて得られる原子的な知識表現データ構造(たとえば要素的データ構造120)の両方をエンコードすることができるよう設計されてもよい。スキーマ350では、諸概念は、多対多の関係を使って、より複雑な型(has型)を合成するために結び付けられてもよい。このようにして、このモデルにおけるコアとなる概念エンティティは、そのデータによってモデル化される複雑な知識表現の性質に依存して、単純または複雑の幅広い多様性を表しうる。多対多の関係を使ってシンボル、規則およびオブジェクトをこれらの概念に結び付けることによって、そのようなスキーマは幅広い範囲の知識表現をモデル化するために前記データを管理しうる。
【0052】
図3に示されるスキーマ350では、長方形はエンティティ集合、たとえば、データベース内のメイン・オブジェクトとしてエンコードされうる現実世界のオブジェクトとともに、知識表現における、抽象概念、概念を指す人間および/または機械にとって読み取り可能なシンボルおよび概念に適用される規則を表す。実線の各接続子(connector)は二つのエンティティ集合の間の関係を表し、関係の型が菱形によって表されている。「N」は関係の参加濃度(cardinality)を表す。ここで、関係は多対多であり、これは、各エンティティ集合の多くのエンティティがその関係に参加する他方のエンティティ集合のエンティティとの関係に参加できることを示す。また逆も成り立つ。これに対し、菱形の両側で「1」とラベル付けされた関係は一対一の関係を表し、一方の側で「1」、他方の側で「N」とラベル付けされた関係は一対多の関係を表す。この場合、第一の型の一つのエンティティが第二の型の多くのエンティティとの関係に参加できる一方、第二の型の各エンティティは第一の型の一つだけのエンティティとのその関係に参加できる、などとなる。
【0053】
いくつかの実施形態では、知識表現のデータ構造は、一つまたは複数のデータベース・テーブル内でスキーマ350に従ってエンコードされるのに、いかなる好適なデータベースおよび/または他のデータ・エンコード技法を使ってもよい。たとえば、いくつかの実施形態では、KRデータ構造についてのデータ・セットは、各行が一対の概念間の関係を表すテーブルのコンピュータ可読表現として構築されてもよい。たとえば、データ・テーブルの一つの例は、「概念1」属性、「概念2」属性、「関係」属性および「型」属性を含む四つの属性列を有し、テーブルの各行について、「概念1はある型(たとえば外因性または内因性)のある関係概念を通じて概念2に関係している」のように三元関係をモデル化することができる。属性(列のエントリー){概念1:「かなづち」;概念2:「釘」;関係:「道具」;型:「外因性」}をもつそのようなテーブルの行は「『かなづち』は『道具』として『釘』に関係付けられ、その関係は「外因性」である」という関係を表すことができる。多くの例示的なデータ構造において、各概念はデータベース・テーブルの一つまたは複数の行に現れてもよく、たとえば複数の行に現れて複数の他の概念との関係を表してもよい。さらに、特定の一対の概念が二つ以上の行に現れてもよい。たとえば、その対の概念が二つ以上の型の関係を通じて関係付けられる場合である。しかしながら、以上の記述は単に例であって、データ構造はいかなる好適な仕方で実装および/またはエンコードされ、記憶されてもよいことは理解しておくべきである。本発明の諸側面はこの点で限定されるものではない。
【0054】
いくつかの実施形態では、規則ベースのプログラミングを支援するために、AKRM内のエンティティ(たとえば概念および概念関係)のそれぞれにさまざまなメタデータが関連付けられていてもよい。たとえば、多くの規則は諸概念のソートされた集合を要求するので、概念関係(内因性または外因性)内の諸概念の優先度がこのスキーマに追加されることができる。これらの詳細は、単にデータ・モデルの提示を単純にするために、ここでは省略されている。
【0055】
図3の例示的なデータ・スキーマは比較的単純であるかもしれないが、知識表現の構築および分解のための処理規則に結び合わされると、(後述するさまざまな例において記述されるように)非常に幅広い範囲の複雑な知識を扱う機能をもちうる。その利益は、データの経済性を改善し、大きな知識表現データ構造中に複雑さを組み込む必要性を減らす、リアルタイムの知識エンジニアリングを含みうる。さらに、知識表現データ構造の範囲が縮小されるので、推論、解析、データ・マイニングおよび検索といった統合された知識エンジニアリング・プロセスに対しても有益な効果をもちうる。
【0056】
図1に戻ると、いくつかの実施形態では、知識処理規則130は、システム100において、たとえばデータ・セット110内でエンコードされ、持続させられてもよく、入力KR 160および/または要素的データ構造120内の諸概念に結び付けられてもよい。規則が概念に結び付けられてもよく、それにより、特定の概念が与えられたときに、該規則がシステム100の一つまたは複数のプロセッサによるプログラミング・コードの実行を通じて適用されて要素的データ構造120から新しい意味エンティティ(概念および関係)を生成するおよび/または入力KR 160を要素的データ構造120に含められるべき要素的エンティティに分解する。そのような規則の例はのちにより詳細に述べる。
【0057】
規則130は、たとえばシステム100の開発者によっておよび/またはシステム100のエンドユーザーによって、その個別的な知識処理のニーズまたは選好に従って、入力規則140としてデータ・セット110に導入されてもよい。入力規則140はいかなる好適なときにいかなる好適な源から得られてもよく、AKRMの一部として記憶されている規則130は、システム100の動作前または動作中にいかなる好適なユーザーによっていかなる好適なときに更新および/または変更されてもよく、システム100と対話する異なるユーザーまたはアプリケーションのために異なる記憶された規則130が維持されてもよいことは理解しておくべきである。本発明の諸側面はこの点で限定されるものではない。さらに、いくつかの実施形態では、入力KR 160の分析に適用される記憶された規則130の部分集合は出力KR 190の合成に適用されるものとは異なっていてもよい。一方、他の実施形態では、同じ規則が分析および合成動作の両方で適用されてもよく、記憶された規則130の異なる部分集合が異なる型の規則表現に適用されてもよい。
【0058】
KRの分析および合成において諸概念に適用されるとき、規則130はシステム100のようなシステムのための構成および分解の論理を提供しうる。いかにして知識が生成(合成)または分解(分析)されるかの方法は規則130の集合においてエンコードされていてもよい。規則130は、対称的(単一の規則が分析および合成の両方で作用する)または非対称的(単一の規則は合成または分析でのみ機能するよう設計される)に機能するよう設計されてもよい。いくつかの実施形態では、規則130は、知識モデルの概念データ構造内のエンティティとしてエンコードされなくてもよく、概念データ構造に対して生成の役割において作用する知識表現モデル内の規則としてエンコードされてもよい。いくつかの実施形態では、規則130は、データとしてエンコードされ、要素的データ構造120のような知識表現データ構造と一緒に、規則を含むAKRMの機械可読エンコードにおいて記憶されてもよい。規則130は規則エンジン・ソフトウェア・コンポーネントを使って適用されてもよい。規則エンジン・ソフトウェア・コンポーネントは、たとえばシステム100に含まれるかシステム100によってアクセス可能な一つまたは複数の有形の非一時的なコンピュータ可読記憶媒体においてエンコードされ、システム100の一つまたは複数のプロセッサによって実行されて規則エンジンを提供するプログラミング命令によって実装される。
【0059】
本発明のいくつかの実施形態に基づくシステム100のようなシステムの確率的な性格のため、規則130の適用から帰結する知識表現データ構造について意味的コヒーレンスを検査する方法が実行されてもよい。いくつかの実施形態では、システム100は、結果として得られるデータ構造が既存の知識モデルに存在するかどうかについて証拠を集めるようプログラムされてもよい。これら既存の知識モデルは(複雑な知識表現データ構造として)システム内部にあってもよいし、あるいは(セマンティック・ウェブ上でエンコードされた知識モデルのような)外的であってもよい。いくつかの実施形態では、結果として得られるデータ構造の諸概念に関連する用語(シンボルまたはラベル)が(文書のような)外部の知識表現内に存在するかどうかを調べるために、検索エンジンを使ってもよい。用語‐文書頻度(たとえば、検索エンジン・ヒット数)は、結果として得られる知識表現データ構造の意味的コヒーレンスの一つの例示的な指標を提供しうる。しかしながら、そのようなデータ構造の意味的コヒーレンスについてのいかなる好適な指標が利用されてもよいことは理解しておくべきである。本発明の諸側面はこの点で限定されるものではない。
【0060】
分析エンジン150および合成エンジン170は、知識表現データ構造の構築および分解をサポートする意味的な分析および合成のさまざまな方法のうちいずれを使ってもよい。本発明の諸側面はこの点で限定されるものではない。入力された複雑なKR 160の分解において分析エンジン150によって規則130の適用とともに使用されうる分析方法の例は、テキスト解析、エンティティおよび情報抽出、情報検索、データ・マイニング、分類、統計的クラスタリング、言語学的解析、ファセット解析、自然言語処理および意味的知識ベース(たとえばレキシコン、オントロジーなど)を含む。複雑なKR 190の構築において合成エンジン170によって規則130の適用とともに使用されうる合成方法の例は、形式概念解析、ファセット分類合成、意味的合成および動的系統分類を含む。
【0061】
複雑なKRの分析および合成の例示的な方法が分析エンジン150および合成エンジン170によって実行されうることは理解しておくべきである。分析エンジン150および合成エンジン170は、個々に、および/または、それらのエンジンおよび/またはシステム100とのインターフェースをもちうる任意の好適な外部ソフトウェア・アプリケーションと連係して動作する。そのような外的なソフトウェア・アプリケーションは、システム100の他のコンポーネントと同じ物理的装置または装置の集合内で実装されてもよいし、あるいは、そのようなソフトウェア・アプリケーションの一部または全部が他の別個の装置と通信して分散式に実装されてもよい。本発明の諸側面はこの点で限定されるものではない。
【0062】
図4は、入力された複雑なKR 160を分解する際に分析エンジン150によって使用されうる意味的分析の一つの例示的な方法400を示している。図4に示される方法は単に一例であって、上で論じたように、分析の他の多くの方法が可能であることは理解しておくべきである。本発明の諸側面はこの点で限定されるものではない。例示的な方法400は、ソース概念410の抽出をもって始まる。ソース概念410は、ソース・データ構造中に明示的に呈示されているテキストの概念ラベルをもつ。ソース・データ構造から複数のソース概念410が、ソース・データ構造中に明示的に存在しうるソース概念410間のソース概念関係とともに、抽出されてもよい。
【0063】
ソース概念410についての概念ラベルにおいて、一連のキーワード輪郭子(delineator)が同定されてもよい。予備的キーワード範囲が、諸キーワードの一般的な構造的テキスト輪郭子(括弧、引用符およびコンマなど)に基づいて概念ラベルからパース(parse)されてもよい。次いで、予備的なキーワード範囲から全体単語が、やはり一般的な単語輪郭子(空白および文法的シンボルなど)を使ってパースされてもよい。パースされた候補キーワードが有効であることを保証するため、次いで単独語独立性の検査が実行されてもよい。いくつかの実施形態では、単語独立性の検査は、語幹(または語根)マッチ(matching)の方法に基づいていてもよい。これについては以下では「語幹処理(stemming)」と称する。ひとたび検証されたら、ある単語がある概念ラベル内に他の諸単語と一緒に存在し、それら他の諸単語なしに関係する概念ラベルに存在していたら、その単語はキーワードの輪郭をなしうる。
【0064】
ひとたび予備的なキーワード・ラベルの集合がこのようにして生成されたら、すべての予備的なキーワード・ラベルが総体として調査されて混成キーワードを同定してもよい。混成キーワードは、単一の概念ラベル内に二つ以上の有効なキーワード・ラベルを呈するものである。いくつかの実施形態では、混成キーワードの集合を、ソース・データによってサポートされる最も要素的なキーワード集合に徹底的に分割するために再帰が使用されてもよい。候補キーワード抽出、検証および分割のプロセスは、それ以上原子的キーワードが見出せなくなるまで繰り返されてもよい。
【0065】
いくつかの実施形態では、ドメイン全体にわたってキーワード・ラベルの曖昧さをなくすために、整理統合(consolidation)の最終方法段が使用されてもよい。そのような曖昧さ解消は、複数のエンティティが同じラベルを共有するときに生じる曖昧さを解決するために使われてもよい。いくつかの実施形態では、曖昧さ解消は、同じラベルを共有する複数の単独の構造的エンティティ中に諸キーワードを整理統合することによって提供されてもよい。結果は、キーワード概念の集合であってもよい。各キーワード概念は、それが導出されたもとのソース概念に含まれる。たとえば、ソース概念410は、その概念ラベルからパースされたキーワード420、440および460に分解されてもよく、キーワード420、440および460はソース概念410についての概念定義を構成していてもよい。たとえば、図2Bの例示的な要素的データ構造300では、「家庭内の」とラベル付けされたより要素的な概念255が、「家庭内の犬」とラベル付けされたより複雑な概念250から、概念ラベルからパースされたキーワードとして、分解されうる。
【0066】
いくつかの実施形態では、キーワード概念を含む概念定義は、さらなる分解を通じて、それらの構造中により深く、より基本的なレベルの抽象化として形態素概念エンティティを含むよう拡張されてもよい。いくつかの実施形態では、形態素は、より複雑な概念およびその関係の要素的な既約な属性を表していてもよい。形態素レベルの抽象化では、属性の多くは人間の分類者には概念として認識可能ではないであろう。しかしながら、複数の全体ドメインにまたがるリレーショナル・データ構造に組み合わされると、形態素はいくつかの実施形態では、より少ない情報を使ってより複雑な概念の内容的意味(semantic meaning)を担持することができることがある。
【0067】
いくつかの実施形態では、形態素抽出の方法は、上で論じたキーワード抽出の方法と共通する要素を有していてもよい。形態素候補を同定するための基準として使うパターンが定義されてもよい。これらのパターンは、語幹処理のためのパラメータを確立してもよく、単語全体および部分単語マッチのためのパターンを含んでいてもよい。キーワード抽出と同様、ソース概念関係の諸集合が、形態素パターン・マッチのためのコンテキストを提供してもよい。それらのパターンがキーワードのプールと突き合わせて適用されるのは、そのキーワードが現れるソース概念関係の諸集合内であってもよい。パターンを語幹処理することに基づく共有される根の集合が同定されてもよい。共有される根の集合は、各キーワードについての候補形態素根の集合を含んでいてもよい。
【0068】
いくつかの実施形態では、各キーワードについての候補形態素根が、互いに整合することを保証するために比較されてもよい。同じキーワードのコンテキスト内に存在する根およびキーワードが現れるソース概念関係集合は重複根(overlapping roots)をもつと想定されてもよい。さらに、それらの重複根の交わりから導出される素元根(elemental roots)は、有効な形態素を同定するために使われるパラメータ内に留まると想定されてもよい。そのような検証は、過剰な形態素分割を制約し、コンテキスト的に有意だが根本的なレベルの抽象化を提供する。いくつかの実施形態では、整合しない候補形態素根があれば諸キーワード集合から除去されてもよい。形態素候補を同定するためのパターン・マッチのプロセスは、すべての整合しない候補が除去されるまで繰り返されてもよい。
【0069】
いくつかの実施形態では、潜在的な根の群を調べることによって、各キーワードについて一つまたは複数の形態素輪郭子が同定されてもよい。形態素は、各キーワード・ラベル内の輪郭子の位置に基づいて抽出されてもよい。次いで、抽出された形態素をそれを導出するもとになったキーワードに関係付ける(またはマッピングする)ことによって、キーワード概念定義が構築されてもよい。たとえば、形態素概念425および430はキーワード概念420のための概念定義に含まれてもよく、形態素概念445および450はキーワード概念440のための概念定義に含まれてもよく、形態素概念465および470はキーワード概念460のための概念定義に含まれてもよい。このように、もとのソース概念410は意味的分析を通じてキーワード概念のレベルまで、さらにはAKRMの要素的データ構造に含めるための形態素概念の最も要素的なレベルまで分解されうる。
【0070】
しかしながら、要素的データ構造の生成においていかなる好適なレベルの抽象化が用いられてもよく、キーワードや形態素を中心としない方法も含め、いかなる好適な解析方法が使われてもよいことは理解しておくべきである。本発明の諸側面はこの点に関して限定されるものではない。いくつかの実施形態では、より複雑なKRの分析および/または合成において使うためのAKRMに含められる要素的データ構造は、該要素的データ構造の中身を入れるために分解されるおよび/または該要素的データ構造から合成される前記より複雑なKRに含まれる概念および関係より要素的である概念および関係を含み、エンコードしてもよい。たとえば、複雑なKRにおいてエンコードされる複雑な概念の抽象的な意味は、AKRMの要素的データ構造においてエンコードされる要素的概念の抽象的な意味の組み合わせによって形成されうる。
【0071】
いくつかの実施形態では、中央集中されたAKRMの一部として要素的データ構造に含まれる諸概念は、より複雑な概念からキーワードのような単一の単語全体のレベルまで分解されたものであってもよい。図2Bの例は、単一の単語全体をエンコードするそのような要素的データ構造を例示している。いくつかの実施形態では、要素的データ構造における概念は、単語の一部を表現する、より要素的なレベルまで分解されたものであってもよい。いくつかの実施形態では、要素的データ構造内の諸概念は、形態素によって表現される、より要素的な意味レベルまで分解されたものであってもよい。形態素は、意味内容を担持できる最小の言語学的単位である。たとえば、単語全体の概念「Siamese」は分解されて二つの形態素概念「Siam」および「-ese」を生じうる。「Siam」が自由形態素を表し、「-ese」が接辞を表す。いくつかの実施形態では、AKRMの要素的データ構造は指定されたレベルの要素性における概念のみを含んでいてもよい。たとえば、要素的データ構造はいくつかの実施形態では、完全に形態素から、または完全に単独単語概念から形成されてもよい。他の実施形態では、要素的データ構造はさまざまな異なるレベルの要素性の概念を含んでいて(たとえば、形態素概念、キーワード概念および/または他のレベルの要素性の他の概念を含む)、該要素的データ構造中の概念の少なくとも一部はそれらの概念が分解されるもとになった入力KRにおける複雑な概念および/またはそれらの概念が他の要素的概念との組み合わせで創り出す出力KRにおける複雑な概念より要素的であるのでもよい。複雑なKRをより要素的なデータ構造に分解するためのいかなる好適な基礎が利用されてもよいことは理解しておくべきである。それには、言語学および意味論以外のパラダイムに結び付けられた基礎が含まれる。本発明の諸側面はこの点に関して限定されるものではない。
【0072】
図1を参照するに、データ消費者195はシステム100の一または複数の人間のユーザーおよび/またはシステム100と対話する一つまたは複数の機械実装されるソフトウェア・アプリケーションを表していてもよい。いくつかの実施形態では、データ消費者195は、さまざまな形のデータを通じてシステム100からの出力を受け取るおよび/または要求してもよい。たとえば、データ消費者195は、要素的概念および概念関係に分解されて要素的データ構造120を生成および/または更新するための複雑なKR 160をシステム100に入力してもよい。データ消費者195(同じまたは異なるデータ消費者)は、知識処理規則130の一つまたは複数を要素的データ構造120の一部または全部に適用することによって合成される、システム100からの出力される複雑なKR 190を受け取ってもよい。
【0073】
いくつかの実施形態では、データ消費者195は、合成および分析動作を指令するためのコンテキスト180を提供してもよい。たとえば、出力KRの要求とともに特定のコンテキスト180を入力することによって、データ消費者195はシステム100に、データ消費者によって実行されている現在のタスクまたは要求される情報のための適切な特性をもつ出力KR 190を生成するよう指令してもよい。たとえば、データ消費者195が関係情報を要求するまたは受信したがっている特定の概念にマッピング可能な検索語として、特定のコンテキスト180がデータ消費者195によって入力されてもよい。合成エンジン170はたとえば、規則130を、コンテキスト180に対応する概念に概念的に関係している(すなわち、データ構造において接続されている)要素的データ構造120の部分のみに適用してもよい。もう一つの例では、入力コンテキスト180は、データ消費者195が出力KR 190が準拠させたがっている知識表現モデルの特定の型、たとえば系統分類を示してもよい。したがって、合成エンジン170は、規則130の集合のうち、要素的データ構造120から系統分類を合成するために適切な規則のみを適用してもよい。
【0074】
入力コンテキスト180が、出力KR 190の合成に適用される要求および/または制限をいくつ含んでいてもよく、入力コンテキスト180の構成要素はデータまたはプログラミング言語のいかなる好適な形でエンコードされたいかなる好適な型のものであってもよいことは理解しておくべきである。本発明の諸側面はこの点に関して限定されるものではない。好適な入力コンテキストの例は、これに限られないが、たとえば自然言語処理(NLP: natural language processing)技術によって媒介される自由テキスト問い合わせおよび提出ならびにさまざまなWeb2.0システムと整合する用語またはタグの集合のような構造的な入力を含む。いくつかの実施形態では、特定のコンテキスト180に基づく出力KR 190の生成は、データ消費者との、より流動的かつ動的な知識交換を可能にしうる。しかしながら、入力コンテキスト180は必須ではなく、システム100はいくつかの実施形態では、入力コンテキストの必要なしに、出力KR 190を生成してもよいことは理解しておくべきである。本発明の諸側面はこの点に関して限定されるものではない。
【0075】
データ消費者195は、いかなる好適なデータ・エンコードおよび/またはプログラミング言語を使っていかなる好適な形でシステム100にいかなる好適な型の入力KR 160を提供してもよい。本発明の諸側面はこの点に関して限定されるものではない。入力KRの好適な形の例は、これに限られないが、やはりさまざまな形のNLPおよびテキスト解析と一緒に使われる半構造化されたまたは構造化されていない文書ならびに系統分類、制御された語彙、ファセット分類およびオントロジーといった構造化された知識表現を含む。
【0076】
本開示に基づくいくつかの実施形態では、システム100のようなAKRMを使う複雑なKRの分析および合成のためのシステムは、一つまたは複数のクライアント装置、機械および/またはコンピュータとネットワーク通信をもつ分散式コンピューティング・システムのサーバー側で実装されてもよい。図5は、そのような分散式のコンピューティング環境500を示している。ここではシステム100はKRデータ構造のためのサーバー側の変換エンジンとして動作しうる。変換エンジンは入力として、クライアント510によって一つまたは複数のドメインからたとえば人間のユーザーのアクションを通じてまたはクライアント510のソフトウェア・アプリケーションによって提供される、一つまたは複数のソースの複雑なKRデータ構造520を取ってもよい。いくつかの実施形態では、入力の複雑なKR 520は、ウェブ・サービス(またはAPIまたは他の配布チャネル)を介して、インターネット550のようなネットワークを通じて、システム100が実装されているコンピューティング・システム(単数または複数)に配布されてもよい一つまたは複数のXMLファイル530にエンコードされてもよい。同様に、システム100はXMLファイル540としてネットワークを通じてさまざまなクライアント510に要求された出力KRを返してもよい。しかしながら、データは、サーバー・システム100とクライアント・システム510との間で、いかなる好適な仕方で、いかなる好適な形で通信されてもよいことは理解しておくべきである。本発明の諸側面はこの点に関して限定されるものではない。
【0077】
分散および脱中央集中化のこの態様および/または他の態様を通じて、いくつかの実施形態では、幅広い範囲の開発者および/または出版者が、複雑なKRデータ構造を分解および生成するために分解エンジン150および合成エンジン170を使用してもよい。例示的な応用は、これに限られないが、ウェブ・サイト、知識ベース、電子商取引店舗、検索サービス、クライアント・ソフトウェア、管理情報システム、分析などを含む。
【0078】
いくつかの実施形態では、そのような分散式のシステムの利点は、プライベート・ドメイン・データと諸ドメインを処理するためにシステムによって使用される共有されるデータとの明確な分離でありうる。データ分離は、サービスとしてのソフトウェア(SaaS: software-as-a-service)モデルのようなホストされる処理モデルを容易にしうる。それにより、サードパーティーは変換エンジン・サービスをドメイン所有者に提供しうる。ドメイン所有者のドメイン固有データは、共有されるデータ(たとえば、AKRMデータ・セット110)および他のドメイン所有者のプライベート・データから分離可能なので、SaaSによって安全にホストされうる。あるいはまた、ドメイン固有データはドメイン所有者によって、共有されるデータからは物理的に隔てられてホストされてもよい。いくつかの実施形態では、ドメイン所有者は、自分独自の知識をさらす必要なしに、ユーザーのコミュニティー全体の共有される知識(たとえばKARM)に立脚してもよい。
【0079】
以上の議論から理解されるはずであるが、本開示に基づくいくつかの実施形態は、複雑なKRを分解して原子的知識表現モデルの要素的データ構造を生成または更新するための独創的な複雑な知識の表現を解析する技法に向けられる。図6は、例示的なプロセス600として一つのそのような技法を示している。プロセス600は工程610で始まる。ここでは入力の複雑なKRが、たとえばデータ消費者から、システム100のような分析/合成システムによって受領されうる。
【0080】
工程620では、システム100においてAKRMの一部としてエンコードされている一つまたは複数の知識処理規則が適用されて、入力の複雑なKRを一つまたは複数の要素的概念および/または一つまたは複数の要素的概念関係に分解してもよい。さまざまな型のKRに適用可能な知識処理規則の例は後述する。しかしながら、本発明の諸側面は、知識処理規則のいかなる特定の例に限定されるものでもなく、原子的知識表現モデルとの関連でエンコードされたいかなる好適な規則が利用されてもよいことは理解しておくべきである。上で論じたように、そのような規則は、分析システムの開発者によっておよび/または分析システムの一または複数のエンドユーザーによっていかなる好適なときに提供されてもよい。
【0081】
工程630では、工程620において発見および/または導出された要素的概念および/または要素的概念関係の一つまたは複数がシステムのAKRMの一部としてエンコードおよび記憶される要素的データ構造に含められてもよい。いくつかの実施形態では、単一の入力複雑KRから導出された要素的概念および関係の一部または全部が、AKRMの新しい要素的データ構造に中身を入れるために使われてもよい。いくつかの実施形態では、記憶された要素的データ構造がすでに中身を入れられている場合、その後の入力KRから発見された新しい要素的概念および/または関係は、中央集中化したAKRMを更新および/または拡張するために、記憶された要素的データ構造に含められてもよい。いくつかの実施形態では、新しい入力KRが利用可能になるにつれて、プロセス600は、記憶された要素的データ構造をさらに更新するおよび/または新しい要素的データ構造を生成するために、ループで最初に戻ることを続けてもよい。他の実施形態では、プロセス600は、プロセスを通じた一回のパス後にまたは別の所定回数のパス後に、記憶された要素的データ構造が所定のサイズまたは複雑さに達したのちに、または他の任意の好適な停止基準が満たされたのちに終了してもよい。
【0082】
以上の議論から理解されるはずであるが、本開示に基づくいくつかのさらなる実施形態は、原子的知識表現モデルを使って複雑な知識表現を生成(合成)する技法に向けられる。図7は、そのような技法を例示的なプロセス700として示している。プロセス700は工程710で始まり、ここで入力コンテキストが、たとえば人間のユーザーまたはソフトウェア・アプリケーションのようなデータ消費者から受領されてもよい。上記で論じたように、そのようなコンテキストはテキストの問い合わせまたは要求、一つまたは複数の検索語、一つまたは複数のシード概念の同定などを含んでいてもよい。さらに、コンテキストは、複雑なKRの特定の形の要求を示してもよい。しかしながら、いくつかの実施形態では、複雑なKRの要求は、該複雑なKRに含められるべき概念および/または概念関係を制限するさらなるコンテキストなしに受領されてもよい。本発明の諸側面はこの点で限定されるものではない。さらに、いくつかの実施形態では、コンテキストの受領は、コンテキストに伴う明示的な要求の必要なしに、複雑なKRの要求として解釈されてもよい。
【0083】
工程720において、入力要求および/またはコンテキストに応答して、AKRMにおいてエンコードされている一つまたは複数の適切な知識処理規則がAKRMの要素的データ構造に適用されて、要素的データ構造中に明示的にエンコードされていない一つまたは複数の追加的な概念および/または概念関係を合成してもよい。さまざまな型の出力KRを合成するために適用可能な知識処理規則の例は後述する。上記で論じたように、いくつかの実施形態では、規則は、同じ知識処理規則を使って複雑なKRの分析および合成の両方を双方向的に達成するよう適用されてもよい。一方、他の実施形態では、一組の規則が分析に適用され、異なる組の規則が合成に適用されてもよい。しかしながら、本発明の諸側面がこの点で知識処理規則のいかなる特定の例にも限定されず、原子的知識表現モデルに関連してエンコードされたいかなる好適な規則が利用されてもよいことは理解しておくべきである。上記で論じたように、そのような規則は分析システムの開発者によっておよび/または分析システムの一つまたは複数のエンドユーザーによっていかなる好適なときに提供されてもよい。
【0084】
いくつかの実施形態では、適切な規則が、受領された入力要求および/またはコンテキストに基づいて要素的データ構造の適切な諸部分に適用されてもよい。たとえば、入力要求が特定の型の複雑なKRが出力されることを指定する場合、いくつかの実施形態では、その型の複雑なKRを合成することに適用されるAKRMでエンコードされた規則のみが要素的データ構造に適用されうる。いくつかの実施形態では、複雑なKRの特定の型が指定されない場合、系統分類のような複雑なKRのデフォルト型が合成されてもよいし、あるいは複雑なKRのランダムな型が選択されてもよい、など。入力コンテキストが一つまたは複数の特定の関心のあるシード概念を指定する場合、たとえば、それらのシード概念に関係した(すなわち概念関係を通じて接続された)当該要素的データ構造の諸部分のみが選択されてもよく、規則が新たな複雑なKRを合成するためにそれらの諸部分に適用されてもよい。いくつかの実施形態では、出力の複雑なKRのサイズおよび/または複雑さに対するいくつかのあらかじめ決定された制限が、たとえば合成システムの開発者によってまたはエンドユーザーによって、たとえば含められる概念の数、要素的データ構造におけるシード概念と選択された関係した概念との間の階層的距離、結果として得られる出力の複雑なKRのエンコードされたデータ・サイズなどを条件として、設定されてもよい。
【0085】
工程730では、受領された入力において示される任意の指定されたKRの型に従って、工程720で合成された追加的な概念および関係ならびに要素的データ構造の選択された適切な諸部分から、新たな複雑なKRが合成されて、エンコードされてもよい。工程740では、結果として得られる合成された複雑なKRは要求の受領元のデータ消費者に提供されてもよい。上記で論じたように、これはたとえば、ソフトウェア・アプリケーションまたは提供される複雑なKRをソフトウェア・ユーザー・インターフェースを通じて閲覧および/または利用しうる人間のユーザーであってもよい。プロセス700は次いで、新たな知識をエンコードする新たに合成された複雑なKRの提供をもって終了してもよい。
【0086】
以下の諸セクションの擬似コードは上記の方法のさらなる例解となるであろう。
【0087】
KnowledgeCreation(KRin, RULESin, CONTEXT, ANALYSIS, SYNTHESIS)
入力:
・CONTEXT:ユーザー/アプリケーション・コンテキスト(たとえば、要求、シード概念、ドメイン制約)
・KRin:知識表現(Knowledge representation)(たとえば系統分類)
・RULES:関連する知識処理規則
・ANALYSIS:分析イベントを有効にするフラグ
・SYNTHESIS:合成イベントを有効にするフラグ
出力:
・AKRMに記憶されるべき概念および関係
・ユーザー/アプリケーションに呈示すべき複雑KRout
手順:
Ca=AKRM.C /*AKRMにおいて定義される概念定義の集合*/
Ra=AKRM.R /*AKRMにおいて定義される概念関係の集合*/
C={} /*新たな概念定義の集合*/
R={} /*新たな関係の集合*/
KRout=C+R
/*さらなる規則が適用できる限り分析タスクを実行し続ける*/
whenever(ANALYSIS) do{
RULESからの分析規則をKRin+Ca+Raに適用
Ca=Ca U {生成された原子的概念の集合}
Ra=Ra U {生成された関係の集合}
さらなる規則が適用できなければ、ANALYSISをfalseに設定
}
/*さらなる規則が適用できる限り合成タスクを実行し続ける*/
whenever(SYNTHESIS} do {
RULESからの合成規則をCa+C+Ra+R+CONTEXTに適用
C=C U {生成された複雑な概念の集合}
R=R U {生成された複雑な関係の集合}
さらなる規則が適用できなければ、SYNTHESISをfalseに設定
/*可能性としては生成されたKRの部分集合を具現*/
if (十分なサポートまたはユーザー要求)
Ca=Ca U C and Ra=Ra U R
}
/*生成された複雑なKRをユーザー/アプリケーションに呈示*/
複雑なKRout=C+Rを出力(ユーザー/アプリケーションに)。
【0088】
以上の議論から理解されるはずであるが、本開示に基づくいくつかの実施形態は、原子的知識表現モデルを使って知識表現の間の意味的相互運用性を支援する技法に向けられる。上記で論じたように、いくつかの実施形態では、記憶された要素的データ構造と共有される中央集中されたAKRMを維持することは、複数の異なる(場合によっては異なる型または知識表現モデルの)入力の複雑なKRを分解して、すべての型の複雑なKRと意味的に互換な単一の共有される要素的データ構造の生成および/または更新において使われる要素的概念および/または概念関係にすることを許容しうる。さらに、要素的データ構造への分解およびその後の新たな複雑なKRへの合成を通じて、ある型の入力KRがいくつかの実施形態では、同じソース・データに基づく異なる型の出力KRに変換されてもよい。
【0089】
次の擬似コードは、意味的相互運用性の恩恵を提供するための、ここで記載されるAKRMのもとでの複数の異なるKRを統合する諸方法のさらなる例解となるであろう。
【0090】
入力:
・KR1, KR2,…, KRn: /*n個の可能な異なるKR*/
・RULES1, RULES2,…, RULESn /*関連する知識処理規則*/
・ユーザー/アプリケーション・コンテキスト
出力:
・AKRMに記憶されるべき概念および関係
・ユーザー/アプリケーションに呈示すべき複雑なKR
手順:
Ca=AKRM.C /*AKRMにおいて定義されている概念定義の集合*/
Ra=AKRM.R /*AKRMにおいて定義されている概念関係の集合*/
C={} /*新たな概念定義の集合*/
R={} /*新たな関係の集合*/
KRout=C+R /*複雑な知識表現*/
/*入力KRを分析してAKRMに中身を入れる*/
for (i: 1 to n) {
RULESiからのすべての可能な分析規則をKRi+Ca+Raに適用
Ca=Ca U {生成された原子的概念の集合}
Ra=Ra U {生成された関係の集合}
}
/*新たな知識を合成*/
RULESiからの可能な合成規則をCa+C+Ra+Rに適用
C=C U {生成された複雑な概念の集合}
R=R U {生成された複雑な関係の集合}
/*可能性としては生成されたKRのサブセットを具現*/
Ca=Ca U C and Ra=Ra U R。
【0091】
図8は、本開示に基づくいくつかの実施形態において、5つの例示的な型の複雑な知識表現(すなわち、系統分類、同義環(synonym rings)、シソーラス、ファセット分類およびオントロジー)の分析および/または合成において使用されうる6つの例示的な知識処理規則を示す表を与えている。しかしながら、上で論じたように、これらの例は単に例解のために与えられているのであって、本発明の諸側面はいかなる特定の組の規則やKR型もしくはモデルにも限定されないことは理解しておくべきである。さらに、いくつかの実施形態では、分析/合成システムは、たとえばシステムの開発者によって、知識処理規則の初期集合をシードとして与えられてもよく、それが後刻、たとえばシステムのエンドユーザーによって、追加的な規則で拡張されたり、および/または変更および/または削除された規則によって更新されたりしてもよい。種々の型のKRに適用可能な規則の種々の集合が、たとえばユーザー・アカウントにおいて、異なるエンドユーザーまたはアプリケーションのために記憶されていてもよい。さらに、いくつかの実施形態では、個別的なKRの要求に対処するため、知識処理規則は再利用され、新規な仕方で組み合わされてもよい。
【0092】
図8に呈示される例示的な規則は下記で、本図で与えられる例示的なKR型に関わる個別的な例を参照して論じる。上記の一般化された方法のいずれも、異なる入力、出力および知識処理規則が関わる形で、以下の例のいずれにも適用されうることは理解しておくべきである。知識生成理論の多くの異なる側面がここで論じられる例示的な規則を通じてモデル化されうるが、さまざまな他の型の規則も可能であることも理解しておくべきである。以下の例は主として、知識表現データ構造のトポロジーによって操縦される。規則のための他の基礎は、中でも、言語学的形態論および統語論、音韻論、隠喩、象徴および知覚を含んでいてもよい。
【0093】
いくつかの実施形態では、図8に与えられる例示的な規則のような一組の知識処理規則を原子的知識表現モデル内でエンコードすることは、図8に表されるようなサポートされるKR型の集合内の任意の複雑なKRを分析および/または合成することを許容しうる。図8の例では、「×」印は6つの規則の例示的な集合のうちどの規則が5つのKR型の例示的な集合のうちどのKR型に適用されるかを示している。これらの例では、各規則は、それが適用される型の複雑なKRの分析または合成において双方向的に適用されてもよい。たとえば、入力シソーラスKRが与えられると、図8から、規則1、2、3、4がその入力シソーラスに適用されてそれを、要素的データ構造に含められるべき要素的概念および概念関係に分解しうることが明らかである。もう一つの例では、要素的データ構造に規則1、2、3を適用する結果、出力同義環KRが生じる。適切な複雑なKRの分析および/または合成を実行するためのこれらの例示的な規則のそれぞれの使用について、例を参照して下記で述べる。
【0094】
〈系統分類規則〉
下記の入力/出力および知識処理規則は、概念の階層的な分類のような系統分類の機能を提供する。
【0095】
入力/出力:
概念の集合C
階層的関係(非環形)の集合
R={r(ci,cj): ci,cj∈Cかつci Is-a cj}
定義1(コヒーレントな概念):二つの概念ci、cjは、何らかの距離計量Mに基づいてM(ci,cj)<Tである場合にコヒーレントであると考えられる。ここで、Tはあらかじめ選択された閾値である。可能な計量としては、入力コーパスにおいてそれら二つの概念が共起する頻度または系統分類階層構造上で適用される木距離(tree distance)関数を含む。
【0096】
規則1(コヒーレントな概念合成):新たな概念c={ci,cj}を生成する。cは、ciとcjが定義1によりコヒーレントである場合にかつその場合に限り、ciおよびcjから構成される(comprised of)と言われる。
【0097】
規則2(階層的な関係合成):c1={c11, c22,…,c1n}をn個の概念c11ないしc1nから構成される概念とする。同様に、c2={c21, c22,…,c2m}をm個の概念c21ないしc2mから構成される概念とする。各c1iについて何らかの概念c2jについて関係r(c1i,c2j)が存在する場合にかつその場合に限り、新たな階層的関係r(c1,c2)を生成する。
【0098】
上記の例示的な規則(たとえば規則1および規則2)のそれぞれの「…場合にかつその場合に限り」の部分は規則の双方向的な分析/合成の性質を反映していることを注意しておく。たとえば、分析は「…場合に」の部分を実施する(当該条件を満たすようAKRM中に明示的な階層的関係が呈示されることを強制する)。他方、合成は「…場合に限り」の部分を発見するであろう(当該条件が成立する場合に階層的関係を発見する)。
【0099】
入力系統分類200を分析および分解してより要素的なデータ構造300にするこれらの例示的な規則の適用の例は図2Aおよび図2Bで与えられている。その例では、複雑な概念230、250および270が分解されて、規則1の適用を通じて新たなより要素的な概念235、240、255、260、275および280を、規則2の適用を通じてそれらの関係を生成している。さらに、(たとえば)外的なコーパスを証拠として使って、新たな複雑な概念が規則1の適用を通じて合成されてもよい:{家庭内の,ライオン}、{山岳,犬}、{山岳,猫}、{家庭内の,山羊}、{家庭内の,ペット}、{家庭内の,猫}。合成における規則2の適用は新たな概念関係を生成してもよい。たとえば、「動物」と「犬」の間および「動物」と「山岳」の間に階層関係が存在するので、「動物」と「山岳犬」の間に新たな階層関係が合成されてもよい。
【0100】
〈同義環規則〉
下記の入力/出力および知識処理規則は、用語または概念間の意味の近接性または論理においては真理値を保存する用語の内的置換可能性によって定義される同義環(synonym ring)の機能を提供する。
【0101】
入力/出力:
概念の集合C(可能性としては関係「から構成される」)
同義語のリスト:Synonym(ci,cj)
定義2(意味的類似性):c1={c11, c22,…,c1n}をn個の概念c11ないしc1nから構成される概念とする。同様に、c2={c21, c22,…,c2m}とする。類似性関数S、S(c1,c2)は二つの概念の間の類似性を記述する。例示的な関数は次のようなものである。
【0102】
【数1】
定義3(交わりの概念):c1={c11, c22,…,c1n}をn個の概念c11ないしc1nから構成される概念とする。同様に、c2={c21, c22,…,c2m}とする。
【0103】
【数2】
規則3(同義概念合成):c1={c11, c22,…,c1n}とc2={c21, c22,…,c2m}が定義2に基づく二つの同義概念であるとする。S(c1,c2)>Tsynonymである場合にかつその場合にのみ、概念c3=c1∩c2および階層的関係r(c1,c3)およびr(c2,c3)が存在する。ここで、Tsynonymは「同義語」の宣言を保証する意味的類似性の閾値である。
【0104】
【数3】
同義環の例は次のようなものである:
ペット:家庭内の動物:家庭の獣:猫。
【0105】
規則3に基づく分析は、階層的関係を導出しうる。それらの関係を通じて四つの概念すべては「家庭の動物」の子となる。規則1に基づく分析は次の新たな概念を導出しうる:
家、家庭内の、家庭、動物、獣、哺乳類。
【0106】
規則2に基づく分析は、「家庭内の」および「家庭」が「家」の子であり、「ペット」、「哺乳類」、「獣」および「猫」が「動物」の子である階層構造を発見しうる。これらの階層的関係は、より単純な概念が抽出されるもとになった複雑な概念間の関係に基づいて生成されてもよい。よって、規則3の適用を通じて次の新たな同義環が合成されうる。
【0107】
猫:ペット:哺乳類:獣
家庭内の:家庭。
【0108】
〈シソーラス規則〉
下記の入力/出力および知識処理規則は、上記のKRおよび連想関係(関係した用語)の特徴を含むシソーラスの機能を提供する。
【0109】
入力/出力:
概念の集合C(可能性としては関係「から構成される」)
連想関係のリスト、たとえばSynonym(ci,cj)、RelatedTerm(ci,cj)
階層的関係(非環形)の集合R={r(ci,cj): ci,cj∈Cかつci NT cj}
規則1(コヒーレントな概念合成)はシソーラスに当てはまる。
【0110】
規則2(階層的な関係合成)はシソーラスに当てはまる。
【0111】
規則4(連想関係合成):c1={c11, c22,…,c1n}およびc2={c21, c22,…,c2m}を何らかの連想関係(associative relationship)ARに基づく二つの関連した概念であるとする。S(c1,c2)>TARである場合にかつその場合にのみ、ある概念c3=c1∩c2、c4={AR}であり、三つの階層的関係r(c1,c3)、r(c2,c3)およびr(c4,c3)が存在する。ここで、TARは二つの概念の間の「AR」関係の宣言を保証する意味的類似性の閾値である。
【0112】
【数4】
意味的類似性が要求されず、c3を介した連想がその関係を捉えるのに十分である場合には、TARは0に設定されてもよいことを注意しておく。
【0113】
例示的なシソーラスは連想関係:{猫,食料}is-associated-with〔関連する〕{魚,食べ物}というものを含みうる。規則1に基づく分析は次の新たな概念を導出しうる:
猫,食料,魚,食べ物。
【0114】
呈示される階層的関係における適切なパターンを与えられれば、新たな連想関係が規則4の適用を通じて合成されうる。たとえば、{猫}is-associated-with{魚}および{食料}is-associated-with{食べ物}。ここでもまた、連想関係は、より単純な概念が抽出されるもとになった複雑な概念間の関係に基づいて生成されうる。
【0115】
〈ファセット分類規則〉
下記の入力/出力および知識処理規則は、ファセットおよびファセット属性を概念として、ファセットをクラス階層構造に編成された概念のカテゴリーとして含むファセット分類の機能を提供する。
【0116】
入力/出力:
ファセット階層構造(それぞれの根ファセットについての値ノードの階層構造)
ファセット値に関してラベル付けされた用語/概念。
【0117】
定義4(排他的なファセット階層構造):任意の概念は、各ファセット階層構造からただ一つのノード・ラベル/値/属性を選び出すことによって分類できる。すなわち、任意のファセット階層構造においてノードを表す概念の意味論は重なり合わない。
【0118】
規則1、2、4はファセット分類に当てはまる。
【0119】
規則5(ファセット属性割り当て):ファセット階層構造中の各ノード/値/属性は概念cに対応する。ciが何らかのファセット階層構造において唯一の親cjの子として現れる場合にかつその場合にのみ、関係r(ci,cj)が存在し、かつファセット階層構造中の任意の二つの概念c1、c2についてc1∩c2={}である。
【0120】
規則6(ラベル付けされた概念割り当て):ファセット分類における各ラベル付けされた用語は概念ci={ci1,ci2,…,cin}に対応する。ここで、cijは規則5に基づくラベル概念である。
【0121】
例示的な入力ファセット分類は次のとおり:
ファセット:飼い慣らし(Domestication)
・飼い慣らされた(Domesticated)
・野生の(Wild)
ファセット:種(Species)
・動物(Animals)
・イヌ科(Canine)
・犬(Dog)
・ネコ科(Feline)
・猫(Cat)
・ライオン(Lion)
・霊長類(Primate)
・チンパンジー(Chimpanzee)
ファセット:生息地(Habitat)
・自然(Natural)
・山岳(Mountain)
・ジャングル(Jungle)
・砂漠(Desert)
・サバンナ(Savanna)
・海洋(Ocean)
・人工(Man-made)
・都市(City)
・農場(Farm)
ファセット:地域(Region)
・世界(World)
・アフリカ(Africa)
・アジア(Asia)
・ヨーロッパ(Europe)
・南北アメリカ(Americas)
・北アメリカ(North America)
・米国(US)
・カナダ(Canada)
・南アメリカ(South America)。
【0122】
ファセット属性/ノード/値の割り当てをもつオブジェクト
「家庭内の犬(Domestic dog)」 {北アメリカ,飼い慣らされた,犬}
「山岳ライオン(Mountain lion)」 {南北アメリカ,野生の,猫,山岳}
「シャム猫(Siamese Cat)」 {世界,飼い慣らされた,猫}
「ライオン」 {アフリカ,野生の,ライオン,サバンナ}。
【0123】
上例に示されるように、規則2および規則5に基づく分析は、入力のファセット分類をより広義のファセット階層に分解するために使用されうる(たとえばファセット分析または統計的クラスタリングの方法を使って)。
【0124】
ファセット:「ペット」 /*合成ラベル*/
・「一般的なペット(common pet)」 /*クラスター{飼い慣らされた,動物}から導かれる*/
・「珍奇なペット(exotic pet)」 /*クラスター{野生の,動物}から導かれる */
「犬」および「猫」はいずれも「動物」(ファセット階層「動物」から導かれる)なので、セット「飼い慣らされた,犬」、「飼い慣らされた,猫」において明らかなように、新しい概念「飼い慣らされた,動物」がコヒーレントであることがわかる。
【0125】
同様に、ファセット属性/ノード/値の割り当てをもつ新たなオブジェクトが規則1および規則6に従って生成されうる。たとえば、上記の概念合成のための規則を使って、「ライオン・ペット」{人工,ライオン,飼い慣らされた}のような新たな概念を合成できる。これは現実世界では存在しないかもしれないが、入力KRにおける証拠を与えられたときの考えられる新たな知識として正当化でき、のちに(たとえば)該データとのユーザー対話を通じて評価されることができる。
【0126】
〈オントロジー規則〉
規則1、2、4、5、6は、ファセットおよびファセット属性を概念として、ファセットをクラス階層構造に編成された概念のカテゴリーとして含むオントロジーの機能を提供するために適用できる。
【0127】
例示的な複雑な関係 共通生息地(Cohabitate)(COH):
野生の猫←COH→ライオン
家庭内の犬←COH→家庭内の猫
COH関係を分析することは、それらをより原子的な関係および概念に分解しうる。以下の原子的な構造体は可能性である。
【0128】
野生の猫、ライオン、家庭内の犬、家庭内の猫、共通生息地。
【0129】
知識生成のための上記の諸規則は複雑な仕方で、より豊かな関係を表すために適用されうる。たとえば、c1 Relation c2で、Relationは一般的な連想関係。連想関係(双方向的)である複雑な関係については、その関係において対にされる概念間の意味の交わりの属性が強化されうる。階層的な(一方向的)複雑な関係については、その関係において対にされる概念間の意味の包摂の属性が強化されうる。合成された複雑な関係について導出されるラベルは、通常の呈示に準拠できる。たとえば、「C1およびC2は、C3が共通しているので関係している」。
【0130】
規則1(コヒーレントな概念合成)および規則4(連想関係合成)を適用する結果、以下のより原子的な概念を生じうる:
野生の,猫,犬,家庭内の,生息地,野生の生息地,家庭内の生息地,「野生の生息地」is-a「生息地」、「家庭内の生息地」is-a「生息地」。
【0131】
合成は、コヒーレントであることが見出されれば、以下の概念および関係を構築しうる:
「野生の犬」は{野生の,犬,野生の生息地}から構成される(is-comprised-of)
よって、下記のより高次の関係が演繹できる:
野生の犬←COH→ライオン
野生の犬←COH→野生の猫
ここで、「野生の犬」ならびに「ライオン」および「野生の猫」との関係は、新たに合成された構造体である。
【0132】
〈自由テキスト(自然言語)の例〉
下記は、自然言語処理、エンティティ抽出および統計的クラスタリングのようなアプローチを使って構造化された意味的表現に変換されうる自然言語テキストの例である。ひとたび変換されれば、上記の例示的な諸規則が該データを処理するために適用されうる。
【0133】
The cat (Felis silvestris catus), also known as the domestic cat or housecat to distinguish it from other felines and felids, is a small carnivorous mammal that is valued by humans for its companionship and its ability to hunt vermin and household pests. Cats have been associated with humans for at least 9,500 years, and are currently the most popular pet in the world. Due to their close association with humans, cats are now found almost everywhere on Earth.〔猫(学名Felis silvestris catus)は、他のネコ科の動物およびネコ属の動物から区別するために飼い猫(domestic cat)またはイエネコとしても知られるが、小型の肉食哺乳類で、その伴侶性および害獣や家庭の有害生物を駆除する能力のため人間によって重んじられている。猫は少なくとも9500年前から人間と関わっており、現在世界で最も人気のあるペットである。人間との密接な関わりのため、猫は今や地球上のほとんどいたるところに見出される。〕
図9に示されるような構造化された知識表現がこの自然言語テキストから導かれうる。この知識表現は、以下のような例示的な各知識表現型のもとで記述される規則を使って処理されうる:
系統分類;C1 is-a C5(階層性)
同義環:C1:C2:C3
シソーラス:C1 is-associated-with C7
オントロジー:C1はC6を駆除する;C1 is-found-on〔…に見出される〕 C7。
【0134】
この例に合成を適用すると、追加的な構造化されたデータが導出されうる。たとえば、規則1(コヒーレントな概念合成)を適用すると、追加的な概念が導出されうる:
C8: 家庭内の
C9: 家。
【0135】
次いで、新たな関係が合成されうる。たとえば、規則3(同義概念合成)を適用することによって、
C8::C9(「家庭内の(domestic)」は「家(house)」の同義語である)。
【0136】
〈意味的相互運用性の例〉
下記の例は、あるKRにおける入力が出力として異なるKRに変換されうる意味的相互運用性を示す。下記に記載される例示的な処理はたとえば意味的相互運用性処理のための上記で呈示した擬似コードの一般的なデータフローに従って実装されてもよい。
【0137】
入力(入力KRはシソーラスである; ::はsynonym-of〔…の同義語〕を表す; ├は狭義を表す。)
フィンチ(finch)::スズメ(sparrow)::コガラ(chickadee)
鳥(bird)::キツツキ(woodpecker)::フィンチ(finch)
キツツキ(woodpecker)
├ズアカキツツキ(red-headed woodpecker)
├ズグロキツツキ(black-backed woodpecker)
スズメ(sparrow)
├キガシラトド(golden-crowned sparrow)
色(color)
├赤(red)
├黒(black)
├金(gold)
解剖構造(anatomy)
├背中(back)
├頭(head)
├帽子(cap)
上記の入力KRから分析されうる要素的データ構造が図10に示されている。この図では、実線の矢印は「is-a」〔…である〕関係を表し、破線の矢印は「comprised-of」〔…から構成される〕関係を表す。
【0138】
出力(この出力KRは、「ズアカキツツキ」のファセット階層である。)
ファセット
ファセット1:鳥の種(Bird Species)
・キツツキ(woodpecker)
・フィンチ(finch)
・コガラ(chickadee)
・スズメ(sparrow)
ファセット2:着色(Coloration)
・赤(red)
・黒(black)
・金(gold)
ファセット3:名のもとになった解剖構造(Namesake Anatomy)
・頭(head)
・頭頂(crown)
・背中(back)
ラベル付け(Labeling)
「ズアカキツツキ」は{鳥の種:キツツキ,着色:赤,名のもとになった解剖構造:頭}である。
【0139】
上例において、AKRM表現における原子的意味論は、各KRをまたがる意味の交わりを探求するために使用されてもよいことを注意しておく(意味的相互運用性)。たとえば、原子的概念「頭頂」および「頭」は、以前は分離した概念であった「スズメ」および「キツツキ」にまたがる意味の接続を与えうる。
【0140】
以上の議論および例から、本発明の諸側面が知識表現における最も切迫しており困難な応用領域のいくつかに向けられることができることが理解されるはずである。それには、ブレインストーミングおよび知覚の補強、動的および新興知識のサポートおよびさまざまな複雑な知識表現間で共通の意味語彙に変換することによる意味的相互運用性の提供のためのツールが含まれる。
【0141】
本稿に記載されるさまざまな発明側面は、一つまたは複数のコンピュータおよび/または装置のいずれと一緒に使用されてもよい。そのそれぞれは、複雑な知識表現の分析および合成において原子的知識表現モデルを使うための上記の動作の任意のものを行うようプログラムされうる一つまたは複数のプロセッサを有する。たとえば、サーバーおよびクライアント・コンピューティング・システムのいずれも上記のような一つまたは複数のコンピュータとして実装されうる。図11は、概略的に、本開示のさまざまな発明的な側面が実装されうる例示的なコンピュータ1100を示している。コンピュータ1100はプロセッサまたは処理ユニット1101および揮発性および/または不揮発性メモリを含みうるメモリ1102を含む。コンピュータ1100は、システム・メモリ1102に加えて記憶装置1105(たとえば一つまたは複数のディスク・ドライブ)をも含んでいてもよい。
【0142】
メモリ1102および/または記憶装置1105は、本稿に記載した機能の任意のものを実行するよう処理ユニット1101をプログラムするための一つまたは複数のコンピュータ実行可能な命令を記憶してもよい。記憶装置1105は任意的に、必要に応じて一つまたは複数のデータ・セットを記憶していてもよい。たとえば、サーバー・システム100を実装するために使われるコンピュータはいくつかの実施形態では、記憶装置1105にAKRMデータ・セット110を記憶してもよい。あるいはまた、そのようなデータ・セットは、サーバー・システム100を実装するために使用されるコンピュータとは別個に実装されてもよい。
【0143】
本稿でのコンピュータへの言及は、ラックマウント・コンピュータ、デスクトップ・コンピュータ、ラップトップ・コンピュータ、タブレット・コンピュータまたは一般にはコンピュータと見なされないこともある、プログラムされたプロセッサを含む多数の装置(たとえばPDA、MP3プレーヤー、携帯電話、無線ヘッドホンなど)の任意のものを含むプログラムされたプロセッサを有する任意の装置を含むことができる。
【0144】
例示的なコンピュータ1100は、図11に示される装置1106および1107のような一つまたは複数の入力装置および/または出力装置を有していてもよい。これらの装置は、中でも、ユーザー・インターフェースを呈するために使用されてもよい。ユーザー・インターフェースを提供するために使用できる出力装置の例は、出力の視覚的な呈示のためのプリンタまたはディスプレイ画面ならびに出力の可聴呈示のためのスピーカーまたは他のサウンド生成装置を含む。ユーザー・インターフェースのために使用できる入力装置の例は、キーボードおよびマウス、タッチパッドおよびデジタイズ用タブレットのようなポインティングデバイスを含む。もう一つの例としては、コンピュータは音声認識を通じて、または他の可聴フォーマットで、入力情報を受領してもよい。
【0145】
図11に示されるように、コンピュータ1100は、さまざまなネットワーク(たとえばネットワーク1120)を介した通信を可能にするために一つまたは複数のネットワーク・インターフェース(たとえばネットワーク・インターフェース1100)を有していてもよい。ネットワークの例は、企業ネットワークまたはインターネットのような、ローカル・エリア・ネットワークまたは広域ネットワークを含む。そのようなネットワークはいかなる好適な技術に基づいていてもよく、いかなる好適なプロトコルに従って動作してもよく、無線ネットワーク、有線ネットワークまたは光ファイバー・ネットワークを含んでいてもよい。
【0146】
このように本発明の少なくとも一つの実施形態のいくつかの側面を記載してきたが、さまざまな変更、修正および改善が当業者には容易に思いつくであろうことは理解しておくべきである。よって、以上の記述および図面は単に例である。
【0147】
本発明の上記の実施形態は数ある方法のいずれで実装されることもできる。たとえば、それらの実施形態はハードウェア、ソフトウェアまたはそれらの組み合わせを使って実装されうる。ソフトウェアで実装されるとき、ソフトウェア・コードは、単一コンピュータにおいて提供されようと複数のコンピュータの間に分散されようと、いかなる好適なプロセッサまたはプロセッサの集合で実行されることもできる。そのようなプロセッサは、集積回路コンポーネント内に一つまたは複数のプロセッサをもつ集積回路として具現されてもよい。ただし、プロセッサはいかなる好適なフォーマットの回路を使って実装されてもよい。
【0148】
さらに、コンピュータは、ラックマウント・コンピュータ、デスクトップ・コンピュータ、ラップトップ・コンピュータまたはタブレット・コンピュータのようないくつもの形のいずれで具現されてもよい。さらに、コンピュータは、携帯情報端末(PDA: Personal Digital Assistant)、スマートフォンまたは他の任意の好適な可搬型もしくは固定型電子装置を含む、一般にコンピュータとは見なされていないが好適な処理機能をもつ装置において具現されてもよい。
【0149】
また、コンピュータは一つまたは複数の入力および出力装置を有していてもよい。これらの装置は、中でも、ユーザー・インターフェースを呈示するために使用されることができる。ユーザー・インターフェースを提供するために使用されることのできる出力装置の例は、出力の視覚的な呈示のためのプリンタまたはディスプレイ画面または出力の可聴呈示のためのサウンド生成装置を含む。ユーザー・インターフェースのために使用できる入力装置の例は、キーボードおよびマウス、タッチパッドおよびデジタイズ用タブレットのようなポインティングデバイスを含む。もう一つの例として、コンピュータは音声認識を通じて、または他の可聴フォーマットで、入力情報を受領してもよい。
【0150】
そのようなコンピュータは、企業ネットワークまたはインターネットのような、ローカル・エリア・ネットワークまたは広域ネットワークを含む任意の好適な形の一つまたは複数のネットワークによって相互接続されてもよい。そのようなネットワークはいかなる好適な技術に基づいていてもよく、いかなる好適なプロトコルに従って動作してもよく、無線ネットワーク、有線ネットワークまたは光ファイバー・ネットワークを含んでいてもよい。
【0151】
また、本稿で概説したさまざまな方法またはプロセスは、多様なオペレーティング・システムまたはプラットフォームのうちの任意のものを用いる一つまたは複数のプロセッサ上で実行可能であるソフトウェアとしてコードされてもよい。さらに、そのようなソフトウェアはいくつもある好適なプログラミング言語および/またはプログラミングもしくはスクリプティング・ツールのいずれを使って書かされてもよく、また、実行可能な機械語コードまたはフレームワークもしくは仮想マシン上で実行される中間コードとしてコンパイルされてもよい。
【0152】
この点で、本発明は、有形な非一時的なコンピュータ可読記憶媒体(または複数のコンピュータ可読記憶媒体)(たとえば、コンピュータ・メモリ、一つまたは複数のフロッピーディスク、コンパクトディスク(CD)、光ディスク、デジタルビデオディスク(DVD)、磁気テープ、フラッシュメモリ、現場プログラム可能なゲートアレイ(FPGA)もしくは他の半導体デバイスにおける回路構成または他の非一時的な有形なコンピュータ可読記憶媒体)に、一つまたは複数のコンピュータまたは他のプロセッサ上で実行されたときに上で論じた本発明のさまざまな実施形態を実装する方法を実行する一つまたは複数のプログラムをエンコードしたものとして具現されてもよい。コンピュータ可読媒体(単数または複数)は、記憶されたプログラム(単数または複数)が上で論じた本発明のさまざまな側面を実装するよう一つまたは複数の異なるコンピュータまたは他のプロセッサ上にロードされることができるよう、可搬であってもよい。本稿では、「非一時的なコンピュータ可読記憶媒体」の用語は、製造物(すなわち、製造された物品)または機械であると考えることのできるコンピュータ可読記憶媒体のみを含む。
【0153】
用語「プログラム」または「ソフトウェア」は本稿では、一般的な意味で、上で論じた本発明のさまざまな側面を実装するようコンピュータまたは他のプロセッサをプログラムするために用いることのできる任意の型のコンピュータ・コードまたはコンピュータ実行可能命令の組を指す。さらに、この実施形態のある側面によれば、実行されたときに本発明の方法を実行する一つまたは複数のプログラムが単一のコンピュータまたはプロセッサ上に存在する必要がなく、本発明のさまざまな側面を実装するためにモジュール式にいくつかの異なるコンピュータまたはプロセッサの間に分散されていてもよいことも理解しておくべきである。
【0154】
コンピュータ実行可能命令は、一つまたは複数のコンピュータまたは他のデバイスによって実行される、プログラム・モジュールのような多くの形であることができる。一般に、プログラム・モジュールは、特定のタスクを実行するまたは特定の抽象的データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを含む。典型的には、プログラム・モジュールの機能性は、さまざまな実施形態において所望に応じて組み合わされたり分散されたりしてもよい。
【0155】
また、データ構造は任意の好適な形でコンピュータ可読媒体に記憶されてもよい。例示の簡単のため、データ構造は、該データ構造中の位置を通じて関係付けられるフィールドを有するよう示されることがある。そのような関係は、同様に、フィールド間の関係を伝達するコンピュータ可読媒体内の位置をもつフィールドのための記憶を割り当てることによって達成されてもよい。しかしながら、データ構造のフィールド中の情報間の関係を確立するためには、ポインタ、タグまたはデータ要素間の関係を確立する他の機構の使用を通じてなどを含め、いかなる好適な機構が使用されてもよい。
【0156】
本発明のさまざまな側面は、単独で、組み合わせて、または上記で記載されている実施形態では具体的に論じられていない多様な配置で使用されてもよく、したがって、その適用において、上記の記述に述べられているまたは図面に示されている詳細および構成要素の配置に限定されるものではない。たとえば、ある実施形態において記述される側面が他の実施形態において記述される側面と任意の仕方で組み合わされてもよい。
【0157】
また、本発明は、方法として具現されてもよい。それについては例を挙げた。該方法の一部として実行される工程は、任意の好適な仕方で順序付けられてもよい。よって、例示的な実施形態において逐次的な工程として示されていたとしても、例示したのとは異なる順序で工程が実行される実施形態も構築されうる。
【0158】
請求項において請求項の要素を修飾するために「第一」「第二」「第三」などといった助数詞を使っていることは、それ自身として、ある請求項の要素の他の要素に対するいかなる優先、優位または順序も、方法の工程が実行される時間的順序も含意せず、請求項の要素を区別するために、単にある名前をもつ請求項の要素を(助数詞の使用を除いて)同じ名前をもつ他の要素と区別するためのラベルとして使っているまでである。
【0159】
本稿で定義され、使用されるあらゆる定義は、辞書の定義、参照によって組み込まれた文書における定義および/または定義されている用語の通常の意味より優先して支配すると理解されるべきである。
【0160】
本稿で使われる単数形の表現は、そうでないことが明確に示されるのでない限り、「少なくとも一つ」を意味すると理解すべきである。
【0161】
本稿での用法では、一つまたは複数の要素のリストに言及しての「少なくとも一つの」という句は、該要素リストの要素の任意の一つまたは複数から選択される少なくとも一つの要素を意味するが、必ずしも該要素リスト内に個々に挙げられているすべての要素の少なくとも一つを含むとは限らず、要素リスト内の要素のいかなる組み合わせも排除しないと理解すべきである。前記定義は、個々に特定されている要素に関係したものであろうと関係していないものであろうと、「少なくとも一つ」という句が指す要素リスト内で個々に特定されている要素以外の要素が任意的に存在してもよいことをも許容する。よって、限定しない例として、「AおよびBの少なくとも一つ」(または等価だが「AまたはBの少なくとも一つ」または等価だが「Aおよび/またはBの少なくとも一つ」)は、ある実施形態では、Bなしで少なくとも一つ、任意的には二つ以上のA(そして任意的にはB以外の要素を含む)を;別の実施形態では、Aなしで少なくとも一つ、任意的には二つ以上のB(そして任意的にはA以外の要素を含む)を;さらに別の実施形態では、少なくとも一つ、任意的には二つ以上のAおよび少なくとも一つ、任意的には二つ以上のB(そして任意的には他の要素を含む)などを指すことができる。
【0162】
本稿で使用される句「および/または」は、結ばれている要素の「いずれかまたは両方」、すなわち、場合によっては両方ともが存在する要素を、場合によっては一方のみが存在する要素を意味すると理解されるべきである。「および/または」をもって挙げられる複数の要素も同じように、すなわち、そのように結ばれている要素の「一つまたは複数」として解釈されるべきである。任意的に、「および/または」節によって具体的に特定される要素以外の他の要素が、具体的に特定されたそのような要素に関係したものであろうと関係していないものであろうと、存在してもよい。よって、限定しない例として、「Aおよび/またはB」への言及は、「含む/有する」といった開放型の言辞と一緒に使われるとき、ある実施形態ではAのみ(任意的にはB以外の要素を含む)を;別の実施形態ではBのみ(任意的にはA以外の要素を含む)を;さらに別の実施形態ではAおよびBの両方(任意的には他の要素を含む)などを指すことができる。
【0163】
本稿での用法では、「または」は上に定義した「および/または」と同じ意味をもつと理解すべきである。たとえば、リスト内の項目を分離するとき、「または」または「および/または」は包含的であると解釈される。すなわち、いくつかのリスト要素の少なくとも一つ、だが二つ以上をも含み、任意的にはリストに挙げられていない追加的項目をも含むと解釈されるものである。
【0164】
また、本項で使われる表現や用語は説明のためであって、限定するものと見なすべきではない。本項における「含む」「有する」「もつ」「包含する」「関わる」およびそれらの変形の使用は列挙された項目およびその等価物ならびに追加的な項目をカバーすることを意図している。
【0165】
本発明のいくつかの実施形態を詳細に記載してきたが、さまざまな修正および改善が当業者にはすぐ思いつくであろう。よって、上記の記述は単に例であって、限定するものと意図されてはいない。
【0166】
いくつかの付記を残しておく。
〔付記1〕
複雑な知識表現を生成する方法であって:
要求コンテキストを示す入力を受領する段階と;
プロセッサにより、少なくとも一つの要素的概念、少なくとも一つの要素的概念関係または少なくとも一つの要素的概念および少なくとも一つの要素的概念関係を表す要素的データ構造に、一つまたは複数の規則を適用する段階と;
前記一つまたは複数の規則の適用に基づいて、前記要求コンテキストに従って、一つまたは複数の追加的概念、一つまたは複数の追加的概念関係または一つまたは複数の追加的概念および一つまたは複数の追加的概念関係を合成する段階と;
前記追加的概念の少なくとも一つ、前記追加的概念関係の少なくとも一つまたは前記追加的概念の少なくとも一つおよび前記追加的概念関係の少なくとも一つを使って、前記要求コンテキストに従って複雑な知識表現を生成する段階とを含む、
方法。
〔付記2〕
前記適用する段階が、前記要求コンテキストを示す入力を受領したあとの時点において、前記一つまたは複数の規則の少なくとも一つを適用することを含む、付記1記載の方法。
〔付記3〕
ラベル、シンボルまたはラベルおよびシンボルを概念、概念関係または概念および概念関係に割り当てる段階をさらに含む、付記1記載の方法。
〔付記4〕
前記要素的データ構造が、少なくとも二つの要素的概念を結ぶ少なくとも一つの要素的概念関係を含み、前記少なくとも一つの要素的概念関係は、少なくとも一つの一対一関係、少なくとも一つの一対多関係および少なくとも一つの多対多関係からなる群より選択される少なくとも一つの関係を含む、付記1記載の方法。
〔付記5〕
前記要素的データ構造がテーブル構造を含む、付記1記載の方法。
〔付記6〕
前記テーブル構造が少なくとも第一の行を含み、前記第一の行は第一の対の概念の間の第一の関係を表す、付記5記載の方法。
〔付記7〕
前記テーブル構造が、前記第一の対の概念の間の第二の関係を表す第二の行を含む、付記6記載の方法。
〔付記8〕
合成する段階が、概念分析、ファセット分類合成、意味的合成および動的系統分類からなる群より選択される少なくとも一つの技法を適用することを含む、付記1記載の方法。
〔付記9〕
入力を受領する段階が、テキスト問い合わせ、検索語、シード概念および複雑なKR要求からなる群より選択される少なくとも一つの項目を受領することを含む、付記1記載の方法。
〔付記10〕
前記複雑な知識表現を生成する段階が、1)所定数より少ない概念を生成するおよび2)シード概念から所定の階層的距離内の概念のみを生成する、からなる群より選択される少なくとも一つの動作を含む、付記1記載の方法。
〔付記11〕
前記一つまたは複数の規則を含む規則の集合に対して、規則を追加すること、規則を削除することまたは規則を追加することおよび規則を削除することをさらに含む、付記1記載の方法。
〔付記12〕
生成された複雑な知識表現をユーザーまたは操作者に対して出力する段階をさらに含む、付記1記載の方法。
〔付記13〕
少なくとも部分的に、もとの知識表現を分解して、前記少なくとも一つの要素的概念を前記もとの知識表現の少なくとも一つのより複雑な概念から導出することによって、前記要素的データ構造を生成する段階をさらに含む、付記1記載の方法。
〔付記14〕
前記要素的データ構造を生成する段階が、前記もとの知識表現に前記一つまたは複数の規則を適用することを含む、付記13記載の方法。
〔付記15〕
前記要素的データ構造を生成する段階が、前記もとの知識表現に一つまたは複数の異なる規則を適用することを含む、付記13記載の方法。
〔付記16〕
前記一つまたは複数の規則を前記一つまたは複数の異なる規則と一緒に記憶する段階をさらに含む、付記15記載の方法。
〔付記17〕
前記要素的データ構造を生成する段階が:
前記一つまたは複数の規則または一つまたは複数の異なる規則のどちらを適用するかを、前記もとの知識表現に基づいて選択する段階と;
選択された規則を適用して前記もとの知識表現を分解する段階とを含む、
付記13記載の方法。
〔付記18〕
前記要素的データ構造の意味的コヒーレンスを測定する段階をさらに含む、付記1記載の方法。
〔付記19〕
意味的コヒーレンスを測定する段階が、用語‐文書頻度を決定することを含む、付記18記載の方法。
〔付記20〕
前記分解が、テキスト分析、統計的クラスタリング、言語学的分析、ファセット分析、自然言語処理および意味的知識ベースの使用からなる群より選択される少なくとも一つの技法を使うことを含む、付記13記載の方法。
〔付記21〕
前記少なくとも一つの要素的概念の曖昧さ解消をする段階をさらに含む、付記13記載の方法。
〔付記22〕
前記少なくとも一つの要素的概念が一つまたは複数の形態素を含む、付記1記載の方法。
〔付記23〕
前記分解が、前記少なくとも一つのより複雑な概念を所定のレベルの要素性まで分解することを含む、付記13記載の方法。
〔付記24〕
もとの知識表現を分解する方法であって:
もとの知識表現に対応する入力を受領する段階と;
プロセッサにより一つまたは複数の規則を適用して前記もとの知識表現を一つまたは複数の要素的概念、一つまたは複数の要素的概念関係または一つまたは複数の要素的概念および一つまたは複数の要素的概念関係に分解する段階と;
前記要素的概念の少なくとも一つ、前記要素的概念関係の少なくとも一つまたは前記要素的概念の少なくとも一つおよび前記要素的概念関係の少なくとも一つの表現を要素的データ構造に含める段階とを含む、
方法。
〔付記25〕
前記要素的データ構造から新しい複雑な知識表現を合成する段階をさらに含む、付記24記載の方法。
〔付記26〕
要求コンテキストに従って、一つまたは複数の追加的概念、一つまたは複数の追加的概念関係または一つまたは複数の追加的概念および一つまたは複数の追加的概念関係を合成する段階と;
前記追加的概念の少なくとも一つ、前記追加的概念関係の少なくとも一つまたは前記追加的概念の少なくとも一つおよび前記追加的概念関係の少なくとも一つを使って、前記要求コンテキストに従って複雑な知識表現を生成する段階とをさらに含む、
付記24記載の方法。
〔付記27〕
前記複雑な知識表現を生成する段階が、前記要素的データ構造に前記一つまたは複数の規則を適用することを含む、付記26記載の方法。
〔付記28〕
前記複雑な知識表現を生成する段階が、前記要素的データ構造に一つまたは複数の異なる規則を適用することを含む、付記26記載の方法。
〔付記29〕
前記一つまたは複数の規則を前記一つまたは複数の異なる規則と一緒に記憶する段階をさらに含む、付記28記載の方法。
〔付記30〕
もとの知識表現に基づいて前記一つまたは複数の規則を選択する段階をさらに含む、付記24記載の方法。
〔付記31〕
前記要素的データ構造の意味的コヒーレンスを測定する段階をさらに含む、付記24記載の方法。
〔付記32〕
意味的コヒーレンスを測定する段階が、用語‐文書頻度を決定することを含む、付記31記載の方法。
〔付記33〕
前記もとの知識表現を分解するために、テキスト分析、統計的クラスタリング、言語学的分析、ファセット分析、自然言語処理および意味的知識ベースの使用からなる群より選択される少なくとも一つの技法を適用する段階をさらに含む、付記24記載の方法。
〔付記34〕
前記要素的概念の曖昧さ解消をする段階をさらに含む、付記24記載の方法。
〔付記35〕
前記要素的概念が形態素を含む、付記24記載の方法。
〔付記36〕
前記一つまたは複数の規則を適用することが、前記もとの知識表現を所定のレベルの要素性まで分解することを含む、付記24記載の方法。
〔付記37〕
知識表現間の意味的相互運用性を支援する方法であって:
複数の入力知識表現のうちの各入力知識表現について、プロセッサにより一つまたは複数の規則を適用して前記入力知識表現を一つまたは複数の要素的概念、一つまたは複数の要素的概念関係または一つまたは複数の要素的概念および一つまたは複数の要素的概念関係に分解する段階と;
プロセッサにより、前記複数の入力知識表現のそれぞれについての前記要素的概念の少なくとも一つ、前記要素的概念関係の少なくとも一つまたは前記要素的概念の少なくとも一つおよび前記要素的概念関係の少なくとも一つの表現を、共有される要素的データ構造に含める段階とを含む、
方法。
〔付記38〕
複雑な知識表現を生成するシステムであって:
要求コンテキストを示す入力を受領する段階と;
少なくとも一つの要素的概念、少なくとも一つの要素的概念関係または少なくとも一つの要素的概念および少なくとも一つの要素的概念関係を表す要素的データ構造に、一つまたは複数の規則を適用する段階と;
前記一つまたは複数の規則の適用に基づいて、前記要求コンテキストに従って、一つまたは複数の追加的概念、一つまたは複数の追加的概念関係または一つまたは複数の追加的概念および一つまたは複数の追加的概念関係を合成する段階と;
前記追加的概念の少なくとも一つ、前記追加的概念関係の少なくとも一つまたは前記追加的概念の少なくとも一つおよび前記追加的概念関係の少なくとも一つを使って、前記要求コンテキストに従って複雑な知識表現を生成する段階と
を実行するよう適応されたプロセッサおよびメモリを有する、
システム。
〔付記39〕
前記適用する段階が、前記要求コンテキストを示す入力を受領したあとの時点において、前記一つまたは複数の規則の少なくとも一つを適用することを含む、付記38記載のシステム。
〔付記40〕
ラベル、シンボルまたはラベルおよびシンボルを概念、概念関係または概念および概念関係に割り当てるようさらに適応されている、付記38記載のシステム。
〔付記41〕
前記要素的データ構造が、少なくとも二つの要素的概念を結ぶ少なくとも一つの要素的概念関係を含み、前記少なくとも一つの要素的概念関係は、少なくとも一つの一対一関係、少なくとも一つの一対多関係および少なくとも一つの多対多関係からなる群より選択される少なくとも一つの関係を含む、付記38記載のシステム。
〔付記42〕
前記要素的データ構造がテーブル構造を含む、付記38記載のシステム。
〔付記43〕
前記テーブル構造が少なくとも第一の行を含み、前記第一の行は第一の対の概念の間の第一の関係を表す、付記42記載のシステム。
〔付記44〕
前記テーブル構造が、前記第一の対の概念の間の第二の関係を表す第二の行を含む、付記43記載のシステム。
〔付記45〕
前記合成する段階が、概念分析、ファセット分類合成、意味的合成および動的系統分類からなる群より選択される少なくとも一つの技法を適用することを含む、付記38記載のシステム。
〔付記46〕
前記入力を受領する段階が、テキスト問い合わせ、検索語、シード概念および複雑なKR要求からなる群より選択される少なくとも一つの項目を受領することを含む、付記38記載のシステム。
〔付記47〕
前記複雑な知識表現を生成する段階が、1)所定数より少ない概念を生成するおよび2)シード概念から所定の階層的距離内の概念のみを生成する、からなる群より選択される少なくとも一つの動作を含む、付記38記載のシステム。
〔付記48〕
前記一つまたは複数の規則を含む規則の集合に対して、規則を追加すること、規則を削除することまたは規則を追加することおよび規則を削除することをさらに含む、付記38記載のシステム。
〔付記49〕
生成された複雑な知識表現をユーザーまたは操作者に対して出力するようさらに適応されている、付記38記載のシステム。
〔付記50〕
少なくとも部分的に、もとの知識表現を分解して、前記少なくとも一つの要素的概念を前記もとの知識表現の少なくとも一つのより複雑な概念から導出することによって、前記要素的データ構造を生成するようさらに適応されている、付記38記載のシステム。
〔付記51〕
前記要素的データ構造を生成する段階が、前記もとの知識表現に前記一つまたは複数の規則を適用することを含む、付記50記載のシステム。
〔付記52〕
前記要素的データ構造を生成する段階が、前記もとの知識表現に一つまたは複数の異なる規則を適用することを含む、付記50記載のシステム。
〔付記53〕
前記一つまたは複数の規則を前記一つまたは複数の異なる規則と一緒に記憶するようさらに適応されている、付記52記載のシステム。
〔付記54〕
前記要素的データ構造を生成する段階が:
前記一つまたは複数の規則または一つまたは複数の異なる規則のどちらを適用するかを、前記もとの知識表現に基づいて選択する段階と;
選択された規則を適用して前記もとの知識表現を分解する段階とを含む、
付記50記載のシステム。
〔付記55〕
前記要素的データ構造の意味的コヒーレンスを測定するようさらに適応されている、付記38記載のシステム。
〔付記56〕
意味的コヒーレンスを測定する段階が、用語‐文書頻度を決定することを含む、付記55記載のシステム。
〔付記57〕
前記分解が、テキスト分析、統計的クラスタリング、言語学的分析、ファセット分析、自然言語処理および意味的知識ベースの使用からなる群より選択される少なくとも一つの技法を使うことを含む、付記50記載のシステム。
〔付記58〕
前記少なくとも一つの要素的概念の曖昧さ解消をするようさらに適応されている、付記50記載のシステム。
〔付記59〕
前記少なくとも一つの要素的概念が形態素を含む、付記38記載のシステム。
〔付記60〕
前記分解が、前記少なくとも一つのより複雑な概念を所定のレベルの要素性まで分解することを含む、付記50記載のシステム。
〔付記61〕
もとの知識表現を分解するシステムであって:
もとの知識表現に対応する入力を受領する段階と;
一つまたは複数の規則を適用して前記もとの知識表現を一つまたは複数の要素的概念、一つまたは複数の要素的概念関係または一つまたは複数の要素的概念および一つまたは複数の要素的概念関係に分解する段階と;
前記要素的概念の少なくとも一つ、前記要素的概念関係の少なくとも一つまたは前記要素的概念の少なくとも一つおよび前記要素的概念関係の少なくとも一つの表現を要素的データ構造に含める段階と
を実行するよう適応されたプロセッサおよびメモリを有する、
システム。
〔付記62〕
前記要素的データ構造から新しい複雑な知識表現を合成するようさらに適応されている、付記61記載のシステム。
〔付記63〕
要求コンテキストに従って、一つまたは複数の追加的概念、一つまたは複数の追加的概念関係または一つまたは複数の追加的概念および一つまたは複数の追加的概念関係を合成する段階と;
前記追加的概念の少なくとも一つ、前記追加的概念関係の少なくとも一つまたは前記追加的概念の少なくとも一つおよび前記追加的概念関係の少なくとも一つを使って、前記要求コンテキストに従って複雑な知識表現を生成する段階とを実行するようさらに適応されている、
付記61記載のシステム。
〔付記64〕
前記複雑な知識表現を生成する段階が、前記要素的データ構造に前記一つまたは複数の規則を適用することを含む、付記63記載のシステム。
〔付記65〕
前記複雑な知識表現を生成する段階が、前記要素的データ構造に一つまたは複数の異なる規則を適用することを含む、付記63記載のシステム。
〔付記66〕
前記一つまたは複数の規則を前記一つまたは複数の異なる規則と一緒に記憶するようさらに適応されている、付記65記載のシステム。
〔付記67〕
もとの知識表現に基づいて前記一つまたは複数の規則を選択するようさらに適応されている、付記61記載のシステム。
〔付記68〕
前記要素的データ構造の意味的コヒーレンスを測定するようさらに適応されている、付記61記載のシステム。
〔付記69〕
意味的コヒーレンスを測定する段階が、用語‐文書頻度を決定することを含む、付記68記載のシステム。
〔付記70〕
前記もとの知識表現を分解するために、テキスト分析、統計的クラスタリング、言語学的分析、ファセット分析、自然言語処理および意味的知識ベースの使用からなる群より選択される少なくとも一つの技法を適用するようさらに適応されている、付記61記載のシステム。
〔付記71〕
前記要素的概念の曖昧さ解消をするようさらに適応されている、付記61記載のシステム。
〔付記72〕
前記要素的概念が形態素を含む、付記61記載のシステム。
〔付記73〕
前記一つまたは複数の規則を適用することが、前記もとの知識表現を所定のレベルの要素性まで分解することを含む、付記61記載のシステム。
〔付記74〕
知識表現間の意味的相互運用性を支援するシステムであって:
複数の入力知識表現のうちの各入力知識表現について、一つまたは複数の規則を適用して前記入力知識表現を一つまたは複数の要素的概念、一つまたは複数の要素的概念関係または一つまたは複数の要素的概念および一つまたは複数の要素的概念関係に分解する段階と;
前記複数の入力知識表現のそれぞれについての前記要素的概念の少なくとも一つ、前記要素的概念関係の少なくとも一つまたは前記要素的概念の少なくとも一つおよび前記要素的概念関係の少なくとも一つの表現を、共有される要素的データ構造に含める段階と
を実行するよう適応されたプロセッサおよびメモリを有する、
システム。
〔付記75〕
複雑な知識表現を生成するための複数のコンピュータ実行可能命令をエンコードされた少なくとも一つの非一時的コンピュータ可読記憶媒体であって、前記命令は、実行されたときに:
要求コンテキストを示す入力を受領する段階と;
少なくとも一つの要素的概念、少なくとも一つの要素的概念関係または少なくとも一つの要素的概念および少なくとも一つの要素的概念関係を表す要素的データ構造に、一つまたは複数の規則を適用する段階と;
前記一つまたは複数の規則の適用に基づいて、前記要求コンテキストに従って、一つまたは複数の追加的概念、一つまたは複数の追加的概念関係または一つまたは複数の追加的概念および一つまたは複数の追加的概念関係を合成する段階と;
前記追加的概念の少なくとも一つ、前記追加的概念関係の少なくとも一つまたは前記追加的概念の少なくとも一つおよび前記追加的概念関係の少なくとも一つを使って、前記要求コンテキストに従って複雑な知識表現を生成する段階とを実行する、
少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記76〕
前記適用する段階が、前記要求コンテキストを示す入力を受領したあとの時点において、前記一つまたは複数の規則の少なくとも一つを適用することを含む、付記75記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記77〕
前記命令が、実行されたときに、ラベル、シンボルまたはラベルおよびシンボルを概念、概念関係または概念および概念関係に割り当てることを実行する、付記75記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記78〕
前記要素的データ構造が、少なくとも二つの要素的概念を結ぶ少なくとも一つの要素的概念関係を含み、前記少なくとも一つの要素的概念関係は、少なくとも一つの一対一関係、少なくとも一つの一対多関係および少なくとも一つの多対多関係からなる群より選択される少なくとも一つの関係を含む、付記75記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記79〕
前記要素的データ構造がテーブル構造を含む、付記75記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記80〕
前記テーブル構造が少なくとも第一の行を含み、前記第一の行は第一の対の概念の間の第一の関係を表す、付記79記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記81〕
前記テーブル構造が、前記第一の対の概念の間の第二の関係を表す第二の行を含む、付記80記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記82〕
前記合成する段階が、概念分析、ファセット分類合成、意味的合成および動的系統分類からなる群より選択される少なくとも一つの技法を適用することを含む、付記75記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記83〕
入力を受領する段階が、テキスト問い合わせ、検索語、シード概念および複雑なKR要求からなる群より選択される少なくとも一つの項目を受領することを含む、付記75記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記84〕
前記複雑な知識表現を生成する段階が、1)所定数より少ない概念を生成するおよび2)シード概念から所定の階層的距離内の概念のみを生成する、からなる群より選択される少なくとも一つの動作を含む、付記75記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記85〕
前記命令が、実行されたときに、前記一つまたは複数の規則を含む規則の集合に対して、規則を追加すること、規則を削除することまたは規則を追加することおよび規則を削除することをさらに実行する、付記75記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記86〕
前記命令が、実行されたときに、生成された複雑な知識表現をユーザーまたは操作者に対して出力する段階をさらに含む、付記75記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記87〕
前記命令が、実行されたときに、少なくとも部分的に、もとの知識表現を分解して、前記少なくとも一つの要素的概念を前記もとの知識表現の少なくとも一つのより複雑な概念から導出することによって、前記要素的データ構造を生成する段階をさらに実行する、付記75記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記88〕
前記要素的データ構造を生成する段階が、前記もとの知識表現に前記一つまたは複数の規則を適用することを含む、付記87記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記89〕
前記要素的データ構造を生成する段階が、前記もとの知識表現に一つまたは複数の異なる規則を適用することを含む、付記87記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記90〕
前記命令が、実行されたときに、前記一つまたは複数の規則を前記一つまたは複数の異なる規則と一緒に記憶する段階をさらに実行する、付記89記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記91〕
前記要素的データ構造を生成する段階が:
前記一つまたは複数の規則または一つまたは複数の異なる規則のどちらを適用するかを、前記もとの知識表現に基づいて選択する段階と;
選択された規則を適用して前記もとの知識表現を分解する段階とを含む、
付記87記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記92〕
前記命令が、実行されたときに、前記要素的データ構造の意味的コヒーレンスを測定する段階をさらに実行する、付記75記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記93〕
意味的コヒーレンスを測定する段階が、用語‐文書頻度を決定することを含む、付記92記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記94〕
前記分解が、テキスト分析、統計的クラスタリング、言語学的分析、ファセット分析、自然言語処理および意味的知識ベースの使用からなる群より選択される少なくとも一つの技法を使うことを含む、付記87記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記95〕
前記命令が、実行されたときに、前記少なくとも一つの要素的概念の曖昧さ解消をする段階をさらに実行する、付記87記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記96〕
前記少なくとも一つの要素的概念が形態素を含む、付記75記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記97〕
前記分解が、前記少なくとも一つのより複雑な概念を所定のレベルの要素性まで分解することを含む、付記87記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記98〕
もとの知識表現を分解するための複数のコンピュータ実行可能命令をエンコードされた少なくとも一つの非一時的コンピュータ可読記憶媒体であって、前記命令は、実行されたときに:
もとの知識表現に対応する入力を受領する段階と;
一つまたは複数の規則を適用して前記もとの知識表現を一つまたは複数の要素的概念、一つまたは複数の要素的概念関係または一つまたは複数の要素的概念および一つまたは複数の要素的概念関係に分解する段階と;
前記要素的概念の少なくとも一つ、前記要素的概念関係の少なくとも一つまたは前記要素的概念の少なくとも一つおよび前記要素的概念関係の少なくとも一つの表現を要素的データ構造に含める段階とを実行する、
少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記99〕
前記命令が、実行されたときに、前記要素的データ構造から新しい複雑な知識表現を合成する段階をさらに実行する、付記98記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記100〕
前記命令が、実行されたときに:
要求コンテキストに従って、一つまたは複数の追加的概念、一つまたは複数の追加的概念関係または一つまたは複数の追加的概念および一つまたは複数の追加的概念関係を合成する段階と;
前記追加的概念の少なくとも一つ、前記追加的概念関係の少なくとも一つまたは前記追加的概念の少なくとも一つおよび前記追加的概念関係の少なくとも一つを使って、前記要求コンテキストに従って複雑な知識表現を生成する段階とをさらに実行する、
付記98記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記101〕
前記複雑な知識表現を生成する段階が、前記要素的データ構造に前記一つまたは複数の規則を適用することを含む、付記100記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記102〕
前記複雑な知識表現を生成する段階が、前記要素的データ構造に一つまたは複数の異なる規則を適用することを含む、付記100記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記103〕
前記命令が、実行されたときに、前記一つまたは複数の規則を前記一つまたは複数の異なる規則と一緒に記憶する段階をさらに実行する、付記102記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記104〕
前記命令が、実行されたときに、もとの知識表現に基づいて前記一つまたは複数の規則を選択する段階をさらに実行する、付記98記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記105〕
前記命令が、実行されたときに、前記要素的データ構造の意味的コヒーレンスを測定する段階をさらに実行する、付記98記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記106〕
意味的コヒーレンスを測定する段階が、用語‐文書頻度を決定することを含む、付記105記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記107〕
前記命令が、実行されたときに、前記もとの知識表現を分解するために、テキスト分析、統計的クラスタリング、言語学的分析、ファセット分析、自然言語処理および意味的知識ベースの使用からなる群より選択される少なくとも一つの技法を適用する段階をさらに実行する、付記98記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記108〕
前記命令が、実行されたときに、前記要素的概念の曖昧さ解消をする段階をさらに実行する、付記98記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記109〕
前記要素的概念が形態素を含む、付記98記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記110〕
前記一つまたは複数の規則を適用することが、前記もとの知識表現を所定のレベルの要素性まで分解することを含む、付記98記載の少なくとも一つの非一時的コンピュータ可読記憶媒体。
〔付記111〕
知識表現間の意味的相互運用性を支援するための複数のコンピュータ実行可能命令をエンコードされた少なくとも一つの非一時的コンピュータ可読記憶媒体であって、前記命令は、実行されたときに:
複数の入力知識表現のうちの各入力知識表現について、一つまたは複数の規則を適用して前記入力知識表現を一つまたは複数の要素的概念、一つまたは複数の要素的概念関係または一つまたは複数の要素的概念および一つまたは複数の要素的概念関係に分解する段階と;
前記複数の入力知識表現のそれぞれについての前記要素的概念の少なくとも一つ、前記要素的概念関係の少なくとも一つまたは前記要素的概念の少なくとも一つおよび前記要素的概念関係の少なくとも一つの表現を、共有される要素的データ構造に含める段階とを含む、
少なくとも一つの非一時的コンピュータ可読記憶媒体。
【符号の説明】
【0167】
100 システム
110 AKRMデータ・セット
120 要素的データ構造
130 知識処理規則
140 入力規則
150 分析エンジン
160 入力KR
170 合成エンジン
180 コンテキスト
190 出力KR
195 データ消費者
図1
図2A
図2B
図3
図4
図5
図6
図7
図8
図9
図10
図11