【文献】
尾崎 正太郎、外2名,意味ネットワークからの文章生成,情報処理学会研究報告,日本,社団法人情報処理学会,1997年 7月25日,第97巻,第69号,p.133−140
(58)【調査した分野】(Int.Cl.,DB名)
学習の前記1つ以上の態様を記憶する、さらなるステップであって、それによって、1つ以上の他のセマンティックネットワークの動的生成を容易にする、ステップを含むことを特徴とする、請求項2に記載のコンピュータで実現される方法。
消費者向けの対話に基づき、クライアント向けの合成されたメディアを提供する、さらなるステップであって、それによって、前記消費者は、以下の、(a)前記合成されたメディアの前記生成を指図する入力を提供するステップ、または(b)合成されたメディアを提供される前記1つ以上の形態から選択するステップ、のうちの1つを実施する、ステップを含むことを特徴とする、請求項1に記載のコンピュータで実現される方法。
【発明を実施するための形態】
【0024】
本発明は、その一態様では、セマンティックネットワークおよび思考ネットワークを自動作成するためのシステム、方法、ならびにコンピュータプログラムを提供する。また、本発明は、その別の態様では、(1)抽象的思考をデジタルで表現する方法と、(2)思考を(デジタルメモリとして)記憶し、呼び出す手段と、(3)適時かつ適切な観点内で思考を文脈化し、それらを同一の観点内(セマンティックネットワーク)で他の思考とリンク付けする手段と、(4)これらの思考の表現を特定のタスクに向ける手段と、(5)セマンティックネットワーキングのさらなる繰り返しに使用するために、学習したことを無駄なく記憶する手段と、を含む、セマンティックネットワーキングの広範な要件を提供するためのシステムおよび方法も提供する。
【0025】
本発明は、そのさらに別の態様では、方法、システム、およびコンピュータプログラムであって、それによって、メディア消費者が、1つ以上の、用途に合った文書を生成するように、メディア統合を指図し得る、方法、システム、およびコンピュータプログラムを援助する。このように、消費者は、個々の消費者の直接貢献および識見を含むように、自ら統合プロセスを指図することができる。生成される結果は、個人に合ったメディアとなり得る。本発明は、複合型ソリューションを提供し、それによって、個々の消費者が、メディアおよびコンテンツの作成を指図する唯一の作者および声となり得、このプロセスは、様々な文書および文書ソースを収集し、他の手段によって可能である域を越えてプロセスをさらに加速することができる、機械メディア統合によって容易になり得る。複合型ソリューションの結果は、それぞれの消費者独自統合のされたメディアまたは文書となり得、文書、メディアソース、および既知のメディア統合手法によって課される境界ならびに制限によって制約されない。
【0026】
セマンティックネットワークおよび思考ネットワークの概要
本発明は、その一態様では、方法、システム、およびコンピュータプログラムを開示し、それらは、例えば、複数のウェブページからなるウェブサイトまたは複数のデータインスタンスからなるデータベースなどの知識表現からなる情報ストアが、エージェントによって識別される1つ以上の思考によって定義される発想と、データインスタンスによって具現化される1つ以上の発想との間の関係の結びつきに基づき、最適に組織化され、アクセスされ得る、手段を提供する。そのような手段は、以後、「思考ネットワーク」と称される。
【0027】
セマンティックネットワーキングと同様に、思考処理は、相互関係のダイナミズムによって、セマンティックネットワークの能動的な作成および入れ替えによって定義される。「思考プロセッサ」は、動的な進化する思考ネットワーク、または統合された情報のドメインからなるネットワークを作成する、この処理思考の役割を提供し得る。思考の新しい表現がシステムに入力される際、思考プロセッサは、新しい思考および思考間の新しい連結を推論するために、新しい情報を使用し得る。既存の推理および推論エンジンとは異なり、本発明に係る思考プロセッサは、既存のセマンティックネットワークにわたる推理を補完するために、セマンティックネットワークの生成(ノードおよびエッジの両方を作成する)において、推論することができる。これを達成するために、思考プロセッサは、知識表現(思考データ)を認識エージェント(例えば、人を含む)の入力と統合することができる。
【0028】
いったん作成されると、セマンティック(思考)ネットワークは、多くの使途に使用することができる。思考ネットワーキングは、(1)思考を取得し、記憶し、呼び出す手段の提供、(2)高度に個人化され、文脈化され、かつ実用的な思考ネットワークを、それらが作業するのに必要とされる際に生成する手段の提供、および(3)ソフトウェアエージェントであって、それらが作成された思考ネットワークを摂取する際、これらの仕事を行う、ソフトウェアエージェントの提供を含む、少なくとも3つの広い分類の活動に対処し得る。
【0029】
これらの思考ネットワークは、いくつかの理由で有用であり得る。例えば、それらは、思考ネットワーキングから得られる情報に基づき、ウェブサイトをナビゲートするために使用することができ、それによって、インターネット検索を可能にし、買物を支援し、文書の略述を可能にし、作成されるソーシャルネットワークの作成を支援すること等を行うことができる。ソフトウェアエージェントの役割には、インターネットから情報を検索し、取り出す、問い合わせビルダにデータを提供すること、特定の基準に適合する製品を見つけるための買物エージェントとしての機能を果たすこと、セマンティックネットワークを文書として提示し、それを異なるドメインから取り出されたコンテンツと共に生成することによって、文書を略述すること、および異なる人によって生成されたセマンティックネットワーク内の思考の共通部分を探すことによって、ソーシャルネットワークを作成することを挙げることができるが、これらに限定されない。
【0030】
図1は、思考ネットワークを生成し、使用するために必要とされるコンポーネントの一実現形態を図示する。
【0031】
本発明の一実現形態では、思考ネットワークの生成は、以下のコンポーネント、すなわち、知識表現の手段101、思考処理装置103、認識エージェント105の使用、思考記憶装置手段107、および適応分類スキームジェネレータ109によって生じる。これらのコンポーネントのそれぞれは、以下に記載される。それぞれのコンポーネントの新規の代表的な実現形態が記載されるが、当業者は、コンポーネントの他の既知の実現形態が、本発明のシステム全体の動作を提供し得ることを認識するであろう。コンポーネントのそれぞれは、思考ネットワークを動的かつ最適に洗練するために、必ずしもではないが、同時に動作し得ることを理解されたい。
【0032】
本発明の別の態様では、思考ネットワークの生成および使用は、特に、ビルドエンジン、例えば、PCT出願第PCT/CA2007/001546号に記載されるビルドエンジンの一実現形態として最もよく理解される、思考処理装置103によって可能となる。思考処理装置103は、概念合成の手段113にリンク付けされてもよく、これもPCT出願第PCT/CA2007/001546号に記載される。また、認識エージェント105が以下により完全に記載されるプロセスに従って思考処理装置103とやりとりができるようにするために、インターフェース115が提供されてもよい。
【0033】
情報ストア(またはソースドメイン111)からその知識表現を抜き出すために、最初に、情報を概念のセマンティック表現に抽象化する必要があり得る。情報抽象化のプロセスは、「知識表現」と称され得る。
【0034】
知識表現の手段101は、抽象的思考の物理表現を含み得る。本発明の文脈においては、特定かつ要素単位の知識が表現され、所望によりコード化され得る(一態様では、要素単位は、利用可能な知識の絶対最小単位であり得る)。知識表現手段によって生成されるアーティファクトは、例えば、ウェブページ、RSSフィード、RDFグラフ等の思考を表現する様々なメディアを使用し得る。これらのメディアは、本発明のシステムの他のコンポーネントによって処理される思考の相互関係を提供し得る。次いで、メディアは、本発明よって教示されるように、広告、購読、取引の小額決済等、多種多様な収益モデルによって、収益化されてもよい。
【0035】
いったん知識の単位が表現されると、次いで、思考処理装置103は、概念統合の手段113を提供し得る。ソーシャルネットワーキングの特定の実施形態と同様に、思考処理は、ネットワークの能動的な作成および入れ替えをもたらす、相互関係ののダイナミズムによって定義されてもよい(この場合も同様に、思考処理は、例えば、一般に、知識の概して静的な表現である「セマンティックネットワーク」の観念とは大きく異なり得る)。思考処理装置103は、動的な進化するネットワークを作成するように、思考を処理することができる。思考の新しい表現がシステムに入力されると、思考処理装置103は、新しい思考および思考間の新しい連結を推論するために、新しい情報を利用し得る。既存の推理および推論エンジンとは異なり、思考処理装置103は、既存のセマンティックネットワークにわたる推理を補完するために、セマンティックネットワークの生成(例えば、ノードおよびエッジの両方を作成する)において、推論する必要があり得る。これを達成するために、思考処理装置103は、知識表現(思考データ)を、人、機械ベースのエキスパートシステム等であり得る、認識エージェント(また、本開示では、「エージェント」とも称される)105の入力と統合する必要があり得る。思考処理装置103は、認識エージェント105の「考え」を拡大および加速ことができる。
【0036】
人、機械ベースのエキスパートシステム等であり得る、認識エージェント105は、経時的に思考ネットワークを洗練し、最適化し得るパターン認識および選択の入力を提供することができる。思考ネットワークによって生成されるメディアに加えて、また、認識エージェント105は、向上した呼び出しまたはメモリ、創造性、および関連する考え等の利益によって、価値作成の利益を得ることができる。作成されるメディアと同様に、これらの利益は、ライセンス供与、購読等によって、収益化され得る。
【0037】
次第に増加する大きな数および規模の思考ネットワークに対応するために、要素情報および関係情報を記憶するための思考記憶装置手段107を提供することができる。思考記憶装置手段107は、必要に応じてのみ思考ネットワークを選択的に統合し得る、圧縮装置および最適化装置を備えてもよい。注目され、作用を受け、次いで薄れる記憶と同様に、デジタル思考は、取り出され、メディア等の有形のアーティファクトを作成するためにネットワークに統合され、次いで解体される必要があり得る。本記載の思考記憶装置手段107は、異なるドメインからの思考を統合するために使用され得る分析システムと共に使用される、データモデルを教示する。
【0038】
適応分類スキームジェネレータ109は、特定のドメイン内の知識を表現するために使用することができ、概念に関する推理のための基礎を提供する。分類スキームおよびオントロジーの生成における課題は、それらが、特定のドメインおよびそれらの中で活動している認識エージェント用に作られなければならないということである。思考は、非常に主観的であり、非常に個人的であり、多くの場合、私的であり得る。したがって、適応分類スキームジェネレータ109は、ある人が作成し得るネットワークの種類の範囲および用途を定義してもよい。本開示では、高度に個人化され、かつドメイン固有の分類スキームを生成するためのコンポーネントが教示され、これは、広範囲の汎用アプリケーションにインフラストラクチャを提供し得る。また、このコンポーネントは、人々および複数のドメインにわたる思考ネットワークを統合するために、思考データストアと共に機能し、思考を呼び出し、必要に応じて思考ネットワークを統合し、いったんそれから利益が集められると、ネットワークを崩壊させる手段を提供し得る。
【0039】
知識表現
本発明の文脈において、知識は、当業者に既知のいくつかの方法で表現され得る。必要とされ得るものは、それによって、本発明の思考プロセッサが思考間の関係のネットワークを統合し得るように、思考が連結され得る、手段である。以下に、以前にPCT出願第PCT/CA2007/001546号に記載された、思考の表現を生成する新規の一手法を記載するが、本発明の思考プロセッサは、任意の思考の表現で動作可能であり得る。
【0040】
知識表現モデルの概要
簡略化のため、本発明によって記載される表現を生成する新規手法を説明するために、PCT出願第PCT/CA2007/001546号に記載される知識表現モデルが使用される。
【0041】
知識表現モデルは、知識表現エンティティと、関係と、変換の方法とを含み得る。
【0042】
エンティティ
図2は、本発明の一実現における、知識表現エンティティおよび関係を図示する。例証目的のためだけに、および本発明を制限することなく、
図2は、知識表現エンティティおよび関係312に係る、サンプルエンティティラベル314も示す。エンティティは、一式のコンテンツノード302と、一式のコンテンツコンテナ304と、一式の概念306(説明の簡略化のため、1つの概念のみが
図2に提示される)と、一式のキーワード308と、一式の形態素310とを含み得る。含まれる情報空間は、ドメインと称され得る。ドメインは、知識が分割され、その周囲に境界が設定される、広い関心フィールドを備え得る。
【0043】
ドメインは、それが含有するものを厳密に、または完全に知ることなく、定義され得る。本発明は、任意の数のドメインを調べる、または調査するために使用されてもよい。しかしながら、これは、任意の特定の時間に、1つの選択されるドメイン内で動作することができる。これは、アクティブドメインと称され得る。
【0044】
分類されるドメインのオブジェクトは、コンテンツノード302と称され得る。コンテンツノードは、分類に従う任意のオブジェクト、例えば、ファイル、文書、文書の一部、画像、または記憶された文字列からなってもよい。コンテンツノード302は、物理オブジェクトまたは仮想オブジェクトを参照してもよい。
【0045】
コンテンツノード302は、一式のコンテンツコンテナ304内に含まれてもよい。コンテンツコンテナ304は、アドレス可能な(または位置付け可能な)情報を提供し得、それによって、コンテンツノード302を取り出すことができる。コンテンツコンテナ304は、1つ以上のコンテンツノード302を含むことができる。例えば、URLによってアドレス可能なウェブページのコンテンツコンテナ304は、テキストおよび画像の形態の多くのコンテンツノード302を含んでもよい。
【0046】
コンテンツノード302の意味(例えば、コンテンツノード302の記述、目的、用途、または意図)は、概念306を使用して抽象化され得る。概念306は、コンテンツノード302またはコンテンツノード302のいくつかの態様を説明し得る。個々のコンテンツノード302に、多くの概念306が割り当てられてもよく、個々の概念306は、多くのコンテンツノード302にわたって共有されてもよい。場合によっては、概念306は、いかなるコンテンツノードともまったく関連しなくてもよい。これらには、いくつかの意味を、その意味がいずれかの特定のオブジェクトまたはコンテンツノード302に属すると見なすことなく表現する概念306が挙げられ得る。
【0047】
本発明の文脈において、概念306は、「思考」を表現してもよく、コンテンツノード302は、例えば、思考と関連するテキスト、音声、画像、または映像であってもよい。
【0048】
概念306は、それらの他のエンティティに対する関係によって、抽象化の複合レベルの観点から定義され、キーワード308および形態素310等の他のより基礎的な知識表現エンティティの観点から構造的に定義され得る。そのような構造は、概念定義と称され得る。集合的に、概念を含むキーワードおよび形態素等のより基礎的な知識表現エンティティは、概念の属性と称される。
【0049】
キーワード308は、概念306内のより微小な単位であり得る。キーワード308は、より複雑(かつより抽象的)な概念306を作成するために、他のキーワード308と組み合わされてもよい。したがって、同一のキーワードが、多くの異なる概念306内に出現してもよい。例えば、概念「チームスポーツ(Team Sports)」は、キーワード「チーム(Team)」および「スポーツ(Sports)」からなってもよく、概念「ウォータースポーツ(Water Sports)」は、キーワード「ウォーター(Water)」および「スポーツ(Sports)」からなってもよい。したがって、「スポーツ」は、両方の概念のキーワードであり得る。また、キーワード308間の方向性は、それらの関係を部分的に説明するように維持され得る。
【0050】
概念306がキーワード308に分けられ得るのと同様に、キーワード308は、形態素310と呼ばれる、それらの最も基本的な意味単位にさらに分けられ得る。形態素310は、抽象化の最下位レベルであり得、最も明確かつ一意的な意味の単位または意味単位を表現し得る。例えば、「ベースボール(baseball)」は、形態素「ベース−(base−)」および「ボール(−ball)」からなり得る。どのように、およびどの方向にこれらのビルディングブロックが関係付けられ得るかを理解することによって、それらは、次第により複雑な構造に組み合わせられ得る。このようにして、ドメイン内のすべての考えられる概念が関係付けられ得る。
【0051】
ラベルと称される(分類の技術分野では、多くの場合、「ターム」と呼ばれる)、特別のカテゴリのコンテンツノード302は、それぞれの知識表現エンティティに連結され得る。ファセットデータ集合内のそれぞれのエンティティは、ラベルを有し得る。ラベルは、エンティティを識別するために使用され得る、簡易化された名前、説明的語または句であってもよい。ラベルは、それらが説明するそれぞれのエンティティとは異なるものである。ラベルは、単に、様々なエンティティを、人が識別可能なものにするのを助けることができるものである。エンティティに割り当てられるラベルは、典型的に、ドメイン内に提示される言語および用語から導かれる。
【0052】
ラベルは、本発明の自動化された態様の動作における因子ではなくてもよいが、自動化された態様と認識エージェントとの間の相互関係における役割を有し得る。
【0053】
コンテンツノード302と同様に、ラベルは、知識表現モデルにおいて、それらが説明するそれぞれのエンティティから抽象化されてもよい。したがって、
図2では、以下の種類のラベル、すなわち、コンテンツコンテナ304を説明するコンテンツコンテナラベル304aと、コンテンツノード302を説明するコンテンツノードラベル302aと、概念306を説明する概念ラベル306aと、一式のキーワード308を説明する一式のキーワードラベル308aと、一式の形態素310を説明する一式の形態素ラベル310aとが特定される。
【0054】
動作およびシステムの特定の態様は、上記の知識表現モデルを参照して記載されるが、当業者は、他のモデルを使用して、それに従って動作およびシステムを適合させることができることを理解するであろう。例えば、概念は、より高次の知識表現エンティティ(「ミーム」、発想を構成する概念の群等)を作成するために、共に組み合わせられてもよい。また、表現モデルの構造は、縮小されてもよい。例えば、概念がキーワード310に関してのみ定義されるように、形態素抽象化層が除去されてもよい。
【0055】
関係
入力データ内のエンティティ関係は、概念から生じ得る。例えば、概念に関連付けられる属性は、方向性を有して(例えば、より広範のものからより狭範のものに)関係付けられてもよく、これは、関連する概念を結びつける、属性階層と称され得る。
【0056】
ドメインの属性階層では、それぞれの属性は、ゼロ以上の子孫を有し得、1つの祖先(祖先を有さないルート属性を除いて)を有し得る。
【0057】
知識の物理表現の生成
本発明のシステムでは、知識を「思考」としてコード化し、「思考ネットワーク」内で思考を共に結びつける、データ集合、例えば、ファセットデータ集合を、思考処理手段に提供する必要があり得る。思考ネットワーク等のセマンティックネットワークへの入力として、データを提供するための多くの方法が当業者に既知である。以下の記載は、PCT出願第PCT/CA2007/001546号に記載される、データ集合の提供の代表的な一実施例を提供する。
【0058】
知識の物理表現の生成は、1つ以上のドメインにわたって提供され得る、つまり、本発明によって開示されるシステムおよび方法は、単一のドメイン上および複数のドメイン上の両方で動作可能であることに留意されたい。
【0059】
図3は、知識表現のプロセスの一実施例を図示し、これは、本実施例では、ファセット分析と称され得る。ファセット分析の概要が以下に記載される。簡略化のため、ファセット分析に関連するプロセスを説明するために、上記の知識表現モデルが使用されるが、しかしながら、ファセット分析または類似する表現方法は、任意の知識表現モデルに適用されてもよいことが当業者にとって明白であろう。
【0060】
ファセット分析は、ドメインをステージングすること201、すなわち、データの群を表現する再編成された入力構造を生成するプロセスによって開始することができる。ドメインによって、これらの入力構造は、一連の複雑性を具現化し得る。
【0061】
ドメインは、例えば、情報のインデックスおよびライブラリを含む、いくつかのウェブページを備えるウェブサイトであってもよい。ステージング201の後、ウェブサイトのコンテンツは、最高レベル(最広範)のトピックスから開始し、最低レベル(最も特定)の記事にまで狭まる、一連の重複階層(多重階層として知られる)で表現されてもよい。説明のため、これは、以下のようであってもよい。
【0062】
人々
場所
物
自然物
人工物
想像物
・・・
【0063】
ステージング201に続き、分析プロセスは、本発明の思考処理態様で使用するために、ステージングされたドメイン内の情報を基礎的なビルディングブロックに展開し、次いで、これらのビルディングブロックをずっと小さなデータ集合に組み立てるステップからなり得る。結果は、代表的な実施例の知識表現モデルを使用する場合、ファセットデータ集合と称され得る。
【0064】
ファセットデータ集合は、ドメインの分類スキームをコード化してもよく、これは、前述される知識表現モデルを利用し得る。これは、本発明の思考処理態様に、思考ネットワーク内の意味概念がどのように互いに関係し得る可能性があるかを知らせる。ウェブサイトが表現される、上述の実現形態を考慮すると、知識は、以下のように、概念、キーワード、および形態素として表現され得る。
【0065】
ドメイン内のそれぞれのオブジェクト(例えば、記事、リンク、または写真)は、オブジェクトにある意味を与える、1つ以上の概念と関連していてもよい。概念関係の方向性は、階層で捕捉することができる。例えば、ウェブサイトは、「スポーツ→チームスポーツ→ベースボール」という項目を含んでもよい。これらのトピックのそれぞれは、概念によって表現され得る。
【0066】
ステージング
ステージング段階の目的は、インポートジョブを設定し、次いで、続く分析タスクで使用するために、データを抽出し、変換し、ロードする(「ETL」)ことであり得る。ETLの方法は、当業者に既知である。この段階は、(1)データソースからデータを読み込み、(2)生データを構造化データに翻訳し、(3)その構造化データをデータ記憶装置手段に記憶する。これらのタスクを実施するために使用されるツールおよび技術は、選定されるデータソースに依存し得る。
【0067】
分析
分析は、ソース構造分析ステップ203と、属性抽出ステップ205と、属性階層組み立てステップ207とを含み得る。PCT出願第PCT/CA2007/001546号に基づく代表的な実施例が提供され、便宜のために、以下に概要される。当業者に既知の、実質的に類似する結果を提供するための他の方法が存在することに留意されたい。
【0068】
ソースデータがインポートされた後、抽出されたソースデータを分析し、後の属性の抽出のために準備する、ソース構造分析203段階を使用することができる。この段階は、例えば、冗長データを除去し、それらの共有ラベルに基づき、概念を明確化し、データ内の循環関係を除去する、プロセスを使用して、入力データを認証し、圧縮するために使用され得る。そのようなプロセスは、当該技術分野において周知である。
【0069】
これは、入力概念関係の範囲を、比較的高い信頼性のものだけに制限するのを助長する。例えば、ルートノードからさらに除去される関係は、より低い信頼性のものであり得、または関係は、文脈に基づいて除去されてもよい(215)。
【0070】
また、概念は、明確化することができる(217)。つまり、あいまいなラベルを有する概念は、同一の概念にまとめられてもよい。これは、例えば、ウェブサイトを利用する実現形態で、記事が、それらの親カテゴリと同一のラベルを共有する場合に有用であり得る。明確化は、(1)指定される関係集合内で主ラベルを共有する概念をマージする、またはまとめること、または(2)代替ラベルが関係集合内で別の概念の主ラベルと一致する場合、所望により、代替ラベルを除去することを含んでもよい。さらなる最適化のために、循環および冗長関係が、所望により除去されてもよく(219、221)、または非階層概念関係を排除するように再配向されてもよい。
【0071】
このプロセスに続き、抽出されたデータソースは、属性抽出205のために準備することができる。入力概念を基準として使用して、この段階は、属性を作成し(例えば、キーワードとして)、それらを属性階層への配置に備えることができる。概念は、適切な属性のリスト(例えば、キーワードの集合としての)によって定義されてもよい。このプロセスは、概念当たり1つのキーワードを作成してもよい(223)。そのキーワードは、それぞれの概念ラベルに対して1つのラベルを有してもよい。これらのキーワードラベルは、概念ラベルに対応し得る。あるいは、所与の概念に対する複数の異なるラベルが、その概念の異なる発想または態様を説明してもよい。この場合、それぞれの概念ラベルに対して、別個のキーワードが作成されてもよい。あるいは、これらの2つの手法が組み合わせられてもよい。次いで、キーワードは、概念が明確化され得たのと同様に明確化されてもよい(225、227)。
【0072】
概念ラベルは、除去され得る、個々の語に分解されてもよい(229)。これは、(1)以前に確立された概念ラベルのインデックスで参照されるラベルで開始し、(2)まだトークン化されていない、または分離されていない概念ラベル(すなわち、これらのラベルは依然として存在していない)から、単一語ラベルを取り出し、(3)概念ラベルをトークン化または分離し、(4)単純なキーワード抽出プロセスによって、対応する概念から作成され得たキーワードに、単一語ラベル(順に優先順位の付けられた)を追加することによって、達成されてもよい。
【0073】
次に、近隣の概念と共有されるラベルに基づき、概念に新しいキーワードが割り当てられ(231)、それによって、複雑な概念定義を作成する。「共通語」のインデックス内の以前に識別された語は、追加されなくてもよい。最後に、所望により、未使用のラベルが外されてもよい(233)。
【0074】
属性関係は、それぞれの概念を、単純なものまたは複雑なもののいずれかとして分類し、単純な概念と関連するキーワード間に関係を作成し(235)、その間のいかなる複雑な概念も省略することによって、抽出され、洗練されてもよい(209)。複雑な概念は、そのラベルのうちの1つまたはすべて内に閾値数以上の語、または2つ以上のキーワードのうちの少なくとも1つを含む、概念であってもよい。複雑な概念は、それらのキーワード関係における確実性がそれ程高くない可能性があるため、除外され得る。
【0075】
次に、属性階層を構成することができる(211)。循環キーワード関係を除去する(237)、または冗長キーワード関係を除去する(239)ために、属性階層にソース構造分析が再適用されてもよい。属性(例えば、キーワード)関係が取り除かれ、厳密な階層(それぞれの子キーワードは、1つの親のみを有し得る)に再編成されてもよい(241)。複数の親を有する子キーワードは、親関係が切断されてもよく、その祖先関係は、再編成されてもよい。
【0076】
最後に、入力ソース構造内に存在する概念関係に基づき、概念に属性を割り当てることができる(213)。エクスポートの前に、概念定義は、属性(例えば、親の概念定義内のキーワード)のそれぞれが、(1)子概念定義内に見つかる、または(2)子概念定義内のキーワードに関係付けられる、のうちの1つとなるように、修正されてもよい(243)。概念定義がこの判定基準を満たさない場合には、そうなるように変更されてもよい(245)。
【0077】
ステージングおよび分析プロセスの出力247は、思考プロセッサが使用可能な形式の属性階層であり得る。形式は、複数のインデックスまたはテーブルであってもよい。複数のテーブルは、エンティティ(例えば、キーワードおよび形態素の属性からなる概念)、属性間の関係、それらのソースコンテンツコンテナへのコンテンツノード参照およびURI参照、それぞれのエンティティのラベル、ならびに有用であり得る他の情報、例えば、プロセスメタデータを記憶するためのものを含み得る。
【0078】
思考プロセッサ
以下は、思考プロセッサの思考ネットワーク態様の新規の一実現形態を記載し、これは、以前にPCT出願第PCT/CA2007/001546号に記載された方法に基づき得るが、本発明の思考プロセッサは、例えば、また、形式概念分析またはファセット分類合成にも基づくことができる、任意の思考ネットワークで動作可能であり得る。
【0079】
図4は、思考プロセッサの思考ネットワーク合成態様の一実現を図示する。
【0080】
本発明の思考プロセッサ態様は、1つ以上のドメインを関心領域として表現する、データ集合401(例えば、上述のファセットデータ集合)を入力として受け取り、新しい思考および既存の思考を共に連結するために、ユーザ入力を収集し得る。新しいセマンティックネットワークは、本発明の知識表現態様によって提供されるデータ集合の集約を使用して、動的に統合され得る。
【0081】
これらの統合動作の出力は、次元的概念タクソノミーと称され得、属性階層を調べることによって、次元的概念関係を表現する。これを達成する方法は、当業者に既知である。そのような方法には、形式概念分析およびファセット分類合成が挙げられる。ここで、可能な一実現形態が記載される。
【0082】
入力時、ファセットデータ集合401内のそれぞれのエンティティ(例えば、概念、属性、コンテンツノード、概念関係、および属性関係)に、一意の識別子(ID)が与えられ得る。エンティティIDが与えられると、対応するラベルを判定することができる。概念IDから、その概念に対応する属性のIDリスト、その概念に対応する属性の数、その概念に対応するコンテンツノードのIDリスト、その概念に対応するコンテンツノードの数のうちのいずれもが判定され得る。
【0083】
動的統合動作の後、基本的なルックアップ機能、属性階層415、および概念照合を含む、多数の新しいマッピング403が作成され得る。概念のラベルから、属性またはコンテンツノード、同一のラベルを有する同一の種類のすべての他のエンティティのリストが判定され得る。それぞれの属性に対して、属性のIDから、その属性の祖先、子孫、または兄弟の個数およびIDのリストが生成され得るように、それを含む一式の概念が求められ得る。さらに、属性またはコンテンツノードのIDが与えられると、そのエンティティと関連する概念の個数およびIDのリストが判定され得る。同様に、属性集合内の属性の数が与えられると、そのサイズの属性集合を有する概念の個数およびIDのリストが生成され得る。
【0084】
統合405を指図するために、1つ以上のパラメータ、例えば、ドメイン、アクティブ概念定義、軸定義、および範囲を制約するための所望の制限パラメータを入力できるようにする、ユーザインターフェースが、ユーザに提示されてもよい。
【0085】
ユーザ入力
図5は、本発明によって提供されるユーザインターフェースの一態様を図示する。
【0086】
ユーザおよびシステムによって提供される入力には、以下のものが挙げられ得る。
● ドメイン501:統合動作が適用されるべき広いフィールド。
● アクティブ概念503:開始点。
● 軸定義505:関係付けられる概念を探す方向(方向または別の点のいずれかとしての)。軸定義は、アクティブ概念の1つ以上の属性またはドメイン内の他の概念のいくつかの属性のリストを使用して、指定されてもよい。
【0087】
ユーザは、インターフェースを使用して、以下のパラメータをさらに提供してもよく、またはこれらは、ユーザ対話に関係付けられていない設定値として提供されてもよい。
● 分離度:停止する前に、結果として生じる概念階層内のアクティブ概念から関係付けられる概念まで進み得る直接階層段の最大数。分離度は、関係の階層鎖内の段を含んでもよい。
● 出力制限:停止する前に見つけ得る、関係付けられる概念、コンテンツノード、または両方の合計の最大数。例えば、ユーザは、10個の最も近い概念を見つけた後、それらとアクティブ概念との間にいくつの分離度が存在するかに関わらず、統合動作を停止するように指示することができる。
【0088】
ユーザは、ユーザインターフェースを介して、これらの任意の組み合わせをシステムに指定してもよく、システムは、思考ネットワークとして、概念の結果として生じる階層(出力概念階層)を返すことができる。次いで、出力概念階層は、ユーザによるさらなる探求の的であり得、またはさらに別の一連の統合動作への橋渡しとしての機能を果たしてもよい。さらなる探求は、以下の「認識エージェント」という見出しの下に、さらに記載される。ここで、出力概念階層の生成がより完全に説明される。
【0089】
候補集合
戻って
図4を参照すると、アクティブ概念の属性集合407は、指定されるドメイン内から、構築された概念階層の候補として使用され得る、一式の概念を見つけるための開始点であってもよい。アクティブ概念に関係付けられる一式の概念は、関係の性質に関わらず、候補集合と称され得る。候補集合は、属性が指定された軸定義および分離度内であり、かつ明示的もしくは黙示的に、または両方でアクティブ概念に関係付けられる、概念を含み得る。
【0090】
ドメイン内のそれぞれの概念は、入力ファセットデータ集合の一部として、その属性の観点から定義され得る。それぞれの概念に一式の属性が存在し得る。ドメイン内の属性のうちのいくつかは、属性階層内で関連し得る。それぞれの属性は、複数の概念の定義の一部として使用され得る。それぞれの属性に対して、アプリケーションは、それを含む一式の概念定義を求めてもよい。
【0091】
アクティブ概念の属性集合は、明示的に関係付けられる祖先および子孫属性集合を見つけるために、属性階層を調べられてもよい。属性集合は、指定された軸定義に制約され得る。また、それらは、指定された最大限度および分離距離の程度に制約され得る。
【0092】
候補集合は、以下のように判定され得る(409)。アクティブ属性集合内のものの部分集合である、もしくは明示的な祖先である要素を有する、または両方である、属性集合は、考えられる祖先概念と見なされ得る。これらの関係付けられる属性集合のそれぞれ内のそれぞれの属性は、自体の一式の一致する概念を有し得る。所与の属性集合のこれらの概念集合の共通集合は、属性集合の一致する概念411を含み得る。
【0093】
アクティブ属性集合内のものの上位集合である、もしくは明示的な子孫である要素を有する、または両方である、関連する属性集合を使用して、類似するプロセスが実施され、考えられる子孫概念を表現してもよい。再びここでも、関連する属性集合の概念集合の共通集合は、その属性集合の一致する概念を含み得る。
【0094】
候補集合は、すべての関連する属性集合からの共通集合の和集合であってもよい。
【0095】
明示的な関係
それぞれの属性は、一式の祖先、一式の子孫、または両方を有し得る。属性階層へのファセット入力データの一部として、属性間に関係が存在する際、属性間に明示的な関係が存在し得る。次いで、この関係は、これらの属性に対応する概念間に関係を確立するために使用することができる。
【0096】
例えば、以下が与えられる場合:
● {属性1}は、「概念1」の属性であること
● {属性2}は、「概念2」の属性であること
● {属性1}が祖先であり、{属性2}が子孫である、これらの属性間の明示的な関係属性{属性1}がその子属性{属性2}と置き換えられる(以後、「動作c」)場合、「概念1」は、「概念2」と同一の属性リストを有し、したがって、それらの間に関係が存在し得る。「概念2」は、「概念1」の子孫であり得る。
【0097】
同様に、代わりに、{属性2}がその親属性{属性1}と置き換えられる(以後、「動作p」)場合、「概念2」は、「概念1」と同一の属性リストを有し、それらの間に関係が存在し得る。「概念1」は、「概念2」の祖先であり得る。
【0098】
黙示的な関係
黙示的な関係は、1つ以上の属性を追加する、またはアクティブ概念定義から1つ以上の属性を削除することによって導出される、属性の共通集合に基づき得る。いずれかの動作を使用して、子孫または祖先の概念定義が導出され得る。アクティブ概念の部分集合である属性を有する概念は、アクティブ概念の祖先であり得る。同様に、アクティブ概念のすべての属性、そしてさらに1つ以上の追加属性を有する概念は、アクティブ概念の子孫であり得る。
【0099】
例えば、以下が与えられる場合:
● 「概念1」は、アクティブ概念であり、2つの属性:{A、B}で構成される概念定義を有すること
● 「概念2」は、3つの属性:{A、B、C}で構成される概念定義を有すること
【0100】
子属性{C}が「概念1」属性リストに追加される場合、「概念1」は、「概念2」と同一の属性リストを有し得、2つの属性リスト間に黙示的な関係が存在し得る。したがって、「概念2」は、「概念1」の子孫であり得る。
【0101】
あるいは、「概念2」がアクティブ概念である場合、それに「概念1」と同一の属性リストを与えるために、その属性のうちの1つが削除されてもよい。そこで、2つの属性リスト間には黙示的な関係が存在し得、「概念1」は、「概念2」の祖先であり得る。
【0102】
次いで、アクティブ属性集合のすべての部分集合を収集することによって、一式の祖先属性集合が生成されてもよい。これらの部分集合は、アクティブ属性集合より1つ少ない属性、2つ少ない属性、3つ少ない属性等を有するものを含み得る。
【0103】
同様に、アクティブ属性集合のすべての上位集合を収集することによって、一式の子孫属性集合が生成されてもよい。上位集合は、アクティブ属性集合より1つ多い属性、2つ多い属性、3つ多い属性等を有するものを含み得る。
【0104】
明示的な属性関係の階層は、これらの属性が存在するすべての概念定義の文脈内に存在する属性関係の判定において、統合動作を支援し得る。
【0105】
導出
候補集合は、アクティブ概念の属性集合に関連する属性集合から判定され得る。明示的に関係する要素は、ファセットデータ集合内の属性階層から見つけられ得る。黙示的に関係付けられる属性集合は、積集合によって暗示され得る。黙示的な子孫属性を見つけるために使用される追加属性は、ドメイン内である間、システムに既知であってもなくてもよい。
【0106】
アクティブ属性集合は、候補集合内の概念に関連付けられる属性集合のそれぞれと対にされてもよい。それぞれの対に対して、アクティブ属性集合をその対集合に変換する、一連の集合動作が導出されてもよい。導出と称されるこれらの動作は、どのように候補概念がアクティブ概念に関係するかを定義し得る。
【0107】
関係する属性集合を見つける試みのプロセスにおいて、属性集合に対して実行することができる、4つの導出動作(413)が存在し得る。動作の種類は、表1に示されるように簡約することができる。
【0109】
すべての属性関係の方向性が、潜在的概念関係の対内で一貫している必要がある場合があることに留意する。属性集合の対は、それらの要素間に祖先関係または子孫関係を有してもよいが、両方を有していなくてもよい。
【0110】
統合動作は、概念間に関係を確立するために、祖先動作(p、d)または子孫動作(c、a)の両方ではなく、いずれかのみを適用することによって、この方向性を保つことができる。これは、概念のすべてのその属性が、関係付けられていない概念に対応するもので置き換えられることを防止し得る。
【0111】
例えば、属性{A、B、C}を有するアクティブ概念、および属性{D、B、G、F}を有する候補概念が与えられる場合、その3つの属性に対応するアクティブ概念の定義を通って走る、3つの軸が存在し得る。概念間に関係が存在するかを判定するために、最初に、明示的な関係、例えば、AからDの明示的な関係、およびCからGの別の明示的な関係を使用することができる。(これらは、両方とも、属性を子属性と置き換える、c動作である。)最後に、子孫属性(すなわちF)を追加する黙示的なa動作を使用することによって、候補子孫のものと一致する、アクティブ概念の属性集合がもたらされ得る。したがって、候補は、アクティブ概念の子孫と称され得る。
【0112】
例えば、アクティブ属性集合および候補属性集合を対にする際、属性の3つの考えられるグループが存在し得る。
● 候補集合のみと関連付けられるもの(「候補のみ」属性)
● 候補集合およびアクティブ集合の両方と関連付けられるもの(「両方」属性)
● アクティブ集合とのみ関連付けられるもの(「アクディブのみ」属性)
【0113】
アクティブ集合の候補集合への変換が、「アクティブのみ」属性を削除することを要求する場合、候補集合は、アクティブ集合祖先であり得る。アクティブ集合が候補集合と同一である場合、候補集合は、アクティブ集合の兄弟であり得る。アクティブ集合の候補集合への変換が、「候補のみ」属性を追加することを要求する場合、候補集合は、アクティブ集合の子孫であり得る。
【0114】
2つの元の集合が既に共通の属性を有するかどうかに関わらず、「アクティブのみ」属性を削除し、「候補のみ」属性を追加することによって、アクティブ集合を候補集合に変換することは、有効ではない場合がある。そのような対は、関係していないと見なされ得る。この例外は、「のみ」集合内の属性が、属性階層で関係している場合であり得る。そのような場合、以下の2つの動作のうちの1つを実行することができる:
● アクティブ集合属性を、その親属性と(アクティブ集合の祖先である候補集合と)置き換える、または
● アクティブ集合属性を、その子属性と(アクティブ集合の子孫である候補集合と)置き換える
【0115】
結果として生じる属性は、「両方」集合のメンバであり得る。
【0116】
ユーザにとって重要である可能性のより高い、これらの概念は、より高い優先度が与えられ得る。
【0117】
候補集合内のそれぞれの概念は、それをアクティブ概念に連結する、固有の一連の導出を有し得る。導出がソートされ、統合動作によって処理される順序は、結果階層内の概念の順序に影響を及ぼし得る。階層内の候補概念の優先度は、表2に従って判定され得る。
【0118】
表2−結果階層の判定における導出の優先度
【表2】
【0119】
このプロセスの出力417は、以下により完全に記載されるように、ユーザ対話を処理する(419)ように動作可能な思考ネットワークであり得る。
【0120】
ユーザへのインターフェース出力
再び
図5を参照すると、ユーザの要求内で指定される要件に応じて、アプリケーションは、ドメイン内のオブジェクトと関連付けられる場合も関連付けられない場合もある概念から構築された、ユーザによって提供されるラベルのアクティブ概念に関連し、かつ軸に沿う、概念階層507を返してもよい。また、概念階層は、他の種類の構造、および表現、例えば、概念間の双方向(関連)関係を導出するために使用され得る。ユーザは、ユーザが指定するアクティブ概念に関連する概念を見つけるために、この概念階層を参照してもよい。ユーザの概念階層とのやりとりに従って、ユーザに有意義なコンテンツを提供することができる(513)。
【0121】
導出は、階層的結果集合に構築されてもよい。その階層内のそれぞれのノードは、その概念定義として、属性集合でもって概念を表現し得る。階層内のそれぞれのエッジは、単一の導出動作を表現し得る。
【0122】
統合動作は、アクティブドメイン内から、アクティブ概念に関連する概念の階層を分離し、返してもよい。関連する概念は、指定された軸に沿って、かつ指図される範囲で、アクティブ概念から、祖先(より広い)および子孫(より特定)方向の両方に分岐してもよい。
【0123】
次元的構造
一般に、概念およびそれらの潜在的関係のすべては、多次元格子509の観点から視覚化され得、頂点は、概念に対応し、辺は、概念間の意味関係に対応する。
【0124】
ドメイン内の概念のそれぞれは、関係が、上述のとおり、統合規則を満足するという前提で、そのドメイン内のいくつかの数の他の概念と関係し得る。これらの概念およびそれらの潜在的関係の集約、ならびにこれらの概念を組織化するすべての多次元方法は、次元的構造と称され得る。
【0125】
軸(観点)
統合動作の実施において、方向および範囲が軸定義によって定義される、概念の特定の一階層は、次元的構造内から分離されてもよい。これは、元の格子の次元を関心資料に制限し、したがってより理解しやすいものにし得る。
【0126】
次元軸は、概念関係の個別の階層を表現してもよい。この階層は、ドメイン空間内の2つの点を通る部分を表現し得る。概念と同様に、軸は、属性の観点から定義されてもよい。したがって、軸は、1つがアクティブ概念であり得る、2つの概念を使用して指定されてもよい。これは、アクティブ概念に結び付けられ得る、一式の祖先を制約することができる。
【0127】
例えば、ドメインが「自動車(Motor Vehicles)」であり、アクティブ概念が、属性{灰色(grey)、Jetta(登録商標)、私の物(mine)}を有する、「私の車(my car)」である場合、軸定義は、{灰色(grey)}であり得、灰色であるすべての車両の階層に導き得る。または、軸定義は、{Jetta(登録商標)}であり得、Jettaであるすべての車両の階層がもたらされ得る。または、軸定義は、{私の物(mine)}であり得、階層は、私によって所有されるすべての車両のものであり得る。
【0128】
概念階層
複雑な概念は、ドメイン内の多くの他の概念と関連し得る。厳密にどのようにそれらが関連しているかの判定が必要とされる場合がある。本発明のシステムの下で、ユーザは、ドメイン、アクティブ概念定義、およびアクティブ軸定義を選択し、次いで、アプリケーションに一式の関連する概念を探すように指図してもよい。
【0129】
結果は、アクティブ概念に関係付けられる概念階層であり得る。また、見つけられる関係の最大数は、ユーザ指定パラメータによって制限され得る。例えば、ユーザは、概念階層を、特定の数の概念、または概念によってカテゴリ分けされた特定の数のコンテンツノードに制約してもよい。概念関係は、階層的であり、より広い概念(親または祖先)からより特定の概念(子または子孫)に下がるように方向付けられ得る。
【0130】
例えば、一階層的分岐は、{産業(Industries)→製造(Manufacturing)→自動車(Automobiles)}であり得る。本実施例では、「産業(Industries)」概念は、アクティブ概念「製造(Manufacturing)」の祖先と称され得る。または、アクティブ概念が「製造(Manufacturing)」である場合、子孫は、「自動車(Automobiles)」であり得る。概念は、ゼロ、1つ、もしくはそれ以上の祖先または子孫、あるいは両方を有することができる。厳密な階層では、より高く、より広い概念の属性のすべてが、概念によってさらに下の階層に継承され得ることに留意する。例えば、「製造(Manufacturing)」概念は、「産業(Industries)」概念のすべての属性を継承し得る。
【0131】
木構造
上述される概念階層は、すべての概念の属性の検査に基づく。木構造は、アクティブ概念の属性の部分集合のみが、統合動作のすぐに使用可能な部分として使用される、概念階層であり得る。部分集合の外側の属性は、無視され得る。例えば、会社の組織図の推論において、木構造内の職名というフラグが立てられた属性のみが使用されてもよい。
【0132】
次元的概念タクソノミー
所与のドメインの次元的構造内の考えられる関係のうちのいくつかが、ユーザにとって関心のあるものではない可能性がある。ユーザは、ユーザが指定する動的統合動作からもたらされる特定の概念階層にのみ関心がある場合がある。
【0133】
時間とともに、特定のドメインに対して構築される概念階層は、共に連結され、ドメインの次元的構造の部分集合を形成し得る。この部分集合は、関心のある次元的構造の一部を備える、次元的概念タクソノミーに成長し得る。概念階層のこれらの群は、より拡張された思考(セマンティック)ネットワークを備え得る。
【0134】
さらに、ユーザが情報のこれらの動的階層を作成する際、結果は、保存され、1つ以上の大きくかつ包括的な次元的概念タクソノミーに組み合わせられてもよい。したがって、それぞれの次元的概念タクソノミーは、1人以上のユーザがサブジェクトに加えることを望む、観点のうちのいくつか、またはすべての全体的な概観を提供し得る。このタクソノミーは、ユーザの個々の、かつ個人的使用のための、または他のユーザと共有される、ユーザの活動の知識ベースとして、ユーザにとって長期的な価値を有し得る。
【0135】
仮想概念
場合によっては、概念階層ノードの属性集合は、一致する概念を有さない場合がある。これを示すために、プレースホルダとして、仮想概念が使用されてもよい。
【0136】
例えば、属性集合{A、B、C}が与えられ、
● 明示的な関係A→Dが存在し、
● 明示的な関係D→Fが存在し、
● {D、B、C}属性集合を有する概念が存在しないならば、
{F、B、C}は、{A、B、C}からの一分離度を有する候補集合内にあり得る。{D、B、C}属性集合が対応する概念を有さないならば、階層内のこのノードに仮想概念が存在してもよい。
【0137】
仮想概念は、PCT出願第PCT/CA2007/001546号により完全に記載される。
【0138】
認識エージェント
本発明は、手段であって、それによって、人、機械ベースのエキスパートシステム等であってもよい、認識エージェントが、経時的に思考ネットワークを洗練し、最適化し得る、パターン認識および選択の入力を提供し得る、手段を提供し得る。
【0139】
認識エージェントの他の代替としては、機械学習、フィードバックデータ、およびウェブサイト分析が挙げられる(しかし、これらに限定されない)。例えば、RSSフィードは、新しい「思考」のソース資料として提供され得る。当業者に既知であるRSSフィールドは、文字列を概念、例えば、以下に記載されるものに翻訳するプロセスにマップされ得る、テキスト文字列を含む。これらは、次いで、新しい思考をシステムにシードするために使用することができる。
【0140】
ラベルから概念への翻訳
プロセスであって、それによって、システムが、アクティブドメインに対して適用するための一式の対応する概念定義を生成する、プロセスは、ラベルから概念への翻訳(LCT)と称され得る。
【0141】
ラベルから概念への翻訳(LCT)の基本的な動作は、人ベースのシステムおよび機械ベースのシステムの両方を可能にするように適用され得る。動作は、文字列を受け取り、それを概念定義に変換するタスクに一般化され得る。文字列は、人によって提出される問い合わせ(人の思考の明確な表現として)として生じてもよく、または、機械生成ソースもしくは知識の以前にコード化された表現(例えば、文書、データフィード等)から得られてもよい。
【0142】
ユーザは、ユーザインターフェースによって、思考503を提供するように要求され得る。思考は、人が認識可能な1つの、あるいは複数の語として入力されてもよい。したがって、ユーザは、ラベルを思考プロセッサに提供していることになり得る。
【0143】
ユーザによって提供されるラベルは、思考プロセッサが使用するために、1つ以上の概念に翻訳され得る。考えられる文書一致結果のランク付けされたリストを返す、従来の動作の検索および情報取り出しモードとは異なり、LCTは、概念定義をユーザの思考の表現として動的に作成し得る。次いで、このLCTによって生成された概念定義は、問い合わせの結果として、セマンティックネットワーク(概念階層としてコード化された)を作成するために、統合動作で使用され得る。ユーザの思考は、その思考ネットワーク内にあり、ネットワーク内でのユーザの行為に対する文脈をユーザに提供し得る。
【0144】
2つ以上の概念がラベルに対応する場合、本発明の思考プロセッサは、プロセスであって、それによって、ユーザが、意味を明確化するために、適切な、または望ましい概念を選択し得る、プロセスを提示するように要求され得る。所望により、思考プロセッサは、最も適切であると思われるものから最も適切でないと思われるものの順序で、対応する概念定義を返してもよい。ユーザ提出の問い合わせに対するそれらの適切性に基づき、ドメインから候補属性を識別し、取り出すために使用され得る、情報取り出し方法は、当業者に既知である。
【0145】
LCTは、概念定義をラベルから得ることができるようにする。これは、本発明の動作によって、思考を、それによって包み込まれるセマンティックネットワークと統合することによって、思考がデータエンティティと統合されるようにする。
【0146】
ここで、情報取り出し方法の一実施例が提供される。
【0147】
ユーザの問い合わせラベルを、概念定義のリストに翻訳するために、以下のステップが行われてもよい。
【0148】
1.ユーザの問い合わせが、トークン化され得る、または個々の語に分離され得る。例えば、ユーザの問い合わせ「愛と戦争(Love and war)」は、「愛(Love)」、「と(and)」、および「戦争(war)」にトークン化されるであろう。
【0149】
2.ストップワード(例えば、「および(and)」、「該(the)」等)ではない、それぞれのトークン化された語に対して、ラベル内にその語を有する、ドメイン内のすべてのキーワードを見つけるために、インデックスが使用され得る。
【0150】
3.それぞれの語に対して、そのキーワードがランク付けされ、最良のものが選定され得る。例えば、ドメインは、「愛(Love)」という語を使用する、9,000のキーワードを有し得る。システムは、ユーザに提示する数、および概念定義を作成する数に、妥当な数(例えば10)を使用してもよい。
【0151】
語のキーワードをランク付けするために、一式の基準が利用されてもよい。一式の基準の一実施例には、以下のものが挙げら得る。
【0152】
(a)複数のトークン化された語と厳密に一致するキーワード。例えば、トークン化された語が「アメリカの(American)」および「アルバム(Albums)である場合、キーワード「アメリカのアルバム(American Albums)」は、キーワード「アメリカの(American)」またはキーワード「アルバム(Albums)」より高くランク付けされ得る。
【0153】
(b)トークン化された語と厳密に一致するキーワード。例えば、「愛(Love)」という語は、キーワード「政治における愛(Love in politics)」によってより、キーワード「愛(Love)」によって、より良く一致されてもよい。
【0154】
(c)2つ以上のトークン化された語を使用するキーワード。
【0155】
(d)キーワード蔓延度。ドメイン内の多くの概念によって使用されるキーワードは、より少ない概念によって使用されるキーワードより高くランク付けされてもよい。
【0156】
4.選択されるキーワードに対応して、概念定義が作成され得る。任意の概念定義内に、それぞれの語からのキーワードが1つのみ使用され得る(ノイズワード、およびキーワードのない語を除く)。任意の概念定義に、それぞれのキーワードは、1回のみ使用され得る(2つ以上のトークン化された語にマップされる場合にでさえ)。
【0157】
ユーザのテキスト問い合わせが、未知の語(つまり、キーワードが存在しない、いずれかの語)を含む場合、ユーザの全テキスト問い合わせをラベルとして有する、単一の仮想概念が作成されてもよい。これは、祖先または子孫を有さなくてもよい。この仮想概念は、キーワードラベルもまた問い合わせ文字列と一致する、1つのキーワードを有し得る。この仮想概念は、翻訳プロセスの終了時に破棄されてもよい。
【0158】
例えば、ユーザの問い合わせが「愛と戦争(Love and war)」であり、「戦争(war)」という用語が、いずれのドメインのキーワードによっても使用されない場合、システムは、「愛と戦争(Love and war)というラベルを用いて、仮想概念を作成してもよい。この概念は、これもまた「愛と戦争(Love and war)」というラベルを有する、1つのキーワードを有するであろう。あるいは、未知の語の仮想概念を作成する代わりに、システムは、代わりにそれらを無視するように構成されてもよい。
【0159】
5.作成された概念定義が、ランク付けされ得る。概念定義をランク付けするために、一式の基準が利用されてもよい。一式の基準の一実施例には、以下のものが挙げられ得る。
【0160】
(a)最も少ない数の、ラベルがトークン化された語と厳密に一致しないキーワードを有するもの。例えば、ユーザの問い合わせが、「チェス戦略(Chess Strategy)」である場合、トークン化される語は、「チェス(Chess)」および「戦略(Strategy)」であり得る。概念定義、例えば、{キーワード1:「チェス(Chess)」、キーワード2:「戦略(Strategy)}は、ラベルが語と厳密に一致しないキーワードを有し得ない。別の概念定義、例えば、{キーワード3:「チェス(Chess)」、キーワード4:「戦略ゲーム(Strategy games)}は、トークン化された語と厳密に一致しない、1つのキーワードを有し得る。したがって、この第2の概念定義は、第1のものより低くランク付けされ得る。
【0161】
(b)最も少ない数の、現実の既存の概念定義内で共に発生しないキーワードを有するもの。
【0162】
(c)より大きな数の、現実概念定義内での同時発生率を有するもの。
【0163】
(d)キーワードがドメイン内により蔓延するもの。蔓延度を判定するために、それぞれの概念定義に対して、そのキーワードのそれぞれのドメイン内での発生率の合計が計算され得る。次いで、それぞれの概念定義の合計を比較することができる。
【0164】
比較されている一対の概念定義において、一方の概念定義が他方より多くのキーワードを有する場合、両方の概念定義から同一の数が比較されるように、その概念定義の最も蔓延していないキーワードは、無視され得る。
【0165】
(e)現実概念定義と厳密に一致するもの。
【0166】
(f)より単純であり得るもの。つまり、より少ないキーワードを有する概念定義は、より高い優先度を有し得る。
【0167】
次いで、概念は、アクティブ概念として思考プロセッサに提供されてもよく、それにより、思考プロセッサが、ユーザによって問い合わせとして提出されたラベルから得られる概念定義に基づいて関係付けられる概念の階層を、ユーザに提供できるようにする。
【0168】
思考記憶
記憶スキーム
知識表現の分野におけるセマンティックネットワークは、典型的に、静的な永久構造として取り扱われる。思考ネットワーキングシステムの文脈では、必要に応じて、特定かつ適時のセマンティックネットワークが生成されるように、セマンティックネットワークの基本的なビルディングブロックのみ、記憶される必要があり得る。思考は、高度に圧縮されたデータ集合(ドメインを含むソースデータまたはファセットデータ集合)内に記憶され得る。データは、それが、セマンティックネットワーク(特に、セマンティックグラフを構成するエッジまたは関係)を含まない場合があり、しかし、セマンティックネットワークを構築するためのソース資料として使用することができるノード(概念)のみを含む場合があるため、部分的に圧縮されてもよい。
【0169】
さらに、統合プロセスは、任意の数のドメインからソース資料を取得するように構成されてもよい。
【0170】
本発明の思考記憶装置態様は、ファセットデータを記憶し、それを思考プロセッサにロードする手段を提供することができる。データの記憶は、当業者に既知である。ここで、PCT出願第PCT/CA2007/001546号に記載される知識表現モデルを反映する、一実現形態が記載される。データは、3つの広い領域にまとめられ得る。
【0171】
1.エンティティ:システム内の知識表現の主ビルディングブロック。エンティティには、属性、概念、コンテンツノード、およびコンテンツコンテナが挙げられ得る。
【0172】
2.エンティティ関係:システム内で使用される様々なエンティティ間の関係を表現する。エンティティ関係には、属性関係、概念関係、概念−属性関係、ノード−概念関係、およびノード−コンテンツコンテナ関係が挙げられ得る。
【0173】
3.ラベル:エンティティ自体の構造定義から分離される、エンティティを説明するために使用される語。ラベルには、属性ラベル、概念ラベル、およびノードラベルが挙げられ得る。ラベルは、様々なエンティティにわたって共有されてもよい。あるいは、ラベルは、エンティティの種類によってセグメント化されてもよい。
【0174】
この簡易化されたスキーマは、任意の実現において使用されるデータベーススキーマを決して制限しないことに留意する。
【0175】
データコード化
抽象的(思考)なものを、コンピュータ(思考プロセッサ)および認識エージェント(人)がそれらを操作し得るように、具体的なものに変換する要求が存在し得る。ここで、これを達成するための一実施例が記載される。当業者は、これを達成するための多くの代替方法が存在することを認識するであろう。
【0176】
ファセット出力データは、XMLとしてコード化され、XSLTによって表示されてもよい。ファセット出力は、多くの異なる方法で再編成され、表現されてもよい。階層を表現するための代替出力が利用可能である。
【0177】
プレゼンテーション層を提示するために、XSL変換コード(XSLT)が使用されてもよい。システムによって管理される、すべての情報要素(システムを通して供給される場合、分散コンテンツを含む)は、XSLTによって表示されてもよい。
【0178】
クライアント側の処理は、データフィードをシステムのプレゼンテーション層に連結し得る。これらの種類のコネクタは、アプリケーションサーバからの情報を、構造情報を使用する様々なメディアに出力するために使用され得る。アプリケーションサーバからのXMLデータは、ウェブページ上に提示するために、XSLTによって処理されてもよい。
【0179】
基本的な公開およびデータ提示に加えて、XSLTおよび類似する技術は、一連のプログラムの機会を提供し得る。複雑な情報構造、例えば、システムによって作成されるものは、データモデルに酷似する、すぐに使用可能な情報を提供し得る。ソフトウェアプログラムおよびエージェントは、高度な対話性および自動化を提供するように、プレゼンテーション層上の情報に作用することができる。したがって、システムのコア構造上の利点によって提供される本発明の範囲は、単純な公開をはるかに越えて拡大し得る。
【0180】
また、当業者は、これらのXMLおよびXSLT位置の設計の可能な多様性を理解するであろう。例えば、ファイルは、エンドユーザのコンピュータ上にローカルに記憶されてもよく、またはウェブサービスを使用して生成されてもよい。本システムによって管理される情報を、分散されたプレゼンテーション層(例えば、第3公開者またはソフトウェアクライアントのウェブページ)上に挿入するために、クライアント側のスクリプト言語(または類似する技術)が使用されてもよい。
【0181】
別の実施例として、システムからのコア構造情報を含むXMLデータフィードは、システムが組織化する、分散コンテンツと組み合わせられてもよい。当業者は、これらの2つの種類のデータを別個のデータフィードに切り離す機会を理解するであろう。
【0182】
これらの提示ファイルおよびデータフィードを記憶し、分散するための、これらおよび他の構造的機会は、当該技術分野において周知であり、したがって、本明細書にはさらに記載されない。
【0183】
分類スキームジェネレータ
分類スキームジェネレータは、分類スキームを導出し、維持し、集約するために使用される、技術の分類である。思考ネットワーキング内で、分類スキームは、知識表現のための手段を提供し得る。
【0184】
様々な分類スキームジェネレータが当業者に既知である。例えば、オープンデータプロジェクトは、1つのプロセスがインターネットエコシステム自体であるように、この種類のデータの急増をもたらしている。分類データ(例えば、ファセット分析、情報抽出等)を提供するための、多くの他の特定の技術が存在する。
【0185】
分類スキームジェネレータは、生入力を思考ネットワーキングプロセスに提供し、それによって、新しい思考を作り出す中で、提案、ガイダンス、およびインスピレーションをユーザに提供し得る。
【0186】
セマンティックネットワークは、いったん構築されると、思考ネットワーキングのさらなる繰り返しのためのソース資料として使用することができる。換言すれば、1つのサイクルの思考ネットワーキングの出力は、別のサイクルへの入力を提供し得る。これは、セマンティックネットワークが経時的に進化する際、これの維持において現れ得る。
【0187】
ユーザインターフェース
図5を参照すると、思考ネットワークの動的統合のために、ユーザまたは他の認識エージェントに、思考プロセッサのインターフェースが提供され得る。インターフェースは、ツールであって、それを用いて、上述のとおり、アクティブ概念定義、軸定義、アクティブドメイン、および統合動作の範囲を指図するための様々なパラメータを選択する、ツールを含んでもよい。
【0188】
ユーザインターフェースは、認識エージェントがアクティブ概念を入力できるようにするように動作可能であり得る。認識エージェントは、最初に、テキストラベルをユーザインターフェースに入力してもよい(503)。テキストラベルは、上述のLCTのプロセスを使用して、アクティブ概念に翻訳され得る。2つ以上の概念がラベルに対応する場合、ユーザインターフェースは、アクティブ概念を選択するための手段を認識エージェントに提供してもよい。そうでなければ、LCTプロセスの結果は、アクティブ概念を自動的に返してもよい。
【0189】
いったんアクティブ概念が提供されると、アクティブ概念に対応する中心ノード509を有する木として、結果として生じる概念階層507がユーザに表示され得る。結果として生じる階層507の範囲は、制約されてもよい。例えば、1つの祖先レベルおよび1つの子孫レベルが示され得る。他の統合パラメータ(例えば、解像度)および選択肢(例えば、より多い、またはより少ない概念を結果階層内に表示する、仮想概念を示す、もしくは隠す、図を保存する、または新しいドメインを開始する)もまた、認識エージェントに提示されてもよい。また、手段であって、それによって、アクティブ概念503およびアクティブ軸定義505を構成し、編集する、手段が認識エージェントに提示されてもよい。
【0190】
ユーザインターフェースは、以前に入力されたアクティブ概念のように、アクティブ概念を処理し得る。
【0191】
アクティブ概念または関係付けられる概念が選択されると、ユーザインターフェースは、代表的なコンテンツ(すなわち、選択された概念に関係付けられる情報)を表示するように動作可能であってもよい。代表的なコンテンツとは、例えば、選択される概念に関連する、使用可能かつ有用なコンテンツであり得る。また、ユーザインターフェースは、上述される分類スキームジェネレータを実現するために必要とされる機能を含み得る。これには、手段であって、それによって、認識エージェントが、概念およびコンテンツを再分類できるようにし得る、手段が挙げられ得る。
【0192】
認識エージェントがユーザである、本発明のシステムの考えられる用途では、ユーザは、以下のステップを使用して、情報ドメインをナビゲートし得る。例えば、上述のとおり、LCTコンポーネントによって、アクティブ概念503を入力する手段がユーザに提示され得る。ユーザは、アクティブ概念を入力または選択してもよい。次いで、アクティブ概念から分岐する子孫階層が示されてもよく、一式の考えられる軸定義(タグクラウド)が表示されてもよい(505)。軸ラベルは、それぞれの下の概念の密度を表現するため、および代替軸が現在の概念からどれだけ離れているかを説明するために、様々な寸法および陰影で示されてもよい。
【0193】
ユーザは、軸定義のうちの1つを入力または選択し得る(505)。アプリケーションは、タグクラウド内のタグのうちの1つに対応するアクティブ軸を使用して、祖先階層を表示し得る(507)。そのタグは、階層のルート509として表示されてもよい。
【0194】
ユーザは、別の軸定義(タグクラウド内をクリックする、または新しいラベルを入力することによって)、アクティブ概念(木内をクリックする、または新しいラベルを入力することによって)、解像度、または制限を選択し、プロセスを繰り返すことによって、続けてもよい。
【0195】
構築される階層は、典型的な出力デバイス、例えば、コンピュータモニタの空間的に制約された表示領域内に適切に表示できるものより大きい場合がある。ユーザに、結果階層を通ってナビゲートする手段を提供するための多くの可能性が存在し得る。また、ユーザは、解像度パラメータ(分離度および制限)を使用し、結果として生じる階層にさらなる詳細を連続して追加することによって、ユーザが求める詳細のレベルに対する統合動作の範囲のバランスを取ることができる。
【0196】
実現形態
本発明は、その一態様では、コンピュータプログラムとして実現され得る。サーバアプリケーションソフトウェアおよびデータベースは、集中型コンピュータ上および分散された非集中型システム上の両方で実行され得る。集中型サーバと、様々なコンピューティングデバイスと、それと対話する分散システムと、の間で通信するためのネットワークとして、インターネットまたは任意の他の私的もしくは公的ネットワーク(例えば、企業のイントラネット)が使用されてもよい。
【0197】
コンピュータプログラムの一態様では、ユーザインターフェースは、ウェブページを供給するように動作可能なウェブサーバを介して、ユーザに提供されてもよい。ユーザインターフェースは、手段であって、それによって思考を提供する、手段をユーザに提供してもよく、思考に関係するデータエンティティに対応する様々なラベルおよび軸と共に提示されてもよい。次いで、ユーザは、上述される選択および洗練のプロセスを、それを行うための手段としてユーザインターフェースを使用して完了することができる。コンピュータプログラムの別の態様では、ユーザインターフェースは、クライアント側のソフトウェアによって提供されてもよい。
【0198】
本発明のユーザインターフェースまたはフロントエンドは、思考およびデータ集合を処理し、ネットワークを統合し、選択および洗練のプロセスを取り扱うために、サーバ(それがフロントエンドをホストする際、同一のコンピュータであってもなくてもよい)と関連付けられてもよい。
【0199】
ウェブサーバ、またはクライアント側のソフトウェアプログラム、および処理サーバの使用は、分散コンピューティングの利益、例えば、ホストされるアプリケーションサービスプロバイダ(ASP)処理モデル、またはサービス型ソフトウェア(software−as−a−service:SaaS)アプリケーション配布モデルのための手段を提供し得る。これらのモデルの下、第3者は、ドメイン所有者に思考ネットワークエンジンサービスを提供してもよい。したがって、ドメイン所有者は、これらの種類のモデルが提供する規模の経済性を十分に利用することができる。
【0200】
また、本発明は、ワイヤレスインフラストラクチャ上でも動作可能であり得る。現在のワイヤレスデバイスには、多くの場合、WAPまたは従来の手段によるウェブブラウジング機能が備わっている。本発明のユーザインターフェースは、通信チャネルのサーバ側またはそのようなネットワークに関連付けられる任意のサーバ上で処理が起こる、ワイヤレスデバイスに提供されてもよい。
【0201】
さらなる実現形態
思考ネットワークのいくつかの有用な実現形態が存在する。
【0202】
図5を参照すると、本発明の一態様では、思考ネットワークを実現するウェブサイトが開示される。ウェブサイトは、手段であって、それによって、広告主および広告ネットワークへの広告スペース511を収益化する、手段を提供してもよい。
【0203】
思考ネットワークウェブサイトは、3つの基本的な事柄:(1)コンテンツ生成、(2)文脈広告、および(3)価値のある大衆市場視聴者によって、広告主に価値をもたらし得る。
【0204】
また、思考ネットワークの追加の実現も可能である。
【0205】
コンテンツ生成
コンテンツ生成は、従来的に商用分野から抜けていた活動を容易にし、収益化し得る。本発明は、商用アプリケーションによってほぼ支援されていなかった、または支援されていなかった一連の活動を、加速して完了することを容易にし得る。特に、本発明は、異なるソースからの情報を、即座に役立つ方法で集約および組織化することを簡単にし得る。
【0206】
本発明は、人が情報と対話し、人の思考を触媒し、知識を作成するためにそれを使用する方法で、完全なパラダイムシフトを作成し得る。例えば、大量の新しく、かつ非常に個人化されたメディアの生成が、本発明によって可能となり得る。
【0207】
現在、オンライン広告を支援する、「コンテンツインベントリ」オンラインが欠如している。オンライン広告市場における2つの主要な問題は、高品質の待ち受けページの欠如、およびトップウェブサイトに広告を定置する結果として広告主が支払う高価格である。この問題は、インターネットが、広告主間の関心の拡大するシェアを獲得し続けるのと共に、急速に悪化している。結果として、広告主は、「ロングテール」(すなわち、より長く、かつより特定の検索問い合わせ)を満たす、ニッチトピックスおよびウェブサイト上の高品質な新しいコンテンツを求め得る。
【0208】
価値のある大衆市場視聴者
本発明は、様々な作成済みのソースからの情報を、ユーザの個人的ニーズを反映するものに組み立て、組織化することを試みる、膨大かつ不満を抱くユーザ視聴者のニーズを満たし得る。その実の視聴者には、知識労働者、学問および科学研究者、学生、情報設計者、ならびにライブラリ化学者の大部分が挙げられ得る。さらに、主流なウェブユーザの大部分は、旅行計画、店を組織化するため、または任意の特定の関心トピックを丹念に調べるために、多数のウェブサイトをブラウジングし、情報を組み合わせることを伴うタスクを実施する。本発明によって提供されるサービスは、これらの視聴者が強く感じてきた問題を解決し得る。
【0209】
追加の実現
思考ネットワークは、サービス型ソフトウェア(SaaS)、ライセンス供与手法、データ計測、および購読ベースのサービスを含むが、これらに限定されない、多数の方法で商用化されてもよい。
【0210】
SaaSを使用して、アプリケーションが提供され、ユーザ別に値段が設定されてもよい。ソフトウェアが中央制御位置にあることから、常に最新のバージョンが提供され得る。
【0211】
ライセンス供与手法には、ユーザ別に、アプリケーションの特定のバージョンへのアクセスを提供することが挙げられ得る。また、ソフトウェアの更新も提供されてもよいが、アップグレード料金または新しいライセンスの購入が要求されてもよい。
【0212】
データが処理され、ユーティリティサービスとして販売される、データ計測手法が提供され得る。
【0213】
さらに、期限付きで、思考ネットワークアプリケーションへのアクセスが提供される、購読ベース手法が提供され得る。この期間の間、制限付きまたは制限無しでの使用が提供され得る。
【0214】
消費者駆動によるメディア統合の概要
本発明は、その別の態様では、上述のとおり、分類システムまたはセマンティックネットワークに基づく合成動作による、合成されたメディアの動的生成を容易にする、システム、方法、およびコンピュータプログラムを提供する。本発明は、ユーザが、ユーザがメディアを摂取する方法を反映するように、容易かつ多量にコンテンツを作成できるようにする。本発明はさらに、ユーザ入力に完全に基づく、有意義なコンテンツの瞬時生成のために、静的データをビルディングブロックとして再利用することを容易にする。
【0215】
本発明は、消費者向けのセマンティックネットワーク、または思考ネットワークの作成を容易にするように機能し得る。
図6に示されるように、例えば、上記のプロセス605に従って生成される、消費者向けのセマンティックネットワークまたは思考ネットワーク601は、ネットワークのメディアの構造格子として利用されてもよい。消費者向けのセマンティックネットワークまたは思考ネットワーク601は、メディアを合成する(603)ために利用されてもよい。セマンティックネットワークまたは思考ネットワーク601を様々な文書形式に変換するために、スキーママッピングが利用されてもよい。さらに、セマンティックネットワークまたは思考ネットワーク601のセマンティック的に注釈の付けられたコンテンツ要素は、消費者によって生成されるセマンティックネットワークによって提供される構造格子内で照合されてもよい。
【0216】
本発明は、従来技術に固有の制限を克服する。文書の形態であってもよいメディアが前もって作成されることを要求する消費者は、従来技術に照らして、限られた選択肢しか有さなかった。第1に、消費者は、ゼロからメディアを作成することができた。このプロセスは、時間の掛かるものとなり得る。第2に、消費者は、主に、オントロジー、文書、または他のソース等の既存の知識表現に基づく、従来技術のメディア統合手法を利用することができた。合成機会の範囲は、これらの既存のソースによって境界され、また、これは、消費者自身の知識の独自かつ個人的な表現を考慮に入れる消費者の能力も制限する。本発明は、個々の消費者が、メディアおよびそのコンテンツの作成を指図し、この作成プロセスを触媒し、加速するために、機械メディア統合システムを利用できるようにすることによって、これらの制約を克服する。
【0217】
本発明の出力は、例えば、文書、ウェブページ等の多くの形態または形式のものであり得る、合成されたメディアであってもよい。合成されたメディアは、個々の消費者特有であり得る。また、メディアは、様々なソースから取り出してもよく、特定のメディアまたはメディアソース、例えば、特定の種類の文書もしくは文書ソースの境界によって必ずしも制約されない。
【0218】
詳細が上記に提供される、セマンティックネットワークおよび/または思考ネットワークは、合成されたメディアの生成を助長するためのツールとして適用され得る。そのようなネットワークは、多くの使途に使用され得る。例えば、思考ネットワーキングは、(1)思考を取得し、記憶し、呼び出す手段の提供、(2)高度に個人化され、文脈化され、かつ実用的な思考ネットワークを、それらが作業するのに必要とされる際に生成する手段の提供、および(3)ソフトウェアエージェントであって、それらが作成された思考ネットワークを摂取する際、これらのジョブを行う、ソフトウェアエージェントの提供を含む、活動の少なくとも3つの広い分類に対処し得る。本明細書に開示されるように、思考ネットワークは、ウェブサイトをナビゲートするため、および情報を検索し、取り出すために利用され得る。そのような情報は、合成されたメディアの作成に利用され得る。
【0219】
前述されるように、コンテンツ生成を容易にするために、セマンティックネットワークおよび/または思考ネットワークが適用され得る。それに応じて、これらのネットワークは、合成されたメディアを生成するために利用されてもよい。本発明は、ソフトウェアエージェントを、セマンティックおよび/または思考ネットワーキングサービスのコンポーネントとして組み込んでもよい。ソフトウェアエージェントは、消費者によって作成されたセマンティックネットワーク(思考ネットワーク)上で動作し得る。ソフトウェアエージェントは、セマンティックネットワークを、例えば、ウェブサイト、文書、RSSフィード等の様々な種類のメディアに変換するように作成されてもよい。
図7に示されるように、ユーザインターフェース701(以前に
図5に図示された入力および出力を含んでもよい)は、特定の合成されたメディア出力形式を選定する手段を消費者に提供し得る。例えば、消費者は、文書703、RSSフィード705、ウェブサイト707、または異なるメディア種類およびメディアチャネルの混合物となる、合成されたメディア出力を選択してもよい。熟達した読者は、他の合成されたメディア出力が、出力選択肢として消費者に提供され得ることを認識するであろう
【0220】
システムは、いくつかの要素およびステップを組み込んでもよい。手段であって、それによって、消費者向けのネットワーキングが、消費者向けのセマンティックネットワークを作成し得る、手段が提供され得る。文書、または他のメディアは、消費者向けのセマンティックネットワークに従って合成されてもよい。セマンティックネットワークが、形式的な機械可読データ構造である際、そのようなネットワークを、スキーママップおよび変換技術、例えば、XSLTを使用して、様々なメディアおよび文書形式に変換することができる。この種類のデータ変換は、当該技術分野において周知である。
【0221】
さらに、セマンティックネットワークのコンテンツ要素は、セマンティックネットワークの構造内で照合されてもよく、合成されたメディアのコンテンツを書き込むために利用されてもよい。この文脈において、構造化された、セマンティック的に注釈の付けられたコンテンツは、セマンティックネットワークで直接関連付けられる、および/またはカテゴリ分けされてもよい。構造化されていない、または第3者のコンテンツの関連を構築するために、情報取り出しおよび/または抽出技術が利用されてもよい。いったん、スキーマ変換によって提供されるメディアに必要とされるように、コンテンツ要素が構造内で照合されると、生成されたメディアは、消費者が閲覧する、表示する、エクスポートする、編集する、または任意の他の方法で利用するのに利用可能であってもよい。
【0222】
本発明の一態様では、メディア、例えば、文書は、消費者によるいかなる対話もなく、自動的に生成され得る。自動生成は、本発明の他の態様に従って、消費者によって提供され得る指図の代替的手段を利用することによって、容易になり得る。代替的手段には、既存のメディアソース、例えば、文書の既存のコーパスの利用が挙げられ得る。メディアソースの分析によって、メディアの構造内のいかなる空所も特定され得る。例えば、利用されるメディアが文書のコーパスである場合、多数の国に関する情報を含むコーパス内に、文書が存在し得、表現されていない国に対して、構造内の空所が存在し得る。空所は、消費者向けのセマンティックネットワーキングの代替として利用されてもよい。本明細書に開示されるように、また、コンテンツをセマンティックネットワークと自動的に照合することもできることから、文書合成は、エンドツーエンドで進行し得、それによって、これは、いかなる消費者対話または入力も伴わない。
【0223】
本発明の別の態様では、合成されたメディアは、代替的手段を再帰的に適用することによって、バッチで生成されてもよい。バッチでの合成されたメディアの生成を容易にする、本発明の一態様は、大量のメディア、例えば、大きな数の文書を生成し得る。生成されたメディアのそれぞれは、消費者が選択するメディアの可能性または変形として提示されてもよい。消費者は、様々な方法でメディアを選択してもよい。例えば、メディアは、ワールドワイドウェブ(World Wide Web:WWW)上で公開されてもよく、例えば、Google(登録商標)等の検索エンジンによって、インデックスが付けられてもよい。検索問い合わせを利用することによって、消費者は、特定の種類のメディア、例えば、消費者の個々のニーズまたは要件を満たす特定の文書のバッチから選択してもよい。消費者によるメディアの選択は、消費者が、本発明の消費者向けのメディア統合態様によって生成されたようなメディアに確実にアクセスできるようにする。
【0224】
本発明の目的のための消費者対話は、合成されたメディアの生成の前の消費者による直接入力、または合成されたメディアのバッチからの消費者によるメディアの選択もしくは選定のいずれかを伴い得る。ユーザインターフェース(UI)は、手段であって、それによって、消費者が入力し得る、または合成されたメディアのコンテンツ要素を選択し得る、手段として適用されてもよい。また、UIは、セマンティックネットワーク内のコンテンツ要素を関連付ける手段も消費者に提供し得る。例えば、関連付けは、カテゴリ分けされたリストからコンテンツ要素を明示的に選定することによって、手動で達成されてもよい。また、関連付けは、セマンティック的に注釈の付けられたコンテンツ要素を、消費者向けのセマンティックネットワーク内のノードに連結することによって、自動的に達成されてもよい。UIは、消費者に、様々なオンラインまたはウェブに統合可能なメディアおよび文書形式から選択する手段をさらに提供し得る。メディア形式は、様々な種類のものであってもよい。
図8に示されるように、合成されたメディア出力は、ウェブページの形態であってもよい。また、例えば、HTML、RSS、Microsoft(登録商標)Word(登録商標)、PDF等の他の出力が生成されてもよい。さらなる出力は、例えば、音声、映像等の文書以外のメディアに関係してもよい。消費者は、新しい文書形式、スタイルガイド、レイアウト等を提供するために、消費者自身のスキーママップを提供してもよい。消費者は、コンテンツ選択のための消費者自身の情報ソースをさらに提供してもよい。
【0225】
本発明は、ユーザがメディアを摂取する際、ユーザがコンテンツを作成することを可能にし得る。本発明の実施形態によって、合成されたメディアは、容易に作成され得、大量のメディアを組み込み得る。本発明は、消費者対話に基づく、有意義なコンテンツの瞬時生成のために、静的データをビルディングブロックとして再使用できるようにし得る。
【0226】
本発明の一態様では、合成されたメディアは、収益化のために、コンテンツインベントリとして記憶され、利用され得る、変換されたセマンティックネットワークまたは思考ネットワークを表現する。セマンティックネットワークまたは思考ネットワークの価値は、メディア統合によって認識されてもよい。合成されたメディアは、対話を容易にするために、次いで他の人と共有され得る、消費者向けの通信を可能にする。このように、合成されたメディアは、相補型メディアのより大きな価値連鎖内でのセマンティックネットワーキングを統合し得る。
【0227】
また、本発明のメディア統合は、ビジネスマーケティングおよび供給手段も提供し得る。様々なメディア形態の生成によって、セマンティックネットワークおよび思考ネットワークを既存の大量市場ネットワークと統合することが可能となる。例えば、大量市場ネットワークには、ワールドワイドウェブ(WWW)、Google(登録商標)等の検索ネットワーク、またはFacebook(登録商標)等のソーシャルネットワークが挙げられ得る。メディア統合は、既存の大量市場ネットワークによるメディア統合サービスの提供を容易にする。
【0228】
当業者は、また、本発明の範囲から逸脱することなく、本明細書に記載される実施形態の他の変形も実践され得ることを理解するであろう。したがって、他の修正が可能である。