(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5654051
(24)【登録日】2014年11月28日
(45)【発行日】2015年1月14日
(54)【発明の名称】コンテキスト問い合わせ
(51)【国際特許分類】
G06F 17/30 20060101AFI20141218BHJP
【FI】
G06F17/30 330C
【請求項の数】15
【全頁数】13
(21)【出願番号】特願2012-551987(P2012-551987)
(86)(22)【出願日】2011年1月13日
(65)【公表番号】特表2013-519156(P2013-519156A)
(43)【公表日】2013年5月23日
(86)【国際出願番号】US2011021210
(87)【国際公開番号】WO2011097057
(87)【国際公開日】20110811
【審査請求日】2014年1月14日
(31)【優先権主張番号】12/700,985
(32)【優先日】2010年2月5日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】500046438
【氏名又は名称】マイクロソフト コーポレーション
(74)【代理人】
【識別番号】100140109
【弁理士】
【氏名又は名称】小野 新次郎
(74)【代理人】
【識別番号】100075270
【弁理士】
【氏名又は名称】小林 泰
(74)【代理人】
【識別番号】100096013
【弁理士】
【氏名又は名称】富田 博行
(74)【代理人】
【識別番号】100092967
【弁理士】
【氏名又は名称】星野 修
(74)【代理人】
【識別番号】100120112
【弁理士】
【氏名又は名称】中西 基晴
(72)【発明者】
【氏名】スリカンス,ムニラスナム
(72)【発明者】
【氏名】ヴァッダディ,ファニ
(72)【発明者】
【氏名】ナジム,タレク
【審査官】
野崎 大進
(56)【参考文献】
【文献】
特開2005−165958(JP,A)
【文献】
特開平08−235185(JP,A)
【文献】
特開2003−032292(JP,A)
【文献】
特開平07−093364(JP,A)
【文献】
特開2005−165416(JP,A)
【文献】
米国特許出願公開第2005/0125400(US,A1)
【文献】
米国特許出願公開第2008/0288641(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
JSTPlus(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
コンテキスト問い合わせを生成するためのコンピューター実装方法であって、
ユーザー問い合わせおよびコンテキストを受け取るステップであって、前記コンテキストは、ユーザーが現問い合わせセッションの間に動作させた1つ以上のアプリケーションのタイプを表すものである、ステップと、
ドメイン・オントロジーを使用して前記問い合わせの意味的表現を生成するステップであって、前記ドメイン・オントロジーが、フィルター、概念、および複数のカテゴリーにおける関係を特定する、ステップと、
現在の問い合わせセッションにおいて調べられた各ドメインと関連したフィルターを使用して、前記意味的表現をリファインするステップであって、いくつかのフィルターが、前記現問い合わせセッションの間にユーザーが前記1つ以上のアプリケーションを動作させた規準によって、前記意味的表現を増強する、ステップと、
前記コンテキストおよび意味的表現に基づいて、前記問い合わせにおけるタームと関連したコンテンツを有するデーター・ソースに対して発行する1つ以上のデーター・ソース・コマンドを選択するステップと、
を含む、コンピューター実装方法。
【請求項2】
請求項1記載の方法であって、更に、問い合わせおよびコンテキスト・オントロジーを使用して問い合わせおよびコンテキスト・タイプを判定するステップを含む、方法。
【請求項3】
請求項2記載の方法において、前記意味的表現に対する構造が、前記問い合わせオントロジーに含まれる問い合わせタイプと関連したテンプレートから導かれる、方法。
【請求項4】
請求項1記載の方法において、前記データー・ソースが、構造化データー・ソース、非構造化データー・ソース、および半構造化データー・ソースを含む、方法。
【請求項5】
請求項4記載の方法において、前記構造化データー・ソースが、構造化問い合わせ言語(SQL)またはSPARQLプロトコルおよびRDF問い合わせ言語(SPARQL)のうち1つを使用して問い合わせられる、方法。
【請求項6】
請求項4記載の方法において、前記非構造化または半構造化データー・ソースが、テキスト・キーワード問い合わせを使用して問い合わせられる、方法。
【請求項7】
請求項4記載の方法において、前記データー・ソース・コマンドが、各データー・ソースと関連した語彙情報に基づいて選択される、方法。
【請求項8】
問い合わせを処理する方法を実行するように構成された1つ以上のコンピューター読み取り可能媒体であって、前記方法が、
ユーザー問い合わせおよびコンテキストを受け取るステップであって、前記コンテキストは、ユーザーが現問い合わせセッションの間に動作させた1つ以上のアプリケーションのタイプを表すものである、ステップと、
ドメイン・オントロジーを使用して前記問い合わせの意味的表現を生成するステップと、
現在の問い合わせセッションにおいて調べられた各ドメインと関連したフィルターを使用して、前記意味的表現をリファインするステップであって、いくつかのフィルターが、前記現問い合わせセッションの間にユーザーが前記1つ以上のアプリケーションを動作させた規準によって、前記意味的表現を増強する、ステップと、
前記問い合わせにおけるタームと関連したコンテンツを有するデーター・ソースに対して発行する1つ以上のデーター・ソース・コマンドを選択するステップと、
を含む、コンピューター読み取り可能媒体。
【請求項9】
請求項8記載の媒体であって、更に、問い合わせおよびコンテキスト・オントロジーを使用して問い合わせおよびコンテキスト・タイプを判定するステップを含む、媒体。
【請求項10】
請求項9記載の媒体において、前記意味的表現に対する構造が、前記問い合わせオントロジーに含まれる問い合わせタイプと関連したテンプレートから導かれる、媒体。
【請求項11】
請求項8記載の媒体において、前記データー・ソースが、構造化データー・ソース、非構造化データー・ソース、および半構造化データー・ソースを含む、媒体。
【請求項12】
請求項11記載の媒体において、前記構造化データー・ソースが、構造化問い合わせ言語(SQL)またはSPARQLプロトコルおよびRDF問い合わせ言語(SPARQL)のうち1つを使用して問い合わせられる、媒体。
【請求項13】
請求項11記載の媒体において、前記非構造化または半構造化データー・ソースが、テキスト・キーワード問い合わせを使用して問い合わせられる、媒体。
【請求項14】
プロセッサとメモリーとを有し、コンテキスト問い合わせを生成するように構成されたコンピューター・システムであって、
ユーザー問い合わせおよびコンテキストを受け取るように構成されたサーチ・エンジンであって、前記コンテキストは、ユーザーが現問い合わせセッションの間に動作させた1つ以上のアプリケーションのタイプを表すものである、サーチ・エンジンと、
前記ユーザー問い合わせの問い合わせタイプおよび前記アプリケーションのアプリケーション・タイプを特定するオントロジーを格納するように構成された問い合わせ理解コンポーネントであって、前記問い合わせタイプが1つ以上の入力タイプおよび1つ以上の出力タイプを特定し、前記入力および出力タイプが、ドメイン・オントロジーまたはアプリケーション・オントロジーにおける概念、インスタンス、プロパティ、または関係に対応する、問い合わせ理解コンポーネントと、
前記問い合わせ理解コンポーネントに通信可能に接続されたデーター・ソース・コマンド・ジェネレータであって、該データー・ソース・コマンド・ジェネレータが、前記問い合わせ理解コンポーネントによって与えられる意味的表現を、コンテキスト問い合わせに変換するように構成され、各データー・ソースと関連した語彙情報に基づいて選択されたデーター・ソース・コマンドを使用して、複数のデーター・ソースに跨がって、前記コンテキスト問い合わせが適用される、データー・ソース・コマンド・ジェネレータと、
を含む、システム。
【請求項15】
請求項14記載のコンピューター・システムにおいて、前記オントロジーが、前記意味的問い合わせ表現を拡大し、前記オントロジーにおいて表現された概念、プロパティ、および関係の意味的記述に基づいてデーター・ソースから関連情報にアクセスするかまたは関連情報を計算する方法を特定する規則を与え、前記データー・ソースが、非構造化、構造化、または半構造化のデーター・ソースを含み、構造化問い合わせ言語(SQL)またはSPARQLプロトコル、およびRDF問い合わせ言語(SPARQL)、またはテキスト・キーワード問い合わせのうち1つを使用して問い合わせられる、コンピューター・システム。
【発明の詳細な説明】
【0001】
[0001] 従来のサーチ・エンジンは、ユーザーからの問い合わせを受け取り、この受け取った問い合わせに含まれるタームに一致するタームを有するウェブ・ページを突き止める。従来、サーチ・エンジンは、ユーザー問い合わせのコンテキストおよび意味を無視し、問い合わせを1組の単語として扱っていた。問い合わせに含まれるタームは、頻度に基づいてサーチされ、問い合わせのタームを含む結果がサーチ・エンジンによって戻されていた。
【0002】
[0002] したがって、従来のサーチ・エンジンは、ユーザーの関心を満たし損ねているかもしれない結果を戻している。ユーザーは、関心のある文書において発見される可能性が高い単語を選択することによって、問い合わせを組み直すことを試みる。例えば、株式情報を求めているユーザーが、「PE、会社A、株式」についての問い合わせを入力することが考えられる。
【発明の概要】
【発明が解決しようとする課題】
【0003】
従来のサーチ・エンジンは、各単語を別々に扱い、「会社A」というタームを有する文書、「PE」というタームを有する文書、「株式」というタームを有する文書、そしてこれらのタームのうち任意のものを有する文書を返す。従来のサーチ・エンジンは、会社Aの株式動向、会社Aのその競合との比較、および会社Aの管理についてのニュースを論ずる結果において、インテリジェントに文書を選択することができない。ユーザーは、これらの文書のいずれかに動向情報が含まれるか否か判断するためには、結果の中にある異なる文書を読まなければならない。
【課題を解決するための手段】
【0004】
[0003] 本発明の実施形態は、コンテキスト問い合わせを生成するシステム、方法、およびコンピューター読み取り可能媒体に関する。サーチ・エンジンが、クライアント・デバイスからの問い合わせを、現在のサーチ・セッションの間に利用されたアプリケーションによって提供されたコンテキスト情報と共に受け取る。一方、問い合わせ理解コンポーネントは、コンテキスト情報および問い合わせを処理して、この問い合わせの意味的表現を生成する。この問い合わせの意味的表現は、更に、データー・ソース・コマンド・ジェネレータによって処理され、各データー・ソースと関連した語彙情報に基づいて、数個のデーター・ソース・コマンドを選択する。データー・ソース・コマンドは、ユーザーの問い合わせおよび生成されたコンテキストお問い合わせに応答して、回答および結果をサーチ・エンジンに戻すために、データー・ソース・コマンド・ジェネレータからデーター・ソースに発行される。
【0005】
[0004] この摘要は、詳細な説明の章において以下で更に説明する概念から選択したものを紹介するために、設けられている。この摘要は、特許請求する主題の主要な特徴や必須の特徴を特定することを意図するのではなく、特許請求する主題の範囲を判断するために補助として単独で使用されることを意図するのでもない。
【図面の簡単な説明】
【0006】
[0005] 本発明の例示的実施形態について、添付図面を参照しながら以下に詳細に説明する。添付図面は、ここで引用したことにより、本明細書に含まれるものとする。
【
図1】
図1は、本発明の実施形態による計算デバイス例を示すブロック図である。
【
図2】
図2は、本発明の実施形態にしたがってコンテキスト問い合わせを生成するように構成されたコンピューター・システムのコンポーネント例を示すネットワーク図である。
【
図3】
図3は、本発明の実施形態にしたがってコンテキスト問い合わせをs衛星するコンピューター実装方法を示す論理図である。
【発明を実施するための形態】
【0007】
[0009] 本特許は、特許請求する主題について、法的要件を満たすために具体性をもって説明する。しかしながら、説明自体は、本特許の範囲を限定することは意図していない。むしろ、本発明者は、特許請求する主題は、本文書において記載するステップとは異なるステップまたは同様のステップの組み合わせを含むように、他の現在または今後の技術と関連付けて、別の方法で具現化してもよいことを想定している。更に、「ステップ」および/または「ブロック」という用語は、本明細書においては、採用される方法の異なるエレメントを言外に意味するために使用することもできるが、個々のステップの順序が明示的に記載されている場合を除いて(unless and except)、これらの用語は、本明細書において開示される種々のステップ間において、いかなる特定の順序をも暗示するように解釈してはならない。
【0008】
[0010] 本明細書において使用する場合、「コンテキスト問い合わせ」(contextual query)という用語は、データー・ソースにアクセスし、このデーター・ソースに含まれる情報の構造、および問い合わせに含まれるタームの意味に基づいて、データー・ソースから情報を引き出すために使用されるデーター・コマンドのことを言う。
【0009】
[0011] 本明細書において使用する場合、「コンポーネント」という用語は、ハードウェア、ファームウェア、およびソフトウェアの任意の組み合わせのことを言う。
[0012] 本発明の実施形態は、ユーザーがユーザー問い合わせに対する回答を受けることを可能にするコンテキスト問い合わせを提供する。回答は、構造化データー、半構造化データー、および未構造化データーを有する大きなコンテンツ集合体から収集される。コンテキスト問い合わせは、この問い合わせに含まれるタームと関連したオントロジー(ontology)、および現在のサーチ・セッションの間に利用されたアプリケーションに基づいて、コンピューター・システムによって生成される。コンテキスト問い合わせは、構造化、非構造化、および半構造化データーの組み合わせをサーチして、問い合わせに対する回答を求める。
【0010】
[0013] 例えば、ユーザーの財務問い合わせに対する回答が、この財務問い合わせのオントロジー・ドリブン理解(ontology-driven understanding)を使用して、コンピューター・システムによって戻される。コンピューター・システムは、「会社Aと同様のPE率を有する会社」、「会社A運用収入」、ならびに「会社AおよびBの評価」というような、自然言語問い合わせに対する回答をユーザーが得ることを可能にする財務アプリケーションを提供することができる。オントロジーは、問い合わせに応答して現在のデーターを使用して計算されるべき複数の主要な比率(key ratio)をコンピューター・システムが理解するために使用される。主要な比率には、とりわけ、「PE比率」、「価格対販売比率」等を含むことができる。自然言語問い合わせおよび対応するオントロジーは、意味的表現を生成するために使用される。財務アプリケーションは、意味的表現をSPARQL問い合わせに変換し、このSPARQL問い合わせをデーター・ソースに発行する。SPARQL問い合わせは、レコードを含み、これらのレコードを調べて回答を戻す。一方、財務アプリケーションは、これらの比率の比較、ならびに会社AおよびBについての他の評価メトリックを戻す。
【0011】
[0014] コンピューター・システムは、問い合わせをユーザーから受け取る。また、コンピューター・システムは、現在のサーチ・セッションの間に調べられた1つ以上のアプリケーションについてのコンテキストも受け取る。1つ以上のオントロジーを使用して、コンピューター・システムは問い合わせおよびコンテキストを理解し、問い合わせの意味的表現、およびユーザーが問い合わせを明確に表現(formulate)したアプリケーションのコンテキストを生成する。概念、インスタンス、プロパティ、および関係が、分類学(taxonomy)、テンプレート、またはオントロジーに含まれる定義に基づいて、問い合わせの意味的表現に含まれる。一実施形態では、意味的表現は、抽出された概念、インスタンス、プロパティ、および関係等を使用した、問い合わせのグラフである。一方、意味的表現は、関連情報および問い合わせに対する回答を引き出すために、データー・ソース・コマンド・ジェネレータによって自動的にデーター・ソース特定問い合わせ言語に変換することができる。
【0012】
[0015]
図1は、本発明の実施形態による計算デバイス例100を示すブロック図である。計算デバイス100は、バス110、メモリー112、プロセッサ114、プレゼンテーション・コンポーネント116、入力/出力(I/O)ポート118、入力/出力(I/O)コンポーネント120、および電源122を含む。計算デバイス100は、適した計算環境の一例に過ぎず、本発明の使用範囲や機能に関していかなる限定をも示唆する意図はない。また、計算デバイス100が、図示のコンポーネントのうち任意の1つまたはその組み合わせに関して、いかなる依存性や必要性をも有すると解釈すべきでない。
【0013】
[0016] 計算デバイス100は、通例、種々のコンピューター読み取り可能媒体を含む。一例として、そして限定ではなく、コンピューター読み取り可能媒体は、ランダム・アクセス・メモリー(RAM)、リード・オンリー・メモリー(ROM)、電子的消去可能プログラム可能リード・オンリー・メモリー(EEPROM)、フラッシュ・メモリーまたは他のメモリー技術、CDROM、ディジタル・バーサタイル・ディスク(DVD)あるいは他の光またはホログラフ媒体、磁気カセット、磁気テープ、磁気ディスク・ストレージまたは他の磁気記憶デバイス、あるいは所望の情報をエンコードするために使用することができ、計算デバイス100がアクセスすることができる任意の他の媒体を含むことができる。本発明の実施形態は、パーソナル・データー・アシスタントまたは他のハンドヘルド・デバイスというような計算デバイス100によって実行される、コンピューター・コードあるいはプログラム・モジュールのようなコンピューター実行可能命令を含む装置使用可能命令を使用して実現することができる。一般に、プログラム・モジュールは、ルーチン、プログラム、オブジェクト、モジュール、データー構造等を含み、特定のタスクを実行するコード、または特定の抽象データー・タイプを実現するコードのことを言う。本発明の実施形態は、分散型計算環境を含む種々のシステム構成で実施することができ、分散型計算環境では、通信ネットワークを介してリンクされているリモート処理デバイスによってタスクが実行される。
【0014】
[0017] 計算デバイス100は、以下のコンポーネントを直接または間接的に結合するバス110を含む。メモリー112、1つ以上のプロセッサー114、1つ以上のプレゼンテーション・コンポーネント116、入力/出力(I/O)ポート118、I/Oコンポーネント120、および例示的な電源122。バス110は、1系統以上のバス(アドレス・バス、データー・バス、またはその組み合わせのような)としてもよいものを代表する。
図1の種々のコンポーネントは、明確化のために線で示されているが、実際には、種々のコンポーネントの輪郭はそれほど明らかではなく、比喩的には、これらの線はもっと正確には灰色で曖昧になるであろう。例えば、ディスプレイ・デバイスのようなプレゼンテーション・コンポーネント116を、I/Oコンポーネント120と見なす人がいてもよい。加えて、プロセッサー114はメモリー112を有する。「ワークステーション」、「サーバー」、「ラップトップ」、「ハンド・ヘルド・デバイス」等の間では、区別は行われない。何故なら、これらは全て
図1の範囲に入ると考えられるからである。
【0015】
[0018] メモリー112は、揮発性および/または不揮発性メモリーの形態としたコンピューター記憶媒体を含む。このメモリーは、リムーバブル、非リムーバブル、またはその組み合わせであってもよい。ハードウェア・デバイスの例には、ソリッド・ステート・メモリー、ハード・ドライブ、光ディスク・ドライブ等が含まれる。計算デバイス100は、メモリー112またはI/Oコンポーネント120のような種々のエンティティからデーターを読み出す1つ以上のプロセッサー114を含む。プレゼンテーション・コンポーネント116は、データー指示をユーザーまたは他のデバイスに提示する。プレゼンテーション・コンポーネント116の例には、ディスプレイ・デバイス、スピーカー、プリンター、振動モジュール等が含まれる。I/Oポート118は、I/Oコンポーネント120を含む他のデバイスに計算デバイス100を物理的および論理的に結合することを可能にする。これら他のデバイスの一部は内蔵されていてもよい。例示的なI/Oコンポーネント120には、マイクロフォン、ジョイスティック、ゲーム・パッド、衛星ディッシュ、スキャナー、プリンター、ワイヤレス・デバイス等が含まれる。
【0016】
[0019] コンテキスト問い合わせを生成するコンピューター・システムは、サーチ・エンジン、問い合わせ理解コンポーネント、およびデーター・ソース・コマンド・ジェネレータを含む。コンテキスト問い合わせは、クライアント・デバイスによって与えられる問い合わせと関連したオントロジー、およびその問い合わせを定型化したアプリケーションに対応するオントロジーに基づいて生成される。サーチ・エンジンは、問い合わせをクライアント・デバイスから受け取り、コンテキストをアプリケーションから受け取る。次いで、サーチ・エンジンはコンテキスト問い合わせに対する回答、および問い合わせに対応するコンテンツを含む結果を、クライアント・デバイスに送る。クライアント・デバイスは、この結果を回答と共に表示する。
【0017】
[0020]
図2は、本発明の実施形態にしたがってコンテキスト問い合わせを生成するように構成されているコンピューター・システムのコンポーネント例を示すネットワーク図である。コンピューター・システム200は、クライアント・デバイス210、ネットワーク220、サーチ・エンジン230、データー・ソース・コマンド・ジェネレータ240、および問い合わせ理解コンポーネント250を有する。
【0018】
[0021] クライアント・デバイス210は、ネットワーク220を介して、サーチ・エンジン230に接続されている。実施形態の中には、クライアント・デバイス210が、ウェブ・アクセスが可能な任意の計算デバイスであてもよい場合もある。したがって、クライアント・デバイス210は、パーソナル・コンピューター(PC)、ラップトップ・コンピューター、移動体電話機、パーソナル・ディジタル・アシスタント(PDA)、サーバー、CDプレーヤー、MP3プレーヤー、ビデオ・プレーヤー、ハンドヘルド通信デバイス、ワークステーション、これら列挙したデバイスの任意の組み合わせ、またはウェブ・アクセスが可能な任意の他のデバイスというような、種々の形態をなすこともできる。
【0019】
[0022] クライアント・デバイス210は、ユーザーが問い合わせを入力することを可能にする。クライアント・デバイス210は、問い合わせをサーチ・エンジン230に送る。ある種の実施形態では、クライアント・デバイス210は、問い合わせを明確に表現するためにユーザーによって使用されたアプリケーションと関連したコンテキストも送る。他の実施形態では、サーチ・エンジン230がコンテキストを与えることもできる。次いで、クライアント・デバイス210は、回答を含む結果を受け取る。また、クライアント・デバイス210は、コンテキスト問い合わせに対する回答、および問い合わせに対する結果をユーザーに表示することができる。
【0020】
[0023] ネットワーク220は、クライアント・デバイス210、サーチ・エンジン230、データー・ソース・コマンド・ジェネレータ240、および問い合わせ理解コンポーネント250を接続する。ネットワーク220は、有線、ワイヤレス、または双方でもよい。ネットワーク220は、複数のネットワーク、またはネットワークのネットワークを含むこともできる。例えば、ネットワーク220は、1つ以上のワイド・エリア・ネットワーク(WAN)、1つ以上のローカル・エリア・ネットワーク(LAN)、インターネットのような1つ以上の公衆ネットワーク、または1つ以上の私用ネットワークを含むことができる。ワイヤレス・ネットワークでは、基地局、通信塔、またはアクセス・ポイント(および他のコンポーネント)というようなコンポーネントであっても、実施形態の中には、ワイヤレス接続を提供できる場合もある。明確化のために1つずつのコンポーネントが示されているが、ネットワーク220は任意の数のクライアント・デバイス210間における通信を可能にするとよいことは、当業者には認められよう。
【0021】
[0024] サーチ・エンジン230は、クライアント・デバイス210から受け取った問い合わせに対する結果、およびデーター・ソース・コマンド・ジェネレータ240によって動的に生成されるコンテキスト問い合わせに対する回答を与えるサーバ・コンピューターである。サーチ・エンジン230は、ユーザー問い合わせおよびアプリケーション・コンテキストを受け取るように構成されている。サーチ・エンジン230は、ユーザー問い合わせに対する結果、およびコンテキスト問い合わせに対する回答を戻す。実施形態の中には、サーチ・エンジン230がコンテキスト問い合わせに対する回答のみを戻す場合もある。
【0022】
[0025] データー・ソース・コマンド・ジェネレータ240は、問い合わせ理解コンポーネント250に通信可能に接続されている。一実施形態では、データー・ソース・コマンド・ジェネレータ250は、フィルター242および語彙情報244を含む。データー・ソース・コマンド・ジェネレータ240は、問い合わせ理解コンポーネント250によって与えられる意味的表現を、コンテキスト問い合わせに変換するように構成されており、コンテキスト問い合わせは、各データー・ソースと関連した語彙情報244に基づいて選択されたデーター・ソース・コマンドを使用して、複数のデーター・ソースに跨がって印加される。一実施形態では、データー・ソースは、非構造化、構造化、または半構造化データー・ソースを含み、構造化問い合わせ言語(SQL)、SPARQLプロトコル、およびRDF問い合わせ言語(SPAEQL)、またはテキスト・キーワード問い合わせのうち1つを使用して、これらのデータ・ソースが問い合わせられる。
【0023】
[0026] フィルター242は、問い合わせ理解コンポーネント250によって与えられる意味的表現をリファインするように構成されている。フィルター242は、現問い合わせセッションと関連した情報に基づいて意味的表現を増強することによって、意味的表現をリファインする。一実施形態では、フィルター242は、ドメイン・フィルター、協調フィルター、地理フィルター、時間フィルター、タスク・フィルター、およびユーザー・フィルターを含む。ドメイン・フィルターは、アプリケーション・コンテキストに基づいて特定することができる。例えば、株式についてサーチしているユーザーが、財務ドメインまたは料理ドメインに関心がある可能性がある。データー・ソース・コマンド・ジェネレータ240は、これらのドメインから1つを、他のフィルター242に基づいて選択することができる。例えば、協調フィルターまたはコミュニティ・フィルターは、ユーザが料理グループまたは財務グループに繋がれていることを示すことができる。ユーザーと関連したグループに基づいて、データー・ソース・コマンド・ジェネレータ240は、関連するドメイン・フィルターを選択する。例えば、財務コミュニティに入っているユーザーは、会社の株式に関心がある可能性が高い。したがって、ドメイン・フィルターを財務に設定するとよい。地理フィルターは、ユーザーの現在地を含むことができる。例えば、イングランドにおける英国国民であるユーザーが問い合わせを発行することも考えられ、コンピューター・システム200によって地理フィルタをイングランドに設定するとよい。時間フィルターは、問い合わせに対する時間枠を含むことができる。問い合わせに日付または時刻が含まれていない場合、時間フィルターを現在の24時間単位の時間期間に設定することができる。タスク・フィルターは、ユーザーによって使用されているアプリケーションに基づいて選択することができ、またはコンピューター・システム200によって推論することもできる。タスク・フィルターは、電子メールをチェックする、コンテンツをサーチする、文書を編集する等を含むことができる。ユーザー・フィルターは、他のフィルター242に選択された値を無効にするプロファイル属性を含むことができる。例えば、英国国民であるユーザーが、プロファイルにおいて、米国株式の関心を指定することができる。これに応じて、株式問い合わせに対する地理的情報を、イングランドからアメリカ合衆国に変更することができる。フィルター242に対するこれらの値は、意味的表現に含まれ、この意味的表現は、データー・ソース・コマンド・ジェネレータ240によってコンテキスト問い合わせに変換される。
【0024】
[0027] 語彙情報コンポーネント244は、データー・ソース・コマンド・ジェネレータ240の一部である。語彙情報コンポーネント240は、コンテキスト問い合わせを受け取るべきデーター・ソースを選択するために使用される。コンテキスト問い合わせのタームと同様の語彙情報を有するデーター・ソースが、コンテキスト問い合わせを受け取るために選択される。一実施形態では、語彙情報コンポーネント244は、オントロジーと関連した語彙情報、およびサーチ・エンジンによって調べられたコンテンツを格納するデーター・ソースを格納する。実施形態の中には、コンピューター・システムによって各データー・ソースに対してテキスト・マイニングが行われて、語彙情報コンポーネント244に格納されている各データー・ソースと関連した語彙情報を選択する場合もある。
【0025】
[0028] 一方、データー・ソース・コマンド・ジェネレータ240は、選択されたデーター・ソースに対して発行されるコンテキスト問い合わせを生成する。この問い合わせの意味的表現は更に処理されて、選択されたデーター・ソースに対してしかるべきコマンドを選択することができる。語彙情報コンポーネント244、オントロジー252、および規則254にアクセスし、データー・ソース毎に、概念の意味的記述、プロパティ、および意味的表現に含まれる関係に基づいて、データー・ソースから関連情報にアクセスするまたは関連情報を計算する方法を特定する。
【0026】
[0029] 問い合わせ理解コンポーネント250は、問い合わせタイプおよびコンテキスト・タイプを特定するオントロジー252を格納するように構成されている。また、問い合わせ理解コンポーネント250は、オントロジー252における項目と関連した規則254も与える。この規則254は、意味的表現を拡張し、オントロジー252において表現されている概念、プロパティ、および関係の意味的記述に基づいて、データー・ソースから関連情報にアクセスするまたは計算する方法を特定する。例えば、問い合わせタイプは1つ以上の入力タイプおよび1つ以上の出力タイプを特定することができ、入力および出力タイプは、問い合わせオントロジーまたはテキストオントロジーにおける概念、インスタンス、プロパティ、または関係に対応する。
【0027】
[0030] 問い合わせ理解コンポーネント250は、問い合わせおよびコンテキストの意味的表現を生成するように構成されている。問い合わせオントロジーおよびコンテキスト・オントロジーは、問い合わせ理解コンポーネント250が、オントロジー252に含まれる各概念、インスタンス等と関連したユニフォーム・リソース識別子(URI)に基づいて意味的表現のグラフを生成するために使用することができる。意味的表現は、ユーザー問い合わせおよびアプリケーション・コンテキストのしかるべきコンテキスト規則によって調整される。
【0028】
[0031] 一実施形態では、グラフは、拡張可能マークアップ言語(XML)でフォーマットされた意味的問い合わせ表現(SQR)である。SQRは、以下のノードを含むことができる。問い合わせタイプ(QT)、コンテキスト(CXT)、および表示(DSP)テンプレート。例えば、会社Aに対する自然言語問い合わせは、以下のSQR<QT:インスタンス・プロファイル:会社;インスタンス・タイプ:株式;インスタンスURI:会社A><CXT:自然言語、財務><DSP:会社名、シンボル、ニュース>を有することができる。
【0029】
[0032] データー・ソースに依存して、意味的問い合わせ表現は、関連した回答および情報をこれらのデーター・ソースから引き出すためのデーター・ソース特定問い合わせに変換される。意味的表現では、QTはアプリケーションがそのユーザーから期待することができる異なるタイプの問い合わせの階層の正式表現である。各QTは、オントロジーの他の部分への拡張を容易にする1組の入力および出力パラメータによって評価される。CXTは、ユーザー問い合わせを取り込んで解釈することができる異なるタイプのコンテキストの階層の正式表現である。CXTは、ユーザーが彼らの問い合わせを発行するために対話処理するアプリケーションによって明示的に特定することができ、または問い合わせのテキストから暗示的に導くことができる。各CXTは、所与の問い合わせにおいて概念、インスタンス等を解釈するための条件および規準を特定する。CXTは、意味的問い合わせ表現に含まれる概念、インスタンス等を拡大するかまたは明確にすることができる。意味的グラフは、問い合わせタイプ・オントロジーにおける問い合わせタイプ、ならびに各データー・ソースと関連したコンテキスト・タイプ・オントロジーおよび語彙情報におけるコンテキスト・タイプと関連したQTおよびCXTテンプレートにしたがって構造化される。
【0030】
[0033] オントロジー252は、データー・ソースにおけるコンテンツに対応する単語および句を含む。各オントロジー252は、ドメインに対する分類法、およびドメインにおける単語または句間の関係を含む。ドメインは、医学、美術、コンピューター等を含むことができる。一実施形態では、オントロジー242は問い合わせタイプおよびコンテキスト・タイプも格納する。問い合わせタイプは、テキスト・ユーザー問い合わせのタイプおよび構造を特定する。例えば、問い合わせタイプは、自然言語、構造化、インライン・コマンド等を含むことができる。コンテキスト・タイプは、問い合わせを表現することができる異なるタイプのコンテキストを特定し編成する。例えば、コンテキストは、サーチ・エンジン、電子メール・アプリケーション、財務アプリケーション等を含むことができる。オントロジー252は、規則254と関連付けられている。この規則は、意味的問い合わせ表現において、しかるべき規則に対応するURIを使用して参照することができる。
【0031】
[0034] 規則254は、複数のドメインに跨がって概念、インスタンス、プロパティ、および関係を特定する。ある種の実施形態では、規則254は、データー・ソースに含まれるデーターから結果を計算するために使用される方法または関数を定めることができる。例えば、規則254は、比較器、数学的関数、統計的関数、または他の探索法を含むことができる。他の実施形態では、規則254は、データー・ソースに利用可能なコマンドにおいて特定される関数と関連付けることもできる。
【0032】
[0035] 一実施形態では、クライアント・デバイスのユーザーから受け取られた問い合わせから動的に生成されたコンテキスト問い合わせに基づいて、回答がクライアント・デバイスに送られる。コンピューター・システムは、問い合わせに対応するオントロジー、およびこの問い合わせを明確に表現するときにユーザーによって調べられたアプリケーションに基づいて、コンテキスト問い合わせを動的に生成するためのコンピューター実装方法を実行することができる。
【0033】
[0036]
図3は、本発明の実施形態にしたがってコンテキスト問い合わせを生成するためのコンピューター実装方法を示す論理図である。この方法は、コンピューター・システムがクライアント・デバイスのネットワークに接続されたときに、ステップ310において初期化する。
【0034】
[0037] ステップ320において、コンピューター・システムはユーザー問い合わせおよびアプリケーション・コンテキストを受け取る。このコンテキストは、ユーザーが現問い合わせセッションにおいて動作させているアプリケーションによって与えられる。ステップ330において、コンピューター・システムは、ドメイン・オントロジーを使用して、問い合わせの意味的表現を生成する。コンピューター・システムは、問い合わせおよびコンテキストオントロジーを使用して、問い合わせおよびコンテキスト・タイプを判定する。意味的表現に対する構造は、問い合わせオントロジーに含まれる問い合わせタイプ、またはコンテキスト・オントロジーに含まれるコンテキスト・タイプと関連したテンプレートから導かれる。
【0035】
[0038] 意味的表現は、ステップ340において、現問い合わせセッションにおいて調べられた各ドメインと関連したフィルターを使用してリファインされる。このフィルターは、現問い合わせセッション要求の間にユーザーが動作させた1つ以上のアプリケーションと関連した規準によって、意味的表現を増強する。ステップ350において、コンピューター・システムは、問い合わせにおけるタームと関連したコンテンツを有するデーター・ソースに対して発行する1つ以上のデーター・ソース・コマンドを選択する。ある種の実施形態では、データー・ソースは、構造化データー・ソース、非構造化データー・ソース、および半構造化データー・ソースを含む。構造化データー・ソースは、構造化問い合わせ言語(SQL)またはSPARQLプロトコル、およびRDF問い合わせ言語(SPARQL)のうち1つを使用して、問い合わせられる。非構造化または半構造化データー・ソースは、テキスト・キーワード問い合わせを使用して問い合わせられる。本方法は、ステップ360において終了する。
【0036】
[0039] 要約すると、コンテキスト問い合わせは、ユーザーによって与えられた問い合わせと関連したオントロジー、および問い合わせを生成するために利用されたアプリケーションと関連したオントロジーに組み立てられた情報を使用して、ユーザーが複数のデーター・ソースを調べることを可能にする。例えば、ユーザーは問い合わせをサーチ・エンジンに送ることができ、サーチ・エンジンは複数の結果を戻す。加えて、サーチ・エンジンは、ユーザー問い合わせから明確に表現されたコンテキスト問い合わせと関連した回答も与えることができる。
【0037】
[0040] 例えば、ユーザーの財務問い合わせに対する回答が、財務問い合わせのオントロジー・ドリブン理解を使用して、コンピューター・システムによって戻される。コンピューター・システムは、「会社Aと同様のPE率を有する会社」、「会社A運用収入」、および「会社AおよびBの評価」というような、自然言語問い合わせに対する回答をユーザーが得ることを可能にする財務アプリケーションを提供することができる。後者の問い合わせ処理は、現在のデーターを使用して計算されるべき複数の主要な比率を含む評価を理解するためにオントロジーを使用することができる。主要な比率には、とりわけ、「PE比率」、「価格対販売比率」等を含むことができる。一方、財務アプリケーションは、これらの比率の比較、ならびに会社AおよびBについての他の評価メトリックを戻す。自然言語問い合わせおよび対応するオントロジーは、意味的表現を生成するために使用される。財務アプリケーションは、意味的表現をSPARQL問い合わせに変換することができ、このSPARQL問い合わせはデーター・ソースに発行される。SPARQL問い合わせは、レコードを含み、回答を戻すためにこれらのレコードが調べられる。
【0038】
[0041] コンピューター・システムは、問い合わせ"MSFT higher PE"をユーザーから受け取り、アプリケーション・コンテキスト「財務」および「自然言語」を財務アプリケーションから受け取る。コンピューター・システムは、財務オントロジーおよび自然言語オントロジーを特定する。次いで、言語的解釈を使用して、問い合わせが"MSFT higher/high-1 PE"に変換される。財務オントロジーは、数学的演算子およびPE比率に対する定義を使用して意味的表現を更に変換するために、使用することができる。意味的表現は、"MSFT higher/high-1 Comparator PE"に変換される。コンピューター・システムは、複数のフィルターを適用して、この意味的表現をリファインする。一実施形態では、意味的表現は、オントロジーを使用して生成された問い合わせグラフである。これらのフィルターには、ドメイン・フィルター、協調フィルター、地理フィルター、時間フィルター、タスク・フィルター、およびユーザー関心フィルターを含む。これらのフィルターを適用した後、コンピューター・システムは問い合わせを"Ticker MSFTUS/Ticker higher greater-IPE/PE ratio Date:today"に変換する。次いで、この意味的表現はデーター・ソース・コマンドに変換される。コンピューター・システムは、次の"Ticker/PePratio>MSFTQUS.PERatio&&Date=today"を発行することができる。このデーター・ソース・コマンドは、回答を突き止めるために、複数のデーター・ソースに送られる。
【0039】
[0042] 図示した種々のコンポーネントの多くの異なる構成、および図示しなかったコンポーネントも、本発明の主旨および範囲から逸脱することなく可能である。本発明の実施形態は、限定的ではなく例示的であることを意図して記載された。尚、ある種の特徴およびサブコンビネーションは有益であり、他の特徴およびサブコンビネーションを参照しなくても採用でき、特許請求の範囲に含まれることは言うまでもない。種々の図において列挙された全てのステップを、記載した特定の順序で実行する必要はない。