特許第5888978号(P5888978)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アルカテル−ルーセントの特許一覧

特許5888978辞書に含まれる用語定義からオントロジを自動的に生成するデバイスおよび方法
<>
  • 特許5888978-辞書に含まれる用語定義からオントロジを自動的に生成するデバイスおよび方法 図000003
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5888978
(24)【登録日】2016年2月26日
(45)【発行日】2016年3月22日
(54)【発明の名称】辞書に含まれる用語定義からオントロジを自動的に生成するデバイスおよび方法
(51)【国際特許分類】
   G06F 17/27 20060101AFI20160308BHJP
   G06F 17/30 20060101ALI20160308BHJP
【FI】
   G06F17/27 685
   G06F17/30 320D
【請求項の数】11
【全頁数】14
(21)【出願番号】特願2011-501161(P2011-501161)
(86)(22)【出願日】2009年2月24日
(65)【公表番号】特表2011-517495(P2011-517495A)
(43)【公表日】2011年6月9日
(86)【国際出願番号】EP2009052176
(87)【国際公開番号】WO2009118223
(87)【国際公開日】20091001
【審査請求日】2012年2月22日
【審判番号】不服2014-12933(P2014-12933/J1)
【審判請求日】2014年7月4日
(31)【優先権主張番号】08300157.8
(32)【優先日】2008年3月27日
(33)【優先権主張国】EP
(73)【特許権者】
【識別番号】391030332
【氏名又は名称】アルカテル−ルーセント
(74)【代理人】
【識別番号】100094112
【弁理士】
【氏名又は名称】岡部 讓
(74)【代理人】
【識別番号】100106183
【弁理士】
【氏名又は名称】吉澤 弘司
(74)【代理人】
【識別番号】100170601
【弁理士】
【氏名又は名称】川崎 孝
(72)【発明者】
【氏名】ラルベ,フィリップ
(72)【発明者】
【氏名】カレ,フランソワ
【合議体】
【審判長】 手島 聖治
【審判官】 川崎 優
【審判官】 石川 正二
(56)【参考文献】
【文献】 欧州特許出願公開第1903454(EP,A1)
【文献】 Liu,C.,et al,DODO:A Mechanism Helping to Dynamically Construct Domain Ontologies for Services Integration,Proc. of 2006 Int. Workshop on Service Oriented Software Engineering(IW−SOSE ’06)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/21-17/30
(57)【特許請求の範囲】
【請求項1】
オントロジを自動的に生成する方法であって、オントロジを生成しなければならない用語が受け取られるたびに、i)前記受け取られた用語の定義を辞書(DC)内で特定するステップと、次に、ii)前記特定された定義から関連用語を抽出するステップであって、前記関連用語は意味論的骨格である単語、単語のセット、または辞書編集的ストリングであり、前記意味論的骨格は名詞および動詞であり、次に、iii)前記抽出された関連用語のそれぞれの定義を前記辞書(DC)内で特定するステップと、次に、iv)前記受け取られた用語および前記抽出された関連用語の前記特定された定義のそれぞれについて、含まれる関連用語の対の間の関係を表す少なくとも1つの論理節を構築するステップとを含み、前記構築される論理節は、前記受け取られた用語のオントロジを定義する、方法。
【請求項2】
前記論理節を構築し終えた後に、それらの論理節を選択されたオントロジ言語に変換する、請求項1に記載の方法。
【請求項3】
変換テーブル(CT)によって前記論理節を変換する、請求項2に記載の方法。
【請求項4】
前記オントロジ言語は、少なくともOWLおよびRDFを含む言語群から選択される、請求項2または3に記載の方法。
【請求項5】
オントロジを自動的に生成するデバイス(D)であって、分析手段(AM)を含み、前記分析手段は、オントロジを生成しなければならない用語が受け取られるたびに、i)前記受け取られた用語の定義を特定するために辞書(DC)にアクセスし、次に、ii)前記特定された定義から、意味論的骨格である単語、単語のセット、または辞書編集的ストリングである関連用語を抽出し、前記意味論的骨格は名詞および動詞であり、次に、iii)前記抽出された関連用語のそれぞれの定義を特定するために前記辞書(DC)にアクセスし、次に、iv)前記受け取られた用語および前記抽出された関連用語の前記特定された定義のそれぞれについて、含まれる関連用語の対の間の関係を表す少なくとも1つの論理節を構築する、よう構成され、前記構築される論理節は、前記受け取られた用語のオントロジを定義する、デバイス。
【請求項6】
前記構築された論理節を、選択されたオントロジ言語に変換するように構成された変換手段(CM)をさらに含む、請求項5に記載のデバイス。
【請求項7】
前記変換手段(CM)は、変換テーブル(CT)によって前記論理節を変換するように構成される、請求項6に記載のデバイス。
【請求項8】
前記変換テーブル(CT)を格納するように構成された格納手段(SM2)をさらに含む、請求項7に記載のデバイス。
【請求項9】
前記オントロジ言語は、少なくともOWLおよびRDFを含む言語群から選択される、請求項6乃至8のいずれか1項に記載のデバイス。
【請求項10】
前記辞書(DC)を格納するように構成された他の格納手段(SM1)をさらに含む、請求項5乃至9のいずれか1項に記載のデバイス。
【請求項11】
ンピュータにオントロジを自動的に生成するデバイスとして機能させるプログラムであって、前記デバイスは分析手段(AM)を含み、前記分析手段は、オントロジを生成しなければならない用語が受け取られるたびに、
i)前記受け取られた用語の定義を特定するために辞書(DC)にアクセスし、次に、 ii)前記特定された定義から、意味論的骨格である単語、単語のセット、または辞書編集的ストリングである関連用語を抽出し、前記意味論的骨格は名詞および動詞であり、次に、
iii)前記抽出された関連用語のそれぞれの定義を特定するために前記辞書(DC)にアクセスし、次に、
iv)前記受け取られた用語および前記抽出された関連用語の前記特定された定義のそれぞれについて、含まれる関連用語の対の間の関係を表す少なくとも1つの論理節を構築するように構成され、
前記構築される論理節が前記受け取られた用語のオントロジを定義する、プログラム
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書の分析に関し、より具体的には、文書分析または文書処理の文脈で使用されるオントロジ(ontology)を自動的に生成する方法およびデバイスに関する。
【背景技術】
【0002】
用語「自動的に生成」は、本明細書では、本発明によってオントロジを用語定義から自動的に生成でき、完成できることを意味する。
【0003】
さらに、用語「オントロジ」は、本明細書では、所与の領域内で操作される用語(または概念)およびこれらの用語(または概念)の間の関係の形式記述(またはデータ・モデル)を叙述する。オントロジは、特に、ある領域内に存在するオブジェクトに関して推論するのに使用される。
【0004】
当業者から知られているとおり、増加する数のアプリケーションが、文書の分析または処理を可能にし、またはこれに関係し、またはこれを容易にするためにオントロジを使用する。これは、特に、仕様書から実行可能アプリケーションを自動的に構築するデバイス、CRM(「カスタマ・リレーションシップ・マネジメント」)で着信電子メールを自動的に処理するのに使用されるテキスト分析、または自然言語要求から関連情報を見つけることができる「意味論検索エンジン」にあてはまる。
【0005】
したがって、分析されまたは処理されがちなテキストに含まれる可能性がある用語(または概念)を完全にかつ正確に記述する、自由になるオントロジを有することが重要である。
【0006】
現在、オントロジは、たとえば「Protege」(特にインターネット・アドレス「http://protege.standford.edu」で説明されている)などの専用ツールの援助によって手作業で構築される。これは、満足できるものではない。というのは、テキスト(または文書)が、オントロジ内の対応物がまだ存在しない用語(または概念)を含むたびに、専門家がオントロジ内に対応するエントリを手作業で構築するまで、このテキストの一部を正しく分析しまたは処理することができないからである。同様に、この用語(または概念)の同義語(または下位語または反意語…)がテキスト内で使用されている場合に、この用語の関連する定義または他の有用な用語との関係の欠如に起因して、このテキストの意味全体が誤解されることがある。
【先行技術文献】
【非特許文献】
【0007】
【非特許文献1】http://protege.standford.edu
【発明の概要】
【発明が解決しようとする課題】
【0008】
したがって、本発明の目的は、オントロジの自動生成を可能にすることによってこの状況を改善することである。
【課題を解決するための手段】
【0009】
このために、本発明は、オントロジを自動的に生成する方法であって、オントロジを生成しなければならない用語が受け取られるたびに、
−この受け取られた用語の定義を辞書内で特定するステップと、次に、
−この特定された定義から関連用語を抽出するステップと、次に、
−これらの抽出された関連用語のそれぞれの定義を辞書内で特定するステップと、次に、
−受け取られた用語および抽出された関連用語の特定された定義のそれぞれについて、含まれる関連用語の対の間の関係を表す少なくとも1つの論理節を構築するステップであって、これらの構築される論理節は、受け取られた用語のオントロジを定義する、構築するステップと
からなる方法が提供される。
【0010】
本発明による方法は、考慮される追加の特性を別々にまたは組み合わせて含むことができ、特に、
−論理節を構築し終えた後に、それらの論理節を、選択されたオントロジ言語に変換することができ、
>変換テーブルによって論理節を変換することができ、
>オントロジ言語は、少なくともOWL(「Ontology Web Language」)およびRDF(「Resource Description Framework」)を含む言語群から選択することができる。
【0011】
本発明は、オントロジを自動的に生成するデバイスであって、オントロジを生成しなければならない用語が受け取られるたびに、
−この受け取られた用語の定義を特定するために辞書にアクセスすることと、次に、
−この特定された定義から関連用語を抽出することと、次に、
−抽出された関連用語のそれぞれの定義を特定するために辞書にアクセスすることと、次に、
−受け取られた用語および抽出された関連用語の特定された定義のそれぞれについて、含まれる関連用語の対の間の関係を表す少なくとも1つの論理節を構築することであって、これらの構築される論理節は、受け取られた用語のオントロジを定義する、構築することと
のために構成された分析手段を含むデバイスをも提供する。
【0012】
本発明によるデバイスは、考慮される追加の特性を別々にまたは組み合わせて含むことができ、特に、
−構築された論理節を、選択されたオントロジ言語に変換するように構成された変換手段をさらに含むことができ、
>変換手段は、変換テーブルによって論理節を変換するように構成することができ、
・変換テーブルを格納するように構成された格納手段をさらに含むことができ、
>オントロジ言語は、少なくともOWLおよびRDFを含む言語群から選択することができる。
【0013】
本発明は、上で紹介したものなどのデバイスを含むコンピュータ・ソフトウェア製品をも提供する。
【0014】
本発明の他の特徴および利益は、下の詳細な説明および添付図面を調べる時に明白になる。
【図面の簡単な説明】
【0015】
図1】本発明によるデバイスの実施形態の例を概略的に示す図である。
【発明を実施するための形態】
【0016】
添付図面は、本発明を完成させるだけではなく、必要な場合にその定義に寄与するようにも働く可能性がある。
【0017】
本発明は、辞書に含まれる用語定義からオントロジを自動的に生成することを意図された、デバイス(D)および関連する方法を提供することを目指す。
【0018】
本発明は、すべてのタイプの領域で操作される用語(または概念)およびこれらの用語(または概念)の間の関係を形式的な形で記述するすべてのオントロジを対象とする。
【0019】
本発明によるデバイスDを、たとえばテキストまたは文書の分析または処理を意図された機器またはアプリケーションの一部とするかそれに結合することができることに留意することが重要である。したがって、そのようなデバイスDを、ソフトウェア・モジュールまたは電子回路(1つまたは複数)(またはハードウェア・モジュール)またはハードエア・モジュールおよびソフトウェア・モジュールの組合せからなるコンピュータ電子製品とすることができる。
【0020】
唯一の図に概略的に示されているように、本発明によるデバイスDは、少なくとも分析モジュールAMを含む。
【0021】
分析モジュールAMは、デバイスDが、オントロジを生成しなければならない用語(または概念)を受け取るたびに介入するように構成される。したがって、ある用語が受け取られる時に、分析モジュールAMは、この受け取られた用語の定義を特定するために、少なくとも1つの辞書DCにアクセスする。図示されているように、辞書DCを、デバイスDの第1格納手段SM1に格納することができる。しかし、これは必須ではない。実際に、辞書DCを、デバイスDからアクセス可能な外部格納手段に、たとえば通信ネットワークを介して遠くのサーバに格納することもできる。
【0022】
少なくとも1つの辞書DCを格納でき、当業者から知られているすべてのタイプの第1格納手段SM1を使用することができる。したがって、第1格納手段SM1を、データベース、フラッシュ・メモリ、ROM、RAM、CD(「コンパクト・ディスク」)またはDVD(「ディジタル・ビデオ・ディスク」)、フラット・ファイル・システム、または任意の他の種類のリポジトリとすることができる。
【0023】
たとえば、分析モジュールAMが、「translation(翻訳)」という概念の「意味論」を記述するオントロジを構築しなければならない場合に、分析モジュールAMは、辞書DC(ここでは、第1格納手段SM1に格納される)内で概念「translation」の定義を特定する。この定義を、「The act of converting a text from one language to another(ある言語から別の言語へテキストを変換する行為)」とすることができる。
【0024】
次に、分析モジュールAMは、それが特定した用語(または概念)定義に含まれる関連用語を抽出する。このために、分析モジュールAMは、定義の意味論分析を実行することができる。「句内の関連用語」とは、句の「意味論的骨格」である単語または単語のセット(または「辞書編集的ストリング(lexical string)」)すなわち、主に名詞および動詞である。たとえば、文「The act of converting a text from one language to another(ある言語から別の言語へテキストを変換する行為)」では、関連用語は、「act of converting(変換する行為)」(すなわち、「conversion(変換)」または「convert(変換する)」)、「text」、および「language」である。
【0025】
したがって、概念「translation」について、その定義の関連用語は、「convert」、「text」、および「language」である。
【0026】
分析モジュールAMが、定義に含まれる関連用語を抽出し終えた時に、これらの抽出された関連用語のそれぞれの定義を特定するための辞書DCに対する分析モジュールAMの再度のアクセス。たとえば、概念「translation」の場合には、
−抽出された関連用語「convert」の定義は、「to transform or change something into another form,substance,state,or product(あるものを別の形、物質、状態、または産物に変形しまたは変更すること)」であり、
−抽出された関連用語「text」の定義は、「a written passage consisting of multiple characters,symbols or sentences(複数の文字、記号、または文からなる書かれた一節)」であり、
−抽出された関連用語「language」の定義は、「a system of communication using the spoken words or using symbols that represent words or sounds(単語または音を表す話された言葉または記号を使用することによるコミュニケーションの体系)」である。
【0027】
分析モジュールAMが、受け取られた用語(または概念)の定義から抽出された各関連用語の定義を特定し終えた時に、分析モジュールAMは、受け取られた用語(または概念)および抽出された関連用語の特定された定義のそれぞれについて、含まれる関連用語の対の間の関係を表す少なくとも1つの論理節を構築する。構築される論理節のセットは、受け取られた用語(または概念)のオントロジを定義する。用語「節」は、ここでは、ブルバキの集合論の意味で理解されなければならない。
【0028】
たとえば、概念「translation」の場合には、
−「translation」の定義は、次の論理節を与える。
>「translation is an act of converting(翻訳は、変換する行為である)」、
>「the conversion concerns a text(変換は、テキストに関係する)」、および
>「the text is converted from one language to another language(テキストは、ある言語から別の言語に変換される)」。
−「text」の定義は、次の論理節を与える。
>「a text is a written passage(テキストは、書かれた一節である)」、
>「the passage consists of several characters(一節は、複数の文字からなる)」、または
>「the passage consists of several symbols(一節は、複数の記号からなる)」、または
>「the passage consists of several sentences(一節は、複数の文からなる)」、
>「a sentence is a set of words(文は、単語のセットである)」、および
>「a sentence has a grammatical structure(文は、文法構造を有する)」。
【0029】
分析モジュールAMを、2つのサブモジュールすなわち、定義を特定するために辞書DCにアクセスする第1サブモジュールと、第1サブモジュールによって特定された定義に含まれる関連用語を抽出する第2サブモジュールとに分割できることに留意することが重要である。
【0030】
唯一の図の非限定的な例に示されているように、本発明によるデバイスDは、変換モジュールCMをも含むことができる。この変換モジュールCMは、論理節(分析モジュールAMによって構築された)を、たとえばOWL(「Ontology Web Language」)またはRDF(「Resource Description Framework」)などの選択されたオントロジ言語に変換することが意図されている。
【0031】
OWLおよびRDFが、W3C(「World Wide Web Consortium」)によって開発され、標準化された2つのオントロジ言語であることを想起されたい。
【0032】
論理節のセットの変換を実行するために、変換モジュールCMは、変換テーブルCTを使用することができる。図示されているように、そのような変換テーブルCTを、デバイスDの第2格納手段SM2に格納することができる。しかし、これは必須ではない。実際に、変換テーブルCTを、デバイスDからアクセス可能な外部格納手段に、たとえば通信ネットワークを介して遠くのサーバに格納することもできる。
【0033】
少なくとも1つの変換テーブルCTを格納でき、当業者から知られているすべてのタイプの第2格納手段SM2を使用することができる。したがって、第2格納手段SM2を、データベース、フラッシュ・メモリ、ROM、RAM、CDまたはDVD、フラット・ファイル・システム、または任意の他の種類のリポジトリとすることができる。
【0034】
第1格納手段SM1および第2格納手段SM2を、同一の格納手段の2つの部分とすることができることに留意することが重要である。
【0035】
変換モジュールCMは、出力を含み、この出力で、変換した論理節のセットを送達し、この出力は、そのデバイスDによって以前に受け取られた用語(または概念)に対応するオントロジONを定義する。
【0036】
唯一の図の非限定的な例に示されているように、本発明によるデバイスDは、変換モジュールCMが、それが変換した論理節のセットを格納できる第3格納手段SM3をも含むことができる。オントロジONを定義する(変換された)論理節のセットを格納でき、当業者から知られているすべてのタイプの第3格納手段SM3を使用することができる。したがって、第3格納手段SM3を、データベース、フラッシュ・メモリ、ROM、RAM、フラット・ファイル・システム、または任意の他の種類のリポジトリとすることができる。
【0037】
第1格納手段SM1および/または第2格納手段SM2および/または第3格納手段SM3を、同一の格納手段の2つまたは3つの部分とすることができることに留意することが重要である。
【0038】
OWL変換テーブルCTの一部の非限定的な例を、下に与える。
【0039】
【表1】
【0040】
この変換テーブルCTでは、各論理節が、OWLにおける対応物に変換される。
【0041】
変換テーブルCTのそのような例があれば、OWL内の用語「Translation」を説明する(すなわち、OWL内の変換された論理節を有する)オントロジONを含むXMLファイルの次の例を生成することが可能である(「<!−−・・・−−>」の内部の斜体のコメントは、論理節が変換モジュール(または、オントロジ・ジェネレータ)CMによってどのように解釈されるのかを示す)。
【0042】
<?xml version="1.0"?>
<rdf:RDF
xmlns="file:Domain_Translation.owl#"
xml:base="file:Domain_Translation.owl#"
xmlns:owl=http://www.w3.org/2002/07/owl#
xmlns:rdf=http://www.w3.org/1999/02/22-rdf-syntax-ns#
xmlns:rdfs=http://www.w3.org/2000/01/rdf-schema#
xmlns:xsd="http://www.w3.org/2001/XMLSchema#">

<owl:Ontology rdf:about="">
<rdfs:description>
Domain Ontology for Translation
</rdfs:description>
<rdfs:comment>This ontology has been fully generated from natural language by AutogenerativeOntologyBuilder.</rdfs:comment>
</owl:Ontology>

<owl:Class rdf:ID="Translation">
<rdfs:description>Translation is the name of the Domain addressed by this ontology.</rdfs:description>
</owl:Class>

<!-- heritage: Translation is-a-kind-of conversion -->
<owl:Class rdf:ID="conversion" />
<owl:Class rdf:about="#Translation">
<rdfs:subClassOf>
<owl:Class rdf:about="#conversion"/>
</rdfs:subClassOf>
</owl:Class>

<!-- synonym: conversion is-synonym-of act_of_converting -->
<owl:Class rdf:ID="act_of_converting" />
<owl:Class rdf:about="#conversion">
<equivalentClass rdf:resource="#act_of_converting"/>
</owl:Class>

<!-- obj_property: conversion concerns text -->
<owl:ObjectProperty rdf:ID="concerns">
<rdfs:domain rdf:resource="#conversion"/>
<rdfs:range rdf:resource="#text"/>
</owl:ObjectProperty>

<!-- assoc: text is_converted_from (1) language -->
<owl:Class rdf:ID="text" />
<owl:Class rdf:ID="language" />
<owl:ObjectProperty rdf:ID="is_converted_from">
<rdfs:domain rdf:resource="#text"/>
<rdfs:range rdf:resource="#language"/>
</owl:ObjectProperty>

<owl:Class rdf:about="#text">
<rdfs:subClassOf>
<owl:Restriction>
<owl:onProperty rdf:resource="#is_converted_from"/>
<owl:cardinality>1</owl:cardinality>
</owl:Restriction>
</rdfs:subClassOf>
</owl:Class>

<!-- assoc: text is_converted_to (1) language -->
<owl:ObjectProperty rdf:ID="is_converted_to">
<rdfs:domain rdf:resource="#text"/>
<rdfs:range rdf:resource="#language"/>
</owl:ObjectProperty>

<owl:Class rdf:about="#text">
<rdfs:subClassOf>
<owl:Restriction>
<owl:onProperty rdf:resource="#is_converted_to"/>
<owl:cardinality>1</owl:cardinality>
</owl:Restriction>
</rdfs:subClassOf>
</owl:Class>

<!-- heritage: text is-a-kind-of passage -->
<owl:Class rdf:ID="passage" />
<owl:Class rdf:about="#text">
<rdfs:subClassOf>
<owl:Class rdf:about="#passage"/>
</rdfs:subClassOf>
</owl:Class>

<!-- data_property: passage has the property: isWritten = written -->
<owl:DatatypeProperty rdf:ID="isWritten">
<rdfs:domain rdf:resource="#passage" />
<rdfs:range rdf:datatype="string"/>
<rdfs:description>
Written
</rdfs:description>
</owl:DatatypeProperty>

<!-- composition: passage isComposedOf (1..n) character -->
<owl:Class rdf:ID="character" />
<owl:ObjectProperty rdf:ID="isComposedOf">
<rdfs:domain rdf:resource="#passage"/>
<rdfs:range rdf:resource="#character"/>
</owl:ObjectProperty>

<owl:Class rdf:about="#passage">
<rdfs:subClassOf>
<owl:Restriction>
<owl:onProperty rdf:resource="#isComposedOf"/>
<owl:cardinality>1..n</owl:cardinality>
</owl:Restriction>
</rdfs:subClassOf>
</owl:Class>

<!-- composition: passage isComposedOf (1..n) symbol -->
<owl:Class rdf:ID="symbol" />
<owl:ObjectProperty rdf:about="#isComposedOf">
<rdfs:domain rdf:resource="#passage"/>
<rdfs:range rdf:resource="#symbol"/>
</owl:ObjectProperty>

<owl:Class rdf:about="#passage">
<rdfs:subClassOf>
<owl:Restriction>
<owl:onProperty rdf:resource="#isComposedOf"/>
<owl:cardinality>1..n</owl:cardinality>
</owl:Restriction>
</rdfs:subClassOf>
</owl:Class>

<!-- composition: passage isComposedOf (1..n) sentence -->
<owl:Class rdf:ID="sentence" />
<owl:ObjectProperty rdf:about="#isComposedOf">
<rdfs:domain rdf:resource="#passage"/>
<rdfs:range rdf:resource="#sentence"/>
</owl:ObjectProperty>

<owl:Class rdf:about="#passage">
<rdfs:subClassOf>
<owl:Restriction>
<owl:onProperty rdf:resource="#isComposedOf"/>
<owl:cardinality>1..n</owl:cardinality>
</owl:Restriction>
</rdfs:subClassOf>
</owl:Class>

<!-- composition: sentence isComposedOf (1..n) word -->
<owl:Class rdf:ID="word" />
<owl:ObjectProperty rdf:about="#isComposedOf">
<rdfs:domain rdf:resource="#sentence"/>
<rdfs:range rdf:resource="#word"/>
</owl:ObjectProperty>

<owl:Class rdf:about="#sentence">
<rdfs:subClassOf>
<owl:Restriction>
<owl:onProperty rdf:resource="#isComposedOf"/>
<owl:cardinality>1..n</owl:cardinality>
</owl:Restriction>
</rdfs:subClassOf>
</owl:Class>

<!-- obj_property: sentence has grammatical_structure -->
<owl:ObjectProperty rdf:ID="has">
<rdfs:domain rdf:resource="#sentence"/>
<rdfs:range rdf:resource="#grammatical_structure"/>
</owl:ObjectProperty>

<!-- data_property: sentence has the property: hasGrammaticalStructure = grammatical structure -->
<owl:DatatypeProperty rdf:ID="hasGrammaticalStructure">
<rdfs:domain rdf:resource="#sentence" />
<rdfs:range rdf:datatype="string"/>
<rdfs:description>
grammatical structure
</rdfs:description>
</owl:DatatypeProperty>

</rdf:RDF>
【0043】
概念「translation」に対応するオントロジONの上で述べた例を用いると、推論を行い、「what is a translation?(翻訳とは何か)」、「what is concerned by a translation?(翻訳は何に関係するのか)」、「what is the role of a text in the translation?(翻訳におけるテキストの役割は何か)」、「how languages are used in a translation?(言語は翻訳でどのように使用されるのか)」などの質問に答えることが可能になる。
【0044】
本発明を、オントロジを自動的に生成する方法に関して検討することもできる。
【0045】
そのような方法を、唯一の図を参照して上で説明したものなどのデバイスDによって実施することができる。したがって、その主な特性だけに、下で言及する。
【0046】
本発明による方法は、オントロジを生成しなければならない用語が受け取られるたびに、
−この受け取られた用語の定義を辞書DC内で特定するステップと、次に、
−この特定された定義から関連用語を抽出するステップと、次に、
−これらの抽出された関連用語のそれぞれの定義を辞書DC内で特定するステップと、次に、
−受け取られた用語および抽出された関連用語の特定された定義のそれぞれについて、含まれる関連用語の対の間の関係を表す少なくとも1つの論理節を構築するステップであって、これらの構築される論理節は、受け取られた用語のオントロジを定義する、構築するステップと
からなる。
【0047】
本発明は、処理時間を減らすことができるのでテキスト処理またはテキスト分析の性能を改善するだけではなく、テキストの「理解」の深さが増えるのでテキスト処理またはテキスト分析の性能を改善することを可能にする。たとえば、文法手法または意味論手法を用いて顧客電子メールを処理することを意図されたCRMアプリケーションの場合に、テキスト・プロセッサおよび文法アナライザの機能は、i)異なる用語および概念を一緒にリンクすることができ、ii)用語の間の関係を確立することができ、iii)分析の深さおよび妥当性を高めることができるので、特に改善される。さらに、オントロジの自動構築は、自然言語要求または自然言語処理の領域の強力なツールの使用を可能にする。
【0048】
本発明は、例としてのみ上で説明した方法およびデバイスの実施形態に限定されるのではなく、当業者によって添付の特許請求の範囲の範囲に含まれると考えられる可能性があるすべての代替実施形態を含む。
図1