特許6597978 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧 ▶ 国立大学法人京都大学の特許一覧

特許6597978構文解析装置、方法、及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6597978

(24)【登録日】2019年10月11日

(45)【発行日】2019年10月30日

(54)【発明の名称】構文解析装置、方法、及びプログラム

(51)【国際特許分類】

G06F 17/27 20060101AFI20191021BHJP

G06N 5/04 20060101ALI20191021BHJP

【ＦＩ】

G06F17/27 610

G06N5/04

G06F17/27 615

【請求項の数】5

【全頁数】15

(21)【出願番号】特願2016-223547(P2016-223547)

(22)【出願日】2016年11月16日

(65)【公開番号】特開2018-81505(P2018-81505A)

(43)【公開日】2018年5月24日

【審査請求日】2019年1月31日

(73)【特許権者】

【識別番号】000004226

【氏名又は名称】日本電信電話株式会社

(73)【特許権者】

【識別番号】504132272

【氏名又は名称】国立大学法人京都大学

(74)【代理人】

【識別番号】110001519

【氏名又は名称】特許業務法人太陽国際特許事務所

(72)【発明者】

【氏名】西野正彬

(72)【発明者】

【氏名】山本章博

【審査官】萩島豪

(56)【参考文献】

【文献】特開２０１０−０６６９７０（ＪＰ，Ａ）

【文献】特開平１１−０８５７４８（ＪＰ，Ａ）

【文献】特開平０７−０６４７９２（ＪＰ，Ａ）

【文献】特開２０１４−０２９６２２（ＪＰ，Ａ）

【文献】佐藤泰介，ベイジアンネットワークと離散構造処理系，人工知能学会誌第２５巻第６号，日本，（社）人工知能学会，２０１０年１１月１日，第25巻，pp.796-802

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｆ１７／２０ − １７／２８

Ｇ０６Ｎ５／０４

(57)【特許請求の範囲】

【請求項1】

終端記号の系列に対して、確率文脈自由文法に基づいた構文解析を行う構文解析装置であって、
入力された、確率文脈自由文法における非終端記号を書き換えるための生成規則に関する制約条件である論理制約を表す論理関数に対応する二分決定グラフを構築するＢＤＤ構築部と、
予め与えられた生成規則の集合と、前記終端記号の系列とに基づいて、予め定められた開始記号から前記終端記号の系列を得るまでの、前記生成規則の列を導出とし、前記終端記号の系列に対して可能な導出の集合を求め、
前記求められた前記可能な導出の集合に基づいて、前記導出において各生成規則が利用されることを、命題変数を用いて表現し、
前記命題変数を用いて前記終端記号の系列に対する正しい導出であるか否かを表現する論理関数を定義し、
前記定義された論理関数に対応する二分決定グラフを構築し、
前記ＢＤＤ構築部によって構築された前記二分決定グラフと、前記定義された論理関数に対応する前記二分決定グラフとの論理積となる前記二分決定グラフを用いて、前記制約条件を満たし、かつ、確率が最大となる導出を求める構文解析部と、
を含む構文解析装置。

【請求項2】

前記構文解析部は、前記終端記号の系列に含まれる前記終端記号の各々について、非終端記号を前記終端記号に書き換える生成規則が、前記導出において利用されることを表す命題変数と、前記終端記号の系列に含まれる部分系列の各々について、前記部分系列に対応して前記生成規則が、前記導出において利用されることを表す命題変数とを用いて、前記論理関数を定義する請求項１に記載の構文解析装置。

【請求項3】

終端記号の系列に対して、確率文脈自由文法に基づいた構文解析を行う構文解析装置における構文解析方法であって、
ＢＤＤ構築部が、入力された、確率文脈自由文法における非終端記号を書き換えるための生成規則に関する制約条件である論理制約を表す論理関数に対応する二分決定グラフを構築するステップと、
構文解析部が、予め与えられた生成規則の集合と、前記終端記号の系列とに基づいて、予め定められた開始記号から前記終端記号の系列を得るまでの、前記生成規則の列を導出とし、前記終端記号の系列に対して可能な導出の集合を求めるステップと、
前記構文解析部が、前記求められた前記可能な導出の集合に基づいて、前記導出において各生成規則が利用されることを、命題変数を用いて表現するステップと、
前記構文解析部が、前記命題変数を用いて前記終端記号の系列に対する正しい導出であるか否かを表現する論理関数を定義するステップと、
前記構文解析部が、前記定義された論理関数に対応する二分決定グラフを構築するステップと、
前記構文解析部が、前記ＢＤＤ構築部によって構築された前記二分決定グラフと、前記定義された論理関数に対応する前記二分決定グラフとの論理積となる前記二分決定グラフを用いて、前記制約条件を満たし、かつ、確率が最大となる導出を求めるステップと、
を含む構文解析方法。

【請求項4】

前記構文解析部が定義するステップは、前記終端記号の系列に含まれる前記終端記号の各々について、非終端記号を前記終端記号に書き換える生成規則が、前記導出において利用されることを表す命題変数と、前記終端記号の系列に含まれる部分系列の各々について、前記部分系列に対応して前記生成規則が、前記導出において利用されることを表す命題変数とを用いて、前記論理関数を定義する請求項３に記載の構文解析方法。

【請求項5】

コンピュータを、請求項１又は請求項２に記載の構文解析装置の各部として機能させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、構文解析装置、方法、及びプログラムに係り、特に、終端記号の系列に対して、構文解析を行うための構文解析装置、方法、及びプログラムに関する。

【背景技術】

【0002】

確率文脈自由文法は自然言語文の構文解析に用いられる基礎的な技術である。確率文脈自由文法Ｇは、Ｇ＝（Ｍ，Ｔ，Ｒ，Ｓ，Ｐ）からなる５つ組として定義される。ここでＭは非終端記号の集合、Ｔは終端記号の集合、Ｒは生成規則の集合、Ｓは開始記号、Ｐは生成規則に付与された確率値の集合である。確率文脈自由文法がチョムスキー標準形であるとすれば、生成規則は以下（１）〜（３）式のいずれかである。

【0003】

【数1】

・・・（１）

・・・（２）

・・・（３）

【0004】

ここでＡ、Ｂ、及びＣは非終端記号、αは終端記号、Ｓは開始記号、εは空列を表すものとする。

【0005】

各規則は、規則の左辺（以下では頭部とよぶ）の非終端記号Ａを右辺の記号列に書き換えることを表している。ある規則Ａ→ＢＣを適用するとは、非終端記号Ａを含む系列において、Ａを非終端記号の列ＢＣに書き換えることを表す。

【0006】

各規則に対してはその規則が適用される確率が付与されている。与えられた確率文脈自由文法において、規則の頭部が非終端記号Ａであるような規則の集合をｒ_１，．．．，ｒ_ｍとすると、各規則ｒ_ｉには出現確率ｗ_ｉが与えられる。ここで確率ｗ_ｉは

【0007】

【数2】

【0008】

を満たす。各確率は、非終端記号Ａが与えられたときに確率ｗ_ｉで生成規則ｒ_ｉを適用することを表している。

【0009】

ある確率文脈自由文法Ｇが与えられると、それを用いた構文解析が可能となる。すなわち、与えられた終端記号の列α_１，α_２，．．．，α_ｎに対して、開始記号Ｓから当該終端記号の列を導出するための生成規則の適用による非終端記号の書き換えの列を得ることができる。ある構文解析は、開始記号に対して適用した生成規則の列として表現することができる。この列を導出ともよぶ。また、生成規則の列に含まれる各規則に付与された確率の積として、その解析が得られる確率が定義される。

【0010】

確率文脈自由文法を用いることで自然言語文のように曖昧さのある対象に対する構文解析を行うことができるため、自然言語文の解析や、ＲＮＡ（リボ核酸）の二次構造予測などに用いられてきた。また、確率文脈自由文法が与えられたときに、ある系列に対する構文解析のうち、確率が最大となるものを発見する問題は、系列の長さをＮとするとＯ（Ｎ^３）の動的計画法を用いることで解くことができる。

【先行技術文献】

【非特許文献】

【0011】

【非特許文献1】Bryant, Randal E. "Graph-based algorithms for boolean function manipulation." Computers, IEEE Transactions on 100.8 (1986): 677-691.

【非特許文献2】Knuth, D. E. (2009). The Art of Computer Programming: Bitwise Tricks & Techniques;Binary Decision Diagrams, volume 4, fascicle 1.

【発明の概要】

【発明が解決しようとする課題】

【0012】

確率文脈自由文法を用いた構文解析には動的計画法を用いた効率的なアルゴリズムが存在し、系列の要素間の関係性を考慮した解析が可能であることから、様々な問題に利用される。一方で、既存の動的計画法に基づく構文解析アルゴリズムでは、適用される規則の間の制約条件を考慮することができなかった。ここで制約条件とは、例えばある規則ｒ∈Ｒが導出中に出現する回数に制限を加えたり、規則ｒ，ｓ∈Ｒが導出中で同時に出現することを禁止したりするものである。

【0013】

本発明は、上記事情を鑑みて成されたものであり、生成規則に関する任意の制約条件を考慮した構文解析を行うことができる構文解析装置、方法、及びプログラムを提供することを目的とする。

【課題を解決するための手段】

【0014】

上記目的を達成するために、第１の発明に係る構文解析装置は、終端記号の系列に対して、確率文脈自由文法に基づいた構文解析を行う構文解析装置であって、入力された、確率文脈自由文法における非終端記号を書き換えるための生成規則に関する制約条件である論理制約を表す論理関数に対応する二分決定グラフを構築するＢＤＤ構築部と、予め与えられた生成規則の集合と、前記終端記号の系列とに基づいて、予め定められた開始記号から前記終端記号の系列を得るまでの、前記生成規則の列を導出とし、前記終端記号の系列に対して可能な導出の集合を求め、前記求められた前記可能な導出の集合に基づいて、前記導出において各生成規則が利用されることを、命題変数を用いて表現し、前記命題変数を用いて前記終端記号の系列に対する正しい導出であるか否かを表現する論理関数を定義し、前記定義された論理関数に対応する二分決定グラフを構築し、前記ＢＤＤ構築部によって構築された前記二分決定グラフと、前記定義された論理関数に対応する前記二分決定グラフとの論理積となる前記二分決定グラフを用いて、前記制約条件を満たし、かつ、確率が最大となる導出を求める構文解析部と、を含んで構成されている。

【0015】

また、第１の発明に係る構文解析装置において、前記構文解析部は、前記終端記号の系列に含まれる前記終端記号の各々について、非終端記号を前記終端記号に書き換える生成規則が、前記導出において利用されることを表す命題変数と、前記終端記号の系列に含まれる部分系列の各々について、前記部分系列に対応して前記生成規則が、前記導出において利用されることを表す命題変数とを用いて、前記論理関数を定義するようにしてもよい。

【0016】

第２の発明に係る構文解析方法は、終端記号の系列に対して、確率文脈自由文法に基づいた構文解析を行う構文解析装置における構文解析方法であって、ＢＤＤ構築部が、入力された、確率文脈自由文法における非終端記号を書き換えるための生成規則に関する制約条件である論理制約を表す論理関数に対応する二分決定グラフを構築するステップと、構文解析部が、予め与えられた生成規則の集合と、前記終端記号の系列とに基づいて、予め定められた開始記号から前記終端記号の系列を得るまでの、前記生成規則の列を導出とし、前記終端記号の系列に対して可能な導出の集合を求めるステップと、前記構文解析部が、前記求められた前記可能な導出の集合に基づいて、前記導出において各生成規則が利用されることを、命題変数を用いて表現するステップと、前記構文解析部が、前記命題変数を用いて前記終端記号の系列に対する正しい導出であるか否かを表現する論理関数を定義するステップと、前記構文解析部が、前記定義された論理関数に対応する二分決定グラフを構築するステップと、前記構文解析部が、前記ＢＤＤ構築部によって構築された前記二分決定グラフと、前記定義された論理関数に対応する前記二分決定グラフとの論理積となる前記二分決定グラフを用いて、前記制約条件を満たし、かつ、確率が最大となる導出を求めるステップと、を含んで実行することを特徴とする。

【0017】

また、第２の発明に係る構文解析方法において、前記構文解析部が定義するステップは、前記終端記号の系列に含まれる前記終端記号の各々について、非終端記号を前記終端記号に書き換える生成規則が、前記導出において利用されることを表す命題変数と、前記終端記号の系列に含まれる部分系列の各々について、前記部分系列に対応して前記生成規則が、前記導出において利用されることを表す命題変数とを用いて、前記論理関数を定義するようにしてもよい。

【0018】

また、第３の発明に係るプログラムは、コンピュータを、第１の発明に係る構文解析装置の各部として機能させるためのプログラムである。

【発明の効果】

【0019】

本発明の構文解析装置、方法、及びプログラムによれば、生成規則に関する制約条件である論理制約を表す論理関数に対応する二分決定グラフを構築し、予め与えられた生成規則の集合と、終端記号の系列とに基づいて、予め定められた開始記号から終端記号の系列を得るまでの、生成規則の列を導出とし、終端記号の系列に対して可能な導出の集合を求め、求められた可能な導出の集合に基づいて、導出において各生成規則が利用されることを、命題変数を用いて表現し、命題変数を用いて終端記号の系列に対する正しい導出であるか否かを表現する論理関数を定義し、定義された論理関数に対応する二分決定グラフを構築し、構築された二分決定グラフと、定義された論理関数に対応する二分決定グラフとの論理積となる二分決定グラフを用いて、制約条件を満たし、かつ、確率が最大となる導出を求めることにより、生成規則に関する任意の制約条件を考慮した構文解析を行うことができる、という効果が得られる。

【図面の簡単な説明】

【0020】

【図1】二分決定グラフ（ＢＤＤ）の一例を示す図である。

【図2】本発明の実施の形態に係る構文解析装置の構成を示すブロック図である。

【図3】本発明の実施の形態に係る構文解析装置における構文解析処理ルーチンを示すフローチャートである。

【発明を実施するための形態】

【0021】

以下、図面を参照して本発明の実施の形態を詳細に説明する。

【0022】

＜本発明の実施の形態に係る概要＞

【0023】

まず、本発明の実施の形態における概要を説明する。

【0024】

本実施の形態で提案する、論理制約が存在するもとでの確率文脈自由文法に基づく構文解析の特徴は、まず確率文脈自由文法における各生成規則を命題変数に置き換えて、可能な導出の集合を、論理関数を用いて表現し、論理関数を二分決定グラフ(ＢＤＤ)とよばれるデータ構造を用いて表現することにある。二分決定グラフを用いて論理関数を表現することによって、可能な導出の集合のうち制約条件を満たし、かつ確率最大となる導出の検索を行うことができるようになる。

【0025】

＜本発明の実施の形態に係る原理＞

【0026】

次に、本発明の実施の形態における二分決定グラフ（ＢＤＤ）の原理を説明する。

【0027】

二分決定グラフ（ＢＤＤ）は論理関数を有向非巡回グラフとして表現するデータ構造である。Ｎ引数の論理関数

【0028】

【数3】

【0029】

は、Ｎ個の命題変数ｘ_１，．．．，ｘ_Ｎを引数として受け取り、０または１を出力する関数である。論理関数は命題変数と論理演算子を用いて記述することができる。例えばｘ_１，ｘ_２を引数として受け取り、ｘ１＝１かつｘ２＝１のときに１、それ以外のときに０を返すような論理関数は、

【0030】

【数4】

【0031】

として表現することができる。３引数の論理関数

【0032】

【数5】

【0033】

を表現するＢＤＤを図１に示す。ＢＤＤは２種類のノードからなる。

【0034】

そのノードを親とするようなアークが存在しないノードを終端ノードとよび、図中では四角で表現する。それ以外のノードを分岐ノードとよび、図中では丸で表現する。ＢＤＤは必ず記号

【0035】

【数6】

【0036】

が付与された２種類の終端ノードを含む。また、分岐ノードは必ずそのノードを親とする２つのアークを持つ。それぞれのアークは区別され、０枝、１枝とよばれる。図１中では０枝は破線、１枝は実線で表現される。各分岐ノードは論理関数のいずれかの引数である命題変数に対応しており、対応している変数は図１中では分岐ノードの丸の中に書かれた記号で表現されている。対応している変数をＢＤＤの分岐ノードのラベルとよぶ。また、最上位の分岐ノードをＢＤＤの根とよぶ。

【0037】

ＢＤＤ上で最上位のノードから、入力に応じた枝を辿ることによって、ある引数の値に対する論理関数の出力を得ることができる。例で挙げた論理関数に入力としてｘ＝１，ｙ＝１，ｚ＝１が与えられたときに図１のＢＤＤを用いて関数を評価する方法を示す。まず、根のラベルはｘであり、入力ではｘ＝１であることから、根から１枝を辿って図中で根の直下にある分岐ノードに遷移する。辿った先のノードのラベルはｙであり、入力はｙ＝１であることから、ノードから１枝を辿って

【数7】

終端ノードに遷移する。

【数8】

終端ノードに遷移した場合、関数は与えられた入力に対して１を返すことを示すため、入力ｘ＝１，ｙ＝１，ｚ＝１に対する出力は１であることが分かる。同様に、入力としてｘ＝１，ｙ＝０，ｚ＝０が与えられたとすると、ＢＤＤを根から順番に辿るとこの場合は

【0038】

【数9】

【0039】

終端ノードに到達する。

【0040】

【数10】

【0041】

終端ノードに到達したときには関数は０を返すことを示すため、入力ｘ＝１，ｙ＝０，ｚ＝０に対する出力は０であることが分かる。

【0042】

ＢＤＤを用いて論理関数を表現することで、上述した関数の評価のほかにも論理関数間の演算を行うことができたり、関数のモデル（関数が１を返すような引数の値の組合せの個数）を数えるなどの演算を高速に実行することが可能となる。

【0043】

＜本発明の実施の形態に係る構文解析装置の構成＞

【0044】

次に、本発明の実施の形態に係る構文解析装置の構成について説明する。図２に示すように、本発明の実施の形態に係る構文解析装置１００は、ＣＰＵと、ＲＡＭと、後述する構文解析処理ルーチンを実行するためのプログラムや各種データを記憶したＲＯＭと、を含むコンピュータで構成することが出来る。この構文解析装置１００は、機能的には図２に示すように文入力部１０と、論理制約入力部１２と、生成規則入力部１４と、演算部２０と、出力部５０とを備えている。

【0045】

文入力部１０は、解析の対象となる終端記号の系列（例えば、自然言語文）の入力を受け付ける。

【0046】

論理制約入力部１２は、確率文脈自由文法における非終端記号を書き換えるための生成規則に関する制約条件である論理制約を表す論理関数を受け付ける。論理関数の引数については後述する。

【0047】

生成規則入力部１４は、チョムスキー標準形で与えられる生成規則の集合を入力として受け取る。

【0048】

演算部２０は、生成規則記憶部２８と、ＢＤＤ構築部３０と、構文解析部３２とを含んで構成されている。

【0049】

生成規則記憶部２８は、生成規則入力部１４で受け付けた生成規則の集合を記憶している。

【0050】

ＢＤＤ構築部３０は、論理制約入力部１２で受け付けた論理関数に対応する二分決定グラフを構築する。

【0051】

構文解析部３２は、生成規則記憶部２８に記憶されている生成規則の集合と、文入力部１０で受け付けた終端記号の系列とに基づいて、予め定められた開始記号Ｓから当該終端記号の系列を得るまでに適用される生成規則の列を導出とし、終端記号の系列に対して可能な導出の集合を求め、求められた可能な導出の集合に基づいて、導出において各生成規則が利用されることを、命題変数を用いて表現し、命題変数を用いて終端記号の系列に対する正しい導出であるか否かを表現する論理関数を定義する。構文解析部３２は、定義された論理関数に対応する二分決定グラフを構築し、ＢＤＤ構築部３０によって構築された二分決定グラフと、定義された論理関数に対応する二分決定グラフとの論理積となる二分決定グラフを用いて、可能な導出の集合のうち、論理制約入力部１２で受け付けた論理関数が表す制約条件を満たし、かつ、確率が最大となる導出を求める。ここで、論理関数を定義する際には、終端記号の系列に含まれる終端記号α_ｉの各々について、非終端記号を終端記号α_ｉに書き換える生成規則ｒ_ｊが、導出において利用されることを表す命題変数ｄ_ｉｊと、終端記号の系列に含まれる部分系列α_ｉｊの各々について、部分系列α_ｉｊに対応して生成規則ｒ_ｌが、導出において利用されることを表す命題変数ｂ_ｉｊｌとを用いる。

【0052】

＜本発明の実施の形態に係る構文解析装置の作用＞

【0053】

次に、本発明の実施の形態に係る構文解析装置１００の作用について説明する。生成規則入力部１４が生成規則の集合を受け付けると、生成規則記憶部２８に生成規則の集合が記憶される。そして、構文解析装置１００は、図３に示す構文解析処理ルーチンを実行する。

【0054】

まず、ステップＳ１００では、文入力部１０が終端記号の系列を受け付け、論理制約入力部１２が論理制約を表す論理関数を受け付ける。受け付けた長さＮの終端記号の列をα_１，α_２，．．．，α_Ｎとする。Ｔを終端記号の集合とすると、各α_ｉはα_ｉ∈Ｔであるとする。また、生成規則記憶部２８に記憶されている生成規則の集合をＲとする。Ｒに含まれる生成規則のうち、非終端記号を終端記号に置き換える規則、すなわちＡ→αの形をしている規則をｑ_１，．．．，ｑ_Ｋとし，非終端記号を非終端記号のペアに置き換える規則、すなわちＡ→ＢＣの形をしている規則をｒ_１，．．．，ｒ_Ｍとする。論理制約は、後述する命題変数ｄ_ｉ，ｂ_ｉを引数とする任意の論理関数として表現されるものとする。

【0055】

次に、ステップＳ１０２では、ステップＳ１００で受け付けた論理制約を表す論理関数に対応する二分決定グラフを構築する。二分決定グラフの構築には、例えば非特許文献１に記載されているような二分決定グラフ構築のための既存手法を用いる。

【0056】

ステップＳ１０４では、ステップＳ１００で受け付けた生成規則の集合と、終端記号の系列とに基づいて、予め定められた開始記号Ｘから終端記号の系列を得るまでの、生成規則の列を導出とし、終端記号の系列に対して可能な導出の集合を求める。ここでは、Cocke-Younger-Kasami(CYK)アルゴリズムを実行して、生成規則の集合による可能な導出の集合を求める。CYKアルゴリズムは動的計画法によって文脈自由文法の構文解析を行うアルゴリズムである。終端記号の系列のｉ文字目からｊ文字目までからなる部分系列をα_ｉｊとすると、CYKアルゴリズムは任意の非終端記号を開始記号とする各部分系列への導出を再帰的に求める。すなわち、Ｓ_ｉｊ^（Ｘ）を、部分系列α_ｉｊに対する、非終端記号Ｘを開始記号とする導出において、最初に利用された生成規則のインデックスの集合であるとすると、(ｉ＜ｊ)であるときのＳ_ｉｊ^（Ｘ）は以下（４）式のように再帰的に求められる。

【0057】

【数11】

・・・（４）

【0058】

また、Ｓ_ｉｉ^（Ｘ）は、導出において利用される、非終端記号Ｘを終端記号α_ｉに書き換える生成規則のインデックスの集合であり、以下（５）式のように定義される。

【0059】

【数12】

・・・（５）

【0060】

すべてのＳ_ｉｊ^（Ｘ）の計算はＯ(Ｎ^３)時間で実行することができる。

【0061】

ステップＳ１０６では、求められた可能な導出の集合に基づいて、導出において各生成規則が利用されることを、命題変数を用いて表現する。命題変数は、終端記号の系列に含まれる終端記号α_ｉの各々について、非終端記号を終端記号α_ｉに書き換える生成規則ｒ_ｊが、導出において利用されることを表す命題変数ｄ_ｉｊと、終端記号の系列に含まれる部分系列α_ｉｊの各々について、部分系列α_ｉｊに対応して生成規則ｒ_ｌが、導出において利用されることを表す命題変数ｂ_ｉｊｌとを用いる。すなわち、命題変数ｄ_ｉｊは、終端記号α_ｉの各々ついて、

【0062】

【数13】

【0063】

であるような生成規則のインデックス

【0064】

【数14】

【0065】

に対して定義される。

【0066】

また、命題変数ｂ_ｉｊｌは、終端記号α_ｉからα_ｊについて、ｉ≠ｊであり各

【0067】

【数15】

【0068】

である場合において、生成規則のインデックスｌ∈Ｓ_ｉｊ^（Ｘ）に対応する生成規則ｒ_ｌ＝（Ｘ→ＹＺ）と、あるｋ：i≦ｋ≦ｊ−１について、

【0069】

【数16】

【0070】

である生成規則のインデックスｌに対して定義される。

【0071】

ステップＳ１０８では、ステップＳ１０６で得られた各命題変数ｄ_ｉｊ、ｂ_ｉｊｌを用いて、終端記号の系列に対する正しい導出であるか否かを表現する論理関数を定義する。ここでは、論理式間が満たすべき制約の条件をそれぞれ以下（６）〜（１１）のように設定することで、正しい導出を表現する論理関数を構成する。まず、各命題変数d_ｉ＊のうち、二つ以上が同時に真とならない制約を以下（６）式とする。

【0072】

【数17】

・・・（６）

【0073】

同様に、各命題変数ｂ_ｉｊ＊のうち、二つ以上が同時に真とならない制約を以下（７）式のように表す。

【0074】

【数18】

・・・（７）

【0075】

次に、各集合Ｓ_ｉｊ^（Ｘ）にインデックスが含まれる生成規則のうちいずれかが真となる制約を、以下（８）式のように表す。

【0076】

【数19】

・・・（８）

【0077】

同様にＳ_ｉｉ^（Ｘ）にインデックスが含まれる生成規則のうちいずれかが真となる制約を、以下（９）式のように表す。

【0078】

【数20】

・・・（９）

【0079】

また、命題変数ｂ_ｉｊｋに対し、ｒ_ｋ＝(Ｘ→ＹＺ)であるならば、以下（１０）式の制約を設定する。

【0080】

【数21】

・・・（１０）

【0081】

最後に、ｉ＜ｋ≦ｊ＜ｌであるような全てのｂ_ｉｊｍ，ｂ_ｋｌｎに対して、以下（１１）式の制約を設定する。

【0082】

【数22】

・・・（１１）

【0083】

上記（６）〜（１１）式を用いると、正しい導出に対応する規則の集合が与えられたときに真を返す論理関数は、命題変数ｄ_ｉｊ，ｂ_ｉｊｋを引数とする関数として以下（１２）のように表現できる。

【0084】

【数23】

・・・（１２）

【0085】

ステップＳ１１０では、ステップＳ１０８で定義された論理関数に対応する二分決定グラフを構築する。二分決定グラフの構築は、ステップＳ１０２と同様に非特許文献１に記載の既存手法を用いる。

【0086】

ステップＳ１１２では、ステップＳ１０２で構築された二分決定グラフと、ステップＳ１１０で構築された二分決定グラフとの論理積となる二分決定グラフを計算する。

【0087】

ステップＳ１１４では、ステップＳ１１２で構築された二分決定グラフを用いて、可能な導出のうち、ステップＳ１００で受け付けた論理関数が表す制約条件を満たし、かつ、確率が最大となる導出を求める。ステップＳ１１２で計算した二分決定グラフを用いることで、導出確率を最大とする導出は二分決定グラフのサイズに比例する動的計画法で求めることができる。このとき、Ｎ引数ｘ_１，．．．，ｘ_Ｎの論理関数ｆ(ｘ_１，．．．，ｘ_ｎ)が二分決定グラフで表されているとする。また、各ｘ_ｉについて重みｕ_ｉが定められているとすると、二分決定グラフを用いた、非特許文献２に記載されているアルゴリズム(非特許文献２の７ページに記載されている”AlgorithmB”を参照)を用いることで、以下（１３）〜（１５）式を解くことができる。

【0088】

【数24】

・・・（１３）

・・・（１４）

・・・（１５）

【0089】

本実施の形態の問題では、各命題変数ｘ_ｉについて対応する生成規則ｒ_ｊが定まるので、その生成規則の出現確率ｗ_ｊの対数をとり、出現確率ｗ_ｊの対数を命題変数ｘ_ｉに対応する重みｕ_ｉとして設定することによって、上記の定式化によって確率最大かつ制約条件を満たす導出を得ることが可能となる。

【0090】

以上説明したように、本発明の実施の形態に係る構文解析装置によれば、入力された生成規則に関する制約条件である論理制約を表す論理関数に対応する二分決定グラフを構築し、予め与えられた生成規則の集合と、終端記号の系列とに基づいて、予め定められた開始記号から終端記号の系列を得るまでの、生成規則の列を導出とし、終端記号の系列に対して可能な導出の集合を求め、求められた可能な導出の集合に基づいて、導出において各生成規則が利用されることを、命題変数を用いて表現し、命題変数を用いて終端記号の系列に対する正しい導出であるか否かを表現する論理関数を定義し、定義された論理関数に対応する二分決定グラフを構築し、構築された二分決定グラフと、定義された論理関数に対応する二分決定グラフとの論理積となる二分決定グラフを用いて、制約条件を満たし、かつ、確率が最大となる導出を求めることにより、生成規則に関する任意の制約条件を考慮した構文解析を行うことができる。

【0091】

なお、本発明は、上述した実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。

【0092】

例えば、上述した実施の形態における構文解析装置は、自然言語文に対して、構文解析を行う場合について説明したが、これに限定されるものではなく、自然言語文以外の終端記号の列を受け付けて、構文解析を行うようにしてもよい。例えば、ＲＮＡなどの二次構造予測など、何らかの構造に対して、構文解析を行うようにしてもよい。

【符号の説明】

【0093】

１０文入力部
１２論理制約入力部
１４生成規則入力部
２０演算部
２８生成規則記憶部
３０ＢＤＤ構築部
３２構文解析部
５０出力部
１００構文解析装置

【図1】

【図2】

【図3】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

特許第6597978号(P6597978)IP Force 特許公報掲載プロジェクト 2022.1.31 β版