特許5653709 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人京都大学の特許一覧 ▶ トヨタ自動車株式会社の特許一覧

特許5653709質問応答システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】5653709

(24)【登録日】2014年11月28日

(45)【発行日】2015年1月14日

(54)【発明の名称】質問応答システム

(51)【国際特許分類】

G06F 17/28 20060101AFI20141218BHJP

【ＦＩ】

G06F17/28 Z

【請求項の数】1

【全頁数】15

(21)【出願番号】特願2010-234383(P2010-234383)

(22)【出願日】2010年10月19日

(65)【公開番号】特開2012-88893(P2012-88893A)

(43)【公開日】2012年5月10日

【審査請求日】2013年7月3日

(73)【特許権者】

【識別番号】504132272

【氏名又は名称】国立大学法人京都大学

(73)【特許権者】

【識別番号】000003207

【氏名又は名称】トヨタ自動車株式会社

(74)【代理人】

【識別番号】100103894

【弁理士】

【氏名又は名称】家入健

(72)【発明者】

【氏名】河原達也

(72)【発明者】

【氏名】山田整

(72)【発明者】

【氏名】山口宇唯

(72)【発明者】

【氏名】中野雄介

【審査官】長由紀子

(56)【参考文献】

【文献】特開平０７−０９３３５１（ＪＰ，Ａ）

【文献】国際公開第２００７／０９９８１２（ＷＯ，Ａ１）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｆ１７／２０−２８

Ｇ０６Ｔ３／００−７／００

(57)【特許請求の範囲】

【請求項1】

利用者が質問を入力する質問入力手段と、
前記質問入力手段に入力された質問の構文を解析する構文解析手段と、
前記構文解析手段による解析結果に基づき、前記入力された質問の種類を判定する質問判定手段と、
前記質問判定手段により前記入力された質問の種類がＹｅｓ又はＮｏで回答できる種類であると判定された場合に、前記入力された質問の焦点を決定する焦点決定手段と、
前記焦点決定手段により決定された焦点に応じて、適切な回答文を生成する回答文生成手段と、
あらかじめ前記焦点となる文節の位置が設定された解析済み文を記憶する文例データベースと、を備え、
前記焦点決定手段は、前記入力された質問文と前記解析済み文との、それぞれの最終文節の働きの比較と、当該最終文節に係る文節の機能語の比較と、当該機能語の出現順とに基づいて、最も類似した解析文を抽出し、その解析された焦点位置に基づいて、前記入力された質問の焦点を決定する、
質問応答システム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、質問応答システムに関する。

【背景技術】

【0002】

近年、利用者がシステムに対して音声入力等により質問を行い、システムが質問に対する応答を行う質問応答システムが利用されている。
例えば、音声認識技術を用いたシステムとして、電話を使った航空券やホテルの予約などの自動応答システムがある。この自動応答システムは、利用者がシステムに対して要求を伝え、システムは利用者に要求内容の確認を行った後に予約などの処理を行う。また他の例として、利用者がｗｅｂでの検索を行う際に、クエリや質問を音声によってシステムに入力し、クエリや質問に応じた結果を返す質問応答システムも実用化されつつある。

【0003】

このような質問応答システムにおいて、利用者は質問応答システムに対して様々な形式で質問を行う。例えば利用者は、質問応答システムに対し、いつ、どこで、誰が、何を、どうして、どのように、という５Ｗ１Ｈについて回答を求める場合や、Ｙｅｓ又はＮｏの回答を求める質問（以下、Ｙｅｓ／Ｎｏ質問）をする場合がある。

【0004】

ここで特に、利用者がＹｅｓ／Ｎｏ質問を行った場合であって、質問応答システムによる回答がＮｏである場合には、単に質問応答システムがＮｏと回答するだけでは不十分なことがある。
例えば、利用者が質問応答システムに「風邪にはリンゴがいいの？」と尋ねた場合、質問応答システムはＮｏと回答するだけでは不十分であり、利用者は実際には「風邪にいいのは何か」を知りたがっている。したがって質問応答システムは、このＹｅｓ／Ｎｏ質問を「何を」を尋ねるＷｈａｔ質問であると判断し、「風邪にはミカンがいいそうです」と答える必要がある。すなわち質問応答システムは、利用者の知りたい箇所を特定し適切な内容を回答するために、表層ではＹｅｓ／Ｎｏ質問にみえる質問が、深層ではＷＨ質問（５Ｗ１Ｈ）としての役割を果たしているものとみなす必要がある。

【0005】

非特許文献１には、焦点の定義について記載されている。ここで焦点とは、利用者がしたＹｅｓ／Ｎｏ質問から利用者が本当に回答を得たい箇所であり、ＷＨ質問に置き換えられる箇所である。例えば「風邪にはリンゴがいいの？」という文は、「風邪には何がいいの？」という文に置き換えることができ、「リンゴが」の箇所が焦点となる。

【0006】

ここで、文の焦点解析は、主に言語学的な知見に基づいて行われている。非特許文献２には、焦点を用いた文脈解析の方法が記載されている。この焦点解析方法は文脈に基づいて焦点を解析する方法であり、述語にかかる最終文節を焦点とすることや、述語に係る助詞の頻度を用いることにより、焦点解析を行う。

【先行技術文献】

【非特許文献】

【0007】

【非特許文献1】福地肇著、「談話の構造」、大修館書店、1985年

【非特許文献2】吉田悦子、横山晶一、「主題・焦点を用いた文脈解析の一手法」、電子情報通信学会技術研究報告、ＮＬＣ９７−２９、1997年

【発明の概要】

【発明が解決しようとする課題】

【0008】

しかしながら従来の焦点解析の方法では、質問応答システムは、質問の焦点の推定において十分な推定精度を得ることができず、利用者が求めている回答を出力できない場合があった。

【課題を解決するための手段】

【0009】

本発明に係る質問応答システムは、利用者が質問を入力する質問入力手段と、前記質問入力手段に入力された質問の構文を解析する構文解析手段と、前記構文解析手段による解析結果に基づき、前記入力された質問の種類を判定する質問判定手段と、前記質問判定手段により前記入力された質問の種類がＹｅｓ又はＮｏで回答できる種類であると判定された場合に、前記入力された質問の焦点を決定する焦点決定手段と、前記焦点決定手段により決定された焦点に応じて、適切な回答文を生成する回答文生成手段と、あらかじめ前記焦点となる文節の位置が設定された解析済み文を記憶する文例データベースと、を備え、前記焦点決定手段は、前記入力された質問文と前記解析済み文との、それぞれの最終文節の働きの比較と、当該最終文節に係る文節の機能語の比較と、当該機能語の出現順とに基づいて、前記入力された質問の焦点を決定する。

【発明の効果】

【0010】

利用者による質問の焦点を精度良く推定し、回答することができる。

【図面の簡単な説明】

【0011】

【図1】実施の形態１にかかる質問応答システムのブロック図である。

【図2】実施の形態１にかかる質問タイプとキーワード例を示す図である。

【図3】実施の形態１にかかる焦点解析のフローチャートである。

【図4】実施の形態１にかかる焦点解析における最終文節の役割と文末例の図である。

【図5】実施の形態１にかかる焦点解析方法を示す図である。

【図6】実施の形態１にかかる回答文生成のフローチャートである。

【図7】実施の形態１にかかる文例データベースにおける解析済み文の学習フローチャートである。

【図8】実施の形態２にかかる焦点解析のフローチャートである。

【図9】実施の形態２にかかる焦点解析方法を示す図である。

【発明を実施するための形態】

【0012】

実施の形態１．
以下、図面を参照して本発明の実施の形態について説明する。
図１は音声認識を用いた質問応答システムのブロック図である。質問応答システム１０は、音声入力部１１と、音声認識部１２と、音響モデル１３と、言語モデル１４と、質問タイプ同定部１５と、焦点解析部１６と、回答文生成部１７と、文例データベース１８と、知識データベース１９と、音声合成部２０を備える。

【0013】

音声入力部１１は、マイク等により音声入力を行う質問入力手段である。例えば、音声入力部１１には「風邪にはりんごがいいの？」が入力される。利用者により音声入力部１１に入力された音声は、アナログ信号又はデジタル信号として、音声認識部１２に伝送される。

【0014】

音声認識部１２は、音声入力部１１により入力された音声信号の認識を行う構造解析手段である。音声認識部１２は、音響モデル１３と言語モデル１４を参照し、入力された音声信号の構造解析を行うことで質問を認識する。すなわち音声認識部１２は、音声入力部１１に音声が入力された場合には、入力された質問をテキスト化する。

【0015】

音響モデル１３は、単語の音響特徴についての統計モデルを格納する記憶部である。例えば音響モデル１３は、音韻を単位として、前後につながる音韻の種類およびその発生確率を記憶する。これにより音声認識部１２は、例えば次に入力される音声を予測して、音声認識を行うことができる。

【0016】

言語モデル１４は、言語の語順の統計モデルや規則を格納する記憶部である。音声認識部１２は、言語モデル１４に格納されたデータを用いることにより、次に入力される単語を予測することができる。これにより音声認識部１２は、認識対象となる語彙を絞り込んで音声認識を行う。

【0017】

質問タイプ同定部１５は、入力された質問を、あらかじめ定めた数種類の質問タイプに分類する質問判定手段である。
図２に、質問タイプ同定部１５による質問タイプの分類例を示す。質問タイプ同定部１５はこの分類例に基づき、音声認識部１２においてテキスト化された質問中に、「何」という言葉が使用されていれば質問タイプはＷｈａｔであると分類し、「どうして」という言葉が使用されていれば質問タイプはＷｈｙであると分類し、「どうやって」という言葉が使用されていれば質問タイプはＨｏｗであると分類し、「いくら」という言葉が使用されていれば質問タイプはＨｏｗｍｕｃｈであると分類し、「いつ」という言葉が使用されていれば質問タイプはＷｈｅｎであると分類し、いずれのキーワードも使用されていなければ質問タイプはＹｅｓ／Ｎｏ質問であると分類する。
なお、質問タイプの分類例は文例データベース１８に記憶されている。

【0018】

焦点解析部１６は、質問タイプ同定部１５により入力された質問のタイプがＹｅｓ／Ｎｏ質問であると分類された場合に焦点解析を行い、焦点の位置を決定する焦点決定手段である。より具体的には、焦点解析部１６は入力された質問について、入力された質問の最終文節の役割と、最終文節に直接係る文節の機能語（助詞と助動詞）のパターンに基づき、焦点となる文節の位置と、深層質問タイプ（利用者が本当に知りたいのは５Ｗ１Ｈのどの質問か、以下ＷＨ質問）を推定する。
例えば焦点解析部１６に入力された「風邪にはりんごがいいの？」が解析され、「りんごが」が焦点として抽出される。焦点解析部１６による焦点解析の方法については、後に詳述する。

【0019】

回答文生成部１７は、入力された質問に対する適切な回答を生成する回答文生成手段である。具体的には回答文生成部１７は、入力された質問がＹｅｓ／Ｎｏ質問であれば、質問をＷＨ質問に変換する。次に回答文生成部１７は、変換したＷＨ質問を、あらかじめ知識データベース１９に記憶されている複数の文と比較し、最も類似している平叙文を抽出する。
また回答文生成部１７は、入力された質問がＹｅｓ／Ｎｏ質問でなく、５Ｗ１Ｈを問う質問であれば、入力された質問を知識データベース１９に記憶されている複数の文と比較し、最も類似している平叙文を抽出する。回答文生成部１７による回答文の生成方法については、後に詳述する。

【0020】

文例データベース１８は、質問タイプの同定や焦点解析に用いるデータを記憶するデータベースある。文例データベース１８は、図２に示した質問タイプの分類と文末例を記憶する。また文例データベース１８は、解析済み文を記憶する。ここで文例データベース１８が記憶する解析済み文は、典型的には数百文である。
なお、文例データベース１８で記憶するものは、上記のものに限られない。

【0021】

知識データベース１９は、回答文生成部１７からの入力に基づき、文を抽出可能なデータベースである。例えば知識データベース１９には、百科事典やＷＥＢ上の文章が記録されている。なお知識データベース１９は、質問応答システム１０の外部に備えられ、ＷＥＢ全体から文を抽出するものとしてもよい。

【0022】

音声合成部２０は、生成した回答文を読み上げる音声合成部である。例えば音声合成部２０はスピーカーを備えており、回答文生成部１７が生成した回答文を、音声によって利用者に伝える。例えば音声合成部２０は、「風邪にはみかんがいいそうです」と発話する。

【0023】

次に、文の焦点位置を推定する方法について説明する。図３は、焦点を推定するためのフローチャートである。ここで焦点とは、文の中でＷＨ質問に置き換え可能であり、質問の答えがＮｏの場合に、回答となる文節である。

【0024】

利用者は、音声入力部１１に質問文を入力する（ステップＳ１）。ここで利用者は、質問文として「インドネシアの考古学では遺跡を発見した方にクレジットや評価がいくんですか。」を入力したものとする。以下、入力された質問を分析対象質問文とする。また、分析対象質問文はｓ_ｔとする。

【0025】

音声認識部１２において、音声入力部１１に分析対象質問文の音声認識を行う（ステップＳ２）。ここで音声認識部１２は、音響モデル１３及び言語モデル１４を参照して音声認識を行う。これにより音声入力部１１に分析対象質問文は、テキスト形式に変換され、質問タイプ同定部１５に出力される。

【0026】

質問タイプ同定部１５は、分析対象質問文のタイプを決定する（ステップＳ３）。質問タイプ同定部１５による質問タイプの決定は、図２に示したように、文例データベース１８に記憶された質問タイプの分類とキーワードに基づいて行う。

【0027】

次に質問タイプ同定部１５は、質問がＹｅｓ／Ｎｏ質問であるか否かを判定する（ステップＳ４）。質問がＹｅｓ／Ｎｏ質問でない場合には（ステップＳ４でＮｏ）、他のタイプの質問の応答処理に移行する（ステップＳ５）。

【0028】

分析対象質問文がＹｅｓ／Ｎｏ質問である場合には（ステップＳ４でＹｅｓ）、質問タイプ同定部１５は、分析対象質問文を焦点解析部１６に出力する。焦点解析部１６は、分析対象質問文の最終文節の役割を決定する（ステップＳ６）。
図４に、質問文の最終文節の役割と文末例の対応表を示す。最終文節は、動詞、存在、可能、名詞＋助動詞、形容詞、その他の６種類に分類されており、それぞれの分類には複数の文末例が登録されている。なお、判定不能の文末の場合はその他に分類される。
典型的には、最終文節の役割と文末例の対応表は、あらかじめ文例データベース１８に記憶されている。
図５は、機能語のパターンを利用した焦点解析方法を示す図である。「インドネシアの考古学では遺跡を発見した方にクレジットや評価がいくんですか。」という質問が入力されると、焦点解析部１６は「いくんですか」の役割を決定する。

【0029】

次に焦点解析部１６は、文例データベース１８に記憶されている解析済み文を読み込む（ステップＳ７）。解析済み文の集合は｛ｓ_ａ（ｉ）｝とする。ここで図５に示すように、解析済み文として「それじゃ掘った人にクレジットや評価がいくのでしょうか。」が読み込まれたものとする。

【0030】

焦点解析部１６は、読み込まれた解析済み文の最終文節の役割が、分析対象質問文の最終文節の役割と一致しているか否かを判定する（ステップＳ８）。
例えば図５に示すように、焦点解析部１６は、解析済み文の「それじゃ掘った人にクレジットや評価がいくのでしょうか。」の「いくのでしょうか」が、前述の「いくんですか」の役割と一致するか否かを判定する。ここで、「いくのでしょうか」と「いくんですか」の役割は一致したものとする。
分析対象質問文の最終文節と、解析済み文の最終文節の役割が一致していない場合には、ステップＳ１２に進む（ステップＳ８でＮｏ）。

【0031】

分析対象質問文の最終文節と、解析済み文の最終文節の役割が一致している場合には（ステップＳ８でＹｅｓ）、焦点解析部１６は、入力文書の最終文節に直接係る文節のうち、最終文節に最も近く、かつ、機能語のパターンを比較していない文節について、機能語のパターンを抽出する（ステップＳ９）。
入力文書の最終文節に直接係る文節とは、図５における、「考古学では」「方に」「評価が」が相当する。機能語とは助詞と助動詞であるので、「では」「に」「が」が相当する。ここで機能語の比較は、構文木の根から上に向かって行うため、「が」、「に」、「では」の順番になる。

【0032】

次に焦点解析部１６は、ステップＳ９で抽出した入力文書の機能語のパターンと、解析済み文の機能語のパターンが一致するかを比較する（ステップＳ１０）。パターンが一致していれば（ステップＳ１０でＹｅｓ）、焦点解析部は一致した文節数のカウントをインクリメントして記録し（ステップＳ１１）、一段上の文節についてステップ９の動作に戻る。
図５において焦点解析部１６は、分析対象質問文の「評価が」の「が」と、解析済み文の「評価が」の「が」を比較する。比較の結果、パターンが一致しているので、焦点解析部１６は、一致した文節数のカウントをインクリメントする。その後、焦点解析部１６はステップＳ９〜ステップＳ１１のループにより、分析対象質問文の「方に」の「に」と解析済み文の「人に」の「に」の比較を行う。さらに焦点解析部１６は、分析対象質問文の「考古学では」の「では」と、解析済み文の「それじゃ」の「じゃ」の比較を行う。したがって焦点解析部１６では、一致した文節数の２がカウントされ、その後「では」と「じゃ」の機能語パターンの比較結果が不一致となる。
機能語パターンが不一致となった場合には（ステップＳ１０でＮｏ）、ステップＳ１２に進む。

【0033】

次に焦点解析部１６は、まだ解析済み文があるか否かを判定する。焦点解析部１６は、解析済み文が他にあれば（ステップＳ１２でＹｅｓ）、ステップＳ７に戻る。
解析済み文が他に無ければ（ステップＳ１２でＮｏ）、ステップＳ１３に進む。このとき典型的には、１つの分析対象質問文に対し、複数の解析済み文が比較された状態である。したがって、焦点解析部１６にはそれぞれの解析済み文について、ステップＳ１１で行われた文節数のカウントが記録されている。機能語のパターンの一致率をＮ_ｆ（ｓ_ｔ，ｓ_ａ（ｉ））とする。

【0034】

焦点解析部１６は、複数の解析済み文のうち、ステップＳ１１でカウントされた文節数が最大である解析済み文を収集する（ステップＳ１３）。ここで解析済み文には、それぞれ焦点の位置があらかじめ設定されている。
焦点解析部１６は、複数の解析済み文の焦点の位置の多数決により、分析対象質問文の焦点の位置を推定する（ステップＳ１４）。例えば、解析済み文「それじゃ掘った人にクレジットや評価がいくのでしょうか。」が、焦点の位置の推定に用いられる場合であって、あらかじめ焦点の位置が「人に」であると設定されている場合には、分析対象質問文の「方に」の箇所に焦点があるものとして投票される。

【0035】

焦点解析部１６は、ステップＳ１４で推定された焦点の位置を、分析対象質問文の焦点の位置として出力する（ステップＳ１５）。

【0036】

以上の方法により、分析対象質問文と解析済み文を比較する際に、最終文節とこれに係る文節の機能語の一致率に着目して、分析対象質問文の焦点の位置を決定することができる。

【0037】

次に、回答文生成部１７が回答文を生成する方法について説明する。図６は、回答文を生成する処理のフローチャートである。なお、分析対象質問文は、Ｙｅｓ／Ｎｏ質問の形式であるものとする。

【0038】

回答文生成部１７は、焦点位置および深層質問タイプが解析済みの分析対象質問文を、焦点解析部１６から入力する。
回答文生成部１７は、入力された分析対象質問文をＹｅｓ／Ｎｏ質問の形式から、深層質問タイプに応じたＷＨ質問に変換する（ステップＳ２１）。次に、回答文生成部１７は、ＷＨ質問に変換された分析対象質問文を、自立語（疑問詞、名詞、形容詞、形容動詞、動詞）の列に変換する（ステップＳ２２）。

【0039】

回答文生成部１７は、知識データベース１９に記憶されている文より、分析対象質問文と最も近い平叙文を検索して選択する。具体的には、回答文生成部１７は、知識データベース１９に記憶されている文と、分析対象質問文を、順序を考えずにそれぞれ自立語の集合として比較する。
この比較により一致する自立語の数を、文の自立語の数で除算することで正規化したものを類似度とする。回答文生成部１７は、分析対象質問文を複数の文と比較し、もっとも類似度が高い文を選択する（ステップＳ２３）。

【0040】

次に、ステップＳ２３で選択された平叙文を、回答文とする（ステップＳ２４）。ここで音声合成部２０は、焦点に当たる語が見つけられた回答と一致しない場合は、「いいえ」と前につけて発話し、一致すれば「はい」と前につけて発話する。

【0041】

次に、文例データベース１８における解析済み文の生成法について述べる。

【0042】

図７は、解析済み文の学習のフローチャートである。
質問応答システム１０は、人間同士の会話から質問文を抽出し、Ｙｅｓ／Ｎｏ質問を収集する（ステップＳ３１）。次に質問応答システム１０は、収集した質問文から、順番に一つの質問文を選択する（ステップＳ３２）。

【0043】

質問応答システム１０は形態素解析を行う。すなわち質問応答システム１０は、入力文の単語列を認識し、個々の単語に品詞情報を付与する（ステップＳ３３）。次に質問応答システム１０は係り受け解析を行う（ステップＳ３４）。ここで係り受け解析とは、各文節間の係り受け構造を構築する処理である。
質問応答システム１０が自動で形態素解析と係り受け解析を実施した後、解析誤りがあれば、手動で修正を行う。

【0044】

次に、人手により、焦点の箇所と深層質問タイプを決定する（ステップＳ３５）。入力された各文から前提となる情報を除き、残った箇所のうち、疑問符に置き換えても不自然でないものを焦点とする。さらに、この焦点がどのような疑問詞に置き換えられるかによって、深層質問タイプを決定する。
文例データベース１８は、決定された焦点の箇所と深層質問タイプを登録する。

【0045】

質問応答システム１０は、全ての文について解析が終了したか否かを確認する（ステップＳ３６）。全ての文について解析が終了していれば、学習を終了する（ステップＳ３６でＹｅｓ）。全ての文について解析が終了していなければステップＳ３２に戻る。

【0046】

以上の方法により、文例データベース１８に解析済み文を追加することができる。

【0047】

これにより質問応答システム１０は、入力された質問と文例データベース１８に記憶された解析済み文の比較において、最終文節と最終文節に係る文節の機能語の一致率に着目して利用者の深層質問タイプと焦点を判定することができる。したがって質問応答システム１０は、利用者の質問に対して適切に回答することができる。
また質問応答システム１０は、文例データベース１８に解析済み文の学習データを蓄積することができ、これにより質問応答の精度を高めることができる。

【0048】

実施の形態２．
実施の形態１では、分析対象質問文と解析済み文を比較する際に、最終文節と、最終文節にかかる文節の機能語の一致率について注目した。実施の形態２では、各文節の内容的な類似度に注目する。
以下に、焦点解析部１６における焦点解析の具体的な手法を述べる。図８は、実施の形態２にかかる焦点解析のフローチャートである。なお、図３の焦点解析のフローチャートと同様の処理を行う箇所については、同一のステップ番号を付し、説明を省略する。

【0049】

利用者が音声入力部１１に質問文を入力する（ステップＳ１）。音声認識部１２は、音声認識を行う（ステップＳ２）。質問タイプ同定部１５は、分析対象質問文の質問タイプを決定する（ステップＳ３）。質問タイプ同定部１５において、質問がＹｅｓ／Ｎｏ質問であるか否かを判定する（ステップＳ４）。質問がＹｅｓ／Ｎｏ質問でない場合には（ステップＳ４でＮｏ）、他のタイプの質問の応答処理に移行する（ステップＳ５）。

【0050】

ステップＳ４において、入力文書がＹｅｓ／Ｎｏ質問である場合には、焦点解析部１６解析済み文を読み込む（ステップＳ４６）。

【0051】

焦点解析部１６は、最終文節間の類似度を計算する（ステップＳ４７）。ここで最終文節間の類似度は以下の方法により求める。
分析対象質問をｓ_ｔ、解析済み文の集合を｛ｓ_ａ（ｉ）｝とする。焦点解析部１６はｓ_ｔの最終文節と、これに直接係る最終文節から文節番号を付与する。ここで、文節番号ｊの文節をｐ_ｔ（ｊ）とする。ｓ_ａ（ｉ）の最終文節と、これに直接係る最終文節から文節番号を付与し、文節番号ｊの文節をｐ_ａ（ｉ，ｊ）とする。
次にｐ_ｔ（ｊ）の形態素数をＮ_uni-gram（ｐ_ｔ（ｊ））とする。また、ｐ_ｔ（ｊ）とｐ_ａ（ｉ，ｊ）の形態素一致数をＮ_uni-gram（ｐ_ｔ（ｊ），ｐ_ａ（ｉ，ｊ））とする。
ｐ_ｔ（ｊ）とｐ_ａ（ｉ，ｊ）の形態素一致率Ｓｉｍ（ｐ_ｔ（ｊ），ｐ_ａ（ｉ，ｊ））は以下の式で求められる。

【数1】

これを文節間類似度とする。

【0052】

図９は、類似度を利用した焦点解析方法の図である。ステップＳ４７により、図９における焦点解析部１６は入力文の「いくんですか」と、解析済み文の「いくのでしょうか」の文節間類似度（形態素一致率）の計算が行われる。ここで、文節間類似度は０．７であったものとする。

【0053】

次に焦点解析部１６は、文節間類似度（形態素一致率）が０か否かを判断する（ステップＳ４８）。最終文節間の文節間類似度が０ならば（ステップＳ４８でＹｅｓ）、ステップＳ５３に進む。

【0054】

文節間類似度が０でなければ（ステップＳ４８でＮｏ）、焦点解析部１６は、それぞれの質問文の最終文節に直接係る文節のうち、最終文節に最も近く、かつ、文節間類似度をまだ計算していない文節同士の文節間類似度を計算する（ステップＳ４９）。
ここで入力文書の最終文節に直接係る文節とは、図９において、「考古学では」「方に」「評価が」が相当する。比較は構文木の根から上に向かう順序で行い、「が」、「に」、「では」の順序となる。ここでは、入力文の「評価が」と解析済み文の「評価が」が比較される。

【0055】

焦点解析部１６は、文節間類似度が０か、最終文節に直接係る文節がまだあるかを確認する（ステップＳ５０）。文節間類似度が０でなく最終文節に直接係る文節があれば（ステップＳ５０でＮｏ）、焦点解析部１６は、全体文節数のカウントをインクリメントし（ステップＳ５１）、一段上の文節についてステップＳ４９の動作を行う。
図９において、入力文の「いくんですか」と解析済み文の「いくのでしょうか」は類似度が０でなく文節が終了していないので、焦点解析部１６ではカウントをインクリメントし、ステップＳ４９に戻る。その後ステップＳ４９〜ステップＳ５１のループにより、焦点解析部１６において、入力文の「評価が」と解析済み文の「評価が」および、入力文の「方に」と解析済み文の「人に」の類似度の計算と、カウントのインクリメントが行われる。さらに焦点解析部１６では、入力文の「考古学界では」と解析済み文の「それじゃ」の類似度を計算する。ここで、類似度はそれぞれ１、０．５、０であるものとする。

【0056】

焦点解析部１６は、文節間類似度が０か、または最終文節に係る文節が無ければ（ステップＳ５０でＹｅｓ）、各文節間類似度の積を計算して文間類似度を計算する（ステップＳ５２）。したがって焦点解析部１６は、入力文の「考古学界では」と解析済み文の「それじゃ」の類似度の計算後、文間類似度の計算を行う。

【0057】

文間類似度は以下の方法により求める。
焦点解析部１６は、ｓ_ｔとｓ_ａ（ｉ）の最終文節とこれに直接係る文節の文節間について、それぞれ最終文節から順に形態素一致率Ｓｉｍ（ｐ_ｔ（ｊ），ｐ_ａ（ｉ，ｊ））を計算し、０でなかった文節数Ｎ_ｂ（ｓ_ｔ，ｓ_ａ（ｉ））と、そこまでの形態素一致率の積Ｓｉｍ（ｓ_ｔ，ｓ_ａ（ｉ））を求める。
すなわち

【数2】

である。これを文間類似度とする。
次にステップＳ５３に進む。

【0058】

焦点解析部１６は、まだ解析済み文があるか否かを確認する（ステップＳ５３）。まだ解析済みの文があればステップＳ４７に戻る（ステップＳ５３でＹｅｓ）。

【0059】

解析済みの文が無ければ（ステップＳ５３でＮｏ）、焦点解析部１６は、文節数が最大、文間類似度が最大の文を収集する（ステップＳ５４）。すなわち焦点解析部１６は、Ｎ_ｂ（ｓ_ｔ，ｓ_ａ（ｉ））が最大となる解析済み文の中から、Ｓｉｍ（ｐ_ｔ（ｊ），ｐ_ａ（ｉ，ｊ））が最大の解析済み文を収集する。

【0060】

焦点解析部１６は、収集した解析済み文にあらかじめ設定された焦点の位置から、多数決で焦点位置を推定する。例えば図９において、解析済み文では「に」の位置が焦点に設定されているため、対応する入力文の「方に」の文節を、焦点であるとして投票する（ステップＳ５５）。
その後、焦点解析部１６は、焦点位置の投票結果に基づいて焦点位置を決定して出力する（ステップＳ５６）。

【0061】

これにより焦点解析部１６は、各文節の内容的な類似度を用いて、入力された質問の焦点を決定することができる。したがって質問応答システム１０は、文節の類似度に基づいて決定された焦点に基づいて、利用者への応答を行うことができる。

【0062】

実施の形態３．
実施の形態３では、実施の形態１で述べた最終文末および最終文末に係る文節の機能語の一致率に注目した焦点解析の方法と、実施の形態２で述べた各文節の内容的な類似度に注目した焦点解析の方法を、組み合わせた方法によって焦点解析を行う方法について述べる。

【0063】

まず、分析対象質問文をｓ_ｔ、解析済み文の集合を｛ｓ_ａ（ｉ）｝とする。
焦点解析部１６は、ｓ_ｔの最終文節と、これに直接かかる文節に最終文節から文節番号を付与し、文節番号ｊの文節をｐ_ｔ（ｊ）とする。また、ｓ_ａ（ｉ）の最終文節と、最終文節に直接係る文節に、最終文節から文節番号を付与し、文節番号ｊの文節をｐ_ａ（ｉ，ｊ）とする。

【0064】

次に、ｐ_ｔ（ｊ）の形態素数をＮ_uni-gram（ｐ_ｔ（ｊ））とする。ｐ_ｔ（ｊ）とｐ_ａ（ｉ，ｊ）の形態素一致数をＮ_uni-gram（ｐ_ｔ（ｊ），ｐ_ａ（ｉ，ｊ））とする。ただし、機能語が一致しない場合は０とする。
ｐ_ｔ（ｊ）とｐ_ａ（ｉ，ｊ）の形態素一致率Ｓｉｍ（ｐ_ｔ（ｊ），ｐ_ａ（ｉ，ｊ））は、以下の式で求められる。

【数3】

これを機能語に着目した文節間類似度と定義する。

【0065】

焦点解析部１６は、この機能語に着目した文節間類似度を使って、ｓ_ｔとｓ_ａ（ｉ）の文間類似度を以下のように計算する。
焦点解析部１６は、ｓ_ｔとｓ_ａ（ｉ）の最終文節と、最終文節に直接係る文節の文節間について、それぞれ最終文節から順に機能語に着目した形態素一致率Ｓｉｍ（ｐ_ｔ（ｊ），ｐ_ａ（ｉ，ｊ））を計算し、０でなかった文節数Ｎ_ｂ（ｓ_ｔ，ｓ_ａ（ｉ））とそこまでの機能語に着目した形態素一致率の積Ｓｉｍ（ｓ_ｔ，ｓ_ａ（ｉ））を求める。すなわち、

【数4】

である。ただし最終文節に関しては、役割が異なるか、形態素一致率が０ならば、文節間類似度を０とする。

【0066】

焦点解析部１６は、Ｎ_ｂ（ｓ_ｔ，ｓ_ａ（ｉ））が最大の解析済み文の中からＳｉｍ（ｓ_ｔ，ｓ_ａ（ｉ））が最大の解析済み文を収集し、多数決で焦点位置を決定する。

【0067】

これにより焦点解析部１６は、入力された質問と解析済み文の最終文節と最終文節に係る文節の機能語の一致率に注目しつつ、各文節の類似度を用いて、焦点の位置を決定することができる。
したがって質問応答システム１０は、機能語と類似度の両方を利用した焦点解析によって決定された焦点に基づいて、利用者の質問に回答することができる。

【0068】

なお、質問応答システム１０における任意の処理を、ハードウェアによって実現することも可能であり、ＣＰＵ（Central Processing Unit）にコンピュータプログラムを実行させることにより実現することも可能である。プログラムは、様々なタイプの非一時的なコンピュータ可読媒体（non-transitory computer readable medium）を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体（tangible storage medium）を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体（例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ）、光磁気記録媒体（例えば光磁気ディスク）、ＣＤ−ＲＯＭ（Read Only Memory）、ＣＤ−Ｒ、ＣＤ−Ｒ／Ｗ、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ（Programmable ROM）、ＥＰＲＯＭ（Erasable PROM）、フラッシュＲＯＭ、ＲＡＭ（random access memory））を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体（transitory computer readable medium）によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。

【0069】

なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、１つの文例データベース１８に、質問タイプの分類と文末例や、解析済み文等が記憶されているものとして説明したが、複数の文例データベースを用いても良い。

【符号の説明】

【0070】

１０質問応答システム
１１音声入力部
１２音声認識部
１３音響モデル
１４言語モデル
１５質問タイプ同定部
１６焦点解析部
１７回答文生成部
１８文例データベース
１９知識データベース
２０音声合成部

【図1】