【課題を解決するための手段】
【0010】
本発明によれば、クエリに基づいて文章を検索するようにコンピュータを機能させる検索プログラムにおいて、
文章識別子を付与された多数の文章を蓄積した文章集合蓄積手段と、
文章から、構成要素を抽出し、識別子を付与する構成要素抽出手段と、
述語項構造解析によって、文章から、格要素、格助詞及び述語からなる述語句を抽出する述語項構造解析手段と、
述語句について、構成要素と一致する格要素を、構成要素に対応する識別子に置換し、述語句に、文章中での述語句の出現順に昇順となる出現番号を付与する昇順述語句導出手段と、
出現番号と、述語と、文章識別子とを対応付けた述語テーブルを蓄積する検索インデックス蓄積手段と、
述語項構造解析によって、クエリから、クエリ格要素、クエリ格助詞及びクエリ述語からなるクエリ述語句を抽出するクエリ述語項構造解析手段と、
クエリ述語句について、構成要素と一致するクエリ格要素を、構成要素に対応する識別子に置換し、クエリ述語句に、クエリ中でのクエリ述語句の出現順に昇順となるクエリ出現番号を付与する昇順クエリ述語句導出手段と、
クエリ述語について、クエリ出現番号順に述語テーブルに対して検索し、クエリ述語と一致する述語に対応する文章識別子及び出現番号からなる検索対を抽出する検索手段と、
検索対を抽出した順に整列した際に、検索対の出現番号が昇順になっていれば、文章識別子を出力する出現順照合手段と
してコンピュータを機能させることを特徴とする。
【0011】
本発明の検索プログラムにおける他の実施形態によれば、文章中位置表現を蓄積した文章中位置表現蓄積手段を更に有し、
述語項構造解析手段は、更に、文章中に文章中位置表現があれば、その文章中位置表現を含む文又は句の前又は後で文章を分割し、分割した文章に文章中位置情報を付与し、
検索インデックス蓄積手段は、述語テーブルの述語に、更に文章中位置情報を対応付けて蓄積し、
クエリ述語項構造解析手段は、更に、クエリ中に文章中位置表現があれば、その文章中位置表現を含む文又は句の前又は後でクエリを分割し、分割したクエリ毎にクエリ中位置情報を付与し、
昇順クエリ述語句導出手段は、分割したクエリ毎に含まれるクエリ述語句に、クエリ中位置情報を更に付与し、
検索手段は、更に、クエリ中位置情報について、述語テーブルに対して検索し、クエリ中位置情報と一致する文章中位置情報に対応する文章識別子及び出現番号からなる検索対を抽出する
ようにコンピュータを機能させることも好ましい。
【0012】
本発明の検索プログラムにおける他の実施形態によれば、評価に関する意味属性と対応付けられている評価語を蓄積した評価極性辞書蓄積手段と、
昇順述語句導出手段は、更に、述語について、評価極性辞書蓄積手段に対して検索し、述語と評価語が一致する場合、その評価語に対応付けられている意味属性を述語に付与し、
検索インデックス蓄積手段は、更に、出現番号と、意味属性と、文章中位置情報と、文章識別子とを対応付けた意味属性テーブルを蓄積し、
昇順クエリ述語句導出手段は、更に、クエリ述語について、評価極性辞書蓄積手段に対して検索し、クエリ述語と評価語が一致する場合、その評価語に対応付けられている意味属性をクエリ意味属性としてクエリ述語に付与し、
検索手段は、更に、クエリ意味属性及びクエリ中位置情報について、意味属性テーブルに対して検索し、クエリ意味属性及びクエリ中位置情報と一致する意味属性及び文章中位置情報に対応する文章識別子及び出現番号からなる検索対を抽出する
ようにコンピュータを機能させることも好ましい。
【0013】
本発明の検索プログラムにおける他の実施形態によれば、検索インデックス蓄積手段は、更に、述語テーブル及び意味属性テーブル毎にスコアを有し、
検索手段は、更に、検索対にスコアを付与し、
出現順照合手段は、更に、スコアに基づいて、文章識別子毎に算出した文章識別子スコアを更に出力し、
文章識別子スコアを降順に整列したランキングを付与するランキング付与手段を更に有する
ようにコンピュータを機能させることも好ましい。
【0014】
本発明の検索プログラムにおける他の実施形態によれば、構成要素抽出手段によって抽出された構成要素を蓄積する構成要素蓄積手段を更に有し、
構成要素は、昇順述語
句導出手段及び昇順クエリ述語
句導出手段によって参照される
ようにコンピュータを機能させることも好ましい。
【0015】
本発明の検索プログラムにおける他の実施形態によれば、構成要素、格要素及びクエリ格要素は、名詞であり、
述語及びクエリ述語は、動詞、形容詞又はサ変動詞である
ようにコンピュータを機能させることも好ましい。
【0016】
本発明によれば、クエリに基づいて文章を検索する検索装置において、
文章識別子を付与された多数の文章を蓄積した文章集合蓄積手段と、
文章から、構成要素を抽出し、識別子を付与する構成要素抽出手段と、
述語項構造解析によって、文章から、格要素、格助詞及び述語からなる述語句を抽出する述語項構造解析手段と、
述語句について、構成要素と一致する格要素を、構成要素に対応する識別子に置換し、述語句に、文章中での述語句の出現順に昇順となる出現番号を付与する昇順述語句導出手段と、
出現番号と、述語と、文章識別子とを対応付けた述語テーブルを蓄積する検索インデックス蓄積手段と、
述語項構造解析によって、クエリから、クエリ格要素、クエリ格助詞及びクエリ述語からなるクエリ述語句を抽出するクエリ述語項構造解析手段と、
クエリ述語句について、構成要素と一致するクエリ格要素を、構成要素に対応する識別子に置換し、クエリ述語句に、クエリ中でのクエリ述語句の出現順に昇順となるクエリ出現番号を付与する昇順クエリ述語句導出手段と、
クエリ述語について、クエリ出現番号順に述語テーブルに対して検索し、クエリ述語と一致する述語に対応する文章識別子及び出現番号からなる検索対を抽出する検索手段と、
検索対を抽出した順に整列した際に、検索対の出現番号が昇順になっていれば、文章識別子を出力する出現順照合手段と
を有することを特徴とする。
【0017】
本発明によれば、コンピュータを用いてクエリに基づいて文章を検索する検索方法において、
文章識別子を付与された多数の文章を蓄積した文章集合蓄積部と、
検索インデックスを蓄積する検索インデックス蓄積部とを有し、
文章から、構成要素を抽出し、識別子を付与する第1のステップと、
述語項構造解析によって、文章から、格要素、格助詞及び述語からなる述語句を抽出する第2のステップと、
述語句について、構成要素と一致する格要素を、構成要素に対応する識別子に置換し、述語句に、文章中での述語句の出現順に昇順となる出現番号を付与する第3のステップと、
出現番号と、述語と、文章識別子とを対応付けた述語テーブルを蓄積する第4のステップと、
述語項構造解析によって、クエリから、クエリ格要素、クエリ格助詞及びクエリ述語からなるクエリ述語句を抽出する第5のステップと、
クエリ述語句について、構成要素と一致するクエリ格要素を、構成要素に対応する識別子に置換し、クエリ述語句に、クエリ中でのクエリ述語句の出現順に昇順となるクエリ出現番号を付与する第6のステップと、
クエリ述語について、クエリ出現番号順に述語テーブルに対して検索し、クエリ述語と一致する述語に対応する文章識別子及び出現番号からなる検索対を抽出する第7のステップと、
検索対を抽出した順に整列した際に、検索対の出現番号が昇順になっていれば、文章識別子を出力する第8のステップと
を有することを特徴とする。
【0018】
本発明によれば、クエリに基づいて文章を検索する検索サーバにおいて、
端末から利用者の操作に応じて入力されたクエリを受信するクエリ受信手段と、
文章識別子を付与された多数の文章を蓄積した文章集合蓄積手段と、
文章から、構成要素を抽出し、識別子を付与する構成要素抽出手段と、
述語項構造解析によって、文章から、格要素、格助詞及び述語からなる述語句を抽出する述語項構造解析手段と、
述語句について、構成要素と一致する格要素を、構成要素に対応する識別子に置換し、述語句に、文章中での述語句の出現順に昇順となる出現番号を付与する昇順述語句導出手段と、
出現番号と、述語と、文章識別子とを対応付けた述語テーブルを蓄積する検索インデックス蓄積手段と、
述語項構造解析によって、クエリから、クエリ格要素、クエリ格助詞及びクエリ述語からなるクエリ述語句を抽出するクエリ述語項構造解析手段と、
クエリ述語句について、構成要素と一致するクエリ格要素を、構成要素に対応する識別子に置換し、クエリ述語句に、クエリ中でのクエリ述語句の出現順に昇順となるクエリ出現番号を付与する昇順クエリ述語句導出手段と、
クエリ述語について、クエリ出現番号順に述語テーブルに対して検索し、クエリ述語と一致する述語に対応する文章識別子及び出現番号からなる検索対を抽出する検索手段と、
検索対を抽出した順に整列した際に、検索対の出現番号が昇順になっていれば、文章識別子を出力する出現順照合手段と
文章識別子を端末へ送信する文章識別子送信手段と
を有することを特徴とする。