特開2021-125001 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ＳＣＳＫ株式会社の特許一覧

特開2021-125001演算システム、及び演算プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】特開2021-125001(P2021-125001A)

(43)【公開日】2021年8月30日

(54)【発明の名称】演算システム、及び演算プログラム

(51)【国際特許分類】

G06F 16/332 20190101AFI20210802BHJP

【ＦＩ】

G06F16/332

【審査請求】有

【請求項の数】2

【出願形態】ＯＬ

【全頁数】45

(21)【出願番号】特願2020-18552(P2020-18552)

(22)【出願日】2020年2月6日

(11)【特許番号】特許第6789426号(P6789426)

(45)【特許公報発行日】2020年11月25日

(71)【出願人】

【識別番号】399104844

【氏名又は名称】ＳＣＳＫ株式会社

(74)【代理人】

【識別番号】100107364

【弁理士】

【氏名又は名称】斉藤達也

(72)【発明者】

【氏名】土居誉生

【テーマコード（参考）】

5B175

【Ｆターム（参考）】

5B175DA01

5B175HB03

(57)【要約】（修正有）

【課題】第１文及び第２文相互間の意味の類似性の度合いを把握することが可能となる演算システム及び演算プログラムを提供する。
【解決手段】チャットシステム１００において、第１文及び第２文の類似性の度合いである文間類似度を演算するサーバ装置２は、第１文及び第２文を取得する取得部２３１と、取得部２３１が取得した第１文及び第２文に基づいて、文間類似度を演算する演算部２３２と、を備える。演算部２３２は、取得部２３１が取得した第１文に含まれている第１単語列と、取得部２３１が取得した第２文に含まれている第２単語列との類似性の度合いである単語列間類似度に基づいて、第２文意味第１文側被含有尺度を演算する第１演算処理と、単語列間類似度に基づいて、第１文意味第２文側被含有尺度を演算する第２演算処理と、第２文意味第１文側被含有尺度と第１文意味第２文側被含有尺度とに基づいて、文間類似度を演算する第３演算処理と、を行う。
【選択図】図１

【特許請求の範囲】

【請求項1】

【請求項2】

前記演算手段は、
前記第１演算処理において、前記単語列間類似度に基づいて、前記第２単語列の意味が前記第１文に含まれる程度を示す第２単語列意味第１文側被含有尺度を演算し、演算した前記第２単語列意味第１文側被含有尺度に基づいて、前記第２文意味第１文側被含有尺度を演算し、
前記第２演算処理において、前記単語列間類似度に基づいて、前記第１単語列の意味が前記第２文に含まれる程度を示す第１単語列意味第２文側被含有尺度を演算し、演算した前記第１単語列意味第２文側被含有尺度に基づいて、前記第１文意味第２文側被含有尺度を演算する、
請求項１に記載の演算システム。

【請求項3】

前記演算手段は、
前記第１演算処理において、前記第２単語列意味第１文側被含有尺度に基づいて、前記取得手段が取得した前記第２文に含まれている前記第２単語列の集合である第２単語列群の意味が前記第１文に含有されている程度を示す第２単語列群意味第１文側被含有尺度を演算し、演算した前記第２単語列群意味第１文側被含有尺度に基づいて、前記第２文意味第１文側被含有尺度を演算し、
前記第２演算処理において、前記第１単語列意味第２文側被含有尺度に基づいて、前記取得手段が取得した前記第１文に含まれている前記第１単語列の集合である第１単語列群の意味が前記第２文に含有されている程度を示す第１単語列群意味第２文側被含有尺度を演算し、演算した前記第１単語列群意味第２文側被含有尺度に基づいて、前記第１文意味第２文側被含有尺度を演算する、
請求項２に記載の演算システム。

【請求項4】

前記演算手段は、
前記第１演算処理において、
前記第１文における１個の前記第１単語列を示す分散表現の第１ベクトルと、前記第２文における１個の前記第２単語列を示す分散表現の第２ベクトルとのコサイン類似度に基づく第１演算値を演算する第１演算処理側第１処理と、
前記第１演算処理側第１処理において、前記第１文に含まれている前記第１単語列を順次適用して、当該第１演算処理側第１処理を前記第１単語列の個数に対応する回数分繰り返し実行し、前記第１単語列の個数分の前記第１演算値を演算する第１演算処理側第２処理と、
前記第１演算処理側第２処理で演算された前記第１単語列の個数分の前記第１演算値の内の最大値を、前記第２文における１個の前記第２単語列の意味が前記第１文に含まれる程度を示す前記第２単語列意味第１文側被含有尺度とする第１演算処理側第３処理と、を行い、
前記第２演算処理において、
前記コサイン類似度に基づく第２演算値を演算する第２演算処理側第１処理と、
前記第２演算処理側第１処理において、前記第２文に含まれている前記第２単語列を順次適用して、当該第２演算処理側第１処理を前記第２単語列の個数に対応する回数分繰り返し実行し、前記第２単語列の個数分の前記第２演算値を演算する第２演算処理側第２処理と、
前記第２演算処理側第２処理で演算された前記第２単語列の個数分の前記第２演算値の内の最大値を、前記第１文における１個の前記第１単語列の意味が前記第２文に含まれる程度を示す前記第１単語列意味第２文側被含有尺度とする第２演算処理側第３処理と、を行う、
請求項３に記載の演算システム。

【請求項5】

前記演算手段は、
前記第１演算処理において、
前記第２文に含まれている前記第２単語列を順次適用して、前記第１演算処理側第１処理、前記第１演算処理側第２処理、及び前記第１演算処理側第３処理を、前記第２単語列の個数に対応する回数分繰り返し実行し、前記第２単語列の個数分の前記第２単語列意味第１文側被含有尺度を演算する第１演算処理側第４処理と、
前記第１演算処理側第４処理で演算した前記第２単語列の個数分の前記第２単語列意味第１文側被含有尺度についての平均に対応する演算を行うことにより、前記第２単語列群意味第１文側被含有尺度を演算する第１演算処理側第５処理と、を更に行い、
前記第２演算処理において、
前記第１文に含まれている前記第１単語列を順次適用して、前記第２演算処理側第１処理、前記第２演算処理側第２処理、及び前記第２演算処理側第３処理を、前記第１単語列の個数に対応する回数分繰り返し実行し、前記第１単語列の個数分の前記第１単語列意味第２文側被含有尺度を演算する第２演算処理側第４処理と、
前記第２演算処理側第４処理で演算した前記第１単語列の個数分の前記第１単語列意味第２文側被含有尺度についての平均に対応する演算を行うことにより、前記第１単語列群意味第２文側被含有尺度を演算する第２演算処理側第５処理と、を更に行う、
請求項４に記載の演算システム。

【請求項6】

前記演算手段は、
前記第１演算処理において、前記第１演算処理側第１処理乃至前記第１演算処理側第５処理を実行し、前記第１単語列に含まれる単語の個数であるｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の前記第２単語列群意味第１文側被含有尺度を演算し、演算した前記第２単語列群意味第１文側被含有尺度についての平均に対応する演算を行うことにより、前記第２文意味第１文側被含有尺度を演算し、
前記第２演算処理において、前記第２演算処理側第１処理乃至前記第２演算処理側第５処理を実行し、前記第２単語列に含まれる単語の個数であるｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の前記第１単語列群意味第２文側被含有尺度を演算し、演算した前記第１単語列群意味第２文側被含有尺度についての平均に対応する演算を行うことにより、前記第１文意味第２文側被含有尺度を演算し、
前記第３演算処理において、前記第１演算処理にて演算された前記第２文意味第１文側被含有尺度と、前記第２演算処理にて演算された前記第１文意味第２文側被含有尺度との平均を前記文間類似度として演算する、
請求項５に記載の演算システム。

【請求項7】

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、演算システム、及び演算プログラムに関する。

【背景技術】

【0002】

従来、文書間の類似性の度合いである類似度を用いて、似た文書を検索する技術が知られていた（例えば、特許文献１）。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０１９−８５７２号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、特許文献１の技術においては、「ＢｈａｔｔａｃｈａｒｙｙａＣｏｅｆｆｉｃｉｅｎｔ等の類似度」等を用いて文書相互間で比較して似た文書を検索していたので、より粒度の小さい文同士の類似性の度合いを把握する点において改善の余地があった。

【0005】

本発明は、上記に鑑みてなされたものであって、第１文及び第２文相互間の意味の類似性の度合いを把握することが可能となる演算システム、及び演算プログラムを提供することを目的とする。

【課題を解決するための手段】

【0006】

【0007】

請求項２に記載の演算システムは、請求項１に記載の演算システムにおいて、前記演算手段は、前記第１演算処理において、前記単語列間類似度に基づいて、前記第２単語列の意味が前記第１文に含まれる程度を示す第２単語列意味第１文側被含有尺度を演算し、演算した前記第２単語列意味第１文側被含有尺度に基づいて、前記第２文意味第１文側被含有尺度を演算し、前記第２演算処理において、前記単語列間類似度に基づいて、前記第１単語列の意味が前記第２文に含まれる程度を示す第１単語列意味第２文側被含有尺度を演算し、演算した前記第１単語列意味第２文側被含有尺度に基づいて、前記第１文意味第２文側被含有尺度を演算する。

【0008】

請求項３に記載の演算システムは、請求項２に記載の演算システムにおいて、前記演算手段は、前記第１演算処理において、前記第２単語列意味第１文側被含有尺度に基づいて、前記取得手段が取得した前記第２文に含まれている前記第２単語列の集合である第２単語列群の意味が前記第１文に含有されている程度を示す第２単語列群意味第１文側被含有尺度を演算し、演算した前記第２単語列群意味第１文側被含有尺度に基づいて、前記第２文意味第１文側被含有尺度を演算し、前記第２演算処理において、前記第１単語列意味第２文側被含有尺度に基づいて、前記取得手段が取得した前記第１文に含まれている前記第１単語列の集合である第１単語列群の意味が前記第２文に含有されている程度を示す第１単語列群意味第２文側被含有尺度を演算し、演算した前記第１単語列群意味第２文側被含有尺度に基づいて、前記第１文意味第２文側被含有尺度を演算する。

【0009】

請求項４に記載の演算システムは、請求項３に記載の演算システムにおいて、前記演算手段は、前記第１演算処理において、前記第１文における１個の前記第１単語列を示す分散表現の第１ベクトルと、前記第２文における１個の前記第２単語列を示す分散表現の第２ベクトルとのコサイン類似度に基づく第１演算値を演算する第１演算処理側第１処理と、前記第１演算処理側第１処理において、前記第１文に含まれている前記第１単語列を順次適用して、当該第１演算処理側第１処理を前記第１単語列の個数に対応する回数分繰り返し実行し、前記第１単語列の個数分の前記第１演算値を演算する第１演算処理側第２処理と、前記第１演算処理側第２処理で演算された前記第１単語列の個数分の前記第１演算値の内の最大値を、前記第２文における１個の前記第２単語列の意味が前記第１文に含まれる程度を示す前記第２単語列意味第１文側被含有尺度とする第１演算処理側第３処理と、を行い、前記第２演算処理において、前記コサイン類似度に基づく第２演算値を演算する第２演算処理側第１処理と、前記第２演算処理側第１処理において、前記第２文に含まれている前記第２単語列を順次適用して、当該第２演算処理側第１処理を前記第２単語列の個数に対応する回数分繰り返し実行し、前記第２単語列の個数分の前記第２演算値を演算する第２演算処理側第２処理と、前記第２演算処理側第２処理で演算された前記第２単語列の個数分の前記第２演算値の内の最大値を、前記第１文における１個の前記第１単語列の意味が前記第２文に含まれる程度を示す前記第１単語列意味第２文側被含有尺度とする第２演算処理側第３処理と、を行う。

【0010】

請求項５に記載の演算システムは、請求項４に記載の演算システムにおいて、前記演算手段は、前記第１演算処理において、前記第２文に含まれている前記第２単語列を順次適用して、前記第１演算処理側第１処理、前記第１演算処理側第２処理、及び前記第１演算処理側第３処理を、前記第２単語列の個数に対応する回数分繰り返し実行し、前記第２単語列の個数分の前記第２単語列意味第１文側被含有尺度を演算する第１演算処理側第４処理と、前記第１演算処理側第４処理で演算した前記第２単語列の個数分の前記第２単語列意味第１文側被含有尺度についての平均に対応する演算を行うことにより、前記第２単語列群意味第１文側被含有尺度を演算する第１演算処理側第５処理と、を更に行い、前記第２演算処理において、前記第１文に含まれている前記第１単語列を順次適用して、前記第２演算処理側第１処理、前記第２演算処理側第２処理、及び前記第２演算処理側第３処理を、前記第１単語列の個数に対応する回数分繰り返し実行し、前記第１単語列の個数分の前記第１単語列意味第２文側被含有尺度を演算する第２演算処理側第４処理と、前記第２演算処理側第４処理で演算した前記第１単語列の個数分の前記第１単語列意味第２文側被含有尺度についての平均に対応する演算を行うことにより、前記第１単語列群意味第２文側被含有尺度を演算する第２演算処理側第５処理と、を更に行う。

【0011】

請求項６に記載の演算システムは、請求項５に記載の演算システムにおいて、前記演算手段は、前記第１演算処理において、前記第１演算処理側第１処理乃至前記第１演算処理側第５処理を実行し、前記第１単語列に含まれる単語の個数であるｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の前記第２単語列群意味第１文側被含有尺度を演算し、演算した前記第２単語列群意味第１文側被含有尺度についての平均に対応する演算を行うことにより、前記第２文意味第１文側被含有尺度を演算し、前記第２演算処理において、前記第２演算処理側第１処理乃至前記第２演算処理側第５処理を実行し、前記第２単語列に含まれる単語の個数であるｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の前記第１単語列群意味第２文側被含有尺度を演算し、演算した前記第１単語列群意味第２文側被含有尺度についての平均に対応する演算を行うことにより、前記第１文意味第２文側被含有尺度を演算し、前記第３演算処理において、前記第１演算処理にて演算された前記第２文意味第１文側被含有尺度と、前記第２演算処理にて演算された前記第１文意味第２文側被含有尺度との平均を前記文間類似度として演算する。

【0012】

請求項７に記載の演算プログラムは、第１文及び第２文の類似性の度合いである文間類似度を演算する演算プログラムであって、コンピュータを、前記第１文及び前記第２文を取得する取得手段と、前記取得手段が取得した前記第１文及び前記第２文に基づいて、前記文間類似度を演算する演算手段と、として機能させ、前記演算手段は、前記取得手段が取得した前記第１文に含まれている複数の単語の内のｎ個（ｎは正の整数）の連続する単語からなる第１単語列と、前記取得手段が取得した前記第２文に含まれている複数の単語の内のｎ個（ｎは正の整数）の連続する単語からなる第２単語列との類似性の度合いである単語列間類似度に基づいて、前記第２文の意味が前記第１文に含まれる程度を示す第２文意味第１文側被含有尺度を演算する第１演算処理と、前記単語列間類似度に基づいて、前記第１文の意味が前記第２文に含まれる程度を示す第１文意味第２文側被含有尺度を演算する第２演算処理と、前記第１演算処理にて演算された前記第２文意味第１文側被含有尺度と、前記第２演算処理にて演算された前記第１文意味第２文側被含有尺度とに基づいて、前記文間類似度として演算する第３演算処理と、を行う。

【発明の効果】

【0013】

請求項１に記載の演算システム、及び請求項７に記載の演算システムによれば、単語列間類似度に基づいて第２文意味第１文側被含有尺度を演算し、また、単語列間類似度に基づいて第１文意味第２文側被含有尺度を演算した上で、これらの演算結果に基づいて文間類似度を演算することにより、例えば、少なくとも単語列の単位（つまり、比較的小さい粒度の単位）の類似度を用いて文間類似度を演算するので、第１文及び第２文相互間の意味の類似性の度合いを的確に把握することが可能となる。また、第２文意味第１文側被含有尺度及び第１文意味第２文側被含有尺度に基づいて文間類似度を演算するので、第１文及び第２文相互間の意味の類似性の度合いをより的確に把握することが可能となる。

【0014】

請求項２に記載の演算システムによれば、単語列間類似度に基づいて第２単語列意味第１文側被含有尺度を演算し、演算結果に基づいて第２文意味第１文側被含有尺度を演算し、また、単語列間類似度に基づいて第１単語列意味第２文側被含有尺度を演算し、演算結果に基づいて第１文意味第２文側被含有尺度を演算することにより、例えば、単語列の単位（つまり、比較的小さい粒度の単位）で意味が文に含まれる程度を考慮することができるので、第１文及び第２文相互間の意味の類似性の度合いを的確に把握することが可能となる。

【0015】

請求項３に記載の演算システムによれば、第２単語列意味第１文側被含有尺度に基づいて第２単語列群意味第１文側被含有尺度を演算し、演算結果に基づいて第２文意味第１文側被含有尺度を演算し、また、第１単語列意味第２文側被含有尺度に基づいて第１単語列群意味第２文側被含有尺度を演算し、演算結果に基づいて第１文意味第２文側被含有尺度を演算することにより、例えば、単語列群の単位（つまり、単語列よりも大きな粒度の単位）で意味が文に含まれる程度も考慮することができるので、第１文及び第２文相互間の意味の類似性の度合いを的確に把握することが可能となる。

【0016】

請求項４に記載の演算システムによれば、第１単語列の個数分の第１演算値（コサイン類似度に基づく演算値）の内の最大値を、第２文における１個の第２単語列の意味が第１文に含まれる程度を示す第２単語列意味第１文側被含有尺度とし、また、第２単語列の個数分の第２演算値（コサイン類似度に基づく演算値）の内の最大値を、第１文における１個の第１単語列の意味が第２文に含まれる程度を示す第１単語列意味第２文側被含有尺度とすることにより、例えば、第２単語列意味第１文側被含有尺度、及び第１単語列意味第２文側被含有尺度を適切に演算することができるので、第１文及び第２文相互間の意味の類似性の度合いを的確に把握することが可能となる。

【0017】

請求項５に記載の演算システムによれば、第２単語列の個数分の第２単語列意味第１文側被含有尺度を演算し、演算した第２単語列意味第１文側被含有尺度についての平均に対応する演算を行うことにより第２単語列群意味第１文側被含有尺度を演算し、また、第１単語列の個数分の第１単語列意味第２文側被含有尺度を演算し、演算した第１単語列意味第２文側被含有尺度についての平均に対応する演算を行うことにより第１単語列群意味第２文側被含有尺度を演算することにより、例えば、第２単語列群意味第１文側被含有尺度、及び第１単語列群意味第２文側被含有尺度を適切に演算することができるので、第１文及び第２文相互間の意味の類似性の度合いを的確に把握することが可能となる。

【0018】

請求項６に記載の演算システムによれば、ｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の第２単語列群意味第１文側被含有尺度を演算し、演算した第２単語列群意味第１文側被含有尺度についての平均に対応する演算を行うことにより第２文意味第１文側被含有尺度を演算し、また、ｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の第１単語列群意味第２文側被含有尺度を演算し、演算した第１単語列群意味第２文側被含有尺度についての平均に対応する演算を行うことにより第１文意味第２文側被含有尺度を演算した上で、第２文意味第１文側被含有尺度と第１文意味第２文側被含有尺度との平均を文間類似度として演算することにより、例えば、第２文意味第１文側被含有尺度、及び第１文意味第２文側被含有尺度を適切に演算することができるので、第１文及び第２文相互間の意味の類似性の度合いを的確に把握することが可能となる。

【図面の簡単な説明】

【0019】

【図1】本発明の実施の形態がチャットシステムのブロック図である。

【図2】単語間類似度特定情報を例示した図である。

【図3】共起度特定情報を例示した図である。

【図4】逆文書頻度特定情報を例示した図である。

【図5】質問回答特定情報を例示した図である。

【図6】回答出力処理のフローチャートである。

【図7】文間類似度を演算するための数式を例示した図である。

【図8】入力文意味蓄積文側被含有尺度演算処理のフローチャートである。

【図9】入力文意味蓄積文側被含有尺度演算処理の演算例を説明するための図である。

【図10】蓄積文意味入力文側被含有尺度演算処理のフローチャートである。

【図11】蓄積文意味入力文側被含有尺度演算処理の演算例を説明するための図である。

【発明を実施するための形態】

【0020】

以下、本発明に係る演算システム、及び演算プログラムの実施の形態について図面を参照しつつ詳細に説明する。ただし、実施の形態によって本発明が限定されるものではない。ここでは、基本的概念、及び用語を説明した後に、具体的な実施の形態について説明する。

【0021】

（基本的概念）
まず、基本的概念について説明する。本発明に係る演算システムは、文間類似度を演算するシステムであり、例えば、文間類似度を演算する専用システム、あるいは、汎用的に用いられるシステム（一例としては、汎用コンピュータ、サーバコンピュータ、あるいは、ネットワーク上に分散配置された複数のコンピュータ（つまり、いわゆるクラウドコンピュータ）等）に対して、演算プログラムをインストールして文間類似度を演算する機能を実装することにより実現されるシステム等を含む概念である。また、演算システムは、例えば、取得手段、及び演算手段を備える。

【0022】

「取得手段」とは、第１文及び第２文を取得する手段である。

【0023】

「演算手段」とは、取得手段が取得した第１文及び第２文に基づいて、文間類似度を演算する手段であり、具体的には、第１演算処理、第２演算処理、及び第３演算処理を行う手段である。

【0024】

「第１演算処理」とは、取得手段が取得した第１文に含まれている複数の単語の内のｎ個（ｎは正の整数）の連続する単語からなる第１単語列と、取得手段が取得した第２文に含まれている複数の単語の内のｎ個（ｎは正の整数）の連続する単語からなる第２単語列との類似性の度合いである単語列間類似度に基づいて、第２文の意味が第１文に含まれる程度を示す第２文意味第１文側被含有尺度を演算する処理である。また、「第１演算処理」とは、例えば、単語列間類似度に基づいて、第２単語列の意味が第１文に含まれる程度を示す第２単語列意味第１文側被含有尺度を演算し、演算した第２単語列意味第１文側被含有尺度に基づいて、第２文意味第１文側被含有尺度を演算する処理等を含む概念である。また、「第１演算処理」とは、例えば、第２単語列意味第１文側被含有尺度に基づいて、取得手段が取得した第２文に含まれている第２単語列の集合である第２単語列群の意味が第１文に含有されている程度を示す第２単語列群意味第１文側被含有尺度を演算し、演算した第２単語列群意味第１文側被含有尺度に基づいて、第２文意味第１文側被含有尺度を演算する処理等を含む概念である。

【0025】

また、「第１演算処理」とは、例えば、第１演算処理側第１処理、第１演算処理側第２処理、及び第１演算処理側第３処理等を含む概念である。「第１演算処理側第１処理」とは、例えば、第１文における１個の第１単語列を示す分散表現の第１ベクトルと、第２文における１個の第２単語列を示す分散表現の第２ベクトルとのコサイン類似度に基づく第１演算値を演算する処理である。「第１演算処理側第２処理」とは、例えば、第１演算処理側第１処理において、第１文に含まれている第１単語列を順次適用して、当該第１演算処理側第１処理を第１単語列の個数に対応する回数分繰り返し実行し、第１単語列の個数分の第１演算値を演算する処理である。「第１演算処理側第３処理」とは、例えば、第１演算処理側第２処理で演算された第１単語列の個数分の第１演算値の内の最大値を、第２文における１個の第２単語列の意味が第１文に含まれる程度を示す第２単語列意味第１文側被含有尺度とする処理である。

【0026】

また、「第１演算処理」とは、例えば、第１演算処理側第４処理、及び第１演算処理側第５処理を更に含む概念である。「第１演算処理側第４処理」とは、例えば、第２文に含まれている第２単語列を順次適用して、第１演算処理側第１処理、第１演算処理側第２処理、及び第１演算処理側第３処理を第２単語列の個数に対応する回数分繰り返し実行し、第２単語列の個数分の第２単語列意味第１文側被含有尺度を演算する処理である。「第１演算処理側第５処理」とは、例えば、第１演算処理側第４処理で演算した第２単語列の個数分の第２単語列意味第１文側被含有尺度についての平均に対応する演算を行うことにより第２単語列群意味第１文側被含有尺度を演算する処理である。

【0027】

また、「第１演算処理」とは、例えば、第１演算処理側第１処理乃至第１演算処理側第５処理を実行し、第１単語列に含まれる単語の個数であるｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の第２単語列群意味第１文側被含有尺度を演算し、演算した第２単語列群意味第１文側被含有尺度についての平均に対応する演算を行うことにより、第２文意味第１文側被含有尺度を演算する処理等を含む概念である。

【0028】

「第２演算処理」とは、単語列間類似度に基づいて、第１文の意味が第２文に含まれる程度を示す第１文意味第２文側被含有尺度を演算する処理である。また、「第２演算処理」とは、例えば、単語列間類似度に基づいて、第１単語列の意味が第２文に含まれる程度を示す第１単語列意味第２文側被含有尺度を演算し、演算した第１単語列意味第２文側被含有尺度に基づいて、第１文意味第２文側被含有尺度を演算する等を含む概念である。「第２演算処理」とは、例えば、第１単語列意味第２文側被含有尺度に基づいて、取得手段が取得した第１文に含まれている第１単語列の集合である第１単語列群の意味が第２文に含有されている程度を示す第１単語列群意味第２文側被含有尺度を演算し、演算した第１単語列群意味第２文側被含有尺度に基づいて、第１文意味第２文側被含有尺度を演算する処理等を含む概念である。

【0029】

また、「第２演算処理」とは、例えば、第２演算処理側第１処理、第２演算処理側第２処理、及び第２演算処理側第３処理等を含む概念である。「第２演算処理側第１処理」とは、例えば、コサイン類似度に基づく第２演算値を演算する処理である。「第２演算処理側第２処理」とは、例えば、第２演算処理側第１処理において、第２文に含まれている第２単語列を順次適用して、当該第２演算処理側第１処理を第２単語列の個数に対応する回数分繰り返し実行し、第２単語列の個数分の第２演算値を演算する処理である。「第２演算処理側第３処理」とは、例えば、第２演算処理側第２処理で演算された第２単語列の個数分の第２演算値の内の最大値を、第１文における１個の第１単語列の意味が第２文に含まれる程度を示す第１単語列意味第２文側被含有尺度とする処理である。

【0030】

また、「第２演算処理」とは、例えば、第２演算処理側第４処理、及び第２演算処理側第５処理を更に含む概念である。「第２演算処理側第４処理」とは、例えば、第１文に含まれている第１単語列を順次適用して、第２演算処理側第１処理、第２演算処理側第２処理、及び第２演算処理側第３処理を第１単語列の個数に対応する回数分繰り返し実行し、第１単語列の個数分の第１単語列意味第２文側被含有尺度を演算する処理である。「第２演算処理側第５処理」とは、例えば、第２演算処理側第４処理で演算した第１単語列の個数分の第１単語列意味第２文側被含有尺度についての平均に対応する演算を行うことにより第１単語列群意味第２文側被含有尺度を演算する処理である。

【0031】

また、「第２演算処理」とは、例えば、第２演算処理側第１処理乃至第２演算処理側第５処理を実行し、第２単語列に含まれる単語の個数であるｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の第１単語列群意味第２文側被含有尺度を演算し、演算した第１単語列群意味第２文側被含有尺度についての平均に対応する演算を行うことにより第１文意味第２文側被含有尺度を演算する処理等を含む概念である。

【0032】

「第３演算処理」とは、第１演算処理にて演算された第２文意味第１文側被含有尺度と、第２演算処理にて演算された第１文意味第２文側被含有尺度とに基づいて、文間類似度を演算する処理である。また、「第３演算処理」とは、例えば、第１演算処理にて演算された第２文意味第１文側被含有尺度と、第２演算処理にて演算された第１文意味第２文側被含有尺度との平均を文間類似度として演算する処理等を含む概念である。

【0033】

（用語）
次に、用語について説明する。

【0034】

「第１文」及び「第２文」は、演算システムでの処理の対象となる文であり、例えば、各々１個ずつの文、２個以上ずつの文、相互に異なる個数ずつの文、あるいは、相互に同じ個数の文等を含む概念である。「第１文」の一例としては、例えば、「ｃｈｅｃｋｏｕｔはいつ」等が該当する。なお、「第２文」の一例としては、例えば、「チェックインチェックアウトは何時」等が該当する。なお、以下では、単語列、及び単語列群の説明では、第１文の一例を用いて説明する。

【0035】

「第１単語列」とは、第１文に含まれている複数の単語の内のｎ個（ｎは正の整数）の連続する単語からなる単語列各々である。「第１単語列」の一例としては、例えば、前述の「ｃｈｅｃｋｏｕｔはいつ」において、「ｎ」＝「１」の場合の「ｃｈｅｃｋｏｕｔ」、「は」、「いつ」各々、「ｎ」＝「２」の場合の「ｃｈｅｃｋｏｕｔ＋は」、「は＋いつ」各々、及び「ｎ」＝「３」の場合の「ｃｈｅｃｋｏｕｔ＋は＋いつ」等が該当する。なお、ここで例示している「＋」については、単語各々を含んでいることを意味していることとし、つまり、「ｃｈｅｃｋｏｕｔ＋は」は、「ｃｈｅｃｋｏｕｔ」と「は」を含んでいることを意味していることとして以下説明する。

【0036】

また、以下では、例えば、「ｎ」＝「１」の単語列（上述の「ｃｈｅｃｋｏｕｔ」等）を「単語１グラム」とも称し、また、「ｎ」＝「２」の単語列（上述の「ｃｈｅｃｋｏｕｔ＋は」等）を「単語２グラム」とも称し、同様にして、「ｎ」＝「３」、「４」、・・・の単語列を「単語３グラム」、「単語４グラム」、・・・とも称して説明する。また、「ｎ」の値を抽象化する場合、「単語ｎグラム」と称して説明する（つまり、単語ｎグラムにおいて「ｎ」＝「１」が上述の単語１グラムとなる）。

【0037】

また、「単語」とは、文を形成する基本的単位であり、例えば、意味、形、機能等の任意の観点に基づいて定まる単位等を含む概念である。

【0038】

「第２単語列」とは、第２文に含まれている複数の単語の内のｎ個（ｎは正の整数）の連続する単語からなる単語列各々である。

【0039】

「第１単語列群」とは、第１文に含まれている第１単語列の集合である。「第１単語列群」の一例としては、前述の「ｃｈｅｃｋｏｕｔはいつ」において、「ｃｈｅｃｋｏｕｔ」、「は」、「いつ」、「ｃｈｅｃｋｏｕｔ＋は」、「は＋いつ」、及び「ｃｈｅｃｋｏｕｔ＋は＋いつ」からなる集合等が該当する。「第２単語列群」とは、第２文に含まれている第２単語列の集合である。

【0040】

「文間類似度」とは、第１文及び第２文の相互間の意味が類似している度合いを示す概念である。「文間類似度」とは、例えば、第２文意味第１文側被含有尺度と、第１文意味第２文側被含有尺度との平均に対応する数値情報として求められる概念であり、具体的な演算については実施の形態で説明する（以下の単語列間類似度、及び各尺度の演算も同様とする）。

【0041】

「単語列間類似度」とは、第１単語列と第２単語列との類似性の度合いであり、具体的には、第１単語列の意味と第２単語列の意味との類似性の度合いであり、例えば、第１単語列を示す分散表現の第１ベクトルと、第２単語列を示す分散表現の第２ベクトルとのコサイン類似度に基づいて演算される数値情報である。

【0042】

「第２文意味第１文側被含有尺度」とは、第２文の意味が第１文に含まれる程度を示す尺度であり、つまり、第１文が第２文の意味を含む程度を示す尺度であり、例えば、少なくとも単語列間類似度に基づいて演算される数値情報等を含む概念であり、詳細には、第２単語列意味第１文側被含有尺度に基づいて演算される数値情報等を含む概念であり、より詳細には、第２単語列群意味第１文側被含有尺度に基づいて演算される数値情報等を含む概念である。

【0043】

「第２単語列群意味第１文側被含有尺度」とは、第２単語列群の意味が第１文に含有されている程度を示す尺度であり、つまり、第１文が第２単語列群の意味を含む程度を示す尺度であり、例えば、第２単語列意味第１文側被含有尺度に基づいて演算される数値情報等を含む概念である。

【0044】

「第２単語列意味第１文側被含有尺度」とは、第２単語列の意味が第１文に含まれる程度を示す尺度であり、つまり、第１文が第２単語列の意味を含む程度を示す尺度であり、例えば、単語列間類似度に基づいて演算される数値情報等を含む概念である。

【0045】

「第１文意味第２文側被含有尺度」とは、第１文の意味が第２文に含まれる程度を示す尺度であり、つまり、第２文が第１文の意味を含む程度を示す尺度であり、例えば、少なくとも単語列間類似度に基づいて演算される数値情報等を含む概念であり、詳細には、第１単語列意味第２文側被含有尺度に基づいて演算される数値情報等を含む概念であり、より詳細には、第１単語列群意味第２文側被含有尺度に基づいて演算される数値情報等を含む概念である。

【0046】

「第１単語列群意味第２文側被含有尺度」とは、第１単語列群の意味が第２文に含有されている程度を示す尺度であり、つまり、第２文が第１単語列群の意味を含む程度を示す尺度であり、例えば、第１単語列意味第２文側被含有尺度に基づいて演算される数値情報等を含む概念である。

【0047】

「第１単語列意味第２文側被含有尺度」とは、第１単語列の意味が第２文に含まれる程度を示す尺度であり、つまり、第２文が第１単語列の意味を含む程度を示す尺度であり、例えば、単語列間類似度に基づいて演算される数値情報等を含む概念である。

【0048】

そして、この演算処理の適用対象は任意であるが、例えば、演算処理をいわゆるチャットボットシステムに適用する場合を例示して説明する。

【0049】

（構成）
まず、本実施の形態に係るチャットシステムについて説明する。図１は、本発明の実施の形態がチャットシステムのブロック図である。

【0050】

チャットシステム１００は、いわゆるチャットボットシステムであり、例えば、ユーザからの問い合わせに対する回答を出力するシステムであり、一例としては、相互に通信可能に接続されている端末装置１、及びサーバ装置２を備える。なお、実際には、端末装置１は、複数個設けられているが、図１では、説明の便宜上、１個のみが代表して図示されている。

【0051】

（構成−端末装置）
端末装置１は、問い合わせを行うユーザが携帯している携帯端末であり、例えば、いわゆるスマートフォンであり、一例としては、通信部１１、タッチパッド１２、ディスプレイ１３、記録部１４、及び制御部１５を備える。

【0052】

（構成−端末装置−通信部）
通信部１１は、外部装置（例えば、サーバ装置２）との間で通信するための通信手段である。この通信部１１の具体的な種類や構成は任意であるが、例えば、公知の通信回路等を用いて構成することができる。

【0053】

（構成−端末装置−タッチパッド）
タッチパッド１２は、ユーザの指等で押圧されることにより、当該ユーザから各種操作入力を受け付ける操作手段である。このタッチパッド１２の具体的な構成は任意であるが、例えば、抵抗膜方式や静電容量方式等による操作位置検出手段を備えた公知のものを用いることができる。

【0054】

（構成−端末装置−ディスプレイ）
ディスプレイ１３は、制御部１５の制御に基づいて各種の画像を表示する表示手段である。このディスプレイ１３の具体的な構成は任意であるが、例えば、公知の液晶ディスプレイや有機ＥＬディスプレイの如きフラットパネルディスプレイ等を用いることができる。なお、上記のタッチパッド１２とディスプレイ１３と相互に重畳させてタッチパネルとして一体形成しても構わない。

【0055】

（構成−端末装置−記録部）
記録部１４は、端末装置１の動作に必要なプログラム及び各種のデータを記録する記録手段であり、例えば、外部記録装置としてのフラッシュメモリ（図示省略）を用いて構成されている。ただし、フラッシュメモリに代えてあるいはフラッシュメモリと共に、ハードディスク、磁気ディスクの如き磁気的記録媒体、又はＤＶＤやブルーレイディスクの如き光学的記録媒体を含む、その他の任意の記録媒体を用いることができる（他の装置の記録部も同様とする）。

【0056】

（構成−端末装置−制御部）
制御部１５は、端末装置１を制御する制御手段であり、具体的には、ＣＰＵ、当該ＣＰＵ上で解釈実行される各種のプログラム（ＯＳなどの基本制御プログラムや、ＯＳ上で起動され特定機能を実現するアプリケーションプログラムを含む）、及びプログラムや各種のデータを格納するためのＲＡＭの如き内部メモリを備えて構成されるコンピュータである（他の装置の制御部も同様とする）。特に、実施の形態に係るプログラムは、任意の記録媒体又はネットワークを介して端末装置１にインストールされることで、制御部１５の各部を実質的に構成する（他の装置の制御部も同様とする）。

【0057】

（構成−サーバ装置）
サーバ装置２は、演算システムであり、例えば、通信部２１、記録部２２、及び制御部２３を備える。

【0058】

（構成−サーバ装置−通信部）
通信部２１は、外部装置（例えば、端末装置１）との間で通信するための通信手段である。この通信部２１の具体的な種類や構成は任意であるが、例えば、通信部１１と同様にして構成することができる。

【0059】

（構成−サーバ装置−記録部）
記録部２２は、サーバ装置２の動作に必要なプログラム及び各種のデータを記録する記録手段であり、例えば、類似語特定情報データベース（以下、データベースを「ＤＢ」と称する）２２１、単語間類似度特定情報ＤＢ２２２、共起度特定情報ＤＢ２２３、逆文書頻度特定情報ＤＢ２２４、質問回答特定情報ＤＢ２２５を備える。

【0060】

（構成−サーバ装置−記録部−類似語特定情報ＤＢ）
類似語特定情報ＤＢ２２１とは、類似語特定情報を格納する類似語特定情報格納手段である。「類似語特定情報」とは、例えば、相互に意味が類似している単語ｎグラム（ｎは正の整数）を特定する情報である。この類似語特定情報ＤＢ２２１に特定されている類似語特定情報は任意であるが、例えば、単語１グラムである「チェックアウト」と「ｃｈｅｃｋｏｕｔ」が相互に類似していること、単語２グラムである「チェックアウト＋は」と「ｃｈｅｃｋｏｕｔ＋は」が相互に類似していること等を特定する情報が格納されていることとする。なお、この類似語特定情報ＤＢ２２１における類似語特定情報を格納する具体的な手法は任意であるが、例えば、管理者が不図示の入力手段（キーボード又はマウス等）を介してサーバ装置２に類似語特定情報を入力したり、あるいは、管理者が自己の端末（パーソナルコンピュータ等）からサーバ装置２に類似語特定情報を送信したりすることにより、類似語特定情報が格納されることとする。

【0061】

（構成−サーバ装置−記録部−単語間類似度特定情報ＤＢ）
単語間類似度特定情報ＤＢ２２２とは、単語間類似度特定情報を格納する単語間類似度特定情報格納手段である。「単語間類似度特定情報」とは、単語ｎグラム相互間の類似性の度合いを特定する情報である。図２は、単語間類似度特定情報を例示した図である。「単語間類似度特定情報」は、図２に示すように、例えば、項目「単語情報」に対応する情報と、項目「類似度情報」に対応する情報とが相互に関連付けられて格納されている。項目「単語情報」に対応する情報は、２個の単語ｎグラムを特定する単語情報である（図２では、単語１グラムである「ｃｈｅｃｋｏｕｔ」と「チェックイン」を特定する「ｃｈｅｃｋｏｕｔ、チェックイン」、及び単語２グラムの「ｃｈｅｃｋｏｕｔ＋は」と「チェックイン＋は」を特定する「ｃｈｅｃｋｏｕｔ＋は、チェックイン＋は」等）。項目「類似度情報」に対応する情報は、単語列間類似度であり、単語ｎグラム相互間の意味についての類似性の度合いを特定する類似度情報である。この類似度情報としては任意の情報を用いることができるが、例えば、単語情報で特定されている２個の単語ｎグラム各々の分散表現に対応するベクトル各々のコサイン類似度に対応する数値情報を用いる場合について説明する。図２では、例えば、最上段の情報について、「類似度情報」＝「Ｖｓ（ｃｈｅｃｋｏｕｔ、チェックイン）」は、「単語情報」＝「ｃｈｅｃｋｏｕｔ、チェックイン」が示す単語１グラムである「ｃｈｅｃｋｏｕｔ」及び単語１グラムである「チェックイン」の各々の分散表現である各ベクトルのコサイン類似度を示す数値情報であることとして、以下説明する。なお、実際には、このコサイン類似度を示す数値情報については、「０」以上から「１」以下の数値となり、例えば、２個の単語ｎグラムの意味が相互に一致する場合、「１」となり、また、２個の単語ｎグラムの意味が相互に遠くなる（つまり、意味の類似性の度合いが下がる）につれて「０」に近い数値となり、一方、２個の単語ｎグラムの意味が相互に近づく（つまり、意味の類似性の度合いが上がる）につれて「１」に近い数値となる。

【0062】

そして、このような単語間類似度特定情報ＤＢ２２２の単語間類似度特定情報の具体的な格納手法は任意であるが、例えば、制御部２３が、任意のタイミング（例えば、１週間毎、１か月毎、あるいは、後述のコーパスＤＢの情報が更新される毎等のタイミング）で、サーバ装置２の外部の任意のコーパスＤＢにアクセスし、当該ＤＢから多数の文のデータを取得し、取得した文のデータについて任意の処理（例えば、形態素解析等の技術を用いて各文を単語に分解する処理、分解された単語について教師なし学習（ｗｏｒｄ２ｖｅｃ、ｆａｓｔＴｅｘｔ等）に対応する技術を適用して２個単語ｎグラムの意味を示す分散表現であるベクトルを取得する処理、取得したベクトル相互間において公知の演算を行うことによりコサイン類似度を演算する処理等）を行うことにより、演算の対象となった２個の単語ｎグラムを示す情報を図２の単語情報として格納し、また、当該演算されたコサイン類似度を図２の類似度を類似度情報として格納する。

【0063】

なお、前述の「コサイン類似度を演算する処理」に関して、２個の単語１グラム（つまり、２個の単語）に対応するコサイン類似度は、公知の演算式を用いる手法等でコサイン類似度を演算することとし、２個の単語２グラム、及び２個の単語３グラム等のｎ＝２以上の場合の単語ｎグラムのコサイン類似度の演算手法は任意であり、例えば、ベクトルの各要素を加算する手法や、単語ｎグラム中の単語の出現順にそのベクトルを連結する手法等を用いてもよい。

【0064】

「ベクトルの各要素を加算する手法」を用いる場合、具体的には、一方の単語ｎグラムの内の単語１グラム各々のベクトルの各要素を加算することにより、一方の単語ｎグラムのベクトルを作成し、また、他方の単語ｎグラムの内の単語１グラム各々のベクトルの各要素を加算することにより、他方の単語ｎグラムのベクトルを作成し、これらのベクトルについてコサイン類似度を求める演算することにより、ｎ＝２以上の場合の単語ｎグラムのコサイン類似度を演算してもよい。

【0065】

「単語ｎグラム中の単語の出現順にそのベクトルを連結する手法」を用いる場合、一方の単語ｎグラムの内の単語１グラム各々のベクトルを連結することにより、一方の単語ｎグラムのベクトルを作成し、また、他方の単語ｎグラムの内の単語１グラム各々のベクトルを連結することにより、他方の単語ｎグラムのベクトルを作成し、これらのベクトルについてコサイン類似度を求める演算することにより、ｎ＝２以上の場合の単語ｎグラムのコサイン類似度を演算してもよい。なお、この手法を用いた場合、前述の作成された一方及び他方の単語ｎグラムの次元数は、単語１グラムのベクトルの次元数のｎ倍となる。

【0066】

なお、これらの各手法を用いる過程において、加算や連結等の前に、単語毎の重みをその各ベクトルに掛けてもよい。この重みには単語の前述のコーパスＤＢから取得した文のデータにおけるＩＤＦ（逆文書頻度：ＩｎｖｅｒｓｅＤｏｃｕｍｅｎｔＦｒｅｑｕｅｎｃｙ）等を用いてもよい。なお、ここで説明した単語間類似度特定情報の格納手法は一例であり、他の任意の手法を用いて格納してもよい（後述する共起度特定情報、及び逆文書頻度特定情報も同様とする）。

【0067】

（構成−サーバ装置−記録部−共起度特定情報ＤＢ）
図１の共起度特定情報ＤＢ２２３は、共起度特定情報を格納する共起度特定情報格納手段である。「共起度特定情報」とは、単語ｎグラム相互間の共起度を特定する情報である。図３は、共起度特定情報を例示した図である。「共起度特定情報」は、図３に示すように、例えば、項目「単語情報」に対応する情報と、項目「共起度情報」に対応する情報とが相互に関連付けられて格納されている。項目「単語情報」に対応する情報は、図２の同一名称の情報と同様である。項目「共起度情報」に対応する情報は、２個の単語ｎグラム各々の共起度を特定する共起度情報である。この共起度情報としては任意の情報を用いることができるが、例えば、前述のコーパスＤＢから取得した多数の文において、「「図３の単語情報が特定する単語ｎグラムの内の両方の単語ｎグラムが含まれている文の個数」÷「図３の単語情報が特定する単語ｎグラムの内の少なくとも一方が含まれている文の個数」」の演算結果の数値情報を用いる場合について説明する。図３では、例えば、最上段の情報について、「類似度情報」＝「Ｖｃ（ｃｈｅｃｋｏｕｔ、チェックイン）」は、前述のコーパスＤＢから取得した多数の文において、「「ｃｈｅｃｋｏｕｔ」及び「チェックイン」の両方の単語ｎグラムが含まれている文の個数」÷「「ｃｈｅｃｋｏｕｔ」及び「チェックイン」の少なくとも一方が含まれている文の個数」の演算結果を示す数値情報であることとして、以下説明する。つまり、この共起度情報においては、２個の単語ｎグラムが共に使われている文が多い程、大きな数値となる。

【0068】

そして、このような共起度特定情報ＤＢ２２３の共起度特定情報の具体的な格納手法は任意であるが、例えば、制御部２３が、任意のタイミング（例えば、単語間類似度特定情報ＤＢ２２２の単語間類似度特定情報の説明で記載したタイミングと同じタイミング等）で、サーバ装置２の外部の任意のコーパスＤＢにアクセスし、当該ＤＢから多数の文のデータを取得し、取得した文のデータについて任意の処理（例えば、形態素解析等の技術を用いて各文を単語に分解する処理、各単語が含まれている文を特定する処理、及び分解した各単語の共起度を演算する処理等）を行うことにより、分解した各単語の共起度を演算し、演算の対象となった２個の単語ｎグラムを示す情報を図３の単語情報として格納し、また、演算した共起度を示す情報を図３の共起度情報として格納する。

【0069】

なお、前述の「各単語の共起度を演算する処理」に関して、２個の単語１グラム（つまり、２個の単語）に対応する共起度は、「「前述のコーパスＤＢから取得した多数の文の内の、任意の２個の単語１グラムの両方が含まれている文の個数」÷「前述のコーパスＤＢから取得した多数の文の内の、前述の２個の単語１グラムの内の少なくとも一方が含まれている文の個数」」の演算を行って求める。

【0070】

また、２個の単語２グラム、及び２個の単語３グラム等のｎ＝２以上の場合の２個の単語ｎグラムの共起度については、「「前述のコーパスＤＢから取得した多数の文の内の、任意の２個の単語ｎグラムの両方が含まれている文の個数」÷「前述のコーパスＤＢから取得した多数の文の内の、前述の２個の単語ｎグラムの内の少なくとも一方が含まれている文の個数」」の演算を行って求めてもよいし、あるいは、以下の手法で求めてもよい。具体的には、２個の単語ｎグラムの内の一方側の単語ｎグラムに含まれる各単語１グラムと、２個の単語ｎグラムの内の側方側の単語ｎグラムに含まれる各単語１グラムとの共起度各々を演算し、これらの演算した共起度の統計値（例えば、最大値、あるいは、平均値等）を、ｎ＝２以上の場合の２個の単語ｎグラムの共起度として演算してもよい。

【0071】

（構成−サーバ装置−記録部−逆文書頻度特定情報ＤＢ）
図１の逆文書頻度特定情報ＤＢ２２４は、逆文書頻度特定情報を格納する逆文書頻度特定情報格納手段である。「逆文書頻度特定情報」とは、単語ｎグラムのＩＤＦ（つまり、逆文書頻度）を特定する情報である。図４は、逆文書頻度特定情報を例示した図である。「逆文書頻度特定情報」は、図４に示すように、例えば、項目「単語情報」に対応する情報と、項目「逆文書頻度情報」に対応する情報とが相互に関連付けられて格納されている。項目「単語情報」に対応する情報は、図２の同一名称の情報と同様であり、１個の単語ｎグラムを特定する単語情報である。項目「逆文書頻度情報」に対応する情報は、単語ｎグラムのＩＤＦを特定する逆文書頻度情報である。この逆文書頻度情報としては任意の情報を用いることができるが、例えば、前述のコーパスＤＢから取得した多数の文において、ＩＤＦを演算する所定の演算式を用いて行われる演算の演算結果の数値情報を用いる場合について説明する。なお、ここでの所定の演算式としては、例えば、「前述のコーパスＤＢから取得した多数の文の個数」÷「前述のコーパスＤＢから取得した多数の文の内の、１個の単語ｎグラムが含まれている文の個数」の演算結果の対数（つまり、「ｌｏｇ」）に対して、定数（例えば、「１」等）を加算する演算式を用いてもよいし、その他の任意の演算式を用いてもよい。図４では、例えば、最上段の情報について、「逆文書頻度情報」＝「Ｖｉ（ｃｈｅｃｋｏｕｔ）」は、前述のコーパスＤＢから取得した多数の文における、「ｃｈｅｃｋｏｕｔ」についての、前述の所定の演算式を用いて行われた演算結果を示す数値情報であることとして、以下説明する。つまり、この逆文書頻度情報においては、単語ｎグラムが含まれている文の個数が多くなる程、小さな数値となる。

【0072】

そして、このような逆文書頻度特定情報ＤＢ２２４の逆文書頻度特定情報の具体的な格納手法は任意であるが、例えば、制御部２３が、任意のタイミング（例えば、単語間類似度特定情報ＤＢ２２２の単語間類似度特定情報の説明で記載したタイミングと同じタイミング等）で、サーバ装置２の外部の任意のコーパスＤＢにアクセスし、当該ＤＢから多数の文のデータを取得し、取得した文のデータについて任意の処理（例えば、形態素解析等の技術を用いて各文を単語に分解する処理、各単語が含まれている文を特定する処理、及びＩＤＦを演算する処理等）を行うことにより、分解した各単語のＩＤＦを演算し、演算の対象となった１個の単語ｎグラムを示す情報を図４の単語情報として格納し、また、演算したＩＤＦを示す情報を図４の逆文書頻度情報として格納する。

【0073】

なお、前述の「ＩＤＦを演算する処理」に関して、単語１グラム（つまり、１個の単語）に対応するＩＤＦは、所定の演算式を用いて行われる演算を行って求める。

【0074】

また、単語２グラム、及び単語３グラム等のｎ＝２以上の場合の単語ｎグラムのＩＤＦについては、単語ｎグラムに含まれる各単語１グラムのＩＤＦを演算し、演算した各単語１グラムのＩＤＦの統計値（例えば、最大値、あるいは、平均値等）を、ｎ＝２以上の場合の単語ｎグラムのＩＤＦとして演算してもよい。

【0075】

（構成−サーバ装置−記録部−質問回答特定情報ＤＢ）
図１の質問回答特定情報ＤＢ２２５は、質問回答特定情報を格納する質問回答特定情報格納手段である。「質問回答特定情報」とは、質問と当該質問に対する回答を特定する情報である。図５は、質問回答特定情報を例示した図である。「質問回答特定情報」は、図５に示すように、例えば、項目「質問情報」に対応する情報と、項目「回答情報」に対応する情報とが相互に関連付けられて格納されている。項目「質問情報」に対応する情報は、質問内容を示す文を特定する質問情報である（図４では、チャットシステム１００で用いられる１個の質問の文のテキスト情報である「チェックインチェックアウトは何時」等）。なお、ここでの質問情報が特定する文を「蓄積文」とも称する。項目「回答情報」に対応する情報は、質問情報が示す質問内容に対する回答内容を示す文を特定する回答情報である（図４では、チャットシステム１００で用いられる１個の文のテキスト情報である「チェックインは１５時でチェックアウトは１０時です」等）。

【0076】

そして、このような質問回答特定情報ＤＢ２２５の質問回答特定情報の具体的な格納手法は任意であるが、例えば、管理者が、任意の手法でユーザ（例えば、ホテルの顧客等）からの想定される質問と、当該質問に対する回答とを把握した上で、不図示の入力手段（キーボード又はマウス等）を介してサーバ装置２に当該把握した質問と回答とを特定する情報を入力したり、あるいは、管理者が自己の端末（パーソナルコンピュータ等）からサーバ装置２に質問と回答とを特定する情報を送信したりすることにより、質問回答特定情報が格納されることとする。

【0077】

（構成−サーバ装置−制御部）
制御部２３は、サーバ装置２を制御する制御手段である。この制御部２３は、機能概念的に、例えば、取得部２３１、及び演算部２３２を備える。取得部２３１は、第１文及び第２文を取得する取得手段である。演算部２３２は、取得部２３１が取得した第１文及び第２文に基づいて、文間類似度を演算する演算手段であり、特に、取得部２３１が取得した第１文に含まれている複数の単語の内のｎ個（ｎは正の整数）の連続する単語からなる第１単語列と、取得部２３１が取得した第２文に含まれている複数の単語の内のｎ個（ｎは正の整数）の連続する単語からなる第２単語列との類似性の度合いである単語列間類似度に基づいて、第２文の意味が第１文に含まれる程度を示す第２文意味第１文側被含有尺度を演算する第１演算処理と、単語列間類似度に基づいて、第１文の意味が第２文に含まれる程度を示す第１文意味第２文側被含有尺度を演算する第２演算処理と、第１演算処理にて演算された第２文意味第１文側被含有尺度と、第２演算処理にて演算された第１文意味第２文側被含有尺度とに基づいて、文間類似度を演算する第３演算処理と、を行う演算手段である。そして、このような制御部２３の各部によって行われる処理については、後述する。

【0078】

（処理）
次に、このように構成されるチャットシステム１００によって行われる回答出力処理について説明する。図６は、回答出力処理のフローチャートである（以下では、各ステップを「Ｓ」と称する）。回答出力処理は、サーバ装置２で行われる処理であり、概略的には、ユーザからの質問に対する回答を出力する処理である。この回答出力処理を実行するタイミングは任意であるが、例えば、サーバ装置２の電源をオンした場合に、繰り返し起動することとし、この回答出力処理が起動したところから説明する。

【0079】

ここでは、例えば、端末装置１のユーザが、端末装置１のタッチパッド１２を介して、「ｃｈｅｃｋｏｕｔはいつ」という質問の文を入力した場合に、端末装置１の制御部１５が、ユーザに入力された文（以下、入力文）を示す入力文情報を、通信部１１を介してサーバ装置２に送信し、サーバ装置２の制御部２３が、当該送信された入力文情報を通信部２１を介して受信し、受信した入力文情報が示す入力文の質問に対する回答を出力する場合を例示して説明する。

【0080】

図６のＳＡ１において取得部２３１は、入力文を取得する。なお、実際の情報処理では、各文（入力文等）を示す各情報について処理を行っているが、以下では、説明の便宜上、「情報」という用語は適宜省略し、単に「入力文」等の用語を用いて説明する。ＳＡ１の処理は任意であるが、例えば、端末装置１から送信された入力文情報を、通信部２１を介して受信した場合、当該受信した入力文情報が示す入力文を取得する。

【0081】

ここでは、例えば、端末装置１からの「ｃｈｅｃｋｏｕｔはいつ」を示す入力文情報を、通信部２１を介して受信した場合、当該受信した入力文情報が示す入力文として「ｃｈｅｃｋｏｕｔはいつ」を取得する。

【0082】

図６のＳＡ２において取得部２３１は、蓄積文を取得する。具体的には任意であるが、質問回答特定情報ＤＢ２２５の図５の質問回答特定情報を参照して、未だ取得していない質問情報を１個特定し、特定した１個の質問情報が示す文を蓄積文として取得する。なお、未だ取得していない質問情報を１個特定する手法としては、例えば、過去にＳＡ２で取得した質問情報に対して取得済フラグ（取得済であることを示す情報）を付すように構成した上で、当該フラグが付されていない質問情報を１個特定してもよい。

【0083】

ここでは、例えば、図５の全ての質問情報に未だ取得済フラグが付されていない場合、例えば、図５の最上段の「チェックインチェックアウトは何時」を示す質問情報を特定し、特定した質問情報が示す文である「チェックインチェックアウトは何時」を蓄積文として取得する。

【0084】

この後のＳＡ３からＳＡ５の処理を実行することにより、文間類似度を演算することになる。図７は、文間類似度を演算するための数式を例示した図である。ＳＡ３からＳＡ５では、例えば、この図７に示す数式に対応する処理を行うこととして、以下説明する。なお、図７の各数式の意味について、「ｓ１」を前述の定義で説明した「第１文」とし、「ｓ２」を前述の定義で説明した「第２文」とする場合を例示して説明する。

【0085】

まず、数式Ｍの「ＷＥＮＦ（ｓ１，ｓ２）」は、「ｓ１」の文と「ｓ２」の文との文間類似度を示している。また、数式Ｍの「ＷＥＮＰ（ｓ１，ｓ２）」は、「ｓ１」の文が「ｓ２」の文の意味を含む程度を示す尺度（つまり、数式Ｍ１に示すように、第２文意味第１文側被含有尺度）を示しており、また、「ＷＥＮＲ（ｓ１，ｓ２）」は、「ｓ１」の文の意味が「ｓ２」の文に含まれる程度を示す尺度（つまり、第１文意味第２文側被含有尺度）を示している。そして、この数式Ｍについては、文間類似度が、第１文意味第２文側被含有尺度と第２文意味第１文側被含有尺度の平均（具体的には、調和平均）の演算を行うことにより求められることを示している。

【0086】

また、数式Ｍ１については、「ＷＥＮＰ（ｓ１，ｓ２）」が「ＷＥＮＲ（ｓ１，ｓ２）」における引数を入れ替えた「ＷＥＮＲ（ｓ２，ｓ１）」に対応することを示している。つまり、数式Ｍ２、Ｍ２−１、及びＭ２−１−１に示される「ＷＥＮＲ（ｓ１，ｓ２）」の演算において、引数を入れ替えて演算することにより、「ＷＥＮＰ（ｓ１，ｓ２）」が求められることを示している。

【0087】

また、数式Ｍ２の右辺の分母及び分子のシグマについては、単語ｎグラムのｎの値が「１」から「Ｎ」各々である場合の総和を示している。また、「ｗｅｉｇｈｔｎ」は、重みを示しており、ここでは、例えば、単語ｎグラムのｎの値毎に所定値が定められており、当該所定値を用いることとする。また、「ＷＥＮＲｎ（ｓ１，ｓ２）」は、「ｓ１」の文の単語列群の意味が「ｓ２」の文に含有されている程度を示す尺度（つまり、第１単語列群意味第２文側被含有尺度）を示している。そして、この数式Ｍ２については、第１文意味第２文側被含有尺度が、単語ｎグラムの値が「１」から「Ｎ」である場合の第１単語列群意味第２文側被含有尺度についての平均に対応する演算により求められることを示している。

【0088】

また、数式Ｍ２−１の右辺の分母及び分子のシグマについては、「ｓ１」の文の単語ｎグラム全てに関する総和を示している。「ｎ１」は、「ｓ１」の文に含まれている１個の単語ｎグラムを示している。また、「ｓｉｍｉｌａｒｉｔｙｎ（ｎ１，ｎ２）」は、「ｓ１」の文の単語列の意味が「ｓ２」の文に含有されている程度を示す尺度（つまり、第１単語列意味第２文側被含有尺度）を示している。また、「ｗｅｉｇｈｔ（ｎ１）」は、重みを示しており、ここでは、例えば、「ｓ１」の文の単語ｎグラムのＩＤＦを用いることとする。そして、この数式Ｍ２−１については、第１単語列群意味第２文側被含有尺度が、「ｓ１」の文の単語ｎグラムの全ての第１単語列意味第２文側被含有尺度についての平均に対応する演算により求められることを示している。

【0089】

また、数式Ｍ２−１−１の右辺の第１部分については、「ｓ１」の文に含まれる１個の単語ｎグラムと、「ｓ２」の文に含まれる各単語ｎグラムの内の何れかのｎグラムとが、相互に類似している場合（つまり、類似語特定情報ＤＢ２２１に類似している単語ｎグラムとして格納されている場合）、当該「ｓ１」の文に含まれる１個の単語ｎグラムについての第１単語列意味第２文側被含有尺度として「１」を演算することを示している。

【0090】

また、数式Ｍ２−１−１の右辺の第２部分については、「ｓ１」の文に含まれる１個の単語ｎグラムと、「ｓ２」の文に含まれる各単語ｎグラムの内の何れかのｎグラムとが、相互に類似していない場合（つまり、類似語特定情報ＤＢ２２１に類似している単語ｎグラムとして格納されていない場合）の当該「ｓ１」の文の単語列の意味が「ｓ２」の文に含有されている程度を示す尺度（つまり、第１単語列意味第２文側被含有尺度）の求め方が示されている。

【0091】

数式Ｍ２−１−１の右辺の第２部分について具体的には、「ｎ２」は、「ｓ２」の文に含まれている１個の単語ｎグラムを示している。また、「ｃｏｓ（ｖｅｃ（ｎ１），ｖｅｃ（ｎ２））」は、「ｓ１」の文に含まれている１個の単語ｎグラムと、「ｓ２」の文に含まれている１個の単語ｎグラムとの単語列間類似度を示している。また、「ｗｅｉｇｈｔ（ｎ１，ｎ２）」は、重みを示しており、ここでは、例えば、「ｓ１」の文の単語ｎグラムと「ｓ２」の文の単語ｎグラムとの共起度を用いることとする。「ｎ２ｉｎｎｇｒａｍＴｏＣｏｍｐａｒｅｎ（ｓ２），ｍａｘ（ｃｏｓ（ｖｅｃ（ｎ１），ｖｅｃ（ｎ２））×ｗｅｉｇｈｔ（ｎ１，ｎ２））」については、「ｓ２」の文に含まれている単語ｎグラム各々について「ｍａｘ」以下の演算（つまり、「ｃｏｓ（ｖｅｃ（ｎ１），ｖｅｃ（ｎ２））×ｗｅｉｇｈｔ（ｎ１，ｎ２）」の演算）を各々行い、各々行った演算の結果の内の最大値を、「ｓ１」の文に含まれる１個の単語ｎグラムについての第１単語列意味第２文側被含有尺度として求めることが示されている。

【0092】

なお、数式Ｍ２、Ｍ２−１，Ｍ２−１−１の重みを採用するか否かは任意であり、例えば、当該重みの内の１個以上を省略してもよいが、ここでは、図７に示されているように、重みを用いる場合を例示して説明する。

【0093】

また、以下では、ＳＡ１で取得した入力文が図７の「ｓ１」（つまり、第１文）であり、ＳＡ２で取得した蓄積文が図７の「ｓ２」（つまり、第２文）である場合を例示して説明する。そして、以下では、「（用語）」の欄で説明した各用語において、「第１」を「入力」に適宜読み替えて、また、「第２」を「蓄積」と適宜読み替えて説明する。

【0094】

図６のＳＡ３において演算部２３２は、入力文意味蓄積文側被含有尺度演算処理を実行する。図８は、入力文意味蓄積文側被含有尺度演算処理のフローチャートである。なお、「入力文意味蓄積文側被含有尺度演算処理」とは、入力文の意味が蓄積文に含まれる程度を示す尺度である入力文意味蓄積文側被含有尺度（つまり、第１文意味第２文側被含有尺度）を演算する処理（第２演算処理）である。

【0095】

図９は、入力文意味蓄積文側被含有尺度演算処理の演算例を説明するための図である。この図９では、項目「ｎの数」に対応する情報、項目「単語ｎグラム（入力文）」に対応する情報、項目「単語ｎグラム（蓄積文）」に対応する情報、項目「類似演算値」に対応する情報、項目「第１尺度値」に対応する情報、項目「第２尺度値」に対応する情報、及び項目「第３尺度値」に対応する情報が相互に関連付けられて表示されている。

【0096】

項目「ｎの数」に対応する情報は、単語ｎグラムにおけるｎの数（つまり、連続する単語の個数）を示している。項目「単語ｎグラム（入力文）」に対応する情報は、入力文の単語ｎグラムを示している。項目「単語ｎグラム（蓄積文）」に対応する情報は、蓄積文の単語ｎグラムを示している。

【0097】

項目「類似演算値」に対応する情報は、図７の数式Ｍ２−１−１の第２部分における「ｃｏｓ（ｖｅｃ（ｎ１），ｖｅｃ（ｎ２））×ｗｅｉｇｈｔ（ｎ１，ｎ２）」に対応する演算の演算値（第１演算値）を示している。なお、図７では、数式Ｍ２−１−１にて第１部分に該当するために、第２部分の演算が行われなかった場合は「無」と記載されており、また、第１部分に該当する根拠の各単語ｎグラムの組み合わせに対応する欄（つまり、相互に類似している単語ｎグラムの組み合わせに対応する欄）に「無（１）」と記載されている。また、演算結果の数値については、便宜上、「Ｖｉ１１」、「Ｖｉ１２」、「Ｖｉ２１」、「Ｖｉ３１」、「Ｖｉ…」等と記載されている（後述する各尺度値の項目の情報も同様である）。また、「ｃｏｓ（ｖｅｃ（ｎ１），ｖｅｃ（ｎ２））×ｗｅｉｇｈｔ（ｎ１，ｎ２）」の最大値を算出するための比較対象となっている単語ｎグラムの組み合わせの内で、最大値に対応する値が「最大（Ｖｉ１１）」等と記載されている。

【0098】

項目「第１尺度値」に対応する情報は、図７の数式Ｍ２−１−１に対応する演算の演算値を示している。項目「第２尺度値」に対応する情報は、図７の数式Ｍ２−１に対応する演算の演算値を示している。項目「第３尺度値」に対応する情報は、図７の数式Ｍ２に対応する演算の演算値を示している。以下では、これらの図９の例を適宜用いて説明する。

【0099】

図８のＳＢ１において演算部２３２は、入力文を分解する。具体的には任意であるが、例えば、ＳＡ１で取得した入力文を取得し、取得した入力文を、任意の手法（例えば、形態素解析、構文解析等の公知の手法を用いて文を単語に分解する手法）を用いて単語に分解する。ここでは、例えば、ＳＡ１で取得した入力文である「ｃｈｅｃｋｏｕｔはいつ」を取得し、取得した入力文である「ｃｈｅｃｋｏｕｔはいつ」を、単語である「ｃｈｅｃｋｏｕｔ」、「は」、「いつ」に分解する。

【0100】

図８のＳＢ２において演算部２３２は、蓄積文を分解する。具体的には任意であるが、例えば、ＳＡ２で取得した蓄積文を取得し、取得した蓄積文を、前述の任意の手法を用いて単語に分解する。ここでは、例えば、ＳＡ２で取得した蓄積文である「チェックインチェックアウトは何時」を取得し、取得した蓄積文である「チェックインチェックアウトは何時」を、単語である「チェックイン」、「チェックアウト」、「は」、「何時」に分解する。

【0101】

図８のＳＢ３において演算部２３２は、単語ｎグラムの最大のｎである最大グラム数（つまり、単語が連続する最大数）を決定する。具体的には任意であるが、例えば、ＳＢ１で分解した単語の個数、及びＳＢ２で分解した単語の個数の内の少ない方の個数を、最大グラム数に決定する。ここでは、例えば、ＳＢ１で分解した単語の個数が３個であり、ＳＢ２で分解した単語の個数が４個であるので、最大グラム数を３個に対応する「３」に決定する。

【0102】

次に、単語ｎグラムの「ｎ」を「１」からＳＢ３で決定した最大グラム数（ここでは、「３」）まで「１」ずつ増加させて、各「ｎ」について図８のＳＢ４からＳＢ９を実行する。つまり、図７の数式Ｍ２−１、Ｍ２−２−１の演算を、単語ｎグラムの「ｎ」が「１」の場合から「３」の場合まで繰り返し行う。

【0103】

図８のＳＢ４において演算部２３２は、入力文及び蓄積文の単語ｎグラムを生成する。具体的には任意であるが、例えば、未だＳＢ４が実行されていない場合、「ｎ」を「１」として入力文及び蓄積文の単語１グラムを生成し、また、ＳＢ４が２回目以降に実行されている場合、直近に生成した単語ｎグラムの「ｎ」の値に「１」を加算した値を新たな「ｎ」として単語ｎグラムを生成する。なお、未だＳＢ４が実行されていないこと、あるいは、ＳＢ４が２回目以降に実行されていること等については、ＳＢ４を実行した回数又は当該ＳＢ４を実行した場合の「ｎ」の値が記録部２２に記録されていることとし、当該記録を用いて判断するように構成してもよいし、あるいは、その他の任意の手法を採用することができる。

【0104】

また、単語ｎグラムの具体的な生成手法は任意であるが、例えば、入力文の単語ｎグラムについては、ＳＢ１で分解した各単語を取得し、分解前の入力文を参照して、当該取得した各単語相互間の入力文での位置を把握した上で、単語ｎグラムを生成する。ここでは、例えば、ＳＢ１で分解した各単語として「ｃｈｅｃｋｏｕｔ」、「は」、「いつ」を取得し、分解前の入力文である「ｃｈｅｃｋｏｕｔはいつ」を参照して、「ｃｈｅｃｋｏｕｔ」が１番目、「は」が２番目、「いつ」が３番目と特定した上で、単語ｎグラムを生成する。特に、「ｎ」が「１」の場合は、連続する単語の数が１個であるので、「ｃｈｅｃｋｏｕｔ」、「は」、「いつ」を生成することになる。また、「ｎ」が「２」の場合は、連続する単語の数が２個であるので、１番目の単語である「ｃｈｅｃｋｏｕｔ」と２番目の単語である「は」を組み合わせた「ｃｈｅｃｋｏｕｔ＋は」を生成し、また、２番目の単語である「は」と３番目の単語である「いつ」を組み合わせた「は＋いつ」を生成することになる。また、「ｎ」が「３」の場合は、連続する単語の数が３個であるので、１番目の単語である「ｃｈｅｃｋｏｕｔ」、２番目の単語である「は」、及び３番目の単語である「いつ」を組み合わせた「ｃｈｅｃｋｏｕｔ＋は＋いつ」を生成することになる。

【0105】

また、蓄積文の単語ｎグラムについては、ＳＢ２で分解した各単語を取得し、分解前の蓄積文を参照して、当該取得した各単語相互間の蓄積文での位置を把握した上で、単語ｎグラムを生成することになるが、具体的な処理は入力文の単語ｎグラムの場合と同様であるので、詳細の説明を省略する。

【0106】

ここでは、例えば、未だＳＢ４が実行されておらず、ＳＢ１を初めて実行されるので、「ｎ」を「１」として入力文及び蓄積文の単語１グラムを生成する。具体的には、入力文の単語１グラムとして「ｃｈｅｃｋｏｕｔ」、「は」、「いつ」を生成し、また、蓄積文の単語１グラムとして、「チェックイン」、「チェックアウト」、「は」、「何時」を生成する。

【0107】

次に、ＳＢ４で生成した入力文の各単語ｎグラムについてＳＢ５からＳＢ８を実行することにより、入力文の単語ｎグラムの個数分だけＳＢ５からＳＢ８を実行する。

【0108】

図８のＳＢ５において演算部２３２は、ＳＢ４で生成した入力文及び蓄積文の単語ｎグラムから、未だ取得していない１個の入力文の単語ｎグラム、及び全ての蓄積文の単語ｎグラムを取得する。ここでは、例えば、未だ取得していない１個の入力文の単語１グラムとして「ｃｈｅｃｋｏｕｔ」を取得し、また、全ての蓄積文の単語１グラムとして「チェックイン」、「チェックアウト」、「は」、「何時」を取得する。

【0109】

図８のＳＢ６において演算部２３２は、ＳＢ５で取得した蓄積文の単語ｎグラムの中に、ＳＢ５で取得した１個の入力文の単語ｎグラムと意味が類似している単語ｎグラムが存在するか否かを判定する。具体的には任意であるが、例えば、図１の類似語特定情報ＤＢ２２１の類似語特定情報を参照して、ＳＢ５で取得した蓄積文の単語ｎグラム各々と、ＳＢ５で取得した１個の入力文の単語ｎグラムとの組み合わせ内の、当該類似語特定情報において相互に類似していることが特定されている組み合わせが存在するか否かに基づいて判定する。そして、類似語特定情報において相互に類似していることが特定されている組み合わせが存在する場合、ＳＢ５で取得した蓄積文の単語ｎグラムの中に、ＳＢ５で取得した１個の入力文の単語ｎグラムと意味が類似している単語ｎグラムが存在するものと判定し（ＳＢ６のＹＥＳ）、ＳＢ８に移行する。また、類似語特定情報において相互に類似していることが特定されている組み合わせが存在しない場合、ＳＢ５で取得した蓄積文の単語ｎグラムの中に、ＳＢ５で取得した１個の入力文の単語ｎグラムと意味が類似している単語ｎグラムが存在しないものと判定し（ＳＢ６のＮＯ）、ＳＢ７に移行する。

【0110】

ここでは、例えば、ＳＢ５で取得した蓄積文の単語１グラムである「チェックイン」、「チェックアウト」、「は」、「何時」の内の「チェックアウト」と、ＳＢ５で取得した１個の入力文の単語１グラムである「ｃｈｅｃｋｏｕｔ」とが、類似語特定情報ＤＢ２２１の類似語特定情報において相互に類似していることが特定されているので、ＳＢ５で取得した蓄積文の単語ｎグラムの中に、ＳＢ５で取得した１個の入力文の単語ｎグラムと意味が類似している単語ｎグラムが存在するものと判定し、ＳＢ８に移行する。

【0111】

次に、ＳＢ６において、ＳＢ５で取得した蓄積文の単語ｎグラムの中に、ＳＢ５で取得した１個の入力文の単語ｎグラムと意味が類似している単語ｎグラムが存在しないものと判定した（ＳＢ６のＮＯ）場合、ＳＢ６のＳＢ５で取得した各蓄積文の単語ｎグラムについてＳＢ７を実行することにより、蓄積文の単語ｎグラムの個数分だけＳＢ７を実行する。

【0112】

図８のＳＢ７において演算部２３２は、図７の数式Ｍ２−１−１の第２部分の「ｃｏｓ（ｖｅｃ（ｎ１），ｖｅｃ（ｎ２））×ｗｅｉｇｈｔ（ｎ１，ｎ２）」に対応する演算を行う。

【0113】

具体的には任意であるが、例えば、まず、ＳＢ５で取得した蓄積文の単語ｎグラムの内の、未だＳＢ７での演算の対象となっていない１個の蓄積文の単語ｎグラム（以下、「演算対象蓄積文側単語ｎグラム」）を特定し、単語間類似度特定情報ＤＢ２２２の図２の単語間類似度特定情報を参照して、ＳＢ５で取得した１個の入力文の単語ｎグラム（以下、「演算対象入力文側単語ｎグラム」）と、前述の特定した「演算対象蓄積文側単語ｎグラム」との２個の単語ｎグラムに対応する類似度情報を前述の数式「ｃｏｓ（ｖｅｃ（ｎ１），ｖｅｃ（ｎ２））」として特定する。次に、共起度特定情報ＤＢ２２３の図３の共起度特定情報を参照して、「演算対象入力文側単語ｎグラム」と前述の特定した「演算対象蓄積文側単語ｎグラム」との２個の単語ｎグラムに対応する共起度情報を前述の数式の「ｗｅｉｇｈｔ（ｎ１，ｎ２）」として特定する。次に、特定した類似度情報と共起度情報とを相互に掛け合わせる演算を行って、当該演算結果を「ｃｏｓ（ｖｅｃ（ｎ１），ｖｅｃ（ｎ２））×ｗｅｉｇｈｔ（ｎ１，ｎ２）」の演算結果として求める。そして、これらの処理を、ＳＢ５で取得した各蓄積文の単語ｎグラムについて行うことにより、蓄積文の単語ｎグラムの個数分だけ「ｃｏｓ（ｖｅｃ（ｎ１），ｖｅｃ（ｎ２））×ｗｅｉｇｈｔ（ｎ１，ｎ２）」の演算結果を求める。なお、ここでの具体例については後述する。

【0114】

図８のＳＢ８において演算部２３２は、入力文の単語ｎグラム（入力文の単語列）の意味が蓄積文に含まれる程度を示す入力単語列意味蓄積文側被含有尺度を求める。なお、この入力単語列意味蓄積文側被含有尺度は、「第１単語列意味第２文側被含有尺度」に対応し、また、図９の項目「第１尺度値」に対応する。具体的には任意であるが、例えば、図７の数式Ｍ２−１−１に基づいて求める。

【0115】

詳細には、ＳＢ６の判定において、意味が類似している単語ｎグラムが存在するものと判定した場合（ＳＢ６のＹＥＳ）（つまり、図１の類似語特定情報ＤＢ２２１の類似語特定情報で相互に類似していることが特定されている場合）、ＳＢ５で取得した蓄積文の単語ｎグラムの中に、ＳＢ５で取得した１個の入力文の単語ｎグラムと意味が極めて類似（例えば、一致）しているものと存在するものとみなして、「１」を入力単語列意味蓄積文側被含有尺度とする。また、ＳＢ６の判定において、意味が類似している単語ｎグラムが存在しないものと判定した場合（ＳＢ６のＮＯ）（つまり、図１の類似語特定情報ＤＢ２２１の類似語特定情報で相互に類似していることが特定されていない場合）、ＳＢ７の処理を行うことになるが、このＳＢ７で行った演算結果の内の最大値を、入力単語列意味蓄積文側被含有尺度とする。

【0116】

ここでは、例えば、ＳＢ５で取得した蓄積文の単語１グラムである「チェックイン」、「チェックアウト」、「は」、「何時」の内の「チェックアウト」と、ＳＢ５で取得した１個の入力文の単語１グラムである「ｃｈｅｃｋｏｕｔ」とが、類似語特定情報ＤＢ２２１の類似語特定情報において相互に類似していることが特定されており、意味が類似している単語ｎグラムが存在するものと判定した（ＳＢ６のＹＥＳ）ので、「１」を入力単語列意味蓄積文側被含有尺度とする。つまり、図９の項目「ｎの数」＝「１」の項目「単語ｎグラム（入力文）」＝「ｃｈｅｃｋｏｕｔ」に関連付けられている項目「第１尺度値」の欄に記載されているように、「１」を演算して求めることになる。

【0117】

そして、前述したように、入力文の単語ｎグラムの個数分だけＳＢ５からＳＢ８を繰り返し行うことになるが、次のＳＢ５において、未だ取得していない１個の入力文の単語１グラムとして「は」を取得し、また、前述の場合と同様にして、全ての蓄積文の単語１グラムとして「チェックイン」、「チェックアウト」、「は」、「何時」を取得する。次に、ＳＢ６において、例えば、意味が類似している単語ｎグラムが存在しないものと判定し（ＳＢ６のＮＯ）する。次に、ＳＢ７において、入力文の単語１グラムである「は」と、蓄積文の単語１グラムである「チェックイン」、「チェックアウト」、「は」、「何時」各々とについて、図７の数式Ｍ２−１−１の第２部分の「ｃｏｓ（ｖｅｃ（ｎ１），ｖｅｃ（ｎ２））×ｗｅｉｇｈｔ（ｎ１，ｎ２）」に対応する演算を行う。

【0118】

このＳＢ７の処理については、例えば、「演算対象蓄積文側単語ｎグラム」として「チェックイン」を特定し、単語間類似度特定情報ＤＢ２２２の図２の単語間類似度特定情報を参照して、「演算対象入力文側単語ｎグラム」である「は」と、前述の特定した「演算対象蓄積文側単語ｎグラム」である「チェックイン」との２個の単語ｎグラムに対応する類似度情報である「Ｖｓ（は、チェックイン）」を図７の数式Ｍ２−１−１の「ｃｏｓ（ｖｅｃ（ｎ１），ｖｅｃ（ｎ２））」として特定する。次に、共起度特定情報ＤＢ２２３の図３の共起度特定情報を参照して、「演算対象入力文側単語ｎグラム」である「は」と、前述の特定した「演算対象蓄積文側単語ｎグラム」である「チェックイン」との２個の単語ｎグラムに対応する共起度情報である「Ｖｃ（は、チェックイン）」を前述の数式の「ｗｅｉｇｈｔ（ｎ１，ｎ２）」として特定する。次に、類似度情報である「Ｖｓ（は、チェックイン）」と共起度情報である「Ｖｃ（は、チェックイン）」とを相互に掛け合わせる演算を行って、演算結果である「Ｖｉ・・・」を「ｃｏｓ（ｖｅｃ（ｎ１），ｖｅｃ（ｎ２））×ｗｅｉｇｈｔ（ｎ１，ｎ２）」の演算結果として求める。そして、これらの演算を繰り返し行うことにより、例えば、図９の項目「ｎの数」＝「１」の項目「単語ｎグラム（入力文）」＝「は」に関連付けられている項目「類似演算値」の欄に記載されている演算値である「Ｖｉ・・・」、「Ｖｉ・・・」、「Ｖｉ１１」、「Ｖｉ・・・」を演算する。

【0119】

次に、ＳＢ８において、ＳＢ７で行った演算結果の内の最大値である「Ｖｉ１１」を、入力単語列意味蓄積文側被含有尺度とする。つまり、図９の項目「ｎの数」＝「１」の項目「単語ｎグラム（入力文）」＝「は」に関連付けられている項目「第１尺度値」の欄に記載されているように、「Ｖｉ１１」を演算して求めることになる。次に、入力文の単語１グラムである「いつ」についても、ＳＢ５からＳＢ８の処理を行って、ＳＢ８において、図９の項目「ｎの数」＝「１」の項目「単語ｎグラム（入力文）」＝「いつ」に関連付けられている項目「第１尺度値」の欄に記載されているように、入力単語列意味蓄積文側被含有尺度として「Ｖｉ１２」を演算して求めることになる。

【0120】

図８のＳＢ９において演算部２３２は、入力文の単語ｎグラムの集合（入力文の単語列群）の意味が蓄積文に含まれる程度を示す入力単語列群意味蓄積文側被含有尺度を求める。なお、この入力単語列群意味蓄積文側被含有尺度は、「第１単語列群意味第２文側被含有尺度」に対応し、また、図９の項目「第２尺度値」に対応する。具体的には任意であるが、例えば、図７の数式Ｍ２−１に基づいて求める。

【0121】

詳細には、まず、単語ｎグラムの１個の「ｎ」の値に対して繰り返し行われたＳＢ５からＳＢ８のＳＢ８で求めた入力単語列意味蓄積文側被含有尺度を取得する。次に取得した入力単語列意味蓄積文側被含有尺度各々に関連する重みの値を特定する。なお、重みの値の特定手法は任意であるが、例えば、ＳＢ８で入力単語列意味蓄積文側被含有尺度を求める対象となった１個の入力文の単語ｎグラム（つまり、ＳＢ５で取得した１個の入力文の単語ｎグラム）を任意の手法（例えば、特定するために必要な情報が記録部２２に記録されており、当該情報を参照して特定する手法等）で特定し、逆文書頻度特定情報ＤＢ２２４の図４の逆文書頻度特定情報を参照して、当該特定した１個の単語ｎグラムに関連付けられている逆文書頻度情報を取得し、取得した逆文書頻度情報が示す値を重みとして特定する。次に、前述の取得した入力単語列意味蓄積文側被含有尺度と、取得した逆文書頻度情報とを用いて、図７の数式Ｍ２−１の演算を行い、演算結果を入力単語列群意味蓄積文側被含有尺度とする。

【0122】

ここでは、例えば、まず、単語ｎグラムの「ｎ」の値が「１」である場合に繰り返し行われたＳＢ５からＳＢ８のＳＢ８で求めた入力単語列意味蓄積文側被含有尺度とし、図９の項目「ｎの数」＝「１」に関連付けられている項目「第１尺度値」である「１」、「Ｖｉ１１」、及び「Ｖｉ１２」を取得する。次に、取得した入力単語列意味蓄積文側被含有尺度である「１」、「Ｖｉ１１」、及び「Ｖｉ１２」各々に関連する重みの値を特定する。詳細には、逆文書頻度特定情報ＤＢ２２４の図４の逆文書頻度特定情報を参照して、「１」を求める対象となった１個の入力文の単語１グラムである「ｃｈｅｃｋｏｕｔ」に関連付けられている逆文書頻度情報である「Ｖｉ（ｃｈｅｃｋｏｕｔ）」を特定し、また、同様にして、「Ｖｉ１１」、及び「Ｖｉ１２」の対象となった１個の入力文の単語１グラムである「は」、「いつ」に関連付けられている逆文書頻度情報である「Ｖｉ（は）」、「Ｖｉ（いつ）」を特定する。次に、図７の数式Ｍ２−１に図示されているように、分子（被除数）を「１×Ｖｉ（ｃｈｅｃｋｏｕｔ）の二乗＋Ｖｉ１１×Ｖｉ（は）の二乗＋Ｖｉ１２×Ｖｉ（いつ）の二乗」とし、分母（除数）を「Ｖｉ（ｃｈｅｃｋｏｕｔ）の二乗＋Ｖｉ（は）の二乗＋Ｖｉ（いつ）の二乗」とした除算を行い、当該除算結果の平方根を求める演算を行う。例えば、図９の項目「ｎの数」＝「１」の項目「第２尺度値」の欄に記載されている「Ｖｉ２１」を演算結果として求め、当該「Ｖｉ２１」を入力単語列群意味蓄積文側被含有尺度とする。

【0123】

そして、前述したように、単語ｎグラムの「ｎ」を「１」ずつ増加させて、「ｎ」がＳＢ３で決定した最大グラム数になるまで、各「ｎ」について図８のＳＢ４からＳＢ９を実行することになるが、次のＳＢ４において、「ｎ」を「２」として、図９の項目「ｎの数」＝「２」に関連付けられている項目「単語ｎグラム（入力文）」及び項目「単語ｎグラム（蓄積文）」の各欄の単語２グラムを生成する。そして、前述の場合と同様にして、ＳＢ５からＳＢ９の処理を行って、ＳＢ９において、図９の項目「ｎの数」＝「２」の項目「第２尺度値」の欄に記載されている「Ｖｉ２２」を演算結果として求めて、入力単語列群意味蓄積文側被含有尺度とする。そして、次のＳＢ４において、「ｎ」を「３」として、図９の項目「ｎの数」＝「３」に関連付けられている項目「単語ｎグラム（入力文）」及び項目「単語ｎグラム（蓄積文）」の各欄の単語３グラムを生成する。そして、前述の場合と同様にして、ＳＢ５からＳＢ９の処理を行って、ＳＢ９において、図９の項目「ｎの数」＝「３」の項目「第２尺度値」の欄に記載されている「Ｖｉ２３」を演算結果として求めて、入力単語列群意味蓄積文側被含有尺度とする。

【0124】

そして、単語ｎグラムの「ｎ」がＳＢ３で決定した最大グラム数までＳＢ４からＳＢ９を実行した後のＳＢ１０において演算部２３２は、入力文意味蓄積文側被含有尺度を求める。具体的には任意であるが、例えば、図７の数式Ｍ２に基づいて求める。

【0125】

詳細には、例えば、図７の数式Ｍ２の重みの値を特定する情報（例えば、単語ｎグラムの「ｎ」が「１」から「３」の場合各々の重みの値が「Ｖｌ１」から「Ｖｌ３」（「Ｖｌ１」から「Ｖｌ３」は数値であることとする）各々であることを示す情報等）が記録部２２に記録されていることとし、当該記録されている情報及びＳＢ９で求めた入力単語列群意味蓄積文側被含有尺度を用いて、数式Ｍ２の演算を行い、演算結果を入力文意味蓄積文側被含有尺度として求める。

【0126】

ここでは、例えば、図９の項目「第２尺度値」の欄に記載されている「Ｖｉ２１」、「Ｖｉ２２」、及び「Ｖｉ２３」を、ＳＢ９で入力単語列群意味蓄積文側被含有尺度として演算したので、前述の記録部２２に記録されて重みの値を特定する情報を参照して重みを特定した上で、分子（被除数）を「Ｖｉ２１×Ｖｌ１＋Ｖｉ２２×Ｖｌ２＋Ｖｉ２３×Ｖｌ３」とし、分母（除数）を「Ｖｌ１＋Ｖｌ２＋Ｖｌ３」とした除算を行い、除算結果を入力文意味蓄積文側被含有尺度として求める。例えば、図９の項目「第３尺度値」の欄に記載されている「Ｖｉ３」を演算結果として求め、当該「Ｖｉ３」を入力文意味蓄積文側被含有尺度とする。これにて、入力文意味蓄積文側被含有尺度演算処理をリターンする。

【0127】

なお、例えば、図８のＳＢ７の処理が、「第２演算処理側第１処理」及び「第２演算処理側第２処理」に対応する。また、例えば、図８のＳＢ８の処理が「第２演算処理側第３処理」に対応する。また、例えば、繰り返し行われる図８のＳＢ８の処理が「第２演算処理側第４処理」に対応する。また、例えば、図８のＳＢ９の処理が「第２演算処理側第５処理」に対応する。

【0128】

図６のＳＡ４において演算部２３２は、蓄積文意味入力文側被含有尺度演算処理を実行する。図１０は、蓄積文意味入力文側被含有尺度演算処理のフローチャートである。なお、「蓄積文意味入力文側被含有尺度演算処理」とは、蓄積文の意味が入力文に含まれる程度を示す尺度である蓄積文意味入力文側被含有尺度（第２文意味第１文側被含有尺度）を演算する処理（第１演算処理）である。

【0129】

図１１は、蓄積文意味入力文側被含有尺度演算処理の演算例を説明するための図である。この図１１の各項目の情報は、図９の各項目と同様な情報である。

【0130】

なお、蓄積文意味入力文側被含有尺度演算処理については、図７の数式Ｍ１に対応する処理であり、つまり、前述の図８の入力文意味蓄積文側被含有尺度演算処理において、入力文を蓄積文を相互に入れ替えた処理であるので、概要のみ説明する。

【0131】

図１０のＳＣ１からＳＣ３において、図８のＳＢ１からＳＢ３と同様な処理を行う。次に、単語ｎグラムの「ｎ」を「１」からＳＢ３で決定した最大グラム数（ここでは、「３」）まで「１」ずつ増加させて、各「ｎ」について図１０のＳＣ４からＳＣ９を実行する。図１０のＳＣ４において、図８のＳＢ４と同様な処理を行う。

【0132】

次に、ＳＣ４で生成した蓄積文の各単語ｎグラムについてＳＣ５からＳＣ８を実行することにより、蓄積文の単語ｎグラムの個数分だけＳＣ５からＳＣ８を実行する。

【0133】

図１０のＳＣ５において演算部２３２は、ＳＣ４で生成した入力文及び蓄積文の単語ｎグラムから、未だ取得していない１個の蓄積文の単語ｎグラム、及び全ての入力文の単語ｎグラムを取得する。具体的には図８のＳＢ５と同様な処理を行う。

【0134】

図１０のＳＣ６において演算部２３２は、ＳＣ５で取得した入力文の単語ｎグラムの中に、ＳＣ５で取得した１個の蓄積文の単語ｎグラムと意味が類似している単語ｎグラムが存在するか否かを判定する。具体的には図８のＳＢ６と同様な処理を行う。

【0135】

図１０のＳＣ６において、ＳＣ５で取得した入力文の単語ｎグラムの中に、ＳＣ５で取得した１個の蓄積文の単語ｎグラムと意味が類似している単語ｎグラムが存在しないものと判定した（ＳＣ６のＮＯ）後のＳＣ７において演算部２３２は、図７の数式Ｍ２−１−１の第２部分の「ｃｏｓ（ｖｅｃ（ｎ１），ｖｅｃ（ｎ２））×ｗｅｉｇｈｔ（ｎ１，ｎ２）」に対応する演算を行う。ここでは、例えば、図１１の項目「類似演算値」に対応する演算値（第１演算値）を演算で求める。

【0136】

図１０のＳＣ８において演算部２３２は、蓄積文の単語ｎグラム（蓄積文の単語列）の意味が入力文に含まれる程度を示す蓄積単語列意味入力文側被含有尺度を求める。なお、この蓄積単語列意味入力文側被含有尺度は、「第２単語列意味第１文側被含有尺度」に対応し、また、図１１の項目「第１尺度値」に対応する。具体的には図８のＳＢ８と同様な処理を行う。ここでは、例えば、図１１の項目「第１尺度値」に対応する情報を演算で求める。

【0137】

図１０のＳＣ９において演算部２３２は、蓄積文の単語ｎグラムの集合（蓄積文の単語列群）の意味が入力文に含まれる程度を示す蓄積単語列群意味入力文側被含有尺度を求める。なお、この蓄積単語列群意味入力文側被含有尺度は、「第２単語列群意味第１文側被含有尺度」に対応し、また、図１１の項目「第２尺度値」に対応する。具体的には図８のＳＢ９と同様な処理を行う。ここでは、例えば、図１１の項目「第２尺度値」に対応する情報を演算で求める。

【0138】

そして、単語ｎグラムの「ｎ」がＳＣ３で決定した最大グラム数までＳＣ４からＳＣ９を実行した後のＳＣ１０において演算部２３２は、蓄積文意味入力文側被含有尺度を求める。具体的には図８のＳＢ１０と同様な処理を行う。ここでは、例えば、図１１の項目「第３尺度値」に対応する情報を演算で求める。これにて、蓄積文意味入力文側被含有尺度演算処理をリターンする。

【0139】

なお、例えば、図１０のＳＣ７の処理が、「第１演算処理側第１処理」及び「第１演算処理側第２処理」に対応する。また、例えば、図１０のＳＣ８の処理が「第１演算処理側第３処理」に対応する。また、例えば、繰り返し行われる図１０のＳＣ８の処理が「第１演算処理側第４処理」に対応する。また、例えば、図１０のＳＣ９の処理が「第１演算処理側第５処理」に対応する。

【0140】

図６のＳＡ５において演算部２３２は、文間類似度を演算する。なお、ここでの処理が「第３演算処理」に対応する。具体的には任意であるが、例えば、ＳＡ３で求めた入力文意味蓄積文側被含有尺度と、ＳＡ４で求めた蓄積文意味入力文側被含有尺度とを取得し、これらの各尺度を用いて図７の数式Ｍの演算を行い、演算結果を文間類似度とする。ここでは、例えば、ＳＡ３で求めた入力文意味蓄積文側被含有尺度として図９の項目「第３尺度値」の欄の「Ｖｉ３」を取得し、また、ＳＡ４で求めた蓄積文意味入力文側被含有尺度として図１１の項目「第３尺度値」の欄の「Ｖｓ３」を取得し、分子（被除数）を「２×Ｖｓ３×Ｖｉ３」とし、分母（除数）を「Ｖｓ３＋Ｖｉ３」として除算を行い、除算結果を文間類似度とする。

【0141】

図６のＳＡ６において制御部２３は、入力文と全ての蓄積文との文間類似度を演算したか否かを判定する。具体的には任意であるが、例えば、質問回答特定情報ＤＢ２２５の図５の質問回答特定情報において、前述の取得済フラグに着目して、全ての質問情報についてＳＡ２で取得し取得済であるか否かに基づいて判定する。そして、全ての質問情報についてＳＡ２で取得したわけではないものと判定した場合、入力文と全ての蓄積文との文間類似度を演算したわけではないものと判定し（ＳＡ６のＮＯ）、ＳＡ２に移行する。また、全ての質問情報についてＳＡ２で取得したものと判定した場合、入力文と全ての蓄積文との文間類似度を演算したものと判定し（ＳＡ６のＹＥＳ）、ＳＡ７に移行する。

【0142】

ここでは、例えば、ＳＡ１で取得した入力文と、質問回答特定情報ＤＢ２２５の図５の質問回答特定情報における全ての質問情報が示す文（蓄積文）との文間類似度を演算した後、入力文と全ての蓄積文との文間類似度を演算したものと判定し、ＳＡ７に移行することになる。

【0143】

図６のＳＡ７において制御部２３は、回答を出力する。具体的には任意であるが、例えば、繰り返し行われるＳＡ５で演算した文間類似度を取得し、取得した文間類似度の内の数値が最大となる文間類似度を特定し、特定した文間類似度の演算の対象となった蓄積文を特定し、質問回答特定情報ＤＢ２２５の図５の質問回答特定情報を参照して、当該特定した蓄積文に対応する回答情報を取得する。次に、制御部２３は、取得した回答情報を、通信部２１を介して、前述の入力文情報を送信した端末装置１に対して送信する。一方、端末装置１の制御部１５は、サーバ装置２から送信された回答情報を、通信部１１を介して受信し、受信した当該回答情報が示す文を、前述のタッチパッド１２を介してユーザに入力された質問に対する回答としてディスプレイ１３に表示する。

【0144】

ここでは、例えば、繰り返し行われるＳＡ５で演算した文間類似度の数値の内の最大となるものが、入力文である「ｃｈｅｃｋｏｕｔはいつ」と蓄積文である「チェックインチェックアウトは何時」との文間類似度である場合、当該文間類似度を特定し、特定した文間類似度の演算の対象となった蓄積文である「チェックインチェックアウトは何時」を特定し、質問回答特定情報ＤＢ２２５の図５の質問回答特定情報を参照して、当該特定した蓄積文である「チェックインチェックアウトは何時」に対応する回答情報である「チェックインは１５時でチェックアウトは１０時です」を取得する。次に、制御部２３は、取得した回答情報である「チェックインは１５時でチェックアウトは１０時です」を、通信部２１を介して、前述の入力文情報である「ｃｈｅｃｋｏｕｔはいつ」を示す情報を送信した端末装置１に対して送信する。一方、端末装置１の制御部１５は、「チェックインは１５時でチェックアウトは１０時です」を、「ｃｈｅｃｋｏｕｔはいつ」に対する回答としてディスプレイ１３に表示する。

【0145】

（実施の形態の効果）
このように本実施の形態によれば、単語列間類似度に基づいて蓄積文意味入力文側被含有尺度を演算し、また、単語列間類似度に基づいて入力文意味蓄積文側被含有尺度を演算した上で、これらの演算結果に基づいて文間類似度を演算することにより、例えば、少なくとも単語列の単位（つまり、比較的小さい粒度の単位）の類似度を用いて文間類似度を演算するので、入力文及び蓄積文相互間の意味の類似性の度合いを的確に把握することが可能となる。また、蓄積文意味入力文側被含有尺度及び入力文意味蓄積文側被含有尺度に基づいて文間類似度を演算するので、入力文及び蓄積文相互間の意味の類似性の度合いをより的確に把握することが可能となる。

【0146】

また、単語列間類似度に基づいて蓄積単語列意味入力文側被含有尺度を演算し、演算結果に基づいて蓄積文意味入力文側被含有尺度を演算し、また、単語列間類似度に基づいて入力単語列意味蓄積文側被含有尺度を演算し、演算結果に基づいて入力文意味蓄積文側被含有尺度を演算することにより、例えば、単語列の単位（つまり、比較的小さい粒度の単位）で意味が文に含まれる程度を考慮することができるので、入力文及び蓄積文相互間の意味の類似性の度合いをより的確に把握することが可能となる。

【0147】

また、蓄積単語列意味入力文側被含有尺度に基づいて蓄積単語列群意味入力文側被含有尺度を演算し、演算結果に基づいて蓄積文意味入力文側被含有尺度を演算し、また、入力単語列意味蓄積文側被含有尺度に基づいて入力単語列群意味蓄積文側被含有尺度を演算し、演算結果に基づいて入力単語列群意味蓄積文側被含有尺度を演算することにより、例えば、単語列群の単位（つまり、単語列よりも大きな粒度の単位）で意味が文に含まれる程度も考慮することができるので、入力文及び蓄積文相互間の意味の類似性の度合いをより的確に把握することが可能となる。

【0148】

また、第１単語列の個数分の第１演算値（コサイン類似度に基づく演算値）の内の最大値を、蓄積文における１個の第２単語列の意味が入力文に含まれる程度を示す蓄積単語列意味入力文側被含有尺度とし、また、第２単語列の個数分の第２演算値（コサイン類似度に基づく演算値）の内の最大値を、入力文における１個の第１単語列の意味が蓄積文に含まれる程度を示す入力単語列意味蓄積文側被含有尺度とすることにより、例えば、蓄積単語列意味入力文側被含有尺度、及び入力単語列意味蓄積文側被含有尺度を適切に演算することができるので、入力文及び蓄積文相互間の意味の類似性の度合いをより的確に把握することが可能となる。

【0149】

また、第２単語列の個数分の蓄積単語列意味入力文側被含有尺度を演算し、演算した蓄積単語列意味入力文側被含有尺度についての平均に対応する演算を行うことにより蓄積単語列群意味入力文側被含有尺度を演算し、また、第１単語列の個数分の入力単語列意味蓄積文側被含有尺度を演算し、演算した入力単語列意味蓄積文側被含有尺度についての平均に対応する演算を行うことにより入力単語列群意味蓄積文側被含有尺度を演算することにより、例えば、蓄積単語列群意味入力文側被含有尺度、及び入力単語列群意味蓄積文側被含有尺度を適切に演算することができるので、入力文及び蓄積文相互間の意味の類似性の度合いを的確に把握することが可能となる。

【0150】

また、ｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の蓄積単語列群意味入力文側被含有尺度を演算し、演算した蓄積単語列群意味入力文側被含有尺度についての平均に対応する演算を行うことにより、蓄積文意味入力文側被含有尺度を演算し、また、ｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の入力単語列群意味蓄積文側被含有尺度を演算し、演算した入力単語列群意味蓄積文側被含有尺度についての平均に対応する演算を行うことにより、入力文意味蓄積文側被含有尺度を演算した上で、蓄積文意味入力文側被含有尺度と入力文意味蓄積文側被含有尺度との平均を文間類似度として演算することにより、例えば、蓄積文意味入力文側被含有尺度、及び入力文意味蓄積文側被含有尺度を適切に演算することができるので、入力文及び蓄積文相互間の意味の類似性の度合いをより的確に把握することが可能となる。

【0151】

〔実施の形態に対する変形例〕
以上、本発明に係る実施の形態について説明したが、本発明の具体的な構成及び手段は、特許請求の範囲に記載した本発明の技術的思想の範囲内において、任意に改変及び改良することができる。以下、このような変形例について説明する。

【0152】

（解決しようとする課題や発明の効果について）
まず、発明が解決しようとする課題や発明の効果は、上述の内容に限定されるものではなく、発明の実施環境や構成の細部に応じて異なる可能性があり、上述した課題の一部のみを解決したり、上述した効果の一部のみを奏したりすることがある。

【0153】

（分散や統合について）
また、上述した各電気的構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各部の分散や統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散又は統合して構成できる。また、本出願における「装置」とは、単一の装置によって構成されたものに限定されず、複数の装置によって構成されたものを含む。

【0154】

（形状、数値、構造、時系列について）
実施の形態や図面において例示した構成要素に関して、形状、数値、又は複数の構成要素の構造若しくは時系列の相互関係については、本発明の技術的思想の範囲内において、任意に改変及び改良することができる。

【0155】

（重みの値について）
また、上記実施の形態では、図７の各数式の重みの値を任意に変更してもよい。具体的には、数式Ｍ２−１、Ｍ２−１−１の重みの値として所定値（予め定められている値）を用いてもよいし、あるいは、前述したように、各重みの値を省略してもよい。なお、数式Ｍ２についても同様としてもよい。

【0156】

（処理フローについて）
また、上記実施の形態では、図７の各数式の演算を実施する処理フローとして、図８及び図１０の処理フローを実行する場合について説明した、これに限らず、図７の演算を行う限りにおいて他の任意のフローを実行してもよい。

【0157】

（入力文意味蓄積文側被含有尺度演算処理等について）
また、上記実施の形態の図６のＳＡ３の入力文意味蓄積文側被含有尺度演算処理では、入力文側及び蓄積文側において単語ｎグラムの「ｎ」の値が相互に同じである場合について説明したが、これに限らない。例えば、「ｎ」の値を相互に異ならせて処理を行ってもよい。この場合、任意の手法（例えば、前述の「ベクトルの各要素を加算する手法」で説明した手法、あるいは、その他の公知の手法等）でベクトルの次元を相互に一致させて処理を行ってもよい。なお、図６のＳＡ４の蓄積文意味入力文側被含有尺度演算処理についても同様である。

【0158】

（類似の判定について）
また、上記実施の形態の図８のＳＢ６の類似の判定手法を任意に変更してもよい。例えば、図１の類似語特定情報ＤＢ２２１の類似語特定情報として、「ｎ」の値の相互に異なる単語ｎグラムが相互に類似していることを特定する情報も記録されていることとし、当該記録されている情報に基づいて、「ｎ」の値に関わらずに蓄積文の単語ｎグラムを全て取得し、そのうちの少なくとも１個の単語ｎグラムと、ＳＢ５で取得した１個の入力文の単語ｎグラムが相互に類似しているか否かを判定してもよい。なお、図１０のＳＣ６の処理についても同様である。

【0159】

（適用について）
また、上記実施の形態では、図７の各数式の演算に基づいてチャットシステム１００を実現する場合について説明したが、これに限らない。図７の各数式の演算を行って、単に文間類似度を演算するのみシステムに適用してもよい。

【0160】

（付記）
付記１の演算システムは、第１文及び第２文の類似性の度合いである文間類似度を演算する演算システムであって、前記第１文及び前記第２文を取得する取得手段と、前記取得手段が取得した前記第１文及び前記第２文に基づいて、前記文間類似度を演算する演算手段と、を備え、前記演算手段は、前記取得手段が取得した前記第１文に含まれている複数の単語の内のｎ個（ｎは正の整数）の連続する単語からなる第１単語列と、前記取得手段が取得した前記第２文に含まれている複数の単語の内のｎ個（ｎは正の整数）の連続する単語からなる第２単語列との類似性の度合いである単語列間類似度に基づいて、前記第２文の意味が前記第１文に含まれる程度を示す第２文意味第１文側被含有尺度を演算する第１演算処理と、前記単語列間類似度に基づいて、前記第１文の意味が前記第２文に含まれる程度を示す第１文意味第２文側被含有尺度を演算する第２演算処理と、前記第１演算処理にて演算された前記第２文意味第１文側被含有尺度と、前記第２演算処理にて演算された前記第１文意味第２文側被含有尺度とに基づいて、前記文間類似度を演算する第３演算処理と、を行う。

【0161】

付記２の演算システムは、付記１に記載の演算システムにおいて、前記演算手段は、前記第１演算処理において、前記単語列間類似度に基づいて、前記第２単語列の意味が前記第１文に含まれる程度を示す第２単語列意味第１文側被含有尺度を演算し、演算した前記第２単語列意味第１文側被含有尺度に基づいて、前記第２文意味第１文側被含有尺度を演算し、前記第２演算処理において、前記単語列間類似度に基づいて、前記第１単語列の意味が前記第２文に含まれる程度を示す第１単語列意味第２文側被含有尺度を演算し、演算した前記第１単語列意味第２文側被含有尺度に基づいて、前記第１文意味第２文側被含有尺度を演算する。

【0162】

付記３の演算システムは、付記２に記載の演算システムにおいて、前記演算手段は、前記第１演算処理において、前記第２単語列意味第１文側被含有尺度に基づいて、前記取得手段が取得した前記第２文に含まれている前記第２単語列の集合である第２単語列群の意味が前記第１文に含有されている程度を示す第２単語列群意味第１文側被含有尺度を演算し、演算した前記第２単語列群意味第１文側被含有尺度に基づいて、前記第２文意味第１文側被含有尺度を演算し、前記第２演算処理において、前記第１単語列意味第２文側被含有尺度に基づいて、前記取得手段が取得した前記第１文に含まれている前記第１単語列の集合である第１単語列群の意味が前記第２文に含有されている程度を示す第１単語列群意味第２文側被含有尺度を演算し、演算した前記第１単語列群意味第２文側被含有尺度に基づいて、前記第１文意味第２文側被含有尺度を演算する。

【0163】

付記４の演算システムは、付記３に記載の演算システムにおいて、前記演算手段は、前記第１演算処理において、前記第１文における１個の前記第１単語列を示す分散表現の第１ベクトルと、前記第２文における１個の前記第２単語列を示す分散表現の第２ベクトルとのコサイン類似度に基づく第１演算値を演算する第１演算処理側第１処理と、前記第１演算処理側第１処理において、前記第１文に含まれている前記第１単語列を順次適用して、当該第１演算処理側第１処理を前記第１単語列の個数に対応する回数分繰り返し実行し、前記第１単語列の個数分の前記第１演算値を演算する第１演算処理側第２処理と、前記第１演算処理側第２処理で演算された前記第１単語列の個数分の前記第１演算値の内の最大値を、前記第２文における１個の前記第２単語列の意味が前記第１文に含まれる程度を示す前記第２単語列意味第１文側被含有尺度とする第１演算処理側第３処理と、を行い、前記第２演算処理において、前記コサイン類似度に基づく第２演算値を演算する第２演算処理側第１処理と、前記第２演算処理側第１処理において、前記第２文に含まれている前記第２単語列を順次適用して、当該第２演算処理側第１処理を前記第２単語列の個数に対応する回数分繰り返し実行し、前記第２単語列の個数分の前記第２演算値を演算する第２演算処理側第２処理と、前記第２演算処理側第２処理で演算された前記第２単語列の個数分の前記第２演算値の内の最大値を、前記第１文における１個の前記第１単語列の意味が前記第２文に含まれる程度を示す前記第１単語列意味第２文側被含有尺度とする第２演算処理側第３処理と、を行う。

【0164】

付記５の演算システムは、付記４に記載の演算システムにおいて、前記演算手段は、前記第１演算処理において、前記第２文に含まれている前記第２単語列を順次適用して、前記第１演算処理側第１処理、前記第１演算処理側第２処理、及び前記第１演算処理側第３処理を、前記第２単語列の個数に対応する回数分繰り返し実行し、前記第２単語列の個数分の前記第２単語列意味第１文側被含有尺度を演算する第１演算処理側第４処理と、前記第１演算処理側第４処理で演算した前記第２単語列の個数分の前記第２単語列意味第１文側被含有尺度についての平均に対応する演算を行うことにより、前記第２単語列群意味第１文側被含有尺度を演算する第１演算処理側第５処理と、を更に行い、前記第２演算処理において、前記第１文に含まれている前記第１単語列を順次適用して、前記第２演算処理側第１処理、前記第２演算処理側第２処理、及び前記第２演算処理側第３処理を、前記第１単語列の個数に対応する回数分繰り返し実行し、前記第１単語列の個数分の前記第１単語列意味第２文側被含有尺度を演算する第２演算処理側第４処理と、前記第２演算処理側第４処理で演算した前記第１単語列の個数分の前記第１単語列意味第２文側被含有尺度についての平均に対応する演算を行うことにより、前記第１単語列群意味第２文側被含有尺度を演算する第２演算処理側第５処理と、を更に行う。

【0165】

付記６の演算システムは、付記５に記載の演算システムにおいて、前記演算手段は、前記第１演算処理において、前記第１演算処理側第１処理乃至前記第１演算処理側第５処理を実行し、前記第１単語列に含まれる単語の個数であるｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の前記第２単語列群意味第１文側被含有尺度を演算し、演算した前記第２単語列群意味第１文側被含有尺度についての平均に対応する演算を行うことにより、前記第２文意味第１文側被含有尺度を演算し、前記第２演算処理において、前記第２演算処理側第１処理乃至前記第２演算処理側第５処理を実行し、前記第２単語列に含まれる単語の個数であるｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の前記第１単語列群意味第２文側被含有尺度を演算し、演算した前記第１単語列群意味第２文側被含有尺度についての平均に対応する演算を行うことにより、前記第１文意味第２文側被含有尺度を演算し、前記第３演算処理において、前記第１演算処理にて演算された前記第２文意味第１文側被含有尺度と、前記第２演算処理にて演算された前記第１文意味第２文側被含有尺度との平均を前記文間類似度として演算する。

【0166】

付記７の演算プログラムは、第１文及び第２文の類似性の度合いである文間類似度を演算する演算プログラムであって、コンピュータを、前記第１文及び前記第２文を取得する取得手段と、前記取得手段が取得した前記第１文及び前記第２文に基づいて、前記文間類似度を演算する演算手段と、として機能させ、前記演算手段は、前記取得手段が取得した前記第１文に含まれている複数の単語の内のｎ個（ｎは正の整数）の連続する単語からなる第１単語列と、前記取得手段が取得した前記第２文に含まれている複数の単語の内のｎ個（ｎは正の整数）の連続する単語からなる第２単語列との類似性の度合いである単語列間類似度に基づいて、前記第２文の意味が前記第１文に含まれる程度を示す第２文意味第１文側被含有尺度を演算する第１演算処理と、前記単語列間類似度に基づいて、前記第１文の意味が前記第２文に含まれる程度を示す第１文意味第２文側被含有尺度を演算する第２演算処理と、前記第１演算処理にて演算された前記第２文意味第１文側被含有尺度と、前記第２演算処理にて演算された前記第１文意味第２文側被含有尺度とに基づいて、前記文間類似度として演算する第３演算処理と、を行う。

【0167】

（付記の効果）
付記１に記載の演算システム、及び付記７に記載の演算システムによれば、単語列間類似度に基づいて第２文意味第１文側被含有尺度を演算し、また、単語列間類似度に基づいて第１文意味第２文側被含有尺度を演算した上で、これらの演算結果に基づいて文間類似度を演算することにより、例えば、少なくとも単語列の単位（つまり、比較的小さい粒度の単位）の類似度を用いて文間類似度を演算するので、第１文及び第２文相互間の意味の類似性の度合いを的確に把握することが可能となる。また、第２文意味第１文側被含有尺度及び第１文意味第２文側被含有尺度に基づいて文間類似度を演算するので、第１文及び第２文相互間の意味の類似性の度合いをより的確に把握することが可能となる。

【0168】

付記２に記載の演算システムによれば、単語列間類似度に基づいて第２単語列意味第１文側被含有尺度を演算し、演算結果に基づいて第２文意味第１文側被含有尺度を演算し、また、単語列間類似度に基づいて第１単語列意味第２文側被含有尺度を演算し、演算結果に基づいて第１文意味第２文側被含有尺度を演算することにより、例えば、単語列の単位（つまり、比較的小さい粒度の単位）で意味が文に含まれる程度を考慮することができるので、第１文及び第２文相互間の意味の類似性の度合いを的確に把握することが可能となる。

【0169】

付記３に記載の演算システムによれば、第２単語列意味第１文側被含有尺度に基づいて第２単語列群意味第１文側被含有尺度を演算し、演算結果に基づいて第２文意味第１文側被含有尺度を演算し、また、第１単語列意味第２文側被含有尺度に基づいて第１単語列群意味第２文側被含有尺度を演算し、演算結果に基づいて第１文意味第２文側被含有尺度を演算することにより、例えば、単語列群の単位（つまり、単語列よりも大きな粒度の単位）で意味が文に含まれる程度も考慮することができるので、第１文及び第２文相互間の意味の類似性の度合いを的確に把握することが可能となる。

【0170】

付記４に記載の演算システムによれば、第１単語列の個数分の第１演算値（コサイン類似度に基づく演算値）の内の最大値を、第２文における１個の第２単語列の意味が第１文に含まれる程度を示す第２単語列意味第１文側被含有尺度とし、また、第２単語列の個数分の第２演算値（コサイン類似度に基づく演算値）の内の最大値を、第１文における１個の第１単語列の意味が第２文に含まれる程度を示す第１単語列意味第２文側被含有尺度とすることにより、例えば、第２単語列意味第１文側被含有尺度、及び第１単語列意味第２文側被含有尺度を適切に演算することができるので、第１文及び第２文相互間の意味の類似性の度合いを的確に把握することが可能となる。

【0171】

付記５に記載の演算システムによれば、第２単語列の個数分の第２単語列意味第１文側被含有尺度を演算し、演算した第２単語列意味第１文側被含有尺度についての平均に対応する演算を行うことにより第２単語列群意味第１文側被含有尺度を演算し、また、第１単語列の個数分の第１単語列意味第２文側被含有尺度を演算し、演算した第１単語列意味第２文側被含有尺度についての平均に対応する演算を行うことにより第１単語列群意味第２文側被含有尺度を演算することにより、例えば、第２単語列群意味第１文側被含有尺度、及び第１単語列群意味第２文側被含有尺度を適切に演算することができるので、第１文及び第２文相互間の意味の類似性の度合いを的確に把握することが可能となる。

【0172】

付記６に記載の演算システムによれば、ｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の第２単語列群意味第１文側被含有尺度を演算し、演算した第２単語列群意味第１文側被含有尺度についての平均に対応する演算を行うことにより、第２文意味第１文側被含有尺度を演算し、また、ｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の第１単語列群意味第２文側被含有尺度を演算し、演算した第１単語列群意味第２文側被含有尺度についての平均に対応する演算を行うことにより、第１文意味第２文側被含有尺度を演算した上で、第２文意味第１文側被含有尺度と第１文意味第２文側被含有尺度との平均を文間類似度として演算することにより、例えば、第２文意味第１文側被含有尺度、及び第１文意味第２文側被含有尺度を適切に演算することができるので、第１文及び第２文相互間の意味の類似性の度合いを的確に把握することが可能となる。

【符号の説明】

【0173】

１端末装置
２サーバ装置
１１通信部
１２タッチパッド
１３ディスプレイ
１４記録部
１５制御部
２１通信部
２２記録部
２３制御部
１００チャットシステム
２２１類似語特定情報ＤＢ
２２２単語間類似度特定情報ＤＢ
２２３共起度特定情報ＤＢ
２２４逆文書頻度特定情報ＤＢ
２２５質問回答特定情報ＤＢ
２３１取得部
２３２演算部

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

【図8】

【図9】

【図10】

【図11】

【手続補正書】

【提出日】2020年8月6日

【手続補正1】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

第１文及び第２文の類似性の度合いである文間類似度を演算する演算システムであって、
前記第１文及び前記第２文を取得する取得手段と、
前記取得手段が取得した前記第１文及び前記第２文に基づいて、前記文間類似度を演算する演算手段と、を備え、
前記演算手段は、
前記取得手段が取得した前記第１文に含まれている複数の単語の内のｎ個（ｎは正の整数）の連続する単語からなる第１単語列と、前記取得手段が取得した前記第２文に含まれている複数の単語の内のｎ個（ｎは正の整数）の連続する単語からなる第２単語列との類似性の度合いである単語列間類似度に基づいて、前記第２文の意味が前記第１文に含まれる程度を示す第２文意味第１文側被含有尺度を演算する第１演算処理と、
前記単語列間類似度に基づいて、前記第１文の意味が前記第２文に含まれる程度を示す第１文意味第２文側被含有尺度を演算する第２演算処理と、
前記第１演算処理にて演算された前記第２文意味第１文側被含有尺度と、前記第２演算処理にて演算された前記第１文意味第２文側被含有尺度とに基づいて、前記文間類似度を演算する第３演算処理と、を行い、
前記演算手段は、
前記第１演算処理において、前記単語列間類似度に基づいて、前記第２単語列の意味が前記第１文に含まれる程度を示す第２単語列意味第１文側被含有尺度を演算し、演算した前記第２単語列意味第１文側被含有尺度に基づいて、前記第２文意味第１文側被含有尺度を演算し、
前記第２演算処理において、前記単語列間類似度に基づいて、前記第１単語列の意味が前記第２文に含まれる程度を示す第１単語列意味第２文側被含有尺度を演算し、演算した前記第１単語列意味第２文側被含有尺度に基づいて、前記第１文意味第２文側被含有尺度を演算し、
前記演算手段は、
前記第１演算処理において、前記第２単語列意味第１文側被含有尺度に基づいて、前記取得手段が取得した前記第２文に含まれている前記第２単語列の集合である第２単語列群の意味が前記第１文に含有されている程度を示す第２単語列群意味第１文側被含有尺度を演算し、演算した前記第２単語列群意味第１文側被含有尺度に基づいて、前記第２文意味第１文側被含有尺度を演算し、
前記第２演算処理において、前記第１単語列意味第２文側被含有尺度に基づいて、前記取得手段が取得した前記第１文に含まれている前記第１単語列の集合である第１単語列群の意味が前記第２文に含有されている程度を示す第１単語列群意味第２文側被含有尺度を演算し、演算した前記第１単語列群意味第２文側被含有尺度に基づいて、前記第１文意味第２文側被含有尺度を演算し、
前記単語列間類似度は、前記第１文における１個の前記第１単語列を示す分散表現の第１ベクトルと、前記第２文における１個の前記第２単語列を示す分散表現の第２ベクトルとのコサイン類似度であり、
前記演算手段は、
前記第１演算処理において、
前記コサイン類似度に基づく第１演算値であって、前記コサイン類似度に対応する数値と重みに対応する数値との積算結果である前記第１演算値を演算する第１演算処理側第１処理と、
前記第１演算処理側第１処理において、前記第１文に含まれている前記第１単語列を順次適用して、当該第１演算処理側第１処理を前記第１単語列の個数に対応する回数分繰り返し実行し、前記第１単語列の個数分の前記第１演算値を演算する第１演算処理側第２処理と、
前記第１演算処理側第２処理で演算された前記第１単語列の個数分の前記第１演算値の内の最大値を、前記第２文における１個の前記第２単語列の意味が前記第１文に含まれる程度を示す前記第２単語列意味第１文側被含有尺度とする第１演算処理側第３処理と、を行い、
前記第２演算処理において、
前記コサイン類似度に基づく第２演算値であって、前記コサイン類似度に対応する数値と重みに対応する数値との積算結果である前記第２演算値を演算する第２演算処理側第１処理と、
前記第２演算処理側第１処理において、前記第２文に含まれている前記第２単語列を順次適用して、当該第２演算処理側第１処理を前記第２単語列の個数に対応する回数分繰り返し実行し、前記第２単語列の個数分の前記第２演算値を演算する第２演算処理側第２処理と、
前記第２演算処理側第２処理で演算された前記第２単語列の個数分の前記第２演算値の内の最大値を、前記第１文における１個の前記第１単語列の意味が前記第２文に含まれる程度を示す前記第１単語列意味第２文側被含有尺度とする第２演算処理側第３処理と、を行い、
前記演算手段は、
前記第１演算処理において、
前記第２文に含まれている前記第２単語列を順次適用して、前記第１演算処理側第１処理、前記第１演算処理側第２処理、及び前記第１演算処理側第３処理を、前記第２単語列の個数に対応する回数分繰り返し実行し、前記第２単語列の個数分の前記第２単語列意味第１文側被含有尺度を演算する第１演算処理側第４処理と、
前記第１演算処理側第４処理で演算した前記第２単語列の個数分の前記第２単語列意味第１文側被含有尺度についての平均に対応する演算を行うことにより、前記第２単語列群意味第１文側被含有尺度を演算する第１演算処理側第５処理と、を更に行い、
前記第２演算処理において、
前記第１文に含まれている前記第１単語列を順次適用して、前記第２演算処理側第１処理、前記第２演算処理側第２処理、及び前記第２演算処理側第３処理を、前記第１単語列の個数に対応する回数分繰り返し実行し、前記第１単語列の個数分の前記第１単語列意味第２文側被含有尺度を演算する第２演算処理側第４処理と、
前記第２演算処理側第４処理で演算した前記第１単語列の個数分の前記第１単語列意味第２文側被含有尺度についての平均に対応する演算を行うことにより、前記第１単語列群意味第２文側被含有尺度を演算する第２演算処理側第５処理と、を更に行い、
前記演算手段は、
前記第１演算処理において、前記第１演算処理側第１処理乃至前記第１演算処理側第５処理を実行し、前記第１単語列に含まれる単語の個数であるｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の前記第２単語列群意味第１文側被含有尺度を演算し、演算した前記第２単語列群意味第１文側被含有尺度についての平均に対応する演算を行うことにより、前記第２文意味第１文側被含有尺度を演算し、
前記第２演算処理において、前記第２演算処理側第１処理乃至前記第２演算処理側第５処理を実行し、前記第２単語列に含まれる単語の個数であるｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の前記第１単語列群意味第２文側被含有尺度を演算し、演算した前記第１単語列群意味第２文側被含有尺度についての平均に対応する演算を行うことにより、前記第１文意味第２文側被含有尺度を演算し、
前記第３演算処理において、前記第１演算処理にて演算された前記第２文意味第１文側被含有尺度と、前記第２演算処理にて演算された前記第１文意味第２文側被含有尺度との平均を前記文間類似度として演算する、
演算システム。

【請求項2】

第１文及び第２文の類似性の度合いである文間類似度を演算する演算プログラムであって、
コンピュータを、
前記第１文及び前記第２文を取得する取得手段と、
前記取得手段が取得した前記第１文及び前記第２文に基づいて、前記文間類似度を演算する演算手段と、として機能させ、
前記演算手段は、
前記取得手段が取得した前記第１文に含まれている複数の単語の内のｎ個（ｎは正の整数）の連続する単語からなる第１単語列と、前記取得手段が取得した前記第２文に含まれている複数の単語の内のｎ個（ｎは正の整数）の連続する単語からなる第２単語列との類似性の度合いである単語列間類似度に基づいて、前記第２文の意味が前記第１文に含まれる程度を示す第２文意味第１文側被含有尺度を演算する第１演算処理と、
前記単語列間類似度に基づいて、前記第１文の意味が前記第２文に含まれる程度を示す第１文意味第２文側被含有尺度を演算する第２演算処理と、
前記第１演算処理にて演算された前記第２文意味第１文側被含有尺度と、前記第２演算処理にて演算された前記第１文意味第２文側被含有尺度とに基づいて、前記文間類似度として演算する第３演算処理と、を行い、
前記演算手段は、
前記第１演算処理において、前記単語列間類似度に基づいて、前記第２単語列の意味が前記第１文に含まれる程度を示す第２単語列意味第１文側被含有尺度を演算し、演算した前記第２単語列意味第１文側被含有尺度に基づいて、前記第２文意味第１文側被含有尺度を演算し、
前記第２演算処理において、前記単語列間類似度に基づいて、前記第１単語列の意味が前記第２文に含まれる程度を示す第１単語列意味第２文側被含有尺度を演算し、演算した前記第１単語列意味第２文側被含有尺度に基づいて、前記第１文意味第２文側被含有尺度を演算し、
前記演算手段は、
前記第１演算処理において、前記第２単語列意味第１文側被含有尺度に基づいて、前記取得手段が取得した前記第２文に含まれている前記第２単語列の集合である第２単語列群の意味が前記第１文に含有されている程度を示す第２単語列群意味第１文側被含有尺度を演算し、演算した前記第２単語列群意味第１文側被含有尺度に基づいて、前記第２文意味第１文側被含有尺度を演算し、
前記第２演算処理において、前記第１単語列意味第２文側被含有尺度に基づいて、前記取得手段が取得した前記第１文に含まれている前記第１単語列の集合である第１単語列群の意味が前記第２文に含有されている程度を示す第１単語列群意味第２文側被含有尺度を演算し、演算した前記第１単語列群意味第２文側被含有尺度に基づいて、前記第１文意味第２文側被含有尺度を演算し、
前記単語列間類似度は、前記第１文における１個の前記第１単語列を示す分散表現の第１ベクトルと、前記第２文における１個の前記第２単語列を示す分散表現の第２ベクトルとのコサイン類似度であり、
前記演算手段は、
前記第１演算処理において、
前記コサイン類似度に基づく第１演算値であって、前記コサイン類似度に対応する数値と重みに対応する数値との積算結果である前記第１演算値を演算する第１演算処理側第１処理と、
前記第１演算処理側第１処理において、前記第１文に含まれている前記第１単語列を順次適用して、当該第１演算処理側第１処理を前記第１単語列の個数に対応する回数分繰り返し実行し、前記第１単語列の個数分の前記第１演算値を演算する第１演算処理側第２処理と、
前記第１演算処理側第２処理で演算された前記第１単語列の個数分の前記第１演算値の内の最大値を、前記第２文における１個の前記第２単語列の意味が前記第１文に含まれる程度を示す前記第２単語列意味第１文側被含有尺度とする第１演算処理側第３処理と、を行い、
前記第２演算処理において、
前記コサイン類似度に基づく第２演算値であって、前記コサイン類似度に対応する数値と重みに対応する数値との積算結果である前記第２演算値を演算する第２演算処理側第１処理と、
前記第２演算処理側第１処理において、前記第２文に含まれている前記第２単語列を順次適用して、当該第２演算処理側第１処理を前記第２単語列の個数に対応する回数分繰り返し実行し、前記第２単語列の個数分の前記第２演算値を演算する第２演算処理側第２処理と、
前記第２演算処理側第２処理で演算された前記第２単語列の個数分の前記第２演算値の内の最大値を、前記第１文における１個の前記第１単語列の意味が前記第２文に含まれる程度を示す前記第１単語列意味第２文側被含有尺度とする第２演算処理側第３処理と、を行い、
前記演算手段は、
前記第１演算処理において、
前記第２文に含まれている前記第２単語列を順次適用して、前記第１演算処理側第１処理、前記第１演算処理側第２処理、及び前記第１演算処理側第３処理を、前記第２単語列の個数に対応する回数分繰り返し実行し、前記第２単語列の個数分の前記第２単語列意味第１文側被含有尺度を演算する第１演算処理側第４処理と、
前記第１演算処理側第４処理で演算した前記第２単語列の個数分の前記第２単語列意味第１文側被含有尺度についての平均に対応する演算を行うことにより、前記第２単語列群意味第１文側被含有尺度を演算する第１演算処理側第５処理と、を更に行い、
前記第２演算処理において、
前記第１文に含まれている前記第１単語列を順次適用して、前記第２演算処理側第１処理、前記第２演算処理側第２処理、及び前記第２演算処理側第３処理を、前記第１単語列の個数に対応する回数分繰り返し実行し、前記第１単語列の個数分の前記第１単語列意味第２文側被含有尺度を演算する第２演算処理側第４処理と、
前記第２演算処理側第４処理で演算した前記第１単語列の個数分の前記第１単語列意味第２文側被含有尺度についての平均に対応する演算を行うことにより、前記第１単語列群意味第２文側被含有尺度を演算する第２演算処理側第５処理と、を更に行い、
前記演算手段は、
前記第１演算処理において、前記第１演算処理側第１処理乃至前記第１演算処理側第５処理を実行し、前記第１単語列に含まれる単語の個数であるｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の前記第２単語列群意味第１文側被含有尺度を演算し、演算した前記第２単語列群意味第１文側被含有尺度についての平均に対応する演算を行うことにより、前記第２文意味第１文側被含有尺度を演算し、
前記第２演算処理において、前記第２演算処理側第１処理乃至前記第２演算処理側第５処理を実行し、前記第２単語列に含まれる単語の個数であるｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の前記第１単語列群意味第２文側被含有尺度を演算し、演算した前記第１単語列群意味第２文側被含有尺度についての平均に対応する演算を行うことにより、前記第１文意味第２文側被含有尺度を演算し、
前記第３演算処理において、前記第１演算処理にて演算された前記第２文意味第１文側被含有尺度と、前記第２演算処理にて演算された前記第１文意味第２文側被含有尺度との平均を前記文間類似度として演算する、
演算プログラム。

【手続補正2】

【補正対象書類名】明細書

【補正対象項目名】０００６

【補正方法】変更

【補正の内容】

【0006】

上述した課題を解決し、目的を達成するために、請求項１に記載の演算システムは、第１文及び第２文の類似性の度合いである文間類似度を演算する演算システムであって、前記第１文及び前記第２文を取得する取得手段と、前記取得手段が取得した前記第１文及び前記第２文に基づいて、前記文間類似度を演算する演算手段と、を備え、前記演算手段は、前記取得手段が取得した前記第１文に含まれている複数の単語の内のｎ個（ｎは正の整数）の連続する単語からなる第１単語列と、前記取得手段が取得した前記第２文に含まれている複数の単語の内のｎ個（ｎは正の整数）の連続する単語からなる第２単語列との類似性の度合いである単語列間類似度に基づいて、前記第２文の意味が前記第１文に含まれる程度を示す第２文意味第１文側被含有尺度を演算する第１演算処理と、前記単語列間類似度に基づいて、前記第１文の意味が前記第２文に含まれる程度を示す第１文意味第２文側被含有尺度を演算する第２演算処理と、前記第１演算処理にて演算された前記第２文意味第１文側被含有尺度と、前記第２演算処理にて演算された前記第１文意味第２文側被含有尺度とに基づいて、前記文間類似度を演算する第３演算処理と、を行い、前記演算手段は、前記第１演算処理において、前記単語列間類似度に基づいて、前記第２単語列の意味が前記第１文に含まれる程度を示す第２単語列意味第１文側被含有尺度を演算し、演算した前記第２単語列意味第１文側被含有尺度に基づいて、前記第２文意味第１文側被含有尺度を演算し、前記第２演算処理において、前記単語列間類似度に基づいて、前記第１単語列の意味が前記第２文に含まれる程度を示す第１単語列意味第２文側被含有尺度を演算し、演算した前記第１単語列意味第２文側被含有尺度に基づいて、前記第１文意味第２文側被含有尺度を演算し、前記演算手段は、前記第１演算処理において、前記第２単語列意味第１文側被含有尺度に基づいて、前記取得手段が取得した前記第２文に含まれている前記第２単語列の集合である第２単語列群の意味が前記第１文に含有されている程度を示す第２単語列群意味第１文側被含有尺度を演算し、演算した前記第２単語列群意味第１文側被含有尺度に基づいて、前記第２文意味第１文側被含有尺度を演算し、前記第２演算処理において、前記第１単語列意味第２文側被含有尺度に基づいて、前記取得手段が取得した前記第１文に含まれている前記第１単語列の集合である第１単語列群の意味が前記第２文に含有されている程度を示す第１単語列群意味第２文側被含有尺度を演算し、演算した前記第１単語列群意味第２文側被含有尺度に基づいて、前記第１文意味第２文側被含有尺度を演算し、前記単語列間類似度は、前記第１文における１個の前記第１単語列を示す分散表現の第１ベクトルと、前記第２文における１個の前記第２単語列を示す分散表現の第２ベクトルとのコサイン類似度であり、前記演算手段は、前記第１演算処理において、前記コサイン類似度に基づく第１演算値であって、前記コサイン類似度に対応する数値と重みに対応する数値との積算結果である前記第１演算値を演算する第１演算処理側第１処理と、前記第１演算処理側第１処理において、前記第１文に含まれている前記第１単語列を順次適用して、当該第１演算処理側第１処理を前記第１単語列の個数に対応する回数分繰り返し実行し、前記第１単語列の個数分の前記第１演算値を演算する第１演算処理側第２処理と、前記第１演算処理側第２処理で演算された前記第１単語列の個数分の前記第１演算値の内の最大値を、前記第２文における１個の前記第２単語列の意味が前記第１文に含まれる程度を示す前記第２単語列意味第１文側被含有尺度とする第１演算処理側第３処理と、を行い、前記第２演算処理において、前記コサイン類似度に基づく第２演算値であって、前記コサイン類似度に対応する数値と重みに対応する数値との積算結果である前記第２演算値を演算する第２演算処理側第１処理と、前記第２演算処理側第１処理において、前記第２文に含まれている前記第２単語列を順次適用して、当該第２演算処理側第１処理を前記第２単語列の個数に対応する回数分繰り返し実行し、前記第２単語列の個数分の前記第２演算値を演算する第２演算処理側第２処理と、前記第２演算処理側第２処理で演算された前記第２単語列の個数分の前記第２演算値の内の最大値を、前記第１文における１個の前記第１単語列の意味が前記第２文に含まれる程度を示す前記第１単語列意味第２文側被含有尺度とする第２演算処理側第３処理と、を行い、前記演算手段は、前記第１演算処理において、前記第２文に含まれている前記第２単語列を順次適用して、前記第１演算処理側第１処理、前記第１演算処理側第２処理、及び前記第１演算処理側第３処理を、前記第２単語列の個数に対応する回数分繰り返し実行し、前記第２単語列の個数分の前記第２単語列意味第１文側被含有尺度を演算する第１演算処理側第４処理と、前記第１演算処理側第４処理で演算した前記第２単語列の個数分の前記第２単語列意味第１文側被含有尺度についての平均に対応する演算を行うことにより、前記第２単語列群意味第１文側被含有尺度を演算する第１演算処理側第５処理と、を更に行い、前記第２演算処理において、前記第１文に含まれている前記第１単語列を順次適用して、前記第２演算処理側第１処理、前記第２演算処理側第２処理、及び前記第２演算処理側第３処理を、前記第１単語列の個数に対応する回数分繰り返し実行し、前記第１単語列の個数分の前記第１単語列意味第２文側被含有尺度を演算する第２演算処理側第４処理と、前記第２演算処理側第４処理で演算した前記第１単語列の個数分の前記第１単語列意味第２文側被含有尺度についての平均に対応する演算を行うことにより、前記第１単語列群意味第２文側被含有尺度を演算する第２演算処理側第５処理と、を更に行い、前記演算手段は、前記第１演算処理において、前記第１演算処理側第１処理乃至前記第１演算処理側第５処理を実行し、前記第１単語列に含まれる単語の個数であるｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の前記第２単語列群意味第１文側被含有尺度を演算し、演算した前記第２単語列群意味第１文側被含有尺度についての平均に対応する演算を行うことにより、前記第２文意味第１文側被含有尺度を演算し、前記第２演算処理において、前記第２演算処理側第１処理乃至前記第２演算処理側第５処理を実行し、前記第２単語列に含まれる単語の個数であるｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の前記第１単語列群意味第２文側被含有尺度を演算し、演算した前記第１単語列群意味第２文側被含有尺度についての平均に対応する演算を行うことにより、前記第１文意味第２文側被含有尺度を演算し、前記第３演算処理において、前記第１演算処理にて演算された前記第２文意味第１文側被含有尺度と、前記第２演算処理にて演算された前記第１文意味第２文側被含有尺度との平均を前記文間類似度として演算する。

【手続補正3】

【補正対象書類名】明細書

【補正対象項目名】０００７

【補正方法】削除

【補正の内容】

【手続補正4】

【補正対象書類名】明細書

【補正対象項目名】０００８

【補正方法】削除

【補正の内容】

【手続補正5】

【補正対象書類名】明細書

【補正対象項目名】０００９

【補正方法】削除

【補正の内容】

【手続補正6】

【補正対象書類名】明細書

【補正対象項目名】００１０

【補正方法】削除

【補正の内容】

【手続補正7】

【補正対象書類名】明細書

【補正対象項目名】００１１

【補正方法】削除

【補正の内容】

【手続補正8】

【補正対象書類名】明細書

【補正対象項目名】００１２

【補正方法】変更

【補正の内容】

【0012】

請求項２に記載の演算プログラムは、第１文及び第２文の類似性の度合いである文間類似度を演算する演算プログラムであって、コンピュータを、前記第１文及び前記第２文を取得する取得手段と、前記取得手段が取得した前記第１文及び前記第２文に基づいて、前記文間類似度を演算する演算手段と、として機能させ、前記演算手段は、前記取得手段が取得した前記第１文に含まれている複数の単語の内のｎ個（ｎは正の整数）の連続する単語からなる第１単語列と、前記取得手段が取得した前記第２文に含まれている複数の単語の内のｎ個（ｎは正の整数）の連続する単語からなる第２単語列との類似性の度合いである単語列間類似度に基づいて、前記第２文の意味が前記第１文に含まれる程度を示す第２文意味第１文側被含有尺度を演算する第１演算処理と、前記単語列間類似度に基づいて、前記第１文の意味が前記第２文に含まれる程度を示す第１文意味第２文側被含有尺度を演算する第２演算処理と、前記第１演算処理にて演算された前記第２文意味第１文側被含有尺度と、前記第２演算処理にて演算された前記第１文意味第２文側被含有尺度とに基づいて、前記文間類似度として演算する第３演算処理と、を行い、前記演算手段は、前記第１演算処理において、前記単語列間類似度に基づいて、前記第２単語列の意味が前記第１文に含まれる程度を示す第２単語列意味第１文側被含有尺度を演算し、演算した前記第２単語列意味第１文側被含有尺度に基づいて、前記第２文意味第１文側被含有尺度を演算し、前記第２演算処理において、前記単語列間類似度に基づいて、前記第１単語列の意味が前記第２文に含まれる程度を示す第１単語列意味第２文側被含有尺度を演算し、演算した前記第１単語列意味第２文側被含有尺度に基づいて、前記第１文意味第２文側被含有尺度を演算し、前記演算手段は、前記第１演算処理において、前記第２単語列意味第１文側被含有尺度に基づいて、前記取得手段が取得した前記第２文に含まれている前記第２単語列の集合である第２単語列群の意味が前記第１文に含有されている程度を示す第２単語列群意味第１文側被含有尺度を演算し、演算した前記第２単語列群意味第１文側被含有尺度に基づいて、前記第２文意味第１文側被含有尺度を演算し、前記第２演算処理において、前記第１単語列意味第２文側被含有尺度に基づいて、前記取得手段が取得した前記第１文に含まれている前記第１単語列の集合である第１単語列群の意味が前記第２文に含有されている程度を示す第１単語列群意味第２文側被含有尺度を演算し、演算した前記第１単語列群意味第２文側被含有尺度に基づいて、前記第１文意味第２文側被含有尺度を演算し、前記単語列間類似度は、前記第１文における１個の前記第１単語列を示す分散表現の第１ベクトルと、前記第２文における１個の前記第２単語列を示す分散表現の第２ベクトルとのコサイン類似度であり、前記演算手段は、前記第１演算処理において、前記コサイン類似度に基づく第１演算値であって、前記コサイン類似度に対応する数値と重みに対応する数値との積算結果である前記第１演算値を演算する第１演算処理側第１処理と、前記第１演算処理側第１処理において、前記第１文に含まれている前記第１単語列を順次適用して、当該第１演算処理側第１処理を前記第１単語列の個数に対応する回数分繰り返し実行し、前記第１単語列の個数分の前記第１演算値を演算する第１演算処理側第２処理と、前記第１演算処理側第２処理で演算された前記第１単語列の個数分の前記第１演算値の内の最大値を、前記第２文における１個の前記第２単語列の意味が前記第１文に含まれる程度を示す前記第２単語列意味第１文側被含有尺度とする第１演算処理側第３処理と、を行い、前記第２演算処理において、前記コサイン類似度に基づく第２演算値であって、前記コサイン類似度に対応する数値と重みに対応する数値との積算結果である前記第２演算値を演算する第２演算処理側第１処理と、前記第２演算処理側第１処理において、前記第２文に含まれている前記第２単語列を順次適用して、当該第２演算処理側第１処理を前記第２単語列の個数に対応する回数分繰り返し実行し、前記第２単語列の個数分の前記第２演算値を演算する第２演算処理側第２処理と、前記第２演算処理側第２処理で演算された前記第２単語列の個数分の前記第２演算値の内の最大値を、前記第１文における１個の前記第１単語列の意味が前記第２文に含まれる程度を示す前記第１単語列意味第２文側被含有尺度とする第２演算処理側第３処理と、を行い、前記演算手段は、前記第１演算処理において、前記第２文に含まれている前記第２単語列を順次適用して、前記第１演算処理側第１処理、前記第１演算処理側第２処理、及び前記第１演算処理側第３処理を、前記第２単語列の個数に対応する回数分繰り返し実行し、前記第２単語列の個数分の前記第２単語列意味第１文側被含有尺度を演算する第１演算処理側第４処理と、前記第１演算処理側第４処理で演算した前記第２単語列の個数分の前記第２単語列意味第１文側被含有尺度についての平均に対応する演算を行うことにより、前記第２単語列群意味第１文側被含有尺度を演算する第１演算処理側第５処理と、を更に行い、前記第２演算処理において、前記第１文に含まれている前記第１単語列を順次適用して、前記第２演算処理側第１処理、前記第２演算処理側第２処理、及び前記第２演算処理側第３処理を、前記第１単語列の個数に対応する回数分繰り返し実行し、前記第１単語列の個数分の前記第１単語列意味第２文側被含有尺度を演算する第２演算処理側第４処理と、前記第２演算処理側第４処理で演算した前記第１単語列の個数分の前記第１単語列意味第２文側被含有尺度についての平均に対応する演算を行うことにより、前記第１単語列群意味第２文側被含有尺度を演算する第２演算処理側第５処理と、を更に行い、前記演算手段は、前記第１演算処理において、前記第１演算処理側第１処理乃至前記第１演算処理側第５処理を実行し、前記第１単語列に含まれる単語の個数であるｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の前記第２単語列群意味第１文側被含有尺度を演算し、演算した前記第２単語列群意味第１文側被含有尺度についての平均に対応する演算を行うことにより、前記第２文意味第１文側被含有尺度を演算し、前記第２演算処理において、前記第２演算処理側第１処理乃至前記第２演算処理側第５処理を実行し、前記第２単語列に含まれる単語の個数であるｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の前記第１単語列群意味第２文側被含有尺度を演算し、演算した前記第１単語列群意味第２文側被含有尺度についての平均に対応する演算を行うことにより、前記第１文意味第２文側被含有尺度を演算し、前記第３演算処理において、前記第１演算処理にて演算された前記第２文意味第１文側被含有尺度と、前記第２演算処理にて演算された前記第１文意味第２文側被含有尺度との平均を前記文間類似度として演算する。

【手続補正9】

【補正対象書類名】明細書

【補正対象項目名】００１３

【補正方法】変更

【補正の内容】

【0013】

請求項１に記載の演算システム、及び請求項２に記載の演算システムによれば、単語列間類似度に基づいて第２文意味第１文側被含有尺度を演算し、また、単語列間類似度に基づいて第１文意味第２文側被含有尺度を演算した上で、これらの演算結果に基づいて文間類似度を演算することにより、例えば、少なくとも単語列の単位（つまり、比較的小さい粒度の単位）の類似度を用いて文間類似度を演算するので、第１文及び第２文相互間の意味の類似性の度合いを的確に把握することが可能となる。また、第２文意味第１文側被含有尺度及び第１文意味第２文側被含有尺度に基づいて文間類似度を演算するので、第１文及び第２文相互間の意味の類似性の度合いをより的確に把握することが可能となる。
また、単語列間類似度に基づいて第２単語列意味第１文側被含有尺度を演算し、演算結果に基づいて第２文意味第１文側被含有尺度を演算し、また、単語列間類似度に基づいて第１単語列意味第２文側被含有尺度を演算し、演算結果に基づいて第１文意味第２文側被含有尺度を演算することにより、例えば、単語列の単位（つまり、比較的小さい粒度の単位）で意味が文に含まれる程度を考慮することができるので、第１文及び第２文相互間の意味の類似性の度合いを的確に把握することが可能となる。
また、第２単語列意味第１文側被含有尺度に基づいて第２単語列群意味第１文側被含有尺度を演算し、演算結果に基づいて第２文意味第１文側被含有尺度を演算し、また、第１単語列意味第２文側被含有尺度に基づいて第１単語列群意味第２文側被含有尺度を演算し、演算結果に基づいて第１文意味第２文側被含有尺度を演算することにより、例えば、単語列群の単位（つまり、単語列よりも大きな粒度の単位）で意味が文に含まれる程度も考慮することができるので、第１文及び第２文相互間の意味の類似性の度合いを的確に把握することが可能となる。
また、第１単語列の個数分の第１演算値（コサイン類似度に基づく演算値）の内の最大値を、第２文における１個の第２単語列の意味が第１文に含まれる程度を示す第２単語列意味第１文側被含有尺度とし、また、第２単語列の個数分の第２演算値（コサイン類似度に基づく演算値）の内の最大値を、第１文における１個の第１単語列の意味が第２文に含まれる程度を示す第１単語列意味第２文側被含有尺度とすることにより、例えば、第２単語列意味第１文側被含有尺度、及び第１単語列意味第２文側被含有尺度を適切に演算することができるので、第１文及び第２文相互間の意味の類似性の度合いを的確に把握することが可能となる。
また、第２単語列の個数分の第２単語列意味第１文側被含有尺度を演算し、演算した第２単語列意味第１文側被含有尺度についての平均に対応する演算を行うことにより第２単語列群意味第１文側被含有尺度を演算し、また、第１単語列の個数分の第１単語列意味第２文側被含有尺度を演算し、演算した第１単語列意味第２文側被含有尺度についての平均に対応する演算を行うことにより第１単語列群意味第２文側被含有尺度を演算することにより、例えば、第２単語列群意味第１文側被含有尺度、及び第１単語列群意味第２文側被含有尺度を適切に演算することができるので、第１文及び第２文相互間の意味の類似性の度合いを的確に把握することが可能となる。
また、ｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の第２単語列群意味第１文側被含有尺度を演算し、演算した第２単語列群意味第１文側被含有尺度についての平均に対応する演算を行うことにより第２文意味第１文側被含有尺度を演算し、また、ｎがａ（ａは正の整数）からｂ（ｂはａより大きな正の整数）各々である場合の第１単語列群意味第２文側被含有尺度を演算し、演算した第１単語列群意味第２文側被含有尺度についての平均に対応する演算を行うことにより第１文意味第２文側被含有尺度を演算した上で、第２文意味第１文側被含有尺度と第１文意味第２文側被含有尺度との平均を文間類似度として演算することにより、例えば、第２文意味第１文側被含有尺度、及び第１文意味第２文側被含有尺度を適切に演算することができるので、第１文及び第２文相互間の意味の類似性の度合いを的確に把握することが可能となる。

【手続補正10】

【補正対象書類名】明細書

【補正対象項目名】００１４

【補正方法】削除

【補正の内容】

【手続補正11】

【補正対象書類名】明細書

【補正対象項目名】００１５

【補正方法】削除

【補正の内容】

【手続補正12】

【補正対象書類名】明細書

【補正対象項目名】００１６

【補正方法】削除

【補正の内容】

【手続補正13】

【補正対象書類名】明細書

【補正対象項目名】００１７

【補正方法】削除

【補正の内容】

【手続補正14】

【補正対象書類名】明細書

【補正対象項目名】００１８

【補正方法】削除

【補正の内容】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

特開2021-125001(P2021-125001A)IP Force 特許公報掲載プロジェクト 2022.1.31 β版