7192039 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

7192039マッチングシステムおよびプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】

(24)【登録日】2022-12-09

(45)【発行日】2022-12-19

(54)【発明の名称】マッチングシステムおよびプログラム

(51)【国際特許分類】

G06Q 50/10 20120101AFI20221212BHJP

G06Q 30/02 20120101ALI20221212BHJP

【ＦＩ】

G06Q50/10

G06Q30/02 480

【請求項の数】 9

(21)【出願番号】P 2021098929

(22)【出願日】2021-06-14

【審査請求日】2021-08-18

(73)【特許権者】

【識別番号】596108508

【氏名又は名称】株式会社大和総研

(74)【代理人】

【識別番号】100114638

【弁理士】

【氏名又は名称】中野寛也

(72)【発明者】

【氏名】加藤惇雄

(72)【発明者】

【氏名】參木裕之

(72)【発明者】

【氏名】原悟

(72)【発明者】

【氏名】伊東俊哉

(72)【発明者】

【氏名】臼井飛翔

(72)【発明者】

【氏名】佐藤泰之

(72)【発明者】

【氏名】岡田航

(72)【発明者】

【氏名】大堀崇志

(72)【発明者】

【氏名】馬場陽一

(72)【発明者】

【氏名】田中稔介

【審査官】松野広一

(56)【参考文献】

【文献】特開２０２１－０２６４１３（ＪＰ，Ａ）

【文献】特開２０１５－１６４０２２（ＪＰ，Ａ）

【文献】特開２０１０－１１８０６４（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１７／０３００５６３（ＵＳ，Ａ１）

【文献】中国特許出願公開第１１２８００２０９（ＣＮ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｑ１０／００－９９／００

(57)【特許請求の範囲】

【請求項1】

自然人、法人、法人でない団体、またはその他の案件同士を組み合わせるマッチング処理を実行するコンピュータにより構成されたマッチングシステムであって、
多数の案件の各々についての自己の特徴を記述したテキストデータからなる自己データ、およびマッチング相手に対するニーズを記述したテキストデータからなるニーズデータ、または、これらの自己データとニーズデータとを結合して得られた結合テキストデータを、各案件に固有の情報を記述した多数の固有テキストデータとして用いて、ソフトクラスタリングまたはニューラル言語モデルによるトピック推定処理を実行して得られた、各案件の固有テキストデータにおける各トピックの出現確率を示すトピック値を、案件識別情報と関連付けて記憶するとともに、当該トピック推定処理を実行して得られた各トピックにおける各単語の出現確率を記憶するトピックモデル記憶手段と、
キーワードまたは案件識別情報の入力を受け付ける処理を実行する入力受付手段と、
この入力受付手段により案件識別情報の入力を受け付けた場合に、受け付けた案件識別情報の案件をマッチング処理の対象案件とし、前記トピックモデル記憶手段に記憶されている各案件の前記固有テキストデータにおける各トピックの出現確率を示すトピック値を用いて、対象案件とこの対象案件のマッチング相手となる各候補案件とからなる複数のペアの各々についてのマッチング用特徴データを作成し、作成した複数のマッチング用特徴データの各々を入力データとして、選定されるか否かの２クラス分類で予め学習されてマッチングモデル記憶手段に記憶されたマッチングモデルを用いて、教師あり分類モデルによる分類処理を行うことにより、対象案件に対して各候補案件が選定される確度を示すスコアを算出する処理を実行するマッチング手段と、
前記入力受付手段により案件識別情報の入力を受け付けた場合に、前記マッチング手段による処理と併せて、各案件の前記固有テキストデータを用いて算出した前記対象案件とそれ以外の案件との間の案件類似度の高い順で前記対象案件の類似案件を抽出する処理を実行する類似案件検索手段と、
前記入力受付手段によりキーワードの入力を受け付けた場合に、分散表現モデル記憶手段に記憶された単語の分散表現を用いて算出した前記キーワードとそれ以外の単語との間の一般類似度を最終類似度とするか、または、この一般類似度と、各案件の前記固有テキストデータを用いて算出した前記キーワードとそれ以外の単語との間の固有類似度とを用いて最終類似度を算出し、得られた最終類似度の高い順で前記キーワードの関連単語を決定するとともに、前記キーワードおよび前記関連単語の各々が、各案件の前記固有テキストデータの中に出現する単語別出現回数を求め、求めた単語別出現回数および前記関連単語の最終類似度を用いて算出した前記キーワードに対する各案件の関連度の高い順で関連案件を決定する処理を実行する連想検索手段と、
前記入力受付手段によりキーワードの入力を受け付けた場合には、前記連想検索手段により決定した前記関連案件、または、前記関連案件に加えて前記関連単語を、前記入力受付手段によるキーワードまたは案件識別情報の入力部と同一の画面上に表示し、前記入力受付手段により案件識別情報の入力を受け付けた場合には、前記マッチング手段により算出したスコアの高い前記候補案件を、推薦案件として前記入力部と同一の画面上に表示するとともに、前記類似案件検索手段により抽出した前記類似案件を、前記入力部と同一の画面上に表示する処理を実行する出力手段と
を備えたことを特徴とするマッチングシステム。

【請求項2】

前記トピック推定処理に用いられていない新規案件についての前記固有テキストデータ、および、前記トピックモデル記憶手段に記憶されている各トピックにおける各単語の出現確率を用いて、前記新規案件の前記固有テキストデータにおける各トピックの出現確率を示すトピック値を予測する処理を実行するトピック値予測手段を備え、
前記マッチング手段は、
前記トピック値予測手段により求めた前記新規案件の前記固有テキストデータにおける各トピックの出現確率を示すトピック値と、前記トピックモデル記憶手段に記憶されている前記新規案件のマッチング相手となる各候補案件の前記固有テキストデータにおける各トピックの出現確率を示すトピック値とを用いて、前記新規案件と前記各候補案件とからなる複数のペアについてのマッチング用特徴データを作成し、作成した複数のマッチング用特徴データの各々を入力データとして、選定されるか否かの２クラス分類で予め学習されて前記マッチングモデル記憶手段に記憶されたマッチングモデルを用いて、教師あり分類モデルによる分類処理を行うことにより、前記新規案件に対して前記各候補案件が選定される確度を示すスコアを出力する処理を実行する構成とされ、
前記類似案件検索手段は、
前記新規案件およびそれ以外の各案件の前記固有テキストデータを用いて算出した前記新規案件とそれ以外の案件との間の案件類似度を含めて類似案件を抽出する処理を実行する構成とされ、
前記連想検索手段は、
前記キーワードおよび前記関連単語の各々が、前記新規案件を含めた各案件の前記固有テキストデータの中に出現する単語別出現回数を求め、求めた単語別出現回数および前記関連単語の最終類似度を用いて算出した前記キーワードに対する各案件の関連度の高い順で関連案件を決定する処理を実行する構成とされている
ことを特徴とする請求項１に記載のマッチングシステム。

【請求項3】

前記類似案件検索手段は、
前記トピックモデル記憶手段に記憶されている各案件の固有テキストデータにおける各トピックの出現確率を示すトピック値からなるトピック分布ベクトルと、各案件の前記固有テキストデータを構成する各単語の分散表現の平均値からなる文章ベクトルと、各案件の前記固有テキストデータについての各単語のＴＦＩＤＦ値またはその他の単語重要度指標値からなる単語重要度ベクトルとのうちの少なくとも１つのベクトルを用いて算出した前記対象案件とそれ以外の案件との間の案件類似度の高い順で前記対象案件の類似案件を抽出する処理を実行する構成とされている
ことを特徴とする請求項１または２に記載のマッチングシステム。

【請求項4】

前記入力受付手段により受け付けたキーワードまたは案件識別情報、並びにこれらの入力順を含むログ情報を記憶する検索履歴記憶手段を備え、
前記入力受付手段は、
前記検索履歴記憶手段に記憶されている前記ログ情報を用いて、キーワードまたは案件識別情報のいずれの入力を受け付けたのかの入力種別および入力順を示すことに加え、
前記対象案件に対する前記推薦案件の案件識別情報の入力を受け付けたのか、前記対象案件の前記類似案件の案件識別情報の入力を受け付けたのかを区別する推薦・類似区別情報と、
前記推薦案件の案件識別情報と前記類似案件の案件識別情報との入力の受付を繰り返す中で、案件識別情報の入力を受け付けた案件が、マッチングを求める側の案件か、マッチング相手側の案件かという観点から、前記推薦案件については、案件識別情報の入力を受け付けた案件と反対側の案件とし、前記類似案件については、案件識別情報の入力を受け付けた案件と同じ側の案件とし、前記推薦案件に対する前記推薦案件については、案件識別情報の入力を受け付けた案件と同じ側の案件とすることにより、案件識別情報の入力を受け付けた各案件が、互いに同じ側または反対側のいずれの案件かを区別するサイド情報とのうちの少なくとも一方の情報を含む検索履歴表示処理を実行するか、
または、各案件の案件データに、売・買の別、労働者・使用者の別、男・女の別、その他の対になる情報を示すニーズフラグが含まれている場合に、前記推薦・類似区別情報と前記サイド情報とのうちの少なくとも一方の情報を含み、かつ、前記ニーズフラグを含む検索履歴表示処理を実行する構成とされている
ことを特徴とする請求項１～３のいずれかに記載のマッチングシステム。

【請求項5】

新規案件の案件データの入力を受け付けて案件識別情報を付与し、受け付けた案件データを、付与した案件識別情報と関連付けて案件データ記憶手段に記憶させる処理を実行する新規案件登録手段を備え、
前記出力手段は、
新規案件の登録時の参考案件として選択された前記関連案件、前記推薦案件、若しくは前記類似案件の案件識別情報またはその案件データを登録時参考案件記憶手段に記憶させる処理を実行する構成とされ、
前記新規案件登録手段は、
前記登録時参考案件記憶手段に記憶されている前記参考案件の案件識別情報を用いて前記案件データ記憶手段から前記参考案件の案件データを取得するか、または前記登録時参考案件記憶手段に記憶されている前記参考案件の案件データを取得し、取得した前記参考案件の案件データを、新規案件の案件データの入力部と同一の画面上に表示する処理を実行する構成とされている
ことを特徴とする請求項１～４のいずれかに記載のマッチングシステム。

【請求項6】

前記連想検索手段は、
前記一般類似度と前記固有類似度とを用いて前記最終類似度を算出する処理を実行する構成とされ、かつ、
全ての案件のうち、前記固有テキストデータの中に前記キーワードおよび前記一般類似度の高さで選定した一般類似単語の双方が含まれる各案件の集合Ｐにおける前記一般類似単語の出現回数によるか、または、集合Ｐにおける前記キーワードの出現回数および前記一般類似単語の出現回数による集合Ｐの評価値Ｐｓと、
前記固有テキストデータの中に前記キーワードが含まれず、かつ、前記一般類似単語が含まれる各案件の集合Ｑにおける前記一般類似単語の出現回数による集合Ｑの評価値Ｑｓとを用いて、
Ｐｓ／（Ｐｓ＋Ｑｓ）により、前記固有類似度を算出する処理を実行する構成とされている
ことを特徴とする請求項１～５のいずれかに記載のマッチングシステム。

【請求項7】

前記入力受付手段は、
キーワードの入力および案件識別情報の入力を同一の入力部で受け付けた後、前記入力部に入力された情報が、キーワードであるか案件識別情報であるかを判断する処理を実行する構成とされている
ことを特徴とする請求項１～６のいずれかに記載のマッチングシステム。

【請求項8】

前記入力受付手段は、
複数の案件識別情報の同時入力を受け付けることができる構成とされ、
前記マッチング手段は、
前記入力受付手段により複数の案件識別情報の同時入力を受け付けた場合に、受け付けた複数の案件識別情報の各案件をまとめて１つのマッチング処理の対象案件グループとし、前記トピックモデル記憶手段に記憶されている各案件の固有テキストデータにおける各トピックの出現確率を示すトピック値を用いて、前記対象案件グループを構成する複数の対象案件の各々とこれらの複数の対象案件の各々のマッチング相手となる各候補案件とからなる複数のペアの各々についてのマッチング用特徴データを作成し、作成した複数のマッチング用特徴データの各々を入力データとして、選定されるか否かの２クラス分類で予め学習されてマッチングモデル記憶手段に記憶されたマッチングモデルを用いて、教師あり分類モデルによる分類処理を行うことにより、前記対象案件グループを構成する複数の対象案件の各々に対して各候補案件が選定される確度を示すスコアを算出し、
前記対象案件グループを構成する複数の対象案件の各々と、マッチング相手となる複数の候補案件の各々との間の各スコアの合計値が大きくなる複数の候補案件を選択し、選択した複数の候補案件を、推薦案件グループを構成する複数の推薦案件として決定する処理を実行する構成とされ、
前記類似案件検索手段は、
前記入力受付手段により複数の案件識別情報の同時入力を受け付けた場合に、前記マッチング手段による処理と併せて、前記対象案件グループを構成する複数の対象案件の各々について、各案件の前記固有テキストデータを用いて算出した前記対象案件とそれ以外の案件との間の案件類似度の高い順で前記対象案件の類似案件を抽出する処理を実行する構成とされ、
前記出力手段は、
前記入力受付手段により複数の案件識別情報の同時入力を受け付けた場合に、前記マッチング手段により決定した前記推薦案件グループを構成する複数の前記推薦案件を、前記入力部と同一の画面上に表示するとともに、前記類似案件検索手段により抽出した前記対象案件グループを構成する複数の対象案件の各々についての前記類似案件を、前記入力部と同一の画面上に表示する処理を実行する構成とされている
ことを特徴とする請求項１～７のいずれかに記載のマッチングシステム。

【請求項9】

請求項１～８のいずれかに記載のマッチングシステムとして、コンピュータを機能させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、自然人、法人、法人でない団体、またはその他の案件同士を組み合わせるマッチング処理を実行するコンピュータにより構成されたマッチングシステムおよびプログラムに係り、例えば、企業同士を組み合わせるビジネスマッチングシステム等に利用できる。

【背景技術】

【0002】

従来のビジネスマッチングサービスでは、事業の提携や協力等を行う相手企業を探すことを希望する企業に対し、主に以下の２つの手法によってサービス担当者が紹介候補の企業を選定していた。

【0003】

第１の手法は、サービス担当者がキーワードによる検索を行い、その検索結果からマッチング相手となる企業を選定するというキーワード検索機能に基づく手法である。この第１の手法では、各企業について、自己の特徴を記述したテキストデータからなる自己データと、マッチング相手に対するニーズを記述したテキストデータからなるニーズデータとを用意しておき、それらのテキストデータを検索対象とする。

【0004】

第２の手法は、マッチング相手を探している企業とその他の任意の企業との２社のマッチング確度を示すスコアを算出し、スコアの高い企業を選出するというＡＩ推薦機能に基づく手法である。すなわち、マッチング相手となる候補企業の選定実績をまとめた過去のデータ（どのような特徴を有する企業に対し、どのような特徴を有する企業がマッチング相手として選定されたのかを示すデータの集合）を学習用データとして機械学習を行うことによりマッチングモデルを構築しておき、このマッチングモデルに対し、マッチング相手を探している企業の情報を入力し、スコアを出力する手法である。この第２の手法を実現するシステムとしては、本願出願人により開発されたマッチングシステムを用いることができる（特許文献１参照）。このマッチングシステムでは、上述した各企業の自己データとニーズデータとをそれぞれ結合し、得られた多数の結合テキストデータを用いて、ソフトクラスタリングまたはニューラル言語モデルによるトピック推定処理（例えば、ＬＤＡ：レイテント・ディリクレ・アロケーション等）を実行し、結合テキストデータにおける各トピックの出現確率を示すトピック値を用いてマッチング用特徴データを作成している。

【0005】

なお、前述した第１の方法を実現するには、キーワードを入力してそのキーワードに関連する企業を抽出するシステムがあればよいことになるが、このような条件を満たすシステムとしては、本願出願人により開発された抽出システムが知られている（特許文献２参照）。この抽出システムは、主として、キーワードを入力してテーマ型ファンドの構成銘柄とする候補銘柄（すなわち、その銘柄の発行企業）を抽出するシステムとして開発されたものであり、関連企業の抽出を行うために、各企業の固有テキストデータとして、各企業が投資家に向けて発信するインベスター・リレーションズ情報（ＩＲ情報）や各企業のホームページ情報（ＨＰ情報）を用いている。

【先行技術文献】

【特許文献】

【0006】

【文献】特許第６８０２３３４号掲載公報

【文献】特許第６５９６５６５号掲載公報

【発明の概要】

【発明が解決しようとする課題】

【0007】

しかしながら、前述した第１、第２の手法では、以下のような問題点があった。

【0008】

第１の手法のキーワード検索、第２の手法のマッチングモデルによるＡＩ推薦のいずれでも、各企業について記述したテキストデータの内容が検索結果や推薦結果に大きく影響する。従って、ビジネスマッチングという観点から企業の情報を的確に示していないテキストデータや、そもそも情報量の少ないテキストデータでは、望ましい検索結果や推薦結果が得られない。

【0009】

また、第１の手法のキーワード検索や、第２の手法のマッチングモデルの構築に用いられる前述した自己データおよびニーズデータは、マッチングを希望する企業自身が作成する。この際、自己データやニーズデータをどのように記述すれば、ビジネスマッチングの観点から効果的であるのかが不明であったり、自己データとニーズデータとの区別を付けにくいことから、双方に同じ情報を記述したり、いずれか一方を記述しない等の不備が発生するおそれもある。これに対し、マッチングのサービス担当者が、各企業に対し、適切な記述方法を指導することも考えられるが、手間がかかる、サービス担当者の経験や知識等の相違により指導内容に差が出る、サービス担当者による指導の特徴が記述内容に直接に現れてしまう等の不都合が生じる。

【0010】

さらに、第１の手法のキーワード検索を行う場合は、マッチング条件に合致する適切なキーワードを入力する必要があり、サービス担当者のノウハウに大きく影響するため、紹介件数が限られてしまう。また、第１の手法のキーワード検索と、第２の手法のマッチングモデルによるＡＩ推薦とを併用する場合において、上記のようにキーワード検索による紹介件数が限られることから、キーワード検索により選定した企業よりも、マッチングモデルの推薦した企業の紹介が増えてしまう結果となり、紹介実績に偏りが生じる。これにより、偏った紹介実績をマッチングモデルが再学習することで、推薦される企業が似たようなものに偏ってしまう。

【0011】

そして、以上のような問題は、企業同士を結び付けるビジネスマッチングシステムに限らず、例えば、未婚の男女を結び付けるお見合い支援を行うマッチングシステム等を含め、広く「案件」同士を組み合わせるマッチングシステムで同様に生じることである。

【0012】

なお、ビジネスマッチングであれば、企業と企業、企業と個人事業主、個人事業主と個人事業主とのマッチングになり、お見合い支援のマッチングであれば、未婚の男性と女性とのマッチングになるが、データ処理の本質としては、実質的には、それらの者がマッチングを目的として登録した情報同士のマッチングであるということと、それ故に登録する情報の内容が重要であり、マッチングの結果を左右するということと、ペット等の動物や、ロボット等の機械でも、人間がそれらの保有情報を代弁（代理で記述）することができれば、マッチングは行い得ることから、本願では、マッチングの対象（自然人、法人、法人でない団体、動物、ロボット、その他）を「案件」と呼ぶものとする。

【0013】

本発明の目的は、偏った紹介の未然防止、偏った紹介実績に基づくマッチングモデルの再学習の未然防止、効果的なマッチングを行うための適切な案件データの登録の実現、サービス担当者の手間の軽減を図ることができるマッチングシステムおよびプログラムを提供するところにある。

【課題を解決するための手段】

【0014】

本発明は、各企業の固有テキストデータ（自己データおよびニーズデータ、またはこれらの結合テキストデータ）を用いた３つの処理、すなわち、キーワードによる連想検索処理と、マッチングモデルによるＡＩ推薦のためのマッチング処理と、類似案件検索処理とを繰り返し実行することができるようにして前記目的を達成するものである。

【0015】

すなわち、本発明は、自然人、法人、法人でない団体、またはその他の案件同士を組み合わせるマッチング処理を実行するコンピュータにより構成されたマッチングシステムであって、
多数の案件の各々についての自己の特徴を記述したテキストデータからなる自己データ、およびマッチング相手に対するニーズを記述したテキストデータからなるニーズデータ、または、これらの自己データとニーズデータとを結合して得られた結合テキストデータを、各案件に固有の情報を記述した多数の固有テキストデータとして用いて、ソフトクラスタリングまたはニューラル言語モデルによるトピック推定処理を実行して得られた、各案件の固有テキストデータにおける各トピックの出現確率を示すトピック値を、案件識別情報と関連付けて記憶するとともに、当該トピック推定処理を実行して得られた各トピックにおける各単語の出現確率を記憶するトピックモデル記憶手段と、
キーワードまたは案件識別情報の入力を受け付ける処理を実行する入力受付手段と、
この入力受付手段により案件識別情報の入力を受け付けた場合に、受け付けた案件識別情報の案件をマッチング処理の対象案件とし、トピックモデル記憶手段に記憶されている各案件の固有テキストデータにおける各トピックの出現確率を示すトピック値を用いて、対象案件とこの対象案件のマッチング相手となる各候補案件とからなる複数のペアの各々についてのマッチング用特徴データを作成し、作成した複数のマッチング用特徴データの各々を入力データとして、選定されるか否かの２クラス分類で予め学習されてマッチングモデル記憶手段に記憶されたマッチングモデルを用いて、教師あり分類モデルによる分類処理を行うことにより、対象案件に対して各候補案件が選定される確度を示すスコアを算出する処理を実行するマッチング手段と、
入力受付手段により案件識別情報の入力を受け付けた場合に、マッチング手段による処理と併せて、各案件の固有テキストデータを用いて算出した対象案件とそれ以外の案件との間の案件類似度の高い順で対象案件の類似案件を抽出する処理を実行する類似案件検索手段と、
入力受付手段によりキーワードの入力を受け付けた場合に、分散表現モデル記憶手段に記憶された単語の分散表現を用いて算出したキーワードとそれ以外の単語との間の一般類似度を最終類似度とするか、または、この一般類似度と、各案件の固有テキストデータを用いて算出したキーワードとそれ以外の単語との間の固有類似度とを用いて最終類似度を算出し、得られた最終類似度の高い順でキーワードの関連単語を決定するとともに、キーワードおよび関連単語の各々が、各案件の固有テキストデータの中に出現する単語別出現回数を求め、求めた単語別出現回数および関連単語の最終類似度を用いて算出したキーワードに対する各案件の関連度の高い順で関連案件を決定する処理を実行する連想検索手段と、
入力受付手段によりキーワードの入力を受け付けた場合には、連想検索手段により決定した関連案件、または、関連案件に加えて関連単語を、入力受付手段によるキーワードまたは案件識別情報の入力部と同一の画面上に表示し、入力受付手段により案件識別情報の入力を受け付けた場合には、マッチング手段により算出したスコアの高い候補案件を、推薦案件として入力部と同一の画面上に表示するとともに、類似案件検索手段により抽出した類似案件を、入力部と同一の画面上に表示する処理を実行する出力手段と
を備えたことを特徴とするものである。

【0016】

ここで、「出力手段」における「入力部と同一の画面上」は、必ずしも入力部と処理結果の表示部とが同じウィンドウに設けられている必要はなく、例えば、処理結果の表示部が設けられたメインウィンドウと、入力部が設けられた小型ウィンドウ等とが同時に画面表示（重畳表示を含む）されるような場合も、同じ表示手段の画面上に、入力部と処理結果の表示部とが同時期に存在する状態となるので、ここでいう「入力部と同一の画面上」に該当する。また、表示手段の画面サイズが小さい場合や、処理結果として多くの情報を表示部に表示した場合等に、画面をスクロールしなければ、入力部と処理結果の表示部とが、同時に目に入らないような場合も、ここでいう「入力部と同一の画面上」に該当する。

【0017】

このような本発明のマッチングシステムにおいては、ユーザ（マッチングサービスの提供を受ける者、またはマッチングサービスを提供するサービス担当者）が、入力部にキーワードを入力すると、連想検索手段による処理が実行され、入力部と同一の画面上に、関連案件が表示されるか、またはこの関連案件の表示に加えて関連単語が表示される。一方、入力部に案件識別情報を入力すると、マッチング手段による処理、および類似案件検索手段による処理が実行され、入力部と同一の画面上に、マッチング相手としての推薦案件、および入力した案件識別情報の対象案件に対する類似案件が表示される。

【0018】

この際、連想検索手段、マッチング手段、および類似案件検索手段による３つの処理は、いずれも各案件の固有テキストデータ、すなわち同じデータを用いて実行されるので、３つの処理の全てでマッチングに適した処理を実現できることに加え、互いに関連性のある処理内容とすることができる。従って、本発明のマッチングシステムは、既存の３つのシステムを単純に併設したものではなく、各処理でデータの共用や、処理内容の共通化を図ることが可能となる。

【0019】

また、連想検索手段、マッチング手段、および類似案件検索手段による各処理の結果は、これらの各手段による次の処理に活かすことができ、これらの各手段による処理を繰り返すことができるので、ユーザは、多様な検索を行うことができる。

【0020】

より詳細には、キーワードを入力し、連想検索手段による処理でそのキーワードの関連案件が得られた場合には、その関連案件の案件識別情報を入力すれば、その関連案件に対するマッチング相手としての推薦案件が得られるとともに、その関連案件に対する類似案件が得られる。そして、得られた推薦案件の案件識別情報を入力すれば、その推薦案件に対するマッチング相手としての推薦案件が得られるとともに、その推薦案件に対する類似案件が得られる。また、得られた類似案件の案件識別情報を入力すれば、その類似案件に対するマッチング相手としての推薦案件が得られるとともに、その類似案件に対する類似案件が得られる。このように関連案件、推薦案件、類似案件を横断した繰り返しの検索が可能となり、さらにその間に任意のタイミングで様々なキーワードを入力することが可能となる。

【0021】

このため、ユーザが新規案件の登録を行う者またはその補助・指導・案内を行うサービス担当者であれば、自分または自分が担当する顧客と同じ立場の幾つかの案件（例えば、ある製品や商品を売るという目的でマッチングを希望する企業）についての案件データ（そこに含まれる自己データおよびニーズデータ）の内容を容易に把握することが可能となり、また、どのような内容の案件データを登録すると、どのような内容の案件データを有する案件が、マッチング相手として推薦されるのか（つまり、どのような内容の案件データを有する案件同士のマッチング確度が高いのか）を容易に把握することが可能となるので、それらの検索で参照した情報を、新規案件の案件データを登録する際に活かすことが可能となる。従って、ユーザは、マッチングという観点から適切な案件データを登録し、効果的なマッチングサービスの提供を受けることが可能となる。

【0022】

また、このような案件データの検索・参照は、新規案件の登録を行う者が、自身で行うことができるので、サービス担当者の負担を軽減することも可能となる。さらに、例えばサービス窓口や客先等でサービス担当者が検索を行う場合でも、検索で得られた幾つかの参考案件の案件データの内容を、新規案件の登録を行う者に直接に示すことができるので、サービス担当者の負担（補助・指導・案内をする上での手間）を軽減することが可能となる。

【0023】

また、マッチング手段は、トピック推定処理で得られたトピックモデルの更新や、マッチング用特徴データを用いた学習で得られたマッチングモデルの更新が行われない限り、同じ入力に対しては、同じ出力をすることから、ある案件に対し、いつも同じ案件が同じ順位（同じスコア）で推薦案件として出力されることになる。そして、これが選定実績となり、マッチングモデルの更新に反映されると、偏った紹介を助長することに繋がる。しかし、本発明では、類似案件検索手段による処理を行うと、マッチングを希望する対象案件の類似案件を把握することができ、その類似案件を入力すれば、マッチング手段による処理で、その類似案件に対する推薦案件が出力されるので、対象案件に対する推薦案件だけではなく、対象案件の類似案件に対する推薦案件を出力することもでき、サービス担当者は、それを紹介することもできる。同様に、検索を繰り返せば、対象案件に対する推薦案件の類似案件や、対象案件の類似案件に対する推薦案件の類似案件も出力することができ、サービス担当者は、それらを紹介することもできる。従って、サービス担当者は、様々な角度から紹介する案件を見つけることができるので、ノウハウの少ない担当者でも、マッチング依頼者に対し、マッチング相手として適切な案件を紹介することができるとともに、紹介案件の選定作業の固定化を防ぐことができるので、偏った学習用データによるマッチングモデルの更新の未然防止を図ることが可能となり、これらにより前記目的が達成される。

【0024】

なお、キーワードを入力すると、連想検索手段による処理で得られた関連案件の出力に加え、そのキーワードの関連単語も出力される構成としてもよく、そのような構成とした場合には、その関連単語を新たなキーワードとして入力することが可能となり、検索上の利便性が高まる。この際、関連単語を、一般類似度と固有類似度とを用いて算出した最終類似度の高い順で決定する構成としてもよく、そのような構成とした場合には、関連単語を、単なる一般的な関連単語（入力したキーワードに対し、一般類似度が高い単語）ではなく、各案件の固有テキストデータの内容を反映した関連単語とすることができ、マッチングという観点から、より一層、効果的な関連単語を、新たなキーワードとして入力することが可能となる。つまり、連想検索手段による処理では、各案件の固有テキストデータを用いて関連案件を決定するが、その関連案件の決定で使用される関連単語の決定にも、各案件の固有テキストデータが用いられることになり、マッチングという観点から、より一層、効果的な処理を実現することができる。

【0025】

＜トピックモデルの更新を行わずに、新規案件の固有テキストデータを検索に反映させる構成＞

【0026】

また、前述したマッチングシステムにおいて、
トピック推定処理に用いられていない新規案件についての固有テキストデータ、および、トピックモデル記憶手段に記憶されている各トピックにおける各単語の出現確率を用いて、新規案件の固有テキストデータにおける各トピックの出現確率を示すトピック値を予測する処理を実行するトピック値予測手段を備え、
マッチング手段は、
トピック値予測手段により求めた新規案件の固有テキストデータにおける各トピックの出現確率を示すトピック値と、トピックモデル記憶手段に記憶されている新規案件のマッチング相手となる各候補案件の固有テキストデータにおける各トピックの出現確率を示すトピック値とを用いて、新規案件と各候補案件とからなる複数のペアについてのマッチング用特徴データを作成し、作成した複数のマッチング用特徴データの各々を入力データとして、選定されるか否かの２クラス分類で予め学習されてマッチングモデル記憶手段に記憶されたマッチングモデルを用いて、教師あり分類モデルによる分類処理を行うことにより、新規案件に対して各候補者が選定される確度を示すスコアを出力する処理を実行する構成とされ、
類似案件検索手段は、
新規案件およびそれ以外の各案件の固有テキストデータを用いて算出した新規案件とそれ以外の案件との間の案件類似度を含めて類似案件を抽出する処理を実行する構成とされ、
連想検索手段は、
キーワードおよび関連単語の各々が、新規案件を含めた各案件の固有テキストデータの中に出現する単語別出現回数を求め、求めた単語別出現回数および関連単語の最終類似度を用いて算出したキーワードに対する各案件の関連度の高い順で関連案件を決定する処理を実行する構成とされていてもよい。

【0027】

このようにトピック値予測手段を設け、トピックモデルの更新を行わずに、新規案件の固有テキストデータを検索に反映させる構成とした場合には、新規案件の固有テキストデータを含めたトピック推定処理によるトピックモデルの更新を行う前であっても、新規案件を対象案件とするマッチング処理が可能となる。従って、トピックモデルの更新を行う前に、新規案件を含めた状態で、連想検索手段、マッチング手段、および類似案件検索手段による各処理を繰り返す検索を行うことが可能となる。

【0028】

＜類似案件検索手段による固有テキストデータを用いたベクトル処理の詳細＞

【0029】

さらに、前述したマッチングシステムにおいて、
類似案件検索手段は、
トピックモデル記憶手段に記憶されている各案件の固有テキストデータにおける各トピックの出現確率を示すトピック値からなるトピック分布ベクトルと、各案件の固有テキストデータを構成する各単語の分散表現の平均値からなる文章ベクトルと、各案件の固有テキストデータについての各単語のＴＦＩＤＦ値またはその他の単語重要度指標値からなる単語重要度ベクトルとのうちの少なくとも１つのベクトルを用いて算出した対象案件とそれ以外の案件との間の案件類似度の高い順で対象案件の類似案件を抽出する処理を実行する構成とされていてもよい。

【0030】

このように類似案件検索手段により固有テキストデータを用いたベクトル処理を行う構成とした場合には、固有テキストデータ（自己データ、ニーズデータ）の記述内容を的確に反映させ、マッチングに役立つ類似案件の抽出処理を実現することができる。

【0031】

＜検索履歴表示処理の詳細＞

【0032】

そして、前述したマッチングシステムにおいて、
入力受付手段により受け付けたキーワードまたは案件識別情報、並びにこれらの入力順を含むログ情報を記憶する検索履歴記憶手段を備え、
入力受付手段は、
検索履歴記憶手段に記憶されているログ情報を用いて、キーワードまたは案件識別情報のいずれの入力を受け付けたのかの入力種別および入力順を示すことに加え、
対象案件に対する推薦案件の案件識別情報の入力を受け付けたのか、対象案件の類似案件の案件識別情報の入力を受け付けたのかを区別する推薦・類似区別情報と、
推薦案件の案件識別情報と類似案件の案件識別情報との入力の受付を繰り返す中で、案件識別情報の入力を受け付けた案件が、マッチングを求める側の案件か、マッチング相手側の案件かという観点から、推薦案件については、案件識別情報の入力を受け付けた案件と反対側の案件とし、類似案件については、案件識別情報の入力を受け付けた案件と同じ側の案件とし、推薦案件に対する推薦案件については、案件識別情報の入力を受け付けた案件と同じ側の案件とすることにより、案件識別情報の入力を受け付けた各案件が、互いに同じ側または反対側のいずれの案件かを区別するサイド情報とのうちの少なくとも一方の情報を含む検索履歴表示処理を実行するか、
または、各案件の案件データに、売・買の別、労働者・使用者の別、男・女の別、その他の対になる情報を示すニーズフラグが含まれている場合に、推薦・類似区別情報とサイド情報とのうちの少なくとも一方の情報を含み、かつ、ニーズフラグを含む検索履歴表示処理を実行する構成としてもよい。

【0033】

このようにキーワードまたは案件識別情報のいずれの入力を受け付けたのかの入力種別および入力順を示す通常の検索履歴表示処理を行うだけではなく、推薦・類似区別情報とサイド情報とのうちの少なくとも一方の情報を含む検索履歴表示処理や、さらにニーズフラグを含む検索履歴表示処理を行う構成とした場合には、連想検索手段、マッチング手段、および類似案件検索手段による各処理を繰り返す検索を行う中で、ユーザは、自分が今まで何をしてきたのか、今何をしているのか、さらには今から何をすればよいのかを把握し易くなるので、効率的な検索を行うことが可能となる。

【0034】

＜新規案件の登録時に参考案件を表示する構成＞

【0035】

また、前述したマッチングシステムにおいて、
新規案件の案件データの入力を受け付けて案件識別情報を付与し、受け付けた案件データを、付与した案件識別情報と関連付けて案件データ記憶手段に記憶させる処理を実行する新規案件登録手段を備え、
出力手段は、
新規案件の登録時の参考案件として選択された関連案件、推薦案件、若しくは類似案件の案件識別情報またはその案件データを登録時参考案件記憶手段に記憶させる処理を実行する構成とされ、
新規案件登録手段は、
登録時参考案件記憶手段に記憶されている参考案件の案件識別情報を用いて案件データ記憶手段から参考案件の案件データを取得するか、または登録時参考案件記憶手段に記憶されている参考案件の案件データを取得し、取得した参考案件の案件データを、新規案件の案件データの入力部と同一の画面上に表示する処理を実行する構成とされていてもよい。

【0036】

このように新規案件の登録時に参考案件を表示する構成とした場合には、新規案件の登録を行うユーザは、マッチング用のデータとして適切な案件データ（自己データおよびニーズデータを含む）の入力作業を容易に行うことができる。

【0037】

＜連想検索手段により一般類似度と固有類似度とを用いて最終類似度を算出する構成とする場合の固有類似度の算出処理の詳細＞

【0038】

さらに、前述したマッチングシステムにおいて、
連想検索手段は、
一般類似度と固有類似度とを用いて最終類似度を算出する処理を実行する構成とされ、かつ、
全ての案件のうち、固有テキストデータの中にキーワードおよび一般類似度の高さで選定した一般類似単語の双方が含まれる各案件の集合Ｐにおける一般類似単語の出現回数によるか、または、集合Ｐにおけるキーワードの出現回数および一般類似単語の出現回数による集合Ｐの評価値Ｐｓと、
固有テキストデータの中にキーワードが含まれず、かつ、一般類似単語が含まれる各案件の集合Ｑにおける一般類似単語の出現回数による集合Ｑの評価値Ｑｓとを用いて、
Ｐｓ／（Ｐｓ＋Ｑｓ）により、固有類似度を算出する処理を実行する構成としてもよい。

【0039】

このように連想検索手段により単語の出現回数を用いて固有類似度を算出する構成とした場合には、各案件の固有テキストデータの記述内容を的確に反映した固有類似度を算出し、その固有類似度を用いて最終類似度を算出し、その最終類似度を用いて関連単語を決定することが可能となる。

【0040】

＜キーワードの入力および案件識別情報の入力を同一の入力部で受け付ける構成＞

【0041】

そして、前述したマッチングシステムにおいて、
入力受付手段は、
キーワードの入力および案件識別情報の入力を同一の入力部で受け付けた後、入力部に入力された情報が、キーワードであるか案件識別情報であるかを判断する処理を実行する構成としてもよい。

【0042】

このようにキーワードの入力および案件識別情報の入力を同一の入力部で受け付ける構成とした場合には、入力部を配置し、かつ、検索結果を表示する画面の構成が簡易になり、ユーザによる操作性の向上が図られる。

【0043】

＜複数の案件識別情報の同時入力を受け付けることができる構成＞

【0044】

また、前述したマッチングシステムにおいて、
入力受付手段は、
複数の案件識別情報の同時入力を受け付けることができる構成とされ、
マッチング手段は、
入力受付手段により複数の案件識別情報の同時入力を受け付けた場合に、受け付けた複数の案件識別情報の各案件をまとめて１つのマッチング処理の対象案件グループとし、トピックモデル記憶手段に記憶されている各案件の固有テキストデータにおける各トピックの出現確率を示すトピック値を用いて、対象案件グループを構成する複数の対象案件の各々とこれらの複数の対象案件の各々のマッチング相手となる各候補案件とからなる複数のペアの各々についてのマッチング用特徴データを作成し、作成した複数のマッチング用特徴データの各々を入力データとして、選定されるか否かの２クラス分類で予め学習されてマッチングモデル記憶手段に記憶されたマッチングモデルを用いて、教師あり分類モデルによる分類処理を行うことにより、対象案件グループを構成する複数の対象案件の各々に対して各候補案件が選定される確度を示すスコアを算出し、
対象案件グループを構成する複数の対象案件の各々と、マッチング相手となる複数の候補案件の各々との間の各スコアの合計値が大きくなる複数の候補案件を選択し、選択した複数の候補案件を、推薦案件グループを構成する複数の推薦案件として決定する処理を実行する構成とされ、
類似案件検索手段は、
入力受付手段により複数の案件識別情報の同時入力を受け付けた場合に、マッチング手段による処理と併せて、対象案件グループを構成する複数の対象案件の各々について、各案件の固有テキストデータを用いて算出した対象案件とそれ以外の案件との間の案件類似度の高い順で対象案件の類似案件を抽出する処理を実行する構成とされ、
出力手段は、
入力受付手段により複数の案件識別情報の同時入力を受け付けた場合に、マッチング手段により決定した推薦案件グループを構成する複数の推薦案件を、入力部と同一の画面上に表示するとともに、類似案件検索手段により抽出した対象案件グループを構成する複数の対象案件の各々についての類似案件を、入力部と同一の画面上に表示する処理を実行する構成とされていてもよい。

【0045】

このように複数の案件識別情報の同時入力を受け付けることができる構成とした場合には、類似案件検索手段により、入力された対象案件グループを構成する複数の対象案件の各々についての類似案件が抽出され、表示されるので、様々な観点から、紹介する案件グループを決定することが可能となり、ノウハウの少ないサービス担当者でも適切な紹介作業を行うことが可能になるとともに、偏った紹介実績を含む学習用データによるマッチングモデルの更新の未然防止を図ることが可能となる。すなわち、マッチング手段は、トピック推定処理で得られたトピックモデルの更新や、マッチング用特徴データを用いた学習で得られたマッチングモデルの更新が行われない限り、同じ入力に対しては、同じ出力をすることから、ある対象案件グループに対し、いつも同じ推薦案件グループが出力されることになる。しかし、本発明により、対象案件グループを構成する複数の対象案件のうちの少なくとも１つの案件を、それらの対象案件の類似案件に変えて検索を行ったり、あるいは、推薦案件グループを構成する複数の推薦案件のうちの少なくとも１つの案件を、それらの推薦案件の類似案件に変えて紹介すること等が可能となる。

【0046】

＜プログラムの発明＞

【0047】

また、本発明のプログラムは、以上に述べたマッチングシステムとして、コンピュータを機能させるためのものである。

【0048】

なお、上記のプログラムまたはその一部は、例えば、光磁気ディスク（ＭＯ）、コンパクトディスク（ＣＤ）、デジタル・バーサタイル・ディスク（ＤＶＤ）、フレキシブルディスク（ＦＤ）、磁気テープ、読出し専用メモリ（ＲＯＭ）、電気的消去および書換可能な読出し専用メモリ（ＥＥＰＲＯＭ）、フラッシュ・メモリ、ランダム・アクセス・メモリ（ＲＡＭ）、ハードディスクドライブ（ＨＤＤ）、ソリッドステートドライブ（ＳＳＤ）、フラッシュディスク等の記録媒体に記録して保存や流通等させることが可能であるとともに、例えば、ローカル・エリア・ネットワーク（ＬＡＮ）、メトロポリタン・エリア・ネットワーク（ＭＡＮ）、ワイド・エリア・ネットワーク（ＷＡＮ）、インターネット、イントラネット、エクストラネット等の有線ネットワーク、あるいは無線通信ネットワーク、さらにはこれらの組合せ等の伝送媒体を用いて伝送することが可能であり、また、搬送波に載せて搬送することも可能である。さらに、上記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。

【発明の効果】

【0049】

以上に述べたように本発明によれば、連想検索手段、マッチング手段、および類似案件検索手段による３つの処理を繰り返す検索を行うことができるので、偏った紹介の未然防止、偏った紹介実績に基づくマッチングモデルの再学習の未然防止、効果的なマッチングを行うための適切な案件データの登録の実現、サービス担当者の手間の軽減を図ることができるという効果がある。

【図面の簡単な説明】

【0050】

【図1】本発明の一実施形態のマッチングシステムの全体構成図。

【図2】前記実施形態の単語の分散表現を用いた処理の説明図。

【図3】前記実施形態の固有類似度Ｂの算出処理の説明図。

【図4】前記実施形態の関連度ＣＳの算出処理の説明図。

【図5】前記実施形態の固有テキストデータの準備処理の説明図。

【図6】前記実施形態の固有テキストデータの準備からトピック分布の推定までのデータの具体例を示す図。

【図7】前記実施形態のマッチング用特徴データに含める合成変数の作成方法の説明図。

【図8】前記実施形態の運用時におけるマッチング用特徴データの作成方法の説明図。

【図9】前記実施形態の学習時におけるマッチング用特徴データの準備方法の説明図。

【図10】前記実施形態の案件類似度の算出処理の説明図。

【図11】前記実施形態のマッチングシステムでの検索の流れを示す説明図。

【図12】前記実施形態の連想検索手段による処理の結果を表示した画面例を示す図。

【図13】前記実施形態のマッチング手段および類似案件検索手段による各処理の結果を表示した画面例を示す図。

【図14】前記実施形態のマッチングシステムの事前処理の全体的な流れを示すフローチャートの図。

【図15】前記実施形態のマッチングシステムによる検索処理の全体的な流れを示すフローチャートの図。

【図16】前記実施形態の新規の案件データを含めたトピックモデルの更新等の時期が到来した場合の処理の全体的な流れを示すフローチャートの図。

【図17】前記実施形態の連想検索用の事前処理の詳細な流れを示すフローチャートの図。

【図18】前記実施形態のマッチング用の事前処理の詳細な流れを示すフローチャートの図。

【図19】前記実施形態の類似案件検索用の事前処理の詳細な流れを示すフローチャートの図。

【図20】前記実施形態の連想検索処理の詳細な流れを示すフローチャートの図。

【図21】前記実施形態のマッチング処理の詳細な流れを示すフローチャートの図。

【図22】前記実施形態の類似案件検索処理の詳細な流れを示すフローチャートの図。

【図23】前記実施形態の新規案件登録処理の流れを示すフローチャートの図。

【図24】本発明の第１の変形の形態を示す図。

【図25】本発明の第２の変形の形態を示す図。

【図26】本発明の第３の変形の形態を示す図。

【発明を実施するための形態】

【0051】

以下に本発明の一実施形態について図面を参照して説明する。図１には、本実施形態のマッチングシステム１０の全体構成が示されている。このマッチングシステム１０は、事業者（主として企業であるが、個人事業主や、大学等の非営利団体でもよい。）に対し、ビジネスパートナー（産学連携を含む。）となる事業者を紹介するビジネスマッチングサービスを実施するためのシステムである。なお、本願明細書では、個人事業主や、大学等の非営利団体も含めた事業者という意味で「企業」という用語を用いることがある。

【0052】

サービス形態としては、事業者からのマッチングの依頼を受けて、専らサービス担当者が検索を行い、条件に合うマッチング相手を探して依頼者に紹介する形態でもよく、例えばサービス会社の窓口や客先等で、サービス担当者と顧客（依頼者）とが対話をしながら検索を行うことにより、条件に合うマッチング相手を探し、選定した相手方の名称や連絡先等をサービス担当者が依頼者に開示して紹介する形態でもよく、専らマッチングの依頼者が検索（遠隔地からのオンライン検索を含む。）を行い、条件に合うマッチング相手を探し、選定した相手方の名称や連絡先等をサービス担当者（サービス会社）に紹介してもらう形態でもよく、従って、検索を行う主体は、マッチングを希望する事業者、またはその事業者の補助・指導・案内を行うサービス担当者である。

【0053】

図２～図１０には、マッチングシステム１０による各処理の内容の詳細が示されている。また、図１１～図１３は、ユーザの操作に伴って実行されるマッチングシステム１０の検索機能の説明図である。さらに、図１４および図１５には、マッチングシステム１０の事前処理および運用時の検索処理の全体的な流れが、図１６には、トピックモデルの更新等の処理の流れが、図１７～図１９には、連想検索用、マッチング用、類似案件検索用の各事前処理の流れが、図２０～図２３には、連想検索処理、マッチング処理、類似案件検索処理、新規案件登録処理の流れが、それぞれフローチャートで示されている。

【0054】

＜マッチングシステム１０の全体構成＞

【0055】

図１において、マッチングシステム１０は、コンピュータにより構成され、本体２０と、例えば液晶ディスプレイ等の表示手段８０と、例えばマウスやキーボードやタッチパネル等の入力手段９０とを備えている。

【0056】

本体２０は、マッチング並びにそれに付随する連想検索および類似案件検索に関する各種処理を実行する処理手段３０と、この処理手段３０による処理に必要となる各種データを記憶する記憶手段５０とを備えて構成されている。

【0057】

処理手段３０は、設定手段３１と、分散表現モデル学習手段３２と、案件データ準備手段３３と、固有テキストデータ準備手段３４と、トピック推定手段３５と、トピック値予測手段３６と、単語重要度ベクトル算出手段３７と、マッチング学習用データ準備手段３８と、マッチングモデル学習手段３９と、入力受付手段４０と、連想検索手段４１（単語類似度算出手段４１Ａ、関連度算出手段４１Ｂを含む）と、マッチング手段４２（マッチング用特徴データ作成手段４２Ａ、マッチングスコア算出手段４２Ｂを含む）と、類似案件検索手段４３（案件類似度算出手段４３Ａ、類似案件抽出手段４３Ｂを含む）と、出力手段４４と、新規案件登録手段４５とを含んで構成されている。

【0058】

ここで、処理手段３０に含まれる各手段３１～４５は、マッチングシステム１０の本体２０の内部に設けられた中央演算処理装置（ＣＰＵ）、およびこのＣＰＵの動作手順を規定する１つまたは複数のプログラムにより実現される。これらの各手段３１～４５の詳細は後述する。

【0059】

記憶手段５０は、設定データ記憶手段５１と、分散表現モデル学習用データ記憶手段５２と、分散表現モデル記憶手段５３と、案件データ記憶手段５４と、不要語辞書記憶手段５５と、トピックモデル記憶手段５６と、単語重要度ベクトル記憶手段５７と、マッチング候補選定実績リスト記憶手段５８と、マッチング学習用データ記憶手段５９と、マッチングモデル記憶手段６０と、検索履歴記憶手段６１と、モデル別類似度記憶手段６２と、一般類似度記憶手段６３と、固有類似度記憶手段６４と、最終類似度記憶手段６５と、関連度記憶手段６６と、文章ベクトル記憶手段６７と、案件類似度記憶手段６８と、登録時参考案件記憶手段６９とを含んで構成されている。

【0060】

ここで、記憶手段５０に含まれる各記憶手段５１～６９としては、例えば、ハードディスクドライブ（ＨＤＤ）、ソリッドステートドライブ（ＳＳＤ）等を採用することができるが、揮発性メモリ（主メモリやキャッシュメモリ等の作業用メモリに一時的に確保される記憶領域）でよいものも含まれている。この点については後述する。また、各記憶手段５１～６９の詳細も後述する。

【0061】

また、図１では、マッチングシステム１０は、スタンドアロンの構成で記載されているが、ネットワークを介して通信を行うシステム構成としてもよい。サーバ・クライアント型のマッチングシステム１０とする場合には、本体２０を１台または複数台のサーバにより構成し、表示手段８０および入力手段９０は端末側に設けることができる。この際、ネットワークは、インターネットのような外部ネットワークでもよく、イントラネットやＬＡＮ等の内部ネットワークでもよく、それらの組合せでもよく、有線であるか、無線であるか、有線・無線の混在型であるかは問わない。端末は、サービス形態により、主としてサービス担当者の端末である場合と、主としてマッチング依頼者（マッチングサービスの提供を受ける者）の端末である場合と、例えばサービス窓口や客先等で互いにそばにいるサービス担当者とマッチング依頼者とが同時に同じ画面を物理的に１つの端末で見る場合と、互いに遠隔地にいるサービス担当者とマッチング依頼者とがオンライン会議のように共有の画面を別々の端末で見る場合とがある。遠隔地にいるマッチング依頼者が自分の案件データを自分で直接に入力し、あるいはマッチングの結果（スコアリングの結果）を画面で直接に参照する場合には、ネットワークをインターネットのような外部ネットワークとし、マッチング依頼者の端末を、サーバである本体２０に接続することになる。また、いずれのサービス形態をとる場合でも、システムの構築・維持・更新等の管理を行うシステム管理者の端末を設置することになる。

【0062】

＜処理手段３０の構成＞

【0063】

（処理手段３０／設定手段３１の構成）
設定手段３１は、システム管理者による入力手段９０からの各種の設定データの入力を受け付け、設定データ記憶手段４１に記憶させる処理を実行するものである。

【0064】

また、設定手段３１は、ユーザ（サービス担当者）による入力手段９０からの各種の設定データの入力を受け付け、設定データ記憶手段４１に記憶させる処理を実行してもよい。この場合は、ユーザ（サービス担当者）毎の設定データが、ユーザ識別情報（サービス担当者識別情報）と関連付けられて設定データ記憶手段４１に記憶される。例えば、ユーザ毎の設定ファイル等の形式で保存される。なお、ユーザによる設定データは、保存せずに、その都度、入力するものとしてもよく、その場合には、設定データ記憶手段４１の一部が、主メモリやキャッシュメモリ等の作業用メモリにより構成されることになる。

【0065】

具体的には、設定データには、単語類似度算出手段４１Ａにより一般類似単語を決定する際（詳細は後述するが、処理の結果としてＮ５個（例えば、Ｎ５＝７０）の単語が一般類似単語として選択決定される。）に用いる各分散表現モデルにおけるモデル別類似度Ｓの個数Ｎ３（例えば、Ｎ３＝１００）と、単語類似度算出手段４１ＡによりＮ５個の一般類似単語の中から選択決定する関連単語の個数Ｎ６（例えば、Ｎ６＝１０）と、単語類似度算出手段４１Ａにより複数の分散表現モデルにおけるモデル別類似度Ｓを統合して一般類似度Ａを求める際に加重調和平均や加重平均を使う場合の各分散表現モデルに対する重み係数の値と、単語類似度算出手段４１Ａにより固有類似度Ｂを求める際の後述する式（１）における係数σ，τおよび式（２）における係数φと、単語類似度算出手段４１Ａにより一般類似度Ａと固有類似度Ｂとを用いて最終類似度ＦＳを求める際に加重調和平均や加重平均を使う場合の一般類似度Ａおよび固有類似度Ｂに対する重み係数の値と、関連度算出手段４１Ｂにより関連度ＣＳを求める際の後述する式（３）における重み係数κ（ｉ）と、案件類似度算出手段４３Ａにより案件類似度を算出する際の後述する式（４）における重み係数Ｗtf-idf、Ｗword2vec、Ｗtopicとがある。また、出力手段４４により画面表示する関連案件（連想検索手段４１の処理結果）、推薦案件（マッチング手段４２の処理結果）、類似案件（類似案件検索手段４３の処理結果）の各表示数（例えば、上位１０位以内等）も、設定データである。なお、これらの設定データは、固定値としてもよい。

【0066】

さらに、設定手段３１は、システム管理者による入力手段９０の操作で、事前に取得・収集しておいた分散表現モデル学習用のテキストデータを、分散表現モデル学習用データ記憶手段５２に記憶させる処理も実行する。

【0067】

（処理手段３０／分散表現モデル学習手段３２の構成）
分散表現モデル学習手段３２は、分散表現モデル学習用データ記憶手段５２に記憶された分散表現モデル学習用のテキストデータを用いて、形態素解析、各種のアルゴリズムによる機械学習を行い、得られた学習結果データ（本実施形態では、単語の分散表現としての高次元の単語ベクトルの集合である重み行列Ｗ）を、分散表現モデル記憶手段５３（図２参照）に記憶させる処理を実行するものである。学習で得られた分散表現モデルは、図２に示すように、連想検索手段４１による処理および類似案件検索手段４３による処理で使用されるが、双方の処理で使用する分散表現モデルは共用としてもよく、別々に用意してもよい。本実施形態では、一例として共用とする。なお、公開・提供された学習結果データ（重み行列Ｗ）を取得し、分散表現モデル記憶手段５３に保存してもよい。

【0068】

ここで、分散表現モデル学習用のテキストデータには、例えば、ニュースのテキストデータや、ウィキペディア等のインターネットから収集したテキストデータ等を用いる。この分散表現モデル学習用のテキストデータは、Ｎ１個（例えば、Ｎ１＝１８億）の単語を含むデータであり、膨大な量のデータである。この中には、重なりのないユニークな単語が、Ｎ２個（例えば、Ｎ２＝１１５万）含まれている。

【0069】

また、分散表現モデル記憶手段５３（図２参照）に記憶される単語ベクトルとしては、例えば、ワード・ツー・ベック（ｗｏｒｄ２ｖｅｃ）のモデルであるコンティニュアス・バッグ・オブ・ワード（ＣＢＯＷ）やスキップ・グラム（Ｓｋｉｐ－ｇｒａｍ）、あるいは、グローヴ（ＧｌｏＶｅ）、ファースト・テキスト（ｆａｓｔＴｅｘｔ）、リカレント・ニューラル・ネットワーク（ＲＮＮ）の１種であるロング・ショート・ターム・メモリ（ＬＳＴＭ）によるエルモ（ＥＬＭｏ）、さらには、ニューラル・ネットワーク（ＮＮ）以外でも、例えば、ライン（ＬＩＮＥ）等のアルゴリズムによる単語ベクトルを用いることができる。

【0070】

具体的には、図２に示すように、例えばｗｏｒｄ２ｖｅｃ等による学習で得られた単語ベクトルの集合である重み行列Ｗ（行が単語ベクトルになっている。）を利用することができる。この重み行列Ｗは、ワード・ベクター・ルックアップ・テーブル等と称され、ボキャブラリ数Ｎ２（例えば、Ｎ２＝１１５万）×ディメンジョン数の行列である。本実施形態では、一例として、３種類のディメンジョン（＝１００，２００，４００）で、いずれについてもウィンドウサイズ＝１２を設定することにより、３タイプの重み行列Ｗ１，Ｗ２，Ｗ３を用意し、３タイプの分散表現モデルとして分散表現モデル記憶手段５３（図２参照）に記憶させる。これらの３タイプの分散表現モデルは、各分散表現モデルによるモデル別類似度Ｓが、後述するように調和平均または加重調和平均等によりアンサンブルされるので、統合された１つのモデルであると考えてもよい。ディメンジョン数は、単語ベクトルの次元数であり、例えばｗｏｒｄ２ｖｅｃ等のニューラルネットワーク（ＮＮ）のアルゴリズムで得られた単語ベクトルの場合には、ＮＮの中間層（隠れ層）のノード数と同等である。

【0071】

なお、用意する分散表現モデルの数は、１つだけとしてもよく、また、複数の分散表現モデルを用意する場合には、３タイプに限らず、２タイプや４タイプ以上でもよく、例えば、複数種類のディメンジョンの各々について複数種類のウィンドウサイズを設定することにより、４タイプ以上の分散表現モデルを用意してもよい。

【0072】

また、本発明における単語の分散表現として用いる単語ベクトルは、必ずしも各種のアルゴリズムによる機械学習で得られた学習結果データとしての単語ベクトルである必要はなく、例えば、機械学習で得られた学習結果データとしての単語ベクトルを加工、調整、または混合（異なるアルゴリズムによる機械学習で得られた単語ベクトルを混成させる等）して作成した単語ベクトルや、機械学習によらない手法で集計作業等を行って作成した単語ベクトル等としてもよい。

【0073】

（処理手段３０／案件データ準備手段３３の構成）
案件データ準備手段３３は、マッチングサービスの提供を受けることを目的として用意された多数の案件（ここでは、企業）についての案件データを、案件識別情報（本実施形態では、案件番号）と関連付けて案件データ記憶手段５４に記憶させる処理を実行するものである。これらの案件データは、マッチングサービスを行う既存のシステムで用いていたデータを流用してもよい。なお、案件識別情報は、本実施形態のような数字からなる案件番号に限らず、文字や記号等を含めた識別情報でもよい。

【0074】

案件データには、企業情報として、企業名、自己所在地、電話番号、ホームページアドレス、代表者名や担当者名およびそれらの役職、自己業種および主な取扱商品、自己ＰＲ（自由記述形式のテキストデータ）、資本金、従業員数、年商（売上高）等が含まれている。また、ビジネスマッチング相手に求めるニーズ情報として、希望業種（相手企業の業種）、希望地域（相手企業の所在地）、ニーズの種類をサービス会社（マッチングサービス提供者）が予め用意した各項目に該当するか否かの選択指定で示すニーズフラグ、ニーズ詳細（自由記述形式のテキストデータ）等が含まれている。このうち、本発明におけるマッチングを実行するうえで重要なデータは、自由記述形式のテキストデータである自己ＰＲおよびニーズ詳細である。本発明（請求項）における「自己データ」は、自己ＰＲを中心とするデータ（自己ＰＲを含んでいればよく、自己ＰＲだけでもよい。）であり、「ニーズデータ」は、ニーズ詳細を中心とするデータ（ニーズ詳細を含んでいればよく、ニーズ詳細だけでもよい。）であり、この点については、図５、図６を用いて後述する。

【0075】

図５、図１０に示すように、ニーズフラグは、ニーズの種類を示すデータ（該当するか否かの１，０のデータ）であり、本実施形態では、一例として７個設けられているが、ニーズフラグの設置個数は任意であり、１つでも、複数でもよい。また、内容やその粗さの度合いの設定も任意であり、例えば、「売ります」というニーズフラグと、「買います」というニーズフラグとを設けてもよく、さらに細かく、例えば、「部品を売ります」、「材料を売ります」、「部品を買います」、「材料を買います」等のニーズフラグを設けてもよい。なお、例えば、「売ります」と「販売先を求めています」とは同じ内容であり、「買います」と「仕入れ先を求めています」も同じ内容であるため、表現上の相違は問題にならない。

【0076】

同様に、「弊社にて製造します」というニーズフラグと、「貴社で製造してください」というニーズフラグとを設けてもよく、さらに細かく、例えば、「部品を製造します」、「材料を製造します」、「部品を製造してください」、「材料を製造してください」等のニーズフラグを設けてもよい。その他には、例えば、「システムを構築します」、「システムの構築をお願いします」、「製品・商品を輸送します」、「製品・商品を輸送してください」、「広告を引き受けます」、「広告をお願いします」、「人材を派遣します」、「人材の派遣をお願いします」、「小売りします」、「小売店を求めています」、「全国展開を引き受けます」、「全国展開をお願いしたい」、「不動産を提供します」、「不動産の提供を求めています」、「サービスを提供します」、「サービスの提供を求めています」、「納品は当日または翌日です」、「納期は当日または翌日として欲しい」等のニーズフラグを設けることができる。また、「その他」というニーズフラグを設けてもよい。

【0077】

（処理手段３０／固有テキストデータ準備手段３４の構成）
固有テキストデータ準備手段３４は、案件データ記憶手段５４に記憶されている各案件（各企業）の案件データを用いて、マッチング処理およびそれに付随する連想検索処理および類似案件検索処理に必要となる各案件（各企業）の固有テキストデータを準備する処理を実行し、処理後の固有テキストデータを、案件識別情報（案件番号）と関連付けて案件データ記憶手段５４に記憶させる処理を実行するものである。

【0078】

なお、処理後の固有テキストデータは、案件データ記憶手段５４とは別に、固有テキストデータ記憶手段を設けておき、そこに案件識別情報（案件番号）と関連付けて記憶させてもよい。また、本実施形態では、処理後の固有テキストデータを案件データ記憶手段５４に記憶させるが、案件データ記憶手段５４に記憶されている処理後の固有テキストデータの部分を、固有テキストデータ記憶手段と呼んでもよい。従って、案件データや処理後の固有テキストデータを記憶するために設置するデータベースの数や、テーブルの数は任意であり、どのようなデータ分割形態をとっていても、案件識別情報（案件番号）により関連付けられていればよい。

【0079】

固有テキストデータは、連想検索手段４１、マッチング手段４２、類似案件検索手段４３のいずれの処理でも使用される。本実施形態では、マッチング手段４２による処理については、図５に示すように、自己データとニーズデータとを結合した結合テキストデータを、固有テキストデータとして使用する。一方、類似案件検索手段４３による処理については、図１０に示すように、自己データとニーズデータとは結合せずに、別々の状態の自己データおよびニーズデータのそれぞれを固有テキストデータとして使用する。但し、マッチング手段４２による処理において、自己データとニーズデータとを結合せずに、別々の状態でそれぞれを固有テキストデータとして使用してもよく、また、類似案件検索手段４３による処理において、自己データとニーズデータとを結合した結合テキストデータを、固有テキストデータとして使用してもよい。

【0080】

また、連想検索手段４１による処理については、本実施形態では、マッチング手段４２による処理で使用する固有テキストデータ（結合テキストデータの状態のもの）を共用で使用する。但し、連想検索手段４１による処理において、自己データまたはニーズデータのいずれか一方を固有テキストデータとして使用してもよい。なお、前述した本願出願人により開発された特許文献２の抽出システムは、キーワードを入力してそのキーワードに関連する企業を抽出するシステムであるため、連想検索手段４１による処理に応用することができる。この際、特許文献２の抽出システムは、主として、キーワードを入力してテーマ型ファンドの構成銘柄とする候補銘柄（すなわち、その銘柄の発行企業）を抽出するシステムとして開発されたので、関連企業の抽出を行うために、各企業の固有テキストデータとして、各企業が投資家に向けて発信するインベスター・リレーションズ情報（ＩＲ情報）や各企業のホームページ情報（ＨＰ情報）を用いているが、本発明のマッチングシステムに応用する場合には、ＩＲ情報やＨＰ情報を、マッチングを目的として記述された自己データ、ニーズデータ、またはそれらの結合テキストデータに置き換える。

【0081】

この固有テキストデータ準備手段３４による処理は、事前処理（図１４参照）の段階で実行される。また、新規案件の登録時（図２３参照）に、新規案件登録手段４５からの指示を受けて、トピックモデル等の更新前における新規案件の即時反映処理として、新規案件の固有テキストデータについて実行される。さらに、トピックモデルの更新等の時期が到来した場合（図１６参照）にも実行されるが、上記の新規案件の即時反映処理で実行されている処理については、繰り返し実行する必要はない。

【0082】

（処理手段３０／固有テキストデータ準備手段３４の構成：結合テキストデータの作成処理、図５、図６）
固有テキストデータ準備手段３４は、［α］結合テキストデータの作成処理と、［β］不要な記号やタグ等の除去処理と、［γ］形態素解析で単語に分解し、名詞のみを抽出する処理と、［δ］不要な単語の除去処理とを実行する。なお、［α］の処理を実行して得られたデータと、［α］～［δ］の処理を実行して得られたデータとは、ともに結合テキストデータ（固有テキストデータ）と呼ぶ。この際、［γ］の処理を経た後は、単語に分解された状態となるが、トピック推定を行ううえで、［α］の処理を実行して得られたデータと同等な情報を持ち合わせているので、説明の便宜上、結合テキストデータ（固有テキストデータ）と呼ぶ。また、［δ］までの処理を経た結合テキストデータ（固有テキストデータ）を特に区別して呼ぶときは、処理後の結合テキストデータ（処理後の固有テキストデータ）と呼ぶ。

【0083】

［α］結合テキストデータの作成処理では、固有テキストデータ準備手段３４は、図５に示すように、案件データを構成する自己業種（取扱商品）および自己ＰＲ（自由記述形式のテキストデータ）を合わせたテキストデータからなる自己データと、希望業種（マッチング相手の業種）およびニーズ詳細（自由記述形式のテキストデータ）を合わせたテキストデータからなるニーズデータとを結合することにより、結合テキストデータを作成する。得られた結合テキストデータは、１つの文書データとして取り扱われる。

【0084】

この際、固有テキストデータ準備手段３４は、図６に示すように、句点（。）を挟んで自己業種、自己ＰＲ（自由記述形式）、希望業種、ニーズ詳細（自由記述形式）を結合する。なお、ここでは、自己業種を含めて自己データとし、希望業種を含めてニーズデータとしているが、自己業種を含めずに自己ＰＲ（自由記述形式）だけを自己データとしてもよく、希望業種を含めずにニーズ詳細（自由記述形式）だけをニーズデータとしてもよい。

【0085】

また、固有テキストデータ準備手段３４により作成する結合テキストデータは、テキストデータであるから、自己業種や希望業種が選択式の記号や番号（１，２，…等）になっている場合には、それらの業種をテキストデータ（電機、建築・土木、ＩＴ、…等）に変換してから結合する。一方、自己業種や希望業種が自由記述形式になっているか、あるいはマッチングサービス提供者側で予め用意した業種の中から選択した業種をテキストで記述するようになっている場合には、既にテキストデータになっているので、そのまま結合することができる。

【0086】

さらに、マッチングサービス提供者側で予め用意した業種の中から選択した業種（記号や番号で選択指定されているか、テキストで記述されているかは問わない。）と、マッチング依頼者が自由記述形式で記述した業種とが併用されている場合（予め用意された業種の中に、該当する業種が無いときに、該当する業種を自由記述形式で記述するようになっている場合）には、自由記述形式で記述した業種だけを、自己データやニーズデータに含めてもよい。このようにする場合は、自由記述形式で記述した自己業種や希望業種だけが、自己ＰＲ（自由記述形式）やニーズ詳細（自由記述形式）と同等な情報であると考えていることになる。

【0087】

そして、図５および図６での図示は省略されているが、自由記述形式の「その他」の欄がある場合には、「その他」の欄に記述されたテキストデータを、自己ＰＲ（自由記述形式）やニーズ詳細（自由記述形式）と同等な情報であると考え、それも結合して結合テキストデータに含めるようにしてもよい。

【0088】

［β］不要な記号やタグ等の除去処理では、固有テキストデータ準備手段３４は、［α］の処理で得られた結合テキストデータから、例えば、☆、＜ｂｒ＞等を削除する。

【0089】

［γ］形態素解析で単語に分解し、名詞のみを抽出する処理では、固有テキストデータ準備手段３４は、図６に示すように、先ず、［β］の処理で得られた結合テキストデータを用いて形態素解析を実行し、結合テキストデータを単語に分解（分割）し、分かち書きにする。この形態素解析は、既存の解析ツールを利用して実行することができる。

【0090】

この際、形態素解析用に、単語や類義語の辞書を作成し、図示されない単語辞書記憶手段や類義語辞書記憶手段に記憶しておいてもよい。単語辞書には、例えば「イヤホン」、「インスタグラム」、「オーガニック」等、既存の解析ツールの辞書に含まれていない単語を登録する。また、類義語辞書には、例えば「バッテリー」、「バッテリ」等の表記のゆれ単語を登録する。

【0091】

［δ］不要な単語の除去処理では、固有テキストデータ準備手段３４は、単語の絞り込みを行う。先ず、単語の品詞や出現回数に基づいて、単語をフィルタリングする。具体的には、名詞の一部（例えば「一般」、「サ変接続」等）だけを残し、他の単語は捨てる。また、全ての案件の結合テキストデータの集合において、出現回数が、例えば３回未満の単語は捨てる。各単語と出現回数との関係は、図示されない単語出現回数記憶手段に記憶されている。従って、新規案件の結合テキストデータが増えた場合には、そこに含まれる単語の出現回数が加算されるので、例えば３回という閾値を超える場合もあり、これにより、捨てられていた単語が活かされるようになる場合もある。また、新規案件の結合テキストデータが増えた場合に、その結合テキストデータに全く新出の単語が現れ、その出現回数が、例えば３回という閾値を超えていれば、その新出の単語は、捨てられる単語ではなく、活かされる単語となる。

【0092】

次に、固有テキストデータ準備手段３４は、不要語辞書記憶手段５５に記憶されている不要語（ノイズ単語）を排除する。具体的には、例えば、「企業」、「ニーズ」、「サポート」等のような業種に関係なく出現すると考えられる単語は、不要語として排除する。また、例えば、「京都」、「関東」、「東日本」等の国内の地名は、不要語として排除する。但し、例えば、「欧州」、「中国」、「大連」等、海外の地名は残しておく。不要語として登録する単語は、例えば、１，０００～２，０００単語等である。

【0093】

図６の例では、固有テキストデータ準備手段３４による以上の［α］～［δ］の処理を経た後に残る単語は、先頭から順番に、「飲食」、「店舗」、「酒類」、「ブランド」、「飲食」、「食品」、「酒類」、「食品」、「ブランド」、「泡盛」、…となる。従って、図６に示すように、残った各単語とそれらの出現回数との関係が得られ、この関係が、トピック推定を行うために必要な情報となる。すなわち、１つの文書データとして取り扱われる結合テキストデータ（ｉ＝００００１２３４）における各単語の出現回数となる。ｉ＝００００１２３４は、案件番号であり、案件識別情報であるとともに、結合テキストデータ（文書データ）の番号でもある。案件番号は、連続番号である必要はないが（飛び飛びの番号でもよいが）、後述するトピック推定の説明も含め、ここでは、説明の便宜上、番号は、詰めて考えることにする。

【0094】

（処理手段３０／固有テキストデータ準備手段３４の構成：自己データとニーズデータとを結合せずに別々の固有テキストデータとして使用する場合の処理、図１０）
本実施形態の類似案件検索処理では、図１０に示すように、自己データとニーズデータとを結合せずに別々の固有テキストデータとして使用するが、処理後の固有テキストデータを作成する手順は、上述した処理後の結合テキストデータを作成する場合と殆ど同様であり、［α］の処理がないだけである。この際、自己データとニーズデータとは、別々の固有テキストデータであるから、それぞれについて［β］～［δ］の処理を実行する。従って、処理後の固有テキストデータは、別々に存在するので、それぞれの処理後の固有テキストデータを、案件識別情報（案件番号）と関連付けて案件データ記憶手段５４に記憶させる。つまり、案件データ記憶手段５４には、各案件について、処理後の結合テキストデータ、処理後の自己データ、処理後のニーズデータが、それぞれ内容の異なる固有テキストデータとして記憶されることになる。

【0095】

なお、結合テキストデータの作成処理では、固有テキストデータ準備手段３４は、図５に示すように、自己業種と自己ＰＲとを合わせて自己データとし、希望業種とニーズ詳細とを合わせてニーズデータとしていたが、類似案件検索用の固有テキストデータは、図１０に示すように、自己ＰＲだけを自己データとし、ニーズ詳細だけをニーズデータとする。但し、類似案件検索用の固有テキストデータについても、自己業種と自己ＰＲとを合わせて自己データとし、希望業種とニーズ詳細とを合わせてニーズデータとしてもよく、このようにする場合は、結合が行われるので、［α］の処理があるといえる。

【0096】

（処理手段３０／トピック推定手段３５の構成）
トピック推定手段３５は、固有テキストデータ準備手段３４により作成されて案件データ記憶手段５４に記憶されている全ての案件（企業）の固有テキストデータを用いて、ソフトクラスタリングまたはニューラル言語モデルで、ギブスサンプリング等を行うことにより、各案件（各企業）の固有テキストデータ（ｉ）における各トピックの出現確率を示すトピック値（縦ベクトルπ（ｉ））、および、各トピックにおける各単語の出現確率（行列β）を求めるトピック推定処理を実行し、このトピック推定処理で得られたπ（ｉ）およびβを、トピックモデルとしてトピックモデル記憶手段５６に記憶させる処理を実行するものである。

【0097】

この際、本実施形態では、案件データ記憶手段５４には、マッチングおよび連想検索に共用の固有テキストデータである結合テキストデータと、類似案件検索用の固有テキストデータである自己データおよびニーズデータとが記憶されているので、これらの３種類の固有テキストデータの各々について別々にトピック推定処理を実行し、それぞれのトピック推定処理で得られたπ（ｉ）およびβを、それぞれのトピックモデルとしてトピックモデル記憶手段５６に記憶させる。

【0098】

このトピック推定手段３５による処理は、事前処理（図１４参照）として実行される。また、トピックモデルの更新処理（図１６参照）でも実行される。後者の更新時には、案件データ記憶手段５４に新規案件（前回更新時から見て、１件に限らず、複数の新規案件が登録されている場合もある。）の固有テキストデータが記憶されているので、新規案件の固有テキストデータも含めて全ての案件の固有テキストデータを用いてトピック推定処理が実行される。

【0099】

トピック推定処理を実行する際のソフトクラスタリングまたはニューラル言語モデルについては、本実施形態では、一例として、レイテント・ディリクレ・アロケーション（ＬＤＡ：Latent Dirichlet Allocation、潜在的ディリクレ配分法）を採用する。なお、ここでいうニューラル言語モデルの「モデル」は、アルゴリズムおよびパラメータを含めた概念であり、一方、トピックモデル記憶手段５６に記憶されるトピックモデルの「モデル」は、学習結果として得られるパラメータ（学習結果データ）を指す概念である。従って、アルゴリズムにより実現されるトピック推定手段３５および後述するトピック値予測手段３６と、トピックモデルを記憶するトピックモデル記憶手段５６とにより、推定器が構成されている。

【0100】

また、レイテント・ディリクレ・アロケーション（ＬＤＡ）の他には、例えば、ファジー・Ｃミーンズ（Fuzzy c-means）、混合分布モデル、非負値行列因子分解（ＮＭＦ：Non-negative Matrix Factorization）、ｐＬＳＩ（probabilistic Latent Semantic Indexing）、Ｄｏｃ２Ｖｅｃ、ＳＣＤＶ（Sparse Compose Document Vecotors）等を採用することができる。例えば、Ｄｏｃ２Ｖｅｃを実装する場合には、既存のＧｅｎｓｉｍと呼ばれるライブラリを用いることができる。

【0101】

ここで、各案件の固有テキストデータ（ｉ）における各トピックの出現確率を示すトピック値は、図１８および図１９に示すように、Ｋ次元の縦ベクトルπ（ｉ）であり、本願では、これをトピック分布と呼んでいる。ｉは文書番号であり、ｉ＝１～ｎのとき、ｎは文書数であるが、この文書数ｎは、本発明では、固有テキストデータの数（すなわち、案件の数）に相当し、本実施形態のビジネスマッチングでは、登録企業数に相当し、例えば、ｎ＝約１０万社等である。Ｋはトピック数であり、システムの構築者が指定する。従って、トピック分布は、トピック番号＝１～Ｋの各トピック値π（ｉ，１），π（ｉ，２），π（ｉ，３），…，π（ｉ，Ｋ）により構成される。例えば、本実施形態のビジネスマッチングでは、トピックとして２０業種を想定し、Ｋ＝２０等とすることができる。但し、トピック数Ｋは２０に限定されるものではなく、また、トピックとして必ずしも業種を想定しなければならないわけではなく、本実施形態がビジネスマッチングであるから、最も容易に当て嵌めて考えることができる業種を想定してシステム設計を行っているに過ぎない。

【0102】

また、各トピックにおける各単語の出現確率は、図１８および図１９に示すように、Ｋ行ｐ列の行列βで表すことができる。Ｋはトピック数である。ｐは単語数であり、例えば、ｐ＝約３，０００語等である。

【0103】

図６に示すように、１つの文書データとして取り扱われる固有テキストデータ（図６の例では、結合テキストデータ）（ｉ＝００００１２３４）から直接に得られる情報は、その固有テキストデータに含まれる各単語とそれらの出現回数との関係を示すデータである。そして、各単語の出現回数が判れば、それぞれの単語の出現回数を、全ての単語の出現回数の和で除することにより、ある１つの固有テキストデータにおける各単語の出現確率が判るので、これが既知の情報となる。トピック推定手段３５は、多数の固有テキストデータのそれぞれにおける各単語とそれらの出現回数との関係を示すデータを既知の情報として、それらの既知の情報を用いて、ギブスサンプリング等を行うことにより、各固有テキストデータ（ｉ）におけるトピック分布π（ｉ）（トピック番号＝１～Ｋの各トピックの出現確率を示すトピック値）、および、各トピックにおける各単語の出現確率（Ｋ行ｐ列の行列β）を求める。なお、Ｋ行ｐ列の行列βと、Ｋ次元の縦ベクトルで示されるトピック分布π（ｉ）とが得られているときに、固有テキストデータ（ｉ）における各単語（１～ｐ番目の単語）の出現確率を算出するには、行列βの転置行列（ｐ行Ｋ列）と、トピック分布π（ｉ）（Ｋ次元の縦ベクトル）とを、この順で掛ける演算を行うことになる。以上のことは、固有テキストデータが、結合テキストデータではなく、結合されていない自己データやニーズデータの場合も同様である。

【0104】

（処理手段３０／トピック値予測手段３６の構成）
トピック値予測手段３６は、トピックモデルの更新前に、新規案件登録手段４５からの指示を受けて固有テキストデータ準備手段３４により作成されて案件データ記憶手段５４に記憶されている新規案件（新規企業）の処理後の固有テキストデータ、および、トピックモデル記憶手段５６に記憶されている各トピックにおける各単語の出現確率（Ｋ行ｐ列の行列β）（更新前のトピックモデルの行列β）を用いて、新規案件の固有テキストデータにおける各トピックの出現確率を示すトピック値（Ｋ次元の縦ベクトルπ（ｉ）で表されるトピック分布）を予測し、予測したπ（ｉ）を、更新前における仮の値としてトピックモデル記憶手段５６に記憶させる処理を実行するものである。

【0105】

この際、トピック値予測手段３６は、新規案件（新規企業）の処理後の固有テキストデータ（ｉ＝ｎ＋１）について、次の３種類のトピック分布π（ｉ）を予測する。すなわち、マッチング処理で用いる固有テキストデータである結合テキストデータにおけるトピック分布π（ｉ）と、類似案件検索処理で用いる固有テキストデータである自己データ、ニーズデータの各々におけるトピック分布π（ｉ）とを予測する。

【0106】

このトピック値予測手段３６による処理を行う際には、図６に示すように、新規案件の固有テキストデータ(図６の例では、結合テキストデータ)における各単語とそれらの出現回数との関係（すなわち、１つの文書データとして取り扱われる新規案件の固有テキストデータにおける各単語の出現確率）と、各トピック（トピック番号＝１～Ｋ）における各単語（１～ｐ番目の単語）の出現確率（Ｋ行ｐ列の行列β）とが既知の情報である。従って、トピック値予測手段３６は、これらの既知の情報から、新規案件の固有テキストデータにおける各トピックの出現確率を示すトピック値（Ｋ次元の縦ベクトルπ（ｉ）で表されるトピック分布）を予測する。

【0107】

なお、新規案件の固有テキストデータの中に、各トピックにおける各単語の出現確率（Ｋ行ｐ列の行列β）として用意されている各単語（１～ｐ番目の単語）に含まれない新出の単語が存在する場合には、その新出の単語を含めた予測は行うことができないので、その新出の単語は無いものとして、新規案件の固有テキストデータにおけるトピック分布の予測を行う。従って、この新出の単語の情報は、その後に行われるトピック推定手段３５によるトピック推定処理（トピックモデルの更新処理）で、トピックモデル記憶手段５６に記憶されるトピックモデルに反映されることになる。

【0108】

（処理手段３０／単語重要度ベクトル算出手段３７の構成）
単語重要度ベクトル算出手段３７は、固有テキストデータ準備手段３４により作成されて案件データ記憶手段５４に記憶されている各案件（各企業）の固有テキストデータについての各単語のＴＦＩＤＦ値またはその他の単語重要度指標値からなる単語重要度ベクトルを算出し、得られた単語重要度ベクトルを、案件識別情報（案件番号）と関連付けて単語重要度ベクトル記憶手段５７に記憶させる処理を実行するものである。なお、単語重要度ベクトルの算出に用いる固有テキストデータは、固有テキストデータ準備手段３４による［δ］までの処理を経た後に残った単語の集合である。

【0109】

ここで、単語重要度指標値は、本実施形態では、一例として、ＴＦＩＤＦ値を採用しているが、これに限定されるものではなく、例えば、Ｏｋａｐｉ－ＢＭ２５等でもよい。なお、ＴＦ（Term Frequency）は、文書（ここでは、固有テキストデータ）における単語の出現頻度であり、ある１つの固有テキストデータにおける各単語の出現回数を、その固有テキストデータにおける全単語の出現回数の和で除した値である。ＩＤＦ（Inverse Document Frequency）は、逆文書頻度であり、全文書数（ここでは、固有テキストデータの総数）を、各単語を含む固有テキストデータの数で除した値についてロガリズム（ｌｏｇ）をとった値である。

【0110】

単語重要度ベクトルは、単語数をｐとすると、ｐ次元のベクトルであり、例えば、ｐ＝約３，０００語等であれば、約３，０００次元のベクトルとなる。この単語重要度ベクトルは、正規化（例えば、Ｌ２ノルム正規化）の処理を行っておくことが好ましい。

【0111】

本実施形態では、案件データ記憶手段５４には、マッチング処理で用いる固有テキストデータである結合テキストデータと、類似案件検索処理で用いる固有テキストデータである自己データおよびニーズデータとが記憶されているので、これらの３種類の固有テキストデータの各々についての単語重要度ベクトルを算出し、それぞれの単語重要度ベクトルを、案件識別情報（案件番号）と関連付けて単語重要度ベクトル記憶手段５７に記憶させる。なお、マッチング処理および類似案件検索処理で用いる固有テキストデータを、結合テキストデータで統一するか、あるいは、結合していない自己データおよびニーズデータで統一する場合には、マッチング処理用と類似案件検索処理用の単語重要度ベクトルは、共用にすることができる。

【0112】

この単語重要度ベクトル算出手段３７による処理は、事前処理（図１４参照）の段階で実行される。また、新規案件の登録時（図２３参照）に、新規案件登録手段４５からの指示を受けて、トピックモデル等の更新前における新規案件の即時反映処理として、新規案件の固有テキストデータについての単語重要度ベクトルの算出処理が実行される。さらに、トピックモデルの更新等の時期が到来した場合（図１６参照）にも実行されるが、上記の新規案件の即時反映処理で実行されている処理については、繰り返し実行する必要はない。

【0113】

（処理手段３０／マッチング学習用データ準備手段３８の構成）
マッチング学習用データ準備手段３８は、マッチング学習用データ（マッチングモデル記憶手段６０に記憶させるマッチングモデルの学習用データ）として、多数のマッチング用特徴データ（図８参照）の各々について、選定・非選定のラベル（タグ）を付したアノテーション後のデータ（図９参照）を作成し、タグ付けされた多数のマッチング用特徴データを、案件識別情報（案件番号）のペアと関連付けてマッチング学習用データ記憶手段５９に記憶させる処理を実行するものである。

【0114】

この際、マッチング学習用データ準備手段３８は、多数のマッチング用特徴データを用意するが、マッチング用特徴データの作成方法については、マッチング手段４２のマッチング用特徴データ作成手段４２Ａの説明で図７、図８を用いて詳述する。また、各マッチング用特徴データについての選定・非選定のタグ付け処理は、マッチング候補選定実績リスト記憶手段５８に記憶されているマッチング候補選定実績リストを用いて実行される。

【0115】

このマッチング学習用データ準備手段３８による処理は、マッチングモデルの初期モデルを構築する事前処理（図１４参照）の段階で実行される。また、マッチングモデルの更新時（図１６参照）にも実行される。

【0116】

（処理手段３０／マッチングモデル学習手段３９の構成）
マッチングモデル学習手段３９は、マッチング学習用データ準備手段３８により作成されてマッチング学習用データ記憶手段５９に記憶されているマッチング学習用データ（多数のマッチング用特徴データの各々について、選定・非選定のラベル（タグ）を付したアノテーション後のデータ、図９参照）を用いて、教師あり分類モデルによる学習処理を行い、得られたマッチングモデル（ここでは、学習結果データとしてのパラメータを意味する。）を、マッチングモデル記憶手段６０に記憶させる処理を実行するものである。

【0117】

このマッチングモデル学習手段３９による処理は、マッチングモデルの初期モデルを構築する事前処理（図１４参照）の段階で実行される。また、マッチングモデルの更新時（図１６参照）にも実行される。

【0118】

なお、固有テキストデータの数を増やしてトピック推定手段３５によるトピック推定処理を再度実行すると、厳密に言えば、各固有テキストデータにおけるトピック分布は、若干、異なる値となるので、それらのトピック分布を用いて作成される各マッチング用特徴データも、若干、異なる状態となる。そして、そのような若干異なる各マッチング用特徴データを用いてマッチングモデル学習手段３９による学習処理を行えば、マッチングモデル記憶手段６０に記憶させるマッチングモデルは、若干異なる状態となる。しかし、追加する固有テキストデータが、１つまたは比較的少数であれば、トピック分布は殆ど変化しないので、マッチングモデル記憶手段６０に記憶されているマッチングモデルについては、再学習せずに、そのまま用いることができる。従って、マッチングモデルの更新は、必ずしもトピック推定処理を再度実行することによるトピックモデルの更新と同時期に行う必要はなく、トピックモデルの更新と、マッチングモデルの更新とは、異なるタイミングで行ってよい（図１６のステップＳ１４参照）。

【0119】

（処理手段３０／入力受付手段４０の構成）
入力受付手段４０は、各画面１００，２００，３００（図１１、図１２、図１３参照）に設けられた入力部１１０でのキーワードまたは案件識別情報（案件番号）の入力を受け付ける処理を実行するものである。

【0120】

ここで、入力部１１０へのキーワードの入力には、各画面１００，２００，３００の入力部１１０への打鍵操作による入力の他、図１２の画面２００の「類似キーワード」表示部２１０に表示された各単語（入力されたキーワード、およびそのキーワードに関連する複数の関連単語）を選択することによる選択入力（クリック操作やタップ操作等による入力）が含まれる。各単語のいずれかを選択入力すると、選択した単語が、入力部１１０に自動表示されるようになっている。また、入力部１１０への案件識別情報（案件番号）の入力には、各画面１００，２００，３００の入力部１１０への打鍵操作による入力の他、図１２の画面２００の「キーワード検索リスト」表示部２２０に表示された各関連案件の案件識別情報（案件番号）を選択することによる選択入力と、図１３の画面３００の「推薦案件リスト」表示部３２０や「類似案件一覧」表示部３３０に表示された各推薦案件や各類似案件の案件識別情報（案件番号）を選択することによる選択入力とが含まれる。各関連案件、各推薦案件、各類似案件の案件識別情報（案件番号）のいずれかを選択入力すると、選択した案件識別情報（案件番号）が、入力部１１０に自動表示されるようになっている。

【0121】

また、入力受付手段４０は、入力部１１０に入力された情報が、キーワードであるか案件識別情報（案件番号）であるかを判断し、キーワードであると判断した場合には、連想検索手段４１にキーワードを伝達して連想検索処理を実行させ、案件識別情報（案件番号）であると判断した場合には、マッチング手段４２および類似案件検索手段４３に案件識別情報を伝達してマッチング処理および類似案件検索処理を実行させる。なお、本実施形態では、キーワードの入力と、案件識別情報（案件番号）の入力とを、同一の入力部１１０で受け付ける構成とされているが、キーワードの入力部と、案件識別情報（案件番号）の入力部とを、別々に設けてもよい。但し、同一の入力部１１０で受け付ける構成とすることが、ユーザの操作性、利便性向上の観点から好ましい。

【0122】

さらに、入力受付手段４０は、入力を受け付けたキーワードまたは案件識別情報（案件番号）のログ情報を、検索履歴記憶手段６１に記憶させる。検索履歴記憶手段６１は、主メモリ等の揮発性メモリでもよい。この際、マッチングシステム１０が、複数のユーザ（サービス担当者またはマッチング依頼者）の操作を同時に受け付けることができる構成（例えば、ネットワーク構成）である場合には、各ユーザの検索履歴のログ情報を、ユーザ識別情報と関連付けて検索履歴記憶手段６１に記憶させる。そして、入力受付手段４０は、検索履歴記憶手段６１に記憶させたログ情報を用いて、各画面１００，２００，３００に設けられた「検索履歴」表示部１３０（図１１では、表示部１３０の図示が省略されている。）に検索履歴の表示（キーワードまたは案件識別情報を入力順に並べた表示）を行う。なお、同じキーワードや、同じ案件識別情報（案件番号）を続けて入力してもよいが、同じ出力が繰り返されるだけであり、検索履歴には、同じキーワードや、同じ案件識別情報（案件番号）が並ぶことになる。

【0123】

（処理手段３０／連想検索手段４１の構成）
連想検索手段４１は、単語類似度算出手段４１Ａと、関連度算出手段４１Ｂとを含んで構成されている。

【0124】

単語類似度算出手段４１Ａは、入力受付手段４０によりキーワードの入力を受け付けた場合に、分散表現モデル記憶手段５３に記憶された単語の分散表現を用いて算出したキーワードとそれ以外の単語との間の一般類似度Ａと、案件データ記憶手段５４に記憶された各案件（各企業）の固有テキストデータを用いて算出したキーワードとそれ以外の単語との間の固有類似度Ｂとを用いて最終類似度ＦＳを算出し、得られた最終類似度ＦＳの高い順でキーワードの関連単語を決定する処理を実行するものである。より詳細な内容は、後述する。

【0125】

ここで、固有類似度Ｂを算出する際の各案件の固有テキストデータは、連想検索用の固有テキストデータであり、本実施形態では、マッチング用と共用の固有テキストデータである結合テキストデータである。

【0126】

なお、単語類似度算出手段４１Ａは、固有類似度Ｂを用いずに、一般類似度Ａを最終類似度ＦＳとし、キーワードの関連単語を決定してもよい。但し、より効果的なマッチングを行うという観点から、一般類似度Ａと固有類似度Ｂとの双方を用いて最終類似度ＦＳを算出することが好ましい。

【0127】

関連度算出手段４１Ｂは、入力受付手段４０により受け付けたキーワードおよびその関連単語の各々が、案件データ記憶手段５４に記憶された各案件（各企業）の固有テキストデータの中に出現する単語別出現回数Ｃを求め、求めた単語別出現回数Ｃおよび関連単語の最終類似度ＦＳを用いて、キーワードに対する各案件の関連度ＣＳを算出し、関連度ＣＳの高い順で関連案件を決定する処理を実行するものである。より詳細な内容は、後述する。

【0128】

（処理手段３０／連想検索手段４１／単語類似度算出手段４１Ａの構成：一般類似度Ａの算出処理、図２）
単語類似度算出手段４１Ａは、分散表現モデル記憶手段５３（図２参照）に記憶された分散表現モデル（本実施形態では、単語ベクトルの集合からなる重み行列Ｗであり、３つのタイプの重み行列Ｗ１，Ｗ２，Ｗ３とする。）を用いて、入力受付手段４０により受け付けたキーワードと他の単語との間のモデル別類似度Ｓを算出し、このモデル別類似度Ｓの大きさで順位付けした単語のうち、予め定められた上位Ｎ３（例えば、Ｎ３＝１００）の単語を、モデル別類似単語として選択する。なお、Ｎ３は、設定データとして設定データ記憶手段５１に記憶されているが、固定値としてもよい。

【0129】

より詳細には、単語類似度算出手段４１Ａは、先ず、図２に示すように、タイプ１～３の各々の分散表現モデルについて、分散表現モデル記憶手段５３（図２参照）に記憶されている重み行例Ｗ（Ｗ１～Ｗ３）を用いて、入力受付手段４０により受け付けたキーワードについての単語ベクトルＶ（ｋ，ｊ）と、他の単語についての単語ベクトルＶ（ｉ，ｊ）との間のコサイン類似度Ｓ（ｉ，ｊ）を算出し、モデル別類似度記憶手段６２に記憶させる。モデル別類似度記憶手段６２は、主メモリ等の揮発性メモリでもよい。図２に示すように、コサイン類似度Ｓ（ｉ，ｊ）は、Ｖ（ｋ，ｊ）とＶ（ｉ，ｊ）との内積を、Ｖ（ｋ，ｊ）の大きさとＶ（ｉ，ｊ）の大きさとの積で除した値である。このコサイン類似度Ｓ（ｉ，ｊ）の算出処理は、例えばｗｏｒｄ２ｖｅｃのモジュール等のように、既存のツールの機能を利用して実行してもよい。

【0130】

ここで、ｋは、入力受付手段４０により受け付けたキーワード（単語）の番号である。ｉは、各単語の番号であり、ｉ＝１，２，３，…，ｋ－１，ｋ＋１，…，Ｎ２－２，Ｎ２－１，Ｎ２をとり、Ｎ２は、ボキャブラリ数（例えば、Ｎ２＝１１５万）である。ｋが抜けているのは、Ｎ２個の単語のうち、キーワードの単語を除くという意味であり、キーワードの単語と、それ以外の全ての単語との間で、コサイン類似度Ｓ（ｉ，ｊ）を算出するという意味である。ｊは、分散表現モデルのタイプの番号であり、本実施形態では、ｊ＝１，２，３である。なお、分散表現モデルの数は３つに限定されるものではなく、３以外の複数でもよく、また、複数に限定されるものでもなく、１つでもよい。但し、複数の分散表現モデルを用いれば、各分散表現モデル間のモデル別類似度Ｓのばらつきを吸収し、より適切な単語を、一般類似単語として決定することが可能となる。なお、分散表現モデルの数が１つの場合は、その分散表現モデルにおけるモデル別類似度Ｓが、一般類似度Ａとなり、その分散表現モデルにおけるモデル別類似度Ｓの上位Ｎ３（例えば、Ｎ３＝１００）の単語が、モデル別類似単語であり、かつ、一般類似単語となる。

【0131】

従って、図２に示すように、例えば、タイプ１の分散表現モデルについては、重み行例Ｗ１を用いて、キーワードの単語についての単語ベクトルＶ（ｋ，１）と、他の単語についての単語ベクトルＶ（ｉ，１）との間のコサイン類似度Ｓ（ｉ，１）を算出する。同様に、タイプ２の分散表現モデルについては、重み行例Ｗ２を用いて、キーワードの単語についての単語ベクトルＶ（ｋ，２）と、他の単語についての単語ベクトルＶ（ｉ，２）との間のコサイン類似度Ｓ（ｉ，２）を算出する。タイプ３の分散表現モデルも同様である。

【0132】

それから、単語類似度算出手段４１Ａは、タイプ１～３の各々の分散表現モデルについて、モデル別類似度記憶手段６２に記憶しているコサイン類似度Ｓ（ｉ，ｊ）の中から、大きさが上位Ｎ３（例えば、Ｎ３＝１００）位以内のコサイン類似度Ｓ（ｉ，ｊ）を選択する。ここで、ｉ＝１，２，３，…，ｋ－１，ｋ＋１，…，Ｎ２－２，Ｎ２－１，Ｎ２であり、ｊ＝１，２，３である。番号ｉの数は、Ｎ２個（例えば１１５万個）の単語から、番号ｋのキーワードの単語を１つを除くので、（Ｎ２－１）個である。

【0133】

例えば、タイプ１のモデルについては、（Ｎ２－１）個（例えば、（１１５万－１）個）のコサイン類似度Ｓ（ｉ，１）（ｉ＝１，２，３，…，ｋ－１，ｋ＋１，…，Ｎ２－２，Ｎ２－１，Ｎ２）の中から、上位Ｎ３位以内（例えば、１００位以内）のコサイン類似度Ｓ（ｉ，１）を選択する。選択されたコサイン類似度Ｓ（ｉ，１）は、図２の最下部の表において太線で囲まれている。同様に、タイプ２のモデルについては、（Ｎ２－１）個（例えば、（１１５万－１）個）のコサイン類似度Ｓ（ｉ，２）（ｉ＝１，２，３，…，ｋ－１，ｋ＋１，…，Ｎ２－２，Ｎ２－１，Ｎ２）の中から、上位Ｎ３位以内（例えば１００位以内）のコサイン類似度Ｓ（ｉ，２）を選択する。さらに、タイプ３のモデルについては、（Ｎ２－１）個（例えば、（１１５万－１）個）のコサイン類似度Ｓ（ｉ，３）（ｉ＝１，２，３，…，ｋ－１，ｋ＋１，…，Ｎ２－２，Ｎ２－１，Ｎ２）の中から、上位Ｎ３位以内（例えば１００位以内）のコサイン類似度Ｓ（ｉ，３）を選択する。

【0134】

そして、タイプ１～３の各分散表現モデルで選択された上位Ｎ３位以内（例えば１００位以内）のＳ（ｉ，ｊ）の単語の番号ｉは、通常、一致していない。つまり、図２の最下部の表に示すように、太枠で囲まれた部分は、ずれている。従って、３タイプ全体で考えた場合には、各分散表現モデルで選択した単語が一致していない場合のずれ分の単語を含め、少なくとも１つの分散表現モデルで選択された単語の数は、Ｎ３（例えば１００）個よりも大きくなる。この数を、Ｎ４（例えば１５０）とする。

【0135】

また、Ｎ３個（例えば１００個）の単語の番号がずれて選択されることにより、全体でＮ４個（例えば１５０個）の単語の番号が選択されているので、タイプ１～３の分散表現モデルの各々についてみれば、（Ｎ４－Ｎ３）個（例えば、１５０－１００＝５０個）の単語の番号に対応するコサイン類似度Ｓ（ｉ，ｊ）が選択されていないため、存在しない状態である。このように、対応するコサイン類似度Ｓ（ｉ，ｊ）が存在しない番号の単語については、コサイン類似度Ｓ（ｉ，ｊ）＝０とみなすものとする。すなわち、実際には、それらのコサイン類似度Ｓ（ｉ，ｊ）の値は存在するが、上位Ｎ３位以内（例えば１００位以内）に入らないような小さな数値であるため、０とみなすことになる。

【0136】

例えば、図２の最下部の表において、タイプ１の分散表現モデルについては、Ｎ４個（例えば１５０個）の単語の番号ｉのうち、番号ｉ＝ｋ－１のＳ（ｋ－１，１）が存在しないので、Ｓ（ｋ－１，１）＝０とみなす。同様に、タイプ２の分散表現モデルについては、Ｎ４個（例えば１５０個）の単語の番号ｉのうち、番号ｉ＝２のＳ（２，２）と、番号ｉ＝Ｎ－２のＳ（Ｎ－２，２）とが存在しないので、Ｓ（２，２）＝Ｓ（Ｎ－２，２）＝０とみなす。また、タイプ３の分散表現モデルについては、Ｎ４個（例えば１５０個）の単語の番号ｉのうち、番号ｉ＝ｋ－１のＳ（ｋ－１，３）と、番号ｉ＝Ｎ－２のＳ（Ｎ－２，３）とが存在しないので、Ｓ（ｋ－１，３）＝Ｓ（Ｎ－２，３）＝０とみなす。

【0137】

その後、単語類似度算出手段４１Ａは、タイプ１～３の各々の分散表現モデルについて、Ｎ４個（例えば１５０個）の番号ｉの単語毎に、モデル別類似度記憶手段６２に記憶しているコサイン類似度Ｓ（ｉ，ｊ）の調和平均または加重調和平均（重み付き調和平均）を求めることにより、３つのタイプの分散表現モデルをアンサンブルした一般類似度Ａ（ｉ）を算出する。すなわち、一般類似度Ａ（ｉ）は、Ｓ（ｉ，１）、Ｓ（ｉ，２）、Ｓ（ｉ，３）の調和平均または加重調和平均である。加重調和平均は、例えば、ディメンジョンやウィンドウサイズについて、強調したい分散表現モデルがある場合に、そこに相対的に大きな重みを付けたり、ｗｏｒｄ２ｖｅｃのＣＢＯＷの分散表現モデルとＳｋｉｐ－ｇｒａｍの分散表現モデルとの混成とする場合に、ＣＢＯＷとＳｋｉｐ－ｇｒａｍとで重みを変える場合等に利用することができる。

【0138】

調和平均または加重調和平均をとると、番号ｉの単語について、タイプ１～３の各分散表現モデルのコサイン類似度Ｓ（ｉ，１），Ｓ（ｉ，２），Ｓ（ｉ，３）のうちのいずれかの値（少なくとも１つの値）がゼロになった場合には、一般類似度Ａ（ｉ）＝０となる。例えば、図２の最下部の表では、タイプ２の分散表現モデルについての番号ｉ＝２のＳ（２，２）＝０であるから、番号ｉ＝２の単語の一般類似度Ａ（２）＝０となる。同様に、タイプ１，３の分散表現モデルについての番号ｉ＝ｋ－１のＳ（ｋ－１，１）＝Ｓ（ｋ－１，３）＝０であるから、番号ｉ＝ｋ－１の単語の一般類似度Ａ（ｋ－１）＝０となる。また、タイプ２，３の分散表現モデルについての番号ｉ＝Ｎ－２のＳ（Ｎ－２，２）＝Ｓ（Ｎ－２，３）＝０であるから、番号ｉ＝Ｎ－２の単語の一般類似度Ａ（Ｎ－２）＝０となる。

【0139】

続いて、単語類似度算出手段４１Ａは、アンサンブルした一般類似度Ａ（ｉ）の値がゼロにならなかった単語を選択し、それらを一般類似単語として決定し、一般類似単語およびその一般類似単語についての一般類似度Ａ（ｉ）を、一般類似度記憶手段６３に記憶させる。一般類似度記憶手段６３は、主メモリ等の揮発性メモリでもよい。なお、複数種類の分散表現モデルをアンサンブルした一般類似度Ａ（ｉ）の値がゼロになることなく、一般類似単語として選択される単語は、タイプ１～３の各分散表現モデルで選択された上位Ｎ３位以内（例えば１００位以内）のモデル別類似度Ｓ（ｉ，ｊ）の番号ｉのうち、全ての分散表現モデルで選択された番号、すなわち全ての分散表現モデルで重なっている番号の単語である。換言すれば、全ての分散表現モデルについてのモデル別類似単語となっている単語である。この結果、一般類似単語として決定した単語の個数がＮ５個（例えば７０個）になったとする。このＮ５の値は、当然にＮ３（例えば１００）以下の値となり、Ｎ５＝Ｎ３となるのは、タイプ１～３の全ての分散表現モデルについて上位Ｎ３位以内（例えば１００位以内）のモデル別類似度Ｓ（ｉ，ｊ）の単語の組合せが一致している場合（順位まで一致している必要はない。）のみである。

【0140】

以上のように、本実施形態では、一般類似度Ａ（ｉ）は、Ｓ（ｉ，１）、Ｓ（ｉ，２）、Ｓ（ｉ，３）の調和平均または加重調和平均としているが、一般類似度Ａを算出するためのモデル別類似度Ｓの統合方法は、調和平均または加重調和平均に限定されるものではなく、例えば、単純平均、加重平均、相乗平均等でもよい。また、各種平均をとる前に、突出した値を除外するという観点で、各分散表現モデルの番号ｉの単語のモデル別類似度Ｓのうちの最大および／または最小のモデル別類似度Ｓを除いた状態としてから、各種平均をとるようにしてもよい。

【0141】

（処理手段３０／連想検索手段４１／単語類似度算出手段４１Ａの構成：固有類似度Ｂの算出処理、図３）
さらに、単語類似度算出手段４１Ａは、以上のようにして決定したＮ５個（例えば７０個）の各一般類似単語、および、キーワードの単語について、案件テキストデータ記憶手段５４に記憶された各案件の固有テキストデータ（本実施形態では、自己データとニーズデータとの結合テキストデータ）との照合を行うことにより、各一般類似単語および／またはキーワードの単語を含む固有テキストデータおよびその案件識別情報（案件番号）を抽出する。なお、抽出した案件識別情報（案件番号）は、図示されない抽出案件記憶手段（主メモリ等の揮発性メモリでもよい。）に記憶しておく。

【0142】

そして、単語類似度算出手段４１Ａは、図３に示すように、Ｎ５個（例えば７０個）の一般類似単語の全てについて、次の処理を実行する。なお、図３では、Ｎ５個の一般類似単語のうちの任意の１つの一般類似単語をβとしている。

【0143】

すなわち、単語類似度算出手段４１Ａは、全ての案件のうち、固有テキストデータの中にキーワードαおよび一般類似単語βの双方が含まれる各案件の集合Ｐにおけるキーワードαの出現回数および一般類似単語βの出現回数による集合Ｐの評価値Ｐｓ（但し、後述する式（１）の係数σ＝０とし、キーワードαの出現回数を使用せずに一般類似単語βの出現回数だけによる集合Ｐの評価値Ｐｓとしてもよい。）と、固有テキストデータの中にキーワードαが含まれず、かつ、一般類似単語βが含まれる各案件の集合Ｑにおける一般類似単語βの出現回数による集合Ｑの評価値Ｑｓとを用いて、Ｐｓ／（Ｐｓ＋Ｑｓ）により、固有類似度Ｂを算出し、算出した固有類似度Ｂを固有類似度記憶手段６４に記憶させる。固有類似度記憶手段６４は、主メモリ等の揮発性メモリでもよい。

【0144】

図３において、例えば、キーワードα（例えば「お酒」）を含む案件は、Ａ社、Ｂ社、Ｃ社、Ｈ社、Ｊ社であり、一般類似単語β（例えば「焼酎」）を含む案件は、Ａ社、Ｂ社、Ｃ社、Ｄ社、Ｅ社、Ｆ社、Ｇ社であるとする。この場合、キーワードαおよび一般類似単語βの双方を含む案件の集合Ｐは、Ａ社、Ｂ社、Ｃ社により構成される。また、キーワードαを含まず、かつ、一般類似単語βを含む案件の集合Ｑは、Ｄ社、Ｅ社、Ｆ社、Ｇ社により構成される。なお、キーワードαに対する一般類似単語βについての固有類似度Ｂの算出には、Ｈ社、Ｊ社は関与しない。

【0145】

集合Ｐの評価値Ｐｓは、次の式（１）により、集合Ｐに属する各案件（企業）のαの出現回数と、βの出現回数との関数ｆで算出される。

【0146】

Ｐｓ＝ｆ（集合Ｐに属する各案件のαの出現回数，βの出現回数）
＝（Ａα＋Ｂα＋Ｃα）×σ＋（Ａβ＋Ｂβ＋Ｃβ）×τ ・・・・（１）

【0147】

ここで、Ａαは、Ａ社の固有テキストデータにおけるキーワードαの出現回数である。同様に、Ｂα、Ｃαは、Ｂ社、Ｃ社の各固有テキストデータにおけるキーワードαの各出現回数である。Ａβ、Ｂβ、Ｃβは、Ａ社、Ｂ社、Ｃ社の各固有テキストデータにおける一般類似単語βの各出現回数である。なお、図３は、一例であるから、より多くの案件が集合Ｐに属していれば、それらの全ての案件の固有テキストデータにおけるキーワードαや一般類似単語βの各出現回数を加算対象とする。

【0148】

また、係数σは、σ＝０の値をとることができ、その場合は、集合Ｐに属する各案件の固有テキストデータには、キーワードαおよび一般類似単語βの双方が含まれているが、キーワードαの出現回数は使用しないことになる。係数σ，τは、設定データとして設定データ記憶手段５１に記憶されているが、固定値としてもよい。

【0149】

集合Ｑの評価値Ｑｓは、次の式（２）により、集合Ｑに属する各案件（企業）のβの出現回数の関数ｇで算出される。

【0150】

Ｑｓ＝ｇ（集合Ｑに属する各案件（企業）のβの出現回数）
＝（Ｄβ＋Ｅβ＋Ｆβ＋Ｇβ）×φ ・・・・・・・・・・・・・・・（２）

【0151】

ここで、Ｄβ、Ｅβ、Ｆβ、Ｇβは、Ｄ社、Ｅ社、Ｆ社、Ｇ社の各固有テキストデータにおける一般類似単語βの各出現回数である。なお、図３は、一例であるから、より多くの案件が集合Ｑに属していれば、それらの全ての案件の固有テキストデータにおける一般類似単語βの出現回数を加算対象とする。また、係数φは、設定データとして設定データ記憶手段５１に記憶されているが、固定値としてもよい。

【0152】

例えば、図３の表のデータ集計例１では、式（１）の係数σ＝τ＝１という設定とした場合は、Ｐｓ＝（３＋２＋２）×１＋（２＋１＋３）×１＝１３となり、式（２）の係数φ＝１という設定とした場合は、Ｑｓ＝（２＋１＋２＋４）×１＝９となる。従って、固有類似度Ｂは、Ｐｓ／（Ｐｓ＋Ｑｓ）＝１３／（１３＋９）＝０．５９１となる。

【0153】

図３の表のデータ集計例１で、αの出現回数を用いずにβの出現回数だけで固有類似度Ｂを算出すべく、式（１）の係数σ＝０、τ＝１、式（２）の係数φ＝１という設定とした場合は、Ｐｓ＝６、Ｑｓ＝９となるので、固有類似度Ｂは、Ｐｓ／（Ｐｓ＋Ｑｓ）＝６／（６＋９）＝０．４となる。

【0154】

また、図３の表のデータ集計例１で、集合Ｐの評価値Ｐｓを算出する際に、ａ，βという２つの単語の出現回数を合計することによる過大な影響を抑えるべく、式（１）の係数σ＝τ＝０．５、式（２）の係数φ＝１という設定とした場合は、Ｐｓ＝６．５、Ｑｓ＝９となるので、固有類似度Ｂは、Ｐｓ／（Ｐｓ＋Ｑｓ）＝６．５／（６．５＋９）＝０．４１９となる。

【0155】

さらに、ある１つの案件の固有テキストデータにおけるａ，βの出現回数の値が突出していると、その１つの案件による影響が過大になるおそれがある。そこで、例えば、閾値（例えば、１０回等）を設け、出現回数が閾値を超える場合には、閾値に変更する等の上限調整を行ってもよい。例えば、閾値が１０回のときに、Ａβ＝１３であれば、上限であるＡβ＝１０に調整する等である。また、出現回数の平方根を求める等の変換調整を行ってもよい。例えば、Ａβ＝２であれば、Ａβ＝√２＝１．４１４に変換調整する等である。

【0156】

従って、固有類似度Ｂは、各案件（各企業）の固有テキストデータを用いて算出されていればよい。このため、本願出願人により開発された前述した特許文献２の抽出システムに記載された方法で固有類似度Ｂ（特許文献２では、テキストデータ基準関連度Ｐｗｏｒｄ（適合率）と称されている。）を算出してもよい。前述した特許文献２の抽出システムでは、固有類似度Ｂは、本実施形態のような単語α，βの出現回数を用いる方法ではなく、集合Ｐに属する案件（企業）の数と、集合Ｑに属する案件（企業）の数とを用いて固有類似度Ｂを算出している。よって、前述した特許文献２の抽出システムの方法によれば、固有類似度Ｂは、一般類似単語βを含む案件のうちのキーワードαも含む案件の比率であるから、図３の表のデータ集計例１では、固有類似度Ｂは、３社／（３社＋４社）＝３社／７社＝０．４２９となる。

【0157】

なお、図３の表のデータ集計例２の状況で、式（１）の係数σ＝τ＝１、式（２）の係数φ＝１という設定とした場合、あるいは、図３の表のデータ集計例３の状況で、式（１）の係数σ＝０、τ＝１、式（２）の係数φ＝１という設定とした場合は、Ｐｓ＝６、Ｑｓ＝８となるので、固有類似度Ｂは、Ｐｓ／（Ｐｓ＋Ｑｓ）＝６／（６＋８）＝０．４２９となり、前述した特許文献２の抽出システムの方法により算出した固有類似度Ｂの値と同じ値となる。従って、単語α，βの出現回数が特殊な状況（各案件で均等）になったときに、案件の数を考慮する特許文献２の方法による固有類似度Ｂの算出値と、出現回数を考慮する本実施形態の方法による固有類似度Ｂの算出値とが一致する。

【0158】

（処理手段３０／連想検索手段４１／単語類似度算出手段４１Ａの構成：最終類似度ＦＳの算出処理）
その後、単語類似度算出手段４１Ａは、一般類似度記憶手段６３に記憶されている各一般類似単語についての一般類似度Ａ（ｉ）と、固有類似度記憶手段６４に記憶されている各一般類似単語についての固有類似度Ｂ（ｉ）との調和平均または加重調和平均（重み付き調和平均）を求めることにより、各一般類似単語についての最終類似度ＦＳ（ｉ）を算出し、この最終類似度ＦＳ（ｉ）の大きさで順位付けした各一般類似単語のうち、予め定められた数の上位の単語、または、閾値に対する最終類似度ＦＳ（ｉ）の大きさで選択した単語を、関連単語として決定し、決定した各関連単語およびそれらの関連単語の最終類似度ＦＳ（ｉ）を最終類似度記憶手段６５に記憶させる処理を実行する。本実施形態では、上位Ｎ６個（例えば１０個）の一般類似単語を、関連単語として選択決定する。Ｎ６は、設定データとして設定データ記憶手段５１に記憶されているが、固定値としてもよい。

【0159】

ここで、ｉは、一般類似単語として決定された単語の番号であり、ｉ＝１，２，３，…，Ｎ５をとり、Ｎ５（例えば７０）は、一般類似単語の個数である。従って、ここでは、番号ｉは、詰めている。

【0160】

なお、一般類似度Ａ（ｉ）と固有類似度Ｂ（ｉ）とを用いて最終類似度ＦＳ（ｉ）を算出する際には、調和平均または加重調和平均ではなく、単純平均、加重平均、相乗平均、二乗平均平方根（ＲＭＳ）等を求めてもよいが、率の平均をとるという観点では、調和平均または加重調和平均とすることが好ましい。

【0161】

（処理手段３０／連想検索手段４１／関連度算出手段４１Ｂの構成：関連度ＣＳの算出処理、図４）
関連度算出手段４１Ｂは、案件データ記憶手段５４に記憶された全ての案件（企業）の固有テキストデータのうち、単語類似度算出手段４１Ａにより決定した各関連単語（本実施形態では、一般類似単語βのうち、最終類似度ＦＳが上位Ｎ６個（例えば１０個）の単語）またはキーワードαのいずれかの単語を含む各固有テキストデータについて、次の処理を実行する。この処理対象となる各固有テキストデータは、当然に、各一般類似単語βまたはキーワードαのいずれかの単語を含む各固有テキストデータの集合の中に含まれるので、ここでの処理対象となる各固有テキストデータの案件識別情報（案件番号）は、単語類似度算出手段４１Ａにより抽出されて図示されない抽出案件記憶手段に記憶されている案件識別情報（案件番号）の範囲内である。

【0162】

すなわち、関連度算出手段４１Ｂは、図４に示すように、各関連単語γ（本実施形態では、Ｎ５個（例えば７０個）の一般類似単語βのうち、最終類似度ＦＳが上位Ｎ６個（例えば１０個）の単語）およびキーワードαのそれぞれの単語について、上述した処理対象となる各固有テキストデータの中に出現する単語別出現回数Ｃ（ｉ）を求め、次の式（３）により、各関連単語γ（γ１，γ２，…）についての単語別出現回数Ｃ（ｉ）に各関連単語γについての最終類似度ＦＳ（ｉ）を乗じた値またはこの値に各関連単語γの重み係数κ（ｉ）を乗じた値、並びに、キーワードαについての単語別出現回数Ｃ（０）またはこの単語別出現回数Ｃ（０）にキーワードαの重み係数κ（０）を乗じた値を合計することにより、キーワードαに対する各案件（各企業）の関連度ＣＳを算出し、算出した関連度ＣＳを、案件識別情報（案件番号）と関連付けて関連度記憶手段６６に記憶させる処理を実行する。

【0163】

ＣＳ＝Σｉ｛κ（ｉ）×ＦＳ（ｉ）×Ｃ（ｉ）｝・・・・・・・・・（３）

【0164】

ここで、ｉは、単語の番号であり、ｉ＝０，１，２，３，…，Ｎ６をとり、番号ｉ＝０は、キーワード（単語α）の番号であり、番号ｉ＝１～Ｎ６は、関連単語γとして決定された単語の番号であり、Ｎ６（例えば１０）は、関連単語γの個数である。従って、ここでは、番号ｉは、詰めている。キーワードα（ｉ＝０）についての最終類似度ＦＳは、ＦＳ（０）＝１とする。

【0165】

κ（ｉ）は、各単語（キーワードα、各関連単語γ）の重み係数であり、いずれも設定データとして、設定データ記憶手段５１に記憶されている。原則的には、全ての単語（ｉ＝０，１，…，Ｎ６）の重み係数について、κ（ｉ）＝１としてよい。単語別出現回数Ｃ（ｉ）には、重みとしてＦＳ（ｉ）が乗じられているからである。従って、最終類似度ＦＳ（ｉ）による重み付けについて、更なる重み付けをする場合等に、１以外の値であるκ（ｉ）を利用することができる。例えば、１番大きいＦＳ（ｉ）または１番大きいＣ（ｉ）には、κ（ｉ）＝３を乗じ、２番目に大きいＦＳ（ｉ）または２番目に大きいＣ（ｉ）には、κ（ｉ）＝２を乗じる等のような更なる重み付けを行うことができる。また、キーワードα（ｉ＝０）と、各関連単語γ（ｉ＝１～Ｎ６）との相対的な重み付けに、κ（ｉ）を利用してもよく、その場合には、κ（０）と、その他のκ（ｉ）（ｉ＝１～Ｎ６）とを別の値に設定すればよい。この際、キーワードα（ｉ＝０）についての最終類似度は、ＦＳ（０）＝１とし、さらに重み係数κ（０）を乗じているので、κ（０）×ＦＳ（０）を１つの重み係数と考えてもよく、あるいは、κ（０）を使用せずに、ＦＳ（０）自体を、１とするのではなく、重み係数と考えてもよい。なお、式（３）により求まる関連度ＣＳの値は、案件（企業）を順位付けするための相対的な評価用の数値であるから、κ（ｉ）（ｉ＝０，１，…，Ｎ６）は、相対的な重み付けをすることができる数値であればよいので、どのようなレベルの値でもよく（例えば、０～１の範囲でも、０～１００の範囲でも、どのような範囲をとる数値でもよいという意味である。）、整数である必要もない。

【0166】

より詳細には、図４の例では、関連度算出手段４１Ｂは、処理対象の１つであるＡ社の固有テキストデータについて、キーワードα（例えば「お酒」）や各関連単語γ（例えば、γ１＝「焼酎」、γ２＝「泡盛」等）が含まれているか否かを判断している。図４に示すように、Ａ社の固有テキストデータには、「お酒」（キーワードα）が３回出現し、「焼酎」（関連単語γ１）が２回出現し、「泡盛」（関連単語γ２）が２回出現しているので、その他の関連単語γ３，γ４，…の出現も含め、これらの単語のそれぞれが出現する単語別出現回数Ｃ（ｉ）（ｉ＝０，１，…，Ｎ６）を求める。

【0167】

続いて、関連度算出手段４１Ｂは、最終類似度記憶手段６５に記憶されている各関連単語γについての最終類似度ＦＳ（ｉ）（ｉ＝１～Ｎ６）を取得し、取得した最終類似度ＦＳ（ｉ）と、キーワードα（ｉ＝０）についてのＦＳ（０）＝１と、上記のようにして求めたＡ社の固有テキストデータにおける単語別出現回数Ｃ（ｉ）（ｉ＝０，１，…，Ｎ６）と、設定データ記憶手段５１に記憶されている重み係数κ（ｉ）（ｉ＝０，１，…，Ｎ６）とを用いて、式（３）により、キーワードαに対するＡ社の関連度ＣＳを算出する。

【0168】

そして、関連度算出手段４１Ｂは、以上の処理を、Ａ社以外の処理対象の案件の固有テキストデータについても同様に実行する。これにより、キーワードαに対する各案件（各企業）の関連度ＣＳが得られるので、関連度ＣＳの高い案件（企業）を、関連案件（関連企業）として決定し、案件データ記憶手段５４から、決定した関連案件の案件データを取得する。この際、関連度ＣＳが予め定められた数の上位の案件を関連案件として選択決定してもよく、関連度ＣＳに対する閾値を設けて関連案件を決定してもよい。

【0169】

（処理手段３０／マッチング手段４２の構成）
マッチング手段４２は、マッチング用特徴データ作成手段４２Ａと、マッチングスコア算出手段４２Ｂとを含んで構成されている。このマッチング手段４２には、本願出願人により開発された前述した特許文献１のマッチングシステムまたはその変形システム（固有テキストデータとして、特許文献１に記載された結合テキストデータを使用する代わりに、非結合状態の自己データおよびニーズデータを使用する場合）を適用することができ、本発明は、主として、特許文献１のマッチングシステムの周辺部分を開発したものである。従って、本発明のマッチング処理の有効性については、特許文献１の段落番号［０２１１］に実験結果として記載されている通りであり、適合率、再現率、Ｆ１値、正確度のいずれについても高い数値が得られている。

【0170】

マッチング用特徴データ作成手段４２Ａは、入力受付手段４０により案件識別情報（案件番号）の入力を受け付けた場合に、受け付けた案件識別情報（案件番号）の案件をマッチング処理の対象案件とし、トピックモデル記憶手段５６に記憶されている各案件の固有テキストデータにおけるトピック分布（各トピックの出現確率を示すトピック値）を用いて、対象案件とこの対象案件のマッチング相手となる各候補案件とからなる複数のペアの各々についてのマッチング用特徴データを作成する処理を実行するものである。より詳細な内容は、後述する。

【0171】

マッチングスコア算出手段４２Ｂは、マッチング用特徴データ作成手段４２Ａにより作成した複数のマッチング用特徴データの各々を入力データとして、選定されるか否かの２クラス分類で予め学習されてマッチングモデル記憶手段６０に記憶されたマッチングモデルを用いて、教師あり分類モデルによる分類処理を行うことにより、対象案件に対して各候補案件が選定される確度（確からしさ）を示すスコア（マッチングスコア）を算出する処理を実行するものである。より詳細な内容は、後述する。

【0172】

（処理手段３０／マッチング手段４２／マッチング用特徴データ作成手段４２Ａの構成：図５、図７、図８）
マッチング用特徴データ作成手段４２Ａは、図５に示すように、マッチング用の固有テキストデータ（本実施形態では、結合テキストデータ）におけるトピック分布π（ｉ）（トピック番号＝１～Ｋの各トピックの出現確率を示すトピック値）と、マッチング用の固有テキストデータについてのマッチング用の単語重要度ベクトル（本実施形態では、一例として、ＴＦＩＤＦベクトルとする。）と、マッチングの対象案件（対象企業）および各候補案件（各候補企業）についてのニーズフラグや年商とを用いて、マッチングスコア算出手段４２Ｂおよびマッチングモデル記憶手段６０からなる識別器への入力データとなるマッチング用特徴データを作成する処理を実行する。但し、図５の下部に記載されているのは、マッチングの対象案件と候補案件とからなるペアのうちの一方の側のマッチング用特徴データ（従って、合成変数を作成する前の状態、単語重要度ベクトルの内積を算出する前の状態）である。

【0173】

より詳細には、マッチング用特徴データ作成手段４２Ａは、図８に示すように、運用時（ユーザの検索中）の処理として、トピックモデル記憶手段５６に記憶されている対象案件Ｘおよび各候補案件Ｙのマッチング用の固有テキストデータ（本実施形態では、結合テキストデータ）におけるトピック分布（各トピックの出現確率を示すトピック値）と、単語重要度ベクトル算出手段３７により算出されて単語重要度ベクトル記憶手段５７に記憶されている対象案件Ｘおよび各候補案件Ｙのマッチング用の固有テキストデータについてのマッチング用の単語重要度ベクトル（ＴＦＩＤＦベクトル等）と、案件データ記憶手段５４に記憶されている対象案件Ｘおよび各候補案件Ｙの案件データに含まれるニーズフラグや年商とを用いて、対象案件Ｘと各候補案件Ｙとからなる複数のペアについてのマッチング用特徴データを作成する。

【0174】

ここで、トピックモデル記憶手段５６に記憶されている対象案件Ｘおよび各候補案件Ｙのマッチング用の固有テキストデータにおけるトピック分布（各トピックの出現確率を示すトピック値）には、トピック推定手段３５によるトピック推定処理（トピックモデルの初期モデルの構築時およびモデルの更新時）で得られた各案件のマッチング用の固有テキストデータにおけるトピック分布の他、検索のタイミングにより、トピック値予測手段３６によるトピック値予測で得られた新規案件のマッチング用の固有テキストデータにおけるトピック分布（トピックモデルの更新前における仮の値）が含まれることがある。「検索のタイミングにより」というのは、トピックモデルの更新後（新規モデルの構築後を含む）で、かつ、未だその更新後において新規案件の登録がないタイミングでは、トピック値予測手段３６によるトピック分布（仮の値）は存在せず、一方、トピックモデルの更新後において新規案件の登録があり、かつ、その次の更新時期が到来していないタイミングでは、トピック値予測手段３６によるトピック分布（仮の値）が存在するという意味である。

【0175】

また、図５では、各案件識別情報（各案件番号）についてのマッチング用特徴データ（但し、図５は合成変数を作成する前の状態、単語重要度ベクトルの内積を算出する前の状態）は、トピック分布と、単語重要度ベクトル（例えばＴＦＩＤＦベクトル等）と、ニーズフラグと、年商とで構成されているが、図５中の二点鎖線で示すように、単語重要度ベクトル、ニーズフラグ、年商は、マッチング用特徴データの作成に必須のものではなく、使用しないという選択もできる。また、図５での図示は省略されているが、マッチング用特徴データの作成に、文書長を使用してもよい。この文書長としては、例えば、固有テキストデータ準備手段３４による［α］固有テキストデータの作成処理を行った状態、または［β］不要な記号やタグ等の除去処理を行った状態の固有テキストデータの文字数（すなわち、［γ］の形態素解析で単語に分解される前の状態の固有テキストデータの文字数）、あるいは、［δ］までの処理を経た状態の処理後の固有テキストデータの単語の総数等を用いることができる。

【0176】

さらに、図７に示すように、マッチング用特徴データの作成では、合成変数を含めることが、適切なスコアリングを行ううえで効果的である。

【0177】

図７（Ａ）に示すように、各トピック値により合成変数を作成する場合は、対象案件Ｘのトピック分布π（Ｘ）と、候補案件Ｙのトピック分布π（Ｙ）との積からなる合成変数の分布λ（ＸＹ）を求め、これをマッチング用特徴データに含めることができる。なお、図７（Ａ）において、λ（ＸＹ）＝π（Ｘ）＊π（Ｙ）という表記を行っているが、ベクトルの内積を求めるわけではなく、ベクトルの対応する要素同士の積を求めるという意味である。すなわち、同じトピックについてのトピック値同士の積であるから、トピック番号＝１のトピック値同士の積、トピック番号＝２のトピック値同士の積、…、トピック番号＝Ｋ（Ｋはトピック数）のトピック値同士の積を求める。より正確な表記にすると、λ（ＸＹ，１）＝π（Ｘ，１）＊π（Ｙ，１）、λ（ＸＹ，２）＝π（Ｘ，２）＊π（Ｙ，２）、…、λ（ＸＹ，Ｋ）＝π（Ｘ，Ｋ）＊π（Ｙ，Ｋ）となる。従って、Ｋ次元ベクトルであるトピック分布π（Ｘ）と、Ｋ次元ベクトルであるトピック分布π（Ｙ）とから、Ｋ次元ベクトルである合成変数の分布λ（ＸＹ）を求めることになる。

【0178】

また、図７（Ａ）に示すように、対象案件Ｘのトピック分布π（Ｘ）と、候補案件Ｙのトピック分布π（Ｙ）との差の絶対値からなる合成変数の分布μ（ＸＹ）を求め、これをマッチング用特徴データに含めることができる。差ではなく、差の絶対値としているのは、方向性を無くすためであり、μ（ＸＹ）とμ（ＹＸ）とを同じにするため（順番を変えても同じになるようにするため）である。この場合は、ベクトルの対応する要素間の差の絶対値を求める。すなわち、同じトピックについてのトピック値間の差の絶対値であるから、トピック番号＝１のトピック値間の差の絶対値、トピック番号＝２のトピック値間の差の絶対値、…、トピック番号＝Ｋ（Ｋはトピック数）のトピック値間の差の絶対値を求める。より正確な表記にすると、μ（ＸＹ，１）＝｜π（Ｘ，１）－π（Ｙ，１）｜、μ（ＸＹ，２）＝｜π（Ｘ，２）－π（Ｙ，２）｜、…、μ（ＸＹ，Ｋ）＝｜π（Ｘ，Ｋ）－π（Ｙ，Ｋ）｜となる。従って、Ｋ次元ベクトルであるトピック分布π（Ｘ）と、Ｋ次元ベクトルであるトピック分布π（Ｙ）とから、Ｋ次元ベクトルである合成変数の分布μ（ＸＹ）を求めることになる。

【0179】

なお、図７（Ａ）の例において、トピック分布の積からなる合成変数の分布λ（ＸＹ）と、トピック分布の差の絶対値からなる合成変数の分布μ（ＸＹ）との双方を、マッチング用特徴データに含めることが好ましいが、積の分布λ（ＸＹ）、差の絶対値の分布μ（ＸＹ）のうち、いずれか一方を使用してもよい。

【0180】

さらに、図７（Ｂ）に示すように、各ニーズフラグにより合成変数を作成する場合は、対応するニーズフラグ同士（同じ種類のニーズフラグ同士）の論理和（ＯＲ）、論理積（ＡＮＤ）、排他的論理和（ＸＯＲ）、否定論理和（ＮＯＲ）、否定論理積（ＮＡＮＤ）、否定排他的論理和（ＮＸＯＲ）、算術和等を採用することができる。図７（Ｂ）の例では、論理和（ＯＲ）、論理積（ＡＮＤ）、算術和による合成変数が示されている。この例は、論理和（ＯＲ）、論理積（ＡＮＤ）、算術和等による複数タイプ（３タイプ）の合成変数の全部を使用するという意味ではなく、いずれか1タイプの合成変数を選んで使用すればよいという趣旨で記載している。なお、複数タイプの合成変数を、マッチング用特徴データに含めてもよい。

【0181】

そして、各ニーズフラグにより合成変数を作成する場合は、対応するニーズフラグ同士ではなく、異なる種類のニーズフラグに跨って、合成変数を作成してもよい。例えば、ニーズフラグの中に、（１）売ります、（２）買います、のように内容的に関連するニーズフラグがある場合に、（１）および（２）のニーズフラグを用いて、上述した論理和（ＯＲ）等による合成変数を作成してもよい。

【0182】

また、図７（Ｃ）に示すように、年商により合成変数を作成する場合は、双方の年商の比の値等を採用することができる。比の値による合成変数Ｍ（ＸＹ）とする場合、希望者Ｘの年商をＳ（Ｘ）、希望者Ｙの年商をＳ（Ｙ）とすると、方向性を持たせて、Ｍ（ＸＹ）＝Ｓ（Ｘ）／Ｓ（Ｙ）、あるいは、Ｍ（ＸＹ）＝Ｓ（Ｙ）／Ｓ（Ｘ）としてもよい。また、方向性を無くすため、Ｍ（ＸＹ）＝Ｓ（Ｘ）／Ｓ（Ｙ）またはＳ（Ｙ）／Ｓ（Ｘ）のうちの大きい方の値、あるいは、Ｍ（ＸＹ）＝Ｓ（Ｘ）／Ｓ（Ｙ）またはＳ（Ｙ）／Ｓ（Ｘ）のうちの小さい方の値としてもよい。方向性を持たせた場合には、Ｍ（ＸＹ）とＭ（ＹＸ）とが異なる値となる。

【0183】

さらに、図７での図示は省略されているが、文書長により合成変数を作成する場合は、双方の文書長の比の値等を採用することができる。比の値による合成変数とする場合、方向性を待たせてもよく、方向性を無くしてもよいのは、上述した年商の場合と同様である。

【0184】

単語重要度ベクトル（例えばＴＦＩＤＦベクトル等）については、対象案件Ｘの単語重要度ベクトルと、候補案件Ｙの単語重要度ベクトルとの内積をとる。内積であるから、方向性はない。

【0185】

また、本実施形態では、マッチング用の固有テキストデータは、結合テキストデータとしているが、結合していない自己データおよびニーズデータを固有テキストデータとしてもよく、この場合には、対象案件Ｘに、自己データについてのトピック分布π１（Ｘ）と、ニーズデータについてのトピック分布π２（Ｘ）とがあり、候補案件Ｙにも、自己データについてのトピック分布π１（Ｙ）と、ニーズデータについてのπ２（Ｙ）とがある。

【0186】

この際、トピック分布の積からなる合成変数を求めるには、対象案件Ｘの自己データと、候補案件Ｙのニーズデータとを組み合わせてλ１（ＸＹ）＝π１（Ｘ）＊π２（Ｙ）とするとともに、候補案件Ｙの自己データと、対象案件Ｘのニーズデータとを組み合わせてλ２（ＸＹ）＝π１（Ｙ）＊π２（Ｘ）とすることができる。「＊」がベクトルの内積ではなく、ベクトルの対応する要素同士の積を意味するのは、前述した通りである。同様に、トピック分布の差の絶対値からなる合成変数は、μ１（ＸＹ）＝｜π１（Ｘ）－π２（Ｙ）｜、μ２（ＸＹ）＝｜π１（Ｙ）－π２（Ｘ）｜とすることができる。従って、４つの合成変数λ１（ＸＹ）、λ２（ＸＹ）、μ１（ＸＹ）、μ２（ＸＹ）をマッチング用特徴データに含めることができる。なお、合成変数を使用しない場合は、４つのトピック分布π１（Ｘ）、π２（Ｘ）、π１（Ｙ）、π２（Ｙ）をそのままマッチング用特徴データに含めることになる。

【0187】

また、求めた２つの合成変数λ１（ＸＹ）とλ２（ＸＹ）とを用いて、これらのベクトルの対応する要素同士の平均値からなるλave（ＸＹ）という１つの合成変数を求める２段階合成を行ってもよい。同様に、２つの合成変数μ１（ＸＹ）とμ２（ＸＹ）とを用いて、これらのベクトルの対応する要素同士の平均値からなるμave（ＸＹ）という１つの合成変数を求める２段階合成を行ってもよい。このように２段階合成を行った場合には、２つの合成変数λave（ＸＹ）、μave（ＸＹ）をマッチング用特徴データに含めることになる。

【0188】

さらに、マッチング用特徴データ作成手段４２Ａにより、対象案件Ｘと候補案件Ｙとの１つのペア案件について、π１（Ｘ）およびπ２（Ｙ）を含むか、またはこれらの合成変数λ１（ＸＹ）およびμ１（ＸＹ）を含む第１のマッチング用特徴データと、π１（Ｙ）およびπ２（Ｘ）を含むか、またはこれらの合成変数λ２（ＸＹ）およびμ２（ＸＹ）を含む第２のマッチング用特徴データを作成し、これらの第１、第２のマッチング用特徴データを別々に、マッチングスコア算出手段４２Ｂおよびマッチングモデル記憶手段６０からなる識別器に入力することにより、第１、第２のマッチングスコアを算出し、その後、これらの第１、第２のマッチングスコアの平均値等を算出して統合後のマッチングスコアを算出してもよい。

【0189】

このような統合後のマッチングスコアを算出する構成とする場合には、マッチング学習用データ準備手段３８により、案件番号Ｘと案件番号Ｙとの１つのペアから、２つのマッチング学習用データである第１、第２のマッチング用特徴データを作成する。すなわち、図９において、選定実績のある１つのペア案件から、「１（選定）」というタグが付された２つのマッチング用特徴データを作成し、選定実績のない１つのペア案件から、「０（非選定）」というタグが付された２つのマッチング用特徴データを作成するという準備処理を、全てのペア案件について行い、マッチングモデル学習手段３９による学習処理を実行してマッチングモデルを構築する。

【0190】

（処理手段３０／マッチング手段４２／マッチングスコア算出手段４２Ｂの構成）
マッチングスコア算出手段４２Ｂは、選定されるか否かの２クラス分類で予め学習されてマッチングモデル記憶手段６０に記憶されたマッチングモデルを用いて、「教師あり分類モデル」による分類処理（分類アルゴリズム）を実行するものであり、マッチングモデル記憶手段６０とともに、マッチング用の識別器を構成する。この識別器への入力は、マッチング用特徴データ作成手段４２Ａにより作成したマッチング用特徴データであり、識別器からの出力は、対象案件と候補案件とからなるペア案件が選定される確度（つまり、対象案件に対して候補案件が選定される確度）を示すスコア（マッチングスコア）である。このスコアは、候補案件毎（対象案件と候補案件とからなるペア案件毎）に出力される。スコアは、例えば、尤度で出力する場合には、０～１の範囲の値で出力され、スコアが１に近い程、マッチング相手として相応しい候補案件であることを示している。

【0191】

ここで、「教師あり分類モデル」の「モデル」は、アルゴリズムおよびパラメータを含む概念であり、マッチングモデル記憶手段６０に記憶されたマッチングモデルの「モデル」は、学習で得られたパラメータ（学習結果データ）だけの概念である。

【0192】

また、「教師あり分類モデル」は、選定されるか否かの２クラス分類による機械学習を行うことができる手法であれば、いずれの機械学習手法でもよい。例えば、ＳＧＤ分類器（SGD Classifier：Stochastic Gradient Descent Classifier）、Ｋ近傍法分類器（K-Neighbors Classifier）、単純ベイズ分類器（Naive Bayes Classifier）、サポート・ベクター・マシン分類器（SVC：Support Vector Classifier）、ランダム・フォレスト分類器（Random Forest Classifier）、多層パーセプトロン分類器（MLP Classifier：Multi Layer Perceptron Classifier）、ニューラル・ネットワーク等を採用することができる。本実施形態では、ランダム・フォレスト分類器を採用している。

【0193】

なお、マッチングスコア算出手段４２Ｂとマッチングモデル記憶手段６０とにより構成される識別器は、同じ入力データ（マッチング用特徴データ）を、上記のような複数種類の分類器へ入力し、それぞれから出力されるスコアの平均値等を算出して統合スコアを出力する構成としてもよく、また、統合の際に重み付けをしてもよい（それぞれの分類器から出力されるスコアの加重平均値等を統合スコアとしてもよい）。

【0194】

また、マッチングスコア算出手段４２Ｂは、対象案件と各候補案件（対象案件以外の全ての案件）との間のスコア（マッチングスコア）を算出した後、算出したスコアの高い順で推薦案件を決定し、案件データ記憶手段５４から、決定した推薦案件の案件データを取得する。この際、スコアが予め定められた数の上位の案件を推薦案件として選択決定してもよく、スコアに対する閾値を設けて推薦案件を決定してもよい。

【0195】

（処理手段３０／類似案件検索手段４３の構成）
類似案件検索手段４３は、案件類似度算出手段４３Ａと、類似案件抽出手段４３Ｂとを含んで構成されている。

【0196】

案件類似度算出手段４３Ａは、案件データ記憶手段５４に記憶されている各案件の類似案件検索用の固有テキストデータ（本実施形態では、結合していない自己データおよびニーズデータ）を用いて、案件間の類似度を示す案件類似度（本実施形態体では、ＰＲスコアおよびニーズスコア）を算出し、算出した案件類似度を、案件識別情報（案件番号）のペアと関連付けて案件類似度記憶手段６８に記憶させる処理を実行するものである。より詳細な内容は、後述する。

【0197】

類似案件抽出手段４３Ｂは、入力受付手段４０により案件識別情報（案件番号）の入力を受け付けた場合に、案件類似度算出手段４３Ａにより算出されて案件類似度記憶手段６８に記憶されている案件類似度を用いて、入力された対象案件に対する類似案件を抽出する処理を実行するものである。より詳細な内容は、後述する。

【0198】

（処理手段３０／類似案件検索手段４３／案件類似度算出手段４３Ａの構成：図２、図１０）
案件類似度算出手段４３Ａは、図２に示すように、案件データ記憶手段５４に記憶されている固有テキストデータに含まれる全ての単語（単語１，単語２，単語３，単語４，単語５，…）に対応する単語ベクトルを分散表現モデル記憶手段５３から取得し、ある１つの案件に含まれる全ての単語の単語ベクトルの平均ベクトル（各単語ベクトルの対応する要素同士の平均値からなるベクトル）を算出し、これを当該案件の文章ベクトルとして案件識別情報（案件番号）と関連付けて文章ベクトル記憶手段６７に記憶させる処理を実行する。

【0199】

この際、当該案件の固有テキストデータの中に、同じ単語が複数回出現しても、それらは別の単語として捉え、同じ単語ベクトルを出現回数分だけ用意し、平均値を算出する。例えば、単語１と単語４とが同じ単語であっても、単語１の単語ベクトルと、単語４の単語ベクトルとをそれぞれ用意し、平均値を算出する。そして、この処理を、全ての案件について実行する。

【0200】

本実施形態では、類似案件検索用の固有テキストデータとして、非結合状態の自己データ、ニーズデータを使用するので、１つの案件につき、２つの文章ベクトルが作成され、文章ベクトル記憶手段６７に記憶されるが、結合テキストデータを使用して、１つの案件につき、１つの文章ベクトルを作成してもよい。また、図１０に示すように、自己データは、自己業種を含めずに自己ＰＲだけとしているが、自己業種を含めてもよい。ニーズデータは、ニーズ詳細だけとしているが、希望業種（相手企業の業種）を含めてもよい。

【0201】

また、案件類似度算出手段４３Ａは、図２および図１０に示すように、文章ベクトル記憶手段６７に記憶させた各案件の文章ベクトルを用いて、任意のペア案件Ｘ，Ｙ（任意の２つの案件番号Ｘ，Ｙの組合せ）の文章ベクトル間の類似度Ｓword2vec（本実施形態では、コサイン類似度）を算出する。任意のペア案件Ｘ，Ｙは、全ての案件（本実施形態のビジネスマッチングでは、登録企業数に相当し、例えば、ｎ＝約１０万社等）についての組合せ（ｎ個の中から２個を選ぶ組合せ）である。本実施形態では、１つの案件につき、自己データとニーズデータとについての２つの文章ベクトルが作成されているので、それぞれについて文章ベクトル間の類似度Ｓword2vecを算出する。なお、本実施形態では、分散表現としてｗｏｒｄ２ｖｅｃを採用しているため、添え字にその用語を用いているが、分散表現モデル学習手段３２の説明で既に詳述している通り、分散表現はｗｏｒｄ２ｖｅｃに限定されるものではない。

【0202】

さらに、案件類似度算出手段４３Ａは、図１０に示すように、単語重要度ベクトル記憶手段５７に記憶されている単語重要度ベクトル（ＴＦＩＤＦベクトル等）を用いて、任意のペア案件Ｘ，Ｙ（任意の２つの案件番号Ｘ，Ｙの組合せ）の単語重要度ベクトル間の類似度Ｓtf-idf（本実施形態では、コサイン類似度）を算出する。本実施形態では、単語重要度ベクトル記憶手段５７には、類似案件検索用の単語重要度ベクトルとして、自己データとニーズデータとにおける２つの単語重要度ベクトルが記憶されているので、それぞれについて単語重要度ベクトル間の類似度Ｓtf-idfを算出する。

【0203】

また、案件類似度算出手段４３Ａは、図１０に示すように、トピックモデル記憶手段５６に記憶されているトピック分布π（ｉ）（Ｋ次元の縦ベクトル、Ｋはトピック数、ｉは案件番号）を用いて、任意のペア案件Ｘ，Ｙ（任意の２つの案件番号Ｘ，Ｙの組合せ）のトピック分布ベクトル間の類似度Ｓtopic（本実施形態では、コサイン類似度）を算出する。本実施形態では、トピックモデル記憶手段５６には、類似案件検索用のトピック分布ベクトルとして、自己データとニーズデータとにおける２つのトピック分布ベクトルが記憶されているので、それぞれについてトピック分布ベクトル間の類似度Ｓtopicを算出する。この際、本実施形態では、ニーズデータにおけるトピック分布ベクトルについては、図１０に示すように、案件データ記憶手段５４に記憶されたニーズフラグの集合からなるニーズベクトルと結合し、トピック分布ベクトル間（ニーズベクトルとの結合ベクトル間）の類似度Ｓtopicを算出する。

【0204】

さらに、案件類似度算出手段４３Ａは、図１０に示すように、単語重要度ベクトル間の類似度Ｓtf-idf、文章ベクトル間の類似度Ｓword2vec、トピック分布ベクトル間の類似度Ｓtopic、およびこれらの重み係数であるＷtf-idf、Ｗword2vec、Ｗtopicを用いて、次の式（４）により、任意のペア案件Ｘ，Ｙ（任意の２つの案件番号Ｘ，Ｙの組合せ）の案件類似度を算出し、算出した案件類似度を、ペア案件Ｘ，Ｙの案件識別情報（案件番号Ｘ，Ｙ）と関連付けて案件類似度記憶手段６８に記憶させる処理を実行するものである。本実施形態では、案件類似度として、自己データを用いたＰＲスコアと、ニーズデータを用いたニーズスコアとを算出する。Ｗtf-idf、Ｗword2vec、Ｗtopicは、設定データとして設定データ記憶手段５１に記憶されているが、固定値としてもよい。

【0205】

案件類似度（ＰＲスコア、ニーズスコア）
＝Ｓtf-idf×Ｗtf-idf＋Ｓword2vec×Ｗword2vec＋Ｓtopic×Ｗtopic ・・（４）

【0206】

この案件類似度算出手段４３Ａによる処理は、事前処理（図１４参照）の段階で実行される。また、新規案件の登録時（図２３参照）に、新規案件登録手段４５からの指示を受けて、トピックモデル等の更新前における新規案件の即時反映処理として、新規案件と既存の全ての案件（新規案件以外の全ての案件）との間で実行される。さらに、トピックモデルの更新等の時期が到来した場合（図１６参照）にも実行されるが、上記の新規案件の即時反映処理で実行されている処理については、繰り返し実行する必要はない。

【0207】

（処理手段３０／類似案件検索手段４３／類似案件抽出手段４３Ｂの構成）
類似案件抽出手段４３Ｂは、運用時（ユーザによる検索中）において、入力受付手段４０により案件識別情報（案件番号）の入力を受け付けた場合に、案件類似度記憶手段６８から、入力を受け付けた案件番号と、その案件番号以外の全ての案件番号との組合せ（ペア案件の案件番号の組合せ）に関連付けられて記憶されている案件類似度を取得し、案件類似度が高い順で、対象案件（入力を受け付けた案件番号の案件）に対する類似案件を抽出し、案件データ記憶手段５４から、抽出した類似案件の案件データを取得する処理を実行する。この際、案件類似度が予め定められた数の上位の案件を類似案件として抽出してもよく、案件類似度に対する閾値を設けて類似案件を抽出してもよい。

【0208】

また、本実施形態では、案件類似度記憶手段６８には、案件類似度として、ＰＲスコアと、ニーズスコアとが記憶されているので、ＰＲスコアとニーズスコアとの平均値または加重平均値等を算出して統合スコアを求め、統合スコアにより類似案件の抽出を行ってもよく、ＰＲスコア、ニーズスコアのうちユーザ（サービス担当者またはマッチング依頼者）が選択したスコアにより類似案件の抽出を行ってもよい。なお、統合スコアは、単純平均、加重平均、調和平均、加重調和平均、相乗平均等の各種の方法で求めることができ、加重平均や加重調和平均とする場合の重みは、設定データとして設定データ記憶手段５１に記憶してもよく、固定値としてもよい。

【0209】

また、ＰＲスコア、ニーズスコアのうち、高い値のほうを選択し、または低い値のほうを選択し、選択したスコアの値に基づき、類似案件の抽出を行ってもよい。

【0210】

（処理手段３０／出力手段４４の構成）
出力手段４４は、入力受付手段４０によりキーワードの入力を受け付けた場合には、表示手段８０において、連想検索手段４１により決定した関連案件の案件データ、または、関連案件に加えて関連単語を、入力受付手段４０によるキーワードまたは案件識別情報（案件番号）の入力部１１０と同一の画面（図１２の画面２００参照）上に表示し、入力受付手段４０により案件識別情報（案件番号）の入力を受け付けた場合には、マッチング手段４２により算出したスコア（マッチングスコア）の高い候補案件の案件データを、推薦案件の案件データとして入力部１１０と同一の画面（図１３の画面３００参照）上に表示するとともに、類似案件検索手段４３により案件類似度（本実施形態では、ＰＲスコア、ニーズスコア）を用いて抽出した類似案件の案件データを、入力部１１０と同一の画面（図１３の画面３００参照）上に表示する処理を実行するものである。

【0211】

また、出力手段４４は、連想検索手段４１、マッチング手段４２、類似案件検索手段４３による処理結果を出力した画面（図１２の画面２００、図１３の画面３００参照）上に表示された関連案件、推薦案件、類似案件の中から、ユーザ（サービス担当者または新規案件の登録を行う顧客）が新規案件登録時の参考案件とするために選択した１つまたは複数の案件について、それらの案件識別情報（案件番号）のメモ入力（図示は省略）を受け付け、受け付けた参考案件の案件識別情報（案件番号）を登録時参考案件記憶手段６９に記憶させる構成とされている。

【0212】

（処理手段３０／新規案件登録手段４５の構成）
新規案件登録手段４５は、ユーザ（新規案件の登録を行う顧客、またはその入力を代行するサービス担当者）の操作による入力手段９０からの新規案件の案件データの登録のための入力を受け付け、この新規案件についての案件識別情報（案件番号）を自動付与し、受け付けた案件データを、付与した案件識別情報（案件番号）と関連付けて案件データ記憶手段５４に記憶させる処理を実行するものである。案件データの内容は、案件データ準備手段３３の説明で既に詳述している通りである。

【0213】

この際、新規案件登録手段４５は、登録時参考案件記憶手段６９に記憶されている参考案件の案件識別情報（案件番号）を取得し、取得した参考案件の案件識別情報を用いて、案件データ記憶手段５４から、参考案件の案件データを取得し、表示手段８０において新規案件登録画面（不図示）上に表示する。ユーザは、その表示を見ながら、新規案件（自己の案件）の案件データの登録のための入力作業を行う。また、登録時参考案件記憶手段６９に参考案件の案件識別情報（案件番号）が記憶されていなくても、ユーザが参考案件の案件番号を覚えているか、または紙にメモしている場合には、その案件番号を入力すれば、新規案件登録手段４５により受け付けられ、案件データ記憶手段５４から、参考案件の案件データが取得され、新規案件登録画面（不図示）上に表示される。

【0214】

また、新規案件登録手段４５は、新規案件の案件データが登録された後に、案件データ記憶手段５４に記憶された新規案件の案件データを用いて、新規案件の即時反映処理（図２３参照）を実行する。具体的には、固有テキストデータ準備手段３４に指示を出し、新規案件の固有テキストデータ（マッチング用および連想検索用の結合テキストデータ、および類似案件検索用の非結合の自己データ、ニーズデータ）を準備する処理（［α］～［δ］の処理、図５、図６、図１０参照）を実行し、処理後の固有テキストデータを、新規案件の案件識別情報（案件番号）と関連付けて案件データ記憶手段５４に記憶させる。

【0215】

さらに、新規案件登録手段４５は、単語重要度ベクトル算出手段３７に指示を出し、固有テキストデータ準備手段３４により作成されて案件データ記憶手段５４に記憶されている新規案件の固有テキストデータ（マッチング用および連想検索用の結合テキストデータ、および類似案件検索用の非結合の自己データ、ニーズデータ）についての各単語のＴＦＩＤＦ値またはその他の単語重要度指標値からなる単語重要度ベクトルを算出し、得られた単語重要度ベクトルを、新規案件の案件識別情報（案件番号）と関連付けて単語重要度ベクトル記憶手段５７に記憶させる。この際、単語重要度ベクトルをＴＦＩＤＦ値とする場合には、ＴＦ値は、新規案件の固有テキストデータだけで算出することができるが、ＩＤＦ値の算出には、全ての案件の固有テキストデータが必要となるので、厳密に言えば、新規案件以外の既存の案件のＴＦＩＤＦ値も、若干、値が変化することになる。しかし、既存の案件のＴＦＩＤＦ値は、変更せずにそのままとし、新規案件のＴＦＩＤＦ値だけを算出し、追加記憶してもよい。

【0216】

また、新規案件登録手段４５は、トピック値予測手段３６に指示を出し、新規案件の処理後の固有テキストデータ（マッチング用および連想検索用の結合テキストデータ、および類似案件検索用の非結合の自己データ、ニーズデータ）と、トピックモデル記憶手段５６に記憶されている各トピックにおける各単語の出現確率（Ｋ行ｐ列の行列β）（更新前のトピックモデルの行列β）とを用いて、新規案件の固有テキストデータにおける各トピックの出現確率を示すトピック値（Ｋ次元の縦ベクトルπ（ｉ）で表されるトピック分布）を予測し、予測した新規案件のπ（ｉ）を、更新前における仮の値としてトピックモデル記憶手段５６に記憶させる。

【0217】

さらに、新規案件登録手段４５は、案件類似度算出手段４３Ａに指示を出し、新規案件の文章ベクトルを作成し、文章ベクトル記憶手段６７に記憶させ、さらに、新規案件と既存の全ての案件との間の案件類似度（本実施形態では、ＰＲスコア、ニーズスコア）を算出し、算出した案件類似度を、新規案件と既存の各案件とからなる各ペア案件の案件識別情報（案件番号）と関連付けて案件類似度記憶手段６８に記憶させる。

【0218】

なお、新規案件登録手段４５は、案件データの修正も受け付ける。軽微な修正の場合は、案件識別情報（案件番号）を維持して内容の修正入力を受け付けるが、大幅な修正の場合は、新たな案件識別情報（案件番号）を付与し、新規案件と同様な取り扱いとする。

【0219】

＜記憶手段５０の構成＞

【0220】

設定データ記憶手段５１は、設定手段３１により入力を受け付けたシステム管理者またはユーザ（サービス担当者）による各種の設定データを記憶するものである。この設定データの詳細は、設定手段３１の説明で既に詳述している通りである。

【0221】

分散表現モデル学習用データ記憶手段５２は、分散表現モデル学習用のテキストデータを記憶するものである。この分散表現モデル学習用のテキストデータの詳細は、分散表現モデル学習手段３２の説明で既に詳述している通りである。

【0222】

分散表現モデル記憶手段５３は、図２に示すように、分散表現モデル学習手段３２による学習処理で得られた学習結果データとしての分散表現モデルを記憶するものである。この分散表現モデルは、本実施形態では、単語の分散表現としての高次元の単語ベクトルの集合である重み行列Ｗであり、ディメンジョンの異なる３種類のＷ１，Ｗ２，Ｗ３が用意されている。

【0223】

案件データ記憶手段５４は、各案件の案件データを、案件識別情報（案件番号）と関連付けて記憶するものである。この案件データの詳細は、案件データ準備手段３３の説明で既に詳述している通りである。

【0224】

不要語辞書記憶手段５５は、固有テキストデータ準備手段３４による［δ］の処理で用いる不要語（ノイズ単語）を記憶するものである。この不要語の詳細は、固有テキストデータ準備手段３４の説明で既に詳述している通りである。

【0225】

トピックモデル記憶手段５６は、トピック推定手段３５によるトピック推定処理で得られたトピックモデルとして、図１８、図１９に示すπ（ｉ）（案件番号ｉの各案件の固有テキストデータにおける各トピックの出現確率を示すトピック値からなる縦ベクトル）およびβ（各トピックにおける各単語の出現確率からなる行列）を記憶するものである。また、新規案件登録手段４５による新規案件の即時反映処理（図２３参照）が実行された場合には、トピック値予測手段３６による処理で得られた新規案件のπ（ｉ）を、更新前における仮の値として記憶する。

【0226】

単語重要度ベクトル記憶手段５７は、単語重要度ベクトル算出手段３７により算出した各案件の固有テキストデータについての各単語のＴＦＩＤＦ値またはその他の単語重要度指標値からなる単語重要度ベクトルを、案件識別情報（案件番号）と関連付けて記憶するものである。

【0227】

マッチング候補選定実績リスト記憶手段５８は、マッチング学習用データ準備手段３８による各マッチング用特徴データへの選定・非選定のタグ付け処理を行う際に使用するマッチング候補選定実績リストを記憶するものである。

【0228】

マッチング学習用データ記憶手段５９は、マッチング学習用データ準備手段３８により作成したマッチング学習用データ（マッチングモデルの学習用データであり、選定・非選定のラベル（タグ）を付されたマッチング用特徴データ）を、案件識別情報（案件番号）のペアと関連付けて記憶するものである。

【0229】

マッチングモデル記憶手段６０は、マッチングモデル学習手段３９による学習処理で得られたマッチングモデルを記憶するものである。マッチングスコア算出手段４２Ｂとともに、マッチング用の識別器を構成する。

【0230】

検索履歴記憶手段６１は、入力受付手段４０により受け付けたキーワードまたは案件識別情報（案件番号）のログ情報を記憶するものである。

【0231】

モデル別類似度記憶手段６２は、単語類似度算出手段４１Ａにより算出したモデル別類似度Ｓを記憶するものである。

【0232】

一般類似度記憶手段６３は、単語類似度算出手段４１Ａにより算出した一般類似度Ａを記憶するものである。

【0233】

固有類似度記憶手段６４は、単語類似度算出手段４１Ａにより算出した固有類似度Ｂを記憶するものである。

【0234】

最終類似度記憶手段６５は、単語類似度算出手段４１Ａにより算出した最終類似度ＦＳ
を記憶するものである。

【0235】

関連度記憶手段６６は、関連度算出手段４１Ｂにより算出した関連度ＣＳを、案件識別情報（案件番号）と関連付けて記憶するものである。

【0236】

文章ベクトル記憶手段６７は、案件類似度算出手段４３Ａにより求めた文章ベクトルを、案件識別情報（案件番号）と関連付けて記憶するものである。

【0237】

案件類似度記憶手段６８は、案件類似度算出手段４３Ａにより算出した案件類似度（ＰＲスコア、ニーズスコア）を、ペア案件の案件識別情報（案件番号）と関連付けて記憶するものである。

【0238】

登録時参考案件記憶手段６９は、出力手段４４により受け付けたユーザが選択した新規案件登録時の参考案件の案件識別情報（案件番号）を記憶するものである。

【0239】

＜検索の流れ：図１１、図１２、図１３＞

【0240】

図１１において、ユーザ（サービス担当者、または、新規登録を行う顧客、若しくはマッチング相手の紹介を依頼する既登録の顧客）は、画面１００の入力部１１０にキーワードまたは案件識別情報（案件番号）を入力する。この際、マッチング相手の紹介を依頼する顧客（既に自分の案件番号を有している顧客）またはそのサービス担当者であれば、入力部１１０に自分（または自分の顧客）の案件番号を入力することになるが、その場合は、画面３００が表示されるため、その詳細は、図１３を用いて後述する。ここでは、新規登録を行う顧客（未だ自分の案件番号を有していない顧客）またはそのサービス担当者が、自分（または自分の顧客）の情報を新規案件として登録するにあたり、自分と類似する内容（ここでは事業内容）の案件についての案件データが、どのような記述内容になっているのか、あるいは、自分と類似する内容の案件に対し、どのような記述内容の案件がマッチングで推薦されるのか等を確認するため、先ず、入力部１１０に、キーワード（自分の事業内容に関連する単語）を入力するものとする。

【0241】

入力部１１０にキーワード（Ｋ１、例えば「お酒」）が入力されると、これが入力受付手段４０により受け付けられ、図１１に示すように連想検索手段４１による処理が実行され、出力手段４４により、図１２に示す画面２００が表示される。

【0242】

図１２において、画面２００には、入力部１１０と、検索を実行するための「Search」ボタン１２０と、「検索履歴」表示部１３０とが設けられている。なお、入力部１１０には、直前に入力されたキーワード（Ｋ１）が表示されたままになっている。また、「検索履歴」表示部１３０にも、最初に入力されたキーワード（Ｋ１）が表示される。

【0243】

また、図１２の画面２００には、「類似キーワード」表示部２１０が設けられ、この表示部２１０には、各単語（入力されたキーワード、およびそのキーワードに関連する複数の関連単語）の表示部２１１が設けられ、これらの表示部２１１をクリックやタップ等の操作により選択すると、選択された単語（入力されたキーワード、または関連単語）が、入力部１１０に自動入力されるようになっている。また、各表示部２１１を選択操作せずに、打鍵入力によりキーワードまたは関連単語、またはその他の単語を入力部１１０に入力することもできる。なお、再度、同じキーワードを入力・選択入力すると、同じ処理結果が表示されることになる。

【0244】

さらに、図１２の画面２００には、「キーワード検索リスト」表示部２２０が設けられ、この表示部２２０には、各関連案件についての関連度ＣＳの表示部２２１と、用語（当該関連案件の固有テキストデータに含まれる関連単語）の表示部と、当該関連案件（関連企業）の案件番号（案件識別情報）の表示部２２２と、ニーズフラグの「売り／買い」の選択情報、自社業種、取扱商品、地域名称、希望地域詳細、希望業種詳細、自己ＰＲのテキストデータ、ニーズ詳細のテキストデータの各表示部とが設けられている。関連度ＣＳの算出、関連案件の決定の処理、関連案件の案件番号を用いて案件データ記憶手段５４から関連案件の案件データを取得する処理は、連想検索手段４１により実行され、連想検索手段４１から受け取った情報を表示手段８０の画面上に表示する処理は、出力手段４４により実行される。

【0245】

関連案件の案件番号の表示部２２２をクリックやタップ等の操作により選択すると、選択された関連案件の案件番号が、入力部１１０に自動入力されるようになっている。また、各表示部２２２を選択操作せずに、打鍵入力により関連案件の案件番号、またはその他の案件番号を入力部１１０に入力することもできる。

【0246】

そして、図１２の画面２００の入力部１１０に、関連単語の表示部２１１の選択操作により関連単語が新たなキーワードとして入力されるか、または、打鍵により別のキーワード（Ｋ２，Ｋ３，…）が入力されると、図１１中の点線で示すように、再び、連想検索手段４１による処理が実行され、出力手段４４により、図１２に示す画面２００が表示される。一方、画面２００の入力部１１０に、関連案件の案件番号の表示部２２２の選択操作により関連案件の案件番号（Ｍ１、例えば「５６７８」）が入力されるか、または、打鍵により案件番号（Ｍ１）が入力されると、図１１中の実線で示すように、マッチング手段４２および類似案件検索処理４３による各処理が実行され、出力手段４４により、図１３に示す画面３００が表示される。なお、図１１中の点線の矢印は、キーワード（単語）の流れを示し、実線の矢印は、案件番号の流れを示している。

【0247】

図１３において、画面３００には、入力部１１０と、「Search」ボタン１２０と、「検索履歴」表示部１３０とが設けられている。なお、入力部１１０には、直前に入力された案件番号（Ｍ１、例えば「５６７８」）が表示されたままになっている。また、「検索履歴」表示部１３０にも、案件番号（Ｍ１）が最後に入力された情報として表示される。

【0248】

また、図１３の画面３００には、入力部１１０に入力された案件番号（Ｍ１）の案件を表示する「対象案件」表示部３１０と、対象案件の情報を表示するか否かの選択部３１１とが設けられている。「対象案件」表示部３１０には、対象案件の案件番号（案件識別情報）の表示部３１２と、ニーズフラグの「売り／買い」の選択情報、自社業種、取扱商品、地域名称、希望地域詳細、希望業種詳細、自己ＰＲのテキストデータ、ニーズ詳細のテキストデータの各表示部とが設けられている。

【0249】

さらに、図１３の画面３００には、「推薦案件リスト」表示部３２０と、マッチング処理による推薦案件の情報を表示するか否かの選択部３２１とが設けられている。「推薦案件リスト」表示部３２０には、推薦案件の案件番号（案件識別情報）の表示部３２２と、ニーズフラグの「売り／買い」の選択情報、自社業種、取扱商品、地域名称、希望地域詳細、希望業種詳細、自己ＰＲのテキストデータ、ニーズ詳細のテキストデータ、スコア（マッチングスコア）の各表示部とが設けられている。マッチングスコアの算出、推薦案件の決定の処理、推薦案件の案件番号を用いて案件データ記憶手段５４から推薦案件の案件データを取得する処理は、マッチング手段４２により実行され、マッチング手段４２から受け取った情報を表示手段８０の画面上に表示する処理は、出力手段４４により実行される。

【0250】

推薦案件の案件番号の表示部３２２をクリックやタップ等の操作により選択すると、選択された推薦案件の案件番号が、入力部１１０に自動入力されるようになっている。また、各表示部３２２を選択操作せずに、打鍵入力により推薦案件の案件番号、またはその他の案件番号を入力部１１０に入力することもできる。

【0251】

また、図１３の画面３００には、「類似案件一覧」表示部３３０と、類似案件の情報を表示するか否かの選択部３３１とが設けられている。「類似案件一覧」表示部３３０には、類似案件の案件番号（案件識別情報）の表示部３３２と、ニーズフラグの「売り／買い」の選択情報、自社業種、取扱商品、地域名称、希望地域詳細、希望業種詳細、自己ＰＲのテキストデータ、ニーズ詳細のテキストデータ、案件類似度（ＰＲスコア、ニーズスコア）の各表示部とが設けられている。案件類似度の算出、類似案件の抽出の処理、類似案件の案件番号を用いて案件データ記憶手段５４から類似案件の案件データを取得する処理は、類似案件検索処理４３により実行され、類似案件検索処理４３から受け取った情報を表示手段８０の画面上に表示する処理は、出力手段４４により実行される。

【0252】

類似案件の案件番号の表示部３３２をクリックやタップ等の操作により選択すると、選択された類似案件の案件番号が、入力部１１０に自動入力されるようになっている。また、各表示部３３２を選択操作せずに、打鍵入力により類似案件の案件番号、またはその他の案件番号を入力部１１０に入力することもできる。

【0253】

そして、図１３の画面３００の入力部１１０に、推薦案件の案件番号の表示部３２２の選択操作により推薦案件の案件番号が入力されるか、類似案件の案件番号の表示部３３２の選択操作により類似案件の案件番号が入力されるか、または、打鍵により別の案件番号（Ｍ２，Ｍ３，…）が入力されると、図１１中の実線で示すように、再び、マッチング手段４２および類似案件検索処理４３による各処理が実行され、出力手段４４により、図１３に示す画面３００が表示される。一方、図１３の画面３００の入力部１１０に、キーワードが入力されると、図１１中の点線で示すように、連想検索手段４１による処理が実行され、出力手段４４により、図１２に示す画面２００が表示される。

【0254】

新規登録を行う顧客（未だ自分の案件番号を有していない顧客）またはそのサービス担当者は、以上のような検索を繰り返しながら、図１２の画面２００、図１３の画面３００を参照し、適宜、新規案件（自分の案件）の登録時の参考案件を選んでメモ入力することにより、登録時参考案件記憶手段６９に記憶させておくか、または、参考案件の案件番号を覚えるか、若しくは紙にメモしておく。そして、新規案件登録手段４５により画面表示された参考案件の案件データを見ながら、新規案件（自分の案件）の案件データの登録のための入力を行うと、新規案件登録手段４５により、その新規案件に案件番号が自動付与され、登録処理が実行される。

【0255】

続いて、新規案件の登録を行った後に、新規登録を行った顧客またはそのサービス担当者は、図１１に示すように、付与された新規案件の案件番号（Ｍnew）を入力部１１０（画面１００，２００，３００のいずれの状態の入力部１１０でもよい。）に入力し、検索を繰り返すことにより、新規案件（自分の案件）に対する推薦案件、新規案件の類似案件に対する推薦案件、新規案件に対する推薦案件の類似案件等の案件データを画面表示させる。

【0256】

＜マッチングシステム１０による処理の全体的な流れ：図１４、図１５＞

【0257】

図１４において、先ず、システム管理者は、作成済の多数の既存の案件データを準備し、案件識別情報（案件番号）と関連付けて案件データ記憶手段５４に記憶させる（ステップＳ１）。運用中の既存のシステムからのデータ移行でもよい。この処理は、案件データ準備手段３３により実行される。

【0258】

次に、連想検索用の事前処理（詳細は、図１７参照）を実行する（ステップＳ２）。続いて、マッチング用の事前処理（トピックモデル、マッチングモデルの初期モデルの構築等、図１８参照）を実行する（ステップＳ３）。さらに、類似案件（類似企業）検索用の事前処理（詳細は、図１９参照）を実行する（ステップＳ４）。これらのステップＳ２～Ｓ４の事前処理は、いずれも検索中（運用時）のリアルタイム処理でも実行することができるが、反応速度が遅くなる。

【0259】

図１５において、事前処理（ステップＳ１～Ｓ４）の完了後に、運用段階に入ると、ユーザによる検索処理が行われる。検索処理では、先ず、入力受付手段４０により、画面１００の入力部１１０（図１１参照）で、ユーザによるキーワードまたは案件番号（案件識別情報）の入力を受け付ける（ステップＳ５）。なお、２回目以降は（後述するステップＳ１１からの戻りでは）、画面２００，３００の入力部１１０で入力（選択入力を含む）を受け付ける。

【0260】

次に、入力受付手段４０により、入力部１１０で入力を受け付けた情報がキーワードか否かを判断し（ステップＳ６）、キーワードである場合には、連想検索手段４１による連想検索処理（詳細は、図２０参照）を実行し（ステップＳ７）、キーワードでない場合（すなわち、案件番号である場合）には、マッチング手段４２によるマッチング処理（詳細は、図２１参照）を実行するとともに（ステップＳ８）、類似案件検索手段４３による類似案件（類似企業）検索処理（詳細は、図２２参照）を実行する（ステップＳ９）。

【0261】

続いて、出力手段４４により、連想検索処理の結果（図１２参照）を画面表示するか、または、マッチング処理および類似案件（類似企業）検索処理の各結果（図１３参照）を画面表示する（ステップＳ１０）。そして、検索を続行する場合には（ステップＳ１１）、前述したステップＳ５の処理に戻り、ユーザによるキーワードまたは案件番号（案件識別情報）の入力（選択入力を含む）を受け付ける。一方、検索を続行しない場合には、そのまま検索処理を終了するか、または、新規案件登録時の参考案件の案件番号のメモ入力がある場合には、出力手段４４により、そのメモ入力を受け付けて検索処理を終了する。

【0262】

それから、ユーザ（新規に案件データの登録を行う企業、またはそのサービス担当者）が、画面表示された参考案件の案件データの内容を見ながら、自分の案件データを登録するための新規案件登録処理（新規案件の登録の受付、新規案件への案件番号の付与、即時反映処理、図２３参照）を実行する（ステップＳ１２）。この処理は、新規案件登録手段４５により実行される。そして、新規案件の登録を終えたユーザは、新規の案件データを含めたトピックモデルの更新等の時期の到来前に、新規案件の即時反映処理が行われている状態で、付与された新規案件の案件番号を用いた検索を行う場合は、前述したステップＳ５の処理に戻り、入力部１１０に、新規案件の案件番号を入力し、検索を繰り返す。その後、新規の案件データを含めたトピックモデルの更新等の時期が到来した場合には、次の図１６の更新処理（ステップＳ１３～Ｓ１５）へ進む。

【0263】

図１６に示すように、トピックモデルの更新等の時期は、（１）新規の案件データの登録数が、所定の数に達したとき、（２）新規の案件データの登録が行われる都度、（３）毎日（毎晩）、毎週、毎月等の一定周期、但し、直近の期間中に新規の案件データの登録があることが前提、（４）システム管理者が適当と判断した任意の時期のいずれでもよい。なお、（２）の場合には、新規の案件データの登録後、すぐに更新処理を実行するときは、新規案件登録手段４５による新規案件の即時反映処理（図２３参照）を行う必要はないが、新規の案件データの登録後、すぐに更新処理を実行するのではなく、例えばその日の夜間バッチ等で更新処理を実行するときは、登録処理と更新処理とにタイムラグがあるので、新規案件登録手段４５による新規案件の即時反映処理を行う。

【0264】

図１６において、更新時期が到来した場合は、先ず、連想検索用の更新処理を実行する（ステップＳ１３）。この処理は、ステップＳ２の連想検索用の事前処理（詳細は、図１７参照）と同様である。但し、分散表現モデルの更新は、頻繁に行う必要はないので、省略してもよい。

【0265】

次に、マッチング用の更新処理を実行する（ステップＳ１４）。この処理は、ステップＳ３のマッチング用の事前処理（詳細は、図１８参照）と同様である。この際、トピックモデルの更新は行うが、マッチングモデルの更新は省略してもよい。従って、トピックモデルの更新と、マッチングモデルの更新とは、同じ頻度で行う必要はなく、同時期に行う必要もない。

【0266】

続いて、類似案件（類似企業）検索用の更新処理を実行する（ステップＳ１５）。この処理は、ステップＳ４の類似案件（類似企業）検索用の事前処理（詳細は、図１９参照）と同様である。この際、新規案件の登録時に即時反映されている処理は省略してもよい。

【0267】

＜ステップＳ２の連想検索用の事前処理の流れ：図１７＞

【0268】

図１７において、先ず、システム管理者が、入力手段９０を操作し、連想検索用の設定データ（Ｎ３＝例えば１００、Ｎ６＝例えば１０、関連案件の表示数等）を入力すると、設定手段３１により、この設定データが受け付けられ、設定データ記憶手段５１に保存される（ステップＳ２０１）。また、マッチング用の設定データ（推薦案件の表示数等）、類似案件検索用の設定データ（Ｗtf-idf、Ｗword2vec、Ｗtopic、類似案件の表示数等）の入力の受付、保存も、設定手段３１により、ここで行ってよい。

【0269】

次に、システム管理者は、入力手段９０を操作し、事前に取得・収集しておいた分散表現モデル学習用のテキストデータを、分散表現モデル学習用データ記憶手段５２に保存する（ステップＳ２０２）。この処理は、設定手段３１により行う。

【0270】

続いて、分散表現モデル学習手段３２により、分散表現モデル学習用データ記憶手段５２に記憶されている分散表現モデル学習用のテキストデータを用いて、分散表現モデルの学習処理を実行し、得られた学習結果データ（単語ベクトルで構成された重み行列Ｗ）を、分散表現モデル記憶手段５３に保存する（ステップＳ２０２）。なお、公開・提供された学習結果データ（重み行列Ｗ）を取得し、分散表現モデル記憶手段５３に保存してもよい。

【0271】

また、本実施形態では、連想検索用、類似案件検索用の分散表現モデルは共用とするが、共用としない場合でも、このステップＳ２０２の処理で、双方の分散表現モデルを用意してよい。

【0272】

＜ステップＳ３のマッチング用の事前処理の流れ：図１８＞

【0273】

図１８において、固有テキストデータ準備手段３４により、案件データ記憶手段５４から、全ての案件（ここでは企業）について、自己データ（自己業種、自社ＰＲ）、ニーズデータ（希望業種、ニーズ詳細）を取得し、マッチング用および連想検索用（共用）の固有テキストデータ（本実施形態では、結合テキストデータとする。）を作成する（ステップＳ３０１）。なお、モデルの更新処理の場合（図１６のステップＳ１４）は、新規案件について固有テキストデータを追加作成すればよい。

【0274】

続いて、固有テキストデータ準備手段３４により、上記のステップＳ３０１の処理で作成した全ての固有テキストデータ（ここでは、結合テキストデータ）について、不要な記号やタグ等の除去、形態素解析で単語に分解、名詞のみ抽出、不要な単語の除去の各処理を実行し、処理後の固有テキストデータを、案件識別情報（案件番号）と関連付けて案件データ記憶手段５４に記憶させる（ステップＳ３０２）。これらの処理の内容は、固有テキストデータ準備手段３４の説明で既に詳述しているので、ここでは詳しい説明を省略する。なお、モデルの更新処理の場合（図１６のステップＳ１４）は、新規案件の固有テキストデータについてだけ、これらの処理を実行すればよい。

【0275】

次に、トピック推定手段３５により、案件データ記憶手段５４に記憶されているマッチング用の処理後の固有テキストデータ（ｉ＝１～ｎ）の全てを用いて、ソフトクラスタリングまたはニューラル言語モデル（ここでは、ＬＤＡ）によるトピック推定処理を実行し、各案件（各企業）の固有テキストデータ（ｉ＝１～ｎ）における各トピック（トピック番号＝１～Ｋ）の出現確率を示すトピック値π（ｉ）、および各トピックにおける各単語の出現確率βを求め、求めたマッチング用のπ（ｉ）およびβを、トピックモデル記憶手段５６に保存する（ステップＳ３０３）。このトピック推定処理の内容は、トピック推定手段３５の説明で既に詳述しているので、ここでは詳しい説明を省略する。なお、モデルの更新処理の場合（図１６のステップＳ１４）には、文書数に相当する案件数（企業数）ｎが、追加登録された新規案件の数だけ増えた状態で、トピック推定処理が実行される。

【0276】

その後、単語重要度ベクトル算出手段３７により、案件データ記憶手段５４に記憶されているマッチング用の処理後の固有テキストデータ（ここでは、結合テキストデータ）（ｉ＝１～ｎ）の全てを用いて、単語重要度ベクトル（ここでは、ＴＦＩＤＦベクトル）を算出し、算出したマッチング用の単語重要度ベクトルを、案件識別情報（案件番号）と関連付けて単語重要度ベクトル記憶手段５７に保存する（ステップＳ３０４）。この処理の内容は、単語重要度ベクトル算出手段３７の説明で既に詳述しているので、ここでは詳しい説明を省略する。なお、モデルの更新処理の場合（図１６のステップＳ１４）は、ＴＤ値は、新規案件の固有テキストデータだけで算出できるが、ＩＤＦ値の算出には、全ての案件の固有テキストデータが必要となるので、新規案件を含めた全ての案件について、単語重要度ベクトルを算出する。

【0277】

続いて、マッチング学習用データ準備手段３８により、マッチング候補選定実績リスト記憶手段５８に記憶されているマッチング候補選定実績リストに存在するペアを正例（正解データ）とし、マッチング候補選定実績リストに存在するペア以外のペアを負例（不正解データ）とし、マッチング学習用データとしてのマッチング用特徴データ（図９参照）を作成するための多数のペアを用意する（ステップＳ３０５）。この処理の内容は、マッチング学習用データ準備手段３８の説明で既に詳述しているので、ここでは詳しい説明を省略する。なお、モデルの更新処理の場合（図１６のステップＳ１４）は、トピック推定処理を実行してトピックモデルの更新を行っていても、必ずしもマッチングモデルの更新を行う必要はないので、この処理を省略してもよい。トピックモデルを更新すると各案件のトピック分布が若干変化するので、厳密に言えば、マッチング用特徴データも変化することになるが、選定実績があまり増えていない状況では、マッチングモデルへの影響が小さいからである。

【0278】

それから、マッチング学習用データ準備手段３８により、上記のステップＳ３０５の処理でマッチング学習用データを作成するために用意した全てのペア案件について、トピックモデル記憶手段５６から、各トピック値π（ｉ）を取得し、案件データ記憶手段５４から、ニーズフラグ、年商を取得し、合成変数（各トピック値の積、差の絶対値、ニーズフラグの論理和、年商の比の値等）を算出する（ステップＳ３０６）。さらに、マッチング学習用データ準備手段３８により、マッチング学習用データを作成するために用意した全てのペア案件について、単語重要度ベクトル記憶手段５７に記憶されているマッチング用の単語重要度ベクトル（ここでは、ＴＦＩＤＦベクトル）の内積を算出した後、マッチング学習用データとしてのマッチング用特徴データ（図９参照）を作成し、ペア案件の案件識別情報（案件番号）と関連付けてマッチング学習用データ記憶手段５９に保存する（ステップＳ３０７）。これらの処理の内容は、マッチング学習用データ準備手段３８の説明で既に詳述しているので、ここでは詳しい説明を省略する。なお、モデルの更新処理の場合（図１６のステップＳ１４）は、上記のステップＳ３０５と同様に、マッチングモデルの更新処理を省略してもよい。

【0279】

続いて、マッチングモデル学習手段３８により、マッチング学習用データ記憶手段５９に記憶されているマッチング学習用データを用いて、教師あり分類モデル（例えば、ランダムフォレスト）により、選定・非選定の２クラス分類のマッチングモデル（パラメータ）を求め、求めたマッチングモデルをマッチングモデル記憶手段６０に記憶させる（ステップＳ３０８）。この処理の内容は、マッチングモデル学習手段３８の説明で既に詳述しているので、ここでは詳しい説明を省略する。なお、モデルの更新処理の場合（図１６のステップＳ１４）は、上記のステップＳ３０５～Ｓ３０７と同様に、マッチングモデルの更新処理を省略してもよい。

【0280】

＜ステップＳ４の類似案件（類似企業）検索用の事前処理の流れ：図１９＞

【0281】

図１９において、固有テキストデータ準備手段３４により、案件データ記憶手段５４から、全ての案件（ここでは企業）について、自己データ（自己業種、自社ＰＲ）、ニーズデータ（希望業種、ニーズ詳細）を取得し、類似案件検索用の２種類の固有テキストデータ（本実施形態では、自己データとニーズデータとの結合は行わない。）を用意する（ステップＳ４０１）。この際、自己データとして、自己業種を含めずに自社ＰＲだけを用い、また、ニーズデータとして、希望業種を含めずにニーズ詳細だけを用いてもよく、本実施形態では、そのようにする（図１０参照）。なお、モデルの更新処理の場合（図１６のステップＳ１５）は、新規案件について固有テキストデータを追加作成すればよい。

【0282】

続いて、固有テキストデータ準備手段３４により、上記のステップＳ４０１の処理で用意した全ての類似案件検索用の２種類の固有テキストデータ（非結合の自己データ、ニーズデータ）について、不要な記号やタグ等の除去、形態素解析で単語に分解、名詞のみ抽出、不要な単語の除去の各処理を実行し、処理後の固有テキストデータを、案件識別情報（案件番号）と関連付けて案件データ記憶手段５４に記憶させる（ステップＳ４０２）。これらの処理の内容は、固有テキストデータ準備手段３４の説明で既に詳述しているので、ここでは詳しい説明を省略する。なお、モデルの更新処理の場合（図１６のステップＳ１５）は、新規案件の固有テキストデータについてだけ、これらの処理を実行すればよい。

【0283】

次に、トピック推定手段３５により、案件データ記憶手段５４に記憶されている類似案件検索用の２種類の処理後の固有テキストデータ（ｉ＝１～ｎ）の全てを用いて、２種類のそれぞれについて別々に、ソフトクラスタリングまたはニューラル言語モデル（ここでは、ＬＤＡ）によるトピック推定処理を実行し、各案件（各企業）の類似案件検索用の固有テキストデータ（ｉ＝１～ｎ）における各トピック（トピック番号＝１～Ｋ）の出現確率を示すトピック値π（ｉ）、および各トピックにおける各単語の出現確率βを求め、求めた類似案件検索用の２種類のそれぞれのπ（ｉ）およびβ（つまり、自己データについてのπ（ｉ）およびβ、ニーズデータについてのπ（ｉ）およびβ）を、トピックモデル記憶手段５６に保存する（ステップＳ４０３）。このトピック推定処理の内容は、トピック推定手段３５の説明で既に詳述しているので、ここでは詳しい説明を省略する。なお、モデルの更新処理の場合（図１６のステップＳ１５）には、文書数に相当する案件数（企業数）ｎが、追加登録された新規案件の数だけ増えた状態で、トピック推定処理が実行される。

【0284】

その後、単語重要度ベクトル算出手段３７により、案件データ記憶手段５４に記憶されている類似案件検索用の２種類の処理後の固有テキストデータ（ここでは、非結合の自己データ、ニーズデータ）（ｉ＝１～ｎ）の全てを用いて、単語重要度ベクトル（ここでは、ＴＦＩＤＦベクトル）を算出し、算出した類似案件検索用の２種類の単語重要度ベクトル（つまり、自己データ、ニーズデータのそれぞれについての単語重要度ベクトル）を、案件識別情報（案件番号）と関連付けて単語重要度ベクトル記憶手段５７に保存する（ステップＳ４０４）。この処理の内容は、単語重要度ベクトル算出手段３７の説明で既に詳述しているので、ここでは詳しい説明を省略する。なお、モデルの更新処理の場合（図１６のステップＳ１５）は、ＴＤ値は、新規案件の固有テキストデータだけで算出できるが、ＩＤＦ値の算出には、全ての案件の固有テキストデータが必要となるので、新規案件を含めた全ての案件について、２種類の単語重要度ベクトルを算出する。

【0285】

続いて、案件類似度算出手段４３Ａにより、類似案件検索用の２種類の処理後の固有テキストデータ（ｉ＝１～ｎ）の全てを用いて、固有テキストデータ毎（自己データ毎、ニーズデータ毎）に、図２に示すように、各固有テキストデータを構成する全ての単語の分散表現（ここでは、word2vecによる単語ベクトルとする）の平均値を算出し、これらを各案件の固有テキストデータの文章ベクトルとして案件識別情報（案件番号）と関連付けて文章ベクトル記憶手段６７に記憶させる（ステップＳ４０５）。この際、各案件（各企業）について、自己データの分散表現の平均値（文章ベクトル）と、ニーズデータの分散表現の平均値（文章ベクトル）とを、別々に算出する。この処理の内容は、案件類似度算出手段４３Ａの説明で既に詳述しているので、ここでは詳しい説明を省略する。

【0286】

それから、案件類似度算出手段４３Ａにより、全ての案件（企業）の総当たりの各ペアについて、単語重要度ベクトル記憶手段５７に記憶されている単語重要度ベクトル同士の類似度Ｓtf-idf、文章ベクトル記憶手段６７に記憶されている文章ベクトル同士の類似度Ｓword2vec、トピックモデル記憶手段５６に記憶されているトピック分布（トピック値）ベクトル同士の類似度Ｓtopicを算出し、これらの各類似度を重み係数（Ｗtf-idf、Ｗword2vec、Ｗtopic）を用いて統合することにより、案件（企業）間の類似度を示す案件類似度を算出し、算出した案件類似度を、ペア案件の案件識別情報（案件番号）と関連付けて案件類似度記憶手段６８に記憶させる（ステップＳ４０６）。この際、案件類似度として、各ペア案件について、自己データについての類似度を示すＰＲスコアと、ニーズデータについての類似度を示すニーズスコアとを、別々に算出する。この処理の内容は、案件類似度算出手段４３Ａの説明で既に詳述しているので、ここでは詳しい説明を省略する。

【0287】

＜ステップＳ７の連想検索処理の流れ：図２０＞

【0288】

図２０において、先ず、単語類似度算出手段４１Ａにより、分散表現モデル記憶手段５３に記憶されている各分散表現モデル（本実施形態では、ディメンジョンの異なる３種類の単語ベクトルの集合）について、入力・選択入力されたキーワードと他の単語との間のコサイン類似度等のモデル別類似度Ｓを算出し、各分散表現モデルについて、モデル別類似度Ｓが上位Ｎ３以内（例えば１００位以内）の単語を選択してモデル別類似単語とし、各モデル別類似単語のモデル別類似度Ｓをモデル別類似度記憶手段６２に記憶させる（ステップＳ７０１）。この処理の内容は、単語類似度算出手段４１Ａの説明で既に詳述しているので、ここでは詳しい説明を省略する。なお、モデル別類似単語は、各分散表現モデルでずれている。

【0289】

次に、単語類似度算出手段４１Ａにより、少なくとも１つの分散表現モデルで選択された単語（Ｎ４個）の全てについて、対応する単語が選択されていない分散表現モデルの当該単語のモデル別類似度Ｓをゼロとみなすとともに（図２参照）、全ての分散表現モデル（ここでは、３タイプの分散表現モデル）のモデル別類似度Ｓの調和平均または加重調和平均等を求めることにより、複数種類の分散表現モデルをアンサンブルした一般類似度Ａを算出し、算出した一般類似度Ａがゼロにならなかった単語を一般類似単語（Ｎ５個）として決定し、各一般類似単語の一般類似度Ａを一般類似度記憶手段６３に記憶させる（ステップＳ７０２）。この処理の内容は、単語類似度算出手段４１Ａの説明で既に詳述しているので、ここでは詳しい説明を省略する。

【0290】

続いて、単語類似度算出手段４１Ａにより、各一般類似単語（Ｎ５個）および入力・選択入力されたキーワードについて、全ての連想検索用の固有テキストデータ（本実施形態では、自己データとニーズデータとの結合テキストデータとする）との照合を行うことにより、それらの単語の少なくとも１つを含む固有テキストデータに関連付けられた案件（ここでは企業）の案件番号を抽出する（ステップＳ７０３）。さらに、単語類似度算出手段４１Ａにより、各一般類似単語（Ｎ５個）および入力・選択入力されたキーワードとの照合で抽出した各案件の固有テキストデータを用いて、入力・選択入力されたキーワードと、各一般類似単語（Ｎ５個）との間の固有類似度Ｂを算出し、算出した固有類似度Ｂを固有類似度記憶手段６４に記憶させる（ステップＳ７０４）。これらの処理の内容は、単語類似度算出手段４１Ａの説明で既に詳述しているので、ここでは詳しい説明を省略する。

【0291】

それから、単語類似度算出手段４１Ａにより、各一般類似単語（Ｎ５個）について、一般類似度Ａと固有類似度Ｂとの調和平均または加重調和平均等により最終類似度ＦＳを算出し、最終類似度ＦＳが上位Ｎ６以内（例えば１０位以内）の単語を、関連単語として決定し、各関連単語の最終類似度ＦＳを最終類似度記憶手段６５に記憶させる（ステップＳ７０５）。この処理の内容は、単語類似度算出手段４１Ａの説明で既に詳述しているので、ここでは詳しい説明を省略する。

【0292】

その後、関連度算出手段４１Ｂにより、各関連単語（Ｎ６＝１０個）および入力・選択入力されたキーワードについて、それぞれの単語が連想検索用の各固有テキストデータ（本実施形態では、結合テキストデータ）に出現する単語別出現回数Ｃ（ｉ）（ｉ＝０，１，２，…，Ｎ６）を求め、これに最終類似度ＦＳ（ｉ）を乗じ、各単語についてそれらの値を合計して関連度ＣＳを算出し、関連度ＣＳの高い順で関連案件を決定し、各関連案件の関連度ＣＳを関連度記憶手段６６に記憶させるとともに、関連案件の案件番号を用いて、案件データ記憶手段５４から関連案件の案件データを取得する（ステップＳ７０６）。この処理の内容は、関連度算出手段４１Ｂの説明で既に詳述しているので、ここでは詳しい説明を省略する。

【0293】

＜ステップＳ８のマッチング処理の流れ：図２１＞

【0294】

図２１において、先ず、マッチング用特徴データ作成手段４２Ａにより、入力部１１０（図１１～図１３参照）に入力・選択入力された対象案件（企業）と、推薦の候補となる他の全ての案件（企業）との各ペアについて、トピックモデル記憶手段５６から、各トピック値π（ｉ）を取得し、案件データ記憶手段５４から、ニーズフラグ、年商を取得し、合成変数（各トピック値の積、差の絶対値、ニーズフラグの論理和、年商の比の値等）を算出する（ステップＳ８０１）。さらに、マッチング用特徴データ作成手段４２Ａにより、入力部１１０に入力・選択入力された対象案件（企業）と、推薦の候補となる他の全ての案件（企業）との各ペアについて、単語重要度ベクトル記憶手段５７に記憶されている単語重要度ベクトル（ここでは、ＴＦＩＤＦベクトル）の内積を算出した後（ステップＳ８０２）、マッチング用特徴データ（図８参照）を作成する（ステップＳ８０３）。これらの処理の内容は、マッチング用特徴データ作成手段４２Ａの説明で既に詳述しているので、ここでは詳しい説明を省略する。

【0295】

次に、上記のステップＳ８０３の処理で作成したマッチング用特徴データを、教師あり分類モデル（例えば、ランダムフォレスト）によるマッチング用の識別器（マッチングスコア算出手段４２Ｂおよびマッチングモデル記憶手段５０により構成される識別器）に入力し、入力部１１０に入力・選択入力された対象案件（企業）に対して各候補案件（候補企業）が選定される確率を示すスコア（マッチングスコア）を出力し、得られたスコアの高い順で推薦案件（推薦企業）を決定し、決定した推薦案件の案件番号を用いて、案件データ記憶手段５４から推薦案件の案件データを取得する（ステップＳ８０４）。

【0296】

＜ステップＳ９の類似案件（類似企業）検索処理の流れ：図２２＞

【0297】

図２２において、類似案件抽出手段４３Ｂにより、案件類似度記憶手段６８から、入力部１１０（図１１～図１３参照）で入力・選択入力された案件番号の対象案件（企業）と、他の全ての案件（企業）との間の案件類似度（本実施形態では、ＰＲスコアおよびニーズスコア）を取得する（ステップＳ９０１）。

【0298】

続いて、類似案件抽出手段４３Ｂにより、案件類似度の高い順で類似案件を抽出し、抽出した類似案件の案件番号を用いて、案件データ記憶手段５４から、類似案件の案件データを取得する（ステップＳ９０２）。

【0299】

＜ステップＳ１２の新規案件登録処理の流れ：図２３＞

【0300】

図２３において、新規案件登録手段４５により、ユーザによる新規案件の案件データの登録のための入力を受け付け（ステップＳ１２０１）、新規案件に対して案件識別情報（案件番号）を自動付与し、受け付けた新規案件の案件データを、付与した新規案件の案件番号と関連付けて案件データ記憶手段５４に保存する（ステップＳ１２０２）。この際、新規案件登録手段４５により、登録時参考案件記憶手段６９に記憶されている参考案件の案件識別情報（案件番号）を用いて、案件データ記憶手段５４から参考案件の案件データを取得し、表示手段８０の画面上に表示する。

【0301】

その後、新規案件登録手段４５からの指示により、以下のような更新前における新規案件の即時反映処理を実行する。

【0302】

先ず、新規案件登録手段４５からの指示を受けた固有テキストデータ準備手段３４により、新規案件（企業）について、案件データ記憶手段５４から、自己データ、ニーズデータを取得し、次の固有テキストデータを用意する（ステップＳ１２０３）。すなわち、マッチング処理および連想検索処理で用いる固有テキストデータ（自己データとニーズデータとの結合テキストデータ）と、類似案件検索処理で用いる固有テキストデータ（非結合の自己データ、ニーズデータ）とを用意する。

【0303】

続いて、新規案件登録手段４５からの指示を受けた固有テキストデータ準備手段３４により、新規案件（企業）の固有テキストデータ（マッチング用および連想検索用（共用）の結合テキストデータ、類似案件検索用の非結合の自己データ、ニーズデータ）について、不要な記号やタグ等の除去、形態素解析で単語に分解、名詞のみ抽出、不要な単語の除去の各処理を実行し、処理後の各固有テキストデータを、案件識別情報（案件番号）と関連付けて案件データ記憶手段５４に記憶させる（ステップＳ１２０４）。

【0304】

次に、新規案件登録手段４５からの指示を受けた単語重要度ベクトル算出手段３７により、新規案件（企業）を含む全ての案件の処理後の固有テキストデータ（ｉ＝1～ｎ＋１）を用いて、新規案件の処理後の固有テキストデータ（ｉ＝ｎ＋１）についての次の単語重要度ベクトル（ここでは、ＴＦＩＤＦベクトル）を算出し、案件識別情報（案件番号）と関連付けて単語重要度ベクトル記憶手段５７に記憶させる（ステップＳ１２０５）。すなわち、マッチング処理で用いる単語重要度ベクトル（結合テキストデータの単語重要度ベクトル）と、類似案件検索処理で用いる単語重要度ベクトル（自己データ、ニーズデータの各々の単語重要度ベクトル）とを算出する。

【0305】

それから、新規案件登録手段４５からの指示を受けたトピック値予測手段３６により、新規案件（企業）の処理後の固有テキストデータ（ｉ＝ｎ＋１）について、次のトピック分布π（ｉ）を予測し、得られたトピック分布π（ｉ）を、案件識別情報（案件番号）と関連付けてトピックモデル記憶手段５６に記憶させる（ステップＳ１２０６）。すなわち、マッチング処理で用いる結合テキストデータのトピック分布π（ｉ）と、類似案件検索処理で用いる自己データ、ニーズデータの各々のトピック分布π（ｉ）とを予測する。

【0306】

続いて、新規案件登録手段４５からの指示を受けた案件類似度算出手段４３Ａにより、新規案件（企業）の処理後の固有テキストデータを用いて、その固有テキストデータを構成する全ての単語の分散表現（ここでは、word2vecによる単語ベクトル）の平均値を算出して文章ベクトルとし、得られた文章ベクトルを、案件識別情報（案件番号）と関連付けて文章ベクトル記憶手段６７に記憶させる（ステップＳ１２０７）。この祭、自己データの分散表現の平均値（文章ベクトル）と、ニーズデータの分散表現の平均値（文章ベクトル）とを、別々に算出する。

【0307】

さらに、新規案件登録手段４５からの指示を受けた案件類似度算出手段４３Ａにより、新規案件（企業）と、既存の全ての案件との間で、単語重要度ベクトル記憶手段５７に記憶されている単語重要度ベクトル同士の類似度Ｓtf-idf、文章ベクトル記憶手段６７に記憶されている文章ベクトル同士の類似度Ｓword2vec、トピックモデル記憶手段５６に記憶されているトピック分布（トピック値）ベクトル同士の類似度Ｓtopicを算出し、これらの各類似度を重み係数（Ｗtf-idf、Ｗword2vec、Ｗtopic）を用いて統合することにより、案件間（企業間）の類似度を示す案件類似度を算出し、算出した案件類似度を、ペア案件の案件識別情報（案件番号）と関連付けて案件類似度記憶手段６８に記憶させる（ステップＳ１２０８）。この際、案件類似度として、自己データについての類似度を示すＰＲスコアと、ニーズデータについての類似度を示すニーズスコアとを、別々に算出する。

【0308】

＜本実施形態の効果＞

【0309】

このような本実施形態によれば、次のような効果がある。すなわち、マッチングシステム１０では、ユーザ（マッチングサービスの提供を受ける者、またはサービス担当者）が、入力部１１０（図１１～図１３参照）にキーワードを入力すると、連想検索手段４１による処理が実行され、入力部１１０と同一の画面上に、関連案件の案件データや関連単語を表示することができる。一方、入力部１１０に案件識別情報（案件番号）を入力すると、マッチング手段４２による処理、および類似案件検索手段４３による処理が実行され、入力部１１０と同一の画面上に、対象案件（入力された案件番号の案件）のマッチング相手としての推薦案件の案件データ、および対象案件の類似案件の案件データを表示することができる。

【0310】

この際、連想検索手段４１、マッチング手段４２、および類似案件検索手段４３による３つの処理は、いずれも各案件の固有テキストデータ、すなわち同じデータ（各処理で結合・非結合の選択の自由度はあるが、いずれの処理でも自己データ、ニーズデータを使う。）を用いて実行されるので、３つの処理の全てでマッチングに適した処理を実現できることに加え、互いに関連性のある処理内容とすることができる。従って、マッチングシステム１０は、既存の３つのシステムを単純に併設したものではなく、各処理でデータの共用や、処理内容の共通化を図ることができる。

【0311】

また、連想検索手段４１、マッチング手段４２、および類似案件検索手段４３による各処理の結果は、これらの各手段４１，４２，４３による次の処理に活かすことができ、これらの各手段４１，４２，４３による処理を繰り返すことができるので、ユーザは、多様な検索を行うことができる。

【0312】

より詳細には、入力部１１０（図１１～図１３参照）にキーワードを入力し、連想検索手段４１による処理でそのキーワードの関連案件が得られた場合には、その関連案件の案件識別情報（案件番号）を入力部１１０に入力すれば、その関連案件に対するマッチング相手としての推薦案件を得ることができるとともに、その関連案件に対する類似案件を得ることができる。そして、得られた推薦案件の案件識別情報（案件番号）を入力部１１０に入力すれば、その推薦案件に対するマッチング相手としての推薦案件を得ることができるとともに、その推薦案件に対する類似案件を得ることができる。また、得られた類似案件の案件識別情報（案件番号）を入力部１１０に入力すれば、その類似案件に対するマッチング相手としての推薦案件を得ることができるとともに、その類似案件に対する類似案件を得ることができる。マッチングシステム１０では、このように関連案件、推薦案件、類似案件を横断した繰り返しの検索を行うことができ、さらにその間に任意のタイミングで様々なキーワードを入力することができる（図１１参照）。

【0313】

このため、ユーザが新規案件の登録を行う者またはその補助・指導・案内を行うサービス担当者であれば、自分または自分が担当する顧客と同じ立場の幾つかの案件（例えば、ある製品や商品を売るという目的でマッチングを希望する企業）についての案件データ（そこに含まれる自己データおよびニーズデータ）の内容を容易に把握することができ、また、どのような内容の案件データを登録すると、どのような内容の案件データを有する案件が、マッチング相手として推薦されるのか（つまり、どのような内容の案件データを有する案件同士のマッチング確度が高いのか）を容易に把握することができるので、それらの検索で参照した情報を、新規案件の案件データを登録する際に活かすことができる。従って、ユーザは、マッチングという観点から適切な案件データを登録し、効果的なマッチングサービスの提供を受けることができる。

【0314】

また、このような案件データの検索・参照は、新規案件の登録を行う者が、自身で行うことができるので、サービス担当者の負担を軽減することもできる。さらに、例えばサービス窓口や客先等でサービス担当者が検索を行う場合でも、検索で得られた幾つかの参考案件の案件データの内容を、新規案件の登録を行う者に直接に示すことができるので、サービス担当者の負担（補助・指導・案内をする上での手間）を軽減することができる。

【0315】

また、マッチング手段４２は、トピック推定処理で得られたトピックモデルの更新や、マッチング用特徴データを用いた学習で得られたマッチングモデルの更新が行われない限り、同じ入力に対しては、同じ出力をすることから、ある案件に対し、いつも同じ案件が同じ順位（同じスコア）で推薦案件として出力されることになる。そして、これが選定実績となり、マッチングモデルの更新に反映されると、偏った紹介を助長することに繋がる。しかし、マッチングシステム１０では、類似案件検索手段４３による処理を行うと、対象案件の類似案件を把握することができ、その類似案件を入力すれば、マッチング手段４２による処理で、その類似案件に対する推薦案件を出力することができるので、対象案件に対する推薦案件だけではなく、対象案件の類似案件に対する推薦案件を出力することもでき、サービス担当者は、それを紹介することもできる。同様に、検索を繰り返せば、対象案件に対する推薦案件の類似案件や、対象案件の類似案件に対する推薦案件の類似案件も出力することができ、サービス担当者は、それらを紹介することもできる。従って、サービス担当者は、様々な角度から紹介する案件を見つけることができるので、ノウハウの少ない担当者でも、マッチング依頼者に対し、マッチング相手として適切な案件を紹介することができるとともに、紹介案件の選定作業の固定化を防ぐことができるので、偏った学習用データによるマッチングモデルの更新の未然防止を図ることができる。

【0316】

さらに、連想検索手段４１は、一般類似度Ａと、固有テキストデータを用いて算出した固有類似度Ｂとを用いて最終類似度ＦＳを算出し、最終類似度ＦＳの高い順で関連単語を決定するので、関連単語を、単なる一般的な関連単語（入力したキーワードに対し、一般類似度Ａが高い単語）ではなく、固有テキストデータの内容を反映した関連単語とすることができる。このため、マッチングという観点から、より一層、効果的な関連単語を、新たなキーワードとして入力することができる。つまり、連想検索手段４１による処理では、関連案件の決定に用いる関連度ＣＳを求める式（３）の中に、固有テキストデータにおける単語別出現回数Ｃ（ｉ）が含まれているので、この関連度ＣＳが、固有テキストデータを用いて算出されていることになるが、これに加え、関連案件の決定で使用される関連単語の決定に用いる最終類似度ＦＳにも、固有テキストデータを用いて算出した固有類似度Ｂが関与するので、マッチングという観点から、より一層、効果的な処理を実現することができる。

【0317】

また、マッチングシステム１０は、トピック値予測手段３６を備えているので、トピックモデルの更新を行わずに、新規案件の固有テキストデータを検索に反映させることができる（図２３の新規案件の即時反映処理を参照）。このため、新規案件の固有テキストデータを含めたトピック推定処理によるトピックモデルの更新を行う前であっても、新規案件を対象案件とするマッチング処理を行うことができる。従って、トピックモデルの更新を行う前に、新規案件を含めた状態で、連想検索手段４１、マッチング手段４２、および類似案件検索手段４３による各処理を繰り返す検索を行うことができる。換言すれば、トピックモデルの更新を行う前であっても、新規案件の案件識別情報（案件番号）を、入力部１１０（図１１～図１３参照）に入力することができ、また、新規案件が、処理結果として画面表示される関連案件、推薦案件、類似案件になり得る状態とすることができる。

【0318】

さらに、類似案件検索手段４３は、式（４）に示すように、各案件の固有テキストデータにおける各トピックの出現確率を示すトピック値からなるトピック分布ベクトルと、各案件の固有テキストデータを構成する各単語の分散表現の平均値からなる文章ベクトルと、各案件の固有テキストデータについての単語重要度ベクトル（本実施形態では、ＴＦＩＤＦベクトル）とを用いて、対象案件とそれ以外の案件との間の案件類似度（ＰＲスコア、ニーズスコア）を算出し、この案件類似度の高い順で対象案件の類似案件を抽出する構成とされているので、固有テキストデータ（自己データ、ニーズデータ）の記述内容を的確に反映させた、マッチングに役立つ類似案件の抽出処理を実現することができる。

【0319】

また、連想検索手段４１は、図３に示すように、単語の出現回数を用いて固有類似度Ｂを算出する構成とされているので、各案件の固有テキストデータの記述内容を、より的確に反映した固有類似度Ｂを算出することができ、その固有類似度Ｂを用いて最終類似度ＦＳを算出し、その最終類似度ＦＳを用いて関連単語を決定することができる。このため、マッチングという観点から、より適切な関連単語の決定処理を行うことができる。

【0320】

さらに、入力受付手段４０は、キーワードの入力および案件識別情報（案件番号）の入力を、同一の入力部１１０（図１１～図１３参照）で受け付け、いずれの入力であるかを自動判別する構成とされているので、入力部１１０を配置し、かつ、検索結果を表示する画面の構成が簡易になり、ユーザによる操作性の向上を図ることができる。

【0321】

そして、入力受付手段４０は、検索履歴記憶手段６１に記憶させたログ情報を用いて、各画面１００，２００，３００（図１１～図１３参照）に設けられた「検索履歴」表示部１３０（図１１では、表示部１３０の図示が省略されている。）に検索履歴の表示を行うので、ユーザは、この表示を見ることで、どのようなキーワードまたは案件識別情報（案件番号）をどのような順序で入力し、検索を行ってきたのかを容易に把握することができる。このため、ユーザの検索作業効率を向上させることができる。

【0322】

また、出力手段４４は、参考案件の案件識別情報（案件番号）のメモ入力（図示は省略）を受け付け、登録時参考案件記憶手段６９に記憶させる構成とされ、新規案件登録手段４５は、登録時参考案件記憶手段６９に記憶されている参考案件の案件識別情報を用いて、表示手段８０に表示された新規案件登録画面（不図示）上において参考案件の案件データを表示する構成とされているので、ユーザは、その表示を見ながら、新規案件（自己の案件）の案件データの登録のための入力作業を行うことができる。このため、適切な案件データを容易に登録することができる。

【0323】

＜変形の形態＞

【0324】

なお、本発明は前記実施形態に限定されるものではなく、本発明の目的を達成できる範囲内での変形等は本発明に含まれるものである。

【0325】

（検索履歴表示に関する変形の形態：図２４）
例えば、前記実施形態では、各画面１００，２００，３００（図１１～図１３参照）に設けられた「検索履歴」表示部１３０（図１１では、表示部１３０の図示が省略されている。）には、検索履歴の表示として、キーワードまたは案件識別情報を入力順に並べた表示が行われていたが、図２４に示すような検索履歴の表示を行ってもよい。

【0326】

図２４において、画面４００には、前記実施形態の各画面１００，２００，３００（図１１～図１３参照）と同様に、入力部１１０および「Search」ボタン１２０が設けられているが、前記実施形態の「検索履歴」表示部１３０（図１１では、表示部１３０の図示が省略されている。）とは異なる「検索履歴」表示部４３０が設けられている。

【0327】

「検索履歴」表示部４３０には、最下行から上方に向かって入力順に従って、キーワードまたは案件識別情報（案件番号）が並べられている。従って、図２４の例は、キーワード「お酒」、案件番号「５６７８」、案件番号「６００６」、…という順序で、入力部１１０への入力が行われたことを示している。なお、入力順は、最上行から下方に向かっていてもよい。

【0328】

また、「検索履歴」表示部４３０には、３つの列が設けられている。左列には、キーワードが表示され、中央列には、最初に入力された案件識別情報（案件番号）と同じ側の案件識別情報（案件番号）が表示され、右列には、最初に入力された案件識別情報（案件番号）と反対側の案件識別情報（案件番号）が表示される。同じ側・反対側というのは、マッチングを求める側か、マッチング相手側かという観点で区別したサイド情報である。なお、キーワード、同じ側の案件識別情報、反対側の案件識別情報の左右方向の並び順（各列の配置位置）は、図２４の例に限定されず、任意であり、３つの情報が列によって区別されていればよい。また、図２４の例では、上下方向が入力順（時間情報）を示し、左右方向が、キーワード、同じ側・反対側の案件識別情報の区別を示すようになっているが、上下方向と左右方向との関係を入れ替えてもよい。

【0329】

「検索履歴」表示部４３０では、最初に入力された案件識別情報（案件番号）の案件が起点の案件（企業）となり、中央列と右列との間で、振り分け表示が行われる。図２４の例では、案件番号「５６７８」が起点である。類似案件（類似企業）を選択して入力部１１０に入力すると、同じ列に表示され、推薦案件（推薦企業）を選択して入力部１１０に入力すると、反対側の列に表示される。よって、マッチング相手（推薦案件）のマッチング相手（推薦案件）は、元の列に戻る。一旦、キーワードが入力部１１０に入力されると、この関係はリセットされ、その後において、最初に入力された案件識別情報（案件番号）の案件が新たな起点の案件となる。図２４の例では、案件番号「１８７７７」が新たな起点である。なお、類似案件、推薦案件のいずれでもない案件の案件番号を入力部１１０に打鍵入力することもできるが、この場合も、それまでの関係はリセットされ、打鍵入力した案件番号が、新たな起点となる。

【0330】

さらに、「検索履歴」表示部４３０では、関連案件、類似案件、推薦案件のいずれの案件番号を選択入力したのかを示す文字表示も行われている。例えば、「６００６・類似（売）」における「類似」の文字は、その直前に入力された案件番号「５６７８」の類似案件であることを示している。また、「６００６・類似（売）」における「（売）」の文字は、ニーズフラグの情報であり、案件番号「６００６」の案件のニーズフラグが「売」であることを示している。

【0331】

「検索履歴」表示部４３０では、ニーズフラグの情報（ここでは、売買の別）と、類似案件の入力か推薦案件の入力かの区別に従った中央列・右列の振り分け表示によるサイド情報との整合性情報も表示される。すなわち、最初に入力した案件番号の案件のニーズフラグが「売」であれば、その案件に対する推薦案件は「買」の案件になり、さらにその推薦案件に対する推薦案件は「売」の案件に戻るのが自然であるため、中央列には「売」の案件番号が並び、右列には「買」の案件番号が並ぶのが自然である。最初に入力した案件番号の案件のニーズフラグが「買」であれば、この関係は全て逆になるのが自然である。従って、最初に入力した案件番号の案件（起点の案件）のニーズフラグに対し、そのような自然な状態が保たれていれば、通常の背景色（例えば白色）に通常色の文字（例えば黒字）を表示する通常表示になる。一方、ニーズフラグが「売買」（「売」と「買」の双方）になっている案件があることと、テキストデータである自己データやニーズデータが必ずしも「売」と「買」とを明確に区別した情報になっていないことから、上記のような自然な状態が保たれない場合があるので、その場合は、逆転が生じたことを示すため、赤色背景または赤字にする等の注意喚起表示が行われる。

【0332】

また、ユーザが最初に入力する案件番号の案件（企業）が、自分側（ユーザと同じ側）の案件なのか、マッチング相手側（ユーザと反対側）の案件なのかについては、前者のケースが多いものの、ユーザの意思表示を受け付けない限り、システムは正確にそれを把握することはできない。しかし、いずれのケースであっても、すなわちユーザの検索意図（最初にどちら側を選んだのか）が不明であっても、最初に入力された案件番号が起点になることに変わりはない。この起点の案件のニーズフラグが「売買」のときもあり得るが、その場合は、ニーズフラグの情報から見ても、最初からユーザの検索意図が不明であるため、以降の表示の全部（リセットされるまでの全部）を黄色背景または黄色字にする等により、整合性情報の表示が機能しない旨の注意喚起表示が行われる。

【0333】

以上より、入力受付手段による「検索履歴」表示部４３０の表示には、次の（１）～（５）の機能がある。

【0334】

（１）キーワードまたは案件識別情報（案件番号）のいずれの入力を受け付けたのかという入力種別および入力順を示す基本機能がある。

【0335】

（２）対象案件（入力された案件番号の案件）に対する推薦案件の案件識別情報の入力を受け付けたのか、対象案件の類似案件の案件識別情報の入力を受け付けたのかを区別する推薦・類似区別情報の表示機能がある。図２４の例では、「推薦」および「類似」の文字で示されている。但し、推薦・類似区別情報は、文字表示ではなく、例えば、色分け表示や、網掛けの有無、枠囲いの有無等により実現してもよい。

【0336】

（３）案件識別情報（案件番号）の入力を受け付けた各案件が、互いに同じ側または反対側のいずれの案件かを区別するサイド情報の表示機能がある。起点の案件から見て、同じ側か反対側かというだけではなく、どの案件から見ても、他の案件が同じ側か反対側かがわかるようになっている。図２４の例では、「６６６７・類似（買）」と「５２９５・推薦（買）」とが同じ側であることがわかり、「６６６７・類似（買）」と「１１２２３・推薦（売）」とが反対側であることがわかる。このサイド情報の表示機能は、図２４の例では、中央列・右列の振り分け表示で実現されている。但し、サイド情報は、列の振り分け表示ではなく、例えば、色分け表示や、網掛けの有無、枠囲いの有無等により実現してもよい。なお、このサイド情報の表示機能は、推薦案件の推薦案件を同じ側に表示するので、上記（２）の推薦・類似区別情報の表示機能とは異なる機能である。

【0337】

（４）ニーズフラグの情報の表示機能がある。各案件の案件データに、売・買の別、労働者・使用者の別、男・女の別、その他の対になる情報を示すニーズフラグ（図２４の例では、売・買の別）が含まれていることが前提となる。図２４の例では、「（売）」、「（買）」、「（売買）」という文字で示されている。但し、ニーズフラグの情報は、文字表示ではなく、例えば、色分け表示や、網掛けの有無、枠囲いの有無等により実現してもよい。

【0338】

（５）ニーズフラグの情報（図２４の例では、売買の別）と、同じ側か反対側かを区別するサイド情報（図２４の例では、類似案件の入力か推薦案件の入力かの区別に従った中央列・右列の振り分け表示）との整合性情報の表示機能がある。図２４の例では、通常の背景色（例えば白色）に通常色の文字（例えば黒字）を表示する通常表示と、赤色背景または赤字にする等により逆転の発生を示す注意喚起表示と、黄色背景または黄色字にする等により整合性情報の表示が機能しない旨を示す注意喚起表示とがある。

【0339】

これらの（１）～（５）の機能を伴う検索履歴表示処理を行うことにより、連想検索手段４１、マッチング手段４２、および類似案件検索手段４３による各処理を繰り返す検索を行う中で、ユーザは、自分が今まで何をしてきたのか、今何をしているのか、さらには今から何をすればよいのかを把握し易くなるので、効率的な検索を行うことができる。

【0340】

（新規案件の登録時における参考案件の表示に関する変形の形態：図２５）
また、前記実施形態では、出力手段４４により参考案件の案件識別情報(案件番号)のメモ入力（不図示）を受け付ける構成とされていたが、図２５に示すような流れで、新規案件の登録時に、参考案件の案件データを表示するようにしてもよい。

【0341】

図２５において、ユーザ（新規案件の登録を行う顧客（企業）、またはそのサービス担当者）は、検索を行っている最中に、画面２００（図１２参照）に表示されている関連案件や、画面３００（図１３参照）に表示されている推薦案件、類似案件を、参考案件として選択することができる。選択操作は、各関連案件、各推薦案件、各類似案件に対応して設けられたチェックボックスやラジオボタン等の選択入力操作でもよく、各関連案件、各推薦案件、各類似案件に対応して設けられたアイコンをドロップエリアにドラッグ＆ドロップする操作でもよく、要するに、検索中に画面表示されている案件を直接に画面上で選択できればよい。検索中に画面が入れ替わり、既に選択済の案件が再表示された場合には、その案件のチェックボックスやラジオボタン等は、既に選択入力操作が行われた状態で表示される。また、ドロップエリアの周辺部（図２５の例では、下部）には、選択済の案件の案件番号が表示されている。なお、選択取消用のドロップエリアを設けておき、選択取消を行うときには、そこにアイコンをドラッグ＆ドロップするようにしてもよい。

【0342】

そして、選択された参考案件の案件識別情報（案件番号）は、前記実施形態のメモ入力（不図示）の場合と同様に、出力手段４４により、登録時参考案件記憶手段６９に保存される。その後、ユーザが新規案件の登録を行う際に、新規案件登録手段４５により、図２５に示すような新規案件登録画面５００が、表示手段８０の画面上に表示される。

【0343】

図２５において、新規案件登録画面５００には、自己ＰＲ入力部５１０と、ニーズ詳細入力部５２０と、参考案件表示部５３０とが設けられている。参考案件表示部５３０には、案件番号の表示部５３１と、ニーズフラグの表示部５３２と、参考案件の自己ＰＲテキストデータを新規案件の自己ＰＲ入力部５１０に自動的にコピー＆ペーストするための選択ボタン５３３と、参考案件の自己ＰＲテキストデータを新規案件のニーズ詳細入力部５２０に自動的にコピー＆ペーストするための選択ボタン５３４と、参考案件のニーズ詳細テキストデータを新規案件の自己ＰＲ入力部５１０に自動的にコピー＆ペーストするための選択ボタン５３５と、参考案件のニーズ詳細テキストデータを新規案件のニーズ詳細入力部５２０に自動的にコピー＆ペーストするための選択ボタン５３６とが設けられている。このように選択ボタン５３３～５３６が、交差移動できるように設けられているのは、ニーズフラグが「売買」になっている案件（対になる情報の双方を指定している案件）があることと、ユーザが選択した参考案件が、必ずしもユーザ自身（新規登録を行う者）と同じ側の案件であるとは限らないことからである。

【0344】

ユーザは、選択ボタン５３３～５３６を選択操作し、参考案件のテキストデータをコピー＆ペーストしてから、自分の案件用のテキストデータに編集することができる。また、選択ボタン５３３～５３６の選択操作を複数回行うことにより、新規案件の自己ＰＲ入力部５１０に、複数のテキストデータを自動的にコピー＆ペーストすることもできる。この場合、上書きではなく、選択した順序で、次々に新規案件の自己ＰＲ入力部５１０に、選択したテキストデータが追加されていく。図２５の例では、参考案件（案件番号＝１５５４２）の自己ＰＲのテキストデータ「ＸＸＸＸＸＸＸＸ」の選択ボタン５３３と、参考案件（案件番号＝８２７５）のニーズ詳細のテキストデータ「ＺＺＺＺＺＺＺＺ」の選択ボタン５３５とが、この順で選択されることにより、「ＸＸＸＸＸＸＸＸ」および「ＺＺＺＺＺＺＺＺ」が、自己ＰＲ入力部５１０にペーストされた状態となっている。新規案件のニーズ詳細入力部５２０にも同様に、複数のテキストデータを次々に自動的にコピー＆ペーストすることができる。なお、選択ボタン５３３～５３６を選択操作するのではなく、画面５００上で通常のコピー＆ペーストの操作を行うことにより、参考案件のテキストデータの一部または全部（選択したコピー範囲）を、新規案件の自己ＰＲ入力部５１０やニーズ詳細入力部５２０にペーストしてもよい。

【0345】

このように新規案件の登録時に参考案件の案件データ（自己ＰＲ、ニーズ詳細を含む）を表示し、ユーザ自身の案件の自己ＰＲ、ニーズ詳細の編集に利用することができるようにしておけば、新規案件の登録を行うユーザは、マッチング用のデータとして適切な案件データ（自己ＰＲ、ニーズ詳細を含む）の入力作業を容易に行うことができる。

【0346】

（複数の案件識別情報の同時入力を受け付けることができる変形の形態：図２６）
また、本発明のマッチングシステムは、図２６に示すように、複数の案件を同時に入力することができるようにしてもよい。この場合、複数の案件の全てが対象案件となり、複数の対象案件からなる対象案件グループが構成される。そして、対象案件グループに対し、複数の推薦案件からなる推薦案件グループが表示される。この推薦案件グループは、対象案件グループに対し、一体としたマッチング処理により決定された推薦案件の集合であり、原則的には、複数の対象案件のそれぞれに対する個別のマッチング処理で決定された推薦案件を単純に寄せ集めたものではないが、集団マッチングアルゴリズムによっては、結果的に、そのような単純な寄せ集めと同じ表示状態になる場合もある。このように一体としたマッチング処理を行うのは、推薦案件グループを紹介する目的が、具体的には、例えば、複数の企業（対象案件グループ）と、別の複数の企業（推薦案件グループ）との名刺交換会、集団会合等の設定、あるいは、複数の男性（対象案件グループ）と、複数の女性（推薦案件グループ）との集団お見合い、合同飲食会の設定等であるため、１対１のマッチングを考慮するだけでは不十分だからである。一方、類似案件については、検索の利便性や多様性向上の観点から表示するので、一体としての抽出処理により類似案件グループを一体的に抽出するという概念はなく、対象案件グループを構成する複数の対象案件のそれぞれに対し、類似案件が表示される。これにより、対象案件グループを構成する複数の対象案件のうちの少なくとも一部の案件を、それぞれの類似案件に入れ替えて検索を行うことが可能となっている。

【0347】

図２６において、画面６００には、入力部６１０と、検索を実行するための「Search」ボタン６２０と、「検索履歴」表示部６３０と、推薦案件グループを構成する案件数の入力部６４０とが設けられている。画面６００のタイトルは、ビジネスマッチングになっているが、これに限定されるものではなく、例えば、男女の集団カップリング等でもよい。

【0348】

入力部６１０には、カンマ区切り、セミコロン区切り（図２６の例）、ブランク挿入等により、対象案件グループを構成する複数の対象案件についての案件識別情報（案件番号）を同時に入力する。例えば、入力部６１０に５つの案件番号を同時に入力し、入力部６４０に「５」を入力すれば、５案件（５企業または５人）に対し、５案件からなる推薦案件グループが表示される。但し、対象案件グループを構成する対象案件の案件数と、推薦案件グループを構成する推薦案件の案件数とは、必ずしも一致させる必要はなく、例えば、５案件の対象案件グループに対し、１０案件の推薦案件グループが表示されるようにしてもよい。なお、５案件の対象案件グループに対し、１０案件の１つの推薦案件グループを表示するマッチング処理と、５案件の２つの推薦案件グループ（グループ番号＝１，２）を表示するマッチング処理とは、異なる処理である。

【0349】

また、図２６の画面６００には、「対象案件」表示部６５０と、「推薦案件グループ」表示部６６０と、「類似案件一覧」表示部６７０と、１対象案件当たりの類似案件の表示数の入力部６７１とが設けられている。「対象案件」表示部６５０には、対象案件グループを構成する複数の対象案件の各々の案件データ（案件番号、自己ＰＲ、ニーズ詳細を含む）が表示される。

【0350】

「推薦案件グループ」表示部６６０には、少なくとも１つの推薦案件グループが表示され、それぞれの推薦案件グループには、グループ番号が付与されている。各推薦案件グループを構成する複数の推薦案件の各々の案件データ（案件番号、自己ＰＲ、ニーズ詳細を含む）が表示される。表示される推薦案件グループの数は、システム管理者により入力され、設定データとして設定データ記憶手段５１に記憶されているが、固定数としてもよい。また、ユーザが画面６００で指定してもよい。なお、入力部６４０に入力するのは、１つの推薦案件グループを構成する案件の数であるから、ここでいう推薦案件グループの数とは異なる。また、ある推薦案件グループを構成する複数の推薦案件と、別の推薦案件グループを構成する複数の推薦案件とに重なりはない。

【0351】

「類似案件一覧」表示部６７０には、対象案件グループを構成する複数の対象案件のそれぞれに対する複数の類似案件の案件データ（案件番号、自己ＰＲ、ニーズ詳細を含む）が表示される。いずれの対象案件に対する類似案件であるかがわかるように、対象案件の案件番号も表示される。１対象案件当たりの類似案件の表示数は、ユーザが入力部６７１に入力して指定するが、システム管理者が設定データとして入力して設定データ記憶手段５１に記憶してもよく、固定数としてもよい。

【0352】

なお、推薦案件グループの決定方法は、前述した特許文献１（本願出願人により開発されたマッチングシステム）に記載されているので、そのアルゴリズムを採用することができる。この集団マッチングアルゴリズムは、対象案件グループを構成する複数の対象案件（企業等）の全ての満足度が高くなるように推薦案件グループの決定を行うが、必ずしも厳密な意味での最適化処理を行う必要はない。要するに、１案件と１案件との間のマッチングスコアは、全てのペア案件について得られるので、それらのスコアを用いて、それぞれの集団マッチングアルゴリズム内において、スコアの合計値が大きくなるように推薦案件グループの決定を行えばよい。

【0353】

例えば、Ａ社、Ｂ社、Ｃ社、Ｄ社、Ｅ社の５案件（Ｎｔ案件）の対象案件グループに対し、１０案件（Ｎｃ案件）の推薦案件グループを決定するものとする。この場合、登録された全ての案件（Ｎａ案件）からＡ社、Ｂ社、Ｃ社、Ｄ社、Ｅ社の５案件（Ｎｔ案件）を除いた（Ｎａ－Ｎｔ）案件からなる候補案件群を考える。この候補案件群の任意の１案件と、Ａ社、Ｂ社、Ｃ社、Ｄ社、Ｅ社の５案件（Ｎｔ案件）との間の５つ（Ｎｔ個）のマッチングスコアの合計値を算出する。この合計値の算出を、候補案件群の（Ｎａ－Ｎｔ）案件の全てについて行う。そして、候補案件群の案件のうち、合計値が１番目に大きい案件、２番目、３番目、…、１０番目（Ｎｃ番目）に大きい案件を、グループ番号＝１の推薦案件グループを構成する１０個（Ｎｃ個）の推薦案件として決定し、合計値が１１番目（（Ｎｃ＋１）番目）から２０番目（２×Ｎｃ番目）までの案件を、グループ番号＝２の推薦案件グループを構成する１０個（Ｎｃ個）の推薦案件として決定し、合計値が２１番目（（２×Ｎｃ＋１）番目）から３０番目（３×Ｎｃ番目）までの案件を、グループ番号＝３の推薦案件グループを構成する１０個（Ｎｃ個）の推薦案件として決定し、…というマッチング処理を実行する。

【0354】

また、別の集団マッチングアルゴリズムとしては、例えば、先ず、（Ｎａ－Ｎｔ）案件からなる候補案件群の中から、Ａ社、Ｂ社、Ｃ社、Ｄ社、Ｅ社の５案件（Ｎｔ案件）の各々とのマッチングスコアが最も高い５案件（Ｎｔ案件）を選択する。つまり、Ａ社とのマッチングスコアが最も高い案件と、Ｂ社とのマッチングスコアが最も高い案件と、…を選択する。選択した５案件に重なりがなければ、５案件の全てを推薦案件として決定し、推薦案件として決定すべき残りの案件は５案件となるが、ここでは１案件について重なりがあったとすると、４案件を推薦案件として決定し、残りの案件は６案件となる。次に、Ａ社、Ｂ社、Ｃ社、Ｄ社、Ｅ社の５案件（Ｎｔ案件）の各々とのマッチングスコアが２番目に高い５案件（Ｎｔ案件）を選択する。つまり、Ａ社とのマッチングスコアが２番目に高い案件と、Ｂ社とのマッチングスコアが２番目に高い案件と、…を選択する。選択した５案件に重なりがなければ、５案件の全てを推薦案件として追加決定し、推薦案件として決定すべき残りの案件は１案件となるが、ここでも１案件について重なりがあったとすると、４案件を推薦案件として追加決定し、残りの案件は２案件となる。続いて、Ａ社、Ｂ社、Ｃ社、Ｄ社、Ｅ社の５案件（Ｎｔ案件）の各々とのマッチングスコアが３番目に高い５案件（Ｎｔ案件）を選択する。つまり、Ａ社とのマッチングスコアが３番目に高い案件と、Ｂ社とのマッチングスコアが３番目に高い案件と、…を選択する。残りの案件は２案件であるから、選択した５案件のうち、マッチングスコアが上位２番目までの案件を選択し、推薦案件として追加決定する。そして、グループ番号＝２以降の推薦案件グループの決定では、Ａ社、Ｂ社、Ｃ社、Ｄ社、Ｅ社の５案件（Ｎｔ案件）の各々とのマッチングスコアが４番目、５番目、６番目、…に高い５案件（Ｎｔ案件）を順次選択していく。

【0355】

図２６に示すように、複数の案件番号の同時入力を受け付けることができる構成にすると、類似案件検索手段４３により、対象案件グループを構成する複数の対象案件の各々についての類似案件が抽出され、「類似案件一覧」表示部６７０に、それらの類似案件の案件データが表示されるので、様々な観点から、紹介する案件グループを決定することができる。このため、ノウハウの少ないサービス担当者でも適切な紹介作業を行うことができるとともに、偏った紹介実績を含む学習用データによるマッチングモデルの更新の未然防止を図ることができる。

【0356】

すなわち、マッチング手段４２は、トピック推定処理で得られたトピックモデルの更新や、マッチング用特徴データを用いた学習で得られたマッチングモデルの更新が行われない限り、同じ入力に対しては、同じ出力をすることから、ある対象案件グループに対し、いつも同じ推薦案件グループが出力されることになる。しかし、図２６に示すような表示を行うと、対象案件グループを構成する複数の対象案件のうちの少なくとも１つの案件を、それらの対象案件の類似案件に変えて検索を行ったり、あるいは、推薦案件グループを構成する複数の推薦案件のうちの少なくとも１つの案件を、それらの推薦案件の類似案件に変えて紹介すること等が可能となる。

【産業上の利用可能性】

【0357】

以上のように、本発明のマッチングシステムおよびプログラムは、例えば、企業同士を組み合わせるビジネスマッチングシステム等に用いるのに適している。

【符号の説明】

【0358】

１０マッチングシステム
３６トピック値予測手段
４０入力受付手段
４１連想検索手段
４１Ａ連想検索手段を構成する単語類似度算出手段
４１Ｂ連想検索手段を構成する関連度算出手段
４２マッチング手段
４２Ａマッチング手段を構成するマッチング用特徴データ作成手段
４２Ｂマッチング手段を構成するマッチングスコア算出手段
４３類似案件検索手段
４３Ａ類似案件検索手段を構成する案件類似度算出手段
４３Ｂ類似案件検索手段を構成する類似案件抽出手段
４４出力手段
４５新規案件登録手段
５３分散表現モデル記憶手段
５４案件データ記憶手段
５６トピックモデル記憶手段
６０マッチングモデル記憶手段
６８案件類似度記憶手段
６９登録時参考案件記憶手段

【要約】

【課題】偏った紹介の未然防止、偏った紹介実績に基づくマッチングモデルの再学習の未然防止、効果的なマッチングを行うための適切な案件データの登録の実現、サービス担当者の手間の軽減を図ることができるマッチングシステムを提供する。
【解決手段】マッチングシステム１０では、ユーザが、入力部１１０にキーワードを入力すると、連想検索処理が実行され、入力部１１０と同一の画面上に、関連案件や関連単語が表示され、入力部１１０に案件識別情報を入力すると、マッチング処理および類似案件検索処理が実行され、入力部１１０と同一の画面上に、マッチング相手としての推薦案件および対象案件の類似案件が表示される。この際、連想検索処理、マッチング処理、および類似案件検索処理は、いずれも各案件の固有テキストデータを用いて実行される。
【選択図】図１１