(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023145870
(43)【公開日】2023-10-12
(54)【発明の名称】文書検証装置及びプログラム
(51)【国際特許分類】
G06F 40/253 20200101AFI20231004BHJP
G06Q 50/18 20120101ALI20231004BHJP
G06F 40/166 20200101ALI20231004BHJP
【FI】
G06F40/253
G06Q50/18
G06F40/166
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2022052749
(22)【出願日】2022-03-29
(71)【出願人】
【識別番号】000002897
【氏名又は名称】大日本印刷株式会社
(74)【代理人】
【識別番号】100106002
【弁理士】
【氏名又は名称】正林 真之
(74)【代理人】
【識別番号】100165157
【弁理士】
【氏名又は名称】芝 哲央
(74)【代理人】
【識別番号】100120891
【弁理士】
【氏名又は名称】林 一好
(72)【発明者】
【氏名】伊藤 直之
【テーマコード(参考)】
5B091
5B109
5L049
【Fターム(参考)】
5B091AA15
5B091CA01
5B091CD11
5B091EA01
5B109KA00
5B109KB01
5B109QA01
5B109QB11
5B109RB32
5B109TB03
5B109VC03
5L049CC32
(57)【要約】
【課題】文書の修正するべき箇所を明示する文書検証装置及びプログラムを提供する。
【解決手段】文書検証サーバ1は、検証対象の文書の入力を受け付ける文書受付部12と、修正が不要な正解文書と修正が必要な不正解文書とを入力データとて学習し、正解文書と不正解文書とを分類する文書分類器22aに、文書受付部12が受け付けた文書を入力して、文書の分類結果と、分類結果のテキストごとの寄与度をアテンション情報として取得する推定結果取得部14と、推定結果取得部14が取得したアテンション情報に基づいて、文書の対応するテキストの態様を変更するテキスト態様変更部15と、テキスト態様変更部15による変更後の文書を出力する変更文書出力部16と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
検証対象文書の入力を受け付ける対象文書受付手段と、
修正が不要な正解文書と修正が必要な不正解文書とを入力データとして学習し、前記正解文書と前記不正解文書とを分類する分類器に、前記対象文書受付手段が受け付けた前記検証対象文書を入力して、前記検証対象文書の分類結果と、前記分類結果の文字列ごとの寄与度をアテンション情報として取得する推定結果取得手段と、
前記推定結果取得手段が取得した前記アテンション情報に基づいて、前記検証対象文書の対応する前記文字列の態様を変更する態様変更手段と、
前記態様変更手段による変更後の前記検証対象文書を出力する文書出力手段と、
を備える、文書検証装置。
【請求項2】
請求項1に記載の文書検証装置において、
前記態様変更手段は、前記推定結果取得手段が取得した前記分類結果が不正解文書である場合に、前記推定結果取得手段が取得した前記アテンション情報に応じて、前記検証対象文書の対応する前記文字列の態様を変更する、文書検証装置。
【請求項3】
請求項1又は請求項2に記載の文書検証装置において、
前記態様変更手段は、前記アテンション情報が有する前記寄与度に応じて、前記検証対象文書の対応する前記文字列の態様を変更する、文書検証装置。
【請求項4】
請求項1から請求項3までのいずれかに記載の文書検証装置において、
前記検証対象文書並びに前記正解文書及び前記不正解文書は、契約書の文書である、文書検証装置。
【請求項5】
請求項4に記載の文書検証装置において、
前記分類器は、条及び/又は項の単位で前記入力データを学習したものである、文書検証装置。
【請求項6】
請求項4又は請求項5に記載の文書検証装置において、
前記分類器は、前記契約書の種別及び/又は前記契約書の主体に応じた前記入力データを学習したものである、文書検証装置。
【請求項7】
請求項1から請求項6までのいずれかに記載の文書検証装置としてコンピュータを機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書検証装置及びプログラムに関する。
【背景技術】
【0002】
従来、契約書等の文書について、文法チェック、スペルチェック、単語チェック等を行い、文書の誤り箇所を示す文書校正サーバがある。文書校正サーバは、予め登録してある単語や構文と一致するか否かを判定することにより、作成された文書の文法誤り等、校正が必要な箇所を抽出するものであった。
上記の文書校正サーバでは、予め登録されていないものについては校正の必要があるか否かの判定を行うことができない、という問題があった。また、契約書において、契約内容のチェックには、専門的な知識を必要とする。そこで、ニューラルネットワークを使用した契約書チェック装置が開示されている(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載のものは、契約書においてチェックすべき項目の重要度を出力するが、これでは項目の重要度が示されるのみであった。また、特許文献1に記載のものは、修正案を提示するが、重要であると判別した項目についてのものであり、真に修正するべき箇所を明示するものではなかった。
【0005】
そこで、本発明は、文書の修正するべき箇所を明示する文書検証装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明は、以下のような解決手段により、前記課題を解決する。
第1の発明は、検証対象文書の入力を受け付ける対象文書受付手段と、修正が不要な正解文書と修正が必要な不正解文書とを入力データとして学習し、前記正解文書と前記不正解文書とを分類する分類器に、前記対象文書受付手段が受け付けた前記検証対象文書を入力して、前記検証対象文書の分類結果と、前記分類結果の文字列ごとの寄与度をアテンション情報として取得する推定結果取得手段と、前記推定結果取得手段が取得した前記アテンション情報に基づいて、前記検証対象文書の対応する前記文字列の態様を変更する態様変更手段と、前記態様変更手段による変更後の前記検証対象文書を出力する文書出力手段と、を備える、文書検証装置である。
第2の発明は、第1の発明の文書検証装置において、前記態様変更手段は、前記推定結果取得手段が取得した前記分類結果が不正解文書である場合に、前記推定結果取得手段が取得した前記アテンション情報に応じて、前記検証対象文書の対応する前記文字列の態様を変更する、文書検証装置である。
第3の発明は、第1の発明又は第2の発明の文書検証装置において、前記態様変更手段は、前記アテンション情報が有する前記寄与度に応じて、前記検証対象文書の対応する前記文字列の態様を変更する、文書検証装置である。
第4の発明は、第1の発明から第3の発明までのいずれかの文書検証装置において、前記検証対象文書並びに前記正解文書及び前記不正解文書は、契約書の文書である、文書検証装置である。
第5の発明は、第4の発明の文書検証装置において、前記分類器は、条及び/又は項の単位で前記入力データを学習したものである、文書検証装置である。
第6の発明は、第4の発明又は第5の発明の文書検証装置において、前記分類器は、前記契約書の種別及び/又は前記契約書の主体に応じた前記入力データを学習したものである、文書検証装置である。
第7の発明は、第1の発明から第6の発明までのいずれかの文書検証装置としてコンピュータを機能させるためのプログラムである。
【発明の効果】
【0007】
本発明によれば、文書の修正するべき箇所を明示する文書検証装置及びプログラムを提供することができる。
【図面の簡単な説明】
【0008】
【
図1】本実施形態に係る文書検証システムの全体構成図及び文書検証サーバの機能ブロック図である。
【
図2】本実施形態に係る文書検証サーバでの分類器生成処理を示すフローチャートである。
【
図3】本実施形態に係る文書検証サーバでの分類器生成処理で用いる訓練データの例を示す図である。
【
図4】本実施形態に係る文書検証サーバでの文書検証処理を示すフローチャートである。
【
図5】本実施形態に係るユーザ端末の検証用画面に検証対象の文書を出力するまでの流れを説明するための図である。
【
図6】本実施形態に係る文書検証サーバでの文書検証処理を説明するための図である。
【発明を実施するための形態】
【0009】
以下、本発明を実施するための形態について、図を参照しながら説明する。なお、これは、あくまでも一例であって、本発明の技術的範囲は、これに限られるものではない。
(実施形態)
<文書検証システム100の全体構成>
図1は、本実施形態に係る文書検証システム100の全体構成図及び文書検証サーバ1の機能ブロック図である。
【0010】
図1に示すように、文書検証システム100は、文書検証サーバ1(文書検証装置)と、ユーザ端末5とを備える。文書検証サーバ1と、ユーザ端末5とは、通信ネットワークNを介して接続されている。
文書検証システム100は、ユーザ端末5から入力がされた契約書に代表される文書(検証対象文書)を文書検証サーバ1が受け付けて、文書検証サーバ1が、文書の修正するべき箇所をユーザ端末5に出力する。このように、文書検証システム100は、ユーザに対して文書の修正するべき箇所を教示するシステムである。
【0011】
<文書検証サーバ1>
文書検証サーバ1は、文書(検証対象文書)を受け付けて、修正するべき箇所であるテキスト(文字列)を、修正すべき箇所の重要度に応じて可視化して提示するサーバである。
文書検証サーバ1は、制御部10と、記憶部20と、通信インタフェース部29とを備える。
制御部10は、文書検証サーバ1の全体を制御するCPU(中央処理装置)である。制御部10は、記憶部20に記憶されているOS(オペレーティングシステム)や、各種のアプリケーションプログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、各種機能を実行する。
【0012】
制御部10は、文書検証処理部11と、分類器生成部18とを備える。
文書検証処理部11は、文書の内容を検証するための処理を行う制御部である。
文書検証処理部11は、文書受付部12(対象文書受付手段)と、文書適用部13(推定結果取得手段)と、推定結果取得部14(推定結果取得手段)と、テキスト態様変更部15(態様変更手段)と、変更文書出力部16(文書出力手段)とを備える。
【0013】
文書受付部12は、例えば、ユーザ端末5から検証対象の文書を受信することで、文書を受け付ける。ここで、検証対象の文書は、例えば、契約書に代表されるドキュメントである。文書は、条の単位であってもよいし、複数の条からなる契約書そのものであってもよい。
文書は、テキストが取得可能な形式であればよく、例えば、文書作成ソフトウェアで作成されたものであってもよいし、PDF(Portable Document Format)形式のデータであってもよい。また、文書が画像ファイルの形式であれば、例えば、OCR(Optical Character Recognition/Reader)によってテキストに変換した後の文書であってもよい。
【0014】
文書適用部13は、文書受付部12が受け付けた文書を、記憶部20の文書分類器22aに入力する。
推定結果取得部14は、文書分類器22aが出力した分類を取得する。ここで、推定結果取得部14が取得する分類結果は、正解文書か不正解文書かのいずれかである。正解文書とは、修正が不要な文書をいう。他方、不正解文書とは、修正すべき文書をいう。
また、推定結果取得部14は、文書分類器22aが出力した分類結果にしたがったテキストごとの寄与度をアテンション情報として取得する。ここで、アテンション情報とは、文書におけるテキストの着目箇所と、着目箇所の着目度合いである寄与度に係る情報をいう。そして、着目度合いが高いほど、分類の関係性が高いため、寄与度が大きいテキストは、分類を決定するのに重要な役割を果たす。
【0015】
テキスト態様変更部15は、推定結果取得部14が取得した分類結果が不正解文書であった場合に、アテンション情報に基づいてテキストの態様を変更する。ここで、テキスト態様変更部15は、テキストの態様を、アテンション情報に有する寄与度に応じたものに変更する。
変更文書出力部16は、テキスト態様変更部15による変更後の文書を、ユーザ端末5に出力する。
【0016】
分類器生成部18は、正解文書と不正解文書とを訓練データ(入力データ)として学習して、正解文書と不正解文書とを分類する文書分類器22aを生成する。より具体的には、分類器生成部18は、例えば、アテンション機構を有する再帰型ニューラルネットワークを用いて、訓練データから文書分類器22aを生成する。ここで、分類器生成部18は、再帰型ニューラルネットワークとして、例えば、RNN(Recurrent Neural Network)に代表されるモデルを用いる。分類器生成部18の学習に用いる訓練データは、検証を行う文書と同じ種別のものを用いるのが望ましい。種別とは、例えば、秘密保持契約(NDA)や、利用規約といった契約書の分類である。
なお、これらの各機能の詳細については、後述する。
【0017】
記憶部20は、文書検証サーバ1の動作に必要なプログラム、データ等を記憶するためのハードディスク、半導体メモリ素子等の記憶装置である。
記憶部20は、プログラム記憶部21と、分類器記憶部22とを備える。
プログラム記憶部21は、プログラムを記憶するための記憶領域である。プログラム記憶部21は、文書検証プログラム21a(プログラム)と、分類器生成プログラム21bとを記憶している。
【0018】
文書検証プログラム21aは、例えば、制御部10の文書検証処理部11に関する各種機能を実行するためのプログラムである。
分類器生成プログラム21bは、例えば、制御部10の分類器生成部18に関する機能を実現するためのプログラムである。
なお、上記のプログラムは、一例であり、例えば、文書検証プログラム21aと、分類器生成プログラム21bとの機能を有する1つのプログラムで構成されていてもよい。
【0019】
分類器記憶部22は、分類器を記憶するための記憶領域である。分類器記憶部22は、文書分類器22aを記憶している。
文書分類器22aは、分類器生成部18が生成した分類器である。
なお、記憶部20は、例えば、文書受付部12が受け付けた文書を、一時的に記憶する一時記憶領域等を有してもよい。
通信インタフェース部29は、通信ネットワークNを介してユーザ端末5との通信を行うためのインタフェースである。
【0020】
ここで、コンピュータとは、制御部、記憶装置等を備えた情報処理装置をいい、文書検証サーバ1は、制御部10、記憶部20等を備えた情報処理装置であり、コンピュータの概念に含まれる。
また、文書検証サーバ1を構成するハードウェアの数に制限はない。必要に応じて、1又は複数で構成してもよい。また、文書検証サーバ1のハードウェアは、必要に応じてWebサーバ、DB(データベース)サーバ、アプリケーションサーバ等の各種サーバを含んで構成してもよく、1台のサーバで構成しても、それぞれ別のサーバで構成してもよい。また、文書検証サーバ1は、例えば、クラウドであってもよい。
【0021】
<ユーザ端末5>
ユーザ端末5は、文書を検証するためにユーザが使用する端末である。ユーザ端末5は、例えば、パーソナルコンピュータ(PC)や、タブレット端末等で構成することができる。図示していないが、ユーザ端末5は、制御部、記憶部、入力部、表示部、通信インタフェース部等を備える。
通信ネットワークNは、文書検証サーバ1と、ユーザ端末5との間のネットワークであり、例えば、インターネット回線等の通信網である。
【0022】
<分類器生成処理>
次に、文書検証サーバ1による文書の検証を行う際に用いる分類器の学習について説明する。
図2は、本実施形態に係る文書検証サーバ1での分類器生成処理を示すフローチャートである。
図3は、本実施形態に係る文書検証サーバでの分類器生成処理で用いる訓練データの例を示す図である。
【0023】
図2のステップS(以下、「ステップS」を、単に「S」という。)11において、文書検証サーバ1の制御部10(分類器生成部18)は、訓練データを受け付ける。
ここで、文書分類器22aの生成に用いる訓練データについて、
図3に基づき説明する。
図3は、訓練データ30を示す。訓練データ30は、修正なし文書31と、修正すべき文書32とを含む。
修正なし文書31は、文書が正しく、修正が不要な文書データである。
修正すべき文書32は、文書が正しくなく、修正が必要な文書データである。修正すべき文書32には、例えば、修正必要箇所32Aや32Bを含む。
なお、訓練データ30は、修正なし文書31か、修正すべき文書32かを分類してラベル付けをしておくだけでよい。例えば、修正なし文書31と修正すべき文書32とが対になっている必要はなく、対になっている場合であっても、修正なし文書31と修正すべき文書32とを関連付ける必要はない。また、修正すべき文書32は、修正必要箇所32Aや32Bが修正すべき文書32にあれば足り、修正必要箇所を明示する必要はない。
【0024】
図2のS12において、制御部10(分類器生成部18)は、例えば、アテンション機構を有する再帰型ニューラルネットワークを用いて、訓練データから文書分類器22aを生成する。
S13において、制御部10(分類器生成部18)は、S12において生成した文書分類器22aを、分類器記憶部22に記憶させる。その後、制御部10は、本処理を終了する。
【0025】
この分類器生成処理によって、文書検証サーバ1は、文書分類器22aを生成するので、文書の検証において、文書分類器22aを用いることができる。
なお、
図3に示す例では、項ごとの文書を訓練データにして文書分類器22aを生成している。そのため、上記の処理で生成した文書分類器22aは、項ごとに分類を行うものになる。
【0026】
<文書検証処理>
次に、文書検証サーバ1による文書の検証処理について説明する。
図4は、本実施形態に係る文書検証サーバ1での文書検証処理を示すフローチャートである。
図5は、本実施形態に係るユーザ端末5の検証用画面60に検証対象の文書41を出力するまでの流れを説明するための図である。
図6は、本実施形態に係る文書検証サーバ1での文書検証処理を説明するための図である。
【0027】
ユーザ端末5は、例えば、検証を行いたい文書41を図示しないアップロード画面から指定して、
図5に示すように、文書検証サーバ1に文書41をアップロードする。そうすることで、
図4のS31において、文書検証サーバ1の制御部10(文書受付部12)は、ユーザ端末5から文書を受け付ける。
S32において、制御部10は、受け付けた文書を含む検証用画面を、ユーザ端末5に出力する。
【0028】
図5に示す検証用画面60は、S32の処理によってユーザ端末5に出力される画面の例である。
検証用画面60は、文書領域61と、ボタン62及び63と、結果出力領域64とを含む。
文書領域61は、検証対象の文書41を出力する出力領域である。また、文書領域61は、検証結果により変更された文書を出力する出力領域である。
ボタン62は、文書領域61を消去するための部材である。
ボタン63は、文書領域61に出力された文書41の検証処理を開始するための部材である。
結果出力領域64は、文書領域61に出力された文書41についての検証結果を出力する出力領域である。結果出力領域64は、検証実行前は、ブランクである。
【0029】
次に、ユーザがユーザ端末5において
図5に示す検証用画面60のボタン63を選択することで、
図4のS33において、制御部10は、検証の実行操作を受け付ける。
S34において、制御部10(文書適用部13、推定結果取得部14)は、S31の処理で受け付けた文書を文書分類器22aに入力し、文書分類器22aから出力された分類結果及び検証結果を取得する。ここで、文書分類器22aから出力される分類結果は、正解文書又は不正解文書のいずれかである。また、文書分類器22aから出力される検証結果には、分類結果のテキストごとの寄与度を示すアテンション情報を含む。
【0030】
S35において、制御部10は、S34で取得した分類結果を、ユーザ端末5に出力する。より具体的には、取得した分類結果が正解文書、つまり、修正なしと判断された文書である場合には、制御部10は、例えば、「検証結果はOKです。」等のテキストを、検証用画面60の結果出力領域64に出力する。他方、取得した分類結果が不正解文書、つまり、修正あり(修正するべき)と判断された文書である場合には、制御部10は、例えば、「検証結果はNGです。」等のテキストを、検証用画面60の結果出力領域64に出力する。
【0031】
S36において、制御部10は、分類結果が不正解文書であるか否かを判断する。分類結果が不正解文書である場合(S36:YES)には、制御部10は、処理をS37に移す。他方、分類結果が不正解文書ではない場合、つまり、分類結果が正解文書である場合(S36:NO)には、制御部10は、本処理を終了する。
S37において、制御部10(テキスト態様変更部15)は、検証結果を用いて文書のテキストの態様を変更する。より具体的には、制御部10は、検証結果として得られたアテンション情報に応じてテキストの態様を変更する。
【0032】
図6を用いて、文書検証処理における処理の例を説明する。
図6(A)は、文書41のうちの1つの条42を示す。この条42には、項43を含む。
図6(B)は、項43を入力データとして文書分類器22aに適用した場合のアテンション情報45の例を示す。
図6(B)に示すアテンション情報45は、項43のうちの一部を抜粋したものである。アテンション情報45は、テキスト(word)と寄与度を示す重み(weight)とが対応付けられている。
図6(B)に示すアテンション情報45では、重みの数値に応じて、重みの色が異なる。
【0033】
ここで、アテンション情報45は、この例の場合には、文書が不正解文書であると判断した際に着目したテキストについて、着目度合いを、寄与度を示す重みにより示している。
図6(C)は、
図6(B)に示すアテンション情報45に応じてテキストの態様を変更した変更後の条47の例を示す。
図6(C)に示す条47は、
図6(B)に示すアテンション情報の寄与度が大きいほど、強調度合いが大きくなるように、テキストに付す網掛けの色が濃く示されている。
【0034】
図4のS38において、制御部10(変更文書出力部16)は、検証用画面60の文書を、変更後の文書に更新する。この処理によって、検証用画面60(
図5参照)の文書領域61に出力される文書は、
図6(C)に例示する条47のように、アテンション情報の寄与度に応じた強調態様がされたものになる。
よって、ユーザは、まず、検証用画面60の結果出力領域64を見ることで、文書41の検証結果を確認できる。また、文書41の検証結果がNGである場合、つまり、修正すべき文書であるとの判断がされた場合に、制御部10は、その文書41のうち修正すべき箇所を直感的に分かりやすく明示するので、ユーザは、どの部分を修正するべきであるかの確認を容易に行うことができる。
その後、制御部10は、本処理を終了する。
【0035】
このように、本実施形態によれば、文書検証サーバ1は、以下のような効果がある。
(1)検証対象の文書を受け付けると、文書分類器22aに文書を入力して文書の内容に関する検証を行う。そして、文書分類器22aが出力する正解文書又は不正解文書のいずれかに分類した根拠になるテキストを寄与度として表すアテンション情報を用いて、根拠になるテキストの態様を変更して出力する。
よって、文書において正解文書又は不正解文書のいずれかに分類した根拠が、テキストの態様の変化として明示されるため、文書のうち分類した根拠となる箇所を確認しやすくできる。
【0036】
(2)文書分類器22aが出力する分類が不正解文書である場合に、アテンション情報を用いて、根拠になるテキストの態様を変更して出力する。
よって、不正解文書と分類した場合に根拠が明示されるため、文書のうち修正するべき箇所を確認しやすくできる。
(3)文書分類器22aが出力するアテンション情報が有する分類結果のテキストごとの寄与度に応じてテキストの態様を変更して出力する。
よって、正解文書又は不正解文書に分類した際に着目したテキストの寄与度を、視覚的に表すことができる。
【0037】
(4)文書分類器22aが学習する文書を契約書の文書とするので、契約書を検証することができる。
(5)文書分類器22aが学習する文書を、条や項の単位にするので、契約書の検証を、条や項の単位で行うことができる。
(6)文書分類器22aが学習する文書を、契約書の種別に応じたものにするので、契約書の種別により当該種別に適した契約書の検証を行うことができる。
【0038】
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されるものではない。また、実施形態に記載した効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、実施形態に記載したものに限定されない。なお、上述した実施形態及び後述する変形形態は、適宜組み合わせて用いることもできるが、詳細な説明は省略する。
【0039】
(変形形態)
(1)本実施形態では、文書検証サーバが文書分類器を生成するものを例に説明したが、これに限定されない。例えば、図示しない他の装置において、文書分類器を生成し、生成済の文書分類器を、文書検証サーバの記憶部に記憶してもよい。
また、文書検証サーバが文書分類器を有する必要はなく、例えば、他の装置に対して通信接続されている状態において、他の装置にある文書分類器に対して文書データを送信し、検証結果を受信するようにしてもよい。
【0040】
(2)本実施形態では、不正解文書である場合に、着目したテキストの態様を変更するものを例に説明したが、これに限定されない。正解文書であっても同様に、着目したテキストの態様を変更してもよい。この場合には、修正なし文書と判断した根拠になるテキストの態様が変更される。
(3)本実施形態では、着目度合いを網掛けの濃淡により強調するものを例に説明したが、これに限定されない。下線を付したり、文字色を変えたり、文字を太字にしたり、といった様々な強調手法によって、着目度合いを表してもよい。
【0041】
(4)本実施形態では、文書検証サーバとユーザ端末とからなるシステムを例に説明したが、これに限定されない。文書検証サーバの機能を有するクライアント端末のみのスタンドアロン構成のものであってもよい。
【0042】
(5)本実施形態では、契約書の項ごとに検証するものを例に説明したが、これに限定されない。例えば、条ごとであってもよいし、契約書全体であってもよい。
また、本実施形態では、文書として契約書を例に説明したが、これに限定されない。他の文書であってもよい。その場合、検証処理は、文書全体に対して行ってもよいし、段落ごと等に対して行ってもよい。
(6)本実施形態では、契約書の種別ごとに生成した文書分類器を使用するものを例に説明したが、これに限定されない。契約書の主体ごとに生成した文書分類器を使用してもよい。契約書の主体とは、例えば、契約書を作成する側と、契約に従う側といった立場の違いをいう。
【符号の説明】
【0043】
1 文書検証サーバ
5 ユーザ端末
10 制御部
11 文書検証処理部
12 文書受付部
13 文書適用部
14 推定結果取得部
15 テキスト態様変更部
16 変更文書出力部
18 分類器生成部
20 記憶部
21a 文書検証プログラム
21b 分類器生成プログラム
22a 文書分類器
60 検証用画面
100 文書検証システム