(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022176511
(43)【公開日】2022-11-30
(54)【発明の名称】文書処理プログラム、情報処理装置及び文書処理方法
(51)【国際特許分類】
G06Q 10/10 20120101AFI20221122BHJP
【FI】
G06Q10/10
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2021082985
(22)【出願日】2021-05-17
(71)【出願人】
【識別番号】717005132
【氏名又は名称】株式会社LegalForce
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】岩本 恵太
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049AA11
(57)【要約】
【課題】構造化されていない表を含む場合であっても文書情報から情報を抽出して抽出箇所を提示する文書処理プログラム、情報処理装置及び文書処理方法を提供する。
【解決手段】文書処理サーバ装置1は、文書情報111内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報113として抽出する表情報抽出手段101と、当該表情報113中の情報を参照するための参照情報114を生成する参照情報生成手段102と、文書情報111に含まれるテキスト部分及び表部分から少なくとも表部分中の情報を、予め定めた条件に基づいて、参照情報114を用いて抽出する情報抽出手段103として機能させる。
【選択図】
図2
【特許請求の範囲】
【請求項1】
コンピュータにより実行されることにより、
文書情報内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報として抽出し、
当該表情報中の情報を参照するための参照情報を生成し、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分中の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出する、
ように前記コンピュータを機能させるための文書処理プログラム。
【請求項2】
前記表情報を抽出する方法は、予め定めた条件に基づいて前記表部分に含まれる情報を参照し、前記表部分の構造を認識する請求項1に記載の文書処理プログラム。
【請求項3】
前記情報抽出手段が抽出した情報を、予め定めたレビュー条件に基づいてレビューするようにさらに機能させる請求項1又は2に記載の文書処理プログラム。
【請求項4】
前記文書情報の前記表は予め構造化されていない請求項1から3のいずれか1項に記載の文書処理プログラム。
【請求項5】
文書情報内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報として抽出する表情報抽出手段と、
当該表情報中の情報を参照するための参照情報を生成する参照情報生成手段と、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出する情報抽出手段として機能させる情報処理装置。
【請求項6】
所定の指示命令に加えて、文書情報を記憶するように構成されたメモリと、
前記メモリに記憶された指示命令に基づいて、
前記メモリに記憶された文書情報内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報として抽出し、
当該表情報中の情報を参照するための参照情報を生成し、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分中の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出する、
ための処理を実行するように構成されたプロセッサと、
を含む情報処理装置。
【請求項7】
文書情報内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報として抽出するステップと、
当該表情報中の情報を参照するための参照情報を生成するステップと、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分中の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出するステップとを有する文書処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、文書処理プログラム、情報処理装置及び文書処理方法に関する。
【背景技術】
【0002】
従来の技術として、紙文書のイメージデータから、あらかじめ決められた規則性に基づいて項目名とそれに対応する文字データを抽出する情報処理装置が提案されている(例えば、特許文献1参照)。
【0003】
特許文献1に開示された情報処理装置は、文書等に記載された表の縦罫の長さや、各枠の横幅、面積等を計算しこれらを比較して、項目枠が縦罫の右側であるとか、幅が狭く面積も小さいといった規則性に基づき、項目枠を抽出し、該項目枠内の文字パターンに認識処理を実施することで項目名を取得する。さらに、項目枠の右側または下側よりデータ枠を抽出することで、項目名とデータとの対応付けを行う。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、上記した特許文献1に開示された情報処理装置によると、データ枠に文字が記入されていても表の中から項目枠とデータ枠とを区別し、表データを読み取るものの、表画像と表データとの対応を行うものではなく、また、表データから特定の情報を抽出するものでもないため、文書の内容に応じた種類の情報が記載されている表画像上の位置又は範囲を示すことができない、という問題がある。
【0006】
本開示の目的は、上記従来技術を踏まえ、より使い勝手のよい文書処理プログラム、情報処理装置及び文書処理方法を提供することにある。
【課題を解決するための手段】
【0007】
本開示に係る発明の一態様は、上記目的を達成するため、以下の文書処理プログラム、情報処理装置及び文書処理方法を提供する。
【0008】
[1]コンピュータにより実行されることにより、
文書情報内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報として抽出し、
当該表情報中の情報を参照するための参照情報を生成し、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分中の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出する、ように前記コンピュータを機能させるための文書処理プログラム。
[2]文書情報内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報として抽出する表情報抽出手段と、
当該表情報中の情報を参照するための参照情報を生成する参照情報生成手段と、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分中の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出する情報抽出手段として機能させる情報処理装置。
[3]所定の指示命令に加えて、文書情報を記憶するように構成されたメモリと、
前記メモリに記憶された指示命令に基づいて、
前記メモリに記憶された文書情報内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報として抽出し、
当該表情報中の情報を参照するための参照情報を生成し、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分中の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出する、
ための処理を実行するように構成されたプロセッサと、
を含む情報処理装置。
[4]文書情報内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報として抽出するステップと、
当該表情報中の情報を参照するための参照情報を生成するステップと、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分中の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出するステップとを有する文書処理方法。
【発明の効果】
【0009】
本開示の様々な実施形態によれば、より使い勝手のよい文書処理プログラム、情報処理装置及び文書処理方法を提供することが可能となる。
【図面の簡単な説明】
【0010】
【
図1】
図1は、実施の形態に係る文書処理システムの構成の一例を示す概略図である。
【
図2】
図2は、実施の形態に係る文書処理サーバ装置の構成例を示すブロック図である。
【
図3】
図3は、文書情報の構成例を示す概略図である。
【
図4】
図4は、表抽出条件の構成例を示す概略図である。
【
図5】
図5は、表情報の構成例を示す概略図である。
【
図6】
図6(a)~(c)は、表情報抽出動作における文書情報の処理の一例を説明するための概略図である。
【
図7】
図7(a)~(f)は、表情報抽出動作における文書情報の処理の他の例を説明するための概略図である。
【
図8】
図8は、表情報抽出動作の結果、表示制御手段により端末の表示部に表示される画面の構成例を示す概略図である。
【
図9】
図9は、契約書レビュー動作において、表示制御手段により端末の表示部に表示される画面の構成例を示す概略図である。
【
図10】
図10は、契約書レビュー動作において、表示制御手段により端末の表示部に表示される画面の構成例を示す概略図である。
【
図11】
図11は、契約書レビュー動作において、表示制御手段により端末の表示部に表示される画面の構成例を示す概略図である。
【
図12】
図12は、契約書レビュー動作において、表示制御手段により端末の表示部に表示される画面の構成例を示す概略図である。
【
図13】
図13は、文書処理サーバ装置の検査動作を示すフローチャートである。
【発明を実施するための形態】
【0011】
[実施の形態]
(文書処理システムの構成)
図1は、実施の形態に係る文書処理システムの構成の一例を示す概略図である。
【0012】
この文書処理システム5は、文書処理サーバ装置1と、端末2と、端末3とをネットワーク4によって互いに通信可能に接続することで構成される。端末2は、例えば、文書作成、文書内容確認及び/又は文書レビューを希望する利用者によって操作され、端末3は文書作成、文書内容確認及び/又は文書レビューを希望する他の利用者によって操作されるが、これに限られるものではない。端末2の利用者と、端末3の利用者とは文書情報として、例えば、契約書を互いに合意できる内容になるまで、利用者間で修正とその承認を繰り返すものであり、主に、一方の利用者が作成した文書情報に記載された内容を把握するために文書処理システム5を利用する。または、一方の利用者の作成した文書情報に記載された内容をレビューしてもらうために文書処理システム5を利用してもよいし、任意の2つの文書情報を対比する際にも文書処理システム5を利用してもよい。
【0013】
文書処理サーバ装置1は、サーバ型の情報処理装置であり、端末2及び端末3の要求に応じて動作するものであって、本体内に情報を処理するための機能を有するCPU(Central Processing Unit)やHDD(Hard Disk Drive)、フラッシュメモリ等の電子部品を備える。なお、文書処理サーバ装置1は、必ずしも単体の情報処理装置で構成される必要はなく、複数の情報処理装置が協働して動作するものであってもよいし、任意のクラウドサービスによって動作するものであってもよい。また、文書処理サーバ装置1の機能を端末2及び/又は端末3内で実現するものであってもよい
【0014】
端末2及び端末3は、PC(Personal Computer)やタブレット端末等の情報処理装置であって、本体内に情報を処理するための機能を有するCPUやフラッシュメモリ等の電子部品を備える。
【0015】
ネットワーク4は、高速通信が可能な通信ネットワークであり、例えば、インターネット、イントラネットやLAN(Local Area Network)等の有線又は無線の通信網である。
【0016】
上記構成において、一例として、文書処理サーバ装置1が処理する文書は契約書等の法律分野の文書であり、利用者の一方又は双方は法律の専門家ではないが契約書の作成を必要とする人物、又は弁護士等の法律の専門家であって契約書の作成の知識を有する人物である。また、例えば、一方又は双方の利用者は社内の営業部の社員、又は社内法務部の社員である。
【0017】
端末2又は端末3から文書情報を文書処理サーバ装置1にアップロードした後、契約書を作成する際に利用者の作業負担を減らすべく、又は利用者単独での契約書の作成を支援するべく、文書処理サーバ装置1は、文書情報から契約書に重要な項目の抽出を行い、またさらに抽出した項目を利用して契約書のレビューを行う。また、さらに端末2又は端末3から文書処理サーバ装置1を介して又はメール等の他の手段を用いて端末3又は端末2へ依頼要求を送信することで契約書のレビューを依頼し、端末2及び端末3から文書処理サーバ装置1上の文書情報を編集することで、双方の利用者の意見とレビュー結果を反映した契約書を作成する等の作業を行うことができるように構成されているものであってもよい。
【0018】
本実施の形態では特に、文書処理サーバ装置1は、表を含む文書情報の表部分及び本文部分からそれぞれ重要な項目の抽出を行い、またさらに抽出した項目を利用して契約書のレビューを行う。実施の形態を以下で説明する。
【0019】
また、端末2及び端末3はそれぞれ単数を図示しているが、複数台がネットワーク4に接続されるものであってもよく、同様にこれらを操作する利用者は複数人であってもよい。
【0020】
(文書処理サーバ装置の構成)
図2は、実施の形態に係る文書処理サーバ装置1の構成例を示すブロック図である。
【0021】
文書処理サーバ装置1は、CPU等から構成され、各部を制御するとともに、各種のプログラムを実行する制御部10と、フラッシュメモリ等の記憶媒体から構成され情報を記憶する記憶部11と、ネットワーク4を介して外部と通信するための通信インターフェイスとして機能する通信部12とを備える。
【0022】
制御部10は、CPU等のプロセッサから構成され、メモリから構成される記憶部11及び通信インターフェイスとして機能する通信部12に電気的に接続される。当該制御部10は、後述する文書処理プログラム110を実行することで、契約書受付手段100、表情報抽出手段101、参照情報生成手段102、情報抽出手段103、契約書レビュー手段104及び表示制御手段105等として機能する。
【0023】
契約書受付手段100は、端末2又は端末3から契約書を文書情報111として受け付けて記憶部11に格納する。なお、以降の説明において契約書受付手段100が受け付ける文書情報111は、表を含む契約書等の文書情報であって、少なくとも表部分は行や列等の情報の配置、並びを定義する構造上の情報を有しないものを前提とするが、予め構造上の情報が付与されたものを受け付けてもよい。
【0024】
表情報抽出手段101は、文書情報111の表部分から表抽出条件情報112に基づいて表の構成に応じて情報を抽出し、抽出した情報を構造化して表情報113として記憶部11に格納する。
【0025】
参照情報生成手段102は、構造化された表情報113上の情報を文書情報111上にて参照する場合に用いられる参照情報114を生成して記憶部11に格納する。
【0026】
情報抽出手段103は、文書情報111の表部分及び表部分以外のテキスト部分から、契約書にとって重要な情報(記載すべき情報、記載すべきでない情報、記載したほうがよい情報等)を定めたレビュー条件情報116に基づいて抽出して抽出情報115として記憶部11に格納する。また、情報抽出手段103は、抽出した情報を予め定めた方法で修正して記載を統一するものであってもよい。
【0027】
契約書レビュー手段104は、レビュー条件情報116に基づいて抽出情報115の内容をレビューしてレビュー結果情報117を生成し、記憶部11に格納する。
【0028】
表示制御手段105は、記憶部11の文書情報111、表情報113、抽出情報115並びに各手段100‐104の出力結果を予め定めた方法で端末2及び端末3の表示部に表示制御する。なお、表示方法の詳細は後述する。
【0029】
記憶部11は、フラッシュメモリ等のメモリから構成され、プロセッサ等から構成される制御部10及通信インターフェイスとして機能する通信部12に電気的に接続される。当該記憶部11は、制御部10を上述した各手段100‐105として動作させる文書処理プログラム110、文書情報111、表抽出条件情報112、表情報113、参照情報114、抽出情報115、レビュー条件情報116及びレビュー結果情報117等を記憶する。
【0030】
図3は、文書情報111の構成例を示す概略図である。
【0031】
文書情報111は、一例として、契約書であり、契約書のタイトル111a1と、序文111a2と、契約要項をまとめた表部分111a3と、これらに続く条項112a4…とを有する。
【0032】
図4は、表抽出条件情報112の構成例を示す概略図である。
【0033】
表抽出条件情報112は、表情報を抽出するための条件を定めた情報であり、条件を識別するための条件IDと、条件の内容を示す条件と、条件を満たした場合の動作を示す結果とを有する。例えば、条件ID「001」に示すように、表の構成として、表の左端の同一列の項目は構造の同一階層の項目とすることで、
図3の表部分111a
3の左端同一列の項目「建物の表示」、「賃貸借の目的物」、「賃貸借条件」が項目名となる。また、条件ID「002」に示すように、表の構成として、同一列の複数項目が左列の一項目の枠に属する場合は左列一項目の項目名の従属項目とすることで、
図3の表部分111a
3の左から2番目の同一列の項目、例えば、「目的物の位置及び範囲」、「目的物の床面積(壁心計算)」が項目名の「賃貸借の目的物」の従属項目となる。条件ID「003」に示すように、表の構成として、項目名が「委託者」、「受託者」である場合は構造の同一階層の項目名とする。
【0034】
【0035】
表情報113aは、一例として、
図5に示すような構造を有し、表中の項目名、従属項目名、記述内容を有する。
図4で説明したように、「建物の表示」、「賃貸借の目的物」、「賃貸借条件」が構造の項目名となり、これら各項目の従属項目名と、さらに各従属項目名の記述内容とを有する。なお、表情報113aは、項目名、従属項目名、記述内容に限らず、表の構造に合わせた構造名を有するようにする。
【0036】
(文書処理システムの動作)
次に、実施の形態の作用を、(1)基本動作、(2)表情報抽出動作、(3)契約書レビュー動作に分けて説明する。以降、端末2を操作対象として動作を説明するが、端末3に置き換えた場合も同様の動作となる場合は説明を省略する。
【0037】
(1)基本動作
まず、利用者は、文書処理サーバ装置1の提供するサービスへログインを行うため端末2を操作する。端末2は、利用者から利用者ID及びパスワード等の情報の入力を受け付けると、当該情報とともに認証要求を文書処理サーバ装置1に送信する。
【0038】
文書処理サーバ装置1は、端末2から利用者ID及びパスワード等の情報とともに認証要求を受信すると、予め登録された利用者ID及びパスワード等を含む図示しない利用者情報を参照し、利用者としての依頼者の認証を行う。
【0039】
次に、利用者は、サービスへのログインが完了すると、契約書の文書情報を文書処理サーバ装置1へアップロードするため端末2を操作する。端末2は、当該文書情報を文書処理サーバ装置1へアップロードする。
【0040】
文書処理サーバ装置1は、依頼者の操作する端末2から文書情報111を受け付けて記憶部11に格納する。
【0041】
文書処理サーバ装置1は、端末2から文書情報を受け付けると(
図13、S1)、以下に示す表情報抽出動作を開始する。なお、文書処理サーバ装置1は、契約書の種類と契約書の立場とともに比較要求を受け付けてもよく、当該契約書の種類と契約書の立場に基づいて抽出する情報を変更し、後述する「(3)契約書レビュー動作」においてレビュー内容を変更する。
【0042】
(2)表情報抽出動作
図13は、文書処理サーバ装置1の検査動作を示すフローチャートである。
【0043】
まず、表情報抽出手段101は、
図3に示すように、文書情報111の表部分111a
3部分から情報を抽出し、表抽出条件情報112に基づいて抽出した情報を構造化して表情報113として記憶部11に格納する(S2)。
【0044】
表情報抽出手段101が文書情報111から表部分111a3を認識する方法としては、例えば、罫線等から表中の項目の配置を認識する方法、及び表部分111a3中のテキストを認識する方法としてはOCR(Optical Character Recognition)等の技術が挙げられるが、これに限られるものではない。
【0045】
また、表情報抽出手段101が抽出した表部分111a
3の構造及びテキストの内容を表情報113に構造化する方法は、
図4において説明したものであって、表抽出条件情報112の条件に合致する項目について結果で指示された内容で行う。なお、表情報抽出手段101は、表情報113の構造の各項目名、従属項目名、記述内容に対して表部分111a
3中の該当するテキストの位置情報(座標等)及び範囲情報(幅及び高さ等)を関連付けて記憶する。
【0046】
次に、参照情報生成手段102は、構造化された表情報113上の情報を文書情報111上にて参照する場合に用いられる参照情報114を生成して記憶部11に格納する(S3)。
【0047】
図6(a)~(c)は、表情報抽出動作における文書情報111の処理の一例を説明するための概略図である。
【0048】
図6(a)は、参照情報114の一例を示す参照情報114aであり、「契約期間」を有する表中のセルを参照することを示すものである。
【0049】
参照情報114aにより、次に説明する情報抽出手段103は、
図6(b)に示すように、表情報113aの構造中の「契約期間」に該当するノードを特定し、当該ノードに関連付けられた位置情報及び範囲情報から、
図6(c)に示すように、表部分111a
3中の位置及び範囲115a
2を特定する。
【0050】
次に、情報抽出手段103は、文書情報111の表部分及び表部分以外のテキスト部分から、レビュー条件情報116に基づいて、契約書にとって重要な情報(記載すべき情報、記載すべきでない情報、記載したほうがよい情報等)を抽出して抽出情報115として記憶部11に格納する(S4)。表部分からの抽出は、上述したように契約書の種類と立場に基づいて定められた単数又は複数の語句からそれぞれ参照情報114を生成して行う。また、テキスト部分からの抽出は、契約書の種類と立場に基づいて定められた単数又は複数の語句をテキスト部分から抽出する。なお、上記した「抽出」には記載された内容を抽出する場合だけでなく、記載されていないことを検知することも含むものとする。また、情報抽出手段103は、抽出した情報を予め定めた方法で修正して記載を統一するものであってもよい。例えば、表情報113aにおいて「契約期間」は、「平成30年1月1日から令和3年12月31日までの4年間」であるが、抽出情報115としては、「締結日」が「平成30年1月1日」、「終了日」が「令和3年12月31日」、「有効期限」が「4年間」と修正して抽出する。また、日付を西暦に統一する等してもよい。
【0051】
次に、利用者は、アップロードした文書情報から抽出された情報を確認したい文書情報を選択するため端末2を操作する。端末2は、文書処理サーバ装置1へ文書情報の選択要求を送信する。
【0052】
文書処理サーバ装置1の表示制御手段105は、文書情報の選択要求を受信し、文書情報選択のための画面を端末2の表示部に表示処理する(図示せず。)。
【0053】
利用者は、上記した文書情報選択のための画面を参照しつつ、文書情報を選択し、抽出情報とともに文書情報の表示を要求する。端末2は、選択した文書情報の識別子とともに表示要求を文書処理サーバ装置1に送信する。
【0054】
文書処理サーバ装置1の表示制御手段105は、端末2から表示要求を受け付けて文書情報111、表情報113、参照情報114及び抽出情報115に基づいて、例えば以下の
図8に示すように、端末2の表示部に画面を表示制御する。
【0055】
図8は、表情報抽出動作の結果、表示制御手段105により端末2又は3の表示部に表示される画面の構成例を示す概略図である。
【0056】
画面104eは、文書情報111の内容を表示する表示欄104e1と、抽出情報115の内容を表示する表示欄104e2とを有する。表示欄104e2には抽出情報115の内容が表示され、具体的には、タイトルとして「定期建物賃貸借契約書」、締結日として「平成30年1月1日」、終了日として「令和3年12月31日」、有効期限として「4年間」のように表示され、利用者によって選択された項目が他の項目と表示差をつけることで選択表示104e21となる。また、選択表示104e21となった項目に対応する文書情報111中の位置及び範囲が、参照情報114によって参照されて、強調表示104e11となる。
【0057】
利用者は、上記した抽出情報115を参照するための画面104eを参照し、抽出情報115の内容から契約の詳細と、当該詳細が記載された契約書上の位置及び範囲を確認する。
【0058】
また、ここまで項目名が列に並んでいる表について説明してきたが、表の変形例として、項目名が行と列に設けられ、項目名の組み合わせによって項目の内容が定まる表の場合について以下説明する。
【0059】
図7(a)~(f)は、表情報抽出動作における文書情報111の処理の他の例を説明するための概略図である。
【0060】
図7(a)に示すように、表部分111bは、例えば、「A社」の「期間」が「○○~○○」といったように、項目の内容が行と列の項目名の組み合わせによって定まる表である。
【0061】
また、
図7(b)は、表部分111bから抽出された表情報113bであり、一例として、行及び列にそれぞれ項目名を有する構造であって、表部分111bの第1行の「項目」、「A社」、「B社」が行項目名となり、これに対応して列項目名1が「期間」、「○○~○○」、「●●~●●」、列項目名2が「値段」、「100円」、「999円」という構造を有する。
【0062】
図7(c)は、参照情報114の一例を示す参照情報114bであり、「値段」と「B社」により特定される表中のセルを参照することを示すものである。
【0063】
参照情報114bにより、情報抽出手段103は、
図7(d)に示すように、表情報113bの構造中の列項目名2「値段」と行項目名「B社」に該当するノード115b
1を特定し、当該ノード115b
1に関連付けられたセル(位置情報及び範囲情報)から、
図7(e)に示すように、表部分111b中のセル115b
2を特定し、
図7(f)に示すように、抽出結果115b
3として「999円」を得る。
【0064】
(3)契約書レビュー動作
次に、利用者は、アップロードした文書情報から抽出された情報に基づいてレビューを要求したい文書情報を選択するため端末2を操作する。端末2は、文書処理サーバ装置1へ文書情報の選択要求を送信する。
【0065】
文書処理サーバ装置1の表示制御手段105は、文書情報の選択要求を受信し、文書情報選択のための画面を端末2の表示部に表示処理する(図示せず。)。
【0066】
利用者は、上記した文書情報選択のための画面を参照しつつ、文書情報を選択し、文書情報のレビュー結果の表示を要求する。端末2は、選択した文書情報の識別子とともに表示要求を文書処理サーバ装置1に送信する。
【0067】
文書処理サーバ装置1の契約書レビュー手段104は、端末2から表示要求を受け付けて、選択された文書情報について、レビュー条件情報116に基づいて抽出情報115の内容をレビューして、レビュー結果情報117を生成し、記憶部11に格納する(S5)。なお、契約書レビュー手段104は、レビュー条件情報116のうち、契約書の類型、作成者の立場等に応じて使用する条件を選択してレビューを行う。
【0068】
次に、表示制御手段105は、文書情報111、表情報113、参照情報114、抽出情報115及びレビュー結果情報117に基づいて、例えば以下の
図9に示すように、端末2の表示部に画面を表示制御する。
【0069】
図9は、契約書レビュー動作において、表示制御手段105により端末2又は3の表示部に表示される画面の構成例を示す概略図である。
【0070】
画面104aは、文書情報111の内容を表示する表示欄104a1と、レビュー結果情報117の内容を表示する表示欄104a2とを有する。表示欄104a2には、文書情報111の表部分の抽出項目に対してレビューされたレビュー結果情報117の内容がそれぞれ表示ボックス104a21、104a22、104a23に示され、具体的には、表示ボックス104a21であれば、指摘内容「委託料が税込みか税別か、が定められていません」、修正方針「税込・税別の区別、を追加」、修正文例「(代金)(1)消費税別とする場合 委託者は、受託者に対し、本業務の対価として金●●円及び…」のように表示される。また、表示ボックス104a21、104a22、104a23に対応する文書情報111中の位置及び範囲104a11、104a12、104a13が、参照情報114に基づいて強調表示されて参照される。また、表示ボックス104a21、104a22、104a23にさらに修正内容の解説を表示してもよい。
【0071】
利用者は、上記したレビュー結果情報117を参照するための画面104aを参照し、レビュー結果情報117の内容から契約の問題点と、当該問題点に関連するキーワード又は文が記載された契約書上の位置及び範囲を確認し、必要に応じて編集を行う。
【0072】
レビュー結果情報117は、契約書中の表部分とテキスト部分との対応や、契約書の類型、作成者の立場等によってレビューの内容が変わるため、以降その他の例について説明する。なお、
図9は、表部分のみから情報が抽出された場合を示し、
図10は、表部分及びテキスト部分から情報が抽出された場合を示している。また、
図9、
図10は、複数の立場において共通のレビューがなされ、
図11、
図12において立場に応じたレビューがなされている。
【0073】
図10は、契約書レビュー動作において、表示制御手段105により端末2又は3の表示部に表示される画面の構成例を示す概略図である。
【0074】
画面104bは、文書情報111の内容を表示する表示欄104b1と、レビュー結果情報117の内容を表示する表示欄104b2とを有する。表示欄104b2には、文書情報111の表部分の抽出項目に対してレビューされたレビュー結果情報117の内容がそれぞれ表示ボックス104b21、104b22に、テキスト部分の抽出項目に対してレビューされたレビュー結果情報117の内容が表示ボックス104b23に示される。また、表示ボックス104b21、104b22、104b23に対応する文書情報111中の位置及び範囲104b11、104b12、104b13が、参照情報114に基づいて強調表示されて参照される。
【0075】
なお、例えば、表示ボックス104b21では、指摘内容「賃料の支払期日、が定められていません」、修正方針「上記を追加」、修正文例「(賃料)1.賃料は月額金●●円とし、賃借人は、賃貸人に対し、毎月●●日までに…」のように表示されており、レビュー結果情報117において、当該指摘内容に関わる「賃料の支払期日」が表部分以外のテキスト部分に定められているか否かについても考慮して指摘がなされる。また、表示ボックス104b21、104b22、104b23にさらに修正内容の解説を表示してもよい。
【0076】
図11は、契約書レビュー動作において、表示制御手段105により端末2又は3の表示部に表示される画面の構成例を示す概略図である。
【0077】
画面104cは、文書情報111の内容を表示する表示欄104c1と、レビュー結果情報117の内容を表示する表示欄104c2とを有する。表示欄104c2には、文書情報111の表部分の抽出項目に対してレビューされたレビュー結果情報117の内容がそれぞれ表示ボックス104c21、104c22、104c23に、テキスト部分の抽出項目に対してレビューされたレビュー結果情報117の内容が表示ボックス104c24に示される。また、表示ボックス104c21、104c22、104c23、104c24に対応する文書情報111中の位置及び範囲104c11、104c12、104c13、104c14が、参照情報114に基づいて強調表示されて参照される。
【0078】
なお、例えば、表示ボックス104c21では、指摘内容「履行割合に応じた委託料の金額、が定められていません」、修正方針「上記を追加」、修正文例「(代金)1.委託者は、受託者に対し、本業務の対価として●●円(税込)を、20●●年●月●日までに、…」のように受託者の立場で表示されており、レビュー結果情報117において、当該指摘内容に関わる「委託料の金」が表部分以外のテキスト部分に定められているか否かについても考慮して指摘がなされる。また、表示ボックス104c21、104c22、104c23にさらに修正内容の解説を表示してもよい。
【0079】
図12は、契約書レビュー動作において、表示制御手段105により端末2又は3の表示部に表示される画面の構成例を示す概略図である。
【0080】
画面104dは、文書情報111の内容を表示する表示欄104d1と、レビュー結果情報117の内容を表示する表示欄104d2とを有する。表示欄104d2には、文書情報111の表部分の抽出項目に対してレビューされたレビュー結果情報117の内容がそれぞれ表示ボックス104d21、104d22に、テキスト部分の抽出項目に対してレビューされたレビュー結果情報117の内容が表示ボックス104d23に示される。また、表示ボックス104d21、104d22、104d23に対応する文書情報111中の位置及び範囲104d11、104d12、104d13が、参照情報114に基づいて強調表示されて参照される。
【0081】
なお、例えば、表示ボックス104d21では、指摘内容「委託業務に付随する業務も、業務内容に含まれる旨が、定められていません」、修正方針「業務内容に、「具体的な委託業務に付随する一切の業務」を追加」、修正文例「(委託内容)委託者は、受託者に対し、以下の業務(以下「本業務」という。)を委託し、…」のように委託者の立場で表示されており、レビュー結果情報117において、当該指摘内容に関わる「委託業務に付随する業務」が表部分以外のテキスト部分に定められているか否かについても考慮して指摘がなされる。また、表示ボックス104d21、104d22、104d23にさらに修正内容の解説を表示してもよい。
【0082】
(実施の形態の効果)
上記した実施の形態によれば、文書情報111に表を含む場合に、表抽出条件情報112に基づいて当該表を構造化して表情報113として抽出するとともに、当該表情報113中の情報と対応する文書情報111中の位置を対応付けて、これらの情報を参照するための参照情報114を生成するようにしたため、構造化されていない表を含む場合であっても文書情報111から抽出情報115を抽出して抽出箇所を提示することができる
【0083】
また、さらに文書情報111の表部分及びテキスト部分から情報を抽出して抽出情報115を生成し、抽出情報115を対象として契約書レビュー手段104によってレビューを行うようにしたため、テキスト部分に限らず表部分も含めて契約書をレビューすることができる。
【0084】
[他の実施の形態]
なお、本発明は、上記実施の形態に限定されず、本発明の趣旨を逸脱しない範囲で種々な変形が可能である。
【0085】
例えば、文書情報111は契約書に限らず、構成要素で分割できるものであれば、法律そのものの文書や取り扱い説明書等であってよいし、同様に本発明を適用可能である。また、構成要素は、条文、項、号に限らず、単語や文字・記号であってもよいし、段落、文章であってもよい。
【0086】
上記実施の形態では制御部10の各手段100‐105の機能をプログラムで実現したが、各手段の全て又は一部をASIC等のハードウエアによって実現してもよい。また、上記実施の形態で用いたプログラムをCD‐ROM等の記録媒体に記憶して提供することもできる。また、上記実施の形態で説明した上記ステップの入れ替え、削除、追加等は本発明の要旨を変更しない範囲内で可能である。
【符号の説明】
【0087】
1 :文書処理サーバ装置
2、3 :端末
4 :ネットワーク
5 :文書処理システム
10 :制御部
11 :記憶部
12 :通信部
100 :契約書受付手段
101 :表情報抽出手段
102 :参照情報生成手段
103 :情報抽出手段
104 :契約書レビュー手段
105 :表示制御手段
110 :文書処理プログラム
111 :文書情報
112 :表抽出条件情報
113 :表情報
114 :参照情報
115 :抽出情報
116 :レビュー条件情報
117 :レビュー結果情報