(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022175298
(43)【公開日】2022-11-25
(54)【発明の名称】文書処理プログラム、情報処理装置及び文書処理方法
(51)【国際特許分類】
G06F 40/205 20200101AFI20221117BHJP
G06Q 50/18 20120101ALI20221117BHJP
【FI】
G06F40/205
G06Q50/18
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2021081583
(22)【出願日】2021-05-13
【新規性喪失の例外の表示】新規性喪失の例外適用申請有り
(71)【出願人】
【識別番号】717005132
【氏名又は名称】株式会社LegalForce
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】奥村 友宏
(72)【発明者】
【氏名】乾 瑛美子
(72)【発明者】
【氏名】椎木 亮成
【テーマコード(参考)】
5B091
5L049
【Fターム(参考)】
5B091AA15
5B091CA01
5L049CC32
(57)【要約】
【課題】文書間の関係性を、文書の言語に応じて予め定めた単位の関係で表示する文書処理プログラム、情報処理装置及び文書処理方法を提供する。
【解決手段】情報処理装置1は、第1の文書情報及び第2の文書情報の言語に基づいて分割単位を決定し、決定した分割単位で分割する契約書分割手段101と、第1の文書情報に含まれる単数又は複数の単位と、第2の文書情報に含まれる単数又は複数の単位との関連度を算出する関連度算出手段102と、関連度に基づいて第1の文書情報、第2の文書情報に含まれる単数又は複数の単位とを互いに紐付ける単位紐付手段103と、それぞれ紐付けられた第1の文書情報、第2の文書情報に含まれる単位とを対応付けて出力する出力制御手段104とを有する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
コンピュータにより実行されることにより、
第1の文書情報及び第2の文書情報の言語に基づいて分割単位を決定し、当該第1の文書情報と、当該第2の文書情報を決定した前記分割単位で分割し、
前記第1の文書情報に含まれる単数又は複数の単位と、前記第2の文書情報に含まれる単数又は複数の単位との関連度を算出し、
前記関連度に基づいて前記第1の文書情報に含まれる単数又は複数の単位と、前記第2の文書情報に含まれる単数又は複数の単位とを互いに紐付けし、
前記第1の文書情報に含まれる単数又は複数の単位と、当該第1の文書情報に含まれる単数又は複数の単位のそれぞれに対して紐付けられた前記第2の文書情報に含まれる単位とを対応付けて出力する、
ように前記コンピュータを機能させるための文書処理プログラム。
【請求項2】
前記関連度を算出する方法は、前記第1の文書情報及び前記第2の文書情報の前記言語に基づいて変更される請求項1に記載の文書処理プログラム。
【請求項3】
前記第1の文書情報の単位と、当該第1の文書情報の単位に紐付けられた第2の文書情報の単位との間に差分がある場合、当該差分に対して強調表示がされる請求項2に記載の文書処理プログラム。
【請求項4】
前記関連度の和が最大となるよう前記第1の文書情報に含まれる単数又は複数の単位と、前記第2の文書情報に含まれる単数又は複数の単位とが互いに紐付けられる請求項1―3のいずれか1項に記載の文書処理プログラム。
【請求項5】
前記コンピュータは、ネットワークを通じて通信可能に1又は複数の端末と接続される、請求項1―4のいずれか1項に記載の文書処理プログラム。
【請求項6】
前記コンピュータは、無線通信ネットワークを通じて1又は複数の端末と接続される、請求項1―5のいずれか1項に記載の文書処理プログラム。
【請求項7】
第1の文書情報及び第2の文書情報の言語に基づいて分割単位を決定し、当該第1の文書情報と、当該第2の文書情報を決定した前記分割単位で分割する分割手段と、
前記第1の文書情報に含まれる単数又は複数の単位と、前記第2の文書情報に含まれる単数又は複数の単位との関連度を算出する算出手段と、
前記関連度に基づいて前記第1の文書情報に含まれる単数又は複数の単位と、前記第2の文書情報に含まれる単数又は複数の単位とを互いに紐付ける紐付手段と、
前記第1の文書情報に含まれる単数又は複数の単位と、当該第1の文書情報に含まれる単数又は複数の単位のそれぞれに対して紐付けられた前記第2の文書情報に含まれる単位とを対応付けて出力する出力制御手段とを有する情報処理装置。
【請求項8】
所定の指示命令に加えて、第1の文書情報及び第2の文書情報を記憶するように構成されたメモリと、
前記メモリに記憶された指示命令に基づいて、
前記メモリに記憶された第1の文書情報と、前記メモリに記憶された第2の文書情報の言語に基づいて分割単位を決定し、当該第1の文書情報と、当該第2の文書情報を予め定めた単位で分割し、
前記第1の文書情報に含まれる単数又は複数の単位と、前記第2の文書情報に含まれる単数又は複数の単位との関連度を算出し、
前記関連度に基づいて前記第1の文書情報に含まれる単数又は複数の単位と、前記第2の文書情報に含まれる単数又は複数の単位とを互いに紐付けし、
前記第1の文書情報に含まれる単数又は複数の単位と、当該第1の文書情報に含まれる単数又は複数の単位のそれぞれに対して紐付けられた前記第2の文書情報に含まれる単位とを対応付けて出力する、
ための処理を実行するように構成されたプロセッサと、
を含む情報処理装置。
【請求項9】
第1の文書情報と、第2の文書情報の言語に基づいて分割単位を決定し、当該第1の文書情報と、当該第2の文書情報を予め定めた単位で分割する分割ステップと、
前記第1の文書情報に含まれる単数又は複数の単位と、前記第2の文書情報に含まれる単数又は複数の単位との関連度を算出する算出ステップと、
算出した前記関連度に基づいて前記第1の文書情報に含まれる単数又は複数の単位と、前記第2の文書情報に含まれる単数又は複数の単位とを互いに紐付ける紐付ステップと、
前記第1の文書情報に含まれる単数又は複数の単位と、当該第1の文書情報に含まれる単数又は複数の単位のそれぞれに対して紐付けられた前記第2の文書情報に含まれる単位とを対応付けて出力する表示制御ステップとを有する文書処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、文書処理プログラム、情報処理装置及び文書処理方法に関する。
【背景技術】
【0002】
従来の技術として、ドキュメント間の差分を抽出する情報処理装置が提案されている(例えば、特許文献1参照)。
【0003】
特許文献1に開示された情報処理装置は、対象とする対象ドキュメントのベクタデータと、画像処理装置に既に保存されている保存済みドキュメントのベクタデータとを比較する比較手段と、比較手段による比較の結果、異なっている場合に、対象ドキュメントのベクタデータ及び保存済みドキュメントのベクタデータをテキストデータに変換し、変換されたそれぞれのテキストデータの差分を抽出することによって、テキスト形式の差分データを生成し保存する差分データ生成手段とを備える。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、上記した特許文献1に開示された情報処理装置によると、対象ドキュメントをテキストデータに変換して、テキストデータの差分を抽出するもの、ドキュメント全体を比較するものであり、例えば、条や項といった単位間で比較するものではないため、単位の順序の入れ替えについても差分として抽出してしまい、実質的な内容の比較には適していないという問題がある。また、対象ドキュメントの言語に応じて差分抽出の方法を変更するものではないため、言語に応じた適切な比較結果を提供することができる、とは言えない。
【0006】
本開示の目的は、上記従来技術を踏まえ、より使い勝手のよい文書処理プログラム、情報処理装置及び文書処理方法を提供することにある。
【課題を解決するための手段】
【0007】
本開示に係る発明の一態様は、上記目的を達成するため、以下の文書処理プログラム、情報処理装置及び文書処理方法を提供する。
【0008】
[1]コンピュータを、
第1の文書情報及び第2の文書情報の言語に基づいて分割単位を決定し、当該第1の文書情報と、当該第2の文書情報を決定した前記分割単位で分割する分割手段と、
前記第1の文書情報に含まれる単数又は複数の単位と、前記第2の文書情報に含まれる単数又は複数の単位との関連度を算出する算出手段と、
前記関連度に基づいて前記第1の文書情報に含まれる単数又は複数の単位と、前記第2の文書情報に含まれる単数又は複数の単位とを互いに紐付ける紐付手段と、
前記第1の文書情報に含まれる単数又は複数の単位と、当該第1の文書情報に含まれる単数又は複数の単位のそれぞれに対して紐付けられた前記第2の文書情報に含まれる単位とを対応付けて出力する出力制御手段として機能させるための文書処理プログラム。
[2]第1の文書情報及び第2の文書情報の言語に基づいて分割単位を決定し、当該第1の文書情報と、当該第2の文書情報を決定した前記分割単位で分割する分割手段と、
前記第1の文書情報に含まれる単数又は複数の単位と、前記第2の文書情報に含まれる単数又は複数の単位との関連度を算出する算出手段と、
前記関連度に基づいて前記第1の文書情報に含まれる単数又は複数の単位と、前記第2の文書情報に含まれる単数又は複数の単位とを互いに紐付ける紐付手段と、
前記第1の文書情報に含まれる単数又は複数の単位と、当該第1の文書情報に含まれる単数又は複数の単位のそれぞれに対して紐付けられた前記第2の文書情報に含まれる単位とを対応付けて出力する出力制御手段とを有する情報処理装置。
[3]所定の指示命令に加えて、第1の文書情報及び第2の文書情報を記憶するように構成されたメモリと、
前記メモリに記憶された指示命令に基づいて、
前記メモリに記憶された第1の文書情報と、前記メモリに記憶された第2の文書情報の言語に基づいて分割単位を決定し、当該第1の文書情報と、当該第2の文書情報を予め定めた単位で分割し、
前記第1の文書情報に含まれる単数又は複数の単位と、前記第2の文書情報に含まれる単数又は複数の単位との関連度を算出し、
前記関連度に基づいて前記第1の文書情報に含まれる単数又は複数の単位と、前記第2の文書情報に含まれる単数又は複数の単位とを互いに紐付けし、
前記第1の文書情報に含まれる単数又は複数の単位と、当該第1の文書情報に含まれる単数又は複数の単位のそれぞれに対して紐付けられた前記第2の文書情報に含まれる単位とを対応付けて出力する、
ための処理を実行するように構成されたプロセッサと、
を含む情報処理装置。
[4]第1の文書情報と、第2の文書情報の言語に基づいて分割単位を決定し、当該第1の文書情報と、当該第2の文書情報を予め定めた単位で分割する分割ステップと、
前記第1の文書情報に含まれる単数又は複数の単位と、前記第2の文書情報に含まれる単数又は複数の単位との関連度を算出する算出ステップと、
算出した前記関連度に基づいて前記第1の文書情報に含まれる単数又は複数の単位と、前記第2の文書情報に含まれる単数又は複数の単位とを互いに紐付ける紐付ステップと、
前記第1の文書情報に含まれる単数又は複数の単位と、当該第1の文書情報に含まれる単数又は複数の単位のそれぞれに対して紐付けられた前記第2の文書情報に含まれる単位とを対応付けて出力する表示制御ステップとを有する文書処理方法。
【発明の効果】
【0009】
本開示の様々な実施形態によれば、より使い勝手のよい文書処理プログラム、情報処理装置及び文書処理方法を提供することが可能となる。
【図面の簡単な説明】
【0010】
【
図1】
図1は、実施の形態に係る文書処理システムの構成の一例を示す概略図である。
【
図2】
図2は、実施の形態に係る文書処理サーバ装置の構成例を示すブロック図である。
【
図3】
図3は、文書情報の構成例を示す概略図である。
【
図4】
図4(a)及び(b)は、文書処理動作における文書情報の処理の一例を説明するための概略図である。
【
図5】
図5(a)及び(b)は、関連度情報及び紐付情報の構成例を示す概略図である。
【
図6】
図6は、紐付情報の構成を概念的に示した概略図である。
【
図7】
図7は、出力制御手段により端末の表示部に表示される画面の構成例を示す概略図である。
【
図8】
図8は、文書処理サーバ装置の検査動作を示すフローチャートである。
【発明を実施するための形態】
【0011】
[実施の形態]
(文書処理システムの構成)
図1は、実施の形態に係る文書処理システムの構成の一例を示す概略図である。
【0012】
この文書処理システム5は、文書処理サーバ装置1と、端末2と、端末3とをネットワーク4によって互いに通信可能に接続することで構成される。端末2は、例えば、文書作成、文書内容確認及び/又は文書レビューを希望する利用者によって操作され、端末3は文書作成、文書内容確認及び/又は文書レビューを希望する他の利用者によって操作されるが、これに限られるものではない。端末2の利用者と、端末3の利用者とは文書情報として、例えば、契約書を互いに合意できる内容になるまで、利用者間で修正とその承認を繰り返すものであり、主に、一方の利用者の作成した文書情報と他方の利用者が作成(又は編集)した文書情報とを対比し、その関係性を把握するために文書処理システム5を利用する。または、一方の利用者が作成した文書情報と予め用意された雛形の文書情報とを対比し、その関係性を把握するために文書処理システム5を利用してもよいし、任意の2つの文書情報を対比する際にも文書処理システム5を利用してもよい。
【0013】
文書処理サーバ装置1は、サーバ型の情報処理装置であり、端末2及び端末3の要求に応じて動作するものであって、本体内に情報を処理するための機能を有するCPU(Central Processing Unit)やHDD(Hard Disk Drive)、フラッシュメモリ等の電子部品を備える。なお、文書処理サーバ装置1は、必ずしも単体の情報処理装置で構成される必要はなく、複数の情報処理装置が協働して動作するものであってもよいし、任意のクラウドサービスによって動作するものであってもよい。また、文書処理サーバ装置1の機能を端末2及び/又は端末3内で実現するものであってもよい
【0014】
端末2及び端末3は、PC(Personal Computer)やタブレット端末等の情報処理装置であって、本体内に情報を処理するための機能を有するCPUやフラッシュメモリ等の電子部品を備える。
【0015】
ネットワーク4は、高速通信が可能な通信ネットワークであり、例えば、インターネット、イントラネットやLAN(Local Area Network)等の有線又は無線の通信網である。
【0016】
上記構成において、一例として、文書処理サーバ装置1が処理する文書情報は契約書等の法律分野の文書であり、利用者の一方又は双方は法律の専門家ではないが契約書の作成を必要とする人物、又は弁護士等の法律の専門家であって契約書の作成の知識を有する人物である。また、例えば、一方又は双方の利用者は社内の営業部の社員、又は社内法務部の社員である。
【0017】
基本動作としては、端末2又は端末3から文書情報を文書処理サーバ装置1にアップロードした後、端末2又は端末3から文書処理サーバ装置1を介して又はメール等の他の手段を用いて端末3又は端末2へ依頼要求を送信することで契約書のレビューを依頼し、端末2及び端末3から文書処理サーバ装置1上の文書情報を編集することで、双方の利用者の意見とレビュー結果を反映した契約書を作成する等の作業を行うが、その際に利用者の作業負担を減らすべく、又は利用者単独での契約書の作成を支援するべく、文書処理サーバ装置1は、複数の文書情報間の比較を行う。
【0018】
本実施の形態では主に、文書処理サーバ装置1は、比較により複数の文書情報間の対応関係や変更点を検出し、検出した情報を一方又は双方の利用者に提示する。なお、以下において、条項のことを「条文」と言うことがある。実施の形態を以下で説明する。
【0019】
また、端末2及び端末3はそれぞれ単数を図示しているが、複数台がネットワーク4に接続されるものであってもよく、同様にこれらを操作する利用者は複数人であってもよい。
【0020】
(文書処理サーバ装置の構成)
図2は、実施の形態に係る文書処理サーバ装置1の構成例を示すブロック図である。
【0021】
文書処理サーバ装置1は、CPU等から構成され、各部を制御するとともに、各種のプログラムを実行する制御部10と、フラッシュメモリ等の記憶媒体から構成され情報を記憶する記憶部11と、ネットワーク4を介して外部と通信するための通信インターフェイスとして機能する通信部12とを備える。
【0022】
制御部10は、CPU等のプロセッサから構成され、メモリから構成される記憶部11及び通信インターフェイスとして機能する通信部12に電気的に接続される。当該制御部10は、後述する文書処理プログラム110を実行することで、契約書受付手段100、契約書分割手段101、関連度算出手段102、単位紐付手段103及び出力制御手段104等として機能する。
【0023】
契約書受付手段100は、端末2又は端末3から契約書を文書情報111として受け付けて記憶部11に格納する。なお、契約書受付手段100は、文書情報111を受け付ける際、記述言語を認識して文書情報111の付随情報として記録する。また、記述言語は、文書情報111を受け付ける際に利用者の選択によって記録するものであってもよい。以下の実施例では、日本語、英語を例に挙げて説明するが他の言語について本発明を適用してもよいし、受け付けた文書情報111の言語が日本語、英語のいずれに近いかを判断して本発明を適用するようにしてもよい。
【0024】
契約書分割手段101は、文書情報111の言語に応じて分割単位(条、項、号)を決定し、文書情報111を分割単位で分割された単位、タイトル、序文等により契約書の構成要素毎に分割し、単位情報112として記憶部11に格納する。なお、分割単位は、分割の単位が条、項、号に限定されるものでなく、意味のまとまりのある複数の条、項、号のまとまりであってもよい。また、異なる条、項に渡って意味のまとまりのある項、号であってもよいし、予め定めた条件に応じて分割しない範囲があってもよい。
【0025】
関連度算出手段102は、複数の、例えば2つの文書情報111(第1の文書情報及び第2の文書情報)間で、文書情報111に含まれる単数又は複数の単位情報112の関連度を算出して関連度情報113として記憶部11に格納する。
【0026】
単位紐付手段103は、関連度算出手段102が算出した関連度情報113に基づいて2つの文書情報111間の単位情報112をそれぞれ紐付けて紐付情報114として記憶部11に格納する。
【0027】
出力制御手段104は、記憶部11の文書情報111、単位情報112、関連度情報113及び紐付情報114並びに各手段100‐103の出力結果を予め定めた方法で端末2及び端末3の表示部に表示するよう、端末2及び端末3に出力制御する。なお、端末2及び端末3での表示方法の詳細は後述する。
【0028】
記憶部11は、フラッシュメモリ等のメモリから構成され、プロセッサ等から構成される制御部10及通信インターフェイスとして機能する通信部12に電気的に接続される。当該記憶部11は、制御部10を上述した各手段100‐104として動作させる文書処理プログラム110、文書情報111、単位情報112、関連度情報113及び紐付情報114等を記憶する。
【0029】
図3は、文書情報111の構成例を示す概略図である。
【0030】
文書情報111aは、一例として、英文の契約書であり、契約書のタイトル112a1と、序文112a2と、これらに続く複数の単位(主に条、項)112a3、112a4、112a5…とを有する。また、条単位112a4は、複数の項単位112a41、112a42、…を含むものとする。
【0031】
(文書処理システムの動作)
次に、実施の形態の作用を、(1)基本動作、(2)文書比較動作に分けて説明する。以降、端末2を操作対象として動作を説明するが、端末3に置き換えた場合も同様の動作となる場合は説明を省略する。
【0032】
(1)基本動作
まず、利用者は、文書処理サーバ装置1の提供するサービスへログインを行うため端末2を操作する。端末2は、利用者から利用者ID及びパスワード等の情報の入力を受け付けると、当該情報とともに認証要求を文書処理サーバ装置1に送信する。
【0033】
文書処理サーバ装置1は、端末2から利用者ID及びパスワード等の情報とともに認証要求を受信すると、予め登録された利用者ID及びパスワード等を含む図示しない利用者情報を参照し、利用者としての依頼者の認証を行う。
【0034】
次に、利用者は、サービスへのログインが完了すると、比較する契約書の文書情報を文書処理サーバ装置1へアップロードするため端末2を操作する。端末2は、当該文書情報を文書処理サーバ装置1へアップロードする。
【0035】
文書処理サーバ装置1は、依頼者の操作する端末2から文書情報111を受け付けて記憶部11に格納する。
【0036】
次に、利用者は、アップロードした文書情報と比較したい文書情報を選択するため端末2を操作する。端末2は、文書処理サーバ装置1へ文書情報の比較要求を送信する。
【0037】
文書処理サーバ装置1の出力制御手段104は、文書情報の比較要求を受信し、比較する文書情報を選択するための画面を端末2の表示部に表示するよう出力制御する。
【0038】
利用者は、比較する文書情報を選択するための画面を参照しつつ、比較元の文書情報(第1の文書情報)と、比較先の文書情報(第2の文書情報)とを選択操作して比較することを要求する。端末2は、比較要求を文書処理サーバ装置1に送信する。
【0039】
文書処理サーバ装置1は、端末2から比較元の文書情報及び比較先の文書情報とともに比較要求を受け付けると(
図8、S1)、以下に示す文書比較動作を開始する。なお、文書処理サーバ装置1は、契約書の言語、種類と契約書の立場とともに比較要求を受け付けてもよいし、比較元の文書情報及び/又は比較先の文書情報から契約書の言語、種類と立場を抽出してもよい。
【0040】
(2)文書比較動作
図8は、文書処理サーバ装置1の検査動作を示すフローチャートである。
図4(a)及び(b)は、文書処理動作における文書情報111の処理の一例を説明するための概略図である。
【0041】
まず、文書処理サーバ装置1の契約書分割手段101は、
図4(a)に示す選択中の文書情報111aと、比較先の文書情報111bの言語を確認し、言語に応じて分割単位を変更する(S2)。一例として、契約書分割手段101は、言語が「日本語」の場合は、条毎に内容がひとつの意味のまとまりを有していることが多いため、条を分割単位の基本とし、言語が「英語」の場合は、項毎に内容がひとつの意味のまとまりを有していることが多いため、項を分割単位の基本とする。ここで、「分割単位の基本とする」としたのは、例えば、項を分割単位の基本とした場合であっても、複数の項からなる条であって、複数の定義が複数の項にそれぞれ記載されている場合は、当該条を項に分割しないほうが比較しやすいことから、当該条については条を単位とするといった例外を許容するためである。
【0042】
契約書分割手段101は、
図4(a)に示す例において言語が「英語」であったため、文書情報111aと、文書情報111bをそれぞれ、
図4(b)に示すように、項毎に分割して複数の単位からなる単位情報112とする(S3)。その結果、契約書分割手段101は、文書情報111aをタイトル112a
1、序文112a
2、分割単位の例外としての条単位112a
3、基本の分割単位としての項単位112a
41、112a
42、112a
43、…締結部112a
nのように分割する。また、契約書分割手段101は、文書情報111bをタイトル112b
1、序文112b
2、分割単位の例外としての条単位112b
3、基本の分割単位としての項単位112ba
41、112ba
42、112ba
51、…締結部112ba
mのように分割する。なお、契約書分割手段101は、対象とする文書情報111a及び111bを、号やさらに下位の単位で分割するものであってもよく、文書情報111の構造に適した単位を用いて単位情報112とする。
【0043】
次に、関連度算出手段102は、言語に応じて、2つの文書情報111a及び111b間で、条単位112a
3、項単位112a
41、112a
42、112a
43、…と条単位112b
3、項単位112ba
41、112ba
42、112ba
51、…の関連度を、
図5(a)に示すように、関連度情報113として算出する(S4)。関連度は、例えば、2つの文書情報111a及び111b間の項単位同士の編集距離を算出する方法や、項単位をベクトル化してコサイン類似度を計算する方法等を用いて算出する。ここで、例えば、英語は日本語に比べて一文字あたりに含まれる情報量が少ないため日本語に比べて多い文字数(単語数)を比較単位としてオーバーラップを計算する。対して日本語は英語に比べて一文字あたりに含まれる情報量が多いため英語に比べて少ない文字数を比較単位としてオーバーラップを計算する。
【0044】
図5(a)及び(b)は、関連度情報113及び紐付情報114の構成例を示す概略図である。
【0045】
図5(a)は、条単位112a
3、項単位112a
41、112a
42、112a
43、…と条単位112b
3、項単位112ba
41、112ba
42、112ba
51、…の関連度を示す関連度情報113abであり、条単位112a
3、項単位112a
41、112a
42、112a
43、…と条単位112b
3、項単位112ba
41、112ba
42、112ba
51、…をそれぞれ行の項目と列の項目に有し、各関連度が記載される。
【0046】
次に、単位紐付手段103は、関連度算出手段102が算出した関連度情報113abに基づいて、2つの文書情報111a及び111b間の条単位112a
3、項単位112a
41、112a
42、112a
43、…と条単位112b
3、項単位112ba
41、112ba
42、112ba
51、…がそれぞれ一対一に対応し、関連度の和が最大化されるように紐付け(S5)、
図5(b)に示すように紐付情報114abとして生成する。なお、一方の文書情報において複数の単位を結合することで、他方の文書情報の単位との関連度が向上する場合は、一方の文書情報の複数の単位を結合した後に一対一で対応付けてもよいし、一方の文書情報において単位をさらに分割することで、他方の文書情報の単位との関連度が向上する場合は、一方の文書情報の単位を分割した後に一対一で対応付けてもよい。このように、関連度の和が最大となるように文書情報111aに含まれる単数又は複数の単位と、文書情報111bに含まれる単数又は複数の単位とを一対一の関係で紐づけることができる。また、関連度の和が最大となる場合の他、ある閾値以上となる場合の組み合わせを後述する表示動作においてすべて表示し、又は関連度の和が上位複数位となる組み合わせを表示して、適切な組み合わせを利用者に選択させるものであってもよい。
【0047】
図5(b)は、条単位112a
3、項単位112a
41、112a
42、112a
43、…と条単位112b
3、項単位112b
41、112b
42、112b
51、…が紐付けられた紐付情報114abであり、条単位112a
3、項単位112a
41、112a
42、112a
43、…と条単位112b
3、項単位112b
41、112b
42、112b
51、…をそれぞれ行の項目と列の項目に有し、紐付けられた箇所に「1」が記載される。
【0048】
図6は、紐付情報114の構成を概念的に示した概略図である。
【0049】
図6に示すように、
図5(b)に示した紐付情報114abに示された条単位112a
3、項単位112a
41、112a
42、112a
43、…と条単位112b
3、項単位112b
41、112b
42、112b
51、…の対応関係に、タイトル112a
1、序文112a
2、締結部112a
nと、タイトル112b
1、序文112b
2、締結部112b
mを加えて、文書情報111a及び111bの対応関係が概念的に示される。それぞれ紐付けられた条単位112a
3、項単位112a
41、112a
51、112a
52、112a
53、…と条単位112b
3、項単位112ba
41、112ba
51、112ba
52、112ba
53、…が横に並べて表現されており、紐付けがなされなかった項単位112a
42、112a
43、112a
54、…の横は空欄で表現されている。
【0050】
次に、出力制御手段104は、
図7に示すように、上記紐付情報114に基づいて文書情報111aのタイトル112a
1、序文112a
2、条単位112a
3、項単位112a
41、112a
42、112a
43、…締結部112a
n、及び文書情報111bのタイトル112b
1、序文112b
2、条単位112b
3、項単位112b
41、112b
42、112b
51、…締結部112b
mを端末2の表示部に表示制御する(S6)。なお、締結部112a
n、締結部112b
m等は
図7中に示されていないが、後述するスライドバー104a
3を操作して表示内容をスライドさせることで表示される。
【0051】
図7は、出力制御手段104により端末2又は3の表示部に表示される画面の構成例を示す概略図である。
【0052】
画面104aは、比較元の契約書の内容を示す表示欄104a1と、比較先の契約書の内容を示す表示欄104a2と、スライドバー104a3と、比較先の契約書の単位のうち比較元の契約書の単位と紐付けられなかった単位を表示する表示欄104a4とを有する。表示欄104a1は、タイトル112a1及び序文112a2が表示される表示欄104a11、条単位112a3が表示される表示欄104a12、それぞれ項単位112a41、112a42…が表示される表示欄104a13、104a14、…を有し、表示欄104a2は、タイトル112b1及び序文112b2が表示される表示欄104a21、条単位112b3が表示される表示欄104a22、項単位112b41が表示される表示欄104a23、「該当なし」が表示される表示欄104a24、…を有する。
【0053】
項単位112a41と項単位112b41のように対応付けられたものは横並びに表示欄104a13と表示欄104a23に表示され、項単位112a42のように対応するものがなかった場合は「該当なし」と記載された表示欄104a24が表示欄104a14の横並びに表示される。また、逆に、項単位112b42、112b62のように対応するものがなかった場合は「マッチしなかった条文」として表示欄112a4に表示される。
【0054】
また、利用者の操作内容に基づいて項単位112b42を表示欄104a2に移動させたり、表示欄104a2内の各条単位・項単位を表示欄104a2の他の表示欄または表示欄112a4に手動で移動させる等して、紐付情報114の内容を変更し、その変更後の紐付情報114の関係に基づいて表示内容を出力するようにしてもよい。
【0055】
なお、項単位112a41と項単位112b41のように対応付けられたものは、それぞれの単位との間に差分がある場合、当該差分に対して強調表示をしてもよい。強調表示は項単位112a41又は項単位112b41の一方に表示してもよいし、双方に表示してもよい。
【0056】
(実施の形態の効果)
上記した実施の形態によれば、第1の文書情報としての文書情報111a及び第2の文書情報としての文書情報111bをそれぞれ分割する際に、言語に応じて分割単位を変更して分割し、文書情報111a及び文書情報111b間の単位の関連度を算出する際に、言語に応じて関連度の算出方法を変更して算出するとともに、関連度を最大化して一対一に対応するように単位を紐付けたため、文書の言語に応じて、単位で文書間の関係性を表示することができる。つまり、内容が編集された変更前後の文書情報であっても、又は、それぞれ作成された同じ種類の文書情報であって、それぞれが異なる文体で異なる順序の記載であっても、これらの文書情報の言語に応じて適した単位で対応関係を示すことができる。
【0057】
[他の実施の形態]
なお、本発明は、上記実施の形態に限定されず、本発明の趣旨を逸脱しない範囲で種々な変形が可能である。
【0058】
例えば、新旧対照表の作成に本発明を適用してもよい。具体的には、2つの文書情報のそれぞれの単位の順序を入れ替えずに、2つの文書情報間の対応関係を検査し、2つの文書情報間の差分を提示することで適用される。さらに具体的には、文書情報に含まれる単位の順序を変更せずに関連度を算出し、紐付けるようにするとともに、紐付けられた単位に差分がある場合と、差分がない場合の表記を定め、紐付けられない単位の表記を定めるようにする。これにより、文書情報間の関係性を、文書情報に含まれる予め定めた単位の関係で表示するとともに、法文や契約書が改定された際に作成される新旧対照表を自動で作成することができる。また、文書情報の単位間に差分がある場合、当該差分に対して強調表示をしてもよい。
【0059】
また、文書情報111は契約書に限らず、構成要素で分割できるものであれば、法律そのもの文書や取り扱い説明書等であってよいし、同様に本発明を適用可能である。また、言語により分割単位や関連度の算出方法を変更する他、法律、取り扱い説明書等の文書の種類に応じて分割単位や関連度の算出方法を変更してもよい。また、構成要素は、条文、項、号に限らず、単語や文字・記号であってもよいし、段落、文章であってもよい。
【0060】
上記実施の形態では制御部10の各手段100‐104の機能をプログラムで実現したが、各手段の全て又は一部をASIC等のハードウエアによって実現してもよい。また、上記実施の形態で用いたプログラムをCD‐ROM等の記録媒体に記憶して提供することもできる。また、上記実施の形態で説明した上記ステップの入れ替え、削除、追加等は本発明の要旨を変更しない範囲内で可能である。
【産業上の利用可能性】
【0061】
文書間の関係性を、文書の言語に応じて予め定めた単位の関係で表示する文書処理プログラム、情報処理装置及び文書処理方法を提供する。
【符号の説明】
【0062】
1 :文書処理サーバ装置
2 :端末
3 :端末
4 :ネットワーク
5 :文書処理システム
10 :制御部
11 :記憶部
12 :通信部
100 :契約書受付手段
101 :契約書分割手段
102 :関連度算出手段
103 :単位紐付手段
104 :出力制御手段
110 :文書処理プログラム
111 :文書情報
112 :単位情報
113 :関連度情報
114 :紐付情報