(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022180714
(43)【公開日】2022-12-07
(54)【発明の名称】情報処理装置、情報処理方法及び情報処理プログラム
(51)【国際特許分類】
G06F 40/279 20200101AFI20221130BHJP
G06Q 50/18 20120101ALI20221130BHJP
【FI】
G06F40/279
G06Q50/18
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2021087351
(22)【出願日】2021-05-25
(71)【出願人】
【識別番号】518287076
【氏名又は名称】FRAIM株式会社
(74)【代理人】
【識別番号】100158850
【弁理士】
【氏名又は名称】明坂 正博
(72)【発明者】
【氏名】堀口 圭
(72)【発明者】
【氏名】宮坂 豪
【テーマコード(参考)】
5B091
5L049
【Fターム(参考)】
5B091AA11
5B091AA15
5B091CC02
5B091CD11
5L049BB67
5L049CC32
(57)【要約】 (修正有)
【課題】より効果的なレビューが可能な情報処理装置、情報処理方法及び情報処理プログラムを提供する。
【解決手段】サーバ(情報処理装置)と、このサーバとネットワークを介して接続されたユーザ端末とを備える情報処理システムにおいて、サーバのCPU200Cは、文書データの入力を受け付ける受信部201(受付部)と、文書データを解析し、文書データに含まれる所定の表現に特徴的な文字列を抽出する抽出部206と、抽出部が抽出した文字列を、文書データに含まれる他の文字列とは異なる態様で表示させる情報を出力する送信部202(出力部)と、を備える。
【選択図】
図3
【特許請求の範囲】
【請求項1】
文書データの入力を受け付ける受付部と、
前記文書データを解析し、前記文書データに含まれる所定の表現に特徴的な文字列を抽出する抽出部と、
前記抽出部が抽出した文字列を、前記文書データに含まれる他の文字列とは異なる態様で表示させる情報を出力する出力部と、
を備えることを特徴とする情報処理装置。
【請求項2】
前記文書データに含まれる文字列を解析し、解析した前記文字列に前記分類を付与する解析部を備え、
前記抽出部は、
前記文書に含まれる文字列から前記分類が付与された文字列を抽出し、
前記出力部は、
前記分類に応じて、異なる態様で表示させる情報を出力する、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
所定の表現に特徴的な文字列と、該文字列の分類とが関連付けられた辞書を備え、
前記解析部は、
前記辞書を参照して、前記文字列に前記分類を付与する、
ことを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記辞書には、少なくとも、
(1)権利及び義務
(2)当事者
(3)権利/義務に付された条件
(4)原則及び例外
(5)注意
(6)権利/義務の対象
(7)法令
(8)被引用関係
のいずれかに特徴的な文字列と、該文字列の分類とが関連付けて記憶されている、
ことを特徴とする請求項3に記載の情報処理装置。
【請求項5】
前記辞書には、
所定の表現に特徴的な文字列と、異なる表現であるが前記所定の表現と意味が同じである表現とが関連付けて記憶されている、
ことを特徴とする請求項3又は請求項4に記載の情報処理装置。
【請求項6】
抽出された文字列に対し、付与された分類に応じて評価を付与する評価部、
を備えることを特徴とする請求項2乃至請求項5のいずれかに記載の情報処理装置。
【請求項7】
前記評価部は、
前記権利/義務の対象及び金額の少なくとも一方に応じて、付与する評価を変化させることを特徴とする請求項6に記載の情報処理装置。
【請求項8】
前記評価部は、
前記権利/義務の対象数及び前記権利/義務に付された条件の少なくとも一方に応じて、付与する評価を変化させることを特徴とする請求項6又は請求項7に記載の情報処理装置。
【請求項9】
文書を所定単位に分割する分割部を備え、
前記解析部は、
前記所定単位ごとに前記文書データに含まれる文字列に前記分類を付与する、
ことを特徴とする請求項2乃至請求項5のいずれかに記載の情報処理装置。
【請求項10】
前記出力部は、
前記所定単位ごとに抽出された文字列の組み合わせ及び評価を関連付けて表示させる情報を出力する、
ことを特徴とする請求項9に記載の情報処理装置。
【請求項11】
受付部が、文書データの入力を受け付ける工程と、
抽出部が、前記文書データを解析し、前記文書データに含まれる所定の表現に特徴的な文字列を抽出する工程と、 出力部が、前記抽出部が抽出した文字列を、前記文書データに含まれる他の文字列とは異なる態様で表示させる情報を出力する工程と、
を有することを特徴とする情報処理方法。
【請求項12】
コンピュータを、
文書データの入力を受け付ける受付部、
前記文書データを解析し、前記文書データに含まれる所定の表現に特徴的な文字列を抽出する抽出部、
前記抽出部が抽出した文字列を、前記文書データに含まれる他の文字列とは異なる態様で表示させる情報を出力する出力部、
として機能させることを特徴とする情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。
【背景技術】
【0002】
法律文書をはじめとする契約書等の文書は、商取引等に重大な影響がある。このため作成された文書のレビューを行うのが一般的であるが、士業者や企業の法務担当者のように専門知識をもつ人々以外の人間にとっては難解な表現が多く、レビューの負担が重いという問題がある。そこで、従来には、契約書の作成段階において、改変された契約条件に係るリスクの認識、改変された契約条件が妥当であるか否かの意思決定、リスクに対する対応策の提示など、文書のレビューを支援するものがある(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら従来のレビューを支援する技術は、一般的に、取引形態や、など文書の類型ごとに、契約条件やリスクなどを判断している。このため、類型ごとに有利不利をラベリングしたり、パターンマッチングを行う必要があり、システム構築のために大量のデータと作業が必要となり、費用負担が重くなる。また、細かくレビューするあまりユーザの目線で適切でない指摘が多く含まれる虞もある。
【0005】
本発明は、上記課題に鑑みてなされたものであり、より効果的なレビューが可能な情報処理装置、情報処理方法及び情報処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するため、本発明の情報処理装置は、文書データの入力を受け付ける受付部と、文書データを解析し、文書データに含まれる所定の表現に特徴的な文字列を抽出する抽出部と、抽出部が抽出した文字列を、文書データに含まれる他の文字列とは異なる態様で表示させる情報を出力する出力部と、を備える。
【発明の効果】
【0007】
本発明によれば、より効果的なレビューが可能な情報処理装置、情報処理方法及び情報処理プログラムを提供することができる。
【図面の簡単な説明】
【0008】
【
図1】実施形態に係る情報処理システムの概略構成の一例を示す図である。
【
図2】実施形態に係るサーバのハード構成の一例を示す図である。
【
図3】実施形態に係るサーバの機能構成の一例を示す図である。
【
図4】実施形態に係るユーザ端末のハード構成及び機能構成の一例を示す図である。
【
図5】実施形態に係るユーザ端末の表示装置に表示される画面の一例を示す図である。
【
図6】実施形態に係るユーザ端末の表示装置に表示される画面の一例を示す図である。
【
図7】実施形態に係るサーバによる情報処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0009】
以下、本発明の実施形態を図面に基づいて説明する。
なお、下記実施形態では、文書として契約書を例に実施形態を説明するが文書は契約書に限られない。例えば、規程文書、条例や条約、有価証券報告書、決算短信、特許明細書、申請書、種々の様式などであってもよい。
【0010】
[実施形態]
図1は、実施形態に係る情報処理システム1の概略構成の一例を示す図である。初めに、
図1を参照して情報処理システム1の構成について説明する。情報処理システム1は、サーバ2(情報処理装置)と、このサーバ2とネットワーク4を介して接続されたユーザ端末3とを備える。なお、情報処理システム1が備えるサーバ2及びユーザ端末3の数はそれぞれ任意である。なお、サーバ2及びユーザ端末3間の通信は無線通信であるか有線通信であるか問わない。
【0011】
(サーバ2)
図2は、サーバ2(情報処理装置)のハード構成の一例を示す図である。
図2に示すように、サーバ2は、通信IF200A、記憶装置200B、CPU200Cなどを備える。なお、サーバ2に入力装置(例えば、キーボード、タッチパネルなど)及び表示装置(例えば、液晶モニタや有機ELモニタなど)を備えるようにしてもよい。
【0012】
通信IF200Aは、外部端末(実施形態では、ユーザ端末3)と通信するためのインターフェースである。
【0013】
記憶装置200Bは、例えば、HDDや半導体記憶装置である。記憶装置200Bには、サーバ2で利用する情報処理プログラム及び各種データなどが記憶されている。なお、実施形態では、情報処理プログラム及び各種データは、サーバ2の記憶装置200Bに記憶されているが、USBメモリなどの外部記憶装置やネットワークを介して接続された外部サーバに記憶し、必要に応じて参照やダウンロード可能に構成されていてもよい。
【0014】
例えば、各種データには、後述の解析部205が、形態素解析を行うための形態素解析用データやラベル(分類)を付与するためのラベル付与用データ(分類用データ)が含まれる。形態素解析を行うためのデータには、例えば、慣用句テーブル、ひらがな部分の単語切り分け用テーブル、付属語テーブル、ひらがな自立語テーブル、活用語尾テーブル、ひらがな語幹テーブル、特殊動詞テーブル、副詞テーブル、情報テーブル(テーブル内の各項目に対応した辞書的情報)、接続テーブル(形態素間の相互接続関係を記述したテーブルであり、接続カテゴリ(品詞)毎に、その前に出現可能な形態素のカテゴリや活用形が記されたデータ)や規則などのデータが含まれる。なお、解析部205による形態素解析には、既知のアルゴリズムを利用することができる。
【0015】
ラベルを付与するためのデータには、ラベルを付与するための辞書が含まれる。該辞書は、権利及び義務、当事者、権利/義務に付された条件、原則及び例外、注意、権利/義務の対象、法令、被引用関係などの所定の表現ごとに特徴的な文字列が関連付けられたデータである。以下、権利及び義務、当事者、権利/義務に付された条件、原則及び例外、注意、権利/義務の対象、法令、被引用関係などの所定の表現ごとに特徴的な文字列の一例について説明する。なお、下記はあくまで一例であり、どのような文字列を所定の表現ごとに特徴的な文字列とするかは任意である。
【0016】
(1)権利/義務
権利/義務は、権利/義務の有無及び強度を表す表現であり、例えば、以下の文章において、「」内の文字列は義務を表す表現として特徴的なものであり、<義務:支払うものとする>などとラベリングすることができる。なお、<義務種類:支払う>、<義務強度:とする>などのように、義務をその種別と強度(義務の強さ)にわけてラベリングしてもよい。この場合、種別と強度の表現を予め辞書に登録しておく。また、さらに期間についても抽出対象としてもよい。この場合、<義務期限:支払期日の翌日から弁済に至るまで>などとラベリングすることができる。なお、権利/義務以外の他のラベルについても同様に種別と強度に細分化してラベリングするようにしてもよい。
(遅延損害金)
第1条 買主が代金の支払を怠ったときは、「支払期日の翌日から弁済に至るまで」年○%の割合による遅延損害金を売主に「支払うものとする」。
【0017】
(2)当事者
当事者は、契約の当事者を表す表現であり、例えば、以下の文章において、「」内の文字列は義務を表す表現として特徴的なものであり、<当事者:甲:自分>、<当事者:乙:相手方>などとラベリングすることができる。
(遅延損害金)
第7条 「甲」が、第3条記載の代金の支払を怠ったときは、「乙」に対し、支払期日の翌日から完済の日まで、日歩5銭の割合による遅延損害金を付加して支払わなければならない。
【0018】
(3)権利/義務に付された条件
権利/義務に付された条件は、権利/義務の行使条件を表す表現であり、例えば、以下の文章において、「」内の文字列は権利/義務の行使対象を表す表現として特徴的なものであり、<権利:売却 留置,条件:支払担保 全額の支払いを得られない>などとラベリングすることができる。
(貨物の留置)
第14条 乙は、甲に対する運賃その他の請求権について貨物を留置し、かつ、「その支払を受けるために」貨物を、競売することができる。ただし、「貨物を競売してもなお全額の支払を得ることができない場合には」、その残額につき甲に対して請求することを妨げるものではない。
【0019】
(4)原則/例外
権利/義務について複数の持つ意味をどのように解釈すべきか指針となるのが原則・例外表現である。例えば、以下の文章において「」内の文字列は例外表現である。但し書きと呼ばれる原則例外関係については、法律文書特有のものであり、原則を本文に、但し書きに例外処理を記載するものである。なお、上記権利/義務に付された条件の「ただし」は例外処理を表したものではなく、「但し~限りではない。」など特徴的な表現を正しく認識する必要がある。
(秘密保持)
第21条 発行会社及び経営株主は、前条に従った公表を除き、本契約の内容を、全投資者の書面による事前の承諾なしに第三者に提供、開示又は漏洩しないものとする。「但し、法令等又は裁判所若しくは行政機関の命令に基づき開示する場合はこの限りではない」。
【0020】
(5)注意
注意は、権利/義務について上記の各種表現に当てはまらないか、当てはまるとしても特徴的であるがゆえにそれ単体で固有の意味をもたせることが適切な表現である。例えば、上記原則/例外の「事前(の)承諾」といった用語は、一般に用いられる条件表現であるが、一般的な評価として限定的な条件であるという法的な評価が存在するため、正規化してアラートの対象とすることが考えられる。
【0021】
(6)権利/義務の対象
権利/義務の対象は、権利/義務の対象を表す表現を指す。例えば、以下の文章において、「」内の表現は権利/義務の行使対象を表す表現として特徴的なものであり、<権利:売却 留置,対象:貨物>などとラベリングすることができる。また、権利/義務の目的物の金額等の数量表現は、権利/義務の強さを意味付けるものになることが多い為、金額等の数量表現についても評価できるように後述の抽出部206の抽出対象とすることが好ましい。この場合、<対象数量:○○○>といったようにラベリングすることができる。権利/義務の対象以外の他のラベルについても同様に数量表現を評価できるように後述の抽出部206の抽出対象としてラベリングするようにしてもよい。
(貨物の留置)
第14条 乙は、甲に対する「運賃その他の請求権について貨物を」留置し、かつ、「その支払を受けるために貨物」を、競売することができる。ただし、貨物を競売してもなお全額の支払を得ることができない場合には、その残額につき甲に対して請求することを妨げるものではない。
【0022】
(7)法令
契約書は権利/義務の記述を中心としてなされるが、義務とも権利とも言い難いような特徴的な表現が存在する場合がある。しかしながら、このような義務とも権利とも言い難い特徴的な表現については、数が限られるため、類型化して辞書として登録する(記憶装置200Bに記憶しておく)ことでラベル付を行うことができる。
(紛争処理)
第10条 本契約に定めのない事項及び本契約に定める条項の解釈に疑義が生じた場合は、甲及び乙は、信義に従い誠実に協議してその解決にあたる。
2 甲及び乙は、前項の協議で解決できない場合、本契約に関する一切の紛争についての第一審の専属的管轄裁判所を○○地方裁判所とすることに合意する。
【0023】
(8)被引用関係
被引用関係は、他の箇所(例えば、他の所定単位など)から引用されている表現(被引用表現)のことである。例えば、「第○条の規定に違反した場合は、…」、「第○条に従い、…」と他の条項を引用するような表現である。
【0024】
また、ラベルを付与するための辞書には、文書データに含まれる文字列の表現を正規化するための正規化用データが含まれる。正規化用データは、例えば、所定の表現に特徴的な文字列と、異なる表現であるが前記所定の表現と意味が同じである表現とを関連付けたデータである。
以下の表1は、正規化用データの一例である。
【表1】
【0025】
表1に示すように、正規化用データは、所定の表現に特徴的な文字列と、異なる表現であるが前記所定の表現と意味が同じである表現とを関連付けたデータである。このような正規化用データを用意することで、異なる表現であるが前記所定の表現と意味が同じである表現の文字列についてもラベルを付与することができる。
【0026】
CPU200Cは、サーバ2を制御し、図示しないROM(Read Only Memory)及びRAM(Random Access Memory)を備えている。
【0027】
図3は、実施形態に係るサーバ2の機能構成の一例を示す図である。
図3に示すように、サーバ2は、受信部201(受付部)、送信部202(出力部)、記憶装置制御部203、分割部204、解析部205、抽出部206、評価部207などの機能を有する。なお、
図3に示す機能は、サーバ2のROM(不図示)に記憶された情報処理プログラムをCPU200Cが実行することにより実現される。
【0028】
受信部201は、ネットワーク4を介してユーザ端末3から送信されるデータを受信する。例えば、受信部201は、レビューしたい文書データなどを受信する(受け付ける)。
【0029】
送信部202は、ネットワーク4を介してユーザ端末3へデータを送信(出力)する。例えば、送信部202は、評価部207による評価結果などを送信する。
【0030】
記憶装置制御部203は、記憶装置200Bを制御する。記憶装置制御部203は、例えば、記憶装置200Bへのデータの書き込みや読み出しを行う。
【0031】
分割部204は、ユーザにベース契約書を所定単位に分割する。実施形態では、分割部204は、契約書を条項ごとに分割する。具体的には、分割部204は、契約書から「条」の階層を表す番号ルール「第n条」や「第n」(nは任意の数字(主に整数))が行頭に出現する行を特定し、その行もしくはその行の一つ前の行の「条の見出し」を表す行を境目とみなし、条項毎に契約書を分割する。なお、所定単位をどのような単位とするかは任意である。例えば、項又は号を所定単位として対象の契約書を分割するようにしてもよい。この場合、分割部204は、対象の契約書から「項」又は「号」の階層を表す番号ルール「n.」又は「(n)」や「第n」(nは任意の数字(主に整数))が行頭に出現する行を特定し、その行もしくはその行の一つ前の行の「項の見出し」又は「号の見出し」を表す行を境目とみなし、項毎又は号毎に契約書を分割する。また、単に「条」、「項」又は「号」という単語を抽出し、この「条」、「項」又は「号」を境目とみなして条項毎に契約書を分割するようにしてもよい。更に、「条」「項」又は「号」という単語を抽出して分割するのではなく、条段落、項段落又は号段落であることを連続する行の中のテキストデータから判断して分割するようにしてもよい。
【0032】
解析部205は、記憶装置200Bに記憶されている辞書(形態素解析用データ及びラベル付与用データ)に基づいて、所定単位ごとに形態素解析を行い、各所定単位に含まれる文字列に対してラベルを付与する。具体的には、解析部205は、形態素解析による品詞解析、固有表現抽出による権利及び義務、当事者(例えば、組織名、人名など)、権利/義務に付された条件(例えば、日付表現、時間表現など)、原則及び例外、注意、権利/義務の対象(例えば、金額表現、割合表現など)、法令、被引用関係など所定の表現の文字列にラベルを付与する。
【0033】
解析部205は、文字列にラベルを付与する際に、所定の表現に特徴的な文字列と、異なる表現であるが前記所定の表現と意味が同じである表現とが関連付けられた正規化用データを参照し、異なる表現であるが前記所定の表現と意味が同じである表現の文字列についてもラベルを付与する。
【0034】
なお、実施形態では、解析部205は、形態素解析により文書データに含まれる文字列を形態素(言語で意味を持つ最小単位)に分割しているが、例えば、Sentencepiece、n-gramといった他の手法により、文書データに含まれる文字列を任意の単位に分割するようにしてもよい。
また、解析部205による上記ラベルの付与には、種々の手法を利用することができる。例えば、当事者、権利、義務、条件、法令、原則/例外、注意の文字列に対するラベルを付与した正解データを用意し、機械学習もしくはディープラーニングを用いた自動ラベルリングのAIモデルを作成し、このAIモデルにより上記文字列に対してラベルを付与してもよい。もちろん、AIモデルによる上記ラベルの付与は、一例であり、他の手法により上記文字列に対してラベルを付与するようにしてもよい。
【0035】
抽出部206は、文書データに含まれる文字列から所定の表現に関する文字列を抽出する。具体的には、抽出部206は、解析部205により付与されたラベルに基づいて、文書データに含まれる文字列から下記(a1)~(a8)の文字列を抽出する。
(a1)権利及び義務の少なくとも一方(権利/義務)に関する文字列
(a2)当事者に関する文字列
(a3)権利/義務に付された条件に関する文字列
(a4)原則及び例外の少なくとも一方(原則/例外)に関する文字列
(a5)注意に関する文字列
(a6)権利/義務の対象に関する文字列
(a7)法令に関する文字列
(a8)被引用関係に関する文字列
【0036】
なお、実施形態では、解析部205が分割した単位にラベルを付与し、この付与されたラベルに基づいて、文書データに含まれる文字列から上記(a1)~(a8)の文字列を抽出しているが、例えば、ラベルを付与せずに文字列の位置情報(offset情報)に基づいて文字列を抽出したり、文字列自体を抽出して(ラベルは付与せずに)抽出した文字列を可視化情報として利用する構成としてもよい。
【0037】
評価部207は、抽出された文字列及び評価ルールに基づいて、契約書を所定単位で評価する。
例えば、評価部207は、以下(b1)~(b4)のルールに基づいて、契約書を所定単位で評点する。なお、下記(b1)~(b4)のルールはあくまで一例であり、他のルールにより契約書を評点するようにしてもよい。
(b1)権利/義務に対して評点を付与する。なお、権利/義務をその種別と強度(義務の強さ)にわけてラベリングしている場合、種別と強度の表現に応じて評点を付与する。例えば、自己の権利の強度が強いほど評点を高くし、義務の権利の強度が強いほど評点を低くしてもよい。また権利/義務の期限をラベリングしている場合、権利の支払期日が長いほど評点を高くし、義務の期限が長いほど評点を低くしてもよい。
(b2)権利/義務の範囲(いくつの目的物に対して権利/義務があるかや、目的物の数量表現に応じて点数の重み付けが変わる。例えば、権利の当事者が本人である場合は、目的物の数や数量が多いほど有利な度合いが高くなると考えられるため、目的物の数や数量が多いほど評点が高くなる。また、権利の当事者が相手方である場合は、目的物の数や数量が多いほど有利な度合いが低くなると考えられるため、目的物の数や数量が多いほど評点が低くなる)
(b3)権利/義務が条件付きの場合、条件の大きさ(いくつの条件があるのか)に応じて点数の重み付けが変わる(権利の当事者が本人である場合は、条件付きの権利は、条件なしの権利に比べて、有利な度合いが低くなると考えられるため、条件が多いほど評点が低くなる。一方、権利の当事者が相手方である場合は、条件付きの権利は、条件なしの権利に比べて、有利な度合いが高くなると考えられるため、条件が多いほど評点が高くなる。)。
(b4)他の箇所から引用されている箇所(被引用箇所)については、影響度が大きいため、点数の重み付けを調整する。被引用箇所は、例えば、他の条項から引用されている条項などである。他の条項から引用されている場合、引用先の条項の内容にも関係するためより重要度が高い、と判定することができる。このため、評価部207は、被引用箇所が存在する場合、被引用箇所先の重み付けを重くする(評価を高くする)。
例えば、以下のような文書データの場合、第10条は「第14条」を引用しているため(「」を参照)、評価部207は、第10条は第14条の条項の重み付けを重くする(評価を高くする)。なお、他の箇所から引用されている数(被引用数)が多いほど重み付けを重くするようにしてもよい。
第10条(権利侵害等の責任)
成果物又は技術的成果が第三者の権利を侵害するとして何らかの請求、異議申立がなされ、又は訴訟が提起される等の紛争が生じたときは、甲は直ちにその旨を乙に通知するものとし、乙は自己の責任と費用においてこれを処理するか、若しくはこれによって甲に生じた損害を「第14条」に従い甲に賠償するものとする。ただし、当該権利の利用が甲の指示に基づく場合はこの限りではない。
また、評価部207は、評点に基づいて契約書を所定単位で判定する(評点及び評価の例については、
図6を参照)。
【0038】
なお、実施形態では、評価部207は、上記に例示した評価ルールに基づいて契約書を評価しているが、例えば、標準となる契約書(標準契約書)を予め評価しておき、この標準契約書の評価を基準として相対的に評価対象である契約書を評価してもよい。例えば、標準契約との抽出した文字列の表現の違いによって、評価対象である契約書の評価を標準契約書の評価よりも高くしたり、低くしたりするようにしてもよい。
【0039】
(ユーザ端末3)
図4は、実施形態に係るユーザ端末3のハード構成及び機能構成の一例を示す図である。
図4(a)は、ユーザ端末3のハード構成の一例を示す図、
図4(b)は、ユーザ端末3の機能構成の一例を示す図である。ユーザ端末3は、PC(Personal Computer)や携帯端末(例えば、タブレット端末)などである。
図4(a)に示すように、ユーザ端末3は、通信IF300A、記憶装置300B、入力装置300C、表示装置300D、CPU300Eなどを備える。
【0040】
通信IF300Aは、他の装置(実施形態では、サーバ2)と通信するためのインターフェースである。
【0041】
記憶装置300Bは、例えば、HDD(Hard Disk Drive)や半導体記憶装置(SSD(Solid State Drive))である。記憶装置300Bには、ユーザ端末3の識別子(ID)及び情報処理プログラムなどが記憶されている。なお、識別子は、サーバ2がユーザ端末3に対して新たに付与してもよいし、IP(Internet Protocol)アドレス、MAC(Media Access Control)アドレスなどを利用してもよい。
【0042】
入力装置300Cは、例えば、キーボード、タッチパネルなどであり、ユーザは、入力装置300Cを操作して、情報処理システム1の利用に必要なデータを入力することができる。
【0043】
表示装置300Dは、例えば、液晶モニタや有機ELモニタなどである。表示装置300Dは、情報処理システム1の利用に必要な画面を表示する。
【0044】
CPU300Eは、ユーザ端末3を制御するものであり、図示しないROM及びRAMを備えている。
【0045】
図4(b)に示すように、ユーザ端末3は、受信部301、送信部302、記憶装置制御部303、操作受付部304、表示装置制御部305などの機能を有する。なお、
図4(b)に示す機能は、CPU300Eが、記憶装置300Bに記憶されている情報処理プログラムを実行することで実現される。
【0046】
受信部301は、サーバ2から送信されるデータを受信する。
【0047】
送信部302は、入力装置300Cを利用して入力されたデータに識別子を付与してサーバ2へ送信する。ユーザ端末3から送信されるデータに識別子を付与することでサーバ2は、受信したデータがどのユーザ端末3から送信されたものであるかを認識できる。
【0048】
記憶装置制御部303は、記憶装置300Bを制御する。具体的には、記憶装置制御部303は、記憶装置300Bを制御してデータの書き込みや読み出しを行う。
【0049】
操作受付部304は、入力装置300Cでの入力操作を受け付ける。
【0050】
表示装置制御部305は、表示装置300Dを制御する。具体的には、表示装置制御部305は、表示装置300Dを制御して実施形態に係る情報処理システム1の利用に必要な画面を表示させる。
【0051】
なお、ユーザ端末3は、例えば、WEBブラウザを用いて、サーバ2から送信されるデータを表示するようにしてもよいし、ユーザ端末3にアプリケーションソフトウェアがインストールされており、このアプリケーション上でサーバ2から送信されるデータを表示してもよい。
【0052】
(表示画面例)
図5~
図6は、実施形態に係るユーザ端末3の表示装置300Dに表示される画面の一例を示す図である。以下、
図5~
図6を参照して、実施形態に係るユーザ端末3の表示装置300Dに表示される画面の一例について説明する。なお、
図5~
図6に示す画面はあくまで一例であり、他の表示態様としてもよい。
【0053】
(表示画面G11)
図5は、契約書の解析結果を提示する画面G1の一例である。
図5に示すように、契約書の解析結果を提示する画面G1には、抽出部206により抽出された文字列が、文字列に付与されたラベルに応じて異なる態様で表示される。具体的には、以下(a1)~(a8)に関する文字列が互いに異なる表示態様(例えば、文字の色、背景色、文字の大きさ、フォントなどの違い)で表示される。また、その他、抽出部206により抽出された文字列に文章内にマークをつけたり、表で表現したり、文章の木構造やグラフ表現で表現したりなどして、抽出部206により抽出された文字列とその他の文字列とを識別可能性に表示させるようにしてもよい。
(a1)権利及び義務の少なくとも一方(権利/義務)に関する文字列
(a2)当事者に関する文字列
(a3)権利/義務に付された条件に関する文字列
(a4)原則及び例外の少なくとも一方(原則/例外)に関する文字列
(a5)注意に関する文字列
(a6)権利/義務の対象に関する文字列
(a7)法令に関する文字列
(a8)被引用関係に関する文字列
【0054】
(表示画面G2)
図6は、契約書の評価結果を提示する画面G2の一例である。
図6に示すように、契約書の評価結果を提示する画面G1には、所定単位である条項、権利及び義務の少なくとも一方(権利/義務)に関する文字列、当事者に関する文字列、権利/義務に付された条件に関する文字列、原則及び例外の少なくとも一方(原則/例外)に関する文字列、注意に関する文字列、権利/義務の対象に関する文字列、法令に関する文字列、被引用関係に関する文字列、条項の評価である評点及び判定が所定単位である条項ごとに関連付けた情報が一覧できる形態で表示される。
このため、契約書に記載されている各条項の権利及び義務、当事者、権利/義務に付された条件、原則及び例外、注意、権利/義務の対象、法令、被引用関係、評点及び判定を一目で把握することができ視認性に優れる。
【0055】
(情報処理システム1で実行される処理)
図7は、情報処理システム1で実行される処理の一例を示すフローチャートである。以下、
図7を参照して、情報処理システム1で実行される処理について説明するが、
図1~
図6を参照して説明した構成と同一の構成には同一の符号を付して重複する説明を省略する。
【0056】
(ステップS101)
ユーザは、入力装置300Cを操作して、レビューしたい契約書をドラッグアンドドロップする。なお、契約書のファイルを選択操作するようにしてもよい。
【0057】
(ステップS102)
ユーザ端末3の送信部202は、ドラッグアンドドロップ又は選択操作された契約書のデータをサーバ2へ送信する。
【0058】
(ステップS103)
サーバ2の受信部201がユーザ端末3から送信された契約書のデータを受信すると、分割部204は、ユーザにベース契約書を所定単位に分割する。
【0059】
(ステップS104)
サーバ2の解析部205は、所定単位ごとに形態素解析を行い、各所定単位に含まれる文字列に対してラベルを付与する。なお、上述したように、解析部205は、正規化用データを参照し、異なる表現であるが前記所定の表現と意味が同じである表現の文字列についてもラベルを付与する。
【0060】
(ステップS105)
サーバ2の抽出部206は、解析部205による解析結果(ラベル)に基づいて、文書データに含まれる文字列から所定の表現に関する文字列を抽出する。
【0061】
(ステップS106)
サーバ2の評価部207は、抽出された文字列及び評価ルールに基づいて、契約書を所定単位で評価(評点及び判定)する。
【0062】
(ステップS107)
サーバ2の送信部202は、抽出部206で抽出された文字列のデータや評価部207での評価結果に基づいて、
図5及び
図6にそれぞれ示す画面G1及び画面G2を表示させるためのデータをユーザ端末3へ送信する。
ユーザ端末3の受信部301は、サーバ2から送信されたデータを受信する。ユーザ端末3の表示装置制御部305は、受信部201が受信したデータに基づいて、表示装置300Dに
図5及び
図6にそれぞれ示す画面G1及び画面G2を表示させる。
【0063】
以上のように、実施形態に係るサーバ2(情報処理装置)は、文書データの入力を受け付ける受信部201(受付部)と、文書データを解析し、文書データに含まれる所定の表現に特徴的な文字列を抽出する抽出部206と、抽出部206が抽出した文字列を、文書データに含まれる他の文字列とは異なる態様で表示させる情報を送信(出力)する送信部202(出力部)とを備える。
このように、類型ごとに有利不利をラベリングしたり、パターンマッチングを行うのではなく、文書に含まれる文字列を抽出して、この抽出された文字列を他の文字列とは異なる態様で表示させるシンプルな構成であるため、種々の文書の利用することができ汎用性が高い。
【0064】
また、実施形態に係るサーバ2(情報処理装置)は、文書データに含まれる文字列を解析し、解析した文字列に分類を付与する解析部205を備える。そして、サーバ2の抽出部206は、文書に含まれる文字列から分類が付与された文字列を抽出し、サーバ2の送信部202(出力部)は、分類に応じて、異なる態様で表示させる情報を出力する。
このように、文字列に対して付与された分類に応じて異なる態様で表示させるので、文字列がどのような分類の文字列なのかを識別することが可能となる。
【0065】
また、実施形態に係るサーバ2(情報処理装置)は、所定の表現に特徴的な文字列と、該文字列の分類とが関連付けられた辞書を備える。そして、サーバ2の解析部205は、辞書を参照して、文字列に前記分類を付与する。
このため、異なる表現であるが所定の表現と意味が同じである表現の文字列についてもラベルを付与することができる。
【0066】
また、実施形態に係る辞書には、少なくとも、
(1)権利及び義務
(2)当事者
(3)権利/義務に付された条件
(4)原則及び例外
(5)注意
(6)権利/義務の対象
(7)法令
(8)被引用関係
のいずれかに特徴的な文字列と、該文字列の分類とが関連付けて記憶されている。
このように、辞書とマッチングによりラベルを付与することができる。
【0067】
また、実施形態に係る辞書には、所定の表現に特徴的な文字列と、異なる表現であるが前記所定の表現と意味が同じである表現とが関連付けて記憶されている。
このため、異なる表現であるが所定の表現と意味が同じである表現の文字列についてもラベルを付与することができる。
【0068】
また、実施形態に係るサーバ2(情報処理装置)は、抽出された文字列に対し、付与された分類に応じて評価を付与する評価部を備える。
このように、付与された分類に応じて評価を付与するシンプルな構成であるため、種々の文書の利用することができ汎用性が高い。また、システム構築のために大量のデータと作業を必要としないため、費用負担が重くなる虞が少ない。また、細かくレビューするあまりユーザの目線で適切でない指摘が多く含まれる虞も抑制できる。
【0069】
また、実施形態に係るサーバ2(情報処理装置)の評価部207は、権利/義務の対象及び金額の少なくとも一方に応じて、付与する評価を変化させる。
このように、権利/義務の対象及び金額の少なくとも一方に応じて柔軟に評価することができ利便性が向上する。
【0070】
また、実施形態に係るサーバ2(情報処理装置)の評価部207は、権利/義務の対象数及び権利/義務に付された条件の少なくとも一方に応じて、付与する評価を変化させる。
このように、権利/義務の対象数及び権利/義務に付された条件の少なくとも一方に応じて柔軟に評価することができ利便性が向上する。
【0071】
また、実施形態に係るサーバ2(情報処理装置)は、文書を所定単位に分割する分割部204を備える。そして、サーバ2の解析部205は、所定単位ごとに文書データに含まれる文字列に分類を付与する。
このように、所定単位で、文書データに含まれる文字列に分類を付与するので、文書全体ではなく、所定単位ごとに契約内容等を評価することができ、利便性が向上する。
【0072】
また、実施形態に係るサーバ2(情報処理装置)の送信部202(出力部)は、所定単位ごとに抽出された文字列の組み合わせ及び評価を関連付けて表示する情報を出力する。
このように、所定単位ごとに抽出された文字列の組み合わせ及び評価を関連付けて表示する情報を出力するので、一覧性があり識別性が向上する(一目で文字列の組み合わせと評価との関係を把握することができる)。
【0073】
[実施形態の変形例]
また、実施形態に係るサーバ2(情報処理装置)は、ユーザ(利用者)に対し、定額又は評価部207が評価した契約書量(文書量)に応じた課金額を算出する算出部を備えるようにしてもよい。ユーザに対して柔軟に課金することができ利便性が向上する。
【0074】
その他、上記実施形態及び変形例は、何れも本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその要旨、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。
【符号の説明】
【0075】
1 情報処理システム
2 サーバ(情報処理装置)
200A 通信IF
200B 記憶装置
200C CPU
201 受信部(受信部)
202 送信部(出力部)
203 記憶装置制御部
204 分割部
205 解析部
206 抽出部
207 評価部
3 ユーザ端末
300A 通信IF
300B 記憶装置
300C 入力装置
300D 表示装置
300E CPU
301 受信部
302 送信部
303 記憶装置制御部
304 操作受付部
305 表示装置制御部
4 ネットワーク