IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 新日本法規出版株式会社の特許一覧

特開2024-55040文書を処理するためのプログラム、システム及び方法
<>
  • 特開-文書を処理するためのプログラム、システム及び方法 図1
  • 特開-文書を処理するためのプログラム、システム及び方法 図2A
  • 特開-文書を処理するためのプログラム、システム及び方法 図2B
  • 特開-文書を処理するためのプログラム、システム及び方法 図2C
  • 特開-文書を処理するためのプログラム、システム及び方法 図3
  • 特開-文書を処理するためのプログラム、システム及び方法 図4
  • 特開-文書を処理するためのプログラム、システム及び方法 図5
  • 特開-文書を処理するためのプログラム、システム及び方法 図6
  • 特開-文書を処理するためのプログラム、システム及び方法 図7A
  • 特開-文書を処理するためのプログラム、システム及び方法 図7B
  • 特開-文書を処理するためのプログラム、システム及び方法 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024055040
(43)【公開日】2024-04-18
(54)【発明の名称】文書を処理するためのプログラム、システム及び方法
(51)【国際特許分類】
   G06F 16/31 20190101AFI20240411BHJP
   G06F 40/279 20200101ALI20240411BHJP
   G06Q 50/18 20120101ALI20240411BHJP
【FI】
G06F16/31
G06F40/279
G06Q50/18
【審査請求】未請求
【請求項の数】16
【出願形態】OL
(21)【出願番号】P 2022161626
(22)【出願日】2022-10-06
(71)【出願人】
【識別番号】500418598
【氏名又は名称】新日本法規出版株式会社
(72)【発明者】
【氏名】南谷 泰史
(72)【発明者】
【氏名】飯田 智久
【テーマコード(参考)】
5B091
5B175
5L049
5L050
【Fターム(参考)】
5B091CA14
5B175DA01
5B175KA08
5L049CC32
5L050CC32
(57)【要約】
【課題】ある文書において参照されている他の文書等を識別するためのプログラム等を提供すること。
【解決手段】文書において1以上の参照文言を検出するステップ(510)と、検出された前記1以上の参照文言の各々について参照先を識別するステップ(540)とをコンピュータに実行させるプログラムであって、参照先を識別するために、検出された前記1以上の参照文言のうちの少なくとも1つを、前記文書における先行する別の参照文言に少なくとも基づき補完するステップ(535)をコンピュータに更に実行させるプログラム。
【選択図】図5
【特許請求の範囲】
【請求項1】
文書において1以上の参照文言を検出するステップと、
検出された前記1以上の参照文言の各々について参照先を識別するステップと
をコンピュータに実行させるプログラムであって、
参照先を識別するために、検出された前記1以上の参照文言のうちの少なくとも1つを、前記文書における先行する別の参照文言に少なくとも基づき補完するステップ
をコンピュータに更に実行させるプログラム。
【請求項2】
請求項1に記載のプログラムであって、
検出された前記1以上の参照文言の各々について、当該参照文言が所定の記載を含むかに少なくとも基づき補完が必要であるかを判定するステップ
をコンピュータに更に実行させるプログラム。
【請求項3】
請求項1に記載のプログラムであって、検出された前記1以上の参照文言のうちの少なくとも1つを、前記文書における先行する別の参照文言に少なくとも基づき補完する前記ステップは、
検出された前記1以上の参照文言のうちの前記少なくとも1つを、前記別の参照文言と、文章の階層構造に係るルールとに基づき補完するステップ
を含む、プログラム。
【請求項4】
請求項3に記載のプログラムであって、文章の階層構造に係る前記ルールは、前記別の参照文言の参照先であるか又は参照先を含む文書に基づき識別される、プログラム。
【請求項5】
請求項1に記載のプログラムであって、検出された前記1以上の参照文言のうちの少なくとも1つを、前記文書における先行する別の参照文言に少なくとも基づき補完する前記ステップは、
検出された前記1以上の参照文言のうちの前記少なくとも1つを、補完された前記別の参照文言に少なくとも基づき補完するステップ
を含む、プログラム。
【請求項6】
請求項1に記載のプログラムであって、
1以上の文書について、文章の階層構造を解析して、入れ子構造を有する複数の文章ブロックを識別するステップ
をコンピュータに更に実行させ、
検出された前記1以上の参照文言の各々について参照先を識別する前記ステップは、前記1以上の文書のうちの1つが含む複数の文章ブロックのうちの1つを参照先として識別するステップを含む、
プログラム。
【請求項7】
請求項1に記載のプログラムであって、
文書を、該文書が含む1以上の参照文言が他の文言と区別される態様で表示するステップと、
表示された前記文書が含む前記1以上の参照文言のうちの1つの選択を受けるステップと、
前記参照文言の選択を受けることに応答して、選択を受けた前記参照文言の参照先についての情報を表示するためのデータを準備するステップと
をコンピュータに更に実行させるプログラム。
【請求項8】
請求項1に記載のプログラムであって、
表示された又は選択された文書について、該文書の少なくとも一部を参照先とする1以上の参照文言を識別するステップと、
識別された前記1以上の参照文言について表示するためのデータを準備するステップと
をコンピュータに更に実行させるプログラム。
【請求項9】
請求項1に記載のプログラムであって、前記文書は訴訟に係る書類である、プログラム。
【請求項10】
請求項1に記載のプログラムであって、
複数のページで構成される第1文書を取得するステップと、
前記第1文書の複数のページの各々において、1以上の所定の記載のうちの何れか1つの存否を判定し、存在すると判定した場合に識別するステップと、
識別された前記所定の記載に基づき、前記第1文書から1以上の第2文書を抽出するステップと
をコンピュータに更に実行させ、文書において1以上の参照文言を検出する前記ステップは、
前記1以上の第2文書において、1以上の参照文言を検出するステップ
を含む、プログラム。
【請求項11】
請求項10に記載のプログラムであって、前記第1文書の複数のページの各々において、1以上の所定の記載のうちの何れか1つの存否を判定し、存在すると判定した場合に識別する前記ステップは、
1以上の所定の記載のうちの何れか1つの、ページの所定の位置における存否を検出し、存在する場合に、当該ページに1以上の所定の記載のうちの何れか1つが存在すると判定するステップ
を含む、プログラム。
【請求項12】
請求項10に記載のプログラムであって、
各第2文書は、前記1以上の所定の記載のうちの1つにそれぞれ関連付けられ、
前記プログラムは、各第2文書を前記1以上の所定の記載のうちの1つにそれぞれ関連付けるために、ある所定の記載が識別されたページから、別の所定の記載が識別されたページの直前のページまでを識別するステップをコンピュータに更に実行させる、プログラム。
【請求項13】
請求項12に記載のプログラムであって、
各第2文書の名前を、当該第2文書に関連付けられた前記所定の記載に少なくとも基づき決定するステップ
をコンピュータに更に実行させるプログラム。
【請求項14】
請求項10に記載のプログラムであって、前記第1文書の複数のページの各々において、1以上の所定の記載のうちの何れか1つの存否を判定し、存在すると判定した場合に識別する前記ステップは、
スタンプを認識するためのアルゴリズムを実行することにより、ページにおける前記1以上の所定の記載のうちの1つが含まれる領域を検出するステップと、
検出された前記領域において、手書き文字を認識するためのアルゴリズムを実行することにより、前記1以上の所定の記載のうちの前記1つを識別するステップ
を含む、プログラム。
【請求項15】
文書において1以上の参照文言を検出し、
検出された1以上の参照文言の各々について参照先を識別する
ように構成されたシステムであって、
参照先を識別するために、検出された前記1以上の参照文言のうちの少なくとも1つを、前記文書における先行する別の参照文言に少なくとも基づき補完するように更に構成されたシステム。
【請求項16】
文書において1以上の参照文言を検出するステップと、
検出された前記1以上の参照文言の各々について参照先を識別するステップと
を含む、コンピュータが実行する方法であって、
参照先を識別するために、検出された前記1以上の参照文言のうちの少なくとも1つを、前記文書における先行する別の参照文言に少なくとも基づき補完するステップ
を更に含む方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、文書を処理することに関する。
【背景技術】
【0002】
従来、訴訟に係る作業おいては紙ベースでの文書の取り扱いが多かったが、様々な情勢の変化により、近年、そのような作業においても文書の電子化が図られてきている。
【0003】
これに関連して、特許文献1には、訴状等書類の文字情報を自動認識し、これに基づき答弁書を作成する答弁書自動作成システムが記載されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2009-223422号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
訴訟に係る文書においては、主張書面から書証への参照等、ある文書から別の文書等への参照が頻出する。しかしながら、紙である書類を例えば従来のOCR技術を用いて単純に電子化するだけでは、当該文書に含まれるテキストが得られるのみであり、当該文書において何が参照されているのかといった情報(データ)は得られない。
【0006】
本開示は以上に鑑みてなされたものであり、その課題は、ある文書において参照されている他の文書等を識別するためのプログラム等を提供することである。
【課題を解決するための手段】
【0007】
上記課題を解決するため、本開示の実施形態によれば、文書において1以上の参照文言を検出するステップと、検出された前記1以上の参照文言の各々について参照先を識別するステップとをコンピュータに実行させるプログラムであって、参照先を識別するために、検出された前記1以上の参照文言のうちの少なくとも1つを、前記文書における先行する別の参照文言に少なくとも基づき補完するステップをコンピュータに更に実行させるプログラムが提供される。
【0008】
一実施形態において、前記プログラムは、検出された前記1以上の参照文言の各々について、当該参照文言が所定の記載を含むかに少なくとも基づき補完が必要であるかを判定するステップをコンピュータに更に実行させてよい。
【0009】
一実施形態において、検出された前記1以上の参照文言のうちの少なくとも1つを、前記文書における先行する別の参照文言に少なくとも基づき補完する前記ステップは、検出された前記1以上の参照文言のうちの前記少なくとも1つを、前記別の参照文言と、文章の階層構造に係るルールとに基づき補完するステップを含んでいてよい。
【0010】
一実施形態において、文章の階層構造に係る前記ルールは、前記別の参照文言の参照先であるか又は参照先を含む文書に基づき識別されてよい。
【0011】
一実施形態において、検出された前記1以上の参照文言のうちの少なくとも1つを、前記文書における先行する別の参照文言に少なくとも基づき補完する前記ステップは、検出された前記1以上の参照文言のうちの前記少なくとも1つを、補完された前記別の参照文言に少なくとも基づき補完するステップを含んでいてよい。
【0012】
一実施形態において、前記プログラムは、1以上の文書について、文章の階層構造を解析して、入れ子構造を有する複数の文章ブロックを識別するステップをコンピュータに更に実行させ、検出された前記1以上の参照文言の各々について参照先を識別する前記ステップは、前記1以上の文書のうちの1つが含む複数の文章ブロックのうちの1つを参照先として識別するステップを含んでいてよい。
【0013】
一実施形態において、前記プログラムは、文書を、該文書が含む1以上の参照文言が他の文言と区別される態様で表示するステップと、表示された前記文書が含む前記1以上の参照文言のうちの1つの選択を受けるステップと、前記参照文言の選択を受けることに応答して、選択を受けた前記参照文言の参照先についての情報を表示するためのデータを準備するステップとをコンピュータに更に実行させてよい。
【0014】
一実施形態において、前記プログラムは、表示された又は選択された文書について、該文書の少なくとも一部を参照先とする1以上の参照文言を識別するステップと、識別された前記1以上の参照文言について表示するためのデータを準備するステップとをコンピュータに更に実行させてよい。
【0015】
一実施形態において、前記文書は訴訟に係る書類であってよい。
【0016】
一実施形態において、前記プログラムは、複数のページで構成される第1文書を取得するステップと、前記第1文書の複数のページの各々において、1以上の所定の記載のうちの何れか1つの存否を判定し、存在すると判定した場合に識別するステップと、識別された前記所定の記載に基づき、前記第1文書から1以上の第2文書を抽出するステップとをコンピュータに更に実行させ、文書において1以上の参照文言を検出する前記ステップは、前記1以上の第2文書において、1以上の参照文言を検出するステップを含んでいてよい。
【0017】
一実施形態において、前記第1文書の複数のページの各々において、1以上の所定の記載のうちの何れか1つの存否を判定し、存在すると判定した場合に識別する前記ステップは、1以上の所定の記載のうちの何れか1つの、ページの所定の位置における存否を検出し、存在する場合に、当該ページに1以上の所定の記載のうちの何れか1つが存在すると判定するステップを含んでいてよい。
【0018】
一実施形態において、各第2文書は、前記1以上の所定の記載のうちの1つにそれぞれ関連付けられ、前記プログラムは、各第2文書を前記1以上の所定の記載のうちの1つにそれぞれ関連付けるために、ある所定の記載が識別されたページから、別の所定の記載が識別されたページの直前のページまでを識別するステップをコンピュータに更に実行させてよい。
【0019】
一実施形態において、前記プログラムは、各第2文書の名前を、当該第2文書に関連付けられた前記所定の記載に少なくとも基づき決定するステップをコンピュータに更に実行させてよい。
【0020】
一実施形態において、前記第1文書の複数のページの各々において、1以上の所定の記載のうちの何れか1つの存否を判定し、存在すると判定した場合に識別する前記ステップは、スタンプを認識するためのアルゴリズムを実行することにより、ページにおける前記1以上の所定の記載のうちの1つが含まれる領域を検出するステップと、検出された前記領域において、手書き文字を認識するためのアルゴリズムを実行することにより、前記1以上の所定の記載のうちの前記1つを識別するステップを含んでいてよい。
【0021】
上記課題を解決するため、本開示の実施形態によれば、文書において1以上の参照文言を検出し、検出された1以上の参照文言の各々について参照先を識別するように構成されたシステムであって、参照先を識別するために、検出された前記1以上の参照文言のうちの少なくとも1つを、前記文書における先行する別の参照文言に少なくとも基づき補完するように更に構成されたシステムが提供される。
【0022】
上記課題を解決するため、本開示の実施形態によれば、文書において1以上の参照文言を検出するステップと、検出された前記1以上の参照文言の各々について参照先を識別するステップとを含む、コンピュータが実行する方法であって、参照先を識別するために、検出された前記1以上の参照文言のうちの少なくとも1つを、前記文書における先行する別の参照文言に少なくとも基づき補完するステップを更に含む方法が提供される。
【発明の効果】
【0023】
本開示の実施形態によれば、ある文書において参照されている他の文書等をコンピュータ上で識別することができる。
【図面の簡単な説明】
【0024】
図1】文書を処理する例示システム100の概略図である。
図2A】文書を処理する例示方法200のフローチャートである。
図2B】文書を処理する例示方法200のフローチャートである。
図2C】文書を処理する例示方法200のフローチャートである。
図3】ステップ213が含むことのできる、より詳細な例示方法300のフローチャートである。
図4】例示の第2文書400における文書の階層構造を表す図である。
図5】ステップ245が含むことのできる、より詳細な例示方法500のフローチャートである。
図6】クライアント160に表示される例示画面600である。
図7A】例示画面600の表示に関連して実行される例示方法700のフローチャートである。
図7B】例示画面600の表示に関連して実行される例示方法700のフローチャートである。
図8】コンピュータのハードウエア構成の一例を表す図である。
【発明を実施するための形態】
【0025】
図1は、本発明の一実施形態に係る、文書を処理する例示システム100の概略図である。なお、例示システム100は、パーソナルコンピュータやクラウド上のコンピュータ等のコンピュータにより構成されてよい。また、例示システム100が含む以下に説明する構成要素は、コンピュータのハードウエア資源とソフトウエアとの協働により実現されることが当業者には理解されよう。
【0026】
110は、文書を処理するための文書処理部を示している。文書処理部110は、後述する例示方法200を実行するものである。
【0027】
120は、処理された文書について、1以上のネットワークから構成されるネットワーク150を介して接続されたクライアント160(コンピュータ)に対して文書を提示するための文書提示部を示している。文書提示部120は、後述する例示方法700を実行するものである。なお、文書提示部120は、クライアント160がウェブブラウザを介して通信できるように、ウェブサーバとしての機能を有していてよい。また、文書提示部120とクライアント160との間では、JSON形式でデータが通信されてよいが、データの通信形式はこれに限定されるわけではない。ネットワーク150は、インターネットを含んでいてよい。
【0028】
130、132,134、136及び138は、それぞれ、文書処理部110によって取得され、文書提示部120によって使用されるデータを記憶するためのデータベースである、全文検索インデックス、ドキュメントテーブル、被参照アンカーテーブル、参照元アンカーテーブル及びリンクテーブルを示している。これらデータベースに記憶されるデータについては後述する。
【0029】
図2A~2Cは、本発明の一実施形態に係る、文書を処理する例示方法200の流れを示すフローチャートである。なお、上述したように、例示方法200は例示システム100が含む文書準備部110が実行するものである。したがって、例示方法200はコンピュータが実行するものと考えてよい。
【0030】
205は、処理する対象である文書として、第1文書を取得するステップを示している。
【0031】
第1文書は複数のページで構成されるもので、各ページは、紙の文書の各ページを画像化したものに相当してよい。なお、第1文書はPDFファイルであってよい。
【0032】
本実施形態において、第1文書は、訴訟に係る書類であってよく、訴状、答弁書、準備書面、申立書、反訴状、控訴趣意書及び抗告状等の主張書面並びに書証のうちの1以上の文書を含むものであってよい。なお、第1文書はこれに限定されるわけではなく、別実施形態においては訴訟に係る書類以外のものであってもよい。
【0033】
ステップ205において、第1文書の取得手法は任意である。例えば、ステップ205は、例示システム100に予め記憶されている第1文書を取得するステップであってよい。あるいは、ステップ205は、クライアント160から例示システム100へとアップロードされた第1文書を取得するステップであってよい。アップロードされた第1文書は、例示システム100に少なくとも一時的に記憶することができる。
【0034】
210は、第1文書をOCR処理するステップを示している。
【0035】
ステップ210は、従来のOCR技術を用いて、画像である第1文書の各ページから、当該ページに含まれるテキストを認識するステップを含むことができる。テキストを認識する際には、当該テキストが認識されたページ及びページにおける位置を決定することができる。よって、ステップ210においては、認識されたテキスト及びその位置のデータを取得することができる。ステップ210は、取得されたデータを、テキストについての全文検索が可能なように公知の手法で処理し、処理されたデータを全文検索インデックス130に記憶するステップを更に含むことができる。
【0036】
213は、第1文書において所定の記載(後述)を識別するステップを示している。
【0037】
図3は、ステップ213が含むことのできる、より詳細な例示方法300のフローチャートである。なお、例示方法300は、従来のOCR技術を用いたステップ210において取得される上述したデータを利用することができる。
【0038】
310は、第1文書に含まれる複数のページのうちの1つのページを選択するステップを示している。ステップ310においては、第1文書の最初のページから最後のページまで順に選択されてよい。
【0039】
320は、選択したページにおいて、1以上の所定の記載のうちの何れか1つの存否の検出を試みるステップを示している。
【0040】
1つの所定の記載は、固定のテキストであってよい。固定のテキストは、例えば、
訴状、
答弁書、
準備書面、
申立書、
反訴状、
控訴状、
控訴趣意書、
抗告状、
証拠説明書、
証拠申出書、
訴訟委任状、
委任状、
口頭弁論期日請書、
期日請書、
弁論要旨、
弁護人選任届、及び、
判決
であってよいが、これらに限定されるわけではない。
【0041】
あるいは、1つの所定の記載は、ワイルドカードを含むテキストであってよい。ワイルドカードを含むテキストは、例えば、
A第B号証、
AB号証、
AB、
A第B号証のC、
A第B号証のCのD、
AB号証のC、
AB号証のCのD
ABのC、及び、
ABのCのD
であってよい(Aは訴訟当事者等を特定するために慣用される記載(甲、乙、丙、丁、弁、疎…)を表すワイルドカードであり、B、C及びDはアラビア数字を表すワイルドカードである。以下同様。)が、これらに限定されるわけではない。なお、ワイルドカードを含むテキストは、上記固定のテキストの前後にワイルドカードを含むテキストを加えたもの(例えば、「第B準備書面」や「準備書面B」、「E付け準備書面」(Eは日付を表すワイルドカード。以下同様。))であってよい。また、1つの所定の記載は、正規表現を用いて表現されてよい。
【0042】
ステップ320は、スタンプを認識するためのアルゴリズムを実行することにより、選択されたページにおける1以上の所定の記載のうちの1つ、特に、スタンプを用いて記載される可能性があるテキスト(例えば、上述した「A第B号証」~「ABのCのD」)、が含まれる領域を検出するステップと、検出された領域において、手書き文字を認識するためのアルゴリズムを実行することにより、1以上の所定の記載のうちの1つを検出するステップとを含むことができる。かかるステップによれば、従来のOCR技術によっては認識が困難なスタンプと手書き文字とを併用して記載されるテキストを認識することができる。
【0043】
330は、選択されたページにおいて、1以上の所定の記載のうちの何れか1つの存否を判定するステップを示している。存在すると判定した場合、処理はステップ340に進み、そうでない場合、処理はステップ350に進む。
【0044】
ステップ330は、ステップ320において、選択されたページに1以上の所定の記載のうちの1つが検出された場合に、存在すると判定することができる。あるいは、ステップ330は、ステップ320において、選択されたページの所定の位置において、1以上の所定の記載のうちの1つが検出された場合に、存在すると判定することができる。所定の位置は、ページの冒頭又は第1行から第5行までの中央という位置や、ページの右上という位置であってよいが、これらに限定されるわけではない。
【0045】
340は、ステップ320において検出された所定の記載を識別するステップを示している。ステップ340は、ステップ320において検出された所定の記載が、1以上の所定の記載のうちのどれかを識別するステップであってよい。また、ステップ340は、識別された所定の記載を現在選択されているページに関連付けて記憶するステップを含むことができる。
【0046】
350は、第1文書においてまだ選択されていない次のページはあるかを判定するステップを示している。次のページはあると判定した場合、処理はステップ310に戻り、そうでない場合、処理は終了する。
【0047】
図2Aに戻ると、215は、第1文書における文書の区切りを検出するステップを示している。ステップ215は、ステップ340においてある所定の記載(例えば、「訴状」)が識別されたページから、別の所定の記載(例えば、「答弁書」)が識別されたページの直前のページまでを識別するステップを含むことができ、この識別されたページ(ある所定の記載が識別されたページから、別の所定の記載が識別されたページの直前のページまで)の前後を文書の区切りとして検出することができる。なお、上記「ある所定の記載」は、識別された1以上のページに関連付けられることになる。あるいは、ステップ215においては、ステップ320においてある所定の記載が連続して識別された複数のページの前後を文書の区切りとして検出してもよい。
【0048】
220は、第1文書から、1以上の第2文書を抽出するステップを示している。ステップ220は、ステップ215において検出された文書の区切りを用いて第1文書を分割し、分割された各文書を第2文書として抽出してよい。ステップ220は、各第2文書に関連付けられた所定の記載と、各第2文書の第1文書における位置(例えば、第1文書における各第2文書の開始ページ及び終了ページ)とをドキュメントテーブル132に記憶するステップを含むことができる。また、ステップ220は、各第2文書の名前を、当該第2文書に関連付けられた所定の記載に少なくとも基づき決定し、ドキュメントテーブル132に記憶するステップを含むことができる。
【0049】
例えば、ステップ213において取得されたデータ(例えば、識別された所定の記載)等からある第2文書が書証であると識別できる場合には、当該第2文書の名前を、上述した「A第B号証」等として決定することができる。また、例えば、ステップ210において取得されたデータ等からある第2文書が書証であると識別でき、かつ、書証のタイトルが識別できる場合には、当該第2文書の名前を、上述した「A第B号証」に当該タイトルを加えたものとして決定することができる。
【0050】
また、ステップ213において取得されたデータ(例えば、識別された所定の記載)等からある第2文書が主張書面等であり、当該主張書面等の提出者及び事件名が識別できる場合には、当該第2文書の名前を「αβ_γ」として決定することができ、ここで、αは提出者(「被告」や「原告」等。)であり、βは当該第2文書に関連付けられた所定の記載であり、γは事件名である。
【0051】
図2Bを参照すると、225は、ステップ220において抽出された1以上の第2文書のうちの1つを選択するステップを示している。
【0052】
230は、選択された第2文書について、文章の階層構造を解析して、入れ子構造を有する複数の文章ブロックを識別するステップを示している。ステップ230は、ステップ210において取得される上述したデータを利用することができる。
【0053】
図4は、例示の第2文書400における文書の階層構造を表す図である。
【0054】
410及び415は、第1階層の文章ブロックを示している。例示の第2文書400において、第1階層の文章ブロックは、「第B」(上述したように、Bはアラビア数字のワイルドカードである。)という符号で始まる文章ブロックである。
【0055】
420、425、427、430及び435は、第1階層よりも下位の第2階層の文章ブロックを示している。例示の第2文書400において、第2階層の文章ブロックは、「B」という符号で始まる文章ブロックである。第2階層の文章ブロック420、425及び427は第1階層の文章ブロック410の入れ子となっている一方、第2階層の文章ブロック430及び435は第1階層の文章ブロック415の入れ子となっている。
【0056】
440及び445は、第2階層よりも下位の第3階層の文章ブロックを示している。例示の第2文書400において、第3階層の文章ブロックは、「(B)」という符号で始まる文章ブロックである。第3階層の文章ブロック440及び445は第2階層の文章ブロック425の入れ子となっている。例示の第2文書400において、第2階層の文章ブロック420、427、430及び435に、第3階層の文章ブロックの入れ子はない。
【0057】
なお、第2文書400全体を、第1階層よりも上位の第0階層の文章ブロックに相当するものと考えてもよい。
【0058】
図2Bに戻ると、ステップ230は、上述したような各文章ブロックの位置(例えば、各文章ブロックの第2文書における開始ページ及び行並びに終了ページ及び行。)を識別し、当該文章ブロックを一意に識別する識別子(以下、「文章ブロックID」という。)とともに被参照アンカーテーブル134に記憶するステップを含むことができる。
【0059】
また、ステップ230は、第2文書の文章の階層構造に係るルールを識別するステップを含むことができる。本開示における文章の階層構造に係るルールとは、各階層の文章ブロックの文頭の符号(「第B」、「B」及び「(B)」)の書式のことである。
【0060】
文章の階層構造に係るルールの一例を以下に記載する。
【0061】
【表1】
【0062】
文章の階層構造に係るルールの別の一例を以下に記載する。
【表2】
【0063】
なお、文章の階層構造における階層数は9に限定されず、任意である。また、文章の階層構造は、上に示したものに限定されるわけではない。
【0064】
235は、ステップ225において、1以上の第2文書のうち、選択されていない次の第2文書は存在するかを判定するステップを示している。存在すると判定した場合、処理はステップ225に戻り、そうでない場合、処理は図2Cのステップ240に進む。
【0065】
図2Cを参照すると、240は、ステップ220において抽出された1以上の第2文書のうちの1つを選択するステップを示している。
【0066】
245は、選択された第2文書が含む参照文言について処理するステップを示している。ステップ245は、ステップ210において取得される上述したデータを利用することができる。
【0067】
図5は、ステップ245が含むことのできる、より詳細な例示方法500のフローチャートである。
【0068】
510は、選択された第2文書において、1以上の参照文言を検出するステップを示している。参照文言は、ステップ320に関連して上述した、1以上の所定の記載(例えば、「第B準備書面」)の各々であってよい。あるいは、参照文言は、ページ番号、又は、ページ番号及び行番号を識別する記載(「Bページ」や「第B頁第C行」等)であってよい。あるいは、参照文言は、ステップ230に関連して上述した、文章ブロックの文頭の符号の記載であってよい。あるいは、参照文言は、上述したものの組み合わせ、又は、上述したものと省略を表す記載(「同」や「当該」、「上記」、「前記」等)の組み合わせであってよい。なお、参照文言は、これらに限定されるわけではなく、文書又はその部分の参照を表す任意の記載であってよい。ステップ510は、識別された各参照文言及びその位置(参照文言が検出された文書及び当該文書内の位置)並びに当該参照文言を一意に識別する識別子(以下、「参照文言ID」という。)を参照元アンカーテーブル136に記憶するステップを含むことができる。
【0069】
520は、ステップ510において検出された1以上の参照文言のうちの1つを選択するステップを示している。
【0070】
530は、選択した参照文言に補完が必要かを判定するステップを示している。ステップ530においては、選択した参照文言が上述した省略を表す記載を含んでいる場合や、選択した参照文言からは参照先であるか又は参照先を含む文書を識別できない場合等に、補完が必要であると判定することができる。補完が必要であると判定した場合、処理はステップ535に進み、そうでない場合、処理はステップ540に進む。
【0071】
535は、選択した参照文言を、選択されている第2文書(ステップ240において選択した第2文書)における先行する別の参照文言に少なくとも基づき補完するステップを示している。
【0072】
ステップ535は、選択した参照文言を、上記別の参照文言と、文章の階層構造に係るルールとに基づき補完するステップを含んでいてよい。例えば、選択した参照文言が「同4(3)エ」であり、直近の別の参照文言が「被告第3準備書面第2の3(1)ウ」である場合、符号「4」より1つ上位の階層の符号が「第B」であることを文書の階層構造に係るルールに基づき決定し、選択した参照文言を「被告第3準備書面第2の4(3)エ」と補完してよい。なお、文章の階層構造に係るルールは文章によって変わりうるため、文章の階層構造に係るルールは、上記別の参照文言の参照先であるか又は参照先を含む文書に基づき識別されることが好ましい。例えば、直近の別の参照文言である「被告第3準備書面第2の3(1)ウ」の参照先を含む文書である「被告第3準備書面」に基づき、文章の階層構造に係るルールを識別してよい。なお、文章の階層構造に係るルールは、可能であれば、選択されている第2文書における先行する別の参照文言自体から識別してもよい。
【0073】
ステップ535は、選択した参照文言を、補完された別の参照文言に少なくとも基づき補完するステップを含んでいてよい。例えば、選択した参照文言が「同オ」であり、別の参照文言が「同4(3)エ」である場合に、別の参照文言を「被告第3準備書面第2の4(3)エ」と補完したときには、符号「オ」より1つ上位の階層の符号が「(B)」であるという文章の階層構造に係るルール、及び、補完された別の参照文言である「被告第3準備書面第2の4(3)エ」に基づき、選択した参照文言を「被告第3準備書面第2の4(3)オ」と補完してよい。
【0074】
540は、選択した参照文言について参照先を識別するステップを示している。ステップ540は、選択した参照文言又は選択し補完された参照文言に基づき、ステップ220において抽出された1以上の第2文書のうちの1つを参照先として識別するステップを含むことができる。また、ステップ540は、選択した参照文言又は選択し補完された参照文言に基づき、ステップ220において抽出された1以上の第2文書のうちの1つが含む、ステップ230において識別された複数の文章ブロックのうちの1つを参照先として識別するステップを含むことができる。ない、ステップ540においては、参照先であるか又は参照先を含む第2文書を、第2文書に関連付けられた所定の記載(例えば、「第3準備書面」)が、参照文言又は補完された参照文言(例えば、「第3準備書面第2の3(1)オ」)に含まれているかに基づき識別することができる。また、ステップ540は、選択した参照文言を識別するための情報(例えば、参照文言ID)をその参照先を識別するための情報(例えば、文章ブロックID)に関連付けてリンクテーブル138に記憶するステップを含むことができる。
【0075】
550は、ステップ510において検出した1以上の参照文言のうち、選択していない次の参照文言は存在するかを判定するステップを示している。存在すると判定した場合、処理はステップ520に戻り、そうでない場合、処理は終了する。
【0076】
図2Cに戻ると、250は、ステップ240において、1以上の第2文書のうち、選択されていない次の第2文書は存在するかを判定するステップを示している。存在すると判定した場合、処理はステップ240に戻り、そうでない場合、処理は終了する。
【0077】
図6は、例示方法200により文書を処理した後に、例示システム100の文書提示部120によりサービスを受けるクライアント160に表示される例示画面600である。例示画面600は、クライアント160が実行するウェブブラウザ上にウェブページとして表示されてよい。
【0078】
610は、文書の一覧を表示する文書リスト部を示している。なお、一覧が表示される文書は、例示方法200を実行することにより得られた1以上の第2文書であってよい。また、文書の一覧は1以上の文書にそれぞれ対応する1以上の項目を含み、各項目は、対応する文書の名前(図6における「主張書面1」、「甲1号証」及び「準備書面1」)と、対応する文書の内容の一部「-…」とを含んでいてよいが、これらに限定されるわけではない。例示システム100は、クライアント160との通信を介して、文書リスト部610が含む項目の選択を受けたときに、選択を受けた項目に対応する文書を選択するように構成することができる。
【0079】
615は、全文検索用テキストボックス部を示している。例示システム100は、クライアント160との通信を介して、全文検索用テキストボックス部615に文字が入力されたときに、当該文字が検索にヒットする文書の一覧が文書リスト部610に表示されるように構成することができる。
【0080】
620は、文書の内容を表示する文書表示部を示している。文書表示部620は、ページ単位で文書を表示することができる。
【0081】
622は、表示された文書に含まれる参照文言(「甲3の4」)を示している。図6において、参照文言は、下線が付されることにより他の文言と区別される態様で表示されていることが理解されよう。なお、下線を付すことは「他の文言と区別される態様」の一例に過ぎない。「他の文言と区別される態様」は、他の文言と文字色を変えること、他の文言と文字の背景色を変えること、他の文言と文字のフォントを変えること、又は、これらを組み合わせることであってもよいが、これらに限定されるわけではない。また、図6において参照文言は1つのみ表示されているが、参照文言は同時に複数表示される場合があることは言うまでもない。以下、文書に含まれる参照文言のことを「参照元アンカー」ともいう。
【0082】
624は、他の文書が参照先としているか、又は、参照先とする可能性のある、表示された文書の部分の符号(「1」及び「2」)を示している。符号624は、他の文言と区別される態様で表示されてよい。また、符号624は、参照文言622とも区別される態様で表示されてよい。なお、参照先とする他の文書が存在しない部分の符号については、他の文言と同様の態様で表示されてもよい。以下、他の文書が参照先としているか、又は、参照先とする可能性のある、文書の部分の符号のことを「参照先アンカー」ともいう。なお、参照先アンカーから、参照先とする他の文書が存在しない部分の符号は除外してもよい。
【0083】
630は、各種情報表示部を示している。各種情報表示部630においては、状況に応じて様々な情報を表示することができる。
【0084】
例えば、例示システム100は、クライアント160との通信を介して、特定の種類の文書(例えば甲1号証等の書証)が文書表示部620に表示されたときに、各種情報表示部630に参照元アンカーの一覧を表示するように構成することができる。この参照元アンカーの一覧は、文書表示部620に表示した文書を参照先とする1以上の参照元アンカーにそれぞれ対応する1以上の項目を含み、各項目は、対応する参照元アンカーの文言(補正前の参照文言)と、対応する参照元アンカーを含む文書の名前と、当該文書における対応する参照元アンカーを含むページの番号と、当該文書における対応する参照元アンカーの前後の文章とを含んでいてよいが、これらに限定されるわけではない。例示システム100は、クライアント160との通信を介して、参照元アンカーの一覧が含む項目の選択を受けたときに、選択を受けた項目に対応する参照元アンカーを含む文書又は当該文書中の対応する参照元アンカーを含む部分を選択するように構成することができる。
【0085】
また、例えば、例示システム100は、クライアント160との通信を介して、特定の種類の文書以外の文書(例えば主張書面1や準備書面1等の書面)が文書表示部620に表示されたときに、各種情報表示部630に参照先アンカーの一覧を表示するように構成することができる。この参照先アンカーの一覧は、文書表示部620に表示した文書が含む1以上の参照先アンカーにそれぞれ対応する1以上の項目を含み、各項目は、対応する参照先アンカー(符号)と、対応する参照先アンカーが登場する当該文書におけるページの番号と、対応する参照先アンカーの部分の文章の少なくとも一部とを含んでいてよいが、これらに限定されるわけではない。例示システム100は、クライアント160との通信を介して、参照先アンカーの一覧が含む項目の選択を受けたときに、選択を受けた項目に対応する参照先アンカーの参照先である文書又はその部分を選択するように構成することができる。
【0086】
例えば、例示システム100は、クライアント160との通信を介して、文書表示部620に表示された参照元アンカーの選択を受けたときに、各種情報表示部630に、選択を受けた参照元アンカーの参照先についての情報を表示することができる。参照先についての情報は、当該参照先であるか又は当該参照先を含む文書の名前と、当該文書のミニビュー又は内容の一部(例えば、参照先である部分の少なくとも一部)とを含んでいてよいが、これに限定されるわけではない。例示システム100は、クライアント160との通信を介して、各種情報表示部630に表示された参照先についての情報の選択を受けたときに、当該参照先である文書又はその部分を選択するよう構成することができる。
【0087】
更に、例えば、例示システム100は、クライアント160との通信を介して、文書表示部620に表示された参照先アンカーの選択を受けたときに、各種情報表示部630に参照元アンカーの一覧を表示することができる。この参照元アンカーの一覧は、選択を受けた参照先アンカーの部分を参照先とする1以上の参照元アンカーにそれぞれ対応する1以上の項目を含み、各項目は、対応する参照元アンカーの文言(補正前の参照文言)と、対応する参照元アンカーを含む文書の名前と、当該文書における対応する参照元アンカーを含むページの番号と、当該文書における対応する参照元アンカーの前後の文章とを含んでいてよいが、これらに限定されるわけではない。これを実現するために、例示システム100は、選択を受けた参照先アンカーの部分を参照先とする1以上の参照元アンカー即ち参照文言を識別し、識別された1以上の参照文言についての表示として識別された1以上の参照元アンカーの一覧を各種情報表示部630に表示するためのデータを準備するように構成することができることが理解されよう。例示システム100は、クライアント160との通信を介して、参照元アンカーの一覧が含む項目の選択を受けたときに、選択を受けた項目に対応する参照元アンカーを含む文書又は当該文書中の対応する参照元アンカーを含む部分を選択するよう構成することができる。
【0088】
図7A及び7Bは、本発明の一実施形態に係る、例示画面600の表示に関連して実行される例示方法700のフローチャートである。なお、上述したように、例示方法700は例示システム100が含む文書提示部120が実行するものである。したがって、例示方法700はコンピュータが実行するものと考えてよい。また、例示方法700で処理される文書は、例示方法200を実行することにより得られた1以上の第2文書であってよい。
【0089】
705は、1以上の文書についてのデータを取得するステップを示している。ステップ705は、ドキュメントテーブル132から、例示方法200を実行することにより得られた1以上の第2文書の各々について、名前及びその第1文書における開始ページ及び終了ページを取得するステップを含むことができる。ステップ705は、記憶された第1文書を取得するステップを更に含むことができる。
【0090】
710は、ステップ705において取得したデータに基づき、文書リスト部610に文書の一覧を表示するためのデータを、クライアント160に送信するステップを示している。
【0091】
715は、文書が選択されたかを判定するステップを示している。文書が選択されたと判定した場合、処理はステップ720に進み、そうでない場合、処理はステップ715に戻る。上述したように、例示システム100は、クライアント160との通信を介して、文書リスト部610が含む項目の選択を受けたときに、選択された項目に対応する文書を選択するように構成することができる。
【0092】
720は、選択された文書についてのデータを取得するステップを示している。なお、選択された文書は、その部分が選択された文書を含む。
【0093】
ステップ720は、参照元アンカーテーブル136から、選択された文書に含まれる参照文言及び当該文書内の位置を取得するステップを含むことができる。
【0094】
ステップ720は、被参照アンカーテーブル134から、選択された文書が含む各文章ブロックの位置を取得し、リンクテーブル138から、選択された文書及び各文章ブロックが参照先として関連付けられた1以上の参照文言を取得し、参照元アンカーテーブル136から、取得した1以上の参照文言の各々を含む第2文書の名前及び当該文書内の位置を取得するステップを更に含むことができる。
【0095】
図7Bを参照すると、725は、選択された文書又は選択された文書の部分を、参照文言が他の文言と区別される態様で、文書表示部620に表示するためのデータを、クライアント160に送信するステップを示している。なお、当該データは、参照先アンカーも他の文言と区別される態様で表示されるように構成されていてよい。更に、当該データは、参照先アンカーが参照文言とも区別される態様で表示されるように構成されていてよい。選択された文書の部分を表示することは、選択された文書の部分の始まりを含む当該文書のページを表示することであってよい。また、ステップ725は、ステップ705及び720において取得されたデータを用いて実行されてよい。
【0096】
730は、選択された文書は特定の種類の文書かを判定するステップを示している。この判定は、選択された文書の名前に基づき実行されてよい。特定の種類の文書であると判定した場合、処理はステップ735に進み、そうでない場合、処理はステップ740に進む。
【0097】
735は、各種情報表示部630に参照元アンカーの一覧を表示するためのデータをクライアント160に送信するステップを示し、740は、各種情報表示部630に参照先アンカーの一覧を表示するためのデータをクライアント160に送信するステップを示している。なお、上記参照元アンカーの一覧は、文書表示部620に表示した文書を参照先とする1以上の参照元アンカーにそれぞれ対応する1以上の項目を含んでいてよく、上記参照先アンカーの一覧は、文書表示部620に表示した文書が含む1以上の参照先アンカーにそれぞれ対応する1以上の項目を含んでいてよい。ステップ735及び740は、ステップ705及び720において取得されたデータを用いて実行されてよい。
【0098】
750は、文書表示部620に表示された参照元アンカーが選択されたかを判定するステップを示している。選択されたと判定された場合、処理はステップ755に進み、そうでない場合、処理はステップ760に進む。例示システム100は、クライアント160との通信を介して、文書表示部620に表示された参照元アンカーの選択を受けたときに、当該参照元アンカーを選択するように構成することができる。
【0099】
755は、各種情報表示部630に、選択された参照元アンカーの参照先についての情報を表示するためのデータを、クライアント160に送信するステップを示している。ステップ755は、選択された即ち選択を受けた参照元アンカー即ち参照文言の参照先についての情報を表示するためのデータを準備するステップを含むことができる。ステップ755は、ステップ705及び720において取得されたデータを用いて実行されてよい。
【0100】
760は、文書表示部620に表示された参照先アンカーが選択されたかを判定するステップを示している。選択されたと判定された場合、処理はステップ765に進み、そうでない場合、処理はステップ770に進む。例示システム100は、クライアント160との通信を介して、文書表示部620に表示された参照先アンカーの選択を受けたときに、当該参照先アンカーを選択するように構成することができる。
【0101】
765は、各種情報表示部630に参照元アンカーの一覧を表示するためのデータをクライアント160に送信するステップを示している。この参照元アンカーの一覧は、選択された参照先アンカーの部分を参照先とする1以上の参照元アンカーにそれぞれ対応する1以上の項目を含んでいてよい。ステップ765は、選択された参照先アンカーの部分を参照先とする1以上の参照元アンカー即ち参照文言を識別し、識別された1以上の参照文言についての表示として識別された1以上の参照元アンカーの一覧を各種情報表示部630に表示するためのデータを準備するステップを含むことができる。ステップ765は、ステップ705及び720において取得されたデータを用いて実行されてよい。
【0102】
770は、文書又は文書の部分が選択されたかを判定するステップを示している。選択されたと判定した場合、処理は図7Aのステップ720に戻り、そうでない場合、処理はステップ750に戻り、ループを形成する。上述したように、例示システム100は、クライアント160との通信を介して、文書リスト部610が含む項目の選択を受けたときに、選択された項目に対応する文書を選択するように構成することができる。また、上述したように、例示システム100は、クライアント160との通信を介して、参照先アンカーの一覧が含む項目の選択を受けたときに、選択を受けた項目に対応する参照先アンカーの参照先である文書又はその部分を選択するように構成することができる。上述したように、例示システム100は、クライアント160との通信を介して、各種情報表示部630に表示された参照先についての情報の選択を受けたときに、当該参照先である文書又はその部分を選択するよう構成することができる。更に、上述したように、例示システム100は、クライアント160との通信を介して、参照元アンカーの一覧が含む項目の選択を受けたときに、選択を受けた項目に対応する参照元アンカーを含む文書又は当該文書中の対応する参照元アンカーを含む部分を選択するように構成することができる。
【0103】
なお、例示方法700は任意のタイミングで終了してよい。
【0104】
以下、本発明の一実施形態を実施するために用いることができるコンピュータのハードウエア構成の一例について説明する。
【0105】
図8は、コンピュータのハードウエア構成の一例を表す図である。同図に示すように、コンピュータ800は、ハードウエア資源として、主に、プロセッサ810と、主記憶装置820と、補助記憶装置830と、入出力インターフェース840と、通信インターフェース850とを備えており、これらはアドレスバス、データバス、コントロールバス等を含むバスライン860を介して相互に接続されている。なお、バスライン860と各ハードウエア資源との間には適宜インターフェース回路(図示せず)が介在している場合もある。
【0106】
プロセッサ810は、CPUやマイクロプロセッサ等のコンピュータ全体又は少なくとも一部の制御を行うものである。なお、1つのコンピュータは複数のプロセッサ810を含む場合がある。このような場合、「プロセッサ」は、複数のプロセッサ810の総称であってもよい。
【0107】
主記憶装置820は、プロセッサ810に対して作業領域を提供する、SRAM(Static Random Access Memory)やDRAM(Dynamic Random Access Memory)等の揮発性メモリである。
【0108】
補助記憶装置830は、ソフトウエアであるプログラム等やデータ等を格納する、HDDやSSD、フラッシュメモリ等の不揮発性メモリである。当該プログラムやデータ等は、任意の時点で補助記憶装置830からバスライン860を介して主記憶装置820へとロードされる。補助記憶装置830は、コンピュータ可読記憶媒体、非一時的コンピュータ可読記憶媒体、又は、コンピュータ判読可能な貯蔵媒体として参照されることがある。なお、プログラムは、プロセッサに所望の処理を実行させる命令を含むものである。
【0109】
入出力インターフェース840は、情報を提示すること及び情報の入力を受けることの一方又は双方を行うものであり、デジタル・カメラ、キーボード、マウス、ディスプレイ、タッチパネル・ディスプレイ、マイク、スピーカ、各種センサ等である。
【0110】
通信インターフェース850は、インターネットやローカル・エリア・ネットワーク(LAN)の等うちの1以上から構成されたネットワーク855と接続されるものであり、ネットワーク855を介してデータを送受する。通信インターフェース850とネットワーク855とは、有線又は無線で接続されうる。通信インターフェース850は、ネットワークに係る情報、例えば、Wi-Fiのアクセスポイントに係る情報、通信キャリアの基地局に関する情報等も取得することがある。
【0111】
上に例示したハードウエア資源とソフトウエアとの協働により、コンピュータ800は、所望の手段として機能し、所望のステップを実行し、所望の機能を実現させることできることは、当業者には明らかであろう。
【0112】
以上、本開示の実施形態の幾つかの例を説明してきたが、これらは例示にすぎず、本開示の技術的範囲を限定するものではないことが理解されるべきである。本開示の趣旨及び範囲から逸脱することなく、実施形態の変更、追加、改良などを適宜行うことができることが理解されるべきである。本開示の技術的範囲は、上述した実施形態のいずれによっても限定されるべきではなく、特許請求の範囲及びその均等物によってのみ規定されるべきである。
【符号の説明】
【0113】
150…ネットワーク
200…例示方法
300…例示方法
400…第2文書(第0階層の文章ブロック)
410、415…第1階層の文章ブロック
420、425、427、430、435…第2階層の文章ブロック
440、445…第3階層の文章ブロック
500…例示方法
600…例示画面
610…文書リスト部
615…全文検索用テキストボックス部
620…文書表示部
622…参照文言(参照元アンカー)
624…文書の部分の符号(参照先アンカー)
630…各種情報表示部
700…例示方法
855…ネットワーク
860…バスライン
図1
図2A
図2B
図2C
図3
図4
図5
図6
図7A
図7B
図8