特許6802590 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日本法務システム研究所の特許一覧

特許6802590情報処理システム及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】6802590

(24)【登録日】2020年12月1日

(45)【発行日】2020年12月16日

(54)【発明の名称】情報処理システム及びプログラム

(51)【国際特許分類】

G06F 40/189 20200101AFI20201207BHJP

G06F 40/258 20200101ALI20201207BHJP

【ＦＩ】

G06F40/189

G06F40/258

【請求項の数】11

【全頁数】18

(21)【出願番号】特願2020-58199(P2020-58199)

(22)【出願日】2020年3月27日

【審査請求日】2020年3月27日

【早期審査対象出願】

(73)【特許権者】

【識別番号】518287076

【氏名又は名称】株式会社日本法務システム研究所

(74)【代理人】

【識別番号】100158850

【弁理士】

【氏名又は名称】明坂正博

(72)【発明者】

【氏名】堀口圭

(72)【発明者】

【氏名】宮坂豪

(72)【発明者】

【氏名】植木智之

【審査官】成瀬博之

(56)【参考文献】

【文献】特開平０２−２５７２６０（ＪＰ，Ａ）

【文献】特開平０７−３３４５７４（ＪＰ，Ａ）

【文献】原真男他２名，日本語ワードプロセッサRupoにおける自動文書編集機能，東芝レビュー，日本，株式会社東芝，１９９２年１１月１日，47巻11号，874-876頁

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｆ４０／００−４０／５８

(57)【特許請求の範囲】

【請求項1】

項目番号に含まれる文字の出現パターンそれぞれと、当該出現パターンそれぞれを識別する出現パターン識別子とが関連付けられて記憶されているストレージと、
項目番号が記載された書類のデータにおいて、文の先頭部分に含まれる文字が、前記ストレージに記憶されている出現パターンに含まれる文字と一致する毎に、当該文字を、前記ストレージにおいて当該出現パターンに関連付けられた出現パターン識別子に変換する変換手段と、
変換後の文字列同士が一致する文字列を含む文を、同じスペースだけインデントするように調整する調整手段と、
前記ストレージを参照して、前記調整手段で調整後の文字列同士が一致する同一文字列毎に、当該文字列に含まれる出現パターン識別子を、当該文字列に含まれる出現パターン識別子に対応する出現パターンに含まれる複数の文字から順に取り出された文字で順に置換する置換手段と、
を備える情報処理システム。

【請求項2】

前記データに含まれる文字列のうち、前記出現パターンが出現する前及び／または後の文字を、予め決められたルールに従って、記号に変換する記号変換手段と、
前記変換手段の変換と前記調整手段の調整の後に、前記記号変換手段によって変換された記号を元の文字に復元する文字復元手段と、
を備える請求項１に記載の情報処理システム。

【請求項3】

前記調整手段は、前記変換後の先頭部分の文字列同士が一致する文字列を、同一インデントに揃える際に、当該変換後の先頭部分の文字毎に、当該文字列が最初に出現した場合のインデントに合わせて調整する
請求項１または２に記載の情報処理システム。

【請求項4】

前記調整手段は、前記変換後の先頭部分の文字列同士が一致する文字列を、同一インデントに揃える際に、当該変換後の先頭部分の文字毎に、多数決で一番多いインデントに合わせて調整する
請求項１または２に記載の情報処理システム。

【請求項5】

前記調整手段は、前記変換後の先頭部分の文字列同士が一致する文字列を、同一インデントに揃える際に、インデントの文字数毎に、最初に出現した文字列の重みづけが重くなるように加重平均したスコアを算出し、当該スコアに応じてインデントを調整する
請求項１から３のいずれか一項に記載の情報処理システム。

【請求項6】

前記データから、文の先頭部分の文字列を抽出する抽出手段を備え、
前記変換手段は、前記抽出された文字列に対して、処理を実行する
請求項１から５のいずれか一項に記載の情報処理システム。

【請求項7】

項目番号に含まれる文字の出現パターンそれぞれと、当該出現パターンそれぞれを識別する出現パターン識別子とが関連付けられて記憶されているストレージにアクセス可能なコンピュータを、
項目番号が記載された書類のデータにおいて、文の先頭部分に含まれる文字が、前記ストレージに記憶されている出現パターンに含まれる文字と一致する毎に、当該文字を、前記ストレージにおいて当該出現パターンに関連付けられた出現パターン識別子に変換する変換手段と、
変換後の文字列同士が一致する文字列を含む文を、同じスペースだけインデントするように調整する調整手段と、
前記ストレージを参照して、前記調整手段で調整後の文字列同士が一致する同一文字列毎に、当該文字列に含まれる出現パターン識別子を、当該文字列に含まれる出現パターン識別子に対応する出現パターンに含まれる複数の文字から順に取り出された文字で順に置換する置換手段と、
として機能させるためのプログラム。

【請求項8】

項目番号が記載された書類のデータにおいて、文の先頭部分の文字列から、予め決められた正規表現にパターンマッチする文字列を抽出する抽出手段と、
抽出された文字列を含む文を、同じスペースだけインデントするように調整する調整手段と、を備え、
前記調整手段は、前記抽出された文字列を含む文を、同じスペースだけインデントする際に、当該文字列が最初に出現した場合のインデントに合わせて調整する情報処理システム。

【請求項9】

項目番号が記載された書類のデータにおいて、文の先頭部分の文字列から、予め決められた正規表現にパターンマッチする文字列を抽出する抽出手段と、
抽出された文字列を含む文を、同じスペースだけインデントするように調整する調整手段と、を備え、
前記調整手段は、前記抽出された文字列を含む文を、同じスペースだけインデントする際に、多数決で一番多いインデントに合わせて調整する情報処理システム。

【請求項10】

コンピュータを、
項目番号が記載された書類のデータにおいて、文の先頭部分の文字列から、予め決められた正規表現にパターンマッチする文字列を抽出する抽出手段と、
抽出された文字列を含む文を、同じスペースだけインデントするように調整する調整手段と、
として機能させるとともに、
前記調整手段が、前記抽出された文字列を含む文を、同じスペースだけインデントする際に、当該文字列が最初に出現した場合のインデントに合わせて調整するように機能させるプログラム。

【請求項11】

コンピュータを、
項目番号が記載された書類のデータにおいて、文の先頭部分の文字列から、予め決められた正規表現にパターンマッチする文字列を抽出する抽出手段と、
抽出された文字列を含む文を、同じスペースだけインデントするように調整する調整手段と、
として機能させるとともに、
前記調整手段が、前記抽出された文字列を含む文を、同じスペースだけインデントする際に、多数決で一番多いインデントに合わせて調整するように機能させるプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理システム及びプログラムに関する。

【背景技術】

【0002】

文章（例えば、契約書、規則など）には、階層構造を有する場合がある。具体的には例えば、契約書、規則では、条、項、号等に区分けした階層構造がある。このような場合、文書の行の先頭を、条、項、号等の階層レベルに従って、各々異なるスペース（例えば文字数）だけ字下げする（インデントするともいう）ことが行われている。例えば、特許文献１では、「第１章」等の文字列が文書構成単位の先頭にあることに着目して、この文字列を検出し、検出した行を、この文字パターンに設定された桁数だけインデントすることが記載されている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開平２−２５７２６０号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、書類（例えば、契約書、規則など）によっては、「第１条」というように、アラビア数字の番号の前に「第」後に「条」を付けた項目番号（細別符号ともいう）の次の下の階層が「第１項」というように、アラビア数字の番号の前に「第」後に「項」を付けた項目番号で表記される場合もあれば、「第１条」という項目番号の次の下の階層（レベルともいう）が「１」という項目番号で表記される場合もある。このように、書類（例えば、契約書、規則など）毎に、項目番号の表記の階層構造が異なっているので、特許文献１の技術のように、予め「第１項」という文字列に対してインデント桁数を設定したとしても、「（１）」と表記されていれば、この「（１）」から始まる文章は適切にインデントされないという問題がある。

【0005】

本発明は、上記問題に鑑みてなされたものであり、項目番号が記載された書類毎に、項目番号に含まれる文字の出現パターンの階層構造が異なっていても、階層毎に適切にインデントを設定することを可能とする情報処理システム及びプログラムを提供することを目的とする。

【課題を解決するための手段】

【0006】

本発明の第１の態様に係る情報処理システムは、項目番号に含まれる文字の出現パターンそれぞれと、当該出現パターンそれぞれを識別する出現パターン識別子とが関連付けられて記憶されているストレージと、項目番号が記載された書類のデータにおいて、文の先頭部分に含まれる文字が、前記ストレージに記憶されている出現パターンに含まれる文字と一致する毎に、当該文字を、前記ストレージにおいて当該出現パターンに関連付けられた出現パターン識別子に変換する変換手段と、変換後の文字列同士が一致する文字列を含む文を、同じスペースだけインデントするように調整する調整手段と、を備える。

【0007】

この構成によれば、項目番号に含まれる文字の出現パターン毎に出現パターン識別子に変換して、変換後の文字列が一致する文字列を同じスペースだけインデントできるので、書類がどのような項目番号に含まれる文字の出現パターンの階層構造を有していたとしても、階層毎にインデントをそろえることができる。よって、項目番号が記載された書類毎に、項目番号に含まれる文字の出現パターンの階層構造が異なっていても、階層毎に適切にインデントを設定することができる。
また、書類毎に条項番号の表記の仕方が異なっていても適切にインデントすることができる。また、出現パターン毎に出現パターン識別子を設定するだけでよいので、設定の労力を低減しつつ、インデントを設定することができる。

【0008】

本発明の第２の態様に係る情報処理システムは、第１の態様に係る情報処理システムであって、前記ストレージを参照して、前記調整手段で調整後の文字列同士が一致する同一文字列毎に、当該文字列に含まれる出現パターン識別子を、当該文字列に含まれる出現パターン識別子に対応する出現パターンに含まれる複数の文字から順に取り出された文字で順に置換する置換手段を更に備える。

【0009】

この構成によれば、元の条項番号の番号もしくは文字が間違っていたとしても、出現パターンに含まれる複数の文字から順に取り出された文字で順に置換することにより、条項番号を正しい番号もしくは文字にリナンバリングすることができる。

【0010】

本発明の第３の態様に係る情報処理システムは、第１または２の態様に係る情報処理システムであって、前記データに含まれる文字列のうち、前記出現パターンが出現する前及び／または後の文字を、予め決められたルールに従って、記号に変換する記号変換手段と、前記変換手段の変換と前記調整手段の調整の後に、前記記号変換手段によって変換された記号を元の文字に復元する文字復元手段と、を備える。

【0011】

この構成によれば、出現パターンが出現する前及び／または後の文字を変換した後にインデントを付与するので、インデント付与時の処理が簡素化され、処理を効率的に行うことができる。

【0012】

本発明の第４の態様に係る情報処理システムは、第１から３のいずれかの態様に係る情報処理システムであって、前記調整手段は、前記変換後の先頭部分の文字列同士が一致する文字列を、同一インデントに揃える際に、当該変換後の先頭部分の文字毎に、当該文字列が最初に出現した場合のインデントに合わせて調整する。

【0013】

この構成によれば、インデントを適切に調整できる可能性を向上させる。

【0014】

本発明の第５の態様に係る情報処理システムは、第１から３のいずれかの態様に係る情報処理システムであって、前記調整手段は、前記変換後の先頭部分の文字列同士が一致する文字列を、同一インデントに揃える際に、当該変換後の先頭部分の文字毎に、多数決で一番多いインデントに合わせて調整する。

【0015】

この構成によれば、インデントを適切に調整できる可能性を向上させる。

【0016】

本発明の第６の態様に係る情報処理システムは、第１から５のいずれかの態様に係る情報処理システムであって、前記調整手段は、前記変換後の先頭部分の文字列同士が一致する文字列を、同一インデントに揃える際に、インデントの文字数毎にスコアを決定し、当該スコアに応じてインデントを調整する。

【0017】

この構成によれば、インデントを適切に調整できる可能性を向上させる。

【0018】

本発明の第７の態様に係る情報処理システムは、第１から６のいずれかの態様に係る情報処理システムであって、前記データから、文の先頭部分の文字列を抽出する抽出手段を備え、前記変換手段は、前記抽出された文字列に対して、処理を実行する。

【0019】

この構成によれば、条項を示す文字列に対して処理を実行することができる。

【0020】

本発明の第８の態様に係るプログラムは、項目番号に含まれる文字の出現パターンそれぞれと、当該出現パターンそれぞれを識別する出現パターン識別子とが関連付けられて記憶されているストレージにアクセス可能なコンピュータを、項目番号が記載された書類のデータにおいて、文の先頭部分に含まれる文字が、前記ストレージに記憶されている出現パターンに含まれる文字と一致する毎に、当該文字を、前記ストレージにおいて当該出現パターンに関連付けられた出現パターン識別子に変換する変換手段と、変換後の文字列同士が一致する文字列を含む文を、同じスペースだけインデントするように調整する調整手段と、として機能させるためのプログラムである。

【0021】

【0022】

本発明の第９の態様に係る情報処理システムは、項目番号が記載された書類のデータにおいて、文の前方の特徴を解析して、項目番号に含まれる文字の出現パターンを抽出し、当該出現パターンに出現パターン識別子を割り当てる抽出手段と、項目番号が記載された書類のデータにおいて、文の先頭部分に含まれる文字が、前記抽出された出現パターンに含まれる文字と一致する毎に、当該文字を、当該出現パターンに割り当てられた出現パターン識別子に変換する変換手段と、変換後の文字列同士が一致する文字列を含む文を、同じスペースだけインデントするように調整する調整手段と、を備える。

【0023】

この構成によれば、項目番号に含まれる文字の出現パターン毎に出現パターン識別子に変換して、変換後の文字列が一致する文字列を同じスペースだけインデントできるので、書類がどのような項目番号に含まれる文字の出現パターンの階層構造を有していたとしても、階層毎にインデントをそろえることができる。

【0024】

本発明の第１０の態様に係るプログラムは、項目番号が記載された書類のデータにおいて、文の前方の特徴を解析して、項目番号に含まれる文字の出現パターンを抽出し、当該出現パターンに出現パターン識別子を割り当てる抽出手段と、項目番号が記載された書類のデータにおいて、文の先頭部分に含まれる文字が、前記抽出された出現パターンに含まれる文字と一致する毎に、当該文字を、当該出現パターンに割り当てられた出現パターン識別子に変換する変換手段と、変換後の文字列同士が一致する文字列を含む文を、同じスペースだけインデントするように調整する調整手段と、としてコンピュータを機能させるためのプログラムである。

【0025】

【0026】

本発明の第１１の態様に係る情報処理システムは、項目番号が記載された書類のデータにおいて、文の先頭部分の文字列から、予め決められた正規表現にパターンマッチする文字列を抽出する抽出手段と、抽出された文字列を含む文を、同じスペースだけインデントするように調整する調整手段と、を備える。

【0027】

この構成によれば、予め決められた正規表現にパターンマッチする文字列を同じスペースだけインデントできるので、書類がどのような項目番号に含まれる文字の出現パターンの階層構造を有していたとしても、階層毎にインデントをそろえることができる。

【0028】

本発明の第１２の態様に係るプログラムは、項目番号が記載された書類のデータにおいて、文の先頭部分の文字列から、予め決められた正規表現にパターンマッチする文字列を抽出する抽出手段と、抽出された文字列を含む文を、同じスペースだけインデントするように調整する調整手段と、としてコンピュータを機能させるためのプログラムである。

【0029】

【発明の効果】

【0030】

本発明の一態様によれば、項目番号に含まれる文字の出現パターン毎に出現パターン識別子に変換して、変換後の文字列が一致する文字列を同じスペースだけインデントできるので、書類がどのような項目番号に含まれる文字の出現パターンの階層構造を有していたとしても、階層毎にインデントをそろえることができる。よって、項目番号が記載された書類毎に、項目番号に含まれる文字の出現パターンの階層構造が異なっていても、階層毎に適切にインデントを設定することができる。
また、書類毎に条項番号の表記の仕方が異なっていても適切にインデントすることができる。また、出現パターン毎に出現パターン識別子を設定するだけでよいので、設定の労力を低減しつつ、インデントを設定することができる。

【図面の簡単な説明】

【0031】

【図1】本実施形態に係る情報処理システムの概略構成図である。

【図2】本実施形態に係る端末の概略構成図である。

【図3】本実施形態に係るサーバの概略構成図である。

【図4】本実施形態に係るサーバのストレージに記憶されているマスタテーブルの一例である。

【図5】インデント処理の一例を示す模式図である。

【図6】図５の続きの模式図である。

【図7】端末１のＷＥＢブラウザにおいて、読み込まれた就業規則が表示された画面の一例である。

【図8】本実施形態に係る処理の一例を示すフローチャートである。

【発明を実施するための形態】

【0032】

以下、各実施形態について、図面を参照しながら説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。

【0033】

上記の課題に加えて、書類（例えば、契約書、規則など）によっては、「第１条」ではなく「１」もしくは「１条」もしくは「第１」などと表記される場合もある。このように書類（例えば、契約書、規則など）毎に、条項番号の表記の仕方が異なっているので、特許文献１の技術のように、予め「第１条」という文字列に対してインデント桁数を設定した場合には、「第１条」ではなく「１」と表記されていれば、この「１」から始まる文章は適切にインデントされないという問題がある。それに対して、本実施形態に係る情報処理システム及びプログラムは、書類毎に条項番号の表記の仕方が異なっていても適切にインデントする。

【0034】

更に上記の課題に加えて、特許文献１の方法では、「第１条」の文字パターンに対してインデント桁数を設定し、「第２条」の文字パターンに対しても同様にインデント桁数を設定しなければならない。すなわち、同じ階層であっても数字が違う場合、それぞれについて、インデント桁数を設定しなければいけないので設定に労力がかかるという問題がある。それに対して、本実施形態に係る情報処理システム及びプログラムは、設定の労力を低減しつつ、インデントを設定することができる。

【0035】

図１は、本実施形態に係る情報処理システムの概略構成図である。図１に示すように、情報処理システムＳは一例として、端末１−１〜１−Ｎと通信回路網ＣＮを介して接続されたサーバ２を備える。情報処理システムＳは一例として、端末１−１、…、１−Ｎ（Ｎは自然数）を備える。なお、情報処理システムＳは、端末１−１、…、１−Ｎ（Ｎは自然数）を備えなくてもよい。

【0036】

端末１−１〜１−Ｎは、別々のユーザが使用する端末装置であり、例えば、多機能携帯電話（いわゆるスマートフォン）などの携帯電話、タブレット、ノートパソコン、またはデスクトップパソコンなどである。端末１−１〜１−Ｎは例えば、ＷＥＢブラウザを用いて、サーバ２から提供される情報を表示する。

【0037】

サーバ２は情報処理装置の一例であり、端末１−１〜１−Ｎに対して情報を提供する。以下、端末１−１〜１−Ｎを総称して端末１とも呼ぶ。

【0038】

図２は、本実施形態に係る端末の概略構成図である。図２に示すように、端末１は例えば、入力インタフェース１１と、通信回路１２と、ストレージ１３と、メモリ１４と、出力インタフェース１５と、プロセッサ１６とを備える。
入力インタフェース１１は、ユーザからの入力を受け付け、受け付けた入力に応じた入力信号をプロセッサ１６へ出力する。
通信回路１２は、通信回路網ＣＮに接続されて、通信回路網ＣＮに接続されているサーバ２と通信する。この通信は有線であっても無線であってもよい。

【0039】

ストレージ１３には、プロセッサ１６が読み出して実行するためのプログラム及び各種のデータが格納されている。
メモリ１４は、データ及びプログラムを一時的に保持する。メモリ１４は、揮発性メモリであり、例えばＲＡＭ（Random Access Memory）である。

【0040】

出力インタフェース１５は、ディスプレイ１７と接続されており、プロセッサ１６の指令に従って情報をディスプレイ１７に出力する。これにより、ディスプレイ１７に情報が表示される。なおディスプレイ１７は端末１に外付けではなく端末１に内蔵されていてもよい。

【0041】

プロセッサ１６は、ストレージ１３から本実施形態に係るプログラムをメモリ１４にロードし、当該プログラムに含まれる一連の命令を実行する。

【0042】

図３は、本実施形態に係るサーバの概略構成図である。図４に示すように、サーバ２は、入力インタフェース２１と、通信回路２２と、ストレージ２３と、メモリ２４と、出力インタフェース２５と、プロセッサ２６とを備える。
入力インタフェース２１は、サーバ２の管理者からの入力を受け付け、受け付けた入力に応じた入力信号をプロセッサ２６へ出力する。
通信回路２２は、通信回路網ＣＮに接続されて、通信回路網ＣＮに接続されている端末１−１〜１−Ｎと通信する。この通信は有線であっても無線であってもよい。

【0043】

ストレージ２３は、プロセッサ２６が読み出して実行するためのプログラム及び各種のデータが格納されている。
メモリ２４は、データ及びプログラムを一時的に保持する。メモリ２４は、揮発性メモリであり、例えばＲＡＭ（Random Access Memory）である。
出力インタフェース２５は、外部の機器（例えばディスプレイと接続されており、プロセッサ２６からの指令に従って当該外部の機器に信号（例えば映像信号）を出力する。これにより、例えばディスプレイに映像信号が入力されて情報が表示される。

【0044】

プロセッサ２６は、ストレージ２３からプログラムをメモリ２４にロードし、当該プログラムに含まれる一連の命令を実行することによって、抽出手段２６１、記号変換手段２６２、変換手段２６３、調整手段２６４、置換手段２６５、文字復元手段２６６、通信制御手段２６７として機能する。それぞれの処理については後述する。

【0045】

図４は、本実施形態に係るサーバのストレージに記憶されているマスタテーブルの一例である。図４に示すように、本実施形態に係るサーバ２のストレージ２３に記憶されている出現パターンマスタテーブルＭ１には、項目番号に含まれる文字（順番を示す文字で、例えば「１」または「あ」など）の出現パターンと、当該出現パターンそれぞれを識別する出現パターン識別子との組のレコードが蓄積されている。
例えば、出現パターン識別子が「Ａ」である場合、当該出現パターンは、１、２、３、…とアラビア数字の順で表記される。出現パターン識別子が「Ｂ」である場合、当該出現パターンは、ａ、ｂ、ｃ、…とアルファベットの順で表記される。出現パターン識別子が「Ｃ」である場合、当該出現パターンは、あ、い、う、…と平仮名の順で表記される。出現パターン識別子が「Ｄ」である場合、当該出現パターンは、ア、イ、ウ、…とカタカナの順で表記される。出現パターン識別子が「Ｅ」である場合、当該出現パターンは、イ、ロ、ハ、…とカタカナの順で表記される。このように、ストレージ２３には、項目番号に含まれる文字の出現パターンそれぞれと、当該出現パターンそれぞれを識別する出現パターン識別子とが関連付けられて記憶されている。

【0046】

図４に示すように、本実施形態に係るサーバ２のストレージ２３に記憶されている記号化規則マスタテーブルＭ２には、文字と、文字が変換される後の記号との組のレコードが蓄積されている。

【0047】

図５は、インデント処理の一例を示す模式図である。図６は、図５の続きの模式図である。図５に示すように、原文では一例として、インデントが乱れているものとする。抽出手段２６１は、項目番号が記載された書類（ここでは一例として原文ともいう）のデータから、文の先頭部分の文字列（例えば、「第１条」、「第１項」など）を抽出する。ここで例えば、先頭部分の文字列は、最初のスペースが検出されるまでの文字列であってもよい。

【0048】

続いて図５に示すように、記号変換手段２６２は、データから抽出された、先頭部分の文字列に対して、項目番号に含まれる文字の出現パターンで使用されている文字（例えば、数字の１、２、アルファベットのａ、ｂ）の前後の文字を記号化する。ここで項目番号に含まれる文字の出現パターンで使用されている文字とは一例として、図４の出現パターンマスタテーブルＭ１の出現パターンで使用されている文字である。また、記号化への変換規則は、図４の記号化規則マスタテーブルＭ２の規則に従っている。

【0049】

これによって、例えば「第１条」については、「第」が「α」、「条」が「β」に変換されるので、「第１条」が「α１β」に変換される。また例えば「第１項」については、「第」が「α」、「項」が「γ」に変換されるので、「第１項」が「α１γ」に変換される。また、例えば「（ａ）」については、「（」が「δ」、「」」が「ε」に変換されるので、「第１項」が「δ１ε」に変換される。

【0050】

このように、記号変換手段２６２は、項目番号が記載された書類のデータに含まれる文字列のうち、出現パターンが出現する前及び／または後の文字を、予め決められたルールに従って、記号に変換する。

【0051】

続いて、図５に示すように、変換手段２６３は、出願パターンで使用されている文字を出現パターン識別子に変換する。例えば「α１β」については「１」が「Ａ」に変換されるので、「α１β」が「αＡβ」に変換される。また例えば、「δａε」については「ａ」が「Ｂ」に変換されるので、「δａε」が「δＢε」に変換される。

【0052】

このように、変換手段２６３は、項目番号が記載された書類（例えば、契約書、規則など）のデータにおいて、文の先頭部分（例えば、「第１条」）に含まれる文字（例えば、「１」）が、ストレージ２３に記憶されている出現パターン（例えば、「１、２、３、…」）に含まれる文字と一致する毎に、当該文字（例えば、「１」）を、ストレージ２３において当該出現パターンに関連付けられた出現パターン識別子（例えば、「Ａ」）に変換する。なお、規則には、規定（例えば、職務発明規定）が含まれる。

【0053】

続いて図６に示すように、調整手段２６４は、変換後文字列が一致するものが同一インデントに揃える。例えば、（１）最初に出現した変換後文字列のインデントが正しいと見なす場合には、例えば、「αＡβ」については、最初に出現した１行目の「αＡβ」のインデントが正しいとして、４行目、５行目の「αＡβ」のインデントを、１行目の「αＡβ」のインデントに揃える。
このように、調整手段２６４は、前記変換後の先頭部分の文字列同士が一致する文字列を、同一インデントに揃える際に、当該変換後の先頭部分の文字毎に、当該文字列が最初に出現した場合のインデントに合わせて調整してもよい。

【0054】

他の例としては、（２）同じ変換後文字列について多数決でインデントする文字数を決めるというものである。具体的には例えば、「αＡβ」については、１行目のインデントが０文字、４行目、５行目の「αＡβ」のインデントが２文字であるので、インデントが２文字である場合が最も多いので、「αＡβ」のインデントが２文字にされる。
このように、調整手段２６４は、前記変換後の先頭部分の文字列同士が一致する文字列を、同一インデントに揃える際に、当該変換後の先頭部分の文字毎に、多数決で一番多いインデントに合わせて調整してもよい。

【0055】

他の例として、調整手段２６４は、同じ変換後文字列について、インデントの文字数毎にスコアをつけ、最もスコアが高いものに決定してもよい。例えば、最初の方に出現した文字列についてのインデントの文字数が重きを置くように、点数を加重平均したものをスコアとしてもよい。これにより、最初の方の出現した文字列のインデントに重きを置きながら、インデントする文字数を決定できる。

【0056】

このように、調整手段２６４は、前記変換後の先頭部分の文字列同士が一致する文字列を、同一インデントに揃える際に、インデントの文字数毎にスコア化を決定し、当該スコアに応じてインデントを調整する。

【0057】

このように、調整手段２６４は、変換手段２６３によって変換後の文字列同士が一致する文字列を含む文を、同じスペース（例えば、同じ文字数）だけインデントするように調整する。

【0058】

続いて図６に示すように、置換手段２６５は、同一文字列毎に、当該文字列に含まれる出現パターン識別子に対応する出現パターンに含まれる複数の文字から順に取り出し、当該文字列が出現する順番に、当該文字列に含まれる出現パターン識別子を、当該文字列が出現する順番と取り出された順番が同じ文字で、当該文字列に含まれる出現パターン識別子を置換する。例えば、「αＡβ」については、置換手段２６５は、１行目の（すなわち１番目に出現する）「αＡβ」において出現パターン識別子「Ａ」を当該出現パターンの１番目の文字「１」に置換して「α１β」を生成する。置換手段２６５は、次に出現する４行目の（すなわち２番目に出現する）「αＡβ」において出現パターン識別子「Ａ」を当該出現パターンの２番目の文字「２」に置換して「α２β」を生成する。置換手段２６５は、次に出現する５行目の（すなわち３番目に出現する）「αＡβ」において出現パターン識別子「Ａ」を当該出現パターンの３番目の文字「３」に置換して「α３β」を生成する。

【0059】

このように、置換手段２６５は、ストレージ２３を参照して、調整手段２６４で調整後の文字列同士が一致する同一文字列毎に、当該文字列に含まれる出現パターン識別子を、当該文字列に含まれる出現パターン識別子に対応する出現パターンに含まれる複数の文字から順に取り出された文字で順に置換する。この構成によれば、元の条項番号の番号もしくは文字が間違っていたとしても、出現パターンに含まれる複数の文字から順に取り出された文字で順に置換することにより、条項番号を、正しい番号もしくは文字にリナンバリングすることができる。

【0060】

続いて図６に示すように、文字復元手段２６６は、記号化規則マスタテーブルＭ２を参照して、出現パターンで使用されている文字の前後の記号を文字に復元する。例えば、「αＡβ」については、文字復元手段２６６は、「α１β」において「α」を「第」に復元し、「β」を「条」に復元することによって、「α１β」を「第１条」に復元する。
このように、文字復元手段２６６は、前記変換手段２６３の変換と前記調整手段２６４の調整の後に、前記記号変換手段２６２によって変換された記号を元の文字に復元する。この構成により、出現パターンが出現する前及び／または後の文字を変換した後にインデントを付与するので、インデント付与時の処理が簡素化され、処理を効率的に行うことができる。

【0061】

図７は、端末１のＷＥＢブラウザにおいて、読み込まれた就業規則が表示された画面の一例である。図７に示すように、第５条の（１）から（１０）が同じインデントにそろっている。このように、就業規則が端末１のＷＥＢブラウザを介して、サーバ２にアップロードされた場合、サーバ２は、図５及び図６の処理によって、インデントを調整し、調整されたインデントで表示されるようにＨＴＭＬデータを出力して端末１へ送信する。これにより、端末１がこのＨＴＭＬデータを受信して表示することにより、端末１のブラウザにインデントが調整された就業規則が表示される。

【0062】

図８は、本実施形態に係る処理の一例を示すフローチャートである。ここでは、項目番号が記載された書類は一例として契約書もしくは規則であるものとして説明する。

【0063】

（ステップＳ１０）まず、端末１のプロセッサ１６は、契約書もしくは規則を読み取る。

【0064】

（ステップＳ２０）次に端末１のプロセッサ１６は、契約書もしくは規則をサーバ２へ通信回路１２から送信する。

【0065】

（ステップＳ３０）次にサーバ２の抽出手段２６１は、文の先頭部分の文字列を抽出する。

【0066】

（ステップＳ４０）次にサーバ２の、記号変換手段２６２は、抽出された先頭部分の文字列について、出現パターンが出現する前及び後の文字を、予め決められたルールに従って、記号に変換する。

【0067】

（ステップＳ５０）次にサーバ２の変換手段２６３は、ステップＳ４０で変換後の文字列に含まれる文字が、ストレージ２３に記憶されている出現パターンに含まれる文字と一致する毎に、当該文字を、ストレージ２３において当該出現パターンに関連付けられた出現パターン識別子に変換する。

【0068】

（ステップＳ６０）次にサーバ２の調整手段２６４は、ステップＳ５０で変換後の文字列同士が一致する文字列を含む文を、同じスペース（例えば、同じ文字数）だけインデントするように調整する。

【0069】

（ステップＳ７０）次にサーバ２の置換手段２６５は、ストレージ２３を参照して、ステップＳ６０で調整後の文字列同士が一致する同一文字列毎に、当該文字列に含まれる出現パターン識別子を、当該文字列に含まれる出現パターン識別子に対応する出現パターンに含まれる複数の文字から順に取り出された文字で順に置換する。

【0070】

（ステップＳ８０）次にサーバ２の置換手段２６５で復元された後の文字列について、ステップＳ４０で記号変換手段２６２によって変換された記号（例えば、「α」）を元の文字（例えば、「第」）に復元する。

【0071】

（ステップＳ９０）次にサーバ２の通信制御手段２６７は、インデント調整後の契約書もしくは規則を表示するための情報（例えば、ＨＴＭＬデータ）を通信回路２２から端末１へ送信する。

【0072】

（ステップＳ１００）次に端末１のプロセッサ１６は、サーバ２から送信された情報を受信し、この情報を用いて、インデント調整後の契約書もしくは規則をディプレイ１７に表示する。

【0073】

以上、本実施形態に係る情報処理システムＳは、項目番号に含まれる文字の出現パターンそれぞれと、当該出現パターンそれぞれを識別する出現パターン識別子とが関連付けられて記憶されているストレージ２３と、項目番号が記載された書類のデータにおいて、文の先頭部分に含まれる文字が、ストレージ２３に記憶されている出現パターンに含まれる文字と一致する毎に、当該文字を、ストレージ２３において当該出現パターンに関連付けられた出現パターン識別子に変換する変換手段２６３と、変換後の文字列同士が一致する文字列を含む文を、同じスペースだけインデントするように調整する調整手段２６４と、を備える。

【0074】

この構成により、項目番号に含まれる文字の出現パターン毎に出現パターン識別子に変換して、変換後の文字列が一致する文字列を同じスペースだけインデントできるので、書類がどのような項目番号に含まれる文字の出現パターンの階層構造を有していたとしても、階層毎にインデントをそろえることができる。よって、項目番号が記載された書類毎に、項目番号に含まれる文字の出現パターンの階層構造が異なっていても、階層毎に適切にインデントを設定することができる。
また、書類毎に条項番号の表記の仕方が異なっていても適切にインデントすることができる。また、出現パターン毎に出現パターン識別子を設定するだけでよいので、設定の労力を低減しつつ、インデントを設定することができる。

【0075】

なお、本実施形態では、条項番号を対象にして説明したが、見出しのレベル毎につけられる項目番号についても同様に適用できる。
また、条項番号の表記の仕方が異なっていても適切にインデントする場合について説明したが、見出しの項目番号の表記の仕方が異なっていても、適切にインデントすることができる。

【0076】

＜変形例１＞
上記の処理では、出現パターン（例えば、「１、２、３、…」、「あ、い、う、…」など）で使用されている文字（例えば、「１」、「あ」など）の前後の文字を記号化して、その後に、出現パターンで使用されている文字を出願パターン識別子に変換して、変換後文字列が一致するものを同一インデントにしたが、これに限ったものではない。
抽出手段２６１は、予め決められた正規表現「第％条」（但し、「％」には、「１、２、３、…」などの数字）にパターンマッチする文字列を抽出し、調整手段２６４が抽出した文字列を同じスペースだけインデントするように調整し（すなわち同一インデント化し）、置換手段２６５が、抽出した文字列が登場した順に、「１、２、３、…」などの数字を「％」に割り振りなおしてもよい（すなわちリナンバリングしてもよい）。なお、リナンバリングについては、項目番号が正しい場合には必ずしもしなくてもよい。このように、抽出手段２６１は、項目番号が記載された書類のデータにおいて、文の先頭部分の文字列から、予め決められた正規表現にパターンマッチする文字列を抽出してもよく、調整手段２６４は、当該抽出された文字列を含む文を、同じスペースだけインデントするように調整してもよい。この構成によれば、予め決められた正規表現にパターンマッチする文字列を同じスペースだけインデントできるので、書類がどのような項目番号に含まれる文字の出現パターンの階層構造を有していたとしても、階層毎にインデントをそろえることができる。

【0077】

＜変形例２＞
上記の実施形態では図４のようにストレージ２３に出現パターンマスタテーブルＭ１で
出現パターンが予め記憶されていたが、これに限ったものではない。特定の項目番号に含まれる文字の出現パターンが出現パターンマスタテーブルＭ１に登録されていない場合、もしくは項目番号に含まれる文字の出現パターンが予め全く記憶されていない場合であっても、抽出手段２６１は、文の前方の特徴を解析して、項目番号に含まれる文字の出現パターン（例えば、「ｒ、ｔ、ｙ、ｕ、ｉ、…」など）を抽出してもよい。例えば、抽出手段２６１は、文の先頭に、「ｒ」、「ｔ」が順に登場していれば、項目番号に含まれる文字の出現パターンとして、「ｒ、ｔ、…」を抽出してもよい。

【0078】

このように、抽出手段２６１は、項目番号が記載された書類のデータにおいて、文の前方の特徴を解析して、項目番号に含まれる文字の出現パターンを抽出し、当該出現パターン（例えば、「ｒ、ｔ、ｙ、ｕ、ｉ、…」）に出現パターン識別子（例えば、「Ｆ」）を割り当ててもよい。その場合、変換手段２６３は、項目番号が記載された書類のデータにおいて、文の先頭部分に含まれる文字（例えば、「ｒ」）が、前記抽出された出現パターン（例えば、「ｒ、ｔ、ｙ、ｕ、ｉ、…」）に含まれる文字と一致する毎に、当該文字（例えば、「ｒ」）を、当該出現パターンに割り当てられた出現パターン識別子（例えば、「Ｆ」）に変換してもよい。そして、調整手段２６４は、変換後の文字列同士が一致する文字列を含む文を、同じスペースだけインデントするように調整してもよい。
この構成によれば、項目番号に含まれる文字の出現パターン毎に出現パターン識別子に変換して、変換後の文字列が一致する文字列を同じスペースだけインデントできるので、書類がどのような項目番号に含まれる文字の出現パターンの階層構造を有していたとしても、階層毎にインデントをそろえることができる。

【0079】

同様に、上記の実施形態では図４のようにストレージ２３に記号化規則マスタテーブルＭ２が予め記憶されていたが、これに限ったものではない。特定の記号化規則が記号化規則マスタテーブルＭ２に登録されていない場合、もしくは記号化規則が予め全く記憶されていない場合であっても、抽出手段２６１は、文前方の特徴を解析して、記号化規則（例えば、「第」をαに変換し「条」をβに変換するなど）を抽出してもよい。例えば抽出手段２６１は、文の先頭に「第１条」、「第２条」が順に登場していれば、「第」を第１の記号（ここでは一例として「α」）に変換する規則に決定し、「条」を第２の記号（例えばここでは一例として「β」）に変換する規則を抽出してもよい。ここで、第１の記号と第２の記号は異なっていればよく、順番に使用する記号が決まっていてもよいし、ランダムに記号を割り当ててもよい。このように、記号変換手段２６２は、データに含まれる文字列のうち、出現パターンが出現する前及び／または後の文字を、記号に変換してもよい。

【0080】

＜変形例３＞
先に、予め設定された設定範囲にある文それぞれを同一インデントに整え、その後、整えた後の文章に対して階層付けをし、リナンバリングを行うようにしてもよい。例えば、予め設定された設定範囲が左端から１〜３文字である場合、左端から１〜３文字の範囲でインデントされている文それぞれを、第１の同一インデント（例えば、左端から２文字インデント）に整え、予め設定された設定範囲が左端から４〜６文字である場合、第２の同一インデント（例えば、左端から５文字インデント）に整え、その後、整えた後の文章に対して、左端から２文字インデントの文を第１階層、左端から５文字インデントの文を第１階層より一つ下の第２階層に設定し、第１階層に含まれる項目番号を、登場順に番号を振りなおし、これとは別に、第２階層に含まれる項目番号を、登場順に番号を振りなおしてもよい（リナンバリングしてもよい）。なお、リナンバリングについては、項目番号が正しい場合には必ずしもしなくてもよい。
また、このようにして設定された階層間のインデント差を相対値（例えば、インデント差が２文字）でもってもよいし、階層ごとにインデントを絶対値（例えば、第１階層は左端から１文字インデント、第２階層は左端から３文字インデント）でもってもよい。

【0081】

＜変形例４＞
サーバ２のプロセッサ２６はルール生成手段として機能してもよく、このルール生成手段は、一定のグループの中の文書の集合体から共通のインデントルール及び／またはナンバリングルール（１つとは限らない）を自動構築してもよい。この自動構築は、人工知能（ＡＩ）で実装しても、ルールベース（もしくはロジックベース）で実装してもよい。
例えば、人工知能（ＡＩ）で実装する場合、ルール生成手段は、一定のグループの中の文書を複数（望ましくは大量）に読み込んで、教師なし学習で、共通のインデントルール及び／またはナンバリングルール（１つとは限らない）を自動構築してもよい。
例えば、ルールベース（もしくはロジックベース）で実装する場合には、ルール生成手段は例えば、登場頻度が上位（例えば、最も頻度が高い）のインデントパターンを共通のインデントルールに設定し、登場頻度が上位（例えば、最も頻度が高い）ナンバリングルールを共通のナンバリングルールに設定してもよい。

【0082】

なお、上述した実施形態で説明したサーバ２の少なくとも一部の手段を、端末１が備えていてもよい。端末１で実行する場合には、ストレージ２３に記憶されているテーブルが端末１のストレージ１３に記憶されていてもよいし、ネットワークＣＮ経由でアクセス可能なストレージに記憶されていてもよい。またストレージ２３は、外付けであってもよいし、ネットワークを介してサーバ２に接続されていてもよい。また上述した実施形態で説明したサーバ２の少なくとも一部は、ハードウェアで構成してもよいし、ソフトウェアで構成してもよい。ソフトウェアで構成する場合には、情報処理システムＳの少なくとも一部の機能を実現するプログラムをフレキシブルディスクやＣＤ−ＲＯＭ等の記録媒体に収納し、コンピュータに読み込ませて実行させてもよい。記録媒体は、磁気ディスクや光ディスク等の着脱可能なものに限定されず、ハードディスク装置やメモリなどの固定型の記録媒体でもよい。

【0083】

また、サーバ２の少なくとも一部の機能を実現するプログラムを、インターネット等の通信回線（無線通信も含む）を介して頒布してもよい。さらに、同プログラムを暗号化したり、変調をかけたり、圧縮した状態で、インターネット等の有線回線や無線回線を介して、あるいは記録媒体に収納して頒布してもよい。

【0084】

さらに、一つまたは複数の情報処理装置によってサーバ２を機能させてもよい。複数の情報処理装置を用いる場合、情報処理装置のうちの１つをコンピュータとし、当該コンピュータが所定のプログラムを実行することにより情報処理システムＳの少なくとも１つの手段として機能が実現されてもよい。

【0085】

また、方法の発明においては、全ての工程（ステップ）をコンピュータによって自動制御で実現するようにしてもよい。また、各工程をコンピュータに実施させながら、工程間の進行制御を人の手によって実施するようにしてもよい。また、さらには、全工程のうちの少なくとも一部を人の手によって実施するようにしてもよい。

【0086】

以上、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。

【符号の説明】

【0087】

１端末
１１入力インタフェース
１２通信回路
１３ストレージ
１４メモリ
１５出力インタフェース
１６プロセッサ
１７ディスプレイ
２サーバ
２１入力インタフェース
２２通信回路
２３ストレージ
２４メモリ
２５出力インタフェース
２６プロセッサ
２６１抽出手段
２６２記号変換手段
２６３変換手段
２６４調整手段
２６５置換手段
２６６文字復元手段
２６７通信制御手段
Ｓ情報処理システム

【要約】（修正有）

【課題】項目番号が記載された書類毎に、項目番号に含まれる文字の出現パターンの階層構造が異なっていても、階層毎に適切にインデントを設定する。
【解決手段】情報処理システムにおいて、サーバは、項目番号に含まれる文字の出現パターンそれぞれと、当該出現パターンそれぞれを識別する出現パターン識別子とが関連付けられて記憶されているストレージと、項目番号が記載された書類のデータにおいて、文の先頭部分に含まれる文字が、ストレージに記憶されている出現パターンに含まれる文字と一致する毎に、当該文字を、ストレージにおいて当該出現パターンに関連付けられた出現パターン識別子に変換する変換手段及び変換後の文字列同士が一致する文字列を含む文を、同じスペースだけインデントするように調整する調整手段を含むプロセッサと、を備える。
【選択図】図３

【図1】