(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023121482
(43)【公開日】2023-08-31
(54)【発明の名称】文書入力支援プログラム、および、文書編集システム
(51)【国際特許分類】
G06F 40/279 20200101AFI20230824BHJP
【FI】
G06F40/279
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022024846
(22)【出願日】2022-02-21
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り 発明の新規性の喪失の例外の規定の適用を受けるための証明書別紙に、提供日と、試用者の住所または居所と、試用者の氏名または名称を一覧で記載している。
(71)【出願人】
【識別番号】521173742
【氏名又は名称】株式会社BoostDraft
(74)【代理人】
【識別番号】110001807
【氏名又は名称】弁理士法人磯野国際特許商標事務所
(72)【発明者】
【氏名】藤井 陽平
(72)【発明者】
【氏名】渡邊 弘
【テーマコード(参考)】
5B091
【Fターム(参考)】
5B091AB06
5B091AB08
5B091AB11
(57)【要約】
【課題】文書から抽出された定義語の正当性を検証する。
【解決手段】文書入力支援プログラム122は、文書に記載された定義セクションから定義語を取得する手順、この文書の前記定義セクション以外の文章から定義語を取得する手順、定義セクションから取得した定義語と定義セクション以外の文章から取得した定義語とを統合する手順、をコンピュータ1に実行させる。
【選択図】
図1
【特許請求の範囲】
【請求項1】
文書に記載された定義セクションから定義語を取得する手順、
前記文書の前記定義セクション以外の文章から定義語を取得する手順、
前記定義セクションから取得した定義語と前記定義セクション以外の文章から取得した定義語とを統合する手順、
をコンピュータに実行させるための文書入力支援プログラム。
【請求項2】
前記定義セクション以外の文章から取得できた定義語が、前記定義セクションから取得できなかったならば、前記定義語に係る警告を表示する手順、
をコンピュータに実行させるための請求項1に記載の文書入力支援プログラム。
【請求項3】
前記定義セクションに同一の定義語が複数回定義されている場合に警告を表示する手順、
をコンピュータに実行させるための請求項1に記載の文書入力支援プログラム。
【請求項4】
前記定義セクション以外の文章から取得できた定義語が、前記定義セクション以外の文章の別の箇所にて再度定義されている場合に警告を表示する手順、
をコンピュータに実行させるための請求項1に記載の文書入力支援プログラム。
【請求項5】
前記定義セクションが存在しない文書において、前記定義セクション以外の文章から取得できた定義語が、定義箇所より前に使用されていた際に警告を表示する手順、
をコンピュータに実行させるための請求項1に記載の文書入力支援プログラム
【請求項6】
前記定義セクションおよび/または前記定義セクション以外の文章から取得した定義語が前記文書に記載されている箇所を検知する手順、
前記定義語が使用されている箇所に対するユーザ入力を検知した際に、当該定義語の意味を表示する手順、
をコンピュータに実行させるための請求項1に記載の文書入力支援プログラム。
【請求項7】
前記文書に記載されている所定の用語のうち、前記定義セクションおよび/または前記定義セクション以外の文章から取得した定義語に含まれないものを未定義語として警告する手順、
をコンピュータに実行させるための請求項1に記載の文書入力支援プログラム。
【請求項8】
文書に記載された定義セクションから定義語を取得する定義セクション解析部と、
前記文書の定義セクション以外の文章から定義語を取得するインライン解析部と、
前記定義セクション解析部が取得した定義語と前記インライン解析部が取得した定義語とを統合する統合部と、
を備えることを特徴とする文書編集システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書入力支援プログラム、および、文書編集システムに関する。
【背景技術】
【0002】
従来から、ワードプロセッサやワープロソフトなどを使用して、ユーザが文書データ(文書)を編集する文書処理装置が知られている。このように文書を記載する上で、ユーザがその単語の意味を定義している場合がある。文書の意味を誤りなく伝達するためである。
【0003】
特許文献1には、形態素解析を行い単語に分割し、「~とは-である」等の言語パタンで抽出された「~」に相当する単語等に「定義属性」を与える発明が記載されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に記載されている発明によれば、所定の言語パタンで記載された単語を定義語として抽出できる。しかし、文書内から抽出された定義語が正当でない場合が考慮されていない。
そこで、本発明は、文書から抽出された定義語の正当性を検証することを課題とする。
【課題を解決するための手段】
【0006】
本発明は、上記目的を達成するため、
文書に記載された定義セクションから定義語を取得する手順、
前記文書の前記定義セクション以外の文章から定義語を取得する手順、
前記定義セクションから取得した定義語と前記定義セクション以外の文章から取得した定義語とを統合する手順、
をコンピュータに実行させるための文書入力支援プログラムである。
【0007】
本発明は、文書に記載された定義セクションから定義語を取得する定義セクション解析部と、
前記文書の定義セクション以外の文章から定義語を取得するインライン解析部と、
前記定義セクション解析部が取得した定義語と前記インライン解析部が取得した定義語とを統合する統合部と、
を備えることを特徴とする文書編集システム。
【発明の効果】
【0008】
本発明によれば、文書から抽出された定義語の正当性を検証することが可能となる。
【図面の簡単な説明】
【0009】
【
図1】本実施形態に係るコンピュータの主な構成を説明する説明図である。
【
図3A】定義語解析処理を示したフローチャートである。
【
図3B】定義語解析処理を示したフローチャートである。
【
図4】インラインで記述された定義語と、定義セクションに記述された定義語と、文書で使用された定義語を示す図である。
【
図7】定義語のポップアップダイアログを示した図である。
【
図8】端末と、サーバとを備えた文書編集システムの構成図である。
【発明を実施するための形態】
【0010】
以降、本発明を実施するための形態を、各図を参照して詳細に説明する。
図1は、本実施形態に係るコンピュータの主な構成を説明する説明図である。
コンピュータ1は、例えば、文書作成支援装置(ワードプロセッサ)として機能するコンピュータである。なお、文書作成支援装置は、文書入力支援機能を備えている。なお、以下の説明において、同一の構成については、同一の符号を付して説明を適宜省略する。
【0011】
コンピュータ1は、CPU(Central Processing Unit)11、記憶部12、ROM(Read Only Memory)13、RAM(Random Access Memory)14、操作部15、及び表示部16を含んで構成される。記憶部12は、文書編集プログラム121、定義語解析アドイン122、頻出定義語リスト123を格納する。
【0012】
CPU11は、中央処理装置であり、記憶部12に格納された文書編集プログラム121と、定義語解析アドイン122を実行する。
【0013】
文書編集プログラム121は、CPU11によって実行されることにより、文書作成支援の手順、またその文書を編集させる手順を実行させるためのプログラムである。すなわち、CPU11は、文書編集プログラム121を起動することにより、文書を編集するためのウインドウを開くことができる。
【0014】
また、定義語解析アドイン122は、文書編集プログラム121が起動されている状態で、定義語を検出して、その正当性を判定する機能を具現化する文書入力支援プログラムである。定義語解析アドイン122は、文書内から定義語を検出する。なお、定義語を検出して、その正当性を判定する機能を実装する実装先は、アドインプログラムに限定されるものではない。
【0015】
頻出定義語リスト123は、契約書等に頻出する定義語のリストである。なお頻出定義語リスト123は、固定した名詞ではなく、正規表現で記載されていてもよい。
【0016】
CPU11は、定義語解析アドイン122を実行することにより、
図2に示した各機能部を具現化する。なお、CPU11が実行する各処理については、
図3を用いて後述する。
【0017】
記憶部12は、大容量の記憶装置であり、例えば、ハードディスクドライブ(Hard Disk Drive)やフラッシュメモリなどで構成される。なお、記憶部12は、文書を構成する文書データを格納することもできる。
【0018】
RAM14は揮発性メモリであり、CPU11で実行可能な各種プログラム、入力データ、出力データ、及びパラメータ等を一時的に記憶するワークエリアとして機能する。ROM13は不揮発性メモリであり、例えばBIOS(Basic I/O System)などが格納されている。
【0019】
操作部15は、カーソルキー、数字入力キー、及び各種機能キーなどを備えたキーボードと、マウスなどのポインティングデバイスを備えて構成される。操作部15は、キーボードで押下操作されたキーの押下信号やマウスによる操作信号を検知する。CPU11は、操作部15からの操作信号に基づいて、各種処理を実行する。
【0020】
表示部16は、例えば、LCD(Liquid Crystal Display)等のモニタディスプレイを備えて構成される。表示部16は、CPU11から入力される表示信号により各種画面を表示する。また、表示部16、及び操作部15は、タッチパネルディスプレイを採用することもできる。
【0021】
内部バス17は、コンピュータ1における各構成要素を、相互に接続する複数の信号線の組み合わせである。
【0022】
図2は、各機能部のブロック図である。
コンピュータ1のCPU11は、定義セクション解析部111と、インライン解析部112と、統合部113と、外部リンク部114と、検知部115の各機能部を具現化する。
【0023】
定義セクション解析部111は、定義セクションを解析する。定義セクションとは、文書にて定義されている語句が一覧で纏められている条項等のセクションを指し、例えば、条項のタイトルに「定義」と記載された部分、または、定義語が表形式で記載された部分のことをいう。
【0024】
条項のタイトルに「定義」と記載された定義セクションの場合、定義セクション解析部111は、文章の主語が鍵括弧で囲まれているとき、鍵括弧内の文字列を定義語として判定し、それ以降に鍵括弧で囲まれていない部分を定義語の意味として判定する。なお、鍵括弧内の文字列の長さが所定値を超える場合、および、鍵括弧内の文字列に句読点が入っている場合には、定義語でないものとして扱う。
【0025】
例えば表のタイトルや項目名に定義と記載された定義セクションの場合、定義セクション解析部111は、特定のカラムの文字列が鍵括弧で囲まれているものを定義語として判定し、それ以降のカラムの鍵括弧で囲まれていない文字列を定義語の意味として判定する。
【0026】
インライン解析部112は、定義セクション以外の文章に定義語がインラインで記載されたものを解析する。インライン解析部112は、定義セクション以外の文章を順に解析していき、(以下、「営業日」という)のように、以下・以降・以後等、これ以降再び使用するようなフレーズと、鍵括弧および「という」の文字列を判定して、定義語とする。
【0027】
他のバリエーションとしては、(総称して「営業日」という。以下同じ。)のようなフレーズがある。「以下同じ。」のフレーズは、「以下同じ。」、「以下、同じ。」、「以下同様とする。」、「以下、同様とする。」、「以下同じとする。」などであってもよい。
【0028】
インライン解析部112は、誤検知を防ぐために、定義語の長さの上限を定めている。インライン解析部112は更に、定義語には鍵括弧、句読点、改行等の文字を含まないものとして解析する。
【0029】
インライン解析部112は、(以下、この章において「営業日」という。)のような、定義語が有効な範囲を示す言葉を判定し、定義語の範囲を特定してもよい。そしてインライン解析部112は、定義語が存在する周辺の文字列を、その定義語が指す意味としてメモリ上に定義語とセットで保存する。
【0030】
なお、インライン解析部112は、定義語を指す意味を抽出する際に、定義周辺の1文または複数文を抽出するが、これは各括弧の範囲等を特定した上で句点で区切り、文を抽出する。
【0031】
統合部113は、定義セクション解析部111が文書の定義セクションから取得した定義語とインライン解析部112が文書の定義セクション以外の文章中にインラインで記載された部分から取得した定義語の和集合をとることで統合する。これにより文書中の定義語の使用を一義的に判定することができる。なお、定義セクション解析部111が文書の定義セクションから取得した定義語と、インライン解析部112が文書の文章中にインラインで記載された部分から取得した定義語とは、それぞれ別々に管理される。
【0032】
この文書とは別のファイルに定義語が宣言されている場合もある。外部リンク部114は、ユーザが該当ファイルをリンクさせることで、外部から定義語を読み込む。
検知部115は、定義セクション解析部111が定義セクションを解析して得た定義語と、インライン解析部112が定義セクション以外の文章を解析して得た定義語の和集合が、文書中に使用されている箇所を検知する。検知部115は更に、文書中に使用されている用語が頻出定義語リスト123に含まれており、かつ定義語として定義されていない未定義語を検知する。検知部115は、インラインの定義語には存在するものの、定義セクションに入れ忘れている定義語を検知することができる。
【0033】
また検知部115は、定義セクションに同一の定義語が複数回定義されている場合を検知して警告を表示し、定義セクション以外の文章から取得できた定義語が、定義セクション以外の文章の別の箇所にて再度定義されている場合に警告を表示する。これによりユーザは、重複して定義された定義語を整理できる。
【0034】
更に検知部115は、定義セクションが存在しない文書において、定義セクション以外の文章から取得できた定義語が、定義箇所より前に使用されていた際に警告を表示する。これによりユーザは、定義語の定義箇所を、この定義語が出現する最先の箇所とすることができる。
【0035】
図3Aと
図3Bは、定義語解析処理を示したフローチャートである。
最初、定義セクション解析部111は、文書の定義セクションから定義語を取得する(ステップS10)。ここで定義セクションとは、例えば
図4の第1条-定義に示される用語の定義のことをいう。
【0036】
インライン解析部112は、文書の定義セクション以外の文章から、この文章にインラインで定義された定義語を取得する(ステップS11)。ここで文書の定義セクション以外の文章にインラインで定義された定義語とは、例えば
図4の契約書の前文の括弧書きに示された用語のことをいう。
【0037】
ステップS12にて、検知部115は、定義セクションが存在するか否かを判定する。定義セクションが存在するならば(Yes)、統合部113は、定義セクション以外の文章にインラインで定義された定義語と、定義セクションで定義された定義語を統合して(ステップS13)、ステップS14の処理に進む。ここで統合とは、文章中の定義語と、テーブルの定義語の和集合をとることをいう。
ステップS12の判定にて、定義セクションが存在しないならば(No)、検知部115は、ステップS16の処理に進む。
【0038】
ステップS14にて、検知部115は、定義セクション以外の文章にインラインで定義された定義語であり、かつ、定義セクションで定義されていない定義語に対して警告を表示する。これによりユーザは、定義セクションに全ての定義を纏めることができるので、文章を解りやすくすることができる。
【0039】
更に検知部115は、文書の定義セクションに複数回定義されている同一の定義語を検出して警告すると(ステップS15)、ステップS18の処理に進む。これによりユーザは、誤って複数回定義した定義語を1回の定義に纏めることができる。
【0040】
ステップS16にて、検知部115は、定義セクション以外の文章から取得できた定義語の使用を検知する。検知部115は、定義セクション以外の文章から取得できた定義語が、定義箇所より前に使用されていた定義語に警告を表示して(ステップS17)、ステップS18の処理に進む。
ステップS18にて、検知部115は、定義セクション以外の文章から取得できた定義語のうち、定義セクション以外の文章の別の箇所にて再度定義されている定義語を検出し、この検出した定義語に対して警告を表示する。これによりユーザは、誤って定義セクション以外の文章に複数回定義した定義語を1回の定義に纏めることができる。
【0041】
ステップS19にて、検知部115は、統合した定義語で、この文書内の定義語とリンク先の文書内の定義語の使用を検知する。検知部115は、未使用の定義語が有るか否かを判定する(ステップS20)。
【0042】
検知部115は、未使用の定義語が有るならば(Yes)、この未使用の定義語を記録して、ステップS21に進む。検知部115は、未使用の定義語が無いならば(No)、ステップS21に進む。この未使用の定義語の記録をダイアログ等で表示することにより、ユーザは、不要な定義語の定義部分を認識することができる。更にユーザは、不要な定義語の定義部分を削除することで、文書を簡潔かつ解りやすくすることが可能である。
【0043】
ステップS22にて、検知部115は、頻出定義語リスト123(
図1参照)のうち、この文書内で使用され、かつ定義語として定義されていないものを検知すると、
図3の処理を終了する。ステップS22の処理により、ユーザは、未定義のうちに用語を使用することがなくなり、文章が理解されやすくなる。
【0044】
図4は、インラインで記述された定義語と、定義セクションに記述された定義語と、文書で使用された定義語を示す図である。
文書ウインドウ2は、CPU11が文書編集プログラム121を実行することで開かれるウインドウであり、所定の契約書ファイルを開いている。文書ウインドウ2の上部には、この契約書の前文が記載されており、かつ定義語20がインラインで記載されている。
【0045】
文書ウインドウ2の中部には、契約書の第1条-定義が記載されており、かつ定義語21~26が、第1条各項として記載されている。ここで契約書の第1条は、定義セクションである。
文書ウインドウ2の下部には、契約書の第2条第2項が記載されており、「本件受託者」という定義語が使用されている。
【0046】
図5は、未使用の用語一覧を示した図である。
ユーザが、定義語解析リボンからプルーフリーディング結果を選択すると、プルーフリーディング結果ウインドウ3が表示される。プルーフリーディング結果ウインドウ3には、定義されたにも拘らず実際には使用されていない用語(定義語)と、その定義場所と、該当する定義場所の前後の抜粋とが表形式で示されている。各行の右端には除外ボタン311~313が配置されている。ユーザが除外ボタン311~313の何れかをクリックすると、この用語が定義語から削除される。
【0047】
そして、
図5のプルーフリーディング結果ウインドウ3には、未使用の用語ボタン31と、未定義の用語ボタン32とが表示されている。
図5において、未使用の用語ボタン31が強調表示されており、未使用の用語一覧が表示されていることを示している。ユーザが未定義の用語ボタン32をクリックすると、
図6に示す未定義の用語一覧が表示される。
【0048】
図6は、未定義の用語一覧を示した図である。
プルーフリーディング結果ウインドウ3には、定義されていないにも拘らず、実際には使用されている用語(定義語)と、その使用場所と、該当する使用場所の前後の抜粋とが表形式で示されている。行の右端には除外ボタン321が配置されている。ユーザが除外ボタン321をクリックすると、クリックした除外ボタンに係る列が削除されると共に、この用語「本件受託者」が未定義語から除外される。
【0049】
プルーフリーディング結果ウインドウ3の下部には、「別ファイルの定義語への参照を設定する」ボタン322が配置されている。ユーザが「別ファイルの定義語への参照を設定する」ボタン322をクリックして、定義語が定義されている別ファイルへの参照を指定すると、指定した別ファイルの定義語が、あたかもこのファイルにて定義されているように扱われ、ポップアップ表示が可能となる。つまり定義語については、現在開いているファイルとは別のファイルで定義することができる。これにより、定義語の閲覧のために、このファイルと別のファイルとを行き来することがなくなる。
【0050】
図7は、定義語のポップアップダイアログ71を示した図である。
文書ウインドウ7の上層には、ポップアップダイアログ71が表示されている。このポップアップダイアログ71は、ユーザがマウスカーソルを所定時間に亘って定義語の上に重ねる(マウスオーバーまたはホバー)することで表示される。ここではユーザが、定義語の「本契約」の上にマウスオーバーした場合を示している。
【0051】
ポップアップダイアログ71には、定義語の「本契約」を示したタイトルと、定義語「本契約」の定義(意味)と、「新ウインドウで開く」ボタン72と、「他箇所での使用を確認」ボタン73とが表示されている。ポップアップダイアログ71に定義語「本契約」を表示する際は、「本契約」が定義されている周辺の文字列を表示する。この際、文字列中の定義語について太字・色つき・アンダーラインを施して表示する。これによりユーザは、何処が定義語かわかりやすくなる。つまり検知部115は、定義語が使用されている箇所に対するユーザ入力を検知した際に、ポップアップダイアログ71に当該定義語の意味を表示している。このポップアップダイアログ71によって、ユーザは定義語の定義(意味)を容易に確認できる。
【0052】
「新ウインドウで開く」ボタン72は、定義語が定義されている場所を、新たな文書ウインドウとして開くためのボタンである。これによりユーザは、ユーザは定義語の定義(意味)を容易に編集できる。
【0053】
「他箇所での使用を確認」ボタン73は、この定義語が他で使用されている箇所を一覧表示するボタンである。これによりユーザは、この定義語の実際の用法を確認して、この文書における整合性を担保することができる。
【0054】
図8は、端末5と、サーバ4とを備えた文書編集システムの構成図である。
図8に示すように、文書入力支援システムは、端末5が、ネットワーク6を介してサーバ4に接続されて構成されている。このサーバ4は、例えばデータセンタなどに設置されたクラウド上のサーバである。
【0055】
端末5は、ブラウザ51と、表示部52と、操作部53とを含んで構成されている。ブラウザ51は、端末5から、サーバ4の情報を表示部52に表示させると共に、操作部53に入力された操作情報をサーバ4に送信する機能を有している。
【0056】
サーバ4は、定義セクション解析部411と、インライン解析部412と、統合部413と、外部リンク部414と、検知部415を含んで構成される。これら各機能部は、
図2に示した定義セクション解析部111と、インライン解析部112と、統合部113と、外部リンク部114と、検知部115の各機能部と同様に動作する。このように、本実施形態は、コンピュータにインストールされたプログラムに限定されず、クラウド上のサーバ4と端末5との組み合わせによって実現されてもよい。
【0057】
(変形例)
本発明は、上記実施形態に限定されることなく、本発明の趣旨を逸脱しない範囲で、変更実施が可能であり、例えば、次の(a)~(b)のようなものがある。
【0058】
(a) 本システムは、機械学習を用いて、本文中に各単語が定義語である確率を抽出して。各文章(一文単位、段落単位、全文のパターンがある)をこの機械学習モデルに入力して、定義語である可能性の高い単語を抽出してもよい。そして、定義語である可能性の高い単語でありながらも、文書中に定義語として定義されていない場合は、この単語を未定義語としてエラー表示してもよい。
【0059】
(b) 他のドキュメント(過去に開いたファイル等)に出現する定義語を保存し、データを収集することで、「定義語Xを定義しているドキュメントは、定義語Yも定義しています。」といった提案をしてもよい。更に本システムは、現ファイルの定義されている単語を用いて他に定義すべき単語を抽出し、その中で本文中に出現しない単語を除外することで、この文書に定義すべき単語を抽出してもよい。このようなレコメンデーションエンジンは、例えば協調フィルタリングのようなアルゴリズムを使うことが考えられる。
【符号の説明】
【0060】
1 コンピュータ
11 CPU
12 記憶部
121 文書編集プログラム
122 定義語解析アドイン
13 ROM
14 RAM
15 操作部
16 表示部
111 定義セクション解析部
112 インライン解析部
113 統合部
114 外部リンク部
115 検知部
4 サーバ
411 定義セクション解析部
412 インライン解析部
413 統合部
414 外部リンク部
415 検知部
5 端末
51 ブラウザ
52 表示部
53 操作部
6 ネットワーク