IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社椿知財サービスの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023056585
(43)【公開日】2023-04-20
(54)【発明の名称】文書処理プログラム
(51)【国際特許分類】
   G06F 40/258 20200101AFI20230413BHJP
   G06F 40/242 20200101ALI20230413BHJP
   G06F 40/129 20200101ALI20230413BHJP
   G06F 40/166 20200101ALI20230413BHJP
【FI】
G06F40/258
G06F40/242
G06F40/129
G06F40/166
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2021165879
(22)【出願日】2021-10-08
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.VISUAL BASIC
(71)【出願人】
【識別番号】518394776
【氏名又は名称】株式会社椿知財サービス
(74)【代理人】
【識別番号】100110788
【弁理士】
【氏名又は名称】椿 豊
(74)【代理人】
【識別番号】100124589
【弁理士】
【氏名又は名称】石川 竜郎
(72)【発明者】
【氏名】椿 豊
【テーマコード(参考)】
5B091
5B109
【Fターム(参考)】
5B091CC16
5B091CC17
5B109MF02
(57)【要約】
【課題】特許出願などの文書の作成の補助を行う文書処理プログラムを提供する。
【解決手段】文書処理プログラムは、文書中の文字列であって単語および符号よりなる文字列である符号文字列と、文書中の文字列であって単語よりなる文字列である単語文字列とを、互いに対応付けてデータベースに登録する登録ステップと、データベースの登録内容に基づいて、符号文字列と単語文字列との対応関係を出力する出力ステップとをコンピュータに実行させる。
【選択図】図31
【特許請求の範囲】
【請求項1】
文書中の文字列であって単語および符号よりなる文字列である符号文字列と、文書中の文字列であって単語よりなる文字列である単語文字列とを、互いに対応付けてデータベースに登録する登録ステップと、
前記データベースの登録内容に基づいて、前記符号文字列と前記単語文字列との対応関係を出力する出力ステップとをコンピュータに実行させる、文書処理プログラム。
【請求項2】
前記登録ステップは、
文字列の選択を受け付ける第1の選択受付ステップと、
前記第1の選択受付ステップにて選択を受け付けた文字列から抽出した前記符号文字列を、インプットメソッドエディタの辞書に登録する第1の辞書登録ステップと、
前記第1の選択受付ステップにて選択を受け付けた文字列から抽出した前記符号文字列を、前記データベースに登録する第1のデータベース登録ステップと、
文字列の選択を受け付ける第2の選択受付ステップと、
前記第2の選択受付ステップにて選択を受け付けた文字列から抽出した前記単語文字列を、前記インプットメソッドエディタの辞書に登録する第2の辞書登録ステップと、
前記第2の選択受付ステップにて選択を受け付けた文字列から抽出した前記単語文字列を、前記データベースに登録する第2のデータベース登録ステップと、
前記データベース内で前記符号文字列と前記単語文字列とを互いに対応付ける対応付けステップとを含む、請求項1に記載の文書処理プログラム。
【請求項3】
前記登録ステップは、
前記第1の選択受付ステップにて選択を受け付けた文字列から抽出した文字列を符号文字列の候補として表示する第1の候補表示ステップと、
前記符号文字列の候補の修正を受け付ける第1の修正受付ステップとをさらに含み、
前記第1の辞書登録ステップおよび第1のデータベース登録ステップの各々において、前記第1の修正受付ステップにて受け付けた修正を反映した前記符号文字列を登録する、請求項2に記載の文書処理プログラム。
【請求項4】
前記登録ステップは、
前記第2の選択受付ステップにて選択を受け付けた文字列から抽出した文字列を単語文字列の候補として表示する第2の候補表示ステップと、
前記単語文字列の候補の修正を受け付ける第2の修正受付ステップとをさらに含み、
前記第2の辞書登録ステップおよび第2のデータベース登録ステップの各々において、前記第2の修正受付手段にて受け付けた修正を反映した前記単語文字列を登録する、請求項2または3に記載の文書処理プログラム。
【請求項5】
前記インプットメソッドエディタの辞書は、読みの項目と、単語の項目とを含み、
前記第1の辞書登録ステップにおいて、前記符号文字列の符号を前記読みの項目に登録し、前記符号文字列を前記単語の項目に登録し、
前記第2の辞書登録ステップにおいて、前記単語文字列の読みを前記読みの項目に登録し、前記単語文字列を前記単語の項目に登録する、請求項2~4のいずれかに記載の文書処理プログラム。
【請求項6】
文字入力可能なアプリケーションのウィンドウにおいて、前記データベースに登録されている前記符号文字列および前記単語文字列の中から抽出した少なくとも1つの文字列の符号または読みを入力し、前記1つの文字列に変換する入力変換ステップをさらにコンピュータに実行させる、請求項5に記載の文書処理プログラム。
【請求項7】
前記対応付けステップの後で、前記符号文字列と前記単語文字列との対応付けを解除する設定を受け付ける解除受付ステップと、
前記解除受付ステップにて受け付けた設定に基づいて、前記データベース内で前記符号文字列と前記単語文字列との対応付けを解除する解除ステップとをさらにコンピュータに実行させる、請求項2~6のいずれかに記載の文書処理プログラム。
【請求項8】
前記出力ステップにおいて、第1、第2、および第3の出力形式のうち少なくともいずれか1つの形式で出力を行い、
前記第1の出力形式は、前記単語文字列を含む文書における前記単語文字列の直後に、前記符号文字列または前記符号文字列に含まれる符号を挿入した形式であり、
前記第2の出力形式は、前記符号文字列の符号と前記符号文字列の単語との関係を説明する文書に、前記単語文字列を挿入した形式であり、
前記第3の出力形式は、前記符号文字列を含む文書における前記符号文字列の直後に、前記単語文字列を挿入した形式である、請求項1~7のいずれかに記載の文書処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、文書処理プログラムに関する。
【背景技術】
【0002】
下記特許文献1には、特許出願に添付される特許請求の範囲等に記載された請求項間の関連を表すクレーム全体構造を、その階層構造の容易な把握が可能なように出力、表示する方法が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2012-27743号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
この発明は、特許出願などの文書の作成の補助を行う文書処理プログラムを提供することを目的としている。
【課題を解決するための手段】
【0005】
上記目的を達成するため、この発明のある局面に従うと、文書処理プログラムは、文書中の文字列であって単語および符号よりなる文字列である符号文字列と、文書中の文字列であって単語よりなる文字列である単語文字列とを、互いに対応付けてデータベースに登録する登録ステップと、データベースの登録内容に基づいて、符号文字列と単語文字列との対応関係を出力する出力ステップとをコンピュータに実行させる。
【0006】
好ましくは、登録ステップは、文字列の選択を受け付ける第1の選択受付ステップと、第1の選択受付ステップにて選択を受け付けた文字列から抽出した符号文字列を、インプットメソッドエディタの辞書に登録する第1の辞書登録ステップと、第1の選択受付ステップにて選択を受け付けた文字列から抽出した符号文字列を、データベースに登録する第1のデータベース登録ステップと、文字列の選択を受け付ける第2の選択受付ステップと、第2の選択受付ステップにて選択を受け付けた文字列から抽出した単語文字列を、インプットメソッドエディタの辞書に登録する第2の辞書登録ステップと、第2の選択受付ステップにて選択を受け付けた文字列から抽出した単語文字列を、データベースに登録する第2のデータベース登録ステップと、データベース内で符号文字列と単語文字列とを互いに対応付ける対応付けステップとを含む。
【0007】
好ましくは、登録ステップは、第1の選択受付ステップにて選択を受け付けた文字列から抽出した文字列を符号文字列の候補として表示する第1の候補表示ステップと、符号文字列の候補の修正を受け付ける第1の修正受付ステップとをさらに含み、第1の辞書登録ステップおよび第1のデータベース登録ステップの各々において、第1の修正受付ステップにて受け付けた修正を反映した符号文字列を登録する。
【0008】
好ましくは、登録ステップは、第2の選択受付ステップにて選択を受け付けた文字列から抽出した文字列を単語文字列の候補として表示する第2の候補表示ステップと、単語文字列の候補の修正を受け付ける第2の修正受付ステップとをさらに含み、第2の辞書登録ステップおよび第2のデータベース登録ステップの各々において、第2の修正受付手段にて受け付けた修正を反映した単語文字列を登録する。
【0009】
好ましくは、インプットメソッドエディタの辞書は、読みの項目と、単語の項目とを含み、第1の辞書登録ステップにおいて、符号文字列の符号を読みの項目に登録し、符号文字列を単語の項目に登録し、第2の辞書登録ステップにおいて、単語文字列の読みを読みの項目に登録し、単語文字列を単語の項目に登録する。
【0010】
好ましくは、文字入力可能なアプリケーションのウィンドウにおいて、データベースに登録されている符号文字列および単語文字列の中から抽出した少なくとも1つの文字列の符号または読みを入力し、1つの文字列に変換する入力変換ステップをさらにコンピュータに実行させる。
【0011】
好ましくは、文書処理プログラムは、対応付けステップの後で、符号文字列と単語文字列との対応付けを解除する設定を受け付ける解除受付ステップと、解除受付ステップにて受け付けた設定に基づいて、データベース内で符号文字列と単語文字列との対応付けを解除する解除ステップとをさらにコンピュータに実行させる。
【0012】
好ましくは、出力ステップにおいて、第1、第2、および第3の出力形式のうち少なくともいずれか1つの形式で出力を行い、第1の出力形式は、単語文字列を含む文書における単語文字列の直後に、符号文字列または符号文字列に含まれる符号を挿入した形式であり、第2の出力形式は、符号文字列の符号と符号文字列の単語との関係を説明する文書に、単語文字列を挿入した形式であり、第3の出力形式は、符号文字列を含む文書における符号文字列の直後に、単語文字列を挿入した形式である。
【発明の効果】
【0013】
この発明によると、上記課題の少なくとも1つを解決することができる。
【図面の簡単な説明】
【0014】
図1】本発明の第1の実施の形態における文書処理システムの構成を示すブロック図である。
図2】本発明の第1の実施の形態における文書処理システムの構成を示す機能ブロック図である。
図3】データベース207に格納されるデータ構造の具体例を示す図である。
図4】データベース207に格納されるデータ構造の具体例を示す図である。
図5】本発明の第1の実施の形態における文書処理システムに含まれるコンピュータプログラムのIME登録・DB登録処理を示すフローチャートである。
図6図5に続くフローチャートである。
図7】本発明の第1の実施の形態における文書処理システムに含まれる特許明細書エディタの画面構成を示す図である。
図8】本発明の第2の実施の形態における文書処理システムに含まれる特許明細書エディタのウィンドウの構成を示す図である。
図9】本発明の第2の実施の形態において符号文字列を登録する際の特許明細書エディタのウィンドウを示す第1の図である。
図10】本発明の第2の実施の形態において符号文字列を登録する際の特許明細書エディタのウィンドウを示す第2の図である。
図11図10に示す符号文字列に関するデータを登録後のデータベース207の内容を示す図である。
図12図10に示す符号文字列を登録後の特許明細書エディタのウィンドウを示す図である。
図13】本発明の第2の実施の形態における符号文字列の登録処理を示すフローチャートである。
図14】本発明の第2の実施の形態において単語文字列を登録する際の特許明細書エディタのウィンドウを示す第1の図である。
図15】本発明の第2の実施の形態において単語文字列を登録する際の特許明細書エディタのウィンドウを示す第2の図である。
図16図15に示す単語文字列に関するデータを登録後のデータベース207の内容を示す図である。
図17図15に示す単語文字列を登録後の特許明細書エディタのウィンドウを示す図である。
図18】本発明の第2の実施の形態における単語文字列に関するデータの登録処理を示すフローチャートである。
図19】本発明の第2の実施の形態において符号文字列と単語文字列とを互いに対応付ける際の特許明細書エディタのウィンドウを示す図である。
図20】符号文字列に関するデータと単語文字列に関するデータとを互いに対応付けた後のデータベース207の内容を示す図である。
図21】本発明の第2の実施の形態において符号文字列と単語文字列とを互いに対応付けた後の特許明細書エディタのウィンドウを示す図である。
図22】本発明の第2の実施の形態において符号文字列と単語文字列との対応付けを解除する際の特許明細書エディタのウィンドウを示す図である。
図23】本発明の第2の実施の形態において符号文字列と単語文字列との対応付けを解除した後のデータベース207の内容を示す図である。
図24】本発明の第2の実施の形態において符号文字列と単語文字列との対応付けを解除した後の特許明細書エディタのウィンドウを示す図である。
図25】本発明の第2の実施の形態におけるデータベース207の文字列の対応付け処理を示すフローチャートである。
図26】本発明の第2の実施の形態において符号文字列と単語文字列との対応関係を出力する際の特許明細書エディタのウィンドウを示す図である。
図27】本発明の第2の実施の形態においてデータベース207に登録された文字列の対応関係を第1の出力形式で出力した場合の特許明細書エディタのウィンドウを示す図である。
図28】本発明の第2の実施の形態においてデータベース207に登録された文字列の対応関係を第2の出力形式で出力した場合の特許明細書エディタのウィンドウを示す図である。
図29】本発明の第2の実施の形態においてデータベース207に登録された文字列の対応関係を第3の出力形式で出力した場合の特許明細書エディタのウィンドウを示す図である。
図30】本発明の第2の実施の形態においてデータベース207に登録された文字列の対応関係を第4の出力形式で出力した場合の特許明細書エディタのウィンドウを示す図である。
図31】本発明の第2の実施の形態における符号文字列と単語文字列との対応関係の出力処理を示すフローチャートである。
図32】本発明の第2の実施の形態において符号文字列および単語文字列を予測変換用辞書へ登録する際のPC100の画面を示す第1の図である。
図33】本発明の第2の実施の形態において符号文字列および単語文字列を予測変換用辞書へ登録する際のPC100の画面を示す第2の図である。
図34】本発明の第2の実施の形態における予測変換用辞書への登録処理を示すフローチャートである。
図35】本発明の第2の実施の形態において、文字列の符号または読みと文字列との組を予測変換用辞書に登録した直後の特許明細書エディタのウィンドウを示す図である。
【発明を実施するための形態】
【0015】
以下、本発明の実施の形態について、図面に基づいて説明する。
【0016】
[第1の実施の形態]
【0017】
図1は、本発明の第1の実施の形態における文書処理システムの構成を示すブロック図である。
【0018】
図を参照して、文書処理システムは、ユーザ(システム利用者)が操作を行うコンピュータ100と、LAN(Local Area Network)300と、インターネット400と、他社コンピュータ資源200と、自社コンピュータ資源500とから構成される。
【0019】
ユーザが操作を行うコンピュータ100は、CPU(Central Processing Unit)101と、通信部103と、I/O105と、ROM(Read Only Memory)107と、RAM(Random Access Memory)109と、記憶装置111と、音声入力/出力部113と、ディスプレイ115と、グラフィックユニット117と、キーボード119と、マウス121とを含んで構成されている。
【0020】
コンピュータ100は、LAN300に接続され、LAN300はインターネット400に接続される。LAN300には自社コンピュータ資源500が接続されており、インターネット400には他社コンピュータ資源200が接続されている。
【0021】
ここでコンピュータ資源とは、サーバ、パーソナルコンピュータ、記憶装置(コンピュータ内のストレージ、NAS(Network Attached Storage)など)、および情報通信経路(ネットワーク、ロードバランサ、スイッチ、ルータなど)、並びに、それらを構成するCPU、メモリ、記憶装置(ハードディスク、光学的または磁気的記憶装置、SSDほか半導体デバイス)、ROM、マザーボード、キーボード、マウス、マイクなどの入力装置、ディスプレイ、およびスピーカなどの出力装置、並びに記憶装置から読み出され、一般にはメモリ上で動作するコンピュータプログラム、データなどのソフトウェアの全てまたは一部を示している。
【0022】
自社コンピュータ資源500とは、上記ユーザ(または上記ユーザが所属する組織)が所有しているコンピュータ資源である。組織は、ユーザ1名からなる組織であっても良いし、複数の人員から構成される組織であってもよい。
【0023】
自社コンピュータ資源500やコンピュータ100は、インターネット400に直接接続されておらず、インターネット400には、LAN300のルータ(図示せず)を介して接続される。また、ルータ、自社コンピュータ資源500、コンピュータ100にファイヤウォール機能を設けることにより、インターネット400側から自社コンピュータ資源500やコンピュータ100にアクセスすることが禁じられている。これにより、自社コンピュータ資源500やコンピュータ100がインターネット400を介して外部から操作されることはなく、また、自社コンピュータ資源500やコンピュータ100に記憶されたデータに外部からアクセスすることが禁止されている。
【0024】
他社コンピュータ資源200とは、上記ユーザ(または上記ユーザが所属する組織)が所有するものではないコンピュータ資源である。上記ユーザは、コンピュータ100からアクセスすることで他社コンピュータ資源200の計算能力やストレージを一時的に借り受けることができる。その利用形態は、有償であると無償であるとを問わない。
【0025】
文書データは、ワードプロセッサーが処理するファイル、HTMLやプレーンなテキストファイルに保存され、自社コンピュータ資源500やコンピュータ100に記録される。文書データが画像である場合には、自社コンピュータ資源500やコンピュータ100に記録されたOCR(Optical Character Recognition/Reader)のソフトウェアによりそれがHTML文書やテキスト文書に変換され、処理の対象とされる。
【0026】
自社コンピュータ資源500およびコンピュータ100と、他社コンピュータ資源200との間の通信プロトコルは、HTTPS(Hypertext Transfer Protocol Secure)等により行われる。すなわち、SSL(Secure Sockets Layer)/TLS(Transport Layer Security)プロトコルによって提供されるセキュアな暗号化(秘密鍵、公開鍵を使ったデータ暗号化手法)の上でHTTP通信が行われるので、自社コンピュータ資源500およびコンピュータ100と他社コンピュータ資源200との間の通信内容を秘匿化することができ、その通信内容が第三者に漏洩することは防止される。通信内容の第三者への漏洩を防ぐことができるのであれば、HTTPS以外の暗号化通信を行っても良い。
【0027】
図2は、本発明の第1の実施の形態における文書処理システムの構成を示す機能ブロック図である。
【0028】
図1の記憶装置111には、CPU101によって順に実行されることで、コンピュータ100を文書処理装置として動作させるコンピュータ読取り可能な実行形式のプログラムが複数記録されている。プログラムは、記憶装置111からから読み出され、RAM109上に展開される。プログラムがRAM109上でCPU101によって実行される。
【0029】
プログラムの実行により、図2に示されるように、コンピュータ100は、制御部201、通信部103、検索・置換部203、文書編集・言葉登録部205、データベース207、メモリ209、記憶装置111、表示/出力部211、および入力部213としての機能を発揮する。
【0030】
制御部201は、装置全体の各種制御を行う機能ブロックである。通信部103は、社内・社外のコンピュータ資源と通信を行うための機能ブロックである。検索・置換部203は、文書について、特定の要素(言葉、文節など)の検索を行ったり、検索された要素を対応する文字列や暗号に置換したりする機能ブロックである。文書編集・言葉登録部205は、文書を編集したり、言葉変換のための辞書を登録したりする機能ブロックである。
【0031】
データベース207は、主に言葉辞書を登録するデータベースである。データベース207としてはデータベースサーバのソフトウェアを採用しても良いし、CSVファイルなどの単なるテキストファイルや、表計算ソフト(EXCELなど)のテーブルを記録し、それを検索し、対応するデータを読み出すことでデータベースとしてもよい。
【0032】
メモリ209は、データを一時的に記録するワーキングエリアである。記憶装置111は、不揮発性の記憶装置であり、文書データ、データベースに記録されるデータ、メモリ209のデータなどを記憶する。表示/出力部211は、ディスプレイ、スピーカなどのユーザインタフェースである。入力部213は、マウス、キーボード、マイクなどのユーザインタフェースである。
【0033】
図3は、データベース207に格納されるデータ構造の具体例を示す図である。
【0034】
ここではデータベース207は列名(カラム名、フィールド名)として、ID(レコード番号であり、データの通し番号)、符号(読み)、単語、変換後単語、属性、対応などを有するテーブルからなっている。図3では、符号に対応付けられている単語(文字列)がデータベース207に登録されている例が示されている。
【0035】
符号とは、特許出願の明細書などの文書において、単語の直後に記載される文字列であって、その単語と、その単語が指す図面中の要素とを対応付けるための数字、アルファベットなどの文字列である。例えば図面中に描かれた電気自動車(図面中の要素の一例)に引き出し線が付され、「101」と番号が振られており、その電気自動車を明細書中で「電気自動車101」という文字列で説明する場合、「101」が符号である。またこの場合の「電気自動車」は符号「101」に対応する単語である。
【0036】
単語のカラムには、その符号に対応する単語(例えば明細書中に「電気自動車101」の文字列が表れるのであれば、そのうちの「電気自動車」)が登録される。一般には単語のカラムには名詞が登録されるが、動詞、副詞、形容詞などを登録しても良い。また名詞には、複数の名詞からなる複合名詞(電気+自動車である「電気自動車」など)も含まれる。
【0037】
IDのカラムは、1レコードの通し番号を記録する。
【0038】
変換後単語のカラムには、そのレコードにおける単語+符号の文字列が記録される。例えば、図3のID=0のレコードでは、符号が「101」、単語が「電気自動車」であるため、変換後単語のカラムには、「電気自動車101」が登録される。
【0039】
属性のカラムには、例えばその「単語」が特許出願の明細書中の実施の形態に登場する単語であれば「0」、特許請求の範囲に登場する単語であれば「1」などの属性が記録される。
【0040】
対応のカラムには、そのレコードの単語に対応する他の単語のIDと、対応関係が記録される(複数の対応付けを行ってもよい)。例えば単語「信号入力部」に対して、他の単語である「信号入力手段」が対応する場合、それら単語が関連することと、その対応関係(例えば、請求項に出てくる単語と、それに対応する実施の形態に出てくる単語の関係であることを示すコード)が記録される。
【0041】
この実施の形態において符号は、IME(Input Method Editor、インプットメソッドエディター)のユーザ辞書に、その「符号」に対応する「変換後単語」の読みとしても登録される。
【0042】
IMEは、パーソナルコンピュータ(PC)やタブレット端末、スマートフォン端末などの情報機器において、ハードウェアキーボード(物理キーボード)または画面上に表示されるソフトウェアキーボード(仮想キーボード)の上にある限られたキーの組み合わせで、漢字、ハングル、かな文字などキーボード上には無い文字を入力するためのソフトウェアである。IMEは、ハードウェアキーボードまたはソフトウェアキーボードから入力された文字列を、その文字列に対応する文字列に変換する処理を行う。IMEは、入力方式エディタやかな漢字変換ソフトとも呼ばれることもある。
【0043】
IMEは辞書ファイルを用いて文字列の変換を行う。辞書ファイルには誰もが使用する基本辞書、オプションで追加される追加辞書、予測変換用辞書、およびユーザごとに作成されるユーザ辞書がある。基本辞書には、例えば「せかい」に対応させた「世界」など、誰もが利用する単語が登録されている。追加辞書は、ユーザの利用環境に応じて追加される辞書であり、例えば専門用語を集めた辞書である。ユーザ辞書は、各ユーザごとに、単語と読みを登録、編集、削除できる辞書であり、ユーザ個別の辞書として機能する。
【0044】
IMEの基本機能は、ひらがななどの文字列が入力された後に、変換キーが押されるなどすると、その文字列を、その文字列に対応して辞書登録されている文字列に変換するものである。1の文字列に対して複数の辞書登録がある場合、変換キーが押されるなどするごとに、次の候補の文字列が表示される。確定キーが押されるなどすると、表示されている文字列が入力確定文字列となる。その確定文字列は、次回の変換時に優先的に変換候補に表示される。また、ユーザ辞書による変換を他の辞書(基本辞書など)よりも優先的に行ったりする。よく使われる候補を早く表示させるためである。
【0045】
IMEは、現在の入力途中の文字列(未確定文字列)に応じて辞書からピックアップした入力候補や変換候補を表示することができる(予測変換機能)。またIMEは、ユーザ入力履歴をもとに学習して辞書や入力/変換候補の精度を強化していくことができる。
【0046】
上述のように図3の「符号」は、IMEのユーザ辞書に、その符号に対応する「変換後単語」の読みとしても登録されるため、ユーザは例えば「101」をキーボードなどから入力し、変換キーを押すことで「電気自動車101」のIMEによる変換結果を得ることができる。また、IMEの予測変換機能を用いると、「101」と入力する前に、または入力することで、「電気自動車101」のIMEによる変換結果を得ることができる。これにより、ユーザによる入力の省力化を図ることができる。また、符号と単語との整合性の誤り(誤入力、タイプミス)を防ぐことができる。すなわち、ユーザは迅速に誤りなく単語+符号からなる文字列の入力が可能となる。
【0047】
なお、IMEに「符号」をそれに対応する「単語」の読みとして登録することもできる。この場合、ユーザは例えば「101」をキーボードなどから入力し、変換キーを押すことで「電気自動車」のIMEによる変換結果を得ることができる。この場合も省力化や入力ミス軽減を図ることができる。
【0048】
データベース207に複数のレコードがあれば、それら全ての符号および変換後単語のペアが辞書登録される。
【0049】
図4は、データベース207に格納されるデータ構造の具体例を示す図である。
【0050】
図4で示されているデータベース207の構成は、図3と同じである。図4では、符号に対応付けられていない単語(符号を含まない文字列)がデータベース207に登録されている例が示されている。例えば特許出願であれば、明細書の発明の実施の形態や要約書には符号に対応付けられている単語が出現し、特許請求の範囲には符号に対応付けられていない単語が出現することが多い。前者の単語を図3、後者の単語を図4のようにデータベースに登録し、対応カラムのデータによって対応付けるものである。
【0051】
図4では図3とは違い、符号(読み)のカラムには、その単語のひらがな読みが記載される。例えばID=250のレコードの単語は「検出手段」であるため、その符号(読み)のカラムには「けんしゅつしゅだん」の文字列が記録される。ひらがな読みは、ユーザが入力してもよいし、単語を形態素解析などすることによって単語から決定してもよい。また、単語を形態素解析などすることによって得られた読みをユーザに提示し、誤りがあれば修正可能としてもよい。
【0052】
また、図4においては、変換後単語としては符号のない単語のみが登録される(単語カラムと変換後単語カラムの両者は同じとなる)。
【0053】
図4においても、データベース207に登録される符号(読み)とそれに対応付けられる変換後単語が、IMEに単語とその読みとして辞書登録される。
【0054】
これによって、図4の登録がある状態においては、ユーザは単語の読みの「けんしゅつしゅだん」をキーボードから入力し、変換キーを押すことなどによってIMEでそれを変換することで、「検出手段」の変換結果を得ることができる。また、予測変換機能を用いると、「けんしゅつしゅだん」を入力する途中で「検出手段」の変換結果を得ることができる。これにより、迅速に誤りなく単語の文字列の入力が可能となる。
【0055】
以降、単語および符号よりなる文字列を符号文字列と記すことがある。単語よりなる(符号を含まない)文字列を単語文字列と記すことがある。
【0056】
典型的には、符号文字列は、特許出願の明細書の実施の形態に記載された単語(部材)と、その単語の直後に付された符号とよりなっている。単語文字列は、特許出願の特許請求の範囲に記載された単語(実施の形態に記載された単語を上位概念化した構成)よりなっている。図3のデータは、符号文字列に関するデータに相当する。図4のデータは、単語文字列に関するデータに相当する。
【0057】
なおIMEはワープロソフト(マイクロソフト社のWORD、オープンソース方式で公開されているOpenOfficeなど)に付属するものを用いてもよいし、OSに付属するものを用いてもよいし、独自にインストールするものを用いてもよい。本発明は、ワープロソフトのマクロ(VBA:Visual Basic For Applicationsなど)を用いて図5,6などのフローチャートのプログラムを実行することで実現されてもよい。本発明は、独自のエディタソフトで図5,6などのフローチャートのプログラムを実行することで実現されてもよい。データベースは、専用のデータベース(MySQL,SQLiteなど)でもCSVファイルであってもよいし、マイクロソフト社のEXCELなどの表計算ソフトを用いてデータベースが形成され、ワープロソフトのVBAを用いてデータベースへのアクセスが行われるものであってもよい。なお使用されるワープロソフト、テキストエディタ、プログラム言語の種類は、発明の実施において制限されるものではない。
【0058】
処理の対象となる文書ファイルは、プレーンテキスト形式で記載されたテキストファイルであってもよいし、ワープロソフトの文書ファイルであってもよいし、HTMLファイルであってもよい。また、画像に含まれる文字がOCRによりテキスト化されたファイルであってもよい。画像ファイルを入力し、OCR機能により文字部分をテキストデータに変換したファイルを作成しても良い。他、文章を記述することができるのであれば、ファイルのフォーマットは特定のものに限定されない。文書は、他のコンピュータからファイル転送プロトコルや電子メールソフトウェアを用いて受信しても良いし、USBメモリなどのストレージから入力されても良い。また、キーボード119やマイクによって入力されても良い。文書は、インターネットからダウンロードすることとしてもよい。
【0059】
以下のフローチャートで示される処理は、記憶装置111に記録されたコンピュータプログラムがRAM109上に読み出され、それをCPU101が順次実行することで実行される。プログラムは、コンパイルされた機械語の実行形式で保存されてもよいし、ソースコードをインタプリタが逐次実行する形式としてもよいし、中間言語で記載された形式としても良い。
【0060】
図5は、本発明の第1の実施の形態における文書処理システムに含まれるコンピュータプログラムのIME登録・DB登録処理を示すフローチャートであり、図6は、図5に続くフローチャートである。
【0061】
ステップS101で、コンピュータ100にインストールされているワープロソフトまたはテキストエディタソフトが起動されている場合を想定する。ソフトで文書または単語などのテキストが表示されている場合において、ユーザは登録を行いたい部分を選択する。選択は、マウス左クリックによって選択の始点から終点までをドラッグする方法や、カーソル位置を始点に合わせ、Shift+矢印キーによってカーソルを移動させる方法などで行われる。形態素解析によってコンピュータ100が単語の区切りを自動判断し、選択範囲を自動で決定、または範囲選択の補助をさせることとしてもよい。
【0062】
ステップS101でテキストの選択後に登録処理のトリガが発生したのであれば、ステップS103に移行する。登録処理のトリガは、例えば特定のショートカットキーの押下、メニュー中の特定項目の選択、マウスの右クリック、特定の音声入力などのコマンド入力によって発生するものとする。また、単語登録を行いたい部分の選択が行われたら(または選択後所定時間が経過したら)自動的にトリガを発生させてもよい。
【0063】
ステップS103においては、選択された範囲内に「単語」と「符号」からなる組(ペア)が含まれるかを判定する。YESであればステップS105へ、NOであればS205(図6)へ進む。YESは、単語と符号のペアが選択範囲に含まれるので、それを図3の形式でデータベース207に登録するための処理である。NOは、単語のみが選択範囲に含まれるので、それを図4の形式でデータベース207に登録するための処理である。
【0064】
ステップS105においては、選択された範囲内に「単語」と「符号」からなる組(ペア)が複数組含まれるかを判定する。例えば文書中の1つの「単語」+それに対応する1つの「符号」のペアのみが選択され、それを登録するのか、あるいは特許出願の明細書であれば「[符号の説明]」の項目に記載されるような、1つの「単語」+それに対応する1つの「符号」のペアが複数記載されている部分が選択され、それらペアの全てを登録するのかが判定される。
【0065】
ステップS107において、選択範囲内の文字列を図3の「変換後単語」のカラムに、選択範囲内の単語部分の文字列を図3の「単語」のカラムに、選択範囲内の符号部分の文字列を図3の「符号(読み)」のカラムに、新たなレコードとして登録するため、これらのセットを取得する。新たなレコードには通し番号であるIDが付与される。また「属性」カラム用に、「符号の付いた単語である実施例中の単語である」などの属性が付与される。対応する他のレコードがある場合には、それをユーザから入力し、または自動判別し、「対応」のカラムに記録することとしてもよい。
【0066】
ステップS107での登録処理は、例えば特許出願の明細書であれば「[符号の説明]」の項目に記載されるような、1つの「単語」+それに対応する1つの「符号」のペアが複数記載されている部分が選択されていた場合には、各ペアが1レコードとして、複数レコードが図3のデータベース207に登録される。
【0067】
なお、選択範囲内に符号部分が含まれるか否かは、例えば選択範囲内の文字列の形態素解析や正規表現による検索で、その末尾に数字やアルファベットが含まれているか否かによって判断することができる。また、数字やアルファベットが連続する部分を判定することで、選択範囲内の符号部分の文字列を得ることができるし、それ以外の部分を選択範囲内の単語部分の文字列として得ることができる。
【0068】
ステップS109において、IMEのユーザ辞書登録を行う。より詳しくは、「読み」を選択範囲内の符号部分の文字列、「単語」を選択範囲内の文字列、「品詞」を「短縮読み」などとして辞書の1つのレコードが登録される。「品詞」は「短縮読み」に限らず、「名詞」、「固有名詞」などでもよい。
【0069】
例えば特許出願の明細書であれば「[符号の説明]」の項目に記載されるような、1つの「単語」+それに対応する1つの「符号」のペアが複数記載されている部分が選択されていた場合には、各ペアが1レコードとして、複数レコードがIMEに登録される。
【0070】
ステップS111において、データベース207への登録が確定する。
【0071】
次に図6のステップS205以降の説明を行う。図6の処理は、選択範囲内に符号が含まれず、選択範囲内に単語のみが存在する場合に、図4に示されるようにデータベース207への単語登録を行い、IMEにも登録を行う処理である。
【0072】
ステップS205において、選択範囲内に単語が複数含まれるかを判定する。これは例えば、それぞれが改行コード、カンマ、スペース、タブ記号で区切られた複数の単語が選択範囲内に存在するかを判定する処理である。
【0073】
ステップS207において、選択範囲内の1つの単語と、そのひらがな読みを取得する。ひらがな読みは、ユーザが入力してもよいし、単語を形態素解析などすることによって単語から決定してもよい。また、単語を形態素解析などすることによって得られた読みをユーザに提示し、誤りがあれば修正可能としてもよい。単語が複数あれば、全ての単語のひらがな読みが得られる。
【0074】
ステップS209において、「読み」をひらがな読み、「単語」を選択範囲内の単語、「品詞」を「短縮読み」または「名詞」として、IMEに辞書登録する。
【0075】
単語が複数記載されている部分が選択されていた場合には、各単語についてステップS209の処理が行われ、複数レコードがIMEに登録される。
【0076】
ステップS211において、データベース207への登録が確定する。
【0077】
図7は、本発明の第1の実施の形態における文書処理システムに含まれる特許明細書エディタの画面構成を示す図である。
【0078】
この画面は、特許明細書エディタのウィンドウを示している。ウィンドウの最上部にはタイトルバーが位置し、その下にメニューバーが位置している。メニューには、「ファイル」、「編集」、「機能」、「検索/置換」、「管理」、「分析」が含まれる。
【0079】
メニューバーの下に、検索/置換バーが位置している。検索/置換バーは、検索するテキストを入力する第1のテキストボックスと、第1のテキストボックスに入力されたテキストを文書中から検索するトリガを発生させる「検索」ボタンと、選択された部分が置換されるテキストを入力する第2のテキストボックスと、第1のテキストボックスに入力されたテキストの文書中からの検索結果を、第2のテキストボックスに入力されたテキストに置換し、次の検索を行うトリガを発生させる「置換+次」ボタンと、文章中から第1のテキストボックスに入力されたテキストを全て検索し、全てを第2のテキストボックスに入力されたテキストに置換する「全置換」ボタンとが含まれる。
【0080】
検索/置換バーの下の画面は、左上、左下、右上、右下に4分割されている。左上は、特許出願の明細書を表示するテキストボックスである。左下は、特許出願の特許請求の範囲および要約書を表示するテキストボックスである。右上は、特許出願の明細書の実施の形態に記載された符号付きの単語(符号文字列)について、その符号と、単語と、IDと、対応とを表形式で表示するリストコントロールである。右下は、特許出願の特許請求の範囲に記載された符号なしの単語(単語文字列)について、その読みと、単語と、IDと、対応とを表形式で表示するリストコントロールである。右下のリストコントロールの下に、選択状態とされたリストコントロールの要素を削除するための削除ボタンと、選択状態をキャンセルするためのキャンセルボタンと、リストコントロール中の2以上の要素が選択されている状態で、それら要素を対応付けて記録するための「登録」ボタンが表示される。
【0081】
コンテンツがテキストボックスやリストコントロールの表示範囲に入りきれない場合、そのテキストボックスやリストコントロールの右側にスクロールバーが表示される。ユーザは、スクロールバーを操作することにより、コンテンツのうち表示される範囲を変更することができる。
【0082】
ユーザはマウスやTabキーの押下によって、各テキストボックス、各リストコントロールを選択状態とすることができる。ユーザは各テキストボックスにおいては、テキストの入力、編集(コピー、ペーストなど)、削除などを行うことができる。また、選択範囲の登録を行うことができる。ユーザは各リストコントロールにおいては、所望の要素を選択状態とすることができる。複数の要素を同時に選択状態とすることも可能である。
【0083】
右上のリストコントロールにおいては、図3のデータベースの登録内容が、符号の昇順に並べられて表示される。右下のリストコントロールにおいては、図4のデータベースの登録内容が、符号(読み)の昇順に並べられて表示される。データベースが更新されるごとに、両リストコントロールの内容がリアルタイムで更新される。
【0084】
ユーザは例えば「水受けかご2」の文字列を入力したいときには、図7の右上のリストコントロールを見て、「2」が対応する符号であることを理解することができる。ユーザはテキストコントロールにカーソルがある状態で、「2」をタイプし、変換キーを押すことで(予測変換機能によれば変換キーを押すことなく)、「水受けかご2」のテキストを入力することができる。
【0085】
また、ユーザは例えば「バランスリング取付部」の文字列を入力したいときには、「ばらんすりんぐとりつけぶ」をタイプし、変換キーを押すことで(予測変換機能によれば変換キーを押すことなく入力途中で)、「バランスリング取付部」のテキストを入力することができる。
【0086】
なおデータベースの登録が削除されると、対応するインプットメソッドエディタの辞書登録も削除することが望ましい。使わない単語登録を削除し、IMEでの誤変換を防ぐためである。
【0087】
また、文書ごとにデータベースを対応付けて管理し、ある文書を編集するときには対応するデータベースが読み出され、それに記録された符号(読み)と単語(または単語+符号)がIME辞書に登録されるようにしてもよい。文書ごとに、固有のデータベースと固有のIMEの辞書を使うものである。また、文書の編集を終了するときには、対応するデータベースが読み出され、それに記録された符号(読み)と単語(または単語+符号)がIME辞書から削除されるようにしてもよい。
【0088】
また、ユーザの入力によって、または自動的に、データベースに記録された符号(読み)と単語(または単語+符号)をIMEに登録させることとしてもよい。データベースの内容とIMEに登録されるユーザ辞書とを同期させることとしてもよい。
【0089】
IMEへの辞書登録は、IMEのデータベースに直接データを登録することとしてもよいし、デスクトップの自動化ソフトを利用することにより、IMEを起動させた後に自動的にダイアログ画面に必要な情報を入力し、「登録」ボタンが押されるようにプログラムを設計してもよい。IMEの起動は、IMEのexeファイル(実行ファイル)を実行することによって行ってもよいし、デスクトップの自動化ソフトでキーやマウスの自動操作を行うことでIMEを起動させてもよい。
【0090】
ユーザの入力によって、または自動的に、コンピュータによってデータベースから符号と対応する単語のペアを複数取得させ、それを符号の並び順(数字の昇順など)に一覧としてまとめた符号表を出力する機能を設けてもよい。特許出願の明細書であれば、「符号の説明」を自動起草するものである。また、単語の文書中での出現回数をカウントし、出現回数が所定値以上の単語のみを符号表として出力してもよい。
【0091】
[第2の実施の形態]
【0092】
本実施の形態では、ユーザが特許明細書エディタを用いて特許出願の文書を作成する際の文書処理システムの具体的な動作について説明する。本実施の形態における文書処理システムの構成および後述以外の動作は、第1の実施の形態における文書処理システムの構成および動作と同一であるため、その説明は繰り返さない。
【0093】
(特許明細書エディタの画面構成)
【0094】
図8は、本発明の第2の実施の形態における文書処理システムに含まれる特許明細書エディタのウィンドウの構成を示す図である。
【0095】
図8を参照して、特許明細書エディタのウィンドウは、PC100において所定の操作が行われた場合にディスプレイ115に表示される。本実施の形態の前提として、ユーザは、特許明細書エディタを起動し、特許明細書エディタ内で作成中の特許出願の文書データを開く。作成中の特許出願の文書データは、明細書、特許請求の範囲、および要約書がこの順序で記載された(または記載される予定の)テキストデータである。文書処理システムは、これらの操作を受け付けると、図8に示す方法で、特許明細書エディタのウィンドウに作成中の特許出願の文書データを表示する。
【0096】
特許明細書エディタのウィンドウは、タイトルバーBR1と、メニューバーBR2と、検索/置換バーBR3と、テキストボックスTX1およびTX2と、リストコントロールLC1およびLC2と、タブTB1、TB2、およびTB3と、リストコントロール編集バーBR4とを含んでいる。
【0097】
タイトルバーBR1は、ウィンドウの最上部に設けられている。タイトルバーBR1には、作成中の特許出願の文書データのファイル名が表示される。
【0098】
メニューバーBR2は、タイトルバーBR1の下に設けられている。メニューバーBR2は、「ファイル」、「編集」、「検索/置換」、「入力支援」、「IME&DB登録」、「チェック」、「管理」、および「分析」などの各種操作メニューを含んでいる。
【0099】
検索/置換バーBR3は、メニューバーBR2の下に設けられている。検索/置換バーBR3は、編集中の文書に含まれる文字を検索する操作や置換する操作に関するボタンを含んでいる。具体的には、検索/置換バーBR3は、テキストボックスTX31と、「検索」ボタンBT31と、テキストボックスTX32と、「置換+次」ボタンBT32と、「全置換」ボタンBT33とを含んでいる。テキストボックスTX31は、検索する文字列の入力を受け付ける。「検索」ボタンBT31は、テキストボックスTX31に入力された文字列を文書中から検索するトリガを発生させる。テキストボックスTX32は、置換後の文字列の入力を受け付ける。「置換+次」ボタンBT32は、テキストボックスTX31に入力された文字列の文書中からの検索結果を、テキストボックスTX32に入力された文字列で置換し、次の検索を行うトリガを発生させる。「全置換」ボタンBT33は、文書中からテキストボックスTX31に入力された文字列を全て検索し、全てをテキストボックスTX32に入力された文字列に置換するトリガを発生させる。
【0100】
検索/置換バーBR3の下の画面は、左上、左下、右上、右下に4分割されている。左上の画面はテキストボックスTX1である。左下の画面はテキストボックスTX2である。右上の画面はリストコントロールLC1である。右下の画面はリストコントロールLC2である。
【0101】
テキストボックスTX1には、作成中の特許出願の文書データの明細書の欄の部分(実施の形態を含む部分)が表示される。
【0102】
テキストボックスTX2には、作成中の特許出願の文書データの特許請求の範囲および要約書の欄の部分が表示される。
【0103】
リストコントロールLC1には、データベース207に登録された符号文字列に関するデータが表示される。リストコントロールLC2には、データベース207に登録された単語文字列に関するデータが表示される。リストコントロールLC1およびLC2の各々は、符号、単語、ID、対応ID、および対応語の項目を含んでいる。符号の項目には、符号文字列の符号または単語文字列の読みが表示される。単語の項目には、符号文字列の単語または単語文字列が表示される。IDの項目には、符号文字列または単語文字列に付されたIDが表示される。対応IDの項目には、その文字列に対応付けられた文字列のIDが表示される。対応語の項目には、その文字列に対応付けられた文字列が表示される。
【0104】
タブTB1、TB2、およびTB3の各々は、リストコントロールLC1およびLC2の表示態様の設定を受け付けるタブであり、リストコントロールLC1の上に設けられている。「請・実」タブTB1は、リストコントロールLC1とリストコントロールLC2とを上下方向に並べて表示するためのタブである。「実施例」タブTB2は、リストコントロールLC1を表示しリストコントロールLC2を表示しないためのタブである。「請求項」タブTB3は、リストコントロールLC1を表示せずリストコントロールLC2を表示するためのタブである。図8では「請・実」タブTB1が押下されている。
【0105】
リストコントロール編集バーBR4は、リストコントロールLC2の下に設けられている。リストコントロール編集バーBR4は、「リンク」ボタンBT41と、「解除」ボタンBT42と、「削除」ボタンBT43と、「キャンセル」ボタンBT44とを含んでいる。「リンク」ボタンBT41は、符号文字列と単語文字列とをデータベース207上で互いに対応付けるためのボタンである。「解除」ボタンBT42は、データベース207内での符号文字列と単語文字列との対応付けを解除するためのボタンである。「削除」ボタンBT43は、選択された符号文字列または単語文字列に関するデータを、データベース207およびIMEの辞書の各々から削除するためのボタンである。「キャンセル」ボタンBT44は、リストコントロールLC1内での符号文字列の選択およびリストコントロールLC2内での単語文字列の選択を解除するためのボタンである。
【0106】
コンテンツがテキストボックスやリストコントロールの表示範囲に入りきれない場合、そのテキストボックスやリストコントロールの右側にスクロールバーが表示される。ユーザは、スクロールバーを操作することにより、コンテンツのうち表示される範囲を変更することができる。
【0107】
ユーザはマウスやTabキーの押下によって、各テキストボックス、各リストコントロールを選択状態とすることができる。ユーザは各テキストボックスにおいては、テキストの入力、編集(コピー、ペーストなど)、削除などを行うことができる。また、選択範囲の登録を行うことができる。ユーザは各リストコントロールにおいては、所望の要素を選択状態とすることができる。複数の要素を同時に選択状態とすることも可能である。
【0108】
(符号文字列の登録)
【0109】
次に、符号文字列に関するデータをIMEの辞書およびデータベース207の各々に登録する方法について説明する。
【0110】
図9および図10は、本発明の第2の実施の形態において符号文字列を登録する際の特許明細書エディタのウィンドウを示す図である。
【0111】
図9を参照して、特許明細書エディタを起動して特許出願の文書データを開いた時点では、データベース207にはデータが登録されていないものとする。ユーザは、テキストボックスTX1に表示された明細書中の実施の形態の欄に文書を入力する。ユーザは、実施の形態の欄に任意の分量の文書の入力を終えた時点で、マウスやキーボードを用いて、入力した文書の一部または全体の文字列を選択する。図9では、入力した文書のうち「図1において,遠心脱水機の外箱1の内部に水受けかご2をねじ3によって固着する。」という文字列が選択されており、選択された文字列は他の文字列とは異なる色でマーキングされている。
【0112】
続いてユーザは、文字列を選択した状態で、符号文字列を登録するためのボタン(ここでは、メニューバーBR2の「IME&DB登録」という操作メニュー中の「[(複数)単語+符号]選択範囲の複数IME&DB登録」というボタン)BT51を押下する。ボタンBT51の押下は、符号文字列の登録処理を開始するトリガとなる。符号文字列の登録処理を開始するトリガは、特定のショートカットキーの押下、マウスの右クリックによる所定の項目の選択、特定の音声入力などのコマンド入力などによって発生してもよい。
【0113】
文字列の選択を受け付けた状態で、符号文字列の登録処理を開始するトリガが発生すると(第1の選択受け付けステップの一例)、文書処理システムは、選択された文字列を形態素解析することにより、選択された文字列から単語および符号よりなる文字列を抽出する。抽出した文字列は符号文字列の候補とされる。抽出される文字列の数は任意であり、選択された文字列の中に該当する文字列が複数存在する場合には、複数の符号文字列の候補が抽出される。図9では、選択された文字列から「外箱1」、「水受けかご2」、および「ねじ3」という3つの符号文字列の候補が抽出される。
【0114】
図10を参照して、次に文書処理システムは、特許明細書エディタのウィンドウ上にポップアップ画面PP1を表示する(第1の候補表示ステップの一例)。ポップアップ画面PP1は、テキストボックスTX51と、「IMEへ登録」ボタンBT52と、「閉じる」ボタンBT53とを含んでいる。テキストボックスTX51は、抽出した符号文字列の候補を、たとえば符号と単語とに分けて表示する。図10では、たとえば「外箱1」という符号文字列の候補は、「1」という符号と「外箱」という単語とに分けて表示されている。
【0115】
テキストボックスTX51は、表示した符号文字列の候補の修正を受け付ける(第1の修正受付ステップの一例)。ユーザは、テキストボックスTX51内で入力を行うことにより、符号文字列の候補の単語または符号を修正したり、符号文字列の候補を削除したりすることが可能である。
【0116】
「IMEへ登録」ボタンBT52の押下は、符号文字列に関するデータを登録するトリガとなる。符号文字列に関するデータを登録するトリガは、特定のショートカットキーの押下、マウスの右クリックによる所定の項目の選択、特定の音声入力などのコマンド入力などによって発生してもよい。
【0117】
符号文字列に関するデータを登録するトリガが発生すると、文書処理システムは、ポップアップ画面PP1に表示した符号文字列の候補を確定し、確定した符号文字列に関するデータをデータベース207およびIMEの辞書の各々に登録する(第1の辞書登録ステップおよび第1のデータベース登録ステップの一例)。ポップアップ画面PP1に表示した内容が修正されている場合には、文書処理システムは、修正を反映した符号文字列に関するデータをデータベース207およびIMEの辞書の各々に登録する。
【0118】
IMEの辞書へ符号文字列を登録する際、IMEの辞書における読みの項目には符号文字列の符号が登録され、IMEの辞書における語句(単語)の項目には符号文字列全体が登録される。
【0119】
「閉じる」ボタンBT53が押下されると、文書処理システムは、ポップアップ画面PP1に表示した符号文字列の候補をすべて破棄してポップアップ画面PP1を閉じる。
【0120】
なお、選択された文字列から抽出した単語および符号よりなる文字列についての修正を受け付けずに、選択された文字列から抽出した単語および符号よりなる文字列に関するデータが、符号文字列に関するデータとしてそのままデータベース207およびIMEの辞書の各々に登録されてもよい。
【0121】
図11は、図10に示す符号文字列に関するデータを登録後のデータベース207の内容を示す図である。
【0122】
図11を参照して、符号文字列に関するデータは、IDと、符号(読み)と、単語と、変換後単語と、属性と、対応との各項目を含んでいる。IDの項目には、データベース207に登録される符号文字列および単語文字列に対して登録順に付される通し番号が登録される。符号(読み)の項目には、符号文字列の符号が登録される。単語の項目には、符号文字列に含まれる単語が登録される。変換後単語の項目には、符号文字列全体が登録される。属性の項目には、符号文字列であることを示す「0」という数字が付される。対応の項目は、符号文字列に対応付けられた単語文字列のIDが登録される。たとえば「外箱1」という符号文字列に関しては、「0」というIDが付され、符号の項目には「1」という符号が登録され、単語の項目には「外箱」という単語が登録され、変換後単語の項目には「外箱1」という文字列が登録される。対応の項目は、他の文字列との対応付けが設定されるまで空白とされる。
【0123】
図12は、図10に示す符号文字列を登録後の特許明細書エディタのウィンドウを示す図である。
【0124】
図12を参照して、図10に示す符号文字列がデータベース207に登録されると、リストコントロールLC1の表示内容が更新され、リストコントロールLC1には登録された符号文字列に関するデータが新たに表示される。図12では、「外箱1」、「水受けかご2」、および「ねじ3」という3つの符号文字列の各々に関するデータが新たに表示されている。「外箱1」という符号文字列に関するデータとして、符号の項目には「1」という符号が表示され、単語の項目には「外箱」という単語が表示され、IDの項目には「0」というIDが表示される。新たに表示された符号文字列の各々には、対応付けられた文字列が未だ存在しないため、新たに表示された符号文字列に関するデータの対応IDの項目および対応語の項目は空白とされるか、または「none」という登録無しを意味する文字が表示されている。なお、データベース207には単語文字列に関するデータは未だ登録されていないため、リストコントロールLC2には何も表示されない。
【0125】
図13は、本発明の第2の実施の形態における符号文字列の登録処理を示すフローチャートである。このフローチャートは、記憶装置111に記憶されたプログラムをCPU101が実行することにより実現される。
【0126】
図13を参照して、CPU101は、特許明細書エディタにおいて文字列が選択され、かつ符号文字列の登録処理のトリガが発生したか否かを判別する(S301)。ステップS301で特許明細書エディタにおいて文字列が選択され、かつ符号文字列の登録処理のトリガが発生したと判別するまで、CPU101はステップS301の処理を繰り返す。
【0127】
ステップS301において、特許明細書エディタにおいて文字列が選択され、かつ符号文字列の登録処理のトリガが発生したと判別した場合(S301でYES)、CPU101は、選択された文字列から、単語および符号よりなる文字列を符号文字列の候補として抽出し(S303)、符号文字列の候補を抽出したか否かを判別する(S305)。
【0128】
ステップS305において、符号文字列の候補を抽出しないと判別した場合(S305でNO)、選択した文字列の中に符号文字列は存在していない。この場合、CPU101は処理を終了する。
【0129】
ステップS305において、符号文字列の候補を抽出したと判別した場合(S305でYES)、CPU101は、符号文字列の候補を表示し(S307)、符号文字列の候補を修正する操作を受け付けたか否かを判別する(S309)。
【0130】
ステップS309において、符号文字列の候補を修正する操作を受け付けたと判別した場合(S309でYES)、CPU101は、表示した符号文字列の候補を修正し(S311)、ステップS307の処理へ進む。
【0131】
ステップS309において、符号文字列の候補を修正する操作を受け付けないと判別した場合(S309でNO)、CPU101は、符号文字列に関するデータを登録するトリガが発生したか否かを判別する(S313)。
【0132】
ステップS313において、符号文字列に関するデータを登録するトリガが発生しないと判別した場合(S313でNO)、符号文字列の候補が破棄された状況にある。この場合、CPU101は処理を終了する。
【0133】
ステップS313において、符号文字列に関するデータを登録するトリガが発生したと判別した場合(S313でYES)、CPU101は、表示した符号文字列の候補を確定し、表示した符号文字列に関するデータをIMEの辞書およびデータベース207の各々に登録する(S315およびS317)。次にCPU101は、データベース207の登録内容をリストコントロールLC1に反映させ(S319)、処理を終了する。
【0134】
上述のようにデータベース207には、IMEの辞書に登録された符号文字列に関するデータが登録される。リストコントロールLC1にはデータベース207に登録された符号文字列に関するデータが表示される。したがって、ユーザは、リストコントロールLC1の表示内容を参照することで、特許出願の作成を進めながらIMEの辞書に登録されている符号文字列を把握することができ、ユーザが入力した符号がIMEの辞書機能によりどのような文字列に変換されるかを把握することができる。
【0135】
IMEの辞書に符号文字列に関するデータが登録されると、ユーザは例えば「1」という符号をキーボードなどから入力し、変換キーを押すことで「外箱1」という変換結果を得ることができる。また、IMEの予測変換機能を用いると、「1」と入力することで、「外箱1」というIMEによる変換結果を得ることができる。これにより、ユーザによる入力の省力化を図ることができる。また、符号と単語との整合性の誤り(誤入力、タイプミス)を防ぐことができる。
【0136】
(単語文字列の登録)
【0137】
次に、単語文字列に関するデータをIMEの辞書およびデータベース207の各々に登録する方法について説明する。
【0138】
図14および図15は、本発明の第2の実施の形態において単語文字列を登録する際の特許明細書エディタのウィンドウを示す図である。
【0139】
図14を参照して、ユーザは、テキストボックスTX2に表示された特許請求の範囲の欄または要約書の欄に文書を入力する。ユーザは、特許請求の範囲または要約書の欄に任意の分量の文書の入力を終えた時点で、マウスやキーボードを用いて、入力した文書の一部または全体の文字列を選択する。図14では、入力した文書のうち[請求項1]の全ての文字列が選択されており、選択された文字列は他の文字列とは異なる色で表示されている。
【0140】
続いてユーザは、文字列を選択した状態で、単語文字列を登録するためのボタン(ここでは、メニューバーBR2の「IME&DB登録」という操作メニュー中の「クレーム中の単語のIME&DB登録」というボタン)BT61を押下する。ボタンBT61の押下は、単語文字列の登録処理を開始するトリガとなる。単語文字列の登録処理を開始するトリガは、特定のショートカットキーの押下、マウスの右クリックによる所定の項目の選択、特定の音声入力などのコマンド入力などによって発生してもよい。
【0141】
文字列の選択を受け付けた状態で、単語文字列の登録処理を開始するトリガが発生すると(第2の選択受け付けステップの一例)、文書処理システムは、選択された文字列を形態素解析することにより、選択された文字列から単語よりなる文字列を抽出する。抽出した文字列は単語文字列の候補とされる。抽出される文字列の数は任意であり、選択された文字列の中に該当する文字列が複数存在する場合には、複数の単語文字列の候補が抽出される。図14では、選択された文字列から「外箱」、「スプリング」、「駆動モータ」、「回転軸」、および「脱水かご」などの合計8つの単語文字列の候補が抽出される。
【0142】
図15を参照して、次に文書処理システムは、特許明細書エディタのウィンドウ上にポップアップ画面PP2を表示する(第2の候補表示ステップの一例)。ポップアップ画面PP2は、テキストボックスTX61と、「IMEへ登録」ボタンBT62と、「閉じる」ボタンBT63とを含んでいる。テキストボックスTX61は、抽出した単語文字列の候補を、単語文字列の読みと単語文字列(単語文字列の単語)とに分けて表示する。図15では、たとえば「外箱」という単語文字列の候補は、「そとばこ」という単語文字列の読みと「外箱」という単語文字列(単語文字列の単語)とに分けて表示されている。
【0143】
テキストボックスTX61は、表示した単語文字列の候補の修正を受け付ける(第2の修正受付ステップの一例)。ユーザは、テキストボックスTX61内で入力を行うことにより、単語文字列の読みまたは単語文字列を修正したり、単語文字列の候補を削除したりすることが可能である。
【0144】
「IMEへ登録」ボタンBT62の押下は、単語文字列に関するデータを登録するトリガとなる。単語文字列に関するデータを登録するトリガは、特定のショートカットキーの押下、マウスの右クリックによる所定の項目の選択、特定の音声入力などのコマンド入力などによって発生してもよい。
【0145】
単語文字列に関するデータを登録するトリガが発生すると、文書処理システムは、ポップアップ画面PP2に表示した単語文字列の候補(図15では8つの単語文字列の候補)を確定し、確定した単語文字列に関するデータをデータベース207およびIMEの辞書の各々に登録する(第2の辞書登録ステップおよび第2のデータベース登録ステップの一例)。ポップアップ画面PP2に表示した内容が修正されている場合には、文書処理システムは、修正を反映した単語文字列に関するデータをデータベース207およびIMEの辞書の各々に登録する。
【0146】
IMEの辞書へ単語文字列を登録する際、IMEの辞書における読みの項目には単語文字列の読みが登録され、IMEの辞書における語句(単語)の項目には単語文字列全体が登録される。
【0147】
「閉じる」ボタンBT63が押下されると、文書処理システムは、ポップアップ画面PP2に表示した単語文字列の候補をすべて破棄してポップアップ画面PP2を閉じる。
【0148】
なお、選択された文字列から抽出した単語よりなる文字列についての修正を受け付けずに、選択された文字列から抽出した単語よりなる文字列に関するデータが、単語文字列に関するデータとしてそのままデータベース207およびIMEの辞書の各々に登録されてもよい。
【0149】
図16は、図15に示す単語文字列に関するデータを登録後のデータベース207の内容を示す図である。
【0150】
図16を参照して、単語文字列に関するデータは、IDと、符号(読み)と、単語と、変換後単語と、属性と、対応との各項目を含んでいる。IDの項目には、データベース207に登録される符号文字列および単語文字列に対して登録順に付される通し番号が登録される。符号(読み)の項目には、単語文字列の読みが登録される。単語および変換後単語の項目には、単語文字列が登録される。属性の項目には、単語文字列であることを示す「1」という数字が付される。対応の項目は、単語文字列に対応付けられた符号文字列のIDが登録される。たとえば「外箱」という単語文字列に関しては、「3」というIDが付され、符号(読み)の項目には「そとばこ」という読みが登録され、単語および変換後単語の項目には「外箱」という単語が登録される。対応の項目は、他の文字列との対応付けが設定されるまで空白とされる。
【0151】
図17は、図15に示す単語文字列を登録後の特許明細書エディタのウィンドウを示す図である。
【0152】
図17を参照して、図15に示す単語文字列がデータベース207に登録されると、リストコントロールLC2の表示内容が更新され、リストコントロールLC2には登録された単語文字列に関するデータが新たに表示される。図17では、「外箱」、「スプリング」、「駆動モータ」、「回転軸」、および「脱水かご」などの8つの単語文字列に関するデータが新たに表示されている。「外箱」という単語文字列であれば、符号の項目には「そとばこ」という単語文字列の読みが表示され、単語の項目には「外箱」という単語文字列が表示され、IDの項目には「4」というIDが表示されている。新たに表示された単語文字列の各々には、対応付けられた文字列が未だ存在しないため、新たに表示された単語文字列に関するデータの対応IDの項目および対応語の項目は空白とされるか、または「none」という登録無しを意味する文字が表示されている。
【0153】
図18は、本発明の第2の実施の形態における単語文字列に関するデータの登録処理を示すフローチャートである。このフローチャートは、記憶装置111に記憶されたプログラムをCPU101が実行することにより実現される。
【0154】
図18を参照して、CPU101は、特許明細書エディタにおいて文字列が選択され、かつ単語文字列の登録処理のトリガが発生したか否かを判別する(S401)。ステップS401で特許明細書エディタにおいて文字列が選択され、かつ単語文字列の登録処理のトリガが発生したと判別するまで、CPU101はステップS401の処理を繰り返す。
【0155】
ステップS401において、特許明細書エディタにおいて文字列が選択され、かつ単語文字列の登録処理のトリガが発生したと判別した場合(S401でYES)、CPU101は、選択された文字列から、単語よりなる文字列を単語文字列の候補として抽出し(S403)、単語文字列の候補を抽出したか否かを判別する(S405)。
【0156】
ステップS405において、単語文字列の候補を抽出しないと判別した場合(S405でNO)、選択した文字列の中に単語文字列は存在していない。この場合、CPU101は処理を終了する。
【0157】
ステップS405において、単語文字列の候補を抽出したと判別した場合(S405でYES)、CPU101は、単語文字列の候補を表示し(S407)、単語文字列の候補を修正する操作を受け付けたか否かを判別する(S409)。
【0158】
ステップS409において、単語文字列の候補を修正する操作を受け付けたと判別した場合(S409でYES)、CPU101は、表示した単語文字列の候補を修正し(S411)、ステップS407の処理へ進む。
【0159】
ステップS409において、単語文字列の候補を修正する操作を受け付けないと判別した場合(S409でNO)、CPU101は、単語文字列に関するデータを登録するトリガが発生したか否かを判別する(S413)。
【0160】
ステップS413において、単語文字列に関するデータを登録するトリガが発生しないと判別した場合(S413でNO)、単語文字列の候補が破棄された状況にある。この場合、CPU101は処理を終了する。
【0161】
ステップS413において、単語文字列に関するデータを登録するトリガが発生したと判別した場合(S413でYES)、CPU101は、表示した単語文字列の候補を確定し、表示した単語文字列に関するデータをIMEの辞書およびデータベース207の各々に登録する(S415およびS417)。次にCPU101は、データベース207の登録内容をリストコントロールLC2に反映させ(S419)、処理を終了する。
【0162】
上述のようにデータベース207には、IMEの辞書に登録された単語文字列に関するデータが登録される。リストコントロールLC2にはデータベース207に登録された単語文字列に関するデータが表示される。したがって、ユーザは、リストコントロールLC2の表示内容を参照することで、特許出願の作成を進めながらIMEの辞書に登録されている単語文字列を把握することができ、ユーザが入力した読み(仮名)がIMEの辞書機能によりどのような文字列に変換されるかを把握することができる。
【0163】
IMEの辞書に単語文字列に関するデータが登録されると、ユーザは例えば「そとばこ」という読みをキーボードなどから入力し、変換キーを押すことで「外箱」というIMEによる変換結果を得ることができる。また、IMEの予測変換機能を用いると、「そ」と入力することで、「外箱」というIMEによる変換結果を得ることができる。これにより、ユーザによる入力の省力化を図ることができる。また、特許請求の範囲の記載と明細書の記載との整合性の誤り(たとえば「外箱」(そとばこ)という特許請求の範囲の記載を、明細書で「外函」と誤変換したり「さとばこ」と誤入力したりするような誤り)を防ぐことができる。特に特許出願では難解な言葉や一般的ではない言葉が使用される機会が多く、これらの言葉については正確な変換が得られ難い傾向にある。IMEの辞書に単語文字列に関するデータを登録することで、特許出願で使用する言葉を正確かつ迅速に得ることができる。
【0164】
(文字列の対応付け)
【0165】
次に、データベース207の文字列の対応付けの方法について説明する。
【0166】
図19は、本発明の第2の実施の形態において符号文字列と単語文字列とを互いに対応付ける際の特許明細書エディタのウィンドウを示す図である。
【0167】
図19を参照して、データベース207には、符号文字列に関するデータおよび単語文字列に関するデータが保存されている。リストコントロールLC1およびLC2の各々には、符号文字列に関するデータおよび単語文字列に関するデータが表示されている。
【0168】
ユーザは、リストコントロールLC1に表示された符号文字列のうち少なくとも1つの符号文字列と、リストコントロールLC2に表示された単語文字列のうち少なくとも1つの単語文字列とを選択した状態で、リストコントロール編集バーBR4の「リンク」ボタンBT41を押下する。図19では、リストコントロールLC1中の「外箱1」および「外箱20」という符号文字列と、リストコントロールLC1中の「外箱」という単語文字列とが選択されている。ボタンBT41の押下は、符号文字列と単語文字列とを互いに対応付ける処理を開始するトリガとなる。符号文字列と単語文字列とを互いに対応付ける処理を開始するトリガは、特定のショートカットキーの押下、マウスの右クリックによる所定の項目の選択、特定の音声入力などのコマンド入力などによって発生してもよい。
【0169】
図20は、符号文字列に関するデータと単語文字列に関するデータとを互いに対応付けた後のデータベース207の内容を示す図である。
【0170】
図20を参照して、リストコントロールLC1に表示された符号文字列のうち少なくとも1つの符号文字列と、リストコントロールLC2に表示された単語文字列のうち少なくとも1つの単語文字列とが選択された状態で、符号文字列と単語文字列とを互いに対応付ける処理を開始するトリガが発生すると、文書処理システムは、データベース207内の選択された符号文字列に関するデータと選択された単語文字列に関するデータとを互いに対応付ける(登録ステップおよび対応付けステップの一例)。具体的には、データベース207内の選択された符号文字列に関するデータの対応の項目に、対応付ける単語文字列および符号文字列のIDを登録し、データベース207内の選択された単語文字列に関するデータの対応の項目に、対応付ける符号文字列および単語文字列のIDを登録する。なお、互いに対応付ける符号文字列および単語文字列の選択は、文書処理システムによって行われてもよい。
【0171】
図20では、「外箱1」という符号文字列に関するデータの対応の項目に、「外箱20」という符号文字列IDである「22」と、「外箱」という単語文字列のIDである「4」との各々のIDが登録される。「外箱20」という符号文字列に関するデータの対応の項目に、「外箱1」という符号文字列のIDである「1」と、「外箱」という単語文字列のIDである「4」とが登録される。「外箱」という単語文字列に関するデータの対応の項目に、「外箱1」という符号文字列のIDである「1」と、「外箱20」という符号文字列のIDである「22」とが登録される。
【0172】
図21は、本発明の第2の実施の形態において符号文字列と単語文字列とを互いに対応付けた後の特許明細書エディタのウィンドウを示す図である。
【0173】
図21を参照して、データベース207内の選択された符号文字列に関するデータと選択された単語文字列に関するデータとが互いに対応付けられると、リストコントロールLC1における対応付けられた符号文字列およびリストコントロールLC2における対応付けられた単語文字列の各々の表示内容が更新される。対応付けられた符号文字列および単語文字列の各々の対応IDの項目には、対応付けられた全ての単語文字列および符号文字列のIDが表示される。対応付けられた符号文字列および単語文字列の各々の対応語の項目には、対応付けられた全ての単語文字列および符号文字列が表示される。図21では、リストコントロールLC1における「外箱1」という符号文字列および「外箱20」という符号文字列、ならびにリストコントロールLC2における「外箱」という単語文字列の各々に関するデータにおいて、対応IDの項目に「1,22,4」という対応付けられた全ての単語文字列および符号文字列のIDが表示され、対応語の項目に「外箱1,外箱20,外箱」という対応付けられた全ての単語文字列および符号文字列が表示され、これらの文字列が対応付けて表示される。
【0174】
図22は、本発明の第2の実施の形態において符号文字列と単語文字列との対応付けを解除する際の特許明細書エディタのウィンドウを示す図である。
【0175】
図22を参照して、ユーザは、リストコントロールLC1またはLC2において符号文字列および単語文字列のうち少なくとも1つを選択した状態で、リストコントロール編集バーBR4の「解除」ボタンBT42を押下する。図22では、「外箱1」という符号文字列が選択されている。ボタンBT42の押下は、符号文字列と単語文字列との対応付けを解除する処理を開始するトリガとなる。符号文字列と単語文字列との対応付けを解除する処理を開始するトリガは、特定のショートカットキーの押下、マウスの右クリックによる所定の項目の選択、特定の音声入力などのコマンド入力などによって発生してもよい。
【0176】
図23は、本発明の第2の実施の形態において符号文字列と単語文字列との対応付けを解除した後のデータベース207の内容を示す図である。
【0177】
図23を参照して、リストコントロールLC1またはLC2において符号文字列および単語文字列のうち少なくとも1つを選択した状態で、符号文字列と単語文字列との対応付けを解除する処理を開始するトリガが発生すると(解除受付ステップの一例)、文書処理システムは、データベース207内で、選択された文字列とその文字列に対応付けられた文字列との対応付けを解除する(解除ステップの一例)。文書処理システムは、データベース207内の選択された符号文字列または単語文字列に関するデータと、選択された符号文字列または単語文字列に対応付けられた全ての単語文字列および符号文字列に関するデータとの各々における対応の項目を削除する。図23では、「外箱1」という符号文字列に関するデータ、「外箱20」という符号文字列に関するデータ、および「外箱」という単語文字列に関するデータの各々における対応の項目が削除され、空欄とされる。
【0178】
図24は、本発明の第2の実施の形態において符号文字列と単語文字列との対応付けを解除した後の特許明細書エディタのウィンドウを示す図である。
【0179】
図24を参照して、データベース207内の必要なデータの対応の項目が削除されると、データベース207の変更が、リストコントロールLC1およびLC2の各々の表示内容に反映される。図24では、リストコントロールLC1における「外箱1」という符号文字列に関するデータ、「外箱20」という符号文字列に関するデータ、およびリストコントロールLC2における「外箱」という単語文字列に関するデータの各々における対応IDおよび対応語の表示内容が削除され、これらの文字列の対応付けの表示が削除される。
【0180】
図25は、本発明の第2の実施の形態におけるデータベース207の文字列の対応付け処理を示すフローチャートである。このフローチャートは、記憶装置111に記憶されたプログラムをCPU101が実行することにより実現される。
【0181】
図25を参照して、CPU101は、リストコントロールLC1に表示された符号文字列のうち少なくとも1つの符号文字列と、リストコントロールLC2に表示された単語文字列のうち少なくとも1つの単語文字列とが選択され、かつ符号文字列と単語文字列とを互いに対応付ける処理を開始するトリガが発生したか否かを判別する(S501)。
【0182】
ステップS501において、リストコントロールLC1に表示された符号文字列のうち少なくとも1つの符号文字列と、リストコントロールLC2に表示された単語文字列のうち少なくとも1つの単語文字列とが選択されない、または符号文字列と単語文字列とを互いに対応付ける処理を開始するトリガが発生しないと判別した場合(S501でNO)、CPU101はS507の処理へ進む。
【0183】
ステップS501において、リストコントロールLC1に表示された符号文字列のうち少なくとも1つの符号文字列と、リストコントロールLC2に表示された単語文字列のうち少なくとも1つの単語文字列とが選択され、かつ符号文字列と単語文字列とを互いに対応付ける処理を開始するトリガが発生したと判別した場合(S501でYES)、CPU101は、データベース207内で、選択された文字列に関するデータ同士を互いに対応付ける(S503)。次にCPU101は、データベース207の内容をリストコントロールLC1およびLC2に反映させ(S505)、ステップS507の処理へ進む。
【0184】
ステップS507において、CPU101は、リストコントロールLC1およびLC2において対応付けられた符号文字列および単語文字列のうち少なくとも1つが選択され、かつ符号文字列と単語文字列との対応付けを解除する処理を開始するトリガが発生したか否かを判別する(S507)。
【0185】
ステップS507において、リストコントロールLC1およびLC2において対応付けられた符号文字列および単語文字列のうち少なくとも1つが選択されない、または符号文字列と単語文字列との対応付けを解除する処理を開始するトリガが発生しないと判別した場合(S507でNO)、CPU101はステップS501の処理へ進む。
【0186】
ステップS507において、リストコントロールLC1およびLC2において対応付けられた符号文字列および単語文字列のうち少なくとも1つが選択され、かつ符号文字列と単語文字列との対応付けを解除する処理を開始するトリガが発生したと判別した場合(S507でYES)、CPU101は、データベース207内で、選択された文字列に関するデータの対応付けを削除する(S509)。次にCPU101は、データベース207の内容をリストコントロールLC1およびLC2に反映させ(S511)、ステップS501の処理へ進む。
【0187】
上述のようにデータベース207には、文字列同士の対応付けが登録される。リストコントロールLC1およびLC2には文字列同士の対応付けが表示される。したがって、ユーザは、リストコントロールLC1およびLC2の表示内容を参照することで、特許出願の作成を進めながら特許請求の範囲の単語と実施の形態中の単語および符号との対応関係を把握することができる。その結果、ユーザの利便性が向上する。
【0188】
(対応関係の出力)
【0189】
次に、符号文字列と単語文字列との対応関係の出力方法について説明する。
【0190】
図26は、本発明の第2の実施の形態において符号文字列と単語文字列との対応関係を出力する際の特許明細書エディタのウィンドウを示す図である。
【0191】
図26を参照して、データベース207には、符号文字列に関するデータおよび単語文字列に関するデータが保存されており、いくつかの符号文字列と単語文字列との対応付けが登録されている。リストコントロールLC1およびLC2の各々には、符号文字列に関するデータおよび単語文字列に関するデータが表示されている。
【0192】
ユーザは、符号文字列と単語文字列との対応関係を出力するためのボタンを押下する。ここでは、メニューバーBR2の「入力支援」という操作メニュー中の「クレームに対応挿入」ボタンBT70、「符号の説明に対応挿入」ボタンBT71、「実施の形態にクレームの文言を追加」ボタンBT72、または「クレーム→手段+対応作成」ボタンBT73が押下される。ボタンBT70、BT71、BT72、またはBT73の押下は、符号文字列と単語文字列との対応関係を出力するトリガとなる。符号文字列と単語文字列との対応関係を出力するトリガは、特定のショートカットキーの押下、マウスの右クリックによる所定の項目の選択、特定の音声入力などのコマンド入力などによって発生してもよい。
【0193】
文書処理システムは、符号文字列と単語文字列との対応関係を出力するトリガが発生した場合に、データベース207の登録内容に基づいて、符号文字列と単語文字列との対応関係を出力する(出力ステップの一例)。文書処理システムは、ボタンBT70、BT71、BT72、およびBT73のうち押下されたボタン(トリガ)の種類に応じて異なる出力形式で、符号文字列の符号と単語文字列との対応関係を出力する。符号文字列の符号と単語文字列との対応関係の出力方法は任意であり、対応関係を含むポップアップ画面を表示する出力方法、または作成中の特許出願のデータに対して対応関係を挿入する出力方法などであってもよい。
【0194】
図27は、本発明の第2の実施の形態においてデータベース207に登録された文字列の対応関係を第1の出力形式で出力した場合の特許明細書エディタのウィンドウを示す図である。
【0195】
図27を参照して、「クレームに対応挿入」ボタンBT70が押下された場合には、文書処理システムは、特許明細書エディタのウィンドウ上にポップアップ画面PP3を表示することで、データベース207に登録された文字列の対応関係を第1の出力形式で出力する。第1の出力形式は、単語文字列を含む文書における単語文字列の直後に、符号文字列または符号文字列に含まれる符号を挿入した形式である。
【0196】
ポップアップ画面PP3は、テキストボックスTX71と、「閉じる」ボタンBT74とを含んでいる。テキストボックスTX71には、特許明細書エディタで作成中の文書における特許請求の範囲および要約書の欄に記載された文書と同一の文書が表示されている。表示した文書における単語文字列の直後には、その単語文字列に対応付けられた符号文字列が括弧書きで挿入されている。なお、テキストボックスTX71には、表示した文書における単語文字列の直後に、その単語文字列に対応付けられた符号文字列の符号のみが挿入されてもよい。
【0197】
図27のテキストボックスTX71には、特許請求の範囲および要約書の欄に記載された文書と同一の文書における「外箱」という単語文字列の直後に、「外箱」という単語文字列に対応付けられた「外箱1」という符号文字列および「外箱20」という符号文字列の各々が括弧書きで挿入されている。同様の方法で、「スプリング」、「駆動モータ」、「回転軸」、「脱水かご」、「バランスリング」、および「バランスリング取付部」という単語文字列の各々の直後に、「スプリング4」、「駆動モータ5」、「回転軸6」、「脱水かご11」、「バランスリング13」、および「バランスリング取付部12」という符号文字列の各々が括弧書きで挿入されている。
【0198】
ユーザは、テキストボックスTX71に表示された文書をコピーして、他の文書にペーストすることで、特許請求の範囲に記載された構成と実施の形態に記載された構成との対応関係を示す資料などを作成することができる。またユーザは、テキストボックスTX71に表示された文書をコピーして、作成中の特許出願の明細書内の特許請求の範囲および要約書の欄にペーストすることで、簡単な操作により特許出願の明細書内の特許請求の範囲および要約書の欄を作成することができる。その結果、ユーザの利便性が向上する。
【0199】
「閉じる」ボタンBT74が押下されると、文書処理システムは、ポップアップ画面PP3を閉じる。
【0200】
図28は、本発明の第2の実施の形態においてデータベース207に登録された文字列の対応関係を第2の出力形式で出力した場合の特許明細書エディタのウィンドウを示す図である。
【0201】
図28を参照して、「符号の説明に対応挿入」ボタンBT71が押下された場合には、文書処理システムは、特許明細書エディタのウィンドウ上にポップアップ画面PP4を表示することで、データベース207に登録された文字列の対応関係を第2の出力形式で出力する。第2の出力形式は、符号文字列の符号と符号文字列の単語との関係を説明する文書に、単語文字列を挿入した形式である。
【0202】
ポップアップ画面PP4は、テキストボックスTX72と、「閉じる」ボタンBT75とを含んでいる。テキストボックスTX72には、特許出願の明細書内の符号の説明の欄の一般的な記載方法に従って、符号文字列の符号と符号文字列の単語との関係を説明する文書が表示される。すなわち、表示した文書では、符号文字列の符号と符号文字列の単語とが同一の行に互いに間隔を空けて記載される。符号文字列の符号と符号文字列の単語とが記載された行の真下の行には、符号文字列に対応付けられた単語文字列が挿入される。
【0203】
なお、第2の出力形式では、符号文字列の符号と符号文字列の単語との関係を説明する文書に、その符号文字列に対応付けられた単語文字列が挿入されればよい。表示した文書における符号文字列の符号と符号文字列の単語との関係を説明する記載の直後に、その符号文字列に対応付けられた単語文字列とともにその符号文字列に対応付けられた符号文字列も挿入されてもよい。
【0204】
図28のテキストボックスTX72では、たとえば符号文字列の符号と符号文字列の単語との関係を説明する「1 外箱」という記載の直後に、「→関連要素:「外箱20」」という記載によって、「外箱1」という符号文字列に対応付けられた「外箱20」という符号文字列が挿入されており、「→対応の請求項の文言:『外箱』」という記載によって、「外箱1」という符号文字列に対応付けられた「外箱」という単語文字列が挿入されている。
【0205】
ユーザは、テキストボックスTX72に表示された文書をコピーして他の文書にペーストすることで、特許請求の範囲に記載された構成と実施の形態に記載された構成との対応関係を示す資料などを作成することができる。またユーザは、テキストボックスTX72に表示された文書をコピーして、作成中の特許出願の明細書内の符号の説明の欄にペーストすることで、簡単な操作により特許出願の明細書内の符号の説明の欄を作成することができる。その結果、ユーザの利便性が向上する。
【0206】
「閉じる」ボタンBT75が押下されると、文書処理システムは、ポップアップ画面PP4を閉じる。
【0207】
図29は、本発明の第2の実施の形態においてデータベース207に登録された文字列の対応関係を第3の出力形式で出力した場合の特許明細書エディタのウィンドウを示す図である。
【0208】
図29を参照して、「実施の形態にクレームの文言を追加」ボタンBT72が押下された場合には、文書処理システムは、データベース207に登録された文字列の対応関係を第3の出力形式で出力する。第3の出力形式は、符号文字列を含む文書における符号文字列の直後に、単語文字列を挿入した形式である。
【0209】
図29では、テキストボックスTX1に、作成中の特許出願の文書データの明細書の欄の部分が表示されている。テキストボックスTX1に表示された文書中の符号文字列のうち初出の符号文字列の直後に、単語文字列が括弧書きで挿入されている。具体的には、「外箱1」という符号文字列のうち初出のものの直後に「(外箱の一例)」という記載によって、「外箱1」という符号文字列に対応付けられた「外箱」という単語文字列が挿入されている。同様に、「スプリング4」、「駆動モータ5」、および「回転軸6」という符号文字列の各々について、初出のものの直後に、「スプリング」、「駆動モータ」、および「回転軸」という単語文字列の各々が挿入されている。
【0210】
このように、実施の形態の文書中の符号文字列の直後に、単語文字列が括弧書きで挿入されていると、ユーザや特許出願の読み手は、特許請求の範囲に記載された構成が実施の形態でどのようにサポートされているかを容易に把握することができ。その結果、ユーザおよび読み手の利便性が向上する。
【0211】
図30は、本発明の第2の実施の形態においてデータベース207に登録された文字列の対応関係を第4の出力形式で出力した場合の特許明細書エディタのウィンドウを示す図である。
【0212】
図30を参照して、「クレーム→手段+対応作成」ボタンBT73が押下された場合には、文書処理システムは、特許明細書エディタのウィンドウ上にポップアップ画面PP5を表示することで、データベース207に登録された文字列の対応関係を第4の出力形式で出力する。第4の出力形式は、第1の出力方式と類似のものであり、単語文字列を含む文書における単語文字列の直後に、符号文字列または符号文字列に含まれる符号を挿入した形式である。
【0213】
ポップアップ画面PP5は、テキストボックスTX73と、「閉じる」ボタンBT76とを含んでいる。テキストボックスTX73には、特許出願の明細書内の課題を解決するための手段の欄の一般的な記載方法に従って、特許請求の範囲に記載された発明を説明する文書が表示される。表示した文書における単語文字列の直後には、その単語文字列に対応付けられた符号文字列が括弧書きで挿入されている。なお、テキストボックスTX73には、表示した文書における単語文字列の直後に、符号文字列の符号のみが挿入されてもよい。
【0214】
図30のテキストボックスTX73には、特許請求の範囲を説明する文書中の「外箱」という単語文字列の直後に、「外箱」という単語文字列に対応付けられた「外箱1」という符号文字列および「外箱20」という符号文字列の各々が括弧書きで挿入されている。同様の方法で、課題を解決するための手段の欄に記載された文字列における「スプリング」、「駆動モータ」、「回転軸」、「脱水かご」、「バランスリング」、および「バランスリング取付部」という単語文字列の各々の直後に、「スプリング4」、「駆動モータ5」、「脱水かご11」、「バランスリング13」、および「バランスリング取付部12」という符号文字列の各々が括弧書きで挿入されている。
【0215】
ユーザは、テキストボックスTX73に表示された文書をコピーして他の文書にペーストすることで、特許請求の範囲に記載された構成と実施の形態に記載された構成との対応関係を示す資料などを作成することが可能である。またユーザは、テキストボックスTX72に表示された文書をコピーして、作成中の特許出願の明細書内の課題を解決するための手段の欄にペーストすることで、特許出願の明細書内の課題を解決するための手段の欄を簡単な操作により作成することができる。その結果、ユーザの利便性が向上する。
【0216】
「閉じる」ボタンBT76が押下されると、文書処理システムは、ポップアップ画面PP5を閉じる。
【0217】
図31は、本発明の第2の実施の形態における符号文字列と単語文字列との対応関係の出力処理を示すフローチャートである。このフローチャートは、記憶装置111に記憶されたプログラムをCPU101が実行することにより実現される。
【0218】
図31を参照して、CPU101は、符号文字列と単語文字列との対応関係を出力する処理を開始するトリガが発生したか否かを判別する(S601)。符号文字列と単語文字列との対応関係を出力する処理を開始するトリガが発生したと判別するまで、CPU101はステップS601の処理を繰り返す。
【0219】
ステップS601において、符号文字列と単語文字列との対応関係を出力する処理を開始するトリガが発生したと判別した場合(S601でYES)、CPU101は、トリガの種類に応じた形式で、符号文字列と単語文字列との対応関係を出力し(S603)、処理を終了する。
【0220】
(予測変換用辞書への登録処理)
【0221】
次に、予測変換用辞書への登録方法について説明する。
【0222】
符号文字列がIMEの辞書に登録されると、ユーザは、符号文字列の符号を入力して変換キーを押すことで、その符号に対応する符号文字列の変換結果を得ることができる。また、単語文字列がIMEの辞書に登録されると、ユーザは、単語文字列の読みを入力して変換キーを押すことで、その読みに対応する単語文字列の変換結果を得ることができる。
【0223】
ところでIMEは、過去の入力履歴を予測変換用辞書に登録し、入力途中の文字列(未確定文字列)に応じて予測変換用辞書からピックアップした変換候補を表示する機能を有している(予測変換機能)。予測変換用辞書に記憶される入力履歴は基本的に先入れ先出しである。予測変換用辞書では、新たな入力履歴が記憶される度に、古い入力履歴が消去される。入力途中に表示される予測変換の候補は、入力された日時(予測変換用の辞書に登録された日時)が新しい入力履歴である程、優先して(上位に)表示される。ユーザは、Tabキーを押下することで予測変換の候補を選択し、選択を確定するためのキーを押下することで、予測変化の候補を確定することができる。
【0224】
そこで、文書処理システムは、以下で説明する予測変換用辞書への登録処理を行うことで、データベース207に登録された符号文字列および単語文字列に関する新しい入力履歴を、IMEの予測変換用の辞書に登録する。
【0225】
図32および図33は、本発明の第2の実施の形態において符号文字列および単語文字列を予測変換用辞書へ登録する際のPC100の画面を示す図である。
【0226】
図32を参照して、ユーザは、符号文字列および単語文字列を予測変換用辞書へ登録するためのボタン(ここでは、メニューバーBR2の「IME&DB登録」という操作メニュー中の「DB→予測変換へ登録」というボタン)BT77を押下する。ボタンBT77の押下は、予測変換用辞書への登録処理を開始するトリガとなる。予測変換用辞書への登録処理を開始するトリガは、特定のショートカットキーの押下、マウスの右クリック、もしくは特定の音声入力などのコマンド入力、データベース207への新たな文字列の登録、または特許明細書エディタの起動などによって発生してもよい。
【0227】
図33を参照して、予測変換用辞書への登録処理を開始するトリガが発生すると、文書処理システムは、PC100にインストールされている文字入力可能なアプリケーション(テキストエディタなど)を起動する。起動したアプリケーションのウィンドウWD1が、特許明細書エディタのウィンドウの上に表示される。文書処理システムは、データベース207に登録されている符号文字列および単語文字列の中から文字列を1つずつ抽出する。文書処理システムは、ウィンドウWDにおいて、抽出した文字列の符号または読みを入力し、入力した符号または読みを抽出した文字列に変換し、変換を確定する(入力変換ステップの一例)。これにより、IMEの予測変換用辞書には抽出した文字列の符号または読みと抽出した文字列との組が登録される。
【0228】
なお、データベース207に登録されている符号文字列および単語文字列の中から文字列を1つずつ抽出する際に、文書処理システムは、文字数の多い文字列を文字数の少ない文字列より先に抽出することが好ましい。これにより、文字数の少ない文字列の予測変換用の辞書への登録日時が、文字数の多い文字列の予測変換用の辞書への登録日時よりも新しくなる。その結果、同一の入力文字から始まる複数の文字列が予測変換用辞書に登録されている場合に、文字数の少ない文字列を、文字数の多い文字列よりも優先して(上位に)表示することができ、利便性を向上することができる。また、データベース207に登録されている全ての符号文字列および単語文字列が予測変換用の辞書へ登録される必要は無く、データベース207に登録されている符号文字列および単語文字列のうち少なくとも1つの文字列のみが予測変換用の辞書へ登録されればよい。
【0229】
図34は、本発明の第2の実施の形態における予測変換用辞書への登録処理を示すフローチャートである。このフローチャートは、記憶装置111に記憶されたプログラムをCPU101が実行することにより実現される。
【0230】
図34を参照して、CPU101は、予測変換用辞書への登録処理を開始するトリガが発生したか否かを判別する(S701)。予測変換用辞書への登録処理を開始するトリガが発生したと判別するまで、CPU101はステップS701の処理を繰り返す。
【0231】
ステップS701において、予測変換用辞書への登録処理を開始するトリガが発生したと判別した場合(S701でYES)、CPU101は、テキストエディタを起動し(S703)、データベース207から未抽出の1つの符号文字列または単語文字列を抽出する(S705)。次にCPU101は、テキストエディタのウィンドウに、抽出した文字列の符号または読みを入力し、抽出した文字列に変換する(S707)。次にCPU101は、全ての文字列をデータベース207から抽出したか否かを判別する(S709)。
【0232】
ステップS709において、全ての文字列をデータベース207から抽出しないと判別した場合(S709でNO)、CPU101はステップS705の処理へ進む。ステップS709において、全ての文字列をデータベース207から抽出したと判別した場合(S709でYES)、CPU101は処理を終了する。
【0233】
図35は、本発明の第2の実施の形態において、文字列の符号または読みと文字列との組を予測変換用辞書に登録した直後の特許明細書エディタのウィンドウを示す図である。
【0234】
図35を参照して、文字列の符号または読みと文字列との組を予測変換用辞書に登録した直後に、ユーザがその文字列を入力しようとした場合には、その文字列の入力途中にその文字列の予測変換の候補が表示されるようになる。その結果、ユーザは、データベース207に登録された符号または読みを全て入力する前に、所望する符号文字列または単語文字列への変換が得られる。その結果、ユーザは、符号文字列または単語文字列への変換を容易にかつ確実に行うことができる。
【0235】
一例として、図35では、テキストボックスTX1に「く」という文字が入力されている。この場合、「くどうもーた」という読みの「駆動モータ」という単語文字列と、「くびふりぼうしそうち」という読みの「首振り防止装置」という単語文字列とを含む予測変換の候補が表示される。ここでは、「駆動モータ」という単語文字列の予測変換用の辞書への登録日時が、「首振り防止装置」という単語文字列の予測変換用の辞書への登録日時よりも新しいので、「駆動モータ」という単語文字列が「首振り防止装置」という単語文字列よりも優先して(上位に)表示されている。その結果、ユーザは、「くどうもーた」または「くびふりぼうしそうち」という読みのうち一部を入力するだけで、「駆動モータ」または「首振り防止装置」という所望の単語文字列への変換を容易にかつ確実に行うことができる。
【0236】
[その他]
【0237】
データベース207の登録内容は、特許明細書エディタで開かれる作成中の特許出願の文書データに関連付けられていてもよい。すなわち、文書処理システムは、特許明細書エディタ内で作成中の特許出願の文書データを保存する際に、作成中の特許出願の文書データにデータベース207の登録内容を関連付けて保存し、IME及びデータベース207の登録内容を削除してもよい。また、文書処理システムは、特許明細書エディタで作成中の特許出願の文書データを開く際に、作成中の特許出願の文書データに関連付けられたデータベース207の登録内容を読み出し、読み出した内容をIMEの辞書およびデータベース207に登録してもよい。
【0238】
対応付けを用いて、請求項中の用語に対応する語が明細書中のどの段落に書かれているかをユーザに提示することとしてもよい。例えば、「請求項1中の「外箱」に対応する実施例の用語「外箱1」は、[0021]、[0033]段落に書いてあります。」のようなメッセージを出力するものである。これは、請求項中から対応付けが行われている単語を検索し、検索された単語に対応する単語を、特許明細書の請求項以外の部分から検索し、それが存在する部分を出力するものである。
【0239】
IMEに登録する場合、読みの登録は全角にすることが望ましい。例えば「外箱1」の場合、読みを半角の「1」とするのではなく、全角の「1」に変換して登録するものである。日本語のIMEは、全角の入力に対して機能するためである。
【0240】
図33では予測変換への登録を行うときに、ウィンドウWD1(メモ帳などのテキスト入力ソフトのウィンドウ)において、RPA(ロボティック・プロセス・オートメーション)を用いて読みや符号をタイピングするための信号を発生させる。読みや符号がタイピングされた後に、「変換」キーをタイピングすることで、辞書に登録されている語への変換が行われる。登録語の読みは、ローマ字に変換してRPAでタイピングさせることが望ましい。
【0241】
図9、14ではユーザによって選択された範囲から語を抽出して登録することとしたが、ユーザの選択なしに文書全てから語を検索して登録することとしてもよい(すなわち、全てが選択された状態とし、その全てから語を検索(抽出)して登録するものである)。また図9ではテキストボックスTX1に含まれる全ての文書を検索対象としてもよいし、図14ではテキストボックスTX2に含まれる全ての文書を検索対象としてもよい。
【0242】
上述の複数の実施の形態、およびそれに含まれる要素(一部の構成、一部の処理)を組み合わせたり、入替えたりすることで新たな別の実施の形態とすることもできる。
【0243】
なお、上記実施の形態において、文書処理は外部サーバを用いて行ってもよいし、スタンドアローンのPC内やLAN内のPC内で行ってもよい。
【0244】
上述の実施の形態における処理は、ソフトウェアにより行っても、ハードウェア回路を用いて行ってもよい。また、上述の実施の形態における処理を実行するプログラムを提供することもできるし、そのプログラムをCD-ROM、フレキシブルディスク、ハードディスク、ROM、RAM、メモリカードなどの記録媒体に記録してユーザに提供することにしてもよい。プログラムは、CPUなどのコンピュータにより実行される。また、プログラムはインターネットなどの通信回線を介して、装置にダウンロードするようにしてもよい。
【0245】
上記実施の形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。
【符号の説明】
【0246】
100 コンピュータ
101 CPU(Central Processing Unit)
103 通信部
107 ROM(Read Only Memory)
109 RAM(Random Access Memory)
111 記憶装置
113 出力部
115 ディスプレイ
117 グラフィックユニット
119 キーボード
121 マウス
200 他社コンピュータ資源
201 制御部
203 置換部
205 言葉登録部
207 データベース
209 メモリ
211 出力部
213 入力部
300 LAN(Local Area Network)
400 インターネット
500 自社コンピュータ資源
BR1 タイトルバー
BR2 メニューバー
BR3 検索/置換バー
BR4 リストコントロール編集バー
BT31,BT32,BT33,BT41,BT42,BT43,BT44,BT51,BT52,BT53,BT61,BT62,BT63,BT70,BT71,BT72,BT73,BT74,BT75,BT76,BT77 ボタン
LC1,LC2 リストコントロール
PP1,PP2,PP3,PP4,PP5 ポップアップ画面
TB1,TB2,TB3 タブ
TX1,TX2,TX31,TX32,TX51,TX61,TX71,TX72,TX73 テキストボックス
WD1 ウィンドウ
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27
図28
図29
図30
図31
図32
図33
図34
図35