IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 雲拓科技有限公司の特許一覧

特許7105500コンピュータによって実行される文字間スペースなし特許書類のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-07-14
(45)【発行日】2022-07-25
(54)【発明の名称】コンピュータによって実行される文字間スペースなし特許書類のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法
(51)【国際特許分類】
   G06F 40/279 20200101AFI20220715BHJP
   G06Q 50/18 20120101ALI20220715BHJP
【FI】
G06F40/279
G06Q50/18 310
【請求項の数】 8
(21)【出願番号】P 2020148638
(22)【出願日】2020-09-04
(65)【公開番号】P2021082252
(43)【公開日】2021-05-27
【審査請求日】2020-09-04
(31)【優先権主張番号】108141435
(32)【優先日】2019-11-14
(33)【優先権主張国・地域又は機関】TW
(73)【特許権者】
【識別番号】516040154
【氏名又は名称】雲拓科技有限公司
【氏名又は名称原語表記】INTEGRAL SEARCH INTERNATIONAL LTD.
【住所又は居所原語表記】7F.,No.14-1,Aly.21,Ln.69,Sec.5,Minsheng E.Rd.,Songshan Dist.,Taipei City 10572,Taiwan
(74)【代理人】
【識別番号】100175064
【弁理士】
【氏名又は名称】相澤 聡
(72)【発明者】
【氏名】林志青
【審査官】長 由紀子
(56)【参考文献】
【文献】特開2017-211993(JP,A)
【文献】特開2018-120586(JP,A)
【文献】原 正巳 外2名,テキストのフォーマットと単語の範囲内重要度を利用したキーワード抽出,情報処理学会論文誌,日本,社団法人情報処理学会,1997年02月15日,第38巻 第2号,pp.299-309
【文献】柚木山 駿 外3名,特許関連業務支援のための技術用語自動抽出の試み,言語処理学会第22回年次大会 発表論文集 [online],日本,言語処理学会,2016年02月29日,pp.326-329,http://www.anlp.jp/proceedings/annual_meeting/2016/pdf_dir/C1-3.pdf
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/00-58
G06Q 50/18
(57)【特許請求の範囲】
【請求項1】
コンピュータを用いて中国語文字からなる中国語文字の特許請求の範囲の文字に対して前記中国語文字の特許請求の範囲に所属する各要素名詞文字コードを自動的に獲得して自動獲得要素名詞とし、コンピュータによって実行される、中国語特許書類の要素名詞自動獲得方法であって、
コンピュータによって、中国語文字の特許請求の範囲の文字コードを自動的に読み取って前記中国語文字の特許請求の範囲の文字とし、基本排除文字データベースにおいて冠詞文字コード、単位データベース文字コード、フォーム字文字コード、慣用字文字コードを含む複数の基本排除文字コードを複数の基本排除文字とすることに基いて、前記中国語文字の特許請求の範囲の文字コードから、複数の前記基本排除文字コードを排除するように記録して、前記中国語文字の特許請求の範囲の文字コードにおける前記基本排除文字コードが排除された連続文字コードを基本排除文字連続文字コードとする、基本排除文字記録排除工程と、
コンピュータによって、複数の基本排除文字連続文字コードを自動的に読取って基本排除文字連続文字とし、前記基本排除文字連続文字コードと前記基本排除文字連続文字の前の排除と記録された前記基本排除文字コードの間の文字コード相隣文字関係に基き、前記基本排除文字連続文字コードと前記基本排除文字連続文字の後の排除と記録された前記基本排除文字コードの間の慣用字文字コード、動詞文字コード、副詞文字コード、設置詞文字コードを含む文字コード相隣文字関係に基いて、前記基本排除文字連続文字コードから、削除可能文字コードを削除可能文字として排除するように記録し、前記基本排除文字連続文字コードから、前記削除可能文字コートが排除されて削除可能文字削除連続文字コードを獲得して削除可能文字削除連続文字とする、削除可能文字記録排除工程と、
コンピュータによって、複数の前記削除可能文字削除連続文字コードを自動的に読取って複数の前記削除可能文字削除連続文字とし、単一文字排除文字コードを前記削除可能文字削除連続文字コードから排除するように記録して、前記削除可能文字削除連続文字コードから、前記単一文字排除文字コードが排除されて初歩要素名詞文字コードを獲得して初歩要素名詞とする、単一文字記録排除工程と、
コンピュータによって、複数の前記初歩要素名詞文字コードを自動的に読取って複数の初歩要素名詞文字とし、前記初歩要素名詞文字コードの前一つ文字が不定冠詞文字コードである前記初歩要素名詞文字コードを前字不定冠詞初歩要素名詞文字コードとし、かつ前記初歩要素名詞文字コードの前一つ文字が定冠詞であるもう一つの初歩要素名詞文字コードを前字定冠詞初歩要素名詞文字コードとし、前記前字不定冠詞初歩要素名詞文字コードを前から後への順序で前記前字定冠詞初歩要素名詞文字コードと比較し、前記前字定冠詞初歩要素名詞文字コードに対して前記前字不定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞コードを獲得し、且つ、前記前字不定冠詞初歩要素名詞文字コードに対して前記前字定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞文字コードを獲得して獲得要素名詞文字とする、高度排除文字記録排除工程と、を含むことを特徴とするコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法
【請求項2】
前記削除可能文字記録排除工程が首部文字記録排除工程を有し、前記首部文字記録排除工程がコンピュータを用いて複数の前記基本排除文字連続文字コードを自動的に読取って複数の前記基本排除文字連続文字とし、慣用字文字コードである削除可能識別文字コードに基づいて:各前記基本排除文字連続文字コードの起始文字コードや起始連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記対応削除可能識別文字コード且つ/或は前記対応削除可能識別文字コード後の指定文字数の文字コードを首部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードの起始文字コードの相隣前文字コードや相隣前連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記起始文字コード後の指定文字数の文字コードを首部削除文字コードとして排除するように記録することで、前記基本排除文字排除連続文字コードにおける前記首部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コードとすることを特徴とする請求項1のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法
【請求項3】
前記削除可能文字記録排除工程が尾部文字記録排除工程を更に有し、前記尾部文字記録排除装置がコンピュータを用いて複数の前記基本排除文字連続文字コードを自動的に読取って複数の前記基本排除文字連続文字とし、慣用字コードである削除可能識別文字コードに基づいて:各前記基本排除文字連続文字コードの末文字コードや末連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記対応削除可能識別文字コード且つ/或は前記対応削除可能識別文字コード前の指定文字数の文字コードを尾部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードの末文字コードの相隣後文字コードや相隣後連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記末文字コード前の指定文字数の文字コードを尾部削除文字コードとして排除するように記録することで、前記基本排除文字排除連続文字コードにおける前記尾部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コードとすることを特徴とする請求項1のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法
【請求項4】
各獲得要素名詞文字コード、句読点文字コードおよび改行符号文字コードに基いて、前記中国語文字の特許請求の範囲の構造を得ることを特徴とする請求項1のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法。
【請求項5】
コンピュータを用いて中国語文字からなる中国語文字の特許請求の範囲の文字に対して前記中国語文字の特許請求の範囲に所属する各要素名詞文字コードを自動的に獲得して自動獲得要素名詞とし、コンピュータによって実行される、コンピュータによって実行される中国語特許書類の要素名詞自動獲得方法であって、
コンピュータによって、中国語文字の特許請求の範囲の文字コードを自動的に読み取って前記中国語文字の特許請求の範囲の文字とし、要素名詞対照表における要素対照表要素名詞文字コードに基いて、前記中国語文字の特許請求の範囲の文字コードから、前記要素対照表要素名詞文字コードを排除するように記録し、前記中国語文字の特許請求の範囲の文字コードにおける前記要素対照表要素名詞文字コードが排除された連続文字コードを要素対照表要素名詞排除連続文字コードとする、要素対照表要素名詞記録排除工程と、
コンピュータによって、前記要素対照表要素名詞排除連続文字コードを自動的に読み取り、基本排除文字データベースにおいて冠詞文字コード、単位データベース文字コード、フォーム字文字コード、慣用字文字コードを含む複数の基本排除文字コードを複数の基本排除文字とすることに基いて、前記要素対照表要素名詞排除連続文字コードから、前記基本排除文字コードを排除するように記録し、前記要素対照表要素名詞排除連続文字コードにおける前記基本排除文字コードが排除された連続文字コードを基本排除文字連続文字コードとする、基本排除文字記録排除工程と、
コンピュータによって、複数の前記基本排除文字連続文字コードを自動的に読取って基本排除文字連続文字とし、前記基本排除文字連続文字コードと前記基本排除文字連続文字コードの前の排除と記録された前記基本排除文字コードの間の文字連続関係に基き、及び、前記基本排除文字連続文字コードと前記基本排除文字連続文字コードの後の排除と記録された前記基本排除文字コードの間の慣用字文字コード、動詞文字コード、副詞文字コード及び設置詞文字コードの間の文字コード相隣文字関係である文字コード相隣文字関係に基いて、前記基本排除文字連続文字コードから、削除可能文字コードを削除可能文字として排除するように記録し、前記基本排除文字連続文字コードから、前記削除可能文字コードが排除されて削除可能文字削除連続文字コードを獲得して削除可能文字削除連続文字とする、削除可能文字記録排除工程と、
コンピュータによって、複数の前記削除可能文字削除連続文字コードを自動的に読取って複数の前記削除可能文字削除連続文字とし、単一文字排除文字コードを前記削除可能文字削除連続文字コードから排除するように記録して、前記削除可能文字削除連続文字コードから、単一文字排除文字コードが排除されて初歩要素名詞文字コードを獲得して初歩要素名詞とする、単一文字記録排除工程と、
コンピュータによって、複数の前記最初要素名詞文字コードを自動的に読取って複数の最初要素名詞とし、前一つ文字が不定冠詞である前記初歩要素名詞文字コードを前字不定冠詞初歩要素名詞文字コードとし、前一つ文字が定冠詞であるもう一つの前記初歩要素名詞文字コードを前字定冠詞初歩要素名詞文字コードとし、前記前字不定冠詞初歩要素名詞文字コードを前から後への順序で前記前字定冠詞初歩要素名詞文字コードと比較し、前記前字定冠詞初歩要素名詞文字コードに対して前記前字不定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞文字コードを獲得して獲得要素名詞文字とし、且つ、前記前字不定冠詞初歩要素名詞文字コードに対して前記前字定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞文字コードを獲得して獲得要素名詞とする、高度排除文字記録排除工程と、を含むことを特徴とするコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法。
【請求項6】
前記削除可能文字記録排除工程が首部文字記録排除工程を有し、前記首部文字記録排除工程がコンピュータを用いて複数の前記基本排除文字連続文字コードを自動的に読取って複数の前記基本排除文字連続文字とし、慣用字文字コードである削除可能識別文字コードにより:各前記基本排除文字連続文字コードの起始文字コードや起始連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記対応削除可能識別文字コード且つ/或は前記対応削除可能識別文字コード後の指定文字数の文字コードを首部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードの起始文字コードの相隣前文字コードや相隣前連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記起始文字コード後の指定文字数の文字コードを首部削除文字として排除するように記録することで、前記基本排除文字排除連続文字コードにおける前記首部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コードとすることを特徴とする請求項5のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法。
【請求項7】
前記削除可能文字記録排除工程が尾部文字記録排除工程を更に有し、前記尾部文字記録排除装置がコンピュータを用いて複数の前記基本排除文字連続文字コードを自動的に読取って複数の前記基本排除文字連続文字とし、慣用字コードである削除可能識別文字コードにより:各前記基本排除文字連続文字コードの末文字や末連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記対応削除可能識別文字コード且つ/或は前記対応削除可能識別文字コード前の指定文字数の文字コードを尾部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードの末文字コードの相隣後文字コードや相隣跡後連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記末文字コード前の指定文字数の文字コードを尾部削除文字コードとして排除するように記録することで、前記基本排除文字排除連続文字コードにおける前記尾部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コードとすることを特徴とする請求項5のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法。
【請求項8】
各獲得要素名詞文字コード、句読点文字コードおよび改行符号文字コードに基いて、前記中国語文字の特許請求の範囲の構造を得ることを特徴とする請求項5のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンピュータによって実行される中国語特許書類の要素名詞自動獲得方法に関するものであって、特に、文字間スペースなし特許書類のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法に関する。
【背景技術】
【0002】
特許の明細書というのは、複雑で読みにくいものである。人工知能によって特許請求項における要素名詞を識別するのは、人工知能特許閲読補助システムの礎である。要素名詞とは、特許請求項において要素を構成する定義文字であり、その要素名詞が名詞だけではなく、名詞文字が最終文字として、形容詞、動詞、副詞や名詞を含んで構成する定義文字であり、例えば、「受信アンテナ」、「信号発送手段」などがある。特許請求項の要素名詞を獲得することでその要素名詞の所属位置を獲得できるので、その要素名詞に対応する動作特徴、接続関係や位置関係の対応位置をより明確に獲得でき、特許の閲読者へ明確に補助して、その特許請求項の技術特徴をより明白に理解させることができる。
【0003】
しかしながら、例えば、中国語、日本語、韓国語などのアジア言語である文字間スペースなし言語文字について、文字と文字の間にはスペースが存在しないので、英語に比べて、前記文字間スペースなし言語文字の文字と文字の間の組合せを識別することが難しくて、各種の組合った言葉を認識するのが難しいこともある。この場合では、自然言語の品詞の解析を実現するのは困難なことである。要素名詞データベースの方法を確立して品詞によって要素名詞の識別を行う方法が提案されるが、特許請求項の要素名詞は色んな変化があるので、膨大な要素名詞データベースの立ち上げが不可能であり、動詞、名詞、形容詞、副詞などの誤判がよくある。また、膨大な要素名詞データベースを立ち上げることが可能であっても、そのような膨大なデータベースの資料比較工程を行うことは、膨大な時間をかかるので、実施するのが難しくなる。
【発明の概要】
【発明が解決しようとする課題】
【0004】
このため、請求の範囲の要素名詞を、如何に高効率で正確に自動的に獲得する方法、即ち、要素名詞データベースの方法に頼らず、且つ、品詞で要素名詞の判断を行わずに、特許請求項のフォーマットおよび特性により、膨大なシステム計算およびストレージをかけずに、効率な最高獲得数、最高正確度、最速獲得速度の方法が求められている。
【0005】
このため、本発明は上記の課題に鑑みてなされたもので、要素名詞データベースの立ち上げ、且つ、品詞での要素名詞の判断の代わりに、要素名詞の存在不可能の文字位置を順を追って排除することで要素名詞を獲得し、数が多く、成功確率が高く、且つ最速の獲得速度で特許請求の範囲の要素名詞及び要素名詞所属位置を効率的に獲得できる文字間スペースなし特許書類のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明が従来の技術問題を解決するために用いる技術手段は、コンピュータを用いて中国語文字からなる中国語文字の特許請求の範囲の文字に対して前記中国語文字の特許請求の範囲に所属する各要素名詞文字コードを自動的に獲得して自動獲得要素名詞とし、コンピュータによって実行される、コンピュータによって実行される中国語特許書類の要素名詞自動獲得方法であって、コンピュータによって、中国語文字の特許請求の範囲の文字コードを自動的に読み取って前記中国語文字の特許請求の範囲の文字とし、基本排除文字データベースにおいて冠詞文字コード、単位データベース文字コード、フォーム字文字コード、慣用字文字コードを含む複数の基本排除文字コードを複数の基本排除文字とすることに基いて、前記中国語文字の特許請求の範囲の文字コードから、複数の前記基本排除文字コードを排除するように記録して、前記中国語文字の特許請求の範囲の文字コードにおける前記基本排除文字コードが排除された連続文字コードを基本排除文字連続文字コードとする、基本排除文字記録排除工程と、コンピュータによって、複数の基本排除文字連続文字コードを自動的に読取って基本排除文字連続文字とし、前記基本排除文字連続文字コードと前記基本排除文字連続文字の前の排除と記録された前記基本排除文字コードの間の文字コード相隣文字関係に基き、前記基本排除文字連続文字コードと前記基本排除文字連続文字の後の排除と記録された前記基本排除文字コードの間の慣用字文字コード、動詞文字コード、副詞文字コード、設置詞文字コードを含む文字コード相隣文字関係に基いて、前記基本排除文字連続文字コードから、削除可能文字コードを削除可能文字として排除するように記録し、前記基本排除文字連続文字コードから、前記削除可能文字コートが排除されて削除可能文字削除連続文字コードを獲得して削除可能文字削除連続文字とする、削除可能文字記録排除工程と、コンピュータによって、複数の前記削除可能文字削除連続文字コードを自動的に読取って複数の前記削除可能文字削除連続文字とし、単一文字排除文字コードを前記削除可能文字削除連続文字コードから排除するように記録して、前記削除可能文字削除連続文字コードから、前記単一文字排除文字コードが排除されて初歩要素名詞文字コードを獲得して初歩要素名詞とする、単一文字記録排除工程と、コンピュータによって、複数の前記初歩要素名詞文字コードを自動的に読取って複数の初歩要素名詞文字とし、前記初歩要素名詞文字コードの前一つ文字が不定冠詞文字コードである前記初歩要素名詞文字コードを前字不定冠詞初歩要素名詞文字コードとし、かつ前記初歩要素名詞文字コードの前一つ文字が定冠詞であるもう一つの初歩要素名詞文字コードを前字定冠詞初歩要素名詞文字コードとし、前記前字不定冠詞初歩要素名詞文字コードを前から後への順序で前記前字定冠詞初歩要素名詞文字コードと比較し、前記前字定冠詞初歩要素名詞文字コードに対して前記前字不定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞コードを獲得し、且つ、前記前字不定冠詞初歩要素名詞文字コードに対して前記前字定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞文字コードを獲得して獲得要素名詞文字とする、高度排除文字記録排除工程と、を含むことを特徴とするコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供する。
【0007】
本発明の1つの実施例では、前記削除可能文字記録排除工程が首部文字記録排除工程を有し、前記首部文字記録排除工程がコンピュータを用いて複数の前記基本排除文字連続文字コードを自動的に読取って複数の前記基本排除文字連続文字とし、慣用字文字コードである削除可能識別文字コードに基づいて:各前記基本排除文字連続文字コードの起始文字コードや起始連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記対応削除可能識別文字コード且つ/或は前記対応削除可能識別文字コード後の指定文字数の文字コードを首部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードの起始文字コードの相隣前文字コードや相隣前連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記起始文字コード後の指定文字数の文字コードを首部削除文字として排除するように記録することで、前記基本排除文字排除連続文字コードにおける前記首部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コードとすることを特徴とする上述のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供する。
【0008】
本発明の1つの実施例では、前記削除可能文字記録排除工程が尾部文字記録排除工程を更に有し、前記尾部文字記録排除装置がコンピュータを用いて複数の前記基本排除文字連続文字コードを自動的に読取って複数の前記基本排除文字連続文字とし、慣用字コードである削除可能識別文字コードに基づいて:各前記基本排除文字連続文字コードの末文字や末連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記対応削除可能識別文字コード且つ/或は前記対応削除可能識別文字コード前の指定文字数の文字コードを尾部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードの末文字コードの相隣後文字コードや相隣後連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記末文字コード前の指定文字数の文字コードを尾部削除文字コードとして排除するように記録することで、前記基本排除文字排除連続文字コードにおける前記尾部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コードとすることを特徴とする上述のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供する。
【0009】
本発明の1つの実施例では、前記高度排除文字記録排除工程が更に高度排除慣用字コードによって各前記初歩要素名詞コードから前記高度排除慣用字コードを排除するように記録し、前記初歩要素名詞文字コードにおける前記高度排除文字コードが排除された連続文字コードを前記獲得要素名詞文字コードとすることを特徴とする上述のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供する。
【0010】
本発明の1つの実施例では、各獲得要素名詞文字コード、各獲得要素名詞文字コードの獲得要素名詞所属位置コード、句読点文字コードおよび改行符号文字コードに基いて、前記中国語文字の特許請求の範囲の構造を得ることを特徴とする上述のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供する。
【0011】
本発明が従来の技術問題を解決するために用いるもう一つの技術手段は、コンピュータを用いて中国語文字からなる中国語文字の特許請求の範囲の文字に対して前記中国語文字の特許請求の範囲に所属する各要素名詞文字コードを自動的に獲得して自動獲得要素名詞とし、コンピュータによって実行される、コンピュータによって実行される中国語特許書類の要素名詞自動獲得方法であって、コンピュータによって、中国語文字の特許請求の範囲の文字コードを自動的に読み取って前記中国語文字の特許請求の範囲の文字とし、要素名詞対照表における要素対照表要素名詞文字コードに基いて、前記中国語文字の特許請求の範囲の文字コードから、前記要素対照表要素名詞文字コードを排除するように記録し、前記中国語文字の特許請求の範囲の文字コードにおける前記要素対照表要素名詞文字コードが排除された連続文字コードを要素対照表要素名詞排除連続文字コードとする、要素対照表要素名詞記録排除工程と、コンピュータによって、前記要素対照表要素名詞排除連続文字コードを自動的に読み取り、基本排除文字データベースにおいて冠詞文字コード、単位データベース文字コード、フォーム字文字コード、慣用字文字コードを含む複数の基本排除文字コードを複数の基本排除文字とすることに基いて、前記要素対照表要素名詞排除連続文字コードから、前記基本排除文字コードを排除するように記録し、前記要素対照表要素名詞排除連続文字コードにおける前記基本排除文字コードが排除された連続文字コードを基本排除文字連続文字コードとする、基本排除文字記録排除工程と、コンピュータによって、複数の前記基本排除文字連続文字コードを自動的に読取って基本排除文字連続文字とし、前記基本排除文字連続文字コードと前記基本排除文字連続文字コードの前の排除と記録された前記基本排除文字コードの間の文字連続関係に基き、及び、前記基本排除文字連続文字コードと前記基本排除文字連続文字コードの後の排除と記録された前記基本排除文字コードの間の慣用字文字コード、動詞文字コード、副詞文字コード及び設置詞文字コードの間の文字コード相隣文字関係である文字コード相隣文字関係に基いて、前記基本排除文字連続文字コードから、削除可能文字コードを削除可能文字として排除するように記録し、前記基本排除文字連続文字コードから、前記削除可能文字コードが排除されて削除可能文字削除連続文字コードを獲得して削除可能文字削除連続文字とする、削除可能文字記録排除工程と、コンピュータによって、複数の前記削除可能文字削除連続文字コードを自動的に読取って複数の前記削除可能文字削除連続文字とし、単一文字排除文字コードを前記削除可能文字削除連続文字コードから排除するように記録して、前記削除可能文字削除連続文字コードから、単一文字排除文字コードが排除されて初歩要素名詞文字コードを獲得して初歩要素名詞とする、単一文字記録排除工程と、コンピュータによって、複数の前記最初要素名詞文字コードを自動的に読取って複数の最初要素名詞とし、前一つ文字が不定冠詞である前記初歩要素名詞文字コードを前字不定冠詞初歩要素名詞文字コードとし、前一つ文字が定冠詞であるもう一つの前記初歩要素名詞文字コードを前字定冠詞初歩要素名詞文字コードとし、前記前字不定冠詞初歩要素名詞文字コードを前から後への順序で前記前字定冠詞初歩要素名詞文字コードと比較し、前記前字定冠詞初歩要素名詞文字コードに対して前記前字不定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞文字コードを獲得して獲得要素名詞文字とし、且つ、前記前字不定冠詞初歩要素名詞文字コードに対して前記前字定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞文字コードを獲得して獲得要素名詞とする、高度排除文字記録排除工程と、を含むことを特徴とするコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法
【0012】
本発明のもう1つの実施例では、前記削除可能文字記録排除工程が首部文字記録排除工程を有し、前記首部文字記録排除工程がコンピュータを用いて複数の前記基本排除文字連続文字コードを自動的に読取って複数の前記基本排除文字連続文字とし、慣用字文字コードである削除可能識別文字コードにより:各前記基本排除文字連続文字コードの起始文字コードや起始連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記対応削除可能識別文字コード且つ/或は前記対応削除可能識別文字コード後の指定文字数の文字コードを首部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードの起始文字コードの相隣前文字コードや相隣前連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記起始文字コード後の指定文字数の文字コードを首部削除文字として排除するように記録することで、前記基本排除文字排除連続文字コードにおける前記首部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コードとすることを特徴とするもう一つのコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供する。
【0013】
本発明のもう1つの実施例では、前記削除可能文字記録排除工程が尾部文字記録排除工程を更に有し、前記尾部文字記録排除装置がコンピュータを用いて複数の前記基本排除文字連続文字コードを自動的に読取って複数の前記基本排除文字連続文字とし、慣用字コードである削除可能識別文字コードにより:各前記基本排除文字連続文字コードの末文字や末連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記対応削除可能識別文字コード且つ/或は前記対応削除可能識別文字コード前の指定文字数の文字コードを尾部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードの末文字コードの相隣後文字コードや相隣跡後連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記末文字コード前の指定文字数の文字コードを尾部削除文字コードとして排除するように記録することで、前記基本排除文字排除連続文字コードにおける前記尾部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コードとすることを特徴とするもう一つのコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供する。
【0014】
本発明のもう1つの実施例では、前記高度排除文字記録排除工程が更に高度排除慣用字コードによって各前記初歩要素名詞コードから前記高度排除慣用字コードを排除するように記録し、前記初歩要素名詞文字コードにおける前記高度排除文字コードが排除された連続文字コードを前記獲得要素名詞文字コードとすることを特徴とするもう一つのコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供する。
【0015】
本発明のもう1つの実施例では、各獲得要素名詞文字コード、各獲得要素名詞文字コードの獲得要素名詞所属位置コード、句読点文字コードおよび改行符号文字コードに基いて、前記中国語文字の特許請求の範囲の構造を得ることを特徴とするもう一つのコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供する。
【発明の効果】
【0016】
本発明によれば、要素名詞データベースの立ち上げ、且つ、品詞での要素名詞の判断の代わりに、特許請求項の書き方と特性に基いて要素名詞の存在不可能の文字位置で順位に排除することで要素名詞を獲得することで、膨大なシステム計算およびストレージをかからずに、効率な最高獲得数、最高正確度、最速獲得速度で、特許書類のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供する。
【図面の簡単な説明】
【0017】
図1】本発明によるコンピュータによって実行されるコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法の1つの実施例のブロック図である。
図2(a)】基本排除文字連続文字コードの起始文字コードや起始連続文字コードに削除可能識別文字コードが含まれると削除可能識別文字コードを対応削除可能識別文字とすることを示す図である。
図2(b)】基本排除文字連続文字コードの起始文字コードや起始連続文字コードに削除可能識別文字コードが含まれると削除可能識別文字コードを対応削除可能識別文字とすることを示すもう1つの図である。
図2(c)】各基本排除文字連続文字コードの起始文字コードの相隣前文字コードや相隣前連続文字コードに削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにすることを示す図である。
図3(a)】基本排除文字連続文字コードの尾部文字コードや尾部連続文字コードに削除可能識別文字コードが含まれると削除可能識別文字コードを対応削除可能識別文字とすることを示す図である。
図3(b)】基本排除文字連続文字コードの最後文字コードや最後連続文字コードに削除可能識別文字コードが含まれると削除可能識別文字コードを対応削除可能識別文字とすることを示す図である。
図3(c)】各基本排除文字連続文字コードの最後文字コードの相隣前文字コードや相隣前連続文字コードに削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにすることを示す図である。
図4】本発明によるコンピュータによって実行されるコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法のもう1つの実施例のブロック図である。
【発明を実施するための形態】
【0018】
以下、図1図4を用いて本発明の実施形態を説明する。本発明はこれらの説明に限定されるものでおらず、本発明の一つの実施例である。
【0019】
図1図3(c)に示すように、コンピュータによって実行される中国語特許書類の要素名詞自動獲得方法Pは、コンピュータを用いて中国語文字からなる中国語文字の特許請求の範囲の文字に対して所有する要素名詞文字コード(EM)及び要素名詞所属位置コード(EP)を自動的に獲得して自動獲得要素名詞及び自動獲得要素名詞所属位置とする。コンピュータによって実行される中国語特許書類の要素名詞自動獲得方法Pは、基本排除文字記録排除工程1を有し、コンピュータによって、中国語文字の特許請求の範囲の文字コード(C-text)を自動的に読み取って前記中国語文字の特許請求の範囲の文字とし、基本排除文字データベース11において複数の基本排除文字コードBを複数の基本排除文字とすることに基いて、前記中国語文字の特許請求の範囲の文字コード(C-text)から、複数の前記基本排除文字コードBを排除するように記録して、前記中国語文字の特許請求の範囲の文字コード(C-text)における前記基本排除文字コードBが排除された連続文字コードを基本排除文字連続文字コードB-textとする。
基本排除文字データベースにおいて複数の基本排除文字コードが、冠詞文字コード、単位データベース文字コード、フォーム字文字コード、慣用字文字コードを含む。
【0020】
【0021】
【0022】
【0023】
本発明の1つの実施例では、基本排除文字コードBに特定標示元(例えば、BD(Basic deleting words))を与えて前記基本排除文字コードの識別とする。
基本排除文字コードBの特定標示元がBWであると、識別された基本排除文字コードを“BW”を有する特定標示元にするように記録する。
また、前記特定標示文字の中国語文字の特許請求の範囲の文字の最初位置と終了位置を標示でき、例えば、“一種”の基本排除文字の最初位置が0であり、終了位置が1である。
そして、前記特定標示元、前記基本排除文字の内容、前記特定標示文字の最初位置と終了位置をメモリに記憶し、例えば、(BW,“一種”0,1)に記憶する。
もちろん、本発明は上述の様態に限定されず、中国語文字の特許請求の範囲の文字において、基本排除文字コードBと基本排除文字連続文字コードB-Textの相互の位置関係、及び基本排除文字コードBと基本排除文字連続文字コードB-Textの内容を、明確に標示できればいい。
【0024】
【0025】
即ち、図2(a)、図2(b)、図2(c)、図3(a)、図3(b)、図3(c)に示す(排除するように記録された文字コードが“XX”で標示され、検出された削除可能文字コートSDが○で標示される)ように、削除可能文字記録排除工程2は、基本排除文字連続文字コードB-Textにおいて削除可能文字コートSDがあるかどうかを探し(図2(a)、図2(b)、図3(a)、図3(b)のように)、或は、基本排除文字連続文字コードB-Textに相隣する基本排除文字コードBにおいて削除可能文字コートSDがあるかどうかを探し(図2(c)、図3(c)のように)、基本排除文字連続文字コードB-Textにおいて削除可能文字コートSDがあれば(図2(a)、図2(b)、図3(a)、図3(b)のように)、基本排除文字連続文字コードB-Textにおいて削除可能文字コートSDを削除するように記録し(図2(a)、図3(a)のように)、或は、削除可能文字コートSDと共に削除可能文字コートSDの相隣文字や相隣連続文字を削除可能文字として排除するように記録する(図2(b)、図3(b)のように)。
また、基本排除文字コードBにおいて削除可能文字コートSDがあれば(図2(c)、図3(c)のように)、基本排除文字連続文字コードB-Textの首部や尾部の特定文字数の文字コードや連続文字コードを削除可能文字コートSDとして排除するように記録する。
詳細には、削除可能文字コートSDが基本排除文字連続文字コードB-Textに存在し、或は、基本排除文字連続文字コードB-Textの相隣の外に存在する。
「基本排除文字連続文字コードB-Textの相隣の外の削除可能文字コートSD」というのは、削除可能文字コートSDが基本排除文字連続文字コードB-Textに存在されず、基本排除文字連続文字コードB-Textの前相隣基本排除文字コードBの尾部や後相隣基本排除文字コードBの首部に存在する。
更に、本発明の削除可能文字記録排除工程2は、基本排除文字連続文字コードB-Textに対して削除可能文字コートSDを探すこと以外、基本排除文字連続文字コードB-Textの前相隣基本排除文字コードBの尾部文字、後相隣基本排除文字コードBの尾部文字、前相隣基本排除文字コードBの尾部連続文字、或は後相隣基本排除文字コードBの尾部連続文字が削除可能文字コートSDであるかどうかを探し、そうであれば、基本排除文字連続文字コードB-Textの首部文字、尾部文字や尾部連続文字を取り出して削除可能文字として削除するように記録する。
【0026】
被設置成 隔離層鄰接聚合材料層」における「被設置成」の部分を例として、その「一」と「與」が基本排除文字コードBであり、「被設置成」が基本排除文字連続文字コードB-Textである。
「被設置」が削除可能文字コートSDに指定されると、即ち、削除可能文字コートSDが基本排除文字連続文字コードB-Textに存在するので、削除可能文字コートSDである「被設置」を削除可能文字とし、削除可能文字コートSDである「被設置」を、基本排除文字連続文字コードある「被設置成」から排除するように記録し、「被設置」が排除された削除可能文字削除連続文字コート「成」になる。
これは、図2(a)の例である。
【0027】
【0028】
具体的には、図2(a)、図2(b)及び図2(c)に示すように、本発明の削除可能文字記録排除工程2は首部文字記録排除工程21を有する。首部文字記録排除工程21が、がコンピュータを用いて複数の前記基本排除文字連続文字コードB-Textを自動的に読取り、慣用字文字コードである削除可能識別文字(IW、Identifying word)コードにより:各前記基本排除文字連続文字コードB-Textの起始文字コードや起始連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コード(Found-IW)にして前記対応削除可能識別文字コード(Found-IW)且つ/或は前記対応削除可能識別文字コード(Found-IW)後の指定文字数の文字コードを首部削除文字コード(HD)として排除するように記録し、或は、各前記基本排除文字連続文字コードB-Textの起始文字コードの相隣前文字コードや相隣前連続文字コードに前記削除可能識別文字コード(IW)が含まれるかどうかを判断し対応削除可能識別文字コード(Found-IW)にして前記起始文字コード後の指定文字数の文字コードを首部削除文字コード(HD)として排除するように記録することで、前記基本排除文字排除連続文字コードB-Textにおける前記首部削除文字コード(HD)が排除された連続文字コードを前記削除可能文字削除連続文字コード(D-Text)とする。
【0029】
図3(a)、図3(b)及び図3(c)に示すように、前記削除可能文字記録排除工程2が尾部文字記録排除工程22を更に有する。前記尾部文字記録排除装置22が、コンピュータを用いて複数の前記基本排除文字連続文字コードB-Textを自動的に読取って複数の前記基本排除文字連続文字とし、慣用字コードである削除可能識別文字コード(IW)により:各前記基本排除文字連続文字コードB-Textの末文字コードや末連続文字コードに前記削除可能識別文字コード(IW)が含まれるかどうかを判断し対応削除可能識別文字コード(Found-IW)にして前記対応削除可能識別文字コード(Found-IW)且つ/或は前記対応削除可能識別文字コード(Found-IW)前の指定文字数の文字コードを尾部削除文字コード(TD)として排除するように記録し、或は、各前記基本排除文字連続文字コードB-Textの末文字コードの相隣後文字コードや相隣後連続文字コードに前記削除可能識別文字コード(IW)が含まれるかどうかを判断し対応削除可能識別文字コード(Found-IW)にして前記末文字コード前の指定文字数の文字コードを尾部削除文字コード(TD)として排除するように記録することで、前記基本排除文字排除連続文字コードB-Textにおける前記尾部削除文字コード(TD)が排除された連続文字コードを前記削除可能文字削除連続文字コード(D-Text)とする。
【0030】
以下、図2(a)、図2(b)及び図2(c)により、首部文字記録排除工程21の一つの実施例を説明する。
【0031】
図2(a)において、基本排除文字連続文字コードB-Textの起始文字コードや起始連続文字コードに削除可能識別文字コード(IW)が含まれると、削除可能識別文字コード(IW)を対応削除可能識別文字コード(Found-IW)にして、対応削除可能識別文字コード(Found-IW)を首部削除文字コード(HD)として排除するように記録する。
例えば、削除可能識別文字コード(IW、Identifying word)が「被設置」、「或」;「被」;「隨」;「為」;「將」;「給」(字数が多いものが先に執行する)であると、これらの削除可能識別文字コード(IW)を、基本排除文字連続文字コードB-Textの起始の所から排除するように記録する。
【0032】
【0033】
図2(c)において、基本排除文字連続文字コードB-Textの起始文字コードの相隣前文字コードや相隣前連続文字コード(相隣前基本排除文字コードBに存在する)に前記削除可能識別文字コード(IW)が含まれるかどうかを判断し対応削除可能識別文字コード(Found-IW)にして前記起始文字コード後の指定文字数の文字コードを首部削除文字コード(HD)として排除するように記録することで、前記基本排除文字排除連続文字コードB-Textにおける前記首部削除文字コード(HD)が排除された連続文字コードを前記削除可能文字削除連続文字コード(D-Text)とする
例えば、基本排除文字連続文字コードB-Textの相隣前1字コードや相隣前連続文字コード(これらの文字コード及び連続文字コードが排除するように記録された)が、藉以、用以、用來、用於、彼此などの削除可能識別文字コード(IW)であると、基本排除文字連続文字コードB-Textの起始のところの後の2字コードを排除するように記録する。
【0034】
以下、図3(a)、図3(b)及び図3(c)により、尾部文字記録排除工程22の一つの実施例を説明する。
【0035】
図3(a)において、基本排除文字連続文字コードB-Textの末文字コードや末連続文字コードに削除可能識別文字コード(IW)が含まれると、削除可能識別文字コード(IW)を対応削除可能識別文字コード(Found-IW)にして、対応削除可能識別文字コード(Found-IW)を尾部削除文字コード(TD)として排除するように記録する。
例えば、削除可能識別文字コード(IW、Identifying word)が、或、成、於、時、來、有、者、對應、相關、連同、之間、鄰接、“要素名詞+2字”(字数が多いものが先に執行する)であると、これらの削除可能識別文字コード(IW)を、基本排除文字連続文字コードB-Textの尾部の所から排除するように記録する。
【0036】
図3(b)において、基本排除文字連続文字コードB-Textの末文字コードや末連続文字コードに削除可能識別文字コード(IW)が含まれると、削除可能識別文字コード(IW)を対応削除可能識別文字コード(Found-IW)にして、対応削除可能識別文字コード(Found-IW)及び対応削除可能識別文字コード(Found-IW)前の指定文字数の文字コードを尾部削除文字コード(TD)として排除するように記録する。
例えば、削除可能識別文字コード(IW)が、給、到(字数が多いものが先に執行する)、為であると、それらの文字コード及びそれらの文字コードの前2字コードを排除するように記録する。
【0037】
図3(c)において、各前記基本排除文字連続文字コードB-Textの末文字コードの相隣後文字コードや相隣後連続文字コード(相隣後基本排除文字連続文字コードBに存在する)に前記削除可能識別文字コード(IW)が含まれるかどうかを判断し対応削除可能識別文字コード(Found-IW)にして前記末文字コード前の指定文字数の文字コードを尾部削除文字コード(TD)として排除するように記録することで、前記基本排除文字排除連続文字コードB-Textにおける前記尾部削除文字コード(TD)が排除された連続文字コードを前記削除可能文字削除連続文字コード(D-Text)とする。
例えば、基本排除文字連続文字コードB-Textの相隣後1字文字コードや相隣後連続文字コード(これらの文字コード及び連続文字コードが排除するように記録された)が、該、一、於、在であると、基本排除文字連続文字コードB-Textの最終のところの前2字文字コードを排除するように記録する。
【0038】
【0039】
本発明のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法Pは、更に、単一文字記録排除工程3を有し、単一文字記録排除工程3が、コンピュータによって、複数の前記削除可能文字削除連続文字コード(D-text)を自動的に読取って複数の複数の前記削除可能文字削除連続文字とし、単一文字排除文字コード(SW)を複数の前記削除可能文字削除連続文字コード(D-text)から排除するように記録して、前記削除可能文字削除連続文字コードが、前記単一文字排除文字コード(SW)が排除されて初歩要素名詞文字コード(P-EN)を獲得して初歩要素名詞とする、
【0040】
【0041】
本発明のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法Pは、更に、高度排除文字記録排除工程4を有し、高度排除文字記録排除工程4が、コンピュータによって、複数の前記初歩要素名詞文字コード(P-EN)を自動的に読取って複数の前記初歩要素名詞とし、前記初歩要素名詞文字コードの前一つ文字が不定冠詞文字コードである前記初歩要素名詞文字コードを前字不定冠詞初歩要素名詞文字コードとし、前記初歩要素名詞文字コードの前一つ文字が定冠詞であるもう一つの初歩要素名詞文字コードを前字定冠詞初歩要素名詞文字コードとし、前記前字不定冠詞初歩要素名詞文字コードを前から後への順序で前記前字定冠詞初歩要素名詞文字コードと比較する。
前記前字定冠詞初歩要素名詞文字コードに対して前記前字不定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞コードを獲得する。
且つ、前記前字不定冠詞初歩要素名詞文字コードに対して前記前字定冠詞初歩要素名詞文字コードが余尾部文字コードを有する場合、余尾部文字コードを排除するように記録して、獲得要素名詞文字コードを獲得して獲得要素名詞文字とする。
【0042】
詳細には、初歩要素名詞が2字文字コードであり、且つ、その初歩要素名詞の前/後が、「於」、「成」、「至」、「在」、「用於」……などであると、初歩要素名詞文字コードを削除し、及び、「經XX」(XXが2字文字コードを表する)、「為XX」(XXが2字文字コードを表する)、「待XX」(XXが2字文字コードを表する)、「之間」、「同時」、「實時」、「以上」、「被XX的」(XXが2字文字コードを表する)、「XX化」……などの文字コードであると、初歩要素名詞文字コードを削除する。
【0043】
【0044】
【0045】
図1に示すように、更に、本発明の一つの実施例のコンピュータによって実行される、コンピュータによって実行される中国語特許書類の要素名詞自動獲得方法Pによると、高度排除文字記録排除工程4が、更に高度排除慣用字コードによって各前記初歩要素名詞コードから前記高度排除慣用字コードを排除するように記録し、前記初歩要素名詞文字コードにおける前記高度排除文字コードが排除された連続文字コードを前記獲得要素名詞文字コードとする。
この方法によって、獲得要素名詞を確定するので、首部文字記録排除工程21の“要素名詞+2字”の排除するように記録することを再執行でき、要素名詞の獲得正確度を向上できる。
【0046】
図1に示すように、更に、本発明の一つの実施例のコンピュータによって実行される、コンピュータによって実行される中国語特許書類の要素名詞自動獲得方法Pによると、各獲得要素名詞文字コード、各獲得要素名詞文字コードの獲得要素名詞所属位置コード、句読点文字コードおよび改行符号文字コードに基いて、前記中国語文字の特許請求の範囲の構造を得る。
例えば、句読点文字コードによって、中国語文字の特許請求の範囲に対して、改行を行うことができ、且つ、獲得された獲得要素名詞文字コードを、クリックして獲得要素名詞の明細書の位置に移動するようにクリックできると標示することで、獲得要素名詞の意義を更に分かることができる。
【0047】
【0048】
本発明において、上述の実施例以外、要素対照表にリストされる要素名詞を、中国語文字の特許請求の範囲の文字コード(C-text)から見出すことを先に行い、基本排除文字記録排除工程1の基本排除文字連続文字B-textの獲得を行うことができる。
図4に示すように、本発明のもう一つの実施例において、コンピュータによって実行される、文字間スペースなし言語特許書類文字コードのコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法Pには、要素対照表要素名詞記録排除工程1Aが設置されることができ、
要素対照表要素名詞記録排除工程1Aが、コンピュータによって、中国語文字の特許請求の範囲の文字コード(C-text)を自動的に読み取り、要素名詞対照表(EN-List)における要素対照表要素名詞文字コード(List-EN)に基いて、前記中国語文字の特許請求の範囲の文字コード(C-text)から、前記要素対照表要素名詞文字コード(List-EN)を排除するように記録し、前記中国語文字の特許請求の範囲の文字コード(C-text)における前記要素対照表要素名詞文字コード(List-EN)が排除された連続文字コードを要素対照表要素名詞排除連続文字コード(D-EN)とする。
獲得する要素対照表要素名詞排除連続文字コード(D-EN)が基本排除文字記録排除工程1に伝送し、基本排除文字記録排除工程1によって上述と同様な操作を行い、前記要素対照表要素名詞排除連続文字コード(D-EN)から、前記基本排除文字コードBを排除するように記録し、前記要素対照表要素名詞排除連続文字コード(D-EN)における前記基本排除文字コードBが排除された連続文字コードを基本排除文字連続文字コードB-textとする。
【0049】
更に、先に、要素対照表要素名詞文字コード(List-EN)を獲得した後、次の削除可能文字記録排除工程2(首部文字記録排除工程21と首部文字記録排除工程22を有する)で要素対照表要素名詞文字コード(List-EN)に関する規則運算を制定することで、全体の運算速度及び正確性を向上できる。
即ち、削除可能文字記録排除工程2が要素対照表要素名詞文字コードを削除可能文字コードSDに取り込み、基本排除文字連続文字コードB-textから削除可能文字コードSDを削除可能文字として排除するように記録し、且つ/或は、削除可能文字コードSDの相隣文字コードや相隣連続文字コードを削除可能文字として排除するように記録することで、基本排除文字連続文字コードB-textで削除可能文字が排除された連続文字コードを削除可能文字削除連続文字とする。
【0050】
具体的に、削除可能文字記録排除工程2の首部文字記録排除工程21が、複数の前記基本排除文字連続文字コードB-textを自動的に読取り、要素対照表要素名詞文字コード(List-EN)を削除可能識別文字コード(IW)に取り込み、第1の実施例の判断以外、更に、要素対照表要素名詞文字コード(List-EN)に基いて:各前記基本排除文字連続文字コードB-textの起始文字コードの相隣前文字コードや相隣前連続文字コードに要素対照表要素名詞文字コード(List-EN)が含まれるかどうかを判断し対応削除可能識別文字コード(Found-IW)にして前記起始文字コード後の指定文字数の文字コードを首部削除文字として排除するように記録する(即ち、要素対照表要素名詞文字コード(List-EN)を削除可能識別文字コード(IW)に取り込む際に、図2(c)と図3(c)に示す例のように、削除可能識別文字コード(IW)が基本排除文字連続文字コードB-textの起始文字コード以外の相隣前文字コードや相隣前連続文字コードである)。
このとき、首部文字記録排除工程21が第1実施例と同様に、他の要素対照表要素名詞文字コード(List-EN)ではない削除可能識別文字コード(IW)に対して:各前記基本排除文字連続文字コードB-Textの起始文字コードや起始連続文字コードに前記削除可能識別文字コード(IW)が含まれるかどうかを判断し対応削除可能識別文字コード(Found-IW)にして前記対応削除可能識別文字コード(Found-IW)且つ/或は前記対応削除可能識別文字コード(Found-IW)後の指定文字数の文字コードを首部削除文字コードとして排除するように記録し、或は、各前記基本排除文字連続文字コードB-Textの起始文字コードの相隣前文字コードや相隣前連続文字コードに前記削除可能識別文字コードが含まれるかどうかを判断し対応削除可能識別文字コードにして前記起始文字コード後の指定文字数の文字コードを首部削除文字コードとして排除するように記録することで、前記基本排除文字排除連続文字コードB-Textにおける前記首部削除文字コードが排除された連続文字コードを前記削除可能文字削除連続文字コード(D-Text)とする。
【0051】
詳細には、首部文字記録排除工程21が、第1実施例と同様に削除可能識別文字コード(IW)に対する判断を執行すること以外、知られた要素対照表要素名詞文字コード(List-EN)に基いて、基本排除文字排除連続文字コードB-Textに対して以下の文字コードの記録排除を行って、削除可能文字削除連続文字コード(D-Text)を獲得する。
例えば、「將」+「要素対照表要素名詞文字コード(List-EN)」+「……至」(即ち、「將」と「要素対照表要素名詞文字コード(List-EN)」が基本排除文字排除連続文字コードB-Textである「……至」の外に前に相隣し、且つ、「至」が基本排除文字排除連続文字コードB-Textの尾部にいる)である場合、「至」と「至」の前2字を排除するように記録する。
また、例えば、「把」+「要素対照表要素名詞文字コード(List-EN)」+「……至」(即ち、「把」と「要素対照表要素名詞文字コード(List-EN)」が基本排除文字排除連続文字コードB-Textである「……至」の外に前に相隣し、且つ、「至」が基本排除文字排除連続文字コードB-Textの尾部にいる)である場合、「至」と「至」の前2字を排除するように記録する。
また、例えば、「把」+「要素対照表要素名詞文字コード(List-EN)」+「……以」(即ち、「把」と「要素対照表要素名詞文字コード(List-EN)」が基本排除文字排除連続文字コードB-Textである「……以」の外に前に相隣し、且つ、「以」が基本排除文字排除連続文字コードB-Textの尾部にいる)である場合、「以」と「以」の前2字を排除するように記録する。
【0052】
要素対照表要素名詞文字コード(List-EN)を先に獲得する要素対照表要素名詞記録排除工程1Aを有する文字間スペースなし言語特許書類文字コードのコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法Pにおいて、削除可能文字記録排除工程2の尾部文字記録排除工程22が、複数の前記基本排除文字連続文字コードB-textを自動的に読取り、要素対照表要素名詞文字コード(List-EN)を削除可能識別文字コード(IW)に取り込み、第1の実施例の判断以外、更に、要素対照表要素名詞文字コード(List-EN)に基いて:各前記基本排除文字連続文字コードB-textの起始文字コードの相隣後文字コードや相隣後連続文字コードに要素対照表要素名詞文字コード(List-EN)が含まれるかどうかを判断し対応削除可能識別文字コード(Found-IW)にして前記最終文字コード後の指定文字数の文字コードを尾部削除文字として排除するように記録する(即ち、要素対照表要素名詞文字コード(List-EN)を削除可能識別文字コード(IW)に取り込む際に、図2(c)と図3(c)に示す例のように、削除可能識別文字コード(IW)が基本排除文字連続文字コードB-textの最終文字コード以外の相隣後文字コードや相隣後連続文字コードである)。
このとき、尾部文字記録排除工程22が第1実施例と同様に、他の要素対照表要素名詞文字コード(List-EN)ではない削除可能識別文字コード(IW)に対して:各前記基本排除文字連続文字コードB-Textの最終文字コードや最終連続文字コードに前記削除可能識別文字コード(IW)が含まれるかどうかを判断し対応削除可能識別文字コード(Found-IW)にして前記対応削除可能識別文字コード(Found-IW)且つ/或は前記対応削除可能識別文字コード(Found-IW)前の指定文字数の文字コードを尾部削除文字コード(TD)として排除するように記録し、或は、各前記基本排除文字連続文字コードB-Textの最終文字コードの相隣後文字コードや相隣後連続文字コードに前記削除可能識別文字コード(IW)が含まれるかどうかを判断し対応削除可能識別文字コード(Found-IW)にして前記最終文字コード前の指定文字数の文字コードを尾部削除文字コード(TD)として排除するように記録することで、前記基本排除文字排除連続文字コードB-Textにおける前記尾部削除文字コード(TD)が排除された連続文字コードを前記削除可能文字削除連続文字コードとする。
【0053】
例えば、尾部文字記録排除工程22が、第1実施例と同様に削除可能識別文字コード(IW)に対する判断を執行すること以外、知られた要素対照表要素名詞文字コード(List-EN)に基いて、基本排除文字排除連続文字コードB-Textに対して以下の文字コードの記録排除を行って、削除可能文字削除連続文字コードを獲得する。
例えば、「至」+「要素対照表要素名詞文字コード(List-EN)」(即ち、「要素対照表要素名詞文字コード(List-EN)」が基本排除文字排除連続文字コードB-Textである「……至」の外に後に相隣し、且つ、「至」が基本排除文字排除連続文字コードB-Textの尾部にいる)である場合、「至」と「至」の前2字を排除するように記録する(「;」、「,」などの句読点まで)。
また、例えば、「給」+「要素対照表要素名詞文字コード(List-EN)」(即ち、「要素対照表要素名詞文字コード(List-EN)」が基本排除文字排除連続文字コードB-Textである「……給」の外に後に相隣し、且つ、「給」が基本排除文字排除連続文字コードB-Textの尾部にいる)である場合、「給」と「給」の前2字を排除するように記録する(「;」、「,」などの句読点まで)。
また、例えば、「到」+「要素対照表要素名詞文字コード(List-EN)」(即ち、「要素対照表要素名詞文字コード(List-EN)」が基本排除文字排除連続文字コードB-Textである「……到」の外に後に相隣し、且つ、「到」が基本排除文字排除連続文字コードB-Textの尾部にいる)である場合、「到」と「到」の前2字を排除するように記録する(「;」、「,」などの句読点まで)。
また、例えば、「至」+「要素対照表要素名詞文字コード(List-EN)」(即ち、「要素対照表要素名詞文字コード(List-EN)」が基本排除文字排除連続文字コードB-Textである「……至」の外に後に相隣し、且つ、「至」が基本排除文字排除連続文字コードB-Textの尾部にいる)である場合、「至」と「至」の前2字を排除するように記録する(「;」、「,」などの句読点まで)。
【0054】
本発明の実施形態によると、本発明は、特許書類の要素名詞及び要素名詞所属位置の自動獲得に対して、要素名詞データベースの立ち上げ、且つ、品詞での要素名詞の判断の代わりに、特許請求項の書き方と特性に基いて要素名詞の存在不可能の文字位置で順位に排除することで要素名詞を獲得することで、膨大なシステム計算およびストレージをかからずに、効率な最高獲得数、最高正確度、最速獲得速度で、特許書類のコンピュータによって実行される中国語特許書類の要素名詞自動獲得方法を提供する。
【0055】
なお、本発明は、上記実施形態に限定されるものではない。上記実施形態は、例示であり、本発明の特許請求の範囲に記載された技術的思想と実質的に同一な構成を有し、同様な作用効果を奏するものは、いかなるものであっても本発明の技術的範囲に包含される。
【符号の説明】
【0056】
コンピュータによって実行される中国語特許書類の要素名詞自動獲得方法
1A 要素対照表要素名詞記録排除工程
1 基本排除文字記録排除工程
11 基本排除文字データベース
2 削除可能文字記録排除工程
21 首部文字記録排除工程
22 尾部文字記録排除工程
3 単一文字記録排除工程
4 高度排除文字記録排除工程
42 第二細部要素名詞獲得工程
B 基本排除文字コード
B-Text 基本排除文字連続文字コード
SD 削除可能文字コード
図1
図2(a)】
図2(b)】
図2(c)】
図3(a)】
図3(b)】
図3(c)】
図4