IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 石川サポート・アンド・サービス株式会社の特許一覧

<>
  • 特許-機械翻訳システムおよび機械翻訳方法 図1
  • 特許-機械翻訳システムおよび機械翻訳方法 図2
  • 特許-機械翻訳システムおよび機械翻訳方法 図3
  • 特許-機械翻訳システムおよび機械翻訳方法 図4
  • 特許-機械翻訳システムおよび機械翻訳方法 図5
  • 特許-機械翻訳システムおよび機械翻訳方法 図6
  • 特許-機械翻訳システムおよび機械翻訳方法 図7
  • 特許-機械翻訳システムおよび機械翻訳方法 図8
  • 特許-機械翻訳システムおよび機械翻訳方法 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-01-18
(45)【発行日】2022-01-26
(54)【発明の名称】機械翻訳システムおよび機械翻訳方法
(51)【国際特許分類】
   G06F 40/45 20200101AFI20220119BHJP
【FI】
G06F40/45
【請求項の数】 7
(21)【出願番号】P 2017218042
(22)【出願日】2017-11-13
(65)【公開番号】P2018085109
(43)【公開日】2018-05-31
【審査請求日】2020-11-06
(31)【優先権主張番号】P 2016221078
(32)【優先日】2016-11-13
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】516341693
【氏名又は名称】石川サポート・アンド・サービス株式会社
(74)【代理人】
【識別番号】100196003
【弁理士】
【氏名又は名称】石川 太郎
(72)【発明者】
【氏名】石川 太郎
【審査官】長 由紀子
(56)【参考文献】
【文献】特開2003-006190(JP,A)
【文献】特開2004-348514(JP,A)
【文献】特開2009-128929(JP,A)
【文献】特開2005-165612(JP,A)
【文献】福井 雅敏 外3名,日米対応特許コーパスを用いた対訳抽出手法,情報処理学会研究報告,日本,社団法人情報処理学会,2001年09月11日,第2001巻第86号,pp.23-28
【文献】須藤 克仁 外4名,英中韓から日本語への特許文向け統計翻訳システム,言語処理学会第20回年次大会 発表論文集 [online],日本,言語処理学会,2014年03月10日,pp.606-609
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/00-58
G06Q 50/18
(57)【特許請求の範囲】
【請求項1】
第1言語によって記述された第1文章要素を、第2言語によって記述された第2文章要素に翻訳する機械翻訳システムであって、
前記第1文章要素をコンピュータに入力する入力装置と、
前記入力装置から前記第1文章要素を受け取る前記コンピュータと、
記憶装置と
を具備し、
前記記憶装置は、
前記第2言語によって記述された国際公開公報のテキストデータと、
前記国際公開公報に対応し、かつ、前記第1言語によって記述された対応公開公報のテキストデータと
を記憶しており、
前記コンピュータは、前記入力装置から前記第1文章要素を受け取ると、複数の前記対応公開公報の中から、前記第1文章要素を含む特定公開公報を決定し、
前記コンピュータは、複数の前記国際公開公報の中から、前記特定公開公報に対応する特定国際公開公報を決定し、
前記コンピュータは、前記特定国際公開公報の中から、前記第1文章要素に対応する前記第2文章要素を抽出し、
前記コンピュータは、抽出された前記第2文章要素を、前記第1文章要素の翻訳として出力する
機械翻訳システム。
【請求項2】
前記記憶装置は、前記国際公開公報と、前記国際公開公報の国籍データとを関連付けて記憶しており、
前記コンピュータは、前記国際公開公報の国籍データに基づいて、前記特定国際公開公報を決定する
請求項1に記載の機械翻訳システム。
【請求項3】
前記コンピュータは、前記第2文章要素を、前記特定国際公開公報の国籍データとともに出力する
請求項1または2に記載の機械翻訳システム。
【請求項4】
前記コンピュータは、複数の前記特定国際公開公報の中から複数の前記第2文章要素の抽出が行われた場合には、複数の前記第2文章要素のうち、請求の範囲の記載欄から抽出された文章要素を優先的に出力する
請求項1乃至3のいずれか一項に記載の機械翻訳システム。
【請求項5】
第1言語によって記述された第1文章要素を、第2言語によって記述された第2文章要素に翻訳する機械翻訳方法であって、
(A)コンピュータが、入力装置から前記第1文章要素を受け取る受取工程と、
(B)前記コンピュータが、前記第1言語で記述された複数の公開公報の中から、前記第1文章要素を含む特定公開公報を決定する第1決定工程と、
(C)前記コンピュータが、前記第2言語で記述された複数の国際公開公報の中から、前記特定公開公報に対応する特定国際公開公報を決定する第2決定工程と、
(D)前記コンピュータが、前記特定国際公開公報の中から、前記第1文章要素に対応する前記第2文章要素を抽出する抽出工程と、
(E)前記コンピュータが、抽出された前記第2文章要素を、前記第1文章要素の翻訳として出力する出力工程と
を具備する
機械翻訳方法。
【請求項6】
前記受取工程において、前記コンピュータは、複数の前記第1文章要素を含む文章データを受け取り、
前記コンピュータは、複数の前記第1文章要素を、専門用語を含む文章要素と、前記専門用語を含まない文章要素とに分け、
前記コンピュータは、前記専門用語を含む文章要素に対してのみ、前記工程(B)、前記工程(C)、および、前記工程(D)を実行する
請求項5に記載の機械翻訳方法。
【請求項7】
(F)前記コンピュータが、前記第1言語で記述された複数の前記公開公報の中から、前記第1文章要素を含む前記特定公開公報を検索する検索工程と、
(G)前記コンピュータが、前記第1文章要素を第1小要素と第2小要素とを含む複数の小要素に分割する分割工程と、
(H)前記コンピュータが、前記第1言語で記述された複数の前記公開公報の中から、前記第1小要素を含む第1特定公開公報を決定する工程と、
(I)前記コンピュータが、前記第1言語で記述された複数の前記公開公報の中から、前記第2小要素を含む第2特定公開公報を決定する工程と、
(J)前記コンピュータが、前記第2言語で記述された複数の前記国際公開公報の中から、前記第1特定公開公報に対応する第1特定国際公開公報を決定する工程と、
(K)前記コンピュータが、前記第2言語で記述された複数の前記国際公開公報の中から、前記第2特定公開公報に対応する第2特定国際公開公報を決定する工程と、
(L)前記コンピュータが、前記第1特定国際公開公報の中から、前記第1小要素に対応し、前記第2言語で記述された第3小要素を抽出する工程と、
(M)前記コンピュータが、前記第2特定国際公開公報の中から、前記第2小要素に対応し、前記第2言語で記述された第4小要素を抽出する工程と、
(N)前記コンピュータが、前記第3小要素および前記第4小要素を含む前記第2文章要素を、前記第1文章要素の翻訳として出力する工程と
を更に具備し、
前記検索工程において、前記特定公開公報が発見されると、前記コンピュータは、前記工程(B)、前記工程(C)、前記工程(D)を実行し、
前記検索工程において、前記特定公開公報が発見されないと、前記コンピュータ(20)は、前記工程(G)、前記工程(H)、前記工程(I)、前記工程(J)、前記工程(K)、前記工程(L)、前記工程(M)、前記工程(N)を実行する
請求項5または6に記載の機械翻訳方法。


【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械翻訳システムおよび機械翻訳方法、特に、国際公開公報データを用いた機械翻訳システムおよび機械翻訳方法に関するものである。なお、本明細書において、国際公開公報とは、世界知的所有権機関(WIPO)によって公開された公開特許文献(WO XXXX/YYYYYY A1またはA2)を意味する。
【背景技術】
【0002】
現在、様々な企業が機械翻訳システムを提供している。しかし、機械翻訳の精度は、依然として低い。そこで、AI(Artificial Intelligence)を用いて機械翻訳の精度を向上させることが考えられる。しかし、良質なデータと良質でないデータとが混在している中では、AIといえども、機械翻訳の精度を向上させることは容易ではない。
【発明の概要】
【発明が解決しようとする課題】
【0003】
そこで、本発明は、機械翻訳の精度を向上させることが可能な機械翻訳システムおよび機械翻訳方法を提供することにある。
【課題を解決するための手段】
【0004】
以下に、発明を実施するための形態で使用される番号・符号を用いて、課題を解決するための手段を説明する。これらの番号・符号は、特許請求の範囲の記載と発明を実施するための形態との対応関係の一例を示すために、参考として、括弧付きで付加されたものである。よって、括弧付きの記載により、特許請求の範囲は、限定的に解釈されるべきではない。
【0005】
いくつかの実施形態における機械翻訳システムは、第1言語によって記述された第1文章要素を、第2言語によって記述された第2文章要素に翻訳する機械翻訳システムである。機械翻訳システム(1)は、前記第1文章要素をコンピュータ(20)に入力する入力装置(10)と、前記入力装置(10)から前記第1文章要素を受け取る前記コンピュータ(20)と、記憶装置(40)とを具備する。前記記憶装置(40)は、前記第2言語によって記述された国際公開公報のテキストデータと、前記国際公開公報に対応し、かつ、前記第1言語によって記述された対応公開公報のテキストデータとを記憶している。 前記コンピュータ(20)は、前記入力装置から前記第1文章要素を受け取ると、複数の前記対応公開公報の中から、前記第1文章要素を含む特定公開公報を決定する。前記コンピュータ(20)は、複数の前記国際公開公報の中から、前記特定公開公報に対応する特定国際公開公報を決定する。前記コンピュータ(20)は、前記特定国際公開公報の中から、前記第1文章要素に対応する前記第2文章要素を抽出する。前記コンピュータ(20)は、抽出された前記第2文章要素を、前記第1文章要素の翻訳として出力する。
【0006】
上記翻訳システムにおいて、前記記憶装置(40)は、前記国際公開公報と、前記国際公開公報の国籍データとを関連付けて記憶していてもよい。また、前記コンピュータ(20)は、前記国際公開公報の国籍データに基づいて、前記特定国際公開公報を決定してもよい。
【0007】
上記翻訳システムにおいて、前記コンピュータ(20)は、前記第2文章要素を、前記特定国際公開公報の国籍データとともに出力してもよい。
【0008】
上記翻訳システムにおいて、前記コンピュータ(20)は、複数の前記特定国際公開公報の中から複数の前記第2文章要素の抽出が行われた場合には、複数の前記第2文章要素のうち、請求の範囲の記載欄から抽出された文章要素を優先的に出力してもよい。
【0009】
いくつかの実施形態における機械翻訳方法は、第1言語によって記述された第1文章要素を、第2言語によって記述された第2文章要素に翻訳する機械翻訳方法である。機械翻訳方法は、(A)コンピュータ(20)が、入力装置(10)から前記第1文章要素を受け取る受取工程と、(B)前記コンピュータ(20)が、前記第1言語で記述された複数の公開公報の中から、前記第1文章要素を含む特定公開公報を決定する第1決定工程と、(C)前記コンピュータ(20)が、第2言語で記述された複数の国際公開公報の中から、前記特定公開公報に対応する特定国際公開公報を決定する第2決定工程と、(D)前記コンピュータ(20)が、前記特定国際公開公報の中から、前記第1文章要素に対応する前記第2文章要素を抽出する抽出工程と、(E)前記コンピュータ(20)が、抽出された前記第2文章要素を、前記第1文章要素の翻訳として出力する出力工程とを具備する。
【0010】
上記機械翻訳方法では、前記受取工程において、前記コンピュータ(20)は、複数の前記第1文章要素を含む文章データを受け取ってもよい。前記コンピュータは、複数の前記第1文章要素を、専門用語を含む文章要素と、前記専門用語を含まない文章要素とに分けてもよい。また、前記コンピュータは、前記専門用語を含む文章要素に対してのみ、前記第1決定工程、前記第2決定工程、および、前記抽出工程を実行してもよい。
【0011】
上記機械翻訳方法において、(F)前記コンピュータ(20)が、前記第1言語で記述された複数の前記公開公報の中から、前記第1文章要素を含む前記特定公開公報を検索する検索工程と、(G)前記コンピュータ(20)が、前記第1文章要素を第1小要素と第2小要素とを含む複数の小要素に分割する分割工程と、(H)前記コンピュータ(20)が、前記第1言語で記述された複数の前記公開公報の中から、前記第1小要素を含む第1特定公開公報を決定する工程と、(I)前記コンピュータ(20)が、前記第1言語で記述された複数の前記公開公報の中から、前記第2小要素を含む第2特定公開公報を決定する工程と、(J)前記コンピュータ(20)が、前記第2言語で記述された複数の前記国際公開公報の中から、前記第1特定公開公報に対応する第1特定国際公開公報を決定する工程と、(K)前記コンピュータ(20)が、前記第2言語で記述された複数の前記国際公開公報の中から、前記第2特定公開公報に対応する第2特定国際公開公報を決定する工程と、(L)前記コンピュータ(20)が、前記第1特定国際公開公報の中から、前記第1小要素に対応し、前記第2言語で記述された第3小要素を抽出する工程と、(M)前記コンピュータ(20)が、前記第2特定国際公開公報の中から、前記第2小要素に対応し、前記第2言語で記述された第4小要素を抽出する工程と、(N)前記コンピュータ(20)が、前記第3小要素および前記第4小要素を含む前記第2文章要素を、前記第1文章要素の翻訳として出力する工程とを更に具備していてもよい。また、前記検索工程において、前記特定公開公報が発見されると、前記コンピュータ(20)は、前記工程(B)、前記工程(C)、前記工程(D)を実行してもよい。また、前記検索工程において、前記特定公開公報が発見されないと、前記コンピュータ(20)は、前記工程(G)、前記工程(H)、前記工程(I)、前記工程(J)、前記工程(K)、前記工程(L)、前記工程(M)、前記工程(N)を実行してもよい。
【発明の効果】
【0012】
本発明により、機械翻訳の精度を向上させることが可能な機械翻訳システムおよび機械翻訳方法を提供することができる。
【図面の簡単な説明】
【0013】
図1図1は、実施形態または各変形例における機械翻訳システムの機能ブロック図である。
図2図2は、実施形態または第6変形例をの除く各変形例における機械翻訳方法の概要を示すフローチャートである。
図3図3は、出力装置が、第2文章要素を出力した様子を示す図である。
図4図4は、出力装置が、第2文章要素を出力した様子を示す図である。
図5図5は、出力装置が、第2文章要素を出力した様子を示す図である。
図6図6は、出力装置が、第2文章要素を出力した様子を示す図である。
図7図7は、第6変形例における機械翻訳方法の概要を示すフローチャートである。
図8図8は、第6変形例における機械翻訳方法の概要を示すフローチャートである。
図9図9は、第6変形例における機械翻訳方法の概要を示すフローチャートである。
【発明を実施するための形態】
【0014】
以下、機械翻訳システムおよび機械翻訳方法に関して、添付図面を参照して説明する。なお、以下の説明において、同じ機能を有する部材については、同一の図番が付され、同一の図番が付されている部材について、繰り返しの説明は省略される。なお、以下の実施形態では、第1言語が日本語であり、第2言語が英語である場合について説明される。しかし、第1言語は日本語に限定されない。第1言語は、例えば、中国語、フランス語、ドイツ語、または、英語であってもよい。また、第2言語は英語に限定されない。第2言語は、ドイツ語、フランス語、中国語、または、日本語であってもよい。なお、第2言語は、第1言語とは異なる言語である。
【0015】
図1を参照して、実施形態における機械翻訳システムの概要について説明する。図1は、実施形態における機械翻訳システム1の機能ブロック図である。
【0016】
実施形態における機械翻訳システム1は、日本語(第1言語)によって記述された第1文章要素を、英語(第2言語)によって記述された第2文章要素に翻訳する翻訳システムである。例えば、いくつかの実施形態では、機械翻訳システムは、「から内径方向に延在」という第1文章要素を、「extends radially inwardly from」という第2文章要素に翻訳する。これに対し、公知の機械翻訳システムのうちの1つは、「から内径方向に延在」という第1文章要素を、「extends radially」という第2文章要素に翻訳する。すなわち、公知の機械翻訳システムの翻訳精度は高くない。
【0017】
機械翻訳システム1は、入力装置10と、コンピュータ20と、記憶装置40とを具備する。機械翻訳システム1は、出力装置50を備えていてもよい。
【0018】
入力装置10は、日本語(第1言語)によって記述された第1文章要素をコンピュータ20に入力する。入力装置10は、コンピュータ20と情報伝達可能に接続されたキーボードであってもよいし、USBメモリ等の記憶媒体であってもよいし、他のコンピュータであってもよいし、データをコンピュータ20に伝送するインターネット回線であってもよい。第1文章要素は、単語であってもよいし、単語に助詞または助動詞が付加された語句であってもよいし、句であってもよい。
【0019】
コンピュータ20は、入力装置10から第1文章要素を受け取る。コンピュータは、CPU(Central Processing Unit)と内部メモリ(記憶装置)とを備える。コンピュータは、内部メモリに記憶されたプログラムを実行することにより、後述の特定公開公報を決定する第1決定手段24、後述の特定国際公開公報を決定する第2決定手段26、あるいは、第2文章要素を抽出する抽出手段28として機能する。
【0020】
記憶装置40は、コンピュータ20と情報伝達可能に接続された記憶装置である。記憶装置40は、例えば、ハードディスク、サーバー等である。記憶装置40は、第2言語によって記述された国際公開公報のテキストデータと、国際公開公報に対応し、かつ、第1言語によって記述された対応公開公報のテキストデータとを記憶している。国際公開公報のテキストデータには、例えば、国際公開第2007/033072号の英語テキストデータ等が含まれ、対応公開公報データには、例えば、特表2009-508065号公報の日本語テキストデータ等が含まれる。なお、特表2009-508065号公報は、国際公開第2007/033072号のパテントファミリー文献である。すなわち、本明細書において、「国際公開公報に対応する対応公開公報」とは、国際公開公報のパテントファミリー文献を意味する。あるいは、「国際公開公報に対応する対応公開公報」とは、国際公開公報に対応する国際出願の明細書、請求の範囲などが、国内移行時に翻訳されることによって作成された翻訳文献を意味する。なお、対応公開公報は、例えば、第1言語を公用語とする国によって発行される公報(文献)である。
【0021】
記憶装置40は、多数、例えば、10万件以上の国際公開公報のテキストデータを含んでいてもよく、また、10万件以上の対応公開公報のテキストデータを含んでいてもよい。
【0022】
出力装置50は、例えば、ディスプレイ等の表示装置、音声出力装置、記憶装置、あるいは、インターネット回線等の回線である。コンピュータ20は、翻訳結果としての第2文章要素を出力装置50に出力する。その結果、出力装置50が、表示装置である場合には、第2文章要素が、表示装置に表示される。代替的に、あるいは、付加的に、出力装置50が、音声出力装置である場合には、第2文章要素が発音される。代替的に、あるいは、付加的に、出力装置50が、記憶装置である場合には、第2文章要素を含むファイルが、記憶装置に記憶される。代替的に、あるいは、付加的に、出力装置50が、回線である場合には、第2文章要素を含むデータが、回線を介して、他の装置に伝送される。
【0023】
なお、機械翻訳システム1が、どのようにして機械翻訳を行うかについては、以下の機械翻訳方法についての記述の中で説明される。
【0024】
実施形態における機械翻訳方法について説明する。図2は、実施形態における機械翻訳方法の概要を示すフローチャートである。
【0025】
第1ステップST1において、コンピュータ20は、入力装置10から第1言語によって記述された第1文章要素を受け取る。ここでは、第1言語が、日本語であり、第1文章要素が、「から内径方向に延在」という語句である場合を想定する。第1文章要素のコンピュータ20への入力は、オペレーターがキーボードを介して入力することにより実行されてもよい。代替的に、第1文章要素のコンピュータ20への入力は、第1文章要素を含むファイルを、外部装置がコンピュータ20に送信することにより実行されてもよい。
【0026】
第2ステップST2において、コンピュータ20は、複数の対応公開公報の中から、第1ステップST1において受け取った第1文章要素を含む特定公開公報を決定する。当該決定は、例えば、テキスト検索を用いて実行される。例えば、第1文章要素が、「から内径方向に延在」である場合には、コンピュータ20は、記憶装置40に記憶された複数の対応公開公報に対してテキスト検索を実行し、その結果、「から内径方向に延在」との語句を含む公開公報を特定公開公報として決定する。例えば、コンピュータ20は、特表2009-508065号公報を特定公開公報として決定する。なぜなら、特表2009-508065号公報は、その請求の範囲の欄に、「から内径方向に延在」との語句を含むからである。
【0027】
なお、第1言語が日本語である場合には、上述の「複数の対応公開公報」は、「複数の公表特許公報」に相当する。
【0028】
上述の第2ステップST2は、コンピュータ20が、第1決定手段24として機能することにより実行される。換言すれば、コンピュータ20は、内部メモリに記憶されたプログラムを実行することにより、複数の対応公開公報の中から、第1文章要素を含む特定公開公報を決定する第1決定手段24として機能する。
【0029】
第3ステップST3において、コンピュータ20は、複数の国際公開公報の中から、特定公開公報に対応する特定国際公開公報を決定する。例えば、特定公開公報が特表2009-508065号公報である場合には、コンピュータ20は、特定公開公報である特表2009-508065号公報に対応する国際公開公報、すなわち、国際公開第2007/033072号を、特定国際公開公報として決定する。
【0030】
なお、コンピュータ20が、特定公開公報に基づいて、特定国際公開公報を決定するため、記憶装置40は、各対応公開公報と、1つの国際公開公報とを関連づけて記憶していてもよい。複数の対応公開公報と、複数の国際公開公報とを関連付ける第1関連付けデータが記憶装置40に記憶されている場合を想定する。この場合、コンピュータ20は、第2ステップST2において決定された特定公開公報と、第1関連付けデータとに基づいて、特定公開公報に対応する特定国際公開公報を決定することができる。代替的に、各対応公開公報と、1つの国際公開公報とは、必ずしも対応付けられていなくてもよい。この場合、コンピュータ20は、第2ステップST2において決定された特定公開公報を第2言語に大雑把に機械翻訳したものと、記憶装置40に記憶された複数の国際公開公報との間で、文献一致度解析(マッチング解析)をする。そして、コンピュータ20は、一致度が最も高い文献を、特定国際公開公報として決定する。
【0031】
上述の第3ステップST3は、コンピュータ20が、第2決定手段26として機能することにより実行される。換言すれば、コンピュータ20は、内部メモリに記憶されたプログラムを実行することにより、複数の国際公開公報の中から、特定公開公報に対応する特定国際公開公報を決定する第2決定手段26として機能する。
【0032】
第4ステップST4において、コンピュータ20は、特定国際公開公報の中から、第1文章要素に対応する第2文章要素を抽出する。例えば、特定国際公開公報が国際公開第2007/033072号であり、第1文章要素が「から内径方向に延在」との語句である場合、コンピュータ20は、第2文章要素として、「extends radially inwardly from」との語句を抽出する。
【0033】
なお、コンピュータ20が、特定国際公開公報の中から、第1文章要素に対応する第2文章要素を抽出するために、コンピュータ20は、公知の手法を利用することができる。例えば、コンピュータ20は、第1文章要素を含む特定公開公報のテキストデータを、公知の機械翻訳手段(公知の機械翻訳手段は、翻訳の精度が高くなくてもよい。)を用いて、第2言語のテキストデータに変換する。変換後のテキストデータを、ここでは、変換済テキストデータと呼ぶ。コンピュータ20は、第2言語に変換された第1文章要素を含む変換済テキストデータと、特定国際公開公報のテキストデータとのマッチングを行うことにより、第2言語に変換された第1文章要素が、特定国際公開公報のテキストデータにおけるどの文章要素に対応するかを決定する。そして、コンピュータ20は、決定された文章要素を、第2文章要素として抽出する。
【0034】
代替的に、コンピュータ20が、特定国際公開公報の中から、第1文章要素に対応する第2文章要素を抽出するために、コンピュータ20は、次の手法を利用してもよい。すなわち、コンピュータ20は、第1文章要素が、特定公開公報の中で、前から何番目の文章中に存在するのかを判断する。ここでは、前から100番目の文章が、第1文章要素を含んでいたとする。また、コンピュータ20は、第1文章要素の中から、キーとなる単語(例えば、名詞、または、動詞)を抽出する。例えば、第1文章要素が「から内径方向に延在」との語句である場合、「延在」との単語を、キーとなる単語として抽出する。この場合、コンピュータ20は、特定国際公開公報の中から、前から100番目の前後に位置する複数の文章(例えば、前から90番目の文章から前から110番目までの文章)を抽出する。そして、コンピュータ20は、抽出された複数の文章の中から、キーとなる単語(例えば「延在」との単語)に対応する単語(例えば、「extend」、「extends」、「extending」等)を見つけ出す。そして、見つけられた当該単語を含む語句(例えば、「extends radially inwardly from」)を、第2文章要素として抽出する。
【0035】
上述の第4ステップST4は、コンピュータ20が、抽出手段28として機能することにより実行される。換言すれば、コンピュータ20は、内部メモリに記憶されたプログラムを実行することにより、特定国際公開公報の中から、第1文章要素に対応する第2文章要素を抽出する抽出手段28として機能する。
【0036】
第5ステップST5において、コンピュータ20は、抽出された第2文章要素を、第1文章要素の翻訳として出力装置50に出力する。例えば、出力装置50が、表示装置である場合には、第2文章要素が、表示装置に表示される。
【0037】
以上のとおり、実施形態では、国際公開公報のテキストデータを用いて、第1文章要素が第2文章要素に翻訳される。国際出願の各国国内移行に際しては、国際出願の明細書の言語が、各国の公用語に対応するように精度良く翻訳されている。すなわち、国際公開公報のテキストデータと、各国における対応公開公報のテキストデータとは、技術用語、または、技術的文章についての、良質な翻訳データベースとなり得る。実施形態では、コンピュータ20が、当該、良質な翻訳データベースを用いて、第1文章要素を第2文章要素に翻訳する。このため、機械翻訳の精度が向上する。
【0038】
(第1変形例)
第1変形例は、コンピュータ20が、国際公開公報の国籍データに基づいて、特定国際公開公報を決定する点において、上述の実施形態と異なる。その他の点では、第1変形例は、上述の実施形態と同様である。
【0039】
第2言語によって記述された国際公開公報であっても、当該国際公開公報の出願人の所属する国の公用語、あるいは、発明者の所属する国の公用語が第2言語とは異なる場合がある。例えば、日本人が出願人である場合であっても、日本語(第1言語)で国際出願をせず、英語(第2言語)で国際出願をする場合がある。この場合、国際公開公報は、第2言語で記述されているものの、出願人の所属する国の公用語は、第2言語ではない。
【0040】
機械翻訳システムの大きな問題の1つは、第1言語で記述された第1文章要素を第2言語で記述された第2文章要素に翻訳する場合に、第1言語を母国語とする者が作成した翻訳文が利用される点にある。例えば、日本人が作成した英文は、英語を母国語とする者が作成した英文と比較して、英文としての精度が低い。そこで、第1変形例では、第1言語で記述された第1文章要素を第2言語で記述された第2文章要素に翻訳する場合に、第2言語を母国語とする者が作成した文章が利用されるようにする。
【0041】
第1変形例では、記憶装置40は、国際出願の出願人の所属する国、国際出願に係る発明の発明者の所属する国、または、国際出願の受理官庁が所在する国のうちの少なくとも一つを、国際公開公報の国籍データとして記憶している。また、記憶装置40は、国際公開公報と、当該国籍データとを関連付けた第2関連付けデータを記憶している。そして、コンピュータ20は、国際公開公報の国籍データに基づいて、上述の特定国際公開公報を決定する。
【0042】
以下、具体例を挙げて説明する。ここでは、第1文章要素が「互いに対向配置される」である場合を想定する。コンピュータ20は、第2ステップST2を実行することにより、複数の対応公開公報の中から、特表2007-505241号公報を、第1文章要素(「互いに対向配置される」)を含む特定公開公報のうちの1つとして決定する。しかし、特表2007-505241号公報に対応する国際公開公報、すなわち、WO2005/026462A1を参照すると、当該国際公開公報に係る出願人の所属する国は、日本である。また、当該国際公開公報に係る発明者の所属する国は、日本である。また、当該国際公開公報の受理官庁は、日本国特許庁である。よって、当該国際公開公報(WO2005/026462A1)は、第2言語(英語)で記述されているものの、当該国際公開公報の国籍データは日本である。
【0043】
この場合、第2言語(英語)と、国籍データに対応する公用語(日本語)とは、一致しない。コンピュータ20は、第2言語と、国際公開公報の国籍データに対応する公用語とが一致しない場合、当該国際公開公報を、特定国際公開公報の候補から除外する。換言すれば、コンピュータ20は、第2言語と、国際公開公報の国籍データに対応する公用語とが一致しない場合、当該国際公開公報を、特定国際公開公報として決定しない。
【0044】
また、第1文章要素が「互いに対向配置される」である場合、コンピュータ20は、第2ステップST2を実行することにより、複数の対応公開公報の中から、特表2005-501784号公報を、第1文章要素(「互いに対向配置される」)を含む特定公開公報のうちの1つとして決定する。特表2005-501784号公報に対応する国際公開公報、すなわち、WO2003/020594A1を参照すると、当該国際公開公報に係る出願人の所属する国は、米国である。また、当該国際公開公報に係る発明者の所属する国は、米国である。また、当該国際公開公報の受理官庁は、米国特許商標庁である。よって、当該国際公開公報(WO2003/020594A1)の国籍データは米国である。
【0045】
この場合、第2言語(英語)と、国籍データに対応する公用語(英語)とは、互いに一致する。コンピュータ20は、第2言語と、国際公開公報の国籍データに対応する公用語とが互いに一致する場合、当該国際公開公報を、特定国際公開公報の候補に含める。換言すれば、コンピュータ20は、第2言語と、国際公開公報の国籍データに対応する公用語とが一致する場合であって、かつ、当該国際公開公報に対応する対応公開公報が第1言語で記述された第1文章要素を含む場合、当該国際公開公報を、特定国際公開公報として決定する。
【0046】
第1変形例では、コンピュータは、国籍データに基づいて、特定国際公開公報を決定する。このため、第2言語を公用語とする者が作成した英文の中から、第2文章要素が抽出される蓋然性が高い。その結果、機械翻訳の精度が向上する。
【0047】
なお、記憶装置40には、国籍データと、公用語との対応関係を示す第3関連付けデータが記憶されていてもよい。第3関連付けデータにおいては、例えば、日本(国籍データ)が、日本語(公用語)に対応付けられており、オーストラリア(国籍データ)が、英語(公用語)に対応付けられている。この場合、コンピュータ20は、第3関連付けデータに基づいて、第2言語と、国際公開公報の国籍データに対応する公用語とが一致するか否かを判定する。
【0048】
なお、上述の第1変形例では、コンピュータ20は、第2言語と、国際公開公報の国籍データに対応する公用語とが一致しない場合、当該国際公開公報を、特定国際公開公報の候補から除外する。代替的に、コンピュータ20は、第2言語と、国際公開公報の国籍データに対応する公用語とが一致する場合、当該国際公開公報を、特定国際公開公報の優先候補として決定し、第2言語と、国際公開公報の国籍データに対応する公用語とが一致しない場合、当該国際公開公報を、特定国際公開公報の非優先候補として決定してもよい。この場合、コンピュータ20は、優先候補がある場合、優先候補の中から、特定国際公開公報を決定し、優先候補がない場合、非優先候補の中から、特定国際公開公報を決定してもよい。
【0049】
(第2変形例)
第2変形例は、コンピュータ20が、第2文章要素を、特定国際公開公報の国籍データとともに出力する点において、上述の実施形態あるいは上述の第1変形例と異なる。その他の点では、第2変形例は、上述の実施形態あるいは上述の第1変形例と同様である。
【0050】
第2変形例では、記憶装置40は、国際出願の出願人の所属する国、国際出願に係る発明の発明者の所属する国、または、国際出願の受理官庁が所在する国のうちの少なくとも一つを、国際公開公報の国籍データとして記憶している。また、記憶装置40は、国際公開公報と、国籍データとを関連付けた第2関連付けデータを記憶している。
【0051】
第2変形例では、コンピュータ20が、第3ステップST3を実行する際に、当該第2関連付けデータに基づいて、コンピュータ20が、特定国際公開公報の国籍データを抽出する。例えば、特定国際公開公報が、上述のWO2003/020594A1である場合、特定国際公開公報の国籍データは、「米国」である。
【0052】
そして、コンピュータ20が、第5ステップST5を実行する際に、コンピュータ20は、抽出された第2文章要素を、特定国際公開公報の国籍データとともに出力する。その結果、例えば、出力装置50が、表示装置である場合には、第2文章要素が、特定国際公開公報の国籍データとともに表示される。
【0053】
図3に、出力装置50が、第2文章要素と、特定国際公開公報の国籍データとを表示した様子が記載されている。図3に記載の例では、出力装置50は表示装置である。表示装置の第2領域54には、第2文章要素(「face each other」)が表示されている。加えて、表示装置(より具体的には、第2領域54)には、国籍データ55(「US(米国)」)が表示されている。当該国籍データは、特定国際公開公報の国籍データを示している。
【0054】
なお、図3に示されるように、表示装置の第1領域52には、第1文章要素(「互いに対向配置される」)が表示されてもよい。
【0055】
付加的に、図3に示されるように、表示装置の第3領域57には、別の第2文章要素(例えば、「arranged being opposed to each other」)が表示されてもよい。なお、表示装置(より具体的には、第3領域57)には、当該別の第2文章要素に対応する特定国際公開公報の国籍データ58(「JP(日本)」が表示されてもよい。
【0056】
第2変形例では、コンピュータは、特定国際公開公報の国籍データを出力する。よって、機械翻訳システムの利用者は、第2文章要素が、信頼性の高い英文データから抽出されたのか否かを把握することができる。
【0057】
(第3変形例)
第3変形例は、上述の第4ステップST4において、複数の第2文章要素の抽出が行われた場合に、コンピュータ20が、複数の前記第2文章要素の中から、請求の範囲の記載欄から抽出された第2文章要素を優先的に出力する点において、上述の実施形態あるいは上述の第1または第2変形例と異なる。その他の点では、第3変形例は、上述の実施形態あるいは上述の第1または第2変形例と同様である。
【0058】
請求の範囲の記載欄に記載された文章については、翻訳者が、特に注意を払って翻訳した可能性が高い。このため、請求の範囲の記載欄から第2文章要素が抽出された場合には、第1文章要素から第2文章要素への翻訳の精度は高いといえる。よって、第3変形例では、請求の範囲の記載欄から抽出された第2文章要素を優先的に出力する。
【0059】
より具体的に説明する。第1文章要素が「互いに対向配置される」であり、第3ステップST3において決定された特定国際公開公報が、上述のWO2003/020594A1、および、上述のWO2005/026462A1を含む場合を想定する。
【0060】
この場合、WO2003/020594A1中の「face each other」が、第2文章要素に該当し、当該第2文章要素は、WO2003/020594A1の請求の範囲の記載欄(より具体的には、請求項8の記載欄)から抽出される。このため、当該第2文章要素は、コンピュータ20によって、優先的に出力される。
【0061】
他方、WO2005/026462A1中の「arranged being opposed to each other」は、別の第2文章要素に該当し、当該別の第2文章要素は、WO2005/026462A1の明細書の記載欄(すなわち、請求の範囲の記載欄以外の部分)から抽出される。このため、当該第2文章要素は、コンピュータ20によって、非優先的に出力される。なお、「非優先的に出力される」とは、出力されないことを意味するか、あるいは、優先的に出力されるものよりも目立たないように出力されることを意味する。
【0062】
図4に、出力装置50が、請求の範囲の記載欄から抽出された第2文章要素を優先的に表示した様子が記載されている。図4に記載の例では、出力装置50は表示装置である。表示装置の第2領域54には、第2文章要素(「face each other」)が表示されている。加えて、表示装置(より具体的には、第2領域54)には、第2文章要素の抽出が請求の範囲の記載欄から行われたものであることを示す出所データ56が表示されている。
【0063】
また、図4には、出力装置50が、明細書の記載欄から抽出された別の第2文章要素を非優先的に表示した様子が記載されている。表示装置の第3領域57には、別の第2文章要素(「arranged being opposed to each other」)が表示されている。加えて、表示装置(より具体的には、第3領域57)には、当該別の第2文章要素の抽出が明細書の記載欄から行われたものであることを示す出所データ59が表示されている。当該別の第2文章要素は、上述の第2文章要素(「face each other」)よりも下方、すなわち、上述の第2文章要素(「face each other」)よりも目立たない位置に表示されている。
【0064】
第3変形例では、コンピュータは、請求の範囲の記載欄から抽出された第2文章要素を優先的に出力する。このため、信頼性の高い英文データから抽出された第2文章要素が、機械翻訳として優先的に使用されることとなる。
【0065】
(第4変形例)
第4変形例は、コンピュータ20が、入力装置10から技術分野を示す指定技術分野データを受け取る点、および、コンピュータ20が、当該技術分野に属する国際公開公報から抽出された第2文章要素を優先的に出力する点において、上述の実施形態あるいは上述の第1乃至第3変形例のうちのいずれかの変形例と異なる。その他の点では、第3変形例は、上述の実施形態あるいは上述の第1乃至第3変形例のうちのいずれかの変形例と同様である。
【0066】
第1の技術分野で使用される用語の第2言語への翻訳と、第2の技術分野で使用される当該用語の第2言語への翻訳とは異なる場合がある。例えば、一般的には「A」と翻訳される用語であっても、特定の技術分野では、「B」と翻訳される場合がある。第4変形例は、このような場合に対応する変形例である。
【0067】
第4変形例において、入力装置10は、コンピュータ20に、技術分野を示す指定技術分野データを入力する。指定技術分野データは、例えば、国際特許分類のサブクラスデータ(例えば、「A01B」等)である。また、記憶装置40は、各国際公開公報と、当該国際公開公報が属する技術分野データとが関連付けられた第4関連付けデータを記憶している。
【0068】
第3ステップST3において、特定国際公開公報を決定する際に、コンピュータ20は、上記の第4関連付けデータに基づいて、当該特定国際公開公報の属する技術分野データを取得する。そして、コンピュータ20は、取得された技術分野データと、入力装置10から受け取った指定技術分野データとが一致するか否かを判定する。一致する場合には、コンピュータ20は、当該特定国際公開公報の中から抽出される第2文章要素を優先的に出力する。他方、一致しない場合には、コンピュータ20は、当該特定国際公開公報の中から抽出される第2文章要素を非優先的に出力する。なお、「非優先的に出力する」とは、出力しないことを意味するか、あるいは、優先的に出力されるものよりも目立たないように出力することを意味する。
【0069】
図5に、出力装置50が、指定された技術分野に属する国際公開公報から抽出された第2文章要素を優先的に表示した様子が記載されている。なお、指定された技術分野とは、コンピュータ20が入力装置10から受け取った指定技術分野データによって示される技術分野である。
【0070】
図5に記載の例では、出力装置50は表示装置である。表示装置の第1領域52には、コンピュータ20が入力装置10から受け取った指定技術分野データ521が表示されている。指定技術分野データは、例えば、B65D等、国際特許分類に関連するデータ(例えば、国際特許分類のサブクラスデータ)である。
【0071】
また、表示装置(より具体的には、第2領域54)には、第2文章要素(「face each other」)の抽出がどの技術分野に属する文献(国際公開公報)から行われたものであることを示す技術分野データ541が表示されている。図5に記載の例では、技術分野データ541と指定技術分野データ521とが互いに一致している。
【0072】
また、図5には、出力装置50が、指定された技術分野に属さない国際公開公報から抽出された第2文章要素を非優先的に表示した様子が記載されている。表示装置の第3領域57には、別の第2文章要素(「arranged being opposed to each other」)が表示されている。加えて、表示装置(より具体的には、第3領域57)には、当該別の第2文章要素の抽出がどの技術分野に属する文献(国際公開公報)から行われたものであることを示す技術分野データ571が表示されている。図5に記載の例では、技術分野データ571と指定技術分野データ521とが互いに異なっている。よって、当該別の第2文章要素は、上述の第2文章要素(「face each other」)よりも下方、すなわち、上述の第2文章要素(「face each other」)よりも目立たない位置に表示されている。
【0073】
第4変形例では、コンピュータは、指定された技術分野に属する国際公開公報から抽出された第2文章要素を優先的に出力する。このため、信頼性の高い英文データから抽出された第2文章要素が、機械翻訳として優先的に使用されることとなる。
【0074】
上述の実施形態あるいは変形例において、コンピュータ20が、入力装置10から文章あるいは段落等を受け取ることも可能である。この場合、コンピュータ20は、当該文章あるいは段落等を、複数の第1文章要素に分解する。この場合、コンピュータ20は、各第1文章要素に対して、上述の第2ステップST2乃至第5ステップST5を実施する。
【0075】
代替的に、コンピュータ20は、分解によって得られる複数の第1文章要素のうち、一部の第1文章要素に対しては、上述の第2ステップST2乃至第4ステップST4を実施し、残りの第1文章要素に対しては、公知の機械翻訳システムを用いた翻訳を行ってもよい。例えば、コンピュータ20が、入力装置10から、「前記磁気シールド部材の両端部に嵌合部が設けられ、前記磁気シールド部材は略I字又はZ字の形状に形成される」という文章を受け取る場合について想定する。この場合、例えば、コンピュータ20は、当該文章を複数の第1文章要素に分解する。例えば、コンピュータ20は、当該文章を、8つの第1文章要素、すなわち、「前記磁気シールド部材の」、「両端部に」、「嵌合部が設けられ」、「前記磁気シールド部材は」、「略I字」、「又は」、「Z字の形状に」、「形成される」に分解してもよい。次に、コンピュータ20は、複数の第1文章要素を、一般用語と専門用語とに分ける。例えば、一般用語は、所定の辞書に掲載されている用語であり、専門用語は、当該所定の辞書に掲載されていない用語であってもよい。ここでは、「嵌合部が設けられ」が専門用語に該当し、他の7つの第1文章要素が、一般用語に該当すると仮定する。この場合、コンピュータ20は、専門用語を含む第1文章要素についてのみ、上述の第2ステップST2乃至第4ステップST4を実施し、残りの第1文章要素に対しては、公知の機械翻訳システムを用いた翻訳を行ってもよい。こうして、コンピュータ20は、各第1文章要素について、第2言語で記述された第2文章要素を取得する。すなわち、コンピュータ20は、複数の第1文章要素を第2言語に翻訳することにより得られる複数の第2文章要素を取得する。そして、コンピュータ20は、得られた複数の第2文章要素を、出力装置50に出力する。
【0076】
上述の例では、専門用語を含まない第1文章要素については、公知の機械翻訳システムを利用して翻訳が行われる。その結果、翻訳時間の短縮が図られる。また、専門用語を含まない第1文章要素については、国際公開公報のテキストデータを用いた翻訳よりも、公知の機械翻訳システムを利用した翻訳の方が、精度が高い場合がある。よって、専門用語を含む第1文章要素の翻訳を行う翻訳システムと、専門用語を含まない第1文章要素の翻訳を行う翻訳システムとを使い分けることにより、更なる翻訳精度の向上が期待できる。
【0077】
(第5変形例)
第5変形例では、第2文章要素を含む節または文章の全体が出力装置50(表示装置)に表示される点において、上述の実施形態あるいは上述の第1変形例乃至第4変形例のいずれかの変形例と異なる。その他の点では、第5変形例は、上述の実施形態あるいは上述の第1変形例乃至第4変形例のいずれかと同様である。
【0078】
図6は、出力装置50である表示装置に、第2文章要素を含む節の全体が表示されている様子を示す図である。ここでは、第1文章要素が「互いに対向配置される」であり、第2文章要素が「face each other」である場合を想定している。表示装置の第2領域54には、第2文章要素を含む節の全体、すなわち、「so that a front surface of said first panel and a front surface of said fourth panel face each other」が表示されている。
【0079】
図6に記載の例では、表示装置に第2文章要素を含む節の全体が表示される。代替的に、表示装置に第2文章要素を含む文章の全体が表示されてもよい。
【0080】
図6に記載の例では、表示装置に第2文章要素を含む節または文章の全体が表示される。このため、オペレーターは、第2文章要素を含む節または文章を見ることにより、第2文章要素の用法を確認することが可能である。
【0081】
(第6変形例)
上述の第2ステップST2において、コンピュータ20が、第1文章要素を含む公開公報を発見できない場合がある。第6変形例は、このような場合に対応するための変形例である。
【0082】
図7乃至図9は、第6変形例における機械翻訳方法の概要を示すフローチャートである。図7における第1ステップST1、第2-3ステップST2-3、第3ステップST3、第4ステップST4、第5ステップST5は、図2における第1ステップST1、第2ステップST2、第3ステップST3、第4ステップST4、第5ステップST5と、それぞれ同一であるため、第1ステップST1、第2-3ステップST2-3、第3ステップST3、第4ステップST4、第5ステップST5についての繰り返しとなる説明は省略する。
【0083】
第2-1ステップST2-1において、コンピュータ20は、第1言語で記述された複数の公開公報の中から、第1文章要素を含む特定公開公報を検索する。第1文章要素を含む特定公開公報が発見された場合(第2-2ステップST2-2:「Yes」)には、第2-3ステップST2-3に進み、第1文章要素を含む特定公開公報が発見されなかった場合には、第6ステップST6に進む。
【0084】
例えば、第1文章要素が「第1面と第2面とは互いに対向配置される」である場合を想定する。この場合、コンピュータ20は、第1文章要素(第1面と第2面とは互いに対向配置される)を含む公開公報を発見することができない(第2-2ステップST2-2:「No」)。よって、図8に記載の第6ステップST6に進む。
【0085】
第6ステップST6において、コンピュータ20は、第1文章要素を、第1小要素と第2小要素とを含む複数の小要素に分割する。第1文章要素が「第1面と第2面とは互いに対向配置される」である場合、第1小要素は、例えば、「第1面と第2面とは」であり、第2小要素は、例えば、「互いに対向配置される」である。
【0086】
第7ステップST7において、コンピュータ20は、第1言語で記述された複数の公開公報の中から、第1小要素を含む第1特定公開公報を検索する。第1小要素を含む第1特定公開公報が発見された場合には、第8ステップST8に進み、第1小要素を含む第1特定公開公報が発見されなかった場合には、第1小要素は、更に小さな複数の小要素に分割される。ここでは、第1小要素を含む第1特定公開公報が発見されたものとする。
【0087】
第8ステップST8において、コンピュータ20は、複数の公開公報(対応公開公報)の中から、第1小要素を含む第1特定公開公報を決定する。ここでは、コンピュータ20は、「第1面と第2面とは」との語句を含む公開公報を第1特定公開公報として決定する。例えば、コンピュータ20は、特表2004-519000号公報を第1特定公開公報として決定する。なぜなら、特表2004-519000号公報は、その請求の範囲の欄に、「第1面と第2面とは」との語句を含むからである。
【0088】
第9ステップST9において、コンピュータ20は、複数の国際公開公報の中から、第1特定公開公報に対応する第1特定国際公開公報を決定する。例えば、第1特定公開公報が特表2004-519000号公報である場合には、コンピュータ20は、第1特定公開公報である特表2004-519000号公報に対応する国際公開公報、すなわち、国際公開第2002/061481号を、第1特定国際公開公報として決定する。当該第9ステップST9は、コンピュータ20が、第2決定手段26として機能することにより実行されてもよい。
【0089】
第10ステップST10において、コンピュータ20は、第1特定国際公開公報の中から、第1小要素に対応し、第2言語で記述された第3文章要素を抽出する。例えば、第1特定国際公開公報が国際公開第2002/061481号であり、第1小要素が「第1面と第2面とは」との語句である場合、コンピュータ20は、第3文章要素として、「the first and second planes」との語句を抽出する。当該第10ステップST10は、コンピュータ20が、抽出手段28として機能することにより実行されてもよい。
【0090】
第11ステップST11において、コンピュータ20は、第1言語で記述された複数の公開公報の中から、第2小要素を含む第2特定公開公報を検索する。第2小要素を含む第2特定公開公報が発見された場合には、第12ステップST12に進み、第2小要素を含む第2特定公開公報が発見されなかった場合には、第2小要素は、更に小さな複数の小要素に分割される。ここでは、第2小要素を含む第2特定公開公報が発見されたものとする。
【0091】
第12ステップST12において、コンピュータ20は、複数の公開公報(対応公開公報)の中から、第2小要素を含む第2特定公開公報を決定する。ここでは、コンピュータ20は、「互いに対向配置される」との語句を含む公開公報を第2特定公開公報として決定する。例えば、コンピュータ20は、特表2005-501784号公報を第2特定公開公報として決定する。なぜなら、特表2005-501784号公報は、その請求の範囲の欄に、「互いに対向配置される」との語句を含むからである。
【0092】
第13ステップST13において、コンピュータ20は、複数の国際公開公報の中から、第2特定公開公報に対応する第2特定国際公開公報を決定する。例えば、第2特定公開公報が特表2005-501784号公報である場合には、コンピュータ20は、第2特定公開公報である特表2005-501784号公報に対応する国際公開公報、すなわち、国際公開第2003/020594号を、第2特定国際公開公報として決定する。当該第13ステップST13は、コンピュータ20が、第2決定手段26として機能することにより実行されてもよい。
【0093】
第14ステップST14において、コンピュータ20は、第2特定国際公開公報の中から、第2小要素に対応し、第2言語で記述された第4文章要素を抽出する。例えば、第2特定国際公開公報が国際公開第2003/020594号であり、第1小要素が「互いに対向配置される」との語句である場合、コンピュータ20は、第4文章要素として、「face each other」との語句を抽出する。
【0094】
第15ステップST15において、コンピュータ20は、第3小要素および第4小要素を含む第2文章要素を、第1文章要素の翻訳として出力する。ここでは、コンピュータ20は、第3小要素(「the first and second planes」)と、第4小要素(「face each other」)とを組み合わせて、第2文章要素(「the first and second planes face each other」)を作成する。そして、コンピュータ20は、第2文章要素を、第1文章要素の翻訳として出力装置50に出力する。例えば、出力装置50が、表示装置である場合には、第2文章要素が、表示装置に表示される。
【0095】
第6変形例における機械翻訳システムおよび機械翻訳方法では、複数の単語を含む第1文章要素が入力された時、まずは、第1文章要素の全体を検索キーとしてテキスト検索が実行される。その結果、第1文章要素の全体を含む特定公開公報が発見された場合には、当該特定公開公報を用いて翻訳が実行される。このため、翻訳の精度が向上する。他方、第1文章要素の全体を含む特定公開公報が発見されない場合には、第1文章要素が複数の小要素に分割される。そして、各小要素を検索キーとしてテキスト検索が実行される。このため、翻訳できない確率が減少する。
【0096】
上述の実施形態または各変形例では、第1文章要素が単語よりも長い文章要素である例について説明された。しかし、実施形態または各変形例は、当該例に限定されない。すなわち、第1文章要素は、単語であってもよい。ただし、第1文章要素が、単語よりも長い句、節、または、文章等であり、当該単語よりも長い句、節、または、文章等を検索キーとしてテキスト検索を実行する方が、翻訳の精度が高くなる。なお、句には、例えば、前置詞句(prepositional phrase)、名詞句(noun phrase)、動詞句(verb phrase)、形容詞句(adjectival phrase)、または、副詞句(adverbial phrase)が含まれる。
【0097】
また、上述の第6変形例では、第1小要素が単語よりも長い文章要素である例について説明された。しかし、第6変形例は、当該例に限定されない。すなわち、第1小要素は、単語であってもよい。同様に、上述の第6変形例では、第2小要素が単語よりも長い文章要素である例について説明された。しかし、第6変形例は、当該例に限定されない。すなわち、第2小要素は、単語であってもよい。
【0098】
本発明は上記各実施形態に限定されず、本発明の技術思想の範囲内において、各実施形態は適宜変形又は変更され得ることは明らかである。また、各実施形態又は変形例で用いられる種々の技術は、技術的矛盾が生じない限り、他の実施形態又は変形例にも適用可能である。
【0099】
例えば、国際公開公報の国籍データは、出願人の所属する国に基づいて決定されてもよいし、発明者の所属する国に基づいて決定されてもよいし、国際出願の受理官庁に基づいて決定されてもよい。代替的に、あるいは、付加的に、国際公開公報の国籍データは、国際公開公報の明細書を分析することにより行われてもよい。例えば、国際公開公報の明細書において、米国ネイティブが多用する表現が使用されていれば、当該国際公開公報の国籍データは、米国であると決定されてもよい。
【符号の説明】
【0100】
1 :機械翻訳システム
10 :入力装置
20 :コンピュータ
24 :第1決定手段
26 :第2決定手段
28 :抽出手段
40 :記憶装置
50 :出力装置
52 :第1領域
54 :第2領域
55 :国籍データ
56 :出所データ
57 :第3領域
58 :国籍データ
59 :出所データ
521 :指定技術分野データ
541 :技術分野データ
571 :技術分野データ

図1
図2
図3
図4
図5
図6
図7
図8
図9