特許7218856 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 有限会社アイ・アール・ディーの特許一覧

特許7218856学習器生成装置、学習器の生産方法、およびプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-01-30

(45)【発行日】2023-02-07

(54)【発明の名称】学習器生成装置、学習器の生産方法、およびプログラム

(51)【国際特許分類】

G06F 16/906 20190101AFI20230131BHJP

G06F 16/35 20190101ALI20230131BHJP

G06N 20/00 20190101ALI20230131BHJP

【ＦＩ】

G06F16/906

G06F16/35

G06N20/00 130

【請求項の数】 4

(21)【出願番号】P 2018207885

(22)【出願日】2018-11-05

(65)【公開番号】P2020077018

(43)【公開日】2020-05-21

【審査請求日】2021-09-21

(73)【特許権者】

【識別番号】502384842

【氏名又は名称】株式会社アイ・アール・ディー

(74)【代理人】

【識別番号】100115749

【弁理士】

【氏名又は名称】谷川英和

(72)【発明者】

【氏名】谷川英和

【審査官】甲斐哲雄

(56)【参考文献】

【文献】特開２０１８－０２６１１９（ＪＰ，Ａ）

【文献】特開２０１７－０４９６７７（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ１６／００－１６／９５８

Ｇ０６Ｎ２０／００－２０／２０

(57)【特許請求の範囲】

【請求項1】

特許に関する特許情報と当該特許情報に対する分類を示す分類情報とを有する２以上の特許分類情報を有する学習元情報を用いて、特許に関する特許情報を分類するための学習器を生成するプログラムであり、異なるアルゴリズムにより学習器を生成する少なくとも２以上の各学習器生成プログラムが、学習器生成プログラムが利用可能または利用に好適な学習元情報に関する条件に対応付けて格納されるプログラム格納部と、
学習元情報を受け付ける学習元情報受付部と、
前記学習元情報受付部が受け付けた学習元情報のうちの少なくとも一部の特許分類情報に対して、前記２以上の学習器生成プログラムのうちの、少なくとも１以上の学習器生成プログラムを実行し、学習器を構成する学習部と、
前記学習元情報受付部が受け付けた前記学習元情報が、前記２以上の学習器生成プログラムに対応付いている条件に合致するか否かを判断し、条件に合致する１以上の学習器生成プログラムのうち、一のプログラムを選択する選択部と、
前記選択部が選択したプログラムにより生成された学習器である予測学習器を、前記学習元情報または前記学習元情報に対応する対応情報に対応付けて蓄積する蓄積部とを具備する学習器生成装置。

【請求項2】

前記学習部は、
前記学習元情報受付部が受け付けた学習元情報が有する特許分類情報に対して、前記選択部が選択した学習器生成プログラムを実行し、予測に使用する学習器である予測学習器を構成し、
前記蓄積部は、
前記学習部が構成した予測学習器を、前記学習元情報または前記学習元情報に対応する対応情報に対応付けて蓄積する請求項１記載の学習器生成装置。

【請求項3】

特許に関する特許情報と当該特許情報に対する分類を示す分類情報とを有する２以上の特許分類情報を有する学習元情報を用いて、特許に関する特許情報を分類するための学習器を生成するプログラムであり、異なるアルゴリズムにより学習器を生成する少なくとも２以上の各学習器生成プログラムが、学習器生成プログラムが利用可能または利用に好適な学習元情報に関する条件に対応付けて格納されるプログラム格納部と、学習元情報受付部と、学習部と、選択部と、蓄積部とにより実現される学習器の生産方法であって、
前記学習元情報受付部が、学習元情報を受け付ける学習元情報受付ステップと、
前記学習部が、前記学習元情報受付ステップで受け付けられた学習元情報のうちの少なくとも一部の特許分類情報に対して、前記２以上の学習器生成プログラムのうちの、少なくとも１以上の学習器生成プログラムを実行し、学習器を構成する学習ステップと、
前記選択部が、前記学習元情報受付部が受け付けた前記学習元情報が、前記２以上の学習器生成プログラムに対応付いている条件に合致するか否かを判断し、条件に合致する１以上の学習器生成プログラムのうち、一のプログラムを選択する選択ステップと、
前記蓄積部が、前記選択ステップで選択されたプログラムにより生成された学習器である予測学習器を、前記学習元情報または前記学習元情報に対応する対応情報に対応付けて蓄積する蓄積ステップとを具備する学習器の生産方法。

【請求項4】

特許に関する特許情報と当該特許情報に対する分類を示す分類情報とを有する２以上の特許分類情報を有する学習元情報を用いて、特許に関する特許情報を分類するための学習器を生成するプログラムであり、異なるアルゴリズムにより学習器を生成する少なくとも２以上の各学習器生成プログラムが、学習器生成プログラムが利用可能または利用に好適な学習元情報に関する条件に対応付けて格納されるプログラム格納部にアクセス可能なコンピュータを、
学習元情報を受け付ける学習元情報受付部と、
前記学習元情報受付部が受け付けた学習元情報のうちの少なくとも一部の特許分類情報に対して、前記２以上の学習器生成プログラムのうちの、少なくとも１以上の学習器生成プログラムを実行し、学習器を構成する学習部と、
前記学習元情報受付部が受け付けた前記学習元情報が、前記２以上の学習器生成プログラムに対応付いている条件に合致するか否かを判断し、条件に合致する１以上の学習器生成プログラムのうち、一のプログラムを選択する選択部と、
前記選択部が選択したプログラムにより生成された学習器である予測学習器を、前記学習元情報または前記学習元情報に対応する対応情報に対応付けて蓄積する蓄積部として機能させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、特許情報を自動分類する予測装置等に関するものである。

【背景技術】

【0002】

従来、管理されている出願・公開前のアイデア・特許情報に対し、類似と思われる特許関連公報を特許検索システムから探し出し、その公報のＩＰＣ、ＦＩ、Ｆタームといった特許分類を、対象アイデア・特許情報を管理しているシステムに自動的に格納し、管理システム上で検索できる手段とを備えたアイデア・特許提案における特許分類取得システムがあった（例えば、特許文献１参照）。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２００６－２２７７５７号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、従来技術においては、精度高く特許情報を分類できなかった。

【課題を解決するための手段】

【0005】

本第一の発明の学習器生成装置は、特許に関する特許情報と特許情報に対する分類を示す分類情報とを有する２以上の特許分類情報を有する学習元情報を用いて、特許に関する特許情報を分類するための学習器を生成するプログラムであり、異なるアルゴリズムにより学習器を生成する少なくとも２以上の学習器生成プログラムが格納されるプログラム格納部と、学習元情報を受け付ける学習元情報受付部と、学習元情報受付部が受け付けた学習元情報のうちの少なくとも一部の特許分類情報に対して、２以上の学習器生成プログラムのうちの、少なくとも１以上の学習器生成プログラムを実行し、学習器を構成する学習部と、２以上の学習器生成プログラムの中から、学習元情報受付部が受け付けた学習元情報に適合するプログラムを選択する選択部と、選択部が選択したプログラムにより生成された学習器である予測学習器を、学習元情報または学習元情報に対応する対応情報に対応付けて蓄積する蓄積部とを具備する学習器生成装置である。

【0006】

かかる構成により、精度高く特許情報を分類できる予測学習器が作成できる。

【0007】

また、本第二の発明の学習器生成装置は、第一の発明に対して、プログラム格納部には、学習器を用いて特許情報の分類を予測し、予測分類情報を取得する予測プログラムが、２以上の学習器生成プログラムごとに格納され、学習部は、学習元情報受付部が受け付けた学習元情報のうちの少なくとも一部の特許分類情報に対して、２以上の各学習器生成プログラムを実行し、２以上の各学習器生成プログラムごとに学習器を生成し、選択部は、学習元情報受付部が受け付けた学習元情報のうちの少なくとも一部の各特許分類情報に対して、学習部が生成した２以上の各学習器を用いて、予測プログラムを適用し、１以上の各特許分類情報に対する予測分類情報を取得し、予測分類情報と、学習元情報が有する分類情報とを用いて、予測プログラムの精度に関する精度情報を取得し、精度情報が最も精度の高い情報に対応する学習器を生成したプログラムを選択する学習器生成装置である。

【0008】

かかる構成により、精度高く特許情報を分類できる予測学習器が作成できる。

【0009】

また、本第三の発明の学習器生成装置は、第一の発明に対して、プログラム格納部には、２以上の各学習器生成プログラムに対応付けて、学習器生成プログラムが利用可能または利用に好適な学習元情報に関する条件が格納されており、選択部は、学習元情報受付部が受け付けた学習元情報が、２以上の各学習器生成プログラムに対応付いている条件に合致するか否かを判断し、条件に合致する１以上の学習器生成プログラムのうち、一のプログラムを選択する学習器生成装置である。

【0010】

かかる構成により、精度高く特許情報を分類できる予測学習器が作成できる。

【0011】

また、本第四の発明の学習器生成装置は、第一から第三いずれか１つの発明に対して、学習部は、学習元情報受付部が受け付けた学習元情報が有する特許分類情報に対して、選択部が選択した学習器生成プログラムを実行し、予測に使用する学習器である予測学習器を構成し、蓄積部は、学習部が構成した予測学習器を、学習元情報または学習元情報に対応する対応情報に対応付けて蓄積する学習器生成装置である。

【0012】

かかる構成により、精度高く特許情報を分類できる予測学習器が作成できる。

【0013】

また、本第五の発明の予測装置は、第一から第四いずれか１つの発明における学習器生成装置が構成した予測学習器が格納される予測学習器格納部と、分類を予測する対象である特許情報を受け付ける予測対象受付部と、予測学習器に特許情報を与えて、特許情報の分類の予測に関する予測情報を取得する予測部と、予測情報を出力する予測情報出力部とを具備する予測装置である。

【0014】

かかる構成により、精度高く特許情報を分類できる。

【発明の効果】

【0015】

本発明による予測装置によれば、精度高く特許情報を分類できる。

【図面の簡単な説明】

【0016】

【図1】実施の形態１における予測装置Ａのブロック図

【図2】同予測装置Ａが予測学習器を得るまでの処理について説明するフローチャート

【図3】同予測処理について説明するフローチャート

【図4】同学習生成装置Ｂのブロック図

【図5】同予測装置Ｃのブロック図

【図6】同コンピュータシステムの概観図

【図7】同コンピュータシステムのブロック図

【発明を実施するための形態】

【0017】

以下、予測装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。

【0018】

（実施の形態１）
本実施の形態において、特許に関する特許情報と当該特許情報に対する分類を示す分類情報とを有する２以上の特許分類情報である学習元情報に対して、２以上の異なるアルゴリズムにより作成した２以上の学習器のうち、少なくとも一の学習器を用いて、予測対象の特許を分類する予測装置について説明する。

【0019】

また、本実施の形態において、２以上の学習器を評価し、評価結果が良い学習器を選択して、使用する予測装置について説明する。

【0020】

また、本実施の形態において、特許情報が有する属性から学習器を選択して、使用する予測装置について説明する。

【0021】

さらに、本実施の形態において、選択部が選択したプログラムを用いて、最終的な学習器を構成して、使用する予測装置について説明する。

【0022】

図１は、本実施の形態における予測装置Ａのブロック図である。予測装置Ａは、格納部Ａ１、受付部Ａ２、処理部Ａ３、および出力部Ａ４を備える。格納部Ａ１は、プログラム格納部１１、および予測学習器格納部１２を備える。受付部Ａ２は、学習元情報受付部２１、および予測対象受付部２２を備える。処理部Ａ３は、学習部３１、選択部３２、蓄積部３３、および予測部３４を備える。出力部Ａ４は、予測情報出力部４１を備える。

【0023】

格納部Ａ１には、各種の情報が格納される。各種の情報とは、例えば、後述する学習器生成プログラム、後述する予測学習器である。

【0024】

プログラム格納部１１には、異なるアルゴリズムの２以上の学習器生成プログラムが格納される。学習器生成プログラムは、特許情報と分類情報とを有する２以上の特許分類情報を有する学習元情報を用いて、特許情報を分類するための学習器を生成するプログラムである。２以上の学習器生成プログラムは、異なるアルゴリズムにより学習器を生成するプログラムである。学習器生成プログラムは、例えば、機械学習のアルゴリズムを用いて学習器を生成するプログラムである。機械学習のアルゴリズムは、深層学習、ランダムフォレスト、決定木、ＳＶＭ、ＳＶＲ等、問わない。

【0025】

特許情報は、特許に関する情報である。特許情報は、例えば、特許の要約、特許請求の範囲、明細書、特許分類コード等のうち１以上の情報を含む。特許分類コードは、例えば、ＩＰＣ、Ｆターム、ＦＩ、ＣＰＣ等のうちの１以上の情報である。

【0026】

分類情報は、特許情報に対する分類を示す情報である。分類情報は、「○，×」「Ａ，Ｂ，Ｃ」、技術分野のＩＤ等、特許情報を分類した結果であれば何でも良い。分類情報は、通常、人手により分類された情報であるが、いわゆるロボットやソフトにより分類された情報でも良い。

【0027】

プログラム格納部１１には、１または２以上の予測プログラムが格納される。予測プログラムは、学習器生成プログラムごとに格納される。予測プログラムは、学習器を用いて特許情報の分類を予測し、予測分類情報を取得するプログラムである。予測プログラムは、例えば、機械学習のアルゴリズムを用いて学習器を生成するプログラムである。機械学習のアルゴリズムは、深層学習、ランダムフォレスト、決定木、ＳＶＭ、ＳＶＲ等、問わない。

【0028】

予測分類情報は、予測プログラムが取得した分類情報である。予測分類情報も、分類情報と同様、「○，×」「Ａ，Ｂ，Ｃ」、技術分野のＩＤ等、特許情報を分類する情報であれば何でも良い。

【0029】

プログラム格納部１１には、２以上の各学習器生成プログラムに対応付けて、条件が格納されていても良い。条件は、学習器生成プログラムが利用可能または利用に好適な学習元情報に関する条件である。条件とは、例えば、特許分類コードに関する条件、特許分類情報の数に関する条件である。特許分類コードに関する条件は、例えば、「ＩＰＣ部分一致 "Ｇ０６Ｆ" ｏｒ "Ｈ０４Ｎ"」（特許情報のＩＰＣの情報の中に、"Ｇ０６Ｆ"または"Ｈ０４Ｎ"が含まれること）、「ＩＰＣ！＝ "Ｇ０６Ｆ" ｏｒ "Ｈ０４Ｎ"」（特許情報のＩＰＣの情報の中に、"Ｇ０６Ｆ"または"Ｈ０４Ｎ"が含まれないこと）である。特許分類情報の数に関する条件は、例えば、「特許分類情報の数が閾値以上」、「特許分類情報の数が閾値より多い」、「特許分類情報の数が閾値以下」、「特許分類情報の数が閾値未満」、「Ｘ＜＝特許分類情報の数＜＝Ｙ」等である。

【0030】

予測学習器格納部１２は、予測学習器が格納される。予測学習器は、学習部３１が構成した学習器である。予測学習器は、予測部３４が使用する学習器である。

【0031】

受付部Ａ２は、各種の情報または指示等を受け付ける。各種の情報または指示等は、例えば、後述する学習元情報、後述する予測対象である。

【0032】

ここで、受け付けとは、例えば、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、有線もしくは無線の通信回線を介して送信された情報の受信、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付けなどを含む概念である。

【0033】

各種の情報または指示等の入力手段は、例えば、キーボードやマウスやメニュー画面によるもの等、何でも良い。受付部Ａ２は、キーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。

【0034】

学習元情報受付部２１は、学習元情報を受け付ける。学習元情報は、学習器生成プログラムに与える情報である。学習元情報は、例えば、学習器生成プログラムを選択するために使用される情報である。学習元情報は、例えば、予測学習器を先生するために使用される情報である。

【0035】

予測対象受付部２２は、分類を予測する対象である特許情報を受け付ける。

【0036】

処理部Ａ３は、各種の処理を行う。各種の処理は、例えば、学習部３１、選択部３２、蓄積部３３、予測部３４が行う処理である。

【0037】

学習部３１は、学習元情報受付部２１が受け付けた学習元情報のうちの少なくとも一部の特許分類情報に対して、２以上の学習器生成プログラムのうちの、少なくとも１以上の学習器生成プログラムを実行し、学習器を構成する。少なくとも一部の特許分類情報は、例えば、学習元情報のうちのＮ割（例えば、９割）の特許分類情報である。少なくとも一部の特許分類情報は、学習元情報のうちの全部の特許分類情報を用いても良い。

【0038】

学習部３１は、例えば、２以上の各学習器生成プログラムごとに、閾値回数（例えば、１０回）、異なる一部の特許分類情報（部分特許分類情報）を選択し、当該異なる部分特許分類情報を用いて、異なる閾値回数分の数の学習器を構成する。

【0039】

学習部３１は、学習元情報受付部２１が受け付けた学習元情報のうちの少なくとも一部の特許分類情報に対して、２以上の各学習器生成プログラムを実行し、２以上の各学習器生成プログラムごとに学習器を生成する。

【0040】

学習部３１は、学習元情報受付部２１が受け付けた学習元情報が有する特許分類情報に対して、選択部３２が選択した学習器生成プログラムを実行し、予測に使用する学習器である予測学習器を構成する。なお、ここで、学習部３１は、学習元情報が有するすべての特許分類情報を用いて、予測学習器を構成することは好適である。また、予測とは、特許情報に対する分類情報である予測情報を取得することである。

【0041】

選択部３２は、２以上の学習器生成プログラムの中から、学習元情報受付部２１が受け付けた学習元情報に適合するプログラムを選択する。なお、プログラムを選択とは、プログラムで作成した学習器を選択することも同意義である。

【0042】

選択部３２は、例えば、学習元情報受付部２１が受け付けた学習元情報のうちの少なくとも一部の各特許分類情報に対して、学習部３１が生成した２以上の各学習器を用いて、予測プログラムを適用し、１以上の各特許分類情報に対する予測分類情報を取得し、予測分類情報と、学習元情報が有する分類情報とを用いて、予測プログラムの精度に関する精度情報を取得し、精度情報が最も精度の高い情報に対応する学習器を生成したプログラムを選択する。なお、かかる方法を精度評価選択法という。また、ここで、選択部３２が２以上の各学習器に対して与える一部の各特許分類情報は、学習部３１が使用していない１以上の特許分類情報であることは好適である。また、精度情報とは、例えば、正解率、適合率である。

【0043】

選択部３２は、例えば、学習元情報受付部２１が受け付けた学習元情報が、２以上の各学習器生成プログラムに対応付いている条件に合致するか否かを判断し、条件に合致する一のプログラムを選択する。選択部３２は、例えば、学習元情報受付部２１が受け付けた学習元情報の属性値（例えば、特許分類コード、または特許分類情報の数）を取得し、当該属性値が合致する条件と対になる学習器生成プログラムを選択する。なお、かかる方法を条件選択法という。

【0044】

蓄積部３３は、選択部３２が選択したプログラムにより生成された学習器である予測学習器を、学習元情報または学習元情報に対応する対応情報に対応付けて蓄積する。

【0045】

蓄積部３３は、学習部３１が構成した予測学習器を、学習元情報または学習元情報に対応する対応情報に対応付けて蓄積する。

【0046】

なお、予測学習器の蓄積先は、例えば、予測学習器格納部１２、図示しない外部の装置である。

【0047】

予測部３４は、予測学習器に特許情報を与えて、特許情報の分類の予測に関する予測情報を取得する。予測部３４は、通常、予測学習器に特許情報を与えて、機械学習のアルゴリズムにより、予測情報を取得する。

【0048】

出力部Ａ４は、各種の情報を出力する。各種の情報とは、例えば、予測情報である。ここで、出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である。

【0049】

予測情報出力部４１は、予測部３４が取得した予測情報を出力する。予測情報出力部４１は、予測部３４が取得した予測情報を、特許情報に対応付けて出力することは好適である。予測情報出力部４１は、例えば、予測部３４が取得した予測情報を、特許情報に対応付けて蓄積する。

【0050】

格納部Ａ１、プログラム格納部１１、および予測学習器格納部１２は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。

【0051】

格納部Ａ１等に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が格納部Ａ１等で記憶されるようになってもよく、通信回線等を介して送信された情報が格納部Ａ１等で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が格納部Ａ１等で記憶されるようになってもよい。

【0052】

処理部Ａ３、学習部３１、選択部３２、蓄積部３３、および予測部３４は、通常、ＭＰＵやメモリ等から実現され得る。処理部Ａ３等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはＲＯＭ等の記録媒体に記録されている。但し、ハードウェア（専用回路）で実現しても良い。

【0053】

出力部Ａ４、および予測情報出力部４１は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。出力部Ａ４等は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。

【0054】

次に、予測装置Ａの動作について説明する。まず、予測装置Ａが予測に使用する予測学習器を得るまでの処理について、図２のフローチャートを用いて説明する。

【0055】

（ステップＳ２０１）学習元情報受付部２１は、学習元情報を受け付けたか否かを判断する。学習元情報を受け付けた場合はステップＳ２０２に行き、学習元情報を受け付けなかった場合はステップＳ２０１に戻る。

【0056】

（ステップＳ２０２）学習部３１は、カウンタｉに１を代入する。

【0057】

（ステップＳ２０３）学習部３１は、プログラム格納部１１にはｉ番目の学習器生成プログラムが存在するか否かを判断する。番目の学習器生成プログラムが存在する場合はステップＳ２０４に行き、番目の学習器生成プログラムが存在しない場合はステップＳ２１９に行く。

【0058】

（ステップＳ２０４）学習部３１は、カウンタｊに１を代入する。

【0059】

（ステップＳ２０５）学習部３１は、「閾値＞ｊ」を満たすか否かを判断する。「閾値＞ｊ」を満たす場合はステップＳ２０６に行き、「閾値＞ｊ」を満たさない場合はステップＳ２１７に行く。

【0060】

（ステップＳ２０６）学習部３１は、ステップＳ２０１で受け付けられた学習元情報から、」ｊ番目の部分特許分類情報を取得する。なお、ｊ番目の部分特許分類情報は、他の部分特許分類情報とは異なる特許分類情報の集合である。

【0061】

（ステップＳ２０７）学習部３１は、ｊ番目の部分特許分類情報をｉ番目の学習器生成プログラムに与え、学習処理を行い、学習器を生成する。

【0062】

（ステップＳ２０８）学習部３１は、初期化を行う。初期化は、カウンタｌに１、変数「一致」に０、変数「不一致」に０を代入することである。変数「一致」は予測情報と分類情報とが一致した数のカウンタ、変数「不一致」は予測情報と分類情報とが一致しなかった数のカウンタである。

【0063】

（ステップＳ２０９）学習部３１は、ｋ番目の評価用の特許情報が存在するか否かを判断する。ｋ番目の評価用の特許情報が存在する場合はステップＳ２１０に行き、ｋ番目の評価用の特許情報が存在しない場合はステップＳ２１５に行く。なお、評価用の特許情報は、ステップＳ２０１で受け付けられた学習元情報の中の特許情報であり、ｊ番目の部分特許分類情報に含まれない特許情報であることは好適である。

【0064】

（ステップＳ２１０）学習部３１は、ステップＳ２０７で生成した学習器に対して、ｋ番目の評価用の特許情報を与え、予測処理を行い、予測情報を取得する。

【0065】

（ステップＳ２１１）学習部３１は、ステップＳ２１０で取得した予測情報と、ｋ番目の評価用の特許情報と対になる分類情報とが一致するか否かを判断する。一致する場合はステップＳ２１２に行き、不一致の場合はステップＳ２１３に行く。

【0066】

（ステップＳ２１２）学習部３１は、変数「一致」を１、インクリメントする。ステップＳ２１４に行く。

【0067】

（ステップＳ２１３）学習部３１は、変数「不一致」を１、インクリメントする。

【0068】

（ステップＳ２１４）学習部３１は、カウンタｋを１、インクリメントする。ステップＳ２０９に戻る。

【0069】

（ステップＳ２１５）学習部３１は、変数「一致」、変数「不一致」の値を用いて、ｉ番目の学習器生成プログラムのｊ番目の評価回数の精度情報を取得する。例えば、「精度情報＝変数「一致」の値／（変数「一致」の値＋変数「不一致」の値）である。

【0070】

（ステップＳ２１６）学習部３１は、カウンタｊを１、インクリメントする。ステップＳ２０５に戻る。

【0071】

（ステップＳ２１７）学習部３１は、ステップＳ２１５で取得した閾値回数の数の精度情報の代表値（例えば、平均値、中央値など）を取得し、かかる代表値をｉ番目の学習器生成プログラムの精度情報とする。

【0072】

（ステップＳ２１８）学習部３１は、カウンタｉを１、インクリメントする。ステップＳ２０１に戻る。

【0073】

（ステップＳ２１９）学習部３１は、ステップＳ２１７で取得した各学習器生成プログラムの精度情報を用いて、最も精度の高い精度情報に対応する学習器生成プログラムを選択する。

【0074】

（ステップＳ２２０）学習部３１は、ステップＳ２０１で受け付けられた学習元情報をステップＳ２１９で選択した学習器生成プログラムに適用し、学習処理を行い、予測学習器を生成する。

【0075】

（ステップＳ２２１）蓄積部３３は、ステップＳ２２０で生成された予測学習器を蓄積する。ステップＳ２０１に戻る。

【0076】

次に、予測装置Ａが予測学習器を用いて、特許情報の分類を予測する処理について、図３のフローチャートを用いて説明する。

【0077】

（ステップＳ３０１）予測対象受付部２２は、分類を予測する対象である１または２以上の特許情報の集合を受け付けたか否かを判断する。特許情報の集合を受け付けた場合はステップＳ３０２に行き、特許情報の集合を受け付けなかった場合はステップＳ３０１に戻る。

【0078】

（ステップＳ３０２）予測部３４は、カウンタｉに１を代入する。

【0079】

（ステップＳ３０３）予測部３４は、ステップＳ３０１で受け付けられた特許情報の集合の中で、ｉ番目の特許情報が存在するか否かを判断する。ｉ番目の特許情報が存在する場合はステップＳ３０４に行き、ｉ番目の特許情報が存在しない場合はステップＳ３０１に戻る。

【0080】

（ステップＳ３０４）予測部３４は、予測学習器にｉ番目の特許情報を与えて、ｉ番目の特許情報の予測情報を取得する。

【0081】

（ステップＳ３０５）予測情報出力部４１は、ステップＳ３０４で取得されたｉ番目の特許情報の予測情報を出力する。

【0082】

（ステップＳ３０６）予測部３４は、カウンタｉを１、インクリメントする。ステップＳ３０３に戻る。

【0083】

なお、図３のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。

【0084】

以上、本実施の形態によれば、精度高く特許情報を分類できる予測学習器が作成できる。

【0085】

また、本実施の形態によれば、精度高く特許情報を分類できる。

【0086】

なお、本実施の形態において、予測学習器の生成処理と、予測処理とを異なる装置で行っても良い。かかる場合、予測学習器の生成処理を行う学習生成装置Ｂのブロック図は図４である。また、かかる場合、予測処理を行う予測装置Ｃのブロック図は図５である。

【0087】

学習生成装置Ｂは、格納部Ｂ１、受付部Ｂ２、処理部Ｂを備える。格納部Ｂは、プログラム格納部１１を備える。受付部Ｂ２は、学習元情報受付部２１を備える。処理部Ｂ３は、学習部３１、選択部３２、蓄積部３３を備える。

【0088】

また、予測装置Ｃは、格納部Ｃ１、受付部Ｃ２、処理部Ｃ３、および出力部Ｃ４を備える。格納部Ｃ１は、予測学習器格納部１２を備える。受付部Ｃ２は、予測対象受付部２２を備える。処理部Ｃ３は、予測部３４を備える。出力部Ｃ４は、予測情報出力部４１を備える。

【0089】

さらに、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをＣＤ－ＲＯＭなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における予測装置Ｃを実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、特許に関する特許情報と当該特許情報に対する分類を示す分類情報とを有する２以上の特許分類情報を有する学習元情報を用いて、特許に関する特許情報を分類するための学習器を生成するプログラムであり、異なるアルゴリズムにより学習器を生成する少なくとも２以上の学習器生成プログラムが格納されるプログラム格納部にアクセス可能なコンピュータを、学習元情報を受け付ける学習元情報受付部と、前記学習元情報受付部が受け付けた学習元情報のうちの少なくとも一部の特許分類情報に対して、前記２以上の学習器生成プログラムのうちの、少なくとも１以上の学習器生成プログラムを実行し、学習器を構成する学習部と、前記２以上の学習器生成プログラムの中から、前記学習元情報受付部が受け付けた学習元情報に適合するプログラムを選択する選択部と、前記選択部が選択したプログラムにより生成された学習器である予測学習器を、前記学習元情報または前記学習元情報に対応する対応情報に対応付けて蓄積する蓄積部として機能させるためのプログラムである。

【0090】

また、図６は、本明細書で述べたプログラムを実行して、上述した種々の実施の形態の情報処理装置等を実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。図６は、このコンピュータシステム３００の概観図であり、図７は、システム３００のブロック図である。

【0091】

図６において、コンピュータシステム３００は、ＣＤ－ＲＯＭドライブを含むコンピュータ３０１と、キーボード３０２と、マウス３０３と、モニタ３０４とを含む。

【0092】

図７において、コンピュータ３０１は、ＣＤ－ＲＯＭドライブ３０１２に加えて、ＭＰＵ３０１３と、ＣＤ－ＲＯＭドライブ３０１２等に接続されたバス３０１４と、ブートアッププログラム等のプログラムを記憶するためのＲＯＭ３０１５と、ＭＰＵ３０１３に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのＲＡＭ３０１６と、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのハードディスク３０１７とを含む。ここでは、図示しないが、コンピュータ３０１は、さらに、ＬＡＮへの接続を提供するネットワークカードを含んでも良い。

【0093】

コンピュータシステム３００に、上述した実施の形態の予測装置１等の機能を実行させるプログラムは、ＣＤ－ＲＯＭ３１０１に記憶されて、ＣＤ－ＲＯＭドライブ３０１２に挿入され、さらにハードディスク３０１７に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ３０１に送信され、ハードディスク３０１７に記憶されても良い。プログラムは実行の際にＲＡＭ３０１６にロードされる。プログラムは、ＣＤ－ＲＯＭ３１０１またはネットワークから直接、ロードされても良い。

【0094】

プログラムは、コンピュータ３０１に、上述した実施の形態の予測装置１等の機能を実行させるオペレーティングシステム（ＯＳ）、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能（モジュール）を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム３００がどのように動作するかは周知であり、詳細な説明は省略する。

【0095】

また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。

【0096】

また、上記各実施の形態において、一の装置に存在する２以上の通信手段は、物理的に一の媒体で実現されても良いことは言うまでもない。

【0097】

また、上記各実施の形態において、各処理は、単一の装置によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。

【0098】

本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。

【産業上の利用可能性】

【0099】

以上のように、本発明にかかる予測装置は、精度高く特許情報を分類できるという効果を有し、予測装置等として有用である。

【符号の説明】