IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 有限会社アイ・アール・ディーの特許一覧

特許7218856学習器生成装置、学習器の生産方法、およびプログラム
<>
  • 特許-学習器生成装置、学習器の生産方法、およびプログラム 図1
  • 特許-学習器生成装置、学習器の生産方法、およびプログラム 図2
  • 特許-学習器生成装置、学習器の生産方法、およびプログラム 図3
  • 特許-学習器生成装置、学習器の生産方法、およびプログラム 図4
  • 特許-学習器生成装置、学習器の生産方法、およびプログラム 図5
  • 特許-学習器生成装置、学習器の生産方法、およびプログラム 図6
  • 特許-学習器生成装置、学習器の生産方法、およびプログラム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-01-30
(45)【発行日】2023-02-07
(54)【発明の名称】学習器生成装置、学習器の生産方法、およびプログラム
(51)【国際特許分類】
   G06F 16/906 20190101AFI20230131BHJP
   G06F 16/35 20190101ALI20230131BHJP
   G06N 20/00 20190101ALI20230131BHJP
【FI】
G06F16/906
G06F16/35
G06N20/00 130
【請求項の数】 4
(21)【出願番号】P 2018207885
(22)【出願日】2018-11-05
(65)【公開番号】P2020077018
(43)【公開日】2020-05-21
【審査請求日】2021-09-21
(73)【特許権者】
【識別番号】502384842
【氏名又は名称】株式会社アイ・アール・ディー
(74)【代理人】
【識別番号】100115749
【弁理士】
【氏名又は名称】谷川 英和
(72)【発明者】
【氏名】谷川 英和
【審査官】甲斐 哲雄
(56)【参考文献】
【文献】特開2018-026119(JP,A)
【文献】特開2017-049677(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06N 20/00-20/20
(57)【特許請求の範囲】
【請求項1】
特許に関する特許情報と当該特許情報に対する分類を示す分類情報とを有する2以上の特許分類情報を有する学習元情報を用いて、特許に関する特許情報を分類するための学習器を生成するプログラムであり、異なるアルゴリズムにより学習器を生成する少なくとも2以上の学習器生成プログラムが、学習器生成プログラムが利用可能または利用に好適な学習元情報に関する条件に対応付けて格納されるプログラム格納部と、
学習元情報を受け付ける学習元情報受付部と、
前記学習元情報受付部が受け付けた学習元情報のうちの少なくとも一部の特許分類情報に対して、前記2以上の学習器生成プログラムのうちの、少なくとも1以上の学習器生成プログラムを実行し、学習器を構成する学習部と、
前記学習元情報受付部が受け付けた前記学習元情報が、前記2以上の学習器生成プログラムに対応付いている条件に合致するか否かを判断し、条件に合致する1以上の学習器生成プログラムのうち、一のプログラムを選択する選択部と、
前記選択部が選択したプログラムにより生成された学習器である予測学習器を、前記学習元情報または前記学習元情報に対応する対応情報に対応付けて蓄積する蓄積部とを具備する学習器生成装置。
【請求項2】
前記学習部は、
前記学習元情報受付部が受け付けた学習元情報が有する特許分類情報に対して、前記選択部が選択した学習器生成プログラムを実行し、予測に使用する学習器である予測学習器を構成し、
前記蓄積部は、
前記学習部が構成した予測学習器を、前記学習元情報または前記学習元情報に対応する対応情報に対応付けて蓄積する請求項記載の学習器生成装置。
【請求項3】
特許に関する特許情報と当該特許情報に対する分類を示す分類情報とを有する2以上の特許分類情報を有する学習元情報を用いて、特許に関する特許情報を分類するための学習器を生成するプログラムであり、異なるアルゴリズムにより学習器を生成する少なくとも2以上の学習器生成プログラムが、学習器生成プログラムが利用可能または利用に好適な学習元情報に関する条件に対応付けて格納されるプログラム格納部と、学習元情報受付部と、学習部と、選択部と、蓄積部とにより実現される学習器の生産方法であって、
前記学習元情報受付部が、学習元情報を受け付ける学習元情報受付ステップと、
前記学習部が、前記学習元情報受付ステップで受け付けられた学習元情報のうちの少なくとも一部の特許分類情報に対して、前記2以上の学習器生成プログラムのうちの、少なくとも1以上の学習器生成プログラムを実行し、学習器を構成する学習ステップと、
前記選択部が、前記学習元情報受付部が受け付けた前記学習元情報が、前記2以上の学習器生成プログラムに対応付いている条件に合致するか否かを判断し、条件に合致する1以上の学習器生成プログラムのうち、一のプログラムを選択する選択ステップと、
前記蓄積部が、前記選択ステップで選択されたプログラムにより生成された学習器である予測学習器を、前記学習元情報または前記学習元情報に対応する対応情報に対応付けて蓄積する蓄積ステップとを具備する学習器の生産方法。
【請求項4】
特許に関する特許情報と当該特許情報に対する分類を示す分類情報とを有する2以上の特許分類情報を有する学習元情報を用いて、特許に関する特許情報を分類するための学習器を生成するプログラムであり、異なるアルゴリズムにより学習器を生成する少なくとも2以上の学習器生成プログラムが、学習器生成プログラムが利用可能または利用に好適な学習元情報に関する条件に対応付けて格納されるプログラム格納部にアクセス可能なコンピュータを、
学習元情報を受け付ける学習元情報受付部と、
前記学習元情報受付部が受け付けた学習元情報のうちの少なくとも一部の特許分類情報に対して、前記2以上の学習器生成プログラムのうちの、少なくとも1以上の学習器生成プログラムを実行し、学習器を構成する学習部と、
前記学習元情報受付部が受け付けた前記学習元情報が、前記2以上の学習器生成プログラムに対応付いている条件に合致するか否かを判断し、条件に合致する1以上の学習器生成プログラムのうち、一のプログラムを選択する選択部と、
前記選択部が選択したプログラムにより生成された学習器である予測学習器を、前記学習元情報または前記学習元情報に対応する対応情報に対応付けて蓄積する蓄積部として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、特許情報を自動分類する予測装置等に関するものである。
【背景技術】
【0002】
従来、管理されている出願・公開前のアイデア・特許情報に対し、類似と思われる特許関連公報を特許検索システムから探し出し、その公報のIPC、FI、Fタームといった特許分類を、対象アイデア・特許情報を管理しているシステムに自動的に格納し、管理システム上で検索できる手段とを備えたアイデア・特許提案における特許分類取得システムがあった(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2006-227757号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来技術においては、精度高く特許情報を分類できなかった。
【課題を解決するための手段】
【0005】
本第一の発明の学習器生成装置は、特許に関する特許情報と特許情報に対する分類を示す分類情報とを有する2以上の特許分類情報を有する学習元情報を用いて、特許に関する特許情報を分類するための学習器を生成するプログラムであり、異なるアルゴリズムにより学習器を生成する少なくとも2以上の学習器生成プログラムが格納されるプログラム格納部と、学習元情報を受け付ける学習元情報受付部と、学習元情報受付部が受け付けた学習元情報のうちの少なくとも一部の特許分類情報に対して、2以上の学習器生成プログラムのうちの、少なくとも1以上の学習器生成プログラムを実行し、学習器を構成する学習部と、2以上の学習器生成プログラムの中から、学習元情報受付部が受け付けた学習元情報に適合するプログラムを選択する選択部と、選択部が選択したプログラムにより生成された学習器である予測学習器を、学習元情報または学習元情報に対応する対応情報に対応付けて蓄積する蓄積部とを具備する学習器生成装置である。
【0006】
かかる構成により、精度高く特許情報を分類できる予測学習器が作成できる。
【0007】
また、本第二の発明の学習器生成装置は、第一の発明に対して、プログラム格納部には、学習器を用いて特許情報の分類を予測し、予測分類情報を取得する予測プログラムが、2以上の学習器生成プログラムごとに格納され、学習部は、学習元情報受付部が受け付けた学習元情報のうちの少なくとも一部の特許分類情報に対して、2以上の各学習器生成プログラムを実行し、2以上の各学習器生成プログラムごとに学習器を生成し、選択部は、学習元情報受付部が受け付けた学習元情報のうちの少なくとも一部の各特許分類情報に対して、学習部が生成した2以上の各学習器を用いて、予測プログラムを適用し、1以上の各特許分類情報に対する予測分類情報を取得し、予測分類情報と、学習元情報が有する分類情報とを用いて、予測プログラムの精度に関する精度情報を取得し、精度情報が最も精度の高い情報に対応する学習器を生成したプログラムを選択する学習器生成装置である。
【0008】
かかる構成により、精度高く特許情報を分類できる予測学習器が作成できる。
【0009】
また、本第三の発明の学習器生成装置は、第一の発明に対して、プログラム格納部には、2以上の各学習器生成プログラムに対応付けて、学習器生成プログラムが利用可能または利用に好適な学習元情報に関する条件が格納されており、選択部は、学習元情報受付部が受け付けた学習元情報が、2以上の各学習器生成プログラムに対応付いている条件に合致するか否かを判断し、条件に合致する1以上の学習器生成プログラムのうち、一のプログラムを選択する学習器生成装置である。
【0010】
かかる構成により、精度高く特許情報を分類できる予測学習器が作成できる。
【0011】
また、本第四の発明の学習器生成装置は、第一から第三いずれか1つの発明に対して、学習部は、学習元情報受付部が受け付けた学習元情報が有する特許分類情報に対して、選択部が選択した学習器生成プログラムを実行し、予測に使用する学習器である予測学習器を構成し、蓄積部は、学習部が構成した予測学習器を、学習元情報または学習元情報に対応する対応情報に対応付けて蓄積する学習器生成装置である。
【0012】
かかる構成により、精度高く特許情報を分類できる予測学習器が作成できる。
【0013】
また、本第五の発明の予測装置は、第一から第四いずれか1つの発明における学習器生成装置が構成した予測学習器が格納される予測学習器格納部と、分類を予測する対象である特許情報を受け付ける予測対象受付部と、予測学習器に特許情報を与えて、特許情報の分類の予測に関する予測情報を取得する予測部と、予測情報を出力する予測情報出力部とを具備する予測装置である。
【0014】
かかる構成により、精度高く特許情報を分類できる。
【発明の効果】
【0015】
本発明による予測装置によれば、精度高く特許情報を分類できる。
【図面の簡単な説明】
【0016】
図1】実施の形態1における予測装置Aのブロック図
図2】同予測装置Aが予測学習器を得るまでの処理について説明するフローチャート
図3】同予測処理について説明するフローチャート
図4】同学習生成装置Bのブロック図
図5】同予測装置Cのブロック図
図6】同コンピュータシステムの概観図
図7】同コンピュータシステムのブロック図
【発明を実施するための形態】
【0017】
以下、予測装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
【0018】
(実施の形態1)
本実施の形態において、特許に関する特許情報と当該特許情報に対する分類を示す分類情報とを有する2以上の特許分類情報である学習元情報に対して、2以上の異なるアルゴリズムにより作成した2以上の学習器のうち、少なくとも一の学習器を用いて、予測対象の特許を分類する予測装置について説明する。
【0019】
また、本実施の形態において、2以上の学習器を評価し、評価結果が良い学習器を選択して、使用する予測装置について説明する。
【0020】
また、本実施の形態において、特許情報が有する属性から学習器を選択して、使用する予測装置について説明する。
【0021】
さらに、本実施の形態において、選択部が選択したプログラムを用いて、最終的な学習器を構成して、使用する予測装置について説明する。
【0022】
図1は、本実施の形態における予測装置Aのブロック図である。予測装置Aは、格納部A1、受付部A2、処理部A3、および出力部A4を備える。格納部A1は、プログラム格納部11、および予測学習器格納部12を備える。受付部A2は、学習元情報受付部21、および予測対象受付部22を備える。処理部A3は、学習部31、選択部32、蓄積部33、および予測部34を備える。出力部A4は、予測情報出力部41を備える。
【0023】
格納部A1には、各種の情報が格納される。各種の情報とは、例えば、後述する学習器生成プログラム、後述する予測学習器である。
【0024】
プログラム格納部11には、異なるアルゴリズムの2以上の学習器生成プログラムが格納される。学習器生成プログラムは、特許情報と分類情報とを有する2以上の特許分類情報を有する学習元情報を用いて、特許情報を分類するための学習器を生成するプログラムである。2以上の学習器生成プログラムは、異なるアルゴリズムにより学習器を生成するプログラムである。学習器生成プログラムは、例えば、機械学習のアルゴリズムを用いて学習器を生成するプログラムである。機械学習のアルゴリズムは、深層学習、ランダムフォレスト、決定木、SVM、SVR等、問わない。
【0025】
特許情報は、特許に関する情報である。特許情報は、例えば、特許の要約、特許請求の範囲、明細書、特許分類コード等のうち1以上の情報を含む。特許分類コードは、例えば、IPC、Fターム、FI、CPC等のうちの1以上の情報である。
【0026】
分類情報は、特許情報に対する分類を示す情報である。分類情報は、「○,×」「A,B,C」、技術分野のID等、特許情報を分類した結果であれば何でも良い。分類情報は、通常、人手により分類された情報であるが、いわゆるロボットやソフトにより分類された情報でも良い。
【0027】
プログラム格納部11には、1または2以上の予測プログラムが格納される。予測プログラムは、学習器生成プログラムごとに格納される。予測プログラムは、学習器を用いて特許情報の分類を予測し、予測分類情報を取得するプログラムである。予測プログラムは、例えば、機械学習のアルゴリズムを用いて学習器を生成するプログラムである。機械学習のアルゴリズムは、深層学習、ランダムフォレスト、決定木、SVM、SVR等、問わない。
【0028】
予測分類情報は、予測プログラムが取得した分類情報である。予測分類情報も、分類情報と同様、「○,×」「A,B,C」、技術分野のID等、特許情報を分類する情報であれば何でも良い。
【0029】
プログラム格納部11には、2以上の各学習器生成プログラムに対応付けて、条件が格納されていても良い。条件は、学習器生成プログラムが利用可能または利用に好適な学習元情報に関する条件である。条件とは、例えば、特許分類コードに関する条件、特許分類情報の数に関する条件である。特許分類コードに関する条件は、例えば、「IPC 部分一致 "G06F" or "H04N"」(特許情報のIPCの情報の中に、"G06F"または"H04N"が含まれること)、「IPC != "G06F" or "H04N"」(特許情報のIPCの情報の中に、"G06F"または"H04N"が含まれないこと)である。特許分類情報の数に関する条件は、例えば、「特許分類情報の数が閾値以上」、「特許分類情報の数が閾値より多い」、「特許分類情報の数が閾値以下」、「特許分類情報の数が閾値未満」、「X<=特許分類情報の数<=Y」等である。
【0030】
予測学習器格納部12は、予測学習器が格納される。予測学習器は、学習部31が構成した学習器である。予測学習器は、予測部34が使用する学習器である。
【0031】
受付部A2は、各種の情報または指示等を受け付ける。各種の情報または指示等は、例えば、後述する学習元情報、後述する予測対象である。
【0032】
ここで、受け付けとは、例えば、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、有線もしくは無線の通信回線を介して送信された情報の受信、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付けなどを含む概念である。
【0033】
各種の情報または指示等の入力手段は、例えば、キーボードやマウスやメニュー画面によるもの等、何でも良い。受付部A2は、キーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。
【0034】
学習元情報受付部21は、学習元情報を受け付ける。学習元情報は、学習器生成プログラムに与える情報である。学習元情報は、例えば、学習器生成プログラムを選択するために使用される情報である。学習元情報は、例えば、予測学習器を先生するために使用される情報である。
【0035】
予測対象受付部22は、分類を予測する対象である特許情報を受け付ける。
【0036】
処理部A3は、各種の処理を行う。各種の処理は、例えば、学習部31、選択部32、蓄積部33、予測部34が行う処理である。
【0037】
学習部31は、学習元情報受付部21が受け付けた学習元情報のうちの少なくとも一部の特許分類情報に対して、2以上の学習器生成プログラムのうちの、少なくとも1以上の学習器生成プログラムを実行し、学習器を構成する。少なくとも一部の特許分類情報は、例えば、学習元情報のうちのN割(例えば、9割)の特許分類情報である。少なくとも一部の特許分類情報は、学習元情報のうちの全部の特許分類情報を用いても良い。
【0038】
学習部31は、例えば、2以上の各学習器生成プログラムごとに、閾値回数(例えば、10回)、異なる一部の特許分類情報(部分特許分類情報)を選択し、当該異なる部分特許分類情報を用いて、異なる閾値回数分の数の学習器を構成する。
【0039】
学習部31は、学習元情報受付部21が受け付けた学習元情報のうちの少なくとも一部の特許分類情報に対して、2以上の各学習器生成プログラムを実行し、2以上の各学習器生成プログラムごとに学習器を生成する。
【0040】
学習部31は、学習元情報受付部21が受け付けた学習元情報が有する特許分類情報に対して、選択部32が選択した学習器生成プログラムを実行し、予測に使用する学習器である予測学習器を構成する。なお、ここで、学習部31は、学習元情報が有するすべての特許分類情報を用いて、予測学習器を構成することは好適である。また、予測とは、特許情報に対する分類情報である予測情報を取得することである。
【0041】
選択部32は、2以上の学習器生成プログラムの中から、学習元情報受付部21が受け付けた学習元情報に適合するプログラムを選択する。なお、プログラムを選択とは、プログラムで作成した学習器を選択することも同意義である。
【0042】
選択部32は、例えば、学習元情報受付部21が受け付けた学習元情報のうちの少なくとも一部の各特許分類情報に対して、学習部31が生成した2以上の各学習器を用いて、予測プログラムを適用し、1以上の各特許分類情報に対する予測分類情報を取得し、予測分類情報と、学習元情報が有する分類情報とを用いて、予測プログラムの精度に関する精度情報を取得し、精度情報が最も精度の高い情報に対応する学習器を生成したプログラムを選択する。なお、かかる方法を精度評価選択法という。また、ここで、選択部32が2以上の各学習器に対して与える一部の各特許分類情報は、学習部31が使用していない1以上の特許分類情報であることは好適である。また、精度情報とは、例えば、正解率、適合率である。
【0043】
選択部32は、例えば、学習元情報受付部21が受け付けた学習元情報が、2以上の各学習器生成プログラムに対応付いている条件に合致するか否かを判断し、条件に合致する一のプログラムを選択する。選択部32は、例えば、学習元情報受付部21が受け付けた学習元情報の属性値(例えば、特許分類コード、または特許分類情報の数)を取得し、当該属性値が合致する条件と対になる学習器生成プログラムを選択する。なお、かかる方法を条件選択法という。
【0044】
蓄積部33は、選択部32が選択したプログラムにより生成された学習器である予測学習器を、学習元情報または学習元情報に対応する対応情報に対応付けて蓄積する。
【0045】
蓄積部33は、学習部31が構成した予測学習器を、学習元情報または学習元情報に対応する対応情報に対応付けて蓄積する。
【0046】
なお、予測学習器の蓄積先は、例えば、予測学習器格納部12、図示しない外部の装置である。
【0047】
予測部34は、予測学習器に特許情報を与えて、特許情報の分類の予測に関する予測情報を取得する。予測部34は、通常、予測学習器に特許情報を与えて、機械学習のアルゴリズムにより、予測情報を取得する。
【0048】
出力部A4は、各種の情報を出力する。各種の情報とは、例えば、予測情報である。ここで、出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である。
【0049】
予測情報出力部41は、予測部34が取得した予測情報を出力する。予測情報出力部41は、予測部34が取得した予測情報を、特許情報に対応付けて出力することは好適である。予測情報出力部41は、例えば、予測部34が取得した予測情報を、特許情報に対応付けて蓄積する。
【0050】
格納部A1、プログラム格納部11、および予測学習器格納部12は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
【0051】
格納部A1等に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が格納部A1等で記憶されるようになってもよく、通信回線等を介して送信された情報が格納部A1等で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が格納部A1等で記憶されるようになってもよい。
【0052】
処理部A3、学習部31、選択部32、蓄積部33、および予測部34は、通常、MPUやメモリ等から実現され得る。処理部A3等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
【0053】
出力部A4、および予測情報出力部41は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。出力部A4等は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
【0054】
次に、予測装置Aの動作について説明する。まず、予測装置Aが予測に使用する予測学習器を得るまでの処理について、図2のフローチャートを用いて説明する。
【0055】
(ステップS201)学習元情報受付部21は、学習元情報を受け付けたか否かを判断する。学習元情報を受け付けた場合はステップS202に行き、学習元情報を受け付けなかった場合はステップS201に戻る。
【0056】
(ステップS202)学習部31は、カウンタiに1を代入する。
【0057】
(ステップS203)学習部31は、プログラム格納部11にはi番目の学習器生成プログラムが存在するか否かを判断する。番目の学習器生成プログラムが存在する場合はステップS204に行き、番目の学習器生成プログラムが存在しない場合はステップS219に行く。
【0058】
(ステップS204)学習部31は、カウンタjに1を代入する。
【0059】
(ステップS205)学習部31は、「閾値>j」を満たすか否かを判断する。「閾値>j」を満たす場合はステップS206に行き、「閾値>j」を満たさない場合はステップS217に行く。
【0060】
(ステップS206)学習部31は、ステップS201で受け付けられた学習元情報から、」j番目の部分特許分類情報を取得する。なお、j番目の部分特許分類情報は、他の部分特許分類情報とは異なる特許分類情報の集合である。
【0061】
(ステップS207)学習部31は、j番目の部分特許分類情報をi番目の学習器生成プログラムに与え、学習処理を行い、学習器を生成する。
【0062】
(ステップS208)学習部31は、初期化を行う。初期化は、カウンタlに1、変数「一致」に0、変数「不一致」に0を代入することである。変数「一致」は予測情報と分類情報とが一致した数のカウンタ、変数「不一致」は予測情報と分類情報とが一致しなかった数のカウンタである。
【0063】
(ステップS209)学習部31は、k番目の評価用の特許情報が存在するか否かを判断する。k番目の評価用の特許情報が存在する場合はステップS210に行き、k番目の評価用の特許情報が存在しない場合はステップS215に行く。なお、評価用の特許情報は、ステップS201で受け付けられた学習元情報の中の特許情報であり、j番目の部分特許分類情報に含まれない特許情報であることは好適である。
【0064】
(ステップS210)学習部31は、ステップS207で生成した学習器に対して、k番目の評価用の特許情報を与え、予測処理を行い、予測情報を取得する。
【0065】
(ステップS211)学習部31は、ステップS210で取得した予測情報と、k番目の評価用の特許情報と対になる分類情報とが一致するか否かを判断する。一致する場合はステップS212に行き、不一致の場合はステップS213に行く。
【0066】
(ステップS212)学習部31は、変数「一致」を1、インクリメントする。ステップS214に行く。
【0067】
(ステップS213)学習部31は、変数「不一致」を1、インクリメントする。
【0068】
(ステップS214)学習部31は、カウンタkを1、インクリメントする。ステップS209に戻る。
【0069】
(ステップS215)学習部31は、変数「一致」、変数「不一致」の値を用いて、i番目の学習器生成プログラムのj番目の評価回数の精度情報を取得する。例えば、「精度情報=変数「一致」の値/(変数「一致」の値+変数「不一致」の値)である。
【0070】
(ステップS216)学習部31は、カウンタjを1、インクリメントする。ステップS205に戻る。
【0071】
(ステップS217)学習部31は、ステップS215で取得した閾値回数の数の精度情報の代表値(例えば、平均値、中央値など)を取得し、かかる代表値をi番目の学習器生成プログラムの精度情報とする。
【0072】
(ステップS218)学習部31は、カウンタiを1、インクリメントする。ステップS201に戻る。
【0073】
(ステップS219)学習部31は、ステップS217で取得した各学習器生成プログラムの精度情報を用いて、最も精度の高い精度情報に対応する学習器生成プログラムを選択する。
【0074】
(ステップS220)学習部31は、ステップS201で受け付けられた学習元情報をステップS219で選択した学習器生成プログラムに適用し、学習処理を行い、予測学習器を生成する。
【0075】
(ステップS221)蓄積部33は、ステップS220で生成された予測学習器を蓄積する。ステップS201に戻る。
【0076】
次に、予測装置Aが予測学習器を用いて、特許情報の分類を予測する処理について、図3のフローチャートを用いて説明する。
【0077】
(ステップS301)予測対象受付部22は、分類を予測する対象である1または2以上の特許情報の集合を受け付けたか否かを判断する。特許情報の集合を受け付けた場合はステップS302に行き、特許情報の集合を受け付けなかった場合はステップS301に戻る。
【0078】
(ステップS302)予測部34は、カウンタiに1を代入する。
【0079】
(ステップS303)予測部34は、ステップS301で受け付けられた特許情報の集合の中で、i番目の特許情報が存在するか否かを判断する。i番目の特許情報が存在する場合はステップS304に行き、i番目の特許情報が存在しない場合はステップS301に戻る。
【0080】
(ステップS304)予測部34は、予測学習器にi番目の特許情報を与えて、i番目の特許情報の予測情報を取得する。
【0081】
(ステップS305)予測情報出力部41は、ステップS304で取得されたi番目の特許情報の予測情報を出力する。
【0082】
(ステップS306)予測部34は、カウンタiを1、インクリメントする。ステップS303に戻る。
【0083】
なお、図3のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
【0084】
以上、本実施の形態によれば、精度高く特許情報を分類できる予測学習器が作成できる。
【0085】
また、本実施の形態によれば、精度高く特許情報を分類できる。
【0086】
なお、本実施の形態において、予測学習器の生成処理と、予測処理とを異なる装置で行っても良い。かかる場合、予測学習器の生成処理を行う学習生成装置Bのブロック図は図4である。また、かかる場合、予測処理を行う予測装置Cのブロック図は図5である。
【0087】
学習生成装置Bは、格納部B1、受付部B2、処理部Bを備える。格納部Bは、プログラム格納部11を備える。受付部B2は、学習元情報受付部21を備える。処理部B3は、学習部31、選択部32、蓄積部33を備える。
【0088】
また、予測装置Cは、格納部C1、受付部C2、処理部C3、および出力部C4を備える。格納部C1は、予測学習器格納部12を備える。受付部C2は、予測対象受付部22を備える。処理部C3は、予測部34を備える。出力部C4は、予測情報出力部41を備える。
【0089】
さらに、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD-ROMなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における予測装置Cを実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、特許に関する特許情報と当該特許情報に対する分類を示す分類情報とを有する2以上の特許分類情報を有する学習元情報を用いて、特許に関する特許情報を分類するための学習器を生成するプログラムであり、異なるアルゴリズムにより学習器を生成する少なくとも2以上の学習器生成プログラムが格納されるプログラム格納部にアクセス可能なコンピュータを、学習元情報を受け付ける学習元情報受付部と、前記学習元情報受付部が受け付けた学習元情報のうちの少なくとも一部の特許分類情報に対して、前記2以上の学習器生成プログラムのうちの、少なくとも1以上の学習器生成プログラムを実行し、学習器を構成する学習部と、前記2以上の学習器生成プログラムの中から、前記学習元情報受付部が受け付けた学習元情報に適合するプログラムを選択する選択部と、前記選択部が選択したプログラムにより生成された学習器である予測学習器を、前記学習元情報または前記学習元情報に対応する対応情報に対応付けて蓄積する蓄積部として機能させるためのプログラムである。
【0090】
また、図6は、本明細書で述べたプログラムを実行して、上述した種々の実施の形態の情報処理装置等を実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。図6は、このコンピュータシステム300の概観図であり、図7は、システム300のブロック図である。
【0091】
図6において、コンピュータシステム300は、CD-ROMドライブを含むコンピュータ301と、キーボード302と、マウス303と、モニタ304とを含む。
【0092】
図7において、コンピュータ301は、CD-ROMドライブ3012に加えて、MPU3013と、CD-ROMドライブ3012等に接続されたバス3014と、ブートアッププログラム等のプログラムを記憶するためのROM3015と、MPU3013に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのRAM3016と、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのハードディスク3017とを含む。ここでは、図示しないが、コンピュータ301は、さらに、LANへの接続を提供するネットワークカードを含んでも良い。
【0093】
コンピュータシステム300に、上述した実施の形態の予測装置1等の機能を実行させるプログラムは、CD-ROM3101に記憶されて、CD-ROMドライブ3012に挿入され、さらにハードディスク3017に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ301に送信され、ハードディスク3017に記憶されても良い。プログラムは実行の際にRAM3016にロードされる。プログラムは、CD-ROM3101またはネットワークから直接、ロードされても良い。
【0094】
プログラムは、コンピュータ301に、上述した実施の形態の予測装置1等の機能を実行させるオペレーティングシステム(OS)、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム300がどのように動作するかは周知であり、詳細な説明は省略する。
【0095】
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
【0096】
また、上記各実施の形態において、一の装置に存在する2以上の通信手段は、物理的に一の媒体で実現されても良いことは言うまでもない。
【0097】
また、上記各実施の形態において、各処理は、単一の装置によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。
【0098】
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
【産業上の利用可能性】
【0099】
以上のように、本発明にかかる予測装置は、精度高く特許情報を分類できるという効果を有し、予測装置等として有用である。
【符号の説明】
【0100】
1A,1B,1C 格納部
2A,2B,2C 受付部B
3A,3B,3C 処理部
4A,4C 出力部
11 プログラム格納部
12 予測学習器格納部
21 学習元情報受付部
22 予測対象受付部
31 学習部
32 選択部
33 蓄積部
34 予測部
41 予測情報出力部
図1
図2
図3
図4
図5
図6
図7